Friedman Test（弗里德曼检验）

Goat_Yang2025/12/4约 482 字大约 2 分钟

1. 适用场景

Friedman Test 用于比较三个或以上的算法在多个实例上的整体性能差异。

适用条件：

Friedman 不关心具体数值，而是比较每个实例中算法的相对排名（Rank）。

如果某算法在多数实例中排名持续靠前，则其平均秩统计上显著更低。

最优 = Rank 1
最差 = Rank k

\bar{R}_j = \frac{1}{N}\sum_{i=1}^{N} R_{ij}

其中：

\chi_F^2 = \frac{12N}{k(k+1)} \left[ \sum_{j=1}^{k} \bar{R}_j^2 - \frac{k(k+1)^2}{4} \right]

k：算法数量
N：实例数量

若：

p < 0.05

则说明四个算法整体性能存在显著差异。

Friedman 检验用于回答：

“多个算法中，哪个整体表现最佳？优势是否具有统计显著性？”

当某算法的平均秩最优且显著优于临界线，就证明其整体性能最强。