标签: 非参数检验 | Goat_Yang

Friedman Test（弗里德曼检验）

1. 适用场景

Friedman Test 用于比较三个或以上的算法在多个实例上的整体性能差异。

适用条件：

有 k 个算法（k ≥ 3）
在 N 个相同的实例上测试
数据不要求服从正态分布

2. 基本思想

Friedman 不关心具体数值，而是比较每个实例中算法的相对排名（Rank）。

如果某算法在多数实例中排名持续靠前，则其平均秩统计上显著更低。

3. 操作步骤

Step 1：对每个实例对算法进行排序（按某指标如 GD）

Goat_Yang2025/12/4大约 2 分钟

Wilcoxon Signed-Rank Test（威尔科克森符号秩检验）

1. 适用场景

Wilcoxon Signed-Rank Test 用于比较两个相关算法/模型在多次实验（如多个实例）上的性能是否存在显著差异。

适用条件：

数据是成对的（如算法 A 与算法 B 在同一个实例上的值）
不要求数据服从正态分布（非参数方法）
检验差值的符号与秩是否有系统性偏向

非常适合用于两个优化算法的性能对比。

2. 基本思想

该检验检查两组成对数据差值的：

方向性（正负）
差异大小的排序（绝对值秩）

Goat_Yang2025/12/4大约 2 分钟