Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)
2025/12/4约 583 字大约 2 分钟
Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)
1. 适用场景
Wilcoxon Signed-Rank Test 用于比较两个相关算法/模型在多次实验(如多个实例)上的性能是否存在显著差异。
适用条件:
- 数据是成对的(如算法 A 与算法 B 在同一个实例上的值)
- 不要求数据服从正态分布(非参数方法)
- 检验差值的符号与秩是否有系统性偏向
非常适合用于两个优化算法的性能对比。
2. 基本思想
该检验检查两组成对数据差值的:
- 方向性(正负)
- 差异大小的排序(绝对值秩)
如果一个算法始终优于另一个算法,则所有差值的符号会保持一致 → 产生显著的统计偏向。
3. 操作步骤
Step 1:计算成对差值
对于每个实例 i:
Step 2:删除差值为 0 的项
因为 0 表示两个算法相同,没有信息贡献。
Step 3:对 按大小排序(赋秩 rank)
秩反映差值大小的重要性。
若出现相同 ,采用平均秩。
Step 4:根据原始差值的正负,将秩分配到 R+ 或 R−
- 如果 ,则该 rank 属于正秩
- 如果 ,则属于负秩
与 分别对应“支持 A 优于 B”与“支持 B 优于 A”的力度。
Step 5:计算统计量 W
W 越小,差异越显著。
Step 6:查表或计算 p 值
若:
则:
差异显著,两算法性能不是随机差异,而是真实差距。
4. 结果解读
- 且 ⇒ A 显著优于 B
- 且 ⇒ B 显著优于 A
- ⇒ 差异不显著
5. Wilcoxon 的优点
- 非参数检验,不需要正态分布
- 对成对算法性能对比非常适合
- 兼顾差值大小与方向,更严谨
- 在优化算法对比研究中是标准方法之一
6. 在多目标优化中的意义
在算法性能具有随机性的情况下,Wilcoxon 用于判断:
某算法对另一算法的优势是否为真实规律,而非随机波动导致。