一、什么是方差分析?
方差分析(Analysis of Variance, ANOVA)用于检验多个总体均值是否相等。
其核心思想是比较:
- 组间变异(不同组均值之间的差异,解释为“因素效应”)
- 组内变异(组内个体间的随机差异,即“误差”)
记第 组第 个观测值为 ,方差分析要判断:
方差分析(Analysis of Variance, ANOVA)用于检验多个总体均值是否相等。
其核心思想是比较:
记第 i 组第 j 个观测值为 Yij,方差分析要判断:
Friedman Test 用于比较三个或以上的算法在多个实例上的整体性能差异。
适用条件:
Friedman 不关心具体数值,而是比较每个实例中算法的相对排名(Rank)。
如果某算法在多数实例中排名持续靠前,则其平均秩统计上显著更低。
Wilcoxon Signed-Rank Test 用于比较两个相关算法/模型在多次实验(如多个实例)上的性能是否存在显著差异。
适用条件:
非常适合用于两个优化算法的性能对比。
该检验检查两组成对数据差值的:
p 值用于衡量 在原假设 H0 为真时,观察到当前样本数据(或更极端)出现的概率。
本文梳理统计学中常见的假设检验类型,从功能、适用场景和数据类型角度进行系统总结。
功能:检验总体均值或比例是否等于某个值,或两个总体均值/比例是否相等。
适用条件:
共识排列指:给定多个来源(评委、模型、算法)的排序,求一个能“最好代表所有排序意见”的最终排序。
设对象集合为
C={c1,c2,…,cn}
有 m 个输入排序(对对象集合元素的排列):
R(1),R(2),…,R(m)
一致估计量指的是:
当样本量不断增大时,估计量会越来越接近真实参数值。
换句话说:
更多数据 → 更准。
设
Kendall tau 距离(Kendall tau distance)用于衡量两个排序(permutations)之间相对顺序的不一致程度。
它统计所有顺序相反的成对元素数量,也称为 discordant pairs。
给定两个排序 σ 和 π(元素相同但顺序可能不同),定义 Kendall tau 距离为:
封闭形式表达式指的是一个数学量可以用有限个常见的数学运算和函数直接表示出来的表达式。
一般允许使用的元素包括: