共识排列

Goat_Yang2025/12/3约 560 字大约 2 分钟

1. 基本概念

共识排列（Consensus Ranking）指：给定多个来源（评委、模型、算法）的排序，求一个能“最好代表所有排序意见”的最终排序。

设对象集合为
$C=\{c_1,c_2,\dots,c_n\}$
有 $m$ 个输入排序（对对象集合元素的排列）：
$R^{(1)},R^{(2)},\dots,R^{(m)}$

目标是求一个排序 $R^\*$ 使得它与所有输入排序尽可能一致：

R^\*=\arg\min_R\sum_{i=1}^{m}d(R,R^{(i)})

常用距离：Kendall tau 距离（交换次数）。

Kemeny 最优排序定义为最小化 Kendall tau 距离：

R^\*=\arg\min_R\sum_{i=1}^{m}K(R,R^{(i)})

其中 $K(\cdot,\cdot)$ 为 Kendall tau 距离。

特点：

对每一对候选项 $(a,b)$ 统计谁更常排前：

w(a,b)=\#\{i\mid a\prec_i b\}

形成胜负矩阵，通过最大一致性求排序。

简单近似方法：
若排序有 $n$ 个元素，名次为 $k$ 则得分 $n-k$ 。

累加所有排序的得分，最终按得分降序排列。

优点： 高效、简单
缺点： 不一定是 Kemeny 最优

常用近似策略包括：

这些方法可近似求 Kemeny 最优。

3 个候选项 A, B, C
3 个评委排序：

统计 pairwise：

最终共识排序：

B > A > C