Kendall Tau 距离
2025/12/3约 392 字大约 1 分钟
Kendall Tau 距离
1. 概念概述
Kendall tau 距离(Kendall tau distance)用于衡量两个排序(permutations)之间相对顺序的不一致程度。
它统计所有顺序相反的成对元素数量,也称为 discordant pairs。
2. 数学定义
给定两个排序 和 (元素相同但顺序可能不同),定义 Kendall tau 距离为:
更直观解释:
比较所有 对元素,只要 和 中的相对顺序相反,就计一次距离。
3. 示例
设两个排序:
不一致的仅是 :
- 在 中:2 在 3 前
- 在 中:3 在 2 前
因此:
4. 距离范围
最大距离发生在完全逆序时:
5. 与 Kendall Tau 相关系数的关系
Kendall 相关性定义为:
距离越大,相关性越小。
6. 计算算法
1. 朴素算法
比较所有成对元素。
2. 基于归并排序的逆序对统计
可将一个排序映射到另一个的序号序列,然后统计逆序对数,即为 Kendall tau 距离。
7. 应用场景
- 评价排序算法质量
- 排序预测 vs. 实际排序的偏差分析
- 推荐系统中比较推荐列表
- 投票系统 / 社会选择理论
- 统计学中的 Kendall 系数