逆变换采样

Goat_Yang2025/10/23约 688 字大约 2 分钟

一、背景与动机

在随机算法、蒙特卡罗模拟或概率建模中，我们常常希望从某个特定分布中生成随机变量样本。
然而，大多数编程语言或计算机硬件只提供均匀分布的随机数生成器，例如：

u \sim U(0,1)

因此，需要一种通用方法将这些均匀随机数转换为任意分布的样本。
这就是 —— 逆变换采样（Inverse Transform Sampling）。

假设目标随机变量为 $X$ ，其概率密度函数为 $p(x)$ ，对应的累积分布函数为：

F(x) = \int_{-\infty}^x p(t)\,dt

因为 $F(x)$ 是单调递增且取值范围在 $[0,1]$ ，我们可以定义其反函数：

x = F^{-1}(u)

于是有以下定理：

若 $u \sim U(0,1)$ ，则 $x = F^{-1}(u)$ 服从分布 $p(x)$ 。

这个过程称为 逆变换采样。

这样得到的 $x$ 就服从目标分布 $p(x)$ 。

术语解释

PDF：概率密度函数 (probability density function), 连续型
PMF：概率质量函数 (probability mass function), 离散型
CDF：累积分布函数 (cumulative distribution function)

可以把 $F(x)$ 看作“把 $x$ 映射到 [0,1] 区间”的函数。
而 $F^{-1}$ 则是“把均匀数 $u$ 重新拉伸到 $x$ 轴上”的逆过程。

均匀分布的 $u$ 经由 $F^{-1}$ 的非线性变换后，
在 $x$ 轴上会形成与 $p(x)$ 形状一致的密度分布。

形象地说：

这就使得采样结果自动符合目标分布。

function sample_from_pdf(F_inverse):
    u = random_uniform(0, 1)
    x = F_inverse(u)
    return x