LHS 采样

Goat_Yang2026/3/23约 1355 字大约 5 分钟

1. 基本概念

LHS（Latin Hypercube Sampling），中文通常称为拉丁超立方采样，是一种常用的分层随机采样方法。它的目标是在样本数量有限的情况下，使样本尽可能均匀地覆盖变量空间。

与普通随机采样相比，LHS 在小样本条件下通常具有更好的空间覆盖性，因此广泛用于数值实验、仿真分析、不确定性量化、代理模型训练和优化算法初始化等场景。

LHS 的关键思想是：在每一维上都进行均匀分层，并保证每个分层区间都恰好被采样一次。

设某一变量的取值范围已经归一化到 $[0,1]$ ，若需要生成 $N$ 个样本，则先将该区间划分为 $N$ 个等概率子区间，再从每个子区间中随机选取一个点。对多维变量重复这一过程后，再通过随机排列将各维样本组合起来，最终得到一组多维样本点。

因此，LHS 保证了样本在每一维边缘分布上具有较好的均匀性。

设问题维数为 $d$ ，样本数为 $N$ ，LHS 的基本流程如下：

若在二维空间中进行 LHS 采样，并设样本数为 $N$ ，则可以将两个坐标轴都划分为 $N$ 个区间。最终生成的样本满足：

因此，LHS 能有效避免普通随机采样中常见的样本聚集和区域空缺现象。

LHS 采样常见于以下场景：

从方法属性上看，LHS 可以视为对传统 Monte Carlo 采样的一种改进。

普通 Monte Carlo 采样完全依赖随机性，而 LHS 在随机采样的基础上增加了分层约束，因此通常能以更少的样本获得更稳定的覆盖效果。也正因如此，LHS 常被视为一种更高效的分层随机采样方法。

为了进一步提高样本点在多维空间中的分布质量，LHS 常有以下改进形式：

这些方法在高维实验设计和代理模型构建中较为常见。

LHS 采样是一种典型的分层随机采样方法，其核心优势在于：用较少的样本实现对变量空间更均匀的覆盖。因此，它在实验设计、仿真分析、敏感性分析、代理建模和智能优化等领域具有很强的实用价值。