进化策略（ES）

Goat_Yang2026/3/21约 1588 字大约 5 分钟

名称

进化策略（Evolution Strategies, ES），也称演化策略。

进化策略受到生物进化基本原理的启发，尤其借鉴了自然选择过程以及“适者生存”的思想。该算法维护一个候选解种群，其中每个候选解均由一个实值参数向量表示。这些候选解通常被称为个体（individuals）或子代（offspring）。

算法通过一系列遗传操作对候选解种群进行迭代更新，主要包括变异（mutation）和重组（recombination，也称交叉 crossover）。其中，变异用于向个体中引入随机扰动，而重组则通过组合多个父代的遗传信息来生成新的子代。

每个个体的适应度由目标函数进行评估，目标函数用于衡量候选解在给定优化问题中的质量或性能。算法的目标是在搜索过程中找到具有最高适应度值的个体，从而获得该问题的最优解或近似最优解。

选择机制用于决定当前种群中哪些个体能够存活并对下一代产生贡献。该过程通常偏向于选择适应度较高的个体，使其遗传信息能够传递到后续代中。

算法持续重复应用遗传操作、适应度评估与选择过程，直至满足某一终止条件。该终止条件可以是预设的最大代数、达到满意的适应度水平，或满足某种收敛阈值。

初始化种群：
1. 确定种群规模 $\mu$ 和子代数量 $\lambda$ 。
2. 创建一个由 $\mu$ 个个体组成的初始种群，每个个体由一个实值参数向量表示。
3. 使用目标函数评估初始种群中每个个体的适应度。
当未满足终止条件时，重复执行以下步骤：
1. 重组：
  1. 根据适应度从当前种群中选择 $\rho$ 个父代个体。
  2. 对选出的父代应用重组算子（如中间重组、离散重组），生成 $\lambda$ 个新的子代。
2. 变异：
  1. 对重组步骤生成的每个子代施加变异操作（如高斯变异），以引入随机变化。
  2. 根据所采用的变异策略（如 $1/5$ 成功法则、自适应机制）调整变异强度（步长）。
3. 适应度评估：
  1. 使用目标函数评估每个子代的适应度。
4. 选择：
  1. 根据适应度从父代与子代组成的联合种群中选择 $\mu$ 个个体。
  2. 被选中的个体构成下一代种群。
返回优化过程中找到的最优个体作为问题的解。