分层贝叶斯优化算法(hBOA)
2026/3/21约 1652 字大约 6 分钟
分层贝叶斯优化算法(hBOA)
名称
分层贝叶斯优化算法(Hierarchical Bayesian Optimization Algorithm, HBOA)
分类
分层贝叶斯优化算法是一种序贯的基于模型的优化方法,属于广义上的贝叶斯优化范畴。它与其他贝叶斯优化技术密切相关,例如高斯过程优化(Gaussian Process Optimization)和树结构 Parzen 估计器(Tree-structured Parzen Estimator, TPE)。
- 计算智能
- 随机优化
- 贝叶斯优化
- 分层贝叶斯优化算法(HBOA)
- 贝叶斯优化
- 随机优化
策略
代理建模
HBOA 采用高斯过程(Gaussian Processes, GPs)构建目标函数的分层代理模型。该代理模型基于已观测数据点建立,并随着新数据的获得进行迭代更新。分层结构使其能够刻画不同保真度层次下的函数特性,从而实现对高代价黑盒目标函数的高效优化。
采集函数
为引导搜索过程,HBOA 使用采集函数在探索与开发之间进行权衡。采集函数基于代理模型的预测均值与不确定性来选择下一个待评估点。常见的采集函数包括期望改进(Expected Improvement, EI)、上置信界(Upper Confidence Bound, UCB)和改进概率(Probability of Improvement, PI)。
分层搜索
HBOA 利用代理模型的分层结构执行多层次搜索。算法首先借助低保真模型在较粗粒度层面探索搜索空间,然后在潜在优良区域中逐步使用高保真模型进行细化搜索。该机制有助于更合理地分配计算资源,并加快收敛至最优解的过程。
流程
数据结构
- 搜索空间:一种分层结构,其中每一层对应不同的抽象层次或搜索粒度。
- 高斯过程:用于在各层级上刻画目标函数的概率模型。
- 采集函数:用于平衡探索与开发并引导搜索方向的函数。
参数
- 层级数:分层搜索空间中的层数。
- 迭代次数:算法在每一层中允许执行的最大迭代次数。
- 初始点数:在开始优化前,每一层需要预先评估的初始样本点数量。
- 核函数:高斯过程模型所采用的协方差函数。
- 采集函数类型:所选用的采集函数类型,如 EI、UCB 等。
步骤
- 初始化分层搜索空间
- 定义层级数以及各层对应的搜索空间。
- 按照从高层到低层的顺序,对层级中的每一层执行以下过程:
- 初始化高斯过程模型
- 选择当前层需要评估的初始点。
- 在这些初始点处计算目标函数值。
- 基于已评估点拟合高斯过程模型。
- 对当前层中的每次迭代,执行以下过程:
- 优化采集函数
- 基于当前高斯过程模型,找到使采集函数取得最大值的点。
- 在所选点处评估目标函数
- 计算该最大化采集函数点对应的目标函数值。
- 将该点及其目标函数值加入已评估点集合。
- 更新高斯过程模型
- 基于更新后的已评估点集合重新拟合高斯过程模型。
- 优化采集函数
- 若当前层不是最底层:
- 细化搜索空间
- 利用当前层的结果对下一层的搜索空间进行细化。
- 根据当前层识别出的最有前景区域,定义下一层的精细搜索空间。
- 细化搜索空间
- 若当前层为最底层:
- 返回在最底层中找到的最优解。
- 初始化高斯过程模型
注:分层贝叶斯优化算法的具体实现会因问题领域以及采集函数、核函数的具体选择而有所不同。上述流程仅给出了该算法的一般性框架。
数据结构
- 分层代理模型:由不同保真度层次上的多个高斯过程模型组成的集合。
- 采集函数:依据代理模型的预测结果与不确定性,为每个候选点赋予评价值的函数。
- 候选点:从搜索空间中抽样得到、用于下一步评估的一组潜在点。
参数
- 保真度层数:分层代理模型中包含的保真度层级数量。
- 初始数据点数:每个保真度层次初始收集的数据点数量。
- 采集函数类型:所采用的采集函数类别,如 EI、UCB 等。
- 停止准则:终止优化过程的条件,如最大迭代次数或收敛阈值。
注意事项
优点
- 能够借助分层代理模型高效处理高代价黑盒目标函数。
- 可以融合多保真度信息,从而加快收敛并降低总体计算成本。
- 通过采集函数在探索与开发之间实现有效平衡。
缺点
- 需要谨慎设定保真度层数以及各层的初始数据点数量。
- HBOA 的性能依赖于代理模型的质量以及采集函数的选择。
- 在高维搜索空间或高度多峰目标函数场景下,算法可能面临性能下降问题。
启发式建议
保真度层数
- 可先从较少的保真度层数开始设置,例如 2 至 3 层,再根据实际需要进行增加。
- 在确定层数时,应综合考虑计算开销与模型精度之间的权衡关系。
初始数据点
- 每个保真度层次都应收集足够数量的初始数据点,以对相应搜索空间形成较合理的覆盖。
- 可采用试验设计方法(如拉丁超立方采样,Latin Hypercube Sampling)生成初始数据点。
采集函数选择
- 期望改进(EI)是平衡探索与开发时较为常用的选择。
- 上置信界(UCB)更适用于带有噪声的目标函数问题。
- 当已知目标函数的目标值范围时,可考虑使用改进概率(PI)。
停止准则
- 应根据可用计算预算设置最大迭代次数。
- 可依据目标函数值在若干次迭代中的改进幅度设定收敛阈值。
- 在决定停止时,还应考虑性能提升的边际收益是否已明显减弱。