实值优化问题的非对称负相关搜索算法

于润龙1 赵洪科2 汪 中1 叶雨扬1 张培宁1 刘 淇1 陈恩红1

1(大数据分析与应用安徽省重点实验室(中国科学技术大学) 合肥 230027)2(天津大学管理与经济学部 天津 300072)

摘 要 现实世界中的许多应用与实值优化问题紧密相关.为了求解复杂的实值优化问题,一些研究工作提出不同的元启发式假设并设计相应的搜索策略.在搜索解空间过程中,如何平衡探索解空间新区域(多样化)与实现优质解利用(集约化)之间的关系,是提高元启发式搜索算法性能的关键因素之一.特别地,负相关搜索(negatively correlated search, NCS)通过在搜索进程中引入负相关的搜索趋势,促进了解的多样性,有效改进了并行爬山算法的搜索性能.负相关搜索将每一个搜索进程的搜索行为建模为概率分布,在此基础上,根据搜索进程的搜索范围的相对大小,将搜索行为进一步划分为全局搜索行为和局部搜索行为.然后提出一种新的元启发式搜索算法,即非对称负相关搜索(negatively correlated search with asymmetry, NSA),它假设具有全局搜索行为的搜索进程应尽可能远离具有局部搜索行为的搜索进程.得益于搜索进程之间非对称的负相关的搜索趋势,提出的算法相比负相关搜索拥有更优的搜索效率.实验结果表明:相比成熟的搜索方法,非对称负相关搜索在20个多模态实值优化问题上取得了最佳的整体性能.

关键词 复杂实值优化问题;探索与利用;并行爬山算法;负相关搜索;搜索行为

在现实世界中存在许多复杂的优化问题,例如,最小化汽车流体设计的空气阻力[1]、最小化天线阵列中的峰值傍瓣电平(peak side-lobe levels, PSLLs)[2]以及最优经济调度问题中电力设备的折损[3]等.这些复杂优化问题都涉及实值参数空间的许多局部极值解.通常,研究人员设计专门的模拟软件来拟合复杂的优化场景,也就是说显式的优化函数和梯度信息是很难被获取的.这类优化问题被统称为多模态(非凸)实值优化问题或黑盒优化问题[4],图1展示了3个经典的实值优化函数在二维情况下的可视化样例.由于在大多数场景下,缺少对优化函数的有效信息,因此需要采取一般的启发式假设来指导搜索解空间,所有的这些算法被归纳为元启发式搜索[5].大量研究表明[6-8]:元启发式搜索在求解复杂实值优化问题时,展现了比一般遍历方法和其他近似方法更好的优化性能.其中具有代表性的元启发式搜索包括:爬山算法[9](hill climbing, HC)、模拟退火算法[10](simulated annealing, SA)、禁忌搜索[11](tabu search, TS)、遗传算法[12](genetic algorithms, GA)、粒子群算法[13](particle swarm optimizer, PSO)、演化策略[14](evolution strategies, ES)、差分演化[15](differential evolution, DE)等.

Fig. 1 Visualization of benchmark complex real- parameter optimization functions
图1 可视化复杂实值优化函数

元启发式搜索是基于一个或多个随机搜索进程以及个体或种群的迭代实现的,种群中的每个个体代表了实值优化问题的一个可行候选解.为了衡量这些解的优劣,需要通过计算实值优化问题的函数值来评估这些候选解,称得到的函数值为个体或解的适应度.适应度的大小通常被用于指导元启发式搜索的搜索方向[16].对于复杂实值优化问题,一方面,由于解空间的维度高、规模大,存在大量的局部极值点,任何包含有限数量搜索进程的元启发式搜索都不能保证发现全局最优解;另一方面,由于解空间的连续性和缺乏优化函数的梯度信息,采用任何随机搜索算子的搜索进程都只能在有限的搜索步骤尽可能接近局部极值点,而不能到达极值点.因此,一个元启发式搜索方法是注重解空间的探索,即探寻更多的局部极值点以发现全局更优的解,还是注重解的利用,即驱使适应度更优的解逼近周围的某个局部极值点,是设计元启发式搜索最为关键的问题之一,相关问题也被称作探索与利用问题,或多样化与集约化问题[17].许多元启发式搜索提出了平衡探索与利用的方法或假设,研究表明这些元启发式假设直接影响了搜索算法的性能[18].特别地,负相关搜索[19](negatively correlated search, NCS)是一种基于种群的元启发式搜索算法,假设不同的搜索进程应当探索解空间不同的区域,通过在并行爬山算法中引入负相关的搜索趋势,目前展现了复杂实值优化问题的最佳优化性能.

在本文中,我们以概率分布建模每一个搜索进程的搜索行为,并且根据其概率分布的大小,将搜索进程的搜索行为进一步划分为全局搜索行为和局部搜索行为.然后提出一种新的元启发式搜索算法,即非对称负相关搜索(negatively correlated search with asymmetry, NSA),它假设具有全局搜索行为的搜索进程应当远离具有局部搜索行为的搜索进程,而具有局部搜索行为的搜索进程不受到具有全局搜索行为的搜索进程的影响.针对元启发式搜索的探索与利用问题,我们通过研究一对搜索进程之间负相关搜索趋势的非对称性,从而提供了一种平衡探索与利用的新的思路.本文首先总结了实值优化问题中元启发式搜索的探索与利用问题和相关假设,然后介绍了经典的并行爬山算法以及负相关搜索的核心思想,接着描述了非对称负相关搜索以及其元启发式假设.相比负相关搜索,可以发现非对称负相关搜索的效率更高且性能更优.在20个多模态实值优化问题上的对比实验验证了我们的想法.最后,讨论了关于非对称负相关搜索在并行计算方面的潜力并给出了扩充实验结果.

1 相关工作

求解复杂实值优化问题的元启发式搜索一般分为2类方法:基于种群的搜索算法(采用一组候选解)和基于个体的搜索算法(采用单个候选解).基于个体的搜索算法首先产生单个随机初始候选解,在每一轮迭代过程中,当前的候选解以一定的概率被其邻域内另一个解所取代;而基于种群的搜索算法利用了多个候选解,在每一轮迭代过程中,整个种群或者部分候选解被新产生的个体取代.由于这2类元启发式搜索导致了不同的探索与利用的平衡策略,我们分别讨论其分支的相关工作.

1.1 基于个体的搜索算法

本节介绍3种经典的基于个体的搜索算法,分别是爬山算法(hill climbing, HC)、模拟退火算法(simulated annealing, SA)和禁忌搜索(tabu search, TS).这3种基于个体的元启发式搜索可以通过独立地并行工作转化成为基于种群的搜索算法,但是大多数情况下使用它们基于个体的搜索形式[9-11].

1) 爬山算法

爬山算法是最基本的元启发式搜索之一,通常被形式化为单个搜索进程,也就是说,从单个随机初始候选解开始,在迭代的过程中被邻域内适应度更优的候选解取代.爬山算法有许多实现方式,其中采用高斯变异算子的实现方式是处理实值优化问题最流行的方法之一[20].为了平衡探索与利用,高斯变异算子的搜索步长由1/5成功准则进行调整.1/5成功准则的核心思想是[21]:如果搜索进程经常在过去的迭代过程中找到适应度更优的候选解,则应当增大搜索步长;如果搜索进程未能在过去的迭代中找到适应度更优的候选解,则搜索步长应当减小.

2) 模拟退火算法

与爬山算法相比较,模拟退火算法采用概率方法更好地探索全局最优解.受冶金退火工艺的启发,模拟退火算法采用加热和冷却的控制策略调整搜索进程远离局部极值点的能力.在模拟退火算法中,缓慢地实施冷却的概念被解释为:随着解空间的探索而接受适应度较差的候选解的概率被缓慢地降低.这意味着在迭代过程中,模拟退火算法的平衡策略从探索转向利用.

3) 禁忌搜索

禁忌搜索通过放宽爬山算法的取代条件和引入禁忌列表来加强对解空间的探索能力.首先,在每一轮的迭代过程中,如果当前候选解的邻域内没有发现适应度更优的解,则可以接受适应度更差的解.然后,引入禁令以阻止搜索进程访问之前发现的解.特别地,如果在短期内访问过某个候选解,或者候选解违反了预先制定的禁忌规则,将该候选解标记上禁令并存放在禁忌列表中,以便搜索进程不会反复搜索这个候选解,这有助于算法对解空间的探索能力.

1.2 基于种群的搜索算法

研究表明[6-8],基于种群的搜索算法不仅在理论方面取得了成功,而且在应用方面被认为是经验上更好的元启发式搜索.尽管有许多工作讨论了基于种群的探索与利用的平衡策略,但是可以从整体上把它们分为3类[19,22-23]

1) 小生境技术(niching techniques)

诸如适应度共享和拥挤方法的小生境技术旨在选择解空间中彼此距离较远的一组候选解,然后利用这些解产生新的候选解(一般通过杂交算子).适应度共享方法试图与邻域的个体共享适应度,并通过牺牲部分候选解的适应度来维持种群的多样化.而拥挤方法依赖于后代与其近代父母之间的竞争机制,允许调整选择压力以偏向选择相隔距离很远的个体,从而增进种群的多样化.

2) 自适应搜索步长(adaptive search step-size)

显然,可以采用具有小搜索步长的搜索进程来发现更接近当前候选解的新的解,这有助于利用适应度更优的候选解.另一方面,可以采用具有大搜索步长的搜索进程来发现更远离当前候选解的新的解,这有助于解空间的探索.许多元启发式假设基于解空间的属性提出了自适应搜索步长的策略.但是,这种方法会引入另一个算法设计问题,也就是说,应该使用何种搜索进程及在迭代期间何时切换具有不同搜索步长的进程以实现探索与利用之间的良好折中.

3) 负相关(negative correlation)

基于并行爬山算法的负相关提出元启发式假设,即不同的搜索进程应该在解空间中搜索不同的区域.通过将各搜索进程的搜索行为建模为概率分布,负相关搜索鼓励保留那些具有较小相关概率的搜索进程.由于搜索进程之间搜索趋势的负相关性,负相关搜索显著提高了探索能力,我们将在接下来的章节详细介绍这一策略.

2 并行爬山算法与负相关

在本节中,首先介绍面向实值优化的并行爬山算法(parallel hill climbing, PHC)框架,然后在此基础上进一步讨论负相关搜索.并行爬山算法被形式化为多个爬山算法独立且并行地运行,每个爬山算法从初始的随机候选解开始,在迭代期间被适应度更优的邻居候选解取代.我们可以将爬山算法视为单个搜索进程,其在大部分情况下是依赖高斯变异算子实现的,通过1/5成功准则调整高斯变异算子的参数.

2.1 高斯变异算子

假定一个D维连续最小化问题的目标函数为f(x),对于并行爬山算法,每一个候选解(种群中的个体)被表示为一个D维的实值向量.高斯变异算子被用于实现种群中所有个体的随机搜索进程.对于第i个搜索进程的当前解xi,高斯变异算子产生新的解的过程依赖于[20]

(1)

xi d表示xi的第d维分量,N(0,σi)表示一个均值为0且标准差为σi的高斯随机分布.高斯随机分布的标准差σi对于不同的搜索进程以及其在解空间不同的维度可以给出不同的值,为了保持简单的形式,在本文默认初始化所有搜索进程相同的高斯变异算子的参数.对于并行爬山算法,采取下启发式规则来选择丢弃一个解:

(2)

2.2 搜索步长与15成功准则

通过高斯变异算子的数学形式,可以了解到一个候选解产生新的解的范围(新的个体与其父亲在解空间的欧氏距离)依赖于高斯随机分布的标准差σi值.因此在并行爬山算法中,对于单个搜索进程来说,高斯随机分布的标准差σi值可以被看作调整搜索步长的重要指标.15成功准则被经常用于协助基于高斯变异算子的搜索进程,特别地,调整搜索步长以谋求探索与利用之间的平衡.一般的15成功准则可以表示为[21]

(3)

其中,0<r<1,c表示在epoch轮迭代过程中个体替代其父代的次数,即新产生的解被保留的次数.一方面,如果c比较大,意味着搜索进程在过去的迭代中经常找到适应度更优的候选解,因此搜索步长应当增大(为原来的r-1倍)以更快地探索解空间更多适应度更优的候选解;另一方面,如果c比较小,意味着搜索进程未能在过去的迭代中发现更优的候选解,因此搜索步长应当减小(为原来的r倍)以帮助搜索进程高效地利用优质候选解的邻居区域.

2.3 搜索行为与负相关

负相关搜索首先将搜索进程的搜索行为视为概率分布,因为新的解是在每次迭代时由变异算子作用于候选解产生的,并且下一次迭代中搜索进程的搜索趋势相当于一个新的解被采样的概率分布.因此,如果一个搜索进程的搜索行为与其他搜索进程的搜索行为负相关,则很可能在不被其他搜索进程的搜索行为覆盖的区域产生新的候选解.这需要测量2个概率分布之间的差异或相关性,巴氏距离(Bhattacharyya distance)被引入并测量2个搜索进程的搜索行为之间的相关性[24].对于2个连续或离散概率分布的巴氏距离可以分别表示为

(4)

(5)

其中,pipj表示2个分布的概率密度函数.如果无法获知显式的概率密度函数,可以通过随机产生候选解的方式来近似概率,并通过巴氏距离的离散形式估计相关性的值.

xi表示第i个搜索进程获得的当前候选解,并且表示变异算子作用于xi产生的新解.每次迭代中,将选择2个解的其中一个在变异算子的作用下产生新的解,另一个则被丢弃.也就是说,在下一次迭代中与第i个搜索进程相关联的搜索行为取决于变异算子和保留的解,即xi因此,通过选择要保留的候选解,相当于选择了第i个搜索进程的搜索行为,其概率分布表示为pi理想情况下,所选择的候选解应当具有更优的适应度,并且鼓励其搜索行为远离解空间的其他搜索进程.在负相关搜索中,前者可以用最小化实值优化问题的目标函数值来衡量,后者用搜索行为的相关性来衡量,定义为

(6)

其中,概率分布pi表示了第i个搜索进程的搜索行为.Corr(pi)的值越大,与其相关联的候选解越倾向于被保留.

3 非对称负相关搜索算法

在本节中,首先讨论负相关搜索的局限性.针对负相关搜索的缺陷,提出将非对称的思想引入负相关,根据搜索行为的概率分布的大小,将搜索行为进一步划分为全局搜索行为和局部搜索行为,并给出非对称负相关搜索作为算法实例.

3.1 负相关的局限性

Fig. 2 Illustration of search behaviors in a two-dimensional search space
图2 二维解空间(标注等高线)的搜索示例

除负相关搜索之外,几乎所有的元启发式假设都将多样性概念定义为各个候选解之间的多样性,而负相关搜索提出并定义了搜索行为的多样性,这直接与搜索进程产生新解的概率分布相关.负相关的思想有效改进了并行爬山算法的搜索性能.然而,本研究认为不同的搜索进程覆盖不同的搜索区域(具有负相关的搜索行为)过于严格.举例来说,如果多个搜索进程共同覆盖的解空间的区域存在局部极值点,那么这些搜索进程互相远离的结果将导致其中的局部极值点不被任何一个搜索进程发现.在局部极值点密集的区域,这种情况尤为明显.当搜索进程共同覆盖的解空间的区域较小且集中多个局部极值点时,负相关不仅不能够更好地探索解空间,而且还会导致搜索进程拥挤,这大大降低了搜索效率.

考虑图2所描述的情形,R1R2表示2个搜索进程在二维解空间采纳负相关的搜索行为,在图例中其搜索趋势以箭头符号示意.对于R1R2,我们以候选解的向量值为圆心,高斯变异算子的标准差为半径,可视化2个搜索进程在二维解空间的搜索范围,即搜索进程覆盖的解空间的区域.可以发现,R1R2的搜索范围覆盖了部分相同的区域,且共同覆盖的区域存在局部极值点A.由于负相关鼓励搜索进程探索解空间不同的区域以维持解的多样性,因此R1R2倾向于在远离彼此的方向上产生新的解,从而远离局部极值点A.对于这种情形,2个搜索进程无法利用当前候选解发现邻域内适应度更优的新的解,可以认为负相关限制了搜索进程对解的利用,破坏了探索与利用的平衡.

3.2 非对称负相关搜索

为了平衡探索与利用的关系,我们首先根据一对搜索进程其搜索范围的相对大小,将种群中的搜索进程的搜索行为划分为全局搜索行为(搜索范围较大)和局部搜索行为(搜索范围较小).一方面,具有全局搜索行为的搜索进程搜索范围大、搜索方向相对不清晰、其覆盖的区域可能存在多个局部极值点或者没有局部极值点;另一方面,具有局部搜索行为的搜索进程搜索范围小、搜索方向相对清晰\其覆盖的区域通常只有一个或少个局部极值点.我们区别对待具有全局搜索行为的搜索进程与具有局部搜索行为的搜索进程对彼此相关性的影响,并提出非对称负相关的元启发式假设:如果一对搜索进程中存在具有全局搜索行为的搜索进程,那么这个搜索进程应鼓励与另一个搜索进程负相关的搜索行为.也就是说,具有全局搜索行为的搜索进程应当远离具有局部搜索行为的搜索进程,而具有局部搜索行为的搜索进程不受到具有全局搜索行为的搜索进程的影响.通过引入非对称到负相关,我们提供了一种平衡探索与利用的新的思路,并且可以大量节省由负相关操作产生的计算成本,从而节约算法的运行时间.

下面介绍一种采纳非对称负相关的元启发式假设的实例,即非对称负相关搜索算法.非对称负相关搜索继承了并行爬山算法的基本形式,种群中的个体依赖高斯变异算子产生新的解.特别地,高斯变异算子的标准差成为刻画个体搜索行为的重要指标.对于第i个搜索进程,当前高斯变异算子的标准差为σi,对于第j个搜索进程,当前高斯变异算子的标准差为σj,如果存在σi>σjW,定义第i个搜索进程相对于第j个搜索进程是具有全局搜索行为的搜索进程,第j个搜索进程相对于第i个搜索进程是具有局部搜索行为的搜索进程,反之亦然,如果不存在σi>σjW或者σj>σiW,定义第i个搜索进程与第j个搜索进程互为具有局部搜索行为的搜索进程,这里W被定义为非对称参数.对于当前一对搜索进程,具有局部搜索行为的搜索进程不受到相关性的影响.如果一个搜索进程相对于其他所有搜索进程均为具有局部搜索行为的搜索进程,那么它的候选解的更新策略只与解的适应度有关,这与并行爬山算法的候选解的更新策略是一致的.

如果一个搜索进程相对于某个搜索进程具有全局搜索行为,那么就需要计算它与这个搜索进程的相关性.由此,在非对称负相关搜索中,相关性为


(global,local)}.

(7)

对于采用高斯变异算子的2个个体xixj,其产生子代的概率分布的巴氏距离[25]:

(8)

其中,Σ=(Σi+Σj)2,Σi=σi2II是单位矩阵.进一步平衡种群中个体的适应度与相关性之间的关系,因为个体的适应度f(xi)和相关性Corr(pi)通常不在一个量级,并且个体的适应度f(xi)可能取负值,而相关性Corr(pi)是非负的.对于最小化问题,我们采取的策略是f(xi)减去目前为止搜索算法得到的最小值,作非负化处理.然后,对于第i个搜索进程,做归一化处理,使得Corr(pi)+都等于1.归一化处理之后,可以不再考虑f(xi)和Corr(pi)的大小,因为现在它们等于一个较小的表示有较优的适应度,一个较大的表示产生的子代会与那些具有局部搜索行为的个体产生的子代处于较远的距离.因此,那些更小且更大的解将会倾向于被保留.我们采用启发式规则来选择丢弃一个解:

(9)

其中,参数λ>0.给定xi不同的λ值将会在保留或丢弃解上做出不同的决策.因此,λ值的设定将直接影响到非对称负相关搜索的搜索趋势,进而影响到非对称负相关搜索的性能.通常可以把λ的缺省值设定为1,表示个体的适应度和相关性同等重要.但是,对于不同的情况,一个变化的λ值将是更合适的.在这里,采用随迭代轮数变化的λ参数.具体地,在非对称负相关搜索迭代初期,xi的变化比较大,采用远离缺省的λ值;在非对称负相关搜索迭代后期,xi比较相似,λ值伴随趋近于1.综上,从高斯分布采样得到λ值,高斯分布的期望为1,标准差初始化为0.1,随后趋近于0.

(10)

其中,t是当前迭代的轮数,Tmax是非对称负相关搜索迭代的总轮数.

由此,我们可以得到非对称负相关搜索的算法流程:首先产生N个随机候选解作为初始种群,记录下初始种群的最优解,进入迭代过程.每一轮迭代,一个随轮数变化的λ值被产生,N个新的解由高斯变异算子作用在父代上产生,考察新产生的解的适应度并更新最优解,然后根据其搜索行为选择式(2)或者式(9)决定新的解是否替换父代成为种群中的个体.每经过epoch轮迭代,根据15成功准则更新高斯变异算子的标准差.终止条件被满足时,迭代结束,返回最优解,算法终止.

4 实验评估

在本节,为了评估非对称负相关搜索(negatively correlated search with asymmetry, NSA)的潜力,我们在实验部分与许多成熟的基于种群的搜索算法进行比较,包括遗传算法(genetic algorithms, GA)、粒子群算法(particle swarm optimizer, PSO)、演化策略(evolution strategies, ES)、差分演化(differen-tial evolution, DE)和散点搜索[26](scatter search, SS).对于这些算法中的每一种,选择最新的版本用于比较,即GL-25[12],CLPSO[13],CMA-ES[14],SaDE[15]和SS[26].此外,还选取了2个流行的基于个体的搜索算法,即模拟退火算法[10](simulated annealing, SA)和禁忌搜索[11](tabu search, TS),因为它们在实践中取得了优异的性能.为了验证非对称负相关的元启发式假设,选取并行爬山算法(parallel hill climbing, PHC)和负相关搜索[19](negatively corre-lated search, NCS)做参照.我们根据文献中的建议设定上述算法的参数,给出了实验结果及分析.最后,讨论了关于非对称负相关搜索在并行计算方面的潜力并给出了扩充实验结果.

4.1 搜索算法的参数设置

为了使比较公平,对所有的搜索算法设定相同的产生初始解的策略,并用实值向量的形式表示候选解.SA[10]和TS[11]采取相同的高斯变异算子,其中标准差被初始化为优化函数自变量范围的1/10,式(3)中的参数repoch分别设定为0.99和10.具体地,对于SA中的冷却过程,温度初始化为1,然后每100轮迭代以85%的速率降低;对于TS,将最近生成的5个候选解保存在禁忌列表中.遵循标准程序,设定SS[26]的参考集的大小为10,并且参考集中的每一对候选解在迭代中被重新组合以产生新的解,特别地,使用1点杂交算子作为父代的重组方法,使用高斯变异算子产生并改进新的解.在本实验中,我们比较了标准的CMA-ES[14].GL-25[12]是一种混合实值编码的遗传算法,它首先在25%的计算预期内执行全局搜索行为,然后执行局部搜索行为,其中与全局搜索行为相关的初始种群大小为400,之后适应度最高的100个个体被保留并执行局部搜索行为.在CLPSO[13]中,通过利用所有粒子的历史最佳信息来更新粒子的速度.在SaDE[15]中,尝试矢量生成方案和相关控制参数都是通过逐次学习以前产生的适应度更优的候选解及其经验而自适应.CLPSO和SaDE的种群规模分别为40和50.除了相关性的计算过程之外,PHC和NCS[19]复制NSA的所有组件.也就是说,在PHC中,适应度是被认为是丢弃一个候选解的唯一标准.对于NSA,设定非对称参数W=10,我们还需要预先设定NSA的种群大小,在这里将其设定为10,即与SS相同.

4.2 实验方案

多模态(非凸)实值优化问题是最典型的复杂实值优化问题,也正是这类问题激发了大多数基于种群的搜索算法的设计.在实验评估中使用CEC2005实值优化竞赛[27]的基准测试函数(编号F6~F20)中20个多模态实值优化问题.每个基准测试函数的维度设置为30维.每个搜索算法在生成300 000个候选解时终止,并输出到目前获得的适应度最优的解.最优解的质量用函数误差测量,即所获取的最优解的目标函数值与问题的最佳候选解的目标函数值(这些基准测试函数已知)之间的差值.也就是说,更优的解对应于更小的函数误差,零函数误差表示找到了最佳的候选解.由于所有的搜索算法都采用随机搜索算子,我们对每种算法重复实验25次,记录相应的函数误差值,并将10种算法实现的平均函数误差与标准偏差一起列出.

4.3 实验结果与分析

表1给出了10种搜索算法在20个基准测试函数上的平均函数误差,表2给出了非对称负相关搜索与负相关搜索在基准测试函数上运行时间的比较.我们使用双侧Wilcoxon秩和统计检验[28]来检查非对称负相关搜索与对比搜索算法之间的差异(就函数误差而言)是否具有统计显著性,Wilcoxon秩和统计检验以0.05显著水平设计.通过Wilcoxon秩和统计检验,如表1最后一行所示,在成对的比较中,非对称负相关搜索在统计上显著优于其他算法,特别地,非对称负相关搜索在20个基准测试函数上均不显著劣于负相关搜索,并在17个基准测试函数上显著优于负相关搜索,验证了非对称负相关假设的合理性.并且,在运行时间的比较中,非对称负相关搜索因为缓解了负相关搜索冗余的相关性计算,在许多基准测试函数与负相关搜索相比大大节约了运行时间.此外,我们基于成对的双侧Wilcoxon秩和统计检验计算了搜索算法执行第K佳结果的次数,即Top-K(K=1,2,…,10),如图3所示.如果算法的整体性能是最优的,那么对应的折线会高于其他算法的折线,并且在最小的K值达到20(基准测试函数的总数).可以观察到非对称负相关搜索在K=6时首先到达了20,同时非对称负相关搜索永远不会低于其他折线,因此我们验证了非对称负相关搜索取得最佳的整体性能.

Table 1 The Averaged Results of Search Algorithms on Benchmark Functions
表1 搜索算法在基础测试函数上的平均函数误差

FunctionPHCSATSSSGL-25SaDECMA-ESCLPSONCSNSAF62.61E+01±2.35E+013.90E+02±4.09E+017.00E+03±1.01E+042.17E+05±6.41E+042.13E+01±1.02E+01 4.76E+01 ±3.35E+010.00E+00±0.00E+004.80E+00±3.55E+002.33E+01±1.06E+012.02E+01±2.46E+00F79.86E-04±2.76E-032.21E+00±1.84E+001.64E-02±1.59E-021.40E+00±7.31E-022.78E-02±3.76E-021.95E-02±1.37E021.84E-03±4.59E-034.63E-01±7.31E-021.67E-02±2.19E-021.62E-02±1.25E-02F82.00E+01±1.29E-022.10E+01±7.13E-022.01E+01±3.60E-022.09E+01±3.60E-022.10E+01±5.12E-022.09E+01±4.76E-022.03E+01±5.62E-022.10E+01±5.60E-022.00E+01±1.11E-022.00E+01±8.60E-03F91.07E+02±2.13E+012.41E+02±8.62E+014.83E+02±9.60E+012.57E+02±3.85E+012.63E+01±5.64E+001.99E-01±4.06E-014.12E+02±1.38E+020.00E+00±0.00E+009.01E+01±1.49E+018.66E+01±1.32E+01F109.64E+01±1.84E+012.17E+02±8.69E+017.92E+02±1.43E+023.48E+02±9.51E+011.35E+02±6.67E+025.08E+01±1.32E+014.97E+01±1.12E+011.06E+02±1.31E+011.01E+02±2.15E+018.52E+01±1.51E+01F111.57E+01±1.89E+002.70E+01±2.18E+001.89E+01±4.44E+002.58E+01±4.55E+003.15E+01±8.45E+001.68E+01±2.82E+006.23E+00±1.47E+002.63E+01±1.65E+001.37E+01±1.25E+001.35E+01±1.27E+00F127.53E+03±6.72E+036.06E+03±5.30E+032.28E+03±3.39E+031.18E+04±7.82E+036.83E+03±4.34E+033.11E+03±2.15E+031.28E+04±1.53E+041.96E+04±4.44E+032.04E+03±1.68E+031.57E+03±1.85E+03F134.32E+00±9.03E-011.33E+01±1.04E+011.19E+01±3.36E+002.80E+01±4.44E+007.88E+00±5.79F+003.72E+00±5.89E-013.35E+00±8.52E-012.14E+00±2.09E-014.81E+00±7.98E-014.26E+00±7.63E-01F141.34E+01±2.11E-011.47E+01±1.07E-011.42E+01±3.11E-011.35E+01±3.92E-011.29E+01±3.72E-011.26E+01±2.71E-011.47E+01±1.95E-011.27E+01±2.64E-011.26E+01±2.94E-011.25E+01±2.55E-01F153.79E+02±5.35E+015.72E+02±1.18E+028.42E+02±3.19E+02 4.33E+02±4.75E+013.00E+02±7.62E-023.60E+02±6.51E+015.13E+02±2.69E+026.33E+01±4.87E+013.15E+02±5.26E+013.24E+02±5.89E+01F161.42E+02±4.36E+013.77E+02±1.93E+025.96E+02±3.35E+024.21E+02±1.89E+001.44E+02±7.76E+018.16E+01±6.90E+013.39E+02±2.99E+021.76E+02±3.25E+011.24E+02±1.41E+011.17E+02±2.13E+01F171.90E+02±3.94E+016.46E+02±3.12E+02 8.75E+02±3.34E+023.28E+02±1.29E+021.58E+02±7.17E+017.31E+01±2.79E+014.15E+02±3.07E+022.36E+02±4.37E+011.64E+02±2.34E+011.44E+02±2.17E+01F189.10E+02±1.98E+008.23E+02±1.60E+01 9.29E+02±1.60E+028.32E+02±4.00E+019.06E+02±1.49E+008.75E+02±6.32E+019.04E+02±1.86E-019.10E+02±2.15E+019.09E+02±9.66E-018.16E+02±1.80E+02F199.09E+02±1.74E+008.23E+02±1.40E+019.54E+02±1.92E+028.45E+02 ±7.77E+019.07E+02±1.71E+019.07E+02±4.08E+019.25E+02±1.07E+029.14E+02±1.79E+009.09E+02±1.61E+008.82E+02±8.48E+01F209.09E+02±1.92E+008.29E+02±3.46E+011.01E+03±1.95E+028.24E+02±8.86E-019.07E+02±1.54E+008.83E+02±5.84E+019.04E+02±2.32E-019.14E+02±1.19E+009.10E+02±1.59E+008.43E+02±1.29E+02F215.00E+02±0.00E+008.47E+02±1.03E+029.08E+02±3.43E+028.22E+02±2.60E+025.00E+02±4.83E-035.00E+02±2.09E-035.12E+02±6.00E+015.00E+02±2.38E-135.00E+02±0.00E+004.97E+02±9.54E+00F229.41E+02±2.11E+017.45E+02±2.25E+02 1.34E+03±1.60E+025.74E+02±1.27E+029.28E+02±1.07E+019.33E+02±2.00E+018.24E+02±1.59E+019.70E+02±1.04E+019.17E+02±1.24E+019.11E+02±1.74E+01F235.43E+02±1.57E-128.36E+02±1.13E+021.31E+03±1.10E+029.62E+02±3.27E+025.34E+02±4.21E-045.34E+02±2.26E-035.35E+02±1.88E+005.34E+02±1.57E-045.73E+02±2.41E+015.64E+02±1.98+01F242.00E+02±3.59E+023.69E+02±2.79E+021.57E+03±1.04E+022.35E+02±8.36E+012.00E+02±2.96E-092.00E+02±0.00E+002.00E+02±6.39E-132.00E+02±2.67E-122.00E+02±0.00E+002.00E+02±0.00E+00F251.35E+03±3.59E+021.43E+03±6.85E+012.00E+03±7.30E+011.32E+03±3.66E+012.17E+02±1.59E+012.13E+02±1.15E+002.07E+02±6.30E+002.00E+02±1.96E+002.41E+02±4.65E+012.18E+02±2.94E+01W-D-L16-2-217-2-118-2-017-0-315-2-313-1-611-1-813-1-617-3-0-

Note: The averaged results are listed in the form of “mean ± standard deviation”. The last row provides the results of the Wilcoxon test, where “W-D-L” indicates NSA is superior to, not significantly different from or inferior to the corresponding compared algorithms.

Table 2 The Running Time of NSA and NCS
表2 非对称负相关搜索与负相关搜索的运行时间 s

Benchmark FunctionF6F7F8F9F10F11F12F13F14F15NCS51.3254.0258.9354.7054.9794.6567.9755.9161.97336.33NSA6.149.046.857.038.4243.4719.729.3010.30274.27Benchmark FunctionF16F17F18F19F20F21F22F23F24F25NCS308.70310.48309.70314.23312.78328.23349.17330.79280.14278.86NSA243.25244.27248.43246.98263.23293.21290.72261.77222.46228.40

Fig. 3 The Top-K,K=1,2,…,10,curves of the algorithms
图3 搜索算法的Top-K(K=1,2,…,10)折线图

Fig. 4 The search trajectories of three algorithms with
population size N=4 on the 2D version of F18
图4 在二维基准测试函数F18上3种算法的搜索轨迹

为了进一步验证非对称负相关的元启发式假设,在二维可视化的基准测试函数上设计实验测试非对称负相关搜索,并比照了并行爬山算法和负相关搜索.我们设定种群的大小为4,在搜索过程中记录每个个体的搜索趋势.在基准测试函数F18上的结果如图4所示.可以观察到并行爬山算法探索解空间的能力很差,解的多样性在迭代的过程中不能够被很好地保持;负相关搜索拥有优异的探索解空间的能力,有效地保持了解的多样性,但是限制了对优质解的利用,不能够很好地做到集约化;非对称负相关搜索在探索解空间的同时,有效地利用了高质量的解.综上所述,可以认为非对称负相关的元启发式假设在探索与利用之间做到了最优的平衡.

4.4 非对称负相关搜索的并行化

因为元启发式搜索是递归算法的特性,对于元启发式搜索细粒度的并行化方法(基于个体间的并行),如果不面向个体的适应度计算做单独的并行设计,元启发式搜索并行化的最大效率不会超过种群大小,所以对大种群更友好的元启发式搜索并行化潜力更大,通常是更被青睐的算法.特别地,基于种群的搜索算法通常因为个体间频繁的信息交流与现实中昂贵的通信代价,导致并行化效率较低,无法谋求以种群规模交换迭代轮数的目的[29],因此消除个体之间不必要的通信可以很好地释放算法的并行潜力.这里设计实验研究了非对称负相关搜索在并行化方面的性能,并与负相关搜索进行比较.具体地,采用细粒度的“主-从模型”作为并行框架[30],如图5所示,主机负责控制搜索流程,每个计算单元享有一个独立的搜索进程,搜索进程之间的通信由主机转接.实验硬件环境为英特尔至强多核服务器集群,软件环境为Matlab分布式计算系统.设定搜索算法的种群大小从10增大到100,相应地计算单元由10个扩充到100个,并且保持搜索算法在生成300 000个候选解时终止,也就是说迭代轮数从30 000轮减少到3 000轮,记录下平均函数误差与算法运行时间的变化.

Fig. 5 Fine-gained Master-Slaves parallel framework
图5 细粒度的“主-从模型”并行框架

在30维基准测试函数F7上的结果如图6和图7所示.通过观察图6可以得到,对于最小化基准测试函数,我们保持搜索算法生成候选解的个数,在牺牲迭代轮数的同时扩大种群的规模,搜索算法的性能受到不同程度上的影响.其中,非对称负相关搜索对于种群规模较大的情况适应较好,负相关搜索在种群规模极大的情况搜索性能急剧下降,两者的相对差值呈多项函数趋势.这是由于负相关搜索在种群规模极大的情况容易出现因负相关产生的拥挤现象,也就是说个体集中在局部极值点附近且流通性较差.非对称负相关的元启发式假设只关注全局搜索行为,促进了个体的流通,有效缓解了拥挤现象,对基于大种群的大规模并行环境更友好.通过观察图7可以得到,在生成候选解的个数不变的情况下,非对称负相关搜索可以通过细粒度的并行化方法有效节约运行时间,并且种群规模越大,运行时间越短,这得益于随着种群规模扩大时算法迭代轮数减少.同时,并行化负相关搜索的运行时间随着种群规模的扩大反而急剧提升,这是由于种群规模扩大导致整体相关性的计算代价呈幂律提升,从而展现了负收益的并行化结果.非对称负相关的元启发式假设避免了部分冗余的相关性计算,在大规模并行环境展现了更加优异的潜力.

Fig. 6 The function errors of parallelized NSA and NCS
图6 并行化NCS,NSA的平均函数误差及相对差(Diff)

Fig. 7 The running time of parallelized NSA and NCS
图7 并行化NSA以及并行化NCS的运行时间

5 总 结

本文首先介绍了求解复杂实值优化问题的一般性方法和关于探索与利用的背景研究,然后围绕平衡探索与利用的策略分析了流行的元启发式假设,特别是负相关.我们发现负相关搜索鼓励搜索行为的多样性从而改进了并行爬山算法的探索能力,但是其假设过于严格,并且导致搜索进程的拥挤和相关性计算的冗余.我们提出了非对称负相关的元启发式假设,将种群中搜索进程的搜索行为划分为全局搜索行为和局部搜索行为,鼓励具有全局搜索行为的搜索进程尽可能远离具有局部搜索行为的搜索进程.在此基础上,我们给出了非对称负相关搜索的算法流程,并在20个多模态实值优化问题上与成熟的搜索算法对比,实验结果表明非对称负相关搜索取得了最佳的整体性能,同时在运行效率和并行化潜力方面显著优于负相关搜索.

元启发式搜索是通过全局探索和局部利用的不同机制引导并迭代生成解的一类过程,探索与利用之间的平衡是提高元启发式搜索优化性能的关键因素,不同的平衡策略是区分许多元启发式搜索的重要标识.本文继承了负相关对于搜索行为多样性的概念,与此同时关注解的利用,面向复杂实值优化问题,提供了一种平衡探索与利用的新思路.未来的研究包括:1)关于非对称负相关搜索的理论研究,比如发现最优解的时间复杂度分析;2)将非对称负相关搜索扩展到其他优化问题,比如,多目标实值优化问题,组合优化问题,多任务优化问题等;3)利用非对称负相关搜索解决具体的复杂应用问题.

参考文献

[1]Ahmed H, Chacko S. Computational optimization of vehicle aerodynamics[C] //Proc of the 23rd Int DAAAM Symp. Vienna, Austria: DAAAM International, 2012: 313-318

[2]Ahmed Q Z, Ahmed S, Alouini M S, et al. Minimizing the symbol-error-rate for amplify-and-forward relaying systems using evolutionary algorithms[J]. IEEE Transactions on Communications, 2015, 63(2): 390-400

[3]Sasson A M, Merrill H M. Some applications of optimization techniques to power systems problems[J]. Proceedings of the IEEE, 1974, 62(7): 959-972

[4]Bessaou M, Siarry P. A genetic algorithm with real-value coding to optimize multimodal continuous functions[J]. Structural and Multidisciplinary Optimization, 2001, 23(1): 63-74

[5]Glover F, Kochenberger G A. Handbook of Metaheuristics[M]. Berlin: Springer Science & Business Media, 2006

[6]Voss S, Martello S, Osman I H. Meta-heuristics: Advances and Trends in Local Search Paradigms for Optimization[M]. Berlin: Springer Science & Business Media, 2012

[7]Dorigo M, Birattari M. Ant Colony Optimization[M]. Berlin: Springer, 2010

[8]Blum C, Roli A. Metaheuristics in combinatorial optimization: Overview and conceptual comparison[J]. ACM Computing Surveys, 2003, 35(3): 268-308

[9]Mitchell M, Holland J H, Forrest S. When will a genetic algorithm outperform hill climbing[C] //Advances in Neural Information Processing systems. Cambridge, Massachusetts: MIT Press, 1994: 51-58

[10]Corana A, Marchesi M, Martini C, et al. Minimizing multimodal functions of continuous variables with the “simulated annealing” algorithm Corrigenda for this article is available here[J]. ACM Transactions on Mathematical Software, 1987, 13(3): 262-280

[11]Chelouah R, Siarry P. Tabu search applied to global optimization[J]. European Journal of Operational Research, 2000, 123(2): 256-270

[12]García-Martínez C, Lozano M, Herrera F, et al. Global and local real-coded genetic algorithms based on parent-centric crossover operators[J]. European Journal of Operational Research, 2008, 185(3): 1088-1113

[13]Liang J J, Qin A K, Suganthan P N, et al. Comprehensive learning particle swarm optimizer for global optimization of multimodal functions[J]. IEEE Transactions on Evolutionary Computation, 2006, 10(3): 281-295

[14]Hansen N, Ostermeier A. Completely derandomized self-adaptation in evolution strategies[J]. Evolutionary Computation, 2001, 9(2): 159-195

[15]Qin A K, Huang V L, Suganthan P N. Differential evolution algorithm with strategy adaptation for global numerical optimization[J]. IEEE Transactions on Evolutionary Computation, 2009, 13(2): 398-417

[16]Estimation of Distribution Algorithms: A New Tool for Evolutionary Computation[M]. Berlin: Springer Science & Business Media, 2001

[17]repinšek M, Liu S H, Mernik M. Exploration and exploitation in evolutionary algorithms: A survey[J]. ACM Computing Surveys, 2013, 45(3): No.35

[18]Eiben A E, Smith J E. Introduction to Evolutionary Computing[M]. Berlin: Springer, 2003

[19]Tang K, Yang P, Yao X. Negatively correlated search[J]. IEEE Journal on Selected Areas in Communications, 2016, 34(3): 542-550

[20]Beyer H G, Schwefel H P. Evolution strategies-A comprehensive introduction[J]. Natural Computing, 2002, 1(1): 3-52

[21]Kramer O. Machine learning for Evolution Strategies[M]. Berlin: Springer, 2016

[22]Das S, Maity S, Qu B Y, et al. Real-parameter evolutionary multimodal optimization—A survey of the state-of-the-art[J]. Swarm and Evolutionary Computation, 2011, 1(2): 71-88

[23]Yao X, Liu Y, Lin G. Evolutionary programming made faster[J]. IEEE Transactions on Evolutionary computation, 1999, 3(2): 82-102

[24]Kailath T. The divergence and Bhattacharyya distance measures in signal selection[J]. IEEE Transactions on Communication Technology, 1967, 15(1): 52-60

[25]Fukunaga K. Introduction to Statistical Pattern Recognition[M]. Amsterdam: Elsevier, 2013

[26]Martí R, Laguna M, Glover F. Principles of scatter search[J]. European Journal of Operational Research, 2006, 169(2): 359-372

[27]Suganthan P N, Hansen N, Liang J J, et al. Problem definitions and evaluation criteria for the CEC 2005 special session on real-parameter optimization[R]. KanGAL Report 2005005 (2005). Singapore: Nanyang Technological University, 2005

[28]Lam F C, Longnecker M T. A modified Wilcoxon rank sum test for paired data[J]. Biometrika, 1983, 70(2): 510-513

[29]Alba E, Luque G, Nesmachnow S. Parallel metaheuristics: Recent advances and new trends[J]. International Transactions in Operational Research, 2013, 20(1): 1-48

[30]Luque G, Alba E. Parallel Genetic Algorithms: Theory and Real World Applications[M]. Berlin: Springer, 2011

Negatively Correlated Search with Asymmetry for Real-Parameter Optimization Problems

Yu Runlong1, Zhao Hongke2, Wang Zhong1, Ye Yuyang1, Zhang Peining1, Liu Qi1, and Chen Enhong1

1(Anhui Province Key Laboratory of Big Data Analysis and Application (University of Science and Technology of China), Hefei 230027) 2(College of Management and Economics, Tianjin University, Tianjin 300072)

Abstract As many real-world applications are closely related to complex real-parameter optimization problems, some metaheuristic assumptions are employed to help design search strategies and have been shown to be powerful tools. The balance between exploration (diversification) of new areas of the search space and exploitation (intensification) of good solutions accomplished by this kind of algorithms is one of the key factors for their high performance with respect to other metaheuristics. In particular, negatively correlated search (NCS) improves the search performance of parallel hill climbing by introducing negative correlation of search trends between search processes, which contributes greatly to the diversity maintenance of solutions. NCS models the search behaviors of individual search processes as probability distributions. On this basis, we further divide the search behaviors of a couple of search processes into global search behavior and local search behavior according to the size of the coverage of each search process. Then we present a new metaheuristic, namely negatively correlated search with asymmetry (NSA), which assumes that the search process with global search behavior should be away from the search process with local search behavior. Due to the asymmetry of the negative correlation between search processes, the efficiency of NSA has been greatly improved compared with NCS. The experimental results show that NSA is competitive to well-established search methods in the sense that NSA achieves the best overall performance on 20 multimodal real-parameter optimization problems.

Key words complex real-parameter optimization; exploration and exploitation; parallel hill climbing; negatively correlated search (NCS); search behavior

收稿日期2019-03-21;修回日期:2019-05-17

基金项目国家自然科学基金项目(61672483,U1605251);中国科学院青年创新促进会优秀会员专项(2014299);安徽省科技创新战略与软科学研究专项(201806a02020055)

This work was supported by the National Natural Science Foundation of China (61672483, U1605251), the Special Fund for the Member of Youth Innovation Promotion Association of Chinese Academy of Sciences (2014299), and the Anhui Science and Technology Innovation Strategy and Soft Science Research Special Project (201806a02020055).

通信作者刘淇(qiliuql@ustc.edu.cn)

(yrunl@mail.ustc.edu.cn)

中图法分类号 TP18

Yu Runlong, born in 1995. PhD candidate. His main research interests include evolutionary computation, metaheuristic search, computational intelligence, and recommender systems.

Zhao Hongke, born in 1988. PhD. His main research interests include optimization, data mining, and internet finance.

Wang Zhong, born in 1984. PhD, senior engineer. His main research interests include artificial intelligence, object detection, and machine learning.

Ye Yuyang, born in 1995. Master candidate. His main research interests include nature inspired computation, data mining, and representation learning.

Zhang Peining, born in 1997. Bachelor candidate. His main research interests include evolutionary computation, metah-euristic search, and parallel computing.

Liu Qi, born in 1986. PhD, associate professor, PhD supervisor. Member of CCF. His main research interests include data mining, optimization, recommender systems, and social network analysis.

Chen Enhong, born in 1968. PhD, professor, PhD supervisor. CCF Fellow, IEEE Senior Member. His main research interests include data mining, computational intelligence, recommender systems and social network analysis.