CN113110490A

CN113110490A - 基于改进的樽海鞘群算法的机器人多目标路径规划

Info

Publication number: CN113110490A
Application number: CN202110493563.9A
Authority: CN
Inventors: 应明峰; 莫晓晖; 程锦翔; 杭阿芳; 苗甜银
Original assignee: Jinling Institute of Technology
Current assignee: Jinling Institute of Technology
Priority date: 2021-05-07
Filing date: 2021-05-07
Publication date: 2021-07-13

Abstract

基于改进的樽海鞘群算法的机器人多目标路径规划，具体步骤如下：(1)基本樽海鞘群算法；(2)樽海鞘群算法的改进；(3)机器人路径规划；本申请提供基于改进的樽海鞘群算法的机器人多目标路径规划，依据重心来进行加权的优化策略，根据个体的优劣状况使用不同的权重来计算重心，可以在不忽略较差个体的同时，向更多优秀个体学习，合理利用了种群的信息，同时避免了只向最优个体学习陷入早熟使用逐维变异，可以避免高维函数之间每个维度相互干扰，从而提高变异解的质量。

Description

基于改进的樽海鞘群算法的机器人多目标路径规划

技术领域

本发明涉及人工智能技术领域，特别是涉及到基于改进的樽海鞘群算法的机器人多目标路径规划。

背景技术

樽海鞘群算法是Mirjalili等人于2017年提出的一种全新的群体智能优化算法。该算法的主要思想来源于樽海鞘的群聚行为。算法中将樽海鞘群分为两组，领导者和追随者。在樽海鞘链中领导者处于前面，其余的个体为追随者。和其他的群体智能优化算法不同在于，领导者不会影响整个群体的移动，追随者会根据前一个个体的位置来更新自己的位置，依此类推形成了樽海鞘链。领导者对于排在后面的追随者的领导作用会越来越弱，在后面的追随者不会一味的向着领导者移动，保持了种群的多样性，该方法可以用于机器人规划；

传统樽海鞘群算法中，所有领导者都向目标源进行学习，忽略了种群内其他优秀的个体，有文献提出重心反向学习，重心中包含了群体搜索经验，但是重心中所有个体的贡献相同；

在传统樽海鞘群算法中，领导者受到目标源的位置来更新自己的位置，追随者追随上一个个体进行更新。其中，领导者X的更新是在目标源头F的附近产生新的个体，追随者再根据领导者的位置进行位置更新。因此目标源的位置将直接影响整个种群的搜索方向，如果目标源陷入局部最优，那么种群会在目标源附近不断搜索，无法跳出局部最优，降低了种群的多样性，从而算法只能得到局部最优解，为了解决这一问题，常用的方法为加入变异操作，对更新完的个体进行变异，增强了种群的多样性，从而跳出局部最优。常使用的变异算子有高斯变异、柯西变异等。通常变异均是对所有维度同时进行变异，再根据目标函数来评判，这样对于高维函数，维度间会相互干扰，造成有些维度经过变异得到了更好的解，但是由于其他维度经过变异，变异效果不好，且变异效果差的维度覆盖了变异效果好的维度，使个体最后变异效果不佳，进而影响了算法的收敛速度和精度，针对以上问题申请人设计基于改进的樽海鞘群算法的机器人多目标路径规划。

发明内容

为了解决上述存在问题，本申请提供基于改进的樽海鞘群算法的机器人多目标路径规划，依据重心来进行加权的优化策略，根据个体的优劣状况使用不同的权重来计算重心，可以在不忽略较差个体的同时，向更多优秀个体学习，合理利用了种群的信息，同时避免了只向最优个体学习陷入早熟使用逐维变异，可以避免高维函数之间每个维度相互干扰，从而提高变异解的质量。

本发明提供基于改进的樽海鞘群算法的机器人多目标路径规划，其特征在于：具体步骤如下：

(1)基本樽海鞘群算法；

在樽海鞘群算法中，设樽海鞘群X在D维空间搜索，X由M个维度为D的樽海鞘个体组成，搜索空间上限为ubn＝[ubn₁ ubn₂ … ubn_D]，搜索空间下限为lbn＝[lbn₁ lbn₂ …lbn_D]，樽海鞘种群矩阵如下所示；

(2)樽海鞘群算法的改进；

1)重心优化策略；

根据个体的优劣状况使用不同的权重来计算重心，在不忽略较差个体的同时，向更多优秀个体学习，合理利用了种群的信息，同时避免了只向最优个体学习陷入早熟，重心定义如下：

定义1重心设(X¹,…,X^M)是D维空间中的m个点，则整体重心为

加权重心公式如下：

其中：Q_W为加权重心，f_wst为当前种群最差个体适应度值，f_F为目标源适应度值，

为当前种群_x ⁱ个体的适应度值，F为目标源位置，(f_wst-f)/β是个体的权重，越优秀的个体其权重越大，在加权重心中占比也就越大，同时在加权重心引入目标源的位置和权重，可以更加充分利用全局种群信息，修改后的领导者公式为

xⁱ＝λxⁱ+rnd*(Q_W-xⁱ)

λ＝(β/β_max)²

修改后的公式可以在向最优解逐渐学习的同时，没有过多丢失种群多样性，λ用来调节个体在搜索过程中对自身位置的依赖，搜索前期，较低的λ可以降低个体对自身的依赖，从而增大了搜索的范围，算法的全局搜索能力得到增强，搜索后期，λ逐渐向1靠拢，不影响算法寻优；

2)自适应惯性权重；

自适应惯性权重在很多群体智能优化算法中被使用，搜索前期权重较大，增强全局搜索能力，搜索后期自适应权重较小，增强局部寻优能力，使用的自适应惯性权重公式如下：

将自适应惯性权重公式应用到更新后追随者根据牛顿运动定律更新位置的公式中，新的追随者更新公式如下：

ω＝2，

时,自适应惯性权重公式的值为从-1和1逐渐向-0.4和0.4收敛，由自适应惯性权重公式可以在不提高计算复杂度的同时，提高算法前期的搜索范围，增加种群多样性；

3)逐维随机差分变异；

使用随机差分变异进行逐维变异，通过该变异得到一个新的个体的维度，具体公式为

其中：

为樽海鞘群中的第i个个体的第k维，F_k为目标源位置的第k维，x'_k为种群中随机的一个个体的第k维，c₁和c₂为[0,1]的随机数，在种群位置更新完成后，使用逐维随机差分变异对个体的每个维度进行变异，某一维度进行变异后，对其进行评价，如果优秀，则保留变异后的解，如果变异后，评价结果变差，则舍弃较差的维度信息，减少了各个维度间的干扰，同时增大了搜索的范围；

由于变异操作具有一定的盲目性，把所有个体都进行逐维随机差分变异势必会导致算法的搜索效率下降和计算量大幅的增加，因此仅挑选种群中最优秀和最差个体进行变异，对最优个体变异，可以提高搜索效率，对最差个体变异，可以提高搜索范围，跳出局部最优解；

4)改进后的算法；

为了算法在迭代的前期能够有较强的全局搜索能力，选取种群中前一半的个体作为领导者，增多领导者，可以增强算法的随机性；

(3)机器人路径规划；

假设机器人工作环境为二维空间，在空间中分布着有限数量的静态障碍物即凸多边形，机器人路径规划的任务是在起始点和终止点之间找到一条最短的、较平滑的、且避开所有障碍物的路径，并采用导航点模型来构建机器人工作环境；

1)路径编码；

起点B与终点E的连线为X'轴构建坐标系BX'Y'，然后将坐标系OXY中的点变换到BX'Y'中，路径编码变换公式如下:

其中，(x_b,y_b)是坐标系OXY中起点B的坐标，(x',y')是点(x,y)在坐标系BX'Y'中对应的点，θ是X轴与直线BE的夹角；

用m条平行簇l₁,l₂,…,l_m将BE平均为m+1段，每每相邻的两条平时直线的距离设为Δl＝||BE||/(m+1)，通过每条直线上面随机产生的一个点，可以构造一条机器人移动的完整路径B,P₁,P₂,…,P_m,E，将这条路径上所有的节点生成为一个樽海鞘个体的编码序列，这样就通过上式将一个机器人移动路径的规划问题转换为对一个集合点的变量的优化问题；

2)适应度函数；

路径规划主要考虑长度、安全度和光滑度3个指标.

(1)长度指标；

设起点B和终点E的坐标为B(x_b,y_b)、E(x_e,y_e)，任意路径节点坐标设为P_i(x_i,y_i)，i的取值为[1,m]，设路径长度为f_distance，将其标准化表示如下式：

(2)安全度指标；

为避免机器人与障碍物发生碰撞且路径更加平滑，采用准则是在三次样条插值节点处与障碍物无碰撞，假设已知m个路径结点的坐标(x₁,y₁)，(x₂,y₂)，…，(x_m,y_m)以及起点坐标(x_b,y_b)和终点坐标(x_e,y_e)，通过三次样条差值分别得到d个插值点，其横坐标为(x₁,x₂,…,x_d)，其纵坐标为(y₁,y₂,…,y_d)，需要所生成的d个插值点是否有碰撞情况发生，本设计将d设置为100，设路径安全度指标为f_secure，将其如下式表示：

上式中η表示安全因子，取值为100，D_j,k表示第j个插值点到第k个障碍物中心距离，R(k)表示第k个障碍物的半径，H表示路径中障碍物的数量；

(3)光滑度指标；

设路径节点为B,P₁,P₂,…,P_m,E，相邻路段之间的夹角表示为ψ_i，建立的路径平滑度指标为：

ψ_i越小表示路径光滑程度越优；

将以上指标进行融合后得到机器人路径规划的综合指标S：

S＝f_distance+f_secure+f_flatness

3)基于改进樽海鞘优化算法的机器人多目标路径规划算法；

采用改进樽海鞘优化算法来对机器人移动路径进行规划，算法的具体步骤如下：

1)进行坐标系变换，且利用路径编码变换公式对起点、终点、障碍物位置的坐标进行变换；

2)建立m条平行簇l₁,l₂,…,l_m将BE平均为m+1段，每每相邻的两条平时直线的距离设为Δl＝||BE||/(m+1)；

3)初始化参数包括N、G、m、ubn和lbn；

4)在每条平行线l_j，0＜j≤m上随机生成一个点，组成点集合得到樽海鞘

0＜i≤N，共计初始化N个樽海鞘；

5)利用机器人路径规划的综合指标S的适应度函数式，对樽海鞘进行评估，当前群体最佳个体，记为目标F；

6)根据位置更新公式更新个体位置，前一半个体为领导者使用修改后的领导者公式进行更新，后一半个体为追随者使用新的追随者更新公式进行更新；

7)对更新完的个体，选择最优和最差个体，对其通过使用随机差分变异进行逐维变异，通过该变异得到一个新的个体的维度的公式进行逐维随机差分变异，将更新的维度与其余维度组成新的个体，比较变异前后个体适应度值的变化，如果好则保留；

8)找出最优个体适应度值，更新目标F；

9)判断是否满足迭代次数要求或精度要求，若是满足进入步骤10)，否则返回步骤5)；

10)输出最优个体适应度值。

作为本发明进一步改进，步骤(1)中基本樽海鞘群算法分以下为三个步骤；

1)种群初始化；

与其他群体智能优化算法类似，算法通过生成随机数的方式进行种群的初始化，即

X＝lbn+rnd(M,D)×(ubn-lbn) (2)

2)领导者位置更新；

领导者负责搜索目标来领导整个群体的移动方向，领导者位置更新公式为

其中，x_1k为作为领导者的第1只樽海鞘个体在第k维上的位置；ubn_k和lbn_k分别是第k维的上下限；P_k为目标在第k维上的位置；l₂和l₃是在[0,1]范围内均匀生成的两个随机数，l₁是负责平衡探索和开发的收敛因子，公式如下：

其中：g为当前的迭代次数，G为最大迭代次数，根据领导者位置更新公式中所示的运动策略，领导者以目标位置为中心并在整个搜索区域持续震荡，在初始阶段，l₁的值比较大，接近2，领导者在比较大的范围内去搜索，在后期阶段，l₁的值接近于0，领导者接近目标；

3)追随者位置更新；

追随者根据牛顿运动定律更新位置，公式如下：

其中，

为第i个追随者在第k维上的位置，i≥2，t是时间，v₀为初速度，加速度

因为在算法中迭代次数为时间，每次迭代之间的差值为1，v₀＝0，追随者根据牛顿运动定律更新位置的公式表示为

由于在实际的迭代过程中，目标的位置并不明确，因此在迭代的过程中，计算所有樽海鞘个体的应度值，并将最优适应度值的樽海鞘的位置设置为当前目标位置。

作为本发明进一步改进，步骤(2)樽海鞘群算法的改进中改进后的算法，算法具体步骤如下：

1)初始化种群和参数，初始化种群个体数量N，最大迭代次数G，使用随机数的方式进行种群的初始化

生成初始种群；

2)计算种群每个个体的适应度，最优的个体作为目标位置；

3)根据位置更新公式更新个体位置，前一半个体为领导者使用修改后的领导者公式进行更新，后一半个体为追随者使用新的追随者更新公式进行更新；

4)对更新完的个体，选择最优和最差个体，对其通过使用随机差分变异进行逐维变异，通过该变异得到一个新的个体的维度的公式进行逐维随机差分变异，将更新的维度与其余维度组成新的个体，比较变异前后个体适应度值的变化，如果好则保留；

5)找出最优个体适应度值，更新目标位置；

6)判断是否满足迭代次数要求或精度要求，若是进行步骤7)，否则返回步骤3)；

7)输出最优个体的适应度值。

本发明提供基于改进的樽海鞘群算法的机器人多目标路径规划，具体有优点如下；

1)本申请提出一种依据重心来进行加权的优化策略，根据个体的优劣状况使用不同的权重来计算重心，可以在不忽略较差个体的同时，向更多优秀个体学习，合理利用了种群的信息，同时避免了只向最优个体学习陷入早熟；

2)本申请使用逐维变异，可以避免高维函数之间每个维度相互干扰，从而提高变异解的质量；

3)本申请选取种群中前一半的个体作为领导者，增多领导者，可以增强算法的随机性。

附图说明

图1本发明机器人在环境中的路径表示图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述：

本申请提供基于改进的樽海鞘群算法的机器人多目标路径规划，依据重心来进行加权的优化策略，根据个体的优劣状况使用不同的权重来计算重心，可以在不忽略较差个体的同时，向更多优秀个体学习，合理利用了种群的信息，同时避免了只向最优个体学习陷入早熟使用逐维变异，可以避免高维函数之间每个维度相互干扰，从而提高变异解的质量。

作为本发明一种具体实施例；

(1)基本樽海鞘群算法；

基本樽海鞘群算法分以下为三个步骤；

1)种群初始化；

X＝lbn+rnd(M,D)×(ubn-lbn) (2)

2)领导者位置更新；

其中，

为作为领导者的第1只樽海鞘个体在第k维上的位置；ubn_k和lbn_k分别是第k维的上下限；P_k为目标在第k维上的位置；l₂和l₃是在[0,1]范围内均匀生成的两个随机数，l₁是负责平衡探索和开发的收敛因子，公式如下：

其中：g为当前的迭代次数，G为最大迭代次数，根据式(3)中所示的运动策略，领导者以目标位置为中心并在整个搜索区域持续震荡，在初始阶段，l₁的值比较大，接近2，领导者在比较大的范围内去搜索，在后期阶段，l₁的值接近于0，领导者接近目标；

因此，领导者使得整个算法在开始阶段不易陷入局部最优，后期提高收敛的速度；

3)追随者位置更新；

追随者根据牛顿运动定律更新位置，公式如下：

其中，

因为在算法中迭代次数为时间，每次迭代之间的差值为1，v₀＝0，式(5)表示为

由于在实际的迭代过程中，目标的位置并不明确，因此在迭代的过程中，计算所有樽海鞘个体的应度值，并将最优适应度值的樽海鞘的位置设置为当前目标位置；

(2)樽海鞘群算法的改进；

1)重心优化策略；

本申请提出一种依据重心来进行加权的优化策略，根据个体的优劣状况使用不同的权重来计算重心，在不忽略较差个体的同时，向更多优秀个体学习，合理利用了种群的信息，同时避免了只向最优个体学习陷入早熟，重心定义如下：

定义1重心设(X¹,…,X^M)是D维空间中的m个点，则整体重心为

加权重心公式如下：

为当前种群xⁱ个体的适应度值，F为目标源位置，(f_wst-f)/β是个体的权重，越优秀的个体其权重越大，在加权重心中占比也就越大，同时在加权重心引入目标源的位置和权重，可以更加充分利用全局种群信息。修改后的领导者公式为

xⁱ＝λxⁱ+rnd*(Q_W-xⁱ) (10)

λ＝(β/β_max)² (11)

修改后的公式可以在向最优解逐渐学习的同时，没有过多丢失种群多样性。λ用来调节个体在搜索过程中对自身位置的依赖。搜索前期，较低的λ可以降低个体对自身的依赖，从而增大了搜索的范围，算法的全局搜索能力得到增强。搜索后期，λ逐渐向1靠拢，不影响算法寻优；

2)自适应惯性权重；

自适应惯性权重在很多群体智能优化算法中被使用，搜索前期权重较大，可以增强全局搜索能力，搜索后期自适应权重较小，可以增强局部寻优能力。使用的自适应惯性权重公式如下：

将式(12)应用到(6)中，新的追随者更新公式如下：

ω＝2，

时,式(12)的值为从-1和1逐渐向-0.4和0.4收敛，由式(12)可以在不提高计算复杂度的同时，提高算法前期的搜索范围，增加种群多样性。

3)逐维随机差分变异；

在传统樽海鞘群算法中，领导者受到目标源的位置来更新自己的位置，追随者追随上一个个体进行更新。如式(3)(6)所示，领导者X的更新是在目标源头F的附近产生新的个体，追随者再根据领导者的位置进行位置更新。因此目标源的位置将直接影响整个种群的搜索方向，如果目标源陷入局部最优，那么种群会在目标源附近不断搜索，无法跳出局部最优，降低了种群的多样性，从而算法只能得到局部最优解。

为了解决这一问题，常用的方法为加入变异操作，对更新完的个体进行变异，增强了种群的多样性，从而跳出局部最优。常使用的变异算子有高斯变异、柯西变异等。通常变异均是对所有维度同时进行变异，再根据目标函数来评判，这样对于高维函数，维度间会相互干扰，造成有些维度经过变异得到了更好的解，但是由于其他维度经过变异，变异效果不好，且变异效果差的维度覆盖了变异效果好的维度，使个体最后变异效果不佳，进而影响了算法的收敛速度和精度。使用逐维变异，可以避免高维函数之间每个维度相互干扰，从而提高变异解的质量。

其中：

为樽海鞘群中的第i个个体的第k维，F_k为目标源位置的第k维，x'_k为种群中随机的一个个体的第k维，c₁和c₂为[0,1]的随机数。在种群位置更新完成后，使用逐维随机差分变异对个体的每个维度进行变异，某一维度进行变异后，对其进行评价，如果优秀，则保留变异后的解，如果变异后，评价结果变差，则舍弃较差的维度信息，减少了各个维度间的干扰，同时增大了搜索的范围。

由于变异操作具有一定的盲目性，把所有个体都进行逐维随机差分变异势必会导致算法的搜索效率下降和计算量大幅的增加，因此仅挑选种群中最优秀和最差个体进行变异，对最优个体变异，可以提高搜索效率，对最差个体变异，可以提高搜索范围，跳出局部最优解。

4)改进后的算法；

为了算法在迭代的前期能够有较强的全局搜索能力，选取种群中前一半的个体作为领导者，增多领导者，可以增强算法的随机性。算法具体步骤如下：

1)初始化种群和参数，初始化种群个体数量N，最大迭代次数G，使用式(2)生成初始种群；

2)计算种群每个个体的适应度，最优的个体作为目标位置；

3)根据位置更新公式更新个体位置。前一半个体为领导者使用式(10)进行更新，后一半个体为追随者使用式(13)进行更新；

4)对更新完的个体，选择最优和最差个体，对其通过式(14)进行逐维随机差分变异，将更新的维度与其余维度组成新的个体，比较变异前后个体适应度值的变化，如果好则保留；

5)找出最优个体适应度值，更新目标位置；

7)输出最优个体的适应度值；

(3)机器人路径规划；

假设机器人工作环境为二维空间，在空间中分布着有限数量的静态障碍物(凸多边形)，机器人路径规划的任务是在起始点和终止点之间找到一条最短的、较平滑的、且避开所有障碍物的路径。本设计采用导航点模型来构建机器人工作环境；

1)路径编码；

起点B与终点E的连线为X'轴构建坐标系BX'Y'，如图1所示。然后将坐标系OXY中的点变换到BX'Y'中，变换公式如下:

其中，(x_b,y_b)是坐标系OXY中起点B的坐标，(x',y')是点(x,y)在坐标系BX'Y'中对应的点，θ是X轴与直线BE的夹角。

如图1所示，用m条平行簇l₁,l₂,…,l_m将BE平均为m+1段，每每相邻的两条平时直线的距离设为Δl＝||BE||/(m+1)。通过每条直线上面随机产生的一个点，可以构造一条机器人移动的完整路径(B,P₁,P₂,…,P_m,E)，将这条路径上所有的节点生成为一个樽海鞘个体的编码序列，这样就通过式(15)将一个机器人移动路径的规划问题转换为对一个集合点的变量的优化问题。

2)适应度函数

路径规划主要考虑长度、安全度和光滑度3个指标.

(1)长度指标；

设起点B和终点E的坐标为B(x_b,y_b)、E(x_e,y_e)，任意路径节点坐标设为P_i(x_i,y_i)，i的取值为[1,m]。设路径长度为f_distance，将其标准化表示如下式：

(2)安全度指标；

为避免机器人与障碍物发生碰撞且路径更加平滑，本设计采用准则是在三次样条插值节点处与障碍物无碰撞。假设已知m个路径结点的坐标(x₁,y₁)，(x₂,y₂)，…，(x_m,y_m)以及起点坐标(x_b,y_b)和终点坐标(x_e,y_e)。通过三次样条差值分别得到d个插值点，其横坐标为(x₁,x₂,…,x_d)，其纵坐标为(y₁,y₂,…,y_d)。需要所生成的d个插值点是否有碰撞情况发生，本设计将d设置为100，设路径安全度指标为f_secure，将其如下式表示：

上式中η表示安全因子，取值为100，D_j,k表示第j个插值点到第k个障碍物中心距离，R(k)表示第k个障碍物的半径，H表示路径中障碍物的数量。

(3)光滑度指标；

设路径节点为(B,P₁,P₂,…,P_m,E)，相邻路段之间的夹角表示为ψ_i，本设计建立的路径平滑度指标为：

ψ_i越小表示路径光滑程度越优。

将以上指标进行融合后得到机器人路径规划的综合指标S：

S＝f_distance+f_secure+f_flatness (19)

3)基于改进樽海鞘优化算法的机器人多目标路径规划算法；

1)进行坐标系变换，且利用式(15)对起点、终点、障碍物位置的坐标进行变换；

3)初始化参数N、G、m、ubn、lbn等；

4)在每条平行线l_j(0＜j≤m)上随机生成一个点，组成点集合得到樽海鞘

0＜i≤N，共计初始化N个樽海鞘；

5)利用适应度函数式(19)，对樽海鞘进行评估，当前群体最佳个体，记为目标F；

6)根据位置更新公式更新个体位置。前一半个体为领导者使用式(10)进行更新，后一半个体为追随者使用式(13)进行更新；

7)对更新完的个体，选择最优和最差个体，对其通过式(14)进行逐维随机差分变异，将更新的维度与其余维度组成新的个体，比较变异前后个体适应度值的变化，如果好则保留；

8)找出最优个体适应度值，更新目标F；

10)输出最优个体适应度值。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作任何其他形式的限制，而依据本发明的技术实质所作的任何修改或等同变化，仍属于本发明所要求保护的范围。