CN113110490A - 基于改进的樽海鞘群算法的机器人多目标路径规划 - Google Patents
基于改进的樽海鞘群算法的机器人多目标路径规划 Download PDFInfo
- Publication number
- CN113110490A CN113110490A CN202110493563.9A CN202110493563A CN113110490A CN 113110490 A CN113110490 A CN 113110490A CN 202110493563 A CN202110493563 A CN 202110493563A CN 113110490 A CN113110490 A CN 113110490A
- Authority
- CN
- China
- Prior art keywords
- dimension
- individual
- formula
- algorithm
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 241000251555 Tunicata Species 0.000 title claims abstract description 58
- 238000005457 optimization Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims abstract description 15
- 230000006872 improvement Effects 0.000 claims abstract description 8
- 230000005484 gravity Effects 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 17
- 230000035772 mutation Effects 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 12
- 241000251557 Ascidiacea Species 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 201000004569 Blindness Diseases 0.000 claims description 3
- 238000011161 development Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 206010036590 Premature baby Diseases 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0223—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0214—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0276—Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
基于改进的樽海鞘群算法的机器人多目标路径规划,具体步骤如下:(1)基本樽海鞘群算法;(2)樽海鞘群算法的改进;(3)机器人路径规划;本申请提供基于改进的樽海鞘群算法的机器人多目标路径规划,依据重心来进行加权的优化策略,根据个体的优劣状况使用不同的权重来计算重心,可以在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟使用逐维变异,可以避免高维函数之间每个维度相互干扰,从而提高变异解的质量。
Description
技术领域
本发明涉及人工智能技术领域,特别是涉及到基于改进的樽海鞘群算法的机器人多目标路径规划。
背景技术
樽海鞘群算法是Mirjalili等人于2017年提出的一种全新的群体智能优化算法。该算法的主要思想来源于樽海鞘的群聚行为。算法中将樽海鞘群分为两组,领导者和追随者。在樽海鞘链中领导者处于前面,其余的个体为追随者。和其他的群体智能优化算法不同在于,领导者不会影响整个群体的移动,追随者会根据前一个个体的位置来更新自己的位置,依此类推形成了樽海鞘链。领导者对于排在后面的追随者的领导作用会越来越弱,在后面的追随者不会一味的向着领导者移动,保持了种群的多样性,该方法可以用于机器人规划;
传统樽海鞘群算法中,所有领导者都向目标源进行学习,忽略了种群内其他优秀的个体,有文献提出重心反向学习,重心中包含了群体搜索经验,但是重心中所有个体的贡献相同;
在传统樽海鞘群算法中,领导者受到目标源的位置来更新自己的位置,追随者追随上一个个体进行更新。其中,领导者X的更新是在目标源头F的附近产生新的个体,追随者再根据领导者的位置进行位置更新。因此目标源的位置将直接影响整个种群的搜索方向,如果目标源陷入局部最优,那么种群会在目标源附近不断搜索,无法跳出局部最优,降低了种群的多样性,从而算法只能得到局部最优解,为了解决这一问题,常用的方法为加入变异操作,对更新完的个体进行变异,增强了种群的多样性,从而跳出局部最优。常使用的变异算子有高斯变异、柯西变异等。通常变异均是对所有维度同时进行变异,再根据目标函数来评判,这样对于高维函数,维度间会相互干扰,造成有些维度经过变异得到了更好的解,但是由于其他维度经过变异,变异效果不好,且变异效果差的维度覆盖了变异效果好的维度,使个体最后变异效果不佳,进而影响了算法的收敛速度和精度,针对以上问题申请人设计基于改进的樽海鞘群算法的机器人多目标路径规划。
发明内容
为了解决上述存在问题,本申请提供基于改进的樽海鞘群算法的机器人多目标路径规划,依据重心来进行加权的优化策略,根据个体的优劣状况使用不同的权重来计算重心,可以在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟使用逐维变异,可以避免高维函数之间每个维度相互干扰,从而提高变异解的质量。
本发明提供基于改进的樽海鞘群算法的机器人多目标路径规划,其特征在于:具体步骤如下:
(1)基本樽海鞘群算法;
在樽海鞘群算法中,设樽海鞘群X在D维空间搜索,X由M个维度为D的樽海鞘个体组成,搜索空间上限为ubn=[ubn1 ubn2 … ubnD],搜索空间下限为lbn=[lbn1 lbn2 …lbnD],樽海鞘种群矩阵如下所示;
(2)樽海鞘群算法的改进;
1)重心优化策略;
根据个体的优劣状况使用不同的权重来计算重心,在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟,重心定义如下:
定义1重心设(X1,…,XM)是D维空间中的m个点,则整体重心为
加权重心公式如下:
其中:QW为加权重心,fwst为当前种群最差个体适应度值,fF为目标源适应度值,为当前种群x i个体的适应度值,F为目标源位置,(fwst-f)/β是个体的权重,越优秀的个体其权重越大,在加权重心中占比也就越大,同时在加权重心引入目标源的位置和权重,可以更加充分利用全局种群信息,修改后的领导者公式为
xi=λxi+rnd*(QW-xi)
λ=(β/βmax)2
修改后的公式可以在向最优解逐渐学习的同时,没有过多丢失种群多样性,λ用来调节个体在搜索过程中对自身位置的依赖,搜索前期,较低的λ可以降低个体对自身的依赖,从而增大了搜索的范围,算法的全局搜索能力得到增强,搜索后期,λ逐渐向1靠拢,不影响算法寻优;
2)自适应惯性权重;
自适应惯性权重在很多群体智能优化算法中被使用,搜索前期权重较大,增强全局搜索能力,搜索后期自适应权重较小,增强局部寻优能力,使用的自适应惯性权重公式如下:
将自适应惯性权重公式应用到更新后追随者根据牛顿运动定律更新位置的公式中,新的追随者更新公式如下:
3)逐维随机差分变异;
使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度,具体公式为
其中:为樽海鞘群中的第i个个体的第k维,Fk为目标源位置的第k维,x'k为种群中随机的一个个体的第k维,c1和c2为[0,1]的随机数,在种群位置更新完成后,使用逐维随机差分变异对个体的每个维度进行变异,某一维度进行变异后,对其进行评价,如果优秀,则保留变异后的解,如果变异后,评价结果变差,则舍弃较差的维度信息,减少了各个维度间的干扰,同时增大了搜索的范围;
由于变异操作具有一定的盲目性,把所有个体都进行逐维随机差分变异势必会导致算法的搜索效率下降和计算量大幅的增加,因此仅挑选种群中最优秀和最差个体进行变异,对最优个体变异,可以提高搜索效率,对最差个体变异,可以提高搜索范围,跳出局部最优解;
4)改进后的算法;
为了算法在迭代的前期能够有较强的全局搜索能力,选取种群中前一半的个体作为领导者,增多领导者,可以增强算法的随机性;
(3)机器人路径规划;
假设机器人工作环境为二维空间,在空间中分布着有限数量的静态障碍物即凸多边形,机器人路径规划的任务是在起始点和终止点之间找到一条最短的、较平滑的、且避开所有障碍物的路径,并采用导航点模型来构建机器人工作环境;
1)路径编码;
起点B与终点E的连线为X'轴构建坐标系BX'Y',然后将坐标系OXY中的点变换到BX'Y'中,路径编码变换公式如下:
其中,(xb,yb)是坐标系OXY中起点B的坐标,(x',y')是点(x,y)在坐标系BX'Y'中对应的点,θ是X轴与直线BE的夹角;
用m条平行簇l1,l2,…,lm将BE平均为m+1段,每每相邻的两条平时直线的距离设为Δl=||BE||/(m+1),通过每条直线上面随机产生的一个点,可以构造一条机器人移动的完整路径B,P1,P2,…,Pm,E,将这条路径上所有的节点生成为一个樽海鞘个体的编码序列,这样就通过上式将一个机器人移动路径的规划问题转换为对一个集合点的变量的优化问题;
2)适应度函数;
路径规划主要考虑长度、安全度和光滑度3个指标.
(1)长度指标;
设起点B和终点E的坐标为B(xb,yb)、E(xe,ye),任意路径节点坐标设为Pi(xi,yi),i的取值为[1,m],设路径长度为fdistance,将其标准化表示如下式:
(2)安全度指标;
为避免机器人与障碍物发生碰撞且路径更加平滑,采用准则是在三次样条插值节点处与障碍物无碰撞,假设已知m个路径结点的坐标(x1,y1),(x2,y2),…,(xm,ym)以及起点坐标(xb,yb)和终点坐标(xe,ye),通过三次样条差值分别得到d个插值点,其横坐标为(x1,x2,…,xd),其纵坐标为(y1,y2,…,yd),需要所生成的d个插值点是否有碰撞情况发生,本设计将d设置为100,设路径安全度指标为fsecure,将其如下式表示:
上式中η表示安全因子,取值为100,Dj,k表示第j个插值点到第k个障碍物中心距离,R(k)表示第k个障碍物的半径,H表示路径中障碍物的数量;
(3)光滑度指标;
设路径节点为B,P1,P2,…,Pm,E,相邻路段之间的夹角表示为ψi,建立的路径平滑度指标为:
ψi越小表示路径光滑程度越优;
将以上指标进行融合后得到机器人路径规划的综合指标S:
S=fdistance+fsecure+fflatness
3)基于改进樽海鞘优化算法的机器人多目标路径规划算法;
采用改进樽海鞘优化算法来对机器人移动路径进行规划,算法的具体步骤如下:
1)进行坐标系变换,且利用路径编码变换公式对起点、终点、障碍物位置的坐标进行变换;
2)建立m条平行簇l1,l2,…,lm将BE平均为m+1段,每每相邻的两条平时直线的距离设为Δl=||BE||/(m+1);
3)初始化参数包括N、G、m、ubn和lbn;
5)利用机器人路径规划的综合指标S的适应度函数式,对樽海鞘进行评估,当前群体最佳个体,记为目标F;
6)根据位置更新公式更新个体位置,前一半个体为领导者使用修改后的领导者公式进行更新,后一半个体为追随者使用新的追随者更新公式进行更新;
7)对更新完的个体,选择最优和最差个体,对其通过使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度的公式进行逐维随机差分变异,将更新的维度与其余维度组成新的个体,比较变异前后个体适应度值的变化,如果好则保留;
8)找出最优个体适应度值,更新目标F;
9)判断是否满足迭代次数要求或精度要求,若是满足进入步骤10),否则返回步骤5);
10)输出最优个体适应度值。
作为本发明进一步改进,步骤(1)中基本樽海鞘群算法分以下为三个步骤;
1)种群初始化;
与其他群体智能优化算法类似,算法通过生成随机数的方式进行种群的初始化,即
X=lbn+rnd(M,D)×(ubn-lbn) (2)
2)领导者位置更新;
领导者负责搜索目标来领导整个群体的移动方向,领导者位置更新公式为
其中,x1k为作为领导者的第1只樽海鞘个体在第k维上的位置;ubnk和lbnk分别是第k维的上下限;Pk为目标在第k维上的位置;l2和l3是在[0,1]范围内均匀生成的两个随机数,l1是负责平衡探索和开发的收敛因子,公式如下:
其中:g为当前的迭代次数,G为最大迭代次数,根据领导者位置更新公式中所示的运动策略,领导者以目标位置为中心并在整个搜索区域持续震荡,在初始阶段,l1的值比较大,接近2,领导者在比较大的范围内去搜索,在后期阶段,l1的值接近于0,领导者接近目标;
3)追随者位置更新;
追随者根据牛顿运动定律更新位置,公式如下:
由于在实际的迭代过程中,目标的位置并不明确,因此在迭代的过程中,计算所有樽海鞘个体的应度值,并将最优适应度值的樽海鞘的位置设置为当前目标位置。
作为本发明进一步改进,步骤(2)樽海鞘群算法的改进中改进后的算法,算法具体步骤如下:
1)初始化种群和参数,初始化种群个体数量N,最大迭代次数G,使用随机数的方式进行种群的初始化
生成初始种群;
2)计算种群每个个体的适应度,最优的个体作为目标位置;
3)根据位置更新公式更新个体位置,前一半个体为领导者使用修改后的领导者公式进行更新,后一半个体为追随者使用新的追随者更新公式进行更新;
4)对更新完的个体,选择最优和最差个体,对其通过使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度的公式进行逐维随机差分变异,将更新的维度与其余维度组成新的个体,比较变异前后个体适应度值的变化,如果好则保留;
5)找出最优个体适应度值,更新目标位置;
6)判断是否满足迭代次数要求或精度要求,若是进行步骤7),否则返回步骤3);
7)输出最优个体的适应度值。
本发明提供基于改进的樽海鞘群算法的机器人多目标路径规划,具体有优点如下;
1)本申请提出一种依据重心来进行加权的优化策略,根据个体的优劣状况使用不同的权重来计算重心,可以在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟;
2)本申请使用逐维变异,可以避免高维函数之间每个维度相互干扰,从而提高变异解的质量;
3)本申请选取种群中前一半的个体作为领导者,增多领导者,可以增强算法的随机性。
附图说明
图1本发明机器人在环境中的路径表示图。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本申请提供基于改进的樽海鞘群算法的机器人多目标路径规划,依据重心来进行加权的优化策略,根据个体的优劣状况使用不同的权重来计算重心,可以在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟使用逐维变异,可以避免高维函数之间每个维度相互干扰,从而提高变异解的质量。
作为本发明一种具体实施例;
(1)基本樽海鞘群算法;
在樽海鞘群算法中,设樽海鞘群X在D维空间搜索,X由M个维度为D的樽海鞘个体组成,搜索空间上限为ubn=[ubn1 ubn2 … ubnD],搜索空间下限为lbn=[lbn1 lbn2 …lbnD],樽海鞘种群矩阵如下所示;
基本樽海鞘群算法分以下为三个步骤;
1)种群初始化;
与其他群体智能优化算法类似,算法通过生成随机数的方式进行种群的初始化,即
X=lbn+rnd(M,D)×(ubn-lbn) (2)
2)领导者位置更新;
领导者负责搜索目标来领导整个群体的移动方向,领导者位置更新公式为
其中,为作为领导者的第1只樽海鞘个体在第k维上的位置;ubnk和lbnk分别是第k维的上下限;Pk为目标在第k维上的位置;l2和l3是在[0,1]范围内均匀生成的两个随机数,l1是负责平衡探索和开发的收敛因子,公式如下:
其中:g为当前的迭代次数,G为最大迭代次数,根据式(3)中所示的运动策略,领导者以目标位置为中心并在整个搜索区域持续震荡,在初始阶段,l1的值比较大,接近2,领导者在比较大的范围内去搜索,在后期阶段,l1的值接近于0,领导者接近目标;
因此,领导者使得整个算法在开始阶段不易陷入局部最优,后期提高收敛的速度;
3)追随者位置更新;
追随者根据牛顿运动定律更新位置,公式如下:
由于在实际的迭代过程中,目标的位置并不明确,因此在迭代的过程中,计算所有樽海鞘个体的应度值,并将最优适应度值的樽海鞘的位置设置为当前目标位置;
(2)樽海鞘群算法的改进;
1)重心优化策略;
本申请提出一种依据重心来进行加权的优化策略,根据个体的优劣状况使用不同的权重来计算重心,在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟,重心定义如下:
定义1重心设(X1,…,XM)是D维空间中的m个点,则整体重心为
加权重心公式如下:
其中:QW为加权重心,fwst为当前种群最差个体适应度值,fF为目标源适应度值,为当前种群xi个体的适应度值,F为目标源位置,(fwst-f)/β是个体的权重,越优秀的个体其权重越大,在加权重心中占比也就越大,同时在加权重心引入目标源的位置和权重,可以更加充分利用全局种群信息。修改后的领导者公式为
xi=λxi+rnd*(QW-xi) (10)
λ=(β/βmax)2 (11)
修改后的公式可以在向最优解逐渐学习的同时,没有过多丢失种群多样性。λ用来调节个体在搜索过程中对自身位置的依赖。搜索前期,较低的λ可以降低个体对自身的依赖,从而增大了搜索的范围,算法的全局搜索能力得到增强。搜索后期,λ逐渐向1靠拢,不影响算法寻优;
2)自适应惯性权重;
自适应惯性权重在很多群体智能优化算法中被使用,搜索前期权重较大,可以增强全局搜索能力,搜索后期自适应权重较小,可以增强局部寻优能力。使用的自适应惯性权重公式如下:
将式(12)应用到(6)中,新的追随者更新公式如下:
3)逐维随机差分变异;
在传统樽海鞘群算法中,领导者受到目标源的位置来更新自己的位置,追随者追随上一个个体进行更新。如式(3)(6)所示,领导者X的更新是在目标源头F的附近产生新的个体,追随者再根据领导者的位置进行位置更新。因此目标源的位置将直接影响整个种群的搜索方向,如果目标源陷入局部最优,那么种群会在目标源附近不断搜索,无法跳出局部最优,降低了种群的多样性,从而算法只能得到局部最优解。
为了解决这一问题,常用的方法为加入变异操作,对更新完的个体进行变异,增强了种群的多样性,从而跳出局部最优。常使用的变异算子有高斯变异、柯西变异等。通常变异均是对所有维度同时进行变异,再根据目标函数来评判,这样对于高维函数,维度间会相互干扰,造成有些维度经过变异得到了更好的解,但是由于其他维度经过变异,变异效果不好,且变异效果差的维度覆盖了变异效果好的维度,使个体最后变异效果不佳,进而影响了算法的收敛速度和精度。使用逐维变异,可以避免高维函数之间每个维度相互干扰,从而提高变异解的质量。
使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度,具体公式为
其中:为樽海鞘群中的第i个个体的第k维,Fk为目标源位置的第k维,x'k为种群中随机的一个个体的第k维,c1和c2为[0,1]的随机数。在种群位置更新完成后,使用逐维随机差分变异对个体的每个维度进行变异,某一维度进行变异后,对其进行评价,如果优秀,则保留变异后的解,如果变异后,评价结果变差,则舍弃较差的维度信息,减少了各个维度间的干扰,同时增大了搜索的范围。
由于变异操作具有一定的盲目性,把所有个体都进行逐维随机差分变异势必会导致算法的搜索效率下降和计算量大幅的增加,因此仅挑选种群中最优秀和最差个体进行变异,对最优个体变异,可以提高搜索效率,对最差个体变异,可以提高搜索范围,跳出局部最优解。
4)改进后的算法;
为了算法在迭代的前期能够有较强的全局搜索能力,选取种群中前一半的个体作为领导者,增多领导者,可以增强算法的随机性。算法具体步骤如下:
1)初始化种群和参数,初始化种群个体数量N,最大迭代次数G,使用式(2)生成初始种群;
2)计算种群每个个体的适应度,最优的个体作为目标位置;
3)根据位置更新公式更新个体位置。前一半个体为领导者使用式(10)进行更新,后一半个体为追随者使用式(13)进行更新;
4)对更新完的个体,选择最优和最差个体,对其通过式(14)进行逐维随机差分变异,将更新的维度与其余维度组成新的个体,比较变异前后个体适应度值的变化,如果好则保留;
5)找出最优个体适应度值,更新目标位置;
6)判断是否满足迭代次数要求或精度要求,若是进行步骤7),否则返回步骤3);
7)输出最优个体的适应度值;
(3)机器人路径规划;
假设机器人工作环境为二维空间,在空间中分布着有限数量的静态障碍物(凸多边形),机器人路径规划的任务是在起始点和终止点之间找到一条最短的、较平滑的、且避开所有障碍物的路径。本设计采用导航点模型来构建机器人工作环境;
1)路径编码;
起点B与终点E的连线为X'轴构建坐标系BX'Y',如图1所示。然后将坐标系OXY中的点变换到BX'Y'中,变换公式如下:
其中,(xb,yb)是坐标系OXY中起点B的坐标,(x',y')是点(x,y)在坐标系BX'Y'中对应的点,θ是X轴与直线BE的夹角。
如图1所示,用m条平行簇l1,l2,…,lm将BE平均为m+1段,每每相邻的两条平时直线的距离设为Δl=||BE||/(m+1)。通过每条直线上面随机产生的一个点,可以构造一条机器人移动的完整路径(B,P1,P2,…,Pm,E),将这条路径上所有的节点生成为一个樽海鞘个体的编码序列,这样就通过式(15)将一个机器人移动路径的规划问题转换为对一个集合点的变量的优化问题。
2)适应度函数
路径规划主要考虑长度、安全度和光滑度3个指标.
(1)长度指标;
设起点B和终点E的坐标为B(xb,yb)、E(xe,ye),任意路径节点坐标设为Pi(xi,yi),i的取值为[1,m]。设路径长度为fdistance,将其标准化表示如下式:
(2)安全度指标;
为避免机器人与障碍物发生碰撞且路径更加平滑,本设计采用准则是在三次样条插值节点处与障碍物无碰撞。假设已知m个路径结点的坐标(x1,y1),(x2,y2),…,(xm,ym)以及起点坐标(xb,yb)和终点坐标(xe,ye)。通过三次样条差值分别得到d个插值点,其横坐标为(x1,x2,…,xd),其纵坐标为(y1,y2,…,yd)。需要所生成的d个插值点是否有碰撞情况发生,本设计将d设置为100,设路径安全度指标为fsecure,将其如下式表示:
上式中η表示安全因子,取值为100,Dj,k表示第j个插值点到第k个障碍物中心距离,R(k)表示第k个障碍物的半径,H表示路径中障碍物的数量。
(3)光滑度指标;
设路径节点为(B,P1,P2,…,Pm,E),相邻路段之间的夹角表示为ψi,本设计建立的路径平滑度指标为:
ψi越小表示路径光滑程度越优。
将以上指标进行融合后得到机器人路径规划的综合指标S:
S=fdistance+fsecure+fflatness (19)
3)基于改进樽海鞘优化算法的机器人多目标路径规划算法;
采用改进樽海鞘优化算法来对机器人移动路径进行规划,算法的具体步骤如下:
1)进行坐标系变换,且利用式(15)对起点、终点、障碍物位置的坐标进行变换;
2)建立m条平行簇l1,l2,…,lm将BE平均为m+1段,每每相邻的两条平时直线的距离设为Δl=||BE||/(m+1);
3)初始化参数N、G、m、ubn、lbn等;
5)利用适应度函数式(19),对樽海鞘进行评估,当前群体最佳个体,记为目标F;
6)根据位置更新公式更新个体位置。前一半个体为领导者使用式(10)进行更新,后一半个体为追随者使用式(13)进行更新;
7)对更新完的个体,选择最优和最差个体,对其通过式(14)进行逐维随机差分变异,将更新的维度与其余维度组成新的个体,比较变异前后个体适应度值的变化,如果好则保留;
8)找出最优个体适应度值,更新目标F;
9)判断是否满足迭代次数要求或精度要求,若是满足进入步骤10),否则返回步骤5);
10)输出最优个体适应度值。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (3)
1.基于改进的樽海鞘群算法的机器人多目标路径规划,其特征在于:具体步骤如下:
(1)基本樽海鞘群算法;
在樽海鞘群算法中,设樽海鞘群X在D维空间搜索,X由M个维度为D的樽海鞘个体组成,搜索空间上限为ubn=[ubn1 ubn2 … ubnD],搜索空间下限为lbn=[lbn1 lbn2 … lbnD],樽海鞘种群矩阵如下所示;
(2)樽海鞘群算法的改进;
1)重心优化策略;
根据个体的优劣状况使用不同的权重来计算重心,在不忽略较差个体的同时,向更多优秀个体学习,合理利用了种群的信息,同时避免了只向最优个体学习陷入早熟,重心定义如下:
定义1重心设(X1,…,XM)是D维空间中的m个点,则整体重心为
加权重心公式如下:
其中:QW为加权重心,fwst为当前种群最差个体适应度值,fF为目标源适应度值,为当前种群x i个体的适应度值,F为目标源位置,(fwst-f)/β是个体的权重,越优秀的个体其权重越大,在加权重心中占比也就越大,同时在加权重心引入目标源的位置和权重,可以更加充分利用全局种群信息,修改后的领导者公式为
xi=λxi+rnd*(QW-xi)
λ=(β/βmax)2
修改后的公式可以在向最优解逐渐学习的同时,没有过多丢失种群多样性,λ用来调节个体在搜索过程中对自身位置的依赖,搜索前期,较低的λ可以降低个体对自身的依赖,从而增大了搜索的范围,算法的全局搜索能力得到增强,搜索后期,λ逐渐向1靠拢,不影响算法寻优;
2)自适应惯性权重;
自适应惯性权重在很多群体智能优化算法中被使用,搜索前期权重较大,增强全局搜索能力,搜索后期自适应权重较小,增强局部寻优能力,使用的自适应惯性权重公式如下:
将自适应惯性权重公式应用到更新后追随者根据牛顿运动定律更新位置的公式中,新的追随者更新公式如下:
3)逐维随机差分变异;
使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度,具体公式为
其中:为樽海鞘群中的第i个个体的第k维,Fk为目标源位置的第k维,x'k为种群中随机的一个个体的第k维,c1和c2为[0,1]的随机数,在种群位置更新完成后,使用逐维随机差分变异对个体的每个维度进行变异,某一维度进行变异后,对其进行评价,如果优秀,则保留变异后的解,如果变异后,评价结果变差,则舍弃较差的维度信息,减少了各个维度间的干扰,同时增大了搜索的范围;
由于变异操作具有一定的盲目性,把所有个体都进行逐维随机差分变异势必会导致算法的搜索效率下降和计算量大幅的增加,因此仅挑选种群中最优秀和最差个体进行变异,对最优个体变异,可以提高搜索效率,对最差个体变异,可以提高搜索范围,跳出局部最优解;
4)改进后的算法;
为了算法在迭代的前期能够有较强的全局搜索能力,选取种群中前一半的个体作为领导者,增多领导者,可以增强算法的随机性;
(3)机器人路径规划;
假设机器人工作环境为二维空间,在空间中分布着有限数量的静态障碍物即凸多边形,机器人路径规划的任务是在起始点和终止点之间找到一条最短的、较平滑的、且避开所有障碍物的路径,并采用导航点模型来构建机器人工作环境;
1)路径编码;
起点B与终点E的连线为X'轴构建坐标系BX'Y',然后将坐标系OXY中的点变换到BX'Y'中,路径编码变换公式如下:
其中,(xb,yb)是坐标系OXY中起点B的坐标,(x',y')是点(x,y)在坐标系BX'Y'中对应的点,θ是X轴与直线BE的夹角;
用m条平行簇l1,l2,…,lm将BE平均为m+1段,每每相邻的两条平时直线的距离设为Δl=||BE||/(m+1),通过每条直线上面随机产生的一个点,可以构造一条机器人移动的完整路径B,P1,P2,…,Pm,E,将这条路径上所有的节点生成为一个樽海鞘个体的编码序列,这样就通过上式将一个机器人移动路径的规划问题转换为对一个集合点的变量的优化问题;
2)适应度函数;
路径规划主要考虑长度、安全度和光滑度3个指标.
(1)长度指标;
设起点B和终点E的坐标为B(xb,yb)、E(xe,ye),任意路径节点坐标设为Pi(xi,yi),i的取值为[1,m],设路径长度为fdistance,将其标准化表示如下式:
(2)安全度指标;
为避免机器人与障碍物发生碰撞且路径更加平滑,采用准则是在三次样条插值节点处与障碍物无碰撞,假设已知m个路径结点的坐标(x1,y1),(x2,y2),…,(xm,ym)以及起点坐标(xb,yb)和终点坐标(xe,ye),通过三次样条差值分别得到d个插值点,其横坐标为(x1,x2,…,xd),其纵坐标为(y1,y2,…,yd),需要所生成的d个插值点是否有碰撞情况发生,本设计将d设置为100,设路径安全度指标为fsecure,将其如下式表示:
上式中η表示安全因子,取值为100,Dj,k表示第j个插值点到第k个障碍物中心距离,R(k)表示第k个障碍物的半径,H表示路径中障碍物的数量;
(3)光滑度指标;
设路径节点为B,P1,P2,…,Pm,E,相邻路段之间的夹角表示为ψi,建立的路径平滑度指标为:
ψi越小表示路径光滑程度越优;
将以上指标进行融合后得到机器人路径规划的综合指标S:
S=fdistance+fsecure+fflatness
3)基于改进樽海鞘优化算法的机器人多目标路径规划算法;
采用改进樽海鞘优化算法来对机器人移动路径进行规划,算法的具体步骤如下:
1)进行坐标系变换,且利用路径编码变换公式对起点、终点、障碍物位置的坐标进行变换;
2)建立m条平行簇l1,l2,…,lm将BE平均为m+1段,每每相邻的两条平时直线的距离设为Δl=||BE||/(m+1);
3)初始化参数包括N、G、m、ubn和lbn;
5)利用机器人路径规划的综合指标S的适应度函数式,对樽海鞘进行评估,当前群体最佳个体,记为目标F;
6)根据位置更新公式更新个体位置,前一半个体为领导者使用修改后的领导者公式进行更新,后一半个体为追随者使用新的追随者更新公式进行更新;
7)对更新完的个体,选择最优和最差个体,对其通过使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度的公式进行逐维随机差分变异,将更新的维度与其余维度组成新的个体,比较变异前后个体适应度值的变化,如果好则保留;
8)找出最优个体适应度值,更新目标F;
9)判断是否满足迭代次数要求或精度要求,若是满足进入步骤10),否则返回步骤5);
10)输出最优个体适应度值。
2.根据权利要求1所述的基于改进的樽海鞘群算法的机器人多目标路径规划,其特征在于:步骤(1)中基本樽海鞘群算法分以下为三个步骤;
1)种群初始化;
与其他群体智能优化算法类似,算法通过生成随机数的方式进行种群的初始化,即
X=lbn+rnd(M,D)×(ubn-lbn) (2)
2)领导者位置更新;
领导者负责搜索目标来领导整个群体的移动方向,领导者位置更新公式为
其中,为作为领导者的第1只樽海鞘个体在第k维上的位置;ubnk和lbnk分别是第k维的上下限;Pk为目标在第k维上的位置;l2和l3是在[0,1]范围内均匀生成的两个随机数,l1是负责平衡探索和开发的收敛因子,公式如下:
其中:g为当前的迭代次数,G为最大迭代次数,根据领导者位置更新公式中所示的运动策略,领导者以目标位置为中心并在整个搜索区域持续震荡,在初始阶段,l1的值比较大,接近2,领导者在比较大的范围内去搜索,在后期阶段,l1的值接近于0,领导者接近目标;
3)追随者位置更新;
追随者根据牛顿运动定律更新位置,公式如下:
由于在实际的迭代过程中,目标的位置并不明确,因此在迭代的过程中,计算所有樽海鞘个体的应度值,并将最优适应度值的樽海鞘的位置设置为当前目标位置。
3.根据权利要求1所述的基于改进的樽海鞘群算法的机器人多目标路径规划,其特征在于:步骤(2)樽海鞘群算法的改进中改进后的算法,算法具体步骤如下:
1)初始化种群和参数,初始化种群个体数量N,最大迭代次数G,使用随机数的方式进行种群的初始化
生成初始种群;
2)计算种群每个个体的适应度,最优的个体作为目标位置;
3)根据位置更新公式更新个体位置,前一半个体为领导者使用修改后的领导者公式进行更新,后一半个体为追随者使用新的追随者更新公式进行更新;
4)对更新完的个体,选择最优和最差个体,对其通过使用随机差分变异进行逐维变异,通过该变异得到一个新的个体的维度的公式进行逐维随机差分变异,将更新的维度与其余维度组成新的个体,比较变异前后个体适应度值的变化,如果好则保留;
5)找出最优个体适应度值,更新目标位置;
6)判断是否满足迭代次数要求或精度要求,若是进行步骤7),否则返回步骤3);
7)输出最优个体的适应度值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110493563.9A CN113110490A (zh) | 2021-05-07 | 2021-05-07 | 基于改进的樽海鞘群算法的机器人多目标路径规划 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110493563.9A CN113110490A (zh) | 2021-05-07 | 2021-05-07 | 基于改进的樽海鞘群算法的机器人多目标路径规划 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113110490A true CN113110490A (zh) | 2021-07-13 |
Family
ID=76721030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110493563.9A Withdrawn CN113110490A (zh) | 2021-05-07 | 2021-05-07 | 基于改进的樽海鞘群算法的机器人多目标路径规划 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113110490A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627382A (zh) * | 2021-08-24 | 2021-11-09 | 北京电信易通信息技术股份有限公司 | 面向视频会议系统的用户行为识别方法、系统及存储介质 |
CN113867368A (zh) * | 2021-12-03 | 2021-12-31 | 中国人民解放军陆军装甲兵学院 | 一种基于改进海鸥算法的机器人路径规划方法 |
CN113959448A (zh) * | 2021-10-26 | 2022-01-21 | 江苏海洋大学 | 一种基于改进樽海鞘群算法的水下地形辅助导航方法 |
CN115018149A (zh) * | 2022-06-01 | 2022-09-06 | 南京林业大学 | 一种直升机航空施药飞机起降点位置规划方法 |
CN117744994A (zh) * | 2023-12-20 | 2024-03-22 | 国网江苏省电力有限公司泰州供电分公司 | 一种基于樽海鞘算法的巡检无人机-机巢分配调度方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009274180A (ja) * | 2008-05-15 | 2009-11-26 | Kawasaki Heavy Ind Ltd | ロボット動作計画方法及び装置 |
CN108919641A (zh) * | 2018-06-21 | 2018-11-30 | 山东科技大学 | 一种基于改进樽海鞘算法的无人机航迹规划方法 |
CN111027663A (zh) * | 2019-11-12 | 2020-04-17 | 天津大学 | 一种改进樽海鞘群算法的方法 |
-
2021
- 2021-05-07 CN CN202110493563.9A patent/CN113110490A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009274180A (ja) * | 2008-05-15 | 2009-11-26 | Kawasaki Heavy Ind Ltd | ロボット動作計画方法及び装置 |
CN108919641A (zh) * | 2018-06-21 | 2018-11-30 | 山东科技大学 | 一种基于改进樽海鞘算法的无人机航迹规划方法 |
CN111027663A (zh) * | 2019-11-12 | 2020-04-17 | 天津大学 | 一种改进樽海鞘群算法的方法 |
Non-Patent Citations (2)
Title |
---|
王秋萍: "多策略集成的樽海鞘群算法的机器人路径规划", 《电子学报》 * |
陈连兴: "一种改进的樽海鞘群算法", 《计算机应用研究》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627382A (zh) * | 2021-08-24 | 2021-11-09 | 北京电信易通信息技术股份有限公司 | 面向视频会议系统的用户行为识别方法、系统及存储介质 |
CN113959448A (zh) * | 2021-10-26 | 2022-01-21 | 江苏海洋大学 | 一种基于改进樽海鞘群算法的水下地形辅助导航方法 |
CN113959448B (zh) * | 2021-10-26 | 2023-08-29 | 江苏海洋大学 | 一种基于改进樽海鞘群算法的水下地形辅助导航方法 |
CN113867368A (zh) * | 2021-12-03 | 2021-12-31 | 中国人民解放军陆军装甲兵学院 | 一种基于改进海鸥算法的机器人路径规划方法 |
CN113867368B (zh) * | 2021-12-03 | 2022-02-25 | 中国人民解放军陆军装甲兵学院 | 一种基于改进海鸥算法的机器人路径规划方法 |
CN115018149A (zh) * | 2022-06-01 | 2022-09-06 | 南京林业大学 | 一种直升机航空施药飞机起降点位置规划方法 |
CN117744994A (zh) * | 2023-12-20 | 2024-03-22 | 国网江苏省电力有限公司泰州供电分公司 | 一种基于樽海鞘算法的巡检无人机-机巢分配调度方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113110490A (zh) | 基于改进的樽海鞘群算法的机器人多目标路径规划 | |
Jiang et al. | Path planning for intelligent robots based on deep Q-learning with experience replay and heuristic knowledge | |
CN111142522B (zh) | 一种分层强化学习的智能体控制方法 | |
CN110515303B (zh) | 一种基于ddqn的自适应动态路径规划方法 | |
CN110378439B (zh) | 基于Q-Learning算法的单机器人路径规划方法 | |
CN110750096B (zh) | 静态环境下基于深度强化学习的移动机器人避碰规划方法 | |
CN111780777A (zh) | 一种基于改进a*算法和深度强化学习的无人车路径规划方法 | |
CN110883776B (zh) | 一种快速搜索机制下改进dqn的机器人路径规划算法 | |
CN112462803B (zh) | 一种基于改进nsga-ii的无人机路径规划方法 | |
CN113052372B (zh) | 一种基于深度强化学习的动态auv追踪路径规划方法 | |
CN109931943B (zh) | 无人船舶全局路径规划方法及电子设备 | |
Bai et al. | Adversarial examples construction towards white-box q table variation in dqn pathfinding training | |
CN112550314A (zh) | 适用于无人驾驶的嵌入优化式控制方法及其驾驶控制模块和自动驾驶控制系统 | |
CN113435025A (zh) | 一种结合多级优化模型的机器人高性能轨迹自动生成方法 | |
CN113138555A (zh) | 一种基于遗传算法优化的grnn电主轴热误差建模方法 | |
CN117103282B (zh) | 一种基于matd3算法的双臂机器人协同运动控制方法 | |
CN113485451A (zh) | 一种基于改进的蜉蝣优化算法的机器人多目标路径规划 | |
CN113791613A (zh) | 改进的黏菌优化算法及基于该算法的机器人多目标路径规划 | |
CN112859855A (zh) | 一种基于蝗虫优化算法的机器人多目标路径规划 | |
CN113391633A (zh) | 一种面向城市环境的移动机器人融合路径规划方法 | |
CN115933693A (zh) | 一种基于自适应混沌粒子群算法的机器人路径规划方法 | |
CN114995390A (zh) | 一种基于动态自适应参数调整的蜉蝣算法的移动机器人路径规划方法 | |
CN112528556A (zh) | 一种基于集成模型辅助社会学习粒子群算法的微机电系统设计优化方法 | |
Palacios-Morocho et al. | Multipath planning acceleration method with double deep r-learning based on a genetic algorithm | |
CN115097814A (zh) | 基于改进pso算法的移动机器人路径规划方法、系统及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210713 |
|
WW01 | Invention patent application withdrawn after publication |