CN114386556A - 一种基于禁忌搜索与粒子群算法的目标源定位与避障方法 - Google Patents
一种基于禁忌搜索与粒子群算法的目标源定位与避障方法 Download PDFInfo
- Publication number
- CN114386556A CN114386556A CN202111526695.3A CN202111526695A CN114386556A CN 114386556 A CN114386556 A CN 114386556A CN 202111526695 A CN202111526695 A CN 202111526695A CN 114386556 A CN114386556 A CN 114386556A
- Authority
- CN
- China
- Prior art keywords
- particle
- tabu
- target source
- particles
- particle swarm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002245 particle Substances 0.000 title claims abstract description 126
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000005457 optimization Methods 0.000 title claims abstract description 21
- 230000004888 barrier function Effects 0.000 claims abstract description 6
- 230000001133 acceleration Effects 0.000 claims description 6
- 230000033001 locomotion Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000004807 localization Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000005591 Swarts synthesis reaction Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003592 biomimetic effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S11/00—Systems for determining distance or velocity not using reflection or reradiation
- G01S11/02—Systems for determining distance or velocity not using reflection or reradiation using radio waves
- G01S11/06—Systems for determining distance or velocity not using reflection or reradiation using radio waves using intensity measurements
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种基于禁忌搜索和粒子群算法的目标源定位与避障方法,该方法包括:建立表征目标源信号强度的适应度函数模型,将智能体视作粒子,初始化粒子群算法参数并清空禁忌列表;依据粒子的加权平均速度判断是否更新禁忌列表,结合禁忌搜索进行移动和避障;更新适应度值和全局、局部最优位置,并执行速度和位置更新策略;重复迭代直至智能体定位到目标源或满足迭代终止条件,最终智能体定位到最优目标源。与现有技术相比,本发明解决了智能体在没有环境先验知识的条件下,陷入障碍物中无法脱离的问题。
Description
技术领域
本发明涉及目标信号源搜索领域,尤其是涉及一种基于禁忌搜索与粒子群算法的目标源定位与避障方法。
背景技术
在搜索区域中,通过对信号强度的测量来定位信号源的任务被称为目标信号源定位问题。信号源定位问题由于其各种潜在的应用而引起了人们的广泛关注。该问题要求多智能体在未知环境中自组织搜索信号源位置,即信号强度最大处,并且有一定的约束。智能体具有一定感知能力,能够检测到其所在位置的信号强度,并通过群体协同来定位信号源所在位置。这个问题存在于各种不同的场景中,如环境监测、灾区搜索和救援行动、化学品泄漏调查等等。由于此类任务很可能发生在危险环境中,会对人类生命会造成威胁,发明一种无人自主多智能体协同搜索方法是很有必要的。
近年来,很多学者对源定位问题进行了一系列的研究,提出了梯度下降/上升、基于机制、仿生行为等方法。如一个多智能体系统通过合作获得一个更好的梯度的估计。通过蜂群算法引导智能体围绕信号源聚集。粒子群优化器(PSO)由于其良好的性能和与智能体的兼容性,被广泛采用来解决源定位问题。
在未知环境中的障碍物是凸的或信息已知的前提下,大多数避障方法都具有良好的性能。但如果环境中出现凹形障碍物,或者对障碍物的先验知识是未知的,如U形障碍物,智能体此时可能被障碍物困住,无法脱离。
因此,亟需发明一种无需环境先验信息的协同高效避障算法。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供了一种无需环境先验信息的基于禁忌搜索与粒子群算法的目标源定位与避障方法。
本发明的目的可以通过以下技术方案来实现:
本发明提供了一种基于禁忌搜索和粒子群算法的目标源定位与避障方法,该方法包括:
建立表征目标源信号强度的适应度函数模型,将智能体视作粒子,初始化粒子群算法参数并清空禁忌列表;
依据粒子的加权平均速度判断是否粒子是否陷入禁忌区域以及更新禁忌列表,结合禁忌搜索进行移动和避障;
更新适应度值和全局、局部最优位置,并执行速度和位置更新策略;
重复迭代直至智能体定位到目标源或满足迭代终止条件,从而使得智能体定位到最优目标源。
优选地,所述初始化粒子群参数具体为:
初始化种群初始大小N,加速因子c1和c2,问题维度D,迭代次数T并清空禁忌列表;随机初始化粒子的速度vi=(vi1,...,vij,...,viD)和位置xi=(xi1,...,xij,...,xiD),其中i为第i个粒子。
优选地,所述局部最优位置和全局最优位置的更新公式如下:
其中,pi=(pi1,...,pid,...,piD)表示第i个粒子的最佳位置,g=(g1,g2,...,gD)表示粒子群所确定的全局最优位置,k表示当前迭代次数。
优选地,所述速度和位置更新策略如下:
其中,为第k次迭代第i个粒子的速度,pi=(pi1,...,pid,...,piD)表示第i个粒子的最佳位置,g=(g1,g2,...,gD)表示粒子群所确定的全局最优位置,k表示当前迭代次数;c1和c2是加速因子,用于确定第i个粒子的最佳位置pi和粒子群所确定的全局最优位置g的相对重要性;∈1和∈2是区间[0,1]中均匀分布的两个随机数;ω为粒子对目标源所在区域搜索的调整权值。
优选地,依据粒子的加权平均速度判断是否粒子是否陷入禁忌区域以及更新禁忌列表,结合禁忌搜索进行移动和避障,具体过程为:
如果粒子在k次迭代中的加权平均速度小于预设阈值γ,且没有接近它的全局最佳位置,则认为该粒子被困在障碍物附近;对于被困粒子,将当前被困粒子附近区域作为新的禁忌区域添加到禁忌列表中存储;并给予禁忌区域中所有粒子沿粒子和禁忌区域中心连线方向的速度,使其离开该禁忌区域。
优选地,所述加权平均速度表达式为:
优选地,所述粒子离开禁忌区域的速度表达式为:
优选地,所述预设阈值γ满足:
如果智能体被困在障碍物附近时,会陷入死锁状态,只能在两点之间移动,随着迭代次数的增加,最近迭代的加权平均速度的比例也在增加;当加权平均速度的比例增加到预设值时,得到加权平均期望的上界,即为预设阈值γ的参考值。
优选地,所述禁忌列表采用R-Tree进行存储。
与现有技术相比,本发明具有以下优点:
1)本发明提出了一种基于禁忌搜索与粒子群算法的目标源定位与避障方法,解决了智能体在没有环境先验知识的条件下,陷入U型障碍物中无法脱离的问题;
2)本发明利用禁忌搜索来组织多智能体进行移动和避障,在保证搜索效率的同时提升智能体脱离U型障碍物区域的能力;
3)本发明创新性地将禁忌区域设置为禁忌对象,将加权平均速度作为判断是否陷入局部障碍物区域的判断标准,避免了对禁忌区域的重复探索,同时使用R-Tree存储禁忌区域以加快禁忌列表搜索效率,提高智能体对U型障碍物的避障能力以及提高粒子群算法的避障效率;
4)本发明的方法粒子群算法应用到目标源定位问题上,并结合禁忌搜索弥补了当前大多数优化算法避障能力差的缺点。
附图说明
图1为本发明的方法流程图;
图2为本发明中禁忌区域示意图;
图3为单源算法有无禁忌搜索策略收敛对比图;其中,图3a为A-RPSO算法有无禁忌搜索策略收敛对比图,图3b为RbRDPSO算法有无禁忌搜索策略收敛对比图;
图4为多源算法有无禁忌搜索策略收敛对比图;其中,图4a为SAP-CFPSO算法有无禁忌搜索策略收敛对比图,图4b为Multi-MPSO算法有无禁忌搜索策略收敛对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
本发明提供了一种无需环境先验信息的基于禁忌搜索与粒子群算法的目标源定位与避障方法。该方法基于在有限的搜索范围中智能体没有环境先验信息的假设下,将粒子群优化算法应用到多智能体系统中,将每一个智能体都视作一个粒子,利用粒子群算法的学习策略来引导多智能体的进化,在多智能体系统中,每一个智能体都能够探测到其位置的信号强度。粒子群算法中粒子的当前位置即每个智能体的坐标;强度粒子群算法中粒子的适应度值对应智能体探测到的信号。粒子位置的更新指导了智能体的移动方向和距离。如图1所示,本发明所采用的实施方案包括以下步骤:
建立适应度函数模型f(x),初始化粒子群参数:种群初始大小N,加速因子c1和c2,问题维度D,迭代次数T并清空禁忌列表和R-Tree;
步骤1:随机初始化粒子的速度vi=(vi1,...,vij,...,viD)和位置xi=(xi1,...,xij,...,xiD);
其中,D表示解空间的维数,j∈{1,...,D},xi表示第i个粒子的位置,vi表示第i个粒子的速度;
步骤2:计算每个粒子的适应度f(xi);
步骤3:根据粒子xi的适应度值更新第k次迭代局部最优位置pi和全局最优位置g,更新公式如下:
其中,pi=(pi1,...,pid,...,piD)表示第i个粒子的最佳位置,g=(g1,g2,...,gD)表示粒子群所确定的全局最优位置,k表示当前迭代次数;
步骤4:更新粒子的速度和位置,更新公式如下:
其中,pi=(pi1,...,pid,...,piD)表示粒子i的最佳位置,g=(g1,g2,...,gD)表示粒子群所确定的最佳位置,k表示当前的迭代次数,c1和c1是加速因子,用于确定pi和g的相对重要性;∈1和∈2是[0,1]中的两个随机数;ω为粒子对目标源所在区域搜索的调整权值,通过调整ω值,粒子对目标源所在区域有较大的探索趋势,并在该区域进行细化搜索;
步骤5:计算粒子的加权平均速度,判断是否被困在障碍物区域,加权平均速度计算公式如下:
步骤6:对于被困的粒子,将当前粒子附近区域作为新的禁忌区域添加到禁忌列表中并存储在R-Tree中;
步骤7:给予禁忌区域中所有粒子沿粒子和禁忌区域中心连线方向的速度,使其离开该区域,速度公式:
步骤8:更新粒子群状态;
步骤9:判断是否定位到目标源或满足迭代终止条件,若满足则跳转到步骤10,否则跳转到步骤2;
步骤10:结束搜索。
在步骤5中,与平均速度相比,加权平均速度可以更好地反映粒子在最近时间段内的状态,通过展开加权平均速度公式得出如下结论:
如果智能体在第k次迭代中的加权平均速度小于预设阈值γ,那么这意味着智能体在一段时间内的位置几乎没有改变。如果一个智能体没有接近它的全局最佳位置,即该粒子的速度向着全局最佳位置的反方向,则它就可能被困在障碍物附近。
为了量化上述现象,引入了参数η,以最后n次迭代为主要考虑,也就是前n次迭代的加权平均速度占比小于β,公式如下:
如果智能体陷入死锁状态,它只能在两点之间移动。随着迭代次数的增加,最近迭代的加权平均速度的比例也在增加。当比例增加到一定程度时,可以得到加权平均速度期望的上界。这个上界可以作为预设阈值γ值的参考。假设一个智能体被困在一个小的范围内,做一个周期性运动,速度可以被认为是vi+1=-vi;
当k足够大时,如果主要考虑最后n次迭代,则参数满足:
在步骤6中,将禁忌区域设置为禁忌对象并为其选择合适的大小,并使用R-Tree进行存储。如图2所示,如果一个智能体从点1移动到点2,这意味着智能体已经检测到阴影区域,并警告自己不要到达那里。考虑速度的约束最大值,阴影区域中任意位置与点1之间的距离小于最大值。因此,将以点1和点2之间的中点为中心,边长为的矩形设置为禁忌区域。
为了更直观的验证本发明在信号源搜索问题中的性能,本实施例将提出的策略嵌入到多种基于粒子群算法的源定位算法中。为了验证算法的有效性,这些算法将在两种情况下执行(有无禁忌策略)。测试算法为单源定位算法和多源定位算法,环境中都会有许多凹面障碍物,容易使机器人陷入困境。
比较了两种最先进的单源搜索方法:
自适应机器人PSO(A-RPSO)4(M.Dadgar,S.Jafari,and A.Hamzeh,“A pso-basedmulti-robot cooperation method for target searching in unknown environments,”Neurocomputing,vol.177,no.C,pp.62–74,2015.)和基于斥力的RDPSO(RbRDPSO)(M.Dadgar,M.Couceiro,and A.Hamzeh,“Rbrdpso:Repulsion-based rdpso for robotictarget searching,”Iranian Journal of Science and Technology,Transactions ofElectrical Engineering,vol.44,no.1,pp.551–563,2019.)。
算法的收敛图如图3。很明显,通过嵌入所提出的禁忌策略,它们的性能显著提高。在不同数量的智能体下,禁忌搜索策略的改进具有较好的鲁棒性。在A-RPSO和RDPSO中,原始策略在早期迭代中可能陷入局部最优。而禁忌搜索策略有助于跳出局部最优,收敛到较小的值。
对于多源搜索,考虑两种算法进行比较。一种是基于搜索辅助点进行动态分组搜索的两阶段算法SAP-CFPSO(Q.Tang,L.Ding,F.Y u,Y.Zhang,Y.Li,and H.Tu,“Swarmrobots search for multiple targets based on an improved grouping strategy,”IEEE/ACM Transactions on Computational Biology and Bioinformatics,vol.15,no.6,pp.1943–1950,2018.)。另一种算法是多源机械粒子群算法(Multi-MPSO)(Q.Tang,F.Y u,Z.Xu,and P.Eberhard,“Swarm robots search for multiple targets,”IEEEAccess,vol.8,pp.92 814–92 826,2020.)。它根据一个机器人的个人性能与所有机器人的平均性能的差值,增加或减少机器人的邻域,以达到分组和多源搜索的目的。
算法的收敛图如图4。当将禁忌搜索策略嵌入到确定性避障策略中时,所提出的禁忌搜索算法具有较好的性能。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于禁忌搜索和粒子群算法的目标源定位与避障方法,其特征在于,该方法包括:
建立表征目标源信号强度的适应度函数模型,将智能体视作粒子,初始化粒子群算法参数并清空禁忌列表;
依据粒子的加权平均速度判断是否粒子是否陷入禁忌区域以及更新禁忌列表,结合禁忌搜索进行移动和避障;
更新适应度值和全局、局部最优位置,并执行速度和位置更新策略;
重复迭代直至智能体定位到目标源或满足迭代终止条件,从而使得智能体定位到最优目标源。
2.根据权利要求1所述的一种基于禁忌搜索和粒子群算法的目标源定位与避障方法,其特征在于,所述初始化粒子群参数具体为:
初始化种群初始大小N,加速因子c1和c2,问题维度D,迭代次数T并清空禁忌列表;随机初始化粒子的速度vi=(vi1,...,vij,...,viD)和位置xi=(xi1,...,xij,...,xiD),其中i为第i个粒子。
9.根据权利要求5所述的一种基于禁忌搜索和粒子群算法的目标源定位与避障方法,其特征在于,所述预设阈值γ满足:
如果智能体被困在障碍物附近时,会陷入死锁状态,只能在两点之间移动,随着迭代次数的增加,最近迭代的加权平均速度的比例也在增加;当加权平均速度的比例增加到预设值时,得到加权平均期望的上界,即为预设阈值γ的参考值。
10.根据权利要求5所述的一种基于禁忌搜索和粒子群算法的目标源定位与避障方法,其特征在于,所述禁忌列表采用R-Tree进行存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111526695.3A CN114386556A (zh) | 2021-12-14 | 2021-12-14 | 一种基于禁忌搜索与粒子群算法的目标源定位与避障方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111526695.3A CN114386556A (zh) | 2021-12-14 | 2021-12-14 | 一种基于禁忌搜索与粒子群算法的目标源定位与避障方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114386556A true CN114386556A (zh) | 2022-04-22 |
Family
ID=81196843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111526695.3A Pending CN114386556A (zh) | 2021-12-14 | 2021-12-14 | 一种基于禁忌搜索与粒子群算法的目标源定位与避障方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114386556A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117119469A (zh) * | 2023-10-18 | 2023-11-24 | 国网江苏省电力有限公司信息通信分公司 | 基于改进粒子群算法的电力无线专网基站选址方法及装置 |
-
2021
- 2021-12-14 CN CN202111526695.3A patent/CN114386556A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117119469A (zh) * | 2023-10-18 | 2023-11-24 | 国网江苏省电力有限公司信息通信分公司 | 基于改进粒子群算法的电力无线专网基站选址方法及装置 |
CN117119469B (zh) * | 2023-10-18 | 2024-01-05 | 国网江苏省电力有限公司信息通信分公司 | 基于改进粒子群算法的电力无线专网基站选址方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108664022B (zh) | 一种基于拓扑地图的机器人路径规划方法及系统 | |
CN112344943B (zh) | 一种改进人工势场算法的智能车路径规划方法 | |
CN110147101B (zh) | 一种基于深度强化学习的端到端分布式多机器人编队导航方法 | |
Cao et al. | Target search control of AUV in underwater environment with deep reinforcement learning | |
CN114859911B (zh) | 一种基于drl的四足机器人路径规划方法 | |
CN105717929A (zh) | 一种多分辨率障碍物环境下移动机器人混合路径规划方法 | |
CN111381600B (zh) | 一种基于粒子群算法的uuv路径规划方法 | |
Jung et al. | Cooperative multi-robot target tracking | |
CN110561417B (zh) | 一种多智能体无碰撞轨迹规划方法 | |
CN109300144A (zh) | 一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 | |
CN111784079A (zh) | 一种基于人工势场和蚁群算法的无人机路径规划方法 | |
CN112405547B (zh) | 未知环境下的群机器人多目标搜索方法 | |
CN114386556A (zh) | 一种基于禁忌搜索与粒子群算法的目标源定位与避障方法 | |
Border et al. | Proactive estimation of occlusions and scene coverage for planning next best views in an unstructured representation | |
CN114326810B (zh) | 一种无人机在复杂动态环境下的避障方法 | |
CN114485673B (zh) | 基于深度强化学习的服务机器人人群感知导航方法及系统 | |
CN114397894B (zh) | 一种模仿人类记忆的移动机器人目标搜索方法 | |
CN115933637A (zh) | 一种变电设备巡检机器人路径规划方法、设备及存储介质 | |
Li et al. | Path planning of mobile robot based on improved td3 algorithm | |
Turgut et al. | Restarting particle filters: an approach to improve the performance of dynamic indoor localization | |
Doellinger et al. | Environment-aware multi-target tracking of pedestrians | |
CN112356031A (zh) | 一种基于Kernel采样策略在不确定性环境下的在线规划方法 | |
CN113934219B (zh) | 一种机器人自动避障方法、系统、设备及介质 | |
CN114723782A (zh) | 一种基于异构图学习的交通场景运动目标感知方法 | |
Mottaghi et al. | An integrated particle filter and potential field method for cooperative robot target tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |