CN110275527B - 一种基于改进拟态物理法的多智能体系统运动控制方法 - Google Patents
一种基于改进拟态物理法的多智能体系统运动控制方法 Download PDFInfo
- Publication number
- CN110275527B CN110275527B CN201910466169.9A CN201910466169A CN110275527B CN 110275527 B CN110275527 B CN 110275527B CN 201910466169 A CN201910466169 A CN 201910466169A CN 110275527 B CN110275527 B CN 110275527B
- Authority
- CN
- China
- Prior art keywords
- agent
- target
- intelligent
- motion
- mimicry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
- G05D1/0088—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0287—Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
- G05D1/0291—Fleet control
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Automation & Control Theory (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公布了一种基于改进拟态物理法的多智能体系统运动控制方法,涉及多智能体协同运动控制领域。所述方法首先建立单个智能体的运动模型,并对多智能体个体的运动规则用拟态物理力的方法进行描述;接着,将拟态物理法与经典聚集、避碰和速度一致规则相结合,同时利用距离和相对速度来计算聚集系数与速度一致系数;然后,利用注意力参数调节调节改进拟态物理法各项的作用效果,使智能体有选择的跟随其他智能体或者目标;最后,通过使用改进拟态物理法对智能体运动进行调节,实现多智能体系统的聚集运动、速度一致和多目标环境下的分群运动。该方法主要解决了经典的多智能体系统运动控制算法在聚集运动过程中出现的边界振荡问题和多目标环境下多智能体系统的分群运动问题。
Description
技术领域
本发明属于多智能体系统运动控制领域,特别是考虑多个目标环境下的自主分群方法。
背景技术
多智能体系统(multi-agent systems,MAS)是由大量简单自主个体组成的自组织群体系统,虽然MAS的基本单位智能水平很低,但是整体却表现出较高的智能水平,能够完成搜索、侦查、救援等复杂的任务,多智能体系统运动控制是多智能体系统应用的基础,即通过自组织的方式实现群体的聚集运动、速度一致以及分群运动。
目前的多智能体运动控制算法主要针对聚集运动和速度一致,并以SAC原则为基础出现了大量的分布式集群运动控制算法,如Three-Circle法、人工势场法、社会力模型等。其中SAC原则是指每一个智能体遵循三条简单的规则——避撞(Separation)、对齐(Alignment)和聚集(Cohesion)。Three-Circle法简单且容易理解,但是由于智能体的感知范围被分为三个不连续的区域,因此在聚集过程中容易发生振荡现象。人工势场法通常需要建立全局势场,且存在局部极小值的问题,导致智能体间避碰失败。社会力法不需要全局控制,但由于与人工势场法在本质上是相同的,因此也存在人工势场法局部极小值问题。
拟态物理法将个体间的相互作用抽象为物理力,省去了人工势场法的求梯度过程,且不存在人工势场法局部极小值问题,因此广泛应用于多智能体编队及重构、无人机编队、智能车编队等。但是当环境中存在多个目标时,经典的拟态物理法无法实现多智能体系统的分群运动。
发明内容
本发明的目的在于提供一种基于改进拟态物理法的多智能体系统运动控制方法,能够实现多智能系统的聚集运动、速度一致和分群运动,解决了经典SAC算法边界振荡问题和实现了多目标环境下多智能体系统的分群运动。
为实现上述目的,本发明采用以下技术方案:
一种基于改进拟态物理法的多智能体系统运动控制方法,包括:
步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。
步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数kp、速度一致系数kv和避碰系数kr。
步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui。
步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。
步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。
本发明具有以下优点:
1.在智能体的感知距离内,同时考虑相对速度与相对位置来计算聚集系数和速度一致系数,实现多智能体系统的聚集运动,解决了经典基于SAC原则的运动控制算法在聚集运动过程中存在的边界振荡问题。
2.将拟态物理法与SAC原则相结合,融合聚集区域与速度一致区域,在经典拟态物理法吸引力与排斥力的基础上,增加速度一致作用力,实现了多智能体系统的速度一致运动。
3.考虑到多目标情形下多智能体系统的分群运动,将注意力跟随机制与改进拟态物理法相结合,利用注意力参数调节目标点或邻居智能体的作用效果,实现了多智能体系统分群运动。
附图表说明
图1为本发明方法的流程图。
图2为多智能体系统坐标示意图。
图3为t=3s和t=9s时多智能体系统群体运动状态。
图4为25s内每个智能体的速度方向变化曲线。
图5为本发明算法、经典SAC算法、人工势场法、改进的SAC算法一致性指数变化曲线。
图6为基于改进拟态物理法的多智能体系统分群运动轨迹。
图7为分群运动过程中每个智能体的速度变化曲线。
具体实施方式
结合所附图表,对本发明的技术方案作具体说明。
如图1所示,本发明的一种基于改进拟态物理法的多智能体系统运动控制方法,具体包括以下步骤:
步骤1:将每个智能体抽象为质点,建立单个智能体的二阶运动模型。具体过程为:
对智能体所处环境建立笛卡尔坐标系,如图2所示,图中圆圈表示智能体,三角形表示目标,速度向量由箭头表示。设智能体Agenti在环境中的位置为pi=(xi,yi),速度为目标的位置为将单个智能体均抽象为质点,其运动模型为:
式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。
步骤2:根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。具体过程为:
获取编号为i的智能体Agenti的邻居序号集Ni为:
Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i} (2)
式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离。
步骤4:根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。具体为:
式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子。
步骤5:利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。具体过程为:
式中,pj表示智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量。
式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rS为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离。
(5.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:
式中,αi为注意力参数,表示为:
步骤6:根据步骤5计算的控制输入与步骤1单个智能体的运动模型,对智能体进行控制。
步骤7:判断每个智能体是否都到达目标点,如果没有,则跳转步骤2进行循环,否则结束运动。
采用本发明的上述方案,多智能体系统在运动过程中能够实现多智能体的聚集运动、速度一致和多目标环境下的分群运动。
为了验证方法的可行性和有效性,下面结合实例对本发明做进一步详细的描述。
在Windows 7操作系统上,使用MATLAB 2013a进行仿真实验。设置规模为20多智能体系统,每个智能体的初始位置在半径为25米的圆形区域内随机选取,初始速度v0设置为单位为m/s。分别针对多智能体系统在连续环境下的聚集与速度一致以及多目标环境下自主分群两种情况进行仿真。仿真每次循环的时间步长为1s,同步更新智能体的状态。
表1所示为本发明中改进拟态物理法的参数。
表1改进拟态物理法仿真参数
图3为3s和9s时多智能体系统群体运动状态,图中虚线表示智能体连续3s的运动轨迹,“○”和“●”分别表示3s和9s时的智能体。在t=3s时,从虚线所示轨迹可以看出,此时正在发生群体的聚集运动。在t=9s时,虚线所示运动轨迹平稳,同时智能体间保持稳定的距离,多智能体系统完成了聚集运动。
图4所示为仿真时长25s得到的每个智能体的速度方向θ的变化曲线,其中θ=arctan(xi/yi)。从图4曲线可以看出,经过大约5s的调整,各个智能体的运动速度基本达成一致,多智能体系统实现了速度一致运动。
在仿真过程中,为了定量描述MAS聚集运动和速度一致运动,定义一致性指数C描述了群体运动方向的有序性,具体如下式所示:
式中,N为多智能体系统中智能体的个数,vi为智能体Agenti的速度,显然,C∈[0,1]。当C→1时,表示多智能体系统运动的一致性越强,反之,则多智能体系统运动的随机性越强。
图5所示为本发明提出的改进拟态物理法与经典SAC算法、人工势场法、改进SAC算法的仿真比较。在相同的初始状态下仿真25s,得到一致性指数变化曲线,这里认为当一致性指数C>0.95时即表示多智能体系统实现了速度一致。可以看出,本发明提出的改进拟态物理法得到的一致性指数变化曲线更为平滑,解决了经典SAC算法与基于人工势场的算法存在的振荡问题。
为验证本发明一种基于改进拟态物理法的多智能体系统运动控制方法的分群能力,当多智能体系统聚集完成并实现速度一致后,在群体运动路线上随机设置两个目标点。
图6所示为本发明提出的基于改进拟态物理法的多智能体系统分群运动轨迹。从图中可以看出,当多智能体系统附近存在多个目标时,由于目标信息迅速在集群内传播,系统中智能体根据自身状态自主地选择注意对象,实现了多智能体系统的分群运动。
图7为分群运动过程中每个智能体的速度变化曲线。从图中可以看出,本发明提出的改进拟态物理法不仅很好地实现了多智能体系统的聚集运动、速度一致,还实现了多目标环境下的分群运动,并在分群运动过程中各个子群保持速度一致运动。
Claims (4)
1.一种基于改进拟态物理法的多智能体系统运动控制方法,其特征在于,包括以下步骤:
步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型;
步骤二,根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息;
步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象;
步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数,具体为:
式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子;
步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入,具体包括:
式中,pj表示编号为j的智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量;
式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rs为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离;
(5.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:
式中,αi为注意力参数,表示为:
步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制;
步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。
3.如权利要求1所述的一种基于改进拟态物理法的多智能体系统 运动控制方法,其特征在于,所述步骤二中根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息,具体包括:
获取智能体Agenti的邻居序号集Ni为:
Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i} (8)
式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离;
4.如权利要求1所述的一种基于改进拟态物理法的多智能体系统 运动控制方法,其特征在于,所述步骤三中根据邻居智能体的状态信息和目标的位置信息选择注意对象选择注意对象,具体为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466169.9A CN110275527B (zh) | 2019-05-29 | 2019-05-29 | 一种基于改进拟态物理法的多智能体系统运动控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466169.9A CN110275527B (zh) | 2019-05-29 | 2019-05-29 | 一种基于改进拟态物理法的多智能体系统运动控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110275527A CN110275527A (zh) | 2019-09-24 |
CN110275527B true CN110275527B (zh) | 2022-02-11 |
Family
ID=67960339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910466169.9A Active CN110275527B (zh) | 2019-05-29 | 2019-05-29 | 一种基于改进拟态物理法的多智能体系统运动控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110275527B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111007848B (zh) * | 2019-12-03 | 2022-08-16 | 中国电子科技集团公司第二十八研究所 | 一种基于有界空间的多智能体协同作业控制方法 |
CN111859816A (zh) * | 2020-08-03 | 2020-10-30 | 南京航空航天大学 | 拟态物理法与ddqn结合的无人机集群空战决策方法 |
CN112083738B (zh) * | 2020-09-24 | 2021-09-21 | 北京航空航天大学 | 一种受物理化学启发的多智能体集群控制方法 |
CN113146624B (zh) * | 2021-03-25 | 2022-04-29 | 重庆大学 | 基于最大角聚集策略的多智能体控制方法 |
CN113033756B (zh) * | 2021-03-25 | 2022-09-16 | 重庆大学 | 基于目标导向的聚集策略的多智能体控制方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004030058A (ja) * | 2002-06-24 | 2004-01-29 | Toshiba Corp | マルチエージェントシステム |
CN101825901B (zh) * | 2010-03-31 | 2012-01-11 | 北京航空航天大学 | 基于人工物理法的多智能体机器人协同控制方法 |
CN104503454B (zh) * | 2014-12-23 | 2017-04-12 | 浙江理工大学 | 基于多智能体理论的搜救机器人系统运动控制方法 |
CN107179683B (zh) * | 2017-04-01 | 2020-04-24 | 浙江工业大学 | 一种基于神经网络的交互机器人智能运动检测与控制方法 |
US10755424B2 (en) * | 2017-05-05 | 2020-08-25 | Hrl Laboratories, Llc | Prediction of multi-agent adversarial movements through signature-formations using radon-cumulative distribution transform and canonical correlation analysis |
CN107340784B (zh) * | 2017-08-21 | 2018-04-17 | 中国人民解放军陆军工程大学 | 无人机集群控制方法 |
CN109005055B (zh) * | 2018-07-16 | 2020-03-31 | 西安交通大学 | 基于多尺度拓扑空间的复杂网络信息节点重要度评价方法 |
CN108827312B (zh) * | 2018-08-08 | 2021-10-08 | 清华大学 | 一种基于神经网络和人工势场的协同博弈路径规划方法 |
CN109726903B (zh) * | 2018-12-19 | 2020-10-16 | 中国电子科技集团公司信息科学研究院 | 基于注意力机制的分布式多智能体协同决策方法 |
-
2019
- 2019-05-29 CN CN201910466169.9A patent/CN110275527B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110275527A (zh) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110275527B (zh) | 一种基于改进拟态物理法的多智能体系统运动控制方法 | |
Cortés et al. | Coordinated control of multi-robot systems: A survey | |
Huegle et al. | Dynamic input for deep reinforcement learning in autonomous driving | |
Lan et al. | Distributed control of cooperative target enclosing based on reachability and invariance analysis | |
CN110608743A (zh) | 基于多种群混沌灰狼算法的多无人机协同航路规划方法 | |
Asl et al. | Control of leader–follower formation and path planning of mobile robots using Asexual Reproduction Optimization (ARO) | |
Savkin et al. | Distributed formation building algorithms for groups of wheeled mobile robots | |
CN104020665A (zh) | 基于多目标粒子群算法的机械臂最小跃度轨迹优化方法 | |
CN112000096A (zh) | 一种基于麻雀搜索算法的差速agv轨迹跟踪控制方法 | |
Hauri et al. | Multi-robot formation control via a real-time drawing interface | |
CN113552891A (zh) | 一种基于改进的蝴蝶优化算法的机器人多目标路径规划 | |
Ciou et al. | Composite reinforcement learning for social robot navigation | |
Kumar et al. | Emergent formations of a Lagrangian swarm of unmanned ground vehicles | |
Kwon et al. | Mathematical modeling for flocking flight of autonomous multi-UAV system, including environmental factors | |
Ourari et al. | Nearest-neighbor-based collision avoidance for quadrotors via reinforcement learning | |
CN108958262A (zh) | 一种分布式多机器人的局部蜂拥控制方法 | |
Belavadi et al. | Frontier exploration technique for 3d autonomous slam using k-means based divisive clustering | |
Woo | Mobile robot path planning with randomly moving obstacles and goal | |
Agarwal et al. | Improving energy efficiency in UAV attitude control using deep reinforcement learning | |
Siahaan | Adjustable Knapsack in Travelling Salesman Problem Using Genetic Process | |
Krongauz et al. | Vision-based collective motion: a locust-inspired reductionist model | |
Hexmoor et al. | Swarm Control in Unmanned Aerial Vehicles. | |
Moshtagh et al. | Vision-based distributed coordination and flocking of multi-agent systems | |
CN110162084B (zh) | 基于一致性理论的飞航导弹集群系统编队控制方法 | |
CN111007848A (zh) | 一种基于有界空间的多智能体协同作业控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |