CN110275527B - 一种基于改进拟态物理法的多智能体系统运动控制方法 - Google Patents

一种基于改进拟态物理法的多智能体系统运动控制方法 Download PDF

Info

Publication number
CN110275527B
CN110275527B CN201910466169.9A CN201910466169A CN110275527B CN 110275527 B CN110275527 B CN 110275527B CN 201910466169 A CN201910466169 A CN 201910466169A CN 110275527 B CN110275527 B CN 110275527B
Authority
CN
China
Prior art keywords
agent
target
intelligent
motion
mimicry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910466169.9A
Other languages
English (en)
Other versions
CN110275527A (zh
Inventor
丁勇
高振龙
何金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201910466169.9A priority Critical patent/CN110275527B/zh
Publication of CN110275527A publication Critical patent/CN110275527A/zh
Application granted granted Critical
Publication of CN110275527B publication Critical patent/CN110275527B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/0088Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公布了一种基于改进拟态物理法的多智能体系统运动控制方法,涉及多智能体协同运动控制领域。所述方法首先建立单个智能体的运动模型,并对多智能体个体的运动规则用拟态物理力的方法进行描述;接着,将拟态物理法与经典聚集、避碰和速度一致规则相结合,同时利用距离和相对速度来计算聚集系数与速度一致系数;然后,利用注意力参数调节调节改进拟态物理法各项的作用效果,使智能体有选择的跟随其他智能体或者目标;最后,通过使用改进拟态物理法对智能体运动进行调节,实现多智能体系统的聚集运动、速度一致和多目标环境下的分群运动。该方法主要解决了经典的多智能体系统运动控制算法在聚集运动过程中出现的边界振荡问题和多目标环境下多智能体系统的分群运动问题。

Description

一种基于改进拟态物理法的多智能体系统运动控制方法
技术领域
本发明属于多智能体系统运动控制领域,特别是考虑多个目标环境下的自主分群方法。
背景技术
多智能体系统(multi-agent systems,MAS)是由大量简单自主个体组成的自组织群体系统,虽然MAS的基本单位智能水平很低,但是整体却表现出较高的智能水平,能够完成搜索、侦查、救援等复杂的任务,多智能体系统运动控制是多智能体系统应用的基础,即通过自组织的方式实现群体的聚集运动、速度一致以及分群运动。
目前的多智能体运动控制算法主要针对聚集运动和速度一致,并以SAC原则为基础出现了大量的分布式集群运动控制算法,如Three-Circle法、人工势场法、社会力模型等。其中SAC原则是指每一个智能体遵循三条简单的规则——避撞(Separation)、对齐(Alignment)和聚集(Cohesion)。Three-Circle法简单且容易理解,但是由于智能体的感知范围被分为三个不连续的区域,因此在聚集过程中容易发生振荡现象。人工势场法通常需要建立全局势场,且存在局部极小值的问题,导致智能体间避碰失败。社会力法不需要全局控制,但由于与人工势场法在本质上是相同的,因此也存在人工势场法局部极小值问题。
拟态物理法将个体间的相互作用抽象为物理力,省去了人工势场法的求梯度过程,且不存在人工势场法局部极小值问题,因此广泛应用于多智能体编队及重构、无人机编队、智能车编队等。但是当环境中存在多个目标时,经典的拟态物理法无法实现多智能体系统的分群运动。
发明内容
本发明的目的在于提供一种基于改进拟态物理法的多智能体系统运动控制方法,能够实现多智能系统的聚集运动、速度一致和分群运动,解决了经典SAC算法边界振荡问题和实现了多目标环境下多智能体系统的分群运动。
为实现上述目的,本发明采用以下技术方案:
一种基于改进拟态物理法的多智能体系统运动控制方法,包括:
步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。
步骤二,根据智能体感知范围得到智能体的邻居序号集Ni,获取感知范围内邻居智能体的状态信息
Figure GSB0000196630250000021
以及目标的位置信息
Figure GSB0000196630250000022
步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象
Figure GSB0000196630250000023
并确定自身的目标感知状态
Figure GSB0000196630250000024
步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数kp、速度一致系数kv和避碰系数kr
步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui
步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。
步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。
本发明具有以下优点:
1.在智能体的感知距离内,同时考虑相对速度与相对位置来计算聚集系数和速度一致系数,实现多智能体系统的聚集运动,解决了经典基于SAC原则的运动控制算法在聚集运动过程中存在的边界振荡问题。
2.将拟态物理法与SAC原则相结合,融合聚集区域与速度一致区域,在经典拟态物理法吸引力与排斥力的基础上,增加速度一致作用力,实现了多智能体系统的速度一致运动。
3.考虑到多目标情形下多智能体系统的分群运动,将注意力跟随机制与改进拟态物理法相结合,利用注意力参数调节目标点或邻居智能体的作用效果,实现了多智能体系统分群运动。
附图表说明
图1为本发明方法的流程图。
图2为多智能体系统坐标示意图。
图3为t=3s和t=9s时多智能体系统群体运动状态。
图4为25s内每个智能体的速度方向变化曲线。
图5为本发明算法、经典SAC算法、人工势场法、改进的SAC算法一致性指数变化曲线。
图6为基于改进拟态物理法的多智能体系统分群运动轨迹。
图7为分群运动过程中每个智能体的速度变化曲线。
具体实施方式
结合所附图表,对本发明的技术方案作具体说明。
如图1所示,本发明的一种基于改进拟态物理法的多智能体系统运动控制方法,具体包括以下步骤:
步骤1:将每个智能体抽象为质点,建立单个智能体的二阶运动模型。具体过程为:
对智能体所处环境建立笛卡尔坐标系,如图2所示,图中圆圈表示智能体,三角形表示目标,速度向量由箭头表示。设智能体Agenti在环境中的位置为pi=(xi,yi),速度为
Figure GSB0000196630250000031
目标的位置为
Figure GSB0000196630250000032
将单个智能体均抽象为质点,其运动模型为:
Figure GSB0000196630250000033
式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。
步骤2:根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。具体过程为:
获取编号为i的智能体Agenti的邻居序号集Ni为:
Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i} (2)
式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离。
获取的邻居智能体的状态信息用元组
Figure GSB0000196630250000034
表示,
Figure GSB0000196630250000035
为Agentj(j∈Ni)的目标感知状态。当Agentj能感知到目标时,
Figure GSB0000196630250000036
反之
Figure GSB0000196630250000037
当目标与智能体的距离
Figure GSB0000196630250000038
小于智能体的感知距离δ时,表示智能体能感知到目标,则获取目标的位置信息为
Figure GSB0000196630250000041
这里
Figure GSB0000196630250000042
表示编号为m的目标Tm位置向量。
步骤3:根据邻居智能体的状态信息和目标的位置信息选择注意对象
Figure GSB0000196630250000043
并确定自身的目标感知状态
Figure GSB0000196630250000044
具体过程为:
当智能体Agenti能够感知到目标时,根据目标的位置信息
Figure GSB0000196630250000045
选择欧氏距离最近的目标作为注意对象
Figure GSB0000196630250000046
同时设置Agenti的目标感知状态为
Figure GSB0000196630250000047
当智能体Agenti没有感知到目标且邻居智能体Agentj(j∈Ni)的目标感知状态
Figure GSB0000196630250000048
时,则选择最近的智能体Agentj作为注意对象
Figure GSB0000196630250000049
同时设置Agenti的目标感知状态为
Figure GSB00001966302500000410
当智能体Agenti既感知不到目标,且其邻居智能体的目标感知状态
Figure GSB00001966302500000411
均为0时,则令Agenti的注意对象
Figure GSB00001966302500000412
同时设置Agenti的目标感知状态为
Figure GSB00001966302500000413
步骤4:根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。具体为:
Figure GSB00001966302500000414
式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象
Figure GSB00001966302500000415
的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子。
步骤5:利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。具体过程为:
(5.1)计算智能体Agenti与邻居智能体Agentj(j∈Ni)的位置差
Figure GSB00001966302500000416
和速度差
Figure GSB00001966302500000417
具体为:
Figure GSB00001966302500000418
式中,pj表示智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量。
(5.2)计算改进拟态物理法的速度一致项
Figure GSB0000196630250000051
和避碰项
Figure GSB0000196630250000052
具体为:
Figure GSB0000196630250000053
式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rS为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离。
(5.3)计算改进拟态物理法的注意力跟随项
Figure GSB0000196630250000054
具体为:
Figure GSB0000196630250000055
式中,
Figure GSB0000196630250000056
为注意对象
Figure GSB0000196630250000057
的位置,
Figure GSB0000196630250000058
为注意对象
Figure GSB0000196630250000059
的速度。显然,当注意对象
Figure GSB00001966302500000510
为静止目标时,
Figure GSB00001966302500000511
(5.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:
Figure GSB00001966302500000512
式中,αi为注意力参数,表示为:
Figure GSB00001966302500000513
步骤6:根据步骤5计算的控制输入与步骤1单个智能体的运动模型,对智能体进行控制。
步骤7:判断每个智能体是否都到达目标点,如果没有,则跳转步骤2进行循环,否则结束运动。
采用本发明的上述方案,多智能体系统在运动过程中能够实现多智能体的聚集运动、速度一致和多目标环境下的分群运动。
为了验证方法的可行性和有效性,下面结合实例对本发明做进一步详细的描述。
在Windows 7操作系统上,使用MATLAB 2013a进行仿真实验。设置规模为20多智能体系统,每个智能体的初始位置在半径为25米的圆形区域内随机选取,初始速度v0设置为
Figure GSB00001966302500000514
单位为m/s。分别针对多智能体系统在连续环境下的聚集与速度一致以及多目标环境下自主分群两种情况进行仿真。仿真每次循环的时间步长为1s,同步更新智能体的状态。
表1所示为本发明中改进拟态物理法的参数。
表1改进拟态物理法仿真参数
Figure GSB0000196630250000061
图3为3s和9s时多智能体系统群体运动状态,图中虚线表示智能体连续3s的运动轨迹,“○”和“●”分别表示3s和9s时的智能体。在t=3s时,从虚线所示轨迹可以看出,此时正在发生群体的聚集运动。在t=9s时,虚线所示运动轨迹平稳,同时智能体间保持稳定的距离,多智能体系统完成了聚集运动。
图4所示为仿真时长25s得到的每个智能体的速度方向θ的变化曲线,其中θ=arctan(xi/yi)。从图4曲线可以看出,经过大约5s的调整,各个智能体的运动速度基本达成一致,多智能体系统实现了速度一致运动。
在仿真过程中,为了定量描述MAS聚集运动和速度一致运动,定义一致性指数C描述了群体运动方向的有序性,具体如下式所示:
Figure GSB0000196630250000062
式中,N为多智能体系统中智能体的个数,vi为智能体Agenti的速度,显然,C∈[0,1]。当C→1时,表示多智能体系统运动的一致性越强,反之,则多智能体系统运动的随机性越强。
图5所示为本发明提出的改进拟态物理法与经典SAC算法、人工势场法、改进SAC算法的仿真比较。在相同的初始状态下仿真25s,得到一致性指数变化曲线,这里认为当一致性指数C>0.95时即表示多智能体系统实现了速度一致。可以看出,本发明提出的改进拟态物理法得到的一致性指数变化曲线更为平滑,解决了经典SAC算法与基于人工势场的算法存在的振荡问题。
为验证本发明一种基于改进拟态物理法的多智能体系统运动控制方法的分群能力,当多智能体系统聚集完成并实现速度一致后,在群体运动路线上随机设置两个目标点。
图6所示为本发明提出的基于改进拟态物理法的多智能体系统分群运动轨迹。从图中可以看出,当多智能体系统附近存在多个目标时,由于目标信息迅速在集群内传播,系统中智能体根据自身状态自主地选择注意对象,实现了多智能体系统的分群运动。
图7为分群运动过程中每个智能体的速度变化曲线。从图中可以看出,本发明提出的改进拟态物理法不仅很好地实现了多智能体系统的聚集运动、速度一致,还实现了多目标环境下的分群运动,并在分群运动过程中各个子群保持速度一致运动。

Claims (4)

1.一种基于改进拟态物理法的多智能体系统运动控制方法,其特征在于,包括以下步骤:
步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型;
步骤二,根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息;
步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象;
步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数,具体为:
Figure FSB0000196630240000011
式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象
Figure FSB0000196630240000012
的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子;
步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入,具体包括:
(5.1)计算智能体Agenti与邻居智能体Agentj,j∈Ni的位置差
Figure FSB0000196630240000013
和速度差
Figure FSB0000196630240000014
具体为:
Figure FSB0000196630240000015
式中,pj表示编号为j的智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量;
(5.2)计算改进拟态物理法的速度一致项
Figure FSB0000196630240000016
和避碰项
Figure FSB0000196630240000017
具体为:
Figure FSB0000196630240000018
式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rs为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离;
(5.3)计算改进拟态物理法的注意力跟随项
Figure FSB0000196630240000021
具体为:
Figure FSB0000196630240000022
式中,
Figure FSB0000196630240000023
为注意对象
Figure FSB0000196630240000024
的位置,
Figure FSB0000196630240000025
为注意对象
Figure FSB0000196630240000026
的速度向量,显然,当注意对象
Figure FSB0000196630240000027
为静止目标时,
Figure FSB0000196630240000028
(5.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:
Figure FSB0000196630240000029
式中,αi为注意力参数,表示为:
Figure FSB00001966302400000210
步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制;
步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。
2.如权利要求1所述的一种基于改进拟态物理法的多智能体系统 运动控制方法,其特征在于,所述步骤一中将每个智能体抽象为质点,建立单个智能体的二阶运动模型,具体为:
Figure FSB00001966302400000211
式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。
3.如权利要求1所述的一种基于改进拟态物理法的多智能体系统 运动控制方法,其特征在于,所述步骤二中根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息,具体包括:
获取智能体Agenti的邻居序号集Ni为:
Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i} (8)
式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离;
获取邻居智能体的状态信息用元组
Figure FSB0000196630240000031
表示,
Figure FSB0000196630240000032
为Agentj,j∈Ni的目标感知状态;当Agentj能感知到目标时,
Figure FSB0000196630240000033
反之
Figure FSB0000196630240000034
当目标与智能体的距离
Figure FSB0000196630240000035
小于智能体的感知距离δ时,表示智能体能感知到目标,则获取目标的位置信息为
Figure FSB0000196630240000036
这里
Figure FSB0000196630240000037
表示编号为m的目标Tm位置向量。
4.如权利要求1所述的一种基于改进拟态物理法的多智能体系统 运动控制方法,其特征在于,所述步骤三中根据邻居智能体的状态信息和目标的位置信息选择注意对象选择注意对象,具体为:
当智能体Agenti能够感知到目标时,根据目标的位置信息
Figure FSB0000196630240000038
选择欧氏距离最近的目标作为注意对象
Figure FSB0000196630240000039
同时设置Agenti的目标感知状态为
Figure FSB00001966302400000310
当智能体Agenti没有感知到目标且邻居智能体Agentj,j∈Ni的目标感知状态
Figure FSB00001966302400000311
时,则选择最近的智能体Agentj作为注意对象
Figure FSB00001966302400000312
同时设置Agenti的目标感知状态为
Figure FSB00001966302400000313
当智能体Agenti既感知不到目标,且其邻居智能体的目标感知状态
Figure FSB00001966302400000314
均为0时,则令Agenti的注意对象
Figure FSB00001966302400000315
同时设置Agenti的目标感知状态为
Figure FSB00001966302400000316
CN201910466169.9A 2019-05-29 2019-05-29 一种基于改进拟态物理法的多智能体系统运动控制方法 Active CN110275527B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910466169.9A CN110275527B (zh) 2019-05-29 2019-05-29 一种基于改进拟态物理法的多智能体系统运动控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910466169.9A CN110275527B (zh) 2019-05-29 2019-05-29 一种基于改进拟态物理法的多智能体系统运动控制方法

Publications (2)

Publication Number Publication Date
CN110275527A CN110275527A (zh) 2019-09-24
CN110275527B true CN110275527B (zh) 2022-02-11

Family

ID=67960339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910466169.9A Active CN110275527B (zh) 2019-05-29 2019-05-29 一种基于改进拟态物理法的多智能体系统运动控制方法

Country Status (1)

Country Link
CN (1) CN110275527B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111007848B (zh) * 2019-12-03 2022-08-16 中国电子科技集团公司第二十八研究所 一种基于有界空间的多智能体协同作业控制方法
CN111859816A (zh) * 2020-08-03 2020-10-30 南京航空航天大学 拟态物理法与ddqn结合的无人机集群空战决策方法
CN112083738B (zh) * 2020-09-24 2021-09-21 北京航空航天大学 一种受物理化学启发的多智能体集群控制方法
CN113146624B (zh) * 2021-03-25 2022-04-29 重庆大学 基于最大角聚集策略的多智能体控制方法
CN113033756B (zh) * 2021-03-25 2022-09-16 重庆大学 基于目标导向的聚集策略的多智能体控制方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030058A (ja) * 2002-06-24 2004-01-29 Toshiba Corp マルチエージェントシステム
CN101825901B (zh) * 2010-03-31 2012-01-11 北京航空航天大学 基于人工物理法的多智能体机器人协同控制方法
CN104503454B (zh) * 2014-12-23 2017-04-12 浙江理工大学 基于多智能体理论的搜救机器人系统运动控制方法
CN107179683B (zh) * 2017-04-01 2020-04-24 浙江工业大学 一种基于神经网络的交互机器人智能运动检测与控制方法
US10755424B2 (en) * 2017-05-05 2020-08-25 Hrl Laboratories, Llc Prediction of multi-agent adversarial movements through signature-formations using radon-cumulative distribution transform and canonical correlation analysis
CN107340784B (zh) * 2017-08-21 2018-04-17 中国人民解放军陆军工程大学 无人机集群控制方法
CN109005055B (zh) * 2018-07-16 2020-03-31 西安交通大学 基于多尺度拓扑空间的复杂网络信息节点重要度评价方法
CN108827312B (zh) * 2018-08-08 2021-10-08 清华大学 一种基于神经网络和人工势场的协同博弈路径规划方法
CN109726903B (zh) * 2018-12-19 2020-10-16 中国电子科技集团公司信息科学研究院 基于注意力机制的分布式多智能体协同决策方法

Also Published As

Publication number Publication date
CN110275527A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
CN110275527B (zh) 一种基于改进拟态物理法的多智能体系统运动控制方法
Cortés et al. Coordinated control of multi-robot systems: A survey
Huegle et al. Dynamic input for deep reinforcement learning in autonomous driving
Lan et al. Distributed control of cooperative target enclosing based on reachability and invariance analysis
CN110608743A (zh) 基于多种群混沌灰狼算法的多无人机协同航路规划方法
Asl et al. Control of leader–follower formation and path planning of mobile robots using Asexual Reproduction Optimization (ARO)
Savkin et al. Distributed formation building algorithms for groups of wheeled mobile robots
CN104020665A (zh) 基于多目标粒子群算法的机械臂最小跃度轨迹优化方法
CN112000096A (zh) 一种基于麻雀搜索算法的差速agv轨迹跟踪控制方法
Hauri et al. Multi-robot formation control via a real-time drawing interface
CN113552891A (zh) 一种基于改进的蝴蝶优化算法的机器人多目标路径规划
Ciou et al. Composite reinforcement learning for social robot navigation
Kumar et al. Emergent formations of a Lagrangian swarm of unmanned ground vehicles
Kwon et al. Mathematical modeling for flocking flight of autonomous multi-UAV system, including environmental factors
Ourari et al. Nearest-neighbor-based collision avoidance for quadrotors via reinforcement learning
CN108958262A (zh) 一种分布式多机器人的局部蜂拥控制方法
Belavadi et al. Frontier exploration technique for 3d autonomous slam using k-means based divisive clustering
Woo Mobile robot path planning with randomly moving obstacles and goal
Agarwal et al. Improving energy efficiency in UAV attitude control using deep reinforcement learning
Siahaan Adjustable Knapsack in Travelling Salesman Problem Using Genetic Process
Krongauz et al. Vision-based collective motion: a locust-inspired reductionist model
Hexmoor et al. Swarm Control in Unmanned Aerial Vehicles.
Moshtagh et al. Vision-based distributed coordination and flocking of multi-agent systems
CN110162084B (zh) 基于一致性理论的飞航导弹集群系统编队控制方法
CN111007848A (zh) 一种基于有界空间的多智能体协同作业控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant