CN112083738B - 一种受物理化学启发的多智能体集群控制方法 - Google Patents
一种受物理化学启发的多智能体集群控制方法 Download PDFInfo
- Publication number
- CN112083738B CN112083738B CN202011016117.0A CN202011016117A CN112083738B CN 112083738 B CN112083738 B CN 112083738B CN 202011016117 A CN202011016117 A CN 202011016117A CN 112083738 B CN112083738 B CN 112083738B
- Authority
- CN
- China
- Prior art keywords
- agent
- cluster
- agents
- dynamics
- potential energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000005381 potential energy Methods 0.000 claims abstract description 59
- 239000002245 particle Substances 0.000 claims abstract description 27
- 238000005315 distribution function Methods 0.000 claims abstract description 21
- 239000003795 chemical substances by application Substances 0.000 claims description 153
- 230000003993 interaction Effects 0.000 claims description 60
- 238000009826 distribution Methods 0.000 claims description 38
- 239000006185 dispersion Substances 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 25
- 230000009471 action Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 22
- 239000000126 substance Substances 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000013519 translation Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 8
- 238000013016 damping Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 239000012634 fragment Substances 0.000 claims description 2
- 238000012938 design process Methods 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 20
- 238000004088 simulation Methods 0.000 description 17
- 230000000739 chaotic effect Effects 0.000 description 14
- 230000002776 aggregation Effects 0.000 description 13
- 238000004220 aggregation Methods 0.000 description 13
- 230000006399 behavior Effects 0.000 description 13
- 230000005012 migration Effects 0.000 description 12
- 238000013508 migration Methods 0.000 description 12
- 230000007704 transition Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000009827 uniform distribution Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005184 irreversible process Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005036 potential barrier Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/104—Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于多智能体集群控制技术领域,特别公开了一种受物理化学启发的多智能体集群控制方法,首先进行模型抽象;其次引入虚拟电子的概率密度分布函数来构筑势能泛函;然后通过求解非孤立质点系的拉格朗日方程得到集群控制律;最后引入耗散结构理论评估集群控制律是否具有将初始混乱的智能体群控制到一个稳定的有序结构的潜能,若控制律满足“耗散结构”理论的三个必要条件,则采用类似李雅普诺夫方法对所设计的控制律进行稳定性和收敛性分析,判断其是否能够使智能体群形成一个稳定的时间渐进的集群。本发明解决了传统社会力模型在集群控制律设计过程中需要构造复杂经验势场的问题,并且为集群控制稳定性和可达性提供完备的理论依据。
Description
技术领域
本发明属于多智能体集群控制技术领域,特别涉及一种受物理化学启发的多智能体集群控制方法,具体来说,就是一种如何控制成百上千的智能体群一起运动,形成一个稳定的几何构型,同时保证各智能体的速度趋于一致的方法。
背景技术
集群是一种普遍存在于自然界的自组织现象,比如细菌、昆虫、鱼类、鸟类、兽类,甚至是无生命的活性胶体和微观粒子,为适应生存环境,历经长期演化后,涌现出高度协调一致的集体行为。实际上,无论是在宏观还是微观世界,无论是在生命体还是非生命体,都广泛存在着类似的大规模集群现象。这些集群现象都表现出了分布、协调、自组织、共识主动等智能行为。集群控制的主要技术难点在于如何控制成百上千的智能体在不发生碰撞的前提下,形成紧密的稳定几何构型,同时保证所有智能体的速度趋于一致。
对于集群控制的研究,最早开始于20世界80年代。主要研究方法是通过构建相关模型来模拟自然界群体现象的内在机理,并将这种驱动机制应用于针对多自主智能体群的集体控制中。典型的集群控制模型有Reynolds模型、Vicsek模型和社会力模型。
1)Reynolds模型
最经典的集群控制模型是由Reynolds在模仿鸟群飞行仿真过程中所提出的,简单地可以概括为Reynolds三准则,即1)避碰原则:避免与邻居智能体发生碰撞;2)速度对齐原则:试图使速度与邻居个体趋于一致;3)集群聚集原则:尽量靠近其他智能体,使其形成紧密群体。Reynolds模型虽然没有严格的数学推导过程,但确实是集群控制算法研究过程中的一个里程碑式的飞跃,后续研究者提出的绝大部分集群控制模型均建立在这三个基本原则的框架之下。
2)Vicsek模型
另外一种代表性的集群模型为Vicsek模型。该模型是Vicsek等人在Reynolds模型的基础上提出地一种更为简单的集群控制模型。Vicsek模型使用的唯一规则就是速度对齐原则,即智能体的速度大小保持不变,并朝着周围一定范围内个体的平均方向进行运动。这种离散模型尽管简单和通用,但是很难对其进行理论解释和稳定性分析。为了从理论上支持Vicsek模型,Toner和Tu给出了该模型在连续域的一般性理论分析以探索其物理本质。Jadbabaie等人也为Vicsek模型提出了一般性理论解释,同时还给出了其他几个Vicsek类似模型的收敛性分析。实际上,Vicsek模型主要关注的是速度方向的对齐,其速率是恒定不变的。相反,Cucker和Smale通过引入加权平均值的概念,提出了一种共识模型来改进Vicsek模型。显然,Cucker-Smale模型比Vecsek模型要更实际一些。Vicsek模型对理解和分析集群行为的内在作用机制提供了独特的视角。但是,它的作用机理与自然界的实际集群行为相违背,比如,智能体间既不能实现避碰也不能表现出聚集吸引作用。这就导致,当智能体间的初始位置偏差较大时,Vicsek模型无法形成一个有界的几何群。
3)社会力模型
自然界的集群行为本质上是有利于生物种群的栖息、进化和繁衍。受这种社群相互作用的启发,Couxin等人通过考虑种群存活的代价与收益,提出了一种社会力模型来模拟种群之间的集体行为。该模型将智能体的整个感知范围由内而外依次分为排斥区域、对齐区域和吸引区域三个互不重叠的子区域,分别对应Reynolds模型中的分离、对齐和聚集规则。当智能体的排斥区域存在其他个体时,则该智能体仅受到排斥作用的影响,否则,智能体同时受到对齐区域和吸引区域内邻居个体的共同作用,其中对齐区域内个体产生速度对齐作用,吸引区域内个体产生空间的聚集作用。后来,Couxin等人对社会力模型做了进一步的改进,他们消除了对智能体感知区域的划分,并将其抽象为作用于整个感知区域的独立社会力。社会力模型采用基于经典牛顿力学的建模方式,将智能体之间的协同关系抽象为个体间的相互作用力,从而改变智能体的运动状态。该模型为自然界群体行为的内在作用机制提供了一个全新的视野。
近些年,人工势场模型在集群控制领域也已取得了较为广泛的研究。通常,一个势能函数可以分为两项,即聚集势能和排斥势能,它们分别用来实现群体聚集和个体避碰控制。所以,本质上,人工势场模型是社会力模型的延续。Olfati提出了一个基于人工势场的多智能体集群控制通用框架。他通过结合虚拟导航力和环境避障力,对连续空间中的集群控制行为进行了综合分析。显然,这些研究工作促进了多智能体集群控制的发展,并为集群动力学理论提供了新的动力。但是,这些模型在使用经典牛顿力学求解运动方程之前必须预先构造一个复杂的经验场(力场或势场),该经验场往往是通过经验性的试凑方法来构筑,一般没有物理依据以及统一的设计规则。而且,集群控制结果的可靠性严重依赖于所构造的人工势场模型的准确性。如果构造的人工势场模型不准确,集群控制效果就不稳定、不可靠。这就限制了社会力模型和人工势场模型的应用范围。
发明内容
为解决传统社会力模型在集群控制律设计过程中需要构造复杂经验势场的问题,以及为集群控制稳定性和可达性提供完备的理论依据,本发明通过模拟非极性粒子间的色散和排斥作用,提出了一种简单而又通用的分布式集群控制方法,为设计和分析多智能体集群控制律提供了一个通用的理论框架。本发明的主要创新点可以总结为以下三个方面:
1)通过引入虚拟电子密度函数来构筑势能泛函,以避免设计复杂的经验性势场。本发明将自主智能体抽象为一个具有虚拟电子的单原子分子,这些虚拟电子以某一概率分布密度分布在该单原子分子的原子核外。
2)创新性的将经典牛顿力学理论与泛函理论巧妙结合,通过引入泛函理论来计算智能体的势能泛函,然后采用经典牛顿力学来求解拉格朗日方程组以获得智能体群的集群控制律。
3)提出了一个用于多智能体集群控制的理论和计算控制律,同时引入了“耗散结构”理论来判断所设计的控制律是否具有将初始混乱的智能体群控制到一个稳定的有序结构的能力。而且,还采用类似李雅普诺夫方法为集群控制提供完整的理论分析依据。
实际上,本发明所提出的集群控制方法为群体行为产生的内在驱动机制提供了一个全新视角,并为多智能体集群控制方法提供了一个受物理化学启发的通用理论框架。
此外,本发明也融合了一些著名的物理化学和生物学概念:非极性分子间主要受远程色散作用和短程排斥作用的影响;原子核外的电子运动是混沌且不规则的,因此通常使用电子的概率分布密度来描述其在核外某处的出现概率;在生物群体中,常常忽略距离焦点个体较远的生物体,而把重点放在位于焦点个体感知范围内的生物体。
具体地,本发明提供了一种受物理化学启发的多智能体集群控制方法,包括如下步骤:
步骤一:将智能体抽象为具有虚拟电子分布的单原子分子模型,建立虚拟电子的概率密度分布函数;
步骤二:通过模拟非极性粒子间的色散和排斥相互作用,引入步骤一中建立的虚拟电子的概率密度分布函数来构筑势能泛函;
步骤三:基于步骤二中构筑的势能泛函建立非孤立质点系的拉格朗日方程,通过求解所述拉格朗日方程得到集群控制律,同时导出智能体群的集群动力学,并引入移动坐标系的概念,将集群动力学转换为平移动力学和结构动力学;
步骤四:引入耗散结构理论评估步骤三中所得到的集群控制律是否具有将初始混乱的智能体群控制到一个稳定的有序结构的潜能。
进一步,步骤一具体过程为:
假设虚拟电子的径向分布密度ρ服从高斯分布,即ρ~N(μ,σ2),N为高斯分布符号,μ表示均值,σ表示方差,将rc=μ+3σ作为高斯曲线截断半径,取均值μ=rs,方差σ=(rc-rs)/3,所建立的虚拟电子的概率密度分布函数为:
进一步,步骤二具体过程如下:
通过模拟非极性粒子间的相互作用,设计如下三种交互机制:当两个智能体相距较远时,两者之间没有相互作用;当两个智能体相互靠近时,两者产生色散作用;当两个智能体无限靠近时,两者之间产生排斥作用,
将智能体的势能泛函定义为色散势能泛函和排斥势能泛函之和:
其中,为智能体i的势能泛函,为智能体i的位置坐标,为智能体i的色散势能泛函,为智能体i的排斥势能泛函,为归一化虚拟电子密度分布函数,为智能体j的位置坐标,||·||表示欧式范数,智能体i和智能体j具有相同的归一化虚拟电子密度分布函数,即
假设智能体i和智能体j之间的色散作用与两者相对距离rij的一次方有关,而排斥作用与两者之间的相对距离rij的二次方有关,则智能体i的色散势能泛函和智能体i的排斥势能泛函分别定义为:
其中,Γ表示智能体i的运动路径;α,β>0分别为色散作用和排斥作用的强度系数;nij=(qj-qi)/||qj-qi||为单位方向向量;Ni={j:||qj-qi||<rc}为智能体i的邻居集;为保证积分有界和消除欧式范数||z||-m,m=1,2,在变量z=[0,0]T的奇点,定义一个称之为σ-范数的非负映射,即其中,∈>0;
将智能体的势能泛函(2)转换为标量形式,得到智能体i和智能体j双体势能泛函:
进一步,步骤三中,基于步骤二中构筑的势能泛函建立非孤立质点系的拉格朗日方程,通过求解所述拉格朗日方程得到集群控制律,具体过程如下:
考虑一个由n个智能体构成的多智能体系统在二维欧式空间中进行群体运动,其中每个智能体满足如下动力学特性:
其中,pi为智能体i的速度坐标,ui为智能体i的控制输入,
相邻智能体i和智能体j之间具有如下作用强度:
aij=1-φ(||qj-qi||),j∈Ni,j≠i (8)
其中,aij为相邻智能体i和智能体j之间的作用强度,Ni={j:||qj-qi||<rc}为智能体i的邻居智能体集合,函数φ(||qj-qi||)是一个具有正弦衰减特性的S型函数,
所述多智能体系统中智能体之间的相互作用用拉格朗日函数来描述
Li=Vi-Ti (10)
其中,Li为智能体i的拉格朗日函数;Ti=mipi Tpi/2为智能体i的动能,mi为智能体i的质量;
智能体除了受到体系内部的相互作用,还受到系统外部的作用力,用非孤立质点系的拉格朗日方程来描述智能体的运动特性:
其中,Fi ext是作用在智能体i上的外力,t为时间,
求解方程(11),得到:
作用在智能体i上的外力Fi ext为:
式(14)中,第一项是充当摩擦作用的阻尼力,pj为智能体j的速度坐标;第二项[κ1(qt-qi)+κ2(pt-pi)]是相对于群跟踪目标的导航反馈力,其中,qt和pt分别是群跟踪目标的位置和速度,κ1,κ2>0为比例系数,
将式(14)代入式(12),得到受物理化学驱动的集群控制律:
其中,梯度项用于表征所述多智能体系统内部的交互作用,其可以使所述多智能体系统内的智能体形成一个相对紧密和稳定的几何群;速度协调项用于保证使智能体之间的相对速度差为0;导航反馈项[κ1(qt-qi)+κ2(pt-pi)]用于使智能体群在满足速度约束的同时无差地跟踪给定的群跟踪目标,
其中,梯度项和速度协调项是实现时间渐近群的充要条件,导航反馈项能够放宽系统的初始状态,避免智能体群出现碎片结构。
进一步,步骤三中,导出智能体群的集群动力学,并引入移动坐标系的概念,将集群动力学方程组转换为平移动力学和结构动力学,具体过程为:
一群应用集群控制律(15)的自主智能体群的集群动力学表示为
其中,分别为n个智能体的位置坐标,p1,...,pn分别为n个智能体的速度坐标;是一个平滑的质点系势能函数;是一个二维的拉普拉斯矩阵,I2为2阶单位矩阵;为克罗内克积;f(q,p,qt,pt)是导航反馈矩阵,
智能体i和j的相对位移和相对速度为
将集群动力学(16)转换为实际参考坐标系下的平移动力学(21)和移动坐标系下的结构动力学(22):
进一步,步骤四具体过程为:
所述多智能体系统形成耗散结构的三个基本条件为:所述多智能体系统是开放系统;所述多智能体系统处于远离热平衡的状态;以及所述多智能体系统中各个子系统之间存在着非线性相互作用;
集群控制律满足所述三个基本条件,就具备从无序向有序转变的潜能。
本发明还提供了一种上述控制方法的应用,所述方法应用于机器人群和无人机群的集群控制。
本发明的有益效果:
1)本发明是将复杂经验势场的构筑问题转换为虚拟电子密度分布函数的设计问题,即仅仅通过设计一个简单的虚拟电子密度分布函数就可以有效地避免构造一个复杂的经验场(势场或者力场)。相比于现有技术(社会力集群控制模型或者人工势场控制模型需要构筑复杂经验场),本发明在构筑势能时有物理依据可循,而且势能设计规则更为一般化和通用化,相关设计参数也相对较少。
2)相比于现有集群控制技术,本发明提出了一种用于多智能体集群控制律设计和分析的通用框架,为控制律的能力评估、可达性和稳定性分析提供了完备的理论分析依据。
附图说明
图1为本发明的受物理化学启发的多智能体集群控制方法流程图;
图2为无人机建模结构示意图和无人机间的相互作用示意图;
图3为无人机i和j之间的内在交互作用示意图,其中(a)为无相互作用,(b)为色散作用,(c)为排斥作用;
图4为双体势能泛函的几何解释图,其中,(a)为势能泛函曲线Vij,(b)为虚拟电子的径向分布密度ρ相对于相对距离rij的径向分布曲线,(c)为实数场相对于相对距离rij的径向分布曲线(数字1-3分别对应无相互作用,色散作用和排斥作用),(d)为实数场相对于径向分布密度ρ的变化曲线;
图6为由50个无人机组成的无人机群从混乱无序向平衡有序的转变过程图,其中变量t0,t1,t2和t3分别表示相应的仿真时刻,并满足t0<t1<t2<t3;
图7为仿真图6的序参数R(t)和<v(t)>在转换过程中的变化曲线,其中(a)为聚集半径R(t)随时间t的变化曲线,(b)为平均迁移速度<v(t)〉随时间t的化曲线;
图8为控制无人机组跟踪给定匀速运动目标的跟踪曲线;
图9为仿真图8的序参数变化曲线,其中(a)为聚集半径R(t)随时间t的变化曲线,(b)为平均迁移速度<v(t)〉随时间t的化曲线,(c)为群体中任意两个智能体间的最小距离rmin(t)随时间t的变化曲线;
图10为实验1和实验2的无人机集群运动轨迹图;
图11为实验1和实验2的序参数变化曲线,其中(a)为聚集半径R(t)随时间t的变化曲线,(b)为平均迁移速度<v(t)〉随时间t的化曲线,(c)为无人机群中任意两个无人机间的最小距离rmin(t)随时间t的变化曲线;
图12为针对不同无人机数量的序参数变化曲线图,其中(a)为聚集半径R(t)的变化曲线,(b)为平均迁移速度<v(t)〉的变化曲线;
图13为针对300个无人机的集群控制仿真图;
图14为对具有不同运动特性目标的跟踪效率的两个仿真示例,其中(a)为实验1:目标做匀速圆周运动,(b)为实验2:目标做随机运动。
具体实施方式
下面结合附图和实施例进一步描述本发明,应该理解,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。本发明可以具体应用于无人机、机器人、卫星和传感器等智能体的集群控制,本实施例以无人机群的集群控制为例。
如图1所示,本发明的受物理化学启发的无人机集群控制方法包括如下步骤:
步骤一:将无人机抽象为微观世界中具有虚拟电子分布的单原子分子(单原子分子是一类非极性粒子)模型。
受物理化学中微观粒子间相互作用的启发,本发明将无人机抽象为具有虚拟电子分布的单原子分子,如图2(a)所示,虚拟电子以径向分布密度ρ分布在原子核外的空间,其最大分布密度是在以原子核为中心,半径为rs的球面上,其中,是指主体无人机与其他无人机间安全距离的一半,即无人机安全半径,如图2(b)所示。如果任意两个无人机i和j的相对距离小于2rs时,则它们之间可能发生重叠或者碰撞。当相对距离rij小于无人机感知范围时,无人机i和j可以互相感知到对方,从而产生交互作用。这就意味着如果两个无人机要同时满足避碰和交互作用,它们之间的相对距离rij必须满足2rs<rij<rc。
假设虚拟电子的径向分布密度ρ服从高斯分布,即ρ~N(μ,σ2),N为高斯分布符号,μ表示均值,σ表示方差。由于高斯曲线在区间(μ-3σ,μ+3σ)面积占整个曲线的99.74%,所以此处将rc=μ+3σ作为曲线截断半径。取均值μ=rs,方差σ=(rc-rs)/3。因此,本发明的虚拟电子的概率密度分布函数可以被定义为
步骤二:通过模拟非极性粒子间的色散和排斥相互作用,并引入步骤一种建立的虚拟电子的概率密度分布函数来构筑势能泛函。
本发明通过模拟非极性粒子间的相互作用,设计如下三种交互机制:当两个无人机相距较远时,两者之间没有相互作用,如图3(a)所示;当两个无人机相互靠近时,由于瞬时偶极矩的产生,无人机间产生相互吸引作用,称之为色散作用,如图3(b)所示;当两个无人机无限靠近时,由于两者核外电子云的重叠,个体之间会产生排斥作用,如图3(c)所示。
色散和排斥作用的本质实际上是核外电子之间的相互作用。在物理化学中,由于电子与核的质量相比可以忽略不计,因此人们普遍认为电子可以在与分子系统动力学相关的时间尺度上瞬间达到平衡分布(Born–Oppenheimer近似),即可以忽略电子的弛豫时间。而且,原子核外的电子运动是混乱且不规则的,因此,作用在每个核粒子上的力可以由系统中其他核粒子的位置和局部电子密度确定。基于此,本发明引入虚拟电子的概念,并使用泛函理论在多无人机系统的动力学特性与单一无人机的虚拟电子密度分布之间建立定量联系。
通过以上分析,可以将势能泛函写为色散势能泛函和排斥势能泛函之和,它们都是以虚拟电子的分布密度作为基本变量。
其中,为无人机i的势能泛函,为无人机i的位置坐标,为无人机i的色散势能泛函,为无人机i的排斥势能泛函,为归一化虚拟电子密度分布函数,为无人机j的位置坐标,||·||表示欧式范数。不同的粒子具有相同的归一化虚拟电子密度分布函数,即实际上,也可以理解为位于qj处的邻居无人机j对位于qi处的无人机i的作用强度。
理论研究发现,分子或原子之间的相互作用强度与两个粒子之间的距离变化有关。基于此,本发明假设无人机i和j之间的色散作用与两者相对距离rij的一次方有关,而排斥作用与两者相对距离rij的二次方有关。因此,色散和排斥势能泛函可以分别定义为:
其中,L表示无人机i的运动路径;α,β>0分别为色散和排斥作用的强度系数,nij=(qj-qi)/||qj-qi||为单位方向向量;Ni={j:||qj-qi||<rc}为无人机i的邻居集。为保证积分有界和消除欧式范数||z||-m,(m=1,2)在z=[0,0]T的奇点,定义一个称之为σ-范数的非负映射,即其中,∈>0。事实上,σ-范数并不是一个严格意义上的范数,因为它不满足范数定义中的齐次性。
为了探索势能泛函的本质,下面以两个无人机之间的相互作用为例,将势能泛函(2)转换为标量形式,即双体势能泛函:
如图4(b)所示,假设径向分布密度ρ服从虚拟电子的概率密度分布函数(1),而且其变量rij满足rij∈(0,rc)。如果无人机i和无人机j间的距离大于rc时,有ρ=0。如图4(c)所示,随着相对距离rij由远及近,无人机i和无人机j之间的相互作用逐渐从无相互作用到色散作用再到排斥作用。当相对距离rij=2rs时,无人机i和无人机j的虚拟电子云重合最大,即此时的排斥强度最大。本发明中,一般不允许相对距离rij小于2rs,而且不允许其他无人机穿越焦点无人机的势垒。同样地,径向分布密度ρ的变化也会影响无人机之间的相互作用,如图4(d)所示,如果径向分布密度ρ在某处为ρ=0,则邻居无人机不会对焦点无人机产生影响。随着径向分布密度ρ的增加,无人机间吸引作用逐渐增加。当径向分布密度ρ达到某个值时,无人机间的交互作用逐渐从吸引变为排斥。
步骤三:基于步骤二中构筑的势能泛函建立非孤立质点系的拉格朗日方程,通过求解该拉格朗日方程得到集群控制律,同时导出无人机群的集群动力学方程组,并引入“移动坐标系”的概念,将集群动力学方程组转换为平移动力学方程组和结构动力学方程组。
考虑一个由n个无人机(单位质量)构成的多无人机系统在二维欧式空间中进行群体运动,每个无人机满足如下动力学特性:
其中,pi为无人机i的速度坐标,ui为无人机i的控制输入。
且相邻无人机i和j之间具有如下作用强度
aij=1-φ(||qj-qi||),j∈Ni,j≠i (8)
其中,aij为相邻无人机i和j之间的作用强度,Ni={j:||qj-qi||<rc}为无人机i的邻居无人机集合,函数φ(||qj-qi||)是一个具有正弦衰减特性的S型函数,
显然,rij=||qj-qi||为无人机i和j的相对距离,φ(rij)取值满足φ(rij)∈[0,1]。
在利用本发明的控制方法所构成的多无人机系统中,无人机之间存在着相互作用,这些交互作用可以用拉格朗日函数来描述:
Li=Vi-Ti (10)
其中,Li为无人机i的拉格朗日函数;Ti=mipi Tpi/2为无人机i的动能,mi为无人机i的质量,通常为单位质量。无人机除了受到体系内部的相互作用,还受到系统外部的作用力。这就意味着具有动力学特性(7)的系统是一个非孤立系统。因此,可以用非孤立质点系的拉格朗日方程来描述无人机的运动特性:
其中,Fi ext是作用在无人机i上的外力,t为时间。
通过求解上述方程(11),可以得到:
其中外力Fi ext由下式给出:
上式(14)中的第一项是充当摩擦作用的阻尼力,pj为无人机j的速度坐标。由于阻尼力的方向与相对速度pi-pj的方向相反,所以阻尼力将减小相对速度差,直到pi和pj达到一个共同的速度(即pi-pj=0)。显然,阻尼力是作为摩擦项消耗能量的。上式(14)中的第二项[κ1(qt-qi)+κ2(pt-pi)]是相对于群跟踪目标的导航反馈力,其中,qt和pt分别是群跟踪目标的位置和速度,κ1,κ2>0为比例系数。该群跟踪目标可以是静态目标,也可以是动态目标,导航反馈项的主要作用是消除无人机与群跟踪目标之间的相对位置差和速度差,从而使无人机群能够无差跟踪给定的群跟踪目标。
将(14)代入(12),可以得到受物理化学驱动的集群控制律:
其中,为群跟踪目标的位置坐标,为群跟踪目标的速度坐标;梯度项表征了多无人机系统内部的交互作用,其可以是系统内的无人机形成一个相对紧密和稳定的几何群;速度协调项可以保证使所用无人机区域一个共同速度,即使无人机之间的相对速度差为0;导航反馈项[κ1(qt-qi)+κ2(pt-pi)]是使无人机群在满足速度约束的同时无差地跟踪给定的群跟踪目标。梯度项和速度协调项是是实现时间渐近群的充要条件,导航反馈项可以放宽系统的初始状态,避免无人机群出现碎片结构。
一群应用集群控制律(15)的自主无人机群的集群动力学可以表示为
其中,分别为n个无人机的位置坐标,p1,...,pn分别为n个无人机的速度坐标;是一个平滑的质点系势能函数;是一个二维的拉普拉斯矩阵,I2为2阶单位矩阵;为克罗内克积;f(q,p,qt,pt)是导航反馈矩阵,它可以由下式给出
集群动力学(16)可以很好地反映出多无人机系统的运动特性,但是它很难用来描述集群运动的结构特性。因此,本发明引入“移动坐标系”来分析集群运动的平移和结构特性。
无人机i和j的相对位移和相对速度可以表述为
显然,移动坐标系中的无人机i和j相对运动状态(xj-xi和vj-vi)与实际参考坐标系中无人机间的相对运动状态(qj-qi和pj-pi)是一致的。
下面给出移动坐标系下的集群动力学。事实上,梯度场是相对||qj-qi||距离的函数。很明显,根据式(19),可以得到||xj-xi||=||qj-qi||。因此,有以下等式关系成立,和其中分别为无人机1-n的在“移动坐标系”中的位置。对于速度协调项,由于vj-vi=pj-pi,所以有成立,v1,...,vn分别为无人机1-n的在“移动坐标系”中的速度。根据式(19),很容易得到成立。然后,将上述关系代入(17),可以得到
因此,集群动力学(16)可以转换为实际参考坐标系下的平移动力学:
和移动坐标系下的结构动力学:
实际上,平移动力学(21)是将集群中的所有无人机视为一个整体,它描述了集群的整体运动特性,而忽略了集群内部的相对运动关系。相反,结构动力学(22)主要考虑集群内个体之间的相对运动关系,即集群的结构特性。
步骤四:引入“耗散结构”理论评估所得到的集群控制律是否具有将初始混乱的无人机群控制到一个稳定的有序结构的潜能。
集群控制的主要目的是设计一个适当的控制律以实现无人机从无序运动到有序运动的快速转变。在物理学中,耗散结构理论常被用于描述这种复杂系统的过渡过程,它可以概括为如下定义:
一个远离平衡状态(热力学平衡)的开放系统不断与外界交换物质和能量,当外部条件的变化达到一定阈值时,系统可以通过其内部的非线性相互作用从原始的混沌状态转变为时空或功能有序的状态,从而形成新的稳定的宏观有序结构,这种处于非平衡状态的新结构称为耗散结构。
实际上,自然界中的大多数系统,无论是物理、化学、生物还是社会、经济系统,都是远离平衡的耗散结构。它们都是非孤立,非平衡和非线性系统。而且,它们都通过与周围环境交换物质、能量和熵来维持这种有序结构。
引理1:一个复杂系统必须具备以下三个基本条件才能从无序混乱的状态演变为有序稳定的状态:
1)(开放系统)开放是所有系统形成有序结构的必要条件。只有不断地与外界交换物质和能量,系统才能产生并维持稳定有序的结构。
2)(远离平衡状态)系统必须处于远离热平衡的状态,才能从无序演变到有序,即非平衡是有序之源。
3)(非线性相互作用)系统中各个子系统之间存在着非线性相互作用。这种交互作用可以使各个子系统之间生成协调动作,从而使系统从混乱状态变为有序状态。
上述引理1给出了复杂系统从混沌无序演变为有序的必要条件。这些基本条件可用于衡量复杂系统是否具有从无序转变为有序的能力。
本发明所设计的集群控制律(15)满足使多无人机系统形成耗散结构的以上三个基本条件,即具备从混沌状态演变为有序状态的潜在能力。下面对此进行证明。
可以直接由式(11)-(15)推断出,具有集群动力学(16)的多无人机系统是一个非孤立系统,或者说是一个开放系统。因为系统不仅受到内部的相互作用还受到来自系统外部的作用力Fi ext。换句话说,本发明的具有集群动力学(16)的多无人机系统通过外部作用Fi ext与外界交换能量。
在化学中,熵通常用来描述复杂系统的演化过程。假设dS是具有集群动力学(16)的多无人机系统在dt时间内的熵变,可以将dS分解为以下两个贡献之和:
dS=dSe+dSi (23)
其中,dSe是由外部作用Fi ext产生的熵流,dSi是由系统本身不可逆过程产生的熵增。热力学第二定律表明,随时间进行,一个孤立体系中的熵是不会减少的,即dSi≥0,如果系统达到平衡,则dSi=0。相反,熵流dSe并没有特定的符号,可以想象这样一个演变过程,即具有集群动力学(16)的多无人机系统可以达到一个比初始熵值更低的状态。
ΔS=∫LdS<0 (24)
根据平衡关系,这种定态(熵减小状态)并不能一直保持。如果系统能够达到这种定态,而且满足
dSe=-dSi<0,dS=0 (25)
则该定态可以一直保持下去。这就意味着,如果通过外部作用Fi ext给系统足够的负熵流,则就可以将其保持在一个有序构型。更确切地说,外部作用Fi ext的存在可以使具有集群动力学(16)的多无人机系统处于非平衡状态,而连续的外部作用Fi ext使系统远离平衡并达到新的定态。
具有集群动力学(16)的多无人机系统中的无人机通过分散和排斥作用进行交互。正如式(9)中所描述的,无人机之间的色散和排斥作用是非线性的,即不满足叠加定理。此外,具有集群动力学(16)的多无人机系统中的无人机根据其感知范围rc进行随机交互,而不是一一对应的。简言之,具有集群动力学(16)的多无人机系统中存在着非线性相互作用,这些交互会导致无人机之间产生协调动作,从而使具有集群动力学(16)的多无人机系统逐步向有序演化。
总之,本发明的具有集群动力学(16)的多无人机系统具有从无序向有序运动转变的能力。因此,本发明的多无人机系统在控制律(15)的作用下,满足形成“耗散结构”的三个必要条件,具备从无序向有序转变的潜能。
下面采用类似李雅普诺夫方法对本发明所设计的集群控制律进行稳定性和收敛性分析,判断其是否能够使无人机群形成一个稳定的时间渐进的集群。
1)稳定性分析
集群动力学稳定性分析的关键是采用正确的坐标系。通过引入“移动坐标系”,可以将具有集群动力学(16)的多无人机系统的稳定性分析分解为以下两种形式的组合:(1)平移动力学的跟踪稳定性,和(2)结构动力学的结构稳定性。
首先给出平移动力学的跟踪稳定性分析。假定群跟踪目标是静止的或以匀速运动,并具有以下运动特性:
令e1=qt-qc和e2=pt-pc分别表示系统相对于给定的集群跟踪目标的位置差和速度差。根据集群跟踪目标的运动特性(26),e1和e2具有如下微分关系:
显然,平移动力学(21)的平衡点为(qt,pt)。根据跟踪控制目标,可以定义如下李雅普诺夫函数
其中,李雅普诺夫函数V(e1,e2)满足对所有e1,e2≠0有V(e1,e2)>0,当且仅当e1,e2=0时,V(e1,e2)=0,即V(e1,e2)是正定的。将李雅普诺夫函数V(e1,e2)对时间求导,有
V(e1(t),e2(t))≤V(e1(t0),e2(t0))<∞ (30)
其中,e1(t0),e2(t0)表示初始时刻t0的误差。
通过以上分析,集群控制律(15)可以实现具有运动特性(26)的无人机群无差跟踪给定目标,而且可以使系统状态(qc,pc)渐近地收敛到平衡点(qt,pt)。
集群运动分析的主要难点是对其结构动力学的稳定性分析。在对结构动力学进行稳定性分析之前,本发明需要将系统的结构动力学(22)转换为以下表达式形式:
其中
引理3:双体势能泛函(5)在定义域[0,rc]内是连续而有界的(具有上界和下界)。
由于
和
即,被积函数在左端点z=0处右连续,在右端点z=rc处左连续。因此,被积函数在闭区间[0,rc]是连续的。而且,由于被积函数在定义域内连续,所以不定积分Vij在闭区间[0,rc]是连续的。从而,可以得到双体势能泛函在定义域内是有界的,即有:
其中,h0,c0表示任意两个实数,其实针对一对无人机i和j的双体势能泛函Vij的数。
其中,r*也被称为任意两个相邻无人机间的期望距离。需要注意的是,双体势能泛函Vij仅在rij=r*处取得最小值。
引理4:如果双体势能泛函Vij在闭区间[0,rc]内是有界的
下面对此进行证明。
由于双体势能泛函Vij在闭区间[0,rc]内是有界的,可以推断出无人机i的势能泛函Vi是有界的
通过分析,可以得到
引理5:考虑一群受集群控制律(15)控制的无人机群,其结构动力学为(31)。假设初始惯性矩J(x(0))和动能T(v(0))是有限的,如果以下条件成立,则本发明的多无人机系统可以形成时间渐近群。
(1)无人机群对于所有t≥0是保持聚集的。也就是说,存在一个以qc为圆心,半径为R>0的圆,使得该圆在空间内总是可以包含住所有无人机。
(2)所有无人机都可以渐进地收敛到一个共同的速度,即,随着时间的推移,各无人机相对于pc的速度差最终趋于零。
下面对此进行证明。
根据关系式(18)和(19),可以推断出,受集群控制律(15)控制的具有集群动力学(16)的多无人机系统的任何一个状态解与具有结构动力学(31)的系统的解是一一对应的。在移动坐标系中,每个无人机具有以下结构动力学特性
其中
因此,可以得到
结合xi=qi-qc,上式(57)可以写为
因此
这表明,存在一个以qc为圆心,半径为的圆,使得该圆对所有t≥0总是可以包含住所有无人机,即无人机群对于所有t≥0总是聚集在该圆内。该性质与动能T[v(t)]有界一起保证了转换后的结构动力学(31)的解的有界性。
假设由多无人机系统中所有无人机构成的无向图对所有t≥0总是连通的。根据式(52),要想使则vi必然为vi=0。因此可以推断出,在移动坐标系中所有无人机的速度最终会渐近地收敛到零。这表明在实际参考系中所有无人机的速度可以渐近地收敛到一个共同的速度,即p1=...=pn=pc。假设x*是聚集势能泛函的局部最小值,还可以通过式(53)得出,几乎质点的结构动力学(31)中的所有解都会渐近地收敛到平衡状态(x*,0)。总而言之,所有无人机都可以从初始混沌运动渐近收敛到一个平衡而又稳定的几何构型,同时确保所有无人机能够渐进地收敛到一个共同的运动速度。
下面通过具体的仿真实例来验证本发明。首先给出一个自驱动的例子来说明由色散和排斥作用所引起的群体聚集行为;其次,为了证明本发明所提出的集群控制方法的优势,将本发明与现有的人工势场法进行比较;之后给出几组针对不同无人机数量的集群试验,以说明本发明所提出方法的的可扩展性;最后验证集群对具有不同运动特征的目标的跟踪仿真。
在给出仿真结果之前,需要先定义以下参数值,这些参数值在所有模拟中几乎保持不变(请参见表1)。为方便描述,在所有的仿真图中,无人机用空心圆圈表示,其实际速度由指示线表示。
表1仿真参数值
参数 | r<sub>s</sub> | r<sub>c</sub> | α | β | ∈ | κ<sub>1</sub> | κ<sub>2</sub> |
数值 | 1.0 | 8.4 | 51 | 151 | 1.0 | 0.5 | 1.2 |
为了验证无人机群是否是时间渐近集群,需要定义以下序参数。
(1)定义聚集半径R(t)为:
显然,可以通过聚集半径R(t)的变化趋势来验证无人机群是否是聚集在一起的。如果聚集半径R(t)逐渐减小并最终收敛到一个有限值,则该无人机群是一个聚集群;相反,它不是一个聚集群。
(2)定义平均迁移速度<v(t)>,以衡量多无人机系统是否达到一致速度,
如果所有无人机一致地朝同一方向移动,则<v(t)>接近于1。如果所有无人机都是无序混杂运动的,则<v(t)>大约为0。
为了证明色散和排斥作用对集体运动的有效性,本实施例仅考虑由系统内部相互作用和速度协调力组成的集群控制力:
显然,ui是一个过阻尼的控制力。需要注意的是,由于缺少外部导航反馈力,无人机群可能产生结构化碎片现象,即无人机形成了多个小群组。为了避免这种现象,本发明在适当的数值范围内初始化无人机的初始状态。
无人机从无序向有序的转变过程如图6所示。各无人机的初始位置和速度分别从均匀分布[23,57]和[0,5]中随机选择的(参见图6中的时刻t0)。相应地,此时的平均迁移速度基本为0,而且聚合半径也较大。由于系统内部相互作用,无人机群逐渐从初始的混乱状态向有序状态演变(见图6中的时刻t1和t2),并最终聚集形成一个稳定的平衡几何构型(见图6中的时刻t3)。在此过渡期间,聚集半径逐渐减小,最终收敛到有限值R=15.85,如图7(a)所示。最开始时,聚集半径是增加的,这是因为一些无人机在初始时刻t0时相距较近。由于无人机间的排斥作用,个体之间的距离逐渐变大,最终导致聚集半径R的增加。同时,随着无人机群从无序向有序转变,系统的平均迁移速度也逐渐增加,最终接近于1(见图7(b))。通过数值仿真可以发现,受物理化学启发所提出的色散和排斥作用可以使无人机群产生全局集体行为,并且系统中无人机最终分布在类似晶格的几何构型中。
接下来本实施例给出了由50个无人机构成的无人机群在完整的控制律(15)控制下的仿真实验。
如图8所示,本实施例设置了这样一个场景,其中无人机群跟踪一个匀速运动目标。无人机的初始状态是根据均匀分布随机选择的,即qi~U([10,15]T,[60,65]T)和pi~U([0,0]T,[5,5]T)。在该仿真中,目标运动轨迹是事先设定的。可以看出,所有无人机从初始混乱状态最终聚集在一起形成了集群,而且该集群不断地通过改变其质心和方向来跟踪给定目标。当集群运动时,跟踪误差保持为零。而且,群体中所有无人机的运动状态可以立即收敛并趋于一致。当遇到干扰时,集群控制律(15)可以使无人机迅速消除干扰并无差地跟踪给定状态。序参数的变化如图9所示,显然,在短时间内,聚集半径可以快速地衰减到一个有限值R=13.58,而且平均迁移速度也迅速地从0收敛到1,这表明无人机群从无序到有序的过渡过程是非常迅速地。此外,还可以发现,当集群跟踪给定目标时,聚集半径是保持不变的,而且平均迁移速度也保持不变。另外,在整个过程中,集群中任何两个无人机间的最小距离rmin没有小于安全距离2rs=2。
为了进一步阐明本发明的优越性,将本发明提出的集群控制方法与现有典型的人工势场进行了对比。在仿真中,分别使用实验1和实验2来表示传统人工势场集群控制方法和本发明提出的集群控制方法。在两个不同实验组中,每个组中都各有50个无人机。这两个实验的初始状态完全相同,并且初始位置和速度满足qi~U([5,5]T,[75,75]T)和pi~U([0,0]T,[5,5]T)。为了更好地反映无人机之间的内部相互作用,让这两组无人机都跟踪位于qt=[210,40]T处的静态目标。这两个实验的实验参数值分别如下表2和表3所示。由于这两种控制方法完全不同,所以尽可能地调整本发明所提出集群控制方法的参数,以使其控制规模接近于传统人工势场方法。例如,将这两个实验的感知范围设置为相同,rc=r=8.4,然后将本发明所提出方法的rs增加到rs=2。同时,为了避免跟踪静态目标时产生较大的速度,将这两个实验的导航反馈力的比例因子都设置为0.2,即κ1=c1=0.2。
无人机群的运动轨迹如图10所示。可以看出,两个实验都可以实现无人机群从最初的无序运动向有序结构转变。但相比之下,本发明所控制的演变过程要更快一些。此外,在实验2中,无人机相对于实验1中的空间排列要更加紧密,而且没有空缺现象(参见图10(a)中的红色圆圈)。另外,从图11中的序参数变化曲线很容易看出,实验2中的聚集半径和无人机间的最小距离rmin可以迅速收敛到一个稳定值,而实验1中的参数收敛相对缓慢,并且收敛值在不断变化。
表2实验1中的实验参数值(利用传统的人工势场控制方法)
参数 | d | r | a | b | c | h | ∈ | c<sub>1</sub> |
数值 | 7.0 | 8.4 | 5.0 | 5.0 | 4.5 | 0.2 | 0.1 | 0.2 |
表3实验2中的实验参数值(利用本发明的集群控制方法)
参数 | r<sub>s</sub> | r<sub>c</sub> | α | β | ∈ | κ<sub>1</sub> |
数值 | 1.0 | 8.4 | 51 | 151 | 1.0 | 0.2 |
综上,本发明所提出的多智能集群控制方法可以有效地实现多无人机系统从无序到有序运动的快速转变。而且,本方法的参数数量明显少于传统人工势场集群控制方法的参数数量。这意味着本发明仅仅通过一个简单的分布密度就可以有效地避免复杂的经验场的构造,因此将具有更为广阔的应用前景。
下面为了证明本发明所提出的集群控制方法的可扩展性,给出六组针对不同无人机数量的扩展实验。
同样地,这几组实验的初始位置和速度也是根据均匀分布随机选择,即初始位置和速度满足qi~U([10,10]T,[90,90]T)和pi~U([0,0]T,[5,5]T)。这六组实验的无人机数量分别为50,100,150,200,250和300。在这些实验中,给定目标是固定的。图12展示了这六组实验的序参数变化曲线。可以看出,这些实验的聚集半径是逐渐减小的,最终收敛到它们各自的稳定值(参见图11(a))。而且可以发现无人机数量越多,收敛速度越快。这是因为无人机的初始区域是固定的,随着无人机数量的增大,无人机群的分布密度也逐步增大。此外,还可以很容易得到,无人机的数量越多,最终聚集半径的稳定值就越大。另外,如图12(b)所示,这些实验的平均迁移速度也可以迅速增加到1,而且各实验之间的平均迁移速度的演变差异也很小,基本相同。同时,本发明还给出了针对300个无人机的集群控制的仿真示例,如图13所示。显然,即使对于更多的无人机,本发明所提出的集群控制方法也可以实现无人机群从无序到有序的快速转换,并最终收敛到平衡构型。可见,本发明具有较强的群体规模扩展能力。
最后给出两个仿真示例,以说明本发明所提出的方法在目标跟踪中的控制效率。在仿真中,让实验1和实验2来分别表示这两个不同的仿真示例。在这两个实验中,无人机的初始状态也是根据均匀分布随机选择的,并且为各个实验分别设定不同的目标运动特性。如图14所示,实验1中的目标是做匀速圆周运动的,实验2中的目标由随机力控制的,可以看出,本发明所提出的集群控制方法可以实现无人机群对给定目标的实时动态跟踪。最重要的是,在整个跟踪过程中,聚合半径R始终保持不变,而且平均迁移速度也一直保持不变。这表明,一旦所有无人机形成了稳定构型后,该平衡状态将不会在整个跟踪过程中改变。
综上,本发明提出了一个简单而通用的用于大规模自主无人机的分布式集群控制的设计和分析的理论框架。本方法展现了由物理化学启发的分散和排斥作用所引起的群体行为,所提出的框架的主要创新性在于通过引入虚拟电子来构建势能泛函,避免了传统社会力模型和人工势场模型需要设计复杂的经验场。上述分析表明,本发明所提出的分布集群控制律可以确保无人机从混沌运动渐近收敛到一个稳定的平衡构型,同时保证所有无人机逐渐趋于一个共同的运动速度,换言之,本发明可以使具有双积分二阶质点特性的多无人机系统形成时间渐近集群。综上,本发明为探索形成群体行为的驱动机制提供了一个全新的视角,并为针对多无人机系统的集群控制律的设计和分析提供了一个简单而又通用的理论框架。
对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以对本发明的实施例作出若干变型和改进,这些都属于本发明的保护范围。
Claims (7)
1.一种受物理化学启发的多智能体集群控制方法,其特征在于,包括如下步骤:
步骤一:将智能体抽象为具有虚拟电子分布的单原子分子模型,建立虚拟电子的概率密度分布函数;
步骤二:通过模拟非极性粒子间的色散和排斥相互作用,引入步骤一中建立的虚拟电子的概率密度分布函数来构筑势能泛函;
步骤三:基于步骤二中构筑的势能泛函建立非孤立质点系的拉格朗日方程,通过求解所述拉格朗日方程得到集群控制律,同时导出智能体群的集群动力学,并引入移动坐标系的概念,将集群动力学转换为平移动力学和结构动力学;
步骤四:引入耗散结构理论评估步骤三中得到的集群控制律是否具有将初始混乱的智能体群控制到一个稳定的有序结构的潜能。
2.根据权利要求1所述的方法,其特征在于,步骤一具体过程为:
假设虚拟电子的径向分布密度ρ服从高斯分布,即ρ~N(μ,σ2),N为高斯分布符号,μ表示均值,σ表示方差,将rc=μ+3σ作为高斯曲线截断半径,取均值μ=rs,方差σ=(rc-rs)/3,所建立的虚拟电子的概率密度分布函数为:
3.根据权利要求1所述的方法,其特征在于,步骤二具体过程如下:
通过模拟非极性粒子间的相互作用,设计如下三种交互机制:当两个智能体相距较远时,两者之间没有相互作用;当两个智能体相互靠近时,两者产生色散作用;当两个智能体无限靠近时,两者之间产生排斥作用,
将智能体的势能泛函定义为色散势能泛函和排斥势能泛函之和:
其中,为智能体i的势能泛函,为智能体i的位置坐标,为智能体i的色散势能泛函,为智能体i的排斥势能泛函,为智能体i的归一化虚拟电子密度分布函数,为智能体j的位置坐标,||·||表示欧式范数,智能体i和智能体j具有相同的归一化虚拟电子密度分布函数,即
假设智能体i和智能体j之间的色散作用与两者相对距离rij的一次方有关,而排斥作用与两者之间的相对距离rij的二次方有关,则智能体i的色散势能泛函和智能体i的排斥势能泛函分别定义为:
其中,Γ表示智能体i的运动路径;α,β>0分别为色散作用和排斥作用的强度系数;nij=(qj-qi)/||qj-qi||为单位方向向量;Ni={j:||qj-qi||<rc}为智能体i的邻居集;为保证积分有界和消除欧式范数||z||-m,m=1,2,在变量z=[0,0]T的奇点,定义一个称之为σ-范数的非负映射,即其中,ε>0;
将智能体的势能泛函(2)转换为标量形式,得到智能体i和智能体j双体势能泛函:
4.根据权利要求3所述的方法,其特征在于,步骤三中,基于步骤二中构筑的势能泛函建立非孤立质点系的拉格朗日方程,通过求解所述拉格朗日方程得到集群控制律,具体过程如下:
考虑一个由n个智能体构成的多智能体系统在二维欧式空间中进行群体运动,其中每个智能体满足如下动力学特性:
其中,pi为智能体i的速度坐标,ui为智能体i的控制输入,
智能体i和智能体j相邻,两者之间具有如下作用强度:
aij=1-φ(||qj-qi||),j∈Ni,j≠i (8)
其中,aij为相邻智能体i和智能体j之间的作用强度,Ni={j:||qj-qi||<rc}为智能体i的邻居智能体集合,函数φ(||qj-qi||)是一个具有正弦衰减特性的S型函数,
智能体之间的相互作用用拉格朗日函数来描述:
Li=Vi-Ti (10)
其中,Li为智能体i的拉格朗日函数;Ti=mipi Tpi/2为智能体i的动能,mi为智能体i的质量,
智能体除了受到体系内部的相互作用,还受到体系外部的作用力,用非孤立质点系的拉格朗日方程来描述智能体的运动特性
其中,Fi ext是作用在智能体i上的外力,t为时间,
求解方程(11),得到:
作用在智能体i上的外力Fi ext为:
式(14)中,第一项是充当摩擦作用的阻尼力,pj为智能体j的速度坐标;第二项[κ1(qt-qi)+κ2(pt-pi)]是相对于群跟踪目标的导航反馈力,其中,qt和pt分别是群跟踪目标的位置和速度,κ1,κ2>0为比例系数,
将式(14)代入式(12),得到受物理化学驱动的集群控制律:
其中,梯度项用于表征体系内部的交互作用,其用于使体系内的智能体形成相对紧密和稳定的几何群;速度协调项用于保证使智能体之间的相对速度差为0;导航反馈项[κ1(qt-qi)+κ2(pt-pi)]用于使智能体群在满足速度约束的同时无差地跟踪给定的群跟踪目标,
其中,梯度项和速度协调项是实现时间渐近群的充要条件,导航反馈项能够放宽体系的初始状态,避免智能体群出现碎片结构。
5.根据权利要求4所述的方法,其特征在于,步骤三中,导出智能体群的集群动力学,并引入移动坐标系的概念,将集群动力学方程组转换为平移动力学和结构动力学,具体过程为:
一群应用集群控制律(15)的自主智能体群的集群动力学表示为
其中,q1,...,qn分别为n个智能体的位置坐标,p1,...,pn分别为n个智能体的速度坐标;是平滑的质点系势能函数;是二维拉普拉斯矩阵,I2为2阶单位矩阵;为克罗内克积;f(q,p,qt,pt)是导航反馈矩阵,
智能体i和j的相对位移和相对速度为
将集群动力学(16)转换为实际参考坐标系下的平移动力学(21)和移动坐标系下的结构动力学(22):
6.根据权利要求5所述的方法,其特征在于,步骤四具体过程为:
所述多智能体系统形成耗散结构的三个基本条件为:所述多智能体系统是开放系统;所述多智能体系统处于远离热平衡的状态;以及所述多智能体系统中各个子系统之间存在着非线性相互作用;
集群控制律满足所述三个基本条件,就具备从无序向有序转变的潜能。
7.一种根据权利要求1-6之一所述方法的应用,其特征在于,所述方法应用于机器人群和无人机群的集群控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011016117.0A CN112083738B (zh) | 2020-09-24 | 2020-09-24 | 一种受物理化学启发的多智能体集群控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011016117.0A CN112083738B (zh) | 2020-09-24 | 2020-09-24 | 一种受物理化学启发的多智能体集群控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112083738A CN112083738A (zh) | 2020-12-15 |
CN112083738B true CN112083738B (zh) | 2021-09-21 |
Family
ID=73738843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011016117.0A Active CN112083738B (zh) | 2020-09-24 | 2020-09-24 | 一种受物理化学启发的多智能体集群控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112083738B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113146624B (zh) * | 2021-03-25 | 2022-04-29 | 重庆大学 | 基于最大角聚集策略的多智能体控制方法 |
CN113128107B (zh) * | 2021-04-07 | 2022-05-13 | 杭州电子科技大学 | 一种基于构造定正Liapunov函数的单种群平衡系统及方法 |
CN117850437B (zh) * | 2024-03-08 | 2024-05-14 | 北京航空航天大学 | 智能体集群运动控制方法和相关产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101825901A (zh) * | 2010-03-31 | 2010-09-08 | 北京航空航天大学 | 基于人工物理法的多智能体机器人协同控制方法 |
CN107367944A (zh) * | 2017-09-04 | 2017-11-21 | 贾永楠 | 一种面向多智能体系统的集群控制方法 |
CN110096073A (zh) * | 2019-04-18 | 2019-08-06 | 北京航空航天大学 | 仿信鸽智能行为的超大规模无人机集群控制系统及方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6904335B2 (en) * | 2002-08-21 | 2005-06-07 | Neal Solomon | System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system |
US9146561B2 (en) * | 2013-12-03 | 2015-09-29 | King Fahd University Of Petroleum And Minerals | Robotic leader-follower navigation and fleet management control method |
CN110275527B (zh) * | 2019-05-29 | 2022-02-11 | 南京航空航天大学 | 一种基于改进拟态物理法的多智能体系统运动控制方法 |
CN110865653B (zh) * | 2019-12-02 | 2022-09-13 | 西北工业大学 | 一种分布式集群无人机队形变换方法 |
-
2020
- 2020-09-24 CN CN202011016117.0A patent/CN112083738B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101825901A (zh) * | 2010-03-31 | 2010-09-08 | 北京航空航天大学 | 基于人工物理法的多智能体机器人协同控制方法 |
CN107367944A (zh) * | 2017-09-04 | 2017-11-21 | 贾永楠 | 一种面向多智能体系统的集群控制方法 |
CN110096073A (zh) * | 2019-04-18 | 2019-08-06 | 北京航空航天大学 | 仿信鸽智能行为的超大规模无人机集群控制系统及方法 |
Non-Patent Citations (6)
Title |
---|
A Voronoi Diagram-Based Workspace Partition;JEONGEUN KIM;《IEEE》;20200127;全文 * |
基于拟态物理法的无人机集群与重构控制;沈林成等;《中国科学:技术科学》;20170320(第03期);全文 * |
基于虚拟群集中心的局部信息下多移动机器人编队控制研究;史骏;《机电工程》;20170820(第08期);全文 * |
多无人机分布式协同编队飞行控制技术研究;薛瑞彬;《中国博士学位论文全文数据库 工程科技Ⅱ辑》;20180615;全文 * |
多智能体多目标跟踪算法研究;罗小元等;《控制工程》;20080720(第04期);全文 * |
鸽群运动模型稳定性及聚集特性分析;罗琪楠等;《中国科学:技术科学》;20190620(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112083738A (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112083738B (zh) | 一种受物理化学启发的多智能体集群控制方法 | |
Chen et al. | Modified central force optimization (MCFO) algorithm for 3D UAV path planning | |
Barnes et al. | Unmanned ground vehicle swarm formation control using potential fields | |
Zhang et al. | Trajectory generation by chance-constrained nonlinear MPC with probabilistic prediction | |
Yan et al. | Collision-avoiding flocking with multiple fixed-wing uavs in obstacle-cluttered environments: A task-specific curriculum-based madrl approach | |
Kumar et al. | Emergent formations of a Lagrangian swarm of unmanned ground vehicles | |
Liang et al. | Bio-inspired self-organized cooperative control consensus for crowded UUV swarm based on adaptive dynamic interaction topology | |
Hongbo et al. | Lateral control of autonomous vehicles based on learning driver behavior via cloud model | |
Fernando | Online flocking control of UAVs with mean-field approximation | |
CN111007848B (zh) | 一种基于有界空间的多智能体协同作业控制方法 | |
Wei | A new formation control strategy based on the virtual-leader-follower and artificial potential field | |
He et al. | Neural network-based velocity-controllable UAV flocking | |
Zhang et al. | Levenberg-Marquardt based artificial physics method for mobile robot oscillation alleviation | |
Sun et al. | A physicochemically inspired approach to flocking control of multiagent system | |
Ivancevic et al. | Hamiltonian dynamics and control of a joint autonomous land–air operation | |
Sun et al. | A survey of cooperative path planning for multiple UAVs | |
Son et al. | Lennard-jones potential field-based swarm systems for aggregation and obstacle avoidance | |
Wang et al. | Adaptive spacing policy design of flocking control for multi-agent vehicular systems | |
Xue et al. | The influence of intra-group differences on the flocking and obstacle avoidance movement of multiagent systems | |
Xiong et al. | Compact and ordered swarms of unmanned aerial vehicles in cluttered environments | |
Cheung et al. | A supervised particle swarm algorithm for real-parameter optimization | |
Banerjee et al. | A step toward learning to control tens of optically actuated microrobots in three dimensions | |
Palm et al. | Velocity potentials and fuzzy modeling of fluid streamlines for obstacle avoidance of mobile robots | |
Parzani et al. | On a three dimensional vision based collision avoidance model | |
Zheng et al. | Multi-Robot-Guided Crowd Evacuation: Two-Scale Modeling and Control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |