CN102215260B - 一种具有连通性保持的多智能体系统协同控制方法 - Google Patents

一种具有连通性保持的多智能体系统协同控制方法 Download PDF

Info

Publication number
CN102215260B
CN102215260B CN 201110147349 CN201110147349A CN102215260B CN 102215260 B CN102215260 B CN 102215260B CN 201110147349 CN201110147349 CN 201110147349 CN 201110147349 A CN201110147349 A CN 201110147349A CN 102215260 B CN102215260 B CN 102215260B
Authority
CN
China
Prior art keywords
subsystem
intelligent body
supporter
intelligent
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110147349
Other languages
English (en)
Other versions
CN102215260A (zh
Inventor
方浩
窦丽华
曹虎
陈杰
刘华罡
孙巍
由佳
贾睿
李路
孙腾
王强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN 201110147349 priority Critical patent/CN102215260B/zh
Publication of CN102215260A publication Critical patent/CN102215260A/zh
Application granted granted Critical
Publication of CN102215260B publication Critical patent/CN102215260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种具有连通性保持的多智能体系统协同控制方法,多智能体系统开始运动后,在任意时刻t,当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时,根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统,并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者,领航子系统中的领导者称为虚拟领航者,伴随子系统中的领导者称为伴随者,在虚拟领航者与每个伴随者之间建立长程连接;各智能体根据自身的角色确定σi(t)的值,采用控制率的表达式对自身实时控制。本发明解决了目前多智能体系统协调控制方法中无法保持连通性的问题。

Description

一种具有连通性保持的多智能体系统协同控制方法
技术领域
本发明涉及一种基于人工势能函数的兼具连通性保持的多智能体分布式协同控制方法,属于智能机器人技术领域。
背景技术
近年来,多智能体系统的分布式运动协调控制与应用受到日益广泛的关注,逐渐成为复杂性科学研究的一个焦点问题。其中各智能体仅利用局部信息进行交互,并结合通信等手段发挥分布式资源的优势实现整体规划、解决局部冲突,从而达到整体预期目标。多智能体系统作为一门综合性交叉学科,其在工业和军事等应用领域均具有广泛的应用前景和重要的理论研究价值。
在多智能体系统中,智能体利用自身配置的多种传感器和执行器来感知环境并对环境的变化做出适当的反应,而整个多智能体系统在某种程度上可以视为一个移动传感器网络和执行器网络;同时,整个多智能群体在协同操作过程中通过自身所配备的通信设备进行信息交互和共享,使得整个系统在某种程度上又成为一个通信互联网络,因此合理的通信网络结构是多智能体系统进行分布式协调控制的重要保障。
其中,网络的通信连通性保持是多智能体网络拓扑控制中最基础和最重要的问题之一,特别是在障碍物环境或群体受到外扰的情况下,网络连通性的保持更为重要,其直接影响到整个群体系统的稳定性和算法的收敛性;而且,由于通信连通性是描述网络通信拓扑结构的全局特征量,而单个智能体只能获取有限范围的网络拓扑信息,其对网络的全局拓扑估计存在本质局限性,从而导致网络局部连通性与全局连通性并不等价。因此网络的通信连通性保持是多智能体系统的分布式运动协调控制中非常重要的一个环节。
然而,由于单个智能体受到功能设计和硬件条件等因素的制约,其自身所配置的传感器传播和感应信息能力范围R十分有限,单个智能体与群体中最近智能体之间的距离超过一定范围R时,该单个智能体失去了与群体的联络,网络连通性被破坏。
目前对网络连通性保持的研究中,通常人为割裂通信连通性保持和分布式运动协调控制之间的联系,缺乏将连通性作为约束条件与具体的协同控制任务的目标相结合的综合控制方案。
发明内容
有鉴于此,本发明是为解决目前多智能体系统协调控制方法中无法保持连通性的问题,提供了一种基于人工势能函数的兼具连通性保持功能的多智能体分布式协同控制方法,能够兼顾通信连通性保持和智能体运动协调控制,使系统在演化的过程中始终保持通信拓扑的连通性的同时达到预期的控制目标。
该方案是这样实现的:
通过对智能体系统的研究分析注意到,虽然在实际中不能保证系统通信网络的初始连通性,但系统肯定存在初始连通的子系统,但子系统的初始连通并不能保证其在演化过程中始终保持连通。首先,将这些连通子系统按照一定的规则分为领航子系统和伴随子系统,领航子系统中随机选择一个领航者,从伴随子系统中随机选择一个伴随者,在领航者和每个伴随者之间建立一个或若干个长程连接,接着设计领航-伴随势能函数作用于领航者和伴随者,使得彼此不相连的子系统联合起来,形成一个凝聚的连接群体。为了使初始连通的子系统和连通融合之后的完整系统在网络演化的过程中始终保持连通,又设计连通系统内的势能函数来防止相互连通的智能体移动到它们的感知范围之外。最后,将这两个势能函数应用到控制规则中就可以使群体系统同时达到保持网络连通性和获得稳定队形的目的。
具体来说,本发明提供了一种具有连通性保持的多智能体系统分布式协同控制方法,适用于采用双积分连续时间模型描述的智能体所构成的多智能体系统;该方法包括如下步骤:
步骤一:设计群集控制规则:
①设任意时刻,多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统,连通子系统为单个智能体或为彼此连通的至少2个智能体组成的集合;其中一个连通子系统定义为领航子系统,其他连通子系统定义为伴随子系统;从领航子系统中推举出一个虚拟领航者,从每个伴随子系统中推举出一个伴随者;在虚拟领航者和每个伴随者之间建立长程连接,所述长程连接采用远程短时通讯手段;每个连通子系统内部的各智能体之间采用内部连接彼此连通,该内部连接采用近距离持续通讯手段,其允许的感应信息能力范围为R;
②设计所述长程连接的势能函数和所述内部连接的势能函数;
设Vil表示虚拟领航者l与作为伴随者的智能体i之间的长程连接势能函数,Vij表示连通子系统内智能体i和智能体j之间的内部连接势能函数;
Vil的设计满足如下条件:Vil是||xil||的函数,||xil||为长程连接两端虚拟领航者l与伴随者之间的相对距离;当||xil||为d时,Vil的值最小;当||xil||趋近0或者无穷大时,Vil的值趋于无穷大;并且考虑,当||xil||从0向d变化时,Vil的变化率为负;当||xil||从d向无穷大变化时,Vil的变化率为正;其中,d是预设的智能体系统中彼此连通智能体间的期望距离;
Vij的设计满足如下条件:Vij是||xij||的函数,||xij||为内部连接两端智能体i和智能体j之间的相对距离;当||xij||大于R时,Vij的值为常数;当||xij||等于0或R时,Vij的值趋于无穷;当||xij||达到d时,Vij达到最小;并且考虑,当||xij||从0向d变化时,Vij的变化率为负;当||xij||从d向R变化时,Vij的变化率为正;
③结合两个势能函数设计智能体的控制率;
因为要求所有智能体在保持期望队形的同时达到一致的速度,则期望智能体i和j之间的相对速度趋近于0,并且期望智能体i和j之间的相对距离趋近于d,则智能体i的控制率ui设计如下:
u i = σ i ( t ) [ - ▿ | | x il | | V il - ( v i - v l ) + v · l ]
- Σ j ∈ N i ( t ) ▿ | | x ij | | V ij - Σ j ∈ N i ( t ) ( v i - v j )
其中,
Figure BDA00000657489400043
表示对“·”求“”的偏导,Ni(t)是在t时刻与智能体i通过内部连接通信的所有通信邻居集合;σi(t)表示角色选择因子,当智能体i为伴随者时,σi(t)=1,当智能体i为非伴随者时,σi(t)=0;vi,vj,vl分别为智能体i、j和虚拟领航者的实时速度;
步骤二:多智能体系统开始运动后,在任意时刻t,当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时,根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统,并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者,领航子系统中的领导者称为虚拟领航者,伴随子系统中的领导者称为伴随者,在虚拟领航者与每个伴随者之间建立长程连接;各智能体根据自身的角色确定σi(t)的值,采用控制率ui的表达式对自身实施控制;并且,各伴随者实时监测自身与虚拟领航者之间的距离,当伴随者a与虚拟领航者与之间的距离超过R时,保持伴随者a与虚拟领航者之间的长程连接,否则,取消伴随者a与虚拟领航者之间的长程连接,以及虚拟领航者和伴随者的角色扮演。
较佳地,该方法进一步包括,设置一个权值因子系数aij(t),aij(t)是一个非负实数,它表示在t时刻,智能体j传递给智能体i的信息的权值因子,如果没有信息的传递,则aij(t)=0,否则aij(t)=1,并引入滞后阈值为δ的滞环:
Figure BDA00000657489400044
则控制率ui进一步考虑aij(t),其变形为:
u i = σ i ( t ) [ - ▿ | | x il | | V il - ( v i - v l ) + v · l ]
- Σ j ∈ N i ( t ) ▿ | | x ij | | V ij - Σ j ∈ N i ( t ) [ a ij ( t ) · ( v i - v j ) ] .
有益效果:
本发明针对具有双积分动态特性的多移动智能体系统,研究系统协同群集行为。在速度一致性协议和多智能体交互网络基础上设计分布式协同群集控制规则,该群集控制规则简单表述为长程连接、两个势能函数和一个控制率。两个势能函数分为领航-伴随势能函数(即长程连接的势能函数)和连通系统内的势能函数(即内部连接的势能函数)。长程连接使不同子系统之间能快速建立连接,是不同子系统渐近运动的基础和关键,长程连接是临时的,一旦不同子系统渐近融合之后,则取消这些长程连接。当初始系统为彼此不相连的子系统,随机选择的领航者和伴随者同时作用在两个势能函数之下,而未被选择的智能体则只作用在连通系统内的势能函数之下,从而保证不同子系统在渐近运动融合的同时,子系统始终保持连通。当所有的子系统渐近运动融合为一个连通的完整系统后,所有的智能体全部作用在连通系统内的势能函数之下,使群体系统达到保持网络连通性的同时获得预期群集运动的目标。
其次,本发明在控制率计算中设计了权值因子系数aij(t)并引入滞环,在aij(t)的控制下,智能体在连通子系统的边缘时,能够通过内部连接尽快拉回连通子系统,而尽量减少长程连接的使用,从而减少智能体的能源消耗。
本发明的预期研究成果可以为通信连通性约束下多智能体系统协同区域探索与覆盖,编队控制,群集运动,路径规划和任务分配等典型应用任务的决策与控制问题提供解决之道。
附图说明
图1-具有连通性保持功能的多智能体协同控制示意图;
图2-动态邻接矩阵A(t);
图3-主导-伴随势能函数;
图4-APF连通性保持;
图5-与Tanner等算法的对比仿真实验图;
图6-在式(6)控制率下多智能体群集运动仿真实验图。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
稳定的群集运动是指所有智能体渐近达到一致的速度,智能体相互之间避免碰撞,并且最终系统的紧凑结构可以使所有智能体的势能最小,此时系统称为稳定的群。
考虑一个具有N个智能体的多智能体系统在n维欧式空间中移动,双积分动态特性的智能体具有质点动态特性。系统的一个双积分连续时间模型描述如下:
x · i = v i ( 1 )
m v · i = u i i = 1,2 , . . . N
其中
Figure BDA00000657489400064
是智能体i的位置向量,
Figure BDA00000657489400065
是智能体i的速度向量,mi>0是智能体i的质量并假设各智能体质量相同,是作用于智能体i的控制输入。智能体i和智能体j之间的相对位置向量表示为xij=xi-xj
接着介绍本发明中使用的人工势能方法。
人工势能法在是智能体的运动空间中创建了一个势能。该势能由两部分组成:一个是引力场UA,随着智能体和目标点的距离增加而单调递增,且方向指向目标点;另一个是斥力场UR,在智能体处在障碍物位置时有一极大值,并随着智能体与障碍物距离的增大而单调减小,方向指向远离障碍物方向。整个势能是其引力部分和斥力部分的叠加。
假设智能体在二维空间中运动,则坐标为q的智能体在势能作用下,所受的力F(q)是U(q)的负梯度,如式(3)
F ( q ) = F A ( q ) + F R ( q ) = - ▿ U ( q ) - - - ( 3 )
这个合力决定了智能体的运动。
通过控制智能体受力的方向和大小可以实现对智能体的运动的控制。
如图1所示,该方法包括如下步骤:
步骤一:设计群集控制规则:
(1)设任意时刻,多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统(可参见图6(a)的示意),连通子系统为单个智能体或为彼此连通的至少2个智能体组成的集合;其中一个连通子系统定义为领航子系统,其他连通子系统定义为伴随子系统;从领航子系统中推举出一个虚拟领航者,从每个伴随子系统中推举出一个伴随者;在虚拟领航者和每个伴随者之间建立长程连接,所述长程连接采用远程短时通讯手段,例如采用GPS卫星通讯,移动通信网络;每个连通子系统内部的各智能体之间采用内部连接彼此连通,该内部连接采用近距离持续通讯手段,其允许的感应信息能力范围为R,该内部连接就是智能体之间相互感知所采用的通信手段。
(2)为内部连接设计一个连通系统内的势能函数。
在包含N个智能体的群中,令||xij||(为了简化,只考虑二维的情况)表示智能体i和j的相对距离,智能体i和它的连通邻接集Ni中的智能体j之间的相互作用通过内部连接的人工势能函数Vij来描述。其中,Ni表示与智能体i通过内部连接进行彼此连通的所有通信邻居的集合。由于不允许自环,所以
Figure BDA00000657489400071
为了实现群集运动的避碰性指标,要求当智能体i和j的距离很近时,Vij趋于无穷大,表现为很强的排斥力;为了实现连通性保持的目标,要求当智能体i和j距离将要超出感知半径R时,Vij也趋于无穷大,表现为很强的吸引力;而为了实现群集运动队形收敛的指标,要求当距离达到队形的稳定距离d时,Vij存在唯一的极小值。
因此人工势能函数Vij是一个关于距离||xij||非负的,分段连续的在(0,R)上可微的径向无界函数,并满足以下条件:
1)当||xij||→0或||xij||→R时,Vij→∞,
2)当达到预定距离d时,Vij达到最小。
3)当内部连接两端的距离大于R时,Vij的值为常数;
4)并且考虑,当内部连接两端的距离从0向d变化时,Vij的变化率为负,表示斥力;当内部连接两端的距离从d向R变化时,Vij的变化率为正,表示吸力。其中,d是预设的智能体系统中彼此连通智能体间的期望距离。
本实施例中,Vij的设计如下:
V ij ( | | x ij | | ) = ( 1 | | x ij | | - 1 d ) c 1 1 ( R 2 - | | x ij | | 2 ) c 2 0 ≤ | | x ij | | ≤ R c | | x ij | | > R - - - ( 4 )
其中,c1,c2,c均为常数,C1≥2,c2≥1并且c≥0。Vij的曲线如图4所示。
这个势能函数与Tanner等提出的函数主要的不同在于当智能体i和j的距离趋近于感知半径R时,Vij趋于无穷,这可以保证保留所有的已有连接。另外从式(5)可以得知集体的势能在期望距离d处达到最小。因此本发明提出的连通系统内的势能函数可以使初始连通子系统在伴随领航子系统融合的过程中始终保持连通,同时可以使融合之后的完整系统保持网络连通性,从而使得整个系统保持连通性的同时达到稳定的结构。
(3)为长程连接设计一个领航-伴随人工势能函数。
伴随者在领航-伴随人工势能的作用下渐近向SSL(t)运动,从而帮助整个群体最终连接。长程连接使不同子系统之间能快速建立连接,是不同子系统渐近运动的基础和关键,长程连接是临时的,一旦不同子系统渐近融合之后,则取消这些长程连接,即对于伴随者a来说,当虚拟领航者与伴随者a之间的距离超过近距离持续通讯允许的感应信息能力范围R时,保持虚拟领航者与伴随者a之间的长程连接,否则,取消虚拟领航者与伴随者a之间的长程连接。
Vil表示虚拟领航者l和伴随者i之间的领航-伴随人工势能函数,Vil的设计满足如下条件:Vil是||xij||的函数,||xij||为长程连接两端虚拟领航者l与伴随者之间的相对距离;当长程连接两端的距离||xij||为d时,Vil的值最小;当长程连接两端的距离||xil||趋近0或者无穷大时,Vil的值趋于无穷大;并且考虑,当长程连接两端的距离||xil||从0向d变化时,Vil的变化率为负,表示斥力;当长程连接两端的距离||xil||从d向无穷大变化时,Vil的变化率为正,表示吸力。
本实施例中,领航-伴随人工势能函数Vil的设计如下:
V il ( | | x il | | ) = k ( d | | x il | | + 1 n | | x il | | ) - - - ( 5 )
其中,
Figure BDA00000657489400092
e为自然对数的底数,。很容易知道,Vil几乎处处连续可微,并当||xij||=d时有唯一的全局最小值k(1+ln d)。Vil曲线图如图3所示。
在网络理论中,将长程连接引入通信拓扑网络,能极大地提高系统的同步合作能力。一方面在复杂网络中引入一些长程连接会产生所谓的小世界效应,小世界效应在降低平均路径长度和增强网络聚类性质方面带来一些显著的好处;另一方面,从技术角度讲,长程连接易于实施在典型的多智能体系统中,例如漫步移动智能体群。因此,本发明将长程连接网络理论引入进来,形成一种新的模型。这种新的模型能利用几乎相同的通信半径,使彼此不连接的群体连接起来或者使已有群连接变得更加稳固。
(4)结合两个势能函数设计控制率。
因为要求所有智能体在保持期望队形的同时达到一致的速度,则期望智能体i和j之间的相对速度趋近于0即vij(t)→0,并且期望智能体i和j之间的相对距离趋近于d即
Figure BDA00000657489400093
V表示多智能体系统的集合;则智能体i的控制率ui设计如下:
u i = σ i ( t ) [ - ▿ | | x il | | V il - ( v i - v l ) + v · l ]
( 6 )
- Σ j ∈ N i ( t ) ▿ | | x ij | | V ij - Σ j ∈ N i ( t ) ( v i - v j )
其中,
Figure BDA00000657489400097
表示对“·”求“”的偏导;Ni(t)是在t时刻与智能体i通过内部连接通信的所有通信邻居集合;σi(t)表示角色选择因子,当智能体i为伴随者时,σi(t)=1,当智能体i为非伴随者时,σi(t)=0;vi,vj,vl分别为智能体i、j和虚拟领航者的实时速度。
根据控制率ui对各智能体实施控制,可以实现智能体受力大小和方向的控制,由于智能体的质量不变且相互相等,因此控制率ui控制可以简单地理解为智能体加速度a的控制。
在实际中,为了使得智能体在连通子系统的边缘时,能够通过内部连接尽快拉回连通子系统,而尽量减少长程连接的使用,从而减少智能体的能源消耗,因此本发明设置一个权值因子系数aij(t),aij(t)是一个非负实数,它表示在t时刻,智能体j传递给智能体i的信息的权值因子,如果没有信息的传递,则aij(t)=0,否则aij(t)=1,并引入滞环,aij(t)的取值表达式为:
Figure BDA00000657489400101
其中,0<δ<R是一个固定的滞后阈值。由图2可以看出在A(t)中引入了滞环,这对于保持网络拓扑结构是非常重要的。所有的aij(t)构成了一个邻接矩阵A(t),A(t)=[aij(t)]N×N用来表示通信拓扑图的结构特征。
在考虑aij(t)的情况下,则控制率ui变形为:
u i = σ i ( t ) [ - ▿ | | x il | | V il - ( v i - v l ) + v · l ]
( 6 - 1 )
- Σ j ∈ N i ( t ) ▿ | | x ij | | V ij - Σ j ∈ N i ( t ) [ a ij ( t ) · ( v i - v j ) ]
步骤二:多智能体系统开始运动后,根据公式(6)或(6-1)对自身实施控制。
第1步:在任意时刻t,当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时,根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统,并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者,领航子系统中的领导者称为虚拟领航者,伴随子系统中的领导者称为伴随者,在虚拟领航者与每个伴随者之间建立长程连接,这个长程连接是临时的,长程连接的数目可以是若干条。
本步骤中,在t可能为多智能体系统开始运动的初始时刻,也可以是多智能体系统运动过程中。
对于t可能为多智能体系统开始运动的初始时刻的情况:
智能体上电后,通过广播与其他智能体通信并接收其他智能体返回的响应并建立连接,该连接为所述内部连接;对于相互之间有内部连接的群体构成了连通子系统;连通子系统内部各智能体通过相互通信推举一个领导者,领导者推举策略可以为随机选取,或者为根据智能体的位置选取,例如距离其他连通子系统最近的智能体作为领导者。各连通子系统的领导者之间通过长程连接通信,推举虚拟领航者,领航者的推举策略可以为随机选取,或者为根据连通子系统中智能体的数量选取(例如数量最多的智能体为领航子系统,其领导者就是虚拟领航者),或者根据领导者的前后位置选取(例如位置最靠前的领导者作为虚拟领航者),那么除领航者之外的所有领导者都为伴随者。确定领航者和伴随者后,在虚拟领航者与每个伴随者之间建立长程连接。
在另一个实施例中,还可以在智能体上电后,通过GPS定位方式确定各智能体的位置,从而得知连通子系统的划分,每个连通子系统内部随机选取一个领导者,或者根据GPS定位信息将每个连通子系统中位置最前者选为领导者,领导者中最靠前者为虚拟领航者,在虚拟领航者与每个伴随者之间建立长程连接。
在实际中,本建立长程连接的过程可以有很多种,不仅限于上述两种实施方式,这里不一一举例。
对于t可能为多智能体系统运动过程中的情况:
多智能体系统在运动过程中初始为一个连通系统,各智能体在不断维护自身的邻居域Ni(t),当Ni(t)中的成员减少时,触发智能体通过广播与其他智能体通信,从而重新划分连通子系统,并重新推举领导者和伴随者,从而建立其长程连接。
第2步:各智能体根据自身的角色确定σi(t)的值,对于伴随者σi(t)=1,对于非伴随者σi(t)=0。各智能体确定当前时刻t自身对应的aij(t)。
第3步:利用公式(6)或(6-1)示出的控制率ui的表达式对自身实施控制。
第4步:各伴随者实时监测自身与虚拟领航者之间的距离,当伴随者a与虚拟领航者与之间的距离超过R时,保持伴随者a与虚拟领航者之间的长程连接,否则,取消伴随者a与虚拟领航者之间的长程连接,以及虚拟领航者和伴随者的角色扮演。这时所有智能体的σ=0。那么系统内所有的智能体只需利用连通系统内的势能函数,使得整个群体在运动的过程中始终保持连通。
循环执行上述步骤1~4,从而实现了智能体控制,产生稳定的群集运动。
最后通过实验结果对本发明进行进一步的阐述:
首先介绍本实验中使用的代数图论方法。
动态通信图G(t)={V,E(t)}是一个时变的无向图,由N个顶点的顶点集V={n1,n2,...,nN}和边集E(t)={(ni,nj)| ||xij(t)||<R}组成,顶点表示系统中的智能体,边集包含有邻居关系的顶点的无序对。用Ni={nj|(ni,nj)∈E(t)}表示智能体i的所有通信邻居。由于不允许自环,所以
Figure BDA00000657489400121
为了描述智能体之间的时变邻居关系,拓扑连通图的边集E(t)必须满足以下条件:
●初始链路E(0)={(ni,nj| ||xij(0)||<R,ni,nj∈V};
●如果在时刻t之前智能体i和j不是邻居,并且||xij(t)||<R-δ(0<δ<R),δ为预设的滞后阈值,那么在它们之间加入一条新的链路;
●如果||xij(t)||>R,那么从E(t)中删除链路(ni,nj);
为了清晰地展现实验结果,数值仿真中采用10个具有双积分动态模型的智能体,在二维平面上运动,智能体用点表示。初始速度、位置和连接任意给定,但必须满足以下约束:
所有的初始位置在一个半径R=12m的圆形区域内,邻接图由一个随机生成的0-1邻接矩阵来描述。
初始速度幅值和方向任意选定,幅值限制在[0-5]m/s。
所有智能体有相同的质量1kg。
此外,智能体的感知半径R=6m,期望距离d=4m,切换阈值δ=0.7m,仿真共运行100s。假设在初始时间t0=0s有两个子系统,在较大的子系统中随机选择虚拟领航者,在其它子系统中随机选择伴随者,此时在虚拟领航者与伴随者之间建立长程连接。
图5给出了在初始连通的情况下,本发明提出的算法与Tanner等提出的算法的比较实验。图5(a)表示10个智能体的初始状态,智能体之间的邻居关系用实线表示,带箭头的实线表示了速度的方向。图5(b)和(c)分别给出了使用两种算法的系统最终状态。可以很明显的看出,Tanner等提出的没有连通性保持的算法,产生了系统分割,最终没能达到期望的群集运动。这主要是因为网络的初始连通,并不能保证在网络的演化过程中始终保持连通。相反,通过使用连通性保持算法APF,本发明所提出的控制率能使整个系统达到稳定的群移行为。
图6给出了在初始不连通的情况下本发明提出的算法实验。图6(a)表示10个智能体的初始状态,智能体之间的邻居关系用实线表示,带箭头的实线表示了速度的方向。图6(b)-(d)分别给出了在时刻t=30s,t=70s和t=120s时所有智能体的运动状态和结构,图6(e)给出了系统最终状态和运动轨迹。可以清楚的看到,通过在初始不连通的系统中加入长程连接,在控制率(6)下所有智能体渐近形成聚合的连接群集,最终获得期望的群集运动。
此外,为了研究系统滞后阈值δ的影响,还进行了δ=0.8和δ=0.3下的对比实验。可以发现,δ越小,最大超调量就越大,系统的上升时间越短。这是因为δ越小导致边缘条件更早产生,增强了网络的连通性,从而使得系统的上升时间越小。另一方面,δ越小也能产生更大的人工势能力,从而使系统超调量更大。因此,通过调整参数δ,可以在较小的超调量和较小的上升时间之间选择一个的权衡值。
而且,长程连接数目Ln对群集系统收敛存在着一定的影响,当Ln越大时,群体具有更快的收敛率和更牢固的最终结构。这是因为长程连接越多,系统的连通度越大,从而能通过相邻链路的帮助为整个群体传播外部参考信号。
可以清楚地看到,本发明算法利用人工势能函数(4)和(5)使得控制率(6)可以产生稳定的群集行为。因此可以得出结论,连通性的保持是不可或缺的,并且需要合理的设计带有连通性保持的势能函数来保证整个群的稳定性。
可见,本发明的群集控制规则简单表述为长程连接、两个势能函数和一个控制率。两个势能函数分为领航-伴随势能函数和连通系统内的势能函数。长程连接使不同子系统之间能快速建立连接,是不同子系统渐近运动的基础和关键,长程连接是临时的,一旦不同子系统渐近融合之后,则取消这些长程连接。当初始系统为彼此不相连的子系统,随机选择的领航者和伴随者同时作用在两个势能函数之下,而未被选择的智能体则只作用在连通系统内的势能函数之下,从而保证不同子系统在渐近运动融合的同时,子系统始终保持连通。当所有的子系统渐近运动融合为一个连通的完整系统后,所有的智能体全部作用在连通系统内的势能函数之下,使群体系统达到保持网络连通性的同时获得预期群集运动的目标。因此,两个势能函数分别作用在系统不同的运动状态下。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之。

Claims (3)

1.一种具有连通性保持的多智能体系统分布式协同控制方法,适用于采用双积分连续时间模型描述的智能体所构成的多智能体系统;其特征在于,该方法包括如下步骤:
步骤一:设计群集控制规则:
①设任意时刻,多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统,连通子系统为单个智能体或为彼此连通的至少2个智能体组成的集合;其中一个连通子系统定义为领航子系统,其他连通子系统定义为伴随子系统;从领航子系统中推举出一个虚拟领航者,从每个伴随子系统中推举出一个伴随者;在虚拟领航者和每个伴随者之间建立长程连接,所述长程连接采用远程短时通讯手段;每个连通子系统内部的各智能体之间采用内部连接彼此连通,该内部连接采用近距离持续通讯手段,其允许的感应信息能力范围为R;
②设计所述长程连接的势能函数和所述内部连接的势能函数;
设Vil表示虚拟领航者l与作为伴随者的智能体i之间的长程连接势能函数,Vij表示连通子系统内智能体i和智能体j之间的内部连接势能函数;
Vil的设计满足如下条件:Vil是||xil||的函数,||xil||为长程连接两端虚拟领航者l与伴随者之间的相对距离;当||xil||为d时,Vil的值最小;当||xil||趋近0或者无穷大时,Vil的值趋于无穷大;并且考虑,当||xil||从0向d变化时,Vil的变化率为负;当||xil||从d向无穷大变化时,Vil的变化率为正;其中,d是预设的智能体系统中彼此连通智能体间的期望距离;
Vij的设计满足如下条件:Vij是||xij||的函数,||xij||为内部连接两端智能体i和智能体j之间的相对距离;当||xij||大于R时,Vij的值为常数;当||xij||趋近于0或R时,Vij的值趋于无穷;当||xij||达到d时,Vij达到唯一的最小值;并且考虑,当||xij||从0向d变化时,Vij的变化率为负;当||xij||从d向R变化时,Vij的变化率为正;
③结合两个势能函数设计智能体的控制率;
要求所有智能体在保持期望队形的同时达到一致的速度,则期望智能体i和j之间的相对速度趋近于0,并且期望智能体i和j之间的相对距离趋近于d,则智能体i的控制率ui设计如下:
u i = σ i ( t ) [ - ▿ | | x il | | V il - ( v i - v l ) + v · l ]
- Σ j ∈ N i ( t ) ▿ | | x ij | | V ij - Σ j ∈ N i ( t ) ( v i - v j )
其中,表示对“·”求“*”的偏导,Ni(t)是在t时刻与智能体i通过内部连接通信的所有通信邻居集合;σi(t)表示角色选择因子,当智能体i为伴随者时,σi(t)=1,当智能体i为非伴随者时,σi(t)=0;vi,vj,vl分别为智能体i、j和虚拟领航者的实时速度,
Figure FDA00002808710300024
为vl的导数;
步骤二:多智能体系统开始运动后,在任意时刻t,当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时,根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统,并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者,领航子系统中的领导者称为虚拟领航者,伴随子系统中的领导者称为伴随者,在虚拟领航者与每个伴随者之间建立长程连接;各智能体根据自身的角色确定σi(t)的值,采用控制率ui的表达式对自身实时控制;并且,各伴随者实时监测自身与虚拟领航者之间的距离,当伴随者a与虚拟领航者与之间的距离超过R时,保持伴随者a与虚拟领航者之间的长程连接,否则,取消伴随者a与虚拟领航者之间的长程连接,以及虚拟领航者和伴随者的角色扮演。
2.如权利要求1所述的方法,其特征在于,所述内部连接的势能函数的构建方式为:
V ij ( | | x ij | | ) = ( 1 | | x ij | | - 1 d ) c 1 1 ( R 2 - | | x ij | | 2 ) c 2 , 0 ≤ | | x ij | | ≤ R c , | | x ij | | > R
上式中,c1,c2,c均为常数,c1≥2,c2≥1并且c≥0。
3.如权利要求1所述的方法,其特征在于,该方法进一步包括,设置一个权值因子系数aij(t),aij(t)是一个非负实数,它表示在t时刻,智能体j传递给智能体i的信息的权值因子,如果没有信息的传递,则aij(t)=0,否则aij(t)=1,并引入滞后阈值为δ的滞环:
Figure FDA00002808710300031
则控制率ui进一步考虑aij(t),其变形为:
u i = σ i ( t ) [ - ▿ | | x il | | V il - ( v i - v l ) + v · l ]
- Σ j ∈ N i ( t ) ▿ | | x ij | | V ij - Σ j ∈ N i ( t ) [ a ij ( t ) · ( v i - v j ) ] .
CN 201110147349 2011-06-02 2011-06-02 一种具有连通性保持的多智能体系统协同控制方法 Active CN102215260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110147349 CN102215260B (zh) 2011-06-02 2011-06-02 一种具有连通性保持的多智能体系统协同控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110147349 CN102215260B (zh) 2011-06-02 2011-06-02 一种具有连通性保持的多智能体系统协同控制方法

Publications (2)

Publication Number Publication Date
CN102215260A CN102215260A (zh) 2011-10-12
CN102215260B true CN102215260B (zh) 2013-04-17

Family

ID=44746387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110147349 Active CN102215260B (zh) 2011-06-02 2011-06-02 一种具有连通性保持的多智能体系统协同控制方法

Country Status (1)

Country Link
CN (1) CN102215260B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984343A (zh) * 2014-05-15 2014-08-13 北京理工大学 一种多无人移动平台网络化协同控制方法
CN104181813B (zh) * 2014-06-11 2016-08-03 北京理工大学 具有连通性保持的拉格朗日系统自适应控制方法
CN104865960B (zh) * 2015-04-29 2017-09-12 山东师范大学 基于平面的一种多智能体队形控制方法
CN105140907B (zh) * 2015-08-19 2018-03-06 华北电力大学(保定) 直流微网多智能体自适应下垂一致性协调控制方法及装置
CN105573306B (zh) * 2015-12-31 2018-05-08 中南大学 一种具有盲区的多个智能体的编队方法以及装置
CN105589333B (zh) * 2016-02-03 2018-09-07 电子科技大学 多智能体系统分组包围控制方法
CN105759633B (zh) * 2016-05-04 2018-05-18 华东交通大学 一种带强连通分支的多机器人系统可控包含控制方法
CN108108759B (zh) * 2017-12-19 2021-11-02 四川九洲电器集团有限责任公司 一种多智能体的动态编群方法
CN109254532B (zh) * 2018-04-19 2020-07-03 北京理工大学 一种面向通信时滞的多智能体分布式合作故障检测方法
CN109167678B (zh) * 2018-07-26 2020-11-10 北京理工大学 一种多段关键通信链路的分布式搜索方法
CN108983612A (zh) * 2018-08-08 2018-12-11 华南理工大学 一种具有预设性能和连接保持的水下机器人编队控制方法
CN109379125B (zh) * 2018-09-30 2020-06-12 北京航空航天大学 一种多智能体编队控制方法及系统
CN110162065B (zh) * 2019-06-18 2021-11-19 东北大学 一种基于有向跟随的自适应多智能体编队控制方法
CN111046955B (zh) * 2019-12-12 2020-11-20 中国人民解放军军事科学院国防科技创新研究院 一种基于图网络的多智能体对抗策略智能预测方法及装置
CN111258219B (zh) * 2020-01-19 2022-05-03 北京理工大学 一种多智能体系统协同策略的反演辨识方法
CN111459161B (zh) * 2020-04-03 2021-07-06 北京理工大学 一种多机器人系统人为干预控制方法
CN111596547B (zh) * 2020-05-21 2022-04-19 西北工业大学 二阶智能体系统连通性保持固定时间协同一致性控制方法
CN111953515B (zh) * 2020-07-07 2021-09-21 西南大学 一种基于Nesterov梯度法和重球法的双加速分布式异步优化方法
CN113534819B (zh) * 2021-08-26 2024-03-15 鲁东大学 用于领航跟随型多智能体编队路径规划的方法和存储介质
CN114296473B (zh) * 2021-11-30 2022-09-09 北京航空航天大学 一种避免碰撞和通信中断的多智能体自适应编队控制方法
CN114879484B (zh) * 2022-04-25 2024-02-27 同济大学 多个非完整移动智能体连接保持的协同控制器设计方法
CN115134269B (zh) * 2022-06-28 2023-08-25 北京邮电大学 多智能体系统连通性的检测方法和装置
CN115657686B (zh) * 2022-12-13 2023-05-16 南京南大电子智慧型服务机器人研究院有限公司 基于Backstepping的多机器人编队控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094138A (zh) * 2007-06-15 2007-12-26 武汉大学 基于d-s算法的延长无线传感器网络生命周期的方法
CN101551661A (zh) * 2009-05-12 2009-10-07 广东工业大学 一种面向多机器人系统的控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019576B2 (en) * 2007-02-16 2011-09-13 Telcordia Licensing Company, Llc Method for placement of sensors for surveillance

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094138A (zh) * 2007-06-15 2007-12-26 武汉大学 基于d-s算法的延长无线传感器网络生命周期的方法
CN101551661A (zh) * 2009-05-12 2009-10-07 广东工业大学 一种面向多机器人系统的控制方法

Also Published As

Publication number Publication date
CN102215260A (zh) 2011-10-12

Similar Documents

Publication Publication Date Title
CN102215260B (zh) 一种具有连通性保持的多智能体系统协同控制方法
Zavlanos et al. Graph-theoretic connectivity control of mobile robot networks
Chen et al. Formation control of multiple Euler-Lagrange systems via null-space-based behavioral control
CN104407619B (zh) 不确定环境下的多无人机同时到达多个目标方法
Wang et al. Improved multi-agent reinforcement learning for path planning-based crowd simulation
Jun et al. Multi-objective mobile robot path planning based on improved genetic algorithm
CN110470306B (zh) 一种可保证连通性约束的基于深度强化学习的多机器人编队导航方法
Choudhury et al. RRT*-AR: Sampling-based alternate routes planning with applications to autonomous emergency landing of a helicopter
CN110597059B (zh) 面向无人系统的椋群式智能群体动态网络拓扑构建方法
CN101739509A (zh) 一种大规模虚拟人群路径导航方法
Majcherczyk et al. Decentralized connectivity-preserving deployment of large-scale robot swarms
CN104181813B (zh) 具有连通性保持的拉格朗日系统自适应控制方法
CN112698634A (zh) 基于事件触发的交通智能体系统固定时间二分一致性方法
CN110412984B (zh) 一种群集安全一致性控制器及其控制方法
Qiming et al. A review of intelligent optimization algorithm applied to unmanned aerial vehicle swarm search task
Zhan et al. Flocking of discrete-time multi-agent systems with predictive mechanisms
Qiao et al. Dynamic self-organizing leader-follower control in a swarm mobile robots system under limited communication
Durrant-Whyte A beginner’s guide to decentralised data fusion
Yuan-hui et al. Research on optimal planning method of USV for complex obstacles
Yu et al. Robust adaptive flocking control of nonlinear multi-agent systems
Yang et al. Complete coverage path planning based on bioinspired neural network and pedestrian location prediction
CN114721273B (zh) 一种固定时间收敛零化神经网络的多智能体编队控制方法
Chen et al. A multirobot cooperative area coverage search algorithm based on bioinspired neural network in unknown environments
CN113759935B (zh) 基于模糊逻辑的智能群体编队移动控制方法
Cappello et al. Distributed control of multi-agent systems via linear quadratic differential games with partial information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant