CN102215260B

CN102215260B - 一种具有连通性保持的多智能体系统协同控制方法

Info

Publication number: CN102215260B
Application number: CN 201110147349
Authority: CN
Inventors: 方浩; 窦丽华; 曹虎; 陈杰; 刘华罡; 孙巍; 由佳; 贾睿; 李路; 孙腾; 王强
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2011-06-02
Filing date: 2011-06-02
Publication date: 2013-04-17
Anticipated expiration: 2031-06-02
Also published as: CN102215260A

Abstract

本发明提供了一种具有连通性保持的多智能体系统协同控制方法，多智能体系统开始运动后，在任意时刻t，当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时，根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统，并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者，领航子系统中的领导者称为虚拟领航者，伴随子系统中的领导者称为伴随者，在虚拟领航者与每个伴随者之间建立长程连接；各智能体根据自身的角色确定σ_i(t)的值，采用控制率的表达式对自身实时控制。本发明解决了目前多智能体系统协调控制方法中无法保持连通性的问题。

Description

一种具有连通性保持的多智能体系统协同控制方法

技术领域

本发明涉及一种基于人工势能函数的兼具连通性保持的多智能体分布式协同控制方法，属于智能机器人技术领域。

背景技术

近年来，多智能体系统的分布式运动协调控制与应用受到日益广泛的关注，逐渐成为复杂性科学研究的一个焦点问题。其中各智能体仅利用局部信息进行交互，并结合通信等手段发挥分布式资源的优势实现整体规划、解决局部冲突，从而达到整体预期目标。多智能体系统作为一门综合性交叉学科，其在工业和军事等应用领域均具有广泛的应用前景和重要的理论研究价值。

在多智能体系统中，智能体利用自身配置的多种传感器和执行器来感知环境并对环境的变化做出适当的反应，而整个多智能体系统在某种程度上可以视为一个移动传感器网络和执行器网络；同时，整个多智能群体在协同操作过程中通过自身所配备的通信设备进行信息交互和共享，使得整个系统在某种程度上又成为一个通信互联网络，因此合理的通信网络结构是多智能体系统进行分布式协调控制的重要保障。

其中，网络的通信连通性保持是多智能体网络拓扑控制中最基础和最重要的问题之一，特别是在障碍物环境或群体受到外扰的情况下，网络连通性的保持更为重要，其直接影响到整个群体系统的稳定性和算法的收敛性；而且，由于通信连通性是描述网络通信拓扑结构的全局特征量，而单个智能体只能获取有限范围的网络拓扑信息，其对网络的全局拓扑估计存在本质局限性，从而导致网络局部连通性与全局连通性并不等价。因此网络的通信连通性保持是多智能体系统的分布式运动协调控制中非常重要的一个环节。

然而，由于单个智能体受到功能设计和硬件条件等因素的制约，其自身所配置的传感器传播和感应信息能力范围R十分有限，单个智能体与群体中最近智能体之间的距离超过一定范围R时，该单个智能体失去了与群体的联络，网络连通性被破坏。

目前对网络连通性保持的研究中，通常人为割裂通信连通性保持和分布式运动协调控制之间的联系，缺乏将连通性作为约束条件与具体的协同控制任务的目标相结合的综合控制方案。

发明内容

有鉴于此，本发明是为解决目前多智能体系统协调控制方法中无法保持连通性的问题，提供了一种基于人工势能函数的兼具连通性保持功能的多智能体分布式协同控制方法，能够兼顾通信连通性保持和智能体运动协调控制，使系统在演化的过程中始终保持通信拓扑的连通性的同时达到预期的控制目标。

该方案是这样实现的：

通过对智能体系统的研究分析注意到，虽然在实际中不能保证系统通信网络的初始连通性，但系统肯定存在初始连通的子系统，但子系统的初始连通并不能保证其在演化过程中始终保持连通。首先，将这些连通子系统按照一定的规则分为领航子系统和伴随子系统，领航子系统中随机选择一个领航者，从伴随子系统中随机选择一个伴随者，在领航者和每个伴随者之间建立一个或若干个长程连接，接着设计领航-伴随势能函数作用于领航者和伴随者，使得彼此不相连的子系统联合起来，形成一个凝聚的连接群体。为了使初始连通的子系统和连通融合之后的完整系统在网络演化的过程中始终保持连通，又设计连通系统内的势能函数来防止相互连通的智能体移动到它们的感知范围之外。最后，将这两个势能函数应用到控制规则中就可以使群体系统同时达到保持网络连通性和获得稳定队形的目的。

具体来说，本发明提供了一种具有连通性保持的多智能体系统分布式协同控制方法，适用于采用双积分连续时间模型描述的智能体所构成的多智能体系统；该方法包括如下步骤：

步骤一：设计群集控制规则：

①设任意时刻，多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统，连通子系统为单个智能体或为彼此连通的至少2个智能体组成的集合；其中一个连通子系统定义为领航子系统，其他连通子系统定义为伴随子系统；从领航子系统中推举出一个虚拟领航者，从每个伴随子系统中推举出一个伴随者；在虚拟领航者和每个伴随者之间建立长程连接，所述长程连接采用远程短时通讯手段；每个连通子系统内部的各智能体之间采用内部连接彼此连通，该内部连接采用近距离持续通讯手段，其允许的感应信息能力范围为R；

②设计所述长程连接的势能函数和所述内部连接的势能函数；

设V_il表示虚拟领航者l与作为伴随者的智能体i之间的长程连接势能函数，V_ij表示连通子系统内智能体i和智能体j之间的内部连接势能函数；

V_il的设计满足如下条件：V_il是||x_il||的函数，||x_il||为长程连接两端虚拟领航者l与伴随者之间的相对距离；当||x_il||为d时，V_il的值最小；当||x_il||趋近0或者无穷大时，V_il的值趋于无穷大；并且考虑，当||x_il||从0向d变化时，V_il的变化率为负；当||x_il||从d向无穷大变化时，V_il的变化率为正；其中，d是预设的智能体系统中彼此连通智能体间的期望距离；

V_ij的设计满足如下条件：V_ij是||x_ij||的函数，||x_ij||为内部连接两端智能体i和智能体j之间的相对距离；当||x_ij||大于R时，V_ij的值为常数；当||x_ij||等于0或R时，V_ij的值趋于无穷；当||x_ij||达到d时，V_ij达到最小；并且考虑，当||x_ij||从0向d变化时，V_ij的变化率为负；当||x_ij||从d向R变化时，V_ij的变化率为正；

③结合两个势能函数设计智能体的控制率；

因为要求所有智能体在保持期望队形的同时达到一致的速度，则期望智能体i和j之间的相对速度趋近于0，并且期望智能体i和j之间的相对距离趋近于d，则智能体i的控制率u_i设计如下：

u_{i} = σ_{i} (t) [- {&dtri;}_{| | x_{il} | |} V_{il} - (v_{i} - v_{l}) + {\overset{\cdot}{v}}_{l}]

- \underset{j &Element; N_{i} (t)}{Σ} {&dtri;}_{| | x_{ij} | |} V_{ij} - \underset{j &Element; N_{i} (t)}{Σ} (v_{i} - v_{j})

其中，

表示对“·”求“”的偏导，N_i(t)是在t时刻与智能体i通过内部连接通信的所有通信邻居集合；σ_i(t)表示角色选择因子，当智能体i为伴随者时，σ_i(t)＝1，当智能体i为非伴随者时，σ_i(t)＝0；v_i，v_j，v_l分别为智能体i、j和虚拟领航者的实时速度；

步骤二：多智能体系统开始运动后，在任意时刻t，当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时，根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统，并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者，领航子系统中的领导者称为虚拟领航者，伴随子系统中的领导者称为伴随者，在虚拟领航者与每个伴随者之间建立长程连接；各智能体根据自身的角色确定σ_i(t)的值，采用控制率u_i的表达式对自身实施控制；并且，各伴随者实时监测自身与虚拟领航者之间的距离，当伴随者a与虚拟领航者与之间的距离超过R时，保持伴随者a与虚拟领航者之间的长程连接，否则，取消伴随者a与虚拟领航者之间的长程连接，以及虚拟领航者和伴随者的角色扮演。

较佳地，该方法进一步包括，设置一个权值因子系数a_ij(t)，a_ij(t)是一个非负实数，它表示在t时刻，智能体j传递给智能体i的信息的权值因子，如果没有信息的传递，则a_ij(t)＝0，否则a_ij(t)＝1，并引入滞后阈值为δ的滞环：

则控制率u_i进一步考虑a_ij(t)，其变形为：

u_{i} = σ_{i} (t) [- {&dtri;}_{| | x_{il} | |} V_{il} - (v_{i} - v_{l}) + {\overset{\cdot}{v}}_{l}]

- \underset{j &Element; N_{i} (t)}{Σ} {&dtri;}_{| | x_{ij} | |} V_{ij} - \underset{j &Element; N_{i} (t)}{Σ} {[a}_{ij} (t) \cdot (v_{i} - v_{j})] .

有益效果：

本发明针对具有双积分动态特性的多移动智能体系统，研究系统协同群集行为。在速度一致性协议和多智能体交互网络基础上设计分布式协同群集控制规则，该群集控制规则简单表述为长程连接、两个势能函数和一个控制率。两个势能函数分为领航-伴随势能函数(即长程连接的势能函数)和连通系统内的势能函数(即内部连接的势能函数)。长程连接使不同子系统之间能快速建立连接，是不同子系统渐近运动的基础和关键，长程连接是临时的，一旦不同子系统渐近融合之后，则取消这些长程连接。当初始系统为彼此不相连的子系统，随机选择的领航者和伴随者同时作用在两个势能函数之下，而未被选择的智能体则只作用在连通系统内的势能函数之下，从而保证不同子系统在渐近运动融合的同时，子系统始终保持连通。当所有的子系统渐近运动融合为一个连通的完整系统后，所有的智能体全部作用在连通系统内的势能函数之下，使群体系统达到保持网络连通性的同时获得预期群集运动的目标。

其次，本发明在控制率计算中设计了权值因子系数a_ij(t)并引入滞环，在a_ij(t)的控制下，智能体在连通子系统的边缘时，能够通过内部连接尽快拉回连通子系统，而尽量减少长程连接的使用，从而减少智能体的能源消耗。

本发明的预期研究成果可以为通信连通性约束下多智能体系统协同区域探索与覆盖，编队控制，群集运动，路径规划和任务分配等典型应用任务的决策与控制问题提供解决之道。

附图说明

图1-具有连通性保持功能的多智能体协同控制示意图；

图2-动态邻接矩阵A(t)；

图3-主导-伴随势能函数；

图4-APF连通性保持；

图5-与Tanner等算法的对比仿真实验图；

图6-在式(6)控制率下多智能体群集运动仿真实验图。

具体实施方式

下面结合附图并举实施例，对本发明进行详细描述。

稳定的群集运动是指所有智能体渐近达到一致的速度，智能体相互之间避免碰撞，并且最终系统的紧凑结构可以使所有智能体的势能最小，此时系统称为稳定的群。

考虑一个具有N个智能体的多智能体系统在n维欧式空间中移动，双积分动态特性的智能体具有质点动态特性。系统的一个双积分连续时间模型描述如下：

{\overset{\cdot}{x}}_{i} = v_{i}

(1)

m {\overset{\cdot}{v}}_{i} = u_{i} i = 1,2, . . . N

其中

是智能体i的位置向量，

是智能体i的速度向量，m_i＞0是智能体i的质量并假设各智能体质量相同，是作用于智能体i的控制输入。智能体i和智能体j之间的相对位置向量表示为x_ij＝x_i-x_j。

接着介绍本发明中使用的人工势能方法。

人工势能法在是智能体的运动空间中创建了一个势能。该势能由两部分组成：一个是引力场UA，随着智能体和目标点的距离增加而单调递增，且方向指向目标点；另一个是斥力场UR，在智能体处在障碍物位置时有一极大值，并随着智能体与障碍物距离的增大而单调减小，方向指向远离障碍物方向。整个势能是其引力部分和斥力部分的叠加。

假设智能体在二维空间中运动，则坐标为q的智能体在势能作用下，所受的力F(q)是U(q)的负梯度，如式(3)

F (q) = F_{A} (q) + F_{R} (q) = - &dtri; U (q) - - - (3)

这个合力决定了智能体的运动。

通过控制智能体受力的方向和大小可以实现对智能体的运动的控制。

如图1所示，该方法包括如下步骤：

步骤一：设计群集控制规则：

(1)设任意时刻，多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统(可参见图6(a)的示意)，连通子系统为单个智能体或为彼此连通的至少2个智能体组成的集合；其中一个连通子系统定义为领航子系统，其他连通子系统定义为伴随子系统；从领航子系统中推举出一个虚拟领航者，从每个伴随子系统中推举出一个伴随者；在虚拟领航者和每个伴随者之间建立长程连接，所述长程连接采用远程短时通讯手段，例如采用GPS卫星通讯，移动通信网络；每个连通子系统内部的各智能体之间采用内部连接彼此连通，该内部连接采用近距离持续通讯手段，其允许的感应信息能力范围为R，该内部连接就是智能体之间相互感知所采用的通信手段。

(2)为内部连接设计一个连通系统内的势能函数。

在包含N个智能体的群中，令||x_ij||(为了简化，只考虑二维的情况)表示智能体i和j的相对距离，智能体i和它的连通邻接集Ni中的智能体j之间的相互作用通过内部连接的人工势能函数V_ij来描述。其中，N_i表示与智能体i通过内部连接进行彼此连通的所有通信邻居的集合。由于不允许自环，所以

为了实现群集运动的避碰性指标，要求当智能体i和j的距离很近时，V_ij趋于无穷大，表现为很强的排斥力；为了实现连通性保持的目标，要求当智能体i和j距离将要超出感知半径R时，V_ij也趋于无穷大，表现为很强的吸引力；而为了实现群集运动队形收敛的指标，要求当距离达到队形的稳定距离d时，Vij存在唯一的极小值。

因此人工势能函数V_ij是一个关于距离||x_ij||非负的，分段连续的在(0，R)上可微的径向无界函数，并满足以下条件：

1)当||x_ij||→0或||x_ij||→R时，V_ij→∞，

2)当达到预定距离d时，V_ij达到最小。

3)当内部连接两端的距离大于R时，V_ij的值为常数；

4)并且考虑，当内部连接两端的距离从0向d变化时，V_ij的变化率为负，表示斥力；当内部连接两端的距离从d向R变化时，V_ij的变化率为正，表示吸力。其中，d是预设的智能体系统中彼此连通智能体间的期望距离。

本实施例中，V_ij的设计如下：

V_{ij} (| | x_{ij} | |) = \{\begin{matrix} \begin{matrix} {(\frac{1}{| | x_{ij} | |} - \frac{1}{d})}^{c_{1}} \frac{1}{{(R^{2} - {| | x_{ij} | |}^{2})}^{c_{2}}} & 0 \leq | | x_{ij} | | \leq R \end{matrix} \\ \begin{matrix} c & | | x_{ij} | | > R \end{matrix} \end{matrix}, - - - (4)

其中，c₁，c₂，c均为常数，C₁≥2，c₂≥1并且c≥0。V_ij的曲线如图4所示。

这个势能函数与Tanner等提出的函数主要的不同在于当智能体i和j的距离趋近于感知半径R时，V_ij趋于无穷，这可以保证保留所有的已有连接。另外从式(5)可以得知集体的势能在期望距离d处达到最小。因此本发明提出的连通系统内的势能函数可以使初始连通子系统在伴随领航子系统融合的过程中始终保持连通，同时可以使融合之后的完整系统保持网络连通性，从而使得整个系统保持连通性的同时达到稳定的结构。

(3)为长程连接设计一个领航-伴随人工势能函数。

伴随者在领航-伴随人工势能的作用下渐近向SSL(t)运动，从而帮助整个群体最终连接。长程连接使不同子系统之间能快速建立连接，是不同子系统渐近运动的基础和关键，长程连接是临时的，一旦不同子系统渐近融合之后，则取消这些长程连接，即对于伴随者a来说，当虚拟领航者与伴随者a之间的距离超过近距离持续通讯允许的感应信息能力范围R时，保持虚拟领航者与伴随者a之间的长程连接，否则，取消虚拟领航者与伴随者a之间的长程连接。

V_il表示虚拟领航者l和伴随者i之间的领航-伴随人工势能函数，V_il的设计满足如下条件：V_il是||x_ij||的函数，||x_ij||为长程连接两端虚拟领航者l与伴随者之间的相对距离；当长程连接两端的距离||x_ij||为d时，V_il的值最小；当长程连接两端的距离||x_il||趋近0或者无穷大时，V_il的值趋于无穷大；并且考虑，当长程连接两端的距离||x_il||从0向d变化时，V_il的变化率为负，表示斥力；当长程连接两端的距离||x_il||从d向无穷大变化时，V_il的变化率为正，表示吸力。

本实施例中，领航-伴随人工势能函数V_il的设计如下：

V_{il} (| | x_{il} | |) = k (\frac{d}{| | x_{il} | |} + 1 n | | x_{il} | |) - - - (5)

其中，

e为自然对数的底数，。很容易知道，V_il几乎处处连续可微，并当||x_ij||＝d时有唯一的全局最小值k(1+ln d)。V_il曲线图如图3所示。

在网络理论中，将长程连接引入通信拓扑网络，能极大地提高系统的同步合作能力。一方面在复杂网络中引入一些长程连接会产生所谓的小世界效应，小世界效应在降低平均路径长度和增强网络聚类性质方面带来一些显著的好处；另一方面，从技术角度讲，长程连接易于实施在典型的多智能体系统中，例如漫步移动智能体群。因此，本发明将长程连接网络理论引入进来，形成一种新的模型。这种新的模型能利用几乎相同的通信半径，使彼此不连接的群体连接起来或者使已有群连接变得更加稳固。

(4)结合两个势能函数设计控制率。

因为要求所有智能体在保持期望队形的同时达到一致的速度，则期望智能体i和j之间的相对速度趋近于0即v_ij(t)→0，并且期望智能体i和j之间的相对距离趋近于d即

V表示多智能体系统的集合；则智能体i的控制率u_i设计如下：

u_{i} = σ_{i} (t) [- {&dtri;}_{| | x_{il} | |} V_{il} - (v_{i} - v_{l}) + {\overset{\cdot}{v}}_{l}]

(6)

- \underset{j &Element; N_{i} (t)}{Σ} {&dtri;}_{| | x_{ij} | |} V_{ij} - \underset{j &Element; N_{i} (t)}{Σ} (v_{i} - v_{j})

其中，

表示对“·”求“”的偏导；N_i(t)是在t时刻与智能体i通过内部连接通信的所有通信邻居集合；σ_i(t)表示角色选择因子，当智能体i为伴随者时，σ_i(t)＝1，当智能体i为非伴随者时，σ_i(t)＝0；v_i，v_j，v_l分别为智能体i、j和虚拟领航者的实时速度。

根据控制率u_i对各智能体实施控制，可以实现智能体受力大小和方向的控制，由于智能体的质量不变且相互相等，因此控制率u_i控制可以简单地理解为智能体加速度a的控制。

在实际中，为了使得智能体在连通子系统的边缘时，能够通过内部连接尽快拉回连通子系统，而尽量减少长程连接的使用，从而减少智能体的能源消耗，因此本发明设置一个权值因子系数a_ij(t)，a_ij(t)是一个非负实数，它表示在t时刻，智能体j传递给智能体i的信息的权值因子，如果没有信息的传递，则a_ij(t)＝0，否则a_ij(t)＝1，并引入滞环，a_ij(t)的取值表达式为：

其中，0＜δ＜R是一个固定的滞后阈值。由图2可以看出在A(t)中引入了滞环，这对于保持网络拓扑结构是非常重要的。所有的a_ij(t)构成了一个邻接矩阵A(t)，A(t)＝[a_ij(t)]_N×N用来表示通信拓扑图的结构特征。

在考虑a_ij(t)的情况下，则控制率u_i变形为：

u_{i} = σ_{i} (t) [- {&dtri;}_{| | x_{il} | |} V_{il} - (v_{i} - v_{l}) + {\overset{\cdot}{v}}_{l}]

(6 - 1)

- \underset{j &Element; N_{i} (t)}{Σ} {&dtri;}_{| | x_{ij} | |} V_{ij} - \underset{j &Element; N_{i} (t)}{Σ} {[a}_{ij} (t) \cdot (v_{i} - v_{j})]

步骤二：多智能体系统开始运动后，根据公式(6)或(6-1)对自身实施控制。

第1步：在任意时刻t，当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时，根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统，并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者，领航子系统中的领导者称为虚拟领航者，伴随子系统中的领导者称为伴随者，在虚拟领航者与每个伴随者之间建立长程连接，这个长程连接是临时的，长程连接的数目可以是若干条。

本步骤中，在t可能为多智能体系统开始运动的初始时刻，也可以是多智能体系统运动过程中。

对于t可能为多智能体系统开始运动的初始时刻的情况：

智能体上电后，通过广播与其他智能体通信并接收其他智能体返回的响应并建立连接，该连接为所述内部连接；对于相互之间有内部连接的群体构成了连通子系统；连通子系统内部各智能体通过相互通信推举一个领导者，领导者推举策略可以为随机选取，或者为根据智能体的位置选取，例如距离其他连通子系统最近的智能体作为领导者。各连通子系统的领导者之间通过长程连接通信，推举虚拟领航者，领航者的推举策略可以为随机选取，或者为根据连通子系统中智能体的数量选取(例如数量最多的智能体为领航子系统，其领导者就是虚拟领航者)，或者根据领导者的前后位置选取(例如位置最靠前的领导者作为虚拟领航者)，那么除领航者之外的所有领导者都为伴随者。确定领航者和伴随者后，在虚拟领航者与每个伴随者之间建立长程连接。

在另一个实施例中，还可以在智能体上电后，通过GPS定位方式确定各智能体的位置，从而得知连通子系统的划分，每个连通子系统内部随机选取一个领导者，或者根据GPS定位信息将每个连通子系统中位置最前者选为领导者，领导者中最靠前者为虚拟领航者，在虚拟领航者与每个伴随者之间建立长程连接。

在实际中，本建立长程连接的过程可以有很多种，不仅限于上述两种实施方式，这里不一一举例。

对于t可能为多智能体系统运动过程中的情况：

多智能体系统在运动过程中初始为一个连通系统，各智能体在不断维护自身的邻居域N_i(t)，当N_i(t)中的成员减少时，触发智能体通过广播与其他智能体通信，从而重新划分连通子系统，并重新推举领导者和伴随者，从而建立其长程连接。

第2步：各智能体根据自身的角色确定σ_i(t)的值，对于伴随者σ_i(t)＝1，对于非伴随者σ_i(t)＝0。各智能体确定当前时刻t自身对应的a_ij(t)。

第3步：利用公式(6)或(6-1)示出的控制率u_i的表达式对自身实施控制。

第4步：各伴随者实时监测自身与虚拟领航者之间的距离，当伴随者a与虚拟领航者与之间的距离超过R时，保持伴随者a与虚拟领航者之间的长程连接，否则，取消伴随者a与虚拟领航者之间的长程连接，以及虚拟领航者和伴随者的角色扮演。这时所有智能体的σ＝0。那么系统内所有的智能体只需利用连通系统内的势能函数，使得整个群体在运动的过程中始终保持连通。

循环执行上述步骤1～4，从而实现了智能体控制，产生稳定的群集运动。

最后通过实验结果对本发明进行进一步的阐述：

首先介绍本实验中使用的代数图论方法。

动态通信图G(t)＝{V，E(t)}是一个时变的无向图，由N个顶点的顶点集V＝{n₁，n₂，...，n_N}和边集E(t)＝{(n_i，n_j)| ||x_ij(t)||＜R}组成，顶点表示系统中的智能体，边集包含有邻居关系的顶点的无序对。用N_i＝{n_j|(n_i，n_j)∈E(t)}表示智能体i的所有通信邻居。由于不允许自环，所以

为了描述智能体之间的时变邻居关系，拓扑连通图的边集E(t)必须满足以下条件：

●初始链路E(0)＝{(n_i，n_j| ||x_ij(0)||＜R，n_i，n_j∈V}；

●如果在时刻t之前智能体i和j不是邻居，并且||x_ij(t)||＜R-δ(0＜δ＜R)，δ为预设的滞后阈值，那么在它们之间加入一条新的链路；

●如果||x_ij(t)||＞R，那么从E(t)中删除链路(n_i，n_j)；

为了清晰地展现实验结果，数值仿真中采用10个具有双积分动态模型的智能体，在二维平面上运动，智能体用点表示。初始速度、位置和连接任意给定，但必须满足以下约束：

所有的初始位置在一个半径R＝12m的圆形区域内，邻接图由一个随机生成的0-1邻接矩阵来描述。

初始速度幅值和方向任意选定，幅值限制在[0-5]m/s。

所有智能体有相同的质量1kg。

此外，智能体的感知半径R＝6m，期望距离d＝4m，切换阈值δ＝0.7m，仿真共运行100s。假设在初始时间t₀＝0s有两个子系统，在较大的子系统中随机选择虚拟领航者，在其它子系统中随机选择伴随者，此时在虚拟领航者与伴随者之间建立长程连接。

图5给出了在初始连通的情况下，本发明提出的算法与Tanner等提出的算法的比较实验。图5(a)表示10个智能体的初始状态，智能体之间的邻居关系用实线表示，带箭头的实线表示了速度的方向。图5(b)和(c)分别给出了使用两种算法的系统最终状态。可以很明显的看出，Tanner等提出的没有连通性保持的算法，产生了系统分割，最终没能达到期望的群集运动。这主要是因为网络的初始连通，并不能保证在网络的演化过程中始终保持连通。相反，通过使用连通性保持算法APF，本发明所提出的控制率能使整个系统达到稳定的群移行为。

图6给出了在初始不连通的情况下本发明提出的算法实验。图6(a)表示10个智能体的初始状态，智能体之间的邻居关系用实线表示，带箭头的实线表示了速度的方向。图6(b)-(d)分别给出了在时刻t＝30s，t＝70s和t＝120s时所有智能体的运动状态和结构，图6(e)给出了系统最终状态和运动轨迹。可以清楚的看到，通过在初始不连通的系统中加入长程连接，在控制率(6)下所有智能体渐近形成聚合的连接群集，最终获得期望的群集运动。

此外，为了研究系统滞后阈值δ的影响，还进行了δ＝0.8和δ＝0.3下的对比实验。可以发现，δ越小，最大超调量就越大，系统的上升时间越短。这是因为δ越小导致边缘条件更早产生，增强了网络的连通性，从而使得系统的上升时间越小。另一方面，δ越小也能产生更大的人工势能力，从而使系统超调量更大。因此，通过调整参数δ，可以在较小的超调量和较小的上升时间之间选择一个的权衡值。

而且，长程连接数目L_n对群集系统收敛存在着一定的影响，当L_n越大时，群体具有更快的收敛率和更牢固的最终结构。这是因为长程连接越多，系统的连通度越大，从而能通过相邻链路的帮助为整个群体传播外部参考信号。

可以清楚地看到，本发明算法利用人工势能函数(4)和(5)使得控制率(6)可以产生稳定的群集行为。因此可以得出结论，连通性的保持是不可或缺的，并且需要合理的设计带有连通性保持的势能函数来保证整个群的稳定性。

可见，本发明的群集控制规则简单表述为长程连接、两个势能函数和一个控制率。两个势能函数分为领航-伴随势能函数和连通系统内的势能函数。长程连接使不同子系统之间能快速建立连接，是不同子系统渐近运动的基础和关键，长程连接是临时的，一旦不同子系统渐近融合之后，则取消这些长程连接。当初始系统为彼此不相连的子系统，随机选择的领航者和伴随者同时作用在两个势能函数之下，而未被选择的智能体则只作用在连通系统内的势能函数之下，从而保证不同子系统在渐近运动融合的同时，子系统始终保持连通。当所有的子系统渐近运动融合为一个连通的完整系统后，所有的智能体全部作用在连通系统内的势能函数之下，使群体系统达到保持网络连通性的同时获得预期群集运动的目标。因此，两个势能函数分别作用在系统不同的运动状态下。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之。

Claims

1.一种具有连通性保持的多智能体系统分布式协同控制方法，适用于采用双积分连续时间模型描述的智能体所构成的多智能体系统；其特征在于，该方法包括如下步骤：

步骤一：设计群集控制规则：

V_ij的设计满足如下条件：V_ij是||x_ij||的函数，||x_ij||为内部连接两端智能体i和智能体j之间的相对距离；当||x_ij||大于R时，V_ij的值为常数；当||x_ij||趋近于0或R时，V_ij的值趋于无穷；当||x_ij||达到d时，V_ij达到唯一的最小值；并且考虑，当||x_ij||从0向d变化时，V_ij的变化率为负；当||x_ij||从d向R变化时，V_ij的变化率为正；

③结合两个势能函数设计智能体的控制率；

要求所有智能体在保持期望队形的同时达到一致的速度，则期望智能体i和j之间的相对速度趋近于0，并且期望智能体i和j之间的相对距离趋近于d，则智能体i的控制率u_i设计如下：

u_{i} = σ_{i} (t) [- {&dtri;}_{| | x_{il} | |} V_{il} - (v_{i} - v_{l}) + {\overset{\cdot}{v}}_{l}]

- \underset{j &Element; N_{i} (t)}{Σ} {&dtri;}_{| | x_{ij} | |} V_{ij} - \underset{j &Element; N_{i} (t)}{Σ} (v_{i} - v_{j})

其中，表示对“·”求“*”的偏导，N_i(t)是在t时刻与智能体i通过内部连接通信的所有通信邻居集合；σ_i(t)表示角色选择因子，当智能体i为伴随者时，σ_i(t)＝1，当智能体i为非伴随者时，σ_i(t)＝0；v_i,v_j,v_l分别为智能体i、j和虚拟领航者的实时速度，

为v_l的导数；

步骤二：多智能体系统开始运动后，在任意时刻t，当智能体根据与其他智能体的彼此连通情况检测到所在多智能体系统被分割为彼此不相连的2个或2个以上的连通子系统时，根据预定的推举策略确定自身所在连通子系统是领航子系统还是伴随子系统，并通过与连通子系统中其他智能体的通信推举本连通子系统的领导者，领航子系统中的领导者称为虚拟领航者，伴随子系统中的领导者称为伴随者，在虚拟领航者与每个伴随者之间建立长程连接；各智能体根据自身的角色确定σ_i(t)的值，采用控制率u_i的表达式对自身实时控制；并且，各伴随者实时监测自身与虚拟领航者之间的距离，当伴随者a与虚拟领航者与之间的距离超过R时，保持伴随者a与虚拟领航者之间的长程连接，否则，取消伴随者a与虚拟领航者之间的长程连接，以及虚拟领航者和伴随者的角色扮演。

2.如权利要求1所述的方法，其特征在于，所述内部连接的势能函数的构建方式为：

V_{ij} (| | x_{ij} | |) = \{\begin{matrix} {(\frac{1}{| | x_{ij} | |} - \frac{1}{d})}^{c_{1}} \frac{1}{{(R^{2} - {| | x_{ij} | |}^{2})}^{c_{2}}}, 0 \leq | | x_{ij} | | \leq R \\ c, {| | x}_{ij} | | > R \end{matrix}

上式中，c₁,c₂,c均为常数，c₁≥2,c₂≥1并且c≥0。

3.如权利要求1所述的方法，其特征在于，该方法进一步包括，设置一个权值因子系数a_ij(t)，a_ij(t)是一个非负实数，它表示在t时刻，智能体j传递给智能体i的信息的权值因子，如果没有信息的传递，则a_ij(t)＝0，否则a_ij(t)＝1，并引入滞后阈值为δ的滞环：

则控制率u_i进一步考虑a_ij(t)，其变形为：

u_{i} = σ_{i} (t) [- {&dtri;}_{| | x_{il} | |} V_{il} - (v_{i} - v_{l}) + {\overset{\cdot}{v}}_{l}]

- \underset{j &Element; N_{i} (t)}{Σ} {&dtri;}_{| | x_{ij} | |} V_{ij} - \underset{j &Element; N_{i} (t)}{Σ} [a_{ij} (t) \cdot (v_{i} - v_{j})] .