CN111176327A

CN111176327A - 一种多智能体系统合围控制方法及系统

Info

Publication number: CN111176327A
Application number: CN202010049585.1A
Authority: CN
Inventors: 董希旺; 周诗钰; 任章; 李清东
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2020-05-19
Anticipated expiration: 2040-01-16
Also published as: CN111176327B

Abstract

本发明公开了一种多智能体系统合围控制方法及系统。该方法包括：获取多智能体系统中所有智能体的状态数据；多智能体系统中M个智能体为领导者，N个智能体为跟随者；由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议；由跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器；依据合围控制协议和所有智能体的状态数据构建线性多智能体系统模型；由线性多智能体系统模型和状态观测器，得到状态观测器误差和合围误差；当状态观测器误差和合围误差均收敛于零时，确定多智能体系统实现状态合围控制。本发明能实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制。

Description

一种多智能体系统合围控制方法及系统

技术领域

本发明涉及协同控制技术领域，特别是涉及一种多智能体系统合围控制方法及系统。

背景技术

随着技术的进步，多智能体的协同控制具有广阔的应用前景。协同控制包含一致性控制、合围控制和编队控制等。合围控制是机器人系统协同控制领域中的重要课题之一，多智能体系统实现状态合围控制定义为跟随者的状态进入领导者状态张成的凸包的内部。

随着实际应用的要求，信息传输速率的有限性必然会导致通信存在时延，同时这种时延还会随着数据量的多少以及可用通信带宽的大小而改变，通信时延会改变系统的控制性能，甚至会使原本稳定的合围控制系统变得不稳定。因此需要对时变通信时延存在下的多智能体系统合围控制进行研究。由于队形的改变、通信设备的故障等原因，对智能体系统主体之间的通信拓扑会发生切换。拓扑的切换会改变系统的连通性及各主体之间的相互作用关系，导致个体之间无法进行协同，更无法实现合围控制，因此进一步研究拓扑切换下的合围控制也是重中之重。

随着一致性控制理论的的发展和完善，基于一致性的合围控制方法逐渐的到了广泛的应用。该方法仅利用邻居节点的相对信息设计本地控制器，结构较为简单，具有较好的稳定性和可扩展性。

目前，现有的基于一致性的分布式合围控制方法主要研究通信时延和切换拓扑单独存在下的合围控制。由于通讯时延和切换拓扑的广泛性，已有的单独考虑的控制器设计方法难以直接应用。因此，如何实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制成为目前亟待解决的问题。

发明内容

基于此，有必要提供一种多智能体系统合围控制方法及系统，以实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制。

为实现上述目的，本发明提供了如下方案：

一种多智能体系统合围控制方法，包括：

获取多智能体系统中所有智能体的状态数据；所述多智能体系统包括V个智能体，其中，M个智能体为领导者，N个智能体为跟随者；V＝M+N；

由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议；

由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器；

依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型；

由所述线性多智能体系统模型和所述状态观测器，得到状态观测器误差和合围误差；

判断所述状态观测器误差和所述合围误差是否均收敛于零；

当所述状态观测器误差和所述合围误差均收敛于零时，确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。

可选的，所述由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议，具体包括：

由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建初步合围控制协议；所述初步合围控制协议为

其中，u_i(t)为第i个跟随者对应的控制输入，x_i(t)为第i个跟随者对应的状态向量，ρ_ij为第i个跟随者对第j个领导者的合围增益，

为第i个跟随者对第j个领导者的状态估计值，K₁为初步合围控制协议的待求参数；

确定所述初步合围控制协议的待求参数；

将待求参数确定后的初步合围控制协议确定为合围控制协议。

可选的，所述由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器，具体包括：

由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建初步状态观测器；所述初步状态观测器为

其中，

为跟随者对领导者的状态估计值的导数，I_M为M阶单位阵，

A为n阶实方阵，

为跟随者对领导者的状态估计值，

为第i个跟随者对第j个领导者的状态估计值，z(t)为领导者对应的状态向量，σ(t)为通信拓扑切换函数，τ(t)为通信时延，K₂为初步状态观测器的待求参数，

为第i个跟随者在对应拓扑下是否能获得所有领导者的信息，当第i个跟随者在对应拓扑下可以获得所有领导者的信息时

否则

t-τ(t)表示延迟后的时间，z(t-τ(t))为通讯时延下领导者对应的状态向量，

表示通讯时延下第i个跟随者的状态估计值，

表示通讯时延下除第i个跟随者之外的，第k个跟随者的状态估计值，w_ik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重；

确定所述初步状态观测器的待求参数；

将待求参数确定后的初步状态观测器确定为状态观测器。

可选的，所述线性多智能体系统模型为：

其中，x_i(t)为第i个跟随者对应的状态向量，

为第i个跟随者对应的状态向量的导数，u_i(t)为第i个跟随者对应的控制输入，A为n阶实方阵，B为n×m阶列满秩实矩阵，O_F为跟随者的集合，z_j(t)为第j个领导者对应的状态向量，

为第j个领导者对应的状态向量的导数，O_L为领导者的集合。

可选的，所述由所述线性多智能体系统模型和所述状态观测器，得到状态观测器误差和合围误差，具体包括：

由所述线性多智能体系统模型确定合围误差

其中，e₁为合围误差，

为第i个跟随者对应的状态向量的导数，ρ_ij为第i个跟随者对第j个领导者的合围增益，

为第j个领导者对应的状态向量的导数；

由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差

其中，e₂为状态观测器误差，

为跟随者对领导者的状态估计值的导数。

本发明还提供了一种多智能体系统合围控制系统，包括：

状态数据获取模块，用于获取多智能体系统中所有智能体的状态数据；所述多智能体系统包括V个智能体，其中，M个智能体为领导者，N个智能体为跟随者；V＝M+N；

合围控制协议构建模块，用于由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议；

状态观测器构建模块，用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器；

多智能体系统构建模块，用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型；

误差计算模块，用于由所述线性多智能体系统模型和所述状态观测器，得到状态观测器误差和合围误差；

判断模块，用于判断所述状态观测器误差和所述合围误差是否均收敛于零；

合围控制模块，用于当所述状态观测器误差和所述合围误差均收敛于零时，确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。

可选的，所述合围控制协议构建模块，具体包括：

第一初步构建单元，用于由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建初步合围控制协议；所述初步合围控制协议为

第一参数确定单元，用于确定所述初步合围控制协议的待求参数；

合围控制协议确定单元，用于将待求参数确定后的初步合围控制协议确定为合围控制协议。

可选的，所述状态观测器构建模块，具体包括：

第二初步构建单元，用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建初步状态观测器；所述初步状态观测器为

其中，

为跟随者对领导者的状态估计值的导数，I_M为M阶单位阵，

A为n阶实方阵，

为跟随者对领导者的状态估计值，

否则

表示通讯时延下第i个跟随者的状态估计值，

第二参数确定单元，用于确定所述初步状态观测器的待求参数；

状态观测器确定单元，用于将待求参数确定后的初步状态观测器确定为状态观测器。

可选的，所述多智能体系统构建模块中的所述线性多智能体系统模型为：

其中，x_i(t)为第i个跟随者对应的状态向量，

为第j个领导者对应的状态向量的导数，O_L为领导者的集合。

可选的，所述误差计算模块，具体包括：

第一误差计算单元，用于由所述线性多智能体系统模型确定合围误差

其中，e₁为合围误差，

为第j个领导者对应的状态向量的导数；

第二误差计算单元，用于由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差

其中，e₂为状态观测器误差，

为跟随者对领导者的状态估计值的导数。

与现有技术相比，本发明的有益效果是：

本发明提出了一种多智能体系统合围控制方法及系统。该方法基于状态观测器的合围控制协议考虑了时延和通信拓扑切换，这两个因素在现实场景中普遍存在，因此，采用本发明的方法或系统，实现了时变通信时延和切换拓扑同时存在下的多智能体系统合围控制；本发明考虑的多智能体系统是一般的线性系统模型，该模型具有广泛的应用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1一种多智能体系统合围控制方法的流程图；

图2为多智能系统的三种切换拓扑图；

图3为切换拓扑信号示意图；

图4为多智能体系统在不同时刻的状态轨迹截图；

图5为随着时间变化状态观测器误差的变化图；

图6为随着时间变化合围误差的变化图；

图7为本发明实施例3一种多智能体系统合围控制系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1：

图1为本发明实施例1一种多智能体系统合围控制方法的流程图。

参见图1，实施例的多智能体系统合围控制方法包括：

101：获取多智能体系统中所有智能体的状态数据；所述多智能体系统包括V个智能体，其中，M个智能体为领导者，N个智能体为跟随者。V＝M+N。

102：由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议。

所述102，具体包括：

21)由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建初步合围控制协议；所述初步合围控制协议为

为第i个跟随者对第j个领导者的状态估计值，K₁为初步合围控制协议的待求参数。

22)确定所述初步合围控制协议的待求参数。具体的：选取所述初步合围控制协议的待求参数为设定值；将设定矩阵的特征值指定到左半复平面的设定位置；所述设定矩阵为A+BK₁；其中，A为n阶实方阵，B为n×m阶列满秩实矩阵；若(A,B)是可控的，则确定初步合围控制协议的待求参数为所述设定值，若(A,B)不可控，则重新选取所述初步合围控制协议的待求参数的设定值，直到(A,B)可控。

该步骤中(A,B)是否可控的判断过程为：

考虑如下的线性系统

其中，

和

分别表示系统的常数矩阵，

和

分别表示系统的状态、控制输入和控制输出。下面给出上述线性系统能控性、能观测性、稳定性的判据。

如果对于任意给定初始状态x(0)，总存在控制输入u(t)使得上述线性系统的解x(t)能够在有限时间内达到原点，则称上述线性系统称系统是能控的(可控的)或称(A,B)是能控的。

23)将待求参数确定后的初步合围控制协议确定为合围控制协议。

103：由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器。

所述103，具体包括：

31)由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建初步状态观测器；所述初步状态观测器为

其中，

为跟随者对领导者的状态估计值的导数，I_M为M阶单位阵，

A为n阶实方阵，

为跟随者对领导者的状态估计值，

否则

表示通讯时延下第i个跟随者的状态估计值，

表示通讯时延下除第i个跟随者之外的，第k个跟随者的状态估计值，w_ik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。本实施例中，0≤τ(t)≤σ′，同时

满足

其中σ′与δ均为已知常数，上式表明通信时延与通信时延的变化率均有界。

32)确定所述初步状态观测器的待求参数。

33)将待求参数确定后的初步状态观测器确定为状态观测器。

104：依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型。

所述线性多智能体系统模型为：

其中，x_i(t)为第i个跟随者对应的状态向量，

为第j个领导者对应的状态向量的导数，O_L为领导者的集合。

105：由所述线性多智能体系统模型和所述状态观测器，得到状态观测器误差和合围误差。

所述105，具体包括：

51)由所述线性多智能体系统模型确定合围误差

其中，e₁为合围误差，

为第j个领导者对应的状态向量的导数。

52)由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差

其中，e₂为状态观测器误差，

为跟随者对领导者的状态估计值的导数。

106：判断所述状态观测器误差和所述合围误差是否均收敛于零。

107：当所述状态观测器误差和所述合围误差均收敛于零时，确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。

所述107，具体为：当满足

且

时，确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。

下面提供了一个更为具体的实施例。

实施例2：

本实施例基于状态观测器，提出时延和通信拓扑切换同时存在下，针对一般线性多智能体系统状态合围控制协议，并设计了详细可行的方案来确定协议中的参数。在通信拓扑切换和一定程度的时延情况下，所提出的方法可保证多智能体系统实现状态合围控制。本实施例提供的多智能体系统合围控制方法包括如下步骤：

步骤1：通信时延和切换下的多智能体系统建模。

(1)多智能体系统建模

多智能体系统是多个智能体组成的集合，每个智能体能够对自身进行控制，并具备多个智能体间互相通信的能力，考虑由M+N个多智能体组成的系统(例如可考虑由M+N架无人机组成的系统)，其中包含有M个领导者和N个跟随者，将领导者集合记为O_L＝{1,2,…,M}，跟随者集合记为O_F＝{1,2,…,N}，一般线性多智能体系统描述如下：

其中，i表示第i个跟随者，x_i(t)表示第i个跟随者的状态向量，x_i(t)是由跟随者对应的状态数据构建而成的，当多智能体系统为由M+N架无人机组成的系统时，跟随者对应的状态数据为无人机的位置和速度，

表示第i个跟随者的状态向量的导数，u_i(t)为第i个跟随者的控制输入，z_j(t)表示第j个领导者的状态向量，

表示第j个领导者的状态向量的导数，A为n阶实方阵，B为n×m阶列满秩实矩阵。

(2)合围定义

如果对任意有界的初始状态和任意i∈{1,2,…,N}，存在满足

的非负的常数ρ_ij(j＝1,2,…,M)，使得：

则称多智能体系统实现了状态合围。

(3)时延和通信拓扑切换建模

通讯时延表示为τ(t)，0≤τ(t)≤σ′，同时

满足

用无向图

建模多智能体间的通信情况，其中

代表节点集，

为边集，

为无向图的领接矩阵；每个智能体建模为其中的一个节点，智能体间的通信建模为图中的一条边。

智能体间的通信拓扑是切换的，并且存在一个无限的无重叠时间间隔序列

其中t_k+1-t_k≥T_d＞0，T_d是驻留时间(dwell time)，期间拓扑保持不变，

为自然数集，时间序列t_k被称为切换时序，在每个t_k时刻智能体系统间的通信拓扑发生切换。σ(t):[0,+∞)→{1,2,…,p}表示切换函数，其函数值表示t时刻对应的通信拓扑的编号。G_σ(t)是σ(t)对应的交互拓扑，L_σ(t)为G_σ(t)对应的拉普拉斯矩阵，

为对应拓扑结构下跟随者之间的作用拓扑图，

为

对应的拉普拉斯矩阵。本实施例中，跟随者对应的作用拓扑

是无向且连通的。同时至少有一个跟随者可以获得所有领导者信息。

步骤2：设计基于一致性的合围控制器。

给出存在时延和切换下的多智能体系统的合围控制协议如下：

u_i(t)为跟随者对应的控制输入。

其中针对每个跟随者i(i＝1,2,…,N)，构造如下的状态观测器：

其中，

I_M为M阶单位阵，

代表第i个跟随者对第j个领导者的状态估计，

为领导者状态矩阵，K₁、K₂是具有匹配维数的常数增益矩阵(待求参数)，ρ_ij为预先确定的合围增益满足

为第i个跟随者在对应拓扑下是否能获得所有领导者的信息，当第i个跟随者在对应拓扑下可以获得所有领导者信息时

否则

τ(t)是对应的时变通信时延，满足0≤τ(t)≤σ′，同时

满足

表示通讯时延下第i个跟随者的状态估计值，

表示通讯时延下除第i个跟随者之外的，第k个跟随者的状态估计值，w_ik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。

令

为对应拓扑下跟随者之间对应的实对称拉普拉斯矩阵，B_σ(t)为对应通讯拓扑结构下，由非负整数

所组成的对角阵，

令

是实对称正定矩阵H_σ(t)在σ(t)时的特征值。且所有切换下，特征值最小值为

特征值最大值为

步骤3：确定合围控制协议与状态观测器的参数。

以下给出的合围控制协议中的参数K_i,(i＝1,2)的设计方法。

(1)选取K₁来分配矩阵A+BK₁的特征值，将特征值指定到左半复平面的特定位置，如果(A,B)是可控的，则K₁的存在是可以得到保证的。

(2)求解如下的线性矩阵不等式。如果存在正定对称的矩阵R,Ω,S和实矩阵

使得如下的线性矩阵不等式可行，则状态观测器中的增益矩阵

其中，*表示对称元素，

上述这些参量对应LMI中每一项的系数，LMI是求解线性矩阵不等式，这个矩阵不等式满足上述的式子，每一项都含有未知系数R,Ω,S和实矩阵

上面的每个系数我都有解释，未知系数R,Ω,S和实矩阵

0≤τ(t)≤σ′，同时

满足

σ′与δ这两个数与时延相关是后面仿真自己给定的参数，令

是实对称正定矩阵H_σ(t)的特征值。且所有切换下，特征值最小值为

特征值最大值为

本实施例中的多智能体系统合围控制方法，由于对任意的i∈{1，2,3,…,N}和对任意的切换拓扑σ(t)∈{1,2,…,p}，

(这是一个不等式，对于每一个切换拓扑需要所有特征值带入，都需要成立，转变成对所有切换拓扑，特征值的最大值和最小值成立就可以了)成立，当且仅当对任意的i∈{1,2}，

本实施例利用这一特点将p×N个线性矩阵不等式(即

σ(t)＝1,2,…,p,i＝1,2,…,N)的求解问题简化为了两个线性矩阵不等式

的求解问题。这极大的提高了计算效率，同时不增加保守性。

下面对本实施例中的多智能体系统合围控制方法进行了仿真验证，验证时延和切换下多智能体系统的合围效果。

考虑由七个智能体组成的三阶多智能体系统，其中4个领导者，3个跟随者，1，2，3，4代表领导者，5，6，7代表跟随者，其状态向量为x_i(t)＝[x_i1(t),x_i2(t),x_i3(t)]^T，z_i(t)＝[z_i1(t),z_i2(t),z_i3(t)]^T且

时延τ(t)＝0.05+0.01cos(t)，通信拓扑在图1所示的三个拓扑中切换，切换的时间间隔为10秒。

预先确定的合围增益为

通过取K₁＝[1.4918 -0.5574 1.6230]可以将A+BK₁的特征值配置到-1，-2和-3。求解，得到

为了简单起见，四个领导者初始状态分别为z₁(0)＝[1.2472,-0.2347,-1.0743]^T，z₂(0)＝[0.4672,1.3785,0.8766]^T，z₃(0)＝[1.3020,1.0474,-1.3929]^T，z₄(0)＝[0.7294,0.7732,0.5362]^T，三个跟随者的初始状态为随机值，状态观测器初始状态为0。

图2为多智能系统的三种切换拓扑图，该图表示每10s切换的拓扑信号对应的通讯拓扑图。图3为切换拓扑信号示意图，图3中横坐标是时间，纵坐标对应的数值1、2、3分别指的是切换的信号，这三种信号分别对应图2中的(a)、(b)、(c)三种拓扑，例如，1对应图2中的(a)部分，表示在1持续的10s内，对应的拓扑是(a)，以此类推。

图4为多智能体系统在不同时刻的状态轨迹截图，图4中跟随者状态为方框，其他形状为领导者的状态，领导者状态形成的凸包用虚线来表示。图4中的(a)、(b)、(c)、(d)这四个部分分别表示每个智能体的状态t＝1，6，36，50s时对应的状态图(状态是3维)，因此这四个部分均为对应的三维图。由图4可以看出随着时间的推移，跟随者的状态逐渐进入到领导者状态形成的凸包内部。由图5与图6可知在合围控制协议与状态观测器的作用下，状态观测器误差与合围误差均逐渐收敛于零，即实现通信时延和拓扑切换同时存在下的状态合围控制。图5和图6的横坐标都是对应仿真时间，纵坐标表示均误差。图5表示的状态观测器的误差e₁随着时间的变化。图6是合围误差e₁随着时间的变化。本实例验证了所提出方法的有效性。

本实施例的多智能体系统合围控制方法，步骤1给出的多智能体系统合围控制协议具有广泛的适用性；考虑的多智能体系统是一般的线性系统模型，该模型具有广泛的应用；基于状态观测器的合围控制协议考虑了时延和通信拓扑切换，这两个因素在现实场景中普遍存在，并且没有时延或通信拓扑切换的情况属于所考虑的问题的特殊情况，因此该控制协议可应用于没有时延或通信拓扑切换的多智能体系统合围控制问题；步骤4有效地利用了线性矩阵不等式的特性，大大提高了求解编队控制协议中的增益矩阵的计算效率。

实施例3：

本发明还提供了一种多智能体系统合围控制系统，图7为本发明实施例3一种多智能体系统合围控制系统的结构示意图。

参见图7，实施例的多智能体系统合围控制系统，包括：

状态数据获取模块701，用于获取多智能体系统中所有智能体的状态数据；所述多智能体系统包括V个智能体，其中，M个智能体为领导者，N个智能体为跟随者；V＝M+N。

合围控制协议构建模块702，用于由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议。

状态观测器构建模块703，用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器。

多智能体系统构建模块704，用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型。

误差计算模块705，用于由所述线性多智能体系统模型和所述状态观测器，得到状态观测器误差和合围误差。

判断模块706，用于判断所述状态观测器误差和所述合围误差是否均收敛于零。

合围控制模块707，用于当所述状态观测器误差和所述合围误差均收敛于零时，确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。

作为一种可选的实施方式，所述合围控制协议构建模块702，具体包括：

第一参数确定单元，用于确定所述初步合围控制协议的待求参数。

作为一种可选的实施方式，所述状态观测器构建模块703，具体包括：

其中，

为跟随者对领导者的状态估计值的导数，I_M为M阶单位阵，

A为n阶实方阵，

为跟随者对领导者的状态估计值，

否则

表示通讯时延下第i个跟随者的状态估计值，

作为一种可选的实施方式，所述多智能体系统构建模块704中的所述线性多智能体系统模型为：

其中，x_i(t)为第i个跟随者对应的状态向量，

为第j个领导者对应的状态向量的导数，O_L为领导者的集合。

作为一种可选的实施方式，所述误差计算模块705，具体包括：

其中，e₁为合围误差，

为第j个领导者对应的状态向量的导数。

其中，e₂为状态观测器误差，

为跟随者对领导者的状态估计值的导数。

本实施例提供的多智能体系统合围控制系统，实现了时变通信时延和切换拓扑同时存在下的多智能体系统合围控制；考虑的多智能体系统是一般的线性系统模型，该模型具有广泛的应用

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种多智能体系统合围控制方法，其特征在于，包括：

判断所述状态观测器误差和所述合围误差是否均收敛于零；

2.根据权利要求1所述的一种多智能体系统合围控制方法，其特征在于，所述由跟随者对应的状态数据和跟随者对领导者的状态估计值，构建合围控制协议，具体包括：

确定所述初步合围控制协议的待求参数；

3.根据权利要求1所述的一种多智能体系统合围控制方法，其特征在于，所述由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据，构建状态观测器，具体包括：

其中，

为跟随者对领导者的状态估计值的导数，I_M为M阶单位阵，

A为n阶实方阵，

为跟随者对领导者的状态估计值，

否则

表示通讯时延下第i个跟随者的状态估计值，

确定所述初步状态观测器的待求参数；

将待求参数确定后的初步状态观测器确定为状态观测器。

4.根据权利要求1所述的一种多智能体系统合围控制方法，其特征在于，所述线性多智能体系统模型为：

其中，x_i(t)为第i个跟随者对应的状态向量，

为第j个领导者对应的状态向量的导数，O_L为领导者的集合。

5.根据权利要求1所述的一种多智能体系统合围控制方法，其特征在于，所述由所述线性多智能体系统模型和所述状态观测器，得到状态观测器误差和合围误差，具体包括：

由所述线性多智能体系统模型确定合围误差

其中，e₁为合围误差，

为第j个领导者对应的状态向量的导数；

其中，e₂为状态观测器误差，

为跟随者对领导者的状态估计值的导数。

6.一种多智能体系统合围控制系统，其特征在于，包括：

7.根据权利要求6所述的一种多智能体系统合围控制系统，其特征在于，所述合围控制协议构建模块，具体包括：

8.根据权利要求6所述的一种多智能体系统合围控制系统，其特征在于，所述状态观测器构建模块，具体包括：

其中，

为跟随者对领导者的状态估计值的导数，I_M为M阶单位阵，

A为n阶实方阵，

为跟随者对领导者的状态估计值，

否则

表示通讯时延下第i个跟随者的状态估计值，

9.根据权利要求6所述的一种多智能体系统合围控制系统，其特征在于，所述多智能体系统构建模块中的所述线性多智能体系统模型为：

其中，x_i(t)为第i个跟随者对应的状态向量，

为第j个领导者对应的状态向量的导数，O_L为领导者的集合。

10.根据权利要求6所述的一种多智能体系统合围控制系统，其特征在于，所述误差计算模块，具体包括：

其中，e₁为合围误差，

为第j个领导者对应的状态向量的导数；

其中，e₂为状态观测器误差，

为跟随者对领导者的状态估计值的导数。