CN111176327A - 一种多智能体系统合围控制方法及系统 - Google Patents
一种多智能体系统合围控制方法及系统 Download PDFInfo
- Publication number
- CN111176327A CN111176327A CN202010049585.1A CN202010049585A CN111176327A CN 111176327 A CN111176327 A CN 111176327A CN 202010049585 A CN202010049585 A CN 202010049585A CN 111176327 A CN111176327 A CN 111176327A
- Authority
- CN
- China
- Prior art keywords
- state
- follower
- leader
- agent system
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004891 communication Methods 0.000 claims abstract description 107
- 239000003795 chemical substances by application Substances 0.000 claims description 148
- 239000013598 vector Substances 0.000 claims description 61
- 239000011159 matrix material Substances 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 8
- 239000007787 solid Substances 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 240000006829 Ficus sundaica Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
- G05D1/104—Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种多智能体系统合围控制方法及系统。该方法包括:获取多智能体系统中所有智能体的状态数据;多智能体系统中M个智能体为领导者,N个智能体为跟随者;由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;由跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;依据合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;由线性多智能体系统模型和状态观测器,得到状态观测器误差和合围误差;当状态观测器误差和合围误差均收敛于零时,确定多智能体系统实现状态合围控制。本发明能实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制。
Description
技术领域
本发明涉及协同控制技术领域,特别是涉及一种多智能体系统合围控制方法及系统。
背景技术
随着技术的进步,多智能体的协同控制具有广阔的应用前景。协同控制包含一致性控制、合围控制和编队控制等。合围控制是机器人系统协同控制领域中的重要课题之一,多智能体系统实现状态合围控制定义为跟随者的状态进入领导者状态张成的凸包的内部。
随着实际应用的要求,信息传输速率的有限性必然会导致通信存在时延,同时这种时延还会随着数据量的多少以及可用通信带宽的大小而改变,通信时延会改变系统的控制性能,甚至会使原本稳定的合围控制系统变得不稳定。因此需要对时变通信时延存在下的多智能体系统合围控制进行研究。由于队形的改变、通信设备的故障等原因,对智能体系统主体之间的通信拓扑会发生切换。拓扑的切换会改变系统的连通性及各主体之间的相互作用关系,导致个体之间无法进行协同,更无法实现合围控制,因此进一步研究拓扑切换下的合围控制也是重中之重。
随着一致性控制理论的的发展和完善,基于一致性的合围控制方法逐渐的到了广泛的应用。该方法仅利用邻居节点的相对信息设计本地控制器,结构较为简单,具有较好的稳定性和可扩展性。
目前,现有的基于一致性的分布式合围控制方法主要研究通信时延和切换拓扑单独存在下的合围控制。由于通讯时延和切换拓扑的广泛性,已有的单独考虑的控制器设计方法难以直接应用。因此,如何实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制成为目前亟待解决的问题。
发明内容
基于此,有必要提供一种多智能体系统合围控制方法及系统,以实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制。
为实现上述目的,本发明提供了如下方案:
一种多智能体系统合围控制方法,包括:
获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断所述状态观测器误差和所述合围误差是否均收敛于零;
当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
可选的,所述由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议,具体包括:
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益, 为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
确定所述初步合围控制协议的待求参数;
将待求参数确定后的初步合围控制协议确定为合围控制协议。
可选的,所述由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器,具体包括:
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
其中,为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,A为n阶实方阵,为跟随者对领导者的状态估计值, 为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时否则t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
确定所述初步状态观测器的待求参数;
将待求参数确定后的初步状态观测器确定为状态观测器。
可选的,所述线性多智能体系统模型为:
其中,xi(t)为第i个跟随者对应的状态向量,为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,为第j个领导者对应的状态向量的导数,OL为领导者的集合。
可选的,所述由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差,具体包括:
由所述线性多智能体系统模型确定合围误差
由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
本发明还提供了一种多智能体系统合围控制系统,包括:
状态数据获取模块,用于获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
合围控制协议构建模块,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
状态观测器构建模块,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
多智能体系统构建模块,用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
误差计算模块,用于由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断模块,用于判断所述状态观测器误差和所述合围误差是否均收敛于零;
合围控制模块,用于当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
可选的,所述合围控制协议构建模块,具体包括:
第一初步构建单元,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益, 为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
第一参数确定单元,用于确定所述初步合围控制协议的待求参数;
合围控制协议确定单元,用于将待求参数确定后的初步合围控制协议确定为合围控制协议。
可选的,所述状态观测器构建模块,具体包括:
第二初步构建单元,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
其中,为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,A为n阶实方阵,为跟随者对领导者的状态估计值, 为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时否则t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
第二参数确定单元,用于确定所述初步状态观测器的待求参数;
状态观测器确定单元,用于将待求参数确定后的初步状态观测器确定为状态观测器。
可选的,所述多智能体系统构建模块中的所述线性多智能体系统模型为:
其中,xi(t)为第i个跟随者对应的状态向量,为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,为第j个领导者对应的状态向量的导数,OL为领导者的集合。
可选的,所述误差计算模块,具体包括:
第一误差计算单元,用于由所述线性多智能体系统模型确定合围误差
第二误差计算单元,用于由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
与现有技术相比,本发明的有益效果是:
本发明提出了一种多智能体系统合围控制方法及系统。该方法基于状态观测器的合围控制协议考虑了时延和通信拓扑切换,这两个因素在现实场景中普遍存在,因此,采用本发明的方法或系统,实现了时变通信时延和切换拓扑同时存在下的多智能体系统合围控制;本发明考虑的多智能体系统是一般的线性系统模型,该模型具有广泛的应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1一种多智能体系统合围控制方法的流程图;
图2为多智能系统的三种切换拓扑图;
图3为切换拓扑信号示意图;
图4为多智能体系统在不同时刻的状态轨迹截图;
图5为随着时间变化状态观测器误差的变化图;
图6为随着时间变化合围误差的变化图;
图7为本发明实施例3一种多智能体系统合围控制系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
图1为本发明实施例1一种多智能体系统合围控制方法的流程图。
参见图1,实施例的多智能体系统合围控制方法包括:
101:获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者。V=M+N。
102:由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议。
所述102,具体包括:
21)由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益, 为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数。
22)确定所述初步合围控制协议的待求参数。具体的:选取所述初步合围控制协议的待求参数为设定值;将设定矩阵的特征值指定到左半复平面的设定位置;所述设定矩阵为A+BK1;其中,A为n阶实方阵,B为n×m阶列满秩实矩阵;若(A,B)是可控的,则确定初步合围控制协议的待求参数为所述设定值,若(A,B)不可控,则重新选取所述初步合围控制协议的待求参数的设定值,直到(A,B)可控。
该步骤中(A,B)是否可控的判断过程为:
考虑如下的线性系统
如果对于任意给定初始状态x(0),总存在控制输入u(t)使得上述线性系统的解x(t)能够在有限时间内达到原点,则称上述线性系统称系统是能控的(可控的)或称(A,B)是能控的。
23)将待求参数确定后的初步合围控制协议确定为合围控制协议。
103:由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器。
所述103,具体包括:
31)由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
其中,为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,A为n阶实方阵,为跟随者对领导者的状态估计值, 为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时否则t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。本实施例中,0≤τ(t)≤σ′,同时满足其中σ′与δ均为已知常数,上式表明通信时延与通信时延的变化率均有界。
32)确定所述初步状态观测器的待求参数。
33)将待求参数确定后的初步状态观测器确定为状态观测器。
104:依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型。
所述线性多智能体系统模型为:
其中,xi(t)为第i个跟随者对应的状态向量,为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,为第j个领导者对应的状态向量的导数,OL为领导者的集合。
105:由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差。
所述105,具体包括:
51)由所述线性多智能体系统模型确定合围误差
52)由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
106:判断所述状态观测器误差和所述合围误差是否均收敛于零。
107:当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
下面提供了一个更为具体的实施例。
实施例2:
本实施例基于状态观测器,提出时延和通信拓扑切换同时存在下,针对一般线性多智能体系统状态合围控制协议,并设计了详细可行的方案来确定协议中的参数。在通信拓扑切换和一定程度的时延情况下,所提出的方法可保证多智能体系统实现状态合围控制。本实施例提供的多智能体系统合围控制方法包括如下步骤:
步骤1:通信时延和切换下的多智能体系统建模。
(1)多智能体系统建模
多智能体系统是多个智能体组成的集合,每个智能体能够对自身进行控制,并具备多个智能体间互相通信的能力,考虑由M+N个多智能体组成的系统(例如可考虑由M+N架无人机组成的系统),其中包含有M个领导者和N个跟随者,将领导者集合记为OL={1,2,…,M},跟随者集合记为OF={1,2,…,N},一般线性多智能体系统描述如下:
其中,i表示第i个跟随者,xi(t)表示第i个跟随者的状态向量,xi(t)是由跟随者对应的状态数据构建而成的,当多智能体系统为由M+N架无人机组成的系统时,跟随者对应的状态数据为无人机的位置和速度,表示第i个跟随者的状态向量的导数,ui(t)为第i个跟随者的控制输入,zj(t)表示第j个领导者的状态向量,表示第j个领导者的状态向量的导数,A为n阶实方阵,B为n×m阶列满秩实矩阵。
(2)合围定义
则称多智能体系统实现了状态合围。
(3)时延和通信拓扑切换建模
智能体间的通信拓扑是切换的,并且存在一个无限的无重叠时间间隔序列其中tk+1-tk≥Td>0,Td是驻留时间(dwell time),期间拓扑保持不变,为自然数集,时间序列tk被称为切换时序,在每个tk时刻智能体系统间的通信拓扑发生切换。σ(t):[0,+∞)→{1,2,…,p}表示切换函数,其函数值表示t时刻对应的通信拓扑的编号。Gσ(t)是σ(t)对应的交互拓扑,Lσ(t)为Gσ(t)对应的拉普拉斯矩阵,为对应拓扑结构下跟随者之间的作用拓扑图,为对应的拉普拉斯矩阵。本实施例中,跟随者对应的作用拓扑是无向且连通的。同时至少有一个跟随者可以获得所有领导者信息。
步骤2:设计基于一致性的合围控制器。
给出存在时延和切换下的多智能体系统的合围控制协议如下:
ui(t)为跟随者对应的控制输入。
其中针对每个跟随者i(i=1,2,…,N),构造如下的状态观测器:
其中,IM为M阶单位阵, 代表第i个跟随者对第j个领导者的状态估计,为领导者状态矩阵,K1、K2是具有匹配维数的常数增益矩阵(待求参数),ρij为预先确定的合围增益满足 为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者信息时否则τ(t)是对应的时变通信时延,满足0≤τ(t)≤σ′,同时满足t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。
令为对应拓扑下跟随者之间对应的实对称拉普拉斯矩阵,Bσ(t)为对应通讯拓扑结构下,由非负整数所组成的对角阵,令 是实对称正定矩阵Hσ(t)在σ(t)时的特征值。且所有切换下,特征值最小值为 特征值最大值为
步骤3:确定合围控制协议与状态观测器的参数。
以下给出的合围控制协议中的参数Ki,(i=1,2)的设计方法。
(1)选取K1来分配矩阵A+BK1的特征值,将特征值指定到左半复平面的特定位置,如果(A,B)是可控的,则K1的存在是可以得到保证的。
其中,*表示对称元素,
上述这些参量对应LMI中每一项的系数,LMI是求解线性矩阵不等式,这个矩阵不等式满足上述的式子,每一项都含有未知系数R,Ω,S和实矩阵上面的每个系数我都有解释,未知系数R,Ω,S和实矩阵0≤τ(t)≤σ′,同时满足σ′与δ这两个数与时延相关是后面仿真自己给定的参数,令 是实对称正定矩阵Hσ(t)的特征值。且所有切换下,特征值最小值为 特征值最大值为
本实施例中的多智能体系统合围控制方法,由于对任意的i∈{1,2,3,…,N}和对任意的切换拓扑σ(t)∈{1,2,…,p},(这是一个不等式,对于每一个切换拓扑需要所有特征值带入,都需要成立,转变成对所有切换拓扑,特征值的最大值和最小值成立就可以了)成立,当且仅当对任意的i∈{1,2},本实施例利用这一特点将p×N个线性矩阵不等式(即σ(t)=1,2,…,p,i=1,2,…,N)的求解问题简化为了两个线性矩阵不等式的求解问题。这极大的提高了计算效率,同时不增加保守性。
下面对本实施例中的多智能体系统合围控制方法进行了仿真验证,验证时延和切换下多智能体系统的合围效果。
考虑由七个智能体组成的三阶多智能体系统,其中4个领导者,3个跟随者,1,2,3,4代表领导者,5,6,7代表跟随者,其状态向量为xi(t)=[xi1(t),xi2(t),xi3(t)]T,zi(t)=[zi1(t),zi2(t),zi3(t)]T且
时延τ(t)=0.05+0.01cos(t),通信拓扑在图1所示的三个拓扑中切换,切换的时间间隔为10秒。
预先确定的合围增益为
通过取K1=[1.4918 -0.5574 1.6230]可以将A+BK1的特征值配置到-1,-2和-3。求解,得到
为了简单起见,四个领导者初始状态分别为z1(0)=[1.2472,-0.2347,-1.0743]T,z2(0)=[0.4672,1.3785,0.8766]T,z3(0)=[1.3020,1.0474,-1.3929]T,z4(0)=[0.7294,0.7732,0.5362]T,三个跟随者的初始状态为随机值,状态观测器初始状态为0。
图2为多智能系统的三种切换拓扑图,该图表示每10s切换的拓扑信号对应的通讯拓扑图。图3为切换拓扑信号示意图,图3中横坐标是时间,纵坐标对应的数值1、2、3分别指的是切换的信号,这三种信号分别对应图2中的(a)、(b)、(c)三种拓扑,例如,1对应图2中的(a)部分,表示在1持续的10s内,对应的拓扑是(a),以此类推。
图4为多智能体系统在不同时刻的状态轨迹截图,图4中跟随者状态为方框,其他形状为领导者的状态,领导者状态形成的凸包用虚线来表示。图4中的(a)、(b)、(c)、(d)这四个部分分别表示每个智能体的状态t=1,6,36,50s时对应的状态图(状态是3维),因此这四个部分均为对应的三维图。由图4可以看出随着时间的推移,跟随者的状态逐渐进入到领导者状态形成的凸包内部。由图5与图6可知在合围控制协议与状态观测器的作用下,状态观测器误差与合围误差均逐渐收敛于零,即实现通信时延和拓扑切换同时存在下的状态合围控制。图5和图6的横坐标都是对应仿真时间,纵坐标表示均误差。图5表示的状态观测器的误差e1随着时间的变化。图6是合围误差e1随着时间的变化。本实例验证了所提出方法的有效性。
本实施例的多智能体系统合围控制方法,步骤1给出的多智能体系统合围控制协议具有广泛的适用性;考虑的多智能体系统是一般的线性系统模型,该模型具有广泛的应用;基于状态观测器的合围控制协议考虑了时延和通信拓扑切换,这两个因素在现实场景中普遍存在,并且没有时延或通信拓扑切换的情况属于所考虑的问题的特殊情况,因此该控制协议可应用于没有时延或通信拓扑切换的多智能体系统合围控制问题;步骤4有效地利用了线性矩阵不等式的特性,大大提高了求解编队控制协议中的增益矩阵的计算效率。
实施例3:
本发明还提供了一种多智能体系统合围控制系统,图7为本发明实施例3一种多智能体系统合围控制系统的结构示意图。
参见图7,实施例的多智能体系统合围控制系统,包括:
状态数据获取模块701,用于获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N。
合围控制协议构建模块702,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议。
状态观测器构建模块703,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器。
多智能体系统构建模块704,用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型。
误差计算模块705,用于由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差。
判断模块706,用于判断所述状态观测器误差和所述合围误差是否均收敛于零。
合围控制模块707,用于当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
作为一种可选的实施方式,所述合围控制协议构建模块702,具体包括:
第一初步构建单元,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益, 为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
第一参数确定单元,用于确定所述初步合围控制协议的待求参数。
合围控制协议确定单元,用于将待求参数确定后的初步合围控制协议确定为合围控制协议。
作为一种可选的实施方式,所述状态观测器构建模块703,具体包括:
第二初步构建单元,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
其中,为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,A为n阶实方阵,为跟随者对领导者的状态估计值, 为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时否则t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。
第二参数确定单元,用于确定所述初步状态观测器的待求参数;
状态观测器确定单元,用于将待求参数确定后的初步状态观测器确定为状态观测器。
作为一种可选的实施方式,所述多智能体系统构建模块704中的所述线性多智能体系统模型为:
其中,xi(t)为第i个跟随者对应的状态向量,为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,为第j个领导者对应的状态向量的导数,OL为领导者的集合。
作为一种可选的实施方式,所述误差计算模块705,具体包括:
第一误差计算单元,用于由所述线性多智能体系统模型确定合围误差
第二误差计算单元,用于由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
本实施例提供的多智能体系统合围控制系统,实现了时变通信时延和切换拓扑同时存在下的多智能体系统合围控制;考虑的多智能体系统是一般的线性系统模型,该模型具有广泛的应用
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种多智能体系统合围控制方法,其特征在于,包括:
获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断所述状态观测器误差和所述合围误差是否均收敛于零;
当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
3.根据权利要求1所述的一种多智能体系统合围控制方法,其特征在于,所述由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器,具体包括:
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
其中,为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,A为n阶实方阵,为跟随者对领导者的状态估计值, 为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时否则t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
确定所述初步状态观测器的待求参数;
将待求参数确定后的初步状态观测器确定为状态观测器。
6.一种多智能体系统合围控制系统,其特征在于,包括:
状态数据获取模块,用于获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
合围控制协议构建模块,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
状态观测器构建模块,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
多智能体系统构建模块,用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
误差计算模块,用于由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断模块,用于判断所述状态观测器误差和所述合围误差是否均收敛于零;
合围控制模块,用于当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
8.根据权利要求6所述的一种多智能体系统合围控制系统,其特征在于,所述状态观测器构建模块,具体包括:
第二初步构建单元,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
其中,为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,A为n阶实方阵,为跟随者对领导者的状态估计值, 为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时否则t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,表示通讯时延下第i个跟随者的状态估计值,表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
第二参数确定单元,用于确定所述初步状态观测器的待求参数;
状态观测器确定单元,用于将待求参数确定后的初步状态观测器确定为状态观测器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010049585.1A CN111176327B (zh) | 2020-01-16 | 2020-01-16 | 一种多智能体系统合围控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010049585.1A CN111176327B (zh) | 2020-01-16 | 2020-01-16 | 一种多智能体系统合围控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111176327A true CN111176327A (zh) | 2020-05-19 |
CN111176327B CN111176327B (zh) | 2021-01-26 |
Family
ID=70657977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010049585.1A Active CN111176327B (zh) | 2020-01-16 | 2020-01-16 | 一种多智能体系统合围控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111176327B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111665848A (zh) * | 2020-06-28 | 2020-09-15 | 北京航空航天大学 | 拓扑切换下无人机与无人车异构集群编队跟踪控制方法 |
CN111766783A (zh) * | 2020-06-29 | 2020-10-13 | 北京航空航天大学 | 一种面向集群系统的有限时间内收敛的编队合围跟踪方法 |
CN112230679A (zh) * | 2020-12-15 | 2021-01-15 | 中国人民解放军国防科技大学 | 基于延时的群组耦合系统协同控制方法和装置 |
CN112379626A (zh) * | 2020-11-23 | 2021-02-19 | 哈尔滨理工大学 | 具有外部干扰的多智能体系统分组领导跟随一致的方法 |
CN112947557A (zh) * | 2021-02-07 | 2021-06-11 | 河北科技大学 | 一种切换拓扑下的多智能体容错跟踪控制方法 |
CN113239513A (zh) * | 2021-04-01 | 2021-08-10 | 中国电子科技集团公司信息科学研究院 | 多智能体的一致性分析方法、系统及应用 |
CN113259259A (zh) * | 2021-05-13 | 2021-08-13 | 哈尔滨理工大学 | 一种带有通信时延的异构多智能体系统输出一致性方法 |
CN113296410A (zh) * | 2021-05-26 | 2021-08-24 | 哈尔滨理工大学 | 一种切换拓扑下的多智能体系统的领导跟随一致性方法 |
CN116610106A (zh) * | 2023-07-20 | 2023-08-18 | 南京信息工程大学 | 一种多无人机容错跟踪控制方法 |
CN116700012A (zh) * | 2023-07-19 | 2023-09-05 | 合肥工业大学 | 一种多智能体的避撞编队合围控制器的设计方法 |
CN116740922A (zh) * | 2023-05-08 | 2023-09-12 | 海南大学 | 一种基于模糊观测协议的智慧交通系统的控制方法 |
CN118151544A (zh) * | 2024-05-11 | 2024-06-07 | 北京理工大学长三角研究院(嘉兴) | 一种多智能体系统在合围控制中的自适应容错控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017189086A1 (en) * | 2016-04-28 | 2017-11-02 | Raytheon Company | Cellular enabled restricted zone monitoring |
CN108845590A (zh) * | 2018-07-06 | 2018-11-20 | 哈尔滨工业大学(威海) | 一种时延环境下的多无人机协同编队控制方法 |
CN110069076A (zh) * | 2019-04-23 | 2019-07-30 | 北京航空航天大学 | 一种基于猛狼围捕行为的无人机集群空战方法 |
-
2020
- 2020-01-16 CN CN202010049585.1A patent/CN111176327B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017189086A1 (en) * | 2016-04-28 | 2017-11-02 | Raytheon Company | Cellular enabled restricted zone monitoring |
CN108845590A (zh) * | 2018-07-06 | 2018-11-20 | 哈尔滨工业大学(威海) | 一种时延环境下的多无人机协同编队控制方法 |
CN110069076A (zh) * | 2019-04-23 | 2019-07-30 | 北京航空航天大学 | 一种基于猛狼围捕行为的无人机集群空战方法 |
Non-Patent Citations (1)
Title |
---|
韩亮 等: ""多无人机协同控制方法及应用研究"", 《导航定位与授时》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111665848B (zh) * | 2020-06-28 | 2020-12-11 | 北京航空航天大学 | 拓扑切换下无人机与无人车异构集群编队跟踪控制方法 |
CN111665848A (zh) * | 2020-06-28 | 2020-09-15 | 北京航空航天大学 | 拓扑切换下无人机与无人车异构集群编队跟踪控制方法 |
CN111766783B (zh) * | 2020-06-29 | 2021-08-24 | 北京航空航天大学 | 一种面向集群系统的有限时间内收敛的编队合围跟踪方法 |
CN111766783A (zh) * | 2020-06-29 | 2020-10-13 | 北京航空航天大学 | 一种面向集群系统的有限时间内收敛的编队合围跟踪方法 |
CN112379626A (zh) * | 2020-11-23 | 2021-02-19 | 哈尔滨理工大学 | 具有外部干扰的多智能体系统分组领导跟随一致的方法 |
CN112230679A (zh) * | 2020-12-15 | 2021-01-15 | 中国人民解放军国防科技大学 | 基于延时的群组耦合系统协同控制方法和装置 |
CN112947557B (zh) * | 2021-02-07 | 2023-06-23 | 河北科技大学 | 一种切换拓扑下的多智能体容错跟踪控制方法 |
CN112947557A (zh) * | 2021-02-07 | 2021-06-11 | 河北科技大学 | 一种切换拓扑下的多智能体容错跟踪控制方法 |
CN113239513A (zh) * | 2021-04-01 | 2021-08-10 | 中国电子科技集团公司信息科学研究院 | 多智能体的一致性分析方法、系统及应用 |
CN113239513B (zh) * | 2021-04-01 | 2023-06-30 | 中国电子科技集团公司信息科学研究院 | 多智能体的一致性分析方法、系统及应用 |
CN113259259B (zh) * | 2021-05-13 | 2024-04-19 | 哈尔滨理工大学 | 一种带有通信时延的异构多智能体系统输出一致性方法 |
CN113259259A (zh) * | 2021-05-13 | 2021-08-13 | 哈尔滨理工大学 | 一种带有通信时延的异构多智能体系统输出一致性方法 |
CN113296410A (zh) * | 2021-05-26 | 2021-08-24 | 哈尔滨理工大学 | 一种切换拓扑下的多智能体系统的领导跟随一致性方法 |
CN116740922B (zh) * | 2023-05-08 | 2024-04-05 | 海南大学 | 一种基于模糊观测协议的智慧交通系统的控制方法 |
CN116740922A (zh) * | 2023-05-08 | 2023-09-12 | 海南大学 | 一种基于模糊观测协议的智慧交通系统的控制方法 |
CN116700012A (zh) * | 2023-07-19 | 2023-09-05 | 合肥工业大学 | 一种多智能体的避撞编队合围控制器的设计方法 |
CN116700012B (zh) * | 2023-07-19 | 2024-03-01 | 合肥工业大学 | 一种多智能体的避撞编队合围控制器的设计方法 |
CN116610106B (zh) * | 2023-07-20 | 2023-09-22 | 南京信息工程大学 | 一种多无人机容错跟踪控制方法 |
CN116610106A (zh) * | 2023-07-20 | 2023-08-18 | 南京信息工程大学 | 一种多无人机容错跟踪控制方法 |
CN118151544A (zh) * | 2024-05-11 | 2024-06-07 | 北京理工大学长三角研究院(嘉兴) | 一种多智能体系统在合围控制中的自适应容错控制方法 |
CN118151544B (zh) * | 2024-05-11 | 2024-07-23 | 北京理工大学长三角研究院(嘉兴) | 一种多智能体系统在合围控制中的自适应容错控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111176327B (zh) | 2021-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111176327B (zh) | 一种多智能体系统合围控制方法及系统 | |
CN111443715B (zh) | 一种集群系统编队-合围控制方法及系统 | |
Zhu et al. | Distributed Nash equilibrium seeking in an aggregative game on a directed graph | |
CN109683477B (zh) | 一种随机多智能体系统有限时间控制器的设计方法及系统 | |
Chen et al. | Stabilizing solution and parameter dependence of modified algebraic Riccati equation with application to discrete-time network synchronization | |
Zhao et al. | $ H_ {\infty} $ Consensus and Synchronization of Nonlinear Systems Based on A Novel Fuzzy Model | |
Ge et al. | Stable adaptive control for nonlinear multivariable systems with a triangular control structure | |
CN112987790B (zh) | 一种分布式异构集群系统分组编队跟踪控制方法和系统 | |
Ali et al. | Synchronization of master-slave Markovian switching complex dynamical networks with time-varying delays in nonlinear function via sliding mode control | |
CN110376889A (zh) | 具有时变时滞的异构网络化多智能体系统分组一致的方法 | |
CN113176732B (zh) | 一种非线性随机多智能体系统固定时间一致控制方法 | |
CN113900380B (zh) | 一种异构集群系统鲁棒输出编队跟踪控制方法及系统 | |
CN116661347B (zh) | 一种含不确定时滞的多智能体一致性控制方法 | |
Yucelen et al. | Active-passive networked multiagent systems | |
CN112527016A (zh) | 一种智能集群一体化容错时变编队控制方法及系统 | |
Poonawala et al. | Decentralized estimation of the algebraic connectivity for strongly connected networks | |
CN118170034B (zh) | 一种具有通信丢包的异构多智能体系统均方一致控制方法 | |
Ryu et al. | Distributed Kalman-filtering: Distributed optimization viewpoint | |
CN114637278A (zh) | 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法 | |
Yang et al. | Distributed estimation of graph spectrum | |
CN113515066B (zh) | 一种非线性多智能体系统动态事件触发控制方法 | |
CN110673651A (zh) | 一种通信受限条件下的无人机群鲁棒编队方法 | |
Nitzan et al. | Cyclic Bayesian Cramér-Rao bound for filtering in circular state space | |
Yang et al. | Optimal information propagation in sensor networks | |
CN114545777A (zh) | 基于改进q函数的多智能体一致性强化学习方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |