CN111176327B - 一种多智能体系统合围控制方法及系统 - Google Patents

一种多智能体系统合围控制方法及系统 Download PDF

Info

Publication number
CN111176327B
CN111176327B CN202010049585.1A CN202010049585A CN111176327B CN 111176327 B CN111176327 B CN 111176327B CN 202010049585 A CN202010049585 A CN 202010049585A CN 111176327 B CN111176327 B CN 111176327B
Authority
CN
China
Prior art keywords
state
follower
leader
agent system
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010049585.1A
Other languages
English (en)
Other versions
CN111176327A (zh
Inventor
董希旺
周诗钰
任章
李清东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010049585.1A priority Critical patent/CN111176327B/zh
Publication of CN111176327A publication Critical patent/CN111176327A/zh
Application granted granted Critical
Publication of CN111176327B publication Critical patent/CN111176327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种多智能体系统合围控制方法及系统。该方法包括:获取多智能体系统中所有智能体的状态数据;多智能体系统中M个智能体为领导者,N个智能体为跟随者;由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;由跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;依据合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;由线性多智能体系统模型和状态观测器,得到状态观测器误差和合围误差;当状态观测器误差和合围误差均收敛于零时,确定多智能体系统实现状态合围控制。本发明能实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制。

Description

一种多智能体系统合围控制方法及系统
技术领域
本发明涉及协同控制技术领域,特别是涉及一种多智能体系统合围控制方法及系统。
背景技术
随着技术的进步,多智能体的协同控制具有广阔的应用前景。协同控制包含一致性控制、合围控制和编队控制等。合围控制是机器人系统协同控制领域中的重要课题之一,多智能体系统实现状态合围控制定义为跟随者的状态进入领导者状态张成的凸包的内部。
随着实际应用的要求,信息传输速率的有限性必然会导致通信存在时延,同时这种时延还会随着数据量的多少以及可用通信带宽的大小而改变,通信时延会改变系统的控制性能,甚至会使原本稳定的合围控制系统变得不稳定。因此需要对时变通信时延存在下的多智能体系统合围控制进行研究。由于队形的改变、通信设备的故障等原因,对智能体系统主体之间的通信拓扑会发生切换。拓扑的切换会改变系统的连通性及各主体之间的相互作用关系,导致个体之间无法进行协同,更无法实现合围控制,因此进一步研究拓扑切换下的合围控制也是重中之重。
随着一致性控制理论的的发展和完善,基于一致性的合围控制方法逐渐的到了广泛的应用。该方法仅利用邻居节点的相对信息设计本地控制器,结构较为简单,具有较好的稳定性和可扩展性。
目前,现有的基于一致性的分布式合围控制方法主要研究通信时延和切换拓扑单独存在下的合围控制。由于通讯时延和切换拓扑的广泛性,已有的单独考虑的控制器设计方法难以直接应用。因此,如何实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制成为目前亟待解决的问题。
发明内容
基于此,有必要提供一种多智能体系统合围控制方法及系统,以实现时变通信时延和切换拓扑同时存在下的多智能体系统合围控制。
为实现上述目的,本发明提供了如下方案:
一种多智能体系统合围控制方法,包括:
获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断所述状态观测器误差和所述合围误差是否均收敛于零;
当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
可选的,所述由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议,具体包括:
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
Figure BDA0002370643110000021
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000022
Figure BDA0002370643110000023
为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
确定所述初步合围控制协议的待求参数;
将待求参数确定后的初步合围控制协议确定为合围控制协议。
可选的,所述由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器,具体包括:
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
Figure BDA0002370643110000031
其中,
Figure BDA0002370643110000032
为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,
Figure BDA0002370643110000033
A为n阶实方阵,
Figure BDA0002370643110000034
为跟随者对领导者的状态估计值,
Figure BDA0002370643110000035
Figure BDA0002370643110000036
为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,
Figure BDA0002370643110000037
为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时
Figure BDA0002370643110000038
否则
Figure BDA0002370643110000039
t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure BDA00023706431100000310
表示通讯时延下第i个跟随者的状态估计值,
Figure BDA00023706431100000311
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
确定所述初步状态观测器的待求参数;
将待求参数确定后的初步状态观测器确定为状态观测器。
可选的,所述线性多智能体系统模型为:
Figure BDA00023706431100000312
其中,xi(t)为第i个跟随者对应的状态向量,
Figure BDA00023706431100000313
为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,
Figure BDA00023706431100000314
为第j个领导者对应的状态向量的导数,OL为领导者的集合。
可选的,所述由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差,具体包括:
由所述线性多智能体系统模型确定合围误差
Figure BDA00023706431100000315
其中,e1为合围误差,
Figure BDA0002370643110000041
为第i个跟随者对应的状态向量的导数,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000042
Figure BDA0002370643110000043
为第j个领导者对应的状态向量的导数;
由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
Figure BDA0002370643110000044
其中,e2为状态观测器误差,
Figure BDA0002370643110000045
为跟随者对领导者的状态估计值的导数。
本发明还提供了一种多智能体系统合围控制系统,包括:
状态数据获取模块,用于获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
合围控制协议构建模块,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
状态观测器构建模块,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
多智能体系统构建模块,用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
误差计算模块,用于由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断模块,用于判断所述状态观测器误差和所述合围误差是否均收敛于零;
合围控制模块,用于当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
可选的,所述合围控制协议构建模块,具体包括:
第一初步构建单元,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
Figure BDA0002370643110000051
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000052
Figure BDA0002370643110000053
为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
第一参数确定单元,用于确定所述初步合围控制协议的待求参数;
合围控制协议确定单元,用于将待求参数确定后的初步合围控制协议确定为合围控制协议。
可选的,所述状态观测器构建模块,具体包括:
第二初步构建单元,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
Figure BDA0002370643110000054
其中,
Figure BDA0002370643110000055
为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,
Figure BDA0002370643110000056
A为n阶实方阵,
Figure BDA0002370643110000057
为跟随者对领导者的状态估计值,
Figure BDA0002370643110000058
Figure BDA0002370643110000059
为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,
Figure BDA00023706431100000510
为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时
Figure BDA00023706431100000511
否则
Figure BDA00023706431100000512
t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure BDA00023706431100000513
表示通讯时延下第i个跟随者的状态估计值,
Figure BDA00023706431100000514
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
第二参数确定单元,用于确定所述初步状态观测器的待求参数;
状态观测器确定单元,用于将待求参数确定后的初步状态观测器确定为状态观测器。
可选的,所述多智能体系统构建模块中的所述线性多智能体系统模型为:
Figure BDA0002370643110000061
其中,xi(t)为第i个跟随者对应的状态向量,
Figure BDA0002370643110000062
为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,
Figure BDA0002370643110000063
为第j个领导者对应的状态向量的导数,OL为领导者的集合。
可选的,所述误差计算模块,具体包括:
第一误差计算单元,用于由所述线性多智能体系统模型确定合围误差
Figure BDA0002370643110000064
其中,e1为合围误差,
Figure BDA0002370643110000065
为第i个跟随者对应的状态向量的导数,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000066
Figure BDA0002370643110000067
为第j个领导者对应的状态向量的导数;
第二误差计算单元,用于由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
Figure BDA0002370643110000068
其中,e2为状态观测器误差,
Figure BDA0002370643110000069
为跟随者对领导者的状态估计值的导数。
与现有技术相比,本发明的有益效果是:
本发明提出了一种多智能体系统合围控制方法及系统。该方法基于状态观测器的合围控制协议考虑了时延和通信拓扑切换,这两个因素在现实场景中普遍存在,因此,采用本发明的方法或系统,实现了时变通信时延和切换拓扑同时存在下的多智能体系统合围控制;本发明考虑的多智能体系统是一般的线性系统模型,该模型具有广泛的应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1一种多智能体系统合围控制方法的流程图;
图2为多智能系统的三种切换拓扑图;
图3为切换拓扑信号示意图;
图4为多智能体系统在不同时刻的状态轨迹截图;
图5为随着时间变化状态观测器误差的变化图;
图6为随着时间变化合围误差的变化图;
图7为本发明实施例3一种多智能体系统合围控制系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
图1为本发明实施例1一种多智能体系统合围控制方法的流程图。
参见图1,实施例的多智能体系统合围控制方法包括:
101:获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者。V=M+N。
102:由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议。
所述102,具体包括:
21)由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
Figure BDA0002370643110000081
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000082
Figure BDA0002370643110000083
为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数。
22)确定所述初步合围控制协议的待求参数。具体的:选取所述初步合围控制协议的待求参数为设定值;将设定矩阵的特征值指定到左半复平面的设定位置;所述设定矩阵为A+BK1;其中,A为n阶实方阵,B为n×m阶列满秩实矩阵;若(A,B)是可控的,则确定初步合围控制协议的待求参数为所述设定值,若(A,B)不可控,则重新选取所述初步合围控制协议的待求参数的设定值,直到(A,B)可控。
该步骤中(A,B)是否可控的判断过程为:
考虑如下的线性系统
Figure BDA0002370643110000084
其中,
Figure BDA0002370643110000085
Figure BDA0002370643110000086
分别表示系统的常数矩阵,
Figure BDA0002370643110000087
Figure BDA0002370643110000088
Figure BDA0002370643110000089
分别表示系统的状态、控制输入和控制输出。下面给出上述线性系统能控性、能观测性、稳定性的判据。
如果对于任意给定初始状态x(0),总存在控制输入u(t)使得上述线性系统的解x(t)能够在有限时间内达到原点,则称上述线性系统称系统是能控的(可控的)或称(A,B)是能控的。
23)将待求参数确定后的初步合围控制协议确定为合围控制协议。
103:由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器。
所述103,具体包括:
31)由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
Figure BDA0002370643110000091
其中,
Figure BDA0002370643110000092
为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,
Figure BDA0002370643110000093
A为n阶实方阵,
Figure BDA0002370643110000094
为跟随者对领导者的状态估计值,
Figure BDA0002370643110000095
Figure BDA0002370643110000096
为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,
Figure BDA0002370643110000097
为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时
Figure BDA0002370643110000098
否则
Figure BDA0002370643110000099
t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure BDA00023706431100000910
表示通讯时延下第i个跟随者的状态估计值,
Figure BDA00023706431100000911
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。本实施例中,0≤τ(t)≤σ′,同时
Figure BDA00023706431100000912
满足
Figure BDA00023706431100000913
其中σ′与δ均为已知常数,上式表明通信时延与通信时延的变化率均有界。
32)确定所述初步状态观测器的待求参数。
33)将待求参数确定后的初步状态观测器确定为状态观测器。
104:依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型。
所述线性多智能体系统模型为:
Figure BDA00023706431100000914
其中,xi(t)为第i个跟随者对应的状态向量,
Figure BDA00023706431100000915
为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,
Figure BDA0002370643110000101
为第j个领导者对应的状态向量的导数,OL为领导者的集合。
105:由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差。
所述105,具体包括:
51)由所述线性多智能体系统模型确定合围误差
Figure BDA0002370643110000102
其中,e1为合围误差,
Figure BDA0002370643110000103
为第i个跟随者对应的状态向量的导数,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000104
Figure BDA0002370643110000105
为第j个领导者对应的状态向量的导数。
52)由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
Figure BDA0002370643110000106
其中,e2为状态观测器误差,
Figure BDA0002370643110000107
为跟随者对领导者的状态估计值的导数。
106:判断所述状态观测器误差和所述合围误差是否均收敛于零。
107:当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
所述107,具体为:当满足
Figure BDA0002370643110000108
Figure BDA0002370643110000109
时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
下面提供了一个更为具体的实施例。
实施例2:
本实施例基于状态观测器,提出时延和通信拓扑切换同时存在下,针对一般线性多智能体系统状态合围控制协议,并设计了详细可行的方案来确定协议中的参数。在通信拓扑切换和一定程度的时延情况下,所提出的方法可保证多智能体系统实现状态合围控制。本实施例提供的多智能体系统合围控制方法包括如下步骤:
步骤1:通信时延和切换下的多智能体系统建模。
(1)多智能体系统建模
多智能体系统是多个智能体组成的集合,每个智能体能够对自身进行控制,并具备多个智能体间互相通信的能力,考虑由M+N个多智能体组成的系统(例如可考虑由M+N架无人机组成的系统),其中包含有M个领导者和N个跟随者,将领导者集合记为OL={1,2,…,M},跟随者集合记为OF={1,2,…,N},一般线性多智能体系统描述如下:
Figure BDA0002370643110000111
其中,i表示第i个跟随者,xi(t)表示第i个跟随者的状态向量,xi(t)是由跟随者对应的状态数据构建而成的,当多智能体系统为由M+N架无人机组成的系统时,跟随者对应的状态数据为无人机的位置和速度,
Figure BDA0002370643110000112
表示第i个跟随者的状态向量的导数,ui(t)为第i个跟随者的控制输入,zj(t)表示第j个领导者的状态向量,
Figure BDA0002370643110000113
表示第j个领导者的状态向量的导数,A为n阶实方阵,B为n×m阶列满秩实矩阵。
(2)合围定义
如果对任意有界的初始状态和任意i∈{1,2,…,N},存在满足
Figure BDA0002370643110000114
的非负的常数ρij(j=1,2,…,M),使得:
Figure BDA0002370643110000115
则称多智能体系统实现了状态合围。
(3)时延和通信拓扑切换建模
通讯时延表示为τ(t),0≤τ(t)≤σ′,同时
Figure BDA0002370643110000116
满足
Figure BDA0002370643110000117
其中σ′与δ均为已知常数,上式表明通信时延与通信时延的变化率均有界。
用无向图
Figure BDA0002370643110000118
建模多智能体间的通信情况,其中
Figure BDA0002370643110000119
代表节点集,
Figure BDA00023706431100001110
为边集,
Figure BDA00023706431100001111
为无向图的领接矩阵;每个智能体建模为其中的一个节点,智能体间的通信建模为图中的一条边。
智能体间的通信拓扑是切换的,并且存在一个无限的无重叠时间间隔序列
Figure BDA00023706431100001112
其中tk+1-tk≥Td>0,Td是驻留时间(dwell time),期间拓扑保持不变,
Figure BDA00023706431100001113
为自然数集,时间序列tk被称为切换时序,在每个tk时刻智能体系统间的通信拓扑发生切换。σ(t):[0,+∞)→{1,2,…,p}表示切换函数,其函数值表示t时刻对应的通信拓扑的编号。Gσ(t)是σ(t)对应的交互拓扑,Lσ(t)为Gσ(t)对应的拉普拉斯矩阵,
Figure BDA0002370643110000121
为对应拓扑结构下跟随者之间的作用拓扑图,
Figure BDA0002370643110000122
Figure BDA0002370643110000123
对应的拉普拉斯矩阵。本实施例中,跟随者对应的作用拓扑
Figure BDA0002370643110000124
是无向且连通的。同时至少有一个跟随者可以获得所有领导者信息。
步骤2:设计基于一致性的合围控制器。
给出存在时延和切换下的多智能体系统的合围控制协议如下:
Figure BDA0002370643110000125
ui(t)为跟随者对应的控制输入。
其中针对每个跟随者i(i=1,2,…,N),构造如下的状态观测器:
Figure BDA0002370643110000126
其中,
Figure BDA0002370643110000127
IM为M阶单位阵,
Figure BDA0002370643110000128
Figure BDA0002370643110000129
代表第i个跟随者对第j个领导者的状态估计,
Figure BDA00023706431100001210
为领导者状态矩阵,K1、K2是具有匹配维数的常数增益矩阵(待求参数),ρij为预先确定的合围增益满足
Figure BDA00023706431100001211
Figure BDA00023706431100001212
为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者信息时
Figure BDA00023706431100001213
否则
Figure BDA00023706431100001214
τ(t)是对应的时变通信时延,满足0≤τ(t)≤σ′,同时
Figure BDA00023706431100001215
满足
Figure BDA00023706431100001216
t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure BDA00023706431100001217
表示通讯时延下第i个跟随者的状态估计值,
Figure BDA00023706431100001218
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。
Figure BDA00023706431100001219
为对应拓扑下跟随者之间对应的实对称拉普拉斯矩阵,Bσ(t)为对应通讯拓扑结构下,由非负整数
Figure BDA00023706431100001220
所组成的对角阵,
Figure BDA00023706431100001221
Figure BDA00023706431100001222
Figure BDA00023706431100001223
是实对称正定矩阵Hσ(t)在σ(t)时的特征值。且所有切换下,特征值最小值为
Figure BDA00023706431100001224
Figure BDA00023706431100001225
特征值最大值为
Figure BDA00023706431100001226
Figure BDA00023706431100001227
步骤3:确定合围控制协议与状态观测器的参数。
以下给出的合围控制协议中的参数Ki,(i=1,2)的设计方法。
(1)选取K1来分配矩阵A+BK1的特征值,将特征值指定到左半复平面的特定位置,如果(A,B)是可控的,则K1的存在是可以得到保证的。
(2)求解如下的线性矩阵不等式。如果存在正定对称的矩阵R,Ω,S和实矩阵
Figure BDA0002370643110000131
使得如下的线性矩阵不等式可行,则状态观测器中的增益矩阵
Figure BDA0002370643110000132
Figure BDA0002370643110000133
其中,*表示对称元素,
Figure BDA0002370643110000134
上述这些参量对应LMI中每一项的系数,LMI是求解线性矩阵不等式,这个矩阵不等式满足上述的式子,每一项都含有未知系数R,Ω,S和实矩阵
Figure BDA0002370643110000135
上面的每个系数我都有解释,未知系数R,Ω,S和实矩阵
Figure BDA0002370643110000136
0≤τ(t)≤σ′,同时
Figure BDA0002370643110000137
满足
Figure BDA0002370643110000138
σ′与δ这两个数与时延相关是后面仿真自己给定的参数,令
Figure BDA0002370643110000139
Figure BDA00023706431100001310
是实对称正定矩阵Hσ(t)的特征值。且所有切换下,特征值最小值为
Figure BDA00023706431100001311
Figure BDA00023706431100001312
特征值最大值为
Figure BDA00023706431100001313
Figure BDA00023706431100001314
本实施例中的多智能体系统合围控制方法,由于对任意的i∈{1,2,3,…,N}和对任意的切换拓扑σ(t)∈{1,2,…,p},
Figure BDA00023706431100001315
(这是一个不等式,对于每一个切换拓扑需要所有特征值带入,都需要成立,转变成对所有切换拓扑,特征值的最大值和最小值成立就可以了)成立,当且仅当对任意的i∈{1,2},
Figure BDA00023706431100001316
本实施例利用这一特点将p×N个线性矩阵不等式(即
Figure BDA00023706431100001317
σ(t)=1,2,…,p,i=1,2,…,N)的求解问题简化为了两个线性矩阵不等式
Figure BDA00023706431100001318
的求解问题。这极大的提高了计算效率,同时不增加保守性。
下面对本实施例中的多智能体系统合围控制方法进行了仿真验证,验证时延和切换下多智能体系统的合围效果。
考虑由七个智能体组成的三阶多智能体系统,其中4个领导者,3个跟随者,1,2,3,4代表领导者,5,6,7代表跟随者,其状态向量为xi(t)=[xi1(t),xi2(t),xi3(t)]T,zi(t)=[zi1(t),zi2(t),zi3(t)]T
Figure BDA0002370643110000141
时延τ(t)=0.05+0.01cos(t),通信拓扑在图1所示的三个拓扑中切换,切换的时间间隔为10秒。
预先确定的合围增益为
Figure BDA0002370643110000142
Figure BDA0002370643110000143
通过取K1=[1.4918 -0.5574 1.6230]可以将A+BK1的特征值配置到-1,-2和-3。求解,得到
Figure BDA0002370643110000144
为了简单起见,四个领导者初始状态分别为z1(0)=[1.2472,-0.2347,-1.0743]T,z2(0)=[0.4672,1.3785,0.8766]T,z3(0)=[1.3020,1.0474,-1.3929]T,z4(0)=[0.7294,0.7732,0.5362]T,三个跟随者的初始状态为随机值,状态观测器初始状态为0。
图2为多智能系统的三种切换拓扑图,该图表示每10s切换的拓扑信号对应的通讯拓扑图。图3为切换拓扑信号示意图,图3中横坐标是时间,纵坐标对应的数值1、2、3分别指的是切换的信号,这三种信号分别对应图2中的(a)、(b)、(c)三种拓扑,例如,1对应图2中的(a)部分,表示在1持续的10s内,对应的拓扑是(a),以此类推。
图4为多智能体系统在不同时刻的状态轨迹截图,图4中跟随者状态为方框,其他形状为领导者的状态,领导者状态形成的凸包用虚线来表示。图4中的(a)、(b)、(c)、(d)这四个部分分别表示每个智能体的状态t=1,6,36,50s时对应的状态图(状态是3维),因此这四个部分均为对应的三维图。由图4可以看出随着时间的推移,跟随者的状态逐渐进入到领导者状态形成的凸包内部。由图5与图6可知在合围控制协议与状态观测器的作用下,状态观测器误差与合围误差均逐渐收敛于零,即实现通信时延和拓扑切换同时存在下的状态合围控制。图5和图6的横坐标都是对应仿真时间,纵坐标表示均误差。图5表示的状态观测器的误差e1随着时间的变化。图6是合围误差e1随着时间的变化。本实例验证了所提出方法的有效性。
本实施例的多智能体系统合围控制方法,步骤1给出的多智能体系统合围控制协议具有广泛的适用性;考虑的多智能体系统是一般的线性系统模型,该模型具有广泛的应用;基于状态观测器的合围控制协议考虑了时延和通信拓扑切换,这两个因素在现实场景中普遍存在,并且没有时延或通信拓扑切换的情况属于所考虑的问题的特殊情况,因此该控制协议可应用于没有时延或通信拓扑切换的多智能体系统合围控制问题;步骤4有效地利用了线性矩阵不等式的特性,大大提高了求解编队控制协议中的增益矩阵的计算效率。
实施例3:
本发明还提供了一种多智能体系统合围控制系统,图7为本发明实施例3一种多智能体系统合围控制系统的结构示意图。
参见图7,实施例的多智能体系统合围控制系统,包括:
状态数据获取模块701,用于获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N。
合围控制协议构建模块702,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议。
状态观测器构建模块703,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器。
多智能体系统构建模块704,用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型。
误差计算模块705,用于由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差。
判断模块706,用于判断所述状态观测器误差和所述合围误差是否均收敛于零。
合围控制模块707,用于当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
作为一种可选的实施方式,所述合围控制协议构建模块702,具体包括:
第一初步构建单元,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
Figure BDA0002370643110000161
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA0002370643110000162
Figure BDA0002370643110000163
为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
第一参数确定单元,用于确定所述初步合围控制协议的待求参数。
合围控制协议确定单元,用于将待求参数确定后的初步合围控制协议确定为合围控制协议。
作为一种可选的实施方式,所述状态观测器构建模块703,具体包括:
第二初步构建单元,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
Figure BDA0002370643110000164
其中,
Figure BDA0002370643110000171
为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,
Figure BDA0002370643110000172
A为n阶实方阵,
Figure BDA0002370643110000173
为跟随者对领导者的状态估计值,
Figure BDA0002370643110000174
Figure BDA0002370643110000175
为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,
Figure BDA0002370643110000176
为第i个跟随者在对应拓扑下是否能获得所有领导者的信息,当第i个跟随者在对应拓扑下可以获得所有领导者的信息时
Figure BDA0002370643110000177
否则
Figure BDA0002370643110000178
t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure BDA0002370643110000179
表示通讯时延下第i个跟随者的状态估计值,
Figure BDA00023706431100001710
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重。
第二参数确定单元,用于确定所述初步状态观测器的待求参数;
状态观测器确定单元,用于将待求参数确定后的初步状态观测器确定为状态观测器。
作为一种可选的实施方式,所述多智能体系统构建模块704中的所述线性多智能体系统模型为:
Figure BDA00023706431100001711
其中,xi(t)为第i个跟随者对应的状态向量,
Figure BDA00023706431100001712
为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,
Figure BDA00023706431100001713
为第j个领导者对应的状态向量的导数,OL为领导者的集合。
作为一种可选的实施方式,所述误差计算模块705,具体包括:
第一误差计算单元,用于由所述线性多智能体系统模型确定合围误差
Figure BDA00023706431100001714
其中,e1为合围误差,
Figure BDA00023706431100001715
为第i个跟随者对应的状态向量的导数,ρij为第i个跟随者对第j个领导者的合围增益,
Figure BDA00023706431100001716
Figure BDA00023706431100001717
为第j个领导者对应的状态向量的导数。
第二误差计算单元,用于由所述由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
Figure BDA0002370643110000181
其中,e2为状态观测器误差,
Figure BDA0002370643110000182
为跟随者对领导者的状态估计值的导数。
本实施例提供的多智能体系统合围控制系统,实现了时变通信时延和切换拓扑同时存在下的多智能体系统合围控制;考虑的多智能体系统是一般的线性系统模型,该模型具有广泛的应用
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种多智能体系统合围控制方法,其特征在于,包括:
获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断所述状态观测器误差和所述合围误差是否均收敛于零;
当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
2.根据权利要求1所述的一种多智能体系统合围控制方法,其特征在于,所述由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议,具体包括:
由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
Figure FDA0002803182160000011
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益,
Figure FDA0002803182160000012
Figure FDA0002803182160000013
为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
确定所述初步合围控制协议的待求参数;
将待求参数确定后的初步合围控制协议确定为合围控制协议。
3.根据权利要求1所述的一种多智能体系统合围控制方法,其特征在于,所述由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器,具体包括:
由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
Figure FDA0002803182160000021
其中,
Figure FDA0002803182160000022
为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,
Figure FDA0002803182160000023
A为n阶实方阵,
Figure FDA0002803182160000024
为跟随者对领导者的状态估计值,
Figure FDA0002803182160000025
Figure FDA0002803182160000026
为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,
Figure FDA0002803182160000027
为第i个跟随者在对应拓扑下获得所有领导者的信息的增益值,当第i个跟随者在对应拓扑下获得所有领导者的信息时
Figure FDA0002803182160000028
否则
Figure FDA0002803182160000029
表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure FDA00028031821600000210
表示通讯时延下第i个跟随者的状态估计值,
Figure FDA00028031821600000211
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
确定所述初步状态观测器的待求参数;
将待求参数确定后的初步状态观测器确定为状态观测器。
4.根据权利要求1所述的一种多智能体系统合围控制方法,其特征在于,所述线性多智能体系统模型为:
Figure FDA0002803182160000031
其中,xi(t)为第i个跟随者对应的状态向量,
Figure FDA0002803182160000032
为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,
Figure FDA0002803182160000033
为第j个领导者对应的状态向量的导数,OL为领导者的集合。
5.根据权利要求1所述的一种多智能体系统合围控制方法,其特征在于,所述由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差,具体包括:
由所述线性多智能体系统模型确定合围误差
Figure FDA0002803182160000034
其中,e1为合围误差,
Figure FDA0002803182160000035
为第i个跟随者对应的状态向量的导数,ρij为第i个跟随者对第j个领导者的合围增益,
Figure FDA0002803182160000036
Figure FDA0002803182160000037
为第j个领导者对应的状态向量的导数;
由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
Figure FDA0002803182160000038
其中,e2为状态观测器误差,
Figure FDA0002803182160000039
为跟随者对领导者的状态估计值的导数。
6.一种多智能体系统合围控制系统,其特征在于,包括:
状态数据获取模块,用于获取多智能体系统中所有智能体的状态数据;所述多智能体系统包括V个智能体,其中,M个智能体为领导者,N个智能体为跟随者;V=M+N;
合围控制协议构建模块,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建合围控制协议;
状态观测器构建模块,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建状态观测器;
多智能体系统构建模块,用于依据所述合围控制协议和所有智能体的状态数据构建线性多智能体系统模型;
误差计算模块,用于由所述线性多智能体系统模型和所述状态观测器,得到状态观测器误差和合围误差;
判断模块,用于判断所述状态观测器误差和所述合围误差是否均收敛于零;
合围控制模块,用于当所述状态观测器误差和所述合围误差均收敛于零时,确定所述多智能体系统实现在通信时延和拓扑切换同时存在下的状态合围控制。
7.根据权利要求6所述的一种多智能体系统合围控制系统,其特征在于,所述合围控制协议构建模块,具体包括:
第一初步构建单元,用于由跟随者对应的状态数据和跟随者对领导者的状态估计值,构建初步合围控制协议;所述初步合围控制协议为
Figure FDA0002803182160000041
其中,ui(t)为第i个跟随者对应的控制输入,xi(t)为第i个跟随者对应的状态向量,ρij为第i个跟随者对第j个领导者的合围增益,
Figure FDA0002803182160000051
Figure FDA0002803182160000052
为第i个跟随者对第j个领导者的状态估计值,K1为初步合围控制协议的待求参数;
第一参数确定单元,用于确定所述初步合围控制协议的待求参数;
合围控制协议确定单元,用于将待求参数确定后的初步合围控制协议确定为合围控制协议。
8.根据权利要求6所述的一种多智能体系统合围控制系统,其特征在于,所述状态观测器构建模块,具体包括:
第二初步构建单元,用于由所述跟随者对领导者的状态估计值、通信拓扑切换函数、通信时延和领导者对应的状态数据,构建初步状态观测器;所述初步状态观测器为
Figure FDA0002803182160000053
其中,
Figure FDA0002803182160000054
为跟随者对领导者的状态估计值的导数,IM为M阶单位阵,
Figure FDA0002803182160000055
A为n阶实方阵,
Figure FDA0002803182160000056
为跟随者对领导者的状态估计值,
Figure FDA0002803182160000057
Figure FDA0002803182160000058
为第i个跟随者对第j个领导者的状态估计值,z(t)为领导者对应的状态向量,σ(t)为通信拓扑切换函数,τ(t)为通信时延,K2为初步状态观测器的待求参数,
Figure FDA0002803182160000059
为第i个跟随者在对应拓扑下获得所有领导者的信息的增益值,当第i个跟随者在对应拓扑下获得所有领导者的信息时
Figure FDA00028031821600000510
否则
Figure FDA00028031821600000511
t-τ(t)表示延迟后的时间,z(t-τ(t))为通讯时延下领导者对应的状态向量,
Figure FDA00028031821600000512
表示通讯时延下第i个跟随者的状态估计值,
Figure FDA00028031821600000513
表示通讯时延下除第i个跟随者之外的,第k个跟随者的状态估计值,wik表示第i个跟随者与第k个跟随者之间的拓扑切换对应的权重;
第二参数确定单元,用于确定所述初步状态观测器的待求参数;
状态观测器确定单元,用于将待求参数确定后的初步状态观测器确定为状态观测器。
9.根据权利要求6所述的一种多智能体系统合围控制系统,其特征在于,所述多智能体系统构建模块中的所述线性多智能体系统模型为:
Figure FDA0002803182160000061
其中,xi(t)为第i个跟随者对应的状态向量,
Figure FDA0002803182160000062
为第i个跟随者对应的状态向量的导数,ui(t)为第i个跟随者对应的控制输入,A为n阶实方阵,B为n×m阶列满秩实矩阵,OF为跟随者的集合,zj(t)为第j个领导者对应的状态向量,
Figure FDA0002803182160000063
为第j个领导者对应的状态向量的导数,OL为领导者的集合。
10.根据权利要求6所述的一种多智能体系统合围控制系统,其特征在于,所述误差计算模块,具体包括:
第一误差计算单元,用于由所述线性多智能体系统模型确定合围误差
Figure FDA0002803182160000064
其中,e1为合围误差,
Figure FDA0002803182160000065
为第i个跟随者对应的状态向量的导数,ρij为第i个跟随者对第j个领导者的合围增益,
Figure FDA0002803182160000066
Figure FDA0002803182160000067
为第j个领导者对应的状态向量的导数;
第二误差计算单元,用于由所述线性多智能体系统模型和所述状态观测器确定状态观测器误差
Figure FDA0002803182160000071
其中,e2为状态观测器误差,
Figure FDA0002803182160000072
为跟随者对领导者的状态估计值的导数。
CN202010049585.1A 2020-01-16 2020-01-16 一种多智能体系统合围控制方法及系统 Active CN111176327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010049585.1A CN111176327B (zh) 2020-01-16 2020-01-16 一种多智能体系统合围控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010049585.1A CN111176327B (zh) 2020-01-16 2020-01-16 一种多智能体系统合围控制方法及系统

Publications (2)

Publication Number Publication Date
CN111176327A CN111176327A (zh) 2020-05-19
CN111176327B true CN111176327B (zh) 2021-01-26

Family

ID=70657977

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010049585.1A Active CN111176327B (zh) 2020-01-16 2020-01-16 一种多智能体系统合围控制方法及系统

Country Status (1)

Country Link
CN (1) CN111176327B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111665848B (zh) * 2020-06-28 2020-12-11 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN111766783B (zh) * 2020-06-29 2021-08-24 北京航空航天大学 一种面向集群系统的有限时间内收敛的编队合围跟踪方法
CN112379626A (zh) * 2020-11-23 2021-02-19 哈尔滨理工大学 具有外部干扰的多智能体系统分组领导跟随一致的方法
CN112230679B (zh) * 2020-12-15 2021-03-09 中国人民解放军国防科技大学 基于延时的群组耦合系统协同控制方法和装置
CN112947557B (zh) * 2021-02-07 2023-06-23 河北科技大学 一种切换拓扑下的多智能体容错跟踪控制方法
CN113239513B (zh) * 2021-04-01 2023-06-30 中国电子科技集团公司信息科学研究院 多智能体的一致性分析方法、系统及应用
CN113259259B (zh) * 2021-05-13 2024-04-19 哈尔滨理工大学 一种带有通信时延的异构多智能体系统输出一致性方法
CN113296410A (zh) * 2021-05-26 2021-08-24 哈尔滨理工大学 一种切换拓扑下的多智能体系统的领导跟随一致性方法
CN116740922B (zh) * 2023-05-08 2024-04-05 海南大学 一种基于模糊观测协议的智慧交通系统的控制方法
CN116700012B (zh) * 2023-07-19 2024-03-01 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法
CN116610106B (zh) * 2023-07-20 2023-09-22 南京信息工程大学 一种多无人机容错跟踪控制方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10080099B2 (en) * 2016-04-28 2018-09-18 Raytheon Company Cellular enabled restricted zone monitoring
CN108845590B (zh) * 2018-07-06 2021-05-28 哈尔滨工业大学(威海) 一种时延环境下的多无人机协同编队控制方法
CN110069076B (zh) * 2019-04-23 2020-06-09 北京航空航天大学 一种基于猛狼围捕行为的无人机集群空战方法

Also Published As

Publication number Publication date
CN111176327A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN111176327B (zh) 一种多智能体系统合围控制方法及系统
CN111443715B (zh) 一种集群系统编队-合围控制方法及系统
CN109683477B (zh) 一种随机多智能体系统有限时间控制器的设计方法及系统
Ge et al. Stable adaptive control for nonlinear multivariable systems with a triangular control structure
CN112987790B (zh) 一种分布式异构集群系统分组编队跟踪控制方法和系统
Yoo Distributed consensus tracking for multiple uncertain nonlinear strict-feedback systems under a directed graph
CN113176732B (zh) 一种非线性随机多智能体系统固定时间一致控制方法
Ali et al. Synchronization of master-slave Markovian switching complex dynamical networks with time-varying delays in nonlinear function via sliding mode control
CN113900380B (zh) 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
Dong et al. Quantized fuzzy cooperative output regulation for heterogeneous nonlinear multiagent systems with directed fixed/switching topologies
CN108762091B (zh) 一种基于未知控制方向的自适应编队控制算法
CN112527016A (zh) 一种智能集群一体化容错时变编队控制方法及系统
Atrianfar Sampled-time containment control of high-order continuous-time MASs under heterogenuous time-varying delays and switching topologies: A scrambling matrix approach
CN116466588A (zh) 多智能体系统的有限时间时变编队跟踪控制方法及系统
Yang et al. Distributed estimation of graph spectrum
CN114637278A (zh) 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法
Yang et al. Optimal information propagation in sensor networks
Cheng et al. Balanced truncation approach to linear network system model order reduction
CN113515066A (zh) 一种非线性多智能体系统动态事件触发控制方法
CN114200830A (zh) 一种多智能体一致性强化学习控制方法
Tian et al. Event-triggered-based Fault-tolerant Consensus for AUVs on Heterogeneous Switch Topology
Li et al. Synchronization analysis of coupled fractional-order neural networks with time-varying delays
CN115903817A (zh) 一种具有避障和连续性维护的多领导智能无人集群系统的包容控制方法
CN116661347B (zh) 一种含不确定时滞的多智能体一致性控制方法
Luo et al. Distributed cooperative fault detection for multi-agent systems with time-varying delay

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant