CN112947557A - 一种切换拓扑下的多智能体容错跟踪控制方法 - Google Patents

一种切换拓扑下的多智能体容错跟踪控制方法 Download PDF

Info

Publication number
CN112947557A
CN112947557A CN202110167620.4A CN202110167620A CN112947557A CN 112947557 A CN112947557 A CN 112947557A CN 202110167620 A CN202110167620 A CN 202110167620A CN 112947557 A CN112947557 A CN 112947557A
Authority
CN
China
Prior art keywords
agent
time
formation
fault
topology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110167620.4A
Other languages
English (en)
Other versions
CN112947557B (zh
Inventor
甄然
金亚婷
武晓晶
吴学礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Jinru Software Development Co ltd
Original Assignee
Hebei University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei University of Science and Technology filed Critical Hebei University of Science and Technology
Priority to CN202110167620.4A priority Critical patent/CN112947557B/zh
Publication of CN112947557A publication Critical patent/CN112947557A/zh
Application granted granted Critical
Publication of CN112947557B publication Critical patent/CN112947557B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本公开提供了一种切换拓扑下的多智能体容错跟踪控制方法,属于协同控制领域。该方法包含步骤:在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻,该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行,该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行;所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点。该方法构造出完全分布式的容错跟踪控制协议,使得系统在执行器故障情况下,仍可以实现多智能体的编队跟踪;同时,利用自适应策略获得时变容错控制协议,得以解决在执行器故障未知且时变的条件下避免高增益的问题。

Description

一种切换拓扑下的多智能体容错跟踪控制方法
技术领域
本发明属于协同控制领域,尤其涉及多智能体切换通信网络拓扑时的跟踪控制方法。
背景技术
在很多通信控制场景中,如卫星导航、机器人控制、无人机搜索救援、军舰协同作战等方面,都应用到协同控制领域中的多智能体(Mult-Agent)的编队跟踪(Formationtracking)控制技术。然而,以多智能体的无人机系统为例的,系统中的每一个智能体(无人机)都可能发生执行器故障的情况,且随着智能体个数的增加和系统结构的复杂化,编队中存在执行器发生故障的几率也在增加,执行器故障将会影响智能体的正常飞行,并可能通过拓扑链(Topological chain)影响到其他智能体,从而影响整个编队的飞行,导致执行的任务失败。同时在实际飞行过程中,智能体之间拓扑结构可能会由于通信距离的限制而导致一个或者多个通信链(Communication link)的失效和新通信链路的产生,从而发生拓扑间的切换。
目前,解决编队跟踪控制问题主要有以下几种经典的控制算法:领导-追随者控制算法、虚拟结构控制算法、基于行为的控制算法以及一致性理论。这些方法一个方面的部分解决了执行器故障情况下,多智能体系统的编队跟踪控制问题,但是既考虑执行器故障,又考虑切换通讯拓扑结构的跟踪控制方法尚未见公开。
发明内容
本发明目的在于提供一种适于切换拓扑下的多智能体容错跟踪控制方法,进而增强多智能体系统的鲁棒性,使得系统在执行器故障情况下,仍可以实现多智能体的编队跟踪。
本发明提供的技术方案为一种切换拓扑下的多智能体容错跟踪控制方法,其包含步骤:在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻,该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行,该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行;其中,所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点,本文中根结点即为两个生成树编队拓扑切换时的领导者。
在一些具体的实施例中上述的多智能体容错跟踪控制方法,包含以下步骤:
在时刻t,对于包含N个智能体{A1,A2,…,AN}的智能体群,A1为领导者,Ai为A1的追随者,i=2,3,…,N;
所述领导者A1的控制模型为,
Figure BDA0002937957920000021
其中,
Figure BDA0002937957920000022
为接收的A1当前时刻t的位置向量;
Figure BDA0002937957920000023
为接收的A1当前时刻t的速度向量;
Figure BDA0002937957920000024
为当前时刻t向A1的执行器发送的速度向量;
Figure BDA0002937957920000025
为当前时刻t向A1的执行器发送的加速度向量;αx和αv分别为该智能体群固有的阻尼常数;
所述追随者Ai的控制模型为,
Figure BDA0002937957920000026
其中,
Figure BDA0002937957920000027
为接收的Ai当前时刻t的位置向量;
Figure BDA0002937957920000028
为接收的Ai当前时刻t的速度向量;
Figure BDA0002937957920000029
为当前时刻t向Ai执行器发送的速度向量;
Figure BDA00029379579200000210
为当前时刻t向Ai执行器发送的加速度向量;
Figure BDA00029379579200000211
为t时刻Ai的执行器的控制输入向量;ρi(t)=diag{ρi1(t),ρi2(t),...,ρin(t)},对角元素ρij(t)表示t时刻Ai在执行器j通道的未知失效故障,并且满足0<ρij(t)≤1,j∈[1,2,...,n];
Figure BDA00029379579200000212
以表示未知输出偏差。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,包含以下步骤:
在所述拓扑切换时刻,所述智能体群中以追随者控制器模型运行的智能体Ai,根据以下容错时变编队跟踪协议向执行器提供所述控制输入向量ui(t):
Figure BDA00029379579200000213
其中,
Figure BDA00029379579200000214
为自适应更新增益,gi(Si(t))为时变编队跟踪局部误差Si(t)的一个非线性函数,
Figure BDA00029379579200000215
为所述多智能体系统各个智能体的控制器增益参数,P为预设的正定对称矩阵,hi(t)为相对于编队参考的分段连续可微偏移向量,hiv(t)为hi(t)中表示追随者Ai速度方向的连续可微偏移向量。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,在实施中其所述跟踪者的时变编队跟踪局部误差Si(t)被设计为通过下式计算:
Figure BDA0002937957920000031
其中,hi(t)=[hix(t),hiv(t)]T(i=2,3,...,N)是分段连续可微的向量。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,在实施中所述自适应更新增益
Figure BDA0002937957920000032
被设计为:
Figure BDA0002937957920000033
其中,
Figure BDA0002937957920000034
为满足时变编队跟踪误差向量ψi(t)为0,且小于等于
Figure BDA0002937957920000035
的自适应参数。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,在实施中正定对称矩阵P满足以下线性矩阵不等式:
Figure BDA0002937957920000036
其中,B1=[1 0]T,B2=[0 1]T,α=[αx αv],均为常数矩阵。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,在实施中在所述多智能体群的系统运行期间,其中追随者智能体的时变编队向量hi(t)的时变编队向量约束模型参与对所述多智能体群实时获取的时变编队向量hi(t)的计算处理。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,在实施中所述追随者智能体的时变编队向量hi(t)的时变编队向量约束模型包括以下两个编队跟踪条件:
条件一,时变编队跟踪的目标函数:
Figure BDA0002937957920000037
其中,hi(t),表示相对于编队参考的分段连续可微偏移向量,当满足
Figure BDA0002937957920000038
i∈F,则称追随者形成了hi(t)表示的编队,且跟踪上领导者的状态;
条件二,时变编队跟踪的可行性条件:
Figure BDA0002937957920000039
其中,hix(t)表示追随者Ai位置方向的连续可微偏移向量,hiv(t)表示追随者Ai速度方向的连续可微偏移向量。
一些优选实施例中,一个方面的改进在于上述的多智能体容错跟踪控制方法,在实施中,所述时变编队跟踪局部误差Si(t)的非线性函数gi(Si(t))被设计为:
Figure BDA0002937957920000041
并且,所述多智能体系统各个智能体的控制器增益参数K使用相同的P求解。
一些优选实施例中,一个方面的改进在于上述各个的多智能体容错跟踪控制方法,在实施中根据包含以下步骤100至600限定时序逻辑处理过程实施:
步骤100,根据各时刻所期望的一智能体群中各智能体的空间位置分布,确定该空间位置分布中的各智能体的领导者身份和追随者身份;
步骤200,根据外部预先获得的拓扑切换期间的故障类型,确定故障模型,将故障模型引入智能体控制模型中获得智能体群系统状态模型;
步骤300,构建领导者与追随者以及各追随者之间的基于步骤100所描述的拓扑切换的影响关系;
步骤400,获得满足智能体群编队跟踪条件的追随者智能体的时变编队向量约束模型;
步骤500,基于智能体模型、集合S中的通讯拓扑关系和包含编队跟踪可行性条件的时变编队向量约束模型,设计容错时变编队跟踪的多智能体控制模型并配置自适应参数;
步骤600,根据上述步骤所确定的多智能体控制模型的各个模块配置多智能体系统,以便实现各个智能体在时序相邻的两个空间位置分布切换时,在领导-追随控制模式下实现拓扑切换的进行编队跟随控制。
本发明提供技术方案技术效果的至少一个方面在于:提供了切换拓扑下构造时变容错控制协议的方法,使得利用此控制协议,得以解决切换拓扑下执行器故障的编队跟踪控制问题。其中,针对二阶多智能体系统,本发明既考虑执行器故障情况又考虑切换拓扑的通讯条件;根据智能体之间的拓扑结构,基于相邻智能体的输出信息,构造出完全分布式的容错跟踪控制协议,增强了系统的鲁棒性,使得系统在执行器故障情况下,仍可以实现多智能体的编队跟踪;利用自适应策略获得时变容错控制协议,得以解决在执行器故障未知且时变的条件下避免高增益的问题。
附图说明
图1为本发明一实施例中使用切换拓扑下的多智能体容错跟踪控制方法的多智能体系统在拓扑切换时的系统原理框图;
图2为本发明一实施例中多智能体系统分布式容错跟踪控制协议的系统结构示意图;
图3为本发明一实施例中实施切换拓扑下的多智能体容错跟踪控制方法的步骤示意图;
图4为本发明一实施例中为多智能体系统配置实施切换拓扑下的多智能体容错跟踪控制方法的流程示意图;
图5为本发明另一实施例中为多智能体系统配置实施切换拓扑下的多智能体容错跟踪控制方法的流程示意图;
图6为本发明一实施例中集合S中的一个生成树编队拓扑的通信拓扑图;
图7为本发明一实施例中集合S中的另一个生成树编队拓扑的通信拓扑图;
图8为本发明一实施例中集合S中的另一个生成树编队拓扑的通信拓扑图;
图9为本发明一实施例中一个拓扑切换信号时序示意图;
图10为本发明一应用实施例中一追随者在X和Y方向的位置误差图;
图11为本发明一应用实施例中一智能体群中各智能体在X和Y方向的速度图;
图12为本发明一应用实施例中智能体群各智能体在容错条件下拓扑切换期间各智能体的跟踪曲线图。
具体实施方式
首先需要说明的是,在多智能体系统中,智能体群中某智能体发生执行器故障(Actuator faults)后可能会通过拓扑链影响到其他智能体的正常运行,从而导致任务失败。考虑到现实情况,执行器故障包括失效故障和偏差故障,且这些故障都是未知且时变的,所以容错控制需要采用鲁棒控制算法或自适应控制算法。即为切换拓扑下多智能体的容错跟踪控制问题。任章等人于2017公开了固定拓扑下多智能体系统在执行器故障和输入饱和两种情况下的解决时变跟踪问题的技术方案,但其技术启示在于在解决时变问题时要求追随者不仅需要保持预定的编队,并且需要确定其和跟踪领导者之间的状态。因此,其方案中首先通过引入双曲正切函数对具有输入饱和约束的控制器模型进行修正,在此基础上,利用动态表面控制技术构造了各跟踪者的动态增广模型,并推导出其控制协议,但其未涉及切换拓扑下的时变跟踪问题,其提供控制协议仅在于通过自适应容错控制来处理偏差故障和未知有界的失效故障,进而实现多智能体固定拓扑下的容错控制方法。对本领域技术人员解决切换拓扑下的时变跟踪控制问题一般选用滑模控制的方法设计编队控制器,从而达到多智能体编队跟踪控制的目的,滑模控制是一类特殊的非线性控制方法,具有响应速度快,对系统的不确定参数不灵敏,物理实现简单,鲁棒性强的优点。本发明提供了另一种可实施的替代方法,并且实现了完全分布式的容错跟踪控制协议,为本领域技术人员提供了新的改进基础。
还需要说明的是,本发明的核心构思在于,通过考虑自适应策略和切换拓扑的通讯结构,构造出基于相邻智能体信息的完全分布式的容错时变跟踪控制协议,从而解决切换拓扑下执行器故障的问题。在该构思上,本发明主张:在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻,该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行,该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行;所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点。进而实现切换拓扑下的多智能体容错跟踪控制方法。
下面通过实施例结合附图进一步描述本发明提供技术方案,以便本领域技术人员充分理解本发明与现有技术的差异和具体效果,并在此基础上予以实施哈改进。
本发明提供的多个实施例展示了一种切换拓扑下的多智能体容错跟踪控制方法,应用于包含一个智能体群的多智能体系统。该多智能体系统至少实现了一个智能体群的编队跟踪系统,该智能体群由N个智能体{A1,A2,…,AN}组成,其中,包括1个领导者A1和N-1个追随者A2,…,AN,智能体之间的切换拓扑结构由Gσ(t)描述,编队跟踪系统在面对每个追随者都可能遭受执行器故障,且故障包括失效故障和偏差故障,能够实现满足期待的拓扑切换。容易理解的,本实施例的切换拓扑下的多智能体容错跟踪控制方法是一种基于自适应控制和一致性理论控制的二阶多智能体系统容错跟踪控制方法,在面对具有无向切换通讯拓扑结构的多智能体跟踪系统中存在的执行器故障的问题时,通过领导者控制模型和追随者控制模型的自适应控制,使用一种完全分布式容错控制协议,使得多智能体系统在发生故障的情况下仍能顺利完成拓扑切换时的跟踪任务。
参考图1、2,本实施例中多智能体系统的自适应控制模型包括领导-追随模式下的分布于领导者控制器的领导者控制模型以及分布于追随者控制器的追随者控制模型。其中:
领导者A1的控制模型:
Figure BDA0002937957920000071
其中,
Figure BDA0002937957920000072
均为n维列向量,分别表示领导者的位置和速度;αx和αv为阻尼常数。
追随者Ai,(i=2,3,...,N)的控制模型:
Figure BDA0002937957920000073
其中,
Figure BDA0002937957920000074
Figure BDA0002937957920000075
分别表示追随者Ai的位置、速度和控制输入向量,αx和αv为阻尼常数。本实施例中,取通道数n=1以做出示范性说明,根据多智能体的具体控制通道数量,对于在一些其他实施例中n>1,根据本实施例计算所取参数向量间克罗内克积的示范,所有的结果都可以直接推广到高维情况。
可以看出,本实施例的追随者控制模型(2)中考虑了其执行器各通道故障,本实施例中,追随者执行器故障模型用下式表示:
uiF(t)=ρi(t)ui(t)+bi(t) (3)
其中,
Figure BDA0002937957920000076
为追随者执行器控制输入向量;
Figure BDA0002937957920000077
为执行器的故障输出向量;
ρi(t)=diag{ρi1(t),ρi2(t),...,ρin(t)},其中未知失效故障ρij(t)满足0<ρij(t)≤1,i∈[2,3,...,N],j∈[1,2,...,n];
bi(t)=[bi1(t),bi2(t),...,bin(t)]T,bij(t)表示执行器第j通道存在未知输出偏差。本文中,序号i、j、k仅表示装置、通道、参数或者元素等对象组中一个对象的序,用于区别同组中不同对象,其具体含义根据本文限定的取值范围和对象定义而确定,同序号的不同对象不限定对应关系。
具体的,对于追随者Ai,本实施例的执行器故障包括以下故障模式:
(1)如果ρij(t)=1且bij(t)=0,认为追随者Ai不存在执行器故障。
(2)如果0<ρij(t)<1且bij(t)=0,追随者Ai存在失效故障。
(3)如果ρij(t)=1且bij(t)≠0,追随者Ai存在偏差故障。
(4)如果0<ρij(t)<1且bij(t)≠0,追随者Ai既存在偏差故障又存在失效故障。
本发明技术方案中执行器故障指未知且时变的,满足以下边界假设的执行器故障:
未知失效故障ρi(t)和偏差故障bi(t)是有界的,即存在两个未知正常数ηi和βi,满足0<ηi≤ρi(t)≤1,并且,||bi(t)||≤βi(i=2,3,...,N)。
Figure BDA0002937957920000081
本实施例中,多智能体系统包含的智能体群{A1,A2,…,AN}的网络通信拓扑结构,在智能体群处于一个非切换时的稳定状态时,由一个有N个顶点的加权有向图G={V(G),E(G),W(G)}表示N个智能体之间的通信链路。其中,顶点集V(G)={v1,v2,...,vN},加权邻接矩阵
Figure BDA0002937957920000082
边集
Figure BDA0002937957920000083
Figure BDA0002937957920000084
分别代表与G相关的顶点集、和边集。eij=(vi,vj)∈E表示为G的边,其中,顶点vi称为顶点vj的邻居。对于
Figure BDA0002937957920000085
当且仅当eij=(vi,vj)∈E时,wij>0,否则wij=0。G的入度矩阵定义为D(G)=diag{degin{vi},i=1,2,...,N},其中
Figure BDA0002937957920000086
表示为顶点vi的入度。顶点vi的邻居集可由Ni={Vj∈V(G):eij∈E(G)}表示。图G的拉普拉斯矩阵L可以定义为L=D(G)-W(G)。本实施例其他拓扑切换相关定义条件可以根据任章等公开的“Time-VaryingFormation Tracking for Second-Order Multi-Agent Systems Subjected toSwitching Topologies With Application to Quadrotor Formation Flying,”IEEETRANSACTIONS ON INDUSTRIAL ELECTRONICS,VOL.64,NO.6,JUNE 2017。显然,对于用图G描述通信链路的智能体群,如果存在至少一个顶点(即结点),且该顶点与所有其他顶点都有通信路径,则该图所描述的拓扑结构即为本发明一个生成树编队拓扑。
容易理解,多智能体之间的通信拓扑即编队拓扑能够进行切换。集合S表示多智能体系统所有可能的通信拓扑集合,且拓扑索引集
Figure BDA0002937957920000087
代表自然数的集合,σ(t):[0,∞)→I为一个拓扑切换时刻t的通信拓扑切换信号,其取值代表了多智能体系统在t时刻所对应通信切换拓扑在集合S中的编号。示范的,对于σ(t1)=1,σ(t2)=2,G1为t1时刻后期望智能体切换到的第二生成树编队拓扑,G2为t2时刻后期望智能体切换到的第二生成树编队拓扑。
本实施例多智能体系统的由多智能体组成的智能体群中,各个智能体使用图论描述的任一通信链路拓扑图Gσ(t)满足以下假设:图Gσ(t)是以一个根结点为领导者,以其他结点为追随者的生成树编队拓扑,集合S中至少包括预设的一个第一生成树编队拓扑和一个第二生成树编队拓扑,该第一生成树编队拓扑和一个第二生成树编队拓扑根结点的是同一领导者,即具备相同的根结点。容易理解,一些实施例中,生成树编队拓扑可以根据现有技术中广度优先、深度优先等生成算法动态获得。本实施例中,任一图Gσ(t)中追随者之间的开始的拓扑边是无向的,在t时刻,多智能体系统接收到一个拓扑切换信号σ(t),拓扑切换信号σ(t)携带多智能体系统的预设程序模块所要求的信息,该信息使得多智能体系统的智能体群开始从当前的第一生成树编队拓扑向第二生成树编队拓扑图Gσ(t)转换,t即为拓扑切换时刻,该领导-追随(Leader-follower)的拓扑结构中,t时刻拓扑切换的用拉普拉斯矩阵描述领导者与追随者以及追随者之间影响的有向图Lσ(t)有以下形式:
Figure BDA0002937957920000091
其中,
Figure BDA0002937957920000092
表示领导者和追随者之间影响的拉普拉斯矩阵,
Figure BDA0002937957920000093
表示追随者和追随者之间影响的拉普拉斯矩阵,01×1与01×(N-1)是占位的零矩阵,代表相应结点智能体之间的无关性。
示范的,本实施例根据本发明提供的领导者控制模型和追随者控制模型提供一种容错跟踪控制协议的技术方案,如下:
令t时刻智能体Ak的编队跟踪状态向量为ξk=[xk(t),vk(t)]T,根据领导者和追踪者的控制模型(1)和(2),使用以下公式建立本实施例的多智能体系统模型:
Figure BDA0002937957920000094
其中,B1=[1 0]T,B2=[0 1]T,α=[αx αv]。
进一步的,计算系统的时变编队跟踪误差向量:ψi(t)=ξi(t)-hi(t)-ξ1(t),其中,ξi是将位置和速度xk(t),vk(t)组合在一起的向量,单纯的组合,以便由公式(1)和(2)可组合求解,目的是简化公式,方便后续证明简化过程。ψi(t)是时变编队跟踪误差,当ψi(t)=0则证明出系统的跟踪误差为0,说明跟踪目标成就,且hi(t)满足
Figure BDA0002937957920000101
的条件,hix(t)和hiv(t)分别表示hi(t)的位置和速度分量,则根据公式(5),本实施例的系统时变编队跟踪误差向量被描述为:
Figure BDA0002937957920000102
上述构思在于,通过证明时变编队跟踪误差向量ψi(t)是否为0,判断控制协议设计的是否正确。本发明各实施例中容错跟踪控制协议具体即通过式(8)限定的全部u(t)的求解过程,同时,通过式(7)(9)(10)(11)揭示了式(8)中具体参数的限定表示。与现有技术不同的,本发明限定了(8)为切换拓扑时刻的控制协议,同时通过具体的式(7)(9)(10)(11)限定了新的求解过程。
进一步的,计算本实施例跟踪者的时变编队跟踪局部误差Si(t):
Figure BDA0002937957920000103
其中,hi(t)=[hix(t),hiv(t)]T(i=2,3,...,N)是分段连续可微的。进而,各追随者期望的时变编队h(t)可表示为h(t)=[h2(t),h3(t),...,hN(t)]T
进一步的,基于邻近局部误差,根据以上构思设计容错时变编队跟踪协议,即下式(8):
Figure BDA0002937957920000104
其中,
Figure BDA0002937957920000105
为自适应更新增益,gi(Si(t))为一个非线性函数,多智能体系统各个智能体的控制器增益参数设计为
Figure BDA0002937957920000106
P为正定对称矩阵且满足以下线性矩阵不等式:
Figure BDA0002937957920000107
自适应更新增益为:
Figure BDA0002937957920000111
进一步的,上述计算方法可以预先简化为:
Figure BDA0002937957920000112
其中,ki和σi均为正常数,且其初始值满足
Figure BDA0002937957920000113
是为了满足时变编队跟踪误差向量ψi(t)为0,而设计出来的自适应参数,是公式(8)指定的控制协议中的一部分。需要说明的是,本发明实施例对ki和σi没有其他限制性要求。
具体的,时变编队跟踪局部误差Si(t)的非线性函数gi(Si(t))表示为:
Figure BDA0002937957920000114
示范的,基于本实施例的领导者控制模型(1)、追随者控制模型(2)以及容错时变跟踪控制协议(8),其中容错时变跟踪控制协议(8)中各模型分别由公式(7)、(9)、(10)、(11)提供,参考图1、2、3,本实施例的智能体群通过以下步骤100至600实现一次拓扑切换时的容错跟踪控制。
步骤100,根据各时刻所期望的一智能体群中各智能体的空间位置分布,确定该空间位置分布中的各智能体的领导者身份和追随者身份。
本实施例中,将空间位置分布的智能体中,无邻居的智能体确定为一领导者,如A1;将至少存在一个邻居的智能体确定为一追随者,如A2,…,AN。示范的,根据时刻t2期望的空间位置分布,以其中无邻居的智能体A1为根结点创建一个第二生成树编队
Figure BDA0002937957920000115
以智能体A1为根结点的创建时刻t1的智能体群的空间位置分布创建一个第一生成树编队
Figure BDA0002937957920000116
其中,t2>t1
容易理解,本实施例仅要求两个不同空间位置分布变化期间,使用领导-追随者控制模式的生成树拓扑编队,在其他时刻并不限定必须保持领导-追随控制模型保持编队空间位置分布。
步骤200,根据外部预先获得的拓扑切换期间的故障类型,确定故障模型,将故障模型引入智能体控制模型中获得智能体群系统状态模型。
具体的,本实施例考虑编队故障包括失效故障和偏差故障,建立编队故障模型:
uiF(t)=ρi(t)ui(t)+bi(t) (3)
其中,
i,表示追随者Ai的身份序号;
ui(t),表示各追随者控制器具体的控制输入指令,容易看出,
Figure BDA0002937957920000121
uiF(t),表示各追随者执行器具体的驱动控制输入,容易看出,
Figure BDA0002937957920000122
ρi(t),表示追随者Ai执行器效率矩阵,ρi(t)=diag{ρi2(t),ρi3(t),...,ρiN(t)};且满足0<ρij(t)≤1,(j=1,2,...,n),ρij(t)表示执行器效率矩阵的第j个对角元素;
bi(t)=[bi1(t),bi2(t),...,bin(t)]T,bij(t)表示执行器第j通道存在未知输出偏差。bi(t)表示偏差故障,容易看出,
Figure BDA0002937957920000123
编队故障模型中执行器失效故障元素ρij(t)未知但有界,满足0<ηi≤ρij(t)≤1,其中,ηi表示未知正常数,从外部获取;偏差故障bi(t)未知且有界,满足||bi(t)||≤βi,其中,βi表示未知正常数,从外部获取。
基于执行器故障模型可知,建立各个追随者Ai(i=2,3,...,N)在拓扑切换时的控制模型:
Figure BDA0002937957920000124
其中,
xi(t),表示追随者在拓扑切换期间一个控制周期中获得的实际位置,xi(t)∈Rn
vi(t),表示追随者在拓扑切换期间一个控制周期中获得的实际速度;
αx和αv为阻尼常数。
领导者的控制模型:
Figure BDA0002937957920000125
其中,
x1(t),表示追随者的位置,x1(t)∈Rn
v1(t),表示追随者的速度,v1(t)∈Rn
αx和αv为阻尼常数。
令ξk=[xk(t),vk(t)]T,领导者和跟踪者的控制模型可表示为:
Figure BDA0002937957920000131
其中,B1,表示常数矩阵,B1=[1 0]T;B2,表示常数矩阵,B2=[0 1]T;α,表示常数矩阵,α=[αx αv]。公式(5)的解即智能体群系统状态模型。
步骤300,构建领导者与追随者以及各追随者之间的基于步骤100所描述的拓扑切换的影响关系。
具体的,本实施例在步骤100中将时间相邻的两个空间位置分布中智能体集群中的每个智能体用结点表示,将结点间的通信连接用结点连线构成的边来表示;将智能体集群的通信关系用无向代数拓扑图表示,所述无向代数拓扑图包含结点、边以及边的权重值。V(G)={v1,v2,...,vN},W(G)=[wij]∈RN×N
Figure BDA0002937957920000132
Figure BDA0002937957920000133
分别代表与G相关的顶点集、加权邻接矩阵和边集。eij=(vi,vj)∈E表示为G的边,其中顶点vi称为顶点vj的邻居。对于
Figure BDA0002937957920000134
Figure BDA0002937957920000135
当且仅当eij=(vi,vj)∈E时,wij>0,否则wij=0。G的入度矩阵定义为D(G)=diag{degin{vi},i=1,2,...,N},
其中,
Figure BDA0002937957920000136
表示为顶点vi的入度。顶点vi的邻居集可由Ni={Vj∈V(G):eij∈E(G)}表示。智能体群拓扑切换中的拉普拉斯矩阵L可以定义为L=D(G)-W(G)。
容易理解的,本实施例中多智能体之间的通信拓扑能够进行切换。用集合S表示步骤100中系统所有可能的通信拓扑集合,且拓扑索引集为
Figure BDA0002937957920000138
,N代表自然数的集合,σ(t):[0,∞)→I为通信拓扑切换信号,其取值代表了多智能体系统在t时刻所对应通信切换拓扑的编号。
可以看出,本实施例中,图论满足以下假设:图Gσ(t)有一个以领导者为根结点的生成树。而且追随者之间的拓扑是无向的。考虑了Leader-follower的拓扑结构,拉普拉斯矩阵Lσ(t)有以下形式:
Figure BDA0002937957920000137
其中,
Figure BDA0002937957920000141
表示领导者和追随者之间通信关系的矩阵;
Figure BDA0002937957920000142
表示追随者和追随者之间通信关系的矩阵。
步骤400,获得满足智能体群编队跟踪条件的追随者智能体的时变编队向量约束模型。
具体的,在多智能体系统运行期间,追随者智能体的时变编队向量hi(t)要满足的编队跟踪条件有两个,其中:
条件一,时变编队跟踪的目标函数:
Figure BDA0002937957920000143
其中,hi(t),表示相对于编队参考的分段连续可微偏移向量,当满足
Figure BDA0002937957920000144
i∈F,则称追随者形成了hi(t)表示的编队,且跟踪上领导者的状态;
条件二,时变编队跟踪的可行性条件:
Figure BDA0002937957920000145
其中,hix(t)表示追随者Ai位置方向的连续可微偏移向量,hiv(t)表示追随者Ai速度方向的连续可微偏移向量;
上述条件一和条件二构成了本实施例中追随者智能体的时变编队向量hi(t)的时变编队向量约束模型,在系统运行期间参与对实时获取的时变编队向量hi(t)的计算处理。
步骤500,基于智能体模型、集合S中的通讯拓扑关系和包含编队跟踪可行性条件的时变编队向量约束模型,设计容错时变编队跟踪的多智能体控制模型并配置自适应参数。
具体的,当系统的时变编队跟踪误差为:ψi(t)=ξi(t)-hi(t)-ξ1(t)且hi(t)满足
Figure BDA0002937957920000146
的约束条件,本实施例的多智能体系统实际运行期间在涉及拓扑切换的任一具体时刻应当被描述为:
Figure BDA0002937957920000147
即根据公式(6),
Figure BDA0002937957920000148
Figure BDA0002937957920000149
定义跟踪者的时变编队跟踪局部误差为:
Figure BDA00029379579200001410
Figure BDA0002937957920000151
其中,
Si(t),表示跟踪者的时变编队跟踪局部误差;i表示第i个追随者,j表示第j个追随者;hix(t),表示追随者位置方向的连续可微偏移向量;hiv(t),表示追随者速度方向的连续可微偏移向量;
Figure BDA0002937957920000152
表示追随者i和领导者之间的加权邻接值;
Figure BDA0002937957920000153
表示追随者i和追随者j之间的加权邻接值;
利用邻近局部误差Si(t),设计出容错时变编队跟踪控制协议中的ui(t)计算模块:
Figure BDA0002937957920000154
其中,
Figure BDA0002937957920000155
表示自适应更新增益,并根据公式(10)设计计算
Figure BDA0002937957920000156
的程序模块。程序模块中的ki和σi均为正常数,且其初始值满足
Figure BDA0002937957920000157
其中,
gi(Si(t))表示Si(t)的一个非线性函数,本实施例被配置为:
Figure BDA0002937957920000158
其中,P为正定对称矩阵且满足以下线性矩阵不等式:
Figure BDA0002937957920000159
同时,容错时变编队跟踪协议中的控制器增益参数K被设计为
Figure BDA00029379579200001510
步骤600,根据上述步骤所确定的多智能体控制模型的各个模块配置多智能体系统,以便实现各个智能体在时序相邻的两个空间位置分布切换时,在领导-追随控制模式下实现拓扑切换的进行编队跟随控制。
图4和图5分别示出了两种不同的配置方法以使得多智能体系统实现本发明切换拓扑下的多智能体容错跟踪控制方法。
示范的,完成配置的多智能体系统在运行期间,至少可以通过以下过程获得本发明技术方案的效果:在一个从当前所处于的第一发生树编队拓扑切换到指定的第二发生树编队拓扑时刻,该时刻由拓扑切换信号启动;多智能体系统根据拓扑切换信号向各个智能体的控制器单元1001提供领导者和追随者的初始状态值和预期值,预期值包括系统所期望的领导者和追随者的时变编队向量hi(t),hi(t)包括位置和速度,并满足步骤400获得的时变编队向量约束模型;控制器单元1001预置有步骤500中通过公式(8)获得的容错时变编队跟踪控制协议中的ui(t)计算模块;控制器单元1001运行容错时变编队跟踪控制协议中的ui(t)计算模块,获得当前一个控制周期各个追随者的ui(t),并发送给执行器单元1002,执行器单元1002包括各个追随者的执行器;执行器执行期间,出现故障和偏差,通过传感器获得相应的实际值,实际值包括各智能体实际的位置和速度信息以及切换拓扑信息,即公式(4)中Lσ(t)的和(7)中的权重矩阵
Figure BDA0002937957920000161
Figure BDA0002937957920000162
其中,各智能体实际的位置和速度信息作为返回值提供给各个控制器单元1001,各个控制器单元1001调用或者不调用连接的辅助运算单元3001对接收数据再次处理,完成一次控制闭环,辅助运算单元3001存储或者动态完成步骤300或者部轴500中公式(4)和公式(10)包含的模型和模型参数。
为了便于评价本发明技术方案效果,本文通过一个在MATLAB中建立的具体多智能体系统,通过步骤100至步骤500获得多智能体控制模型配置该多智能体系统的各个程序模块以便对各个智能体进行控制,配置该多智能体系统的外部环境模块模拟运行期间的执行器故障,通过MATLAB仿真验证本发明的技术效果。参考图5至12,本实施例提供了应用于一个具体的多智能体系统的切换拓扑下的多智能体容错跟踪控制方法。本实施例中多智能体系统的智能体群包含一个虚拟领导者和三个追随者共四个智能体,各个智能体在二维平面直角坐标系XOY下运动,其通信拓扑图集合S中包含G1、G2、G3三个生成树编队拓扑形式的拓扑图分别对应图5、图6、图7,其中A1结点编号0,A2结点编号1,A3结点编号2,A4结点编号3,并且各个拓扑具有同一根结点,智能体群根据图8所示的时序信号σ(t1),σ(t2),…,σ(t8),…在三个拓扑图G1、G2、G3中切换。每个连接权重为0或1,0表示不连接,1表示连接,切换间隔时间τ=5s,在MATLAB中根据公式(1)(2)建立多智能体系统的仿真模型2001,仿真模型2001提供每个智能体Ai的由系统采集返回的实际状态信息包括实际位置向量xi(t)=[xXi(t),xYi(t)]T和实际速度向量vi(t)=[vXi(t),vYi(t)]T,其中,xXi(t)和xYi(t)分别表示智能体Ai由系统采集到的x和Y方向的实际位置分量,vXi(t)和vYi(t)分别表示智能体Ai由系统采集到的x和Y方向的实际速度分量。追随者智能体的控制输入ui(t)由控制器模型给出,在故障仿真模型2002中配置满足公式(3)的A2、A3、A4的执行器故障参数,具体分别设为ρ2(t)=diag{0.5+0.1sin(t),0.5+0.1sin(t)},b2=[0,0]T,ρ3(t)=diag{1,1},b3=[0,0]T,ρ4(t)=diag{0.6+0.4e-0.1t,0.6+0.4e-0.1t},b4=[0.2+0.3sin(t),0.2+0.3sin(t)]T,追随者智能体期望的状态分别为
Figure BDA0002937957920000171
通过Matlab对本实施例进行系统仿真从而得到多智能体系统0-20s内的运动过程,图6、7、8是多智能体系统集合S的三个拓扑图,图9是多智能体系统的切换通信拓扑结构图,表示智能体之间的通讯连接关系每隔5秒产生信号使得系统拓扑自动进行一次向指定拓扑的切换;图10是其中一跟随者在X和Y方向的位置误差图,可以看出该跟随者的跟踪误差趋于0,说明当系统发生故障后,多智能体系统仍然能够顺利完成跟踪任务。图11是各个智能体在X和Y方向的速度图,跟随者的速度是时变的,且可以实现期望的速度,领导者的速度可以趋于0,说明领导者可以稳定在一点,符合领导者的控制模型要求。图12是多智能体的跟踪曲线,由图12可知,跟随者既可以实现给定的编队,又可以跟踪领导者的状态。
容易理解,上述实施例以二维空间中的多智能体空间位置分布为例实现了智能体群的切换拓扑,本领域技术人员能够据此继续进行三维空间的仿真和设计。通过调整系统参数,获得三维空间仿真编队的仿真结果,参考图5给出的流程优化模型后为实际的所智能体系统配置模型和模型参数以便其实现拓扑切换下的容错跟踪控制。
通过本应用实施例可以看出本发明技术方案中,执行器发生故障会使实际输出与控制信号之间产生偏差,当存在偏差说明智能体存在执行器故障。设计中没有用到故障检测装置,因为只要存在偏差,利用自适应方法设计出的控制器(8)就会进行补偿,自适应控制可使智能体根据任务具体情况和自身状态进行动态调整。自适应控制方法可与多智能体编队跟踪控制结合,从而根据具体任务形势,动态地调整编队跟踪控制器。
本应用实施例中,相邻智能体的输出和切换拓扑是同时输出的,智能体通过与相邻智能体的完成一致性控制策略的通信,获取其它智能体的状态信息,状态信息包括位置、速度信息,也包括是否相邻的智能体间存在拓扑连接,然后通过这些信息生成自身的控制指令,由控制器单元1001的容错时变编队跟踪协议实现,控制器将对位置和速度的控制uix和uiv传给相应追随者Ai的执行器,从而使得多智能体系统最后形成编队。如多无人机集群系统的形态编队,在此基础之上,编队跟踪控制在通信中除了传递邻居无人机状态信息外,还传递跟踪目标的状态信息,从而使多无人机集群系统保持一定的队形的同时跟踪目标。
本应用实施例中,多智能体系统仿真模型2001输出的实际值包括切换拓扑还需要通过智能体控制器之间的通讯链路给到相邻智能体,每隔5秒切换拓扑图变换一次,拓扑图表示的是智能体之间的连接关系,所以切换拓扑发生变化后,将信息传达给控制器,控制器再将信息传达给执行器,从而引起智能体之间连接关系的变化。
本应用实施例中,作为输入量的期望值包括领导者和跟随者智能体的初始位置和速度,以及跟随者期望的位置和速度hi(t),在仿真中由计算机预先给定。本发明中领导者控制模型(1)里面没有控制输入,所以最终领导者智能体可以稳定到一个点,因此不需要期望的位置和速度,跟随者模型(2)有控制输入,所以跟随者是时变的,是有期望的位置和速度。
需要说明的是:
本文提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
本文所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个申请方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映仅由这些描述构成的技术方案:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如本文所反映的那样,申请方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的机制进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的机制或单元或组件组合成一个机制或单元或组件,以及此外可以把它们分成多个子机制或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件机制实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器、数字信号处理器(DSP)和人工神经网络芯片来实现根据本申请实施例的切换拓扑下的多智能体容错跟踪控制方法中的一些或者全部步骤的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

Claims (10)

1.一种切换拓扑下的多智能体容错跟踪控制方法,其包含步骤:
在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻,该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行,该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行;所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点。
2.根据权利要求1所述的多智能体容错跟踪控制方法,其特征在于:
在时刻t,对于包含N个智能体{A1,A2,…,AN}的智能体群,A1为领导者,Ai为A1的追随者,i=2,3,…,N;
所述领导者A1的控制模型为,
Figure FDA0002937957910000011
其中,
Figure FDA0002937957910000012
为接收的A1当前时刻t的位置向量;
Figure FDA0002937957910000013
为接收的A1当前时刻t的速度向量;
Figure FDA0002937957910000014
为当前时刻t向A1的执行器发送的速度向量;
Figure FDA0002937957910000015
为当前时刻t向A1的执行器发送的加速度向量;αx和αv分别为该智能体群固有的阻尼常数;
所述追随者Ai的控制模型为,
Figure FDA0002937957910000016
其中,
Figure FDA0002937957910000017
为接收的Ai当前时刻t的位置向量;
Figure FDA0002937957910000018
为接收的Ai当前时刻t的速度向量;
Figure FDA0002937957910000019
为当前时刻t向Ai执行器发送的速度向量;
Figure FDA00029379579100000110
为当前时刻t向Ai执行器发送的加速度向量;
Figure FDA00029379579100000111
为t时刻Ai的执行器的控制输入向量;ρi(t)=diag{ρi1(t),ρi2(t),...,ρin(t)},对角元素ρij(t)表示t时刻Ai在执行器j通道的未知失效故障,并且满足0<ρij(t)≤1,j∈[1,2,...,n];
Figure FDA00029379579100000112
以表示未知输出偏差。
3.根据权利要求2所述的多智能体容错跟踪控制方法,其特征在于,
在所述拓扑切换时刻,所述智能体群中以追随者控制器模型运行的智能体Ai,根据以下容错时变编队跟踪协议向执行器提供所述控制输入向量ui(t):
Figure FDA00029379579100000113
其中,
Figure FDA0002937957910000021
为自适应更新增益,gi(Si(t))为时变编队跟踪局部误差Si(t)的一个非线性函数,
Figure FDA0002937957910000022
为所述多智能体系统各个智能体的控制器增益参数,P为预设的正定对称矩阵,hi(t)为相对于编队参考的分段连续可微偏移向量,hiv(t)为hi(t)中表示追随者Ai速度方向的连续可微偏移向量。
4.根据权利要求3所述的多智能体容错跟踪控制方法,其特征在于,所述跟踪者的时变编队跟踪局部误差Si(t)被设计为通过下式计算:
Figure FDA0002937957910000023
其中,hi(t)=[hix(t),hiv(t)]T(i=2,3,...,N)是分段连续可微向量。
5.根据权利要求3所述的多智能体容错跟踪控制方法,其特征在于,所述自适应更新增益
Figure FDA0002937957910000024
被设计为:
Figure FDA0002937957910000025
其中,
Figure FDA0002937957910000026
为满足时变编队跟踪误差向量ψi(t)为0,且小于等于
Figure FDA0002937957910000027
的自适应参数。
6.根据权利要求3所述的多智能体容错跟踪控制方法,其特征在于,正定对称矩阵P满足以下线性矩阵不等式:
Figure FDA0002937957910000028
其中,B1=[1 0]T,B2=[0 1]T,α=[αx αv],均为常数矩阵。
7.根据权利要求4所述的多智能体容错跟踪控制方法,其特征在于,在所述多智能体群的系统运行期间,其中追随者智能体的时变编队向量hi(t)的时变编队向量约束模型参与对所述多智能体群实时获取的时变编队向量hi(t)的计算处理。
8.根据权利要求7所述的多智能体容错跟踪控制方法,其特征在于,所述追随者智能体的时变编队向量hi(t)的时变编队向量约束模型包括以下两个编队跟踪条件:
条件一,时变编队跟踪的目标函数:
Figure FDA0002937957910000029
其中,hi(t),表示相对于编队参考的分段连续可微偏移向量,当满足
Figure FDA0002937957910000031
i∈F,则称追随者形成了hi(t)表示的编队,且跟踪上领导者的状态;
条件二,时变编队跟踪的可行性条件:
Figure FDA0002937957910000032
其中,hix(t)表示追随者Ai位置方向的连续可微偏移向量,hiv(t)表示追随者Ai速度方向的连续可微偏移向量。
9.根据权利要求6所述的多智能体容错跟踪控制方法,其特征在于,所述时变编队跟踪局部误差Si(t)的非线性函数gi(Si(t))被设计为:
Figure FDA0002937957910000033
并且,所述多智能体系统各个智能体的控制器增益参数K使用相同的P求解。
10.根据权利要求1至9任一项所述的多智能体容错跟踪控制方法,其特征在于,通过包含以下步骤的过程实施:
步骤100,根据各时刻所期望的一智能体群中各智能体的空间位置分布,确定该空间位置分布中的各智能体的领导者身份和追随者身份;
步骤200,根据外部预先获得的拓扑切换期间的故障类型,确定故障模型,将故障模型引入智能体控制模型中获得智能体群系统状态模型;
步骤300,构建领导者与追随者以及各追随者之间的基于步骤100所描述的拓扑切换的影响关系;
步骤400,获得满足智能体群编队跟踪条件的追随者智能体的时变编队向量约束模型;
步骤500,基于智能体模型、集合S中的通讯拓扑关系和包含编队跟踪可行性条件的时变编队向量约束模型,设计容错时变编队跟踪的多智能体控制模型并配置自适应参数;
步骤600,根据上述步骤所确定的多智能体控制模型的各个模块配置多智能体系统,以便实现各个智能体在时序相邻的两个空间位置分布切换时,在领导-追随控制模式下实现拓扑切换的进行编队跟随控制。
CN202110167620.4A 2021-02-07 2021-02-07 一种切换拓扑下的多智能体容错跟踪控制方法 Active CN112947557B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110167620.4A CN112947557B (zh) 2021-02-07 2021-02-07 一种切换拓扑下的多智能体容错跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110167620.4A CN112947557B (zh) 2021-02-07 2021-02-07 一种切换拓扑下的多智能体容错跟踪控制方法

Publications (2)

Publication Number Publication Date
CN112947557A true CN112947557A (zh) 2021-06-11
CN112947557B CN112947557B (zh) 2023-06-23

Family

ID=76243154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110167620.4A Active CN112947557B (zh) 2021-02-07 2021-02-07 一种切换拓扑下的多智能体容错跟踪控制方法

Country Status (1)

Country Link
CN (1) CN112947557B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114020042A (zh) * 2021-12-14 2022-02-08 北京航空航天大学 一种异构无人集群编队合围跟踪控制方法及系统
CN114326664A (zh) * 2021-12-22 2022-04-12 同济大学 一种非线性多智能体的容错控制器设计方法及存储介质
CN116047908A (zh) * 2023-01-16 2023-05-02 齐齐哈尔大学 混合阶异构多智能体系统协同最优编队控制方法及设备
CN117093006A (zh) * 2023-10-19 2023-11-21 西北工业大学深圳研究院 一种多智能体集群系统自适应固定时间仿射编队控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110933726A (zh) * 2019-12-12 2020-03-27 华东交通大学 一种切换异构网络下的多智能体系统包含控制的实现方法
CN111176327A (zh) * 2020-01-16 2020-05-19 北京航空航天大学 一种多智能体系统合围控制方法及系统
CN111208835A (zh) * 2020-02-27 2020-05-29 大连海事大学 一种基于拓扑重构的船舶编队切换控制方法
CN112000108A (zh) * 2020-09-08 2020-11-27 北京航空航天大学 一种多智能体集群分组时变编队跟踪控制方法及系统
WO2021073777A1 (en) * 2019-10-14 2021-04-22 NEC Laboratories Europe GmbH Topology-driven byzantine fault-tolerant consensus protocol with vote aggregation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021073777A1 (en) * 2019-10-14 2021-04-22 NEC Laboratories Europe GmbH Topology-driven byzantine fault-tolerant consensus protocol with vote aggregation
CN110933726A (zh) * 2019-12-12 2020-03-27 华东交通大学 一种切换异构网络下的多智能体系统包含控制的实现方法
CN111176327A (zh) * 2020-01-16 2020-05-19 北京航空航天大学 一种多智能体系统合围控制方法及系统
CN111208835A (zh) * 2020-02-27 2020-05-29 大连海事大学 一种基于拓扑重构的船舶编队切换控制方法
CN112000108A (zh) * 2020-09-08 2020-11-27 北京航空航天大学 一种多智能体集群分组时变编队跟踪控制方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
RAN ZHEN: "Fault-Tolerant Time-Varying Formation Tracking Control for Unmanned Aerial Vehicle Swarm Systems with Switching Topologies", 《MATHEMATICAL PROBLEMS IN ENGINEERING》 *
XIN WANG: "Fault-Tolerant Consensus Tracking Control for Linear Multiagent Systems Under Switching Directed Network", 《 IEEE TRANSACTIONS ON CYBERNETICS》 *
倪洪杰等: "切换拓扑下多舞台移动机器人编队容错跟踪控制", 《高技术通讯》 *
梁洪晶等: "具有领导者的多智能体系统协同控制研究", 《渤海大学学报(自然科学版)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114020042A (zh) * 2021-12-14 2022-02-08 北京航空航天大学 一种异构无人集群编队合围跟踪控制方法及系统
CN114326664A (zh) * 2021-12-22 2022-04-12 同济大学 一种非线性多智能体的容错控制器设计方法及存储介质
CN114326664B (zh) * 2021-12-22 2023-08-29 同济大学 一种非线性多智能体的容错控制器设计方法及存储介质
CN116047908A (zh) * 2023-01-16 2023-05-02 齐齐哈尔大学 混合阶异构多智能体系统协同最优编队控制方法及设备
CN117093006A (zh) * 2023-10-19 2023-11-21 西北工业大学深圳研究院 一种多智能体集群系统自适应固定时间仿射编队控制方法
CN117093006B (zh) * 2023-10-19 2024-01-30 西北工业大学深圳研究院 一种多智能体集群系统自适应固定时间仿射编队控制方法

Also Published As

Publication number Publication date
CN112947557B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN112947557B (zh) 一种切换拓扑下的多智能体容错跟踪控制方法
Yang et al. Leader–follower output synchronization of linear heterogeneous systems with active leader using reinforcement learning
CN110782011B (zh) 一种基于强化学习的网络化多智能体系统分布式优化控制方法
Fu et al. Distributed formation navigation of constrained second-order multiagent systems with collision avoidance and connectivity maintenance
Wang et al. Cascade structure predictive observer design for consensus control with applications to UAVs formation flying
Turpin et al. Trajectory design and control for aggressive formation flight with quadrotors
Shahvali et al. Distributed control of networked uncertain Euler–Lagrange systems in the presence of stochastic disturbances: a prescribed performance approach
CN111208829B (zh) 基于分布式预设时间状态观测器的多移动机器人编队方法
Zhu et al. Observer-based event-triggered formation control of multi-agent systems with switching directed topologies
CN112631335B (zh) 一种基于事件触发的多四旋翼无人机固定时间编队方法
Xia et al. Optimal synchronization control of heterogeneous asymmetric input-constrained unknown nonlinear MASs via reinforcement learning
CN114237041B (zh) 一种基于预设性能的空-地协同固定时间容错控制方法
CN111897224A (zh) 基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法
Ong et al. Cooperative collision avoidance via proximal message passing
CN114637278A (zh) 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法
CN117055605A (zh) 多无人机姿态控制方法及系统
Huang et al. Deep q-learning to preserve connectivity in multi-robot systems
CN111176324B (zh) 一种多无人机分布式协同编队规避动态障碍的方法
CN112198796A (zh) 一种分布式前置时间状态观测器的设计方法
Golmisheh et al. Heterogeneous optimal formation control of nonlinear multi-agent systems with unknown dynamics by safe reinforcement learning
Wang et al. Consensus tracking for discrete distributed parameter multi-agent systems via iterative learning control
Wang et al. Event-Triggered Integral Formation Controller for Networked Nonholonomic Mobile Robots: Theory and Experiment
Zhou et al. Path planning of improved DQN based on quantile regression
CN116500893B (zh) 一种高阶多智能体的强化学习优化控制器构建方法及系统
Ding et al. Finite-time consensus control for multi-agent systems with channel fading via sliding mode technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240329

Address after: Room 2412, Zijin Building, No. 100 Huai'an West Road, Shijiazhuang City, Hebei Province, 050000

Patentee after: Hebei Jinru Software Development Co.,Ltd.

Country or region after: China

Address before: 050018 No.26 Yuxiang street, Yuhua District, Shijiazhuang City, Hebei Province

Patentee before: HEBEI University OF SCIENCE AND TECHNOLOGY

Country or region before: China