CN112947557A

CN112947557A - 一种切换拓扑下的多智能体容错跟踪控制方法

Info

Publication number: CN112947557A
Application number: CN202110167620.4A
Authority: CN
Inventors: 甄然; 金亚婷; 武晓晶; 吴学礼
Original assignee: Hebei University of Science and Technology
Current assignee: Hebei Jinru Software Development Co ltd
Priority date: 2021-02-07
Filing date: 2021-02-07
Publication date: 2021-06-11
Anticipated expiration: 2041-02-07
Also published as: CN112947557B

Abstract

本公开提供了一种切换拓扑下的多智能体容错跟踪控制方法，属于协同控制领域。该方法包含步骤：在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻，该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行，该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行；所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点。该方法构造出完全分布式的容错跟踪控制协议，使得系统在执行器故障情况下，仍可以实现多智能体的编队跟踪；同时，利用自适应策略获得时变容错控制协议，得以解决在执行器故障未知且时变的条件下避免高增益的问题。

Description

一种切换拓扑下的多智能体容错跟踪控制方法

技术领域

本发明属于协同控制领域，尤其涉及多智能体切换通信网络拓扑时的跟踪控制方法。

背景技术

在很多通信控制场景中，如卫星导航、机器人控制、无人机搜索救援、军舰协同作战等方面，都应用到协同控制领域中的多智能体(Mult-Agent)的编队跟踪(Formationtracking)控制技术。然而，以多智能体的无人机系统为例的，系统中的每一个智能体(无人机)都可能发生执行器故障的情况，且随着智能体个数的增加和系统结构的复杂化，编队中存在执行器发生故障的几率也在增加，执行器故障将会影响智能体的正常飞行，并可能通过拓扑链(Topological chain)影响到其他智能体，从而影响整个编队的飞行，导致执行的任务失败。同时在实际飞行过程中，智能体之间拓扑结构可能会由于通信距离的限制而导致一个或者多个通信链(Communication link)的失效和新通信链路的产生，从而发生拓扑间的切换。

目前，解决编队跟踪控制问题主要有以下几种经典的控制算法：领导-追随者控制算法、虚拟结构控制算法、基于行为的控制算法以及一致性理论。这些方法一个方面的部分解决了执行器故障情况下，多智能体系统的编队跟踪控制问题，但是既考虑执行器故障，又考虑切换通讯拓扑结构的跟踪控制方法尚未见公开。

发明内容

本发明目的在于提供一种适于切换拓扑下的多智能体容错跟踪控制方法，进而增强多智能体系统的鲁棒性，使得系统在执行器故障情况下，仍可以实现多智能体的编队跟踪。

本发明提供的技术方案为一种切换拓扑下的多智能体容错跟踪控制方法，其包含步骤：在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻，该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行，该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行；其中，所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点，本文中根结点即为两个生成树编队拓扑切换时的领导者。

在一些具体的实施例中上述的多智能体容错跟踪控制方法，包含以下步骤：

在时刻t，对于包含N个智能体{A₁，A₂，…，A_N}的智能体群，A₁为领导者，A_i为A₁的追随者，i＝2，3，…，N；

所述领导者A₁的控制模型为，

其中，

为接收的A₁当前时刻t的位置向量；

为接收的A₁当前时刻t的速度向量；

为当前时刻t向A₁的执行器发送的速度向量；

为当前时刻t向A₁的执行器发送的加速度向量；α_x和α_v分别为该智能体群固有的阻尼常数；

所述追随者A_i的控制模型为，

其中，

为接收的A_i当前时刻t的位置向量；

为接收的A_i当前时刻t的速度向量；

为当前时刻t向A_i执行器发送的速度向量；

为当前时刻t向A_i执行器发送的加速度向量；

为t时刻A_i的执行器的控制输入向量；ρ_i(t)＝diag{ρ_i1(t)，ρ_i2(t)，...，ρ_in(t)}，对角元素ρ_ij(t)表示t时刻A_i在执行器j通道的未知失效故障，并且满足0＜ρ_ij(t)≤1，j∈[1，2，...，n]；

以表示未知输出偏差。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，包含以下步骤：

在所述拓扑切换时刻，所述智能体群中以追随者控制器模型运行的智能体A_i，根据以下容错时变编队跟踪协议向执行器提供所述控制输入向量u_i(t)：

其中，

为自适应更新增益，g_i(S_i(t))为时变编队跟踪局部误差S_i(t)的一个非线性函数，

为所述多智能体系统各个智能体的控制器增益参数，P为预设的正定对称矩阵，h_i(t)为相对于编队参考的分段连续可微偏移向量，h_iv(t)为h_i(t)中表示追随者A_i速度方向的连续可微偏移向量。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，在实施中其所述跟踪者的时变编队跟踪局部误差S_i(t)被设计为通过下式计算：

其中，h_i(t)＝[h_ix(t)，h_iv(t)]^T(i＝2，3，...，N)是分段连续可微的向量。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，在实施中所述自适应更新增益

被设计为：

其中，

为满足时变编队跟踪误差向量ψ_i(t)为0，且小于等于

的自适应参数。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，在实施中正定对称矩阵P满足以下线性矩阵不等式：

其中，B₁＝[1 0]^T，B₂＝[0 1]^T，α＝[α_x α_v]，均为常数矩阵。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，在实施中在所述多智能体群的系统运行期间，其中追随者智能体的时变编队向量h_i(t)的时变编队向量约束模型参与对所述多智能体群实时获取的时变编队向量h_i(t)的计算处理。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，在实施中所述追随者智能体的时变编队向量h_i(t)的时变编队向量约束模型包括以下两个编队跟踪条件：

条件一，时变编队跟踪的目标函数：

其中，h_i(t)，表示相对于编队参考的分段连续可微偏移向量，当满足

i∈F，则称追随者形成了h_i(t)表示的编队，且跟踪上领导者的状态；

条件二，时变编队跟踪的可行性条件：

其中，h_ix(t)表示追随者A_i位置方向的连续可微偏移向量，h_iv(t)表示追随者A_i速度方向的连续可微偏移向量。

一些优选实施例中，一个方面的改进在于上述的多智能体容错跟踪控制方法，在实施中，所述时变编队跟踪局部误差S_i(t)的非线性函数g_i(S_i(t))被设计为：

并且，所述多智能体系统各个智能体的控制器增益参数K使用相同的P求解。

一些优选实施例中，一个方面的改进在于上述各个的多智能体容错跟踪控制方法，在实施中根据包含以下步骤100至600限定时序逻辑处理过程实施：

步骤100，根据各时刻所期望的一智能体群中各智能体的空间位置分布，确定该空间位置分布中的各智能体的领导者身份和追随者身份；

步骤200，根据外部预先获得的拓扑切换期间的故障类型，确定故障模型，将故障模型引入智能体控制模型中获得智能体群系统状态模型；

步骤300，构建领导者与追随者以及各追随者之间的基于步骤100所描述的拓扑切换的影响关系；

步骤400，获得满足智能体群编队跟踪条件的追随者智能体的时变编队向量约束模型；

步骤500，基于智能体模型、集合S中的通讯拓扑关系和包含编队跟踪可行性条件的时变编队向量约束模型，设计容错时变编队跟踪的多智能体控制模型并配置自适应参数；

步骤600，根据上述步骤所确定的多智能体控制模型的各个模块配置多智能体系统，以便实现各个智能体在时序相邻的两个空间位置分布切换时，在领导-追随控制模式下实现拓扑切换的进行编队跟随控制。

本发明提供技术方案技术效果的至少一个方面在于：提供了切换拓扑下构造时变容错控制协议的方法，使得利用此控制协议，得以解决切换拓扑下执行器故障的编队跟踪控制问题。其中，针对二阶多智能体系统，本发明既考虑执行器故障情况又考虑切换拓扑的通讯条件；根据智能体之间的拓扑结构，基于相邻智能体的输出信息，构造出完全分布式的容错跟踪控制协议，增强了系统的鲁棒性，使得系统在执行器故障情况下，仍可以实现多智能体的编队跟踪；利用自适应策略获得时变容错控制协议，得以解决在执行器故障未知且时变的条件下避免高增益的问题。

附图说明

图1为本发明一实施例中使用切换拓扑下的多智能体容错跟踪控制方法的多智能体系统在拓扑切换时的系统原理框图；

图2为本发明一实施例中多智能体系统分布式容错跟踪控制协议的系统结构示意图；

图3为本发明一实施例中实施切换拓扑下的多智能体容错跟踪控制方法的步骤示意图；

图4为本发明一实施例中为多智能体系统配置实施切换拓扑下的多智能体容错跟踪控制方法的流程示意图；

图5为本发明另一实施例中为多智能体系统配置实施切换拓扑下的多智能体容错跟踪控制方法的流程示意图；

图6为本发明一实施例中集合S中的一个生成树编队拓扑的通信拓扑图；

图7为本发明一实施例中集合S中的另一个生成树编队拓扑的通信拓扑图；

图8为本发明一实施例中集合S中的另一个生成树编队拓扑的通信拓扑图；

图9为本发明一实施例中一个拓扑切换信号时序示意图；

图10为本发明一应用实施例中一追随者在X和Y方向的位置误差图；

图11为本发明一应用实施例中一智能体群中各智能体在X和Y方向的速度图；

图12为本发明一应用实施例中智能体群各智能体在容错条件下拓扑切换期间各智能体的跟踪曲线图。

具体实施方式

首先需要说明的是，在多智能体系统中，智能体群中某智能体发生执行器故障(Actuator faults)后可能会通过拓扑链影响到其他智能体的正常运行，从而导致任务失败。考虑到现实情况，执行器故障包括失效故障和偏差故障，且这些故障都是未知且时变的，所以容错控制需要采用鲁棒控制算法或自适应控制算法。即为切换拓扑下多智能体的容错跟踪控制问题。任章等人于2017公开了固定拓扑下多智能体系统在执行器故障和输入饱和两种情况下的解决时变跟踪问题的技术方案，但其技术启示在于在解决时变问题时要求追随者不仅需要保持预定的编队，并且需要确定其和跟踪领导者之间的状态。因此，其方案中首先通过引入双曲正切函数对具有输入饱和约束的控制器模型进行修正，在此基础上，利用动态表面控制技术构造了各跟踪者的动态增广模型，并推导出其控制协议，但其未涉及切换拓扑下的时变跟踪问题，其提供控制协议仅在于通过自适应容错控制来处理偏差故障和未知有界的失效故障，进而实现多智能体固定拓扑下的容错控制方法。对本领域技术人员解决切换拓扑下的时变跟踪控制问题一般选用滑模控制的方法设计编队控制器，从而达到多智能体编队跟踪控制的目的，滑模控制是一类特殊的非线性控制方法，具有响应速度快，对系统的不确定参数不灵敏，物理实现简单，鲁棒性强的优点。本发明提供了另一种可实施的替代方法，并且实现了完全分布式的容错跟踪控制协议，为本领域技术人员提供了新的改进基础。

还需要说明的是，本发明的核心构思在于，通过考虑自适应策略和切换拓扑的通讯结构，构造出基于相邻智能体信息的完全分布式的容错时变跟踪控制协议，从而解决切换拓扑下执行器故障的问题。在该构思上，本发明主张：在一智能体群以一个第一生成树编队拓扑向一个第二生成树编队拓扑转换的一个拓扑切换时刻，该智能体群中根结点的智能体以不考虑执行器故障的领导者控制模型运行，该智能体群中其他结点的智能体以考虑执行器故障的追随者控制模型运行；所述第一生成树编队拓扑向第二生成树编队拓扑具有相同的根结点。进而实现切换拓扑下的多智能体容错跟踪控制方法。

下面通过实施例结合附图进一步描述本发明提供技术方案，以便本领域技术人员充分理解本发明与现有技术的差异和具体效果，并在此基础上予以实施哈改进。

本发明提供的多个实施例展示了一种切换拓扑下的多智能体容错跟踪控制方法，应用于包含一个智能体群的多智能体系统。该多智能体系统至少实现了一个智能体群的编队跟踪系统，该智能体群由N个智能体{A₁，A₂，…，A_N}组成，其中，包括1个领导者A₁和N-1个追随者A₂，…，A_N，智能体之间的切换拓扑结构由G_σ(t)描述，编队跟踪系统在面对每个追随者都可能遭受执行器故障，且故障包括失效故障和偏差故障，能够实现满足期待的拓扑切换。容易理解的，本实施例的切换拓扑下的多智能体容错跟踪控制方法是一种基于自适应控制和一致性理论控制的二阶多智能体系统容错跟踪控制方法，在面对具有无向切换通讯拓扑结构的多智能体跟踪系统中存在的执行器故障的问题时，通过领导者控制模型和追随者控制模型的自适应控制，使用一种完全分布式容错控制协议，使得多智能体系统在发生故障的情况下仍能顺利完成拓扑切换时的跟踪任务。

参考图1、2，本实施例中多智能体系统的自适应控制模型包括领导-追随模式下的分布于领导者控制器的领导者控制模型以及分布于追随者控制器的追随者控制模型。其中：

领导者A₁的控制模型：

其中，

均为n维列向量，分别表示领导者的位置和速度；α_x和α_v为阻尼常数。

追随者A_i，(i＝2，3，...，N)的控制模型：

其中，

和

分别表示追随者A_i的位置、速度和控制输入向量，α_x和α_v为阻尼常数。本实施例中，取通道数n＝1以做出示范性说明，根据多智能体的具体控制通道数量，对于在一些其他实施例中n＞1，根据本实施例计算所取参数向量间克罗内克积的示范，所有的结果都可以直接推广到高维情况。

可以看出，本实施例的追随者控制模型(2)中考虑了其执行器各通道故障，本实施例中，追随者执行器故障模型用下式表示：

u_iF(t)＝ρ_i(t)u_i(t)+b_i(t) (3)

其中，

为追随者执行器控制输入向量；

为执行器的故障输出向量；

ρ_i(t)＝diag{ρ_i1(t)，ρ_i2(t)，...，ρ_in(t)}，其中未知失效故障ρ_ij(t)满足0＜ρ_ij(t)≤1，i∈[2，3，...，N]，j∈[1，2，...，n]；

b_i(t)＝[b_i1(t)，b_i2(t)，...，b_in(t)]^T，b_ij(t)表示执行器第j通道存在未知输出偏差。本文中，序号i、j、k仅表示装置、通道、参数或者元素等对象组中一个对象的序，用于区别同组中不同对象，其具体含义根据本文限定的取值范围和对象定义而确定，同序号的不同对象不限定对应关系。

具体的，对于追随者A_i，本实施例的执行器故障包括以下故障模式：

(1)如果ρ_ij(t)＝1且b_ij(t)＝0，认为追随者A_i不存在执行器故障。

(2)如果0＜ρ_ij(t)＜1且b_ij(t)＝0，追随者A_i存在失效故障。

(3)如果ρ_ij(t)＝1且b_ij(t)≠0，追随者A_i存在偏差故障。

(4)如果0＜ρ_ij(t)＜1且b_ij(t)≠0，追随者A_i既存在偏差故障又存在失效故障。

本发明技术方案中执行器故障指未知且时变的，满足以下边界假设的执行器故障：

未知失效故障ρ_i(t)和偏差故障b_i(t)是有界的，即存在两个未知正常数η_i和β_i，满足0＜η_i≤ρ_i(t)≤1，并且，||b_i(t)||≤β_i(i＝2，3，...，N)。

本实施例中，多智能体系统包含的智能体群{A₁，A₂，…，A_N}的网络通信拓扑结构，在智能体群处于一个非切换时的稳定状态时，由一个有N个顶点的加权有向图G＝{V(G)，E(G)，W(G)}表示N个智能体之间的通信链路。其中，顶点集V(G)＝{v₁，v₂，...，v_N}，加权邻接矩阵

边集

分别代表与G相关的顶点集、和边集。e_ij＝(v_i，v_j)∈E表示为G的边，其中，顶点v_i称为顶点v_j的邻居。对于

当且仅当e_ij＝(v_i，v_j)∈E时，w_ij＞0，否则w_ij＝0。G的入度矩阵定义为D(G)＝diag{deg_in{v_i}，i＝1，2，...，N}，其中

表示为顶点v_i的入度。顶点v_i的邻居集可由N_i＝{V_j∈V(G)：e_ij∈E(G)}表示。图G的拉普拉斯矩阵L可以定义为L＝D(G)-W(G)。本实施例其他拓扑切换相关定义条件可以根据任章等公开的“Time-VaryingFormation Tracking for Second-Order Multi-Agent Systems Subjected toSwitching Topologies With Application to Quadrotor Formation Flying，”IEEETRANSACTIONS ON INDUSTRIAL ELECTRONICS，VOL.64，NO.6，JUNE 2017。显然，对于用图G描述通信链路的智能体群，如果存在至少一个顶点(即结点)，且该顶点与所有其他顶点都有通信路径，则该图所描述的拓扑结构即为本发明一个生成树编队拓扑。

容易理解，多智能体之间的通信拓扑即编队拓扑能够进行切换。集合S表示多智能体系统所有可能的通信拓扑集合，且拓扑索引集

代表自然数的集合，σ(t)：[0，∞)→I为一个拓扑切换时刻t的通信拓扑切换信号，其取值代表了多智能体系统在t时刻所对应通信切换拓扑在集合S中的编号。示范的，对于σ(t₁)＝1，σ(t₂)＝2，G₁为t₁时刻后期望智能体切换到的第二生成树编队拓扑，G₂为t₂时刻后期望智能体切换到的第二生成树编队拓扑。

本实施例多智能体系统的由多智能体组成的智能体群中，各个智能体使用图论描述的任一通信链路拓扑图G_σ(t)满足以下假设：图G_σ(t)是以一个根结点为领导者，以其他结点为追随者的生成树编队拓扑，集合S中至少包括预设的一个第一生成树编队拓扑和一个第二生成树编队拓扑，该第一生成树编队拓扑和一个第二生成树编队拓扑根结点的是同一领导者，即具备相同的根结点。容易理解，一些实施例中，生成树编队拓扑可以根据现有技术中广度优先、深度优先等生成算法动态获得。本实施例中，任一图G_σ(t)中追随者之间的开始的拓扑边是无向的，在t时刻，多智能体系统接收到一个拓扑切换信号σ(t)，拓扑切换信号σ(t)携带多智能体系统的预设程序模块所要求的信息，该信息使得多智能体系统的智能体群开始从当前的第一生成树编队拓扑向第二生成树编队拓扑图G_σ(t)转换，t即为拓扑切换时刻，该领导-追随(Leader-follower)的拓扑结构中，t时刻拓扑切换的用拉普拉斯矩阵描述领导者与追随者以及追随者之间影响的有向图L_σ(t)有以下形式：

其中，

表示领导者和追随者之间影响的拉普拉斯矩阵，

表示追随者和追随者之间影响的拉普拉斯矩阵，0_1×1与0_1×(N-1)是占位的零矩阵，代表相应结点智能体之间的无关性。

示范的，本实施例根据本发明提供的领导者控制模型和追随者控制模型提供一种容错跟踪控制协议的技术方案，如下：

令t时刻智能体A_k的编队跟踪状态向量为ξ_k＝[x_k(t)，v_k(t)]^T，根据领导者和追踪者的控制模型(1)和(2)，使用以下公式建立本实施例的多智能体系统模型：

其中，B₁＝[1 0]^T，B₂＝[0 1]^T，α＝[α_x α_v]。

进一步的，计算系统的时变编队跟踪误差向量：ψ_i(t)＝ξ_i(t)-h_i(t)-ξ₁(t)，其中，ξ_i是将位置和速度x_k(t)，v_k(t)组合在一起的向量，单纯的组合，以便由公式(1)和(2)可组合求解，目的是简化公式，方便后续证明简化过程。ψ_i(t)是时变编队跟踪误差，当ψ_i(t)＝0则证明出系统的跟踪误差为0，说明跟踪目标成就，且h_i(t)满足

的条件，h_ix(t)和h_iv(t)分别表示h_i(t)的位置和速度分量，则根据公式(5)，本实施例的系统时变编队跟踪误差向量被描述为：

上述构思在于，通过证明时变编队跟踪误差向量ψ_i(t)是否为0，判断控制协议设计的是否正确。本发明各实施例中容错跟踪控制协议具体即通过式(8)限定的全部u(t)的求解过程，同时，通过式(7)(9)(10)(11)揭示了式(8)中具体参数的限定表示。与现有技术不同的，本发明限定了(8)为切换拓扑时刻的控制协议，同时通过具体的式(7)(9)(10)(11)限定了新的求解过程。

进一步的，计算本实施例跟踪者的时变编队跟踪局部误差S_i(t)：

其中，h_i(t)＝[h_ix(t)，h_iv(t)]^T(i＝2，3，...，N)是分段连续可微的。进而，各追随者期望的时变编队h(t)可表示为h(t)＝[h₂(t)，h₃(t)，...，h_N(t)]^T。

进一步的，基于邻近局部误差，根据以上构思设计容错时变编队跟踪协议，即下式(8)：

其中，

为自适应更新增益，g_i(S_i(t))为一个非线性函数，多智能体系统各个智能体的控制器增益参数设计为

P为正定对称矩阵且满足以下线性矩阵不等式：

自适应更新增益为：

进一步的，上述计算方法可以预先简化为：

其中，k_i和σ_i均为正常数，且其初始值满足

是为了满足时变编队跟踪误差向量ψ_i(t)为0，而设计出来的自适应参数，是公式(8)指定的控制协议中的一部分。需要说明的是，本发明实施例对k_i和σ_i没有其他限制性要求。

具体的，时变编队跟踪局部误差S_i(t)的非线性函数g_i(S_i(t))表示为：

示范的，基于本实施例的领导者控制模型(1)、追随者控制模型(2)以及容错时变跟踪控制协议(8)，其中容错时变跟踪控制协议(8)中各模型分别由公式(7)、(9)、(10)、(11)提供，参考图1、2、3，本实施例的智能体群通过以下步骤100至600实现一次拓扑切换时的容错跟踪控制。

步骤100，根据各时刻所期望的一智能体群中各智能体的空间位置分布，确定该空间位置分布中的各智能体的领导者身份和追随者身份。

本实施例中，将空间位置分布的智能体中，无邻居的智能体确定为一领导者，如A₁；将至少存在一个邻居的智能体确定为一追随者，如A₂，…，A_N。示范的，根据时刻t₂期望的空间位置分布，以其中无邻居的智能体A₁为根结点创建一个第二生成树编队

以智能体A₁为根结点的创建时刻t₁的智能体群的空间位置分布创建一个第一生成树编队

其中，t₂＞t₁。

容易理解，本实施例仅要求两个不同空间位置分布变化期间，使用领导-追随者控制模式的生成树拓扑编队，在其他时刻并不限定必须保持领导-追随控制模型保持编队空间位置分布。

步骤200，根据外部预先获得的拓扑切换期间的故障类型，确定故障模型，将故障模型引入智能体控制模型中获得智能体群系统状态模型。

具体的，本实施例考虑编队故障包括失效故障和偏差故障，建立编队故障模型：

u_iF(t)＝ρ_i(t)u_i(t)+b_i(t) (3)

其中，

i，表示追随者A_i的身份序号；

u_i(t)，表示各追随者控制器具体的控制输入指令，容易看出，

u_iF(t)，表示各追随者执行器具体的驱动控制输入，容易看出，

ρ_i(t)，表示追随者A_i执行器效率矩阵，ρ_i(t)＝diag{ρ_i2(t)，ρ_i3(t)，...，ρ_iN(t)}；且满足0＜ρ_ij(t)≤1，(j＝1，2，...，n)，ρ_ij(t)表示执行器效率矩阵的第j个对角元素；

b_i(t)＝[b_i1(t)，b_i2(t)，...，b_in(t)]^T，b_ij(t)表示执行器第j通道存在未知输出偏差。b_i(t)表示偏差故障，容易看出，

编队故障模型中执行器失效故障元素ρ_ij(t)未知但有界，满足0＜η_i≤ρ_ij(t)≤1，其中，η_i表示未知正常数，从外部获取；偏差故障b_i(t)未知且有界，满足||b_i(t)||≤β_i，其中，β_i表示未知正常数，从外部获取。

基于执行器故障模型可知，建立各个追随者A_i(i＝2，3，...，N)在拓扑切换时的控制模型：

其中，

x_i(t)，表示追随者在拓扑切换期间一个控制周期中获得的实际位置，x_i(t)∈Rⁿ：

v_i(t)，表示追随者在拓扑切换期间一个控制周期中获得的实际速度；

α_x和α_v为阻尼常数。

领导者的控制模型：

其中，

x₁(t)，表示追随者的位置，x₁(t)∈Rⁿ；

v₁(t)，表示追随者的速度，v₁(t)∈Rⁿ；

α_x和α_v为阻尼常数。

令ξ_k＝[x_k(t)，v_k(t)]^T，领导者和跟踪者的控制模型可表示为：

其中，B₁，表示常数矩阵，B₁＝[1 0]^T；B₂，表示常数矩阵，B₂＝[0 1]^T；α，表示常数矩阵，α＝[α_x α_v]。公式(5)的解即智能体群系统状态模型。

步骤300，构建领导者与追随者以及各追随者之间的基于步骤100所描述的拓扑切换的影响关系。

具体的，本实施例在步骤100中将时间相邻的两个空间位置分布中智能体集群中的每个智能体用结点表示，将结点间的通信连接用结点连线构成的边来表示；将智能体集群的通信关系用无向代数拓扑图表示，所述无向代数拓扑图包含结点、边以及边的权重值。V(G)＝{v₁，v₂，...，v_N}，W(G)＝[w_ij]∈R^N×N，

分别代表与G相关的顶点集、加权邻接矩阵和边集。e_ij＝(v_i，v_j)∈E表示为G的边，其中顶点v_i称为顶点v_j的邻居。对于

当且仅当e_ij＝(v_i，v_j)∈E时，w_ij＞0，否则w_ij＝0。G的入度矩阵定义为D(G)＝diag{deg_in{v_i}，i＝1，2，...，N}，

其中，

表示为顶点v_i的入度。顶点v_i的邻居集可由N_i＝{V_j∈V(G)：e_ij∈E(G)}表示。智能体群拓扑切换中的拉普拉斯矩阵L可以定义为L＝D(G)-W(G)。

容易理解的，本实施例中多智能体之间的通信拓扑能够进行切换。用集合S表示步骤100中系统所有可能的通信拓扑集合，且拓扑索引集为

，N代表自然数的集合，σ(t)：[0，∞)→I为通信拓扑切换信号，其取值代表了多智能体系统在t时刻所对应通信切换拓扑的编号。

可以看出，本实施例中，图论满足以下假设：图G_σ(t)有一个以领导者为根结点的生成树。而且追随者之间的拓扑是无向的。考虑了Leader-follower的拓扑结构，拉普拉斯矩阵L_σ(t)有以下形式：

其中，

表示领导者和追随者之间通信关系的矩阵；

表示追随者和追随者之间通信关系的矩阵。

步骤400，获得满足智能体群编队跟踪条件的追随者智能体的时变编队向量约束模型。

具体的，在多智能体系统运行期间，追随者智能体的时变编队向量h_i(t)要满足的编队跟踪条件有两个，其中：

条件一，时变编队跟踪的目标函数：

条件二，时变编队跟踪的可行性条件：

其中，h_ix(t)表示追随者A_i位置方向的连续可微偏移向量，h_iv(t)表示追随者A_i速度方向的连续可微偏移向量；

上述条件一和条件二构成了本实施例中追随者智能体的时变编队向量h_i(t)的时变编队向量约束模型，在系统运行期间参与对实时获取的时变编队向量h_i(t)的计算处理。

步骤500，基于智能体模型、集合S中的通讯拓扑关系和包含编队跟踪可行性条件的时变编队向量约束模型，设计容错时变编队跟踪的多智能体控制模型并配置自适应参数。

具体的，当系统的时变编队跟踪误差为：ψ_i(t)＝ξ_i(t)-h_i(t)-ξ₁(t)且h_i(t)满足

的约束条件，本实施例的多智能体系统实际运行期间在涉及拓扑切换的任一具体时刻应当被描述为：

即根据公式(6)，

定义跟踪者的时变编队跟踪局部误差为：

其中，

S_i(t)，表示跟踪者的时变编队跟踪局部误差；i表示第i个追随者，j表示第j个追随者；h_ix(t)，表示追随者位置方向的连续可微偏移向量；h_iv(t)，表示追随者速度方向的连续可微偏移向量；

表示追随者i和领导者之间的加权邻接值；

表示追随者i和追随者j之间的加权邻接值；

利用邻近局部误差S_i(t)，设计出容错时变编队跟踪控制协议中的u_i(t)计算模块：

其中，

表示自适应更新增益，并根据公式(10)设计计算

的程序模块。程序模块中的k_i和σ_i均为正常数，且其初始值满足

其中，

g_i(S_i(t))表示S_i(t)的一个非线性函数，本实施例被配置为：

其中，P为正定对称矩阵且满足以下线性矩阵不等式：

同时，容错时变编队跟踪协议中的控制器增益参数K被设计为

图4和图5分别示出了两种不同的配置方法以使得多智能体系统实现本发明切换拓扑下的多智能体容错跟踪控制方法。

示范的，完成配置的多智能体系统在运行期间，至少可以通过以下过程获得本发明技术方案的效果：在一个从当前所处于的第一发生树编队拓扑切换到指定的第二发生树编队拓扑时刻，该时刻由拓扑切换信号启动；多智能体系统根据拓扑切换信号向各个智能体的控制器单元1001提供领导者和追随者的初始状态值和预期值，预期值包括系统所期望的领导者和追随者的时变编队向量h_i(t)，h_i(t)包括位置和速度，并满足步骤400获得的时变编队向量约束模型；控制器单元1001预置有步骤500中通过公式(8)获得的容错时变编队跟踪控制协议中的u_i(t)计算模块；控制器单元1001运行容错时变编队跟踪控制协议中的u_i(t)计算模块，获得当前一个控制周期各个追随者的u_i(t)，并发送给执行器单元1002，执行器单元1002包括各个追随者的执行器；执行器执行期间，出现故障和偏差，通过传感器获得相应的实际值，实际值包括各智能体实际的位置和速度信息以及切换拓扑信息，即公式(4)中L_σ(t)的和(7)中的权重矩阵

和

其中，各智能体实际的位置和速度信息作为返回值提供给各个控制器单元1001，各个控制器单元1001调用或者不调用连接的辅助运算单元3001对接收数据再次处理，完成一次控制闭环，辅助运算单元3001存储或者动态完成步骤300或者部轴500中公式(4)和公式(10)包含的模型和模型参数。

为了便于评价本发明技术方案效果，本文通过一个在MATLAB中建立的具体多智能体系统，通过步骤100至步骤500获得多智能体控制模型配置该多智能体系统的各个程序模块以便对各个智能体进行控制，配置该多智能体系统的外部环境模块模拟运行期间的执行器故障，通过MATLAB仿真验证本发明的技术效果。参考图5至12，本实施例提供了应用于一个具体的多智能体系统的切换拓扑下的多智能体容错跟踪控制方法。本实施例中多智能体系统的智能体群包含一个虚拟领导者和三个追随者共四个智能体，各个智能体在二维平面直角坐标系XOY下运动，其通信拓扑图集合S中包含G₁、G₂、G₃三个生成树编队拓扑形式的拓扑图分别对应图5、图6、图7，其中A₁结点编号0，A₂结点编号1，A₃结点编号2，A₄结点编号3，并且各个拓扑具有同一根结点，智能体群根据图8所示的时序信号σ(t₁)，σ(t₂)，…，σ(t₈)，…在三个拓扑图G₁、G₂、G₃中切换。每个连接权重为0或1，0表示不连接，1表示连接，切换间隔时间τ＝5s，在MATLAB中根据公式(1)(2)建立多智能体系统的仿真模型2001，仿真模型2001提供每个智能体A_i的由系统采集返回的实际状态信息包括实际位置向量x_i(t)＝[x_Xi(t)，x_Yi(t)]^T和实际速度向量v_i(t)＝[v_Xi(t)，v_Yi(t)]^T，其中，x_Xi(t)和x_Yi(t)分别表示智能体A_i由系统采集到的x和Y方向的实际位置分量，v_Xi(t)和v_Yi(t)分别表示智能体A_i由系统采集到的x和Y方向的实际速度分量。追随者智能体的控制输入u_i(t)由控制器模型给出，在故障仿真模型2002中配置满足公式(3)的A₂、A₃、A₄的执行器故障参数，具体分别设为ρ₂(t)＝diag{0.5+0.1sin(t)，0.5+0.1sin(t)}，b₂＝[0，0]^T，ρ₃(t)＝diag{1，1}，b₃＝[0，0]^T，ρ₄(t)＝diag{0.6+0.4e^-0.1t，0.6+0.4e^-0.1t}，b₄＝[0.2+0.3sin(t)，0.2+0.3sin(t)]^T，追随者智能体期望的状态分别为

通过Matlab对本实施例进行系统仿真从而得到多智能体系统0-20s内的运动过程，图6、7、8是多智能体系统集合S的三个拓扑图，图9是多智能体系统的切换通信拓扑结构图，表示智能体之间的通讯连接关系每隔5秒产生信号使得系统拓扑自动进行一次向指定拓扑的切换；图10是其中一跟随者在X和Y方向的位置误差图，可以看出该跟随者的跟踪误差趋于0，说明当系统发生故障后，多智能体系统仍然能够顺利完成跟踪任务。图11是各个智能体在X和Y方向的速度图，跟随者的速度是时变的，且可以实现期望的速度，领导者的速度可以趋于0，说明领导者可以稳定在一点，符合领导者的控制模型要求。图12是多智能体的跟踪曲线，由图12可知，跟随者既可以实现给定的编队，又可以跟踪领导者的状态。

容易理解，上述实施例以二维空间中的多智能体空间位置分布为例实现了智能体群的切换拓扑，本领域技术人员能够据此继续进行三维空间的仿真和设计。通过调整系统参数，获得三维空间仿真编队的仿真结果，参考图5给出的流程优化模型后为实际的所智能体系统配置模型和模型参数以便其实现拓扑切换下的容错跟踪控制。

通过本应用实施例可以看出本发明技术方案中，执行器发生故障会使实际输出与控制信号之间产生偏差，当存在偏差说明智能体存在执行器故障。设计中没有用到故障检测装置，因为只要存在偏差，利用自适应方法设计出的控制器(8)就会进行补偿，自适应控制可使智能体根据任务具体情况和自身状态进行动态调整。自适应控制方法可与多智能体编队跟踪控制结合，从而根据具体任务形势，动态地调整编队跟踪控制器。

本应用实施例中，相邻智能体的输出和切换拓扑是同时输出的，智能体通过与相邻智能体的完成一致性控制策略的通信，获取其它智能体的状态信息，状态信息包括位置、速度信息，也包括是否相邻的智能体间存在拓扑连接，然后通过这些信息生成自身的控制指令，由控制器单元1001的容错时变编队跟踪协议实现，控制器将对位置和速度的控制u_ix和u_iv传给相应追随者A_i的执行器，从而使得多智能体系统最后形成编队。如多无人机集群系统的形态编队，在此基础之上，编队跟踪控制在通信中除了传递邻居无人机状态信息外，还传递跟踪目标的状态信息，从而使多无人机集群系统保持一定的队形的同时跟踪目标。

本应用实施例中，多智能体系统仿真模型2001输出的实际值包括切换拓扑还需要通过智能体控制器之间的通讯链路给到相邻智能体，每隔5秒切换拓扑图变换一次，拓扑图表示的是智能体之间的连接关系，所以切换拓扑发生变化后，将信息传达给控制器，控制器再将信息传达给执行器，从而引起智能体之间连接关系的变化。

本应用实施例中，作为输入量的期望值包括领导者和跟随者智能体的初始位置和速度，以及跟随者期望的位置和速度h_i(t)，在仿真中由计算机预先给定。本发明中领导者控制模型(1)里面没有控制输入，所以最终领导者智能体可以稳定到一个点，因此不需要期望的位置和速度，跟随者模型(2)有控制输入，所以跟随者是时变的，是有期望的位置和速度。

需要说明的是：

本文提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本申请也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本申请的内容，并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。

本文所提供的说明书中，说明了大量具体细节。然而，能够理解，本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本申请并帮助理解各个申请方面中的一个或多个，在上面对本申请的示例性实施例的描述中，本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映仅由这些描述构成的技术方案：即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如本文所反映的那样，申请方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本申请的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的机制进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的机制或单元或组件组合成一个机制或单元或组件，以及此外可以把它们分成多个子机制或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本申请的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件机制实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器、数字信号处理器(DSP)和人工神经网络芯片来实现根据本申请实施例的切换拓扑下的多智能体容错跟踪控制方法中的一些或者全部步骤的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。