CN114637278A

CN114637278A - 一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法

Info

Publication number: CN114637278A
Application number: CN202210222671.7A
Authority: CN
Inventors: 武晓晶; 郭振安; 甄然; 吴学礼
Original assignee: Hebei University of Science and Technology
Current assignee: Hebei University of Science and Technology
Priority date: 2022-03-09
Filing date: 2022-03-09
Publication date: 2022-06-17

Abstract

本发明涉及一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法，将故障模型加入到追随者的动态模型当中，基于智能体之间的相邻误差构造容错时变编队追踪控制协议；获得多智能体完成编队追踪所需的可行性条件；设计容错时变编队追踪的多智能体模型，并且给出自适应更新公式中所需的参数；构建智能体的控制模型，实现在多个领导者与切换拓扑下的容错时变编队追踪控制。

Description

一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法

技术领域

本发明涉及多智能体系统协同控制技术领域，具体涉及一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法。

背景技术

近年来，多智能体系统的协同控制因其在各个领域都拥有极其重要的应用从而得到了迅速发展，并引起了各个领域的关注。例如：微型卫星、车辆编队控制、飞行器编队控制、复杂网络同步、水下机器人，等方面都有极其重要的应用。协同控制可分为编队控制、一致性控制、合围控制和编队包围控制等几个分支。一致性控制是在设计的控制协议下，使得所有智能体的达到一致的状态。在过去的几十年中，机器人控制领域有三种典型的控制方法，分别是基于行为方法、领导-追随法和虚拟结构方法。

如今很多的多智能体编队研究都没有考虑执行器故障，然而随着多智能体规模的扩大后，智能体中执行器发生故障的概率也会提升，当执行器发生故障以后，会影响任务的继续执行，从而导致任务失败。

发明内容

本发明的目的是提供一种解决具有多个领导者的高阶线性多智能体系统的时变容错编队追踪控制问题，其中领导者的控制输入是未知且时变的。

本发明采用如下技术方案：

一种多领导者与切换拓扑下的多智能体容错编队跟踪控制方法，其包括如下步骤：

(1)根据智能体空间分布确定领导者与追随者；

(2)根据外部切换拓扑期间得到的故障信息，确定故障类型，将故障模型加入到追随者的动态模型当中；

(3)构造领导者与追随者之间的拓扑交互结构；

(4)基于智能体之间的相邻误差构造容错时变编队追踪控制协议；

(5)获得多智能体完成编队追踪所需的可行性条件；

(6)基于多智能体中领导与追随者模型，集合X拓扑关系，编队可行性条件，设计容错时变编队追踪的多智能体模型，并且给出自适应更新公式中所需的参数；

(7)构建智能体的控制模型，实现在多个领导者与切换拓扑下的容错时变编队追踪控制。

进一步的，步骤(1)中，所有知情追随者都是消息灵通的追随者，追随者之间的信息交互渠道是无方向的，对于每一个消息不灵通的追随者而言，至少存在一个消息灵通的追随者与它连接。

进一步的，步骤(2)中，故障类型分为四种情况：

情况1：当ρ_id(t)＝1且u_bid(t)＝0系统不存在故障；

情况2：当0＜ρ_id(t)＜1且u_bid(t)＝0时只存在失效故障；

情况3：当ρ_id(t)＝1且u_bid(t)≠0时系统只存在偏置故障；

情况4：当0＜ρ_id(t)＜1且u_bid(t)≠0时系统既存在失效故障也存在偏置故障。

进一步的，步骤(4)中，所述容错时变编队追踪控制协议为：

其中，

与

与

是自适应性参数，

与

表示故障的界限估计，P是一个正定矩阵。

进一步的，步骤(4)中，正定矩阵P由线性不等式

求得，其中线性不等式(A,B)是稳定的并且

进一步的，步骤(5)中，所述编队的可行性条件的补偿输入v_i(t)，通过

求解，假设存在补偿输入v_i(t)满足上述公式则可以继续，否则形成的编队对于在容错协议下的多智能体系统是行不通的。

进一步的，步骤(6)中，所述自适应性参数包括

分别通过如下公式计算：

进一步的，其中容错控制协议的局部编队追踪误差ξ_i(t)i∈F通过下列公式计算：

其中，协调变量θ_i(t)是基于期望时变编队h_i(t)来定义的，定义编队的协调变量为θ_i(t)＝x_i(t)-h_i(t)i∈F；

在多智能体运行期间，追随者的时变编队偏移向量h_i(t)，需要满足下述条件：对于任意给定有界初始状态，如果存在一个正常数a_k(k∈E)满足

可以实现具有多个领导者的编队追踪控制；

代表编队参考函数。

进一步的，步骤(7)中，带有执行器故障的追随者动力学模型：

本发明的有益效果在于：

1、当多智能体系统中一个或者多个智能体发生执行器故障以后，不仅可以完成所期望的时变编队，同时还可以跟踪领导者预期的轨迹，其中领导者存在未知时变控制输入使得研究变得更为复杂，并且相比较与无领导者或者单个领导者而言，本发明研究了存在多个领导者的情况更为复杂，且鲁棒性更强，单个领导者的研究结果不能直接应用到多个领导者。

2、编队是时变的，每个多智能体都是高阶的，相比较与时不变编队而言，时变编队的研究更为实用并且研究更为复杂。

3、本发明的拓扑是切换的，相比较与固定拓扑的研究本发明研究的切换拓扑应用更加广泛且鲁棒性更强，因为障碍物阻塞或通信设备链路故障时，多智能体系统的交互拓扑可能发生切换。并且固定拓扑的处理方法不能直接适用于切换拓扑，具有切换拓扑的多智能体系统的研究相较于固定拓扑而言更加复杂并且更加具有挑战性。

本发明考虑了编队控制方法，给出了一种分布式编队控制协议用来补偿偏置故障与未知效率故障，给出了时变编队的可行性方法。对于大规模多智能体控制，由于通信的限

附图说明

图1为本发明的方法的流程示意图。

图2为计算例中，多智能体通信拓扑图集合X包含的G₁生成树编队拓扑结构。

图3为为计算例中，多智能体通信拓扑图集合X包含的G₂生成树编队拓扑结构。

图4为拓扑切换信号时序示意图。

图5为追随者的误差。

具体实施方式

用G＝{V,E,W}表示拥有M结点的加权有向图，用V＝{v₁,v₂,....,v_M}来表示结点集合，

为边集合，W＝[w_ij]∈R^M×M表示具有非负权重的w_ij的邻接矩阵。G每条边用e_ij＝(v_i,v_j)来表示，v_i是v_j的邻居。权重w_ij＞0当且仅当e_ji∈E时，且w_ii＝0(i＝1,2,.....,M)。N_i＝{v_j∈V:e_ji∈E}表示所有邻居集。

表示v_i的入度。用D＝diag{deg_in(v_i),i＝1,2,......,M}来表示图G的入度矩阵。图G的Laplacian矩阵被表示为L＝D-W。

本发明由N追随者与M-N领导者，共拥有M智能体。用F＝[1,2,.........,N]与E＝[N+1,N+2,.........,M]分别表示追随者与领导者的集合。

(一)根据智能体空间分布确定领导者与追随者

领导者与追随者由如下描述定义，如果一个多智能体没有邻居那它被称为领导者，反之如果多智能体至少有一个邻居那么它被称为追随者。如果追随者的邻居集包含一个领导者称它为知情领导者，如果包含所有的领导者则称它为消息灵通的追随者，反之如果其邻居集不包括领导者称它为不知情追随者。

假设本发明的所有知情追随者都是消息灵通的追随者，追随者之间的信息交互渠道是无方向的，对于每一个消息不灵通的追随者而言，至少存在一个消息灵通的追随者与它连接。

(二)根据外部切换拓扑期间得到的故障信息，确定故障类型，将故障模型加入到追随者的动态模型当中

为了解决容错时变编队问题，建设执行器故障模型，对于追随者i(i∈F)，执行器故障模型被定义如下：

其中，

代表执行器的输出，u_i∈R^m代表执行器的输入，u_bi(t)∈R^m代表执行器的偏置故障，ρ_i(t)＝diag[ρ_i1(t),ρ_i2(t),.....,ρ_im(t)]且0＜ρ_id(t)≤1代表执行器通道d(d＝1,2,.....,m)未知效率故障。本发明同时考虑了偏置故障与失效故障。

执行器发生故障分为下面四种情况。

情况1：当ρ_id(t)＝1且u_bid(t)＝0系统不存在故障。

情况2：当0＜ρ_id(t)＜1且u_bid(t)＝0时只存在失效故障。

情况3：当ρ_id(t)＝1且u_bid(t)≠0时系统只存在偏置故障。

追随者系统模型：

其中，用x_i(t)∈Rⁿ来代表追随者i的状态向量，u_i(t)∈R^m代表追随者i的控制输入，u_bi(t)∈R^m代表追随者i的偏置故障，ρ_i(t)表示追随者i的未知失效故障，A∈R^n×n与B∈R^n×m是已知的常数矩阵。

未知失效故障ρ_i(t)与偏置故障u_bi(t)都是有界的，存在一个未知的正常数ρ _id使得0＜ρ _id≤ρ_id(t)≤1，i＝1,2,......,N,d＝1,2,......,m，存在一个正常数m_i，使得||u_bi||≤m_i

领导者系统模型：

其中，x_k(t)∈Rⁿ代表领导者k的状态向量,r_k(t)∈R^m代表领导者k的控制输入，是未知且时变的。A∈R^n×n与B∈R^n×m是已知的常数矩阵。

(三)构造领导者与追随者之间的拓扑交互结构

本发明多智能体系统之间的信息交互使用图论描述任意通信链拓扑图G_σ(t)满足以下假设：图G_σ(t)追随者之间的信息交互是无向的，图G_σ(t)是以多个根结点为领导者，其余结点为追随者。

(四)基于智能体之间的相邻误差构造容错时变编队追踪控制协议

容错时变编队追踪控制协议：

其中，

与

与

是自适应性参数，

与

表示故障的界限估计。P是一个正定矩阵。由线性不等式

求得，其中线性不等式(A,B)是稳定的并且

(五)获得多智能体完成编队追踪所需的可行性条件

求解编队的可行性条件的补偿输入v_i(t)，通过

假设存在补偿输入v_i(t)满足上述公式则可以继续，否则形成的编队对于在容错协议(公式(4))下的多智能体系统(公式(2))是行不通的。

(六)基于多智能体中领导与追随者模型，集合X拓扑关系，编队可行性条件，设计容错时变编队追踪的多智能体模型，并且给出自适应更新公式中所需的参数

通过以下自适应律，计算自适应性参数

上述容错控制协议的局部编队追踪误差ξ_i(t)i∈F通过下列公式计算：

当ξ_i(t)＝0说明系统完成了编队追踪。其中，协调变量θ_i(t)是基于期望时变编队h_i(t)来定义的，定义编队的协调变量为θ_i(t)＝x_i(t)-h_i(t)i∈F。

公式(8)可以改写成公式(9)

其中，

与

在多智能体运行期间，追随者的时变编队偏移向量h_i(t)，需要满足下述条件。对于任意给定有界初始状态，如果存在一个正常数a_k(k∈E)满足

可以实现具有多个领导者的编队追踪控制。

代表编队参考函数，当完成编队追踪时所有的追随者都需要注意编队参考函数

同时保持时变偏移量h_i(t)，要想使得x_i(t)-h_i(t)达成一致，h_i(t)与

将不可避免的引入系统从而影响分析与设计，这就使得编队追踪问题变得更加复杂。

(七)构建智能体的控制模型，实现在多个领导者与切换拓扑下的容错时变编队追踪控制

多智能体直接的通信拓扑可以进行切换。集合X表示多智能体可能形成的拓扑集合，拓扑索引O∈N代表自然数集合，δ(t):[0,∞)→O为拓扑切换时刻t的通信拓扑切换信号，其取值代表了多智能体系统在t时刻所对应通信拓扑在集合X中的编号。例如，δ(t₁)＝1，δ(t₂)＝2。G₁为t₁时刻后期望智能体切换到的第一生成树编队拓扑，G₂为t₂时刻后期望智能体切换到的第二生成树编队拓扑。

集合X至少包括第一生成树编队拓扑与一个第二生成树编队拓扑，这两个拓扑拥有共同的领导者。在t时刻，多智能体系统收到拓扑切换信号δ(t)，拓扑切换信号δ(t)使得多智能体系统中的智能体群从第一生成树编队拓扑向第二生成树编队拓扑图G_δ(t)进行切换，t为拓扑切换时刻，领导-追随(Leader-follower)的拓扑结构，t时刻的拓扑切换用拉普拉斯矩阵L_δ(t)描述。

L_1δ(t)∈R^N×N表示追随者与追随者之间的信息交互的拉普拉斯矩阵，

L_2δ(t)∈R^N×(M-N)表示追随者与领导者之间信息交互的拉普拉斯矩阵。

如果满足本发明对于领导者和追随者的定义与假设，那么对于每一个追随者，至少存在一个具有指向它的有向路径的领导者。因此，对于L_δ(t)有以下引理。

L_1δ(t)所有的特征值均具有正实部。

是非负的，

每一行都是相同的和为1，

有如下形式：

把容错协议(公式(4))代入到追随者动力学模型(公式(2))中可得

对追随者的局部误差(公式(8))求导可得

其中，

ρ(t)＝diag{ρ₁(t),ρ₂(t),.....,ρ_N(t)}

为了消去领导者外部输入的影响，假设存在一个正常数数d_i，使得

成立。

计算例

为了证明所设计容错控制协议的有效性，本发明利用MATLAB建立多智能体系统，多智能体系统由八个智能体组成，分为两个领导者与六个追随者，根据公式(1)与公式(2)构造每个多智能体的动力学模型x_i(t)＝[x_i1(t),x_i2(t),x_i3(t)]^T，其中x_i1(t),x_i2(t),x_i3(t)智能体分别表示X轴Y轴Z轴的状态。六个追随者的控制输入用u_i(t)＝[u_i1(t),u_i2(t)]^T，两个领导者的控制输入

r₇＝[0.1sin(t)+0.1,0.1sin(t+1)-0.1]^T,r₈＝[0.2sin(t)+0.2,0.2sin(t+1)-0.2]^T。

故障仿真模型满足公式(1)，对于每一个智能体，设置r_i＝0.5，η_i＝0.5，μ_i＝0.5，σ_i(t)＝10e^-0.9t，

追随者的执行器故障参数分别设置为：

ρ₁(t)＝diag{1,1}，u_b1(t)＝[-0.2sin(t),-0.2cos(t)]，u_b2(t)＝[0,0]，ρ₂(t)＝diag{1,1}，

u_b3(t)＝[0,0]，ρ₃(t)＝diag{0.8-0.2sin(t),0.5+0.2cos(t)}，

u_b4(t)＝[0,0],ρ₄(t)＝diag{1,1}，ρ₅(t)＝diag{0.5+0.2e^-0.2t,0.5+0.1cos(t)}，

u_b5(t)＝[-0.2-0.2e^-0.1t,0.2cos(t)]，ρ₆(t)＝diag{1,1}，u_b6(t)＝[0,0]。

追随者智能体的期望状态分别为：

常数矩阵A，B分别为，

多智能体通信拓扑图集合X包含G₁、G₂两种生成树编队拓扑结构分别对应图2和图3。每个智能体之间的连接权重为0或1，0表示不连接，1表示连接，图4表示切换拓扑信号，切换的周期定为10s。图5表示追随者的误差可以看出最后追随者的误差趋近于0。根据编队的可行性条件可以求得补偿输入v_i(t)。

通过线性不等式求得的正定矩阵P为。

本发明研究的是执行器故障下的编队追踪控制，同时考虑了执行器的偏置故障与未知失效故障使得多智能体系统在追随者执行器出现故障的情况下依然可以形成预期的编队同时跟踪领导者。

本发明考虑的是拥有多个领导者的多智能体系统相比较与单个领导者而言多个领导者具有更强的鲁邦性，并且研究更为复杂。例如，以无人车为例，如果跟踪目标是一辆给定的无人车，该无人车的故障将导致整个编队的崩溃。但是，在有多个领导者的情况下，如果某些领导者无人车出现故障，剩余领导者无人车可以视为新的跟踪目标，任务可以继续。

本发明的多智能体系统是时变的多智能体是高阶的，相比较与时不变系统，时变系统的鲁邦性更强且研究更为复杂，在容错编队追踪控制协议设计的过程中，存在编队信息极其衍生信息，因此研究时变编队具有更强的挑战性。

本发明考虑的拓扑结构是切换的，相比较与固定拓扑，切换拓扑的鲁邦性更强。因为障碍物阻塞或通信设备链路故障时，多智能体系统的交互拓扑可能发生切换。

本发明采用的方法是领导-追随法，相比较与编队控制方法，领导-追随法可以对中心进行更好的控制。

本领域技术人员应该理解，以上实施例仅为本发明的优选实施方案，详尽的说明只是为了帮助读者更好地理解本发明精神，而并非对本发明保护范围的限制，相反，任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。