CN112925197B

CN112925197B - 基于有限时间的多智能体系统二分一致跟踪方法

Info

Publication number: CN112925197B
Application number: CN202110084937.1A
Authority: CN
Inventors: 万瑾; 毛艺颖; 赵敏
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2021-01-21
Filing date: 2021-01-21
Publication date: 2022-08-12
Anticipated expiration: 2041-01-21
Also published as: CN112925197A

Abstract

本发明提供了一种基于有限时间的多智能体系统二分一致跟踪方法，引入有向路径权重积概念确定有向图中任意两点间存在间接关联的交互关系，并据此判断有向图是否结构平衡；构建有向图对应的增广无向图，利用有向路径权重积概念设计规范变换矩阵D；利用基于M矩阵的方法来设计李雅普诺夫函数中待定参数，确定有限时间情况下多智能系统收敛时间上界。本发明的有益效果为：本发明克服了交互拓扑中权重系数全为非负的缺陷，合理假设多智能体间相互协作与竞争并存，利用带符号的正负路径权重积来刻画图中任意两点间的交互关系，高效地确定多智能体系统有限时间的收敛上界，从而有效地解决了现有技术中收敛时间上界计算困难的问题。

Description

基于有限时间的多智能体系统二分一致跟踪方法

技术领域

本发明涉及多智能体系统技术领域，尤其涉及一种基于有限时间的多智能体系统二分一致跟踪方法。

背景技术

在过去的几年里，多智能体系统一致性问题引起了极大的关注，主要是因为它在许多领域的广泛应用，包括环境监测、无人飞行器、传感器网络、和电网等。一致性，作为MASs的一种集体行为，意味着所有智能体可以在适当的协议下，仅基于相邻智能体之间的邻居信息，最终使每个智能体趋于一个相同的状态。现阶段，多智能体一致研究大多数都是基于智能体间交互关系为协作关系，即交互拓扑中权重都是非负的情形。而在一些实际情况下，更为合理的假设是，智能体间不仅相互协作，而且相互竞争。为此，将使用符号图描述智能体间这种新型关系，其中有边权重正负性分别代表合作关系和竞争关系。

与合作控制下的一致收敛相比，二分一致是一种特殊类型的共识，意味着所有智能体都以相同的模值但相反的符号收敛到最终状态。在实际应用中，二分一致现象广泛存在于许多应用场景中，如社交网络、敌对政治阵营和信任-猜忌网络。在这些实际网络的启发下，一种被称为结构平衡符号图的拓扑结构被创造性地引入该类研究中。此外，收敛速度是二分一致控制协议设计中的一个重要问题。当前，许多二分一致跟踪算法主要侧重于具有无限稳定时间的渐近收敛。与渐近控制协议相比，有限时间控制协议更可取，具有更快的收敛速度和更好的抗扰动性能。为此，提出了一种结构平衡符号图下的二分一致有限时间控制协议，即在已知系统初始状态条件下便可在有限时间内使得系统达到二分一致。

在绝大多数有限时间控制协议的研究结果中，有限时间的收敛上界需要通过复杂的数学公式计算，甚至因为有向图的非对称性导致无法有效获取收敛时间上界。从计算优化的角度上来看，本文所构造的李雅普诺夫函数，可以明确了李雅普诺夫函数待定参数的解析式，继而可以高效估计MASs有限时间的收敛上界。

发明内容

本发明的目的在于提供一种基于有限时间的多智能体系统二分一致跟踪方法，克服了交互拓扑中权重系数全为非负的缺陷，合理假设多智能体间相互协作与竞争并存，利用带符号的正负路径权重积来刻画图中任意两点间的交互关系，高效地确定多智能体系统有限时间的收敛上界，从而有效地解决了现有技术中收敛时间上界计算困难的问题。

本发明是通过如下措施实现的：一种基于有限时间的多智能体系统二分一致跟踪方法，其中，包括如下步骤：

步骤1：引入有向路径权重积概念确定有向图中任意两点间存在间接关联的交互关系，并据此判断有向图是否结构平衡；

步骤2：构建有向图对应的增广无向图，利用有向路径权重积概念设计规范变换矩阵D；

步骤3：提出有限时间协议解决有限时间的二分一致跟踪问题；

步骤4：提出基于M矩阵的方法来设计李雅普诺夫函数中待定参数，确定有限时间情况下多智能系统收敛时间上界。

作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案，所述步骤1的具体步骤为：

步骤1.1：采用符号有向图

描述协作竞争并存的多智能系统网络，其中

是一组点集，

是一组有向边集，并且

是邻接矩阵；

步骤1.2：用ε_ij表示从点j到点i的有向边，邻接矩阵

中元素a_ij定义为a_ij≠0当且仅当ε_ij∈ε；

步骤1.3：如果点j到点i的交互关系是合作的，则a_ij＞0，当交互关系是竞争的，则a_ij＜0；

步骤1.4：假设

没有自环，即所有

的a_ii＝0，图

是符号对角对称，即a_ija_ji≥0；

步骤1.5：假设

是图

中的一条有向路径，并且可以用首尾相连的有向边集

来表示，满足

的权重积用

表示；

步骤1.6：图

中至少存在一个点，该点也称为根，到

中所有剩余点均存在有向路径，则图

中包含生成树

ε′∈ε；

步骤1.7：符号有向图

的拉普拉斯矩阵定义为

领导邻接矩阵B表示为B＝diag{a₁₀，a₂₀，…，a_N0}，若第i个追随者可以从领导0接收信息，则a_i0＞0；否则a_i0＝0。

作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案，所述步骤2的具体步骤为：

步骤2.1：构造增广无向图

其中

且

包含生成树

步骤2.2：增广无向图

与有向图

拥有相同的点集

以及划分

步骤2.4：图

中任一有向路径记作

可以用首尾相连的一个有向边集

来表示，其中k₀＝j，k_l＝i，

的权重积用

来表示，

可以反映

中直接相连两点间的协作或竞争关系；

步骤2.5：若符号图G为结构平衡图，则其增广无向图

中存在一个正定对角矩阵D＝diag{σ₁，σ₂，...，σ_N}使得

其中σ₁＝1，

为有向路径

的权重积。

作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案，所述步骤3的具体步骤为：

步骤3.1：构建由一个虚拟领导者和N个跟随者组成的N+1个智能体集有向拓扑图

所构成的动态方程被描述如下：

是第i个跟随者的状态，而

是相应的输入控制；

步骤3.2：领导者的动态连续时间系统被描述如下：

和

分别是领导者的状态和输入控制；

步骤3.3：对于任何初始状态

则对于有限时间内的系统收敛上界

满足：

步骤3.4：为了实现二分一致追踪，做出以下两个假设：

(1)将包含生成树

的有向图

的根作为虚拟领导者；

(2)对于所有t≥0，存在一个常数ω₀＞0使得|u₀(t)|≤ω₀；

步骤3.5：在有限时间内，实现多智能体系统的二分一致跟踪，提出了以下跟踪协议：

其中c₁，c₂＞0并且0＜μ＜1；

步骤3.6：将局部智能体的追踪误差表示为e_i＝x_i-σ_ix₀，构建对角矩阵D＝diag{1，sgn(P21)，sgn(P₃₁)，…，sgn(P_N1)}；

步骤3.7：将多智能体系统和跟踪协议相结合，得到新的动态方程：

其中sgn(a_ij)x_j-x_i＝sgn(a_ij)e_j+sgn(a_ij)σ_jx₀-e_i-σ_ix₀＝sgn(a_ij)e_j-e_i；

步骤3.8：e可以表示为e＝[e₁，e₂，…，e_N]^T，则步骤2.7的可以被改写成向量形式：

步骤3.9：设ζ＝D(L+B)e，L_D＝DLD，H＝L_D+B，其中

L_D1_N＝0_N；

步骤3.10：根据步骤2.9，得到

以及

因此

步骤3.11：在c₂≥ω₀的条件下，则有限时间的收敛上界为：

ξ_max＝max{ξ₁，...，ξ_N}，

λ为待确定非负参数。

作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案，所述步骤4的具体步骤为：

步骤4.1：引入非奇异M-矩阵H，H＝L_D+B和对角矩阵Ξ＝diag{ξ₁，ξ₂，…，ξ_N}，

令

p＝(p₁，…，p_N)^T＝H^-11_N，

q＝(q₁，…，q_N)^T＝(H^T)^-11_N，Q＝diag(q₁，…，q_N)，

则Ξ＝PQ，易证，p、q、Ξ元素均大于零；

步骤4.2：构造一个向量H^-11_N，有：

(ΞH+H^TΞ)·H^-11_N＝Ξ1_N+H^TPQ_p＝Ξ1_N+H^TQP_p

＝Ξ1_N+H^TQ1_N＝Ξ1_N+H^T(H^T)^-11_N

＝Ξ1_N+1_N＞0

即ΞH+HT_Ξ元素全为正；

步骤4.3：设定李雅普诺夫函数V为：

步骤4.4：对V函数求导数，得到：

其中λ＝λ_min(ΞH+H^TΞ)；

步骤4.5：由于L_D是一个零行和矩阵，可得：

证明：

步骤4.6：根据步骤4.3和步骤4.4，则得：

步骤4.7：由此可以得到有限时间的收敛上界：

步骤4.8：证明得到通过构造李雅普诺夫函数得到正参数的解析公式，在有限时间

的条件下，|e_i(t)|＝|x_i(t)-σ_ix₀(t)|收敛到零。

与现有技术相比，本发明的有益效果为：本发明克服了交互拓扑中权重系数全为非负的缺陷，合理假设多智能体间相互协作与竞争并存，利用带符号的正负路径权重积来刻画图中任意两点间的交互关系，高效地确定多智能体系统有限时间的收敛上界，从而有效地解决了现有技术中收敛时间上界计算困难的问题。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1为本发明的基本流程图。

图2为本发明的实施例智能体的交互拓扑实例图。

图3为本发明的实施例智能体在有限时间跟踪协议下的状态轨迹图。

图4为本发明的实例智能体在不同有限时间跟踪协议下的输入控制结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。当然，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

实施例1

参见图1至图4，本发明提供其技术方案为，一种基于有限时间的多智能体系统二分一致跟踪方法，其中，包括如下步骤：

具体地，所述步骤1的具体步骤为：

步骤1.1：采用符号有向图

描述协作竞争并存的多智能系统网络，其中

是一组点集，

是一组有向边集，并且

是邻接矩阵；

步骤1.2：用ε_ij表示从点j到点i的有向边，邻接矩阵

中元素a_ij定义为a_ij≠0当且仅当ε_ij∈ε；

步骤1.4：假设

没有自环，即所有

的a_ii＝0，图

是符号对角对称，即a_ija_ji≥0；

步骤1.5：假设

是图

中的一条有向路径，并且可以用首尾相连的有向边集

来表示，满足

的权重积用

表示；

步骤1.6：图

中至少存在一个点，该点也称为根，到

中所有剩余点均存在有向路径，则图

中包含生成树

ε′∈ε：

步骤1.7：符号有向图

的拉普拉斯矩阵定义为

具体地，所述步骤2的具体步骤为：

步骤2.1：构造增广无向图

其中

且

包含生成树

步骤2.2：增广无向图

与有向图

拥有相同的点集

以及划分

步骤2.4：图

中任一有向路径记作

可以用首尾相连的一个有向边集

来表示，其中k₀＝j，kl＝i，

的权重积用

来表示，

可以反映

中直接相连两点间的协作或竞争关系；

步骤2.5：若符号图G为结构平衡图，则其增广无向图

中存在一个正定对角矩阵D＝diag{σ₁，σ₂，...，σ_N}使得

其中σ₁＝1

为有向路径

的权重积；

具体地，所述步骤3的具体步骤为：

所构成的动态方程被描述如下：

是第i个跟随者的状态，而

是相应的输入控制；

步骤3.2：领导者的动态连续时间系统被描述如下：

和

分别是领导者的状态和输入控制；

步骤3.3：对于任何初始状态

则对于有限时间内的系统收敛上界

满足：

步骤3.4：为了实现二分一致追踪，做出以下两个假设：

(1)将包含生成树

的有向图

的根作为虚拟领导者；

(2)对于所有t≥0，存在一个常数ω₀＞0使得|u₀(t)|≤ω₀；

其中c₁，c₂＞0并且0＜μ＜1；

步骤3.6：将局部智能体的追踪误差表示为e_i＝x_i-σ_ix₀，构建对角矩阵D＝diag{1，sgn(P₂₁)，sgn(P₃₁)，…，sgn(P_N1)}；

步骤3.8：e可以表示为e＝[e1，e2，…，eN]T，则步骤2.7的可以被改写成向量形式：

步骤3.9：设ζ＝D(L+B)e，L_D＝DLD，H＝L_D+B，其中

L_D1_N＝0_N；

步骤3.10：根据步骤2.9，得到

以及

因此

步骤3.11：在c₂≥ω₀的条件下，则有限时间的收敛上界为：

ξ_max＝max{ξ₁，...，ξ_N}，

λ为待确定非负参数。

具体地，所述步骤4的具体步骤为：

令

p＝(p₁，…，p_N)^T＝H^-11_N，

q＝(q₁，…，q_N)^T＝(H^T)^-11_N，Q＝diag(q₁，…，q_N)，

则Ξ＝PQ，易证，p、q、Ξ元素均大于零；

步骤4.2：构造一个向量H^-11_N，有：

(ΞH+H^TΞ)·H^-11_N＝Ξ1_N+H^TPQ_p＝Ξ1_N+H^TQP_p

＝Ξ1_N+H^TQ1_N＝Ξ1_N+H^T(H^T)^-11_N

＝Ξ1_N+1_N＞0

即ΞH+H^TΞ元素全为正；

步骤4.3：设定李雅普诺夫函数V为：

步骤4.4：对V函数求导数，得到：

其中λ＝λ_min(ΞH+H^TΞ)；

步骤4.5：由于L_D是一个零行和矩阵，可得：

证明：

步骤4.6：根据步骤4.3和步骤4.4，则得：

步骤4.7：由此可以得到有限时间的收敛上界：

的条件下，|e_i(t)|＝|x_i(t)-σ_ix₀(t)|收敛到零。

为了验证本发明提出的智能体的二分一致跟踪，给出实例数字仿真。

构造一个由5个追随者和一个领导者组成的多智能体系统；

满足|u₀(t)|≤ω₀(t)＝1的条件，领导者的输入控制为u₀＝sin(3t)；

求得对角矩阵E＝diag{ξ₁，ξ₂，…，ξ_N}＝PQ＝diag{2.2000，0.7059,2.8000,1.6296，0.2703}；

由上式可得P21＞0，P₃₁＜0，P₄₁＜0，P₅₁＜0，将五个智能体划分为两个不同的子集：v₁＝{1，2}和v₂＝{3，4，5}；

相应的对角矩阵D可以设定为D＝diag{1，1，-1，-1}；

设定智能体的初始状态为

对于有限时间跟踪控制协议，控制增益定为μ＝0.5，c₁＝7和c₂＝1.2≥ω₀；

e(0)＝[-9，9，-5，7，-1]^T，

可以计算出有限时间收敛上界：

图2描绘了有向拓扑图

被用作5个智能体的交互拓扑。图3描绘了在有限时间控制协议下的跟随者智能体状态轨迹，可以观察到，跟随者智能体1，2与智能体3，4，5的轨迹完全相反。图4描绘了在有限时间控制协议下的跟随者智能体的输入控制。

从仿真结果可以看出所有智能体大约在1s之后实现二分一致跟踪，这小于在有限时间跟踪控制协议下计算的收敛时间上限，有效判断了智能体之间的关系，证明了所提算法的有效性。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于有限时间的多智能体系统二分一致跟踪方法，其特征在于，包括如下步骤：

步骤4：提出基于M矩阵的方法来设计李雅普诺夫函数中待定参数，确定有限时间情况下多智能系统收敛时间上界；

所述步骤1的具体步骤为：

步骤1.1：采用符号有向图

描述协作竞争并存的多智能系统网络，其中

是一组点集,

是一组有向边集，并且

是邻接矩阵；

步骤1.2：用ε_ij表示从点j到点i的有向边，邻接矩阵

中元素a_ij定义为a_ij≠0当且仅当ε_ij∈ε；

步骤1.3：如果点j到点i的交互关系是合作的，则a_ij>0,当交互关系是竞争的，则a_ij<0；

步骤1.4：假设

没有自环，即所有

的a_ii＝0，图

是符号对角对称,即a_ija_ji≥0；

步骤1.5：假设

是图

中的一条有向路径,并且可以用首尾相连的有向边集

来表示,满足

0<s≤l，

的权重积用

表示；

步骤1.6：图

中至少存在一个点，该点也称为根，到

中所有剩余点均存在有向路径，则图

中包含生成树

ε′∈ε；

步骤1.7：符号有向图

的拉普拉斯矩阵定义为

领导邻接矩阵B表示为B＝diag{a₁₀,a₂₀,…,a_N0}，若第i个追随者可以从领导0接收信息，则a_i0>0；否则a_i0＝0；

所述步骤2的具体步骤为：

步骤2.1：构造增广无向图

其中

且

包含生成树

步骤2.2：增广无向图

与有向图

拥有相同的点集

以及划分

步骤2.4：图

中任一有向路径记作

可以用首尾相连的一个有向边集

来表示，其中k₀＝j,k_l＝i,

0<s≤l，

的权重积用

来表示，

可以反映

中直接相连两点间的协作或竞争关系；

步骤2.5：若符号图G为结构平衡图，则其增广无向图

中存在一个正定对角矩阵D＝diag{σ₁,σ₂,…,σ_N}使得

其中σ₁＝1,

1<i≤N，

为有向路径

的权重积；

所述步骤3的具体步骤为：

所构成的动态方程被描述如下：

是第i个跟随者的状态，而

是相应的输入控制；

步骤3.2：领导者的动态连续时间系统被描述如下：

和

分别是领导者的状态和输入控制；

步骤3.3：对于任何初始状态

则对于有限时间内的系统收敛上界

满足：

步骤3.4：为了实现二分一致追踪，做出以下两个假设：

(1)将包含生成树

的有向图

的根作为虚拟领导者；

(2)对于所有t≥0，存在一个常数ω₀>0，使得|u₀(t)|≤ω₀；

其中c₁,c₂>0并且0<μ<1；

步骤3.6：将局部智能体的追踪误差表示为e_i＝x_i-σ_ix₀，构建对角矩阵D＝diag{1,sgn(P₂₁),sgn(P₃₁),…,sgn(P_N1)}；

步骤3.8：e可以表示为e＝[e₁,e₂,…,e_N]^T，则步骤2.7的可以被改写成向量形式：

步骤3.9：设ζ＝D(L+B)e,L_D＝DLD,H＝L_D+B，其中

L_D1_N＝0_N；

步骤3.10：根据步骤2.9，得到

以及

因此

步骤3.11：在c₂≥ω₀的条件下，则有限时间的收敛上界为：

λ为待确定非负参数；

所述步骤4的具体步骤为：

步骤4.1：引入非奇异M-矩阵H，H＝L_D+B和对角矩阵Ξ＝diag{ξ₁,ξ₂,…,ξ_N}，

令

p＝(p₁,…,p_N)^T＝H^-11_N，

q＝(q₁,…,q_N)^T＝(H^T)^-11_N，Q＝diag(q₁,…,q_N)，

则Ξ＝PQ，易证，p、q、Ξ元素均大于零；

步骤4.2：构造一个向量H^-11_N，有：

(ΞH+H^TΞ)·H^-11_N＝Ξ1_N+H^TPQ_p＝Ξ1_N+H^TQP_p

＝Ξ1_N+H^TQ1_N＝Ξ1_N+H^T(H^T)^-11_N

＝Ξ1_N+1_N＞0

即ΞH+H^TΞ元素全为正；

步骤4.3：设定李雅普诺夫函数V为：

步骤4.4：对V函数求导数，得到：

其中λ＝λ_min(ΞH+H^TΞ)；

步骤4.5：由于L_D是一个零行和矩阵，可得：

证明：

步骤4.6：根据步骤4.3和步骤4.4，则得：

步骤4.7：由此可以得到有限时间的收敛上界：

的条件下，|e_i(t)|＝|x_i(t)-σ_ix₀(t)|收敛到零。