CN112925197B - 基于有限时间的多智能体系统二分一致跟踪方法 - Google Patents

基于有限时间的多智能体系统二分一致跟踪方法 Download PDF

Info

Publication number
CN112925197B
CN112925197B CN202110084937.1A CN202110084937A CN112925197B CN 112925197 B CN112925197 B CN 112925197B CN 202110084937 A CN202110084937 A CN 202110084937A CN 112925197 B CN112925197 B CN 112925197B
Authority
CN
China
Prior art keywords
directed
graph
matrix
convergence
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110084937.1A
Other languages
English (en)
Other versions
CN112925197A (zh
Inventor
万瑾
毛艺颖
赵敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202110084937.1A priority Critical patent/CN112925197B/zh
Publication of CN112925197A publication Critical patent/CN112925197A/zh
Application granted granted Critical
Publication of CN112925197B publication Critical patent/CN112925197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/024Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于有限时间的多智能体系统二分一致跟踪方法,引入有向路径权重积概念确定有向图中任意两点间存在间接关联的交互关系,并据此判断有向图是否结构平衡;构建有向图对应的增广无向图,利用有向路径权重积概念设计规范变换矩阵D;利用基于M矩阵的方法来设计李雅普诺夫函数中待定参数,确定有限时间情况下多智能系统收敛时间上界。本发明的有益效果为:本发明克服了交互拓扑中权重系数全为非负的缺陷,合理假设多智能体间相互协作与竞争并存,利用带符号的正负路径权重积来刻画图中任意两点间的交互关系,高效地确定多智能体系统有限时间的收敛上界,从而有效地解决了现有技术中收敛时间上界计算困难的问题。

Description

基于有限时间的多智能体系统二分一致跟踪方法
技术领域
本发明涉及多智能体系统技术领域,尤其涉及一种基于有限时间的多智能体系统二分一致跟踪方法。
背景技术
在过去的几年里,多智能体系统一致性问题引起了极大的关注,主要是因为它在许多领域的广泛应用,包括环境监测、无人飞行器、传感器网络、和电网等。一致性,作为MASs的一种集体行为,意味着所有智能体可以在适当的协议下,仅基于相邻智能体之间的邻居信息,最终使每个智能体趋于一个相同的状态。现阶段,多智能体一致研究大多数都是基于智能体间交互关系为协作关系,即交互拓扑中权重都是非负的情形。而在一些实际情况下,更为合理的假设是,智能体间不仅相互协作,而且相互竞争。为此,将使用符号图描述智能体间这种新型关系,其中有边权重正负性分别代表合作关系和竞争关系。
与合作控制下的一致收敛相比,二分一致是一种特殊类型的共识,意味着所有智能体都以相同的模值但相反的符号收敛到最终状态。在实际应用中,二分一致现象广泛存在于许多应用场景中,如社交网络、敌对政治阵营和信任-猜忌网络。在这些实际网络的启发下,一种被称为结构平衡符号图的拓扑结构被创造性地引入该类研究中。此外,收敛速度是二分一致控制协议设计中的一个重要问题。当前,许多二分一致跟踪算法主要侧重于具有无限稳定时间的渐近收敛。与渐近控制协议相比,有限时间控制协议更可取,具有更快的收敛速度和更好的抗扰动性能。为此,提出了一种结构平衡符号图下的二分一致有限时间控制协议,即在已知系统初始状态条件下便可在有限时间内使得系统达到二分一致。
在绝大多数有限时间控制协议的研究结果中,有限时间的收敛上界需要通过复杂的数学公式计算,甚至因为有向图的非对称性导致无法有效获取收敛时间上界。从计算优化的角度上来看,本文所构造的李雅普诺夫函数,可以明确了李雅普诺夫函数待定参数的解析式,继而可以高效估计MASs有限时间的收敛上界。
发明内容
本发明的目的在于提供一种基于有限时间的多智能体系统二分一致跟踪方法,克服了交互拓扑中权重系数全为非负的缺陷,合理假设多智能体间相互协作与竞争并存,利用带符号的正负路径权重积来刻画图中任意两点间的交互关系,高效地确定多智能体系统有限时间的收敛上界,从而有效地解决了现有技术中收敛时间上界计算困难的问题。
本发明是通过如下措施实现的:一种基于有限时间的多智能体系统二分一致跟踪方法,其中,包括如下步骤:
步骤1:引入有向路径权重积概念确定有向图中任意两点间存在间接关联的交互关系,并据此判断有向图是否结构平衡;
步骤2:构建有向图对应的增广无向图,利用有向路径权重积概念设计规范变换矩阵D;
步骤3:提出有限时间协议解决有限时间的二分一致跟踪问题;
步骤4:提出基于M矩阵的方法来设计李雅普诺夫函数中待定参数,确定有限时间情况下多智能系统收敛时间上界。
作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤1的具体步骤为:
步骤1.1:采用符号有向图
Figure BDA0002908888450000021
描述协作竞争并存的多智能系统网络,其中
Figure BDA0002908888450000022
是一组点集,
Figure BDA0002908888450000023
是一组有向边集,并且
Figure BDA0002908888450000024
是邻接矩阵;
步骤1.2:用εij表示从点j到点i的有向边,邻接矩阵
Figure BDA0002908888450000025
中元素aij定义为aij≠0当且仅当εij∈ε;
步骤1.3:如果点j到点i的交互关系是合作的,则aij>0,当交互关系是竞争的,则aij<0;
步骤1.4:假设
Figure BDA0002908888450000026
没有自环,即所有
Figure BDA0002908888450000027
的aii=0,图
Figure BDA0002908888450000028
是符号对角对称,即aijaji≥0;
步骤1.5:假设
Figure BDA0002908888450000029
是图
Figure BDA00029088884500000210
中的一条有向路径,并且可以用首尾相连的有向边集
Figure BDA00029088884500000211
来表示,满足
Figure BDA00029088884500000212
的权重积用
Figure BDA00029088884500000213
Figure BDA00029088884500000214
表示;
步骤1.6:图
Figure BDA00029088884500000215
中至少存在一个点,该点也称为根,到
Figure BDA00029088884500000216
中所有剩余点均存在有向路径,则图
Figure BDA00029088884500000217
中包含生成树
Figure BDA00029088884500000218
ε′∈ε;
步骤1.7:符号有向图
Figure BDA00029088884500000219
的拉普拉斯矩阵定义为
Figure BDA00029088884500000220
领导邻接矩阵B表示为B=diag{a10,a20,…,aN0},若第i个追随者可以从领导0接收信息,则ai0>0;否则ai0=0。
作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤2的具体步骤为:
步骤2.1:构造增广无向图
Figure BDA00029088884500000221
其中
Figure BDA00029088884500000222
Figure BDA00029088884500000223
包含生成树
Figure BDA00029088884500000224
步骤2.2:增广无向图
Figure BDA00029088884500000225
与有向图
Figure BDA00029088884500000226
拥有相同的点集
Figure BDA00029088884500000227
以及划分
Figure BDA00029088884500000228
步骤2.4:图
Figure BDA00029088884500000229
中任一有向路径记作
Figure BDA00029088884500000230
可以用首尾相连的一个有向边集
Figure BDA00029088884500000231
来表示,其中k0=j,kl=i,
Figure BDA00029088884500000232
的权重积用
Figure BDA00029088884500000233
来表示,
Figure BDA00029088884500000234
可以反映
Figure BDA00029088884500000235
中直接相连两点间的协作或竞争关系;
步骤2.5:若符号图G为结构平衡图,则其增广无向图
Figure BDA0002908888450000031
中存在一个正定对角矩阵D=diag{σ1,σ2,...,σN}使得
Figure BDA0002908888450000032
其中σ1=1,
Figure BDA0002908888450000033
为有向路径
Figure BDA0002908888450000034
的权重积。
作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤3的具体步骤为:
步骤3.1:构建由一个虚拟领导者和N个跟随者组成的N+1个智能体集有向拓扑图
Figure BDA0002908888450000035
所构成的动态方程被描述如下:
Figure BDA0002908888450000036
Figure BDA0002908888450000037
是第i个跟随者的状态,而
Figure BDA0002908888450000038
是相应的输入控制;
步骤3.2:领导者的动态连续时间系统被描述如下:
Figure BDA0002908888450000039
Figure BDA00029088884500000310
Figure BDA00029088884500000311
分别是领导者的状态和输入控制;
步骤3.3:对于任何初始状态
Figure BDA00029088884500000312
则对于有限时间内的系统收敛上界
Figure BDA00029088884500000313
满足:
Figure BDA00029088884500000314
步骤3.4:为了实现二分一致追踪,做出以下两个假设:
(1)将包含生成树
Figure BDA00029088884500000315
的有向图
Figure BDA00029088884500000316
的根作为虚拟领导者;
(2)对于所有t≥0,存在一个常数ω0>0使得|u0(t)|≤ω0
步骤3.5:在有限时间内,实现多智能体系统的二分一致跟踪,提出了以下跟踪协议:
Figure BDA00029088884500000317
其中c1,c2>0并且0<μ<1;
步骤3.6:将局部智能体的追踪误差表示为ei=xiix0,构建对角矩阵D=diag{1,sgn(P21),sgn(P31),…,sgn(PN1)};
步骤3.7:将多智能体系统和跟踪协议相结合,得到新的动态方程:
Figure BDA00029088884500000318
其中sgn(aij)xj-xi=sgn(aij)ej+sgn(aijjx0-eiix0=sgn(aij)ej-ei
步骤3.8:e可以表示为e=[e1,e2,…,eN]T,则步骤2.7的可以被改写成向量形式:
Figure BDA0002908888450000041
步骤3.9:设ζ=D(L+B)e,LD=DLD,H=LD+B,其中
Figure BDA0002908888450000042
Figure BDA0002908888450000043
LD1N=0N
步骤3.10:根据步骤2.9,得到
Figure BDA0002908888450000044
以及
Figure BDA0002908888450000045
因此
Figure BDA0002908888450000046
步骤3.11:在c2≥ω0的条件下,则有限时间的收敛上界为:
Figure BDA0002908888450000047
Figure BDA0002908888450000048
ξmax=max{ξ1,...,ξN},
Figure BDA0002908888450000049
λ为待确定非负参数。
作为本发明提供的一种基于有限时间的多智能体系统二分一致跟踪方法进一步优化方案,所述步骤4的具体步骤为:
步骤4.1:引入非奇异M-矩阵H,H=LD+B和对角矩阵Ξ=diag{ξ1,ξ2,…,ξN},
Figure BDA00029088884500000410
p=(p1,…,pN)T=H-11N
Figure BDA00029088884500000411
q=(q1,…,qN)T=(HT)-11N,Q=diag(q1,…,qN),
则Ξ=PQ,易证,p、q、Ξ元素均大于零;
步骤4.2:构造一个向量H-11N,有:
(ΞH+HTΞ)·H-11N=Ξ1N+HTPQp=Ξ1N+HTQPp
=Ξ1N+HTQ1N=Ξ1N+HT(HT)-11N
=Ξ1N+1N>0
即ΞH+HTΞ元素全为正;
步骤4.3:设定李雅普诺夫函数V为:
Figure BDA00029088884500000412
步骤4.4:对V函数求导数,得到:
Figure BDA00029088884500000413
Figure BDA0002908888450000051
其中λ=λmin(ΞH+HTΞ);
步骤4.5:由于LD是一个零行和矩阵,可得:
Figure BDA0002908888450000052
证明:
Figure BDA0002908888450000053
步骤4.6:根据步骤4.3和步骤4.4,则得:
Figure BDA0002908888450000054
步骤4.7:由此可以得到有限时间的收敛上界:
Figure BDA0002908888450000055
步骤4.8:证明得到通过构造李雅普诺夫函数得到正参数的解析公式,在有限时间
Figure BDA0002908888450000056
的条件下,|ei(t)|=|xi(t)-σix0(t)|收敛到零。
与现有技术相比,本发明的有益效果为:本发明克服了交互拓扑中权重系数全为非负的缺陷,合理假设多智能体间相互协作与竞争并存,利用带符号的正负路径权重积来刻画图中任意两点间的交互关系,高效地确定多智能体系统有限时间的收敛上界,从而有效地解决了现有技术中收敛时间上界计算困难的问题。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明的基本流程图。
图2为本发明的实施例智能体的交互拓扑实例图。
图3为本发明的实施例智能体在有限时间跟踪协议下的状态轨迹图。
图4为本发明的实例智能体在不同有限时间跟踪协议下的输入控制结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。当然,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例1
参见图1至图4,本发明提供其技术方案为,一种基于有限时间的多智能体系统二分一致跟踪方法,其中,包括如下步骤:
步骤1:引入有向路径权重积概念确定有向图中任意两点间存在间接关联的交互关系,并据此判断有向图是否结构平衡;
步骤2:构建有向图对应的增广无向图,利用有向路径权重积概念设计规范变换矩阵D;
步骤3:提出有限时间协议解决有限时间的二分一致跟踪问题;
步骤4:提出基于M矩阵的方法来设计李雅普诺夫函数中待定参数,确定有限时间情况下多智能系统收敛时间上界。
具体地,所述步骤1的具体步骤为:
步骤1.1:采用符号有向图
Figure BDA0002908888450000061
描述协作竞争并存的多智能系统网络,其中
Figure BDA0002908888450000062
是一组点集,
Figure BDA0002908888450000063
是一组有向边集,并且
Figure BDA0002908888450000064
是邻接矩阵;
步骤1.2:用εij表示从点j到点i的有向边,邻接矩阵
Figure BDA0002908888450000065
中元素aij定义为aij≠0当且仅当εij∈ε;
步骤1.3:如果点j到点i的交互关系是合作的,则aij>0,当交互关系是竞争的,则aij<0;
步骤1.4:假设
Figure BDA0002908888450000066
没有自环,即所有
Figure BDA0002908888450000067
的aii=0,图
Figure BDA0002908888450000068
是符号对角对称,即aijaji≥0;
步骤1.5:假设
Figure BDA0002908888450000069
是图
Figure BDA00029088884500000610
中的一条有向路径,并且可以用首尾相连的有向边集
Figure BDA0002908888450000071
来表示,满足
Figure BDA0002908888450000072
的权重积用
Figure BDA0002908888450000073
Figure BDA0002908888450000074
表示;
步骤1.6:图
Figure BDA0002908888450000075
中至少存在一个点,该点也称为根,到
Figure BDA0002908888450000076
中所有剩余点均存在有向路径,则图
Figure BDA0002908888450000077
中包含生成树
Figure BDA0002908888450000078
ε′∈ε:
步骤1.7:符号有向图
Figure BDA0002908888450000079
的拉普拉斯矩阵定义为
Figure BDA00029088884500000710
领导邻接矩阵B表示为B=diag{a10,a20,…,aN0},若第i个追随者可以从领导0接收信息,则ai0>0;否则ai0=0。
具体地,所述步骤2的具体步骤为:
步骤2.1:构造增广无向图
Figure BDA00029088884500000711
其中
Figure BDA00029088884500000712
Figure BDA00029088884500000713
包含生成树
Figure BDA00029088884500000714
步骤2.2:增广无向图
Figure BDA00029088884500000715
与有向图
Figure BDA00029088884500000716
拥有相同的点集
Figure BDA00029088884500000717
以及划分
Figure BDA00029088884500000718
步骤2.4:图
Figure BDA00029088884500000719
中任一有向路径记作
Figure BDA00029088884500000720
可以用首尾相连的一个有向边集
Figure BDA00029088884500000721
来表示,其中k0=j,kl=i,
Figure BDA00029088884500000722
的权重积用
Figure BDA00029088884500000723
来表示,
Figure BDA00029088884500000724
可以反映
Figure BDA00029088884500000725
中直接相连两点间的协作或竞争关系;
步骤2.5:若符号图G为结构平衡图,则其增广无向图
Figure BDA00029088884500000726
中存在一个正定对角矩阵D=diag{σ1,σ2,...,σN}使得
Figure BDA00029088884500000727
其中σ1=1
Figure BDA00029088884500000728
为有向路径
Figure BDA00029088884500000729
的权重积;
具体地,所述步骤3的具体步骤为:
步骤3.1:构建由一个虚拟领导者和N个跟随者组成的N+1个智能体集有向拓扑图
Figure BDA00029088884500000730
所构成的动态方程被描述如下:
Figure BDA00029088884500000731
Figure BDA00029088884500000732
是第i个跟随者的状态,而
Figure BDA00029088884500000733
是相应的输入控制;
步骤3.2:领导者的动态连续时间系统被描述如下:
Figure BDA00029088884500000734
Figure BDA00029088884500000735
Figure BDA00029088884500000736
分别是领导者的状态和输入控制;
步骤3.3:对于任何初始状态
Figure BDA00029088884500000737
则对于有限时间内的系统收敛上界
Figure BDA00029088884500000738
满足:
Figure BDA00029088884500000739
步骤3.4:为了实现二分一致追踪,做出以下两个假设:
(1)将包含生成树
Figure BDA0002908888450000081
的有向图
Figure BDA0002908888450000082
的根作为虚拟领导者;
(2)对于所有t≥0,存在一个常数ω0>0使得|u0(t)|≤ω0
步骤3.5:在有限时间内,实现多智能体系统的二分一致跟踪,提出了以下跟踪协议:
Figure BDA0002908888450000083
其中c1,c2>0并且0<μ<1;
步骤3.6:将局部智能体的追踪误差表示为ei=xiix0,构建对角矩阵D=diag{1,sgn(P21),sgn(P31),…,sgn(PN1)};
步骤3.7:将多智能体系统和跟踪协议相结合,得到新的动态方程:
Figure BDA0002908888450000084
其中sgn(aij)xj-xi=sgn(aij)ej+sgn(aijjx0-eiix0=sgn(aij)ej-ei
步骤3.8:e可以表示为e=[e1,e2,…,eN]T,则步骤2.7的可以被改写成向量形式:
Figure BDA0002908888450000085
步骤3.9:设ζ=D(L+B)e,LD=DLD,H=LD+B,其中
Figure BDA0002908888450000086
Figure BDA0002908888450000087
LD1N=0N
步骤3.10:根据步骤2.9,得到
Figure BDA0002908888450000088
以及
Figure BDA0002908888450000089
因此
Figure BDA00029088884500000810
步骤3.11:在c2≥ω0的条件下,则有限时间的收敛上界为:
Figure BDA00029088884500000815
Figure BDA00029088884500000811
ξmax=max{ξ1,...,ξN},
Figure BDA00029088884500000812
λ为待确定非负参数。
具体地,所述步骤4的具体步骤为:
步骤4.1:引入非奇异M-矩阵H,H=LD+B和对角矩阵Ξ=diag{ξ1,ξ2,…,ξN},
Figure BDA00029088884500000813
p=(p1,…,pN)T=H-11N
Figure BDA00029088884500000814
q=(q1,…,qN)T=(HT)-11N,Q=diag(q1,…,qN),
则Ξ=PQ,易证,p、q、Ξ元素均大于零;
步骤4.2:构造一个向量H-11N,有:
(ΞH+HTΞ)·H-11N=Ξ1N+HTPQp=Ξ1N+HTQPp
=Ξ1N+HTQ1N=Ξ1N+HT(HT)-11N
=Ξ1N+1N>0
即ΞH+HTΞ元素全为正;
步骤4.3:设定李雅普诺夫函数V为:
Figure BDA0002908888450000091
步骤4.4:对V函数求导数,得到:
Figure BDA0002908888450000092
其中λ=λmin(ΞH+HTΞ);
步骤4.5:由于LD是一个零行和矩阵,可得:
Figure BDA0002908888450000093
证明:
Figure BDA0002908888450000094
步骤4.6:根据步骤4.3和步骤4.4,则得:
Figure BDA0002908888450000095
Figure BDA0002908888450000101
步骤4.7:由此可以得到有限时间的收敛上界:
Figure BDA0002908888450000102
步骤4.8:证明得到通过构造李雅普诺夫函数得到正参数的解析公式,在有限时间
Figure BDA0002908888450000103
的条件下,|ei(t)|=|xi(t)-σix0(t)|收敛到零。
为了验证本发明提出的智能体的二分一致跟踪,给出实例数字仿真。
构造一个由5个追随者和一个领导者组成的多智能体系统;
满足|u0(t)|≤ω0(t)=1的条件,领导者的输入控制为u0=sin(3t);
求得对角矩阵E=diag{ξ1,ξ2,…,ξN}=PQ=diag{2.2000,0.7059,2.8000,1.6296,0.2703};
由上式可得P21>0,P31<0,P41<0,P51<0,将五个智能体划分为两个不同的子集:v1={1,2}和v2={3,4,5};
相应的对角矩阵D可以设定为D=diag{1,1,-1,-1};
设定智能体的初始状态为
Figure BDA0002908888450000108
对于有限时间跟踪控制协议,控制增益定为μ=0.5,c1=7和c2=1.2≥ω0
e(0)=[-9,9,-5,7,-1]T
Figure BDA0002908888450000104
Figure BDA0002908888450000105
可以计算出有限时间收敛上界:
Figure BDA0002908888450000106
图2描绘了有向拓扑图
Figure BDA0002908888450000107
被用作5个智能体的交互拓扑。图3描绘了在有限时间控制协议下的跟随者智能体状态轨迹,可以观察到,跟随者智能体1,2与智能体3,4,5的轨迹完全相反。图4描绘了在有限时间控制协议下的跟随者智能体的输入控制。
从仿真结果可以看出所有智能体大约在1s之后实现二分一致跟踪,这小于在有限时间跟踪控制协议下计算的收敛时间上限,有效判断了智能体之间的关系,证明了所提算法的有效性。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于有限时间的多智能体系统二分一致跟踪方法,其特征在于,包括如下步骤:
步骤1:引入有向路径权重积概念确定有向图中任意两点间存在间接关联的交互关系,并据此判断有向图是否结构平衡;
步骤2:构建有向图对应的增广无向图,利用有向路径权重积概念设计规范变换矩阵D;
步骤3:提出有限时间协议解决有限时间的二分一致跟踪问题;
步骤4:提出基于M矩阵的方法来设计李雅普诺夫函数中待定参数,确定有限时间情况下多智能系统收敛时间上界;
所述步骤1的具体步骤为:
步骤1.1:采用符号有向图
Figure FDA0003634254310000011
描述协作竞争并存的多智能系统网络,其中
Figure FDA0003634254310000012
是一组点集,
Figure FDA0003634254310000013
是一组有向边集,并且
Figure FDA0003634254310000014
是邻接矩阵;
步骤1.2:用εij表示从点j到点i的有向边,邻接矩阵
Figure FDA0003634254310000015
中元素aij定义为aij≠0当且仅当εij∈ε;
步骤1.3:如果点j到点i的交互关系是合作的,则aij>0,当交互关系是竞争的,则aij<0;
步骤1.4:假设
Figure FDA0003634254310000016
没有自环,即所有
Figure FDA0003634254310000017
的aii=0,图
Figure FDA0003634254310000018
是符号对角对称,即aijaji≥0;
步骤1.5:假设
Figure FDA0003634254310000019
是图
Figure FDA00036342543100000110
中的一条有向路径,并且可以用首尾相连的有向边集
Figure FDA00036342543100000111
来表示,满足
Figure FDA00036342543100000112
0<s≤l,
Figure FDA00036342543100000113
的权重积用
Figure FDA00036342543100000114
Figure FDA00036342543100000115
表示;
步骤1.6:图
Figure FDA00036342543100000116
中至少存在一个点,该点也称为根,到
Figure FDA00036342543100000117
中所有剩余点均存在有向路径,则图
Figure FDA00036342543100000118
中包含生成树
Figure FDA00036342543100000119
ε′∈ε;
步骤1.7:符号有向图
Figure FDA00036342543100000120
的拉普拉斯矩阵定义为
Figure FDA00036342543100000121
领导邻接矩阵B表示为B=diag{a10,a20,…,aN0},若第i个追随者可以从领导0接收信息,则ai0>0;否则ai0=0;
所述步骤2的具体步骤为:
步骤2.1:构造增广无向图
Figure FDA00036342543100000122
其中
Figure FDA00036342543100000123
Figure FDA00036342543100000124
包含生成树
Figure FDA00036342543100000125
步骤2.2:增广无向图
Figure FDA00036342543100000126
与有向图
Figure FDA00036342543100000127
拥有相同的点集
Figure FDA00036342543100000138
以及划分
Figure FDA00036342543100000128
步骤2.4:图
Figure FDA00036342543100000129
中任一有向路径记作
Figure FDA00036342543100000130
可以用首尾相连的一个有向边集
Figure FDA00036342543100000131
来表示,其中k0=j,kl=i,
Figure FDA00036342543100000132
0<s≤l,
Figure FDA00036342543100000133
的权重积用
Figure FDA00036342543100000134
来表示,
Figure FDA00036342543100000135
可以反映
Figure FDA00036342543100000136
中直接相连两点间的协作或竞争关系;
步骤2.5:若符号图G为结构平衡图,则其增广无向图
Figure FDA00036342543100000137
中存在一个正定对角矩阵D=diag{σ12,…,σN}使得
Figure FDA0003634254310000021
其中σ1=1,
Figure FDA0003634254310000022
1<i≤N,
Figure FDA0003634254310000023
为有向路径
Figure FDA0003634254310000024
的权重积;
所述步骤3的具体步骤为:
步骤3.1:构建由一个虚拟领导者和N个跟随者组成的N+1个智能体集有向拓扑图
Figure FDA0003634254310000025
所构成的动态方程被描述如下:
Figure FDA0003634254310000026
Figure FDA0003634254310000027
是第i个跟随者的状态,而
Figure FDA0003634254310000028
是相应的输入控制;
步骤3.2:领导者的动态连续时间系统被描述如下:
Figure FDA0003634254310000029
Figure FDA00036342543100000210
Figure FDA00036342543100000211
分别是领导者的状态和输入控制;
步骤3.3:对于任何初始状态
Figure FDA00036342543100000212
则对于有限时间内的系统收敛上界
Figure FDA00036342543100000213
满足:
Figure FDA00036342543100000214
步骤3.4:为了实现二分一致追踪,做出以下两个假设:
(1)将包含生成树
Figure FDA00036342543100000215
的有向图
Figure FDA00036342543100000216
的根作为虚拟领导者;
(2)对于所有t≥0,存在一个常数ω0>0,使得|u0(t)|≤ω0
步骤3.5:在有限时间内,实现多智能体系统的二分一致跟踪,提出了以下跟踪协议:
Figure FDA00036342543100000217
其中c1,c2>0并且0<μ<1;
步骤3.6:将局部智能体的追踪误差表示为ei=xiix0,构建对角矩阵D=diag{1,sgn(P21),sgn(P31),…,sgn(PN1)};
步骤3.7:将多智能体系统和跟踪协议相结合,得到新的动态方程:
Figure FDA00036342543100000218
其中sgn(aij)xj-xi=sgn(aij)ej+sgn(aijjx0-eiix0=sgn(aij)ej-ei
步骤3.8:e可以表示为e=[e1,e2,…,eN]T,则步骤2.7的可以被改写成向量形式:
Figure FDA00036342543100000219
步骤3.9:设ζ=D(L+B)e,LD=DLD,H=LD+B,其中
Figure FDA00036342543100000220
Figure FDA0003634254310000031
LD1N=0N
步骤3.10:根据步骤2.9,得到
Figure FDA0003634254310000032
以及
Figure FDA0003634254310000033
因此
Figure FDA0003634254310000034
步骤3.11:在c2≥ω0的条件下,则有限时间的收敛上界为:
Figure FDA0003634254310000035
Figure FDA0003634254310000036
λ为待确定非负参数;
所述步骤4的具体步骤为:
步骤4.1:引入非奇异M-矩阵H,H=LD+B和对角矩阵Ξ=diag{ξ12,…,ξN},
Figure FDA0003634254310000037
p=(p1,…,pN)T=H-11N
Figure FDA0003634254310000038
q=(q1,…,qN)T=(HT)-11N,Q=diag(q1,…,qN),
则Ξ=PQ,易证,p、q、Ξ元素均大于零;
步骤4.2:构造一个向量H-11N,有:
(ΞH+HTΞ)·H-11N=Ξ1N+HTPQp=Ξ1N+HTQPp
=Ξ1N+HTQ1N=Ξ1N+HT(HT)-11N
=Ξ1N+1N>0
即ΞH+HTΞ元素全为正;
步骤4.3:设定李雅普诺夫函数V为:
Figure FDA0003634254310000039
步骤4.4:对V函数求导数,得到:
Figure FDA00036342543100000310
其中λ=λmin(ΞH+HTΞ);
步骤4.5:由于LD是一个零行和矩阵,可得:
Figure FDA0003634254310000041
证明:
Figure FDA0003634254310000042
步骤4.6:根据步骤4.3和步骤4.4,则得:
Figure FDA0003634254310000043
步骤4.7:由此可以得到有限时间的收敛上界:
Figure FDA0003634254310000044
步骤4.8:证明得到通过构造李雅普诺夫函数得到正参数的解析公式,在有限时间
Figure FDA0003634254310000045
的条件下,|ei(t)|=|xi(t)-σix0(t)|收敛到零。
CN202110084937.1A 2021-01-21 2021-01-21 基于有限时间的多智能体系统二分一致跟踪方法 Active CN112925197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110084937.1A CN112925197B (zh) 2021-01-21 2021-01-21 基于有限时间的多智能体系统二分一致跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110084937.1A CN112925197B (zh) 2021-01-21 2021-01-21 基于有限时间的多智能体系统二分一致跟踪方法

Publications (2)

Publication Number Publication Date
CN112925197A CN112925197A (zh) 2021-06-08
CN112925197B true CN112925197B (zh) 2022-08-12

Family

ID=76164059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110084937.1A Active CN112925197B (zh) 2021-01-21 2021-01-21 基于有限时间的多智能体系统二分一致跟踪方法

Country Status (1)

Country Link
CN (1) CN112925197B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117973431A (zh) * 2024-03-25 2024-05-03 四川航天职业技术学院(四川航天高级技工学校) 一种最优二分共识控制方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281053A (zh) * 2013-07-08 2015-01-14 哈尔滨点石仿真科技有限公司 一种解决通信时滞的多智能体协同控制方法
CN110119087A (zh) * 2019-05-05 2019-08-13 西北工业大学 一种有向通信下二阶多智能体系统固定时一致性跟踪方法
CN111077779A (zh) * 2019-12-23 2020-04-28 华东交通大学 带扰动混杂多智能体系统实现领导-跟随一致性控制方法
CN111258214A (zh) * 2020-02-25 2020-06-09 西北工业大学 基于有向拓扑的高阶多智能体系统固定时一致性跟踪方法
CN111694272A (zh) * 2020-07-22 2020-09-22 南京工程学院 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281053A (zh) * 2013-07-08 2015-01-14 哈尔滨点石仿真科技有限公司 一种解决通信时滞的多智能体协同控制方法
CN110119087A (zh) * 2019-05-05 2019-08-13 西北工业大学 一种有向通信下二阶多智能体系统固定时一致性跟踪方法
CN111077779A (zh) * 2019-12-23 2020-04-28 华东交通大学 带扰动混杂多智能体系统实现领导-跟随一致性控制方法
CN111258214A (zh) * 2020-02-25 2020-06-09 西北工业大学 基于有向拓扑的高阶多智能体系统固定时一致性跟踪方法
CN111694272A (zh) * 2020-07-22 2020-09-22 南京工程学院 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置

Also Published As

Publication number Publication date
CN112925197A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
Xu et al. Event-triggered schemes on leader-following consensus of general linear multiagent systems under different topologies
Li et al. Event-triggering sampling based leader-following consensus in second-order multi-agent systems
Shang Fixed‐time group consensus for multi‐agent systems with non‐linear dynamics and uncertainties
Liang et al. Distributed state estimation for uncertain Markov‐type sensor networks with mode‐dependent distributed delays
Huang et al. Leader‐following consensus of second‐order non‐linear multi‐agent systems with directed intermittent communication
An et al. Group consensus control for networked multi-agent systems with communication delays
Peng et al. Input–output data-based output antisynchronization control of multiagent systems using reinforcement learning approach
Jiang et al. Couple-group consensus for discrete-time heterogeneous multiagent systems with cooperative–competitive interactions and time delays
Wang et al. Synchronization criteria for impulsive complex dynamical networks with time-varying delay
Sun et al. Bipartite consensus of multi-agent systems with intermittent interaction
Xie et al. Consensus for multi‐agent systems with distributed adaptive control and an event‐triggered communication strategy
Xu et al. Necessary and sufficient conditions for distributed containment control of multi‐agent systems without velocity measurement
Wu et al. Interventional consensus for high-order multi-agent systems with unknown disturbances on coopetition networks
Zhang et al. Consensus of multi‐agent systems with linear dynamics using event‐triggered control
Cheng et al. Distributed MPC based consensus for single-integrator multi-agent systems
Han et al. Event-based H∞ consensus control for second-order leader-following multi-agent systems
Liu et al. Reduced-order observer-based leader-following formation control for discrete-time linear multi-agent systems
CN112925197B (zh) 基于有限时间的多智能体系统二分一致跟踪方法
Geng et al. Consensus of heterogeneous multi-agent systems under directed topology
CN114609909A (zh) 一种切换拓扑下的随机多智体系统控制协议的设计方法
CN111694272B (zh) 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置
Zhan et al. Flocking of discrete-time multi-agent systems with predictive mechanisms
Guoa et al. Predefined-time average consensus control for heterogeneous nonlinear multi-agent systems
Cihan Stability analysis and controller design for consensus in discrete‐time networks with heterogeneous agent dynamics
Ge et al. State consensus analysis and design for high-order discrete-time linear multiagent systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant