CN113867150A - 一种具有饱和输入的多智能体的事件驱动控制方法 - Google Patents

一种具有饱和输入的多智能体的事件驱动控制方法 Download PDF

Info

Publication number
CN113867150A
CN113867150A CN202111198055.4A CN202111198055A CN113867150A CN 113867150 A CN113867150 A CN 113867150A CN 202111198055 A CN202111198055 A CN 202111198055A CN 113867150 A CN113867150 A CN 113867150A
Authority
CN
China
Prior art keywords
agent
event
matrix
control
consistency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111198055.4A
Other languages
English (en)
Inventor
杜胜利
盛宏
高永峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202111198055.4A priority Critical patent/CN113867150A/zh
Publication of CN113867150A publication Critical patent/CN113867150A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及多智能体一致性控制领域,具体提供了一种适用于具有饱和输入的多智能体系统的事件驱动控制设计方法,其特征在于,包括以下步骤:针对具有饱和输入的智能体,构建每个智能体的状态空间模型,并给出其系统矩阵需要满足的假设条件;基于步骤1中建立的多智能体系统模型,设计一种可以使该系统达成一致性的控制律;设计合适的低反馈增益,将非线性的智能体模型优化为线性模型;利用李雅普诺夫函数法,对事件驱动控制律进行一致性证明。本发明能够利用基于代数黎卡提方程的低增益技术将其优化为线性系统,降低了依赖性;本发明能够在完成一致性控制任务的基础上有效的减少控制律更新的次数,节约资源;本发明能够有效的避免芝诺现象。

Description

一种具有饱和输入的多智能体的事件驱动控制方法
技术领域
本发明涉及多智能体一致性控制领域,特别是涉及一种在饱和输入下的多智能体系统 事件驱动控制方法。
背景技术
近年来,多智能体系统引发了许多研究人员的关注,成为自动控制领域的研究热点。 多智能体系统在无人机编队,多机器人编队,分布式传感器网络等等前沿领域的广泛应用 使得人们对它的兴趣不断提升。在多智能体系统研究领域中,一致性问题有十分重要的意 义,它是智能体之间能够完成协作的基础。一致性指的是智能体根据邻居传来的信息,对 其进行分析和运算,从而不断调整自己的行为,使每个的智能体的各个状态参数(如位置、 速度、角度等)随着时间的推移达到某一共同的值。
输入饱和非线性是一种常见的非线性问题,由于物理约束和安全原因,大多数实际控 制系统会受到输入饱和的影响。当系统输入饱和时,无论输入信号如何变化,系统的输出 都不能再继续增加,输入输出之间会出现失配问题。当控制器难以追踪系统的输出信号时, 控制器将会处于一个完全失控的状态,这就是输入饱和的问题。因此,设计系统控制器解 决输入饱和问题成为当下研究的重点。
另一方面,在多智能体达成一致的过程中,智能体间需要保持连续的通信和控制率 的更新。智能体间的信息通过通信网络进行传输,而在实际的多智能体系统中,通信网络 带宽与计算资源是十分有限的,因此如何在编队目标跟踪过程中降低智能体间的通信压力 是一个亟待解决的问题。
为了解决以上问题,文献“Dimarogonas D V,Frazzoli E,Johansson K H.Distributed Event-Triggered Control for Multi-Agent Systems[J].IEEETransactions on Automatic Control,2012,57(5):1291-1297”将事件驱动控制引入多智能体一致性 控制,缓解了智能体间的通讯压力,但并未考虑输入饱和的存在。文献“Du,S.L.,Dong, L.,&Ho,D..(2017).Event-triggered control for outputsynchronization of heterogeneous network with input saturationconstraint.IECON 2017-43rd Annual Conference of the IEEE IndustrialElectronics Society.IEEE”采用低增益技术有 效的避免了输入饱和非线性,但该研究是针对异构多智能体系统的输出同步问题,而不是 一致性问题。
因此,将事件触发控制策略应用于具有输入饱和约束的多智能体系统的一致性控制中, 所需要解决的主要难题在于:
(1)如何设计事件触发控制的触发条件和阈值,能够使多智能体系统达成一致的前 提下,减少控制律的更新次数节约能源;
(2)如何避免事件触发机制可能导致的“芝诺行为”,其中“芝诺行为”指的是在 有限的时间内有无限次的事件触发;
(3)如何设计系统控制器解决饱和输入问题对系统性能的影响。
发明内容
本发明的目的在于提供一种具有饱和输入的多智能体系统的事件驱动控制方法,从理 论上保证其稳定性和避免芝诺现象,能够有效的节约通信资源,完成控制任务。
为实现上述目的,本发明采用了如下技术方案:
一种具有饱和输入的多智能体系统的事件驱动控制设计方法,其特征在于,包括以下 步骤:
步骤1:针对具有饱和输入的智能体,构建每个智能体的状态空间模型,并给出其系 统矩阵需要满足的假设条件;
步骤2:基于所述步骤1中建立的多智能体系统模型,设计可以使该系统达成一致性 的控制律;
步骤3:利用基于代数黎卡提方程的低增益技术,设计合适的低反馈增益,将非线性 的智能体模型优化为线性模型;
步骤4:设计了能够排除芝诺现象的事件驱动机制,以避免智能体间连续通信带来的 资源浪费;
步骤5:利用李雅普诺夫函数法,对设计出的事件驱动控制律进行一致性证明。
根据权利要求1所述的具有饱和输入的多智能体系统的事件驱动控制方法,其特征在 于,所述步骤1中,描述智能体运动特性的状态空间形式的个体数学模型采用以下公式:
Figure BDA0003303844590000033
其中xi(t)∈Rn,代表智能体i的状态向量,Rn为n维欧氏空间,ui(t)∈Rm代表智 能体i的输入,Rm为m维欧氏空间,σ表示ui(t)具有饱和非线性的限制;设无向图 G={v,ε,A},来描述各智能体之间的信息传输;其中v={1,2,...,N}表示N个节点,
Figure RE-GDA0003356410080000037
表示边的集合;无向图G的边用eij表示;这代表智能体i和智能体j可以相互进 行信息传输;智能体i的所有邻居的集合定义为Ni={j∈v:(i,j)∈ε,j≠i};无向图G的邻 接矩阵定义为
Figure RE-GDA0003356410080000032
其中RN×N为N×N维矩阵,其元素定义为aii=0,当且 仅当vj和vi有路径,即eij∈ε时,aij=1,否则aii=0;对角矩阵D=diag{d1,…,dn}被称 作度矩阵,其元素定义为di=∑i∈Ni aij;无向图G的拉普拉斯矩阵L定义为
Figure RE-GDA0003356410080000033
系统矩阵需要满足的假设条件为:(A,B)在有界控制下是渐近零可控的,即(A,B)是可 稳定的;A的所有特征值都在封闭的左半s平面上。
所述步骤2中设计的使多智能体系统达成一致性的控制律具体为:
Figure BDA0003303844590000039
其中,K为反馈增益矩阵,xj(t)为智能体j的状态,
对于任意有界的初始状态集合
Figure BDA00033038445900000312
在该控制律下能够达成多智能体系统状态的一 致性,即:
Figure BDA00033038445900000310
所述步骤3中设计合适的低反馈增益,将非线性的智能体模型优化为线性模型的理论 依据具体为:
步骤3-1.解如下的代数黎卡提方程:
Figure BDA0003303844590000041
得到唯一正定的P(γ),其中γ∈(0,1)是给定的常数,I是具有适当维度的单位矩阵,AT是 系统矩阵A的转置,BBT是控制矩阵及其转置之积,N是智能体的个数;
步骤3-2.定义反馈增益矩阵:
K=BTP(γ) (5)
利用该方法设计的反馈增益K与γ唯一对应,且γ越小,K的值也越小,通过调整γ就能 不断的减小K,使每个智能体的输入ui(t)保持在饱和约束阈值以下;并且所设计的低反馈 增益只需要网络中的智能体个数,而不需要整个网络的拓扑结构。
所述步骤4中设计的能够排除芝诺现象的事件驱动机制,具体为:
步骤4-1.将所述步骤2和所述步骤3中设计的控制律离散化,设计非连续时间的控制 律,具体为:
Figure BDA0003303844590000042
其中
Figure BDA0003303844590000043
代表智能体i的触发序列,将(6)带入到(1)中得到系统的动力学方程为:
Figure BDA0003303844590000044
步骤4-2.定义变量
Figure BDA0003303844590000045
其中xj(t)和xi(t)表示智能体j和i的状态,值得注意的是,j和i是拓扑结构上相连的智能体,能够相互交换信息;再定义误差变量:
Figure BDA0003303844590000046
我们定义
Figure BDA0003303844590000047
因为无向图G是无向且 联通的,于是存在一个矩阵Γ=[Γ1,Γ2,…,ΓN]∈RNxN,其中Γ1,Γ2,…,ΓN为拉普拉斯矩阵L 对应特征值的特征向量;也就是说ΓTLΓ=diag{λ1,…,λN},其中λ1,…,λN为拉普拉斯矩阵L 的特征值;对于无向连通图我们可以选择
Figure BDA0003303844590000051
显然,它对应的特征值为λ1=0; 然后我们令φ=[Γ2,…,ΓN]∈RN×N-1,Λ=Λ=diag{λ2,…,λN},
Figure BDA0003303844590000052
Figure BDA0003303844590000053
Figure BDA0003303844590000054
此处的
Figure BDA0003303844590000055
表示两个矩阵的克罗内克积;
步骤4-3.设计智能体i,i∈V的事件触发序列
Figure BDA0003303844590000056
为:
Figure BDA0003303844590000057
其中
Figure BDA0003303844590000058
λ0=λN||P(γ)BBTP(γ)||;与此同时,该规则可以在理论上 有效的避免芝诺现象,即任意两次相邻触发时刻间隔的下界为:
Figure BDA0003303844590000059
其中
Figure BDA00033038445900000510
表示任意两次相邻触发时刻之差,且
Figure BDA00033038445900000511
严格为正。
所述步骤5中利用李雅普诺夫函数法,进行一致性证明,具体为:
步骤5-1.选取恰当的李雅普诺夫函数为:
Figure BDA00033038445900000512
步骤5-2.其对时间的导数为:
Figure BDA00033038445900000513
值得一提的是,这里化简的第一步用到了:
Figure BDA00033038445900000514
步骤5-3.为了判断该导数的符号,我们将首先判断||z(t)||,||e(t)||,和
Figure BDA00033038445900000517
之间的关 系;首先根据zi(t)的定义,我们容易得到
Figure BDA00033038445900000518
x(t),以及:
Figure BDA00033038445900000515
基于事件触发序列(10),对于任意
Figure BDA00033038445900000516
都有:
Figure BDA0003303844590000061
与(14)联立,我们就可以得到||z(t)||,||e(t)||,和
Figure BDA0003303844590000062
之间的关系:
Figure BDA0003303844590000063
步骤5-4.判断导数符号:与(13)联立可以得到,
Figure BDA0003303844590000064
(17)的成立是因为
Figure BDA0003303844590000065
往上式中带入||z(t)||,||e(t)||,和
Figure BDA00033038445900000612
的不等关系(16)有:
Figure BDA0003303844590000066
我们再定义λM=λmax(p(γ)),λm=λmin(p(γ)),
Figure BDA0003303844590000067
于是我们有:
Figure BDA0003303844590000068
带入V(t)的定义式(12)有:
Figure BDA0003303844590000069
对上式左右两端开平方,并取t→∞可得,
Figure BDA00033038445900000610
与(17)相结合,由李雅普诺夫第二法我们可以得出多智能体系统(1)在所给出的事件触发控制策略下,能够达成一致性,即有
Figure BDA00033038445900000611
与现有技术相比,本发明的有益效果:
针对多智能体系统的一致性控制,本发明提出了一种能够解决输入饱和约束的多智能 体时间驱动控制协议,使多智能体系统能够完成预期的控制目标。主要优点如下:
1)输入饱和非线性是一种常见的非线性问题,由于物理约束和安全原因,大多数实 际控制系统会受到输入饱和的影响。在智能体的输入受到饱和非线性约束的时候,能够利 用基于代数黎卡提方程的低增益技术将其优化为线性系统。并且低反馈增益的设计不依赖 系统全局的拓扑信息,而仅仅依靠智能体的个数。
2)基于连续时间或采用时间驱动的多智能体一致性控制协议,虽然能够完成控制任 务,但伴随着大量的不必要的通信资源和控制资源的浪费。本发明采用的事件驱动控制能 够在完成一致性控制任务的基础上有效的减少控制律更新的次数,仅在必要的时候更新控 制律,节约资源。
3)本发明所采用的事件触发序列能够有效的避免芝诺现象,不会在有限的时间内发 生无穷次触发使得系统崩溃的情况。
附图说明
图1为本发明的具有饱和输入的多智能体系统的事件驱动控制方法设计步骤示意图;
图2为本发明实施例无向拓扑示意图;
图3为γ=0.1时多智能体状态图;
图4为γ=0.1时多智能体控制输入图;
图5为γ=0.1时事件触发序列图;
图6为γ=0.2时多智能体状态图;
图7为γ=0.2时多智能体控制输入图;
图8为γ=0.2时事件触发序列图。
具体实施方式
下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描 述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发 明的保护范围。
现有的多智能体一致性控制技术大多要求多智能体能够实时接收邻居智能体的信息, 并且可以广播自己的信息,这对于智能体通讯网络的带宽要求和实时通讯能力具有较高要 求。周期性的时间驱动控制能够将连续的、实时的控制转换为在离散触发时刻的控制,但 较为保守的时间周期选择仍然造成大量的通讯资源浪费。现实中的电子器件,出于物理因 素或安全因素考虑,通常会存在输入饱和非线性。超出饱和约束阈值的控制信号将会失真, 控制器得不到完整的控制信号,控制的性能大打折扣,甚至影响到系统的稳定性,有造成 危险的可能。
基于以上考虑,本发明首先利用基于代数黎卡提方程的低增益技术,设计低反馈增益 矩阵,将具有饱和输入约束的非线性系统优化为线性系统,并且该反馈仅仅依赖智能体的 个数。为了进一步克服周期性时间驱动控制的弊端,本文设计了一种事件驱动控制,有效 的减少了触发次数,节约了通讯资源。接着,通过证明触发序列中任意两个触发时刻的间 隔具有严格正的下界从而排除了芝诺现象。最后通过选择恰当的李雅普诺夫函数,证明了 本发明设计的事件驱动控制方案能够使多智能体系统达成一致性。
实施例1
一种适用于具有饱和输入的多智能体系统的事件驱动控制方法,所述方法包括以下步 骤:图1表示了对于处于饱和约束条件下的多智能体,构建智能体的微分方程模型。其构 成具体如下执行:
步骤1.针对具有饱和输入的智能体,构建每个智能体的状态空间模型,并给出其系统 矩阵需要满足的假设条件。具体为
Figure BDA0003303844590000081
在此处,xi(t)∈Rn,代表智能体i的状态向量,ui(t)∈Rm代表智能体i的输入。且ui(t) 具有饱和非线性的限制,因此(1)也可以写为:
Figure BDA0003303844590000082
且假设(A,B)在有界控制下是渐近零可控的,即(A,B)是可稳定的;A的所有特征值都 在封闭的左半s平面上。
多智能体的拓扑结构可以描述为:
设无向图G={v,ε,A},来描述各智能体之间的信息传输。其中V={1,2,...,N}表示N 个节点,
Figure RE-GDA0003356410080000097
表示边的集合。图G的边用eij表示。这代表智能体i和智能体j可以相互进行信息传输。智能体i的所有邻居的集合定义为Ni={j∈V:(i,j)∈ε,j≠i}。图G的 邻接矩阵定义为
Figure RE-GDA0003356410080000091
其元素定义为aii=0,当且仅当Vj和Vi有路径,即eij∈ε时,aij=1,否则aii=0。对角矩阵D=diag{d1,…,dn}被称作度矩阵,其元素定义为 di=∑i∈Ni aij。图G的拉普拉斯矩阵L定义为
Figure RE-GDA0003356410080000092
步骤2.设计使多智能体系统达成一致性的控制律。该步骤具体为:
Figure BDA0003303844590000093
对于任意有界的初始状态集合
Figure BDA0003303844590000094
在该控制律下能够达成多智能体系统状态的一 致性,即:
Figure BDA0003303844590000095
步骤3.设计合适的低反馈增益,将非线性的智能体模型优化为线性模型。该步骤的具 体过程为:
步骤3-1.解如下的代数黎卡提方程:
Figure BDA0003303844590000096
得到唯一正定的P(γ),其中γ∈(0,1)是给定的常数,I是具有适当维度的单位矩阵;
步骤3-2.定义反馈增益矩阵:
K=BTP(γ)
利用该方法设计的反馈增益K与γ唯一对应,且γ越小,K的值也越小,通过调整γ就能 不断的减小K,使每个智能体的输入ui(t)保持在饱和约束阈值以下。并且所设计的低反馈 增益只需要网络中的智能体个数,而不需要整个网络的拓扑结构。
步骤4.设计的能够排除芝诺现象的事件驱动机制。该步骤的具体过程为:
步骤4-1.将步骤2和步骤3中设计的控制律离散化,设计非连续时间的控制律,具体 为:
Figure BDA0003303844590000101
其中
Figure BDA00033038445900001016
代表智能体i的触发序列,将(6)带入到(1)中得到系统的动力学方程为:
Figure BDA0003303844590000102
步骤4-2.定义变量
Figure BDA0003303844590000103
其中xj(t)和xi(t)表示智能体j和i的状态,值得注意的是,j和i是拓扑结构上相连的智能体,能够相互交换信息。再定义误差变量:
Figure BDA0003303844590000104
我们定义
Figure BDA0003303844590000105
因为图G是无向且联通 的,于是存在一个矩阵Γ=[Γ1,Γ2,…,ΓN]∈RNxN,其中Γ1,Γ2,…,ΓN为拉普拉斯矩阵L对应 特征值的特征向量。也就是说ΓTLΓ=diag{λ1,…,λN},其中λ1,…,λN为拉普拉斯矩阵L的 特征值。对于无向连通图我们可以选择
Figure BDA0003303844590000106
显然,它对应的特征值为λ1=0。 然后我们令φ=[Γ2,…,ΓN]∈RN×N-1,Λ=Λ=diag{λ2,…,λN},
Figure BDA0003303844590000107
Figure BDA00033038445900001017
Figure BDA0003303844590000108
此处的
Figure BDA0003303844590000109
表示两个矩阵的克罗内克积。
步骤4-3.设计智能体i,i∈V的事件触发序列
Figure BDA00033038445900001010
为:
Figure BDA00033038445900001011
其中
Figure BDA00033038445900001012
λ0=λN||P(γ)BBTP(γ)||。与此同时,该规则可以在理论上 有效的避免芝诺现象,即任意两次相邻触发时刻间隔的下界为:
Figure BDA00033038445900001013
其中
Figure BDA00033038445900001014
表示任意两次相邻触发时刻之差,且
Figure BDA00033038445900001015
严格为正
步骤5.利用李雅普诺夫函数法,进行一致性证明。该步骤的具体过程为:
步骤5-1.选取恰当的李雅普诺夫函数为:
Figure BDA0003303844590000111
步骤5-2.其对时间的导数为:
Figure BDA0003303844590000112
值得一提的是,这里化简的第一步用到了
Figure BDA0003303844590000113
步骤5-3.为了判断该导数的符号,我们将首先判断||z(t)||,||e(t)||,和
Figure BDA0003303844590000114
之间的关 系。首先根据zi(t)的定义,我们容易得到
Figure BDA0003303844590000115
以及:
Figure BDA0003303844590000116
与(14)联立,我们就可以得到||z(t)||,||e(t)||,和
Figure BDA0003303844590000117
之间的关系:
Figure BDA0003303844590000118
步骤5-4.判断导数符号:
Figure BDA0003303844590000119
上式的成立是因为
Figure BDA00033038445900001110
往上式中带入||z(t)||,||e(t)||,和
Figure BDA00033038445900001111
的不等关系有:
Figure BDA00033038445900001112
我们再定义λM=λmax(p(γ)),λm=λmin(p(γ)),
Figure BDA00033038445900001113
于是我们有:
Figure BDA00033038445900001114
Figure BDA0003303844590000121
Figure BDA0003303844590000122
对上式左右两端开平方,并取t→∞可得,
Figure BDA0003303844590000123
由李雅普诺夫第二法我们可以得出多智能体系统(1)在本发明所给出的事件触发控 制策略下,能够达成一致性,即有
Figure BDA0003303844590000124
以下是本发明所设计的具有饱和输入的多智能体事件驱动控制的模拟仿真实验。
该仿真实验为5个智能体构成的多智能体系统最终状态达成一致性的数值模拟实验各 智能体的初始状态
Figure RE-GDA0003356410080000127
是有界的,即其初始状态向量中的各个元素均为[-3,3]内的随机值, σ0=0.9,γ=0.1或0.2仿真时间为[0,30s]
仿真实验中,假设智能体之间的通信拓扑图为无向图,由边相连的智能体可以互相传 递信息。所构建的多智能体通信拓扑图如图2所示,显然该图满足假设,即图是联通的, 因此图的邻接矩阵和拉普拉斯矩阵分别为
Figure RE-GDA0003356410080000124
Figure BDA0003303844590000129
另外设置系统矩阵A和输入矩阵B分别为
Figure BDA00033038445900001210
和B=[0 1]T
当设置γ=0.1时,图3可以看出5个智能体的二维状态向量随事件逐渐趋近于同一个 值,达成了一致性控制的任务。图4中可以看到智能体的控制输入逐渐趋近于0,也就是 说每个智能体与其邻居智能体的状态差值渐渐接近于0。图5记录了事件触发的时间点。当设置γ=0.2时的实验结果如图6-图8所示。
表1.γ=0.1时智能体触发次数记录表
智能体1 智能体2 智能体3 智能体4 智能体5
977次 1210次 899次 887次 933次
表2.γ=0.2时智能体触发次数记录表
智能体1 智能体2 智能体3 智能体4 智能体5
956次 1098次 892次 870次 920次
从上表中不难看出,将从γ从0.1设置成0.2时,每个智能体的触发次数都有所降低。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员 应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为发明的优选 例,并不用来限制本发明,在不脱离本发明新型精神和范围的前提下,本发明还会有各种 变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所 附的权利要求书及其等效物界定。

Claims (6)

1.一种具有饱和输入的多智能体系统的事件驱动控制设计方法,其特征在于,包括以下步骤:
步骤1:针对具有饱和输入的智能体,构建每个智能体的状态空间模型,并给出其系统矩阵需要满足的假设条件;
步骤2:基于所述步骤1中建立的多智能体系统模型,设计可以使该系统达成一致性的控制律;
步骤3:利用基于代数黎卡提方程的低增益技术,设计合适的低反馈增益,将非线性的智能体模型优化为线性模型;
步骤4:设计了能够排除芝诺现象的事件驱动机制;
步骤5:利用李雅普诺夫函数法,对设计出的事件驱动控制律进行一致性证明。
2.根据权利要求1所述的具有饱和输入的多智能体系统的事件驱动控制方法,其特征在于,所述步骤1中,描述智能体运动特性的状态空间形式的个体数学模型采用以下公式:
Figure RE-FDA0003356410070000011
其中xi(t)∈Rn,代表智能体i的状态向量,Rn为n维欧氏空间,ui(t)∈Rm代表智能体i的输入,Rm为m维欧氏空间,σ表示ui(t)具有饱和非线性的限制;设无向图G={v,ε,A},来描述各智能体之间的信息传输;其中v={1,2,...,N}表示N个节点,
Figure RE-FDA0003356410070000012
表示边的集合;无向图G的边用eij表示;这代表智能体i和智能体j可以相互进行信息传输;智能体i的所有邻居的集合定义为Ni={j∈v:(i,j)∈ε,j≠i};无向图G的邻接矩阵定义为
Figure RE-FDA0003356410070000013
其中RN×N为N×N维矩阵,其元素定义为aii=0,当且仅当vj和vi有路径,即eij∈ε时,aij=1,否则aii=0;对角矩阵D=diag{d1,…,dn}被称作度矩阵,其元素定义为di=∑i∈Ni aij;无向图G的拉普拉斯矩阵L定义为
Figure RE-FDA0003356410070000014
系统矩阵需要满足的假设条件为:(A,B)在有界控制下是渐近零可控的,即(A,B)是可稳定的;A的所有特征值都在封闭的左半s平面上。
3.根据权利要求1所述的具有饱和输入的多智能体系统的事件驱动控制方法,其特征在于,所述步骤2中设计的使多智能体系统达成一致性的控制律具体为:
Figure FDA0003303844580000025
其中,K为反馈增益矩阵,xj(t)为智能体j的状态;
对于任意有界的初始状态集合
Figure FDA0003303844580000021
在该控制律下能够达成多智能体系统状态的一致性,即:
Figure FDA0003303844580000022
4.根据权利要求1所述的具有饱和输入的多智能体系统的事件驱动控制方法,其特征在于,所述步骤3中设计合适的低反馈增益,将非线性的智能体模型优化为线性模型的理论依据具体为:
步骤3-1.解如下的代数黎卡提方程:
Figure FDA0003303844580000023
得到唯一正定的P(γ),其中γ∈(0,1)是给定的常数,I是具有适当维度的单位矩阵,AT是系统矩阵A的转置,BBT是控制矩阵及其转置之积,N是智能体的个数;
步骤3-2.定义反馈增益矩阵:
K=BTP(γ) (5)
利用该方法设计的反馈增益K与γ唯一对应,且γ越小,K的值也越小,通过调整γ就能不断的减小K,使每个智能体的输入ui(t)保持在饱和约束阈值以下;并且所设计的低反馈增益只需要网络中的智能体个数,而不需要整个网络的拓扑结构。
5.根据权利要求1所述的具有饱和输入的多智能体系统的事件驱动控制方法,其特征在于,所述步骤4中设计的能够排除芝诺现象的事件驱动机制,具体为:
步骤4-1.将所述步骤2和所述步骤3中设计的控制律离散化,设计非连续时间的控制律,具体为:
Figure FDA0003303844580000024
其中
Figure FDA0003303844580000031
代表智能体i的触发序列,将(6)带入到(1)中得到系统的动力学方程为:
Figure FDA0003303844580000032
步骤4-2.定义变量:
Figure FDA0003303844580000033
其中xj(t)和xi(t)表示智能体j和i的状态,值得注意的是,j和i是拓扑结构上相连的智能体,能够相互交换信息;再定义误差变量:
Figure FDA0003303844580000034
我们定义
Figure FDA0003303844580000035
因为无向图G是无向且联通的,于是存在一个矩阵Γ=[Γ1,Γ2,…,ΓN]∈RNxN,其中Γ1,Г2,…,ΓN为拉普拉斯矩阵L对应特征值的特征向量;也就是说ΓTLΓ=diag{λ1,…,λN},其中λ1,…,λN为拉普拉斯矩阵L的特征值;对于无向连通图我们可以选择
Figure FDA0003303844580000036
显然,它对应的特征值为λ1=0;然后我们令φ=[Γ2,…,ΓN]∈RN×N-1,Λ=Λ=diag{λ2,…,λN},
Figure FDA0003303844580000037
Figure FDA0003303844580000038
Figure FDA0003303844580000039
此处的
Figure FDA00033038445800000310
表示两个矩阵的克罗内克积;
步骤4-3.设计智能体i,i∈V的事件触发序列
Figure FDA00033038445800000311
为:
Figure FDA00033038445800000312
其中
Figure FDA00033038445800000313
σ0∈(0,1),λ0=λN||P(γ)BBTP(γ)||;与此同时,该规则可以在理论上有效的避免芝诺现象,即任意两次相邻触发时刻间隔的下界为:
Figure FDA00033038445800000314
其中
Figure FDA00033038445800000315
表示任意两次相邻触发时刻之差,且
Figure FDA00033038445800000316
严格为正。
6.根据权利要求1所述的具有饱和输入的多智能体系统的事件驱动控制方法,其特征在于,所述步骤5中利用李雅普诺夫函数法,进行一致性证明,具体为:
步骤5-1.选取恰当的李雅普诺夫函数为:
Figure FDA0003303844580000041
步骤5-2.其对时间的导数为:
Figure FDA0003303844580000042
值得一提的是,这里化简的第一步用到了:
Figure FDA0003303844580000043
步骤5-3.为了判断该导数的符号,我们将首先判断||z(t)||,||e(t)||,和
Figure FDA0003303844580000044
之间的关系;首先根据zi(t)的定义,我们容易得到
Figure FDA0003303844580000045
以及:
Figure FDA0003303844580000046
基于事件触发序列(10),对于任意
Figure FDA0003303844580000047
都有:
Figure FDA0003303844580000048
与(14)联立,我们就可以得到||z(t)||,||e(t)||,和
Figure FDA0003303844580000049
之间的关系:
Figure FDA00033038445800000410
步骤5-4.判断导数符号:与(13)联立可以得到:
Figure FDA00033038445800000411
(17)的成立是因为
Figure FDA00033038445800000412
往上式中带入||z(t)||,||e(t)||,和
Figure FDA00033038445800000413
的不等关系(16)有:
Figure FDA00033038445800000414
我们再定义λM=λmax(p(γ)),λm=λmin(p(γ)),
Figure FDA0003303844580000051
于是我们有:
Figure FDA0003303844580000052
带入V(t)的定义式(12)有:
Figure FDA0003303844580000053
Figure FDA0003303844580000054
对上式左右两端开平方,并取t→∞可得,
Figure FDA0003303844580000055
与(17)相结合,由李雅普诺夫第二法我们可以得出多智能体系统(1)在所给出的事件触发控制策略下,能够达成一致性,即有
Figure FDA0003303844580000056
CN202111198055.4A 2021-10-14 2021-10-14 一种具有饱和输入的多智能体的事件驱动控制方法 Pending CN113867150A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111198055.4A CN113867150A (zh) 2021-10-14 2021-10-14 一种具有饱和输入的多智能体的事件驱动控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111198055.4A CN113867150A (zh) 2021-10-14 2021-10-14 一种具有饱和输入的多智能体的事件驱动控制方法

Publications (1)

Publication Number Publication Date
CN113867150A true CN113867150A (zh) 2021-12-31

Family

ID=78999671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111198055.4A Pending CN113867150A (zh) 2021-10-14 2021-10-14 一种具有饱和输入的多智能体的事件驱动控制方法

Country Status (1)

Country Link
CN (1) CN113867150A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547980A (zh) * 2022-02-24 2022-05-27 重庆大学 具有时变状态约束的多智能体有限时间事件触发控制方法
CN116047908A (zh) * 2023-01-16 2023-05-02 齐齐哈尔大学 混合阶异构多智能体系统协同最优编队控制方法及设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070150565A1 (en) * 2005-12-22 2007-06-28 Arun Ayyagari Surveillance network system
CN105301966A (zh) * 2015-11-27 2016-02-03 上海无线电设备研究所 基于输入受限式自激发驱动的多机器人协同控制方法
CN108942935A (zh) * 2018-07-24 2018-12-07 南京邮电大学 基于输出位置的单臂机械手自适应控制器及控制方法
CN110262245A (zh) * 2019-07-02 2019-09-20 南京理工大学 基于事件触发机制的多智能体系统的控制器设计方法
GB201912280D0 (en) * 2019-07-02 2019-10-09 Univ Northwestern Polytechnical Dynamic gain control method for multi-spacecraft consensus
WO2020101869A1 (en) * 2018-11-16 2020-05-22 Rutgers, The State University Of New Jersey Scalable, secure, and broad-spectrum mechanism for enforcement of protocols over multi-agent systems
KR20200093874A (ko) * 2019-01-29 2020-08-06 한밭대학교 산학협력단 퍼지모델 기반 쿼드로터의 제어 시스템 및 방법
CN113176732A (zh) * 2021-01-25 2021-07-27 华东交通大学 一种非线性随机多智能体系统固定时间一致控制方法
CN113342037A (zh) * 2021-06-07 2021-09-03 广东工业大学 具有输入饱和的多旋翼无人机时变编队控制方法及系统
US20210286375A1 (en) * 2020-03-13 2021-09-16 King Fahd University Of Petroleum And Minerals Systems and methods for multi-agent system control using consensus and saturation constraints

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070150565A1 (en) * 2005-12-22 2007-06-28 Arun Ayyagari Surveillance network system
CN105301966A (zh) * 2015-11-27 2016-02-03 上海无线电设备研究所 基于输入受限式自激发驱动的多机器人协同控制方法
CN108942935A (zh) * 2018-07-24 2018-12-07 南京邮电大学 基于输出位置的单臂机械手自适应控制器及控制方法
WO2020101869A1 (en) * 2018-11-16 2020-05-22 Rutgers, The State University Of New Jersey Scalable, secure, and broad-spectrum mechanism for enforcement of protocols over multi-agent systems
KR20200093874A (ko) * 2019-01-29 2020-08-06 한밭대학교 산학협력단 퍼지모델 기반 쿼드로터의 제어 시스템 및 방법
CN110262245A (zh) * 2019-07-02 2019-09-20 南京理工大学 基于事件触发机制的多智能体系统的控制器设计方法
GB201912280D0 (en) * 2019-07-02 2019-10-09 Univ Northwestern Polytechnical Dynamic gain control method for multi-spacecraft consensus
US20210286375A1 (en) * 2020-03-13 2021-09-16 King Fahd University Of Petroleum And Minerals Systems and methods for multi-agent system control using consensus and saturation constraints
CN113176732A (zh) * 2021-01-25 2021-07-27 华东交通大学 一种非线性随机多智能体系统固定时间一致控制方法
CN113342037A (zh) * 2021-06-07 2021-09-03 广东工业大学 具有输入饱和的多旋翼无人机时变编队控制方法及系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
周绍磊;闫实;刘伟;李瑞涛;: "输入饱和约束下一类多智能体编队系统鲁棒一致性分析", 电子设计工程, no. 10, 20 May 2015 (2015-05-20) *
张银辉;杨华波;江振宇;张为华;: "干扰抑制SDRE姿态控制方法", 西安电子科技大学学报, no. 05, 20 October 2015 (2015-10-20) *
时良仁: "输入饱和多智能体系统的半全局鲁棒及输出一致性", 《中国博士学位论文全文数据库》, 15 January 2020 (2020-01-15) *
杨思凡;谢广明;罗文广;徐鹏;文家燕;: "符号图下多智能体系统事件驱动二分一致性", 信息与控制, no. 05, 15 October 2020 (2020-10-15) *
董瑞华;熊卫华;: "自适应事件触发控制的多智能体系统保性能一致性研究", 机电工程, no. 06, 20 June 2019 (2019-06-20) *
马巨海;张晓红;罗小元;关新平;: "基于事件触发的多智能体输入饱和一致性控制", 燕山大学学报, no. 04, 31 July 2015 (2015-07-31) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114547980A (zh) * 2022-02-24 2022-05-27 重庆大学 具有时变状态约束的多智能体有限时间事件触发控制方法
CN114547980B (zh) * 2022-02-24 2024-06-07 重庆大学 具有时变状态约束的多智能体有限时间事件触发控制方法
CN116047908A (zh) * 2023-01-16 2023-05-02 齐齐哈尔大学 混合阶异构多智能体系统协同最优编队控制方法及设备
CN116047908B (zh) * 2023-01-16 2023-10-13 齐齐哈尔大学 混合阶异构多智能体系统协同最优编队控制方法及设备

Similar Documents

Publication Publication Date Title
Yu et al. Second-order consensus in multiagent systems via distributed sliding mode control
Wang et al. Pinning control of lag-consensus for second-order nonlinear multiagent systems
CN113110039B (zh) 一种多智能体系统的有限时间分布式聚合优化方法
CN113867150A (zh) 一种具有饱和输入的多智能体的事件驱动控制方法
Cui et al. L2–L∞ consensus control for high-order multi-agent systems with switching topologies and time-varying delays
CN108037659B (zh) 基于事件驱动的时变耦合复杂动态网络同步方法
CN112596395B (zh) 一种多重信息约束下的多智能体一致性协同控制方法
CN112698634A (zh) 基于事件触发的交通智能体系统固定时间二分一致性方法
CN113268083A (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
CN112311589B (zh) 多智能体在Markov切换拓扑下的分组一致控制方法
Chen et al. Observer-based event-triggered consensus of leader-following linear multi-agent systems with input saturation and switching topologies
Chang et al. Time cost for consensus of stochastic multiagent systems with pinning control
Yong et al. Reaching consensus at a preset time: Double-integrator dynamics case
Guo et al. Predefined-time average consensus control for heterogeneous nonlinear multi-agent systems
Ren et al. Semiglobal cluster consensus for heterogeneous systems with input saturation
CN110609468B (zh) 基于pi的非线性时滞多智能体系统的一致性控制方法
CN116794987A (zh) 基于事件触发控制的异构多智能体系统一致性控制方法
Wu et al. Adaptive synchronization of TS fuzzy complex networks with time-varying delays via the pinning control method
CN113515066B (zh) 一种非线性多智能体系统动态事件触发控制方法
Wang et al. Event-triggered consensus control for second-order multi-agent systems with/without input time delay
Luo et al. The L2− L∞ control for leader-following coordination with switching topology and time-delay
Zhao et al. Tradeoff between time and energy costs for controlling stochastic coupled neural networks
CN113741185B (zh) 一种单边Lipschitz非线性多智能体系统保性能领导跟随一致性方法
CN114609909B (zh) 一种切换拓扑下的随机多智体系统控制协议的设计方法
Shi et al. Event-triggered consensus for double-integrator multi-agent systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination