CN115629544A - 一种数据驱动的多智能体系统自触发跟踪控制方法 - Google Patents

一种数据驱动的多智能体系统自触发跟踪控制方法 Download PDF

Info

Publication number
CN115629544A
CN115629544A CN202211331357.9A CN202211331357A CN115629544A CN 115629544 A CN115629544 A CN 115629544A CN 202211331357 A CN202211331357 A CN 202211331357A CN 115629544 A CN115629544 A CN 115629544A
Authority
CN
China
Prior art keywords
data
triggering
self
driven
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211331357.9A
Other languages
English (en)
Inventor
王钢
李依霏
孙健
陈杰
王信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202211331357.9A priority Critical patent/CN115629544A/zh
Publication of CN115629544A publication Critical patent/CN115629544A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公布了一种数据驱动的多智能体系统自触发跟踪控制方法,解决了有向通信拓扑下,未知模型的领导跟随多智能体系统一致性跟踪控制问题。首先。提出了一种分布式数据驱动自触发通信机制,实现在当前触发时刻仅利用数据决定下一个触发时刻,避免了连续状态检测,节约了计算和通信资源;其次,本方案在保证多智能体系统渐近一致跟踪的基础上,避免了智能体间连续通信,有效减少了通信负荷,进一步节约了资源;最后,本方案提供了一种仅利用状态‑输入数据联合设计控制器和触发矩阵的方法,消除了传统控制对系统模型的依赖,首次实现了针对未知多智能体系统的自触发一致性跟踪控制。

Description

一种数据驱动的多智能体系统自触发跟踪控制方法
技术领域
本发明属于多智能体系统协同控制技术领域,尤其涉及一种数据驱动的多智能体系统自触发跟踪控制方法。
背景技术
多智能体系统(MASs),如多机器人系统、车辆排系统和传感器网络等,因其具有协同执行复杂任务的潜力而受到学术界和工业界的广泛关注。作为多智能体系统领域内的关键问题之一,跟踪控制旨在基于智能体间的局部信息交互,设计分布式控制算法,使得所有跟随智能体跟踪上一个领导者的状态。
在实际应用中,单个智能体往往会受到有限的通信带宽和能量的限制。因此,针对传输资源受限问题,开展了间歇式通信机制研究,即通过仅在必要时采样/传输来延长传感器的生命周期,提高资源利用效率。自触发机制是间歇式通信策略中常用的方法,利用当前触发时刻的可用信息预先确定下一个触发时刻。由此可见,自触发机制下的触发(传输)时刻均是提前规划好的,并且系统的测量值只需要在每个触发时刻被采样,所以在事件触发间歇期,系统的传感器可以切换到睡眠模式。此外,多智能体系统自触发控制通过设计一个反馈控制器和一个自触发机制,在实现系统一致的基础上,不仅可以避免智能体间连续的通信,还可以避免连续的状态监测,有效的节约通信和计算资源,并在一定程度上延长传感器的使用寿命和系统的作业时长。
值得注意的是,目前有关自触发一致性控制的研究都是基于模型的,即控制器和自触发机制的设计都依赖于显式系统模型。然而,在实际应用中,要获得准确的系统模型是十分具有挑战性的。针对不同应用场景,系统模型缺失均会导致一系列控制难题,如智能制造过程中由于生产线模型缺失导致协同生产难等。为此,新型的数据驱动控制方法提供了一个端到端的范式以解决上述问题,即仅利用数据来实现对未知系统的控制与分析,并且不需要借助于任何中间步骤估计系统模型,如系统辨识。尽管针对单个未知系统的数据驱动控制,已经开展了广泛的研究,但是目前尚未有研究考虑未知多智能体系统传输资源受限情况下的一致性跟踪控制。因此,在自触发通信机制下,实现具有领导跟随结构的多智能体系统的分布式数据驱动一致性跟踪控制已成为亟待解决的问题。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提出一种数据驱动的多智能体系统自触发跟踪控制方法,该方法在考虑有向图下未知模型的领导跟随多智能体系统,避免了连续的通信与状态监测,有效的节约了有限的通信和计算资源。
本发明的技术解决方案是:
一种数据驱动的多智能体系统自触发跟踪控制方法,包括步骤:
S100,对多智能体系统设计分布式自触发一致性跟踪控制策略,控制策略包含一个状态反馈控制器和一个基于模型的分布式自触发通信机制;
S200,通过离线实验收集多智能体系统的状态数据和输入数据,建立跟踪误差的闭环提升系统,构建数据驱动的提升系统参数化表示;
S300,根据步骤S100中的基于模型的分布式自触发通信机制以及步骤S200 中构建的数据驱动的提升系统参数化表示,设计数据驱动的分布式自触发通信机制,实现在当前触发时刻仅利用数据预测下一个触发时刻;
S400,建立基于数据的稳定性判据,并根据建立的基于数据的稳定性判据设计步骤S100中状态反馈控制器中的增益矩阵,同时还设计步骤S300中得到的数据驱动的分布式自触发通信机制的触发矩阵,实现数据驱动的多智能体系统自触发跟踪控制。
所述的多智能体系统是N+1个智能体构成,其中,1个智能体为领导者,N 个智能体为跟随者,领导者的动力学模型为:
x0(t+1)=Atrx0(t)
跟随者的动力学模型为:
xi(t+1)=Atrxi(t)+Btrui(t),i=1,2,…,N
其中,
Figure RE-GDA0003975214420000031
表示领导者的状态;
Figure RE-GDA0003975214420000032
Figure RE-GDA0003975214420000033
分别表示跟随者i的状态向量和控制输入,真实系统矩阵Atr,Btr均是恒定的、可镇定和未知的;各智能体之间的连通关系由一个以领导者为根节点的有向生成树
Figure RE-GDA0003975214420000034
来描述;
所述的步骤S100中,状态反馈控制器和一个基于模型的分布式自触发通信机制具体设计如下:
S111,利用局部间歇信息,设计状态反馈控制器,具体为:
Figure RE-GDA0003975214420000035
Figure RE-GDA0003975214420000036
其中,
Figure RE-GDA0003975214420000037
为待设计的反馈增益矩阵;
Figure RE-GDA0003975214420000038
是跟随者i的第k次触发的时刻;aij是邻接矩阵
Figure RE-GDA0003975214420000039
的第i行、第j列的元素;
S112,基于模型的分布式自触发通信机制的设计如下:
不失一般性,假设领导者未配置触发装置,那么,对于跟随者i,假设
Figure RE-GDA00039752144200000310
是第一次触发时刻,触发时刻序列
Figure RE-GDA00039752144200000311
由下式确定:
Figure RE-GDA00039752144200000312
其中,触发函数设计为:
Figure RE-GDA00039752144200000313
其中,
Figure RE-GDA00039752144200000314
为待设计的正定对称矩阵;σ为正常数;
Figure RE-GDA00039752144200000315
为跟随者i的第k个事件触发间隔;
Figure RE-GDA00039752144200000316
表示在
Figure RE-GDA00039752144200000317
时刻与
Figure RE-GDA00039752144200000318
时刻之间的状态误差;符号T表示矩阵的转置;
所述的步骤S200,构建的数据驱动的提升系统参数化表示表述为:
Figure RE-GDA00039752144200000319
其中,
Figure RE-GDA0003975214420000041
Δi:=[δi(0)δi(1)…δi(ρ-1)],
Figure RE-GDA0003975214420000042
此外, s=1时
Figure RE-GDA0003975214420000043
Figure RE-GDA0003975214420000044
为在离散时间点T∈ [0,ρ]采集获得状态-输入数据。数据
Figure RE-GDA0003975214420000045
Figure RE-GDA0003975214420000046
根据跟踪误差的定义δi(t):=xi(t)-x0(t)计算后收集得到,
Figure RE-GDA0003975214420000047
Figure RE-GDA0003975214420000048
为适当维度下的已知矩阵;
所述的步骤S300,数据驱动的分布式自触发通信机制,具体为:
Figure RE-GDA0003975214420000049
其中,数据驱动触发函数设计为:
Figure RE-GDA00039752144200000410
其中,
Figure RE-GDA00039752144200000411
Figure RE-GDA00039752144200000412
Figure RE-GDA00039752144200000413
具体地,数据驱动的提升系统参数化表示的构建步骤为:
S211,在时间间隔T∈{0,1,…,ρ}内,多智能体系统的状态数据
Figure RE-GDA00039752144200000414
和输入数据
Figure RE-GDA00039752144200000415
由下述受干扰的开环系统通过开环实验测量得到:
xi(T+1)=Atrxi(T)+Btrui(T)+Ewi(T)
其中,
Figure RE-GDA00039752144200000416
是一个已知矩阵,用于模拟噪声wi(t)对该系统影响;
S212,定义跟随者i和领导者的跟踪误差δi(t):=xi(t)-x0(t),根据步骤S111 中设计的反馈控制器,跟踪误差闭环系统的动力学方程满足:
Figure RE-GDA0003975214420000051
那么,在触发时刻,该闭环系统的状态由下述切换系统控制:
Figure RE-GDA0003975214420000052
其中,
Figure RE-GDA0003975214420000053
为提升控制器增益;
Figure RE-GDA0003975214420000054
Figure RE-GDA0003975214420000055
为提升系统矩阵;上述系统即为跟踪误差的闭环提升系统。
S213,根据预先收集的每个智能体i输入-状态数据
Figure RE-GDA0003975214420000056
进一步,跟踪误差的定义计算并收集跟踪误差数据
Figure RE-GDA0003975214420000057
按如下方式堆叠以形成矩阵:
Δi:=[δi(0)δi(1)…δi(ρ-1)]
Figure RE-GDA0003975214420000058
Figure 100002_1
Figure RE-GDA00039752144200000510
S214,定义能够解释智能体i的数据
Figure RE-GDA00039752144200000511
的所有提升矩阵As,B s所在的集合为
Figure RE-GDA00039752144200000512
其中,s=1时
Figure RE-GDA00039752144200000513
时Es:=I。
S215,通过构造噪声模型,对未知的噪声上界加以限制,具体为:
Figure RE-GDA00039752144200000514
其中,
Figure RE-GDA00039752144200000515
Figure RE-GDA00039752144200000516
为适当维度下的已知
矩阵。s=1时
Figure RE-GDA00039752144200000517
Figure RE-GDA00039752144200000518
S216,基于上述步骤S211、S212、S213、S214、S215,得到
基于数据驱动的提升系统参数化表示为:
Figure RE-GDA00039752144200000519
其中,
Figure RE-GDA0003975214420000061
所述的步骤S400中,基于数据的稳定性判据,具体为:
考虑所述的拓扑图
Figure RE-GDA0003975214420000062
和具有领导跟随结构的多智能体系统,对于给定的正常数σ>0和∈,对于所有[AB]∈∑i,如果存在参数β>0,以及矩阵P>0,Φ> 0,G和KG,对i=1,2,…,N满足以下线性矩阵不等式,那么对于任何初始状态,在所述的分布式反馈控制器和分布式自触发通信机制的作用下,网络中所有跟随者状态均渐近跟踪上领导者状态;
增益矩阵设计为K=KGG-1
Figure RE-GDA0003975214420000063
其中,
Lκ:=[0n×(κ-1)n,In,0n×(3-κ)n],κ=1,2,3,
Figure RE-GDA0003975214420000064
Figure RE-GDA0003975214420000065
Figure RE-GDA0003975214420000066
Figure RE-GDA0003975214420000067
Ui:=[ui(1)ui(2)…ui(ρ-1)],Δi+:=[δi(1)δi(2)…δi(ρ)]
有益效果
本发明解决了有向通信拓扑下,未知模型的领导-跟随多智能体系统一致跟踪控制问题。首先,提出了一种分布式自触发一致性跟踪控制策略,包括一个状态反馈控制器和一个基于模型的自触发机制;进一步,利用状态-输入数据以及跟踪误差的闭环提升系统,构建了数据驱动的提升系统参数化表示;通过结合基于模型的自触发机制和数据驱动的提升系统参数化表示,设计了分布式数据驱动自触发机制;最后,通过构建数据驱动的原系统参数化表示,提出了控制器和触发矩阵的联合设计方法,得到了基于数据的一致性条件,实现了所有跟随者状态渐近跟踪上领导者状态。综上,本发明的主要贡献可总结为:首先,所设计的分布式数据驱动自触发通信机制在当前触发时刻仅利用数据决定下一个触发时刻,避免了连续的状态检测,节约了计算和通信资源;其次,本方案在保证多智能体系统渐近一致的基础上,避免了智能体间连续通信,有效地减少了通信负荷,进一步节约了资源;最后,本方案提供了一种仅利用状态-输入数据设计控制器和触发矩阵的数据驱动方法,消除了传统控制对系统模型的依赖,首次实现了针对未知多智能体系统的自触发一致性跟踪控制。
本发明公布了一种数据驱动的多智能体系统自触发跟踪控制方法,解决了有向通信拓扑下,未知模型的领导跟随多智能体系统一致性跟踪控制问题。首先。提出了一种分布式数据驱动自触发通信机制,实现在当前触发时刻仅利用数据决定下一个触发时刻,避免了连续状态检测,节约了计算和通信资源;其次,本方案在保证多智能体系统渐近一致跟踪的基础上,避免了智能体间连续通信,有效减少了通信负荷,进一步节约了资源;最后,本方案提供了一种仅利用状态-输入数据联合设计控制器和触发矩阵的方法,消除了传统控制对系统模型的依赖,首次实现了针对未知多智能体系统的自触发一致性跟踪控制。
附图说明
图1是本发明提供一种数据驱动的多智能体系统自触发跟踪控制方法的结构示意图;
图2是本发明提供的一种数据驱动的多智能体系统自触发跟踪控制方法的流程示意图;
图3是本发明一个实施例中的数据驱动自触发控制策略作用下的多智能体系统状态轨迹图;
图4是本发明一个实施例中的数据驱动触发控制策略作用下的多智能体系统的触发时刻图。
具体实施方式
下面结合附图并举实施例,对本发明的实施方式做具体说明。
如图1所示为本发明的系统结构示意图,其中包括被控对象(未知模型的领导-跟随多智能体系统、传感器、执行器、状态反馈控制器和分布式自触发决策器。其中,分布式自触发决策器在当前出发时刻预测下一个触发时刻,并将预测值向其邻居广播。若邻居触发事件后,该智能体立即接收邻居的最新状态并重新检查自身自触发功能;否则,该智能体将待到其预定的触发时刻才验证触发条件。通过预先采集的系统状态-输入数据,设计数据驱动反馈控制器和自触发机制,实现未知系统渐近跟踪一致性控制。
如图2所示为本发明的流程示意图,一种数据驱动的多智能体系统自触发跟踪控制方法,包含以下步骤:
S100,考虑具有领导跟随结构的线性多智能体系统,设计分布式自触发一致性跟踪控制策略,包含一个状态反馈控制器和一个分布式基于模型的自触发通信机制。
在一个实施例中,考虑由N个跟随者和1个领导者构成的离散时间线性多智能体系统,每个智能体的动力学模型为:
Figure RE-GDA0003975214420000081
其中,
Figure RE-GDA0003975214420000082
表示领导者的状态;
Figure RE-GDA0003975214420000083
Figure RE-GDA0003975214420000084
分别表示跟随者i 的状态向量和控制输入。真实系统矩阵Atr,Btr是恒定的、可镇定和未知的。系统中各智能体之间的连通关系可由一个以领导者为根节点的有向生成树
Figure RE-GDA0003975214420000085
来描述。
进一步,步骤S100中所述分布式自触发一致性跟踪控制策略,包括一个状态反馈控制器和一个分布式自触发通信机制,具体设计如下:
S111,利用局部间歇信息,设计分布式状态反馈控制器,具体为:
Figure RE-GDA0003975214420000086
Figure RE-GDA0003975214420000087
其中,
Figure RE-GDA0003975214420000088
为待设计的反馈增益矩阵;
Figure RE-GDA0003975214420000089
是跟随者i的第k次触发的时刻;aij是邻接矩阵
Figure RE-GDA00039752144200000810
的第i行、第j列的元素。
S112,分布式自触发通信机制,设计如下:
不失一般性,假设领导者未配置触发装置。那么,对于跟随者i,假设
Figure RE-GDA0003975214420000091
是第一次触发时刻,触发时刻序列
Figure RE-GDA0003975214420000092
由下式确定:
Figure RE-GDA0003975214420000093
其中,触发函数设计为:
Figure RE-GDA0003975214420000094
其中,
Figure RE-GDA0003975214420000095
为待设计的正定对称矩阵;σ为正常数;
Figure RE-GDA0003975214420000096
为跟随者i的第k个事件触发间隔;
Figure RE-GDA0003975214420000097
表示在
Figure RE-GDA0003975214420000098
时刻与
Figure RE-GDA0003975214420000099
时刻之间的状态误差;符号T表示矩阵的转置。
S200,通过离线实验收集开环系统的状态数据和输入数据,建立跟踪误差的闭环提升系统,构建数据驱动的提升系统参数化表示;
在一个实施例中,步骤S200所述数据驱动的提升系统参数化表示表述为:
Figure RE-GDA00039752144200000910
其中,
Figure RE-GDA00039752144200000911
Δi:=[δi(0)δi(1)…δi(ρ-1)],
Figure RE-GDA00039752144200000912
此外, s=1时
Figure RE-GDA00039752144200000913
Figure RE-GDA00039752144200000914
为在离散时间点T∈ [0,ρ]采集获得状态-输入数据。数据
Figure RE-GDA00039752144200000915
Figure RE-GDA00039752144200000916
可根据跟踪误差的定义δi(t):=xi(t)-x0(t)计算后收集得到。
Figure RE-GDA00039752144200000917
Figure RE-GDA00039752144200000918
为适当维度下的已知矩阵。
具体地,数据驱动的提升系统参数化表示构建步骤为:
S211,在时间间隔T∈{0,1,…,ρ}内,系统的状态数据
Figure RE-GDA00039752144200000919
和输入数据
Figure RE-GDA00039752144200000920
由下述受干扰的开环系统通过开环实验测量得到:
xi(T+1)=Atrxi(T)+Btrui(T)+Ewi(T)
其中,
Figure RE-GDA0003975214420000101
是一个已知矩阵,用于模拟噪声wi(t)对该系统影响。
S212,定义跟随者i和领导者的跟踪误差δi(t):=xi(t)-x0(t),根据步骤S111 中设计的反馈控制器,跟踪误差闭环系统的动力学方程满足:
Figure RE-GDA0003975214420000102
那么,在触发时刻,该闭环系统的状态由下述切换系统控制:
Figure RE-GDA0003975214420000103
其中,
Figure RE-GDA0003975214420000104
为提升控制器增益;
Figure RE-GDA0003975214420000105
Figure RE-GDA0003975214420000106
为提升系统矩阵。上述系统即为跟踪误差的闭环提升系统。
S213,根据预先收集的每个智能体i输入-状态数据
Figure RE-GDA0003975214420000107
进一步,跟踪误差的定义计算并收集跟踪误差数据
Figure RE-GDA0003975214420000108
按如下方式堆叠以形成矩阵:
Δi:=[δi(0)δi(1)…δi(ρ-1)],
Figure RE-GDA0003975214420000109
Figure 2
Figure RE-GDA00039752144200001011
S214,定义能够解释智能体i的数据
Figure RE-GDA00039752144200001012
的所有提升矩阵As,B s所在的集合为
Figure RE-GDA00039752144200001013
其中,s=1时
Figure RE-GDA00039752144200001014
时Es:=I。
S215,通过构造噪声模型,对未知的噪声上界加以限制,具体为:
Figure RE-GDA00039752144200001015
其中,
Figure RE-GDA00039752144200001016
Figure RE-GDA00039752144200001017
为适当维度下的已知
矩阵。s=1时
Figure RE-GDA00039752144200001018
Figure RE-GDA00039752144200001019
S216,基于上述步骤S211、S212、S213、S214、S215,可以得到
基于数据驱动的提升系统参数化表示为:
Figure RE-GDA0003975214420000111
其中,
Figure RE-GDA0003975214420000112
S300,结合基于模型的自触发机制和基于数据的提升系统参数化表示,设计分布式数据驱动自触发通信机制,实现在当前触发时刻仅利用数据预测下一个触发时刻。
在一个实施例中,步骤S300所述分布式数据驱动的自触发通信机制,具体为:
Figure RE-GDA0003975214420000113
其中,数据驱动触发函数设计为:
Figure RE-GDA0003975214420000114
其中,
Figure RE-GDA0003975214420000115
Figure RE-GDA0003975214420000116
Figure RE-GDA0003975214420000117
具体地,所述分布式数据驱动的自触发通信机制设计步骤为:
S311,将步骤S100所述基于模型的分布式自触发通信机制改写为如下二次矩阵不等式:
Figure RE-GDA0003975214420000118
S312,引入一个正定矩阵M,将步骤S200所述的基于数据驱动的提升系统参数化改写为
Figure RE-GDA0003975214420000121
S312,结合S311与S312,利用S-引理,可以得到分布式数据驱动的自触发通信机制,表述为:
考虑所述拓扑图
Figure RE-GDA00039752144200001211
具有领导跟随结构的多智能体系统,以及反馈控制器。对于给定的正常数σ>0,控制器增益K,触发矩阵Φ>0,以及智能体i最新传输的状态
Figure RE-GDA0003975214420000122
如果存在一个参数α>0和一个矩阵M>0,那么下述线性矩阵不等式对i=1,2,…,N和
Figure RE-GDA0003975214420000123
成立:
Figure RE-GDA0003975214420000124
S400,建立基于数据的稳定性判据,用于联合设计控制器增益矩阵和触发矩阵,实现对所述未知模型多智能体系统的数据驱动自触发一致性跟踪控制。
在一个实施例中,步骤S400所述基于数据的稳定性判据,具体为:
考虑所述的拓扑图
Figure RE-GDA0003975214420000125
和具有领导跟随结构的多智能体系统,对于给定的正常数σ>0和∈,对于所有[AB]∈∑i,如果存在参数β>0,以及矩阵P>0,Φ> 0,G和KG,对i=1,2,…,N满足以下线性矩阵不等式,那么对于任何初始状态,在所述的分布式反馈控制器和权力要求4所述的分布式自触发通信机制的作用下,网络中所有跟随者状态均可以渐近跟踪上领导者状态。此外,反馈增益矩阵设计为K=KGG-1
Figure RE-GDA0003975214420000126
其中,
Lκ:=[0n×(κ-1)n,In,0n×(3-κ)n],κ=1,2,3,
Figure RE-GDA0003975214420000127
Figure RE-GDA0003975214420000128
Figure RE-GDA0003975214420000129
Figure RE-GDA00039752144200001210
Ui:=[ui(1)ui(2)…ui(ρ-1)],Δi+:=[δi(1)δi(2)…δi(ρ)]
具体地,控制器增益矩阵和触发矩阵的联合设计方法设计步骤为:
S411,针对所述的多智能体系统,构建基于数据的系统参数化表示,如下:
Figure RE-GDA0003975214420000131
其中,
Figure RE-GDA0003975214420000132
Δi+:=[x(1) x(2)…x(ρ)],
Δi:=[x(1) x(2)…x(ρ-1)],Ui:=[u(1) u(2)…u(ρ-1)]。
S412,跟踪误差闭环系统
Figure RE-GDA0003975214420000133
令δi(t)=Gsi(t),其中
Figure RE-GDA0003975214420000134
为非奇异矩阵。对于
Figure RE-GDA0003975214420000135
上述跟踪误差系统的动力学可以被改写为:
Figure RE-GDA0003975214420000136
其中,
Figure RE-GDA0003975214420000137
Figure RE-GDA0003975214420000138
KG=KG。上述两个系统具有相同的稳定性特性。对于所有i=1,2,…,N,当且仅当s(t)=0时,即δ(t)=0时,有xi(t)-x0(t)=0。换言之,如果每个智能体的不一致向量渐近收敛到零,则该多智能体系统可以实现状态渐近一致。由此,多智能体系统的一致性问题便转化为了不一致向量的稳定性问题。
S413,基于此,构造李雅普诺夫函数为:
Figure RE-GDA0003975214420000139
其中,P>0。对上述函数求前向差分并放缩,得到以下条件:
Figure RE-GDA00039752144200001310
其中,
Figure RE-GDA00039752144200001311
Figure RE-GDA00039752144200001312
当γ<0时,不一致向量δi(t)渐近收敛到零,即当t→∞时,有xi-x0→0。
S414,结合S411和S413,利用S-引理,可以得到如下基于数据的自触发一致性条件,具体为:
考虑所述的拓扑图
Figure RE-GDA0003975214420000141
和具有领导跟随结构的多智能体系统,对于给定的正常数σ>0和∈,对于所有[A B]∈∑i,如果存在参数β>0,以及矩阵P>0,Φ> 0,G和KG,对i=1,2,…,N满足以下线性矩阵不等式,那么对于任何初始状态,在所述的分布式反馈控制器和权力要求4所述的分布式自触发通信机制的作用下,网络中所有跟随者状态均可以渐近跟踪上领导者状态。此外,反馈增益矩阵设计为K=KGG-1
Figure RE-GDA0003975214420000142
在一个实施例中,通过仿真实验来验证本发明中数据驱动控制策略设计方法的可行性与有效性。
考虑一个由六个跟随者和一个领导者的多倒立摆系统,每个倒立摆的动力学模型为:
Figure RE-GDA0003975214420000143
其中,g=9.8m/s2为重力加速度常数,m和l是每个倒立摆的质量和长度,αi和α0分别是跟随者和领导者的钟摆角度,ui是跟随倒立摆i的控制扭矩。令
Figure RE-GDA0003975214420000144
m=1kg,
Figure RE-GDA0003975214420000145
选择周期Tk=0.02,该连续时域内的线性摆可以用离散时域的多智能体系统来描述,系统矩阵为:
Figure RE-GDA0003975214420000146
进一步,系统控制输入限制为ui(t)∈[-1,1],选定矩阵E=0.01I和参数ρ=80,收集状态数据
Figure RE-GDA0003975214420000147
和输入数据
Figure RE-GDA0003975214420000148
设置矩阵Qd=-I,Sd=0,和
Figure RE-GDA0003975214420000149
可得噪声
Figure RE-GDA00039752144200001410
参数选择为∈=2和σ=0.2。通过求解步骤S400所述的线性矩阵不等式,得到反馈控制器增益矩阵于事件触发矩阵分别为
K=[-3.5061 -1.4648],
Figure RE-GDA0003975214420000151
每个智能体的初始状态设置为x0(0)=[2,-1]T,x1(0)=[-4,2]T,x2(0)= [4,2]T,x3(0)=[2,0]T,x4(0)=[3,-1]T,x5(0)=[-5,-3]T和x6(0)= [2,0.5]T。由此,得到仿真结果如图3和图4所示。图3展示了所有智能体的状态演变轨迹。可以看出,在本发明所述数据驱动控制策略作用下多智能体系统实现了状态一致,证明了所提数据驱动自触发控制方法的有效性。图4给出了每个智能体在所述自触发策略下的通信时刻图,并与传统的连续采样策略进行比较。可以看出,本发明所提出的自触发机制显著减少了通信次数。
以上内容为本发明的较佳实施例而已,本发明包括但不局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (8)

1.一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于包括步骤:
S100,对多智能体系统设计分布式自触发一致性跟踪控制策略,控制策略包含一个状态反馈控制器和一个基于模型的分布式自触发通信机制;
S200,通过离线实验收集多智能体系统的状态数据和输入数据,建立跟踪误差的闭环提升系统,构建数据驱动的提升系统参数化表示;
S300,根据步骤S100中的基于模型的分布式自触发通信机制以及步骤S200中构建的数据驱动的提升系统参数化表示,设计数据驱动的分布式自触发通信机制;
S400,建立基于数据的稳定性判据,并根据建立的基于数据的稳定性判据设计步骤S100中状态反馈控制器中的增益矩阵,同时还设计步骤S300中得到的数据驱动的分布式自触发通信机制的触发矩阵,实现数据驱动的多智能体系统自触发跟踪控制。
2.根据权利要求1所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的多智能体系统是N+1个智能体构成,其中,1个智能体为领导者,N个智能体为跟随者,领导者的动力学模型为:
x0(t+1)=Atrx0(t)
跟随者的动力学模型为:
xi(t+1)=Atrxi(t)+Btrui(t),i=1,2,...,N
其中,
Figure RE-FDA0003975214410000011
表示领导者的状态;
Figure RE-FDA0003975214410000012
Figure RE-FDA0003975214410000013
分别表示跟随者i的状态向量和控制输入,真实系统矩阵Atr,Btr均是恒定的、可镇定和未知的;各智能体之间的连通关系由一个以领导者为根节点的有向生成树
Figure RE-FDA0003975214410000014
来描述。
3.根据权利要求2所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的步骤S100中,状态反馈控制器具体设计如下:
S111,利用局部间歇信息,设计状态反馈控制器,具体为:
Figure RE-FDA0003975214410000021
Figure RE-FDA0003975214410000022
其中,
Figure RE-FDA0003975214410000023
为待设计的反馈增益矩阵;
Figure RE-FDA0003975214410000024
是跟随者i的第k次触发的时刻;aij是邻接矩阵
Figure RE-FDA0003975214410000025
的第i行、第j列的元素。
4.根据权利要求3所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的步骤S100中,基于模型的分布式自触发通信机制的设计如下:
S112,假设领导者未配置触发装置,对于跟随者i,假设
Figure RE-FDA0003975214410000026
是第一次触发时刻,触发时刻序列
Figure RE-FDA0003975214410000027
由下式确定:
Figure RE-FDA0003975214410000028
其中,触发函数设计为:
Figure RE-FDA0003975214410000029
其中,
Figure RE-FDA00039752144100000210
为待设计的正定对称矩阵;σ为正常数;
Figure RE-FDA00039752144100000211
为跟随者i的第k个事件触发间隔;
Figure RE-FDA00039752144100000212
表示在
Figure RE-FDA00039752144100000213
时刻与
Figure RE-FDA00039752144100000214
时刻之间的状态误差;符号T表示矩阵的转置。
5.根据权利要求4所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的步骤S200,构建的数据驱动的提升系统参数化表示表述为:
Figure RE-FDA00039752144100000215
其中,
Figure RE-FDA00039752144100000216
Δi:=[δi(0) δi(1)…δi(ρ-1)],
Figure RE-FDA0003975214410000031
此外,s=1时E1:=E,
Figure RE-FDA0003975214410000032
时Es:=I,
Figure RE-FDA0003975214410000033
为在离散时间点T∈[0,ρ]采集获得状态-输入数据,数据
Figure RE-FDA0003975214410000034
Figure RE-FDA0003975214410000035
根据跟踪误差的定义δi(t):=xi(t)-x0(t)计算后收集得到,
Figure RE-FDA0003975214410000036
Figure RE-FDA0003975214410000037
为适当维度下的已知矩阵。
6.根据权利要求4所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的步骤S300中,数据驱动的分布式自触发通信机制,具体为:
Figure RE-FDA0003975214410000038
其中,数据驱动触发函数设计为:
Figure RE-FDA0003975214410000039
其中,
Figure RE-FDA00039752144100000310
Figure RE-FDA00039752144100000311
Figure RE-FDA00039752144100000312
7.根据权利要求6所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的步骤S300中,数据驱动的提升系统参数化表示的构建步骤为:
S211,在时间间隔T∈{0,1,...,ρ}内,多智能体系统的状态数据
Figure RE-FDA00039752144100000313
和输入数据
Figure RE-FDA00039752144100000314
由下述受干扰的开环系统通过开环实验测量得到:
xi(T+1)=Atrxi(T)+Btrui(T)+Ewi(T)
其中,
Figure RE-FDA00039752144100000315
是一个已知矩阵,用于模拟噪声wi(t)对该系统影响;
S212,定义跟随者i和领导者的跟踪误差δi(t):=xi(t)-x0(t),根据步骤S111中设计的反馈控制器,跟踪误差闭环系统的动力学方程满足:
Figure RE-FDA0003975214410000041
那么,在触发时刻,该闭环系统的状态由下述切换系统控制:
Figure RE-FDA0003975214410000042
其中,
Figure RE-FDA0003975214410000043
为提升控制器增益;
Figure RE-FDA0003975214410000044
Figure RE-FDA0003975214410000045
为提升系统矩阵;
S213,根据预先收集的每个智能体i输入-状态数据
Figure RE-FDA0003975214410000046
跟踪误差的定义计算并收集跟踪误差数据
Figure RE-FDA0003975214410000047
按如下方式堆叠以形成矩阵:
Figure RE-FDA0003975214410000048
Figure 1
Figure RE-FDA00039752144100000410
S214,定义能够解释智能体i的数据
Figure RE-FDA00039752144100000411
的所有提升矩阵AsB s所在的集合为
Figure RE-FDA00039752144100000412
其中,s=1时E1:=E,
Figure RE-FDA00039752144100000413
时Es:=I;
S215,通过构造噪声模型,对未知的噪声上界加以限制,具体为:
Figure RE-FDA00039752144100000414
其中,
Figure RE-FDA00039752144100000415
Figure RE-FDA00039752144100000416
为适当维度下的已知矩阵,s=1时
Figure RE-FDA00039752144100000417
Figure RE-FDA00039752144100000418
S216,得到基于数据驱动的提升系统参数化表示为:
Figure RE-FDA00039752144100000419
其中,
Figure RE-FDA00039752144100000420
8.根据权利要求6所述的一种数据驱动的多智能体系统自触发跟踪控制方法,其特征在于:
所述的步骤S400中,基于数据的稳定性判据,具体为:
考虑所述的拓扑图
Figure RE-FDA0003975214410000051
和具有领导跟随结构的多智能体系统,对于给定的正常数σ>0和∈,对于所有[AB]∈∑i,如果存在参数β>0,以及矩阵P>0,Φ>0,G和KG,对i=1,2,...,N满足以下线性矩阵不等式,那么对于任何初始状态,在所述的分布式反馈控制器和分布式自触发通信机制的作用下,网络中所有跟随者状态均渐近跟踪上领导者状态;
增益矩阵设计为K=KGG-1
Figure RE-FDA0003975214410000052
其中,
Figure RE-FDA0003975214410000053
Figure RE-FDA0003975214410000054
Figure RE-FDA0003975214410000055
Figure RE-FDA0003975214410000056
Ui:=[ui(1) ui(2)...ui(ρ-1)],Δi+:=[δi(1) δi(2)...δi(ρ)]。
CN202211331357.9A 2022-10-28 2022-10-28 一种数据驱动的多智能体系统自触发跟踪控制方法 Pending CN115629544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211331357.9A CN115629544A (zh) 2022-10-28 2022-10-28 一种数据驱动的多智能体系统自触发跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211331357.9A CN115629544A (zh) 2022-10-28 2022-10-28 一种数据驱动的多智能体系统自触发跟踪控制方法

Publications (1)

Publication Number Publication Date
CN115629544A true CN115629544A (zh) 2023-01-20

Family

ID=84908966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211331357.9A Pending CN115629544A (zh) 2022-10-28 2022-10-28 一种数据驱动的多智能体系统自触发跟踪控制方法

Country Status (1)

Country Link
CN (1) CN115629544A (zh)

Similar Documents

Publication Publication Date Title
CN108803349B (zh) 非线性多智能体系统的最优一致性控制方法及系统
CN111722628B (zh) 一种多智能体轨迹更新迭代学习的点到点跟踪控制方法
CN112698634B (zh) 基于事件触发的交通智能体系统固定时间二分一致性方法
CN108388247B (zh) 一种基于有向通信网络的无人车编队驾驶方法
CN113325719B (zh) 时变时滞多智能体的分布式脉冲一致性控制方法及系统
CN113900380A (zh) 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
CN112936286B (zh) 一种多柔性机械臂系统自适应一致性追踪控制方法及系统
Zhang et al. Distributed coordinated control for fixed-wing UAVs with dynamic event-triggered communication
CN115629544A (zh) 一种数据驱动的多智能体系统自触发跟踪控制方法
Zou et al. Distributed output feedback consensus tracking control of multiple nonholonomic mobile robots with directed communication graphs and sensor faults
CN116794987A (zh) 基于事件触发控制的异构多智能体系统一致性控制方法
CN112526886A (zh) 随机试验长度下离散多智能体系统迭代学习编队控制方法
CN114861435B (zh) 有限时间观测器下的多智能体系统一致性滑模控制算法
CN116088317A (zh) 一种基于动态事件触发的多智能体一致性控制方法
CN114594760A (zh) 一种基于动态事件触发的多无人船航向一致性控制方法
CN113031644B (zh) 一种面向通信时滞的飞行器编队控制系统事件触发方法、装置及介质
CN114545777A (zh) 基于改进q函数的多智能体一致性强化学习方法及系统
CN112799367A (zh) 一种基于工业互联网云平台的智能控制系统及方法
CN115657722A (zh) 一种基于事件触发脉冲控制的智能无人集群系统一致性编队控制方法
Chai et al. Sampled-data-based Event-triggered Affine Formation Control for Multi-agent Systems with Intergrator Dynamics
CN114114904B (zh) 一种有限时间和固定时间分布式事件触发一致性方法
Wei et al. Event-triggered containment control for multi-agent systems with switching topology in finite-time
CN116149183A (zh) 一种异构多智能体系统的数据驱动输出同步方法
CN115981166B (zh) 车队安全运行控制方法、系统、计算机设备以及存储介质
CN115008456B (zh) 一种柔性单链机械臂多智能体的跟踪控制方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination