CN116794987A - 基于事件触发控制的异构多智能体系统一致性控制方法 - Google Patents
基于事件触发控制的异构多智能体系统一致性控制方法 Download PDFInfo
- Publication number
- CN116794987A CN116794987A CN202310913880.0A CN202310913880A CN116794987A CN 116794987 A CN116794987 A CN 116794987A CN 202310913880 A CN202310913880 A CN 202310913880A CN 116794987 A CN116794987 A CN 116794987A
- Authority
- CN
- China
- Prior art keywords
- agent
- heterogeneous multi
- control
- order
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000004891 communication Methods 0.000 claims abstract description 13
- 238000005259 measurement Methods 0.000 claims description 10
- 230000001960 triggered effect Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000001228 spectrum Methods 0.000 claims description 2
- 238000000691 measurement method Methods 0.000 abstract description 6
- 238000013459 approach Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Abstract
本发明公开了一种基于事件触发控制的异构多智能体系统一致性控制方法,所述异构多智能体系统含有m个一阶多智能体,N‑m个二阶多智能体,通过加权无向网络进行通信;首先根据所述异构多智能体系统收敛到一致时,智能体的位置收敛到位置的平均值,速度收敛到0,定义位置收敛平均值;然后将所述异构多智能体系统一致性问题转化为稳定性问题,通过分段控制输入率和事件触发控制,实现异构多智能体系统一致性控制。本发明结合了组合测量方法的事件触发控制,继承了一阶二阶异构多智能体系统一致性。减少通信资源损耗。矩阵Q的条件为其最小奇异值大于0,以减少事件触发条件的保守性。
Description
技术领域
本发明属于分布式控制技术领域,涉及一种多智能体系统一致性控制方法,具体涉及一种基于事件触发控制的异构多智能体系统一致性控制方法。
背景技术
多智能体系统的分布式协调控制由于其在编队控制、集群控制和蜂拥控制等方面的广泛应用而得到了广泛的关注。集中式控制对比于分布式控制,要求每个节点都能有一个与中央控制器有着优良连接的网络通信,但是实际应用中由于通信延迟等因素的影响,集中式控制往往难以良好地实现预定的控制效果,并且由于可能存在的单点故障,集中式控制所发生故障的概率比分布式控制较高。分布式控制减少了集中式控制中中央控制器和各节点的通信时滞的影响,使系统能够适应动态变化的运行环境,减少了对全局通信的依赖,提高了系统的容错率和鲁棒性。
一致性问题作为最基本的分布式协调控制问题之一,是控制系统理论和图论的交叉领域,它是涉及一系列智能体通过信息交互与共享来达到共同目标的过程。一致性指的是智能体系统的各个状态随着时间的推移最终在某一时刻都趋近于同一个值,这种状态可以是卫星的运动姿态、鱼群或鸟群的行动方向、数据融合或者分布式传感器的滤波值。
目前,一致性问题的研究,主要成果集中在一阶系统、二阶系统、高阶系统和异构系统的协同一致性控制。“Distributed event-triggered control of multi-agentsystems with combinational measurements”提出了一种组合测量方法的事件触发控制,区别于以往的事件触发控制,智能体只在它们自己的事件时间触发而不用考虑邻居的触发时刻,这在实践中减少了通信量,降低了控制器更新的频率。该方案提供了一个方法的可行性,但是并未考虑一阶二阶异构多智能体系统。“Distributed event-triggeredconsensus control for leaderless heterogeneous multiagent systems”使用分布式事件触发控制方法,控制一阶二阶异构多智能体系统使其位置达到平均一致,速度收敛到0,排除了系统的zeno行为,但是该方案没有考虑组合测量方法的事件触发控制,不能更好的减轻控制输入更新的能量消耗。
发明内容
为了解决上述技术问题,本发明提供了一种基于事件触发控制的异构多智能体系统一致性控制方法。
本发明的方法所采用的技术方案是:一种基于事件触发控制的异构多智能体系统一致性控制方法,所述异构多智能体系统含有m个一阶多智能体,N-m个二阶多智能体,通过加权无向网络进行通信;
首先根据所述异构多智能体系统收敛到一致时,智能体的位置收敛到位置的平均值,速度收敛到0,定义位置收敛平均值;然后将所述异构多智能体系统一致性问题转化为稳定性问题,通过分段控制输入率和事件触发控制,实现异构多智能体系统一致性控制。
本发明还提供了一种基于事件触发控制的异构多智能体系统一致性控制系统,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的基于事件触发控制的异构多智能体系统一致性控制方法。
本发明还提供了一种存储介质,存储有程序,所述程序被处理器执行时,实现所述的基于事件触发控制的异构多智能体系统一致性控制方法。
与现有技术相比,本发明的优点是:
(1)结合了组合测量方法的事件触发控制,继承了一阶二阶异构多智能体系统一致性,减少通信资源损耗。
(2)矩阵Q的条件为其最小奇异值大于0,以减少事件触发条件的保守性。
附图说明
下面使用实施例,以及具体实施方式作进一步说明本文的技术方案。另外,在说明技术方案的过程中,也使用了一些附图。对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图以及本发明的意图。
图1为本发明实施例的多智能体系统拓扑图;
图2为本发明实施例的位置状态更新图;
图3为本发明实施例的速度状态更新图;
图4为本发明实施例的控制输入更新图;
图5为本发明实施例的异构多智能体触发次数图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供的一种基于事件触发控制的异构多智能体系统一致性控制方法,所述异构多智能体系统含有m个一阶多智能体,N-m个二阶多智能体,通过加权无向网络进行通信;
首先根据所述异构多智能体系统收敛到一致时,智能体的位置收敛到位置的平均值,速度收敛到0,定义位置收敛平均值;然后将所述异构多智能体系统一致性问题转化为稳定性问题,通过分段控制输入率和事件触发控制,实现异构多智能体系统一致性控制。
在一种实施方式中,所述加权无向网络的拓扑图定义为G={V,ε,A},V={V1,V2,...,VN}代表节点集,Vi表示编号为i的智能体,1≤i≤N;代表边集;A=[aij]∈RN×N代表加权邻接矩阵,如果智能体i和智能体j之间存在信息链接则aij=1,否则aij=0;定义D为度矩阵,拉普拉斯矩阵L=D-A;
当i=1,2,...,m时,定义一阶智能体的动力学方程为当i=m+1,m+2,...,N时,定义二阶智能体的动力学方程为/>其中t表示时间;每个智能体都保存自己的状态信息,规定第i个智能体在t时刻的位置状态值为xi(t),后N-m个智能体在t时刻的速度状态值为vi(t);
定义一致性协议:
其中,xi(t)、xj(t)分别表示第i、j个智能体在t时刻的位置状态信息;vi(t)、vj(t)分别表示第i、j个智能体在t时刻的速度状态信息;Im表示N个智能体里面前m个智能体即一阶智能体集合,IN-m表示N个智能体里面后N-m个智能体即二阶智能体集合;bij表示二阶智能体的速度拓扑对应加权邻接矩阵的权重值;α,β是系统的反馈增益满足α>0,β>0;LA=[aij]N×N,LB=[bij](N-m)×(N-m)是位置图Gp和速度图Gv的对应矩阵,j∈Ni是智能体i的邻居集;
定义智能体i的第k个事件触发时刻为分别表示智能体i和j在/>时刻的位置采样状态和速度采样状态,带入式(3)得:
将式(4)代入式(1)和(2)得:
智能体i在其邻居智能体j的组合测量位置和组合测量速度为:
将式(6)代入式(5)得:
定义采样数据测量误差为:
其中ef,x(t)=(e1,x(t),e1,x(t),...,em,x(t))T,es,x(t)=(em+1,x(t),em+2,x(t),...,eN,x(t))T,es,v(t)=(em+1,v(t),em+2,v(t),...,eN,v(t))T,xf(t)=(x1(t),x2(t),...,xm(t))T,xs(t)=(xm+1(t),xm+2(t),...,xN(t))T,vs(t)=(vm+1(t),vm+2(t),...,vN(t))T;
将式(8)带入式(7)得:
式(9)进一步写成:
令则系统重写为矩阵形式:
其中L11、L12、L21、L22表示LA的分块矩阵,L11∈Rm*m,L12∈Rm*(N-m),L21∈R(N-m)*m,L22∈R(N-m)*(N-m)。
由系统的动力学方程知道,一阶二阶异构多智能体系统收敛到一致的时候,智能体的位置收敛到位置的平均值,速度收敛到0;由此定义位置收敛平均值为:
定义一个列向量/>
令系统的误差信号则误差系统为:
当时,/>等价于/>
因此异构多智能体系统(11)的一致性问题转化为研究系统(12)的稳定性问题。
记ε(t)为ε,构造一个Lyapunov函数:
V(t)=εTPε (13);
其中P为一个正定对称矩阵;
对V(t)求导,得:
其中P为正定对称矩阵,定义一个矩阵Q=GTP+PG-PK,存在矩阵P使得svdmin(Q)>0;svdmin(Q)表示矩阵Q最小的奇异值;
定义λmax(P)为矩阵P最大的特征值,||K||为矩阵K的谱范数;则式(14)进一步写成:
强制ei满足当σi∈(0,1)时,得到一个负定的/> 随着时间的推移,一旦条件(16)发生变化,智能体i将发生事件触发;与此同时,该智能体i的测量误差置0,并依据式(4)来更新控制律,否则控制率不变;
依据Lasalle不变原理,定义Lasalle不变集表示/>
进一步得到:
即异构多智能体系统的一致性问题得到解决。
系统(1)和(2)在无向连通拓扑G下,通过分段控制输入率(4)和事件触发函数(16),对于任何初始条件,至少存在一个智能体r∈V,其时间间隔严格为正,下界τr>0。
证明过程如下:定义r=arg maxi||εi||并且认为||ei||≤||e||对所有智能体i成立,可得:定义τr为/>从0增长到/>的时间,τ*为/>从0增长到/>的时间,从以上不等式可得,τr比τ*要大。
定义可得/>假设θ(t,θ0)是等式的解,并且θ(0,θ0)=θ0,因此φ≤θ(t,θ0),最小时间间隔可以通过计算此微分方程的时间得到:/>
假设此系统在第一次事件触发时启动,所以θ0=0,否则系统将不断演化,至少对于一个智能体,其绝对测量误差将在不复位的情况下增加。
定义τ是等式(17)的解,可得令则任意两个智能体之间的最小时间间隔显然τ*>0,证明了事件不会无限触发,因此排除了芝诺行为。
以下通过实验对本发明最进一步的阐述。
本实验考虑以下系统:其拓扑图如图1所示。
其中智能体1和2为一阶积分智能体,智能体3和4为二阶积分智能体。其中位置拓扑的拉普拉斯矩阵LA和LB分别为:反馈增益α=1,β=1,系统位置初始状态为x=(2,-1,-2,3)T,速度初始状态为v=(-1,1)T,参数δ设置为δ1=δ2=δ3=δ4=δ5=δ6=0.9。图2和图3分别表示智能体的位置和速度达到一致。图4表示系统的控制输入,由图4可以看出当智能体达到共识目标后,智能体的控制协议为0。图5显示每个智能体的触发次数,通过仿真将时间戳[0s,10s]分成1000个区间,每个区间h=0.01s,每个智能体的触发次数分别为47次、47次、81次、81次,如果系统没有事件触发,则控制更新至少需要更新1000次,从图5可以看出输入更新的次数有效减少了。
本发明实现了一种组合测量方法的事件触发控制的一阶二阶异构多智能体一致性,组合测量方法的事件触发控制减少了通信资源损耗,其关键点如下:
1.反馈增益α,β,设计的常数σi都控制在合理范围内。
2.智能体只在它们自己的事件时间触发而不用考虑邻居的触发时刻,减少了通信频率和能源消耗,避免了“芝诺”现象。
3.讨论一阶二阶异构多智能体系统模型,更符合实际中的一些情况。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (5)
1.一种基于事件触发控制的异构多智能体系统一致性控制方法,其特征在于:所述异构多智能体系统含有m个一阶多智能体,N-m个二阶多智能体,通过加权无向网络进行通信;
首先根据所述异构多智能体系统收敛到一致时,智能体的位置收敛到位置的平均值,速度收敛到0,定义位置收敛平均值;然后将所述异构多智能体系统一致性问题转化为稳定性问题,通过分段控制输入率和事件触发控制,实现异构多智能体系统一致性控制。
2.根据权利要求1所述的基于事件触发控制的异构多智能体系统一致性控制方法,其特征在于:所述加权无向网络的拓扑图定义为G={V,ε,A},V={V1,V2,...,VN}代表节点集,Vi表示编号为i的智能体,1≤i≤N;代表边集;A=[aij]∈RN×N代表加权邻接矩阵,如果智能体i和智能体j之间存在信息链接则aij=1,否则aij=0;定义D为度矩阵,拉普拉斯矩阵L=D-A;
当i=1,2,...,m时,定义一阶智能体的动力学方程为(1);当i=m+1,m+2,...,N时,定义二阶智能体的动力学方程为/>(2);其中t表示时间;每个智能体都保存自己的状态信息,规定第i个智能体在t时刻的位置状态值为xi(t),后N-m个智能体在t时刻的速度状态值为vi(t);
定义一致性协议:
其中,xi(t)、xj(t)分别表示第i、j个智能体在t时刻的位置状态信息;vi(t)、vj(t)分别表示第i、j个智能体在t时刻的速度状态信息;Im表示N个智能体里面前m个智能体即一阶智能体集合,IN-m表示N个智能体里面后N-m个智能体即二阶智能体集合;bij表示二阶智能体的速度拓扑对应加权邻接矩阵的权重值;α,β是系统的反馈增益满足α>0,β>0;LA=[aij]N×N,LB=[bij](N-m)×(N-m)是位置图Gp和速度图Gv的对应矩阵,j∈Ni是智能体i的邻居集;
定义智能体i的第k个事件触发时刻为分别表示智能体i和j在/>时刻的位置采样状态和速度采样状态,带入式(3)得:
将式(4)代入式(1)和(2)得:
智能体i在其邻居智能体j的组合测量位置和组合测量速度为:
将式(6)代入式(5)得:
定义采样数据测量误差为:
其中ef,x(t)=(e1,x(t),e1,x(t),...,em,x(t))T,es,x(t)=(em+1,x(t),em+2,x(t),...,eN,x(t))T,es,v(t)=(em+1,v(t),em+2,v(t),...,eN,v(t))T,xf(t)=(x1(t),x2(t),...,xm(t))T,xs(t)=(xm+1(t),xm+2(t),...,xN(t))T,vs(t)=(vm+1(t),vm+2(t),...,vN(t))T;
将式(8)带入式(7)得:
式(9)进一步写成:
令则系统重写为矩阵形式:
其中L11、L12、L21、L22表示LA的分块矩阵,L11∈Rm*m,L12∈Rm*(N-m),L21∈R(N-m)*m,L22∈R(N-m)*(N-m);
由系统的动力学方程知道,一阶二阶异构多智能体系统收敛到一致的时候,智能体的位置收敛到位置的平均值,速度收敛到0;由此定义位置收敛平均值为:定义一个列向量/>
令系统的误差信号则误差系统为:
当时,/>等价于/> 因此异构多智能体系统(11)的一致性问题转化为研究系统(12)的稳定性问题。
3.根据权利要求2所述的基于事件触发控制的异构多智能体系统一致性控制方法,其特征在于:
构造一个Lyapunov函数:
V(t)=εT(t)Pε(t) (13);
其中P为一个正定对称矩阵,记ε(t)为ε;
对V(t)求导,得:
定义一个矩阵Q=GTP+PG-PK,存在矩阵P使得svdmin(Q)>0;svdmin(Q)表示矩阵Q最小的奇异值;
定义λmax(P)为矩阵P最大的特征值,||K||为矩阵K的谱范数;则式(14)进一步写成:
强制ei满足当σi∈(0,1)时,得到一个负定的/> 随着时间的推移,一旦条件(16)发生变化,智能体i将发生事件触发;与此同时,该智能体i的测量误差置0,并依据式(4)来更新控制律,否则控制率不变;
依据Lasalle不变原理,定义Lasalle不变集 表示/>
进一步得到:
即异构多智能体系统的一致性问题得到解决。
4.一种基于事件触发控制的异构多智能体系统一致性控制系统,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至3中任一项所述的基于事件触发控制的异构多智能体系统一致性控制方法。
5.一种存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1至3中任一项所述的基于事件触发控制的异构多智能体系统一致性控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310913880.0A CN116794987A (zh) | 2023-07-24 | 2023-07-24 | 基于事件触发控制的异构多智能体系统一致性控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310913880.0A CN116794987A (zh) | 2023-07-24 | 2023-07-24 | 基于事件触发控制的异构多智能体系统一致性控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116794987A true CN116794987A (zh) | 2023-09-22 |
Family
ID=88036831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310913880.0A Pending CN116794987A (zh) | 2023-07-24 | 2023-07-24 | 基于事件触发控制的异构多智能体系统一致性控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116794987A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687345A (zh) * | 2024-02-01 | 2024-03-12 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
CN117687345B (zh) * | 2024-02-01 | 2024-05-14 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
-
2023
- 2023-07-24 CN CN202310913880.0A patent/CN116794987A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117687345A (zh) * | 2024-02-01 | 2024-03-12 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
CN117687345B (zh) * | 2024-02-01 | 2024-05-14 | 北京中关村实验室 | 多智能体系统的控制方法及相关产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jing et al. | Consensus of multiagent systems with distance-dependent communication networks | |
CN112631335B (zh) | 一种基于事件触发的多四旋翼无人机固定时间编队方法 | |
CN113110039B (zh) | 一种多智能体系统的有限时间分布式聚合优化方法 | |
Huang et al. | Distributed backstepping-based adaptive fuzzy control of multiple high-order nonlinear dynamics | |
Wang et al. | Adaptive cooperative control for a class of nonlinear multi-agent systems with dead zone and input delay | |
Chu et al. | Consensus of multiagent systems with relative state saturations | |
Dai et al. | Event-triggered exponential synchronization of complex dynamical networks with cooperatively directed spanning tree topology | |
Cui et al. | Simplified optimized finite-time containment control for a class of multi-agent systems with actuator faults | |
CN115033013A (zh) | 具有输入约束的多无人机固定时间分布式编队控制方法 | |
Sun et al. | Consensus for multiagent systems under output constraints and unknown control directions | |
Li et al. | Learning-observer-based adaptive tracking control of multiagent systems using compensation mechanism | |
Hou et al. | Event-triggered integral sliding mode formation control for multiple quadrotor UAVs with unknown disturbances | |
Li et al. | Output-constrained control of non-affine multi-agent systems with actuator faults and unknown dead zones | |
CN116794987A (zh) | 基于事件触发控制的异构多智能体系统一致性控制方法 | |
Zhang et al. | Dynamic event-triggered consensus control for multi-agent systems using adaptive dynamic programming | |
CN113110058B (zh) | 一种通信受限的多智能体系统二分实用一致性控制方法 | |
Chen et al. | Fully distributed event-triggered semi-global consensus of multi-agent systems with input saturation and directed topology | |
CN113031644B (zh) | 一种面向通信时滞的飞行器编队控制系统事件触发方法、装置及介质 | |
CN115657722A (zh) | 一种基于事件触发脉冲控制的智能无人集群系统一致性编队控制方法 | |
CN113867150A (zh) | 一种具有饱和输入的多智能体的事件驱动控制方法 | |
Wang et al. | Event-Triggered-Based Consensus Neural Network Tracking Control for Nonlinear Pure-Feedback Multiagent Systems With Delayed Full-State Constraints | |
Li et al. | Observer-based adaptive fuzzy distributed control of non-affine multi-agent systems with input quantization | |
Zhou et al. | Estimator‐based adaptive neural network control of leader‐follower high‐order nonlinear multiagent systems with actuator faults | |
CN114114904B (zh) | 一种有限时间和固定时间分布式事件触发一致性方法 | |
Wang et al. | Trajectory and Attitude Cooperative Formation Control for Air-Ground Collaborative Systems under Communication Faults |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |