CN112379596A - 基于rbf神经网络的异构多智能体系统协同容错控制方法 - Google Patents

基于rbf神经网络的异构多智能体系统协同容错控制方法 Download PDF

Info

Publication number
CN112379596A
CN112379596A CN202011284966.4A CN202011284966A CN112379596A CN 112379596 A CN112379596 A CN 112379596A CN 202011284966 A CN202011284966 A CN 202011284966A CN 112379596 A CN112379596 A CN 112379596A
Authority
CN
China
Prior art keywords
agent
heterogeneous multi
neural network
rbf neural
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011284966.4A
Other languages
English (en)
Other versions
CN112379596B (zh
Inventor
张柯
任意
姜斌
丁勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202011284966.4A priority Critical patent/CN112379596B/zh
Publication of CN112379596A publication Critical patent/CN112379596A/zh
Application granted granted Critical
Publication of CN112379596B publication Critical patent/CN112379596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于RBF神经网络的异构多智能体系统协同容错控制方法:首先,假设所有的智能体都可以获得预定的运动轨迹和速度,通过异构多智能体间的通讯链接,构建异构多智能体系统通讯拓扑并以有向图表示,并计算出拉普拉斯矩阵;然后,具体分析每个智能体的动力学方程,在考虑执行器的乘性故障和加性故障的情况下,形成形式统一的二阶动态方程;基于RBF神经网络自适应理论和通讯网络链接的设计异构多智能体系统的协同容错控制器,基于一致性理论得到异构多智能体系统的全局动态方程,实现系统的协同容错控制。本发明克服了异构多智能体系统因内部智能体结构的不同导致难以协同容错控制的问题,使系统具有较强的鲁棒性和抗扰动性。

Description

基于RBF神经网络的异构多智能体系统协同容错控制方法
技术领域
本发明涉及一种基于RBF神经网络的异构多智能体系统协同容错控制方法,属于异构多 智能体系统技术领域。
背景技术
近年来,无人作战系统作为改变未来战争模式的颠覆性技术装备,在世界范围内得到飞 速发展,已经成为国家间军事博弈的重要力量。面向未来作战应用需求,以无人机与无人车 组成的异构无人集群系统具有重要的研究价值。
由于无人机和无人车的异构特性,编队控制的困难度急剧增加。无人机与无人车之间存 在巨大差异,例如,二者有不同的工作空间、不同的动力学特性、不同的速度限制,这些差 异不仅仅体现在数学模型的差异上,更让控制系统难于统一处理。同时,二者模型的差异又 导致了控制目标量的不一致,进一步增加了编队控制系统的设计难度。受制于这些困难,目 前无人机和无人车协同控制的精度低且可靠性差,现有编队控制方法不能有效地指导工程应 用。同时,无人作战系统实现任务的前提是每个智能体本身能够正常运行,一旦在运行中某 个或多个智能体发生执行器故障,就可能因控制律不能完整的被执行而导致整体任务失败。 由于多智能体之间相互连接,单个智能体的故障很可能影响整个系统,甚至导致整个系统崩 溃,无法完成任务,造成巨大的损失,但是目前这个方向的研究尚少,因此异构智能体系统 的容错控制具有重要的现实意义。
发明内容
为了解决上述背景技术提出的技术问题,本发明旨在提供基于RBF神经网络的异构多智 能体系统协同容错控制方法,克服因智能体不同导致难以实现协同容错控制的问题。
本发明为解决上述技术问题采用以下技术方案:
基于RBF神经网络的异构多智能体系统协同容错控制方法,包括如下步骤:
(1)设定所有的智能体都能够获得预定的运动轨迹和速度,通过异构多智能体间的通讯 链接,构建异构多智能体系统的通讯拓扑并以有向图表示,计算出拉普拉斯矩阵L;
(2)根据每个智能体的动力学方程,针对方程中难以处理的非线性项、模型不确定性和 外界扰动进行处理,在考虑执行器的乘性故障和加性故障的情况下,形成统一二阶动态方程 形式的每个智能体带有故障的模型;
(3)基于RBF神经网络自适应理论和通讯网络链接,设计异构多智能体系统的协同容 错控制器,基于一致性理论得到异构多智能体系统的全局动态方程,实现系统的协同容错控 制。
进一步,在步骤(1)中,采用G={V,E,A}表示异构多智能体系统的通讯拓扑;其中,V={v1,v2,…,vN}表示智能体集合,vi表示第i个智能体,i=1,2,…,N,N表示智能体数 量,E=[eij]表示智能体之间的通讯链接集合,eij=(vi,vj)表示vi能够获取第j个智能体vj的信息,j=1,2,…,N;A=[aij]∈RN×N为权值非负的邻接矩阵,如果(vi,vj)∈E则 aij>0,否则aij=0;定义G的入度矩阵D=diag(degin(v1),degin(v2),…,degin(vN)),
Figure BDA0002782057250000021
拉普拉斯矩阵L=[lij]∈RN×N,L=D-A。
如果从每个智能体都有到其他智能体的一条有向路径,则有向图G为强连通图,下面三 个推论成立:
i.0为L的一个特征值,其余为N-1个具有正实部特征值。
ii.存在一个正向量ζ=[ζ1,ζ2,…,ζN]T,且满足
Figure BDA0002782057250000022
和ζTL=0。
iii.令A=diag{ζ1,ζ2,…,ζN},可得
Figure BDA0002782057250000023
Figure BDA0002782057250000024
相当于一个无向连通图的 拉普拉斯矩阵。对于任一正的列向量μ∈RN×1,如下不等式成立:
Figure BDA0002782057250000025
其中,
Figure BDA00027820572500000213
代表一个N维列向量,
Figure BDA0002782057250000026
Figure BDA0002782057250000027
的最小非零特征值。
进一步,步骤(2)中第i个智能体带有故障的模型表示为如下的二阶动态方程:
Figure BDA0002782057250000028
其中,n为向量维度,xi(t)∈Rn、vi(t)∈Rn
Figure BDA0002782057250000029
分别代表t时刻第i个智能体 的位置、速度和带有未知故障的控制输入向量;
Figure BDA00027820572500000210
ρi(t)=diag{ρi1(t),ρi2(t),…,ρin(t)},bi(t)=[bi1(t),bi2(t),…,bin(t)]T,0<pik(t)≤1和 bik(t)分别表示t时刻第i个智能体的执行器第k个通道未知效率因子和输出偏差, 0<ρ i≤ρi(t)≤1,
Figure BDA00027820572500000211
ρ i为ρi(t)的下界,
Figure BDA00027820572500000212
为bi(t)的上界;t 时刻第i个智能体模型中的非线性项和小确定性项综合表示为 fi(*,t)=[f1(*,t),f2(*,t),…,fn(*,t)]T;di(t)=[di1(t),di2(t),…,din(t)]T表示t时刻第i 个智能体受到的外界扰动。
进一步,第i个智能体带有故障的模型包含如下的故障模式:
1)ρi(t)=1且bi(t)≠0:代表执行器只有加性故障;
2)0<ρi(t)<1且bi(t)=0:代表执行器只有乘性故障;
3)0<ρi(t)<1且bi(t)≠0:代表执行器既有乘性故障又有加性故障。
进一步,步骤(3)中异构多智能体系统的协同容错控制器如下:
Figure BDA0002782057250000031
Figure BDA0002782057250000032
其中,ui(t)表示t时刻第i个智能体的控制输入向量,
Figure BDA0002782057250000033
表示t时刻第i个智能体的自适应 参数且其初始值为正实数;ei(t)表示t时刻第i个智能体的编队状态误差;t时刻第i个智能 体的预定的时变队形指令表示为hi(t)=[hxi(t),hvi(t)]T,hxi(t)和hvi(t)分别表示hi(t)的位置 和速度分量,且满足
Figure BDA0002782057250000034
ci、σi为第i个智能体中控制器所需的参数,且都 为正实数;f(ei(t))表示基于有界层理论所设计的符号函数,
Figure BDA0002782057250000035
表示第i个智能体控制器中 有界层的值,满足
Figure BDA0002782057250000036
Figure BDA0002782057250000037
Figure BDA0002782057250000038
表示t时刻第i个智能体中 RBF神经网络的自适应权值向量,Φi(t)表示t时刻第i个智能体控制器中RBF神经网络的基 函数向量,γi和τi表示第i个智能体控制器中RBF神经网络所需的参数。
上述协同容错控制器可以使异构多智能体系统的状态误差渐进稳定。
进一步,为方便进行分析和解决问题,基于一致性理论得到异构多智能体系统的全局动 态方程,具体为:
令χi(t)=xi(t)-hxi(t),ψi(t)=vi(t)-hvi(t),得
Figure BDA0002782057250000041
Figure BDA0002782057250000042
利用RBF神经网络可以逼近任意非线性函数 的特点来处理g(·),具体公式如下:
Figure BDA0002782057250000043
其中,Φi(t)=[φ1(ei(t)),φ2(ei(t)),…,φl(ei(t))]T,Wi *(t)∈Rl×1表示第i个智能体控制 器中RBF神经网络的最优权值向量,
Figure BDA00027820572500000412
m=1,2,…,l, l表示RBF神经网络隐藏神经元的数量,μm
Figure BDA00027820572500000413
分别表示RBF神经网络高斯基函数的中心 点向量和宽度,ξi(t)为t时刻第i个智能体控制器中RBF神经网络的近似误差,||ξi(t)||≤ε0, ε0是一个很小且有界的正常数。
Figure BDA0002782057250000044
可知当满足
Figure BDA0002782057250000045
和limt→∞ei(t)=0时,可 得limt→∞i(t)-χj(t))=0和limt→∞i(t)-ψj(t))=0。
异构多智能体系统的全局动态方程如下:
Figure BDA0002782057250000046
其中,IN表示N维单位阵,1N表示元素都为1的N维列向量;
Figure BDA0002782057250000047
和e(t)表示异构多智能体系统的两个综合状态误差,
Figure BDA0002782057250000048
Figure BDA0002782057250000049
ρ=diag{ρ1(t),ρ2(t),…,ρN(t)}表示异构多智能体系统的 未知效率因子矩阵;
Figure BDA00027820572500000410
表示异构多智能体系统的自适应参数矩 阵;f(e(t))=[f(e1(t)),f(e2(t)),…,f(eN(t))]T表示异构多智能体系统的有界层函数; Φ(t)=[Φ1(t),Φ2(t),…,ΦN(t)]T表示异构多智能体系统的控制器中RBF神经网络的基函数 输出向量,
Figure BDA00027820572500000411
表示异构多智能体系统的控制器中RBF神 经网络的权值向量,
Figure BDA0002782057250000051
是由异构多智能体系统模型中多项函数 整合成的一个综合函数项。
采用Lyapunov函数的方法对异构多智能体系统的稳定性进行验证,考虑Lyapunov函数 如下:
Figure BDA0002782057250000052
其中,
Figure BDA0002782057250000053
其中
Figure BDA0002782057250000054
为一个正实数;
Figure BDA0002782057250000055
求导可以得到如下形式:
Figure BDA0002782057250000056
利用以下不等式进行化简:
1.
Figure BDA0002782057250000057
2.
Figure BDA0002782057250000058
3.
Figure BDA0002782057250000059
4.
Figure BDA00027820572500000510
其中a为非负实数,c为正实数。
通过进一步化简可得
Figure BDA00027820572500000511
又因为0<ρ≤IN
Figure BDA0002782057250000061
Figure BDA0002782057250000062
其中ρ=min{ρ 1ρ 2,…,ρ N},可得:
Figure BDA0002782057250000063
利用以下不等式继续化简:
1.eTPξ≤eTξ≤δ1||e||21,其中δ1为正实数,
Figure BDA0002782057250000064
且||ξ(t)||≤ε0
2.
Figure BDA0002782057250000065
其中δ2为正实数,
Figure BDA0002782057250000066
3.
Figure BDA0002782057250000067
4.
Figure BDA0002782057250000068
5.
Figure BDA0002782057250000069
其中
Figure BDA00027820572500000615
Figure BDA00027820572500000610
通过化简最终可得:
Figure BDA00027820572500000611
其中,α=min{λ1,λ2,λ3},
Figure BDA00027820572500000612
Figure BDA00027820572500000613
λ3=κ,
Figure BDA00027820572500000614
δ=δ12,ε=ε12
证明完毕。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明基于RBF神经网 络自适应的理论知识设计了异构多智能体系统的协同容错控制器,利用所设计的控制器可以 克服因智能体不同导致难以协同控制的问题,同时保证系统中的智能体在受到外界干扰、执 行器的乘性故障和加性故障的情况下,既可以快速跟踪预定的运动指令,还可以保证系统整 体稳定完成预定的编队队形。本发明所设计的控制器具有很强的鲁棒性和抗扰动性。
附图说明
图1是本发明的流程图;
图2是有向图G;
图3至图6是无人车1~4与预定指令之间的状态误差图;
图7和图8是四旋翼无人机1~2与预定指令之间的状态误差图;
图9至图12是无人车1~4与邻居之间的状态误差图;
图13和图14是四旋翼无人机1~2与邻居之间的状态误差图;
图15和图16是异构智能体系统预定的运动轨迹图和实际的运动轨迹图;
图17是无人车1~4和无人机1~2在xoY平面内预定的队形及运动轨迹;
图18是无人车1~4和无人机1~2在xoY平面内t=80s时实际的队形及80s内的实际运 动轨迹。
具体实施方式
本发明以如下的4辆无人小车和2架四旋翼无人机为实施对象,其中x(t)=[x,y,z]T, x、y和z分别代表无人器的x轴、y轴和z轴方向的位移;v(t)=[vx,vv,vz]T,vx、vy和 vz分别代表无人器的x轴、y轴和z轴方向的速度;u(t)=[ux,uy,uz]T,ux、uy和uz分别 代表无人器的x轴、y轴和z轴方向的控制输入。针对无人机和无人车的运动维度不同,为 方便协同控制,默认无人车的z轴方向的位移、速度和控制输入都为0。
考虑如下的无人器的动态方程:
Figure BDA0002782057250000071
其中,取n=3,xi(t)∈Rn、vi(t)∈Rn和ui(t)∈Rn分别代表第i个智能体的位置、速度和控 制输入向量。令带有故障的控制输入表示为
Figure BDA0002782057250000072
ρi(t)和bi(t)分别代 表第i个智能体执行器的未知效率因子和输出偏差,第i个智能体模型中的非线性项和模型不 确定性项综合表示为fi(*,t);di(t)代表第i个智能体受到的外界扰动。
首先,构建异构多智能体系统的通讯链接图,并以有向图G表示。如图2所示,1-4表示异构智能体系统中的4辆无人车,5和6表示系统中的2架四旋翼无人机。拉普拉斯矩阵L如下:
Figure BDA0002782057250000081
智能体预定的队形指令为hi(t)=[hxi(t),hvi(t)]T,其中 hxi(t)=[r sin(ωt+π(i-1)/3)r cos(ωt+π(i-1)/3)]T,i=1,2,…,6,其中r=16, ω=0.3,且满足
Figure BDA0002782057250000082
四旋翼无人机1~2的z轴方向的指令为zi=0.5·i·t, i=1,2,具体表现为无人车1~4和无人机1~2在xoy平面上按照正六边形的队形进行圆周运 动,且无人机1~2以不同的速度螺旋上升。
1.第一个无人车的初始状态和相关参数:
x1(t0)=[5 5]T;v1(t0)=[0 0]T;d1(t)=[sin t cos t]T;c1=5;σ1=0.5;
Figure BDA0002782057250000083
γ1=10;τ1=0.05;神经元个数l=11。
2.第二个无人车的初始状态和相关参数:
x2(t0)=[5 -5]T;v2(t0)=[0 0]T;d2(t)=[sin t cos t]T;c2=30;σ2=0.2;
Figure BDA0002782057250000084
γ2=50;τ2=0.01;神经元个数l=11。
3.第三个无人车的初始状态和相关参数:
x3(t0)=[-5 -5]T;v3(t0)=[0 0]T;d3(t)=[sin t cos t]T;c3=50;σ3=0.1;
Figure BDA0002782057250000085
γ3=50;τ3=0.01;神经元个数l=11。
4.第四个无人车的初始状态和相关参数:
x4(t0)=[-5 5]T;v4(t0)=[0 0]T;d4(t)=[sin t cos t]T;c4=30;σ4=0.5;
Figure BDA0002782057250000091
γ4=50;τ4=0.01;神经元个数l=11。
5.第一个四旋翼无人机的初始状态和相关参数:
x5(t0)=[-10 2 0]T;v5(t0)=[0 0 0]T;d5(t)=[sin t cos t0]T;c5=50;σ5=0.2;
Figure BDA0002782057250000092
γ3=50;τ3=0.01;神经元个数l=11。
6.第二个四旋翼无人机的初始状态和相关参数:
x6(t0)=[0 10 0]T;v6(t0)=[0 0 0]T;d6(t)=[sin t cos t 0]T;c6=50;σ6=0.2;
Figure BDA0002782057250000093
γ6=50;τ6=0.01;神经元个数l=11。
t0表示初始时刻,
Figure BDA0002782057250000094
Figure BDA0002782057250000095
分别代表无人车1、3和四旋翼无人机1故障发生的时刻,令
Figure BDA0002782057250000096
无人车2、无人车4和无人机2无故障。具体故障参数表示如下:
ρ1(t)=diag{ρ11,ρ12},ρ1i∈[0.5,1];b1(t)=[b11 b12]T,b1i∈[-1,1];
ρ3(t)=diag{ρ31,ρ32},ρ3i∈[0.5,1];b3(t)=[b31 b32]T,b3i∈[-1,1];
ρ5(t)=diag{ρ51,ρ52,ρ53},ρ5i∈[0.5,1];b5(t)=[b51 b52 b53]T,b5i∈[-1,1]。
为验证本发明协同容错控制方法的效果,应用matlab中的simulink模板进行仿真验证。 图3至图8中的曲线分别表示无人车1~4和四旋翼无人机1~2与预定指令之间的状态误差 (χi(t))图;图9至图14中的曲线分别表示无人车1-4和四旋翼无人机1-2与邻居之间的 状态误差(ei(t))图;图15和图16分别为异构智能体系统预定的运动轨迹图和实际的运动 轨迹图,图17为无人车1~4和无人机1~2在xoY平面内预定的队形及运动轨迹,图18为无 人车1~4和无人机1~2在xoY平面内t=80s时实际的队形及80s内的实际运动轨迹。
从仿真结果可以看出,利用所设计的异构多智能体协同控制器,可以使分别处于任意初 始位置的智能体,在短时间内按照预定的编队指令进行协同运动,而且当系统中的一个或多 个智能体发成执行器故障和受到外界干扰时,仍然可以保证稳定。本发明对于异构多智能体 系统协同容错控制的相关研究方面具有重要的参考价值和实际应用价值。
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明 提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (6)

1.基于RBF神经网络的异构多智能体系统协同容错控制方法,其特征在于,包括如下步骤:
(1)设定所有的智能体都能够获得预定的运动轨迹和速度,通过异构多智能体间的通讯链接,构建异构多智能体系统的通讯拓扑并以有向图表示,计算出拉普拉斯矩阵;
(2)根据每个智能体的动力学方程,在考虑执行器的乘性故障和加性故障的情况下,形成统一二阶动态方程形式的每个智能体带有故障的模型;
(3)基于RBF神经网络自适应理论和通讯网络链接,设计异构多智能体系统的协同容错控制器,基于一致性理论得到异构多智能体系统的全局动态方程,实现系统的协同容错控制。
2.如权利要求1所述的基于RBF神经网络的异构多智能体系统协同容错控制方法,其特征在于,在步骤(1)中,采用G={V,E,A}表示异构多智能体系统的通讯拓扑;其中,V={v1,v2,…,vN}表示智能体集合,vi表示第i个智能体,i=1,2,…,N,N表示智能体数量,E=[eij]表示智能体之间的通讯链接集合,eij=(vi,vj)表示vi能够获取第j个智能体vj的信息,j=1,2,…,N;A=[aij]为权值非负的邻接矩阵,如果(vi,vj)∈E则aij>0,否则aij=0;G的入度矩阵D=diag(degin(v1),degin(v2),…,degin(vN)),
Figure FDA0002782057240000011
拉普拉斯矩阵L=[lij]=D-A。
3.如权利要求1所述的基于RBF神经网络的异构多智能体系统协同容错控制方法,其特征在于,步骤(2)中第i个智能体带有故障的模型表示为如下的二阶动态方程:
Figure FDA0002782057240000012
其中,n为向量维度,xi(t)∈Rn、vi(t)∈Rn
Figure FDA0002782057240000013
分别代表t时刻第i个智能体的位置、速度和带有未知故障的控制输入向量;
Figure FDA0002782057240000014
ρi(t)=diag{ρi1(t),ρi2(t),…,ρin(t)},bi(t)=[bi1(t),bi2(t),…,bin(t)]T,0<ρik(t)≤1和bik(t)分别表示t时刻第i个智能体的执行器第k个通道未知效率因子和输出偏差,0<ρ i≤ρi(t)≤1,
Figure FDA0002782057240000015
ρ i为ρi(t)的下界,
Figure FDA0002782057240000016
为bi(t)的上界;t时刻第i个智能体模型中的非线性项和不确定性项综合表示为fi(*,t)=[f1(*,t),f2(*,t),…,fn(*,t)]T;di(t)=[di1(t),di2(t),…,din(t)]T表示t时刻第i个智能体受到的外界扰动。
4.如权利要求3所述的基于RBF神经网络的异构多智能体系统协同容错控制方法,其特征在于,第i个智能体带有故障的模型包含如下的故障模式:
1)ρi(t)=1且bi(t)≠0:代表执行器只有加性故障;
2)0<ρi(t)<1且bi(t)=0:代表执行器只有乘性故障;
3)0<ρi(t)<1且bi(t)≠0:代表执行器既有乘性故障又有加性故障。
5.如权利要求1所述的基于RBF神经网络的异构多智能体系统协同容错控制方法,其特征在于,步骤(3)中异构多智能体系统的协同容错控制器如下:
Figure FDA0002782057240000021
Figure FDA0002782057240000022
其中,ui(t)表示t时刻第i个智能体的控制输入向量,
Figure FDA0002782057240000023
表示t时刻第i个智能体的自适应参数且其初始值为正实数;ei(t)表示t时刻第i个智能体的编队状态误差;t时刻第i个智能体的预定的时变队形指令表示为hi(t)=[hxi(t),hvi(t)]T,hxi(t)和hvi(t)分别表示hi(t)的位置和速度分量,且满足
Figure FDA0002782057240000024
ci、σi为第i个智能体中控制器所需的参数,且都为正实数;
Figure FDA0002782057240000025
表示第i个智能体控制器中有界层的值,满足
Figure FDA0002782057240000026
Figure FDA0002782057240000027
Figure FDA0002782057240000028
表示t时刻第i个智能体中RBF神经网络的自适应权值向量,Φi(t)表示t时刻第i个智能体控制器中RBF神经网络的基函数向量,γi和τi表示第i个智能体控制器中RBF神经网络所需的参数。
6.如权利要求5所述的基于RBF神经网络的异构多智能体系统协同容错控制方法,其特征在于,基于一致性理论得到异构多智能体系统的全局动态方程,具体为:
Figure FDA0002782057240000029
Figure FDA0002782057240000031
Figure FDA0002782057240000032
利用RBF神经网络处理g(·),具体公式如下:
gi(·)=Wi *T(t)Φi(t)+ξi(t)
其中,Φi(t)=[φ1(ei(t)),φ2(ei(t)),…,φl(ei(t))]T,φm(ei(t))=exp[-||ei(t)-μm||2/2ιm 2],Wi *(t)∈Rl×1表示第i个智能体控制器中RBF神经网络的最优权值向量,m=1,2,…,l,l表示RBF神经网络隐藏神经元的数量,μm和ιm分别表示RBF神经网络高斯基函数的中心点向量和宽度,ξi(t)为t时刻第i个智能体控制器中RBF神经网络的近似误差,||ξi(t)||≤ε0,ε0是一个有界的正常数;
Figure FDA0002782057240000033
异构多智能体系统的全局动态方程如下:
Figure FDA0002782057240000034
其中,IN表示N维单位阵,1N表示元素都为1的N维列向量,
Figure FDA0002782057240000035
Figure FDA0002782057240000036
表示异构多智能体系统的两个综合状态误差,
ρ=diag{ρ1(t),ρ2(t),…,ρN(t)}表示异构多智能体系统的未知效率因子矩阵;
Figure FDA0002782057240000037
表示异构多智能体系统的自适应参数矩阵;
f(e(t))=[f(e1(t)),f(e2(t)),…,f(eN(t))]T表示异构多智能体系统的有界层函数;
Φ(t)=[Φ1(t),Φ2(t),…,ΦN(t)]T表示异构多智能体系统的控制器中RBF神经网络的基函数输出向量,
Figure FDA0002782057240000038
表示异构多智能体系统的控制器中RBF神经网络的权值向量,
Figure FDA0002782057240000039
CN202011284966.4A 2020-11-17 2020-11-17 基于rbf神经网络的异构多智能体系统协同容错控制方法 Active CN112379596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011284966.4A CN112379596B (zh) 2020-11-17 2020-11-17 基于rbf神经网络的异构多智能体系统协同容错控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011284966.4A CN112379596B (zh) 2020-11-17 2020-11-17 基于rbf神经网络的异构多智能体系统协同容错控制方法

Publications (2)

Publication Number Publication Date
CN112379596A true CN112379596A (zh) 2021-02-19
CN112379596B CN112379596B (zh) 2021-11-23

Family

ID=74584873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011284966.4A Active CN112379596B (zh) 2020-11-17 2020-11-17 基于rbf神经网络的异构多智能体系统协同容错控制方法

Country Status (1)

Country Link
CN (1) CN112379596B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115220472A (zh) * 2022-07-13 2022-10-21 南京航空航天大学 一种切换拓扑下空-地异构编队系统的容错控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106054922A (zh) * 2016-06-22 2016-10-26 长安大学 一种无人机‑无人车联合编队协同控制方法
CN108828949A (zh) * 2018-07-20 2018-11-16 南京航空航天大学 一种基于自适应动态规划的分布式最优协同容错控制方法
KR101935006B1 (ko) * 2017-06-23 2019-01-03 중앙대학교 산학협력단 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법
CN110058519A (zh) * 2019-04-02 2019-07-26 南京航空航天大学 一种基于快速自适应技术的主动编队容错控制方法
CN110221542A (zh) * 2019-06-04 2019-09-10 西北工业大学 一种二阶非线性多智能体系统固定时间协同跟踪控制方法
CN110825092A (zh) * 2019-12-02 2020-02-21 电子科技大学 一种多智能体系统的编队控制方法
AU2021101247A4 (en) * 2021-01-28 2021-05-06 Guangdong University Of Technology Human-in-the-Loop Consensus Control for High-Rise Firefighting Multi-MUAV Systems with Unknown Disturbances and Actuator Failures

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106054922A (zh) * 2016-06-22 2016-10-26 长安大学 一种无人机‑无人车联合编队协同控制方法
KR101935006B1 (ko) * 2017-06-23 2019-01-03 중앙대학교 산학협력단 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법
CN108828949A (zh) * 2018-07-20 2018-11-16 南京航空航天大学 一种基于自适应动态规划的分布式最优协同容错控制方法
CN110058519A (zh) * 2019-04-02 2019-07-26 南京航空航天大学 一种基于快速自适应技术的主动编队容错控制方法
CN110221542A (zh) * 2019-06-04 2019-09-10 西北工业大学 一种二阶非线性多智能体系统固定时间协同跟踪控制方法
CN110825092A (zh) * 2019-12-02 2020-02-21 电子科技大学 一种多智能体系统的编队控制方法
AU2021101247A4 (en) * 2021-01-28 2021-05-06 Guangdong University Of Technology Human-in-the-Loop Consensus Control for High-Rise Firefighting Multi-MUAV Systems with Unknown Disturbances and Actuator Failures

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
HAO YANG: "Fault-Tolerant Cooperative Control of Multiagent Systems: A Survey of Trends and Methodologies", 《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS》 *
KE ZHANG: "Distributed fault estimation observer design for multi-agent systems with switching topologies", 《IET CONTROL THEORY & APPLICATIONS》 *
ZHENG WANG: "Neural network-based adaptive fault tolerant consensus control for a class of high order multiagent systems with input quantization and time-varying parameters", 《NEUROCOMPUTING》 *
张高: "带有执行器故障的多智能体系统一致性问题研究", 《中国博士学位论文全文数据库》 *
钱默抒: "无人机姿控系统鲁棒动态面容错控制设计", 《系统工程与电子技术》 *
黄小龙: "高阶非线性不确定多智能体系统自适应RBF神经网络协同控制", 《北京工业大学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115220472A (zh) * 2022-07-13 2022-10-21 南京航空航天大学 一种切换拓扑下空-地异构编队系统的容错控制方法

Also Published As

Publication number Publication date
CN112379596B (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
CN107608367B (zh) 多变量干扰补偿四旋翼无人机轨迹与姿态协同控制方法
Chen et al. A reconfiguration scheme for quadrotor helicopter via simple adaptive control and quantum logic
Li et al. Robust tracking control strategy for a quadrotor using RPD-SMC and RISE
Chen Constrained control allocation for overactuated aircraft using a neurodynamic model
Rosales et al. 3d formation control of autonomous vehicles based on null-space
Joshi et al. Asynchronous deep model reference adaptive control
CN111781827B (zh) 基于神经网络和滑模控制的卫星编队控制方法
CN111781942B (zh) 一种基于自构造模糊神经网络的容错飞行控制方法
Rosaldo-Serrano et al. Observer-based time-varying backstepping control for a quadrotor multi-agent system
CN110908281A (zh) 无人直升机姿态运动有限时间收敛强化学习控制方法
Fessi et al. LQG controller design for a quadrotor UAV based on particle swarm optimisation
CN108681331A (zh) 一种近空间飞行器的姿态跟踪控制方法
Adlakha et al. An optimization-based iterative learning control design method for UAV’s trajectory tracking
CN113568423A (zh) 一种考虑电机故障的四旋翼无人机智能容错控制方法
CN112379596B (zh) 基于rbf神经网络的异构多智能体系统协同容错控制方法
dos Santos et al. An experimental validation of reinforcement learning applied to the position control of UAVs
Di et al. Low-level control with actuator dynamics for multirotor UAVs
Tao et al. Control of a flexible air-breathing hypersonic vehicle with measurement noises using adaptive interval type-2 fuzzy logic system
Ma et al. Finite-time trajectory tracking control of quadrotor UAV via adaptive RBF neural network with lumped uncertainties
Xian et al. An Intelligent Attitude Control Method for UAV Based on DDPG Algorithm
Vianna et al. Neural Network Based Model Predictive Control for an Autonomous Vehicle
CN111435253A (zh) 四旋翼飞行器有界输出控制
CN115373275A (zh) 四旋翼无人机的指定时间预定性能容错控制方法
Giernacki et al. Comparison of tracking performance and robustness of simplified models of multirotor UAV’s propulsion unit with CDM and PID controllers (with anti-windup compensation)
Shi et al. Fuzzy adaptive sliding mode control for unmanned quadrotor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant