CN112379596A

CN112379596A - 基于rbf神经网络的异构多智能体系统协同容错控制方法

Info

Publication number: CN112379596A
Application number: CN202011284966.4A
Authority: CN
Inventors: 张柯; 任意; 姜斌; 丁勇
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2021-02-19
Anticipated expiration: 2040-11-17
Also published as: CN112379596B

Abstract

本发明公开了一种基于RBF神经网络的异构多智能体系统协同容错控制方法：首先，假设所有的智能体都可以获得预定的运动轨迹和速度，通过异构多智能体间的通讯链接，构建异构多智能体系统通讯拓扑并以有向图表示，并计算出拉普拉斯矩阵；然后，具体分析每个智能体的动力学方程，在考虑执行器的乘性故障和加性故障的情况下，形成形式统一的二阶动态方程；基于RBF神经网络自适应理论和通讯网络链接的设计异构多智能体系统的协同容错控制器，基于一致性理论得到异构多智能体系统的全局动态方程，实现系统的协同容错控制。本发明克服了异构多智能体系统因内部智能体结构的不同导致难以协同容错控制的问题，使系统具有较强的鲁棒性和抗扰动性。

Description

基于RBF神经网络的异构多智能体系统协同容错控制方法

技术领域

本发明涉及一种基于RBF神经网络的异构多智能体系统协同容错控制方法，属于异构多智能体系统技术领域。

背景技术

近年来，无人作战系统作为改变未来战争模式的颠覆性技术装备，在世界范围内得到飞速发展，已经成为国家间军事博弈的重要力量。面向未来作战应用需求，以无人机与无人车组成的异构无人集群系统具有重要的研究价值。

由于无人机和无人车的异构特性，编队控制的困难度急剧增加。无人机与无人车之间存在巨大差异，例如，二者有不同的工作空间、不同的动力学特性、不同的速度限制，这些差异不仅仅体现在数学模型的差异上，更让控制系统难于统一处理。同时，二者模型的差异又导致了控制目标量的不一致，进一步增加了编队控制系统的设计难度。受制于这些困难，目前无人机和无人车协同控制的精度低且可靠性差，现有编队控制方法不能有效地指导工程应用。同时，无人作战系统实现任务的前提是每个智能体本身能够正常运行，一旦在运行中某个或多个智能体发生执行器故障，就可能因控制律不能完整的被执行而导致整体任务失败。由于多智能体之间相互连接，单个智能体的故障很可能影响整个系统，甚至导致整个系统崩溃，无法完成任务，造成巨大的损失，但是目前这个方向的研究尚少，因此异构智能体系统的容错控制具有重要的现实意义。

发明内容

为了解决上述背景技术提出的技术问题，本发明旨在提供基于RBF神经网络的异构多智能体系统协同容错控制方法，克服因智能体不同导致难以实现协同容错控制的问题。

本发明为解决上述技术问题采用以下技术方案：

基于RBF神经网络的异构多智能体系统协同容错控制方法，包括如下步骤：

(1)设定所有的智能体都能够获得预定的运动轨迹和速度，通过异构多智能体间的通讯链接，构建异构多智能体系统的通讯拓扑并以有向图表示，计算出拉普拉斯矩阵L；

(2)根据每个智能体的动力学方程，针对方程中难以处理的非线性项、模型不确定性和外界扰动进行处理，在考虑执行器的乘性故障和加性故障的情况下，形成统一二阶动态方程形式的每个智能体带有故障的模型；

(3)基于RBF神经网络自适应理论和通讯网络链接，设计异构多智能体系统的协同容错控制器，基于一致性理论得到异构多智能体系统的全局动态方程，实现系统的协同容错控制。

进一步，在步骤(1)中，采用G＝{V，E，A}表示异构多智能体系统的通讯拓扑；其中，V＝{v₁，v₂，…，v_N}表示智能体集合，v_i表示第i个智能体，i＝1，2，…，N，N表示智能体数量，E＝[e_ij]表示智能体之间的通讯链接集合，e_ij＝(v_i，v_j)表示v_i能够获取第j个智能体v_j的信息，j＝1，2，…，N；A＝[a_ij]∈R^N×N为权值非负的邻接矩阵，如果(v_i，v_j)∈E则 a_ij＞0，否则a_ij＝0；定义G的入度矩阵D＝diag(deg_in(v₁)，deg_in(v₂)，…，deg_in(v_N))，

拉普拉斯矩阵L＝[l_ij]∈R^N×N，L＝D-A。

如果从每个智能体都有到其他智能体的一条有向路径，则有向图G为强连通图，下面三个推论成立：

i.0为L的一个特征值，其余为N-1个具有正实部特征值。

ii.存在一个正向量ζ＝[ζ₁，ζ₂，…，ζ_N]^T，且满足

和ζ^TL＝0。

iii.令A＝diag{ζ₁，ζ₂，…，ζ_N}，可得

则

相当于一个无向连通图的拉普拉斯矩阵。对于任一正的列向量μ∈R^N×1，如下不等式成立：

其中，

代表一个N维列向量，

为

的最小非零特征值。

进一步，步骤(2)中第i个智能体带有故障的模型表示为如下的二阶动态方程：

其中，n为向量维度，x_i(t)∈Rⁿ、v_i(t)∈Rⁿ和

分别代表t时刻第i个智能体的位置、速度和带有未知故障的控制输入向量；

ρ_i(t)＝diag{ρ_i1(t)，ρ_i2(t)，…，ρ_in(t)}，b_i(t)＝[b_i1(t)，b_i2(t)，…，b_in(t)]^T，0＜p_ik(t)≤1和 b_ik(t)分别表示t时刻第i个智能体的执行器第k个通道未知效率因子和输出偏差， 0＜ρ _i≤ρ_i(t)≤1，

ρ _i为ρ_i(t)的下界，

为b_i(t)的上界；t 时刻第i个智能体模型中的非线性项和小确定性项综合表示为 f_i(*，t)＝[f₁(*，t)，f₂(*，t)，…，f_n(*，t)]T；d_i(t)＝[d_i1(t)，d_i2(t)，…，d_in(t)]^T表示t时刻第i 个智能体受到的外界扰动。

进一步，第i个智能体带有故障的模型包含如下的故障模式：

1)ρ_i(t)＝1且b_i(t)≠0：代表执行器只有加性故障；

2)0＜ρ_i(t)＜1且b_i(t)＝0：代表执行器只有乘性故障；

3)0＜ρ_i(t)＜1且b_i(t)≠0：代表执行器既有乘性故障又有加性故障。

进一步，步骤(3)中异构多智能体系统的协同容错控制器如下：

其中，u_i(t)表示t时刻第i个智能体的控制输入向量，

表示t时刻第i个智能体的自适应参数且其初始值为正实数；e_i(t)表示t时刻第i个智能体的编队状态误差；t时刻第i个智能体的预定的时变队形指令表示为h_i(t)＝[h_xi(t)，h_vi(t)]^T，h_xi(t)和h_vi(t)分别表示h_i(t)的位置和速度分量，且满足

c_i、σ_i为第i个智能体中控制器所需的参数，且都为正实数；f(e_i(t))表示基于有界层理论所设计的符号函数，

表示第i个智能体控制器中有界层的值，满足

时

表示t时刻第i个智能体中 RBF神经网络的自适应权值向量，Φ_i(t)表示t时刻第i个智能体控制器中RBF神经网络的基函数向量，γ_i和τ_i表示第i个智能体控制器中RBF神经网络所需的参数。

上述协同容错控制器可以使异构多智能体系统的状态误差渐进稳定。

进一步，为方便进行分析和解决问题，基于一致性理论得到异构多智能体系统的全局动态方程，具体为：

令χ_i(t)＝x_i(t)-h_xi(t)，ψ_i(t)＝v_i(t)-h_vi(t)，得

令

利用RBF神经网络可以逼近任意非线性函数的特点来处理g(·)，具体公式如下：

其中，Φ_i(t)＝[φ₁(e_i(t))，φ₂(e_i(t))，…，φ_l(e_i(t))]^T，W_i ^*(t)∈R^l×1表示第i个智能体控制器中RBF神经网络的最优权值向量，

m＝1，2，…，l， l表示RBF神经网络隐藏神经元的数量，μ_m和

分别表示RBF神经网络高斯基函数的中心点向量和宽度，ξ_i(t)为t时刻第i个智能体控制器中RBF神经网络的近似误差，||ξ_i(t)||≤ε₀， ε₀是一个很小且有界的正常数。

令

可知当满足

和lim_t→∞e_i(t)＝0时，可得lim_t→∞(χ_i(t)-χ_j(t))＝0和lim_t→∞(ψ_i(t)-ψ_j(t))＝0。

异构多智能体系统的全局动态方程如下：

其中，I_N表示N维单位阵，1_N表示元素都为1的N维列向量；

和e(t)表示异构多智能体系统的两个综合状态误差，

ρ＝diag{ρ₁(t)，ρ₂(t)，…，ρ_N(t)}表示异构多智能体系统的未知效率因子矩阵；

表示异构多智能体系统的自适应参数矩阵；f(e(t))＝[f(e₁(t))，f(e₂(t))，…，f(e_N(t))]^T表示异构多智能体系统的有界层函数； Φ(t)＝[Φ₁(t)，Φ₂(t)，…，Φ_N(t)]^T表示异构多智能体系统的控制器中RBF神经网络的基函数输出向量，

表示异构多智能体系统的控制器中RBF神经网络的权值向量，

是由异构多智能体系统模型中多项函数整合成的一个综合函数项。

采用Lyapunov函数的方法对异构多智能体系统的稳定性进行验证，考虑Lyapunov函数如下：

其中，

其中

为一个正实数；

求导可以得到如下形式：

利用以下不等式进行化简：

1.

2.

3.

4.

其中a为非负实数，c为正实数。

通过进一步化简可得

又因为0＜ρ≤I_N、

和

其中ρ＝min{ρ ₁，ρ ₂，…，ρ _N}，可得：

利用以下不等式继续化简：

1.e^TPξ≤e^Tξ≤δ₁||e||²+ε₁，其中δ₁为正实数，

且||ξ(t)||≤ε₀。

2.

其中δ₂为正实数，

3.

4.

5.

其中

通过化简最终可得：

其中，α＝min{λ₁，λ₂，λ₃}，

λ₃＝κ，

δ＝δ₁+δ₂，ε＝ε₁+ε₂。

证明完毕。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：本发明基于RBF神经网络自适应的理论知识设计了异构多智能体系统的协同容错控制器，利用所设计的控制器可以克服因智能体不同导致难以协同控制的问题，同时保证系统中的智能体在受到外界干扰、执行器的乘性故障和加性故障的情况下，既可以快速跟踪预定的运动指令，还可以保证系统整体稳定完成预定的编队队形。本发明所设计的控制器具有很强的鲁棒性和抗扰动性。

附图说明

图1是本发明的流程图；

图2是有向图G；

图3至图6是无人车1～4与预定指令之间的状态误差图；

图7和图8是四旋翼无人机1～2与预定指令之间的状态误差图；

图9至图12是无人车1～4与邻居之间的状态误差图；

图13和图14是四旋翼无人机1～2与邻居之间的状态误差图；

图15和图16是异构智能体系统预定的运动轨迹图和实际的运动轨迹图；

图17是无人车1～4和无人机1～2在xoY平面内预定的队形及运动轨迹；

图18是无人车1～4和无人机1～2在xoY平面内t＝80s时实际的队形及80s内的实际运动轨迹。

具体实施方式

本发明以如下的4辆无人小车和2架四旋翼无人机为实施对象，其中x(t)＝[x，y，z]^T， x、y和z分别代表无人器的x轴、y轴和z轴方向的位移；v(t)＝[v_x，v_v，v_z]^T，v_x、v_y和 v_z分别代表无人器的x轴、y轴和z轴方向的速度；u(t)＝[u_x，u_y，u_z]^T，u_x、u_y和u_z分别代表无人器的x轴、y轴和z轴方向的控制输入。针对无人机和无人车的运动维度不同，为方便协同控制，默认无人车的z轴方向的位移、速度和控制输入都为0。

考虑如下的无人器的动态方程：

其中，取n＝3，x_i(t)∈Rⁿ、v_i(t)∈Rⁿ和u_i(t)∈Rⁿ分别代表第i个智能体的位置、速度和控制输入向量。令带有故障的控制输入表示为

ρ_i(t)和b_i(t)分别代表第i个智能体执行器的未知效率因子和输出偏差，第i个智能体模型中的非线性项和模型不确定性项综合表示为f_i(*，t)；d_i(t)代表第i个智能体受到的外界扰动。

首先，构建异构多智能体系统的通讯链接图，并以有向图G表示。如图2所示，1-4表示异构智能体系统中的4辆无人车，5和6表示系统中的2架四旋翼无人机。拉普拉斯矩阵L如下：

智能体预定的队形指令为h_i(t)＝[h_xi(t)，h_vi(t)]^T，其中 h_xi(t)＝[r sin(ωt+π(i-1)/3)r cos(ωt+π(i-1)/3)]^T，i＝1，2，…，6，其中r＝16， ω＝0.3，且满足

四旋翼无人机1～2的z轴方向的指令为z_i＝0.5·i·t， i＝1，2，具体表现为无人车1～4和无人机1～2在xoy平面上按照正六边形的队形进行圆周运动，且无人机1～2以不同的速度螺旋上升。

1.第一个无人车的初始状态和相关参数：

x₁(t₀)＝[5 5]^T；v₁(t₀)＝[0 0]^T；d₁(t)＝[sin t cos t]^T；c₁＝5；σ₁＝0.5；

γ₁＝10；τ₁＝0.05；神经元个数l＝11。

2.第二个无人车的初始状态和相关参数：

x₂(t₀)＝[5 -5]^T；v₂(t₀)＝[0 0]^T；d₂(t)＝[sin t cos t]^T；c₂＝30；σ₂＝0.2；

γ₂＝50；τ₂＝0.01；神经元个数l＝11。

3.第三个无人车的初始状态和相关参数：

x₃(t0)＝[-5 -5]^T；v₃(t₀)＝[0 0]^T；d₃(t)＝[sin t cos t]^T；c₃＝50；σ₃＝0.1；

γ₃＝50；τ₃＝0.01；神经元个数l＝11。

4.第四个无人车的初始状态和相关参数：

x₄(t₀)＝[-5 5]^T；v₄(t₀)＝[0 0]^T；d₄(t)＝[sin t cos t]^T；c₄＝30；σ₄＝0.5；

γ₄＝50；τ₄＝0.01；神经元个数l＝11。

5.第一个四旋翼无人机的初始状态和相关参数：

x₅(t₀)＝[-10 2 0]^T；v₅(t₀)＝[0 0 0]^T；d₅(t)＝[sin t cos t0]^T；c₅＝50；σ₅＝0.2；

γ₃＝50；τ₃＝0.01；神经元个数l＝11。

6.第二个四旋翼无人机的初始状态和相关参数：

x₆(t₀)＝[0 10 0]^T；v₆(t₀)＝[0 0 0]^T；d₆(t)＝[sin t cos t 0]^T；c₆＝50；σ₆＝0.2；

γ₆＝50；τ₆＝0.01；神经元个数l＝11。

t₀表示初始时刻，

和

分别代表无人车1、3和四旋翼无人机1故障发生的时刻，令

无人车2、无人车4和无人机2无故障。具体故障参数表示如下：

ρ₁(t)＝diag{ρ₁₁，ρ₁₂}，ρ_1i∈[0.5，1]；b₁(t)＝[b₁₁ b₁₂]^T，b_1i∈[-1，1]；

ρ₃(t)＝diag{ρ₃₁，ρ₃₂}，ρ_3i∈[0.5，1]；b₃(t)＝[b₃₁ b₃₂]^T，b_3i∈[-1，1]；

ρ₅(t)＝diag{ρ₅₁，ρ₅₂，ρ₅₃}，ρ_5i∈[0.5，1]；b₅(t)＝[b₅₁ b₅₂ b₅₃]^T，b_5i∈[-1，1]。

为验证本发明协同容错控制方法的效果，应用matlab中的simulink模板进行仿真验证。图3至图8中的曲线分别表示无人车1～4和四旋翼无人机1～2与预定指令之间的状态误差 (χ_i(t))图；图9至图14中的曲线分别表示无人车1-4和四旋翼无人机1-2与邻居之间的状态误差(e_i(t))图；图15和图16分别为异构智能体系统预定的运动轨迹图和实际的运动轨迹图，图17为无人车1～4和无人机1～2在xoY平面内预定的队形及运动轨迹，图18为无人车1～4和无人机1～2在xoY平面内t＝80s时实际的队形及80s内的实际运动轨迹。

从仿真结果可以看出，利用所设计的异构多智能体协同控制器，可以使分别处于任意初始位置的智能体，在短时间内按照预定的编队指令进行协同运动，而且当系统中的一个或多个智能体发成执行器故障和受到外界干扰时，仍然可以保证稳定。本发明对于异构多智能体系统协同容错控制的相关研究方面具有重要的参考价值和实际应用价值。

实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.基于RBF神经网络的异构多智能体系统协同容错控制方法，其特征在于，包括如下步骤：

(1)设定所有的智能体都能够获得预定的运动轨迹和速度，通过异构多智能体间的通讯链接，构建异构多智能体系统的通讯拓扑并以有向图表示，计算出拉普拉斯矩阵；

(2)根据每个智能体的动力学方程，在考虑执行器的乘性故障和加性故障的情况下，形成统一二阶动态方程形式的每个智能体带有故障的模型；

2.如权利要求1所述的基于RBF神经网络的异构多智能体系统协同容错控制方法，其特征在于，在步骤(1)中，采用G＝{V,E,A}表示异构多智能体系统的通讯拓扑；其中，V＝{v₁,v₂,…,v_N}表示智能体集合，v_i表示第i个智能体，i＝1,2,…,N，N表示智能体数量，E＝[e_ij]表示智能体之间的通讯链接集合，e_ij＝(v_i,v_j)表示v_i能够获取第j个智能体v_j的信息，j＝1,2,…,N；A＝[a_ij]为权值非负的邻接矩阵，如果(v_i,v_j)∈E则a_ij＞0，否则a_ij＝0；G的入度矩阵D＝diag(deg_in(v₁),deg_in(v₂),…,deg_in(v_N))，

拉普拉斯矩阵L＝[l_ij]＝D-A。

3.如权利要求1所述的基于RBF神经网络的异构多智能体系统协同容错控制方法，其特征在于，步骤(2)中第i个智能体带有故障的模型表示为如下的二阶动态方程：

其中，n为向量维度，x_i(t)∈Rⁿ、v_i(t)∈Rⁿ和

ρ_i(t)＝diag{ρ_i1(t)，ρ_i2(t)，…，ρ_in(t)}，b_i(t)＝[b_i1(t)，b_i2(t)，…，b_in(t)]^T，0＜ρ_ik(t)≤1和b_ik(t)分别表示t时刻第i个智能体的执行器第k个通道未知效率因子和输出偏差，0＜ρ _i≤ρ_i(t)≤1，

ρ _i为ρ_i(t)的下界，

为b_i(t)的上界；t时刻第i个智能体模型中的非线性项和不确定性项综合表示为f_i(*,t)＝[f₁(*,t),f₂(*,t),…,f_n(*,t)]^T；d_i(t)＝[d_i1(t)，d_i2(t)，…，d_in(t)]^T表示t时刻第i个智能体受到的外界扰动。

4.如权利要求3所述的基于RBF神经网络的异构多智能体系统协同容错控制方法，其特征在于，第i个智能体带有故障的模型包含如下的故障模式：

1)ρ_i(t)＝1且b_i(t)≠0：代表执行器只有加性故障；

2)0＜ρ_i(t)＜1且b_i(t)＝0：代表执行器只有乘性故障；

5.如权利要求1所述的基于RBF神经网络的异构多智能体系统协同容错控制方法，其特征在于，步骤(3)中异构多智能体系统的协同容错控制器如下：

其中，u_i(t)表示t时刻第i个智能体的控制输入向量，

c_i、σ_i为第i个智能体中控制器所需的参数，且都为正实数；

表示第i个智能体控制器中有界层的值，满足

时

表示t时刻第i个智能体中RBF神经网络的自适应权值向量，Φ_i(t)表示t时刻第i个智能体控制器中RBF神经网络的基函数向量，γ_i和τ_i表示第i个智能体控制器中RBF神经网络所需的参数。

6.如权利要求5所述的基于RBF神经网络的异构多智能体系统协同容错控制方法，其特征在于，基于一致性理论得到异构多智能体系统的全局动态方程，具体为：

令

得

令

利用RBF神经网络处理g(·)，具体公式如下：

g_i(·)＝W_i ^*T(t)Φ_i(t)+ξ_i(t)

其中，Φ_i(t)＝[φ₁(e_i(t)),φ₂(e_i(t)),…,φ_l(e_i(t))]^T，φ_m(e_i(t))＝exp[-||e_i(t)-μ_m||²/2ι_m ²]，W_i ^*(t)∈R^l×1表示第i个智能体控制器中RBF神经网络的最优权值向量，m＝1,2,…,l，l表示RBF神经网络隐藏神经元的数量，μ_m和ι_m分别表示RBF神经网络高斯基函数的中心点向量和宽度，ξ_i(t)为t时刻第i个智能体控制器中RBF神经网络的近似误差，||ξ_i(t)||≤ε₀，ε₀是一个有界的正常数；

令

异构多智能体系统的全局动态方程如下：

其中，I_N表示N维单位阵，1_N表示元素都为1的N维列向量，

和

表示异构多智能体系统的两个综合状态误差，

ρ＝diag{ρ₁(t),ρ₂(t),…,ρ_N(t)}表示异构多智能体系统的未知效率因子矩阵；

表示异构多智能体系统的自适应参数矩阵；

f(e(t))＝[f(e₁(t)),f(e₂(t)),…,f(e_N(t))]^T表示异构多智能体系统的有界层函数；

Φ(t)＝[Φ₁(t),Φ₂(t),…,Φ_N(t)]^T表示异构多智能体系统的控制器中RBF神经网络的基函数输出向量，

表示异构多智能体系统的控制器中RBF神经网络的权值向量，