CN110716582A

CN110716582A - 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Info

Publication number: CN110716582A
Application number: CN201910984502.5A
Authority: CN
Inventors: 温广辉; 胡一帆; 吕跃祖; 付俊杰; 周佳玲
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2020-01-21
Anticipated expiration: 2039-10-16
Also published as: CN110716582B

Abstract

本发明公开了一种通信受间歇DoS攻击的不确定多智能体一致性跟踪协议设计方法，包括：对于处于通信受间歇DoS攻击下的多智能体，构建智能体的微分方程模型；利用切换系统稳定性理论，将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题；利用线性矩阵不等式(LMI)，构建解耦切换系统李雅普诺夫函数，设计多智能体协同一致性跟踪协议算法及通信时长占比条件；基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体一致性跟踪协议算法；基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体围捕控制算法。

Description

适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

技术领域：

本发明涉及一种在间歇通信的环境下多智能体一致性跟踪协议设计方法，基于最小通信时长占比的一致性协议算法能实现在更加苛刻的间歇通信环境下实现多智能体对目标的一致性跟踪。通过设置固定围捕编队构型，该一致性算法能实现间歇通信环境下多智能体对目标智能体编队围捕，该发明属于协同控制技术领域。

背景技术：

随着机器人，无人飞行器等智能体设备在军用和民用领域的普及，对于多机器人，多飞行器等多智能体协同控制的研究持续进行。在多智能体协同控制领域中一个重要研究方向是通过协同控制实现多智能体一致性行为。现已有的多智能体一致性控制技术有在固定通信环境对应拓扑图满足强连通条件时，多智能体能以渐近收敛的速度实现平均一致性，如技术[1](参见Olfati-Saber R,Murray RM.Consensus problems in networks ofagents with switching topology and time-delays.IEEE Transactions on AutomaticControl 2004；49(9):1520–1533.)，也有当通信环境随时间变化时，当时变网络拓扑图始终包含生成树时，多智能体能实现一致性，如技术[2](参见Vicsek T,Cziroók A,Ben-Jacob E,Cohen O,Shochet I.Novel type of phase transition in a system of self-drivenparticles.Physical Review Letters 1995；75(6):1226–1229.)，基于一般线性动力学以及高阶积分器的多智能体系统一致性也得到了研究，如技术[3]，(Ren W,Moore KL,Chen Y.High-order and model reference consensus algorithms in cooperativecontrol ofmulti-vehicle systems.ASME Journal of Dynamic Systems,Measurement,and Control 2007；129(5):678–688.)，多智能体一致性控制技术的应用包括一致性跟踪，即通过设置虚拟领导者智能体，可以实现多智能体系统一致性跟踪，如技术[4](参见HongY,Hu J,Gao L.Tracking control for multi-agent consensus with an active leaderand varibaletopology.Automatica 2006；42(7):1177–1182.)。

上述包括一致性跟踪的多智能体一致性控制技术均基于智能体之间的信息一直连续地在通讯网络中传输，即智能体传递给其邻居的信息并没有任何通信限制。近年，网络服务攻击开始出现并不断发展，其中DoS(Denial of Service)攻击通过攻击网络协议使智能体的信息无法成功传递至其邻居，在多智能体通信网络上体现为DoS攻击阻碍智能体传输信号，使其无法传递至其余智能体。在通信拓扑层面，使原本的多智能体通信拓扑图转变为空图，即所有的通信连边均被DoS攻击所破坏。这种攻击方式令当前的一致性控制技术无法控制多智能体实现一致。

考虑到现实中智能体存在的自检能力，当智能体发现其发送的信息无法传递到其余智能体的这种状态持续一段时间后，智能体能够重新修复与其邻居智能体的通信连边，从而使通信拓扑图修复为原本的通信拓扑图，此时信息传输又能恢复正常。而后DoS攻击又将重新对多智能体的通信网络进行攻击，因此对于多智能体的通信拓扑而言，其变化呈现周期性，即在一个时间周期内，一段时间为原本设计的通信拓扑，另一段时间为在DoS攻击干扰下的空图。在信息传输层面体现为在每个时间周期内的一个时间段能正常接收到邻居智能体信息，整体上体现为间歇通信。针对这种间歇通信环境下的多智能体一致性跟踪控制的研究，目前还未见到相关文献。

发明内容：

针对现有技术的不足，本发明提供一种间歇通信环境下多智能体一致性跟踪协议，以及对应李雅普诺夫函数构造，实现间歇通信环境下多智能体对目标智能体状态的一致性跟踪并实现基于一致性的多智能体围捕编队控制。本发明通过智能体之间交互自身状态信息，建立一致性跟踪协议，并得到该间歇控制协议的通信时长需满足的条件。利用线性矩阵不等式组，优化通信时长条件，得到能适应更苛刻通信条件的间歇控制协议。利用该间歇控制协议，得到通过智能体之间交互自身位置与固定围捕编队构型的差值信息的协同控制协议。

为了实现上述目的，本发明的技术方案如下，一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，所述方法包括以下步骤：

步骤1：对于处于通信受间歇DoS攻击下的多智能体，构建智能体的微分方程模型。

步骤2：利用切换系统稳定性理论，将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题。具体包括：

步骤2-1：通过变量转换，将系统一致跟踪问题等价转变为稳定性问题；

步骤2-2：通过变量转换，将系统稳定性问题转变为解耦系统的渐近稳定性问题。

步骤3：利用线性矩阵不等式(LMI)，构建解耦切换系统李雅普诺夫函数，设计多智能体协同一致性跟踪协议算法及通信时长占比条件。具体包括：

步骤3-1：表示将使用的矩阵不等式；

步骤3-2：将矩阵不等式转变为线性矩阵不等式；

步骤3-3：构造解耦系统李雅普诺夫函数；

步骤3-4：设计多智能体一致性协议算法；

步骤3-5：设计多智能体通信时长满足条件。

步骤4：基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体一致性跟踪协议算法，具体包括：

步骤4-1：选择合适的系统参数；

步骤4-2：通过求解线性矩阵不等式组，得到相关参数及最小通信时长；

步骤4-3：设计智能体控制协议。

步骤5：基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体围捕控制算法。具体包括：

步骤5-1：设计固定围捕编队构型；

步骤5-2：设计智能体控制器控制协议。

进一步地，步骤1中的具有N+1个智能体(N+1号智能体为领导者智能体)的处于间歇通信环境下的智能体分段线性动力学模型构建方法为：

首先确定智能体动力学的微分方程模型表示：

其中x_i(t)∈Rⁿ为第i个智能体状态，A∈R^n×n为系统矩阵，ΔA为系统不确定性满足结构ΔA＝DKE，K为不确定变量，表示为对角矩阵，并满足K^TK≤σ²I,σ为给定常数，B∈R^n×m为系统输入矩阵。u_i(t)∈R^m为控制输入，并且有u_N+1(t)≡0。

基于间歇通信环境，设计智能体在正常通信以及无通信环境中控制输入：

其中c>0为耦合强度，F∈R^m×n为反馈增益矩阵，ρ表示一个周期时间段对应时长，δ表示一周期时间段中智能体之间存在通信的时长。

结合式(15)和式(16)，得出处于间歇通信环境下智能体分段微分方程：

步骤2中利用切换系统稳定性理论，将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题具体为：

步骤2-1.设置变量

与并满足

得到r(t)的动力学表示：

并得到关于x_i(t)的一致性问题等价于r_i(t)中的稳定性问题；

步骤2-2.设置变量

满足关系

其中Y₂∈R^(N-1)×N，得到ε(t)的动力学表示：

并得到关于r_i(t)中的稳定性问题等价于ε_i(t)中的渐近稳定性问题。由切换系统稳定性定理，此系统渐近稳定等价于矩阵

舒尔稳定，其中

从而x_i(t)的一致性跟踪问题转化为系统

的渐近稳定性问题。

步骤3中利用线性矩阵不等式(LMI)，构建解耦切换系统李雅普诺夫函数，设计多智能体协同一致性跟踪协议算法及通信时长占比条件的具体步骤为：

步骤3-1.利用的矩阵不等式为：

AP+PA^T+σ²DD^T+PE^TEP-2βP<0,

其中A＝(a_ij)_n×n为实矩阵，P∈R^n×n为正定矩阵，β₀为A+DKE特征值中实部的最大值，且β>β₀。

AQ+QA^T-2BB^T+σ²DD^T+QE^TEQ+2αQ<0,

其中(A,B)可镇定，A∈R^n×n，B∈R^n×p且p≤n，P∈R^n×n为正定矩阵，α₀为矩阵A+DKE不可控模态对应特征值实部的最大值的负值，α满足α<α₀。当(A,B)完全可控时，α可取任意值。

步骤3-2.利用Schur引理将上述矩阵不等式转化为线性矩阵不等式：

步骤3-3.设计解耦切换系统李雅普诺夫函数：

其中矩阵P由线性矩阵不等式AP+PA^T+σ²DD^T+PE^TEP-2βP<0得出，β₀为A+DKE特征值中实部的最大值，且β>β₀。矩阵Q由AQ+QA^T-2BB^T+σ²DD^T+QE^TEQ+2αQ<0得出，α₀为矩阵A+DKE不可控模态对应特征值实部的最大值的负值，α满足α<α₀。当(A,B)完全可控时，α可取任意值。

步骤3-4.多智能体一致性跟踪协议算法具体设计为：

Step1.设置β>β₀，求解不等式AP+PA^T+σ²DD^T+PE^TEP-2βP<0，得到正定矩阵P；

Step2.选择α>0，求解不等AQ+QA^T-2BB^T+σ²DD^T+QE^TEQ+2αQ<0,，得到正定矩阵Q；

Step3.设置反馈增益矩阵F＝-B^TQ^-1，耦合强度c≥1/Re(λ₁)，其中Re(λ₁)为λ₁的实部；

Step4.设置智能体控制协议：

步骤3-5.多智能体通信时长满足条件具体为：

多智能体系统实现一致性所需通信时长占比条件具体满足：其中μ＝max(λ_max(Q^-1)/λ_min(P^-1),λ_max(P^-1)/λ_min(Q^-1))。

步骤4中基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体一致性跟踪协议算法具体为：

步骤4-1.按照步骤3-2选择合适的β>β₀和α>0，并选择耦合强度c≥1/Re(λ₁)。

步骤4-2.基于(A,B)可镇定和图

存在有向生成树的假设，求解线性矩阵不等式组：

minμ

s.t.Q>0,

P>Q,

P<μQ,

得到最优的μ，P和Q，求解得到反馈增益矩阵F＝-B^TQ^-1。求解最小通信时长δ满足步骤3-5的条件。

步骤4-3.设计智能体控制协议：

步骤5中基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体围捕控制算法具体为：

步骤5-1.设置固定围捕编队构型Ξ＝(ξ₁,ξ₂,…,ξ_N,0)∈R^n×(N+1)，其中ξ_i表示第i个智能体在编队中与领导者的相对状态；

步骤5-2.设计智能体围捕编队控制协议：

其中c,F和δ由步骤4-1和步骤4-2得到，被捕者系统满足

针对多智能体一致性跟踪控制，本发明提出了一种在应对DoS攻击导致的间歇通信环境下的多智能体一致性跟踪控制协议设计。在多智能体系统遭受DoS攻击而无法通信时，智能体只能根据自身状态进行更新，此时智能体之间的一致性误差将有一定程度的放大，在多智能体系统能正常进行通信时，通过设计耦合强度，反馈增益矩阵可以使多智能体系统在有通信时间段能在前一时间周期无通信时间段中一致性误差放大的情况下一样使得整体一致性误差缩小，从而实现多智能体一致性。

综上所述，本发明的一致性协同控制协议可满足在通信网络遭受DoS攻击而出现间歇通信的环境中实现多智能体一致性跟踪的要求，由于基于一致性跟踪的多智能体协同控制在实际中具有良好应用优点，如机器人队伍跟踪领导者智能体完成指定任务过程中并不需要所有机器人均接收到上级指令，只需领导者智能体接收到上级指令，并将其传递给部分跟随者智能体，而跟随者智能体之间则通过相互通信，实现对领导者智能体行为的跟踪，进一步所有智能体均在跟踪到领导者智能体后完成指定任务。因此结合间歇通信环境的多智能体一致性跟踪策略能在理想通信环境下的一致性跟踪的基础上考虑实际受干扰的通信网络，进一步提高了一致性跟踪策略的实用性。此外，本发明可平行应用于多智能体在间歇通信环境下围捕编队控制的场合，根据算法特点，在修改固定围捕编队构型后，多智能体可以实现指定的任意编队，从而对复杂现实环境下的围捕具有良好适应效果，如在较为狭窄的地形环境下，可设置较小的围捕编队使得多智能体能在保持围捕编队的情况下通过此地形。并且在智能体通信层面，该算法对DoS攻击下的通信环境具有良好适应效果，即当现实环境中存在通信环境干扰时，智能体的围捕编队仍然能够实现。因此本发明在多智能体现实环境下协同编队围捕具有良好的应用前景。

附图说明

图1是本发明的针对间歇通信环境中多智能体一致性跟踪协议设计步骤示意图；

图2是本发明仿真模拟1的多智能体通信拓扑示意图；

图3是本发明仿真模拟1的状态轨迹的一致性随时间变化图；

图4是本发明仿真模拟1的一致性误差随时间变化图；

图5是本发明的针对间歇通信环境中多智能体编队控制流程示意图；

图6是本发明仿真模拟2的多智能体通信拓扑示意图；

图7是本发明仿真模拟2的智能体位置随时间变化图；

图8是本发明仿真模拟2的各智能体编队误差随时间变化图。

具体实施方式

下面将结合附图就本发明的发明目的、技术方案、发明优点作进一步详细说明。

现有的多智能体一致性控制技术要求多智能体系统能时刻接受到邻居智能体状态信息，并且智能体传递给其邻居的信息并没有任何通信限制，这对于智能体通信网络的即时通信能力有较高的要求。现实中常见网络攻击如DoS攻击对网络协议进行攻击，影响智能体接受邻居信息，从而阻碍多智能体一致性的形成。一类特殊的DoS攻击体现为周期性破坏网络协议，在该种网络攻击下，现有多智能体一致性协同控制技术无法实现多智能体一致性目标。

基于以上考虑，本发明首先建立了处于间歇通信环境下的智能体分段线性动力学模型，然后实现了多智能体系统一致性跟踪问题与一组解耦切换系统的渐近稳定性问题的等价性转化。进一步对解耦切换系统设计李雅普诺夫函数，设计了多智能体一致性跟踪协议算法并给出多智能体系统实现一致所需通信时长占比条件。接着基于多智能体系统实现一致性所需通信时长占比条件最优的目标，重新设计了多智能体一致性跟踪协议算法。最后，基于该一致性跟踪算法，设计了多智能围捕同编队控制算法。

实施例1：一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，所述方法包括以下步骤：图1表示了对于处于通信受间歇DoS攻击下的多智能体，构建智能体的微分方程模型。其构成具体如下执行：

步骤1.针对处于通信受间歇DoS攻击下的N+1个智能体，构建智能体的微分方程模型。的具体过程为：

将智能体的动力学模型首先表示为线性定长系统，以x_i(t)∈Rⁿ表示第i个智能体状态，A∈R^n×n表示系统矩阵，ΔA为系统不确定性满足结构ΔA＝DKE，K为不确定变量，表示为对角矩阵，且满足K^TK≤σ²I,σ为给定常数，B∈R^n×m表示系统输入矩阵，u_i(t)∈R^m为控制输入。智能体系统表示为：

在多智能体一致性跟踪控制中，对于跟随者智能体，u_i(t)主要由智能体自身状态x_i(t)及其邻居智能体状态x_j(t)的差值构成。因此在无通信时间段，设置控制输入u_i(t)＝0。在总体上，设置u_i(t)满足：

其中c>0为耦合强度，F∈R^m×n为反馈增益矩阵，ρ表示一个周期时间段对应时长，δ表示一周期时间段中智能体之间存在通信的时长，a_ij≥0为正常通信环境下通信拓扑图对应邻接矩阵的元素，若智能体i能接收到来着智能体j的状态信息，则a_ij>0，若不能，则a_ij＝0。

领导者智能体系统动力学表示为：

跟随者智能体分段线性动力学模型构建为：

步骤2.利用切换系统稳定性理论，将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题。该步骤的具体过程为：

步骤2-1.令r_i(t)＝x_i(t)-x_N+1(t)，i＝1,…,N,并且对于

得到r(t)的动力学表示：

其中

为包含N+1个智能体的通信拓扑图的拉普拉斯矩阵，L₁为N×N矩阵并且r(t)＝0等价于x₁(t)＝x₂(t)＝…＝x_N(t)，故x_i(t)的一致性问题等价于r_i(t)中的稳定性问题。

步骤2-2.令Y₁∈R^N×(N-1)，Y₂∈R^(N-1)×N，T∈R^N×N以及一个上三角矩阵U∈R^(N-1)×(N-1)满足T＝(1_N,Y₁)，

其中U＝diag(λ₁,…,λ_N)为正定对角矩阵,0<λ₁≤…≤λ_N。再令

满足得到ε(t)的动力学表示：

得到关于r_i(t)中的稳定性问题等价于ε_i(t)中的渐近稳定性问题。

由切换系统稳定性定理，上述系统渐近稳定等价于矩阵舒尔稳定，其中从而x_i(t)的一致性问题转化为被解耦系统

的渐近稳定性问题。

步骤3.利用线性矩阵不等式(LMI)，构建解耦切换系统李雅普诺夫函数，设计多智能体协同一致性跟踪协议算法及通信时长占比条件。该步骤的具体过程为：

步骤3-1.利用的矩阵不等式为：

AP+PA^T+σ²DD^T+PE^TEP-2βP<0,

AQ+QA^T-2BB^T+σ²DD^T+QE^TEQ+2αQ<0,

步骤3-3.设置解耦切换系统李雅普诺夫函数：

通过对V(t)关于t求导，得到

进而可以得到

其中γ₀＝2αδ-2β(ρ-δ)-2lnμ。当δ满足

时，γ₀>0。故对于任意时间t，存在zρ<t≤(z+1)ρ，有

其中Ω₀＝e² ^ρβ+1V(0)，

从而在可以证明解耦切换系统指数稳定，即原多智能体系统能实现一致性跟踪。

步骤3-4.设计多智能体一致性跟踪协议算法：

Step1.设置β>β₀，求解不等式AP+PA^T+σ²DD^T+PE^TEP-2βP<0，得正定矩阵P；

Step4.设置智能体控制协议：

步骤3-5.多智能体通信时长满足条件具体为：

多智能体系统实现一致性所需通信时长占比条件具体满足

其中μ＝max(λ_max(Q^-1)/λ_min(P^-1),λ_max(P^-1)/λ_min(Q^-1))。

步骤4.针对通信时长占比条件达到最优，设计满足多智能体系统实现一致性的一致性跟踪协议算法。该步骤的具体过程为：

步骤4-2.基于(A,B)可镇定和图

存在有向生成树的假设，利用MATLAB中LMI工具箱求解线性矩阵不等式组：

minμ

s.t.Q>0,

P>Q,

P<μQ,

解得最优的μ，P和Q，求解得到反馈增益矩阵F＝-B^TQ^-1。求解最小通信时长δ满足步骤3-3的条件。

步骤4-3.设计智能体控制协议：

步骤5.基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体围捕控制算法。该步骤的具体过程为：

步骤5-1.设置固定围捕编队构型Ξ＝(ξ₁,ξ₂,…,ξ_N,0)∈R^n×(N+1)，其中ξ_i表示第i个智能体在编队中与领导者的相对状态。

步骤5-2.设计智能体围捕编队控制协议：

其中

c,F和δ由步骤4-1和步骤4-2得到，被捕者系统满足

以下是本发明所设计的针对间歇通信环境下多智能体一致性跟踪控制模拟仿真验证。

仿真实验1为5个跟随者智能体对领导者智能体的状态实现一致性跟踪的数值模拟实验。智能体i状态为并且x₆(t)表示领导者智能体状态，各智能体初始状态由表1所示。

表1

仿真实验中，假设跟随者智能体之间的通信拓扑为无向图，领导者智能体向部分跟随者智能体单向传输状态信息。所构建的多智能体通信拓扑图如图2所示，显然该通信拓扑图包含有向生成树。并且邻接矩阵

以及矩阵L₁分别表示为：

另外设置系统矩阵A与输入矩阵B分别为并且系统不确定矩阵ΔA以及结构矩阵D和E表示为：

另外K矩阵表示为

且σ＝0.2。

由1/min_{i＝1,2,…,N}Re(λ_i(L))＝0.86，取参数c＝0.87。另外(A,B)完全能控，所以选择α＝0.5，又Re(λ_i(A))＝0对任意的i成立，所以选择β＝0.5。将取值后的α和β带入线性矩阵不等式组：

minμ

s.t.Q>0,

P>Q,

P<μQ,

解得μ_min＝6.255，对应F＝(-10.8449,-0.1088,-4.7792)。取时间周期ρ＝5s，则取δ＝4.3384s，则6个智能体状态轨迹的一致性随时间的变化情况如图3所示。令

一致性误差定义为

其中‖·‖为2-范数。一致性误差随时间变化情况如图4所示。

从图3-1,3-2,3-3可以看出跟随者智能体的状态的三个分量随时间变化跟踪上了领导者智能体对应状态，图4中一致性误差随时间变化最终也趋向于0。以上数据验证了本发明针对间歇通信环境所设计的一致性跟踪协议能使跟随者智能体一致跟踪上领导者智能体这一结论。

仿真实验2为5个基于二阶系统的多智能体在二维平面对被捕者进行围捕编队控制实验，基于一致性的多智能体编队控制流程示意图如图5所示。每个智能体的状态x_i(t)由其位置p_i(t)和速度v_i(t)构成，具体为x_i(t)＝(p_i(t)^T,v_i(t)^T)^T。该系统对应通信拓扑图如图6所示，并且邻接矩阵以及矩阵L₁分别表示为：

另外设置系统矩阵A和输入矩阵B分别为

系统不确定矩阵ΔA以及结构矩阵D和E表示为：

另外K矩阵表示为且σ＝0.15。

设置固定正五边形围捕编队构型为Ξ＝(ξ₁,ξ₂,…,ξ₅,0_4×1)，其中

各智能体初始状态x(0)＝(x₁(0),x₂(0),x₃(0),x₄(0),x₅(0),x₆(0))设置为：

由1/min_{i＝2,3,…,N}Re(λ_i(L))＝1.9275，取参数c＝1.9375。另外(A,B)完全能控，所以选择α＝0.5，又Re(λ_i(A))＝0对任意的i成立，所以选择β＝0.5。将取值后的α和β带入线性矩阵不等式组：

minμ

s.t.Q>0,

P>Q,

P<μQ,

解得μ_min＝1.8447，对应取时间周期ρ＝5s，则

取δ＝3.1173s，则6个智能体位置轨迹随时间的变化情况如图7所示。令

各智能体编队误差定义为Error_i(t)＝‖(x_i(t)-ξ_i)-ζ(t)‖²，其中‖·‖为2-范数。各智能体编队误差随时间变化情况如图8所示。

图7体现了在间歇通信环境下第1-5号智能体位置实现既定正五边形围捕编队且被捕智能体处于该队形中间，图8体现了各智能体编队误差最终均趋向于0。这说明了本发明针对间歇通信环境下的多智能体围捕编队控制一致性协议设计的有效性。

综合以上两个仿真实验，本发明所设计的多智能体一致性跟踪协议以及基于一致性的围捕编队协议在间歇通信环境下满足了多智能体实现一致性跟踪以及实现对应围捕编队的要求。

本发明提供了一种间歇通信环境下实现多智能体一致性跟踪的协议设计方法以及一种间歇通信环境下实现多智能体围捕编队的协议设计方法，基于这两种协议设计方法，多智能体在实现一致性跟踪以及实现指定围捕编队方面有令人满意的结果。另外本发明提供了多智能体系统一致性问题与一组解耦切换系统的稳定性问题等价转化方法以及基于线性矩阵不等式(LMI)的解耦切换系统李雅普诺夫函数构造方法。

以上仅是本发明的优选实施方式，应当指出，以上实施列对本发明不构成限定，相关工作人员在不偏离本发明技术思想的范围内，所进行的多样变化和修改，均落在本发明的保护范围内。

Claims

1.一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，其特征在于，该方法包括以下步骤：

步骤1：对于处于通信受间歇DoS攻击下的多智能体，构建智能体的微分方程模型；

步骤2：利用切换系统稳定性理论，将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题；

步骤3：利用线性矩阵不等式(LMI)，构建解耦切换系统李雅普诺夫函数，设计多智能体协同一致性跟踪协议算法及通信时长占比条件；

步骤4：基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体一致性跟踪协议算法；

步骤5：基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体围捕控制算法。

2.如权利要求1所述适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，其特征在于，步骤1中处于间歇通信环境下智能体微分方程模型，具体为：

领导者动力学为：

跟随者动力学为：

其中x_i(t)为第i个多智能体的状态向量，

为状态的导函数，A为系统矩阵，ΔA为系统不确定性满足结构ΔA＝DKE，K为不确定变量，且为对角矩阵，满足K^TK≤σ²I,σ为给定常数，c为耦合强度，B为输入矩阵，F为反馈增益矩阵，a_ij为通信拓扑图

对应邻接矩阵

中的元素，ρ表示一个周期时间段对应时长，δ表示一周期时间段中智能体之间存在通信的时长，这里跟随者之间的通信拓扑图为无向图。

3.如权利要求2所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，其特征在在于，步骤2中多智能体系统一致性问题转化为一组解耦切换系统的渐近稳定问题的理论依据具体为：

步骤2-1.令

和

并满足

由克罗内克积的性质可得：

从而把一致性跟踪问题等价于(3)中r(t)＝0的稳定性问题，其中

为包含N+1个智能体的通信拓扑图的拉普拉斯矩阵，L₁为N×N矩阵；

步骤2-2.令

其中

T^-1L₁T＝U，其中U＝diag(λ₁,…,λ_N)为正定对角矩阵,0<λ₁≤…≤λ_N，从而可得：

从而(1)中x_i(t)的一致性问题可以转化为(3)中ε_i(t)的渐近稳定性问题，由切换系统稳定性定理，(4)式系统渐近稳定等价矩阵

舒尔稳定，其中

从而x_i(t)的一致性问题转化为系统

的渐近稳定性问题。

4.如权利要求3所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，其特征在在于，步骤3中利用线性矩阵不等式(LMI)，构建解耦切换系统李雅普诺夫函数，设计多智能体一致性跟踪协议算法及通信时长占比条件，具体为：

步骤3-1.利用的矩阵不等式为：

AP+PA^T+σ²DD^T+PE^TEP-2βP<0, (6)

其中A＝(a_ij)_n×n为实矩阵，P∈R^n×n为正定矩阵，β₀为A+DKE特征值中实部的最大值，且β>β₀；

AQ+QA^T-2BB^T+σ²DD^T+QE^TEQ+2αQ<0, (7)

步骤3-2.利用Schur引理将矩阵不等式(6)和(7)转化为线性矩阵不等式：

步骤3-3.根据线性矩阵不等式(8),(9)，构造解耦切换系统(5)的李雅普诺夫函数：

其中P为根据线性矩阵不等式(8)得出的正定矩阵，Q为根据不等式(9)得出的正定矩阵；

步骤3-4.基于(A,B)可镇定和图

存在有向生成树的假设，设计的多智能体协一致性协议算法为：

Step1.设置β>β₀，求解不等式(8)，得到正定矩阵P；

Step2.选择α>0，求解不等式(9)，得到正定矩阵Q；

Step3.设置反馈增益矩阵F＝-B^TQ^-1，选择耦合强度c≥1/Re(λ₁)，其中Re(λ₁)为λ₁的实部；

Step4.设置智能体控制协议：

步骤3-5.设计多智能体通信时长满足不等式为

其中μ＝max(λ_max(Q^-1)/λ_min(P^-1),λ_max(P^-1)/λ_min(Q^-1))。

5.如权利要求4所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，其特征在在于，步骤4中基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体一致性跟踪协议算法，具体为：

步骤4-1.按照步骤3-4选择合适的β>β₀和α>0，并选择耦合强度c≥1/Re(λ₁)；

步骤4-2.基于(A,B)可镇定和图存在有向生成树的假设，求解线性矩阵不等式组：

得到最优的μ，P和Q，求解得到反馈增益矩阵F＝-B^TQ^-1。求解最小通信时长δ满足(11)。

步骤4-3.设计智能体控制协议：

6.如权利要求5所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法，其特征在在于，步骤5中基于线性矩阵不等式(LMI)及最小通信时长占比，设计多智能体围捕控制算法，具体为：

步骤5-2.设计智能体控制器控制协议：

其中c,F和δ由步骤4-1和步骤4-2得到，另外有B_N+1(t)≡0。