CN110716582A - 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 - Google Patents

适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 Download PDF

Info

Publication number
CN110716582A
CN110716582A CN201910984502.5A CN201910984502A CN110716582A CN 110716582 A CN110716582 A CN 110716582A CN 201910984502 A CN201910984502 A CN 201910984502A CN 110716582 A CN110716582 A CN 110716582A
Authority
CN
China
Prior art keywords
agent
matrix
communication
consistency
designing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910984502.5A
Other languages
English (en)
Other versions
CN110716582B (zh
Inventor
温广辉
胡一帆
吕跃祖
付俊杰
周佳玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910984502.5A priority Critical patent/CN110716582B/zh
Publication of CN110716582A publication Critical patent/CN110716582A/zh
Application granted granted Critical
Publication of CN110716582B publication Critical patent/CN110716582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种通信受间歇DoS攻击的不确定多智能体一致性跟踪协议设计方法,包括:对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型;利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题;利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件;基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法;基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。

Description

适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设 计方法
技术领域:
本发明涉及一种在间歇通信的环境下多智能体一致性跟踪协议设计方法,基于最小通信时长占比的一致性协议算法能实现在更加苛刻的间歇通信环境下实现多智能体对目标的一致性跟踪。通过设置固定围捕编队构型,该一致性算法能实现间歇通信环境下多智能体对目标智能体编队围捕,该发明属于协同控制技术领域。
背景技术:
随着机器人,无人飞行器等智能体设备在军用和民用领域的普及,对于多机器人,多飞行器等多智能体协同控制的研究持续进行。在多智能体协同控制领域中一个重要研究方向是通过协同控制实现多智能体一致性行为。现已有的多智能体一致性控制技术有在固定通信环境对应拓扑图满足强连通条件时,多智能体能以渐近收敛的速度实现平均一致性,如技术[1](参见Olfati-Saber R,Murray RM.Consensus problems in networks ofagents with switching topology and time-delays.IEEE Transactions on AutomaticControl 2004;49(9):1520–1533.),也有当通信环境随时间变化时,当时变网络拓扑图始终包含生成树时,多智能体能实现一致性,如技术[2](参见Vicsek T,Cziroók A,Ben-Jacob E,Cohen O,Shochet I.Novel type of phase transition in a system of self-drivenparticles.Physical Review Letters 1995;75(6):1226–1229.),基于一般线性动力学以及高阶积分器的多智能体系统一致性也得到了研究,如技术[3],(Ren W,Moore KL,Chen Y.High-order and model reference consensus algorithms in cooperativecontrol ofmulti-vehicle systems.ASME Journal of Dynamic Systems,Measurement,and Control 2007;129(5):678–688.),多智能体一致性控制技术的应用包括一致性跟踪,即通过设置虚拟领导者智能体,可以实现多智能体系统一致性跟踪,如技术[4](参见HongY,Hu J,Gao L.Tracking control for multi-agent consensus with an active leaderand varibaletopology.Automatica 2006;42(7):1177–1182.)。
上述包括一致性跟踪的多智能体一致性控制技术均基于智能体之间的信息一直连续地在通讯网络中传输,即智能体传递给其邻居的信息并没有任何通信限制。近年,网络服务攻击开始出现并不断发展,其中DoS(Denial of Service)攻击通过攻击网络协议使智能体的信息无法成功传递至其邻居,在多智能体通信网络上体现为DoS攻击阻碍智能体传输信号,使其无法传递至其余智能体。在通信拓扑层面,使原本的多智能体通信拓扑图转变为空图,即所有的通信连边均被DoS攻击所破坏。这种攻击方式令当前的一致性控制技术无法控制多智能体实现一致。
考虑到现实中智能体存在的自检能力,当智能体发现其发送的信息无法传递到其余智能体的这种状态持续一段时间后,智能体能够重新修复与其邻居智能体的通信连边,从而使通信拓扑图修复为原本的通信拓扑图,此时信息传输又能恢复正常。而后DoS攻击又将重新对多智能体的通信网络进行攻击,因此对于多智能体的通信拓扑而言,其变化呈现周期性,即在一个时间周期内,一段时间为原本设计的通信拓扑,另一段时间为在DoS攻击干扰下的空图。在信息传输层面体现为在每个时间周期内的一个时间段能正常接收到邻居智能体信息,整体上体现为间歇通信。针对这种间歇通信环境下的多智能体一致性跟踪控制的研究,目前还未见到相关文献。
发明内容:
针对现有技术的不足,本发明提供一种间歇通信环境下多智能体一致性跟踪协议,以及对应李雅普诺夫函数构造,实现间歇通信环境下多智能体对目标智能体状态的一致性跟踪并实现基于一致性的多智能体围捕编队控制。本发明通过智能体之间交互自身状态信息,建立一致性跟踪协议,并得到该间歇控制协议的通信时长需满足的条件。利用线性矩阵不等式组,优化通信时长条件,得到能适应更苛刻通信条件的间歇控制协议。利用该间歇控制协议,得到通过智能体之间交互自身位置与固定围捕编队构型的差值信息的协同控制协议。
为了实现上述目的,本发明的技术方案如下,一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,所述方法包括以下步骤:
步骤1:对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型。
步骤2:利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题。具体包括:
步骤2-1:通过变量转换,将系统一致跟踪问题等价转变为稳定性问题;
步骤2-2:通过变量转换,将系统稳定性问题转变为解耦系统的渐近稳定性问题。
步骤3:利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件。具体包括:
步骤3-1:表示将使用的矩阵不等式;
步骤3-2:将矩阵不等式转变为线性矩阵不等式;
步骤3-3:构造解耦系统李雅普诺夫函数;
步骤3-4:设计多智能体一致性协议算法;
步骤3-5:设计多智能体通信时长满足条件。
步骤4:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法,具体包括:
步骤4-1:选择合适的系统参数;
步骤4-2:通过求解线性矩阵不等式组,得到相关参数及最小通信时长;
步骤4-3:设计智能体控制协议。
步骤5:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。具体包括:
步骤5-1:设计固定围捕编队构型;
步骤5-2:设计智能体控制器控制协议。
进一步地,步骤1中的具有N+1个智能体(N+1号智能体为领导者智能体)的处于间歇通信环境下的智能体分段线性动力学模型构建方法为:
首先确定智能体动力学的微分方程模型表示:
Figure BDA0002236261710000031
其中xi(t)∈Rn为第i个智能体状态,A∈Rn×n为系统矩阵,ΔA为系统不确定性满足结构ΔA=DKE,K为不确定变量,表示为对角矩阵,并满足KTK≤σ2I,σ为给定常数,B∈Rn×m为系统输入矩阵。ui(t)∈Rm为控制输入,并且有uN+1(t)≡0。
基于间歇通信环境,设计智能体在正常通信以及无通信环境中控制输入:
Figure BDA0002236261710000032
其中c>0为耦合强度,F∈Rm×n为反馈增益矩阵,ρ表示一个周期时间段对应时长,δ表示一周期时间段中智能体之间存在通信的时长。
结合式(15)和式(16),得出处于间歇通信环境下智能体分段微分方程:
步骤2中利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题具体为:
步骤2-1.设置变量
Figure BDA0002236261710000042
并满足
Figure BDA0002236261710000044
得到r(t)的动力学表示:
Figure BDA0002236261710000045
并得到关于xi(t)的一致性问题等价于ri(t)中的稳定性问题;
步骤2-2.设置变量
Figure BDA0002236261710000046
满足关系
Figure BDA0002236261710000047
其中Y2∈R(N-1)×N,得到ε(t)的动力学表示:
Figure BDA0002236261710000049
并得到关于ri(t)中的稳定性问题等价于εi(t)中的渐近稳定性问题。由切换系统稳定性定理,此系统渐近稳定等价于矩阵
Figure BDA00022362617100000410
舒尔稳定,其中
Figure BDA00022362617100000411
Figure BDA00022362617100000412
从而xi(t)的一致性跟踪问题转化为系统
Figure BDA00022362617100000413
的渐近稳定性问题。
步骤3中利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件的具体步骤为:
步骤3-1.利用的矩阵不等式为:
AP+PAT2DDT+PETEP-2βP<0,
其中A=(aij)n×n为实矩阵,P∈Rn×n为正定矩阵,β0为A+DKE特征值中实部的最大值,且β>β0
AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,
其中(A,B)可镇定,A∈Rn×n,B∈Rn×p且p≤n,P∈Rn×n为正定矩阵,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-2.利用Schur引理将上述矩阵不等式转化为线性矩阵不等式:
Figure BDA0002236261710000052
步骤3-3.设计解耦切换系统李雅普诺夫函数:
Figure BDA0002236261710000053
其中矩阵P由线性矩阵不等式AP+PAT2DDT+PETEP-2βP<0得出,β0为A+DKE特征值中实部的最大值,且β>β0。矩阵Q由AQ+QAT-2BBT2DDT+QETEQ+2αQ<0得出,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-4.多智能体一致性跟踪协议算法具体设计为:
Step1.设置β>β0,求解不等式AP+PAT2DDT+PETEP-2βP<0,得到正定矩阵P;
Step2.选择α>0,求解不等AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,,得到正定矩阵Q;
Step3.设置反馈增益矩阵F=-BTQ-1,耦合强度c≥1/Re(λ1),其中Re(λ1)为λ1的实部;
Step4.设置智能体控制协议:
Figure BDA0002236261710000054
步骤3-5.多智能体通信时长满足条件具体为:
多智能体系统实现一致性所需通信时长占比条件具体满足:其中μ=max(λmax(Q-1)/λmin(P-1),λmax(P-1)/λmin(Q-1))。
步骤4中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法具体为:
步骤4-1.按照步骤3-2选择合适的β>β0和α>0,并选择耦合强度c≥1/Re(λ1)。
步骤4-2.基于(A,B)可镇定和图
Figure BDA0002236261710000067
存在有向生成树的假设,求解线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure BDA0002236261710000061
Figure BDA0002236261710000062
得到最优的μ,P和Q,求解得到反馈增益矩阵F=-BTQ-1。求解最小通信时长δ满足步骤3-5的条件。
步骤4-3.设计智能体控制协议:
Figure BDA0002236261710000063
步骤5中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法具体为:
步骤5-1.设置固定围捕编队构型Ξ=(ξ12,…,ξN,0)∈Rn×(N+1),其中ξi表示第i个智能体在编队中与领导者的相对状态;
步骤5-2.设计智能体围捕编队控制协议:
Figure BDA0002236261710000064
其中c,F和δ由步骤4-1和步骤4-2得到,被捕者系统满足
Figure BDA0002236261710000066
针对多智能体一致性跟踪控制,本发明提出了一种在应对DoS攻击导致的间歇通信环境下的多智能体一致性跟踪控制协议设计。在多智能体系统遭受DoS攻击而无法通信时,智能体只能根据自身状态进行更新,此时智能体之间的一致性误差将有一定程度的放大,在多智能体系统能正常进行通信时,通过设计耦合强度,反馈增益矩阵可以使多智能体系统在有通信时间段能在前一时间周期无通信时间段中一致性误差放大的情况下一样使得整体一致性误差缩小,从而实现多智能体一致性。
综上所述,本发明的一致性协同控制协议可满足在通信网络遭受DoS攻击而出现间歇通信的环境中实现多智能体一致性跟踪的要求,由于基于一致性跟踪的多智能体协同控制在实际中具有良好应用优点,如机器人队伍跟踪领导者智能体完成指定任务过程中并不需要所有机器人均接收到上级指令,只需领导者智能体接收到上级指令,并将其传递给部分跟随者智能体,而跟随者智能体之间则通过相互通信,实现对领导者智能体行为的跟踪,进一步所有智能体均在跟踪到领导者智能体后完成指定任务。因此结合间歇通信环境的多智能体一致性跟踪策略能在理想通信环境下的一致性跟踪的基础上考虑实际受干扰的通信网络,进一步提高了一致性跟踪策略的实用性。此外,本发明可平行应用于多智能体在间歇通信环境下围捕编队控制的场合,根据算法特点,在修改固定围捕编队构型后,多智能体可以实现指定的任意编队,从而对复杂现实环境下的围捕具有良好适应效果,如在较为狭窄的地形环境下,可设置较小的围捕编队使得多智能体能在保持围捕编队的情况下通过此地形。并且在智能体通信层面,该算法对DoS攻击下的通信环境具有良好适应效果,即当现实环境中存在通信环境干扰时,智能体的围捕编队仍然能够实现。因此本发明在多智能体现实环境下协同编队围捕具有良好的应用前景。
附图说明
图1是本发明的针对间歇通信环境中多智能体一致性跟踪协议设计步骤示意图;
图2是本发明仿真模拟1的多智能体通信拓扑示意图;
图3是本发明仿真模拟1的状态轨迹的一致性随时间变化图;
图4是本发明仿真模拟1的一致性误差随时间变化图;
图5是本发明的针对间歇通信环境中多智能体编队控制流程示意图;
图6是本发明仿真模拟2的多智能体通信拓扑示意图;
图7是本发明仿真模拟2的智能体位置随时间变化图;
图8是本发明仿真模拟2的各智能体编队误差随时间变化图。
具体实施方式
下面将结合附图就本发明的发明目的、技术方案、发明优点作进一步详细说明。
现有的多智能体一致性控制技术要求多智能体系统能时刻接受到邻居智能体状态信息,并且智能体传递给其邻居的信息并没有任何通信限制,这对于智能体通信网络的即时通信能力有较高的要求。现实中常见网络攻击如DoS攻击对网络协议进行攻击,影响智能体接受邻居信息,从而阻碍多智能体一致性的形成。一类特殊的DoS攻击体现为周期性破坏网络协议,在该种网络攻击下,现有多智能体一致性协同控制技术无法实现多智能体一致性目标。
基于以上考虑,本发明首先建立了处于间歇通信环境下的智能体分段线性动力学模型,然后实现了多智能体系统一致性跟踪问题与一组解耦切换系统的渐近稳定性问题的等价性转化。进一步对解耦切换系统设计李雅普诺夫函数,设计了多智能体一致性跟踪协议算法并给出多智能体系统实现一致所需通信时长占比条件。接着基于多智能体系统实现一致性所需通信时长占比条件最优的目标,重新设计了多智能体一致性跟踪协议算法。最后,基于该一致性跟踪算法,设计了多智能围捕同编队控制算法。
实施例1:一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,所述方法包括以下步骤:图1表示了对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型。其构成具体如下执行:
步骤1.针对处于通信受间歇DoS攻击下的N+1个智能体,构建智能体的微分方程模型。的具体过程为:
将智能体的动力学模型首先表示为线性定长系统,以xi(t)∈Rn表示第i个智能体状态,A∈Rn×n表示系统矩阵,ΔA为系统不确定性满足结构ΔA=DKE,K为不确定变量,表示为对角矩阵,且满足KTK≤σ2I,σ为给定常数,B∈Rn×m表示系统输入矩阵,ui(t)∈Rm为控制输入。智能体系统表示为:
Figure BDA0002236261710000081
在多智能体一致性跟踪控制中,对于跟随者智能体,ui(t)主要由智能体自身状态xi(t)及其邻居智能体状态xj(t)的差值构成。因此在无通信时间段,设置控制输入ui(t)=0。在总体上,设置ui(t)满足:
其中c>0为耦合强度,F∈Rm×n为反馈增益矩阵,ρ表示一个周期时间段对应时长,δ表示一周期时间段中智能体之间存在通信的时长,aij≥0为正常通信环境下通信拓扑图对应邻接矩阵的元素,若智能体i能接收到来着智能体j的状态信息,则aij>0,若不能,则aij=0。
领导者智能体系统动力学表示为:
跟随者智能体分段线性动力学模型构建为:
Figure BDA0002236261710000092
步骤2.利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题。该步骤的具体过程为:
步骤2-1.令ri(t)=xi(t)-xN+1(t),i=1,…,N,并且对于
Figure BDA0002236261710000093
得到r(t)的动力学表示:
Figure BDA0002236261710000094
其中
Figure BDA0002236261710000095
为包含N+1个智能体的通信拓扑图的拉普拉斯矩阵,L1为N×N矩阵并且r(t)=0等价于x1(t)=x2(t)=…=xN(t),故xi(t)的一致性问题等价于ri(t)中的稳定性问题。
步骤2-2.令Y1∈RN×(N-1),Y2∈R(N-1)×N,T∈RN×N以及一个上三角矩阵U∈R(N-1)×(N-1)满足T=(1N,Y1),
Figure BDA0002236261710000096
其中U=diag(λ1,…,λN)为正定对角矩阵,0<λ1≤…≤λN。再令
Figure BDA0002236261710000097
满足得到ε(t)的动力学表示:
Figure BDA0002236261710000099
得到关于ri(t)中的稳定性问题等价于εi(t)中的渐近稳定性问题。
由切换系统稳定性定理,上述系统渐近稳定等价于矩阵舒尔稳定,其中从而xi(t)的一致性问题转化为被解耦系统
Figure BDA0002236261710000103
的渐近稳定性问题。
步骤3.利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件。该步骤的具体过程为:
步骤3-1.利用的矩阵不等式为:
AP+PAT2DDT+PETEP-2βP<0,
其中A=(aij)n×n为实矩阵,P∈Rn×n为正定矩阵,β0为A+DKE特征值中实部的最大值,且β>β0
AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,
其中(A,B)可镇定,A∈Rn×n,B∈Rn×p且p≤n,P∈Rn×n为正定矩阵,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-2.利用Schur引理将上述矩阵不等式转化为线性矩阵不等式:
Figure BDA0002236261710000104
Figure BDA0002236261710000105
步骤3-3.设置解耦切换系统李雅普诺夫函数:
其中矩阵P由线性矩阵不等式AP+PAT2DDT+PETEP-2βP<0得出,β0为A+DKE特征值中实部的最大值,且β>β0。矩阵Q由AQ+QAT-2BBT2DDT+QETEQ+2αQ<0得出,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
通过对V(t)关于t求导,得到
Figure BDA0002236261710000111
进而可以得到
Figure BDA0002236261710000118
其中γ0=2αδ-2β(ρ-δ)-2lnμ。当δ满足
Figure BDA0002236261710000112
时,γ0>0。故对于任意时间t,存在zρ<t≤(z+1)ρ,有
Figure BDA0002236261710000113
其中Ω0=e2 ρβ+1V(0),
Figure BDA0002236261710000114
从而在可以证明解耦切换系统指数稳定,即原多智能体系统能实现一致性跟踪。
步骤3-4.设计多智能体一致性跟踪协议算法:
Step1.设置β>β0,求解不等式AP+PAT2DDT+PETEP-2βP<0,得正定矩阵P;
Step2.选择α>0,求解不等AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,,得到正定矩阵Q;
Step3.设置反馈增益矩阵F=-BTQ-1,耦合强度c≥1/Re(λ1),其中Re(λ1)为λ1的实部;
Step4.设置智能体控制协议:
Figure BDA0002236261710000115
步骤3-5.多智能体通信时长满足条件具体为:
多智能体系统实现一致性所需通信时长占比条件具体满足
Figure BDA0002236261710000116
其中μ=max(λmax(Q-1)/λmin(P-1),λmax(P-1)/λmin(Q-1))。
步骤4.针对通信时长占比条件达到最优,设计满足多智能体系统实现一致性的一致性跟踪协议算法。该步骤的具体过程为:
步骤4-1.按照步骤3-2选择合适的β>β0和α>0,并选择耦合强度c≥1/Re(λ1)。
步骤4-2.基于(A,B)可镇定和图
Figure BDA0002236261710000117
存在有向生成树的假设,利用MATLAB中LMI工具箱求解线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure BDA0002236261710000121
Figure BDA0002236261710000122
解得最优的μ,P和Q,求解得到反馈增益矩阵F=-BTQ-1。求解最小通信时长δ满足步骤3-3的条件。
步骤4-3.设计智能体控制协议:
步骤5.基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。该步骤的具体过程为:
步骤5-1.设置固定围捕编队构型Ξ=(ξ12,…,ξN,0)∈Rn×(N+1),其中ξi表示第i个智能体在编队中与领导者的相对状态。
步骤5-2.设计智能体围捕编队控制协议:
Figure BDA0002236261710000124
其中
Figure BDA0002236261710000125
c,F和δ由步骤4-1和步骤4-2得到,被捕者系统满足
Figure BDA0002236261710000126
以下是本发明所设计的针对间歇通信环境下多智能体一致性跟踪控制模拟仿真验证。
仿真实验1为5个跟随者智能体对领导者智能体的状态实现一致性跟踪的数值模拟实验。智能体i状态为并且x6(t)表示领导者智能体状态,各智能体初始状态由表1所示。
表1
Figure BDA0002236261710000128
仿真实验中,假设跟随者智能体之间的通信拓扑为无向图,领导者智能体向部分跟随者智能体单向传输状态信息。所构建的多智能体通信拓扑图如图2所示,显然该通信拓扑图包含有向生成树。并且邻接矩阵
Figure BDA0002236261710000132
以及矩阵L1分别表示为:
Figure BDA0002236261710000133
另外设置系统矩阵A与输入矩阵B分别为并且系统不确定矩阵ΔA以及结构矩阵D和E表示为:
Figure BDA0002236261710000135
另外K矩阵表示为
Figure BDA0002236261710000136
且σ=0.2。
由1/mini=1,2,…,NRe(λi(L))=0.86,取参数c=0.87。另外(A,B)完全能控,所以选择α=0.5,又Re(λi(A))=0对任意的i成立,所以选择β=0.5。将取值后的α和β带入线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure BDA0002236261710000138
解得μmin=6.255,对应F=(-10.8449,-0.1088,-4.7792)。取时间周期ρ=5s,则取δ=4.3384s,则6个智能体状态轨迹的一致性随时间的变化情况如图3所示。令
Figure BDA0002236261710000141
一致性误差定义为
Figure BDA0002236261710000142
其中‖·‖为2-范数。一致性误差随时间变化情况如图4所示。
从图3-1,3-2,3-3可以看出跟随者智能体的状态的三个分量随时间变化跟踪上了领导者智能体对应状态,图4中一致性误差随时间变化最终也趋向于0。以上数据验证了本发明针对间歇通信环境所设计的一致性跟踪协议能使跟随者智能体一致跟踪上领导者智能体这一结论。
仿真实验2为5个基于二阶系统的多智能体在二维平面对被捕者进行围捕编队控制实验,基于一致性的多智能体编队控制流程示意图如图5所示。每个智能体的状态xi(t)由其位置pi(t)和速度vi(t)构成,具体为xi(t)=(pi(t)T,vi(t)T)T。该系统对应通信拓扑图如图6所示,并且邻接矩阵以及矩阵L1分别表示为:
Figure BDA0002236261710000143
另外设置系统矩阵A和输入矩阵B分别为
Figure BDA0002236261710000144
系统不确定矩阵ΔA以及结构矩阵D和E表示为:
Figure BDA0002236261710000145
另外K矩阵表示为且σ=0.15。
设置固定正五边形围捕编队构型为Ξ=(ξ12,…,ξ5,04×1),其中
Figure BDA0002236261710000147
Figure BDA0002236261710000148
各智能体初始状态x(0)=(x1(0),x2(0),x3(0),x4(0),x5(0),x6(0))设置为:
Figure BDA0002236261710000149
由1/mini=2,3,…,NRe(λi(L))=1.9275,取参数c=1.9375。另外(A,B)完全能控,所以选择α=0.5,又Re(λi(A))=0对任意的i成立,所以选择β=0.5。将取值后的α和β带入线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure BDA0002236261710000151
Figure BDA0002236261710000152
解得μmin=1.8447,对应取时间周期ρ=5s,则
Figure BDA0002236261710000154
取δ=3.1173s,则6个智能体位置轨迹随时间的变化情况如图7所示。令
Figure BDA0002236261710000155
各智能体编队误差定义为Errori(t)=‖(xi(t)-ξi)-ζ(t)‖2,其中‖·‖为2-范数。各智能体编队误差随时间变化情况如图8所示。
图7体现了在间歇通信环境下第1-5号智能体位置实现既定正五边形围捕编队且被捕智能体处于该队形中间,图8体现了各智能体编队误差最终均趋向于0。这说明了本发明针对间歇通信环境下的多智能体围捕编队控制一致性协议设计的有效性。
综合以上两个仿真实验,本发明所设计的多智能体一致性跟踪协议以及基于一致性的围捕编队协议在间歇通信环境下满足了多智能体实现一致性跟踪以及实现对应围捕编队的要求。
本发明提供了一种间歇通信环境下实现多智能体一致性跟踪的协议设计方法以及一种间歇通信环境下实现多智能体围捕编队的协议设计方法,基于这两种协议设计方法,多智能体在实现一致性跟踪以及实现指定围捕编队方面有令人满意的结果。另外本发明提供了多智能体系统一致性问题与一组解耦切换系统的稳定性问题等价转化方法以及基于线性矩阵不等式(LMI)的解耦切换系统李雅普诺夫函数构造方法。
以上仅是本发明的优选实施方式,应当指出,以上实施列对本发明不构成限定,相关工作人员在不偏离本发明技术思想的范围内,所进行的多样变化和修改,均落在本发明的保护范围内。

Claims (6)

1.一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在于,该方法包括以下步骤:
步骤1:对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型;
步骤2:利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题;
步骤3:利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件;
步骤4:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法;
步骤5:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。
2.如权利要求1所述适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在于,步骤1中处于间歇通信环境下智能体微分方程模型,具体为:
领导者动力学为:
Figure FDA0002236261700000011
跟随者动力学为:
Figure FDA0002236261700000012
其中xi(t)为第i个多智能体的状态向量,
Figure FDA0002236261700000013
为状态的导函数,A为系统矩阵,ΔA为系统不确定性满足结构ΔA=DKE,K为不确定变量,且为对角矩阵,满足KTK≤σ2I,σ为给定常数,c为耦合强度,B为输入矩阵,F为反馈增益矩阵,aij为通信拓扑图
Figure FDA0002236261700000014
对应邻接矩阵
Figure FDA0002236261700000015
中的元素,ρ表示一个周期时间段对应时长,δ表示一周期时间段中智能体之间存在通信的时长,这里跟随者之间的通信拓扑图为无向图。
3.如权利要求2所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在在于,步骤2中多智能体系统一致性问题转化为一组解耦切换系统的渐近稳定问题的理论依据具体为:
步骤2-1.令
Figure FDA0002236261700000021
Figure FDA0002236261700000022
并满足
Figure FDA0002236261700000023
由克罗内克积的性质可得:
Figure FDA0002236261700000024
从而把一致性跟踪问题等价于(3)中r(t)=0的稳定性问题,其中
Figure FDA0002236261700000025
为包含N+1个智能体的通信拓扑图的拉普拉斯矩阵,L1为N×N矩阵;
步骤2-2.令
Figure FDA0002236261700000026
其中
Figure FDA0002236261700000027
T-1L1T=U,其中U=diag(λ1,…,λN)为正定对角矩阵,0<λ1≤…≤λN,从而可得:
Figure FDA0002236261700000028
从而(1)中xi(t)的一致性问题可以转化为(3)中εi(t)的渐近稳定性问题,由切换系统稳定性定理,(4)式系统渐近稳定等价矩阵
Figure FDA0002236261700000029
舒尔稳定,其中
Figure FDA00022362617000000210
Figure FDA00022362617000000211
从而xi(t)的一致性问题转化为系统
的渐近稳定性问题。
4.如权利要求3所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在在于,步骤3中利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体一致性跟踪协议算法及通信时长占比条件,具体为:
步骤3-1.利用的矩阵不等式为:
AP+PAT2DDT+PETEP-2βP<0, (6)
其中A=(aij)n×n为实矩阵,P∈Rn×n为正定矩阵,β0为A+DKE特征值中实部的最大值,且β>β0
AQ+QAT-2BBT2DDT+QETEQ+2αQ<0, (7)
其中(A,B)可镇定,A∈Rn×n,B∈Rn×p且p≤n,P∈Rn×n为正定矩阵,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-2.利用Schur引理将矩阵不等式(6)和(7)转化为线性矩阵不等式:
Figure FDA0002236261700000031
Figure FDA0002236261700000032
步骤3-3.根据线性矩阵不等式(8),(9),构造解耦切换系统(5)的李雅普诺夫函数:
Figure FDA0002236261700000033
其中P为根据线性矩阵不等式(8)得出的正定矩阵,Q为根据不等式(9)得出的正定矩阵;
步骤3-4.基于(A,B)可镇定和图
Figure FDA0002236261700000034
存在有向生成树的假设,设计的多智能体协一致性协议算法为:
Step1.设置β>β0,求解不等式(8),得到正定矩阵P;
Step2.选择α>0,求解不等式(9),得到正定矩阵Q;
Step3.设置反馈增益矩阵F=-BTQ-1,选择耦合强度c≥1/Re(λ1),其中Re(λ1)为λ1的实部;
Step4.设置智能体控制协议:
Figure FDA0002236261700000035
步骤3-5.设计多智能体通信时长满足不等式为
Figure FDA0002236261700000036
其中μ=max(λmax(Q-1)/λmin(P-1),λmax(P-1)/λmin(Q-1))。
5.如权利要求4所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在在于,步骤4中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法,具体为:
步骤4-1.按照步骤3-4选择合适的β>β0和α>0,并选择耦合强度c≥1/Re(λ1);
步骤4-2.基于(A,B)可镇定和图存在有向生成树的假设,求解线性矩阵不等式组:
Figure FDA0002236261700000041
得到最优的μ,P和Q,求解得到反馈增益矩阵F=-BTQ-1。求解最小通信时长δ满足(11)。
步骤4-3.设计智能体控制协议:
Figure FDA0002236261700000042
6.如权利要求5所述的适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在在于,步骤5中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法,具体为:
步骤5-1.设置固定围捕编队构型Ξ=(ξ12,…,ξN,0)∈Rn×(N+1),其中ξi表示第i个智能体在编队中与领导者的相对状态;
步骤5-2.设计智能体控制器控制协议:
Figure FDA0002236261700000043
其中c,F和δ由步骤4-1和步骤4-2得到,另外有BN+1(t)≡0。
CN201910984502.5A 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 Active CN110716582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910984502.5A CN110716582B (zh) 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910984502.5A CN110716582B (zh) 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Publications (2)

Publication Number Publication Date
CN110716582A true CN110716582A (zh) 2020-01-21
CN110716582B CN110716582B (zh) 2023-01-17

Family

ID=69211747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910984502.5A Active CN110716582B (zh) 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Country Status (1)

Country Link
CN (1) CN110716582B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385155A (zh) * 2020-03-18 2020-07-07 东北大学秦皇岛分校 一种基于韧性协议的分布式平均跟踪方法
CN111665848A (zh) * 2020-06-28 2020-09-15 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN112327632A (zh) * 2020-11-23 2021-02-05 哈尔滨理工大学 一种虚假数据注入攻击的多智能体系统跟踪控制方法
CN112462602A (zh) * 2020-08-21 2021-03-09 浙江大丰实业股份有限公司 一种在DoS攻击下保持移动舞台车队安全间距的分布式控制方法
CN113268078A (zh) * 2021-04-20 2021-08-17 四川大学 一种无人机群自适应环境的目标追踪围捕方法
CN113359463A (zh) * 2021-06-28 2021-09-07 大连理工大学 一种针对多智能体系统的领导跟随一致性问题的循环切换方案
CN113359474A (zh) * 2021-07-06 2021-09-07 杭州电子科技大学 基于梯度反馈的可扩展分布式多智能体一致性控制方法
CN114609909A (zh) * 2022-03-15 2022-06-10 广州大学 一种切换拓扑下的随机多智体系统控制协议的设计方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138006A (zh) * 2015-07-09 2015-12-09 哈尔滨工程大学 一种时滞非线性多智能体系统的协同追踪控制方法
CN109031958A (zh) * 2018-10-16 2018-12-18 廊坊师范学院 分数阶多智能体追踪一致性的迭代学习控制方法
CN109491249A (zh) * 2018-11-30 2019-03-19 沈阳航空航天大学 一种存在DoS攻击时多智能体系统事件触发控制器的设计方法
CN109902260A (zh) * 2019-03-05 2019-06-18 南京理工大学 三阶多智能体系统的能控性判定方法
CN110297497A (zh) * 2019-06-11 2019-10-01 沈阳航空航天大学 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138006A (zh) * 2015-07-09 2015-12-09 哈尔滨工程大学 一种时滞非线性多智能体系统的协同追踪控制方法
CN109031958A (zh) * 2018-10-16 2018-12-18 廊坊师范学院 分数阶多智能体追踪一致性的迭代学习控制方法
CN109491249A (zh) * 2018-11-30 2019-03-19 沈阳航空航天大学 一种存在DoS攻击时多智能体系统事件触发控制器的设计方法
CN109902260A (zh) * 2019-03-05 2019-06-18 南京理工大学 三阶多智能体系统的能控性判定方法
CN110297497A (zh) * 2019-06-11 2019-10-01 沈阳航空航天大学 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385155A (zh) * 2020-03-18 2020-07-07 东北大学秦皇岛分校 一种基于韧性协议的分布式平均跟踪方法
CN111665848A (zh) * 2020-06-28 2020-09-15 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN111665848B (zh) * 2020-06-28 2020-12-11 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN112462602A (zh) * 2020-08-21 2021-03-09 浙江大丰实业股份有限公司 一种在DoS攻击下保持移动舞台车队安全间距的分布式控制方法
CN112462602B (zh) * 2020-08-21 2022-05-17 浙江大丰实业股份有限公司 一种在DoS攻击下保持移动舞台车队安全间距的分布式控制方法
CN112327632A (zh) * 2020-11-23 2021-02-05 哈尔滨理工大学 一种虚假数据注入攻击的多智能体系统跟踪控制方法
CN113268078A (zh) * 2021-04-20 2021-08-17 四川大学 一种无人机群自适应环境的目标追踪围捕方法
CN113359463A (zh) * 2021-06-28 2021-09-07 大连理工大学 一种针对多智能体系统的领导跟随一致性问题的循环切换方案
CN113359474A (zh) * 2021-07-06 2021-09-07 杭州电子科技大学 基于梯度反馈的可扩展分布式多智能体一致性控制方法
CN114609909A (zh) * 2022-03-15 2022-06-10 广州大学 一种切换拓扑下的随机多智体系统控制协议的设计方法
CN114609909B (zh) * 2022-03-15 2024-07-02 广州大学 一种切换拓扑下的随机多智体系统控制协议的设计方法

Also Published As

Publication number Publication date
CN110716582B (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
CN110716582B (zh) 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法
Amirkhani et al. Consensus in multi-agent systems: a review
CN111638726B (zh) 基于事件触发通信的多无人机编队一致性控制方法
CN112327633A (zh) 具有时滞和干扰的领导跟随多智能体系统一致性的方法
CN111522361A (zh) 主-从模式的多无人机编队一致性控制方法
CN113268083B (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
Shou et al. Finite‐time formation control and obstacle avoidance of multi‐agent system with application
CN112363535A (zh) 一种领导-跟随型多飞行器的分布式协同控制方法
CN108681247B (zh) 一种完全分布式保性能通信容错编队控制方法
Zhao et al. End to end communication rate-based adaptive fault tolerant control of multi-agent systems under unreliable interconnections
Liuzza et al. Distributed model based event-triggered control for synchronization of multi-agent systems
Chen et al. Observer-based adaptive fuzzy consensus control of nonlinear multiagent systems encountering deception attacks
Davydov et al. Pursuer coordination in multi-player reach-avoid games through control barrier functions
CN111596688B (zh) 基于连续通信的多无人机编队一致性控制方法
Maxim et al. Min-max coalitional model predictive control algorithm
Qi et al. Pinning consensus control for switched multi-agent systems: A switched adaptive dynamic programming method
Chang et al. Fully distributed event-triggered affine formation maneuver control over directed graphs
Zhu et al. Networked cyber-physical systems: Interdependence, resilience and information exchange
CN117706913B (zh) 基于参考信号发生器的非线性多智能体系统输出反馈一致性控制方法
Ballal et al. Trust-based collaborative control for teams in communication networks
CN116679753B (zh) 一种异构无人系统抗欺骗攻击的编队跟踪控制方法
CN115378648B (zh) 多智能体系统的防网络攻击包含控制方法、装置及终端
CN116442212B (zh) 预置时间和精度下人在环多机械臂系统分群安全控制方法
Yang et al. Scaled Formation Control for Multi-Agent Systems via A Dynamic Event-Triggered Mechanism
Jenabzadeh et al. Distributed estimation and control over mobile sensor networks with jointly connected topology: Event-triggered approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant