CN110716582B - 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 - Google Patents

适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 Download PDF

Info

Publication number
CN110716582B
CN110716582B CN201910984502.5A CN201910984502A CN110716582B CN 110716582 B CN110716582 B CN 110716582B CN 201910984502 A CN201910984502 A CN 201910984502A CN 110716582 B CN110716582 B CN 110716582B
Authority
CN
China
Prior art keywords
agent
matrix
communication
consistency
inequality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910984502.5A
Other languages
English (en)
Other versions
CN110716582A (zh
Inventor
温广辉
胡一帆
吕跃祖
付俊杰
周佳玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Huizi Robot Technology Co.,Ltd.
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910984502.5A priority Critical patent/CN110716582B/zh
Publication of CN110716582A publication Critical patent/CN110716582A/zh
Application granted granted Critical
Publication of CN110716582B publication Critical patent/CN110716582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种通信受间歇DoS攻击的不确定多智能体一致性跟踪协议设计方法,包括:对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型;利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题;利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件;基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法;基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。

Description

适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设 计方法
技术领域:
本发明涉及一种在间歇通信的环境下多智能体一致性跟踪协议设计方法,基于最小通信时长占比的一致性协议算法能实现在更加苛刻的间歇通信环境下实现多智能体对目标的一致性跟踪。通过设置固定围捕编队构型,该一致性算法能实现间歇通信环境下多智能体对目标智能体编队围捕,该发明属于协同控制技术领域。
背景技术:
随着机器人,无人飞行器等智能体设备在军用和民用领域的普及,对于多机器人,多飞行器等多智能体协同控制的研究持续进行。在多智能体协同控制领域中一个重要研究方向是通过协同控制实现多智能体一致性行为。现已有的多智能体一致性控制技术有在固定通信环境对应拓扑图满足强连通条件时,多智能体能以渐近收敛的速度实现平均一致性,如技术[1](参见Olfati-Saber R,Murray RM.Consensus problems in networks ofagents with switching topology and time-delays.IEEE Transactions on AutomaticControl 2004;49(9):1520–1533.),也有当通信环境随时间变化时,当时变网络拓扑图始终包含生成树时,多智能体能实现一致性,如技术[2](参见Vicsek T,Cziroók A,Ben-Jacob E,Cohen O,Shochet I.Novel type of phase transition in a system of self-drivenparticles.Physical Review Letters 1995;75(6):1226–1229.),基于一般线性动力学以及高阶积分器的多智能体系统一致性也得到了研究,如技术[3],(Ren W,Moore KL,Chen Y.High-order and model reference consensus algorithms in cooperativecontrol ofmulti-vehicle systems.ASME Journal of Dynamic Systems,Measurement,and Control 2007;129(5):678–688.),多智能体一致性控制技术的应用包括一致性跟踪,即通过设置虚拟领导者智能体,可以实现多智能体系统一致性跟踪,如技术[4](参见HongY,Hu J,Gao L.Tracking control for multi-agent consensus with an active leaderand varibaletopology.Automatica 2006;42(7):1177–1182.)。
上述包括一致性跟踪的多智能体一致性控制技术均基于智能体之间的信息一直连续地在通讯网络中传输,即智能体传递给其邻居的信息并没有任何通信限制。近年,网络服务攻击开始出现并不断发展,其中DoS(Denial of Service)攻击通过攻击网络协议使智能体的信息无法成功传递至其邻居,在多智能体通信网络上体现为DoS攻击阻碍智能体传输信号,使其无法传递至其余智能体。在通信拓扑层面,使原本的多智能体通信拓扑图转变为空图,即所有的通信连边均被DoS攻击所破坏。这种攻击方式令当前的一致性控制技术无法控制多智能体实现一致。
考虑到现实中智能体存在的自检能力,当智能体发现其发送的信息无法传递到其余智能体的这种状态持续一段时间后,智能体能够重新修复与其邻居智能体的通信连边,从而使通信拓扑图修复为原本的通信拓扑图,此时信息传输又能恢复正常。而后DoS攻击又将重新对多智能体的通信网络进行攻击,因此对于多智能体的通信拓扑而言,其变化呈现周期性,即在一个时间周期内,一段时间为原本设计的通信拓扑,另一段时间为在DoS攻击干扰下的空图。在信息传输层面体现为在每个时间周期内的一个时间段能正常接收到邻居智能体信息,整体上体现为间歇通信。针对这种间歇通信环境下的多智能体一致性跟踪控制的研究,目前还未见到相关文献。
发明内容:
针对现有技术的不足,本发明提供一种间歇通信环境下多智能体一致性跟踪协议,以及对应李雅普诺夫函数构造,实现间歇通信环境下多智能体对目标智能体状态的一致性跟踪并实现基于一致性的多智能体围捕编队控制。本发明通过智能体之间交互自身状态信息,建立一致性跟踪协议,并得到该间歇控制协议的通信时长需满足的条件。利用线性矩阵不等式组,优化通信时长条件,得到能适应更苛刻通信条件的间歇控制协议。利用该间歇控制协议,得到通过智能体之间交互自身位置与固定围捕编队构型的差值信息的协同控制协议。
为了实现上述目的,本发明的技术方案如下,一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,所述方法包括以下步骤:
步骤1:对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型。
步骤2:利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题。具体包括:
步骤2-1:通过变量转换,将系统一致跟踪问题等价转变为稳定性问题;
步骤2-2:通过变量转换,将系统稳定性问题转变为解耦系统的渐近稳定性问题。
步骤3:利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件。具体包括:
步骤3-1:表示将使用的矩阵不等式;
步骤3-2:将矩阵不等式转变为线性矩阵不等式;
步骤3-3:构造解耦系统李雅普诺夫函数;
步骤3-4:设计多智能体一致性协议算法;
步骤3-5:设计多智能体通信时长满足条件。
步骤4:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法,具体包括:
步骤4-1:选择合适的系统参数;
步骤4-2:通过求解线性矩阵不等式组,得到相关参数及最小通信时长;
步骤4-3:设计智能体控制协议。
步骤5:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。
具体包括:
步骤5-1:设计固定围捕编队构型;
步骤5-2:设计智能体控制器控制协议。
进一步地,步骤1中的具有N+1个智能体(N+1号智能体为领导者智能体)的处于间歇通信环境下的智能体分段线性动力学模型构建方法为:
首先确定智能体动力学的微分方程模型表示:
Figure GDA0003843840090000031
其中xi(t)∈Rn为第i个智能体状态,A∈Rn×n为系统矩阵,ΔA为系统不确定性满足结构ΔA=DKE,K为不确定变量,表示为对角矩阵,并满足KTK≤σ2I,σ为给定常数,B∈Rn×m为系统输入矩阵。ui(t)∈Rm为控制输入,并且有uN+1(t)≡0。
基于间歇通信环境,设计智能体在正常通信以及无通信环境中控制输入:
Figure GDA0003843840090000032
其中c>0为耦合强度,F∈Rm×n为反馈增益矩阵,ρ表示一个周期时间段对应时长,δ表示一周期时间段中智能体之间存在通信的时长。
结合式(15)和式(16),得出处于间歇通信环境下智能体分段微分方程:
Figure GDA0003843840090000033
步骤2中利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题具体为:
步骤2-1.设置变量
Figure GDA0003843840090000034
Figure GDA0003843840090000035
并满足
Figure GDA0003843840090000036
得到r(t)的动力学表示:
Figure GDA0003843840090000041
并得到关于xi(t)的一致性问题等价于ri(t)中的稳定性问题;
步骤2-2.设置变量
Figure GDA0003843840090000042
满足关系
Figure GDA0003843840090000043
其中
Figure GDA0003843840090000044
得到ε(t)的动力学表示:
Figure GDA0003843840090000045
并得到关于ri(t)中的稳定性问题等价于εi(t)中的渐近稳定性问题。由切换系统稳定性定理,此系统渐近稳定等价于矩阵
Figure GDA0003843840090000046
舒尔稳定,其中
Figure GDA0003843840090000047
Figure GDA0003843840090000048
从而xi(t)的一致性跟踪问题转化为系统
Figure GDA0003843840090000049
的渐近稳定性问题。
步骤3中利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件的具体步骤为:
步骤3-1.利用的矩阵不等式为:
AP+PAT2DDT+PETEP-2βP<0,
其中A=(aij)n×n为实矩阵,P∈Rn×n为正定矩阵,β0为A+DKE特征值中实部的最大值,且β>β0
AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,
其中(A,B)可镇定,A∈Rn×n,B∈Rn×p且p≤n,P∈Rn×n为正定矩阵,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-2.利用Schur引理将上述矩阵不等式转化为线性矩阵不等式:
Figure GDA00038438400900000410
Figure GDA00038438400900000411
步骤3-3.设计解耦切换系统李雅普诺夫函数:
Figure GDA0003843840090000051
其中矩阵P由线性矩阵不等式AP+PAT2DDT+PETEP-2βP<0得出,β0为A+DKE特征值中实部的最大值,且β>β0。矩阵Q由AQ+QAT-2BBT2DDT+QETEQ+2αQ<0得出,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-4.多智能体一致性跟踪协议算法具体设计为:
Step1.设置β>β0,求解不等式AP+PAT2DDT+PETEP-2βP<0,得到正定矩阵P;
Step2.选择α>0,求解不等AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,,得到正定矩阵Q;
Step3.设置反馈增益矩阵F=-BTQ-1,耦合强度c≥1/Re(λ1),其中Re(λ1)为λ1的实部;
Step4.设置智能体控制协议:
Figure GDA0003843840090000052
步骤3-5.多智能体通信时长满足条件具体为:
多智能体系统实现一致性所需通信时长占比条件具体满足:
Figure GDA0003843840090000053
其中μ=max(λmax(Q-1)/λmin(P-1),λmax(P-1)/λmin(Q-1))。
步骤4中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法具体为:
步骤4-1.按照步骤3-2选择合适的β>β0和α>0,并选择耦合强度c≥1/Re(λ1)。
步骤4-2.基于(A,B)可镇定和图G存在有向生成树的假设,求解线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure GDA0003843840090000054
Figure GDA0003843840090000055
得到最优的μ,P和Q,求解得到反馈增益矩阵F=-BTQ-1。求解最小通信时长δ满足步骤3-5的条件。
步骤4-3.设计智能体控制协议:
Figure GDA0003843840090000061
步骤5中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法具体为:
步骤5-1.设置固定围捕编队构型Ξ=(ξ12,…,ξN,0)∈Rn×(N+1),其中ξi表示第i个智能体在编队中与领导者的相对状态;
步骤5-2.设计智能体围捕编队控制协议:
Figure GDA0003843840090000062
其中
Figure GDA0003843840090000063
i=1,…,N,c,F和δ由步骤4-1和步骤4-2得到,被捕者系统满足
Figure GDA0003843840090000064
针对多智能体一致性跟踪控制,本发明提出了一种在应对DoS攻击导致的间歇通信环境下的多智能体一致性跟踪控制协议设计。在多智能体系统遭受DoS攻击而无法通信时,智能体只能根据自身状态进行更新,此时智能体之间的一致性误差将有一定程度的放大,在多智能体系统能正常进行通信时,通过设计耦合强度,反馈增益矩阵可以使多智能体系统在有通信时间段能在前一时间周期无通信时间段中一致性误差放大的情况下一样使得整体一致性误差缩小,从而实现多智能体一致性。
综上所述,本发明的一致性协同控制协议可满足在通信网络遭受DoS攻击而出现间歇通信的环境中实现多智能体一致性跟踪的要求,由于基于一致性跟踪的多智能体协同控制在实际中具有良好应用优点,如机器人队伍跟踪领导者智能体完成指定任务过程中并不需要所有机器人均接收到上级指令,只需领导者智能体接收到上级指令,并将其传递给部分跟随者智能体,而跟随者智能体之间则通过相互通信,实现对领导者智能体行为的跟踪,进一步所有智能体均在跟踪到领导者智能体后完成指定任务。因此结合间歇通信环境的多智能体一致性跟踪策略能在理想通信环境下的一致性跟踪的基础上考虑实际受干扰的通信网络,进一步提高了一致性跟踪策略的实用性。此外,本发明可平行应用于多智能体在间歇通信环境下围捕编队控制的场合,根据算法特点,在修改固定围捕编队构型后,多智能体可以实现指定的任意编队,从而对复杂现实环境下的围捕具有良好适应效果,如在较为狭窄的地形环境下,可设置较小的围捕编队使得多智能体能在保持围捕编队的情况下通过此地形。并且在智能体通信层面,该算法对DoS攻击下的通信环境具有良好适应效果,即当现实环境中存在通信环境干扰时,智能体的围捕编队仍然能够实现。因此本发明在多智能体现实环境下协同编队围捕具有良好的应用前景。
附图说明
图1是本发明的针对间歇通信环境中多智能体一致性跟踪协议设计步骤示意图;
图2是本发明仿真模拟1的多智能体通信拓扑示意图;
图3-1是多智能体状态第一个分量随时间变化图;
图3-2是多智能体状态第二个分量随时间变化图;
图3-3是多智能体状态第三个分量随时间变化图;
图4是本发明仿真模拟1的一致性误差随时间变化图;
图5是本发明的针对间歇通信环境中多智能体编队控制流程示意图;
图6是本发明仿真模拟2的多智能体通信拓扑示意图;
图7是本发明仿真模拟2的智能体位置随时间变化图;
图8是本发明仿真模拟2的各智能体编队误差随时间变化图。
具体实施方式
下面将结合附图就本发明的发明目的、技术方案、发明优点作进一步详细说明。
现有的多智能体一致性控制技术要求多智能体系统能时刻接受到邻居智能体状态信息,并且智能体传递给其邻居的信息并没有任何通信限制,这对于智能体通信网络的即时通信能力有较高的要求。现实中常见网络攻击如DoS攻击对网络协议进行攻击,影响智能体接受邻居信息,从而阻碍多智能体一致性的形成。一类特殊的DoS攻击体现为周期性破坏网络协议,在该种网络攻击下,现有多智能体一致性协同控制技术无法实现多智能体一致性目标。
基于以上考虑,本发明首先建立了处于间歇通信环境下的智能体分段线性动力学模型,然后实现了多智能体系统一致性跟踪问题与一组解耦切换系统的渐近稳定性问题的等价性转化。进一步对解耦切换系统设计李雅普诺夫函数,设计了多智能体一致性跟踪协议算法并给出多智能体系统实现一致所需通信时长占比条件。接着基于多智能体系统实现一致性所需通信时长占比条件最优的目标,重新设计了多智能体一致性跟踪协议算法。最后,基于该一致性跟踪算法,设计了多智能围捕同编队控制算法。
实施例1:一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,所述方法包括以下步骤:图1表示了对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型。其构成具体如下执行:
步骤1.针对处于通信受间歇DoS攻击下的N+1个智能体,构建智能体的微分方程模型。的具体过程为:
将智能体的动力学模型首先表示为线性定长系统,以xi(t)∈Rn表示第i个智能体状态,A∈Rn×n表示系统矩阵,ΔA为系统不确定性满足结构ΔA=DKE,K为不确定变量,表示为对角矩阵,且满足KTK≤σ2I,σ为给定常数,B∈Rn×m表示系统输入矩阵,ui(t)∈Rm为控制输入。智能体系统表示为:
Figure GDA0003843840090000081
在多智能体一致性跟踪控制中,对于跟随者智能体,ui(t)主要由智能体自身状态xi(t)及其邻居智能体状态xj(t)的差值构成。因此在无通信时间段,设置控制输入ui(t)=0。在总体上,设置ui(t)满足:
Figure GDA0003843840090000082
其中c>0为耦合强度,F∈Rm×n为反馈增益矩阵,ρ表示一个周期时间段对应时长,δ表示一周期时间段中智能体之间存在通信的时长,aij≥0为正常通信环境下通信拓扑图对应邻接矩阵的元素,若智能体i能接收到来着智能体j的状态信息,则aij>0,若不能,则aij=0。
领导者智能体系统动力学表示为:
Figure GDA0003843840090000083
跟随者智能体分段线性动力学模型构建为:
Figure GDA0003843840090000084
步骤2.利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题。该步骤的具体过程为:
步骤2-1.令ri(t)=xi(t)-xN+1(t),i=1,…,N,并且对于
Figure GDA0003843840090000085
得到r(t)的动力学表示:
Figure GDA0003843840090000091
其中
Figure GDA0003843840090000092
为包含N+1个智能体的通信拓扑图的拉普拉斯矩阵,L1为N×N矩阵并且r(t)=0等价于x1(t)=x2(t)=…=xN(t),故xi(t)的一致性问题等价于ri(t)中的稳定性问题。
步骤2-2.令Y1∈RN×(N-1),Y2∈R(N-1)×N,T∈RN×N以及一个上三角矩阵U∈R(N-1)×(N-1)满足T=(1N,Y1),
Figure GDA0003843840090000093
其中U=diag(λ1,…,λN)为正定对角矩阵,0<λ1≤…≤λN。再令
Figure GDA0003843840090000094
满足
Figure GDA0003843840090000095
得到ε(t)的动力学表示:
Figure GDA0003843840090000096
得到关于ri(t)中的稳定性问题等价于εi(t)中的渐近稳定性问题。
由切换系统稳定性定理,上述系统渐近稳定等价于矩阵
Figure GDA0003843840090000097
舒尔稳定,其中
Figure GDA0003843840090000098
从而xi(t)的一致性问题转化为被解耦系统
Figure GDA0003843840090000099
的渐近稳定性问题。
步骤3.利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件。该步骤的具体过程为:
步骤3-1.利用的矩阵不等式为:
AP+PAT2DDT+PETEP-2βP<0,
其中A=(aij)n×n为实矩阵,P∈Rn×n为正定矩阵,β0为A+DKE特征值中实部的最大值,且β>β0
AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,
其中(A,B)可镇定,A∈Rn×n,B∈Rn×p且p≤n,P∈Rn×n为正定矩阵,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
步骤3-2.利用Schur引理将上述矩阵不等式转化为线性矩阵不等式:
Figure GDA0003843840090000101
Figure GDA0003843840090000102
步骤3-3.设置解耦切换系统李雅普诺夫函数:
Figure GDA0003843840090000103
其中矩阵P由线性矩阵不等式AP+PAT2DDT+PETEP-2βP<0得出,β0为A+DKE特征值中实部的最大值,且β>β0。矩阵Q由AQ+QAT-2BBT2DDT+QETEQ+2αQ<0得出,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0。当(A,B)完全可控时,α可取任意值。
通过对V(t)关于t求导,得到
Figure GDA0003843840090000104
进而可以得到V(ρ)<e-γ0V(0),其中γ0=2αδ-2β(ρ-δ)-2lnμ。当δ满足
Figure GDA0003843840090000105
时,γ0>0。故对于任意时间t,存在zρ<t≤(z+1)ρ,有
Figure GDA0003843840090000106
其中Ω0=e2ρβ+ 1V(0),
Figure GDA0003843840090000107
从而在可以证明解耦切换系统指数稳定,即原多智能体系统能实现一致性跟踪。
步骤3-4.设计多智能体一致性跟踪协议算法:
Step1.设置β>β0,求解不等式AP+PAT2DDT+PETEP-2βP<0,得正定矩阵P;
Step2.选择α>0,求解不等AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,,得到正定矩阵Q;
Step3.设置反馈增益矩阵F=-BTQ-1,耦合强度c≥1/Re(λ1),其中Re(λ1)为λ1的实部;
Step4.设置智能体控制协议:
Figure GDA0003843840090000108
步骤3-5.多智能体通信时长满足条件具体为:
多智能体系统实现一致性所需通信时长占比条件具体满足
Figure GDA0003843840090000109
其中μ=max(λmax(Q-1)/λmin(P-1),λmax(P-1)/λmin(Q-1))。
步骤4.针对通信时长占比条件达到最优,设计满足多智能体系统实现一致性的一致性跟踪协议算法。该步骤的具体过程为:
步骤4-1.按照步骤3-2选择合适的β>β0和α>0,并选择耦合强度c≥1/Re(λ1)。
步骤4-2.基于(A,B)可镇定和图G存在有向生成树的假设,利用MATLAB中LMI工具箱求解线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure GDA0003843840090000111
Figure GDA0003843840090000112
解得最优的μ,P和Q,求解得到反馈增益矩阵F=-BTQ-1。求解最小通信时长δ满足步骤3-3的条件。
步骤4-3.设计智能体控制协议:
Figure GDA0003843840090000113
步骤5.基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法。该步骤的具体过程为:
步骤5-1.设置固定围捕编队构型Ξ=(ξ12,…,ξN,0)∈Rn×(N+1),其中ξi表示第i个智能体在编队中与领导者的相对状态。
步骤5-2.设计智能体围捕编队控制协议:
Figure GDA0003843840090000114
其中
Figure GDA0003843840090000115
i=1,…,N,c,F和δ由步骤4-1和步骤4-2得到,被捕者系统满足
Figure GDA0003843840090000116
以下是本发明所设计的针对间歇通信环境下多智能体一致性跟踪控制模拟仿真验证。
仿真实验1为5个跟随者智能体对领导者智能体的状态实现一致性跟踪的数值模拟实验。智能体i状态为
Figure GDA0003843840090000121
并且x6(t)表示领导者智能体状态,各智能体初始状态由表1所示。
表1
Figure GDA0003843840090000122
仿真实验中,假设跟随者智能体之间的通信拓扑为无向图,领导者智能体向部分跟随者智能体单向传输状态信息。所构建的多智能体通信拓扑图如图2所示,显然该通信拓扑图包含有向生成树。并且邻接矩阵
Figure GDA0003843840090000123
以及矩阵L1分别表示为:
Figure GDA0003843840090000124
另外设置系统矩阵A与输入矩阵B分别为
Figure GDA0003843840090000125
并且系统不确定矩阵ΔA以及结构矩阵D和E表示为:
Figure GDA0003843840090000126
另外K矩阵表示为
Figure GDA0003843840090000127
且σ=0.2。
由1/mini=1,2,…,NRe(λi(L))=0.86,取参数c=0.87。另外(A,B)完全能控,所以选择α=0.5,又Re(λi(A))=0对任意的i成立,所以选择β=0.5。将取值后的α和β带入线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure GDA0003843840090000131
Figure GDA0003843840090000132
解得μmin=6.255,对应F=(-10.8449,-0.1088,-4.7792)。取时间周期ρ=5s,则
Figure GDA0003843840090000133
取δ=4.3384s,则6个智能体状态轨迹的一致性随时间的变化情况如图3-1,3-2,3-3所示。令
Figure GDA0003843840090000134
一致性误差定义为
Figure GDA0003843840090000135
Figure GDA0003843840090000136
其中‖·‖为2-范数。一致性误差随时间变化情况如图4所示。
从图3-1,3-2,3-3可以看出跟随者智能体的状态的三个分量随时间变化跟踪上了领导者智能体对应状态,图4中一致性误差随时间变化最终也趋向于0。以上数据验证了本发明针对间歇通信环境所设计的一致性跟踪协议能使跟随者智能体一致跟踪上领导者智能体这一结论。
仿真实验2为5个基于二阶系统的多智能体在二维平面对被捕者进行围捕编队控制实验,基于一致性的多智能体编队控制流程示意图如图5所示。每个智能体的状态xi(t)由其位置pi(t)和速度vi(t)构成,具体为xi(t)=(pi(t)T,vi(t)T)T。该系统对应通信拓扑图如图6所示,并且邻接矩阵A以及矩阵L1分别表示为:
Figure GDA0003843840090000137
另外设置系统矩阵A和输入矩阵B分别为
Figure GDA0003843840090000138
系统不确定矩阵ΔA以及结构矩阵D和E表示为:
Figure GDA0003843840090000139
另外K矩阵表示为
Figure GDA0003843840090000141
且σ=0.15。
设置固定正五边形围捕编队构型为Ξ=(ξ12,…,ξ5,04×1),其中
Figure GDA0003843840090000142
Figure GDA0003843840090000143
i=1,…,5。各智能体初始状态x(0)=(x1(0),x2(0),x3(0),x4(0),x5(0),x6(0))设置为:
Figure GDA0003843840090000144
由1/mini=2,3,…,NRe(λi(L))=1.9275,取参数c=1.9375。另外(A,B)完全能控,所以选择α=0.5,又Re(λi(A))=0对任意的i成立,所以选择β=0.5。将取值后的α和β带入线性矩阵不等式组:
minμ
s.t.Q>0,
P>Q,
P<μQ,
Figure GDA0003843840090000145
Figure GDA0003843840090000146
解得μmin=1.8447,对应
Figure GDA0003843840090000147
取时间周期ρ=5s,则
Figure GDA0003843840090000148
取δ=3.1173s,则6个智能体位置轨迹随时间的变化情况如图7所示。令
Figure GDA0003843840090000149
各智能体编队误差定义为Errori(t)=‖(xi(t)-ξi)-ζ(t)‖2,其中‖·‖为2-范数。各智能体编队误差随时间变化情况如图8所示。
图7体现了在间歇通信环境下第1-5号智能体位置实现既定正五边形围捕编队且被捕智能体处于该队形中间,图8体现了各智能体编队误差最终均趋向于0。这说明了本发明针对间歇通信环境下的多智能体围捕编队控制一致性协议设计的有效性。
综合以上两个仿真实验,本发明所设计的多智能体一致性跟踪协议以及基于一致性的围捕编队协议在间歇通信环境下满足了多智能体实现一致性跟踪以及实现对应围捕编队的要求。
本发明提供了一种间歇通信环境下实现多智能体一致性跟踪的协议设计方法以及一种间歇通信环境下实现多智能体围捕编队的协议设计方法,基于这两种协议设计方法,多智能体在实现一致性跟踪以及实现指定围捕编队方面有令人满意的结果。另外本发明提供了多智能体系统一致性问题与一组解耦切换系统的稳定性问题等价转化方法以及基于线性矩阵不等式(LMI)的解耦切换系统李雅普诺夫函数构造方法。
以上仅是本发明的优选实施方式,应当指出,以上实施列对本发明不构成限定,相关工作人员在不偏离本发明技术思想的范围内,所进行的多样变化和修改,均落在本发明的保护范围内。

Claims (1)

1.一种适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法,其特征在于,该方法包括以下步骤:
步骤1:对于处于通信受间歇DoS攻击下的多智能体,构建智能体的微分方程模型;
步骤2:利用切换系统稳定性理论,将多智能体系统一致性跟踪问题转化为一组解耦切换系统的渐近稳定问题;
步骤3:利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体协同一致性跟踪协议算法及通信时长占比条件;
步骤4:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法;
步骤5:基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法;
步骤1中处于间歇通信环境下智能体微分方程模型,具体为:
领导者动力学为:
Figure FDA0003843840080000011
跟随者动力学为:
Figure FDA0003843840080000012
其中xi(t)为第i个多智能体的状态向量,
Figure FDA0003843840080000013
为状态的导函数,A为系统矩阵,ΔA为系统不确定性满足结构ΔA=DKE,K为不确定变量,且为对角矩阵,满足KTK≤σ2I,σ为给定常数,c为耦合强度,B为输入矩阵,F为反馈增益矩阵,aij为通信拓扑图
Figure FDA0003843840080000014
对应邻接矩阵
Figure FDA0003843840080000015
中的元素,ρ表示一个周期时间段对应时长,δ表示一周期时间段中智能体之间存在通信的时长,这里跟随者之间的通信拓扑图为无向图;
步骤2中多智能体系统一致性问题转化为一组解耦切换系统的渐近稳定问题的理论依据具体为:
步骤2-1.令
Figure FDA0003843840080000016
Figure FDA0003843840080000017
并满足
Figure FDA0003843840080000018
由克罗内克积的性质可得:
Figure FDA0003843840080000019
从而把一致性跟踪问题等价于(3)中r(t)=0的稳定性问题,其中
Figure FDA00038438400800000110
为包含N+1个智能体的通信拓扑图的拉普拉斯矩阵,L1为N×N矩阵;
步骤2-2.令
Figure FDA0003843840080000021
其中
Figure FDA0003843840080000022
T-1L1T=U,其中U=diag(λ1,…,λN)为正定对角矩阵,0<λ1≤…≤λN,从而可得:
Figure FDA0003843840080000023
从而(1)中xi(t)的一致性问题可以转化为(3)中εi(t)的渐近稳定性问题,由切换系统稳定性定理,(4)式系统渐近稳定等价矩阵
Figure FDA0003843840080000024
舒尔稳定,其中
Figure FDA0003843840080000025
Figure FDA0003843840080000026
从而xi(t)的一致性问题转化为系统
Figure FDA0003843840080000027
的渐近稳定性问题;
步骤3中利用线性矩阵不等式(LMI),构建解耦切换系统李雅普诺夫函数,设计多智能体一致性跟踪协议算法及通信时长占比条件,具体为:
步骤3-1.利用的矩阵不等式为:
AP+PAT2DDT+PETEP-2βP<0,(6)
其中A=(aij)n×n为实矩阵,P∈Rn×n为正定矩阵,β0为A+DKE特征值中实部的最大值,且β>β0
AQ+QAT-2BBT2DDT+QETEQ+2αQ<0,(7)
其中(A,B)可镇定,A∈Rn×n,B∈Rn×p且p≤n,P∈Rn×n为正定矩阵,α0为矩阵A+DKE不可控模态对应特征值实部的最大值的负值,α满足α<α0,当(A,B)完全可控时,α可取任意值,
步骤3-2.利用Schur引理将矩阵不等式(6)和(7)转化为线性矩阵不等式:
Figure FDA0003843840080000028
Figure FDA0003843840080000029
步骤3-3.根据线性矩阵不等式(8),(9),构造解耦切换系统(5)的李雅普诺夫函数:
Figure FDA00038438400800000210
其中P为根据线性矩阵不等式(8)得出的正定矩阵,Q为根据不等式(9)得出的正定矩阵;
步骤3-4.基于(A,B)可镇定和图
Figure FDA0003843840080000031
存在有向生成树的假设,设计的多智能体协一致性协议算法为:
Step1.设置β>β0,求解不等式(8),得到正定矩阵P;
Step2.选择α>0,求解不等式(9),得到正定矩阵Q;
Step3.设置反馈增益矩阵F=-BTQ-1,选择耦合强度c≥1/Re(λ1),其中Re(λ1)为λ1的实部;
Step4.设置智能体控制协议:
Figure FDA0003843840080000032
步骤3-5.设计多智能体通信时长满足不等式为
Figure FDA0003843840080000033
其中μ=max(λmax(Q-1)/λmin(P-1),λmax(P-1)/λmin(Q-1));
步骤4中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体一致性跟踪协议算法,具体为:
步骤4-1.按照步骤3-4选择合适的β>β0和α>0,并选择耦合强度c≥1/Re(λ1);
步骤4-2.基于(A,B)可镇定和图G存在有向生成树的假设,求解线性矩阵不等式组:
Figure FDA0003843840080000034
得到最优的μ,P和Q,求解得到反馈增益矩阵F=-BTQ-1,求解最小通信时长δ满足(11),
步骤4-3.设计智能体控制协议:
Figure FDA0003843840080000035
步骤5中基于线性矩阵不等式(LMI)及最小通信时长占比,设计多智能体围捕控制算法,具体为:
步骤5-1.设置固定围捕编队构型Ξ=(ξ12,…,ξN,0)∈Rn×(N+1),其中ξi表示第i个智能体在编队中与领导者的相对状态;
步骤5-2.设计智能体控制器控制协议:
Figure FDA0003843840080000041
其中
Figure FDA0003843840080000042
和δ由步骤4-1和步骤4-2得到,另外有BN+1(t)≡0。
CN201910984502.5A 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法 Active CN110716582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910984502.5A CN110716582B (zh) 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910984502.5A CN110716582B (zh) 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Publications (2)

Publication Number Publication Date
CN110716582A CN110716582A (zh) 2020-01-21
CN110716582B true CN110716582B (zh) 2023-01-17

Family

ID=69211747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910984502.5A Active CN110716582B (zh) 2019-10-16 2019-10-16 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法

Country Status (1)

Country Link
CN (1) CN110716582B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111385155B (zh) * 2020-03-18 2022-06-03 东北大学秦皇岛分校 一种基于韧性协议的分布式平均跟踪方法
CN111665848B (zh) * 2020-06-28 2020-12-11 北京航空航天大学 拓扑切换下无人机与无人车异构集群编队跟踪控制方法
CN112462602B (zh) * 2020-08-21 2022-05-17 浙江大丰实业股份有限公司 一种在DoS攻击下保持移动舞台车队安全间距的分布式控制方法
CN112327632A (zh) * 2020-11-23 2021-02-05 哈尔滨理工大学 一种虚假数据注入攻击的多智能体系统跟踪控制方法
CN113268078B (zh) * 2021-04-20 2022-11-18 四川大学 一种无人机群自适应环境的目标追踪围捕方法
CN113359463A (zh) * 2021-06-28 2021-09-07 大连理工大学 一种针对多智能体系统的领导跟随一致性问题的循环切换方案
CN113359474B (zh) * 2021-07-06 2022-09-16 杭州电子科技大学 基于梯度反馈的可扩展分布式多智能体一致性控制方法
CN114609909B (zh) * 2022-03-15 2024-07-02 广州大学 一种切换拓扑下的随机多智体系统控制协议的设计方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138006A (zh) * 2015-07-09 2015-12-09 哈尔滨工程大学 一种时滞非线性多智能体系统的协同追踪控制方法
CN109031958A (zh) * 2018-10-16 2018-12-18 廊坊师范学院 分数阶多智能体追踪一致性的迭代学习控制方法
CN109491249A (zh) * 2018-11-30 2019-03-19 沈阳航空航天大学 一种存在DoS攻击时多智能体系统事件触发控制器的设计方法
CN109902260A (zh) * 2019-03-05 2019-06-18 南京理工大学 三阶多智能体系统的能控性判定方法
CN110297497A (zh) * 2019-06-11 2019-10-01 沈阳航空航天大学 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138006A (zh) * 2015-07-09 2015-12-09 哈尔滨工程大学 一种时滞非线性多智能体系统的协同追踪控制方法
CN109031958A (zh) * 2018-10-16 2018-12-18 廊坊师范学院 分数阶多智能体追踪一致性的迭代学习控制方法
CN109491249A (zh) * 2018-11-30 2019-03-19 沈阳航空航天大学 一种存在DoS攻击时多智能体系统事件触发控制器的设计方法
CN109902260A (zh) * 2019-03-05 2019-06-18 南京理工大学 三阶多智能体系统的能控性判定方法
CN110297497A (zh) * 2019-06-11 2019-10-01 沈阳航空航天大学 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Also Published As

Publication number Publication date
CN110716582A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110716582B (zh) 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法
Shahvali et al. Bipartite consensus control for fractional-order nonlinear multi-agent systems: An output constraint approach
Amirkhani et al. Consensus in multi-agent systems: a review
Ren et al. Prescribed-time cluster lag consensus control for second-order non-linear leader-following multiagent systems
Liu et al. Consensus problem of high‐order multi‐agent systems with external disturbances: An H∞ analysis approach
CN112327633A (zh) 具有时滞和干扰的领导跟随多智能体系统一致性的方法
Shahvali et al. Cooperative adaptive neural partial tracking errors constrained control for nonlinear multi‐agent systems
Shou et al. Finite‐time formation control and obstacle avoidance of multi‐agent system with application
CN113268083A (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
Liuzza et al. Distributed model based event-triggered control for synchronization of multi-agent systems
Liang et al. Hybrid event-triggered impulsive flocking control for multi-agent systems via pinning mechanism
Wang et al. Semi-global leaderless consensus of linear multi-agent systems with actuator and communication constraints
Fu et al. A cross‐coupling control approach for coordinated formation of surface vessels with uncertain disturbances
CN116679753B (zh) 一种异构无人系统抗欺骗攻击的编队跟踪控制方法
Yoo et al. A universal error transformation strategy for distributed event-triggered formation tracking of pure-feedback nonlinear multiagent systems with communication and avoidance ranges
Wang et al. Detection and defense of time‐varying formation for unmanned aerial vehicles against false data injection attacks and external disturbance
Wu et al. Dynamic consensus of high-order multi-agent systems and its application in the motion control of multiple mobile robots
Chang et al. Fully distributed event-triggered affine formation maneuver control over directed graphs
Li et al. Security-based distributed fuzzy funnel cooperative control for uncertain nonlinear multi-agent systems against DoS attacks
Wang et al. Time-varying formation tracking for multi-agent systems with maneuvering leader under DDoS attacks and actuator faults
Zhan et al. Practical fixed-time multi-group time-varying formation for second-order multi-agent systems with actuator attacks and collision avoidance
Cheng et al. Event-triggered leader-follower tracking control for interconnected systems with undirected communication graphs
CN117706913B (zh) 基于参考信号发生器的非线性多智能体系统输出反馈一致性控制方法
CN116442212B (zh) 预置时间和精度下人在环多机械臂系统分群安全控制方法
Jiang et al. Fuzzy observer based adjustable containment control for multi-agent systems against DoS attacks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20241009

Address after: Room 101-104, Gongda Zhigu Industrial Building, No. 193 Tunxi Road, Baohe District, Hefei City, Anhui Province, China 230000

Patentee after: Hefei Huizi Robot Technology Co.,Ltd.

Country or region after: China

Address before: 210096, No. four archway, Xuanwu District, Jiangsu, Nanjing 2

Patentee before: SOUTHEAST University

Country or region before: China