CN110297497B - 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法 - Google Patents

网络攻击下基于混合触发机制的多智能体系统一致性的控制方法 Download PDF

Info

Publication number
CN110297497B
CN110297497B CN201910499387.2A CN201910499387A CN110297497B CN 110297497 B CN110297497 B CN 110297497B CN 201910499387 A CN201910499387 A CN 201910499387A CN 110297497 B CN110297497 B CN 110297497B
Authority
CN
China
Prior art keywords
agent
consistency
agent system
time
network attack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910499387.2A
Other languages
English (en)
Other versions
CN110297497A (zh
Inventor
陈侠
尹立远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Aerospace University
Original Assignee
Shenyang Aerospace University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Aerospace University filed Critical Shenyang Aerospace University
Priority to CN201910499387.2A priority Critical patent/CN110297497B/zh
Publication of CN110297497A publication Critical patent/CN110297497A/zh
Application granted granted Critical
Publication of CN110297497B publication Critical patent/CN110297497B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/024Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • G05D1/104Simultaneous control of position or course in three dimensions specially adapted for aircraft involving a plurality of aircrafts, e.g. formation flying
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Remote Sensing (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Feedback Control In General (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明针对网络攻击下基于混合触发机制的多智能体系统一致性问题,属于多智能体协同一致控制技术领域,研究了网络攻击下基于混合触发机制的多智能体系统的一致性控制问题,采用伯努利变量描述混合触发机制,以减轻网络传输的负担,建立了闭环多智能体系统的数学模型,基于李雅普诺夫稳定性理论和线性矩阵不等式理论,给出使控制系统一致的充分条件,即定理1。利用具有不确定转移率的马尔可夫跳变来描述系统中拓扑的切换,本发明通过分析时变延时、切换拓扑、随机网络攻击等因素对系统的影响,可以实现多智能体系统一致性,且计算简单有效。

Description

网络攻击下基于混合触发机制的多智能体系统一致性的控制 方法
技术领域
本发明属于多智能体协同一致控制技术领域,具体说的是网络攻击下基于混合触发机制的多智能体系统一致性的控制方法。
背景技术
近十几年来,由于多智能体系统在无人机协同控制、编队控制等多方面的广泛应用而得到了广泛的研究。一致性问题是多智能体系统中的一个关键问题,一致性问题意味着多智能体系统中所有智能体的某些变量最终都必须收敛到同一状态。研究者对于一致性理论的各个方面进行了研究,包括有向/无向通信网络的多智能体一致性理论、固定/动态拓扑情况下的多智能体一致性理论、时滞系统的一致性理论、信息不确定以及异步通信情况下的多智能体一致性理论等问题,同时也在一阶、二阶和高阶一致性理论方面取得了一定的成果。为了实现一致性,通常设计一个控制器,根据本地交换的信息,控制器可以产生分布式控制动作,以保证所有智能体在某些物理量(例如位置或速度)上达成一致。值得注意的是,智能体之间的信息交换受时间延时的影响。网络通信信道有限,智能体不能对状态进行即时采样,智能体需要花费时间进行相关计算,这都会导致时延,因此所设计的控制器必须具有鲁棒性。此外,通信拓扑随时间变化的情况也经常发生,即由于临时通信丢失或智能体布局的改变而导致拓扑发生变化,即切换拓扑,从而导致协商一致协议的行为发生变化。
由于事件触发机制能够大大减少智能体之间的信息传输和智能体控制器调整的次数,因此其应用越来越广泛。然而,大多数事件触发机制总是以牺牲系统性能为代价,并且通常需要在通信数量和系统性能之间取得平衡。在多智能体系统中,优化数据传输方法仍然是一个挑战。在实际的控制系统中,通信带宽的利用率很低,在一定的时间内信息的传输量很少。针对这种系统,无论是事件触发机制还是时间触发机制都不能保证系统的最佳性能。如何解决这个问题,仍然是一个挑战。因此,本文提出了一种包括时间触发机制与事件触发机制的混合触发机制,目的就是缩短这一差距。
各国许多专家学者对多智能体的协同一致性控制进行了大量的研究,并且取得了丰硕的成果,但仍有不少影响控制系统的因素尚未考虑,主要表现在,近年来,网络的飞速发展使得控制领域网络与网络的连接更加紧密,虽然网络的引入增加了控制系统许多方面的工作效率,然而也带来了巨大的挑战,如数据包丢失、随机网络攻击、网络延时等,其中随机网络攻击是影响控制系统的一个最重要的因素。在实际的控制系统中,智能体之间的信息交互都是通过网络来实现的,因此就必须需要考虑网络安全问题,随机的网络攻击可以用非线性函数来表示。迄今为止,网络攻击下基于混合触发机制的多智能体系统一致性问题还没有文献报道。
针对网络攻击下基于混合触发机制的多智能体系统一致性问题,提出了网络攻击下多智能体系统实现一致性的控制方法。本文提出一种新的控制方法来研究网络攻击下基于混合触发机制的多智能体系统的一致性控制问题。采用随机伯努利变量描述混合触发机制以减轻网络负担。在混合触发机制下,考虑了时变延时、切换拓扑、随机网络攻击等因素的影响,建立了闭环控制系统的数学模型。基于Lyapunov稳定性理论和LMI理论,给出了系统一致的主要结果定理。利用具有不确定转移率的马尔可夫跳变来描述拓扑的切换,三种拓扑之间切换的概率是不确定的。结果表明该方法具有很好的可靠性和鲁棒性。
发明内容
本发明为了解决网络攻击下多智能体系统的一致性问题,提供了一种基于混合触发机制的多智能体系统一致性控制方法。该方法能够通过对系统中每个智能体的控制实现系统的一致性控制,还考虑了时变延时、切换拓扑、随机网络攻击等因素的影响,分析了系统在不确定因素下的一致性,因此该方法具有很好的通用性,灵活性、鲁棒性与可伸缩性。首先,为了减轻网络负担,引入了混合触发机制,为了更接近实际情况,还考虑了时变延迟、切换拓扑和随机网络攻击,其中随机网络攻击用伯努利变量来描述。其次,在通信拓扑中不存在生成树的情况下,定理1给出了系统一致的充分条件。结果表明该方法具有很好的可靠性和鲁棒性。
拉普拉斯矩阵L=[lij]为:
L=D-A (1)
其中
Figure BDA0002089678790000031
其中D为度矩阵,A为邻接矩阵,网络攻击下基于混合触发机制的多智能体系统的一致性控制,具体包括如下步骤:
步骤一:多智能体系统的运动模型建立
将多智能体系统中每个智能体看作为二维平面内运动的质点,其简化运动模型为:
Figure BDA0002089678790000032
其中xi∈Rn表示第i个智能体的状态变量,智能体动态的阶数由n决定,ui∈Rn是第i个智能体的控制输入。θt随时间的变化而变化,它表示多智能体系统在时间t的每个时刻所连接的智能体,τi(t)是影响第i个智能体的控制输入的时变延时。设τi(t)=τ+λi(t),其中τ是常数,λi(t)是随时间变化的扰动,满足
Figure BDA0002089678790000033
因此在多智能体系统中对所有的智能体有/>
Figure BDA00020896787900000412
成立。
步骤二:一致性控制器设计以及系统闭环方程建立
考虑如下一致性控制器:
Figure BDA0002089678790000041
其中K∈Rn×n是常数矩阵增益,aijt)决定当前的拓扑状态,例如,如果节点i和j之间没有通信,则aijt)=0,uit,t)表示智能体i的基于当前拓扑结构的控制输入。智能体状态的初始条件为:
Figure BDA0002089678790000042
在区间
Figure BDA0002089678790000043
内,函数μi是任意的,对应于初始条件的集合。
连续时间马尔可夫链决定参数θt的动态特性,其中马尔可夫链具有由集合
Figure BDA0002089678790000044
s给出的离散状态,其中s是多智能体系统中不同拓扑的数量。概率转换矩阵Ψ=[ψpq]的表达式如下:
Figure BDA0002089678790000045
在此式中,ψpq表示在t时刻在区间Δ>0内从拓扑p切换到拓扑q的概率,对所有的
Figure BDA00020896787900000410
都有/>
Figure BDA00020896787900000411
成立,(πpqpq)是不确定转移矩阵Π的元素。
Figure BDA0002089678790000047
在式(7)中,πpq表示从状态p切换到状态q的概率的估计值,εpq表示估计值的误差,εpq未知,且有εpq∈[-δpqpq],其中0<δpq<πpq。很明显πpq和δpq均是正的,并且
Figure BDA0002089678790000048
因此/>
Figure BDA0002089678790000049
最后,将马尔可夫链的初始分布设为υ=(υ12,K,υs)。
将(3)和(4)写成紧凑形式如下:
Figure BDA0002089678790000051
Figure BDA0002089678790000052
当混合触发机制中使用时间触发时,数据采样将按以下方式传输:
Figure BDA0002089678790000053
其中tr是正整数,它满足
Figure BDA0002089678790000054
Figure BDA0002089678790000055
是由网络引起的相应的网络延时,h是采样周期。令τ(t)=t-trh,因此式(10)可以重写为如下形式:
x1(t)=x(t-τ(t)) (11)
式中,τ(t)∈[0,τM],τM,是延迟τ(t),的最大值。
当混合触发机制中选择事件触发机制时,给出如下事件触发条件:
Figure BDA0002089678790000056
其中Ω>0,0≤σ<1,阈值误差er(t)的表达式为
Figure BDA00020896787900000517
为了便于分析,我们把区间/>
Figure BDA0002089678790000057
分成几个子区间,假设存在一个常数/>
Figure BDA0002089678790000058
满足
Figure BDA0002089678790000059
其中/>
Figure BDA00020896787900000510
并且
Figure BDA00020896787900000511
定义/>
Figure BDA00020896787900000512
且有不等式
Figure BDA00020896787900000513
成立。
经过事件触发机制的采样信号表达式如下:
x2(t)=x(t-d(t))+er(t) (13)
时间触发机制与事件触发机制之间切换的概率由随机伯努利变量α(t)来描述,则图1中的
Figure BDA00020896787900000514
的表达式如下:
Figure BDA00020896787900000515
其中0≤α(t)≤1,并且α(t)具有如下性质:
Figure BDA00020896787900000516
Figure BDA0002089678790000061
是α(t)的期望,/>
Figure BDA0002089678790000062
是α(t)的方差。
网络攻击由一个非线性函数f(x(t))来表示,则图1中
Figure BDA0002089678790000063
的表达式如下:
Figure BDA0002089678790000064
在式(16)中,f(x(t-η(t)))表示网络攻击,其中η(t)∈[0,ηM]表示网络攻击的时间延时。0≤β(t)≤1也服从伯努利分布,它表示网络攻击发生的可能性。且有:
Figure BDA0002089678790000065
因此一致性控制器(4)可以写成如下形式:
Figure BDA0002089678790000066
因此可以得到混合触发闭环多智能体系统,即
Figure BDA0002089678790000067
在式(19)中,
Figure BDA0002089678790000068
因此,一下给出一致性的定义:
定义1:当使用协商一致控制器(4)并引入混合触发机制,在随机网络攻击,不确定切换拓扑以及时变延时作用下,多智能体系统(3)可以实现均方一致性。即对任意的i≠j,在所有的初始条件和初始分布下,
Figure BDA0002089678790000069
在均方意义下均成立。
步骤三:转换多智能体系统建立
通过引入不一致的新变量,采用树型转换法可将一致性问题转化为一个稳定性问题。
zi(t)=x1(t)-xi+1(t) (20)
Figure BDA00020896787900000710
Fi(z(t))=f1(x(t))-fi+1(x(t))(22)
其中i=1,2,...,m-1,将式(20)、(21)、(22)写成紧凑形式如下:
Figure BDA0002089678790000071
Figure BDA0002089678790000072
Figure BDA0002089678790000073
并且还有
Figure BDA0002089678790000074
Figure BDA0002089678790000075
Figure BDA0002089678790000076
其中
Figure BDA0002089678790000077
U=[1m-1-Im-1],
并且WT=[0m-1-Im-1]。
对(23)式进行求导并与(19),(26),(27),(28)式联立,最后应用性质U1m=0m-1,Lk1m=0m和UW=Im-1,最后可得如下的分歧系统:
Figure BDA0002089678790000078
式中
Figure BDA0002089678790000079
因此,通过分析系统(29)的稳定性就能够完成对系统(19)的一致性分析,则定义1可重新写成如下形式:
定义2:当使用协商一致控制器(4)并引入混合触发机制时,如果系统(29)在均方意义下渐进稳定,即在任意初始条件与初始分布下,
Figure BDA0002089678790000081
在均方意义下成立,则多智能体系统(3)就可以在随机网络攻击,不确定切换拓扑以及时变延时的作用下达到均方一致性。注意:为了便于计算,θt用/>
Figure BDA00020896787900000816
来表示。
步骤四:闭环多智能体系统的一致性实现
以下定理给出了混合触发机制下多智能体系统在时变延迟控制输入、不确定切换拓扑以及随机网络攻击下实现一致性的充分条件:
定理1:给定正常数
Figure BDA0002089678790000082
τM,dM,ηM和事件触发参数σ,其中τM,dM,ηM是时延的上限。讨论闭环多智能体系统(19),其中τ>0,/>
Figure BDA0002089678790000083
并且Π的定义如式(7)所示,在式(7)中,εpq∈[-δpqpq],且对任意的/>
Figure BDA0002089678790000084
均有δpq>0,当k=1,2,...,m时,时变时延
Figure BDA0002089678790000085
则如果对任意的/>
Figure BDA00020896787900000814
都存在n(m-1)×n(m-1)维的矩阵/>
Figure BDA00020896787900000815
Figure BDA0002089678790000086
Figure BDA0002089678790000087
和S=ST>0使得下列不等式成立,闭环多智能体系统(19)就在均方意义下实现一致性。
Figure BDA0002089678790000088
Figure BDA0002089678790000089
在式(31)中,
Figure BDA00020896787900000810
Figure BDA00020896787900000811
Figure BDA00020896787900000812
Figure BDA0002089678790000091
Figure BDA0002089678790000092
Figure BDA0002089678790000093
Figure BDA0002089678790000094
/>
Figure BDA0002089678790000095
Figure BDA0002089678790000096
Figure BDA0002089678790000097
Figure BDA0002089678790000098
Figure BDA0002089678790000099
Figure BDA00020896787900000910
Figure BDA0002089678790000101
Figure BDA0002089678790000102
Figure BDA0002089678790000103
Figure BDA0002089678790000104
Figure BDA0002089678790000105
/>
Figure BDA0002089678790000106
Figure BDA0002089678790000107
Figure BDA0002089678790000108
Figure BDA0002089678790000109
Figure BDA00020896787900001010
Figure BDA00020896787900001011
Figure BDA00020896787900001012
Figure BDA0002089678790000111
证明:选取下列Lyapunov-Krasovskii随机泛函
Figure BDA00020896787900001117
Figure BDA00020896787900001118
其中zt和状态向量z(ρ)的值相对应,并且有
Figure BDA0002089678790000112
Figure BDA00020896787900001119
Figure BDA0002089678790000113
Figure BDA0002089678790000114
Figure BDA0002089678790000115
/>
Figure BDA0002089678790000116
Figure BDA0002089678790000117
其中,
Figure BDA0002089678790000118
假设式(34)中每一个矩阵变量均是正定的,因此
Figure BDA00020896787900001120
就是正定的,对(34)式至(40)式进行求导、取期望,并进行放缩、应用事件触发条件,最后得到:
Figure BDA0002089678790000119
其中Ξ的定义在定理1中,并且有:
Figure BDA00020896787900001110
Figure BDA00020896787900001111
Figure BDA00020896787900001112
Figure BDA00020896787900001113
Figure BDA00020896787900001114
Figure BDA00020896787900001115
对任意的γ≠0,为了保证
Figure BDA00020896787900001116
利用Schur补引理我们可以得到:
Figure BDA0002089678790000121
其中
Figure BDA0002089678790000122
因此便得到不等式(31),因此有/>
Figure BDA0002089678790000127
假设
Figure BDA0002089678790000123
因此有:
Figure BDA0002089678790000124
在该式中,
Figure BDA0002089678790000128
是零时刻的随机初始拓扑,因此:
Figure BDA0002089678790000125
因此有
Figure BDA0002089678790000126
即分歧系统(29)在均方意义下渐进稳定,也就是说闭环多智能体系统(19)在定义2的基础上实现了一致性,完成了证明。
本发明的特点及效果:本发明通过分析时变延时、切换拓扑、随机网络攻击等因素对系统的影响,研究了基于混合触发机制的多智能体系统一致性问题。首先,为了减轻网络负担,引入了混合触发机制.为了更接近实际情况,还考虑了时变延迟、切换拓扑以及随机网络攻击,其中网络攻击用伯努利变量描述。其次,在通信拓扑中不存在生成树的情况下,以定理的形式给出了系统实现一致性的条件,该定理由李雅普诺夫稳定性理论与线性矩阵不等式理论得到。因此,该发明能灵活地实现系统的一致性控制。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1是本发明中具有时变时滞、不确定切换拓扑和随机网络攻击的多智能体系统的混合触发一致性控制框图;
图2是本发明中多智能体系统中的三个通信拓扑结构图;
图3是本发明中
Figure BDA0002089678790000131
时状态x(t)的响应曲线;
图4是本发明中
Figure BDA0002089678790000132
时速度v(t)的响应曲线;
图5是本发明中
Figure BDA0002089678790000133
时状态x(t)的响应曲线;
图6是本发明中
Figure BDA0002089678790000134
时速度v(t)的响应曲线;
图7是本发明中随机网络攻击f(x(t))的变化曲线;
图8是本发明中
Figure BDA0002089678790000135
时所有智能体的事件触发时刻和释放间隔;
图9是本发明中
Figure BDA0002089678790000136
时混合触发机制中两种触发机制之间的切换概率;
图10是本发明中随机网络攻击f(x(t))发生的概率曲线;
图11是本发明中多智能体系统中的三个通信拓扑之间相互切换的图像。
具体实施方式
结合附图通过如下实施例对本发明进行详细说明:
步骤一:多智能体系统的运动模型建立
考虑以下多智能体系统的运动模型:
Figure BDA0002089678790000137
式中,xi为第i个智能体的位置,b为阻尼常数,c为弹簧常数。
步骤二:一致性控制器设计以及系统闭环方程建立
控制器设计如下:
Figure BDA0002089678790000138
在该式中,k是常数增益,
Figure BDA0002089678790000139
用于计算期望的距离/>
Figure BDA00020896787900001310
将(2)式代入(1)式可得:
Figure BDA00020896787900001311
/>
Figure BDA0002089678790000141
根据图2可得拉普拉斯矩阵如下:
Figure BDA0002089678790000142
设πpq=1,
Figure BDA0002089678790000143
εpq=±0.1,则可得:
Figure BDA0002089678790000144
步骤三:闭环多智能体系统的一致性实现
设采样周期h=0.002s,三个智能体的初始条件为x0=[20.12,13.05,7.89],时滞上界τM=0.4,dM=0.15,ηM=0.12,事件触发参数σ=0.08,由定理1可得τi(t)=0.15是一个可行解,本文考虑如下两种情况:
第一种:
Figure BDA0002089678790000145
即此时系统中无网络攻击且混合触发机制被使用,第一种情况的下x(t)的响应曲线如图3,v(t)的响应曲线如图4。
第二种:
Figure BDA0002089678790000146
即此时系统中网络攻击发生的概率为百分之二十,混合触发机制被使用,此时的x(t)的响应曲线如图5,v(t)的响应曲线如图6,网络攻击的图像如图7所示,在第二种情况下,所有智能体的事件触发时刻和释放区间如图8所示,图9显示出第二种情况下混合触发机制中两种触发机制之间相互切换的概率,图10描述了网络攻击发生的概率,图11表示多智能体系统中三个拓扑之间的切换情况。
结果表明,本发明提出的方法可以应用于一般线性时滞动态系统的一致性检验。此外,还可以证明,即使在三种拓扑中都没有生成树的情况下,系统仍然可以收敛。最后,三种拓扑之间切换的概率是不确定的,本发明考虑了时变延时、切换拓扑、随机网络攻击等因素对系统的影响,实现了基于混合触发机制的多智能体系统一致性。因此,该方法能更灵活地保证系统的一致性。在以上分析的基础上,可以看出多智能体系统最终实现了渐近稳定性和一致性,即本发明设计的控制器是有效的。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (4)

1.网络攻击下基于混合触发机制的多智能体系统一致性的控制方法,其特征在于:具体包括如下步骤:
步骤一:建立多智能体系统的运动模型;
将多智能体系统中每个智能体看作为二维平面内运动的质点,其简化运动模型为:
Figure FDA0004013411960000011
其中xi∈Rn表示第i个智能体的状态变量,智能体动态的阶数由n决定,ui∈Rn是第i个智能体的控制输入;θt随时间的变化而变化,表示多智能体系统在时间t的每个时刻所连接的智能体,τi(t)是影响第i个智能体的控制输入的时变延时;设τi(t)=τ+λi(t),其中τ是常数,λi(t)是随时间变化的扰动,满足
Figure FDA0004013411960000012
因此在多智能体系统中对所有的智能体有/>
Figure FDA0004013411960000013
成立;
步骤二:建立一致性控制器设计以及系统闭环方程;
考虑如下一致性控制器:
Figure FDA0004013411960000014
其中K∈Rn×n是常数矩阵增益,aijt)决定当前的拓扑状态;
连续时间马尔可夫链决定参数θt的动态特性,其中马尔可夫链具有由集合
Figure FDA0004013411960000015
给出的离散状态,其中s是多智能体系统中不同拓扑的数量;概率转换矩阵Ψ=[ψpq]的表达式如下:
Figure FDA0004013411960000016
式(6)中,ψpq表示在t时刻在区间Δ>0内从拓扑p切换到拓扑q的概率,对所有的
Figure FDA0004013411960000017
都有/>
Figure FDA0004013411960000018
成立,(πpqpq)是不确定转移矩阵∏的元素;
Figure FDA0004013411960000021
式(7)中,πpq表示从状态p切换到状态q的概率的估计值,εpq表示估计值的误差,εpq未知,且有εpq∈[-δpqpq],其中0<δpq<πpq;πpq和δpq均是正的,并且
Figure FDA0004013411960000022
因此/>
Figure FDA0004013411960000023
最后,将马尔可夫链的初始分布设为υ=(υ12,...,υs);
将(3)和(4)写成紧凑形式如下:
Figure FDA0004013411960000024
/>
Figure FDA0004013411960000025
当混合触发机制中使用时间触发时,数据采样将按以下方式传输:
Figure FDA0004013411960000026
其中tr是正整数,它满足
Figure FDA0004013411960000027
Figure FDA0004013411960000028
是由网络引起的相应的网络延时,h是采样周期;令τ(t)=t-trh,因此式(10)可以重写为如下形式:
x1(t)=x(t-τ(t)) (11)
式中,τ(t)∈[0,τM],τM,是延迟τ(t),的最大值;
当混合触发机制中选择事件触发机制时,给出如下事件触发条件:
Figure FDA0004013411960000029
其中Ω>0,0≤σ<1,阈值误差er(t)的表达式为
Figure FDA00040134119600000211
经过事件触发机制的采样信号表达式如下:
x2(t)=x(t-d(t))+er(t) (13)
时间触发机制与事件触发机制之间切换的概率由随机伯努利变量α(t)来描述,则
Figure FDA00040134119600000210
的表达式如下:
Figure FDA0004013411960000031
其中0≤α(t)≤1,并且α(t)具有如下性质:
Figure FDA0004013411960000032
Figure FDA0004013411960000033
是α(t)的期望,/>
Figure FDA0004013411960000034
是α(t)的方差;
网络攻击由一个非线性函数f(x(t))来表示,则
Figure FDA0004013411960000035
的表达式如下:
Figure FDA0004013411960000036
在式(16)中,f(x(t-η(t)))表示网络攻击,其中η(t)∈[0,ηM]表示网络攻击的时间延时;0≤β(t)≤1也服从伯努利分布,它表示网络攻击发生的可能性,且有:
Figure FDA0004013411960000037
因此一致性控制器(4)可以写成如下形式:
Figure FDA0004013411960000038
因此可以得到混合触发闭环多智能体系统,即
Figure FDA0004013411960000039
在式(19)中,
Figure FDA00040134119600000310
步骤三:建立转换多智能体系统;
通过引入不一致的新变量,采用树型转换法可将一致性问题转化为一个稳定性问题;
zi(t)=x1(t)-xi+1(t) (20)
Figure FDA0004013411960000041
Fi(z(t))=f1(x(t))-fi+1(x(t)) (22)
其中i=1,2,...,m-1,将式(20)、(21)、(22)写成紧凑形式如下:
Figure FDA0004013411960000042
Figure FDA0004013411960000043
Figure FDA0004013411960000044
并且还有
Figure FDA0004013411960000045
Figure FDA0004013411960000046
Figure FDA0004013411960000047
其中
Figure FDA0004013411960000048
并且WT=[0m-1-Im-1]。
对(23)式进行求导并与(19),(26),(27),(28)式联立,最后应用性质U1m=0m-1,Lk1m=0m和UW=Im-1,最后可得如下的分歧系统:
Figure FDA0004013411960000049
式中
Figure FDA00040134119600000410
步骤四:实现闭环多智能体系统的一致性;
通过以下定理得到混合触发机制下多智能体系统在时变延迟控制输入、不确定切换拓扑以及随机网络攻击下实现一致性的充分条件:
定理1:给定正常数
Figure FDA00040134119600000515
τM,dM,ηM和事件触发参数σ,其中τM,dM,ηM是时延的上限;讨论闭环多智能体系统(19),其中τ>0,/>
Figure FDA0004013411960000052
并且П的定义如式(7)所示,在式(7)中,εpq∈[-δpqpq],且对任意的/>
Figure FDA0004013411960000053
均有δpq>0,当k=1,2,...,m时,时变时延/>
Figure FDA0004013411960000054
则如果对任意的l=1,2,...,s都存在n(m-1)×n(m-1)维的矩阵
Figure FDA0004013411960000055
Figure FDA0004013411960000056
和S=ST>0使得下列不等式成立,闭环多智能体系统(19)就在均方意义下实现一致性;
Figure FDA0004013411960000057
Figure FDA0004013411960000058
在式(31)中,
Figure FDA0004013411960000059
Figure FDA00040134119600000510
Figure FDA00040134119600000511
Figure FDA00040134119600000512
Figure FDA00040134119600000513
Figure FDA00040134119600000514
Figure FDA0004013411960000061
Figure FDA0004013411960000062
Figure FDA0004013411960000063
/>
Figure FDA0004013411960000064
Figure FDA0004013411960000065
Figure FDA0004013411960000066
Figure FDA0004013411960000067
Figure FDA0004013411960000068
Figure FDA0004013411960000069
Figure FDA00040134119600000610
Figure FDA00040134119600000611
Figure FDA0004013411960000071
/>
Figure FDA0004013411960000072
Figure FDA0004013411960000073
Figure FDA0004013411960000074
Figure FDA0004013411960000075
Figure FDA0004013411960000076
Figure FDA0004013411960000077
Figure FDA0004013411960000078
Figure FDA0004013411960000079
2.根据权利要求1所述的网络攻击下基于混合触发机制的多智能体系统一致性的控制方法,其特征在于:多智能体系统为用线性系统或能够线性化的系统或时不变系统来描述,提出了包括时间触发机制和事件触发机制的混合触发机制,时间触发机制和事件触发机制之间的切换服从随机伯努利分布。
3.根据权利要求1所述的网络攻击下基于混合触发机制的多智能体系统一致性的控制方法,其特征在于:由于网络安全问题,考虑了随机网络攻击对系统的影响,随机网络攻击发生的概率也服从随机伯努利分布。
4.根据权利要求1所述的网络攻击下基于混合触发机制的多智能体系统一致性的控制方法,其特征在于:考虑了智能体控制输入的时变延时具有不可微和不均匀以及拓扑切换具有不确定切换概率的特性,拓扑切换用于描述网络系统通信故障或者邻居关系的变化。
CN201910499387.2A 2019-06-11 2019-06-11 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法 Active CN110297497B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910499387.2A CN110297497B (zh) 2019-06-11 2019-06-11 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910499387.2A CN110297497B (zh) 2019-06-11 2019-06-11 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Publications (2)

Publication Number Publication Date
CN110297497A CN110297497A (zh) 2019-10-01
CN110297497B true CN110297497B (zh) 2023-03-28

Family

ID=68027811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910499387.2A Active CN110297497B (zh) 2019-06-11 2019-06-11 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法

Country Status (1)

Country Link
CN (1) CN110297497B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110716582B (zh) * 2019-10-16 2023-01-17 东南大学 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法
CN110933056B (zh) * 2019-11-21 2022-07-08 博智安全科技股份有限公司 防攻击的多智能体控制系统及其方法
CN111679572B (zh) * 2020-05-11 2022-09-13 南京财经大学 多网络攻击下基于混合触发的网络控制系统安全控制方法
CN111756032B (zh) * 2020-05-19 2021-07-20 国网浙江省电力有限公司温州供电公司 一种欺骗性网络下基于事件触发控制的改进方法
CN112198800B (zh) * 2020-11-13 2022-08-23 湖州师范学院 一种具有时变时延的多机器人系统一致性控制方法
CN113156804B (zh) * 2021-03-24 2022-03-25 杭州电子科技大学 多智能体系统的故障诊断与容错控制器设计方法
CN113311811B (zh) * 2021-07-14 2021-12-24 江苏东源电器集团股份有限公司 一种事件触发多智能体系统及其分布式协同故障检测方法
CN114070582B (zh) * 2021-10-12 2024-01-19 曲阜师范大学 一种事件触发控制方法及系统
CN114647188B (zh) * 2022-03-01 2024-06-21 北京航空航天大学 拒绝服务攻击下合作竞争多智能体系统安全协同控制方法
CN115167546A (zh) * 2022-08-26 2022-10-11 曲阜师范大学 一种航空发动机转速调节控制方法、控制装置和存储介质
CN116909315B (zh) * 2023-09-12 2023-12-08 北京航空航天大学 一种通信链路不稳定的无人机编队鲁棒控制方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101003094B1 (ko) * 2008-04-28 2010-12-21 한국전자통신연구원 스파이 봇 에이전트를 이용한 네트워크 공격 위치 추적 방법, 및 시스템
CN103777638B (zh) * 2014-01-26 2016-09-28 北京航空航天大学 多无人机网络编队的一致性控制方法
CN104407619B (zh) * 2014-11-05 2017-03-15 沈阳航空航天大学 不确定环境下的多无人机同时到达多个目标方法
EP3229445B1 (en) * 2016-04-06 2018-08-08 The Boeing Company A system and a computer-implemented method for multi path communication with an unmanned aerial vehicle during a mission
CN105873171B (zh) * 2016-05-27 2017-05-03 合肥工业大学 基于最小树形图的无人机编队通信拓扑重优化方法及系统
CN109491249B (zh) * 2018-11-30 2022-01-18 沈阳航空航天大学 一种存在DoS攻击时确定一致性事件触发控制器的方法

Also Published As

Publication number Publication date
CN110297497A (zh) 2019-10-01

Similar Documents

Publication Publication Date Title
CN110297497B (zh) 网络攻击下基于混合触发机制的多智能体系统一致性的控制方法
CN110308659B (zh) 具有时延和切换拓扑的不确定多智能体系统混合触发一致的控制方法
Li et al. String stability analysis for vehicle platooning under unreliable communication links with event-triggered strategy
Wang et al. Event-based asynchronous and resilient filtering for Markov jump singularly perturbed systems against deception attacks
Zhang et al. Network-based output tracking control for T–S fuzzy systems using an event-triggered communication scheme
Wang et al. Event-triggered dissipative filtering for networked semi-Markov jump systems and its applications in a mass-spring system model
Peng et al. Event-triggered communication and H∞ control co-design for networked control systems
Qu et al. Event-triggered control for networked control systems with quantization and packet losses
Maass et al. Optimal control over multiple erasure channels using a data dropout compensation scheme
CN112327616B (zh) 一种基于事件触发的网络控制系统控制器设计方法
CN110989347B (zh) 一种基于事件触发机制的网络化控制系统和控制方法
CN107728475A (zh) 带有执行器饱和的切换系统事件触发控制设计方法
CN110198236A (zh) 一种基于动态事件触发机制的网络化系统鲁棒控制方法
Ali et al. Non-fragile sampled data control for stabilization of non-linear multi-agent system with additive time varying delays, Markovian jump and uncertain parameters
CN108448576A (zh) 弹性事件触发机制下的多机电力系统广域阻尼控制方法
Zhao et al. Leader-following consensus of multi-agent systems via novel sampled-data event-triggered control
CN113268083A (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
Khoshnevisan et al. Adaptive rate‐based congestion control with weighted fairness through multi‐loop gradient projection internal model controller
Al-Faiz et al. Optimal linear quadratic controller based on genetic algorithm for TCP/AQM router
CN113515066B (zh) 一种非线性多智能体系统动态事件触发控制方法
Kecai et al. Consensus in multi-agent with time-varying delays
CN103095601A (zh) 一种用于通信网络拥塞控制的主动队列管理方法
Li et al. Adaptive Event-Triggered Robust Model Predictive Control for Multiagent Systems With Time-Varying Delay Under Arbitrary Network Topology
Hou et al. Distributed consensus of multi-agent via aperiodic intermittent sampled-data control
Chait et al. Dynamic analysis of congested TCP networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant