CN115378648A - 多智能体系统的防网络攻击包含控制方法、装置及终端 - Google Patents

多智能体系统的防网络攻击包含控制方法、装置及终端 Download PDF

Info

Publication number
CN115378648A
CN115378648A CN202210843052.XA CN202210843052A CN115378648A CN 115378648 A CN115378648 A CN 115378648A CN 202210843052 A CN202210843052 A CN 202210843052A CN 115378648 A CN115378648 A CN 115378648A
Authority
CN
China
Prior art keywords
agent
agent system
control
agents
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210843052.XA
Other languages
English (en)
Other versions
CN115378648B (zh
Inventor
闫琛皓
李晨
邵晋梁
石磊
赵源
马文建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Artificial Intelligence and Robotics
Original Assignee
Shenzhen Institute of Artificial Intelligence and Robotics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Artificial Intelligence and Robotics filed Critical Shenzhen Institute of Artificial Intelligence and Robotics
Priority to CN202210843052.XA priority Critical patent/CN115378648B/zh
Publication of CN115378648A publication Critical patent/CN115378648A/zh
Application granted granted Critical
Publication of CN115378648B publication Critical patent/CN115378648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种多智能体系统的防网络攻击包含控制方法、装置及终端,上述方法包括:通过构建与不同拓扑场景对应的加权邻接矩阵来反映智能体之间信息传输的权重,当受到网络攻击时,通过更新加权邻接矩阵以反映网络攻击下的智能体之间的关系,然后根据不同的拓扑场景对应的控制协议来控制智能体的位置更新,从而实现多智能体系统的包含控制。与现有技术相比,能够适应不同拓扑场景,当受到网络攻击时也能衡量智能体之间信息传输的能力,从而控制智能体的位置更新实现对目标的包含控制。

Description

多智能体系统的防网络攻击包含控制方法、装置及终端
技术领域
本发明涉及智能体控制技术领域,尤其涉及的是一种多智能体系统的防网络攻击包含控制方法、装置、智能终端及存储介质。
背景技术
多智能体系统的包含控制,是指通过智能体之间的信息交互,使得单个或多个目标智能体进入到由指定智能体轨迹形成的凸包当中。包含控制是多智能体系统协调控制研究的重要成果,具备广阔的发展前景,比如联合保护问题,自控智能车辆安全移动问题等。
现有多智能体系统的包含控制,通常假设所有智能体都能够顺利接收到相邻智能体的信息,然而,由于入侵者和攻击者通过不正常的手段获取、更改甚至破坏隐私数据,例如:分布式网络系统中的DoS攻击(拒绝服务攻击)。使得智能体之间的通信极其不稳定,智能体之间不能信息交互,导致不能实现包含控制的任务。
因此,现有技术有待改进和提高。
发明内容
本发明的主要目的在于提供一种多智能体系统的防网络攻击包含控制方法、装置、智能终端及存储介质,能够在网络攻击下实现智能体系统的包含控制。
为了实现上述目的,本发明第一方面提供一种多智能体系统的防网络攻击包含控制方法,预先建立多智能体系统模型,控制每个智能体的位置更新以实现多智能体系统的包含控制,控制智能体的位置更新的方法包括:
获取智能体当前时间步的位置信息和速度信息;
获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
当智能体受到网络攻击时,更新所述加权邻接矩阵;
基于与当前拓扑场景对应的控制协议,根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息;
基于所述下一时间步的速度信息控制智能体的位置更新。
可选的,还包括:根据智能体之间的连接状态确定当前拓扑场景,所述智能体之间的连接状态包括智能体之间的连接保持不变或智能体之间的连接可变。
可选的,所述当智能体受到网络攻击时,更新所述加权邻接矩阵,包括:
在所述加权邻接矩阵中查找与所述智能体对应的行向量;
将所述行向量的数值设置为0。
可选的,若当前拓扑场景为固定拓扑场景,所述控制协议的表达式为:
Figure BDA0003751838770000021
Figure BDA0003751838770000022
其中,k为时间步,θi为控制向量,aij为固定拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β1>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure BDA0003751838770000023
为时间段。
可选的,若当前拓扑场景为切换拓扑场景,所述控制协议的表达式为:
Figure BDA0003751838770000024
其中,tk为时间步,θi为控制向量,
Figure BDA0003751838770000025
为切换拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β234>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure BDA0003751838770000026
为时间段。
可选的,采用异步的方式控制多智能体系统中每个智能体的位置更新。
可选的,所述多智能体系统模型还包括与拓扑场景对应的位置更新协议和速度更新协议。
本发明第二方面提供一种多智能体系统的防网络攻击包含控制装置,其中,上述装置包括:
信息获取模块,用于获取智能体当前时间步的位置信息和速度信息;
通信权重获取模块,用于获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
网络攻击处理模块,用于当智能体受到网络攻击时,更新所述加权邻接矩阵;
更新模块,用于基于与当前拓扑场景对应的控制协议,根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息;
控制模块,用于基于所述下一时间步的速度信息控制智能体的位置更新。
本发明第三方面提供一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的多智能体系统的防网络攻击包含控制程序,上述多智能体系统的防网络攻击包含控制程序被上述处理器执行时实现任意一项上述多智能体系统的防网络攻击包含控制方法的步骤。
本发明第四方面提供一种计算机可读存储介质,上述计算机可读存储介质上存储有多智能体系统的防网络攻击包含控制程序,上述多智能体系统的防网络攻击包含控制程序被处理器执行时实现任意一项上述多智能体系统的防网络攻击包含控制方法的步骤。
由上可见,本发明通过构建与不同拓扑场景对应的加权邻接矩阵来反映智能体之间信息传输的权重,当受到网络攻击时,通过更新加权邻接矩阵以反映网络攻击下的智能体之间的关系,然后根据不同的拓扑场景对应的控制协议来控制智能体的位置更新,从而实现多智能体系统的包含控制。与现有技术相比,能够针对不同拓扑场景,当受到网络攻击时也能衡量智能体之间信息传输的能力,从而根据相应的控制协议控制智能体的位置更新实现包含控制。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的多智能体系统的防网络攻击包含控制方法的流程示意图;
图2是本发明实施例提供的多智能体系统的防网络攻击包含控制装置的结构示意图;
图3是本发明实施例提供的一种智能终端的内部结构原理框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当…时”或“一旦”或“响应于确定”或“响应于检测到”。类似的,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述的条件或事件]”或“响应于检测到[所描述条件或事件]”。
下面结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
多智能体系统包含控制主要是通过分布式控制协议来实现多个智能体状态的最终一致。多智能体系统中,若一个智能体没有邻居智能体,但存在从该智能体出发的边,则称其为领导者;若一个智能体有邻居智能体,则称其为跟随者。二阶多智能体系统的通信拓扑中存在多个领导者和跟随者,通过包含控制实现所有的跟随者都能最终稳定收敛到由领导者构成的凸包中。
目前二阶多智能体系统的包含控制方面的研究工作都是基于智能体之间的通信连通条件下的,而在实际应用中,由于入侵者和攻击者通过不正常的手段获取、更改甚至破坏隐私数据,例如:分布式网络系统中的DoS攻击(拒绝服务攻击)对网络协议发起攻击或通过消耗智能体的网络资源,以此实现智能体无法正常服务或通信,甚至崩溃、死机,使得智能体之间的通信出现故障,智能体之间不能信息交互,导致不能实现包含控制的任务。
本实施例通过建立描述智能体信息的模型,对于DoS攻击情况进行描述,分别针对不同的拓扑场景,建立DoS攻击下智能体的新关系图,再设计不同拓扑场景下的分布式控制协议,实现智能体系统对于给定目标的包含控制。需要说明的是,虽然本实施例以拒绝服务攻击为例对本发明方案进行说明,但是,本发明适用于任何导致智能体之间通信故障的情况。
示例性方法
本实施例提供一种多智能体系统的防网络攻击包含控制方法,应用在多智能体系统的控制器装置中,通过多智能体系统模型控制每个智能体的位置更新以实现智能体系统的包含控制,具体地,控制每个智能体的位置更新的方法如图1所示,包括如下步骤:
步骤S100:获取智能体当前时间步的位置信息和速度信息;
具体地,预先建立多智能体系统模型。多智能体系统模型中包括了描述智能体的位置更新协议、速度更新协议、控制协议以及智能体之间的通信状态图,位置更新协议和速度更新协议用来控制智能体的位置更新,根据控制协议及智能体之间的通信状态图确定控制向量。然后在获取到待控制的智能体在当前时间步的位置信息和速度信息后,就可以在现有的位置信息、速度信息的基础上根据控制向量来控制智能体的位置更新。
特别地,本发明中,对于不同的拓扑场景,多智能体系统模型也相应的有所不同。其中,拓扑场景根据智能体之间的连接状态来确定,智能体之间的连接保持不变时为固定拓扑场景,智能体之间的连接可变时为切换拓扑场景。即当多智能体系统的通信存在故障或需要减少通讯损耗时,多智能体系统的通信拓扑不再是固定拓扑,而是随时间进行切换,即切换拓扑。固定拓扑场景假定在没有受到DoS攻击时通信拓扑图包含以领导者为根的生成森林,且每个智能体在长度为Pδ的时间区间上至少不被攻击一次,切换拓扑场景假定没有受到DoS攻击时在一定长度的时间段内通信拓扑图的并包含以领导者为根的生成森林,且每个智能体在长度为2(n-n1)的时间区间上至少不被攻击一次。
在固定拓扑场景下,多智能体模型的状态方程包括:
位置更新协议:xi(k+1)=xi(k)+τvi(k),i∈Vl∪Vf
速度更新协议:
vi(k)=v(0),i∈Vl
vi(k+1)=vi(k)+τθi(k),i∈Vf
且满足Vf中每个智能体i,i∈Vf接收信息的时间序列分别为
Figure BDA0003751838770000071
Figure BDA0003751838770000072
且相邻时刻满足
Figure BDA0003751838770000073
δ1为正整数。
在切换拓扑场景下,多智能体模型的状态方程包括:
位置更新协议:
xi(tk+1)=xi(tk),i∈Vl
xi(tk+1)=xi(tk)+τkvi(tk),i∈Vf
速度更新协议:
vi(k)=v(0),i∈Vl
vi(tk+1)=vi(tk)+τkθi(tk),i∈Vf
且满足Vf中每个智能体i,i∈Vf接收信息的时间序列分别为
Figure BDA0003751838770000074
Figure BDA0003751838770000075
且相邻时刻满足
Figure BDA0003751838770000076
δ2min为正整数。
上述协议中,Vl表示智能体i,i=1,2,...m所在的集合,Vf表示智能体i,i=m+1,m+2,…,n所在的集合;xi(k),xi(tk)∈Rp×1,vi(k),vi(tk)∈Rp×1,θi(k),θi(tk)∈Rp×1分别代表智能体i在kv时刻和tk时刻的状态信息,速度信息和控制协议。通过使用Kronecker积,可以将结果推广到任意正整数p上。也就是说,本实施例中,分别针对了两种不同的拓扑展开对于DoS攻击的包含控制的研究,并且,对于xi(k),xi(tk)∈Rp×1,vi(k),vi(tk)∈Rp×1i(k),θi(tk)∈Rp×1中的p,可以是任意正整数。
以下描述中将xl(k)记为[x1 T(k),x2 T(k),...,xm T(k)]T;vl(k)记为[v1 T(k),v2 T(k),...,vm T(k)]T;xf(k)记为[xm+2 T(k),xm+2 T(k),...,xn T(k)]T;vf(k)记为[vm+1 T(k),vm+2 T(k),...,vn T(k)]T
步骤S200:获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
具体地,智能体之间的通信状态图中各智能体之间的信息传输能力用加权邻接矩阵来衡量。固定拓扑场景下智能体之间的通信状况用加权邻接矩阵A=[aij]n×n来表示,aij表示智能体i与智能体j之间的进行信息传输的权重,该权重的具体数值可以根据智能体的信息传输阈值进行分段来做相应设定。
Figure BDA0003751838770000081
满足如果智能体i能够接收到智能体j的信息,则aij>0,否则aij=0。对应的拉普拉斯矩阵为LA=[lij]n×n=D-A,其中D为对角矩阵,且对角线上的元素为加权邻接矩阵A每一行的行和。
切换拓扑场景下智能体之间的通信状况用加权邻接矩阵B(tk)=[bij(tk)]n×n来表示,bij(tk)表示在kτ时刻智能体i与智能体j之间进行信息传输的权重,
Figure BDA0003751838770000082
满足如果智能体i在kτ时刻能够接收到智能体j的信息,则bij(tk)>0,否则bij(k)=0。对应的拉普拉斯矩阵为LB(tk)=[lij(tk)]n×n=D(tk)-B(tk),其中D(tk)为对角矩阵,且对角线上的元素为kτ时刻加权邻接矩阵B(tk)每一行的行和。
步骤S300:当智能体受到拒绝服务攻击时,更新加权邻接矩阵;
具体地,定义
Figure BDA0003751838770000083
为第i个智能体DoS攻击的时间序列,Δs表示第s次攻击的时长,那么第s次攻击的时间段为
Figure BDA0003751838770000084
假设Δs<τ。
Figure BDA0003751838770000085
表示在(t0,t)时间段内智能体i受到攻击的次数,
Figure BDA0003751838770000086
表示在这段时间内的攻击频率。固定拓扑场景下假定
Figure BDA0003751838770000087
切换拓扑场景下假定
Figure BDA0003751838770000088
存在攻击时,领导者和跟随者之间的通讯中断,通讯拓扑结构发生变化,此时多智能体系统由稳定变为不稳定,因此采用不同拓扑场景来描述存在DoS攻击时的领导者-跟随者多智能体系统;受到攻击时,多智能体系统对应切换拓扑场景下的不稳定子系统,未受到受攻击时,多智能体系统对应固定拓扑场景下的稳定子系统。
若智能体i在kτ时刻处于受到攻击的状态,在固定拓扑场景下,则将加权邻接矩阵A的第i行元素全变为0;在切换拓扑场景下,则将加权邻接矩阵B(tk)的第i行元素全变为0。若智能体i在kτ时刻没有受到攻击,则加权邻接矩阵A和B(tk)中的第i行元素保持不变。
以下分别用A(k)=[aij(k)]n×n
Figure BDA0003751838770000091
来表示不同场景下第k个时刻智能体之间的关系,对应的拉普拉斯矩阵分别为LA(k)=[lij(k)]n×n
Figure BDA0003751838770000092
采用上述的加权邻接矩阵和拉普拉斯矩阵能够直观描述不同时刻DoS攻击下智能体的状态,方便地用于控制协议中。
步骤S400:基于与当前拓扑场景对应的控制协议,根据加权邻接矩阵、位置信息和速度信息获取下一时间步的速度信息;
具体地,固定拓扑场景下,智能体控制协议的表达式为:
Figure BDA0003751838770000093
Figure BDA0003751838770000094
其中,k为时间步,θi为控制向量,aij为固定拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β1>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure BDA0003751838770000095
为时间段。
切换拓扑场景下,控制协议的表达式为:
Figure BDA0003751838770000096
其中,tk为时间步,θi为控制向量,
Figure BDA0003751838770000097
为切换拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β234>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure BDA0003751838770000101
为时间段。
根据上述控制协议,根据加权邻接矩阵、位置信息和速度信息获取下一时间步的控制向量,然后根据多智能体系统模型中的速度更新协议获得下一时间步的速度信息。
步骤S500:基于下一时间步的速度信息控制智能体的位置更新。
具体地,根据多智能体系统模型中的位置更新协议,代入下一时间步的速度信息控制智能体的位置更新。
进一步地,采用本发明的控制协议,还可以采用异步的方式控制多智能体系统中每个智能体的位置更新。
由上所述,本实施例通过建立加权邻接矩阵来描述智能体之间的关系,若受到DOS攻击时,相应更改加权邻接矩阵,并对固定拓扑和切换拓扑两种场景分别建立相应的控制协议,根据控制协议实现多智能体模型的收敛,从而实现二阶多智能体系统的包含控制,即实现跟随者智能体能够进入由领导者智能体所形成的固定形状的凸包当中,并且能够跟随着领导者智能体做匀速运动。
以下对固定拓扑场景下控制协议的收敛性做进一步分析,以验证多智能体系统能够实现对目标的包含控制,收敛性分析具体过程如下:
将控制协议代入状态方程并进行坐标变换,可以得到:
Figure BDA0003751838770000102
其中η(k)=(ex T(k),αex T(k)+αβev T(k))T
Figure BDA0003751838770000103
Figure BDA0003751838770000104
对η(k)进行收敛性分析,如果limk→∞||η(k+1)||∞=0,那么显然多智能体系统对目标的包含控制能够实现。
进一步对使得limk→∞||η(k+1)||=0的条件进行推导:
假定智能体的固定通信拓扑图包含以领导者为根的生成森林,且有:
Figure BDA0003751838770000111
Figure BDA0003751838770000112
Figure BDA0003751838770000113
Figure BDA0003751838770000114
则多智能体系统能够实现对目标的包含控制,即
Figure BDA0003751838770000115
Figure BDA0003751838770000116
目标能够进入由Vl中智能体所形成的固定形状的凸包当中,并且能够跟随着Vl中智能体做匀速运动。其中α>1为常数,P表示从Vl中任意一个智能体到Vl中任意一个智能体的最长路,dmin和dmax分别对角矩阵D中对角元素的最小值与最大值。
以下对切换拓扑场景下控制协议的收敛性做进一步分析,以验证多智能体系统能够实现对目标的包含控制,收敛性分析具体过程如下:
将控制协议代入状态方程并进行坐标变换,可以得到:
Figure BDA0003751838770000117
其中
Figure BDA0003751838770000118
Figure BDA0003751838770000119
同样对η(k)进行收敛性分析,如果limk→∞||η(k+1)||∞=0,那么显然包含控制能够实现。
进一步对使得limk→∞||η(k+1)||=0的条件进行推导:
假定智能体的切换通信拓扑在一定的时间间隔内的并包含以领导者为根的生成森林,且有:
Figure BDA00037518387700001110
Figure BDA00037518387700001111
Figure BDA0003751838770000121
则所述智能体系统能够实现对目标的包含控制,
Figure BDA0003751838770000122
Figure BDA0003751838770000123
limk→∞vf(tk)=0。目标能够进入到由Vl中智能体所形成的凸包当中,并且能够跟随着Vl中智能体做匀速运动,但在该场景下随着通信拓扑的变化,目标在凸包中的位置也会发生变化。其中m为Vl中智能体的个数。
综上所述,本发明的方法适用于存在网络攻击时大规模无人机编队飞行控制或智能车编队控制,从而实现两种情形下的跟随者都能运动到由领导者构成的凸包中,跟随者与领导者的速度实现一致。
示例性设备
如图2所示,对应于上述多智能体系统的防网络攻击包含控制方法,本发明实施例还提供一种多智能体系统的防网络攻击包含控制装置,上述多智能体系统的防网络攻击包含控制装置包括:
信息获取模块600,用于获取智能体当前时间步的位置信息和速度信息;
通信权重获取模块610,用于获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
拒绝服务攻击处理模块620,用于当智能体受到网络攻击时,更新所述加权邻接矩阵;
更新模块630,用于基于与当前拓扑场景对应的控制协议,根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息;
控制模块640,用于基于所述下一时间步的速度信息控制智能体的位置更新。
具体的,本实施例中,上述多智能体系统的防网络攻击包含控制装置的各模块的具体功能可以参照上述多智能体系统的防网络攻击包含控制方法中的对应描述,在此不再赘述。
基于上述实施例,本发明还提供了一种智能终端,其原理框图可以如图3所示。上述智能终端包括通过系统总线连接的处理器、存储器、网络接口以及显示屏。其中,该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和多智能体系统的防网络攻击包含控制程序。该内存储器为非易失性存储介质中的操作系统和多智能体系统的防网络攻击包含控制程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该多智能体系统的防网络攻击包含控制程序被处理器执行时实现上述任意一种多智能体系统的防网络攻击包含控制方法的步骤。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏。
本领域技术人员可以理解,图3中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的智能终端的限定,具体的智能终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种智能终端,上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的多智能体系统的防网络攻击包含控制程序,上述多智能体系统的防网络攻击包含控制程序被上述处理器执行时进行以下操作指令:
预先建立多智能体系统模型,控制每个智能体的位置更新以实现多智能体系统的包含控制,控制智能体的位置更新的方法包括:
获取智能体当前时间步的位置信息和速度信息;
获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
当智能体受到网络攻击时,更新所述加权邻接矩阵;
基于与当前拓扑场景对应的控制协议,根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息;
基于所述下一时间步的速度信息控制智能体的位置更新。
可选的,还包括:根据智能体之间的连接状态确定当前拓扑场景,所述智能体之间的连接状态包括智能体之间的连接保持不变或智能体之间的连接可变。
可选的,所述当智能体受到网络攻击时,更新所述加权邻接矩阵,包括:
在所述加权邻接矩阵中查找与所述智能体对应的行向量;
将所述行向量的数值设置为0。
可选的,若当前拓扑场景为固定拓扑场景,所述控制协议的表达式为:
Figure BDA0003751838770000141
Figure BDA0003751838770000142
其中,k为时间步,θi为控制向量,aij为固定拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β1>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure BDA0003751838770000143
为时间段。
可选的,若当前拓扑场景为切换拓扑场景,所述控制协议的表达式为:
Figure BDA0003751838770000144
其中,tk为时间步,θi为控制向量,
Figure BDA0003751838770000145
为切换拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β234>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure BDA0003751838770000146
为时间段。
可选的,采用异步的方式控制多智能体系统中每个智能体的位置更新。
可选的,所述多智能体系统模型还包括与拓扑场景对应的位置更新协议和速度更新协议。
本发明实施例还提供一种计算机可读存储介质,上述计算机可读存储介质上存储有多智能体系统的防网络攻击包含控制程序,上述多智能体系统的防网络攻击包含控制程序被处理器执行时实现本发明实施例提供的任意一种多智能体系统的防网络攻击包含控制方法的步骤。
应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以由另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.多智能体系统的防网络攻击包含控制方法,其特征在于,预先建立多智能体系统模型,控制每个智能体的位置更新以实现多智能体系统的包含控制,控制智能体的位置更新的方法包括:
获取智能体当前时间步的位置信息和速度信息;
获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
当智能体受到网络攻击时,更新所述加权邻接矩阵;
基于与当前拓扑场景对应的控制协议,根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息;
基于所述下一时间步的速度信息控制智能体的位置更新。
2.如权利要求1所述的多智能体系统的防网络攻击包含控制方法,其特征在于,还包括:根据智能体之间的连接状态确定当前拓扑场景,所述智能体之间的连接状态包括智能体之间的连接保持不变或智能体之间的连接可变。
3.如权利要求1所述的多智能体系统的防网络攻击包含控制方法,其特征在于,所述当智能体受到网络攻击时,更新所述加权邻接矩阵,包括:
在所述加权邻接矩阵中查找与所述智能体对应的行向量;
将所述行向量的数值设置为0。
4.如权利要求1所述的多智能体系统的防网络攻击包含控制方法,其特征在于,若当前拓扑场景为固定拓扑场景,所述控制协议的表达式为:
Figure FDA0003751838760000011
θi(k)=0,
Figure FDA0003751838760000012
其中,k为时间步,θi为控制向量,aij为固定拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β1>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure FDA0003751838760000013
为时间段。
5.如权利要求1所述的多智能体系统的防网络攻击包含控制方法,其特征在于,若当前拓扑场景为切换拓扑场景,所述控制协议的表达式为:
Figure FDA0003751838760000021
其中,tk为时间步,θi为控制向量,
Figure FDA0003751838760000022
为切换拓扑场景下的加权邻接矩阵,xi、xj分别为第i个智能体、第j个智能体的位置信息,β2,β3,β4>0为反馈控制增益参数,vi、vj分别为第i个智能体、第j个智能体的速度信息,
Figure FDA0003751838760000023
为时间段。
6.如权利要求1所述的多智能体系统的防网络攻击包含控制方法,其特征在于,采用异步的方式控制多智能体系统中每个智能体的位置更新。
7.如权利要求1所述的多智能体系统的防网络攻击包含控制方法,其特征在于,所述多智能体系统模型还包括与拓扑场景对应的位置更新协议和速度更新协议。
8.多智能体系统的防网络攻击包含控制装置,其特征在于,所述装置包括:
信息获取模块,用于获取智能体当前时间步的位置信息和速度信息;
通信权重获取模块,用于获得与当前拓扑场景对应的加权邻接矩阵,所述加权邻接矩阵用于反映智能体之间信息传输的权重;
拒绝服务攻击处理模块,用于当智能体受到网络攻击时,更新所述加权邻接矩阵;
更新模块,用于基于与当前拓扑场景对应的控制协议,根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息;
控制模块,用于基于所述下一时间步的速度信息控制智能体的位置更新。
9.智能终端,其特征在于,所述智能终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的多智能体系统的防网络攻击包含控制程序,所述多智能体系统的防网络攻击包含控制程序被所述处理器执行时实现如权利要求1-7任意一项所述多智能体系统的防网络攻击包含控制方法的步骤。
10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有多智能体系统的防网络攻击包含控制程序,所述多智能体系统的防网络攻击包含控制程序被处理器执行时实现如权利要求1-7任意一项所述多智能体系统的防网络攻击包含控制方法的步骤。
CN202210843052.XA 2022-07-18 2022-07-18 多智能体系统的防网络攻击包含控制方法、装置及终端 Active CN115378648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210843052.XA CN115378648B (zh) 2022-07-18 2022-07-18 多智能体系统的防网络攻击包含控制方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210843052.XA CN115378648B (zh) 2022-07-18 2022-07-18 多智能体系统的防网络攻击包含控制方法、装置及终端

Publications (2)

Publication Number Publication Date
CN115378648A true CN115378648A (zh) 2022-11-22
CN115378648B CN115378648B (zh) 2024-06-21

Family

ID=84062733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210843052.XA Active CN115378648B (zh) 2022-07-18 2022-07-18 多智能体系统的防网络攻击包含控制方法、装置及终端

Country Status (1)

Country Link
CN (1) CN115378648B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111781822A (zh) * 2020-07-09 2020-10-16 重庆邮电大学 一种多智能体系统的隐私保护分组一致性控制方法
CN114371617A (zh) * 2021-12-13 2022-04-19 重庆邮电大学 基于脉冲控制的具有切换拓扑结构的多智能体系统的分组一致性控制方法
CN114609909A (zh) * 2022-03-15 2022-06-10 广州大学 一种切换拓扑下的随机多智体系统控制协议的设计方法
CN114647188A (zh) * 2022-03-01 2022-06-21 北京航空航天大学 拒绝服务攻击下合作竞争多智能体系统安全协同控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111781822A (zh) * 2020-07-09 2020-10-16 重庆邮电大学 一种多智能体系统的隐私保护分组一致性控制方法
CN114371617A (zh) * 2021-12-13 2022-04-19 重庆邮电大学 基于脉冲控制的具有切换拓扑结构的多智能体系统的分组一致性控制方法
CN114647188A (zh) * 2022-03-01 2022-06-21 北京航空航天大学 拒绝服务攻击下合作竞争多智能体系统安全协同控制方法
CN114609909A (zh) * 2022-03-15 2022-06-10 广州大学 一种切换拓扑下的随机多智体系统控制协议的设计方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
MUHAMMAD AHSAN等: "Bipartite Containment Control of Multi-Agent Systems", 《2019 IEEE/ASME INTERNATIONAL CONFERENCE ON ADVANCED INTELLIGENT MECHATRONICS (AIM)》, 17 October 2019 (2019-10-17) *
唐朝君: "多智能体系统一致性问题与包含控制问题研究", 《中国学位论文电子期刊》, 31 December 2012 (2012-12-31) *
宋娜;洪小敏;周川;: "通信受限的网络化多智能体系统编队控制", 动力学与控制学报, no. 02, 20 April 2017 (2017-04-20) *
李猛;梁加红;李石磊;: "一种改进的多智能体碰撞避免行为", 国防科技大学学报, no. 03, 28 June 2013 (2013-06-28) *
肖星;罗毅平;蔡聪;姚月杰;: "基于事件触发策略的连续多智能体系统一致性综述", 湖南工程学院学报(自然科学版), no. 02, 25 June 2020 (2020-06-25) *
贾新春;张媛;池小波;阮艺琳;: "复合网络攻击下离散时间多智能体系统的云端预测控制", 山西大学学报(自然科学版), no. 03 *

Also Published As

Publication number Publication date
CN115378648B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
Campbell Beyond zero trust: Trust is a vulnerability
CN114363093B (zh) 一种基于深度强化学习的蜜罐部署主动防御方法
CN110221581B (zh) 工业控制网络监测装置和方法
CN110716582A (zh) 适用于通信受间歇DoS攻击下的多智能体一致性跟踪协议设计方法
CN113268083B (zh) 基于动态事件触发的多无人机系统编队跟踪控制方法
CN114371617A (zh) 基于脉冲控制的具有切换拓扑结构的多智能体系统的分组一致性控制方法
Guo et al. Fixed-time consensus of nonlinear multi-agent system with uncertain disturbances based on event-triggered strategy
CN112558476B (zh) 基于攻击补偿的非线性多智体系统无领导者一致控制方法
CN108681247B (zh) 一种完全分布式保性能通信容错编队控制方法
CN111103881A (zh) 一种多智能体编队防碰撞控制方法及系统
CN110213086B (zh) 基于网络控制系统l2-l∞控制的切换系统方法及系统、控制器和控制方法
CN111786967B (zh) DDoS攻击的防御方法、系统、节点及存储介质
CN115378648A (zh) 多智能体系统的防网络攻击包含控制方法、装置及终端
CN111046955B (zh) 一种基于图网络的多智能体对抗策略智能预测方法及装置
Zhang et al. Output-constrained fixed-time coordinated control for multi-agent systems with event-triggered and delayed communication
CN116679753B (zh) 一种异构无人系统抗欺骗攻击的编队跟踪控制方法
CN117040776A (zh) 混合随机网络攻击下的多智能体系统的安全协同控制方法
CN113904937B (zh) 一种服务功能链迁移方法、装置、电子设备及存储介质
CN113031644B (zh) 一种面向通信时滞的飞行器编队控制系统事件触发方法、装置及介质
Narayanan et al. Cyber secure consensus of discrete-time fractional-order multi-agent systems with distributed delayed control against attacks
CN114564801A (zh) 液压系统模型辨识方法及装置
CN114912108A (zh) 一种欺骗攻击下多Euler-Lagrange系统实现无领导者一致性方法
CN109981339B (zh) 一种网联汽车控制系统的故障容错控制方法
CN116224867B (zh) 一种多智能体系统的二分包容控制方法
CN116560240B (zh) 计算机可读存储介质及二阶多智能体一致性控制系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant