CN115378648A

CN115378648A - 多智能体系统的防网络攻击包含控制方法、装置及终端

Info

Publication number: CN115378648A
Application number: CN202210843052.XA
Authority: CN
Inventors: 闫琛皓; 李晨; 邵晋梁; 石磊; 赵源; 马文建
Original assignee: Shenzhen Institute of Artificial Intelligence and Robotics
Current assignee: Shenzhen Institute of Artificial Intelligence and Robotics
Priority date: 2022-07-18
Filing date: 2022-07-18
Publication date: 2022-11-22
Anticipated expiration: 2042-07-18
Also published as: CN115378648B

Abstract

本发明公开了一种多智能体系统的防网络攻击包含控制方法、装置及终端，上述方法包括：通过构建与不同拓扑场景对应的加权邻接矩阵来反映智能体之间信息传输的权重，当受到网络攻击时，通过更新加权邻接矩阵以反映网络攻击下的智能体之间的关系，然后根据不同的拓扑场景对应的控制协议来控制智能体的位置更新，从而实现多智能体系统的包含控制。与现有技术相比，能够适应不同拓扑场景，当受到网络攻击时也能衡量智能体之间信息传输的能力，从而控制智能体的位置更新实现对目标的包含控制。

Description

多智能体系统的防网络攻击包含控制方法、装置及终端

技术领域

本发明涉及智能体控制技术领域，尤其涉及的是一种多智能体系统的防网络攻击包含控制方法、装置、智能终端及存储介质。

背景技术

多智能体系统的包含控制，是指通过智能体之间的信息交互，使得单个或多个目标智能体进入到由指定智能体轨迹形成的凸包当中。包含控制是多智能体系统协调控制研究的重要成果，具备广阔的发展前景，比如联合保护问题，自控智能车辆安全移动问题等。

现有多智能体系统的包含控制，通常假设所有智能体都能够顺利接收到相邻智能体的信息，然而，由于入侵者和攻击者通过不正常的手段获取、更改甚至破坏隐私数据，例如：分布式网络系统中的DoS攻击(拒绝服务攻击)。使得智能体之间的通信极其不稳定，智能体之间不能信息交互，导致不能实现包含控制的任务。

因此，现有技术有待改进和提高。

发明内容

本发明的主要目的在于提供一种多智能体系统的防网络攻击包含控制方法、装置、智能终端及存储介质，能够在网络攻击下实现智能体系统的包含控制。

为了实现上述目的，本发明第一方面提供一种多智能体系统的防网络攻击包含控制方法，预先建立多智能体系统模型，控制每个智能体的位置更新以实现多智能体系统的包含控制，控制智能体的位置更新的方法包括：

获取智能体当前时间步的位置信息和速度信息；

获得与当前拓扑场景对应的加权邻接矩阵，所述加权邻接矩阵用于反映智能体之间信息传输的权重；

当智能体受到网络攻击时，更新所述加权邻接矩阵；

基于与当前拓扑场景对应的控制协议，根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息；

基于所述下一时间步的速度信息控制智能体的位置更新。

可选的，还包括：根据智能体之间的连接状态确定当前拓扑场景，所述智能体之间的连接状态包括智能体之间的连接保持不变或智能体之间的连接可变。

可选的，所述当智能体受到网络攻击时，更新所述加权邻接矩阵，包括：

在所述加权邻接矩阵中查找与所述智能体对应的行向量；

将所述行向量的数值设置为0。

可选的，若当前拓扑场景为固定拓扑场景，所述控制协议的表达式为：

其中，k为时间步，θ_i为控制向量，a_ij为固定拓扑场景下的加权邻接矩阵，x_i、x_j分别为第i个智能体、第j个智能体的位置信息，β₁>0为反馈控制增益参数，v_i、v_j分别为第i个智能体、第j个智能体的速度信息，

为时间段。

可选的，若当前拓扑场景为切换拓扑场景，所述控制协议的表达式为：

其中，t_k为时间步，θ_i为控制向量，

为切换拓扑场景下的加权邻接矩阵，x_i、x_j分别为第i个智能体、第j个智能体的位置信息，β₂,β₃,β₄>0为反馈控制增益参数，v_i、v_j分别为第i个智能体、第j个智能体的速度信息，

为时间段。

可选的，采用异步的方式控制多智能体系统中每个智能体的位置更新。

可选的，所述多智能体系统模型还包括与拓扑场景对应的位置更新协议和速度更新协议。

本发明第二方面提供一种多智能体系统的防网络攻击包含控制装置，其中，上述装置包括：

信息获取模块，用于获取智能体当前时间步的位置信息和速度信息；

通信权重获取模块，用于获得与当前拓扑场景对应的加权邻接矩阵，所述加权邻接矩阵用于反映智能体之间信息传输的权重；

网络攻击处理模块，用于当智能体受到网络攻击时，更新所述加权邻接矩阵；

更新模块，用于基于与当前拓扑场景对应的控制协议，根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息；

控制模块，用于基于所述下一时间步的速度信息控制智能体的位置更新。

本发明第三方面提供一种智能终端，上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的多智能体系统的防网络攻击包含控制程序，上述多智能体系统的防网络攻击包含控制程序被上述处理器执行时实现任意一项上述多智能体系统的防网络攻击包含控制方法的步骤。

本发明第四方面提供一种计算机可读存储介质，上述计算机可读存储介质上存储有多智能体系统的防网络攻击包含控制程序，上述多智能体系统的防网络攻击包含控制程序被处理器执行时实现任意一项上述多智能体系统的防网络攻击包含控制方法的步骤。

由上可见，本发明通过构建与不同拓扑场景对应的加权邻接矩阵来反映智能体之间信息传输的权重，当受到网络攻击时，通过更新加权邻接矩阵以反映网络攻击下的智能体之间的关系，然后根据不同的拓扑场景对应的控制协议来控制智能体的位置更新，从而实现多智能体系统的包含控制。与现有技术相比，能够针对不同拓扑场景，当受到网络攻击时也能衡量智能体之间信息传输的能力，从而根据相应的控制协议控制智能体的位置更新实现包含控制。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的多智能体系统的防网络攻击包含控制方法的流程示意图；

图2是本发明实施例提供的多智能体系统的防网络攻击包含控制装置的结构示意图；

图3是本发明实施例提供的一种智能终端的内部结构原理框图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当…时”或“一旦”或“响应于确定”或“响应于检测到”。类似的，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述的条件或事件]”或“响应于检测到[所描述条件或事件]”。

下面结合本发明实施例的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其它不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

多智能体系统包含控制主要是通过分布式控制协议来实现多个智能体状态的最终一致。多智能体系统中，若一个智能体没有邻居智能体，但存在从该智能体出发的边，则称其为领导者；若一个智能体有邻居智能体，则称其为跟随者。二阶多智能体系统的通信拓扑中存在多个领导者和跟随者，通过包含控制实现所有的跟随者都能最终稳定收敛到由领导者构成的凸包中。

目前二阶多智能体系统的包含控制方面的研究工作都是基于智能体之间的通信连通条件下的，而在实际应用中，由于入侵者和攻击者通过不正常的手段获取、更改甚至破坏隐私数据，例如：分布式网络系统中的DoS攻击(拒绝服务攻击)对网络协议发起攻击或通过消耗智能体的网络资源，以此实现智能体无法正常服务或通信，甚至崩溃、死机，使得智能体之间的通信出现故障，智能体之间不能信息交互，导致不能实现包含控制的任务。

本实施例通过建立描述智能体信息的模型，对于DoS攻击情况进行描述，分别针对不同的拓扑场景，建立DoS攻击下智能体的新关系图，再设计不同拓扑场景下的分布式控制协议，实现智能体系统对于给定目标的包含控制。需要说明的是，虽然本实施例以拒绝服务攻击为例对本发明方案进行说明，但是，本发明适用于任何导致智能体之间通信故障的情况。

示例性方法

本实施例提供一种多智能体系统的防网络攻击包含控制方法，应用在多智能体系统的控制器装置中，通过多智能体系统模型控制每个智能体的位置更新以实现智能体系统的包含控制，具体地，控制每个智能体的位置更新的方法如图1所示，包括如下步骤：

步骤S100：获取智能体当前时间步的位置信息和速度信息；

具体地，预先建立多智能体系统模型。多智能体系统模型中包括了描述智能体的位置更新协议、速度更新协议、控制协议以及智能体之间的通信状态图，位置更新协议和速度更新协议用来控制智能体的位置更新，根据控制协议及智能体之间的通信状态图确定控制向量。然后在获取到待控制的智能体在当前时间步的位置信息和速度信息后，就可以在现有的位置信息、速度信息的基础上根据控制向量来控制智能体的位置更新。

特别地，本发明中，对于不同的拓扑场景，多智能体系统模型也相应的有所不同。其中，拓扑场景根据智能体之间的连接状态来确定，智能体之间的连接保持不变时为固定拓扑场景，智能体之间的连接可变时为切换拓扑场景。即当多智能体系统的通信存在故障或需要减少通讯损耗时，多智能体系统的通信拓扑不再是固定拓扑，而是随时间进行切换，即切换拓扑。固定拓扑场景假定在没有受到DoS攻击时通信拓扑图包含以领导者为根的生成森林，且每个智能体在长度为Pδ的时间区间上至少不被攻击一次，切换拓扑场景假定没有受到DoS攻击时在一定长度的时间段内通信拓扑图的并包含以领导者为根的生成森林，且每个智能体在长度为2(n-n₁)的时间区间上至少不被攻击一次。

在固定拓扑场景下，多智能体模型的状态方程包括：

位置更新协议：x_i(k+1)＝x_i(k)+τv_i(k)，i∈V_l∪V_f；

速度更新协议：

v_i(k)＝v(0)，i∈V_l；

v_i(k+1)＝v_i(k)+τθ_i(k)，i∈V_f；

且满足V_f中每个智能体i,i∈V_f接收信息的时间序列分别为

且相邻时刻满足

δ₁为正整数。

在切换拓扑场景下，多智能体模型的状态方程包括：

位置更新协议：

x_i(t_k+1)＝x_i(t_k)，i∈V_l；

x_i(t_k+1)＝x_i(t_k)+τ_kv_i(t_k)，i∈V_f；

速度更新协议：

v_i(k)＝v(0)，i∈V_l；

v_i(t_k+1)＝v_i(t_k)+τ_kθ_i(t_k)，i∈V_f；

且满足V_f中每个智能体i,i∈V_f接收信息的时间序列分别为

且相邻时刻满足

δ₂>τ_min为正整数。

上述协议中，V_l表示智能体i，i＝1,2,...m所在的集合，V_f表示智能体i，i＝m+1,m+2,…,n所在的集合；x_i(k),x_i(t_k)∈R^p×1，v_i(k),v_i(t_k)∈R^p×1，θ_i(k),θ_i(t_k)∈R^p×1分别代表智能体i在kv时刻和t_k时刻的状态信息，速度信息和控制协议。通过使用Kronecker积，可以将结果推广到任意正整数p上。也就是说，本实施例中，分别针对了两种不同的拓扑展开对于DoS攻击的包含控制的研究，并且，对于x_i(k),x_i(t_k)∈R^p×1,v_i(k),v_i(t_k)∈R^p×1,θ_i(k),θ_i(t_k)∈R^p×1中的p，可以是任意正整数。

以下描述中将x_l(k)记为[x₁ ^T(k),x₂ ^T(k),...,x_m ^T(k)]^T；v_l(k)记为[v₁ ^T(k),v₂ ^T(k),...,v_m ^T(k)]^T；x_f(k)记为[x_m+2 ^T(k),x_m+2 ^T(k),...,x_n ^T(k)]^T；v_f(k)记为[v_m+1 ^T(k),v_m+2 ^T(k),...,v_n ^T(k)]^T。

步骤S200：获得与当前拓扑场景对应的加权邻接矩阵，所述加权邻接矩阵用于反映智能体之间信息传输的权重；

具体地，智能体之间的通信状态图中各智能体之间的信息传输能力用加权邻接矩阵来衡量。固定拓扑场景下智能体之间的通信状况用加权邻接矩阵A＝[a_ij]_n×n来表示，a_ij表示智能体i与智能体j之间的进行信息传输的权重，该权重的具体数值可以根据智能体的信息传输阈值进行分段来做相应设定。

满足如果智能体i能够接收到智能体j的信息，则a_ij>0，否则a_ij＝0。对应的拉普拉斯矩阵为L_A＝[l_ij]_n×n＝D-A，其中D为对角矩阵，且对角线上的元素为加权邻接矩阵A每一行的行和。

切换拓扑场景下智能体之间的通信状况用加权邻接矩阵B(t_k)＝[b_ij(t_k)]_n×n来表示，b_ij(t_k)表示在kτ时刻智能体i与智能体j之间进行信息传输的权重，

满足如果智能体i在kτ时刻能够接收到智能体j的信息，则b_ij(t_k)>0，否则b_ij(k)＝0。对应的拉普拉斯矩阵为L_B(t_k)＝[l_ij(t_k)]_n×n＝D(t_k)-B(t_k)，其中D(t_k)为对角矩阵，且对角线上的元素为kτ时刻加权邻接矩阵B(t_k)每一行的行和。

步骤S300：当智能体受到拒绝服务攻击时，更新加权邻接矩阵；

具体地，定义

为第i个智能体DoS攻击的时间序列，Δ_s表示第s次攻击的时长，那么第s次攻击的时间段为

假设Δ_s<τ。

表示在(t₀,t)时间段内智能体i受到攻击的次数，

表示在这段时间内的攻击频率。固定拓扑场景下假定

切换拓扑场景下假定

存在攻击时，领导者和跟随者之间的通讯中断，通讯拓扑结构发生变化，此时多智能体系统由稳定变为不稳定，因此采用不同拓扑场景来描述存在DoS攻击时的领导者-跟随者多智能体系统；受到攻击时，多智能体系统对应切换拓扑场景下的不稳定子系统，未受到受攻击时，多智能体系统对应固定拓扑场景下的稳定子系统。

若智能体i在kτ时刻处于受到攻击的状态，在固定拓扑场景下，则将加权邻接矩阵A的第i行元素全变为0；在切换拓扑场景下，则将加权邻接矩阵B(t_k)的第i行元素全变为0。若智能体i在kτ时刻没有受到攻击，则加权邻接矩阵A和B(t_k)中的第i行元素保持不变。

以下分别用A(k)＝[a_ij(k)]_n×n和

来表示不同场景下第k个时刻智能体之间的关系，对应的拉普拉斯矩阵分别为L_A(k)＝[l_ij(k)]_n×n和

采用上述的加权邻接矩阵和拉普拉斯矩阵能够直观描述不同时刻DoS攻击下智能体的状态，方便地用于控制协议中。

步骤S400：基于与当前拓扑场景对应的控制协议，根据加权邻接矩阵、位置信息和速度信息获取下一时间步的速度信息；

具体地，固定拓扑场景下，智能体控制协议的表达式为：

为时间段。

切换拓扑场景下，控制协议的表达式为：

其中，t_k为时间步，θ_i为控制向量，

为时间段。

根据上述控制协议，根据加权邻接矩阵、位置信息和速度信息获取下一时间步的控制向量，然后根据多智能体系统模型中的速度更新协议获得下一时间步的速度信息。

步骤S500：基于下一时间步的速度信息控制智能体的位置更新。

具体地，根据多智能体系统模型中的位置更新协议，代入下一时间步的速度信息控制智能体的位置更新。

进一步地，采用本发明的控制协议，还可以采用异步的方式控制多智能体系统中每个智能体的位置更新。

由上所述，本实施例通过建立加权邻接矩阵来描述智能体之间的关系，若受到DOS攻击时，相应更改加权邻接矩阵，并对固定拓扑和切换拓扑两种场景分别建立相应的控制协议，根据控制协议实现多智能体模型的收敛，从而实现二阶多智能体系统的包含控制，即实现跟随者智能体能够进入由领导者智能体所形成的固定形状的凸包当中，并且能够跟随着领导者智能体做匀速运动。

以下对固定拓扑场景下控制协议的收敛性做进一步分析，以验证多智能体系统能够实现对目标的包含控制，收敛性分析具体过程如下：

将控制协议代入状态方程并进行坐标变换，可以得到：

其中η(k)＝(e_x ^T(k),αe_x ^T(k)+αβe_v ^T(k))^T，

对η(k)进行收敛性分析，如果lim_k→∞||η(k+1)||∞＝0，那么显然多智能体系统对目标的包含控制能够实现。

进一步对使得lim_k→∞||η(k+1)||_∞＝0的条件进行推导：

假定智能体的固定通信拓扑图包含以领导者为根的生成森林，且有：

则多智能体系统能够实现对目标的包含控制，即

目标能够进入由V_l中智能体所形成的固定形状的凸包当中，并且能够跟随着V_l中智能体做匀速运动。其中α>1为常数，P表示从V_l中任意一个智能体到V_l中任意一个智能体的最长路，d_min和d_max分别对角矩阵D中对角元素的最小值与最大值。

以下对切换拓扑场景下控制协议的收敛性做进一步分析，以验证多智能体系统能够实现对目标的包含控制，收敛性分析具体过程如下：

将控制协议代入状态方程并进行坐标变换，可以得到：

其中

同样对η(k)进行收敛性分析，如果lim_k→∞||η(k+1)||∞＝0，那么显然包含控制能够实现。

进一步对使得lim_k→∞||η(k+1)||_∞＝0的条件进行推导：

假定智能体的切换通信拓扑在一定的时间间隔内的并包含以领导者为根的生成森林，且有：

则所述智能体系统能够实现对目标的包含控制，

lim_k→∞v_f(t_k)＝0。目标能够进入到由V_l中智能体所形成的凸包当中，并且能够跟随着V_l中智能体做匀速运动，但在该场景下随着通信拓扑的变化，目标在凸包中的位置也会发生变化。其中m为V_l中智能体的个数。

综上所述，本发明的方法适用于存在网络攻击时大规模无人机编队飞行控制或智能车编队控制，从而实现两种情形下的跟随者都能运动到由领导者构成的凸包中，跟随者与领导者的速度实现一致。

示例性设备

如图2所示，对应于上述多智能体系统的防网络攻击包含控制方法，本发明实施例还提供一种多智能体系统的防网络攻击包含控制装置，上述多智能体系统的防网络攻击包含控制装置包括：

信息获取模块600，用于获取智能体当前时间步的位置信息和速度信息；

通信权重获取模块610，用于获得与当前拓扑场景对应的加权邻接矩阵，所述加权邻接矩阵用于反映智能体之间信息传输的权重；

拒绝服务攻击处理模块620，用于当智能体受到网络攻击时，更新所述加权邻接矩阵；

更新模块630，用于基于与当前拓扑场景对应的控制协议，根据所述加权邻接矩阵、所述位置信息和所述速度信息获取下一时间步的速度信息；

控制模块640，用于基于所述下一时间步的速度信息控制智能体的位置更新。

具体的，本实施例中，上述多智能体系统的防网络攻击包含控制装置的各模块的具体功能可以参照上述多智能体系统的防网络攻击包含控制方法中的对应描述，在此不再赘述。

基于上述实施例，本发明还提供了一种智能终端，其原理框图可以如图3所示。上述智能终端包括通过系统总线连接的处理器、存储器、网络接口以及显示屏。其中，该智能终端的处理器用于提供计算和控制能力。该智能终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和多智能体系统的防网络攻击包含控制程序。该内存储器为非易失性存储介质中的操作系统和多智能体系统的防网络攻击包含控制程序的运行提供环境。该智能终端的网络接口用于与外部的终端通过网络连接通信。该多智能体系统的防网络攻击包含控制程序被处理器执行时实现上述任意一种多智能体系统的防网络攻击包含控制方法的步骤。该智能终端的显示屏可以是液晶显示屏或者电子墨水显示屏。

本领域技术人员可以理解，图3中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的智能终端的限定，具体的智能终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种智能终端，上述智能终端包括存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的多智能体系统的防网络攻击包含控制程序，上述多智能体系统的防网络攻击包含控制程序被上述处理器执行时进行以下操作指令：

预先建立多智能体系统模型，控制每个智能体的位置更新以实现多智能体系统的包含控制，控制智能体的位置更新的方法包括：

获取智能体当前时间步的位置信息和速度信息；

当智能体受到网络攻击时，更新所述加权邻接矩阵；

基于所述下一时间步的速度信息控制智能体的位置更新。

在所述加权邻接矩阵中查找与所述智能体对应的行向量；

将所述行向量的数值设置为0。

为时间段。

其中，t_k为时间步，θ_i为控制向量，

为时间段。

本发明实施例还提供一种计算机可读存储介质，上述计算机可读存储介质上存储有多智能体系统的防网络攻击包含控制程序，上述多智能体系统的防网络攻击包含控制程序被处理器执行时实现本发明实施例提供的任意一种多智能体系统的防网络攻击包含控制方法的步骤。

应理解，上述实施例中各步骤的序号大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将上述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各实例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，上述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以由另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，上述计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，上述计算机程序包括计算机程序代码，上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括：能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.多智能体系统的防网络攻击包含控制方法，其特征在于，预先建立多智能体系统模型，控制每个智能体的位置更新以实现多智能体系统的包含控制，控制智能体的位置更新的方法包括：

获取智能体当前时间步的位置信息和速度信息；

当智能体受到网络攻击时，更新所述加权邻接矩阵；

基于所述下一时间步的速度信息控制智能体的位置更新。

2.如权利要求1所述的多智能体系统的防网络攻击包含控制方法，其特征在于，还包括：根据智能体之间的连接状态确定当前拓扑场景，所述智能体之间的连接状态包括智能体之间的连接保持不变或智能体之间的连接可变。

3.如权利要求1所述的多智能体系统的防网络攻击包含控制方法，其特征在于，所述当智能体受到网络攻击时，更新所述加权邻接矩阵，包括：

在所述加权邻接矩阵中查找与所述智能体对应的行向量；

将所述行向量的数值设置为0。

4.如权利要求1所述的多智能体系统的防网络攻击包含控制方法，其特征在于，若当前拓扑场景为固定拓扑场景，所述控制协议的表达式为：

θ_i(k)＝0，

其中，k为时间步，θ_i为控制向量，a_ij为固定拓扑场景下的加权邻接矩阵，x_i、x_j分别为第i个智能体、第j个智能体的位置信息，β₁＞0为反馈控制增益参数，v_i、v_j分别为第i个智能体、第j个智能体的速度信息，

为时间段。

5.如权利要求1所述的多智能体系统的防网络攻击包含控制方法，其特征在于，若当前拓扑场景为切换拓扑场景，所述控制协议的表达式为：

其中，t_k为时间步，θ_i为控制向量，

为切换拓扑场景下的加权邻接矩阵，x_i、x_j分别为第i个智能体、第j个智能体的位置信息，β₂，β₃，β₄＞0为反馈控制增益参数，v_i、v_j分别为第i个智能体、第j个智能体的速度信息，

为时间段。

6.如权利要求1所述的多智能体系统的防网络攻击包含控制方法，其特征在于，采用异步的方式控制多智能体系统中每个智能体的位置更新。

7.如权利要求1所述的多智能体系统的防网络攻击包含控制方法，其特征在于，所述多智能体系统模型还包括与拓扑场景对应的位置更新协议和速度更新协议。

8.多智能体系统的防网络攻击包含控制装置，其特征在于，所述装置包括：

拒绝服务攻击处理模块，用于当智能体受到网络攻击时，更新所述加权邻接矩阵；

9.智能终端，其特征在于，所述智能终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的多智能体系统的防网络攻击包含控制程序，所述多智能体系统的防网络攻击包含控制程序被所述处理器执行时实现如权利要求1-7任意一项所述多智能体系统的防网络攻击包含控制方法的步骤。

10.计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有多智能体系统的防网络攻击包含控制程序，所述多智能体系统的防网络攻击包含控制程序被处理器执行时实现如权利要求1-7任意一项所述多智能体系统的防网络攻击包含控制方法的步骤。