CN111045334B - 信息物理融合系统的主动防御弹性滑模控制方法 - Google Patents

信息物理融合系统的主动防御弹性滑模控制方法 Download PDF

Info

Publication number
CN111045334B
CN111045334B CN201911418806.1A CN201911418806A CN111045334B CN 111045334 B CN111045334 B CN 111045334B CN 201911418806 A CN201911418806 A CN 201911418806A CN 111045334 B CN111045334 B CN 111045334B
Authority
CN
China
Prior art keywords
defense
state
sliding mode
physical
attack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911418806.1A
Other languages
English (en)
Other versions
CN111045334A (zh
Inventor
吴承伟
吴立刚
刘健行
高亚斌
孙光辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201911418806.1A priority Critical patent/CN111045334B/zh
Publication of CN111045334A publication Critical patent/CN111045334A/zh
Application granted granted Critical
Publication of CN111045334B publication Critical patent/CN111045334B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

信息物理融合系统的主动防御弹性滑模控制方法,属于信息安全技术领域,解决了信息物理融合系统拒绝服务攻击下的物理过程的指数稳定性差、数据丢失量大的问题。本发明建立拒绝服务攻击物理过程模型;利用拒绝服务攻击物理过程模型和零和博弈理论,设计在DoS攻击下基于防御策略的估计器;利用所述基于防御策略的估计器对系统状态进行估计;利用估计的系统状态,获取主动防御的弹性滑模控制器。本发明适用于信息物理融合系统中使用。

Description

信息物理融合系统的主动防御弹性滑模控制方法
技术领域
本发明属于信息安全技术领域,具体涉及一种信息物理融合系统在拒绝服务攻击下的主动防御弹性滑模控制方法。
背景技术
信息物理融合系统(CPS)是一个综合了计算、网络和物理环境的多维复杂系统,在民用基础设施和工业应用的开发中起着越来越重要的作用。但是,在信息物理融合系统中,与物理层互联的开放式网络层也极易遭受攻击。因此,对信息物理融合系统中网络环境的保护已经成为信息安全领域的研究热点,此保护主要涉及两个方面:对攻击的检测和受到攻击下的安全控制。
攻击者通常向网络世界部署两类攻击行为:导致数据丢失的拒绝服务攻击和破坏数据完整性的欺骗攻击。拒绝服务攻击(DoS)是一种经典的攻击方法,例如泛洪攻击、泪滴攻击和ping of death攻击。对于安全控制问题,设计控制器前重要的一步是建立一定的描述攻击的规则。对于拒绝服务攻击,假设拒绝服务攻击是定期部署的,并且假设可以监测到攻击的周期,可以采用事件触发的弹性控制器;针对消除概率的假设,可以通过提供最大数量的连续拒绝服务攻击来限制攻击性能;针对攻击频率和攻击持续时间概念,可以设计保证物理过程输入状态稳定性的弹性控制策略。尽管除了攻击频率和攻击持续时间外没有对攻击动作施加任何假设,但是如何建立一种使攻击满足这些假设机制的方法尚未得到解决,因此,仍然存在拒绝服务攻击下物理过程指数稳定性差的问题,且导致大量数据丢失的问题。
发明内容
本发明是为了解决信息物理融合系统拒绝服务攻击下的物理过程的指数稳定性差、数据丢失量大的问题,提出了一种信息物理融合系统的主动防御弹性滑模控制方法。
本发明所述的一种信息物理融合系统的主动防御弹性滑模控制方法,该方法利用结合零和博弈理论设计主动防御的弹性滑模控制器,利用主动防御的弹性滑模控制器对信息物理融合系统中拒绝服务攻击进行主动防御,所述主动防御的弹性滑模控制器获取的具体方法为:
步骤一、建立拒绝服务攻击物理过程模型;
步骤二、利用拒绝服务攻击物理过程模型和零和博弈理论,设计在DoS攻击下基于防御策略的估计器;
步骤三、利用所述基于防御策略的估计器对系统状态进行估计;
步骤四、利用估计的系统状态,获取主动防御的弹性滑模控制器。
进一步地,步骤一所述建立拒绝服务攻击物理过程模型的具体步骤为:
结合对外部干扰的衰减对物理层中的物理过程进行描述:
x(k+1)=Ax(k)+Bu(k)+Eω(k) (1)
其中,E为外部扰动的权重矩阵;ω(k)为外部扰动,假设其属于l2[0,+∞)空间,x(k)为物理层中物理过程模型的k时刻的状态向量,u(k)为物理层中物理过程模型k时刻的控制输入向量,y(k)为理层中物理过程模型的k时刻输出变量,A为动态系统中已知的状态参数矩阵,B为已知的控制系统控制输入参数矩阵,其中,矩阵B为满秩矩阵;k为时间;
DoS攻击的发生率为
Figure BDA0002351834720000021
Γ(τ,k)为在时间段[0,k]中DoS攻击激活的时间间隔。
进一步地,步骤二所述获取在DoS攻击下基于防御策略的估计器为:
Figure BDA0002351834720000022
其中,
Figure BDA0002351834720000023
为基于防御策略的估计器对k+1时刻系统状态的估计;
Figure BDA0002351834720000024
为k时刻状态变量x(k)的估计,
Figure BDA0002351834720000025
e(k)为估计误差,
Figure BDA0002351834720000026
C为已知的系统输出状态参数矩阵,L为DoS攻击状态下估计器的参数矩阵,L为静默状态下估计器的参数矩阵,Ψ(0,k)为在时间段[0,k]中DoS攻击静默的时间间隔。
进一步地,步骤三所述的利用所述基于防御策略的估计器对系统状态进行估计的方法为:
首先建立基于零和博弈理论的混合防御策略模型;
将信息物理融合系统中的防御方和恶意攻击方视为零和博弈中的两方,通过计算博弈矩阵,建立最优混合防御策略;
攻击方从库
Figure BDA0002351834720000027
中选择一种攻击方式,n和M均为正整数;
防御方从库
Figure BDA0002351834720000028
中选择防御方式;N为正整数;
定义
Figure BDA0002351834720000031
为所有库
Figure BDA0002351834720000032
中可选集的集合,集合
Figure BDA0002351834720000033
的势为
Figure BDA0002351834720000034
则防御策略
Figure BDA0002351834720000035
m为防御者的防御策略选择,m∈{1,2,...,2N};
Figure BDA0002351834720000036
为在网络状态θ下,防御方选择
Figure BDA0002351834720000037
防御策略的可能性,g(θ,an)为在网络状态θ下,攻击方选择an攻击方式的可能性,其中,θ∈Θ、Θ={θ12,...θs}、
Figure BDA0002351834720000038
0≤g(θ,an)≤1、
Figure BDA0002351834720000039
网络状态的转移概率为
Figure BDA00023518347200000310
其中θ′,θ∈Θ,
Figure BDA00023518347200000311
在攻击状态θ及策略对
Figure BDA00023518347200000312
下的成本函数fcost为:
Figure BDA00023518347200000313
Figure BDA00023518347200000314
为策略成本函数,
Figure BDA00023518347200000315
为防御成本函数;在所有的网络状态下定义:
Figure BDA00023518347200000316
Figure BDA00023518347200000317
Figure BDA00023518347200000318
Figure BDA00023518347200000319
Figure BDA00023518347200000320
为网络状态θ下防御方选择防御策略的可能性向量,其中,
Figure BDA00023518347200000321
均为防御策略;
Figure BDA00023518347200000322
为防御方网络状态向量,
Figure BDA00023518347200000323
为防御方是θ1网络状态的可能性,同理,
Figure BDA00023518347200000324
为防御方是θs网络状态的可能性,
Figure BDA00023518347200000325
为攻击方网络状态向量,
Figure BDA00023518347200000326
为攻击方是θ1网络状态的可能性,同理,
Figure BDA00023518347200000327
为攻击方是θs网络状态的可能性;
折现零和博弈中对任意
Figure BDA00023518347200000328
都存在:
Figure BDA00023518347200000329
Figure BDA00023518347200000330
其中,
Figure BDA00023518347200000331
为第N+1次的自变量为θ的β折支付函数,
Figure BDA00023518347200000332
为第N次的自变量为θ′的β折支付函数,θ′为网络状态量,Prob(·)表示概率函数,
Figure BDA00023518347200000333
Figure BDA00023518347200000334
的对策值,
Figure BDA00023518347200000335
为零和博弈矩阵;
Figure BDA00023518347200000336
其中,0<β<1为折现因子;且
Figure BDA00023518347200000421
则当β折博弈满足:
Figure BDA0002351834720000041
时,
Figure BDA0002351834720000042
为其鞍点,
Figure BDA0002351834720000043
Figure BDA0002351834720000044
为鞍点平衡时的防御策略和攻击策略;
Figure BDA0002351834720000045
表示关于
Figure BDA0002351834720000046
Figure BDA0002351834720000047
的数学期望运算;因此,最优防御策略为:
Figure BDA0002351834720000048
其中,
Figure BDA0002351834720000049
为最优的
Figure BDA00023518347200000410
函数,
Figure BDA00023518347200000411
为最优的
Figure BDA00023518347200000412
函数;
对于零和博弈矩阵
Figure BDA00023518347200000413
通过线性程序得到平衡鞍点
Figure BDA00023518347200000422
Figure BDA00023518347200000414
其中,z为决策变量列向量,zT为z的转置;y(k)为系统输出变量;
由于存在:最优值
Figure BDA00023518347200000424
通过不等式(6)求解,得到
Figure BDA00023518347200000423
的值;
利用
Figure BDA00023518347200000425
的值和Matlab线性矩阵不等式工具包获取当前的网络状态和当前的防御策略
Figure BDA00023518347200000415
即确定了当前时刻的网络状态θ和切换信号i∈{0,1};
当i=0时:DoS攻击成功实施,k∈Γ(0,k);
Figure BDA00023518347200000416
其中,
Figure BDA00023518347200000417
K为静默状态下滑模面增益矩阵;
当i=1时:无DoS攻击k∈Ψ(0,k);
Figure BDA00023518347200000418
其中,
Figure BDA00023518347200000419
K为DoS攻击状态下滑模面增益矩阵。
进一步地,步骤三所述利用估计的系统状态,获取主动防御的弹性滑模控制器;
Figure BDA00023518347200000420
K为滑模面增益矩阵,L为估计器的开关增益参数矩阵,G为作用于s(k)的参数矩阵,s(k)为差分型滑模曲面函数,Λ>0是可以调节的矩阵并且:
Figure BDA0002351834720000051
s(k)为利用DoS攻击信息设计的差分型滑模曲面函数:
Figure BDA0002351834720000052
其中,i∈{0,1},θ∈Θ,G为给定的滑模面参数矩阵且满足GB是非奇异矩阵。
进一步地,滑模面增益矩阵K和估计器的参数矩阵L的由
Figure BDA0002351834720000053
计算获得,其中i=0,1,矩阵
Figure BDA0002351834720000054
通过求解以下三组不等式约束得到:
Figure BDA0002351834720000055
Figure BDA0002351834720000056
Figure BDA0002351834720000057
其中矩阵符号定义为,
Figure BDA0002351834720000058
Figure BDA0002351834720000059
Figure BDA00023518347200000510
Figure BDA00023518347200000511
Figure BDA00023518347200000512
Figure BDA00023518347200000513
Figure BDA00023518347200000514
其中,γθ>0为扰动衰减水平,矩阵Xi>0为矩阵约束变量,
Figure BDA00023518347200000515
为该不等式组约束中矩阵变量,
Figure BDA00023518347200000516
均为适合维度的矩阵变量,i=0,1;
Figure BDA00023518347200000517
为DoS攻击状态下主动防御的弹性滑模控制器的开关增益的估计,
Figure BDA00023518347200000518
为静默状态下主动防御的弹性滑模控制器的开关增益的估计,λ为大于零的给定标量,μ为大于1的给定标量,τD和Ta均为大于1的阈值标量,J1、J2和J3通过矩阵C的奇异值分解计算出,并且
Figure BDA00023518347200000519
I为单位矩阵。
本发明方法根据是否成功发起拒绝服务攻击,将物理过程描述为切换模型,并根据攻击频率和攻击持续时间的概念进行分析。采用弹性滑模控制器来维持拒绝服务攻击下的物理过程的指数稳定性,并采用估算器的方法估计攻击造成的数据丢失量。这样可以减轻对系统性能的不利影响。将“零和博弈”理论与攻击频率与攻击持续时间相结合,建立了主动防御策略来确定所设计控制器的切换逻辑。有效提高了信息物理融合系统拒绝服务攻击下的物理过程的指数稳定性、减少了数据丢失。
附图说明
图1是本发明中的信息物理融合系统结构框图;
图2是仿真A中系统的开环状态响应,横坐标表示为时间,纵坐标表示为两个状态变量x1、x2的值变化曲线图;
图3为仿真A在一般弹性滑模控制下状态变量x1及其估计值
Figure BDA0002351834720000061
的变化图,横坐标表示为时间,纵坐标表示为状态变量的值;
图4为仿真A在一般弹性滑模控制下状态变量x2及其估计值
Figure BDA0002351834720000062
的变化图,横坐标表示为时间,纵坐标表示为状态变量的值;
图5仿真A中DoS攻击的频率和周期变化曲线图,横坐标表示为时间,纵坐标表示为DoS是否攻击,其中DoS on为DoS攻击激活状态,DoS off为DoS攻击静默状态;
图6是仿真B中系统的开环状态响应图,横坐标表示为时间,纵坐标表示为三个状态变量x1、x2、x3的值;
图7为获得
Figure BDA0002351834720000063
Figure BDA0002351834720000064
的迭代过程曲线图,横坐标表示为时间,纵坐标表示为
Figure BDA0002351834720000065
值的变化;
图8为f(θ)和g(θ)在θ1状态下的演变图;
图9为f(θ)和g(θ)在θ2状态下的演变图;
图10为仿真A在基于主动防御的弹性滑模控制下状态变量x1及其估计值
Figure BDA0002351834720000066
的变化曲线图,横坐标表示为时间,纵坐标表示为状态变量的值;
图11为仿真A在基于主动防御的弹性滑模控制下状态变量x2及其估计值
Figure BDA0002351834720000067
的变化图,横坐标表示为时间,纵坐标表示为状态变量的值;
图12为仿真A在基于主动防御的弹性滑模控制下状态变量x3及其估计值
Figure BDA0002351834720000068
的变化图,横坐标表示为时间,纵坐标表示为状态变量的值。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
具体实施方式一:下面结合图1说明本实施方式,本实施方式所述一种信息物理融合系统的主动防御弹性滑模控制方法,
一种信息物理融合系统的主动防御弹性滑模控制方法,该方法利用结合零和博弈理论设计主动防御的弹性滑模控制器,利用主动防御的弹性滑模控制器对信息物理融合系统中拒绝服务攻击进行主动防御,所述主动防御的弹性滑模控制器获取的具体方法为:
步骤一、建立拒绝服务攻击物理过程模型;
步骤二、利用拒绝服务攻击物理过程模型和零和博弈理论,设计在DoS攻击下基于防御策略的估计器;
步骤三、利用所述基于防御策略的估计器对系统状态进行估计;
步骤四、利用估计的系统状态,获取主动防御的弹性滑模控制器。
本实施方式针对拒绝服务攻击下信息物理融合系统的主动防御弹性滑模控制方法的实现过程,信息物理融合系统拓扑如图1所示:该拓扑主要由物理层和网络层组成,对于物理层,除了控制系统中通常采用的传感器和执行器之外,本发明将所设计的估算器和弹性控制其嵌入物理层中,可观察在拒绝服务(DoS)攻击下丢失的信号,并可保证物理进程在DoS攻击下仍保持良好的性能。此外,本发明嵌入监测器用来发现是否接受到数据分组,从而确定开关状态。
进一步地,步骤一所述建立拒绝服务攻击物理过程模型的具体步骤为:
结合对外部干扰的衰减对物理层中的物理过程进行描述:
x(k+1)=Ax(k)+Bu(k)+Eω(k) (1)
其中,E为外部扰动的权重矩阵;ω(k)为外部扰动,假设其属于l2[0,+∞)空间,x(k)为物理层中物理过程模型的k时刻的状态向量,u(k)为物理层中物理过程模型k时刻的控制输入向量,y(k)为理层中物理过程模型的k时刻输出变量,A为动态系统中已知的状态参数矩阵,B为已知的控制系统控制输入参数矩阵,其中,矩阵B为满秩矩阵;k为时间;
DoS攻击的发生率为
Figure BDA0002351834720000081
Γ(τ,k)为在时间段[0,k]中DoS攻击激活的时间间隔。
进一步地,步骤二所述获取在DoS攻击下基于防御策略的估计器为:
Figure BDA0002351834720000082
其中,
Figure BDA0002351834720000083
为基于防御策略的估计器对k+1时刻系统状态的估计;
Figure BDA0002351834720000084
为k时刻状态变量x(k)的估计,
Figure BDA0002351834720000085
e(k)为估计误差,
Figure BDA0002351834720000086
C为已知的系统输出状态参数矩阵,L为DoS攻击状态下估计器的参数矩阵,L为静默状态下估计器的参数矩阵,Ψ(0,k)为在时间段[0,k]中DoS攻击静默的时间间隔。
进一步地,步骤三所述的利用所述基于防御策略的估计器对系统状态进行估计的方法为:
首先建立基于零和博弈理论的混合防御策略模型;
将信息物理融合系统中的防御方和恶意攻击方视为零和博弈中的两方,通过计算博弈矩阵,建立最优混合防御策略;
攻击方从库
Figure BDA0002351834720000087
中选择一种攻击方式,n和M均为正整数;
防御方从库
Figure BDA0002351834720000088
中选择防御方式;N为正整数;
定义
Figure BDA0002351834720000089
为所有库
Figure BDA00023518347200000810
中可选集的集合,集合
Figure BDA00023518347200000811
的势为
Figure BDA00023518347200000812
则防御策略
Figure BDA00023518347200000813
m为防御者的防御策略选择,m∈{1,2,...,2N};
Figure BDA00023518347200000814
为在网络状态θ下,防御方选择
Figure BDA00023518347200000815
防御策略的可能性,g(θ,an)为在网络状态θ下,攻击方选择an攻击方式的可能性,其中,θ∈Θ、Θ={θ12,...θs}、
Figure BDA00023518347200000816
0≤g(θ,an)≤1、
Figure BDA00023518347200000817
网络状态的转移概率为
Figure BDA00023518347200000818
其中θ′,θ∈Θ,
Figure BDA00023518347200000819
在攻击状态θ及策略对
Figure BDA0002351834720000091
下的成本函数fcost为:
Figure BDA0002351834720000092
Figure BDA0002351834720000093
为策略成本函数,
Figure BDA0002351834720000094
为防御成本函数;在所有的网络状态下定义:
Figure BDA0002351834720000095
Figure BDA0002351834720000096
Figure BDA0002351834720000097
Figure BDA0002351834720000098
Figure BDA0002351834720000099
为网络状态θ下防御方选择防御策略的可能性向量,其中,
Figure BDA00023518347200000910
均为防御策略;
Figure BDA00023518347200000911
为防御方网络状态向量,
Figure BDA00023518347200000912
为防御方是θ1网络状态的可能性,同理,
Figure BDA00023518347200000913
为防御方是θs网络状态的可能性,
Figure BDA00023518347200000914
为攻击方网络状态向量,
Figure BDA00023518347200000915
为攻击方是θ1网络状态的可能性,同理,
Figure BDA00023518347200000916
为攻击方是θs网络状态的可能性;
折现零和博弈中对任意
Figure BDA00023518347200000917
都存在:
Figure BDA00023518347200000918
Figure BDA00023518347200000919
其中,
Figure BDA00023518347200000920
为第N+1次的自变量为θ的β折支付函数,
Figure BDA00023518347200000921
为第N次的自变量为θ′的β折支付函数,θ′为网络状态量,Prob(·)表示概率函数,
Figure BDA00023518347200000922
Figure BDA00023518347200000923
的对策值,
Figure BDA00023518347200000924
为零和博弈矩阵;
Figure BDA00023518347200000925
其中,0<β<1为折现因子;且
Figure BDA00023518347200000926
则当β折博弈满足:
Figure BDA00023518347200000927
时,
Figure BDA00023518347200000928
为其鞍点,
Figure BDA00023518347200000929
Figure BDA00023518347200000930
为鞍点平衡时的防御策略和攻击策略;
Figure BDA00023518347200000931
表示关于
Figure BDA00023518347200000932
Figure BDA00023518347200000933
的数学期望运算;因此,最优防御策略为:
Figure BDA00023518347200000934
其中,
Figure BDA00023518347200000935
为最优的
Figure BDA00023518347200000936
函数,
Figure BDA00023518347200000937
为最优的
Figure BDA00023518347200000938
函数;
对于零和博弈矩阵
Figure BDA00023518347200000939
通过线性程序得到平衡鞍点
Figure BDA00023518347200000940
Figure BDA0002351834720000101
其中,z为决策变量列向量,zT为z的转置,y(k)为系统输出变量;1N和1M均为单位向量;
由于存在:最优值
Figure BDA0002351834720000102
通过不等式(6)求解,得到
Figure BDA0002351834720000103
的值;
利用
Figure BDA0002351834720000104
的值和Matlab线性矩阵不等式工具包获取当前的网络状态和当前的防御策略
Figure BDA0002351834720000105
即确定了当前时刻的网络状态θ和切换信号i∈{0,1};
当i=0时:DoS攻击成功实施,k∈Γ(0,k);
Figure BDA0002351834720000106
其中,
Figure BDA0002351834720000107
当i=1时:无DoS攻击k∈Ψ(0,k);
Figure BDA0002351834720000108
其中,
Figure BDA0002351834720000109
K为DoS攻击状态下滑模面增益矩阵,K为静默状态下滑模面增益矩阵;
由以下条件可以保证系统的指数稳定性:给定标量∈0∈(1,∞)、∈1∈(0,1)、μ>1和攻击策略选择对
Figure BDA00023518347200001010
假设存在对称矩阵Pi>0和标量λ使
Figure BDA00023518347200001011
Figure BDA00023518347200001012
则当ω(k)≡0时,系统的衰减率
Figure BDA00023518347200001013
指数稳定;其中,
Figure BDA00023518347200001014
进一步地,步骤三所述利用估计的系统状态,获取主动防御的弹性滑模控制器;
Figure BDA00023518347200001015
K为滑模面增益矩阵,L为估计器的参数矩阵,G为作用于s(k)的参数矩阵,s(k)为差分型滑模曲面函数,Λ>0是可以调节的矩阵并且:
Figure BDA0002351834720000111
s(k)为利用DoS攻击信息设计的差分型滑模曲面函数:
Figure BDA0002351834720000112
其中,i∈{0,1},θ∈Θ,G为给定的滑模面参数矩阵且满足GB是非奇异矩阵。
进一步地,滑模面增益矩阵K和估计器的参数矩阵L
Figure BDA0002351834720000113
计算获得,其中i=0,1,矩阵
Figure BDA0002351834720000114
可以通过求解以下三组不等式约束得到:
Figure BDA0002351834720000115
Figure BDA0002351834720000116
Figure BDA0002351834720000117
其中矩阵符号定义为,
Figure BDA0002351834720000118
Figure BDA0002351834720000119
Figure BDA00023518347200001110
Figure BDA00023518347200001111
Figure BDA00023518347200001112
Figure BDA00023518347200001113
Figure BDA00023518347200001114
其中,γθ>0为扰动衰减水平,矩阵Xi>0为矩阵约束变量,
Figure BDA00023518347200001115
为该不等式组约束中矩阵变量,
Figure BDA00023518347200001116
均为适合维度的矩阵变量,i=0,1;
Figure BDA00023518347200001117
为DoS攻击状态下主动防御的弹性滑模控制器的开关增益的估计,
Figure BDA00023518347200001118
为静默状态下主动防御的弹性滑模控制器的开关增益的估计,λ为大于零的给定标量,μ为大于1的给定标量,τD和Ta均为大于1的阈值标量,J1、J2和J3通过矩阵C的奇异值分解计算出,并且
Figure BDA0002351834720000121
I为单位矩阵。
本发明方法的仿真
用仿真结果说明本设计的有效性。
采用本发明与一般弹性滑模控制效果进行对比;
A、采用现有一般弹性滑模控制仿真;仿真参数为:
Figure BDA0002351834720000122
C=[1.27481.1329]
图2是开环系统状态响应,可以看出,系统的状态轨迹不能收敛到原点,系统不稳定。
DoS攻击的频率和持续时间分别为τD=10和Ta=5。滑模面及各预先定义参数选取为:
G1=[1.2518 0.4731],G2=[1.6669 0.8975],μ=5,
Figure BDA0002351834720000123
根据弹性滑模控制器,得到:
Figure BDA0002351834720000124
K1=[-0.3199-0.3173],K2=[-0.4585-0.3422]
图3-图5为在上述增益下,弹性滑模控制方案的仿真结果,图3和图4分别为状态变量的相应及设计的估算器估计的结果,图5为DoS攻击的频率和周期,可以看出,我们可以发现,尽管在在[0 10]时间段内,DoS攻击可以在一定程度上影响系统的性能,但是所提出的弹性控制策略仍然能够将系统状态稳定至初始值,证明了所提出的弹性控制策略能够在预定义的DoS攻击频率和持续时间下实现控制目标。
B、基于主动防御的弹性滑模控制仿真:
被控系统的模型如(10)所示,仿真参数为:
Figure BDA0002351834720000125
B=[-1.1265 1.3030 0.1287]T,E=[0.1249 0.54550.4826]T,C=[1 1 0]
图6是开环系统状态响应,可以看出,系统的状态轨迹不能收敛到原点,系统不稳定。
针对本系统,本发明设计了两种防御策略
Figure BDA0002351834720000126
Figure BDA0002351834720000127
来保护网络层免受a1和a2的攻击。两种状态下的动作对如表1和表2所示,这两种状态的转移概率如表3所示。通过程序2得到
Figure BDA0002351834720000128
图7为获得
Figure BDA0002351834720000131
Figure BDA0002351834720000132
的迭代过程。
图8和图9为f(θ)和g(θ)策略的演变。从图8和图9中得到最优混合策略:
Figure BDA0002351834720000133
基于上述最优混合策略,利用Matlab中的Yalmip包,可以得到如下增益:
Figure BDA0002351834720000134
Figure BDA0002351834720000135
Figure BDA00023518347200001311
Figure BDA0002351834720000136
Figure BDA0002351834720000137
Figure BDA0002351834720000138
Figure BDA0002351834720000139
Figure BDA00023518347200001310
图10-图12为在上述获得的增益下混合最优防御策略控制下系统的状态相应以及估算器的估计值。可以看出,丢失的数据被估算器有效估计,当DoS攻击发生时,所提出的弹性控制算法能够保持所期望的系统性能。
虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。

Claims (2)

1.信息物理融合系统的主动防御弹性滑模控制方法,其特征在于,该方法利用结合零和博弈理论设计主动防御的弹性滑模控制器,利用主动防御的弹性滑模控制器对信息物理融合系统中拒绝服务攻击进行主动防御,所述主动防御的弹性滑模控制器获取的具体方法为:
步骤一、建立拒绝服务攻击物理过程模型;
步骤二、利用拒绝服务攻击物理过程模型和零和博弈理论,设计在DoS攻击下基于防御策略的估计器;
其中,获取在DoS攻击下基于防御策略的估计器为:
Figure FDA0003761550330000011
其中,
Figure FDA0003761550330000012
为基于防御策略的估计器对k+1时刻系统状态的估计;
Figure FDA0003761550330000013
为k时刻状态变量x(k)的估计,
Figure FDA0003761550330000014
e(k)为估计误差,
Figure FDA0003761550330000015
C为已知的系统输出状态参数矩阵,L为DoS攻击状态下估计器的参数矩阵,L为静默状态下估计器的参数矩阵,Ψ(0,k)为在时间段[0,k]中DoS攻击静默的时间间隔;A为动态系统中已知的状态参数矩阵,B为已知的控制系统控制输入参数矩阵,其中,矩阵B为满秩矩阵;Γ(0,k)为在时间段[0,k]中DoS攻击激活的时间间隔;
步骤三、利用所述基于防御策略的估计器对系统状态进行估计;
步骤四、利用估计的系统状态,获取主动防御的弹性滑模控制器。
2.根据权利要求1所述信息物理融合系统的主动防御弹性滑模控制方法,其特征在于,步骤一所述建立拒绝服务攻击物理过程模型的具体步骤为:
结合对外部干扰的衰减对物理层中的物理过程进行描述:
x(k+1)=Ax(k)+Bu(k)+Eω(k) (1)
其中,E为外部扰动的权重矩阵;ω(k)为外部扰动,假设其属于l2[0,+∞)空间,x(k)为物理层中物理过程模型的k时刻的状态向量,u(k)为物理层中物理过程模型k时刻的控制输入向量,k为时间;DoS攻击的发生率为
Figure FDA0003761550330000016
CN201911418806.1A 2019-12-31 2019-12-31 信息物理融合系统的主动防御弹性滑模控制方法 Active CN111045334B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911418806.1A CN111045334B (zh) 2019-12-31 2019-12-31 信息物理融合系统的主动防御弹性滑模控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911418806.1A CN111045334B (zh) 2019-12-31 2019-12-31 信息物理融合系统的主动防御弹性滑模控制方法

Publications (2)

Publication Number Publication Date
CN111045334A CN111045334A (zh) 2020-04-21
CN111045334B true CN111045334B (zh) 2022-10-25

Family

ID=70243079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911418806.1A Active CN111045334B (zh) 2019-12-31 2019-12-31 信息物理融合系统的主动防御弹性滑模控制方法

Country Status (1)

Country Link
CN (1) CN111045334B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112600814B (zh) * 2020-12-08 2022-06-14 震兑工业智能科技有限公司 一种船舶cps系统欺骗攻击检测方法及系统
CN113094712B (zh) * 2021-05-17 2022-08-26 国网山东省电力公司电力科学研究院 基于自适应滑模控制器的电力信息物理系统攻击防御方法
CN114050939B (zh) * 2021-11-24 2023-01-10 西北工业大学 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统
CN116382097B (zh) * 2023-05-26 2023-08-15 北京科技大学 离散信息物理系统的有限时间类切换滑模容错控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2983054A1 (en) * 2014-08-07 2016-02-10 Goodrich Corporation Optimization of human supervisors and cyber-physical systems
CN107909276A (zh) * 2017-11-20 2018-04-13 广东电网有限责任公司电力调度控制中心 一种电力信息物理融合系统的脆弱性评估方法
CN108985566A (zh) * 2018-06-14 2018-12-11 上海理工大学 电力信息物理融合系统弹性提升策略求解方法
CN110048606A (zh) * 2019-05-23 2019-07-23 哈尔滨工业大学 基于区间二型自适应模糊神经网络的dc-dc升压变换器动态滑模电压控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2983054A1 (en) * 2014-08-07 2016-02-10 Goodrich Corporation Optimization of human supervisors and cyber-physical systems
CN107909276A (zh) * 2017-11-20 2018-04-13 广东电网有限责任公司电力调度控制中心 一种电力信息物理融合系统的脆弱性评估方法
CN108985566A (zh) * 2018-06-14 2018-12-11 上海理工大学 电力信息物理融合系统弹性提升策略求解方法
CN110048606A (zh) * 2019-05-23 2019-07-23 哈尔滨工业大学 基于区间二型自适应模糊神经网络的dc-dc升压变换器动态滑模电压控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于博弈论的信息物理融合系统安全控制;庞岩等;《自动化学报》;20190131;第45卷(第1期);第186-195页 *

Also Published As

Publication number Publication date
CN111045334A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
CN111045334B (zh) 信息物理融合系统的主动防御弹性滑模控制方法
Shen et al. Differential game-based strategies for preventing malware propagation in wireless sensor networks
Fallah A puzzle-based defense strategy against flooding attacks using game theory
Shen et al. Adaptive Markov game theoretic data fusion approach for cyber network defense
Li et al. Improved event-triggered control for networked control systems under stochastic cyber-attacks
Forti et al. Joint attack detection and secure state estimation of cyber‐physical systems
CN115208618B (zh) 基于多层次攻防博弈的新型电力系统apt攻击主动防御方法
CN112003854B (zh) 基于时空博弈的网络安全动态防御决策方法
Liu et al. Active defense strategy selection method based on two-way signaling game
CN115102166A (zh) 一种基于博弈论的有源配电网动态防御性能优化方法
Zhang Impact of defending strategy decision on DDoS attack
Pirani et al. Design of attack-resilient consensus dynamics: A game-theoretic approach
Huang et al. Cross-layer coordinated attacks on cyber-physical systems: A lqg game framework with controlled observations
Ingle et al. A new training scheme for neural network based non-linear channel equalizers in wireless communication system using Cuckoo Search Algorithm
CN113194059B (zh) 移动目标防御策略选择的方法
Jin et al. Evolutionary game decision-making method for network attack and defense based on regret minimization algorithm
CN113132398A (zh) 一种基于q学习的阵列蜜罐系统防御策略预测方法
Li et al. DDoS Defense Method in Software‐Defined Space‐Air‐Ground Network from Dynamic Bayesian Game Perspective
Gutierrez et al. Online learning methods for controlling dynamic cyber deception strategies
CN116232707A (zh) 一种基于深度强化学习的apt攻击防御方法
Dehkordi et al. An effective node-removal method against P2P botnets
CN114501457B (zh) 一种传感边缘云卸载链路的隐形干扰攻击防护方法及系统
CN116248335A (zh) 基于智能演化博弈的网络攻防策略选取方法及系统
Khalil et al. Optimal monitor placement for detection of persistent threats
Xia et al. DDoS Traffic Control Using Transfer Learning DQN With Structure Information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wu Chengwei

Inventor after: Wu Ligang

Inventor after: Liu Jianxing

Inventor after: Gao Yabin

Inventor after: Sun Guanghui

Inventor before: Wu Ligang

Inventor before: Liu Jianxing

Inventor before: Sun Guanghui

Inventor before: Wu Chengwei

Inventor before: Gao Yabin

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant