CN114050939B - 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统 - Google Patents

基于贝叶斯博弈的飞行器信息物理系统设计方法及系统 Download PDF

Info

Publication number
CN114050939B
CN114050939B CN202111408687.9A CN202111408687A CN114050939B CN 114050939 B CN114050939 B CN 114050939B CN 202111408687 A CN202111408687 A CN 202111408687A CN 114050939 B CN114050939 B CN 114050939B
Authority
CN
China
Prior art keywords
channel
aircraft
information
equation
transmitter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111408687.9A
Other languages
English (en)
Other versions
CN114050939A (zh
Inventor
袁欢欢
钟一凡
袁源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202111408687.9A priority Critical patent/CN114050939B/zh
Publication of CN114050939A publication Critical patent/CN114050939A/zh
Application granted granted Critical
Publication of CN114050939B publication Critical patent/CN114050939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1458Denial of Service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于贝叶斯博弈的飞行器信息物理系统设计方法及系统,根据飞行器的飞行状态,构建受到恶意网络攻击的离散非线性系统模型;对离散非线性系统模型进行处理,获取控制系统的上限;依据多信道传输模式,构建随机跳变的多信道传输协议;依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统;对贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。本发明构建基于不完全信息的网络层随机博弈模型,通过最小化目标函数的上界,采用完全平方技术和类黎卡提方程得到目标函数的上限;针对不同信息集,提出静态和动态不完全信息随机对策,获取最优飞行器信息物理系统。

Description

基于贝叶斯博弈的飞行器信息物理系统设计方法及系统
技术领域
本发明属于飞行器控制领域,涉及一种基于贝叶斯博弈的飞行器信息物理系统设计方法及系统。
背景技术
近十年来,由于通信和计算技术的快速发展,飞行器信息物理系统(CPSs)受到了广泛关注。CPS通过结合通信、计算和控制技术,将网络空间和物理世界整合在一起。鉴于CPS广泛应用于包括电网、交通网络、无人驾驶飞机等重要领域,其安全性至关重要,当CPS遭受到外界攻击时,如何保证CPS的安全性成为许多学者研究的热点。CPSs中的基础设施分布广泛,通过无线通信网络连接。由于无线媒体的开放性和广播性,无线网络容易受到干扰攻击。拒绝服务(DoS)干扰攻击已成为远程估计和控制CPS的主要威胁,它可以破坏数据包的实时更新,而无需事先了解任何系统知识,这会中断CPS的正常运行,导致系统性能显著下降,甚至造成财产或生命损失。
针对飞行器信息物理系统,尽管所提出的基于博弈论的方法已经涵盖了DoS攻击CPS的大部分场景,但假设两个玩家都可以获得完整信息是构建和求解博弈的基础。然而,在许多实际应用场景中,一些信息是私有的,非合作参与者无法获取,导致所有参与者的信息不对称甚至不完整,因此现有的信息博弈无法适用于参与者获取信息不完整的情况。
发明内容
本发明的目的在于解决现有技术中的问题,提供一种基于贝叶斯博弈的飞行器信息物理系统设计方法及系统,解决了飞行器在受到恶意攻击时,攻击者和发射者信息不对称的情况时的飞行器控制问题,能够在复杂的干扰下保证飞行器的安全。
为达到上述目的,本发明采用以下技术方案予以实现:
一种基于贝叶斯博弈的飞行器信息物理系统设计方法,包括:
根据飞行器的飞行状态,构建受到恶意网络攻击的飞行器离散非线性系统模型;
对构建的飞行器离散非线性系统模型进行处理,获取控制系统的上限;
依据多信道传输模式,构建随机跳变的多信道传输协议;
依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统;
对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。
本发明的进一步改进在于:
构建受到恶意网络攻击的飞行器离散非线性系统模型,包括:
建立飞行器在垂直面上的连续时间动力学模型如公式(1)所示:
Figure BDA0003373169570000021
其中,x(t)∈R4表示系统状态,包括水平速度、垂直速度、俯仰率和俯仰角,R4表示4维的欧氏空间,控制输入u(t)∈R2由集体循环和纵向循环组成,R2表示2维的欧氏空间,A和B是适用于飞行器在135节空速下的典型装载和飞行条件的系统矩阵;
采样周期设置为T=0.5s,得到的离散非线性系统模型如公式(2)所示:
xk+1=AkxkkBkuk+Dkf(xk,k) (2)
在公式(2)中,xk∈R4是系统状态,uk∈R2是控制输入,f(xk,k)∈R4是非线性扰动,Ak、Bk和Dk是已知系统矩阵,ξk表示满足独立同分布伯努利随机过程的攻击诱导丢包,其中
Figure BDA0003373169570000031
Figure BDA0003373169570000032
其中,Φk和Ψk是已知矩阵;
Figure BDA0003373169570000033
Figure BDA0003373169570000034
是满足
Figure BDA0003373169570000035
的不确定矩阵;扇形界条件适用于公式(2)中的非线性扰动:
(f(xk,k)-Φkxk)T(f(xk,k)-Ψkxk)≤0 (5)。
在获取控制系统的上限之前,还包括:构建控制系统的目标函数;
控制系统的目标函数如公式(6)所示:
Figure BDA0003373169570000036
其中,状态反馈控制器设计如公式(7)所示:
uk=Kkxk (7)
其中,Kk为待设计的控制增益,
Figure BDA0003373169570000037
Q和R是正定矩阵;
控制系统的上限为:基于状态反馈控制器,对目标函数进行处理,获取目标函数的上限;所获取的目标函数的上限为控制系统的上限;
基于状态反馈控制器,对目标函数进行处理,获取目标函数的上限,具体为:
Figure BDA0003373169570000038
针对公式(6),目标函数的上限如公式(9)所示:
Figure BDA0003373169570000041
其中,λmax{·}表示矩阵的最大特征值;
针对公式(9),存在如公式(10)所示的一组控制参数
Figure BDA0003373169570000042
和正定矩阵
Figure BDA0003373169570000043
满足类黎卡提的向后递归方程使目标函数的上限
Figure BDA0003373169570000044
最小化;
Figure BDA0003373169570000045
其中,Pk>0,
Figure BDA0003373169570000046
Figure BDA0003373169570000047
输出反馈增益
Figure BDA0003373169570000048
需要满足公式(11):
Figure BDA0003373169570000049
其中,
Figure BDA00033731695700000410
依据多信道传输模式,构建随机跳变的多信道传输协议,包括:
多信道传输模式为在网络连接的CPS中,所拥有的带宽满足信息传输的要求,存在若干通道用于传输控制输入;其中控制器和执行器之间存在N个具有独立通信环境的通道,独立的通信环境意味着发射者和攻击者的信道增益ηi和ζi是不同的,并且每个信道中存在不同的加性高斯白噪声
Figure BDA00033731695700000411
其中,
Figure BDA00033731695700000412
针对多信道传输模式,构造了一种基于马尔可夫跳变机制的随机通信协议,定义θs(n)和θa(n)分别是发射者和攻击者在步骤n中选择的信道;
发射者从时间步n的信道i到时间步n+1的信道j的转移概率为:
Figure BDA0003373169570000051
攻击者从时间步n的信道i到时间步n+1的信道j的转移概率为:
Figure BDA0003373169570000052
在设计随机协议时,考虑节能和通道的服务质量,发射者和攻击者的转移概率值设置分别如公式(14)和公式(15)所示:
Figure BDA0003373169570000053
Figure BDA0003373169570000054
其中,T(n)和W(n)是发射者和攻击者在时间步n的发射功率,参数αi和βi表示传输系统信息的通道i的服务质量以及受到攻击者干扰的通道i的服务质量;
针对随机传输协议,当发射者选择通道i以功率T(n)传输信息,而攻击者以功率W(n)阻塞通道i时,信号干扰加噪声比(SINR)由公式(16)所示:
Figure BDA0003373169570000055
其中,标量δi是信道i的背景噪声;
如果发射者使用信道i传输信息,而攻击者阻塞信道j,j≠i,则传输系统信息的信噪比(SNR)由公式(17)所示:
Figure BDA0003373169570000061
在时间步n处可能的SINR或SNR以紧凑形式写入,如公式(18)所示:
Figure BDA0003373169570000062
当正交幅度调制(QAM)技术应用于信号传输时,分组错误率(PER)与信号与干扰和噪声比(SINR)或信噪比(SNR)之间的关系如公式(19)所示:
Figure BDA0003373169570000063
Figure BDA0003373169570000064
其中,标量
Figure BDA0003373169570000065
是一个常数。
依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统,具体为:
攻守双方均采用全双工技术,同时发射功率和监控信道;将对手的分组传输信号视为未知的确定性信号,利用能量检测技术估计对方的传输功率;信道选择θs仅为防御者所知,防御者类型为
Figure BDA0003373169570000066
同时,入侵选择θa仅由攻击者所知,并且攻击者的类型为
Figure BDA0003373169570000067
定义Θ={Θsa};引入一种基于不完全信息的贝叶斯博弈来描述控制命令发射者与干扰攻击者之间的相互作用,博弈中考虑了控制系统性能和能量消耗;
定义Bs(n)∈Δ(Θs)是发射者类型Θs的信赖概率分布,类型θs在时间步长n处采用概率Bs(n,θs),定义Ba(n)∈Δ(Θa)是发射者类型Θa的信赖概率分布,类型θa在时间步长n处采用概率Ba(n,θa),其中,Δ(·)是指集合上的概率度量空间;符号bss)是攻击者相信发射者选择信道θs的概率,同时,baa)用于表示发射者相信攻击者干扰信道θa的概率;对于所有通道,信念策略都是bs=[bs(1),bs(2),…,bs(N)]和ba=[ba(1),ba(2),…,ba(N)];具有θs类型和策略对(T,W)的发射者的奖励由公式(21)所示:
Figure BDA0003373169570000071
对于攻击者,具有θa类型和策略对(T,W)的发射者的奖励由公式(22)所示:
Figure BDA0003373169570000072
对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统,具体为:对开环信息集和闭环信息集分别采用静态贝叶斯博弈和动态贝叶斯博弈进行处理;
在不同的信息结构下,定义H为信息集,开环信息集为Hopen(n)={b(0),n},B(n)=b(0),其中,B={Bs,Ba},b={bs,ba};闭环信息集为Hclosed(n)={b(0),T(1),W(1),…,T(n),W(n)};
当信息集为开环信息集时,考虑攻防双方分别具有两个策略的静态博弈问题,混合贝叶斯-纳什均衡策略是唯一的,并求解为((qs,1-qs),(qa,1-qa)),其中
Figure BDA0003373169570000073
Figure BDA0003373169570000074
Figure BDA0003373169570000075
同理,
Figure BDA0003373169570000081
Figure BDA0003373169570000082
Figure BDA0003373169570000083
当信息集为闭环信息集时,使用Q-学习方法对动态博弈问题求解;
步骤1:令迭代次数为n=0,初始状态为b(0),并初始化T(0),W(0),设定选择概率pexp,给出
Figure BDA00033731695700000812
的初始化值;
步骤2:在概率pexp下,使用均匀随机动作均匀随机;在概率1-pexp下,根据
Figure BDA0003373169570000084
选择T(n),W(n),
Figure BDA0003373169570000085
是两个参与者的混合纳什均衡解;
步骤3:更新
Figure BDA00033731695700000813
根据:
Figure BDA0003373169570000086
其中,
Figure BDA0003373169570000087
Figure BDA0003373169570000088
同时获得混合策略
Figure BDA0003373169570000089
步骤4:利用观测值T(n)或者W(n),根据修正和预测的方法,计算下一个信念状态;
修正:在第n阶段,根据观察到的发射者能量传输策略T(n),攻击者使用贝叶斯规则更正其先验信念Bs(n),发射者使用贝叶斯规则更正其先验信念Ba(n);后验信度
Figure BDA00033731695700000810
Figure BDA00033731695700000811
分别由如公式(32)和公式(33)所示:
Figure BDA0003373169570000091
Figure BDA0003373169570000092
预测:攻击者根据修正后的信念
Figure BDA0003373169570000093
和联合行动(T(n),W(n))预测下一步的先验信念Bs(n+1),发射者将根据修正后的信念
Figure BDA0003373169570000094
和联合行动(T(n),W(n))预测下一步的先验信念Ba(n+1),方法公式(34)和公式(35)所示:
Figure BDA0003373169570000095
Figure BDA0003373169570000096
步骤5:计算
Figure BDA0003373169570000097
检查是否小于10-5,如果小于则迭代停止,输出混合策略
Figure BDA0003373169570000098
否则,令n=n+1,转到步骤2,继续迭代,直到计算的结果小于10-5
通过静态和动态贝叶斯博弈最优的结果,得到在不完全信息下的贝叶斯博弈最优飞行器信息物理系统。
一种基于贝叶斯博弈的飞行器信息物理系统设计系统,包括:
第一构建模块,所示第一构建模块用于根据飞行器的飞行状态,构建受到恶意网络攻击的飞行器离散非线性系统模型;
模型处理模块,所示模型处理模块用于对构建的飞行器离散非线性系统模型进行处理,获取控制系统的上限;
第二构建模块,所示第二构建模块用于依据多信道传输模式,构建随机跳变的多信道传输协议;
第三构建模块,所示第三构建模块用于依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统;
贝叶斯博弈系统处理模块,所示贝叶斯博弈系统处理模块用于对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。
一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明基于现有的信息博弈无法解决参与者获取信息不完整的情况,本发明提出了一种多信道框架,其中两个参与者均采用随机传输协议,基于物理层的系统性能,构建了基于不完全信息的贝叶斯随机博弈模型;在攻击和非线性的影响下,通过最小化目标函数的上界,采用完全平方技术和类黎卡提方程,得到了目标函数的上限;本发明针对不同的信息集,提出了静态和动态不完全信息随机对策,并通过数学和Q-学习方法探索解决方案,便于工程实现。
附图说明
为了更清楚的说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例的基于贝叶斯博弈的飞行器信息物理系统设计方法的流程图;
图2为本发明实施例的基于贝叶斯博弈的飞行器信息物理系统设计方法的另一种流程图;
图3为采用本发明方法的仿真结果图;
图4为本发明的实施例的基于贝叶斯博弈的飞行器信息物理系统设计系统的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明实施例的描述中,需要说明的是,若出现术语“上”、“下”、“水平”、“内”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
此外,若出现术语“水平”,并不表示要求部件绝对水平,而是可以稍微倾斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构一定要完全水平,而是可以稍微倾斜。
在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面结合附图对本发明做进一步详细描述:
参见图1和图2,本发明实施例公布了一种基于贝叶斯博弈的飞行器信息物理系统设计方法,包括:
S101,根据飞行器的飞行状态,构建受到恶意网络攻击的飞行器离散非线性系统模型。
建立飞行器在垂直面上的连续时间动力学模型如公式(1)所示:
Figure BDA0003373169570000131
其中,x(t)∈R4表示系统状态,包括水平速度、垂直速度、俯仰率和俯仰角,R4表示4维的欧氏空间,控制输入u(t)∈R2由集体循环和纵向循环组成,R2表示2维的欧氏空间,A和B是适用于飞行器在135节空速下的典型装载和飞行条件的系统矩阵;
采样周期设置为T=0.5s,得到的离散非线性系统模型如公式(2)所示:
xk+1=AkxkkBkuk+Dkf(xk,k) (2)
在公式(2)中,xk∈R4是系统状态,uk∈R2是控制输入,f(xk,k)∈R4是非线性扰动,Ak、Bk和Dk是已知系统矩阵,ξk表示满足独立同分布伯努利随机过程的攻击诱导丢包,其中
Figure BDA0003373169570000132
Figure BDA0003373169570000133
其中,Φk和Ψk是已知矩阵;
Figure BDA0003373169570000134
Figure BDA0003373169570000135
是满足
Figure BDA0003373169570000136
的不确定矩阵;扇形界条件适用于公式(2)中的非线性扰动:
(f(xk,k)-Φkxk)T(f(xk,k)-Ψkxk)≤0。 (5)
S102,对构建的飞行器离散非线性系统模型进行处理,获取控制系统的上限。
在获取控制系统的上限之前,还包括:构建控制系统的目标函数;
控制系统的目标是在有限时间N0内,在控制力、瞬态以及终端性能之间获得一个折中的控制性能。
控制系统的目标函数如公式(6)所示:
Figure BDA0003373169570000137
其中,状态反馈控制器设计如公式(7)所示:
uk=Kkxk (7)
其中,Kk为待设计的控制增益,
Figure BDA0003373169570000141
Q和R是正定矩阵;
由于存在非线性干扰和攻击导致的数据包丢失的情况,不可能获得精确的控制性能以及最佳控制策略,另一种解决方案是找到目标函数的上限。
控制系统的上限为:基于状态反馈控制器,对目标函数进行处理,获取目标函数的上限;所获取的目标函数的上限为控制系统的上限;
基于状态反馈控制器,对目标函数进行处理,获取目标函数的上限,具体为:
Figure BDA0003373169570000142
针对公式(6),目标函数的上限如公式(9)所示:
Figure BDA0003373169570000143
其中,λmax{·}表示矩阵的最大特征值;
针对公式(9),存在如公式(10)所示的一组控制参数
Figure BDA0003373169570000144
和正定矩阵
Figure BDA0003373169570000145
满足类黎卡提的向后递归方程使目标函数的上限
Figure BDA0003373169570000146
最小化:
Figure BDA0003373169570000147
其中,Pk>0,
Figure BDA0003373169570000151
Figure BDA0003373169570000152
输出反馈增益
Figure BDA0003373169570000153
需要满足公式(11):
Figure BDA0003373169570000154
其中,
Figure BDA0003373169570000155
S103,依据多信道传输模式,构建随机跳变的多信道传输协议。
无线通信网络用于连接CPS的不同组件。网络中存在干扰攻击者,可发出干扰信号,阻止有用信息的传输。在网络连接的CPS中,所拥有的带宽满足信息传输的要求,也就是说,可以存在若干通道用于传输控制输入。其中控制器和执行器之间存在N个具有独立通信环境的通道,独立的通信环境意味着发射者和攻击者的信道增益ηi和ζi是不同的,并且每个信道中存在不同的加性高斯白噪声
Figure BDA0003373169570000156
其中,
Figure BDA0003373169570000157
针对上述多信道传输模式,构造了一种基于马尔可夫跳变机制的随机通信协议,供决策者选择传输系统信号的信道,随机信道策略可以降低传输信道被检测和干扰的概率,攻击者为了不被系统检测到而随机干扰信道也是如此。定义θs(n)和θa(n)分别是发射者和攻击者在步骤n中选择的信道。
发射者从时间步n的信道i到时间步n+1的信道j的转移概率为:
Figure BDA0003373169570000158
攻击者从时间步n的信道i到时间步n+1的信道j的转移概率为:
Figure BDA0003373169570000159
在设计随机协议时,考虑节能和通道的服务质量,发射者和攻击者的转移概率值设置分别如公式(14)和公式(15)所示:
Figure BDA0003373169570000161
Figure BDA0003373169570000162
其中,T(n)和W(n)是发射者和攻击者在时间步n的发射功率,参数αi和βi表示传输系统信息的通道i的服务质量以及受到攻击者干扰的通道i的服务质量;
针对随机传输协议,当发射者选择通道i以功率T(n)传输信息,而攻击者以功率W(n)阻塞通道i时,信号干扰加噪声比(SINR)由公式(16)所示:
Figure BDA0003373169570000163
其中,标量δi是信道i的背景噪声;
如果发射者使用信道i传输信息,而攻击者阻塞信道j,j≠i,则传输系统信息的信噪比(SNR)由公式(17)所示:
Figure BDA0003373169570000164
在时间步n处可能的SINR或SNR以紧凑形式写入,如公式(18)所示:
Figure BDA0003373169570000165
当正交幅度调制(QAM)技术应用于信号传输时,分组错误率(PER)与信号与干扰和噪声比(SINR)或信噪比(SNR)之间的关系如公式(19)所示:
Figure BDA0003373169570000171
Figure BDA0003373169570000172
其中,标量
Figure BDA0003373169570000173
是一个常数;因此,将S101中给出的分组传输概率表示为
Figure BDA0003373169570000174
S104,依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统。
攻守双方均采用全双工技术,同时发射功率和监控信道;将对手的分组传输信号视为未知的确定性信号,同时利用能量检测技术估计对方的传输功率;因此,信道选择θs仅为防御者所知,防御者类型为
Figure BDA0003373169570000175
同时,入侵选择θa仅由攻击者所知,并且攻击者的类型为
Figure BDA0003373169570000176
定义Θ={Θsa};由此引入一种基于不完全信息的贝叶斯博弈来描述控制命令发射者与干扰攻击者之间的相互作用,博弈中考虑了控制系统性能和能量消耗;
定义Bs(n)∈Δ(Θs)是发射者类型Θs的信赖概率分布,类型θs在时间步长n处采用概率Bs(n,θs),定义Ba(n)∈Δ(Θa)是发射者类型Θa的信赖概率分布,类型θa在时间步长n处采用概率Ba(n,θa),其中,Δ(·)是指集合上的概率度量空间;符号bss)是攻击者相信发射者选择信道θs的概率,同时,baa)用于表示发射者相信攻击者干扰信道θa的概率;因此,对于所有通道,信念策略都是bs=[bs(1),bs(2),…,bs(N)]和ba=[ba(1),ba(2),…,ba(N)];具有θs类型和策略对(T,W)的发射者的奖励由公式(21)所示:
Figure BDA0003373169570000177
对于攻击者,具有θa类型和策略对(T,W)的发射者的奖励由公式(22)所示:
Figure BDA0003373169570000181
S105,对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。
对开环信息集和闭环信息集分别采用静态贝叶斯博弈和动态贝叶斯博弈进行处理;在不同的信息结构下,定义H为信息集,开环信息集为Hopen(n)={b(0),n},B(n)=b(0),其中,B={Bs,Ba},b={bs,ba};闭环信息集为Hclosed(n)={b(0),T(1),W(1),…,T(n),W(n)};
当信息集为开环信息集时,考虑攻防双方分别具有两个策略的静态博弈问题,混合贝叶斯-纳什均衡策略是唯一的,并求解为((qs,1-qs),(qa,1-qa)),其中
Figure BDA0003373169570000182
Figure BDA0003373169570000183
Figure BDA0003373169570000184
同理,
Figure BDA0003373169570000185
Figure BDA0003373169570000186
Figure BDA0003373169570000187
当信息集为闭环信息集时,使用Q-学习方法对动态博弈问题求解;
步骤1:令迭代次数为n=0,初始状态为b(0),并初始化T(0),W(0),设定选择概率pexp,给出
Figure BDA0003373169570000191
的初始化值;
步骤2:在概率pexp下,使用均匀随机动作均匀随机;在概率1-pexp下,根据
Figure BDA0003373169570000192
选择T(n),W(n),
Figure BDA0003373169570000193
是两个参与者的混合纳什均衡解;
步骤3:更新
Figure BDA0003373169570000194
根据:
Figure BDA0003373169570000195
其中,
Figure BDA0003373169570000196
Figure BDA0003373169570000197
同时获得混合策略
Figure BDA0003373169570000198
步骤4:利用观测值T(n)或者W(n),根据修正和预测的方法,计算下一个信念状态;
修正:在第n阶段,根据观察到的发射者能量传输策略T(n),攻击者使用贝叶斯规则更正其先验信念Bs(n),发射者使用贝叶斯规则更正其先验信念Ba(n);后验信度
Figure BDA0003373169570000199
Figure BDA00033731695700001910
分别由如公式(32)和公式(33)所示:
Figure BDA00033731695700001911
Figure BDA0003373169570000201
预测:攻击者根据修正后的信念
Figure BDA0003373169570000202
和联合行动(T(n),W(n))预测下一步的先验信念Bs(n+1),发射者将根据修正后的信念
Figure BDA0003373169570000203
和联合行动(T(n),W(n))预测下一步的先验信念Ba(n+1),方法公式(34)和公式(35)所示:
Figure BDA0003373169570000204
Figure BDA0003373169570000205
其中,
Figure BDA0003373169570000206
和转移概率
Figure BDA0003373169570000207
在步骤S103中给出。
步骤5:计算
Figure BDA0003373169570000208
检查是否小于10-5,如果小于则迭代停止,输出混合策略
Figure BDA0003373169570000209
否则,令n=n+1,转到步骤2,继续迭代,直到计算的结果小于10-5
通过静态和动态贝叶斯博弈最优的结果,得到在不完全信息下的贝叶斯博弈最优飞行器信息物理系统。
参见图3,图3为本发明方法的仿真结果图;
对于闭环信息集,不同参与者在前1000步的收益值的演化如图3所示,为表示清晰,x轴不同参与者的步数,y轴为
Figure BDA00033731695700002010
由图3可知,通过采用Q-学习方法生效并可以获得最优的Q值。当进行10000次迭代时,最终收敛值为
Figure BDA00033731695700002011
以及
Figure BDA00033731695700002012
参见图4,本发明公布了一种基于贝叶斯博弈的飞行器信息物理系统设计系统,包括:
第一构建模块,所示第一构建模块用于根据飞行器的飞行状态,构建受到恶意网络攻击的飞行器离散非线性系统模型;
模型处理模块,所示模型处理模块用于对构建的飞行器离散非线性系统模型进行处理,获取控制系统上限;
第二构建模块,所示第二构建模块用于依据多信道传输模式,构建随机跳变的多信道传输协议;
第三构建模块,所示第三构建模块用于依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统;
贝叶斯博弈系统处理模块,所示贝叶斯博弈系统处理模块用于对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。
本发明一实施例提供的终端设备。该实施例的终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能。
所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。
所述处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端设备的各种功能。
所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于贝叶斯博弈的飞行器信息物理系统设计方法,其特征在于,包括:
根据飞行器的飞行状态,构建受到恶意网络攻击的飞行器离散非线性系统模型;
对构建的飞行器离散非线性系统模型进行处理,获取控制系统的上限;
依据多信道传输模式,构建随机跳变的多信道传输协议;
依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统;
对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。
2.根据权利要求1所述的基于贝叶斯博弈的飞行器信息物理系统设计方法,其特征在于,所述构建受到恶意网络攻击的飞行器离散非线性系统模型,包括:
建立飞行器在垂直面上的连续时间动力学模型如公式(1)所示:
Figure FDA0003373169560000011
其中,x(t)∈R4表示系统状态,包括水平速度、垂直速度、俯仰率和俯仰角,R4表示4维的欧氏空间,控制输入u(t)∈R2由集体循环和纵向循环组成,R2表示2维的欧氏空间,A和B是适用于飞行器在135节空速下的典型装载和飞行条件的系统矩阵;
采样周期设置为T=0.5s,得到的离散非线性系统模型如公式(2)所示:
xk+1=AkxkkBkuk+Dkf(xk,k) (2)
在公式(2)中,xk∈R4是系统状态,uk∈R2是控制输入,f(xk,k)∈R4是非线性扰动,Ak、Bk和Dk是已知系统矩阵,ξk表示满足独立同分布伯努利随机过程的攻击诱导丢包,其中
Figure FDA0003373169560000021
Figure FDA0003373169560000022
其中,Φk和Ψk是已知矩阵;
Figure FDA0003373169560000023
Figure FDA0003373169560000024
是满足
Figure FDA0003373169560000025
的不确定矩阵;扇形界条件适用于公式(2)中的非线性扰动:
(f(xk,k)-Φkxk)T(f(xk,k)-Ψkxk)≤0 (5)。
3.根据权利要求1所述的基于贝叶斯博弈的飞行器信息物理系统设计方法,其特征在于,所述在获取控制系统的上限之前,还包括:构建控制系统的目标函数;
所述控制系统的目标函数如公式(6)所示:
Figure FDA0003373169560000026
其中,状态反馈控制器设计如公式(7)所示:
uk=Kkxk (7)
其中,Kk为待设计的控制增益,QN0、Q和R是正定矩阵;
所述控制系统的上限为:基于状态反馈控制器,对目标函数进行处理,获取目标函数的上限;所获取的目标函数的上限为控制系统的上限;
所述基于状态反馈控制器,对目标函数进行处理,获取目标函数的上限,具体为:
Figure FDA0003373169560000027
针对公式(6),目标函数的上限如公式(9)所示:
Figure FDA0003373169560000031
其中,λmax{·}表示矩阵的最大特征值;
针对公式(9),存在如公式(10)所示的一组控制参数
Figure FDA0003373169560000032
和正定矩阵
Figure FDA0003373169560000033
满足类黎卡提的向后递归方程使目标函数的上限
Figure FDA0003373169560000034
最小化;
Figure FDA0003373169560000035
其中,
Figure FDA0003373169560000036
Figure FDA0003373169560000037
输出反馈增益
Figure FDA0003373169560000038
需要满足公式(11):
Figure FDA0003373169560000039
其中,
Figure FDA00033731695600000310
4.根据权利要求1所述的基于贝叶斯博弈的飞行器信息物理系统设计方法,其特征在于,所述依据多信道传输模式,构建随机跳变的多信道传输协议,包括:
多信道传输模式为在网络连接的CPS中,所拥有的带宽满足信息传输的要求,存在若干通道用于传输控制输入;其中控制器和执行器之间存在N个具有独立通信环境的通道,独立的通信环境意味着发射者和攻击者的信道增益ηi和ζi是不同的,并且每个信道中存在不同的加性高斯白噪声
Figure FDA00033731695600000311
其中,
Figure FDA00033731695600000312
针对多信道传输模式,构造了一种基于马尔可夫跳变机制的随机通信协议,定义θs(n)和θa(n)分别是发射者和攻击者在步骤n中选择的信道;
发射者从时间步n的信道i到时间步n+1的信道j的转移概率为:
Figure FDA0003373169560000041
攻击者从时间步n的信道i到时间步n+1的信道j的转移概率为:
Figure FDA0003373169560000042
在设计随机协议时,考虑节能和通道的服务质量,发射者和攻击者的转移概率值设置分别如公式(14)和公式(15)所示:
Figure FDA0003373169560000043
Figure FDA0003373169560000044
其中,T(n)和W(n)是发射者和攻击者在时间步n的发射功率,参数αi和βi表示传输系统信息的通道i的服务质量以及受到攻击者干扰的通道i的服务质量;
针对随机传输协议,当发射者选择通道i以功率T(n)传输信息,而攻击者以功率W(n)阻塞通道i时,信号干扰加噪声比(SINR)由公式(16)所示:
Figure FDA0003373169560000045
其中,标量δi是信道i的背景噪声;
如果发射者使用信道i传输信息,而攻击者阻塞信道j,j≠i,则传输系统信息的信噪比(SNR)由公式(17)所示:
Figure FDA0003373169560000051
在时间步n处可能的SINR或SNR以紧凑形式写入,如公式(18)所示:
Figure FDA0003373169560000052
当正交幅度调制(QAM)技术应用于信号传输时,分组错误率(PER)与信号与干扰和噪声比(SINR)或信噪比(SNR)之间的关系如公式(19)所示:
Figure FDA0003373169560000053
Figure FDA0003373169560000054
其中,标量
Figure FDA0003373169560000055
是一个常数。
5.根据权利要求1所述的基于贝叶斯博弈的飞行器信息物理系统设计方法,其特征在于,所述依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统,具体为:
攻守双方均采用全双工技术,同时发射功率和监控信道;将对手的分组传输信号视为未知的确定性信号,利用能量检测技术估计对方的传输功率;信道选择θs仅为防御者所知,防御者类型为
Figure FDA0003373169560000056
同时,入侵选择θa仅由攻击者所知,并且攻击者的类型为
Figure FDA0003373169560000057
定义Θ={Θsa};引入一种基于不完全信息的贝叶斯博弈来描述控制命令发射者与干扰攻击者之间的相互作用,博弈中考虑了控制系统性能和能量消耗;
定义Bs(n)∈Δ(Θs)是发射者类型Θs的信赖概率分布,类型θs在时间步长n处采用概率Bs(n,θs),定义Ba(n)∈Δ(Θa)是发射者类型Θa的信赖概率分布,类型θa在时间步长n处采用概率Ba(n,θa),其中,Δ(·)是指集合上的概率度量空间;符号bss)是攻击者相信发射者选择信道θs的概率,同时,baa)用于表示发射者相信攻击者干扰信道θa的概率;对于所有通道,信念策略都是bs=[bs(1),bs(2),…,bs(N)]和ba=[ba(1),ba(2),…,ba(N)];具有θs类型和策略对(T,W)的发射者的奖励由公式(21)所示:
Figure FDA0003373169560000061
对于攻击者,具有θa类型和策略对(T,W)的发射者的奖励由公式(22)所示:
Figure FDA0003373169560000062
6.根据权利要求1所述的基于贝叶斯博弈的飞行器信息物理系统设计方法,其特征在于,所述对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统,具体为:对开环信息集和闭环信息集分别采用静态贝叶斯博弈和动态贝叶斯博弈进行处理;
在不同的信息结构下,定义H为信息集,开环信息集为Hopen(n)={b(0),n},B(n)=b(0),其中,B={Bs,Ba},b={bs,ba};闭环信息集为Hclosed(n)={b(0),T(1),W(1),…,T(n),W(n)};
当信息集为开环信息集时,考虑攻防双方分别具有两个策略的静态博弈问题,混合贝叶斯-纳什均衡策略是唯一的,并求解为((qs,1-qs),(qa,1-qa)),其中
Figure FDA0003373169560000063
Figure FDA0003373169560000064
Figure FDA0003373169560000071
同理,
Figure FDA0003373169560000072
Figure FDA0003373169560000073
Figure FDA0003373169560000074
当信息集为闭环信息集时,使用Q-学习方法对动态博弈问题求解;
步骤1:令迭代次数为n=0,初始状态为b(0),并初始化T(0),W(0),设定选择概率pexp,给出
Figure FDA0003373169560000075
的初始化值;
步骤2:在概率pexp下,使用均匀随机动作均匀随机;在概率1-pexp下,根据
Figure FDA0003373169560000076
选择T(n),W(n),
Figure FDA0003373169560000077
是两个参与者的混合纳什均衡解;
步骤3:更新
Figure FDA0003373169560000078
根据:
Figure FDA0003373169560000079
其中,
Figure FDA00033731695600000710
Figure FDA00033731695600000711
同时获得混合策略
Figure FDA00033731695600000712
步骤4:利用观测值T(n)或者W(n),根据修正和预测的方法,计算下一个信念状态;
修正:在第n阶段,根据观察到的发射者能量传输策略T(n),攻击者使用贝叶斯规则更正其先验信念Bs(n),发射者使用贝叶斯规则更正其先验信念Ba(n);后验信度
Figure FDA0003373169560000081
Figure FDA0003373169560000082
分别由如公式(32)和公式(33)所示:
Figure FDA0003373169560000083
Figure FDA0003373169560000084
预测:攻击者根据修正后的信念
Figure FDA0003373169560000085
和联合行动(T(n),W(n))预测下一步的先验信念Bs(n+1),发射者将根据修正后的信念
Figure FDA0003373169560000086
和联合行动(T(n),W(n))预测下一步的先验信念Ba(n+1),方法公式(34)和公式(35)所示:
Figure FDA0003373169560000087
Figure FDA0003373169560000088
步骤5:计算
Figure FDA0003373169560000089
检查是否小于10-5,如果小于则迭代停止,输出混合策略
Figure FDA00033731695600000810
否则,令n=n+1,转到步骤2,继续迭代,直到计算的结果小于10-5
通过静态和动态贝叶斯博弈最优的结果,得到在不完全信息下的贝叶斯博弈最优飞行器信息物理系统。
7.一种基于贝叶斯博弈的飞行器信息物理系统设计系统,其特征在于,包括:
第一构建模块,所示第一构建模块用于根据飞行器的飞行状态,构建受到恶意网络攻击的飞行器离散非线性系统模型;
模型处理模块,所示模型处理模块用于对构建的飞行器离散非线性系统模型进行处理,获取控制系统的上限;
第二构建模块,所示第二构建模块用于依据多信道传输模式,构建随机跳变的多信道传输协议;
第三构建模块,所示第三构建模块用于依据控制系统的上限和多信道传输协议,构建基于不完全信息的贝叶斯博弈系统;
贝叶斯博弈系统处理模块,所示贝叶斯博弈系统处理模块用于对所构建的贝叶斯博弈系统进行处理,获取静态和动态贝叶斯博弈最优的结果,构建最优飞行器信息物理系统。
8.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任一项所述方法的步骤。
CN202111408687.9A 2021-11-24 2021-11-24 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统 Active CN114050939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111408687.9A CN114050939B (zh) 2021-11-24 2021-11-24 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111408687.9A CN114050939B (zh) 2021-11-24 2021-11-24 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统

Publications (2)

Publication Number Publication Date
CN114050939A CN114050939A (zh) 2022-02-15
CN114050939B true CN114050939B (zh) 2023-01-10

Family

ID=80211565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111408687.9A Active CN114050939B (zh) 2021-11-24 2021-11-24 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统

Country Status (1)

Country Link
CN (1) CN114050939B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112141164A (zh) * 2020-09-15 2020-12-29 北京交通大学 一种基于贝叶斯博弈的列车自主防护方法和系统
CN112243281A (zh) * 2020-10-15 2021-01-19 广州大学 基于可充电无线传感器网络的贝叶斯博弈路由设计方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111045334B (zh) * 2019-12-31 2022-10-25 哈尔滨工业大学 信息物理融合系统的主动防御弹性滑模控制方法
US11425163B2 (en) * 2020-02-05 2022-08-23 King Fahd University Of Petroleum And Minerals Control of cyber physical systems subject to cyber and physical attacks
CN111563330B (zh) * 2020-05-07 2023-08-04 东北大学 一种基于零和博弈对策的信息物理系统安全优化分析方法
CN112819300B (zh) * 2021-01-21 2024-04-30 南京邮电大学 网络攻击下基于随机博弈网的配电网风险评估方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112141164A (zh) * 2020-09-15 2020-12-29 北京交通大学 一种基于贝叶斯博弈的列车自主防护方法和系统
CN112243281A (zh) * 2020-10-15 2021-01-19 广州大学 基于可充电无线传感器网络的贝叶斯博弈路由设计方法

Also Published As

Publication number Publication date
CN114050939A (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
Huang et al. Reinforcement learning for feedback-enabled cyber resilience
Pawlick et al. iSTRICT: An interdependent strategic trust mechanism for the cloud-enabled internet of controlled things
Yuan et al. Resilient strategy design for cyber-physical system under DoS attack over a multi-channel framework
Wu et al. Zero-sum game-based optimal secure control under actuator attacks
CN111045334B (zh) 信息物理融合系统的主动防御弹性滑模控制方法
CN112003854B (zh) 基于时空博弈的网络安全动态防御决策方法
CN111563330A (zh) 一种基于零和博弈对策的信息物理系统安全优化分析方法
Zhao et al. Optimal joint control and triggering strategies against denial of service attacks: A zero‐sum game
Liu et al. Active defense strategy selection method based on two-way signaling game
Zhou et al. Toward proactive and efficient DDoS mitigation in IIoT systems: A moving target defense approach
CN115913704A (zh) 一种抵御欺骗攻击的智能无人集群系统时滞脉冲控制方法
Guo et al. Identification of FIR systems with binary-valued observations against denial-of-service attacks
CN114050939B (zh) 基于贝叶斯博弈的飞行器信息物理系统设计方法及系统
Wang et al. Optimal DoS attack strategy for cyber-physical systems: A Stackelberg game-theoretical approach
Liu et al. Optimal DoS attack scheduling for multi-sensor remote state estimation over interference channels
Jithish et al. A game‐theoretic approach for ensuring trustworthiness in cyber‐physical systems with applications to multiloop UAV control
Azmat et al. Bio‐inspired collaborative spectrum sensing and allocation for cognitive radios
CN115840363B (zh) 一种针对信息物理系统远程状态估计的拒绝服务攻击方法
CN116232707A (zh) 一种基于深度强化学习的apt攻击防御方法
Shi et al. Flocking control for Cucker–Smale model under denial‐of‐service attacks
Al-Khafaji et al. ML/AI Empowered 5G and beyond Networks
Zhu et al. Networked cyber-physical systems: Interdependence, resilience and information exchange
Wang et al. A learning-based honeypot game for collaborative defense in uav networks
Yang et al. Bipartite containment of heterogeneous multi‐agent systems under denial‐of‐service attacks: A historical information‐based control scheme
CN112327632A (zh) 一种虚假数据注入攻击的多智能体系统跟踪控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant