CN113987512A

CN113987512A - 一种信息系统安全风险评估方法

Info

Publication number: CN113987512A
Application number: CN202111269641.3A
Authority: CN
Inventors: 周晏平; 尹俊; 华国忠
Original assignee: Jiangsu Antai Information Technology Development Co ltd
Current assignee: Jiangsu Antai Information Technology Development Co ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2022-01-28
Anticipated expiration: 2041-10-29
Also published as: CN113987512B

Abstract

本发明涉及一种信息安全技术领域，公开了一种信息系统安全风险评估方法，包括：构建动态安全博弈模型；基于动态安全博弈模型，求解得到最优攻击策略；依据最优攻击策略以及信息系统状态作为输入，将信息系统安全风险级别作为输出，构建神经网络模型进行训练，得到最优模型参数；利用动态安全博弈模型生成信息系统的最优攻击策略，将最优攻击策略以及信息系统状态作为神经网络模型输入，神经网络模型输出得到的值为信息系统安全级别。本发明通过构建动态安全博弈模型，实现动态攻防环境下的信息安全博弈，并利用动态安全博弈模型生成信息系统的最优攻击策略，利用神经网络模型实时生成信息系统安全级别，实现信息系统安全风险的实时评估。

Description

一种信息系统安全风险评估方法

技术领域

本发明涉及信息安全的技术领域，尤其涉及一种信息系统安全风险评估方法。

背景技术

随着信息化进程的不断发展，信息管理系统与现代信息技术融合越来越深入，传统信息管理系统与互联网的界限逐渐被打破，并逐渐摆脱传统的封闭性转型为互联性的系统。因此网络攻击的存在不仅局限于网络信息安全领域，也逐渐蔓延到信息管理系统领域。各种行业信息面临被窃取、篡改、删除等危险，严重的信息管理系统攻击事故时有发生。

由于信息系统中攻击者和防御者之间信息的不确定性，传统完全信息静态博弈模型不能满足信息系统中更复杂的安全风险评估场景。

鉴于此，如何实现信息系统安全风险的实时评估，成为本领域技术人员亟待解决的问题。

发明内容

本发明提供一种信息系统安全风险评估方法，目的在于(1)实现动态攻防环境下的信息安全博弈；(2)实现信息系统安全风险的实时评估。

实现上述目的，本发明提供的一种信息系统安全风险评估方法，包括以下步骤：

S1：构建动态安全博弈模型；

S2：基于动态安全博弈模型，求解得到最优攻击策略；

S3：依据最优攻击策略以及信息系统状态作为输入，将信息系统安全风险级别作为输出，构建神经网络模型进行训练，得到最优模型参数；

S4：将最优模型参数作为神经网络模型参数，利用动态安全博弈模型生成信息系统的最优攻击策略，将最优攻击策略以及信息系统状态作为神经网络模型输入，神经网络模型输出得到的值为信息系统安全级别，即为信息系统风险评估结果。

作为本发明的进一步改进方法：

所述S1步骤中构建信息系统的动态安全博弈模型，包括：

建立信息系统环境下的动态安全博弈模型(S,A,P,ε,V)；

S表示信息系统中的状态集合，每种状态即为网络节点在信息系统中可能存在的状态，所述状态为信息系统中网络实体的特权状态，分为无任何特权、远程访问特权、本地用户特权以及根特权；

A表示信息系统中攻击者和防御者的动作集合，攻击者动作为信息系统网络中存在的弱点信息，防御者动作为预设定的防御策略集合中的防御动作策略；

P表示状态转移概率，P(s,a,s′)∈[0,1]，表示攻击者和防御者在当前网络节点状态s中执行动作a，到达下一个网络节点状态s′的概率，其中s,s′∈S，a∈A；所述状态转移为信息系统上网络节点的特权状态变化，状态转移公式为：

P(s_t+1＝s′|s_t,a_t,s_t-1,a_t-1,…,s₀,a₀)＝P(s_t+1＝s′|s_t,a_t)

其中：

s_t+1表示在t+1时刻的网络节点特权状态；

a_t表示在t时刻攻击者和防御者执行动作a_t；

P(s_t+1＝s′|s_t,a_t)表示在t时刻攻击者和防御者执行动作a_t，网络节点特权状态转换为s′的状态转移概率；

ε∈[0,1]为防御策略因子，ε越接近1，则表示防御者在选择防御动作时更关注长期回报；

V(s,a,s′)表示攻击者和防御者在当前网络节点状态s中执行动作a，到达下一个网络节点状态s′的信息系统回报值，将信息系统中易被攻击的网络节点设置为较大的系统回报值；所述系统回报值的设定是基于网络节点的基本分数和环境分数，基本分数为供应商给出的网络节点漏洞得分，环境得分表示用户队网络节点的评价得分，分数越高表示网络节点越容易遭受攻击，则网络节点的系统回报值越大。

所述S2步骤中基于动态安全博弈模型确定信息系统中的攻击策略函数，包括：

将动态安全博弈模型中防御者的动作空间设置为A^def，攻击者的动作空间设置为A^att，则当防御者选择防御动作d∈A^def，攻击者选择攻击动作g∈A^att时，将攻击者的最大回报值收益作为攻击策略函数，所述攻击策略函数为：

其中：

(d,g)为攻击-防御动作对；

V[s,(d,g),s′]表示执行攻击-防御动作对(d,g)后，信息系统网络节点特权状态由s转换为s′的回报值；

R(d)表示执行防御动作d时，攻击者的最大回报值收益；

π[s,(d,g)]表示信息系统网络节点在特权状态为s时执行攻击-防御动作对(d,g)；

K^π(s′)表示特权状态为s′的值函数。

所述S2步骤中将攻击策略函数扩展到信息系统中的n个网络节点，包括：

建立信息系统中n个网络节点的攻击策略函数：

其中：

R_i(d_i)表示信息系统中网络节点i采用防御动作d_i时，攻击者的最大回报值收益；

g_i表示攻击者对网络节点i采用的攻击动作；

s_i表示网络节点i的特权状态；

(d_i,g_i)表示信息系统中网络节点i的攻击-防御动作对。

所述S2步骤中基于信息系统中的攻击策略函数，求解得到最优攻击策略，包括：

信息系统中攻击者的回报值收益M为：

其中：

n表示信息系统中网络节点的数目；

计算每个网络节点在采用防御动作后，能获得最大回报值收益M的攻击动作集合

其中，

表示攻击者对信息系统中网络节点i的攻击动作，将攻击动作集合

作为信息系统的最优攻击策略。

所述S3步骤中以最优攻击策略以及信息系统状态作为输入，将信息系统安全风险级别作为输出，构建神经网络模型，包括：

所述神经网络模型的输入为最优攻击策略向量

以及系统状态B，输出为信息系统的安全风险级别，所述神经网络模型的计算流程为：

1)将最优攻击策略向量以及系统状态

作为神经网络模型输入层的输入值；

2)隐藏层对输入的最优攻击策略向量进行特征映射：

y＝σ(wG+b)

其中：

σ(·)表示激活函数，其中激活函数为Softmax函数；

w表示隐藏层中的权重值；

b表示隐藏层中的偏置量；

y表示识别的信息系统安全风险级别。

所述S3步骤中训练神经网络模型，得到最优模型参数，包括：

获取U组攻击策略向量、攻击策略向量对应的信息系统状态及安全风险级别的训练数据，构建神经网络模型的损失函数：

其中：

为神经网络模型对第i组训练数据的信息系统安全风险级别输出值；

为神经网络模型对第i组训练数据的信息系统状态输出值；

y_i为第i组训练数据的信息系统安全风险级别实际值；

B_i为第i组训练数据的信息系统状态实际值；

利用梯度下降算法对隐藏层中的参数进行更新，参数更新公式如下：

其中：

α为学习率，将其设置为0.6；

重复上述更新步骤，直到损失函数值Loss达到最小，此时的参数即为模型最优参数，完成模型训练。

所述S4步骤中利用动态安全博弈模型生成信息系统的最优攻击策略，将最优攻击策略作为神经网络模型输入，神经网络模型输出得到的值为信息系统安全级别，包括：

将神经网络模型中初始隐藏层参数替换为训练得到的模型最优参数，得到更新后的神经网络模型；

对于任意信息系统，利用动态安全博弈模型生成信息系统的最优攻击策略，将最优攻击策略作为神经网络模型输入，神经网络模型输出得到的值为信息系统安全级别，即为信息系统风险评估结果。

相对于现有技术，本发明提出一种信息系统安全风险评估方法，该技术具有以下优势：

首先，本方案提出一种信息系统环境下的动态安全博弈模型建立方法，所建立的动态安全博弈模型为(S,A,P,ε,V)，其中S表示信息系统中的状态集合，A表示信息系统中攻击者和防御者的动作集合，ε∈[0,1]为防御策略因子，ε越接近1，则表示防御者在选择防御动作时更关注长期回报；V(s,a,s′)表示攻击者和防御者在当前网络节点状态s中执行动作a，到达下一个网络节点状态s′的信息系统回报值，将信息系统中易被攻击的网络节点设置为较大的系统回报值；所述系统回报值的设定是基于网络节点的基本分数和环境分数，基本分数为供应商给出的网络节点漏洞得分，环境得分表示用户队网络节点的评价得分，分数越高表示网络节点越容易遭受攻击，则网络节点的系统回报值越大。通过将动态安全博弈模型中防御者的动作空间设置为A^def，攻击者的动作空间设置为A^att，则当防御者选择防御动作d∈A^def，攻击者选择攻击动作g∈A^att时，将攻击者的最大回报值收益作为攻击策略函数，所述攻击策略函数为：

其中：(d,g)为攻击-防御动作对；V[s,(d,g),s′]表示执行攻击-防御动作对(d,g)后，信息系统网络节点特权状态由s转换为s′的回报值；R(d)表示执行防御动作d时，攻击者的最大回报值收益；π[s,(d,g)]表示信息系统网络节点在特权状态为s时执行攻击-防御动作对(d,g)；K^π(s′)表示特权状态为s′的值函数，从而实现信息系统动态攻防环境下的信息安全博弈，且考虑到了攻防双方的信息不对称性，即攻击者信息要高于防御方。同时相较于传统方案，本方案将攻击策略函数扩展到信息系统中的n个网络节点，则信息系统中攻击者的回报值收益M为：

其中：n表示信息系统中网络节点的数目；计算每个网络节点在采用防御动作后，能获得最大回报值收益M的攻击动作集合

其中，

作为信息系统的最优攻击策略，表明本方案具有较好的扩展性，通过实时计算信息系统中攻击者的回报值收益，实现最优攻击策略的实时更新。

同时，本方案以最优攻击策略以及信息系统状态作为输入，将信息系统安全风险级别作为输出，构建神经网络模型，所述神经网络模型的输入为最优攻击策略向量

以及系统状态B，输出为信息系统的安全风险级别，所述神经网络模型的计算流程为：将最优攻击策略向量以及系统状态

作为神经网络模型输入层的输入值；隐藏层对输入的最优攻击策略向量进行特征映射：

y＝σ(wG+b)

其中：y表示识别的信息系统安全风险级别。获取U组攻击策略向量、攻击策略向量对应的信息系统状态及安全风险级别的训练数据，构建神经网络模型的损失函数：

其中：

为神经网络模型对第i组训练数据的信息系统状态输出值；y_i为第i组训练数据的信息系统安全风险级别实际值；B_i为第i组训练数据的信息系统状态实际值；利用梯度下降算法对隐藏层中的参数进行更新，参数更新公式如下：

其中：α为学习率，将其设置为0.6；重复上述更新步骤，直到损失函数值Loss达到最小，此时的参数即为模型最优参数，完成模型训练。将神经网络模型中初始隐藏层参数替换为训练得到的模型最优参数，得到更新后的神经网络模型；对于任意信息系统，利用动态安全博弈模型生成信息系统的最优攻击策略，将最优攻击策略作为神经网络模型输入，神经网络模型输出得到的值为信息系统安全级别，即为信息系统风险评估结果，实现信息系统安全级别的实时评估。

附图说明

图1为本发明一实施例提供的一种信息系统安全风险评估方法的流程示意图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

S1：构建动态安全博弈模型。

所述S1步骤中构建信息系统的动态安全博弈模型，包括：

建立信息系统环境下的动态安全博弈模型(S,A,P,ε,V)；

P表示状态转移概率，P(s,a,s′)∈[0,1]，表示攻击者和防御者在当前网络节点中执行动作a，使得网络节点状态由状态s转换为状态s′的概率，其中s,s′∈S，a∈A；所述状态转移为信息系统上网络节点的特权状态变化，状态转移公式为：

P(s_t+1＝s′|s_t,a_t,s_t-1,a_t-1,…,s₀,a₀)＝P(s_t+1＝s′|s_t,a_t)

其中：

s_t+1表示在t+1时刻的网络节点特权状态；

a_t表示在t时刻攻击者和防御者执行动作a_t；

S2：基于动态安全博弈模型，求解得到最优攻击策略。

其中：

(d,g)为攻击-防御动作对；

R(d)表示执行防御动作d时，攻击者的最大回报值收益；

K^π(s′)表示特权状态为s′的值函数。

建立信息系统中n个网络节点的攻击策略函数：

其中：

g_i表示攻击者对网络节点i采用的攻击动作；

s_i表示网络节点i的特权状态；

9d_i,g_i)表示信息系统中网络节点i的攻击-防御动作对。

信息系统中攻击者的回报值收益M为：

其中：

n表示信息系统中网络节点的数目；

其中，

作为信息系统的最优攻击策略。

S3：依据最优攻击策略以及信息系统状态作为输入，将信息系统安全风险级别作为输出，构建神经网络模型进行训练，得到最优模型参数。

所述神经网络模型的输入为最优攻击策略向量

1)将最优攻击策略向量以及系统状态

作为神经网络模型输入层的输入值；

2)隐藏层对输入的最优攻击策略向量进行特征映射：

y＝σ(wG+b)

其中：

σ(·)表示激活函数，其中激活函数为Softmax函数；

w表示隐藏层中的权重值；

b表示隐藏层中的偏置量；

y表示识别的信息系统安全风险级别。

其中：

为神经网络模型对第i组训练数据的信息系统状态输出值；

y_i为第i组训练数据的信息系统安全风险级别实际值；

B_i为第i组训练数据的信息系统状态实际值；

其中：

α为学习率，将其设置为0.6；

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。