CN112070422A

CN112070422A - 一种基于神经网络的安全测评师派工系统及方法

Info

Publication number: CN112070422A
Application number: CN202011221154.5A
Authority: CN
Inventors: 陈永杰; 刘新闻; 郭云飞; 周德雨
Original assignee: Guangzhou Jingyuan Safety Technology Co ltd
Current assignee: Guangzhou Jingyuan Safety Technology Co ltd
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2020-12-11
Anticipated expiration: 2040-11-05
Also published as: CN112070422B

Abstract

本发明公开了一种基于神经网络的安全测评师派工系统及方法，其中系统包括用户信息数据模块，用户特征提取模块，测评派工图神经网络模块，初评派工策略总模块，复评派工策略模块和派工实施及跟踪模块。本发明的系统和方法将安全测评标准要求的测评任务的复杂影响因素全部包括在内，降低维度的同时在嵌入表达中充分体现了不同用户之间的内在联系，为每一个用户分派基于历史数据的第一轮测评和第二轮测评的最佳测评师，在系统中分别利用了深度自编码器和图神经网络技术，以获得最优分配方案。

Description

一种基于神经网络的安全测评师派工系统及方法

技术领域

本发明涉及保密通信领域，具体涉及一种基于神经网络的安全测评师派工系统及方法。

背景技术

随着国家的网络安全战略的展开，网络安全测评的需求迅速增长，为了面向迅速增加的用户数量及测评内容的复杂化，基于云的网络安全测评平台成为网络安全测评解决方案的关键技术。

网络安全测评平台面对数量庞大的用户，同时用户的网络及信息系统现状差异巨大，如何在有限资源的情况下为不同现状的用户提供最优服务成为亟待解决的问题；另一方面，网络安全测评师的资源也面临严重不足的情况，所以在相当长的时期内，测评平台需要面对测评师水平参差不齐的问题，而同时不同测评师针对不同类型网络安全问题的测评也有各自的优势和特点。

现有安全测评平台的测评师分派系统采用的是人工指派方法，系统提供测评师的测评历史信息，派工管理员根据自身经验及测评师的测评历史信息人工指定为特定用户提供服务的测评师。

现在的人工派工系统有明显的缺点：

1）为用户指派测评师的效果高度依赖于派工管理员的个人经验，效果不稳定。

2）随着网络安全测评的标准发展及网络安全态势的变化，网络安全测评的内容变得越来越复杂，影响测评师测评效果的因素迅速增长。完全依赖人工指派安全测评师，很难做到测评师与特定用户之间的最优匹配。

3）安全测评通常要进行两轮测评，即初评和复评。初评之后要根据结果精心设计并实施复评，因此复评对测评师的要求更高，对指派测评师的匹配度要求也更高。由于指派难度高，人工指派很多情况下为两轮测评指派相同的测评师，不能很好地针对两轮测评的不同特点进行测评师最优匹配。

因此，需要对现有的测评师派工系统进行改进，不再以人工派单为主，采用系统自动匹配实现，提高效率，获得最佳匹配方案。

发明内容

为了解决上述技术问题，本发明的提供一种基于用户特征和测评师测评历史的最优化派工系统，为每一个用户分派基于历史数据的第一轮测评和第二轮测评的最佳测评师，在系统中分别利用了深度自编码器和图神经网络技术，以获得最优分配方案的全测评师派工系统。

为实现上述目的，本发明采取的技术方案如下：一种基于神经网络的安全测评师派工系统，包括用户信息数据模块，用户特征提取模块，测评派工图神经网络模块，初评派工策略总模块，复评派工策略模块和派工实施及跟踪模块，其中：

所述用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息，所述用户基础信息的原始表达向量为：

；

其中，

表示管理类信息子向量、

表示硬件资产类信息子向量、

表示软件资产类子向量、

表示网络信息子向量、

表示脆弱点信息子向量；

所述用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达，记当前已测评用户共有N个，N个测评用户嵌入表达的特征向量为

；

所述测评派工图神经网络模块：用于定期使用已测评用户特征向量生成以及训练图神经网络；

生成以及训练图神经网络过程如下：

采用余弦相似度公式计算N个用户特征向量两两之间的相似度

，

之后基于

相似度阈值构建一个邻接矩阵

，

其中

，以此邻接矩阵构造一个无向图，边的权重为两个顶点对应的用户特征向量的相似度

，构造一个图卷积神经网络，输入层通道数为

，C表示用户特征向量

的维度。图卷积神经网络输出即为为用户分配的测评师ID：

，其中M是测评师的数量；

所述初评派工策略模块：在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图，以已分配测评师的用户顶点为目标训练图神经网络，完成半监督的分类任务，为待测评用户分配初评测评师；

所述派工实施及跟踪模块：用于接收来自派工策略模块发出的测评师分配策略，在测评管理系统中发出派工指令，并跟踪派工后每个用户测评任务的执行情况；

所述初评结果分析模块：用于接收来自派工实施及跟踪模块发送过来的用户初评结果，根据初评结果查找漏洞情况，按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量

，填充到用户的原始信息表达向量中，形成完整的用户原始信息表达

，在经过深度自编码器后获得用户最终的特征向量

；

所述复评派工策略模块：在定期训练的图神经网络的基础上添加待测评用户的最终特征向量

对应的顶点构成新的图，以已分配测评师的用户顶点为目标训练图神经网络，完成半监督的分类任务，为待测评用户分配复评测评师。

优选地，所述管理类信息子向量

：包含用户的行业类型编码、人员规模、部门数量、是否获得标准化管理体系认证、是否有独立的信息化部门以及是否有独立的网络及服务器机房信息。

优选地，所述硬件资产类信息子向量

：为硬件的类型和数量，包括服务器、路由器、交换机、防火墙、安全设备和打印机信息。

优选地，所述软件资产类子向量

：为各类软件的类型和数量，包括操作系统、中间件、数据库、大数据平台、WEB服务、文件服务、OA、ERP以及CRM软件。

优选地，所述网络信息子向量

，为网络相关信息，包括网络出口数量、公网地址数量、子网数量、内网终端数量、DMZ数量和DMZ内终端数量。

优选地，所述脆弱点信息子向量

，为发现漏洞按CVE进行分类统计得到的子向量。

优选地，所述原始向量

输入深度自编码器DAE进行压缩编码：

,获得的编码结果向量

的维度记为

。

一种基于深度自编码器和图神经网络的安全测评师派工方法，该方法应用了上述所述的系统，该方法包括以下步骤：

S1: 用户信息存储：采用用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息，所述用户基础信息的原始表达向量为：

；

其中，

表示管理类信息子向量、

表示硬件资产类信息子向量、

表示软件资产类子向量、

表示网络信息子向量、

表示脆弱点信息子向量；

S2: 用户特征提取：采用用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达，记当前已测评用户共有N个，N个测评用户嵌入表达的特征向量为

；

S3: 生成及训练图神经网络：利用定期使用已测评用户特征向量生成以及训练图神经网络；

生成以及训练图神经网络过程如下：

采用余弦相似度公式计算N个用户特征向量两两之间的相似度

，

之后基于

相似度阈值构建一个邻接矩阵

，

其中

，构造一个图卷积神经网络，输入层通道数为

，C表示用户特征向量

的维度。图卷积神经网络输出即为为用户分配的测评师ID：

，其中M是测评师的数量；

S4:生成初评派工策略：在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图，以已分配测评师的用户顶点为目标训练图神经网络，完成半监督的分类任务，为待测评用户分配初评测评师；

S5:派工的实施及跟踪：接收来自派工策略模块发出的测评师分配策略，在测评管理系统中发出派工指令，并跟踪派工后每个用户测评任务的执行情况；

S6:对初评结果分析：接收来自派工实施及跟踪模块发送过来的用户初评结果，根据初评结果查找漏洞情况，按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量

，在经过深度自编码器后获得用户最终的特征向量

；

S7:生成复评派工策略：在定期训练的图神经网络的基础上添加待测评用户的最终特征向量

本发明有益的技术效果：

1）本发明采用深度自编码器将综合了测评用户的管理类信息、硬件类信息、软件类信息、网络类信息和脆弱性信息的原始信息压缩到低维度特征空间，将安全测评标准要求的测评任务的复杂影响因素全部包括在内，降低维度的同时在嵌入表达中充分体现了不同用户之间的内在联系。

2）使用安全测评用户信息特征的嵌入表达向量，计算安全测评用户之间内在的相似度，在后续安全测评师分配过程中获得充分利用。

3）基于测评用户相似度构造的无向图，使用图卷积神经网络用半监督分类的方式为待测评用户分配最佳的测评师，能够更全面准确地完成测评师的最佳分配。

4）使用已测评用户的历史数据定期训练更新图卷积神经网络，在为待测评用户进行测评师分类时加速了神经网络的训练，提升了分配效率。

5）将初评和复评的测评师分配区分开来，基于初评结果为用户信息补足脆弱性信息重新进行分配，能够在复评测评师分配过程中有更明确的针对性，获得更好的测评效果。

附图说明

图1为本发明一种基于神经网络的安全测评师派工系统的整体框架示意图。

图２为本发明一种基于神经网络的安全测评师派工方法的步骤流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例对本发明进行进一步详细说明，但本发明要求保护的范围并不局限于下述具体实施例。

如图1所示，一种基于神经网络的安全测评师派工系统及方法，包括用户信息数据模块，用户特征提取模块，测评派工图神经网络模块，初评派工策略总模块，复评派工策略模块和派工实施及跟踪模块，其中：

所述用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息，用户基础信息至少包括安全测评用户的被测评环境、资产及用户一般性信息。

所述用户特征提取模块通过深度自编码器（DAE Deep AutoEncoder,为现有的编码器，是一种深度神经网络，使用无监督的学习算法，主要用于数据的降维或者特征的抽取）将用户基础信息压缩到用户特征空间获得嵌入表达，所述用户基础信息的原始表达向量为：

；即第i个用户的信息原始表达向量由以下多个子向量拼接而成，其中各种子向量的具体表达含义如下：

表示管理类信息子向量、

表示硬件资产类信息子向量、

表示软件资产类子向量、

表示网络信息子向量、

表示脆弱点信息子向量；采用深度自编码器将综合了测评用户的管理类信息、硬件类信息、软件类信息、网络类信息和脆弱性信息的原始信息压缩到低维度特征空间，将安全测评标准要求的测评任务的复杂影响因素全部包括在内，降低维度的同时在嵌入表达中充分体现了不同用户之间的内在联系。

具体的，所述管理类信息子向量

所述硬件资产类信息子向量

所述软件资产类子向量

所述网络信息子向量

所述脆弱点信息子向量

，为发现漏洞按CVE进行分类统计得到的子向量。

以上的用户信息的原始表达向量

作为输入向量，输入深度自编码器进行压缩编码，即

,获得的编码结果向量

维度记为

，远小于原始向量

的维度。为此，系统定期使用已测评的历史用户信息对深度自编码器进行训练更新。当新的待测评用户信息到达时，直接用最近更新的深度自编码获得特征空间的嵌入表达

。

所述测评派工图神经网络模块：用于定期使用已测评用户特征向量生成以及训练图神经网络, 使用已测评用户的历史数据定期训练更新图卷积神经网络，在为待测评用户进行测评师分类时加速了神经网络的训练，提升了分配效率；

生成以及训练图神经网络过程如下：

记当前已测评用户共有N个，N个测评用户的特征向量为

；

采用余弦相似度公式计算N个用户特征向量两两之间的相似度

, 余弦相似度公式是通过计算两个向量的夹角余弦值来评估他们的相似度，

之后基于

相似度阈值构建一个邻接矩阵

，

其中

，构造一个图卷积神经网络，输入层通道数为

，C表示用户特征向量

的维度。图卷积神经网络输出即为为用户分配的测评师ID：

，其中M是测评师的数量。

计算安全测评用户之间内在的相似度

，可以充分为后续安全测评师分配提供更好的数据分析，使分配工作更精准。基于测评用户相似度构造的无向图，使用图卷积神经网络用半监督分类的方式为待测评用户分配最佳的测评师，能够更全面准确地完成测评师的最佳分配。

所述初评派工策略模块：以批处理的方式为一批待分配初评测评师的用户进行初评测评师分配，对于初评用户，由于尚不知用户信息化系统的脆弱点情况，因此初评时用户信息原始向量

中脆弱点信息子向量

置为全零进入深度自编码器获得嵌入向量表达。在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图，以已分配测评师的用户顶点为目标训练图神经网络，完成半监督的分类任务，为待测评用户分配初评测评师。

所述初评结果分析模块：用于接收来自派工实施及跟踪模块发送过来的用户初评结果，根据初评结果查找漏洞情况，按通用漏洞披露CVE（Common Vulnerabilities &Exposures，通用漏洞披露，CVE是一个字典表，为广泛认同的信息安全漏洞或者已经暴露出来的弱点给出一个公共的名称）分类汇总形成用户的脆弱点信息子向量

，在经过深度自编码器后获得用户最终的特征向量

；

所述复评派工策略模块：以批处理的方式为一批待分配复评测评师的用户进行复评测评师分配，在定期训练的图神经网络的基础上添加待测评用户的最终特征向量

将初评和复评的测评师分配区分开来，基于初评结果为用户信息补足脆弱性信息重新进行分配，能够在复评测评师分配过程中有更明确的针对性，获得更好的测评效果。

；

其中，

表示管理类信息子向量、

表示硬件资产类信息子向量、

表示软件资产类子向量、

表示网络信息子向量、

表示脆弱点信息子向量；

；

生成以及训练图神经网络过程如下：

采用余弦相似度公式计算N个用户特征向量两两之间的相似度

，

之后基于

相似度阈值构建一个邻接矩阵

，

其中

，构造一个图卷积神经网络，输入层通道数为

，即用户特征向量

的维度。图卷积神经网络输出即为为用户分配的测评师ID：

，其中M是测评师的数量；

，在经过深度自编码器后获得用户最终的特征向量

；

根据上述说明书的揭示和教导，本发明所属领域的技术人员还可以对上述实施方式进行变更和修改。因此，本发明并不局限于上面揭示和描述的具体实施方式，对发明的一些修改和变更也应当落入本发明的权利要求的保护范围内。此外，尽管本说明书中使用了一些特定的术语，但这些术语只是为了方便说明，并不对发明构成任何限制。