CN112070422A - 一种基于神经网络的安全测评师派工系统及方法 - Google Patents

一种基于神经网络的安全测评师派工系统及方法 Download PDF

Info

Publication number
CN112070422A
CN112070422A CN202011221154.5A CN202011221154A CN112070422A CN 112070422 A CN112070422 A CN 112070422A CN 202011221154 A CN202011221154 A CN 202011221154A CN 112070422 A CN112070422 A CN 112070422A
Authority
CN
China
Prior art keywords
user
neural network
information
dispatching
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011221154.5A
Other languages
English (en)
Other versions
CN112070422B (zh
Inventor
陈永杰
刘新闻
郭云飞
周德雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jingyuan Safety Technology Co ltd
Original Assignee
Guangzhou Jingyuan Safety Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jingyuan Safety Technology Co ltd filed Critical Guangzhou Jingyuan Safety Technology Co ltd
Priority to CN202011221154.5A priority Critical patent/CN112070422B/zh
Publication of CN112070422A publication Critical patent/CN112070422A/zh
Application granted granted Critical
Publication of CN112070422B publication Critical patent/CN112070422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于神经网络的安全测评师派工系统及方法,其中系统包括用户信息数据模块,用户特征提取模块,测评派工图神经网络模块,初评派工策略总模块,复评派工策略模块和派工实施及跟踪模块。本发明的系统和方法将安全测评标准要求的测评任务的复杂影响因素全部包括在内,降低维度的同时在嵌入表达中充分体现了不同用户之间的内在联系,为每一个用户分派基于历史数据的第一轮测评和第二轮测评的最佳测评师,在系统中分别利用了深度自编码器和图神经网络技术,以获得最优分配方案。

Description

一种基于神经网络的安全测评师派工系统及方法
技术领域
本发明涉及保密通信领域,具体涉及一种基于神经网络的安全测评师派工系统及方法。
背景技术
随着国家的网络安全战略的展开,网络安全测评的需求迅速增长,为了面向迅速增加的用户数量及测评内容的复杂化,基于云的网络安全测评平台成为网络安全测评解决方案的关键技术。
网络安全测评平台面对数量庞大的用户,同时用户的网络及信息系统现状差异巨大,如何在有限资源的情况下为不同现状的用户提供最优服务成为亟待解决的问题;另一方面,网络安全测评师的资源也面临严重不足的情况,所以在相当长的时期内,测评平台需要面对测评师水平参差不齐的问题,而同时不同测评师针对不同类型网络安全问题的测评也有各自的优势和特点。
现有安全测评平台的测评师分派系统采用的是人工指派方法,系统提供测评师的测评历史信息,派工管理员根据自身经验及测评师的测评历史信息人工指定为特定用户提供服务的测评师。
现在的人工派工系统有明显的缺点:
1)为用户指派测评师的效果高度依赖于派工管理员的个人经验,效果不稳定。
2)随着网络安全测评的标准发展及网络安全态势的变化,网络安全测评的内容变得越来越复杂,影响测评师测评效果的因素迅速增长。完全依赖人工指派安全测评师,很难做到测评师与特定用户之间的最优匹配。
3)安全测评通常要进行两轮测评,即初评和复评。初评之后要根据结果精心设计并实施复评,因此复评对测评师的要求更高,对指派测评师的匹配度要求也更高。由于指派难度高,人工指派很多情况下为两轮测评指派相同的测评师,不能很好地针对两轮测评的不同特点进行测评师最优匹配。
因此,需要对现有的测评师派工系统进行改进,不再以人工派单为主,采用系统自动匹配实现,提高效率,获得最佳匹配方案。
发明内容
为了解决上述技术问题,本发明的提供一种基于用户特征和测评师测评历史的最优化派工系统,为每一个用户分派基于历史数据的第一轮测评和第二轮测评的最佳测评师,在系统中分别利用了深度自编码器和图神经网络技术,以获得最优分配方案的全测评师派工系统。
为实现上述目的,本发明采取的技术方案如下:一种基于神经网络的安全测评师派工系统,包括用户信息数据模块,用户特征提取模块,测评派工图神经网络模块,初评派工策略总模块,复评派工策略模块和派工实施及跟踪模块,其中:
所述用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息,所述用户基础信息的原始表达向量为:
Figure 966732DEST_PATH_IMAGE002
其中,
Figure 415031DEST_PATH_IMAGE004
表示管理类信息子向量、
Figure 194768DEST_PATH_IMAGE006
表示硬件资产类信息子向量、
Figure 324398DEST_PATH_IMAGE008
表示软件资产类子向量、
Figure 60142DEST_PATH_IMAGE010
表示网络信息子向量、
Figure 882604DEST_PATH_IMAGE012
表示脆弱点信息子向量;
所述用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达,记当前已测评用户共有N个,N个测评用户嵌入表达的特征向量为
Figure 884059DEST_PATH_IMAGE014
所述测评派工图神经网络模块:用于定期使用已测评用户特征向量生成以及训练图神经网络;
生成以及训练图神经网络过程如下:
采用余弦相似度公式计算N个用户特征向量两两之间的相似度
Figure 82959DEST_PATH_IMAGE016
之后基于
Figure 548575DEST_PATH_IMAGE018
相似度阈值构建一个邻接矩阵
Figure 541939DEST_PATH_IMAGE020
其中
Figure 30689DEST_PATH_IMAGE022
,以此邻接矩阵构造一个无向图,边的权重为两个顶点对应的用户特征向量的相似度
Figure 767701DEST_PATH_IMAGE016
,构造一个图卷积神经网络,输入层通道数为
Figure 963190DEST_PATH_IMAGE024
,C表示用户特征向量
Figure 127455DEST_PATH_IMAGE026
的维度。图卷积神经网络输出即为为用户分配的测评师ID:
Figure 369081DEST_PATH_IMAGE028
,其中M是测评师的数量;
所述初评派工策略模块:在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配初评测评师;
所述派工实施及跟踪模块:用于接收来自派工策略模块发出的测评师分配策略,在测评管理系统中发出派工指令,并跟踪派工后每个用户测评任务的执行情况;
所述初评结果分析模块:用于接收来自派工实施及跟踪模块发送过来的用户初评结果,根据初评结果查找漏洞情况,按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量
Figure DEST_PATH_IMAGE029
,填充到用户的原始信息表达向量中,形成完整的用户原始信息表达
Figure DEST_PATH_IMAGE031
,在经过深度自编码器后获得用户最终的特征向量
Figure 175363DEST_PATH_IMAGE032
所述复评派工策略模块:在定期训练的图神经网络的基础上添加待测评用户的最终特征向量
Figure 818834DEST_PATH_IMAGE032
对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配复评测评师。
优选地, 所述管理类信息子向量
Figure 75371DEST_PATH_IMAGE004
:包含用户的行业类型编码、人员规模、部门数量、是否获得标准化管理体系认证、是否有独立的信息化部门以及是否有独立的网络及服务器机房信息。
优选地,所述硬件资产类信息子向量
Figure 804293DEST_PATH_IMAGE006
:为硬件的类型和数量,包括服务器、路由器、交换机、防火墙、安全设备和打印机信息。
优选地,所述软件资产类子向量
Figure DEST_PATH_IMAGE033
:为各类软件的类型和数量,包括操作系统、中间件、数据库、大数据平台、WEB服务、文件服务、OA、ERP以及CRM软件。
优选地,所述网络信息子向量
Figure 414266DEST_PATH_IMAGE010
,为网络相关信息,包括网络出口数量、公网地址数量、子网数量、内网终端数量、DMZ数量和DMZ内终端数量。
优选地,所述脆弱点信息子向量
Figure 912243DEST_PATH_IMAGE012
,为发现漏洞按CVE进行分类统计得到的子向量。
优选地,所述原始向量
Figure 725303DEST_PATH_IMAGE034
输入深度自编码器DAE进行压缩编码:
Figure DEST_PATH_IMAGE036
,获得的编码结果向量
Figure 207099DEST_PATH_IMAGE032
的维度记为
Figure DEST_PATH_IMAGE037
一种基于深度自编码器和图神经网络的安全测评师派工方法,该方法应用了上述所述的系统,该方法包括以下步骤:
S1: 用户信息存储:采用用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息,所述用户基础信息的原始表达向量为:
Figure 745397DEST_PATH_IMAGE002
其中,
Figure 97881DEST_PATH_IMAGE004
表示管理类信息子向量、
Figure 774850DEST_PATH_IMAGE006
表示硬件资产类信息子向量、
Figure 212785DEST_PATH_IMAGE008
表示软件资产类子向量、
Figure 430139DEST_PATH_IMAGE010
表示网络信息子向量、
Figure 637130DEST_PATH_IMAGE012
表示脆弱点信息子向量;
S2: 用户特征提取:采用用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达,记当前已测评用户共有N个,N个测评用户嵌入表达的特征向量为
Figure 750579DEST_PATH_IMAGE014
S3: 生成及训练图神经网络:利用定期使用已测评用户特征向量生成以及训练图神经网络;
生成以及训练图神经网络过程如下:
采用余弦相似度公式计算N个用户特征向量两两之间的相似度
Figure 347914DEST_PATH_IMAGE016
之后基于
Figure DEST_PATH_IMAGE038
相似度阈值构建一个邻接矩阵
Figure DEST_PATH_IMAGE039
其中
Figure DEST_PATH_IMAGE040
,以此邻接矩阵构造一个无向图,边的权重为两个顶点对应的用户特征向量的相似度
Figure DEST_PATH_IMAGE041
,构造一个图卷积神经网络,输入层通道数为
Figure 742861DEST_PATH_IMAGE024
,C表示用户特征向量
Figure 601095DEST_PATH_IMAGE026
的维度。图卷积神经网络输出即为为用户分配的测评师ID:
Figure 619867DEST_PATH_IMAGE028
,其中M是测评师的数量;
S4:生成初评派工策略:在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配初评测评师;
S5:派工的实施及跟踪:接收来自派工策略模块发出的测评师分配策略,在测评管理系统中发出派工指令,并跟踪派工后每个用户测评任务的执行情况;
S6:对初评结果分析:接收来自派工实施及跟踪模块发送过来的用户初评结果,根据初评结果查找漏洞情况,按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量
Figure 32394DEST_PATH_IMAGE029
,填充到用户的原始信息表达向量中,形成完整的用户原始信息表达
Figure DEST_PATH_IMAGE043
,在经过深度自编码器后获得用户最终的特征向量
Figure DEST_PATH_IMAGE044
S7:生成复评派工策略:在定期训练的图神经网络的基础上添加待测评用户的最终特征向量
Figure 466917DEST_PATH_IMAGE032
对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配复评测评师。
本发明有益的技术效果:
1) 本发明采用深度自编码器将综合了测评用户的管理类信息、硬件类信息、软件类信息、网络类信息和脆弱性信息的原始信息压缩到低维度特征空间,将安全测评标准要求的测评任务的复杂影响因素全部包括在内,降低维度的同时在嵌入表达中充分体现了不同用户之间的内在联系。
2) 使用安全测评用户信息特征的嵌入表达向量,计算安全测评用户之间内在的相似度,在后续安全测评师分配过程中获得充分利用。
3) 基于测评用户相似度构造的无向图,使用图卷积神经网络用半监督分类的方式为待测评用户分配最佳的测评师,能够更全面准确地完成测评师的最佳分配。
4) 使用已测评用户的历史数据定期训练更新图卷积神经网络,在为待测评用户进行测评师分类时加速了神经网络的训练,提升了分配效率。
5) 将初评和复评的测评师分配区分开来,基于初评结果为用户信息补足脆弱性信息重新进行分配,能够在复评测评师分配过程中有更明确的针对性,获得更好的测评效果。
附图说明
图1为本发明一种基于神经网络的安全测评师派工系统的整体框架示意图。
图2为本发明一种基于神经网络的安全测评师派工方法的步骤流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明,但本发明要求保护的范围并不局限于下述具体实施例。
如图1所示,一种基于神经网络的安全测评师派工系统及方法,包括用户信息数据模块,用户特征提取模块,测评派工图神经网络模块,初评派工策略总模块,复评派工策略模块和派工实施及跟踪模块,其中:
所述用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息,用户基础信息至少包括安全测评用户的被测评环境、资产及用户一般性信息。
所述用户特征提取模块通过深度自编码器(DAE Deep AutoEncoder,为现有的编码器,是一种深度神经网络,使用无监督的学习算法,主要用于数据的降维或者特征的抽取)将用户基础信息压缩到用户特征空间获得嵌入表达,所述用户基础信息的原始表达向量为:
Figure DEST_PATH_IMAGE045
;即第i个用户的信息原始表达向量由以下多个子向量拼接而成,其中各种子向量的具体表达含义如下:
Figure DEST_PATH_IMAGE046
表示管理类信息子向量、
Figure DEST_PATH_IMAGE047
表示硬件资产类信息子向量、
Figure 179658DEST_PATH_IMAGE033
表示软件资产类子向量、
Figure DEST_PATH_IMAGE048
表示网络信息子向量、
Figure 290703DEST_PATH_IMAGE029
表示脆弱点信息子向量;采用深度自编码器将综合了测评用户的管理类信息、硬件类信息、软件类信息、网络类信息和脆弱性信息的原始信息压缩到低维度特征空间,将安全测评标准要求的测评任务的复杂影响因素全部包括在内,降低维度的同时在嵌入表达中充分体现了不同用户之间的内在联系。
具体的,所述管理类信息子向量
Figure 924946DEST_PATH_IMAGE046
:包含用户的行业类型编码、人员规模、部门数量、是否获得标准化管理体系认证、是否有独立的信息化部门以及是否有独立的网络及服务器机房信息。
所述硬件资产类信息子向量
Figure 491057DEST_PATH_IMAGE006
:为硬件的类型和数量,包括服务器、路由器、交换机、防火墙、安全设备和打印机信息。
所述软件资产类子向量
Figure 589463DEST_PATH_IMAGE033
:为各类软件的类型和数量,包括操作系统、中间件、数据库、大数据平台、WEB服务、文件服务、OA、ERP以及CRM软件。
所述网络信息子向量
Figure 950037DEST_PATH_IMAGE048
,为网络相关信息,包括网络出口数量、公网地址数量、子网数量、内网终端数量、DMZ数量和DMZ内终端数量。
所述脆弱点信息子向量
Figure 71577DEST_PATH_IMAGE012
,为发现漏洞按CVE进行分类统计得到的子向量。
以上的用户信息的原始表达向量
Figure 113482DEST_PATH_IMAGE031
作为输入向量,输入深度自编码器进行压缩编码,即
Figure 4078DEST_PATH_IMAGE036
,获得的编码结果向量
Figure 535553DEST_PATH_IMAGE032
维度记为
Figure 144389DEST_PATH_IMAGE037
,远小于原始向量
Figure 114619DEST_PATH_IMAGE031
的维度。为此,系统定期使用已测评的历史用户信息对深度自编码器进行训练更新。当新的待测评用户信息到达时,直接用最近更新的深度自编码获得特征空间的嵌入表达
Figure 125301DEST_PATH_IMAGE032
所述测评派工图神经网络模块:用于定期使用已测评用户特征向量生成以及训练图神经网络, 使用已测评用户的历史数据定期训练更新图卷积神经网络,在为待测评用户进行测评师分类时加速了神经网络的训练,提升了分配效率;
生成以及训练图神经网络过程如下:
记当前已测评用户共有N个,N个测评用户的特征向量为
Figure DEST_PATH_IMAGE049
采用余弦相似度公式计算N个用户特征向量两两之间的相似度
Figure 827677DEST_PATH_IMAGE016
, 余弦相似度公式是通过计算两个向量的夹角余弦值来评估他们的相似度,
之后基于
Figure 845181DEST_PATH_IMAGE038
相似度阈值构建一个邻接矩阵
Figure 556785DEST_PATH_IMAGE039
其中
Figure 156393DEST_PATH_IMAGE022
,以此邻接矩阵构造一个无向图,边的权重为两个顶点对应的用户特征向量的相似度
Figure 91988DEST_PATH_IMAGE041
,构造一个图卷积神经网络,输入层通道数为
Figure 675417DEST_PATH_IMAGE024
,C表示用户特征向量
Figure 659553DEST_PATH_IMAGE032
的维度。图卷积神经网络输出即为为用户分配的测评师ID:
Figure DEST_PATH_IMAGE050
,其中M是测评师的数量。
计算安全测评用户之间内在的相似度
Figure 316930DEST_PATH_IMAGE041
,可以充分为后续安全测评师分配提供更好的数据分析,使分配工作更精准。基于测评用户相似度构造的无向图,使用图卷积神经网络用半监督分类的方式为待测评用户分配最佳的测评师,能够更全面准确地完成测评师的最佳分配。
所述初评派工策略模块:以批处理的方式为一批待分配初评测评师的用户进行初评测评师分配,对于初评用户,由于尚不知用户信息化系统的脆弱点情况,因此初评时用户信息原始向量
Figure 626689DEST_PATH_IMAGE032
中脆弱点信息子向量
Figure 353206DEST_PATH_IMAGE012
置为全零进入深度自编码器获得嵌入向量表达。在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配初评测评师。
所述派工实施及跟踪模块:用于接收来自派工策略模块发出的测评师分配策略,在测评管理系统中发出派工指令,并跟踪派工后每个用户测评任务的执行情况;
所述初评结果分析模块:用于接收来自派工实施及跟踪模块发送过来的用户初评结果,根据初评结果查找漏洞情况,按通用漏洞披露CVE(Common Vulnerabilities &Exposures,通用漏洞披露,CVE是一个字典表,为广泛认同的信息安全漏洞或者已经暴露出来的弱点给出一个公共的名称)分类汇总形成用户的脆弱点信息子向量
Figure 62404DEST_PATH_IMAGE029
,填充到用户的原始信息表达向量中,形成完整的用户原始信息表达
Figure 636605DEST_PATH_IMAGE031
,在经过深度自编码器后获得用户最终的特征向量
Figure 914003DEST_PATH_IMAGE026
所述复评派工策略模块:以批处理的方式为一批待分配复评测评师的用户进行复评测评师分配,在定期训练的图神经网络的基础上添加待测评用户的最终特征向量
Figure 940865DEST_PATH_IMAGE044
对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配复评测评师。
将初评和复评的测评师分配区分开来,基于初评结果为用户信息补足脆弱性信息重新进行分配,能够在复评测评师分配过程中有更明确的针对性,获得更好的测评效果。
一种基于深度自编码器和图神经网络的安全测评师派工方法,该方法应用了上述所述的系统,该方法包括以下步骤:
S1: 用户信息存储:采用用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息,所述用户基础信息的原始表达向量为:
Figure 470066DEST_PATH_IMAGE002
其中,
Figure 898773DEST_PATH_IMAGE004
表示管理类信息子向量、
Figure 347072DEST_PATH_IMAGE006
表示硬件资产类信息子向量、
Figure 392389DEST_PATH_IMAGE033
表示软件资产类子向量、
Figure 522019DEST_PATH_IMAGE048
表示网络信息子向量、
Figure 70812DEST_PATH_IMAGE012
表示脆弱点信息子向量;
S2: 用户特征提取:采用用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达,记当前已测评用户共有N个,N个测评用户嵌入表达的特征向量为
Figure 80225DEST_PATH_IMAGE014
S3: 生成及训练图神经网络:利用定期使用已测评用户特征向量生成以及训练图神经网络;
生成以及训练图神经网络过程如下:
采用余弦相似度公式计算N个用户特征向量两两之间的相似度
Figure 347258DEST_PATH_IMAGE016
之后基于
Figure 280579DEST_PATH_IMAGE038
相似度阈值构建一个邻接矩阵
Figure 683879DEST_PATH_IMAGE039
其中
Figure 739559DEST_PATH_IMAGE022
,以此邻接矩阵构造一个无向图,边的权重为两个顶点对应的用户特征向量的相似度
Figure 493889DEST_PATH_IMAGE041
,构造一个图卷积神经网络,输入层通道数为
Figure 965321DEST_PATH_IMAGE024
,即用户特征向量
Figure 160810DEST_PATH_IMAGE032
的维度。图卷积神经网络输出即为为用户分配的测评师ID:
Figure 590655DEST_PATH_IMAGE050
,其中M是测评师的数量;
S4:生成初评派工策略:在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配初评测评师;
S5:派工的实施及跟踪:接收来自派工策略模块发出的测评师分配策略,在测评管理系统中发出派工指令,并跟踪派工后每个用户测评任务的执行情况;
S6:对初评结果分析:接收来自派工实施及跟踪模块发送过来的用户初评结果,根据初评结果查找漏洞情况,按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量
Figure 301122DEST_PATH_IMAGE012
,填充到用户的原始信息表达向量中,形成完整的用户原始信息表达
Figure 841825DEST_PATH_IMAGE034
,在经过深度自编码器后获得用户最终的特征向量
Figure 282033DEST_PATH_IMAGE032
S7:生成复评派工策略:在定期训练的图神经网络的基础上添加待测评用户的最终特征向量
Figure 617200DEST_PATH_IMAGE032
对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配复评测评师。
根据上述说明书的揭示和教导,本发明所属领域的技术人员还可以对上述实施方式进行变更和修改。因此,本发明并不局限于上面揭示和描述的具体实施方式,对发明的一些修改和变更也应当落入本发明的权利要求的保护范围内。此外,尽管本说明书中使用了一些特定的术语,但这些术语只是为了方便说明,并不对发明构成任何限制。

Claims (8)

1.一种基于神经网络的安全测评师派工系统,其特征在于,包括用户信息数据模块,用户特征提取模块,测评派工图神经网络模块,初评派工策略总模块,复评派工策略模块和派工实施及跟踪模块,其中:
所述用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息,所述用户基础信息的表达向量为:
Figure DEST_PATH_IMAGE001
其中,
Figure 495861DEST_PATH_IMAGE002
表示管理类信息子向量、
Figure DEST_PATH_IMAGE003
表示硬件资产类信息子向量、
Figure 678581DEST_PATH_IMAGE004
表示软件资产类子向量、
Figure DEST_PATH_IMAGE005
表示网络信息子向量、
Figure 848531DEST_PATH_IMAGE006
表示脆弱点信息子向量;
所述用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达,记当前已测评用户共有N个,N个测评用户嵌入表达的特征向量为
Figure DEST_PATH_IMAGE007
所述测评派工图神经网络模块:用于定期使用已测评用户特征向量生成以及训练图神经网络;
生成以及训练图神经网络过程如下:
采用余弦相似度公式计算N个用户特征向量两两之间的相似度
Figure 509320DEST_PATH_IMAGE008
,
之后基于
Figure DEST_PATH_IMAGE009
相似度阈值构建一个邻接矩阵
Figure 589271DEST_PATH_IMAGE010
其中
Figure DEST_PATH_IMAGE011
,以此邻接矩阵构造一个无向图,边的权重为两个顶点对应的用户特征向量的相似度
Figure 818258DEST_PATH_IMAGE008
,构造一个图卷积神经网络,输入层通道数为
Figure 85291DEST_PATH_IMAGE012
,C表示用户特征向量
Figure DEST_PATH_IMAGE013
的维度,图卷积神经网络输出即为用户分配的测评师ID:
Figure 549771DEST_PATH_IMAGE014
,其中M是测评师的数量;
所述初评派工策略模块:在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配初评测评师;
所述派工实施及跟踪模块:用于接收来自派工策略模块发出的测评师分配策略,在测评管理系统中发出派工指令,并跟踪派工后每个用户测评任务的执行情况;
所述初评结果分析模块:用于接收来自派工实施及跟踪模块发送过来的用户初评结果,根据初评结果查找漏洞情况,按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量
Figure DEST_PATH_IMAGE015
,填充到用户的原始信息表达向量中,形成完整的用户原始信息表达
Figure 749808DEST_PATH_IMAGE016
,在经过深度自编码器后获得用户最终的特征向量
Figure 743172DEST_PATH_IMAGE013
所述复评派工策略模块:在定期训练的图神经网络的基础上添加待测评用户的最终特征向量
Figure 887714DEST_PATH_IMAGE013
对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配复评测评师。
2.如权利要求1所述的一种基于神经网络的安全测评师派工系统,其特征在于: 所述管理类信息子向量
Figure DEST_PATH_IMAGE017
:包含用户的行业类型编码、人员规模、部门数量、是否获得标准化管理体系认证、是否有独立的信息化部门以及是否有独立的网络及服务器机房信息。
3.如权利要求1所述的一种基于神经网络的安全测评师派工系统,其特征在于:所述硬件资产类信息子向量
Figure 890305DEST_PATH_IMAGE003
:为硬件的类型和数量,包括服务器、路由器、交换机、防火墙、安全设备和打印机信息。
4.如权利要求1所述的一种基于神经网络的安全测评师派工系统,其特征在于:所述软件资产类子向量
Figure 413691DEST_PATH_IMAGE004
:为各类软件的类型和数量,包括操作系统、中间件、数据库、大数据平台、WEB服务、文件服务、OA、ERP以及CRM软件。
5.如权利要求1所述的一种基于神经网络的安全测评师派工系统,其特征在于:所述网络信息子向量
Figure 109114DEST_PATH_IMAGE005
,为网络相关信息,包括网络出口数量、公网地址数量、子网数量、内网终端数量、DMZ数量和DMZ内终端数量。
6.如权利要求1所述的一种基于神经网络的安全测评师派工系统,其特征在于:所述脆弱点信息子向量
Figure 350740DEST_PATH_IMAGE006
,为发现漏洞按CVE进行分类统计得到的子向量。
7.如权利要求1所述的一种基于深度自编码器和图神经网络的安全测评师派工系统,其特征在于:所述原始向量
Figure 891442DEST_PATH_IMAGE016
输入深度自编码器DAE进行压缩编码:
Figure 675859DEST_PATH_IMAGE018
,获得的编码结果向量
Figure 11025DEST_PATH_IMAGE013
的维度记为
Figure 5526DEST_PATH_IMAGE012
8.一种基于神经网络的安全测评师派工方法,该方法应用了如权利要求1-7任一所述的系统,其特征在于:该方法包括以下步骤:
S1: 用户信息存储:采用用户信息数据模块用于存储已测评用户及待测评用户的用户基础信息,所述用户基础信息的原始表达向量为:
Figure 84340DEST_PATH_IMAGE001
其中,
Figure 847897DEST_PATH_IMAGE002
表示管理类信息子向量、
Figure 619544DEST_PATH_IMAGE003
表示硬件资产类信息子向量、
Figure 835762DEST_PATH_IMAGE004
表示软件资产类子向量、
Figure 108480DEST_PATH_IMAGE005
表示网络信息子向量、
Figure 460964DEST_PATH_IMAGE006
表示脆弱点信息子向量;
S2: 用户特征提取:采用用户特征提取模块通过深度自编码器将用户基础信息压缩到用户特征空间获得嵌入表达,记当前已测评用户共有N个,N个测评用户嵌入表达的特征向量为
Figure 669091DEST_PATH_IMAGE007
S3: 生成及训练图神经网络:利用定期使用已测评用户特征向量生成以及训练图神经网络;
生成以及训练图神经网络过程如下:
采用余弦相似度公式计算N个用户特征向量两两之间的相似度
Figure 107026DEST_PATH_IMAGE008
之后基于
Figure 793222DEST_PATH_IMAGE009
相似度阈值构建一个邻接矩阵
Figure 265792DEST_PATH_IMAGE010
其中
Figure DEST_PATH_IMAGE019
,以此邻接矩阵构造一个无向图,边的权重为两个顶点对应的用户特征向量的相似度
Figure 644821DEST_PATH_IMAGE008
,构造一个图卷积神经网络,输入层通道数为
Figure 710997DEST_PATH_IMAGE012
,C表示用户特征向量
Figure 200884DEST_PATH_IMAGE013
的维度,图卷积神经网络输出即为为用户分配的测评师ID:
Figure 262381DEST_PATH_IMAGE014
,其中M是测评师的数量;
S4:生成初评派工策略:在定期训练的图神经网络的基础上添加待测评用户的特征向量对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配初评测评师;
S5:派工的实施及跟踪:接收来自派工策略模块发出的测评师分配策略,在测评管理系统中发出派工指令,并跟踪派工后每个用户测评任务的执行情况;
S6:对初评结果分析:接收来自派工实施及跟踪模块发送过来的用户初评结果,根据初评结果查找漏洞情况,按通用漏洞披露CVE分类汇总形成用户的脆弱点信息子向量
Figure 812311DEST_PATH_IMAGE015
,填充到用户的原始信息表达向量中,形成完整的用户原始信息表达
Figure 224838DEST_PATH_IMAGE016
,在经过深度自编码器后获得用户最终的特征向量
Figure 518416DEST_PATH_IMAGE013
S7:生成复评派工策略:在定期训练的图神经网络的基础上添加待测评用户的最终特征向量
Figure 699998DEST_PATH_IMAGE013
对应的顶点构成新的图,以已分配测评师的用户顶点为目标训练图神经网络,完成半监督的分类任务,为待测评用户分配复评测评师。
CN202011221154.5A 2020-11-05 2020-11-05 一种基于神经网络的安全测评师派工系统及方法 Active CN112070422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011221154.5A CN112070422B (zh) 2020-11-05 2020-11-05 一种基于神经网络的安全测评师派工系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011221154.5A CN112070422B (zh) 2020-11-05 2020-11-05 一种基于神经网络的安全测评师派工系统及方法

Publications (2)

Publication Number Publication Date
CN112070422A true CN112070422A (zh) 2020-12-11
CN112070422B CN112070422B (zh) 2021-07-30

Family

ID=73655410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011221154.5A Active CN112070422B (zh) 2020-11-05 2020-11-05 一种基于神经网络的安全测评师派工系统及方法

Country Status (1)

Country Link
CN (1) CN112070422B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109887282A (zh) * 2019-03-05 2019-06-14 中南大学 一种基于层级时序图卷积网络的路网交通流预测方法
CN110555881A (zh) * 2019-08-29 2019-12-10 桂林电子科技大学 一种基于卷积神经网络的视觉slam测试方法
CN110633734A (zh) * 2019-08-22 2019-12-31 成都信息工程大学 一种基于图论相关理论进行异常检测的方法
CN110705585A (zh) * 2019-08-22 2020-01-17 深圳壹账通智能科技有限公司 网络欺诈识别方法、装置、计算机装置及存储介质
CN110717617A (zh) * 2019-09-09 2020-01-21 广东工业大学 一种基于深度图网络自编码器的无监督关系预测方法
CN110795937A (zh) * 2019-09-25 2020-02-14 卓尔智联(武汉)研究院有限公司 信息处理方法、装置及存储介质
CN111291212A (zh) * 2020-01-24 2020-06-16 复旦大学 基于图卷积神经网络的零样本草图图像检索方法和系统
US20200234145A1 (en) * 2019-01-23 2020-07-23 Deepmind Technologies Limited Action selection using interaction history graphs
CN111651671A (zh) * 2020-05-27 2020-09-11 腾讯科技(深圳)有限公司 用户对象推荐方法、装置、计算机设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200234145A1 (en) * 2019-01-23 2020-07-23 Deepmind Technologies Limited Action selection using interaction history graphs
CN109887282A (zh) * 2019-03-05 2019-06-14 中南大学 一种基于层级时序图卷积网络的路网交通流预测方法
CN110633734A (zh) * 2019-08-22 2019-12-31 成都信息工程大学 一种基于图论相关理论进行异常检测的方法
CN110705585A (zh) * 2019-08-22 2020-01-17 深圳壹账通智能科技有限公司 网络欺诈识别方法、装置、计算机装置及存储介质
CN110555881A (zh) * 2019-08-29 2019-12-10 桂林电子科技大学 一种基于卷积神经网络的视觉slam测试方法
CN110717617A (zh) * 2019-09-09 2020-01-21 广东工业大学 一种基于深度图网络自编码器的无监督关系预测方法
CN110795937A (zh) * 2019-09-25 2020-02-14 卓尔智联(武汉)研究院有限公司 信息处理方法、装置及存储介质
CN111291212A (zh) * 2020-01-24 2020-06-16 复旦大学 基于图卷积神经网络的零样本草图图像检索方法和系统
CN111651671A (zh) * 2020-05-27 2020-09-11 腾讯科技(深圳)有限公司 用户对象推荐方法、装置、计算机设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
XIAOYUAN LI: "Fear-related Visual Information Transfer Characteristics of the Lateral Posterior Thalamic Nucleus", 《ICBET 2020: PROCEEDINGS OF THE 2020 10TH INTERNATIONAL CONFERENCE ON BIOMEDICAL ENGINEERING AND TECHNOLOGY》 *
徐冰冰: "图卷积神经网络综述", 《计算机学报》 *
易东义: "基于图卷积神经网络的医保欺诈检测算法", 《计算机应用》 *
白铂: "图神经网络", 《中国科学:数学》 *

Also Published As

Publication number Publication date
CN112070422B (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
Małkowska et al. The impact of digital transformation on European countries: Insights from a comparative analysis
Goodman Association models and canonical correlation in the analysis of cross-classifications having ordered categories
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN110084377A (zh) 用于构建决策树的方法和装置
Mohammad et al. Customer churn prediction in telecommunication industry using machine learning classifiers
CN111614615A (zh) 一种变电站电力监控系统网络安全量化评估方法
US20180260446A1 (en) System and method for building statistical predictive models using automated insights
CN111898839A (zh) 电力用户的重要程度分类方法及装置
CN114372871A (zh) 信用评分值的确定方法及其装置、电子设备及存储介质
CN113986660A (zh) 系统调整策略的匹配方法、装置、设备及存储介质
CN113962160A (zh) 基于用户画像的互联网卡用户流失预测方法及系统
CN112070422B (zh) 一种基于神经网络的安全测评师派工系统及方法
CN113487241A (zh) 企业环保信用等级的分类方法、装置、设备及存储介质
Smith Mission dependency index of air force built infrastructure: Knowledge discovery with machine learning
KR20040104853A (ko) 정보 자산의 위험 분석 시스템
CN116468273A (zh) 客户风险识别方法及装置
CN115345489A (zh) 基于服务层的云计算风险分析方法及分析系统
CN116579640A (zh) 电力营销服务渠道用户体验评估方法及系统
CN116707859A (zh) 特征规则提取方法和装置、网络入侵检测方法和装置
CN113139191B (zh) 一种漏洞处置修复优先级的统计方法
CN112712270B (zh) 信息处理方法、装置、设备及存储介质
Kulkarni et al. Barriers to Industry 4.0 adoption: Indian scenario
EP3876158A1 (en) Method and system for adjusting a machine learning output
Simonetta et al. Integrating SQuaRE data quality model with ISO 31000 risk management to measure and mitigate software bias
CN113449318A (zh) 一种数据分级模型训练方法、装置、数据分级方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant