CN117857202A - 一种信息系统的多维度安全评估方法 - Google Patents
一种信息系统的多维度安全评估方法 Download PDFInfo
- Publication number
- CN117857202A CN117857202A CN202410083819.2A CN202410083819A CN117857202A CN 117857202 A CN117857202 A CN 117857202A CN 202410083819 A CN202410083819 A CN 202410083819A CN 117857202 A CN117857202 A CN 117857202A
- Authority
- CN
- China
- Prior art keywords
- data
- information system
- information
- source data
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000003062 neural network model Methods 0.000 claims abstract description 52
- 238000011156 evaluation Methods 0.000 claims abstract description 46
- 230000004927 fusion Effects 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 238000013507 mapping Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000013210 evaluation model Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 28
- 238000012795 verification Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 9
- 231100000279 safety data Toxicity 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 235000002020 sage Nutrition 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种信息系统的多维度安全评估方法,涉及信息安全技术领域,包括以下步骤:获取信息系统中的多源数据,对多源数据进行预处理;根据多源数据对应的业务信息构建多源数据的关联矩阵,并将关联矩阵映射至低维向量空间得到多源数据的低维多样特征,根据低维多样特征计算信息系统的多样指标值;根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征进行特征融合,以融合特征作为多源数据的附加特征,得到多源数据集;基于图神经网络模型及GRU网络构建信息系统安全评估模型,利用图神经网络模型对多源数据集进行表示学习,获取低维风险特征。综合考虑信息系统的多样性和风险程度实现对信息系统的安全评估。
Description
技术领域
本发明涉及信息安全技术领域,尤其涉及一种信息系统的多维度安全评估方法。
背景技术
随着信息化和经济全球化的发展,互联网已经深入到人们生活的方方面面,给人们的生活带来了巨大的变化,一方面,由于互联网的开放性,信息系统自身的缺陷、敏感信息的泄露、计算机病毒的泛滥以及黑客入侵等,导致各种信息系统和平台面临着巨大的安全隐患,信息安全问题日渐凸显,另一方面,新的网络环境不断涌现,如大数据、云计算等,使得信息安全问题进一步加剧,信息安全风险评估系统主要用于对信息安全进行评估,通过识别、衡量、分析风险,进而在评估的基础上有效控制风险。
中国专利CN116389171B《一种信息安全评估检测方法、系统、装置及介质》公开了一种信息安全评估检测方法,通过配置人员步骤、优化后风险值计算步骤,以及优化风险可接受度判断步骤的设置,降低优化网络系统时的成本,提高风险值的计算精度。然而该方法所采用的风险值仅通过测试网络系统一个维度的数据进行计算,而未考虑网络信息结构的多样性、网络信息安全风险存在的不确定性和复杂性,对信息安全评估的准确性不足。
发明内容
有鉴于此,本发明提出了一种信息系统的多维度安全评估方法,通过融合多维度特征,综合信息系统的多样性和网络信息安全风险的不确定性和复杂性,提高对信息系统安全性评估的准确度,解决了现有方法对信息安全评估的精度不足的问题。
本发明的技术方案是这样实现的:本发明提供了一种信息系统的多维度安全评估方法,包括以下步骤:
S1,获取信息系统中的多源数据,对多源数据进行预处理;
S2,根据多源数据对应的业务信息构建多源数据的关联矩阵,并将关联矩阵映射至低维向量空间得到多源数据的低维多样特征,根据低维多样特征计算信息系统的多样指标值;
S3,根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征进行特征融合,得到融合特征,以融合特征作为多源数据的附加特征,得到多源数据集;
S4,基于图神经网络模型及GRU网络构建信息系统安全评估模型,利用图神经网络模型对多源数据集进行表示学习,获取低维风险特征,将低维风险特征表示输入到GRU网络,根据低维风险特征和GRU网络计算信息系统的风险指标值;
S5,根据多样指标值和风险指标值对信息系统的信息安全进行评估。
优选的,步骤S1包括:
获取信息系统中的业务信息,根据业务类别对业务信息进行分类,得到多源数据,对多源数据进行预处理,所述预处理包括数据清洗、标准化和主成分分析。
优选的,步骤S2包括:
多源数据对应的业务信息包括用户输入数据和系统输出数据,根据用户输入数据和系统输出数据构建多源数据的关联矩阵A:
其中,i为用户输入数据的类别数量,j为系统输出数据的类别数量,aij为第i个用户输入数据与第j个系统输出数据的关联强度;
所述用户输入数据包括用户身份信息数据、用户登录状态数据、用户访问日志数据、用户故障记录数据,所述系统输出数据包括系统运行状态数据、系统安全事件数据、系统故障排除数据、系统修正日志数据。
优选的,步骤S2还包括:
多源数据的低维多样特征包括每个用户输入数据与多源数据的加权关联强度和每个系统输出数据与多源数据的加权关联强度;
将关联矩阵映射至低维向量空间得到每个用户输入数据与多源数据的加权关联强度和每个系统输出数据与多源数据的加权关联强度:
其中,为第i0个用户输入数据与多源数据的加权关联强度,/>为第j0个系统输出数据与多源数据的加权关联强度,σy为第i0个用户输入数据在所有用户输入数据中的数据量占比,σx为第j0个系统输出数据在所有系统输出数据中的数据量占比,1≤i0≤i,1≤j0≤j。
优选的,步骤S2还包括:
根据低维多样特征计算信息系统的多样指标值Q:
其中,为/>与/>的差异度函数,/>为第i0个用户输入数据的关联路径和系统输出数据的关联路径的集合,d(i0,j0)为第i0个用户输入数据与第j0个系统输出数据的欧式距离,A为多源数据的关联矩阵。
优选的,步骤S3包括:
根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征,所述多维度特征包括安全性特征、整体性特征、功能性特征、密保性特征和强制性特征;
对多维度特征进行特征融合得到融合特征,将安全信息的多维度特征进行特征融合得到融合特征,以融合特征作为多源数据的附加特征,得到多源数据集。
优选的,步骤S4包括:
S41,构建初始图神经网络模型及GRU网络,所述初始图神经网络模型基于GraphSAGE模型构建;
S42,通过大数据获取安全数据集,对安全数据集进行风险鉴定,将风险划分为训练集和验证集,根据训练集和验证集对初始图神经网络模型进行训练和验证,根据训练和验证的结果对初始图神经网络模型的超参数进行优化,训练和验证完成后得到优化后的图神经网络模型,根据图神经网络模型和GRU网络构建信息系统安全评估模型;
S43,将多源数据集输入至信息系统安全评估模型,通过图神经网络模型获取低维风险特征,将低维风险特征输入至GRU网络,根据低维风险特征和GRU网络计算信息系统的风险指标值。
优选的,步骤S42包括:
通过训练集对初始图神经网络模型进行迭代训练,配置优化器、损失函数和超参数,直至达到迭代停止条件,得到训练后的初始图神经网络模型,所述超参数包括总迭代次数、学习率、样本关联度;
利用验证集验证训练后的初始图神经网络模型,通过mAP值对模型进行模型评估,若模型评估达到要求,则训练和验证完毕,得到图神经网络模型,若模型评估未达到要求,则调整超参数后重新对模型进行迭代训练。
优选的,步骤S43包括:
将多源数据集GX输入至图神经网络模型,获取低维风险特征将低维风险特征输入至GRU网络得到信息系统的风险指标值V:
其中,为GRU网络的更新参数,⊙为Hadamard乘积,V0为预设风险阈值,tu为图神经网络模型收敛的时间。
优选的,步骤S5包括:
根据多样指标值和风险指标值综合对信息系统的安全进行评估:
其中,W为信息系统的安全评估值,Q为信息系统的多样指标值,V为信息系统的风险指标值,D1为信息系统的第一多样指标阈值,D2为信息系统的第二多样指标阈值,F1为信息系统的第一风险指标阈值,F2为信息系统的第二风险指标阈值,为信息系统在具备少数多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备少数多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备少数多源数据的同时处于危险风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于危险风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于危险风险等级的安全评估值。
本发明的一种信息系统的多维度安全评估方法相对于现有技术具有以下有益效果:
(1)通过综合考虑信息系统的多样性和风险程度,从多源数据的本身以及相关安全信息分别计算信息系统的多样指标值和风险指标值,综合两个指标的约束实现对信息系统的安全的精确评估;
(2)通过构建多源数据的关联矩阵,结合关联矩阵和关联强度计算信息系统的多样指标值,从而实现对信息系统的数据的多样性的度量;
(3)通过提取信息系统的安全信息的多维特征,将信息系统的多源数据转换为节点数据,结合图神经网络模型及GRU网络构建信息系统安全评估模型,计算信息系统的风险指标值,从而实现对对信息系统的数据的风险程度的衡量;
(4)结合多样指标值和风险指标值综合评估信息系统的安全等级,将信息系统的安全等级抽象定义并与多样性和风险程度两个指标相结合,从多维程度评判信息系统的安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种信息系统的多维度安全评估方法流程图;
图2为本发明的一种信息系统的多维度安全评估方法的数据处理流程图;
图3为本发明的一种信息系统的多维度安全评估方法的风险指标值求解流程图;
图4为本发明的一种信息系统的多维度安全评估方法的GraphSAGE图神经网络结构图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
提供一种信息系统的多维度安全评估方法,如图1所示,包括以下步骤:
S1,获取信息系统中的多源数据,对多源数据进行预处理;
S2,根据多源数据对应的业务信息构建多源数据的关联矩阵,并将关联矩阵映射至低维向量空间得到多源数据的低维多样特征,根据低维多样特征计算信息系统的多样指标值;
S3,根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征进行特征融合,得到融合特征,以融合特征作为多源数据的附加特征,得到多源数据集;
S4,基于图神经网络模型及GRU网络构建信息系统安全评估模型,利用图神经网络模型对多源数据集进行表示学习,获取低维风险特征,将低维风险特征表示输入到GRU网络,根据低维风险特征和GRU网络计算信息系统的风险指标值;
S5,根据多样指标值和风险指标值对信息系统的信息安全进行评估。
应说明的是:
信息系统根据不同业务要求会涉及到不同种类的信息类型,包含了多种多源数据。
本实施例中的多源数据可能与业务领域有关,如金融行业,数据类型可以包括客户交易记录、财务报表、市场数据等,医疗行业,数据类型可以包括患者病历、医疗图像、药物信息等,零售行业,数据类型可以包括产品销售数据、库存信息、客户购买历史等,制造业,数据类型可以包括生产过程数据、设备状态、供应链信息等,科技行业,数据类型可以包括研发数据、技术文档、知识产权等;
多源数据也可能根据用户类型分类,如客户信息,数据类型可以包括个人信息、购买历史、偏好等,员工信息,数据类型可以包括员工档案、薪资信息、培训记录等,合作伙伴信息,数据类型可以包括供应商信息、合同数据、合作历史等;
还可能根据信息来源分类,如内部数据,数据类型可以包括业务数据、员工数据,外部数据,数据类型可以包括市场数据、供应链数据,社交媒体数据,数据类型可以包括评论、分享,传感器数据,数据类型可以包括通过物联网设备、传感器等采集的实时数据;
根据信息性质分类,如结构化信息,数据类型可以包括表格数据,半结构化信息,数据类型可以包括XML、JSON等格式的数据,非结构化信息,数据类型可以包括文本、图像、音频、视频等;
根据信息机密性分类,如公开信息,数据类型可以包括可以在公共领域访问的信息,内部信息,数据类型可以包括公司内部使用,对外不公开的信息,机密信息,数据类型可以包括具有较高敏感性,需要特定权限才能访问的信息;
根据信息生命周期分类,如实时数据,即时生成和更新的数据,通常用于实时监控和决策,历史数据,过去一段时间内的数据,用于分析趋势和模式,归档数据,长时间不再主动使用的数据,但仍需保留的数据。
因此信息系统的信息种类繁多,从各方各面去评估信息系统的安全所涉及到的数据量过于庞大,本实施例中主要从信息系统的多样性和风险性综合评估信息系统的信息安全等级。
为了从多维度评估多样性,本实施例采用关联矩阵在多样性的基础上加入关联强度的约束,从而使多样性在其考虑数据多样差异的基础上,还进一步关注数据与其他数据之间的关联强度,从而增强数据粘性。
在评估多样性后提取信息系统的安全信息特征,将安全信息通知进行特征融合然后作为多源数据的附加特征,根据多源数据和附加特征构成多源数据集,弥补了多源数据中安全信息占比不多的缺陷,提高安全信息特征占比,然后评估数据的风险指标。
仅从风险指标评估信息系统的安全是不客观的,因为随着信息系统的数据量、种类的增大或减少,信息系统对于安全等级的尺度也是不一样的,因此本实施例中将多样指标和风险指标作为双重约束,同时界定信息系统的安全等级。
如图2所示,是本发明的数据处理流程图,通过分别对多源数据进行不同的处理得到多维度的多样指标值和风险指标值,最后根据多样指标值和风险指标值得到安全评估值,实现对信息系统的多维度安全评估。
步骤S1包括:
获取信息系统中的业务信息,根据业务类别对业务信息进行分类,得到多源数据,对多源数据进行预处理,所述预处理包括数据清洗、标准化和主成分分析。
应说明的是:
本实施例中,主要根据业务类别对信息系统的业务信息进行分类,得到多源数据,主要关注的是不同行业领域之间的差异,对多源数据进行预处理,如数据清洗、标准化和主成分分析等,本实施例采用常见的数据清洗方法,通过缺失值处理删除包括有缺失值的数据或者通过数据插补来填充缺失值,通过识别处理异常错误的极端值,该步要通过统计方法、可视化方法或专业知识来判断,然后进行数据去重步骤,删除多源数据中重复记录的数据,确保各数据唯一。
步骤S2包括:
多源数据对应的业务信息包括用户输入数据和系统输出数据,根据用户输入数据和系统输出数据构建多源数据的关联矩阵A:
其中,i为用户输入数据的类别数量,j为系统输出数据的类别数量,aij为第i个用户输入数据与第j个系统输出数据的关联强度;
所述用户输入数据包括用户身份信息数据、用户登录状态数据、用户访问日志数据、用户故障记录数据,所述系统输出数据包括系统运行状态数据、系统安全事件数据、系统故障排除数据、系统修正日志数据。
应说明的是:
本实施例中将业务信息中提取到的多源数据划分为用户输入信息系统的用户输入数据,以及信息系统接收到用户输入数据之后经过处理、反馈之后所输出的系统输出数据。
用户输入数据可以包括用户身份信息数据、用户登录状态数据、用户访问日志数据、用户故障记录数据等,主要用于体现用户输入的客观上固定的数据,都是用户唯一确定的代表身份ID的数据,属于静态数据;
系统输出数据可以包括系统运行状态数据、系统安全事件数据、系统故障排除数据、系统修正日志数据等,主要用于体现系统根据用户的输入而运算处理后得到的主观上变化的数据,是系统为用户界定的代表用户操作的数据,属于动态数据。
本实施例中根据用户输入数据和系统输出数据构建关联矩阵,矩阵元素为用户输入数据与系统输出数据的关联强度,因此,该关联矩阵包括了数据的多样性以及在多样性基础上的关联强度约束,与一般仅通过数据多源衡量多样性的方案相比,本实施例的多样指标不局限于一维层面,通过关联强度将多源数据划分为两大类,进而构成三维层面的关联矩阵,提高了多样指标对多样性评估得精度。
步骤S2还包括:
多源数据的低维多样特征包括每个用户输入数据与多源数据的加权关联强度和每个系统输出数据与多源数据的加权关联强度;
将关联矩阵映射至低维向量空间得到每个用户输入数据与多源数据的加权关联强度和每个系统输出数据与多源数据的加权关联强度:
其中,为第i0个用户输入数据与多源数据的加权关联强度,/>为第j0个系统输出数据与多源数据的加权关联强度,σy为第i0个用户输入数据在所有用户输入数据中的数据量占比,σx为第j0个系统输出数据在所有系统输出数据中的数据量占比,1≤i0≤i,1≤j0≤j。
应说明的是:
根据用户输入数据和系统输出数据两个大类别的划分,分别计算每个用户输入数据与多源数据整体的加权关联强度,以及每个系统输出数据与多源数据整体的加权关联强度。每个用户输入数据的关联强度通过计算该用户输入数据与其他所有系统输出数据的关联强度之和与所有用户输入数据和所有系统输出数据的比值来表示,每个系统输出数据的关联强度通过计算该系统输出数据与其他所有用户输入数据的关联强度之和与所有系统输出数据和所有用户输入数据的比值来表示,即与本实施例的加权关联强度相比少了数据量占比。而本实施例中之所以引入σy和σx,是为了降低单个用户输入数据或系统输出数据的数据量在该用户输入数据或系统输出数据的关联强度中的比重,尽管预处理时对数据进行了去重操作,但根据用户输入数据和系统输出数据两个大类别的划分,会存在一些属于同类别但并非完全相同的数据,所以使用和/>来代表第i0个用户输入数据与多源数据的加权关联强度,以及第j0个系统输出数据与多源数据的加权关联强度,为后面计算信息系统的多样指标值做准备。
步骤S2还包括:
根据低维多样特征计算信息系统的多样指标值Q:
其中,为/>与/>的差异度函数,/>为第i0个用户输入数据的关联路径和系统输出数据的关联路径的集合,d(i0,j0)为第i0个用户输入数据与第j0个系统输出数据的欧式距离,A为多源数据的关联矩阵。
应说明的是:
本实施例中通过差异度函数计算数据的差异度,该差异度函数基于基因术语间语义相似度计算方法改进而来,基因术语间语义相似度方法适用于两个节点间的差异度计算,将多源数据的关联矩阵A作为基因集,本实施例中通过/>和/>分别表示第i0个用户输入数据与多源数据的加权关联强度,以及第j0个系统输出数据与多源数据的加权关联强度后,将用户输入数据的关联强度以及系统输出数据的关联强度从多维数据转换为了点值数据,从而计算用户输入数据和系统输出数据之间的差异度,/>为第i0个用户输入数据的关联路径和系统输出数据的关联路径的集合,d(i0,j0)为第i0个用户输入数据与第j0个系统输出数据的欧式距离,通过将用户输入数据和系统输出数据之间的差异度分散到关联路径和和欧式距离的维度上,定义为信息系统的多样指标值,通过该多样指标值衡量信息系统的多样性,综合考虑了用户输入数据、系统输出数据、关联强度、关联路径和数据空间距离,弥补了仅从数据种类多源考虑数据多样性所带来的局限性。
步骤S3包括:
根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征,所述多维度特征包括安全性特征、整体性特征、功能性特征、密保性特征和强制性特征;
对多维度特征进行特征融合得到融合特征,将安全信息的多维度特征进行特征融合得到融合特征,以融合特征作为多源数据的附加特征,得到多源数据集。
应说明的是:
对信息系统提取安全信息特征的多维度特征,如安全性特征、整体性特征、功能性特征、密保性特征和强制性特征,采用基于决策树的方法,构建一个多层次的决策树来考虑不同特征的组合情况,对应五个层次的多维度特征,最终融合得到低维向量,作为融合特征,将该融合特征添加到多源数据中,构成多源数据与融合特征的映射,组成多源数据集,提高多源数据的安全信息比重,形成邻居节点,为计算风险指标做准备。
如图3所示,步骤S4包括:
S41,构建初始图神经网络模型及GRU网络,所述初始图神经网络模型基于GraphSAGE模型构建;
S42,通过大数据获取安全数据集,对安全数据集进行风险鉴定,将风险划分为训练集和验证集,根据训练集和验证集对初始图神经网络模型进行训练和验证,根据训练和验证的结果对初始图神经网络模型的超参数进行优化,训练和验证完成后得到优化后的图神经网络模型,根据图神经网络模型和GRU网络构建信息系统安全评估模型;
S43,将多源数据集输入至信息系统安全评估模型,通过图神经网络模型获取低维风险特征,将低维风险特征输入至GRU网络,根据低维风险特征和GRU网络计算信息系统的风险指标值。
应说明的是:
如图4所示,本实施例中采用邻居采样图神经网络模型GraphSAGE,该模型采用归纳式的节点学习方法,通过节点邻居采样的方式,有效解决传统图卷积算法内存占用较大的问题。图中A1为二跳邻居节点,A2为一跳邻居节点,A3为目标节点,通过对邻居节点随机采样,从而实现降低计算复杂度,生成目标节点。先聚合二跳邻居特征,生成一跳邻居,再聚合一跳邻居,生成目标节点,从而获得二跳邻居信息,将二跳邻居信息作为全连接层的输入,预测目标节点的低维风险特征。
该模型通过学习一个聚合函数来产生节点的特征表示,由于本实施例中所针对的多源数据集实际上并非是节点数据,因此加入融合之后的多维度的安全信息特征构成邻居节点。经过邻居采样图神经网络模型GraphSAGE处理得到低维风险特征后,再通过GRU网络对低维风险特征进行更新,由于本实施例中的低维风险特征序列较短,所以采用GRU网络,对于较长序列,采用LSTM亦可。
步骤S42包括:
通过训练集对初始图神经网络模型进行迭代训练,配置优化器、损失函数和超参数,直至达到迭代停止条件,得到训练后的初始图神经网络模型,所述超参数包括总迭代次数、学习率、样本关联度;
利用验证集验证训练后的初始图神经网络模型,通过mAP值对模型进行模型评估,若模型评估达到要求,则训练和验证完毕,得到图神经网络模型,若模型评估未达到要求,则调整超参数后重新对模型进行迭代训练。
应说明的是:
迭代停止条件为损失函数收敛或达到总迭代次数,通过mAP值对模型进行评估,mAP值对计算方式为:
其中,b为多源数据集节点数,R(c)为当前位置召回率,R(c+1)为下一位置召回率,precision为当前位置和下一位置的准确率;
规定以下参数,
TP:被正确分类为正样本的数量;实际是正样本,也被模型分类为正样本;
FP:被错误分类为正样本的数量;实际是负样本,但被模型分类为正样本;
TN:被正确分类为负样本的数量;实际是负样本,也被模型分类为负样本;
FN:被错误分类为负样本的数量;实际是正样本,但被模型分类为负样本;
准确率Precision=TP/(TP+FP),召回率Recall=TP/(TP+FN);
将每一种类型的Precision和Recall分别作为横纵轴,求AP值实际等同于求Precision和Recall围成的面积,由于组成的曲线区域抖动的非常厉害,这里使用插值的方式将曲线区域进行平滑操作。若当前的recall值为R(c),插值为与下一位置recall为R(c+1)之间的Precision最大值。其中c表示当前位置。mAP值为所有类型的AP值取平均,这里的b表示的是多源数据集节点数。
步骤S43包括:
将多源数据集GX输入至图神经网络模型,获取低维风险特征将低维风险特征输入至GRU网络得到信息系统的风险指标值V:
其中,为GRU网络的更新参数,⊙为Hadamard乘积,V0为预设风险阈值,tu为图神经网络模型收敛的时间。
应说明的是:
Gated RecurrentUnit(GRU)是一种循环神经网络(RNN)的变体,用于处理序列数据。与传统的RNN相比,GRU引入了门控机制,可以更有效地捕捉序列中的长期依赖关系。
GRU的效果通常在以下几个方面得到改进:
GRU是对LSTM的简化版本,减少了LSTM的参数数量,使得模型更容易训练。LSTM和GRU都具有处理序列数据中的长期依赖关系的能力,但GRU对于序列较短的参数更有效;通过引入更新门和重置门,GRU减轻了传统RNN中的梯度消失问题;由于GRU的参数较少,它通常比LSTM更轻量级。尽管对序列的建模能力可能相对较弱,但本实施例中仅使用GRU对邻居采样图神经网络模型GraphSAGE输出到低维风险特征进行更新与重置,不需要重新建模。
通过Hadamard乘积和GRU网络的更新参数,根据邻居采样图神经网络模型GraphSAGE收敛得到低维风险特征所花费的时间tu求取风险指标值,该风险指标值实际上是衡量信息系统的安全信息所包含数据的复杂度和更新重置的难度,从而作为信息系统的风险指标。
步骤S5包括:
根据多样指标值和风险指标值综合对信息系统的安全进行评估:
其中,W为信息系统的安全评估值,Q为信息系统的多样指标值,V为信息系统的风险指标值,D1为信息系统的第一多样指标阈值,D2为信息系统的第二多样指标阈值,F1为信息系统的第一风险指标阈值,F2为信息系统的第二风险指标阈值,为信息系统在具备少数多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备少数多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备少数多源数据的同时处于危险风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于危险风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于危险风险等级的安全评估值。
应说明的是:
本实施例中,通过多样指标值和风险指标值两个度量参数来对信息系统的安全等级进行同时约束,主要基于多样指标值的三个等级以及风险指标值的三个等级来决定,Q为信息系统的多样指标值,V为信息系统的风险指标值,D1为信息系统的第一多样指标阈值,D2为信息系统的第二多样指标阈值,F1为信息系统的第一风险指标阈值,F2为信息系统的第二风险指标阈值。
当Q≤D1时,其含义为不大于第一多样指标阈值的多样指标值对应的信息系统的数据是不够多元化的,即种类较少,而种类较少的信息系统,其对应的信息复杂度就偏低;
当D1<Q<D2时,其含义为介于第一多样指标阈值和第二多样指标阈值的多样指标值对应的信息系统的数据涵盖率正常,种类跟一般信息系统相符,对应复杂度在正常范畴,
当Q≥D2时,其含义为不小于第二多样指标阈值的多样指标值对应的信息系统的数据的种类繁多,涵盖了常见的所有的数据以及一些常见的信息系统所不具备的数据,其对应的复杂度较高。
当V≤F1时,其含义为不大于第一风险指标阈值的风险指标值对应的信息系统的数据的风险很低,几乎没有,即不太需要安全防护的信息系统;
当F1<V<F2时,其含义为介于第一风险指标阈值和第二风险指标阈值的风险指标值对应的信息系统的数据的风险适中,存在较常规的安全隐患,即需要一般安全防护的信息系统;
当V≥F2时,其含义为不小于第二风险指标阈值的风险指标值对应的信息系统的数据的风险很高,存在较多严重的漏洞,即需要进行严密安全防护的信息系统。
而将两个指标结合共同约束信息系统时,当Q≤D1且V≤F1时,信息系统的安全评估值W为即该信息系统在具备少数多源数据的同时处于安全无风险等级的安全评估值;当Q≤D1且F1<V<F2时,信息系统的安全评估值W为/>即信息系统在具备少数多源数据的同时处于中等风险等级的安全评估值;当Q≤D1且V≥F2时,信息系统的安全评估值W为/>即信息系统在具备少数多源数据的同时处于危险风险等级的安全评估值;当D1<Q<D2且V≤F1时,信息系统的安全评估值W为/>即信息系统在具备中等数量多源数据的同时处于安全无风险等级的安全评估值;当D1<Q<D2且F1<V<F2时,信息系统的安全评估值W为即信息系统在具备中等数量多源数据的同时处于中等风险等级的安全评估值;当D1<Q<D2且V≥F2时,信息系统的安全评估值W为/>即信息系统在具备中等数量多源数据的同时处于危险风险等级的安全评估值;当Q≥D2且V≤F1时,信息系统的安全评估值W为/>即信息系统在具备多数多源数据的同时处于安全无风险等级的安全评估值;当Q≥D2且F1<V<F2时,信息系统的安全评估值W为/>即信息系统在具备多数多源数据的同时处于中等风险等级的安全评估值;当Q≥D2且V≥F2时,信息系统的安全评估值W为/>信息系统在具备多数多源数据的同时处于危险风险等级的安全评估值。
本实施例中,根据求解可得多样指标值的范围在0.3-0.9之间,因此D1、D2分别取值为0.5和0.7,将多样指标值均分为三个等级;而风险评估值的范围在0.1-0.7之间,因此F1、F2分别取值为0.3和0.5,同样将多样指标值均分为三个等级,需要说明的是,最后得到的信息系统的安全评估值,其实质上并非一个具体的值,而是根据多样指标值和风险指标值的限定下对信息系统的安全等级的一个抽象定义。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种信息系统的多维度安全评估方法,其特征在于,包括以下步骤:
S1,获取信息系统中的多源数据,对多源数据进行预处理;
S2,根据多源数据对应的业务信息构建多源数据的关联矩阵,并将关联矩阵映射至低维向量空间得到多源数据的低维多样特征,根据低维多样特征计算信息系统的多样指标值;
S3,根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征进行特征融合,得到融合特征,以融合特征作为多源数据的附加特征,得到多源数据集;
S4,基于图神经网络模型及GRU网络构建信息系统安全评估模型,利用图神经网络模型对多源数据集进行表示学习,获取低维风险特征,将低维风险特征表示输入到GRU网络,根据低维风险特征和GRU网络计算信息系统的风险指标值;
S5,根据多样指标值和风险指标值对信息系统的信息安全进行评估。
2.如权利要求1所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S1包括:
获取信息系统中的业务信息,根据业务类别对业务信息进行分类,得到多源数据,对多源数据进行预处理,所述预处理包括数据清洗、标准化和主成分分析。
3.如权利要求1所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S2包括:
多源数据对应的业务信息包括用户输入数据和系统输出数据,根据用户输入数据和系统输出数据构建多源数据的关联矩阵A:
其中,i为用户输入数据的类别数量,j为系统输出数据的类别数量,aij为第i个用户输入数据与第j个系统输出数据的关联强度;
所述用户输入数据包括用户身份信息数据、用户登录状态数据、用户访问日志数据、用户故障记录数据,所述系统输出数据包括系统运行状态数据、系统安全事件数据、系统故障排除数据、系统修正日志数据。
4.如权利要求3所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S2还包括:
多源数据的低维多样特征包括每个用户输入数据与多源数据的加权关联强度和每个系统输出数据与多源数据的加权关联强度;
将关联矩阵映射至低维向量空间得到每个用户输入数据与多源数据的加权关联强度和每个系统输出数据与多源数据的加权关联强度:
其中,为第i0个用户输入数据与多源数据的加权关联强度,/>为第j0个系统输出数据与多源数据的加权关联强度,σy为第i0个用户输入数据在所有用户输入数据中的数据量占比,σx为第j0个系统输出数据在所有系统输出数据中的数据量占比,1≤i0≤i,1≤j0≤j。
5.如权利要求4所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S2还包括:
根据低维多样特征计算信息系统的多样指标值Q:
其中,为/>与/>的差异度函数,/>为第i0个用户输入数据的关联路径和系统输出数据的关联路径的集合,d(i0,j0)为第i0个用户输入数据与第j0个系统输出数据的欧式距离,A为多源数据的关联矩阵。
6.如权利要求1所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S3包括:
根据多源数据对信息系统中的安全信息特征进行提取,获取安全信息的多维度特征,所述多维度特征包括安全性特征、整体性特征、功能性特征、密保性特征和强制性特征;
对多维度特征进行特征融合得到融合特征,将安全信息的多维度特征进行特征融合得到融合特征,以融合特征作为多源数据的附加特征,得到多源数据集。
7.如权利要求1所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S4包括:
S41,构建初始图神经网络模型及GRU网络,所述初始图神经网络模型基于GraphSAGE模型构建;
S42,通过大数据获取安全数据集,对安全数据集进行风险鉴定,将风险划分为训练集和验证集,根据训练集和验证集对初始图神经网络模型进行训练和验证,根据训练和验证的结果对初始图神经网络模型的超参数进行优化,训练和验证完成后得到优化后的图神经网络模型,根据图神经网络模型和GRU网络构建信息系统安全评估模型;
S43,将多源数据集输入至信息系统安全评估模型,通过图神经网络模型获取低维风险特征,将低维风险特征输入至GRU网络,根据低维风险特征和GRU网络计算信息系统的风险指标值。
8.如权利要求7所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S42包括:
通过训练集对初始图神经网络模型进行迭代训练,配置优化器、损失函数和超参数,直至达到迭代停止条件,得到训练后的初始图神经网络模型,所述超参数包括总迭代次数、学习率、样本关联度;
利用验证集验证训练后的初始图神经网络模型,通过mAP值对模型进行模型评估,若模型评估达到要求,则训练和验证完毕,得到图神经网络模型,若模型评估未达到要求,则调整超参数后重新对模型进行迭代训练。
9.如权利要求8所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S43包括:
将多源数据集GX输入至图神经网络模型,获取低维风险特征将低维风险特征输入至GRU网络得到信息系统的风险指标值V:
其中,为GRU网络的更新参数,⊙为Hadamard乘积,V0为预设风险阈值,tu为图神经网络模型收敛的时间。
10.如权利要求1所述的一种信息系统的多维度安全评估方法,其特征在于,步骤S5包括:
根据多样指标值和风险指标值综合对信息系统的安全进行评估:
其中,W为信息系统的安全评估值,Q为信息系统的多样指标值,V为信息系统的风险指标值,D1为信息系统的第一多样指标阈值,D2为信息系统的第二多样指标阈值,F1为信息系统的第一风险指标阈值,F2为信息系统的第二风险指标阈值,为信息系统在具备少数多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备少数多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备少数多源数据的同时处于危险风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于安全无风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备中等数量多源数据的同时处于危险风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于安全无风险等级的安全评估值,为信息系统在具备多数多源数据的同时处于中等风险等级的安全评估值,/>为信息系统在具备多数多源数据的同时处于危险风险等级的安全评估值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410083819.2A CN117857202A (zh) | 2024-01-19 | 2024-01-19 | 一种信息系统的多维度安全评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410083819.2A CN117857202A (zh) | 2024-01-19 | 2024-01-19 | 一种信息系统的多维度安全评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117857202A true CN117857202A (zh) | 2024-04-09 |
Family
ID=90539900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410083819.2A Pending CN117857202A (zh) | 2024-01-19 | 2024-01-19 | 一种信息系统的多维度安全评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117857202A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110943983A (zh) * | 2019-11-22 | 2020-03-31 | 南京邮电大学 | 基于安全性态势感知与风险评估的网络安全预防方法 |
US20220201008A1 (en) * | 2020-12-21 | 2022-06-23 | Citrix Systems, Inc. | Multimodal modelling for systems using distance metric learning |
CN114676458A (zh) * | 2022-03-24 | 2022-06-28 | 浙江大学 | 一种面向预训练语言模型隐私泄露风险的评估方法及系统 |
CN117220978A (zh) * | 2023-09-26 | 2023-12-12 | 广州云峰信息科技有限公司 | 一种网络安全运营模型量化评估系统及评估方法 |
-
2024
- 2024-01-19 CN CN202410083819.2A patent/CN117857202A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110943983A (zh) * | 2019-11-22 | 2020-03-31 | 南京邮电大学 | 基于安全性态势感知与风险评估的网络安全预防方法 |
US20220201008A1 (en) * | 2020-12-21 | 2022-06-23 | Citrix Systems, Inc. | Multimodal modelling for systems using distance metric learning |
CN114676458A (zh) * | 2022-03-24 | 2022-06-28 | 浙江大学 | 一种面向预训练语言模型隐私泄露风险的评估方法及系统 |
CN117220978A (zh) * | 2023-09-26 | 2023-12-12 | 广州云峰信息科技有限公司 | 一种网络安全运营模型量化评估系统及评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yan et al. | Fair class balancing: Enhancing model fairness without observing sensitive attributes | |
US20200382536A1 (en) | Anomaly detection in cybersecurity and fraud applications | |
US20230289665A1 (en) | Failure feedback system for enhancing machine learning accuracy by synthetic data generation | |
US20200379868A1 (en) | Anomaly detection using deep learning models | |
Hort et al. | Fairea: A model behaviour mutation approach to benchmarking bias mitigation methods | |
US20170018030A1 (en) | System and Method for Determining Credit Worthiness of a User | |
US20220114399A1 (en) | System and method for machine learning fairness testing | |
US20170032270A1 (en) | Method for predicting personality trait and device therefor | |
Farcomeni et al. | Robust estimation for the Cox regression model based on trimming | |
CN105516152B (zh) | 异常行为检测方法 | |
CN109829721B (zh) | 基于异质网络表征学习的线上交易多主体行为建模方法 | |
CN109242250A (zh) | 一种基于模糊熵权法与云模型的用户行为可信度检测方法 | |
WO2019200739A1 (zh) | 数据欺诈识别方法、装置、计算机设备和存储介质 | |
CN110675069B (zh) | 地产行业客户签约风险预警方法、服务器及存储介质 | |
Xu et al. | Structural damage detection by integrating robust PCA and classical PCA for handling environmental variations and imperfect measurement data | |
Abdillah et al. | Failure prediction of e-banking application system using Adaptive Neuro Fuzzy Inference System (ANFIS) | |
CN117094184B (zh) | 基于内网平台的风险预测模型的建模方法、系统及介质 | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
Li et al. | Probabilistic outlier detection for robust regression modeling of structural response for high-speed railway track monitoring | |
CN117370548A (zh) | 用户行为风险识别方法、装置、电子设备及介质 | |
Schwee et al. | Anonymizing building data for data analytics in cross-organizational settings | |
CN117857202A (zh) | 一种信息系统的多维度安全评估方法 | |
Thiprungsri | Cluster analysis for anomaly detection in accounting data | |
CN114547640A (zh) | 涉敏操作行为判定方法、装置、电子设备及存储介质 | |
KR20220022393A (ko) | 위약고객을 검출하는 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |