CN114116957A - 一种基于知识图谱的电磁信息泄漏智能分析方法 - Google Patents
一种基于知识图谱的电磁信息泄漏智能分析方法 Download PDFInfo
- Publication number
- CN114116957A CN114116957A CN202110362783.8A CN202110362783A CN114116957A CN 114116957 A CN114116957 A CN 114116957A CN 202110362783 A CN202110362783 A CN 202110362783A CN 114116957 A CN114116957 A CN 114116957A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- electromagnetic information
- information safety
- electromagnetic
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 42
- 231100000279 safety data Toxicity 0.000 claims abstract description 28
- 238000013135 deep learning Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims description 36
- 239000003795 chemical substances by application Substances 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000003745 diagnosis Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 230000008439 repair process Effects 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 7
- 238000001514 detection method Methods 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 12
- 238000012360 testing method Methods 0.000 description 12
- 238000011160 research Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000005670 electromagnetic radiation Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种基于知识图谱的电磁信息泄漏智能分析方法,具体包括如下步骤:S1、构建电磁信息安全知识图谱;S2、基于所述电磁信息安全知识表达,对电磁信息安全知识进行抽取;S3、基于所述多数据源的电磁信息安全数据,对电磁信息安全知识进行融合;S4、基于所述电磁信息安全知识图谱,对电磁信息安全数据进行知识推理;S5、基于知识推理,自动对电磁信息安全的分析和处理进行演进优化。本发明能够支持多种类型数据,保证了所构建知识图谱数据的充分程度;本发明提出的多层可并行的知识推理框架可得到具有较强可解释性和可靠性的结果;本发明基于深度学习和再学习方法,不断地智能优化知识图谱,以此适应未来电磁信息泄漏的更新发展。
Description
技术领域
本发明属于知识图谱技术领域,特别是涉及一种基于知识图谱的电磁信息泄漏智能分析方法。
背景技术
随着信息技术的飞速发展,计算机已广泛应用于安全机构、机密部门以及银行、金融等重要机构和企业。在工作过程中,计算机及外部设备不可避免地会产生电磁辐射波,而电磁辐射波经常“夹带”有用的信息,从而导致信息泄漏。
相关研究数据表明,目前技术已经能对1000米以外的计算机进行电磁辐射信息的接收和再发。攻击者可以通过这种方式及时、连续地获得隐蔽信息,引发信息安全问题。因此,防止计算机电磁信息泄漏已成为当务之急,研究和掌握有效的电磁信息泄漏防护措施尤为重要。
目前电磁信息泄漏的检测分析方法主要有两种。第一种方法是通过基于数学和物理的理论推导,分析得到电磁信息泄漏的范围、内容等信息。另一种检测方法则是根据泄漏的电磁信息类型(辐射、电磁波等)的不同,从多个层次对电磁信息泄漏进行分析,进而实现电磁信息泄漏检测和防护。
但是这些传统检测与分析方法已难以适应电磁信息泄漏问题的变化和发展。电磁信息泄漏的存在形式是微弱的电磁信号,泄漏的信号容易受电磁环境、被测目标工作状态、检测仪器以及人工操作等多种客观和主观条件因素影响。传统检测方法依赖工程人员的检测经验,在检测过程中,面对不同的上述主客观条件因素,需要重新人工拟定检测分析方案。因此,传统方法的适应性不足,缺乏智能化检测能力,难以应对电磁信息泄漏的变化和发展。
因此,寻找一种高效的电磁信息泄漏智能分析方法进行辅助分析成为研究人员关注的问题。
发明内容
为了解决上述技术问题,提供一种基于知识图谱的电磁信息泄漏智能分析方法,采用知识图谱技术,基于电磁测试标准,结合电磁信息安全领域专家知识和电磁信息泄漏实测数据,综合利用有监督、无监督和弱监督学习等人工智能方法,通过信息抽取、知识融合、知识加工等过程逐步构建电磁信息安全知识图谱,以支持电磁信息泄漏的智能分析与检测。
具体包括如下步骤:
S1、基于多数据源的电磁信息安全数据支持,建立电磁信息安全知识表达;并基于电磁信息安全知识抽取、电磁信息安全知识融合和所述电磁信息安全知识表达,构建电磁信息安全知识图谱;
S2、基于所述电磁信息安全知识表达,对电磁信息安全知识进行抽取;
S3、基于所述多数据源的电磁信息安全数据,对电磁信息安全知识进行融合;
S4、基于所述电磁信息安全知识图谱,对电磁信息安全数据进行知识推理;
S5、基于知识推理,自动对电磁信息安全的分析和处理进行演进优化。
优选地,所述电磁信息安全知识表达包括结构化数据、非结构化数据、半结构化数据;所述电磁信息安全知识抽取包括实体抽取、关系抽取、属性抽取;所述电磁信息安全知识融合包括实体对齐、实体消歧、关系修正。
优选地,所述步骤S2具体为:
对所述电磁信息安全知识表达的非结构化数据和半结构化数据进行实体抽取和关系抽取,采用基于深度学习的远程监督方法,在电磁信息安全数据中加入注意力机制,给不同的非结构化及半结构化数据赋予不同的权重。
优选地,所述步骤S3具体为:
S31、对所述多数据源的电磁信息安全数据进行预处理,形成统一的数据表示;
S32、利用多视图方法分别从不同角度提取所述多数据源的电磁信息安全数据的特征,结合多数据源特征计算各视图的权值,通过多视图模型形成电磁信息安全实体的多维加权特征表示;
S33、利用层次聚类算法,通过实体之间的相似度匹配,自底向上逐层聚合,完成实体对齐任务。
优选地,所述步骤S4具体为:
S41、将电磁信息安全知识按照信息类别的不同划分为若干个子类别;
S42、将每个子类别分别形成具有知识推理能力的推理智能体;
S43、综合各个所述推理智能体的推理知识,形成符合目标需求的综合推理智能体;
S44、对所述各个推理智能体进行诊断和修复分析;
S45、对所述各个智能体并行执行知识推理过程,将结果汇总到综合推理智能体中;
S46、由综合推理智能体完成最终的综合知识推理,得到电磁信息泄漏诊断,并给出防护方案。
优选地,所述步骤S44具体为:
抽取符合目标需求的电磁知识安全信息,并依据信息类别进行划分,将划分后的电磁知识安全信息分别输入相关的推理智能体中进行诊断和修复分析。
优选地,所述推理智能体是以所述电磁信息安全知识图谱为基础,通过深度学习方法训练形成的具有电磁信息安全知识推理能力的神经网络模型,从构成知识图谱的基本元素三元组出发,采用递归神经网络,基于多跳关系进行知识推理;
优选地,所述三元组利用RNN对实体和关系上下文信息的深度学习能力,在任意长度路径中将隐含的实体关系组合起来;然后在每个路径的组合步骤中,利用下一跳关系的嵌入向量,以及表示从起始到目前实体为止的多跳路径的向量,组合成一个输出向量作为下一个步骤的输入;在使用多跳路径之后,采用RNN在路径的第一个实体和最后一个实体之间输出一个关系向量,使得该向量包含整个路径上所有关系的信息。
优选地,采用基于深度学习和再学习的技术路线,围绕知识图谱的自动演进,构建具备自动演进优化能力的智能化电磁信息安全分析和处理技术架构;
所述演进优化的驱动包括新增的电磁信息安全数据、第三方电磁信息安全知识库、知识图谱内在知识的更新。
本发明的有益效果在于:
本发明基于传统技术和方法的思想进行创新与推广,能够支持多种类型数据,保证了所构建知识图谱数据的充分程度。本发明提出的多层可并行的知识推理框架可得到具有较强可解释性和可靠性的结果。此外,本发明基于深度学习和再学习方法,不断地智能优化知识图谱,以此适应未来电磁信息泄漏的更新发展。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明电磁信息泄漏知识图谱基本关系图;
图2为本发明电磁信息安全测试信息映射为知识图谱三元组示例图;
图3为本发明电磁信息安全领域知识图谱构建流程图;
图4为本发明基于注意力机制的电磁信息安全实体关系抽取图;
图5为本发明电磁信息安全检测的知识推理过程图;
图6为本发明智能化电磁信息安全分析和处理技术架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
S1、构建电磁信息安全知识图谱;
电磁信息安全知识图谱构建的核心在于:通过人工智能理解电磁信息安全的知识,建立电磁信息泄漏到知识图谱中实体、关系、属性的映射;并利用人工智能解释电磁信息泄漏的现象,基于知识图谱中实体、关系、属性解释电磁信息泄漏现象的过程路径;在理解电磁信息泄漏机理的基础上去解释电磁信息安全现象,形成具备认知智能的电磁信息安全分析和处理手段。
参照图1所示,为电磁信息泄漏知识图谱基本关系图。知识图谱的构建从电磁信息泄漏的产生过程出发,将其映射为基本的知识图谱三元组。
将泄漏源和接收装置作为知识图谱三元组中一对核心实体,二者基于泄漏路径建立实体间的关系。以电磁信息泄漏机理关系图为基础,逐步扩展知识图谱节点。
参照图2所示,为电磁信息安全测试信息映射为知识图谱三元组示例图。通过抽取电磁信息泄漏测试项目作为电磁信息安全知识图谱中的实体,测试项目的适用范围、限值、测试设备、测试配置等相关信息作为实体的属性,从而实现知识图谱的映射。
本发明通过建立泄漏源、检测方法、接收设备、限值等电磁信息泄漏检测过程到知识图谱中实体、关系、属性的映射,将电磁信息泄漏检测的各要素及其之间的相互作用关系抽取并以图谱的方式记录并存储,便于梳理和分析复杂环境下的电磁信息安全情况,从中发掘隐藏的逻辑关联,也使得人工智能理解电磁信息安全成为可能。基于知识图谱中实体、关系、属性的映射,进行电磁信息安全知识推理,解释电磁信息泄漏现象的产生、泄漏源和敏感设备之间的互相作用、辐射发射测试、传导发射测试等电磁信息安全分析和处理的过程路径,进而实现电磁信息泄漏检测。
以上为理想状态下电磁信息安全知识图谱构建的基本思路,其需要基于结构化的电磁信息安全数据的支撑。但在实际应用中,将面临的不仅是结构化数据,还会有大量的非结构化和半结构化数据需要融入知识图谱。因此,需要对获取的数据进行判别和处理。
参照图3所示,电磁信息安全领域知识图谱构建流程图。
本发明拟构建电磁信息安全领域知识图谱的结构化实体和关系,尤其是对大规模的知识库,需要多种技术的支持。其中,最重要的就是电磁信息安全知识表达、电磁信息安全知识抽取、电磁信息安全知识融合三个步骤,电磁信息安全知识表达通过人工智能理解电磁信息安全的知识,需要来自电磁信息安全标准、规则、领域专家知识、测试等多数据源的数据支持,然后通过电磁信息安全知识抽取技术,能够从一些公开的半结构化、非结构化和第三方结构化数据库的数据中提取出知识、关系、属性等知识要素,包括:实体抽取、属性抽取和关系抽取,最后通过电磁信息安全知识融合,完成实体对齐、实体消歧、关系修正等任务,形成高质量的知识库,最终形成知识推理能力。
S2、基于所述电磁信息安全知识表达,对电磁信息安全知识进行抽取;对于面向结构化电磁信息安全数据的实体、关系、属性的抽取技术,采用上述S1中理想状态下电磁信息安全知识图谱构建的基本思路即可,在此不再赘述;而根据图3的流程图,电磁信息安全知识图谱的构建需要经历知识表达、知识抽取、知识融合三个步骤,最终形成知识推理能力。在此过程中,由于面向非结构化电磁信息安全数据的知识抽取技术将成为研究的重点和难点,因此,本发明更注重于非理想化的面向非结构化和半结构化电磁信息安全数据的实体和关系的抽取技术。
传统的实体和关系抽取方法主要分为有监督、半监督、弱监督和无监督四类。随着人工智能技术的兴起,基于深度学习有监督的实体关系抽取方法成为主要研究热点,能避免经典方法中人工特征选择等步骤,减少并改善特征抽取过程中的误差积累问题。
深度学习的实体关系抽取任务分为有监督和远程监督两类。有监督的实体关系抽取依靠人工标注的方法得到数据集,数据集准确率、纯度较高,训练出的关系抽取模型效果较好,但其人工标注数据集的方法耗费大量人力成本,且标注数据的数量有限、扩展扩展性差、领域性强,导致构造的关系抽取模型对人工标注的数据具有依赖性,不利于模型的跨领域泛化能力,领域迁移性较差。远程监督采用对齐远程知识库的方式自动标注数据,在面对大量无标签数据时,相较于有监督实体关系抽取具有明显优势,减少了人力的损耗且领域知识迁移能力较强。
参照图4所示,为基于注意力机制的电磁信息安全实体关系抽取。由于在电磁信息安全检测实践中,人工标注大量无标签数据显得不切实际,因此,本发明引入基于深度学习的远程监督方法,开展电磁信息安全知识的实体关系抽取研究,并采用基于注意力机制的卷积神经网络(Attention-based Convolutional Neural Network)的技术途径。
在电磁信息安全数据中加入注意力机制,通过给不同的非结构化及半结构化数据赋予不同的权重,以摒弃一些错误标签带来的噪声问题,从而能够提升分类器的性能。
多重注意力机制可将电磁信息安全数据中重要信息的权重增大,不重要的信息的权重减小,用于给不同的非结构化电磁信息安全数据赋予不同的权重;卷积神经网络用于提取电磁信息安全数据的高维语义特征;两者组合成转换器,将输入的非结构化电磁信息安全数据转化为一个高维空间中的特征向量。头部多层感知机和尾部多层感知机都接收来自由电磁信息安全数据转换得到的特征向量,各自输出一个位于新的高维信息空间的特征向量,将两个输出组合后可计算评价结果。电磁信息安全数据的评价结果和电磁信息安全实体关系中的值一起输入给评价函数,评价函数依据知识库中的实体关系,输出电磁信息安全的实体关系评价,以远程监督的方法标注电磁信息安全数据。S3、多数据源的电磁信息安全知识融合技术
构建面向快速检测的知识图谱,需要来自电磁信息安全标准、规则、领域专家知识、测试等多数据源的数据支持。如何将源自不同数据源的关于同一个实体或概念的电磁信息安全知识合并统一,即知识融合,将是电磁信息安全知识图谱构建的重要环节。
实体对齐作为知识融合过程中的关键技术,是推断来自不同数据源中的不同实体是否映射到知识图谱中同一电磁信息安全对象的处理过程。如果多个实体表征同一个电磁信息安全对象,则需要在这些实体之间构建对齐关系,同时对实体包含的电磁信息安全信息进行融合和聚集。
由于目前缺乏有效的电磁信息安全训练数据集,人工匹配方法无法适应快速智能化电磁信息安全分析的需要,因此,本发明采用无监督的机器学习方法完成实体对齐任务。针对电磁信息安全数据特征,基于多视图层次聚类的实体对齐步骤如下:
S31、对来自不同数据源的电磁信息安全数据进行预处理,形成统一的数据表示;
S32、利用多视图分别从不同角度提取电磁信息安全数据的特征,结合多数据源特征计算各视图的权值,通过多视图模型形成电磁信息安全实体的多维加权特征表示;
S33、利用层次聚类算法,通过实体之间的相似度匹配,自底向上逐层聚合,完成实体对齐。
本发明探索综合利用有监督、无监督和弱监督的机器学习方法,对来自多个电磁信息安全数据源中的结构化、半结构化和非结构化数据进行知识抽取、知识融合等处理,从而构建电磁信息安全领域知识图谱。
在后续的研究中,将构建的知识图谱存储于图数据库,以期提供优于关系型数据库的实体关系查询效率,以形成图搜索和遍历能力,使得知识图谱的节点、关系及子图有更好的适应性,并提升系统的可扩展性。
S4、基于所述电磁信息安全知识图谱,对电磁信息安全数据进行知识推理,即基于知识图谱架构学习、再学习、可并行处理的智能电磁信息泄漏分析与检测技术。
电磁信息安全知识推理:本发明在上一步构建的电磁信息安全知识图谱的基础上,结合深度学习方法,对智能提取的电磁环境和目标设备的电磁信息安全知识进行推理,以实现电磁信息泄漏智能检测。知识推理过程,参照图5所示。
为了形成快速准确的分析和处理能力,本发明设计具有并行处理能力的电磁信息安全知识推理框架,具体步骤如下:
S41、将现有的电磁信息安全知识进一步划分子类别;
S42、为每个子类别分别形成具有知识推理能力的推理智能体;
S43、综合各个推理智能体的推理知识,形成符合目标需求的综合推理智能体;
S44、进行诊断和修复分析时,抽取目标的电磁信息安全信息,依据信息类别,分别输入相关的推理智能体;
S45、各个智能体并行执行知识推理过程,将结果汇总到综合推理智能体;
S46、由综合推理智能体完成最终的综合知识推理,做出电磁信息泄漏诊断,并给出防护方案。
在上述过程中,知识推理算法和推理智能体是研究的重点。知识推理算法拟基于深度学习的神经网络方法实现;推理智能体可以视为,以电磁信息安全知识图谱为基础,通过深度学习方法训练形成的具有电磁信息安全知识推理能力的神经网络模型。其仍从构成知识图谱的基本元素三元组出发,采用递归神经网络(Recurrent Neural Network,RNN),基于多跳关系进行知识推理。
由于知识图谱中的电磁信息安全知识三元组并非相互孤立,很多三元组之间具有连接关系,一个三元组的尾实体可能是另一个三元组的头实体,这样的两个三元组可以构成一个五元组路径,则该五元组的头尾实体之间可能隐含了某种符合逻辑的推理关系。因此,利用RNN对实体关系上下文信息的深度学习能力,可在任意长度路径中将隐含的实体关系组合起来。然后,在每个路径的组合步骤中,利用下一跳关系的嵌入向量,以及表示从起始到目前实体为止的多跳路径的向量,组合成一个输出向量作为下一个步骤的输入。在使用多跳路径之后,采用RNN在路径的第一个实体和最后一个实体之间输出一个关系向量,使得该向量包含整个路径上所有关系的信息。
S5、基于深度学习和再学习的智能优化
为了进一步实现更深层次的全面智能化电磁信息安全分析和处理,本发明采用基于深度学习和再学习的技术路线,围绕知识图谱的自动演进,使本发明具有持续优化和改善的能力。
随着电磁信息泄漏智能检测工作的持续深入开展,电磁信息安全知识图谱面临着知识更新迭代、检测能力优化的问题。本发明设计了具备自动演进优化能力的智能化电磁信息安全分析和处理技术架构,如图6所示。
智能化电磁信息安全分析和处理的核心在于电磁信息安全知识图谱。知识图谱更新优化的驱动将来自于三个方面:新增的电磁信息安全数据、第三方电磁信息安全知识库、知识图谱内在知识的更新。更新数据的处理采用知识图谱构建研究中提出的知识抽取和知识融合技术。
1.新增电磁信息安全数据
电磁信息安全的新增数据可以源自互联网、人工采集等多种数据来源。应用知识图谱,进行电磁干扰故障诊断与修复过程中,获取的数据和分析推理得到的知识也可以作为新增数据,经由处理反馈回到电磁信息安全知识图谱中。
电磁信息安全分析和处理的智能化研究过程中,多处需要依靠深度学习技术的支持,而深度学习算法的性能很大程度上受训练数据影响。CNN、RNN等有监督的深度神经网络算法均需要大量的数据支撑其学习训练。相对于图像处理等成熟的应用领域,电磁信息安全领域的深度学习研究还处于起步阶段,缺乏足够数量的现有数据用于训练测试。因此,为了保障电磁信息安全领域深度学习研究的顺利开展,本发明提出基于生成对抗网络(Generative Adversarial Network,GAN)的电磁信息安全数据智能生成方法,以增强知识图谱。
面向电磁信息安全的生成对抗网络其核心在于两个神经网络:电磁信息安全数据的生成网络和电磁信息安全数据合规性的判别网络。这两个神经网络结构相反,生成网络的作用是,将输入的随机数据,通常是噪声数据,通过神经网络的逐层加工放大,形成尽量逼近电磁信息安全真实数据的伪数据;判别网络的作用是,基于电磁信息安全知识图谱,利用现有知识训练出的神经网络模型,对生成网络制造的电磁信息安全伪数据进行真伪甄别。生成网络和判别网络形成天然的对抗关系,在竞争对抗中,利用真伪甄别的误差对两个神经网络进行智能优化和调整,最终获得符合电磁信息安全规则的近似数据,作为电磁信息安全知识图谱的有益数据补充。本发明针对电磁信息安全数据的特征,采用CNN和RNN结合的技术路线设计生成和判别网络。
预估新增的电磁信息安全数据将呈现来源多元化的特点,因此其数据结构可能存在结构化、非结构化和半结构化三种形式。非结构化和半结构化数据,需要对其进行实体、关系、属性的知识抽取,随后与其它来源的数据进行知识融合;对于符合数据规范的结构化数据,可以直接进行数据整合,进入知识融合阶段,以达成知识图谱的智能更新优化的目标。
2.第三方电磁信息安全知识库
本发明对电磁信息安全知识图谱的设计是具有开放性的,考虑到第三方电磁信息安全知识库兼容并蓄,期望通过纳入第三方知识,丰富知识图谱的电磁信息安全知识,并持续改善和优化现有的电磁信息安全认知智能。
由于第三方知识库的数据通常是结构化的,因此设计让其跳过知识抽取阶段,直接进入数据整合的知识融合阶段。
3.知识图谱内在的知识更新
随着外部数据的持续输入,除了带来新的电磁信息安全知识,也可能与现有的知识产生一定程度的冲突。因此,电磁信息安全知识图谱内部面临着知识新旧更替的问题。
本发明采用新增的电磁信息安全数据、第三方电磁信息安全知识库以及知识图谱内在的知识更新作为知识驱动,结合深度学习和再学习技术,以电磁信息安全知识图谱的自我优化和完善为核心,深入推进电磁信息安全分析和处理手段的智能化研究,以期达到持续提升电磁干扰故障诊断和修复的速度和准确率的目标。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (9)
1.一种基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,具体包括如下步骤:
S1、基于多数据源的电磁信息安全数据支持,建立电磁信息安全知识表达;并基于电磁信息安全知识抽取、电磁信息安全知识融合和所述电磁信息安全知识表达,构建电磁信息安全知识图谱;
S2、基于所述电磁信息安全知识表达,对电磁信息安全知识进行抽取;
S3、基于所述多数据源的电磁信息安全数据,对电磁信息安全知识进行融合;
S4、基于所述电磁信息安全知识图谱,对电磁信息安全数据进行知识推理;
S5、基于知识推理,自动对电磁信息安全的智能化分析和处理进行演进优化。
2.根据权利要求1所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,
所述电磁信息安全知识表达包括结构化数据、非结构化数据、半结构化数据;所述电磁信息安全知识抽取包括实体抽取、关系抽取、属性抽取;所述电磁信息安全知识融合包括实体对齐、实体消歧、关系修正。
3.根据权利要求1所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述步骤S2具体为:
对所述电磁信息安全知识表达的非结构化数据和半结构化数据进行实体抽取和关系抽取,采用基于深度学习的远程监督方法,在电磁信息安全数据中加入注意力机制,给不同的非结构化及半结构化数据赋予不同的权重。
4.根据权利要求1所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述步骤S3具体为:
S31、对所述多数据源的电磁信息安全数据进行预处理,形成统一的数据表示;
S32、利用多视图方法分别从不同角度提取所述多数据源的电磁信息安全数据的特征,结合多数据源特征计算各视图的权值,通过多视图模型形成电磁信息安全实体的多维加权特征表示;
S33、利用层次聚类算法,通过实体之间的相似度匹配,自底向上逐层聚合,完成实体对齐任务。
5.根据权利要求1所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述步骤S4具体为:
S41、将电磁信息安全知识按照信息类别的不同划分为若干个子类别;
S42、将每个子类别分别形成具有知识推理能力的推理智能体;
S43、综合各个所述推理智能体的推理知识,形成符合目标需求的综合推理智能体;
S44、对所述各个推理智能体进行诊断和修复分析;
S45、对所述各个智能体并行执行知识推理过程,将结果汇总到综合推理智能体中;
S46、由综合推理智能体完成最终的综合知识推理,得到电磁信息泄漏诊断,并给出防护方案。
6.根据权利要求5所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述步骤S44具体为:
抽取符合目标需求的电磁知识安全信息,并依据信息类别进行划分,将划分后的电磁知识安全信息分别输入相关的推理智能体中进行诊断和修复分析。
7.根据权利要求5所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述推理智能体是以所述电磁信息安全知识图谱为基础,通过深度学习方法训练形成的具有电磁信息安全知识推理能力的神经网络模型,从构成知识图谱的基本元素三元组出发,采用递归神经网络,基于多跳关系进行知识推理。
8.根据权利要求7所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述三元组利用RNN对实体和关系上下文信息的深度学习能力,在任意长度路径中将隐含的实体关系组合起来;然后在每个路径的组合步骤中,利用下一跳关系的嵌入向量,以及表示从起始到目前实体为止的多跳路径的向量,组合成一个输出向量作为下一个步骤的输入;
在使用多跳路径之后,采用RNN在路径的第一个实体和最后一个实体之间输出一个关系向量,使得该向量包含整个路径上所有关系的信息。
9.根据权利要求1所述的基于知识图谱的电磁信息泄漏智能分析方法,其特征在于,所述步骤S5具体为:
采用基于深度学习和再学习的技术路线,围绕知识图谱的自动演进,构建具备自动演进优化能力的智能化电磁信息安全分析和处理技术架构;
所述演进优化的驱动包括新增的电磁信息安全数据、第三方电磁信息安全知识库、知识图谱内在知识的更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110362783.8A CN114116957A (zh) | 2021-04-02 | 2021-04-02 | 一种基于知识图谱的电磁信息泄漏智能分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110362783.8A CN114116957A (zh) | 2021-04-02 | 2021-04-02 | 一种基于知识图谱的电磁信息泄漏智能分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114116957A true CN114116957A (zh) | 2022-03-01 |
Family
ID=80359241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110362783.8A Pending CN114116957A (zh) | 2021-04-02 | 2021-04-02 | 一种基于知识图谱的电磁信息泄漏智能分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114116957A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108680796A (zh) * | 2018-05-17 | 2018-10-19 | 集美大学 | 用于计算机显示器的电磁信息泄漏检测系统及方法 |
CN115858698A (zh) * | 2023-02-22 | 2023-03-28 | 北京融信数联科技有限公司 | 智能体图谱分析方法、系统和可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110688456A (zh) * | 2019-09-25 | 2020-01-14 | 北京计算机技术及应用研究所 | 一种基于知识图谱的漏洞知识库构建方法 |
CN111159249A (zh) * | 2019-12-13 | 2020-05-15 | 深圳市唯特视科技有限公司 | 基于知识图谱的目标识别方法、装置、系统、存储介质 |
WO2021004333A1 (zh) * | 2019-07-08 | 2021-01-14 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
CN112468440A (zh) * | 2020-10-28 | 2021-03-09 | 北京工业大学 | 基于知识图谱的工控系统攻击线索发现系统 |
-
2021
- 2021-04-02 CN CN202110362783.8A patent/CN114116957A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021004333A1 (zh) * | 2019-07-08 | 2021-01-14 | 平安科技(深圳)有限公司 | 基于知识图谱的事件处理方法、装置、设备和存储介质 |
CN110688456A (zh) * | 2019-09-25 | 2020-01-14 | 北京计算机技术及应用研究所 | 一种基于知识图谱的漏洞知识库构建方法 |
CN111159249A (zh) * | 2019-12-13 | 2020-05-15 | 深圳市唯特视科技有限公司 | 基于知识图谱的目标识别方法、装置、系统、存储介质 |
CN112468440A (zh) * | 2020-10-28 | 2021-03-09 | 北京工业大学 | 基于知识图谱的工控系统攻击线索发现系统 |
Non-Patent Citations (1)
Title |
---|
李泽荃;徐淑华;李碧霄;李靖;: "基于知识图谱的灾害场景信息融合技术", 华北科技学院学报, no. 02, 15 April 2019 (2019-04-15) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108680796A (zh) * | 2018-05-17 | 2018-10-19 | 集美大学 | 用于计算机显示器的电磁信息泄漏检测系统及方法 |
CN108680796B (zh) * | 2018-05-17 | 2023-09-19 | 集美大学 | 用于计算机显示器的电磁信息泄漏检测系统及方法 |
CN115858698A (zh) * | 2023-02-22 | 2023-03-28 | 北京融信数联科技有限公司 | 智能体图谱分析方法、系统和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jain et al. | Data mining techniques: a survey paper | |
CN110362660A (zh) | 一种基于知识图谱的电子产品质量自动检测方法 | |
CN113312447A (zh) | 基于概率标签估计的半监督日志异常检测方法 | |
CN112699662B (zh) | 一种基于文本结构算法的虚假信息早期检测方法 | |
CN112100392B (zh) | 一种基于强化学习和知识图谱的设备故障溯因方法 | |
Pan et al. | Clustering of designers based on building information modeling event logs | |
Li et al. | A new method of identification of complex lithologies and reservoirs: task-driven data mining | |
CN114116957A (zh) | 一种基于知识图谱的电磁信息泄漏智能分析方法 | |
Wang et al. | Power system network topology identification based on knowledge graph and graph neural network | |
Wu et al. | Human resource allocation based on fuzzy data mining algorithm | |
CN110704694A (zh) | 一种基于网络表示学习的组织层级划分方法及其应用 | |
Wang et al. | Design of the Sports Training Decision Support System Based on the Improved Association Rule, the Apriori Algorithm. | |
Siminski | An outlier-robust neuro-fuzzy system for classification and regression | |
Zhou et al. | Betweenness centrality-based community adaptive network representation for link prediction | |
Hong et al. | Rule-enhanced noisy knowledge graph embedding via low-quality error detection | |
Lamba et al. | Optimal machine learning model for software defect prediction | |
Feng et al. | Automatic semantic modeling for structural data source with the prior knowledge from knowledge graph | |
Wang et al. | Meta-learning adaptation network for few-shot link prediction in heterogeneous social networks | |
Deekshitha et al. | URL Based Phishing Website Detection by Using Gradient and Catboost Algorithms | |
Junhuai et al. | Fault detection method based on adversarial reinforcement learning | |
Jiang et al. | A survey on translating embedding based entity alignment in knowledge graphs | |
Guo et al. | Network embedding based on biased random walk for community detection in attributed networks | |
Xu et al. | Similarmf: a social recommender system using an embedding method | |
Gong et al. | Finding multi-granularity community structures in social networks based on significance of community partition | |
Butalia et al. | Applications of rough sets in the field of data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |