CN115051843A

CN115051843A - 基于kge的区块链威胁情报知识图谱推理方法

Info

Publication number: CN115051843A
Application number: CN202210629507.8A
Authority: CN
Inventors: 李建彬; 孙艺凡; 梁音; 常晓雨
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2022-06-06
Filing date: 2022-06-06
Publication date: 2022-09-13

Abstract

本发明公开了属于区块链技术领域的基于KGE的区块链威胁情报知识图谱推理方法。包括步骤1：分析区块链威胁情报数据，构建三元组<h，r，t>；步骤2：将步骤1构建的三元组<h，r，t>中实体和关系表示为低维稠密向量，并对低维稠密向量进行训练；步骤3：将待推理的三元组输入TransE和Transformer模型中，由模型的输出来选取三元组加入到区块链威胁情报知识图谱中；步骤4：集合TransE和Transformer模型，取N个集合模型的均值作为最终输出结果；步骤5：与单一的TransE和Transformer模型在知识推理数据集的评价指标做对比。本发明提高了知识推理的准确性，且Mean Rank指数更好。

Description

基于KGE的区块链威胁情报知识图谱推理方法

技术领域

本发明涉及区块链技术领域，尤其涉及基于KGE的区块链威胁情报知识图谱推理方法。

背景技术

随着网络威胁的不断增多，现阶段区块链技术还不够成熟，区块链系统仍然存在许多安全隐患和漏洞，将知识图谱引入区块链安全领域，利用威胁情报知识图谱刻画展现区块链的安全态势，有助于支持安全决策和预警预测。

知识图谱嵌入(KGE)是将知识图谱中的实体和关系用稠密向量进行表示。而面向知识图谱的知识推理技术是根据已有的知识利用机器学习的方法推理出新的知识。不同于传统的知识推理，知识图谱中对于知识的表达更加简洁清晰、灵活丰富，因此如何组织利用这些知识来进行推理是目前的研究热点之一。

目前，由于大规模知识图谱中实体和关系的复杂性和多样性，很难穷尽所有的推理模式，因此，基于一阶谓词逻辑的知识推理不适合于大规模知识图谱的推理；而基于随机游走算法的知识推理复杂性很高，可扩展性较差，当数据存在噪声时，可能会误导推理。所以，需要一种专门针对区块链威胁情报知识图谱的知识推理方法，并结合多个模型来提升知识推理的准确性。

发明内容

本发明的目的是提出基于KGE的区块链威胁情报知识图谱推理方法，其特征在于，所述方法包括以下步骤：

步骤1：数据预处理；分析区块链威胁情报数据，构建三元组<h，r，t>，其中h为头实体，r为关系，t为尾实体；

步骤2：知识图谱嵌入；利用TransE和Transformer模型，将步骤1构建的三元组<h，r，t>中实体和关系表示为低维稠密向量，并对低维稠密向量进行训练；

步骤3：知识推理；将待推理的三元组输入TransE和Transformer模型中，由模型的输出来选取三元组加入到区块链威胁情报知识图谱中；

步骤4：集成学习；利用集成学习的bagging方法，集合TransE和Transformer模型，取N个集合模型的均值作为最终输出结果；

步骤5：性能评价；与单一的TransE和Transformer模型在知识推理数据集的评价指标做对比，评价区块链威胁情报知识图谱推理的准确性。

所述步骤1中的区块链威胁情报数据包括结构化漏洞和攻击事件数据。

所述步骤2具体如下：

首先，将已有三元组<h，r，t>中的实体和关系随机初始化为低维稠密向量；然后，定义距离d(x，y)为两个向量x、y的距离，并取d为L2范式；最后，以三元组<h，r，t>的d(h+r，t)最小为目标进行训练来优化低维稠密向量。

所述步骤3中加入到区块链威胁情报知识图谱中的三元组的距离小于3。

本发明的有益效果在于：

本发明利用集成学习方法将TransE和Transformer模型进行结合，提高了知识推理的准确性；在知识图谱常用数据集FB15K上与其他模型相比，本方法模型的Mean Rank指数更好。

附图说明

图1为本发明基于KGE的区块链威胁情报知识图谱推理方法的流程图；

图2为本发明基于KGE的区块链威胁情报知识图谱推理过程的示意图。

具体实施方式

本发明提出基于KGE的区块链威胁情报知识图谱推理方法，下面结合附图和具体实施例对本发明做进一步说明。

图1为本发明基于KGE的区块链威胁情报知识图谱推理方法的流程图；具体包括：

数据预处理：分析区块链威胁情报数据，包括结构化的漏洞、攻击事件数据等，构建出以<h，r，t>形式的三元组，其中h为头实体，r为关系，t为尾实体。

知识图谱嵌入：利用TransE和Transformer等模型，将已有三元组中实体和关系表示为低维稠密向量。

知识推理：将想要推理的三元组作为输入放入到模型中，由模型输出结果来选取合适的三元组加入到区块链威胁情报知识图谱中。

集成学习：利用集成学习方法，集合包括包括TransE、Transformer等多个模型。最后取多个模型的均值作为输出结果。

性能评价：根据与单一的TransE模型和Transformer模型在知识推理常用数据集的评价指标做对比，得出其准确性更高的结论。

图2为本发明基于KGE的区块链威胁情报知识图谱推理过程的示意图。其每个过程具体如下：

数据预处理中，对于区块链威胁情报数据，分析其中存在的所有实体类型以及属性类型，包括漏洞名称、漏洞等级、漏洞影响等，构建出例如“Lucky9io安全漏洞-漏洞等级-中危”的三元组。

知识图谱嵌入中，首先将已有的正确三元组以及人为构建的错误三元组(比如将正确三元组的头实体替换成其它实体得到一个不存在于知识图谱中的三元组)中的实体和关系随机初始化为长度50的向量，之后定义距离d(x，y)为两个向量x、y的距离，取d为L2范式，根据已有三元组的d(h+r，t)尽可能小的策略进行训练，不断优化实体和关系的向量，使得正确三元组的距离d越来越小。同时算出所有三元组的距离d，根据结果得出正确三元组的距离d普遍小于3，而错误三元组的距离普遍大于3。

知识推理中，将要推理的三元组放入模型，根据知识图谱嵌入中计算得到的正确三元组的距离普遍小于3，因此在进行推理时将距离d小于3的三元组作为推理正确的三元组加入到区块链威胁情报知识图谱中。

集成学习中，利用集成学习的bagging方法，在训练时，将训练集分成N份，用N个模型对不同的训练集进行训练；在测试时，将测试集放入N个模型中去，取所有模型的均值作为最后的结果。

评价指标包括Mean Rank，对于推理中的每个三元组<h，r，t>将尾实体t用知识图谱中的每个实体t’代替，通过距离函数d(h+r，t’)计算距离，之后按照升序将这些距离排序，对于每个三元组中正确答案<h，r，t>求得在上述排序中排多少位，之后对所有三元组求平均就得到Mean Rank了，Mean Rank越小越好。

本实施例利用集成学习方法将TransE和Transformer模型进行结合来提高知识推理的准确性且Mean Rank指数更好。

此实施例仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.基于KGE的区块链威胁情报知识图谱推理方法，其特征在于，所述方法包括以下步骤：

步骤5：性能评价；与单一的TransE和Transformer模型在知识推理数据集的评价指标做对比,评价区块链威胁情报知识图谱推理的准确性。

2.根据权利要求1所述基于KGE的区块链威胁情报知识图谱推理方法，其特征在于，所述步骤1中的区块链威胁情报数据包括结构化漏洞和攻击事件数据。

3.根据权利要求1所述基于KGE的区块链威胁情报知识图谱推理方法，其特征在于，所述步骤2具体如下：

4.根据权利要求1所述基于KGE的区块链威胁情报知识图谱推理方法，其特征在于，所述步骤3中加入到区块链威胁情报知识图谱中的三元组的距离小于3。