CN112685609A - 一种结合平移机制与卷积神经网络的知识图谱补全方法 - Google Patents

一种结合平移机制与卷积神经网络的知识图谱补全方法 Download PDF

Info

Publication number
CN112685609A
CN112685609A CN202110001290.1A CN202110001290A CN112685609A CN 112685609 A CN112685609 A CN 112685609A CN 202110001290 A CN202110001290 A CN 202110001290A CN 112685609 A CN112685609 A CN 112685609A
Authority
CN
China
Prior art keywords
vector
entity
neural network
knowledge graph
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110001290.1A
Other languages
English (en)
Inventor
汪璟玢
聂宽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110001290.1A priority Critical patent/CN112685609A/zh
Publication of CN112685609A publication Critical patent/CN112685609A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及一种结合平移机制与卷积神经网络的知识图谱补全方法,包括以下步骤:步骤S1:获取一个确定性知识库,并进行预训练或者随机初始化;步骤S2:结合平移机制与卷积神经网络,构建CTKE模型并训练;步骤S3:根据CTKE模型得到实体向量和关系向量,将CTKE模型学习到的实体向量和关系向量,在向量空间进行计算完成实体预测或关系预测,以完成知识库补全。本发明能够应对具有复杂关系的知识图谱,并且表现出强大的学习能力。

Description

一种结合平移机制与卷积神经网络的知识图谱补全方法
技术领域
本发明涉及知识图谱领域,具体涉及一种结合平移机制与卷积神经网络的知识图谱补全方法。
背景技术
信息化时代,知识无处不在,知识之间不再孤立,众多的知识构成了一个含有丰富语义的知识网络,我们称之为知识图谱。
知识图谱(KG)本质上是一个有向图,图中的节点代表实体,边代表实体之间的关系。大型知识图谱内部存储着上亿条知识,所以其在问答系统、语义搜索等方面发挥着举足轻重的作用。
随着知识图谱的不断扩大,图形式的知识表示方式已经无法满足存储需求,同时知识缺失问题也越来越严重。如何有效地表示知识并高效地支持知识推理已经成为了知识图谱领域的迫切需要解决的实际问题。近年来,发展迅速的知识表示学习技术表现出了高效的性能,其主要思想是将实体和关系表示为一维向量,通过在低维向量空间进行运算,从而得到实体之间复杂的语义联系。目前,知识表示学习方法已经成为了完成大型知识图谱补全任务的重要工具。
发明内容
有鉴于此,本发明的目的在于提供一种结合平移机制与卷积神经网络的知识图谱补全方法,能够应对具有复杂关系的知识图谱,并且表现出强大的学习能力。
为实现上述目的,本发明采用如下技术方案:
一种结合平移机制与卷积神经网络的知识图谱补全方法,包括以下步骤:
步骤S1:获取一个确定性知识库,并进行预训练或者随机初始化;
步骤S2:结合平移机制与卷积神经网络,构建CTKE模型并训练;
步骤S3:根据CTKE模型得到实体向量和关系向量,将CTKE模型学习到的实体向量和关系向量,在向量空间进行计算完成实体预测或关系预测,以完成知识库补全。
进一步的,所述步骤S1具体为:
给定一个确定性知识图谱,其内部包含着多个三元组(h,r,t),其中h代表头实体,t代表尾实体,r代表头尾实体的关系;
将三元组划分为训练集、验证集和测试集;
使用TransE算法对知识库中实体和关系的向量进行预训练或者随机初始化。
进一步的,所述CTKE构建包括三个步骤,分别是关系特征融合、平移变换和局部特征提取。
进一步的,所述关系特征融合具体为:
首先运用前馈神经网络将关系特征融入到头尾实体的向量表示中,加强了关系信息与实体信息的交互;
将提取出的特征与原始的向量表示进行相乘,得到新的实体表示,关系特征融合过程如式(1)所示。
Figure BDA0002881456680000021
其中e为需要学习的实体向量表示,其中e∈{h,t},r为关系的向量表示,W为通过学习得到的参数矩阵,b为偏置,||代表向量拼接,σ为Sigmoid激活函数,ο表示向量相乘;
将三元组的头尾实体向量采用式(1)融入关系特征的变换过程如式(2)所示
[h,r,t]∈Rn×3→[h',r,t']∈Rn×3 (2)
其中n为嵌入维度,h'、t'分别为融合后的头、尾实体向量表示。
进一步的,所述平移变换具体为:
将平移转换后的向量与原始向量进行拼接得到一个六元组,随后运用卷积神经网络去提取六元组的平移局部特征完成评分;
对于一个已完成关系特征融合过程的三元组向量(h',r,t')进行平移变换,加强三元组内部的信息交互;
平移变换过程如公式(3)所示;
[h',r,t']∈Rn×3→[h',h”,r,r',t',t”]∈Rn×6 (3)
其中h”=t'-r、r”=t'-h'、t”=h'+r,n为嵌入维度。正例三元组具有h'≈h”、r≈r”以及t'≈t”的局部平移特征,而负例则相反。
进一步的,所述局部特征抽取具体为:
采用ω∈Rn×2作为卷积层的过滤器,将滑动步长设置为2,抽取知识的结构信息;
一个过滤器的特征图表示为v=[v1,v2,v3]∈R3
局部特征的运算方法如公式(4)所示
vi=g(ω·[A:,2i-1,A:,2i]+b) (4)
其中vi代表第i个局部特征,g为激活函数,如Sigmoid,ω代表过滤器,·代表卷积操作,A:,2i代表取输入矩阵A的第2i列;b为偏置;第i个局部特征是由过滤器ω与输入矩阵A的第2i列和第2i-1列卷积得到。
进一步的,所述CTKE模型运用评分函数以及优化目标完成训练,具体为:
用多个过滤器从不同角度捕获局部特征,将特征图进行拼接后,使用全连接层得出三元组的评分,评分函数如公式(5)所示
Figure BDA0002881456680000041
其中h'、t'是融入关系特征的实体表示,·代表卷积操作,
Figure BDA0002881456680000042
代表全连接操作。φ,w为共享参数,φ是多个过滤器的集合,w为最后全连接层的参数;concat代表将多个特征图进行连接;
优化目标如公式(6)所示:
Figure BDA0002881456680000043
其中
Figure BDA0002881456680000044
h'、t'为融入关系信息的实体向量表示,r为关系向量表示;S代表正例三元组,S'代表负例三元组,负例三元组是采用随机替换头尾实体的方法产生的。
进一步的,所述实体预测具体为:
给定一个不完备三元组(h,r,?)或(?,r,t)预测其缺失的实体,得到预测三元组;
根据CTKE模型获取各个预测三元组的得分;
给定一个预测三元组得分阈值θ,θ的取值范围为0-1,判断预测三元组是否合理,并将合理的预测三元组加入原始知识图谱完成补全。
进一步的,所述关系预测具体为:
给定一个不完备三元组(h,?,t)预测其缺失的关系;
使用CTKE计算各个预测三元组的得分;
给定一个预测三元组得分阈值θ,θ的取值范围为0-1,判断预测三元组是否合理,并将合理的预测三元组加入原始知识图谱完成补全。
本发明与现有技术相比具有以下有益效果:
1、本发明结合平移机制与卷积神经网络,解决现有知识图谱知识缺失问题。
2、本发明CTKE将平移机制与卷积神经网络相结合,一方面保留了平移机制捕获知识结构信息的有效性,另一方面利用卷积神经网络提升了模型的学习能力。
附图说明
图1是本发明实施例中CTKE模型框架图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种结合平移机制与卷积神经网络的知识图谱补全方法,包括以下步骤:
步骤S1:给定一个确定性知识图谱,其内部包含着多个三元组(h,r,t),其中h代表头实体,t代表尾实体,r代表头尾实体的关系;
将三元组划分为训练集60%、验证集20%和测试集20%用于训练CTKE模型;CTKE的模型的输入是h,r,t的向量表示,可以使用TransE算法对知识库中实体和关系的向量进行预训练或者随机初始化;
步骤S2:结合平移机制与卷积神经网络,构建CTKE模型并训练;
在本实施例中,所述CTKE构建包括三个步骤,分别是关系特征融合、平移变换和局部特征提取。
优选的,关系特征融合具体为:
首先运用前馈神经网络将关系特征融入到头尾实体的向量表示中,加强了关系信息与实体信息的交互;
将提取出的特征与原始的向量表示进行相乘,得到新的实体表示,关系特征融合过程如式(1)所示。
Figure BDA0002881456680000061
其中e为需要学习的实体向量表示,其中e∈{h,t},r为关系的向量表示,W为通过学习得到的参数矩阵,b为偏置,||代表向量拼接,σ为Sigmoid激活函数,ο表示向量相乘;
将三元组的头尾实体向量采用式(1)融入关系特征的变换过程如式(2)所示
[h,r,t]∈Rn×3→[h',r,t']∈Rn×3 (2)
其中n为嵌入维度,h'、t'分别为融合后的头、尾实体向量表示。
优选的,所述平移变换具体为:
将平移转换后的向量与原始向量进行拼接得到一个六元组,随后运用卷积神经网络去提取六元组的平移局部特征完成评分;
对于一个已完成关系特征融合过程的三元组向量(h',r,t')进行平移变换,加强三元组内部的信息交互;
平移变换过程如公式(3)所示;
[h',r,t']∈Rn×3→[h',h”,r,r',t',t”]∈Rn×6 (3)
其中h”=t'-r、r”=t'-h'、t”=h'+r,n为嵌入维度。正例三元组具有h'≈h”、r≈r”以及t'≈t”的局部平移特征,而负例则相反。
优选的,所述局部特征抽取具体为:
采用ω∈Rn×2作为卷积层的过滤器,将滑动步长设置为2,抽取知识的结构信息;
一个过滤器的特征图表示为v=[v1,v2,v3]∈R3
局部特征的运算方法如公式(4)所示
vi=g(ω·[A:,2i-1,A:,2i]+b) (4)
其中vi代表第i个局部特征,g为激活函数,如Sigmoid,ω代表过滤器,·代表卷积操作,A:,2i代表取输入矩阵A的第2i列;b为偏置;第i个局部特征是由过滤器ω与输入矩阵A的第2i列和第2i-1列卷积得到。
进一步的,所述CTKE模型运用评分函数以及优化目标完成训练,具体为:
用多个过滤器从不同角度捕获局部特征,将特征图进行拼接后,使用全连接层得出三元组的评分,评分函数如公式(5)所示
Figure BDA0002881456680000081
其中h'、t'是融入关系特征的实体表示,·代表卷积操作,
Figure BDA0002881456680000082
代表全连接操作。φ,w为共享参数,φ是多个过滤器的集合,w为最后全连接层的参数;concat代表将多个特征图进行连接;
优化目标如公式(6)所示:
Figure BDA0002881456680000083
其中
Figure BDA0002881456680000084
h'、t'为融入关系信息的实体向量表示,r为关系向量表示;S代表正例三元组,S'代表负例三元组,负例三元组是采用随机替换头尾实体的方法产生的。
步骤S3:将CTKE模型学习到的实体向量和关系向量,在向量空间进行计算完成实体预测或关系预测,以完成知识补全任务。其中实体预测定义为:给定一个不完备三元组(h,r,?)或(?,r,t)预测其缺失的实体,使用知识图中的所有实体替换缺失的实体;进一步使用CTKE计算每一个三元组的得分;最后给定一个三元组得分阈值θ,θ的取值范围为0-1,判断三元组是否合理,并将合理的三元组加入原始知识图谱完成补全。关系预测定义为:给定一个不完备三元组(h,?,t)预测其缺失的关系,使用知识图中的所有关系替换缺失的关系;进一步使用CTKE计算每一个三元组的得分;最后给定一个三元组得分阈值θ,θ的取值范围为0-1,判断三元组是否合理,并将合理的三元组加入原始知识图谱完成补全。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (9)

1.一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,包括以下步骤:
步骤S1:获取一个确定性知识库,并进行预训练或者随机初始化;
步骤S2:结合平移机制与卷积神经网络,构建CTKE模型并训练;
步骤S3:根据CTKE模型得到实体向量和关系向量,将CTKE模型学习到的实体向量和关系向量,在向量空间进行计算完成实体预测或关系预测,以完成知识库补全。
2.根据权利要求1所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述步骤S1具体为:
给定一个确定性知识图谱,其内部包含着多个三元组(h,r,t),其中h代表头实体,t代表尾实体,r代表头尾实体的关系;
将三元组划分为训练集、验证集和测试集;
使用TransE算法对知识库中实体和关系的向量进行预训练或者随机初始化。
3.根据权利要求1所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述CTKE构建包括三个步骤,分别是关系特征融合、平移变换和局部特征提取。
4.根据权利要求3所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述关系特征融合具体为:
首先运用前馈神经网络将关系特征融入到头尾实体的向量表示中,加强了关系信息与实体信息的交互;
将提取出的特征与原始的向量表示进行相乘,得到新的实体表示,关系特征融合过程如式(1)所示。
Figure FDA0002881456670000021
其中e为需要学习的实体向量表示,其中e∈{h,t},r为关系的向量表示,W为通过学习得到的参数矩阵,b为偏置,||代表向量拼接,σ为Sigmoid激活函数,
Figure FDA0002881456670000022
表示向量相乘;
将三元组的头尾实体向量采用式(1)融入关系特征的变换过程如式(2)所示
[h,r,t]∈Rn×3→[h',r,t']∈Rn×3 (2)
其中n为嵌入维度,h'、t'分别为融合后的头、尾实体向量表示。
5.根据权利要求3所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述平移变换具体为:
将平移转换后的向量与原始向量进行拼接得到一个六元组,随后运用卷积神经网络去提取六元组的平移局部特征完成评分;
对于一个已完成关系特征融合过程的三元组向量(h',r,t')进行平移变换,加强三元组内部的信息交互;
平移变换过程如公式(3)所示;
[h',r,t']∈Rn×3→[h',h”,r,r',t',t”]∈Rn×6 (3)
其中h”=t'-r、r”=t'-h'、t”=h'+r,n为嵌入维度。正例三元组具有h'≈h”、r≈r”以及t'≈t”的局部平移特征,而负例则相反。
6.根据权利要求3所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述局部特征抽取具体为:
采用ω∈Rn×2作为卷积层的过滤器,将滑动步长设置为2,抽取知识的结构信息;
一个过滤器的特征图表示为v=[v1,v2,v3]∈R3
局部特征的运算方法如公式(4)所示
vi=g(ω·[A:,2i-1,A:,2i]+b) (4)
其中vi代表第i个局部特征,g为激活函数,如Sigmoid,ω代表过滤器,·代表卷积操作,A:,2i代表取输入矩阵A的第2i列;b为偏置;第i个局部特征是由过滤器ω与输入矩阵A的第2i列和第2i-1列卷积得到。
7.根据权利要求1所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述CTKE模型运用评分函数以及优化目标完成训练,具体为:
用多个过滤器从不同角度捕获局部特征,将特征图进行拼接后,使用全连接层得出三元组的评分,评分函数如公式(5)所示
Figure FDA0002881456670000031
其中h'、t'是融入关系特征的实体表示,·代表卷积操作,
Figure FDA0002881456670000032
代表全连接操作。φ,w为共享参数,φ是多个过滤器的集合,w为最后全连接层的参数;concat代表将多个特征图进行连接;
优化目标如公式(6)所示:
Figure FDA0002881456670000041
其中
Figure FDA0002881456670000042
h'、t'为融入关系信息的实体向量表示,r为关系向量表示;S代表正例三元组,S'代表负例三元组,负例三元组是采用随机替换头尾实体的方法产生的。
8.根据权利要求1所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述实体预测具体为:
给定一个不完备三元组(h,r,?)或(?,r,t)预测其缺失的实体,得到预测三元组;
根据CTKE模型获取各个预测三元组的得分;
给定一个预测三元组得分阈值θ,θ的取值范围为0-1,判断预测三元组是否合理,并将合理的预测三元组加入原始知识图谱完成补全。
9.根据权利要求1所述的一种结合平移机制与卷积神经网络的知识图谱补全方法,其特征在于,所述关系预测具体为:
给定一个不完备三元组(h,?,t)预测其缺失的关系;
使用CTKE计算各个预测三元组的得分;
给定一个预测三元组得分阈值θ,θ的取值范围为0-1,判断预测三元组是否合理,并将合理的预测三元组加入原始知识图谱完成补全。
CN202110001290.1A 2021-01-04 2021-01-04 一种结合平移机制与卷积神经网络的知识图谱补全方法 Pending CN112685609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110001290.1A CN112685609A (zh) 2021-01-04 2021-01-04 一种结合平移机制与卷积神经网络的知识图谱补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110001290.1A CN112685609A (zh) 2021-01-04 2021-01-04 一种结合平移机制与卷积神经网络的知识图谱补全方法

Publications (1)

Publication Number Publication Date
CN112685609A true CN112685609A (zh) 2021-04-20

Family

ID=75456918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110001290.1A Pending CN112685609A (zh) 2021-01-04 2021-01-04 一种结合平移机制与卷积神经网络的知识图谱补全方法

Country Status (1)

Country Link
CN (1) CN112685609A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190691A (zh) * 2021-05-28 2021-07-30 齐鲁工业大学 一种知识图谱的链路预测方法及系统
CN113963241A (zh) * 2021-12-22 2022-01-21 苏州浪潮智能科技有限公司 Fpga硬件架构及其数据处理方法、存储介质
CN114064627A (zh) * 2021-11-24 2022-02-18 北京工商大学 一种针对多重关系的知识图谱链接补全方法及系统
CN114860955A (zh) * 2022-05-21 2022-08-05 大连海洋大学 水产医学知识图谱补全方法、混合卷积模型及其训练方法和设备
CN117453923A (zh) * 2023-08-30 2024-01-26 广东电白建设集团有限公司 一种对施工现场施工设备和建筑设施的关系进行优化的方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190691A (zh) * 2021-05-28 2021-07-30 齐鲁工业大学 一种知识图谱的链路预测方法及系统
CN114064627A (zh) * 2021-11-24 2022-02-18 北京工商大学 一种针对多重关系的知识图谱链接补全方法及系统
CN113963241A (zh) * 2021-12-22 2022-01-21 苏州浪潮智能科技有限公司 Fpga硬件架构及其数据处理方法、存储介质
CN114860955A (zh) * 2022-05-21 2022-08-05 大连海洋大学 水产医学知识图谱补全方法、混合卷积模型及其训练方法和设备
CN114860955B (zh) * 2022-05-21 2023-10-03 大连海洋大学 水产医学知识图谱补全方法、混合卷积模型及其训练方法和设备
CN117453923A (zh) * 2023-08-30 2024-01-26 广东电白建设集团有限公司 一种对施工现场施工设备和建筑设施的关系进行优化的方法
CN117453923B (zh) * 2023-08-30 2024-03-19 广东电白建设集团有限公司 一种对施工现场施工设备和建筑设施的关系进行优化的方法

Similar Documents

Publication Publication Date Title
CN112685609A (zh) 一种结合平移机制与卷积神经网络的知识图谱补全方法
Chen et al. Shallowing deep networks: Layer-wise pruning based on feature representations
CN112241481B (zh) 基于图神经网络的跨模态新闻事件分类方法及系统
JP2020126624A (ja) ディープニューラルネットワーク基盤の多重パッチ組み合わせを利用して顔を認識し、極度の状況でフォールトトレランス及びフラクチュエーションロバスト性を向上させる方法
Mishra et al. The understanding of deep learning: A comprehensive review
CN111291556B (zh) 基于实体义项的字和词特征融合的中文实体关系抽取方法
CN113052254B (zh) 多重注意力幽灵残差融合分类模型及其分类方法
CN112766280A (zh) 一种基于图卷积的遥感图像道路提取方法
Shi et al. GAEN: graph attention evolving networks
Cai et al. Softer pruning, incremental regularization
CN113779220A (zh) 一种基于三通道认知图谱和图注意力网络的蒙语多跳问答方法
CN116128056B (zh) 一种面向rpa的多模态交互实体对齐方法
CN117131933A (zh) 一种多模态知识图谱建立方法及应用
CN114880484B (zh) 一种基于向量映射的卫星通信频轨资源图谱构建方法
CN116502181A (zh) 基于通道扩展与融合的循环胶囊网络多模态情感识别方法
CN117115911A (zh) 一种基于注意力机制的超图学习动作识别系统
CN116883746A (zh) 一种基于分区池化超图神经网络的图节点分类方法
CN111428873A (zh) 一种基于自编码器的多视图属性网络嵌入方法
CN116050523A (zh) 一种基于混合知识图的注意力引导增强的常识推理框架
CN113159007B (zh) 一种基于自适应图卷积的步态情感识别方法
CN113128624B (zh) 一种基于多尺度字典的图网络人脸恢复方法
Hu et al. Adaptive cross-stitch graph convolutional networks
CN114911930A (zh) 一种全局与局部互补的双向注意的视频问答方法与系统
CN114821631A (zh) 基于注意力机制与多尺度特征融合的行人特征提取方法
CN118197402B (zh) 一种药物靶点关系的预测方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210420

RJ01 Rejection of invention patent application after publication