CN109189945A - 一种基于可信度向量的知识图谱表示学习方法 - Google Patents

一种基于可信度向量的知识图谱表示学习方法 Download PDF

Info

Publication number
CN109189945A
CN109189945A CN201811140337.7A CN201811140337A CN109189945A CN 109189945 A CN109189945 A CN 109189945A CN 201811140337 A CN201811140337 A CN 201811140337A CN 109189945 A CN109189945 A CN 109189945A
Authority
CN
China
Prior art keywords
vector
triple
confidence level
level vector
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811140337.7A
Other languages
English (en)
Inventor
熊盛武
毛晶晶
段鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201811140337.7A priority Critical patent/CN109189945A/zh
Publication of CN109189945A publication Critical patent/CN109189945A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明提出了一种基于可信度向量的知识图谱表示学习方法,在该方法中基于可信度向量,实体在不同关系下具有不同表达形式,不同的关系关注实体不同的属性信息,本发明能够提升知识表示学习在复杂关系下的区分能力,并且避免了增加过多模型复杂度。本发明方法可以对知识图谱中的实体和关系进行表示,用于知识图谱的补全和推理,具有较好的实用性。

Description

一种基于可信度向量的知识图谱表示学习方法
技术领域
本发明涉及知识图谱表示学习问题,具体地指一种基于可信度向量的知识图谱表示学习方法,属于自然语言处理领域。
背景技术
近年来类人智能在世界各地迅猛发展,其成功离不开完善的知识图谱。知识图谱是智能问答、语义搜索等信息服务应用的重要基础技术,知识图谱覆盖的知识越全面,越能更好地提供所需答案。尽管目前已经有多个大规模、开放领域的知识图谱,但它们距离完备仍然相差甚远,例如Freebase中有大约30%的人物实体缺少其父母亲信息。通常情况下,人类都是以网络和图的架构来组织和表示知识图谱中所包含的知识,图和网络中的每一个节点都表示不同的实体,而每两个节点之间相连的边则表示两个实体之间存在的关系。因此,传统的知识图谱大多数都是采用<实体1,关系,实体2>三元组的方式来表示知识,其对应的是知识图谱中的两个节点以及连接这两个节点的边。在传统的网络表示形式下利用知识图谱进行推理、补全,需要设计专门的图算法,其计算效率极低。而利用知识表示学习模型,能在低维空间中挖掘出实体和关系之间的语义关系,提高知识理解和推理能力。
目前知识表示学习的代表模型是平移模型,该模型虽然简单高效,但平移模型无法很好地处理知识图谱中的复杂关系。这就是本发明的主要研究背景。
发明内容
本发明的目的在于克服上述现有技术的不足,而提出的一种知识图谱表示学习方法,该方法包括:
步骤1,输入知识图谱中的三元组(h,r,t),根据关系r生成其对应的可信度向量;
步骤2,根据可信度向量,定义三元组(h,r,t)中实体向量、关系向量和可信度向量之间的相互关联;
步骤3,通过损失函数将实体向量、关系向量和可信度向量关联起来,并最小化损失函数,以学习实体向量、关系向量和可信度向量,达到优化目标。
在上述的一种基于可信度向量的知识图谱表示学习方法,每一个三元组关系有一个对应的可信度向量,并对其中的向量值进行随机初始化,赋值0或1。
在上述的一种基于可信度向量的知识图谱表示学习方法,在可信度向量对应的空间中,关系r和实体对(h,t)之间存在平移关系,其相互关联的能量函数为:
其中,h、t和r为头实体h、尾实体t和关系r对应的向量;cr为关系的r可信度向量,其为一个二值向量,其中1代表激活,0代表抑制;hr为头实体h经过可信度向量激活后的向量;tr为尾实体t经过可信度向量激活后的向量;rr为关系r经过可信度向量激活后的关系;为哈达吗积。
在上述的一种基于可信度向量的知识图谱表示学习方法,通过损失函数将实体向量、关系向量和可信度向量关联起来,并最小化损失函数,以学习实体向量、关系向量和可信度向量;损失函数为:
其中,[x]+=max(0,x)表示返回0和x之间的较大的那个值;γ为正确三元组损失函数值与错误三元组损失函数值之间的间隔距离;S为正确三元组的集合,S-为错误三元组的集合;fr(h,t)为正确三元组的能量函数;fr'(h',t')错误三元组的能量函数;假设知识图谱中总共包含nt个三元组,将第i个三元组标记为(hi,ri,ti)(i=1,2,3,....nt),同时每一个三元组还有一个标签yi,如果这个三元组是正确三元组,则yi=1,如果这个三元组是错误三元组,则yi=0;S={(hi,ri,ti)|yi=1}表示正确三元组的集合;相应的,错误三元组的集合表示为S-={(hi,ri,ti)|yi=0};从知识图谱中获取正确三元组的集合S,自己构造相应的错误三元组S-;通过分别替换正确三元组中的头实体、尾实体和关系,打破正确三元组,构造错误三元组。
本发明方法解决了传统TransE模型在处理知识图谱中一对多、多对一、多对多关系时的存在的问题,同时实体是由多个不同属性构成的一个综合体,在不同的关系中关注实体不同的属性,使得实体在不同关系下具有不同的表达形式,从而解决TransE模型在处理知识图谱中复杂关系建模能力不足的问题,同时算法复杂度低、简单易行,可操作性强,因此,本发明方法可用于对知识图谱中的知识进行表示的工作。
附图说明
图1是FB15K数据集实体预测计算结果。
图2是FB15K数据集上基于关系类型的预测实体结果。
图3是本发明的方法流程示意图。
具体实施方式
本文中提出的基于可信度向量的知识图谱表示学习方法:
1.根据三元组中的关系生成对应的可信度向量,并对其进行初始化;
2.对三元组中的实体和关系向量进行随机初始化;
3.在可信度向量对应的空间中,关系r和实体对(h,t)之间存在平移关系,其相互关联的能量函数为:
其中,h、t和r为实体h、t和关系r对应的向量;c为可信度向量,c是一个二值向量,其中1代表激活,0代表抑制;为哈达吗积;
4.S为正确三元组的集合,即知识图谱中包含的三元组;S-为错误三元组的集合,通过分别替换正确三元组中的头实体、尾实体和关系,打破正确三元组,构造错误三元组。
5.通过损失函数将实体向量、关系向量和可信度向量关联起来。损失函数为:
其中,[x]+=max(0,x)表示返回0和x之间的较大的那个值;γ为正确三元组损失函数值与错误三元组损失函数值之间的间隔距离;S为正确三元组的集合,S-为错误三元组的集合。
6.利用梯度下降算法对损失函数进行优化,学习得到实体向量、关系向量和可信度向量。
利用本发明提出的基于可信度向量的知识图谱表示学习方法对FB15K的数据进行知识图谱补全实验,其与其他方法的对比结果见图1。将FB15K中的关系分为四种,其结果见图2。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (4)

1.一种基于可信度向量的知识图谱表示学习方法,其特征在于,包括如下步骤:
步骤1,输入知识图谱中的三元组(h,r,t),根据关系r生成其对应的可信度向量;
步骤2,根据可信度向量,定义三元组(h,r,t)中实体向量、关系向量和可信度向量之间的相互关联;
步骤3,通过损失函数将实体向量、关系向量和可信度向量关联起来,并最小化损失函数,以学习实体向量、关系向量和可信度向量,达到优化目标。
2.根据权利要求1所述的一种基于可信度向量的知识图谱表示学习方法,其特征在于:每一个三元组关系有一个对应的可信度向量,并对其中的向量值进行随机初始化,赋值0或1。
3.根据权利要求1所述的一种基于可信度向量的知识图谱表示学习方法,其特征在于:在可信度向量对应的空间中,关系r和实体对(h,t)之间存在平移关系,其相互关联的能量函数为:
其中,h、t和r为头实体h、尾实体t和关系r对应的向量;cr为关系的r可信度向量,其为一个二值向量,其中1代表激活,0代表抑制;hr为头实体h经过可信度向量激活后的向量;tr为尾实体t经过可信度向量激活后的向量;rr为关系r经过可信度向量激活后的关系;为哈达吗积。
4.根据权利要求1所述的一种基于可信度向量的知识图谱表示学习方法,其特征在于:通过损失函数将实体向量、关系向量和可信度向量关联起来,并最小化损失函数,以学习实体向量、关系向量和可信度向量;损失函数为:
其中,[x]+=max(0,x)表示返回0和x之间的较大的那个值;γ为正确三元组损失函数值与错误三元组损失函数值之间的间隔距离;S为正确三元组的集合,S-为错误三元组的集合;fr(h,t)为正确三元组的能量函数;fr'(h',t')错误三元组的能量函数;假设知识图谱中总共包含nt个三元组,将第i个三元组标记为(hi,ri,ti)(i=1,2,3,....nt),同时每一个三元组还有一个标签yi,如果这个三元组是正确三元组,则yi=1,如果这个三元组是错误三元组,则yi=0;S={(hi,ri,ti)|yi=1}表示正确三元组的集合;相应的,错误三元组的集合表示为S-={(hi,ri,ti)|yi=0};从知识图谱中获取正确三元组的集合S,自己构造相应的错误三元组S-;通过分别替换正确三元组中的头实体、尾实体和关系,打破正确三元组,构造错误三元组。
CN201811140337.7A 2018-09-28 2018-09-28 一种基于可信度向量的知识图谱表示学习方法 Pending CN109189945A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811140337.7A CN109189945A (zh) 2018-09-28 2018-09-28 一种基于可信度向量的知识图谱表示学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811140337.7A CN109189945A (zh) 2018-09-28 2018-09-28 一种基于可信度向量的知识图谱表示学习方法

Publications (1)

Publication Number Publication Date
CN109189945A true CN109189945A (zh) 2019-01-11

Family

ID=64907619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811140337.7A Pending CN109189945A (zh) 2018-09-28 2018-09-28 一种基于可信度向量的知识图谱表示学习方法

Country Status (1)

Country Link
CN (1) CN109189945A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275959A (zh) * 2019-05-22 2019-09-24 广东工业大学 一种面向大规模知识库的快速学习方法
CN110647620A (zh) * 2019-09-23 2020-01-03 中国农业大学 一种基于置信超平面和词典信息的知识图谱表示学习方法
CN111460155A (zh) * 2020-03-31 2020-07-28 北京邮电大学 一种基于知识图谱的信息可信度评估方法及装置
CN111538848A (zh) * 2020-04-29 2020-08-14 华中科技大学 一种融合多源信息的知识表示学习方法
CN112860915A (zh) * 2021-03-06 2021-05-28 东南大学 一种基于知识图谱的知识可信度量方法
CN111858958B (zh) * 2020-07-22 2024-02-02 武汉理工大学 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275959A (zh) * 2019-05-22 2019-09-24 广东工业大学 一种面向大规模知识库的快速学习方法
CN110647620A (zh) * 2019-09-23 2020-01-03 中国农业大学 一种基于置信超平面和词典信息的知识图谱表示学习方法
CN110647620B (zh) * 2019-09-23 2022-07-01 中国农业大学 一种基于置信超平面和词典信息的知识图谱表示学习方法
CN111460155A (zh) * 2020-03-31 2020-07-28 北京邮电大学 一种基于知识图谱的信息可信度评估方法及装置
CN111460155B (zh) * 2020-03-31 2023-07-18 北京邮电大学 一种基于知识图谱的信息可信度评估方法及装置
CN111538848A (zh) * 2020-04-29 2020-08-14 华中科技大学 一种融合多源信息的知识表示学习方法
CN111538848B (zh) * 2020-04-29 2023-09-01 华中科技大学 一种融合多源信息的知识表示学习方法
CN111858958B (zh) * 2020-07-22 2024-02-02 武汉理工大学 基于隐空间邻域聚合的智能网联汽车产业图谱融合方法
CN112860915A (zh) * 2021-03-06 2021-05-28 东南大学 一种基于知识图谱的知识可信度量方法

Similar Documents

Publication Publication Date Title
CN109189945A (zh) 一种基于可信度向量的知识图谱表示学习方法
CN110825881B (zh) 一种建立电力知识图谱的方法
CN112860908A (zh) 基于多源异构电力设备数据的知识图谱自动化构建方法
CN106650789A (zh) 一种基于深度lstm网络的图像描述生成方法
CN106503148B (zh) 一种基于多知识库的表格实体链接方法
CN112131404A (zh) 一种四险一金领域知识图谱中实体对齐方法
CN108038234A (zh) 一种问句模板自动生成方法及装置
CN108921295A (zh) 一种基于知识图谱技术的突发事件应急决策模型构建方法
CN110059160A (zh) 一种端到端的基于上下文的知识库问答方法及装置
CN107662617B (zh) 基于深度学习的车载交互控制算法
CN109376249A (zh) 一种基于自适应负采样的知识图谱嵌入方法
CN102314614A (zh) 一种基于类共享多核学习的图像语义分类方法
CN112420151A (zh) 一种超声报告后结构化解析方法、系统、设备和介质
CN110647620A (zh) 一种基于置信超平面和词典信息的知识图谱表示学习方法
CN111241840A (zh) 一种基于知识图谱的命名实体识别方法
Zhang et al. Hierarchical scene parsing by weakly supervised learning with image descriptions
CN109739995A (zh) 一种信息处理方法及装置
CN110008467A (zh) 一种基于迁移学习的缅甸语依存句法分析方法
CN106445911A (zh) 一种基于微观话题结构的指代消解方法及系统
CN112905762A (zh) 一种基于同等注意力图网络的视觉问答方法
CN112256870A (zh) 基于自适应随机游走的属性网络表示学习方法
Tang et al. Parts2Words: Learning Joint Embedding of Point Clouds and Texts by Bidirectional Matching between Parts and Words
CN111159427A (zh) 一种基于众包的知识图谱构建方法及系统
CN107590237B (zh) 一种基于动态翻译原则的知识图谱表示学习方法
CN107622047A (zh) 一种设计决策知识的提取和表达方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190111

RJ01 Rejection of invention patent application after publication