CN113312492A - 一种基于动态翻译的知识图谱表示学习方法 - Google Patents
一种基于动态翻译的知识图谱表示学习方法 Download PDFInfo
- Publication number
- CN113312492A CN113312492A CN202110563626.3A CN202110563626A CN113312492A CN 113312492 A CN113312492 A CN 113312492A CN 202110563626 A CN202110563626 A CN 202110563626A CN 113312492 A CN113312492 A CN 113312492A
- Authority
- CN
- China
- Prior art keywords
- entity
- dynamic translation
- triplet
- vector
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于动态翻译的知识图谱表示学习方法,主要解决了TransE模型在处理复杂关系时效率不高的问题;针对TransE存在的问题,提出了一种基于动态翻译与超平面投影的表示学习方法。首先,将动态翻译与向量嵌入进行结合,得到新的翻译原则,使翻译的原则更加灵活;接着引入投影到特定关系超平面的机制,使得实体在不同关系中有不同的角色,提高模型处理复杂关系的性能;最后在训练模型时,采用新的抽样策略,不同的概率来替换头尾实体;在进行实体替换时需要选用语义最相似的实体,达到显著提升对实体的区分度的效果。该方法将动态翻译和超平面投影相结合,很好解决了TransE处理复杂关系性能不佳的问题。
Description
技术领域
在本发明属于知识图谱表示学习领域,涉及一种基于动态翻译的知识图谱 表示学习方法。
背景技术
知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的 技术方法,属于语义层面的知识库,通常以网格的形式出现。在网格中,节点表 示实体,节点之间的边表示关系,并使用三元组(h,r,t)进行知识的表示。知识 图谱最早的应用是提升搜索引擎的能力。随后,知识图谱在辅助智能问答、自然 语言处理、大数据分析、推荐计算、物联网互联、可解释性人工智能等方面展现 出丰富的应用价值。其中,知识表示是这些应用的基础。然而,由于知识的不断 积累,知识库规模扩展非常快,知识形式也变得越来越多样化。以三元组的形式 对知识进行表示的弊端越来越明显,例如实体间语义关系的推理变得越来越难、 数据稀疏性问题变得越来越严重、计算的复杂性变得越来越高、运用到大型的知 识图谱上变得越来越困难。
近年来,以知识表示为代表的知识表示学习取得了新的研究进展,提出 了将稀疏的三元组(h,r,t)语义信息投射到低维稠密的向量空间,将实体与关系 的推理转变为对象间距离的计算。对象间计算的距离越小,则实体越相似。同时, 知识表示学习通过对实体与关系进行学习,能够解决传统知识表示方法面临的数 据稀疏、知识推理困难等问题,并且促进了知识获取、实体消岐性能的不断提升。
考虑到上述的优点,研究者们提出了若干知识表示模型,现有方法中, 受word2vec模型中词向量在语义空间的平移不变现象启发而提出的TransE模型 最著名。TransE在取得较好预测表现的同时保持了简单、高效的特点,但它在 处理复杂属性时的表现并不佳。例如在处理一对多、多对一、多对多和自反等复 杂关系时存在局限性,不能很好地区分具有相同关系的实体。
发明内容
在本发明提供一种基于动态翻译的知识图谱表示学习方法,该方法解决了TransE模型不能处理一对多、多对一、多对多和自反等复杂关系时存在局限性, 不能很好地区分具有相同关系的实体。
为达到上述发明目的,本发明提出一种基于动态翻译的知识图谱表示学习 方法:该方法包括以下步骤:
S1、将动态翻译技术和向量嵌入相融合,得到新的翻译原则;
S2、引入投影到特定关系超平面的机制,使得实体在不同关系中有不同的 角色;
S3、基于深度学习进行训练,训练此时知识图谱中实体和关系的新的向量 表示。
优选的,所述步骤S1中,对于所有的三元组(h,r,t),假设h和r的嵌入 是给定的,那么可以降低约束,使t是一个平面范围,而不是由TransE模型确 定的一个固定向量或一组相同方向的向量;同样,假设h和t的嵌入是给定的, 那么r的范围可以表示一个平面;假设r和t的嵌入是给定的,那么h的范围也 可以表示为一个平面;将动态翻译模型与TransE模型相结合后,重新定义的翻 译原则为:
(h+αh)+(r+αr)≈(t+αt)#(1)
其中,h为头实体向量,r为关系向量,t为尾实体向量,αh、αr和αt分别为经过动态翻译后得到的头实体、关系和尾实体的向量表示。
优选的,所述步骤S1中,将动态翻译技术和向量嵌入相融合后如下得分 函数:
其中||·||l1/2是l1或l2范数,fr(h,t)代表给定三元组的得分。
所述步骤S2中,引入了投影到特定关系超平面的机制,首先将三元组中 的头实体(h+αh)和尾实体(t+αt)映射到给定关系的超平面wr上,分别用(h+αh) ⊥和(t+αt)⊥表示,用关系向量r将超平面上的(h+αh)⊥和(t+αt)⊥联系起来, 得到如下公式:
此时得分函数为:
优选的,所述步骤S3中,对模型进行训练时,首先需要通过正例三元组 去构建负例三元组,针对不同的类型进行实体的替换;其次选择语义最相近的实 体。
优选的,以不同概率替换实体时,定义参数为q的伯努利分布来抽样;
其中,tqh为头实体对应的尾实体的平均数量,hqt为每个尾实体对应的 头实体的平均数量;规定,当tqh<1.5且hqt<1.5,表示关系r是一对一的; 当tqh>1.5且hqt>1.5,表示关系r是多对多的;当tqh≥1.5且hqt<1.5, 表示关系r是一对多的;当tqh<1.5且hqt≥1.5,表示关系r是多对一的。
优选的,在进行实体之间相似度判断时,选择实体或者关系之间的语义的 相似度进行判断,计算向量之间的相似度,公式为:
给定一个正例三元组(h,r,t),替换头实体生成负例三元组(h′,r,t)时, 选择h′使得dis(h,h′)最小;替换尾实体生成负例三元组(h,r,t′)时,选择 t′使得dis(t,t′)最小。
优选的,所述步骤S3中,为了区分正确三元组和错误三元组,采用如下 基于边际的损失函数作为训练模型的优化目标函数:
其中,S表示正确三元组所属集合,S′表示错误三元组所属集合,max(x,y) 指的是返回x和y之间较大的值,γ表示正确三元组损失函数得分与错误三元 组损失函数得分之间的距离;该目标函数的优化目标就是最大程度地将正确的三 元组和错误的三元组分离。
本发明具有以下优点:本发明为解决TransE模型存在的问题,在其基础 上提出了一种基于动态翻译与超平面投影的表示学习模型。具体地,将动态翻译 模型与TransE模型相结合,使翻译的原则更加灵活。同时,引入投影到特定关 系超平面的机制,提高模型处理复杂关系的性能。首先,将原有的翻译规则改为 (h+αh)+(r+αr)≈(t+αt);其次,将三元组中的h和t映射到给定关系的超平 面。此外,在模型训练时,采用新的抽样策略,使尽可能多的实体得到训练。具 体来说,对于一对多的关系,替换头实体;对于多对一的关系,替换尾实体。在 进行实体替换时需要选用语义最相似的实体,目的是使实体之间的区分度得到显著提升。经过对不同模型的实验结果的对比,在同等实验条件下,本发明的方法 不论从效果还是效率上,都显著优于TransE模型。
附图说明
图1为本发明的流程示意图;
图2为动态翻译模型原理图;
图3为超平面模型的效果图;
具体实施方式
下面结合说明书附图对本发明做进一步的说明。
如图1所示,本发明提出一种基于动态翻译的知识图谱表示学习方法:该 方法包括以下步骤:
S1、将动态翻译技术和向量嵌入相融合,得到新的翻译原则;
S2、引入投影到特定关系超平面的机制,使得实体在不同关系中有不同的 角色;
S3、基于深度学习进行训练,训练得到此时知识图谱中实体和关系的新的 向量表示。
步骤S1中,对于所有的三元组(h,r,t),假设h和r的嵌入是给定的,那 么可以降低约束,使t是一个平面范围,而不是由TransE模型确定的一个固定 向量或一组相同方向的向量;同样,假设h和t的嵌入是给定的,那么r的范围 可以表示一个平面;假设r和t的嵌入是给定的,那么h的范围也可以表示为一 个平面。动态翻译原理图如附图2所示;将动态翻译模型与TransE模型相结合 后,重新定义的翻译原则为:
(h+αh)+(r+αr)≈(t+αt)#(1)
其中,h为头实体向量,r为关系向量,t为尾实体向量,αh、αr和αt分别为经过动态翻译后得到的头实体、关系和尾实体的向量表示;将动态翻译技 术和向量嵌入相融合后如下得分函数:
其中||·||l1/2是l1或l2范数,fr(h,t)代表给定三元组的得分。
步骤S2中,引入了投影到特定关系超平面的机制,首先将三元组中的头 实体(h+αh)和尾实体(t+αt)映射到给定关系的超平面wr上,分别用(h+αh)⊥ 和(t+αt)⊥表示,用关系向量r将超平面上的(h+αh)⊥和(t+αt)⊥联系起来, 得到如下公式:
此时得分函数为:
步骤S3中,对模型进行训练时,首先需要通过正例三元组去构建负例三 元组,针对不同的类型进行实体的替换;其次选择语义最相近的实体。
以不同概率替换实体时,定义参数为q的伯努利分布来抽样;
其中,tqh为头实体对应的尾实体的平均数量,hqt为每个尾实体对应的 头实体的平均数量;规定,当tqh<1.5且hqt<1.5,表示关系r是一对一的; 当tqh>1.5且hqt>1.5,表示关系r是多对多的;当tqh≥1.5且hqt<1.5, 表示关系r是一对多的;当tqh<1.5且hqt≥1.5,表示关系r是多对一的。
在进行实体之间相似度判断时,选择实体或者关系之间的语义的相似度进 行判断,计算向量之间的相似度,公式为:
给定一个正例三元组(h,r,t),替换头实体生成负例三元组(h′,r,t)时, 选择h′使得dis(h,h′)最小;替换尾实体生成负例三元组(h,r,t′)时,选择 t′使得dis(t,t′)最小。
所述步骤S3中,为了区分正确三元组和错误三元组,采用如下基于边际 的损失函数作为训练模型的优化目标函数:
其中,S表示正确三元组所属集合,S′表示错误三元组所属集合,max(x,y) 指的是返回x和y之间较大的值,γ表示正确三元组损失函数得分与错误三元 组损失函数得分之间的距离;该目标函数的优化目标就是最大程度地将正确的三 元组和错误的三元组分离。
算法1展现了本发明设计的一种基于动态翻译的知识表示学习算法的详 细过程。在此算法中,首先对关系集R中的关系进行初始化,然后对关系进行单 位化处理;接着对实体集E中的实体e进行初始化,对每个关系进行单位化处理; 从样本集中取少量三元组并初始化三元组,对每个三元组都做以上操作,然后构 造负例三元组,采用随机梯度下降方法进行训练。
综上所述,一种基于动态翻译的表示学习方法,主要解决了TransE模型 在处理复杂关系时效率不高的问题;运用了动态翻译的思想,使翻译的原则更加 灵活;应用了面向关系的超平面投影的思想,将头尾实体映射至给定关系的超平 面来加以区分;训练得到融合后的新的向量表示。
上面是对本发明的具体实施方式进行描述,以便于本技术领域的技术人员 理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的 普通技术人员来讲,只要各种变化在所附的权力要求限制和确定的本发明的精神 和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (7)
1.一种基于动态翻译的知识图谱表示学习方法,其特征在于,该方法包括以下步骤:
S1、将动态翻译技术和向量嵌入相融合,得到新的翻译原则;
S2、引入投影到特定关系超平面的机制,使得实体在不同关系中有不同的角色;
S3、基于深度学习进行训练,训练此时知识图谱中实体和关系的新的向量表示。
2.根据权利要求1所述的一种基于动态翻译的知识图谱表示学习方法,其特征在于,所述步骤S1中,对于所有的三元组(h,r,t),假设h和r的嵌入是给定的,那么可以降低约束,使t是一个平面范围,而不是由TransE模型确定的一个固定向量或一组相同方向的向量;同样,假设h和t的嵌入是给定的,那么r的范围可以表示一个平面;假设r和t的嵌入是给定的,那么h的范围也可以表示为一个平面;将动态翻译模型与TransE模型相结合后,重新定义的翻译原则为:(h+αh)+(r+αr)≈(t+αt)#(1)
其中,h为头实体向量,r为关系向量,t为尾实体向量,αh、αr和αt分别为经过动态翻译后得到的头实体、关系和尾实体的向量表示。
5.根据权利要求1所述的一种基于动态翻译的知识图谱表示学习方法,其特征在于,所述步骤S3中,对模型进行训练时,首先需要通过正例三元组去构建负例三元组,针对不同的类型进行实体的替换;其次选择语义最相近的实体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110563626.3A CN113312492A (zh) | 2021-05-24 | 2021-05-24 | 一种基于动态翻译的知识图谱表示学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110563626.3A CN113312492A (zh) | 2021-05-24 | 2021-05-24 | 一种基于动态翻译的知识图谱表示学习方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113312492A true CN113312492A (zh) | 2021-08-27 |
Family
ID=77374327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110563626.3A Pending CN113312492A (zh) | 2021-05-24 | 2021-05-24 | 一种基于动态翻译的知识图谱表示学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113312492A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951499A (zh) * | 2017-03-16 | 2017-07-14 | 中国人民解放军国防科学技术大学 | 一种基于翻译模型的知识图谱表示方法 |
CN107590237A (zh) * | 2017-09-11 | 2018-01-16 | 桂林电子科技大学 | 一种基于动态翻译原则的知识图谱表示学习方法 |
CN110647620A (zh) * | 2019-09-23 | 2020-01-03 | 中国农业大学 | 一种基于置信超平面和词典信息的知识图谱表示学习方法 |
CN111209408A (zh) * | 2019-12-23 | 2020-05-29 | 华东师范大学 | 一种基于混合翻译模型的带时间知识图谱嵌入方法 |
US20200242444A1 (en) * | 2019-01-30 | 2020-07-30 | Baidu Usa Llc | Knowledge-graph-embedding-based question answering |
CN111581395A (zh) * | 2020-05-06 | 2020-08-25 | 西安交通大学 | 一种基于深度学习的模型融合三元组表示学习系统及方法 |
CN112131404A (zh) * | 2020-09-19 | 2020-12-25 | 哈尔滨工程大学 | 一种四险一金领域知识图谱中实体对齐方法 |
-
2021
- 2021-05-24 CN CN202110563626.3A patent/CN113312492A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951499A (zh) * | 2017-03-16 | 2017-07-14 | 中国人民解放军国防科学技术大学 | 一种基于翻译模型的知识图谱表示方法 |
CN107590237A (zh) * | 2017-09-11 | 2018-01-16 | 桂林电子科技大学 | 一种基于动态翻译原则的知识图谱表示学习方法 |
US20200242444A1 (en) * | 2019-01-30 | 2020-07-30 | Baidu Usa Llc | Knowledge-graph-embedding-based question answering |
CN110647620A (zh) * | 2019-09-23 | 2020-01-03 | 中国农业大学 | 一种基于置信超平面和词典信息的知识图谱表示学习方法 |
CN111209408A (zh) * | 2019-12-23 | 2020-05-29 | 华东师范大学 | 一种基于混合翻译模型的带时间知识图谱嵌入方法 |
CN111581395A (zh) * | 2020-05-06 | 2020-08-25 | 西安交通大学 | 一种基于深度学习的模型融合三元组表示学习系统及方法 |
CN112131404A (zh) * | 2020-09-19 | 2020-12-25 | 哈尔滨工程大学 | 一种四险一金领域知识图谱中实体对齐方法 |
Non-Patent Citations (2)
Title |
---|
张正航 等: "知识表示学习方法研究综述", 《计算机应用研究》 * |
陈晓军 等: "STransH:一种改进的基于模型的知识表示模型", 《计算机科学》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308158B (zh) | 一种基于部分特征对齐的多源领域自适应模型及方法 | |
CN112949647B (zh) | 三维场景描述方法、装置、电子设备和存储介质 | |
CN110516095B (zh) | 基于语义迁移的弱监督深度哈希社交图像检索方法和系统 | |
CN112347268A (zh) | 一种文本增强的知识图谱联合表示学习方法及装置 | |
CN111291556B (zh) | 基于实体义项的字和词特征融合的中文实体关系抽取方法 | |
CN110046671A (zh) | 一种基于胶囊网络的文本分类方法 | |
CN110598005A (zh) | 一种面向公共安全事件的多源异构数据知识图谱构建方法 | |
CN112699247A (zh) | 一种基于多类交叉熵对比补全编码的知识表示学习框架 | |
CN110909881B (zh) | 一种面向跨媒体知识推理任务的知识表示方法 | |
CN110598022B (zh) | 一种基于鲁棒深度哈希网络的图像检索系统与方法 | |
CN112115967A (zh) | 一种基于数据保护的图像增量学习方法 | |
CN113269089A (zh) | 基于深度学习的实时手势识别方法及系统 | |
US20230222768A1 (en) | Multiscale point cloud classification method and system | |
CN112035689A (zh) | 一种基于视觉转语义网络的零样本图像哈希检索方法 | |
CN110347853B (zh) | 一种基于循环神经网络的图像哈希码生成方法 | |
CN112668543B (zh) | 一种手模型感知的孤立词手语识别方法 | |
CN117765258A (zh) | 基于密度自适应和注意力机制的大规模点云语义分割方法 | |
CN116701665A (zh) | 基于深度学习的中医古籍知识图谱构建方法 | |
CN113312492A (zh) | 一种基于动态翻译的知识图谱表示学习方法 | |
CN113516118B (zh) | 一种图像与文本联合嵌入的多模态文化资源加工方法 | |
CN115661450A (zh) | 一种基于对比知识蒸馏的类别增量语义分割方法 | |
CN115481256A (zh) | 基于卷积四元数的逆向关系旋转嵌入知识表示方法及系统 | |
CN114218850A (zh) | 一种异构多关系图表示学习方法 | |
CN113052298A (zh) | 一种基于胶囊网络的三维模型检索方法 | |
CN111125308A (zh) | 一种支持语义联想的轻量级文本模糊搜索的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210827 |
|
RJ01 | Rejection of invention patent application after publication |