CN110688489A - 基于交互注意力的知识图谱推演方法、装置和存储介质 - Google Patents

基于交互注意力的知识图谱推演方法、装置和存储介质 Download PDF

Info

Publication number
CN110688489A
CN110688489A CN201910845838.3A CN201910845838A CN110688489A CN 110688489 A CN110688489 A CN 110688489A CN 201910845838 A CN201910845838 A CN 201910845838A CN 110688489 A CN110688489 A CN 110688489A
Authority
CN
China
Prior art keywords
knowledge
graph
knowledge graph
samples
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910845838.3A
Other languages
English (en)
Other versions
CN110688489B (zh
Inventor
王亚珅
张欢欢
谢海永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electronics Technology Group Corp CETC
Original Assignee
China Electronics Technology Group Corp CETC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electronics Technology Group Corp CETC filed Critical China Electronics Technology Group Corp CETC
Priority to CN201910845838.3A priority Critical patent/CN110688489B/zh
Publication of CN110688489A publication Critical patent/CN110688489A/zh
Application granted granted Critical
Publication of CN110688489B publication Critical patent/CN110688489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于交互注意力的知识图谱推演方法、装置和存储介质,基于实体、关系以及文本的向量化表示预测知识图谱中缺失的元素,提高知识图谱构推演的准确性。所述方法,包括:获取缺失实体或者关系的知识图谱;利用知识图谱预测模型获取已知实体或者关系的向量化表示,知识图谱预测模型为利用带有标签的文本语料库中的句子样本和/或知识图谱样本进行训练得到的,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和文本语料库中的句子样本协同训练实体和关系以及文本化关系的向量化表示;根据已知实体或者关系的向量化表示,确定缺失的元素。

Description

基于交互注意力的知识图谱推演方法、装置和存储介质
技术领域
本发明涉及知识图谱推演技术领域,尤其涉及一种基于交互注意力的知识图谱推演方法、装置和存储介质。
背景技术
知识图谱,又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形。知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成,其基本组成单位是“实体-关系-实体”三元组,构成网状的知识结构。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”,实体间通过关系相互联结。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力,本质是以语义三元组为基础的结构化的海量知识库。
知识图谱推演是基于知识图谱中已有的实体和关系,来补全知识图谱中缺失的实体或关系,是目前解决知识图谱“非完备性”难题的重要渠道。现有技术,通常将知识图谱中的知识(主要针对知识图谱中的实体或关系)与文本(主要针对文本中的词语)映射到同一语义向量空间中,在这种情况下,如何实现知识与文本的充分融合与消歧,成为知识图谱推演过程中的关键技术之一。现有的知识图谱推演方法中,广泛采纳远程监督策略,但是此类方法严重依赖知识和文本的“硬对齐”;而“软对齐”方法则依赖于语法分析(及句法分析),易产生传导性误差,从而降低了得到的知识图谱的准确性。
发明内容
本发明提供一种基于交互注意力的知识图谱推演方法、装置和存储介质,基于实体、关系以及文本的向量化表示根据缺失实体或者关系的知识图谱,预测缺失的元素,提高知识图谱构推演的准确性。
本发明采用的技术方案是提供一种基于交互注意力的知识图谱推演方法,包括:
获取缺失实体或者关系的知识图谱;
利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示,所述知识图谱预测模型为利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到的,其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
在一种可能的实施方式中,在所述知识图谱预测模型训练过程中,按照以下公式对待训练的模型参数进行训练:
Figure BDA0002195138470000021
其中:θ={θERW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
Figure BDA0002195138470000022
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000031
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
在一种可能的实施方式中,在所述知识图谱预测模型训练过程中,按照以下公式确定损失函数:
Figure BDA0002195138470000032
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
在一种可能的实施方式中,针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000033
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000034
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000041
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000042
Figure BDA0002195138470000043
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
在一种可能的实施方式中,针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure BDA0002195138470000044
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000045
Figure BDA0002195138470000046
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure BDA0002195138470000048
Ws是权重矩阵。
本发明还提供一种基于交互注意力的知识图谱推演装置,包括:
模型训练单元,用于利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到知识图谱预测模型;其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
获取单元,用于获取缺失实体或者关系的知识图谱;
预测单元,用于利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示;
推演单元,用于根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
在一种可能的实施方式中,所述模型训练单元,具体用于按照以下公式确定待训练的模型参数:
Figure BDA0002195138470000051
其中:θ={θERW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
Figure BDA0002195138470000052
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000053
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
在一种可能的实施方式中,所述模型训练单元,具体用于按照以下公式确定损失函数:
Figure BDA0002195138470000061
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
在一种可能的实施方式中,所述模型训练单元,具体用于针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元,具体用于如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000063
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元,具体用于如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000072
Figure BDA0002195138470000073
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
在一种可能的实施方式中,所述模型训练单元,具体用于针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000075
Figure BDA0002195138470000076
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rS为文本化关系rs对应的向量;
Figure BDA0002195138470000077
Figure BDA0002195138470000078
Ws是权重矩阵。
本发明还提供一种计算装置,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一知识图谱推演方法所述的步骤。
本发明还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一知识图谱推演方法所述的步骤。
采用上述技术方案,本发明至少具有下列优点:
本发明所述基于交互注意力的知识图谱推演方法、装置和存储介质中,利用带有标签的、文本语料库中的句子样本或者带有标签的知识图谱样本在同一语义空间协同训练以学习实体、关系或者文本化关系的向量化表示得到的知识图谱预测模型,利用得到的知识图谱预测模型,预测知识图谱中缺失的元素,或者推演知识图谱中实体间的隐含关系,或者将文本中的关系映射到知识图谱中个关系中,上述过程中,增强了知识图谱中的知识与文本蕴含的实体及关系的融合与消歧,从而提高了知识图谱推演的准确性。
附图说明
图1为本发明实施例的知识图谱推演方法流程图;
图2为本发明实施例的知识图谱推演装置流程图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
需要说明的是,本发明实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
知识图谱可以采用三元组(h,r,t)表示,其中,h表示知识图谱中的头实体,r表示知识图谱中的关系,t表示知识图谱中的尾实体。
为了增强知识图谱中的知识与纯文本蕴含的实体(及关系)的融合与消歧,提高知识图谱推演的准确性,本发明实施例中,实现对知识和文本的交互关联与协同分析,进而自动建模和增强有益特征的重要性,完成在同一语义空间按照协同训练学习知识和文本的向量化表示。
本发明实施例中,知识图谱预测模型的训练过程包含以下三个部分:1、联合表示学习,在统一的语义向量空间中,协同训练实体的向量化表示、关系的向量化表示、词语的向量化表示。具体地,可以利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;2、知识图谱表示学习,即基于知识图谱样本,训练实体的向量化表示和关系的向量化表示。在该过程中,使用第3部分衍生的文本化关系表示结果来完善知识图谱表示学习结果。具体地,可以利用带有标签的知识图谱样本训练实体或者关系的向量化表示;3、文本化关系表示学习,即基于文本语料库,训练包含实体对的句子中的文本化关系的向量化表示。在该过程中,使用第2部分衍生的知识图谱表示学习结果来完善文本化关系表示结果。具体地,可以利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示。本发明实施例中,知识图谱预测模型的每一部分训练可以采用随机梯度下降算法(Stochastic Gradient Descent,SGD)算法进行并行训练。
其中,在第一部分的训练过程中,联合表示学习过程需要训练的模型参数可以表示θ={θERW},本发明实施例中,可以按照以下公式对待训练的模型参数进行训练:
其中:G表示带有标签的知识图谱样本;T表示文本语料库中的句子样本;θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数;可以通过最大化知识图谱上的三元组的似然来获得;
Figure BDA0002195138470000102
可以通过最大化文本语料库中句子及其对应的文本化关系的似然来获得。
Figure BDA0002195138470000103
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000104
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率。
本发明实施例中,按照以下公式确定损失函数:
Figure BDA0002195138470000105
其中:λ是谐波因子,||θ||2是基于L2距离的归一化因子。
本发明实施例中,知识图谱预测模型的训练可以采用随机梯度下降算法(Stochastic Gradient Descent,SGD)算法进行并行训练。
需要说明的是,在训练开始时,模型参数{θERW}的初始值可以随机设定。
在针对知识图谱预测模型第二部分的训练过程中,本发明实施例中,将分解为条件概率
Figure BDA0002195138470000107
Figure BDA0002195138470000108
分别进行优化。即:知识图谱表示建模过程包括三种情况:缺失尾实体、缺失头实体和缺失关系。
具体实施时,如果缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000109
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
本发明实施例中,对于(h,r)(这种情况缺失尾实体),定义打分函数ft(h,r)=bt-‖t-(h+r)‖。基于该打分函数的条件概率可以表示为:
Figure BDA0002195138470000111
如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000112
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
具体地,对于(r,t)(这种情况缺失头实体),定义打分函数fh(r,t)=bh-‖h-(t-r)‖。其中,bh表示偏差,h、r、t分别表示头实体向量、关系向量、尾实体向量。基于该打分函数的条件概率可以表示为:
Figure BDA0002195138470000113
如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000114
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000121
Figure BDA0002195138470000122
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
具体实施时,对于关系r,假设在知识图谱中存在m个实体对{(h1,t1),…,(hm,tm)}符合该关系,而这些实体对所对应的文本化关系向量表示为本发明旨在促进知识图谱表示学习得到的显式关系向量r与上述隐式关系向量尽可能对应。每个文本化关系向量对应的注意力表示为:
Figure BDA0002195138470000124
其中,Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。注意力即为每个文本化关系向量对应的权重。
因此,可以生成进一步的对于关系r的文本化关系向量r*,如下:
Figure BDA0002195138470000125
综上,对于(h,t)(这种情况缺失关系),条件概率可以表示为:
Figure BDA0002195138470000126
其中,br是偏差。
在知识图谱预测模型第三部分的训练中,文本化关系抽取是指给定一个句子s,识别和向量化其所包含的实体之间的关系rs。本发明实施中,采用卷积神经网络完成对包含文本化关系抽取,该卷积神经网络结构包括输入层、卷积层、池化层和输出层,其中:
输入层:对于包含实体和实体的句子,本发明实施例,不仅仅利用词语的词向量完成建模,而是将词语向量与位置向量拼接作为输入从而完成建模。
卷积层:基于滑动窗口策略处理句子的输出,进而得到隐层向量。
池化层:基于最大池化策略对隐层向量进行处理,进而得到输出向量
Figure BDA00021951384700001312
对于每个关系rs,文本语料库中存在句子集合{s1,…,sn}蕴含关系rs并包含实体对(h,t),这些句子对应的输出向量表示为
Figure BDA0002195138470000131
输出层:每个句子输出向量对应的注意力(权重)可以表示为:
其中,Ws是权重矩阵,
Figure BDA0002195138470000133
表示句子的输出向量。
因此,可以生成进一步的对于关系r的文本化关系向量rs,如下:
Figure BDA0002195138470000134
基于文本化关系表达rs计算关系得分其中M表示用于计算关系得分的权重矩阵。
综上,模块3训练得到条件概率
Figure BDA0002195138470000136
如下:
Figure BDA0002195138470000137
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000138
Figure BDA0002195138470000139
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure BDA00021951384700001310
Figure BDA00021951384700001311
Ws是权重矩阵。
基于上述定义的损失函数、模型参数,利用带有标签的知识图谱样本和带有标签的文本语料库中的句子样本,对知识图谱预测模型进行训练,直至满足预先设定的迭代截止条件,例如,迭代截止条件可以设定为迭代次数达到设定的迭代次数,或者预测误差不大于设定的误差阈值等等,本发明实施例对此不进行限定。
基于训练得到的知识图谱预测模型,本发明实施例中,可以按照以下流程预测知识图谱中缺失的实体或者元素,如图1所示,可以包括以下步骤:
S11、获取缺失实体或者关系的知识图谱。
具体实施时,获取缺失某一元素的知识图谱,缺失的元素可以为头实体,关系或者尾实体中的任一项。
S12、利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示。
本步骤中,将获取的知识图谱输入到知识图谱预测模型中,得到一致元素对应的向量化表示。
S13、根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
具体实施时,知识图谱中的头实体向量h、关系向量r和尾实体向量t之间满足以下关系h+r=t,由此,在已知知识谱图中任两个元素对应的向量的情况下,可以根据上述公式确定出缺失的元素对应的向量,根据缺失的元素对应的向量,在元素名称与向量的对应关系中,查找与确定出的向量之间距离最近的元素名称作为缺失元素的名称。其中,可以采用余弦定理等来计算两个向量之间的距离,本发明实施例对此不进行限定。
本发明实施例提供的知识图谱推演方法中,无需依赖语法分析(及句法分析)和硬对齐,不仅降低了计算复杂度也避免了前序自然语言处理过程产生的错误对于后续知识推演过程的影响。而且,本发明实施例提供的知识图谱推演方法中,能够实现文本化关系表示学习和知识图谱表示学习的相互促进:在文本化关系表示学习过程中,知识图谱表示学习结果能够缓解远程监督策略带来的噪声;在知识图谱表示学习过程中,文本化关系学习结果能够辅助筛选出最优益的知识特征。本发明实施例提供的知识图谱推演方法,可应用于非严格对齐文本,具有较好的通用性。
基于相同的技术构思,本发明实施例还提供另一种知识图谱推演装置,如图2所示,包括:
模型训练单元21,用于利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到知识图谱预测模型;其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
获取单元22,用于获取缺失实体或者关系的知识图谱;
预测单元23,用于利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示;
推演单元24,用于根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
在一种可能的实施方式中,所述模型训练单元21,具体用于按照以下公式确定待训练的模型参数:
Figure BDA0002195138470000151
其中:θ={θERW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000153
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
在一种可能的实施方式中,所述模型训练单元21,具体用于按照以下公式确定损失函数:
Figure BDA0002195138470000161
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
在一种可能的实施方式中,所述模型训练单元,具体用于针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000162
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元21,具体用于如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000163
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元21,具体用于如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000172
Figure BDA0002195138470000173
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
在一种可能的实施方式中,所述模型训练单元21,具体用于针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure BDA0002195138470000174
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000175
Figure BDA0002195138470000176
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure BDA0002195138470000177
Figure BDA0002195138470000178
Ws是权重矩阵。
基于相同的技术构思,本发明还提供一种计算装置,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一知识图谱推演方法所述的步骤。
基于相同的技术构思,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一知识图谱推演方法所述的步骤。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。

Claims (10)

1.一种基于交互注意力的知识图谱推演方法,其特征在于,包括:
获取缺失实体或者关系的知识图谱;
利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示,所述知识图谱预测模型为利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到的,其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
2.根据权利要求1所述的方法,其特征在于,在所述知识图谱预测模型训练过程中,按照以下公式对待训练的模型参数进行训练:
Figure FDA0002195138460000011
其中:θ={θE,θR,θW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
Figure FDA0002195138460000012
Figure FDA0002195138460000013
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure FDA0002195138460000014
Figure FDA0002195138460000015
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
3.根据权利要求2所述的方法,其特征在于,在所述知识图谱预测模型训练过程中,按照以下公式确定损失函数:
Figure FDA0002195138460000021
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
4.根据权利要求2所述的方法,其特征在于,针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure FDA0002195138460000022
其中:
fh(h,r)=bt-||t-(h+r)||;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
5.根据权利要求2所述的方法,其特征在于,如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure FDA0002195138460000023
其中:
fh(r,t)=bh-||h-(t-r)||;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
6.根据权利要求2所述的方法,其特征在于,如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure FDA0002195138460000024
其中:
{(h1,t1),...,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure FDA0002195138460000032
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
7.根据权利要求2所述的方法,其特征在于,针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure FDA0002195138460000033
其中:
{s1,...,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure FDA0002195138460000035
Figure FDA0002195138460000036
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure FDA0002195138460000038
Ws是权重矩阵。
8.一种基于交互注意力的知识图谱推演装置,其特征在于,包括:
模型训练单元,用于利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到知识图谱预测模型;其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
获取单元,用于获取缺失实体或者关系的知识图谱;
预测单元,用于利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示;
推演单元,用于根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
9.一种计算装置,其特征在于,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
10.一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
CN201910845838.3A 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质 Active CN110688489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910845838.3A CN110688489B (zh) 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910845838.3A CN110688489B (zh) 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN110688489A true CN110688489A (zh) 2020-01-14
CN110688489B CN110688489B (zh) 2022-08-16

Family

ID=69108906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910845838.3A Active CN110688489B (zh) 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN110688489B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460171A (zh) * 2020-03-30 2020-07-28 支付宝(杭州)信息技术有限公司 服务方的目标用户识别方法及装置
CN111949764A (zh) * 2020-08-18 2020-11-17 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN112182320A (zh) * 2020-09-25 2021-01-05 中国建设银行股份有限公司 聚类数据处理方法、装置、计算机设备及存储介质
CN113468077A (zh) * 2021-09-06 2021-10-01 北京无疆脑智科技有限公司 认知能力测试方法、装置、电子设备和存储介质
CN114611816A (zh) * 2022-03-21 2022-06-10 中国电信股份有限公司 潜在事件预测方法、装置、设备及存储介质
WO2022126962A1 (zh) * 2020-12-16 2022-06-23 平安科技(深圳)有限公司 基于知识图谱的引导教唆语料的检测方法及其相关设备
CN116304083A (zh) * 2023-01-13 2023-06-23 北京控制工程研究所 性能-故障关系图谱的关系预测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630901A (zh) * 2015-12-21 2016-06-01 清华大学 一种知识图谱表示学习方法
CN105824802A (zh) * 2016-03-31 2016-08-03 清华大学 一种获取知识图谱向量化表示的方法以及装置
US20180089382A1 (en) * 2016-09-28 2018-03-29 International Business Machines Corporation Container-Based Knowledge Graphs for Determining Entity Relations in Non-Narrative Text
US20180276279A1 (en) * 2017-03-23 2018-09-27 International Business Machines Corporation Leveraging extracted entity and relation data to automatically filter data streams
CN109902171A (zh) * 2019-01-30 2019-06-18 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN109933674A (zh) * 2019-03-22 2019-06-25 中国电子科技集团公司信息科学研究院 一种基于属性聚合的知识图谱嵌入方法及其存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630901A (zh) * 2015-12-21 2016-06-01 清华大学 一种知识图谱表示学习方法
CN105824802A (zh) * 2016-03-31 2016-08-03 清华大学 一种获取知识图谱向量化表示的方法以及装置
US20180089382A1 (en) * 2016-09-28 2018-03-29 International Business Machines Corporation Container-Based Knowledge Graphs for Determining Entity Relations in Non-Narrative Text
US20180276279A1 (en) * 2017-03-23 2018-09-27 International Business Machines Corporation Leveraging extracted entity and relation data to automatically filter data streams
CN109902171A (zh) * 2019-01-30 2019-06-18 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN109933674A (zh) * 2019-03-22 2019-06-25 中国电子科技集团公司信息科学研究院 一种基于属性聚合的知识图谱嵌入方法及其存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MAXIMILIAN NICKEL ET AL: "A Review of Relational Machine Learning for Knowledge Graphs", 《PROCEEDINGS OF THE IEEE》 *
ZIKANG WANG ET AL: "Attention-based Multi-hop Reasoning for Knowledge Graph", 《2018 IEEE INTERNATIONAL CONFERENCE ON INTELLIGENCE AND SECURITY INFORMATICS (ISI)》 *
丁建辉 等: "知识图谱补全算法综述", 《信息通信技术》 *
鲍开放 等: "基于结构与文本联合表示的知识图谱补全方法", 《计算机工程》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460171A (zh) * 2020-03-30 2020-07-28 支付宝(杭州)信息技术有限公司 服务方的目标用户识别方法及装置
CN111460171B (zh) * 2020-03-30 2023-04-07 支付宝(杭州)信息技术有限公司 服务方的目标用户识别方法及装置
CN111949764A (zh) * 2020-08-18 2020-11-17 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN111949764B (zh) * 2020-08-18 2021-06-29 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN112182320A (zh) * 2020-09-25 2021-01-05 中国建设银行股份有限公司 聚类数据处理方法、装置、计算机设备及存储介质
CN112182320B (zh) * 2020-09-25 2023-12-26 中国建设银行股份有限公司 聚类数据处理方法、装置、计算机设备及存储介质
WO2022126962A1 (zh) * 2020-12-16 2022-06-23 平安科技(深圳)有限公司 基于知识图谱的引导教唆语料的检测方法及其相关设备
CN113468077A (zh) * 2021-09-06 2021-10-01 北京无疆脑智科技有限公司 认知能力测试方法、装置、电子设备和存储介质
CN114611816A (zh) * 2022-03-21 2022-06-10 中国电信股份有限公司 潜在事件预测方法、装置、设备及存储介质
CN114611816B (zh) * 2022-03-21 2024-02-27 中国电信股份有限公司 潜在事件预测方法、装置、设备及存储介质
CN116304083A (zh) * 2023-01-13 2023-06-23 北京控制工程研究所 性能-故障关系图谱的关系预测方法及装置
CN116304083B (zh) * 2023-01-13 2023-09-15 北京控制工程研究所 性能-故障关系图谱的关系预测方法及装置

Also Published As

Publication number Publication date
CN110688489B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN110688489B (zh) 基于交互注意力的知识图谱推演方法、装置和存储介质
CN110377903B (zh) 一种句子级实体和关系联合抽取方法
CN110059160B (zh) 一种端到端的基于上下文的知识库问答方法及装置
CN110287494A (zh) 一种基于深度学习bert算法的短文本相似匹配的方法
CN106897559B (zh) 一种面向多数据源的症状体征类实体识别方法及装置
CN109376222B (zh) 问答匹配度计算方法、问答自动匹配方法及装置
CN109800414B (zh) 语病修正推荐方法及系统
CN110737758A (zh) 用于生成模型的方法和装置
CN111400455A (zh) 基于知识图谱的问答系统的关系检测方法
CN115618045B (zh) 一种视觉问答方法、装置及存储介质
CN112749265B (zh) 一种基于多信息源的智能问答系统
CN113962219A (zh) 面向电力变压器知识检索和问答的语义匹配方法及系统
CN115599899B (zh) 基于飞行器知识图谱的智能问答方法、系统、设备及介质
CN114818717A (zh) 融合词汇和句法信息的中文命名实体识别方法及系统
CN116561538A (zh) 问答评分方法、问答评分装置、电子设备及存储介质
CN112599211B (zh) 一种医疗实体关系抽取方法及装置
CN112349294B (zh) 语音处理方法及装置、计算机可读介质、电子设备
CN113705207A (zh) 语法错误识别方法及装置
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN110334204B (zh) 一种基于用户记录的习题相似度计算推荐方法
CN116956925A (zh) 电子病历命名实体识别方法和装置、电子设备及存储介质
CN111291550A (zh) 一种中文实体提取方法及装置
CN115730221A (zh) 基于溯因推理的虚假新闻识别方法、装置、设备及介质
CN115757815A (zh) 知识图谱的构建方法、装置及存储介质
CN114692615A (zh) 一种针对小语种的小样本意图识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant