CN110688489B - 基于交互注意力的知识图谱推演方法、装置和存储介质 - Google Patents

基于交互注意力的知识图谱推演方法、装置和存储介质 Download PDF

Info

Publication number
CN110688489B
CN110688489B CN201910845838.3A CN201910845838A CN110688489B CN 110688489 B CN110688489 B CN 110688489B CN 201910845838 A CN201910845838 A CN 201910845838A CN 110688489 B CN110688489 B CN 110688489B
Authority
CN
China
Prior art keywords
knowledge
graph
entities
knowledge graph
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910845838.3A
Other languages
English (en)
Other versions
CN110688489A (zh
Inventor
王亚珅
张欢欢
谢海永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Electronic and Information Technology of CETC
Original Assignee
China Academy of Electronic and Information Technology of CETC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Electronic and Information Technology of CETC filed Critical China Academy of Electronic and Information Technology of CETC
Priority to CN201910845838.3A priority Critical patent/CN110688489B/zh
Publication of CN110688489A publication Critical patent/CN110688489A/zh
Application granted granted Critical
Publication of CN110688489B publication Critical patent/CN110688489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于交互注意力的知识图谱推演方法、装置和存储介质,基于实体、关系以及文本的向量化表示预测知识图谱中缺失的元素,提高知识图谱构推演的准确性。所述方法,包括:获取缺失实体或者关系的知识图谱;利用知识图谱预测模型获取已知实体或者关系的向量化表示,知识图谱预测模型为利用带有标签的文本语料库中的句子样本和/或知识图谱样本进行训练得到的,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和文本语料库中的句子样本协同训练实体和关系以及文本化关系的向量化表示;根据已知实体或者关系的向量化表示,确定缺失的元素。

Description

基于交互注意力的知识图谱推演方法、装置和存储介质
技术领域
本发明涉及知识图谱推演技术领域,尤其涉及一种基于交互注意力的知识图谱推演方法、装置和存储介质。
背景技术
知识图谱,又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形。知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成,其基本组成单位是“实体-关系-实体”三元组,构成网状的知识结构。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”,实体间通过关系相互联结。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力,本质是以语义三元组为基础的结构化的海量知识库。
知识图谱推演是基于知识图谱中已有的实体和关系,来补全知识图谱中缺失的实体或关系,是目前解决知识图谱“非完备性”难题的重要渠道。现有技术,通常将知识图谱中的知识(主要针对知识图谱中的实体或关系)与文本(主要针对文本中的词语)映射到同一语义向量空间中,在这种情况下,如何实现知识与文本的充分融合与消歧,成为知识图谱推演过程中的关键技术之一。现有的知识图谱推演方法中,广泛采纳远程监督策略,但是此类方法严重依赖知识和文本的“硬对齐”;而“软对齐”方法则依赖于语法分析(及句法分析),易产生传导性误差,从而降低了得到的知识图谱的准确性。
发明内容
本发明提供一种基于交互注意力的知识图谱推演方法、装置和存储介质,基于实体、关系以及文本的向量化表示根据缺失实体或者关系的知识图谱,预测缺失的元素,提高知识图谱构推演的准确性。
本发明采用的技术方案是提供一种基于交互注意力的知识图谱推演方法,包括:
获取缺失实体或者关系的知识图谱;
利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示,所述知识图谱预测模型为利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到的,其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
在一种可能的实施方式中,在所述知识图谱预测模型训练过程中,按照以下公式对待训练的模型参数进行训练:
Figure BDA0002195138470000021
其中:θ={θERW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
Figure BDA0002195138470000022
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000031
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
在一种可能的实施方式中,在所述知识图谱预测模型训练过程中,按照以下公式确定损失函数:
Figure BDA0002195138470000032
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
在一种可能的实施方式中,针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000033
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000034
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000041
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000042
Figure BDA0002195138470000043
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
在一种可能的实施方式中,针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure BDA0002195138470000044
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000045
Figure BDA0002195138470000046
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure BDA0002195138470000047
Figure BDA0002195138470000048
Ws是权重矩阵。
本发明还提供一种基于交互注意力的知识图谱推演装置,包括:
模型训练单元,用于利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到知识图谱预测模型;其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
获取单元,用于获取缺失实体或者关系的知识图谱;
预测单元,用于利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示;
推演单元,用于根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
在一种可能的实施方式中,所述模型训练单元,具体用于按照以下公式确定待训练的模型参数:
Figure BDA0002195138470000051
其中:θ={θERW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
Figure BDA0002195138470000052
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000053
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
在一种可能的实施方式中,所述模型训练单元,具体用于按照以下公式确定损失函数:
Figure BDA0002195138470000061
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
在一种可能的实施方式中,所述模型训练单元,具体用于针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000062
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元,具体用于如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000063
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元,具体用于如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000071
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000072
Figure BDA0002195138470000073
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
在一种可能的实施方式中,所述模型训练单元,具体用于针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure BDA0002195138470000074
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000075
Figure BDA0002195138470000076
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rS为文本化关系rs对应的向量;
Figure BDA0002195138470000077
Figure BDA0002195138470000078
Ws是权重矩阵。
本发明还提供一种计算装置,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一知识图谱推演方法所述的步骤。
本发明还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一知识图谱推演方法所述的步骤。
采用上述技术方案,本发明至少具有下列优点:
本发明所述基于交互注意力的知识图谱推演方法、装置和存储介质中,利用带有标签的、文本语料库中的句子样本或者带有标签的知识图谱样本在同一语义空间协同训练以学习实体、关系或者文本化关系的向量化表示得到的知识图谱预测模型,利用得到的知识图谱预测模型,预测知识图谱中缺失的元素,或者推演知识图谱中实体间的隐含关系,或者将文本中的关系映射到知识图谱中个关系中,上述过程中,增强了知识图谱中的知识与文本蕴含的实体及关系的融合与消歧,从而提高了知识图谱推演的准确性。
附图说明
图1为本发明实施例的知识图谱推演方法流程图;
图2为本发明实施例的知识图谱推演装置流程图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
需要说明的是,本发明实施例中的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。
在本文中提及的“多个或者若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
知识图谱可以采用三元组(h,r,t)表示,其中,h表示知识图谱中的头实体,r表示知识图谱中的关系,t表示知识图谱中的尾实体。
为了增强知识图谱中的知识与纯文本蕴含的实体(及关系)的融合与消歧,提高知识图谱推演的准确性,本发明实施例中,实现对知识和文本的交互关联与协同分析,进而自动建模和增强有益特征的重要性,完成在同一语义空间按照协同训练学习知识和文本的向量化表示。
本发明实施例中,知识图谱预测模型的训练过程包含以下三个部分:1、联合表示学习,在统一的语义向量空间中,协同训练实体的向量化表示、关系的向量化表示、词语的向量化表示。具体地,可以利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;2、知识图谱表示学习,即基于知识图谱样本,训练实体的向量化表示和关系的向量化表示。在该过程中,使用第3部分衍生的文本化关系表示结果来完善知识图谱表示学习结果。具体地,可以利用带有标签的知识图谱样本训练实体或者关系的向量化表示;3、文本化关系表示学习,即基于文本语料库,训练包含实体对的句子中的文本化关系的向量化表示。在该过程中,使用第2部分衍生的知识图谱表示学习结果来完善文本化关系表示结果。具体地,可以利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示。本发明实施例中,知识图谱预测模型的每一部分训练可以采用随机梯度下降算法(Stochastic Gradient Descent,SGD)算法进行并行训练。
其中,在第一部分的训练过程中,联合表示学习过程需要训练的模型参数可以表示θ={θERW},本发明实施例中,可以按照以下公式对待训练的模型参数进行训练:
Figure BDA0002195138470000091
其中:G表示带有标签的知识图谱样本;T表示文本语料库中的句子样本;θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数;
Figure BDA0002195138470000101
可以通过最大化知识图谱上的三元组的似然来获得;
Figure BDA0002195138470000102
可以通过最大化文本语料库中句子及其对应的文本化关系的似然来获得。
Figure BDA0002195138470000103
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000104
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率。
本发明实施例中,按照以下公式确定损失函数:
Figure BDA0002195138470000105
其中:λ是谐波因子,||θ||2是基于L2距离的归一化因子。
本发明实施例中,知识图谱预测模型的训练可以采用随机梯度下降算法(Stochastic Gradient Descent,SGD)算法进行并行训练。
需要说明的是,在训练开始时,模型参数{θERW}的初始值可以随机设定。
在针对知识图谱预测模型第二部分的训练过程中,本发明实施例中,将
Figure BDA0002195138470000106
分解为条件概率
Figure BDA0002195138470000107
Figure BDA0002195138470000108
分别进行优化。即:知识图谱表示建模过程包括三种情况:缺失尾实体、缺失头实体和缺失关系。
具体实施时,如果缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000109
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
本发明实施例中,对于(h,r)(这种情况缺失尾实体),定义打分函数ft(h,r)=bt-‖t-(h+r)‖。基于该打分函数的条件概率可以表示为:
Figure BDA0002195138470000111
如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000112
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
具体地,对于(r,t)(这种情况缺失头实体),定义打分函数fh(r,t)=bh-‖h-(t-r)‖。其中,bh表示偏差,h、r、t分别表示头实体向量、关系向量、尾实体向量。基于该打分函数的条件概率可以表示为:
Figure BDA0002195138470000113
如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000114
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000121
Figure BDA0002195138470000122
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
具体实施时,对于关系r,假设在知识图谱中存在m个实体对{(h1,t1),…,(hm,tm)}符合该关系,而这些实体对所对应的文本化关系向量表示为
Figure BDA0002195138470000123
本发明旨在促进知识图谱表示学习得到的显式关系向量r与上述隐式关系向量尽可能对应。每个文本化关系向量对应的注意力表示为:
Figure BDA0002195138470000124
其中,Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。注意力即为每个文本化关系向量对应的权重。
因此,可以生成进一步的对于关系r的文本化关系向量r*,如下:
Figure BDA0002195138470000125
综上,对于(h,t)(这种情况缺失关系),条件概率可以表示为:
Figure BDA0002195138470000126
其中,br是偏差。
在知识图谱预测模型第三部分的训练中,文本化关系抽取是指给定一个句子s,识别和向量化其所包含的实体之间的关系rs。本发明实施中,采用卷积神经网络完成对包含文本化关系抽取,该卷积神经网络结构包括输入层、卷积层、池化层和输出层,其中:
输入层:对于包含实体和实体的句子,本发明实施例,不仅仅利用词语的词向量完成建模,而是将词语向量与位置向量拼接作为输入从而完成建模。
卷积层:基于滑动窗口策略处理句子的输出,进而得到隐层向量。
池化层:基于最大池化策略对隐层向量进行处理,进而得到输出向量
Figure BDA00021951384700001312
对于每个关系rs,文本语料库中存在句子集合{s1,…,sn}蕴含关系rs并包含实体对(h,t),这些句子对应的输出向量表示为
Figure BDA0002195138470000131
输出层:每个句子输出向量对应的注意力(权重)可以表示为:
Figure BDA0002195138470000132
其中,Ws是权重矩阵,
Figure BDA0002195138470000133
表示句子的输出向量。
因此,可以生成进一步的对于关系r的文本化关系向量rs,如下:
Figure BDA0002195138470000134
基于文本化关系表达rs计算关系得分
Figure BDA0002195138470000135
其中M表示用于计算关系得分的权重矩阵。
综上,模块3训练得到条件概率
Figure BDA0002195138470000136
如下:
Figure BDA0002195138470000137
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000138
Figure BDA0002195138470000139
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure BDA00021951384700001310
Figure BDA00021951384700001311
Ws是权重矩阵。
基于上述定义的损失函数、模型参数,利用带有标签的知识图谱样本和带有标签的文本语料库中的句子样本,对知识图谱预测模型进行训练,直至满足预先设定的迭代截止条件,例如,迭代截止条件可以设定为迭代次数达到设定的迭代次数,或者预测误差不大于设定的误差阈值等等,本发明实施例对此不进行限定。
基于训练得到的知识图谱预测模型,本发明实施例中,可以按照以下流程预测知识图谱中缺失的实体或者元素,如图1所示,可以包括以下步骤:
S11、获取缺失实体或者关系的知识图谱。
具体实施时,获取缺失某一元素的知识图谱,缺失的元素可以为头实体,关系或者尾实体中的任一项。
S12、利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示。
本步骤中,将获取的知识图谱输入到知识图谱预测模型中,得到一致元素对应的向量化表示。
S13、根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
具体实施时,知识图谱中的头实体向量h、关系向量r和尾实体向量t之间满足以下关系h+r=t,由此,在已知知识谱图中任两个元素对应的向量的情况下,可以根据上述公式确定出缺失的元素对应的向量,根据缺失的元素对应的向量,在元素名称与向量的对应关系中,查找与确定出的向量之间距离最近的元素名称作为缺失元素的名称。其中,可以采用余弦定理等来计算两个向量之间的距离,本发明实施例对此不进行限定。
本发明实施例提供的知识图谱推演方法中,无需依赖语法分析(及句法分析)和硬对齐,不仅降低了计算复杂度也避免了前序自然语言处理过程产生的错误对于后续知识推演过程的影响。而且,本发明实施例提供的知识图谱推演方法中,能够实现文本化关系表示学习和知识图谱表示学习的相互促进:在文本化关系表示学习过程中,知识图谱表示学习结果能够缓解远程监督策略带来的噪声;在知识图谱表示学习过程中,文本化关系学习结果能够辅助筛选出最优益的知识特征。本发明实施例提供的知识图谱推演方法,可应用于非严格对齐文本,具有较好的通用性。
基于相同的技术构思,本发明实施例还提供另一种知识图谱推演装置,如图2所示,包括:
模型训练单元21,用于利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到知识图谱预测模型;其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
获取单元22,用于获取缺失实体或者关系的知识图谱;
预测单元23,用于利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示;
推演单元24,用于根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素。
在一种可能的实施方式中,所述模型训练单元21,具体用于按照以下公式确定待训练的模型参数:
Figure BDA0002195138470000151
其中:θ={θERW},表示待训练的模型参数;
G表示带有标签的知识图谱样本;
T表示文本语料库中的句子样本;
Figure BDA0002195138470000152
表示在知识图谱样本G中三元组(h,r,t)的第一条件概率,h、r、t分别表示知识图谱样本中的头实体、关系和尾实体;
Figure BDA0002195138470000153
表示在文本语料库T中句子样本s及其所蕴含的文本化关系rs的第二条件概率;
θE、θR和θW分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数。
在一种可能的实施方式中,所述模型训练单元21,具体用于按照以下公式确定损失函数:
Figure BDA0002195138470000161
其中:
λ是谐波因子,||θ||2是基于L2距离的归一化因子。
在一种可能的实施方式中,所述模型训练单元,具体用于针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000162
其中:
ft(h,r)=bt-‖t-(h+r)‖;
bt表示第一偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元21,具体用于如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000163
其中:
fh(r,t)=bh-‖h-(t-r)‖;
bh表示第二偏差;
h、r和t分别表示头实体h对应的向量、关系r对应的向量和尾实体t对应的向量。
在一种可能的实施方式中,所述模型训练单元21,具体用于如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure BDA0002195138470000171
其中:
{(h1,t1),…,(hm,tm)}表示所述知识图谱样本中存在的符合关系r的m个实体对;
br是第三偏差;
Figure BDA0002195138470000172
Figure BDA0002195138470000173
Ws是权重矩阵,Mr是关系r对应的文本嵌入矩阵,bs是偏差向量。
在一种可能的实施方式中,所述模型训练单元21,具体用于针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure BDA0002195138470000174
其中:
{s1,…,sn}表示文本语料库中蕴含文本化关系rs并包含实体对(h,t)的句子集合,这些句子对应的输出向量表示为
Figure BDA0002195138470000175
Figure BDA0002195138470000176
表示文本化关系rs对应的得分,M表示用于计算文本化关系rs对应的得分的权重矩阵,rs为文本化关系rs对应的向量;
Figure BDA0002195138470000177
Figure BDA0002195138470000178
Ws是权重矩阵。
基于相同的技术构思,本发明还提供一种计算装置,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一知识图谱推演方法所述的步骤。
基于相同的技术构思,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一知识图谱推演方法所述的步骤。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。

Claims (4)

1.一种基于交互注意力的知识图谱推演方法,其特征在于,包括:
获取缺失实体或者关系的知识图谱;
利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示,所述知识图谱预测模型为利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到的,其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素;
在所述知识图谱预测模型训练过程中,按照以下公式对待训练的模型参数进行训练:
Figure DEST_PATH_IMAGE001
其中:
Figure 726646DEST_PATH_IMAGE002
,表示待训练的模型参数;
Figure DEST_PATH_IMAGE003
表示带有标签的知识图谱样本;
Figure 483511DEST_PATH_IMAGE004
表示文本语料库中的句子样本;
Figure DEST_PATH_IMAGE005
Figure 684686DEST_PATH_IMAGE006
表示在知识图谱样本
Figure 2534DEST_PATH_IMAGE003
Figure DEST_PATH_IMAGE007
三元组
Figure 642463DEST_PATH_IMAGE008
的第一条件概率,
Figure 96578DEST_PATH_IMAGE009
Figure 501277DEST_PATH_IMAGE010
分别表示知识图谱样本中的头实体、关系和尾实体;
Figure 40843DEST_PATH_IMAGE011
Figure 953304DEST_PATH_IMAGE012
表示在文本语料库
Figure 261926DEST_PATH_IMAGE013
中句子样本
Figure 336061DEST_PATH_IMAGE014
及其所蕴含的文本化关系
Figure 425240DEST_PATH_IMAGE015
的第二条件概率;
Figure DEST_PATH_IMAGE016
Figure 111698DEST_PATH_IMAGE017
Figure DEST_PATH_IMAGE018
分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数;
在所述知识图谱预测模型训练过程中,按照以下公式确定损失函数:
Figure 71564DEST_PATH_IMAGE019
其中:
Figure DEST_PATH_IMAGE020
是谐波因子,
Figure 785442DEST_PATH_IMAGE021
是基于
Figure DEST_PATH_IMAGE022
距离的归一化因子;
如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure 158655DEST_PATH_IMAGE023
其中:
Figure DEST_PATH_IMAGE024
Figure 117646DEST_PATH_IMAGE025
表示第一偏差;
Figure DEST_PATH_IMAGE026
Figure 56652DEST_PATH_IMAGE027
Figure DEST_PATH_IMAGE028
分别表示头实体
Figure 207010DEST_PATH_IMAGE029
对应的向量、关系
Figure DEST_PATH_IMAGE030
对应的向量和尾实体
Figure 303404DEST_PATH_IMAGE031
对应的向量;
如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure DEST_PATH_IMAGE032
其中:
Figure 767884DEST_PATH_IMAGE033
Figure DEST_PATH_IMAGE034
表示第二偏差;
Figure 233500DEST_PATH_IMAGE035
Figure DEST_PATH_IMAGE036
分别表示头实体
Figure 554760DEST_PATH_IMAGE029
对应的向量、关系
Figure 669609DEST_PATH_IMAGE030
对应的向量和尾实体
Figure 203358DEST_PATH_IMAGE031
对应的向量;
如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure 195585DEST_PATH_IMAGE037
其中:
Figure DEST_PATH_IMAGE038
表示所述知识图谱样本中存在的符合关系
Figure 687746DEST_PATH_IMAGE030
Figure 522847DEST_PATH_IMAGE039
个实体对;
Figure DEST_PATH_IMAGE040
是第三偏差;
Figure 627332DEST_PATH_IMAGE041
Figure 67540DEST_PATH_IMAGE042
Figure 871548DEST_PATH_IMAGE043
是权重矩阵,
Figure 193945DEST_PATH_IMAGE044
是关系
Figure 7180DEST_PATH_IMAGE045
对应的文本嵌入矩阵,
Figure DEST_PATH_IMAGE046
是偏差向量;
针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure 567475DEST_PATH_IMAGE047
其中:
Figure DEST_PATH_IMAGE048
表示文本语料库中蕴含文本化关系
Figure 789439DEST_PATH_IMAGE049
并包含实体对
Figure DEST_PATH_IMAGE050
的句子集合,这些句子对应的输出向量表示为
Figure 67974DEST_PATH_IMAGE051
Figure DEST_PATH_IMAGE052
Figure 12796DEST_PATH_IMAGE053
表示文本化关系
Figure 834121DEST_PATH_IMAGE049
对应的得分,
Figure DEST_PATH_IMAGE054
表示用于计算文本化关系
Figure 606031DEST_PATH_IMAGE049
对应的得分的权重矩阵,
Figure 637441DEST_PATH_IMAGE055
为文本化关系
Figure 854795DEST_PATH_IMAGE049
对应的向量;
Figure DEST_PATH_IMAGE056
Figure 389682DEST_PATH_IMAGE057
Figure DEST_PATH_IMAGE058
是权重矩阵。
2.一种基于交互注意力的知识图谱推演装置,其特征在于,包括:
模型训练单元,用于利用带有标签的、文本语料库中的句子样本和/或带有标签的知识图谱样本进行训练得到知识图谱预测模型;其中,利用带有标签的知识图谱样本训练实体或者关系的向量化表示;利用带有标签的文本语料库中的句子样本训练文本化关系的向量化表示;利用带有标签的知识图谱样本和带有标签的、文本语料库中的句子样本协同训练实体和关系的向量化表示以及文本化关系的向量化表示;
获取单元,用于获取缺失实体或者关系的知识图谱;
预测单元,用于利用知识图谱预测模型,获取所述知识图谱中已知实体或者关系的向量化表示;
推演单元,用于根据已知实体或者关系的向量化表示,确定知识图谱中缺失的元素;
在所述知识图谱预测模型训练过程中,按照以下公式对待训练的模型参数进行训练:
Figure 801334DEST_PATH_IMAGE059
其中:
Figure DEST_PATH_IMAGE060
,表示待训练的模型参数;
Figure 788881DEST_PATH_IMAGE061
表示带有标签的知识图谱样本;
Figure DEST_PATH_IMAGE062
表示文本语料库中的句子样本;
Figure 341085DEST_PATH_IMAGE063
Figure DEST_PATH_IMAGE064
表示在知识图谱样本
Figure 730478DEST_PATH_IMAGE061
中三元组
Figure 483671DEST_PATH_IMAGE007
的第一条件概率,
Figure 991138DEST_PATH_IMAGE008
分别表示知识图谱样本中的头实体、关系和尾实体;
Figure 550295DEST_PATH_IMAGE065
Figure DEST_PATH_IMAGE066
表示在文本语料库
Figure 794195DEST_PATH_IMAGE062
中句子样本
Figure 983868DEST_PATH_IMAGE067
及其所蕴含的文本化关系
Figure DEST_PATH_IMAGE068
的第二条件概率;
Figure 946007DEST_PATH_IMAGE069
Figure DEST_PATH_IMAGE070
Figure 403796DEST_PATH_IMAGE071
分别表示实体对应的模型参数、关系对应的模型参数和词语对应的模型参数;
在所述知识图谱预测模型训练过程中,按照以下公式确定损失函数:
Figure DEST_PATH_IMAGE072
其中:
Figure 502202DEST_PATH_IMAGE020
是谐波因子,
Figure 862776DEST_PATH_IMAGE021
是基于
Figure 46633DEST_PATH_IMAGE022
距离的归一化因子
针对知识图谱样本,如果所述知识图谱样本缺失尾实体,则按照以下公式确定所述第一条件概率:
Figure 245795DEST_PATH_IMAGE073
其中:
Figure DEST_PATH_IMAGE074
Figure 464287DEST_PATH_IMAGE025
表示第一偏差;
Figure 730183DEST_PATH_IMAGE026
Figure 932494DEST_PATH_IMAGE027
Figure 840407DEST_PATH_IMAGE028
分别表示头实体
Figure 444564DEST_PATH_IMAGE029
对应的向量、关系
Figure 881362DEST_PATH_IMAGE030
对应的向量和尾实体
Figure 72434DEST_PATH_IMAGE031
对应的向量;
如果所述知识图谱样本缺失头实体,则按照以下公式确定所述第一条件概率:
Figure 987300DEST_PATH_IMAGE075
其中:
Figure DEST_PATH_IMAGE076
Figure 508280DEST_PATH_IMAGE034
表示第二偏差;
Figure 115979DEST_PATH_IMAGE035
Figure 558462DEST_PATH_IMAGE036
分别表示头实体
Figure 277019DEST_PATH_IMAGE029
对应的向量、关系
Figure 357233DEST_PATH_IMAGE030
对应的向量和尾实体
Figure 135833DEST_PATH_IMAGE031
对应的向量;
如果所述知识图谱样本缺失关系,则按照以下公式确定所述第一条件概率:
Figure 3295DEST_PATH_IMAGE077
其中:
Figure 650177DEST_PATH_IMAGE038
表示所述知识图谱样本中存在的符合关系
Figure 958798DEST_PATH_IMAGE030
Figure 32934DEST_PATH_IMAGE039
个实体对;
Figure 59795DEST_PATH_IMAGE040
是第三偏差;
Figure 114DEST_PATH_IMAGE041
Figure 163243DEST_PATH_IMAGE042
Figure 611541DEST_PATH_IMAGE043
是权重矩阵,
Figure 515912DEST_PATH_IMAGE044
是关系
Figure 379963DEST_PATH_IMAGE045
对应的文本嵌入矩阵,
Figure 522232DEST_PATH_IMAGE046
是偏差向量;
针对文本语料库中的句子样本,按照以下公式确定所述第二条件概率:
Figure DEST_PATH_IMAGE078
其中:
Figure 174055DEST_PATH_IMAGE048
表示文本语料库中蕴含文本化关系
Figure 909930DEST_PATH_IMAGE049
并包含实体对
Figure 639988DEST_PATH_IMAGE050
的句子集合,这些句子对应的输出向量表示为
Figure 902342DEST_PATH_IMAGE051
Figure 630127DEST_PATH_IMAGE052
Figure 712353DEST_PATH_IMAGE053
表示文本化关系
Figure 183785DEST_PATH_IMAGE049
对应的得分,
Figure 67690DEST_PATH_IMAGE054
表示用于计算文本化关系
Figure 700796DEST_PATH_IMAGE049
对应的得分的权重矩阵,
Figure 739160DEST_PATH_IMAGE055
为文本化关系
Figure 873338DEST_PATH_IMAGE049
对应的向量;
Figure 720071DEST_PATH_IMAGE056
Figure 914292DEST_PATH_IMAGE057
Figure 846476DEST_PATH_IMAGE058
是权重矩阵。
3.一种计算装置,其特征在于,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1所述的方法的步骤。
4.一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1所述的方法的步骤。
CN201910845838.3A 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质 Active CN110688489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910845838.3A CN110688489B (zh) 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910845838.3A CN110688489B (zh) 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN110688489A CN110688489A (zh) 2020-01-14
CN110688489B true CN110688489B (zh) 2022-08-16

Family

ID=69108906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910845838.3A Active CN110688489B (zh) 2019-09-09 2019-09-09 基于交互注意力的知识图谱推演方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN110688489B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460171B (zh) * 2020-03-30 2023-04-07 支付宝(杭州)信息技术有限公司 服务方的目标用户识别方法及装置
CN111949764B (zh) * 2020-08-18 2021-06-29 桂林电子科技大学 一种基于双向注意力机制的知识图谱补全方法
CN112182320B (zh) * 2020-09-25 2023-12-26 中国建设银行股份有限公司 聚类数据处理方法、装置、计算机设备及存储介质
CN112528040B (zh) * 2020-12-16 2024-03-19 平安科技(深圳)有限公司 基于知识图谱的引导教唆语料的检测方法及其相关设备
CN113468077B (zh) * 2021-09-06 2021-12-10 北京无疆脑智科技有限公司 认知能力测试方法、装置、电子设备和存储介质
CN114611816B (zh) * 2022-03-21 2024-02-27 中国电信股份有限公司 潜在事件预测方法、装置、设备及存储介质
CN116304083B (zh) * 2023-01-13 2023-09-15 北京控制工程研究所 性能-故障关系图谱的关系预测方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630901A (zh) * 2015-12-21 2016-06-01 清华大学 一种知识图谱表示学习方法
CN105824802B (zh) * 2016-03-31 2018-10-30 清华大学 一种获取知识图谱向量化表示的方法以及装置
US11823798B2 (en) * 2016-09-28 2023-11-21 Merative Us L.P. Container-based knowledge graphs for determining entity relations in non-narrative text
US10621177B2 (en) * 2017-03-23 2020-04-14 International Business Machines Corporation Leveraging extracted entity and relation data to automatically filter data streams
CN109902171B (zh) * 2019-01-30 2020-12-25 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN109933674B (zh) * 2019-03-22 2021-06-04 中国电子科技集团公司信息科学研究院 一种基于属性聚合的知识图谱嵌入方法及其存储介质

Also Published As

Publication number Publication date
CN110688489A (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN110688489B (zh) 基于交互注意力的知识图谱推演方法、装置和存储介质
CN110737758B (zh) 用于生成模型的方法和装置
CN109800414B (zh) 语病修正推荐方法及系统
CN110704621B (zh) 文本处理方法、装置及存储介质和电子设备
CN106897559B (zh) 一种面向多数据源的症状体征类实体识别方法及装置
CN110287494A (zh) 一种基于深度学习bert算法的短文本相似匹配的方法
CN109885660A (zh) 一种知识图谱赋能的基于信息检索的问答系统和方法
CN111400455A (zh) 基于知识图谱的问答系统的关系检测方法
CN112749265B (zh) 一种基于多信息源的智能问答系统
CN113962219A (zh) 面向电力变压器知识检索和问答的语义匹配方法及系统
CN115599899B (zh) 基于飞行器知识图谱的智能问答方法、系统、设备及介质
CN114818717A (zh) 融合词汇和句法信息的中文命名实体识别方法及系统
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN115438674A (zh) 实体数据处理、实体链接方法、装置和计算机设备
CN117648429B (zh) 基于多模态自适应检索式增强大模型的问答方法及系统
CN112599211B (zh) 一种医疗实体关系抽取方法及装置
CN112349294B (zh) 语音处理方法及装置、计算机可读介质、电子设备
CN113705207A (zh) 语法错误识别方法及装置
CN116757195A (zh) 一种基于提示学习的隐性情感识别方法
Karpagam et al. Deep learning approaches for answer selection in question answering system for conversation agents
CN116011450A (zh) 分词模型训练方法、系统、设备、存储介质及分词方法
CN115730221A (zh) 基于溯因推理的虚假新闻识别方法、装置、设备及介质
CN113157932B (zh) 基于知识图谱表示学习的隐喻计算和装置
CN109933788B (zh) 类型确定方法、装置、设备和介质
CN113011141A (zh) 佛经注解模型训练方法、佛经注解生成方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant