CN113360670B - 一种基于事实上下文的知识图谱补全方法及系统 - Google Patents
一种基于事实上下文的知识图谱补全方法及系统 Download PDFInfo
- Publication number
- CN113360670B CN113360670B CN202110643541.6A CN202110643541A CN113360670B CN 113360670 B CN113360670 B CN 113360670B CN 202110643541 A CN202110643541 A CN 202110643541A CN 113360670 B CN113360670 B CN 113360670B
- Authority
- CN
- China
- Prior art keywords
- fact
- entity
- negative sample
- entities
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Library & Information Science (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种基于事实上下文的知识图谱补全方法及系统,包括事实信息编码和事实信息融合,事实信息编码的目标是得到事实的向量表示,首先通过门控循环单元来捕获事实中头实体、关系、尾实体的序列依赖,随后利用卷积神经网络来对门控循环单元的输出进行特征提取,从而得到事实的整体向量表示;事实信息融合的目标是将事实信息编码得到的事实特征向量与该事实下的头实体、关系、尾实体各自的特征向量进行融合,通过评分函数对融合事实信息后的实体和关系进行计算,实现知识图谱的补全。本发明能够提高模型在知识图谱补全任务的性能。
Description
技术领域
本发明属于大数据信息处理技术领域,具体涉及一种基于事实上下文的知识图谱补全方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
知识图谱是一种结构化的语义知识库,它通过符号形式描述客观世界中的概念及其相互关系。知识图谱通常由一系列事实的构成,这些事实又称为知识。在静态知识图谱中事实被构建成(头实体,关系,尾实体)形式的三元组,在时间知识图谱中事实通常被构建成(头实体,关系,尾实体,时间)形式的四元组。
目前,知识图谱在知识问答、智能推荐等众多场景中得到了广泛应用,是人工智能领域中的重要研究内容。由于大部分现有的知识图谱是通过人工或半自动的方式从网络资源中提取数据而构建的,因此在构建过程中无法完整和全面地将现实世界中的所有事实加入到知识图谱中。尽管知识图谱在持续不断的扩充新的内容,现有的知识图谱仍然存在着稀疏性和不完整性的问题。据统计,Freebase中有71%的人类实体缺失出生地信息,DBpedia中有58%的科学家实体缺失研究方向的信息。这些稀疏性和不完整性的问题将会影响知识图谱在各个应用场景下的实际效果,因此知识图谱补全成为学术界和工业界的研究热点。
知识图谱补全旨在找到现实世界中应该存在但在知识图谱中缺失的事实,提高知识图谱的完整性。现有的知识图谱补全方法主要是通过将知识图谱中的实体和关系嵌入到低维稠密向量空间中,并通过计算实体和关系在向量空间中的距离或相似度来判断它们之间是否存在一定联系,从而实现知识图谱补全。然而,现有方法存在着一些不足:一方面,它们主要关注在实体和关系本身而未考虑事实上下文,无法更好地学习到实体和关系在不同事实下的语义信息;另一方面,负采样是知识图谱补全过程中重要步骤,现有的负采样策略主要通过随机替换事实中的头实体或尾实体的方式来生成负样本,这往往会导致所生成的负样本质量不高,影响知识图谱补全的效果。
发明内容
本发明为了解决上述问题,提出了一种基于事实上下文的知识图谱补全方法及系统,本发明能够保证模型每次训练迭代过程都能够有一定的反馈,提高模型在知识图谱补全任务的性能。
根据一些实施例,本发明采用如下技术方案:
一种基于事实上下文的知识图谱补全方法,包括以下步骤:
对知识图谱中的实体、关系进行编码处理和嵌入表示,获得实体和关系的表示向量;
利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征,得到事实的正向和反向嵌入向量表示;
对事实的正向和反向的嵌入向量表示进行特征融合,最终得到事实的整体嵌入向量表示;
基于深度神经网络对事实整体的嵌入向量表示和当前事实下的实体和关系进行特征融合,使实体和关系映射到对应的事实空间中;
基于深度神经网络构造事实评估模型,通过预训练后的事实评估模型生成与正样本保持近似语义的负样本,利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本;
构造基于空间距离的评分函数和激活函数的评分函数,通过计算头实体、关系、尾实体的嵌入向量表示的对应的空间距离以及激活函数输出数值来判断由当前实体和关系构成的事实的合理性;
通过事实的合理性分数构造损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数,完成模型的训练,利用训练好的模型处理判别新的事实的合理性分数,将满足设定条件的事实加入到知识图谱中,完成知识图谱补全。
作为可选择的实施方式,对知识图谱中的实体、关系进行编码处理和嵌入表示的具体过程包括:构建索引代替实体和关系名称并通过实体和关系的索引来对实体和关系进行嵌入表示学习,将实体和关系嵌入到向量空间中,获得实体和关系的表示向量。
作为可选择的实施方式,利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征的具体过程包括:构造Bi-GRU,并将实体和关系的向量表示按照头实体、关系、尾实体的顺序输入到Bi-GRU中,通过Bi-GRU提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征。
作为可选择的实施方式,对事实的正向和反向的嵌入向量表示进行特征融合的具体过程包括:将所述事实的正向和反向的嵌入向量表示输入到卷积神经网络当中,通过卷积神经网络对事实的正向和反向的嵌入向量表示进行特征融合。
作为可选择的实施方式,使实体和关系映射到对应的事实空间中的具体过程包括:构造基于事实的嵌入模型和基于事实的知识卷积神经网络嵌入模型,使实体和关系获得当前事实的上下文语境。
作为可选择的实施方式,利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本的具体过程包括:
通过sigmod激活函数得到当前负样本的合理性分数,通过使用训练数据集对其进行预训练;
根据负样本合理性分数对负样本进行排序,基于TopK算法构造负样本候选集,最终在负样本候选集中进行随机选择来作为知识图谱补全模型的负样本。
作为可选择的实施方式,通过事实的合理性分数构造损失函数并计算相应误差的具体过程包括:通过事实的合理性分数构造最大边界损失函数和交叉熵损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数。
一种基于事实上下文的知识图谱补全系统,包括:
嵌入表示模块,被配置为对知识图谱中的实体、关系进行编码处理,获得实体和关系的表示向量;
双向特征表示模块,被配置为利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征,得到事实的正向和反向嵌入向量表示;
事实信息编码模块,被配置为对事实的正向和反向的嵌入向量表示进行特征融合,最终得到事实的整体嵌入向量表示;
特征融合模块,被配置为基于深度神经网络对事实整体的嵌入向量表示和当前事实下的实体和关系进行特征融合,使实体和关系映射到对应的事实空间中;
负样本生成模块,被配置为基于深度神经网络构造事实评估模型,通过预训练后的事实评估模型生成与正样本保持近似语义的负样本,利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本;
补全模型训练模块,被配置为构造基于空间距离的评分函数和激活函数的评分函数,通过计算头实体、关系、尾实体的嵌入向量表示的对应的空间距离以及激活函数输出数值来判断由当前实体和关系构成的事实的合理性,通过事实的合理性分数构造损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数,完成模型的训练,以利用训练好的模型处理判别新的事实的合理性分数,将满足设定条件的事实加入到知识图谱中,完成知识图谱补全。
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法中的步骤。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法中的步骤。
与现有技术相比,本发明的有益效果为:
(1)本发明提供了一种端到端的知识图谱补全方法,能够评估现有知识图谱所缺少的知识,并预测新的知识添加到知识图谱中,解决了知识图谱的不完整性和稀疏性问题,提高了知识图谱在应用场景的效果。
(2)本发明通过融合事实信息上下文和负采样策略两个角度对知识图谱补全方法进行了优化,从而达到提高知识图谱补全方法准确性的目的。
(3)本发明在知识图谱补全方法中考虑了事实信息的上下文,通过事实信息编码器模块学习事实的特征,通过事实信息融合模块将学习好的事实特征与对应的实体和关系的表示进行特征融合。通过融合事实信息可以使知识图谱中的实体和关系与当前事实的语义相结合,这可以增强实体和关系嵌入表示的表达能力从而提高知识图谱补全任务的效果,并且由于同一实体在不同的事实下有不同的嵌入表示,因此该方法在一定程度上解决了TransE模型无法处理多对多关系的缺陷。值得一提的是,由于时间知识图谱中的事实含有时间属性,因此融合事实信息的知识图谱补全方法可以运用到时间知识图谱补全任务中。
(4)本发明提供了预训练评估模型对传统的负采样策略进行了优化,该模型生成的负样本能够与正样本保持一个较为相近的语义,这解决了因负样本质量较差而导致的知识图谱补全模型的损失函数数值较低使模型得不到误差反馈从而模型参数不更新的问题。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为实施例一提供的融合事实上下文的知识图谱补全方法的整体流程图;
图2为实施例一提供的融合事实上下文的知识图谱补全方法的模型示意图;
图3为实施例一提供的预训练评估模型的负采样优化策略流程图;
图4为实施例一提供的负样本评估模型的模型示意图;
图5为实施例一提供的融合事实上下文的知识图谱补全模型的超参数敏感性对比图。
图6为实施例一提供的融合事实上下文的知识图谱补全模型的消融实验结果图。
图7为实施例一提供的预训练评估模型的负采样后知识图谱补全效果对比图。
图8为实施例一提供的融合事实上下文的知识图谱补全装置结构示意图。
图9为实施例一提供的融合事实上下文的知识图谱补全实施例流程图。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一:
融合事实上下文的知识图谱补全方法,包括事实信息编码、事实信息融合两部分组成。其中,事实信息编码的目标是得到事实的向量表示,首先通过门控循环单元(GatedRecurrent Unit,GRU)来捕获事实中头实体、关系、尾实体的序列依赖,随后利用卷积神经网络(Convolutional Neural Network,CNN)来对门控循环单元的输出进行特征提取,从而得到事实的整体向量表示。
事实信息融合的目标是将事实信息编码得到的事实特征向量与该事实下的头实体、关系、尾实体各自的特征向量进行融合,从而构造了F-TransE和F-ConvKB模型,最终通过评分函数对融合事实信息后的实体和关系进行计算,实现知识图谱的补全。
同时,本公开优化了知识图谱补全过程中的负采样策略,提供了一种基于预训练评估模型的负采样优化方法(Pre-training Negative Sampling,PTN),该方法使用预训练评估模型代替传统的采用随机替换头实体或尾实体的方法进行负采样。负样本评估模型由深度神经网络和三元嵌入矩阵组(Triple Embedding Matrix Pair,TEMP)构成。
其中三元嵌入矩阵组为头实体、关系、尾实体的嵌入表示分别构建了相应的映射矩阵,通过三元嵌入矩阵组可以将头实体、关系、尾实体的嵌入表示映射到对应的向量空间中,其通过矩阵映射后的向量将被拼接并作为深度神经网络的输入,最后深度神经网络将输出当前事实的分数。由于该评估模型已经进行预训练,因此其有一定的先验知识。在进行负采样时,该评估模型可以对生成的负样本进行一个合理性判别,过滤掉一些合理性分数过低的负样本,保证模型每次训练迭代过程都能够有一定的反馈,从而提高模型在知识图谱补全任务的性能。
具体的,如图1和图9所示,包括:
A.对知识图谱的实体和关系进行数据进行采集和预处理,包含建立数据索引、构造三元组和四元组的事实、数据定义并存储。
具体地,基于维基百科、词网和事件数据源的知识图谱数据为应用实例,分别获得常识性知识、词语类和事件类数据集,并将数据集分为训练数据集、验证数据集和测试数据集,其数据统计信息如表1所示。
表1数据集的基本统计信息
B.基于知识图谱中的关系与实体在拓扑结构中的链接属性,使用事实信息编码器对事实进行表示学习,使用事实信息融合模块将实体和关系与事实的嵌入表示进行特征融合,从而得到融合事实上下文的实体与关系的向量表示,随后通过计算融合事实上下文的实体和关系的嵌入表示在空间中的距离相似度来判断它们是否存在一定的联系,最后将存在联系程度较高的实体和关系构建成新的知识加入到现有的知识图谱中,完成知识图谱的补全。
具体地,如图2所示,所述步骤B中融合事实上下文的知识图谱补全一般生成过程为:
B1.事实信息编码器首先将头实体、关系和尾实体映射到低维稠密向量空间中,得到对应的d维向量表示随后将这些实体和关系的向量表示输入到门控循环单元中来捕获实体和关系的序列信息传递特征。为了获得更全面的事实表达,我们同时考虑了事实的正向和反向,其中正向代表事实沿着的顺序输入到门控循环单元中,反向则代表事实沿着的顺序输入到门控循环单元中,具体计算如下:
另外,在时间知识图谱中事实通常以(头实体,关系,尾实体,时间)形式的四元组来进行表示。为了能够使实体和关系感知到当前事实的时间属性从而实现时间知识图谱补全,我们考虑将时间属性放在事实序列的最后加入到门控循环单元中,其计算方式如下:
最后将事实的正向和反向序列传递特征进行拼接并使用一维卷积神经网络对其进行特征提取,从而得到事实整体的嵌入表示,具体计算公式如下:
其中ReLU是激活函数,Cat代表向量的拼接操作,Ω代表卷积核的参数。是事实信息编码器的最终输出的d维特征向量,它代表了事实最终的嵌入表示,随后其将通过事实信息融合模块与对应的实体和关系进行特征融合。
B2.事实信息融合模块的目标是通过深度神经网络将事实信息编码器模块中获得的事实信息的嵌入表示与该事实包含的头实体、关系、尾实体的嵌入表示进行特征融合,将这些原本在实体空间中的嵌入表示映射到事实-实体的空间中,从而使实体和关系感知事实的语境。
C.在负采样模块中,本公开采用基于预训练的评估模型来代替传统模型中采用的随机替换头实体或尾实体的方法进行负采样。该评估模型已经进行预训练,因此其有一定的先验知识。在进行负采样时,该评估模型可以对生成的负样本进行一个合理性判别,过滤掉一些合理性分数过低的负样本,保证模型每次训练迭代过程都能够有一定的反馈,从而提高模型在知识图谱补全任务的性能。
具体的,如图3所示,所述步骤C中构建基于预训练的评估模型的负采样模块的一般生成过程为:
C1.如图4所示,负样本评估模型由深度神经网络和三元嵌入矩阵组(TripleEmbedding Matrix Pair,TEMP)构成。其中三元嵌入矩阵组为头实体、关系、尾实体的嵌入表示分别构建了相应的映射矩阵Mh、Mr、Mt,通过三元嵌入矩阵组可以将头实体、关系、尾实体的嵌入表示映射到对应的向量空间中,其通过矩阵映射后的向量将被拼接并作为深度神经网络的输入,最后深度神经网络将输出当前事实的分数。
其具体计算公式入下:
f(h,r,t)=cat(Mhh,Mrr,Mtt)·W (9)
最后,我们将采用交叉熵损失函数对模型进行优化,具体计算公式如下:
其中G代表正确事实的集合,G'代表错误事实的集合,ξ代表事实,l(ξ)和f(ξ)分别代表事实的标签和事实的分数。通过对负样本评估模型进行预训练,使负样本评估模型可以对事实进行合理性分数计算。
C2.在负采样过程中,通过在替换实体构造负样本的过程中设置一个较高的概率使替换的实体与原事实的实体类别相一致。随后,通过替换实体而构造出来的初始负样本集合输入到预训练好的负样本评估模型中,负样本评估模型将得到这些负样本的对应分数并选择可信度较高的K个负样本作为负样本候选集,最后将在候选集中通过随机选择的方式生成最终的负样本来完成知识图谱补全任务。
在构造初始负样本的过程中,我们将使用Bern的策略来决定替换头实体和尾实体的概率。对于假负样的问题,我们将采用与Uniform一样的过滤方式。整个负采样过程示例如图4所示。
D.构建事实合理性分数函数,分数函数的数值代表了头实体、关系和尾实体在空间中的距离,并以此判断事实中的实体和关系是否满足h+r≈t的约束。当分数较小时可以认为当前事实中的头实体、关系和尾实体存在相应的联系,从而断定当前事实具有较高的合理性,当分数较大的时候情况则相反,其公式如下:
E.构建模型训练模块,通过事实的合理性分数构造最大边界损失函数和交叉熵损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数,完成模型的训练。为了防止过拟合的问题,在计算过程中使用了L2正则化。最后,使用边界损失函数来对模型参数进行优化,其计算方式如下:
其中G代表知识图谱,即正确事实的集合,G`代表通过随机替换知识图谱中正确事实的头实体或尾实体构造出来的负样本集合,ξ代表知识图谱中的正确事实,ξ-代表负样本,f(ξ)代表正确事实的分数数值,f(ξ-)代表负样本的分数数值,γ代表边界值。边界损失函数的思想是尽可能地将正确事实的分数减小,将错误事实的分数增大,并且让错误事实的分数与正确事实的分数的差值保持在一定的范围之外,即如果错误事实的分数与正确事实的分数的差值小于间距γ的数值,那么模型将会根据其损失数值大小进行反向传播并采用随机梯度下降算法进行参数更新,如果错误事实的分数与正确事实的分数的差值大于间距γ的数值,模型的损失函数数值将取0值,参数不再更新。
F.知识图谱补全应用,本实施在上述多个真实数据集中进行了静态和时序的知识图谱补全应用,在应用过程中,本实施采用了Adam优化方法,并采用了bern的采样规则,所有的实验结果均采纳了fi lter设置,同时采用了在知识图谱补全任务中的常用评价指标Hit@N、MeanRank(MR)以及Mean Reciprocal Rank(MRR)。在静态知识图谱补全任务上的应用效果如表2所示,
表2在FB15K-237中静态知识图谱补全实验结果
在FB15K-237数据集中,F-TransE相比TransE在Hit@10指标中提高了1.3%,在Hit@3指标中提高了1.8%,在MRR指标中提高了3.5%;与ConvKB相比,F-ConvKB在Hit@10指标中提高了2.1%,在Hit@3指标中提高了1.6%,在MRR指标中提高了1.2%,在MR指标中上升了4位。在Hit@10和MR评估指标中,F-ConvKB在所有基线模型中均取得了最佳结果。
表3在WN18RR中静态知识图谱补全实验结果
在WN18RR数据集中,与TransE相比,F-TransE在Hit@10指标中提高了0.2%,在Hit@3指标中提高了1.2%,在MRR指标中提高了0.2%;与ConvKB相比,F-ConvKB在Hit@10指标中提高了0.7%,在Hit@3指标中提高了0.5%,在MRR指标中提高了0.4%。
表4时间知识图谱补全实验结果
表4给出了时间知识图谱补全实验的结果,从结果可以看出F-TransE相比于其他基准模型在各项指标都取得了有竞争力的结果,这证明将带有时间属性的事实信息融合到实体和关系的方法在时间知识图谱补全任务中是有效的。
如图5所示,本实施给出了融合事实上下文的知识图谱补全模型在超参数的敏感性实验结果。
如图6所示,本实施给出了融合事实上下文的知识图谱补全模型的消融实验结果图,从结果中可以看到,消除事实的正向和反向、门控循环单元模块、卷积神经网络模块都会使模型降低性能,因此证明了各个模块和网络模块都有一定的作用。
如图7所示,本实施给出了使用预训练评估模型的负采样后知识图谱补全效果对比图,从结果来看本实施提供的负采样策略可以提高知识图谱补全方法的效果。
实施例二:
如图8所示,本实施例提供了一种融合事实信息上下文的知识图谱补全装置,包括:
(1)嵌入模块,其用于构造嵌入层来将实体和关系映射到低维稠密的向量空间中,得到对应的嵌入向量表示;
(2)Bi-GRU构建模块,其用于利用头实体、关系、尾实体的嵌入表示向量及其权重来构建Bi-GRU,以捕获事实中实体和关系的序列依赖特征;
(3)事实信息编码器模块,利用Bi-GRU和卷积神经网络对事实的正向和反向进行表示学习,从而得到事实的嵌入表示;
(4)卷积神经网络构建模块,利用事实和事实下的实体与关系的嵌入表示及其权重构建卷积神经网络,从而提取事实与实体和关系之间的特征;
(5)事实信息融合模块,利用深度神经网络将事实信息编码器获得的事实嵌入表示与事实下的头实体、关系、尾实体进行特征融合,从而使实体和关系获得当前事实的上下文语境;
(6)负样本生成模块,其用于利用预训练评估模型构造高质量负样本,以实现提高知识图谱补全模型的泛化性和效果的目的;
(7)补全模型训练模块,其用于通过事实的合理性分数构造最大边界损失函数和交叉熵损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数,完成模型的训练;
实施例三:
在另一实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现实施例一或如图1所示的知识图谱补全方法中的步骤。
实施例四:
在另一实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如图1所示或实施例一的融合事实上下文的知识图谱补全方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于事实上下文的知识图谱补全方法,其特征是:包括以下步骤:
对知识图谱中的实体、关系进行编码处理和嵌入表示,获得实体和关系的表示向量;
利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征,得到事实的正向和反向嵌入向量表示;
对事实的正向和反向的嵌入向量表示进行特征融合,最终得到事实的整体嵌入向量表示;
基于深度神经网络对事实整体的嵌入向量表示和当前事实下的实体和关系进行特征融合,使实体和关系映射到对应的事实空间中;
基于深度神经网络构造事实评估模型,通过预训练后的事实评估模型生成与正样本保持近似语义的负样本,利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本;
在负采样过程中,通过在替换实体构造负样本的过程中设置一个较高的概率使替换的实体与原事实的实体类别相一致,随后,通过替换实体而构造出来的初始负样本集合输入到预训练好的负样本评估模型中,负样本评估模型将得到这些负样本的对应分数并选择可信度较高的K个负样本作为负样本候选集,最后将在候选集中通过随机选择的方式生成最终的负样本来完成知识图谱补全任务;
构造基于空间距离的评分函数和激活函数的评分函数,通过计算头实体、关系、尾实体的嵌入向量表示的对应的空间距离以及激活函数输出数值来判断由当前实体和关系构成的事实的合理性;
通过事实的合理性分数构造损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数,完成模型的训练,利用训练好的模型处理判别新的事实的合理性分数,将满足设定条件的事实加入到知识图谱中,完成知识图谱补全。
2.如权利要求1所述的一种基于事实上下文的知识图谱补全方法,其特征是:对知识图谱中的实体、关系进行编码处理和嵌入表示的具体过程包括:构建索引代替实体和关系名称并通过实体和关系的索引来对实体和关系进行嵌入表示学习,将实体和关系嵌入到向量空间中,获得实体和关系的表示向量。
3.如权利要求1所述的一种基于事实上下文的知识图谱补全方法,其特征是:利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征的具体过程包括:构造Bi-GRU,并将实体和关系的向量表示按照头实体、关系、尾实体的顺序输入到Bi-GRU中,通过Bi-GRU提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征。
4.如权利要求1所述的一种基于事实上下文的知识图谱补全方法,其特征是:对事实的正向和反向的嵌入向量表示进行特征融合的具体过程包括:将所述事实的正向和反向的嵌入向量表示输入到卷积神经网络当中,通过卷积神经网络对事实的正向和反向的嵌入向量表示进行特征融合。
5.如权利要求1所述的一种基于事实上下文的知识图谱补全方法,其特征是:使实体和关系映射到对应的事实空间中的具体过程包括:构造基于事实的嵌入模型和基于事实的知识卷积神经网络嵌入模型,使实体和关系获得当前事实的上下文语境。
6.如权利要求1所述的一种基于事实上下文的知识图谱补全方法,其特征是:利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本的具体过程包括:
通过sigmod激活函数得到当前负样本的合理性分数,通过使用训练数据集对其进行预训练;
根据负样本合理性分数对负样本进行排序,基于TopK算法构造负样本候选集,最终在负样本候选集中进行随机选择来作为知识图谱补全模型的负样本。
7.如权利要求1所述的一种基于事实上下文的知识图谱补全方法,其特征是:通过事实的合理性分数构造损失函数并计算相应误差的具体过程包括:通过事实的合理性分数构造最大边界损失函数和交叉熵损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数。
8.一种基于事实上下文的知识图谱补全系统,其特征是:包括:
嵌入表示模块,被配置为对知识图谱中的实体、关系进行编码处理,获得实体和关系的表示向量;
双向特征表示模块,被配置为利用特征提取模型,根据实体和关系的向量提取头实体、尾实体、关系在事实中的正向和反向序列依赖特征,得到事实的正向和反向嵌入向量表示;
事实信息编码模块,被配置为对事实的正向和反向的嵌入向量表示进行特征融合,最终得到事实的整体嵌入向量表示;
特征融合模块,被配置为基于深度神经网络对事实整体的嵌入向量表示和当前事实下的实体和关系进行特征融合,使实体和关系映射到对应的事实空间中;
负样本生成模块,被配置为基于深度神经网络构造事实评估模型,通过预训练后的事实评估模型生成与正样本保持近似语义的负样本,利用激活函数评价其合理性,选择符合要求的负样本作为知识图谱补全模型的负样本;
在负采样过程中,通过在替换实体构造负样本的过程中设置一个较高的概率使替换的实体与原事实的实体类别相一致,随后,通过替换实体而构造出来的初始负样本集合输入到预训练好的负样本评估模型中,负样本评估模型将得到这些负样本的对应分数并选择可信度较高的K个负样本作为负样本候选集,最后将在候选集中通过随机选择的方式生成最终的负样本来完成知识图谱补全任务;
补全模型训练模块,被配置为构造基于空间距离的评分函数和激活函数的评分函数,通过计算头实体、关系、尾实体的嵌入向量表示的对应的空间距离以及激活函数输出数值来判断由当前实体和关系构成的事实的合理性,通过事实的合理性分数构造损失函数并计算相应误差,通过误差的反向传播算法更新模型的可学习参数,完成模型的训练,以利用训练好的模型处理判别新的事实的合理性分数,将满足设定条件的事实加入到知识图谱中,完成知识图谱补全。
9.一种电子设备,其特征是:包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7中任一项所述的方法中的步骤。
10.一种计算机可读存储介质,其特征是:用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7中任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110643541.6A CN113360670B (zh) | 2021-06-09 | 2021-06-09 | 一种基于事实上下文的知识图谱补全方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110643541.6A CN113360670B (zh) | 2021-06-09 | 2021-06-09 | 一种基于事实上下文的知识图谱补全方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113360670A CN113360670A (zh) | 2021-09-07 |
CN113360670B true CN113360670B (zh) | 2022-06-17 |
Family
ID=77533501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110643541.6A Active CN113360670B (zh) | 2021-06-09 | 2021-06-09 | 一种基于事实上下文的知识图谱补全方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113360670B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113806561A (zh) * | 2021-10-11 | 2021-12-17 | 中国人民解放军国防科技大学 | 一种基于实体属性的知识图谱事实补全方法 |
CN114330323B (zh) * | 2022-03-08 | 2022-06-28 | 成都数联云算科技有限公司 | 实体关系联合抽取方法、装置、计算机终端及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977234A (zh) * | 2019-03-28 | 2019-07-05 | 哈尔滨工程大学 | 一种基于主题关键词过滤的知识图谱补全方法 |
CN110147450A (zh) * | 2019-05-06 | 2019-08-20 | 北京科技大学 | 一种知识图谱的知识补全方法及装置 |
CN110347847A (zh) * | 2019-07-22 | 2019-10-18 | 西南交通大学 | 基于神经网络的知识图谱补全方法 |
CN111291139A (zh) * | 2020-03-17 | 2020-06-16 | 中国科学院自动化研究所 | 基于注意力机制的知识图谱长尾关系补全方法 |
CN112035672A (zh) * | 2020-07-23 | 2020-12-04 | 深圳技术大学 | 一种知识图谱补全方法、装置、设备以及存储介质 |
CN112765369A (zh) * | 2021-01-31 | 2021-05-07 | 西安电子科技大学 | 知识图谱信息表示学习方法、系统、设备及终端 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815345A (zh) * | 2019-02-25 | 2019-05-28 | 南京大学 | 一种基于路径的知识图谱嵌入方法 |
CN111026875A (zh) * | 2019-11-26 | 2020-04-17 | 中国人民大学 | 一种基于实体描述和关系路径的知识图谱补全方法 |
CN112836064B (zh) * | 2021-02-24 | 2023-05-16 | 吉林大学 | 知识图谱补全方法、装置、存储介质及电子设备 |
CN112883200A (zh) * | 2021-03-15 | 2021-06-01 | 重庆大学 | 一种面向知识图谱补全的链接预测方法 |
-
2021
- 2021-06-09 CN CN202110643541.6A patent/CN113360670B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977234A (zh) * | 2019-03-28 | 2019-07-05 | 哈尔滨工程大学 | 一种基于主题关键词过滤的知识图谱补全方法 |
CN110147450A (zh) * | 2019-05-06 | 2019-08-20 | 北京科技大学 | 一种知识图谱的知识补全方法及装置 |
CN110347847A (zh) * | 2019-07-22 | 2019-10-18 | 西南交通大学 | 基于神经网络的知识图谱补全方法 |
CN111291139A (zh) * | 2020-03-17 | 2020-06-16 | 中国科学院自动化研究所 | 基于注意力机制的知识图谱长尾关系补全方法 |
CN112035672A (zh) * | 2020-07-23 | 2020-12-04 | 深圳技术大学 | 一种知识图谱补全方法、装置、设备以及存储介质 |
CN112765369A (zh) * | 2021-01-31 | 2021-05-07 | 西安电子科技大学 | 知识图谱信息表示学习方法、系统、设备及终端 |
Non-Patent Citations (1)
Title |
---|
《时态知识图谱补全的方法及其进展》;申宇铭等;《大数据》;20210331(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113360670A (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112784092B (zh) | 一种混合融合模型的跨模态图像文本检索方法 | |
CN111753101B (zh) | 一种融合实体描述及类型的知识图谱表示学习方法 | |
US20210232376A1 (en) | Vectorized representation method of software source code | |
CN109816032B (zh) | 基于生成式对抗网络的无偏映射零样本分类方法和装置 | |
CN110807154A (zh) | 一种基于混合深度学习模型的推荐方法与系统 | |
CN111105029B (zh) | 神经网络的生成方法、生成装置和电子设备 | |
CN113360670B (zh) | 一种基于事实上下文的知识图谱补全方法及系统 | |
CN111563192B (zh) | 实体对齐方法、装置、电子设备及存储介质 | |
CN114036307B (zh) | 一种知识图谱实体对齐方法及装置 | |
CN109522561B (zh) | 一种问句复述识别方法、装置、设备及可读存储介质 | |
CN107544960A (zh) | 一种基于变量绑定和关系激活的推理方法 | |
CN112417289B (zh) | 一种基于深度聚类的资讯信息智能推荐方法 | |
CN113268612B (zh) | 基于均值融合的异构信息网知识图谱补全方法和装置 | |
CN111914950B (zh) | 基于深度对偶变分哈希的无监督跨模态检索模型训练方法 | |
CN113987155B (zh) | 一种融合知识图谱与大规模用户日志的会话式检索方法 | |
CN112699215B (zh) | 基于胶囊网络与交互注意力机制的评级预测方法及系统 | |
CN107590139A (zh) | 一种基于循环矩阵翻译的知识图谱表示学习方法 | |
CN116661852B (zh) | 一种基于程序依赖图的代码搜索方法 | |
CN116090522A (zh) | 一种基于因果反馈的缺失数据集因果关系发现方法及系统 | |
CN113239272B (zh) | 一种网络管控系统的意图预测方法和意图预测装置 | |
CN115858799A (zh) | 融合有序关系路径和实体描述信息的知识表示学习方法 | |
CN112686306B (zh) | 基于图神经网络的icd手术分类自动匹配方法及系统 | |
CN116187446B (zh) | 基于自适应注意力机制的知识图谱补全方法、装置和设备 | |
CN112381226B (zh) | 一种基于粒子群算法的深度卷积神经网络架构搜索方法 | |
CN114925190B (zh) | 一种基于规则推理与gru神经网络推理的混合推理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |