CN114048328A

CN114048328A - 基于转换假设和消息传递的知识图谱链接预测方法及系统

Info

Publication number: CN114048328A
Application number: CN202111383832.2A
Authority: CN
Inventors: 刘嵩; 丁帅; 来庆涵; 巩京昊; 崔金安
Original assignee: Qilu University of Technology
Current assignee: Qilu University of Technology
Priority date: 2021-11-22
Filing date: 2021-11-22
Publication date: 2022-02-15

Abstract

本发明提供了一种基于转换假设和消息传递的知识图谱链接预测方法及系统。该方法包括，获取需要进行链接预测任务的知识图谱的数据；根据获取的知识图谱的数据，通过预训练得到知识图谱中实体和关系的向量表示；根据得到的实体和关系的向量表示和变换图网络，得到全图的节点表示；根据全图的节点表示，基于查询条件，得到与查询条件相关的子图表示；根据得到的子图表示和注意力聚合图网络，得到新的子图表示和注意力分数；根据新的子图表示和注意力分数进行知识图谱链接预测。

Description

基于转换假设和消息传递的知识图谱链接预测方法及系统

技术领域

本发明属于知识图谱技术领域，尤其涉及一种基于转换假设和消息传递的知识图谱链接预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

知识图谱，如Freebase和Wikipedia，编码了我们的现实世界，并受到了许多领域的关注，包括知识推理、知识问答、推荐系统等。与现实世界中已有的知识相比，当前的知识图谱仍然是浅薄和不完整的，这促使人们基于已知知识预测新的知识。其中，知识图谱的链接预测任务已成为一个重要的焦点任务。

知识图谱将每个实体和实体之间的关系编码为一个有向图，并且每条边都用三元组<head,rel,tail>表示，链接预测的目的是预测丢失的头实体head、尾实体 tail或关系rel。

例如，

其中YaoMing是头实体head，YaoZhiyuan是尾实体tail，sonOf是头实体和尾实体之间的关系rel，这里链路预测的任务是根据完整三元组来预测给定查询三元组 <head,rel,？>中缺失的尾实体。

知识图谱链接预测模型可以分为基于翻译的模型、乘法模型和深度学习模型。翻译模型，例如TransE、TransR、TransD和RotatE，学习实体和关系嵌入，并通过测量头部实体和尾部实体之间的距离来预测三元组实体的存在。乘法模型，如DistMult，通过张量积生成实体嵌入和关系嵌入。ConvE、CANet、 MADLINK等深度学习模型使用神经网络对实体和关系进行编码，并将编码后的实体和关系嵌入到知识图谱中进行预测。此外，对图卷积网络(GCN)模型的研究，如R-GCN模型、TransGCN模型、DPMPN模型等，都发现GCN模型在链路预测任务中具有很强的竞争力。DPMPN模型采用双GNN架构，包括基于消息传递框架的两个图神经网络模块。其中，采用IGNN模块进行全局消息传递，可以在一批输入中共享节点表示；采用AGNN进行局部消息传递，可以动态构造和展开子图。

现有的知识图谱链接预测方法不能处理有向图的异构邻域，导致其有向图的方向信息不能被有效利用，不能很好地区分节点邻域的信息，这样导致链接预测的准确度不高。

发明内容

为了解决上述背景技术中存在的技术问题，本发明提供一种基于转换假设和消息传递的知识图谱链接预测方法及系统，其通过在DPMPN中引入TransGCN的转换假设和多种聚合器有效的提高了节点的表示精度和节点邻域信息的区分度，增强知识图谱链接预测的准确性。

为了实现上述目的，本发明采用如下技术方案：

本发明的第一个方面提供一种基于转换假设和消息传递的知识图谱链接预测方法。

基于转换假设和消息传递的知识图谱链接预测方法，包括：

获取知识图谱中的实体和关系；

根据获取的实体和关系，得到实体和关系对应的向量表示；

根据实体和关系的向量表示进行转换假设的处理，根据处理后的向量表示和变换图网络，得到更新后的全图的节点表示；

根据得到的更新后的全图节点表示，基于查询条件，得到与查询条件相关的子图节点表示；

根据得到的子图节点表示，采用注意力聚合图网络和注意力机制更新子图的节点表示和注意力分数；

根据得到的注意力分数进行知识图谱链接预测。

本发明的第二个方面提供一种基于转换假设和消息传递的知识图谱链接预测系统。

基于转换假设和消息传递的知识图谱链接预测系统，包括：

知识获取模块，其被配置为：获取整个知识图谱的实体和关系数据；

变换图网络模块，其被配置为：根据获取的实体和关系数据得到全图的节点表示；

注意力聚合图网络模块，其被配置为：基于查询条件，根据全图的节点表示生成与查询条件相关的子图，并根据全图节点表示和子图节点表示影响的注意力分数得到更新后的子图的节点表示；

注意力模块，其被配置为：根据最后得到的注意力分数进行知识图谱链接预测。

本发明的第三个方面提供一种计算机可读存储介质。

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述第一个方面所述的基于转换假设和消息传递的知识图谱链接预测方法中的步骤。

本发明的第四个方面提供一种计算机设备。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述第一个方面所述的基于转换假设和消息传递的知识图谱链接预测方法中的步骤。

与现有技术相比，本发明的有益效果是：

1、本发明所述的方法、系统、介质及计算机设备，通过在DPMPN中引入TransGCN的转换假设和消息传递函数，有效的提高了全图节点表示的精度。

2、本发明所述的方法、系统、介质及计算机设备，通过在DPMPN中引入多种聚合器，在聚合子图消息时考虑不同的邻接信息可以有效提高模型的性能。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1是本发明转换假设和消息传递聚合网络模型(Transformation Assumptionswith Message Passing Aggregation Network，TMPAN)的结构图；

图2是本发明实施例中给出的几种模型的一实验结果对比图；

图3是本发明实施例中给出的几种模型的另一实验结果对比图；

图4是本发明实施例中给出的模型迭代实验结果对比图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

需要注意的是，附图中的流程图和框图示出了根据本发明的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意，在有些作为备选的实现中，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以使用专用硬件与计算机指令的组合来实现。

实施例一

如图1所示，本实施例提供了一种基于转换假设和消息传递的知识图谱链接预测方法，本实施例以该方法应用于服务器进行举例说明，可以理解的是，该方法也可以应用于终端，还可以应用于包括终端和服务器和系统，并通过终端和服务器的交互实现。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务器、云通信、中间件服务、域名服务、安全服务CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。本实施例中，该方法包括以下步骤：

获取需要进行链接预测任务的知识图谱的数据；

根据获取的知识图谱的数据，通过预训练得到知识图谱中实体和关系的向量表示；

根据得到的实体和关系的向量表示和变换图网络，得到全图的节点表示；

根据全图的节点表示，基于查询条件，得到与查询条件相关的子图表示；

根据得到的子图表示和注意力聚合图网络，得到新的子图表示和注意力分数；

根据新的子图表示和注意力分数进行知识图谱链接预测。

作为一种或多种实施方式，所述变换图网络通过所述转换假设，以三元组中的关系为转换操作符，对头实体和尾实体进行转换，经转换后，尾实体即为转换后的头实体。

作为一种或多种实施方式，头尾实体之间的转换假设操作，具体为：根据预训练时使用的实体-关系组合操作来定义所述转换假设操作的转换操作符。

作为一种或多种实施方式，所述得到全图节点表示，具体为：使用与转换假设相适应的消息传递函数和节点更新函数对全图的节点表示进行更新，进而得到更新后的全图的节点表示。

作为一种或多种实施方式，所述得到子图表示的方法，具体为：根据与查询条件相关的子图表示，经过注意力聚合图网络对子图表示更新后，得到新的子图表示。

作为一种或多种实施方式，所述注意力聚合图网络中消息聚合的方法，具体为：每个节点的邻接点的信息各有不同，多种聚合器可根据不同的邻域消息使用合适的聚合函数，然后使用基于节点度的缩放器根据要聚合的消息数对传入消息进行放大或缩小。

作为一种或多种实施方式，所述根据新的子图表示和注意力分数进行知识图谱链接预测的过程包括：根据子图节点信息、查询条件和更新后的全图节点表示，依据转移矩阵，得到注意力分数，基于注意力分数进行知识图谱链接预测。

为了说明本实施的技术方案，下面进行详细介绍：

获取需要进行链接预测任务的知识图谱的数据。

本实施例的该方法的数据取自于应用于FB15K-237和YAGO3-10两种知识图谱数据集。

根据获取的知识图谱的数据，通过预训练得到知识图谱中实体和关系的向量表示。

本实施例的该方法使用TransE初始化知识图谱中的实体和关系向量表示。

根据得到的实体和关系的向量表示和变换图网络，得到全图的节点表示。

将初始化好的知识图谱的实体和关系向量送入变换图网络中，计算得到全图的节点表示。

根据全图的节点表示，基于查询条件，得到与查询条件相关的子图表示。

基于查询条件，在全图的节点表示中得到与查询条件相关的子图的节点表示。

根据得到的子图表示和注意力聚合图网络，得到新的子图表示和注意力分数。

将子图表示送入注意力聚合图网络中，得到新的子图的节点表示。全图的节点表示和子图的节点表示会影响注意力分数，注意力分数也会影响子图节点表示的计算。

根据新的子图表示和注意力分数进行知识图谱链接预测。

将使用最后一步的注意力得分作为链接预测的概率。

具体实现过程如下：

本实施例所述的转换假设和消息传递聚合网络模型结构分为三个模块：变换图网络模块、注意力聚合图网络模块和注意力模块，如图1所示。我们使用消息传递框架来实现整个模型。变换图网络(Transformation graph network，TGN) 模块在整个图中传递消息，并计算图中所有节点的表示。注意力聚合图网络 (attentive aggregation graphnetwork，AAGN)模块用于在小子图上传递消息，该模块依赖于TGN模块生成的节点表示，根据输入查询生成节点表示。注意力模块根据TGN模块和AAGN模块生成的节点表示进行流注意力计算，影响AAGN 生成的节点表示。在本节中，我们将详细介绍TMPAN模型的各个模块。

(1)变换图网络模块

知识图谱是一个有向图，这导致了异构邻域问题。即传统的图神经网络在有向图上沿边方向传递信息，但中心实体与相邻实体之间关系的方向是不同的。 IGNN根据关系的方向传递消息，使得节点无法收集相反方向包含的信息，即 DPMPN的IGNN模块无法有效处理导致知识图谱中异质邻域的异质关系。为了解决这一问题，我们设计了TGN模块来代替DPMPN的IGNN模块。这里我们引入TransGCN中的转换假设，将知识图谱中的异构邻域转换为同构邻域。具体来说，我们引入TransGCN中的转换假设，以知识图谱中的关系作为转换操作，对头尾实体进行转换。通过转换假设，我们将知识图谱关系中的信息以相反方向传递到中心节点。

接下来，我们详细描述了转换假设的操作。实体之间的转换包括平移、旋转等。对知识图谱中的三元组进行关系变换后，尾实体即为变换后的头实体，以便头实体能够估计尾实体的嵌入情况。这个变换的公式如下：

其中◇和·被定义为两个转换操作符，这两个操作符被专门设计来处理关系的方向。以TransE为例，给定实体v_i和出度三元组(v_i,r_k,v_j)，将v_i基于(v_i,r_k,v_j)的估计(v_j-r_k)定义为v_i邻域的嵌入。类似地，对于实体v_i的入度三元组(v_l,r_m,v_i)，我们将其他邻居的嵌入估计定义为(v_l+r_m)。经过变换后，将知识图谱中的异质邻域转化为同质邻域，图神经网络能够更好地聚合中心节点邻域中的信息。

在TGN模块中，我们引入了TransGCN消息传递功能来传递全局消息。每个节点v被初始化为

每个边在κ步处生成一条信息，定义为M^κ。将此信息与自循环信息结合以更新节点状态。函数计算如下：

消息传递函数：

节点更新函数：

其中c_i是与v_i相关的节点的度，W是一个特定层的矩阵，ρ是激活函数 ReLu。在κ步之后，我们将节点状态输出到下一个模块。

(2)注意力聚合图网络模块

为了解决DPMPN中AGNN模块的单射问题，我们引入了PNA中提出的多种聚集器，并将AGNN替换为我们的新模块AAGN。AAGN使用TGN模块的结果和训练数据集的输入查询:χ＝<e_head,e_rel,？>用于计算节点表示，定义为

我们在子图上执行剪枝消息传递。AAGN中的消息聚合方法采用基于节点度的缩放器和多种聚合器的组合，聚合器和缩放器的组合可以产生多种聚合方式。多种聚合模式可以有效缓解单射问题，提高节点信息的区分程度，使每个节点能够更好地了解其邻居的信息分布情况。同时，基于节点度的缩放器可以根据每个节点的度对信号进行放大或衰减，从而有效提高了消息传递过程中节点信息的区分度。在初始步骤0中，从e_head开始，消息传递信息定义为M^k(x)。函数计算如下：

消息传递函数：

其中，η代表两层MLP，第一层是激活函数leakyReLu，第二层是激活函数 tanh。

消息聚合由缩放器根据节点度和多种聚合器完成。函数计算如下：

基于节点度的缩放器：

基于节点度的缩放器公式定义scaler，S(d,α)；d为节点的度，当d>0，S(d,α) 是一个单射函数，α是一个可变参数，δ是在训练集上计算的标准化参数。

消息聚合函数：

在消息聚合函数中，σ是一个线性神经网络层，I表示没有scaler，

表示向量乘法，aggregators包括mean、max、min和std四种聚合函数。

我们结合节点注意力更新节点状态，函数计算如下：

节点注意力函数：

其中

是注意力分数，W是一个可学习矩阵。

节点更新函数：

节点注意力信息是通过注意力模块获得的注意力分数

和传递给AAGN模块的TGN模块的节点表示来计算的，并通过可学习矩阵W投影。

表示训练数据集输入查询的上下文向量。ξ代表两层MLP，第一层是激活函数 leakyReLu，第二层是激活函数tanh。

在我们的AAGN模块中，对于消息传递函数、节点注意力函数、节点状态更新函数，我们遵循了DPMPN模型中AGNN的函数。同时，我们引入PNA的缩放器和多种聚合器来组成消息聚合函数。

(3)注意力模块

我们沿用了DPMPN中的注意力模块。这里，k步的注意力由节点的概率分布序列表示，定义为a^k(k＝1,2,...,K)。a被初始化为一个独热向量，我们通过计算每一步的转移矩阵K^k来分散注意力。注意模块依靠TGN和AAGN来获得可见节点和不可见邻域之间的相互作用。函数计算如下：

其中W₁和W₂是两个可学习矩阵。每个MLP是一个单层，激活函数是 leakyReLu。在第k步，节点v_j有n个最大的注意分数，下一步的注意转换使用节点v_j的邻居抽样节点计算。计算新的注意力分数的公式为:a^k+1＝K^ka^k/||K^ka^k||。最后一步的注意力得分作为预测尾节点的概率。

实施例二

基于转换假设和消息传递的知识图谱链接预测方法，包括：

获取需要进行链接预测任务的知识图谱的数据；

根据新的子图表示和注意力分数进行知识图谱链接预测。

本实施例的技术方案可以在医疗领域进行应用，本实施例的方案可以作为家族遗传病史知识图谱链接的预测。比如：查询条件为：(赵某，患有糖尿病的原因，？)，赵某被查出患有糖尿病，这种病有可能是家族遗传病，那么根据此查询条件可以更新所有患糖尿病的与赵某有血缘关系的知识图谱，然后根据赵某筛选出与赵某有长辈关系的所有直系家属患有糖尿病的知识图谱。最后预测，赵某得糖尿病是因为遗传了赵某爷爷的糖尿病，从而得出知识图谱链接 (赵某，患有糖尿病的原因，遗传)。

实施例三

本实施例提供了一种基于转换假设和消息传递的知识图谱链接预测系统。

基于转换假设和消息传递的知识图谱链接预测系统，包括：

知识获取模块，被配置为：获取需要进行链接预测任务的知识图谱的数据；

变换图网络模块，被配置为：根据获取的知识图谱的数据，通过预训练得到知识图谱中实体和关系的向量表示，根据得到的实体和关系的向量表示和变换图网络，得到全图的节点表示；

注意力聚合图网络模块，被配置为：根据全图的节点表示，基于查询条件，得到与查询条件相关的子图表示，根据得到的子图表示和注意力聚合图网络，结合注意力分数，得到新的子图表示和注意力分数；

注意力模块，被配置为：根据新的子图表示和注意力分数进行知识图谱链接预测。

此处需要说明的是，上述预测模块和模型构建模块与实施例一中的步骤所实现的示例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

实施例四

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述实施例一或实施例二所述的基于转换假设和消息传递的知识图谱链接预测方法中的步骤。

实施例五

本实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述实施例一或实施例二所述的基于转换假设和消息传递的知识图谱链接预测方法中的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory， ROM)或随机存储记忆体(RandomAccessMemory，RAM)等。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，包括：

获取需要进行链接预测任务的知识图谱的数据；

根据新的子图表示和注意力分数进行知识图谱链接预测。

2.根据权利要求1所述的基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，所述变换图网络通过所述转换假设，以三元组中的关系为转换操作符，对头实体和尾实体进行转换，经转换后，尾实体即为转换后的头实体。

3.根据权利要求2所述的基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，头尾实体之间的转换假设操作，具体为：根据预训练时使用的实体-关系组合操作来定义所述转换假设操作的转换操作符。

4.根据权利要求1所述的基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，所述得到全图节点表示，具体为：使用与转换假设相适应的消息传递函数和节点更新函数对全图的节点表示进行更新，进而得到更新后的全图的节点表示。

5.根据权利要求1所述的基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，所述得到子图表示的方法，具体为：根据与查询条件相关的子图表示，经过注意力聚合图网络对子图表示更新后，得到新的子图表示。

6.根据权利要求5所述的基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，所述注意力聚合图网络中消息聚合的方法，具体为：每个节点的邻接点的信息各有不同，多种聚合器可根据不同的邻域消息使用合适的聚合函数，然后使用基于节点度的缩放器根据要聚合的消息数对传入消息进行放大或缩小。

7.根据权利要求1所述的基于转换假设和消息传递的知识图谱链接预测方法，其特征在于，所述根据新的子图表示和注意力分数进行知识图谱链接预测的过程包括：根据子图节点信息、查询条件和更新后的全图节点表示，依据转移矩阵，得到注意力分数，基于注意力分数进行知识图谱链接预测。

8.基于转换假设和消息传递的知识图谱链接预测系统，其特征在于，包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的基于转换假设和消息传递的知识图谱链接预测方法中的步骤。

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于转换假设和消息传递的知识图谱链接预测方法中的步骤。