CN115422321B

CN115422321B - 一种知识图谱复杂逻辑推理方法、组件和知识图谱的查询检索方法

Info

Publication number: CN115422321B
Application number: CN202210881430.3A
Authority: CN
Inventors: 文瑞; 赵万民; 柳春敏; 汤宇轩
Original assignee: Yidatec Co ltd; Dalian University of Technology
Current assignee: Yidatec Co ltd; Dalian University of Technology
Priority date: 2022-07-26
Filing date: 2022-07-26
Publication date: 2024-03-26
Anticipated expiration: 2042-07-26
Also published as: CN115422321A

Abstract

一种知识图谱复杂逻辑推理方法、组件和知识图谱的查询检索方法，属于计算机数据分析领域，根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离；根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，所述偏移表示给定查询在当前步中需向正确的答案偏移的方向以及大小；根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入，效果是有效的、可扩展的复杂逻辑推理组件，可以为基线模型带来一定的提升。

Description

一种知识图谱复杂逻辑推理方法、组件和知识图谱的查询检索方法

技术领域

本发明属于计算机数据分析领域，尤其涉及基于知识图谱的复杂逻辑推理的方法、组件和知识图谱的检索方法。

背景技术

知识图谱(Knowledge Graph,KG)是一种用来描述现实世界的异构图，其节点代表实体，边代表实体之间的关系。如今，知识图谱在很多人工智能任务中都发挥着重要的作用，比如：谷歌和微软使用谷歌知识图谱和Satori辅助搜索引擎检索；许多问答系统使用了不同的知识图谱作为系统的底层知识。

在基于知识图谱的应用中，检索是不可缺少的核心操作，用户可以通过检索获得有用的信息。检索图谱的方法通常是将问题转化成逻辑表达式，然后从表达式的起点逐步递推以获取最终答案。

许多复杂逻辑推理方法使用了带有合取、析取和存在量词的一阶逻辑(First-OrderLogic, FOL)来建模不同类型的查询，然后设法对一阶逻辑查询进行逻辑推理。一阶谓词逻辑是一种简明有效的形式，很多研究都使用了这种形式来建模问题，然后让计算机来对这种固定格式的问题进行处理。比如：自然语言问题“谁是斯蒂芬·库里和克莱·汤普森的教练？”可以轻易地建模为

然后系统可以使用一些经典方法来处理问题。比如：某些方法将查询视作一个有向无环图,然后使用基于子图匹配的方法来检索答案。但是这些方法具有两个缺陷：(1)在大型知识图谱当中的计算复杂度过大；(2)子图匹配无法越过缺失的边搜索答案。这两个缺陷限制了这些传统方法在当今大型知识图谱上的扩展。

知识图谱复杂逻辑推理的意义就是解决一阶逻辑查询并给出其答案，在专利中，一阶逻辑查询的定义如下：

其中Q代表查询，是Q的答案(集合)，/>是Q的起始节点，V_i是Q的中间节点，在查询的过程中需要模型进行推算。

在以上的一阶逻辑查询中包含了三种算子——投影、合取和析取。在知识图谱上它们的定义如下：

投影运算P：给定实体e∈ε和关系P(e,r)＝{t₁,t₂,…,t_m}表示一个实体集合，其中的实体t_i满足/>

交集运算I(合取)：给定n个实体集合S₁,…,S_n，其中I(S₁,…,S_n)＝{t₁,t₂,…,t_m} 表示一个实体集合，其中的实体t_k满足/>为真。

并集运算U(析取)：给定n个实体集合S₁,…,S_n，其中U(S₁,…,S_n)＝{t₁,t₂,…,t_m} 表示一个实体集合，其中的实体t_k满足/>为真。

一个包含了以上三种算子的一阶逻辑查询可以是作为一个计算图。如图1所示，图1(a) 为自然语言问题和对应一阶逻辑查询，图1(b)则是查询对应的计算图，其中包含了P、I、 U三种算子。然后我们需要设计方法处理该计算图。

由于嵌入概念的火热，最近在知识图谱复杂逻辑推理的问题上产生了很多基于嵌入的方法。这些方法将实体、关系和一阶逻辑查询嵌入到低维空间上，将逻辑运算视作这些向量或矩阵之间数值运算。相比于传统方法来说，基于低维空间嵌入的方法一般是从起始节点(通常称之为锚节点，anchor node)开始逐步进行推算，步数是有限的(因为推理的步数远远小于实体个数)，因此可以很大程度地减少推理的时间；同时，由于使用连续空间上的数值运算代替了离散空间上的搜索，因此基于嵌入的方法可以跨过知识图谱中缺失的关系进行答案的检索。虽然这种方法解决了传统方法的两个不足，但是也带来了新的问题：如何将实体、关系和查询嵌入到低维空间中？对于这个问题，研究者们给出了不同的答案。比如：GQE将实体和关系视作向量，将关系投影视作实体和关系相加，将合取视作为基于注意力机制的子查询向量加权；BetaE将实体和关系建模为beta分布向量，将关系投影视作为概率相加，将合取视作为概率相乘。

在知识图谱中，像GQE、BetaE之类的嵌入方法所基于的嵌入技术应用非常广泛，它可以追溯到其最简单的形式——链接预测，这也是知识图谱中的一项核心任务，从知识图谱的概念出现之日起就一直存在。同时，链接预测也是知识图谱复杂查询推理最简单的形式(可以视为只有投影操作，且只有一跳)。这个任务中的很多经典方法，比如TransE、DistMult、 ComplEx、RotatE、HAKE等，不仅在任务中取得了很好的效果，而且还为知识图谱中解决其他任务的方法提供了灵感和启发。

路径查询推理(Path Query Reasoning)是链接预测扩展到多跳之后的形式，它从锚节点开始，通过数个关系的投影得到最终的结果。这个任务的典型方法有Guu等人和Das等人的工作，前者将链接预测模型扩展到了多跳形式，后者使用了RNN来处理多跳查询。

相比于链接预测和路径查询推理，知识图谱中的复杂逻辑推理是一项更困难且更贴近实际应用的任务，它不仅包含单跳和多跳形式的查询，而且还有使用合取、析取或取反运算的查询。GQE是复杂逻辑推理任务中最早使用基于嵌入方法的模型，它将TransE扩展到了多跳形式，并且使用了注意力机制来建模合取运算，随后产生了很多方法，比如Q2B、BetaE、 CQD、MPQE、NewLook、PERM和ConE等，它们从不同的方面对模型进行了改造和优化，比如Q2B、ConE使用了图形嵌入技术(Geometric Embedding)来更合理地建模查询，BetaE和PERM使用了基于概率的嵌入来建模实体和查询，CQD使用了t-norm和t-conorm算子来建模查询，并且提出了连续优化和束搜索优化两种进行推理的方式，诸如此类。

虽然以上的方法在任务中取得了很好的效果，但是它们都没有考虑到相似查询对当前查询的帮助。比如，如果当前查询为“1+1＝？”，则模型可以从“1+2＝3”，“2+2＝4”等其他类似的查询来了解加法的性质，从而使这些相似查询辅助推理和回答。再比如：在一个篮球知识图谱的两个问答对(“谁是斯蒂芬·库里队友的教练？”，“斯蒂夫·科尔”)和(“谁是斯蒂芬·库里前队友的教练”，“史蒂夫·纳什”)中，“斯蒂夫·科尔”和“史蒂夫·纳什”之间必定会有某种隐含的关系。

基于以上的想法，本发明提出了一个基于嵌入的知识图谱辅助推理组件HQR(Homogeneous QueryRevisor，同构查询校准器)，它可以在不改变原有模型结构的情况下，灵活地嵌入到现有的知识图谱复杂逻辑推理模型当中并提升其推理的性能。HQR的核心思想为：当模型进行推理的时候，与当前查询结构相似的查询可以为当前推理提供帮助。在基于嵌入的模型当中，相似查询答案的嵌入可以帮助模型修正当前查询的嵌入。这种思想有些类似于数据增强，但是与它不同的是，由于封闭世界假设(Closed World Assumption,CWA)，模型无法生成新的正例。不过由于知识图谱是实体之间存在联系的图结构，因此模型可以从另一个角度来进行数据的“增强”，也就是使用图谱中已有的相似查询，来帮助问题的推理和回答。

发明内容

为了解决知识图谱检索中推理组件在推理的过程中能够纠偏，从而提升推理性能的问题，本发明提出如下技术方案：

在第一方面，本发明提出一种知识图谱复杂逻辑推理方法，包括：

获取给定查询在当前步中的查询嵌入；

根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离；

根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，所述偏移表示给定查询在当前步中需向正确的答案偏移的方向以及大小；

根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入。

在一种实施例中，所述步骤根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，公式表示如下：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

其中：b_refer为给定查询的在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，Distance()为计算查询与实体相似度的函数，q_refer为给定查询的同构查询的答案嵌入，Projection()为基线模型中投影运算的方法，q_start为给定查询的同构查询起始节点的嵌入，r_refer为给定查询的同构查询的关系在当前步的嵌入；

所述步骤根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，公式表示如下：

b_final＝MLP_{weigh t}(r_refer，r_q)×b_refer

其中：b_final为给定查询在当前步中向正确答案的偏移，MLP_{weigh t}为计算权重的多层神经网络，r_refer为给定查询的同构查询的关系在当前步的嵌入，r_q为当前查询的关系在当前步的嵌入，b_refer为给定查询的在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离；

所述步骤根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入，公式表示如下：

q_new＝q_old+b_final×α

其中：q_old为修正之前给定查询在当前步中的查询嵌入，α为调整偏移大小的超参数，q_new为修正之后给定查询在当前步中的查询嵌入。

在一种实施例中，查询q’为给定查询q的同构查，则：

q和q’的锚节点相同；

q和q’的结构相同。

在第二方面，本发明提出一种知识图谱复杂逻辑推理组件，包括

距离获取模块，所述距离获取模块根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离；

偏移获取模块，所述偏移获取模块根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，所述偏移表示给定查询在当前步中需向正确的答案偏移的方向以及大小；

修正查询嵌入获取模块，所述修正查询嵌入获取模块根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入。

在一种实施例中，所述距离获取模块根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，公式表示如下：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

所述偏移获取模块根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，公式表示如下：

b_final＝MLP_{weigh t}(r_refer，r_q)×b_refer

所述修正查询嵌入获取模块根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入，公式表示如下：

q_new＝q_old+b_final×α

在一种实施例中，查询q’为给定查询q的同构查，则：

q和q’的锚节点相同；

q和q’的结构相同。

在一种实施例中，关系推理部获取初始节点的嵌入，然后获取关系的嵌入，再然后将初始节点的嵌入与关系的嵌入计算，计算所得的嵌入为关系推理部的答案嵌入，所述知识图谱复杂逻辑推理组件安装在基线模型的每一个关系推理部的后面，

在第三方面，本发明提出一种知识图谱的查询检索方法，包括

S1.将知识图谱中的实体和关系集合嵌入到低维空间中；

S2.将一阶逻辑查询转换为相应的计算图，计算图中每个节点表示一个实体，每条边表示一个逻辑运算，其中起始节点为已知节点，中间节点和括答案为未知的变量；

S3.给定一个查询，根据所述查询在当前步中对应的计算图得到所述查询在当前步中的查询嵌入；

S4.根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离；

S5.根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，所述偏移表示给定查询在当前步中需向正确的答案偏移的方向以及大小；

S6.根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入；

S7.根据修正查询嵌入与知识图谱中其他所有实体做相似度匹配，所获取的相似度最高的实体为所述知识图谱的所述查询的答案。

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

b_final＝MLP_{weigh t}(r_refer，r_q)×b_refer

其中：b_final为给定查询在当前步中向正确答案的偏移，MLP_{weigh t}为计算权重的多层神经网络，r_rerer为给定查询的同构查询的关系在当前步的嵌入，r_q为当前查询的关系在当前步的嵌入，b_refer为给定查询的在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离；

q_new＝q_old+b_final×α

在一种实施例中，查询q’为给定查询q的同构查，则：

q和q’的锚节点相同；

q和q’的结构相同。

有益效果；本发明提供一种基于同构查询的知识图谱复杂逻辑推理组件，本发明给出了一种知识图谱上的相似查询定义，然后使用同构查询校准器(HQR)，在进行当前逻辑推理的过程中同时考虑到与当前查询相似的同构查询，并使用同构查询的关系和结果逐步缩短当前查询嵌入和答案嵌入的距离，在不改变原有模型结构的基础上对当前查询进行纠正。基于实验结果分析，本发明设计了一种有效的、可扩展的复杂逻辑推理组件，可以为基线模型带来一定的提升。

附图说明

图1是知识图谱复杂逻辑推理的流程以及模型嵌入HQR前后的区别图。

图1中的(a)是自然语言问题和对应的一阶逻辑查询示意图

图1中的(b)查询对应的计算图

图1中的(c)是先前基线模型的工作流程示意图

图1中的(d)基线模型加上HQR之后的工作流程图，HQR可以在每一个投影操作之后修正查询的嵌入。

图2是HQR的结构。图2中的左侧的上面两个查询为同构查询，答案已知；下面的查询为当前查询，答案未知；图2中的右侧为HQR的结构。

图3是数据集中查询的结构。

图4是使用HQR之后查询结果的可视化以及一个2p查询排名变化的例子是示意图。

具体实施方式

下面结合具体实施方式对本发明作进一步详细说明，但本发明并不局限于具体实施方式。

实施例1：

本发明为了突破现有知识图谱复杂逻辑推理没有注意到相似查询对当前查询帮助的问题，提出了同构查询校准器(HQR)。首先本发明提出了一种同构查询的定义，然后设计了HQR 组件，在推理的过程中逐步利用同构查询进行纠偏，从而提升推理的性能。

本发明的技术方案：

一种提高知识图谱复杂逻辑推理模型性能的组件，其特征在于，在知识图谱复杂逻辑推理的过程中关注了与当前查询相似的查询(称之为同构查询)，并设计同构查询校准器(HQR)，这个组件可以在不改变原模型结构的情况下嵌入其中，并在推理的过程中逐步关注同构查询的不同部分，具体实现方式如下：

HQR模型为残差连接的神经网络层，网络首先计算出当前步同构查询中答案与查询的距离，然后使用神经网络计算不同同构查询所占的权重，随后使用残差网络将原来的查询嵌入与偏差嵌入相加，具体实现方式如下：

(A)本发明中同构查询的定义

本发明使用同构查询来辅助查询的推理，设当前的查询为q，同构查询为q’，本文对同构查询的定义如下：1.q和q’的锚节点相同；2.q和q’的结构相同。

(B)HQR的结构和模型内的工作流程

HQR的公式如下：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

b_final＝MLP_weight(r_refer，r_q)×b_refer

q_new＝q_old+b_final×α

其中：b_refer为给定查询的在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，Distance()为计算查询与实体相似度的函数，q_refer为给定查询的同构查询的答案嵌入，Projection()为基线模型中投影运算的方法，q_start为给定查询的同构查询起始节点的嵌入，r_refer为给定查询的同构查询的关系在当前步的嵌入。

其中：b_final为给定查询在当前步中向正确答案的偏移，MLP_{weigh t}为计算权重的多层神经网络，r_refer为给定查询的同构查询的关系在当前步的嵌入，r_q为当前查询的关系在当前步的嵌入，b_refer为给定查询的在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离。

HQR模型，即HQR残差连接的神经网络层工作的流程如下：首先，计算同构查询当前步中答案与查询的偏移，计算的方式依基线模型而变；然后，通过比较同构查询当前步与当前查询当前步之间的关系，计算不同同构查询对当前查询的影响力。之所以没有用注意力机制，是因为HQR不能假定所有同构查询对当前查询的影响力总和为1，举例来说：如果所有的同构查询对当前查询都有反方向的偏移(比如同构查询关系的语义都和当前关系相反)，此时其总和就是负值而非1；最后，模型计算最终的查询值，在有些模型中训练得到的b_final会偏大，可以通过调整超参数α的值，通过观测模型在验证集上的表现来让模型取得最好的效果。

(C)将HQR嵌入到基线模型中

由于因为绝大多数情况下，在合取和析取之前都会先做投影运算，因此，HQR只需要放在基线模型计算完投影操作之后即可。HQR可以在不改变原有模型结构的情况下，直接安装到原有模型的投影操作之后。

综上所述，HQR分为以上三个流程——定义同构查询，定义HQR模型，以及将HQR模型嵌入到基线模型。

本发明相对于现有技术带来的有益效果：

(1)首次关注相似查询对现有查询的影响，并且可以灵活嵌入到现有模型中，在不改变现有模型结构的情况下提升其表现

在知识图谱复杂查询推理任务中，HQR是首个关注相似查询对现有查询影响的模型，也是首个可以灵活安插到其他基线模型之中的组件。这意味着现有的模型可以灵活地利用HQR 来提升自己的表现性能。我们针对不同类型的基线模型，在3个公共数据集上进行了实验，以HITS@3为评价指标。实验结果可以表明HQR的有效性和可扩展性(详见表1、表2、表 3)。

表1：FB15k-237数据集中各类基线模型和加上HQR之后的HITS@3

表2：FB15k数据集中各类基线模型和加上HQR之后的HITS@3

表3：NELL数据集中各类基线模型和加上HQR之后的HITS@3

实施例2：

一种基于同构查询的知识图谱复杂逻辑推理组件，步骤如下：

步骤一、定义一种同构查询的形式：

本发明使用同构查询来辅助查询的推理，设当前的查询为q，同构查询为q’，本文对同构查询的定义和发明内容中陈述的一致：

q和q’的锚节点相同；

q和q’的结构相同。

同构查询的一个例子如下：假设q为“ ”，则模型可以在图谱中搜索它的同构查询“/> ”和“/> ”。

像q'₁和q'₂之类的同构查询可以在如下几个方面为当前的查询带来帮助：首先，同构查询可以像GNN一样，通过邻域丰富锚节点的语义信息；第二，在推理的过程中，同构查询还可以为推理过程中的中间节点带来语义信息，模型可以在推理的过程中对每一步中间节点的嵌入进行修正，从而减小级联误差。这是普通的GNN所不能做到的，因为GNN不能在一个不存在的节点上进行信息传递。

以下是针对第二点所举的一个例子：在q的第一步推理(也就是获取 Teammate(Stephen Curry,V)嵌入的一步)当中，模型可以使用V'₁和V'₂的嵌入，通过比较 Teammate()和FormerTeammate()的相似性，对这一步推理进行修正。

步骤二、对同构查询进行采样：

首先，模型需要获取训练所需的同构查询。在知识图谱中获取同构查询是一项十分耗时的工作，在n个节点的知识图谱中为m个三跳查询采样，每个查询采样k个同构查询，其最坏情况下的时间复杂度为O(kmn³)，如果在训练中的每一轮都这样采样，其耗费的时间将令人难以接受。作为替代，本文采用空间换时间的策略，在训练之前为每条训练数据就采样一定量的同构查询(由于内存限制，实际训练中为每条查询20条同构查询)，然后在每一轮训练中取一部分作为辅助(在实际训练中为10条)。这可能会降低部分性能，但可以节省很多的时间。

由于不纳入训练过程，因此模型可以采用最直观的方法采样同构查询：对于每一个查询，模型从锚节点开始遍历知识图谱，直到叶子节点到锚节点之间的结构与当前的查询相同。为了节省时间，模型可以在采样时适当剪枝，在每一步随机剪除一些节点；为了提升性能，避免过拟合，在采样训练集的同构查询时，可以有意地删除一些查询，比如答案相同的查询，关系完全相同的查询(比如两跳查询中，两个关系在对应位置全都一样)，等等；采样验证集和测试集的查询时，由于模型不知道查询的答案，因此不需要进行这些限制。

步骤三、设计HQR模块：

HQR的中心思想是：在不改变baseline模型结构的情况下，尽可能地利用同构查询来提升模型的性能。HQR的公式、符号含义以及工作流程与发明内容中一致，此处会做进一步的解释。

HQR模块分为三步，第一步为：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

该步骤的主要功能为计算出同构查询在当前步中答案嵌入与所述查询在当前步中的查询嵌入的距离。首先，使用Projection()函数计算出同构查询在当前步的查询嵌入，然后使用 Distance()函数计算答案嵌入和查询嵌入的距离。得到的距离会给我们计算当前查询的偏移提供参考。

第二步为：

b_final＝MLP_weight(r_refer，r_q)×b_refer

该步骤的主要功能为计算出当前查询偏移的方向以及大致的大小。首先使用MLP_weight() 函数(一个多层神经网络)计算出同构查询关系与当前查询关系的相关性，也即权重。然后在第二步中将权重与相应的同构查询偏移相乘。需要注意的是，此处的MLP_weight()虽然也是基于权重的思想，但是并没有使用含有归一化步骤的注意力机制，因为我们不能笃定所有查询都对当前查询的影响力固定为1，比如说，有可能在当前步中，所有同构查询关系的语义和当前查询语义都是反相关，那么此时同构查询的影响力综合应当为负数而非1，基于这个理由，我们没有使用注意力机制。

第三步为：

q_new＝q_old+b_final×α

该步骤的作用就是将旧查询嵌入做适当的偏移，使其更加接近答案。首先将旧查询乘以一个衰减系数α，因为在实验中，我们发现训练得到的偏移往往是偏大的，如果在方向不变的情况下缩小偏移的量，那么效果会更好。第二步则是将旧查询嵌入与偏移相加，此处使用了一个残差连接，更符合HQR“组件”的思想。

步骤四、将HQR嵌入到基线模型中：

如发明内容中所述，HQR只需要安装到所有投影步的后面即可，不需要更改原来模型的结构。此处会结合一个具体例子来进行说明。

一种知识图谱复杂逻辑推理方法，包括：

S1.将知识图谱中的实体和关系集合嵌入到低维空间中，具体的嵌入方式依原有模型而定。

S2.将一阶逻辑查询转换为相应的计算图，计算图中每个节点表示一个实体，其中起始节点为己知节点，中间节点(包括答案)为未知的变量；每条边表示一个逻辑运算。

S3.给定一个查询，根据所述查询的当前步对应的计算图，生成当前的查询嵌入，方法依原有模型而定。

S4.获取所述查询的同构查询，计算出同构查询在当前步中答案嵌入与所述查询在当前步中的查询嵌入的距离，由下述公式表示：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

S5.根据所述距离，计算出当前查询偏移的方向以及大致的大小，由下述公式表示：

b_final＝MLP_weight(r_refer，r_q)×b_refer

S6根据所述当前查询的偏移，将旧查询嵌入做适当的偏移，得到修正之后当前查询的嵌入，由下述公式表示：

q_new＝q_old+b_final×α

S7.根据修正之后得到所述查询在当前步中的查询嵌入q_new，并使用此查询嵌入q_new对问题的下一步进行推理，即跳转到步骤S3，使用查询嵌入q_new作为步骤S3中的所述查询在当前步中的查询嵌入，再执行步骤S4～S7。重复循环步骤S3～S7，直至到达问题最后一步为止。

图1(d)是HQR推理Teammate(Stephen Curry，V)∧Teammate(Klay Thompson，V)∧Coach(V，V_t)的例子：首先，第一步推理合取运算，合取运算又可以分为投影和整合两步，模型可以在投影的过程中对当前查询的推理进行修正，首先用基线模型中的投影模块计算出Teammate(Stephen Curry，V)和Teammate(Klay Thompson，V)的嵌入，然后使用HQR组件将二者的q_old修正成q_new，最后使用基线模型中的交集运算进行整合；第二步是一个投影操作，模型可以使用和第一步前半部分相似的模式对基线模型计算出的q_old用HQR进行修正。

例子中没有出现析取操作，但是析取操作和合取操作一样，也可以分为投影和整合两步，模型同样可以在第一步进行修正，然后再进行整合。

步骤五、针对基于图形嵌入的模型对HQR进行改进：

受Query2Box带来的影响，图形嵌入(Geometric Embedding)技术在知识图谱复杂逻辑推理任务中越发收到研究者的青睐。Query2Box开创性地将框嵌入(Box Embedding)技术结合到了复杂逻辑推理任务当中，随后，很多模型都在其基础上进行改进，比如HypE使用了流形空间中的框嵌入来建模，ConE使用了锥形建模，都取得了很好的效果。

HQR最早是在点嵌入(比如GQE或TransE)的基础上进行研究的。正如表1、表2和表3所示，在点嵌入中HQR的效果很好，但是如果将其直接迁移到Query2Box上的话，效果却显得有些不尽人意。为了确保HQR的可扩展性，本文尝试针对以Query2Box为代表的图形嵌入模型对HQR模型进行进一步改进。实验使用了不同的改进方法：

直接迁移(origin)：不做任何改变地直接将HQR应用于Query2Box，这意味着查询框的大小不会在HQR中被改变。

考虑边框大小(A)：在计算MLP_weight时除了考虑同构查询关系的中心以外，还考虑关系的边框大小，也就是将同构查询的边框大小向量和当前查询的边框大小向量也和二者关系的中心向量一并输入到该MLP当中。

缩小边框(B)：使用MLP计算出一个常数按比例缩小当前查询的框向量，MLP的输入是当前查询、同构查询的关系中心向量和边框大小向量，输出为一个常数。

使用MLP调整边框(C)：将同构查询的关系、框向量以及当前查询的关系、框向量输入到MLP中计算出新的偏移量。

由于实验结果中A+B的效果最好，因此下面将会对该方法进行详细说明：

S1.将知识图谱中的实体和关系集合嵌入到低维空间中，按照Query2Box的嵌入方式，每个实体以一个向量表示其位置，每个关系以两个向量表示其位置与边框的大小

S2.将一阶逻辑查询转换为相应的计算图，计算图中每个节点表示一个实体，其中起始节点为已知节点，中间节点和答案为未知的变量；每条边表示一个逻辑运算。

S3.给定一个查询，根据查询对应的计算图，按照Query2Box方法生成查询嵌入，包含查询中心q_{old_center}和查询边框q_{old_offset}两个部分。

S4.计算出同构查询在当前步中答案嵌入与查询嵌入的距离，由下述公式表示：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

其中，以Query2Box为基线模型的情况下，可以使用以下公式来计算Distance和Projection：

Distance(q_r，q_p)＝q_r-q_p

Projection(q_start，r_refer)＝q_start+r_refer

其中：q_r＝q_refer；q_p＝Projection(q_start，r_refer)。

S5.根据所述距离，计算出当前查询中心偏移的方向以及大致的大小，由下述公式表示：

b_{final_center}＝MLP_weight(r_refer，r_q，r_{refer_offset}，r_{q_offset})×b_refer

其中：b_{final_center}为给定查询的查询中心在当前步中向正确答案的偏移，MLP_{weigh t}为计算权重的多层神经网络，r_refer为给定查询的同构查询的关系在当前步的嵌入，r_{refer_offset}为给定同构查询的关系的查询的查询边框的在当前步的嵌入，r_q为当前查询的关系在当前步的嵌入，r_{q_offset}为当前查询的关系的查询边框在当前步的嵌入，b_refer为给定同构查询在当前步中的答案嵌入与所述给定同构查询在当前步中的查询嵌入的距离。

S6.根据所述当前查询中心偏移，将旧查询中心的嵌入做适当的偏移，得到修正之后当前查询中心的嵌入，由下述公式表示，在实验过程中取α＝1：

q_{new_center}＝q_{old_center}+b_{final_center}×α

q_{old_center}为修正之前给定查询的查询中心在当前步中的查询嵌入，α为调整偏移大小的超参数，q_{new_center}为修正之后给定查询的查询中心在当前步中的查询嵌入。

S7.根据自身查询、同构查询当前步骤关系的信息，以及查询中心嵌入信息，计算出查询边框缩小的系数v_gate：

v_gate＝σ((MLP_off(r_refer，r_q，r_{refer_offset}，r_{q_offset})，q_{old_center}，q_{new_center}))

其中：σ为sigmoid函数；MLP_off为计算此处权重的多层(一般为2-3)神经网络；r_{refer_offset}为给定同构查询的关系的查询的查询边框的在当前步的嵌入；r_{q_offset}为当前查询的关系的查询边框在当前步的嵌入；q_{old_center}为修正之前给定查询的查询中心在当前步中的查询嵌入；q_{new_center}为修正之后给定查询的查询中心在当前步中的查询嵌入。

S8.使用v_gate缩小原有的边框：

q_{new_offset}＝q_{old_offset}×v_gate

S9.根据所述修正之后得到当前查询的嵌入q_{new_center}和q_{new_offset}，并使用此嵌入进行下一步的推理(跳转到S3)，直至到达最后一步为止。

实验结果详见表4、表5和表6。

表4：FB15k-237数据集中Query2Box和Query2Box+各类HQR变体的HITS@3

表5：FB15k数据集中Query2Box和Query2Box+各类HQR变体的HITS@3

表6：NELL995数据集中Query2Box和Query2Box+各类HQR变体的HITS@3

可以注意到HQR在经过改进后，其表现得到了明显的提升。首先，可以观察到，在考虑到了边框大小以后，模型的表现有明显提升，这是因为关系边框的大小包含了关系语义表示范围的大小；还可以观察到，边框的缩小也对模型表现有益，这可能因为，在HQR修正之后， q_new相比于q_old来说更加贴近答案实体，而这时就只需要小边框就可以将答案实体包含在内了。

下面进一步详细说明本发明在图属性预测任务上的具体实施方式，但本发明并不局限于具体任务与具体实施方式。

(1)数据预处理：

我们使用了FB15k-237、FB15k和NELL数据集来测试了HQR的性能，这三个数据集可以从Query2Box论文对应的仓库中得到。数据分为训练集、测试机和验证集，其中训练集包含1p、2p、3p、2i、3i五种查询，测试集包含所有的9种查询(图3)。

在实验的过程中，根据各个基线模型原文的设置，GQE及其变体以及Query2Box(以及加上HQR之后的GQE、GQE变体和Query2Box)使用前5种(1p、2p、3p、2i、3i)进行训练，CQD仅使用1p进行训练，然后在9种查询上进行测试和评价。

对于数据集中的每个查询，为了提高实验速度，我们都可以预先采样同构查询，方法详见步骤二。

(2)搭建网络模型框架(如图2所示)：

搭建网络模型的部分与发明内容中HQR结构部分一致：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

b_final＝MLP_weight(r_refer，r_q)×b_refer

q_new＝q_old+b_final×α

其中q_refer为同构查询结果的嵌入(当前步，下同)；q_start为同构查询起始节点的嵌入； r_refer为同构查询的关系；Projection()为基线模型中投影运算的方法；Distance()为计算查询与实体相似度的函数，比如二者相减；b_refer为同构查询中结果和查询的差值；MLP_weight为计算权重的多层神经网络；r_q为当前查询关系的嵌入；b_final为最终的偏移；q_old为修正之前当前查询的嵌入，来自于基线模型，以GQE模型回答二跳查询的第一步为例，此时的q_old即e+r，其中e为起始节点的嵌入，r为二跳查询中第一个关系的嵌入；α为调整偏移大小的超参数；q_new为修正之后当前查询的嵌入。

HQR部分直接安装到基线模型投影操作之后即可。

(3)设置模型超参数，训练与评估模型：

本专利对超参数的设置如下：

表7：实验中使用的超参数。1.CQD-CO原文使用了0.1作为学习率，CQD-CO+HQR 中，实体和关系嵌入的学习率维持0.1不变，HQR组件部分使用了可变学习率，在前50 轮学习率为0.0001，后50轮学习率为0.00005；2.CQD-CO+HQR在batch-size＝500 的时候表现更好，而CQD-CO在batch-size＝1000的情况下表现更好，因此使用了不同的 batch-size；2.CQD-CO将所有三元组视作一轮，共训练100轮。

除此之外，所有使用HQR的模型，每个查询的总同构查询数目为20，每轮使用的同构查询数目为10。

训练过程中，将查询以批的形式输入到模型当中，模型输出预测结果，与真值标签计算损失值(损失函数依基线模型不同而不同)，需要注意的是在训练的过程中对于每个例子，我们要进行负采样，随机选取错误答案作为负例，以提升模型的收敛速度和性能；然后通过后向传播算法调节模型参数。我们以验证集上模型预测效果为准调整模型超参数，并在测试集上评估最终的模型性能，以保证模型的泛化能力。

Claims

1.一种知识图谱复杂逻辑推理方法，其特征在于，包括：

获取给定查询在当前步中的查询嵌入；

根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入；

步骤根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，公式表示如下：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

步骤根据所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，获取给定查询在当前步中向正确的答案的偏移，公式表示如下：

b_final＝MLP_{weigh t}(r_refer，r_q)×b_refer

步骤根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入，公式表示如下：

q_new＝q_old+b_final×α

其中：q_old为修正之前给定查询在当前步中的查询嵌入，α为调整偏移大小的超参数，q_new为修正之后给定查询在当前步中的查询嵌入；

查询q’为给定查询q的同构查询，则：q和q’的锚节点相同；q和q’的结构相同。

2.一种知识图谱复杂逻辑推理组件，其特征在于，包括

修正查询嵌入获取模块，所述修正查询嵌入获取模块根据给定查询在当前步中的查询嵌入和给定查询在当前步中向正确的答案的偏移，得到给定查询在当前步中的修正查询嵌入；

所述距离获取模块根据给定查询的同构查询，获取所述同构查询在当前步中的答案嵌入与所述给定查询在当前步中的查询嵌入的距离，公式表示如下：

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

b_final＝MLP_{weigh t}(r_refer，r_q)×b_refer

q_new＝q_old+b_final×α

3.根据权利要求2所述的知识图谱复杂逻辑推理组件，其特征在于，关系推理步获取初始节点的嵌入，然后获取关系的嵌入，再然后将初始节点的嵌入与关系的嵌入计算，计算所得的嵌入为关系推理步的答案嵌入，所述知识图谱复杂逻辑推理组件安装在基线模型的每一个关系推理步的后面。

4.一种知识图谱的查询检索方法，其特征在于，包括

S1.将知识图谱中的实体和关系集合嵌入到低维空间中；

S2.将一阶逻辑查询转换为相应的计算图，计算图中每个节点表示一个实体，每条边表示一个逻辑运算，其中起始节点为己知节点，中间节点和答案为未知的变量；

S7.根据修正查询嵌入与知识图谱中其他所有实体做相似度匹配，所获取的相似度最高的实体为所述知识图谱的所述查询的答案；

b_refer＝Distance(q_refer，Projection(q_start，r_refer))

b_final＝MLP_{weigh t}(r_refer，r_q)×b_refer

q_new＝q_old+b_final×α