CN113360604A

CN113360604A - 基于认知推理的知识图谱多跳问答方法及模型

Info

Publication number: CN113360604A
Application number: CN202110697004.XA
Authority: CN
Inventors: 王杰; 蔡健宇; 张占秋; 吴枫
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2021-06-23
Filing date: 2021-06-23
Publication date: 2021-09-07
Anticipated expiration: 2041-06-23
Also published as: CN113360604B

Abstract

本发明公开了一种基于认知推理的知识图谱多跳问答方法及模型，方法包括：步骤1，从给定的问题‑答案对数据中随机选取多批次的数据作为训练集；步骤2，以训练集作为输入，训练深层认知推理网络模型的参数，并通过神经网络优化器以使训练过程中损失函数的值最小化为目标，对深层认知推理网络模型进行优化，得到优化后的网络模型；步骤3，通过优化后的网络模型对测试集中的问题进行处理，并对各个候选答案实体打分，得分最高的候选答案实体即为给定自然语言问题的答案。通过模拟人类的认知推理机制，由层次化的网络模型从不同角度进行知识推理，有效地利用并建模了知识图谱中的节点级别与边级别的信息，对知识图谱多跳问答取得显著性能提升。

Description

基于认知推理的知识图谱多跳问答方法及模型

技术领域

本发明涉及基于知识图谱的自然语言处理领域，尤其涉及一种基于认知推理的知识图谱多跳问答方法及模型。

背景技术

知识图谱以多关系有向图的形式存储人类知识，图中的每个节点都表示一个实体，每条边都表示两个实体之间的关系，而边的方向则表示了该方向的指向性。知识图谱中的每个事实(Fact)一般以头实体、关系、尾实体的三元组的形式存储，例如：姚明、出生地、上海即为一个三元组。

知识图谱问答旨在基于知识图谱对给定的自然语言问题进行回答，而知识图谱多跳问答旨在通过知识图谱中的路径推理得到答案，图1所示即为知识图谱多跳问答任务的示意图。

目前的知识图谱多跳问答中存在一个严峻的挑战，对于需要长推理路径的复杂问题的回答准确率低，这是由于需要长推理路径的复杂问题，会随着跳数的增长使候选答案实体的数量呈指数增加，但大量的候选答案实体为寻找准确答案带来了困难。之前的方法KV-Mem使用记忆网络(Memory Network)进行多跳推理，VRN使用一种变分法框架进行多跳推理，但这些方法难以有效解决需要长推理路径问题的准确回答问题。现有的方法(如：GRAFT-Net与PullNet)为了解决这一问题，它们首先提取问题相关的子图，随后在提取的子图上进行推理。然而，这些方法往往牺牲了答案实体在子图中的召回率以降低候选实体集合的大小，即这样的妥协限制了现有模型的性能。因此，针对需要长推理路径的复杂问题，如何提供一种无需牺牲召回率的高准确率的问答方法是需要解决的问题。

发明内容

针对现有技术所存在的问题，本发明的目的是提供一种基于认知推理的知识图谱多跳问答方法及模型，能解决现有基于知识图谱多跳问答中，所存在的因需要长推理路径复杂导致回答准确率低以及牺牲模型对于正确答案召回率的问题。

本发明的目的是通过以下技术方案实现的：

本发明实施方式提供一种基于认知推理的知识图谱多跳问答方法，用于从给定知识图谱中，以某一主题实体作为推理起点，基于认知推理预测得出一个自然语言问题的正确答案，包括以下步骤：

步骤1，从给定的问题-答案对数据中随机选取多批次的数据作为训练集；所述问题-答案对数据为给定的自然语言问题与正确候选答案实体组成的数据对；

步骤2，以所述的训练集作为输入，训练深层认知推理网络模型的参数，并通过神经网络优化器以使训练过程中损失函数的值最小化为目标，对所述深层认知推理网络模型进行优化，得到优化后的深层认知推理网络模型；

步骤3，通过优化后的所述深层认知推理网络模型对测试集中的自然语言问题进行处理，并对各个候选答案实体进行打分，得分最高的候选答案实体即为给定自然语言问题的答案。

本发明实施方式还提供一种基于认知推理的知识图谱多跳问答模型，包括：

输入层、推理路径解码模块、无意识模块、有意识模块和输出层；其中，

所述输入层，分别与所述理路径解码模块和无意识模块连接，用于输入给定的自然语言问题；

所述推理路径解码模块的输出端分别无意识模块和有意识模块连接，该理路径解码模块接收所述输入层传入的给定的自然语言问题，输出解码所述给定的自然语言问题得到的推理路径中每一步中每一个选择的得分；

所述无意识模块依次与所述有意识模块和输出层连接，该无意识模块的输入为给定的自然语言问题、知识图谱和推理路径解码模块的输出，输出为每个候选答案实体的打分；

所述有意识模块的输入为给定的自然语言问题、知识图谱、推理路径解码模块的输出和无意识模块的输出，输出为每个候选答案实体的最终得分；

所述输出层，用于输出所述有意识模块得出的每个候选答案实体的最终得分。

由上述本发明提供的技术方案可以看出，本发明实施例提供的基于认知推理的知识图谱多跳问答方法及模型，其有益效果为：

通过模拟人类的认知推理机制，利用层次化的深层认知推理网络模型从不同角度进行知识推理，有效地利用并建模了知识图谱中的节点级别与边级别的信息，对进行知识图谱多跳问答取得了显著的性能提升。本发明的方法及模型结合知识图谱嵌入与贝叶斯网络技术进行建模处理，对于知识图谱多跳问答能快速、准确的预测得出对应的候选答案实体，具备优越的性能，进而很好的解决现有知识图谱多跳问答中，对需要长推理路径问题的回答准确率低以及模型牺牲了对于正确答案召回率的问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的基于认知推理的知识图谱多跳问答方法的流程图；

图2为本发明实施例提供的基于认知推理的知识图谱多跳问答建模示意图；

图3为本发明实施例提供的基于认知推理的知识图谱多跳问答方法模型的示意图；

图4为本发明实施例提供的的示意图。

具体实施方式

下面结合本发明的具体内容，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。本发明实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

参见图1，本发明实施例提供一种基于认知推理的知识图谱多跳问答方法，用于从给定知识图谱中，以某一主题实体作为推理起点，基于认知推理预测得出一个自然语言问题的正确答案，包括以下步骤：

参见图3，上述方法中，所述深层认知推理网络模型包括：

上述方法中，所述推理路径解码模块采用长短期记忆网络(即LSTM)；

所述无意识模块采用基于向量语义匹配的神经网络模型；

所述有意识模块采用基于概率图模型的神经网络模型。

上述方法中，所述深层认知推理网络模型的无意识模块通过语义匹配对每个候选答案实体进行打分，通过以下公式1计算候选答案实体e的得分：

所述公式(1)中，

表示基于自然语言问题q得到的查询向量，

通过公式2计算得出：

所述公式2中，符号

表示元素间相乘，o⁽ⁱ⁾表示所述深层认知推理网络模型的推理路径解码模块中第i步的输出。

上述方法中，所述深层认知推理网络模型的有意识模块基于所述无意识模块输出的得分，使用贝叶斯网络进行顺序推理，得出每个候选答案实体的最终得分。

上述方法中，所述有意识模块的具体处理步骤为：

(a)裁剪知识图谱：以一个主题实体e_topic∈ε作为推理起点用广度优先搜索算法，从给定的一个知识图谱

中搜索一个自然语言问题q的对应答案实体，得出只由访问过的边组成的有向无环图作为裁剪后的知识图谱

(b)将裁剪后的知识图谱

转换为贝叶斯网络

与

的图结构相同，两者的节点与边的定义分别为：

(c)基于贝叶斯网络进行推理：基于所述步骤(b)中得到的贝叶斯网络

建模知识图谱多跳问答为：

这个条件概率表示在给定知识图谱

问题q与主题实体e_topic的条件下，实体e为正确答案的概率。

根据贝叶斯网络的性质，推导出如下结果：

其中pa(e)表示知识图谱中实体(节点)e的父节点集合

所述公式(3)中，

的定义为：

用以上方式对所述概率公式(4)进行建模：

所述公式(5)中，f_s(e)是无意识模块输出的得分，f_b(e)是有意识模块所计算的对候选实体e的打分结果，f_b(e)通过以下公式(6)计算：

其中，对于任一关系r_i，其权重计算为

上述方法中，所述深层认知推理网络模型的损失函数为：

所述公式(7)中，

|ε|表示实体集合大小，

表示答案集合大小。

参见图3，本发明实施例提供一种基于认知推理的知识图谱多跳问答模型，包括：

上述模型中，所述推理路径解码模块采用编码-解码器模型；

所述无意识模块采用基于向量內积的语义匹配模型；

所述有意识模块采用基于贝叶斯网络的路径推理模型。

上述模型中，所述深层认知推理网络模型的无意识模块通过语义匹配对每个候选答案实体进行打分，通过以下公式1计算候选答案实体e的得分：

所述公式(1)中，

表示基于自然语言问题q得到的查询向量，

通过公式2计算得出：

所述公式2中，符号

表示元素间相乘，o⁽ⁱ⁾表示所述深层认知推理网络模型的推理路径解码模块中第i步的输出；

所述深层认知推理网络模型的有意识模块基于所述无意识模块输出的得分，使用贝叶斯网络进行顺序推理，得出每个候选答案实体的最终得分。

上述模型中，所述有意识模块的具体处理步骤为：

(b)将裁剪后的知识图谱

转换为贝叶斯网络

与

的图结构相同，两者的节点与边的定义分别为：

建模知识图谱多跳问答为：

根据贝叶斯网络的性质，推导出如下结果：

所述公式(3)中，

的定义为：

用以上方式对所述概率公式(4)进行建模：

本发明的基于认知推理的知识图谱多跳问答方法，以认知科学中双重过程理论为基础，结合知识图谱嵌入与贝叶斯网络技术进行建模处理，对于知识图谱多跳问答能快速、准确的预测得出对应的候选答案实体，具备优越的性能，进而很好的解决现有知识图谱多跳问答中，对需要长推理路径问题的回答准确率低以及模型牺牲了对于正确答案召回率的问题。

下面对本发明实施例具体作进一步地详细描述。

本发明实施例提供一种基于认知推理的知识图谱多跳问答模型，是一种深层认知推理网络模型，包括：

理路径解码模块、无意识(unconscious)模块和有意识(conscious)模块；其中，

所述路径解码模块，作为最底层的模块，其输出作为所述无意识模块与有意识模块的部分输入。该模块的输入为给定的问题问题，输出为从该问题解码得到的推理路径信息，即推理路径中每一步中每一个选择的得分；

所述无意识模块，其输入为给定的问题、知识图谱以及路径解码模块的输出，其输出为每个候选答案实体的打分，同时也作为所述有意识模块的部分输入。

所述有意识模块，其输入为给定的问题、知识图谱、路径解码模块的输出以及无意识模块的输出，其输出为每个候选答案实体的最终得分。该得分也作为整个模型的输出。

本发明实施例还提供一种基于认知推理的知识图谱多跳问答方法，用于从给定知识图谱中，以某一主题实体作为推理起点，基于认知推理预测得出一个自然语言问题的正确答案，包括以下步骤：

步骤1，从给定的问题-答案对数据中随机选取多批次的数据作为训练集；所述问题-答案对数据为自然语言问题与正确候选答案实体组成的数据对；

步骤2，以所述的训练集作为输入，训练深层认知推理网络模型的参数，并通过神经网络优化器以使训练过程中损失函数的值最小化为目标，对所述深层认知推理网络模型进行优化，得到优化后的深层认知推理网络模型；所述深层认知推理网络模型采用上述的基于认知推理的知识图谱多跳问答模型；

本发明的方法及模型通过模拟人类的认知推理机制，利用层次化的深层认知推理网络模型从不同角度进行知识推理，有效地利用并建模了知识图谱中的节点级别与边级别的信息，对进行知识图谱多跳问答取得了显著的性能提升。

具体的，本发明的基于认知推理为知识图谱多跳问答方法具体包括：

首先说明知识图谱和所使用的符号，然后介绍本发明的具体处理步骤。

(一)知识图谱(KG)是表示结构化人类知识的多关系有向图，将一个知识图谱能表示为

其中ε表示实体集合，

表示关系集，

表示三元组集合。

本发明的知识图谱多跳问答(参见图2)：是从给定知识图谱

中，以作为推理起点的主题实体e_topic∈ε，预测得出一个自然语言问题q的正确答案e^*，

该正确答案称为候选答案实体。

本发明对知识图谱多跳问答任务设计了一个深层认知推理网络模型(DCRN，DeepCognitive Reasoning Network)。该深层认知推理网络模型基于认知科学中的双重过程理论(Dual Process Theory)。该理论提出，人类的推理流程可以被分解为两个过程：无意识过程(unconscious process)与有意识过程(conscious process)。前者使用直觉(fastintuition)从海量的信息中提取重要的部分，而后者使用顺序推理(sequentialreasoning)以寻找答案。类似的，本发明的深层认知推理网络模型包括：无意识模块和有意识模块，分别对应进行无意识阶段(unconscious phase)与有意识阶段(conscious phase)两个阶段的处理，同时还包含一个推理路径解码模块(Path Decoding Module)，如图3所示。

接下来分别介绍推理路径解码模块、无意识模块与有意识模块的功能和处理过程。

(1)推理路径解码模块：

该推理路径解码模块的输入为，q是一个自然语言问题，输出为从该问题q解码得到的推理路径信息，即得到推理路径中每一步中每一个选择的得分。具体地，使用编码-解码(Encoder-Decoder)结构对问题q进行处理。

首先，将问题q使用包含在推理路径解码模块中的循环神经网络(RNN)编码为向量表示q＝RNN-Encoder(q)；

接着，对该向量表示q＝RNN-Encoder(q)进行解码得到推理路径信息，即得到推理路径中每一步中每一个选择的得分，参见图4。

该推理路径解码模块对向量表示q＝RNN-Encoder(q)的解码的过程分为多步，其中，第t步的状态向量用h^(t)表示，通过以下公式计算得出：

h^(t)＝RNN-Decoder(h^(t-1),i^(t))；

上式中，i^(t)为第t步的输入向量，初始的状态向量为h⁽⁰⁾＝q，初始的输入向量i⁽⁰⁾＝0；第t步的输出通过以下方式计算得出：

其中

表示第i个关系的权重，通过以下公式计算得出：

其中，

表示第i个关系在第t步的得分；

第t步的输出作为第(t+1)步的输入，即i^(t+1)＝o^(l)。

(2)无意识模块：

在该无意识模块的处理中，使用语义匹配(Semantic Matching)对每个候选实体进行打分，候选实体e的得分计算方式如下：

其中，

表示基于问题q得到的查询(query)向量，其计算方式如下：

其中，符号

表示元素间相乘，o⁽ⁱ⁾表示推理路径解码模块中第i步的输出。

(3)有意识模块：

在该无意识模块的处理中，基于无意识模块的得分，使用贝叶斯网络进行顺序推理，从而准确地预测答案。该无意识模块的处理包括步骤：

(a)裁剪知识图谱：给定一个知识图谱

一个问题q和主题实体(作为推理起点)e_topic∈ε，从该主题实体出发，执行广度优先搜索算法(Breadth-First Search)从知识图谱

中搜索，只保留图中访问过的边(edge)，最终得到裁剪后的知识图谱

该图为一个有向无环图(DAG)；

(b)将裁剪后的知识图谱

转换为贝叶斯网络，转换后的贝叶斯网络用

表示，

与

图结构相同，区别在于两者的节点与边的定义不同，见下表1；

表1为

与

的区别

(c)基于贝叶斯网络

进行推理：基于步骤(b)中得到的贝叶斯网络

知识图谱多跳问答用以下方式进行建模：

根据贝叶斯网络的性质，推导出如下结果：

其中，

定义为：

使用如下方式建模上述概率公式：

其中，f_s(e)是无意识模块计算的打分结果；f_b(e)是有意识模块所计算的对候选实体e的打分结果；f_b(e)的计算方式如下：

本发明通过基于认知科学中双重过程理论设计的深层认知推理网络模型，并结合知识图谱嵌入与贝叶斯网络进行建模，使得知识图谱多跳问答模型具备优越的性能。

表2为本发明的深层认知推理网络模型的性能表

上表2示意了本发明的深层认知推理网络模型(DCRN)在主流数据集WebQSP、MetaQA数据集上的测试结果(指标为H@1)。实验结果表明该DCRN在主流数据集上性能显著超越现有的方法。

表3为本发明的深层认知推理网络模型的无意识模块与有意识模块消融实验的性能表：

从上表3可以看出，本发明的深层认知推理网络模型(即DCRN)在主流数据集MetaQA数据集上的消融实验测试结果。实验结果表明本发明的DCRN的两个阶段均对最终结果起到了至关重要的作用。

实施例

(1)训练阶段：

训练阶段的目标为最小化损失函数；

给定知识图谱

一个问题q和主题实体(推理起点)e_topic∈ε，以及正确答案集合

训练过程的目的在于最小化以下损失函数(二分类交叉熵损失函数)：

其中，

(2)测试阶段：

在进行测试时，针对给定的知识图谱

一个问题q和主题实体(推理起点)e_topic∈ε，本发明的DCRN对每个候选实体e进行打分：

然后选取得分最高的候选实体作为预测的最终答案。

本领域普通技术人员可以理解：实现上述实施例方法中的全部或部分流程是可以通过程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。