CN113268574A

CN113268574A - 一种基于依赖结构的图卷积网络知识库问答方法及系统

Info

Publication number: CN113268574A
Application number: CN202110570585.0A
Authority: CN
Inventors: 朱振方; 武文擎; 卢强; 张殿元; 裴洪丽; 亓江涛; 张广渊
Original assignee: Shandong Jiaotong University
Current assignee: Shandong Jiaotong University
Priority date: 2021-05-25
Filing date: 2021-05-25
Publication date: 2021-08-17
Anticipated expiration: 2041-05-25
Also published as: CN113268574B

Abstract

本公开公开的一种基于依赖结构的图卷积网络知识库问答方法及系统，包括：获取问题；生成问题的候选查询图；将问题表示为依赖结构；将问题和候选查询图一起输入BERT中，获取问题向量；将问题向量和表示为依赖结构的问题输入图卷积网络中，获得包含依赖关系的问题表示；将包含依赖关系的问题表示整合到问题向量中，获得候选查询图向量；通过候选查询图向量对候选查询图进行评分；选取得分最高的候选查询图从知识库中获取答案。提高了答案获取的准确率。

Description

一种基于依赖结构的图卷积网络知识库问答方法及系统

技术领域

本发明涉及知识库问答技术领域，尤其涉及一种基于依赖结构的图卷积网络知识库问答方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

知识库问答的目的是从知识库中回答事实问题，近年来引起了人们的广泛关注。早期的知识库问答研究主要集中在关系单一的简单问题上，大多基于薄弱的监督手段。这些方法要么使用外部资源，要么使用模式匹配，要么使用手工规则和特性。然而，现实问题中也存在一些制约因素，使问题通常更为复杂。为了解决自然语言问题中的这种约束，提出了一种分阶段查询图生成方法。该方法首先对单跳关系路径进行识别，然后对其进行约束，形成查询图，通过在知识图中搜索得到答案。但现实中，不仅存在单一关系的问题，也存在多跳关系的问题，比如“谁是Facebook创始人的妻子？答案和facebook之间存在有两跳的关系，即“妻子”和“创始人”，为了回答这类问题，需要考虑一个较长的关系路径来获得正确的答案，较长的关系路径意味着搜索空间将呈指数增长，因此要解决的主要问题是如何减少搜索空间，即如何减少要考虑的多跳关系路径的数目。Chen等人和Lan等人提出使用波束搜索来减少搜索空间，但在扩展关系路径时，他们只考虑最佳匹配关系，而不是所有关系。Lan等人提出通过允许更长的关系路径来修改分阶段查询图生成方法，并采用束搜索来减少搜索空间，同时解决了上述两个问题。同时，关系路径越长，关系提取的次数越多，路径中出现错误关系的概率也越大。问题越复杂，问题越长，很难捕捉单词之间的远距离关系。

故发明人认为，现有的查询图生成过程中，由于无法获取长距离词之间的关系，从而使得查询图生成过程中关系选择错误这一问题，进而导致查询图排序出错，降低了知识库问答的准确性。

发明内容

本公开为了解决上述问题，提出了一种基于依赖结构的图卷积网络知识库问答方法及系统，通过将问题表示为依赖结构，由图卷积网络对依赖结构进行编码，获取了长距离词间的关系信息，将长距离词间的关系信息参与至候选查询图的排序中，使得候选查询图的排序更准确，进而提高了知识库问答的准确性。

为实现上述目的，本公开采用如下技术方案：

第一方面，提出了一种基于依赖结构的图卷积网络知识库问答方法，包括：

获取问题；

生成问题的候选查询图；

将问题表示为依赖结构；

将问题和候选查询图一起输入BERT中，获取问题向量；

将问题向量和表示为依赖结构的问题输入图卷积网络中，获得包含依赖关系的问题表示；

将包含依赖关系的问题表示整合到问题向量中，获得候选查询图向量；

通过候选查询图向量对候选查询图进行评分；

选取得分最高的候选查询图从知识库中获取答案。

第二方面，提出了一种基于依赖结构的图卷积网络知识库问答系统，包括：

问题获取模块，用于获取问题；

候选查询图获取模块，用于生成问题的候选查询图；

依赖结构获取模块，用于将问题表示为依赖结构；

问题向量获取模块，用于将问题和候选查询图一起输入BERT中，获取问题向量；

问题表示获取模块，用于将问题向量和表示为依赖结构的问题输入图卷积网络中，获得包含依赖关系的问题表示；

候选查询图向量获取模块，用于将包含依赖关系的问题表示整合到问题向量中，获得候选查询图向量；

候选查询图评分模块，用于通过候选查询图向量对候选查询图进行评分；

答案获取模块，用于选取得分最高的候选查询图从知识库中获取答案。

第三方面，提出了一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成一种基于依赖结构的图卷积网络知识库问答方法所述的步骤。

第四方面，提出了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成一种基于依赖结构的图卷积网络知识库问答方法所述的步骤。

与现有技术相比，本公开的有益效果为：

1、本公开通过将问题表示为依赖结构，获取了长距离词间的关系信息，由图卷积网络对包含依赖结构的问题进行编码，将编码后信息参与至候选查询图的排序中，使得候选查询图的排序更准确，进而提高了知识库问答的准确性。

2、本公开针对候选查询图生成过程中关系选择错误这一问题，将问题表示为依赖结构，获取长距离词之间的关系，提高实体的关系预测的准确性。

3、本公开针对候选查询图排序出错的问题，通过图卷积网络对包含依赖结构的问题进行编码，得到更有效的表示，实现更准确的查询图排序，有效提高了知识库问答的准确性。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1为本公开实施例1公开方法流程图；

图2为本公开实施例1公开的分阶段查询图生成流程图；

图3为本公开实施例1公开的问题的依赖结构。

具体实施方式：

下面结合附图与实施例对本公开作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在本公开中，术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，只是为了便于叙述本公开各部件或元件结构关系而确定的关系词，并非特指本公开中任一部件或元件，不能理解为对本公开的限制。

本公开中，术语如“固接”、“相连”、“连接”等应做广义理解，表示可以是固定连接，也可以是一体地连接或可拆卸连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员，可以根据具体情况确定上述术语在本公开中的具体含义，不能理解为对本公开的限制。

实施例1

在该实施例中，公开了一种基于依赖结构的图卷积网络知识库问答方法，包括：

获取问题；

生成问题的候选查询图；

将问题表示为依赖结构；

将问题和候选查询图一起输入BERT中，获取问题向量；

通过候选查询图向量对候选查询图进行评分；

选取得分最高的候选查询图从知识库中获取答案。

进一步的，遵循分阶段查询图生成的方法，使用束搜索迭代地生成问题的候选查询图。

进一步的，在候选查询图生成的过程中，对于每次迭代过程中的查询图，使用extend、connect和aggregate中的一种动作来添加边和节点，生成候选查询图。

进一步的，分别对问题、候选查询图和表示为依赖结构的问题进行预处理，获得相应的问题序列、候选查询图序列和表示为依赖结构的问题序列。

进一步的，将问题序列和候选查询图序列输入BERT中，获取问题向量；

将问题向量和表示为依赖结构的问题序列输入图卷积网络中，获得包含依赖关系的问题表示。

进一步的，通过候选查询图向量为候选查询图与问题的相似度进行评分，选取相似度得分最高的候选查询图从知识库中获取答案。

进一步的，将候选查询图向量通过全连接层连接后连接softmax，获取候选查询图与问题的相似度得分。

对本实施例公开的一种基于依赖结构的图卷积网络知识库问答方法进行详细说明。

如图1所示，一种基于依赖结构的图卷积网络知识库问答方法，包括：

S1：获取问题。

S2：将问题生成候选查询图。

在具体实施过程中，采用分阶段查询图生成的放大，使用束搜索迭代地生成候选查询图，并且在每次迭代过程中，对于每个候选查询图g，应用extend、connect、aggregate其中一种操作来将g再增长一条边和一个节点。

结合图2对候选查询图的生成过程进行说明，图2中，y1和y3是用于n元关系的CVT节点，CVT是知识图谱(Freebase)中用于n元关系的特殊虚拟实体，由图2可知，查询图由四种类型的节点组成：图中用圆角矩形表示的为固定实体，固定实体即主题实体；用圆表示的为已存在变量，λ变量为未知变量，用阴影圆表示；菱形表示的为聚合函数，聚合函数可以为argmin和count函数。固定实体表示知识图谱中的现有实体，对应的已存在变量和λ变量表示未固定的实体。

以问题“Who is the first wife of TV producer that was nominated forThe Jeff Probst Show？”为例，生成候选查询图的过程为：

从一个固定实体“Jeff Probst show”出发，找到一个连接固定实体和答案的核心关系路径，如果没有多余的约束词和其他关系，那么答案就是图2中的x。但是因为约束词，这里x变成y1，y1为一个中间节点，从y1往下走，在问题中添加约束词，如图2所示，第二个argmin代表first，可以理解为选择许多选项中最小的选项，当找到所有候选查询图时，根据候选查询图与问题的相似度对候选查询图进行排序。在此基础上进行再次迭代时，采用extend、connect和aggregate三种动作来添加节点。extend的功能是寻找关系，在查询图的第一次迭代中，找到nominated for，并通过extend添加“wife”信息，用中间节点替换原来的x。connect的功能是找到问题中的其他固定实体，并将它们连接到已有的节点上；aggregate的作用是生成聚合函数中的节点。

S3：将问题表示为依赖结构。

在具体实施时，为了识别出存在多跳关系的问题的答案，在将问题生成查询图的过程中，需要考虑一个较长的关系路径来获得正确的答案，但是关系路径越长，路径中出现错误关系的概率越大，依赖树可以帮助模型捕捉单词之间的长距离关系。

基于现有的分阶段查询图生成方法，存在关系选取存在错误和查询图排序出错问题，在该实施例中通过增加问题的依赖结构，获得了长距离词之间的关系，提高了由于长距离实体的关系预测的准确性，在利用图卷积网络对包含依赖结构的问题进行二次编码时，得到更有效的表示，实现有效的候选查询图排序，提高生成查询图的精度。

本实施例通过依赖结构帮助模型将问题表示为一个依赖结构，问题“Who is thefirst wife of TV producer that was nominated for The Jeff Probst Show？”的依赖结构如图3所示，该依赖结构为无向图。通过图3可以看出，wife和first，producer，nominated是有联系的，由此看，每一个词都是有关系的。

S4：将问题和候选查询图一起输入BERT中，获取问题向量。

在将问题和候选查询图一起输入BERT前，分别对问题、候选查询图和表示为依赖结构的问题进行预处理，获得相应的问题序列、候选查询图序列和表示为依赖结构的问题序列。

将问题序列和候选查询图序列输入BERT中，获取问题向量h_q，h_q是序列的隐藏状态。

S5：将问题向量和表示为依赖结构的问题序列输入图卷积网络中，获得包含依赖关系的问题表示。

图卷积网络是卷积神经网络用于编码图的自适应，给定一个有n个节点的图，图的结构可以用一个n×n的邻接矩阵A来表示，如果从节点i到节点j有一条边，则A_ij＝1，然后利用高效的图卷积对问题的依赖结构进行编码。

通过将每棵树转换为其对应的邻接矩阵A来适应图卷积操作来建模依赖树，其中如果节点i和j之间存在依赖边，则A_ij＝1。在L层图卷积网络(GCN)中，将L层第i节点的输入向量表示为

输出向量表示为

同时在数据传输到非线性层之前执行归一化操作，并将自循环添加到图中的每个节点，图卷积操作可写为：

其中

I是n×n单位矩阵，

是结果图中记号i的次数，W^(l)是线性变换，b^(l)是偏差项，σ是非线性函数。在图卷积的过程中，每个节点都会收集并汇总来自其邻居的信息。

将该操作叠加在L层得到一个深度GCN网络，其中

为输入词向量，

为输出词表示。该网络中的所有运算都可以通过矩阵乘法有效地实现，适合于批量计算和GPU上运行。此外，节点间的信息传播是并行的，运行时与依赖树的深度无关。到目前为止，已经得到了包含词与词之间依赖关系的问题表示，这影响了关系选择中查询图的排序。同时，它还捕获了选择关系所需的边缘信息。

通过图卷积网络对依赖结构进行编码，获取包含依赖关系的问题表示。

S6：将包含依赖关系的问题表示整合到问题向量中，获得候选查询图向量，并通过候选查询图向量对候选查询图进行评分。

由于每次迭代后，都需要对候选查询图g进行排序，排序前，将图卷积网络输出的包含依赖关系的问题表示集成到问题向量中，获取候选查询图向量。由于从图卷积网络中提取的信息的集合维数较小，所以将问题向量拆分，并对信息进行集成：

h_qx＝h_qx+h^(l)

v_q＝concat(h_qx)

其中h_qx是一个分解成x份之一的问题向量，这里只表示一个，实际上所有分解的部分都将被整合进去，h^(l)是GCN的输出向量，concat用来连接向量。然后为每个候选查询图导出候选查询图向量，候选查询图向量为一个7维向量，将这些向量发送到一个全连接层，最后用softmax计算概率，获取候选查询图与问题的相似度得分。

候选查询图向量的第一个维度是候选查询图向量的词向量，第二个维度是所有固定实体的链接分数，第三个维度是候选查询图中出现的所有地面实体的数量，第四、第五和第六个维度是实体类别的数量，最后一个维度是答案的个数。

在没有任何正确的查询图的情况下，我们使用问答对来训练模型。遵循Das等人的框架，我们使用强化算法以端到端的方式学习策略函数pθ(g|hq)。其中θ是我们要学习的参数集，包括要更新的BERT参数和GCN和全连通层的参数。我们使用F1分数的预测答案作为相对于地面真相答案的奖励。

在没有任何正确的查询图的情况下，使用问答对来训练模型。遵循Das等人的框架，使用强化算法以端到端的方式学习策略函数pθ(g|hq)。其中θ是要学习的参数集，包括要更新的BERT参数和GCN和全连通层的参数。使用F1分数的预测答案作为相对于地面真相答案的奖励。

S4：选取得分最高的候选查询图从知识库中获取答案。

本实施例公开的方法在处理复杂的知识库和问题时更有效，相比较于Yih等人、Bao等人和Luo等人提出的分阶段查询图生成方法，他们的方法不能处理多跳问题。Lan等人处理约束并考虑多跳关系路径，但在不受方法限制的情况下，搜索空间呈指数增长。Chen等人使用波束大小为1的波束搜索来处理多跳问题，但它不能有效地处理约束问题。与Bhutaniet等人进行了比较，他们使用一组简单的查询构造复杂的查询模式，与Ansari等人进行了比较，后者从一个特征到一个特征的问题生成查询程序。相比较于他们两种方法，本实施例公开的方法在对问题的处理上准确性更高。最重要的是与Lan等人相比，Lan等人允许更长的关系路径来修改分阶段查询图生成方法，并使用束搜索来减少搜索空间，但是在查询图生成中，每次迭代中对关系的选择并不那么正确，因为更长的关系路径意味着更多的信息关系选择。相比之下，本实施例公开的方法利用图卷积网络对依赖结构上的信息进行有效的融合，利用有效的图卷积运算对输入问题上的依赖结构进行编码，有助于查询图生成过程中的关系选择。在查询图生成过程中，本实施例公开方法不仅注重减少搜索空间，而且提高了关系选择的准确性，从而影响了查询图的排序，使得获取的答案更准确。

实施例2

在该实施例中，公开了一种基于依赖结构的图卷积网络知识库问答系统，包括：

问题获取模块，用于获取问题；

候选查询图获取模块，用于生成问题的候选查询图；

依赖结构获取模块，用于将问题表示为依赖结构；

实施例3

在该实施例中，公开了一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例1公开的一种方法所述的步骤。

实施例4

在该实施例中，公开了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例1公开的一种方法所述的步骤。

以上仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，包括：

获取问题；

生成问题的候选查询图；

将问题表示为依赖结构；

将问题和候选查询图一起输入BERT中，获取问题向量；

通过候选查询图向量对候选查询图进行评分；

选取得分最高的候选查询图从知识库中获取答案。

2.如权利要求1所述的一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，遵循分阶段查询图生成的方法，使用束搜索迭代地生成问题的候选查询图。

3.如权利要求1所述的一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，在候选查询图生成的过程中，对于每次迭代过程中的查询图，使用extend、connect和aggregate中的一种动作来添加边和节点，生成候选查询图。

4.如权利要求1所述的一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，还包括，分别对问题、候选查询图和表示为依赖结构的问题进行预处理，获得相应的问题序列、候选查询图序列和表示为依赖结构的问题序列。。

5.如权利要求4所述的一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，将问题序列和候选查询图序列输入BERT中，获取问题向量；将问题向量和表示为依赖结构的问题序列输入图卷积网络中，获得包含依赖关系的问题表示。

6.如权利要求1所述的一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，通过候选查询图向量为候选查询图与问题的相似度进行评分，选取相似度得分最高的候选查询图从知识库中获取答案。

7.如权利要求6所述的一种基于依赖结构的图卷积网络知识库问答方法，其特征在于，将候选查询图向量通过全连接层连接后连接softmax，获取候选查询图与问题的相似度得分。

8.一种基于依赖结构的图卷积网络知识库问答系统，其特征在于，包括：

问题获取模块，用于获取问题；

候选查询图获取模块，用于生成问题的候选查询图；

依赖结构获取模块，用于将问题表示为依赖结构；

9.一种电子设备，其特征在于，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成权利要求1-7任一项所述的一种基于依赖结构的图卷积网络知识库问答方法的步骤。

10.一种计算机可读存储介质，其特征在于，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1-7任一项所述的一种基于依赖结构的图卷积网络知识库问答方法的步骤。