CN114637819A

CN114637819A - 一种基于时序知识图谱的复杂问答查询方法和装置

Info

Publication number: CN114637819A
Application number: CN202210146333.XA
Authority: CN
Inventors: 鄂海红; 宋美娜; 许友日
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2022-02-17
Filing date: 2022-02-17
Publication date: 2022-06-17
Also published as: WO2023155287A1

Abstract

本发明公开了一种基于时序知识图谱的复杂问答查询方法和装置，其中，该方法包括：获取时序问题并将时序问题输入训练好的问答系统模型；其中，问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型；利用时序知识嵌入模型获取时序问题中的实体嵌入和时间嵌入，并利用嵌入提取模型获取时序问题的潜在嵌入；以及利用时间变化模型将时间嵌入变换到时序问题的目标时间下；使用答案评分模型对实体嵌入的实体和目标时间进行评分，并输出得分最高的实体或时间作为时序问题的答案。本发明将潜在的嵌入变换到问题的目标时间，能够提升复杂时序问题的处理能力，并简化复杂问题的处理过程。

Description

一种基于时序知识图谱的复杂问答查询方法和装置

技术领域

本发明涉及信息技术及数据业务技术领域，尤其涉及一种基于时序知识图谱的复杂问答查询方法和装置。

背景技术

时序知识图谱是带有时间属性的结构化事件的集合，可表示为四元组的集合 G＝{(s,r,o,t)}，其中s代表头实体，o代表尾实体，r代表关系，t代表时间，如(梅西，获奖，世界足球先生，2009年)。时序知识图谱可看作一个知识库，而基于时序知识图谱构建问答系统，可让人们更容易地获取所查询的知识，即以自然语言而无需撰写专业查询语句向问答系统提问。

目前主流的时序知识图谱问答方法主要有CRONKGQA、TEQUILA、EXAQT。其中，通过利用时序知识嵌入，CRONKGQA对简单问题达到了很高的准确率，但不能很好处理含有复杂时序关系的时序问题。TEQUILA将复杂时序问题分解为子问题进行多步解答，而 EXAQT在涉及多个实体与事件的子图上进行推理。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的目的在于提升复杂时序问题的处理能力，并简化复杂问题的处理过程。提出一种基于时序知识图谱的复杂问答查询方法，首先提取复杂问题中的潜在时间和实体的嵌入，然后利用与实体、关系、问题类型相关的神经网络，去推断问题中时间信息的变化，以便将潜在的嵌入变换到问题的目标时间，同时以处理简单问题的方式解决复杂问题，即使用时序图谱嵌入去回答简化后的查询，而不需要进行麻烦的多步查询或子问题分解。

本发明的另一个目的在于提出一种基于时序知识图谱的复杂问答查询装置。

为达上述目的，本发明一方面提出了基于时序知识图谱的复杂问答查询方法，包括以下步骤：

获取时序问题并将所述时序问题输入训练好的问答系统模型；其中，所述问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型；利用所述时序知识嵌入模型获取所述时序问题中的实体嵌入和时间嵌入，并利用所述嵌入提取模型获取所述时序问题的潜在嵌入；以及，利用所述时间变化模型将所述时间嵌入变换到所述时序问题的目标时间下；使用所述答案评分模型对所述实体嵌入的实体和所述目标时间进行评分，并输出得分最高的实体或时间作为所述时序问题的答案。

本发明实施例的基于时序知识图谱的复杂问答查询方法，能够将潜在的嵌入变换到问题的目标时间，同时以处理简单问题的方式解决复杂问题，即使用时序图谱嵌入去回答简化后的查询，而不需要进行麻烦的多步查询或子问题分解。

另外，根据本发明上述实施例的基于时序知识图谱的复杂问答查询方法还可以具有以下附加的技术特征：

进一步地，对所述时序知识嵌入模型进行训练，包括：获取时序知识图谱并输入所述问答系统模型；使用TComplEx模型在所述时序知识图谱上训练，获得所述实体嵌入和时间嵌入；若所述TComplEx模型训练结果未达到第一预设指标，则调整所述时序知识嵌入模型超的参数，继续所述TComplEx模型在所述时序知识图谱上训练的步骤；若达到所述第一预设指标，则获取用于所述问答系统模型训练的时序问题样本。

进一步地，对所述问答系统模型进行训练，包括：将所述时序问题样本输入所述问答系统模型，并利用所述问答系统模型在所述时序问题样本上进行训练；若所述问答系统模型的训练结果未达到第二预设指标，则调整所述问答系统模型的超参数，继续所述问答系统模型在所述时序问题样本上进行训练的步骤；若达到所述第二预设指标，则结束对所述问答系统模型的训练。

进一步地，所述使用TComplEx模型在所述时序知识图谱上训练，获得所述实体嵌入和时间嵌入，包括：利用ComplEx模型分别将实体、关系和时间戳表示为复数向量，以获得任一四元组真实性的得分函数为：

根据所述得分函数完成TComplEx模型的训练，以获得实体嵌入、关系嵌入和时间嵌入，以及根据所述实体嵌入、关系嵌入和时间嵌入查询单个事件的能力。

进一步地，所述利用所述嵌入提取模型获取所述时序问题的潜在嵌入，包括：使用DistilBert模型编码时序问题q，利用DistilBert模型最后一个隐层状态和全连接层FFN表示提取时序问题q的表示为如下关系：

h_q＝FFN(DistilBert(q))

每个时序问题q至少标注一个实体s，使用知识图谱嵌入表示s的嵌入为e_s＝u_s，使用所述全连接层FFN提取关系表示e_r＝FFN_r(h_q)，若时序问题q的目标时间和目标尾实体缺失，则使用2个全连接层FFN分别提取潜在时间和尾实体的嵌入：

e_time＝FFN(h_q)，e_o＝FFN(h_q)

进一步地，所述利用所述时间变化模型将所述时间嵌入变换到所述时序问题的目标时间下，包括：拼接四个实体、关系和时间的潜在嵌入，并送入全连接层FFN：

与时序问题q的隐层状态表示拼接后送入全连接层FFN：

将潜在的时序嵌入变换为目标时间嵌入:

其中，

代表对应元素相乘。

进一步地，所述使用所述答案评分模型对所述实体嵌入的实体和所述目标时间进行评分，并输出得分最高的实体或时间作为所述时序问题的答案，包括：基于实体或时间为时序问题的答案，使用两个全连接层FFN分别提取两个关系表示

和

使用TComplex模型的得分函数和变换后的嵌入，衡量所述时序问题答案的得分：

衡量每个时间t为时序问题答案的得分函数为：

将所有实体的得分与所有时间的得分拼接后，送入softmax函数后得到归一化的概率，以输出得分最高的实体或时间作为答案。

为达到上述目的，本发明另一方面提出了一种基于时序知识图谱的复杂问答查询装置，包括：

输入模块，用于获取时序问题并将所述时序问题输入训练好的问答系统模型；其中，所述问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型；提取模块，用于利用所述时序知识嵌入模型获取所述时序问题中的实体嵌入和时间嵌入，并利用所述嵌入提取模型获取所述时序问题的潜在嵌入；以及，利用所述时间变化模型将所述时间嵌入变换到所述时序问题的目标时间下；输出模块，用于使用所述答案评分模型对所述实体嵌入的实体和所述目标时间进行评分，并输出得分最高的实体或时间作为所述时序问题的答案。

本发明实施例的基于时序知识图谱的复杂问答查询装置，能够将潜在的嵌入变换到问题的目标时间，同时以处理简单问题的方式解决复杂问题，即使用时序图谱嵌入去回答简化后的查询，而不需要进行麻烦的多步查询或子问题分解。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明实施例的基于时序知识图谱的复杂问答查询方法的流程图；

图2为根据本发明实施例的基于时序知识图谱的复杂问答系统框架图；

图3为根据本发明实施例的问答系统的模型结构图；

图4为根据本发明实施例的问答系统的训练流程图；

图5为根据本发明实施例的问答系统的使用流程图；

图6为根据本发明实施例的基于时序知识图谱的复杂问答查询装置结构示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

下面参照附图描述根据本发明实施例提出的基于时序知识图谱的复杂问答查询方法及装置，首先将参照附图描述根据本发明实施例提出的基于时序知识图谱的复杂问答查询方法。

图1是本发明一个实施例的基于时序知识图谱的复杂问答查询方法的流程图。

如图1所示，该基于时序知识图谱的复杂问答查询方法包括以下步骤：

步骤S1，获取时序问题并将时序问题输入训练好的问答系统模型；其中，问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型。

步骤S2，利用时序知识嵌入模型获取时序问题中的实体嵌入和时间嵌入，并利用嵌入提取模型获取时序问题的潜在嵌入；以及，利用时间变化模型将时间嵌入变换到时序问题的目标时间下。

步骤S3，使用答案评分模型对实体嵌入的实体和目标时间进行评分，并输出得分最高的实体或时间作为时序问题的答案。

下面结合附图对本发明实施例做进一步阐述。

具体地，时序知识图谱定义为G＝{(s,r,o,t)}，给定一个问题集，每个问题的答案是实体或时间。问题可是简单事实的查询，也可以是复杂问题(蕴含时序关系如Time join、Before/After、First/After)，具体的问题类型及示例如表1所示。任务是给定了实体链接后的问题后，使用时序知识图谱G去回答自然语言问题。

表1复杂时序问题类型及示例

进一步地，如图2所示，该框架的思想是先提取问题的潜在时间嵌入，然后基于实体、关系、时间和问题所提供的信息，将潜在时间变换到目标时间下，从而将复杂问题转化为简单问题，然后利用时序知识图谱嵌入去回答查询。该框架主要由4个模块组成：(1)时序知识图谱嵌入模块；(2)嵌入提取模块；(3)时间变换模块；(4)答案评分模块。该4 个模块的功能如下：

时序知识图谱补嵌入模块，负责学习时序知识图谱的所有事实，将实体、关系、时间表示为嵌入向量的形式，然后利用得分函数f(s,r,o,t)评估某四元组(s,r,o,t)的真实性。基于该模块，进行简单查询(如(s,r,？,t)或(s,r,o,？))。

嵌入提取模块，负责解析时序问题，提取问题中潜在的关系(即所查询的事件类型) 和潜在的时间嵌入。

时间变换模块，负责利用与实体、关系、时间、问题相关的神经网络，去推断问题中时间信息的变化，以便将潜在的嵌入变换到问题的目标时间，以将复杂问题转化为简单问题。

答案评分模块，基于实体、关系、时间嵌入，对四元组进行评分，将评分最高的实体或时间作为最终答案。

则该问答系统模型结构图如图3所示。

作为一种示例，TComplEx是一个代表性的时序知识图谱嵌入模型，是静态知识图谱嵌入模型ComplEx在时序知识图谱上的扩展。ComplEx将实体、关系表示为复数向量。TComplEx将时间戳也表示为复数向量，然后它将衡量某四元组(s,r,o,t)真实性的得分函数定义为：

在完成TComplEx的训练后，获得了实体、关系、时间戳的嵌入，以及根据这些嵌入去查询单个事件((s,r,？,t)或(s,r,o,？))的能力。

由于本发明只是利用时序知识图谱嵌入模型去得到每个实体、关系、时间戳的嵌入，以及用于评估四元组的真实性，因此，其他时序知识图谱嵌入模型如TimePlex也可以用于本发明。

潜在嵌入的变换应与实体、关系、时间相关。因此，首先拼接4个潜在嵌入，然后送入一个全连接网络：

此外，变换应与问题的时序关系类型(Before，After，First，Last，Time_join)相关，该信息蕴含在问题的隐层状态表示中。于是，继续与问题的隐层状态表示拼接后送入全连接网络：

然后，将潜在的时序嵌入变换为目标时间嵌入:

其中

代表对应元素相乘。

作为一种示例，使用时序知识图谱嵌入模型去回答查询。一个时序问题的答案可以是实体或时间，使用两个全连接层去分别提取两个关系表示

和

直接使用TComplex 的得分函数，和变换后的嵌入，衡量每个实体entity为问题答案的得分：

用于衡量每个时间t为问题答案的得分函数为

然后，将所有实体的得分与所有时间的得分拼接后，送入softmax函数后得到归一化的概率，最终的损失函数为交叉熵的多分类损失函数。

进一步地，问答系统模型的训练流程如图4所示，具体的步骤如下所述：

(1)获取时序知识图谱并上传至问答系统；

(2)使用TComplEx模型在时序知识图谱上训练，获得每个实体、关系、时间戳的嵌入；

(3)若TComplEx模型训练结果未达到预期指标，则调整超参数，回到步骤(2)；

(4)若TComplEx模型训练结果达到预期指标，则输入用于训练的时序问答集合；

(5)利用图3所示问答系统模型在问答集合上训练；

(6)若模型训练结果未达到预期指标，则调整超参数，回到步骤(5)；

(7)若模型训练结果达到预期指标，则训练流程结束。

进一步地，问答系统模型的使用流程如图5所示：

(1)输入自然语言时序问题；

(2)利用时序知识嵌入模块获取问题中的实体嵌入和时间嵌入，并用嵌入提取模块获取问题的潜在嵌入；

(3)利用时间变化模块对时间嵌入进行变换，将其变换到问题的目标时间下；

(4)使用答案评分模块对候选实体和时间评分；

(5)输出得分最高的实体或时间作为最终答案，流程结束。

根据本发明实施例的基于时序知识图谱的复杂问答查询方法，通过获取时序问题并将时序问题输入训练好的问答系统模型；其中，问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型；利用时序知识嵌入模型获取时序问题中的实体嵌入和时间嵌入，并利用嵌入提取模型获取时序问题的潜在嵌入；以及利用时间变化模型将时间嵌入变换到时序问题的目标时间下；使用答案评分模型对实体嵌入的实体和目标时间进行评分，并输出得分最高的实体或时间作为时序问题的答案。本发明将潜在的嵌入变换到问题的目标时间，能够提升复杂时序问题的处理能力，并简化复杂问题的处理过程。

需要说明的是，基于时序知识图谱的复杂问答查询方法实现方式有多种，但无论具体的实现方法如何，只要方法解决了复杂时序问题的处理能力，都是针对现有技术问题的解决，并具有相应的效果。

为了实现上述实施例，如图6所示，本实施例中还提供了一种基于时序知识图谱的复杂问答查询装置10，该装置10包括：输入模块100、提取模块200和输出模块300。

输入模块100，用于获取时序问题并将时序问题输入训练好的问答系统模型；其中，问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型；

提取模块200，用于利用时序知识嵌入模型获取时序问题中的实体嵌入和时间嵌入，并利用嵌入提取模型获取时序问题的潜在嵌入；以及，利用时间变化模型将时间嵌入变换到时序问题的目标时间下；

输出模块300，用于使用答案评分模型对实体嵌入的实体和目标时间进行评分，并输出得分最高的实体或时间作为时序问题的答案。

进一步地，该装置10还包括，第一训练模块，包括：

第一获取模块，用于获取时序知识图谱并输入问答系统模型；

第一训练子模块，用于使用TComplEx模型在时序知识图谱上训练，获得实体嵌入和时间嵌入；

第二训练子模块，用于若TComplEx模型训练结果未达到第一预设指标，则调整时序知识嵌入模型超的参数，继续第一训练子模块；

第三训练子模块，用于若达到第一预设指标，则获取用于问答系统模型训练的时序问题样本。

进一步地，该装置10还包括，第二训练模块，包括：

第四训练子模块，用于将时序问题样本输入问答系统模型，并利用问答系统模型在所述时序问题样本上进行训练；

第五训练子模块，用于若问答系统模型的训练结果未达到第二预设指标，则调整问答系统模型的超参数，继续第四训练子模块；

第六训练子模块，用于若达到第二预设指标，则结束对问答系统模型的训练。

根据本发明实施例的基于时序知识图谱的复杂问答查询装置，通过获取时序问题并将时序问题输入训练好的问答系统模型；其中，问答系统模型包括：时序知识嵌入模型、嵌入提取模型、时间变化模型和答案评分模型；利用时序知识嵌入模型获取时序问题中的实体嵌入和时间嵌入，并利用嵌入提取模型获取时序问题的潜在嵌入；以及利用时间变化模型将时间嵌入变换到时序问题的目标时间下；使用答案评分模型对实体嵌入的实体和目标时间进行评分，并输出得分最高的实体或时间作为时序问题的答案。本发明将潜在的嵌入变换到问题的目标时间，能够提升复杂时序问题的处理能力，并简化复杂问题的处理过程。

需要说明的是，前述对基于时序知识图谱的复杂问答查询方法实施例的解释说明也适用于该实施例的基于时序知识图谱的复杂问答查询装置，此处不再赘述。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。