CN114328943A

CN114328943A - 基于知识图谱的问题回答方法、装置、设备及存储介质

Info

Publication number: CN114328943A
Application number: CN202111316169.4A
Authority: CN
Inventors: 张静; 刘乐茂; 冯煜
Original assignee: Tencent Technology Shenzhen Co Ltd; Renmin University of China
Current assignee: Tencent Technology Shenzhen Co Ltd; Renmin University of China
Priority date: 2021-11-08
Filing date: 2021-11-08
Publication date: 2022-04-12

Abstract

本申请公开了一种基于知识图谱的问题回答方法、装置、设备及存储介质，涉及人工智能技术领域。所述方法包括：获取待回答的目标问题；从知识图谱中获取与目标问题相关的关系子图和属性子图；对属性子图进行数值推理，得到各个实体的数值嵌入推理结果；对关系子图进行基础推理，得到各个实体的实体嵌入推理结果；根据各个实体的数值嵌入推理结果和实体嵌入推理结果，生成目标问题的答案。本申请针对序数约束问题，通过从数值推理和基础推理两个角度，分别得到与问题相关的各个实体的属性数值的序数关系，以及各个实体与目标问题之间的语义相关性，然后融合这两方面信息确定出该问题的答案，能够提升针对序数约束问题的回答准确度。

Description

基于知识图谱的问题回答方法、装置、设备及存储介质

技术领域

本申请实施例涉及人工智能技术领域，特别涉及一种基于知识图谱的问题回答方法、装置、设备及存储介质。

背景技术

知识图谱问答(Knowledge Base Question Answer，简称KBQA)旨在从现有的知识图谱中找到以自然语言表达的给定问题的答案。由于知识图谱中逻辑组织的实体和关系可以显式地促进回答过程，KBQA在过去几年中已成为一个重要的研究课题。

KBQA任务的方法可分为两大类：基于语义解析(semantic parsing，简称SP)的方法和基于信息抽取(information retrieval，简称IR)的方法。基于SP的方法旨在学习语义解析式，将自然语言问题转换为语义解析式的逻辑语言，然后基于此逻辑语言在知识图谱中查询得到答案。基于IR的方法直接基于知识图谱中候选节点与问题之间的相似度，检索候选答案。

针对带有特定限制条件的序数约束问题(如“中国最长的河流是哪一条”)，目前的KBQA方法所确定的答案的准确度较低。

发明内容

本申请实施例提供了一种基于知识图谱的问题回答方法、装置、设备及存储介质，能够提升针对序数约束问题的回答准确度。所述技术方案如下：

根据本申请实施例的一个方面，提供了一种基于知识图谱的问题回答方法，所述方法包括：

获取待回答的目标问题，所述目标问题是与目标主题相关的序数约束问题；

从知识图谱中获取与所述目标问题相关的关系子图和属性子图，所述关系子图中包含与所述目标问题相关的多个实体，所述属性子图中包含各个所述实体的属性数值；

对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果；其中，各个所述实体的数值嵌入推理结果，用于表征各个所述实体的属性数值在所述目标问题下的序数关系；

对所述关系子图进行基础推理，得到各个所述实体的实体嵌入推理结果；其中，各个所述实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个所述实体与所述目标问题之间的相关性；

根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述目标问题的答案。

根据本申请实施例的一个方面，提供了一种问答推理模型的训练方法，所述方法包括：

获取知识图谱和问题答案对，所述问题答案对包括样本问题和所述样本问题对应的标准答案，所述样本问题是与目标主题相关的序数约束问题；

从所述知识图谱中获取与所述样本问题相关的关系子图和属性子图，所述关系子图中包含与所述样本问题相关的多个实体，所述属性子图中包含各个所述实体的属性数值；

通过所述问答推理模型对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果；其中，各个所述实体的数值嵌入推理结果，用于表征各个所述实体的属性数值在所述样本问题下的序数关系；

通过所述问答推理模型对所述关系子图进行基础推理，得到各个所述实体的实体嵌入推理结果；其中，各个所述实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个所述实体与所述样本问题之间的相关性；

通过所述问答推理模型根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述样本问题的预测答案；

根据所述样本问题的预测答案和标准答案构建训练损失，对所述问答推理模型的参数进行调整。

根据本申请实施例的一个方面，提供了一种基于知识图谱的问题回答装置，所述装置包括：

问题获取模块，用于获取待回答的目标问题，所述目标问题是与目标主题相关的序数约束问题；

子图获取模块，用于从知识图谱中获取与所述目标问题相关的关系子图和属性子图，所述关系子图中包含与所述目标问题相关的多个实体，所述属性子图中包含各个所述实体的属性数值；

数值推理模块，用于对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果；其中，各个所述实体的数值嵌入推理结果，用于表征各个所述实体的属性数值在所述目标问题下的序数关系；

基础推理模块，用于对所述关系子图进行基础推理，得到各个所述实体的实体嵌入推理结果；其中，各个所述实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个所述实体与所述目标问题之间的相关性；

答案生成模块，用于根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述目标问题的答案。

根据本申请实施例的一个方面，提供了一种问答推理模型的训练装置，所述装置包括：

数据获取模块，用于获取知识图谱和问题答案对，所述问题答案对包括样本问题和所述样本问题对应的标准答案，所述样本问题是与目标主题相关的序数约束问题；

子图获取模块，用于从所述知识图谱中获取与所述样本问题相关的关系子图和属性子图，所述关系子图中包含与所述样本问题相关的多个实体，所述属性子图中包含各个所述实体的属性数值；

数值推理模块，用于通过所述问答推理模型对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果；其中，各个所述实体的数值嵌入推理结果，用于表征各个所述实体的属性数值在所述样本问题下的序数关系；

基础推理模块，用于通过所述问答推理模型对所述关系子图进行基础推理，得到各个所述实体的实体嵌入推理结果；其中，各个所述实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个所述实体与所述样本问题之间的相关性；

答案生成模块，用于通过所述问答推理模型根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述样本问题的预测答案；

参数调整模块，用于根据所述样本问题的预测答案和标准答案构建训练损失，对所述问答推理模型的参数进行调整。

根据本申请实施例的一个方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述基于知识图谱的问题回答方法，或者实现上述问答推理模型的训练方法。

根据本申请实施例的一个方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述基于知识图谱的问题回答方法，或者实现上述问答推理模型的训练方法。

根据本申请实施例的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述基于知识图谱的问题回答方法，或者执行上述问答推理模型的训练方法。

本申请实施例提供的技术方案至少包括如下有益效果：

针对KBQA任务中的序数约束问题，通过从数值推理和基础推理两个角度，分别得到与问题相关的各个实体的属性数值的序数关系，以及各个实体与目标问题之间的语义相关性，然后融合这两方面信息确定出该问题的答案，相比于相关技术在处理序数约束问题时，侧重于语义解析而往往忽略掉数值信息，本申请能够提升针对序数约束问题的回答准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个实施例提供的方案实施环境的示意图；

图2是本申请一个实施例提供的方案总体框架的示意图；

图3是本申请一个实施例提供的基于知识图谱的问题回答方法的流程图；

图4是本申请另一个实施例提供的基于知识图谱的问题回答方法的流程图；

图5是本申请一个实施例提供的问答推理模型的训练方法的流程图；

图6是本申请一个实施例提供的基于知识图谱的问题回答装置的框图；

图7是本申请一个实施例提供的问答推理模型的训练装置的框图；

图8是本申请一个实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

自然语言处理(Nature Language Processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

本申请实施例提供的技术方案，涉及人工智能的机器学习和自然语言处理等技术，具体通过如下实施例进行介绍说明。

在介绍本申请实施例之前，先对本申请涉及的一些名词进行解释说明。

1.知识图谱(Knowledge Graph)：是显示知识发展进程与结构关系的一系列各种不同的图形，用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

知识图谱中可以包括多个节点以及连接节点的边。知识图谱中的节点包括实体节点、数值节点等不同类型的节点。其中，每一个实体节点代表一个实体，每一个数值节点代表一个数值。

用于展示实体间关系的知识图谱可以称为关系子图。关系子图中包括多个实体节点，连接两个实体节点的边代表了这两个实体节点对应的两个实体之间的关系。例如，实体节点1对应的实体是“中国”，实体节点2对应的实体是“北京”，连接实体节点1和实体节点2的边代表“中国”和“北京”之间的关系是“城市”，即表示“北京”是“中国”的城市。

用于展示实体的属性数值的知识图谱可以称为属性子图。属性子图中包括实体节点和数值节点，连接实体节点和数值节点的边代表了该实体节点对应的实体具有该数值节点所对应的属性数值。例如，实体节点对应的实体是“北京”，数值节点对应的数值是“6490m²”，连接该实体节点和数值节点的边所代表的属性是面积，即表示“北京”的面积是“6490m²”。

上述关系子图和属性子图可以从一个完整的知识图谱

中获得，例如将关系子图记为

将属性子图记为

其中

和

e(e′)、r、a和v分别表示实体、关系、属性和数值。

另外，属性可以分为属性数值和非属性数值，前者和后者的值分别以数字和文本的形式表示。

2.序数约束问题(Ordinal Constrained Question)：此类问题的答案应该从问题中的序数限定词(ordinal determiners)的排序集中选择。示例性地，序数限定词包括但不限于：第一、最后、最晚、最早、最大、最小、最多、最少、最热、最冷、最高、最低、最长、最短等。例如，“中国最长的河流是哪一条”是一个序数约束问题，其中的序数限定词是“最长”。又例如，“哪个是中国最大的城市？”是一个序数约束问题，其中的序数限定词是“最大”。

3.序数约束KBQA(Ordinal Constrained KBQA)：给定一个序数约束问题q和q中存在的主题实体e_q，我们的目标是从知识图谱

中检索与该问题q相关的关系子图

和属性子图

在关系子图

上进行基础推理和在属性子图

上进行数值推理，然后基于融合的实体嵌入，获取该问题q的答案e_t。

请参考图1，其示出了本申请一个实施例提供的方案实施环境的示意图。该方案实施环境可以包括模型训练设备10和模型使用设备20。

模型训练设备10可以是诸如电脑、服务器、智能机器人等电子设备，或者是其他一些具有较强计算能力的电子设备。模型训练设备10用于对问答推理模型30进行训练。在本申请实施例中，问答推理模型30是用于基于知识图谱进行问答推理的神经网络模型，模型训练设备10可以采用机器学习的方式对该问答推理模型30进行训练，以使得其具备较好的性能。

上述训练完成的问答推理模型30可部署在模型使用设备20中使用，以提供目标问题的答案。模型使用设备20可以是诸如手机、电脑、智能电视、多媒体播放设备、可穿戴设备、医疗设备等终端设备，也可以是服务器，本申请对此不作限定。

在一些实施例中，如图1所示，问答推理模型30可以包括：量级关系推理模型31、序数关系推理模型32、基础推理模型33和数值推理模型34。

量级关系推理模型31用于学习数值之间的大小量级关系，比如3＞2，3＞1，2＞1。

序数关系推理模型32用于学习数值之间的序数关系，比如按照从大到小的顺序排序，3＞2＞1。

基础推理模型33用于生成非序数约束问题的答案(或者说各个候选答案的预测概率)，也用于生成各个实体的实体嵌入推理结果。

数值推理模型34用于生成序数约束问题的答案(或者说各个候选答案的预测概率)。

在一些实施例中，如图2所示，其示例性示出了本申请提供的一种方案总体框架的示意图。KBQA的推理过程包括：在获取一个序数约束问题q之后，从知识图谱

中检索与该问题q相关的关系子图

和属性子图

基于关系子图

进行基础推理，以及基于属性子图

进行数值推理。前一个过程推断出实体嵌入推理结果(也即图2所示的“实体嵌入”)，该实体嵌入推理结果可以编码实体和问题之间的语义关系，而与属性数值无关。同时，后一过程通过预先训练的量级关系推理模型(本申请实施例称为“NumGNN”)和序数关系推理模型(本申请实施例称为“NumTransformer”)来推断得到数值嵌入推理结果(也即图2所示的“数值嵌入”)，并将其附加到由基础推理模型导出的实体嵌入推理结果中，以补充实体的相对大小和序数属性。最后，根据各个实体的数值嵌入推理结果和实体嵌入推理结果，生成问题q的答案。

下面，将通过几个方法实施例对本申请技术方案进行介绍说明。

请参考图3，其示出了本申请一个实施例提供的基于知识图谱的问题回答方法的流程图。该方法各步骤的执行主体可以是上文介绍的模型使用设备。该方法可以包括如下几个步骤(310～350)：

步骤310，获取待回答的目标问题，目标问题是与目标主题相关的序数约束问题。

目标问题可以是序数约束问题，也可以不是序数约束问题。例如，可以对目标问题进行分析识别，以确定该目标问题是否为序数约束问题。例如，在识别出目标问题中包含序数限定词的情况下，确定该目标问题是序数约束问题。

示例性地，目标问题是“哪个是中国最大的城市？”，该问题是与中国城市面积这一主题相关的序数约束问题，其中的序数限定词是“最大”。

步骤320，从知识图谱中获取与目标问题相关的关系子图和属性子图，关系子图中包含与目标问题相关的多个实体，属性子图中包含各个实体的属性数值。

可选地，确定目标问题的主题实体，基于该主题实体从知识图谱中获取与目标问题相关的关系子图和属性子图。主题实体是指能够反映目标问题所对应的目标主题的字词。例如，目标问题是“哪个是中国最大的城市？”，其主题实体可以是“中国城市面积”。有了该主题实体之后，便可以从知识图谱中筛选出与该目标问题相关的实体、关系、属性和数值，例如只要查询中国的城市作为实体节点，且属性为面积的数值节点，然后基于该查询结果得到与目标问题相关的关系子图和属性子图。

如图2所示，目标问题是“哪个是中国最大的城市？”，与该目标问题相关的关系子图中包括“深圳”、“北京”和“上海”等多个实体节点，与该目标问题相关的属性子图中包括上述各个城市的属性数值，如“792m²”、“6490m²”和“2448m²”等数值节点。

步骤330，对属性子图进行数值推理，得到各个实体的数值嵌入推理结果；其中，各个实体的数值嵌入推理结果，用于表征各个实体的属性数值在目标问题下的序数关系。

数值推理是指确定出属性子图中包含的各个实体的属性数值之间的量级关系，并基于该量级关系和目标问题中的序数限定词，对上述各个实体的属性数值进行排序，确定出各个实体的属性数值在该序数限定词下的序数关系。

以“792m²”、“6490m²”和“2448m²”这3个属性数值为例，量级关系包括6490m²＞2448m²，6490m²＞792m²，2448m²＞792m²，序数关系即为6490m²＞2448m²＞792m²。

经过数值推理，可以得到各个实体各自的数值嵌入推理结果，每一个实体的数值嵌入推理结果可以用一个向量进行表示。

步骤340，对关系子图进行基础推理，得到各个实体的实体嵌入推理结果；其中，各个实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个实体与目标问题之间的相关性。

基础推理是指从实体和目标问题之间的语义关系的角度进行的推理，与实体的属性数值无关。经过基础推理，可以得到各个实体各自的实体嵌入推理结果，每一个实体的实体嵌入推理结果也可以用一个向量进行表示。

步骤350，根据各个实体的数值嵌入推理结果和实体嵌入推理结果，生成目标问题的答案。

对于每一个实体，可以对该实体的数值嵌入推理结果和实体嵌入推理结果进行融合，得到该实体的融合的实体嵌入，然后基于各个实体的融合的实体嵌入，从该多个实体中找出用来回答该目标问题的目标实体，将该目标实体作为该目标问题的答案。

例如，根据“深圳”、“北京”和“上海”这3个实体的数值嵌入推理结果和实体嵌入推理结果，生成这3个实体各自的融合的实体嵌入，然后基于这3个实体各自的融合的实体嵌入，确定出“北京”作为目标问题“哪个是中国最大的城市？”的答案。

本申请实施例提供的技术方案，针对KBQA任务中的序数约束问题，通过从数值推理和基础推理两个角度，分别得到与问题相关的各个实体的属性数值的序数关系，以及各个实体与目标问题之间的语义相关性，然后融合这两方面信息确定出该问题的答案，相比于相关技术在处理序数约束问题时，侧重于语义解析而往往忽略掉数值信息，本申请能够提升针对序数约束问题的回答准确度。

上述基于知识图谱的问题回答方法可以利用问答推理模型来实现。在本申请实施例中，如图1所示，问答推理模型30包括量级关系推理模型31、序数关系推理模型32、基础推理模型33和数值推理模型34。下面，将通过实施例介绍该问答推理模型针对KBQA任务的处理过程。

请参考图4，其示出了本申请另一个实施例提供的基于知识图谱的问题回答方法的流程图。该方法各步骤的执行主体可以是上文介绍的模型使用设备。该方法可以包括如下几个步骤(410～470)：

步骤410，获取待回答的目标问题，目标问题是与目标主题相关的序数约束问题。

步骤420，从知识图谱中获取与目标问题相关的关系子图和属性子图，关系子图中包含与目标问题相关的多个实体，属性子图中包含各个实体的属性数值。

步骤430，根据属性子图中包含的各个实体的属性数值，初始化各个实体的数值嵌入。

可选地，采用RoBERTa初始化各个实体、数值、关系、属性和问题的嵌入表示，将文本、数值等信息转化为向量表示。RoBERTa是一个基于BERT的预训练模型，用于将文本、数值等信息转化为向量表示。当然，在一些其他实施例中，也可以使用除RoBERTa之外的其他模型对各个实体、数值、关系、属性和问题的嵌入表示进行初始化，本申请对此不作限定。

对于属性子图中包含的各个实体的属性数值，经过RoBERTa初始化之后，能够得到各个实体初始化的数值嵌入。之后，执行下述步骤440和450，对各个实体初始化的数值嵌入进行更新，得到各个实体的数值嵌入推理结果。

步骤440，对于每一个实体，采用量级关系推理模型根据实体的相邻实体的数值嵌入，对实体的数值嵌入进行更新，得到实体的更新后的数值嵌入；其中，各个实体的更新后的数值嵌入，用于表征各个实体的属性数值之间的量级关系。

量级关系推理模型可以是一个基于图神经网络构建的模型。通过将属性子图中各个实体节点用初始化的实体嵌入表示，各个数值节点用初始化的数值嵌入表示，然后将上述属性子图输入至量级关系推理模型，由该量级关系推理模型学习各个实体的属性数值之间的量级关系(也即相对大小关系)，然后输出各个实体的更新后的数值嵌入。

在一些实施例中，量级关系推理模型包括第一MLP(Multilayer Perceptron，多层感知机)和第二MLP。步骤440可以包括如下几个子步骤：

1.对于每一个实体，通过第一MLP对实体的相邻实体的数值嵌入进行处理，得到实体的相邻实体的处理后数值嵌入；

实体的相邻实体是指与该实体具有边直接连接的其他实体。示例性地，假设实体A包括实体B和实体C两个相邻实体，将实体B的数值嵌入和实体C的数值嵌入分别经过第一MLP的处理，得到该实体B的处理后数值嵌入和实体C的处理后数值嵌入。

2.对实体的相邻实体的处理后数值嵌入进行加权融合，得到实体的相邻实体的融合后数值嵌入；

之后，将实体B的处理后数值嵌入和实体C的处理后数值嵌入进行加权融合，得到实体A的相邻实体的融合后数值嵌入。

3.通过第二MLP对实体的数值嵌入进行处理，得到实体的处理后数值嵌入；

将实体A的数值嵌入经过第二MLP的处理，得到该实体A的处理后数值嵌入。需要说明的是，第一MLP和第二MLP可以是同一个MLP，也可以是两个不同的MLP，本申请对此不作限定。

4.根据实体的处理后数值嵌入和实体的相邻实体的融合后数值嵌入，得到实体的更新后的数值嵌入。

将实体A的处理后数值嵌入和该实体A的相邻实体的融合后数值嵌入经过激活函数层，得到实体A的更新后的数值嵌入。激活函数层可以是ReLU(Rectified Linear Unit，线性整流函数)激活函数层，或者采用其他形式的激活函数，本申请对此不作限定。

另外，上述步骤1-4可以执行一轮，也可以循环执行多轮以对各个实体的数值嵌入进行多轮的更新迭代，本申请对此不作限定。

步骤450，采用序数关系推理模型根据目标问题再次更新各个实体的更新后的数值嵌入，得到各个实体的数值嵌入推理结果；其中，各个实体的数值嵌入推理结果，用于表征各个实体的属性数值在目标问题下的序数关系。

序数关系推理模型可以是一个Transformer模型，Transformer模型是用于处理NLP问题的经典模型，其使用了自注意力(Self-Attention)机制，不采用RNN(RecurrentNeural Network，循环神经网络)顺序结构，使得模型可以并行化训练，而且能够拥有全局信息。采用Transformer模型，可以通过注意力机制学习各个实体与目标问题中的序数限定词之间的相关关系，进而得到更加准确的序数关系，也即各个实体的属性数值在目标问题下的排序结果。

在一些实施例中，将目标问题的单词嵌入和各个实体的更新后的数值嵌入拼接后，输入至转换网络，通过转换网络输出各个实体的数值嵌入推理结果。可选地，上述转换网络即为上文介绍的Transformer模型。其中，转换网络用于通过注意力机制学习各个实体与目标问题中的序数限定词之间的相关关系。

在本申请实施例中，将序数关系推理模型所采用的神经网络称为转换网络，转换网络(如Transformer模型)可以包括编码器和解码器。编码器用于对目标问题的单词嵌入和各个实体的更新后的数值嵌入的拼接结果进行编码处理，得到编码结果。可选地，对目标问题进行分词处理，得到至少一个单词，然后初始化得到各个单词的单词嵌入，将各个单词的单词嵌入和各个实体的更新后的数值嵌入进行拼接，得到拼接结果。解码器用于对上述编码结果进行解码处理，得到解码结果。其中，解码结果包括各个单词对应的解码输出嵌入表示以及各个实体对应的解码输出嵌入表示。从解码结果中提取各个实体对应的解码输出嵌入表示，作为各个实体的数值嵌入推理结果。另外，上述编码器和/或解码器中可以引入注意力机制，使得各个实体与目标问题中的序数限定词进行充分的交互，以学习到各个实体与该序数限定词之间的相关关系。

在一些实施例中，也可以仅对序数限定词的单词嵌入和各个实体的更新后的数值嵌入进行拼接(即无需拼接目标问题中除序数限定词之外的其他单词的单词嵌入)，得到拼接结果，然后将该拼接结果输入至转换网络进行处理，这样可以适当减少转换网络的计算量。

步骤460，采用基础推理模型对关系子图进行基础推理，得到各个实体的实体嵌入推理结果；其中，各个实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个实体与目标问题之间的相关性。

可选地，基础推理模型可以采用任何基于IR方法的问答推理模型。基于IR方法的问答推理模型相比于基于SP方法的问答推理模型，具有更高的容错性和拓展性，因此本申请将其作为基础推理模型，并加入数值推理技术为其赋能，从而使其拥有解决序数约束问题的能力。

可选地，通过将关系子图中各个实体节点用初始化的实体嵌入表示，然后将上述关系子图输入至基础推理模型，得到各个实体的实体嵌入推理结果。

步骤470，采用数值推理模型根据各个实体的数值嵌入推理结果和实体嵌入推理结果，生成目标问题的答案。

在一些实施例中，步骤470可以包括如下几个子步骤：

1.根据各个实体的属性嵌入和数值嵌入推理结果，确定各个实体的实体嵌入优化结果；

可选地，对于每一个实体，通过第三MLP对实体的相邻实体的属性嵌入和数值嵌入推理结果进行处理，得到实体的相邻实体的处理后属性嵌入；对实体的相邻实体的处理后属性嵌入进行加权融合，得到实体的实体嵌入优化结果。

2.将各个实体的实体嵌入优化结果和实体嵌入推理结果进行拼接，得到各个实体的综合嵌入；

可选地，对于每一个实体，将该实体的实体嵌入优化结果和实体嵌入推理结果进行拼接(concatenate)之后，输入至第四MLP，通过该第四MLP输出该实体的综合嵌入。

3.根据各个实体的综合嵌入，确定各个实体的预测概率，预测概率用于表征实体与目标问题的答案之间的匹配度；

可选地，将各个实体的综合嵌入输入至一个神经网络，通过该神经网络输出各个实体的预测概率。例如，每一个实体的预测概率越大，则表示该实体与目标问题的答案之间的匹配度越高。可选地，该神经网络可以是MLP，或者也可以是其他类型的神经网络，本申请对此不作限定。

4.选择预测概率符合条件的目标实体，生成目标问题的答案。

可选地，选择预测概率最大的目标实体，作为目标问题的答案。

本申请实施例提供的技术方案，通过构建包含量级关系推理模型、序数关系推理模型、基础推理模型和数值推理模型的问答推理模型，采用量级关系推理模型和序数关系推理模型进行数值推理，采用基础推理模型进行基础推理，然后融合这两方面的推理结果确定出问题的答案，相比于相关技术在处理序数约束问题时，侧重于语义解析而往往忽略掉数值信息，本申请能够提升针对序数约束问题的回答准确度。

另外，对于数值推理，首先通过量级关系推理模型得到各个实体的属性数值之间的量级关系，然后通过序数关系推理模型得到各个实体的属性数值在目标问题下的序数关系，使得数值推理结果能够准确吻合目标问题的序数限定词的要求，提升了数值推理结果的准确性和可靠性。

上文介绍了问答推理模型的训练过程，下面，将通过实施例对问答推理模型的训练过程进行介绍说明。需要说明的是，有关该模型使用过程中涉及的内容和训练过程中涉及的内容是相互对应的，两者互通，如在一侧未作详细说明的地方，可以参考另一侧的描述说明。

请参考图5，其示出了本申请一个实施例提供的问答推理模型的训练方法的流程图。该方法各步骤的执行主体可以是上文介绍的模型训练设备。该方法可以包括如下几个步骤(510～560)：

步骤510，获取知识图谱和问题答案对，问题答案对包括样本问题和样本问题对应的标准答案，样本问题是与目标主题相关的序数约束问题。

步骤520，从知识图谱中获取与样本问题相关的关系子图和属性子图，关系子图中包含与样本问题相关的多个实体，属性子图中包含各个实体的属性数值。

步骤530，通过问答推理模型对属性子图进行数值推理，得到各个实体的数值嵌入推理结果；其中，各个实体的数值嵌入推理结果，用于表征各个实体的属性数值在样本问题下的序数关系。

在一些实施例中，问答推理模型包括量级关系推理模型和序数关系推理模型。量级关系推理模型和序数关系推理模型可以是两个预训练模型。

在一些实施例中，量级关系推理模型的预训练过程如下：

1.构建数字图，数字图中的每一个节点对应一个数字；

可选地，从给定的知识库中，随机构建大量的数字图，在此基础上进行量级关系推理模型的预训练。数字图中包括多个节点，每一个节点对应一个数字。在本申请实施例中，将数字图用

表示。在数字图中，节点由属于从给定的知识库中提取的相同数值属性的值组成，并且边被定向，每个边从较大的数字指向较小的数字。换言之，如果n(v_i)>n(v_j)，则v_i指向v_j，其中n(v)表示与节点/值v相对应的数字。在本申请实施例中，数字图中仅保留从较大的数字指向较小的数字的边，而从较小的数字指向较大的数字的边或者两个相等的数字之间的边不需要保留，这能够在保证最终训练出的量级关系推理模型能够区分数字大小的前提下，让该量级关系推理模型的结构和训练过程变得更加简单。

当然，在一些其他实施例中，也可以在数字图中仅保留从较小的数字指向较大的数字的边，而从较大的数字指向较小的数字的边或者两个相等的数字之间的边不需要保留，这同样能够达到上述效果。

2.通过量级关系推理模型根据数字图中各个数字初始化的数值嵌入，生成各个数字的更新后的数值嵌入；

数字图

中各个数字初始化的数值嵌入为{v⁽⁰⁾}，该初始化的数值嵌入可以采用RoBERTa或其他方式得到，本申请对此不作限定。

当我们打算保持数字之间的相对大小时，数字在推理中所起的作用应该受到周围数字的影响。具体地说，本申请通过以下传播函数将信息从每个数字传播到其邻居：

其中，v_j为v_j的数字嵌入，

为数字图

中节点v_i的邻居节点集合，MLP是多层感知机的缩写，其权重α_j表示为：

其中，σ是Sigmoid函数。

将邻居节点携带的信息与节点本身相加，以更新节点表示：

上述信息传递和节点表示更新的步骤，重复L次，产生保持数字之间的相对大小的数字嵌入{v^(L)}。

上述过程可以概述如下：对于每一个实体，通过第一MLP对实体的相邻实体的数值嵌入进行处理，得到实体的相邻实体的处理后数值嵌入，对实体的相邻实体的处理后数值嵌入进行加权融合，得到实体的相邻实体的融合后数值嵌入(即公式1所示过程)；然后，通过第二MLP对实体的数值嵌入进行处理，得到实体的处理后数值嵌入，根据实体的处理后数值嵌入和实体的相邻实体的融合后数值嵌入，得到实体的更新后的数值嵌入(即公式3所示过程)。

为了在下文中方便地引用，整个量级关系推理模型的推理过程表示为下式：

3.从数字图中抽样获取三元组，三元组包括第一数字、第二数字和第三数字，第一数字大于第二数字，且第二数字大于第三数字；

4.根据三元组中各个数字的更新后的数值嵌入，计算三元组损失，三元组损失用于衡量量级关系推理模型对三元组中各个数字的排序准确度；

5.根据三元组损失调整量级关系推理模型的参数。

对于量级关系推理模型的优化，我们执行一个数字感知的三元组损失。具体地说，我们从数字图

中随机抽样一组三元组，每个三元组由三个数字组成，并假设较小数v_s应当更接近于中间数v_m，而不是更接近于较大数v_b。换句话说，应该满足“v_s＜v_m＜v_b”来反映数字之间的相对距离，而不是绝对大小。

我们最小化下面的三元组损失来学习量级关系推理模型的参数，即：

其中，g是两个数字之间的余弦相似度，

是采样三元组的集合，∈是分隔(v_s,v_m)和(v_s,v_b)的边距。

在量级关系推理模型输出的数字嵌入的基础上，我们需要进一步将数字与序数限定词联系起来，以了解数字的序数性质。例如，我们的目标是使1在“1＜2＜3”中的嵌入比2和3更接近序数限定词“最小”。为了有效地实现这一目标，我们从序数约束的问答对中构造问题感知数字图对，并在此基础上对序数关系推理模型进行预训练。

在一些实施例中，序数关系推理模型的预训练过程如下：

1.构建问题感知数字图对，问题感知数字图对包括查询问题以及与查询问题对应的数字图，数字图中的每一个节点对应一个数字；

查询问题同样是序数约束问题，查询问题可以用q表示，查询问题q对应的数字图可以用

表示，问题感知数字图对即可表示为

2.采用预训练完成的量级关系推理模型，生成数字图中各个数字的更新后的数值嵌入；

对于一个给定的问题感知数字图对

我们通过上述公式4将量级关系推理模型应用到数字图

上，生成数字图

中各个数字的更新后的数值嵌入{v^(L)}。

3.将查询问题的单词嵌入和各个数字的更新后的数值嵌入拼接后，输入至序数关系推理模型，通过序数关系推理模型输出各个数字的数值嵌入推理结果；其中，与查询问题的序数限定词对应的目标数字的更新后的数值嵌入，采用掩膜替代后输入至序数关系推理模型；

然后，将数字图

中各个数字的更新后的数值嵌入{v^(L)}与查询问题q中各个单词的单词嵌入

拼接起来，作为序数关系推理模型(如Transformer模型)的输入，由序数关系推理模型输出各个数字的数值嵌入推理结果：

其中，Transformer代表序数关系推理模型，L′是序数关系推理模型中全连接层的数量。由于多层自注意力机制，更新的数值嵌入{v^(L′)}已经与查询问题的序数限定词完全交互，使得它们可以对序数语义进行编码。

另外，在序数关系推理模型的预训练过程中，可以将与查询问题的序数限定词对应的目标数字的更新后的数值嵌入，采用掩膜(mask)替代后输入至序数关系推理模型，并由序数关系推理模型输出该目标数字的数值嵌入推理结果，结合该目标数字的更新后的数值嵌入和数值嵌入推理结果，采用交叉熵损失来训练序数关系推理模型。

4.根据目标数字的数值嵌入推理结果，计算交叉熵损失，交叉熵损失用于衡量序数关系推理模型在查询问题的序数限定词的指导下，对各个数字的排序准确度；

可选地，交叉熵损失的计算公式如下：

5.根据交叉熵损失调整序数关系推理模型的参数。

在对量级关系推理模型和序数关系推理模型预训练完成之后，可以采用这两个预训练完成的模型，对问答推理模型中的其他部分(如包括基础推理模型和数值推理模型)进行训练。

在一些实施例中，步骤530可以包括如下几个子步骤：

1.根据属性子图中包含的各个实体的属性数值，初始化各个实体的数值嵌入；

对于样本问题q，假设其属性子图为

首先采用RoBERTa或其他方式初始化该属性子图为

中各个实体的数值嵌入。

2.对于每一个实体，通过量级关系推理模型根据实体的相邻实体的数值嵌入，对实体的数值嵌入进行更新，得到实体的更新后的数值嵌入；其中，各个实体的更新后的数值嵌入，用于表征各个实体的属性数值之间的量级关系；

可选地，通过预训练完成的量级关系推理模型，得到属性子图

中各个实体的更新后的数值嵌入{v^(L)}。该步骤2可以包括如下几个子步骤：

2-1.对于每一个实体，通过第一MLP对实体的相邻实体的数值嵌入进行处理，得到实体的相邻实体的处理后数值嵌入；

2-2.对实体的相邻实体的处理后数值嵌入进行加权融合，得到实体的相邻实体的融合后数值嵌入；

2-3.通过第二MLP对实体的数值嵌入进行处理，得到实体的处理后数值嵌入；

2-4.根据实体的处理后数值嵌入和实体的相邻实体的融合后数值嵌入，得到实体的更新后的数值嵌入。

3.通过序数关系推理模型根据样本问题再次更新各个实体的更新后的数值嵌入，得到各个实体的数值嵌入推理结果。

可选地，将样本问题的单词嵌入和各个实体的更新后的数值嵌入拼接后，输入至序数关系推理模型(或称为转换网络，如Transformer模型)，通过转换网络输出各个实体的数值嵌入推理结果。其中，转换网络用于通过注意力机制学习各个实体与样本问题中的序数限定词之间的相关关系。

步骤540，通过问答推理模型对关系子图进行基础推理，得到各个实体的实体嵌入推理结果；其中，各个实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个实体与样本问题之间的相关性。

在本申请实施例中，问答推理模型还包括基础推理模型和数值推理模型。其中，基础推理模型用于根据关系子图进行基础推理，生成各个实体的实体嵌入推理结果。数值推理模型用于根据各个实体的数值嵌入推理结果和实体嵌入推理结果，生成序数约束问题的答案。

可选地，对于样本问题q，假设其关系子图为

通过基础推理模型对关系子图

进行基础推理，得到各个实体的实体嵌入推理结果{e}，即：

其中，BasicReason代表基础推理模型，{e⁽⁰⁾}代表关系子图为

中各个实体初始化的实体嵌入。

另外，基础推理模型对于实体e_t的预测概率可表示为：

其中，e_t表示第t个实体，e_t是该第t个实体的实体嵌入推理结果。

基础推理模型的训练可以综合使用序数约束问题和非序数约束问题，并采用交叉熵损失函数对基础推理模型的参数进行优化。

步骤550，通过问答推理模型根据各个实体的数值嵌入推理结果和实体嵌入推理结果，生成样本问题的预测答案。

在一些实施例中，本步骤包括如下几个子步骤：

1.通过数值推理模型根据各个实体的属性嵌入和数值嵌入推理结果，确定各个实体的实体嵌入优化结果；

4.选择预测概率符合条件的目标实体，生成样本问题的预测答案。

来自属性子图

的各个实体的数值嵌入推理结果{v^(L′)}可以合并到实体嵌入推理结果{e}中，得到各个实体的实体嵌入优化结果。具体地，对于第i个实体来说，根据该第i个实体的邻居实体的属性嵌入和数值嵌入推理结果，计算得到该第i个实体的实体嵌入优化结果

其中，

是第i个实体的邻居实体，a_j和v_j分别是第j个邻居的属性嵌入和数值嵌入推理结果，α_j为权重。

然后，将各个实体的实体嵌入优化结果

和实体嵌入推理结果e_i进行拼接，得到各个实体的综合嵌入

然后，根据各个实体的综合嵌入

确定各个实体的预测概率。其中，第t个实体e_t的预测概率表示为：

其中，

为该第t个实体的综合嵌入。

数值推理模型的训练可以在序数约束问题上进行，并采用交叉熵损失函数对该数值推理模型的参数进行优化。

可选地，对于每个问题q，我们检索其关系子图和属性子图，如果该问题q是序数约束问题，则通过公式13得到每个实体的预测概率，如果该问题q是非序数约束问题，则通过公式9得到每个实体的预测概率。

步骤560，根据样本问题的预测答案和标准答案构建训练损失，对问答推理模型的参数进行调整。

可选地，根据样本问题的预测答案和标准答案构建训练损失，对基础推理模型和数值推理模型的参数进行调整。

另外，量级关系推理模型和序数关系推理模型可以进行预训练得到，使其具备推理数值间量级关系和序数关系的能力。而且，该预训练完成的量级关系推理模型和序数关系推理模型，可以灵活且方便地结合到一些基础推理模型中进行使用。

在一些实施例中，整个问答推理模型的训练过程如下：

输入：知识图谱和问题答案对{(q,e_t)}。

输出：量级关系推理模型的参数θ_NG，序数关系推理模型的参数θ_NT，基础推理模型的参数θ_BR，数值推理模型的参数θ_NR，以及关系和属性的嵌入表示{r,a}。

1.初始化实体、数值、关系、属性和问题的嵌入表示：{e,v,r,a,q}。

2.构建数字图集合

基于该数字图集合

对量级关系推理模型进行预训练，损失函数参考公式5。

3.构建问题感知数字图对集合

基于该问题感知数字图对集合

对序数关系推理模型进行预训练，损失函数参考公式7。

4.从知识图谱中提取样本问题q的关系子图

基于该关系子图

对基础推理模型进行训练，并输出关系子图

中各个实体的实体嵌入推理结果{e}。

5.从知识图谱中提取样本问题q的属性子图

基于属性子图

构建问题属性子图对集合

通过预训练完成的量级关系推理模型和序数关系推理模型更新属性子图

中各个实体的数值嵌入，得到各个实体的数值嵌入推理结果{v^(L′)}，然后将各个实体的数值嵌入推理结果{v^(L′)}合并到实体嵌入推理结果{e}中，最终输出样本问题的预测答案。之后，根据样本问题的预测答案和标准答案构建训练损失，同步训练基础推理模型的参数θ_BR和数值推理模型的参数θ_NR，并输出关系和属性的嵌入表示{r,a}，损失函数参考公式9和13。

我们基于两个基础的KBQA数据集(WebQSP和CWQ)，选取了具有代表性和表现最好的三种基于检索的问答模型：Graftnet[Sun 2018]，EmbedKGQA[Saxena 2020]和NSM[He2021]，在其基础上运用本申请的借助自监督学习范式的数值推理预训练模型,可以有效提升模型的数值推理能力，从而使模型可以回答序数约束问题。具体实验结果如表1。

表1

表1示出了不同基础问答模型(也即上文介绍的基础推理模型)加入预训练数值推理模型(+Num，也即上文介绍的量级关系推理模型和序数关系推理模型)在两个数据集上所有问题上的准确率(All)和序数约束问题上的准确率(Ordinal)。从表1可以看出，在所有比较的基于IR的基础问答模型中，加入本申请所提出的数值推理模型，都可以在整个测试集和序数约束测试集上获得更好的性能。这表明所提出的模型确实能够捕捉实体的数值关系。基础推理模型忽略了实体的数值属性和值，这显然会导致其模型性能低于相应的数值推理增强模型。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参考图6，其示出了本申请一个实施例提供的基于知识图谱的问题回答装置的框图。该装置用于实现上述基于知识图谱的问题回答方法。该装置600可以包括：问题获取模块610、子图获取模块620、数值推理模块630、基础推理模块640和答案生成模块650。

问题获取模块610，用于获取待回答的目标问题，所述目标问题是与目标主题相关的序数约束问题。

子图获取模块620，用于从知识图谱中获取与所述目标问题相关的关系子图和属性子图，所述关系子图中包含与所述目标问题相关的多个实体，所述属性子图中包含各个所述实体的属性数值。

数值推理模块630，用于对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果；其中，各个所述实体的数值嵌入推理结果，用于表征各个所述实体的属性数值在所述目标问题下的序数关系。

基础推理模块640，用于对所述关系子图进行基础推理，得到各个所述实体的实体嵌入推理结果；其中，各个所述实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个所述实体与所述目标问题之间的相关性。

答案生成模块650，用于根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述目标问题的答案。

在一些实施例中，所述数值推理模块630，用于：

根据所述属性子图中包含的各个所述实体的属性数值，初始化各个所述实体的数值嵌入；

对于每一个所述实体，根据所述实体的相邻实体的数值嵌入，对所述实体的数值嵌入进行更新，得到所述实体的更新后的数值嵌入；其中，各个所述实体的更新后的数值嵌入，用于表征各个所述实体的属性数值之间的量级关系；

根据所述目标问题再次更新各个所述实体的更新后的数值嵌入，得到各个所述实体的数值嵌入推理结果。

可选地，所述数值推理模块630，具体用于：

对于每一个所述实体，通过第一MLP对所述实体的相邻实体的数值嵌入进行处理，得到所述实体的相邻实体的处理后数值嵌入；

对所述实体的相邻实体的处理后数值嵌入进行加权融合，得到所述实体的相邻实体的融合后数值嵌入；

通过第二MLP对所述实体的数值嵌入进行处理，得到所述实体的处理后数值嵌入；

根据所述实体的处理后数值嵌入和所述实体的相邻实体的融合后数值嵌入，得到所述实体的更新后的数值嵌入。

可选地，所述数值推理模块630，具体用于：

将所述目标问题的单词嵌入和各个所述实体的更新后的数值嵌入拼接后，输入至转换网络，通过所述转换网络输出各个所述实体的数值嵌入推理结果；

其中，所述转换网络用于通过注意力机制学习各个所述实体与所述目标问题中的序数限定词之间的相关关系。

在一些实施例中，所述答案生成模块650，用于：

根据各个所述实体的属性嵌入和数值嵌入推理结果，确定各个所述实体的实体嵌入优化结果；

将各个所述实体的实体嵌入优化结果和实体嵌入推理结果进行拼接，得到各个所述实体的综合嵌入；

根据各个所述实体的综合嵌入，确定各个所述实体的预测概率，所述预测概率用于表征所述实体与所述目标问题的答案之间的匹配度；

选择所述预测概率符合条件的目标实体，生成所述目标问题的答案。

可选地，所述答案生成模块650，具体用于：

对于每一个所述实体，通过第三MLP对所述实体的相邻实体的属性嵌入和数值嵌入推理结果进行处理，得到所述实体的相邻实体的处理后属性嵌入；

对所述实体的相邻实体的处理后属性嵌入进行加权融合，得到所述实体的实体嵌入优化结果。

请参考图7，其示出了本申请一个实施例提供的问答推理模型的训练装置的框图。该装置用于实现上述问答推理模型的训练方法。该装置700可以包括：数据获取模块710、子图获取模块720、数值推理模块730、基础推理模块740、答案生成模块750和参数调整模块760。

数据获取模块710，用于获取知识图谱和问题答案对，所述问题答案对包括样本问题和所述样本问题对应的标准答案，所述样本问题是与目标主题相关的序数约束问题。

子图获取模块720，用于从所述知识图谱中获取与所述样本问题相关的关系子图和属性子图，所述关系子图中包含与所述样本问题相关的多个实体，所述属性子图中包含各个所述实体的属性数值。

数值推理模块730，用于通过所述问答推理模型对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果；其中，各个所述实体的数值嵌入推理结果，用于表征各个所述实体的属性数值在所述样本问题下的序数关系。

基础推理模块740，用于通过所述问答推理模型对所述关系子图进行基础推理，得到各个所述实体的实体嵌入推理结果；其中，各个所述实体的实体嵌入推理结果，用于表征从语义推理角度确定的各个所述实体与所述样本问题之间的相关性。

答案生成模块750，用于通过所述问答推理模型根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述样本问题的预测答案。

参数调整模块760，用于根据所述样本问题的预测答案和标准答案构建训练损失，对所述问答推理模型的参数进行调整。

在一些实施例中，所述问答推理模型包括量级关系推理模型和序数关系推理模型；

所述数值推理模块730，用于：

对于每一个所述实体，通过所述量级关系推理模型根据所述实体的相邻实体的数值嵌入，对所述实体的数值嵌入进行更新，得到所述实体的更新后的数值嵌入；其中，各个所述实体的更新后的数值嵌入，用于表征各个所述实体的属性数值之间的量级关系；

通过所述序数关系推理模型根据所述样本问题再次更新各个所述实体的更新后的数值嵌入，得到各个所述实体的数值嵌入推理结果。

可选地，所述量级关系推理模型包括第一MLP和第二MLP；

所述数值推理模块730，具体用于：

对于每一个所述实体，通过所述第一MLP对所述实体的相邻实体的数值嵌入进行处理，得到所述实体的相邻实体的处理后数值嵌入；

通过所述第二MLP对所述实体的数值嵌入进行处理，得到所述实体的处理后数值嵌入；

可选地，所述序数关系推理模型包括转换网络；

所述数值推理模块730，具体用于：

将所述样本问题的单词嵌入和各个所述实体的更新后的数值嵌入拼接后，输入至所述转换网络，通过所述转换网络输出各个所述实体的数值嵌入推理结果；

其中，所述转换网络用于通过注意力机制学习各个所述实体与所述样本问题中的序数限定词之间的相关关系。

在一些实施例中，所述量级关系推理模型的预训练过程如下：

构建数字图，所述数字图中的每一个节点对应一个数字；

通过所述量级关系推理模型根据所述数字图中各个数字初始化的数值嵌入，生成各个所述数字的更新后的数值嵌入；

从所述数字图中抽样获取三元组，所述三元组包括第一数字、第二数字和第三数字，所述第一数字大于所述第二数字，且所述第二数字大于所述第三数字；

根据所述三元组中各个数字的更新后的数值嵌入，计算三元组损失，所述三元组损失用于衡量所述量级关系推理模型对所述三元组中各个数字的排序准确度；

根据所述三元组损失调整所述量级关系推理模型的参数。

在一些实施例中，所述序数关系推理模型的预训练过程如下：

构建问题感知数字图对，所述问题感知数字图对包括查询问题以及与所述查询问题对应的数字图，所述数字图中的每一个节点对应一个数字；

采用预训练完成的量级关系推理模型，生成所述数字图中各个所述数字的更新后的数值嵌入；

将所述查询问题的单词嵌入和各个所述数字的更新后的数值嵌入拼接后，输入至所述序数关系推理模型，通过所述序数关系推理模型输出各个所述数字的数值嵌入推理结果；其中，与所述查询问题的序数限定词对应的目标数字的更新后的数值嵌入，采用掩膜替代后输入至所述序数关系推理模型；

根据所述目标数字的数值嵌入推理结果，计算交叉熵损失，所述交叉熵损失用于衡量所述序数关系推理模型在所述查询问题的序数限定词的指导下，对各个数字的排序准确度；

根据所述交叉熵损失调整所述序数关系推理模型的参数。

在一些实施例中，所述答案生成模块750，用于：

通过所述问答推理模型根据各个所述实体的属性嵌入和数值嵌入推理结果，确定各个所述实体的实体嵌入优化结果；

选择所述预测概率符合条件的目标实体，生成所述样本问题的预测答案。

在一些实施例中，所述问答推理模型还包括基础推理模型和数值推理模型；其中，所述基础推理模型用于生成各个所述实体的实体嵌入推理结果；所述数值推理模型用于根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述样本问题的预测答案；

所述参数调整模块760，用于：

根据所述样本问题的预测答案和标准答案构建训练损失，对所述基础推理模型和所述数值推理模型的参数进行调整。

需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

请参考图8，其示出了本申请一个实施例提供的计算机设备的结构示意图。该计算机设备可以是任何具备数据计算、处理和存储功能的电子设备，该计算机设备可以实现成为图1所示方案实施环境中的模型训练设备10和/或模型使用设备20。在该计算机设备实现成为图1所示方案实施环境中的模型训练设备10时，该计算机设备可用于实施上述实施例中提供的信息匹配模型的训练方法。在该计算机设备实现成为图1所示方案实施环境中的模型使用设备20时，该计算机设备可用于实施上述实施例中提供的信息匹配方法。具体来讲：

该计算机设备800包括中央处理单元(如CPU(Central Processing Unit，中央处理器)、GPU(Graphics Processing Unit，图形处理器)和FPGA(Field Programmable GateArray，现场可编程逻辑门阵列)等)801、包括RAM(Random-Access Memory，随机存储器)802和ROM(Read-Only Memory，只读存储器)803的系统存储器804，以及连接系统存储器804和中央处理单元801的系统总线805。该计算机设备800还包括帮助服务器内的各个器件之间传输信息的基本输入/输出系统(Input Output System，I/O系统)806，和用于存储操作系统813、应用程序814和其他程序模块815的大容量存储设备807。

在一些实施例中，该基本输入/输出系统806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中，该显示器808和输入设备809都通过连接到系统总线805的输入输出控制器810连接到中央处理单元801。该基本输入/输出系统806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。

该大容量存储设备807通过连接到系统总线805的大容量存储控制器(未示出)连接到中央处理单元801。该大容量存储设备807及其相关联的计算机可读介质为计算机设备800提供非易失性存储。也就是说，该大容量存储设备807可以包括诸如硬盘或者CD-ROM(Compact Disc Read-Only Memory，只读光盘)驱动器之类的计算机可读介质(未示出)。

不失一般性，该计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM(Erasable Programmable Read-Only Memory，可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory，电可擦写可编程只读存储器)、闪存或其他固态存储技术，CD-ROM、DVD(Digital Video Disc，高密度数字视频光盘)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知该计算机存储介质不局限于上述几种。上述的系统存储器804和大容量存储设备807可以统称为存储器。

根据本申请实施例，该计算机设备800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备800可以通过连接在该系统总线805上的网络接口单元811连接到网络812，或者说，也可以使用网络接口单元811来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括至少一条指令、至少一段程序、代码集或指令集，该至少一条指令、至少一段程序、代码集或指令集存储于存储器中，且经配置以由一个或者一个以上处理器执行，以实现上述信息匹配方法，或信息匹配模型的训练方法。

在示例性实施例中，还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被计算机设备的处理器执行时实现上述信息匹配方法，或信息匹配模型的训练方法。

可选地，该计算机可读存储介质可以包括：ROM(Read-Only Memory，只读存储器)、RAM(Random-Access Memory，随机存储器)、SSD(Solid State Drives，固态硬盘)或光盘等。其中，随机存取记忆体可以包括ReRAM(Resistance Random Access Memory，电阻式随机存取记忆体)和DRAM(Dynamic Random Access Memory，动态随机存取存储器)。

在示例性实施例中，还提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质中读取所述计算机指令，所述处理器执行所述计算机指令，使得所述计算机设备执行上述信息匹配方法，或信息匹配模型的训练方法。

应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外，本文中描述的步骤编号，仅示例性示出了步骤间的一种可能的执行先后顺序，在一些其它实施例中，上述步骤也可以不按照编号顺序来执行，如两个不同编号的步骤同时执行，或者两个不同编号的步骤按照与图示相反的顺序执行，本申请实施例对此不作限定。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于知识图谱的问题回答方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述对于每一个所述实体，根据所述实体的相邻实体的数值嵌入，对所述实体的数值嵌入进行更新，得到所述实体的更新后的数值嵌入，包括：

对于每一个所述实体，通过第一多层感知机MLP对所述实体的相邻实体的数值嵌入进行处理，得到所述实体的相邻实体的处理后数值嵌入；

4.根据权利要求2所述的方法，其特征在于，所述根据所述目标问题再次更新各个所述实体的更新后的数值嵌入，得到各个所述实体的数值嵌入推理结果，包括：

5.根据权利要求2所述的方法，其特征在于，所述方法基于问答推理模型实现，所述问答推理模型包括量级关系推理模型、序数关系推理模型、基础推理模型和数值推理模型；

所述量级关系推理模型用于生成各个所述实体的更新后的数值嵌入；

所述序数关系推理模型用于生成各个所述实体的数值嵌入推理结果；

所述基础推理模型用于生成各个所述实体的实体嵌入推理结果；

所述数值推理模型用于根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述目标问题的答案。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述目标问题的答案，包括：

7.根据权利要求6所述的方法，其特征在于，所述根据各个所述实体的属性嵌入和数值嵌入推理结果，确定各个所述实体的实体嵌入优化结果，包括：

8.一种问答推理模型的训练方法，其特征在于，所述方法包括：

9.根据权利要求8所述的方法，其特征在于，所述问答推理模型包括量级关系推理模型和序数关系推理模型；

所述通过所述问答推理模型对所述属性子图进行数值推理，得到各个所述实体的数值嵌入推理结果，包括：

10.根据权利要求9所述的方法，其特征在于，所述量级关系推理模型包括第一多层感知机MLP和第二MLP；

所述对于每一个所述实体，通过所述量级关系推理模型根据所述实体的相邻实体的数值嵌入，对所述实体的数值嵌入进行更新，得到所述实体的更新后的数值嵌入，包括：

11.根据权利要求9所述的方法，其特征在于，所述序数关系推理模型包括转换网络；

所述通过所述序数关系推理模型根据所述样本问题再次更新各个所述实体的更新后的数值嵌入，得到各个所述实体的数值嵌入推理结果，包括：

12.根据权利要求9所述的方法，其特征在于，所述量级关系推理模型的预训练过程如下：

构建数字图，所述数字图中的每一个节点对应一个数字；

根据所述三元组损失调整所述量级关系推理模型的参数。

13.根据权利要求9所述的方法，其特征在于，所述序数关系推理模型的预训练过程如下：

根据所述交叉熵损失调整所述序数关系推理模型的参数。

14.根据权利要求9所述的方法，其特征在于，所述通过所述问答推理模型根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述样本问题的预测答案，包括：

15.根据权利要求9至14任一项所述的方法，其特征在于，所述问答推理模型还包括基础推理模型和数值推理模型；其中，所述基础推理模型用于生成各个所述实体的实体嵌入推理结果；所述数值推理模型用于根据各个所述实体的数值嵌入推理结果和实体嵌入推理结果，生成所述样本问题的预测答案；

所述根据所述样本问题的预测答案和标准答案构建训练损失，对所述问答推理模型的参数进行调整，包括：

16.一种基于知识图谱的问题回答装置，其特征在于，所述装置包括：

17.一种问答推理模型的训练装置，其特征在于，所述装置包括：

18.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一项所述的基于知识图谱的问题回答方法，或者实现如权利要求8至15任一项所述的问答推理模型的训练方法。

19.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的基于知识图谱的问题回答方法，或者实现如权利要求8至15任一项所述的问答推理模型的训练方法。

20.一种计算机程序产品或计算机程序，其特征在于，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中，处理器从手术室计算机可读存储介质读取并执行所述计算机指令，以实现如权利要求1至7任一项所述的基于知识图谱的问题回答方法，或者实现如权利要求8至15任一项所述的问答推理模型的训练方法。