CN117634617B

CN117634617B - 知识密集型推理问答方法、装置、电子设备和存储介质

Info

Publication number: CN117634617B
Application number: CN202410102332.4A
Authority: CN
Inventors: 李涓子; 姚子俊; 曹书林; 侯磊
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2024-01-25
Filing date: 2024-01-25
Publication date: 2024-05-17
Anticipated expiration: 2044-01-25
Also published as: CN117634617A

Abstract

本发明涉及计算机领域，提供一种知识密集型推理问答方法、装置、电子设备和存储介质，方法包括：确定推理目标问题所需的步骤集合，步骤集合包括对应各步骤的知识操作原语；针对步骤集合中的各步骤，顺序进行原语执行，在此过程中，基于任一步骤对应的知识操作原语的各种执行方式、以及各种执行方式在数据管理器中关联的知识，确定该步骤对应的知识操作原语的目标执行方式，并基于目标执行方式、以及目标执行方式在数据管理器中关联的知识，执行该步骤对应的知识操作原语；基于步骤集合中步骤进行原语执行的结果，确定目标问题对应的答案。本发明提供的方法、装置、电子设备和存储介质，将符号逻辑与神经计算进行结合，确保问答实现的可靠性。

Description

知识密集型推理问答方法、装置、电子设备和存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种知识密集型推理问答方法、装置、电子设备和存储介质。

背景技术

问答任务以自然语言描述为问题输入，要求计算机给出输入的问题的答案。在知识密集型复杂推理场景下，问答任务的执行，需要厘清解决问题的推理过程，结合解决问题所需的相关知识，并将获取到的相关知识应用在推理过程，从而将推理完成所得的结果作为答案输出。由此，知识密集型复杂推理场景下，问答任务具有知识密集性和推理性两个特性。

针对此类任务，常见的实现方案包括基于符号推理的方法和基于神经计算的方法。其中，基于符号推理的方法将各类知识信息建模为知识符号进行问答，受限于知识符号建模完善困难，基于符号推理的方法存在知识不完备的问题，难以满足知识密集型的需求。基于神经计算的方法以神经网络为基础实现，由于神经网络表现为黑盒模型，导致知识问答的可解释性差。

发明内容

本发明提供一种知识密集型推理问答方法、装置、电子设备和存储介质，用以解决现有技术中知识密集型复杂推理场景下的问答知识完备性差、可解释性差的缺陷。

本发明提供一种知识密集型推理问答方法，包括：

确定推理目标问题所需的步骤集合，所述步骤集合包括对应各步骤的知识操作原语，所述知识操作原语为面向知识的基础操作，所述知识操作原语的执行方式包括符号方式、神经计算方式、符号神经组合方式中的至少两种；

针对所述步骤集合中的各步骤，顺序进行原语执行，在任一步骤的原语执行过程中，基于所述任一步骤对应的知识操作原语的各种执行方式、以及所述各种执行方式在数据管理器中关联的知识，从所述各种执行方式中动态确定出所述任一步骤对应的知识操作原语的目标执行方式，并基于所述目标执行方式、以及所述目标执行方式在所述数据管理器中关联的知识，执行所述任一步骤对应的知识操作原语；所述数据管理器包括符号知识和原始格式知识，所述符号知识与所述符号方式和所述符号神经组合方式关联，所述原始格式知识与所述神经计算方式和所述符号神经组合方式关联；

基于所述步骤集合中步骤进行原语执行的结果，确定所述目标问题对应的答案。

根据本发明提供的一种知识密集型推理问答方法，在存在多个步骤集合的情况下，所述针对所述步骤集合中的各步骤，顺序进行原语执行，包括：

并行对所述多个步骤集合中的各步骤，顺序进行原语执行，并且在所述原语执行的过程中，基于所述多个步骤集合的原语执行情况，从所述多个步骤集合中筛选出淘汰步骤集合，停止所述淘汰步骤集合的原语执行，直至所述多个步骤集合中剩余一个步骤集合进行原语执行。

根据本发明提供的一种知识密集型推理问答方法，所述并行对所述多个步骤集合中的各步骤，顺序进行原语执行，包括：

合并所述多个步骤集合中的相同步骤，得到步骤树结构；

在所述步骤树结构中并行对所述多个步骤集合中的各步骤，顺序进行原语执行。

根据本发明提供的一种知识密集型推理问答方法，所述原始格式知识的确定步骤包括：

获取原始知识信息，所述原始知识信息包括自然语言文本、模型参数知识和多模态图片数据中的至少一种；

对所述原始知识信息进行元素抽取，得到所述原始知识信息对应的知识元素，所述知识元素包括实体、概念、关系、属性和限定词中的至少一种；

将所述原始知识信息和所述原始知识信息对应的知识元素作为所述原始格式知识。

根据本发明提供的一种知识密集型推理问答方法，所述符号知识以符号元素的形式表示，所述符号元素包括所述知识元素；

所述执行方式在数据管理器中关联的知识的确定步骤包括：

从所述任一步骤中确定出对应的知识操作原语的操作对象元素；

从所述数据管理器中筛选与所述执行方式关联、且知识元素与所述操作对象元素相匹配的知识，作为所述执行方式在数据管理器中关联的知识。

根据本发明提供的一种知识密集型推理问答方法，所述确定推理目标问题所需的步骤集合，包括：

将所述目标问题输入至推理规划器，得到所述推理规划器输出的推理目标问题所需的步骤集合；

所述推理规划器是有监督微调大规模预训练语言模型得到的。

根据本发明提供的一种知识密集型推理问答方法，还包括以下至少一种：

接收数据管理器更新指令，基于所述数据管理器更新指令，对所述数据管理器进行更新；

接收执行调整指令，基于所述执行调整指令，对所述原语执行过程进行调整；

接收步骤拆分指令，基于所述步骤拆分指令，调整所述推理目标问题所需的步骤集合。

本发明还提供一种知识密集型推理问答装置，包括：

拆分单元，用于确定推理目标问题所需的步骤集合，所述步骤集合包括对应各步骤的知识操作原语，所述知识操作原语为面向知识的基础操作，所述知识操作原语的执行方式包括符号方式、神经计算方式、符号神经组合方式中的至少两种；

执行单元，用于针对所述步骤集合中的各步骤，顺序进行原语执行，在任一步骤的原语执行过程中，基于所述任一步骤对应的知识操作原语的各种执行方式、以及所述各种执行方式在数据管理器中关联的知识，从所述各种执行方式中动态确定出所述任一步骤对应的知识操作原语的目标执行方式，并基于所述目标执行方式、以及所述目标执行方式在所述数据管理器中关联的知识，执行所述任一步骤对应的知识操作原语；所述数据管理器包括符号知识和原始格式知识，所述符号知识与所述符号方式和所述符号神经组合方式关联，所述原始格式知识与所述神经计算方式和所述符号神经组合方式关联；

输出单元，用于基于所述步骤集合中步骤进行原语执行的结果，确定所述目标问题对应的答案。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述知识密集型推理问答方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述知识密集型推理问答方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述知识密集型推理问答方法。

本发明提供的知识密集型推理问答方法、装置、电子设备和存储介质，面向自然语言描述的复杂的目标问题，进行了步骤集合分解，并针对步骤集合中每个步骤配置对应的至少可以通过符号和神经计算两个方式执行的知识操作原语，由此使得针对目标问题的解答过程，不完全依赖存储的符号逻辑，而是将符号逻辑与神经计算进行结合，通过神经计算弥补符号系统在知识上的不完备性，同时通过步骤划分求解的方式以及逻辑计算保证解答所得答案的可解释性，从而确保问答实现的可靠性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的知识密集型推理问答方法的流程示意图之一；

图2是本发明提供的知识密集型推理问答方法的流程示意图之二；

图3是本发明提供的知识密集型推理问答装置的结构示意图；

图4是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

知识密集型复杂推理场景下，问答任务具有知识密集性和推理性两个特性。其中，知识密集型是指此类问答任务旨在获得某个具体的知识性信息，并且依赖于知识才能完成；推理性是指此类问答任务中的问题往往是需要对不同的知识进行综合才能回答，而不是直接访问获取对应的知识即可回答。

目前，面向知识密集型复杂推理场景下的问答任务，常见的实现方案包括基于符号推理的方法和基于神经计算的方法。

其中，基于符号推理的方法通过符号系统实现。符号系统被认为具有执行一般智能行为所必需的充分手段，它继承了数学逻辑的观点，即世界上的知识可以用符号系统来表示，并将智能视为遵循逻辑规则的符号操作和推理过程。知识工程作为符号型人工智能的继承者，其核心问题在于知识的积累、重用和密集型复杂推理。基于符号推理的方法通过符号建模，将知识表示为符号系统，并将自然语言描述的任务转化为符号系统上的逻辑表达，以执行逻辑表达式来完成复杂推理任务。例如，知识图谱中的实体、关系，以及由此所构成的三元组，即一种知识符号类型。

基于符号推理的方法可以提供明确的推理过程，并带来良好的可解释性，但是，基于符号推理的方法也不可避免地受到符号系统的完备性的限制。

这包括两个方面的问题：（1）知识的不完备性。一个知识符号系统难以保证包含世界上全部的知识，一旦存在知识的缺失问题，就会导致推理过程中步骤的缺失，导致推理难以继续。并且，在实际操作中，由于知识本身具有可组合性，知识数量面临着组合爆炸的问题，同时还有许多无法被现有的符号系统表示的知识，例如常识性的知识。因此，知识的不完备性将会长期持续存在。（2）推理逻辑表达式的不完备性。可以理解的是，所有的推理逻辑表达式都是一种形式语言。虽然形式语言是图灵完备的，但自然语言可以表述的复杂推理任务是超越图灵完备的语言可以表述的。因此，对于知识密集型复杂推理场景下的问答任务，推理逻辑表达式可能会出现无法解决的问题。

基于神经计算的方法，随着不断改进的深度学习模型的发展应用，例如卷积神经网络（CNN）、循环神经网络（RNN）和全联接注意力神经网络（Transformers）等以及大型语言模型（LLMs）的发展，在业界得到的充分的认可。尽管神经计算的方法具有更好的通用性（包括知识的广泛程度，以及逻辑表达式的通用性），但神经计算的方法也具有一定的缺陷。

神经计算方法面临着两方面的挑战。（1）神经计算方法的可解释性非常差。由于神经网络表现为一个黑盒优化模型，人们无法解释神经网络模型的行为，从而难以判断其输出是否正确。（2）神经计算的方法存在一个显著的问题，即幻觉性问题。这意味着模型可能会因为没有一个可以绝对保证正确的知识源，在不是真正理解问题的情况下，对问答任务做出似是而非的解答。

针对上述问题，本发明实施例提供一种知识密集型推理问答方法。图1是本发明提供的知识密集型推理问答方法的流程示意图之一，如图1所示，该方法包括：

步骤110，确定推理目标问题所需的步骤集合，所述步骤集合包括对应各步骤的知识操作原语，所述知识操作原语为面向知识的基础操作，所述知识操作原语的执行方式包括符号方式、神经计算方式、符号神经组合方式中的至少两种。

具体地，目标问题即在知识密集型复杂推理场景下的问答任务下，需要进行回答的问题，目标问题可以是用户以文本的形式录入的，也可以是设备在采集到用户语音之后，通过语音转写得到的，本发明实施例对此不作具体限定。

在得到目标问题之后，即可针对目标问题进行推理，由此拆分推理、解答目标问题所需的步骤集合。此处，步骤集合的获取可以通过预先训练推理规划器实现，推理规划器可以利用神经模型的语言理解能力，将复杂的目标问题分解为基本符号单位，由此形成一个有序的步骤列表，即得到步骤集合。并且，基于推理规划期生成的步骤集合，可以是一个步骤集合、也可以是多个步骤集合，一个步骤集合对应一种推理目标问题以寻求答案的方案。

可以理解的是，此处步骤集合中的各步骤可以以序列结构的形式表示步骤之间的执行顺序，也可以是树结构或者有向无环图结构的形式表示步骤之间的执行顺序，本发明实施例对此不作具体限定。

此处，步骤集合中的每个步骤可以通过自然语言或符号操作来表达，例如，对于目标问题“A地区或B地区的最高峰是哪个”，对应的步骤集合可以是“找到A地区，将其与其包含的山脉关联”→“对B地区做同样的事情”→“计算A地区和B地区的山脉的并集”→“从其中挑选最高的一个”。

并且，步骤集合中的每个步骤，均对应至少一个知识操作原语。此处的知识操作原语为预先设定的具有明确定义的操作，具体是面向知识的基础操作。每个知识操作原语，均具有严格定义的行为，且存在针对期望结果的描述。并且，每个知识操作原语，均可以具备多种执行方式，例如可以通过符号方式执行，或者通过神经计算方式执行，还可以通过二者的组合，即符号神经组合方式执行。

进一步地，知识操作原语可以划分为如下三个大类，分别为：1）直接知识访问，根据特定需求从数据结构中检索元素，例如，将提及链接到它们所指的实体，这个过程也被称为实体消歧；2）知识处理，对其他知识操作的输出进行操作，例如，过滤出满足某些要求的知识元素；3）知识更新，提供更新和精炼数据结构中过时信息的能力。

步骤集合中的每个步骤，均可以对应知识操作原语，从而通过知识操作原语的执行方式的实现，实现各个步骤，从而实现针对目标问题的推理解答过程。知识操作原语的设置，可以充当一个接口，用以整合具有相互补充能力的各种实现，以达到相同的目标。这使得步骤120中针对步骤集合中的各个步骤顺序进行原语执行的过程，能够选择到最优的执行方式，从而得到最优的执行结果为目标问题对应的答案。并且，通过原子化面向知识的操作，为推理问题答案过程中的每个步骤赋予了明确的含义，并保留了每个步骤对应的知识操作原语的执行结果，即每个步骤的中间结果。因此，人类用户不仅可以检查最终答案，还可以检查每个单独知识操作原语的输出，这种执行的透明性因此增强了可解释性。

步骤120，针对所述步骤集合中的各步骤，顺序进行原语执行，在任一步骤的原语执行过程中，基于所述任一步骤对应的知识操作原语的各种执行方式、以及所述各种执行方式在数据管理器中关联的知识，从所述各种执行方式中动态确定出所述任一步骤对应的知识操作原语的目标执行方式，并基于所述目标执行方式、以及所述目标执行方式在所述数据管理器中关联的知识，执行所述任一步骤对应的知识操作原语；所述数据管理器包括符号知识和原始格式知识，所述符号知识与所述符号方式和所述符号神经组合方式关联，所述原始格式知识与所述神经计算方式和所述符号神经组合方式关联。

具体地，在得到步骤集合之后，即可按照步骤集合中各步骤的排列顺序，依次执行各步骤所对应的知识操作原语。可以理解的是，针对于相邻的步骤，前一个步骤对应的知识操作原语执行完成之后，才会执行下一个步骤对应的知识操作原语，且在执行下一个步骤的对应的知识操作原语时可能会应用到上一个步骤对应的知识操作原语执行完成所得的结果，本发明实施例对此不作具体限定。

可以理解的是，每个步骤的原语执行过程中，在执行每个步骤所对应知识操作原语的执行方式时，需要应用与该知识操作原语相关联的知识。因此，可以预先设置数据管理器，并在数据管理器中存储用于问题推理的知识。

此处，数据管理器中的知识可以划分为两类，即符号知识和原始格式知识。其中，符号知识即传统类型的知识库中符号化的知识，例如三元组、四元组，又例如知识图谱。原始格式知识即分散在原始格式中、未经过符号化的知识，例如纯文本、模型参数知识、图像和表格。

可以理解的是，不同类型的知识，可以与知识操作原语的不同执行方式相关联，进一步地，符号方式是面向符号知识的知识操作原语执行方式，神经计算方式是面向原始格式知识的知识操作原语执行方法，符号神经组合方式是面向符号知识和原始格式知识两类知识的知识操作原语执行方法。

通过在数据管理器中涵盖符号知识和原始格式知识两类知识，能够通过原始格式知识的应用，弥补符号知识的不完备性，扩大知识覆盖范围。并且通过符号知识的应用来弥补基于原始格式知识进行神经计算在可解释性上的缺失，

以步骤集合中任一步骤的原语执行过程为例，考虑到该步骤所对应的知识操作原语存在多种执行方式，并且不同的执行方式在数据管理器中关联有不同类型的知识。可以结合各种执行方式本身的计算成本、精度等因素，以及各种执行方式在数据管理器中关联的知识的可靠性和完整度等因素，从各种执行方式中选取至少一种优选的执行方式作为目标执行方式，并且基于目标执行方式、以及该目标执行方式所关联的知识，执行该步骤对应的知识操作原语，由此得到该步骤进行原语执行的结果。可以理解的是，此处针对目标执行方式的确定是动态的，即针对不同步骤的知识操作原语可以分别确定目标执行方式，针对不同步骤集合中的相同知识操作原语，也可以分别确定目标执行方式。并且，在存在多个步骤集合的情况下，多个步骤集合可以并行执行知识操作原语，在此过程中动态筛除步骤集合以实现针对目标问题求解过程的剪枝，且在剪枝过程中知识操作原语的目标执行方式的确定也是动态执行的。

例如步骤“找到A地区的最高峰”对应的知识操作原语的执行方式为符号方式时，需要从数据管理器中的知识库中查找A地区的最高峰的相关信息，执行方式为神经计算方式时，需要对原始格式知识进行语义理解。在各种执行方式中，从文本“C峰为A地区和全世界最高的山脉”中获取到知识，是一个准确且可能是最快的方式来回答目标问题，而目标执行方式的选取就是为了获取这样的最优解。

即，在针对任一步骤的原语执行过程中，通过从知识操作原语对应的多种执行方式中选取目标执行方式，并基于目标执行方式执行该步骤对应的知识操作原语，由此保证得到的原语执行的结果为该步骤的原语执行的最优解。

步骤130，基于所述步骤集合中步骤进行原语执行的结果，确定所述目标问题对应的答案。

具体地，在步骤集合中各步骤的原语执行顺次完成之后，即可基于步骤集合中各步骤进行原语执行的结果，确定目标问题对应的答案。例如可以将步骤集合中最后一个步骤进行原语执行的结果，作为目标问题对应的答案；又例如可以将步骤集合中每个步骤进行原语执行的结果，组合作为目标问题对应的答案，本发明实施例对此不作具体限定。

本发明实施例提供的方法，面向自然语言描述的复杂的目标问题，进行了步骤集合分解，并针对步骤集合中每个步骤配置对应的至少可以通过符号和神经计算两个方式执行的知识操作原语，由此使得针对目标问题的解答过程，不完全依赖存储的符号逻辑，而是将符号逻辑与神经计算进行结合，通过神经计算弥补符号系统在知识上的不完备性，同时通过步骤划分求解的方式以及逻辑计算保证解答所得答案的可解释性，从而确保问答实现的可靠性。

并且，在上述方法中，在数据管理器中涵盖了符号知识和原始格式知识，从而确保知识的完备性。

基于上述实施例，步骤110中，推理目标问题所需的步骤集合可以是一个步骤集合，也可以是多个步骤集合。

可以理解的是，目标问题的解决可以是通过不同的思维链推理过程实现的，由此，推理目标问题所需的步骤集合，可以存在多个，不同的步骤集合即对应不同的思维链推理过程。

例如，对于目标问题“A地区或B地区的最高峰是哪个”，解决问题的思路可以是分别找到A地区和B地区的最高峰，然后比较它们的高度，也可以是收集A地区和B地区的所有山脉的高度，然后从中找到最高的一个。由此，目标问题“A地区或B地区的最高峰是哪个”可以存在至少两条步骤集合。

在此基础上，步骤120中，所述针对所述步骤集合中的各步骤，顺序进行原语执行，包括：

具体地，在存在多个步骤集合的情况下，可以并行对多个步骤集合中的各步骤顺序进行原语执行。即，每个步骤集合，均可以基于上述实施例中步骤120的执行方式，对该步骤集合下的各个步骤顺序进行原语执行。

在执行过程中，基于各个步骤集合的原语执行情况均在实时更新中，此处的原语执行情况可以包括原语执行的效率、计算成本、精度、召回率等。与此同时，可以基于各个步骤集合的原语执行情况，分别评价上述各个步骤集合对于目标问题推理的优劣，从而实时淘汰执行情况不佳的步骤集合，即，从各个步骤集合中选取执行情况不佳的步骤集合作为淘汰步骤集合，并停止淘汰步骤集合的原语执行，从而避免此部分执行情况不佳的淘汰步骤集合持续运行给系统带来额外的计算负担。

上述在原语执行过程中实时进行步骤集合淘汰的方案可以持续进行，直至剩余一个步骤集合进行原语执行。可以理解的是，最后剩余的一个步骤集合，即上述所有步骤集合中执行情况最优的步骤集合，也是最容易找到目标问题推理的最优解的步骤集合。

基于上述任一实施例，步骤120中，所述并行对所述多个步骤集合中的各步骤，顺序进行原语执行，包括：

合并所述多个步骤集合中的相同步骤，得到步骤树结构；

具体地，不同的步骤集合中可能存在相同的步骤，为了避免在并行对多个步骤集合中的步骤进行原语执行的过程中，重复执行不同步骤集合中相同的步骤，可以在此之前，先行对相同步骤进行合并，如此一来，多个步骤集合即可以以步骤树结构的实现展现。

此处的步骤树结构中，每个步骤对应树结构中的一个节点，且相同的步骤在树结构中为同一个节点，不同的步骤集合在步骤树结构中体现为树结构中的不同执行路径，不同执行路径可以经过相同的节点。

由此，在得到步骤树结构之后，即可在步骤树结构中并行对多个步骤集合中的各步骤，顺序进行原语执行，由此避免重复执行不同步骤集合中的相同步骤。

基于上述任一实施例，原始格式知识的确定步骤包括：

此处，原始知识信息即原始格式的、可以直接获取得到的知识信息，例如自然语言文本、模型参数知识和多模态图片数据。可以理解的是，原始知识信息可以直接作为原始格式知识，应用于神经计算方式下的知识操作原语的执行。

在此基础上，考虑到由于缺少绝对正确的知识源，神经计算常存在幻觉问题，导致基于神经计算方式得到的答案准确性欠佳。为了解决这一问题，本发明实施例在得到原始知识信息之后，针对原始知识信息进行了元素抽取，从而得到的原始知识信息对应的知识元素。

此处，针对原始知识信息的元素抽取，可以包括实体抽取、概念抽取、关系抽取、属性抽取和限定词抽取中的至少一种。其中，实体（Entities）是现实世界中的唯一对象；概念（Concepts）是具有相似属性的实体集合；关系（Relations）描述实体和概念之间的连接；属性（Attributes）与实体相关联，以从某些方面描述它们；限定词（Qualifiers）是对其他知识项的约束，用以指定它们在哪些条件下为真。

在通过抽取得到上述元素之后，即可以将原始知识信息和原始知识信息对应的知识元素，一并作为原始格式知识。可以理解的是，由此得到的原始格式知识中，知识元素可以为原始知识信息施加约束，从而提高针对数据管理器中的原始知识信息的访问的准确性，从而减少神经计算给出的答案的幻觉现象。

例如，相关技术中，自然语言文本形式的原始知识信息只允许与查询话语进行模糊相似性匹配，而在本发明实施例中，针对携带了知识元素的原始知识信息，则可以在实体检索的同时进行概念约束，从而提高知识访问的准确性。

基于上述任一实施例，所述符号知识以符号元素的形式表示，所述符号元素包括所述知识元素。

由此，数据管理器中的两类知识，即符号知识和原始格式知识，均以对应的知识元素作为表示形式。

即，在数据管理器中，符号知识和原始格式知识均以统一形式的知识元素表示并提供知识信息，以便于知识操作原语能够进行统一的知识操作。

相应地，步骤120中，所述执行方式在数据管理器中关联的知识的确定步骤包括：

具体地，在步骤120中针对各步骤顺序进行原语执行的过程中，针对任一步骤，可以从该步骤中确定出对应知识操作原语的操作对象元素，可以理解的是，此处的操作对象元素，即与数据管理器中的各类知识所携带的知识元素相对应的元素，即，操作对象元素也可以包括实体、概念、关系、属性和限定词中的至少一种。例如在知识操作原语为直接知识访问时，操作对象元素为需要访问的知识所携带的知识元素。

在确定该步骤的知识操作原语以及操作对象元素之后，即可从数据管理器中筛选知识类型与该知识操作原语的执行方式相关联、且所携带的知识元素与该步骤的操作对象元素相匹配的知识，作为该执行方式在数据管理器中关联的知识，由此实现面向知识的操作。

基于上述任一实施例，步骤110包括：

具体地，推理规划器用于将体现知识密集型复杂推理任务的目标问题分解为知识操作原语的组合。作为一个接口，推理规划器理解人类的需求，并将目标问题所体现的需求表示为推理过程，即步骤集合。

由于推理规划器最主要的任务是将模糊的人类意图细化为具有明确定义的知识操作原语的组合，因此在本发明实施例中，应用预训练的大规模预训练语言模型来构建推理规划器，例如可以对大规模预训练语言模型进行有监督微调，以获取推理规划器。由于大规模预训练语言模型本身具备出色的语言理解和生成能力，显示出根据自然语言提示进行规划的潜力，使得基于此生成的推理规划器不仅可以实现目标问题的步骤拆分，还能够具备从自然语言描述中提取更高阶意图的能力，从而实现针对目标问题的隐式推理任务。

作为示例，本发明实施例还提供一种应用于推理规划器以输出推理目标问题所需的步骤集合的方法，具体可以由推理规划器构建层次化问题分解树，来表示复杂的目标问题。此处，层次化问题分解树的根节点即待推理的目标问题，非根节点表示针对其父节点进行分解所得的子问题，层次化问题分解树可以逐层分解问题，直至分解至叶子节点。此处的叶子节点即无法继续进行分解的简单问题，也可以记为原子问题。通过构建层级化问题分解树，可以将复杂的目标问题分解为原子问题，在此基础上，为原子问题匹配对应的知识操作原语，即可得到推理目标问题所需的步骤集合。

基于上述任一实施例，该方法还包括以下至少一种：

具体地，本发明实施例提供的问答方法还包含人在回路求解机制，运行人类通过反馈提高问答方法所应用的各部分对于世界的理解和性能。

其中，数据管理器更新指令用于指示数据管理器的知识更新。通过接收数据管理器更新指令，可以实现知识更新回路。即，人类用户可以基于数据管理器更新指令，对数据管理器中存储的知识进行更新，具体可以检查并修正知识，以及注释新涉及的知识。

执行调整指令用于调整问题推理中原语执行的过程。通过接收执行调整指令，可以实现程序修复回路。在程序修复回路中，人类用户可以找到由推理规划器给出的错误程序，并在原语执行时帮助选择最优的推理路径，例如选择最优的步骤集合或者最优的知识操作原语，亦或者选择最优的执行方式。在此过程中，人们不仅可以帮忙问答系统立即解决当前的复杂推理任务，还可以积累训练数据，用于进一步训练更好的推理规划器和推理执行器。可以理解的是，此处的问题求解器用于执行上述实施例中的步骤120。

步骤拆分指令用于调整步骤集合。通过接收步骤拆分指令，可以实现人工辅助问题解决回路。在人工辅助问题解决回路下，人类用于可以通过步骤拆分指令，以对话的方式即时将复杂的问题推理任务分解为更为简单的推理任务。通过问答系统和人类用户的协调，来解决简单的推理任务，并将简单推理任务的输出组装成最终的答案。

基于上述任一实施例，图2是本发明提供的知识密集型推理问答方法的流程示意图之二，如图2所示，知识密集型推理问答方法的执行步骤如下：

在进行问答之前，需要预先构建推理执行器210、推理规划器220、数据管理器230和知识操作器240。

其中，数据管理器230用于汇总多个来源的知识，此处多个来源的知识包括知识库来源的符号知识，以及分散在原始格式中的原始格式知识。在数据管理器230中，符号知识和原始格式知识均以知识元素作为标记，且知识元素是统一的。

知识操作器240用于在数据管理器230上提供定义明确的知识操作原语，知识操作原语是面向数据管理器230中的知识而言的，知识操作原语可以划分为如下三个大类，分别为：1）直接知识访问，根据特定需求从数据结构中检索元素；2）知识处理，对其他知识操作的输出进行操作；3）知识更新，提供更新和精炼数据结构中过时信息的能力。

推理规划器220用于将体现知识密集型复杂推理任务的目标问题分解为知识操作原语的组合。推理规划器220可以是在大规模预训练语言模型的基础上有监督微调得到的。

推理执行器210用于根据推理规划器220给出的步骤集合进行推理并输出最终的答案。

在确定存在上述推理执行器210、推理规划器220、数据管理器230和知识操作器240，即可执行问题方法：

首先，可以获取目标问题。

其次，将目标问题输入到推理规划器220中，由推理规划器220将目标问题的推理过程分解为知识操作原语的组合，即得到推理目标问题所需的步骤集合。

接着，推理规划器220将拆分得到的步骤集合发送到推理执行器210，推理执行器210可以按照步骤集合中的顺序，调用知识操作器240中定义的知识操作原语，访问数据管理器230进行推理，并在此过程中选出最优的推理过程，以寻求得到最优解，即得到目标问题的答案。

基于上述任一实施例，图3是本发明提供的知识密集型推理问答装置的结构示意图，如图3所示，该装置包括：

拆分单元310，用于确定推理目标问题所需的步骤集合，所述步骤集合包括对应各步骤的知识操作原语，所述知识操作原语为面向知识的基础操作，所述知识操作原语的执行方式包括符号方式、神经计算方式、符号神经组合方式中的至少两种；

执行单元320，用于针对所述步骤集合中的各步骤，顺序进行原语执行，在任一步骤的原语执行过程中，基于所述任一步骤对应的知识操作原语的各种执行方式、以及所述各种执行方式在数据管理器中关联的知识，从所述各种执行方式中动态确定出所述任一步骤对应的知识操作原语的目标执行方式，并基于所述目标执行方式、以及所述目标执行方式在所述数据管理器中关联的知识，执行所述任一步骤对应的知识操作原语；所述数据管理器包括符号知识和原始格式知识，所述符号知识与所述符号方式和所述符号神经组合方式关联，所述原始格式知识与所述神经计算方式和所述符号神经组合方式关联；

输出单元330，用于基于所述步骤集合中步骤进行原语执行的结果，确定所述目标问题对应的答案。

本发明实施例提供的装置，面向自然语言描述的复杂的目标问题，进行了步骤集合分解，并针对步骤集合中每个步骤配置对应的至少可以通过符号和神经计算两个方式执行的知识操作原语，由此使得针对目标问题的解答过程，不完全依赖存储的符号逻辑，而是将符号逻辑与神经计算进行结合，通过神经计算弥补符号系统在知识上的不完备性，同时通过步骤划分求解的方式以及逻辑计算保证解答所得答案的可解释性，从而确保问答实现的可靠性。

基于上述任一实施例，在存在多个步骤集合的情况下，所述执行单元320用于：

基于上述任一实施例，在存在多个步骤集合的情况下，所述执行单元320具体用于：

合并所述多个步骤集合中的相同步骤，得到步骤树结构；

基于上述任一实施例，该装置还包括知识管理单元，用于：

基于上述任一实施例，所述符号知识以符号元素的形式表示，所述符号元素包括所述知识元素；

所述执行方式在数据管理器中关联的知识的确定步骤包括：

基于上述任一实施例，所述拆分单元310用于：

基于上述任一实施例，该装置还包括人在回路单元，用于：

图4示例了一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器（processor）410、通信接口（Communications Interface）420、存储器（memory）430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行知识密集型推理问答方法，该方法包括：

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的知识密集型推理问答方法，该方法包括：

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的知识密集型推理问答方法，该方法包括：

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种知识密集型推理问答方法，其特征在于，包括：

基于所述步骤集合中步骤进行原语执行的结果，确定所述目标问题对应的答案；

所述确定推理目标问题所需的步骤集合，包括：

所述推理规划器是有监督微调大规模预训练语言模型得到的；

所述基于所述任一步骤对应的知识操作原语的各种执行方式、以及所述各种执行方式在数据管理器中关联的知识，从所述各种执行方式中动态确定出所述任一步骤对应的知识操作原语的目标执行方式，包括：

基于所述任一步骤对应的知识操作原语的各种执行方式本身的计算成本、精度因素，以及各种执行方式在数据管理器中关联的知识的可靠性和完整度因素，从各种执行方式中选取所述任一步骤对应的知识操作原语的目标执行方式。

2.根据权利要求1所述的知识密集型推理问答方法，其特征在于，在存在多个步骤集合的情况下，所述针对所述步骤集合中的各步骤，顺序进行原语执行，包括：

3.根据权利要求2所述的知识密集型推理问答方法，其特征在于，所述并行对所述多个步骤集合中的各步骤，顺序进行原语执行，包括：

合并所述多个步骤集合中的相同步骤，得到步骤树结构；

4.根据权利要求1所述的知识密集型推理问答方法，其特征在于，所述原始格式知识的确定步骤包括：

5.根据权利要求4所述的知识密集型推理问答方法，其特征在于，所述符号知识以符号元素的形式表示，所述符号元素包括所述知识元素；

所述执行方式在数据管理器中关联的知识的确定步骤包括：

6.根据权利要求1至5中任一项所述的知识密集型推理问答方法，其特征在于，还包括以下至少一种：

7.一种知识密集型推理问答装置，其特征在于，包括：

输出单元，用于基于所述步骤集合中步骤进行原语执行的结果，确定所述目标问题对应的答案；

所述拆分单元具体用于：

所述执行单元中，所述基于所述任一步骤对应的知识操作原语的各种执行方式、以及所述各种执行方式在数据管理器中关联的知识，从所述各种执行方式中动态确定出所述任一步骤对应的知识操作原语的目标执行方式，包括：

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述知识密集型推理问答方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述知识密集型推理问答方法。