CN109492086B

CN109492086B - 一种答案输出方法、装置、电子设备及存储介质

Info

Publication number: CN109492086B
Application number: CN201811423685.5A
Authority: CN
Inventors: 岳聪; 孔心宇
Original assignee: Volkswagen China Investment Co Ltd; Mobvoi Innovation Technology Co Ltd
Current assignee: Volkswagen China Investment Co Ltd; Mobvoi Innovation Technology Co Ltd
Priority date: 2018-11-26
Filing date: 2018-11-26
Publication date: 2022-01-21
Anticipated expiration: 2038-11-26
Also published as: CN109492086A

Abstract

本发明实施例公开了一种答案输出方法、装置、电子设备及存储介质，所述方法包括：获取与目标问题匹配的设定数量的目标段落；根据所述目标段落的分词长度确定问答模型；将所述问答模型输出的答案作为所述目标问题的答案进行输出。本发明实施例的技术方案能够在兼顾答案输出的准确率和效率的前提下，提高问答系统的灵活性。

Description

一种答案输出方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及自然语言处理技术领域，特别是涉及一种答案输出方法、装置、电子设备及存储介质。

背景技术

随着自然语言处理技术的发展，基于自然语言处理技术建立起来的问答系统也得到了广泛的应用，常用的问答系统例如聊天机器人，能够根据用户输入的聊天内容，自动生成并输出相应的答案。

目前，现有的问答系统在处理问题时通常采用固定的问答模型。如阅读理解模型或DBQA(Document-Based Question Answering，基于文档的问题回答)模型。

发明人在具体实施过程中，发现现有技术中存在下述问题：问答系统采用固定的问答模型往往不能兼顾答案输出的准确率和效率。耗时短的模型往往无法保证准确率，能保证准确率的模型则一般耗时较长。因此，现有的问答系统在处理问题时，只能根据系统对准确率或效率的需求选择相应的模型，导致问答系统的灵活性极差。

发明内容

有鉴于此，本发明实施例提供了一种答案输出方法、装置、电子设备及存储介质，主要目的在于解决问答系统灵活性较差的问题。

为了解决上述问题，本发明实施例主要提供如下技术方案：

第一方面，本发明实施例提供了一种答案输出方法，该方法包括：

获取与目标问题匹配的设定数量的目标段落；

根据所述目标段落的分词长度确定问答模型；

将所述问答模型输出的答案作为所述目标问题的答案进行输出。

第二方面，本发明实施例还提供一种答案输出装置，该装置包括：

目标段落获取模块，用于获取与目标问题匹配的设定数量的目标段落；

第一问答模型确定模块，用于根据所述目标段落的分词长度确定问答模型；

答案输出模块，用于将所述问答模型输出的答案作为所述目标问题的答案进行输出。

第三方面，本发明实施例还提供一种电子设备，包括：

至少一个处理器；

以及与所述处理器连接的至少一个存储器、总线；其中，

所述处理器、存储器通过所述总线完成相互间的通信；

所述处理器用于调用所述存储器中的程序指令，以执行本发明任意实施例所提供的答案输出方法。

第四方面，本发明实施例还提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行本发明任意实施例所提供的答案输出方法。

借由上述技术方案，本发明实施例提供的技术方案至少具有下列优点：

本发明实施例提供的答案输出方法通过获取与目标问题匹配的设定数量的目标段落，确定目标段落的分词长度，并根据目标段落的分词长度确定相应的问答模型，以将确定的问答模型输出的答案作为目标问题的答案进行输出，打破现有问答系统采用统一的问答模型输出答案的限制，解决了现有的问答系统灵活性较差的问题，从而实现在兼顾答案输出的准确率和效率的前提下，提高问答系统的灵活性的技术效果。

上述说明仅是本发明实施例技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明实施例的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明实施例的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例一提供的一种答案输出方法的流程图；

图2是本发明实施例二提供的一种答案输出方法的流程图；

图3是本发明实施例三提供的一种答案输出装置的示意图；

图4为本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

图1是本发明实施例一提供的一种答案输出方法的流程图，本实施例可适用于根据不同的问答模型输出问题答案的情况，该方法可以由答案输出提供装置来执行，该装置可以由软件和/或硬件的方式来实现。相应的，如图1所示，该方法包括如下操作：

S110、获取与目标问题匹配的设定数量的目标段落。

其中，目标问题可以是用户输入的任一类型的问题，例如“天津大学在哪里？”设定数量可以是问答系统根据实际需求设定的数值，如4、6或8等，本发明实施例并不对设定数量的具体数值进行限定。目标段落可以是问答系统根据目标问题反馈的相关段落，问答系统中的问答模型可以根据目标段落获取答案并输出。

在本发明实施例中，当用户对问答系统输入目标问题后，问答系统可以获取与目标问题匹配的设定数量的目标段落。具体的，问答系统可以通过系统中的问答接口来获取目标段落。问答接口反馈的目标段落可以按照目标段落和目标问题的相关度进行排序，如相关度由高到低的顺序。目标段落的数量可以根据实际需求设定，如设置为6等。

S120、根据所述目标段落的分词长度确定问答模型。

其中，分词即为对于某个句子或者段落，将其分解成单个的词语。例如“上海哪里好玩”，可以分解为“上海，哪里，好玩”。分词长度即为分词的数量。例如，“上海哪里好玩”对应的分词长度为3。

需要说明的是，部分能够保证高准确率的问答模型的时间消耗非常依赖于目标段落的长度。因此在本发明实施例中，为了同时保证问答系统的准确性和效率，避免问答系统因快速输出准确率较低或超时输出准确率较高的答案降低用户体验，问答系统获取到目标问题匹配的设定数量的目标段落后，可以获取各目标段落的分词长度，并可以根据各目标段落的分词长度来确定合适的问答模型，以同时保证问答系统的准确率和效率。

由此可见，不同的目标问题会对应不同的目标段落，因此不同目标问题所对应的问答模型也不尽相同。所以本发明实施例中的问答模型可以依据目标段落的分词长度灵活确定，不再限制于统一的问答模型，能够同时保证问答系统答案输出的准确率和效率，其灵活性更高。

S130、将所述问答模型输出的答案作为所述目标问题的答案进行输出。

相应的，在确定问答模型后，即可以将确定的问答模型输出的案作为目标问题的答案。

实施例二

图2是本发明实施例二提供的一种答案输出方法的流程图，本实施例以上述实施例为基础进行具体化，在本实施例中，给出了问答模型的具体类型，以及根据目标段落的分词长度确定问答模型的具体实现方式。相应的，如图2所示，该方法包括如下操作：

S210、获取与目标问题匹配的设定数量的目标段落。

S220、对所述目标段落进行分词；根据分词结果获取所述目标段落的分词长度。

其中，所述分词长度包括设定数量的所述目标段落的分词平均长度或各所述目标段落的最大分词长度。

在本发明实施例中，获取目标段落的分词长度首先需要对目标段落进行分词。其中，分词方法可以采用现有的任何一种分词方法，如基于统计的分词方法等，本发明实施例并不对分词方法的具体类型进行限制。相应的，目标段落分词完成后，即可以根据分词结果获取目标段落的分词长度。其中，分词长度可以是各目标段落的分词平均长度，例如，6个目标段落的分词长度分别为120、180、150、84、90和120，则目标段落的分词长度(即各目标段落的分词平均长度)为124。另外，分词长度还可以是各目标段落的最大分词长度，例如，6个目标段落的分词长度分别为120、180、150、84、90和120，则目标段落的分词长度(即各目标段落的最大分词长度)为180。

S230、判断目标段落的分词长度是否大于等于设定阈值，若是，则执行S240；否则，执行S250。

其中，设定阈值可以是根据问答系统的效率需求和问答模型对分词长度的敏感度设定的数值，如150或200等，本发明实施例并不对设定阈值的具体数值进行限定。

在本发明实施例中，问答系统采用的问答模型可以包括阅读理解模型和/或DBQA模型。其中，阅读理解模型即为机器阅读理解任务，指的是给定一个问题和匹配的一段段落描述，机器通过阅读这一段段落描述之后，给出对应这个问题的答案。可选的，阅读理解模型所输出的问题的答案可以是给定的段落描述原文中找到的一段话(也可以理解为连续的几个单词)。也即，阅读理解模型预测的目标是输出两个下标，分别对应于问题的答案在给定段落描述的开始位置和结束位置。DBQA模型指的是对于给定的问题，有一个相关的段落。然后机器通过对这个段落的每一句话与问题进行匹配，找到匹配度最高的一句话作为问题的答案。阅读理解模型和DBQA模型都是现有的成熟模型，本发明实施例在此不展开详细的描述。

需要说明的是，阅读理解模型由于网络结构更加复杂和庞大，其输出答案的准确率一般会高于DBQA模型。但阅读理解模型消耗的时间通常是DBQA模型几倍，有时会超过200ms。考虑到要兼顾效率和准确率，在问答系统中可以同时使用阅读理解模型和DBQA模型。相应的，设定阈值则可以根据阅读理解模型的分词长度敏感度和问答系统的效率需求进行设定。例如，如果目标段落的分词长度不超过200，则阅读理解模型的答案输出时间为162ms。如果问答系统的答案输出时间需要控制在200ms以内，则可以将设定阈值设置为200。

S240、将DBQA模型作为所述问答模型。

相应的，如果确定目标段落的分词长度大于等于设定阈值，说明此时阅读理解模型输出答案需要耗费较长的时间。为了保证问答系统的效率，可以采用DBQA模型作为问答模型输出答案。

S250、将所述阅读理解模型和所述DBQA模型同时作为所述问答模型。

相应的，如果确定目标段落的分词长度小于设定阈值，说明此时阅读理解模型输出答案可能不需要耗费较长的时间，为了同时保证问答系统的准确率和效率，可以同时采用阅读理解模型和DBQA模型作为问答模型并输出相应的答案。

S260、判断阅读理解模型是否在设定时间范围内输出答案，若是，则执行S270；否则，执行S280。

其中，设定时间范围可以是根据问答系统的效率需求所设定的时间值，如200ms。

在本发明实施例中，当同时采用阅读理解模型和DBQA模型作为问答模型时，依然需要判断阅读理解模型能否在设定时间范围内输出答案。因为虽然目标段落的分词长度不超过设定阈值，但只能保证阅读理解模型的平均时间消耗不超过设定时间范围。因此，在某些情况下阅读理解模型的时间消耗依然可能超过设定时间范围。

S270、将所述阅读理解模型输出的答案作为所述目标问题的答案。

相应的，如果阅读理解模型能够在设定时间范围内输出答案，则直接将阅读理解模型输出的答案作为目标问题的答案。此时，既能保证问答系统的输出答案的准确性，又能保证问答系统输出答案的高效性。

S280、将所述DBQA模型输出的答案作为所述目标问题的答案。

相应的，如果阅读理解模型不能在设定时间范围内输出答案，则直接将DBQA模型输出的答案作为目标问题的答案。此时能够保证问答系统输出答案的高效性。

在本发明的一个可选实施例中，答案输出方法还可以包括：直接将所述阅读理解模型和所述DBQA模型作为所述问答模型；相应的，将所述问答模型输出的答案作为所述目标问题的答案，可以包括：如果所述阅读理解模型在设定时间范围内输出答案，则将所述阅读理解模型输出的答案作为所述目标问题的答案；否则，将所述DBQA模型输出的答案作为所述目标问题的答案。

相应的，在本发明实施例中，可选的，还可以不考虑目标段落的分词长度，在获取到目标问题后，直接同时开启两个线程，即同时采用阅读理解模型和DBQA模型作为问答模型。如果阅读理解模型能够在设定时间范围内输出答案，则直接将阅读理解模型输出的答案作为目标问题的答案；否则，将DBQA模型输出的答案作为目标问题的答案。虽然这种方案也能同时保证问答系统的准确率和效率，但同时也会增加问答系统的负担。

在本发明的一个可选实施例中，将所述问答模型输出的答案作为所述目标问题的答案进行输出，可以包括：采用JSON字符串方式输出所述目标问题的答案；其中，所述目标问题的答案包括答案内容和答案来源；所述答案内容为所述目标问题的答案信息；所述答案来源为所述问答模型的名称。

在本发明实施例中，可以采用JSON(JavaScript Object Notation，JS对象简谱)字符串方式输出目标问题的答案。目标问题的答案中除了可以包括具体的答案信息，还可以同时包括答案的来源。例如，目标问题是“黄河有多长”，则问答系统输出的答案可以是{“answer”：”黄河长度约为5464公里”，”answerSource”：”DBQA”}格式的JSON字符串。

采用上述技术方案，通过控制问答系统的答案输出时间以实现问答系统的高效性，同时根据目标段落的分词长度来采用阅读理解模型和/或DBQA模型进行答案的输出，解决了现有的问答系统灵活性较差的问题，从而实现在兼顾答案输出的准确率和效率的前提下，提高问答系统的灵活性的技术效果。

需要说明的是，以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。

实施例三

图3是本发明实施例三提供的一种答案输出装置的示意图，如图3所示，所述装置包括：目标段落获取模块310、第一问答模型确定模块320以及答案输出模块330，其中：

目标段落获取模块310，用于获取与目标问题匹配的设定数量的目标段落；

第一问答模型确定模块320，用于根据所述目标段落的分词长度确定问答模型；

答案输出模块330，用于将所述问答模型输出的答案作为所述目标问题的答案进行输出。

可选的，所述装置还包括：段落分词模块，用于对所述目标段落进行分词；分词长度获取模块，用于根据分词结果获取所述目标段落的分词长度；其中，所述分词长度包括设定数量的所述目标段落的分词平均长度或各所述目标段落的最大分词长度。

可选的，所述问答模型包括阅读理解模型和/或基于文档的问题回答DBQA模型。

可选的，第一问答模型确定模块320，具体用于如果确定所述目标段落的分词长度大于等于设定阈值，则将所述DBQA模型作为所述问答模型。

可选的，第一问答模型确定模块320，具体用于如果确定所述目标段落的分词长度小于所述设定阈值，则将所述阅读理解模型和所述DBQA模型同时作为所述问答模型；相应的，答案输出模块330，具体用于如果所述阅读理解模型在设定时间范围内输出答案，则将所述阅读理解模型输出的答案作为所述目标问题的答案；否则，将所述DBQA模型输出的答案作为所述目标问题的答案。

可选的，所述装置还包括：第二问答模型确定模块，用于直接将所述阅读理解模型和所述DBQA模型作为所述问答模型；答案输出模块330，具体用于如果所述阅读理解模型在设定时间范围内输出答案，则将所述阅读理解模型输出的答案作为所述目标问题的答案；否则，将所述DBQA模型输出的答案作为所述目标问题的答案。

可选的，答案输出模块330，具体用于采用JSON字符串方式输出所述目标问题的答案；其中，所述目标问题的答案包括答案内容和答案来源；所述答案内容为所述目标问题的答案信息；所述答案来源为所述问答模型的名称。

上述答案输出装置可执行本发明任意实施例所提供的答案输出方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例提供的答案输出方法。

由于本实施例所介绍的答案输出装置为可以执行本发明实施例中的答案输出方法的装置，故而基于本发明实施例中所介绍的答案输出方法，本领域所属技术人员能够了解本实施例的答案输出装置的具体实施方式以及其各种变化形式，所以在此对于该答案输出装置如何实现本发明实施例中的答案输出方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中答案输出方法所采用的装置，都属于本申请所欲保护的范围。

实施例四

图4为本发明实施例四提供的一种电子设备的结构示意图。如图4所示，电子设备包括：至少一个处理器(processor)41；以及与所述处理器41连接的至少一个存储器(memory)42、总线43；其中，

所述处理器41、存储器42通过所述总线43完成相互间的通信；

所述处理器41用于调用所述存储器42中的程序指令，以执行上述方法实施例中的步骤。例如，所述处理器41执行：获取与目标问题匹配的设定数量的目标段落；根据所述目标段落的分词长度确定问答模型；将所述问答模型输出的答案作为所述目标问题的答案进行输出。

实施例五

本发明实施例五提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述各方法实施例所提供的方法：获取与目标问题匹配的设定数量的目标段落；根据所述目标段落的分词长度确定问答模型；将所述问答模型输出的答案作为所述目标问题的答案进行输出。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种答案输出方法，其特征在于，包括：

获取与目标问题匹配的设定数量的目标段落；

根据所述目标段落的分词长度确定问答模型；

2.根据权利要求1所述的方法，其特征在于，在根据所述目标段落的分词长度确定问答模型之前，还包括：

对所述目标段落进行分词；

根据分词结果获取所述目标段落的分词长度；

3.根据权利要求2所述的方法，其特征在于，所述问答模型包括阅读理解模型和/或基于文档的问题回答DBQA模型。

4.根据权利要求3所述的方法，其特征在于，根据所述目标段落的分词长度确定问答模型，包括：

如果确定所述目标段落的分词长度大于等于设定阈值，则将所述DBQA模型作为所述问答模型。

5.根据权利要求4所述的方法，其特征在于，根据所述目标段落的分词长度确定问答模型，包括：

如果确定所述目标段落的分词长度小于所述设定阈值，则将所述阅读理解模型和所述DBQA模型同时作为所述问答模型；

相应的，将所述问答模型输出的答案作为所述目标问题的答案，包括：

如果所述阅读理解模型在设定时间范围内输出答案，则将所述阅读理解模型输出的答案作为所述目标问题的答案；

否则，将所述DBQA模型输出的答案作为所述目标问题的答案。

6.根据权利要求1所述的方法，其特征在于，将所述问答模型输出的答案作为所述目标问题的答案进行输出，包括：

采用JS对象简谱JSON字符串方式输出所述目标问题的答案；

其中，所述目标问题的答案包括答案内容和答案来源；所述答案内容为所述目标问题的答案信息；所述答案来源为所述问答模型的名称。

7.一种答案输出装置，其特征在于，包括：

8.一种电子设备，其特征在于，包括：

至少一个处理器；

以及与所述处理器连接的至少一个存储器、总线；其中，

所述处理器、存储器通过所述总线完成相互间的通信；

所述处理器用于执行所述存储器中的程序指令，以实现权利要求1至权利要求6中任一项所述的答案输出方法。

9.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令被处理器执行时，实现权利要求1至权利要求6中任一项所述的答案输出方法。