CN110162675B

CN110162675B - 应答语句的生成方法、装置、计算机可读介质及电子设备

Info

Publication number: CN110162675B
Application number: CN201811114574.6A
Authority: CN
Inventors: 缪畅宇; 譚翊章
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-09-25
Filing date: 2018-09-25
Publication date: 2023-05-02
Anticipated expiration: 2038-09-25
Also published as: CN110162675A

Abstract

本发明的实施例提供了一种应答语句的生成方法、装置、计算机可读介质及电子设备。该应答语句的生成方法包括：识别用户输入的问题语句对应的用户意图和关键实体；根据所述问题语句及所述问题语句对应的用户意图和关键实体，通过多种生成方式生成针对所述问题语句的多种应答信息；基于所述多种应答信息，生成所述问题语句的应答语句。本发明实施例的技术方案使得能够综合多种应答信息来生成回答准确、语法无误及语义平滑的应答语句，提高了生成的应答语句的质量，有利于提升用户的使用体验。

Description

应答语句的生成方法、装置、计算机可读介质及电子设备

技术领域

本发明涉及计算机及通信技术领域，具体而言，涉及一种应答语句的生成方法、装置、计算机可读介质及电子设备。

背景技术

对话系统广泛应用在车载语音系统、智能音箱、智能客服、儿童陪伴机器人等使用场景中，衡量对话系统好坏的一个关键因素就是其针对问题语句产生的应答语句是否准确、语法是否有误、语义是否平滑。但是，相关技术中提出的对话系统往往难以实现上述效果。

发明内容

本发明的实施例提供了一种应答语句的生成方法、装置、计算机可读介质及电子设备，进而至少在一定程度上可以提高生成的应答语句的质量。

本发明的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本发明的实践而习得。

根据本发明实施例的一个方面，提供了一种应答语句的生成方法，包括：识别用户输入的问题语句对应的用户意图和关键实体；根据所述问题语句和/或所述问题语句对应的用户意图和/或关键实体，通过多种生成方式生成针对所述问题语句的多种应答信息；基于所述多种应答信息，生成所述问题语句的应答语句。

根据本发明实施例的一个方面，提供了一种应答语句的生成装置，包括：识别单元，用于识别用户输入的问题语句对应的用户意图和关键实体；生成单元，用于根据所述问题语句和/或所述问题语句对应的用户意图和/或关键实体，通过多种生成方式生成针对所述问题语句的多种应答信息；处理单元，用于基于所述多种应答信息，生成所述问题语句的应答语句。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：在信息源中检索与所述用户意图和所述关键实体相对应的信息，得到检索结果；基于所述检索结果生成所述问题语句的第一应答信息。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：根据所述问题语句，从所述检索结果中获取与所述问题语句相关的信息，以作为所述第一应答信息。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：获取所述检索结果对应的摘要信息，并将所述检索结果中对应的摘要信息与所述问题语句相匹配的信息作为与所述问题语句相关的信息。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：将所述检索结果作为所述第一应答信息。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：根据所述用户意图，获取与所述用户意图相匹配的应答模板；将所述应答模板作为所述问题语句对应的第二应答信息，或将所述关键实体填充至所述应答模板中，以生成所述问题语句对应的第二应答信息。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：根据所述问题语句在知识库中检索与所述问题语句相关联的信息，并根据检索到的结果生成所述应答语句对应的第三应答信息。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：将所述多种应答信息输入至拷贝生成网络中，以得到所述问题语句的应答语句。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：通过拷贝生成网络确定所述多种应答信息中的各种应答信息在生成所述应答语句时的参考权重；根据所述参考权重和所述多种应答信息生成所述应答语句。

在本发明的一些实施例中，基于前述方案，所述生成单元配置为：根据所述参考权重，从所述多种应答信息中选择用于生成所述应答语句的目标应答信息和/或选择所述多种应答信息中所包含的目标词语；根据所述目标应答信息和/或所述目标词语，生成所述应答语句。

在本发明的一些实施例中，基于前述方案，所述应答语句的生成装置还包括：训练单元，用于根据获取到的问题样本数据、所述问题样本数据对应的多种应答信息数据、所述问题样本数据对应的应答样本数据，生成训练样本；通过所述训练样本对所述拷贝生成网络进行训练。

在本发明的一些实施例中，基于前述方案，所述识别单元配置为：通过意图识别模型识别用户输入的问题语句对应的用户意图，并通过实体标注模型识别用户输入的问题语句对应的关键实体。

根据本发明实施例的一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例中所述的应答语句的生成方法。

根据本发明实施例的一个方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中所述的应答语句的生成方法。

在本发明的一些实施例所提供的技术方案中，通过识别用户输入的问题语句对应的用户意图和关键实体，并根据问题语句和/或问题语句对应的用户意图和/或关键实体，通过多种生成方式生成针对问题语句的多种应答信息，以基于生成的多种应答信息来生成问题语句的应答语句，使得能够综合多种应答信息来生成回答准确、语法无误及语义平滑的应答语句，提高了生成的应答语句的质量，有利于提升用户的使用体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示出了可以应用本发明实施例的应答语句的生成方法或应答语句的生成装置的示例性系统架构的示意图；

图2示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图；

图3示意性示出了根据本发明的一个实施例的应答语句的生成方法的流程图；

图4示意性示出了根据本发明的一个实施例的生成针对问题语句的多种应答信息的流程图；

图5示意性示出了根据本发明的一个实施例的生成针对问题语句的多种应答信息的流程图；

图6示意性示出了根据本发明的一个实施例的生成针对问题语句的多种应答信息的流程图；

图7示意性示出了根据本发明的一个实施例的对话系统的处理流程图；

图8示意性示出了根据本发明的一个实施例的应答语句的生成装置的框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本发明将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本发明的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本发明的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

图1示出了可以应用本发明实施例的应答语句的生成方法或应答语句的生成装置的示例性系统架构100的示意图。

如图1所示，系统架构100可以包括终端设备(如图1中所示智能手机101、平板电脑102和便携式计算机103中的一种或多种，当然也可以是台式计算机等等)、网络104和服务器105。网络104用以在终端设备和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线通信链路、无线通信链路等等。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

终端设备可以通过网络104与服务器105交互，以接收或发送消息等。服务器105可以是提供各种服务的服务器。例如终端设备103(也可以是终端设备101或102)可以向服务器105上传采集到的问题语句，服务器105在获取到该问题语句之后，可以识别该问题语句对应的用户意图和关键实体，然后根据该问题语句和/或该问题语句对应的用户意图和/或关键实体，通过多种生成方式生成针对该问题语句的多种应答信息，进而基于这多种应答信息生成问题语句的应答语句，并返回给终端设备103。由于服务器105能够综合多种应答信息来生成回答准确、语法无误及语义平滑的应答语句，提高了生成的应答语句的质量，有利于提升用户的使用体验。

需要说明的是，本发明实施例所提供的应答语句的生成方法一般由服务器105执行，相应地，应答语句的生成装置一般设置于服务器105中。但是，在本发明的其它实施例中，终端设备也可以与服务器具有相似的功能，从而执行本发明实施例所提供的应答语句的生成方案。

图2示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。

需要说明的是，图2示出的电子设备的计算机系统200仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图2所示，计算机系统200包括中央处理单元(Central Processing Unit，CPU)201，其可以根据存储在只读存储器(Read-Only Memory，ROM)202中的程序或者从存储部分208加载到随机访问存储器(Random Access Memory，RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中，还存储有系统操作所需的各种程序和数据。CPU 201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(Input/Output，I/O)接口205也连接至总线204。

以下部件连接至I/O接口205：包括键盘、鼠标等的输入部分206；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分207；包括硬盘等的存储部分208；以及包括诸如LAN(Local Area Network，局域网)卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器210上，以便于从其上读出的计算机程序根据需要被安装入存储部分208。

特别地，根据本发明的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分209从网络上被下载和安装，和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(CPU)201执行时，执行本申请的系统中限定的各种功能。

需要说明的是，本发明实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现如图3至图7所示的各个步骤。

以下对本发明实施例的技术方案的实现细节进行详细阐述：

图3示意性示出了根据本发明的一个实施例的应答语句的生成方法的流程图，该应答语句的生成方法可以由服务器来执行，该服务器可以是图1中所示的服务器；当然该应答语句的生成方法也可以由终端设备来执行，该终端设备可以是图1中所示的任一终端设备。参照图3所示，该应答语句的生成方法至少包括步骤S310至步骤S330，详细介绍如下：

在步骤S310中，识别用户输入的问题语句对应的用户意图和关键实体。

在本发明的一个实施例中，用户意图用于表示用户的目的，关键实体用于表示与用户意图相关的关键词。比如问题语句“最近的火锅店在哪里”，该问题语句的用户意图即为搜索商家，关键实体即为火锅店。

在本发明的一个实施例中，可以通过意图识别模型识别用户输入的问题语句对应的用户意图，并通过实体标注模型识别用户输入的问题语句对应的关键实体。

在本发明的一个实施例中，意图识别模型可以通过训练样本对机器学习模型(如深度神经网络模型)进行训练得到，比如可以对已有的问题语句对应的用户意图进行标记，以形成训练样本，然后基于该训练样本对机器学习模型进行训练，以得到意图识别模型。

在本发明的一个实施例中，实体标注模型可以通过训练样本对机器学习模型(如深度神经网络模型)进行训练得到，比如可以对已有的问题语句所包含的实体进行标记，以形成训练样本，然后基于该训练样本对机器学习模型进行训练，以得到实体标注模型。

在步骤S320中，根据所述问题语句和/或所述问题语句对应的用户意图和/或关键实体，通过多种生成方式生成针对所述问题语句的多种应答信息。

在本发明的一个实施例中，如图4所示，生成针对问题语句的多种应答信息，包括：

步骤S410，在信息源中检索与所述用户意图和所述关键实体相对应的信息，得到检索结果。

在本发明的一个实施例中，可以利用搜索引擎在信息源中先检索与用户意图相对应的第一信息，然后在第一信息中再次检索与关键实体相对应的信息，以得到检索结果；或者可以利用搜索引擎在信息源中先检索与关键实体相对应的第二信息，然后在第二信息中再次检索与用户意图相对应的信息，以得到检索结果；或者也可以在信息源中直接检索与用户意图和关键实体相对应的信息，以得到检索结果。比如用户意图是询问天气情况，关键实体是北京，那么可以利用搜索引擎在信息源中先检索出全国各地的天气情况，然后再检索出北京的天气情况；或者利用搜索引擎在信息源中先检索出与北京相关的信息，然后再检索出北京的天气情况；或者利用搜索引擎在信息源中直接检索出北京的天气情况。

在本发明的一个实施例中，信息源可以是多个领域的资料数据，也可以是单个领域的资料数据，并且信息源可以包括多个方面的资料数据。比如信息源可以包括百科知识库、医疗文档、技术文档、新闻资讯、公众号文章等。

步骤S420，基于所述检索结果生成所述问题语句的第一应答信息。

在本发明的一个实施例中，在得到检索结果之后，可以直接将该检索结果作为第一应答信息。比如在信息源中检索与用户意图和关键实体相对应的信息时，若信息源中的资料数据和检索到的结果质量均较高，则可以直接将检索结果作为第一应答信息。

在本发明的一个实施例中，在得到检索结果之后，可以从检索结果中获取与问题语句相关的信息作为第一应答信息。即在得到检索结果之后，可以根据问题语句进一步从检索结果中进行筛选来得到第一应答信息。比如，可以获取检索结果对应的摘要信息，并将检索结果中对应的摘要信息与问题语句相匹配的信息作为与问题语句相关的信息。

在本发明的一个实施例中，可以通过摘要模型来提取检索结果中的各个信息的摘要。其中，可以事先通过信息及信息摘要构建训练样本，然后基于训练样本对机器学习模型进行训练，进而得到摘要模型，以通过该摘要模型来提取检索结果中的各个信息的摘要。

在本发明的一个实施例中，如图5所示，生成针对问题语句的多种应答信息，包括：

步骤S510，根据用户意图，获取与所述用户意图相匹配的应答模板。

在本发明的一个实施例中，可以事先针对某些用户意图配置相应的应答模板，当识别出用户意图之后，获取到该用户意图对应的应答模板。比如对于问题语句“你好，你叫什么？”、“你好，你的名字是什么？”等，这些问题语句对应的用户意图是“自我介绍”，因此可以预先设置自我介绍的应答模板，比如“你好，我叫xx”。

在本发明的一个实施例中，可以事先收集用户可能询问的问题语句，然后通过对收集到的问题语句进行分析来确定各个可能的用户意图，比如自我介绍意图、搜索某一信息的意图、导航意图等，然后针对各个意图设置应答模板，并将意图与应答模板进行对应存储，以在后续需要生成应答语句时，若识别出用户的意图，则根据意图与应答模板之间的对应关系直接获取到对应的应答模板。

步骤S520，根据所述应答模板生成所述问题语句对应的第二应答信息。

在本发明的一个实施例，当获取到与用户意图相匹配的应答模板之后，可以将应答模板作为问题语句对应的第二应答信息，或将识别出的关键实体填充至应答模板中来生成问题语句对应的第二应答信息。比如若用户的问题语句为“小微，早上好”，那么可以确定用户意图为“闲聊”，进而匹配到与用户意图“闲聊”相匹配的应答模板为“主人您好，有什么可以帮您的？”，然后可以将该应答模板直接作为第二应答信息。若用户的问题语句为“小微，请打开地图”，那么可以确定用户意图为“打开某一应用程序”，进而匹配到与用户意图“打开某一应用程序”相匹配的应答模板为“主人您好，正在为您打开XX”，然后可以将问题语句中的关键实体“地图”填充至该应答模板中，最后生成的第二应答信息为“主人您好，正在为您打开地图”。

在本发明的一个实施例中，生成针对问题语句的多种应答信息，包括：根据所述问题语句在知识库中检索与所述问题语句相关联的信息，并根据检索到的结果生成所述应答语句对应的第三应答信息。该实施例的技术方案即为从知识库中检索问题语句的相关联信息，比如用户的问题语句为“小微，天空是什么颜色”，那么通过检索知识库可以生成应答语句“天空是蓝色的”。

继续参照图3所示，在步骤S330中，基于所述多种应答信息，生成所述问题语句的应答语句。

在本发明的一个实施例中，可以将生成的多种应答信息输入至拷贝生成网络(即CopyNet)中，由拷贝生成网络根据这多种应答信息来生成问题语句的应答语句。具体地，如图6所示，通过拷贝生成网络来得到问题语句的应答语句的过程，包括：

步骤S610，通过拷贝生成网络确定多种应答信息中的各种应答信息在生成所述应答语句时的参考权重。

在本发明的一个实施例中，各种应答信息在生成应答语句时的参考权重是由拷贝生成网络根据问题语句来确定的。具体地，若拷贝生成网络确定某一应答信息的权重高于第一预定值(比如80％)，那么可以直接将该应答信息作为问题语句对应的应答语句；若拷贝生成网络确定所有应答信息的权重都低于第一预定值，但是其中有两个应答信息的权重高于第二预定值(比如30％)，那么可以根据这两个应答信息来生成问题语句对应的应答语句。比如问题语句是“你叫什么名字”，那么拷贝生成网络会确定出上述第二应答信息(即根据应答模板生成的应答信息)的权重高于第一预定值，那么可以将上述第二应答信息作为问题语句对应的应答语句。

步骤S620，根据所述参考权重和所述多种应答信息生成应答语句。

在本发明的一个实施例中，可以根据所述参考权重，从所述多种应答信息中选择用于生成所述应答语句的目标应答信息和/或选择所述多种应答信息中所包含的目标词语；根据所述目标应答信息和/或所述目标词语，生成所述应答语句。

在本发明的一个实施例中，若某种应答信息的参考权重较大，则可以仅选择该种应答信息来生成应答语句，或者从该应答信息中选择较多的词语，并与从其他应答信息中选择出的词语共同组合来生成应答语句。可选地，比如拷贝生成网络确定其中一个应答信息的权重高于第一预定值(比如80％)，那么可以直接将该应答信息作为问题语句对应的应答语句；若拷贝生成网络确定所有应答信息的权重都低于第一预定值，但是其中有两个或两个以上应答信息的权重高于第二预定值(比如30％)，那么可以根据这两个或两个以上应答信息来生成问题语句对应的应答语句，比如从这两个或两个以上应答信息中分别选择一部分词语来生成最终的应答语句，并且若应答信息的权重越高，那么从中选取的词语数量越多。

在本发明的一个实施例中，对于上述拷贝生成网络，在使用之前可以根据获取到的问题样本数据、问题样本数据对应的多种应答信息数据、问题样本数据对应的应答样本数据，生成训练样本，然后通过生成的训练样本对拷贝生成网络进行训练，以确保拷贝生成网络在生成应答语句时能够确保语句准确、语法无误，且保证语义平滑。

以下结合图7，对本发明的一个实施例的对话系统的实现细节进行详细阐述。

参照图7所示，在本发明的一个实施例中，对话系统的具体处理过程主要包括如下步骤：

步骤S701，将用户输入的问题语句输入至预先训练好的意图辨别模型和实体标注模型中，以识别出问题语句对应的用户意图和包含的关键实体。

在本发明的一个实施例中，意图辨别模型可以通过训练样本对机器学习模型进行训练得到，比如可以对已有的问题语句对应的用户意图进行标记，以形成训练样本，然后基于该训练样本对机器学习模型进行训练，以得到意图辨别模型。

在本发明的一个实施例中，实体标注模型可以通过训练样本对机器学习模型进行训练得到，比如可以对已有的问题语句所包含的实体进行标记，以形成训练样本，然后基于该训练样本对机器学习模型进行训练，以得到实体标注模型。

步骤S702，通过识别出的用户意图和关键实体从信息源中检索与用户意图和关键实体相关联的信息，作为初筛信息。

在本发明的一个实施例中，可以利用搜索引擎在信息源中检索与用户意图和关键实体相关联的信息。比如若用户的问题语句为“北京的天气如何？”，即用户意图是询问天气情况，关键实体是北京，那么可以利用搜索引擎在信息源中检索出北京的天气情况。信息源可以是多个领域的资料数据，也可以是单个领域的资料数据，并且信息源可以包括多个方面的资料数据。比如信息源可以包括百科知识库、医疗文档、技术文档、新闻资讯、公众号文章等。

步骤S703，将初筛信息和用户输入的问题语句输入至摘要模型中，得到精筛信息。

在本发明的一个实施例中，可以事先通过信息及信息摘要构建训练样本，然后基于训练样本对机器学习模型进行训练，进而得到摘要模型，以通过该摘要模型来提取检索结果中的各个信息的摘要，进而与用户输入的问题语句进行匹配来找到精筛信息。

在本发明的一个实施例中，在步骤S702检索得到初筛信息之后，也可以不经过摘要模型，而直接将初筛信息作为下述步骤S706中信息选择和融合的对象。比如在信息源中检索与用户意图和关键实体相对应的信息时，若信息源中的资料数据和检索到的结果质量均较高，则可以不用将初筛信息输入至摘要模型。

步骤S704，通过识别出的用户意图匹配相应的应答模板，并基于应答模板和识别出的关键实体生成固定回复。

在本发明的一个实施例中，可以事先针对某些用户意图配置相应的应答模板，如事先收集用户可能询问的问题语句，然后通过对收集到的问题语句进行分析来确定各个可能的用户意图，比如自我介绍意图、搜索某一信息的意图、导航意图等，然后针对各个意图设置应答模板，并将意图与应答模板进行对应存储。当识别出用户意图之后，获取到该用户意图对应的应答模板来生成应答语句。比如对于问题语句“你好，你叫什么？”、“你好，你的名字是什么？”等，这些问题语句对应的用户意图是“自我介绍”，因此可以根据“自我介绍”意图对应的应答模板，比如“你好，我叫xx”来生成应答语句。

步骤S705，通过知识匹配模型从知识库中匹配与用户输入的应答语句相关联的信息，得到知识性回复。

步骤S706，将精筛信息、固定回复和知识性回复进行融合，并输入至拷贝生成网络中，得到最后的应答语句。

在本发明的一个实施例中，拷贝生成网络具有两个模式的通道：拷贝模式和生成模式，采用拷贝模式可以从语料信息(如上述的精筛信息、固定回复和知识性回复等)中拷贝相关内容以形成应答语句，采用生成模式可以从设定词典中获取相关内容(如连接词等)形成应答语句。

采用上述实施例的技术方案产生的示例性对话如表1所示：

表1

如表1所示，在第一轮对话中，用户输入的问题语句“你好啊，你叫什么名字”命中了“自我介绍”意图，因此具有对话系统的机器(如智能机器人、智能音箱等)只需用应答模板回复即可；在第二轮对话中，用户输入的问题语句是一个常识性问题，因此检索知识库即可回复；在第三轮对话中，用户输入的问题语句带有明显的闲聊色彩，因此可以通过训练后的模型来确定回复内容；在第四轮对话中，用户输入的问题语句命中了“请求”意图，同时又包含常识性问题(爵士乐的定义)以及需要外部实时信息处理的问题(推荐当前流行的爵士乐)，因此应答模板、知识库和外部信息都发挥了作用，进而可以通过拷贝生成网络连接生成一个通顺的回复。

本发明上述实施例的技术方案能够综合多种信息来生成回答准确、语法无误及语义平滑的应答语句，提高了生成的应答语句的质量，有利于提升用户的使用体验。

以下介绍本发明的装置实施例，可以用于执行本发明上述实施例中的应答语句的生成方法。对于本发明装置实施例中未披露的细节，请参照本发明上述的应答语句的生成方法的实施例。

参照图8所示，根据本发明的一个实施例的应答语句的生成装置800，包括：识别单元802、生成单元804和处理单元806。

其中，识别单元802用于识别用户输入的问题语句对应的用户意图和关键实体；生成单元804用于根据所述问题语句和/或所述问题语句对应的用户意图和/或关键实体，通过多种生成方式生成针对所述问题语句的多种应答信息；处理单元806用于基于所述多种应答信息，生成所述问题语句的应答语句。

在本发明的一个实施例中，生成单元804配置为：在信息源中检索与所述用户意图和所述关键实体相对应的信息，得到检索结果；基于所述检索结果生成所述问题语句的第一应答信息。

在本发明的一个实施例中，生成单元804配置为：根据所述问题语句，从所述检索结果中获取与所述问题语句相关的信息，以作为所述第一应答信息。

在本发明的一个实施例中，生成单元804配置为：获取所述检索结果对应的摘要信息，并将所述检索结果中对应的摘要信息与所述问题语句相匹配的信息作为与所述问题语句相关的信息。

在本发明的一个实施例中，生成单元804配置为：将所述检索结果作为所述第一应答信息。

在本发明的一个实施例中，生成单元804配置为：根据所述用户意图，获取与所述用户意图相匹配的应答模板；将所述应答模板作为所述问题语句对应的第二应答信息，或将所述关键实体填充至所述应答模板中，以生成所述问题语句对应的第二应答信息。

在本发明的一个实施例中，生成单元804配置为：根据所述问题语句在知识库中检索与所述问题语句相关联的信息，并根据检索到的结果生成所述应答语句对应的第三应答信息。

在本发明的一个实施例中，生成单元804配置为：将所述多种应答信息输入至拷贝生成网络中，以得到所述问题语句的应答语句。

在本发明的一个实施例中，生成单元804配置为：通过拷贝生成网络确定所述多种应答信息中的各种应答信息在生成所述应答语句时的参考权重；根据所述参考权重和所述多种应答信息生成所述应答语句。

在本发明的一个实施例中，生成单元804配置为：根据所述参考权重，从所述多种应答信息中选择用于生成所述应答语句的目标应答信息和/或选择所述多种应答信息中所包含的目标词语；根据所述目标应答信息和/或所述目标词语，生成所述应答语句。

在本发明的一个实施例中，应答语句的生成装置800还包括：训练单元，用于根据获取到的问题样本数据、所述问题样本数据对应的多种应答信息数据、所述问题样本数据对应的应答样本数据，生成训练样本；通过所述训练样本对所述拷贝生成网络进行训练。

在本发明的一个实施例中，识别单元802配置为：通过意图识别模型识别用户输入的问题语句对应的用户意图，并通过实体标注模型识别用户输入的问题语句对应的关键实体。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种应答语句的生成方法，其特征在于，包括：

识别用户输入的问题语句对应的用户意图和关键实体；

从信息源中检索与所述用户意图和所述关键实体相关联的信息，作为初筛信息；

将所述初筛信息和所述用户输入的问题语句输入至摘要模型中，得到精筛信息；

根据所述用户意图匹配相应的应答模板，并基于所述应答模板和所述关键实体生成固定回复；

从知识库中匹配与所述用户输入的应答语句相关联的信息，得到知识性回复；

将所述精筛信息、所述固定回复和所述知识性回复进行融合，并输入至拷贝生成网络中，生成所述问题语句的应答语句。

2.根据权利要求1所述的应答语句的生成方法，其特征在于，基于所述应答模板和所述关键实体生成固定回复，包括：

将所述关键实体填充至所述应答模板中，以生成所述问题语句对应的固定回复。

3.根据权利要求1所述的应答语句的生成方法，其特征在于，将所述精筛信息、所述固定回复和所述知识性回复进行融合，并输入至拷贝生成网络中，生成所述问题语句的应答语句，包括：

通过拷贝生成网络确定所述精筛信息、所述固定回复以及所述知识性回复在生成所述应答语句时的参考权重；

根据所述参考权重、所述精筛信息、所述固定回复以及所述知识性回复生成所述应答语句。

4.根据权利要求3所述的应答语句的生成方法，其特征在于，根据所述参考权重、所述精筛信息、所述固定回复以及所述知识性回复生成所述应答语句，包括：

根据所述参考权重，从所述精筛信息、所述固定回复以及所述知识性回复中选择用于生成所述应答语句的目标应答信息，和/或选择所述精筛信息、所述固定回复以及所述知识性回复中所包含的目标词语；

根据所述目标应答信息和/或所述目标词语，生成所述应答语句。

5.根据权利要求1所述的应答语句的生成方法，其特征在于，在将所述精筛信息、所述固定回复和所述知识性回复进行融合，并输入至拷贝生成网络之前，还包括：

根据获取到的问题样本数据、所述问题样本数据对应的多种应答信息数据、所述问题样本数据对应的应答样本数据，生成训练样本；

通过所述训练样本对所述拷贝生成网络进行训练。

6.根据权利要求1至5中任一项所述的应答语句的生成方法，其特征在于，识别用户输入的问题语句对应的用户意图和关键实体，包括：

通过意图识别模型识别用户输入的问题语句对应的用户意图，并通过实体标注模型识别用户输入的问题语句对应的关键实体。

7.一种应答语句的生成装置，其特征在于，包括：

识别单元，用于识别用户输入的问题语句对应的用户意图和关键实体；

生成单元，用于从信息源中检索与所述用户意图和所述关键实体相关联的信息，作为初筛信息；将所述初筛信息和所述用户输入的问题语句输入至摘要模型中，得到精筛信息；根据所述用户意图匹配相应的应答模板，并基于所述应答模板和所述关键实体生成固定回复；从知识库中匹配与所述用户输入的应答语句相关联的信息，得到知识性回复；

处理单元，用于将所述精筛信息、所述固定回复和所述知识性回复进行融合，并输入至拷贝生成网络中，生成所述问题语句的应答语句。

8.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的应答语句的生成方法。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至6中任一项所述的应答语句的生成方法。