CN109800286B

CN109800286B - 对话生成方法和装置

Info

Publication number: CN109800286B
Application number: CN201811541403.1A
Authority: CN
Inventors: 彭金华; 连荣忠; 何径舟; 吴华
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2021-05-11
Anticipated expiration: 2038-12-17
Also published as: CN109800286A

Abstract

本申请实施例提供一种对话生成方法和装置，该方法包括：从终端获取当前提问；对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对；所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句；根据多组问答对和所述当前提问，确定所述当前提问的回复；将所述当前提问的回复发送至所述终端。本申请实施例提供一种对话生成方法和装置提高了生成的回复的精确度。

Description

对话生成方法和装置

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种对话生成方法和装置。

背景技术

对话生成技术是当前以及未来构建通用对话系统的一种主流技术，其本质是建模用户当前的提问(query)与回复(response)的映射关系。

目前的对话生成方法包括两种：检索式和自然语言生成。检索式的方法是通过用户输入的提问语句在语料中进行检索，找到一些相关的回复，效果很受语料的限制，对应语料中没有相关的句子则无法回复用户。今年来基于自然语言生成的方式越来越受到重视，其使用的是端到端(end2end)的框架，最常用的为seq2seq，即将当前提问编码后得到单一向量，然后依据这个向量去控制回复的生成。

上述方法都仅仅建模了提问与回复一对一的映射关系(即一个提问对应一种形式的答复)，从而到导致生成的回复不够精确，比如生成的回复不够人性化，生成一些与提问没有关联的通用回复等。

发明内容

本申请实施例提供一种对话生成方法和装置，使得生成的提问的回复比较精确。

第一方面，本申请实施例提供一种对话生成方法，包括：

从终端获取当前提问；

对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对；所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句；

根据多组问答对和所述当前提问，确定所述当前提问的回复；

将所述当前提问的回复发送至所述终端。

在一种可能的设计中，所述根据多组问答对和所述当前提问，确定当前提问的回复，包括：

根据多组问答对和所述当前提问，从多组问答对中对应的多个内容片段组中，确定与当前提问最相关的目标内容片段组；其中，每组问答对对应的至少一个内容片段组成一个内容片段组；

根据所述目标内容片段组和所述当前提问，确定所述当前提问的回复。

在一种可能的设计中，对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对，包括：

对于语料库对应的每个第一问答语句组，获取第一问答语句组中的回复语句的至少一个第一内容片段，并根据所述第一问答语句组中的第一提问语句和至少一个第一内容片段，得到一组第一问答对；

对于每个第二问答语句组，获取第二问答语句组中的回复语句的至少一个第二内容片段，并根据所述第二问答语句组中的第二提问语句和至少一个第二内容片段，得到一组第二问答对；

其中，第二问答语句组为所述终端对应的最近一次对话中的问答语句组。

在一种可能的设计中，所述根据多组问答对和所述当前提问，从多组问答对对应的多个内容片段组中，确定与当前提问最相关的目标内容片段组，包括：

根据多组第一问答对和所述当前提问，从多组第一问答对对应的多个第一内容片段组中确定与所述当前提问最相关的第一目标内容片段组；

根据至少一组第二问答对和所述当前提问，从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组；

根据所述当前提问、第一目标内容片段组和第二目标内容片段组，从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中，确定至少一个目标内容片段；其中，所述至少一个目标内容片段组成所述目标内容片段组。

在一种可能的设计中，所述根据所述目标内容片段组和所述当前提问，确定所述当前提问的回复，包括：

根据所述目标内容片段组和所述当前提问，得到所述当前提问的回复中的第k个词，k为正整数；

根据所述目标内容片段组、所述当前提问和所述第k个词，得到所述当前提问的回复中的第k+1个词。

第二方面，本申请实施例提供一种对话生成装置，包括：

接收模块，用于从终端获取当前提问；

获取模块，用于对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对；所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句；

确定模块，用于根据多组问答对和所述当前提问，确定所述当前提问的回复；

发送模块，用于将所述当前提问的回复发送至所述终端。

在一种可能的设计中，所述确定模块，具体用于：

根据多组问答对和所述当前提问，从多组问答对中对应的多个内容片段组中，确定与当前提问最相关的目标内容片段组；其中，每组问答对对应的至少一个内容片段组成一个内容片段组。

在一种可能的设计中，所述获取模块，具体用于：

在一种可能的设计中，所述确定模块，具体用于：

第三方面，本申请实施例提供一种可读存储介质，包括程序或指令，当所述程序或指令在计算机上运行时，第一方面任一所述的方法被执行。

第四方面，本申请实施例提供一种服务器，包括：处理器，所述处理器与存储器耦合；

所述存储器用于，存储计算机程序；

所述处理器用于，调用所述存储器中存储的计算机程序，以实现第一方面任一所述的方法。

本申请中通过对多个问答语句中回复语句的内容片段的提取，使得可得到与当前提问最相关的至少一个内容片断，而与当前提问最相关的至少一个内容片断对应的回复语句的形式是多样的，因此可根据当前提问和至少一个内容片断得到符合当前提问的形式的回复语句，提高了生成的回复的精确度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的应用场景示意图；

图2为本申请实施例提供的对话生成方法的流程图；

图3为本申请实施例提供的合并算法原理示意图；

图4为本申请实施例提供的确定当前提问的回复的算法原理图；

图5为本申请实施提供的对话生成装置的结构示意图；

图6为本申请实施提供的服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a,b,或c中的至少一项(个)，可以表示：a,b,c,a-b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。本申请中术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

图1为本申请实施例提供的应用场景示意图。参见图1，用户通过终端11的用户界面111输入当前提问“请问如何挂失”，终端将当前提问发送至服务器12，服务器12根据存储的每个问答语句组得到多组问答对，并根据多组问答对和当前提问，确定当前提问的回复“请拨打挂失电话123456”，并将当前提问的回复发送至终端11，并在终端11的用户界面111显示。

下面，通过具体实施例对本申请所示的技术方案进行详细说明。需要说明的是，下面几个具体实施例可以相互结合，对于相同或相似的内容，在不同的实施例中不再进行重复说明。

图2为本申请实施例提供的对话生成方法的流程图，本实施例的执行主体可为对话生成装置，该对话生成装置可位于服务器中。参见图2，本实施例的方法包括：

步骤S101、从终端获取当前提问。

具体地，用户通过终端的用户界面输入当前提问“XXXXXX”。用户界面可为终端根据用户输入的智能问答指令向用户显示的，比如用户通过点击应用中的用于智能问答的图标输入智能问答指令。

终端接收到当前提问后，将当前提问发送至对话生成装置。

步骤S102、对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句中的至少一个内容片段，并根据问答语句组中的提问语句和至少一个内容片段，得到一组问答对；问答语句组包括一个提问语句和该提问语句对应的至少一个回复语句。

具体地，在对话生成装置中语料库可存储有语料库，或者从数据存储服务器中获取语料库。对话生成装置根据语料库，得到多个问答语句组。每个问答语句组包括一个提问语句和该提问语句对应的至少一个回复语句。

对话生成装置接收到当前提问后，对话生成装置根据每个问答语句组，获取问答语句组中的回复语句中的至少一个内容片段，并根据问答语句组中的提问语句和至少一个内容片段，得到一组问答对。则多个问答语句组对应得到多组问答对。

其中，可通过自然语言处理技术(natural language processing，NLP)，获取语句的内容片段。比如语句“十分明显，不大大提高整个中华民族的科学文化水平，四个现代化就是一句空话”中的至少一个内容片段包括如下中的至少一项：“十分明显”、“提高整个中华民族的科学文化水平”，“不提高整个中华民族的科学文化水平”、“四个现代化”、“一句空话”。

为了使得得到回复的概率更大以及得到的回复的精确度更高，多个问答语句组除了包括语料库中的多个第一问答语句组，还包括该终端对应的最近一次对话中的至少一个第二问答语句组。则对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句中的至少一个内容片段，并根据问答语句组中的提问语句和至少一个内容片段，得到一组问答对，包括：

a1、对于语料库对应的每个第一问答语句组，获取第一问答语句组中回复语句的至少一个第一内容片段，并根据第一问答语句组中的第一提问语句和至少一个第一内容片段，得到一组第一问答对。

具体地，对于多个第一问答语句组，得到多组第一问答对。

a2、对于每个第二问答语句组，获取第二问答语句组中回复语句中的至少一个第二内容片段，并根据第二问答语句组中的第二提问语句和至少一个第二内容片段，得到一组第二问答对。

具体地，对于至少一个第二问答语句组，得到至少一组第二问答对。

进一步地，上述该终端对应的最近一次对话为该终端对应的最近一次多轮对话，此时，多个问答语句组除了包括语料库中的多个第一问答语句组，还包括该终端对应的最近一次多轮对话中的多个第二问答语句组。

其中，多轮对话为用户提问至少两次，终端回复至少两次的对话。

步骤S103、根据多组问答对和当前提问，确定当前提问的回复。

具体地，根据多组问答对和当前提问，确定当前提问的回复，包括：

b1、根据多组问答对和当前提问，从多组问答对对应的多个内容片段组中确定与当前提问最相关的目标内容片段组，其中，每组问答对对应的至少一个内容片段组成一个内容片段组；

具体地，根据多组问答对和当前提问，从多组问答对对应的多个内容片段组中确定与当前提问最相关的目标内容片段组，可以采用多头关注点算法(multi-headattention)得到，具体过程本实施例中不再赘述。

若多个问答语句组除了包括语料库中的多个第一问答语句组，还包括该终端对应的最近一次对话中的至少一个第二问答语句组，则根据多组问答对和当前提问，从多组问答对对应的多个内容片段组中确定与当前提问最相关的目标内容片段组，包括：

根据多组第一问答对和所述当前提问，从多组第一问答对对应的多个第一内容片段组中确定与当前提问最相关的第一目标内容片段组；

根据当前提问、第一目标内容片段组和第二目标内容片段组，从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中，确定至少一个目标内容片段。

具体地，至少一个目标内容片段组成上述的目标内容片段组。可以理解的是，若多个问答语句组包括语料库中的多个第一问答语句组，不包括该终端对应的最近一次对话中的至少一个第二问答语句组，则目标内容片段组为第一目标内容片段组。

其中，确定至少一个目标内容片段，可采用合并算法(MergeNet)将第一目标内容片段组和第二目标内容片段组合并，再采用多头关注点算法实现。

其中，合并算法的原理图可参照图3。

b2、根据目标内容片段组和当前提问，确定当前提问的回复。

具体地，确定当前提问的回复，可以采用seq2seq模型对应的解码算法实现。

为了使得解码后得到的回复更加的精确，在一种方式中，根据至少一个目标内容片段和当前提问，确定当前提问的回复，包括：

c1、根据目标内容片段组和当前提问，得到当前提问的回复中的第k个词，k为正整数。

c2、根据目标内容片段组、当前提问和第k个词，得到当前提问的回复中的第k+1个词。

也就是说在得到当前提问的回复的当前词时，不仅考虑与当前提问最相关的目标内容片段组和当前提问，还考虑当前提问的回复的当前词的上一个词，使得生成的当前提问的回复会更加的精确。

步骤S104、将当前提问的回复发送至终端。

具体地，服务器在得到当前提问的回复后，将当前提问的回复发送至终端，终端显示当前提问的回复。

下面对本实施例的确定当前提问的回复的算法原理进行说明。

图4为本申请实施例提供的确定当前提问的回复的算法原理图。

参见图4，本实施例的确定当前提问的回复的算法原理如下：

(1)对当前提问U编码，得到当前提问对应的隐变量Q。

(2)对多组第一问答对进行编码，得到多组KV格式的第一矩阵对，每组第一矩阵对包括第一矩阵(K)和第二矩阵(V)，第一矩阵为第一问答对中的提问语句对应的矩阵，第二矩阵为第一问答对对应的内容片段组(包括第一问答对中的回复语句对应的至少一个内容片段)对应的矩阵。

(3)对多组第二问答对进行编码，得到多组KV格式的第二矩阵对，每组第一矩阵对包括第三矩阵(K)和第四矩阵(V)，第三矩阵为第二问答对中的提问语句对应的矩阵，第四矩阵为第二问答对对应的内容片段组(包括第二问答对中的回复语句对应的至少一个内容片段)对应的矩阵。

其中，步骤(2)和(3)中的编码方法可为seq2seq模型对应的编码算法。

(4)根据隐变量Q和多组第一矩阵对，通过多头关注点算法(multi-headattention)，获取多组第一矩阵对对应的多个第二矩阵中与隐变量Q最相关的第一目标矩阵；该步骤为“根据多组第一问答对和当前提问，从多组第一问答对对应的多个第一内容片段组中确定与当前提问最相关的第一目标内容片段组”的具体实现，第一目标矩阵为第一目标内容片段组的矩阵表示。

(5)根据隐变量Q和多组第二矩阵对，通过多头关注点算法，获取多个第二矩阵对包括的多个第四矩阵中与隐变量Q最相关的第二目标矩阵；该步骤为“根据多组第二问答对和当前提问，从多组第二问答对对应的多个第二内容片段组中确定与当前提问最相关的第一目标内容片段组”的具体实现，第二目标矩阵为第二目标内容片段组的矩阵表示。

(6)通过合并算法(MergeNet)，对第一目标矩阵和第二目标矩阵合并，得到第一合并矩阵，并根据第一合并矩阵和隐变量Q，通过多头关注点算法，获取第一合并矩阵的子矩阵中与隐变量Q最相关的目标矩阵；该步骤为“根据当前提问、第一目标内容片段组和第二目标内容片段组，从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中，确定至少一个目标内容片段”的具体实现，目标矩阵为至少一个目标内容片段的矩阵表示。

(7)通过合并算法，合并隐变量Q和目标矩阵，得到第五矩阵；

根据第五矩阵进行解码，得到当前提问的回复。

其中，根据第五矩阵进行解码，得到当前提问的回复，包括：

解码得到当前提问的回复中的第k个词；

通过合并算法(MergeNet)，将目标矩阵和回复中的第k个词对应的向量合并，得到第六矩阵；

根据第五矩阵和第六矩阵，解码得到回复中的第k+1个词。

步骤(7)为根据至少一个目标内容片段和当前提问，确定当前提问的回复的具体实现。

其中，步骤(7)的解码方法可为seq2seq模型对应的解码算法。

本实施例中通过对多个问答语句中回复语句的内容片段的提取，使得可得到与当前提问最相关的至少一个内容片断，而与当前提问最相关的至少一个内容片断对应的回复语句的形式是多样的，因此可根据当前提问和至少一个内容片断得到符合当前提问的形式的回复语句，提高了生成的回复的精确度。

应理解，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

图5为本申请实施提供的对话生成装置的结构示意图，如图5所示，本实施例的装置可以包括：接收模块51、获取模块52、确定模块53和发送模块54。

接收模块51，用于从终端获取当前提问；

获取模块52，用于对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对；所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句；

确定模块53，用于根据多组问答对和所述当前提问，确定所述当前提问的回复；

发送模块54，用于将所述当前提问的回复发送至所述终端。

可选地，所述确定模块53，具体用于：

可选地，所述获取模块52，具体用于：

可选地，所述确定模块53，具体用于：

本实施例的装置，可以用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图6为本申请实施例提供的服务器的结构示意图，参见图6，本实施例的服务器包括：处理器62、存储器61和通信总线63，通信总线63用于连接处理器62和存储器61，处理器62与存储器61耦合；

所述存储器61用于，存储计算机程序；

所述处理器62用于，调用所述存储器61中存储的计算机程序，以实现上述方法实施例中的方法。

其中，计算机程序还可存储在服务器外部的存储器中。

应理解，在本申请实施例中，该处理器62可以是CPU，该处理器62还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。

该存储器61可以包括只读存储器和随机存取存储器，并向处理器62提供指令和数据。存储器61还可以包括非易失性随机存取存储器。例如，存储器61还可以存储设备类型的信息。

该存储器61可以是易失性存储器或非易失性存储器，或均可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(read-only memory，ROM)、可编程只读存储器(programmable ROM，PROM)、可擦除可编程只读存储器(erasable PROM，EPROM)、电可擦除可编程只读存储器(electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(static RAM，SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM，SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM，DR RAM)。

该总线63除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线63。

本申请实施例提供一种可读存储介质，包括程序或指令，当所述程序或指令在计算机上运行时，如上述任意方法实施例所述的方法被执行。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请实施例的技术方案，而非对其限制；尽管参照前述各实施例对本申请实施例进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请实施例方案的范围。

Claims

1.一种对话生成方法，其特征在于，包括：

从终端获取当前提问；

对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对，根据多个问答语句组对应得到多组问答对；所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句；

将所述当前提问的回复发送至所述终端。

2.根据权利要求1所述的方法，其特征在于，所述根据多组问答对和所述当前提问，确定当前提问的回复，包括：

3.根据权利要求2所述的方法，其特征在于，对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据多组问答对和所述当前提问，从多组问答对对应的多个内容片段组中，确定与当前提问最相关的目标内容片段组，包括：

5.根据权利要求1～4任一项所述的方法，其特征在于，所述根据所述目标内容片段组和所述当前提问，确定所述当前提问的回复，包括：

6.一种对话生成装置，其特征在于，包括：

接收模块，用于从终端获取当前提问；

获取模块，用于对于多个问答语句组中的每个问答语句组，获取问答语句组中的回复语句的至少一个内容片段，并根据所述问答语句组中的提问语句和所述至少一个内容片段，得到一组问答对，根据多个问答语句组对应得到多组问答对；所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句；

发送模块，用于将所述当前提问的回复发送至所述终端。

7.根据权利要求6所述的装置，其特征在于，所述确定模块，具体用于：

8.根据权利要求7所述的装置，其特征在于，所述获取模块，具体用于：

9.根据权利要求8所述的装置，其特征在于，所述确定模块，具体用于：

10.根据权利要求6～9任一项所述的装置，其特征在于，所述确定模块，具体用于：

11.一种可读存储介质，其特征在于，包括程序或指令，当所述程序或指令在计算机上运行时，权利要求1～5任一所述的方法被执行。

12.一种服务器，其特征在于，包括：处理器，所述处理器与存储器耦合；

所述存储器用于，存储计算机程序；

所述处理器用于，调用所述存储器中存储的计算机程序，以实现权利要求1～5任一所述的方法。