CN109800286B - 对话生成方法和装置 - Google Patents
对话生成方法和装置 Download PDFInfo
- Publication number
- CN109800286B CN109800286B CN201811541403.1A CN201811541403A CN109800286B CN 109800286 B CN109800286 B CN 109800286B CN 201811541403 A CN201811541403 A CN 201811541403A CN 109800286 B CN109800286 B CN 109800286B
- Authority
- CN
- China
- Prior art keywords
- question
- group
- content segment
- answer
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种对话生成方法和装置,该方法包括:从终端获取当前提问;对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对;所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句;根据多组问答对和所述当前提问,确定所述当前提问的回复;将所述当前提问的回复发送至所述终端。本申请实施例提供一种对话生成方法和装置提高了生成的回复的精确度。
Description
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种对话生成方法和装置。
背景技术
对话生成技术是当前以及未来构建通用对话系统的一种主流技术,其本质是建模用户当前的提问(query)与回复(response)的映射关系。
目前的对话生成方法包括两种:检索式和自然语言生成。检索式的方法是通过用户输入的提问语句在语料中进行检索,找到一些相关的回复,效果很受语料的限制,对应语料中没有相关的句子则无法回复用户。今年来基于自然语言生成的方式越来越受到重视,其使用的是端到端(end2end)的框架,最常用的为seq2seq,即将当前提问编码后得到单一向量,然后依据这个向量去控制回复的生成。
上述方法都仅仅建模了提问与回复一对一的映射关系(即一个提问对应一种形式的答复),从而到导致生成的回复不够精确,比如生成的回复不够人性化,生成一些与提问没有关联的通用回复等。
发明内容
本申请实施例提供一种对话生成方法和装置,使得生成的提问的回复比较精确。
第一方面,本申请实施例提供一种对话生成方法,包括:
从终端获取当前提问;
对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对;所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句;
根据多组问答对和所述当前提问,确定所述当前提问的回复;
将所述当前提问的回复发送至所述终端。
在一种可能的设计中,所述根据多组问答对和所述当前提问,确定当前提问的回复,包括:
根据多组问答对和所述当前提问,从多组问答对中对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组;其中,每组问答对对应的至少一个内容片段组成一个内容片段组;
根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复。
在一种可能的设计中,对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对,包括:
对于语料库对应的每个第一问答语句组,获取第一问答语句组中的回复语句的至少一个第一内容片段,并根据所述第一问答语句组中的第一提问语句和至少一个第一内容片段,得到一组第一问答对;
对于每个第二问答语句组,获取第二问答语句组中的回复语句的至少一个第二内容片段,并根据所述第二问答语句组中的第二提问语句和至少一个第二内容片段,得到一组第二问答对;
其中,第二问答语句组为所述终端对应的最近一次对话中的问答语句组。
在一种可能的设计中,所述根据多组问答对和所述当前提问,从多组问答对对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组,包括:
根据多组第一问答对和所述当前提问,从多组第一问答对对应的多个第一内容片段组中确定与所述当前提问最相关的第一目标内容片段组;
根据至少一组第二问答对和所述当前提问,从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组;
根据所述当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段;其中,所述至少一个目标内容片段组成所述目标内容片段组。
在一种可能的设计中,所述根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复,包括:
根据所述目标内容片段组和所述当前提问,得到所述当前提问的回复中的第k个词,k为正整数;
根据所述目标内容片段组、所述当前提问和所述第k个词,得到所述当前提问的回复中的第k+1个词。
第二方面,本申请实施例提供一种对话生成装置,包括:
接收模块,用于从终端获取当前提问;
获取模块,用于对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对;所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句;
确定模块,用于根据多组问答对和所述当前提问,确定所述当前提问的回复;
发送模块,用于将所述当前提问的回复发送至所述终端。
在一种可能的设计中,所述确定模块,具体用于:
根据多组问答对和所述当前提问,从多组问答对中对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组;其中,每组问答对对应的至少一个内容片段组成一个内容片段组。
根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复。
在一种可能的设计中,所述获取模块,具体用于:
对于语料库对应的每个第一问答语句组,获取第一问答语句组中的回复语句的至少一个第一内容片段,并根据所述第一问答语句组中的第一提问语句和至少一个第一内容片段,得到一组第一问答对;
对于每个第二问答语句组,获取第二问答语句组中的回复语句的至少一个第二内容片段,并根据所述第二问答语句组中的第二提问语句和至少一个第二内容片段,得到一组第二问答对;
其中,第二问答语句组为所述终端对应的最近一次对话中的问答语句组。
在一种可能的设计中,所述确定模块,具体用于:
根据多组第一问答对和所述当前提问,从多组第一问答对对应的多个第一内容片段组中确定与所述当前提问最相关的第一目标内容片段组;
根据至少一组第二问答对和所述当前提问,从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组;
根据所述当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段;其中,所述至少一个目标内容片段组成所述目标内容片段组。
在一种可能的设计中,所述确定模块,具体用于:
根据所述目标内容片段组和所述当前提问,得到所述当前提问的回复中的第k个词,k为正整数;
根据所述目标内容片段组、所述当前提问和所述第k个词,得到所述当前提问的回复中的第k+1个词。
第三方面,本申请实施例提供一种可读存储介质,包括程序或指令,当所述程序或指令在计算机上运行时,第一方面任一所述的方法被执行。
第四方面,本申请实施例提供一种服务器,包括:处理器,所述处理器与存储器耦合;
所述存储器用于,存储计算机程序;
所述处理器用于,调用所述存储器中存储的计算机程序,以实现第一方面任一所述的方法。
本申请中通过对多个问答语句中回复语句的内容片段的提取,使得可得到与当前提问最相关的至少一个内容片断,而与当前提问最相关的至少一个内容片断对应的回复语句的形式是多样的,因此可根据当前提问和至少一个内容片断得到符合当前提问的形式的回复语句,提高了生成的回复的精确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景示意图;
图2为本申请实施例提供的对话生成方法的流程图;
图3为本申请实施例提供的合并算法原理示意图;
图4为本申请实施例提供的确定当前提问的回复的算法原理图;
图5为本申请实施提供的对话生成装置的结构示意图;
图6为本申请实施提供的服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。本申请中术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
图1为本申请实施例提供的应用场景示意图。参见图1,用户通过终端11的用户界面111输入当前提问“请问如何挂失”,终端将当前提问发送至服务器12,服务器12根据存储的每个问答语句组得到多组问答对,并根据多组问答对和当前提问,确定当前提问的回复“请拨打挂失电话123456”,并将当前提问的回复发送至终端11,并在终端11的用户界面111显示。
下面,通过具体实施例对本申请所示的技术方案进行详细说明。需要说明的是,下面几个具体实施例可以相互结合,对于相同或相似的内容,在不同的实施例中不再进行重复说明。
图2为本申请实施例提供的对话生成方法的流程图,本实施例的执行主体可为对话生成装置,该对话生成装置可位于服务器中。参见图2,本实施例的方法包括:
步骤S101、从终端获取当前提问。
具体地,用户通过终端的用户界面输入当前提问“XXXXXX”。用户界面可为终端根据用户输入的智能问答指令向用户显示的,比如用户通过点击应用中的用于智能问答的图标输入智能问答指令。
终端接收到当前提问后,将当前提问发送至对话生成装置。
步骤S102、对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句中的至少一个内容片段,并根据问答语句组中的提问语句和至少一个内容片段,得到一组问答对;问答语句组包括一个提问语句和该提问语句对应的至少一个回复语句。
具体地,在对话生成装置中语料库可存储有语料库,或者从数据存储服务器中获取语料库。对话生成装置根据语料库,得到多个问答语句组。每个问答语句组包括一个提问语句和该提问语句对应的至少一个回复语句。
对话生成装置接收到当前提问后,对话生成装置根据每个问答语句组,获取问答语句组中的回复语句中的至少一个内容片段,并根据问答语句组中的提问语句和至少一个内容片段,得到一组问答对。则多个问答语句组对应得到多组问答对。
其中,可通过自然语言处理技术(natural language processing,NLP),获取语句的内容片段。比如语句“十分明显,不大大提高整个中华民族的科学文化水平,四个现代化就是一句空话”中的至少一个内容片段包括如下中的至少一项:“十分明显”、“提高整个中华民族的科学文化水平”,“不提高整个中华民族的科学文化水平”、“四个现代化”、“一句空话”。
为了使得得到回复的概率更大以及得到的回复的精确度更高,多个问答语句组除了包括语料库中的多个第一问答语句组,还包括该终端对应的最近一次对话中的至少一个第二问答语句组。则对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句中的至少一个内容片段,并根据问答语句组中的提问语句和至少一个内容片段,得到一组问答对,包括:
a1、对于语料库对应的每个第一问答语句组,获取第一问答语句组中回复语句的至少一个第一内容片段,并根据第一问答语句组中的第一提问语句和至少一个第一内容片段,得到一组第一问答对。
具体地,对于多个第一问答语句组,得到多组第一问答对。
a2、对于每个第二问答语句组,获取第二问答语句组中回复语句中的至少一个第二内容片段,并根据第二问答语句组中的第二提问语句和至少一个第二内容片段,得到一组第二问答对。
具体地,对于至少一个第二问答语句组,得到至少一组第二问答对。
进一步地,上述该终端对应的最近一次对话为该终端对应的最近一次多轮对话,此时,多个问答语句组除了包括语料库中的多个第一问答语句组,还包括该终端对应的最近一次多轮对话中的多个第二问答语句组。
其中,多轮对话为用户提问至少两次,终端回复至少两次的对话。
步骤S103、根据多组问答对和当前提问,确定当前提问的回复。
具体地,根据多组问答对和当前提问,确定当前提问的回复,包括:
b1、根据多组问答对和当前提问,从多组问答对对应的多个内容片段组中确定与当前提问最相关的目标内容片段组,其中,每组问答对对应的至少一个内容片段组成一个内容片段组;
具体地,根据多组问答对和当前提问,从多组问答对对应的多个内容片段组中确定与当前提问最相关的目标内容片段组,可以采用多头关注点算法(multi-headattention)得到,具体过程本实施例中不再赘述。
若多个问答语句组除了包括语料库中的多个第一问答语句组,还包括该终端对应的最近一次对话中的至少一个第二问答语句组,则根据多组问答对和当前提问,从多组问答对对应的多个内容片段组中确定与当前提问最相关的目标内容片段组,包括:
根据多组第一问答对和所述当前提问,从多组第一问答对对应的多个第一内容片段组中确定与当前提问最相关的第一目标内容片段组;
根据至少一组第二问答对和所述当前提问,从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组;
根据当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段。
具体地,至少一个目标内容片段组成上述的目标内容片段组。可以理解的是,若多个问答语句组包括语料库中的多个第一问答语句组,不包括该终端对应的最近一次对话中的至少一个第二问答语句组,则目标内容片段组为第一目标内容片段组。
其中,确定至少一个目标内容片段,可采用合并算法(MergeNet)将第一目标内容片段组和第二目标内容片段组合并,再采用多头关注点算法实现。
其中,合并算法的原理图可参照图3。
b2、根据目标内容片段组和当前提问,确定当前提问的回复。
具体地,确定当前提问的回复,可以采用seq2seq模型对应的解码算法实现。
为了使得解码后得到的回复更加的精确,在一种方式中,根据至少一个目标内容片段和当前提问,确定当前提问的回复,包括:
c1、根据目标内容片段组和当前提问,得到当前提问的回复中的第k个词,k为正整数。
c2、根据目标内容片段组、当前提问和第k个词,得到当前提问的回复中的第k+1个词。
也就是说在得到当前提问的回复的当前词时,不仅考虑与当前提问最相关的目标内容片段组和当前提问,还考虑当前提问的回复的当前词的上一个词,使得生成的当前提问的回复会更加的精确。
步骤S104、将当前提问的回复发送至终端。
具体地,服务器在得到当前提问的回复后,将当前提问的回复发送至终端,终端显示当前提问的回复。
下面对本实施例的确定当前提问的回复的算法原理进行说明。
图4为本申请实施例提供的确定当前提问的回复的算法原理图。
参见图4,本实施例的确定当前提问的回复的算法原理如下:
(1)对当前提问U编码,得到当前提问对应的隐变量Q。
(2)对多组第一问答对进行编码,得到多组KV格式的第一矩阵对,每组第一矩阵对包括第一矩阵(K)和第二矩阵(V),第一矩阵为第一问答对中的提问语句对应的矩阵,第二矩阵为第一问答对对应的内容片段组(包括第一问答对中的回复语句对应的至少一个内容片段)对应的矩阵。
(3)对多组第二问答对进行编码,得到多组KV格式的第二矩阵对,每组第一矩阵对包括第三矩阵(K)和第四矩阵(V),第三矩阵为第二问答对中的提问语句对应的矩阵,第四矩阵为第二问答对对应的内容片段组(包括第二问答对中的回复语句对应的至少一个内容片段)对应的矩阵。
其中,步骤(2)和(3)中的编码方法可为seq2seq模型对应的编码算法。
(4)根据隐变量Q和多组第一矩阵对,通过多头关注点算法(multi-headattention),获取多组第一矩阵对对应的多个第二矩阵中与隐变量Q最相关的第一目标矩阵;该步骤为“根据多组第一问答对和当前提问,从多组第一问答对对应的多个第一内容片段组中确定与当前提问最相关的第一目标内容片段组”的具体实现,第一目标矩阵为第一目标内容片段组的矩阵表示。
(5)根据隐变量Q和多组第二矩阵对,通过多头关注点算法,获取多个第二矩阵对包括的多个第四矩阵中与隐变量Q最相关的第二目标矩阵;该步骤为“根据多组第二问答对和当前提问,从多组第二问答对对应的多个第二内容片段组中确定与当前提问最相关的第一目标内容片段组”的具体实现,第二目标矩阵为第二目标内容片段组的矩阵表示。
(6)通过合并算法(MergeNet),对第一目标矩阵和第二目标矩阵合并,得到第一合并矩阵,并根据第一合并矩阵和隐变量Q,通过多头关注点算法,获取第一合并矩阵的子矩阵中与隐变量Q最相关的目标矩阵;该步骤为“根据当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段”的具体实现,目标矩阵为至少一个目标内容片段的矩阵表示。
(7)通过合并算法,合并隐变量Q和目标矩阵,得到第五矩阵;
根据第五矩阵进行解码,得到当前提问的回复。
其中,根据第五矩阵进行解码,得到当前提问的回复,包括:
解码得到当前提问的回复中的第k个词;
通过合并算法(MergeNet),将目标矩阵和回复中的第k个词对应的向量合并,得到第六矩阵;
根据第五矩阵和第六矩阵,解码得到回复中的第k+1个词。
步骤(7)为根据至少一个目标内容片段和当前提问,确定当前提问的回复的具体实现。
其中,步骤(7)的解码方法可为seq2seq模型对应的解码算法。
本实施例中通过对多个问答语句中回复语句的内容片段的提取,使得可得到与当前提问最相关的至少一个内容片断,而与当前提问最相关的至少一个内容片断对应的回复语句的形式是多样的,因此可根据当前提问和至少一个内容片断得到符合当前提问的形式的回复语句,提高了生成的回复的精确度。
应理解,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图5为本申请实施提供的对话生成装置的结构示意图,如图5所示,本实施例的装置可以包括:接收模块51、获取模块52、确定模块53和发送模块54。
接收模块51,用于从终端获取当前提问;
获取模块52,用于对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对;所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句;
确定模块53,用于根据多组问答对和所述当前提问,确定所述当前提问的回复;
发送模块54,用于将所述当前提问的回复发送至所述终端。
可选地,所述确定模块53,具体用于:
根据多组问答对和所述当前提问,从多组问答对中对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组;其中,每组问答对对应的至少一个内容片段组成一个内容片段组。
根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复。
可选地,所述获取模块52,具体用于:
对于语料库对应的每个第一问答语句组,获取第一问答语句组中的回复语句的至少一个第一内容片段,并根据所述第一问答语句组中的第一提问语句和至少一个第一内容片段,得到一组第一问答对;
对于每个第二问答语句组,获取第二问答语句组中的回复语句的至少一个第二内容片段,并根据所述第二问答语句组中的第二提问语句和至少一个第二内容片段,得到一组第二问答对;
其中,第二问答语句组为所述终端对应的最近一次对话中的问答语句组。
可选地,所述确定模块53,具体用于:
根据多组第一问答对和所述当前提问,从多组第一问答对对应的多个第一内容片段组中确定与所述当前提问最相关的第一目标内容片段组;
根据至少一组第二问答对和所述当前提问,从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组;
根据所述当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段;其中,所述至少一个目标内容片段组成所述目标内容片段组。
可选地,所述确定模块53,具体用于:
根据所述目标内容片段组和所述当前提问,得到所述当前提问的回复中的第k个词,k为正整数;
根据所述目标内容片段组、所述当前提问和所述第k个词,得到所述当前提问的回复中的第k+1个词。
本实施例的装置,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本申请实施例提供的服务器的结构示意图,参见图6,本实施例的服务器包括:处理器62、存储器61和通信总线63,通信总线63用于连接处理器62和存储器61,处理器62与存储器61耦合;
所述存储器61用于,存储计算机程序;
所述处理器62用于,调用所述存储器61中存储的计算机程序,以实现上述方法实施例中的方法。
其中,计算机程序还可存储在服务器外部的存储器中。
应理解,在本申请实施例中,该处理器62可以是CPU,该处理器62还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。
该存储器61可以包括只读存储器和随机存取存储器,并向处理器62提供指令和数据。存储器61还可以包括非易失性随机存取存储器。例如,存储器61还可以存储设备类型的信息。
该存储器61可以是易失性存储器或非易失性存储器,或均可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
该总线63除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线63。
本申请实施例提供一种可读存储介质,包括程序或指令,当所述程序或指令在计算机上运行时,如上述任意方法实施例所述的方法被执行。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请实施例的技术方案,而非对其限制;尽管参照前述各实施例对本申请实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请实施例方案的范围。
Claims (12)
1.一种对话生成方法,其特征在于,包括:
从终端获取当前提问;
对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对,根据多个问答语句组对应得到多组问答对;所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句;
根据多组问答对和所述当前提问,确定所述当前提问的回复;
将所述当前提问的回复发送至所述终端。
2.根据权利要求1所述的方法,其特征在于,所述根据多组问答对和所述当前提问,确定当前提问的回复,包括:
根据多组问答对和所述当前提问,从多组问答对中对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组;其中,每组问答对对应的至少一个内容片段组成一个内容片段组;
根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复。
3.根据权利要求2所述的方法,其特征在于,对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对,包括:
对于语料库对应的每个第一问答语句组,获取第一问答语句组中的回复语句的至少一个第一内容片段,并根据所述第一问答语句组中的第一提问语句和至少一个第一内容片段,得到一组第一问答对;
对于每个第二问答语句组,获取第二问答语句组中的回复语句的至少一个第二内容片段,并根据所述第二问答语句组中的第二提问语句和至少一个第二内容片段,得到一组第二问答对;
其中,第二问答语句组为所述终端对应的最近一次对话中的问答语句组。
4.根据权利要求3所述的方法,其特征在于,所述根据多组问答对和所述当前提问,从多组问答对对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组,包括:
根据多组第一问答对和所述当前提问,从多组第一问答对对应的多个第一内容片段组中确定与所述当前提问最相关的第一目标内容片段组;
根据至少一组第二问答对和所述当前提问,从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组;
根据所述当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段;其中,所述至少一个目标内容片段组成所述目标内容片段组。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复,包括:
根据所述目标内容片段组和所述当前提问,得到所述当前提问的回复中的第k个词,k为正整数;
根据所述目标内容片段组、所述当前提问和所述第k个词,得到所述当前提问的回复中的第k+1个词。
6.一种对话生成装置,其特征在于,包括:
接收模块,用于从终端获取当前提问;
获取模块,用于对于多个问答语句组中的每个问答语句组,获取问答语句组中的回复语句的至少一个内容片段,并根据所述问答语句组中的提问语句和所述至少一个内容片段,得到一组问答对,根据多个问答语句组对应得到多组问答对;所述问答语句组包括一个提问语句和所述提问语句对应的至少一个回复语句;
确定模块,用于根据多组问答对和所述当前提问,确定所述当前提问的回复;
发送模块,用于将所述当前提问的回复发送至所述终端。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于:
根据多组问答对和所述当前提问,从多组问答对中对应的多个内容片段组中,确定与当前提问最相关的目标内容片段组;其中,每组问答对对应的至少一个内容片段组成一个内容片段组;
根据所述目标内容片段组和所述当前提问,确定所述当前提问的回复。
8.根据权利要求7所述的装置,其特征在于,所述获取模块,具体用于:
对于语料库对应的每个第一问答语句组,获取第一问答语句组中的回复语句的至少一个第一内容片段,并根据所述第一问答语句组中的第一提问语句和至少一个第一内容片段,得到一组第一问答对;
对于每个第二问答语句组,获取第二问答语句组中的回复语句的至少一个第二内容片段,并根据所述第二问答语句组中的第二提问语句和至少一个第二内容片段,得到一组第二问答对;
其中,第二问答语句组为所述终端对应的最近一次对话中的问答语句组。
9.根据权利要求8所述的装置,其特征在于,所述确定模块,具体用于:
根据多组第一问答对和所述当前提问,从多组第一问答对对应的多个第一内容片段组中确定与所述当前提问最相关的第一目标内容片段组;
根据至少一组第二问答对和所述当前提问,从至少一组第二问答对对应的至少一个第二内容片段组中确定与当前提问最相关的第二目标内容片段组;
根据所述当前提问、第一目标内容片段组和第二目标内容片段组,从第一目标内容片段组包括的至少一个内容片段和第一目标内容片段组包括的至少一个内容片段中,确定至少一个目标内容片段;其中,所述至少一个目标内容片段组成所述目标内容片段组。
10.根据权利要求6~9任一项所述的装置,其特征在于,所述确定模块,具体用于:
根据所述目标内容片段组和所述当前提问,得到所述当前提问的回复中的第k个词,k为正整数;
根据所述目标内容片段组、所述当前提问和所述第k个词,得到所述当前提问的回复中的第k+1个词。
11.一种可读存储介质,其特征在于,包括程序或指令,当所述程序或指令在计算机上运行时,权利要求1~5任一所述的方法被执行。
12.一种服务器,其特征在于,包括:处理器,所述处理器与存储器耦合;
所述存储器用于,存储计算机程序;
所述处理器用于,调用所述存储器中存储的计算机程序,以实现权利要求1~5任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811541403.1A CN109800286B (zh) | 2018-12-17 | 2018-12-17 | 对话生成方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811541403.1A CN109800286B (zh) | 2018-12-17 | 2018-12-17 | 对话生成方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109800286A CN109800286A (zh) | 2019-05-24 |
CN109800286B true CN109800286B (zh) | 2021-05-11 |
Family
ID=66556858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811541403.1A Active CN109800286B (zh) | 2018-12-17 | 2018-12-17 | 对话生成方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109800286B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143535B (zh) * | 2019-12-27 | 2021-08-10 | 北京百度网讯科技有限公司 | 用于生成对话模型的方法和装置 |
CN111563029A (zh) * | 2020-03-13 | 2020-08-21 | 深圳市奥拓电子股份有限公司 | 对话机器人的测试方法、系统、存储介质及计算机设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101986293B (zh) * | 2010-09-03 | 2016-08-24 | 百度在线网络技术(北京)有限公司 | 用于在搜索界面中呈现搜索答案信息的方法及设备 |
CN103902652A (zh) * | 2014-02-27 | 2014-07-02 | 深圳市智搜信息技术有限公司 | 自动问答系统 |
CN103853842B (zh) * | 2014-03-20 | 2017-07-18 | 百度在线网络技术(北京)有限公司 | 一种自动问答方法和系统 |
CN104536991B (zh) * | 2014-12-10 | 2017-12-08 | 乐娟 | 答案抽取方法及装置 |
CN105786875B (zh) * | 2014-12-23 | 2019-06-14 | 北京奇虎科技有限公司 | 提供问答对数据搜索结果的方法和装置 |
US9946785B2 (en) * | 2015-03-23 | 2018-04-17 | International Business Machines Corporation | Searching code based on learned programming construct patterns and NLP similarity |
CN105159996B (zh) * | 2015-09-07 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 基于人工智能的深度问答服务提供方法和装置 |
CN106649612B (zh) * | 2016-11-29 | 2020-05-01 | 中国银联股份有限公司 | 一种自动问答模板匹配的方法及装置 |
CN108595619A (zh) * | 2018-04-23 | 2018-09-28 | 海信集团有限公司 | 一种问答方法及设备 |
CN108804529A (zh) * | 2018-05-02 | 2018-11-13 | 深圳智能思创科技有限公司 | 一种基于Web的问答系统实现方法 |
CN108959559B (zh) * | 2018-06-29 | 2021-02-26 | 北京百度网讯科技有限公司 | 问答对生成方法和装置 |
-
2018
- 2018-12-17 CN CN201811541403.1A patent/CN109800286B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109800286A (zh) | 2019-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102458808B1 (ko) | 신경망을 이용한 텍스트 시퀀스 처리 | |
CN112084789B (zh) | 文本处理方法、装置、设备及存储介质 | |
EP3885966B1 (en) | Method and device for generating natural language description information | |
CN107135429B (zh) | 弹幕消息解析方法、装置、电子设备及计算机可读储存介质 | |
WO2023201975A1 (zh) | 一种差异描述语句生成方法、装置、设备及介质 | |
KR20210106398A (ko) | 세션 추천 방법, 장치 및 기기 | |
CN108959388B (zh) | 信息生成方法及装置 | |
CN109800286B (zh) | 对话生成方法和装置 | |
CN111090417A (zh) | 二进制文件解析方法、装置、设备及介质 | |
KR20210158815A (ko) | 트리플 샘플 생성 방법, 장치, 전자 기기 및 기록 매체 | |
CN110619124A (zh) | 一种结合注意力机制与双向lstm的命名实体识别方法及系统 | |
CN110717019A (zh) | 问答处理方法、问答系统、电子设备及介质 | |
KR102550340B1 (ko) | 챕터-레벨 텍스트 번역 방법 및 디바이스 | |
CN113051894A (zh) | 一种文本纠错的方法和装置 | |
CN110427277B (zh) | 数据校验方法、装置、设备及存储介质 | |
CN110275946A (zh) | 一种faq自动问答方法和装置 | |
CN114970666A (zh) | 一种口语处理方法、装置、电子设备及存储介质 | |
Augustyniak et al. | Inference for a leptokurtic symmetric family of distributions represented by the difference of two gamma variates | |
Alhazov et al. | Membrane division, restricted membrane creation and object complexity in P systems | |
CN109063106A (zh) | 网址修正方法、装置、计算机设备和存储介质 | |
CN111324787A (zh) | 区块链浏览器中区块链数据的展现方法和装置 | |
CN113283241B (zh) | 文本识别方法、装置、电子设备及计算机可读存储介质 | |
CN115905598B (zh) | 一种社会事件摘要生成的方法、装置、终端设备及介质 | |
CN115510203B (zh) | 问题答案确定方法、装置、设备、存储介质及程序产品 | |
CN116991919B (zh) | 结合平台数据库的业务数据检索方法及人工智能系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |