CN111400481A

CN111400481A - 针对多轮对话生成回复语句的方法和装置

Info

Publication number: CN111400481A
Application number: CN202010410108.3A
Authority: CN
Inventors: 林谢雄; 简葳玙; 何建杉; 王太峰
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2020-07-10
Anticipated expiration: 2040-05-15
Also published as: CN111400481B

Abstract

本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置，方法包括：获取历史上下文；对历史上下文基于注意力机制进行编码，得到历史上下文对应的上下文向量，以及历史上下文对应的第一分词序列的编码注意力分布；对候选知识集合中的各候选知识基于注意力机制进行编码，得到候选知识集合对应的知识融合向量，以及候选知识集合对应的第二分词序列的知识注意力分布；针对回复语句进行逐词预测，其中每次预测包括：对于扩充词表中每个候选词，得到将该候选词作为下一个词的预测概率；扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。

Description

针对多轮对话生成回复语句的方法和装置

技术领域

本说明书一个或多个实施例涉及计算机领域，尤其涉及针对多轮对话生成回复语句的方法和装置。

背景技术

当前，在智能客服中，由机器与用户进行对话，解答用户问题，由于用户的表达口语化，一轮对话往往无法明确用户诉求，需要机器与用户之间进行多轮对话，才能最终解答用户问题。

现有技术中，常常采用生成式模型针对多轮对话生成回复语句。生成式模型可以生成用户问句中没有的词语，但是生成的回复语句可能不能准确地再现细节,无法处理词汇不足（out-of-vocabulary，OOV）单词。

因此，希望能有改进的方案，在针对多轮对话生成回复语句时能够处理词汇不足单词。

发明内容

本说明书一个或多个实施例描述了一种针对多轮对话生成回复语句的方法和装置，在针对多轮对话生成回复语句时能够处理词汇不足单词。

第一方面，提供了一种针对多轮对话生成回复语句的方法，方法包括：

获取多轮对话中包含当前用户问句的历史上下文；

对所述历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布；

对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布；

针对回复语句进行逐词预测，其中每次预测包括：

通过指针生成网络，分别生成当前的第一指针和第二指针，第一指针指示根据历史上下文生成下一个词的概率，第二指针指示根据候选知识集合生成下一个词的概率；

对于扩充词表中每个候选词，至少根据所述上下文向量、所述知识融合向量预测生成该候选词的第一概率；根据第一指针和编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；

根据扩充词表中各个词的预测概率，预测下一个词。

在一种可能的实施方式中，所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。

在一种可能的实施方式中，所述对候选知识集合中的各候选知识基于注意力机制进行编码之前，所述方法还包括：

提取所述历史上下文中的实体词或关键词；

根据所述实体词或关键词，确定与所述历史上下文相关的所述候选知识集合。

在一种可能的实施方式中，所述候选知识包括：句子形式的候选知识或三元组形式的候选知识；所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。

在一种可能的实施方式中，所述对候选知识集合中的各候选知识基于注意力机制进行编码，包括：

对候选知识集合中的各候选知识分别基于注意力机制进行编码，得到所述各候选知识分别对应的单条知识向量，以及各候选知识分别对应的分词序列的注意力分布；

针对各单条知识向量，基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量；以及根据各候选知识分别对应的分词序列的注意力分布，进行综合处理，得到所述候选知识集合对应的第二分词序列的知识注意力分布。

在一种可能的实施方式中，所述通过指针生成网络，分别生成当前的第一指针和第二指针，包括：

通过指针生成网络，根据所述上下文向量、前一个词的解码状态、以及前一个词对应的词向量和所述上下文向量的组合向量，生成当前的第一指针；

通过指针生成网络，根据所述知识融合向量、前一个词的解码状态、以及前一个词对应的词向量和所述知识融合向量的组合向量，生成当前的第二指针。

在一种可能的实施方式中，所述根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率，包括：

当该候选词存在于所述初始词表中，且不存在于所述第一分词序列中，且不存在于所述第二分词序列中，根据所述第一概率，得到将该候选词作为下一个词的预测概率。

当该候选词存在于所述第一分词序列中，且不存在于所述初始词表中，且不存在于所述第二分词序列中，根据所述第二概率，得到将该候选词作为下一个词的预测概率。

当该候选词存在于所述第二分词序列中，且不存在于所述初始词表中，且不存在于所述第一分词序列中，根据所述第三概率，得到将该候选词作为下一个词的预测概率。

第二方面，提供了一种针对多轮对话生成回复语句的装置，装置包括：

获取单元，用于获取多轮对话中包含当前用户问句的历史上下文；

第一编码单元，用于对所述获取单元获取的历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布；

第二编码单元，用于对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布；

预测单元，用于针对回复语句进行逐词预测，其中每次预测包括：

对于扩充词表中每个候选词，至少根据所述第一编码单元得到的上下文向量、所述第二编码单元得到的知识融合向量预测生成该候选词的第一概率；根据第一指针和所述第一编码单元得到的编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和所述第二编码单元得到的知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；

根据扩充词表中各个词的预测概率，预测下一个词。

第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面的方法。

第四方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面的方法。

通过本说明书实施例提供的方法和装置，首先获取多轮对话中包含当前用户问句的历史上下文；然后不仅对所述历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布；还对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布；后续在针对回复语句进行逐词预测的每次预测过程中，通过指针生成网络，分别生成当前的第一指针和第二指针，第一指针指示根据历史上下文生成下一个词的概率，第二指针指示根据候选知识集合生成下一个词的概率；对于扩充词表中每个候选词，至少根据所述上下文向量、所述知识融合向量预测生成该候选词的第一概率；根据第一指针和编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；根据扩充词表中各个词的预测概率，预测下一个词。由上可见，本说明书实施例，采用历史上下文中的分词和候选知识集合中的分词对初始词表进行了扩充得到扩充词表，并且基于第一指针和第二指针确定扩充词表中各候选词作为下一个词的预测概率，从而在针对多轮对话生成回复语句时能够处理词汇不足单词。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书披露的一个实施例的实施场景示意图；

图2示出根据一个实施例的针对多轮对话生成回复语句的方法流程图；

图3示出根据一个实施例的基于知识复制机制的回复语句生成过程示意图；

图4示出根据一个实施例的针对多轮对话生成回复语句的装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及针对多轮对话生成回复语句。可以理解的是，在智能客服领域，可以由机器代替人工客服与用户进行对话，在用户跟机器的多轮对话中，需要针对多轮对话生成回复语句，以使机器输出该回复语句与用户进行交互。通常地，采用生成式模型针对多轮对话生成回复语句。生成式模型可以生成用户问句中没有的词语，但是生成的回复语句可能不能准确地再现细节,无法处理词汇不足（out of vocabulary，OOV）单词。

参照图1，本说明书实施例中，考虑到词表是根据训练集的词频进行筛选的，词表有个大小的设置，一般不会设置特别大，如果词表比较大会影响速度，所以很多低频词不在词表内，比如一般专有名词比较罕见，词频比较低，容易不在词表范围内，因此基于历史上下文和候选知识集合对原有的词表（即初始词表）进行了扩充，得到扩充词表，基于扩充词表生成回复语句，从而在针对多轮对话生成回复语句时能够处理词汇不足单词。

可以理解的是，初始词表中包括的各分词与历史上下文对应的第一分词序列中包括的各分词可能存在相同的分词，例如，图1中的分词1与分词5相同；初始词表中包括的各分词与候选知识集合对应的第二分词序列中包括的各分词可能存在相同的分词，例如，图1中的分词2与分词8相同；历史上下文对应的第一分词序列中包括的各分词与候选知识集合对应的第二分词序列中包括的各分词可能存在相同的分词，例如，图1中的分词4与分词7相同。

图2示出根据一个实施例的针对多轮对话生成回复语句的方法流程图，该方法可以基于图1所示的实施场景。如图2所示，该实施例中针对多轮对话生成回复语句的方法包括以下步骤：步骤21，获取多轮对话中包含当前用户问句的历史上下文；步骤22，对所述历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布；步骤23，对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布；步骤24，针对回复语句进行逐词预测，其中每次预测包括：通过指针生成网络，分别生成当前的第一指针和第二指针，第一指针指示根据历史上下文生成下一个词的概率，第二指针指示根据候选知识集合生成下一个词的概率；对于扩充词表中每个候选词，至少根据所述上下文向量、所述知识融合向量预测生成该候选词的第一概率；根据第一指针和编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；根据扩充词表中各个词的预测概率，预测下一个词。下面描述以上各个步骤的具体执行方式。

首先在步骤21，获取多轮对话中包含当前用户问句的历史上下文。可以理解的是，上述多轮对话具体可以为用户跟机器的多轮对话。

在一个示例中，所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。也就是说，在当前用户问句之前，用户跟机器已经进行了至少一轮对话。

然后在步骤22，对所述历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布。可以理解的是，可以基于第一分词序列中各分词的编码状态，确定各分词的注意力权重，从而得到上述第一分词序列的编码注意力分布。

在一个示例中，先通过双向长短期记忆（long short-term memory，LSTM）网络对所述历史上下文进行编码，得到各分词的编码状态，再将各分词的编码状态通过注意力机制层，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布。

接着在步骤23，对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布。可以理解的是，上述候选知识集合可以是预先给定的一个候选知识集合，或者，上述候选知识集合可以是根据前述历史上下文，从预先给定的多个候选知识集合中选择的。

在一个示例中，所述对候选知识集合中的各候选知识基于注意力机制进行编码之前，所述方法还包括：

提取所述历史上下文中的实体词或关键词；

在一个示例中，所述候选知识包括：句子形式的候选知识或三元组形式的候选知识；所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。

举例来说，句子形式的候选知识可以为中国的首都是北京；三元组形式的候选知识可以为中国、首都、北京。

本说明书实施例中，候选知识集合对应的第二分词序列中的各分词可以用于生成回复语句，从而丰富用户和机器的多轮对话。

比如这个多轮对话：用户：智慧又不乏魅力！超强的磁场，这样的美丽女孩子少见。机器：是嘛，你看到哪个漂亮女神了用户：中国台湾女神。机器：谁啊，小红用户：确实是的，你的眼光还用说。

上述多轮对话可以基于如下的候选知识集合：小红描述中国台湾明星 |||小红家人次女:小云(Lily)|||小红民族汉族|||小红性别女 |||小红职业演员|||小红领域明星|||小琳获奖2007年第44届中国台北金马影展金马奖最佳原创歌曲(提名)|||小琳体重42kg|||小琳代表作候鸟e人|||小琳性别女|||小琳职业演员|||小琳领域明星 |||小红评论智慧又不乏魅力！超强的磁场～|||小红祖籍中国台湾||| 小红描述女神

在一个示例中，所述对候选知识集合中的各候选知识基于注意力机制进行编码，包括：

在一个示例中，通过转换器（transformer）对候选知识集合中的各候选知识进行编码表达，并通过动态注意力机制，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布。

最后在步骤24，针对回复语句进行逐词预测，其中每次预测包括：通过指针生成网络，分别生成当前的第一指针和第二指针，第一指针指示根据历史上下文生成下一个词的概率，第二指针指示根据候选知识集合生成下一个词的概率；对于扩充词表中每个候选词，至少根据所述上下文向量、所述知识融合向量预测生成该候选词的第一概率；根据第一指针和编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；根据扩充词表中各个词的预测概率，预测下一个词。可以理解的是，针对回复语句进行逐词预测的过程，就是通过解码器解码生成回复语句的过程。

在一个示例中，通过解码器进行逐词地解码生成回复语句，解码器基于一个门控的单向LSTM网络，每一步的解码过程综合了上一个解码状态，编码部分的上下文向量和知识融合向量来解码生成下一个词。

在一个示例中，所述通过指针生成网络，分别生成当前的第一指针和第二指针，包括：

在一个示例中，所述根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率，包括：

图3示出根据一个实施例的基于知识复制机制的回复语句生成过程示意图。参照图3，将历史上下文输入编码器，通过编码器得到所述历史上下文对应的上下文向量C_u，以及所述历史上下文对应的第一分词序列的编码注意力分布u^t。将候选知识集合中的各候选知识（即知识信息）输入转换器（transformer），通过转换器（transformer）得到所述候选知识集合对应的知识融合向量C_k，以及所述候选知识集合对应的第二分词序列的知识注意力分布d^t。解码器综合了上一个解码状态，编码部分的上下文向量和知识融合向量来解码生成下一个词。其中，在解码器解码过程中每一步结果得到的词表概率分布通过知识复制机制进行概率的调整，从而具备生成非词表内的知识端专有词。知识复制机制通过两个复制指针控制，即第一指针u_gen和第二指针k_gen。

其中，

为上下文向量，

为前一个词的解码状态，

为前一个词对应的词向量和所述上下文向量的组合向量，

为网络参数；

其中，

为知识融合向量，

为前一个词的解码状态，

为前一个词对应的词向量和所述知识融合向量的组合向量，

为网络参数；

本说明书实施例中，两个复制指针分别指向编码注意力分布和知识注意力分布，结合解码器得到的初始词表中的初始词概率分布

，决定是否从历史上下文或者候选知识集合进行特殊词的复制，以得到最终的扩充词表的词概率分布:

其中，

为第一指针，

为第二指针，

为初始词表中的初始词概率分布，

为编码注意力分布，

为知识注意力分布，

为参数。

本说明书实施例提供的方法，采用历史上下文中的分词和候选知识集合中的分词对初始词表进行了扩充得到扩充词表，并且基于第一指针和第二指针确定扩充词表中各候选词作为下一个词的预测概率，从而在针对多轮对话生成回复语句时能够处理词汇不足单词。

根据另一方面的实施例，还提供一种针对多轮对话生成回复语句的装置，该装置用于执行本说明书实施例提供的针对多轮对话生成回复语句的方法。图4示出根据一个实施例的针对多轮对话生成回复语句的装置的示意性框图。如图4所示，该装置400包括：

获取单元41，用于获取多轮对话中包含当前用户问句的历史上下文；

第一编码单元42，用于对所述获取单元41获取的历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布；

第二编码单元43，用于对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布；

预测单元44，用于针对回复语句进行逐词预测，其中每次预测包括：

对于扩充词表中每个候选词，至少根据所述第一编码单元42得到的上下文向量、所述第二编码单元43得到的知识融合向量预测生成该候选词的第一概率；根据第一指针和所述第一编码单元42得到的编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和所述第二编码单元43得到的知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；

根据扩充词表中各个词的预测概率，预测下一个词。

可选地，作为一个实施例，所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。

可选地，作为一个实施例，所述装置还包括：

提取单元，用于在所述第二编码单元43对候选知识集合中的各候选知识基于注意力机制进行编码之前，提取所述历史上下文中的实体词或关键词；

确定单元，用于根据所述提取单元提取的实体词或关键词，确定与所述历史上下文相关的所述候选知识集合。

可选地，作为一个实施例，所述候选知识包括：句子形式的候选知识或三元组形式的候选知识；所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。

可选地，作为一个实施例，所述第二编码单元43包括：

第一编码子单元，用于对候选知识集合中的各候选知识分别基于注意力机制进行编码，得到所述各候选知识分别对应的单条知识向量，以及各候选知识分别对应的分词序列的注意力分布；

第二编码子单元，用于针对所述第一编码子单元得到的各单条知识向量，基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量；以及根据各候选知识分别对应的分词序列的注意力分布，进行综合处理，得到所述候选知识集合对应的第二分词序列的知识注意力分布。

可选地，作为一个实施例，所述预测单元44包括：

第一生成子单元，用于通过指针生成网络，根据所述上下文向量、前一个词的解码状态、以及前一个词对应的词向量和所述上下文向量的组合向量，生成当前的第一指针；

第二生成子单元，用于通过指针生成网络，根据所述知识融合向量、前一个词的解码状态、以及前一个词对应的词向量和所述知识融合向量的组合向量，生成当前的第二指针。

可选地，作为一个实施例，所述预测单元44，具体用于当该候选词存在于所述初始词表中，且不存在于所述第一分词序列中，且不存在于所述第二分词序列中，根据所述第一概率，得到将该候选词作为下一个词的预测概率。

可选地，作为一个实施例，所述预测单元44，具体用于当该候选词存在于所述第一分词序列中，且不存在于所述初始词表中，且不存在于所述第二分词序列中，根据所述第二概率，得到将该候选词作为下一个词的预测概率。

可选地，作为一个实施例，所述预测单元44，具体用于当该候选词存在于所述第二分词序列中，且不存在于所述初始词表中，且不存在于所述第一分词序列中，根据所述第三概率，得到将该候选词作为下一个词的预测概率。

本说明书实施例提供的装置，采用历史上下文中的分词和候选知识集合中的分词对初始词表进行了扩充得到扩充词表，并且基于第一指针和第二指针确定扩充词表中各候选词作为下一个词的预测概率，从而在针对多轮对话生成回复语句时能够处理词汇不足单词。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2所描述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种针对多轮对话生成回复语句的方法，所述方法包括：

获取多轮对话中包含当前用户问句的历史上下文；

针对回复语句进行逐词预测，其中每次预测包括：

根据扩充词表中各个词的预测概率，预测下一个词。

2.如权利要求1所述的方法，其中，所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。

3.如权利要求1所述的方法，其中，所述对候选知识集合中的各候选知识基于注意力机制进行编码之前，所述方法还包括：

提取所述历史上下文中的实体词或关键词；

4.如权利要求1所述的方法，其中，所述候选知识包括：句子形式的候选知识或三元组形式的候选知识；所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。

5.如权利要求1所述的方法，其中，所述对候选知识集合中的各候选知识基于注意力机制进行编码，包括：

6.如权利要求1所述的方法，其中，所述通过指针生成网络，分别生成当前的第一指针和第二指针，包括：

7.如权利要求1所述的方法，其中，所述根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率，包括：

8.如权利要求1所述的方法，其中，所述根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率，包括：

9.如权利要求1所述的方法，其中，所述根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率，包括：

10.一种针对多轮对话生成回复语句的装置，所述装置包括：

根据扩充词表中各个词的预测概率，预测下一个词。

11.如权利要求10所述的装置，其中，所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。

12.如权利要求10所述的装置，其中，所述装置还包括：

提取单元，用于在所述第二编码单元对候选知识集合中的各候选知识基于注意力机制进行编码之前，提取所述历史上下文中的实体词或关键词；

13.如权利要求10所述的装置，其中，所述候选知识包括：句子形式的候选知识或三元组形式的候选知识；所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。

14.如权利要求10所述的装置，其中，所述第二编码单元包括：

15.如权利要求10所述的装置，其中，所述预测单元包括：

16.如权利要求10所述的装置，其中，所述预测单元，具体用于当该候选词存在于所述初始词表中，且不存在于所述第一分词序列中，且不存在于所述第二分词序列中，根据所述第一概率，得到将该候选词作为下一个词的预测概率。

17.如权利要求10所述的装置，其中，所述预测单元，具体用于当该候选词存在于所述第一分词序列中，且不存在于所述初始词表中，且不存在于所述第二分词序列中，根据所述第二概率，得到将该候选词作为下一个词的预测概率。

18.如权利要求10所述的装置，其中，所述预测单元，具体用于当该候选词存在于所述第二分词序列中，且不存在于所述初始词表中，且不存在于所述第一分词序列中，根据所述第三概率，得到将该候选词作为下一个词的预测概率。

19.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-9中任一项的所述的方法。

20.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-9中任一项的所述的方法。