CN107632987B

CN107632987B - 一种对话生成方法及装置

Info

Publication number: CN107632987B
Application number: CN201610567504.0A
Authority: CN
Inventors: 舒悦; 林芬; 路彦雄
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-07-19
Filing date: 2016-07-19
Publication date: 2018-12-07
Anticipated expiration: 2036-07-19
Also published as: US10740564B2; WO2018014835A1; CN107632987A; US20180285348A1

Abstract

本发明实施例公开了一种对话生成方法，包括：将第K轮询问句中的每个字转化为第一词向量，并根据第一词向量计算每个字的正向隐层向量和反向隐层向量；获取第K轮询问句的内容主题，并将内容主题转化为第二词向量；根据第二词向量、第K轮询问句中最后一个字的正向隐层向量、针对第K‑1轮询问句输出的第K‑1轮答复句中最后一个字的隐层向量、以及针对第K‑1轮询问句输出的第K‑1轮答复句的初始隐层向量，确定针对第K轮询问句输出的初始隐层向量；根据第K轮询问句中每个字的正向隐层向量和反向隐层向量、以及针对第K轮询问句输出的初始隐层向量，生成针对第K轮询问句的答复句，实施本发明实施例，可以提高生成对话的精确性。

Description

一种对话生成方法及装置

技术领域

本发明涉及语音处理领域，尤其涉及一种对话生成方法及装置。

背景技术

近年来，人机交互方式正发生着日新月异的变化，对话机器人正作为一种新的交互模式吸引着越来越多人的关注。然而，如何在多轮对话中提高自动生成的回复语句的相关性，如何降低高频答案的生成概率，生成高质量的对话，一直成为自然语言处理领域研究的重点，其中，对话系统是自然语言处理的一个重要应用方向。

在现有技术方案中，对话系统可以包括基于规则的对话系统、基于搜索的对话系统或生成式对话系统。其中，基于规则的对话系统结构简单、高准确度，但泛化能力较差；基于搜索的对话系统，要求语料库的质量以及数量比较高，否则容易出现低召回等问题；生成式对话系统可以较好的构建语言模型，对任意输入语句，均可生成对应的答句，生成式对话系统建模方式可以分为单轮建模与多轮建模两类，其中，单轮生成式对话模型仅对问答对进行建模，而在处理多轮对话时将上下文直接拼接成一句长问句，但当对话轮数较多且上下文较长时，容易出现信息压缩混乱，导致生成答句质量较低等问题，多轮生成式对话模型将多轮问答传递过程进行建模，但是该模型容易生成高频答案，精确度低。

发明内容

本发明实施例提供一种对话生成方法及装置。可以解决生成对话精确度低的技术问题。

本发明第一方面提供了一种对话生成方法，包括：

将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数；

获取所述第K轮询问句的内容主题，并将所述内容主题转化为第二词向量；

根据所述第二词向量、所述第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对所述第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对所述第K轮询问句输出的初始隐层向量；

根据所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量、以及所述针对所述第K轮询问句输出的初始隐层向量，生成针对所述第K轮询问句的答复句。

相应地，本发明第二方面提供了一种对话生成装置，包括：

隐层计算模块，用于将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数；

主题确定模块，用于获取所述第K轮询问句的内容主题，并将所述内容主题转化为第二词向量；

向量计算模块，用于根据所述第二词向量、所述第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对所述第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对所述第K轮询问句输出的初始隐层向量；

答复输出模块，用于根据所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量、以及所述针对所述第K轮询问句输出的初始隐层向量，生成针对所述第K轮询问句的答复句。

相应地，本发明第三方面提供了一种对话生成装置，所述装置包括接口电路、存储器以及处理器，其中，存储器中存储一组程序代码，且处理器用于调用存储器中存储的程序代码，用于执行以下操作：

实施本发明实施例，首先将第K轮询问句中的每个字转化为第一词向量，并根据第一词向量计算每个字的正向隐层向量和反向隐层向量；然后获取第K轮询问句的内容主题，并将内容主题转化为第二词向量；其次根据第二词向量、第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对第K轮询问句输出的初始隐层向量；最后根据第K轮询问句中每个字的正向隐层向量和反向隐层向量、以及针对第K轮询问句输出的初始隐层向量，生成针对第K轮询问句的答复句，通过在生成对话过程中加入主题内容，有效的抑制了跨主题通用高频答复句的生成，提高生成对话的精确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提出的一种对话生成方法的流程示意图；

图2是本发明提出的一种对话生成系统的架构示意图；

图3是本发明实施例提供的一种对话生成装置的结构示意图；

图4是本发明实施例提供的另一种对话生成装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，图1是本发明第一实施例提供的一种对话生成方法的流程示意图。如图所述，本发明实施例中的方法包括：

S101，将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数。

具体实现中，可以构建多轮对话模型，如图2所示，可以将每一轮的询问句以及相应的答复句嵌入到单轮对话模型中，多轮对话模型可以看作单轮对话模型的展开，在单轮对话模型中，可以分为encoder编码层、intention意图层以及decoder解码层。

在encoder编码层，可以首先获取用户输入的第K轮询问句，并将第K轮询问句以字进行分词，使用one-hot独热编码表示询问中的每个字的词向量，然后通过embedding嵌入空间矩阵将每个字的词向量转化成一个预定维数的向量其中，one-hot独热编码的维数为预设字典的大小，每一维对应字典中的一个字，仅在对应位为1，其他都为0，然后从前向后扫描第K轮询问句，逐次将每个字的词向量输入到正向数据处理网络GRU，记录输入每个字的正向隐层向量并且从后向前扫描第K轮询问句，逐次将每个字的词向量输入到反向数据处理网络GRU，记录输入每个字后的反向隐层向量

其中，可以根据所述第K轮询问句中目标字的第一词向量和所述目标字的上一个字的正向隐层向量，计算所述目标字的正向隐层向量，目标字的正向隐层向量可以表示为根据所述第K轮询问句中目标字的第一词向量和所述目标字的下一个字的反向隐层向量，计算所述目标字的反向隐层向量，目标字的反向隐层向量可以表示为

例如，第K轮询问句为“你看过电影吗？”，首先可以对“你看过电影吗”进行正向编码，将询问中的每个字转化为一个词向量，分别为然后根据第一个字“你”的词向量确定第一个字“你”的正向隐层向量根据第二字“看”的词向量和第一个字“你”的正向隐层向量确定第一个字“看”的正向隐层向量根据第三个字“过”的词向量和第二个字“看”的正向隐层向量确定第三个字“过”的正向隐层向量逐次类推分别计算得到第四个字“电”的正向隐层向量第五个字“影”的正向隐层向量第六个字“吗”的正向隐层向量

另外，可以首先可以对“你看过电影吗”进行反向编码，将询问中的每个字转化为一个词向量，分别为然后根据第六个字“吗”的词向量确定第六个字“吗”的反向隐层向量根据第五字“影”的词向量和第六个字“吗”的反向隐层向量确定第五个字“影”的反向隐层向量根据第四个字“电”的词向量和第五个字“影”的反向隐层向量确定第四个字“电”的正向隐层向量逐次类推分别计算得到第三个字“过”的反向隐层向量第二个字“看”的正向隐层向量第一个字“我”的反向隐层向量

S102，获取所述第K轮询问句的内容主题，并将所述内容主题转化为第二词向量。

具体实现中，可以使用主题模型Biterm算法对多个词中的每个词进行训练，确定每个词作为内容主题的概率分布，然后将第K轮询问句与所述多个词进行匹配，确定第K轮询问句中概率最大的内容主题，该概率最大的内容主题可以使用one-hot独热编码表示，并构建该内容主题的embedding嵌入空间矩阵，从而得到该内容主题的词向量E^(k)。

S103，根据所述第二词向量、所述第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对所述第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对所述第K轮询问句输出的初始隐层向量。

具体实现中，如图2所示，在intention意图层，可以将第K轮中encoder编码层中输出的询问句中最后一个字的正向隐层向量、内容主题的词向量E^(k)、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对第K-1轮询问句输出的第K-1轮答复句的初始隐层向量输入到simple-RNN神经网络中，计算得到针对第K轮询问句输出的初始隐层向量，该初始隐层向量可以表示为其中，W^(in,in)、W^(in,de)、W^(in,en)以及W^(in_,e)分别为simple-RNN神经网络中的参数，σ用于将h^(in,k)初始隐层向量压缩在[0,1]区间，从而增加模型的非线性表征能力。

需要说明的是，在计算初始隐层向量的过程中，由于将第K轮询问句中的内容主题加入到intention意图层进行计算，相当于在运算过程中加入了监督信息，从而在生成的答复句可以被限制在该内容主题的范围内，进而减少部分通用高频答复句的生成概率。

S104，根据所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量、以及所述针对所述第K轮询问句输出的初始隐层向量，生成针对所述第K轮询问句的答复句。

具体实现中，首先对所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量进行拼接得到所述第K轮询问句中每个字的隐层向量，其中，每个字的隐层向量然后根据所述针对所述第K轮询问句输出的初始隐层向量以及预设的标识字符的词向量，确定针对所述第K轮询问句输出的第二隐层向量，进而根据所述第二隐层向量确定所述针对所述第K轮询问句输出的第一个答复字；根据所述第二隐层向量以及所述第K轮询问句中每个字的隐层向量，计算所述第K轮询问句中每个字对生成第二个答复字的贡献度；根据所述第K轮询问句中每个字对生成第二个答复字的贡献度、所述第二隐层向量以及所述第一个答复字的词向量，计算所述第三隐层向量；根据所述第三隐层向量，生成针对所述第K轮询问句的第二个答复字，依次类推生成针对所述第K轮询问句的答复句。

需要说明的是，使用双向结构的隐状态作为attention注意力的输入，可以更加精确的描述上下文中的重点信息，有效降低单向结构重点信息靠后的问题，由于双向结构的隐层状态在一定程度上可以增加每个字的全局信息，因此避免了单向结构越靠后的字所携带的信息越多的问题，使得生成的答复句相关性更强。

进一步的，可以根据所述第二隐层向量以及所述第K轮询问句中每个字的隐层向量，计算所述第K轮询问句中每个字对生成所述第二个答复字的权重；根据所述第K轮询问句中每个字对生成所述第二个答复字的权重，计算所述第K轮询问句中每个字的隐层向量的加权和，并将所述加权和作为所述第K轮询问句中每个字对生成所述第二个答复字的贡献度。

进一步的，可以根据所述第三隐层向量，计算在预设字典中的每个字的概率分布；选择在所述预设字典中概率最大的字作为所述第二个答复字进行输出，进而依次输出第三个答复字、第四答复字、第五答复字等等，每次可以选择50个字逐字生成答复句，并选择概率最高的前5句话。

例如：可以通过答复句中某字的上一个字的隐层向量和询问句中的每个字的隐层向量，计算询问句中每个字对生成该字的重要度g_jt，其中，为该字的上一个字的隐层向量，为询问句中的每个字的隐层向量，W^(de,de)、W^(de,en)分别为神经网络中的参数，然后对重要度g_jt进行归一化处理，计算得到第K轮询问句中每个字的隐层向量的权重最后计算第K轮询问句中每个字的隐层向量的加权和从而根据逐字生成该答复字的隐层向量，其中，为该字的上一个字的词向量，为该字的上一个字的隐层向量。

针对上述发明实施例提出的一种对话生成方法，以下通过详细的例子说明该方法的具体实施步骤：

在encoder编码层，首先将询问句“你看过电影吗”按字分词为“你”、“看”“、过”、“电”、“影”、“吗”，从“你”到“我”进行正向编码，形成6个字的正向隐层向量向量即attention注意力中从左向右的向量，然后再从“吗”到“你”进行反向编码，形成6个字的反向隐层向量即attention注意力中从右向左的向量，最后将正向隐层向量和反向隐层向量进行串联拼接，形成某个字的隐层向量，例如，询问句中“你”的隐层向量为“你”的正向隐层向量，为“你”的反向隐层向量，并且，将询问句中的最后一个字“吗”的正向隐层向量输入到intention意图层。

在intention意图层，首先通过计算得到询问句“你看过电影吗”的内容主题为“电影”，并对内容主题“电影”进行编码得到主题向量，然后将上一轮的intention意图层的输出向量，上一轮的decoder解码层的输出向量，本轮encoder编码层的输出向量以及主题向量一并输入到intention意图层，通过神经网络运算输出初始隐层向量，该初始隐层向量可以用于decoder解码层确定答句的第一个字。

在decoder解码层，可看做encoder编码层的逆向过程，可以将词向量和隐层向量解码为自然语言，可以根据intention意图层输出的初始隐层向量和attention注意力层中询问句中每个字的词向量，生成答句“我喜欢欧美电影”。假设一个10000个字的字典，decoder每次解码会生成该1万个字的概率分布，然后每次选取概率最大的一个字进行输出。具体过程如下：首先intention的输出初始隐层向量，并将该初始隐层向量以及第一个字符是标识字符“_EOS_”的词向量输入到decoder解码层，通过神经网络更新隐层向量得到第二隐层向量，第二隐层向量通过softmax回归算法生成1万个字的概率分布，其中“我”字的概率最大，因此输出答复字“我”，然后将第二隐层向量和答复字“我”的词向量作为输入，生成第三隐层向量，根据第三隐层向量计算下一个字的概率分布，取概率最大的“喜”字作为输出。重复以上过程，直到输出特殊符号_EOS_时结束全部过程，则可以生成答复句“我喜欢欧美电影_EOS_”。

在本发明实施例中，首先将第K轮询问句中的每个字转化为第一词向量，并根据第一词向量计算每个字的正向隐层向量和反向隐层向量；然后获取第K轮询问句的内容主题，并将内容主题转化为第二词向量；其次根据第二词向量、第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对第K轮询问句输出的初始隐层向量；最后根据第K轮询问句中每个字的正向隐层向量和反向隐层向量、以及针对第K轮询问句输出的初始隐层向量，生成针对第K轮询问句的答复句，通过在生成对话过程中加入主题内容，有效的抑制了跨主题通用高频答复句的生成，提高生成对话的精确性。

请参考图3，图3是本发明实施例提供的一种对话生成装置的结构示意图。如图所述，本发明实施例中的装置包括：

隐层计算模块301，用于将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数。

主题确定模块302，用于获取所述第K轮询问句的内容主题，并将所述内容主题转化为第二词向量。

向量计算模块303，用于根据所述第二词向量、所述第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对所述第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对所述第K轮询问句输出的初始隐层向量。

具体实现中，如图2所示，在intention意图层，可以将第K轮中encoder编码层中输出的询问句中最后一个字的正向隐层向量、内容主题的词向量E^(k)、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的隐层向量、以及针对第K-1轮询问句输出的第K-1轮答复句的初始隐层向量输入到simple-RNN神经网络中，计算得到针对第K轮询问句输出的初始隐层向量，该初始隐层向量可以表示为其中，W^(in,in)、W^(in,de)、W^(in,en)以及W^(in_,e)分别为simple-RNN神经网络中的参数，σ用于将h^(in_,k)初始隐层向量压缩在[0,1]区间，从而增加模型的非线性表征能力。

答复输出模块304，用于根据所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量、以及所述针对所述第K轮询问句输出的初始隐层向量，生成针对所述第K轮询问句的答复句。

针对上述发明实施例提出的一种对话生成装置，以下通过详细的例子说明该方法的具体实施步骤：

请参考图4，图4是本发明实施例提供的一种对话生成装置的结构示意图。如图所示，该装置可以包括：至少一个处理器401，例如CPU，至少一个接口电路402，至少一个存储器403，至少一个总线404。其中，通信总线404用于实现这些组件之间的连接通信。其中，本发明实施例中的接口电路402可以是有线发送端口，也可以为无线设备，例如包括天线装置，用于与其他节点设备进行信令或数据的通信。存储器403可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器403可选的还可以是至少一个位于远离前述处理器401的存储装置。存储器403中存储一组程序代码，且处理器401用于调用存储器中存储的程序代码，用于执行以下操作：

其中，处理器401用于执行如下操作步骤：

根据所述第K轮询问句中目标字的第一词向量和所述目标字的上一个字的正向隐层向量，计算所述目标字的正向隐层向量；或

根据所述第K轮询问句中目标字的第一词向量和所述目标字的下一个字的反向隐层向量，计算所述目标字的反向隐层向量。

其中，处理器401用于执行如下操作步骤：

对所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量进行拼接得到所述第K轮询问句中每个字的隐层向量；

根据所述针对所述第K轮询问句输出的初始隐层向量以及所述第K轮询问句中每个字的隐层向量，生成针对所述第K轮询问句的答复句。

其中，处理器401用于执行如下操作步骤：

根据所述针对所述第K轮询问句输出的初始隐层向量以及预设的标识字符的词向量，确定针对所述第K轮询问句输出的第二隐层向量，进而根据所述第二隐层向量确定所述针对所述第K轮询问句输出的第一个答复字；

根据所述第二隐层向量以及所述第K轮询问句中每个字的隐层向量，计算所述第K轮询问句中每个字对生成第二个答复字的贡献度；

根据所述第K轮询问句中每个字对生成第二个答复字的贡献度、所述第二隐层向量以及所述第一个答复字的词向量，计算所述第三隐层向量；

根据所述第三隐层向量，生成针对所述第K轮询问句的第二个答复字，依次类推生成针对所述第K轮询问句的答复句。

其中，处理器401用于执行如下操作步骤：

根据所述第二隐层向量以及所述第K轮询问句中每个字的隐层向量，计算所述第K轮询问句中每个字对生成所述第二个答复字的权重；

根据所述第K轮询问句中每个字对生成所述第二个答复字的权重，计算所述第K轮询问句中每个字的隐层向量的加权和，并将所述加权和作为所述第K轮询问句中每个字对生成所述第二个答复字的贡献度。

其中，处理器401用于执行如下操作步骤：

根据所述第三隐层向量，计算在预设字典中的每个字的概率分布；

选择在所述预设字典中概率最大的字作为所述第二个答复字进行输出。

需要说明的是，对于前述的各个方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某一些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其他实施例的相关描述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(英文：Read-OKly Memory，简称：ROM)、随机存取器(英文：RaKdom Access Memory，简称：RAM)、磁盘或光盘等。

以上对本发明实施例所提供的内容下载方法及相关设备、系统进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种对话生成方法，其特征在于，所述方法包括：

将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数，所述正向隐层向量由所述每个字的第一词向量输入到正向数据处理网络得到，所述反向隐层向量由所述每个字的第一词向量输入到反向数据处理网络得到；

根据所述第二词向量、所述第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的正向隐层向量和反向隐层向量、以及针对所述第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对所述第K轮询问句输出的初始隐层向量；

2.如权利要求1所述的方法，其特征在于，所述根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量包括：

3.如权利要求1所述的方法，其特征在于，所述根据所述第K轮询问句中每个字的所述正向隐层向量和所述反向隐层向量、以及所述针对所述第K轮询问句输出的初始隐层向量，生成针对所述第K轮询问句的答复句包括：

4.如权利要求3所述的方法，其特征在于，所述根据所述针对所述第K轮询问句输出的初始隐层向量以及所述第K轮询问句中每个字的隐层向量，生成针对所述第K轮询问句的答复句包括：

根据所述第K轮询问句中每个字对生成第二个答复字的贡献度、所述第二隐层向量以及所述第一个答复字的词向量，计算第三隐层向量；

5.如权利要求4所述的方法，其特征在于，所述根据所述第二隐层向量以及所述第K轮询问句中每个字的隐层向量，计算所述第K轮询问句中每个字对生成第二个答复字的贡献度包括：

6.如权利要求4或5所述的方法，其特征在于，所述根据所述第三隐层向量，生成针对所述第K轮询问句的第二个答复字包括：

7.一种对话生成装置，其特征在于，所述装置包括：

隐层计算模块，用于将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数，所述正向隐层向量由所述每个字的第一词向量输入到正向数据处理网络得到，所述反向隐层向量由所述每个字的第一词向量输入到反向数据处理网络得到；

向量计算模块，用于根据所述第二词向量、所述第K轮询问句中最后一个字的正向隐层向量、针对第K-1轮询问句输出的第K-1轮答复句中最后一个字的正向隐层向量和反向隐层向量、以及针对所述第K-1轮询问句输出的第K-1轮答复句的初始隐层向量，确定针对所述第K轮询问句输出的初始隐层向量；

8.如权利要求7所述的装置，其特征在于，所述隐层计算模块具体用于：

9.如权利要求7所述的装置，其特征在于，所述答复输出模块具体用于：

10.如权利要求9所述的装置，其特征在于，所述答复输出模块具体用于：

11.如权利要求10所述的装置，其特征在于，所述答复输出模块具体用于：

12.如权利要求10或11所述的装置，其特征在于，所述答复输出模块具体用于：

13.一种对话生成装置，其特征在于，所述装置包括接口电路、存储器以及处理器，其中，存储器中存储一组程序代码，且处理器用于调用存储器中存储的程序代码，用于执行以下操作：

将第K轮询问句中的每个字转化为第一词向量，并根据所述第一词向量计算所述每个字的正向隐层向量和反向隐层向量，K为大于等于2的正整数,所述正向隐层向量由所述每个字的第一词向量输入到正向数据处理网络得到，所述反向隐层向量由所述每个字的第一词向量输入到反向数据处理网络得到；