CN114492464A

CN114492464A - 一种基于双向异步序列的对话生成方法及系统

Info

Publication number: CN114492464A
Application number: CN202210083371.5A
Authority: CN
Inventors: 赵亚萍; 曹钰; 陈超; 王勇超
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-01-25
Filing date: 2022-01-25
Publication date: 2022-05-13
Anticipated expiration: 2042-01-25
Also published as: CN114492464B

Abstract

本发明公开了一种基于双向异步序列的对话生成方法，包括：S1获取对话文本，识别对话文本中的关键词，并生成所述关键词对应的词向量；S2基于S1中获得的词向量，生成对话文本的语句向量；S3将S2中获得的对话文本的语句向量，与知识问答库中样本问句的语句向量计算相似度，生成包括多个候选答案的答案集以及候选答案对应的词向量；S4基于S3中生成的答案集以及对应的词向量，通过双向异步序列算法，获得初始回答文本；S5对初始回答文本进行修正，输出最终的回答文本。本发明还提供了一种实施上述方法的系统。通过本发明的方法生成的回答文本附带有更多拓展内容，通过修正算法避免了重复用词的问题，进一步提高了回答文本的质量。

Description

一种基于双向异步序列的对话生成方法及系统

技术领域

本发明涉及人工智能、神经网络与自然语言处理领域，尤其涉及一种基于双向异步序列的对话生成方法及系统。

背景技术

人机对话一直是自然语言处理的一个热门研究领域，多样性和不确定性是人机对话更“真实”的关键因素，且得益于神经网络的发展，数据驱动生成式对话模型在灵活性和交互自由度方面显示出巨大潜力。

在神经网络广泛应用之前，对话生成任务的主要方法依赖于统计方法和检索方法，不仅受限于特定领域，而且在大部分任务中需要人为设置规则进行导向。在神经网络出现后，尤其是卷积神经网络在图像处理领域广泛应用和循环神经网络在文本处理领域取得优秀成果后，将神经网络用于对话生成也成为热点研究项目。相对于传统的统计方法、检索方法和指定规则方法，利用神经网络进行对话生成所受的限制更低，可以在任意数据集上进行学习，并且可以取得充分拟合后的优良效果。即使用特定领域数据集，或者数据集包含大量噪声，神经网络模型依旧能够充数据集中抽取知识。并且随着多种深度学习框架的开发和开源，使得神经网络模型变得更加容易编写，更进一步的推动了神经网络模型用于对话生成的热潮。

但是现有由数据驱动的神经网路对话生成模型的性能并不佳，主要由3个方面的问题：

(1)模型倾向于毫无意义的安全普适的句子，例如“某物”和“我不知道”。这些回复是合理的，但是几乎不包含有价值的知识信息，其中产生的原因是解码器借助波束搜索倾向于选择生成一个具有最大估计概率的安全回复。

(2)编码器不能捕捉足够的知识信息来提供给解码器进行解码。

(3)由于人类多种语言的复杂性，概率式生成的质量通常难以达到语言语义学的要求。

专利文献CN113705255A公开了一种语料翻译方法、装置及电子设备，其中方法包括：第一神经网络模型对语料样本进行第一语料翻译处理任务，得到基于语料样本的前序词生成的第一语料翻译结果；第二神经网络模型对语料样本进行第二语料翻译处理任务，得到基于语料样本的上下文词集合生成的第二语料翻译结果，最后基于两个翻译结果生成翻译语句。该方法对同一句话进行翻译，通过不同的神经网络进行识别后，通过类似于完型填空的方式对翻译语句进行填充。该方法可以保证输出的翻译语句内容更加丰富，但是用于两个网络互不关联，导致生成的第一语料翻译结果与第二语料翻译结果之间的关联度不高，可能会出现两个内容毫无关联的情况，使得整个翻译语句变得毫无意义。

专利文献CN111782788A公开了一种面向开放域对话系统的情感回复自用生成方法，包括基于词嵌入表和VAD情感词典对语料库中每个样本的输入和回复语句进行预处理得到输入与回复的词嵌入序列和情感嵌入序列；将词嵌入和情感嵌入拼接对词嵌入进行扩充并向模型引入回复的情感分布信息，将拼接序列向模型引入回复的情感分布信息，将拼接序列在编码器中编码得到输入和回复包含情感信息的语义表示向量；最后通过语义表示向量预测条件先验分布和后验分布的近似并采样潜变量，通过潜变量重构回复和回复的情感分布。该方法通过采样概率生成多个回复，基于模型与VAD字典，生成具有情感的回复语句。该方法只能针对问题语句进行识别输入对应的回复语句，输出的回复语句可能会因为采样结果过于相似导致输出语句出现重复用词的情况。

发明内容

为了解决上述问题，本发明提供了一种基于双向异步序列的对话生成方法，该方法通过反向解码器和正向编码器生成具有一定关联度的前半部回答文本和后半部回答文本，从而避免出现无意义的语句；更加一步的通过惩罚权重计算方法来裁剪回答文本中无意义的重复词，从而提高回答文本的质量。

一种基于双向异步序列的对话生成方法，包括：

S1获取对话文本，识别对话文本中的关键词，并生成所述关键词对应的词向量；

S2基于S1中获得的词向量，生成对话文本的语句向量；

S3将S2中获得的对话文本的语句向量，与知识问答库中样本问句的语句向量计算相似度，生成包括多个候选答案的答案集以及候选答案对应的词向量，其中候选答案数量由人为设定，数量越高则最终输出内容的相关信息更丰富，数量越少则最终输出内容更加符合对话文本的语义；

S4基于S3获得的答案集中候选答案以及对应的词向量，通过双向异步序列算法，获得初始回答文本；

S5对初始回答文本进行修正，输出最终的回答文本。

优选的，所述S2中具体为：

S2.1将关键词的词向量转换为词向量矩阵；

S2.2通过Bi-LSTM网络生成每个关键词对应的隐藏向量；

S2.3将所有关键词的隐藏向量链接起来，获得对应对话文本的语句向量。

优选的，所述S3中知识问答库是输入样本问句与对应的候选答案三元组，通过双层Bi-LSTM网络进行训练获得。

通过同类型的神经网络进行识别与训练，使得最终输出结果与预训练内容更加贴合。

优选的，所述S4双向异步序列算法是基于反向解码器与正向解码器对答案集中候选答案以及对应的词向量进行解码。

优选的，所述反向解码器与正向解码器对答案集中候选答案以及对应的词向量进行解码，具体为：

S4.1从所述答案集中选取相似度最高的候选答案作为起始词；

S4.2基于起始词与对应的词向量，通过反向解码器倒序生成前半部回答文本；

S4.3对前半部回答文本进行翻转处理后，识别获得前半部回答文本的语句向量；

S4.4基于S4.3获得的语句向量，再次与知识问答库中样本问句的语句向量计算相似度，获得对应的答案集；

S4.5基于前半部回答文本的语义信息与S4.4获得的答案集中候选答案的词向量，通过正向解码器生成后半部回答文本；

S4.6将前半部回答文本与后半部回答文本的语句向量链接，获得初始回答文本。

基于前半部回答文本的语义信息，生成的后半部回答文本与前半部回答文本之间的关联度更高，结合生成的初始回答文本的有效内容更加丰富。

优选的，所述S5中对初始回答文本进行修正是通过检测单词或\和短句的词向量出现次数，经过惩罚权重计算对文本进行修正，通过裁剪初始回答文本中无意义的内容，从而提高了输出结果的质量。

优选的，所述惩罚权重计算，具体为：

其中，N为检测到的重复区间的长度，s_t为时刻t对应的生成的回复，x_i为已生成的前置词向量，p(s_t|x_i)为s_t在已生成的x_i条件下的生成概率，对重复出现3次以上的单词或\和短句进行输出裁剪处理。

本发明还提供了一种基于上述方法的系统，该系统只需输入对话问句，便可以输出带有拓展知识信息的高质量回复文本。

一种实施上述对话生成方法的系统，包括：

输入模块，用于获取对话文本；

知识问答模块，基于获取的对话文本，生成对应的答案集；

对话生成模块，基于对话文本的语义信息，与对应的答案集生成初始回答文本；

修正模块，对初始回答文本进行重复词的裁剪修正；

输出模块，用于输出完成修正后的回答文本。

与现有技术相比，本发明的有益效果：

(1)本发明以关键词为核心，采用正反两方向异步生成的方式来生成回复文本，不同于传统的Seq2Seq依序生成，从而避免出现无效内容的出现。

(2)本发明在对话生成方法中设有重复检测惩罚权重计算，解决了词语重复出现的问题，从而提高了生成语句的语法质量。

附图说明

图1为本发明提供的对话生成方法的流程示意图；

图2为本发明提供的实施对话生成方法的系统结构示意图。

具体实施方式

构建知识问答库：首先准备一组样本问句和对应的候选答案知识三元组，通过双层Bi-LSTM网络来学习样本问句的表示方式：第一层获取样本问句关键词的词向量，通过简单的词向量矩阵链接获得对应的语句向量

第二层在

基础上计算第二层隐藏表示形式

在时间步长t处的隐藏状态γ_t更新为：

o_t＝σ(W_o[γ_t-1,q_t]+b_o)

γ_t＝o_t*tanh(C_t)

其中，γ_t-1为前一时刻的隐藏状态，q_t为当前时刻的输入词，C_t为当前时刻的神经元状态，b_o为常数项。

然后链接每一个

和

得到：

然后，将

和

经过一个最大池化层处理得到

和

得到最终输入问题文本的语句向量：

最终得到的输入问题语句的语句向量表示：

h＝[h₁,h₂,…,h_n]

通过Word2vec模型对候选答案序列进行处理，得到隐藏层中的权重向量矩阵E^ω，使用E^ω将候选答案序列转换为词向量

其中m是候选答案的长度。

基于候选答案序列的词向量

进行形式上的统一化处理以便后续模型训练，计算平均嵌入作为候选答案的词向量：

使用TransH模型对知识库全体关系进行预训练获得关系向量e_i，目标函数L为：

其中，r为每一个关系向量，h,t分别为其关联的头实体和尾实体，w_r为训练得到的超平面参数，γ为边际超参数，h_⊥,t_⊥为h,t在超平面上的投影。

将关系向量e_i输入双层Bi-LSTM网络的关系适配器得到中间向量，经过BERT层进去特征提取，通过池化层计算指定维度P的关系级向量r^p：

r^p＝MAX_Pooling(BERT(Adapter(e_i)),p)

重复上述过程，得到每个候选答案的最终词向量：

a＝a^ω+r^p

使用多层感知器计算样本问句的语句向量h_i和候选答案的词向量a_j之间的语义相似性：

R(h_i,a_j)＝MLP([h_i,a_j])

使用铰链损失函数进行训练，将关系正负样本进行区分，目标函数L_h,a为：

L_h,a＝∑max(0,γ-cos(h,a⁺)+cos(h,a^-))

其中，γ为边际超参数，a⁺为正样本，a^-为负样本，cos(h,a)为余弦相似度。

最后整合所有样本问句与对应候选答案的语义关系后，完成知识问答库构建。

如图1所示，一种基于双向异步序列的对话生成方法：

S2基于S1中获得的词向量，生成对话文本的语句向量，具体为：

S2.1将关键词的词向量转换为词向量矩阵；

S2.2通过Bi-LSTM网络生成每个关键词对应的隐藏向量；

S2.3将所有关键词的隐藏向量链接起来，获得对应对话文本的语句向量；

通过以下方式更新对话文本的隐藏状态

将

和

链接起来，得到最终的输入对话文本的语句向量：

S3将S2中获得的对话文本的语句向量，与知识问答库中样本问句的语句向量计算相似度，生成包括多个候选答案的答案集以及候选答案对应的词向量，其中选取相似度最高的前K个候选答案构成答案集：

其中a_j为第j个相关候选知识的词向量，h_i ^′为对话文本的语句向量，c^ad为答案集内候选答案的知识相关性向量。

S4.1从所述答案集中选取相似度最高的候选答案作为起始词；

S4.2基于起始词与对应的词向量，通过反向解码器倒序生成前半部回答文本：

更新时间步t的隐藏状态

其中e^bw为起始词的词向量，C_t-1为前一个时间步的上下文向量。

通过计算回复前半部分序列的概率：

其中r_k为起始词，倒叙生成起始前的前半部回答文本序列部分(r_k-1,r_k-2,…,r₁)。

S4.4基于S4.3获得的语句向量，再次与知识问答库中样本问句的语句向量计算相似度，获得对应的答案集：

其中选取相似度最高的前K个候选答案构成答案集：

其中a_j为第j个相关候选知识的词向量，h_i″为前半部回答文本的语句向量，c^ab为答案集内候选答案的知识相关性向量；

S4.5基于前半部回答文本的语义信息与S4.4获得的答案集中候选答案的词向量，通过正向解码器生成后半部回答文本：

筛选出相似度最高的候选答案词向量作为起始词向量e^fw；

更新时间步t的隐藏状态

其中C_t-1为前一个时间步的上下文向量。

通过生成序列的概率计算：

生成后半部的回答文本序列。

S5对初始回答文本进行修正，输出最终的回答文本：

在生成过程中如果检测到单词或短语的词向量表达与它之前的3个以内的已生成部分有大于两次的重复现象，则对其赋予一个惩罚权重，以降低其生成的可能性。惩罚权重的计算为：

其中，N为检测到的重复区间的长度，s_t为时刻t对应的生成的回复内容，x_i为已生成的前置词向量，p(s_t|x_i)为s_t在已生成的x_i条件下的生成概率。

对生成结果进行一次检测，并对依然存在3次以上的重复现象进行输出裁剪处理，以最大程度保证最终输出结果的质量。

如图2所示，一种实施上述对话生成方法的系统，包括：

输入模块，用于获取对话文本；

知识问答模块，基于获取的对话文本，生成对应的答案集；

修正模块，对初始回答文本进行重复词的裁剪修正；

输出模块，用于输出完成修正后的回答文本。

本发明基于Reddit对话数据集上进行测试，为了客观地评价该方算法的性能，本发明在所选处的测试集中，使用了自动评估和人工评价这两种评价标准的加权求和结果对生成效果进行评价，其中自动评估指标包括：BLEU、困惑度和实体得分。

人工评价指标包括语言层面和知识层面，其中语言层面的得分标准为：

生成回复语句-不通顺-语法不正确，得分为0分；

生成回复语句-不通顺-语法正确，得分为1分；

生成回复语句-通顺-语法存在歧义，得分为2分；

生成回复语句-通顺-语法完成正确，得分为3分。

统计在语言层面评价结果的均值作为语言层面的最终得分，得分大于1分表示生成结果在语言层面效果尚可，得分大于2分表示生成结果在语言层面较好。

知识层面的得分标准为：

生成回复语句-完全没有引入相关拓展内容，得分为0分；

生成回复语句-引入部分拓展内容，得分为1分；

生成回复语句-引入了所有相关拓展内容-相关性低，得分为2分；

生成回复语句-引入了所有相关拓展内容-相关性高，得分为3分。

统计在知识层面评价结果的均值作为知识层面的最终得分，得分大于1分表示生成结果成功引入了拓展内容，得分大于2分表示生成结果成功且准确地引入了所有相关拓展内容。

最终测试结果如下表所示：

通过自动评估结果可知，本方法生成的对话内容中，重复词问题已经得到很好的解决，即BLEU值小于1；同时本发明提供的对话生成系统，相较于同类模型，其困惑度只有38.77，生成对话的质量要优于现有模型；通过人工评价结果可知，本方法生成的对话内容在语言层面或者知识层面的得分都比较高，且均值大于2，证明了本方法相较于传统的对话生成方法具有一定的优势。

Claims

1.一种基于双向异步序列的对话生成方法，其特征在于，包括：

S2基于S1中获得的词向量，生成对话文本的语句向量；

S3将S2中获得的对话文本的语句向量，与知识问答库中样本问句的语句向量计算相似度，生成包括多个候选答案的答案集以及候选答案对应的词向量；

S5对初始回答文本进行修正，输出最终的回答文本。

2.根据权利要求1所述的对话生成方法，其特征在于，所述S2中具体为：

S2.1将关键词的词向量转换为词向量矩阵；

S2.2通过Bi-LSTM网络生成每个关键词对应的隐藏向量；

3.根据权利要求1所述的对话生成方法，其特征在于，所述S3中知识问答库是输入样本问句与对应的候选答案三元组，通过双层Bi-LSTM网络进行训练获得。

4.根据权利要求1所述的对话生成方法，其特征在于，所述S4双向异步序列算法是基于反向解码器与正向解码器对答案集中候选答案以及对应的词向量进行解码。

5.根据权利要求4所述的对话生成方法，其特征在于，所述反向解码器与正向解码器对答案集中候选答案以及对应的词向量进行解码，具体为：

S4.1从所述答案集中选取相似度最高的候选答案作为起始词；

6.根据权要求1所述的对话生成方法，其特征在在于，所述S5中对初始回答文本进行修正是通过检测单词或\和短句的词向量出现次数，经过惩罚权重计算对文本进行修正。

7.根据权利要求6所述的对话生成方法，其特征在于，所述惩罚权重计算，具体为：

8.一种实施权利要求1-7任一所述的对话生成方法的系统，其特征在于，包括：

输入模块，用于获取对话文本；

知识问答模块，基于获取的对话文本，生成对应的答案集；

修正模块，对初始回答文本进行重复词的裁剪修正；

输出模块，用于输出完成修正后的回答文本。