CN110737764A

CN110737764A - 一种个性化对话内容生成方法

Info

Publication number: CN110737764A
Application number: CN201911015873.9A
Authority: CN
Inventors: 郭斌; 王豪; 於志文; 王柱; 梁韵基; 郝少阳
Original assignee: Northwest University of Technology
Current assignee: Northwest University of Technology
Priority date: 2019-10-24
Filing date: 2019-10-24
Publication date: 2020-01-31
Anticipated expiration: 2039-10-24
Also published as: US20220309348A1; WO2021077974A1; CN110737764B

Abstract

本发明一种个性化对话内容生成方法，包括：多轮对话内容生成模型，个性化多轮对话内容生成模型，多样化的个性化对话内容生成模型；利用Transformer模型根据上下文信息得到序列中每个单词高效的向量表示，通过学习自然语言之间的序列依赖关系，可以根据前文自动预测生成后文内容，实现根据对话上下文生成相应回复内容，同时加入多种优化算法，可以降低通用性回复的生成概率，从而提高生成对话内容的多样性。

Description

一种个性化对话内容生成方法

技术领域

本发明涉及基于深度学习领域，尤其涉及一种个性化对话内容生成方法。

背景技术

自然语言处理是人工智能研究中一个非常重要的分支，研究能实现人与计算机之间利用自然语言进行有效通信的各种理论和方法。文本生成，即自然语言生成，是自然语言处理领域一个非常重要的研究方向，可以利用各种不同类型的信息，如文本、结构化信息、图像等，自动生成流畅、通顺、语义清晰的高质量自然语言文本。对话系统是文本生成和人机交互领域一个非常重要的研究方向，形式多样的对话系统正在蓬勃发展。而社交聊天机器人，即能够与人类进行共情对话的人机对话系统的研究，是人工智能领域持续时间最长的研究目标之一。

近几年，基于深度神经网络进行的对话系统的研究已经取得了重大进展，在日常生活中得到了越来越多的应用，例如许多人所熟知的微软小冰、苹果Siri等。对话系统研究中使用的深度神经网络模型一般有下面几种：循环神经网络(Recurrent Neural Network,RNN)，通过天然的序列结构捕捉文本序列中的信息；对抗生成网络(GenerativeAdversarial Network，GAN)和强化学习(Reinforcement learning)，通过模仿人类学习方式学习自然语言中的隐藏规律；变分自编码器(Variational Autoencoder，VAE)，通过隐藏变量分布为模型引入变化性，提高生成内容多样性，但在对话过程中的多样性个性化的准确度上还存在缺陷。

发明内容

针对以上缺陷，本发明提供一种生成对话内容的多样性个性化对话内容生成方法。本发明的技术方案为：

一种个性化对话内容生成方法，包括：多轮对话内容生成模型，所述多轮对话内容生成模型考虑历史对话内容的对话生成模型；个性化多轮对话内容生成模型，所述个性化多轮对话内容生成模型，为考虑历史对话内容以及个性化特征的对话生成模型。

进一步地，一种个性化对话内容生成方法，其包括以下步骤：

步骤1：收集个性化对话数据集，并对数据进行预处理，划分训练集、验证集与测试集，为后续模型的训练提供支持；

步骤2：首先定义模型的输入序列X＝{x1，x2，...，xn}，代表一个输入句

{x1，x2，...，xn}

子序列中的n个单词；对输入序列中的所有单词进行词嵌入得到相应的词嵌入向量，然后进行位置编码，将单词的词嵌入向量与位置编码向量对应相加，得到模型输入向量表示；

步骤3：模型输入进入编码阶段，首先通过多头注意力模块根据上下文对句子序列中的单词向量进行更新，然后经过前馈神经网络层得到编码阶段的输出，公式如下：

FFN(Z)＝max(0，Z，W₁+b₁)W₂+b₂，

其中Z代表多头注意力层的输出内容；

步骤4：模型进入解码阶段，解码阶段的输入同样首先经过词嵌入和是位置编码得到输入向量表示；输入向量经过多头注意力机制进行向量更新，再经过相同结构的编-解码注意力机制决定不同时刻的输入内容、历史对话内容以及不同的个性化特征对当前时刻输出的影响程度，最后经过前馈神经网络层得到解码阶段的输出；

步骤5：使用最小化生成序列的负对数似然函数损失来学习模型的参数，得到个性化多轮对话内容生成模型，公式如下：

其中t₁，...，t_i分别代表生成句子序列中的第i个单词.

进一步地，一种个性化对话内容生成方法，所述步骤2中位置编码公式如下：

其中PE(pos，2i)代表句子序列中第pos个单词的第2i个维度上的值，PE(pos，2i+1)代表句子序列中第pos个单词的第2i+1个维度上的值。

进一步地，一种个性化对话内容生成方法，所述步骤2中模型的输入内容中不仅包括当前对话内容，同时包括已经发生的所有历史对话内容以及特定的个性化特征。

进一步地，一种个性化对话内容生成方法，步骤3中单词向量的更新公式如下：

MultiHead(Q，K，V)＝Concat(head₁，head₂，...head_h)W^O，

head_i＝Attention(QW_i ^Q，KW_i ^K，VW_i ^V)，

其中Q,K,V分别由三个不同的权重矩阵与模型输入向量相乘得到，head_i代表多头注意力机制中的一个注意力头。

进一步地，一种个性化对话内容生成方法，所述步骤3中编码阶段中的多头注意力层和前馈神经网络层后都附加有残差连接和层归一化过程，所述步骤4中解码阶段每个子层后同样附加有残差连接和层归一化过程；公式如下：SubLayer_output＝LayerNorm(x+(SubLayer(x))，其中SubLayer指的是多头注意力层或前馈神经网络层。

进一步地，一种个性化对话内容生成方法，所述方法还包括多样化的个性化对话内容生成模型：在个性化多路对话模型的基础上，添加多种优化算法，包括带有长度惩罚的多样化集束搜索算法以及标签平滑算法，提高生成对话内容多样性，实现多样化的个性化多轮对话模型。

进一步地，一种个性化对话内容生成方法，所述步骤还包括添加优化算法提高模型生成内容多样性；首先在损失函数中增加标签平滑项，防止模型把预测值过度集中在概率较大的类别上，减少通用回复内容生成的可能性，添加了标签平滑项后的损失函数如下：

其中f代表一个与输入无关的均匀先验分布，

V为词表的大小；

然后在测试阶段加入带有长度惩罚的多样化集束搜索算法，通过对序列长度进行惩罚，降低生成短序列的概率，提高模型生成更长序列的可能性；在每个解码时刻选择B个概率最高的单词作为当前时刻的输出结果，预测过程中，根据前一时刻挑选出的B个最优单词的概率分布，分别计算出当前时刻所有单词在这个B个单词上的条件概率，再从中挑选出B个概率最高的单词序列作为当前时刻的输出结果；并将B个句子序列进行分组，组间加入相似性惩罚，降低生成相似内容的概率，提高模型生成内容的多样性。

本发明的有益效果为：利用Transformer模型根据上下文信息得到序列中每个单词高效的向量表示，通过学习自然语言之间的序列依赖关系，可以根据前文自动预测生成后文内容，实现根据对话上下文生成相应回复内容，同时加入多种优化算法，可以降低通用性回复的生成概率，从而提高生成对话内容的多样性。

附图说明

图1为本发明一种个性化对话内容生成方实例中个性化对话模型整体结构图；

图2为本发明一种个性化对话内容生成方模型的解码阶段模型图；

图3为本发明一种个性化对话内容生成方实例中模型的编码阶段模型图。

具体实施方式

下面结合附图来进一步描述本发明的技术方案：

步骤一、收集大型高质量通用对话数据集以及个性化数据集，将数据集按比例进行切分，划分为训练集、验证集和测试集，并对数据进行预处理，将数据集中每段对话处理成如下格式：Dialog＝{C₁，C₂，...，C_n，Q，R}其中C₁，C₂，...，C_n，代表历史对话内容，Q代表最后一句输入对话，R代表相应的回复，均为单词序列组成的句子。转换为模型需要的数据格式，为模型训练做好准备。

步骤二、利用通用对话数据集训练通用对话模型。首先定义模型的输入序列X＝{x₁，x₂，...，x_n}，代表一个输入句子序列中的n个单词。模型的输入内容中不仅包括当前对话内容，同时包括已经发生的所有历史对话内容。对输入序列中的所有单词进行词嵌入得到相应的词嵌入向量，然后进行位置编码，如下：

其中PE(pos，2i)代表句子序列中第pos个单词的第2i个维度上的值，PE(pos，2i+1)代表句子序列中第pos个单词的第2i+1个维度上的值。然后将单词的词嵌入向量与位置编码向量对应相加，得到模型输入向量表示。

步骤三：构建模型编码结构，首先通过多头注意力模块根据上下文对句子序列中的单词向量进行更新，如下：

MultiHead(Q，K，V)＝Concat(head₁，head₂，...head_h)W^O

head_i＝Attention(QW_i ^Q，KW_i ^K，VW_i ^V)

然后经过前馈神经网络层得到编码阶段的输出，如下：

FFN(Z)＝max(0，Z，W₁+b₁)W₂+b₂

其中Z代表多头注意力层的输出内容。

编码阶段中的多头注意力层和前馈神经网络层后都附加有残差连接和层归一化过程，如下：

SubLayer_output＝LayerNorm(x+(SubLayer(x))

其中SubLayer指的是多头注意力层或前馈神经网络层。

步骤四：构建模型解码结构，解码阶段的输入同样首先经过词嵌入和是位置编码得到输入向量表示。输入向量经过多头注意力机制进行向量更新，再经过相同结构的编-解码注意力机制决定不同时刻的输入内容、历史对话内容以及不同的个性化特征对当前时刻输出的影响程度，最后经过前馈神经网络层得到解码阶段的输出。解码阶段每个子层后同样附加有残差连接和层归一化过程。

步骤五：使用最小化生成序列的负对数似然函数损失来学习模型的参数，得到通用多轮对话内容生成模型，如下：

其中t₁，...，t_i分别代表生成句子序列中的第i个单词。训练完成后将通用多路对话模型进行保存，作为个性化对话模型训练的起始点。

步骤六、在通用对话模型编码模块中加入个性化特征编码部分，将特定的个性化特征与当前时刻输入以及历史对话内容共同作为模型输入进行编码，其余模型结构保持不变，利用个性化对话数据集对通用多轮对话模型进行微调，训练得到个性化多轮对话内容生成模型。

步骤七：添加优化算法提高模型生成内容多样性。首先在损失函数中增加标签平滑项，防止模型把预测值过度集中在概率较大的类别上，减少通用回复内容生成的可能性，添加了标签平滑项后的损失函数如下：

其中f代表一个与输入无关的均匀先验分布，

V为词表的大小。

然后在测试阶段加入带有长度惩罚的多样化集束搜索算法，通过对序列长度进行惩罚，降低生成短序列的概率，提高模型生成更长序列的可能性；在每个解码时刻选择B个概率最高的单词作为当前时刻的输出结果，预测过程中，根据前一时刻挑选出的B个最优单词的概率分布，分别计算出当前时刻所有单词在这个B个单词上的条件概率，再从中挑选出B个概率最高的单词序列作为当前时刻的输出结果。并将B个句子序列进行分组，组间加入相似性惩罚，降低生成相似内容的概率，提高模型生成内容的多样性。

本发明为个性化对话内容生成方法，利用神经网络从大量对话数据中学习出数据之间的隐含规律，利用Transformer模型根据上下文信息得到序列中每个单词高效的向量表示，学习自然语言之间的序列依赖关系，根据对话上下文自动预测生成回复内容，同时加入多种优化算法，降低通用性回复的生成概率，提高生成对话内容的多样性。

Claims

1.一种个性化对话内容生成方法，其特征在于：包括：

多轮对话内容生成模型，所述多轮对话内容生成模型考虑历史对话内容的对话生成模型；

个性化多轮对话内容生成模型，所述个性化多轮对话内容生成模型，为考虑历史对话内容以及个性化特征的对话生成模型。

2.根据权利要求1所述的一种个性化对话内容生成方法，其特征在于：包括以下步骤：

步骤2：首先定义模型的输入序列X＝{x₁，x₂，...，x_n}，代表一个输入句子序列中的n个单词；对输入序列中的所有单词进行词嵌入得到相应的词嵌入向量，然后进行位置编码，将单词的词嵌入向量与位置编码向量对应相加，得到模型输入向量表示；

FFN(Z)＝max(0，Z，W₁+b₁)W₂+b₂，

其中Z代表多头注意力层的输出内容；

其中t₁，...，t_i分别代表生成句子序列中的第i个单词。

3.根据权利要求2所述的一种个性化对话内容生成方法，其特征在于：所述步骤2中位置编码公式如下：

4.根据权利要求2所述的一种个性化对话内容生成方法，其特征在于：所述步骤2中模型的输入内容中不仅包括当前对话内容，同时包括已经发生的所有历史对话内容以及特定的个性化特征。

5.根据权利要求2所述的一种个性化对话内容生成方法，其特征在于：所述步骤3中单词向量的更新公式如下：

MultiHead(Q，K，V)＝Concat(head₁，head₂，...head_h)W^O，

6.根据权利要求2所述的一种个性化对话内容生成方法，其特征在于：所述步骤3中编码阶段中的多头注意力层和前馈神经网络层后都附加有残差连接和层归一化过程，所述步骤4中解码阶段每个子层后同样附加有残差连接和层归一化过程；公式如下：

SubLayer_output＝LayerNorm(x+(SubLayer(x))，

其中SubLayer指的是多头注意力层或前馈神经网络层。

7.根据权利要求1所述的一种个性化对话内容生成方法，其特征在于：所述方法还包括多样化的个性化对话内容生成模型：在个性化多路对话模型的基础上，添加多种优化算法，包括带有长度惩罚的多样化集束搜索算法以及标签平滑算法，提高生成对话内容多样性，实现多样化的个性化多轮对话模型。

8.根据权利要求2-7任一所述的一种个性化对话内容生成方法，其特征在于：所述步骤还包括添加优化算法提高模型生成内容多样性；首先在损失函数中增加标签平滑项，防止模型把预测值过度集中在概率较大的类别上，减少通用回复内容生成的可能性，添加了标签平滑项后的损失函数如下：

其中f代表一个与输入无关的均匀先验分布，V为词表的大小；然后在测试阶段加入带有长度惩罚的多样化集束搜索算法，通过对序列长度进行惩罚，降低生成短序列的概率，提高模型生成更长序列的可能性；在每个解码时刻选择B个概率最高的单词作为当前时刻的输出结果，预测过程中，根据前一时刻挑选出的B个最优单词的概率分布，分别计算出当前时刻所有单词在这个B个单词上的条件概率，再从中挑选出B个概率最高的单词序列作为当前时刻的输出结果；并将B个句子序列进行分组，组间加入相似性惩罚，降低生成相似内容的概率，提高模型生成内容的多样性。