CN114385802A

CN114385802A - 一种融合主题预测和情感推理的共情对话生成方法

Info

Publication number: CN114385802A
Application number: CN202210019847.9A
Authority: CN
Inventors: 唐宏; 彭金枝; 郭艳霞; 刘杰
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2022-01-10
Filing date: 2022-01-10
Publication date: 2022-04-22

Abstract

本发明涉及自然语言处理、深度学习、文本情感分析、对话生成领域，特别涉及一种融合主题预测和情感推理的共情对话生成方法，包括构建融合主题预测和情感推理的共情对话生成模型，该模型包括主题预测模块、情感推理模块以及对话生成模块，利用主题预测模块进行受上下文控制的对话主题预测，得到预测的主题；使用情感推理模块预测上下文情感标签和进行情感原因词识别，得到相应的情感信息；将获得主题信息和情感信息输入到对话生成模块中，得到与用户情感共鸣的共情回复；本发明有效地利用上下文控制主题的预测，准确地预测出上下文情感标签和识别情感原因相关的词，从而提升了模型生成的回复在情感上的共情性、主题上的一致性和内容上的相关性。

Description

一种融合主题预测和情感推理的共情对话生成方法

技术领域

本发明涉及自然语言处理、深度学习、文本情感分析、对话生成领域，特别涉及一种融合主题预测和情感推理的共情对话生成方法。

背景技术

人机对话的场景充斥在人们生活中，作为人工智能领域的核心领域，人机对话一直以来受到各界的广泛关注。一直以来人们都希望创造出能够与人流畅交流的机器人，早在1950年，图灵就明确提出了判断机器人是否智能的标准，即图灵测试。受到图灵测试的启发，人机对话引起了学者们的关注，随着深度学习技术的发展，人工智能迎来了第三次浪潮，网上海量的对话数据，为基于深度学习的人机对话技术提供了数据驱动与支撑，但是早期的对话生成系统生成的对话是不具有任何情感的，然而用户一般希望机器产生的回复能够与自己产生情感共鸣，没有情感的回复，很容易使用户失去聊天的兴趣，所以提出一种情感对话生成方法是有必要的。

早期情感对话模型的研究大多数集中于指定情感的单轮次对话生成，这类模型不能根据用户的输入语句判断出用户此时此刻的情感，而是通过在模型编码器或者解码器额外输入一个指定的情感，用于生成带有情感的回复，而且每次回复的生成是单轮次的，也就是说模型只能与用户进行一个轮次的对话。但是在现实生活中，人们希望与机器的对话能够持续很多轮次，而且在生成带有情感的回复时，也不需要指定情感，而是通过用户的输入和对话历史信息来分析用户的情感，并预测用户希望得到什么样的情感回复，这种生成回复的方式称为共情对话生成。

共情对话是从情感对话任务中衍生而来的，根据对话历史，来理解用户当前的感受，产生相应的回复，从而与用户产生情感上的共鸣。共情对话生成的主要挑战集中于对话主题的预测和情感的识别。在对话主题预测方面，以往的研究仅仅根据对话历史进行预测对话主题，只考虑了每个话题的个体语义，忽略了其特定的对话语境，这可能会导致不准确的话题表征和影响反应连贯；在情感识别方面，目前的方法主要集中在学习一个预测情绪标签的模型，却被忽略了情感背后原因的检测，这将会导致模型只能利用表面的情感信息。

发明内容

为解决以上现有技术问题，本发明提出了一种融合主题预测和情感推理的共情对话生成方法，包括构建融合主题预测和情感推理的共情对话生成模型，该模型包括主题预测模块、情感推理模块以及对话生成模块，利用主题预测模块进行受上下文控制的对话主题预测，得到预测的主题；使用情感推理模块预测上下文情感标签和进行情感原因词识别，得到相应的情感信息；将获得主题信息和情感信息输入到对话生成模块中，得到与用户情感共鸣的共情回复，对融合主题预测和情感推理的共情对话生成模型的训练过程具体包括以下步骤：

S1：获取共情对话数据，对数据进行处理，生成训练数据集、验证数据集和测试数据集；

S2：采用word embedding将共情对话数据集中的输入序列转换成相应的词向量表示；

S3：将经过word embedding得到的向量表示分别输入主题预测和情感推理模块，进行对话主题预测和情感推理；

S4：利用可训练的emotion embedding作为每个上下文标签ε的表示；

S5：将emotion embedding与word embedding和position embedding相加输入对话生成模块获取主题词和情感原因词；

S6：最大化条件概率p(U_m|U_＜m)生成最终回复，根据生成的结果计算模型的损失函数，并将测试样本中的数据输入到模型中，不断调整模型的参数，当模型的损失函数值小于设定阈值时，完成模型的训练。

进一步的，主题预测模块包括层次上下文编码、上下文相关主题表示和上下文控制主题预测，层次上下文编码用于获取话语的上下文表示；上下文相关主题表示用于根据话语的上下文表示获取话语的主题表示；上下文控制主题预测用于根据话语的主题表示对主题进行预测。

进一步的，层次上下文编码由两层BiGRU网络组成，层次上下文编码的第一层BiGRU能够对上下文中每个话语

进行编码，得到话语级表示

是话语U_i的话语级表示的最后一个隐藏层向量，表示为：

层次上下文编码的第二层BiGRU能够对话第一层编码得到的话语级表示

进行编码得到上下文级表示，包括：

其中，U_＜m表示对话上下文，N_i为话语U_i词的数量，m为整个对话过程中话语数量；

为w_n,i隐藏向量，

是w_n,i的初始词嵌入，w_n,i表示话语U_i的第n个词；BiGRU()表示BiGRU网络；

是U_i的上下文级表示。

进一步的，上下文相关主题表示由主题词提取、主题内注意力、上下文主题注意力、话语内主题表示和话语间主题表示构成，其中：

进行主题词抽取时，利用LDA主题模型从上下文U_＜m中抽取出一个唯一的主题词序列T^s＝{t₁,…t_k}，并从T^s中为每个话语U_i挑选主题词

得到上下文主题为T_＜m＝{T₁,…,T_m-1}；

主题内注意力为利用注意力机制计算每个话语中不同主题词相互重要权重，并利用权重更新每个主题词的表示，该过程表示为：

上下文主题注意力是利用注意力机制将话语表示融入主题表示过程，该过程表示为：

话语内主题表示利用softmax函数计算出主题词与其相关话语之间的相关性，得到综合的话语内主题表示，包括：

话语间主题表示用GRU网络对话语内主题表示进行编码，捕捉不同话语间的关系，得到话语间主题表示，包括：

其中，α_j,l表示相互重要权重，f()表示点乘操作，

分别为主题词t_j,i、t_l,i的词嵌入表示，g_relu()为单层全连接网络，ReLU是激活函数，z_j,i为词级主题表示，glinear为单层线性全连接网络，K_i为每个话语挑选的主题词数量；β_j,n为z_j,i和

之间的相关性，

为主题词t_j,i的上下文相关主题表示，N_i为话语U_i词的数量；ξ_j,i是主题t_j,i与U_i之间的相关性，

是话语U_i综合的话语内主题表示；

是话语U_i整合后的具有话语感知的主题表示。

进一步的，进行上下文控制主题预测时，利用H层前馈网络进行预测出对话主题转移到回复中的转移概率，并从中选择转移概率最大的L个主题词，包括以下过程：

其中，Concat[；]表示连接操作，W¹,…,W^H、b¹,…,b^H表示模型中可训练的参数，

是H层前馈网络的输出，K表示上下文相关的主题词个数，

表示主题词的转移权重，

表示主题词t_k转移到回复U_m中的概率，t表示从T^s＝{t₁,…t_k}中挑选的

在前L的主题词，Top_L()表示选择最大的L个参数，

表示预测的转移主题

的词嵌入表示，G_t是主题门序列，

表示选择

作为预测转移主题词的概率。

进一步的，情感推理模块由transformer模型构成，该模型根据对话上下文预测出上下文情感标签ε，包括：

X＝{x₀,x₁,…,x_N}

其中，X是给定对话上下文M＝{U₁,…,U_m-1}连接起来后的输入序列，x₀表示序列的开始符号，V为X的词表示，W_e和b_e表示模型中可训练参数；p(ε|X)表示根据对话上下文预测情感标签ε的概率。

进一步的，进行情感原因词识别包括：

其中，

表示第i个词与情感原因相关的概率，c_i为第i个词情感原因相关的标签，W_c和b_c为可训练参数，C表示从输入中选择的

时的前k个主题词，

表示从输入中选择的

时的第k个主题词；

是一个[0,1]中取值连续的软门，

表示在输入中选择

作为情感原因词的概率；

表示第一个特殊字符[CLS]的向量表示，N_i为话语U_i词的数量。

进一步的，对话生成模块中包括编码器、解码器，将词向量表示E_w、对话上下文的情感标签嵌入E_ε和词向量的位置嵌入表示E_p相加输入到对话生成模块的编码器中进行编码得到上下文化的词表示；在解码器中利用一个交叉注意力机制对上下文化的词表示进行关注，在交叉注意力层上添加一个主题门注意力和情感原因词门注意力，对主题预测模块得到主题门序列进行关注，动态选择预测的转移主题序列中出现在回复中主题词，对情感推理模块得到的门序列进行关注，动态控制输入中情感原因相关词的选择，包括：

其中，

的值表示选择预测主题序列中的

作为出现在回复中的主题词的概率；

的值表示在输入中选择

作为情感原因词的概率，q_l表示问询向量，为多头注意力层的输出；

表示

的嵌入表示，

表示

的嵌入表示，

表示在输入中选择

作为情感原因词的概率，⊙表示点积操作，

表示解码器第l块注意力层第i个位置的主题门注意力权重，

表示解码器第l块注意力层第i个位置的情感原因词门注意力权重。

进一步的，通过最大化在给定对话上下文U_＜m的条件下，生成回复U_m的概率P(U_m|U_＜m)得到共情回复，表示为：

其中，p(w_n,m|w_＜n,m,U_<m,t,C,ε)表示在n时刻前生成词为w_＜n,m、对话上下文为U_<m、预测的转移主题词序列为t、情感原因词序列为C、对话上下文情感标签为ε的条件下，n时刻生成词w_n,m的概率；w_n,m表示回复U_m中n时刻生成词，w_＜n,m表示回复U_m中n时刻之前生成词，U_<m表示对话上下文，t表示从T^s＝{t₁,…t_k}中挑选的

在前L的主题词，

表示主题词的转移权重，C表示从输入中选择的

时的前k个主题词，ε表示对话上下文情感标签。

进一步的，模型的损失函数由主题预测模块、情感推理模块和对话生成模块三者损失函数之和，其中：

主题预测模块损失函数为：

情感推理模块的损失函数为：

对话生成模块的损失函数为：

其中，L_tran表示转移主题词预测损失，K表示上下文相关的主题词个数；L_tran(k)表示焦点损失函数，ψ∈[0,1]是一个权重控制因子，γ≥0²是调节因子，

表示主题词转移权重；τ_k表示预测的转移主题词

是否出现在回复中，当τ_k＝1表示预测的转移主题词

出现在回复U_m中，当τ_k＝0表示预测的转移主题词

不出现在回复U_m中；L_ε表示上下文情感标签预测损失，

表示上下文情感标签的预测概率，

表示第i个词与情感原因相关的概率，N_i为话语U_i词的数量，L_c表示情感原因词检测损失；L_g表示解码器的生成损失，N_m表示生成回复中的词的个数；p(w_n,m|w_＜n,m,U_<m,t,C,ε)表示在n时刻前生成词为w_＜n,m、对话上下文为U_<m、预测的转移主题词序列为t、情感原因词序列为C、对话上下文情感标签为ε的条件下，n时刻生成词w_n,m的概率；U_＜m表示对话上下文，

表示主题词的转移权重，C表示从输入中选择的

时的前k个主题词，ε表示对话上下文情感标签。

本发明很好的融合了主题信息和情感信息，有效地利用上下文控制主题的预测，准确地预测出上下文情感标签和识别情感原因相关的词，从而提升了模型生成的回复在情感上的共情性、主题上的一致性和内容上的相关性。

附图说明

图1为本发明的融合主题预测和情感推理的共情对话生成模型结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种基于融合主题预测和情感推理的共情对话生成方法，构建融合主题预测和情感推理的共情对话生成模型，该模型包括主题预测模块、情感推理模块以及对话生成模块，利用主题预测模块进行受上下文控制的对话主题预测，得到预测的主题；使用情感推理模块预测上下文情感标签和进行情感原因词识别，得到相应的情感信息；将获得主题信息和情感信息输入到对话生成模块中，得到与用户情感共鸣的共情回复，对融合主题预测和情感推理的共情对话生成模型的训练过程具体包括以下步骤：

如图1，本实施例中融合主题预测和情感推理的共情对话生成模型包括主题预测模块、情感推理模块以及对话生成模块，用户将数据分别输入主题预测模块和情感推理模块，主题推理模块和情感推理模块得到的输出进行相加后输入对话生成模块生成回复作为模型的输出，其中主题预测模块结合对话上下文进行受上下文控制的对话主题预测，由层次上下文编码、上下文相关主题表示和上下文控制主题预测三个部分构成，如图1，主题预测模块包括以下操作：

第一步，首先，对话上下文中每个话语

经过第一层BiGRU进行编码，得到话语级表示

是U_i话语级表示的最后一个隐藏层向量，然后，将第一层编码得到的话语级表示

通过第二层BiGRU进行编码，最后，得到上下文级表示，公式可表示如下：

其中，

为w_n,i隐藏向量，

是w_n,i的初始词嵌入，w_n,i表示话语U_i的第n个词，

是U_i的上下文级表示。

第二步，利用LDA主题模型从上下文U_＜m中抽取出一个唯一的主题词序列T^s＝{t₁,…t_k}，并从T^s中为每个话语U_i挑选主题词

得到上下文主题为T_＜m＝{T₁,…,T_m-1}，再利用主题内注意力计算每个话语中不同主题词相互重要权重，根据权重更新每个主题词的表示，计算公式如下：

其中，

和

为主题词t_j,i与t_l,i的词嵌入表示，α_j,l相互重要权重，g_relu是单层全连接网络，ReLU是激活函数，z_j,i为词级主题表示，glinear是单层线性全连接网络。

第三步，利用下文主题注意力计算z_j,i与

之间的相关性β_j,n，并根据β_j,n更新主题表示，得到上下文相关的主题表示，计算公式如下：

其中，β_j,n是z_j,i和

之间的相关性，

是t_j,i的上下文相关主题表示。

第四步，利用softmax函数计算出主题词与其相关话语之间的相关性ξ_j,i，并根据ξ_ji进行话语内主题表示，计算公式如下：

其中，ξ_j,i是主题t_j,i与U_i之间的相关性，

是U_i的话语内主题表示。

第五步，利用GRU网络对话语内主题表示进行编码，捕捉不同话语间的关系，得到话语间主题表示

计算公式如下：

其中，

是U_i整合后的具有话语感知的主题表示。

第六步，将第五步得到的话语间的主题表示和第一步得到的上下文级表示通过一个H层的前馈神经网络预测主题词t_k转移到回复U_m中的概率，得到转移权重

并从中挑选出转移概率

在前L的主题词作为预测的主题词序列t，最后，由t得到主题门序列G_t，主题预测过程的计算公式如下：

其中，Concat[；]表示连接操作，W¹,…,W^H和b¹,…,b^H表示可训练的参数，

是H层前馈网络的输出，K表示上下文相关的主题词个数，

表示主题词的转移权重，

在前L的主题词，

表示预测的转移主题

的词嵌入表示，G_t是主题门序列，

表示选择

作为预测转移主题词的概率。

情感推理模块包含情感预测和情感原因词识别，分别进行上下文情感标签预测和识别情感原因相关的词，如图1所示，该模块的操作包括：

将对话上下文M＝{U₁,…,U_m-1}连接起来得到输入序列X＝{x₀,x₁,…,x_N}，再将X进行词表示后得到

并利用一个transformer模型预测上下文情感标签ε，接着进行情感原因词识别，情感原因词能够为对话生成提供更深层次的情感信息，如果第i个词与情感原因相关，其情感原因标签为1，否则为0，给定X＝{x₀,x₁,…,x_N}，得到每个词与情感原因相关的概率，从输入中选择

时的前k个主题词作为情感原因词，根据情感原因标签概率得到情感原因词门序列

计算公式如下：

其中，x₀表示序列的开始符号，V是X的词表示，W_e和b_e表示可训练参数，

时的前k个主题词，

是一个[0,1]中取值连续的软门，

表示在输入中选择

作为情感原因词的概率。

对话生成模块，即利用主题预测模块得到的主题信息和情感推理模块得到的情感信息生成主题相关、情感共鸣的回复，如图1所示，该模块操作包括：

将词嵌入E_w、情感嵌入E_ε和位置嵌入E_p相加输入到对话生成模块的编码器和解码器中进行编码，输入序列X＝{x₀,x₁,…,x_N}经过编码器进行编码后得到上下文化的词表示

在解码器中利用一个交叉注意力机制对H进行关注，再在交叉注意力层上添加一个主题门注意力和情感原因词门注意力，对主题预测模块得到主题门序列

进行关注，动态选择预测的转移主题序列中出现在回复中主题词，对情感推理模块得到的门

进行关注，动态控制输入中情感原因相关词的选择，计算公式如下：

其中，

的值表示选择预测主题序列中的

作为出现在回复中的主题词的概率，

的值表示在输入中选择

作为情感原因词的概率，q_l表示问询向量，是多头注意力层的输出，

表示

的嵌入表示，

表示

的嵌入表示，最后，通过最大化

得到共情回复。

本发明在训练模型时采用的模型的损失函数是主题预测模块、情感推理模块和对话生成模块三者损失函数之和。主题预测模块损失函数为：

其中，L_tran是动态加权交叉熵损失，表示转移主题词预测损失，它能够解决训练样本不平衡的问题，L_tran(k)表示焦点损失函数，ψ∈[0,1]是一个权重控制因子，γ≥0²是调节因子。

情感推理模块的损失函数为：

其中，L_ε表示上下文情感标签预测损失，L_c表示情感原因词检测损失。

对话生成模块的损失函数为：

其中，L_g是一个负对数似然损失，表示解码器的生成损失，N_m表示生成回复中的词的个数。

模型总的损失函数为：

L＝L_ε+L_c+L_tran+L_g。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种融合主题预测和情感推理的共情对话生成方法，其特征在于，构建融合主题预测和情感推理的共情对话生成模型，该模型包括主题预测模块、情感推理模块以及对话生成模块，利用主题预测模块进行受上下文控制的对话主题预测，得到预测的主题；使用情感推理模块预测上下文情感标签和进行情感原因词识别，得到相应的情感信息；将获得主题信息和情感信息输入到对话生成模块中，得到与用户情感共鸣的共情回复，对融合主题预测和情感推理的共情对话生成模型的训练过程具体包括以下步骤：

S2：采用词嵌入将共情对话数据集中的输入序列转换成相应的词向量表示；

S3：将词向量表示分别输入主题预测模块和情感推理模块，；

S4：利用可训练的情感嵌入获取每个词向量表示的上下文情感标签；

S5：将词向量表示、词向量的情感标签和词向量的位置向量表示相加输入对话生成模块获取主题词和情感原因词；

S6：计算在给定对话上下文U_＜m的条件下生成回复U_m的概率p(U_m|U_＜m)并将该概率最大值对应的生成回复作为最终回复，根据最终回复计算模型的损失函数，并将测试样本中的数据输入到模型中，通过方向传播调整模型的参数，当模型的损失函数值小于设定阈值时，完成模型的训练。

2.根据权利要求1所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，主题预测模块包括层次上下文编码、上下文相关主题表示和上下文控制主题预测，层次上下文编码用于获取话语的上下文表示；上下文相关主题表示用于根据话语的上下文表示获取话语的主题表示；上下文控制主题预测用于根据话语的主题表示对主题进行预测。

3.根据权利要求2所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，层次上下文编码由两层BiGRU网络组成，层次上下文编码的第一层BiGRU能够对上下文中每个话语

进行编码，得到话语级表示

是话语U_i的话语级表示的最后一个隐藏层向量，表示为：

进行编码得到上下文级表示，包括：

为w_n,i隐藏向量，

是U_i的上下文级表示。

4.根据权利要求2所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，上下文相关主题表示由主题词提取、主题内注意力、上下文主题注意力、话语内主题表示和话语间主题表示构成，其中：

得到上下文主题为T_＜m＝{T₁,…,T_m-1}；

其中，α_j,l表示相互重要权重，f()表示点乘操作，

之间的相关性，

是话语U_i综合的话语内主题表示；

是话语U_i整合后的具有话语感知的主题表示。

5.根据权利要求2所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，进行上下文控制主题预测时，利用H层前馈网络进行预测出对话主题转移到回复中的转移概率，并从中选择转移概率最大的L个主题词，包括以下过程：

是H层前馈网络的输出，K表示上下文相关的主题词个数，

表示主题词的转移权重，

在前L的主题词，Top_L()表示选择最大的L个参数，

表示预测的转移主题

的词嵌入表示，G_t是主题门序列，

表示选择

作为预测转移主题词的概率。

6.根据权利要求1所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，情感推理模块由transformer模型构成，该模型根据对话上下文预测出上下文情感标签ε，包括：

X＝{x₀,x₁,…,x_N}

7.根据权利要求6所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，进行情感原因词识别包括：

其中，

时的前k个主题词，

表示从输入中选择的

时的第k个主题词；

是一个[0,1]中取值连续的软门，

表示在输入中选择

作为情感原因词的概率；

8.根据权利要求1所述的一种融合主题预测和情感推理的共情对话生成方法，其特征在于，对话生成模块中包括编码器、解码器，将词向量表示E_w、对话上下文的情感标签嵌入E_ε和词向量的位置嵌入表示E_p相加输入到对话生成模块的编码器中进行编码得到上下文化的词表示；在解码器中利用一个交叉注意力机制对上下文化的词表示进行关注，在交叉注意力层上添加一个主题门注意力和情感原因词门注意力，对主题预测模块得到主题门序列进行关注，动态选择预测的转移主题序列中出现在回复中主题词，对情感推理模块得到的门序列进行关注，动态控制输入中情感原因相关词的选择，包括：