CN115795010A

CN115795010A - 一种外部知识辅助的多因素层次建模共情对话生成方法

Info

Publication number: CN115795010A
Application number: CN202211518984.3A
Authority: CN
Inventors: 唐宏; 彭金枝; 杨浩澜; 郭艳霞
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2022-11-30
Filing date: 2022-11-30
Publication date: 2023-03-14

Abstract

本发明涉及自然语言处理领域，特别涉及一种外部知识辅助的多因素层次建模共情对话生成方法，包括构建利用外部知识辅助情感分析和层次建模共情表达相关因素的共情对话生成模型，包括外部知识辅助情感分析模块、多因素层次建模模块以及对话生成模块；利用外部知识辅助情感分析模块将外部知识与对话历史结合，构建情感上下文图，从情感上下文图中学习情感上下文表征，提取情感信号；利用多因素层次建模模块将沟通机制、对话行为以及对话情感等共情表达相关因素进行层次建模，得到共情表达多因素融合嵌入；将获得情感信号和多因素融合嵌入应用于共情对话生成模块中，得到情感合适的共情回复；本发明有效地提高了对话模型生成的回复的共情性和相关性。

Description

一种外部知识辅助的多因素层次建模共情对话生成方法

技术领域

本发明涉及自然语言处理、深度学习、文本情感分析、对话生成领域，特别涉及一种外部知识辅助的多因素层次建模共情对话生成方法。

背景技术

进几年，网络中存在的海量数据为机器学习和深度学习的发展提供了条件，同时这也促使以基于深度学习的人机对话系统得到很好的发展。人机对话也属于人工智能范畴，人们可以通过与机器对话，直接进行信息的交流。人机对话场景在我们的生活中随处可见，例如百度的小度、阿里的天猫精灵、小米的小爱以及苹果的Siri等。这些对话系统的应用使得用户能够很容易地通过语音控制手机、电脑或者家电等，甚至还可以为用户提供聊天服务。

随着时代的发展，用户更倾向于将对话系统当作“灵魂伴侣”，希望能够与用户进行情感上的交流，而不仅仅是使用对话系统来完成特定的任务。因此，情感对话系统逐渐成为了对话模型的主要研究方向之一，但是，早期情感对话模型的研究大多数集中于指定情感的单轮次对话生成，这类模型不能根据用户的输入语句判断出用户此时此刻的情感，而是通过在模型编码器或者解码器额外输入一个指定的情感，用于生成带有情感的回复，而且每次回复的生成是单轮次的，也就是说模型只能与用户进行一个轮次的对话。但是在现实生活中，人们希望与机器的对话能够持续很多轮次，而且在生成带有情感的回复时，也不需要指定情感，而是通过用户的输入和对话历史信息来分析用户所处的情感状态，从而生成能够与用户产生情感共鸣的回复，这种回复生成方法被称为共情回复生成。

共情对话是从情感对话任务中衍生而来的，根据对话历史，来理解用户当前的感受，产生相应的回复，从而与用户产生情感上的共鸣。共情对话系统的主要挑战是共情表达，如何从有限的对话历史中获取更多的情感信息对于共情表达十分重要，除此之外，影响共情表达的因素也有很多，比如沟通机制、对话行为以及对话情感等，这些共情表达相关的因素之间存在某种层次关系，如何对这些因素建模也会影响生成回复的共情表达。

发明内容

为解决以上现有技术问题，本发明提出了一种外部知识辅助的多因素层次建模共情对话生成方法，包括构建利用外部知识辅助情感分析和层次建模共情表达相关因素的共情对话生成模型，该模型包括外部知识辅助情感分析模块、多因素层次建模模块以及对话生成模块；利用外部知识辅助情感分析模块将外部知识与对话历史结合，丰富有限的对话历史，构建情感上下文图，从知识丰富的情感上下文图中学习情感上下文表征，提取情感信号；利用多因素层次建模模块将沟通机制、对话行为以及对话情感等共情表达相关因素进行层次建模，得到一个共情表达多因素融合嵌入；将获得情感信号和多因素融合嵌入应用于共情对话生成模块中，得到情感合适的共情回复，对外部知识辅助的多因素层次建模共情对话生成模型的训练过程具体包括以下步骤：

S1：获取共情对话数据，对数据进行处理，生成训练数据集；

S2：采用词嵌入将共情对话数据集中的输入序列转换成相应的词向量表示；

S3：将词向量表示分别输入外部知识辅助情感分析模块和多因层次建模模块；

S4：在外部知识辅助情感分析模块中，利用外部知识ConceptNet和NRC_VAD来丰富对话上下文，构建情感上下文图；利用词嵌入层和位置嵌入层将情感上下文图中的每个顶点变成向量表示，将情感上下文图中的每个顶点表示输入Transformer编码器中，进行情感下文图编码，从而提取出情感信号e_p；

S5：在多因素层次建模模块中，将对话上下文的向量表示输入Transformer编码器中，预测出沟通机制CM，基于预测出的CM和对话上下文的词向量表示预测出对话行为DA，基于CM、DA和对话上下文的向量表示预测出对话情感EM，得到共情表相关的多因素融合嵌入表示e_CoMAE；

S6：在对话生成模块中，将情感信号e_p和多因素融合嵌入e_CoMAE输入进Transformer的解码器中；

S7：计算在给定对话上下文U_＜m的条件下生成回复U_m的概率p(U_m|U_＜m)，并将该概率最大值对应的回复作为最终回复，根据最终的回复计算模型的损失函数，并将测试样本中的数据输入到模型中，通过反向传播调整模型的参数，当模型的损失函数值小于设定阈值时，完成模型的训练。

进一步的，外部知识辅助情感分析模块包括构建情感上下文图、情感上下文图编码和情感信号识别；其中：

构建情感上下文图，即通过整合外部知识与对话上下文来构建一个知识丰富的对话上下文图；

情感上下文图编码利用情感知识和全局上下文信息更新上下文图中的顶点表示，其中情感上下文图编码采用多头图注意力机制，利用情感知识和全局上下文信息更新情感上下文图中的顶点表示；

情感信号识别是识别出对话中用于共情回复的情感信号，其中情感信号识别利用具有softmax操作的线性层将顶点表示的加权和c_e映射到情感标签的情感类别分布上，识别出用于共情回复的情感信号e_p。

进一步的，情感上下文图构建，即通过整合外部知识与对话上下文来构建一个知识丰富的对话上下文图的过程具体包括：

利用ConceptNet检索得到每一个非停止词x_i的候选概念关系元组集合，表示为：

过滤候选概念关系元组集合中关系和置信分数大于0.1的元组得到一个概念关系子集

利用NRC_VAD求出概念关系子集中每个概念的情感强度值；

根据每个概念的情感强度值对每个概念关系元组进行排序，选择前K'个元组作为情感知识子图；

使用三种边连接情感知识子图中的顶点，两个连续的单词之间使用临时边连接，单词及其概念之间使用情感边连接，CLS标记与其他的顶点之间使用全局边进行连接，完成情感上下文图构建；

其中，T_i表示非停止词x_i的候选概念关系元组集合；x_i∈S，

是将对话历史展开后在开始加入CLS标记得到的一个长单词序列，CLS表示长单词序列的起始标记，m₁表示表示长单词序列的长度，K表示每个非停止词x_i所拥有的概念关系元组个数；

表示非停止词x_i的第k个概念关系元组，

表示第k个概念关系元组中的关系，

表示第k个概念关系元组中的尾概念，

表示第k个概念关系元组中的置信分数。

进一步的，对于一个概念

的情感强度值，表示为：

其中，min-max()是最小最大归一化，||·||₂表示2范数，

表示概念

在VAD向量中的Valence维度值，

表示概念

在VAD向量中的Arousal维度值。

进一步的，情感上下文图编码利用外部知识和全局上下文信息更新情感知识子图中的顶点表示的过程包括：

将顶点v_i的词嵌入E_w(v_i)、位置嵌入E_p(v_i)以及状态嵌入E_v(v_i)三者的和作为其向量表示；

采用多头图注意力机制，利用情感知识更新知识子图中的顶点表示；

使用全局上下文信息更新知识子图中的顶点表示。

进一步的，采用多头图注意力机制，利用情感知识更新知识子图中的顶点表示包括：

其中，||表示H个注意头的串联，αⁿ表示第n个头的自注意力机制，

和

表示线性变换矩阵，d_h＝d/H表示每个头的维度，d表示词嵌入的维度；A_i表示顶点v_i的邻接矩阵，v_i是顶点v_i的向量表示，v_j是顶点v_j的向量表示，

是顶点v_i融入外部知识后的顶点表示。

进一步的，使用全局上下文信息更新知识子图中的顶点表示包括：

其中，LayerNorm是层归一化技巧，MHAtt是由H个注意头组成的多头注意力子层，FFN是以ReLU作为激活函数的两层前反馈网络；G为情感上下文图，

进一步的，情感信号识别的过程，即识别出用于共情回复的情感信号e_p的过程包括：

e_p＝W_ec_e

其中，

表示预测得到的情感回复，c_e是顶点表示

在其情感强度上的加权和，η_i表示顶点v_i的情感强度值，

表示顶点v_i融入全局上下文信息之后的顶点表示，m₂表示情感知识子图中的顶点个数，n表示使用全局上下文信息更新后的情感上下文图中的顶点个数；

表示模型中可训练的参数，q表示表示情感类别的个数，d表示词嵌入的维度；

表示

符合P(e|g)分布；P(e|g)表示在给定情感上下文图g的条件下，情感为e的概率。

进一步的，到共情表相关的多因素融合嵌入表示e_CoMAE的过程包括：

使用对话历史最后一个位置的隐藏状态

来分层预测目标回复的沟通机制CM、对话行为DA和对话情感EM，沟通机制CM的预测过程表示为：

基于对话上下文和预测出的沟通机制来进行预测对话行为DA，该过程表示为：

基于对话上下文、预测出的沟通机制以及对话上下文，预测出对话过程中的情感，该过程表示为：

将预测的所有影响共情的因素相加得到融合嵌入e_CoMAE，该过程表示为：

其中，

表示话语u_i所属的说话人标签，当

表示编号为0的说话人的话语，当

表示编号为1的说话人的话语；

表示话语u_i的对话行为标签；

表示话语u_i的情感标签；

表示u_i,j的符号id，ν是词典，|ν|表示词典的大小；p_ui,j∈[0,1024)表示u_i,j的位置id，M_W表示词嵌入矩阵，M_P表示位置嵌入矩阵，M_K表示说话人嵌入矩阵，M_A表示对话行为嵌入矩阵，M_E表示对话情感嵌入矩阵，[·]表示索引操作；H_x[-1]表示对话历史最后一个位置的隐藏状态；

表示对话历史最后一个位置的隐藏状态h_x经过一个非线性层变化后的表示；

表示tanh激活的非线性层；

表示沟通机制的嵌入矩阵；

表示是否采用沟通机制i，当

表示采用沟通机制i，

表示未采用沟通机制i；

表示预测出来的沟通机制；

表示给定对话历史U_＜m的条件下沟通机制

采取i的概率；ER表示情感反应；IP表示解释；EX表示探索；

表示沟通机制

的向量表示；[·；·]表示向量拼接，F_A是非线性层；

表示表示预测出来的对话行为；

表示在给定对话历史U_＜m和沟通机制

的条件下，预测的对话行为为A_y的概率；

表示预测出的对话情感；

表示在给定对话历史U_＜m、沟通机制

和对话行为

的条件下，预测的对话情感为E_y的概率。

进一步的，模型的损失函数由外部知识辅助情感分析模块、多因素层次建模模块和对话生成模块三者损失函数之和，其中：

外部知识辅助情感分析模块的损失为：

多因素层次建模模块的损失函数为：

对话生成模块的损失函数为：

模型总的损失函数为：

L＝L_emo+L_C+L_A+L_E+L_g

其中，

表示在给定对话历史U_＜m的条件下，真实的沟通机制为

的概率；

表示在给定对话历史U_＜m和真实沟通机制

的条件下，真实的对话行为为

的概率；

表示在给定对话历史U_＜m、真实沟通机制以及真实对话行为

的条件下，真实的对话情感为

的概率；

表示在给定对话历史U_<m、真实沟通机制

真实对话行为

真实对话情感为

真实情感信号为e^*以及真实的前n-1个词为

的条件下，生成真实的词

的概率；

表示预测的情感信号；e^*表示真实的情感信号；

表示表示真实的沟通机制；U_＜m表示对话历史；

表示真实的对话行为；

表示真实的沟通机制；

表示真实的对话情感；N_m表示生成回复的长度；

表示n时刻真实的生成词；

表示前n-1时刻真实的生成词；L_emo表示外部知识辅助情感分析模块的情感信号识别损失，L_C表示沟通机制预测损失，L_A表示对话行为预测损失，L_E表示对话情感预测损失，L_g表示对话生成模块在生成回复时的生成损失，L表示模型的总损失。

本发明很好地借助了外部知识来辅助对话模型进行情感分析，有效地利用层次框架模型对共情表达相关因素进行建模，从而提升了模型生成回复的共情性欲与相关性。

附图说明

图1为本发明的外部知识辅助的多因素层次建模共情对话生成模型结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提出了一种外部知识辅助的多因素层次建模共情对话生成方法，包括构建利用外部知识辅助情感分析和层次建模共情表达相关因素的共情对话生成模型，该模型包括外部知识辅助情感分析模块、多因素层次建模模块以及对话生成模块；利用外部知识辅助情感分析模块将外部知识与对话历史结合，丰富有限的对话历史，构建情感上下文图，从知识丰富的情感上下文图中学习情感上下文表征，提取情感信号；利用多因素层次建模模块将沟通机制、对话行为以及对话情感等共情表达相关因素进行层次建模，得到一个共情表达多因素融合嵌入；将获得情感信号和多因素融合嵌入应用于共情对话生成模块中，得到情感合适的共情回复，对外部知识辅助的多因素层次建模共情对话生成模型的训练过程具体包括以下步骤：

如图1，本实施例中外部知识辅助的多因素层次建模共情对话生成模型包括外部知识辅助情感分析模块、多因素层次建模模块以及对话生成模块，用户将数据分别输入外部知识辅助情感分析模块和多因素层次建模模块，外部知识辅助情感分析模块和多因素层次建模模块得到的输出进行相加后输入对话生成模块生成回复作为模型的输出，其中外部知识辅助情感分析模块结合外部知识和对话上下文，构建一个情感知识丰富的对话上下文图，丰富了有限的对话历史，从知识丰富的对话上下文图中识别情感信号，由情感上下文图构建、情感上下文图编码和情感信号识别三部分构成，如图1所示，该模块包括以下操作：

第一步，通过与ConceptNet和NRC_VAD交互来丰富有限的对话历史，使对话历史中包含丰富的情感知识。

首先，利用ConceptNet检索得到每一个非停止词x_i的候选概念关系元组集合，表示为：

其中，x_i∈S，

表示非停止词x_i的第k个概念关系元组，

表示第k个概念关系元组中的关系，

表示第k个概念关系元组中的尾概念，

表示第k个概念关系元组中的置信分数，元组信息可以通过ConceptNet获取，本发明不再赘述。

其次，过滤候选概念关系元组集合中具有关系和置信分数大于0.1的元组得到一个概念关系子集

利用NRC_VAD求出概念关系子集中每个概念的情感强度值，对于一个概念

k＝1,,K的情感强度值，表示为：

其中，min-max()是最小最大归一化，||·||₂表示2范数，

和

分别表示概念

的VAD向量中的Valence和Arousal维度值。

然后，根据每个概念的情感强度值对每个概念关系元组进行排序，选择前K'个元组作为情感知识子图。

最后，使用三种边连接情感知识子图中的顶点，两个连续的单词之间使用临时边连接，单词及其概念之间使用情感边连接，CLS标记与其他的顶点之间使用全局边进行连接。

第二步，利用外部知识和全局上下文信息更新情感知识子图中的顶点表示。

首先，将顶点v_i的词嵌入E_w(v_i)、位置嵌入E_p(v_i)以及状态嵌入E_v(v_i)三者的和作为其向量表示，表示为：

v_i＝E_w(v_i)+E_p(v_i)+E_v(v_i)

其次，采用多头图注意力机制，利用情感知识更新知识子图中的顶点表示，该过程表示为：

其中，||表示H个注意头的串联，A_i表示顶点v_i的邻接矩阵，αⁿ表示第n个头的自注意力机制，

和

表示线性变换，d_h＝d/H表示每个头的维度，d表示词嵌入的维度。

然后，使用全局上下文信息更新知识子图中的顶点表示，以建模全局交互，该过程表示为：

其中，LayerNorm是层归一化技巧，MHAtt是由H个注意头组成的多头注意力子层，FFN是以ReLU作为两层激活函数的两层前反馈网络。

最后，情感上下文图被表示为

其中

第三步，从情感上下文图中学习情感信号，以指导共情回复生成，该过程表示为：

e_p＝W_ec_e

其中，符号“^”表示预测值，例如

表示预测得到的情感回复；c_e是顶点表示

在其情感强度上的加权和，η_i表示顶点v_i的情感强度值，

表示

第四步，利用层次框架以分层的方式对共情表达相关因素进行建模，得到一个共情表达多因素融合嵌入表示。

首先，将对话历史中的话语

中的每个单词表示为说话人嵌入、对话行为嵌入、对话情感嵌入、词嵌入和位置嵌入的和，表示为：

其中，

(只有两名说话人)表示话语u_i所属的说话人标签，

表示话语u_i的对话行为标签，

表示话语u_i的情感标签，

(ν是词典)表示u_i,j的符号id，

(1024是模型的最大输入长度)表示u_i,j的位置id，M_W表示词嵌入矩阵，M_P表示位置嵌入矩阵，M_K表示说话人嵌入矩阵，M_A表示对话行为嵌入矩阵，M_E表示对话情感嵌入矩阵，[·]表示索引操作。

然后，使用对话历史最后一个位置的隐藏状态

其中，i∈{ER,IP,EX}，

表示是否采用对话行为i，

是用tanh激活的非线性层，

表示沟通机制的嵌入矩阵。

对话行为DA是基于对话上下文和预测出的沟通机制来进行预测的，该过程表示为：

其中，[·；·]表示向量拼接，F_A是非线性层，M_A是对话行为的嵌入矩阵。

其中，F_E是非线性层，M_E是对话情感的嵌入矩阵。

最后，将预测的所有影响共情的因素相加得到融合嵌入e_CoMAE，该过程表示为：

第五步，利用transformer解码器来生成最终回复，将词嵌入表示、位置嵌入表示、说话人嵌入表示、多因素融合嵌入表示以及外部知识辅助情感分析得到的情感信号的向量表示相加作为模型的输入，通过将给定对话上下文U_＜m条件下的生成回复U_m的概率最大化得到共情回复，表示为：

其中，

表示n-1时刻生成的单词

的向量表示，e表示外部知识辅助情感分析部分得到的情感类别信息，

表示在给定n时刻前生成词

对话上下文U_<m、沟通机制

对话行为

对话情感

以及情感信号

时n时刻生成词

的概率。

第六步，计算模型的损失函数，通过最小化负对数似然损失函数训练模型，模型的损失函数由外部知识辅助情感分析模块、多因素层次建模模块和对话生成模块三者损失函数之和，其中：

外部知识辅助情感分析模块的损失为：

多因素层次建模模块的损失函数为：

对话生成模块的损失函数为：

模型总的损失函数为：

L＝L_emo+L_C+L_A+L_E+L_g

其中符号“*”表示真实值，L_emo表示外部知识辅助情感分析模块的情感感知损失，L_C表示沟通机制预测损失，L_A表示对话行为预测损失，L_E表示对话情感预测损失，L_g表示对话生成模块在生成回复时的生成损失，L表示模型的总损失。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种外部知识辅助的多因素层次建模共情对话生成方法，其特征在于，构建利用外部知识辅助情感分析和层次建模共情表达相关因素的共情对话生成模型，该模型包括外部知识辅助情感分析模块、多因素层次建模模块以及对话生成模块；利用外部知识辅助情感分析模块将外部知识与对话历史结合，丰富有限的对话历史，构建情感上下文图，从情感上下文图中学习情感上下文表征，提取情感信号；利用多因素层次建模模块将沟通机制、对话行为以及对话情感等共情表达相关因素进行层次建模，得到一个共情表达多因素融合嵌入；将获得情感信号和多因素融合嵌入应用于共情对话生成模块中，得到情感合适的共情回复，对外部知识辅助的多因素层次建模共情对话生成模型的训练过程具体包括以下步骤：