CN110046239B

CN110046239B - 基于情感编辑的对话方法

Info

Publication number: CN110046239B
Application number: CN201910299459.9A
Authority: CN
Inventors: 孙晓; 李佳; 卫星
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2019-04-15
Filing date: 2019-04-15
Publication date: 2020-12-01
Anticipated expiration: 2039-04-15
Also published as: CN110046239A

Abstract

本发明提供一种基于情感编辑的对话方法，涉及人机交互领域。包括以下步骤：获取待回答的问句，对所述问句进行预处理；预测回答中情感关键词和主题关键词之间的位置关系；生成所述情感关键词和所述主题关键词；生成初始回答；确定模板句子，计算情感编辑向量，对所述初始回答进行编辑优化，生成中间回答；计算所述中间回答的奖励得分；对所述中间回答进行优化，生成最终回答。本发明可以实现情感交互。

Description

基于情感编辑的对话方法

技术领域

本发明涉及人机交互技术领域，具体涉及一种基于情感编辑的对话方法。

背景技术

近年来，随着人工智能与机器人领域如火如荼的发展，融入情感元素的机器人在相关研究中的地位越来越重要。具有情感的交互方式能够实现更加友好的机器与人类的交互界面，因此能够实现情感交互的人工智能有更高的实用价值和现实意义。

现有技术中的人机对话主要利用资料库对用户的对话进行分析，然后使用语言处理技术生成相应的回答作为回复。

现有技术的对话方法只是分析出了用户的情感，而相应的情感元素并未融入到生成的回答中，不能够实现真正的情感交互。因此，现有技术存在不能实现情感交互的缺点。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种基于情感编辑的对话方法，解决了现有技术不能实现情感交互的问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

本发明解决其技术问题所提供的一种基于情感编辑的对话方法，包括以下步骤：

S1、获取待回答的问句，对所述问句进行预处理；

S2、预测所述问句的回答中情感关键词和主题关键词之间的位置关系，所述位置关系包括以下至少一种：无关键词，只有一个情感关键词，只有一个主题关键词，包含情感关键词和主题关键词且位置关系为情感关键词在前和主题关键词在后，以及包含情感关键词和主题关键词且位置关系为主题关键词在前和情感关键词在后；

S3、生成所述情感关键词和所述主题关键词；

S4、根据所述问句、所述情感关键词、所述主题关键词以及所述位置关系生成三个子句：情感关键词侧子句、中间子句和主题关键词侧子句，将所述三个子句组合生成初始回答；

S5、确定模板句子，计算情感编辑向量，并对所述初始回答编辑优化，得到中间回答；计算所述中间回答的奖励得分；对所述中间回答进行优化，生成最终回答。

优选的，对所述问句进行预处理，包括：

利用注意力机制对所述问句进行编码，得到权重向量。

优选的，生成所述情感关键词，包括：

基于预训练的情感词典指定情感类别；

将所述情感类别转化为情感类别向量；

基于所述情感类别向量和所述权重向量计算所述情感词典中关键词的概率分布；

将概率最大的关键词作为所述情感关键词。

优选的，生成所述主题关键词，包括：

将所述问句输入预训练的隐含狄利克雷分布模型，获得所述回答的主题类别；

将所述主题类别转化为主题类别向量；

基于所述主题类别向量和所述权重向量计算模型中关键词的概率分布；

将概率最大的关键词作为所述主题关键词。

优选的，所述初始回答的生成方法包括：

设置起始符和结束符；

以起始符为起点，位置在前的关键词为终点，基于所述权重向量生成第一子句；

以位置在前的关键词为起点，位置在后的关键词为终点，基于所述第一子句生成第二子句；

以位置在后的关键词为起点，结束符为终点，基于第一子句和第二子句生成第三子句；

将三个子句和两个关键词按位置顺序组合，生成所述初始回答。

优选的，所述步骤S5包括：

S501、基于所述情感关键词、所述主题关键词以及所述位置关系，按照预先设置的优先级确定模板句子，基于所述模板句子计算情感编辑向量，基于所述模板句子和所述情感编辑向量，使用序列到序列模型对所述初始回答进行编辑优化，生成中间回答；

S502、计算所述中间回答的衡量指标，包括：连贯度、主题相关度和情感相关度，基于所述指标计算所述中间回答的奖励得分；

S503、基于所述奖励得分对所述中间回答进行优化，生成最终回答。

优选的，所述连贯度的计算方法为：

其中：

r₁表示回答的连贯度；

p_seq2seq(y|x)表示基于给定的句子x，生成回答y的概率；

表示基于回答y，生成问句x的概率；

N_y表示回答的长度；

N_x表示问句的长度。

优选的，所述主题相关度的计算方法为：

其中：

r₂表示回答的主题相关度；

k^tp表示给定句子的主题类别；

LDA(y)表示回答的主题预测概率分布；

N_tp表示主题类别的总数。

优选的，所述情感相关度的计算方法为：

其中：

r₃表示回答的情感相关度；

k^et表示指定的情感类别；

D^et(y)表示回答的预测概率分布；

N_et表示情感类别的总数。

优选的，所述中间回答的奖励得分的计算方法为：

基于所述衡量指标计算所述情感关键词侧子句的奖励得分；

基于所述衡量指标计算所述主题关键词侧子句的奖励得分；

基于所述衡量指标计算所述中间子句的奖励得分；

基于三个子句的奖励得分计算所述中间回答的奖励得分。

(三)有益效果

本发明提供了一种基于情感编辑的对话方法。与现有技术相比，具备以下有益效果：

本发明针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词；由关键词位置关系生成三个子句：情感关键词侧子句、中间子句和主题关键词侧子句，将三个子句组合生成初始回答；确定模板句子，计算情感编辑向量，对初始回答编辑优化，再计算奖励得分；基于奖励得分再进行优化，生成最终回答。本发明在分析用户情感时预测并生成情感关键词，通过情感关键词生成子句并得到具有情感元素的回答，通过模板句子和情感编辑向量对回答进行编辑优化，使得回答更加具备情感色彩，真正的实现了与用户的情感交互，增强了用户的使用体验感。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所述的基于情感编辑的对话方法的整体流程图；

图2为本发明实施例步骤S4中提供的异步对话生成框架的示意图；

图3为本发明实施例步骤S502中奖励得分的计算流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例通过提供一种基于情感编辑的对话方法，解决了现有技术不能实现情感交互的问题，实现了与用户的情感交互。

本申请实施例中的技术方案为解决上述技术问题，总体思路如下：

本发明实施例针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词；由关键词位置关系生成三个子句：情感关键词侧子句、中间子句和主题关键词侧子句，将三个子句组合生成初始回答；确定模板句子，计算情感编辑向量，对初始回答编辑优化，再计算奖励得分；基于奖励得分再进行优化，生成最终回答。本发明实施例在分析用户情感时预测并生成情感关键词，通过情感关键词生成子句并得到具有情感元素的回答，通过模板句子和情感编辑向量对回答进行编辑优化，使得回答更加具备情感色彩，真正的实现了与用户的情感交互，增强了用户的使用体验感。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

本发明实施例提供了一种基于情感编辑的对话方法，如图1所示，上述方法包括以下步骤：

S1、获取待回答的问句，对所述问句进行预处理；

S3、生成所述情感关键词和所述主题关键词；

本发明实施例在具体实施时，针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词；由关键词位置关系生成三个子句：情感关键词侧子句、中间子句和主题关键词侧子句，将三个子句组合生成初始回答；确定模板句子，计算情感编辑向量，对初始回答编辑优化，再计算奖励得分；基于奖励得分再进行优化，生成最终回答。本发明实施例在分析用户情感时预测并生成情感关键词，通过情感关键词生成子句并得到具有情感元素的回答，通过模板句子和情感编辑向量对回答进行编辑优化，使得回答更加具备情感色彩，真正的实现了与用户的情感交互，增强了用户的使用体验感。

下面对各步骤进行详细描述。

在步骤S1中，获取待回答的问句，对上述问句进行预处理。具体的，利用编码器对问句进行编码得出隐向量序列h，问句的编码器采用的是门控循环单元(GRU)，给定一个序列x＝(x₁，x₂，x₃，…，x_T)，隐藏变量将不断更新：

h_t＝GRU(h_t-1，x_t)

其中：x_t是第t个词的索引，h_t-1是t-1时刻的编码器的状态，h_t是编码器t时刻的状态。

利用注意力机制计算权重向量，用于后续计算，具体为：

其中：c^k,*表示权重向量，*∈{et，tp}表示是主题或者情感，

和

表示控制参数。

在步骤S2中，预测回答中情感关键词和主题关键词之间的位置关系。

具体的，可以包括以下几种情况：

z^s＝0:无关键词，使用一个普通的前向解码器来生成回答；

z^s＝1:只有一个情感关键词，可以使用一个异步解码器从情感关键词开始生成回答；

z^s＝2:只有一个主题关键词，可以使用一个异步解码器从主题关键词开始生成回答；

z^s＝3:包含情感关键词和主题关键词，且位置关系为情感关键词在前，主题关键词在后；

z^s＝4:包含情感关键词和主题关键词，且位置关系为主题关键词在前，情感关键词在后。

计算上述情况的概率：

其中：

表示问句x的隐向量序列，W^s为自行设定的参数。

在步骤S3中，生成上述情感关键词和主题关键词。

具体的，情感关键词确定步骤如下：

S3011、首先基于情感知识库构建情感词典。词典中包含七种情感类别：开心，喜欢，伤心，生气，恐惧，厌恶和惊讶，关键词共计27466个。

S3012、确定回答所倾向的情感类别。本发明实施例中的情感类别情感类别可以通过人为指定以上七种类别之一即可。

S3013、将上述情感类别转化为情感类别向量；

S3014、基于上述情感类别向量和上述权重向量计算上述情感词典中关键词的概率分布：

其中：

表示情感关键词，

表示网络参数，c^k,et为情感的权重向量。

从情感词典中选出最合适的关键词。本发明实施例将概率最大的关键词作为上述情感关键词。

主题关键词的确定步骤如下：

S3021、预训练隐含狄利克雷分布模型(LDA)。LDA模型基于网络数据集构建，包括了10种类别的关键词，每种类别100个词，共计1000个词。

S3022、将问句输入LDA模型中，确定回答所倾向的主题类别。

S3023、将上述主题类别转化为主题类别向量；

S3024、基于上述主题类别向量和上述权重向量计算上述主题关键词的概率分布：

其中：

表示主题关键词，

表示网络参数，c^k,tp为情感的权重向量。

从LDA模型中选出最合适的关键词。本发明实施例将概率最大的关键词作为上述主题关键词。

在步骤S4中，根据上述问句、上述情感关键词、上述主题关键词以及上述位置关系生成三个子句：情感关键词侧子句、中间子句和主题关键词侧子句，将上述三个子句组合生成初始回答。

具体的：对于只包含一个关键词的情况，以这个关键词为起点，依次向后，向前生成句子的其他部分。

对于包含两种关键词的情况，本发明实施例提供了一种新型的异步对话生成框架，即：将一个句子分为三个子句迭代生成。

本发明实施例选取其中一种进行详细叙述，如图2所示，即回答包含情感关键词和主题关键词，且情感关键词在前，主题关键词在后，其他的情况均可类推。

设输入的问句为x＝(x₁,x₂,…,x_T)；初始回答为y_初。

用w_s表示起始符<GO>；w_e表示结束符<EOS>；

表示情感关键词；

表示主题关键词；y^et表示<GO>与情感关键词之间的部分，即情感侧子句；y^md表示情感关键词和主题关键词之间的部分，即中间字句；y^tp表示主题关键词与<EOS>之间的部分，即主题侧子句。整个回答被分为三个子句：y^et,y^md,y^tp，模型也将分三个步骤依次生成这三个部分。

步骤Ⅰ：分别以<GO>和

为起点和终点，基于权重向量生成y^et，计算公式为：

步骤Ⅱ：以第一步生成的y^et为基础，再分别以

和

为起点和终点进行生成y^md，计算公式为：

步骤Ⅲ：以第一步生成的y^et和第二步生成的y^md为基础，再分别以

和<EOS>为起点和终点生成y^tp，计算公式为：

其中：其中

表示关键词的集合，

表示三个子句解码过程中的中间状态，g表示编码器。

至此，获得了三个子句，再根据情感关键词和主题关键词的位置关系将子句和关键词组合起来得到初始回答。

本实施例中的初始回答为：

在步骤S5中，确定模板句子，计算情感编辑向量，并对上述初始回答编辑优化，得到中间回答；计算上述中间回答的奖励得分；对上述中间回答进行优化，生成最终回答。具体为：

在步骤S501中，基于上述情感关键词、上述主题关键词以及上述位置关系，按照预先设置的优先级确定模板句子，基于上述模板句子计算情感编辑向量，基于上述模板句子和上述情感编辑向量，使用序列到序列模型对上述初始回答进行编辑优化，生成中间回答。

在步骤S5011中，确定模板句子。

根据上述情感关键词、上述主题关键词以及二者的位置关系，在训练集χ中寻找最合适的模板句子y′。选择模板的优先级如下：包含相同的关键词且位置关系也相同的句子，包含相同关键词但位置关系不同的句子，只有主题关键词相同的句子，只有情感关键词相同的句子。对于优先级相同的句子使用基于词法级别的相似度区分：

L(y,y′)＝d_J(y,y′)

其中：d_J(y,y′)是模板句子y′与中间回答y之间的杰卡德距离。

根据以上规则选出优先级最高且与候选回答相似度最高的句子作为模板句子y′。

在步骤S5012中，计算情感编辑向量。

通过得到的模板句子y′，需要寻找句子对(y′，y)之间的映射关系，也就是情感编辑向量。

为增强情感编辑向量对情感的优化作用，本发明实施例针对一句话中的每个词引入了情感系数这一概念：离情感关键词距离越小的词语的系数越大，离情感关键词距离越大的词语的系数越小。

计算情感编辑向量时，对每个要删改词汇的词向量与其情感系数的乘积求和，从而算出最终的情感编辑向量，具体为：

设：I＝y\y′表示要增添的词语的集合，D＝y′\y表示要删除的词语的集合。

其中：l_w表示词语w与情感关键词之间的距离，α_w表示词语w的情感系数；u和σ²表示参数，本实施例中取u＝0，σ²＝3；Φ(w)表示词语w的词向量，本实施例中将Φ(w)初始化为一个128维度的向量，

代表连接运算。

对向量f增加噪声：增加von-Mises Fisher(vMF)噪声对向量进行随机旋转，增加uniform噪声来改变向量的模长。

设：f_norm＝‖f‖，f_dir＝f/f_norm，使用vMF(v；μ,κ)代表一个在单位球体上的基于点v的vMF分布，其均值向量为μ，聚集参数为k。

q(z_dir|y′,y)＝vMF(z_dir；f_dir,κ)

其中：

表示截断范数，ε表示超参数；

z_dir表示情感编辑向量的方向分量，z_norm表示情感编辑向量的长度分量，Unif表示uniform噪声函数。

最终求得情感编辑向量是z＝z_dir·z_norm。

在步骤S5013中：使用序列到序列模型(Seq2Seq)对上述初始回答进行编辑优化。具体为：

将模板句子y′输入编码器，在每一个时间步，将情感编辑向量z与解码器的状态做连接运算后作为解码器的输入，从而使情感编辑向量来引导优化回答的过程，计算公式如下：

其中：K表示生成回答的最大长度，z表示情感编辑向量，s_i表示解码器的状态。

通过对句子的情感内容编辑优化，得到了中间回答y。

在步骤S502中，计算上述中间回答的衡量指标，包括：连贯度、主题相关度和情感相关度，基于上述指标计算上述中间回答的奖励得分。如图3所示，具体为：

本发明实施例基于三个指标衡量回答：连贯度、主题相关度和情感相关度。

其中，本实施例使用两个Seq2Seq模型来衡量回答的连贯度：

其中：r₁表示回答的连贯度；

p_seq2seq(y|x)代表Seq2Seq模型输出的概率分布，表示基于给定的句子x，生成回答y的概率；

表示基于回答y，生成问句x的概率；

N_y表示回答的长度，N_x表示问句的长度。

本实施例使用预训练的LDA模型衡量回答的主题相关度：

其中：r₂表示回答的主题相关度；

LDA(y)为LDA模型对回答的主题预测概率分布，N_tp表示主题类别的总数。

本实施例使用卷积神经网络衡量回答的情感相关度：

其中：r₃表示回答的情感相关度；

k^et为指定的情感类别，D^et(y)为分类器对回答的预测概率分布，N_et表示情感类别的总数。

综合上述指标，对于一个回答y，其奖励得分为以上提出的指标的加权和：

r(a,[x,y])＝λ₁r₁+λ₂r₂+λ₃r₃

其中：a表示由问句x生成回答y的过程。

为了加强对回答生成过程的约束，对每一个生成的子句都计算奖励得分。由于每一个子句的侧重点不同，其计算奖励时的权重λ也就不同，对于y^et子句，更注重情感相关度；对于子句y^md，情感相关度和主题相关度都要注意；对于子句y^tp，更注重主题相关度。最终的回答更注重整句话连贯度，保证回答在拼接、编辑后的流畅度。每个子句的奖励计算公式整理如下：

r^et＝0.2r₁+0.2r₂+0.6r₃

r^md＝0.2r₁+0.4r₂+0.4r₃

r^tp＝0.2r₁+0.6r₂+0.2r₃

r＝0.5r₁+0.25r₂+0.25r₃

其中：其中r^et，r^md和r^tp分别表示三个子句y^et，y^md和y^tp的奖励得分；

r代表回答被拼接，裁剪优化之后的的奖励得分。

回答的最终奖励得分为：

R(a,[x,y])＝r^et+r^md+r^tp+r。

具体的，本发明实施例在实施过程中也可以：在生成三个子句后分别计算三个子句的奖励得分，再将子句组合生成初始回答；对初始回答编辑优化，得到中间回答，再结合三个子句的奖励得分计算中间回答的奖励得分。

在步骤S503中，基于上述奖励得分对上述中间回答进行优化，生成最终回答。

使用policy gradient策略来搜索能够使奖励期望值最大的参数，目标函数是最大化未来奖励的期望值：

其中：x_i表示问句，y_i表示生成的回答，a_i表示由x_i生成y_i的过程，R(a_i,[x_i,y_i])表示由a_i所的奖励得分，p(a_1:T)表示a₁-a_T的概率。

上述公式表示：累计从1-T生成回答的奖励值，计算目标期望值，并最大这个目标期望值。

使用似然比技巧进行梯度更新优化：

综上所述，与现有技术相比，具备以下有益效果：

1、本发明实施例针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词；由关键词位置关系生成三个子句：情感关键词侧子句、中间子句和主题关键词侧子句，将三个子句组合生成初始回答；确定模板句子，计算情感编辑向量，对初始回答编辑优化，再计算奖励得分；基于奖励得分再进行优化，生成最终回答。本发明实施例在分析用户情感时预测并生成情感关键词，通过情感关键词生成子句并得到具有情感元素的回答，通过模板句子和情感编辑向量对回答进行编辑优化，使得回答更加具备情感色彩，真正的实现了与用户的情感交互，增强了用户的使用体验感。

2、不同于传统方法从左到右生成文本的模式，本发明实施例提供了一种新型的异步对话生成框架：将一个句子分为三个子句迭代生成，这使得预生成的知识和已经生成的句子可以逐级的向下传递信息，并且这种方法生成的回答更加符合人们说话的自然习惯，提高了回答的流畅性，能够生成更加优质的回答。

3、本发明实施例结合挑选出的模板和情感编辑向量对生成的回答进行编辑优化，保证回答受到准确的、细粒度的约束，有效的控制了情感元素。

4、本发明实施例从连贯度、主题相关度、情感相关度三方面综合衡量生成的回答，使这三个指标相互促进、紧密结合，将原本分离的指标深入到词法、句法、语法层次，加强了文本的流畅度，多元性和情感强度。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于情感编辑的对话方法，其特征在于，包括以下步骤：

S1、获取待回答的问句，对所述问句进行预处理；

S3、生成所述情感关键词和所述主题关键词；

S5、确定模板句子，计算情感编辑向量，并对所述初始回答编辑优化，得到中间回答；计算所述中间回答的奖励得分；对所述中间回答进行优化，生成最终回答；

对所述问句进行预处理，包括：

利用注意力机制对所述问句进行编码，得到权重向量；

所述初始回答的生成方法包括：

设置起始符和结束符；

2.如权利要求1所述的对话方法，其特征在于，生成所述情感关键词，包括：

基于预训练的情感词典指定情感类别；

将所述情感类别转化为情感类别向量；

将概率最大的关键词作为所述情感关键词。

3.如权利要求1所述的对话方法，其特征在于，生成所述主题关键词，包括：

将所述主题类别转化为主题类别向量；

将概率最大的关键词作为所述主题关键词。

4.如权利要求1所述的对话方法，其特征在于，所述步骤S5包括：

5.如权利要求4所述的对话方法，其特征在于，所述连贯度的计算方法为：

其中：

r₁表示回答的连贯度；

p_seq2seq(y|x)表示基于给定的句子x，生成回答y的概率；

表示基于回答y，生成问句x的概率；

N_y表示回答的长度；

N_x表示问句的长度。

6.如权利要求4所述的对话方法，其特征在于，所述主题相关度的计算方法为：

其中：

r₂表示回答的主题相关度；

k^tp表示给定句子的主题类别；

LDA(y)表示回答的主题预测概率分布；

N_tp表示主题类别的总数。

7.如权利要求4所述的对话方法，其特征在于，所述情感相关度的计算方法为：

其中：

r₃表示回答的情感相关度；

k^et表示指定的情感类别；

D^et(y)表示回答的预测概率分布；

N_et表示情感类别的总数。

8.如权利要求4所述的对话方法，其特征在于，所述中间回答的奖励得分的计算方法为：

基于所述衡量指标计算所述情感关键词侧子句的奖励得分；

基于所述衡量指标计算所述主题关键词侧子句的奖励得分；

基于所述衡量指标计算所述中间子句的奖励得分；

基于三个子句的奖励得分计算所述中间回答的奖励得分。