CN110046239B - 基于情感编辑的对话方法 - Google Patents

基于情感编辑的对话方法 Download PDF

Info

Publication number
CN110046239B
CN110046239B CN201910299459.9A CN201910299459A CN110046239B CN 110046239 B CN110046239 B CN 110046239B CN 201910299459 A CN201910299459 A CN 201910299459A CN 110046239 B CN110046239 B CN 110046239B
Authority
CN
China
Prior art keywords
emotion
answer
keywords
topic
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910299459.9A
Other languages
English (en)
Other versions
CN110046239A (zh
Inventor
孙晓
李佳
卫星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201910299459.9A priority Critical patent/CN110046239B/zh
Publication of CN110046239A publication Critical patent/CN110046239A/zh
Application granted granted Critical
Publication of CN110046239B publication Critical patent/CN110046239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于情感编辑的对话方法,涉及人机交互领域。包括以下步骤:获取待回答的问句,对所述问句进行预处理;预测回答中情感关键词和主题关键词之间的位置关系;生成所述情感关键词和所述主题关键词;生成初始回答;确定模板句子,计算情感编辑向量,对所述初始回答进行编辑优化,生成中间回答;计算所述中间回答的奖励得分;对所述中间回答进行优化,生成最终回答。本发明可以实现情感交互。

Description

基于情感编辑的对话方法
技术领域
本发明涉及人机交互技术领域,具体涉及一种基于情感编辑的对话方法。
背景技术
近年来,随着人工智能与机器人领域如火如荼的发展,融入情感元素的机器人在相关研究中的地位越来越重要。具有情感的交互方式能够实现更加友好的机器与人类的交互界面,因此能够实现情感交互的人工智能有更高的实用价值和现实意义。
现有技术中的人机对话主要利用资料库对用户的对话进行分析,然后使用语言处理技术生成相应的回答作为回复。
现有技术的对话方法只是分析出了用户的情感,而相应的情感元素并未融入到生成的回答中,不能够实现真正的情感交互。因此,现有技术存在不能实现情感交互的缺点。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于情感编辑的对话方法,解决了现有技术不能实现情感交互的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明解决其技术问题所提供的一种基于情感编辑的对话方法,包括以下步骤:
S1、获取待回答的问句,对所述问句进行预处理;
S2、预测所述问句的回答中情感关键词和主题关键词之间的位置关系,所述位置关系包括以下至少一种:无关键词,只有一个情感关键词,只有一个主题关键词,包含情感关键词和主题关键词且位置关系为情感关键词在前和主题关键词在后,以及包含情感关键词和主题关键词且位置关系为主题关键词在前和情感关键词在后;
S3、生成所述情感关键词和所述主题关键词;
S4、根据所述问句、所述情感关键词、所述主题关键词以及所述位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将所述三个子句组合生成初始回答;
S5、确定模板句子,计算情感编辑向量,并对所述初始回答编辑优化,得到中间回答;计算所述中间回答的奖励得分;对所述中间回答进行优化,生成最终回答。
优选的,对所述问句进行预处理,包括:
利用注意力机制对所述问句进行编码,得到权重向量。
优选的,生成所述情感关键词,包括:
基于预训练的情感词典指定情感类别;
将所述情感类别转化为情感类别向量;
基于所述情感类别向量和所述权重向量计算所述情感词典中关键词的概率分布;
将概率最大的关键词作为所述情感关键词。
优选的,生成所述主题关键词,包括:
将所述问句输入预训练的隐含狄利克雷分布模型,获得所述回答的主题类别;
将所述主题类别转化为主题类别向量;
基于所述主题类别向量和所述权重向量计算模型中关键词的概率分布;
将概率最大的关键词作为所述主题关键词。
优选的,所述初始回答的生成方法包括:
设置起始符和结束符;
以起始符为起点,位置在前的关键词为终点,基于所述权重向量生成第一子句;
以位置在前的关键词为起点,位置在后的关键词为终点,基于所述第一子句生成第二子句;
以位置在后的关键词为起点,结束符为终点,基于第一子句和第二子句生成第三子句;
将三个子句和两个关键词按位置顺序组合,生成所述初始回答。
优选的,所述步骤S5包括:
S501、基于所述情感关键词、所述主题关键词以及所述位置关系,按照预先设置的优先级确定模板句子,基于所述模板句子计算情感编辑向量,基于所述模板句子和所述情感编辑向量,使用序列到序列模型对所述初始回答进行编辑优化,生成中间回答;
S502、计算所述中间回答的衡量指标,包括:连贯度、主题相关度和情感相关度,基于所述指标计算所述中间回答的奖励得分;
S503、基于所述奖励得分对所述中间回答进行优化,生成最终回答。
优选的,所述连贯度的计算方法为:
Figure GDA0002724035020000041
其中:
r1表示回答的连贯度;
pseq2seq(y|x)表示基于给定的句子x,生成回答y的概率;
Figure GDA0002724035020000042
表示基于回答y,生成问句x的概率;
Ny表示回答的长度;
Nx表示问句的长度。
优选的,所述主题相关度的计算方法为:
Figure GDA0002724035020000043
其中:
r2表示回答的主题相关度;
ktp表示给定句子的主题类别;
LDA(y)表示回答的主题预测概率分布;
Ntp表示主题类别的总数。
优选的,所述情感相关度的计算方法为:
Figure GDA0002724035020000051
其中:
r3表示回答的情感相关度;
ket表示指定的情感类别;
Det(y)表示回答的预测概率分布;
Net表示情感类别的总数。
优选的,所述中间回答的奖励得分的计算方法为:
基于所述衡量指标计算所述情感关键词侧子句的奖励得分;
基于所述衡量指标计算所述主题关键词侧子句的奖励得分;
基于所述衡量指标计算所述中间子句的奖励得分;
基于三个子句的奖励得分计算所述中间回答的奖励得分。
(三)有益效果
本发明提供了一种基于情感编辑的对话方法。与现有技术相比,具备以下有益效果:
本发明针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词;由关键词位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将三个子句组合生成初始回答;确定模板句子,计算情感编辑向量,对初始回答编辑优化,再计算奖励得分;基于奖励得分再进行优化,生成最终回答。本发明在分析用户情感时预测并生成情感关键词,通过情感关键词生成子句并得到具有情感元素的回答,通过模板句子和情感编辑向量对回答进行编辑优化,使得回答更加具备情感色彩,真正的实现了与用户的情感交互,增强了用户的使用体验感。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的基于情感编辑的对话方法的整体流程图;
图2为本发明实施例步骤S4中提供的异步对话生成框架的示意图;
图3为本发明实施例步骤S502中奖励得分的计算流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于情感编辑的对话方法,解决了现有技术不能实现情感交互的问题,实现了与用户的情感交互。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词;由关键词位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将三个子句组合生成初始回答;确定模板句子,计算情感编辑向量,对初始回答编辑优化,再计算奖励得分;基于奖励得分再进行优化,生成最终回答。本发明实施例在分析用户情感时预测并生成情感关键词,通过情感关键词生成子句并得到具有情感元素的回答,通过模板句子和情感编辑向量对回答进行编辑优化,使得回答更加具备情感色彩,真正的实现了与用户的情感交互,增强了用户的使用体验感。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明实施例提供了一种基于情感编辑的对话方法,如图1所示,上述方法包括以下步骤:
S1、获取待回答的问句,对所述问句进行预处理;
S2、预测所述问句的回答中情感关键词和主题关键词之间的位置关系,所述位置关系包括以下至少一种:无关键词,只有一个情感关键词,只有一个主题关键词,包含情感关键词和主题关键词且位置关系为情感关键词在前和主题关键词在后,以及包含情感关键词和主题关键词且位置关系为主题关键词在前和情感关键词在后;
S3、生成所述情感关键词和所述主题关键词;
S4、根据所述问句、所述情感关键词、所述主题关键词以及所述位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将所述三个子句组合生成初始回答;
S5、确定模板句子,计算情感编辑向量,并对所述初始回答编辑优化,得到中间回答;计算所述中间回答的奖励得分;对所述中间回答进行优化,生成最终回答。
本发明实施例在具体实施时,针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词;由关键词位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将三个子句组合生成初始回答;确定模板句子,计算情感编辑向量,对初始回答编辑优化,再计算奖励得分;基于奖励得分再进行优化,生成最终回答。本发明实施例在分析用户情感时预测并生成情感关键词,通过情感关键词生成子句并得到具有情感元素的回答,通过模板句子和情感编辑向量对回答进行编辑优化,使得回答更加具备情感色彩,真正的实现了与用户的情感交互,增强了用户的使用体验感。
下面对各步骤进行详细描述。
在步骤S1中,获取待回答的问句,对上述问句进行预处理。具体的,利用编码器对问句进行编码得出隐向量序列h,问句的编码器采用的是门控循环单元(GRU),给定一个序列x=(x1,x2,x3,…,xT),隐藏变量将不断更新:
ht=GRU(ht-1,xt)
其中:xt是第t个词的索引,ht-1是t-1时刻的编码器的状态,ht是编码器t时刻的状态。
利用注意力机制计算权重向量,用于后续计算,具体为:
Figure GDA0002724035020000091
Figure GDA0002724035020000092
Figure GDA0002724035020000093
其中:ck,*表示权重向量,*∈{et,tp}表示是主题或者情感,
Figure GDA0002724035020000094
Figure GDA0002724035020000095
Figure GDA0002724035020000096
表示控制参数。
在步骤S2中,预测回答中情感关键词和主题关键词之间的位置关系。
具体的,可以包括以下几种情况:
zs=0:无关键词,使用一个普通的前向解码器来生成回答;
zs=1:只有一个情感关键词,可以使用一个异步解码器从情感关键词开始生成回答;
zs=2:只有一个主题关键词,可以使用一个异步解码器从主题关键词开始生成回答;
zs=3:包含情感关键词和主题关键词,且位置关系为情感关键词在前,主题关键词在后;
zs=4:包含情感关键词和主题关键词,且位置关系为主题关键词在前,情感关键词在后。
计算上述情况的概率:
Figure GDA0002724035020000097
其中:
Figure GDA0002724035020000098
表示问句x的隐向量序列,Ws为自行设定的参数。
在步骤S3中,生成上述情感关键词和主题关键词。
具体的,情感关键词确定步骤如下:
S3011、首先基于情感知识库构建情感词典。词典中包含七种情感类别:开心,喜欢,伤心,生气,恐惧,厌恶和惊讶,关键词共计27466个。
S3012、确定回答所倾向的情感类别。本发明实施例中的情感类别情感类别可以通过人为指定以上七种类别之一即可。
S3013、将上述情感类别转化为情感类别向量;
S3014、基于上述情感类别向量和上述权重向量计算上述情感词典中关键词的概率分布:
Figure GDA0002724035020000101
其中:
Figure GDA0002724035020000102
表示情感关键词,
Figure GDA0002724035020000103
表示网络参数,ck,et为情感的权重向量。
从情感词典中选出最合适的关键词。本发明实施例将概率最大的关键词作为上述情感关键词。
主题关键词的确定步骤如下:
S3021、预训练隐含狄利克雷分布模型(LDA)。LDA模型基于网络数据集构建,包括了10种类别的关键词,每种类别100个词,共计1000个词。
S3022、将问句输入LDA模型中,确定回答所倾向的主题类别。
S3023、将上述主题类别转化为主题类别向量;
S3024、基于上述主题类别向量和上述权重向量计算上述主题关键词的概率分布:
Figure GDA0002724035020000111
其中:
Figure GDA0002724035020000112
表示主题关键词,
Figure GDA0002724035020000113
表示网络参数,ck,tp为情感的权重向量。
从LDA模型中选出最合适的关键词。本发明实施例将概率最大的关键词作为上述主题关键词。
在步骤S4中,根据上述问句、上述情感关键词、上述主题关键词以及上述位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将上述三个子句组合生成初始回答。
具体的:对于只包含一个关键词的情况,以这个关键词为起点,依次向后,向前生成句子的其他部分。
对于包含两种关键词的情况,本发明实施例提供了一种新型的异步对话生成框架,即:将一个句子分为三个子句迭代生成。
本发明实施例选取其中一种进行详细叙述,如图2所示,即回答包含情感关键词和主题关键词,且情感关键词在前,主题关键词在后,其他的情况均可类推。
设输入的问句为x=(x1,x2,…,xT);初始回答为y
用ws表示起始符<GO>;we表示结束符<EOS>;
Figure GDA0002724035020000114
表示情感关键词;
Figure GDA0002724035020000115
表示主题关键词;yet表示<GO>与情感关键词之间的部分,即情感侧子句;ymd表示情感关键词和主题关键词之间的部分,即中间字句;ytp表示主题关键词与<EOS>之间的部分,即主题侧子句。整个回答被分为三个子句:yet,ymd,ytp,模型也将分三个步骤依次生成这三个部分。
步骤Ⅰ:分别以<GO>和
Figure GDA0002724035020000121
为起点和终点,基于权重向量生成yet,计算公式为:
Figure GDA0002724035020000122
步骤Ⅱ:以第一步生成的yet为基础,再分别以
Figure GDA0002724035020000123
Figure GDA0002724035020000124
为起点和终点进行生成ymd,计算公式为:
Figure GDA0002724035020000125
步骤Ⅲ:以第一步生成的yet和第二步生成的ymd为基础,再分别以
Figure GDA0002724035020000126
和<EOS>为起点和终点生成ytp,计算公式为:
Figure GDA0002724035020000127
其中:其中
Figure GDA0002724035020000128
表示关键词的集合,
Figure GDA0002724035020000129
表示三个子句解码过程中的中间状态,g表示编码器。
至此,获得了三个子句,再根据情感关键词和主题关键词的位置关系将子句和关键词组合起来得到初始回答。
本实施例中的初始回答为:
Figure GDA00027240350200001210
在步骤S5中,确定模板句子,计算情感编辑向量,并对上述初始回答编辑优化,得到中间回答;计算上述中间回答的奖励得分;对上述中间回答进行优化,生成最终回答。具体为:
在步骤S501中,基于上述情感关键词、上述主题关键词以及上述位置关系,按照预先设置的优先级确定模板句子,基于上述模板句子计算情感编辑向量,基于上述模板句子和上述情感编辑向量,使用序列到序列模型对上述初始回答进行编辑优化,生成中间回答。
在步骤S5011中,确定模板句子。
根据上述情感关键词、上述主题关键词以及二者的位置关系,在训练集χ中寻找最合适的模板句子y′。选择模板的优先级如下:包含相同的关键词且位置关系也相同的句子,包含相同关键词但位置关系不同的句子,只有主题关键词相同的句子,只有情感关键词相同的句子。对于优先级相同的句子使用基于词法级别的相似度区分:
L(y,y′)=dJ(y,y′)
其中:dJ(y,y′)是模板句子y′与中间回答y之间的杰卡德距离。
根据以上规则选出优先级最高且与候选回答相似度最高的句子作为模板句子y′。
在步骤S5012中,计算情感编辑向量。
通过得到的模板句子y′,需要寻找句子对(y′,y)之间的映射关系,也就是情感编辑向量。
为增强情感编辑向量对情感的优化作用,本发明实施例针对一句话中的每个词引入了情感系数这一概念:离情感关键词距离越小的词语的系数越大,离情感关键词距离越大的词语的系数越小。
计算情感编辑向量时,对每个要删改词汇的词向量与其情感系数的乘积求和,从而算出最终的情感编辑向量,具体为:
设:I=y\y′表示要增添的词语的集合,D=y′\y表示要删除的词语的集合。
Figure GDA0002724035020000141
Figure GDA0002724035020000142
其中:lw表示词语w与情感关键词之间的距离,αw表示词语w的情感系数;u和σ2表示参数,本实施例中取u=0,σ2=3;Φ(w)表示词语w的词向量,本实施例中将Φ(w)初始化为一个128维度的向量,
Figure GDA0002724035020000143
代表连接运算。
对向量f增加噪声:增加von-Mises Fisher(vMF)噪声对向量进行随机旋转,增加uniform噪声来改变向量的模长。
设:fnorm=‖f‖,fdir=f/fnorm,使用vMF(v;μ,κ)代表一个在单位球体上的基于点v的vMF分布,其均值向量为μ,聚集参数为k。
q(zdir|y′,y)=vMF(zdir;fdir,κ)
Figure GDA0002724035020000144
其中:
Figure GDA0002724035020000145
表示截断范数,ε表示超参数;
zdir表示情感编辑向量的方向分量,znorm表示情感编辑向量的长度分量,Unif表示uniform噪声函数。
最终求得情感编辑向量是z=zdir·znorm
在步骤S5013中:使用序列到序列模型(Seq2Seq)对上述初始回答进行编辑优化。具体为:
将模板句子y′输入编码器,在每一个时间步,将情感编辑向量z与解码器的状态做连接运算后作为解码器的输入,从而使情感编辑向量来引导优化回答的过程,计算公式如下:
Figure GDA0002724035020000151
其中:K表示生成回答的最大长度,z表示情感编辑向量,si表示解码器的状态。
通过对句子的情感内容编辑优化,得到了中间回答y。
在步骤S502中,计算上述中间回答的衡量指标,包括:连贯度、主题相关度和情感相关度,基于上述指标计算上述中间回答的奖励得分。如图3所示,具体为:
本发明实施例基于三个指标衡量回答:连贯度、主题相关度和情感相关度。
其中,本实施例使用两个Seq2Seq模型来衡量回答的连贯度:
Figure GDA0002724035020000152
其中:r1表示回答的连贯度;
pseq2seq(y|x)代表Seq2Seq模型输出的概率分布,表示基于给定的句子x,生成回答y的概率;
Figure GDA0002724035020000153
表示基于回答y,生成问句x的概率;
Ny表示回答的长度,Nx表示问句的长度。
本实施例使用预训练的LDA模型衡量回答的主题相关度:
Figure GDA0002724035020000154
其中:r2表示回答的主题相关度;
LDA(y)为LDA模型对回答的主题预测概率分布,Ntp表示主题类别的总数。
本实施例使用卷积神经网络衡量回答的情感相关度:
Figure GDA0002724035020000161
其中:r3表示回答的情感相关度;
ket为指定的情感类别,Det(y)为分类器对回答的预测概率分布,Net表示情感类别的总数。
综合上述指标,对于一个回答y,其奖励得分为以上提出的指标的加权和:
r(a,[x,y])=λ1r12r23r3
其中:a表示由问句x生成回答y的过程。
为了加强对回答生成过程的约束,对每一个生成的子句都计算奖励得分。由于每一个子句的侧重点不同,其计算奖励时的权重λ也就不同,对于yet子句,更注重情感相关度;对于子句ymd,情感相关度和主题相关度都要注意;对于子句ytp,更注重主题相关度。最终的回答更注重整句话连贯度,保证回答在拼接、编辑后的流畅度。每个子句的奖励计算公式整理如下:
ret=0.2r1+0.2r2+0.6r3
rmd=0.2r1+0.4r2+0.4r3
rtp=0.2r1+0.6r2+0.2r3
r=0.5r1+0.25r2+0.25r3
其中:其中ret,rmd和rtp分别表示三个子句yet,ymd和ytp的奖励得分;
r代表回答被拼接,裁剪优化之后的的奖励得分。
回答的最终奖励得分为:
R(a,[x,y])=ret+rmd+rtp+r。
具体的,本发明实施例在实施过程中也可以:在生成三个子句后分别计算三个子句的奖励得分,再将子句组合生成初始回答;对初始回答编辑优化,得到中间回答,再结合三个子句的奖励得分计算中间回答的奖励得分。
在步骤S503中,基于上述奖励得分对上述中间回答进行优化,生成最终回答。
使用policy gradient策略来搜索能够使奖励期望值最大的参数,目标函数是最大化未来奖励的期望值:
Figure GDA0002724035020000171
其中:xi表示问句,yi表示生成的回答,ai表示由xi生成yi的过程,R(ai,[xi,yi])表示由ai所的奖励得分,p(a1:T)表示a1-aT的概率。
上述公式表示:累计从1-T生成回答的奖励值,计算目标期望值,并最大这个目标期望值。
使用似然比技巧进行梯度更新优化:
Figure GDA0002724035020000172
综上所述,与现有技术相比,具备以下有益效果:
1、本发明实施例针对问句预测回答中情感关键词和主题关键词的位置关系并生成情感关键词和主题关键词;由关键词位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将三个子句组合生成初始回答;确定模板句子,计算情感编辑向量,对初始回答编辑优化,再计算奖励得分;基于奖励得分再进行优化,生成最终回答。本发明实施例在分析用户情感时预测并生成情感关键词,通过情感关键词生成子句并得到具有情感元素的回答,通过模板句子和情感编辑向量对回答进行编辑优化,使得回答更加具备情感色彩,真正的实现了与用户的情感交互,增强了用户的使用体验感。
2、不同于传统方法从左到右生成文本的模式,本发明实施例提供了一种新型的异步对话生成框架:将一个句子分为三个子句迭代生成,这使得预生成的知识和已经生成的句子可以逐级的向下传递信息,并且这种方法生成的回答更加符合人们说话的自然习惯,提高了回答的流畅性,能够生成更加优质的回答。
3、本发明实施例结合挑选出的模板和情感编辑向量对生成的回答进行编辑优化,保证回答受到准确的、细粒度的约束,有效的控制了情感元素。
4、本发明实施例从连贯度、主题相关度、情感相关度三方面综合衡量生成的回答,使这三个指标相互促进、紧密结合,将原本分离的指标深入到词法、句法、语法层次,加强了文本的流畅度,多元性和情感强度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种基于情感编辑的对话方法,其特征在于,包括以下步骤:
S1、获取待回答的问句,对所述问句进行预处理;
S2、预测所述问句的回答中情感关键词和主题关键词之间的位置关系,所述位置关系包括以下至少一种:无关键词,只有一个情感关键词,只有一个主题关键词,包含情感关键词和主题关键词且位置关系为情感关键词在前和主题关键词在后,以及包含情感关键词和主题关键词且位置关系为主题关键词在前和情感关键词在后;
S3、生成所述情感关键词和所述主题关键词;
S4、根据所述问句、所述情感关键词、所述主题关键词以及所述位置关系生成三个子句:情感关键词侧子句、中间子句和主题关键词侧子句,将所述三个子句组合生成初始回答;
S5、确定模板句子,计算情感编辑向量,并对所述初始回答编辑优化,得到中间回答;计算所述中间回答的奖励得分;对所述中间回答进行优化,生成最终回答;
对所述问句进行预处理,包括:
利用注意力机制对所述问句进行编码,得到权重向量;
所述初始回答的生成方法包括:
设置起始符和结束符;
以起始符为起点,位置在前的关键词为终点,基于所述权重向量生成第一子句;
以位置在前的关键词为起点,位置在后的关键词为终点,基于所述第一子句生成第二子句;
以位置在后的关键词为起点,结束符为终点,基于第一子句和第二子句生成第三子句;
将三个子句和两个关键词按位置顺序组合,生成所述初始回答。
2.如权利要求1所述的对话方法,其特征在于,生成所述情感关键词,包括:
基于预训练的情感词典指定情感类别;
将所述情感类别转化为情感类别向量;
基于所述情感类别向量和所述权重向量计算所述情感词典中关键词的概率分布;
将概率最大的关键词作为所述情感关键词。
3.如权利要求1所述的对话方法,其特征在于,生成所述主题关键词,包括:
将所述问句输入预训练的隐含狄利克雷分布模型,获得所述回答的主题类别;
将所述主题类别转化为主题类别向量;
基于所述主题类别向量和所述权重向量计算模型中关键词的概率分布;
将概率最大的关键词作为所述主题关键词。
4.如权利要求1所述的对话方法,其特征在于,所述步骤S5包括:
S501、基于所述情感关键词、所述主题关键词以及所述位置关系,按照预先设置的优先级确定模板句子,基于所述模板句子计算情感编辑向量,基于所述模板句子和所述情感编辑向量,使用序列到序列模型对所述初始回答进行编辑优化,生成中间回答;
S502、计算所述中间回答的衡量指标,包括:连贯度、主题相关度和情感相关度,基于所述指标计算所述中间回答的奖励得分;
S503、基于所述奖励得分对所述中间回答进行优化,生成最终回答。
5.如权利要求4所述的对话方法,其特征在于,所述连贯度的计算方法为:
Figure FDA0002724035010000031
其中:
r1表示回答的连贯度;
pseq2seq(y|x)表示基于给定的句子x,生成回答y的概率;
Figure FDA0002724035010000032
表示基于回答y,生成问句x的概率;
Ny表示回答的长度;
Nx表示问句的长度。
6.如权利要求4所述的对话方法,其特征在于,所述主题相关度的计算方法为:
Figure FDA0002724035010000033
其中:
r2表示回答的主题相关度;
ktp表示给定句子的主题类别;
LDA(y)表示回答的主题预测概率分布;
Ntp表示主题类别的总数。
7.如权利要求4所述的对话方法,其特征在于,所述情感相关度的计算方法为:
Figure FDA0002724035010000041
其中:
r3表示回答的情感相关度;
ket表示指定的情感类别;
Det(y)表示回答的预测概率分布;
Net表示情感类别的总数。
8.如权利要求4所述的对话方法,其特征在于,所述中间回答的奖励得分的计算方法为:
基于所述衡量指标计算所述情感关键词侧子句的奖励得分;
基于所述衡量指标计算所述主题关键词侧子句的奖励得分;
基于所述衡量指标计算所述中间子句的奖励得分;
基于三个子句的奖励得分计算所述中间回答的奖励得分。
CN201910299459.9A 2019-04-15 2019-04-15 基于情感编辑的对话方法 Active CN110046239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910299459.9A CN110046239B (zh) 2019-04-15 2019-04-15 基于情感编辑的对话方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910299459.9A CN110046239B (zh) 2019-04-15 2019-04-15 基于情感编辑的对话方法

Publications (2)

Publication Number Publication Date
CN110046239A CN110046239A (zh) 2019-07-23
CN110046239B true CN110046239B (zh) 2020-12-01

Family

ID=67277048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910299459.9A Active CN110046239B (zh) 2019-04-15 2019-04-15 基于情感编辑的对话方法

Country Status (1)

Country Link
CN (1) CN110046239B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291169B (zh) * 2020-01-16 2024-05-28 中国平安人寿保险股份有限公司 模板编辑回复的方法、装置、设备及存储介质
CN111949762B (zh) * 2020-07-09 2023-12-29 合肥工业大学 基于上下文情感对话的方法和系统、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106104521A (zh) * 2014-01-10 2016-11-09 克鲁伊普公司 用于自动检测文本中的情感的系统、设备和方法
CN107480143A (zh) * 2017-09-12 2017-12-15 山东师范大学 基于上下文相关性的对话话题分割方法和系统
CN108121823A (zh) * 2018-01-11 2018-06-05 哈尔滨工业大学 Babbling情感对话生成系统及方法
CN108256098A (zh) * 2018-01-30 2018-07-06 中国银联股份有限公司 一种确定用户评论情感倾向的方法及装置
CN108595436A (zh) * 2018-04-28 2018-09-28 合肥工业大学 情感对话内容的生成方法和系统、存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN104615755B (zh) * 2015-02-12 2017-12-01 北京航空航天大学 一种基于众包的新型问答系统
CN108491515B (zh) * 2018-03-26 2021-10-01 中国科学技术大学 一种用于校园心理咨询的句对匹配度预测方法
US10593350B2 (en) * 2018-04-21 2020-03-17 International Business Machines Corporation Quantifying customer care utilizing emotional assessments

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106104521A (zh) * 2014-01-10 2016-11-09 克鲁伊普公司 用于自动检测文本中的情感的系统、设备和方法
CN107480143A (zh) * 2017-09-12 2017-12-15 山东师范大学 基于上下文相关性的对话话题分割方法和系统
CN108121823A (zh) * 2018-01-11 2018-06-05 哈尔滨工业大学 Babbling情感对话生成系统及方法
CN108256098A (zh) * 2018-01-30 2018-07-06 中国银联股份有限公司 一种确定用户评论情感倾向的方法及装置
CN108595436A (zh) * 2018-04-28 2018-09-28 合肥工业大学 情感对话内容的生成方法和系统、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Deep Reinforcement Learning for Dialogue Generation;Li Ji-Wei等;《Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing》;20160929;第1192-1202页 *

Also Published As

Publication number Publication date
CN110046239A (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
Csaky Deep learning based chatbot models
Yoon et al. Speech gesture generation from the trimodal context of text, audio, and speaker identity
CN110427617B (zh) 推送信息的生成方法及装置
CN109844741B (zh) 在自动聊天中生成响应
Nie et al. Long dialogue emotion detection based on commonsense knowledge graph guidance
CN110413729B (zh) 基于尾句-上下文双重注意力模型的多轮对话生成方法
Wen et al. Dynamic interactive multiview memory network for emotion recognition in conversation
Bilquise et al. Emotionally intelligent chatbots: a systematic literature review
CN108491514B (zh) 对话系统中提问的方法及装置、电子设备、计算机可读介质
CN109815493B (zh) 一种智能嘻哈音乐歌词生成的建模方法
CN108595436B (zh) 情感对话内容的生成方法和系统、存储介质
CN111241250B (zh) 一种情感对话生成系统和方法
CN111159368A (zh) 一种个性化对话的回复生成方法
Latif et al. Self supervised adversarial domain adaptation for cross-corpus and cross-language speech emotion recognition
CN113435211B (zh) 一种结合外部知识的文本隐式情感分析方法
CN112527966B (zh) 基于Bi-GRU神经网络和自注意力机制的网络文本情感分析方法
CN113326374B (zh) 基于特征增强的短文本情感分类方法及系统
CN113360618B (zh) 一种基于离线强化学习的智能机器人对话方法及系统
CN110046239B (zh) 基于情感编辑的对话方法
CN112818106A (zh) 一种生成式问答的评价方法
CN110032636A (zh) 基于强化学习的情感对话异步生成模型生成文本的方法
CN111949762A (zh) 基于上下文情感对话的方法和系统、存储介质
Matsuyama et al. Automatic expressive opinion sentence generation for enjoyable conversational systems
Mishra et al. GenPADS: Reinforcing politeness in an end-to-end dialogue system
Wang et al. Information-enhanced hierarchical self-attention network for multiturn dialog generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant