CN108595436B - 情感对话内容的生成方法和系统、存储介质 - Google Patents

情感对话内容的生成方法和系统、存储介质 Download PDF

Info

Publication number
CN108595436B
CN108595436B CN201810413567.XA CN201810413567A CN108595436B CN 108595436 B CN108595436 B CN 108595436B CN 201810413567 A CN201810413567 A CN 201810413567A CN 108595436 B CN108595436 B CN 108595436B
Authority
CN
China
Prior art keywords
emotion
content
topic
reply
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810413567.XA
Other languages
English (en)
Other versions
CN108595436A (zh
Inventor
孙晓
李静远
丁帅
杨善林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201810413567.XA priority Critical patent/CN108595436B/zh
Publication of CN108595436A publication Critical patent/CN108595436A/zh
Application granted granted Critical
Publication of CN108595436B publication Critical patent/CN108595436B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种情感对话内容的生成方法和系统、存储介质,涉及人工智能技术领域。该方法包括:获取待回复会话,并确定主题关键词和情感关键词;生成中间内容;将情感关键词、中间内容和主题关键词拼接,得到第一正向拼接序列和第一反向拼接序列,生成情感关键词侧的内容和主题关键词侧的内容;将情感关键词侧的内容、第一正向拼接序列和主题关键词侧的内容依次拼接,得到第二正向拼接序列;将主题关键词侧的内容、第一反向拼接序列和情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定第二正向拼接序列和第二反向拼接序列作为回复会话的概率,将概率较大的拼接序列作为回复会话。由于回复会话中添加了情感关键词,能够与用户进行情感交互。

Description

情感对话内容的生成方法和系统、存储介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种情感对话内容的生成方法和系统、存储介质。
背景技术
近年来,随着人工智能与深度学习技术的发展,情感机器人作为市场潜力巨大的商业应用而逐渐受到社会上的关注。而情感对话作为情感机器人与用户之间交互的主要方式,是情感机器人的核心技术之一,在“个性化用户建模”、“机器人陪护”、“儿童教育”等方面都有着非常广泛的应用前景。
然而,现有的对话技术只是单纯的对用户的对话进行语义分析,然后利用自然语言处理相关技术直接生成机器人的回复。在整个过程中,情感因素并没有真正的被纳入对话生成的考量中。所以,目前的情感机器人大部分只停留在了“情感分析”的层次,离真正的”情感交互”仍有很大的距离。而在人们的日常交流中,70~80%的内容都是包含情感信息的。所以说,如果机器人无法对用户对话中的情感作出相应的反馈,无疑会大大降低产品的实际体验效果。换句话说,如果机器人可以在对话中及时对用户的情感作出反应,就可以提高交互的效率,在同等条件下让用户更易接受产品。并且,能够回应用户的情感,在某些场景下也是必不可少的,例如:在空巢老人的陪护中,有情感的交流能够提升老人的幸福感和归属感,减轻老人的心理负担;在抑郁症、自杀倾向的心理治疗中,对患者进行正确的情感引导,甚至可以挽救年轻的生命。由此可见,情感作为人机交互的核心,是对话技术必须越过的一道门槛。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种情感对话内容的生成方法和系统、存储介质,能够与用户进行情感交互。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明提供的情感对话内容的生成方法包括:
获取待回复会话,并确定所述待回复会话的回复会话的主题关键词和情感关键词;
根据所述待回复会话、所述主题关键词和所述情感关键词,生成中间内容;其中,所述中间内容为所述回复会话中所述主题关键词和所述情感关键词之间的内容;
将所述情感关键词、所述中间内容和所述主题关键词依次拼接,得到第一正向拼接序列,并根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容;将所述主题关键词、所述中间内容和所述情感关键词依次拼接,得到第一反向拼接序列,并根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容;
将所述情感关键词侧的内容、所述第一正向拼接序列和所述主题关键词侧的内容依次拼接,得到第二正向拼接序列;将所述主题关键词侧的内容、所述第一反向拼接序列和所述情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,并将概率较大的拼接序列作为所述回复会话。
第二方面,本发明提供的情感对话内容的生成系统包括:
关键词确定模块,用于获取待回复会话,并确定所述待回复会话的回复会话的主题关键词和情感关键词;
中间内容生成模块,用于根据所述待回复会话、所述主题关键词和所述情感关键词,生成中间内容;其中,所述中间内容为所述回复会话中所述主题关键词和所述情感关键词之间的内容;
两侧内容生成模块,用于将所述情感关键词、所述中间内容和所述主题关键词依次拼接,得到第一正向拼接序列,并根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容;将所述主题关键词、所述中间内容和所述情感关键词依次拼接,得到第一反向拼接序列,并根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容;
回复会话确定模块,用于将所述情感关键词侧的内容、所述第一正向拼接序列和所述主题关键词侧的内容依次拼接,得到第二正向拼接序列;将所述主题关键词侧的内容、所述第一反向拼接序列和所述情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,并将概率较大的拼接序列作为所述回复会话。
第三方面,本发明提供的计算机可读存储介质,其上存储有计算机程序,在处理器执行所述计算机程序时可实现以上生成方法。
(三)有益效果
本发明实施例提供的情感对话内容的生成方法和系统、存储介质,具备以下有益效果:确定了情感关键词和主题关键词,并以此为基础扩展出中间内容和两侧内容,进而得到带有感情色彩的回复会话。由于回复会话中添加了情感关键词,能够与用户进行情感交互。而且由于本发明能够准确的分析出会话主题,减少了答非所问的情况发生。另外,本发明对于不同方向的拼接序列,选择概率较大的一个作为回复序列,这样回复会话不局限于一种模式,具有多样性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一实施例中情感对话内容的生成方法的流程示意图;
图2示出了本发明一实施例中主题关键词和情感关键词的确定流程示意图;
图3示出了本发明一实施例中中间内容和两侧内容的确定流程示意图;
图4示出了本发明实施例中根据生成的各部分确定回复会话的流程示意图;
图5示出了本发明一实施例中情感对话内容的生成系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,本发明提供一种情感对话内容的生成方法,如图1所示,该方法包括:
S101、获取待回复会话,并确定所述待回复会话的回复会话的主题关键词和情感关键词;
可理解的是,待回复会话实际上是用户会话,是用户手动输入或语音输入的。回复会话实际上是机器人会话,是机器人根据用户输入的会话进行的回复,也是本发明实施例想要确定的会话。
为避免出现答非所问的情况,回复会话的主题实际上是和待回复会话的主题是一致的,所蕴含的情感也是一致的。因此可依据待回复会话确定回复会话的主题关键词和情感关键词。
其中,如图2所示,主题关键词的确定过程可以包括以下步骤:
S1011a、将所述待回复会话进行编码,得到第一特征向量;
具体可以采用编码器(例如,序列神经网络,简称RNN)对待回复会话进行编码,得到第一特征向量,便于后续的计算。
S1012a、将所述待回复会话输入隐含狄利克雷分布模型,得到所述回复会话所倾向的主题类别;
隐含狄利克雷分布模型是一种文本主题归纳以及预测模型,简称为LDA模型。从NLPCC2017微博数据集中抽取了60000组对话数据作为LDA模型的训练数据,经过训练可以归纳出常见的主题类别有10个,共有1000个主题词,将1000个主题词形成主题知识库。这些主题词为根据先验知识归纳得到,可以称为先验主题信息。
将待回复会话输入LDA模型,该模型分析输入的语句并将其归为主题类别中最合适的一类,即回复会话所倾向的主题类别。
S1013a、将所述回复会话所倾向的主题类别转换为对应的第二特征向量;
S1014a、将所述第一特征向量以及第二特征向量均输入第一全连接神经网络层,以进行维度转换;
第一全连接神经网络层具体可以采用维度转换矩阵实现维度转换,进行维度转换的原因是:第一、二特征向量的维度与后面概率计算的维度一般情况下是不同的,经过维度转换后便于后续的概率计算。
S1015a、根据所述第一全连接神经网络层的输出数据,计算预设的多个主题类别中的每一个主题词出现在所述回复会话中的概率,并将概率最大的主题词作为所述主题关键词;所述多个主题类别中包括所述回复会话所倾向的主题类别,所述回复会话所倾向的主题类别中的主题词的计算权重比其他主题类别中的主题词的计算权重大。
这里,预设的多个主题类别可以是LDA模型的主题知识库的10个主题类别,即预设的多个主题类别的主题词可以为上述1000个主题词。
虽然S1012a中确定了回复会话所倾向的主题类别,但是由于可能会出现所倾向的主题类别存在计算误差等问题,因此这里计算的是多个主题类别的大量主题词对应的概率,而不是仅计算所倾向的主题类别的主题词对应的概率,只不过在计算时所倾向的主题类别中的主题词的计算权重比其他主题类别中的主题词的计算权重大,这样可以提高主题关键词的准确性。
而且,以往基于深度学习技术的对话系统,会话主题的分析和回复会话的生成工作混在一起,导致主题的分析常常不到位,面对用户主题繁多的会话,倾向于选择更加“万金油”的回复(例如,“哈哈”,“是的”等)。而本发明实施例分工明确,主题的分析和回复会话的生成分步进行,而且能够准确到位的分析出会话主题,大大减少了“答非所问”的情况。
举例来说,根据以上步骤可以采用下式计算一个主题类别中的各个主题词分别出现在回复会话中的概率:
Figure BDA0001645923700000061
式中,P为概率,
Figure BDA0001645923700000062
为主题关键词,x为待回复会话,
Figure BDA0001645923700000063
为主题类别,
Figure BDA0001645923700000071
为待回复会话对应的第一特征向量,
Figure BDA0001645923700000072
为主题类别
Figure BDA0001645923700000073
对应的第二特征向量,
Figure BDA0001645923700000074
为维度转换矩阵。
从上式可以看出,将主题类别
Figure BDA0001645923700000075
转换为第二特征向量
Figure BDA0001645923700000076
将待回复会话x转换为第一特征向量
Figure BDA0001645923700000077
并将第一特征向量
Figure BDA0001645923700000078
和第二特征向量
Figure BDA0001645923700000079
进行维度转换后采用softmax函数进行计算,便得到主题类别
Figure BDA00016459237000000710
中的各个主题词分别作为主题关键词
Figure BDA00016459237000000711
的概率。
可以理解的是,情感关键词的确定过程与主题关键词的确定过程类似,如图2所示,具体可以包括以下步骤:
S1011b、将所述待回复会话进行编码,得到第一特征向量;
步骤S1011b可以参考上述步骤S1011a。
S1012b、将所述待回复会话输入情感转移网络,得到所述回复会话所倾向的情感类别;
情感转移网络的作用在于:分析待回复会话中的情感,然后通过一个转移网络,将待回复会话以及情感“转移”至一个最适合反馈给用户的“受众情感”。
情感转移网络采用的情感知识库中的情感类别可以包括7个类别:高兴、喜欢、悲伤、愤怒、恐惧、厌恶、惊讶,共包含27466个情感词,几乎涵盖了人类所有的情感状态。
S1013b、将所述回复会话所倾向的情感类别转换为对应的第三特征向量;
S1014b、将所述第一特征向量以及第三特征向量均输入第二全连接神经网络层,以进行维度转换;
这里,第二全连接神经网络层的作用与第一全连接神经网络层的作用相同,也是进行维度转换。
S1015b、根据所述第二全连接神经网络层的输出数据,计算预设的多个情感类别中的每一个情感词出现在所述回复会话中的概率,并将概率最大的情感词作为所述情感关键词;所述多个情感类别中包括所述回复会话所倾向的情感类别;所述回复会话所倾向的情感类别中的情感词的计算权重比其他情感类别中的情感词的计算权重大。
这里,预设的多个情感类别可以为上述7个类别。
这里计算的是多个情感类别的大量情感词对应的概率,而不是仅计算所倾向的情感类别的情感词对应的概率,只不过在计算时所倾向的主情感类别中的情感词的计算权重比其他情感类别中的情感词的计算权重大,这样可以减少所倾向的情感类别可能存在计算误差所带来的问题,提高情感关键词的准确性。
举例来说,根据以上步骤可以采用下式计算一个情感类别中的各个情感词分别出现在回复会话中的概率:
Figure BDA0001645923700000081
式中,P为概率,
Figure BDA0001645923700000082
为情感关键词,x为待回复会话,
Figure BDA0001645923700000083
为情感类别,
Figure BDA0001645923700000084
为待回复会话对应的第一特征向量,
Figure BDA0001645923700000085
为情感类别
Figure BDA0001645923700000086
对应的第三特征向量,
Figure BDA0001645923700000087
为维度转换矩阵。
从上式可以看出,将情感类别
Figure BDA0001645923700000088
转换为第三特征向量
Figure BDA0001645923700000089
将待回复会话x转换为第一特征向量
Figure BDA00016459237000000810
并将第一特征向量
Figure BDA00016459237000000811
和第三特征向量
Figure BDA00016459237000000812
进行维度转换后采用softmax函数进行计算,便得到情感类别
Figure BDA00016459237000000813
中的各个情感词分别作为情感关键词
Figure BDA00016459237000000814
的概率。
S102、根据所述待回复会话、所述主题关键词和所述情感关键词,生成中间内容;其中,所述中间内容为所述回复会话中所述主题关键词和所述情感关键词之间的内容;
生成中间内容可以包括以下具体步骤:
S1021、根据所述第一特征向量和所述情感关键词,生成情感约束序列;
具体过程可以包括:如图3所示,将待回复会话对应的第一特征向量输入至一个RNN解码器中,同时以步骤S101中得到的情感关键词为基础,该RNN解码器可以解码出一个情感约束序列。
S1022、根据所述第一特征向量、所述主题关键词和所述情感约束序列,生成所述中间内容。
具体过程可以包括:如图3所示,将待回复会话对应的第一特征向量输入至另一个RNN解码器中,在步骤S101中得到的主题关键词的引导下,结合步骤S1021中得到的情感约束序列,该RNN解码器生成中间内容ymd。在这个过程中,情感约束序列可以通过一种被称为“注意力机制”的动态加权方法向该RNN解码器注入情感因素,使整个中间内容“情绪化”。
整个过程的公式表达如下:
Figure BDA0001645923700000091
Figure BDA0001645923700000092
在式(3)中,
Figure BDA0001645923700000093
为情感约束序列对中间内容的第j个词的影响,
Figure BDA0001645923700000094
为情感控制函数,
Figure BDA0001645923700000095
为在情感关键词引导下生成的第i个情感信息累积单元,
Figure BDA0001645923700000096
为在主题关键词引导下生成的第j个主题信息累积单元,K为中间内容的长度,K’为情感关键词的长度,ymd为中间内容,wk为关键词,x为待回复会话,
Figure BDA0001645923700000097
为中间内容的第j个词,
Figure BDA0001645923700000098
分别代表情感关键词和主题关键词,
Figure BDA0001645923700000099
为在情感约束序列的影响下结合第j个主题信息累积单元和中间内容中的第j-1个信息单元得到中间内容第j个单元的概率,P为生成中间内容的总体概率。
其中,情感控制函数
Figure BDA00016459237000000910
(即图3中的情感控制单元)具体如下:
Figure BDA0001645923700000101
Figure BDA0001645923700000102
Figure BDA0001645923700000103
在上式中,
Figure BDA0001645923700000104
代表第i个情感信息累积单元与第j个主题信息累积单元的匹配分数,
Figure BDA0001645923700000105
是控制参数,
Figure BDA0001645923700000106
是进行标准化后的分数,在0~1之间。通过情感约束序列中不同情感信息累积单元对第j个主题信息累积单元的影响分数计算加权和,得到整个情感约束序列对第j个词的影响。
S103、将所述情感关键词、所述中间内容和所述主题关键词依次拼接,得到第一正向拼接序列,并根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容;将所述主题关键词、所述中间内容和所述情感关键词依次拼接,得到第一反向拼接序列,并根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容;
也就是说,所述第一正向拼接序列和所述第一反向拼接序列中所述中间内容位于所述主题关键词和所述情感关键词之间,所述第一正向拼接序列中所述情感关键词位于所述主题关键词之前,所述第一反向拼接序列中所述情感关键词位于所述主题关键词之后。
在实际使用中,主题关键词和情感关键词的相对位置是不固定的,回复会话的结构具体可以被分为以下两种情况:
(1)情感关键词侧的内容-情感关键词-中间内容-主题关键词-主题关键词的内容;
(2)主题关键词的内容-主题关键词-中间内容-情感关键词-情感关键词侧的内容;
通过以上步骤S101~S102,可以得到情感关键词、主题关键词和中间内容,步骤S103中,将之前得到的情感关键词、主题关键词和中间内容进行拼接,得到两个拼接序列:第一正向拼接序列和第一反向拼接序列。举例来说,第一正向拼接序列为
Figure BDA0001645923700000111
第一反向拼接序列为
Figure BDA0001645923700000112
ymd,f,ymd,b分别代表正向和反向的中间内容。
该步骤S103中,根据第一正向拼接序列生成情感关键词侧的内容可以包括以下步骤:
S1031a、对所述第一正向拼接序列进行编码,得到第四特征向量;
如图3所示,具体可以采用一个RNN编码器对第一正向拼接序列进行编码,得到第四特征向量。
S1032a、根据所述第四特征向量,生成所述回复会话中情感关键词侧的内容。
如图3所示,具体可以采用一个RNN解码器对第四特征向量进行解码,得到情感关键词侧的内容。
举例来说,公式表示如下:
Figure BDA0001645923700000113
式中,gf代表RNN编码函数,Pf代表RNN解码函数,P表示生成情感关键词侧的内容的概率。
该步骤S103中,根据所述第一反向拼接序列生成主题关键词侧的内容的过程可以包括以下步骤:
S1031b、对所述第一反向拼接序列进行编码,得到第五特征向量;
如图3所示,具体可以采用一个RNN编码器对第一反向拼接序列进行编码,得到第五特征向量。
S1031b、根据所述第五特征向量,生成所述回复会话中主题关键词侧的内容。
如图3所示,具体可以采用一个RNN解码器对第五特征向量进行解码,得到主题关键词侧的内容。
举例来说,公式表示如下:
Figure BDA0001645923700000121
式中,gb代表RNN编码函数,Pb代表RNN解码函数,P表示生成主题关键词侧的内容的概率。
S104、将所述情感关键词侧的内容、所述第一正向拼接序列和所述主题关键词侧的内容依次拼接,得到第二正向拼接序列;将所述主题关键词侧的内容、所述第一反向拼接序列和所述情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,并将概率较大的拼接序列作为所述回复会话。
也就是说,第二正向拼接序列的拼接顺序为所述情感关键词侧的内容、所述第一正向拼接序列、所述主题关键词侧的内容;第二反向拼接序列的拼接顺序为所述主题关键词侧的内容、所述第一反向拼接序列、所述情感关键词侧的内容。
举例来说,第二正向拼接序列为:
Figure BDA0001645923700000122
第二方向拼接序列为:
Figure BDA0001645923700000123
其中,yce,f为正向的情感关键词侧的内容,yct,f为正向的主题关键词侧的内容。yct,b为反向的主题关键词侧的内容,yce,b为反向的情感关键词侧的内容。
该步骤S104中,如图4所示,确定第二正向拼接序列和第二反向拼接序列作为所述回复会话的概率的过程可以包括以下步骤:
S1041、将所述第二正向拼接序列进行编码,得到第六特征向量,并将所述第二反向拼接序列进行编码,得到第七特征向量;
具体可以采用RNN编码器对第二正向拼接序列和第二反向拼接序列进行拼接。
S1042、根据所述第六特征向量和所述第七特征向量,采用预设的二分类器确定所述第二正向拼接序列和所述第二反向拼接序列分别作为所述回复会话的概率。其中,二分类器可以由第三全连接神经网络层和Sigmoid激活函数组成。
举例来说,公式表示如下:
Figure BDA0001645923700000131
Figure BDA0001645923700000132
式中,d为方向,d=0,表示正向;d=1,表示反向。GRU为用于编码的神经网络。
Figure BDA0001645923700000133
为回复会话中的第i个词,
Figure BDA0001645923700000134
为回复会话,
Figure BDA0001645923700000135
为第二正向拼接序列,
Figure BDA0001645923700000136
为第二反向拼接序列,Wd,f、Wd,b为第三全连接神经网络层的维度转换矩阵。
从上述公式以及图4中可以看出,将第二正向拼接序列中各个词在第六特征向量中对应的元素求和,将第二反向拼接序列中各个词在第七特征向量中对应的元素求和,并利用第三全连接层分别对两个求和结果进行维度转换,然后将两个维度转换结果求和,将求和结果输入Sigmoid激活函数,便得到拼接序列作为回复会话的概率。当将d置为0时,计算的是第二正向拼接序列作为回复序列的概率。当将d置为1时,计算的是第二反向拼接序列作为回复序列的概率。然后比较两个概率的大小,将概率较大的拼接序列作为回复会话。
例如,用户输入会话:要命还是要工作?,也就是说,待回复会话为:要命还是要工作?。分析出的主题关键词为:身体;情感关键词为:小心(情感为害怕),进而生成的中间序列为:自己的。情感关键词一侧的内容为:你要;主题关键词一侧的内容为:啊。各部分进行正向和反向拼接后,计算两个拼接序列的概率,其正向拼接序列的概率较大,因此将其正向拼接序列作为回复会话:你要小心自己的身体啊,可以将该回复会话反馈给用户。
再例如,用户输入会话:生活艰辛但确实很有趣,每天沉浸其中是乐事;分析出的主题关键词为:生活,情感关键词为:乐趣(情感为高兴),生成的中间内容为:的;情感关键词一侧的内容为:中;主题关键词一侧的内容为:在沉浸我。各部分进行正向和反向拼接后,计算两个拼接序列的概率,其反向拼接序列的概率较大,因此将其反向拼接序列作为回复会话:我沉浸在生活的乐趣中,然后将该回复会话反馈给用户。
本发明提供的生成方法,确定了情感关键词和主题关键词,并以此为基础扩展出中间内容和两侧内容,进而得到带有感情色彩的回复会话。由于回复会话中添加了情感关键词,能够与用户进行情感交互。而且由于本发明能够准确的分析出会话主题,减少了答非所问的情况发生。在现有技术中,对话模型受限于单一序列神经网络,对于人类对话模式的学习顺序是一成不变的。但对话本身是千变万化的,很难通过单个神经网络获得良好的效果。而本发明对于不同方向的拼接序列,选择概率较大的一个作为回复序列,这是一种双向异步对话生成方式,这样回复会话不局限于一种模式,具有多样性。
第二方面,本发明提供一种情感对话内容的生成系统,如图5所示,该系统包括:
关键词确定模块,用于获取待回复会话,并确定所述待回复会话的回复会话的主题关键词和情感关键词;
中间内容生成模块,用于根据所述待回复会话、所述主题关键词和所述情感关键词,生成中间内容;其中,所述中间内容为所述回复会话中所述主题关键词和所述情感关键词之间的内容;
两侧内容生成模块,用于将所述情感关键词、所述中间内容和所述主题关键词依次拼接,得到第一正向拼接序列,并根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容;将所述主题关键词、所述中间内容和所述情感关键词依次拼接,得到第一反向拼接序列,并根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容;
回复会话确定模块,用于将所述情感关键词侧的内容、所述第一正向拼接序列和所述主题关键词侧的内容依次拼接,得到第二正向拼接序列;将所述主题关键词侧的内容、所述第一反向拼接序列和所述情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,并将概率较大的拼接序列作为所述回复会话。
在一些实施例中,关键词确定模块具体用于:对所述待回复会话进行编码,得到第一特征向量;将所述待回复会话输入隐含狄利克雷分布模型,得到所述回复会话所倾向的主题类别;将所述回复会话所倾向的主题类别转换为对应的第二特征向量;将所述第一特征向量以及所述第二特征向量均输入第一全连接神经网络层,以进行维度转换;根据所述第一全连接神经网络层的输出数据,计算预设的多个主题类别中的每一个主题词出现在所述回复会话中的概率,并将概率最大的主题词作为所述主题关键词;所述多个主题类别中包括所述回复会话所倾向的主题类别,所述回复会话所倾向的主题类别中的主题词的计算权重比其他主题类别中的主题词的计算权重大。
在一些实施例中,关键词确定模块具体用于:将所述待回复会话输入情感转移网络,得到所述回复会话所倾向的情感类别;将所述回复会话所倾向的情感类别转换为对应的第三特征向量;将所述第一特征向量以及所述第三特征向量均输入第二全连接神经网络层,以进行维度转换;根据所述第二全连接神经网络层的输出数据,计算预设的多个情感类别中的每一个情感词出现在所述回复会话中的概率,并将概率最大的情感词作为所述情感关键词;所述多个情感类别中包括所述回复会话所倾向的情感类别;所述回复会话所倾向的情感类别中的情感词的计算权重比其他情感类别中的情感词的计算权重大。
在一些实施例中,中间内容生成模块具体用于:根据所述第一特征向量和所述情感关键词,生成情感约束序列;根据所述第一特征向量、所述主题关键词和所述情感约束序列,生成所述中间内容。
在一些实施例中,两侧内容生成模块具体用于:对所述第一正向拼接序列进行编码,得到第四特征向量;根据所述第四特征向量,生成所述回复会话中情感关键词侧的内容。
在一些实施例中,两侧内容生成模块具体用于:对所述第一反向拼接序列进行编码,得到第五特征向量;根据所述第五特征向量,生成所述回复会话中主题关键词侧的内容。
在一些实施例中,回复会话确定模块具体用于:将所述第二正向拼接序列进行编码,得到第六特征向量,并将所述第二反向拼接序列进行编码,得到第七特征向量;根据所述第六特征向量和所述第七特征向量,采用预设的二分类器确定所述第二正向拼接序列和所述第二反向拼接序列分别作为所述回复会话的概率。
在一些实施例中,所述二分类器由第三全连接神经网络层和Sigmoid激活函数组成。
可理解的是,本发明提供的生成系统与上述生成方向相对应,其有关内容的解释、举例、实施方式、有益效果等部分可以参考上述生成方法中的相应内容,此处不在赘述。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,在处理器执行所述计算机程序时可实现以上生成方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种情感对话内容的生成方法,其特征在于,包括:
获取待回复会话,并确定所述待回复会话的回复会话的主题关键词和情感关键词;
根据所述待回复会话、所述主题关键词和所述情感关键词,生成中间内容;其中,所述中间内容为所述回复会话中所述主题关键词和所述情感关键词之间的内容;
将所述情感关键词、所述中间内容和所述主题关键词依次拼接,得到第一正向拼接序列,并根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容;将所述主题关键词、所述中间内容和所述情感关键词依次拼接,得到第一反向拼接序列,并根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容;
将所述情感关键词侧的内容、所述第一正向拼接序列和所述主题关键词侧的内容依次拼接,得到第二正向拼接序列;将所述主题关键词侧的内容、所述第一反向拼接序列和所述情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,并将概率较大的拼接序列作为所述回复会话;
确定所述回复会话的主题关键词,包括:
将所述待回复会话进行编码,得到第一特征向量;
将所述待回复会话输入隐含狄利克雷分布模型,得到所述回复会话所倾向的主题类别;
将所述回复会话所倾向的主题类别转换为对应的第二特征向量;
将所述第一特征向量以及所述第二特征向量均输入第一全连接神经网络层,以进行维度转换;
根据所述第一全连接神经网络层的输出数据,计算预设的多个主题类别中的每一个主题词出现在所述回复会话中的概率,并将概率最大的主题词作为所述主题关键词;所述多个主题类别中包括所述回复会话所倾向的主题类别,所述回复会话所倾向的主题类别中的主题词的计算权重比其他主题类别中的主题词的计算权重大;
所述生成中间内容,包括:
根据所述第一特征向量和所述情感关键词,生成情感约束序列;
根据所述第一特征向量、所述主题关键词和所述情感约束序列,生成所述中间内容。
2.根据权利要求1所述的生成方法,其特征在于,确定所述回复会话的情感关键词,包括:
将所述待回复会话输入情感转移网络,得到所述回复会话所倾向的情感类别;
将所述回复会话所倾向的情感类别转换为对应的第三特征向量;
将所述第一特征向量以及所述第三特征向量均输入第二全连接神经网络层,以进行维度转换;
根据所述第二全连接神经网络层的输出数据,计算预设的多个情感类别中的每一个情感词出现在所述回复会话中的概率,并将概率最大的情感词作为所述情感关键词;所述多个情感类别中包括所述回复会话所倾向的情感类别;所述回复会话所倾向的情感类别中的情感词的计算权重比其他情感类别中的情感词的计算权重大。
3.根据权利要求1所述的生成方法,其特征在于,所述根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容,包括:
对所述第一正向拼接序列进行编码,得到第四特征向量;
根据所述第四特征向量,生成所述回复会话中情感关键词侧的内容。
4.根据权利要求1所述的生成方法,其特征在于,所述根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容,包括:
对所述第一反向拼接序列进行编码,得到第五特征向量;
根据所述第五特征向量,生成所述回复会话中主题关键词侧的内容。
5.根据权利要求1所述的生成方法,其特征在于,所述确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,包括:
将所述第二正向拼接序列进行编码,得到第六特征向量,并将所述第二反向拼接序列进行编码,得到第七特征向量;
根据所述第六特征向量和所述第七特征向量,采用预设的二分类器确定所述第二正向拼接序列和所述第二反向拼接序列分别作为所述回复会话的概率。
6.根据权利要求5所述的生成方法,其特征在于,所述二分类器由第三全连接神经网络层和Sigmoid激活函数组成。
7.一种情感对话内容的生成系统,其特征在于,包括:
关键词确定模块,用于获取待回复会话,并确定所述待回复会话的回复会话的主题关键词和情感关键词;
中间内容生成模块,用于根据所述待回复会话、所述主题关键词和所述情感关键词,生成中间内容;其中,所述中间内容为所述回复会话中所述主题关键词和所述情感关键词之间的内容;
两侧内容生成模块,用于将所述情感关键词、所述中间内容和所述主题关键词依次拼接,得到第一正向拼接序列,并根据所述第一正向拼接序列生成所述回复会话中情感关键词侧的内容;将所述主题关键词、所述中间内容和所述情感关键词依次拼接,得到第一反向拼接序列,并根据所述第一反向拼接序列生成所述回复会话中主题关键词侧的内容;
回复会话确定模块,用于将所述情感关键词侧的内容、所述第一正向拼接序列和所述主题关键词侧的内容依次拼接,得到第二正向拼接序列;将所述主题关键词侧的内容、所述第一反向拼接序列和所述情感关键词侧的内容依次拼接,得到第二反向拼接序列;确定所述第二正向拼接序列和所述第二反向拼接序列作为所述回复会话的概率,并将概率较大的拼接序列作为所述回复会话;
确定所述回复会话的主题关键词,包括:
将所述待回复会话进行编码,得到第一特征向量;
将所述待回复会话输入隐含狄利克雷分布模型,得到所述回复会话所倾向的主题类别;
将所述回复会话所倾向的主题类别转换为对应的第二特征向量;
将所述第一特征向量以及所述第二特征向量均输入第一全连接神经网络层,以进行维度转换;
根据所述第一全连接神经网络层的输出数据,计算预设的多个主题类别中的每一个主题词出现在所述回复会话中的概率,并将概率最大的主题词作为所述主题关键词;所述多个主题类别中包括所述回复会话所倾向的主题类别,所述回复会话所倾向的主题类别中的主题词的计算权重比其他主题类别中的主题词的计算权重大;
所述生成中间内容,包括:
根据所述第一特征向量和所述情感关键词,生成情感约束序列;
根据所述第一特征向量、所述主题关键词和所述情感约束序列,生成所述中间内容。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时可实现如权利要求1~6任一项所述的生成方法。
CN201810413567.XA 2018-04-28 2018-04-28 情感对话内容的生成方法和系统、存储介质 Active CN108595436B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810413567.XA CN108595436B (zh) 2018-04-28 2018-04-28 情感对话内容的生成方法和系统、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810413567.XA CN108595436B (zh) 2018-04-28 2018-04-28 情感对话内容的生成方法和系统、存储介质

Publications (2)

Publication Number Publication Date
CN108595436A CN108595436A (zh) 2018-09-28
CN108595436B true CN108595436B (zh) 2021-09-28

Family

ID=63619540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810413567.XA Active CN108595436B (zh) 2018-04-28 2018-04-28 情感对话内容的生成方法和系统、存储介质

Country Status (1)

Country Link
CN (1) CN108595436B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635253B (zh) * 2018-11-13 2024-05-28 平安科技(深圳)有限公司 文本风格转换方法、装置及存储介质、计算机设备
CN109783800B (zh) * 2018-12-13 2024-04-12 北京百度网讯科技有限公司 情感关键词的获取方法、装置、设备及存储介质
CN110046239B (zh) * 2019-04-15 2020-12-01 合肥工业大学 基于情感编辑的对话方法
CN110032636A (zh) * 2019-04-30 2019-07-19 合肥工业大学 基于强化学习的情感对话异步生成模型生成文本的方法
CN111522936B (zh) * 2020-04-24 2023-08-04 上海智臻智能网络科技股份有限公司 一种包含情感的智能客服对话回复生成方法、装置及电子设备
CN111949762B (zh) * 2020-07-09 2023-12-29 合肥工业大学 基于上下文情感对话的方法和系统、存储介质
CN112183107B (zh) * 2020-09-04 2024-08-20 华为技术有限公司 音频的处理方法和装置
CN112765333B (zh) * 2021-01-08 2023-04-07 山东师范大学 基于情感与提示词结合的自动对话生成方法及系统
CN114999610B (zh) * 2022-03-31 2024-08-13 华东师范大学 基于深度学习的情绪感知与支持的对话系统构建方法
CN114610861B (zh) * 2022-05-11 2022-08-26 之江实验室 基于变分自编码器的融入知识和感情的端到端对话方法
CN115495566A (zh) * 2022-10-11 2022-12-20 重庆邮电大学 一种增强文本特征的对话生成方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683672A (zh) * 2016-12-21 2017-05-17 竹间智能科技(上海)有限公司 一种基于情感和语义的智能对话方法及系统
CN107133224A (zh) * 2017-04-25 2017-09-05 中国人民大学 一种基于主题词的语言生成方法
CN107808008A (zh) * 2017-11-17 2018-03-16 合肥工业大学 一种考虑用户特征信息的主题‑情感联合建模方法
CN107924414A (zh) * 2015-09-16 2018-04-17 英特尔公司 促进在计算装置处进行多媒体整合和故事生成的个人辅助

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685454A (zh) * 2008-09-28 2010-03-31 华为技术有限公司 人机交互方法及系统
JP6601069B2 (ja) * 2015-09-01 2019-11-06 カシオ計算機株式会社 対話制御装置、対話制御方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107924414A (zh) * 2015-09-16 2018-04-17 英特尔公司 促进在计算装置处进行多媒体整合和故事生成的个人辅助
CN106683672A (zh) * 2016-12-21 2017-05-17 竹间智能科技(上海)有限公司 一种基于情感和语义的智能对话方法及系统
CN107133224A (zh) * 2017-04-25 2017-09-05 中国人民大学 一种基于主题词的语言生成方法
CN107808008A (zh) * 2017-11-17 2018-03-16 合肥工业大学 一种考虑用户特征信息的主题‑情感联合建模方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Data-Driven Broad-Coverage Grammars for Opinionated Natural Language Generation (ONLG);Tomer Cagan 等;《Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics》;20170804;1331-1341 *
基于CNN语义匹配的自动问答系统构建方法研究;邓憧;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180215(第(2018)02期);I138-2797 *

Also Published As

Publication number Publication date
CN108595436A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108595436B (zh) 情感对话内容的生成方法和系统、存储介质
CN106448670B (zh) 基于深度学习和强化学习的自动回复对话系统
CN111897933B (zh) 情感对话生成方法、装置及情感对话模型训练方法、装置
CN111966800B (zh) 情感对话生成方法、装置及情感对话模型训练方法、装置
CN112818107B (zh) 一种用于日常生活的对话机器人及其聊天方法
CN110297887B (zh) 基于云平台的服务机器人个性化对话系统及方法
CN113435211B (zh) 一种结合外部知识的文本隐式情感分析方法
CN111159368A (zh) 一种个性化对话的回复生成方法
CN109062902B (zh) 一种文本语义表达方法及装置
Hung et al. Towards a method for evaluating naturalness in conversational dialog systems
CN110399472B (zh) 面试提问提示方法、装置、计算机设备及存储介质
CN110046239B (zh) 基于情感编辑的对话方法
CN114911932A (zh) 基于主题语义增强的异构图结构多会话者情感分析方法
CN117556027B (zh) 基于数字人技术的智能交互系统及方法
CN111339274A (zh) 对话生成模型训练方法、对话生成方法及装置
CN114005446A (zh) 情感分析方法、相关设备及可读存储介质
CN110955765A (zh) 智能助理的语料构建方法、装置、计算机设备和存储介质
Wang et al. Information-enhanced hierarchical self-attention network for multiturn dialog generation
CN114328866A (zh) 应答流畅准确的强拟人化智能对话机器人
CN114444510A (zh) 情感交互方法及装置、情感交互模型的训练方法及装置
CN110795531B (zh) 一种意图识别方法、装置及存储介质
CN112364659A (zh) 一种无监督的语义表示自动识别方法及装置
Nishimoto et al. Dialogue management with deep reinforcement learning: Balancing exploration and exploitation
CN113111640A (zh) 语言风格转换方法及装置
CN114610861B (zh) 基于变分自编码器的融入知识和感情的端到端对话方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant