CN115630145A

CN115630145A - 一种基于多粒度情感的对话推荐方法及系统

Info

Publication number: CN115630145A
Application number: CN202211175448.8A
Authority: CN
Inventors: 曹聪; 王志平; 袁方方; 张春燕; 卢毓海; 刘燕兵; 谭建龙
Original assignee: Institute of Information Engineering of CAS
Current assignee: Institute of Information Engineering of CAS
Priority date: 2022-09-26
Filing date: 2022-09-26
Publication date: 2023-01-20

Abstract

本发明公开了一种基于多粒度情感的对话推荐方法及系统。本方法为：1)利用对话推荐系统中的编码器对历史对话上下文语句进行语义编码；其中，所述语义编码包括历史对话上下文语义向量编码和多粒度情感感知向量编码；所述历史对话上下文语义向量编码方法为：使用词向量嵌入矩阵和位置嵌入矩阵将历史对话上下文中的每个文本单元表示为对应的文本单元语义向量，得到历史对话上下文的语义表示向量；所述多粒度情感感知向量编码方法为：对历史对话上下文中的情感词进行编码得到历史对话上下文的多粒度情感感知向量；2)对语义编码进行线性变换映射，并将映射结果与历史对话上下文进行拼接后输入对话推荐系统中的解码器，得到推荐的回复语句。

Description

一种基于多粒度情感的对话推荐方法及系统

技术领域

本发明属于计算机软件技术领域，具体涉及一种基于多粒度情感的对话推荐方法及系统。

背景技术

随着互联网的快速发展，繁琐的数据和内容逐日递增，针对用户精准获取信息的需求，对话推荐系统应运而生。对话推荐系统的目的主要在于通过与用户进行自然语言的交互，学习用户偏好，进而对用户进行有效推荐。对话推荐系统能够实时地与用户进行多轮对话，动态获取用户的兴趣，对用户做出高质量的商品推荐。对话推荐系统在现实生活中有着广泛的应用场景，如音乐推荐应用、电影推荐应用、餐厅推荐应用、在线购物网站推荐应用、视频流及门户网站推荐应用等。对话推荐系统目前的工作主要从两个不同的角度展开对话推荐技术的研究，一种是基于属性的对话推荐方法，另外一种是基于生成的对话推荐方法。

1.基于属性的对话推荐方法：对话从用户端开始，用户首先指定自己喜欢的标签，系统从物品候选集合中根据用户指定的标签进行筛选，接着对话推荐系统在接下来的每一步中采取推荐动作或者询问属性动作，用户也会对系统的动作做出相应的反馈，对系统的推荐结果可以接受或者拒绝，对询问的属性标签也可以是接受(表示喜欢)或者拒绝(表示不喜欢)。对话推荐系统的目标就是在最短的对话次数内完成尽可能精确的推荐。

2.基于生成的对话推荐方法：基于生成的对话推荐方法通常使用端到端的对话推荐方法，对话过程中对话推荐系统的推荐模块会使用推荐算法从物品集合中筛选出候选物品子集，对话模块生成当前轮次的对用户的回复文本。特别的，候选物品子集为空时对话模块生成的文本为询问相关的文本或闲聊文本。

对于系统与用户交互的多条对话历史语句,基于生成的对话推荐系统的目标是使用推荐结果和回复文本构造这一时刻的回复。基于生成的对话推荐方法通常隐式地包含了对话管理策略。基于生成的对话推荐方法侧重于生成自然语言的回复的同时对用户进行高质量的推荐。对话推荐系统利用对话交互历史来理解用户的偏好，同时生成对用户的回复。该类方法需要包含一个能够生成自然语言回复的模块，以和用户进行交互。

现有的技术方案主要包括基于属性的对话推荐方法和基于生成的对话推荐方法两种方式，这两种方案在生成自然语言应答和获取用户偏好上存在着一些不足，具体如下：

1、对话能力弱：基于属性的对话推荐研究采用多臂老虎机模型、强化学习和汤普森抽样等方法，通过和用户进行互动来获取用户的偏好，这类方法并不注重生成高质量的自然语言应答对用户进行回复，而是通常依赖预定义的对话模板和规则来编写对用户的应答，生成的回复模版化，对话能力弱。

2、情感感知缺失：在和用户进行交互时，现有的推荐系统大多假设用户在对话中提到的物品是用户喜欢的物品，忽略了用户对话文本中情感语义，存在推荐偏差的问题。且现有的使用用户评分对用户进行物品推荐的推荐过程受用户评分矩阵稀疏的制约以及评分真实性的影响，系统根据物品评分生成推荐结果与用户真实的兴趣偏好存在偏差，对话推荐系统中用户与系统交互过程中存在丰富的文本语义的关联和情感信息交互，需要对用户的文本内容表达进行情感分析和语义理解。

发明内容

针对现有技术中存在的问题，本发明的目的在于提供一种基于多粒度情感的对话推荐方法及系统。本发明考虑到人类在对话表达过程中的情感表达存在细微差别，在理解用户对话文本的情感偏好时使用了细粒度的情感词汇和粗粒度的情感分类任务，明确建模细粒度的情感偏好并考虑了句子级别用户偏好反馈。

本发明以基于生成的对话推荐方法为原型，建模用户的情感偏好，满足对话过程中对用户进行有效推荐的需求。本发明的主要思想在于针对用户情感倾向感知缺失的问题，提出了基于多粒度情感的对话上下文语义表示方法，使用局部细粒度单词级别情感感知和整体粗粒度句子级别语义情感理解相结合的方式，实现对用户多粒度情感态度的捕捉，构建多粒度情感表示的对话上下文语义表示。使得对话推荐系统可以在与用户交互的过程中精准获取用户的偏好，缓解推荐偏差问题。

本发明的技术方案为：

一种基于多粒度情感的对话推荐方法，其步骤包括：

1)利用对话推荐系统中的编码器对历史对话上下文语句进行语义编码；其中，所述语义编码包括历史对话上下文语义向量编码和多粒度情感感知向量编码；所述历史对话上下文语义向量编码方法为：使用词向量嵌入矩阵和位置嵌入矩阵将所述历史对话上下文中的每个文本单元表示为对应的文本单元语义向量，得到所述历史对话上下文的语义表示向量；所述历史对话上下文的语义表示向量由历史对话上下文中各单词的词向量、位置向量以及对话状态向量相加得到；所述多粒度情感感知向量编码方法为：使用情感词典提取所述历史对话上下文中的情感词，得到由所述情感词组成的文本序列，对该文本序列进行编码得到所述历史对话上下文的多粒度情感感知向量；

2)对所述语义编码进行线性变换映射，并将映射结果与所述历史对话上下文进行拼接并输入对话推荐系统中的解码器，得到推荐的回复语句。

进一步的，所述对话推荐系统为训练优化后的对话推荐系统，其中训练优化方法为：利用编码器对带有注释的对话推荐数据集中对话上下文语句进行语义编码；对语义编码进行线性变换映射，并将映射结果与对应对话上下文进行拼接并输入对话推荐系统中的解码器，得到推荐的回复语句；训练优化对话推荐系统所采用的损失函数为

其中，情感感知损失函数

回复生成损失函数

e^*为所述对话上下文的真实标签，ε为所述对话上下文的多粒度情感感知向量，γ₁、γ₂为超参数，C为语义编码，P_e(e^*|ε)为在当前情感感知向量条件ε下对话的情感标签为e^*概率，p(y_j|y_＜j，C)为根据当前上下文C，基于当前位置j的j-1个上文(即y_＜j的条件下)生成回复y_j概率。

进一步的，所述带有注释的对话推荐数据集为ReDial数据集。

进一步的，所述对话状态向量用来表示当前单词所在的对话上下文所属说话人。

一种基于多粒度情感的对话推荐系统，其特征在于，包括语义编码器和对话生成解码器；其中，

所述语义编码器，用于对历史对话上下文语句进行语义编码；其中，所述语义编码包括历史对话上下文语义向量编码和多粒度情感感知向量编码；所述历史对话上下文语义向量编码方法为：使用词向量嵌入矩阵和位置嵌入矩阵将所述历史对话上下文中的每个文本单元表示为对应的文本单元语义向量，得到所述历史对话上下文的语义表示向量；所述历史对话上下文的语义表示向量由历史对话上下文中各单词的词向量、位置向量以及对话状态向量相加得到；所述多粒度情感感知向量编码方法为：使用情感词典提取所述历史对话上下文中的情感词，得到由所述情感词组成的文本序列，对该文本序列进行编码得到所述历史对话上下文的多粒度情感感知向量；

所述对话生成解码器，用于对所述语义编码进行线性变换映射，并将映射结果与所述历史对话上下文进行拼接并输入解码器，得到推荐的回复语句。

本发明包括语义编码器和对话生成解码器。

语义编码器模块：

1.对话上下文语义向量编码：ReDial是一个带有注释的对话推荐数据集，用户可以在对话过程中相互进行电影推荐。该数据集由蒙特利尔理工大学、密西根州魁北克AI研究所、蒙特利尔微软研究院以及HEC蒙特利尔和Element AI的一组研究人员收集。在ReDial数据集中，用户会显式地提到是否喜欢当前提到的电影，例如，“I love all the StarWars movies and Pirates of the Caribbean movies”以及“I dont like AnneHathaway or movies like The Devil Wears Prada”等。在该电影领域的对话推荐场景中，系统给用户推荐一个电影后，用户往往会对当前电影有非常明显的喜好倾向，比如表示对于系统推荐的当前电影的偏好程度，这些偏好程度就是用户对于当前对话提到的电影的情感倾向，获取并积累用户的情感倾向可以更好帮助对话推荐系统完成对用户进行个性化推荐的任务，从而根据用户的喜好有效对用户进行精准的电影推荐。我们将用户表示为“被推荐者”，将系统表示为“推荐者”。使用词向量嵌入矩阵和位置向量嵌入矩阵来将ReDial数据集中的对话上下文语句的每个字表示为对应的文本单元语义向量，词向量嵌入矩阵用来获取每个单词的语义信息，每个词语都可以通过词向量嵌入矩阵变为词向量。在对话推荐系统中，使用对话状态向量嵌入来区分推荐者和被推荐者，即使用0和1对用户角色进行区分。对于每个单词，对话状态向量用来表示当前单词所在的对话上下文是由推荐者说的还是被推荐者说的。使用transformer神经网络层来对对话上下文的每个文本单元进行语义向量编码。综上，对话上下文的语义表示向量是由词向量嵌入、位置向量嵌入以及对话状态向量相加得到。

2.多粒度情感感知向量编码：使用外部的情感词典来提取ReDial数据集中对话上下文语句的中的每个情感词，对话上下文文本的多粒度情感是有对话上下文文本中出现的情感词组成的文本序列，使用另外一个参数不同的transformer中的encoder层来编码该文本序列，得到对话上下文文本的多粒度情感向量，使用神经网络有效感知对话上下文文本中的情感信息，使用带softmax的线性层粗粒度的情感感知，在训练过程中，根据对话上下文文本对应的真实标签，使用负的最大似然函数来作为损失函数进而对神经网络中的参数进行学习。

其中，e^*为对话上下文文本对应的真实标签，ε表示对话上下文文本的多粒度情感向量。另外，将生成的代表情感特征分布的粗粒度情感表示输入解码器中生成对话推荐系统中的回复，P_e(e^*|ε)为在当前情感感知向量条件ε下对话的情感标签为e^*概率。

3.融合多粒度情感表示的语义编码器：多粒度情感表示的对话上下文语义表示是由对话上下文语义向量以及多粒度情感感知情感向量拼接构成。

对话生成解码器模块：

1.情感感知：将对编码器生成的代表情感特征分布的粗粒度情感表示进行线性变换操作，变换后将其和解码器端的输入进行拼接得到在解码器端在生成回复时对应的输入，即情感感知的输入。

2.回复生成：解码器基于Transformer中的网络层进行回复生成，解码器端根据在词汇表上生成的单词分布来选择生成的词语，使用最大似然估计函数(MLE)来作为生成回复的优化目标。

C为语义编码，p(y_j|y_＜j，C)为根据当前语义编码C，基于当前位置j的j-1个上文y_＜j的条件下生成回复y_j概率。

完整的回复生成的过程可以被定义为以下联合优化函数：

其中，γ₁，γ₂是情感感知损失函数和回复生成损失函数对应的超参数，我们设置γ₁＝γ₂＝1。因此我们将基于多粒度情感表示的对话上下文语义表示模型中的参数在端到端的框架中联合训练。整体的模型结构如图1。

该发明的主要思想如下：

本发明的整体流程如下：首先使用对ReDial数据集中对话上下文语句进行语义编码，将语义编码表示为对话上下文语义向量编码和多粒度情感感知向量编码，多粒度情感表示的对话上下文语义表示由对话上下文语义向量以及多粒度情感感知情感向量拼接构成。然后使用情感分类任务对编码器进行优化，得到编码器生成的代表情感特征分布的粗粒度情感表示。对编码器得到的代表情感特征分布的粗粒度情感表示进行线性变换映射，和数据集中的对话推荐系统原始回复语句进行拼接得到解码器的输入，解码器基于Transformer中的网络层进行回复生成，解码器端根据在词汇表上生成的单词分布来选择生成的每个词语，完成与用户的对话推荐过程。

语义编码阶段：

1.输入文本转化：对话推荐系统中的多轮对话上下文是由系统端和用户端之间的M轮对话构成，使用的数据集为ReDial数据集，对话上下文中包括语义上下文和情感上下文。语义上下文表示原始文本的语句序列，将所有的对话上下文拼接起来，然后使用上下文嵌入矩阵将每个上下文文本单独的词映射到对应的分布式向量表示。并在每个句子开始的位置插入起始位置标记。情感上下文语义表示考虑了不同粒度的情感，使用一个外部的情感词典来提取原始文本中的情感词，情感表示中在每个句子开始的位置插入情感标注表示，用来标志对话上下文的情感表征。

2.对话上下文语义向量编码：使用词向量嵌入矩阵、位置向量嵌入矩阵以及对话状态向量嵌入矩阵相加得到对话上下文文本对应的嵌入向量矩阵。

3.多粒度情感感知向量编码：使用外部的情感词典来提取ReDial数据集中对话上下文语句的中的每个情感词，对话上下文文本的多粒度情感是由对话上下文文本中出现的情感词组成的文本序列，使用另外一个参数不同的transformer中的encoder层来编码该文本序列，得到对话上下文文本的多粒度情感感知向量。

4.多粒度情感表示的对话上下文语义表示由对话上下文语义向量以及多粒度情感感知情感向量拼接构成。

回复生成解码阶段：

本发明的优点如下：

使用本申请提出的基于多粒度情感的对话上下文语义表示方法在对话任务和推荐任务上分别评测对话模块和推荐模块，本章提出的融合基于多粒度情感的对话上下文语义表示方法优于基线模型，R@1、R@10及R@50对应的指标分别为0.040、0.201、0.389，在REDIAL数据集上取得了较好的表现。和基线模型相比，本章提出的融合基于多粒度情感的对话上下文语义表示方法在对话推荐系统中的推荐任务上的表现较好，故本申请提出的模型能够更好的理解用户的偏好，获取用户的对推荐物品实体分布情感态度分布。

在REDIAL数据集上对基于本章提出的方法的对话推荐系统在对话任务上进行评测，与基线模型相比，所有的Dist-n都有着明显的提高，Dist-2分数提升了0.051分，Dist-3提高了0.077分，Dist-4提高了0.073分，这表明本申请提出的模型能够更加有效理解用户的自然语言表达，从而产生语义丰富度高的话语。

方法	Dist-2	Dist-3	Dist-4
				Transformer	0.148	0.151	0.137
ReDial	0.225	0.236	0.228
				KBRD	0.263	0.368	0.423
KGSF	0.289	0.434	0.519
				Ours	0.340	0.511	0.592

附图说明

图1为本发明的整体结构图。

具体实施方式

下面结合附图对本发明进行进一步详细描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

为了便于说明，本文以电影领域的ReDial数据集为例，展开阐述基于多粒度情感的对话上下文语义表示方法。

输入：

需要获得用户与系统交互的过程中包含用户情感表达的语义文本、情感文本以及相应的情感标签。对原始的ReDial数据集进行处理得到本模型所需数据集，数据集由多标签分类的样本组成，使用NRC情感词典中的情感词语匹配筛选对话上下文文本中的单词得到相应的情感文本，在原始ReDial数据集中，对话过程中提到的电影对应的电影名称前均有“@”出现,故根据该模式我们可以准确匹配出电影名字所在位置，进而对电影位置进行标记，将对话上下文文本中出现电影名字的相应位置标记1，其他位置标记0得到电影位置标志序列。处理之后的数据集中寻求建议的人对于当前对话上下文提到的电影的情感标签分别为建议标签、观看标签和喜欢标签，与原始的ReDial数据集中一致。本方法的训练任务主要包括回复生成过程和推荐过程，本方法使用输入数据中的电影对话数据和相应电影来生成多粒度情感语义上下文，进行粗粒度的情感态度分析，进而进行对话回复生成以及对用户进行电影推荐。由于在原始数据中，是使用了两种数据标注形式来确保数据的可靠性，故我们最终实验的数据集的标签也使用两种标注形式。本方法的粗粒度情感态度分析专注于评估模型是否可以识别出寻求建议的用户对于对话上下文中提到的电影的情感态度，即是否看到、是否建议、是否喜欢。

编码阶段：

1.对话上下文语义向量编码：使用词向量嵌入矩阵和位置嵌入矩阵来将原始数据集的对话上下文语句中的每个文本单元表示为对应的文本单元语义向量，词向量嵌入矩阵用来获取每个单词的语义信息，每个词语都可以通过词向量嵌入矩阵变为词向量。在对话推荐系统中，我们使用了对话状态向量来区分推荐者和被推荐者，对于每个单词，用来表示当前单词所在的对话上下文是由推荐者说的还是被推荐者说的。综上，对话上下文的语义表示向量是由词向量嵌入矩阵、位置向量嵌入矩阵以及对话状态向量嵌入矩阵相加计算得到。我们使用transformer中的神经网络层来对对话上下文的每个文本单元进行语义向量编码。

2.多粒度情感感知向量编码：使用另外一个参数不同的transformer中的encoder层来编码对话上下文文本的多粒度情感向量。

为了有效感知对话上下文文本中的情感信息，我们使用带有softmax操作的线性层来将对话上下文语义向量和多粒度情感感知向量编码的拼接向量映射到对应的情感分布向量，得到粗粒度的情感感知向量。根据对话上下文文本对应的真实标签，我们使用负的最大似然函数来作为损失函数进而对神经网络中的参数进行学习。将对话上下文语义表示由对话上下文语义向量以及多粒度情感感知情感向量进行拼接构成多粒度情感表示的对话上下文语义表示。

回复生成阶段：

使用最大似然估计函数来作为生成回复的优化目标，解码器基于transformer中的网络层进行回复生成。

尽管为说明目的公开了本发明的具体实施例，其目的在于帮助理解本发明的内容并据以实施，本领域的技术人员可以理解：在不脱离本发明及所附的权利要求的精神和范围内，各种替换、变化和修改都是可能的。因此，本发明不应局限于最佳实施例所公开的内容，本发明要求保护的范围以权利要求书界定的范围为准。

Claims

1.一种基于多粒度情感的对话推荐方法，其步骤包括：

2.根据权利要求1所述的方法，其特征在于，所述对话推荐系统为训练优化后的对话推荐系统，其中训练优化方法为：利用编码器对带有注释的对话推荐数据集中对话上下文语句进行语义编码；对语义编码进行线性变换映射，并将映射结果与对应对话上下文进行拼接并输入对话推荐系统中的解码器，得到推荐的回复语句；训练优化对话推荐系统所采用的损失函数为

其中，情感感知损失函数

回复生成损失函数

e^*为所述对话上下文的真实标签，ε为所述对话上下文的多粒度情感感知向量，γ₁、γ₂为超参数，C为语义编码，P_e(e^*|ε)为在当前情感感知向量条件ε下对话的情感标签为e^*概率，p(y_j|y＜j，C)为根据当前上下文C基于当前位置j的j-1个上文生成回复y_j概率。

3.根据权利要求2所述的方法，其特征在于，所述带有注释的对话推荐数据集为ReDial数据集。

4.根据权利要求1或2或3所述的方法，其特征在于，所述对话状态向量用来表示当前单词所在的对话上下文所属说话人。

5.一种基于多粒度情感的对话推荐系统，其特征在于，包括语义编码器和对话生成解码器；其中，

6.根据权利要求5所述的系统，其特征在于，所述对话推荐系统为训练优化后的对话推荐系统，其中训练优化方法为：利用编码器对带有注释的对话推荐数据集中对话上下文语句进行语义编码；对语义编码进行线性变换映射，并将映射结果与对应对话上下文进行拼接并输入对话推荐系统中的解码器，得到推荐的回复语句；训练优化对话推荐系统所采用的损失函数为

其中，情感感知损失函数

回复生成损失函数

7.根据权利要求6所述的系统，其特征在于，所述带有注释的对话推荐数据集为ReDial数据集。