CN116308685A

CN116308685A - 一种基于方面情感预测和协同过滤的产品推荐方法及系统

Info

Publication number: CN116308685A
Application number: CN202310564023.4A
Authority: CN
Inventors: 任剑; 何雨欣; 易国栋; 谢恩坪
Original assignee: Hunan University of Technology
Current assignee: Hunan University of Technology
Priority date: 2023-05-18
Filing date: 2023-05-18
Publication date: 2023-06-23
Anticipated expiration: 2043-05-18
Also published as: CN116308685B

Abstract

本申请涉及一种基于方面情感预测和协同过滤的产品推荐方法及系统；该方法基于用户之间隐性信任，并根据已知用户评论的方面类别和情感值预测出用户对未参评产品的方面类别和情感值，改善了现有方法存在的数据稀疏问题；而且该方法提供了多种推荐方式，能够满足多种情况需求，是一种实时响应、推广性好的个性化推荐方法，能够大幅改善用户体验。系统包括：数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块。

Description

一种基于方面情感预测和协同过滤的产品推荐方法及系统

技术领域

本申请涉及产品推荐技术领域，特别是涉及一种基于方面情感预测和协同过滤的产品推荐方法及系统。

背景技术

在线评论是影响消费者购买决策的关键因素之一，然而消费者精力有限，在海量的评论数据中找到消费者关注的信息成为了亟待解决的问题。

现有的产品推荐方法没有从根本上解决个性化产品推荐的难题，主要集中在以下方面：1）现有方法很少将文本数据和评分数据结合起来转化成结构化数据，导致数据的利用率较低；2）现有基于在线评论的推荐方法通常识别属性标签或情感极性，很少识别句子中的属性及其对应的情感值；3）现有的协同过滤推荐方法存在数据稀疏问题，由于数据稀疏，用户共同参评的数据较为稀缺，用户交互的点赞、关注更为稀少，于是在获取相似用户集时有较大难度；4）现有的协同过滤推荐方法存在冷启动问题；当对新用户进行推荐时，无法计算相似度来识别相似用户，于是针对新用户的推荐容易不准确。

发明内容

基于此，有必要提供一种基于方面情感预测和协同过滤的产品推荐方法，该方法包括：

S1：获取产品的历史在线评论；并对历史在线评论进行清洗；

S2：将多个清洗后的所述历史在线评论输入情感预测模型得到各评论的方面类别及其对应的情感值；基于各评论的方面类别及其对应的情感值构建产品评价矩阵；

S3：基于所述各评论的方面类别及其情感值确定用户之间的隐性信任情况；基于所述隐性信任情况，预测出用户对未参评过的产品的评论的方面类别及其对应的情感值；

S4：基于用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵；

S5：进行产品推荐，其包括：

根据用户查询获取用户实时关注的方面类别，并基于用户实时关注的方面类别对产品进行排序推荐；

基于所述历史在线评论确定历史在线评论的方面类别及其情感值，并基于历史在线评论的方面类别及其情感值对产品进行排序推荐；

基于补全的所述产品评价矩阵计算各产品的推荐得分，根据所述推荐得分进行排序推荐。

本发明还提供了一种基于方面情感预测和协同过滤的产品推荐系统，其用于实现上述产品推荐方法；该系统包括：数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块；

所述数据采集模块用于获取历史在线评论；

所述数据预处理模块用于剔除所述历史在线评论中的重复评论与空值评论；

所述方面情感预测模块用于将清洗后的历史在线评论输入至所述情感预测模型，得到各评论的方面类别及其对应的情感值；

所述用户隐性信任度计算模块用于根据各评论的方面类别及其对应的情感值计算用户之间的隐性信任度；

所述数据填充模块用于根据用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵；

所述产品综合得分计算模块用于计算产品推荐得分，并构建推荐列表对用户进行产品推荐。

有益效果：该方法基于用户之间隐性信任，并根据已知用户评论的方面类别和情感值预测出用户对未参评产品的方面类别和情感值，改善了现有方法存在的数据稀疏问题；而且该方法提供了多种推荐方式，能够满足多种情况需求，是一种实时响应、推广性好的个性化推荐方法，能够大幅改善用户体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的产品推荐方法的流程图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图对本申请的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似改进，因此本申请不受下面公开的具体实施例的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

如图1所示，本实例提供了一种基于方面情感预测和协同过滤的产品推荐方法，在本实施例中，选取酒店作为产品，进行推荐；

该方法包括：

S1：获取产品的历史在线评论；并对历史在线评论进行清洗，剔除所述历史在线评论中的重复评论与空值评论。

由于酒店是临时住所，且用户评价行人靠个人意愿，则本实施例设定酒店的每一条评论对应一位用户。本实施例采用jieba分词对评论文本进行分词与词频计算，去除非特征词和无实际意义词，最终得到九个方面类别，分别为：房间、位置、服务、设施、环境、食物、交通、整体体验和价格。

S2：将多个清洗后的所述历史在线评论输入情感预测模型得到各评论的方面类别及其对应的情感值；基于各评论的方面类别及其对应的情感值构建产品评价矩阵。

该步骤还包括：

训练方面情感预测模型，得到所述情感预测模型；训练过程为：

步骤1：从清洗后的所述历史在线评论中选取部分评论作为原始评论文本；并对所述原始评论文本进行方面情感四元组的标记；

在本实施例中，部分评论的数量包括但不限于历史在线评论数量的十分之一。

步骤2：定义投影函数，采用所述投影函数将每条原始评论文本中标记的方面情感四元组转化为自然语言序列，并采用特殊符号将所述自然语言序列连接，得到目标序列；基于所述原始评论文本以及所述目标序列，生成原始评论文本-目标序列的数据集；

投影规则示例：原始评论文本为“前台小胡服务很好，很周到”；标记的方面情感四元组可表示为（方面类别、方面术语、意见术语、情感值），将“酒店服务”作为方面类别、“前台小胡服务”作为方面术语、“很好，很周到”作为意见术语、“1”作为情感值，那么转换后的自然语言序列则为“酒店服务很好，因为前台小胡服务很好，很周到”。

在本实施例中，情感值的取值标准设定为：{很差：0；差：0.25；中等：0.5；好：0.75；很好：1}；举例说明，“很差：0”，“很差”为情感术语，“0”为情感值。

在本实施例中，特殊符号可选用原始评论文本中未出现的符号。

步骤3：将原始评论文本-目标序列的数据集按照比例分为训练集和测试集；并对数据集中的所述原始评论文本以及目标序列均进行向量化处理；

在本实施例中，训练集与测试集的划分比例可为8:2。

步骤4：基于向量化处理后训练集中的原始评论文本-目标序列，采用序列到序列学习方式对初始的方面情感预测模型进行训练；训练完成的所述方面情感预测模型即为所述情感预测模型；

步骤5：将测试集中的原始评论文本输入所述情感预测模型，输出对测试集中目标序列的预测值；将测试集中的目标序列作为真实值；基于预测值和真实值计算F1得分，以所述F1得分作为情感预测模型的准确率评估所述情感预测模型。

在本实施例中，所述方面情感预测模型为方面情感四元组预测模型（ASQP模型），该模型在T5模型的基础上搭建，其结构与T5模型一致，是Transformer模型的一种变体，其分为编码器和解码器；所述编码器和所述解码器均包括嵌入层、多头注意力层以及全连接层，且解码器还包括输出层；

所述嵌入层用于为输入序列添加前缀；这种前缀包括模型需要解决的任务的本质，例如翻译任务、文本摘要等；即需要完成Prefix + Sequence A = Sequence B步骤，随后模型会给序列套上位置编码，使用相对位置嵌入。

所述多头注意力层用于计算注意力分数；

所述全连接层为前馈神经网络的结构层；

编码器的全连接层输出的数据与解码器的多头注意力层输出的数据一并输入至解码器的全连接层；

所述输出层用于将经过解码器的全连接层的数据输出。

方面情感四元组预测模型旨在预测所有方面水平的情绪四元组，该四元组记为：{(c，a，o，p)}，其中的元素表示分别为：方面类别、方面术语、意见术语以及情感值。

所述历史在线评论输入至所述情感预测模型，输出的形式为：方面类别:情感值。

基于各评论的方面类别及其对应的情感值构建产品评价矩阵，其表示为：

；

其中，R表示产品评价矩阵，user ₁₁表示第1个产品的第1个用户；user _1n表示第1个产品的第n个用户；user _k1表示第k个产品的第1个用户；user _kn表示第k个产品的第n个用户；product ₁表示第一个产品；product _k表示第k个产品；矩阵的行表示用户对于各产品的评论经情感预测模型的输出；矩阵的列表示产品的各用户的评论经情感预测模型的输出；

表示第1个产品的第1个用户点评的第1个产品的第1个方面类别；/>

表示第1个产品的第1个用户点评的第1个产品的第1个方面类别的情感值，其余参数以此类推。

由于用户之间共同评价的产品数据较为稀疏，产品的评论存在故意好评与恶意差评的情况，需要预测某产品的参评用户对其它产品的评论。于是，需要确定用户之间的隐性信任情况；当用户关注类似的方面类别和情感术语时，说明用户们对产品有着类似的偏好与见解，他们会更加信任所含与其关注类似的方面类别和情感术语的评论。

S3：基于所述各评论的方面类别及其情感值确定用户之间的隐性信任情况；基于所述隐性信任情况，预测出用户对未参评过的产品的评论的方面类别及其对应的情感值。

具体的，隐性信任情况包括隐性相互信任和隐性不相互信任；比对不同用户之间对于不同产品的评论的方面类别数量；当用户之间对于不同产品的评论的方面类别数量相同时，表示用户之间的隐性信任情况为隐性相互信任，否则为隐性不相互信任；

根据隐性信任情况计算用户之间的隐性信任度；

当用户之间的隐性信任情况为隐性相互信任时，用户i对用户j的隐性信任度记为S _ij；计算公式为：

；

其中，S _ji表示用户j对用户i的隐性信任度；

表示第k个产品的第i个用户点评的第k个产品的方面类别与第l个产品的第j个用户点评的第l个产品的方面类别的交集中所含元素的数量；/>

表示第k个产品的第i个用户点评的所有方面类别；/>

表示第l个产品的第j个用户点评的所有方面类别；t表示第t个方面类别；/>

表示第k个产品的第i个用户点评的第k个产品的第t个方面类别的情感值；/>

表示第l个产品的第j个用户点评的第l个产品的第t个方面类别的情感值；

当用户之间的隐性信任情况为隐性不相互信任时，用户a对用户b的隐性信任度记为S _ab，用户b对用户a的隐性信任度记为S _ba；计算公式为：

；

；

其中，

、/>

分别表示第k个产品的第a个用户点评的第k个产品的方面类别与第l个产品的第b个用户点评的第l个产品的方面类别的交集与并集中所含元素的数量；/>

表示第k个产品的第a个用户点评的第k个产品的第t个方面类别的情感值；/>

表示第l个产品的第b个用户点评的第l个产品的第t个方面类别的情感值。

基于用户之间的隐性信任度预测出用户对未参评过的产品的评论的方面类别及其对应的情感值；过程为：

当用户之间的隐性信任情况为隐性相互信任时，情感值计算公式为：

；

当用户之间的隐性信任情况为隐性不相互信任时，情感值计算公式为：

；

其中，S _ji表示用户j对用户i的隐性信任度；S _ba表示用户b对用户a的隐性信任度；

表示第l个产品的用户j对产品k预测评论中的第t个方面类别；/>

表示第l个产品的用户b对产品k预测评论中的第t个方面类别。

补全之后的产品评价矩阵表示为：

；

其中，R表示产品评价矩阵，user ₁₁表示第1个产品的第1个用户；user _1n表示第1个产品的第n个用户；user _k1表示第k个产品的第1个用户；user _kn表示第k个产品的第n个用户；product ₁表示第一个产品；product ₂表示第二个产品；product _k表示第k个产品；矩阵的行表示用户对于各产品的评论经情感预测模型的输出；矩阵的列表示产品的各用户的评论经情感预测模型的输出；

表示第1个产品的第1个用户点评的第1个产品的第1个方面类别；

S5：进行产品推荐，分为三种情况，分别为：

第一种情况，

根据用户查询获取用户e实时关注的方面类别；当产品k存在与用户e实时关注的方面类别

完全相同的用户q的评论时，预测用户e实时关注的方面类别下的第一综合情感值，计算公式为：

；

当产品k不存在与用户e实时关注的方面类别

；

根据所述综合情感值计算推荐得分，计算公式为：

；

基于各产品的所述第一推荐得分对产品进行排序，构建针对用户e的第一推荐列表；基于所述第一推荐列表对用户e进行产品推荐；

第二种情况，

基于用户e的所述历史在线评论（若有多条历史在线评论则取算数平均值），确定历史在线评论的方面类别及其相应情感值，并基于所述历史在线评论的方面类别及其相应情感值确定用户e对用户g的隐性信任情况；当产品k存在与用户e为隐性相互信任的用户g时，预测用户e在其未参评过的产品k的第二综合情感值，计算公式为：

；

当对产品k不存在与用户e为隐性相互信任的用户g时，预测用户e在其未参评过的产品k的第二综合情感值，计算公式为：

；

根据所述第二综合情感值计算第二推荐得分，计算公式为：

；

基于各产品的所述第二推荐得分对产品进行排序，构建针对用户e的第二推荐列表；基于所述第二推荐列表对用户e进行产品推荐；

第三种情况，

若无法获得用户实时查询的方面类别，且该用户也无历史评论，则通过补全的所述产品评价矩阵计算评论的方面类别的第三综合情感值，计算公式为：

；

根据所述第三综合情感值计算第三推荐得分，计算公式为：

；

基于各产品的所述第三推荐得分对产品进行排序，构建针对新用户的第三推荐列表；基于所述第三推荐列表对新用户进行产品推荐；

其中，

表示用户e查询输入的方面类别：/>

表示基于用户e实时关注的方面类别预测得到的产品k的第一综合情感值；/>

表示第一推荐得分；/>

表示第h个产品的第e个用户基于历史在线评论预测得到的产品k的方面类别；/>

表示基于用户e对产品h的历史评论中的方面类别及其情感值预测得到的产品k在方面类别/>

下的第二综合情感值；/>

表示第二推荐得分；/>

表示基于补全的所述产品评价矩阵计算得的新用户对产品k点评的方面类别；/>

表示新用户对产品k在方面类别/>

下的第三综合情感值；/>

表示第三推荐得分；/>

表示第k个产品的第q个用户点评的第k个产品的第t个方面类别的情感值；/>

表示第k个产品的第g个用户点评的第k个产品的第t个方面类别的情感值；/>

表示第k个产品的第v个用户点评的第k个产品的第t个方面类别的情感值。

本实施例还提供了一种用于实现上述产品推荐方法的系统,其包括：数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块；

所述数据采集模块用于获取历史在线评论；

本实施例提供的这种基于方面情感预测和协同过滤的产品推荐方法及系统具有以下有益效果：

1、为了避免评论被预测为空值，即不存在任何方面类别以及对应情感值，将评论对应的评分数据归一化，作为整体体验方面类别的情感值，这样补充了整体体验方面类别下的情感值，能够充分利用评论文本与评分数据，同时降低了数据的稀疏性；

2、采用方面情感四元组预测模型，属于细粒度的情感分析，能够同时得到评论的方面类别、方面术语、意见术语以及情感值；并将情感值取值设定为{很差：0；差：0.25；中等：0.5；好：0.75；很好：1}，扩充了其取值；

3、提供了基于用户隐性信任的协同过滤算法，解决了对于用户之间没有共同参评的产品时预测评论的问题，改善了数据稀疏；

4、能够获取用户关注的方面类别，并针对获取的方面类别计算得到推荐得分；基于推荐得分构建推荐列表进而进行产品推荐；

5、提供了多种情况下的产品推荐方式，能够满足更多的需求。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于方面情感预测和协同过滤的产品推荐方法，其特征在于，包括：

S5：进行产品推荐，其包括：

2.根据权利要求1所述的产品推荐方法，其特征在于，S2中，还包括训练方面情感预测模型，得到所述情感预测模型；训练过程为：

3.根据权利要求2所述的产品推荐方法，其特征在于，所述方面情感预测模型为方面情感四元组预测模型，其分为编码器和解码器；所述编码器和所述解码器均包括嵌入层、多头注意力层以及全连接层，且解码器还包括输出层；所述嵌入层用于为输入序列添加前缀；所述多头注意力层用于计算注意力分数；所述全连接层为前馈神经网络的结构层；编码器的全连接层输出的数据与解码器的多头注意力层输出的数据一并输入至解码器的全连接层；所述输出层用于将经过解码器的全连接层的数据输出；方面情感四元组预测模型输出的四元组的元素包括：方面类别、方面术语、意见术语以及情感值。

4.根据权利要求3所述的产品推荐方法，其特征在于，S2中，所述历史在线评论输入至所述情感预测模型，输出的形式为：方面类别:情感值；