CN116308685A - 一种基于方面情感预测和协同过滤的产品推荐方法及系统 - Google Patents

一种基于方面情感预测和协同过滤的产品推荐方法及系统 Download PDF

Info

Publication number
CN116308685A
CN116308685A CN202310564023.4A CN202310564023A CN116308685A CN 116308685 A CN116308685 A CN 116308685A CN 202310564023 A CN202310564023 A CN 202310564023A CN 116308685 A CN116308685 A CN 116308685A
Authority
CN
China
Prior art keywords
product
user
emotion
comment
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310564023.4A
Other languages
English (en)
Other versions
CN116308685B (zh
Inventor
任剑
何雨欣
易国栋
谢恩坪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN202310564023.4A priority Critical patent/CN116308685B/zh
Publication of CN116308685A publication Critical patent/CN116308685A/zh
Application granted granted Critical
Publication of CN116308685B publication Critical patent/CN116308685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种基于方面情感预测和协同过滤的产品推荐方法及系统;该方法基于用户之间隐性信任,并根据已知用户评论的方面类别和情感值预测出用户对未参评产品的方面类别和情感值,改善了现有方法存在的数据稀疏问题;而且该方法提供了多种推荐方式,能够满足多种情况需求,是一种实时响应、推广性好的个性化推荐方法,能够大幅改善用户体验。系统包括:数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块。

Description

一种基于方面情感预测和协同过滤的产品推荐方法及系统
技术领域
本申请涉及产品推荐技术领域,特别是涉及一种基于方面情感预测和协同过滤的产品推荐方法及系统。
背景技术
在线评论是影响消费者购买决策的关键因素之一,然而消费者精力有限,在海量的评论数据中找到消费者关注的信息成为了亟待解决的问题。
现有的产品推荐方法没有从根本上解决个性化产品推荐的难题,主要集中在以下方面:1)现有方法很少将文本数据和评分数据结合起来转化成结构化数据,导致数据的利用率较低;2)现有基于在线评论的推荐方法通常识别属性标签或情感极性,很少识别句子中的属性及其对应的情感值;3)现有的协同过滤推荐方法存在数据稀疏问题,由于数据稀疏,用户共同参评的数据较为稀缺,用户交互的点赞、关注更为稀少,于是在获取相似用户集时有较大难度;4)现有的协同过滤推荐方法存在冷启动问题;当对新用户进行推荐时,无法计算相似度来识别相似用户,于是针对新用户的推荐容易不准确。
发明内容
基于此,有必要提供一种基于方面情感预测和协同过滤的产品推荐方法,该方法包括:
S1:获取产品的历史在线评论;并对历史在线评论进行清洗;
S2:将多个清洗后的所述历史在线评论输入情感预测模型得到各评论的方面类别及其对应的情感值;基于各评论的方面类别及其对应的情感值构建产品评价矩阵;
S3:基于所述各评论的方面类别及其情感值确定用户之间的隐性信任情况;基于所述隐性信任情况,预测出用户对未参评过的产品的评论的方面类别及其对应的情感值;
S4:基于用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵;
S5:进行产品推荐,其包括:
根据用户查询获取用户实时关注的方面类别,并基于用户实时关注的方面类别对产品进行排序推荐;
基于所述历史在线评论确定历史在线评论的方面类别及其情感值,并基于历史在线评论的方面类别及其情感值对产品进行排序推荐;
基于补全的所述产品评价矩阵计算各产品的推荐得分,根据所述推荐得分进行排序推荐。
本发明还提供了一种基于方面情感预测和协同过滤的产品推荐系统,其用于实现上述产品推荐方法;该系统包括:数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块;
所述数据采集模块用于获取历史在线评论;
所述数据预处理模块用于剔除所述历史在线评论中的重复评论与空值评论;
所述方面情感预测模块用于将清洗后的历史在线评论输入至所述情感预测模型,得到各评论的方面类别及其对应的情感值;
所述用户隐性信任度计算模块用于根据各评论的方面类别及其对应的情感值计算用户之间的隐性信任度;
所述数据填充模块用于根据用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵;
所述产品综合得分计算模块用于计算产品推荐得分,并构建推荐列表对用户进行产品推荐。
有益效果:该方法基于用户之间隐性信任,并根据已知用户评论的方面类别和情感值预测出用户对未参评产品的方面类别和情感值,改善了现有方法存在的数据稀疏问题;而且该方法提供了多种推荐方式,能够满足多种情况需求,是一种实时响应、推广性好的个性化推荐方法,能够大幅改善用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的产品推荐方法的流程图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似改进,因此本申请不受下面公开的具体实施例的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
如图1所示,本实例提供了一种基于方面情感预测和协同过滤的产品推荐方法,在本实施例中,选取酒店作为产品,进行推荐;
该方法包括:
S1:获取产品的历史在线评论;并对历史在线评论进行清洗,剔除所述历史在线评论中的重复评论与空值评论。
由于酒店是临时住所,且用户评价行人靠个人意愿,则本实施例设定酒店的每一条评论对应一位用户。本实施例采用jieba分词对评论文本进行分词与词频计算,去除非特征词和无实际意义词,最终得到九个方面类别,分别为:房间、位置、服务、设施、环境、食物、交通、整体体验和价格。
S2:将多个清洗后的所述历史在线评论输入情感预测模型得到各评论的方面类别及其对应的情感值;基于各评论的方面类别及其对应的情感值构建产品评价矩阵。
该步骤还包括:
训练方面情感预测模型,得到所述情感预测模型;训练过程为:
步骤1:从清洗后的所述历史在线评论中选取部分评论作为原始评论文本;并对所述原始评论文本进行方面情感四元组的标记;
在本实施例中,部分评论的数量包括但不限于历史在线评论数量的十分之一。
步骤2:定义投影函数,采用所述投影函数将每条原始评论文本中标记的方面情感四元组转化为自然语言序列,并采用特殊符号将所述自然语言序列连接,得到目标序列;基于所述原始评论文本以及所述目标序列,生成原始评论文本-目标序列的数据集;
投影规则示例:原始评论文本为“前台小胡服务很好,很周到”;标记的方面情感四元组可表示为(方面类别、方面术语、意见术语、情感值),将“酒店服务”作为方面类别、“前台小胡服务”作为方面术语、“很好,很周到”作为意见术语、“1”作为情感值,那么转换后的自然语言序列则为“酒店服务很好,因为前台小胡服务很好,很周到”。
在本实施例中,情感值的取值标准设定为:{很差:0;差:0.25;中等:0.5;好:0.75;很好:1};举例说明,“很差:0”,“很差”为情感术语,“0”为情感值。
在本实施例中,特殊符号可选用原始评论文本中未出现的符号。
步骤3:将原始评论文本-目标序列的数据集按照比例分为训练集和测试集;并对数据集中的所述原始评论文本以及目标序列均进行向量化处理;
在本实施例中,训练集与测试集的划分比例可为8:2。
步骤4:基于向量化处理后训练集中的原始评论文本-目标序列,采用序列到序列学习方式对初始的方面情感预测模型进行训练;训练完成的所述方面情感预测模型即为所述情感预测模型;
步骤5:将测试集中的原始评论文本输入所述情感预测模型,输出对测试集中目标序列的预测值;将测试集中的目标序列作为真实值;基于预测值和真实值计算F1得分,以所述F1得分作为情感预测模型的准确率评估所述情感预测模型。
在本实施例中,所述方面情感预测模型为方面情感四元组预测模型(ASQP模型),该模型在T5模型的基础上搭建,其结构与T5模型一致,是Transformer模型的一种变体,其分为编码器和解码器;所述编码器和所述解码器均包括嵌入层、多头注意力层以及全连接层,且解码器还包括输出层;
所述嵌入层用于为输入序列添加前缀;这种前缀包括模型需要解决的任务的本质,例如翻译任务、文本摘要等;即需要完成Prefix + Sequence A = Sequence B步骤,随后模型会给序列套上位置编码,使用相对位置嵌入。
所述多头注意力层用于计算注意力分数;
所述全连接层为前馈神经网络的结构层;
编码器的全连接层输出的数据与解码器的多头注意力层输出的数据一并输入至解码器的全连接层;
所述输出层用于将经过解码器的全连接层的数据输出。
方面情感四元组预测模型旨在预测所有方面水平的情绪四元组,该四元组记为:{(c,a,o,p)},其中的元素表示分别为:方面类别、方面术语、意见术语以及情感值。
所述历史在线评论输入至所述情感预测模型,输出的形式为:方面类别:情感值。
基于各评论的方面类别及其对应的情感值构建产品评价矩阵,其表示为:
Figure SMS_1
其中,R表示产品评价矩阵,user 11表示第1个产品的第1个用户;user 1n 表示第1个产品的第n个用户;user k1表示第k个产品的第1个用户;user kn 表示第k个产品的第n个用户;product 1表示第一个产品;product k 表示第k个产品;矩阵的行表示用户对于各产品的评论经情感预测模型的输出;矩阵的列表示产品的各用户的评论经情感预测模型的输出;
Figure SMS_2
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别;/>
Figure SMS_3
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别的情感值,其余参数以此类推。
由于用户之间共同评价的产品数据较为稀疏,产品的评论存在故意好评与恶意差评的情况,需要预测某产品的参评用户对其它产品的评论。于是,需要确定用户之间的隐性信任情况;当用户关注类似的方面类别和情感术语时,说明用户们对产品有着类似的偏好与见解,他们会更加信任所含与其关注类似的方面类别和情感术语的评论。
S3:基于所述各评论的方面类别及其情感值确定用户之间的隐性信任情况;基于所述隐性信任情况,预测出用户对未参评过的产品的评论的方面类别及其对应的情感值。
具体的,隐性信任情况包括隐性相互信任和隐性不相互信任;比对不同用户之间对于不同产品的评论的方面类别数量;当用户之间对于不同产品的评论的方面类别数量相同时,表示用户之间的隐性信任情况为隐性相互信任,否则为隐性不相互信任;
根据隐性信任情况计算用户之间的隐性信任度;
当用户之间的隐性信任情况为隐性相互信任时,用户i对用户j的隐性信任度记为S ij ;计算公式为:
Figure SMS_4
其中,S ji 表示用户j对用户i的隐性信任度;
Figure SMS_5
表示第k个产品的第i个用户点评的第k个产品的方面类别与第l个产品的第j个用户点评的第l个产品的方面类别的交集中所含元素的数量;/>
Figure SMS_6
表示第k个产品的第i个用户点评的所有方面类别;/>
Figure SMS_7
表示第l个产品的第j个用户点评的所有方面类别;t表示第t个方面类别;/>
Figure SMS_8
表示第k个产品的第i个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure SMS_9
表示第l个产品的第j个用户点评的第l个产品的第t个方面类别的情感值;
当用户之间的隐性信任情况为隐性不相互信任时,用户a对用户b的隐性信任度记为S ab ,用户b对用户a的隐性信任度记为S ba ;计算公式为:
Figure SMS_10
Figure SMS_11
其中,
Figure SMS_12
、/>
Figure SMS_13
分别表示第k个产品的第a个用户点评的第k个产品的方面类别与第l个产品的第b个用户点评的第l个产品的方面类别的交集与并集中所含元素的数量;/>
Figure SMS_14
表示第k个产品的第a个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure SMS_15
表示第l个产品的第b个用户点评的第l个产品的第t个方面类别的情感值。
基于用户之间的隐性信任度预测出用户对未参评过的产品的评论的方面类别及其对应的情感值;过程为:
当用户之间的隐性信任情况为隐性相互信任时,情感值计算公式为:
Figure SMS_16
当用户之间的隐性信任情况为隐性不相互信任时,情感值计算公式为:
Figure SMS_17
其中,S ji 表示用户j对用户i的隐性信任度;S ba 表示用户b对用户a的隐性信任度;
Figure SMS_18
表示第l个产品的用户j对产品k预测评论中的第t个方面类别;/>
Figure SMS_19
表示第l个产品的用户b对产品k预测评论中的第t个方面类别。
S4:基于用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵;
补全之后的产品评价矩阵表示为:
Figure SMS_20
其中,R表示产品评价矩阵,user 11表示第1个产品的第1个用户;user 1n 表示第1个产品的第n个用户;user k1表示第k个产品的第1个用户;user kn 表示第k个产品的第n个用户;product 1表示第一个产品;product 2表示第二个产品;product k 表示第k个产品;矩阵的行表示用户对于各产品的评论经情感预测模型的输出;矩阵的列表示产品的各用户的评论经情感预测模型的输出;
Figure SMS_21
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别;
Figure SMS_22
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别的情感值,其余参数以此类推。
S5:进行产品推荐,分为三种情况,分别为:
第一种情况,
根据用户查询获取用户e实时关注的方面类别;当产品k存在与用户e实时关注的方面类别
Figure SMS_23
完全相同的用户q的评论时,预测用户e实时关注的方面类别下的第一综合情感值,计算公式为:
Figure SMS_24
当产品k不存在与用户e实时关注的方面类别
Figure SMS_25
完全相同的用户q的评论时,预测用户e实时关注的方面类别下的第一综合情感值,计算公式为:
Figure SMS_26
根据所述综合情感值计算推荐得分,计算公式为:
Figure SMS_27
基于各产品的所述第一推荐得分对产品进行排序,构建针对用户e的第一推荐列表;基于所述第一推荐列表对用户e进行产品推荐;
第二种情况,
基于用户e的所述历史在线评论(若有多条历史在线评论则取算数平均值),确定历史在线评论的方面类别及其相应情感值,并基于所述历史在线评论的方面类别及其相应情感值确定用户e对用户g的隐性信任情况;当产品k存在与用户e为隐性相互信任的用户g时,预测用户e在其未参评过的产品k的第二综合情感值,计算公式为:
Figure SMS_28
当对产品k不存在与用户e为隐性相互信任的用户g时,预测用户e在其未参评过的产品k的第二综合情感值,计算公式为:
Figure SMS_29
根据所述第二综合情感值计算第二推荐得分,计算公式为:
Figure SMS_30
基于各产品的所述第二推荐得分对产品进行排序,构建针对用户e的第二推荐列表;基于所述第二推荐列表对用户e进行产品推荐;
第三种情况,
若无法获得用户实时查询的方面类别,且该用户也无历史评论,则通过补全的所述产品评价矩阵计算评论的方面类别的第三综合情感值,计算公式为:
Figure SMS_31
根据所述第三综合情感值计算第三推荐得分,计算公式为:
Figure SMS_32
基于各产品的所述第三推荐得分对产品进行排序,构建针对新用户的第三推荐列表;基于所述第三推荐列表对新用户进行产品推荐;
其中,
Figure SMS_35
表示用户e查询输入的方面类别:/>
Figure SMS_38
表示基于用户e实时关注的方面类别预测得到的产品k的第一综合情感值;/>
Figure SMS_42
表示第一推荐得分;/>
Figure SMS_36
表示第h个产品的第e个用户基于历史在线评论预测得到的产品k的方面类别;/>
Figure SMS_39
表示基于用户e对产品h的历史评论中的方面类别及其情感值预测得到的产品k在方面类别/>
Figure SMS_43
下的第二综合情感值;/>
Figure SMS_45
表示第二推荐得分;/>
Figure SMS_33
表示基于补全的所述产品评价矩阵计算得的新用户对产品k点评的方面类别;/>
Figure SMS_40
表示新用户对产品k在方面类别/>
Figure SMS_44
下的第三综合情感值;/>
Figure SMS_46
表示第三推荐得分;/>
Figure SMS_34
表示第k个产品的第q个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure SMS_37
表示第k个产品的第g个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure SMS_41
表示第k个产品的第v个用户点评的第k个产品的第t个方面类别的情感值。
本实施例还提供了一种用于实现上述产品推荐方法的系统,其包括:数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块;
所述数据采集模块用于获取历史在线评论;
所述数据预处理模块用于剔除所述历史在线评论中的重复评论与空值评论;
所述方面情感预测模块用于将清洗后的历史在线评论输入至所述情感预测模型,得到各评论的方面类别及其对应的情感值;
所述用户隐性信任度计算模块用于根据各评论的方面类别及其对应的情感值计算用户之间的隐性信任度;
所述数据填充模块用于根据用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵;
所述产品综合得分计算模块用于计算产品推荐得分,并构建推荐列表对用户进行产品推荐。
本实施例提供的这种基于方面情感预测和协同过滤的产品推荐方法及系统具有以下有益效果:
1、为了避免评论被预测为空值,即不存在任何方面类别以及对应情感值,将评论对应的评分数据归一化,作为整体体验方面类别的情感值,这样补充了整体体验方面类别下的情感值,能够充分利用评论文本与评分数据,同时降低了数据的稀疏性;
2、采用方面情感四元组预测模型,属于细粒度的情感分析,能够同时得到评论的方面类别、方面术语、意见术语以及情感值;并将情感值取值设定为{很差:0;差:0.25;中等:0.5;好:0.75;很好:1},扩充了其取值;
3、提供了基于用户隐性信任的协同过滤算法,解决了对于用户之间没有共同参评的产品时预测评论的问题,改善了数据稀疏;
4、能够获取用户关注的方面类别,并针对获取的方面类别计算得到推荐得分;基于推荐得分构建推荐列表进而进行产品推荐;
5、提供了多种情况下的产品推荐方式,能够满足更多的需求。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于方面情感预测和协同过滤的产品推荐方法,其特征在于,包括:
S1:获取产品的历史在线评论;并对历史在线评论进行清洗;
S2:将多个清洗后的所述历史在线评论输入情感预测模型得到各评论的方面类别及其对应的情感值;基于各评论的方面类别及其对应的情感值构建产品评价矩阵;
S3:基于所述各评论的方面类别及其情感值确定用户之间的隐性信任情况;基于所述隐性信任情况,预测出用户对未参评过的产品的评论的方面类别及其对应的情感值;
S4:基于用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵;
S5:进行产品推荐,其包括:
根据用户查询获取用户实时关注的方面类别,并基于用户实时关注的方面类别对产品进行排序推荐;
基于所述历史在线评论确定历史在线评论的方面类别及其情感值,并基于历史在线评论的方面类别及其情感值对产品进行排序推荐;
基于补全的所述产品评价矩阵计算各产品的推荐得分,根据所述推荐得分进行排序推荐。
2.根据权利要求1所述的产品推荐方法,其特征在于,S2中,还包括训练方面情感预测模型,得到所述情感预测模型;训练过程为:
步骤1:从清洗后的所述历史在线评论中选取部分评论作为原始评论文本;并对所述原始评论文本进行方面情感四元组的标记;
步骤2:定义投影函数,采用所述投影函数将每条原始评论文本中标记的方面情感四元组转化为自然语言序列,并采用特殊符号将所述自然语言序列连接,得到目标序列;基于所述原始评论文本以及所述目标序列,生成原始评论文本-目标序列的数据集;
步骤3:将原始评论文本-目标序列的数据集按照比例分为训练集和测试集;并对数据集中的所述原始评论文本以及目标序列均进行向量化处理;
步骤4:基于向量化处理后训练集中的原始评论文本-目标序列,采用序列到序列学习方式对初始的方面情感预测模型进行训练;训练完成的所述方面情感预测模型即为所述情感预测模型;
步骤5:将测试集中的原始评论文本输入所述情感预测模型,输出对测试集中目标序列的预测值;将测试集中的目标序列作为真实值;基于预测值和真实值计算F1得分,以所述F1得分作为情感预测模型的准确率评估所述情感预测模型。
3.根据权利要求2所述的产品推荐方法,其特征在于,所述方面情感预测模型为方面情感四元组预测模型,其分为编码器和解码器;所述编码器和所述解码器均包括嵌入层、多头注意力层以及全连接层,且解码器还包括输出层;所述嵌入层用于为输入序列添加前缀;所述多头注意力层用于计算注意力分数;所述全连接层为前馈神经网络的结构层;编码器的全连接层输出的数据与解码器的多头注意力层输出的数据一并输入至解码器的全连接层;所述输出层用于将经过解码器的全连接层的数据输出;方面情感四元组预测模型输出的四元组的元素包括:方面类别、方面术语、意见术语以及情感值。
4.根据权利要求3所述的产品推荐方法,其特征在于,S2中,所述历史在线评论输入至所述情感预测模型,输出的形式为:方面类别:情感值;
基于各评论的方面类别及其对应的情感值构建产品评价矩阵,其表示为:
Figure QLYQS_1
其中,R表示产品评价矩阵,user 11表示第1个产品的第1个用户;user 1n 表示第1个产品的第n个用户;user k1表示第k个产品的第1个用户;user kn 表示第k个产品的第n个用户;product 1表示第一个产品;product k 表示第k个产品;矩阵的行表示用户对于各产品的评论经情感预测模型的输出;矩阵的列表示产品的各用户的评论经情感预测模型的输出;
Figure QLYQS_2
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别;/>
Figure QLYQS_3
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别的情感值,其余参数以此类推。
5.根据权利要求4所述的产品推荐方法,其特征在于,S3中,隐性信任情况包括隐性相互信任和隐性不相互信任;比对不同用户之间对于不同产品的评论的方面类别数量;当用户之间对于不同产品的评论的方面类别数量相同时,表示用户之间的隐性信任情况为隐性相互信任,否则为隐性不相互信任;
根据隐性信任情况计算用户之间的隐性信任度;
当用户之间的隐性信任情况为隐性相互信任时,用户i对用户j的隐性信任度记为S ij ;计算公式为:
Figure QLYQS_4
其中,S ji 表示用户j对用户i的隐性信任度;
Figure QLYQS_5
表示第k个产品的第i个用户点评的第k个产品的方面类别与第l个产品的第j个用户点评的第l个产品的方面类别的交集中所含元素的数量;/>
Figure QLYQS_6
表示第k个产品的第i个用户点评的所有方面类别;/>
Figure QLYQS_7
表示第l个产品的第j个用户点评的所有方面类别;t表示第t个方面类别;/>
Figure QLYQS_8
表示第k个产品的第i个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure QLYQS_9
表示第l个产品的第j个用户点评的第l个产品的第t个方面类别的情感值;
当用户之间的隐性信任情况为隐性不相互信任时,用户a对用户b的隐性信任度记为S ab ,用户b对用户a的隐性信任度记为S ba ;计算公式为:
Figure QLYQS_10
Figure QLYQS_11
其中,
Figure QLYQS_12
、/>
Figure QLYQS_13
分别表示第k个产品的第a个用户点评的第k个产品的方面类别与第l个产品的第b个用户点评的第l个产品的方面类别的交集与并集中所含元素的数量;/>
Figure QLYQS_14
表示第k个产品的第a个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure QLYQS_15
表示第l个产品的第b个用户点评的第l个产品的第t个方面类别的情感值。
6.根据权利要求5所述的产品推荐方法,其特征在于,S3中,基于用户之间的隐性信任度预测出用户对未参评过的产品的评论的方面类别及其对应的情感值;过程为:
当用户之间的隐性信任情况为隐性相互信任时,情感值计算公式为:
Figure QLYQS_16
当用户之间的隐性信任情况为隐性不相互信任时,情感值计算公式为:
Figure QLYQS_17
其中,S ji 表示用户j对用户i的隐性信任度;S ba 表示用户b对用户a的隐性信任度;
Figure QLYQS_18
表示第l个产品的用户j对产品k预测评论中的第t个方面类别;/>
Figure QLYQS_19
表示第l个产品的用户b对产品k预测评论中的第t个方面类别。
7.根据权利要求6所述的产品推荐方法,其特征在于,S4中,补全后的所述产品评价矩阵,表示为:
Figure QLYQS_20
其中,R表示产品评价矩阵,user 11表示第1个产品的第1个用户;user 1n 表示第1个产品的第n个用户;user k1表示第k个产品的第1个用户;user kn 表示第k个产品的第n个用户;product 1表示第一个产品;product 2表示第二个产品;product k 表示第k个产品;矩阵的行表示用户对于各产品的评论经情感预测模型的输出;矩阵的列表示产品的各用户的评论经情感预测模型的输出;
Figure QLYQS_21
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别;
Figure QLYQS_22
表示第1个产品的第1个用户点评的第1个产品的第1个方面类别的情感值,其余参数以此类推。
8.根据权利要求7所述的产品推荐方法,其特征在于,S5中,产品推荐分为三种情况,分别为:
第一种情况,
根据用户查询获取用户e实时关注的方面类别;当产品k存在与用户e实时关注的方面类别
Figure QLYQS_23
完全相同的用户q的评论时,预测用户e实时关注的方面类别下的第一综合情感值,计算公式为:
Figure QLYQS_24
当产品k不存在与用户e实时关注的方面类别
Figure QLYQS_25
完全相同的用户q的评论时,预测用户e实时关注的方面类别下的第一综合情感值,计算公式为:
Figure QLYQS_26
根据所述综合情感值计算推荐得分,计算公式为:
Figure QLYQS_27
基于各产品的所述第一推荐得分对产品进行排序,构建针对用户e的第一推荐列表;基于所述第一推荐列表对用户e进行产品推荐;
第二种情况,
基于用户e的所述历史在线评论,确定历史在线评论的方面类别及其相应情感值,并基于所述历史在线评论的方面类别及其相应情感值确定用户e对用户g的隐性信任情况;当产品k存在与用户e为隐性相互信任的用户g时,预测用户e在其未参评过的产品k的第二综合情感值,计算公式为:
Figure QLYQS_28
当对产品k不存在与用户e为隐性相互信任的用户g时,预测用户e在其未参评过的产品k的第二综合情感值,计算公式为:
Figure QLYQS_29
根据所述第二综合情感值计算第二推荐得分,计算公式为:
Figure QLYQS_30
基于各产品的所述第二推荐得分对产品进行排序,构建针对用户e的第二推荐列表;基于所述第二推荐列表对用户e进行产品推荐;
第三种情况,
若无法获得用户实时查询的方面类别,且该用户也无历史评论,则通过补全的所述产品评价矩阵计算评论的方面类别的第三综合情感值,计算公式为:
Figure QLYQS_31
根据所述第三综合情感值计算第三推荐得分,计算公式为:
Figure QLYQS_32
基于各产品的所述第三推荐得分对产品进行排序,构建针对新用户的第三推荐列表;基于所述第三推荐列表对新用户进行产品推荐;
其中,
Figure QLYQS_35
表示用户e查询输入的方面类别:/>
Figure QLYQS_39
表示基于用户e实时关注的方面类别预测得到的产品k的第一综合情感值;/>
Figure QLYQS_43
表示第一推荐得分;/>
Figure QLYQS_34
表示第h个产品的第e个用户基于历史在线评论预测得到的产品k的方面类别;/>
Figure QLYQS_40
表示基于用户e对产品h的历史评论中的方面类别及其情感值预测得到的产品k在方面类别/>
Figure QLYQS_44
下的第二综合情感值;/>
Figure QLYQS_46
表示第二推荐得分;/>
Figure QLYQS_33
表示基于补全的所述产品评价矩阵计算得的新用户对产品k点评的方面类别;/>
Figure QLYQS_37
表示新用户对产品k在方面类别/>
Figure QLYQS_41
下的第三综合情感值;/>
Figure QLYQS_45
表示第三推荐得分;/>
Figure QLYQS_36
表示第k个产品的第q个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure QLYQS_38
表示第k个产品的第g个用户点评的第k个产品的第t个方面类别的情感值;/>
Figure QLYQS_42
表示第k个产品的第v个用户点评的第k个产品的第t个方面类别的情感值。
9.根据权利要求8所述的产品推荐方法,其特征在于,情感值的取值标准设定为:{很差:0;差:0.25;中等:0.5;好:0.75;很好:1}。
10.一种用于实现如权利要求9所述的产品推荐方法的系统,其特征在于,包括:数据采集模块、数据预处理模块、方面情感预测模块、用户隐性信任度计算模块、数据填充模块、产品综合得分计算模块;
所述数据采集模块用于获取历史在线评论;
所述数据预处理模块用于剔除所述历史在线评论中的重复评论与空值评论;
所述方面情感预测模块用于将清洗后的历史在线评论输入至所述情感预测模型,得到各评论的方面类别及其对应的情感值;
所述用户隐性信任度计算模块用于根据各评论的方面类别及其对应的情感值计算用户之间的隐性信任度;
所述数据填充模块用于根据用户对未参评过的产品的评论的方面类别及其对应的情感值补全所述产品评价矩阵;
所述产品综合得分计算模块用于计算产品推荐得分,并构建推荐列表对用户进行产品推荐。
CN202310564023.4A 2023-05-18 2023-05-18 一种基于方面情感预测和协同过滤的产品推荐方法及系统 Active CN116308685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310564023.4A CN116308685B (zh) 2023-05-18 2023-05-18 一种基于方面情感预测和协同过滤的产品推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310564023.4A CN116308685B (zh) 2023-05-18 2023-05-18 一种基于方面情感预测和协同过滤的产品推荐方法及系统

Publications (2)

Publication Number Publication Date
CN116308685A true CN116308685A (zh) 2023-06-23
CN116308685B CN116308685B (zh) 2023-07-25

Family

ID=86801758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310564023.4A Active CN116308685B (zh) 2023-05-18 2023-05-18 一种基于方面情感预测和协同过滤的产品推荐方法及系统

Country Status (1)

Country Link
CN (1) CN116308685B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116562305A (zh) * 2023-07-10 2023-08-08 江西财经大学 方面情感四元组预测方法与系统
CN116664253A (zh) * 2023-07-28 2023-08-29 江西财经大学 一种基于广义矩阵分解与遮蔽注意力的项目推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218432A1 (en) * 2017-01-31 2018-08-02 International Business Machines Corporation Recommendation integrated online digital sales service chat system
CN108920503A (zh) * 2018-05-28 2018-11-30 哈尔滨工程大学 一种基于社交网络信任度的微视频个性化推荐算法
CN111339439A (zh) * 2020-02-18 2020-06-26 广东工业大学 一种融合评论文本与时序效应的协同过滤推荐方法和装置
CN112632377A (zh) * 2020-12-21 2021-04-09 西北大学 一种基于用户评论情感分析与矩阵分解的推荐方法
CN114756766A (zh) * 2022-04-22 2022-07-15 山东大学 一种基于中文评论挖掘的方面神经协同过滤推荐方法及系统
US20220245701A1 (en) * 2021-01-29 2022-08-04 Walmart Apollo, Llc Methods and apparatuses for determining personalized recommendations using customer segmentation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218432A1 (en) * 2017-01-31 2018-08-02 International Business Machines Corporation Recommendation integrated online digital sales service chat system
CN108920503A (zh) * 2018-05-28 2018-11-30 哈尔滨工程大学 一种基于社交网络信任度的微视频个性化推荐算法
CN111339439A (zh) * 2020-02-18 2020-06-26 广东工业大学 一种融合评论文本与时序效应的协同过滤推荐方法和装置
CN112632377A (zh) * 2020-12-21 2021-04-09 西北大学 一种基于用户评论情感分析与矩阵分解的推荐方法
US20220245701A1 (en) * 2021-01-29 2022-08-04 Walmart Apollo, Llc Methods and apparatuses for determining personalized recommendations using customer segmentation
CN114756766A (zh) * 2022-04-22 2022-07-15 山东大学 一种基于中文评论挖掘的方面神经协同过滤推荐方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CAO DUY HOANG,等: "Aspect-Category-Opinion-Sentiment Extraction Using Generative Transformer Model", 《2022 RIVF INTERNATIONAL CONFERENCE ON COMPUTING AND COMMUNICATION TECHNOLOGIES (RIVF)》 *
SAMIN POUDEL, MARWAN BIKDASH: "Collaborative Filtering system based on multi-level user clustering and aspect sentiment", 《DATA AND INFORMATION MANAGEMENT》, vol. 6, no. 4 *
丁永刚;李石君;付星;刘梦君;: "面向时序感知的多类别商品方面情感分析推荐模型", 电子与信息学报, no. 06 *
闫晓妍: "基于深度学习的中文在线评论情感分析研究", 《中国博士论文期刊数据库》, no. 02 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116562305A (zh) * 2023-07-10 2023-08-08 江西财经大学 方面情感四元组预测方法与系统
CN116562305B (zh) * 2023-07-10 2023-09-12 江西财经大学 方面情感四元组预测方法与系统
CN116664253A (zh) * 2023-07-28 2023-08-29 江西财经大学 一种基于广义矩阵分解与遮蔽注意力的项目推荐方法
CN116664253B (zh) * 2023-07-28 2023-10-24 江西财经大学 一种基于广义矩阵分解与遮蔽注意力的项目推荐方法

Also Published As

Publication number Publication date
CN116308685B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN110046304B (zh) 一种用户推荐方法和装置
CN116308685B (zh) 一种基于方面情感预测和协同过滤的产品推荐方法及系统
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN111177575A (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN112905739B (zh) 虚假评论检测模型训练方法、检测方法及电子设备
CN113806630A (zh) 基于注意力的多视角特征融合跨域推荐方法及装置
CN112632296B (zh) 基于知识图谱具有可解释性的论文推荐方法及系统、终端
Vilakone et al. Movie recommendation system based on users’ personal information and movies rated using the method of k-clique and normalized discounted cumulative gain
CN116468460A (zh) 基于人工智能的消费金融客户画像识别系统及其方法
Almaghrabi et al. A deep learning based collaborative neural network framework for recommender system
CN114386513A (zh) 一种集成评论与评分的交互式评分预测方法及系统
CN115687760A (zh) 一种基于图神经网络的用户学习兴趣标签预测方法
CN116680363A (zh) 一种基于多模态评论数据的情感分析方法
CN111949894B (zh) 一种基于多空间交互的协同过滤个性化推荐方法
CN111723302A (zh) 一种基于协同双模型深度表示学习的推荐方法
Kundu et al. Deep multi-modal networks for book genre classification based on its cover
CN116010681A (zh) 一种召回模型的训练及检索方法、装置及电子设备
CN113254788B (zh) 一种基于大数据的推荐方法、系统及可读存储介质
CN115481236A (zh) 一种基于用户兴趣建模的新闻推荐方法
CN115391555A (zh) 一种用户感知的知识图谱推荐系统及方法
Khan et al. Brand review prediction using user sentiments: Machine learning algorithm
CN113159976A (zh) 一种微博网络重要用户的识别方法
CN113763084A (zh) 产品推荐的处理方法、装置、设备及存储介质
Sridhar et al. Extending Deep Neural Categorisation Models for Recommendations by Applying Gradient Based Learning
CN117474637B (zh) 基于时序图卷积网络的个性化商品推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant