CN108959409A - 一种结合评论中主题与情感信息的矩阵分解推荐算法 - Google Patents
一种结合评论中主题与情感信息的矩阵分解推荐算法 Download PDFInfo
- Publication number
- CN108959409A CN108959409A CN201810576463.0A CN201810576463A CN108959409A CN 108959409 A CN108959409 A CN 108959409A CN 201810576463 A CN201810576463 A CN 201810576463A CN 108959409 A CN108959409 A CN 108959409A
- Authority
- CN
- China
- Prior art keywords
- user
- algorithm
- commodity
- comment
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Abstract
本发明公开了一种结合评论中主题与情感信息的矩阵分解推荐算法。该算法包含特征提取算法与评分预测算法两个部分。特征提取为本发明提供的TST算法,该算法首先将商品评论按照商品编号进行聚合,然后采用LDA提取商品的主题特征,之后再将商品评论按照用户编号进行聚合,计算用户的情感并映射为用户偏好特征。评分预测为本发明提供的WMF算法,该算法首先以特征提取阶段提取到的特征来初始化特征向量,随后对特征向量进行加权矩阵分解,最后基于矩阵分解的结果对缺失评分进行预测。与现有的主题矩阵分解推荐算法相比,本发明提供的结合评论中主题与情感信息的矩阵分解推荐算法具有更好的用户偏好可解释性以及更高的预测精度。
Description
技术领域
本发明是关于电子商务中的商品推荐技术领域,具体涉及一种结合评论中主题与情感信息的矩阵分解推荐算法。
背景技术
在电子商务中,为了更好地服务用户,同时获得更好的经济效益,通常会使用推荐系统,根据用户的历史行为(例如用户对商品的评分或者评论),为用户推荐相应的商品,评分预测是推荐系统中常用的一种方法。若有m个用户和n个商品,ru,i代表用户u(1≤u≤m)对商品i(1≤i≤n)的评分,其中ru,i∈{1,2,3,4,5},所有用户对所有商品的评分构成了一个评分矩阵,评分预测是根据评分矩阵中已有的评分,来预测评分矩阵中缺失的评分,然后根据预测值来对用户进行商品推荐。
对于评分预测来说,目前比较流行的方法之一是主题矩阵分解,其采用主题模型来处理评论,再与传统的矩阵分解相结合,来提高矩阵分解模型的可解释性和性能。但是现有主题矩阵分解方法没有利用评论中的情感信息,使得用户偏好缺乏可解释性,这是现有主题矩阵分解方法的一个不足。此外,现有的主题矩阵分解方法将主题模型与矩阵分解同时进行,增加了模型的复杂性,模型更容易过拟合,这是现有主题矩阵分解方法的另一个不足。
发明内容
针对现有主题矩阵分解方法存在的不足,本发明提供了一种结合评论中主题与情感信息的矩阵分解推荐算法。本算法包含特征提取与评分预测两个部分。其中特征提取采用本发明提供的TST算法,该算法首先将商品评论按照商品编号进行聚合,然后采用LDA提取商品的主题特征,随后在将商品评论按照用户编号进行聚合,计算用户的情感并映射为用户偏好特征。评分预测采用本发明提供的WMF算法,该算法首先以特征提取阶段提取到的特征初始化特征向量,随后对特征向量加权在进行矩阵分解,最后基于矩阵分解的结果对缺失评分进行预测。与现有的主题矩阵分解算法相比,本发明提供的结合评论中主题与情感信息的矩阵分解推荐算法具有更好的用户偏好可解释性以及更高的预测精度。
本发明包含以下内容:
1、一种结合评论中主题与情感信息的矩阵分解推荐算法
该算法包含特征提取算法(详见发明内容2)和加权矩阵分解算法(详见发明内容3)两个部分,见图1。
2、一种特征提取算法-TST算法
在本发明提供的特征提取部分,采用本发明提供的TST算法(即图1中的S2,详见S2.1、S2.2、S2.3)。该算法首先将商品评论按照商品编号进行聚合,然后采用LDA算法,根据公式(1)(2)计算商品的主题特征,随后再将商品评论按照用户编号进行聚合,根据公式(3)计算用户的情感分数,根据公式(4)修正用户的情感分数,根据公式(5)计算用户的偏好特征。
3、一种加权矩阵分解评分预测算法-WMF算法
在本发明提供的评分预测部分,采用本发明提供的WMF算法(即图1中的S2,详见图5),该算法首先以特征提取阶段提取到的特征初始化特征向量,随后对特征向量加权在进行矩阵分解,最后基于矩阵分解的结果对缺失评分进行预测。优化目标函数的计算表达式见公式(6)(7)(8),参数更新表达式见(9)(10)(11)(12),评分预测函数表达式见(7)。
附图说明
图1是本发明提供的一种结合评论中主题与情感信息的矩阵分解推荐算法的流程图。
图2是图1中S1的流程图。
图3是图1中S2的流程图。
图4是图1中S3的流程图。
图5是图1中S4的流程图
具体实施方式
本发明公开的一种结合评论中主题与情感信息的矩阵分解推荐算法包含特征提取算法和加权矩阵分解算法两个部分。
结合评论中主题与情感信息的矩阵分解推荐算法整体流程图如图1所示。下面结合附图和实施例,对本发明的具体实施方式做详细说明。
一、预处理
本部分对应图1中的S1,详细流程见图2
S1:预处理
S1.1:读取数据
S1.2:提取所需属性
提取所需属性,包括用户编号、商品编号、用户评分、评论这四个属性,构成一个四元组列表。
S1.3:删除重复项
遍历四元组列表,删除数据中的重复项。
S1.4:编码用户编号和商品编号
在四元组列表中分别提取出用户集合和商品集合,按照这两个集合对用户和商品进行编号。
二、计算商品特征
本部分对应图1中的S2,具体流程见图3。
S2:计算商品特征
S2.1:构建商品文档,将评论按照商品编号进行聚合,得到一个商品评论字典列表{商品编号:用户评论集}
S2.2:计算商品主题,对上面得到的商品文档,采用LDA主题提取算法,提取商品评论中的主题特征:
V=θ #(2)
三、计算用户偏好
本部分对应图1中的S3,具体流程见图4。
S3:计算用户偏好
S3.1:构建用户文档,将用户评论按照用户编号进行聚合,得到一个用户评论列表{用户编号:用户评论集}
S3.2:计算用户情感,对上面得到的用户文档,采用基于词典的情感分析方法,计算用户情感得分:
S3.3:修正用户情感得分,对上述计算得到的用户情感得分,采用用户评分进行修正,使得其值更接近真实的用户情感得分,修正计算方式如下:
S3.4:提取用户偏好特征,在得到了用户情感特征特征向量后,将其映射到k维的用户偏好特征空间,其计算方式如下:
四、加权矩阵分解
本部分对应图1中的S4,具体流程见图5。
S4:加权矩阵分解
S4.1:构建新的目标函数
其中T为测试集,为评分预测函数,其定义如下:
其中μ为全局平均分,bi为商品偏置项,bu为用户偏置项,wv为商品特征权重,V为商品特征向量,wu为用户偏好权重,U为用户偏好向量。
Ω(θ)为正则项,其定义如下:
其中θ为参数集。
S4.2:初始化参数
其中μ初始化为全局平均分,商品偏置项bi、用户偏置项bu、商品特征权重wv、用户特征权重wu均初始化为(0,1)之间的随机数,收敛阈值ε初始化为0.1,最大迭代次数t初始化1000,商品特征向量V初始化为计算得到的商品特征向量,用户偏好向量U初始化为计算得到的用户偏好向量。学习率α初始化为0.5,正则项系数λ初始化为0.1,并根据实际情况对α和λ进行校正。
S4.3:更新参数集
需要更新的参数集为{bi,bu,wv,wu},更新公式如下:
b′u=-α[(ru,i-μ-bi-bu-wvVT·wuU)+λbu]#(9)
b′i=-α[(ru,i-μ-bi-bu-wvVT·wuU)+λbi]#(10)
w′v=-α[(ru,i-μ-bi-bu-wvVT·wuU)VT·wuU+λwv]#(11)
w′u=-α[(ru,i-μ-bi-bu-wvVT·wuU)wvVT·U+λwu]#(12)
当目标函数满足收敛条件时,即目标函数的变化小于收敛阈值ε或达到最大的迭代次数t,转到S4.4.继续执行,否则迭代的执行步骤S4.3。
S4.4:预测
学习出参数集{b′i,b′u,w′v,w′u}以后,代入式(7)得到预测评分
S4.5:推荐
给定推荐商品的数量N,将按照降序排列,前N个对应的商品为最终推荐给用户u的商品。
Claims (3)
1.一种结合评论中主题与情感信息的矩阵分解推荐算法,其特征在于:包含特征提取算法与评分预测算法,其中,特征提取算法为本发明提供的TST算法,评分预测算法为本发明提供的WMF算法。
2.根据权利要求1所述的一种结合评论中主题与情感信息的矩阵分解推荐算法,其特征在于,其中的情感主题特征提取算法——TST算法,具体步骤如下:
步骤一:预处理,提取出用户编号、商品编号、用户评分、评论构成一个四元组列表,随后对数据进行去重、编码等预处理操作;
步骤二:商品特征提取
1)构建商品文档,将评论按照商品编号进行聚合,得到一个商品评论字典列表{商品编号:用户评论集},
2)计算商品主题,对上面得到的商品文档,采用隐狄利克雷LDA主题提取算法,提取商品评论中的主题特征:
并令
V=θ (1)
其中T为商品评论构成的文档,θ为商品主题向量,Φ为主题词汇向量,z为隐变量,Nd为商品文档数量,V为物品特征向量;
步骤三:用户偏好特征提取
1)构建用户文档,将用户评论按照用户编号进行聚合,得到一个用户评论列表{用户编号:用户评论集},
2)计算用户情感,对上面得到的用户文档,采用基于词典的情感分析方法,计算用户情感得分:
其中wi为情感词的分数,d为情感词的数量,
3)修正用户情感得分,对上述计算得到的用户情感得分,采用用户评分进行修正,使得其值更接近真实的用户情感得分,修正公式如下:
其中ru,i为用户u对商品i的评分,共有m个用户和n个商品,即1≤u≤m、1≤i≤n,ru,i∈{1,2,3,4,5};Score为步骤2)计算得到用户情感得分,Score′是修正后的用户得分,
4)提取用户偏好特征:在计算得到了Score′后,将其映射到k维的用户偏好特征空间,计算公式为:
其中S为修正后的用户情感集{Score′},b为该集合的元素数目。
3.根据权利要求1所述的一种结合评论中主题与情感信息的矩阵分解推荐算法,其特征在于,其中的加权矩阵分解算法——WMF算法,具体步骤如下:
步骤一:构建目标函数
其中T为测试集,为评分预测函数,其定义如下:
其中μ为全局平均分,bi为商品偏置项,bu为用户偏置项,wv为商品特征权重,
V为商品特征向量,wu为用户偏好权重,U为用户偏好向量,
Ω(θ)为正则项,其定义如下:
其中θ为参数集;
步骤二:初始化参数
μ初始化为全局平均分,商品偏置项bi、用户偏置项bu、商品特征权重wv、用户特征权重wu均初始化为(0,1)之间的随机数,商品特征向量V初始化为θ,如式(1)所示,用户偏好向量U初始化为计算得到的用户偏好向,如式(2)所示;学习率α初始化为0.5,正则项系数λ初始化为0.1,并根据实际情况对α和λ进行校正;
步骤三:更新参数集
需要更新的参数集为{bi,bu,wv,wu},更新公式如下:
b′u=-α[(ru,i-μ-bi-bu-wvVT·wuU)+λbu]
b′i=-α[(ru,i-μ-bi-bu-wvVT·wuU)+λbi]
w′v=-α[(ru,i-μ-bi-bu-wvVT·wuU)VT·wuU+λwv]
w′u=-α[(ru,i-μ-bi-bu-wvVT·wuU)wvVT·U+λwu]
其中α为学习速率,通常设置为0.5,可以根据实际情况进行调整;当目标函数收敛时,转到步骤四执行,否则迭代的执行步骤三;
步骤四:预测
学习出参数集{b′i,b′u,w′v,w'u}以后,代入式(3)得到预测评分
步骤五:推荐
给定推荐商品的数量N,将按照降序排列,前N个对应的商品为最终推荐给用户u的商品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810576463.0A CN108959409A (zh) | 2018-06-06 | 2018-06-06 | 一种结合评论中主题与情感信息的矩阵分解推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810576463.0A CN108959409A (zh) | 2018-06-06 | 2018-06-06 | 一种结合评论中主题与情感信息的矩阵分解推荐算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108959409A true CN108959409A (zh) | 2018-12-07 |
Family
ID=64493195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810576463.0A Pending CN108959409A (zh) | 2018-06-06 | 2018-06-06 | 一种结合评论中主题与情感信息的矩阵分解推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108959409A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766188A (zh) * | 2019-01-14 | 2019-05-17 | 长春理工大学 | 一种负载均衡调度方法及系统 |
CN110648163A (zh) * | 2019-08-08 | 2020-01-03 | 中山大学 | 一种基于用户评论的推荐算法 |
CN110766435A (zh) * | 2018-12-19 | 2020-02-07 | 北京嘀嘀无限科技发展有限公司 | 向量训练方法、装置、电子设备以及计算机可读存储介质 |
CN111222332A (zh) * | 2020-01-06 | 2020-06-02 | 华南理工大学 | 一种结合注意力网络和用户情感的商品推荐方法 |
CN111738807A (zh) * | 2020-07-23 | 2020-10-02 | 上海众旦信息科技有限公司 | 用于推荐目标对象的方法、计算设备和计算机存储介质 |
CN111818370A (zh) * | 2020-06-30 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、电子设备及计算机可读存储介质 |
CN111966888A (zh) * | 2019-05-20 | 2020-11-20 | 南京大学 | 融合外部数据的基于方面类别的可解释性推荐方法及系统 |
CN112632377A (zh) * | 2020-12-21 | 2021-04-09 | 西北大学 | 一种基于用户评论情感分析与矩阵分解的推荐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150095330A1 (en) * | 2013-10-01 | 2015-04-02 | TCL Research America Inc. | Enhanced recommender system and method |
CN105138508A (zh) * | 2015-08-06 | 2015-12-09 | 电子科技大学 | 一种基于偏好扩散的上下文推荐系统 |
CN106202519A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 一种结合用户评论内容和评分的项目推荐方法 |
US20170109633A1 (en) * | 2015-10-15 | 2017-04-20 | Sap Se | Comment-comment and comment-document analysis of documents |
CN107563841A (zh) * | 2017-08-03 | 2018-01-09 | 电子科技大学 | 一种基于用户评分分解的推荐系统 |
-
2018
- 2018-06-06 CN CN201810576463.0A patent/CN108959409A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150095330A1 (en) * | 2013-10-01 | 2015-04-02 | TCL Research America Inc. | Enhanced recommender system and method |
CN105138508A (zh) * | 2015-08-06 | 2015-12-09 | 电子科技大学 | 一种基于偏好扩散的上下文推荐系统 |
US20170109633A1 (en) * | 2015-10-15 | 2017-04-20 | Sap Se | Comment-comment and comment-document analysis of documents |
CN106202519A (zh) * | 2016-07-22 | 2016-12-07 | 桂林电子科技大学 | 一种结合用户评论内容和评分的项目推荐方法 |
CN107563841A (zh) * | 2017-08-03 | 2018-01-09 | 电子科技大学 | 一种基于用户评分分解的推荐系统 |
Non-Patent Citations (1)
Title |
---|
李琳等: "融合评分矩阵与评论文本的商品推荐模型", 《计算机学报》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110766435A (zh) * | 2018-12-19 | 2020-02-07 | 北京嘀嘀无限科技发展有限公司 | 向量训练方法、装置、电子设备以及计算机可读存储介质 |
CN109766188B (zh) * | 2019-01-14 | 2020-12-08 | 长春理工大学 | 一种负载均衡调度方法及系统 |
CN109766188A (zh) * | 2019-01-14 | 2019-05-17 | 长春理工大学 | 一种负载均衡调度方法及系统 |
CN111966888B (zh) * | 2019-05-20 | 2023-12-15 | 南京大学 | 融合外部数据的基于方面类别的可解释性推荐方法及系统 |
CN111966888A (zh) * | 2019-05-20 | 2020-11-20 | 南京大学 | 融合外部数据的基于方面类别的可解释性推荐方法及系统 |
CN110648163A (zh) * | 2019-08-08 | 2020-01-03 | 中山大学 | 一种基于用户评论的推荐算法 |
CN110648163B (zh) * | 2019-08-08 | 2024-03-22 | 中山大学 | 一种基于用户评论的推荐算法 |
CN111222332A (zh) * | 2020-01-06 | 2020-06-02 | 华南理工大学 | 一种结合注意力网络和用户情感的商品推荐方法 |
CN111818370B (zh) * | 2020-06-30 | 2022-03-11 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、电子设备及计算机可读存储介质 |
CN111818370A (zh) * | 2020-06-30 | 2020-10-23 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、电子设备及计算机可读存储介质 |
CN111738807A (zh) * | 2020-07-23 | 2020-10-02 | 上海众旦信息科技有限公司 | 用于推荐目标对象的方法、计算设备和计算机存储介质 |
CN112632377A (zh) * | 2020-12-21 | 2021-04-09 | 西北大学 | 一种基于用户评论情感分析与矩阵分解的推荐方法 |
CN112632377B (zh) * | 2020-12-21 | 2023-06-27 | 西北大学 | 一种基于用户评论情感分析与矩阵分解的推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959409A (zh) | 一种结合评论中主题与情感信息的矩阵分解推荐算法 | |
CN106920147B (zh) | 一种基于词向量数据驱动的商品智能推荐方法 | |
CN109522474B (zh) | 基于交互序列数据挖掘深度用户相似性的推荐方法 | |
CN111079028B (zh) | 基于多源辅助信息的协同过滤推荐系统及方法 | |
Li et al. | Fuzzy linear programming approach to multiattribute decision making with multiple types of attribute values and incomplete weight information | |
CN107563841A (zh) | 一种基于用户评分分解的推荐系统 | |
CN108334592B (zh) | 一种基于内容与协同过滤相结合的个性化推荐方法 | |
Wang et al. | An iterative algorithm to derive priority from large-scale sparse pairwise comparison matrix | |
CN112598462A (zh) | 基于协同过滤和深度学习的个性化推荐方法及系统 | |
CN103324690A (zh) | 基于因子化条件受限玻尔兹曼机的混合推荐方法 | |
Trehan et al. | Time-varying equilibrium real rates and monetary policy analysis | |
CN109034960B (zh) | 一种基于用户节点嵌入的多属性推断的方法 | |
CN102231166A (zh) | 基于社会上下文的协同推荐方法 | |
CN106815347A (zh) | 基于商品相似度的改进slope one协同过滤推荐算法 | |
Luaces et al. | A factorization approach to evaluate open-response assignments in MOOCs using preference learning on peer assessments | |
CN106897911A (zh) | 一种基于用户和物品的自适应个性化推荐方法 | |
CN105138508A (zh) | 一种基于偏好扩散的上下文推荐系统 | |
CN104239496A (zh) | 一种结合模糊权重相似性度量和聚类协同过滤的方法 | |
US20180143968A1 (en) | System, method and non-transitory computer readable storage medium for conversation analysis | |
CN114358657B (zh) | 一种基于模型融合的岗位推荐方法及装置 | |
CN113722583A (zh) | 推荐方法、推荐模型训练方法及相关产品 | |
CN113592609A (zh) | 一种利用时间因素的个性化服饰搭配推荐方法与系统 | |
CN111460316A (zh) | 一种面向知识系统的个性化推荐方法及计算机存储介质 | |
KR20160066395A (ko) | 행렬 분해 모델 기반 데이터 분석 방법 및 장치 | |
CN110569355B (zh) | 一种基于词块的观点目标抽取和目标情感分类联合方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181207 |
|
WD01 | Invention patent application deemed withdrawn after publication |