CN113987363A - 一种基于隐因子预测的冷启动推荐算法 - Google Patents
一种基于隐因子预测的冷启动推荐算法 Download PDFInfo
- Publication number
- CN113987363A CN113987363A CN202111224060.8A CN202111224060A CN113987363A CN 113987363 A CN113987363 A CN 113987363A CN 202111224060 A CN202111224060 A CN 202111224060A CN 113987363 A CN113987363 A CN 113987363A
- Authority
- CN
- China
- Prior art keywords
- user
- matrix
- score
- cold start
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 83
- 239000013598 vector Substances 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000009191 jumping Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 abstract description 18
- 238000010801 machine learning Methods 0.000 abstract description 2
- 230000000873 masking effect Effects 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开的基于隐因子预测的冷启动推荐方法,属于机器学习和推荐系统领域。本发明的评分预测通过预测用户偏好因子来计算用户对项目的评分,克服了协同过滤算法因为用户历史评分缺失无法对新用户进行推荐的问题。本方法针对用户冷启动问题,结合矩阵分解算法和协同过滤算法,提出一个基于隐因子预测的冷启动推荐的方法。本发明提出的方法是将评分数据集通过矩阵分解算法得到用户和项目的隐因子特征向量。如果用户是普通用户,那么就结合用户项目的隐因子向量和偏执值来计算预测评分。如果是新用户,就通过协同过滤算法得到用户的隐因子特征向量(偏好因子),最终计算预测评分。与传统的推荐算法相比,本发明提出的算法不论在精确性还是可扩展性,均高于传统推荐算法,具有一定的实际意义。
Description
技术领域
本发明涉及机器学习和推荐系统领域,具体是基于隐因子预测的冷启动推荐算法。
背景技术
随着互联终端的智能化和互联网的普及,全球数据每天成爆炸式增长,数据中富含信息,也存在着巨大的价值,但是当数据的产生速度远远超出了我们一个人接受数据的能力时,我们不但需要花时间接收信息,还需要话额外的时间从庞大的数据中挑选我们需要的信息,为了解决这个问题,推荐系统应运而生。
在20世纪90年代提出协同过滤推荐系统以来,通过学习用户的历史行为,兴趣爱好和需求来提供的个性化推荐服务已经在解决数据过载问题上起到了很好地作用。协同过滤就是根据一些具有相似兴趣的人选择给出一个你可能感兴趣的服务列表,然后从推荐的列表中筛选出你感兴趣的物品/服务。协同过滤推荐算法的出现和发展,在一些社会领域已经有了很好地效果。通过用户的兴趣爱好以及历史行为,可以针对用户,从海量的信息中提取用户可能感兴趣的产品或信息推荐给用户。协同过滤推荐算法主要分为基于项目的协同过滤(item-based CF)、基于用户的协同过滤(user-based CF)和基于模型的协同过滤算法。其中基于用户的协同过滤推荐算法主要方法是根据不同用户对项目的评分历史,使用皮尔森相关系数公式计算各用户之间的相似度,得到用户的相似度矩阵。通过计算目标用户与相似用户相似度和相似用户对项目的评分来预测目标用户对项目的评分。基于模型的协同过滤算法主要包括基于矩阵分解的协同过滤,基于深度学习的协同过滤和基于遗传算法的协同过滤。
基于矩阵分解的协同过滤有称为基于隐因子分解的协同过滤。通过矩阵分解把评分矩阵R分解成U(用户特征矩阵)和V(项目特征矩阵),通过用户特征矩阵和项目特征矩阵的乘积去拟合预测分数,再利用优化算法,如梯度下降法不断训练,最终得到每个用户对任意商品的评分,提高了稀疏数据集推荐算法的精确度。随着矩阵分解中隐式特征维度(隐因子个数)的提高,模型的推荐结果也将变得个性化,当隐因子个数极大的时候,也会发生过拟合的现象,反而导致推荐的精度下降。
发明内容
本发明提供一种基于隐因子预测的冷启动推荐算法,该方法基于矩阵分解算法将评分数据集分解得到用户和项目的隐因子特征向量。如果用户是普通用户,那么就结合用户项目的隐因子向量和偏执值来计算预测评分。如果是新用户,就通过协同过滤算法得到用户的隐因子特征向量(偏好因子),最终计算预测评分。如图1所示,本发明公开的基于隐因子预测的冷启动推荐算法,包括以下步骤:
步骤2)使用用户矩阵U、项目矩阵V和填充矩阵B,通过矩阵分解模型计算评分预测矩阵。
步骤3)利用步骤2)得到的评分预测矩阵和真实评分矩阵通过损失函数计算误差。
步骤4)使用改进的交替最小二乘法对用户矩阵U、项目矩阵V和填充矩阵B优化更新。当达到最大迭代次数iterate时,得到训练好的用户矩阵U、项目矩阵V和填充矩阵B。
步骤6)通过目标用户和其他非新用户的相似度,得到目标用户u的n个最近邻居Neighboru={u1,u2,...,un}。
本发明的有益效果是:针对传统邻域推荐算法存在冷启动,推荐精度不足的问题,本发明融合矩阵分解算法和相似度计算,通过预测用户隐因子特征向量的方法,有效解决了新用户缺少历史评分数据而无法推荐的问题。并且使用改进的交替最小二乘法,有效提高了推荐的精度。实验证明该方法在真实数据集上的推荐效果远远高于传统推荐算法。
附图说明
图1为本发明基于隐因子预测的冷启动推荐算法流程图。
具体实施方式
下面结合附图,对本发明提出的一种基信息熵聚类的异常检测算法进行详细说明。
如图1所示,本发明中提出的基于信息熵聚类的异常检测算法,包括以下步骤:
步骤3)利用步骤2)得到的评分预测矩阵和真实评分矩阵通过损失函数计算误差。损失函数公式如下
L=minu*,v*,b*tu,i·[L′,0]T
其中tu,i的目的是区分评分矩阵中的值是真实评价还是填充值。在之后的参数优化过程中实现针对性优化。其中 L′是针对真实评价项目的误差计算,λ是正则化系数,||uu||2+||vi||2+||bu,i||2是正则化项,防止过拟合。
步骤4)使用改进的交替最小二乘法对用户矩阵U、项目矩阵V和填充矩阵B优化更新。主要是针对真实评价项目,如果评分ru,i是真实存在用户对项目评价的,就利用交替最小二乘法对uu,vi,bu,i进行更新优化。公式如下
其中uu,vi,bu,i是评分对应的特征向量和填充值。当迭代次数达到最大迭代次数iterate时,就可以得到训练好的用户矩阵U、项目矩阵V和填充矩阵B。
步骤6)通过步骤5)得到的目标用户和其他非新用户的相似度,通过排序可以得到目标用户u的n个最近邻居Neighboru={u1,u2,...,un}。
步骤7)在计算新用户u的隐因子特征向量时,在步骤4)得到的训练好的用户矩阵U中找到对应的Neighboru中相似用户的隐因子特征向量,再结合步骤6)得到的目标用户和相思用户的相似度,计算新用户u的隐因子特征向量公式如下
步骤8)结合目标用户u的隐因子特征向量和步骤4)得到的项目矩阵V,预测用户u对项目的评分当目标用户非新用户时,预测评分由公式计算得到,其中uu由步骤4)得到。当目标用户是新用户时,预测评分通过公式计算得到,其中有步骤7)得到。
至此,本流程结束。
下面讲述本发明所进行的实验过程及结果。
为探究基于隐因子预测的冷启动推荐算法(nALSCS)在实际推荐中的效果,实验使用MovieLens-1M提供的关于用户对电影的评分数据集,新用户比例为10%。评分记录中,每一个用户对电影的评分数据包括用户的id,电影的id和用户评分,其中用户评分是1到5的整数,用户对某个电影的更感兴趣,那么用户对这个电影的评分就越高。实验选取ALS,MF,CMF和nALSCS四个算法进行对比。实验设置隐因子个数40,最大迭代次数200,邻居节点个数10。
为了检验推荐效果的好坏,实验使用平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)作为评价指标。当MAE和RMSE越小时,意味着预测误差更小,预测的值更接近实际情况,预测的精确度越高。反之,意味着预测的效果越差。
实验结果如下:
表1 推荐性能比较
如表1所示,不论是平均绝对误差还是均方根误差,基于隐因子预测的冷启动推荐算法都优于另外三个推荐算法。在解决新用户问题上有巨大的提升,以CMF为例,在评价指标MAE上有大约17%的提升,在RSME上有大约20.4%的提升。
综上所述,以上实施例仅用以说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.基于隐因子预测的冷启动推荐算法,其特征在于,包括以下步骤:
步骤2)使用用户矩阵U、项目矩阵V和填充矩阵B,通过矩阵分解模型计算评分预测矩阵。
步骤3)利用步骤2)得到的评分预测矩阵和真实评分矩阵通过损失函数计算误差。
步骤4)使用改进的交替最小二乘法对用户矩阵U、项目矩阵V和填充矩阵B优化更新。当达到最大迭代次数iterate时,得到训练好的用户矩阵U、项目矩阵V和填充矩阵B。
步骤6)通过目标用户和其他非新用户的相似度,得到目标用户u的n个最近邻居Neighboru={u1,u2,...,un}。
2.根据权利要求1所述的基于隐因子预测的冷启动推荐算法,其特征在于:所述步骤1)中,和传统的矩阵分解算法一样,为了得到用户矩阵U和项目矩阵V,本发明需要确定隐因子个数和迭代次数,并且对特征矩阵进行一个初始化。
7.根据权利要求1所述的基于隐因子预测的冷启动推荐算法,其特征在于:所述步骤6)中,对步骤5)得到的相似度进行排序,选择新用户u的n个最相似非新用户Neighboru={u1,u2,...,un}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111224060.8A CN113987363A (zh) | 2021-10-20 | 2021-10-20 | 一种基于隐因子预测的冷启动推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111224060.8A CN113987363A (zh) | 2021-10-20 | 2021-10-20 | 一种基于隐因子预测的冷启动推荐算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113987363A true CN113987363A (zh) | 2022-01-28 |
Family
ID=79739773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111224060.8A Pending CN113987363A (zh) | 2021-10-20 | 2021-10-20 | 一种基于隐因子预测的冷启动推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113987363A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115034847A (zh) * | 2022-05-25 | 2022-09-09 | 山东大学 | 基于深度学习的产品推荐方法、系统、存储介质及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012126741A2 (en) * | 2011-03-18 | 2012-09-27 | Telefonica, S.A. | Method for context-aware recommendations based on implicit user feedback |
US20150347905A1 (en) * | 2014-06-02 | 2015-12-03 | International Business Machines Corporation | Modeling user attitudes toward a target from social media |
CN108256958A (zh) * | 2017-12-22 | 2018-07-06 | 华南师范大学 | 一种基于WUDiff和RMF的混合协同推荐算法 |
CN109271582A (zh) * | 2018-08-20 | 2019-01-25 | 东南大学 | 一种基于带属性元路径的个性化信息推荐方法 |
CN109783769A (zh) * | 2017-11-15 | 2019-05-21 | 中国移动通信集团上海有限公司 | 一种基于用户项目评分的矩阵分解方法和装置 |
-
2021
- 2021-10-20 CN CN202111224060.8A patent/CN113987363A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012126741A2 (en) * | 2011-03-18 | 2012-09-27 | Telefonica, S.A. | Method for context-aware recommendations based on implicit user feedback |
US20150347905A1 (en) * | 2014-06-02 | 2015-12-03 | International Business Machines Corporation | Modeling user attitudes toward a target from social media |
CN109783769A (zh) * | 2017-11-15 | 2019-05-21 | 中国移动通信集团上海有限公司 | 一种基于用户项目评分的矩阵分解方法和装置 |
CN108256958A (zh) * | 2017-12-22 | 2018-07-06 | 华南师范大学 | 一种基于WUDiff和RMF的混合协同推荐算法 |
CN109271582A (zh) * | 2018-08-20 | 2019-01-25 | 东南大学 | 一种基于带属性元路径的个性化信息推荐方法 |
Non-Patent Citations (3)
Title |
---|
EDUARDO PEREIRA FRESSATO等: "Similarity-Based Matrix Factorization for Item Cold-Start in Recommender Systems", 《2018 7TH BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS (BRACIS)》, 16 December 2018 (2018-12-16), pages 1 - 15 * |
周鑫: "基于隐因子学习的协同推荐算法研究", 《万方数据》, 1 November 2023 (2023-11-01), pages 1 - 65 * |
赵伟: "基于物品相似度与用户信任度的协同过滤推荐算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 June 2020 (2020-06-15), pages 138 - 1209 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115034847A (zh) * | 2022-05-25 | 2022-09-09 | 山东大学 | 基于深度学习的产品推荐方法、系统、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110162706B (zh) | 一种基于交互数据聚类的个性化推荐方法及系统 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN107633444B (zh) | 基于信息熵与模糊c均值聚类的推荐系统噪声过滤方法 | |
CN109902235B (zh) | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 | |
CN109471982B (zh) | 一种基于用户和服务聚类QoS感知的Web服务推荐方法 | |
Hassan et al. | Genetic algorithm approaches for improving prediction accuracy of multi-criteria recommender systems | |
CN112115377A (zh) | 一种基于社交关系的图神经网络链路预测推荐方法 | |
CN113239264A (zh) | 基于元路径网络表示学习的个性化推荐方法及系统 | |
CN115829683A (zh) | 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统 | |
CN106651461A (zh) | 基于灰理论的电影个性化推荐方法 | |
CN113239266B (zh) | 基于局部矩阵分解的个性化推荐方法及系统 | |
CN113987363A (zh) | 一种基于隐因子预测的冷启动推荐算法 | |
Hu et al. | Establishing Grey Criteria Similarity Measures for Multi-criteria Recommender Systems. | |
Ifada et al. | How relevant is the irrelevant data: leveraging the tagging data for a learning-to-rank model | |
Tso et al. | Attribute-aware collaborative filtering | |
CN113590964B (zh) | 一种基于异构建模的深层神经网络Top-N推荐方法 | |
CN115935067A (zh) | 面向社会化推荐的语义与结构视图融合的物品推荐方法 | |
CN115392975A (zh) | 一种基于Canopy模糊聚类和奇异值分解的个性化推荐方法 | |
Salehi et al. | Attribute-based collaborative filtering using genetic algorithm and weighted c-means algorithm | |
Gasmi et al. | Enhanced context-aware recommendation using topic modeling and particle swarm optimization | |
CN114912031A (zh) | 基于聚类和协同过滤的混合推荐方法和系统 | |
Papadakisa et al. | SCoR: a synthetic coordinate based recommender system | |
CN112561599A (zh) | 一种融合域特征交互的基于注意力网络学习的点击率预测方法 | |
Wibowo et al. | Movie Recommendation System Using Knowledge-Based Filtering and K-Means Clustering | |
Shafiei Gol et al. | Intelligent approach for attracting churning customers in banking industry based on collaborative filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |