CN102982107B - 一种融合用户、项目和上下文属性信息的推荐系统优化方法 - Google Patents
一种融合用户、项目和上下文属性信息的推荐系统优化方法 Download PDFInfo
- Publication number
- CN102982107B CN102982107B CN201210442382.4A CN201210442382A CN102982107B CN 102982107 B CN102982107 B CN 102982107B CN 201210442382 A CN201210442382 A CN 201210442382A CN 102982107 B CN102982107 B CN 102982107B
- Authority
- CN
- China
- Prior art keywords
- user
- project
- vector
- sum
- centerdot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种融合用户、项目和上下文属性信息的推荐系统优化方法,该方法通过在矩阵分解模型中融合用户、项目和上下文的属性信息,在个性化推荐系统中提高推荐精度。其特点是考虑用户、项目和上下文属性信息对总体评分、用户兴趣及项目得分的不同影响,应用于原矩阵分解模型的计算。该方法由于同时考虑了用户、项目和上下文属性对评分的影响,其推荐精度明显高于仅采用了用户项目二维评分矩阵信息的矩阵分解模型。
Description
技术领域
本发明涉及一种融合用户、项目和上下文属性信息的推荐系统优化方法,具体涉及一种考虑用户、项目和上下文属性信息对总体评分、用户评分和项目得分的影响,并融入矩阵分解模型,从而对推荐系统的推荐精度进行提高的方法,适用于协同过滤推荐系统,属于推荐系统研究的技术领域。
背景技术
推荐系统的目的是充分挖掘用户的兴趣、帮助用户发现自己感兴趣的东西。近二十年来,推荐系统得到了广泛研究,并成功应用于各种互联网商用系统。但是如何为用户生成更加准确的推荐,一直是推荐系统领域研究的热点之一。
协同过滤算法是推荐系统中应用最为广泛的算法,其中的矩阵分解模型具有优异的预测精度。传统的矩阵分解模型SVD仅使用用户-项目二维评分矩阵数据,存在数据源单一的缺陷。因此,很多研究者就如何在矩阵分解模型中引入其他数据信息来提高模型质量展开了研究。其中代表性的包括Yehuda Koren和Robert Bell提出的引入了隐反馈数据以及时间上下文的矩阵分解模型,Alexandros Karatzoglou等提出的引入上下文信息的N-维张量分解模型,Steffen Rendle等提出的融合上下文信息的因式分解机模型,等等。
在现有的基于矩阵分解模型的改进方法中,用户、项目属性信息没有得到充分利用,而且很少有方法将用户、项目和上下文属性信息同时结合起来应用于矩阵分解模型来提高推荐精度。对此,本发明提出一种融合用户、项目和上下文属性信息的协同过滤推荐方法,考虑用户、项目和上下文属性信息对总体评分、用户评分和项目得分的影响,并融入矩阵分解模型,从而对推荐系统的推荐精度进行提高。
发明内容
本发明要解决的技术问题为:克服现有技术的局限性,提供一种融合用户、项目和上下文属性信息的协同过滤推荐方法,该方法在矩阵分解模型中同时融入用户、项目和上下文属性信息来修正预测评分的偏差,提高个性化推荐系统的推荐精度。
本发明解决上述技术问题采用的技术方案:一种融合用户、项目和上下文属性信息的推荐系统优化方法,在矩阵分解模型中同时融入用户、项目和上下文属性信息来修正预测评分的偏差,提高个性化推荐系统的推荐精度;具体实现过程如下:
首先,对于每个用户u,通过属性向量转换规则,将用户属性信息转换为用户属性向量vu,并引入用户属性信息对总体评分的影响向量bUA和对项目i得分的影响向量最后得到考虑用户属性信息后用户u对项目i的评分偏差修正项其公式为其中,sum()表示计算向量各个元素之和的函数;对于每个项目i,通过属性向量转换规则,将项目属性信息转换为项目属性向量vi,并引入项目属性信息对总体评分的影响向量bIA和对用户u评分的影响向量最后得到考虑项目属性信息后用户u对项目i的评分偏差修正项其公式为对于每条评分关联的上下文c,通过属性向量转换规则,将上下文属性信息转换为上下文属性向量vc,并引入上下文属性信息对总体评分的影响向量bCA、对用户u评分的影响向量和对项目i得分的影响向量最后得到考虑上下文属性信息后用户u对项目i的评分偏差修正项其公式为
然后,同时考虑用户、项目和上下文属性信息而引入的用户u对项目i的评分偏差修正项,融入矩阵分解模型,得到用户u对项目i的预测评分模型:
其中,μ+bu+bi+pu·qi T是矩阵分解模型的评分预测公式,μ为全局平均分,bu为用户u的评分偏差项,bi为项目i的得分偏差项,pu是用户u的隐特征向量,qi是项目i的隐特征向量,bu、bi、pu、qi、bUA、bIA、bCA、均为模型参数;
最后,使用随机梯度下降法最小化损失函数:
进行迭代计算,得到模型参数的最佳值。
本发明与现有技术相比的优点在于:
(1)、在推荐系统的研究领域中,传统的基于矩阵分解的协同过滤方法只利用了用户-项目二维评分矩阵数据,而没有利用其他信息来充分挖掘用户兴趣。本专利在矩阵分解模型中融入了用户、项目和上下文的属性信息,提高了矩阵分解模型的推荐精度。
(2)、从实验结果中可以看出,引入用户、项目和上下文属性信息确实能够提高模型的评分预测精度,并且同时引入多类属性信息比引入单类属性信息对预测精度的提升作用更大。
附图说明
图1是融合用户、项目和上下文属性信息的推荐模型框架图。
图2是随着f值上升各个模型的RMSE值。
具体实施方式
下面结合附图和具体实施例进一步说明本发明。
一种融合用户、项目和上下文属性信息的推荐系统优化方法,在矩阵分解模型中同时融入用户、项目和上下文属性信息来修正预测评分的偏差,提高个性化推荐系统的推荐精度。
所述的矩阵分解模型,考虑用户和项目之间潜在的关系,并引入全局平均分μ、用户u的评分偏差项bu和项目i的得分偏差项bi,得到用户u对项目i的预测评分:
其中,pu是用户u的隐特征向量,qi是项目i的隐特征向量,两个特征向量的维度均为f。
所述的融入用户、项目和上下文属性信息的矩阵分解模型,考虑了用户的属性信息对总体评分和项目得分的影响,在矩阵分解模型中融入用户属性信息。
所述的融入用户、项目和上下文属性信息的矩阵分解模型,考虑了项目的属性信息对总体评分和用户评分的影响,在矩阵分解模型中融入项目属性信息。
所述的融入用户、项目和上下文属性信息的矩阵分解模型,考虑了上下文的属性信息对总体评分、用户评分和项目得分的影响,在矩阵分解模型中融入上下文属性信息。
分为两个阶段,第一个阶段是预处理阶段,主要是对数据集的处理。包括如下步骤:
步骤A1)、对于每个用户u,通过属性向量转换规则,将用户属性信息转换为用户属性向量vu;
对于每个用户u,通过属性向量转换规则,将用户属性信息转换为用户属性向量vu,并引入用户属性信息对总体评分的影响向量bUA和对项目i得分的影响向量最后得到考虑用户属性信息后用户u对项目i的评分偏差修正项其公式为:
其中,sum()表示计算向量各个元素之和的函数。
步骤A2)、对于每个项目i,通过属性向量转换规则,将项目属性信息转换为项目属性向量vi;
对于每个项目i,通过属性向量转换规则,将项目属性信息转换为项目属性向量vi,并引入项目属性信息对总体评分的影响向量bIA和对用户u评分的影响向量最后得到考虑项目属性信息后用户u对项目i的评分偏差修正项其公式为:
步骤A3)、对于每条评分关联的上下文c,通过属性向量转换规则,将上下文属性信息转换为上下文属性向量vc。
对于每条评分关联的上下文c,通过属性向量转换规则,将上下文属性信息转换为上下文属性向量vc,并引入上下文属性信息对总体评分的影响向量bCA、对用户u评分的影响向量和对项目i得分的影响向量最后得到考虑上下文属性信息后用户u对项目i的评分偏差修正项其公式为:
上述的属性向量转换规则,对于一条由若干个属性组成的属性信息(a1,a2...,an),每个属性ai分为三种情况处理:1)、如果ai属于可数有限集合A,则ai转换后的向量维度为|A|,其中与ai对应的维度元素值为1,其他元素值为0;2)、如果ai是可数有限集合A的某个子集,则ai转换后的向量维度为|A|,其中与ai所包含的元素对应的所有维度元素值为1,其他元素值为0;3)、如果ai是一个实数,且ai∈[c,d],平均值为则ai转换后的向量维度为1,其值为最终的属性向量由转换后的向量依次连接得到。
第二个阶段是学习阶段,主要是构造模型参数并求出最佳的模型参数值用于预测评分。包括如下步骤:
步骤B1)、构造模型参数并初始化;
同时考虑用户、项目和上下文属性信息而引入的用户u对项目i的评分偏差修正项,融入矩阵分解模型,得到用户u对项目i的预测评分模型:
其中,bu、bi、pu、qi、bUA、bIA、bCA、为模型参数;
然后给各个模型参数赋初值,其中bu、bi赋值为0,bUA、bIA、bCA、 赋值为零向量,pu、qi赋值为元素值属于区间[0,0.01]的随机向量;
步骤B2)、使用随机梯度下降法最小化损失函数,得到模型参数的最佳值。
损失函数的公式为:
其中,K为训练数据集的用户-项目评分对的集合,ru,i为实际评分,公式右边除第一项之外的项均为正则项,用于防止过拟合;
使用随机梯度下降法需要进行若干次迭代计算;每次迭代时,遍历一次训练数据集;每获得一个评分条目,计算每个模型参数θ相对损失函数J的梯度然后更新模型参数,更新公式为其中α为学习速率,是事先设置的常数。当达到要求的预测精度时,迭代停止,从而得到模型参数的最佳值。
在推荐系统的研究领域中,传统的基于矩阵分解的协同过滤方法只利用了用户-项目二维评分矩阵数据,而没有利用其他信息来充分挖掘用户兴趣。本发明在矩阵分解模型中融入了用户、项目和上下文属性信息,提高了矩阵分解模型的推荐精度。
实验验证在MovieLens1M数据集上进行。该数据集有三个文件,其中,评分文件包含了6040个用户对将近3900部电影的1000209条评分和时间戳,用户信息文件包含了6040个用户的性别、年龄、职业、邮政编码属性,电影信息文件包含了将近3900部电影的标题(包含上映年份)、类别属性。选取用户的性别、年龄、职业属性和电影的上映年份、类别属性,并将时间戳分解为年份、月份、上午/下午、星期属性,按照属性向量转换规则分别构造了用户、项目和上下文的属性向量。使用均方根误差RMSE(Root Mean Square Error)作为推荐系统预测精度的评价指标,RMSE代表了推荐模型在数据集上的平均预测误差,RMSE越低,则表示推荐模型的预测精度越高。为了研究用户、项目、上下文属性对预测评分的不同作用,分别实现了SVD模型、引入用户属性的SVD模型(UA_SVD)、引入项目属性的SVD模型(IA_SVD)、引入用户和项目属性的SVD模型(UIA_SVD)。通过交叉验证,选取正则化参数λ1=0.02,λ2=0.01,λ3=2,λ4=0.0095,λ5=0.07,学习速率α=0.005。
随机选取数据集的80%作为训练数据集,剩下的20%作为测试数据集,计算各个模型在测试数据集上的RMSE值。图2记录了随特征维数f取值上升时各个模型的RMSE值的变化情况,表1列出了各个模型在f=60时的RMSE值,并比较了新模型相对SVD模型RMSE的降低值。表2将SVD模型和UICA_SVD模型随f值上升的RMSE进行对比。
表1 f=60时,各个模型的RMSE对比
表2f值上升时,UICA_SVD和SVD模型的RMSE对比
从实验结果中可以看出,引入用户、项目和上下文属性信息确实能够提高模型的评分预测精度,并且同时引入多类属性信息比引入单类属性信息对预测精度的提升作用更大。
Claims (1)
1.一种融合用户、项目和上下文属性信息的推荐系统优化方法,其特征在于:在矩阵分解模型中同时融入用户、项目和上下文属性信息来修正预测评分的偏差,提高个性化推荐系统的推荐精度;具体实现过程如下:
首先,对于每个用户u,通过属性向量转换规则,将用户属性信息转换为用户属性向量vu,并引入用户属性信息对总体评分的影响向量bUA和对项目i得分的影响向量最后得到考虑用户属性信息后用户u对项目i的评分偏差修正项其公式为其中,sum()表示计算向量各个元素之和的函数;对于每个项目i,通过属性向量转换规则,将项目属性信息转换为项目属性向量vi,并引入项目属性信息对总体评分的影响向量bIA和对用户u评分的影响向量最后得到考虑项目属性信息后用户u对项目i的评分偏差修正项其公式为对于每条评分关联的上下文c,通过属性向量转换规则,将上下文属性信息转换为上下文属性向量vc,并引入上下文属性信息对总体评分的影响向量bCA、对用户u评分的影响向量和对项目i得分的影响向量最后得到考虑上下文属性信息后用户u对项目i的评分偏差修正项其公式为
然后,同时考虑用户、项目和上下文属性信息而引入的用户u对项目i的评分偏差修正项,融入矩阵分解模型,得到用户u对项目i的预测评分模型:
其中,μ+bu+bi+pu·qi T是矩阵分解模型的评分预测公式,μ为全局平均分,bu为用户u的评分偏差项,bi为项目i的得分偏差项,pu是用户u的隐特征向量,qi是项目i的隐特征向量,bu、bi、pu、qi、bUA、bi UA、bIA、bCA、均为模型参数;
最后,使用随机梯度下降法最小化损失函数:
进行迭代计算,得到模型参数的最佳值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210442382.4A CN102982107B (zh) | 2012-11-08 | 2012-11-08 | 一种融合用户、项目和上下文属性信息的推荐系统优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210442382.4A CN102982107B (zh) | 2012-11-08 | 2012-11-08 | 一种融合用户、项目和上下文属性信息的推荐系统优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102982107A CN102982107A (zh) | 2013-03-20 |
CN102982107B true CN102982107B (zh) | 2015-09-16 |
Family
ID=47856125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210442382.4A Active CN102982107B (zh) | 2012-11-08 | 2012-11-08 | 一种融合用户、项目和上下文属性信息的推荐系统优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102982107B (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103260061B (zh) * | 2013-05-24 | 2015-11-18 | 华东师范大学 | 一种上下文感知的iptv节目推荐方法 |
KR20160041028A (ko) * | 2013-08-09 | 2016-04-15 | 톰슨 라이센싱 | 프라이버시 보호 행렬 분해를 위한 방법 및 시스템 |
CN103559197A (zh) * | 2013-09-23 | 2014-02-05 | 浙江大学 | 基于上下文预过滤的实时音乐推荐方法 |
CN103632290B (zh) * | 2013-12-02 | 2016-06-29 | 合肥工业大学 | 一种基于推荐概率融合的混合推荐方法 |
US20150348106A1 (en) * | 2014-05-29 | 2015-12-03 | Google Inc. | Dynamic content item creation |
EP3152679A4 (en) * | 2014-06-06 | 2018-04-04 | Nokia Technologies Oy | Method and apparatus for recommendation by applying efficient adaptive matrix factorization |
CN104391849B (zh) * | 2014-06-30 | 2017-12-15 | 浙江大学苏州工业技术研究院 | 融入时间上下文信息的协同过滤推荐方法 |
CN104199818B (zh) * | 2014-07-01 | 2018-02-23 | 华中科技大学 | 一种基于分类的社会化推荐方法 |
CN104469430A (zh) * | 2014-12-24 | 2015-03-25 | 武汉泰迪智慧科技有限公司 | 基于上下文和群组组合的视频推荐方法及系统 |
CN104809107A (zh) * | 2015-05-18 | 2015-07-29 | 中国科学院自动化研究所 | 基于上下文转换向量模型的推荐方法和系统 |
CN106126591B (zh) * | 2016-06-16 | 2019-09-20 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 音乐数据推荐方法与系统 |
CN107562758B (zh) * | 2016-06-30 | 2020-12-01 | 北京金山安全软件有限公司 | 一种推送信息的方法、装置及电子设备 |
CN106649657B (zh) * | 2016-12-13 | 2020-11-17 | 重庆邮电大学 | 面向社交网络基于张量分解的上下文感知推荐系统及方法 |
CN106779867B (zh) * | 2016-12-30 | 2020-10-23 | 中国民航信息网络股份有限公司 | 基于上下文感知的支持向量回归推荐方法及系统 |
CN106909536B (zh) * | 2017-02-05 | 2020-04-07 | 中山大学 | 一种基于异构信息的评分推荐方法 |
CN108416628B (zh) * | 2018-03-15 | 2020-07-07 | 重庆大学 | 一种融合食物多属性关系的餐厅菜品智能推荐系统 |
CN108510373A (zh) * | 2018-04-12 | 2018-09-07 | 京东方科技集团股份有限公司 | 画作推荐方法、画作推荐装置、设备及存储介质 |
CN108549729B (zh) * | 2018-05-21 | 2021-06-11 | 辽宁师范大学 | 基于覆盖约简的个性化用户协同过滤推荐方法 |
CN109242592A (zh) * | 2018-07-19 | 2019-01-18 | 广州优视网络科技有限公司 | 一种应用的推荐方法和装置 |
CN109190030B (zh) * | 2018-08-22 | 2022-04-05 | 南京工业大学 | 融合node2vec和深度神经网络的隐式反馈推荐方法 |
CN109299370B (zh) * | 2018-10-09 | 2022-03-01 | 中国科学技术大学 | 多对级个性化推荐方法 |
CN109408729B (zh) * | 2018-12-05 | 2022-02-08 | 广州市百果园信息技术有限公司 | 推荐物料确定方法、装置、存储介质和计算机设备 |
CN109726331B (zh) | 2018-12-29 | 2021-05-18 | 北京世纪好未来教育科技有限公司 | 对象偏好预测的方法、装置和计算机可读介质 |
CN110209933A (zh) * | 2019-05-20 | 2019-09-06 | 山东科技大学 | 一种基于回归树上下文特征自动编码的偏置张量分解方法 |
CN111858972B (zh) * | 2020-07-28 | 2023-01-31 | 山东大学 | 一种基于家庭知识图谱的电影推荐方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129463A (zh) * | 2011-03-11 | 2011-07-20 | 北京航空航天大学 | 一种融合项目相关性的基于pmf的协同过滤推荐系统 |
CN102376063A (zh) * | 2011-11-29 | 2012-03-14 | 北京航空航天大学 | 一种基于社会化标签的个性化推荐系统优化方法 |
-
2012
- 2012-11-08 CN CN201210442382.4A patent/CN102982107B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102129463A (zh) * | 2011-03-11 | 2011-07-20 | 北京航空航天大学 | 一种融合项目相关性的基于pmf的协同过滤推荐系统 |
CN102376063A (zh) * | 2011-11-29 | 2012-03-14 | 北京航空航天大学 | 一种基于社会化标签的个性化推荐系统优化方法 |
Non-Patent Citations (5)
Title |
---|
《上下文感知推荐系统》;王立才等;《软件学报》;20120131;第23卷(第1期);正文第1-20页 * |
《基于本体用户兴趣模型的个性化推荐算法》;严隽薇等;《计算机集成制造系统》;20101231;第16卷(第12期);正文第2757-2562页 * |
《基于概念聚类的用户兴趣建模方法》;刘永利等;《北京航空航天大学学报》;20100228;第36卷(第2期);正文第188-192页 * |
《通过相似度支持度优化基于K近邻的协同过滤算法》;罗辛等;《计算机学报》;20100831;第33卷(第8期);正文第1437-1445页 * |
Xin Luo el at..《Improving neighborhood based Collaborative Filtering via integrated folksonomy information》.《Elsevier:Pattern Recognition Letters》.2011,正文第263-270页. * |
Also Published As
Publication number | Publication date |
---|---|
CN102982107A (zh) | 2013-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102982107B (zh) | 一种融合用户、项目和上下文属性信息的推荐系统优化方法 | |
JP7065122B2 (ja) | 推奨情報の取得方法及び装置、電子機器 | |
CN106649657A (zh) | 面向社交网络基于张量分解的上下文感知推荐系统及方法 | |
CN105045907B (zh) | 一种用于个性化社会图像推荐的视觉注意‑标签‑用户兴趣树的构建方法 | |
CN103632290B (zh) | 一种基于推荐概率融合的混合推荐方法 | |
CN103514255B (zh) | 一种基于项目层次类别的协同过滤推荐方法 | |
CN102508907B (zh) | 一种基于训练集优化的推荐系统的动态推荐方法 | |
US20150302433A1 (en) | Automatic Generation of Custom Intervals | |
CN104063481A (zh) | 一种基于用户实时兴趣向量的电影个性化推荐方法 | |
CN104463637A (zh) | 一种基于电商平台的商品推荐方法、装置及服务器 | |
CN105302873A (zh) | 一种基于条件受限波尔兹曼机的协同过滤优化方法 | |
CN104391849A (zh) | 融入时间上下文信息的协同过滤推荐方法 | |
CN104134159A (zh) | 一种基于随机模型预测信息最大化传播范围的方法 | |
CN103092911A (zh) | 一种融合社会标签相似度基于k近邻的协同过滤推荐系统 | |
Zheng et al. | Deviation-based contextual SLIM recommenders | |
CN102841929A (zh) | 一种综合用户和项目评分及特征因素的推荐方法 | |
CN102541920A (zh) | 联合基于用户和项目的协同过滤提高准确度的方法及装置 | |
CN104298787A (zh) | 一种基于融合策略的个性化推荐方法及装置 | |
CN102591915A (zh) | 一种基于标签迁移学习的推荐方法 | |
CN107193882A (zh) | RDF数据上基于图匹配的why‑not查询回答方法 | |
CN106127506A (zh) | 一种基于主动学习解决商品冷启动问题的推荐方法 | |
CN106202377A (zh) | 一种基于随机梯度下降的在线协同排序方法 | |
CN106919699A (zh) | 一种面向大规模用户的个性化信息推荐方法 | |
CN104008204A (zh) | 一种动态的多维情境感知电影推荐系统及其实现方法 | |
CN106204153A (zh) | 一种基于属性比重相似性的两步预测Top‑N推荐算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200108 Address after: 519080 5th floor, building 8, science and Technology Innovation Park, No.1 Gangwan, Jintang Road, Tangjiawan, Xiangzhou District, Zhuhai City, Guangdong Province Patentee after: Zhuhai haotengzhisheng Technology Co., Ltd Address before: 100191 Haidian District, Xueyuan Road, No. 37, Patentee before: Beijing University of Aeronautics and Astronautics |
|
TR01 | Transfer of patent right |