CN106991122B - 一种基于粒子群算法的电影推荐方法 - Google Patents

一种基于粒子群算法的电影推荐方法 Download PDF

Info

Publication number
CN106991122B
CN106991122B CN201710106151.9A CN201710106151A CN106991122B CN 106991122 B CN106991122 B CN 106991122B CN 201710106151 A CN201710106151 A CN 201710106151A CN 106991122 B CN106991122 B CN 106991122B
Authority
CN
China
Prior art keywords
movie
user
movies
recommendation
particle swarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710106151.9A
Other languages
English (en)
Other versions
CN106991122A (zh
Inventor
钟俊
李德新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201710106151.9A priority Critical patent/CN106991122B/zh
Publication of CN106991122A publication Critical patent/CN106991122A/zh
Application granted granted Critical
Publication of CN106991122B publication Critical patent/CN106991122B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于粒子群算法的电影推荐方法,该方法从用户对影片的评分信息和影片自身所包含信息的角度出发,结合基于用户和基于项目的邻域推荐算法的知识,与隐语义模型相结合,应用于电影网站的个性化推荐中,解决了现有技术中推荐精度的瓶颈问题,同时通过粒子群寻优过程,寻找全局最优的权重,提升了电影推荐水平。

Description

一种基于粒子群算法的电影推荐方法
技术领域
本发明涉及电影的推荐方法,具体涉及一种基于粒子群算法的电影推荐方法。
背景技术
各种推荐技术都被作为推荐系统的基础方法而提出,协同过滤、基于内容的推荐、基于知识的推荐、基于人口统计的推荐等等。对于推荐系统而言,每种推荐算法都有各自适宜的应用场景,尚且没有哪一种算法能够完美解决各种推荐问题。实际应用中通常采用多种推荐算法融合的方式来提高推荐精度,融合的推荐系统结合了多种推荐技术的优点,并且能够使得这些推荐技术共同协作,从而取得比较理想、稳定的推荐效果。
然而,目前对于电影的推荐方法存在着精度较差的问题,即使进行方法模型的调整,也还存在着精度瓶颈。
发明内容
针对现有技术的缺点,本发明的目的在于提供一种基于粒子群算法的电影推荐方法,该方法包括如下步骤:
(1)获取电影网站中用户对电影的评分信息和电影本身的信息;
(2)按照如下公式进行计算评分
Figure BDA0001233093310000011
Figure BDA0001233093310000012
α123=1
其中,
Figure BDA0001233093310000021
S(u,K)是和用户u最相似的K个用户集合,N(i)是对电影i评过分的用户集合,rvi是用户v对电影i的评分,wuv是电影之间的相似度,
Figure BDA0001233093310000022
是用户v对他评过分所有电影评分的平均值;
Figure BDA0001233093310000023
S(u,K)是和i最相似的电影集合,N(u)是用户u评过分的电影集合,wij是电影之间的相似度,
Figure BDA0001233093310000024
是电影的平均分;
Figure BDA0001233093310000025
其中u为集合中所有参评电影的评分均值,bu为由于用户u个人评分尺度带来的偏差值,bi为由于电影i本身属性引起的偏差;bu和bi均初始化为0。pu表示用户u对各因子的爱好程度,qi表示电影i的因子权重分布情况,其中pu和qi一般初始化为介于
Figure BDA0001233093310000026
Figure BDA0001233093310000027
之间的随机数,其中F为隐类个数。
(3)利用粒子群算法的全局寻优特性,自动调节步骤(2)中α1,α2,α3的值,以均方根误差RMSE为目标函数,寻找出最优的权重α1,α2,α3组合,获得最优的
Figure BDA0001233093310000031
并进行储存;
(4)将步骤(3)所得结果输出,并推荐给用户。
本发明的有益效果:
本发明从用户对影片的评分信息和影片自身所包含信息的角度出发,结合基于用户和基于项目的邻域推荐算法的知识,与隐语义模型相结合,应用于电影网站的个性化推荐中,解决了现有技术中推荐精度的瓶颈问题,通过粒子群寻优过程,寻找全局最优的权重,提升了电影推荐水平。
附图说明
图1为本发明评分预测RMSE对比图;
图2为本发明评分预测MAE对比图。
具体实施方式
下面通过实施例对本发明进行具体描述,有必要在此指出的是以下实施例只是用于对本发明进行进一步的说明,不能理解为对本发明保护范围的限制,该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整,仍属于本发明的保护范围。
实施例1
1.获取项目特征
以Movielens100K数据集为实验数据集,获取用户、项目、评分、时间等信息。建立用户-项目评分矩阵。
2.计算出基于用户的协同过滤推荐算法所预测的评分
Figure BDA0001233093310000032
以余弦相似法为相似性度量方法,计算出预测评分,公式为:
Figure BDA0001233093310000041
S(u,K)是和用户u最相似的K个用户集合,N(i)是电影i评过分的用户集合,rvi是用户v对电影i的评分wuv是电影之间的相似度,
Figure BDA0001233093310000042
是用户v对他评过分所有电影评分的平均值。
3.计算出基于项目的协同过滤推荐算法所预测的评分
Figure BDA0001233093310000043
以余弦相似法为相似性度量方法,计算出预测评分,公式为:
Figure BDA0001233093310000044
S(u,K)是和i最相似的电影集合,N(u)是用户u评过分的电影集合,wij是电影之间的相似度,
Figure BDA0001233093310000045
是电影的平均分。
4.计算出基于隐语义模型结合SVD++的协同过滤推荐算法所预测的评分
Figure BDA0001233093310000046
Figure BDA0001233093310000047
其中u为集合中所有参评电影的评分均值,bu为由于用户u个人评分尺度带来的偏差值,bi为由于电影i本身属性引起的偏差;bu和bi均初始化为0。pu表示用户u对各因子的爱好程度,qi表示电影i的因子权重分布情况,其中pu和qi一般初始化为介于
Figure BDA0001233093310000051
Figure BDA0001233093310000052
之间的随机数,其中F为隐类个数。
对于每一个电影j,将它用一个K维的向量yj∈RK来表示,这个K维度是综合了显性和隐形两个电影集的属性,因此更加健全。此时,用户预测评分模型被重新表示为公式该模型又称为SVD++。参数pu是从显性反馈数据集中学习而来,隐性部分
Figure BDA0001233093310000053
对其进行了补充,由于正则化的原因,将的和作了归一化处理,减小方差波动。此时,损失函数变为:
Figure BDA0001233093310000054
采用随机梯度下降法优化该损失函数,并得到参数的递推公式:
bu=bu+α(eui-λbu)
bi=bi+α(eui-λbi)
Figure BDA0001233093310000055
puf=puf+α(euiqif-λpuf)
Figure BDA0001233093310000061
5.模型融合并结合粒子群算法寻优
根据步骤2、3、4计算得出的预测评分进行线性模型融合,得到最终预测评分模型。模型公式如下:
Figure BDA0001233093310000062
α123=1
以粒子群算法为优化算法,先后以RMSE和MAE为目标函数,自适应调节权重组合α1,α2,α3,从而得出全局最优的预测评分值。
6.计算误差
根据步骤5得到的评分预测公式,与真实评分进行对比,衡量指标为均方根误差(RMSE)和平均绝对误差(MAE)。|T|表示待预测评分的个数。其中隐语义模型与最近邻居数K无关,而与隐特征数有关,在仿真对比时,取隐特征数为300。结果如图1和图2所示。
Figure BDA0001233093310000063
Figure BDA0001233093310000064
如图1所示,以RMSE为衡量指标,最近邻居数选取5~40之间的8个点,计算出四种不同方法的RMSE,实验结果表明,基于粒子群算法的模型融合确实明显地提高了推荐的精度,与基于余弦相似度的UserCF相比,RMSE减小了27.15%~37.58%;与基于余弦相似度的ItemCF相比,RMSE减小了27.78%~40.09%;与隐语义模型相比,RMSE减小了23.21%~31.36%。经过粒子群算法的模型融合所得的预测评分RMSE远小于其他三种传统方法,即预测评分精度得到了极大的提升。
如图2所示,以MAE为衡量指标,最近邻居数选取5~40之间的8个点,计算出4种不同方法的MAE,实验结果表明,基于粒子群算法的模型融合确实明显地提高了推荐的精度,与基于余弦相似度的UserCF相比,MAE减小了36.43%~40.22%;与基于余弦相似度的ItemCF相比,MAE减小了37.15%~50.66%;与隐语义模型相比,MAE减小了34.12%~46.06%。经过粒子群算法的模型融合所得的预测评分MAE远小于其他三种传统方法,即预测评分精度得到了极大的提升。

Claims (1)

1.一种基于粒子群算法的电影推荐方法,其特征在于,所述方法包括如下步骤:
(1)获取电影网站中用户对电影的评分信息和电影本身的信息;
(2)按照如下公式进行计算评分
Figure FDA0002783320560000011
Figure FDA0002783320560000012
α123=1
其中,
Figure FDA0002783320560000013
S(u,K)是和用户u最相似的K个用户集合,N(i)是对电影i评过分的用户集合,v是集合S(u,K)和N(i)交集的元素,即与用户u最相似的K个用户中对电影i评过分的用户,
Figure FDA0002783320560000014
是用户u对他评过分所有电影评分的平均值,rvi是用户v对电影i的评分,wuv是用户u和v之间对电影兴趣的相似度,
Figure FDA0002783320560000015
是用户v对他评过分所有电影评分的平均值;
Figure FDA0002783320560000016
S(i,K)是和电影i最相似的K个电影集合,N(u)是用户u评过分的电影集合,wig是电影之间的相似度,rug是用户u对交集g中电影的兴趣评分,
Figure FDA0002783320560000021
是电影的平均分,g是集合S(i,K)和N(u)交集的元素,即与电影i最相似的K个电影中用户u评过分的电影;
Figure FDA0002783320560000022
其中u为集合中所有参评电影的评分均值,bu为由于用户u个人评分尺度带来的偏差值,bi为由于电影i本身属性引起的偏差;bu和bi均初始化为0;pu表示用户u对各因子的爱好程度,qi表示电影i的因子权重分布情况,其中pu和qi一般初始化为介于
Figure FDA0002783320560000023
Figure FDA0002783320560000024
之间的随机数,其中F为隐类个数;
(3)利用粒子群算法的全局寻优特性,自动调节步骤(2)中α1,α2,α3的值,以均方根误差RMSE为目标函数,寻找出最优的权重α1,α2,α3组合,获得最优的
Figure FDA0002783320560000025
并进行储存;
(4)将步骤(3)所得结果输出,并推荐给用户。
CN201710106151.9A 2017-02-27 2017-02-27 一种基于粒子群算法的电影推荐方法 Expired - Fee Related CN106991122B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710106151.9A CN106991122B (zh) 2017-02-27 2017-02-27 一种基于粒子群算法的电影推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710106151.9A CN106991122B (zh) 2017-02-27 2017-02-27 一种基于粒子群算法的电影推荐方法

Publications (2)

Publication Number Publication Date
CN106991122A CN106991122A (zh) 2017-07-28
CN106991122B true CN106991122B (zh) 2021-02-02

Family

ID=59412498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710106151.9A Expired - Fee Related CN106991122B (zh) 2017-02-27 2017-02-27 一种基于粒子群算法的电影推荐方法

Country Status (1)

Country Link
CN (1) CN106991122B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107248222B (zh) * 2017-06-09 2019-08-23 深圳正品创想科技有限公司 一种售货方法、装置
CN109815361B (zh) * 2019-01-29 2023-08-08 南京信息工程大学 一种基于脑波识别的智能音乐推荐系统
CN112784171B (zh) * 2021-01-21 2022-11-04 重庆邮电大学 一种基于上下文典型性的电影推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103605723A (zh) * 2013-11-15 2014-02-26 南京云川信息技术有限公司 一种基于粒子群算法的视频推荐方法
CN103971161A (zh) * 2014-05-09 2014-08-06 哈尔滨工程大学 基于柯西分布量子粒子群的混合推荐方法
GB2518172A (en) * 2013-09-11 2015-03-18 Epistemy Ltd Improvements in or relating to optimisation techniques
CN106169083A (zh) * 2016-07-05 2016-11-30 广州市香港科大霍英东研究院 基于视觉特征的电影推荐方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2518172A (en) * 2013-09-11 2015-03-18 Epistemy Ltd Improvements in or relating to optimisation techniques
CN103605723A (zh) * 2013-11-15 2014-02-26 南京云川信息技术有限公司 一种基于粒子群算法的视频推荐方法
CN103971161A (zh) * 2014-05-09 2014-08-06 哈尔滨工程大学 基于柯西分布量子粒子群的混合推荐方法
CN106169083A (zh) * 2016-07-05 2016-11-30 广州市香港科大霍英东研究院 基于视觉特征的电影推荐方法和系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Collaborating trust and item-prediction with ant colony for recommendation";Abhishek Kaleroun et al.;《2014 Seventh International Conference on Contemporary Computing》;20140915;全文 *
"Enhancing scalability and accuracy of recommendation systems using unsupervised learning and particle swarm optimization";SagarikaBakshi et al.;《Applied Soft Computing》;20140228;全文 *
"基于粒子群优化的项聚类推荐算法";熊忠阳 等;《计算机工程》;20091231;第35卷(第23期);全文 *
"基于粒子群选优相似性的协同过滤算法";裴阳 等;《信息技术》;20160616;全文 *

Also Published As

Publication number Publication date
CN106991122A (zh) 2017-07-28

Similar Documents

Publication Publication Date Title
CN107729444B (zh) 一种基于知识图谱的个性化旅游景点推荐方法
CN109241203B (zh) 一种融合时间因素的用户偏好和距离加权的聚类方法
CN104199896B (zh) 基于特征分类的视频相似度确定及视频推荐方法
CN106682114B (zh) 一种融合用户信任关系和评论信息的个性化推荐方法
CN108460619B (zh) 一种提供融合显隐式反馈的协同推荐模型的方法
CN109190030B (zh) 融合node2vec和深度神经网络的隐式反馈推荐方法
CN103971161B (zh) 基于柯西分布量子粒子群的混合推荐方法
CN106991122B (zh) 一种基于粒子群算法的电影推荐方法
CN108804683B (zh) 结合矩阵分解和协同过滤算法的电影推荐方法
CN108573041B (zh) 基于加权信任关系的概率矩阵分解推荐方法
CN106709076B (zh) 基于协同过滤的社交网络推荐装置及方法
CN107016122B (zh) 基于时间迁移的知识推荐方法
CN105761154B (zh) 一种社会化推荐方法及装置
CN112948625B (zh) 一种基于属性异质信息网络嵌入的电影推荐方法
CN109471982B (zh) 一种基于用户和服务聚类QoS感知的Web服务推荐方法
US9230328B1 (en) Providing image parameters
CN108876536A (zh) 基于最近邻信息的协同过滤推荐方法
CN110083764A (zh) 一种协同过滤算法冷启动问题的解决方法
Feng et al. Improving group recommendations via detecting comprehensive correlative information
CN112149734B (zh) 一种基于堆叠自编码器的跨域推荐方法
KR101708254B1 (ko) 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법.
CN110059257B (zh) 基于评分修正的项目推荐方法
CN112765484A (zh) 短视频推送方法、装置、电子设备及存储介质
CN112883282A (zh) 一种基于麻雀搜索优化聚类的组推荐方法
CN110825978B (zh) 一种基于近邻用户特征共享的多任务协同过滤方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210202

CF01 Termination of patent right due to non-payment of annual fee