CN110825971B - 融合关系挖掘与协同过滤的物品冷启动推荐算法 - Google Patents
融合关系挖掘与协同过滤的物品冷启动推荐算法 Download PDFInfo
- Publication number
- CN110825971B CN110825971B CN201911094068.XA CN201911094068A CN110825971B CN 110825971 B CN110825971 B CN 110825971B CN 201911094068 A CN201911094068 A CN 201911094068A CN 110825971 B CN110825971 B CN 110825971B
- Authority
- CN
- China
- Prior art keywords
- article
- attribute
- item
- relationship
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开一种融合关系挖掘与协同过滤的物品冷启动推荐算法,首先依据物品属性矩阵,采用关系挖掘方法计算每两个属性之间多种二元关系,将有限的物品属性扩展成更多的关系属性,进而得出属性关系矩阵并计算物品间属性相似度,同时融合物品评分信息进行相似度加权计算,实现新物品的个性化推荐,可以系统地解决推荐系统中新物品冷启动问题,提高推荐准确度及物品多样性。
Description
技术领域
本发明涉及推荐技术领域,尤其是一种可提高推荐准确度及物品多样性的融合关系挖掘与协同过滤的物品冷启动推荐算法。
背景技术
推荐系统(Recommender Systems,RS)主要用来预测目标用户对其他未评分物品的评分,根据目标用户的历史偏好数据来分析出用户的喜好,从而为用户推荐其喜欢的物品。现有推荐方法可分为协同过滤(Collaborative Filtering,CF)、基于内容过滤(Content Based,CB)和混合方式。
CF推荐主要是利用用户的评分数据构建评分矩阵,计算用户之间或物品之间的相似度,对用户未评分物品进行预测,根据预测评分对目标用户进行推荐。CF依赖于用户和物品之间的关系,即用户对物品的评分,而不需要分析物品的内容以及物品本身属性。然而,CF需要来自用户或者物品的大量评分以获得有效推荐,由于系统中可用的评分很少(甚至没有),即存在冷启动(Cold Start,CS)问题,严重影响了推荐质量。另外,CS问题可以根据评分记录的数量是否为零而分为完全冷启动(Complete Cold Start,CCS)问题和非完全冷启动(Incomplete Cold Start,ICS)问题。如表1所示,*表示不存在评分,I1,I2,I3是非冷启动物品,I4,I5是ICS物品,I6是CCS物品。
表1
CB是利用物品的内容来创建特征和属性与用户历史喜好的物品进行比较,推荐最匹配的物品。该算法不依赖于用户对物品的评分信息,而注重于物品的内容信息,虽然能有效解决CS,但是仅仅根据用户历史喜欢的物品推荐相似的物品,推荐的结果并不理想。
目前已有很多研究人员采用混合过滤方法来解决CS问题,但是因物品属性少、特征难以提取,导致推荐的质量并不高。另外,研究人员还通过引入额外信息来解决CS问题,例如社交信息、物品内容描述与评论信息等,虽推荐结果在一定程度上有所改善,然而信息获取困难,忽略了人际关系的复杂性与网络环境的实时性,无法实时地为社交推荐提供可靠的资源,也不能同时解决CCS和ICS问题。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种可提高推荐准确度及物品多样性的融合关系挖掘与协同过滤的物品冷启动推荐算法。
本发明的技术解决方案是:一种融合关系挖掘与协同过滤的物品冷启动推荐算法,其特征是按照如下步骤进行:
步骤1.根据物品属性对应表,计算每两个属性之间的二元关系,并得出物品属性关系矩阵:
物品属性对应表T={I,C,V},其中I={Ii}表示物品集,i={1,2,3,…,g},g为物品的总数目,Ij∈I但j≠i,C={Cn}表示属性集,n={1,2,3,…,e},e为属性的总数目,Cf∈Cn但f≠n,V={1,0},当V=1时表示该物品具有此属性,当V=0时表示该物品不具有此属性;
属性关系函数定义如下:
根据每两个属性之间的二元关系,得出物品属性关系矩阵;
步骤2.根据物品属性关系矩阵,计算物品属性关系相似度simc(Ii,Ij);
其中,c为关系属性,c={ch},1≤h≤m,m为关系属性的总数量,公式如下:
步骤3.根据物品用户评分表,计算出物品评分相似度simR(Ii,Ij):
步骤4.根据物品属性关系相似度simc(Ii,Ij)与物品评分相似度simR(Ii,Ij),加权计算出相似度sims′(Ii,Ij):
步骤5.根据物品相似度sims′(Ii,Ij)的值从大到小排序,并将与相似度对应的物品放到相似物品集M中,分别计算相似物品集M元素个数为K时的集合Mk;
步骤7.计算目标用户u对所有未评分物品的评分,将这些评分按照从大到小排列,即P={P1,P2,P3,...,Ps},给目标用户u推荐个性化物品时,取前t个与评分相对应的物品。
本发明与已有技术相比,有益效果如下:
1.在物品属性的基础上,具体分析各个属性之间的二元关系,并通过比较这些属性的值来挖掘属性之间的相互关系,使得到的物品最近邻可靠性更高,有效克服了冷启动中CCS问题;
2.在进行属性关系挖掘相似度和基于物品的CF相似度进行融合时,引入调节参数对二者进行线性融合,并通过确定的调节参数,显著提高推荐准确率效果,并克服了现有技术中存在的ICS问题。
3.采用了混合方法但不提取用户偏好,使推荐的结果不拘泥于用户的历史喜好,从而增加新物品被推荐的机会,提高了物品推荐多样性。
附图说明
图1是本发明实施例与现有技术的MAE值对比图。
图2是本发明实施例与现有技术的RMSE值对比图。
图3是本发明实施例与现有技术的多样性MP值对比图。
具体实施方式
本发明的一种融合关系挖掘与协同过滤的物品冷启动推荐算法,按照如下步骤进行:
步骤1.根据物品属性对应表,计算每两个属性之间的二元关系,并得出物品属性关系矩阵:
物品属性对应表T={I,C,V},如表2所示:
表2
C1 | C2 | C3 | |
物品1 | 1 | 0 | 0 |
物品2 | 1 | 1 | 1 |
物品3 | 1 | 0 | 1 |
物品4 | 0 | 0 | 1 |
物品5 | 0 | 1 | 0 |
目标物品1 | 0 | 1 | 1 |
目标物品2 | 1 | 1 | 0 |
其中I={Ii}表示物品集,i={1,2,3,…,7},7为物品的总数目,Ij∈I但j≠i,C={Cn}表示属性集,n={1,2,3},3为属性的总数目,Cf∈Cn但f≠n,V={1,0},当V=1时表示该物品具有此属性,当V=0时表示该物品不具有此属性。
属性关系函数定义如下:
本发明实施例考虑了属性间三种相互关系包括:“>”关系、“=”关系和“<”关系。根据表2的物品属性C1,C2,C3,计算出物品属性关系个数共有 种,即:C1>C2,C1>C3,C2>C3,C1=C2,C1=C3,C2=C3,C1<C2,C1<C3,C2<C3,物品属性关系矩阵如表3所示。
表3
步骤2.根据物品属性关系矩阵,计算物品属性关系相似度simc(Ii,Ij)。
其中,c为关系属性,c={ch},1≤h≤m,m为关系属性的总数量,公式如下:
例如,求物品1和物品3的属性关系相似度:
计算出的物品属性关系相似度如表4所示。
表4
步骤3.根据物品用户评分表,利用传统协同过滤余弦相似度公式计算出物品评分相似度simR(Ii,Ij):
物品用户评分表如表5所示:
表5
用户1 | 用户2 | 用户3 | 用户4 | |
物品1 | 4 | 1 | 1 | 2 |
物品2 | 5 | 4 | 5 | 4 |
物品3 | 4 | 5 | 1 | 3 |
物品4 | 1 | 3 | 1 | 1 |
物品5 | 2 | 4 | 2 | 5 |
目标物品1 | 4 | 3 | 4 | * |
目标物品2 | 3 | 1 | 5 | * |
计算出的物品评分相似度如表6所示:
表6
步骤4.根据物品属性关系相似度simc(Ii,Ij)与物品评分相似度simR(Ii,Ij),加权计算出相似度sims′(Ii,Ij):
sims′(1,2)=0.4*0+0.6*0.871=0.5226
sims′(1,3)=0.4*0.25+0.6*0.836=0.6016
sims′(1,4)=0.4*0+0.6*0.615=0.369
sims′(1,5)=0.4*0+0.6*0.731=0.4386
sims′(1,6)=0.4*0+0.6*0.847=0.5082
sims′(1,7)=0.4*0.25+0.6*0.717=0.5302
sims′(2,3)=0.4*0.2+0.6*0.882=0.6092
sims′(2,4)=0.4*0+0.6*0.83=0.498
sims′(2,5)=0.4*0+0.6*0.947=0.5682
sims′(2,6)=0.4*0.2+0.6*1=0.68
sims′(2,7)=0.4*0.2+0.6*0.916=0.6296
sims′(3,4)=0.4*0.25+0.6*0.931=0.6586
sims′(3,5)=0.4*0+0.6*0.9=0.54
sims′(3,6)=0.4*0+0.6*0.844=0.5064
sims′(3,7)=0.4*0+0.6*0.574=0.3444
sims′(4,5)=0.4*0+0.6*0.867=0.5202
sims′(4,6)=0.4*0.25+0.6*0.8=0.58
sims′(4,7)=0.4*0+0.6*0.56=0.336
sims′(5,6)=0.4*0.25+0.6*0.893=0.6358
sims′(5,7)=0.4*0.25+0.6*0.69=0.514
步骤5.根据物品相似度sims′(Ii,Ij)的值从大到小排序,并将与相似度对应的物品放到相似物品集M中,分别计算相似物品集M元素个数为K时的集合Mk。
根据计算结果,找出与目标物品最相似的前三个物品,记为相似物品集Mk,Mk目标物品1={物品2,物品4,物品5},Mk目标物品2={物品1,物品2,物品5}。
步骤7.计算目标用户u对所有未评分物品的评分,将这些评分按照从大到小排列,即P={P1,P2,P3,...,Ps},给目标用户u推荐个性化物品时,取前t个与评分相对应的物品;
Pu,目标物品1>Pu,目标物品2,如果只推荐一部电影的话,选取预测评分最高的一个物品作为推荐结果,则将目标物品2推荐给目标用户。
实验:
1)准备标准数据集
本发明使用MovieLens 100K数据集,包含了100000条信息,943名用户,1682部电影,每个评分的取值范围为1-5,每名用户至少对20部电影评过分,还包含了电影的18个基本属性。
2)评价指标
多样性的度量采用的是平均多样性MP的标准来量化。将每一个目标用户的预测评分按照降序进行排序,并提取排在前t个电影,记为集合Ω(t),对于两个目标用户u和v,计算其前t个电影集Ωu(t)和Ωv(t)共同拥有的电影数量,并且进一步归一量化,得到两个电影集的重叠程度,最后,将MP定义为1减去每两个用户之间的平均重叠程度,如下:
推荐的质量采用准确率Precision来测量,表示相关推荐项目占推荐项目总数的比例,公式为:
Zu表示向用户推荐的t个物品的推荐集。
3)在标准数据集上进行实验
IBCF(Item Based Collaborative Filtering):基于物品的协同过滤算法。
ABCF(Attribute Based Collaborative Filtering):基于属性的协同过滤算法。
IMCF(Interrelationship Mining based Collaborative Filtering):基于属性关系挖掘的协同过滤算法。
ARCF(Combining Attribute and Rating Collaborative Filtering):融合属性与评分的协同过滤算法。
IRCF(Combining Interrelationship Mining and Rating CollaborativeFiltering):融合属性关系挖掘与协同过滤的推荐算法。
表7
从表7中可以看出随着的值的增加,Precision的值是先增大再减小,当的值为0.4时Precision的效果最好。因此,比较值为0.4时几种方法在相似物品集为20到60,推荐物品数为2到12时的Precision情况,如表8所示。
表8
预测质量如图1和图2所示,实验比较了相似物品集从20到60的三种不同方法的MAE和RMSE,本发明实施例优于现有技术。
物品多样性的比较如图3,实验比较了相似物品个数从20到60的几种不同方法的多样性,本发明实施例优于现有技术。
Claims (1)
1.一种融合关系挖掘与协同过滤的物品冷启动推荐算法,其特征是按照如下步骤进行:
步骤1.根据物品属性对应表,计算每两个属性之间的二元关系,并得出物品属性关系矩阵:
物品属性对应表T={I,C,V},其中I={Ii}表示物品集,i={1,2,3,…,g},g为物品的总数目,Ij∈I但j≠i,C={Cn}表示属性集,n={1,2,3,…,e},e为属性的总数目,Cf∈Cn但f≠n,V={1,0},当V=1时表示该物品具有此属性,当V=0时表示该物品不具有此属性;
属性关系函数定义如下:
根据每两个属性之间的二元关系,得出物品属性关系矩阵;
步骤2.根据物品属性关系矩阵,计算物品属性关系相似度simc(Ii,Ij);
其中,c为关系属性,c={ch},1≤h≤m,m为关系属性的总数量,公式如下:
步骤3.根据物品用户评分表,计算出物品评分相似度simR(Ii,Ij):
步骤4.根据物品属性关系相似度simc(Ii,Ij)与物品评分相似度simR(Ii,Ij),加权计算出相似度sims′(Ii,Ij):
步骤5.根据物品相似度sims′(Ii,Ij)的值从大到小排序,并将与相似度对应的物品放到相似物品集M中,分别计算相似物品集M元素个数为K时的集合Mk;
步骤7.计算目标用户u对所有未评分物品的评分,将这些评分按照从大到小排列,即P={P1,P2,P3,...,Ps},给目标用户u推荐个性化物品时,取前t个与评分相对应的物品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911094068.XA CN110825971B (zh) | 2019-11-11 | 2019-11-11 | 融合关系挖掘与协同过滤的物品冷启动推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911094068.XA CN110825971B (zh) | 2019-11-11 | 2019-11-11 | 融合关系挖掘与协同过滤的物品冷启动推荐算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110825971A CN110825971A (zh) | 2020-02-21 |
CN110825971B true CN110825971B (zh) | 2023-04-14 |
Family
ID=69553817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911094068.XA Active CN110825971B (zh) | 2019-11-11 | 2019-11-11 | 融合关系挖掘与协同过滤的物品冷启动推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110825971B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112785372B (zh) * | 2021-01-11 | 2023-09-12 | 北京欧拉认知智能科技有限公司 | 一种基于语义关系的智能推荐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682114A (zh) * | 2016-12-07 | 2017-05-17 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
CN106878772A (zh) * | 2017-02-27 | 2017-06-20 | Ut斯达康(深圳)技术有限公司 | 一种节目推荐方法及装置 |
CN107463645A (zh) * | 2017-07-21 | 2017-12-12 | 雷锤智能科技南京有限公司 | 基于用户属性评分导向的个性化推荐系统及其推荐方法 |
CN109740064A (zh) * | 2019-01-18 | 2019-05-10 | 北京化工大学 | 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法 |
CN110362755A (zh) * | 2019-07-23 | 2019-10-22 | 南京邮电大学 | 一种基于物品协同过滤与关联规则的混合算法的推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150120722A1 (en) * | 2013-10-31 | 2015-04-30 | Telefonica Digital Espana, S.L.U. | Method and system for providing multimedia content recommendations |
-
2019
- 2019-11-11 CN CN201911094068.XA patent/CN110825971B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682114A (zh) * | 2016-12-07 | 2017-05-17 | 广东工业大学 | 一种融合用户信任关系和评论信息的个性化推荐方法 |
CN106878772A (zh) * | 2017-02-27 | 2017-06-20 | Ut斯达康(深圳)技术有限公司 | 一种节目推荐方法及装置 |
CN107463645A (zh) * | 2017-07-21 | 2017-12-12 | 雷锤智能科技南京有限公司 | 基于用户属性评分导向的个性化推荐系统及其推荐方法 |
CN109740064A (zh) * | 2019-01-18 | 2019-05-10 | 北京化工大学 | 一种融合矩阵分解和挖掘用户项目信息的cf推荐方法 |
CN110362755A (zh) * | 2019-07-23 | 2019-10-22 | 南京邮电大学 | 一种基于物品协同过滤与关联规则的混合算法的推荐方法 |
Non-Patent Citations (2)
Title |
---|
Kenneth K. Fletcher,等.A Method for Dealing with Data Sparsity and Cold-Start Limitations in Service Recommendation Using Personalized Preferences.《2017 IEEE International Conference on Cognitive Computing (ICCC)》.2017,第72-77页. * |
模式识别与人工智能,等.基于热扩散影响力传播的社交网络个性化推荐算法.《模式识别与人工智能》.2019,第第32卷卷(第第32卷期),第746-757页. * |
Also Published As
Publication number | Publication date |
---|---|
CN110825971A (zh) | 2020-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Birtolo et al. | Advances in clustering collaborative filtering by means of fuzzy C-means and trust | |
CN108665323B (zh) | 一种用于理财产品推荐系统的集成方法 | |
CN109558535B (zh) | 基于人脸识别的个性化推送物品的方法及系统 | |
CN107833117B (zh) | 一种考虑标签信息的贝叶斯个性化排序推荐方法 | |
CN106471491A (zh) | 一种时变的协同过滤推荐方法 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
CN107016122B (zh) | 基于时间迁移的知识推荐方法 | |
CN109947987B (zh) | 一种交叉协同过滤推荐方法 | |
US20170206420A1 (en) | System and methods for analysis of user-associated images to generate non-user generated labels and utilization of the generated labels | |
CN106127506B (zh) | 一种基于主动学习解决商品冷启动问题的推荐方法 | |
CN104615741B (zh) | 一种基于云计算的冷启动项目推荐的方法及装置 | |
CN109977299B (zh) | 一种融合项目热度和专家系数的推荐算法 | |
CN109840833A (zh) | 贝叶斯协同过滤推荐方法 | |
KR20160064448A (ko) | 유사 집합의 예상 선호도 대비 기반 아이템 추천 제공 방법 | |
CN104008193B (zh) | 一种基于典型用户群组发现技术的信息推荐方法 | |
KR20170079429A (ko) | 사용자 속성을 고려한 클러스터링 기반의 협업 필터링 방법 및 영화 추천 시스템 | |
CN107248023B (zh) | 一种对标企业名单的筛选方法和装置 | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
CN110825971B (zh) | 融合关系挖掘与协同过滤的物品冷启动推荐算法 | |
Maneeroj et al. | Hybrid recommender system using latent features | |
KR20090046353A (ko) | 개인 맞춤형 다중 추천 학습 방법 | |
CN111143699A (zh) | 基于相似性与置信度聚类的推荐系统 | |
CN113449200B (zh) | 物品推荐方法、装置及计算机存储介质 | |
CN110059257B (zh) | 基于评分修正的项目推荐方法 | |
CN106919647B (zh) | 一种基于聚类的网络结构相似性推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |