CN102376063B - 一种基于社会化标签的个性化推荐系统优化方法 - Google Patents

一种基于社会化标签的个性化推荐系统优化方法 Download PDF

Info

Publication number
CN102376063B
CN102376063B CN 201110386982 CN201110386982A CN102376063B CN 102376063 B CN102376063 B CN 102376063B CN 201110386982 CN201110386982 CN 201110386982 CN 201110386982 A CN201110386982 A CN 201110386982A CN 102376063 B CN102376063 B CN 102376063B
Authority
CN
China
Prior art keywords
user
project
similarity
nearest neighbor
destination item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201110386982
Other languages
English (en)
Other versions
CN102376063A (zh
Inventor
欧阳元新
秦思思
张秦
熊璋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianshi and culture communication limited liability company
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN 201110386982 priority Critical patent/CN102376063B/zh
Publication of CN102376063A publication Critical patent/CN102376063A/zh
Application granted granted Critical
Publication of CN102376063B publication Critical patent/CN102376063B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于社会化标签的个性化推荐系统优化方法,该方法采用社会标签相似度和评分相似度,应用于面向用户和项目的K近邻模型的计算,然后将K近邻的用户和项目同时用于计算用户对项目的预测评分。该方法由于同时采用了标签相似度和评分相似度,使得用户和项目的K近邻计算更加精确,其推荐精度明显高于单采用评分相似度的推荐精度,并且能避免基于标签相似度模型的冷启动问题。然后使用面向用户和项目的推荐模型计算预测评分,能避免数据稀疏性问题,且其推荐精度也明显高于现有的面向用户的推荐模型和面向项目的推荐模型。

Description

一种基于社会化标签的个性化推荐系统优化方法
技术领域
本发明涉及一种适用于电子商务信息的个性化推荐系统,更特别地说,是指一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法。
背景技术
在电子商务迅猛发展过程中,个性化推荐技术功不可没,个性化推荐是根据用户的喜好和兴趣,个性化推荐系统向用户推荐他可能感兴趣的项目,从而促进销售额的提高。在个性化推荐系统中多数使用协同过滤方法提供个性化推荐信息,用户在协同过滤推荐系统中,用户对项目的兴趣被量化为用户对项目的评分。在给定用户集U={u1,u2,…,uc,…um}和项目集I={i1,i2,...,ia,…in}的条件下,用户-项目的评分矩阵表示为R=|U|×|I|。在R=|U|×|I|中用户对项目的评分值区间为[0,5],评分越高则代表用户对项目的喜爱程度越高。
基于邻居关系的协同过滤推荐模型,即K近邻推荐模型,是通过得到与用户最相似的前K个用户或与项目最相似的前K个项目进行建模的,它包括基于评分相似度的面向用户的K近邻模型和面向项目的K近邻模型,其建模过程是:根据已有评分矩阵计算用户间或项目间的评分相似度得到用户的K近邻用户集合或项目的K近邻项目集合;根据K近邻用户对项目的评分和K近邻用户与用户间的相似度,或用户对K近邻项目的评分和K近邻项目于项目间的相似度,计算面向用户或面向项目的预测评分。该K近邻模型具备简单直观,实现难度低,推荐结果易于解释等优点,但其也存在用户-项目评分数据的解释性差,冷启动问题,以及推荐精度不高等缺陷。因此,众多研究者们一直在努力尝试设计出具有更好推荐精度的协同过滤推荐系统。
在个性化推荐系统的研究领域中,K近邻模型是协同过滤推荐系统中使用最方便简单,且较为成熟的一种方法,但是单一的K近邻模型推荐性能有所缺陷,故而针对该K近邻模型进行优化的研究十分活跃,其中有代表性的包括Jun Wan等提出的通过相似度融合将面向项目和面向用户的推荐模型进行组合,Karen H.L.等提出的将社会标签与用户-项目矩阵进行矩阵扩展形成含有社会标签的面向项目和面向用户的模型矩阵,然后计算相似度进而进行推荐,等等。他们提出的方法较为新颖,但仍然存在信息损失的问题,比如冷启动问题和数据稀疏性问题,故而,本专利提出的方法是针对社会化标签相似度和评分相似度构造面向用户和项目的个性化推荐优化方法。社会化标签是用户根据自己的兴趣爱好向项目标注的单词或词组,该类信息可以体现用户的标注兴趣,从而体现用户之间或项目之间的相似性。
发明内容
本发明的目的是提出一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法,该方法同时采用社会化标签相似度和评分相似度,使用面向用户和项目的K近邻模型计算预测评分,使个性化推荐系统的推荐精度得到提高,并弥补数据稀疏性和冷启动问题。本发明采用社会化标签在个性化推荐系统中进行K近邻模型的建模,然后通过K近邻模型建模对未知评分进行预测,获得用户更加感兴趣更高的项目。
本发明是一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法,其特征在于包括有下列步骤:
第一步:在电子商务的项目集I={i1,i2,...,ia,…in}和用户集U={u1,u2,...,uc,...um}中采用矩阵形式表达出用户-项目评分矩阵R=|U|×|I|和用户-项目社会化标签矩阵T=|U|×|I|;
第二步:依据用户-项目评分矩阵R=|U|×|I|、用户-项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标项目in与任意一项目ia之间的项目间相似度ISim(in→ia);
第三步:采用所述第二步的处理方法遍历目标项目in分别与项目集I={i1,i2,...,ia,…in}中项目处理,目标项目in的项目集相似度ISim(in);
第四步:依据用户-项目评分矩阵R=|U|×|I|、用户-项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标用户um与任意一用户uc之间的用户间相似度USim(um→uc);
第五步:采用所述第四步的处理方法遍历目标项目in分别与用户集U={u1,u2,…,uc,...um}中用户处理,目标项目in的用户集相似度UTSim(um);
第六步:获取目标用户-近邻项目评分r(um,i′);
根据项目集相似度ISim(in)来获取与目标项目in相似度最高的前面的项目,得到目标项目in的K近邻项目集合KNN(in);所述K近邻项目集合KNN(in)中的任意一个元素记为i′,则有目标用户um对目标项目in的K近邻项目集合KNN(in)中任意一元素的评分记为r(um,i′);
第七步:获取近邻用户-目标项目评分r(u′,in);
根据用户集相似度USim(um)来获取与目标用户um相似度最高的前面的用户,得到目标用户um的K近邻用户集合KNN(um)。所述K近邻用户集合KNN(um)中的任意一个元素记为u′,则有目标用户um的K近邻用户集合KNN(um)对目标项目in的评分记为r(u′,in);
第八步:从项目集相似度ISim(in)中选取与K近邻项目集合KNN(in)相关的相似度ISim(KNN(in));
从用户集相似度USim(um)中选取与K近邻用户集合KNN(um)相关的相似度USim(KNN(um));
第九步:计算预测评分
对目标用户-近邻项目评分r(um,i′)、近邻用户-目标项目评分r(u′,in)、目标项目-K近邻相似度ISim(KNN(in))和目标用户-K近邻相似度USim(KNN(um))进行加权平均,得到目标用户um对目标项目in的预测评分 r ^ ( u m , i n ) = Σ v ∈ KNN ( u m ) ∩ R ( i n ) USim ( u m , v ) · r ( v , i n ) + Σ j ∈ KNN ( i n ) ∩ R ( u m ) ISim ( i n , j ) · r ( u m , j ) Σ v ∈ KNN ( u m ) ∩ R ( i n ) USim ( u m , v ) + Σ j ∈ KNN ( i n ) ∩ R ( u m ) ISim ( i n , j ) ,v表示目标项目in的求和对象,KNN(um)表示目标用户um的K近邻用户集合,R(in)表示目标项目in的被评分集,USim(um,v)表示目标用户um与求和对象v的用户相似度,r(v,in)表示目标项目in在R=|U|×|I|中的元素,KNN(in)表示目标项目in的K近邻项目集合,R(um)表示目标用户um的被评分集,ISim(in,j)表示目标项目in与求和对象j的项目相似度,r(um,j)表示目标用户um在R=|U|×|I|中的元素。
本发明个性化推荐系统优化的优点在于:
①在个性化推荐系统的研究领域中,K近邻推荐模型是一种简单直观且较为成熟的一种推荐方法,但目前该类方法的推荐精度偏低。而本专利中的K近邻模型,使用了面向用户和项目的K近邻模型,并且加入社会化标签的相似度,从而使得其推荐模型的推荐精度均有提高。
②本发明提出的同时使用标签相似度和评分相似度共同计算用户间或项目间的相似度,可以得到更精确的K近邻用户或K近邻项目,并弥补标签或评分的数据稀疏性问题,有效得提高个性化推荐精度。
③本发明采用面向用户和项目的K近邻模型计算用户对项目的预测评分,可以弥补数据冷启动问题,并且提高个性化推荐精度。
④本发明提出的基于社会化标签的面向用户和项目的个性化推荐方法,相比基于评分相似度的面向用户或面向项目的推荐方法,推荐性能有较大提高,其MAE值明显降低,Coverage和RightRec值明显提高。
附图说明
图1是基于社会化标签的面向用户和项目的个性化推荐模型结构图。
图2是随着s值上升面向用户的K近邻模型的MAE值。
图3是随着K值的上升面向用户的K近邻模型的MAE值。
图4是随着K值的上升各推荐模型的MAE值。
图5是随着K值的上升各推荐模型的Coverage值。
图6是随着K值的上升各推荐模型的RightRec值。
具体实施方式
下面将结合附图对本发明做进一步的详细说明。
本发明是一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法,首先选取出用户-项目社会化标签矩阵T=|U|×|I|和用户-项目评分矩阵R=|U|×|I|作为K近邻推荐模型的基础矩阵;然后通过K近邻推荐模型对所述基础矩阵进行处理,得到项目集相似度ISim(in)、用户集相似度UTSim(um);然后从项目集相似度ISim(in)和用户集相似度UTSim(um)中选取出相似度最高的前面的项,通过K近邻用户集合的处理得到近邻用户-目标项目评分r(u′,in)、目标用户-近邻项目评分r(um,i′);最后采用加权平均法得到目标用户um对目标项目in的预测评分。
在本发明中,项目是指电子商务中展现出的商品,如书籍、电影、服装、食品等商品。项目采用数学集合形式表达为I={i1,i2,...,ia,…in},i1表示第1个项目,i2表示第2个项目,ia表示第a个项目,也称为任意一个项目,in表示第n个项目,为了叙述方便下文称为目标项目。
在本发明中,用户是指电子商务中注册的用户,或者是购买过商品的用户。用户采用数学集合形式表达为U={u1,u2,...,uc,...um},u1表示第1个用户,u2表示第2个用户,uc表示第c个用户,也称为任意一个用户,um表示第m个用户,为了叙述方便下文也称为目标用户。
在个性化推荐系统中以使用协同过滤方法提供个性化推荐信息,用户在协同过滤推荐中,用户对项目的兴趣被量化为用户-项目评分矩阵R=|U|×|I|,用户-项目评分矩阵中的任意一元素记为r(um,in)。实验数据的训练集中,目标用户um对项目集I={i1,i2,...,ia,…in}的评分集记为r(um),目标项目in被用户集U={u1,u2,…,uc,...um}评分过的评分集记为r(in),被目标用户um评分过的项目集记为R(um),对目标项目in评分过的用户集记为R(in)。推荐系统向目标用户um推荐的项目集记为
Figure BDA0000113835280000051
,实验数据的测试集中目标用户um实际评分过的项目集记为R′(um)。
在个性化推荐系统中使用社会化标签提供个性化推荐信息,用户对项目的兴趣被量化为用户-项目社会化标签矩阵T=|U|×|I|,用户-项目社会化标签矩阵中的任意一元素记为t(um,in)。
参见图1所示,本发明是一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法,该优化方法包括有下列步骤:
第一步:在电子商务的项目集I={i1,i2,...,ia,…in}和用户集U={u1,u2,…,uc,...um}中采用矩阵形式表达出用户-项目评分矩阵R=|U|×|I|和用户-项目社会化标签矩阵T=|U|×|I|所述的R=|U|×|I|和T=|U|×|I|为个性化推荐系统中的两个基础矩阵。
第二步:依据用户-项目评分矩阵R=|U|×|I|用户-项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标项目in与任意一项目ia之间的项目间相似度ISim(in→ia);
第201步骤:采用K近邻推荐模型对用户-项目评分矩阵R=|U|×|I|进行处理,获得目标项目in的被评分集R(in)及任意一项目ia的被评分集R(ia);然后使用Pearson相关相似度计算in和ia的项目间评分相似度 IRSim ( i n → i a ) = Σ v ∈ R ( i n ) ∩ R ( i a ) ( r ( v , i n ) - r ( i n ) ‾ ) ( r ( v , i a ) - r ( i a ) ‾ ) Σ v ∈ R ( i n ) ∩ R ( i a ) ( r ( v , i n ) - r ( i n ) ‾ ) 2 Σ v ∈ R ( i n ) ∩ R ( i a ) ( r ( v , i a ) - r ( i a ) ‾ ) 2 , v 表示目标项目in的求和对象,r(v,in)表示目标项目in在R=|U|×|I|中的元素,r(in)表示目标项目in被用户U={u1,u2,…,uc,…um}评分过的评分集,r(v,ia)表示任意一项目ia在R=|U|×|I|中的元素,r(ia)表示任意一项目ia被用户U={u1,u2,…,uc,…um}评分过的评分集;
第202步骤:采用K近邻推荐模型对用户-项目社会化标签矩阵T=|U|×|I|进行处理,获得目标项目in被所有用户标注过的所有标签集及任意一项目ia被所有用户标注过的所有标签集
Figure BDA0000113835280000054
然后将
Figure BDA0000113835280000055
Figure BDA0000113835280000056
进行相同单词的比较,得到in和ia的项目间标签相似度
Figure BDA0000113835280000061
第203步骤:对项目间评分相似度IRSim(in→ia)和项目间标签相似度ITSim(in→ia)进行加权平均计算得到,项目间相似度ISim(in→ia)=s·ITSim(in→ia)+(1-s)·IRSim(in→ia),s表示相似度阈值,一般设置为[0,1]。
在本发明中,相似度阈值s经本专利的实验验证得知s取值为0.9时,效果最佳,可有效解决社会化标签信息缺失的冷启动问题。
第三步:采用所述第二步的处理方法遍历目标项目in分别与项目集I={i1,i2,…,ia,…in}中项目处理,目标项目in的项目集相似度ISim(in);
第四步:依据用户-项目评分矩阵R=|U|×|I|、用户-项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标用户um与任意一用户uc之间的用户间相似度USim(um→uc);
第401步骤:采用K近邻推荐模型对用户-项目评分矩阵R=|U|×|I|进行处理,获得目标用户um的被评分集R(um)及任意一用户uc的被评分集R(uc);然后使用Pearson相关相似度计算um和uc的用户间评分相似度 URSim ( u m → u c ) = Σ j ∈ R ( u m ) ∩ R ( u c ) ( r ( u m , j ) - r ( u m ) ‾ ) ( r ( u c , j ) - r ( u c ) ‾ ) Σ j ∈ R ( u m ) ∩ R ( u c ) ( r ( u m , j ) - r ( u m ) ‾ ) 2 Σ i ∈ R ( u m ) ∩ R ( u c ) ( r ( u c , j ) - r ( u c ) ‾ ) 2 ,j表示目标用户um的求和对象,r(um,j)表示目标用户um在R=|U|×|I|中的元素,r(um)表示目标用户um被用户U={u1,u2,…,uc,...um}评分过的评分集,r(uc,j)表示任意一用户uc在R=|U|×|I|中的元素,r(ia)表示任意一用户uc被用户U={u1,u2,…,uc,...um}评分过的评分集;
第402步骤:采用K近邻推荐模型对用户-项目社会化标签矩阵T=|U|×|I|进行处理,获得目标用户um标注过的所有标签集及任意一用户uc标注过的所有标签集
Figure BDA0000113835280000064
然后将
Figure BDA0000113835280000065
Figure BDA0000113835280000066
进行相同单词的比较,得到um和uc的用户间标签相似度 UTSim ( u m → u c ) = T u m ∩ T u c T u m ∪ T u c ;
第403步骤:对用户间评分相似度URSim(um→uc)和用户间标签相似度UTSim(um→uc)进行加权平均计算得到,用户间相似度USim(um→uc)=s·UTSim(um→uc)+(1-s)·URSim(um→uc),s表示相似度阈值,一般为[0,1]。
在本发明中,相似度阈值s经本专利的实验验证得知s取值为0.9时,效果最佳,可有效解决社会化标签信息缺失的冷启动问题。
第五步:采用所述第四步的处理方法遍历目标项目in分别与用户集U={u1,u2,…,uc,...um}中用户处理,目标项目in的用户集相似度UTSim(um);
第六步:获取目标用户-近邻项目评分r(um,i′);
根据项目集相似度ISim(in)来获取与目标项目in相似度最高的前面的项目(位于目标项目in相似度最高的前面的项目的个数记为KI,KI为用户设定值,一般为10个项目、20个项目、30个项目、…、100个项目),得到目标项目in的K近邻项目集合KNN(in);所述K近邻项目集合KNN(in)中的任意一个元素记为i′,则有目标用户um对目标项目in的K近邻项目集合KNN(in)中任意一元素的评分记为r(um,i′)(简称为目标用户-近邻项目评分r(um,i′))。
第七步:获取近邻用户-目标项目评分r(u′,in);
根据用户集相似度USim(um)来获取与目标用户um相似度最高的前面的用户(位于目标项目in相似度最高的前面的用户的个数记为KU,KU为用户设定值,一般为10个用户、20个用户、30个用户、…、100个用户),得到目标用户um的K近邻用户集合KNN(um)。所述K近邻用户集合KNN(um)中的任意一个元素记为u′,则有目标用户um的K近邻用户集合KNN(um)对目标项目in的评分记为r(u′,in)(简称为近邻用户-目标项目评分r(u′,in))。
第八步:从项目集相似度ISim(in)中选取与K近邻项目集合KNN(in)相关的相似度ISim(KNN(in));
从用户集相似度USim(um)中选取与K近邻用户集合KNN(um)相关的相似度USim(KNN(um));
第九步:计算预测评分
对目标用户-近邻项目评分r(um,i′)、近邻用户-目标项目评分r(u′,in)、目标项目-K近邻相似度ISim(KNN(in))和目标用户-K近邻相似度USim(KNN(um))进行加权平均,得到目标用户um对目标项目in的预测评分 r ^ ( u m , i n ) = Σ v ∈ KNN ( u m ) ∩ R ( i n ) USim ( u m , v ) · r ( v , i n ) + Σ j ∈ KNN ( i n ) ∩ R ( u m ) ISim ( i n , j ) · r ( u m , j ) Σ v ∈ KNN ( u m ) ∩ R ( i n ) USim ( u m , v ) + Σ j ∈ KNN ( i n ) ∩ R ( u m ) ISim ( i n , j ) ,v表示目标项目in的求和对象,KNN(um)表示目标用户um的K近邻用户集合,R(in)表示目标项目in的被评分集,USim(um,v)表示目标用户um与求和对象v的用户相似度,r(v,in)表示目标项目in在R=|U|×|I|中的元素,KNN(in)表示目标项目in的K近邻项目集合,R(um)表示目标用户um的被评分集,ISim(in,j)表示目标项目in与求和对象j的项目相似度,r(um,j)表示目标用户um在R=|U|×|I|中的元素。
本实验采用三种评价指标验证该推荐方法的性能,包括MAE(MAE Absolute Error,平均绝对误差)、Coverage(覆盖率)和RightRec(准确率)。
在本发明中,所述平均绝对误差 MAE = Σ j ∈ R ^ ( u m ) ∩ R ′ ( u m ) | r ( u m , j ) - r ^ ( u m , j ) | | R ^ ( u m ) ∩ R ′ ( u m ) | 值越低推荐精度越高。
其中
Figure BDA0000113835280000082
表示推荐系统为目标用户um推荐的项目集,R′(um)表示测试数据集中目标用户um的已知评分项目集。
在本发明中,Coverage是推荐系统向目标用户um所推荐的项目数占测试集中目标用户已知评分项目数的比例,所述覆盖率 Coverage = Σ | R ^ ( u m ) ∩ R ′ ( u m ) | Σ R ′ ( u m ) 值越高推荐精度越高。
在本发明中,RightRec是推荐系统向目标用户um所推荐的项目中预测评分大于等于3分的项目数占测试集中目标用户已知评分大于等于3的项目数的比例,所述准确率 RightRec = { R ^ ( u m ) | r ^ ( u m , j ) > 2 , j ∈ R ^ ( u m ) ∩ R ′ ( u m ) } { R ′ ( u m ) | r ( u m , j ) > 2 , j ∈ R ′ ( u m ) } 值越高推荐精度越高。
在实验验证中,使用MovieLens 10M/10K数据集,该数据集包含了69878名用户对10677个项目超过1000万条的评分信息,以及4009名用户对7601个项目标注的95580条社会标签。所有的用户评分都分布在区间[0,5]内,评分值越高,代表用户对相应项目的兴趣越强。由于该数据集较为庞大,实验难度较大,因此在实验过程中,选取包含了1160名用户在2973个项目上的279618条评分数据和74275条社会标签数据,以下简称ML279K/74K数据集。
实验在ML279K/74K数据集上按照80%-20%的比例构造训练-测试数据集。使用MAE(MAE Absolute Error,平均绝对误差)、Coverage(覆盖率)和RightRec(准确率)作为推荐系统预测精度的评价指标,MAE越低推荐精度越高,Coverage和RightRec越高推荐精度越高。下表为六种推荐模型推荐精度的比较,K近邻模型的K取值为40(根据已有研究人员的实验表明K取值30到60时能得到最好推荐性能)。Fusion-WithTags是基于社会化标签的面向用户和项目的个性化推荐模型,ItemsBased-WithTags是面向项目的基于社会化标签的推荐模型,UsersBased-WithTags是面向用户的基于社会化标签的推荐模型,ItemsBased-WithoutTags是面向项目的推荐模型(不添加标签相似度),UsersBased-WithoutTags是面向用户的推荐模型(不添加标签相似度)。由下表数据可知,当K取值40时,基于社会化标签的面向用户和项目的个性化推荐模型与其他五种推荐模型相比较,其MAE有明显下降,而Coverage和RightRec有明显的提高。
Figure BDA0000113835280000091
基于社会化标签的个性化推荐比基于评分相似度的个性化推荐有更高的性能,如图2,面向用户的推荐模型,当K取值为40时,s取值0说明没有添加社会标签相似度,s取值1说明没有添加评分相似度,由图可见,s越大MAE越小,当s为1时MAE增大,说明社会标签相似度比评分相似度有更好的性能,但完全使用社会标签时会存在信息缺失问题,所以添加系数为0.1的评分相似度可以解决社会标签的信息缺失问题。如图3所示,面向用户的推荐模型,当K取值从10到100时,s取值分别为0、0.9和1的MAE值,所以s取值为0.9时能最好得权衡社会标签相似度和评分相似度。通过实验得知,面向项目的推荐模型是类似效果。
如图4,图5和图6,基于社会化标签的面向用户和项目的个性化推荐系统的推荐精度相比面向用户和面向项目的个性化推荐精度均有明显提高。

Claims (4)

1.一种基于社会化标签的面向用户和项目的个性化推荐系统优化方法,其特征在于包括有下列步骤:
第一步:在电子商务的项目集I={i1,i2,…,ia,…in}和用户集U={u1,u2,…,uc,…um}中采用矩阵形式表达出用户-项目评分矩阵R=|U|×|I|和用户-项目社会化标签矩阵T=|U|×|I|;
第二步:依据用户-项目评分矩阵R=|U|×|I|、用户-项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标项目in与任意一项目ia之间的项目间相似度ISim(in→ia);
第三步:采用所述第二步的处理方法遍历目标项目in分别与项目集I={i1,i2,…,ia,…in}中项目处理,目标项目in的项目集相似度ISim(in);
第四步:依据用户-项目评分矩阵R=|U|×|I|、用户-项目社会化标签矩阵T=|U|×|I|在K近邻推荐模型中获取目标用户um与任意一用户uc之间的用户间相似度USim(um→uc);
第五步:采用所述第四步的处理方法遍历目标项目in分别与用户集U={u1,u2,…,uc,…um}中用户处理,目标项目in的用户集相似度UTSim(um);
第六步:获取目标用户-近邻项目评分r(um,i′);
根据项目集相似度ISim(in)来获取与目标项目in相似度最高的前面的项目,得到目标项目in的K近邻项目集合KNN(in);所述K近邻项目集合KNN(in)中的任意一个元素记为i′,则有目标用户um对目标项目in的K近邻项目集合KNN(in)中任意一元素的评分记为r(um,i′);
第七步:获取近邻用户-目标项目评分r(u′,in);
根据用户集相似度USim(um)来获取与目标用户um相似度最高的前面的用户,得到目标用户um的K近邻用户集合KNN(um);所述K近邻用户集合KNN(um)中的任意一个元素记为u′,则有目标用户um的K近邻用户集合KNN(um)对目标项目in的评分记为r(u′,in);
第八步:从项目集相似度ISim(in)中选取与K近邻项目集合KNN(in)相关的相似度ISim(KNN(in));
从用户集相似度USim(um)中选取与K近邻用户集合KNN(um)相关的相似度USim(KNN(um));
第九步:计算预测评分
对目标用户-近邻项目评分r(um,i′)、近邻用户-目标项目评分r(u′,in)、目标项目-K近邻相似度ISim(KNN(in))和目标用户-K近邻相似度USim(KNN(um))进行加权平均,得到目标用户um对目标项目in的预测评分 r ^ ( u m , i n ) = Σ v ∈ KNN ( u m ) ∩ R ( i n ) USim ( u m , v ) · r ( v , i n ) + Σ j ∈ KNN ( i n ) ∩ R ( u m ) ISim ( i n , j ) · ( u m , j ) Σ v ∈ KNN ( u m ) ∩ R ( i n ) USim ( u m , v ) + Σ j ∈ KNN ( i n ) ∩ R ( u m ) ISim ( i n , j ) , v表示目标项目in的求和对象,KNN(um)表示目标用户um的K近邻用户集合,R(in)表示目标项目in的被评分集,USim(um,v)表示目标用户um与求和对象v的用户相似度,r(v,in)表示目标项目in在R=|U|×|I|中的元素,KNN(in)表示目标项目in的K近邻项目集合,R(um)表示目标用户um的被评分集,ISim(in,j)表示目标项目in与求和对象j的项目相似度,r(um,j)表示目标用户um在R=|U|×|I|中的元素;
所述的在第二步中项目间相似度ISim(in→ia)的获取包括下列步骤:
第201步骤:采用K近邻推荐模型对用户-项目评分矩阵R=|U|×|I|进行处理,获得目标项目in的被评分集R(in)及任意一项目ia的被评分集R(ia);然后使用Pearson相关相似度计算in和ia的项目间评分相似度
Figure 1
v表示目标项目in的求和对象,r(v,in)表示目标项目in在R=|U|×|I|中的元素,r(in)表示目标项目in被用户U={u1,u2,…,uc,…um}评分过的评分集,r(v,ia)表示任意一项目ia在R=|U|×|I|中的元素,r(ia)表示任意一项目ia被用户U={u1,u2,…,uc,…um}评分过的评分集;
第202步骤:采用K近邻推荐模型对用户-项目社会化标签矩阵T=|U|×|I|进行处理,获得目标项目in被所有用户标注过的所有标签集Tin及任意一项目ia被所有用户标注过的所有标签集
Figure FDA00003459757900024
然后将
Figure FDA00003459757900025
Figure FDA00003459757900026
进行相同单词的比较,得到in和ia的项目间标签相似度
Figure FDA00003459757900023
第203步骤:对项目间评分相似度IRSim(in→ia)和项目间标签相似度ITSim(in→ia)进行加权平均计算得到,项目间相似度ISim(in→ia)=s·ITSim(in→ia)+(1-s)·IRSim(in→ia),s表示相似度阈值,一般设置为[0,1];
所述的在第四步中用户间相似度USim(um→uc)的获取包括下列步骤:
第401步骤:采用K近邻推荐模型对用户-项目评分矩阵R=|U|×|I|进行处理,获得目标用户um的被评分集R(um)及任意一用户uc的被评分集R(uc);然后使用Pearson相关相似度计算um和uc的用户间评分相似度 URSim ( u m → u c ) = Σ j ∈ R ( u m ) ∩ R ( u c ) ( r ( u m , j ) - r ( u m ) ‾ ) ( r ( u c , j ) - r ( u c ) ‾ ) Σ j ∈ R ( u m ) ∩ R ( u c ) ( r ( u m , j ) - r ( u m ) ‾ ) 2 Σ j ∈ R ( u m ) ∩ R ( u c ) ( r ( u c , j ) - r ( u c ) ‾ ) 2 , j表示目标用户um的求和对象,r(um,j)表示目标用户um在R=|U|×|I|中的元素,r(um)表示目标用户um被用户U={u1,u2,…,uc,…um}评分过的评分集,r(uc,j)表示任意一用户uc在R=|U|×|I|中的元素,r(ia)表示任意一用户uc被用户U={u1,u2,…,uc,…um}评分过的评分集;
第402步骤:采用K近邻推荐模型对用户-项目社会化标签矩阵T=|U|×|I|进行处理,获得目标用户um标注过的所有标签集
Figure FDA00003459757900033
及任意一用户uc标注过的所有标签集
Figure FDA00003459757900034
然后将
Figure FDA00003459757900035
Figure FDA00003459757900036
进行相同单词的比较,得到um和uc的用户间标签相似度 UTSim ( u m → u c ) = T u m ∩ T u c T u m ∪ T u c ;
第403步骤:对用户间评分相似度URSim(um→uc)和用户间标签相似度UTSim(um→uc)进行加权平均计算得到,用户间相似度USim(um→uc)=s·UTSim(um→uc)+(1-s)·URSim(um→uc),s表示相似度阈值,一般为[0,1]。
2.根据权利要求1所述的基于社会化标签的面向用户和项目的个性化推荐系统优化方法,其特征在于:相似度阈值s取值为0.9时,效果最佳,可有效解决社会化标签信息缺失的冷启动问题。
3.根据权利要求1所述的基于社会化标签的面向用户和项目的个性化推荐系统优化方法,其特征在于:目标项目in相似度最高的前面的项目的个数可以为10个项目、20个项目、30个项目、…、100个项目。
4.根据权利要求1所述的基于社会化标签的面向用户和项目的个性化推荐系统优化方法,其特征在于:目标项目in相似度最高的前面的用户的个数可以为10个用户、20个用户、30个用户、…、100个用户。
CN 201110386982 2011-11-29 2011-11-29 一种基于社会化标签的个性化推荐系统优化方法 Expired - Fee Related CN102376063B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110386982 CN102376063B (zh) 2011-11-29 2011-11-29 一种基于社会化标签的个性化推荐系统优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110386982 CN102376063B (zh) 2011-11-29 2011-11-29 一种基于社会化标签的个性化推荐系统优化方法

Publications (2)

Publication Number Publication Date
CN102376063A CN102376063A (zh) 2012-03-14
CN102376063B true CN102376063B (zh) 2013-09-25

Family

ID=45794622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110386982 Expired - Fee Related CN102376063B (zh) 2011-11-29 2011-11-29 一种基于社会化标签的个性化推荐系统优化方法

Country Status (1)

Country Link
CN (1) CN102376063B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103365916B (zh) * 2012-03-31 2016-12-14 中国科学技术大学 地震事件参数估计获取方法和系统,地震事件搜索引擎
CN103473244A (zh) * 2012-06-08 2013-12-25 富士通株式会社 用于推荐应用组合中使用的应用的设备和方法
CN102929928B (zh) * 2012-09-21 2015-04-22 北京格致璞科技有限公司 基于多维相似度的个性化新闻推荐方法
CN102982107B (zh) * 2012-11-08 2015-09-16 北京航空航天大学 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN103092911B (zh) * 2012-11-20 2016-02-03 北京航空航天大学 一种融合社会标签相似度基于k近邻的协同过滤推荐系统
CN104239374B (zh) * 2013-06-21 2018-12-04 伊姆西公司 用于文档推荐的方法和装置
CN103679502B (zh) * 2013-11-14 2017-01-18 青岛海信传媒网络技术有限公司 应用推荐方法和系统
CN105335409B (zh) * 2014-07-31 2019-02-01 华为技术有限公司 一种目标用户的确定方法、设备和网络服务器
CN104731866B (zh) * 2015-02-27 2020-05-19 湖南松桂坊电子商务有限公司 一种基于位置的个性化美食推荐方法
CN104915388B (zh) * 2015-03-11 2018-03-16 浙江大学 一种基于谱聚类和众包技术的图书标签推荐方法
CN104899321A (zh) * 2015-06-19 2015-09-09 中国石油大学(华东) 一种基于项目属性评分均值的协同过滤推荐方法
CN105608118B (zh) * 2015-12-15 2018-12-18 成都陌云科技有限公司 基于用户交互信息的结果推送方法
CN105677900A (zh) * 2016-02-04 2016-06-15 南京理工大学 恶意用户检测方法及装置
CN108805642A (zh) * 2017-05-02 2018-11-13 合信息技术(北京)有限公司 推荐方法及装置
CN107239993B (zh) * 2017-05-24 2020-11-24 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN107341687B (zh) * 2017-06-01 2021-06-08 华南理工大学 一种基于多维标签与分类排序的推荐算法
CN106991199B (zh) * 2017-06-07 2020-07-14 上海理工大学 基于用户行为倾向概率的推荐系统评分预测与推荐方法
CN108355349A (zh) * 2018-03-14 2018-08-03 张伟东 游戏系统
CN109345274B (zh) * 2018-07-27 2022-05-24 华南理工大学 基于bp神经网络评分预测误差的近邻用户选择方法
CN109408702B (zh) * 2018-08-29 2021-07-16 昆明理工大学 一种基于稀疏边缘降噪自动编码的混合推荐方法
CN110334284B (zh) * 2019-04-03 2021-07-30 厦门大学 一种新型融合多因素决策的推荐方法
CN113033090B (zh) * 2021-03-24 2023-03-03 平安科技(深圳)有限公司 推送模型训练方法、数据推送方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6865565B2 (en) * 2000-11-30 2005-03-08 International Business Machines Corporation Rule-based personalization framework for integrating recommendation systems
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN101986299A (zh) * 2010-10-28 2011-03-16 浙江大学 基于超图的多任务个性化网络服务方法
CN102073720A (zh) * 2011-01-10 2011-05-25 北京航空航天大学 一种对个性化推荐结果进行优化的fr方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6865565B2 (en) * 2000-11-30 2005-03-08 International Business Machines Corporation Rule-based personalization framework for integrating recommendation systems
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN101986299A (zh) * 2010-10-28 2011-03-16 浙江大学 基于超图的多任务个性化网络服务方法
CN102073720A (zh) * 2011-01-10 2011-05-25 北京航空航天大学 一种对个性化推荐结果进行优化的fr方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking

Also Published As

Publication number Publication date
CN102376063A (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
CN102376063B (zh) 一种基于社会化标签的个性化推荐系统优化方法
CN102982107B (zh) 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN103412948B (zh) 基于聚类的协同过滤的商品推荐方法及系统
CN106156333B (zh) 一种融合社会化信息的改进单类协同过滤方法
CN105045907B (zh) 一种用于个性化社会图像推荐的视觉注意‑标签‑用户兴趣树的构建方法
CN104881401B (zh) 一种专利文献聚类方法
CN107563841A (zh) 一种基于用户评分分解的推荐系统
CN103473354A (zh) 基于电子商务平台的保险推荐系统框架及保险推荐方法
CN103617289B (zh) 基于用户特征及网络关系的微博推荐方法
CN107515909A (zh) 一种视频推荐方法及系统
CN107341687A (zh) 一种基于多维标签与分类排序的推荐算法
CN102567900A (zh) 一种向客户推荐商品的方法
CN110263257A (zh) 基于深度学习的多源异构数据混合推荐模型
CN106447463A (zh) 一种基于马尔科夫决策过程模型的商品推荐方法
CN103309967A (zh) 基于相似性传递的协同过滤方法及系统
CN102542490A (zh) 基于模型匹配的商品推荐方法
CN102541920A (zh) 联合基于用户和项目的协同过滤提高准确度的方法及装置
CN105354260B (zh) 一种融合社会网络和项目特征的移动应用推荐方法
CN103218356A (zh) 一种面向开放平台的提问质量判定方法和系统
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN106776930A (zh) 一种融入时间和地理位置信息的地点推荐方法
CN104424247A (zh) 一种产品信息过滤推荐方法和装置
CN106056413A (zh) 基于时空偏好的兴趣点推荐方法
CN108039198A (zh) 一种面向移动医疗的医生推荐方法及系统
CN105786983A (zh) 一种基于学习地图与协同过滤的员工个性化学习推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171106

Address after: 101407 Beijing city Huairou District Yanqi Park Economic Development Zone Street No. 6 Building 2 room 208

Patentee after: Beijing Tianshi and culture communication limited liability company

Address before: 100191 Haidian District, Xueyuan Road, No. 37,

Patentee before: Beihang University

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130925

Termination date: 20201129

CF01 Termination of patent right due to non-payment of annual fee