CN106294447A - 一种基于双聚类填充的协同过滤方法 - Google Patents

一种基于双聚类填充的协同过滤方法 Download PDF

Info

Publication number
CN106294447A
CN106294447A CN201510282397.2A CN201510282397A CN106294447A CN 106294447 A CN106294447 A CN 106294447A CN 201510282397 A CN201510282397 A CN 201510282397A CN 106294447 A CN106294447 A CN 106294447A
Authority
CN
China
Prior art keywords
row
submatrix
item
user
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201510282397.2A
Other languages
English (en)
Inventor
汪家升
宋宏
周晓锋
郝胜轩
陈喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Institute of Automation of CAS
Original Assignee
Shenyang Institute of Automation of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Institute of Automation of CAS filed Critical Shenyang Institute of Automation of CAS
Priority to CN201510282397.2A priority Critical patent/CN106294447A/zh
Publication of CN106294447A publication Critical patent/CN106294447A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于双聚类填充的协同过滤方法。包括基于双聚类的缺失项填充:对于每个缺失项在整个原始评分矩阵中找出所有包含该缺失项的子矩阵,计算所有子矩阵的平均平方残差Hmin(m,n),根据平均平方残差最小的子矩阵估计缺失项的值;基于用户的协同过滤推荐:分别赋予原始数据和填充数据以不同的可靠性权重,根据所述可靠性权重计算目标用户和其他用户之间的相似度,将与目标用户最相似度最高的若干个用户的集合作为目标用户的最近邻集合,根据目标用户的最近邻集合的评分信息预测目标用户对商品的评分;针对每个用户,向其推荐评分最高的若干个商品。本发明引入了可靠性矩阵区分真实评分项和填充项改进相似度函数及预测评分函数,改善了评分矩阵数据稀疏性带来的影响。

Description

一种基于双聚类填充的协同过滤方法
技术领域
本发明属于协同过滤推荐领域,具体涉及一种基于双聚类填充的协同过滤方法。
背景技术
随着因特网和电子商务的迅猛发展,网站的信息急剧增加,人们想要从海量的数据中快速定位到自己的需要的信息变得愈加困难。人们身处数据的海洋中却仍然承受着信息的匮乏,信息超载的现象越来越加严重。在此背景下个性化推荐系统日益受到重视。
数据稀疏性是协同过滤面临的最大挑战,在实际的商业推荐系统中,用户和项目的数量十分的庞大,而用户往往只在很少的项目上有评分记录,从而导致实际的评分矩阵非常的稀疏,通常商业推荐系统的评价矩阵稀疏度超过99%以上。在评分矩阵数据稀疏的情况下用户共同标注的项目数非常少,从而导致对于目标用户找不到足够而有效的最近邻居集合进而影响推荐质量。针对数据稀疏性问题,本发明提出了基于双聚类填充的协同过滤算法。算法首先对评分矩阵中的缺失值应用双聚类算法进行填充,经过填充后评分矩阵的稠密度增加,并引入了可靠性矩阵以区分原始值和填充值。之后结合基于用户的协同过滤算法对目标用户和目标项目进行预测评分。
推荐技术中基本分为两类:基于记忆的和基于模型的。其中基于模型的协调过滤方法采用机器学习算法或其他技术学得到一个模型,运行时只需要预计算模型就能进行预测。基于记忆的技术则直接通过保存在内存中的评分数据进行计算直接得到推荐结果。基于记忆的方法由于使用全部数据能获得较基于模型的方法更高的推荐精度,但是由于计算量巨大因此会遇到可扩展性问题。
基于记忆的技术中分为基于用户的协调过滤和基于项目的协调过滤,基于项目的协调过滤首先构建一个项目间相似度矩阵,运行时通过确定与目标项目最相似的项目并计算目标用户对这些近邻的物品的评分的加权总和得到目标用户对目标项目的评分。基于用户的协同过滤则是首先查找和目标用户最相似度额相似邻居用户集合,然后根据相似邻居用户集合对项目的的评分预测目标用户对目标项目的评分。基于项目的协调过滤在大数量级时推荐速度很快,但是推荐精度不如基于用户的协调过滤方法高,基于用户的协调过滤方法能获得较高的推荐准确度。
在协同过滤算法由于不需要考虑项目的内容、易于实现等特点被广泛应用于电影推荐、音乐推荐以及电子商务等领域。协同过滤的原理是首先为目标用户找出一组与之偏好一致的邻居用户集合,然后对邻居用户进行分析,把邻居用户感兴趣的项目推荐给目标用户。如今许多大型网站如亚马逊、豆瓣FM等都应用了协同过滤技术为用户提供个性化服务。
传统基于用户协同过滤算法是基于这样的假设:如果用户对一些项目的评分相似,那么他们的兴趣就是相似的,因此这些用户对其他项目的评分也会相似。通过对目标用户计算查找其相似邻居集合,并根据近邻集合对目标用户推荐。算法包含两个部分:
(1)相似度函数:常用的相似度计算函数有余弦相似度、相关相似度等。其中基于用户的协同过滤算法常用相关相似度函数。具体公式如(1)所示:
sim ( u a , u b ) = ( Σ j ∈ S ( r aj - r a ‾ ) · ( r bj - r b ‾ ) Σ j ∈ S ( r aj - r a ‾ ) 2 Σ j ∈ S ( r bj - r b ‾ ) 2 ) - - - ( 1 )
其中raj表示用户ua对项目lj的评分,rbj表示用户ub对项目lj的评分,分别表示用户ua和ub对项目的评分均值。
(2)预测评分函数:在通过公式(1)获得目标用户的相似近邻集合后,对于目标项目通过如公式(2)所示的预测评分函数预测其评分值。
pred ( u a , l j ) = r a ‾ + Σ u i ∈ N sim ( u a , u i ) · ( r ij - r i ‾ ) Σ u i ∈ N sim ( u a , u i ) - - - ( 2 )
其中ua是目标用户、N是其最近邻居集合,是用户i的评分均值。
由于用户评分的记录数很少,导致评分数据极端稀疏,协同过滤的稀疏性问题会导致推荐质量下降,对于新用户没有该用户对项目的任何评分记录,因而无法为其匹配与其兴趣相似的最近邻居。
发明内容
针对现有技术中存在的上述不足之处,本发明要解决的技术问题是提供一种基于双聚类填充的协同过滤方法,在传统基于用户协同过滤算法的基础上,采用双聚类算法对原始评分矩阵进行预测填充以增加数据的稠密度,通过增加矩阵的稠密度使得困扰协同过滤算法的稀疏性问题得到了改善。
本发明为实现上述目的所采用的技术方案是:一种基于双聚类填充的协同过滤方法,包括以下步骤:
基于双聚类的缺失项填充:对于每个缺失项在整个原始评分矩阵中找出所有包含该缺失项的子矩阵,计算所有子矩阵的平均平方残差Hmin(m,n),根据平均平方残差最小的子矩阵估计缺失项的值;
基于用户的协同过滤推荐:分别赋予原始数据和填充数据以不同的可靠性权重,根据所述可靠性权重计算目标用户和其他用户之间的相似度,将与目标用户最相似度最高的若干个用户的集合作为目标用户的最近邻集合,根据目标用户的最近邻集合的评分信息预测目标用户对商品的评分;
针对每个用户,向其推荐评分最高的若干个商品。
所述子矩阵至少为5行5列。
所述计算所有子矩阵的平均平方残差Hmin(m,n),具体为:
Hmin(m,n)=A1+A2+A3+A4-A5 (1)
A 1 = 1 mn Σ p ∈ U Σ q ∈ V ( r pq + SUM mn - 1 n Σ t = 1 n r pt - 1 m Σ s = 1 m r sq ) 2 - - - ( 2 )
A 2 = 1 mn Σ q ∈ V ( r iq + SUM mn - 1 n Σ t ∈ V r it - 1 m Σ s = 1 m r sq ) 2 - - - ( 3 )
A 3 = 1 mn Σ q ∈ U ( r pj + SUM mn - 1 m Σ s ∈ U r sj - 1 n Σ t = 1 n r pt ) 2 - - - ( 4 )
A 4 = 1 mn ( SUM mn - 1 n Σ t ∈ V r it - 1 m Σ s ∈ U r sj ) 2 - - - ( 5 )
A 5 = ( m - 1 ) ( n - 1 ) m 2 n 2 ( 1 ( m - 1 ) ( n - 1 ) Σ p ∈ U Σ q ∈ V r pq - 1 n - 1 Σ t ∈ V r it - 1 m - 1 Σ s ∈ U r sj ) 2 - - - ( 6 )
其中,A为仅包含一个缺失项的子矩阵。A1、A2、A3、A4、A5分别为子矩阵A中的计算式、m为A的行总数、n为A的列总数、SUM为子矩阵A中所有非缺失项数目的总和、集合U={1,2,…,i-1,i+1,…,m}为子矩阵中除了第i行以外所有的行的集合、集合V={1,2,…,j-1,j+1,…,n}为子矩阵中除了第j列以外所有的列的集合、p为集合U中的第p行、q为集合V中的第q列、s为m行中的第s行、t为n列中的第t列、i为缺失项所在行、j为缺失项所在列。rpq为子矩阵中第p行第q列所在项的值、rsq为子矩阵中第s行第q列所在项的值、riq为子矩阵中第i行第q列所在项的值、rpj为子矩阵中第p行第j列所在项的值、rpt为子矩阵中第p行第t列所在项的值、rit为子矩阵中第i行第t列所在项的值、rsj为子矩阵中第s行第j列所在项的值。
所述根据平均平方残差最小的子矩阵估计缺失项的值,具体为:
其中,i为缺失项所在行、j为缺失项所在列、m为A的行总数、n为A的列总数、s为m行中的第s行、t为n列中的第t列、集合U={1,2,…,i-1,i+1,…,m}为子矩阵中除了第i行以外所有的行的集合、集合V={1,2,…,j-1,j+1,…,n}为子矩阵中除了第j列以外所有的列的集合、p为集合U中的第p行、q为集合V中的第q列、rit为子矩阵中第i行第t列所在项的值、rpq为子矩阵中第p行第q列所在项的值、rsj为子矩阵中第s行第j列所在项的值。
当平均平方残差最小的子矩阵不只一个时,选取其中包含数据量最大的子矩阵,即缺失率最低的子矩阵作为平均平方残差最小的子矩阵。
如果平均平方残差最小的子矩阵包含数据量也相同,则随机选取其中一个子矩阵作为平均平方残差最小的子矩阵。
所述可靠性权重为:
其中,i为矩阵中第i行、j为矩阵中第j列。rij为原始评分矩阵中的第i行第j列所在项、tij为可靠性矩阵中第i行第j列所在项。θ为空缺项的权重值。
所述根据所述可靠性权重计算目标用户和其他用户之间的相似度,具体为:
sim ( u a , u b ) = ( Σ jϵS t bj · ( r aj - r a ‾ ) · ( r bj - r b ‾ ) Σ jϵS ( r aj - r a ‾ ) 2 Σ jϵS t bj 2 · ( r bj - r b ‾ ) 2 ) - - - ( 9 )
其中,ua为第a个用户、ub为第b个用户、S为用户ua和ub的共同评分项目集合、j为集合S中的第j个项目、raj表示用户ua对项目lj的评分,rbj表示用户ub对项目lj的评分,ra和rb分别表示用户ua和ub对项目的评分均值,S是用户ua和ub的共同评分项目集合,tbj表示用户ub对项目lj的可靠性权重值。
所述根据目标用户的最近邻集合的评分信息预测目标用户对商品的评分,具体为:
pred ( u a , l j ) = r a ‾ + Σ u i ∈ K t ij · sim ( u a , u i ) · ( r ij - r i ‾ ) Σ u i ∈ K t ij · sim ( u a , u i ) - - - ( 10 )
其中ua是为第a个用户,这里ua是目标用户,ui为第i个用户,lj为第j个项目,K是目标用户的最近邻数量,sim(ua,ui)是目标用户ua和用户ui之间的相似度,tij是用户ui对项目lj的可靠性权重值,rij是用户ui对项目lj的评分值,为用户ui的评分平均值,为用户ua的评分平均值。
本发明具有以下优点及有益效果:
1.改善了评分矩阵数据稀疏性带来的影响。
2.引入了可靠性矩阵区分真实评分项和填充项改进相似度函数及预测评分函数。
3.提高了推荐准确度。
附图说明
图1为本发明方法中原始评分矩阵示意图;
图2为本发明方法中填充后的评分矩阵示意图;
图3为本发明方法中不同近邻数量时基于双聚类填充协同过滤算法和传统基于用户协同过滤算法MAE值图;
图4为本发明方法中可靠性矩阵参数θ取不同值时基于双聚类填充协同过滤算法的MAE值图。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
如图1所示,原始评分矩阵为一个10行10列的矩阵,行分别为U1到U10的十个用户,列分别为I1到I10的十个商品。已有评分项是取值范围1到5之间的整数值。原始评分矩阵中含有空缺项。
如图2所示,填充后的评分矩阵为一个10行10列的矩阵,行分别为U1到U10的十个用户,列分别为I1到I10的十个商品。其中空缺项已被填充为精度为保留一位小数的填充值。填充值的范围不受约束,由双聚类算法计算得到。
本发明效果的验证实例:
1、数据集。MovieLens数据集是美国Minnesota大学GroupLens项目组提供的电影评分数据集。MovieLens是一个基于Web的研究性推荐系统,用于接收用户对电影的评分并提供相应的电影推荐列表。MovieLens数据集中包含了943个用户对1682部电影的10000条评分数据。其中每个用户至少对20部电影有评分记录。实验对数据集进行了划分,80%的数据用作训练集,20%的数据用作测试集。
数据稀疏度能度量数据集的稀疏程度,其定义为用户评分矩阵中未评分条目占总数据条目的百分比。MovieLens数据集的稀疏度为1-100000/(943*1682)=0.93695可见该数据集是非常稀疏的,有约93.7%的项都是空缺项。
2、评价标准。评价推荐系统推荐质量的度量标准主要包括统计精度度量方法和决策支持精度度量方法两类。统计精度度量方法中的平均绝对偏差MAE(mean absolute error)可以直观地对推荐质量进行度量,是最常用推荐质量度量方法。本发明采用MAE作为推荐质量的评价标准,平均绝对偏差MAE通过计算预测的用户评分与实际的用户评分之间的偏差度量预测的准确性,MAE越小,推荐质量越高。设预测的用户评分集合表示为{p1,p2,...,pN},对应的实际用户评分集合为{q1,q2,...,qN},则平均绝对偏差定义为:
MAE = Σ i = 1 N | p i - q i | N - - - ( 14 )
3、结果分析。采用传统基于用户协同过滤算法(UB-CF)和基于双聚类填充的协同过滤算法(BF-CF)按照K取从10到100之间10的倍数进行10组实验并进行分析,实验参数与结果表如表1和表2所示,结果对比图如图3和图4所示。
表1 近邻数量取不同值时两种算法推荐质量对比
K UB-CF BF-CF
10 0.8203 0.8268
20 0.8078 0.8092
30 0.8069 0.7991
40 0.8066 0.7961
50 0.8068 0.7964
60 0.8073 0.7955
70 0.8085 0.7963
80 0.8097 0.7973
90 0.8107 0.7976
100 0.8125 0.7972
此处BF-CF算法中θ值预设为0.3。最近邻居的个数会影响算法的性能,实验中将最近邻居的个数从10递增到100。分别计算了传统基于用户的协同过滤算法和本文提出的基于双聚类填充的协同过滤算法的MAE。实验结果如图3所示,当最近邻居数选取较小值时,BF-CF算法的MAE大于UB-CF算法,但当最近邻居集合数等于30及以上时,BF-CF的预测误差显著低于UB-CF。可见本文提出的基于双聚类填充的协同过滤算法的推荐质量高于传统基于用户的协同过滤算法。
表2 可靠性矩阵t中参数θ取不同值时算法推荐质量对比
θ BF-CF
k=40,θ=0.1 0.8117
k=40,θ=0.2 0.7972
k=40,θ=0.3 0.7961
k=40,θ=0.4 0.7968
k=40,θ=0.5 0.7973
k=40,θ=0.6 0.7979
k=40,θ=0.7 0.7996
k=40,θ=0.8 0.7999
k=40,θ=0.9 0.8002
k=40,θ=1.0 0.8005
可靠性矩阵t中参数θ的选取在很大程度上影响了推荐的精度,θ的取值范围是0到1。如果θ取最大值1,则真实值和填充值拥有相等的可靠性。如果θ取0则算法退化为传统基于用户协同过滤算法。表2表示了参数θ的改变对MAE的影响,实验结果如图4所示,可见当θ取值为0.3时算法性能达到最优。

Claims (9)

1.一种基于双聚类填充的协同过滤方法,其特征在于,包括以下步骤:
基于双聚类的缺失项填充:对于每个缺失项在整个原始评分矩阵中找出所有包含该缺失项的子矩阵,计算所有子矩阵的平均平方残差Hmin(m,n),根据平均平方残差最小的子矩阵估计缺失项的值;
基于用户的协同过滤推荐:分别赋予原始数据和填充数据以不同的可靠性权重,根据所述可靠性权重计算目标用户和其他用户之间的相似度,将与目标用户最相似度最高的若干个用户的集合作为目标用户的最近邻集合,根据目标用户的最近邻集合的评分信息预测目标用户对商品的评分;
针对每个用户,向其推荐评分最高的若干个商品。
2.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,所述子矩阵至少为5行5列。
3.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,所述计算所有子矩阵的平均平方残差Hmin(m,n),具体为:
Hmin(m,n)=A1+A2+A3+A4-A5 (1)
A 1 = 1 mn Σ p ∈ U Σ q ∈ V ( r pq + SUM mn - 1 n Σ t = 1 n r pt - 1 m Σ s = 1 m r sq ) 2 - - - ( 2 )
A 2 = 1 mn Σ q ∈ V ( r iq + SUM mn - 1 n Σ t ∈ V r it - 1 m Σ s = 1 m r sq ) 2 - - - ( 3 )
A 3 = 1 mn Σ q ∈ U ( r pj + SUM mn - 1 m Σ s ∈ U r sj - 1 n Σ t = 1 n r pt ) 2 - - - ( 4 )
A 4 = 1 mn ( SUM mn - 1 n Σ t ∈ V r it - 1 n Σ s ∈ U r sj ) 2 - - - ( 5 )
A 5 = ( m - 1 ) ( n - 1 ) m 2 n 2 ( 1 ( m - 1 ) ( n - 1 ) Σ p ∈ U Σ q ∈ V r pq - 1 n - 1 Σ t ∈ V r it - 1 m - 1 Σ s ∈ U r sj ) 2 - - - ( 6 )
其中,A为仅包含一个缺失项的子矩阵。A1、A2、A3、A4、A5分别为子矩阵A中的计算式、m为A的行总数、n为A的列总数、SUM为子矩阵A中所有非缺失项数目的总和、集合U={1,2,…,i-1,i+1,…,m}为子矩阵中除了第i行以外所有的行的集合、集合V={1,2,…,j-1,j+1,…,n}为子矩阵中除了第j列以外所有的列的集合、p为集合U中的第p行、q为集合V中的第q列、s为m行中的第s行、t为n列中的第t列、i为缺失项所在行、j为缺失项所在列。rpq为子矩阵中第p行第q列所在项的值、rsq为子矩阵中第s行第q列所在项的值、riq为子矩阵中第i行第q列所在项的值、rpj为子矩阵中第p行第j列所在项的值、rpt为子矩阵中第p行第t列所在项的值、rit为子矩阵中第i行第t列所在项的值、rsj为子矩阵中第s行第j列所在项的值。
4.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,所述根据平均平方残差最小的子矩阵估计缺失项的值,具体为:
其中,i为缺失项所在行、j为缺失项所在列、m为A的行总数、n为A的列总数、s为m行中的第s行、t为n列中的第t列、集合U={1,2,…,i-1,i+1,…,m}为子矩阵中除了第i行以外所有的行的集合、集合V={1,2,…,j-1,j+1,…,n}为子矩阵中除了第j列以外所有的列的集合、p为集合U中的第p行、q为集合V中的第q列、rit为子矩阵中第i行第t列所在项的值、rpq为子矩阵中第p行第q列所在项的值、rsj为子矩阵中第s行第j列所在项的值。
5.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,当平均平方残差最小的子矩阵不只一个时,选取其中包含数据量最大的子矩阵,即缺失率最低的子矩阵作为平均平方残差最小的子矩阵。
6.根据权利要求5所述的一种基于双聚类填充的协同过滤方法,其特征在于,如果平均平方残差最小的子矩阵包含数据量也相同,则随机选取其中一个子矩阵作为平均平方残差最小的子矩阵。
7.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,所述可靠性权重为:
其中,i为矩阵中第i行、j为矩阵中第j列。rij为原始评分矩阵中的第i行第j列所在项、tij为可靠性矩阵中第i行第j列所在项。θ为空缺项的权重值。
8.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,所述根据所述可靠性权重计算目标用户和其他用户之间的相似度,具体为:
sim ( u a , u b ) = ( Σ jϵS t bj · ( r aj - r ‾ a ) · ( r bj - r ‾ b ) Σ jϵS ( r aj - r ‾ a ) 2 Σ jϵS t bj 2 · ( t bj - r ‾ b ) 2 ) - - - ( 9 )
其中,ua为第a个用户、ub为第b个用户、S为用户ua和ub的共同评分项目集合、j为集合S中的第j个项目、raj表示用户ua对项目lj的评分,rbj表示用户ub对项目lj的评分,ra和rb分别表示用户ua和ub对项目的评分均值,S是用户ua和ub的共同评分项目集合,tbj表示用户ub对项目lj的可靠性权重值。
9.根据权利要求1所述的一种基于双聚类填充的协同过滤方法,其特征在于,所述根据目标用户的最近邻集合的评分信息预测目标用户对商品的评分,具体为:
pred ( u a , l j ) = r ‾ a + Σ u i ∈ K t ij · sim ( u a , u i ) · ( r ij - r ‾ i ) Σ u i ∈ K t ij · sim ( u a , u i ) - - - ( 10 )
其中ua是为第a个用户,这里ua是目标用户,ui为第i个用户,lj为第j个项目,K是目标用户的最近邻数量,sim(ua,ui)是目标用户ua和用户ui之间的相似度,tij是用户ui对项目lj的可靠性权重值,rij是用户ui对项目lj的评分值,ri为用户ui的评分平均值,为用户ua的评分平均值。
CN201510282397.2A 2015-05-28 2015-05-28 一种基于双聚类填充的协同过滤方法 Withdrawn CN106294447A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510282397.2A CN106294447A (zh) 2015-05-28 2015-05-28 一种基于双聚类填充的协同过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510282397.2A CN106294447A (zh) 2015-05-28 2015-05-28 一种基于双聚类填充的协同过滤方法

Publications (1)

Publication Number Publication Date
CN106294447A true CN106294447A (zh) 2017-01-04

Family

ID=57634507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510282397.2A Withdrawn CN106294447A (zh) 2015-05-28 2015-05-28 一种基于双聚类填充的协同过滤方法

Country Status (1)

Country Link
CN (1) CN106294447A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340364A (zh) * 2017-05-31 2017-11-10 北京市环境保护监测中心 基于海量大气污染浓度数据的污染空间分析方法及装置
CN107833070A (zh) * 2017-10-24 2018-03-23 重庆邮电大学 一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法
CN111327441A (zh) * 2018-12-14 2020-06-23 中兴通讯股份有限公司 一种流量数据预测方法、装置、设备及存储介质
CN113297496A (zh) * 2021-06-18 2021-08-24 中山市力泰电子工业有限公司 一种基于改进用户相似度的协同过滤推荐算法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780920A (zh) * 2011-07-05 2012-11-14 上海奂讯通信安装工程有限公司 电视节目推荐方法及系统
CN103164631A (zh) * 2013-04-16 2013-06-19 东华大学 一种智能协同表达基因分析仪
CN103546778A (zh) * 2013-07-17 2014-01-29 Tcl集团股份有限公司 一种电视节目推荐方法、系统及其实现方法
CN104298893A (zh) * 2014-09-30 2015-01-21 西南交通大学 一种基因表达缺失数据的填补方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780920A (zh) * 2011-07-05 2012-11-14 上海奂讯通信安装工程有限公司 电视节目推荐方法及系统
CN103164631A (zh) * 2013-04-16 2013-06-19 东华大学 一种智能协同表达基因分析仪
CN103546778A (zh) * 2013-07-17 2014-01-29 Tcl集团股份有限公司 一种电视节目推荐方法、系统及其实现方法
CN104298893A (zh) * 2014-09-30 2015-01-21 西南交通大学 一种基因表达缺失数据的填补方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GUI-RONG XUE ET AL.: "Scalable Collaborative Filtering Using Cluster-based Smoothing", 《SIGIR "05 PROCEEDINGS OF THE 28TH ANNUAL INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL》 *
郝胜轩 等: "一种基于双聚类的缺失数据填补方法", 《计算机应用研究》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107340364A (zh) * 2017-05-31 2017-11-10 北京市环境保护监测中心 基于海量大气污染浓度数据的污染空间分析方法及装置
CN107833070A (zh) * 2017-10-24 2018-03-23 重庆邮电大学 一种推荐系统中缓解数据稀疏性问题的交叉动态填充方法
CN111327441A (zh) * 2018-12-14 2020-06-23 中兴通讯股份有限公司 一种流量数据预测方法、装置、设备及存储介质
CN113297496A (zh) * 2021-06-18 2021-08-24 中山市力泰电子工业有限公司 一种基于改进用户相似度的协同过滤推荐算法

Similar Documents

Publication Publication Date Title
CN103412948B (zh) 基于聚类的协同过滤的商品推荐方法及系统
CN103514304B (zh) 一种项目推荐方法和装置
CN103617540B (zh) 一种追踪用户兴趣变化的电子商务推荐方法
CN102982107B (zh) 一种融合用户、项目和上下文属性信息的推荐系统优化方法
CN103399858A (zh) 基于信任的社会化协同过滤推荐方法
CN104391849A (zh) 融入时间上下文信息的协同过滤推荐方法
CN107392049A (zh) 一种基于差分隐私保护的推荐方法
CN102495864A (zh) 基于评分的协同过滤推荐方法及系统
CN106682121A (zh) 一种基于用户兴趣变化的时效推荐方法
CN103761237A (zh) 一种基于用户特征及其信任度的协同过滤推荐方法
CN106471491A (zh) 一种时变的协同过滤推荐方法
CN106570090A (zh) 基于兴趣变化和信任关系的协同过滤推荐方法
CN107563841A (zh) 一种基于用户评分分解的推荐系统
CN105976229A (zh) 一种基于用户和项目混合的协同过滤算法
CN106294447A (zh) 一种基于双聚类填充的协同过滤方法
CN104239496B (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN103530416B (zh) 项目数据预测评分库的生成、项目数据的推送方法和系统
CN106326390A (zh) 基于协同过滤的推荐方法
CN103309972A (zh) 基于链路预测的推荐方法和系统
CN105956089A (zh) 一种针对具备项目的分类信息的推荐方法
CN104899246A (zh) 基于模糊机制用户评分邻域信息的协同过滤推荐方法
CN107330727A (zh) 一种基于隐语义模型的个性化推荐方法
CN105354729A (zh) 一种电子商务系统中的商品推荐方法
CN103336831B (zh) 基于块对角矩阵的推荐方法和装置
CN104298772A (zh) 一种优化近邻选择的协同过滤推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20170104

WW01 Invention patent application withdrawn after publication