CN102426686A - 一种基于矩阵分解的互联网信息产品推荐方法 - Google Patents

一种基于矩阵分解的互联网信息产品推荐方法 Download PDF

Info

Publication number
CN102426686A
CN102426686A CN2011102989946A CN201110298994A CN102426686A CN 102426686 A CN102426686 A CN 102426686A CN 2011102989946 A CN2011102989946 A CN 2011102989946A CN 201110298994 A CN201110298994 A CN 201110298994A CN 102426686 A CN102426686 A CN 102426686A
Authority
CN
China
Prior art keywords
user
product
scoring
matrix
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102989946A
Other languages
English (en)
Inventor
李敏
顾庆
骆斌
汤九斌
陈道蓄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN2011102989946A priority Critical patent/CN102426686A/zh
Publication of CN102426686A publication Critical patent/CN102426686A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于矩阵分解的互联网信息产品推荐方法,其步骤是:1)获取用户对信息产品的评分记录;2)获取互联网用户间的社交关系记录;3)按照目标用户和目标产品类别构建评分矩阵和社交矩阵;4)采用矩阵分解技术学习用户特征向量和产品特征向量;5)根据特征向量计算目标用户对不同产品的评分,据以推荐用户喜好的产品。本发明引入对用户社交关系的分析,结合产品类别信息为目标用户提供个性化产品推荐。计算简单快速,有良好的可扩展性和适应性,适于互联网用户的高动态性以及面向海量产品的推荐。

Description

一种基于矩阵分解的互联网信息产品推荐方法
技术领域
本发明涉及互联网信息产品的推荐问题,特别针对网站系统中同时存在用户间社交信息以及用户对产品的评分信息,如何有效利用不同用户间社交关系,并根据用户对产品的历史评分数据,快速准确预测用户对其未评价产品的可能评分,为目标用户进行个性化信息产品推荐。
背景技术
互联网信息产品指互联网站上罗列的各类商品和各种电子产品,包括电影、音乐、书籍、家电以及服饰等。随着互联网的迅速发展,用户通过网络可以接触到海量的信息产品。例如在淘宝网上有数以亿计的各类商品,在豆瓣网上有数以百万计的各类电影。面对海量的产品,互联网用户往往无所适从,无法找到自己感兴趣的产品。很多网站系统和搜索引擎开始采用推荐的方式帮助用户选择合适的产品,有效提高用户体验并实现商业营销。一个高效、准确、个性化的推荐系统已经成为互联网应用领域的研发热点之一。
目前的推荐系统主要采用两类方法。其一是协同过滤方法。该方法利用互联网用户的历史评分信息计算用户之间的评分相似度。当系统为某个用户推荐产品时,首先选出与之相似度最高的若干其他用户;然后利用其他用户对产品的评价信息来预测目标用户对未评价产品的评分;最后推荐评分最高的信息产品。协同过滤方法的优点是可以借鉴相似用户的评价信息为目标用户提供推荐。其二是矩阵分解方法。该方法将用户对产品的评价信息组织为一个评分矩阵,采用奇异值分解(Singular Value Decomposition)技术,为每个用户、产品分解出一个特征向量;使得用户对产品的评分可以通过计算用户和产品特征向量的内积来获得。矩阵分解方法的优点是可以减少需要估计和学习的参数数量,提高推荐系统的性能。
互联网用户对信息产品的评价会受到其朋友或关注对象的影响,朋友关系或关注关系通过用户之间的社交关系反映。目前大多数网站系统都整合了在线社交关系网络,例如豆瓣网、淘宝网和大众点评网等都集成了社交系统。传统推荐方法没有很好考虑用户间的社交关系,不能准确的为用户提供推荐;同时还存在“冷启动”问题,不能为新加入用户和新产品提供有效推荐。
发明内容
本发明的主要目的是针对互联网海量信息产品的推荐问题,为目标用户提供准确的个性化产品推荐。该方法运用协同过滤和矩阵分解技术,引入对用户社交关系的分析,结合产品类别信息为目标用户提供个性化产品推荐;能够解决新加入用户的“冷启动”问题。计算简单,可快速为目标用户完成产品推荐,有良好的可扩展性和适应性。
为实现上述目的,本发明采用如下的步骤:
1) 获取用户对信息产品的评分记录;
2) 获取用户间社交关系记录;
3) 按照目标用户和目标产品类别构建评分矩阵和社交矩阵;
4) 采用矩阵分解技术学习用户特征向量和产品特征向量;
5) 根据特征向量计算目标用户对不同产品的评分,据以推荐用户喜好的产品。
上述步骤1) 中获取用户对信息产品评分记录的过程为:首先确定一个或多个信息收集网站,收集用户对不同信息产品的评价信息。令                                                
Figure 2011102989946100002DEST_PATH_IMAGE001
表示用户,
Figure 16523DEST_PATH_IMAGE002
表示信息产品,
Figure 341326DEST_PATH_IMAGE003
表示用户对产品的评分,则一个评分记录可以表示成
Figure 445548DEST_PATH_IMAGE004
。然后为每个用户和产品设定唯一标识,如用户标识为
Figure 536476DEST_PATH_IMAGE005
,产品标识为
Figure 333531DEST_PATH_IMAGE006
,上述记录转换为
Figure 880050DEST_PATH_IMAGE007
。最后对评分
Figure 53542DEST_PATH_IMAGE003
做归一化处理,如下式所示:
Figure 1907DEST_PATH_IMAGE008
其中
Figure 907546DEST_PATH_IMAGE009
表示网站系统中评分的最大值,而
Figure 3678DEST_PATH_IMAGE010
表示网站系统中评分的最小值。
上述步骤2) 中获取用户间社交关系记录的过程为:首先识别用户在网站系统中的社交关系:朋友关系和关注关系;朋友关系为双向关系,关注关系为单向关系。然后获取各个用户的唯一标识,如用户
Figure 387386DEST_PATH_IMAGE011
和用户。接下来将用户间社交关系转换为社交记录:如果用户
Figure 594693DEST_PATH_IMAGE011
和用户
Figure 178121DEST_PATH_IMAGE012
是朋友关系,则添加社交记录
Figure 365520DEST_PATH_IMAGE013
Figure 350794DEST_PATH_IMAGE014
;如果用户
Figure 598235DEST_PATH_IMAGE011
关注用户
Figure 668959DEST_PATH_IMAGE012
,则只添加社交记录
Figure 680557DEST_PATH_IMAGE013
。最后根据社交记录设定社交关系值,如下式所示:
上述步骤3) 中按照目标用户和目标产品类别构建评分矩阵和社交矩阵的过程为:首先筛选出与目标用户相似的个用户,其中参数
Figure 720188DEST_PATH_IMAGE017
是可选参数,例如选择网站系统中全部用户数量的50%。然后根据目标产品类别选择同类别或相似类别的
Figure 309433DEST_PATH_IMAGE019
个产品
Figure 354749DEST_PATH_IMAGE020
,参数
Figure 687641DEST_PATH_IMAGE019
也是可选参数,例如选择网站系统中所有的同类别产品。接下来获取用户群
Figure 236434DEST_PATH_IMAGE021
对产品集
Figure 262159DEST_PATH_IMAGE022
的所有评分记录,构建评分矩阵,矩阵中元素值
Figure 400197DEST_PATH_IMAGE024
)为用户
Figure 265701DEST_PATH_IMAGE005
对产品
Figure 689205DEST_PATH_IMAGE006
的评分值。如果用户
Figure 691796DEST_PATH_IMAGE005
未对产品
Figure 152864DEST_PATH_IMAGE006
评分,则
Figure 254813DEST_PATH_IMAGE024
设为空值。
下一步根据用户的评分信息计算社交用户之间的评分相似度。根据用户群
Figure 434121DEST_PATH_IMAGE021
中两两用户之间的社交关系值,构建社交矩阵
Figure 912507DEST_PATH_IMAGE026
。调整矩阵元素
Figure 228082DEST_PATH_IMAGE027
为用户
Figure 766511DEST_PATH_IMAGE011
与用户
Figure 229853DEST_PATH_IMAGE012
的评分相似度
Figure 511930DEST_PATH_IMAGE028
,计算公式如下:
Figure 944661DEST_PATH_IMAGE029
Figure 450728DEST_PATH_IMAGE030
其中表示用户
Figure 487134DEST_PATH_IMAGE011
共同评价过的产品;
Figure 454270DEST_PATH_IMAGE032
Figure 829888DEST_PATH_IMAGE033
分别表示用户
Figure 598441DEST_PATH_IMAGE012
Figure 711891DEST_PATH_IMAGE034
中产品评分的均值。再对矩阵
Figure 574804DEST_PATH_IMAGE026
的元素按行进行归一化处理,公式如下(其中若,则
Figure 63872DEST_PATH_IMAGE036
):
Figure 282976DEST_PATH_IMAGE037
最后对
Figure 367606DEST_PATH_IMAGE023
中的元素进行调整:针对每个用户
Figure 395605DEST_PATH_IMAGE005
,计算其评分均值
Figure 514871DEST_PATH_IMAGE038
;针对每个产品
Figure 970123DEST_PATH_IMAGE006
,计算其被用户评价的评分均值
Figure 807629DEST_PATH_IMAGE039
;调整评分矩阵
Figure 373740DEST_PATH_IMAGE023
中的所有元素,公式如下:
Figure 347512DEST_PATH_IMAGE040
该处理相当于去除用户评分倾向和产品综合印象。
上述步骤4) 中采用矩阵分解技术学习用户特征向量和产品特征向量的过程为:首先设定用户与产品特征向量的维度
Figure 973665DEST_PATH_IMAGE041
,维度属于可选参数,例如设定为15。于是用户的特征向量表示为
Figure 496548DEST_PATH_IMAGE042
;产品的特征向量表示为
Figure 840121DEST_PATH_IMAGE043
。然后设定类权向量,其中
Figure 693469DEST_PATH_IMAGE045
为目标产品类别中子类别的数量。
接下来计算用户
Figure 661425DEST_PATH_IMAGE005
对产品
Figure 695240DEST_PATH_IMAGE006
的评分预测
Figure 344527DEST_PATH_IMAGE046
。分两部分,其一是用户和产品特征向量的内积;其二是累加社交关联用户的评分值。采用权重
Figure 412978DEST_PATH_IMAGE047
综合两部分的计算值,公式如下:
Figure 551835DEST_PATH_IMAGE048
其中
Figure 807367DEST_PATH_IMAGE049
表示社交矩阵
Figure 322662DEST_PATH_IMAGE026
中同用户
Figure 245619DEST_PATH_IMAGE005
相关的其他用户,即对
Figure 493060DEST_PATH_IMAGE050
,有
Figure 235888DEST_PATH_IMAGE051
计算权重
Figure 224048DEST_PATH_IMAGE047
需要类权向量。确定产品
Figure 419855DEST_PATH_IMAGE006
所属的子类别,将子类别对应的元素置1,其他元素置0,形成
Figure 915558DEST_PATH_IMAGE006
的类别向量。再根据以下公式计算权重
Figure 56186DEST_PATH_IMAGE055
下一步采用极大似然估计方法,通过最小化评分预测
Figure 773607DEST_PATH_IMAGE046
和实际评分
Figure 106499DEST_PATH_IMAGE056
的差值学习每个用户
Figure 920871DEST_PATH_IMAGE005
的特征向量、每个产品
Figure 948050DEST_PATH_IMAGE006
的特征向量
Figure 146950DEST_PATH_IMAGE058
、以及类权向量
Figure 750582DEST_PATH_IMAGE052
。基于评分矩阵
Figure 743946DEST_PATH_IMAGE059
中的历史评分,以及社交矩阵
Figure 435959DEST_PATH_IMAGE026
,获得所有用户
Figure 438550DEST_PATH_IMAGE021
对所有产品
Figure 899618DEST_PATH_IMAGE022
评分预测的联合概率,公式如下:
Figure 63883DEST_PATH_IMAGE060
通过对联合概率函数取对数,获得如下函数:
Figure 243192DEST_PATH_IMAGE061
其中参数
Figure 783895DEST_PATH_IMAGE062
Figure 99469DEST_PATH_IMAGE063
Figure 700215DEST_PATH_IMAGE064
Figure 101240DEST_PATH_IMAGE065
为方差值,
Figure 445634DEST_PATH_IMAGE066
Figure 615715DEST_PATH_IMAGE067
Figure 387362DEST_PATH_IMAGE068
;设定
Figure 275684DEST_PATH_IMAGE069
。给定向量
Figure 158189DEST_PATH_IMAGE042
,式
Figure 445427DEST_PATH_IMAGE070
定义如下(式
Figure 387975DEST_PATH_IMAGE071
Figure 763593DEST_PATH_IMAGE072
有相同定义):
最后采用极大似然估计方法,通过最小化上述函数学习向量
Figure 594462DEST_PATH_IMAGE057
上述步骤5) 中为目标用户推荐产品的过程为:首先获得用户的特征向量
Figure 59893DEST_PATH_IMAGE057
。然后获取指定产品类别中用户未评分的所有产品,针对其中每一个产品
Figure 428874DEST_PATH_IMAGE075
,计算用户
Figure 394556DEST_PATH_IMAGE011
对产品
Figure 576139DEST_PATH_IMAGE075
的评分预测值
Figure 969074DEST_PATH_IMAGE046
,其中追加用户评分倾向和产品综合印象,公式如下:
Figure 603318DEST_PATH_IMAGE076
对所有待评分产品预测完毕之后,将产品评分预测值排序,挑选其中评分值最高的
Figure 127619DEST_PATH_IMAGE077
个产品(Top-N)推荐给目标用户。
本发明充分运用互联网用户间社交关系对信息产品进行个性化推荐,根据产品类别自动调整用户社交关系影响的权重。在处理用户对产品的评分信息过程中,排除用户的评分倾向以及产品的综合印象,使得用户对产品的评分服从高斯分布;修正的评分值更加真实反映用户对产品的实际喜好。考虑到互联网用户和产品数量巨大,且信息更新的频率很高等特点;本发明方法学习过程和推荐过程计算简单,能够快速为目标用户完成产品推荐,具有良好的可扩展性和适应性。
附图说明
图1是基于矩阵分解的信息产品推荐方法的总体框架;
图2是获取用户/信息产品评分记录并规范化处理的流程;
图3是获取用户社交关系记录并规范化处理的流程;
图4是用户产品评分信息、用户社交信息的关联图;
图5是按照目标用户和产品类别获取评分矩阵和社交矩阵的处理流程;
图6是计算目标用户对不同产品评分并选择推荐产品的流程。
具体实施方式
图1所示为基于矩阵分解的互联网信息产品推荐方法的总体技术框架。方法的输入是互联网上用户对信息产品的评价信息、以及用户之间的社交关系信息。方法的输出是针对目标用户和目标产品类别,根据用户喜好计算并推荐的信息产品集合。技术框架分为5个模块:获取用户对信息产品的评分记录;获取用户间社交关系记录;按照目标用户和目标产品类别构建评分矩阵和社交矩阵;采用矩阵分解技术学习用户特征向量和产品特征向量;根据特征向量计算目标用户对不同产品的评分,据以推荐用户喜好的产品。
本发明方法的第一个模块是获取用户对信息产品的评分记录。首先选定信息收集网站,如豆瓣、大众点评网等信息资源网站,淘宝网、当当网等电子商务网站等。然后收集用户在网站系统中对各种信息产品的评价信息。令
Figure 429288DEST_PATH_IMAGE001
表示用户,
Figure 993124DEST_PATH_IMAGE002
表示信息产品,
Figure 114664DEST_PATH_IMAGE003
表示用户对产品的评分,则一个评分记录可以表示成
Figure 484465DEST_PATH_IMAGE078
。例如用户“张三”对信息产品“功夫熊猫2”评分为4星,则对应的评分记录是<张三,功夫熊猫2,4星>。本发明方法一般用于单个网站系统的信息产品推荐,如果采用cookie等技术可以获取同一用户在不同网站系统中的评价信息,从而综合多个网站系统的评分记录,使得本方法可用于跨平台信息产品推荐。
图2所示为采集用户评分记录并对评分记录进行规范化处理的流程。首先需要考虑用户和信息产品的统一标识,即为不同用户和产品确定唯一标识以示区分。如将用户“张三”标记为
Figure 578323DEST_PATH_IMAGE005
,将产品“功夫熊猫2”标记为
Figure 375378DEST_PATH_IMAGE006
,将对应评分(4星)标记为
Figure 921897DEST_PATH_IMAGE079
;于是评分记录<张三,功夫熊猫2,4星>转换为
Figure 829810DEST_PATH_IMAGE080
。由于在不同网站系统中,评分的取值范围不同(如在豆瓣网中用户评分的取值范围为1~5星;而在时光网中用户评分的取值范围为1~10分);需要将
Figure 778175DEST_PATH_IMAGE081
归一化到相同的[0,1]区间。归一化方法由公式(1)所示(其中
Figure 746131DEST_PATH_IMAGE009
表示网站系统中评分的最大值,而表示网站系统中评分的最小值):
Figure 429233DEST_PATH_IMAGE082
                                
根据该公式,豆瓣网中的4星评价被转换为评分值0.75,而时光网中的4分评价则被转换为评分值0.33。不产生歧义,本文后续的评分
Figure 370961DEST_PATH_IMAGE081
指归一化后的评分值,即
Figure 954389DEST_PATH_IMAGE084
本发明方法的第二个模块是获取用户间社交关系记录。用户在不同网站系统中有不同形式的社交关系描述。例如在豆瓣网中,用户可以有两种社交关系描述:朋友关系和关注关系。朋友关系为双向关系,即如果用户
Figure 469684DEST_PATH_IMAGE011
为用户的朋友,则用户
Figure 433890DEST_PATH_IMAGE012
同时也是用户的朋友。关注关系为单向关系,用户设定自己关注或信任的其他用户;用户
Figure 495704DEST_PATH_IMAGE011
关注用户
Figure 273168DEST_PATH_IMAGE012
并不意味着用户也会关注用户
Figure 249531DEST_PATH_IMAGE011
。其他网站系统上也存在类似的社交关系描述,如淘宝网中有双向的朋友关系;而大众点评网中只存在单向的关注关系。本模块将收集这两种社交关系信息,对于双向关系,如用户“张三”和用户“李四”是朋友,则添加两个社交记录<张三,李四>和<李四,张三>;对于单向关系,如用户“张三”关注用户“李四”,则只添加一个社交记录<张三,李四>。
图3所示为采集用户社交信息并将用户社交记录进行规范化处理的流程。针对每一个社交记录,首先需要获取用户的唯一标识。例如对记录<张三,李四>,获取张三的标识
Figure 841049DEST_PATH_IMAGE011
和李四的标识
Figure 473019DEST_PATH_IMAGE012
,这些标识必须同评分记录中标识取得一致。然后根据社交记录设定社交关系值,由公式(2)所示:
Figure 169896DEST_PATH_IMAGE085
       
Figure 502789DEST_PATH_IMAGE083
例如用户“张三”和用户“李四”是朋友关系,因此同时存在社交记录<张三,李四>和<李四,张三>,于是有社交关系值
Figure 317161DEST_PATH_IMAGE086
Figure 77307DEST_PATH_IMAGE087
图4所示为用户产品评分信息和用户社交信息的关联图。其中上图为社交关系图,下图为评分信息矩阵。社交关系图显示用户之间的关联关系。如图中用户
Figure 282023DEST_PATH_IMAGE088
和用户
Figure 480923DEST_PATH_IMAGE089
之间是双向的朋友关系,可分别定义社交记录
Figure 84555DEST_PATH_IMAGE090
Figure 77919DEST_PATH_IMAGE091
,对应关系值
Figure 769932DEST_PATH_IMAGE092
;而用户
Figure 506943DEST_PATH_IMAGE088
和用户
Figure 30329DEST_PATH_IMAGE093
之间是关注关系,只能定义社交记录
Figure 397856DEST_PATH_IMAGE094
,于是有
Figure 639482DEST_PATH_IMAGE095
Figure 852288DEST_PATH_IMAGE096
评分信息给出用户对每个信息产品的评分。用户通常不会对所有产品评分,对应图中评分矩阵的缺失元素。本发明方法的目标之一就是估计和计算评分矩阵中的缺失元素,从而为用户推荐未评价的产品。社交关系反映用户之间的相互信任关系,互相信任的用户会影响各自对同一产品的评价。例如用户“张三”对产品“功夫熊猫2”的评价很高;而用户“李四”信任用户“张三”,则“李四”有很高的几率对“功夫熊猫2”同样给予高评价。
仅根据社交关系构建的0-1矩阵尚不能反映用户之间的相似性。例如用户“李四”虽然信任用户“张三”,但他们对不同产品的喜好可能存在偏差。如“李四”更喜欢科幻片,而“张三”更喜欢动画片。两者的社交关系值需要根据各自评分记录集合的相似程度来予以调整。
本发明方法的第三个模块是按照目标用户和目标产品类别分别构建评分矩阵和社交矩阵。如图5所示,给定目标用户和准备向用户推荐的目标产品类别,在计算用户对产品的评分值前,需要筛选合适的用户/产品评分记录以及用户间社交关系记录,并组建评分矩阵和社交矩阵。
首先给定目标用户,筛选出与目标用户相似的
Figure 495759DEST_PATH_IMAGE017
个用户,参数
Figure 497530DEST_PATH_IMAGE017
是可选参数,例如选择网站系统中全部用户的50%。用户选择可以基于用户在网站上登记的身份信息,如职业、年龄和性别等,或者根据用户的访问行为和习惯,选择同目标用户最相近的
Figure 514028DEST_PATH_IMAGE017
个用户。然后根据目标产品类别选择同类别或相似类别的
Figure 12005DEST_PATH_IMAGE019
个产品。参数
Figure 671974DEST_PATH_IMAGE019
也是可选参数,例如选择网站系统中所有的同类别产品。
下一步获取用户群
Figure 492162DEST_PATH_IMAGE021
对产品集
Figure 844646DEST_PATH_IMAGE022
的所有评分记录,构建评分矩阵
Figure 721948DEST_PATH_IMAGE059
,矩阵中元素值
Figure 159882DEST_PATH_IMAGE024
Figure 518183DEST_PATH_IMAGE099
)为用户
Figure 990752DEST_PATH_IMAGE005
对产品
Figure 41885DEST_PATH_IMAGE006
的评分值。如果用户
Figure 967115DEST_PATH_IMAGE005
未对产品
Figure 129107DEST_PATH_IMAGE006
评分,则设为空值。
建立评分矩阵
Figure 412637DEST_PATH_IMAGE059
之后,接下来需要根据用户的评分信息计算社交关联用户之间的评分相似度。即根据用户群
Figure 825164DEST_PATH_IMAGE021
获取其中两两用户之间的社交记录,构建社交矩阵
Figure 790846DEST_PATH_IMAGE026
,矩阵中元素值
Figure 910112DEST_PATH_IMAGE027
为1表示存在社交记录
Figure 99785DEST_PATH_IMAGE100
,为
Figure 937291DEST_PATH_IMAGE101
则表示不存在该社交记录。针对每一条社交记录
Figure 503401DEST_PATH_IMAGE102
,调整
Figure 739823DEST_PATH_IMAGE027
为用户与用户
Figure 425199DEST_PATH_IMAGE012
的评分相似度
Figure 795001DEST_PATH_IMAGE028
。计算
Figure 685596DEST_PATH_IMAGE028
基于各用户对产品集
Figure 420334DEST_PATH_IMAGE022
的评分记录,代表用户对产品集
Figure 29170DEST_PATH_IMAGE022
喜好的相似程度,由公式(3)所示:
Figure 140346DEST_PATH_IMAGE103
               (3)
其中
Figure 151027DEST_PATH_IMAGE104
根据用户
Figure 56666DEST_PATH_IMAGE011
与用户
Figure 28164DEST_PATH_IMAGE012
的评分向量的余弦夹角计算,由公式(4)所示:
Figure 739768DEST_PATH_IMAGE105
       (4)
上式中
Figure 542639DEST_PATH_IMAGE106
表示用户
Figure 681497DEST_PATH_IMAGE011
Figure 199678DEST_PATH_IMAGE012
共同评价过的产品;
Figure 449394DEST_PATH_IMAGE032
Figure 372350DEST_PATH_IMAGE033
分别表示用户
Figure 682109DEST_PATH_IMAGE011
Figure 690516DEST_PATH_IMAGE012
Figure 681606DEST_PATH_IMAGE034
中产品评分的均值。将所有社交矩阵
Figure 521386DEST_PATH_IMAGE026
中有效的矩阵元素处理完毕之后,再对矩阵
Figure 2046DEST_PATH_IMAGE026
的元素按行进行归一化处理,由公式(5)所示:
                      (5)
上式中,若
Figure 89268DEST_PATH_IMAGE108
,则
Figure 721237DEST_PATH_IMAGE109
。调整后的社交矩阵即反映了用户群
Figure 372799DEST_PATH_IMAGE021
中两两用户之间的相互信任程度,同时也反映出给定用户
Figure 355798DEST_PATH_IMAGE005
,用户群中其他关联用户对
Figure 237483DEST_PATH_IMAGE005
的影响程度。
接下来对评分矩阵
Figure 325525DEST_PATH_IMAGE059
中的元素做进一步调整。计算用户群
Figure 527312DEST_PATH_IMAGE021
中每个用户的评分均值和产品集
Figure 726212DEST_PATH_IMAGE022
中每个产品的评分均值。用户评分均值反映该用户的整体评分倾向,如偏高或偏低;产品评分均值反映该产品的综合印象,如偏好或偏差。针对用户
Figure 67195DEST_PATH_IMAGE005
,其评分均值的计算由公式(6)所示:
Figure 18150DEST_PATH_IMAGE110
                       (6)
其中表示产品集
Figure 216230DEST_PATH_IMAGE022
中用户
Figure 583758DEST_PATH_IMAGE005
评价过的所有产品组成的集合,
Figure 559804DEST_PATH_IMAGE112
表示集合中的产品数量。
类似的对每个产品被用户评价的评分均值
Figure 681661DEST_PATH_IMAGE039
,其计算由公式(7)所示:
                      (7)
其中
Figure 683432DEST_PATH_IMAGE114
表示用户群
Figure 699929DEST_PATH_IMAGE021
中评价过产品
Figure 197907DEST_PATH_IMAGE006
的所有用户数量。
最后将评分矩阵
Figure 638728DEST_PATH_IMAGE059
中所有的有效评分值减去
Figure 854946DEST_PATH_IMAGE115
Figure 675134DEST_PATH_IMAGE116
,相当于去除用户评分倾向和产品综合印象,从而准确反映用户对产品的喜好评分,由公式(8)所示:
                                       (8)
本发明方法的第四个模块是采用矩阵分解技术学习用户特征向量和产品特征向量。首先设定用户与产品特征向量的维度。维度
Figure 283467DEST_PATH_IMAGE041
属于可选参数,例如可以设定为15。于是用户
Figure 704084DEST_PATH_IMAGE005
的特征向量可表示为
Figure 114337DEST_PATH_IMAGE042
;产品
Figure 962207DEST_PATH_IMAGE006
的特征向量可表示为
然后设定类权向量
Figure 49429DEST_PATH_IMAGE044
,其中为产品不同子类别的数量。在方法的第三个模块中,根据目标产品类别对信息产品进行过筛选。是指目标产品类别中子类别的数量。例如目标产品类别为“电影”,则子类别可能为“剧情”、“科幻”、“动画”和“战争”等。
接下来对用户
Figure 948749DEST_PATH_IMAGE005
和产品
Figure 711169DEST_PATH_IMAGE006
,分两部分计算用户
Figure 850942DEST_PATH_IMAGE005
对产品的评分预测
Figure 143700DEST_PATH_IMAGE046
。第一部分给定用户的特征向量
Figure 683583DEST_PATH_IMAGE118
,及产品
Figure 309736DEST_PATH_IMAGE006
的特征向量,按矩阵分解技术计算用户
Figure 738761DEST_PATH_IMAGE005
对产品
Figure 832619DEST_PATH_IMAGE006
的评分估值
Figure 629673DEST_PATH_IMAGE120
,即用户特征向量与产品特征向量的内积。第二部分是累加用户的关联用户对产品的评分估值,由公式(9)所示:
Figure 298049DEST_PATH_IMAGE121
                          (9)
上式中
Figure 266005DEST_PATH_IMAGE049
表示社交矩阵
Figure 299820DEST_PATH_IMAGE026
中同用户
Figure 745845DEST_PATH_IMAGE005
相关联的其他用户,即对
Figure 811366DEST_PATH_IMAGE050
,有
Figure 950223DEST_PATH_IMAGE051
Figure 471334DEST_PATH_IMAGE122
是关联用户
Figure 721050DEST_PATH_IMAGE123
对产品
Figure 644006DEST_PATH_IMAGE006
的评分估值,
Figure 953765DEST_PATH_IMAGE124
为矩阵
Figure 962172DEST_PATH_IMAGE026
中用户间归一化后的相似度。
为产品
Figure 273702DEST_PATH_IMAGE006
设定权重
Figure 503826DEST_PATH_IMAGE047
,采用加权平均的方法综合两部分的计算值,得到用户
Figure 360924DEST_PATH_IMAGE005
对产品
Figure 992893DEST_PATH_IMAGE006
的评分预测
Figure 644455DEST_PATH_IMAGE046
,由公式(10)所示:
Figure 627454DEST_PATH_IMAGE048
      (10)
权重
Figure 22663DEST_PATH_IMAGE047
反映用户在对产品评分时,是倾向于自己做决定,还是倾向于了解其他用户对该产品的意见。对于不同类别的产品,用户的倾向性会有所不同。为反映这种情况,本发明方法采用类权向量
Figure 571456DEST_PATH_IMAGE052
协助计算权重
Figure 594252DEST_PATH_IMAGE047
。给定产品
Figure 798968DEST_PATH_IMAGE006
,其归属的子类别用类别向量
Figure 732289DEST_PATH_IMAGE053
表示。
Figure 401168DEST_PATH_IMAGE053
Figure 597794DEST_PATH_IMAGE125
个元素组成的0-1向量,对应类别
Figure 86544DEST_PATH_IMAGE126
的元素为1表示产品属于类别;产品可以同时属于多个类别,例如电影“变形金刚3”同时属于“科幻”和“战争”,于是
Figure 893777DEST_PATH_IMAGE053
中可以有多个值为1的元素。向量
Figure 372163DEST_PATH_IMAGE053
可以按照网站系统对产品的分类信息直接获得。基于类权向量
Figure 750055DEST_PATH_IMAGE052
和向量
Figure 288483DEST_PATH_IMAGE053
,可以为产品
Figure 751826DEST_PATH_IMAGE006
计算权重
Figure 33902DEST_PATH_IMAGE054
,由公式(11)所示:
                      (11)
根据上述模型,令网站系统中一共选择了
Figure 972701DEST_PATH_IMAGE017
个用户和
Figure 188919DEST_PATH_IMAGE019
个产品,产品中包含
Figure 9107DEST_PATH_IMAGE125
个子类别,特征向量的维度为
Figure 361591DEST_PATH_IMAGE127
。则为预测用户对不同产品的评分值,需要学习每个用户
Figure 976243DEST_PATH_IMAGE005
的特征向量
Figure 414178DEST_PATH_IMAGE057
、每个产品的特征向量
Figure 245048DEST_PATH_IMAGE058
、以及类权向量
Figure 296180DEST_PATH_IMAGE052
。一共需要学习的参数数量为
Figure 221411DEST_PATH_IMAGE128
学习这些参数采用极大似然估计方法,基于评分矩阵
Figure 383402DEST_PATH_IMAGE059
中的历史评分,以及社交矩阵
Figure 710478DEST_PATH_IMAGE026
,通过最小化评分预测
Figure 932512DEST_PATH_IMAGE046
和实际评分
Figure 79459DEST_PATH_IMAGE056
的差值估计这些参数的合理值。
首先认定用户
Figure 45141DEST_PATH_IMAGE011
对产品的实际评分
Figure 616730DEST_PATH_IMAGE056
符合高斯分布(即正态分布),由公式(12)所示:
Figure 516553DEST_PATH_IMAGE129
   (12)
认定用户
Figure 20346DEST_PATH_IMAGE011
的特征向量
Figure 56435DEST_PATH_IMAGE057
和产品的特征向量
Figure 741812DEST_PATH_IMAGE058
均符合高斯分布,分别由公式(13)和(14)所示:
Figure 111613DEST_PATH_IMAGE130
                       (13)
                        (14)
其中
Figure 940209DEST_PATH_IMAGE132
表示由
Figure 486728DEST_PATH_IMAGE127
个0组成的一维向量,即
Figure 394641DEST_PATH_IMAGE133
Figure 343005DEST_PATH_IMAGE134
为对角线元素全部为1,而其他元素皆为0的
Figure 2011102989946100002DEST_PATH_IMAGE135
 0-1矩阵。
认定类权向量
Figure 248644DEST_PATH_IMAGE074
符合高斯分布,由公式(15)所示:
                        (15)
其中
Figure 991134DEST_PATH_IMAGE132
表示由个0组成的一维向量。
上述公式(12)~(15)中参数
Figure 198441DEST_PATH_IMAGE062
Figure 516290DEST_PATH_IMAGE063
Figure 969268DEST_PATH_IMAGE064
Figure 954542DEST_PATH_IMAGE065
为方差值,设定为给定值,由后续公式给出其取值设定。
基于评分矩阵
Figure 201984DEST_PATH_IMAGE059
中的历史评分,以及社交矩阵
Figure 7129DEST_PATH_IMAGE026
,可以获得所有用户对所有产品
Figure 837998DEST_PATH_IMAGE022
评分预测的联合概率,由公式(16)所示:
Figure 318658DEST_PATH_IMAGE060
       (16)
最后采用极大似然估计方法,对上述函数取对数,向量
Figure 814362DEST_PATH_IMAGE057
Figure 405880DEST_PATH_IMAGE058
Figure 303429DEST_PATH_IMAGE074
可以通过最小化如下函数学习,由公式(17)所示:
Figure 954990DEST_PATH_IMAGE061
            (17)
其中
Figure 67620DEST_PATH_IMAGE067
Figure 816745DEST_PATH_IMAGE068
。在学习过程中,设定
Figure 639208DEST_PATH_IMAGE069
。给定向量
Figure 843924DEST_PATH_IMAGE042
,式的定义如公式(18)所示:
                      (18)
Figure 642750DEST_PATH_IMAGE071
Figure 334762DEST_PATH_IMAGE072
的定义与
Figure 337353DEST_PATH_IMAGE070
相同。
本发明方法的第五个模块是根据学习到的用户特征向量与产品特征向量,为目标用户推荐其喜好的产品。如图6所示,首先获得用户的特征向量
Figure 962687DEST_PATH_IMAGE057
。然后针对指定产品类别中用户
Figure 141995DEST_PATH_IMAGE011
未评分的所有产品,对其中的每一个产品
Figure 682698DEST_PATH_IMAGE075
,确定产品所属的子类别,按照公式(10)计算用户
Figure 998273DEST_PATH_IMAGE011
对产品的评分预测值
Figure 62361DEST_PATH_IMAGE046
Figure 344438DEST_PATH_IMAGE046
还需要追加用户评分倾向和产品综合印象,由公式(19)所示:
Figure 576836DEST_PATH_IMAGE076
          (19)
对所有待评分产品预测完毕之后,将产品评分预测值排序,挑选其中评分值最高的
Figure 283236DEST_PATH_IMAGE077
个产品(Top-N)推荐给目标用户。
本发明方法的特点是运用了用户的社交关系对产品进行推荐,并根据产品类别自动调整用户社交关系影响的权重。在处理用户对产品的评分信息过程中,本发明方法排除了用户的评分倾向以及产品的综合印象,使得用户对产品的评分服从高斯分布;修正的评分值更加真实反映用户对产品的实际喜好。本发明方法学习过程和推荐过程计算简单,能够快速为目标用户完成个性化产品推荐,有良好的可扩展性和适应性,适于互联网用户的高动态性以及面向海量产品的推荐。

Claims (6)

1.一种基于矩阵分解的互联网信息产品推荐方法,其特征在于包含以下步骤:
1) 获取用户对信息产品的评分记录;
2) 获取用户间社交关系记录;
3) 按照目标用户和目标产品类别构建评分矩阵和社交矩阵;
4) 采用矩阵分解技术学习用户特征向量和产品特征向量;
5) 根据特征向量计算目标用户对不同产品的评分,据以推荐目标用户喜好的产品。
2.根据权利要求1所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤1) 中获取用户对信息产品评分记录的流程是:首先确定一个或多个信息收集网站,收集用户对不同信息产品的评价信息:令                                               
Figure 2011102989946100001DEST_PATH_IMAGE002
表示用户,
Figure 2011102989946100001DEST_PATH_IMAGE004
表示信息产品,
Figure 2011102989946100001DEST_PATH_IMAGE006
表示用户对产品的评分,则一个评分记录可以表示成
Figure 2011102989946100001DEST_PATH_IMAGE008
;然后为每个用户和产品设定唯一标识,如用户标识为,产品标识为
Figure 2011102989946100001DEST_PATH_IMAGE012
,上述记录转换为
Figure 2011102989946100001DEST_PATH_IMAGE014
;最后对评分
Figure 470913DEST_PATH_IMAGE006
做归一化处理,如下式所示:
Figure 2011102989946100001DEST_PATH_IMAGE016
其中
Figure 2011102989946100001DEST_PATH_IMAGE018
表示网站系统中评分的最大值,而
Figure 2011102989946100001DEST_PATH_IMAGE020
表示网站系统中评分的最小值。
3.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤2) 中获取用户间社交关系记录的流程是:首先识别用户在网站系统中的社交关系:朋友关系和关注关系;朋友关系为双向关系,关注关系为单向关系;然后获取各个用户的唯一标识,如用户
Figure 2011102989946100001DEST_PATH_IMAGE022
和用户
Figure 2011102989946100001DEST_PATH_IMAGE024
;接下来将用户间社交关系转换为社交记录:如果用户和用户是朋友关系,则添加社交记录
Figure 2011102989946100001DEST_PATH_IMAGE028
;如果用户
Figure 376049DEST_PATH_IMAGE022
关注用户
Figure 190422DEST_PATH_IMAGE024
,则只添加社交记录
Figure 573736DEST_PATH_IMAGE026
;最后根据社交记录设定社交关系值
Figure 2011102989946100001DEST_PATH_IMAGE030
,如下式所示:
Figure 2011102989946100001DEST_PATH_IMAGE032
4.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤3) 中按照目标用户和目标产品类别构建评分矩阵和社交矩阵的流程是:首先筛选出与目标用户相似的
Figure 2011102989946100001DEST_PATH_IMAGE034
个用户
Figure 2011102989946100001DEST_PATH_IMAGE036
,其中参数
Figure 965403DEST_PATH_IMAGE034
是可选参数;然后根据目标产品类别选择同类别或相似类别的
Figure 2011102989946100001DEST_PATH_IMAGE038
个产品
Figure 2011102989946100001DEST_PATH_IMAGE040
,参数
Figure 226620DEST_PATH_IMAGE038
也是可选参数;接下来获取用户群
Figure 2011102989946100001DEST_PATH_IMAGE042
对产品集
Figure 2011102989946100001DEST_PATH_IMAGE044
的所有评分记录,构建评分矩阵
Figure 2011102989946100001DEST_PATH_IMAGE046
,矩阵中元素值
Figure 2011102989946100001DEST_PATH_IMAGE048
Figure 2011102989946100001DEST_PATH_IMAGE050
)为用户对产品的评分值;如果用户
Figure 393925DEST_PATH_IMAGE010
未对产品
Figure 130936DEST_PATH_IMAGE012
评分,则
Figure 215174DEST_PATH_IMAGE048
设为空值;
下一步根据用户的评分信息计算社交用户之间的评分相似度;根据用户群
Figure 645018DEST_PATH_IMAGE042
中两两用户之间的社交关系值,构建社交矩阵
Figure 2011102989946100001DEST_PATH_IMAGE052
;调整矩阵元素为用户
Figure 948960DEST_PATH_IMAGE022
与用户
Figure 286401DEST_PATH_IMAGE024
的评分相似度
Figure 2011102989946100001DEST_PATH_IMAGE056
,计算公式如下:
Figure 2011102989946100001DEST_PATH_IMAGE060
其中
Figure 2011102989946100001DEST_PATH_IMAGE062
表示用户
Figure 555970DEST_PATH_IMAGE022
Figure 891137DEST_PATH_IMAGE024
共同评价过的产品;
Figure 2011102989946100001DEST_PATH_IMAGE064
Figure 2011102989946100001DEST_PATH_IMAGE066
分别表示用户
Figure 823507DEST_PATH_IMAGE024
Figure 2011102989946100001DEST_PATH_IMAGE068
中产品评分的均值;再对矩阵
Figure 383801DEST_PATH_IMAGE052
的元素按行进行归一化处理,公式如下:
Figure 2011102989946100001DEST_PATH_IMAGE070
     其中若,则
Figure 2011102989946100001DEST_PATH_IMAGE074
最后对
Figure 716300DEST_PATH_IMAGE046
中的元素进行调整:针对每个用户
Figure 729255DEST_PATH_IMAGE010
,计算其评分均值;针对每个产品
Figure 674078DEST_PATH_IMAGE012
,计算其被用户评价的评分均值
Figure 2011102989946100001DEST_PATH_IMAGE078
;调整评分矩阵
Figure 88878DEST_PATH_IMAGE046
中的所有元素,公式如下:
Figure 2011102989946100001DEST_PATH_IMAGE080
该处理相当于去除用户评分倾向和产品综合印象。
5.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤4) 中采用矩阵分解技术学习用户特征向量和产品特征向量的流程是:首先设定用户与产品特征向量的维度
Figure 2011102989946100001DEST_PATH_IMAGE082
,维度
Figure 595208DEST_PATH_IMAGE082
属于可选参数;用户的特征向量表示为
Figure 2011102989946100001DEST_PATH_IMAGE084
;产品
Figure 516077DEST_PATH_IMAGE012
的特征向量表示为;然后设定类权向量
Figure 2011102989946100001DEST_PATH_IMAGE088
,其中
Figure 2011102989946100001DEST_PATH_IMAGE090
为目标产品类别中子类别的数量;
接下来计算用户
Figure 113280DEST_PATH_IMAGE010
对产品
Figure 787582DEST_PATH_IMAGE012
的评分预测
Figure 2011102989946100001DEST_PATH_IMAGE092
:分两部分,其一是用户和产品特征向量的内积;其二是累加社交关联用户的评分值;采用权重
Figure 2011102989946100001DEST_PATH_IMAGE094
综合两部分的计算值,公式如下:
 
其中
Figure 2011102989946100001DEST_PATH_IMAGE098
表示社交矩阵
Figure 837446DEST_PATH_IMAGE052
中同用户相关的其他用户,即对
Figure 2011102989946100001DEST_PATH_IMAGE100
,有;符号
Figure 2011102989946100001DEST_PATH_IMAGE104
表示向量的转置;
计算权重
Figure 749350DEST_PATH_IMAGE094
需要类权向量
Figure 2011102989946100001DEST_PATH_IMAGE106
;确定产品
Figure 96017DEST_PATH_IMAGE012
所属的子类别,将子类别对应的元素置1,其他元素置0,形成
Figure 508544DEST_PATH_IMAGE012
的类别向量
Figure 2011102989946100001DEST_PATH_IMAGE108
;再根据以下公式计算权重
Figure 2011102989946100001DEST_PATH_IMAGE110
Figure 2011102989946100001DEST_PATH_IMAGE112
下一步采用极大似然估计方法,通过最小化评分预测
Figure 661177DEST_PATH_IMAGE092
和实际评分
Figure 2011102989946100001DEST_PATH_IMAGE114
的差值学习每个用户
Figure 403612DEST_PATH_IMAGE010
的特征向量
Figure 2011102989946100001DEST_PATH_IMAGE116
、每个产品
Figure 655601DEST_PATH_IMAGE012
的特征向量、以及类权向量
Figure 555424DEST_PATH_IMAGE106
;基于评分矩阵
Figure 183852DEST_PATH_IMAGE046
中的历史评分,以及社交矩阵
Figure 485520DEST_PATH_IMAGE052
,获得所有用户
Figure 908411DEST_PATH_IMAGE042
对所有产品
Figure 295530DEST_PATH_IMAGE044
评分预测的联合概率,公式如下:
Figure 2011102989946100001DEST_PATH_IMAGE120
通过对联合概率函数取对数,获得如下函数:
Figure 2011102989946100001DEST_PATH_IMAGE122
其中参数
Figure 2011102989946100001DEST_PATH_IMAGE124
Figure 2011102989946100001DEST_PATH_IMAGE126
Figure 2011102989946100001DEST_PATH_IMAGE128
Figure 2011102989946100001DEST_PATH_IMAGE130
为方差值,
Figure 2011102989946100001DEST_PATH_IMAGE134
Figure 2011102989946100001DEST_PATH_IMAGE136
;设定
Figure 2011102989946100001DEST_PATH_IMAGE138
;给定向量
Figure 62670DEST_PATH_IMAGE084
,式
Figure 2011102989946100001DEST_PATH_IMAGE140
定义如下:
Figure 2011102989946100001DEST_PATH_IMAGE142
     ,式
Figure 2011102989946100001DEST_PATH_IMAGE144
定义与
Figure 766315DEST_PATH_IMAGE140
相同;
最后采用极大似然估计方法,通过最小化上述函数学习向量
Figure 625687DEST_PATH_IMAGE116
Figure 234523DEST_PATH_IMAGE118
6.根据权利要求1或2所述的基于矩阵分解的互联网信息产品推荐方法,其特征在于步骤5) 中为目标用户推荐产品的流程是:首先获得用户
Figure 31184DEST_PATH_IMAGE022
的特征向量
Figure 104182DEST_PATH_IMAGE116
;然后获取指定产品类别中用户
Figure 134455DEST_PATH_IMAGE022
未评分的所有产品,针对其中每一个产品
Figure 2011102989946100001DEST_PATH_IMAGE150
,计算用户
Figure 794369DEST_PATH_IMAGE022
对产品
Figure 568290DEST_PATH_IMAGE150
的评分预测值
Figure 495795DEST_PATH_IMAGE092
,其中追加用户评分倾向和产品综合印象,公式如下:
Figure 2011102989946100001DEST_PATH_IMAGE152
对所有待评分产品预测完毕之后,将产品评分预测值排序,挑选其中评分值最高的
Figure 2011102989946100001DEST_PATH_IMAGE154
个产品推荐给目标用户。
CN2011102989946A 2011-09-29 2011-09-29 一种基于矩阵分解的互联网信息产品推荐方法 Pending CN102426686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102989946A CN102426686A (zh) 2011-09-29 2011-09-29 一种基于矩阵分解的互联网信息产品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102989946A CN102426686A (zh) 2011-09-29 2011-09-29 一种基于矩阵分解的互联网信息产品推荐方法

Publications (1)

Publication Number Publication Date
CN102426686A true CN102426686A (zh) 2012-04-25

Family

ID=45960665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102989946A Pending CN102426686A (zh) 2011-09-29 2011-09-29 一种基于矩阵分解的互联网信息产品推荐方法

Country Status (1)

Country Link
CN (1) CN102426686A (zh)

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722838A (zh) * 2012-05-25 2012-10-10 北京邮电大学 用于网站向用户推荐物品的方法和装置
CN102799623A (zh) * 2012-06-21 2012-11-28 杜小勇 信息推送方法
CN103514239A (zh) * 2012-11-26 2014-01-15 Tcl美国研究所 一种集成用户行为和物品内容的推荐方法及系统
CN103530304A (zh) * 2013-05-10 2014-01-22 Tcl集团股份有限公司 基于自适应分布式计算的在线推荐方法、系统和移动终端
CN103559623A (zh) * 2013-09-24 2014-02-05 浙江大学 一种基于联合非负矩阵分解的个性化产品推荐方法
CN103888852A (zh) * 2014-03-24 2014-06-25 清华大学 用于社交电视的视频推荐方法和装置
CN104156436A (zh) * 2014-08-13 2014-11-19 福州大学 一种社交云媒体协同过滤推荐方法
CN104317959A (zh) * 2014-11-10 2015-01-28 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
CN104699711A (zh) * 2013-12-09 2015-06-10 华为技术有限公司 一种推荐方法及服务器
WO2015081915A1 (zh) * 2013-12-05 2015-06-11 腾讯科技(深圳)有限公司 文件推荐方法和装置
CN104778173A (zh) * 2014-01-10 2015-07-15 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
CN104809132A (zh) * 2014-01-27 2015-07-29 阿里巴巴集团控股有限公司 一种获取网络主体社交关系类型的方法及装置
CN104463630B (zh) * 2014-12-11 2015-08-26 新一站保险代理有限公司 一种基于网购保险产品特性的产品推荐方法及系统
CN104933082A (zh) * 2014-03-21 2015-09-23 华为技术有限公司 评价信息处理方法及其装置
CN105183867A (zh) * 2015-09-16 2015-12-23 那彦琳 数据处理方法及装置
CN105335368A (zh) * 2014-06-06 2016-02-17 阿里巴巴集团控股有限公司 一种产品聚类方法及装置
CN105976220A (zh) * 2016-04-25 2016-09-28 合肥工业大学 基于项目使用次数的矩阵分解推荐方法
CN106484777A (zh) * 2016-09-12 2017-03-08 腾讯科技(深圳)有限公司 一种多媒体数据处理方法以及装置
CN106537376A (zh) * 2014-06-06 2017-03-22 诺基亚技术有限公司 通过应用有效的自适应矩阵分解进行推荐的方法和装置
CN106528643A (zh) * 2016-10-13 2017-03-22 上海师范大学 一种基于社交网络的多维度综合推荐方法
CN106649657A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 面向社交网络基于张量分解的上下文感知推荐系统及方法
CN106997381A (zh) * 2017-03-21 2017-08-01 海信集团有限公司 向目标用户推荐影视的方法及装置
CN107239993A (zh) * 2017-05-24 2017-10-10 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN107563833A (zh) * 2017-07-27 2018-01-09 广州智慧城市发展研究院 一种基于区块链积分服务平台的个性化推荐方法及系统
CN107730289A (zh) * 2016-08-11 2018-02-23 株式会社理光 一种用户行为分析方法及用户行为分析装置
CN107767227A (zh) * 2017-10-31 2018-03-06 深圳春沐源控股有限公司 网上商城的商品推荐方法、商品推荐系统
CN107862022A (zh) * 2017-10-31 2018-03-30 中国科学院自动化研究所 文化资源推荐系统
CN107967627A (zh) * 2017-12-05 2018-04-27 北京工业大学 一种基于内容的线性回归理财产品推荐方法
CN108108453A (zh) * 2017-12-28 2018-06-01 北京奇虎科技有限公司 应用信息的推荐方法及装置
CN108139887A (zh) * 2015-10-22 2018-06-08 国际商业机器公司 跨硬件加速器并行化矩阵分解
CN108280548A (zh) * 2018-01-23 2018-07-13 成都信达智胜科技有限公司 基于网络传输的智能处理方法
CN108376152A (zh) * 2018-02-02 2018-08-07 西北工业大学 一种基于矩阵分解的工作者推荐方法
CN108388554A (zh) * 2018-01-04 2018-08-10 中国科学院自动化研究所 基于协同过滤注意力机制的文本情感识别系统
CN109034941A (zh) * 2018-06-13 2018-12-18 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109087130A (zh) * 2018-07-17 2018-12-25 深圳先进技术研究院 一种基于注意力机制的推荐系统及推荐方法
CN109284417A (zh) * 2018-08-27 2019-01-29 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质
CN109766188A (zh) * 2019-01-14 2019-05-17 长春理工大学 一种负载均衡调度方法及系统
CN109886787A (zh) * 2019-02-22 2019-06-14 清华大学 离散社交推荐方法及系统
CN109934684A (zh) * 2019-03-20 2019-06-25 上海证大喜马拉雅网络科技有限公司 一种商品推荐方法、装置、终端及存储介质
CN110059261A (zh) * 2019-03-18 2019-07-26 智者四海(北京)技术有限公司 内容推荐方法及装置
CN110543597A (zh) * 2019-08-30 2019-12-06 北京奇艺世纪科技有限公司 一种评分确定方法、装置及电子设备
CN110879841A (zh) * 2018-09-05 2020-03-13 广州视源电子科技股份有限公司 知识条目推荐方法、装置、计算机设备和存储介质
CN110968771A (zh) * 2018-09-29 2020-04-07 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统
CN111523005A (zh) * 2019-02-02 2020-08-11 北京嘀嘀无限科技发展有限公司 网约用户分析方法、装置及电子设备
CN111681084A (zh) * 2020-06-09 2020-09-18 南京邮电大学 一种基于社交关系影响因素的电商平台推荐方法
CN111768218A (zh) * 2019-04-15 2020-10-13 北京沃东天骏信息技术有限公司 用于处理用户交互信息的方法和装置
CN112418956A (zh) * 2020-12-16 2021-02-26 国网雄安金融科技集团有限公司 一种金融产品的推荐方法及装置
CN112435079A (zh) * 2020-12-16 2021-03-02 合肥工业大学 一种面向纯社交平台的广告推荐方法
CN114581161A (zh) * 2022-05-06 2022-06-03 深圳市明珞锋科技有限责任公司 一种基于深度学习的信息推送方法和系统
CN115841367A (zh) * 2023-01-03 2023-03-24 四川特号商盟科技有限公司 一种基于用户睡眠行为的产品推荐方法
CN117033798A (zh) * 2023-09-06 2023-11-10 杭州赢势通科技有限公司 一种音乐推荐方法和音乐播放器
CN111768218B (zh) * 2019-04-15 2024-06-21 北京沃东天骏信息技术有限公司 用于处理用户交互信息的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271558A (zh) * 2008-05-16 2008-09-24 华东师范大学 基于上下文信息的多策略商品推荐系统
US20100262658A1 (en) * 2009-04-10 2010-10-14 Accenture Global Services Gmbh System for transmitting an electronic recommendation
CN102073717A (zh) * 2011-01-07 2011-05-25 南京大学 一种面向垂直电子商务网站的首页推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271558A (zh) * 2008-05-16 2008-09-24 华东师范大学 基于上下文信息的多策略商品推荐系统
US20100262658A1 (en) * 2009-04-10 2010-10-14 Accenture Global Services Gmbh System for transmitting an electronic recommendation
CN102073717A (zh) * 2011-01-07 2011-05-25 南京大学 一种面向垂直电子商务网站的首页推荐方法

Cited By (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722838A (zh) * 2012-05-25 2012-10-10 北京邮电大学 用于网站向用户推荐物品的方法和装置
CN102799623B (zh) * 2012-06-21 2015-07-22 杜小勇 信息推送方法
CN102799623A (zh) * 2012-06-21 2012-11-28 杜小勇 信息推送方法
CN103514239A (zh) * 2012-11-26 2014-01-15 Tcl美国研究所 一种集成用户行为和物品内容的推荐方法及系统
CN103514239B (zh) * 2012-11-26 2016-12-21 Tcl美国研究所 一种集成用户行为和物品内容的推荐方法及系统
CN103530304A (zh) * 2013-05-10 2014-01-22 Tcl集团股份有限公司 基于自适应分布式计算的在线推荐方法、系统和移动终端
CN103530304B (zh) * 2013-05-10 2017-05-10 Tcl集团股份有限公司 基于自适应分布式计算的在线推荐方法、系统和移动终端
CN103559623A (zh) * 2013-09-24 2014-02-05 浙江大学 一种基于联合非负矩阵分解的个性化产品推荐方法
WO2015081915A1 (zh) * 2013-12-05 2015-06-11 腾讯科技(深圳)有限公司 文件推荐方法和装置
US9930419B2 (en) 2013-12-05 2018-03-27 Tencent Technology (Shenzhen) Company Limited File recommendation method and device
CN104699711A (zh) * 2013-12-09 2015-06-10 华为技术有限公司 一种推荐方法及服务器
CN104699711B (zh) * 2013-12-09 2019-05-28 华为技术有限公司 一种推荐方法及服务器
CN104778173A (zh) * 2014-01-10 2015-07-15 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
WO2015103964A1 (en) * 2014-01-10 2015-07-16 Tencent Technology (Shenzhen) Company Limited Method, apparatus, and device for determining target user
CN104778173B (zh) * 2014-01-10 2020-01-10 腾讯科技(深圳)有限公司 目标用户确定方法、装置及设备
CN104809132A (zh) * 2014-01-27 2015-07-29 阿里巴巴集团控股有限公司 一种获取网络主体社交关系类型的方法及装置
CN104809132B (zh) * 2014-01-27 2018-07-31 阿里巴巴集团控股有限公司 一种获取网络主体社交关系类型的方法及装置
CN104933082A (zh) * 2014-03-21 2015-09-23 华为技术有限公司 评价信息处理方法及其装置
CN104933082B (zh) * 2014-03-21 2019-05-03 华为技术有限公司 评价信息处理方法及其装置
CN103888852B (zh) * 2014-03-24 2017-05-31 清华大学 用于社交电视的视频推荐方法和装置
CN103888852A (zh) * 2014-03-24 2014-06-25 清华大学 用于社交电视的视频推荐方法和装置
CN105335368B (zh) * 2014-06-06 2018-11-16 阿里巴巴集团控股有限公司 一种产品聚类方法及装置
CN106537376A (zh) * 2014-06-06 2017-03-22 诺基亚技术有限公司 通过应用有效的自适应矩阵分解进行推荐的方法和装置
CN105335368A (zh) * 2014-06-06 2016-02-17 阿里巴巴集团控股有限公司 一种产品聚类方法及装置
CN104156436A (zh) * 2014-08-13 2014-11-19 福州大学 一种社交云媒体协同过滤推荐方法
CN104156436B (zh) * 2014-08-13 2017-05-10 福州大学 一种社交云媒体协同过滤推荐方法
CN104317959B (zh) * 2014-11-10 2018-07-17 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
CN104317959A (zh) * 2014-11-10 2015-01-28 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
US10360230B2 (en) 2014-11-10 2019-07-23 Beijing Bytedance Network Technology Co., Ltd. Method and device for social platform-based data mining
CN104463630B (zh) * 2014-12-11 2015-08-26 新一站保险代理有限公司 一种基于网购保险产品特性的产品推荐方法及系统
CN105183867B (zh) * 2015-09-16 2020-01-07 那彦琳 数据处理方法及装置
CN105183867A (zh) * 2015-09-16 2015-12-23 那彦琳 数据处理方法及装置
CN108139887A (zh) * 2015-10-22 2018-06-08 国际商业机器公司 跨硬件加速器并行化矩阵分解
CN105976220A (zh) * 2016-04-25 2016-09-28 合肥工业大学 基于项目使用次数的矩阵分解推荐方法
CN105976220B (zh) * 2016-04-25 2017-05-17 合肥工业大学 基于项目使用次数的矩阵分解推荐方法
CN107730289A (zh) * 2016-08-11 2018-02-23 株式会社理光 一种用户行为分析方法及用户行为分析装置
CN106484777A (zh) * 2016-09-12 2017-03-08 腾讯科技(深圳)有限公司 一种多媒体数据处理方法以及装置
CN106528643A (zh) * 2016-10-13 2017-03-22 上海师范大学 一种基于社交网络的多维度综合推荐方法
CN106649657A (zh) * 2016-12-13 2017-05-10 重庆邮电大学 面向社交网络基于张量分解的上下文感知推荐系统及方法
CN106649657B (zh) * 2016-12-13 2020-11-17 重庆邮电大学 面向社交网络基于张量分解的上下文感知推荐系统及方法
CN106997381B (zh) * 2017-03-21 2021-03-09 海信集团有限公司 向目标用户推荐影视的方法及装置
CN106997381A (zh) * 2017-03-21 2017-08-01 海信集团有限公司 向目标用户推荐影视的方法及装置
CN107239993A (zh) * 2017-05-24 2017-10-10 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN107239993B (zh) * 2017-05-24 2020-11-24 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN107563833A (zh) * 2017-07-27 2018-01-09 广州智慧城市发展研究院 一种基于区块链积分服务平台的个性化推荐方法及系统
CN107767227A (zh) * 2017-10-31 2018-03-06 深圳春沐源控股有限公司 网上商城的商品推荐方法、商品推荐系统
CN107862022B (zh) * 2017-10-31 2020-12-11 中国科学院自动化研究所 文化资源推荐系统
CN107862022A (zh) * 2017-10-31 2018-03-30 中国科学院自动化研究所 文化资源推荐系统
CN107967627A (zh) * 2017-12-05 2018-04-27 北京工业大学 一种基于内容的线性回归理财产品推荐方法
CN108108453A (zh) * 2017-12-28 2018-06-01 北京奇虎科技有限公司 应用信息的推荐方法及装置
CN108388554B (zh) * 2018-01-04 2021-09-28 中国科学院自动化研究所 基于协同过滤注意力机制的文本情感识别系统
CN108388554A (zh) * 2018-01-04 2018-08-10 中国科学院自动化研究所 基于协同过滤注意力机制的文本情感识别系统
CN108280548A (zh) * 2018-01-23 2018-07-13 成都信达智胜科技有限公司 基于网络传输的智能处理方法
CN108376152A (zh) * 2018-02-02 2018-08-07 西北工业大学 一种基于矩阵分解的工作者推荐方法
CN109034941B (zh) * 2018-06-13 2023-03-31 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
WO2019237569A1 (zh) * 2018-06-13 2019-12-19 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109034941A (zh) * 2018-06-13 2018-12-18 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109087130A (zh) * 2018-07-17 2018-12-25 深圳先进技术研究院 一种基于注意力机制的推荐系统及推荐方法
CN109284417B (zh) * 2018-08-27 2022-11-22 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质
CN109284417A (zh) * 2018-08-27 2019-01-29 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质
CN110879841A (zh) * 2018-09-05 2020-03-13 广州视源电子科技股份有限公司 知识条目推荐方法、装置、计算机设备和存储介质
CN110879841B (zh) * 2018-09-05 2024-05-10 广州视源电子科技股份有限公司 知识条目推荐方法、装置、计算机设备和存储介质
CN110968771A (zh) * 2018-09-29 2020-04-07 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统
CN110968771B (zh) * 2018-09-29 2024-05-28 北京淘友天下技术有限公司 一种基于朋友关系的职位推荐冷启动方法及系统
CN109766188A (zh) * 2019-01-14 2019-05-17 长春理工大学 一种负载均衡调度方法及系统
CN109766188B (zh) * 2019-01-14 2020-12-08 长春理工大学 一种负载均衡调度方法及系统
CN111523005A (zh) * 2019-02-02 2020-08-11 北京嘀嘀无限科技发展有限公司 网约用户分析方法、装置及电子设备
CN109886787A (zh) * 2019-02-22 2019-06-14 清华大学 离散社交推荐方法及系统
CN110059261A (zh) * 2019-03-18 2019-07-26 智者四海(北京)技术有限公司 内容推荐方法及装置
CN109934684A (zh) * 2019-03-20 2019-06-25 上海证大喜马拉雅网络科技有限公司 一种商品推荐方法、装置、终端及存储介质
CN111768218A (zh) * 2019-04-15 2020-10-13 北京沃东天骏信息技术有限公司 用于处理用户交互信息的方法和装置
CN111768218B (zh) * 2019-04-15 2024-06-21 北京沃东天骏信息技术有限公司 用于处理用户交互信息的方法和装置
CN110543597A (zh) * 2019-08-30 2019-12-06 北京奇艺世纪科技有限公司 一种评分确定方法、装置及电子设备
CN111681084B (zh) * 2020-06-09 2022-09-06 南京邮电大学 一种基于社交关系影响因素的电商平台推荐方法
CN111681084A (zh) * 2020-06-09 2020-09-18 南京邮电大学 一种基于社交关系影响因素的电商平台推荐方法
CN112418956A (zh) * 2020-12-16 2021-02-26 国网雄安金融科技集团有限公司 一种金融产品的推荐方法及装置
CN112435079B (zh) * 2020-12-16 2022-09-16 合肥工业大学 一种面向纯社交平台的广告推荐方法
CN112435079A (zh) * 2020-12-16 2021-03-02 合肥工业大学 一种面向纯社交平台的广告推荐方法
CN114581161A (zh) * 2022-05-06 2022-06-03 深圳市明珞锋科技有限责任公司 一种基于深度学习的信息推送方法和系统
CN115841367A (zh) * 2023-01-03 2023-03-24 四川特号商盟科技有限公司 一种基于用户睡眠行为的产品推荐方法
CN115841367B (zh) * 2023-01-03 2023-12-29 四川特号商盟科技有限公司 一种基于用户睡眠行为的产品推荐方法
CN117033798A (zh) * 2023-09-06 2023-11-10 杭州赢势通科技有限公司 一种音乐推荐方法和音乐播放器
CN117033798B (zh) * 2023-09-06 2024-01-26 杭州赢势通科技有限公司 一种音乐推荐方法和音乐播放器

Similar Documents

Publication Publication Date Title
CN102426686A (zh) 一种基于矩阵分解的互联网信息产品推荐方法
Bag et al. An integrated recommender system for improved accuracy and aggregate diversity
Li et al. A social recommender mechanism for e-commerce: Combining similarity, trust, and relationship
Jannach et al. What recommenders recommend: an analysis of recommendation biases and possible countermeasures
Jiang et al. Social contextual recommendation
Huang Designing utility-based recommender systems for e-commerce: Evaluation of preference-elicitation methods
CN103678518B (zh) 一种推荐列表调整方法和装置
Zhang et al. An improved hybrid collaborative filtering algorithm based on tags and time factor
Shih et al. Hybrid recommendation approaches: collaborative filtering via valuable content information
Lai et al. Novel personal and group-based trust models in collaborative filtering for document recommendation
US8626604B1 (en) Aggregating product endorsement information
CN103745100A (zh) 一种基于项目的混合显性隐性反馈的协同过滤推荐算法
CN108595493A (zh) 媒体内容的推送方法和装置、存储介质、电子装置
CN107025311A (zh) 一种基于k近邻的贝叶斯个性化推荐方法及装置
Ambulgekar et al. A survey on collaborative filtering: tasks, approaches and applications
CN109446402B (zh) 一种搜索方法及装置
CN106202151A (zh) 一种用于提高个性化推荐系统多样性的方法
CN109063120A (zh) 一种基于聚类的协同过滤推荐方法和装置
Ebrahimi et al. Personalized recommender system based on social relations
CN111143700B (zh) 一种活动推荐方法、装置、服务器及计算机存储介质
Jiang et al. Evaluation metrics for personalized recommendation systems
Huang et al. Improved collaborative filtering personalized recommendation algorithm based on k-means clustering and weighted similarity on the reduced item space
Wang et al. Predicting the incremental benefits of online information search for heterogeneous consumers
Regi et al. A survey on recommendation techniques in E-Commerce
CN109522477B (zh) 资源受限的o2o服务组合推荐方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120425