CN102750336B - 一种基于用户关联性的资源个性化推荐方法 - Google Patents

一种基于用户关联性的资源个性化推荐方法 Download PDF

Info

Publication number
CN102750336B
CN102750336B CN201210179907.XA CN201210179907A CN102750336B CN 102750336 B CN102750336 B CN 102750336B CN 201210179907 A CN201210179907 A CN 201210179907A CN 102750336 B CN102750336 B CN 102750336B
Authority
CN
China
Prior art keywords
targeted customer
user
resource
scoring
frequent set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210179907.XA
Other languages
English (en)
Other versions
CN102750336A (zh
Inventor
孙健
艾丽丽
谢发川
隆克平
周伟强
李江华
王雁峰
林威
黎焯泓
唐明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201210179907.XA priority Critical patent/CN102750336B/zh
Publication of CN102750336A publication Critical patent/CN102750336A/zh
Application granted granted Critical
Publication of CN102750336B publication Critical patent/CN102750336B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于用户关联性的资源个性化推荐方法,首先利用用户关联规则挖掘技术分析用户对资源的历史评分记录,挖掘出目标用户频繁集;然后选取项集中项数最多,其次支持度最高的一个目标用户频繁集,用于构建目标用户兴趣相似组;接着将目标用户兴趣相似组用户对资源的历史评分输入到Slope One算法中作为核心数据,对目标用户未访问资源进行评分预测。最后将评分预测值大于阈值的目标用户未访问资源,按照评分预测值大小推荐给目标用户。由于Slope One算法进行目标用户未访问资源评分预测过程中,使用与目标用户兴趣相似的用户进行预测,既降低了目标用户评分矩阵维度和中间计算的数据量,又提高了评分预测准确率。

Description

一种基于用户关联性的资源个性化推荐方法
技术领域
本发明属于网络应用个性化推荐技术领域,具体来讲,涉及一种基于用户关联性的资源个性化推荐方法。
背景技术
随着互联网的迅速发展,网络中的信息资源越来越丰富,使得人们从曾经苦恼于资源的匮乏,演变成资源过载的烦恼。面对海量的资源信息,用户往往难以发现最适合或自己最感兴趣的资源。因此,为了解决这种从海量资源中获取用户偏好信息的问题,资源个性化推荐系统被广泛应用到各大商务网站中。
协同过滤是目前应用最广泛和最成功的个性化推荐系统。它旨在根据目标用户的最近邻居对某个资源的评分逼近目标用户对该资源的评分。但是,随着网站规模的扩大,用户数目和资源数据量的急剧增加,使得用户评分矩阵极端稀疏。通过传统的协同过滤方法进行推荐会导致用户最近邻居计算准确性降低,推荐系统的资源推荐质量急剧下降。
Slope One是一种新颖的协同过滤方法,它能一定程度上克服传统协同过滤中用户评分数据极端稀疏的问题,因为Slope One对于新用户在数据量上要求较低。它旨在根据其他用户对资源的评分情况来预测目标用户的评分。另外,SlopeOne非常的轻量级,易于实现,能及时跟进推荐系统中的数据更新并提供新的预测值,但它存在以下缺点:
1、实际业务系统中,因资源及用户数据量过大使得通过Slope One构建的目标用户评分矩阵维度非常高,计算数据量庞大。
2、Slope One通过一种“普遍平均”的思想对目标用户进行评分预测,但这种“普遍平均”磨灭了用户个性化,评分预测准确率不高,影响资源推荐质量。
发明内容
本发明的目的在于克服现有技术不足,提供一种基于用户关联性的资源个性化推荐方法,以降低目标用户评分矩阵维度和中间计算的数据量,同时提高评分预测准确率,进而使得资源推荐质量得以提升。
为实现上述发明目的,本发明基于用户关联性的资源个性化推荐方法,其特征在于,包括以下步骤:
(1)、分析并挖掘出目标用户频繁集
将用户对资源的历史评分记录作为数据源,利用用户关联规则分析并挖掘出多个支持度达到要求的目标用户频繁集;
其中,用户关联规则是指目标用户与其他用户对一个或多个资源都进行了评分,目标用户与其他用户都进行了评分的资源数量为支持度;
目标用户频繁集包括由目标用户与其他用户组成的项集以及支持度;
(2)、构建目标用户兴趣相似组
在挖掘出的多个目标用户频繁集中,选取项集中项数,即用户数量最多的目标用户频繁集;如果选取的目标用户频繁集有多个,则进一步选取支持度最高的一个目标用户频繁集,用于构建目标用户兴趣相似组;
选出的目标用户频繁集项集中的用户作为目标用户兴趣相似组;
(3)、用Slope One算法进行预测评分
将目标用户兴趣相似组用户对资源的历史评分输入到Slope One算法中作为核心数据,对目标用户未访问资源进行评分预测;
(4)、推荐资源给目标用户
将评分预测值大于阈值的目标用户未访问资源,按照评分预测值大小推荐给目标用户。
本发明的发明目的是这样实现的:
本发明基于用户关联性的资源个性化推荐方法,首先利用用户关联规则挖掘技术分析用户对资源的历史评分记录,挖掘出目标用户频繁集;然后选取项集中项数,即用户数量最多的目标用户频繁集;如果选取的目标用户频繁集有多个,则进一步选取支持度最高的一个目标用户频繁集,用于构建目标用户兴趣相似组;接着将目标用户兴趣相似组用户对资源的历史评分输入到Slope One算法中作为核心数据,对目标用户未访问资源进行评分预测。最后将评分预测值大于阈值的目标用户未访问资源,按照评分预测值大小推荐给目标用户。由于Slope One算法进行目标用户未访问资源评分预测过程中,使用与目标用户兴趣相似的用户进行预测,既降低了目标用户评分矩阵维度和中间计算的数据量,又提高了评分预测准确率。
附图说明
图1是本发明基于用户关联性的资源个性化推荐方法一具体实施方式的原理框图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于用户关联性的资源个性化推荐方法一具体实施方式的原理框图。
在本实施例中,如图1所示,基于用户关联性的资源个性化推荐方法包括以下四个部分:
(1)、相似用户挖掘,即分析并挖掘出目标用户频繁集
将用户对资源的历史评分记录作为数据源,利用用户关联规则分析并挖掘出多个支持度达到要求的目标用户频繁集;
其中,用户关联规则是指目标用户与其他用户对一个或多个资源都进行了评分,目标用户与其他用户都进行了评分的资源数量为支持度;
目标用户频繁集包括由目标用户与其他用户组成的项集以及支持度;
(2)、相似用户选取,即构建目标用户兴趣相似组
在挖掘出的多个目标用户频繁集中,选取项集中项数,即用户数量最多的目标用户频繁集;如果选取的目标用户频繁集有多个,则进一步选取支持度最高的一个目标用户频繁集,用于构建目标用户兴趣相似组;
选出的目标用户频繁集项集中的用户作为目标用户兴趣相似组;
(3)、评分预测,即用Slope One算法进行预测评分
将目标用户兴趣相似组用户对资源的历史评分输入到Slope One算法中作为核心数据,对目标用户未访问资源进行评分预测;
(4)、资源推荐,即推荐资源给目标用户
将评分预测值大于阈值的目标用户未访问资源,按照评分预测值大小推荐给目标用户。
在本实施例中,采用Apriori关联规则挖掘算法,得到目标用户频繁集。
Apriori算法是一种逐层搜索的迭代方法,用项集项数为k的目标用户频繁集用于搜索项集项数为k+1的目标用户频繁集。
首先扫描用户对资源的历史评分记录数据库,逐个收集与目标用户都对相同资源进行了评分的其他一个用户,并记录下目标用户与该其他用户都进行了评分的资源数量,得到多个项集项数为2的目标用户频繁集;然后,在得到的多个项集项数为2的目标用户频繁集基础上,搜索与目标用户都对相同资源进行了评分的其他两个用户,并记录下目标用户与该其他两个用户都进行了评分的资源数量,得到一个或多个项集项数为3的目标用户频繁集;依次类推,增加其他用户数量,直到找不到它们都对满足支持度的相同资源进行了评分为止。
实例
下面一个精简的实例对本发明进行说明。
在本实例中,资源为视频资源,评分为用户观看后对视频资源的打分。
用户对视频资源的历史评分记录构成一个数据库,该数据库为5个用户对4个视频资源的历史评分数据,具体如表1所示:
表1
在本实例中,如表1所示,用户集:{U1,U2,U3,U4,U5},评分集范围:{1,2,3,4,5}。表1中,Null表示该用户未对相应视频资源进行评分,没有访问过相应视频资源。
1、利用用户关联规则分析并挖掘出目标用户频繁集
在本实例中,首先需要对用户对资源的历史评分记录做预处理,只有用户评分值大于等于3分的评分才进行关联规则分析和挖掘,即只有评分值大于等于3分才认为用户观看过该视频资源并对用户的关联性具有正面的作用,低于3分的忽略不计。
为方便起见,将以用户为ID的事务数据转换为以视频资源为ID的事务数据。由此将表1用户历史评分数据库转换为表2用户观看历史数据库如下。
表2
在转换过程中,将视频资源用户评分大于等于3的标记为1,低于3的标记为空。
在本实例中,U1为目标用户。于是扫描表2用户观看历史数据库,采用Apriori算法逐层搜索迭代方法,积累每个目标用户与其他用户的观看资源计数,并收集满足最小支持度为2目标用户频繁集,如表3所示。
  项集   支持度
  {U1,U2}   2
  {U1,U3}   2
  {U1,U5}   3
表3
在本实例中,如表2、表3所示,目标用户U1与其他用户U2都进行了评分的视频资源为a、c,支持度达到2的要求,因此,构成一个项集为{U1,U2}、支持度为2的目标用户频繁集。同理,目标用户U1与其他用户U3都进行了评分的视频资源为a、d,支持度达到2的要求,构成一个项集为{U1,U3}、支持度为2的目标用户频繁集;目标用户U1与其他用户U5都进行了评分的视频资源为a、c、d,支持度达到3的要求,构成一个项集为{U1,U5}、支持度为3的目标用户频繁集。
而目标用户U1与其他用户U4都进行了评分的视频资源为c,支持度为1,达不到要求,就不能构成目标用户频繁集。
在得到的三个项集项数为2的目标用户频繁集,如表3所示的基础上,搜索与目标用户都对相同资源进行了评分的其他两个用户,并记录下目标用户与该其他两个用户都进行了评分的资源数量,得到两个项集项数为3的目标用户频繁集,如表4所示。
  项集   支持度
  {U1,U2,U5}   2
  {U1,U3,U5}   2
表4
在本实例中,如表2、3、4所示,在U1,U2的基础上,在三个项集项数为2的目标用户频繁集寻找另一其他用户,在本实例中,其他用户有U3,U5,然而,只有其他用户U5与U1,U2对视频资源a、c都进行了评分,因此,构成一个项集为{U1,U2,U5}、支持度为2的目标用户频繁集;同理,在在U1,U3的基础上,在三个项集项数为2的目标用户频繁集寻找另一其他用户,在本实例中,其他用户有U3,U5,然而,只有其他用户U5与U1,U3对视频资源a、d都进行了评分,因此,构成一个项集为{U1,U3,U5}、支持度为2的目标用户频繁集。
在U1,U2,U5的基础上,其他用户U3与用户U1,U2,U5都进行了评分的视频资源只有a,支持度小于2;同理,在U1,U3,U5的基础上,其他用户U2与用户U1,U3,U5都进行了评分的视频资源只有a,支持度也小于2。因此,停止搜索。
2、构建目标用户兴趣相似组
在挖掘出的五个目标用户频繁集,如表3、4中,选取项集中项数,即用户数量最多的目标用户频繁集,即表4中两个目标用户频繁集。在本实例中,取的目标用户频繁集有两个,则进一步选取支持度最高的一个目标用户频繁集,用于构建目标用户兴趣相似组。在本实例中,由于选取的两个目标用户频繁集支持度都为2,因此,选取项集为{U1,U2,U5}的目标用户频繁集,如表5所示
  项集   支持度
  {U1,U2,U5}   2
表5
将选出的目标用户频繁集项集中的用户,即用户U1,U2,U5作为目标用户兴趣相似组,如表6所示。
  目标用户   目标用户兴趣相似组
  U1   U1,U2,U5
表6
(3)、用Slope One算法进行预测评分
目标用户兴趣相似组用户U1,U2,U5对视频资源的历史评分如表7所示
表7
将表7的评分数据输入到Slope One算法中作为核心数据,对目标用户未访问资源b进行评分预测。
针对表7中的用户兴趣相似组评分,对目标用户U1使用Slope One算法可得到评分U1b,Uij表示用户Ui对资源j的评分:
I 1 b = ( U 1 a + U 2 b - U 2 a ) + ( U 1 c + U 2 b - U 2 c ) + ( U 1 d + U 2 b - U 2 d ) 1 + 1 + 1
= ( 3 + 4 - 3 ) + ( 4 + 4 - 4 ) + ( 4 - 2 + 5 ) 3 = 15 3 = 5
(4)、推荐资源给目标用户
本实例中,用户评分范围为{1,2,3,4,5},于是设阈值为4分,即评分预测值大于等于4分认为目标用户对该视频资源感兴趣,可以推荐;反之,则不推荐。在本实例中,目标用户U1对于视频资源b的预测值为5,因此,推荐给目标用户U1
在本实例中,由于目标用户U1未访问视频资源只有b,因此,直接推荐给目标用户U1
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (1)

1.一种基于用户关联性的资源个性化推荐方法,包括以下步骤:
(1)、分析并挖掘出目标用户频繁集
对用户对资源的历史评分记录做预处理,只有用户评分值大于等于设定阈值的评分才进行关联规则分析和挖掘,即只有评分值大于等于设定阈值才认为用户观看过视频资源并对用户的关联性具有正面的作用,低于设定阈值的忽略不计;
将预处理后的用户对资源的历史评分记录作为数据源,利用用户关联规则分析并挖掘出多个支持度达到要求的目标用户频繁集;
其中,用户关联规则是指目标用户与其他用户对一个或多个资源都进行了评分,目标用户与其他用户都进行了评分的资源数量为支持度;
目标用户频繁集包括由目标用户与其他用户组成的项集以及支持度;
(2)、构建目标用户兴趣相似组
在挖掘出的多个目标用户频繁集中,选取项集中项数,即用户数量最多的目标用户频繁集;如果选取的目标用户频繁集有多个,则进一步选取支持度最高的一个目标用户频繁集,用于构建目标用户兴趣相似组;
选出的目标用户频繁集项集中的用户作为目标用户兴趣相似组;
(3)、用Slope One算法进行预测评分
将目标用户兴趣相似组用户对资源的历史评分输入到Slope One算法中作为核心数据,对目标用户未访问资源进行评分预测;
(4)、推荐资源给目标用户
将评分预测值大于阈值的目标用户未访问资源,按照评分预测值大小推荐给目标客户;
所述的用户关联规则分析并挖掘出多个支持度达到要求的目标用户频繁集为:
首先扫描用户对资源的历史评分记录数据库,逐个收集与目标用户都对相同资源进行了评分的其他一个用户,并记录下目标用户与该其他用户都进行了评分的资源数量,得到多个项集项数为2的目标用户频繁集;然后,在得到的多个项集项数为2的目标用户频繁集基础上,搜索与目标用户都对相同资源进行了评分的其他两个用户,并记录下目标用户与该其他两个用户都进行了评分的资源数量,得到一个或多个项集项数为3的目标用户频繁集;依次类推,增加其他用户数量,直到找不到它们都对满足支持度的相同资源进行了评分为止。
CN201210179907.XA 2012-06-04 2012-06-04 一种基于用户关联性的资源个性化推荐方法 Expired - Fee Related CN102750336B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210179907.XA CN102750336B (zh) 2012-06-04 2012-06-04 一种基于用户关联性的资源个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210179907.XA CN102750336B (zh) 2012-06-04 2012-06-04 一种基于用户关联性的资源个性化推荐方法

Publications (2)

Publication Number Publication Date
CN102750336A CN102750336A (zh) 2012-10-24
CN102750336B true CN102750336B (zh) 2014-09-24

Family

ID=47030521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210179907.XA Expired - Fee Related CN102750336B (zh) 2012-06-04 2012-06-04 一种基于用户关联性的资源个性化推荐方法

Country Status (1)

Country Link
CN (1) CN102750336B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533390B (zh) * 2012-11-15 2016-08-31 Tcl集团股份有限公司 基于社交网络信息进行电视节目推荐的方法及系统
CN103049865A (zh) * 2012-12-17 2013-04-17 中国农业大学 主动推荐产品信息服务的方法及系统
CN103353868B (zh) * 2013-05-30 2018-05-11 百度在线网络技术(北京)有限公司 一种用于确定多媒体资源的资源评价信息的方法与设备
CN105302808B (zh) * 2014-06-05 2019-08-09 腾讯科技(深圳)有限公司 一种降低用户组匹配过程中负载峰值的方法和装置
CN105335409B (zh) * 2014-07-31 2019-02-01 华为技术有限公司 一种目标用户的确定方法、设备和网络服务器
CN105005907A (zh) * 2015-03-05 2015-10-28 张良均 一种餐饮服务动态菜品智能推荐方法
CN106471491A (zh) * 2015-05-29 2017-03-01 深圳市汇游智慧旅游网络有限公司 一种时变的协同过滤推荐方法
CN105488213B (zh) * 2015-12-11 2019-05-24 哈尔滨工业大学深圳研究生院 面向lbs的基于马尔可夫预测算法的个性化推荐方法
CN105678430A (zh) * 2016-02-29 2016-06-15 大连大学 基于邻近项目Slope One算法的用户改进推荐方法
CN107526735B (zh) * 2016-06-20 2020-12-11 杭州海康威视数字技术股份有限公司 一种关联关系的识别方法及装置
TWI613606B (zh) * 2016-12-16 2018-02-01 財團法人工業技術研究院 使用者喜好之預測方法
CN108319628B (zh) * 2017-02-22 2022-04-22 腾讯科技(深圳)有限公司 一种用户兴趣确定方法及装置
CN107038213B (zh) * 2017-02-28 2021-06-15 华为技术有限公司 一种视频推荐的方法及装置
CN106844787B (zh) * 2017-03-16 2020-06-16 四川大学 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN106951251A (zh) * 2017-03-21 2017-07-14 广东小天才科技有限公司 应用程序的分级处理方法及装置
CN107133317B (zh) * 2017-05-03 2020-07-31 成都云数未来信息科学有限公司 一种通过新词抽取网络舆情主题的方法
CN109426998B (zh) * 2017-08-29 2022-01-07 北京京东尚科信息技术有限公司 信息推送方法和装置
CN109711912A (zh) * 2017-10-25 2019-05-03 贵州师范学院 一种融合FP-growth算法和Slope-One算法的混合推荐模型
CN108419135B (zh) * 2018-03-22 2020-07-10 武汉斗鱼网络科技有限公司 相似度确定方法、装置及电子设备
CN108830315B (zh) * 2018-05-31 2021-06-04 大连理工大学 一种评分数据噪声消除方法
CN109243413B (zh) * 2018-09-25 2023-02-10 Oppo广东移动通信有限公司 3d音效处理方法及相关产品
CN109410008B (zh) * 2018-10-31 2021-06-04 中国石油大学(华东) 一种融合频繁项集的油田业务服务推荐方法
CN111767470A (zh) * 2020-06-30 2020-10-13 山东汇贸电子口岸有限公司 一种物品推荐方法、装置、设备及计算机可读存储介质
CN112418978B (zh) * 2020-11-17 2024-04-09 中国平安财产保险股份有限公司 产品推荐方法、装置、设备及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101287082A (zh) * 2008-05-16 2008-10-15 华东师范大学 一种引入节目热门度权重的协作过滤推荐方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101287082A (zh) * 2008-05-16 2008-10-15 华东师范大学 一种引入节目热门度权重的协作过滤推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周涛.基于用户情境的协同推荐算法研究与应用.《中国优秀硕士学位论文全文数据库信息科技辑》.2011,(第3期),第8-43页.
基于用户情境的协同推荐算法研究与应用;周涛;《中国优秀硕士学位论文全文数据库信息科技辑》;20110315(第3期);第8-43页 *

Also Published As

Publication number Publication date
CN102750336A (zh) 2012-10-24

Similar Documents

Publication Publication Date Title
CN102750336B (zh) 一种基于用户关联性的资源个性化推荐方法
Ahmadisharaf et al. Integrating flood hazard into site selection of detention basins using spatial multi-criteria decision-making
CN102004774B (zh) 基于统一概率模型的个性化用户标签建模与推荐方法
US9858586B2 (en) Methods and systems for creating rules for assigning attribution credit across a plurality of events
CN105898209A (zh) 视频平台监控分析系统
US20170228768A1 (en) Attributing conversions relating to content items
CN104008203A (zh) 一种融入本体情境的用户兴趣挖掘方法
CN105183727A (zh) 一种图书推荐方法及其系统
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN104408210B (zh) 基于意见领袖的视频推荐方法
CN106339891A (zh) 一种基于大数据采集的智能分析方法及系统
CN102262681A (zh) 一种博客信息传播中识别关键博客集的方法
CN105335491A (zh) 基于用户点击行为来向用户推荐图书的方法和系统
CN104680250A (zh) 一种位置预测系统
CN103678531A (zh) 好友推荐方法和装置
CN105095625B (zh) 点击率预估模型建立方法、装置及信息提供方法、系统
CN102402594A (zh) 一种富媒体个性化推荐方法
CN105488213A (zh) 面向lbs的基于马尔可夫预测算法的个性化推荐方法
CN103262079B (zh) 检索装置及检索方法
US20190050317A1 (en) Systems and methods for determining event processing delays
CN103309894A (zh) 基于用户属性的搜索实现方法及系统
Tokito et al. Hypothetical extraction, betweenness centrality, and supply chain complexity
JP6748312B2 (ja) メディアミックスモデリングにおけるバイアスを除去するためのシステムおよび方法
US20160042013A1 (en) Unlimited data element dimension widening
US20210397892A1 (en) Personalized data model utilizing closed data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140924

Termination date: 20170604

CF01 Termination of patent right due to non-payment of annual fee