CN103593417A - 基于关联规则预测的协同过滤推荐方法 - Google Patents

基于关联规则预测的协同过滤推荐方法 Download PDF

Info

Publication number
CN103593417A
CN103593417A CN201310525778.XA CN201310525778A CN103593417A CN 103593417 A CN103593417 A CN 103593417A CN 201310525778 A CN201310525778 A CN 201310525778A CN 103593417 A CN103593417 A CN 103593417A
Authority
CN
China
Prior art keywords
user
project
similarity
users
correlation rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310525778.XA
Other languages
English (en)
Inventor
吴雷
阮怀伟
昌磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANHUI EDUCATION NETWORK PUBLISHING Co Ltd
Original Assignee
ANHUI EDUCATION NETWORK PUBLISHING Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANHUI EDUCATION NETWORK PUBLISHING Co Ltd filed Critical ANHUI EDUCATION NETWORK PUBLISHING Co Ltd
Priority to CN201310525778.XA priority Critical patent/CN103593417A/zh
Publication of CN103593417A publication Critical patent/CN103593417A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基于关联规则预测的协同过滤推荐方法,它涉及互联网个性化推荐领域。根据用户的搜索、浏览行为等反馈,挖掘并获取网站上用户对项目的评分数据;对无法挖掘等项目,通过挖掘用户特征与项目特征之间的关联规则来预测;利用用户和项目之间的关联规则,构造用户评分的偏好矩阵;根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测;改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,通过用户相似性方法获得目标用户最近邻用户BNS,最终通过BNS获得推荐评分;评估基于关联规则预测的协同过滤推荐方法。本发明有效的提高了用户相似度的计算准确性,在稀疏数据的条件下保持较高的推荐质量,对新用户的推荐质量也具有较高准备度。

Description

基于关联规则预测的协同过滤推荐方法
所属技术领域
本发明涉及互联网个性化推荐领域,尤其涉及一种基于关联规则的协同过滤推荐方法。 
背景技术
信息过载是互联网应用的重要特征和主要挑战,每天有大量的信息发布到网上,使得传统的搜索技术不能满足用户对信息发现的需求,而推荐系统的出现可以更好地帮助用户发现和获取更符合个人需要的信息。个性化推荐根据用户特点和个人偏好,其主要任务是从海量的信息中为目标用户推送感兴趣的内容,随着互联网技术和电子商务的发展,诸如Amazon,淘宝,eBay等都采用了不同形式的推荐系统,针对不同的推荐系统的要求,研究者提出了不同的推荐算法,如协同过滤,聚类方法,关联规则技术等。 
协同过滤是一种在推荐系统中广泛应用的推荐方法,算法基于“物以类聚”的假设,即目标用户感兴趣的内容可以利用与该用户具有偏好相似的其他用户的感兴趣的内容进行推荐,基于协同过滤的推荐方法在用户评分系统中得到了很好的应用,物品之间的关联直接通过用户建立,省去了对项目的处理过程,当前的协同过滤方法具有两种不同的类型,分别是基于用户的推荐和基于物品的推荐。 
基于关联规则的推荐更常见于电子商务系统中,并且也被证明行之有效,其实际的意义为购买了一些物品的用户更倾向于购买另一些物品,基于关联规则的推荐系统的首要目标是挖掘出关联规则,也就是那些同时被很多用户购买的物品集合,这些集合内的物品可以相互进行推荐。基于关联规则的推荐系统一般转化率比较高,因为当用户 已经购买了频繁集合中的若干项目后,购买该频繁集合中的其他项目的可能性更高。然而挖掘项目集合的关联规则计算量较大,同时也存在用户数据的稀疏性问题,降低了推荐的准确率。 
发明内容
本发明提供了一种基于关联规则预测的协同过滤推荐方法,它针对协同过滤方法用户数据稀疏性的问题,通过所有用户对项目或者信息的偏好,发现用户和物品的特征之间的关联规则对用户未评分项目进行预测,构建用户的偏好矩阵,在此基础上,利用偏好矩阵设计最近邻相似度度量方法,最后通过实际数据验证了算法的有效性。 
为了解决背景技术所存在的问题,本发明包括如下步骤: 
101根据用户的搜索、浏览行为以及用户的实际反馈,挖掘并获取网站上用户对项目(或产品)的评分数据; 
102对于无法挖掘或者用户未评分的项目,通过挖掘用户特征与项目特征之间的关联规则来进行预测; 
103利用用户和项目之间的关联规则,构造用户评分的偏好矩阵; 
104根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测; 
105通过改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,进一步通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户ui对项目tk的推荐评分; 
106实验评估基于关联规则预测的协同过滤推荐方法。 
本发明采用上述技术方案,具有以下有益效果:本发明使用关联规则的方法,通过挖掘所有用户对项目或者信息的偏好,发现用户和项目的特征之间的关联规则,此发明一方面避免了传统挖掘项目集合的关联规则计算较大的问题,另一方面利用挖掘出的用户与项目特征之间的关联规则,从根本上解决了协同过滤推荐方法中普遍存在的用 户数掘稀疏的问题,有效的提高了用户相似度的计算准确性,在稀疏数据的条件下保持较高的推荐质量,对新用户的推荐质量也具有较高准备度。 
附图说明
图1为本发明实施具体实例的方法流程图; 
图2为本发明利用用户和项目的关联规则生成的用户评分偏好矩阵示意图,其中不同属性值的用户对不同类型的项目具有不同的偏好值; 
图3为本发明在GroupLens站点的MovieLens Data Set实验结果示意图。 
实施方式 
参见图1-2,本发明方法包括以下步骤: 
101根据用户的搜索、浏览行为以及用户的实际反馈,挖掘并获取网站上用户对项目(或产品)的评分数据;具体包括: 
101-1提取网站中具体注册用户对某一项目(或产品)阅读、购买或使用后,对该项目(或产品)实际的评价反馈得分数据,将数据映射到用户评分矩阵中; 
101-2对于用户未实际反馈评分数据的项目(或产品),分析和挖掘网站日志文件中,用户对该项目的搜索频率、浏览时间等预测用户评分数据。 
102对于无法挖掘或者用户未评分的项目,通过挖掘用户特征与项目特征之间的关联规则来进行预测;在推荐系统中,用户和项集的不同特征之也存在相应的关系,通过关联规则分析能够发现其中隐含的关联; 
用户和项目的特征抽象为两组变量:X={x1,x2,...,xk} Y={y1,y2,...,yi
xi和yi分别是用户特征变量和项目特征变量,相应的关联规则可以表示为蕴含式xi->yi支持度和置信度是衡量关联规则强度的基本标准,支持度s反映了在所有数据中同时出现xi和yi的概率,而置信度c反映了在出现xi的情况下出现yi的概率。令sij和cij分别表示关联规则xi->yi的支持度和置信度,则特征xi对yi的偏好表示为:pij=cij×sij
利用用户和项目的关联规则生成的用户评分偏好矩阵如图2,不同属性值的用户对不同类型的项目具有不同的偏好值。 
103利用用户和项目之间的关联规则,构造用户评分的偏好矩阵。 
104根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测。 
步骤103及步骤104基于用户偏好矩阵,对稀疏的用户评分矩阵进行预测。 
令用户u对项目t的评分预测值为dpre
Figure BSA0000096958810000041
Figure BSA0000096958810000042
分别是u和t对应的属性特征, 
dpre可以表示为:
Figure BSA0000096958810000043
其中:λij=E(dij),M=∑pij
关联规则预测方法将用户对项目的偏好作为权重来预测用户对项目的评分大小。关联规则强度越小,其偏好值越小,对预测值的影响也越小;而关联规则强度越大,其偏好值也越大,对最终的预测值影响越大。 
105通过改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,进一步通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户ui对项目tk的推荐评分; 
105中采用改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,并且通过用户相似性方法获得目标用户的一组最近邻 用户BNS,最终通过BNS获得用户ui对项目tk的推荐评分; 
计算用户ui和用户uj之间的相似性时,首先计算用户ui和用户uj评分项集合的并集upre,则upre表示为:upre=<ui,uj>=ui∪uj-ui;用户ui和用户uj在项目集合upre中未评分的项目通过用户对相似项目的评分预测出来,然后在项目集合upre上计算用户ui和用户uj之间的相似性; 
项目合集upre中未评分的项目预测,采用修正余弦定理计算用户ui和用户uj的相似性: 
similarity ( u i , u j ) = &Sigma; k &Element; u pre d ~ ik d ~ jk &Sigma; k &Element; u pre d ~ ik 2 &Sigma; k &Element; u pre d ~ jk 2
其中
Figure BSA0000096958810000052
Figure BSA0000096958810000053
分别表示用户ui和uj的平均评分; 
用户相似性方法获得目标用户的一组最近邻用户BNS,用户ui对项目tk的预测评分可以通过用户ui的最近邻用户BNS获得,计算过程如下: 
recommend ( u i , t k ) = d &OverBar; i + &Sigma; u j &Element; BNS similarity ( u i , u j ) &times; ( d ik - d &OverBar; j ) &Sigma; u j &Element; BNS | similarity ( u i , u j ) |
其中
Figure BSA0000096958810000056
Figure BSA0000096958810000057
分别表示用户ui和uj的平均评分。 
106实验评估基于关联规则预测的协同过滤推荐方法。 
106中实验评估基于关联规则预测的协同过滤推荐方法,具体包括: 
106-1准备数据集; 
使用取自GroupLens站点的MovieLens Data Set,该数据收集自MovieLens站点,包含943个用户对1682个影片的10万条评分记录,用户评分范围为1-5,同时每个用户至少对20个电影进行了评 分,用户评分数据按照80%和20%的比例划分为训练集和测试集进行实验; 
106-2评价指标; 
采用平均绝对偏差MAE作为评价标准;平均绝对偏差MAE(mean absolute error)是一种常用的度量方法,它通过计算预测的用户评分与实际用户评分之间的偏差度量预测的准确性,MAE越小,推荐的质量越高,假设预测的用户评分集合为{p1,p2,...pN},对应的实际评分集合为{q1,q2,...qN},则MAE可由下式计算[5]
Figure 1
106-3在数据集上进行实验; 
比较基于关联规则的协同过滤推荐方法与基于修正余弦的协同过滤方法以及基于默认值评分预测的协同过滤方法的实验结果。如图3所示; 
106-4分析实验结果; 
由图3可知,在不同的最近邻集合数量下,基于关联规则的协同过滤推荐方法比基于修正余弦的协同过滤方法和基于默认值评分预测的协同过滤方法评价绝对误差都要小,效果更优,所以有效的提高了系统的正确性。 

Claims (6)

1.基于关联规则预测的协同过滤推荐方法,其特征在于,包括如下步骤:
101根据用户的搜索、浏览行为以及用户的实际反馈,挖掘并获取网站上用户对项目(或产品)的评分数据;
102对于无法挖掘或者用户未评分的项目,通过挖掘用户特征与项目特征之间的关联规则来进行预测;
103利用用户和项目之间的关联规则,构造用户评分的偏好矩阵;
104根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测;
105通过改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,进一步通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户uj对项目tk的推荐评分;
106实验评估基于关联规则预测的协同过滤推荐方法。
2.根据权利要求1所述的方法,其特征在于,所述101还包括包括以下步骤:
101-1提取网站中具体注册用户对某一项目(或产品)阅读、购买或使用后,对该项目(或产品)实际的评价反馈得分数据,将数据映射到用户评分矩阵中;
101-2对于用户未实际反馈评分数据的项目(或产品),分析和挖掘网站日志文件中,用户对该项目的搜索频率、浏览时间等预测用户评分数据。
3.根据权利要求1所述的方法,其特征在于,步骤102中,所述关联规则挖掘主要为挖掘用户特征与项目特征之间的关联规则,在所述步骤103中对于步骤102的关联规则,通过用户特征到项目特征的支持度和置信度,来计算用户特征对项目特征的偏好表示,进而构造用户评分偏好矩阵,不同属性值的用户对不同类型的项目具有不同的偏好值。
4.根据权利要求1或3所述的方法,其特征在于,所述104根据步骤103构造的用户评分偏好矩阵,对稀疏的用户评分矩阵进行预测,通过用户共同评分的项目的数量,从根本上解决稀疏矩阵的问题。
5.根据权利要求1所述的方法,其特征在于,所述105包括采用改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,并且通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户ui对项目tk的推荐评分。
6.根据权利要求1所述的方法,其特征在于,所述106包括准备数掘集;采用平均绝对偏差MAE作为评价标准;不同的最近邻集合数量下进行试验比较不同算法的性能;分析试验结果。
CN201310525778.XA 2013-10-25 2013-10-25 基于关联规则预测的协同过滤推荐方法 Pending CN103593417A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310525778.XA CN103593417A (zh) 2013-10-25 2013-10-25 基于关联规则预测的协同过滤推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310525778.XA CN103593417A (zh) 2013-10-25 2013-10-25 基于关联规则预测的协同过滤推荐方法

Publications (1)

Publication Number Publication Date
CN103593417A true CN103593417A (zh) 2014-02-19

Family

ID=50083558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310525778.XA Pending CN103593417A (zh) 2013-10-25 2013-10-25 基于关联规则预测的协同过滤推荐方法

Country Status (1)

Country Link
CN (1) CN103593417A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096149A (zh) * 2014-05-09 2015-11-25 华为软件技术有限公司 业务内容产品关联分析方法及装置
CN105279242A (zh) * 2015-09-29 2016-01-27 浪潮(北京)电子信息产业有限公司 一种个性化推荐方法与系统
CN105630742A (zh) * 2015-12-28 2016-06-01 广州酷狗计算机科技有限公司 特征向量计算方法及装置
CN105808611A (zh) * 2014-12-31 2016-07-27 华为技术有限公司 数据挖掘方法和装置
CN106779825A (zh) * 2016-12-02 2017-05-31 乐视控股(北京)有限公司 一种物品推荐方法、装置及电子设备
CN106844787A (zh) * 2017-03-16 2017-06-13 四川大学 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN107710266A (zh) * 2015-08-06 2018-02-16 赫尔实验室有限公司 用于借助社交媒体识别用户兴趣的系统和方法
CN107798045A (zh) * 2017-07-24 2018-03-13 中南大学 面向中小型网站的用户访问意图获取方法及系统
CN108090810A (zh) * 2017-12-19 2018-05-29 中国科学院合肥物质科学研究院 一种基于大数据的产品推荐系统
CN108108914A (zh) * 2018-01-12 2018-06-01 重庆大学 一种云制造环境下制造服务可信评价方法
CN108510373A (zh) * 2018-04-12 2018-09-07 京东方科技集团股份有限公司 画作推荐方法、画作推荐装置、设备及存储介质
CN108694234A (zh) * 2018-05-08 2018-10-23 重庆邮电大学 一种基于改进协同过滤算法的服务推荐模型
CN108984616A (zh) * 2018-06-12 2018-12-11 佛山欧神诺云商科技有限公司 一种基于微信的活动推荐方法
CN110020917A (zh) * 2019-03-15 2019-07-16 上海电机学院 一种基于协同过滤的在线理财产品推荐方法
WO2020029401A1 (zh) * 2018-08-09 2020-02-13 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及计算机可读存储介质
CN111259236A (zh) * 2020-01-09 2020-06-09 贵州大学 面向捐赠众筹领域的推荐方法
CN112989026A (zh) * 2021-04-14 2021-06-18 华南理工大学 一种基于关联规则的文本推荐方法
WO2022165714A1 (zh) * 2021-02-04 2022-08-11 深圳大学 一种信息推荐方法、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘枚莲等: "基于双向关联规则项目评分预测的推荐算法研究", 《武汉理工大学学报》 *
邓爱林等: "基于项目评分预测的协同过滤推荐算法", 《软件学报》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096149A (zh) * 2014-05-09 2015-11-25 华为软件技术有限公司 业务内容产品关联分析方法及装置
CN105096149B (zh) * 2014-05-09 2019-02-01 华为软件技术有限公司 业务内容产品关联分析方法及装置
CN105808611A (zh) * 2014-12-31 2016-07-27 华为技术有限公司 数据挖掘方法和装置
CN105808611B (zh) * 2014-12-31 2019-12-06 华为技术有限公司 数据挖掘方法和装置
CN107710266A (zh) * 2015-08-06 2018-02-16 赫尔实验室有限公司 用于借助社交媒体识别用户兴趣的系统和方法
CN105279242A (zh) * 2015-09-29 2016-01-27 浪潮(北京)电子信息产业有限公司 一种个性化推荐方法与系统
CN105630742A (zh) * 2015-12-28 2016-06-01 广州酷狗计算机科技有限公司 特征向量计算方法及装置
CN105630742B (zh) * 2015-12-28 2019-05-07 广州酷狗计算机科技有限公司 特征向量计算方法及装置
CN106779825A (zh) * 2016-12-02 2017-05-31 乐视控股(北京)有限公司 一种物品推荐方法、装置及电子设备
CN106844787A (zh) * 2017-03-16 2017-06-13 四川大学 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN106844787B (zh) * 2017-03-16 2020-06-16 四川大学 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法
CN107798045A (zh) * 2017-07-24 2018-03-13 中南大学 面向中小型网站的用户访问意图获取方法及系统
CN108090810A (zh) * 2017-12-19 2018-05-29 中国科学院合肥物质科学研究院 一种基于大数据的产品推荐系统
CN108108914A (zh) * 2018-01-12 2018-06-01 重庆大学 一种云制造环境下制造服务可信评价方法
CN108510373A (zh) * 2018-04-12 2018-09-07 京东方科技集团股份有限公司 画作推荐方法、画作推荐装置、设备及存储介质
WO2019196881A1 (zh) * 2018-04-12 2019-10-17 京东方科技集团股份有限公司 推荐方法、推荐装置、推荐设备、推荐系统及存储介质
CN108694234A (zh) * 2018-05-08 2018-10-23 重庆邮电大学 一种基于改进协同过滤算法的服务推荐模型
CN108984616A (zh) * 2018-06-12 2018-12-11 佛山欧神诺云商科技有限公司 一种基于微信的活动推荐方法
WO2020029401A1 (zh) * 2018-08-09 2020-02-13 平安科技(深圳)有限公司 商品推荐方法、装置、计算机设备及计算机可读存储介质
CN110020917A (zh) * 2019-03-15 2019-07-16 上海电机学院 一种基于协同过滤的在线理财产品推荐方法
CN111259236A (zh) * 2020-01-09 2020-06-09 贵州大学 面向捐赠众筹领域的推荐方法
WO2022165714A1 (zh) * 2021-02-04 2022-08-11 深圳大学 一种信息推荐方法、电子设备及存储介质
CN112989026A (zh) * 2021-04-14 2021-06-18 华南理工大学 一种基于关联规则的文本推荐方法
CN112989026B (zh) * 2021-04-14 2023-08-01 华南理工大学 一种基于关联规则的文本推荐方法

Similar Documents

Publication Publication Date Title
CN103593417A (zh) 基于关联规则预测的协同过滤推荐方法
CN106600372A (zh) 一种基于用户行为的商品推荐方法及系统
CN104008203A (zh) 一种融入本体情境的用户兴趣挖掘方法
CN107766462A (zh) 基于用户偏好、社交信誉度和地理位置的兴趣点推荐方法
CN105488024A (zh) 网页主题句的抽取方法及装置
CN104679835B (zh) 一种基于多视图哈希的图书推荐方法
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN102779182A (zh) 融合偏好和信任关系的协同过滤推荐方法
CN103793476A (zh) 基于网络社区的协同过滤推荐方法
CN104134159A (zh) 一种基于随机模型预测信息最大化传播范围的方法
CN104268271A (zh) 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN102750336A (zh) 一种基于用户关联性的资源个性化推荐方法
CN103632290A (zh) 一种基于推荐概率融合的混合推荐方法
CN103020302A (zh) 基于复杂网络的学术核心作者挖掘及相关信息抽取方法和系统
CN104166732B (zh) 一种基于全局评分信息的项目协同过滤推荐方法
CA3116778A1 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
CN104462611A (zh) 信息排序模型的建模方法、排序方法及建模装置、排序装置
CN104598450A (zh) 一种网络舆情事件的热度分析方法及系统
CN108038746A (zh) 基于关键用户和时间上下文的二部图推荐方法
CN102456064B (zh) 在社会网络中实现社区发现的方法
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN103136331A (zh) 微博网络意见领袖识别方法
CN109492076A (zh) 一种基于网络的社区问答网站答案可信评估方法
CN109982155A (zh) 一种播单推荐方法及系统
CN102799656A (zh) 一种面向目标用户的个性化产品包的提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140219

WD01 Invention patent application deemed withdrawn after publication