CN109783738B - 一种基于多相似度的双极限学习机混合协同过滤推荐方法 - Google Patents
一种基于多相似度的双极限学习机混合协同过滤推荐方法 Download PDFInfo
- Publication number
- CN109783738B CN109783738B CN201910058902.3A CN201910058902A CN109783738B CN 109783738 B CN109783738 B CN 109783738B CN 201910058902 A CN201910058902 A CN 201910058902A CN 109783738 B CN109783738 B CN 109783738B
- Authority
- CN
- China
- Prior art keywords
- similarity
- user
- learning machine
- double
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于多相似度的双极限学习机混合协同过滤推荐方法,包括以下步骤:利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。本发明能够降低评分预测的误差,提高了推荐的精度。
Description
技术领域
本发明涉及互联网技术中的兴趣点推荐技术领域,特别是涉及一种基于多相似度的双极限学习机混合协同过滤推荐方法。
背景技术
随着互联网的高速发展,推荐系统在电子商务,新闻推荐,视频推送等领域崭露头角,取得不错的效果。目前,大多数互联网公司都使用着各种推荐系统作为一种新的方式来提升服务质量和客户粘性。对于广大的消费者来说,推荐系统在一定程度上省去了海量信息检索的过程,可以轻易获取想要的信息。
在推荐系统中,协同过滤(Collaborative Filtering,CF)算法作为一种最重要的信息过滤的手段,受到了人们的广泛关注,并取得了很大的成功,协同过滤推荐源于现实生活中口碑相传的过程,利用相似用户之间具有相似兴趣偏好的方法,来发现用户对物品的潜在偏好。严格意义上来说,协同过滤推荐算法主要包括三类:基于内存的协同过滤(Memory based CF)算法,基于模型的协同过滤(model based CF)推荐算法,混合协同过滤(hybrid CF)推荐算法。基于内存的协同过滤算法是在稀疏评分矩阵的基础上通过计算用户或物品间的相似度,来预测评分或进行TopN推荐,比如基于用户的协同过滤(User-basedCF),基于物品的协同过滤(Item-based CF)。基于模型的协同过滤是建立一个基于评分数据集的模型,然后从数据集中提取一些信息,并将其作为“模型”来进行推荐,这种方法有着快速和可伸缩性的优点,如矩阵分解,概率潜在语义分析,贝叶斯网络。混合协同过滤将基于内存的协同过滤与基于模型的协同过滤相结合,克服数据稀疏的不足,提高了预测性能,大多数的商业运用都是混合协同推荐算法。
虽然传统的协同过滤因其简单有效而被广泛使用,但也存在以下不足:
a)传统的协同过滤算法都是聚焦于单一的相似度,或用户间相似度,或物品间相似度。对于这两者的使用场景主要是取决于推荐系统的用户规模和物品规模,但并不是表明使用效果差的不能提供有效的信息,这是不符合认知规律的,人类对陌生对象的认知是取决于自己属性和对象属性的共同作用。
b)评分预测公式过于简单。传统的基于用户和基于物品的协同过滤的推荐算法的评分预测公式只是近邻评分做了加权求和的过程。而事实上,评分过程可能是一个包含非线性的复杂的决策过程,不能很好的表征这一过程。
发明内容
本发明所要解决的技术问题是提供一种基于多相似度的双极限学习机混合协同过滤推荐方法,能够降低评分预测的误差,提高了推荐的精度。
本发明解决其技术问题所采用的技术方案是:提供一种基于多相似度的双极限学习机混合协同过滤推荐方法,包括以下步骤:
(1)利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;
(2)对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;
(3)采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。
所述步骤(1)包括以下子步骤:
(11)清洗数据样本,去除重复数据,对用户和商品进行连续编号;
(12)构建评分矩阵,矩阵的同一列为不同用户对同一商品的评分,同一行为同一用户对不同商品的评分,以零来填充缺失的项;
(13)从用户维度和物品维度计算用户间相似度和物品间相似度,以行向量为特征向量构建用户相似度矩阵SuserN′N,以列向量为特征向量构建物品相似度矩阵SitemM×M;
(14)对用户间相似度和物品间相似度分别进行排序,根据预设的近邻数,确定目标用户和目标物品的近邻群体;
(15)将用户间相似度和物品间相似度分别与评分记录相乘,来度量近邻分数对评分的贡献,得到用户贡献矩阵和物品贡献矩阵。
所述步骤(13)中用户间相似度和物品间相似度均采用余弦相似度计算方法进行计算,其中,用户间相似度物品间相似度rak和rbk表示用户a与用户b对物品k的评分,rka和rkb表示用户k对物品a和物品b的评分。
所述步骤(2)包括以下子步骤:
(21)随机初始化双极限学习机的隐层参数,包括w1为第一隐层权重,b1为第一隐层偏置,w2为第二隐层权重,b2为第二隐层偏置;
(23)计算输出层输出,其中,输出层输出O=H1β1+H2β2,β1和β2为输出权重;
(25)更新输出权重,完成训练。
所述步骤(3)具体包括以下步骤:
(31)计算用户u与其他用户的相似度,确定用户u的近邻群;
(32)查询出这些近邻对物品i的评分,并与对应的相似度进行加权得到用户贡献向量V1;
(33)计算物品i与其他物品的相似度,确定物品i的近邻群;
(34)查询出这些近邻被用户u的评分,并与对应的相似度进行加权得到物品贡献向量V2;
(35)将用户贡献向量V1和物品贡献向量V2作为输入,根据训练好的双极限学习机网络计算预测的评分;
(36)当评分超过阈值时向用户u推荐物品i。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明将目标用户和目标物品的加权后的近邻分数分别作为输入,利用用户维度的信息和物品的维度的信息综合预测评分,与传统的协同过滤算法相比,本方法明显降低了评分预测的误差,提高了推荐的精度。
附图说明
图1是本发明的流程图;
图2是本发明中双极限学习机评分预测模型示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种基于多相似度的双极限学习机混合协同过滤推荐方法,如图1所示,包括以下步骤:
(1)清洗评分记录数据样本,去除重复数据,对用户和商品进行编号(假设有N个用户,M件商品),并使编号连续;
(2)建立评分矩阵R。假设某平台有N个活跃用户,M件产品,L条评分记录,每条评分记录有用户ID,物品的ID和用户对此商品的打分构成。那可以构建如下的矩阵:
i<sub>1</sub> | … | i<sub>j</sub> | … | i<sub>M</sub> | |
u<sub>1</sub> | r<sub>11</sub> | … | r<sub>1j</sub> | … | r<sub>1M</sub> |
… | … | … | |||
u<sub>i</sub> | r<sub>j1</sub> | … | r<sub>ij</sub> | r<sub>iM</sub> | |
… | … | … | … | ||
u<sub>N</sub> | r<sub>N1</sub> | … | r<sub>Nj</sub> | r<sub>NM</sub> |
其中,rij表示第i个用户对第j件产品的偏好,由于每个用户不可能使用所有产品,所以矩阵R有数据缺失,是一个稀疏矩阵,缺失的部分可以用0来填补。用户对产品的偏好可以是评分,也可以是赞成与反对。
(3)计算用户间相似度和物品间相似度。在构建评分矩阵后,根据和从用户维度和物品维度计算相似度,以行向量为特征向量构建用户相似度矩阵SuserN×N,以列向量为特征向量构建物品相似度矩阵SitemM×M。
(4)确定近邻,构建贡献矩阵。相似度进行排序,根据预设的近邻数K,目标用户和目标物品的近邻群体就可以确定。另外,相似度也可以看作对评分记录对预测评分的贡献度,可以这么认为,相似度越大,那么该数据就对目标用户来说更加的可靠,用户更加倾向于信任和自己相似的用户,对于物品来说也是如此,所以将相似度与评分记录相乘,来度量近邻分数对评分的贡献,由此可以针对目标用户,目标物品构建用户贡献向量Vuser1×K,构建物品贡献向量Vitem1×K,结合用户标签和实际评分,得到如下的贡献矩阵:
CuserL×(K+3)={userid,itemid,truerating,Vuser1×K}
CitemL×(K+3)={userid,itemid,truerating,Vitem1×K}
(5)双极限学习机的输出预测的评分。如图2所示,基于ELM进行了改进,将原来的单输入层网络设计成了双输入层,以达到用户信息与物品信息融合的目的。
随机初始化隐层参数,w1为隐层一权重,b1为隐层一偏置,w2为隐层二权重,b2为隐层二偏置。
由极限学习机的理论基础,可以得到隐层一输出H1和隐层二H2的可以表示为:
输出层输出计算。完成对输出层的输出计算O=H1β1+H2β2。
其中,β1,β2为输出权重。
对输出权值进行更新。由于隐层的权重和偏置是随机取值的,明显损失函数E为凸函数。因此提出了两种输出权值的计算方式:
A)用梯度下降来求解输出权重β1,β2,梯度更新公式为:
其中,η表示梯度下降法的更新步长。将更新的权值迭代入输出层输出,直到达到迭代次数或误差要求,完成训练。
完成网络的训练后,开始进行评分预测,假设要预测用户u对物品i的评分,算法的评分预测步骤如下:
计算用户u与其他用户的相似度,确定用户u的近邻群;
查询出这些近邻对物品i的评分,并与对应的相似度进行加权得到用户贡献向量V1;
计算物品i与其他物品的相似度,确定物品i的近邻群;
查询出这些近邻被用户u的评分,并与对应的相似度进行加权得到物品贡献向量V2;
将用户贡献向量V1和物品贡献向量V2作为输入,根据训练好的双极限学习机网络计算预测的评分;
当评分超过阈值时向用户u推荐物品i。
在实际的应用中,对于相似度计算,近邻群的选取可以采用离线计算的方式,而对于预测可以在线计算,这样有利于提高计算的效率,节省计算资源。不难发现,相比于传统的协同过滤算法,本发明融合了用户的相似信息和物品的相似信息,是有用信息的挖掘更加的充分,评分预测的准确率会更加高。
Claims (7)
1.一种基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,包括以下步骤:
(1)利用评分矩阵从物品和用户两方面计算相似度,并将相似度作为权重加入到近邻评分向量中得到用户贡献向量和物品贡献向量;
(2)对双极限学习机网络进行训练,训练时以用户贡献向量和物品贡献向量作为双极限学习机的输入;具体包括以下子步骤:
(21)随机初始化双极限学习机的隐层参数,包括w1为第一极限学习机隐层权重,b1为第一极限学习机隐层偏置,w2为第二极限学习机隐层权重,b2为第二极限学习机隐层偏置;
(23)计算输出层输出,其中,输出层输出O=H1β1+H2β2,β1和β2为输出权重;
(25)更新输出权重,完成训练;
(3)采用训练好的双极限学习机网络预测用户u对物品i的评分,并根据评分情况判断是否向用户u推荐物品i。
2.根据权利要求1所述的基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,所述步骤(1)包括以下子步骤:
(11)清洗数据样本,去除重复数据,对用户和商品进行连续编号;
(12)构建评分矩阵,矩阵的同一列为不同用户对同一商品的评分,同一行为同一用户对不同商品的评分,以零来填充缺失的项;
(13)从用户维度和物品维度计算用户间相似度和物品间相似度,以行向量为特征向量构建用户相似度矩阵SuserN×N,以列向量为特征向量构建物品相似度矩阵SitemM×M;
(14)对用户间相似度和物品间相似度分别进行排序,根据预设的近邻数,确定目标用户和目标物品的近邻群体;
(15)将用户间相似度和物品间相似度分别与评分记录相乘,来度量近邻分数对评分的贡献,得到用户贡献向量和物品贡献向量。
7.根据权利要求1所述的基于多相似度的双极限学习机混合协同过滤推荐方法,其特征在于,所述步骤(3)具体包括以下步骤:
(31)计算用户u与其他用户的相似度,确定用户u的近邻群;
(32)查询出这些近邻对物品i的评分,并与对应的相似度进行加权得到用户贡献向量V1;
(33)计算物品i与其他物品的相似度,确定物品i的近邻群;
(34)查询出这些近邻被用户u的评分,并与对应的相似度进行加权得到物品贡献向量V2;
(35)将用户贡献向量V1和物品贡献向量V2作为输入,根据训练好的双极限学习机网络计算预测的评分;
(36)当评分超过阈值时向用户u推荐物品i。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910058902.3A CN109783738B (zh) | 2019-01-22 | 2019-01-22 | 一种基于多相似度的双极限学习机混合协同过滤推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910058902.3A CN109783738B (zh) | 2019-01-22 | 2019-01-22 | 一种基于多相似度的双极限学习机混合协同过滤推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109783738A CN109783738A (zh) | 2019-05-21 |
CN109783738B true CN109783738B (zh) | 2023-02-28 |
Family
ID=66501912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910058902.3A Active CN109783738B (zh) | 2019-01-22 | 2019-01-22 | 一种基于多相似度的双极限学习机混合协同过滤推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109783738B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377841B (zh) * | 2019-06-04 | 2022-01-07 | 深思考人工智能机器人科技(北京)有限公司 | 一种应用在协同过滤方法中的相似度计算方法及系统 |
CN110955831B (zh) * | 2019-11-25 | 2023-04-14 | 北京三快在线科技有限公司 | 物品推荐方法、装置、计算机设备及存储介质 |
CN111026966B (zh) * | 2019-12-06 | 2023-12-22 | 创新奇智(成都)科技有限公司 | 基于用户和产品画像及两者关联程度的搜索推荐排序方法 |
CN113449200B (zh) * | 2020-03-26 | 2023-04-18 | 杭州海康威视数字技术股份有限公司 | 物品推荐方法、装置及计算机存储介质 |
CN113554201A (zh) * | 2020-04-23 | 2021-10-26 | 山东大学 | 一种基于超网络和联邦学习的评分预测系统及预测方法 |
CN112115359B (zh) * | 2020-09-16 | 2023-10-31 | 苏州大学 | 一种基于多阶近邻预测的推荐系统及方法 |
CN113763111A (zh) * | 2021-02-10 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 物品搭配方法、装置及存储介质 |
CN113111266A (zh) * | 2021-04-28 | 2021-07-13 | 前海七剑科技(深圳)有限公司 | 目的地推荐方法、装置及计算机可读存储介质 |
CN116089788B (zh) * | 2023-03-23 | 2023-08-22 | 深圳市大数据研究院 | 在线缺失数据处理方法、装置、计算机设备及存储介质 |
CN116911693B (zh) * | 2023-09-11 | 2023-12-05 | 北京赛学科技有限公司 | 一种基于大数据的人员推荐方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012098950A (ja) * | 2010-11-02 | 2012-05-24 | Nippon Telegr & Teleph Corp <Ntt> | 類似ユーザ抽出方法、類似ユーザ抽出装置、類似ユーザ抽出プログラム |
CN103324690A (zh) * | 2013-06-03 | 2013-09-25 | 焦点科技股份有限公司 | 基于因子化条件受限玻尔兹曼机的混合推荐方法 |
CN107256494A (zh) * | 2017-05-18 | 2017-10-17 | 深圳大学 | 一种物品推荐方法及装置 |
CN107943864A (zh) * | 2017-11-10 | 2018-04-20 | 阿基米德(上海)传媒有限公司 | 一种多媒体内容媒体下安全可控的智能推荐系统 |
CN108985830A (zh) * | 2018-07-05 | 2018-12-11 | 北京邮电大学 | 基于异质信息网络的推荐评分方法、装置 |
-
2019
- 2019-01-22 CN CN201910058902.3A patent/CN109783738B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012098950A (ja) * | 2010-11-02 | 2012-05-24 | Nippon Telegr & Teleph Corp <Ntt> | 類似ユーザ抽出方法、類似ユーザ抽出装置、類似ユーザ抽出プログラム |
CN103324690A (zh) * | 2013-06-03 | 2013-09-25 | 焦点科技股份有限公司 | 基于因子化条件受限玻尔兹曼机的混合推荐方法 |
CN107256494A (zh) * | 2017-05-18 | 2017-10-17 | 深圳大学 | 一种物品推荐方法及装置 |
CN107943864A (zh) * | 2017-11-10 | 2018-04-20 | 阿基米德(上海)传媒有限公司 | 一种多媒体内容媒体下安全可控的智能推荐系统 |
CN108985830A (zh) * | 2018-07-05 | 2018-12-11 | 北京邮电大学 | 基于异质信息网络的推荐评分方法、装置 |
Non-Patent Citations (2)
Title |
---|
Deep Matrix Factorization Models for Recommender Systems;Hong-Jian Xue et al.;《Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence (IJCAI-17)》;20170831;第49-56页 * |
ELM based imputation-boosted proactive recommender systems;Punam Bedi et al.;《2016 Intl. Conference on Advances in Computing, Communications and Informatics (ICACCI)》;20161231;第60-74页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109783738A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109783738B (zh) | 一种基于多相似度的双极限学习机混合协同过滤推荐方法 | |
CN108648049B (zh) | 一种基于用户行为区别建模的序列推荐方法 | |
Jiang et al. | Maximizing customer satisfaction through an online recommendation system: A novel associative classification model | |
Bauer et al. | Recommender systems based on quantitative implicit customer feedback | |
CN110362738B (zh) | 一种基于深度学习的结合信任和影响力的个性化推荐方法 | |
CN112184391B (zh) | 一种推荐模型的训练方法、介质、电子设备和推荐模型 | |
CN107545471B (zh) | 一种基于高斯混合的大数据智能推荐方法 | |
CN109087178A (zh) | 商品推荐方法和装置 | |
Desirena et al. | Maximizing customer lifetime value using stacked neural networks: An insurance industry application | |
CN113268656A (zh) | 一种用户推荐方法、装置、电子设备及计算机存储介质 | |
CN112115358A (zh) | 一种利用知识图谱中多跳路径特征的个性化推荐方法 | |
Salehi | An effective recommendation based on user behaviour: a hybrid of sequential pattern of user and attributes of product | |
Singh et al. | Footwear size recommendation system | |
CN113610610B (zh) | 基于图神经网络和评论相似度的会话推荐方法和系统 | |
Hazrati et al. | Entity representation for pairwise collaborative ranking using restricted Boltzmann machine | |
Fareed et al. | A collaborative filtering recommendation framework utilizing social networks | |
CN113763095B (zh) | 信息推荐方法、装置和模型训练方法、装置 | |
CN111815410B (zh) | 基于选择性邻域信息的商品推荐方法 | |
Revankar et al. | Survey on collaborative filtering technique in recommendation system | |
Esmeli et al. | Improving session based recommendation by diversity awareness | |
Palaniappan et al. | Profile and Rating Similarity Analysis for Recommendation Systems Using Deep Learning. | |
CN116911949A (zh) | 基于边界排名损失和邻域感知图神经网络的物品推荐方法 | |
Ifada et al. | Do-rank: DCG optimization for learning-to-rank in tag-based item recommendation systems | |
Kumari et al. | A Semantic Approach to Solve Scalability, Data Sparsity and Cold-Start Problems in Movie Recommendation Systems | |
Lu et al. | Artificial immune network with feature selection for bank term deposit recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |