CN111104606B - 一种基于权重的条件游走图推荐方法 - Google Patents
一种基于权重的条件游走图推荐方法 Download PDFInfo
- Publication number
- CN111104606B CN111104606B CN201911241398.7A CN201911241398A CN111104606B CN 111104606 B CN111104606 B CN 111104606B CN 201911241398 A CN201911241398 A CN 201911241398A CN 111104606 B CN111104606 B CN 111104606B
- Authority
- CN
- China
- Prior art keywords
- user
- article
- node
- weight
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于权重的条件游走图推荐方法,包括利用用户‑物品评分矩阵,物品‑物品相似度矩阵结合标签,构造用户‑标签‑物品带有权重的有向图,并在图上条件游走,对每个用户生成不同的转移概率矩阵,迭代收敛之后生成推荐列表。与常用的协同过滤推荐方法相比,本发明略微提升了推荐的准确性,显著的提升了推荐的多样性和覆盖率,解决了协同过滤推荐方法中存在的多样性不足和物品冷启动的问题。
Description
技术领域
本发明属于信息推荐的技术领域,具体涉及一种基于权重的条件游走图推荐方法。
背景技术
随着互联网和信息技术行业的发展,人们每天都会在互联网上进行各种各样的活动,如:看电影,购物,阅读新闻等。随着互联网上信息越来越多,人们越来越难以从海量的信息中找出最适合自己的商品及服务,人们从信息匮乏时代进入了信息过载时代。
个性化推荐系统的出现解决了信息过载的问题。其中基于协同过滤的基于权重的条件游走图推荐方法是目前使用最为广泛的基于权重的条件游走图推荐方法,其过滤原理是根据用户以往的行为数据来预测用户将来的行为。这种基于权重的条件游走图推荐方法的主要不足有两方面,一是片面的考虑推荐的准确性,陷入“信息茧房”,例如某个用户在电影网站只看过喜剧片,那么使用协同过滤推荐给用户的将全是喜剧片,推荐结果缺乏多样性。二是存在物品冷启动的问题,对于新加入的物品,由于不存在以往的行为数据,使用协同过滤推荐,新加入的物品将不会出现在用户的推荐列表中。
据此,如何在不降低推荐的准确性前提下,提高基于权重的条件游走图推荐方法结果的多样性,并且解决新加入物品的冷启动问题。
发明内容
本发明的目的在于针对现有技术中的上述不足,提供一种基于权重的条件游走图推荐方法,以解决如何在不降低推荐的准确性前提下,提高基于权重的条件游走图推荐方法结果的多样性,并且解决新加入物品的冷启动的问题。
为达到上述目的,本发明采取的技术方案是:
一种基于权重的条件游走图推荐方法,其包括:
S1、根据用户对商品的评分信息,构建用户-物品行为矩阵;
S2、根据用户-物品行为矩阵,计算用户与用户之间的相似度,得到用户-用户相似度矩阵;
S3、计算用户i对物品j的打分;
S4、构建用户-物品打分矩阵;
S5、基于余弦相似度公式计算物品与物品之间的相似度,并构造物品-物品相似度矩阵;
S6、加入标签,构造用户-标签-物品之间带有权重的有向图;
S7、从用户节点开始在有向图中进行条件游走,用户直接游走到物品节点的概率为α,其中0<α<1,游走到标签节点的概率为1-α;
S8、若用户游走到标签节点后,只能继续游走到物品节点;
S9、若用户游走到物品节点后,有β,0<β<1,的概率根据物品相似度权重游走到另一个物品节点,有1-β的概率重新回到用户节点;
S10、根据步骤S7-S9,构建一个有关节点之间的转移概率矩阵P;
S11、给定所有节点的概率相同的一个初始条件,即给定t0初始向量,将该初始向量点乘转移概率矩阵P,所得结果再点乘转移概率矩阵P,迭代若干次后t向量收敛;
S12、去除t向量中的用户和标签节点,对剩余的物品节点排序,得到用户的推荐列表。
优选地,步骤S1中用户-物品行为矩阵中,用户对某物品有购买行为对应矩阵项记录为1否则记为0。
优选地,步骤S2中采用余弦相似度公式计算用户之间的相似度:
其中,N(u)表示用户u有过行为的物品集合,N(v)表示用户v有过行为的物品集合,Su,v表示用户u和用户v的相似度。
优选地,步骤S3计算用户i对物品j的打分为:
其中,Ru,i是用户u对物品i的打分,U(u,K)为与用户u相似度最高的K个用户集合,ru,i是用户u对物品i的行为记录,u购买过I,则ru,i=1,否则ru,i=0。
优选地,步骤S6中加入标签,构造用户-标签-物品之间带有权重的有向图,用户与物品节点之间的权重为用户对物品的打分Ru,i,用户与标签节点之间的权重为1,标签物品之间权重,若物品含有此标签则权重为1,否则权重为0,物品与物品节点之间的权重为物品之间的相似度Si,j。
优选地,步骤S7中用户节点游走到下一个节点i的概率为PR(i):
其中,I为全部物品的集合,T为全部标签的集合,n为标签节点的个数。
优选地,步骤S8中游走到标签节点后,只能继续游走到物品节点,游走到物品节点i的概率PR(i)为:
其中,m为这一个标签下的物品数量。
本发明提供的基于权重的条件游走图推荐方法,具有以下有益效果:
本发明与常用的协同过滤推荐方法相比,本发明略微提升了推荐的准确性,显著的提升了推荐的多样性和覆盖率,解决了协同过滤基于权重的条件游走图推荐方法中存在的多样性不足和物品冷启动的问题。
附图说明
图1为基于权重的条件游走图推荐方法的用户-物品-标签图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
根据本申请的一个实施例,参考图1,本方案的基于权重的条件游走图推荐方法,包括:
步骤S1、根据用户对商品的评分信息,建立用户-物品行为矩阵,用户对某物品有购买行为对应矩阵项记录为1否则记为0。
S2、根据用户-物品行为矩阵,计算用户与用户之间的相似度,得到用户-用户相似度矩阵,采用余弦相似度计算用户之间的相似度:
其中,N(u)表示用户u有过行为的物品集合,N(v)表示用户v有过行为的物品集合,Su,v表示用户u和用户v的相似度。
步骤S3、计算用户i对物品j的打分为:
其中,Ru,i是用户u对物品i的打分,U(u,K)为与用户u相似度最高的K个用户集合,ru,i是用户u对物品i的行为记录,u购买过I,则ru,i=1否则ru,i=0。
步骤S4、在计算出所有用户对所有物品的打分之后,构建用户-物品打分矩阵;
步骤S5、采用余弦相似度公式计算出物品与物品之间的相似度,并构造物品-物品相似度矩阵。
步骤S6、参考图1,加入标签,构造用户-标签-物品之间带有权重的有向图,用户与物品节点之间的权重为用户对物品的打分Ru,i,用户与标签节点之间的权重为1,标签物品之间权重,若物品含有此标签则权重为1,否则权重为0,物品与物品节点之间的权重为物品之间的相似度Si,j。
步骤S7、从用户节点开始在有向图中进行条件游走,用户直接游走到物品节点的概率为α,其中0<α<1,游走到标签节点的概率为1-α。
用户节点游走到下一个节点i的概率为PR(i):
其中,I为全部物品的集合,T为全部标签的集合,n为标签节点的个数。
步骤S8、游走到标签节点后,只能继续游走到物品节点,游走到物品节点i的概率为:
其中,m为这一个标签下的物品数量。
步骤S9、若用户游走到物品节点后,有β,0<β<1,的概率根据物品相似度权重游走到另一个物品节点,有1-β的概率重新回到用户节点。
S10、根据步骤S7-S9,构建一个有关节点之间的转移概率矩阵P;
S11、给定所有节点的概率相同的一个初始条件,即给定t0初始向量,将该初始向量点乘转移概率矩阵P,所得结果再点乘转移概率矩阵P,迭代若干次后t向量收敛;
S12、去除t向量中的用户和标签节点,对剩余的物品节点排序,得到用户的推荐列表。
针对movielens数据集(包含多个用户对多部电影的评价数据,也包括电影元数据信息)本发明与协同过滤推荐方法的对比实验结果如下表(参数α=0.86,β=0.4):
由上述表格可知,本发明与常用的协同过滤推荐方法相比,本发明略微提升了推荐的准确性,显著的提升了推荐的多样性和覆盖率,解决了协同过滤推荐方法中存在的多样性不足和物品冷启动的问题。
虽然结合附图对发明的具体实施方式进行了详细地描述,但不应理解为对本专利的保护范围的限定。在权利要求书所描述的范围内,本领域技术人员不经创造性劳动即可做出的各种修改和变形仍属本专利的保护范围。
Claims (4)
1.一种基于权重的条件游走图推荐方法,其特征在于,包括:
S1、根据用户对商品的评分信息,构建用户-物品行为矩阵;
S2、根据用户-物品行为矩阵,计算用户与用户之间的相似度,得到用户-用户相似度矩阵;
S3、计算用户i对物品j的打分;
S4、构建用户-物品打分矩阵;
S5、基于余弦相似度公式计算物品与物品之间的相似度,并构造物品-物品相似度矩阵;
S6、加入标签,构造用户-标签-物品之间带有权重的有向图;
S7、从用户节点开始在有向图中进行条件游走,用户直接游走到物品节点的概率为α,其中0<α<1,游走到标签节点的概率为1-α;
S8、若用户游走到标签节点后,只能继续游走到物品节点;
S9、若用户游走到物品节点后,有β,0<β<1,的概率根据物品相似度权重游走到另一个物品节点,有1-β的概率重新回到用户节点;
S10、根据步骤S7-S9,构建一个有关节点之间的转移概率矩阵P;
S11、给定所有节点的概率相同的一个初始条件,即给定t 0初始向量,将该初始向量点乘转移概率矩阵P,所得结果再点乘转移概率矩阵P,迭代若干次后t向量收敛;
S12、去除t向量中的用户和标签节点,对剩余的物品节点排序,得到用户的推荐列表;
步骤S3计算用户i对物品j的打分为:
其中,Ru,i是用户u对物品i的打分,U(u,K)为与用户u相似度最高的K个用户集合,ru,i是用户u对物品i的行为记录,u购买过i,则ru,i=1,否则ru,i =0,Su,v表示用户u和用户v的相似度;
步骤S6中加入标签,构造用户-标签-物品之间带有权重的有向图,用户与物品节点之间的权重为用户对物品的打分Ru,i,用户与标签节点之间的权重为1,标签物品之间权重,若物品含有此标签则权重为1,否则权重为0,物品与物品节点之间的权重为物品之间的相似度Si,j;
步骤S7中用户节点游走到下一个节点i的概率为PR(i):
其中,I为全部物品的集合,T为全部标签的集合,n为标签节点的个数。
2.根据权利要求1所述的基于权重的条件游走图推荐方法,其特征在于:所述步骤S1中用户-物品行为矩阵中,用户对某物品有购买行为对应矩阵项记录为1否则记为0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911241398.7A CN111104606B (zh) | 2019-12-06 | 2019-12-06 | 一种基于权重的条件游走图推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911241398.7A CN111104606B (zh) | 2019-12-06 | 2019-12-06 | 一种基于权重的条件游走图推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111104606A CN111104606A (zh) | 2020-05-05 |
CN111104606B true CN111104606B (zh) | 2022-10-21 |
Family
ID=70421754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911241398.7A Active CN111104606B (zh) | 2019-12-06 | 2019-12-06 | 一种基于权重的条件游走图推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111104606B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858915A (zh) * | 2020-08-07 | 2020-10-30 | 成都理工大学 | 基于标签相似度的信息推荐方法及系统 |
CN112380417A (zh) * | 2020-12-01 | 2021-02-19 | 厦门市美亚柏科信息股份有限公司 | 一种基于标签与图的网页推荐方法、终端设备及存储介质 |
CN112650944A (zh) * | 2020-12-29 | 2021-04-13 | 哈尔滨理工大学 | 一种基于高阶连接图的协同过滤推荐算法 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010160029A (ja) * | 2009-01-07 | 2010-07-22 | Toyota Motor Corp | Nmr試料管および測定システム |
CN101853470A (zh) * | 2010-05-28 | 2010-10-06 | 浙江大学 | 一种基于社会化标签的协同过滤方法 |
CN103116639A (zh) * | 2013-02-20 | 2013-05-22 | 新浪网技术(中国)有限公司 | 基于用户-物品二分图模型的物品推荐方法及系统 |
CN105893585A (zh) * | 2016-04-05 | 2016-08-24 | 电子科技大学 | 一种结合标签数据的二部图模型学术论文推荐方法 |
CN105913296A (zh) * | 2016-04-01 | 2016-08-31 | 北京理工大学 | 一种基于图的个性化推荐方法 |
CN107590243A (zh) * | 2017-09-14 | 2018-01-16 | 中国人民解放军信息工程大学 | 基于随机游走和多样性图排序的个性化服务推荐方法 |
CN107657043A (zh) * | 2017-09-30 | 2018-02-02 | 北京工业大学 | 一种基于内容的混合图模型图像推荐方法 |
CN108427730A (zh) * | 2018-02-27 | 2018-08-21 | 江苏大学 | 一种基于随机游走和条件随机场的社会标签推荐方法 |
CN109885758A (zh) * | 2019-01-16 | 2019-06-14 | 西北工业大学 | 一种基于二部图的新型随机游走的推荐方法 |
CN109978657A (zh) * | 2019-03-07 | 2019-07-05 | 北京工业大学 | 一种面向众智平台的改进随机游走图模式推荐算法 |
CN110162690A (zh) * | 2018-10-23 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 确定用户对物品的兴趣度的方法与装置、设备和存储介质 |
CN110322053A (zh) * | 2019-06-13 | 2019-10-11 | 华中科技大学 | 一种基于图随机游走构建局部矩阵的评分预测方法 |
CN110442977A (zh) * | 2019-08-08 | 2019-11-12 | 广州华建工智慧科技有限公司 | 基于建筑施工工序网络推荐的移动端bim模型智能缓存方法 |
CN110503506A (zh) * | 2019-07-05 | 2019-11-26 | 平安科技(深圳)有限公司 | 基于评分数据的物品推荐方法、装置及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103732619A (zh) * | 2011-05-31 | 2014-04-16 | 普罗拜奥金股份有限公司 | 用于制备具有毒素、佐剂、检测标签和药代动力学半衰期延长剂的蛋白质的岩藻糖连接位点特异性缀合物的方法 |
-
2019
- 2019-12-06 CN CN201911241398.7A patent/CN111104606B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010160029A (ja) * | 2009-01-07 | 2010-07-22 | Toyota Motor Corp | Nmr試料管および測定システム |
CN101853470A (zh) * | 2010-05-28 | 2010-10-06 | 浙江大学 | 一种基于社会化标签的协同过滤方法 |
CN103116639A (zh) * | 2013-02-20 | 2013-05-22 | 新浪网技术(中国)有限公司 | 基于用户-物品二分图模型的物品推荐方法及系统 |
CN105913296A (zh) * | 2016-04-01 | 2016-08-31 | 北京理工大学 | 一种基于图的个性化推荐方法 |
CN105893585A (zh) * | 2016-04-05 | 2016-08-24 | 电子科技大学 | 一种结合标签数据的二部图模型学术论文推荐方法 |
CN107590243A (zh) * | 2017-09-14 | 2018-01-16 | 中国人民解放军信息工程大学 | 基于随机游走和多样性图排序的个性化服务推荐方法 |
CN107657043A (zh) * | 2017-09-30 | 2018-02-02 | 北京工业大学 | 一种基于内容的混合图模型图像推荐方法 |
CN108427730A (zh) * | 2018-02-27 | 2018-08-21 | 江苏大学 | 一种基于随机游走和条件随机场的社会标签推荐方法 |
CN110162690A (zh) * | 2018-10-23 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 确定用户对物品的兴趣度的方法与装置、设备和存储介质 |
CN109885758A (zh) * | 2019-01-16 | 2019-06-14 | 西北工业大学 | 一种基于二部图的新型随机游走的推荐方法 |
CN109978657A (zh) * | 2019-03-07 | 2019-07-05 | 北京工业大学 | 一种面向众智平台的改进随机游走图模式推荐算法 |
CN110322053A (zh) * | 2019-06-13 | 2019-10-11 | 华中科技大学 | 一种基于图随机游走构建局部矩阵的评分预测方法 |
CN110503506A (zh) * | 2019-07-05 | 2019-11-26 | 平安科技(深圳)有限公司 | 基于评分数据的物品推荐方法、装置及介质 |
CN110442977A (zh) * | 2019-08-08 | 2019-11-12 | 广州华建工智慧科技有限公司 | 基于建筑施工工序网络推荐的移动端bim模型智能缓存方法 |
Non-Patent Citations (2)
Title |
---|
基于信任网络随机游走模型的协同过滤推荐;何明等;《计算机科学》;20160615;第43卷(第06期);257-262 * |
相似性特征对链路预测的影响与增强;蔡彪等;《计算机应用》;20210323;第41卷(第09期);2569-2577 * |
Also Published As
Publication number | Publication date |
---|---|
CN111104606A (zh) | 2020-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tuan et al. | 3D convolutional networks for session-based recommendation with content features | |
CN111104606B (zh) | 一种基于权重的条件游走图推荐方法 | |
CN102789462B (zh) | 一种项目推荐方法及系统 | |
CN106447463A (zh) | 一种基于马尔科夫决策过程模型的商品推荐方法 | |
CN102073717A (zh) | 一种面向垂直电子商务网站的首页推荐方法 | |
Verma et al. | An intelligent approach to Big Data analytics for sustainable retail environment using Apriori-MapReduce framework | |
CN108109058B (zh) | 一种融合人格特质和物品标签的单分类协同过滤方法 | |
CN111310038B (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
Aharon et al. | Off-set: one-pass factorization of feature sets for online recommendation in persistent cold start settings | |
CN105894310A (zh) | 一种个性化推荐方法 | |
CN113643103A (zh) | 基于用户相似度的产品推荐方法、装置、设备及存储介质 | |
JP2018013925A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN107480227A (zh) | 一种基于大数据的信息推送方法 | |
CN110175892B (zh) | 基于消费者行为的热力球双向推荐方法及系统 | |
Aprilianti et al. | Implementation of weighted parallel hybrid recommender systems for e-commerce in indonesia | |
CN106447364A (zh) | 信息推荐方法及装置 | |
CA3111094A1 (en) | Noise contrastive estimation for collaborative filtering | |
CN113269232B (zh) | 模型训练方法、向量化召回方法、相关设备及存储介质 | |
CN110020918B (zh) | 一种推荐信息生成方法和系统 | |
CN110321490B (zh) | 推荐方法、装置、设备及计算机可读存储介质 | |
CN108763515B (zh) | 一种基于概率矩阵分解的时间敏感个性化推荐方法 | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 | |
CN114861079A (zh) | 一种融合商品特征的协同过滤推荐方法和系统 | |
Ito et al. | Deep Neural Network Incorporating CNN and MF for Item-Based Fashion Recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |