CN112650944A - 一种基于高阶连接图的协同过滤推荐算法 - Google Patents

一种基于高阶连接图的协同过滤推荐算法 Download PDF

Info

Publication number
CN112650944A
CN112650944A CN202011591771.4A CN202011591771A CN112650944A CN 112650944 A CN112650944 A CN 112650944A CN 202011591771 A CN202011591771 A CN 202011591771A CN 112650944 A CN112650944 A CN 112650944A
Authority
CN
China
Prior art keywords
order
users
graph
items
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011591771.4A
Other languages
English (en)
Inventor
吕衍河
李启瑞
贾伟楠
刘宇鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202011591771.4A priority Critical patent/CN112650944A/zh
Publication of CN112650944A publication Critical patent/CN112650944A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于高阶连接图的协同过滤推荐算法,属于推荐算法和推荐系统技术领域,本发明旨在缓解传统推荐算法在实际应用中的冷启动和数据稀疏的问题。针对此问题,本文引入了高阶连接图,通过对多用户多项目多关系进行建立统一的异构图,挖掘用户与用户、用户与项目和项目与项目之间的高阶关系,减缓数据稀疏性和冷启动对推荐结果的影响。本发明中,高阶连接图是一个异构图,其中节点充当实体,边表示实体之间的关系。项目及其属性可以映射到高阶连接图中以了解项目之间的高阶连接性。而且,用户和用户方信息也可以集成到图中,从而可以更准确地捕获用户与项目之间的关系以及用户的喜好。

Description

一种基于高阶连接图的协同过滤推荐算法
技术领域
本发明属于推荐系统技术领域,涉及一种基于高阶连接图的协同过滤推荐算法。
背景技术
随着互联网技术的快速发展,云计算、大数据、物联网等技术得到了空前的热度,互联网空间中各类数据的层出不穷,引发了数据规模的爆炸式增长。人类已经步入了内容过载、数据噪声泛滥的时代,可以通过各种途径获得更加丰富的信息,微博、微信等各种社交工具和自媒体给用户带来了更加便捷的信息获取渠道,与此同时,信息超负荷也成为了了人们遇到困难。这就导致了大数据时代的特点之一,数据容量极大,但数据价值密度很低,怎么从如此海量的数据中获取对于用户而言价值大的信息就至关重要。
推荐系统作为一种筛选信息的工具,存在于海量数据的基础上,可以有效解决信息过载的问题。推荐系统根据用户需求、兴趣等,通过推荐算法从海量数据中挖掘出用户感兴趣的项目(如信息、服务、物品等),并将结果以个性化列表的形式推荐给用户,以满足用户的需求。此外,推荐系统作为用户和信息之间的联系,不仅可以帮助用户发现自己需要的信息,还可以让信息展现在对其感兴趣的用户面前,从而实现数据生产者和数据消费者之间的双赢。
现有的推荐方法主要包括:依赖于直接用户-项目交互的协作过滤方法和基于内容的表征方法。基于ID的CF方法总是遭受冷启动问题,因为过时的项目经常被新的项目所替代。基于内容的方法完全忽略了协作信号。已经提出了将CF和内容相结合以进行推荐的混合方法来解决这些问题。然而,所有这些方法仍然遭受数据稀疏性问题,因为它们大多数都不能在推荐系统中广泛地利用高阶结构信息。
发明内容
鉴于此,本发明主要缓解传统推荐系统中冷启动和数据稀疏性问题,本发明主要使用了使用了高阶连接图,考虑用户与项目交互图中的高阶信息,提出了一种基于高阶连接图的协同过滤推荐算法。
综上,现有的模型大多数现有的基于CF的方法仅使用描述性特征(例如ID和属性)来构建用户和项目嵌入,而不考虑用户与项目交互图中的高阶信息。
为了达到上述目的,本发明提出一种基于高阶连接图的协同过滤推荐算法,其算法步骤如下:
步骤一:将多用户、多项目、多关系构造成一个统一的异构图(即高阶连接图)。将交互数据表示一个有向图Gknow=(V,E),它的节点是实体,而边是主体-属性-实体的三重联系。表现形式为每条边(头实体,关系,尾部实体)表示为来自实体eh到实体er的联系。。
步骤二:从高阶连接图中挖掘用户与项目之间的高阶关系,尤其是隐藏的高阶关系。表示为基于行为的连通性,例如
Figure BDA0002867166740000021
这表明u1将对i2表现出偏好,因为他的相似用户u2之前已采用i2
步骤三:进一步地,利用高阶关系可以更准确去的计算用户与项目之间的相似度。
步骤四:选出相似度最高的N个项目。
步骤五:计算目标用户与推荐项目的匹配分数。
步骤六:生成推荐列表
优选的,在所述推荐算法,首先是通过构造的高阶连接图来获取用户之间的高阶信息,总结项目与项目,用户与用户,用户与项目之间的关系,为推荐算法提供依据。
优选的,在所述推荐算法,通过利于用户与项目之间的高阶关系,丰富了用户数据,缓解数据稀疏性和冷启动问题,使其推荐结果更为准确。
优选的,在所述推荐算法,步骤三中,所述计算用户与用户和项目与项目之间的相似度的方法如下:
Figure BDA0002867166740000022
wuv表示用户u和v的相似度,N(v)和N(u)为用户v和用户u喜欢的物品集合。
计算项目与项目之间的相似度的方法如下:
Figure BDA0002867166740000031
sim(i,j)表示项目i和j的相似度,其中Ru,i表示用户u对物品i的打分,Ri表示第i个物品打分的平均值。
与现有技术相比,本发明的有益效果为:将用户与项目的复杂关系统一到一张异构图中,可以清晰的发掘出用户和项目之间的高阶关系,丰富了用户和项目之间的数据,有效缓解冷启动和数据稀疏的问题;同时,通过高阶连接图,可以清晰展现出用户的喜好,对最后的推荐结果解释性高。
附图说明
图1为本发明一种基于高阶连接图的协同过滤推荐算法的流程图。
图2为本发明一种基于高阶连接图的协同过滤推荐算法实例的流程图。
具体实施方式
下面将结合本发明实施的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅仅是本发明一部分实施例子,而不是全部实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于高阶连接图的协同过滤推荐算法,其基本实现过程如下:
步骤一:将多用户、多项目、多关系构造成一个统一的异构图(即高阶连接图)。
步骤二:从高阶连接图中挖掘用户与项目之间的高阶关系,尤其是隐藏的高阶关系。。
步骤三:进一步地,利用高阶关系可以更准确去的计算用户与项目之间的相似度。
步骤四:选出相似度最高的N个项目。
步骤五:计算目标用户与推荐项目的匹配分数。
步骤六:生成推荐列表
进一步的,具体的推荐实例过程如图2所示:
(1)将用户1和用户2看过的电影以及用户之间的关系,电影的类型,电影的导演,演员等信息全部出现在一个统一的图中。
(2)发掘用户和项目之间的高阶关系,例如用户1看过电影《泰囧》,而用户2看过电影《无人区》,这其中隐藏的高阶信息是:两部电影都有演员徐峥。再比如用户1看过电影《泰囧》和《羞羞的铁拳》,这其中隐藏的高阶信息是:这两部电影都是喜剧类型。
(3)通过高阶关系,就可以更精确的确定用户与用户或者项目与项目之间的相似度。例如,用户1与用户2都看过徐峥出演的电影。
(4)通过相似度,就可以把电影《疯狂的外星人》和《我不是药神》推荐给用户1。其原因是,用户1之前看过徐峥出演的电影,所以推荐《我不是药神》;而且用户1之前看过喜剧类型的电影,而且其朋友用户2看过宁浩导演的电影,所以把宁浩导演的喜剧片《疯狂的外星人》推荐给用户1。
(5)最后的推荐结果是电影《疯狂的外星人》和《我不是药神》推荐给用户1;《疯狂的外星人》同时也推荐给用户2。
(6)将最后的结果呈现给目标用户
综上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于高阶连接图的协同过滤推荐算法,主要包括以下步骤:
步骤一:将多用户、多项目、多关系构造成一个统一的异构图(即高阶连接图)。将交互数据表示一个有向图Gknow=(V,E),它的节点是实体,而边是主体-属性-实体的三重联系。表现形式为每条边(头实体,关系,尾部实体)表示为来自实体eh到实体er的联系。
步骤二:从高阶连接图中挖掘用户与项目之间的高阶关系,尤其是隐藏的高阶关系。表示为基于行为的连通性,例如
Figure FDA0002867166730000011
这表明u1将对i2表现出偏好,因为他的相似用户u2之前已采用i2
步骤三:进一步地,利用高阶关系可以更准确去的计算用户与用户和项目与项目之间的相似度。
步骤四:选出相似度最高的N个项目。
步骤五:计算目标用户与推荐项目的匹配分数。
步骤六:生成推荐列表
2.根据权利要求书1中所述一种基于高阶连接图的协同过滤推荐算法,其特征在于,首先是通过构造的高阶连接图来获取用户之间的高阶信息,总结项目与项目,用户与用户,用户与项目之间的关系,为推荐算法提供依据。
3.根据权利要求书1中所述一种基于高阶连接图的协同过滤推荐算法,其特征在于,通过利于用户与项目之间的高阶关系,丰富了用户数据,缓解数据稀疏性和冷启动问题,使其推荐结果更为准确。
4.根据权利要求书1中所述一种基于高阶连接图的协同过滤推荐算法,其特征在于,步骤三中,所述用户与用户和项目与项目之间的相似度的方法如下:
Figure FDA0002867166730000012
wuv表示用户u和v的相似度,N(v)和N(u)为用户v和用户u喜欢的物品集合。
Figure FDA0002867166730000013
sim(i,j)表示项目i和j的相似度,其中Ru,i表示用户u对物品i的打分,Ri表示第i个物品打分的平均值。
CN202011591771.4A 2020-12-29 2020-12-29 一种基于高阶连接图的协同过滤推荐算法 Pending CN112650944A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011591771.4A CN112650944A (zh) 2020-12-29 2020-12-29 一种基于高阶连接图的协同过滤推荐算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011591771.4A CN112650944A (zh) 2020-12-29 2020-12-29 一种基于高阶连接图的协同过滤推荐算法

Publications (1)

Publication Number Publication Date
CN112650944A true CN112650944A (zh) 2021-04-13

Family

ID=75363840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011591771.4A Pending CN112650944A (zh) 2020-12-29 2020-12-29 一种基于高阶连接图的协同过滤推荐算法

Country Status (1)

Country Link
CN (1) CN112650944A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354862A (zh) * 2016-09-06 2017-01-25 山东大学 一种异构网络中多维个性化推荐方法
CN106503022A (zh) * 2015-09-08 2017-03-15 北京邮电大学 推送推荐信息的方法和装置
CN111104606A (zh) * 2019-12-06 2020-05-05 成都理工大学 一种基于权重的条件游走图推荐方法
CN111125540A (zh) * 2019-11-12 2020-05-08 华侨大学 一种融合知识图谱表示学习和偏置矩阵分解的推荐方法
CN111310045A (zh) * 2020-02-16 2020-06-19 重庆邮电大学 一种基于元路径的网络嵌入的电影推荐方法
CN111611472A (zh) * 2020-03-31 2020-09-01 清华大学 一种基于图卷积神经网络的捆绑推荐方法及系统
CN111931076A (zh) * 2020-09-22 2020-11-13 平安国际智慧城市科技股份有限公司 基于有权有向图进行关系推荐的方法、装置和计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503022A (zh) * 2015-09-08 2017-03-15 北京邮电大学 推送推荐信息的方法和装置
CN106354862A (zh) * 2016-09-06 2017-01-25 山东大学 一种异构网络中多维个性化推荐方法
CN111125540A (zh) * 2019-11-12 2020-05-08 华侨大学 一种融合知识图谱表示学习和偏置矩阵分解的推荐方法
CN111104606A (zh) * 2019-12-06 2020-05-05 成都理工大学 一种基于权重的条件游走图推荐方法
CN111310045A (zh) * 2020-02-16 2020-06-19 重庆邮电大学 一种基于元路径的网络嵌入的电影推荐方法
CN111611472A (zh) * 2020-03-31 2020-09-01 清华大学 一种基于图卷积神经网络的捆绑推荐方法及系统
CN111931076A (zh) * 2020-09-22 2020-11-13 平安国际智慧城市科技股份有限公司 基于有权有向图进行关系推荐的方法、装置和计算机设备

Similar Documents

Publication Publication Date Title
CN106802956B (zh) 一种基于加权异构信息网络的电影推荐方法
Ahmed et al. Movie recommendation system using clustering and pattern recognition network
CN104462385B (zh) 一种基于用户兴趣模型的电影个性化相似度计算方法
Zhang et al. Collaborative filtering recommendation algorithm based on user preference derived from item domain features
Ma et al. Social network and tag sources based augmenting collaborative recommender system
TWI475412B (zh) 數位內容次序調整方法和數位內容匯流器
Sen et al. Video skimming: Taxonomy and comprehensive survey
Zhong et al. Video summarization via spatio-temporal deep architecture
CN110083764A (zh) 一种协同过滤算法冷启动问题的解决方法
KR20150067242A (ko) 멀티미디어 플랫폼을 통해서 멀티미디어 컨텐츠를 추천하기 위한 방법 및 시스템
Stanescu et al. A hybrid recommender system: User profiling from keywords and ratings
Wegba et al. Interactive storytelling for movie recommendation through latent semantic analysis
Soni et al. A three way hybrid movie recommendation syste
CN110069713A (zh) 一种基于用户上下文感知的个性化推荐方法
CN112765490A (zh) 一种基于知识图谱和图卷积网络的信息推荐方法及系统
CN114329222B (zh) 一种融合注意力机制和双端知识图谱的电影推荐方法
Kotsogiannis et al. Directed edge recommender system
Wegba et al. Interactive movie recommendation through latent semantic analysis and storytelling
CN112650944A (zh) 一种基于高阶连接图的协同过滤推荐算法
Sun Music Individualization Recommendation System Based on Big Data Analysis
He et al. Comparison of discretization approaches for granular association rule mining
CN110727863A (zh) 一种基于复杂网络协同过滤的项目推荐方法
Sridharan Introducing serendipity in recommender systems through collaborative methods
Dong Music Recommendation System Based on Machine Learning
Manzato et al. A multimedia recommender system based on enriched user profiles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210413

WD01 Invention patent application deemed withdrawn after publication