CN112417313A - 一种基于知识图卷积网络的模型混合推荐方法 - Google Patents
一种基于知识图卷积网络的模型混合推荐方法 Download PDFInfo
- Publication number
- CN112417313A CN112417313A CN202011326292.XA CN202011326292A CN112417313A CN 112417313 A CN112417313 A CN 112417313A CN 202011326292 A CN202011326292 A CN 202011326292A CN 112417313 A CN112417313 A CN 112417313A
- Authority
- CN
- China
- Prior art keywords
- entity
- user
- knowledge graph
- item
- project
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图卷积网络的模型混合推荐方法,在将知识图谱引入推荐系统的同时加入了基于用户的协同过滤以捕获用户间的相关性,通过在推荐系统的推荐过程中引入知识图谱,并利用用户的历史交互数据将物品的信息与其邻居进行有偏好地聚合,同时在计算用户‑关系分值时加入注意力机制计算用户交互过的物品和候选物品之间的相似性,接下来再融入基于用户的协同过滤,进行准确的推荐。该方法弥补了KGCN存在的缺陷的同时,在一定程度上解决了协同过滤的稀疏性和冷启动问题。
Description
技术领域
本发明涉及机器学习领域,尤其是一种基于知识图卷积网络的模型混合推 荐方法。
背景技术
随着互联网技术的迅猛发展,人们可以足不出户便轻松获得诸如新闻[1]、 影视[2]和商品[3]等大量的网上资讯。如何从如此海量的信息中剔除用户不需 要的信息而获取用户所需的有用信息,如何有效提升用户体验成为了人们关注 的焦点。为了缓解信息过载,推荐系统应运而生。
推荐系统作为一种筛选信息的工具,可以有效解决信息过载问题,通过个 性化的方式提供满足用户需求的内容。在早期的推荐系统中,协同过滤推荐算 法是应用广泛的技术。基于协同过滤的算法[4-6]通过挖掘用户的历史数据来发 现用户的偏好。但是基于协同过滤的算法通常存在用户-物品交互的稀疏性[7] 和冷启动问题[8]。为解决稀疏性和冷启动问题,一些研究者利用用户和物品的 属性来弥补冷启动和稀疏性问题以提高推荐性能[9-11]。近年来一些研究[12-16] 不再使用单纯的属性,而是认为属性间是有关系的,这种关系构成了知识图谱。 将知识图谱作为附加信息引入到推荐系统以实现物品的个性化混合推荐方法 在一定程度上可以缓解冷启动、稀疏矩阵的问题。进一步,文献[17]将知识图 谱和图卷积结合,提出了用于推荐系统的知识图卷积网络(KGCN),这是一 种捕捉知识图谱中语义信息和高阶结构信息的推荐模型。KGCN的核心思想是 在计算给定实体的知识图表示的过程中有偏好地聚合和合并实体的邻居信息。 但是KGCN只捕获了项目间的相关性用于推荐预测,而忽视了用户间的相关 性以及用户的历史交互记录。
近年来,因混合推荐算法结合多种推荐方法,能实现算法间的取长补短, 提高推荐系统的性能,而成为了研究热点[18-20]。其中,将深度学习融入推荐 领域作为一个新方向得到了产业界和学术界的青睐。推荐方法中融合深度学习 技术,可以有效解决传统推荐系统中冷启动、稀疏矩阵等问题,提高推荐系统 的性能和推荐精度。研究中,KGCN和KG两种方法各自具有一定优势。
KGCN是推荐系统研究的一种新视角,主要受GCN非光谱法思想的启发。 非光谱方法直接在原始图上操作,并为节点组定义卷积。为了处理大小各异的 邻域并保持卷积神经网络(Convolutional Neural Networks,CNN)的权重共享特 性,研究人员建议针对每个节点度学习权重矩阵[21],从图中提取局部相连的 区域[22],或采样一组固定大小的邻域作为支持大小[23]。KGCN的主要思想 是在计算知识图谱中给定实体的表示时,将带有偏差的邻域信息进行聚合和合 并。将KG引入推荐系统具有以下优点:一是可以利用图中节点之间丰富的语 义关系挖掘其潜在的关联以提高结果的准确性;二是可以增加项目的多样性;三是可以利用用户的历史交互数据增加系统的可解释性。尽管具有上述优点, 但由于其高维度和异质性,在推荐系统中中使用KG仍具有挑战性。一种方法 是通过知识图嵌入方法对KG进行预处理[24]。另一种方法是设计图算法以利 用KG结构。基于图结构的方法并不局限于实体间具体的连接路径,而是将知 识图谱看做以特定用户/项目为中心的巨大关系网。采用以用户/项目为中心向 外扩散的方式,来提取对应实体的特征应用到推荐当中。如何将知识图谱中的 辅助信息有效的提取出来并应用到推荐系统的场景中是最核心的问题。针对这 个问题,一些科研工作者进行了尝试:文献[13]提出了用户兴趣扩散的思想, 以用户历史交互的各个项目实体为中心进行扩散来提取用户的兴趣特征。文献[25]尝试利用知识图谱的结构特征,将本体融进协同过滤算法。文献[15]尝试 将知识图谱表示学习算法与基于隐性反馈的协同过滤相结合,把原始数据转化 为偏好序列进行参数学习,加强了协同过滤推荐算法的性能。文献[26]将表示 学习的思想应用于知识图谱领域,提出了一种知识图谱表示学习算法TransE。 文献[17]将GCN与知识图谱相结合来提取推荐项目的嵌入特征应用到推荐系 统中。但上述方法多是根据项目的相似性进行推荐,而忽略了用户的相似性。
综上所述,KGCN主要用于捕获物品之间的相关性,未考虑捕获用户间的 相关性以及传统的协同过滤推荐系统存在的稀疏性和冷启动问题,从而导致推 荐结果不够准确。
本发明涉及到的参考文献:
1.Ge,S.,et al.Graph Enhanced Representation Learning for NewsRecommendation.in WWW'20:The Web Conference 2020.2020.
2.Iliopoulou,K.,et al.,Improving Movie Recommendation SystemsFiltering by Exploiting User-Based Reviews and Movie Synopses,in ArtificialIntelligence Applications and Innovations.AIAI 2020IFIP WG 12.5InternationalWorkshops. 2020.p.187-199.
3.Guorui Zhou,X.Z.,Chenru Song,Ying Fan,Han Zhu,Xiao Ma,Yanghui Yan,Junqi Jin,Han Li,and Kun Gai,Deep Interest Network for Click-Through RatePrediction.2018.
4.Chen,R.,et al.,A Survey of Collaborative Filtering-BasedRecommender Systems:From Traditional Methods to Hybrid Methods Based onSocial Networks. IEEE Access,2018.6:p.64301-64320.
5.Li,W.,et al.,A collaborative filtering recommendation method basedon discrete quantum-inspired shuffled frog leaping algorithms in socialnetworks☆. 2018.88(NOV.):p.262-270.
6.Jiang,M.,et al.,A collaborative filtering recommendation algorithmbased on information theory and bi-clustering.Neural Computing andApplications,2019. 31(12):p.8279-8287.
7.<Mitigating the effect of data sparsity_A case study oncollaborativefiltering recommender system.pdf>.
8.Alhijawi,B.,et al.Improving collaborative filtering recommendersystems using semantic information.in 2018 9th International Conference onInformation and Communication Systems(ICICS).2018.
9.SHINE:Signed Heterogeneous Information Network Embedding forSentiment Link Prediction.
10.Cheng,H.-T.,et al.,Wide&Deep Learning for Recommender Systems,inProceedings of the 1st Workshop on Deep Learning for Recommender Systems-DLRS 2016.2016.p.7-10.
11.Yu,X.,et al.,Personalized Entity Recommendation:A HeterogeneousInformation Network Approach.Wsdm'14:Proceedings of the 7th Acm InternationalConference on Web Search and Data Mining,2014:p.283-292.
12.Huang,J.,et al.,Improving Sequential Recommendation withKnowledge-Enhanced Memory Networks,in The 41st International ACM SIGIRConference on Research&Development in Information Retrieval.2018.p. 505-514.
13.Wang,H.,et al.,RippleNet:Propagating User Preferences on theKnowledge Graph for Recommender Systems,in Proceedings of the 27th ACMInternational Conference on Information and Knowledge Management.2018.p. 417-426.
14.Wang,H.,et al.,DKN:Deep Knowledge-Aware Networkfor NewsRecommendation,in Proceedings of the 2018 World Wide Web Conference on WorldWide Web-WWW'18.2018.p.1835-1844.
15.Zhang,F.,et al.,Collaborative Knowledge Base Embedding forRecommender Systems,in Proceedings of the 22nd ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining.2016.p.353-362.
16.Zhao,H.,et al.,Meta-Graph Based Recommendation Fusion overHeterogeneous Information Networks,in Proceedings of the 23rd ACMSIGKDDInternational Conference on Knowledge Discovery and Data Mining.2017.p.635-644.
17.Wang,H.,et al.,Knowledge Graph Convolutional Networks forRecommender Systems,in The World Wide Web Conference on-WWW'19.2019. p.3307-3313.
18.Zhang,S.,et al.,Deep Learning Based Recommender System:A Surveyand New Perspectives.2019.52(1%J ACM Comput.Surv.):p.Article 5.
19.Kiran,R.,P.Kumar,and B.J.E.S.w.A.Bhasker,DNNRec:A Novel DeepLearning based Hybrid Recommender System.2019.144:p.113054.
20.Neve,J.and I.Palomares,Hybrid Reciprocal Recommender Systems:Integrating Item-to-User Principles in Reciprocal Recommendation,in CompanionProceedings of the Web Conference 2020.2020,Association for ComputingMachinery:Taipei,Taiwan.p.848–853.
21.David K Duvenaud,D.M.,Jorge Iparraguirre,Rafael Bombarell,TimothyHirzel,Alán Aspuru-Guzik,and Ryan P Adams,convolutional networks on graphsfor learning molecular fingerprints.In Advances in Neural InformationProcessing Systems,2015:p.2224–2232.
22.Mathias Niepert,M.A.,and Konstantin Kutzkov,Learning ConvolutionalNeural Networks for Graphs.2016.
23.Will Hamilton,Z.Y.,and Jure Leskovec,inductive representationlearning on large graphs.In Advances in Neural Information ProcessingSystems,2017:p. 1024–1034.
24.Wang,Q.,et al.,Knowledge Graph Embedding:A Survey of Approachesand Applications.2017.29(12):p.2724-2743.
25.Zhang,Z.,L.Gong,and J.Xie,Ontology-based collaborative filteringrecommendation algorithm.2013.
26.Antoine Bordes,N.U.,Alberto Garcia-Duran,Jason Weston,and OksanaYakhnenko,Translating Embeddings for Modeling Multi-relational Data.2013.
27.Koren,Y.,Factorization meets the neighborhood:a multifacetedcollaborative filtering model,in Proceedings of the 14th ACM SIGKDDinternational conference on Knowledge discovery and data mining.2008,Association for Computing Machinery:Las Vegas,Nevada,USA.p.426–434.
28.Rendle,S.,Factorization Machines with libFM.2012.3(3%J ACM Trans.Intell.Syst.Technol.):p.Article 57.
发明内容
本发明的发明目的在于:针对上述存在的问题,提供一种基于知识图卷积 网络的模型混合推荐方法,在将知识图谱引入推荐系统的同时加入了基于用户 的协同过滤以捕获用户间的相关性,避免KGCN及传统的协同过滤推荐系统 存在的稀疏性和冷启动问题,提高推荐的准确率。
本发明采用的技术方案如下:
一种基于知识图卷积网络的模型混合推荐方法,包括:A.计算用户实体 集u与项目实体关系集r之间的第一评价,根据输入的用户实体u,以及每个用 户实体和项目实体在知识图谱中的邻居集合N(i),计算用户实体u与其邻域中 各个项目实体关系r的第一评价,将用户实体u与其邻域中各个项目实体关系r 的第一评价进行聚合,其中,项目实体关系集r由每两两项目实体间的关系r构 成;B.根据步骤A的聚合结果,以及输入的待选项目实体i,对待选项目实 体i的拓扑邻近结构进行聚合;C.根据步骤C的聚合结果,计算用户实体u对 待选项目实体i的第一感兴趣概率;D.基于已训练好的协同过滤模型,计算用 户实体u与项目实体集i之间的第二评价集合;E.基于步骤D中计算的第二评 价集合,计算用户实体u与待选项目实体i之间的第二感兴趣概率;F.将用户 实体u对项目实体i的第一感兴趣概率和第二感兴趣概率进行融合,得到最终预 测结果。
进一步的,所述用户实体集u与项目实体关系集r之间的第一评价的计算 方法为:其中,Su,r为第一评价值,f(*)表示全连接层,u和 r分别表示用户u实体u的集合和项目实体关系r的集合,表示元素间的內积。
进一步的,所述步骤B包括:以待选项目实体i的邻居的线性组合来 表示待选项目实体i的拓扑邻近结构:其中是标 准化后的用户实体u与其邻域中各个项目实体关系r间的第一评价: e是实体e的表示;将每个用户实体和项目实体在知 识图谱中的邻居集合的个数设定为固定大小且 K为邻居集合的个数;将待选项目实体i的拓扑邻近结构进行 迭代聚合操作,直至收敛至第0层:其中w表 示可学习的权重,b表示可学习的偏置,σ表示RELU激活函数。
进一步的,所述K等于4或8。
进一步的,所述步骤D中,计算指定用户实体u1与项目实体集i之间的第二 评价集合的方法为:对于项目实体集i中的各项目实体i,分别计算:S=η(C(u,i)), 其中,C(u,i)表示利用协同过滤模型计算的用户实体u对项目实体i的第二评价, η(*)表示归一化函数,第二评价值S的取值范围为[0,1]。
进一步的,所述步骤F中,将用户实体u对待选项目实体i的第一感兴趣概 率和第二感兴趣概率进行融合的方法为,将所述第一感兴趣概率和第二感兴趣 概率进行平均处理。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明的基于知识图谱的图卷积混合模型推荐方法,将用户实体的邻域信 息迭代的融入到协同过滤中并利用知识图谱的高阶连通性来辅助推荐,对于邻 域信息的迭代聚合操作,充分利用了知识图谱的结构信息来提取用户兴趣特征, 并引入注意力机制为不同的聚合信息分配权重。在引入知识图谱的过程中,既 捕获了物品的相关性也捕获了用户的相关性,将二者进行融合提出了基于知识 图谱的图卷积混合模型推荐方法,从而提高推荐的准确度。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是知识图谱中邻域信息聚合示意图。
图2是计算最终预测结果的计算流程图。
图3是KGCN-CF在不同邻居采样个数K下的AUC结果。
图4是KGCN-CF在不同接收野深度H下的AUC结果。
图5是KGCN-CF在不同特征维度d下的AUC结果。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互 相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别 叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙 述,每个特征只是一系列等效或类似特征中的一个例子而已。
名词定义:
a)用户集U={u1,u2,...,um}其中m表示用户的个数。
b)项目集I={i1,i2,...,in},其中n表示项目的个数。
知识图谱三元组为G=(h,r,t),其中表示一个知识三元组的头部、关系、尾部,和分别是知识图中实体和关系的集合。例如,对电影《阿 甘正传》,知识图谱存在三元组(Forrest Gump,film.film.star,Tom Hanks)表 示Tom Hanks是影片《Forrest Gump》的主演。(实体、关系、实体)在本发明 涉及的推荐场景中,用户与项目都对应于知识图谱中的一个实体。
实施例一
一种基于知识图卷积网络的模型混合推荐方法,包括:
输入数据包括:用户实体u,待选项目实体i,以及每个用户实体和项目实 体在知识图谱中的邻居集合N(i)。方法包括:
A.计算用户实体u与其邻域中各个项目实体关系r之间的第一评价,将用 户实体u与其邻域中各个项目实体关系r的第一评价进行聚合:
用户实体集u与项目实体关系集r之间的第一评价表示为:
其中Su,r为第一评价值,表示各项目实体关系r对于相关用户 实体u的重要程度,f(*)表示全连接层(优选输出维度为8),u和r分别表示用 户实体u的集合和项目实体关系r的集合,表示元素间的內积,表示u和r的 维度,项目实体ia和ib的关系表示为例如类型、作者等属性信息 方面的关系,两两项目实体间的关系组成项目实体关系集r。根据输入的用户 实体u以及每个用户实体和项目实体在知识图谱中的邻居集合N(i),从上式中 即可计算出用户实体u与其邻域中各个项目实体关系r的第一评价。
对于同一个用户实体u来说,存在着多个项目实体关系r,这些项目实体关 系对于用户实体来说又必将存在着不同程度的影响,因此,聚合的步骤很有必 要。
B.根据步骤A的聚合结果,以及输入的待选项目实体i,对待选项目实体i的 拓扑邻近结构进行聚合。
以项目实体i的邻居的线性组合iN(i),u来表示项目实体i的拓扑邻近结构:
e是实体e的表示。
在知识图谱中,邻居集合的个数存在着很大的差异,所以我们将每个 实体的邻居集合的个数设定为固定大小,不使用完整的邻居集合。设K为 邻居集合的个数,取并且其中K是一个可修改 的常数,表示了知识图谱中每一层中取的邻居个数。
最终将项目实体i的邻居表示(拓扑邻近结构)iN(i),u进行聚合:
J=σ(w·(i+iN′(i),u)+b)
其中w表示可学习的权重,b表示可学习的偏置,σ表示RELU激活函数。 模型迭代的聚合过程由用户u在知识图谱中发散出的邻域迭代地聚合到中心实 体e上,如图1所示,假设最中心的实体为中心实体e,我们在提取用户特征的 时候考虑到知识图谱中n-hop(n∈N*)范围内的实体,中心实体e在1-hop范围内 的邻居由与e直接相连的实体(有交互记录的项目)组成,相应地,2-hop范围 内的邻居由1-hop范围中实体e的直连实体的邻居组成。以此类推,模型提取 的邻居包括n层,则模型的聚合操作总共迭代n次,第i次迭代是对n-i+1层 内的所有实体进行聚合邻域信息。当模型收敛至第0层,完成聚合操作。
C.计算用户实体u对待选项目实体i的第一感兴趣概率。
上述过程主要针对项目实体间的关系进行信息聚合,本发明还包括用户实 体件相似性的分析过程。
D.基于已训练好的协同过滤(User-CF)模型,计算输入的用户实体u与 项目实体集i之间的第二评价集合。对于各项目实体,分别采用下式计算:
S=η(C(u,i))
其中C(u,i)表示利用协同过滤模型计算的用户实体u对项目实体i的第二评 价,η(*)表示归一化函数,S的取值范围为[0,1]。
E.基于步骤D中计算的第二评价集合,计算用户实体u1与项目实体i1之间 的第二感兴趣概率计算方法为:
根据相同原理,计算用户实体u与待选项目实体i之间的第二感兴趣概率的 方法为:
F.将用户实体u对待选项目实体i的第一感兴趣概率和第二感兴趣概率进行 融合,得到最终预测结果。
将上述模型预测结果与L2正则化相结合,设计了如下完全损失函数:
其中c(*)是交叉熵损失函数,表示求函数F的L2正则化,λ为可学习参 数,yu,i表示用户实体与项目实体间的交互关系,yu,i=1表示用户对项目有过点 击、购买或浏览等行为。相应地,yu,i=0表示用户对项目没有历史交互行为。
实施例二
本实施例公开了一种基于知识图谱的图卷积混合模型推荐方法,其基本思 路是:通过在推荐过程中引入知识图谱,并利用用户的历史交互数据将物品的 信息与其邻居进行有偏好地聚合,同时在计算用户-关系分值时加入注意力机 制计算用户交互过的物品和候选物品之间的相似性,接下来再融入基于用户的 协同过滤,进行准确的推荐,提高推荐的准确率。
在一个典型的推荐场景中,我们将知识图感知推荐问题描述如下:
a)用户集U={u1,u2,...,um}其中m表示用户的个数。
b)项目集I={i1,i2,...,in},其中n表示项目的个数。
d)知识图谱三元组为G=(h,r,t),其中表示一个知识三元组的 头部,关系和尾部,和分别是知识图中实体和关系的集合。例如,对电影《阿 甘正传》,知识图谱存在三元组(Forrest Gump,film.film.star,Tom Hanks)表 示Tom Hanks是影片《Forrest Gump》的主演。(实体、关系、实体)在本文涉 及的推荐场景中,用户与项目都对应于知识图谱中的一个实体。
本实施例的目的是在给定用户u,拟推荐项目i以及对应知识图谱G的条件 下,根据用户交互矩阵Y和知识图谱G预测用户u对之前从没有接触过的物品i 是否感兴趣。具体来说,我们的目标分为两部分,其中一部分是学习预测函数
另一部分为:
其中G表示基于用户的协同过滤函数。
为此,本实施例设计了KGCN-CF模型。KGCN-CF用来发现知识图谱中用 户的潜在兴趣以及提取实体之间的隐藏关系特征。模型有三部分输入:用户实 体u,待选项目实体i,以及每个用户和项目实体在知识图谱中的邻居集合N(i), 其中用户的邻居由用户历史交互记录中的项目实体组成。我们将两个项目实体 ia和ib的关系表示为
现实中,大量用户的兴趣侧重点都不同,比如,有的用户对于同一个歌手 演唱的歌曲感兴趣,而有的用户可能更注重歌曲的曲风。在推荐系统中计算关 系r对于用户u的重要程度是十分重要的。首先,我们将用户和关系之间的得分 表示为:
其中Su,r表示关系r对于用户u的重要程度,f(*)表示全连接层(输出维度为 8),u和r分别表示用户u和关系r,表示元素间的內积,表示u和r的维度, 当u和r的输入维度增大时会增加模型的计算负担,并且有可能会引入 多余的噪声,所以我们在(3)式中加入了f(*)。一方面,加入f(*)可以降低模 型的学习参数,当u和r的输入维度很大时,也能将模型的参数控制在较少的 范围。另一方面,有效地减少了长维度向量中引入的噪声。对于同一个用户u来 说,存在着多个关系r,这些关系对于用户来说又必将存在着不同程度的影响。 因此,我们就需要将用户u与其邻域中各个关系r的得分进行聚合。
另外,我们使用项目i的邻居的线性组合iN(i),u来表示项目i的拓扑邻近结构:
e是实体e的表示。
在知识图谱中,邻居集合的个数存在着很大的差异,所以我们将每个 实体的邻居集合的个数设定为固定大小,不使用完整的邻居集合。设K为 邻居集合的个数,取并且其中K是一个可修改 的常数,表示了知识图谱中每一层中取的邻居个数。以两层接受域(h=2)的 图1为例,中心实体为给定的实体,K设置为3,灰色实体为邻居集合。接着, 我们需要将实体表示i和邻居表示进行聚合:
J=σ(w·(i+iN′(i),u)+b) (6)
其中w表示可学习的权重,b表示可学习的偏置,σ表示RELU激活函数。 模型迭代的聚合过程由用户u在知识图谱中发散出的邻域迭代地聚合到中心实 体e上。如图1所示,假设位于中心的实体为中心实体e,我们在提取用户特征 的时候考虑到知识图谱中n-hop(n∈N*)范围内的实体,中心实体e在1-hop范围 内的邻居由与e直接相连的实体(有交互记录的项目)组成,相应地,2-hop 范围内的邻居由1-hop范围中实体e的直连实体的邻居组成。以此类推,模型 提取的邻居包括n层,则模型的聚合操作总共迭代n次,第i次迭代是对n-i+1 层内的所有实体进行聚合邻域信息。当模型收敛至第0层,完成聚合操作,用 户u对项目i感兴趣的概率为:
以上聚合信息的过程都是针对项目间的关系进行信息聚合,忽略了用户间 的相似性。并且考虑到以下问题:当邻居聚合的个数偏少时,会造成聚合的关 系信息不足和获取的用户兴趣偏好不准;当邻居聚合的个数过多时,会造成聚 合的信息过多,难以对用户进行更加准确和优质的推荐;推荐结果完全依赖于 项目间的邻居关系。为了弥补上述缺陷,我们借鉴了基于用户的协同过滤 (User-CF)算法,并将其与KGCN进行融合。由于篇幅限制,因此本文不对 User-CF进行详细的公式推导,假设已经训练好的User-CF模型为C,用户u对 项目i的评分为C(u,i)。在实际的计算过程中,User-CF往往预测的是用户u对项 目i的评分,这就需要将评分结果转换成感兴趣的概率。例如,设候选项目集 i={i1,i2,…,im},我们需要计算指定用户u1对候选项目i1(i1∈i)感兴趣的概率,用户对 候选项目集i中的项目初始感兴趣的概率那么将得到用户u1与项目 集合i之间的评分集合:
S=η(C(u1,i)) (8)
其中η(*)表示归一化函数,S的取值范围为[0,1]。因此,用户u1与项目i1之间 的感兴趣概率为:
最终,我们将KGCN的计算结果与User-CF的计算结果进行融合:
我们将KGCN-CF模型与L2正则化相结合,设计了如下完全损失函数:
上述过程可预测出特定用户实体对待选项目实体进行选择的概率。本实施 例还对上述模型预测的结果进行了验证。
为了验证本文所提出算法的有效性,我们进行了如下实验。在本节中,我 们首先简要介绍了Dianping-Food、Book-Crossing和Last.FM三个数据集,然 后使用这三个数据集来验证KGCN-CF的优越性,并与SVD﹑LibFM等模型进 行了对比,实验设置如下。
1数据集和实验环境
本节主要针对上述提出的基于知识图谱的图卷积混合模型推荐方法的有效 性在Dianping-Food、Book-Crossing、Last.FM三个数据集上进行实验与分析。 数据集详细情况如下:
表1数据集详情
其中Dianping-Food由Dianping.com提供,它包含了大约200万用户和1000 家餐厅之间超过1000万次的互动(包括点击、购买和添加收藏夹)。对应的 KG包含28115个实体、160519个边和7个关系类型。Book-Crossing包含了从 图书漂流网站社区中爬取的100多万条从1分到10分不等的评分记录,对应 知识图谱中25787个实体和18种关系。Last.FM收集了在线音乐系统中两千多 名用户的收听记录,对应知识图谱中9366个实体和15518种关系。本发明提 出的模型主要由两部分组成:基于知识图谱的图卷积模型KGCN和User-based的协同过滤模型,对于模型的第一部分KGCN,隐式反馈能够提高该组件的预 测准确率,因此对于上述两种显式反馈的数据集,我们将其转换为隐式反馈, 正采样设置为1,负采样设置为0。对于模型的第二部分,需要使用到评分记 录来计算相似性,因此不需要将显式反馈转换为隐式反馈。
表2.实验环境
表2给出了本实验实验环境的详细信息。我们主要使用Tensorflow训练模 型。
2参数设置
在实验中,我们主要通过调整邻居采样个数、特征维度和接受野的深度来 分析这些参数对模型的影响程度和变化趋势。
表3.模型参数配置
表3给出了在实验中两个数据集的基本统计信息和KGCN-CF超参数的设 置(K:邻居采样个数,d:特征维度;H:接受野的深度;λ:L2正则项 系数)。同时,我们在后续的实验参数调整部分分别对它们进行了调整: K∈{2,4,8,16,32,64},d∈{4,8,16,32,64},H∈{1,2,3,4}。
3基线
为了验证KGCN-CF是否优于现有方法,我们将KGCN-CF与以下7个已 有的模型进行了比较:
SVD[27]:推荐系统中一个经典的基于协同过滤的隐含因素模型。
LibFM[28]:一种基于特征的分解模型,
LibFM+TransE:结合LibFM和TransE两种方法,把TransE[26]学习到的实 体表示拼接到每个用户-物品对,再作为LibFM的输入。
PER[11]:使用KG中的“物品-属性-物品”作为PER的特征(例如, “movie-director-movie”)。但PER不能被应用到新闻推荐,因为在新闻实体中 很难预定义元路径(meta-path)。
CKE[15]:联合学习协同过滤的隐式向量以及物品的基于知识库的语义表达。
RippleNet[13]:在知识图谱上模拟用户传播偏好的推荐模型。
KGCN[17]:是一种捕捉KG中语义信息和高阶结构信息的推荐模型。
4结果对比与分析
首先,我们在Book-Crossing数据集和Last.FM两个数据集上比较了本发明 提出的方法KGCN-CF和上述七种已有模型的预测准确度与F1值,实验结果 如表4所示。
表4.KGCN-CF与基线的对比
从表4可以看出,本发明提出的KGCN-CF在Dianping-Food、Book-Crossing 数据集和Last.FM数据集上显示的性能均优于其他7个模型,AUC和F1在 Dianping-Food数据集上分别提高了3.4%~13.4%和3.4%~12.1%,在 Book-Crossing数据集上分别提高了2.7%~18.7%和1.0%~19.1%,在Last.FM数 据集上分别提高了6.9%~25.8%和7.1%~23%。通过表4可以发现KGCN-CF在 Book-Crossing和Last.FM数据上AUC和F1值的提高要高于Dianping-Food。 这表明KGCN-CF可以很好地解决稀疏场景,因为Book-Crossing和Last.FM 比Dianping-Food稀疏。KGCN-CF在考虑了物品KG中的语义信息和高阶结构 信息的前提下,也考虑了用户之间的相关性,较KGCN有了明显提高,这表 明考虑用户之间的相关性更有利于推荐。实验表明该方法在多种数据集上均具 有很好的建模能力。
表4中的最后四行总结了KGCN-CF变体的性能。前三个(sum,concat, neighbor)对应于不同聚合器,sum聚合器将两个表示向量相加,concat聚合器 将两个表示向量连接在一起,neighbor聚合器直接将实体的邻居表示作为输出 表示。而最后一个变体KGCN-avg是KGCN-sum的简化情况,其中邻域表示 直接取平均而没有用户关系得分。因此,KGCN-CF-sum用于检查“注意机制” 的有效性。
图3给出了KGCN-CF在不同邻居采样个数K下的AUC结果。从图3中我 们发现,当K=4或8时,KGCN-CF可获得最佳性能。此行为表明,太小的K没有足够的容量来合并邻域信息,而考虑到太大的K邻居关系,则无用的邻 居关系将被引入,从而降低最终的预测性能。对于不同的数据集,我们需要考 虑的邻居关系个数也不同,例如,有些人对音乐的收听可能只考虑演唱者和歌 曲热度,然而对于书籍的阅读却要考虑更多的因素。
图4给出了KGCN-CF在不同接收野深度H下的AUC结果。当接收野深度 H取值大于1时,在Dianping-Food、Book-Crossing和Last.FM数据集上的AUC 都有所提升,但随着H的增加,AUC没有继续提升且维持在一个水平上。这 说明了接收野深度H对于KGCN-CF的预测性能的影响很小,我们不需要对接 收野深度进行繁复的调参就能得到很好的结果。但是接受野也不能过小,这样 会造成模型在计算实体关系时信息的丢失。
一般的推荐模型需要比较长的特征维度才能对数据进行优质的建模,但是 当特征维度过大时反而会造成计算困难和时间成本高的问题。KGCN-CF通过 加入Attention机制(公式3)后成功地解决了该问题。从图5中可以看出,在 Book-Crossing数据集下和Last.FM数据集下,特征维度的增加对模型的结果没 有太大的影响。
图3到图5中的结果显示,在一定程度上,邻居采样个数、接收野深度和 特征维度对于KGCN-CF的影响不是特别大。由此可以说明,KGCN-CF既可 以捕获项之间和用户之间的相关性,也可以在一定程度上解决稀疏性和冷启动 的问题,在未调参的情况下也能保持优秀的预测能力。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中 披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何 新的组合。
Claims (8)
1.一种基于知识图卷积网络的模型混合推荐方法,其特征在于,包括:
A.计算用户实体集u与项目实体关系集r之间的第一评价,根据输入的用户实体u,以及每个用户实体和项目实体在知识图谱中的邻居集合N(i),计算用户实体u与其邻域中各个项目实体关系r的第一评价,将用户实体u与其邻域中各个项目实体关系r的第一评价进行聚合,其中,项目实体关系集r由每两两项目实体间的关系r构成;
B.根据步骤A的聚合结果,以及输入的待选项目实体i,对待选项目实体i的拓扑邻近结构进行聚合;
C.根据步骤C的聚合结果,计算用户实体u对所述待选项目实体i的第一感兴趣概率;
D.基于已训练好的协同过滤模型,计算用户实体u与项目实体集i之间的第二评价集合;
E.基于步骤D中计算的第二评价集合,计算用户实体u与所述待选项目实体i之间的第二感兴趣概率;
F.将用户实体u对项目实体i的第一感兴趣概率和第二感兴趣概率进行融合,得到最终预测结果。
4.如权利要求3所述的基于知识图卷积网络的模型混合推荐方法,其特征在于,所述K等于4或8。
6.如权利要求1~5任一所述的基于知识图卷积网络的模型混合推荐方法,其特征在于,所述步骤D中,计算用户实体u与项目实体集i之间的第二评价集合的方法为:对于项目实体集i中的各项目实体i,分别计算:
S=η(C(u,i)),
其中,C(u,i)表示利用协同过滤模型计算的用户实体u对项目实体i的第二评价,η(*)表示归一化函数,第二评价值S的取值范围为[0,1]。
8.如权利要求7所述的基于知识图卷积网络的模型混合推荐方法,其特征在于,所述步骤F中,将用户实体u对待选项目实体i的第一感兴趣概率和第二感兴趣概率进行融合的方法为,将所述第一感兴趣概率和第二感兴趣概率进行平均处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011326292.XA CN112417313A (zh) | 2020-11-24 | 2020-11-24 | 一种基于知识图卷积网络的模型混合推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011326292.XA CN112417313A (zh) | 2020-11-24 | 2020-11-24 | 一种基于知识图卷积网络的模型混合推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112417313A true CN112417313A (zh) | 2021-02-26 |
Family
ID=74776900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011326292.XA Pending CN112417313A (zh) | 2020-11-24 | 2020-11-24 | 一种基于知识图卷积网络的模型混合推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417313A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010778A (zh) * | 2021-03-10 | 2021-06-22 | 北京明略软件系统有限公司 | 一种基于用户历史兴趣的知识图谱推荐方法和系统 |
CN113158071A (zh) * | 2021-03-19 | 2021-07-23 | 广东工业大学 | 一种基于图神经网络的知识社交推荐方法、系统和设备 |
CN113362131A (zh) * | 2021-06-02 | 2021-09-07 | 合肥工业大学 | 一种融合知识图谱和用户交互的图模型智能商品推荐方法 |
CN113961823A (zh) * | 2021-12-17 | 2022-01-21 | 江西中业智能科技有限公司 | 新闻推荐方法、系统、存储介质及设备 |
CN114004667A (zh) * | 2021-09-17 | 2022-02-01 | 重庆大学 | 一种知识众包冷启动任务建模与推荐方法 |
CN114386764A (zh) * | 2021-12-11 | 2022-04-22 | 上海师范大学 | 一种基于gru和r-gcn的oj平台题目序列推荐方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
-
2020
- 2020-11-24 CN CN202011326292.XA patent/CN112417313A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275964A (zh) * | 2019-06-26 | 2019-09-24 | 程淑玉 | 基于知识图谱与循环神经网络的推荐模型 |
Non-Patent Citations (2)
Title |
---|
HONGWEI WANG 等: "Knowledge Graph Convolutional Networks for Recommender Systems", 《THE 2019 WORLD WIDE WEB CONFERENCE》 * |
袁泉 等: "基于知识图谱和协同过滤的电影推荐算法研究", 《计算机工程与科学》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113010778A (zh) * | 2021-03-10 | 2021-06-22 | 北京明略软件系统有限公司 | 一种基于用户历史兴趣的知识图谱推荐方法和系统 |
CN113158071A (zh) * | 2021-03-19 | 2021-07-23 | 广东工业大学 | 一种基于图神经网络的知识社交推荐方法、系统和设备 |
CN113362131A (zh) * | 2021-06-02 | 2021-09-07 | 合肥工业大学 | 一种融合知识图谱和用户交互的图模型智能商品推荐方法 |
CN113362131B (zh) * | 2021-06-02 | 2022-09-13 | 合肥工业大学 | 一种融合知识图谱和用户交互的图模型智能商品推荐方法 |
CN114004667A (zh) * | 2021-09-17 | 2022-02-01 | 重庆大学 | 一种知识众包冷启动任务建模与推荐方法 |
CN114004667B (zh) * | 2021-09-17 | 2024-05-14 | 重庆大学 | 一种知识众包冷启动任务建模与推荐方法 |
CN114386764A (zh) * | 2021-12-11 | 2022-04-22 | 上海师范大学 | 一种基于gru和r-gcn的oj平台题目序列推荐方法 |
CN113961823A (zh) * | 2021-12-17 | 2022-01-21 | 江西中业智能科技有限公司 | 新闻推荐方法、系统、存储介质及设备 |
CN113961823B (zh) * | 2021-12-17 | 2022-03-25 | 江西中业智能科技有限公司 | 新闻推荐方法、系统、存储介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | CKAN: Collaborative knowledge-aware attentive network for recommender systems | |
Darban et al. | GHRS: Graph-based hybrid recommendation system with application to movie recommendation | |
CN112417313A (zh) | 一种基于知识图卷积网络的模型混合推荐方法 | |
Li et al. | Deep probabilistic matrix factorization framework for online collaborative filtering | |
Cai et al. | User cold-start recommendation via inductive heterogeneous graph neural network | |
Guo et al. | Trust-aware recommendation based on heterogeneous multi-relational graphs fusion | |
Ni et al. | A two-stage embedding model for recommendation with multimodal auxiliary information | |
CN113918832B (zh) | 基于社交关系的图卷积协同过滤推荐系统 | |
Dezfouli et al. | Deep neural review text interaction for recommendation systems | |
CN113918833B (zh) | 通过社交网络关系的图卷积协同过滤实现的产品推荐方法 | |
CN113918834B (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
Tang et al. | Content‐based and knowledge graph‐based paper recommendation: Exploring user preferences with the knowledge graphs for scientific paper recommendation | |
Ma et al. | DeepAssociate: A deep learning model exploring sequential influence and history-candidate association for sequence recommendation | |
Ji et al. | Relationship-aware contrastive learning for social recommendations | |
Zhang et al. | Graph-based regularization on embedding layers for recommendation | |
Li et al. | Heterogeneous graph embedding for cross-domain recommendation through adversarial learning | |
Yang et al. | Recommendation algorithm based on knowledge graph to propagate user preference | |
Gan et al. | DeepInteract: Multi-view features interactive learning for sequential recommendation | |
CN113342994B (zh) | 一种基于无采样协作知识图网络的推荐系统 | |
Wang et al. | Research on BP neural network recommendation model fusing user reviews and ratings | |
Cai et al. | Adaptive anti-bottleneck multi-modal graph learning network for personalized micro-video recommendation | |
He et al. | Meta-path based graph contrastive learning for micro-video recommendation | |
Deng et al. | A Trust-aware Neural Collaborative Filtering for Elearning Recommendation. | |
Li et al. | Effective hybrid graph and hypergraph convolution network for collaborative filtering | |
Zhang et al. | BKGNN-TI: a bilinear knowledge-aware graph neural network fusing text information for recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210226 |