CN113656684A - 一种基于知识图谱的推荐方法 - Google Patents

一种基于知识图谱的推荐方法 Download PDF

Info

Publication number
CN113656684A
CN113656684A CN202110789659.XA CN202110789659A CN113656684A CN 113656684 A CN113656684 A CN 113656684A CN 202110789659 A CN202110789659 A CN 202110789659A CN 113656684 A CN113656684 A CN 113656684A
Authority
CN
China
Prior art keywords
user
vector
knowledge graph
information
neighbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110789659.XA
Other languages
English (en)
Inventor
王宝亮
潘文采
常鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
CERNET Corp
Original Assignee
Tianjin University
CERNET Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University, CERNET Corp filed Critical Tianjin University
Priority to CN202110789659.XA priority Critical patent/CN113656684A/zh
Publication of CN113656684A publication Critical patent/CN113656684A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于知识图谱的推荐方法,包括下列步骤:(1)建立用户之间推荐的知识图谱,用户通过与其他用户之间交互过的节点,向外寻找用户感兴趣的物品节点。(2)用户节点邻居信息融合。(3)物品节点邻居信息聚合:物品邻居节点的聚合采用KGCN模型,利用KGCN模型在知识图谱中聚合实体特征,从而发掘物品的潜在关联,形成物品节点的向量表示。(4)向量送入预测环节:对于用户u和物品v的最终向量表示,用户向量u包含了用户u的历史记录信息和其在知识图谱中的邻居信息,物品向量vu包含了物品本身和其在知识图谱的邻居信息以及用户对邻居信息的喜好程度,建立用户和物品之间的关联。

Description

一种基于知识图谱的推荐方法
技术领域
本发明涉及一种基于知识图谱的推荐方法。
背景技术
当今社会,随着网络的兴起,用户的选择信息越来越多,为了解决用户的个性化推荐问题,推荐系统应运而生。其中,协同过滤算法通过分析相似用户的行为进行推荐,取得了较大的成功。然而,传统的协同过滤算法存在冷启动和用户交互信息稀疏的问题,因此研究者通过加入辅助信息例如社交网络,物品的属性信息等来缓解该问题。由于知识图谱包含丰富的物品信息,因此也被用于推荐算法中。
知识图谱是一种有向异构图,其中,每个节点称为实体,两个节点的连边表示为两个节点的关系,通常以h(head)、r(relation)、t(tail)来表示它们。比如以
Figure BDA0003160365540000011
Figure BDA0003160365540000012
为例,h就是《变形金刚1》,r就是“科幻片”,t表示《变形金刚2》。为了便于表示它们之间的关系,通常用一个固定长度的向量来表示各个节点,从而可以利用向量来构建数学模型。
将知识图谱应用于推荐算法已成为一个热点,例如将知识图谱应用于推荐系统,将上下文嵌入,知识图谱实体嵌入,和语句嵌入送入CNN网络,从而在语义层次和知识图谱层次学习嵌入表示。
利用知识图谱将用户交互的物品的邻居信息聚合到用户上,生成信息丰富的嵌入表示,将物品的邻居信息聚合到物品上生成物品嵌入表示都是常见的一种形式。
参考文献
[1]H.Wang,M.Zhao,X.Xie,W.Li,and M.Guo,“Knowledge graph convolutionalnetworks for recommender systems,”in The World Wide Web Conference,ser.WWW’19.New York,NY,USA:ACM,2019,pp.3307–3313.
发明内容
本发明发明了一种基于知识图谱的推荐算法研究。
一种基于知识图谱的推荐方法,包括下列步骤:
(1)建立用户之间推荐的知识图谱,用户通过与其他用户之间交互过的节点,向外寻找用户感兴趣的物品节点,每一个节点初始化一个向量,然后通过训练集训练每一个向量,最终形成一个最终的代表节点信息的向量。
(2)用户节点邻居信息融合
建立用户邻居节点信息融合模型,利用用户交互记录表示用户连接到下一个实体的关系,“1跳邻居”表示通过一个箭头连接到的节点,依此类推“H跳邻居”表示在知识图谱中不断向外传播所连接到的实体,将信息融合到用户向量上,丰富用户的向量表达;为了丰富用户的向量表示,对用户的交互记录的每一个知识图谱的节点向量聚合到下一个相邻向量中,定义每个向量的聚合权重;
(3)物品节点邻居信息聚合
物品邻居节点的聚合采用KGCN0模型,利用KGCN0模型在知识图谱中聚合实体特征,从而发掘物品的潜在关联,形成物品节点的向量表示。
(4)向量送入预测环节
对于用户u和物品v的最终向量表示u和vu,用户向量u包含了用户u的历史记录信息和其在知识图谱中的邻居信息。物品向量vu包含了物品本身和其在知识图谱的邻居信息以及用户对邻居信息的喜好程度,建立用户和物品之间的关联。
本发明提出的基于知识图谱的推荐算法,将知识图谱作为辅助信息,首先聚合用户的邻居信息,生成有个性化信息的用户向量,然后将用户向量送入如图3所示的模型聚合物品的邻居信息,生成有个性化的物品向量。增加了推荐算法的可解释性,提升了推荐的性能。
附图说明
图1本发明的推荐算法的整体流程示意图。
图2用户邻居节点信息融合模型。
图3物品邻居节点的聚合模型。
具体实施方式
为了缓解传统的协同过滤算法存在冷启动和用户交互信息稀疏的问题,本文提出基于知识图谱的用户物品邻居信息融合推荐算法,即将用户邻居和物品邻居信息分别融合,从而产生用户和物品信息均丰富的嵌入表示。在聚合用户信息时,首先根据用户的点击记录得到用户点击的物品在知识图谱中的一阶邻居,并向外传播,得到高阶邻居。然后利用邻居节点和节点之间的关系丰富用户的向量表示。在聚合物品信息时,由于物品通常是知识图谱的某个实体节点,因此直接得到物品的一阶和高阶邻居,根据图3模型聚合信息生成丰富的物品嵌入表示。得到用户和物品的向量嵌入表示之后,送入预测环节,得到用户和物品的交互概率。
本发明整体过程如图1所示。其中方框内为知识图谱的节点,方框外的节点为用户节点。比如:
Figure BDA0003160365540000031
这就是一个知识图谱中的一个具体例子。在用户1看过《变形金刚1》时,通过该知识图谱就可以给用户1推荐电影《变形金刚2》。本发明通过用户交互过的节点(比如用户看过的电影集合)然后通过知识图谱(从一个实体节点联系到里一个待选节点的路径集合)向外寻找用户感兴趣的物品节点。
对图1的每一个节点初始化一个向量,然后通过训练集训练每一个向量,最终形成一个最终的代表节点信息的向量。
算法整体分为三部分:用户节点邻居信息融合、物品节点邻居信息聚合、向量送入预测环节。
用户节点邻居信息融合是指将用户交互过的记录(比如用户看过的电影集合)和其相连接的知识图谱的节点(每个电影节点都可以通过关系连接到下一个实体节点)信息融合到用户向量上。
由于待推荐的物品节点通常就是知识图谱中的一个实体节点,因而聚合邻居信息即将待选的物品节点的邻居信息融合到邻居节点上。
向量送入预测环节指将得到的用户向量和待选的物品向量做运算,结果接近1则该物品更容易被推荐给用户。
1用户节点邻居信息融合
用户邻居节点信息融合模型如图(2)所示,以电影为例,图中“用户交互记录”表示用户看过的电影集合,箭头表示连接到下一个实体的关系,比如导演、演员、类别等信息。图中“1跳邻居”表示通过一个箭头连接到的节点。依此类推“H跳邻居”表示在知识图谱中不断向外传播所连接到的实体。
比如以一条链举例:
Figure BDA0003160365540000032
Figure BDA0003160365540000041
《变形金刚1》就是用户的交互记录之一,“导演”、“导演电影”、“类别:科幻片”等就是每个箭头代表的关系r。迈克尔·贝就是1跳邻居中的一个实体,《变形金刚2》就是2跳邻居中的一个实体,《变形金刚3》就是3跳邻居中的一个实体。
用户邻居节点信息融合的目的就是将上述这些信息融合到用户向量上,丰富用户的向量表达。
模型的输入是用户初始化向量u[0]和每个知识图谱的节点向量,输出是融合了H跳信息的用户向量u[H]。
定义1:给定用户物品交互矩阵Y和知识图谱G,用户u的k跳实体集合定义如下:
Figure BDA0003160365540000042
其中
Figure BDA0003160365540000043
是用户的点击历史集合。
定义2:用户u的k跳的邻居集合如下:
Figure BDA0003160365540000044
为了丰富用户的向量表示,对用户的交互记录的每一个知识图谱的节点向量聚合到下一个相邻向量中,每个向量的聚合权重如下式所示:
Figure BDA0003160365540000045
其中,R表示关系向量,h表示知识图谱的节点向量。比如
Figure BDA0003160365540000046
Figure BDA0003160365540000047
h可表示《变形金刚1》的初始向量,R可表示科幻片,下式t可表示《变形金刚2》。
Figure BDA0003160365540000048
中的所有的(hi,ri,ti),利用上述权重聚合形成一跳向量u[1],可以得到
Figure BDA0003160365540000049
得到一跳向量u[1]之后,继续在知识图谱向外传播,得到多条向量得到u[1],u[2],u[3],…u[H]。最终的用户u的向量表示为
u=u[1]+u[2]+…+u[H]
2物品节点邻居信息聚合
物品邻居节点的聚合采用KGCN0模型。其基本框架如图3所示。KGCN模型在知识图谱中聚合实体特征,从而发掘物品的潜在关联。
N(v)表示与v直接相连的实体集合,此处v表示知识图谱中的某个实体。
Figure BDA0003160365540000051
表示知识图谱中实体ei与ej的关系向量。
Figure BDA0003160365540000052
上式表示用户u对关系r的喜好程度。
Figure BDA0003160365540000053
上式通过N(v)的实体的加权和表示物品v的拓扑结构。其中
Figure BDA0003160365540000054
表示如下公式所示。
Figure BDA0003160365540000055
N(e)的规模很大,选择随机采样固定数量邻居的方式降低计算复杂度
S(v)={e|e~N(v),|S(v)|=K}
聚合邻居信息和自身信息得到v的嵌入表达。
Figure BDA0003160365540000056
如图(3)所示,不断从外向内聚合,将绿色节点的信息聚合到蓝色节点。最终形成物品节点的向量表示vu
3向量送入预测环节
得到了用户u和物品v的最终向量表示u和vu,其中用户向量u包含了用户u的历史记录信息和其在知识图谱中的邻居信息。物品向量vu包含了物品本身和其在知识图谱的邻居信息以及用户对邻居信息的喜好程度。用户和物品的关联如下公式所示,值越接近1表示优先推荐物品给用户。
Figure BDA0003160365540000057
其中p:Rd×Rd→R,本文p选用向量的内积操作,
Figure BDA0003160365540000058
本申请适用于用户物品交互记录稀疏的推荐系统中。可以通过引入知识图谱,丰富推荐结果的多样性,提高用户的体验。

Claims (1)

1.一种基于知识图谱的推荐方法,包括下列步骤:
(1)建立用户之间推荐的知识图谱,用户通过与其他用户之间交互过的节点,向外寻找用户感兴趣的物品节点,每一个节点初始化一个向量,然后通过训练集训练每一个向量,最终形成一个最终的代表节点信息的向量。
(2)用户节点邻居信息融合
建立用户邻居节点信息融合模型,利用用户交互记录表示用户连接到下一个实体的关系,“1跳邻居”表示通过一个箭头连接到的节点,依此类推“H跳邻居”表示在知识图谱中不断向外传播所连接到的实体,将信息融合到用户向量上,丰富用户的向量表达;为了丰富用户的向量表示,对用户的交互记录的每一个知识图谱的节点向量聚合到下一个相邻向量中,定义每个向量的聚合权重;
(3)物品节点邻居信息聚合
物品邻居节点的聚合采用KGCN模型,利用KGCN模型在知识图谱中聚合实体特征,从而发掘物品的潜在关联,形成物品节点的向量表示。
(4)向量送入预测环节
对于用户u和物品v的最终向量表示u和vu,用户向量u包含了用户u的历史记录信息和其在知识图谱中的邻居信息。物品向量vu包含了物品本身和其在知识图谱的邻居信息以及用户对邻居信息的喜好程度,建立用户和物品之间的关联。
CN202110789659.XA 2021-07-13 2021-07-13 一种基于知识图谱的推荐方法 Pending CN113656684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110789659.XA CN113656684A (zh) 2021-07-13 2021-07-13 一种基于知识图谱的推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110789659.XA CN113656684A (zh) 2021-07-13 2021-07-13 一种基于知识图谱的推荐方法

Publications (1)

Publication Number Publication Date
CN113656684A true CN113656684A (zh) 2021-11-16

Family

ID=78489320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110789659.XA Pending CN113656684A (zh) 2021-07-13 2021-07-13 一种基于知识图谱的推荐方法

Country Status (1)

Country Link
CN (1) CN113656684A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114265982A (zh) * 2021-12-22 2022-04-01 北京中科闻歌科技股份有限公司 一种基于知识图谱的智能推荐方法
CN114417161A (zh) * 2022-01-21 2022-04-29 杭州碧游信息技术有限公司 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN114491055A (zh) * 2021-12-10 2022-05-13 浙江辰时科技集团有限公司 基于知识图谱的推荐算法
CN114780867A (zh) * 2022-05-10 2022-07-22 杭州网易云音乐科技有限公司 推荐方法、介质、装置和计算设备
CN117056575A (zh) * 2023-10-12 2023-11-14 深圳市华图测控系统有限公司 一种基于智能图书推荐系统数据采集的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114491055A (zh) * 2021-12-10 2022-05-13 浙江辰时科技集团有限公司 基于知识图谱的推荐算法
CN114265982A (zh) * 2021-12-22 2022-04-01 北京中科闻歌科技股份有限公司 一种基于知识图谱的智能推荐方法
CN114265982B (zh) * 2021-12-22 2022-08-26 北京中科闻歌科技股份有限公司 一种基于知识图谱的智能推荐方法
CN114417161A (zh) * 2022-01-21 2022-04-29 杭州碧游信息技术有限公司 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN114780867A (zh) * 2022-05-10 2022-07-22 杭州网易云音乐科技有限公司 推荐方法、介质、装置和计算设备
CN114780867B (zh) * 2022-05-10 2023-11-03 杭州网易云音乐科技有限公司 推荐方法、介质、装置和计算设备
CN117056575A (zh) * 2023-10-12 2023-11-14 深圳市华图测控系统有限公司 一种基于智能图书推荐系统数据采集的方法
CN117056575B (zh) * 2023-10-12 2024-01-30 深圳市华图测控系统有限公司 一种基于智能图书推荐系统数据采集的方法

Similar Documents

Publication Publication Date Title
CN113656684A (zh) 一种基于知识图谱的推荐方法
CN110955834B (zh) 一种知识图谱驱动的个性化精准推荐方法
CN112989064B (zh) 一种聚合知识图神经网络和自适应注意力的推荐方法
CN111160954B (zh) 基于图卷积网络模型的面向群组对象的推荐方法
CN111881350B (zh) 一种基于混合图结构化建模的推荐方法与系统
CN112232925A (zh) 一种融合知识图谱对商品进行个性化推荐的方法
CN113095439A (zh) 基于注意力机制的异构图嵌入学习方法
CN112950324B (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN111143705B (zh) 一种基于图卷积网络的推荐方法
CN115618108B (zh) 新零售模式下基于知识图谱的品牌推荐方法
Gershman et al. A decision tree based recommender system
Deng et al. Knowledge-aware group representation learning for group recommendation
CN113378048A (zh) 一种基于多视角知识图谱注意力网络的个性化推荐方法
Wang et al. Relational graph neural network with neighbor interactions for bundle recommendation service
CN112101984A (zh) 一种融合用户微观行为和知识图谱的会话推荐模型
CN114329222B (zh) 一种融合注意力机制和双端知识图谱的电影推荐方法
CN114282122A (zh) 一种高效非采样的图卷积网络推荐方法
CN116340646A (zh) 一种基于超图基序优化多元用户表示的推荐方法
Xing et al. Big-fed: Bilevel optimization enhanced graph-aided federated learning
CN112364257A (zh) 一种基于知识图谱的用户群组推荐系统及方法
CN107346333A (zh) 一种基于链路预测的在线社交网络好友推荐方法与系统
CN115329215A (zh) 异构网络中基于自适应动态知识图谱的推荐方法及系统
Liu et al. Siga: social influence modeling integrating graph autoencoder for rating prediction
CN114579852A (zh) 一种基于图卷积网络与注意力机制的推荐方法
CN114385804A (zh) 一种基于元学习的异构图注意力神经网络的评论推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication