CN114329222A - 一种融合注意力机制和双端知识图谱的电影推荐方法 - Google Patents

一种融合注意力机制和双端知识图谱的电影推荐方法 Download PDF

Info

Publication number
CN114329222A
CN114329222A CN202111682078.2A CN202111682078A CN114329222A CN 114329222 A CN114329222 A CN 114329222A CN 202111682078 A CN202111682078 A CN 202111682078A CN 114329222 A CN114329222 A CN 114329222A
Authority
CN
China
Prior art keywords
user
movie
knowledge graph
attention
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111682078.2A
Other languages
English (en)
Other versions
CN114329222B (zh
Inventor
王光
石山山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Technical University
Original Assignee
Liaoning Technical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Technical University filed Critical Liaoning Technical University
Priority to CN202111682078.2A priority Critical patent/CN114329222B/zh
Publication of CN114329222A publication Critical patent/CN114329222A/zh
Application granted granted Critical
Publication of CN114329222B publication Critical patent/CN114329222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合注意力机制和双端知识图谱的电影推荐方法,步骤为:将用户的属性信息映射至低维向量空间中,构建用户‑属性二分图Gu;通过注意力机制,为用户‑属性的关系分配注意力分数并获取用户u的邻域表示;使用聚合器计算用户特征矩阵U;将电影知识图谱三元组中的首部实体与尾部实体映射至关系空间中,通过注意力机制计算在关系空间中首部实体与尾部实体的距离作为注意力得分
Figure DDA0003449380250000011
获取电影v的邻域表示;使用聚合器得到电影特征V;将U与V送入预测函数中,计算用户对电影的评分yuv。本发明的融合注意力机制和双端知识图谱的电影推荐方法有效地提高了推荐的个性化、准确性以及结果的可解释性,可应用于多种场景中。

Description

一种融合注意力机制和双端知识图谱的电影推荐方法
技术领域
本发明属于知识图谱的技术领域,尤其涉及一种融合注意力机制和双端知识图谱的电影推荐方法。
背景技术
常用的推荐算法主要有基于内容的推荐算法、基于协同过滤的推荐算法以及基于知识推荐算法。第一种算法的主要思想是基于物品本身的属性,向用户推荐与其曾经喜好相似的物品,第二种算法的主要思想是基于大量的用户-物品交互信息进行的推荐算法,但是由于数据的稀疏性会导致冷启动问题的产生且结果的可解释性较差;为了解决上述问题,则提出了基于知识推荐算法,知识图谱是一种富含实体之间语义关联信息的异构网络,为每个实体和关系学习低维向量,作为推荐系统的辅助信息,可以有效地提高推荐结果的准确性、多样性以及可解释性。
随着人们对算法研究的逐渐深入,许多研究人员尝试将神经网络加入到推荐系统中,由于神经网络可以通过调节内部节点之间的相互关系以处理相关信息的特点,可以有效地提取特征,对于知识图谱中构建用户特征与项目特征有很好的帮助作用。
由于知识图谱内庞大的数据,常使用的方法有固定数量采样法和随机采样法等,但其会引入噪声进而影响推荐结果。因此可以选用注意力机制为每一个三元组分配权值,根据权值进行采样可以减少计算量并提高推荐结果的准确率、可解释性。
发明内容
针对现有技术中的不足,本发明提出了一种融合注意力机制和双端知识图谱的电影推荐方法,实现利用用户对关系的偏好以挖掘更多符合用户兴趣的实体,更加准确地计算用户特征;利用电影知识图谱中丰富的实体关系三元组中的信息,根据首部实体与尾部实体之间的相似度分配权值,根据权值进行邻域采样以获得更加准确的项目特征,从而提高推荐结果的个性化和准确性。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明提供一种融合注意力机制和双端知识图谱的电影推荐方法,包括以下步骤:
步骤1:首先从数据集文档中读取用户-属性信息,将其映射至低维空间中,构建用户-属性二分图Gu,然后在第一个全连接层中用非线性激活函数构造相应的层,获得用户-属性之间的注意力权重,计算用户u的邻域表示,最终使用聚合器得到用户特征U;
步骤2:将电影信息输入至知识图谱中,获取试题三元组(h,r,t),使用基于翻译的嵌入模型TransE学习三元组的嵌入(eh,er,et),并将三元组中的首部实体与尾部实体映射至关系空间中转变为
Figure BDA0003449380230000021
Figure BDA0003449380230000022
步骤3:在第二个全连接层中使用非线性激活函数tanh构建相应的层,使得注意力得分依赖于
Figure BDA0003449380230000023
Figure BDA0003449380230000024
计算在不同关系下知识图谱内实体之间的注意力权重,计算电影v的邻域表示,使用聚合器得到电影特征V;
步骤4:将用户特征U与电影特征V作为预测函数的输入值,计算用户对电影的预测点击率yuv,实现针对于用户的个性化电影推荐。
优选的,所述步骤1中的用非线性激活函数构建相应的层,采用下式:
Figure BDA0003449380230000025
其中,
Figure BDA0003449380230000031
表示用户-属性的注意力得分,ReLu为非线性激活函数,u与ui分别表示用户及其属性,w1与b1分别表示权重与偏置参数,体现不同的属性对于用户本身的重要程度。
优选的,所述步骤2中,将电影信息输入至知识图谱中获得电影实体三元组(h,r,t),使用基于翻译的嵌入模型TranE学习实体与关系的嵌入,使用d(h,r,t)函数计算h+r与t之间的距离,则获得嵌入eh
Figure BDA0003449380230000032
Figure BDA0003449380230000033
将三元组中的头部实体与尾部实体采用
Figure BDA0003449380230000034
映射至关系空间中,其中
Figure BDA0003449380230000035
Figure BDA0003449380230000036
为eh与et在关系空间r中的投影表示,并使用损失函数来扩大存在的三元组(h,r,t)与不存在的三元组(h′,r,t;)的差别:
Figure BDA0003449380230000039
进一步的,所述步骤3中,设计的注意力权重公式为:
Figure BDA0003449380230000037
其中tanh为非线性激活函数,wr为关系权重,使用softmax函数实现归一化:
Figure BDA0003449380230000038
由上,本发明的融合注意力机制和双端知识图谱的电影推荐方法至少具有如下有益效果:
本发明根据用户的偏好更好地提取了用户的特征,实现了推荐结果个性的提高;根据实体之间的相似度更好地提取了项目的特征,实现了推荐结果准确率的提高;将注意力机制与双端知识图谱相融合,进一步提高了推荐结果的可解释性与准确率;并且本发明提出的模型可以应用于诸多领域,比如音乐、图书领域。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1是本发明的融合注意力机制和双端知识图谱的电影推荐方法的流程图;
图2是知识图谱数据传播图。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
如图1至图2所示,本发明的融合注意力机制和双端知识图谱的电影推荐方法,包括以下步骤:
步骤1:首先从数据集文档中读取用户-属性信息,将其映射至低维空间中,构建用户-属性二分图Gu,然后在第一个全连接层中用非线性激活函数构建相应的层:
Figure BDA0003449380230000041
其中,
Figure BDA0003449380230000042
表示用户-属性的注意力得分,ReLu为非线性激活函数,u与ui分别表示用户及其属性,w1与b1分别表示权重与偏置参数,体现不同的属性对于用户本身的重要程度。使用softmax函数将评分归一化:
Figure BDA0003449380230000051
然后计算用户u的邻域表示:
Figure BDA0003449380230000052
其中uN(u)表示为u的邻域表示,N(u)为与用户u直接相连的属性集合。
最终使用聚合器得到用户特征U。
步骤2:将电影信息输入至知识图谱中,获取试题三元组(h,r,t),使用基于翻译的嵌入模型TransE学习三元组的嵌入(eh,er,et),并将三元组中的首部实体与尾部实体映射至关系空间中转变为
Figure BDA0003449380230000053
Figure BDA0003449380230000054
在得到三元组的嵌入后,使用损失函数来扩大两种三元组之间的差别。将电影信息输入至知识图谱中获得电影实体三元组(h,r,t),使用基于翻译的嵌入模型TranE学习实体与关系的嵌入,使用d(h,r,t)函数计算h+r与t之间的距离,则获得嵌入eh
Figure BDA0003449380230000055
Figure BDA0003449380230000056
将三元组中的头部实体与尾部实体采用
Figure BDA0003449380230000057
映射至关系空间中,其中
Figure BDA0003449380230000058
Figure BDA0003449380230000059
为eh与et在关系空间r中的投影表示。并使用损失函数来扩大存在的三元组(h,r,t)与不存在的三元组(h′,r,t;)的差别:
Figure BDA00034493802300000510
其中S为存放三元组的集合,(h,r,t)为存在的三元组,将三元组内的h与t随机替换产生不存在的三元组(h′,r,t′)。
步骤3:在第二个全连接层中使用非线性激活函数tanh构建相应的层,使得注意力得分依赖于
Figure BDA00034493802300000511
Figure BDA00034493802300000512
计算在不同关系下知识图谱内实体之间的注意力权重,计算电影v的邻域表示,使用聚合器得到电影特征V。
本发明针对实体之间的距离所设计的注意力权重公式为:
Figure BDA0003449380230000061
其中tanh为非线性激活函数,wr为关系权重。使用softmax函数实现归一化:
Figure BDA0003449380230000062
然后计算电影v的邻域表示:
Figure BDA0003449380230000063
其中vS(h)为h的领域表示,S(h)为直接与h相连的实体集合。
最终使用聚合器得到电影矩阵V。
步骤4:将用户特征U与电影特征V作为预测函数的输入值,计算用户对电影的预测点击率yuv,从而实现针对于用户的个性化电影推荐。
值得注意的是,与传统的知识图谱中权值的计算方法不同,本发明使用了注意力机制分别基于用户和电影设计了两种注意力权重公式。通过用户-属性信息计算注意力权重,充分获取用户的偏好特征,提高推荐的个性化;通过首部实体与尾部实体的相似度计算注意力权重,充分获取电影的特征,提高推荐的准确率,将用户端与电影端相结合进行推荐,有效地提高了模型的推荐效果。在之后的实验中与其他知识图谱模型进行对比,证明本模型的有效性。
实施例:本发明所采用的数据集是MovieLens-1M。MovieLens-1M数据集含有来自6040名用户对3629部电影的83万条评分数据,其包含:用户的评分、用户信息以及电影的信息。经过数据预处理后的数据如下表1所示:
表1相关数据集的数据
Figure BDA0003449380230000071
本发明将在CTR(点击率预测)场景下验证有效性:用本发明模型对测试集中的数据进行预测,使用ACC和AUC来评估模型预测的准确性。
实验的基线模型有:CKE(Collaborative Knowledge Embedding):协同知识嵌入,将知识图谱与协同过滤算法相结合,对用户进行推荐。KGCN(knowledge graphconvolutional networks for recommender systems):KGCN是以物品为中心实体进行传播,加入注意力机制,实现个性化推荐。RippleNet:将用户的历史兴趣设置为兴趣传播的种子,根据三元组(h,r,t)沿着KG不断地迭代传播用户的兴趣。LibFM(FactorizationMachine Library):是用于点击率预测中的一个基于特征的因子分解模型。PER(Personalized Entity Recommendation):根据知识图谱的异构性,将用户的隐形反馈基于原路径进行扩展实现推荐结果的个性化。上述的五种基线模型和本发明的模型一起在两个数据集上进行实验,实验结果如下表2所示:
Figure BDA0003449380230000072
Figure BDA0003449380230000081
从表2中可以看出,与人们比较熟知的推荐算法LibFM、PER以及与知识图谱相关的算法RippleNet、KGCN、CKE算法相比较,本发明所设计的算法在MovieLens-1M数据集上的各项数据均有提升,在MovieLens-1M数据集上,相较于最优的数据,AUC和ACC数据值各提高了1.1%和1.3%,相比较于以上模型,本发明将知识图谱中的各个实体进行预测,并选择排名前n个继续扩展,保证了数据的有效性,并且将k-hop中的k值提高,可以增加采样以获得更好的用户和商品特征。
采样邻居数量以及聚合跳数对于算法的影响体现在表3和表4中,从表3可以看出采样邻居数量对于算法的影响,取值过高或者过低都会影响算法本身的性能,过低会导致聚合实体数量较少,无法获得更多有效的信息;过高会导致融入更多的噪音,也会提高相应的计算量。
表3在不同采样数量下的AUC值
Figure BDA0003449380230000082
从表4中可以看出,跳数对于算法的影响更强,当跳数增加时,算法在前3跳时表现是最好的,到4时数值有明显的下降,在知识图谱中引入的1跳邻居信息是用户兴趣的直接邻域,而过大的L则会降低引入信息的有效性。
表4在不同跳数下的AUC值
Figure BDA0003449380230000083
Figure BDA0003449380230000091
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。

Claims (4)

1.一种融合注意力机制和双端知识图谱的电影推荐方法,其特征在于,包括以下步骤:
步骤1:首先从数据集文档中读取用户-属性信息,将其映射至低维空间中,构建用户-属性二分图Gu,然后在第一个全连接层中用非线性激活函数构造相应的层,获得用户-属性之间的注意力权重,计算用户u的邻域表示,最终使用聚合器得到用户特征U;
步骤2:将电影信息输入至知识图谱中,获取试题三元组(h,r,t),使用基于翻译的嵌入模型TransE学习三元组的嵌入(ehier,et),并将三元组中的首部实体与尾部实体映射至关系空间中转变为
Figure FDA0003449380220000011
Figure FDA0003449380220000012
步骤3:在第二个全连接层中使用非线性激活函数tanh构建相应的层,使得注意力得分依赖于
Figure FDA0003449380220000013
Figure FDA0003449380220000014
计算在不同关系下知识图谱内实体之间的注意力权重,计算电影v的邻域表示,使用聚合器得到电影特征V;
步骤4:将用户特征U与电影特征V作为预测函数的输入值,计算用户对电影的预测点击率yuv,实现针对于用户的个性化电影推荐。
2.如权利要求1所述的融合注意力机制和双端知识图谱的电影推荐方法,其特征在于,所述步骤1中的用非线性激活函数构建相应的层,采用下式:
Figure FDA0003449380220000015
其中,
Figure FDA0003449380220000016
表示用户-属性的注意力得分,ReLu为非线性激活函数,u与ui分别表示用户及其属性,w1与b1分别表示权重与偏置参数,体现不同的属性对于用户本身的重要程度。
3.如权利要求1所述的融合注意力机制和双端知识图谱的电影推荐方法,其特征在于,所述步骤2中,将电影信息输入至知识图谱中获得电影实体三元组(h,r,t),使用基于翻译的嵌入模型TranE学习实体与关系的嵌入,使用d(h,r,t)函数计算h+r与t之间的距离,则获得嵌入
Figure FDA0003449380220000021
Figure FDA0003449380220000022
将三元组中的头部实体与尾部实体采用
Figure FDA0003449380220000023
映射至关系空间中,其中
Figure FDA0003449380220000024
Figure FDA0003449380220000025
为eh与et在关系空间r中的投影表示,并使用损失函数来扩大存在的三元组(h,r,t)与不存在的三元组(h',r,t;)的差别:
Figure FDA0003449380220000026
4.如权利要求3所述的融合注意力机制和双端知识图谱的电影推荐方法,其特征在于,所述步骤3中,设计的注意力权重公式为:
Figure FDA0003449380220000027
其中tanh为非线性激活函数,wr为关系权重,使用softmax函数实现归一化:
Figure FDA0003449380220000028
CN202111682078.2A 2021-12-31 2021-12-31 一种融合注意力机制和双端知识图谱的电影推荐方法 Active CN114329222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111682078.2A CN114329222B (zh) 2021-12-31 2021-12-31 一种融合注意力机制和双端知识图谱的电影推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111682078.2A CN114329222B (zh) 2021-12-31 2021-12-31 一种融合注意力机制和双端知识图谱的电影推荐方法

Publications (2)

Publication Number Publication Date
CN114329222A true CN114329222A (zh) 2022-04-12
CN114329222B CN114329222B (zh) 2024-09-13

Family

ID=81023083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111682078.2A Active CN114329222B (zh) 2021-12-31 2021-12-31 一种融合注意力机制和双端知识图谱的电影推荐方法

Country Status (1)

Country Link
CN (1) CN114329222B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708064A (zh) * 2022-04-15 2022-07-05 合肥工业大学 一种基于元学习和知识图谱的商品推荐方法
CN115757828A (zh) * 2022-11-16 2023-03-07 南京航空航天大学 一种基于辐射源知识图谱的空中目标意图识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180092194A (ko) * 2017-02-08 2018-08-17 경북대학교 산학협력단 논리적 속성이 반영된 지식 그래프 임베딩 방법 및 시스템, 이를 수행하기 위한 기록매체
US20190332946A1 (en) * 2018-04-30 2019-10-31 Facebook, Inc. Combining machine-learning and social data to generate personalized recommendations
CN112328832A (zh) * 2020-10-27 2021-02-05 内蒙古大学 一种融合标签和知识图谱的电影推荐方法
CN113032618A (zh) * 2021-03-26 2021-06-25 齐鲁工业大学 基于知识图谱的音乐推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180092194A (ko) * 2017-02-08 2018-08-17 경북대학교 산학협력단 논리적 속성이 반영된 지식 그래프 임베딩 방법 및 시스템, 이를 수행하기 위한 기록매체
US20190332946A1 (en) * 2018-04-30 2019-10-31 Facebook, Inc. Combining machine-learning and social data to generate personalized recommendations
CN112328832A (zh) * 2020-10-27 2021-02-05 内蒙古大学 一种融合标签和知识图谱的电影推荐方法
CN113032618A (zh) * 2021-03-26 2021-06-25 齐鲁工业大学 基于知识图谱的音乐推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
袁泉;成振华;江洋;: "基于知识图谱和协同过滤的电影推荐算法研究", 计算机工程与科学, no. 04, 15 April 2020 (2020-04-15) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708064A (zh) * 2022-04-15 2022-07-05 合肥工业大学 一种基于元学习和知识图谱的商品推荐方法
CN115757828A (zh) * 2022-11-16 2023-03-07 南京航空航天大学 一种基于辐射源知识图谱的空中目标意图识别方法
CN115757828B (zh) * 2022-11-16 2023-11-10 南京航空航天大学 一种基于辐射源知识图谱的空中目标意图识别方法

Also Published As

Publication number Publication date
CN114329222B (zh) 2024-09-13

Similar Documents

Publication Publication Date Title
Darban et al. GHRS: Graph-based hybrid recommendation system with application to movie recommendation
CN113362131A (zh) 一种融合知识图谱和用户交互的图模型智能商品推荐方法
Ni et al. A two-stage embedding model for recommendation with multimodal auxiliary information
CN103106279A (zh) 一种同时基于节点属性以及结构关系相似度的聚类方法
CN114329222A (zh) 一种融合注意力机制和双端知识图谱的电影推荐方法
CN112417313A (zh) 一种基于知识图卷积网络的模型混合推荐方法
CN109190030A (zh) 融合node2vec和深度神经网络的隐式反馈推荐方法
CN116010708A (zh) 一种基于知识图谱的多对比学习推荐方法
CN115618108B (zh) 新零售模式下基于知识图谱的品牌推荐方法
CN116340646A (zh) 一种基于超图基序优化多元用户表示的推荐方法
Agarwal et al. Trust-enhanced recommendation of friends in web based social networks using genetic algorithms to learn user preferences
CN113807422A (zh) 融合多特征信息的加权图卷积神经网络评分预测模型
CN114637857A (zh) 一种基于去噪的知识感知图卷积网络推荐方法
CN114461907B (zh) 一种基于知识图谱的多元环境感知推荐方法及系统
Cui et al. Communication-efficient federated recommendation model based on many-objective evolutionary algorithm
CN109710835A (zh) 一种带有时间权重的异构信息网络推荐方法
CN115374347A (zh) 一种基于知识图注意力网络的社交推荐方法
CN116383519A (zh) 基于双加权的自注意力的群组推荐方法
CN113342994B (zh) 一种基于无采样协作知识图网络的推荐系统
CN114564594A (zh) 一种基于双塔模型的知识图谱用户偏好实体召回方法
Zhang et al. Knowledge graph driven recommendation model of graph neural network
CN116304372A (zh) 一种融合群组的协作知识图网络推荐方法
CN110825965A (zh) 一种基于信任机制和时间加权的改进协同过滤推荐方法
Zhang et al. Adaptive Graph Convolution Methods for Attributed Graph Clustering
CN114491055B (zh) 基于知识图谱的推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant