CN114329222A - 一种融合注意力机制和双端知识图谱的电影推荐方法 - Google Patents
一种融合注意力机制和双端知识图谱的电影推荐方法 Download PDFInfo
- Publication number
- CN114329222A CN114329222A CN202111682078.2A CN202111682078A CN114329222A CN 114329222 A CN114329222 A CN 114329222A CN 202111682078 A CN202111682078 A CN 202111682078A CN 114329222 A CN114329222 A CN 114329222A
- Authority
- CN
- China
- Prior art keywords
- user
- movie
- knowledge graph
- attention
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000007246 mechanism Effects 0.000 title claims abstract description 20
- 238000013507 mapping Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 28
- 230000004913 activation Effects 0.000 claims description 14
- 238000013519 translation Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 4
- 241000396377 Tranes Species 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 abstract description 2
- 238000005070 sampling Methods 0.000 description 7
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- ODCKICSDIPVTRM-UHFFFAOYSA-N [4-[2-hydroxy-3-(propan-2-ylazaniumyl)propoxy]naphthalen-1-yl] sulfate Chemical compound C1=CC=C2C(OCC(O)CNC(C)C)=CC=C(OS(O)(=O)=O)C2=C1 ODCKICSDIPVTRM-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
技术领域
本发明属于知识图谱的技术领域,尤其涉及一种融合注意力机制和双端知识图谱的电影推荐方法。
背景技术
常用的推荐算法主要有基于内容的推荐算法、基于协同过滤的推荐算法以及基于知识推荐算法。第一种算法的主要思想是基于物品本身的属性,向用户推荐与其曾经喜好相似的物品,第二种算法的主要思想是基于大量的用户-物品交互信息进行的推荐算法,但是由于数据的稀疏性会导致冷启动问题的产生且结果的可解释性较差;为了解决上述问题,则提出了基于知识推荐算法,知识图谱是一种富含实体之间语义关联信息的异构网络,为每个实体和关系学习低维向量,作为推荐系统的辅助信息,可以有效地提高推荐结果的准确性、多样性以及可解释性。
随着人们对算法研究的逐渐深入,许多研究人员尝试将神经网络加入到推荐系统中,由于神经网络可以通过调节内部节点之间的相互关系以处理相关信息的特点,可以有效地提取特征,对于知识图谱中构建用户特征与项目特征有很好的帮助作用。
由于知识图谱内庞大的数据,常使用的方法有固定数量采样法和随机采样法等,但其会引入噪声进而影响推荐结果。因此可以选用注意力机制为每一个三元组分配权值,根据权值进行采样可以减少计算量并提高推荐结果的准确率、可解释性。
发明内容
针对现有技术中的不足,本发明提出了一种融合注意力机制和双端知识图谱的电影推荐方法,实现利用用户对关系的偏好以挖掘更多符合用户兴趣的实体,更加准确地计算用户特征;利用电影知识图谱中丰富的实体关系三元组中的信息,根据首部实体与尾部实体之间的相似度分配权值,根据权值进行邻域采样以获得更加准确的项目特征,从而提高推荐结果的个性化和准确性。
为了解决上述技术问题,本发明通过以下技术方案来实现:
本发明提供一种融合注意力机制和双端知识图谱的电影推荐方法,包括以下步骤:
步骤1:首先从数据集文档中读取用户-属性信息,将其映射至低维空间中,构建用户-属性二分图Gu,然后在第一个全连接层中用非线性激活函数构造相应的层,获得用户-属性之间的注意力权重,计算用户u的邻域表示,最终使用聚合器得到用户特征U;
步骤4:将用户特征U与电影特征V作为预测函数的输入值,计算用户对电影的预测点击率yuv,实现针对于用户的个性化电影推荐。
优选的,所述步骤1中的用非线性激活函数构建相应的层,采用下式:
优选的,所述步骤2中,将电影信息输入至知识图谱中获得电影实体三元组(h,r,t),使用基于翻译的嵌入模型TranE学习实体与关系的嵌入,使用d(h,r,t)函数计算h+r与t之间的距离,则获得嵌入eh、和将三元组中的头部实体与尾部实体采用映射至关系空间中,其中与为eh与et在关系空间r中的投影表示,并使用损失函数来扩大存在的三元组(h,r,t)与不存在的三元组(h′,r,t;)的差别:
进一步的,所述步骤3中,设计的注意力权重公式为:
其中tanh为非线性激活函数,wr为关系权重,使用softmax函数实现归一化:
由上,本发明的融合注意力机制和双端知识图谱的电影推荐方法至少具有如下有益效果:
本发明根据用户的偏好更好地提取了用户的特征,实现了推荐结果个性的提高;根据实体之间的相似度更好地提取了项目的特征,实现了推荐结果准确率的提高;将注意力机制与双端知识图谱相融合,进一步提高了推荐结果的可解释性与准确率;并且本发明提出的模型可以应用于诸多领域,比如音乐、图书领域。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍。
图1是本发明的融合注意力机制和双端知识图谱的电影推荐方法的流程图;
图2是知识图谱数据传播图。
具体实施方式
下面结合附图详细说明本发明的具体实施方式,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。在所参照的附图中,不同的图中相同或相似的部件使用相同的附图标号来表示。
如图1至图2所示,本发明的融合注意力机制和双端知识图谱的电影推荐方法,包括以下步骤:
步骤1:首先从数据集文档中读取用户-属性信息,将其映射至低维空间中,构建用户-属性二分图Gu,然后在第一个全连接层中用非线性激活函数构建相应的层:
然后计算用户u的邻域表示:
其中uN(u)表示为u的邻域表示,N(u)为与用户u直接相连的属性集合。
最终使用聚合器得到用户特征U。
在得到三元组的嵌入后,使用损失函数来扩大两种三元组之间的差别。将电影信息输入至知识图谱中获得电影实体三元组(h,r,t),使用基于翻译的嵌入模型TranE学习实体与关系的嵌入,使用d(h,r,t)函数计算h+r与t之间的距离,则获得嵌入eh、和将三元组中的头部实体与尾部实体采用映射至关系空间中,其中与为eh与et在关系空间r中的投影表示。并使用损失函数来扩大存在的三元组(h,r,t)与不存在的三元组(h′,r,t;)的差别:
其中S为存放三元组的集合,(h,r,t)为存在的三元组,将三元组内的h与t随机替换产生不存在的三元组(h′,r,t′)。
本发明针对实体之间的距离所设计的注意力权重公式为:
其中tanh为非线性激活函数,wr为关系权重。使用softmax函数实现归一化:
然后计算电影v的邻域表示:
其中vS(h)为h的领域表示,S(h)为直接与h相连的实体集合。
最终使用聚合器得到电影矩阵V。
步骤4:将用户特征U与电影特征V作为预测函数的输入值,计算用户对电影的预测点击率yuv,从而实现针对于用户的个性化电影推荐。
值得注意的是,与传统的知识图谱中权值的计算方法不同,本发明使用了注意力机制分别基于用户和电影设计了两种注意力权重公式。通过用户-属性信息计算注意力权重,充分获取用户的偏好特征,提高推荐的个性化;通过首部实体与尾部实体的相似度计算注意力权重,充分获取电影的特征,提高推荐的准确率,将用户端与电影端相结合进行推荐,有效地提高了模型的推荐效果。在之后的实验中与其他知识图谱模型进行对比,证明本模型的有效性。
实施例:本发明所采用的数据集是MovieLens-1M。MovieLens-1M数据集含有来自6040名用户对3629部电影的83万条评分数据,其包含:用户的评分、用户信息以及电影的信息。经过数据预处理后的数据如下表1所示:
表1相关数据集的数据
本发明将在CTR(点击率预测)场景下验证有效性:用本发明模型对测试集中的数据进行预测,使用ACC和AUC来评估模型预测的准确性。
实验的基线模型有:CKE(Collaborative Knowledge Embedding):协同知识嵌入,将知识图谱与协同过滤算法相结合,对用户进行推荐。KGCN(knowledge graphconvolutional networks for recommender systems):KGCN是以物品为中心实体进行传播,加入注意力机制,实现个性化推荐。RippleNet:将用户的历史兴趣设置为兴趣传播的种子,根据三元组(h,r,t)沿着KG不断地迭代传播用户的兴趣。LibFM(FactorizationMachine Library):是用于点击率预测中的一个基于特征的因子分解模型。PER(Personalized Entity Recommendation):根据知识图谱的异构性,将用户的隐形反馈基于原路径进行扩展实现推荐结果的个性化。上述的五种基线模型和本发明的模型一起在两个数据集上进行实验,实验结果如下表2所示:
从表2中可以看出,与人们比较熟知的推荐算法LibFM、PER以及与知识图谱相关的算法RippleNet、KGCN、CKE算法相比较,本发明所设计的算法在MovieLens-1M数据集上的各项数据均有提升,在MovieLens-1M数据集上,相较于最优的数据,AUC和ACC数据值各提高了1.1%和1.3%,相比较于以上模型,本发明将知识图谱中的各个实体进行预测,并选择排名前n个继续扩展,保证了数据的有效性,并且将k-hop中的k值提高,可以增加采样以获得更好的用户和商品特征。
采样邻居数量以及聚合跳数对于算法的影响体现在表3和表4中,从表3可以看出采样邻居数量对于算法的影响,取值过高或者过低都会影响算法本身的性能,过低会导致聚合实体数量较少,无法获得更多有效的信息;过高会导致融入更多的噪音,也会提高相应的计算量。
表3在不同采样数量下的AUC值
从表4中可以看出,跳数对于算法的影响更强,当跳数增加时,算法在前3跳时表现是最好的,到4时数值有明显的下降,在知识图谱中引入的1跳邻居信息是用户兴趣的直接邻域,而过大的L则会降低引入信息的有效性。
表4在不同跳数下的AUC值
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述是本发明的优选实施方式而已,当然不能以此来限定本发明之权利范围,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变动,这些改进和变动也视为本发明的保护范围。
Claims (4)
1.一种融合注意力机制和双端知识图谱的电影推荐方法,其特征在于,包括以下步骤:
步骤1:首先从数据集文档中读取用户-属性信息,将其映射至低维空间中,构建用户-属性二分图Gu,然后在第一个全连接层中用非线性激活函数构造相应的层,获得用户-属性之间的注意力权重,计算用户u的邻域表示,最终使用聚合器得到用户特征U;
步骤4:将用户特征U与电影特征V作为预测函数的输入值,计算用户对电影的预测点击率yuv,实现针对于用户的个性化电影推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682078.2A CN114329222B (zh) | 2021-12-31 | 2021-12-31 | 一种融合注意力机制和双端知识图谱的电影推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682078.2A CN114329222B (zh) | 2021-12-31 | 2021-12-31 | 一种融合注意力机制和双端知识图谱的电影推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114329222A true CN114329222A (zh) | 2022-04-12 |
CN114329222B CN114329222B (zh) | 2024-09-13 |
Family
ID=81023083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111682078.2A Active CN114329222B (zh) | 2021-12-31 | 2021-12-31 | 一种融合注意力机制和双端知识图谱的电影推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114329222B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708064A (zh) * | 2022-04-15 | 2022-07-05 | 合肥工业大学 | 一种基于元学习和知识图谱的商品推荐方法 |
CN115757828A (zh) * | 2022-11-16 | 2023-03-07 | 南京航空航天大学 | 一种基于辐射源知识图谱的空中目标意图识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180092194A (ko) * | 2017-02-08 | 2018-08-17 | 경북대학교 산학협력단 | 논리적 속성이 반영된 지식 그래프 임베딩 방법 및 시스템, 이를 수행하기 위한 기록매체 |
US20190332946A1 (en) * | 2018-04-30 | 2019-10-31 | Facebook, Inc. | Combining machine-learning and social data to generate personalized recommendations |
CN112328832A (zh) * | 2020-10-27 | 2021-02-05 | 内蒙古大学 | 一种融合标签和知识图谱的电影推荐方法 |
CN113032618A (zh) * | 2021-03-26 | 2021-06-25 | 齐鲁工业大学 | 基于知识图谱的音乐推荐方法及系统 |
-
2021
- 2021-12-31 CN CN202111682078.2A patent/CN114329222B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180092194A (ko) * | 2017-02-08 | 2018-08-17 | 경북대학교 산학협력단 | 논리적 속성이 반영된 지식 그래프 임베딩 방법 및 시스템, 이를 수행하기 위한 기록매체 |
US20190332946A1 (en) * | 2018-04-30 | 2019-10-31 | Facebook, Inc. | Combining machine-learning and social data to generate personalized recommendations |
CN112328832A (zh) * | 2020-10-27 | 2021-02-05 | 内蒙古大学 | 一种融合标签和知识图谱的电影推荐方法 |
CN113032618A (zh) * | 2021-03-26 | 2021-06-25 | 齐鲁工业大学 | 基于知识图谱的音乐推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
袁泉;成振华;江洋;: "基于知识图谱和协同过滤的电影推荐算法研究", 计算机工程与科学, no. 04, 15 April 2020 (2020-04-15) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708064A (zh) * | 2022-04-15 | 2022-07-05 | 合肥工业大学 | 一种基于元学习和知识图谱的商品推荐方法 |
CN115757828A (zh) * | 2022-11-16 | 2023-03-07 | 南京航空航天大学 | 一种基于辐射源知识图谱的空中目标意图识别方法 |
CN115757828B (zh) * | 2022-11-16 | 2023-11-10 | 南京航空航天大学 | 一种基于辐射源知识图谱的空中目标意图识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114329222B (zh) | 2024-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Darban et al. | GHRS: Graph-based hybrid recommendation system with application to movie recommendation | |
CN113362131A (zh) | 一种融合知识图谱和用户交互的图模型智能商品推荐方法 | |
Ni et al. | A two-stage embedding model for recommendation with multimodal auxiliary information | |
CN103106279A (zh) | 一种同时基于节点属性以及结构关系相似度的聚类方法 | |
CN114329222A (zh) | 一种融合注意力机制和双端知识图谱的电影推荐方法 | |
CN112417313A (zh) | 一种基于知识图卷积网络的模型混合推荐方法 | |
CN109190030A (zh) | 融合node2vec和深度神经网络的隐式反馈推荐方法 | |
CN116010708A (zh) | 一种基于知识图谱的多对比学习推荐方法 | |
CN115618108B (zh) | 新零售模式下基于知识图谱的品牌推荐方法 | |
CN116340646A (zh) | 一种基于超图基序优化多元用户表示的推荐方法 | |
Agarwal et al. | Trust-enhanced recommendation of friends in web based social networks using genetic algorithms to learn user preferences | |
CN113807422A (zh) | 融合多特征信息的加权图卷积神经网络评分预测模型 | |
CN114637857A (zh) | 一种基于去噪的知识感知图卷积网络推荐方法 | |
CN114461907B (zh) | 一种基于知识图谱的多元环境感知推荐方法及系统 | |
Cui et al. | Communication-efficient federated recommendation model based on many-objective evolutionary algorithm | |
CN109710835A (zh) | 一种带有时间权重的异构信息网络推荐方法 | |
CN115374347A (zh) | 一种基于知识图注意力网络的社交推荐方法 | |
CN116383519A (zh) | 基于双加权的自注意力的群组推荐方法 | |
CN113342994B (zh) | 一种基于无采样协作知识图网络的推荐系统 | |
CN114564594A (zh) | 一种基于双塔模型的知识图谱用户偏好实体召回方法 | |
Zhang et al. | Knowledge graph driven recommendation model of graph neural network | |
CN116304372A (zh) | 一种融合群组的协作知识图网络推荐方法 | |
CN110825965A (zh) | 一种基于信任机制和时间加权的改进协同过滤推荐方法 | |
Zhang et al. | Adaptive Graph Convolution Methods for Attributed Graph Clustering | |
CN114491055B (zh) | 基于知识图谱的推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |