CN112507132A - 一种基于知识图谱和注意力机制的推荐方法 - Google Patents
一种基于知识图谱和注意力机制的推荐方法 Download PDFInfo
- Publication number
- CN112507132A CN112507132A CN202011475276.7A CN202011475276A CN112507132A CN 112507132 A CN112507132 A CN 112507132A CN 202011475276 A CN202011475276 A CN 202011475276A CN 112507132 A CN112507132 A CN 112507132A
- Authority
- CN
- China
- Prior art keywords
- entity
- knowledge
- recommendation system
- graph
- refining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000007246 mechanism Effects 0.000 title claims abstract description 18
- 230000003993 interaction Effects 0.000 claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000005070 sampling Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000013528 artificial neural network Methods 0.000 claims description 45
- 238000007670 refining Methods 0.000 claims description 42
- 238000006116 polymerization reaction Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000002776 aggregation Effects 0.000 claims description 20
- 238000004220 aggregation Methods 0.000 claims description 20
- 239000011541 reaction mixture Substances 0.000 claims description 12
- 230000002452 interceptive effect Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000005295 random walk Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 3
- 239000010410 layer Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱和注意力机制的推荐方法,包括:根据推荐系统中的交互记录获取与交互记录相关的知识图谱,对知识图谱中的每个实体的其邻居节点进行随机采样处理;使用知识图谱和交互记录分别训练两个模型KRAN‑NM和KRAN‑CD;将待推荐物品分为有交互记录的常规物品和没有交互记录的冷启动物品;对常规物品使用训练好的KRAN‑NM处理,对冷启动物品用训练好的KRAN‑CD处理,最后将两种模型的处理结果按照偏好度大小进行综合排名,得到最终的推荐结果。本发明可以有效的提取出知识图谱中有用的知识,将处理后的信息应用于推荐系统,从而改善和缓解推荐系统的数据稀疏性和冷启动问题。
Description
技术领域
本发明涉及个性化推荐系统领域,尤其涉及一种推荐系统领域的基于知识图谱和注意力机制的混合推荐方法。
背景技术
当今世界,互联网技术迅猛发展,随之而来的是海量的信息数据,人们在面对浩如烟海的信息数据的时候往往无法找到自己想要的信息,为了解决此类问题,推荐系统应运而生,推荐系统能够主动将用户可能感兴趣的物品推送给用户,从而免去了人们搜索和判断的时间,进而使得人们在实际的生产生活中不再需要花费大量的时间和精力去搜索和寻找自己想要的东西,也减少了企业的推广精力,能够更容易卖出更多的东西。推荐系统从整体上提高了整个社会的运行效率,。
传统的推荐系统依赖于用户和物品之间的交互记录,当交互记录数量较少时,会导致推荐系统的推荐效果较差,这就造成了推荐系统的数据稀疏性问题,而在极端情况下,如果待推荐的物品中有一部分完全没有交互记录时,这部分物品就完全不会被推荐,进而导致推荐系统的推荐精度更低,这就是推荐系统所面临的另一个问题,这个问题被叫做物品的冷启动问题。引入知识图谱是解决缓解数据稀疏性和物品冷启动的问题的有效途径,将知识图谱作为额外的辅助数据来源,通过知识图谱中的知识来丰富交互信息能够很大程度上缓解数据的缺少。但知识图谱是一种以图网络结构的方式存在的数据,其数据结构千变万化,很难方便的直接使用,有用的信息很难提取出来。
发明内容
针对上述现有技术,本发明提出一种基于知识图谱和注意力机制的推荐方法,其中,精炼注意力机制可以对知识图谱和交互记录进行综合处理,有效的提取出知识图谱中有用的知识,进而将处理后的信息应用于推荐系统,从而改善和缓解推荐系统的数据稀疏性和冷启动问题。
为了解决上述技术问题,本发明提出的一种基于知识图谱和注意力机制的推荐方法,主要包括:
步骤一:根据推荐系统中的交互记录,获取与交互记录相关的知识图谱;对知识图谱中的每个实体的其邻居节点进行随机采样处理;
步骤二:针对采样结果,使用知识图谱和交互记录分别训练两个推荐系统模型,两个推荐系统模型包括常规版知识精炼推荐系统模型(KRAN-NM)和冷启动版知识精炼推荐系统模型(KRAN-CD);
步骤三:将待推荐物品分为常规物品和冷启动物品,其中,有交互记录的物品为常规物品,没有交互记录的为冷启动物品;对常规物品使用步骤二训练好的常规版知识精炼推荐系统模型处理,对冷启动物品用步骤二训练好的冷启动版知识精炼推荐系统模型处理,最后将两种模型的处理结果按照偏好度大小进行综合排名,得到最终的推荐结果。
进一步讲,本发明所述的基于知识图谱和注意力机制的推荐方法,其中:
步骤一中,获取与交互记录相关的知识图谱,包括以下步骤:
1-1)将交互记录中的物品剔除重复值后加入到一个交互物品列表中;
1-2)对交互物品列表中的每个物品,使用网页接口向中文通用百科知识图谱(CN-DBPedia)网站的列表接口发送物品名称,得到返回的实体ID列表;
1-3)针对实体ID列表中的每一个元素,向中文通用百科知识图谱(CN-DBPedia)网站的实体接口发送实体ID,得到实体的属性信息;
1-4)使用计算机软件编程对实体ID列表中每一个元素得到的属性信息和交互记录中的属性信息进行比对,确定交互记录中实际物品所对应的正确ID;
1-5)将确定的ID发送到中文通用百科知识图谱(CN-DBPedia)网站的提取接口,提取到此ID对应的所有知识图谱三元组;
1-6)将交互物品列表中每个物品的知识图谱三元组集合组成一个总的集合,即为与交互记录相关的知识图谱。
步骤一中,对知识图谱中的每个实体的其邻居节点进行随机采样处理过程中,当采样数量大于邻居节点数量时,采用可重复随机采样,当采样数量小于邻居节点数量时,采用不重复随机采样。
步骤二中,训练常规版知识精炼推荐系统模型的步骤如下:
2-1)计算每个实体与步骤一采样后的邻居节点的注意力系数:
式(1)中,T为求得的注意力系数,a(,)为内积操作,h为实体节点的嵌入向量表示,其中下标0表示实体本身,下标i表示实体的每个邻居节点;
2-2)采用式(2)进行注意力系数的归一化操作,得到每个实体的注意力因子
式(2)中,α为计算得到的每个实体与其每个邻居之间的注意力因子,H为知识图谱中所有实体的嵌入表示组合而成的嵌入表示集合,下标i表示实体的每个邻居节点,下标j表示实体所有邻居节点的枚举值;
2-3)对上述得到的每个实体的注意力因子进行精炼操作,得到精炼注意力因子,
式(3)中,β为计算得到的精炼注意力因子;
2-4)将所有精炼注意力因子组合成向量,得到每个实体的精炼注意力因子向量:
式(4)中,C为邻居的个数;
2-5)使用每个实体的精炼注意力因子向量进行实体信息的初步聚合:
2-6)在上述初步聚合的基础上进行完整的聚合:
2-7)对完整聚合的结果进行规范化处理:
2-8)通过连接操作,得到多次聚合的最终结果:
2-9)形成推荐系统中用户对物品的偏好预测:
式(9)中,u是用户的嵌入向量表示;
2-10)定义损失函数模型:
其中,Γ是实际的偏好大小,Z是预测的偏好大小,y则指的是神经网络中每个矩阵元素的大小,m指的是神经网络中矩阵元素的个数;
2-11)使用梯度下降的算法循环训练式(10)所示的损失函数模型,从而实现对所述的推荐系统模型的训练。
步骤二中,训练冷启动版知识精炼推荐系统模型包括:首先,通过对冷启动版知识精炼推荐系统模型的预训练,得到实体节点的嵌入向量表示h;然后,按照步骤2-1)至2-11)实现对所述的推荐系统模型的训练。其中,对冷启动版知识精炼推荐系统模型的预训练过程如下:
针对步骤一获取的知识图谱中的每个实体的节点进行独热编码;将每个实体的独热编码用两个神经网络进行变换,两个神经网络分别是:第一个神经网络为节点个数*嵌入维度模式的转换矩阵Wa,第二个神经网络为嵌入维度*节点个数模式的转换矩阵Wb;训练上述两个神经网络,将第一个神经网络和第二个神经网络串联,所述第二个神经网络的输出为实体节点,是原点出发的随机游走序列;当第二个神经网络的输出损失最小时,所述的转换矩阵Wa即是知识图谱的冷启动预嵌入向量表示结果,将所述转换矩阵Wa的每一行作为实体节点的嵌入向量表示h。
与现有技术相比,本发明的有益效果是:
(1)整体的推荐性能得到较大的提升。因为加入了知识图谱,交互矩阵的数据得到了极大地丰富,因而整体的推荐效果得到较大的提升。
(2)在数据稀疏的情况下能够得到较好的推荐效果。数据稀疏的情况下,由于知识图谱的加入,使得数据变得不再稀疏,进而能够得到良好的推荐结果。
(3)在冷启动的情况下,由于预嵌入方法的加入,使得即使是冷启动物品,也能够通过知识图谱而获得间接联系,进而能够得到有效的推荐结果。
(4)推荐性能的提升能够帮助用户节约选择时间并且提高效率,能够帮助企业更好的进行产品的推广,能够帮助整个社会提高经济活力。
附图说明
图1是本发明提出的基于知识图谱和注意力机制的推荐方法的整体流程图;
图2是本发明的推荐方法中知识图谱三元组示例。
具体实施方式
下面结合附图及具体实施例对本发明做进一步的说明,但下述实施例绝非对本发明有任何限制。
如图1所示,本发明中提出了一种综合使用知识图谱和精炼注意力机制的推荐方法,主要包括以下步骤:
步骤一:根据推荐系统中的交互记录,获取与交互记录相关的知识图谱;对知识图谱中的每个实体的其邻居节点进行随机采样处理;
步骤二:针对采样结果,使用知识图谱和交互记录分别训练两个推荐系统模型,两个推荐系统模型包括常规版知识精炼推荐系统模型(KRAN-NM)和冷启动版知识精炼推荐系统模型(KRAN-CD);
步骤三:将待推荐物品分为常规物品和冷启动物品,其中,有交互记录的物品为常规物品,没有交互记录的为冷启动物品;对常规物品使用步骤二训练好的常规版知识精炼推荐系统模型处理,对冷启动物品用步骤二训练好的KRAN-CD处理,最后将两种模型的处理结果按照偏好度大小进行综合排名,得到最终的推荐结果。
本发明推荐方法的步骤一中,获取与交互记录相关的知识图谱,包括:
1-1)将交互记录中的物品剔除重复值后加入到一个交互物品列表中;
1-2)对交互物品列表中的每个物品,使用网页接口向中文通用百科知识图谱(CN-DBPedia)网站的列表接口发送物品名称,得到返回的实体ID列表;
1-3)针对实体ID列表中的每一个元素,向CN-DBPedia网站的实体接口发送实体ID,得到实体的属性信息;
1-4)使用计算机软件编程对实体ID列表中每一个元素得到的属性信息和交互记录中的属性信息进行比对,确定交互记录中实际物品所对应的正确ID;
1-5)将确定的ID发送到CN-DBPedia网站的提取接口,提取到此ID对应的所有知识图谱三元组;
1-6)将交互物品列表中每个物品的知识图谱三元组集合组成一个总的集合,即为与交互记录相关的知识图谱。
对知识图谱中的每个实体的其邻居节点进行随机采样处理过程中,当采样数量大于邻居节点数量时,采用可重复随机采样,当采样数量小于邻居节点数量时,采用不重复随机采样。
步骤二中,训练KRAN-NM的步骤如下:
2-1)计算每个实体与步骤一采样后的邻居节点的注意力系数:
式(1)中,T为求得的注意力系数,a(,)为内积操作,h为实体节点的嵌入向量表示,其中下标0表示实体本身,下标i表示实体的每个邻居节点;
2-2)采用式(2)进行注意力系数的归一化操作,得到每个实体的注意力因子
式(2)中,α为计算得到的每个实体与其每个邻居之间的注意力因子,H为知识图谱中所有实体的嵌入表示组合而成的嵌入表示集合,下标i表示实体的每个邻居节点,下标j表示实体所有邻居节点的枚举值;
2-3)对上述得到的每个实体的注意力因子进行精炼操作,得到精炼注意力因子,
式(3)中,β为计算得到的精炼注意力因子;
2-4)将所有精炼注意力因子组合成向量,得到每个实体的精炼注意力因子向量:
式(4)中,C为邻居的个数;
2-5)使用每个实体的精炼注意力因子向量进行实体信息的初步聚合,具体的聚合方式为对应元素相乘:
2-6)在上述初步聚合的基础上进行完整的聚合:
2-7)对完整聚合的结果进行规范化处理:
2-8)通过连接操作,得到多次聚合的最终结果:
2-9)形成推荐系统中用户对物品的偏好预测:
式(9)中,u是用户的嵌入向量表示;
2-10)定义损失函数模型:
Γ是实际的偏好大小,Z是预测的偏好大小,y则指的是神经网络中每个矩阵元素的大小,m指的是神经网络中矩阵元素的个数。
2-11)使用梯度下降的算法循环训练式(10)所示的损失函数模型,从而实现对所述的推荐系统模型的训练。
步骤二中,训练KRAN-CD包括:首先,通过对KRAN-CD的预训练,得到实体节点的嵌入向量表示h;然后,按照步骤2-1)至2-11),进而得到训练后的KRAN-CD。
对KRAN-CD的预训练过程是:针对步骤一获取的知识图谱中的每个实体的节点进行独热编码;将每个实体的独热编码用两个神经网络进行变换,两个神经网络分别是:第一个神经网络为节点个数*嵌入维度模式的转换矩阵Wa,第二个神经网络为嵌入维度*节点个数模式的转换矩阵Wb;训练上述两个神经网络,将第一个神经网络和第二个神经网络串联,所述第二个神经网络的输出为实体节点,是原点出发的随机游走序列;当第二个神经网络的输出损失最小时,所述的转换矩阵Wa即是知识图谱的冷启动预嵌入向量表示结果,将所述转换矩阵Wa的每一行作为实体节点的嵌入向量表示h。
实施例1,
使用本发明提出的一种基于知识图谱和注意力机制的推荐方法处理last.fm-2k数据集的音乐推荐的完整流程参见图1,三元组形式的知识图谱示例参见图2。具体的推荐包括以下步骤:
一、根据音乐数据集last.fm-2k数据集中的音乐交互记录,获取与交互记录中所有的音乐相关的知识图谱。知识图谱的获取是通过CN-DBPedia网站来获得的,通过调用CN-DBPedia的列表接口和实体接口,先后取得实体列表和实体属性列表,进而通过计算机程序判断与交互记录所对应的正确实体ID,最终调用提取接口,获得所有的三元组后,再将这些所有的三元组组装成最终的知识图谱。
二、使用知识图谱和交互记录训练KRAN-NM。具体如下:
2-1)对音乐知识图谱中每个实体的其邻居节点进行随机采样处理。音乐数据集的采样数量为9,邻居节点大于等于9时为非重复采样,小于9时为重复随机采样。
2-2)使用式(1)计算每个实体与其邻居节点的注意力系数。具体的计算方法为实体与邻居节点进行内积操作,内积大的注意力系数大,相关性更高。
2-3)采用式(2)进行注意力系数的归一化操作,归一化使得注意力系数不至于变化太大,但是又能反映出每个节点的重要程度,经过这个步骤以后,就可以得到每个实体的注意力因子。
2-4)使用式(3)对每个实体的注意力因子进行精炼操作,得到精炼注意力因子。精炼操作的过程中,精炼的尺寸为3。
2-5)使用式(4)将所有精炼注意力因子组合成向量,得到每个实体的精炼注意力因子向量。在last.fm-2k的具体处理过程中,精炼注意力因子向量的维度为9,这9个维度中只有三个有数值,其它6个都是0。
2-6)使用式(5)进行初步的聚合。也就是计算邻居节点的聚合值。
2-7)在初步聚合的基础上使用式(6)进行完整的聚合。也就是将初步的聚合结果和初始的节点向量进行相加的操作,二者1:1的比例进行聚合。
2-8)对完整聚合的结果使用式(7)进行规范化处理。这里也是一种对具体的数值进行约束的机制,防止变化太大导致结果的失真。
2-9)使用式(8)进行连接操作,得到多次聚合的最终结果。此处需注意的是连接操作需要包含初始的向量表示,一次聚合的嵌入向量表示,二次聚合的嵌入向量表示,一直到最大聚合次数的嵌入向量表示,last.fm-2k数据集的聚合次数选择为3次。也就是将0、1、2、3次的聚合结果分辨收尾连接在一起。
2-10)使用式(9)形成推荐系统中用户对物品的偏好预测。具体来说也是使用内积操作,通过用户的嵌入向量表示和物品聚合后的嵌入向量表示做内积,得到最终的用户对物品的偏好大小。
2-11)使用式(10)来定义损失函数。使用交叉商损失函数和均方误差函数之和来作为损失函数。
2-12)使用梯度下降的算法循环训练实施例1中的步骤1-11)所得到的推荐系统模型。
三、使用知识图谱和交互记录训练KRAN-CD。这里主要是对知识图谱进行一个预先的训练,中间使用两层神经网络,输入为独热编码,输出为以节点为起点的岁间游走序列。预训练后的物品还需要通过一个两层的神经网络进行综合处理,进而转化为适用于推荐系统的嵌入向量模式,然后按照本实施例1中的步骤2-2)至2-12),从而得到训练后的KRAN-CD。
四、将last.fm-2k数据集中的物品分为训练接和测试集,测试集中为待推荐物品,待推荐物品又分为常规物品和冷启动物品,常规物品使用KRAN-NM模型处理,冷启动物品用KRAN-CD模型处理,最后按照偏好度大小进行综合排名,得到最终的推荐结果。
实施例2
实施例2中将使用本发明提出的基于知识图谱和注意力机制的推荐方法处理MovieLens-20M数据集中的电影推荐问题,推荐方法的完整流程参见图1,三元组形式的知识图谱示例参见图2。具体过程如下:
一、获取与MovieLens-20M数据集交互记录相关的知识图谱:
1-1)将MovieLens-20M交互记录中的物品剔除重复值后加入到一个交互物品列表中。此时的列表是所有电影的名称所组成的列表。
1-2)对MovieLens-20M中交互物品列表中的每个物品,使用CN-DBPedia网站自带的网页接口向CN-DBPedia网站的列表接口发送物品名称,得到返回的所有的相关实体的ID列表。
1-3)针对2中获得的实体ID列表中的每一个元素,向CN-DBPedia网站的实体接口发送实体ID,得到实体的属性信息,大多数都是属性信息,暴扣它是否是一个电影,上映时间是多少,主演是谁等各种相关信息。
1-4)使用计算机软件编程对3中得到的属性信息和交互记录中的属性信息进行比对判断,确定交互记录中电影所对应的CN-DBPedia中实体的正确ID。
1-5)将上一步中得到的正确ID发送到CN-DBPedia的提取接口,提取到此ID对应的所有知识三元组,这里的三元组都是和电影推荐相关的三元组,比如导演、演员、发行年代、影片类型等三元组。
1-6)将所有得到的三元组进行组合,得到一个总的集合,从而形成最终的针对MovieLens-20M数据集的知识图谱。
二、训练MovieLens-20M对应的KRAN-NM:
2-1)针对知识图谱中的每个实体的其邻居节点进行随机采样处理。这里的采样数量定为9,通过这种处理,每个实体的邻居节点数量一致,便于处理。而在具体的采样处理过程中,虽然都是随机采样,但是当采样数量大于邻居节点数量时,采用可重复随机采样,当采样数量小于邻居节点数量时,采用不重复随机采样。
2-2)利用本发明推荐方法中的式(1)计算知识图谱中每个实体与其邻居节点的注意力系数Ti。
2-3)利用本发明推荐方法中的式(2)进行注意力系数的归一化操作,得到每个实体的注意力因子αi。
2-4)利用本发明推荐方法中的式(3)对注意力因子αi进行精炼操作,得到精炼注意力因子βi,从而留下最重要的节点,抛掉噪声节点。
2-7)利用本发明推荐方法中的式(6),在初步聚合的基础上进行完整的聚合,这里既考虑了本身,又考虑了邻居。
2-8)利用本发明推荐方法中的式(7),对完整聚合的结果进行规范化处理,从而避免聚合结果剧烈波动。
2-9)利用下述公式,通过连接操作,得到多次聚合的最终结果,这里需要注意,下角标指的是具体哪个实体,上角标则是聚合的次数,上角标为0的就是没有聚合过的原始数据:
2-10)得到所有实体节点的最终聚合结果后,可以计算推荐系统中用户对物品的偏好预测,下面的公式中<,>为内积操作:
2-11)定义损失函数,整体的损失函数如下所示:
2-12)使用梯度下降的算法循环训练上述2-11)中所示的损失函数,从而得到训练后的KRAN-NM模型。
三,训练MovieLens-20M对应的KRAN-CD模型,包括:
3-1)针对MovieLens-20M的KRAN-CD的预训练,预训练方法如下所示:
对电影数据集所对应的知识图谱中的实体节点进行独热编码。
将每个实体的独热编码用两个神经网络进行变换,第一个神经网络为节点个数*嵌入维度模式的转换矩阵Wa,第二个神经网络为嵌入维度*节点个数模式的转换矩阵Wb。这里面,嵌入维度选择为16,而节点个数是以实际个数为准的。
训练这两个神经网络,使其最终的输出为实体节点为原点出发的随机游走序列,并且使得损失函数最小。
当神经网络的损失最小后,转换矩阵Wa就是知识图谱的冷启动预嵌入向量表示结果。
3-2)在得到预训练的嵌入表示后,就可以将预训练的嵌入向量表示带入到本实施例2中的上述步骤2-2)至2-12中进行训练,从而完成KRAN-CD的训练。
四、对待推荐物品的分类处理以及对结果的综合排名:
首先将待推荐的电影分为常规电影和冷启动电影,有交互记录的物品为常规电影,没有交互记录的为冷启动电影,而后常规电影使用KRAN-NM模型处理,冷启动电影用KRAN-CD模型处理,最后将两种模型的处理结果按照偏好度大小进行综合排名,得到最终的推荐结果。排名高的偏好度大,用户可能会更倾向于喜欢,所以会及时推送出去。
尽管上面结合附图对本发明进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨的情况下,还可以做出很多变形,这些均属于本发明的保护之内。
Claims (6)
1.一种基于知识图谱和注意力机制的推荐方法,其特征在于,包括以下步骤:
步骤一:根据推荐系统中的交互记录,获取与交互记录相关的知识图谱;对知识图谱中的每个实体的其邻居节点进行随机采样处理;
步骤二:针对采样结果,使用知识图谱和交互记录分别训练两个推荐系统模型,两个推荐系统模型包括常规版知识精炼推荐系统模型(KRAN-NM)和冷启动版知识精炼推荐系统模型(KRAN-CD);
步骤三:将待推荐物品分为常规物品和冷启动物品,其中,有交互记录的物品为常规物品,没有交互记录的为冷启动物品;对常规物品使用步骤二训练好的常规版知识精炼推荐系统模型处理,对冷启动物品用步骤二训练好的冷启动版知识精炼推荐系统模型处理,最后将两种模型的处理结果按照偏好度大小进行综合排名,得到最终的推荐结果。
2.根据权利要求1所述的基于知识图谱和注意力机制的推荐方法,其特征在于,步骤一中,获取与交互记录相关的知识图谱,包括:
1-1)将交互记录中的物品剔除重复值后加入到一个交互物品列表中;
1-2)对交互物品列表中的每个物品,使用网页接口向中文通用百科知识图谱(CN-DBPedia)网站的列表接口发送物品名称,得到返回的实体ID列表;
1-3)针对实体ID列表中的每一个元素,向中文通用百科知识图谱(CN-DBPedia)网站的实体接口发送实体ID,得到实体的属性信息;
1-4)使用计算机软件编程对实体ID列表中每一个元素得到的属性信息和交互记录中的属性信息进行比对,确定交互记录中实际物品所对应的正确ID;
1-5)将确定的ID发送到中文通用百科知识图谱(CN-DBPedia)网站的提取接口,提取到此ID对应的所有知识图谱三元组;
1-6)将交互物品列表中每个物品的知识图谱三元组集合组成一个总的集合,即为与交互记录相关的知识图谱。
3.根据权利要求1所述的基于知识图谱和注意力机制的推荐方法,其特征在于,步骤一中,对知识图谱中的每个实体的其邻居节点进行随机采样处理过程中,当采样数量大于邻居节点数量时,采用可重复随机采样,当采样数量小于邻居节点数量时,采用不重复随机采样。
4.根据权利要求1所述的基于知识图谱和注意力机制的推荐方法,其特征在于,步骤二中,训练常规版知识精炼推荐系统模型的步骤如下:
2-1)计算每个实体与步骤一采样后的邻居节点的注意力系数:
式(1)中,T为求得的注意力系数,a(,)为内积操作,h为实体节点的嵌入向量表示,其中下标0表示实体本身,下标i表示实体的每个邻居节点;
2-2)采用式(2)进行注意力系数的归一化操作,得到每个实体的注意力因子
式(2)中,α为计算得到的每个实体与其每个邻居之间的注意力因子,H为知识图谱中所有实体的嵌入表示组合而成的嵌入表示集合,下标i表示实体的每个邻居节点,下标j表示实体所有邻居节点的枚举值;
2-3)对上述得到的每个实体的注意力因子进行精炼操作,得到精炼注意力因子,
式(3)中,β为计算得到的精炼注意力因子;
2-4)将所有精炼注意力因子组合成向量,得到每个实体的精炼注意力因子向量:
式(4)中,C为邻居的个数;
2-5)使用每个实体的精炼注意力因子向量进行实体信息的初步聚合:
2-6)在上述初步聚合的基础上进行完整的聚合:
2-7)对完整聚合的结果进行规范化处理:
2-8)通过连接操作,得到多次聚合的最终结果:
2-9)形成推荐系统中用户对物品的偏好预测:
式(9)中,u是用户的嵌入向量表示;
2-10)定义损失函数模型:
其中:
式(10)-(12)中,Γ是实际的偏好大小,Z是预测的偏好大小,y则指的是神经网络中每个矩阵元素的大小,m指的是神经网络中矩阵元素的个数;
2-11)使用梯度下降的算法循环训练式(10)所示的损失函数模型,从而实现对所述的推荐系统模型的训练。
5.根据权利要求4所述的基于知识图谱和注意力机制的推荐方法,其特征在于,步骤二中,训练冷启动版知识精炼推荐系统模型包括:首先,通过对冷启动版知识精炼推荐系统模型的预训练,得到实体节点的嵌入向量表示h;然后,按照步骤2-1)至2-11)实现对所述的推荐系统模型的训练。
6.根据权利要求5所述的基于知识图谱和注意力机制的推荐方法,其特征在于,步骤二中,对冷启动版知识精炼推荐系统模型的预训练过程如下:
针对步骤一获取的知识图谱中的每个实体的节点进行独热编码;
将每个实体的独热编码用两个神经网络进行变换,两个神经网络分别是:第一个神经网络为节点个数*嵌入维度模式的转换矩阵Wa,第二个神经网络为嵌入维度*节点个数模式的转换矩阵Wb;
训练上述两个神经网络,将第一个神经网络和第二个神经网络串联,所述第二个神经网络的输出为实体节点,是原点出发的随机游走序列;
当第二个神经网络的输出损失最小时,所述的转换矩阵Wa即是知识图谱的冷启动预嵌入向量表示结果,将所述转换矩阵Wa的每一行作为实体节点的嵌入向量表示h。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011475276.7A CN112507132B (zh) | 2020-12-14 | 2020-12-14 | 一种基于知识图谱和注意力机制的推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011475276.7A CN112507132B (zh) | 2020-12-14 | 2020-12-14 | 一种基于知识图谱和注意力机制的推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507132A true CN112507132A (zh) | 2021-03-16 |
CN112507132B CN112507132B (zh) | 2022-08-05 |
Family
ID=74973390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011475276.7A Expired - Fee Related CN112507132B (zh) | 2020-12-14 | 2020-12-14 | 一种基于知识图谱和注意力机制的推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507132B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113254630A (zh) * | 2021-07-07 | 2021-08-13 | 浙江大学 | 一种面向全球综合观测成果的领域知识图谱推荐方法 |
CN113378048A (zh) * | 2021-06-10 | 2021-09-10 | 浙江工业大学 | 一种基于多视角知识图谱注意力网络的个性化推荐方法 |
CN114372732A (zh) * | 2022-03-22 | 2022-04-19 | 杭州杰牌传动科技有限公司 | 实现用户需求智能匹配的减速电机协同制造方法和系统 |
CN114491055A (zh) * | 2021-12-10 | 2022-05-13 | 浙江辰时科技集团有限公司 | 基于知识图谱的推荐算法 |
CN114756694A (zh) * | 2022-06-16 | 2022-07-15 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于知识图谱的推荐系统、推荐方法和相关设备 |
CN114780867A (zh) * | 2022-05-10 | 2022-07-22 | 杭州网易云音乐科技有限公司 | 推荐方法、介质、装置和计算设备 |
CN114943010A (zh) * | 2022-05-26 | 2022-08-26 | 浙江工业大学 | 基于自注意力的融合三元组信的短序列扩充电影推荐方法 |
KR20230093641A (ko) * | 2021-12-20 | 2023-06-27 | 동아대학교 산학협력단 | 내용 아이템을 이용한 어텐션 네트워크 기반의 콜드 아이템 추천방법 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256631A (zh) * | 2018-01-26 | 2018-07-06 | 深圳市唯特视科技有限公司 | 一种基于注意力模型的用户行为推荐系统 |
CN109977283A (zh) * | 2019-03-14 | 2019-07-05 | 中国人民大学 | 一种基于知识图谱和用户足迹的旅游推荐方法和系统 |
CN110427563A (zh) * | 2019-08-30 | 2019-11-08 | 杭州智策略科技有限公司 | 一种基于知识图谱的专业领域系统冷启动推荐方法 |
CN111190968A (zh) * | 2019-12-16 | 2020-05-22 | 北京航天智造科技发展有限公司 | 基于知识图谱的数据预处理和内容推荐方法 |
CN111259147A (zh) * | 2020-01-19 | 2020-06-09 | 山东大学 | 基于自适应注意力机制的句子级情感预测方法及系统 |
CN111460249A (zh) * | 2020-02-24 | 2020-07-28 | 桂林电子科技大学 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
CN111539786A (zh) * | 2020-04-15 | 2020-08-14 | 清华大学 | 条件注意力网络及其在个性化推荐中的应用方法及装置 |
CN111667238A (zh) * | 2020-05-26 | 2020-09-15 | 南开大学 | 一种基于技能感知多注意力机制的招聘启事生成方法 |
CN111914895A (zh) * | 2020-06-29 | 2020-11-10 | 河海大学 | 基于多层注意力机制并融合图谱的水利门户信息推荐方法 |
-
2020
- 2020-12-14 CN CN202011475276.7A patent/CN112507132B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256631A (zh) * | 2018-01-26 | 2018-07-06 | 深圳市唯特视科技有限公司 | 一种基于注意力模型的用户行为推荐系统 |
CN109977283A (zh) * | 2019-03-14 | 2019-07-05 | 中国人民大学 | 一种基于知识图谱和用户足迹的旅游推荐方法和系统 |
CN110427563A (zh) * | 2019-08-30 | 2019-11-08 | 杭州智策略科技有限公司 | 一种基于知识图谱的专业领域系统冷启动推荐方法 |
CN111190968A (zh) * | 2019-12-16 | 2020-05-22 | 北京航天智造科技发展有限公司 | 基于知识图谱的数据预处理和内容推荐方法 |
CN111259147A (zh) * | 2020-01-19 | 2020-06-09 | 山东大学 | 基于自适应注意力机制的句子级情感预测方法及系统 |
CN111460249A (zh) * | 2020-02-24 | 2020-07-28 | 桂林电子科技大学 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
CN111539786A (zh) * | 2020-04-15 | 2020-08-14 | 清华大学 | 条件注意力网络及其在个性化推荐中的应用方法及装置 |
CN111667238A (zh) * | 2020-05-26 | 2020-09-15 | 南开大学 | 一种基于技能感知多注意力机制的招聘启事生成方法 |
CN111914895A (zh) * | 2020-06-29 | 2020-11-10 | 河海大学 | 基于多层注意力机制并融合图谱的水利门户信息推荐方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378048A (zh) * | 2021-06-10 | 2021-09-10 | 浙江工业大学 | 一种基于多视角知识图谱注意力网络的个性化推荐方法 |
CN113254630A (zh) * | 2021-07-07 | 2021-08-13 | 浙江大学 | 一种面向全球综合观测成果的领域知识图谱推荐方法 |
CN114491055A (zh) * | 2021-12-10 | 2022-05-13 | 浙江辰时科技集团有限公司 | 基于知识图谱的推荐算法 |
KR20230093641A (ko) * | 2021-12-20 | 2023-06-27 | 동아대학교 산학협력단 | 내용 아이템을 이용한 어텐션 네트워크 기반의 콜드 아이템 추천방법 |
KR102696370B1 (ko) * | 2021-12-20 | 2024-08-16 | 동아대학교 산학협력단 | 내용 아이템을 이용한 어텐션 네트워크 기반의 콜드 아이템 추천방법 |
CN114372732A (zh) * | 2022-03-22 | 2022-04-19 | 杭州杰牌传动科技有限公司 | 实现用户需求智能匹配的减速电机协同制造方法和系统 |
CN114780867A (zh) * | 2022-05-10 | 2022-07-22 | 杭州网易云音乐科技有限公司 | 推荐方法、介质、装置和计算设备 |
CN114780867B (zh) * | 2022-05-10 | 2023-11-03 | 杭州网易云音乐科技有限公司 | 推荐方法、介质、装置和计算设备 |
CN114943010A (zh) * | 2022-05-26 | 2022-08-26 | 浙江工业大学 | 基于自注意力的融合三元组信的短序列扩充电影推荐方法 |
CN114756694A (zh) * | 2022-06-16 | 2022-07-15 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于知识图谱的推荐系统、推荐方法和相关设备 |
CN114756694B (zh) * | 2022-06-16 | 2022-10-14 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于知识图谱的推荐系统、推荐方法和相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112507132B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112507132B (zh) | 一种基于知识图谱和注意力机制的推荐方法 | |
US20220035827A1 (en) | Tag selection and recommendation to a user of a content hosting service | |
JP4295062B2 (ja) | 反復マッチングを利用した画像検索方法及び装置 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
US8452794B2 (en) | Visual and textual query suggestion | |
US20100070507A1 (en) | Hybrid content recommending server, system, and method | |
CN111008321B (zh) | 基于逻辑回归推荐方法、装置、计算设备、可读存储介质 | |
JP2013541793A (ja) | マルチモード検索クエリー入力手法 | |
JP4374902B2 (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
CN109587527B (zh) | 一种个性化视频推荐的方法及装置 | |
US11727051B2 (en) | Personalized image recommendations for areas of interest | |
CN110851675A (zh) | 一种数据提取方法、装置及介质 | |
JP5481295B2 (ja) | オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム | |
KR20090020005A (ko) | 영상 정보 기반의 동영상 연관 검색 시스템 및 방법 | |
CN114564594A (zh) | 一种基于双塔模型的知识图谱用户偏好实体召回方法 | |
US12093330B2 (en) | IoT enhanced search results | |
Mithun et al. | Generating diverse image datasets with limited labeling | |
CN107256222B (zh) | 基于自由词检索的电子病历快速检索系统 | |
US11269898B1 (en) | Machine learning based database query retrieval | |
CN110769288A (zh) | 一种视频冷启动推荐方法及系统 | |
CN114547251B (zh) | 基于bert的两阶段民间故事检索方法 | |
CN116521996A (zh) | 一种基于知识图谱和图卷积神经网络的多行为推荐方法及系统 | |
CN115730139A (zh) | 基于异质多兴趣建模的短视频推荐方法及装置 | |
CN117688390A (zh) | 内容匹配方法、装置、计算机设备、存储介质和程序产品 | |
JP2022153632A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220805 |