CN114329234A - 基于知识图谱的协同过滤推荐方法及系统 - Google Patents

基于知识图谱的协同过滤推荐方法及系统 Download PDF

Info

Publication number
CN114329234A
CN114329234A CN202210205280.4A CN202210205280A CN114329234A CN 114329234 A CN114329234 A CN 114329234A CN 202210205280 A CN202210205280 A CN 202210205280A CN 114329234 A CN114329234 A CN 114329234A
Authority
CN
China
Prior art keywords
entity
vector
knowledge
graph
description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210205280.4A
Other languages
English (en)
Inventor
刘国清
杨广
王启程
郑伟
刘明洋
杨国武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Minieye Innovation Technology Co Ltd
Original Assignee
Shenzhen Minieye Innovation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Minieye Innovation Technology Co Ltd filed Critical Shenzhen Minieye Innovation Technology Co Ltd
Priority to CN202210205280.4A priority Critical patent/CN114329234A/zh
Publication of CN114329234A publication Critical patent/CN114329234A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的协同过滤推荐方法,该方法根据实体交互图和实体对应的知识图谱得到协同知识图谱;将与实体相关的描述信息输入实体描述编码器得到实体描述向量;基于TransR算法通过混合项的限制,将实体描述向量和实体结构向量映射到同一语义空间,语义空间中还包括关系向量;根据协同知识图谱得到实体的自我中心网络向量;根据实体描述向量和实体结构向量得到实体表示向量,实体表示向量根据实体表示向量和自我中心网络向量进行更新;根据实体表示向量得到用户与物品之间的交互概率。上述方法解决了协同过滤中的数据稀疏问题,能够准确的表示用户的偏好和物品的特征,进而提升推荐方法的性能。

Description

基于知识图谱的协同过滤推荐方法及系统
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于知识图谱的协同过滤推荐方法、基于知识图谱的协同过滤推荐系统、计算机可读存储介质以及计算机设备。
背景技术
随着互联网技术的不断发展普及,大数据时代到来,网络上每时每刻都有大量可供选择的信息资源产生。用户可以通过各种各样的渠道获取大量信息,例如文字、图片、音乐、视频等不同类型的数据,从而获得符合自己需求的信息。这些海量的信息为人们带来无限的便利,但却无法从这些大量的信息中快速获取自己想要的信息,使有价值的信息的获取变得十分困难,因此如何解决这种“信息过载”问题成为重中之重,推荐系统的产生使这种问题得到缓解。用户通常采用搜索引擎来获取想要的信息,然而这种方式只能在用户目标和需求精确的条件下才能取得较好的效果。而推荐系统可以通过分析用户的历史行为,挖掘用户的兴趣偏好,使用户发现自己的隐性需求从而有效的进行信息过滤,提供了个性化推荐。
多数推荐系统仅针对单一领域,根据用户在该领域的历史信息,计算用户偏好从而提供推荐服务。而广泛应用于单一领域的协同过滤方法十分简单有效,协同过滤方法通过发掘用户对项目的偏好以及项目的特征,从而为用户推荐与其偏好相似的项目或者根据与其偏好相似的用户为其推荐。然而随着数据量的急剧增长,数据稀疏问题逐渐显露,这些问题使得协同过滤方法的推荐性能下降。现有的解决方案只能基于内容感知的推荐和基于知识图谱的推荐,不能很好的解决数据稀疏问题。
因此,如何解决协同过滤中的数据稀疏问题,如何准确的表示用户的偏好和物品的特征是亟需解决的问题。
发明内容
本发明提供一种基于知识图谱的协同过滤推荐方法,解决了协同过滤中的数据稀疏问题,能够准确的表示用户的偏好和物品的特征,进而提升推荐方法的性能。
第一方面,本发明实施例提供一种基于知识图谱的协同过滤推荐方法,该基于知识图谱的协同过滤推荐方法包括:
根据实体交互图和实体对应的知识图谱得到协同知识图谱,实体交互图包括用户和物品,协同知识图谱以三元组的形式进行表示;
将与实体相关的描述信息输入实体描述编码器得到实体描述向量;
利用TransR算法学习将协同知识图谱转化为实体结构向量;
根据协同知识图谱得到实体的自我中心网络向量;
根据实体的自我中心网络向量和实体描述向量更新实体描述向量;
将实体描述向量的激活函数进行递归传播得到最终的实体描述向量;
根据最终的实体描述向量得到用户与物品之间交互的可能性预测。
第二方面,本发明实施例提供一种基于知识图谱的协同过滤推荐系统,该基于知识图谱的协同过滤推荐系统包括:
协同知识图谱构建模块:用于根据实体交互图和实体对应的知识图谱得到协同知识图谱,实体交互图包括用户和物品,协同知识图谱以三元组的形式进行表示;
体描述向量构建模块:用于将与实体相关的描述信息输入实体描述编码器得到实体描述向量;
实体结构向量构建模块:用于利用TransR算法学习协同知识图谱得到实体结构向量;
自我中心网络向量构建模块:用于根据协同知识图谱得到实体的自我中心网络向量;
实体描述向量更新模块:用于根据实体的自我中心网络向量和实体描述向量更新实体描述向量;
激活函数递归模块:用于将实体描述向量的激活函数进行递归传播得到最终的实体描述向量;
交互可能性预测模块:用于根据最终的实体描述向量得到用户与物品之间交互的可能性预测。
第三方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有能够被处理器加载并执行的基于知识图谱的协同过滤推荐方法的程序指令。
第四方面,本发明实施例提供一种计算机设备,计算机设备包括:
存储器,用于存储程序指令;
处理器,用于执行程序指令以使计算机设备实现基于知识图谱的协同过滤推荐方法。
上述基于知识图谱的协同过滤推荐方法主要利用用户对项目的交互历史记录,不关注用户和项目本身内容信息。是基于内容感知的推荐,是通过整合用户与项目的交互数据和用户、项目的内容数据,例如,简介信息、图片、知识库、评论等数据来提出的,能够极大地丰富用户或者项目相关的内容。所以基于知识图谱的协同过滤推荐方法可以有效的从内容数据中提取相关的内容来处理数据稀疏性问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例提供的基于知识图谱的协同过滤推荐方法的流程图。
图2为本发明实施例提供的基于知识图谱的协同过滤推荐系统的结构示意图。
图3为本发明实施例提供的计算机设备内部结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
请结合参看图1,其为本发明实施例提供的基于知识图谱的协同过滤推荐方法的流程图。其中,本发明实施例提供的基于知识图谱的协同过滤推荐方法具体包括下面步骤。
步骤S101,根据实体交互图和实体对应的知识图谱得到协同知识图谱,实体交互图包括用户和物品,协同知识图谱的知识以三元组的形式表示,三元组包括头实体、关系和尾实体。知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在本实施例中,实体对应的知识图谱是与实体相关联的各种知识。协同知识图谱为实体和实体对应的知识图谱一起构成的知识图谱。三元组表示为
Figure 287010DEST_PATH_IMAGE001
,其中,h表示头实体,r表示关系,t表示尾实体。在本实施例中,用户在一个网络中有一个唯一确认的ID,用X表示;物品可以是一件消费商品,例如,一款手机,一款电脑;物品也可以是艺术作品,例如,一部电影、电视剧、话剧等。以一部电影为例,A表示一部电影,b1、b2、b3表示电影A的演员;c表示电影A的导演,b1、b2、b3和c构成了电影A的知识图谱,X、b1、b2、b3和c构成了协同知识图谱。
步骤S102,将与实体相关的描述信息输入实体描述编码器得到实体描述向量。在本实施例中,与实体相关的描述信息可以是该ID点击过A电影相关的评分,或者是A电影相关的评价。将上述信息转化为指维度的向量。实体描述向量用
Figure 375051DEST_PATH_IMAGE002
表示,这里
Figure 438822DEST_PATH_IMAGE002
为100维的向量。在本实施例中,实体描述编码器为Word2vec模型。在本实施例中所有的数据仅做示例不做限定,实际应用中根据用户的需求设定。
步骤S103,基于TransR算法通过混合项的限制,将实体描述向量和实体结构向量映射到同一语义空间,语义空间中还包括关系向量,在同一语义空间中关系向量共享,实体结构向量和关系向量是根据TransR算法训练得到。TransR算法时实体空间和多个关系空间(关系特定的实体空间)中建模实体和关系,并在对应的关系空间中进行转换的方法。在本实施例中,实体结构向量用
Figure 168881DEST_PATH_IMAGE003
表示,这里
Figure 615256DEST_PATH_IMAGE003
为100维的向量。在本实施例中所有的数据仅做示例不做限定,实际应用中根据用户的需求设定。在本实施例中,采用以下公式(1)来获得实体结构向量。采用公式(2)得到损失函数,其中:
Figure 139778DEST_PATH_IMAGE004
Figure 628528DEST_PATH_IMAGE005
其中,
Figure 896699DEST_PATH_IMAGE006
表示三元组的得分函数,
Figure 951242DEST_PATH_IMAGE007
表示关系映射矩阵,
Figure 662978DEST_PATH_IMAGE008
表示头实体描述向量,
Figure 435762DEST_PATH_IMAGE009
表示关系向量,
Figure 242043DEST_PATH_IMAGE010
表示尾实体描述向量,
Figure 416673DEST_PATH_IMAGE011
表示尾实体的结构向量,
Figure 797845DEST_PATH_IMAGE012
表示尾实体的描述向量;
Figure 57925DEST_PATH_IMAGE013
是知识嵌入的损失函数,h表示头实体、r表示关系、t表示尾实体,
Figure 871160DEST_PATH_IMAGE014
为正样本集合,
Figure 165875DEST_PATH_IMAGE015
为随机替换正样本中头实体或尾实体生成的负样本集合,
Figure 468680DEST_PATH_IMAGE016
是间隔系数。在本实施例中,
Figure 153740DEST_PATH_IMAGE007
为维度为100*100的向量。
Figure 583715DEST_PATH_IMAGE006
通过混合项的限制,将两种表示,也就是实体描述向量和实体结构向量映射到了同一语义空间中,中间共享关系向量表示。在本实施例,知识嵌入的损失函数采用最大间隔法将正样本与负样本区分出来。
步骤S104,根据协同知识图谱得到实体的自我中心网络向量。在本实施例中,具体通过以下公式(3)得到自我中心网络向量,具体为:
Figure 670620DEST_PATH_IMAGE017
其中,
Figure 409906DEST_PATH_IMAGE018
表示h的自我中心网络向量,
Figure 582261DEST_PATH_IMAGE019
表示
Figure 799616DEST_PATH_IMAGE010
和相加得到的混合向量,
Figure 6606DEST_PATH_IMAGE008
表示头实体描述向量,
Figure 651214DEST_PATH_IMAGE012
表示尾实体的描述向量,
Figure 625380DEST_PATH_IMAGE020
表示传播的衰减系数,Nh表示自我中心网络。在本实施例中,
Figure 584108DEST_PATH_IMAGE018
Figure 442343DEST_PATH_IMAGE019
的维度也是100维。
Figure 461115DEST_PATH_IMAGE020
的计算公式(4)具体为:
Figure 670379DEST_PATH_IMAGE021
(4)
其中,
Figure 432799DEST_PATH_IMAGE022
表示描述向量,
Figure 411119DEST_PATH_IMAGE023
表示关系向量。
步骤S105,根据实体描述向量和实体结构向量得到实体表示向量,实体表示向量根据实体表示向量和自我中心网络向量进行更新。更新实体描述向量的公式(5)具体为:
Figure 335213DEST_PATH_IMAGE024
(5)
其中,
Figure 782506DEST_PATH_IMAGE025
表示结合
Figure 83037DEST_PATH_IMAGE026
自身的信息和与其相邻距离为*的节点信息对
Figure 181443DEST_PATH_IMAGE027
进行表示,
Figure 73176DEST_PATH_IMAGE025
中*表示*阶的表示向量
Figure 194715DEST_PATH_IMAGE028
为激活函数,
Figure 361254DEST_PATH_IMAGE029
为可训练的权重矩阵。
当进行实体描述向量进行第一次更新时,请参照公式(6),
Figure 986271DEST_PATH_IMAGE030
(6)。
步骤S106,根据实体表示向量得到用户与物品之间的交互概率。具体请参照公式(7)、(8)、(9)、(10)、(11)以及(12)。
Figure 829331DEST_PATH_IMAGE031
其中,
Figure 172587DEST_PATH_IMAGE032
为最终的实体描述向量。
Figure 142817DEST_PATH_IMAGE033
请参照公式(8),
Figure 887920DEST_PATH_IMAGE034
Figure 652613DEST_PATH_IMAGE035
(9)
Figure 483166DEST_PATH_IMAGE036
(10)
Figure 991508DEST_PATH_IMAGE037
(11)
Figure 138586DEST_PATH_IMAGE038
(12)
其中,
Figure 11865DEST_PATH_IMAGE039
表示结合
Figure 392030DEST_PATH_IMAGE026
的自我中心网络向量和与其相邻距离为*的节点信息对
Figure 376167DEST_PATH_IMAGE027
进行的中心网络向量,
Figure 158178DEST_PATH_IMAGE040
表示向量拼接符号,
Figure 202357DEST_PATH_IMAGE041
表示用户的最终表示向量,
Figure 69819DEST_PATH_IMAGE042
表示物品的最终表示向量,
Figure 857647DEST_PATH_IMAGE043
表示用户的节点表示,
Figure 740502DEST_PATH_IMAGE044
表示物品的节点表示,
Figure 955583DEST_PATH_IMAGE045
表示最终对用户
Figure 44762DEST_PATH_IMAGE046
与物品
Figure 636280DEST_PATH_IMAGE047
进行交互的概率,
Figure 127304DEST_PATH_IMAGE048
为协同过滤损失函数,
Figure 513286DEST_PATH_IMAGE049
Figure 89761DEST_PATH_IMAGE050
表示sigmoid函数,用于进行归一化。
上述基于知识图谱的协同过滤推荐方法,主要利用用户对项目的交互历史记录,不关注用户和项目本身内容信息。是基于内容感知的推荐,是通过整合用户与项目的交互数据和用户、项目的内容数据,例如,简介信息、图片、知识库、评论等数据来提出的,能够极大地丰富用户或者项目相关的内容。所以基于知识图谱的协同过滤推荐方法可以有效的从内容数据中提取相关的内容来处理数据稀疏性问题。
请结合参看图2,其为基于知识图谱的协同过滤推荐系统的结构示意图。该基于知识图谱的协同过滤推荐系统200包括协同知识图谱构建模块210、实体描述向量构建模块220、TransR算法模块230、自我中心网络向量构建模块240、激活函数递归模块250以及交互可能性预测模块260。
协同知识图谱构建模块210,用于根据实体交互图和实体对应的知识图谱得到协同知识图谱,实体交互图包括用户和物品,协同知识图谱以三元组的形式进行表示。知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在本实施例中,实体对应的知识图谱是与实体相关联的各种知识。协同知识图谱为实体和实体对应的知识图谱一起构成的知识图谱。三元组表示为
Figure 32440DEST_PATH_IMAGE001
,其中,h表示头实体,r表示关系,t表示尾实体。在本实施例中,用户在一个网络中有一个唯一确认的ID,用u表示;物品可以是一件消费商品,例如,一款手机,一款电脑;物品也可以是艺术作品,例如,一部电影、电视剧、话剧等。以一部电影为例,A表示一部电影,b1、b2、b3表示电影A的演员;c表示电影A的导演,b1、b2、b3和c构成了电影A的知识图谱,u、b1、b2、b3和c构成了协同知识图谱。
实体描述向量构建模块220,用于将与实体相关的描述信息输入实体描述编码器得到实体描述向量。在本实施例中,与实体相关的描述信息可以是该ID点击过A电影相关的评分,或者是A电影相关的评价。将上述信息转化为指维度的向量。实体描述向量用
Figure 315654DEST_PATH_IMAGE002
表示,这里
Figure 200434DEST_PATH_IMAGE002
为100维的向量。在本实施例中,实体描述编码器为Word2vec模型。在本实施例中所有的数据仅做示例不做限定,实际应用中根据用户的需求设定。
TransR算法模块230,用于基于TransR算法通过混合项的限制,将实体描述向量和实体结构向量映射到同一语义空间,语义空间中还包括关系向量,在同一语义空间中关系向量共享,实体结构向量和关系向量是根据TransR算法训练得到。在本实施例中,实体结构向量用
Figure 998625DEST_PATH_IMAGE003
表示,这里
Figure 931946DEST_PATH_IMAGE003
为100维的向量。在本实施例中所有的数据仅做示例不做限定,实际应用中根据用户的需求设定。在本实施例中,采用以下公式(1)来获得实体结构向量。采用公式(2)得到损失函数,其中:
Figure 131983DEST_PATH_IMAGE004
Figure 125347DEST_PATH_IMAGE005
Figure 925682DEST_PATH_IMAGE006
表示三元组的得分函数,
Figure 397115DEST_PATH_IMAGE007
表示关系映射矩阵,
Figure 717237DEST_PATH_IMAGE008
表示头实体描述向量,
Figure 881503DEST_PATH_IMAGE009
表示关系向量,
Figure 654286DEST_PATH_IMAGE010
表示尾实体描述向量,
Figure 929410DEST_PATH_IMAGE011
表示尾实体的结构向量,
Figure 369619DEST_PATH_IMAGE012
表示尾实体的描述向量;
Figure 986676DEST_PATH_IMAGE013
是知识嵌入的损失函数,h表示头实体、r表示关系、t表示尾实体,
Figure 450018DEST_PATH_IMAGE014
为正样本集合,
Figure 325570DEST_PATH_IMAGE015
为随机替换正样本中头实体或尾实体生成的负样本集合,
Figure 557969DEST_PATH_IMAGE016
是间隔系数。在本实施例中,
Figure 860774DEST_PATH_IMAGE007
为维度为100*100的向量。
Figure 811412DEST_PATH_IMAGE006
通过混合项的限制,将两种表示,也就是实体描述向量和实体结构向量映射到了同一语义空间中,中间共享关系向量表示。在本实施例,知识嵌入的损失函数采用最大间隔法将正样本与负样本区分出来。
自我中心网络向量构建模块240,自我中心网络向量构建模块:用于根据协同知识图谱得到实体的自我中心网络向量。在本实施例中,自我中心网络向量构建模块240具体通过以下公式(3)得到自我中心网络向量。
Figure 490655DEST_PATH_IMAGE017
其中,
Figure 577560DEST_PATH_IMAGE018
为X的自我中心网络向量,
Figure 569043DEST_PATH_IMAGE019
Figure 741399DEST_PATH_IMAGE010
Figure 958753DEST_PATH_IMAGE011
相加得到的混合向量,
Figure 165744DEST_PATH_IMAGE020
表示每条边上传播的衰减系数。在本实施例中,
Figure 810352DEST_PATH_IMAGE018
Figure 470003DEST_PATH_IMAGE019
的维度也是100维。
Figure 491049DEST_PATH_IMAGE020
的计算公式(4)具体为:
Figure 100016DEST_PATH_IMAGE021
(4)。
激活函数递归模块250,用于根据实体描述向量和实体结构向量得到实体表示向量,实体表示向量根据实体表示向量和自我中心网络向量进行更新。实体描述向量更新模块250更新实体描述向量的公式(5)具体为:
Figure 118787DEST_PATH_IMAGE024
(5)。
当进行实体描述向量进行第一次更新时,请参照公式(6),
Figure 328052DEST_PATH_IMAGE030
(6)。
交互可能性预测模块260,用于根据实体表示向量得到用户与物品之间的交互概率。具体请参照公式(7)、(8)、(9)、(10)、(11)以及(12),各公式具体为:
Figure 824892DEST_PATH_IMAGE031
其中,
Figure 803213DEST_PATH_IMAGE032
为最终的实体描述向量。
Figure 992885DEST_PATH_IMAGE033
请参照公式(8),
Figure 689446DEST_PATH_IMAGE034
Figure 989977DEST_PATH_IMAGE035
(9)
Figure 72072DEST_PATH_IMAGE036
(10)
Figure 432646DEST_PATH_IMAGE037
(11)
Figure 616503DEST_PATH_IMAGE038
(12)
其中,
Figure 455146DEST_PATH_IMAGE040
表示向量拼接符号,
Figure 408058DEST_PATH_IMAGE041
表示用户的最终表示向量,
Figure 736271DEST_PATH_IMAGE042
表示物品的最终表示向量,
Figure 79528DEST_PATH_IMAGE043
表示用户的节点表示,
Figure 800490DEST_PATH_IMAGE044
表示物品的节点表示,
Figure 545592DEST_PATH_IMAGE045
表示最终对用户
Figure 310286DEST_PATH_IMAGE046
与物品
Figure 937577DEST_PATH_IMAGE047
进行交互的概率,
Figure 118022DEST_PATH_IMAGE048
为协同过滤损失函数,
Figure 45527DEST_PATH_IMAGE049
Figure 918805DEST_PATH_IMAGE050
表示sigmoid函数,用于进行归一化。
上述基于知识图谱的协同过滤推荐系统,利用知识图谱对多元异构数据的整合性,对大数据环境下互联网上的数据进行知识抽取,得到更加细粒度的用户和物品的特征信息,从而更精准的计算用户与用户、用户与物品以及物品与物品之间的相关性,最后为用户做出推荐。
本发明还提供了一种计算机可读存储介质。计算机可读存储介质上存储有能够被处理器加载并执行的上述的基于知识图谱的协同过滤推荐方法的程序指令。基于知识图谱的协同过滤推荐方法的程序指令还可以从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,该程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。由于计算机可读存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再赘述。
本发明还提供一种计算机设备900,计算机设备900至少包括存储器901和处理器902。存储器901用于存储基于知识图谱的协同过滤推荐方法的程序指令。处理器902用于执行程序指令以使计算机设备实现上述的基于知识图谱的协同过滤推荐方法。请结合参看图3,其为本发明实施例提供的计算机设备900的内部结构示意图。
其中,存储器901至少包括一种类型的计算机可读存储介质,该计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器901在一些实施例中可以是计算机设备900的内部存储单元,例如计算机设备900的硬盘。存储器901在另一些实施例中也可以是计算机设备900的外部存储设备,例如计算机设备900上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字卡(Secure Digital, SD),闪存卡(Flash Card)等。进一步地,存储器901还可以既包括计算机设备900的内部存储单元也包括外部存储设备。存储器901不仅可以用于存储安装于计算机设备900的应用软件及各类数据,例如基于知识图谱的协同过滤推荐方法的程序指令等,还可以用于暂时地存储已经输出或者将要输出的数据,例如基于知识图谱的协同过滤推荐方法执行产生的数据等。
处理器902在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器901中存储的程序指令或处理数据。具体地,处理器902执行基于知识图谱的协同过滤推荐方法的程序指令以控制计算机设备900实现基于知识图谱的协同过滤推荐方法。
进一步地,计算机设备900还可以包括总线903可以是外设部件互连标准总线(peripheral component interconnect,简称PCI)或扩展工业标准结构总线(extendedindustry standard architecture,简称EISA)等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
进一步地,计算机设备900还可以包括显示组件904。显示组件904可以是LED(Light Emitting Diode,发光二极管)显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示组件904也可以适当的称为显示装置或显示单元,用于显示在计算机设备900中处理的信息以及用于显示可视化的用户界面。
进一步地,计算机设备900还可以包括通信组件905,通信组件905可选的可以包括有线通信组件和/或无线通信组件(如WI-FI通信组件、蓝牙通信组件等),通常用于在计算机设备900与其他计算机设备之间建立通信连接。
图3仅示出了具有组件901-905以及实现基于知识图谱的协同过滤推荐方法的程序指令的计算机设备900,本领域技术人员可以理解的是,图3示出的结构并不构成对计算机设备900的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。由于计算机设备900采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,装置和单元的具体工作过程,可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,装置和方法,可以通过其它的方式实现。例如,以上所描述的基于知识图谱的协同过滤推荐方法实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件 可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所列举的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属于本发明所涵盖的范围。

Claims (10)

1.一种基于知识图谱的协同过滤推荐方法,其特征在于,所述基于知识图谱的协同过滤推荐方法包括:
根据实体交互图和实体对应的知识图谱得到协同知识图谱,所述实体交互图包括用户和物品,所述协同知识图谱的知识以三元组的形式表示,所述三元组包括头实体、关系和尾实体;
将与实体相关的描述信息输入实体描述编码器得到实体描述向量;
基于TransR算法通过混合项的限制,将所述实体描述向量和实体结构向量映射到同一语义空间,所述语义空间中还包括关系向量,在同一语义空间中关系向量共享,所述实体结构向量和所述关系向量是根据所述TransR算法训练得到;
根据所述协同知识图谱得到所述实体的自我中心网络向量;
根据所述实体描述向量和所述实体结构向量得到实体表示向量,所述实体表示向量根据实体表示向量和自我中心网络向量进行更新;
根据所述实体表示向量得到用户与物品之间的交互概率。
2.如权利要求1所述的基于知识图谱的协同过滤推荐方法,其特征在于,所述的基于知识图谱的协同过滤推荐方法,还包括:
Figure 915334DEST_PATH_IMAGE001
Figure 696208DEST_PATH_IMAGE002
其中,
Figure 415903DEST_PATH_IMAGE003
表示三元组的得分函数,
Figure 522399DEST_PATH_IMAGE004
表示关系映射矩阵,
Figure 327544DEST_PATH_IMAGE005
表示头实体描述向量,
Figure 928421DEST_PATH_IMAGE006
表示关系向量,
Figure 502622DEST_PATH_IMAGE007
表示尾实体描述向量,
Figure 514440DEST_PATH_IMAGE008
表示尾实体的结构向量,
Figure 603619DEST_PATH_IMAGE009
表示尾实体的描述向量;
Figure 195137DEST_PATH_IMAGE010
是知识嵌入的损失函数,h表示头实体、r表示关系、t表示尾实体,
Figure 686161DEST_PATH_IMAGE011
为正样本集合,
Figure 72143DEST_PATH_IMAGE012
为随机替换正样本中头实体或尾实体生成的负样本集合,
Figure 163465DEST_PATH_IMAGE013
是间隔系数。
3.如权利要求1所述的基于知识图谱的协同过滤推荐方法,其特征在于,根据所述协同知识图谱得到所述实体的自我中心网络向量,具体包括:
Figure 293095DEST_PATH_IMAGE014
其中,
Figure 373046DEST_PATH_IMAGE015
表示h的自我中心网络向量,
Figure 257826DEST_PATH_IMAGE016
表示
Figure 259280DEST_PATH_IMAGE007
Figure 989338DEST_PATH_IMAGE008
相加得到的混合向量,
Figure 940108DEST_PATH_IMAGE005
表示头实体描述向量,
Figure 933472DEST_PATH_IMAGE009
表示尾实体的描述向量,
Figure 218960DEST_PATH_IMAGE017
表示传播的衰减系数,Nh表示自我中心网络。
4.如权利要求3所述的基于知识图谱的协同过滤推荐方法,其特征在于,
Figure 955971DEST_PATH_IMAGE017
的计算公式具体为:
Figure 276094DEST_PATH_IMAGE018
其中,
Figure 174780DEST_PATH_IMAGE019
表示描述向量,
Figure 213143DEST_PATH_IMAGE006
表示关系向量。
5.如权利要求1所述的基于知识图谱的协同过滤推荐方法,其特征在于,根据所述实体描述向量和所述实体结构向量得到实体表示向量,所述实体表示向量根据实体表示向量和我中心网络向量进行更新,具体包括:
Figure 488267DEST_PATH_IMAGE020
其中,
Figure 649514DEST_PATH_IMAGE021
表示结合
Figure 46998DEST_PATH_IMAGE022
自身的信息和与其相邻距离为*的节点信息对
Figure 41498DEST_PATH_IMAGE023
进行表示,
Figure 120313DEST_PATH_IMAGE021
中*表示*阶的表示向量,
Figure 415028DEST_PATH_IMAGE024
为激活函数,
Figure 655517DEST_PATH_IMAGE025
为可训练的权重矩阵。
6.如权利要求5所述的基于知识图谱的协同过滤推荐方法,其特征在于,根据所述实体描述向量和所述实体结构向量得到实体表示向量,所述实体表示向量根据实体表示向量和我中心网络向量进行更新,还包括:
Figure 419204DEST_PATH_IMAGE020
其中,
Figure 36130DEST_PATH_IMAGE026
Figure 185352DEST_PATH_IMAGE027
表示结合
Figure 393479DEST_PATH_IMAGE022
的自我中心网络向量和与其相邻距离为*的节点信息对
Figure 565835DEST_PATH_IMAGE023
进行的中心网络向量。
7.如权利要求1所述的基于知识图谱的协同过滤推荐方法,其特征在于,根据所述实体表示向量得到用户与物品之间的交互概率,具体包括:
Figure 48769DEST_PATH_IMAGE028
Figure 990180DEST_PATH_IMAGE029
Figure 149635DEST_PATH_IMAGE030
Figure 809286DEST_PATH_IMAGE031
其中,
Figure 830332DEST_PATH_IMAGE032
表示向量拼接符号,
Figure 688566DEST_PATH_IMAGE033
表示用户的最终表示向量,
Figure 707338DEST_PATH_IMAGE034
表示物品的最终表示向量,
Figure 651023DEST_PATH_IMAGE035
表示用户的节点表示,
Figure 960913DEST_PATH_IMAGE036
表示物品的节点表示,
Figure 876916DEST_PATH_IMAGE037
表示用户与物品进行交互概率,
Figure 128906DEST_PATH_IMAGE038
为协同过滤损失函数,
Figure 763150DEST_PATH_IMAGE039
表示sigmoid函数,用于进行归一化。
8.一种基于知识图谱的协同过滤推荐系统,其特征在于,所述基于知识图谱的协同过滤推荐系统包括:
协同知识图谱构建模块:用于根据实体交互图和实体对应的知识图谱得到协同知识图谱,所述实体交互图包括用户和物品,所述协同知识图谱的知识以三元组的形式表示,所述三元组包括头实体、关系和尾实体;
实体描述向量构建模块:用于将与实体相关的描述信息输入实体描述编码器得到实体描述向量;
TransR算法模块:用于基于TransR算法通过混合项的限制,将所述实体描述向量和实体结构向量映射到同一语义空间,所述语义空间中还包括关系向量,在同一语义空间中关系向量共享,所述实体结构向量和所述关系向量是根据所述TransR算法训练得到;
自我中心网络向量构建模块:用于根据所述协同知识图谱得到所述实体的自我中心网络向量;
激活函数递归模块:用于根据所述实体描述向量和所述实体结构向量得到实体表示向量,所述实体表示向量根据实体表示向量和自我中心网络向量进行更新;
交互可能性预测模块:用于根据所述实体表示向量得到用户与物品之间的交互概率。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有能够被处理器加载并执行的如权利要求1~7任意一项所述的基于知识图谱的协同过滤推荐方法的程序指令。
10.一种计算机设备,其特征在于,所述计算机设备包括:
存储器,用于存储程序指令;以及
处理器,用于执行所述程序指令以使所述计算机设备实现如权利要求1~7任意一项所述的基于知识图谱的协同过滤推荐方法。
CN202210205280.4A 2022-03-04 2022-03-04 基于知识图谱的协同过滤推荐方法及系统 Pending CN114329234A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210205280.4A CN114329234A (zh) 2022-03-04 2022-03-04 基于知识图谱的协同过滤推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210205280.4A CN114329234A (zh) 2022-03-04 2022-03-04 基于知识图谱的协同过滤推荐方法及系统

Publications (1)

Publication Number Publication Date
CN114329234A true CN114329234A (zh) 2022-04-12

Family

ID=81031251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210205280.4A Pending CN114329234A (zh) 2022-03-04 2022-03-04 基于知识图谱的协同过滤推荐方法及系统

Country Status (1)

Country Link
CN (1) CN114329234A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886543A (zh) * 2015-12-16 2017-06-23 清华大学 结合实体描述的知识图谱表示学习方法和系统
US20190034530A1 (en) * 2017-07-26 2019-01-31 Google Inc. Content selection and presentation of electronic content
CN109299284A (zh) * 2018-08-31 2019-02-01 中国地质大学(武汉) 一种基于结构信息与文本描述的知识图谱表示学习方法
US20190311275A1 (en) * 2018-04-10 2019-10-10 Beijing Baidu Netcome Science and Technology Co., Ltd. Method and apparatus for recommending entity
CN112749339A (zh) * 2021-01-18 2021-05-04 陕西师范大学 一种基于旅游知识图谱的旅游路线推荐方法及系统
CN112765490A (zh) * 2021-01-28 2021-05-07 重庆兆光科技股份有限公司 一种基于知识图谱和图卷积网络的信息推荐方法及系统
CN113010690A (zh) * 2021-03-29 2021-06-22 华南理工大学 一种基于文本信息增强实体嵌入的方法
CN113626610A (zh) * 2021-08-10 2021-11-09 南方电网数字电网研究院有限公司 知识图谱嵌入方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886543A (zh) * 2015-12-16 2017-06-23 清华大学 结合实体描述的知识图谱表示学习方法和系统
US20190034530A1 (en) * 2017-07-26 2019-01-31 Google Inc. Content selection and presentation of electronic content
US20190311275A1 (en) * 2018-04-10 2019-10-10 Beijing Baidu Netcome Science and Technology Co., Ltd. Method and apparatus for recommending entity
CN109299284A (zh) * 2018-08-31 2019-02-01 中国地质大学(武汉) 一种基于结构信息与文本描述的知识图谱表示学习方法
CN112749339A (zh) * 2021-01-18 2021-05-04 陕西师范大学 一种基于旅游知识图谱的旅游路线推荐方法及系统
CN112765490A (zh) * 2021-01-28 2021-05-07 重庆兆光科技股份有限公司 一种基于知识图谱和图卷积网络的信息推荐方法及系统
CN113010690A (zh) * 2021-03-29 2021-06-22 华南理工大学 一种基于文本信息增强实体嵌入的方法
CN113626610A (zh) * 2021-08-10 2021-11-09 南方电网数字电网研究院有限公司 知识图谱嵌入方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN107609152B (zh) 用于扩展查询式的方法和装置
CN109241403B (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
US20150169710A1 (en) Method and apparatus for providing search results
CN111368185B (zh) 数据展示方法、装置、存储介质及电子设备
WO2020156389A1 (zh) 信息推送方法和装置
US20180096035A1 (en) Query-time analytics on graph queries spanning subgraphs
US20230162005A1 (en) Neural network distillation method and apparatus
CN115204183B (zh) 基于知识增强的双通道情感分析方法、装置以及设备
WO2020238502A1 (zh) 物品推荐方法及装置、电子设备及存储介质
CN113204691B (zh) 一种信息展示方法、装置、设备及介质
WO2022083093A1 (zh) 图谱中的概率计算方法、装置、计算机设备及存储介质
CN109471978A (zh) 一种电子资源推荐方法及装置
CN112989146B (zh) 向目标用户推荐资源的方法、装置、设备、介质和程序产品
CN111523021A (zh) 一种信息处理系统及其执行的方法
CN111756832B (zh) 推送信息的方法、装置、电子设备及计算机可读存储介质
US10108694B1 (en) Content clustering
CN113609308B (zh) 知识图谱构建方法、装置、存储介质及电子设备
CN110363206A (zh) 数据对象的聚类、数据处理及数据识别方法
US20140289334A1 (en) System and method for recommending multimedia information
CN110727853B (zh) 向用户呈现控制的异构数字内容
CN112836126A (zh) 基于知识图谱的推荐方法、装置、电子设备及存储介质
CN112559866A (zh) 大学图书阅读推荐方法、装置、设备及存储介质
CN110489563B (zh) 图结构的表示方法、装置、设备及计算机可读存储介质
CN109672706A (zh) 一种信息推荐方法、装置、服务器及存储介质
CN116738057A (zh) 信息推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220412