CN116304372A - 一种融合群组的协作知识图网络推荐方法 - Google Patents

一种融合群组的协作知识图网络推荐方法 Download PDF

Info

Publication number
CN116304372A
CN116304372A CN202310321078.2A CN202310321078A CN116304372A CN 116304372 A CN116304372 A CN 116304372A CN 202310321078 A CN202310321078 A CN 202310321078A CN 116304372 A CN116304372 A CN 116304372A
Authority
CN
China
Prior art keywords
knowledge graph
user
collaborative knowledge
collaborative
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310321078.2A
Other languages
English (en)
Inventor
孙哲
张碧玉
孙知信
赵学健
曹亚东
宫婧
汪胡青
胡冰
徐玉华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202310321078.2A priority Critical patent/CN116304372A/zh
Publication of CN116304372A publication Critical patent/CN116304372A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合群组的协作知识图网络推荐方法,包括获取用户群组数据、用户项目交互数据和知识图谱数据;通过项目节点融合用户项目交互和知识图为协作知识图谱,使用用户群组数据扩充协作知识图谱中的用户项目二部图为三部图;使用transR知识图谱表示方法,对节点和关系进行嵌入表示;通过元路径的方法把群组用户项目三部图转变为多个关系子图;对子图进行相似度分析得到用户‑用户、项目‑项目的相似度关系及表达式并对知识图的节点嵌入进行更新;使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,并通过图神经网络建模学习,减少无关数据对预测的影响,利用预测函数得到项目的推荐,提高推荐准确度。

Description

一种融合群组的协作知识图网络推荐方法
技术领域
本发明涉及推荐系统技术领域,尤其涉及一种融合群组的协作知识图谱网络推荐方法。
背景技术
随着互联网的快速发展,网络中的信息爆炸式的增长,信息的规模以及信息的复杂性和丰富性再也不断提高,海量的信息给用户带来了信息过载,如何对信息进行筛选,从中获取用户真正感兴趣的信息变得越来越重要。
推荐系统作为处理这种问题的有效手段得到了应用和发展,传统的推荐方法通过协同过滤技术给用户和项目不同的向量表示,再使用内积、矩阵分解、神经网络等操作进行建模,面临着数据稀疏和冷启动的问题。为了解决这个问题,相关专业领域专家提出,把用户和项目的属性用于补偿数据稀疏性得到知识图谱,并把知识图谱和传统推荐相结合。
现有基于知识图谱的推荐考虑了项目信息,但是由于用户隐私性,用户的属性很难融入到知识图谱之中,导致用户数据相对较少,并且现有基于知识图谱的推荐没有把用户间和项目间的相似性和用户的偏好很好的结合起来再进行推荐。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。因此,本发明提供了一种融合群组的协作知识图谱网络推荐方法,用来解决实际问题中,用户属性难融入知识图谱导致的用户数据相对较少和现有知识图谱不能很好的为提供用户推荐感兴趣信息的问题。
为解决上述技术问题,本发明提供如下技术方案:
本发明提供了一种融合群组的协作知识图谱网络推荐方法,包括:
获取用户群组数据、用户项目交互数据和知识图谱数据;
通过项目节点,融合用户项目交互数据和知识图谱数据作为协作知识图谱;
使用所述用户群组数据扩充协作知识图谱中的用户项目二部图为三部图;
使用知识图谱表示方法,对协作知识图谱中的节点和关系进行嵌入表示;
通过元路径方法,把群组用户项目三部图转变为多个关系子图;
对所述关系子图进行相似度分析,得到用户到用户、项目到项目的相似度表达式,并对协作知识图谱的节点嵌入进行更新;
使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,并经过图神经网络建模学习,利用预测函数的预测结果对用户进行项目推荐。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:所述通过项目节点,融合用户项目交互数据和知识图谱数据作为协作知识图谱,包括:
对协作知识图谱中用户节点和用户群组数据进行融合,得到包含用户群组数据的协作知识图谱。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:所述协作知识图谱,包括:
协作知识图谱的上半部分为群组用户项目三部图,所述协作知识图谱的下半部分为项目知识图。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:使用知识图谱表示方法,对协作知识图谱中的节点和关系进行嵌入表示,包括:
使用transR知识图谱表示方法对协作知识图谱进行节点和关系的嵌入表示进行训练;
所述嵌入表示需要进行负采样得到样本数据,通过负采样策略替换头尾实体形成负三元组并结合正三元组,进行训练得到知识图中的节点和关系嵌入表示;
所述使用transR知识图谱表示方法对协作知识图谱进行节点和关系的嵌入表示,具体表示如下:
把实体投影到关系空间中,对于头实体h和尾实体t投影到r关系空间中时满足公式
Figure SMS_1
为关系的嵌入表示,/>
Figure SMS_2
为头实体h在r关系空间中的嵌入表示,/>
Figure SMS_3
为尾实体t在r关系空间中的嵌入表示;
所述嵌入表示的对应得分公式为:
Figure SMS_4
其中,g为头实体h、尾实体t在r关系空间中的距离,得分越低代表三元组越可能为真;
Figure SMS_5
是关系r的转换矩阵,用来把实体转换到对应关系空间中;
所述transR知识图谱表示方法训练对应的损失函数表示为:
Figure SMS_6
其中,
Figure SMS_7
为知识图谱的损失函数,损失函数得到的值越低训练效果越好;lnσ是激活函数,在网络中引入非线性特性;τ代表正负三元组的集合,/>
Figure SMS_8
为正采样的三元组,
Figure SMS_9
为负采样的三元组。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:所述负采样策略,包括:
负采样策略采用有偏重要度采样策略,把节点的重要度作为采样概率增强项和基于关系的采样项归一化,相加得到最终的负采样概率;
其中基于关系的采样把关系分为多对一和多对多两种,在多头对一尾的关系中,替换头实体形成的三元组错误的概率小于替换尾实体形成的三元组的概率;在多头对多尾的关系中,头实体数量比尾实体数量少则选择头实体,反之则选择尾实体;
基于关系的采样概率计算公式为:
Figure SMS_10
其中,p为基于关系的采样概率,
Figure SMS_11
为关系中头实体对应尾实体的数量取平均值,
Figure SMS_12
为尾实体对应头实体的数量取平均值;
将基于关系的采样概率转换为伯努利采样形式,转换公式为:
Figure SMS_13
其中,
Figure SMS_14
为实体H或者实体h的采样概率,若h为0则为头实体替换概率,若h为1则为尾实体替换概率;
基于节点的采样增强项与节点相连的边越多在图中越重要,被采样的概率就越大,具体为节点的边与图中边最大值的比值;
对基于关系和基于节点的采样概率进行有偏归一化,相加得到有偏重要度采样概率,计算公式为:
Figure SMS_15
其中,
Figure SMS_16
为节点采样增强项,/>
Figure SMS_17
为增强项对采样概率的增强参数。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:通过元路径方法,把群组用户项目三部图转变为多个关系子图,包括:
元路径根据多跳之后节点相关度减弱的原则进行元路径跳数划分,把元路径划分为一跳元路径和二跳元路径;
通过所述节点相关度减弱的原则进行元路径跳数划分,设计元路径选取策略;
计算关系子图中元路径的权重;
一跳元路径的权重计算公式为:
Figure SMS_18
其中,n为两节点之间元路径的条数,
Figure SMS_19
为该元路径下节点间最大的元路径条数;
二跳元路径的权重计算公式为:
Figure SMS_20
其中,m为a,b在元路径
Figure SMS_21
下的中间节点;
所述元路径选取策略为通过概率对二跳元路径进行选择,计算公式如下:
Figure SMS_22
其中,
Figure SMS_23
为二跳元路径选取概率,/>
Figure SMS_24
为当前二跳元路径对应关系子图的边权重求和,/>
Figure SMS_25
代表对所有的二跳元路径进行边权重求和。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:对所述关系子图进行相似度分析,得到用户到用户、项目到项目的相似度表达式,并对协作知识图谱的节点嵌入进行更新,包括:
通过融合多个关系子图中的相似性,得到相似度表达式;
相似表达式的计算公式为:
Figure SMS_26
其中,
Figure SMS_27
表示节点u,v的相似度表达式,/>
Figure SMS_28
表示相应跳数下权重平均值,
Figure SMS_29
分别表示节点的一跳和二跳邻居集合,/>
Figure SMS_30
表示其中的邻居;
根据所述得到的相似度表达式,对协作知识图谱中的节点嵌入表示进行更新。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,包括:
所述改进注意力机制分为注意力机制参数项和用户关系倾向参数项。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:所述信息传播和聚合,包括:
通过配置信息传播时对用户关系倾向参数项的权重,调节信息传播和聚合时用户潜在倾向对节点嵌入的影响;
所述信息聚合表示为:
Figure SMS_31
其中,实体h在用户u的偏好下对邻居的信息聚合为
Figure SMS_32
,/>
Figure SMS_33
表示t实体传到h实体的权重;/>
Figure SMS_34
是通过注意力机制公式和用户关系倾向公式融合,并制定
Figure SMS_35
权重调节用户倾向的影响力度的计算得到,计算公式如下:
Figure SMS_36
其中,tanh代表激活函数,在函数中引入非线性特性;
调节信息传播和聚合时用户潜在倾向对节点嵌入的影响,计算公式为:
Figure SMS_37
其中,LeakyReLU为带泄露修正线性单元函数,
Figure SMS_38
为通过注意力机制和用户u偏好聚合的新h实体嵌入,W1代表信息聚合时的权重矩阵是可学习的,/>
Figure SMS_39
代表实体h在用户u的偏好下对邻居的信息聚合。
作为本发明所述的融合群组的协作知识图谱网络推荐方法的一种优选方案,其中:预测函数,包括:
预测函数表示为用户嵌入和项目嵌入的点乘和归一化,经过图神经网络建模学习,产生预测结果对用户进行项目推荐。
与现有技术相比,发明有益效果为:利用现有的用户和群组之前的关系丰富用户数据,通过分析群组用户项目三部图得到用户与用户,项目与项目的相似性,融合和用户群组和用户项目交互数据提高了用户和项目的嵌入表示,并缓解了数据稀疏和冷启动问题;使用了改进注意力机制对不同用户计算不同的节点嵌入表示,提高了推荐准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例所述的融合群组的协作知识图谱网络推荐方法的流程示意图;
图2为本发明一个实施例所述的融合群组的协作知识图谱网络推荐方法的transR知识图谱表示方法实体空间映射到关系空间的示意图;
图3为本发明一个实施例所述的融合群组的协作知识图谱网络推荐方法的融合群组用户项目三部图和融合知识图谱的协作知识图谱;
图4为本发明一个实施例所述的融合群组的协作知识图谱网络推荐方法的元路径得到的部分关系子图;
图5为本发明一个实施例所述的融合群组的协作知识图谱网络推荐方法的图神经网络节点的信息传播图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明第一个实施例,该实施例提供了一种融合群组的协作知识图谱网络推荐方法,包括:
获取用户群组数据、用户项目交互数据和知识图谱数据;
通过项目节点,融合用户项目交互数据和知识图谱数据作为协作知识图谱;
使用所述用户群组数据扩充协作知识图谱中的用户项目二部图为三部图;
使用知识图谱表示方法,对协作知识图谱中的节点和关系进行嵌入表示;
通过元路径方法,把群组用户项目三部图转变为多个关系子图;
对所述关系子图进行相似度分析,得到用户到用户、项目到项目的相似度表达式,并对协作知识图谱的节点嵌入进行更新;
使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,并经过图神经网络建模学习,利用预测函数的预测结果对用户进行项目推荐;
进一步的,所述获取用户群组数据、用户项目交互数据和知识图谱数据;其中,用户群组数据为用户和群组之间的关系,不同用户具有相同的群组表示用户具有相似性,用户之间共同的群组越多则用户的相似度越高,所述用户项目交互数据为用户对项目的评分、点击、购买等行为构成的数据,用户之间交互过的项目越多则用户相似度越高,同理,项目之间包含的用户越多项目的相似度也越高,所述知识图谱数据为项目和属性构成的图谱数据,图谱数据为头实体-关系-尾实体构成的三元组;
进一步的,所述嵌入表示需要进行负采样得到样本数据,通过采样策略替换头尾实体形成负三元组,结合正三元组对模型进行训练得到知识图中的节点和关系嵌入表示;所述负采样策略采用有偏重要度采样策略,把节点的重要度作为采样概率增强项和基于关系的基础采样项归一化,再相加得到最终的负采样概率;其中基于关系的采样把关系分为多对一和多对多两种,在多头对一尾的关系中,替换头实体形成的三元组错误的概率小于替换尾实体形成的三元组的概率;同理,在多头对多尾的关系中,头实体数量比尾实体数量少则选择头实体,反之则选择尾实体。
进一步的,所述基于节点的采样增强项与节点相连的边越多在图中越重要,被采样的概率应该越大,具体为节点的边与图中边最大值的比值;
进一步的,所述得到的关系子图的权重为当前节点间元路径的条数和图中节点间最大元路径的条数的比值;通过计算子图中节点连接的权重对关系子图进行U-U、I-I相似度分析,再利用归一化和相加的方式得到相似度表达式,通过表达式对协作知识图谱中的节点的嵌入表示进行更新。
实施例2
参照图2,为本发明第二个实施例,该实施例提供了一种融合群组的协作知识图谱网络推荐方法,包括:
所述用户项目交互图和知识图谱中有共有的项目节点,通过项目节点把用户项目交互和知识图谱进行融合,得到协作知识图谱,再对协作知识图谱中用户节点和用户群组数据进行融合,得到包含用户群组数据的协作知识图谱;
所述协作知识图谱的上半部分为群组用户项目三部图,所述协作知识图谱的下半部分为项目知识图;
如图2所示,所述协作知识图谱通过Items节点把协作知识图谱分为二部图,上半部分为群组用户项目三部图,其中包括Groups、Users、Items三类节点和对应关系r1,r2,所述协作知识图谱的下半部分为项目知识图,其中包括Items、Entities两类节点和对应关系r3,r4,r5等;
其中,群组用户项目三部图通过Users节点把三部图分为两个二部图,上半部分为群组用户二部图,下半部分为用户项目二部图;
通过对协作知识图谱的构建,能够使得用户属性更好的融入知识图谱,同时能够增加用户数据量,以实现更加宽泛的用户推荐。
实施例3
参照图3,为本发明第三个实施例,该实施例提供了一种融合群组的协作知识图谱网络推荐方法,包括:
把协作知识图谱作为输入经过transR知识图谱表示方法进行训练最终得到节点和关系的嵌入表示,具体是把实体投影到关系空间中,对于头实体h和尾实体投影到r关系空间中时满足公式
Figure SMS_40
为关系的嵌入表示,/>
Figure SMS_41
为头实体h在r关系空间中的嵌入表示,/>
Figure SMS_42
为尾实体t在r关系空间中的嵌入表示;如图3所示,所述h实体和t实体在图中实体空间中,/>
Figure SMS_43
分别为h和t映射到关系空间的表示,/>
Figure SMS_44
为关系r的转换矩阵;
模型训练时该嵌入表示对应的得分公式如下:
Figure SMS_45
其中,g为头实体h、尾实体t在r关系空间中的距离,得分越低代表三元组越可能为真;
Figure SMS_46
是关系r的转换矩阵,用来把实体转换到对应关系空间中;
所述transR知识图谱表示方法训练对应的损失函数为:
Figure SMS_47
其中,
Figure SMS_48
为知识图谱的损失函数,损失函数得到的值越低训练效果越好;lnσ是激活函数,在网络中引入非线性特性;τ代表正负三元组的集合,/>
Figure SMS_49
为正采样的三元组,
Figure SMS_50
为负采样的三元组。
所述嵌入表示需要进行负采样得到样本数据,通过采样策略替换头尾实体形成负三元组并结合正三元组对模型进行训练得到知识图中的节点和关系嵌入表示,所述负采样策略采用有偏重要度采样策略,把节点的重要度作为采样概率增强项和基于关系的基础采样项归一化再相加得到最终的负采样概率,其中基于关系的采样把关系分为多对一和多对多两种,在多头对一尾的关系中,替换头实体形成的三元组错误的概率小于替换尾实体形成的三元组的概率,在多头对多尾的关系中,头实体数量比尾实体数量少则选择头实体,反之则选择尾实体,基于关系的采样概率计算公式为:
Figure SMS_51
其中,p为基于关系的采样概率,
Figure SMS_52
为关系中头实体对应尾实体的数量取平均值,
Figure SMS_53
为尾实体对应头实体的数量取平均值;
将基于关系的采样概转换为伯努利采样形式,计算公式为:
Figure SMS_54
其中,
Figure SMS_55
为实体H或者实体h的采样概率,若h为0则为头实体替换概率,若h为1则为尾实体替换概率;
基于节点的采样增强项考虑与节点相连的边约多在图中越重要,被采样的概率应该越大,具体为节点的边与图中边最大值的比值;
对基于关系和基于节点的采样概率进行有偏归一化并相加,得到有偏重要度采样概率,计算公式为:
Figure SMS_56
其中,
Figure SMS_57
为节点采样增强项,/>
Figure SMS_58
为增强项对采样概率的增强参数。
实施例4
参照图4,为本发明第四个实施例,该实施例提供了一种融合群组的协作知识图谱网络推荐方法,包括:
通过元路径的方法把群组用户项目三部图转变为多个关系子图;
进一步的,通过构造一跳元路径U-I-U、U-G-U、I-U-I和I-U-G对群组用户项目三部图进行分析,得到四个一跳关系子图;构造二跳元路径U-I-U-I-U、U-I-U-G-U、U-G-U-G-U、I-U-I-U-I、I-U-G-U-I得到五个二跳关系子图;
其中U、I、G分别代表用户、项目和群组;
进一步的,通过扫描原三部图节点之间存在元路径则代表在新的关系子图中节点之间存在连接,在关系子图中把原有连接替换为新的连接,根据多个元路径可以得到多个关系子图,利用节点多跳之后相关度减弱的原则设计元路径选取策略,去除相似度较小的关系子图达到减少干扰数据的作用;所述元路径选取策略为通过概率对二跳元路径进行选择,计算公式如下:
Figure SMS_59
其中,
Figure SMS_60
为二跳元路径选取概率,/>
Figure SMS_61
为当前二跳元路径对应关系子图的边权重求和,/>
Figure SMS_62
代表对所有的二跳元路径进行边权重求和;
本实施例中为了计算方便选取
Figure SMS_63
为1,即计算相似性表达式时考虑全部一、二跳元路径转换的关系子图。
如图4所示,上半部分图表示群组用户项目三部图通过元路径U-I-U把原连接转换为用户之间的连接;Users的节点之间存在连接表示在三部图中节点之间存在U-I-U的一条或多条元路径,Users的前三个节点和后两个节点分别具有相似性,第三个节点和第四个节点间没有相似性;下半部分图表示群组用户项目三部图通过元路径I-U-I把原连接转换为项目之间的连接;同理,Items的第二和第三个节点具有相似性,第一个节点和第四个节点和其他节点之间没有相似性;
进一步的,通过一跳元路径U-I-U、U-G-U、I-U-I和I-U-G以及二跳元路径U-I-U-I-U、U-I-U-G-U、U-G-U-G-U、I-U-I-U-I和I-U-G-U-I可以得到共九张关系子图;
通过元路径选取策略,能够去除相似度较小的关系子图,达到减少干扰数据的作用,提高数据的准确度。
实施例5
参照图5,为本发明第五个实施例,该实施例提供了一种融合群组的协作知识图谱网络推荐方法,包括:
使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,并通过图神经网络建模学习;
进一步的,通过基于用户潜在关系倾向的改进注意力机制进行信息聚合,所述改进注意力机制为注意力机制参数项和用户关系倾向参数项,通过配置信息传播时对关系倾向参数项的权重来调节信息传播和聚合时用户潜在倾向对节点嵌入的影响,减少无关邻居的信息传递增大用户偏好的邻居和与项目相似的邻居的信息传递;具体为,实体h在用户u的偏好下对邻居的信息聚合为
Figure SMS_64
,计算公式为:
Figure SMS_65
其中,
Figure SMS_66
表示t实体传到h实体的权重;/>
Figure SMS_67
通过注意力机制公式和用户关系倾向公式融合得到,并制定权重/>
Figure SMS_68
调节用户的倾向的影响力度的计算,计算公式为:
Figure SMS_69
其中,tanh代表激活函数,在函数中引入非线性特性;
所述注意力机制在关系空间中分配给越接近的头实体和尾实体越高的分值,再与用户嵌入和关系嵌入的点乘积进行有权融合得到新的信息传播权重并归一化,最后得到哪些邻居节点需要传递更多信息量;应当说明的是,本实施例中
Figure SMS_70
取值为1;
所述信息聚合是把h实体的嵌入和信息传递的
Figure SMS_71
通过聚合函数聚合为新的h实体嵌入表示,计算公式为:
Figure SMS_72
其中,LeakyReLU为带泄露修正线性单元函数,
Figure SMS_73
为通过注意力机制和用户u偏好聚合的新h实体嵌入,W1代表信息聚合时的权重矩阵是可学习的,/>
Figure SMS_74
代表实体h在用户u的偏好下对邻居的信息聚合。
所述信息传播和聚合需要经过多层堆叠,聚合h实体的本地邻居和非本地邻居的信息;具体为把前一层聚合之后得到的节点嵌入表示作为新一层计算的基础嵌入表示进行堆叠;为了减少计算的复杂性和提高稳定性对每个实体只采样固定数量的邻居,同时减少无关数据的信息传播,堆叠层数采用2至3层,对节点的邻居的连接权重进行排序只取其中最大的前固定数量个邻居;
如图5所示,信息传播的堆叠层数为2,固定采样的邻居数为3,节点的信息传播金国两层堆叠,每层堆叠选取3个最大连接权重的邻居,通过聚合函数把节点原先嵌入表示和第一层堆叠传播过来的信息进行聚合得到一阶嵌入表示,再把节点的一阶嵌入表示和第二层堆叠传播的信息进行聚合得到二阶嵌入表示,把原始嵌入和一阶、二阶嵌入表示进行结合得到最终的节点嵌入表示;
通过改进的注意力机制可以减少无关邻居的信息传递,增大用户偏好的邻居和与项目相似的邻居的信息传递,以实现对用户兴趣内容推荐的准确性。
实施例6
参照表1至表4,为本发明第六个实施例,该实施例提供了一种融合群组的协作知识图谱网络推荐方法,包括:
首先需要分别获取到用户群组数据和用户项目交互数据,具体数据表格参考表1和表2:
Figure SMS_75
Figure SMS_76
表1中用户和群组之间的1代表用户进入了该群组,不同的用户进入相同的群组代表用户之间具有相似性,共同的群组越多相似性就越大;同理,在用户项目交互图中用户和用户之间,项目和项目之间也具有同样的相似性,通过用户群组和用户项目构建群组用户项目三部图,再结合元路径方法进行相似度分析,获取用户间、项目间相似表达式,然后再获取知识图谱数据,把头尾实体和关系重新分配id构造为三元组格式,具体数据表格参考表3:
Figure SMS_77
然后把群组用户项目三部图和知识图谱结合并通过transR知识图谱表示方法进行嵌入表示,将得到的嵌入向量通过上述相似度表达式更新,再通过本发明提出的改进注意力机制的神经网络方法进行训练,得到最终推荐结果;
为了进一步验证本发明的效果,将三个公开数据集采用本发明和另外5种方法进行多组对比实验,5种方法具体如下:
RippleNet:探索知识图谱上用户行为的多重波动,再逐层递归进行信息传播;
KGCN:在NGCF的基础上,去除了非线性转换和激活函数这两个不适合推荐系统的网络架构,在简化模型的基础上提高了推荐算法的效率;
KGNN-LS:基于GNN的模型,它将KG转换针对用户的图,综合了用户的偏好信息与信息聚合时的标签平滑以便生成用户特定的项目表示;
KGAT:把用户项目交互和知识图谱融合并结合注意力机制进行交替训练。
KPRN:在知识图谱中通过LSTM直接对用户-项目路径进行建模,然后将其聚合进行最终预测;参考表4:
Figure SMS_78
如表4所示,与现有的基线模型相比,本发明所提出的方法在召回率recall和归一化折损累计增益ndcg两个指标中都取得了一定的进步;一方面本发明融合了用户群组的关系丰富了数据,并把群组的数据和用户项目交互数据联合进行分析,帮助提高知识图谱的节点和关系的嵌入表示能力;另一方面本发明把用户对关系的偏好和注意力机制融合提高了用户角度的项目信息聚合能力,通过专门针对推荐的采样、元路径选取、图融合、针对用户的信息传播方法,提高推荐方法的效果。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种融合群组的协作知识图网络推荐方法,其特征在于,包括:
获取用户群组数据、用户项目交互数据和知识图谱数据;
通过项目节点,融合用户项目交互数据和知识图谱数据作为协作知识图谱;
使用所述用户群组数据扩充协作知识图谱中的用户项目二部图为三部图;
使用知识图谱表示方法,对协作知识图谱中的节点和关系进行嵌入表示;
通过元路径方法,把群组用户项目三部图转变为多个关系子图;
对所述关系子图进行相似度分析,得到用户到用户、项目到项目的相似度表达式,并对协作知识图谱的节点嵌入进行更新;
使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,并经过图神经网络建模学习,利用预测函数的预测结果对用户进行项目推荐。
2.如权利要求1所述的融合群组的协作知识图网络推荐方法,其特征在于,所述通过项目节点,融合用户项目交互数据和知识图谱数据作为协作知识图谱,包括:
对协作知识图中用户节点和用户群组数据进行融合,得到包含用户群组数据的协作知识图谱。
3.如权利要求2所述的融合群组的协作知识图网络推荐方法,其特征在于,所述协作知识图谱,包括:
协作知识图谱的上半部分为群组用户项目三部图,所述协作知识图谱的下半部分为项目知识图。
4.如权利要求2或3所述的融合群组的协作知识图网络推荐方法,其特征在于,使用知识图谱表示方法,对协作知识图谱中的节点和关系进行嵌入表示,包括:
使用transR知识图谱表示方法对协作知识图谱进行节点和关系的嵌入表示进行训练;
所述嵌入表示需要进行负采样得到样本数据,通过负采样策略替换头尾实体形成负三元组并结合正三元组,进行训练得到知识图中的节点和关系嵌入表示。
5.如权利要求4所述的融合群组的协作知识图网络推荐方法,其特征在于,所述负采样策略,包括:
负采样策略采用有偏重要度采样策略,把节点的重要度作为采样概率增强项和基于关系的采样项归一化,相加得到最终的负采样概率;
其中基于关系的采样把关系分为多对一和多对多两种,在多头对一尾的关系中,替换头实体形成的三元组错误的概率小于替换尾实体形成的三元组的概率;在多头对多尾的关系中,头实体数量比尾实体数量少则选择头实体,反之则选择尾实体。
6.如权利要求5所述的融合群组的协作知识图网络推荐方法,其特征在于,通过元路径方法,把群组用户项目三部图转变为多个关系子图,包括:
元路径根据多跳之后节点相关度减弱的原则进行元路径跳数划分,把元路径划分为一跳元路径和二跳元路径;
计算关系子图中元路径的权重。
7.如权利要求5或6所述的融合群组的协作知识图网络推荐方法,其特征在于,对所述关系子图进行相似度分析,得到用户到用户、项目到项目的相似度表达式,并对协作知识图谱的节点嵌入进行更新,包括:
通过融合多个关系子图中的相似性,得到相似度表达式;
根据所述得到的相似度表达式,对协作知识图谱中的节点嵌入表示进行更新。
8.如权利要求7所述的融合群组的协作知识图网络推荐方法,其特征在于,使用基于用户潜在关系倾向的改进注意力机制进行信息传递与聚合,包括:
所述改进注意力机制分为注意力机制参数项和用户关系倾向参数项。
9.如权利要求8所述的融合群组的协作知识图网络推荐方法,其特征在于,所述信息传播和聚合,包括:
通过配置信息传播时对用户关系倾向参数项的权重,调节信息传播和聚合时用户潜在倾向对节点嵌入的影响。
10.如权利要求9所述的融合群组的协作知识图网络推荐方法,其特征在于,预测函数,包括:
预测函数表示为用户嵌入和项目嵌入的点乘和归一化,经过图神经网络建模学习,产生预测结果对用户进行项目推荐。
CN202310321078.2A 2023-03-29 2023-03-29 一种融合群组的协作知识图网络推荐方法 Pending CN116304372A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310321078.2A CN116304372A (zh) 2023-03-29 2023-03-29 一种融合群组的协作知识图网络推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310321078.2A CN116304372A (zh) 2023-03-29 2023-03-29 一种融合群组的协作知识图网络推荐方法

Publications (1)

Publication Number Publication Date
CN116304372A true CN116304372A (zh) 2023-06-23

Family

ID=86792507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310321078.2A Pending CN116304372A (zh) 2023-03-29 2023-03-29 一种融合群组的协作知识图网络推荐方法

Country Status (1)

Country Link
CN (1) CN116304372A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216417A (zh) * 2023-11-07 2023-12-12 北京智谱华章科技有限公司 融合知识信息和协同信息的推荐方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216417A (zh) * 2023-11-07 2023-12-12 北京智谱华章科技有限公司 融合知识信息和协同信息的推荐方法、装置、设备及介质
CN117216417B (zh) * 2023-11-07 2024-02-20 北京智谱华章科技有限公司 融合知识信息和协同信息的推荐方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111582509B (zh) 一种基于知识图谱表示学习和神经网络的协同推荐方法
CN109190030B (zh) 融合node2vec和深度神经网络的隐式反馈推荐方法
CN112613602A (zh) 基于知识感知超图神经网络的推荐方法及系统
CN112950324B (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN112364976A (zh) 基于会话推荐系统的用户偏好预测方法
CN114265986B (zh) 一种融合知识图谱结构与路径语义的信息推送方法和系统
Li et al. A survey of graph neural network based recommendation in social networks
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
CN113486190A (zh) 一种融合实体图像信息和实体类别信息的多模态知识表示方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
Deng et al. Knowledge-aware group representation learning for group recommendation
CN116304372A (zh) 一种融合群组的协作知识图网络推荐方法
CN116340646A (zh) 一种基于超图基序优化多元用户表示的推荐方法
CN114817712A (zh) 一种基于多任务学习和知识图谱增强的项目推荐方法
CN113918833A (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN115310005A (zh) 基于元路径融合和异构网络的神经网络推荐方法及系统
CN115618128A (zh) 一种基于图注意力神经网络的协同过滤推荐系统及方法
Yin et al. An efficient recommendation algorithm based on heterogeneous information network
Liu et al. Siga: social influence modeling integrating graph autoencoder for rating prediction
CN113342994A (zh) 一种基于无采样协作知识图网络的推荐系统
CN104036013B (zh) 基于属性拓扑的博客数据的形式概念计算方法
Shao et al. H2Rec: Homogeneous and Heterogeneous Network Embedding Fusion for Social Recommendation.
CN114329222A (zh) 一种融合注意力机制和双端知识图谱的电影推荐方法
CN115391555A (zh) 一种用户感知的知识图谱推荐系统及方法
Cai et al. Knowledge-aware graph collaborative filtering for recommender systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination