CN113505294A - 一种融合元路径的异质网络表示推荐算法 - Google Patents

一种融合元路径的异质网络表示推荐算法 Download PDF

Info

Publication number
CN113505294A
CN113505294A CN202110663073.9A CN202110663073A CN113505294A CN 113505294 A CN113505294 A CN 113505294A CN 202110663073 A CN202110663073 A CN 202110663073A CN 113505294 A CN113505294 A CN 113505294A
Authority
CN
China
Prior art keywords
meta
path
user
node
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110663073.9A
Other languages
English (en)
Inventor
黄萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110663073.9A priority Critical patent/CN113505294A/zh
Publication of CN113505294A publication Critical patent/CN113505294A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及异质网络的推荐模型技术领域,公开了一种融合元路径的异质网络表示推荐算法,包括以下步骤:1)异质信息网络上的信息抽取;2)基于元路径权重的向量融合;3)结合矩阵分解预测推荐得分,先利用随机游走策略获取基于不同元路径的节点序列,针对不同路径利用metapath2vec++算法学习用户与项目在统一维度空间的隐向量表示,然后基于注意力机制利用多层感知机MLP学习节点对于不同元路径的偏好权重,并计算出全局表示向量,最后结合矩阵因子分解的推荐模型,利用路径结构Hetesim相似度对评分矩阵分解出的隐因子向量进行约束,对项目评分进行预测。

Description

一种融合元路径的异质网络表示推荐算法
技术领域
本发明涉及异质网络的推荐模型技术领域,具体为一种融合元路径的异质网络表示推荐算法。
背景技术
多数基于异质网络的推荐模型都是先通过预设好的元路径提取节点的特征向量表示,然后对评分矩阵进行拟合实现评分预测。虽然现有的异质网络的方法在提升准确度方面已经有了一定的成效,但大多数方法依然存在以下问题:
(1)仅利用单一元路径提取节点信息,面临稀疏数据时无法得到节点的精准表示;
(2)融合多条元路径信息时忽视了用户对于不同路径语义的偏好,造成复杂网络中节点表示不够精确。
针对上述问题,本发明提供了一种融合元路径的异质网络表示推荐算法。
发明内容
本发明的目的在于提供一种融合元路径的异质网络表示推荐算法,解决了以往在推荐中无法结合异质网络中多重元路径语义信息的问题。
为实现上述目的,本发明提供如下技术方案:一种融合元路径的异质网络表示推荐算法,包括以下步骤:
S01:异质信息网络上的信息抽取,基于推荐系统中用户-商品交互信息构建异质信息网络,计算网络的节点在不同元路径下的随机游走序列,并通过Metapath2vec++算法学习结点的网络表示;
S02:基于元路径权重的向量融合,将这些不同元路径下的节点表示矩阵作为输入,分别学习各个元路径的特征向量;
S03:结合矩阵分解预测推荐得分,通过注意力机制学习元路径权重,融合结点隐向量,以获得用户和商品的整体隐向量,结合矩阵分解用于推荐。
进一步地,步骤S01包括以下步骤:
S011:元路径选择,元路径的选择只针对用户或项目为端点的路径;
S012:基于元路径随机游走的结点网络表示学习。
进一步地,元路径选择遵循以下三点原则:
a)为了学习更加准确的用户表示和项目表示,元路径的构造要以用户(项目)为端点;
b)元路径中只包含对用户评分行为影响较大的节点类型;
c)元路径长度在四个节点之内。
进一步地,游走路径可按如下的计算方式所产生:
Figure RE-GDA0003210941480000021
上式中,nt为随机游走经过的第t个节点,并且该节点类型为At,nt+1代表节点nt的基于规定元路径游走的下一节点,NAt+1代表属于At+1类型的节点集合。该策略可以基于元路径约束等概率选取与初始节点相关联的节点,根据预设的长度进行游走,最后筛选出有意义的随机游走序列。
进一步地,在得到异质信息网络的随机游走序列之后,利用 Metapath2vec++的SkipGram模型对节点表示进行学习,设置节点的嵌入维度为d,模型输出结果则将用户与项目节点映射到同一个d维的空间中,其目标函数如下所示:
Figure RE-GDA0003210941480000022
Figure RE-GDA0003210941480000023
进一步地,步骤S02包括以下步骤:
S021:构建用户-项目的邻接矩阵;
S022:基于注意力机制的元路径加权表示。
进一步地,步骤S021中根据公式PathSim构建基于新的元路径的用户项目相似度邻接矩阵SCpi
Figure RE-GDA0003210941480000031
Figure RE-GDA0003210941480000032
其中
Figure RE-GDA0003210941480000033
为用户节点n*n维的相似度矩阵,
Figure RE-GDA0003210941480000034
为项目节点m*m维的相似度矩阵,它们的元素值都是根据公式PathSim计算得来,然后将所有路径的SCpi以张量的形式按位相加。
SC=SCp1+SCp2+…SCpl
进一步地,步骤S022中项目与用户的权重采用了互为增强的两层感知机结构来实现协同注意力机制:
Attention(Q,K,V)=MLP(Q,KT)V
Figure RE-GDA0003210941480000035
Figure RE-GDA0003210941480000036
其中,
Figure RE-GDA0003210941480000037
和b(1)为第一层的基于元路径的权重矩阵和偏置向量,同理,
Figure RE-GDA0003210941480000038
和b(2)为第二层的权重向量和偏置,
Figure RE-GDA0003210941480000039
为用户节点i基于元路径pl的表示。
进一步地,步骤S03通过对评分矩阵进行分解,结合用户、项目以及全局的偏好,进而得出用户和项目的隐特征向量,评分预测可表示为以下形式:
Figure RE-GDA0003210941480000041
其中ui表示用户的隐因子表示,
Figure RE-GDA0003210941480000042
n表示用户数量,即 i表示第i个用户;同理,
Figure RE-GDA0003210941480000043
m表示为项目数量,k表示第k个项目。
进一步地,为了更加充分的考虑异质信息网络结构特征,在评分拟合部分使用带有一定权重的结构偏好,并通过基于元路径的节点相似度HeteSim 作为约束用户与项目隐语义表示的正则项。
与现有技术相比,本发明的有益效果如下:
本发明提供的一种融合元路径的异质网络表示推荐算法,用户对项目的评分偏好与元路径的隐特征表示有很强的关联,因此先利用随机游走策略获取基于不同元路径的节点序列,针对不同路径利用metapath2vec++算法学习用户与项目在统一维度空间的隐向量表示,然后基于注意力机制利用多层感知机MLP学习节点对于不同元路径的偏好权重,并计算出全局表示向量,最后结合矩阵因子分解的推荐模型,利用路径结构Hetesim相似度对评分矩阵分解出的隐因子向量进行约束,对项目评分进行预测,该模型较传统矩阵分解和基于异质网络的推荐算法都有一定的提升,尤其是可以提高数据稀疏时的预测精度。
附图说明
图1为本发明的融合元路径的异质网络表示推荐算法的整体步骤流程图;
图2为本发明的融合元路径的异质网络表示推荐算法的推荐算法流程示意图;
图3为本发明的融合元路径的异质网络表示推荐算法的用户—项目邻接矩阵图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种融合元路径的异质网络表示推荐算法,包括以下步骤:
S01:异质信息网络上的信息抽取,基于推荐系统中用户-商品交互信息构建异质信息网络,计算网络的节点在不同元路径下的随机游走序列,并通过Metapath2vec++算法学习结点的网络表示;
S02:基于元路径权重的向量融合,将这些不同元路径下的节点表示矩阵作为输入,分别学习各个元路径的特征向量;
S03:结合矩阵分解预测推荐得分,通过注意力机制学习元路径权重,融合结点隐向量,以获得用户和商品的整体隐向量,结合矩阵分解用于推荐。
一、异质信息网络信息抽取
首先选取以用户节点为端点的对称元路径,将用户、项目节点映射在同一个维度空间中,最后通过加权融合不同元路径的表示形成全局向量。
(1)元路径选择
元路径包含了节点之间的结构偏好信息。比如在DoubanMovie数据集中,元路径用户-电影-类型-电影-用户(UVTVU)可表示与用户看过同类别电影的用户,用户-电影-演员-电影-用户(UVAVU)表示与用户看过同演员电影的用户,用户-电影-导演-电影-用户(UVDVU)代表与用户看过同导演电影的用户。因此,基于元路径的节点表示可以有效的反映出在不同影响下节点之间的关联,不过元路径的选择可以对求解节点网络表示产生很大影响,如,元路径设置过长,则距离较远的节点关联度就会很弱,在模型计算中就会产生很多噪声信息,同时,由于给予不同的元路径可以得到用户或项目节点不同层面的向量表示(如UVDVU可以反映出用户在电影观看历史行为方面的隐特征, UVDVU可以反映出用户在导演偏好方面的隐特征)。
因此,本实施例在元路径的选择方面遵循以下三点原则:
1、为了学习更加准确的用户表示和项目表示,元路径的构造要以用户(项目)为端点;
2、元路径中只包含对用户评分行为影响较大的节点类型(如用户在选择电影时可能更加在意电影的类别、演员或者导演而非来源地,即元路径“UVT(Type)VU、UVA(Actor)VU、UVD(Director)VU”比“UVC(Country)VU”更加重要)
3、元路径长度在四个节点之内。
(2)基于元路径随机游走的结点网络表示学习
由于最后仅需要得到用户与项目节点的表示,因此元路径的选择只针对用户或项目为端点的路径,并且将原始的复杂网络简化为只包含用户项目节点的二部图,然后进行随机游走策略。这样做的好处可以过滤掉无用类型的节点,避免由于参杂了过多多余类型节点产生的噪声,同时,在给定的窗口条件下,可以得到更多有用类型节点的信息,从而覆盖更全面的语义信息。与同质网络的随机游走不同,异质信息网络需要考虑不同路径下的节点类型,即游走节点类型要与元路径的节点类型一致,在此处使用Metapath2vec++算法得到节点的特征向量。
为了获得对计算节点表示更有辅助作用的节点序列,采取的游走策略应包含网络中复杂的语义与结构信息。提出将Deepwalk算法应用于元路径来产生节点序列。一个异质信息网络表示为G={V,E,T},V表示节点集合,E表示边集合,指定的元路径集合为 P={ρ1,ρ2,ρ3…ρl}其中ρl代表单条元路径。ρ:A1→A2→A3→…An, Ai表示节点类型,Ai∈Tv,ρl∈TE,并且
Figure RE-GDA0003210941480000071
游走路径可按如下的计算方式所产生:
Figure RE-GDA0003210941480000072
上式中,nt叫为随机游走经过的第t个节点,并且该节点类型为 At,nt+1代表节点nt的基于规定元路径游走的下一节点,
Figure RE-GDA0003210941480000076
代表属于At+1类型的节点集合。该策略可以基于元路径约束等概率选取与初始节点相关联的节点,根据预设的长度进行游走,最后筛选出有意义的随机游走序列。
在得到异质信息网络的随机游走序列之后,利用Metapath2vec++的 SkipGram模型对节点表示进行学习,设置节点的嵌入维度为d,模型输出结果则将用户与项目节点映射到同一个d维的空间中。其目标函数如下所示:
Figure RE-GDA0003210941480000073
Figure RE-GDA0003210941480000074
当SkipGram模型的窗口遍历到节点序列中某个位置的节点时,则v可以表示在该窗口所处位置的中间节点,
Figure RE-GDA0003210941480000075
为处于中间位置节点类型的邻接节点。
为计算方便,通常将p(ct|v;θ)映射为一个非线性的softmax函数;
Figure RE-GDA0003210941480000081
其中,xv为节点v在给定元路径下的d维特征表示,L条元路径应该有L个xv表示,节点的更新方式为下式:
Figure RE-GDA0003210941480000082
Figure RE-GDA0003210941480000083
Figure RE-GDA0003210941480000084
式(3.5)中的
Figure RE-GDA0003210941480000085
代表第i轮迭代时的负采样,
Figure RE-GDA0003210941480000086
为负采样时的先验分布。由于实际应用的异质网络中节点数目庞大,如果单纯的将与目标节点无关的节点当成负样本可能会大大降低训练速度。因此本实施例采用负采样节点考虑了节点在复杂网络的出现频率,还考虑了基于评分交互的节点度,在实际的网络交互场景中,如果一个用户对产生的交互行为很多,并且对大量项目都有评分,则应该认为该用户被选择为负样本的概率会很高。因此,计算节点u被负采样的概率公式如下:
Figure RE-GDA0003210941480000087
当节点类型为用户节点时,g(u)为网络中用户节点的度与评过分的项目数量之和,同理,当节点类型为项目节点时,则g(u)应为该节点拥有的评分数量与度之和。
二、基于元路径权重的向量融合
通过pathsim计算用户与项目的路径关联度构建连接图。
(1)构建用户—项目的邻接矩阵
首先根据步骤S02中以用户节点为端点的对称元路径,提炼出以下三种节点数目在6以内的元路径:第一种是形如UV的直接交互路径;第二种是形如UV*V的基于项目关联度的交互路径;第三张是形如U*UV的基于用户间关联度的交互路径。如,当原始元路径ρ为UVBVU时,则提炼出的交互路径
Figure RE-GDA0003210941480000091
为UVBV。如图所示,当元路径为UV时,则用户与项目的邻接矩阵为Cp0,当元路径为UVDV时,则用户与项目的链接矩阵为Cp1,矩阵中的值代表用户到该节点的实例数量。然后根据公式PathSim构建基于新的元路径的用户项目相似度邻接矩阵SCpi
Figure RE-GDA0003210941480000092
Figure RE-GDA0003210941480000093
其中
Figure RE-GDA0003210941480000094
为用户节点n*n维的相似度矩阵,
Figure RE-GDA0003210941480000095
为项目节点m*m维的相似度矩阵,它们的元素值都是根据公式PathSim计算得来。然后将所有路径的SCpi以张量的形式按位相加。
SC=SCp1+SCp2+…SCpl................(3.11)
即SC的每一个元素值SC(i,j)=SCp1(i,j)+SCp2(i,j)+…SCpl(i,j)。设
Figure RE-GDA0003210941480000104
为用户i基于元路径历史行为的度均值,即:
Figure RE-GDA0003210941480000101
N(i)表示与用户i交互过的节点个数,“i,”表示在相似度矩阵中用户i所在行。然后将小于
Figure RE-GDA0003210941480000102
的元素归零,其余设置为1,如公式(3.13) 所示。这样做可以将因偶然发生交互的路径实例减少,降低数据中的噪声。
Figure RE-GDA0003210941480000103
(2)基于注意力机制的元路径加权表示
不同的用户对同一个元路径的兴趣偏好往往也是不同的,一个用户在一条元路径上的偏好也会由于交互的项目不同二发生变化,因此用户在不同元路径中对项目的评分偏好也不同,比如用户对电影的评分偏好可能更倾向于情节类型,而不是导演,因此基于导演概念构建的元路径在全局的评分预测权重占比就要小一些。为了使图嵌入部分的输出的用户对项目的全局偏好值,本实施例采用注意力机制描述用户对项目基于不同元路径的偏好权重。
注意力机制函数通常被描述为:模型中有一组以键值对(Key—Value) 形式存储的的信息,根据输入的Query,确定Query和不同key的权重关联,然后将value按照权重叠加输出。在本实施例中,当求用户角度的路径权重时,Query为用户基于给定元路径下的d维嵌入向量,Key为项目节点全局表示,(反之则当求项目角度的路径权重时,Query为项目基于给定元路径下的 d维嵌入向量,Key为用户节点全局表示)用户与项目对于路径权重的求取互为增强表示。Value为在不同元路径条件下用户对项目的偏好。一般注意力机制的函数形式如(3.14)所示。项目与用户的权重采用了互为增强的两层感知机结构来实现协同注意力机制:
Attention(Q,K,V)=MLP(Q,KT)V··············(3.14)
Figure RE-GDA0003210941480000111
Figure RE-GDA0003210941480000112
其中(3.15)中,
Figure RE-GDA0003210941480000113
和b(1)为第一层的基于元路径的权重矩阵和偏置向量,同理,(3.16)中
Figure RE-GDA0003210941480000114
和b(2)为第二层的权重向量和偏置,
Figure RE-GDA0003210941480000115
为用户节点i基于元路径pl的表示。激活函数f(x)是Relu函数。最终的权值为通过softmax进行无量纲化后的值:
Figure RE-GDA0003210941480000116
Figure RE-GDA0003210941480000117
同理可得项目的偏好权重
Figure RE-GDA00032109414800001112
得到用户对元路径的偏好权重表示
Figure RE-GDA0003210941480000118
之后,结合用户和项目基于元路径的隐向量表示
Figure RE-GDA0003210941480000119
Figure RE-GDA00032109414800001110
可得到用户、项目基于元路径不同层面的加权全局表征:
Figure RE-GDA00032109414800001111
Figure RE-GDA0003210941480000121
yk为项目对不同用户的全局偏好表示。通过步骤S02计算用户与项目加权融合后的全局偏好,目标函数如公式(3.21)所示。
Figure RE-GDA0003210941480000122
该部分的损失函数为:
Figure RE-GDA0003210941480000123
其中SC(i,k)为真实的样本值,
Figure RE-GDA0003210941480000124
为预测值。
三、结合矩阵分解预测推荐得分
通过对评分矩阵进行分解,结合用户、项目以及全局的偏好,进而得出用户和项目的隐特征向量,评分预测可表示为式(3.23)的形式:
Figure RE-GDA0003210941480000125
其中ui表示用户的隐因子表示,
Figure RE-GDA0003210941480000126
n表示用户数量,即 i表示第i个用户;同理,
Figure RE-GDA0003210941480000127
m表示为项目数量,k表示第k个项目。在前文,已经求得了用户u和商品k基于异质信息网络的隐向量表示,因此得到改进的基于异构网络的隐因子分解模型,如下所示:
Figure RE-GDA0003210941480000128
其中
Figure RE-GDA0003210941480000129
为矩阵分解模型中用户与项目评分的结构偏好,为了更加充分的考虑异质信息网络结构特征,在评分拟合部分使用带有一定权重的结构偏好,并通过基于元路径的节点相似度HeteSim作为约束用户与项目隐语义表示的正则项。因此,MERec的目标函数可表示如下:
Figure RE-GDA0003210941480000131
在式(3.25)中,F1项为矩阵分解模型,Iik是指示函数,当原始矩阵中存在i对k的评分则为1,反之为0。由前文所知,
Figure RE-GDA0003210941480000132
为预测评分。第二项为节点网络表示学习与元路径权重学习的总体损失函数,节点表示、元路径权重与得分预测三部分所需要的信息是彼此关联、互为前提,因此需要同时进行训练,超参数α为网络表示的权重。第三项F3为辅助向量基于路径相似度的正则化项,V分别代表了特征分量e在d维空间映射的辅助向量,L是基于HeteSim相似度的拉普拉斯矩阵,下面以用户相似度为基准进行公式介绍:
Figure RE-GDA0003210941480000133
Figure RE-GDA0003210941480000134
第四项F4为防止过拟合的正则项,可以提高模型的泛化误差,β、λ分别代表 F3、F4的权重。
综上所述:本发明提供了一种融合元路径的异质网络表示推荐算法,用户对项目的评分偏好与元路径的隐特征表示有很强的关联,因此先利用随机游走策略获取基于不同元路径的节点序列,针对不同路径利用 metapath2vec++算法学习用户与项目在统一维度空间的隐向量表示,然后基于注意力机制利用多层感知机MLP学习节点对于不同元路径的偏好权重,并计算出全局表示向量,最后结合矩阵因子分解的推荐模型,利用路径结构Hetesim相似度对评分矩阵分解出的隐因子向量进行约束,对项目评分进行预测,该模型较传统矩阵分解和基于异质网络的推荐算法都有一定的提升,尤其是可以提高数据稀疏时的预测精度。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种融合元路径的异质网络表示推荐算法,其特征在于,包括以下步骤:
S01:异质信息网络上的信息抽取,基于推荐系统中用户-商品交互信息构建异质信息网络,计算网络的节点在不同元路径下的随机游走序列,并通过Metapath2vec++算法学习结点的网络表示;
S02:基于元路径权重的向量融合,将这些不同元路径下的节点表示矩阵作为输入,分别学习各个元路径的特征向量;
S03:结合矩阵分解预测推荐得分,通过注意力机制学习元路径权重,融合结点隐向量,以获得用户和商品的整体隐向量,结合矩阵分解用于推荐。
2.根据权利要求1所述的一种融合元路径的异质网络表示推荐算法,其特征在于,所述步骤S01包括以下步骤:
S011:元路径选择,元路径的选择只针对用户或项目为端点的路径;
S012:基于元路径随机游走的结点网络表示学习。
3.根据权利要求2所述的一种融合元路径的异质网络表示推荐算法,其特征在于,所述元路径选择遵循以下三点原则:
a)为了学习更加准确的用户表示和项目表示,元路径的构造要以用户(项目)为端点;
b)元路径中只包含对用户评分行为影响较大的节点类型;
c)元路径长度在四个节点之内。
4.根据权利要求3所述的一种融合元路径的异质网络表示推荐算法,其特征在于,游走路径可按如下的计算方式所产生:
Figure RE-FDA0003210941470000011
上式中,nt为随机游走经过的第t个节点,并且该节点类型为At,nt+1代表节点nt的基于规定元路径游走的下一节点,NAt+1代表属于At+1类型的节点集合。该策略可以基于元路径约束等概率选取与初始节点相关联的节点,根据预设的长度进行游走,最后筛选出有意义的随机游走序列。
5.根据权利要求4所述的一种融合元路径的异质网络表示推荐算法,其特征在于,在得到异质信息网络的随机游走序列之后,利用Metapath2vec++的SkipGram模型对节点表示进行学习,设置节点的嵌入维度为d,模型输出结果则将用户与项目节点映射到同一个d维的空间中,其目标函数如下所示:
Figure RE-FDA0003210941470000021
Figure RE-FDA0003210941470000022
6.根据权利要求5所述的一种融合元路径的异质网络表示推荐算法,其特征在于,所述步骤S02包括以下步骤:
S021:构建用户-项目的邻接矩阵;
S022:基于注意力机制的元路径加权表示。
7.根据权利要求6所述的一种融合元路径的异质网络表示推荐算法,其特征在于,步骤S021中根据公式PathSim构建基于新的元路径的用户项目相似度邻接矩阵SCpi
Figure RE-FDA0003210941470000023
Figure RE-FDA0003210941470000024
其中
Figure RE-FDA0003210941470000025
为用户节点n*n维的相似度矩阵,
Figure RE-FDA0003210941470000026
为项目节点m*m维的相似度矩阵,它们的元素值都是根据公式PathSim计算得来,然后将所有路径的SCpi以张量的形式按位相加。
SC=SCp1+SCp2+…SCpl
8.根据权利要求7所述的一种融合元路径的异质网络表示推荐算法,其特征在于,步骤S022中项目与用户的权重采用了互为增强的两层感知机结构来实现协同注意力机制:
Attention(Q,K,V)=MLP(Q,KT)V
Figure RE-FDA0003210941470000031
Figure RE-FDA0003210941470000032
其中,
Figure RE-FDA0003210941470000033
和b(1)为第一层的基于元路径的权重矩阵和偏置向量,同理,
Figure RE-FDA0003210941470000034
和b(2)为第二层的权重向量和偏置,
Figure RE-FDA0003210941470000035
为用户节点i基于元路径pl的表示。
9.根据权利要求8所述的一种融合元路径的异质网络表示推荐算法,其特征在于,步骤S03通过对评分矩阵进行分解,结合用户、项目以及全局的偏好,进而得出用户和项目的隐特征向量,评分预测可表示为以下形式:
Figure RE-FDA0003210941470000036
其中ui表示用户的隐因子表示,
Figure RE-FDA0003210941470000037
n表示用户数量,即i表示第i个用户;同理,
Figure RE-FDA0003210941470000038
m表示为项目数量,k表示第k个项目。
10.根据权利要求9所述的一种融合元路径的异质网络表示推荐算法,其特征在于,为了更加充分的考虑异质信息网络结构特征,在评分拟合部分使用带有一定权重的结构偏好,并通过基于元路径的节点相似度HeteSim作为约束用户与项目隐语义表示的正则项。
CN202110663073.9A 2021-06-15 2021-06-15 一种融合元路径的异质网络表示推荐算法 Pending CN113505294A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110663073.9A CN113505294A (zh) 2021-06-15 2021-06-15 一种融合元路径的异质网络表示推荐算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110663073.9A CN113505294A (zh) 2021-06-15 2021-06-15 一种融合元路径的异质网络表示推荐算法

Publications (1)

Publication Number Publication Date
CN113505294A true CN113505294A (zh) 2021-10-15

Family

ID=78010120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110663073.9A Pending CN113505294A (zh) 2021-06-15 2021-06-15 一种融合元路径的异质网络表示推荐算法

Country Status (1)

Country Link
CN (1) CN113505294A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114049930A (zh) * 2021-11-12 2022-02-15 东南大学 一种基于异质网络表示学习的中药药方重定位方法
CN114117232A (zh) * 2021-12-02 2022-03-01 神行太保智能科技(苏州)有限公司 节点和元路径对比学习增强的推荐方法及系统
CN114398462A (zh) * 2022-03-24 2022-04-26 之江实验室 一种基于多源异构信息网络的目的地推荐方法及系统
CN114519097A (zh) * 2022-04-21 2022-05-20 宁波大学 一种异质信息网络增强的学术论文推荐方法
CN115033803A (zh) * 2022-05-18 2022-09-09 电子科技大学 一种基于元路径的社交媒体用户推荐方法
CN115062210A (zh) * 2022-07-08 2022-09-16 天津大学 一种融合社团结构的异质网络表示学习方法
CN115795177A (zh) * 2022-11-25 2023-03-14 人民网股份有限公司 社交媒体内容推荐方法及装置
CN116502713A (zh) * 2023-04-03 2023-07-28 华中师范大学 一种基于加权元路径增强题目相似性嵌入的知识追踪方法
CN117495481A (zh) * 2023-10-25 2024-02-02 宁夏大学 一种基于异构时序图关注度网络的物品推荐方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114049930B (zh) * 2021-11-12 2024-07-16 东南大学 一种基于异质网络表示学习的中药药方重定位方法
CN114049930A (zh) * 2021-11-12 2022-02-15 东南大学 一种基于异质网络表示学习的中药药方重定位方法
CN114117232A (zh) * 2021-12-02 2022-03-01 神行太保智能科技(苏州)有限公司 节点和元路径对比学习增强的推荐方法及系统
CN114398462A (zh) * 2022-03-24 2022-04-26 之江实验室 一种基于多源异构信息网络的目的地推荐方法及系统
CN114398462B (zh) * 2022-03-24 2022-08-09 之江实验室 一种基于多源异构信息网络的目的地推荐方法及系统
CN114519097A (zh) * 2022-04-21 2022-05-20 宁波大学 一种异质信息网络增强的学术论文推荐方法
CN114519097B (zh) * 2022-04-21 2022-07-19 宁波大学 一种异质信息网络增强的学术论文推荐方法
CN115033803A (zh) * 2022-05-18 2022-09-09 电子科技大学 一种基于元路径的社交媒体用户推荐方法
CN115062210A (zh) * 2022-07-08 2022-09-16 天津大学 一种融合社团结构的异质网络表示学习方法
CN115795177A (zh) * 2022-11-25 2023-03-14 人民网股份有限公司 社交媒体内容推荐方法及装置
CN115795177B (zh) * 2022-11-25 2023-04-28 人民网股份有限公司 社交媒体内容推荐方法及装置
CN116502713A (zh) * 2023-04-03 2023-07-28 华中师范大学 一种基于加权元路径增强题目相似性嵌入的知识追踪方法
CN116502713B (zh) * 2023-04-03 2024-02-20 华中师范大学 一种基于加权元路径增强题目相似性嵌入的知识追踪方法
CN117495481A (zh) * 2023-10-25 2024-02-02 宁夏大学 一种基于异构时序图关注度网络的物品推荐方法
CN117495481B (zh) * 2023-10-25 2024-06-11 宁夏大学 一种基于异构时序图关注度网络的物品推荐方法

Similar Documents

Publication Publication Date Title
CN113505294A (zh) 一种融合元路径的异质网络表示推荐算法
Yang et al. Click-through rate prediction in online advertising: A literature review
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
Wang et al. Relational deep learning: A deep latent variable model for link prediction
CN112184391B (zh) 一种推荐模型的训练方法、介质、电子设备和推荐模型
CN112950324B (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN112529168A (zh) 一种基于gcn的属性多层网络表示学习方法
CN113807422B (zh) 融合多特征信息的加权图卷积神经网络评分预测模型
CN112925977A (zh) 一种基于自监督图表征学习的推荐方法
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN112800344B (zh) 一种基于深度神经网络的电影推荐方法
CN111949885B (zh) 一种面向旅游景点的个性化推荐方法
CN113918833A (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN112948625A (zh) 一种基于属性异质信息网络嵌入的电影推荐方法
CN113918834A (zh) 融合社交关系的图卷积协同过滤推荐方法
CN114817508A (zh) 融合稀疏图和多跳注意力的会话推荐系统
Pham et al. Unsupervised training of Bayesian networks for data clustering
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
Chen et al. Poverty/investment slow distribution effect analysis based on Hopfield neural network
Pham et al. An approach to semantic-aware heterogeneous network embedding for recommender systems
CN110659363A (zh) 基于膜计算的Web服务混合进化聚类方法
Niknam et al. DyVGRNN: DYnamic mixture variational graph recurrent neural networks
CN113204522A (zh) 基于结合生成对抗网络的哈希算法的大规模数据检索方法
Zhou et al. Online recommendation based on incremental-input self-organizing map

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination