CN115221413B - 一种基于交互式图注意力网络的序列推荐方法及系统 - Google Patents
一种基于交互式图注意力网络的序列推荐方法及系统 Download PDFInfo
- Publication number
- CN115221413B CN115221413B CN202210929033.9A CN202210929033A CN115221413B CN 115221413 B CN115221413 B CN 115221413B CN 202210929033 A CN202210929033 A CN 202210929033A CN 115221413 B CN115221413 B CN 115221413B
- Authority
- CN
- China
- Prior art keywords
- node
- graph
- representation
- vector
- graphs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于交互式图注意力网络的序列推荐方法及系统。首先将每个用户和每个物品表示为一个属性图,通过对属性图的建模获取用户和物品的动态特征;其次,利用图注意力网络自适应地为当前节点的邻居节点分配不同的权重值参与计算,捕获潜在非交互用户的信息,实现动态学习高阶特征和新节点的表示;最后,聚合每个用户的邻居图的各种信息,并捕获相似用户的嵌入,通过信息聚合和图形匹配,获得预测的输出结果y′,有效解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题,实现了能够动态地精确地向用户推荐目标物品的技术效果。
Description
技术领域
本发明涉及推荐方法技术领域,尤其涉及一种基于交互式图注意力网络的序列推荐方法及系统。
背景技术
推荐系统,是一种以向用户呈现个性化信息为目标的过滤系统,可以提高用户体验及企业利润。利用历史数据进行预测任务,一直是许多基于机器学习的推荐系统的基石。传统的推荐系统都是以一种静态的方式建模用户和物品之间的交互并且只能捕获用户广义的喜好,而无法动态地精确地捕获用户的喜好,从而无法动态地精确地向用户推荐目标物品。
发明内容
本发明通过提供一种基于交互式图注意力网络的序列推荐方法及系统,解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题,实现了能够动态地精确地向用户推荐目标物品的技术效果。
本发明提供了一种基于交互式图注意力网络的序列推荐方法,包括:
构建用户属性图和物品属性图;
将所述用户属性图中的节点特征ci和所述物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi;
在两个图之间进行节点匹配得到节点匹配结果sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si;
将所述内部传递信息wi、所述最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c′i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG;
具体来说,所述将所述用户属性图中的节点特征ci和所述物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi,包括:
通过wij=fm(ci,cj)得到节点对(i,j)交互建模的结果wij;其中,是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的值,xj是与对应的值,wij是节点对(i,j)交互建模的结果;
具体来说,所述采用注意力机制学习边的权值αij,将每个邻居节点hj对于节点hi的重要性进行建模,包括:
通过公式得到抽象的特征表示其中,α使用单层的前馈神经网络实现,总的计算过程为:其中,是注意力函数,具体表述为: 是前馈神经网络α的参数,LeakyReLU是前馈神经网络的激活函数,R是实数集合,R2d′是2d′维的实数向量,Wh∈Rd′×d是可训练的权值矩阵,Rd′×d是d′行d列的实数矩阵;
其中, rit=σWrh+Urhit-1+br;Wz、Wr、Wh、Uz、Ur和Uh是更新函数门控递归单元的权重参数,bz、br和bh是偏置参数,和分别是更新门向量和复位门向量,K是多头注意力头的数量,是k头归一化注意力权重,||是串联操作。
具体来说,所述将所述内部传递信息wi、所述最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c′i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG,包括:
通过c′i=ffuse(ci,wi,si)融合得到融合后的节点表示c′i;
其中,GU是所述用户属性图表示,GI是所述物品属性图表示,VU是所述用户属性图的节点集,VI是所述物品属性图的节点集;
本发明还提供了一种基于交互式图注意力网络的序列推荐系统,包括:
属性图构建模块,用于构建用户属性图和物品属性图;
聚合模块,用于将所述用户属性图中的节点特征ci和所述物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi;
求和模块,用于在两个图之间进行节点匹配得到节点匹配结果sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si;
融合模块,用于将所述内部传递信息wi、所述最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c′i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG;
具体来说,所述聚合模块,包括:
交互建模单元,用于通过wij=fm(ci,cj)得到节点对(i,j)交互建模的结果wij;其中, 是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的值,xj是与对应的值,wij是节点对(i,j)交互建模的结果;
具体来说,所述重要性建模模块,具体用于通过公式得到抽象的特征表示其中,α使用单层的前馈神经网络实现,总的计算过程为:其中,是注意力函数,具体表述为:是前馈神经网络α的参数,LeakyReLU是前馈神经网络的激活函数,R是实数集合,R2d′是2d′维的实数向量,Wh∈Rd ′×d是可训练的权值矩阵,Rd′×d是d′行d列的实数矩阵;
所述节点特征更新模块,具体用于通过公式 得到输出其中, Wz、Wr、Wh、Uz、Ur和Uh是更新函数门控递归单元的权重参数,bz、br和bh是偏置参数,和分别是更新门向量和复位门向量,K是多头注意力头的数量,是k头归一化注意力权重,||是串联操作。
具体来说,所述融合模块,包括:
第一融合单元,用于通过c′i=ffuse(ci,wi,si)融合得到融合后的节点表示c′i;
具体来说,所述图形匹配模块,包括:
本发明中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提出了一种基于GAT的新型自适应图交互框架模型AGIF-GAT(SequenceRecommendation Based on Interactive Graph Attention Network),首先将每个用户和每个物品表示为一个属性图,通过对属性图的建模获取用户和物品的动态特征;其次,利用图注意力网络(GAT)自适应地为当前节点的邻居节点分配不同的权重值参与计算,捕获潜在非交互用户的信息,实现动态学习高阶特征和新节点的表示;最后,聚合每个用户的邻居图的各种信息,并捕获相似用户的嵌入(这些用户在特定时间之前评估或与同一物品进行过交互),通过信息聚合和图形匹配,获得最终的预测输出y′,有效解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题,实现了能够动态地精确地向用户推荐目标物品的技术效果。
技术效果
1)将每个用户和每个物品表示为一个属性图,并以端到端的方式分别对属性图建模,区分了用户和物品之间的交互方式,例如内部信息传递、信息传递和信息交叉交互等。
2)本发明实施例提出了一种基于GAT的新型自适应图交互框架AGIF-GAT,它可以为相邻节点分配不同的权重,从而区分每个节点的重要性并捕获相似用户的高阶结构信息。
3)本发明实施例分别聚合了三种形式的信息传递结果,考虑了多通道的信息传递因素。
4)与传统的推荐任务不同,本发明实施例中的序列推荐能够捕获用户在发展过程中的动态偏好,将用户和物品的交互建模为一个动态的序列并且利用序列的依赖性和结构性的共生关系,以及丰富的序列模式,使得用户更快速高效地根据自己的喜好过滤和定位信息。
附图说明
图1为本发明实施例提供的基于交互式图注意力网络的序列推荐方法的流程图;
图2为本发明实施例提供的基于交互式图注意力网络的序列推荐方法的原理图;
图3为本发明实施例不同数据集在不同网络层数和不同节点属性嵌入维度下的推荐精度对比曲线图;
图4为本发明实施例提供的基于交互式图注意力网络的序列推荐系统的模块图。
具体实施方式
本发明实施例通过提供一种基于交互式图注意力网络的序列推荐方法及系统,解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题,实现了能够动态地精确地向用户推荐目标物品的技术效果。
本发明实施例中的技术方案为解决上述技术问题,总体思路如下:
步骤1:构建数据结构构建及属性图建模。
步骤2:节点间的内部信息传递。将步骤1中属性图中的节点特征ci,cj通过MLP函数fm(·,·)计算得到节点对(i,j)交互建模的结果wij,并将所有交互建模结果聚合得到内部传递信息wi。
步骤3:基于注意力网络的交叉信息传递。
2)采用注意力机制学习边的权值αij,并将每个邻居节点hj对于节点hi的重要性进行建模。
5)在两个图之间进行节点匹配得到sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si。
步骤4:信息融合与图形匹配。将步骤2和步骤3中得到的内部传递信息wi、两图之间的节点交互信息si与节点的自有信息ci通过函数ffuse融合得到c′i。使用元素相加的方法来聚合节点得到fG。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
参见图1和图2,本发明实施例提供的基于交互式图注意力网络的序列推荐方法,包括:
步骤S110:构建用户属性图和物品属性图;
步骤S120:将用户属性图中的节点特征ci和物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi;
对本步骤进行具体说明,将用户属性图中的节点特征ci和物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi,包括:
通过wij=fm(ci,cj)得到节点对(i,j)交互建模的结果wij;其中,每个属性的嵌入向量都被设置为一个随机向量,是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的值,xj是与对应的值,wij是节点对(i,j)交互建模的结果;
具体地,采用注意力机制学习边的权值αij,将每个邻居节点hj对于节点hi的重要性进行建模,包括:
通过公式得到抽象的特征表示其中,α使用单层的前馈神经网络实现,总的计算过程为:其中,是注意力函数,具体表述为: 是前馈神经网络α的参数,LeakyReLU是前馈神经网络的激活函数,R是实数集合,R2d′是2d′维的实数向量,Wh∈Rd′×d是可训练的权值矩阵,Rd′×d是d′行d列的实数矩阵。
其中, Wz、Wr、Wh、Uz、Ur和Uh是更新函数门控递归单元的权重参数,bz、br和bh是偏置参数,和分别是更新门向量和复位门向量,K是多头注意力头的数量,是k头归一化注意力权重,||是串联操作。
步骤S150:在两个图之间进行节点匹配得到节点匹配结果sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si;
步骤S160:将内部传递信息wi、最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c′i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG;
对本步骤进行具体说明,本发明实施例利用一种有效的递归神经网络模型GRU作为该融合函数ffuse参与计算,得到融合后的节点表示c′i。随后,每个图的融合节点表示c′i被聚合为图表示,使用逐元素求和方法来聚合节点表示,得到最终聚合后的节点表示fG。具体地,将内部传递信息wi、最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c′i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG,包括:
通过c′i=ffuse(ci,wi,si)融合得到融合后的节点表示c′i;
其中,GU,GI分别是用户属性图表示和物品属性图表示,VU是用户属性图的节点集,VI是物品属性图的节点集;
下面对本发明实施例进行更具体的说明:
步骤1:数据结构构建
对于每个训练数据(Xn,yn),都包含在具有输入输出对的数据集D中:D={(Xn,yn)}1≤n≤N,yn是输出的预测值即用户点击的概率,数据样本Xn表示为:当用户与物品有交互记录即记录在这个数据样本中时,Xn值为1,否则为0。其中p表示属性特征,x是其对应的值,和分别代表用户属性特征价值对和物品属性特征价值对,分别代表用户属性的集合和物品属性的集合,J是数据集D中所有特征的索引集。
步骤2:数据结构构建
对于每个属性特征p∈JU∪JI,首先被表示为交互建模的d维空间Rd的初始嵌入向量ve,从而构建一个作为嵌入查询表的参数矩阵。对于具有相同属性p的数据样本可共享该属性的嵌入向量其次,对于一个用户特征价值对(p,x),对应的特征向量(特征价值对的表示)CU计算公式为同理,物品所对应的特征向量CI被计算为 是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的不同的值,xj是与对应的值。最后,利用同一数据样本中两个属性特征C1和C2的交互作用建模。当C1和C2同时出现在一个数据样本中时,说明两属性特征存在交互。具体表示为交互函数:
f(C1,C2):R2×d→Rl (1)
其中,C1和C2是在同一个数据样本中的特征价值对表示,l表示输出的维度。对于用户和物品属性特征集在不同数据样本中可能不同,因此不同数据样本中指定的交互作用可能不同。并且由于每个属性都可能出现在多个数据样本中(具有不同的值),不同数据样本中的交互信息的协作将有助于发现从未共同出现过的属性之间的交互。
步骤3:用户和物品属性图构建
对于一个数据样本N可构成一个图GN(VN,EN):
Vertices:VN={vi}1≤i≤N是由N个节点组成的集合,每个节点都被初始化为相应的序列编码特征向量vi,节点的第一层状态向量可以表示为V=(v1,…,vN),用户(物品)序列中的每一个代表属性的节点i都表示为用户(物品)属性图的一个节点特征表示因此,本发明实施例将用户、物品属性图的节点集分别表示为
Edges:每条边的权重反映了不同特征相互作用的重要性。E=(e1,…,eN),E∈RN×N表示包含节点间邻接信息的边的集合。当节点i和j之间构成一条边(即存在有益的特征互动)时,Eij=1,否则Eij=0。Eij表示一组边互动值,是节点间邻接信息的边的集合,节点i,j也称为邻居节点。图中的每对节点都与一条边连接,以表示两个属性之间的成对交互。通过边的交互实现用户及物品特征从邻居节点传播到当前节点的过程。
每个用户属性图和物品属性图分别表示为GU=<VU,EU>,其中EU包含用户属性图中所有边的边集。由于考虑所有成对属性特征交互,因此用户属性图是一个完整的图。对物品属性执行相同的转换,得到物品属性图GI=<VI,EI>,EI包含用户属性图中所有边的边集。
步骤4:节点间内部信息的传递
使用MLP对每个内部交互进行建模,然后将交互建模结果聚合为内部节点信息传递。一个MLP函数fm(·,·):R2×d→Rl,将一对用于边缘预测的节点嵌入作为输入,并输出交互建模结果,具体表示为:
wij=fm(ci,cj) (2)
其中,wi∈Rd,Ni表示在图内包括节点i在内的邻居节点集。本发明实施例利用了图结构的特点通过节点间边的连接性质进行显示建模,结合非线性建模多层感知机层与层之间的全连接尽可能多的获取相关信息,从而实现节点间信息的反复传递、更新与丰富。
步骤5:基于注意力网络的交叉信息传递
利用图注意力网络(GAT)进行特征提取并对两个图之间节点匹配进行交互建模。通过GAT将其他邻域的信息特征传播给当前节点,自动确定当前节点与其邻域之间的重要性和相关性。本发明实施例采用GAT对图中节点、边及它们的交互信息一起集成到一个统一的图形交互体系结构中,并进行更新。具体实现如下:
对于具有N个节点的图,单层GAT的初始节点特征可表示为H=[h1,h2,…,hN],hi∈Rd作为输入,目的是得到更加抽象的特征表示作为模型输出。其中,t表示节点间消息传递的次数。由于每条边上的交互重要性是不同的,因而需要实现沿边的交互,这要求每条边都有一个独特的权值和变换函数。在节点表征上实现的图注意力操作可以写成:
其中,Ni是图中节点i(包括i)的邻居节点集,d和d′是输入和输出维度;Wh∈Rd′×d是可训练的权值矩阵,σ代表非线性激活函数,用于使权重在不同节点之间易于比较。由于需要推断不同节点间交互的重要性,上式中的权重αij是通过注意力过程计算的,该过程模拟了每个邻居节点hj对于节点hi的重要性。具体表示为:
其中,K是多头注意力头的数量,是k头归一化注意力权重,||是串联操作。最后,节点的状态向量通过初始节点特征hi和其在最后一步的隐藏状态实现门控循环神经网络GRU的更新操作,得到输出具体表示为:详细公式化为:
其中,Wz、Wr、Wh、Uz、Ur和Uh是更新函数门控递归单元的权重参数,bz、br和bh是偏置参数,和分别是更新门向量和复位门向量。对于每个GRU单元,它在隐藏状态上应用图神经网络进行信息传播并产生下一帧的状态。
本发明实施例在一个统一的图形交互框架中对用户和物品信息源进行建模,显式的利用节点i与另一信息源节点j之间交互信息进行构建。故在两个图之间进行节点匹配可建模表示为:
其中,代表用户图中节点i的嵌入特征且代表物品图中节点j的嵌入特征且sij代表来自不同图形的两个节点的节点匹配结果,⊙表示各元素对应相乘操作。与节点内部信息传递相似,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si:
为了融合图中各节点的自有信息ci、内部关联信息wi以及两图之间的节点交互信息si,本发明实施例使用融合函数ffuse∈R3×d→Rd,使各部分信息整合在一起。将输入信息通过GRU根据聚合的信息和历史信息更新其节点状态,获得c′i=ffuse(ci,wi,si)。使用元素相加的方法来聚合节点,从而将每个图的融合节点表示聚合为图表示。具体公式表达为fG:
训练
在训练时,本发明实施例使用L2准则来规范模型的所有参数。因此,损失函数表示为:
本发明实施例的相关实验基于Python 3.7及以上版本和Pytorch 1.6.0或更高版本,运行环境版本需Anaconda 3-2020.02及以上。
主要的数据包包括cuda v10.1、cudnn 10.1、pytorch v1.6.0、torch-scatter、torch-sparse、torch-cluster、torch-spline-conv、torch-geometric==1.4.3、pandas==1.1.2、scikit-learn==0.23.2、icecream==2.1.0等。
1.数据描述
本发明实施例在三个公开数据集上进行了实验,分别是:电影评分数据集(MovieLens 1M)、图书评分数据集(Bookcrossing)和淘宝数据集(Taobao)。
(1)电影评分数据集:是一组电影评分数据,包含电影数据、用户数据等。本发明实施例通过将评分标记为0或1将来自该数据集的显示反馈转换为隐式数据,定义用户是否对物品进行评分。每个数据实例都是一个图,节点是用户ID或电影ID,边表示节点和底层特征之间的关系。
(2)图书评分数据集:包含用户对书籍的隐式和显式评分。每个数据样本包括用户、书籍及其属性,例如书名、书名、作者等。
(3)淘宝数据集:该数据集包含有关淘宝在页面上显示的广告点击的数据。每一个数据样本都包含一个特定的用户,对应的属性有性别、年龄、地区等,还有一个可区分的广告信息,如广告物品类别、代言人、品牌等。如果用户与广告之间发生了点击事件,则意味着表示有物品交互,点击事件标记为1,否则为0。
2.评价指标
本发明实施例采用二元交叉熵作为损失函数,可以很好地衡量模型训练后真实数据与预测数据的相似度。由于是非负的且权重更新仅受误差影响(误差率与权重更新成正比),因此使用sigmoid函数可以很好地避免均方误差损失的学习率降低的问题梯度下降过程中的函数。在本发明实施例中,每个数据集以6:2:2的比例随机分为训练集、验证集和测试集。使用Adam结合一阶动量和二阶动量来自动调整参数的学习率,即自适应动量的随机优化方法优化函数,并使用曲线下面积(AUC)和归一化折损累计增益(NDCG@k,@k表示如果在模型的预测结果中,前k个最高概率的类中有真值,就认为模型预测成功)作为评估指标来评估本发明实施例的模型和基线模型的性能。评价指标与模型性能成正比,评价指标越高,性能越好。
3.参数设置
具体的超参数设置如表1所示。
表1模型的超参数
4.与其他模型比较的实验结果
为了证明本发明实施例提出的方法的有效性,本发明实施例与以下的方法进行了对比,且实验结果如表2所示。
(1)FM:使用点乘法来计算和建模每个特征的交互,对稀疏数据有很好的学习能力。
(2)NFM:一种串行架构,将FM与神经网络相结合,以提高FM捕获特征之间多阶交互信息的能力,使用MLP代替FM的点乘方法。
(3)AutoInt:将原始稀疏高维特征向量映射到低维空间,使用多头自注意神经网络对特征交互进行显式建模。
(4)Fi-GNN:每个特征图由数据样本组成,图中每个节点代表一个特征场,采用多头自注意力方法建模。
(5)NGCF:一种基于图的CF方法,广泛遵循标准GCN,在消息传递过程中将二阶特征交互编码到消息中,并在用户-物品交互上利用三层GNN网络,旨在对邻域进行建模最多三个订单的信息。
(6)GMCF:一种基于图的CF方法,它使用交互建模的MLP结构进行模型内部交互建模,分别构建用户和物品属性图。
(7)KGAT:基于协作知识图的建模,使用图卷积的形式递归挖掘高阶连通性信息并将实体的初始表示向外传播以运行实体以获得隐式反馈,例如邻域信息。
5.实验结果分析
实验结果表明本发明实施例AGIF-GAT相比电影数据集更好地提高了书籍和淘宝的性能,这表明AGIF-GAT可以很好地处理稀疏数据。FM模型效果最差,因为仅使用点积计算不足以有效捕捉信息特征;NFM受FM启发,使用MLP代替点乘,实验效果较FM结果有明显提升,证明了MLP计算方法的有效性;AutoInt和Fi-GNN模型结合多头自注意力神经网络对属性特征进行建模,有效提高了模型捕捉特征间多阶交互信息的能力。实验结果表明,本发明实施例可以有效提高模型的准确率和表达能力。
表2与基线比较的结果总结
6.节点维度和网络层研究
本发明实施例尝试使用不同数量的网络层和不同维度的节点表示来评估所提出的AGIF-GAT的性能。图3使用折线图反馈AGIF-GAT模型在节点表示维度64、128和256上的推荐准确度。不同数量的网络层(单层GAT、双层GAT、三层GAT)推荐结果。在图3中可以清楚地观察到,当节点维数为128时,模型达到了最佳性能。低维可能会出现参数不足等问题,而高维则需要拟合更多的参数,这可能会导致过拟合等其他问题。表示模型需要匹配适当的节点尺寸以获得最佳性能。此外,该模型并没有随着GAT网络层数的加深而取得更好的性能,还可能存在过拟合问题。也说明单层GAT足以满足节点间交叉交互的信息传递需求。
参见图4,本发明实施例提供的基于交互式图注意力网络的序列推荐系统,包括:
属性图构建模块100,用于构建用户属性图和物品属性图;
聚合模块200,用于将用户属性图中的节点特征ci和物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi;
具体地,聚合模块200,包括:
交互建模单元,用于通过wij=fm(ci,cj)得到节点对(i,j)交互建模的结果wij;其中, 每个属性的嵌入向量都被设置为一个随机向量,是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的值,xj是与对应的值,wij是节点对(i,j)交互建模的结果;
重要性建模模块300,用于单层GAT的初始节点特征表示为H=[h1,h2,…,hN],实现图注意力操作的节点表征表示为采用注意力机制学习边的权值αij,将每个邻居节点hj对于节点hi的重要性进行建模;
具体地,重要性建模模块300,具体用于通过公式得到抽象的特征表示其中,α使用单层的前馈神经网络实现,总的计算过程为:其中,是注意力函数,具体表述为:αT∈R2d′是前馈神经网络α的参数,LeakyReLU是前馈神经网络的激活函数,R是实数集合,R2d′是2d′维的实数向量,Wh∈Rd′×d是可训练的权值矩阵,Rd′×d是d′行d列的实数矩阵。
具体地,节点特征更新模块400,具体用于通过公式 得到输出其中, Wz、Wr、Wh、Uz、Ur和Uh是更新函数门控递归单元的权重参数,bz、br和bh是偏置参数,和分别是更新门向量和复位门向量,K是多头注意力头的数量,是k头归一化注意力权重,||是串联操作。
求和模块500,用于在两个图之间进行节点匹配得到节点匹配结果sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si;
融合模块600,用于将内部传递信息wi、最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c′i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG;
本发明实施例利用一种有效的递归神经网络模型GRU作为该融合函数ffuse参与计算,得到融合后的节点表示c′i。随后,每个图的融合节点表示c′i被聚合为图表示,使用逐元素求和方法来聚合节点表示,得到最终聚合后的节点表示fG。具体地,融合模块600,包括:
第一融合单元,用于通过c′i=ffuse(ci,wi,si)融合得到融合后的节点表示c′i;
具体地,图形匹配模块700,包括:
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种基于交互式图注意力网络的序列推荐方法,其特征在于,包括:
构建用户属性图和物品属性图;
将所述用户属性图中的节点特征ci和所述物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi;
具体地,所述将所述用户属性图中的节点特征ci和所述物品属性图中的节点特征cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi,包括:
通过wij=fm(ci,cj)得到节点对(i,j)交互建模的结果wij;其中, 是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的值,xj是与对应的值,wij是节点对(i,j)交互建模的结果;
在两个图之间进行节点匹配得到节点匹配结果sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si;
将所述内部传递信息wi、所述最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c’i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG;
其中,GU是所述用户属性图表示,GI是所述物品属性图表示,VU是所述用户属性图的节点集,VI是所述物品属性图的节点集;
2.如权利要求1所述的方法,其特征在于,所述采用注意力机制学习边的权值αij,将每个邻居节点hj对于节点hi的重要性进行建模,包括:
通过公式得到抽象的特征表示其中,α使用单层的前馈神经网络实现,总的计算过程为:其中,是注意力函数,具体表述为:αT∈R2d′是前馈神经网络α的参数,LeakyReLU是前馈神经网络的激活函数,R是实数集合,R2d’是2d’维的实数向量,Wh∈Rd′×d是可训练的权值矩阵,Rd′×d是d′行d列的实数矩阵;
4.一种基于交互式图注意力网络的序列推荐系统,其特征在于,包括:
属性图构建模块,用于构建用户属性图和物品属性图;
聚合模块,用于将所述用户属性图中的节点特征ci和所述物品属性图中的节点特征Cj通过MLP函数fm(·,·)计算,得到节点对(i,j)交互建模的输出结果wij,并将每个节点所有交互建模结果聚合得到内部传递信息wi;
具体地,所述聚合模块,包括:
交互建模单元,用于通过wij=fm(ci,cj)得到节点对(i,j)交互建模的结果wij;其中, 是用户对应交互建模的d维空间Rd的初始嵌入向量,是物品对应交互建模的d维空间Rd的初始嵌入向量,xi是与对应的值,xj是与对应的值,wij是节点对(i,j)交互建模的结果;
求和模块,用于在两个图之间进行节点匹配得到节点匹配结果sij,将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果si;
融合模块,用于将所述内部传递信息wi、所述最终两图交互的信息传递结果si和节点的自有信息ci通过函数ffuse融合得到融合后的节点表示c’i,将每个图的融合节点表示c′i聚合为图表示,得到最终聚合后的节点表示fG;
具体地,所述图形匹配模块,包括:
5.如权利要求4所述的系统,其特征在于,所述重要性建模模块,具体用于通过公式得到抽象的特征表示其中,α使用单层的前馈神经网络实现,总的计算过程为:其中,是注意力函数,具体表述为:αT∈R2d′是前馈神经网络α的参数,LeakyReLU是前馈神经网络的激活函数,R是实数集合,R2d′是2d′维的实数向量,Wh∈Rd′×d是可训练的权值矩阵,Rd′×d是d′行d列的实数矩阵;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210929033.9A CN115221413B (zh) | 2022-08-03 | 2022-08-03 | 一种基于交互式图注意力网络的序列推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210929033.9A CN115221413B (zh) | 2022-08-03 | 2022-08-03 | 一种基于交互式图注意力网络的序列推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115221413A CN115221413A (zh) | 2022-10-21 |
CN115221413B true CN115221413B (zh) | 2023-04-14 |
Family
ID=83615191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210929033.9A Active CN115221413B (zh) | 2022-08-03 | 2022-08-03 | 一种基于交互式图注意力网络的序列推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115221413B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114610950B (zh) * | 2020-12-04 | 2023-11-07 | 中山大学 | 一种图网络节点表示方法 |
CN116992099B (zh) * | 2023-09-27 | 2024-01-12 | 湖北工业大学 | 一种基于交互选择的图神经网络推荐方法、系统及终端 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111782765A (zh) * | 2020-06-24 | 2020-10-16 | 安徽农业大学 | 一种基于图注意力机制的推荐方法 |
CN112084407B (zh) * | 2020-09-08 | 2024-03-12 | 辽宁工程技术大学 | 一种融合图神经网络和注意力机制的协同过滤推荐方法 |
CN112148975A (zh) * | 2020-09-21 | 2020-12-29 | 北京百度网讯科技有限公司 | 会话推荐方法、装置及设备 |
CN112256980A (zh) * | 2020-10-23 | 2021-01-22 | 辽宁工程技术大学 | 一种基于动态图注意力网络的多关系协同过滤推荐 |
CN112905900B (zh) * | 2021-04-02 | 2023-11-17 | 辽宁工程技术大学 | 基于图卷积注意力机制的协同过滤推荐方法 |
CN114048331A (zh) * | 2021-12-01 | 2022-02-15 | 浙江师范大学 | 一种基于改进型kgat模型的知识图谱推荐方法及系统 |
CN114579852A (zh) * | 2022-02-28 | 2022-06-03 | 北京工业大学 | 一种基于图卷积网络与注意力机制的推荐方法 |
-
2022
- 2022-08-03 CN CN202210929033.9A patent/CN115221413B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115221413A (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | HAGERec: Hierarchical attention graph convolutional network incorporating knowledge graph for explainable recommendation | |
CN115221413B (zh) | 一种基于交互式图注意力网络的序列推荐方法及系统 | |
CN112529168B (zh) | 一种基于gcn的属性多层网络表示学习方法 | |
Mongia et al. | Deep latent factor model for collaborative filtering | |
CN110347932B (zh) | 一种基于深度学习的跨网络用户对齐方法 | |
Wan et al. | Deep matrix factorization for trust-aware recommendation in social networks | |
CN110619081A (zh) | 一种基于交互图神经网络的新闻推送方法 | |
Jiang et al. | Enhancing social recommendation via two-level graph attentional networks | |
CN111881350A (zh) | 一种基于混合图结构化建模的推荐方法与系统 | |
CN111881363A (zh) | 一种基于图交互网络的推荐方法 | |
Bianchini et al. | Deep learning in science | |
Liu et al. | Non-linear cross-domain collaborative filtering via hyper-structure transfer | |
CN116431914A (zh) | 一种基于个性化偏好转移模型的跨域推荐方法及系统 | |
Hu et al. | Learning peer recommendation using attention-driven CNN with interaction tripartite graph | |
CN112784118A (zh) | 一种对三角形结构敏感的图中的社区发现方法和装置 | |
Yu et al. | Collaborative group embedding and decision aggregation based on attentive influence of individual members: A group recommendation perspective | |
Chen et al. | Integrating User-Group relationships under interest similarity constraints for social recommendation | |
Zhou et al. | Unsupervised multiple network alignment with multinominal gan and variational inference | |
Wang et al. | Who are the best adopters? User selection model for free trial item promotion | |
Wu et al. | Heterogeneous representation learning and matching for few-shot relation prediction | |
Bourhim et al. | A community-driven deep collaborative approach for recommender systems | |
Mendelevitch et al. | Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale | |
Chang et al. | GraphRR: A multiplex Graph based Reciprocal friend Recommender system with applications on online gaming service | |
Sangeetha et al. | Predicting personalized recommendations using GNN | |
CN115599990A (zh) | 一种知识感知结合深度强化学习的跨域推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |