CN115221413B

CN115221413B - 一种基于交互式图注意力网络的序列推荐方法及系统

Info

Publication number: CN115221413B
Application number: CN202210929033.9A
Authority: CN
Inventors: 陈建峡; 刘琦; 张姝曦; 潘立纬; 刘畅; 余天赐; 马忠宝
Original assignee: Hubei University of Technology
Current assignee: Hubei University of Technology
Priority date: 2022-08-03
Filing date: 2022-08-03
Publication date: 2023-04-14
Anticipated expiration: 2042-08-03
Also published as: CN115221413A

Abstract

本发明公开了一种基于交互式图注意力网络的序列推荐方法及系统。首先将每个用户和每个物品表示为一个属性图，通过对属性图的建模获取用户和物品的动态特征；其次，利用图注意力网络自适应地为当前节点的邻居节点分配不同的权重值参与计算，捕获潜在非交互用户的信息，实现动态学习高阶特征和新节点的表示；最后，聚合每个用户的邻居图的各种信息，并捕获相似用户的嵌入，通过信息聚合和图形匹配，获得预测的输出结果y′，有效解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题，实现了能够动态地精确地向用户推荐目标物品的技术效果。

Description

一种基于交互式图注意力网络的序列推荐方法及系统

技术领域

本发明涉及推荐方法技术领域，尤其涉及一种基于交互式图注意力网络的序列推荐方法及系统。

背景技术

推荐系统，是一种以向用户呈现个性化信息为目标的过滤系统，可以提高用户体验及企业利润。利用历史数据进行预测任务，一直是许多基于机器学习的推荐系统的基石。传统的推荐系统都是以一种静态的方式建模用户和物品之间的交互并且只能捕获用户广义的喜好，而无法动态地精确地捕获用户的喜好，从而无法动态地精确地向用户推荐目标物品。

发明内容

本发明通过提供一种基于交互式图注意力网络的序列推荐方法及系统，解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题，实现了能够动态地精确地向用户推荐目标物品的技术效果。

本发明提供了一种基于交互式图注意力网络的序列推荐方法，包括：

构建用户属性图和物品属性图；

将所述用户属性图中的节点特征c_i和所述物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i,j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i；

单层GAT的初始节点特征表示为H＝[h₁,h₂,…,h_N]，实现图注意力操作的节点表征表示为

采用注意力机制学习边的权值α_ij，将每个邻居节点h_j对于节点h_i的重要性进行建模；

节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

实现门控循环神经网络GRU的更新操作，得到更新后的节点特征

在两个图之间进行节点匹配得到节点匹配结果s_ij，将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果s_i；

将所述内部传递信息w_i、所述最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c′_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G；

通过f_G(·,·)函数获得所述用户属性图和所述物品属性图的向量表示

和

并在两个图形上使用点积函数f(·,·)来匹配两个图形，最终获得预测的输出结果y′。

具体来说，所述将所述用户属性图中的节点特征c_i和所述物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i,j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i，包括：

通过w_ij＝f_m(c_i,c_j)得到节点对(i,j)交互建模的结果w_ij；其中，

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的值，x_j是与

对应的值，w_ij是节点对(i,j)交互建模的结果；

通过

将每个节点对对应的所有交互建模结果聚合得到最终的内部传递信息w_i；其中，N_i表示在图内包括节点i在内的邻居节点集。

具体来说，所述采用注意力机制学习边的权值α_ij，将每个邻居节点h_j对于节点h_i的重要性进行建模，包括：

通过公式

得到抽象的特征表示

其中，α使用单层的前馈神经网络实现，总的计算过程为：

其中，

是注意力函数，具体表述为：

是前馈神经网络α的参数，LeakyReLU是前馈神经网络的激活函数，R是实数集合，R^2d′是2d′维的实数向量，W_h∈R^d′×d是可训练的权值矩阵，R^d′×d是d′行d列的实数矩阵；

所述节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

包括：

通过公式

得到输出

其中，

rit＝σWrh+Urhit-1+br；Wz、Wr、Wh、Uz、Ur和Uh是更新函数门控递归单元的权重参数，b_z、b_r和b_h是偏置参数,

和

分别是更新门向量和复位门向量，

K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。

具体来说，所述将所述内部传递信息w_i、所述最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c′_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G，包括：

通过c′_i＝f_fuse(c_i,w_i,s_i)融合得到融合后的节点表示c′_i；

通过

融合得到最终融合后的节点表示f_G；其中，

是与当前图存在交互行为的另一个属性图的节点集。

具体来说，所述通过f_G(·,·)函数获得所述用户属性图和所述物品属性图的向量表示

和

并在两个图形上使用点积函数f(·,·)来匹配两个图形，最终获得预测的输出结果y′，包括：

通过

和

计算得到所述用户属性图和所述物品属性图的向量表示

和

其中，G^U是所述用户属性图表示,G^I是所述物品属性图表示，V^U是所述用户属性图的节点集,V^I是所述物品属性图的节点集；

通过

计算得到所述预测的输出结果y′。

本发明还提供了一种基于交互式图注意力网络的序列推荐系统，包括：

属性图构建模块，用于构建用户属性图和物品属性图；

聚合模块，用于将所述用户属性图中的节点特征c_i和所述物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i,j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i；

重要性建模模块，用于单层GAT的初始节点特征表示为H＝[h₁,h₂,…,h_N]，实现图注意力操作的节点表征表示为

节点特征更新模块，用于节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

求和模块，用于在两个图之间进行节点匹配得到节点匹配结果s_ij，将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果s_i；

融合模块，用于将所述内部传递信息w_i、所述最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c′_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G；

图形匹配模块，用于通过f_G(·,·)函数获得所述用户属性图和所述物品属性图的向量表示

和

具体来说，所述聚合模块，包括：

交互建模单元，用于通过w_ij＝f_m(c_i,c_j)得到节点对(i,j)交互建模的结果w_ij；其中，

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的值，x_j是与

对应的值，w_ij是节点对(i,j)交互建模的结果；

聚合执行单元，用于通过

具体来说，所述重要性建模模块，具体用于通过公式

得到抽象的特征表示

其中，α使用单层的前馈神经网络实现，总的计算过程为：

其中，

是注意力函数，具体表述为：

是前馈神经网络α的参数，LeakyReLU是前馈神经网络的激活函数，R是实数集合，R^2d′是2d′维的实数向量，W_h∈R^d ^′×d是可训练的权值矩阵，R^d′×d是d′行d列的实数矩阵；

所述节点特征更新模块，具体用于通过公式

得到输出

其中，

W_z、W_r、W_h、U_z、U_r和U_h是更新函数门控递归单元的权重参数，b_z、b_r和b_h是偏置参数,

和

分别是更新门向量和复位门向量，

K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。

具体来说，所述融合模块，包括：

第一融合单元，用于通过c′_i＝f_fuse(c_i,w_i,s_i)融合得到融合后的节点表示c′_i；

第二融合单元，用于通过

融合得到最终融合后的节点表示f_G；其中，

是与当前图存在交互行为的另一个属性图的节点集。

具体来说，所述图形匹配模块，包括：

第一计算单元，用于通过

计算得到所述用户属性图的向量表示

其中，G^U是所述用户属性图表示,V^I是所述物品属性图的节点集；

第二计算单元，用于通过

计算得到所述物品属性图的向量表示

其中，G^I是所述物品属性图表示，V^U是所述用户属性图的节点集；

图形匹配执行单元，用于通过

计算得到所述预测的输出结果y′。

本发明中提供的一个或多个技术方案，至少具有如下技术效果或优点：

本发明提出了一种基于GAT的新型自适应图交互框架模型AGIF-GAT(SequenceRecommendation Based on Interactive Graph Attention Network)，首先将每个用户和每个物品表示为一个属性图，通过对属性图的建模获取用户和物品的动态特征；其次，利用图注意力网络(GAT)自适应地为当前节点的邻居节点分配不同的权重值参与计算，捕获潜在非交互用户的信息，实现动态学习高阶特征和新节点的表示；最后，聚合每个用户的邻居图的各种信息，并捕获相似用户的嵌入(这些用户在特定时间之前评估或与同一物品进行过交互)，通过信息聚合和图形匹配，获得最终的预测输出y′，有效解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题，实现了能够动态地精确地向用户推荐目标物品的技术效果。

技术效果

1)将每个用户和每个物品表示为一个属性图，并以端到端的方式分别对属性图建模，区分了用户和物品之间的交互方式，例如内部信息传递、信息传递和信息交叉交互等。

2)本发明实施例提出了一种基于GAT的新型自适应图交互框架AGIF-GAT，它可以为相邻节点分配不同的权重，从而区分每个节点的重要性并捕获相似用户的高阶结构信息。

3)本发明实施例分别聚合了三种形式的信息传递结果，考虑了多通道的信息传递因素。

4)与传统的推荐任务不同，本发明实施例中的序列推荐能够捕获用户在发展过程中的动态偏好，将用户和物品的交互建模为一个动态的序列并且利用序列的依赖性和结构性的共生关系，以及丰富的序列模式，使得用户更快速高效地根据自己的喜好过滤和定位信息。

附图说明

图1为本发明实施例提供的基于交互式图注意力网络的序列推荐方法的流程图；

图2为本发明实施例提供的基于交互式图注意力网络的序列推荐方法的原理图；

图3为本发明实施例不同数据集在不同网络层数和不同节点属性嵌入维度下的推荐精度对比曲线图；

图4为本发明实施例提供的基于交互式图注意力网络的序列推荐系统的模块图。

具体实施方式

本发明实施例通过提供一种基于交互式图注意力网络的序列推荐方法及系统，解决了现有技术中无法动态地精确地捕获用户的喜好的技术问题，实现了能够动态地精确地向用户推荐目标物品的技术效果。

本发明实施例中的技术方案为解决上述技术问题，总体思路如下：

步骤1：构建数据结构构建及属性图建模。

步骤2：节点间的内部信息传递。将步骤1中属性图中的节点特征c_i,c_j通过MLP函数f_m(·，·)计算得到节点对(i,j)交互建模的结果w_ij，并将所有交互建模结果聚合得到内部传递信息w_i。

步骤3：基于注意力网络的交叉信息传递。

1)单层GAT的初始节点特征可表示为H＝[h₁,h₂,…,h_N]，实现图注意力操作的节点表征表示为

2)采用注意力机制学习边的权值α_ij，并将每个邻居节点h_j对于节点h_i的重要性进行建模。

3)为稳定自注意力学习的过程，GAT将上述机制扩展到采用多头注意力实现，更新表示为

4)节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

实现门控循环神经网络GRU的更新操作，得到

5)在两个图之间进行节点匹配得到s_ij，将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果s_i。

步骤4：信息融合与图形匹配。将步骤2和步骤3中得到的内部传递信息w_i、两图之间的节点交互信息s_i与节点的自有信息c_i通过函数f_fuse融合得到c′_i。使用元素相加的方法来聚合节点得到f_G。

步骤5：通过f_G(·,·)函数获得用户属性图和物品属性图的向量表示

和

并通过在两个图形上使用点积函数f(·,·)来匹配两个图形，最终获得预测的输出结果y′。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

参见图1和图2，本发明实施例提供的基于交互式图注意力网络的序列推荐方法，包括：

步骤S110：构建用户属性图和物品属性图；

步骤S120：将用户属性图中的节点特征c_i和物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i,j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i；

对本步骤进行具体说明，将用户属性图中的节点特征c_i和物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i,j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i，包括：

每个属性的嵌入向量

都被设置为一个随机向量，

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的值，x_j是与

对应的值，w_ij是节点对(i,j)交互建模的结果；

通过

步骤S130：单层GAT的初始节点特征表示为H＝[h₁,h₂,…,h_N]，实现图注意力操作的节点表征表示为

具体地，采用注意力机制学习边的权值α_ij，将每个邻居节点h_j对于节点h_i的重要性进行建模，包括：

通过公式

得到抽象的特征表示

其中，α使用单层的前馈神经网络实现，总的计算过程为：

其中，

是注意力函数，具体表述为：

是前馈神经网络α的参数，LeakyReLU是前馈神经网络的激活函数，R是实数集合，R^2d′是2d′维的实数向量，W_h∈R^d′×d是可训练的权值矩阵，R^d′×d是d′行d列的实数矩阵。

步骤S140：节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

对本步骤进行具体说明，节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

包括：

通过公式

得到输出

其中，

和

分别是更新门向量和复位门向量，

K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。

步骤S150：在两个图之间进行节点匹配得到节点匹配结果s_ij，将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果s_i；

步骤S160：将内部传递信息w_i、最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c′_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G；

对本步骤进行具体说明，本发明实施例利用一种有效的递归神经网络模型GRU作为该融合函数f_fuse参与计算，得到融合后的节点表示c′_i。随后，每个图的融合节点表示c′_i被聚合为图表示,使用逐元素求和方法来聚合节点表示，得到最终聚合后的节点表示f_G。具体地，将内部传递信息w_i、最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c′_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G，包括：

通过c′_i＝f_fuse(c_i,w_i,s_i)融合得到融合后的节点表示c′_i；

通过

融合得到最终融合后的节点表示f_G；其中，

是与当前图存在交互行为的另一个属性图的节点集。

步骤S170：通过f_G(·,·)函数获得用户属性图和物品属性图的向量表示

和

对本步骤进行具体说明，通过f_G(·,·)函数获得用户属性图和物品属性图的向量表示

和

通过

和

计算得到用户属性图和物品属性图的向量表示

和

其中，G^U,G^I分别是用户属性图表示和物品属性图表示，V^U是用户属性图的节点集,V^I是物品属性图的节点集；

通过

计算得到预测的输出结果y′。

下面对本发明实施例进行更具体的说明：

步骤1：数据结构构建

对于每个训练数据(X_n,y_n)，都包含在具有输入输出对的数据集D中：D＝{(X_n,y_n)}_1≤n≤N，y_n是输出的预测值即用户点击的概率，数据样本X_n表示为：

当用户与物品有交互记录即记录在这个数据样本中时，X_n值为1，否则为0。其中p表示属性特征，x是其对应的值，

和

分别代表用户属性特征价值对和物品属性特征价值对，

分别代表用户属性的集合和物品属性的集合，J是数据集D中所有特征的索引集。

步骤2：数据结构构建

对于每个属性特征p∈J^U∪J^I，首先被表示为交互建模的d维空间R^d的初始嵌入向量v^e，从而构建一个作为嵌入查询表的参数矩阵。对于具有相同属性p的数据样本可共享该属性的嵌入向量

其次，对于一个用户特征价值对(p,x)，对应的特征向量(特征价值对的表示)C^U计算公式为

同理，物品所对应的特征向量C^I被计算为

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的不同的值，x_j是与

对应的值。最后，利用同一数据样本中两个属性特征C₁和C₂的交互作用建模。当C₁和C₂同时出现在一个数据样本中时，说明两属性特征存在交互。具体表示为交互函数：

f(C₁,C₂):R^2×d→R^l (1)

其中，

C₁和C₂是在同一个数据样本中的特征价值对表示，l表示输出的维度。对于用户和物品属性特征集

在不同数据样本中可能不同，因此不同数据样本中指定的交互作用可能不同。并且由于每个属性都可能出现在多个数据样本中(具有不同的值)，不同数据样本中的交互信息的协作将有助于发现从未共同出现过的属性之间的交互。

步骤3：用户和物品属性图构建

对于一个数据样本N可构成一个图G_N(V_N,E_N)：

Vertices:V_N＝{v_i}_1≤i≤N是由N个节点组成的集合，每个节点都被初始化为相应的序列编码特征向量v_i，节点的第一层状态向量可以表示为V＝(v₁,…,v_N)，用户(物品)序列中的每一个代表属性的节点i都表示为用户(物品)属性图的一个节点特征表示

因此，本发明实施例将用户、物品属性图的节点集分别表示为

Edges:每条边的权重反映了不同特征相互作用的重要性。E＝(e₁,…,e_N)，E∈R^N×N表示包含节点间邻接信息的边的集合。当节点i和j之间构成一条边(即存在有益的特征互动)时，E_ij＝1,否则E_ij＝0。E_ij表示一组边互动值，是节点间邻接信息的边的集合，节点i，j也称为邻居节点。图中的每对节点都与一条边连接，以表示两个属性之间的成对交互。通过边的交互实现用户及物品特征从邻居节点传播到当前节点的过程。

每个用户属性图和物品属性图分别表示为G^U＝<V^U,E^U>，其中E^U包含用户属性图中所有边的边集。由于考虑所有成对属性特征交互，因此用户属性图是一个完整的图。对物品属性执行相同的转换，得到物品属性图G^I＝<V^I,E^I>，E^I包含用户属性图中所有边的边集。

步骤4：节点间内部信息的传递

使用MLP对每个内部交互进行建模，然后将交互建模结果聚合为内部节点信息传递。一个MLP函数f_m(·,·):R^2×d→R^l，将一对用于边缘预测的节点嵌入作为输入，并输出交互建模结果，具体表示为：

w_ij＝f_m(c_i,c_j) (2)

其中，

w_ij是节点对(i,j)交互建模的结果，然后将每个节点对对应的所有交互建模结果聚合得到最终的内部传递信息得到w_i。具体表示为：

其中，w_i∈R^d，N_i表示在图内包括节点i在内的邻居节点集。本发明实施例利用了图结构的特点通过节点间边的连接性质进行显示建模，结合非线性建模多层感知机层与层之间的全连接尽可能多的获取相关信息，从而实现节点间信息的反复传递、更新与丰富。

步骤5：基于注意力网络的交叉信息传递

利用图注意力网络(GAT)进行特征提取并对两个图之间节点匹配进行交互建模。通过GAT将其他邻域的信息特征传播给当前节点，自动确定当前节点与其邻域之间的重要性和相关性。本发明实施例采用GAT对图中节点、边及它们的交互信息一起集成到一个统一的图形交互体系结构中，并进行更新。具体实现如下：

对于具有N个节点的图，单层GAT的初始节点特征可表示为H＝[h₁,h₂,…,h_N]，h_i∈R^d作为输入，目的是得到更加抽象的特征表示

作为模型输出。其中，t表示节点间消息传递的次数。由于每条边上的交互重要性是不同的，因而需要实现沿边的交互，这要求每条边都有一个独特的权值和变换函数。在节点表征上实现的图注意力操作可以写成：

其中，N_i是图中节点i(包括i)的邻居节点集，d和d′是输入和输出维度；W_h∈R^d′×d是可训练的权值矩阵，σ代表非线性激活函数，用于使权重在不同节点之间易于比较。由于需要推断不同节点间交互的重要性，上式中的权重α_ij是通过注意力过程计算的，该过程模拟了每个邻居节点h_j对于节点h_i的重要性。具体表示为：

是一个注意力函数，具体表述为：

其中αT∈R2d′是前馈神经网络α的参数。此外，为了稳定自注意力学习的过程，GAT将上述机制扩展到采用多头注意力实现，具体表示为：

其中，K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。最后，节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

实现门控循环神经网络GRU的更新操作，得到输出

具体表示为：

详细公式化为：

其中，W_z、W_r、W_h、U_z、U_r和U_h是更新函数门控递归单元的权重参数，b_z、b_r和b_h是偏置参数,

和

分别是更新门向量和复位门向量。对于每个GRU单元，它在隐藏状态上应用图神经网络进行信息传播并产生下一帧的状态。

本发明实施例在一个统一的图形交互框架中对用户和物品信息源进行建模，显式的利用节点i与另一信息源节点j之间交互信息进行构建。故在两个图之间进行节点匹配可建模表示为：

其中，

代表用户图中节点i的嵌入特征且

代表物品图中节点j的嵌入特征且

s_ij代表来自不同图形的两个节点的节点匹配结果，⊙表示各元素对应相乘操作。与节点内部信息传递相似，将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果s_i：

为了融合图中各节点的自有信息c_i、内部关联信息w_i以及两图之间的节点交互信息s_i，本发明实施例使用融合函数f_fuse∈R^3×d→R^d，使各部分信息整合在一起。将输入信息通过GRU根据聚合的信息和历史信息更新其节点状态，获得c′_i＝f_fuse(c_i,w_i,s_i)。使用元素相加的方法来聚合节点，从而将每个图的融合节点表示聚合为图表示。具体公式表达为f_G:

在进行图匹配时，本发明实施例通过f_G(·,·)函数获到用户属性图和物品属性图的向量表示：

并通过在两个图形上使用点积函数f_match来匹配两个图形，以获得预测的输出结果

训练

在训练时，本发明实施例使用L₂准则来规范模型的所有参数。因此，损失函数表示为：

其中，F_DIGAT是本发明实施例中的预测函数，输出为y′，λ为正则化的权重系数，

为二元交叉熵损失函数，θ包含了模型的所有参数，而θ*是最终的参数代表。

本发明实施例的相关实验基于Python 3.7及以上版本和Pytorch 1.6.0或更高版本,运行环境版本需Anaconda 3-2020.02及以上。

主要的数据包包括cuda v10.1、cudnn 10.1、pytorch v1.6.0、torch-scatter、torch-sparse、torch-cluster、torch-spline-conv、torch-geometric＝＝1.4.3、pandas＝＝1.1.2、scikit-learn＝＝0.23.2、icecream＝＝2.1.0等。

1.数据描述

本发明实施例在三个公开数据集上进行了实验，分别是：电影评分数据集(MovieLens 1M)、图书评分数据集(Bookcrossing)和淘宝数据集(Taobao)。

(1)电影评分数据集：是一组电影评分数据，包含电影数据、用户数据等。本发明实施例通过将评分标记为0或1将来自该数据集的显示反馈转换为隐式数据，定义用户是否对物品进行评分。每个数据实例都是一个图，节点是用户ID或电影ID，边表示节点和底层特征之间的关系。

(2)图书评分数据集：包含用户对书籍的隐式和显式评分。每个数据样本包括用户、书籍及其属性，例如书名、书名、作者等。

(3)淘宝数据集：该数据集包含有关淘宝在页面上显示的广告点击的数据。每一个数据样本都包含一个特定的用户，对应的属性有性别、年龄、地区等，还有一个可区分的广告信息，如广告物品类别、代言人、品牌等。如果用户与广告之间发生了点击事件，则意味着表示有物品交互，点击事件标记为1，否则为0。

2.评价指标

本发明实施例采用二元交叉熵作为损失函数，可以很好地衡量模型训练后真实数据与预测数据的相似度。由于是非负的且权重更新仅受误差影响(误差率与权重更新成正比)，因此使用sigmoid函数可以很好地避免均方误差损失的学习率降低的问题梯度下降过程中的函数。在本发明实施例中，每个数据集以6:2:2的比例随机分为训练集、验证集和测试集。使用Adam结合一阶动量和二阶动量来自动调整参数的学习率，即自适应动量的随机优化方法优化函数，并使用曲线下面积(AUC)和归一化折损累计增益(NDCG@k，@k表示如果在模型的预测结果中,前k个最高概率的类中有真值,就认为模型预测成功)作为评估指标来评估本发明实施例的模型和基线模型的性能。评价指标与模型性能成正比，评价指标越高，性能越好。

3.参数设置

具体的超参数设置如表1所示。

表1模型的超参数

4.与其他模型比较的实验结果

为了证明本发明实施例提出的方法的有效性，本发明实施例与以下的方法进行了对比，且实验结果如表2所示。

(1)FM：使用点乘法来计算和建模每个特征的交互，对稀疏数据有很好的学习能力。

(2)NFM：一种串行架构，将FM与神经网络相结合，以提高FM捕获特征之间多阶交互信息的能力，使用MLP代替FM的点乘方法。

(3)AutoInt：将原始稀疏高维特征向量映射到低维空间，使用多头自注意神经网络对特征交互进行显式建模。

(4)Fi-GNN：每个特征图由数据样本组成，图中每个节点代表一个特征场，采用多头自注意力方法建模。

(5)NGCF：一种基于图的CF方法，广泛遵循标准GCN，在消息传递过程中将二阶特征交互编码到消息中，并在用户-物品交互上利用三层GNN网络，旨在对邻域进行建模最多三个订单的信息。

(6)GMCF：一种基于图的CF方法，它使用交互建模的MLP结构进行模型内部交互建模，分别构建用户和物品属性图。

(7)KGAT：基于协作知识图的建模，使用图卷积的形式递归挖掘高阶连通性信息并将实体的初始表示向外传播以运行实体以获得隐式反馈，例如邻域信息。

5.实验结果分析

实验结果表明本发明实施例AGIF-GAT相比电影数据集更好地提高了书籍和淘宝的性能，这表明AGIF-GAT可以很好地处理稀疏数据。FM模型效果最差，因为仅使用点积计算不足以有效捕捉信息特征；NFM受FM启发，使用MLP代替点乘，实验效果较FM结果有明显提升，证明了MLP计算方法的有效性；AutoInt和Fi-GNN模型结合多头自注意力神经网络对属性特征进行建模，有效提高了模型捕捉特征间多阶交互信息的能力。实验结果表明，本发明实施例可以有效提高模型的准确率和表达能力。

表2与基线比较的结果总结

6.节点维度和网络层研究

本发明实施例尝试使用不同数量的网络层和不同维度的节点表示来评估所提出的AGIF-GAT的性能。图3使用折线图反馈AGIF-GAT模型在节点表示维度64、128和256上的推荐准确度。不同数量的网络层(单层GAT、双层GAT、三层GAT)推荐结果。在图3中可以清楚地观察到，当节点维数为128时，模型达到了最佳性能。低维可能会出现参数不足等问题，而高维则需要拟合更多的参数，这可能会导致过拟合等其他问题。表示模型需要匹配适当的节点尺寸以获得最佳性能。此外，该模型并没有随着GAT网络层数的加深而取得更好的性能，还可能存在过拟合问题。也说明单层GAT足以满足节点间交叉交互的信息传递需求。

参见图4，本发明实施例提供的基于交互式图注意力网络的序列推荐系统，包括：

属性图构建模块100，用于构建用户属性图和物品属性图；

聚合模块200，用于将用户属性图中的节点特征c_i和物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i,j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i；

具体地，聚合模块200，包括：

每个属性的嵌入向量

都被设置为一个随机向量，

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的值，x_j是与

对应的值，w_ij是节点对(i,j)交互建模的结果；

聚合执行单元，用于通过

重要性建模模块300，用于单层GAT的初始节点特征表示为H＝[h₁,h₂,…,h_N]，实现图注意力操作的节点表征表示为

具体地，重要性建模模块300，具体用于通过公式

得到抽象的特征表示

其中，α使用单层的前馈神经网络实现，总的计算过程为：

其中，

是注意力函数，具体表述为：

α^T∈R^2d′是前馈神经网络α的参数，LeakyReLU是前馈神经网络的激活函数，R是实数集合，R^2d′是2d′维的实数向量，W_h∈R^d′×d是可训练的权值矩阵，R^d′×d是d′行d列的实数矩阵。

节点特征更新模块400，用于节点的状态向量通过初始节点特征h_i和其在最后一步的隐藏状态

具体地，节点特征更新模块400，具体用于通过公式

得到输出

其中，

和

分别是更新门向量和复位门向量，

K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。

求和模块500，用于在两个图之间进行节点匹配得到节点匹配结果s_ij，将来自不同图形的节点匹配结果求和得到最终两图交互的信息传递结果s_i；

融合模块600，用于将内部传递信息w_i、最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c′_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G；

本发明实施例利用一种有效的递归神经网络模型GRU作为该融合函数f_fuse参与计算，得到融合后的节点表示c′_i。随后，每个图的融合节点表示c′_i被聚合为图表示,使用逐元素求和方法来聚合节点表示，得到最终聚合后的节点表示f_G。具体地，融合模块600，包括：

第二融合单元，用于通过

融合得到最终融合后的节点表示f_G；其中，

是与当前图存在交互行为的另一个属性图的节点集。

图形匹配模块700，用于通过f_G(·,·)函数获得用户属性图和物品属性图的向量表示

和

具体地，图形匹配模块700，包括：

第一计算单元，用于通过

计算得到用户属性图的向量表示

其中，G^U是用户属性图表示,V^I是物品属性图的节点集；

第二计算单元，用于通过

计算得到物品属性图的向量表示

其中，G^I是物品属性图表示，V^U是用户属性图的节点集；

图形匹配执行单元，用于通过

计算得到预测的输出结果y′。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于交互式图注意力网络的序列推荐方法，其特征在于，包括：

构建用户属性图和物品属性图；

将所述用户属性图中的节点特征c_i和所述物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i，j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i；

具体地，所述将所述用户属性图中的节点特征c_i和所述物品属性图中的节点特征c_j通过MLP函数f_m(·，·)计算，得到节点对(i，j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i，包括：

通过w_ij＝f_m(c_i，c_j)得到节点对(i，j)交互建模的结果w_ij；其中，

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的值，x_j是与

对应的值，w_ij是节点对(i，j)交互建模的结果；

通过

将每个节点对对应的所有交互建模结果聚合得到最终的内部传递信息w_i；其中，N_i表示在图内包括节点i在内的邻居节点集；

单层GAT的初始节点特征表示为H＝[h₁，h₂，...，h_N]，实现图注意力操作的节点表征表示为

将所述内部传递信息w_i、所述最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c’_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G；

通过f_G(·，·)函数获得所述用户属性图和所述物品属性图的向量表示

和

并在两个图形上使用点积函数f(·，·)来匹配两个图形，最终获得预测的输出结果y′；

具体地，所述通过f_G(·，·)函数获得所述用户属性图和所述物品属性图的向量表示

和

并在两个图形上使用点积函数f(·，·)来匹配两个图形，最终获得预测的输出结果y’，包括：

通过

和

计算得到所述用户属性图和所述物品属性图的向量表示

和

其中，G^U是所述用户属性图表示，G^I是所述物品属性图表示，V^U是所述用户属性图的节点集，V^I是所述物品属性图的节点集；

通过

计算得到所述预测的输出结果y’。

2.如权利要求1所述的方法，其特征在于，所述采用注意力机制学习边的权值α_ij，将每个邻居节点h_j对于节点h_i的重要性进行建模，包括：

通过公式

得到抽象的特征表示

其中，α使用单层的前馈神经网络实现，总的计算过程为：

其中，

是注意力函数，具体表述为：

α^T∈R^2d′是前馈神经网络α的参数，LeakyReLU是前馈神经网络的激活函数，R是实数集合，R^2d’是2d’维的实数向量，W_h∈R^d′×d是可训练的权值矩阵，R^d′×d是d′行d列的实数矩阵；

包括：

通过公式

得到输出

其中，

W_z、W_r、W_h、U_z、U_r和U_h是更新函数门控递归单元的权重参数，b_z、b_r和b_h是偏置参数，

和

分别是更新门向量和复位门向量，

K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。

3.如权利要求1所述的方法，其特征在于，所述将所述内部传递信息w_i、所述最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c’_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G，包括：

通过c′_i＝f_fuse(c_i，w_i，s_i)融合得到融合后的节点表示c′_i；

通过

融合得到最终融合后的节点表示f_G；其中，

是与当前图存在交互行为的另一个属性图的节点集。

4.一种基于交互式图注意力网络的序列推荐系统，其特征在于，包括：

属性图构建模块，用于构建用户属性图和物品属性图；

聚合模块，用于将所述用户属性图中的节点特征c_i和所述物品属性图中的节点特征C_j通过MLP函数f_m(·，·)计算，得到节点对(i，j)交互建模的输出结果w_ij，并将每个节点所有交互建模结果聚合得到内部传递信息w_i；

具体地，所述聚合模块，包括：

交互建模单元，用于通过w_ij＝f_m(c_i，c_j)得到节点对(i，j)交互建模的结果w_ij；其中，

是用户对应交互建模的d维空间R^d的初始嵌入向量，

是物品对应交互建模的d维空间R^d的初始嵌入向量，x_i是与

对应的值，x_j是与

对应的值，w_ij是节点对(i，j)交互建模的结果；

聚合执行单元，用于通过

重要性建模模块，用于单层GAT的初始节点特征表示为H＝[h₁，h₂，...，h_N]，实现图注意力操作的节点表征表示为

融合模块，用于将所述内部传递信息w_i、所述最终两图交互的信息传递结果s_i和节点的自有信息c_i通过函数f_fuse融合得到融合后的节点表示c’_i，将每个图的融合节点表示c′_i聚合为图表示，得到最终聚合后的节点表示f_G；

图形匹配模块，用于通过f_G(·，·)函数获得所述用户属性图和所述物品属性图的向量表示

和

并在两个图形上使用点积函数f(·，·)来匹配两个图形，最终获得预测的输出结果y’；

具体地，所述图形匹配模块，包括：

第一计算单元，用于通过

计算得到所述用户属性图的向量表示

其中，G^U是所述用户属性图表示，V^I是所述物品属性图的节点集；

第二计算单元，用于通过

计算得到所述物品属性图的向量表示

图形匹配执行单元，用于通过

计算得到所述预测的输出结果y’。

5.如权利要求4所述的系统，其特征在于，所述重要性建模模块，具体用于通过公式

得到抽象的特征表示

其中，α使用单层的前馈神经网络实现，总的计算过程为：

其中，

是注意力函数，具体表述为：

α^T∈R^2d′是前馈神经网络α的参数，LeakyReLU是前馈神经网络的激活函数，R是实数集合，R^2d′是2d′维的实数向量，W_h∈R^d′×d是可训练的权值矩阵，R^d′×d是d′行d列的实数矩阵；

所述节点特征更新模块，具体用于通过公式

，得到输出

其中，

和

分别是更新门向量和复位门向量，

K是多头注意力头的数量，

是k头归一化注意力权重，||是串联操作。

6.如权利要求4所述的系统，其特征在于，所述融合模块，包括：

第一融合单元，用于通过c′_i＝f_fuse(c_i，w_i，s_i)融合得到融合后的节点表示c’_i；

第二融合单元，用于通过

融合得到最终融合后的节点表示f_G；其中，

是与当前图存在交互行为的另一个属性图的节点集。