CN114117232A

CN114117232A - 节点和元路径对比学习增强的推荐方法及系统

Info

Publication number: CN114117232A
Application number: CN202111462320.5A
Authority: CN
Inventors: 张军; 黄明远; 赵朋朋
Original assignee: Shenxing Taibao Intelligent Technology Suzhou Co ltd
Current assignee: Shenxing Taibao Intelligent Technology Suzhou Co ltd
Priority date: 2021-12-02
Filing date: 2021-12-02
Publication date: 2022-03-01

Abstract

本发明公开了节点和元路径对比学习增强的推荐方法，包括：获取待推荐用户标识；将待推荐用户标识输入到训练好的推荐模型中，获得待推荐用户的用户嵌入及与待推荐用户关联的项目嵌入；将用户嵌入与项目嵌入相乘，获得对应项目的得分，并按照得分的高低排序，生成与该排序对应的项目推荐列表；其中，训练好的推荐模型是由BPR损失、基于元路径的用户侧对比损失和基于元路径的项目侧对比损失，对推荐模型进行训练得到的；以及，节点和元路径对比学习增强的推荐系统、电子设备和存储介质。本发明的推荐方法及系统可以利用节点级信息和路径级信息来指导推荐模型学习节点的表示，使输出的推荐项目更符合用户需求。

Description

节点和元路径对比学习增强的推荐方法及系统

技术领域

本发明涉及机器学习领域。更具体地说，本发明涉及一种节点和元路径对比学习增强的推荐方法及系统。

背景技术

近年来，推荐系统在YouTube和亚马逊等在线平台上取得了巨大的成功。推荐系统的原理是利用历史记录来计算用户和项的表示。随着图神经网络(GNNs)的发展(GNN是一种学习图上节点表示的技术，其可以从历史交互记录中提取用户-项目二部图)，出现了许多基于GNN的推荐系统，但它们仍然面临着数据稀疏性的问题。在推荐场景中，用户-项目二部图是非常稀疏的。GNN很难在稀疏的用户-项目二部图上学习有用的节点表示，这导致基于GNN的模型遇到了性能瓶颈。对比学习作为一种属于自监督学习，其通过定义正样本和负样本，可以最大化正样本之间的相似性，并最小化正样本和负样本之间的相似性。因为对比学习可以进一步从未标记数据中挖掘信息，所以被认为是缓解数据稀疏性的有效方法。因此，许多基于GNN的推荐系统都采用了对比学习。具体来说，S3-Rec作为会话推荐系统，通过dropout生成多个会话视图，然后在这些会话视图上使用对比学习。SGL通过dropout用户-项目二部图来获得一个辅助视图，然后通过多视图对比学习增强了模型的鲁棒性。通过对比学习，这些作品取得了卓越的进展。但是，它们仍然存在以下限制：(1)信息丢失。由dropout生成的视图可能会丢弃有用信息，这样会损害模型的性能。(2)对路径信息的利用率不足。

发明内容

本发明的一个目的是提供一种节点和元路径对比学习增强的推荐方法及系统，其可以利用节点级信息和路径级信息来指导推荐模型学习节点的表示。

为了实现根据本发明的目的和其它优点，提供了一种节点和元路径对比学习增强的推荐方法，包括：

获取待推荐用户标识；

将所述待推荐用户标识输入到训练好的推荐模型中，获得待推荐用户的用户嵌入及与所述待推荐用户关联的项目嵌入；

将所述用户嵌入与所述项目嵌入相乘，获得对应项目的得分，并按照得分的高低排序，生成与该排序对应的项目推荐列表；；其中，

所述训练好的推荐模型是由BPR损失、基于元路径的用户侧对比损失和基于元路径的项目侧对比损失，对推荐模型进行训练得到的。

优选的是，所述的节点和元路径对比学习增强的推荐方法，所述训练好的推荐模型通过以下步骤得到：

获取所有用户与项目的历史交互记录，生成用户-项目二部图

并计算

中的用户节点嵌入

和项目节点嵌入

根据

和

计算推荐模型的BPR损失

对所述用户-项目二部图

进行元路径提取，生成用户元路径视图

和项目元路径视图

将所述用户节点嵌入

和所述用户元路径视图

输入元路径视图编码器中，获取所述用户元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算用户侧对比损失

将所述项目节点嵌入

和所述项目元路径视图

输入元路径视图编码器中，获取所述项目元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算项目侧对比损失

根据所述BPR损失

用户侧对比损失

和项目侧对比损失

计算推荐模型的整体损失

用

对推荐模型进行训练，直至

小于预设阈值，即得训练好的推荐模型。

优选的是，所述的节点和元路径对比学习增强的推荐方法，将所述用户节点嵌入

和所述用户元路径视图

输入元路径视图编码器中，获取所述用户元路径视图

上的节点嵌入

将

和

役影到同一向量空间中，计算用户侧对比损失

具体为：

定义：

式中，

是节点i在

上的一组相邻节点，d_i和d_i′分别是节点i和i′的度，

是节点i的邻域节点i′的用户节点嵌入

根据所述用户元路径视图

生成列表Su，

式中，

表示节点i与

中的第n个相邻节点i′的共同交互项目的个数；

将列表Su按降序排序，生成列表Su′，设置一个超参数T_posu，如果|Su′|＞T_posu，我们从Su′中选择第一个T_posu节点作为节点i的正样本，否则将Su′中的所有节点视为正样本，并将节点i的正样本节点集标记为

将节点i的负样本节点集标记为

使用相同的非线性变换将

和

投影到同一向量空间中，其中，

式中，W是权重矩阵，b是常数，

是

投影后的节点嵌入，

是

投影后的节点嵌入；

以用户-项目二部图

为主体计算对比损失

以用户元路径视图

为主体计算对比损失

其中，

式中，τ是温度参数；

计算用户侧对比损失

式中，λ是系数，I是用户集合，|I|为用户数量。

优选的是，所述的节点和元路径对比学习增强的推荐方法，将所述项目节点嵌入

和所述项目元路径视图

输入元路径视图编码器中，获取所述项目元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算项目侧对比损失

具体为：

定义：

式中，

是节点j在

上的一组相邻节点，d_j和d_j′分别是节点j和j′的度，

是节点j的邻域节点j′的项目节点嵌入；

根据所述用户元路径视图

生成列表Sv，

式中，

表示节点j与

中的第n个相邻节点j′的共同交互用户的个数；

将列表Sv按降序排序，生成列表Sv′，设置一个超参数T_posv，如果|Sv′|＞T_posv，我们从Sv′中选择第一个T_posv节点作为节点j的正样本，否则对Sv′中的所有节点视为正样本，并将节点j的正样本节点集标记为

将节点i的负样本节点集标记为

使用相同的非线性变换将

和

投影到同一向量空间中，其中，

式中，W是权重矩阵，b是常数，

是

投影后的节点嵌入，

是

投影后的节点嵌入；

以用户-项目二部图

为主体计算对比损失

以项目元路径视图

为主体计算对比损失

其中，

式中，τ是温度参数；

计算项目侧对比损失

式中，λ是系数，J是项目集合，|J|为项目数量。

优选的是，所述的节点和元路径对比学习增强的推荐方法，根据所述BPR损失

用户侧对比损失

和项目侧对比损失

计算推荐模型的整体损失

具体为：

计算推荐模型整体的对比损失

式中，w_user和w_item是超参数，其分别控制了对用户侧对比损失和对项目侧对比损失的影响；

计算推荐模型的整体损失

优选的是，所述的节点和元路径对比学习增强的推荐方法，所述推荐模型包括LightGCN、NGCF、NeuMF中的一种。

优选的是，所述的节点和元路径对比学习增强的推荐方法及装置，所述元路径视图编码器包括GNN、GCN、GAT中的一种。

本发明还提供了一种节点和元路径对比学习增强的推荐系统，包括：

获取模块，其用于获取待推荐用户与项目的历史交互记录一；

推荐模块，其用于将所述历史交互记录一输入训练好的推荐模型中，得到待推荐用户的推荐项目；其中，

本发明还提供了一种电子设备，包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行上述的方法。

本发明还提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时，实现上述的方法。

本发明至少包括以下有益效果：

本发明提供了一种节点和元路径对比学习增强的推荐方法和系统，它可以利用节点级信息和路径级信息来指导推荐模型学习节点的表示，使训练好的推荐模型可以学习到包含节点级信息和路径级信息的节点表示，进而使得训练好的推荐模型输出的推荐项目更符合用户需求。具体来说，首先通过利用元路径而不是随机dropout，对用户-项目二部图生成一个元路径视图，这样，元路径视图在存储大量路径级信息时不会丢失信息，元路径视图和用户-项目二部图，可以从不同的角度来描述节点表示。其次，利用GNNs捕获节点级信息和路径级信息，学习交互视图和元路径视图上的节点表示。再次，引入了多正样本机制，使对比学习更适合推荐任务，该方法可以为当前节点定义多个正样本，而不是仅定义一个正样本。最后，再把计算正样本和负样本之间的对比损失作为辅助任务，以指导模型学习具有更多路径级信息的节点表示。

本发明的其它优点、目标和特征将部分通过下面的说明体现，部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。

附图说明

图1是本发明的NPCRS模型的结构示意图；

图2是本发明从交互视图中提取元路径视图的示意图。

具体实施方式

下面结合实施例和附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。

术语解释：

LightGCN：Simplifying and Powering Graph Convolution Network forRecommendation，用于推荐的轻量化的图卷积神经网络；

NGCF：Neural Graph Collaborative Filtering，图神经协同过滤；

NeuMF：Neural Collaborative Filtering，基于神经网络的协同过滤；

GCN：图卷积网络；

GAT：图注意力网络。

本发明提供了一种节点和元路径对比学习增强的推荐方法，包括：

S101、获取待推荐用户标识，如用户ID、用户名称；

S102、将所述待推荐用户标识输入到训练好的推荐模型中，获得待推荐用户的用户嵌入(这里，嵌入可以理解为向量表示，下同)及与所述待推荐用户关联的项目嵌入；

将所述用户嵌入与所述项目嵌入相乘，获得对应项目的得分，得分越高表示用户对该项目的感兴趣程度越高，并按照得分的高低排序，生成与该排序对应的项目推荐列表，进一步的，可取排在前预设位数的得分，如前10位的得分，再按照得分的高低，生成与得分对应的项目推荐列表；；其中，

本发明通过BPR损失、基于元路径的用户侧对比损失和基于元路径的项目侧对比损失，对推荐模型进行训练，使训练好的推荐模型可以学习到包含节点级信息和路径级信息的节点表示，进而使得训练好的推荐模型输出的推荐项目更符合用户需求。

在另一实施方案中，如图1所示，所述训练好的推荐模型(命名为NPCRS模型)通过以下步骤得到：

S201、获取所有用户与项目的历史交互记录，生成用户-项目二部图

并计算

中的用户节点嵌入

和项目节点嵌入

根据

和

计算推荐模型的BPR损失

所述推荐模型包括LightGCN、NGCF、NeuMF中的一种；具体的：

令用户表示为I＝{i₁，i₂，...，i_n}(|I|＝N)，项目分别表示为J＝{j₁，j₂，...，j_m}(|J|＝M)。用户和项目之间的交互历史可以表示为矩阵

r_ij＝1表示用户i和项目j存在交互记录，否则表示为r_ij＝0。设O+＝{r_ij|i∈I，j∈J}是观察到的交互。利用矩阵

可以得到一个用户-项目二部图

其中

是所有节点的集合，ε_r＝O⁺表示观察到的交互。

和

是邻居节点集。

包括用户i交互过的所有项目节点。

包括与项目j交互过的所有用户节点。

为简单起见，这里，使用LightGCN作为推荐模型，进行举例说明：

计算用户和项目的表示形式：在LightGCN中嵌入的计算定义如下：

在这里，e_i和e_j分别是用户嵌入和项目嵌入。k是GCN的层数。

是对称归一化项，它可以避免在图卷积操作过程中嵌入规模的增大。值得注意的是，LightGCN不使用非线性激活函数和特征转换。通过k层的GCN后，通过以下方法得到最终的嵌入：

α_k≥0度量了k层嵌入的重要性。在实际应用中，设置α_k＝1/(K+1)。

训练和预测：在获得用户和项目的最终嵌入后，通过用户和项目的嵌入相乘来获得预测分数：

是反映用户对该项目的兴趣程度的得分，分数越高表示用户对该项目越感兴趣。

LightGCN采用贝叶斯个性化排序(BPR)损失来学习参数。BPR损失是一种成对的损失，促进观察到的条目的排名高于未观察的对应：

其中，λ为L₂正则化系数，Θ为模型的参数

S202、对所述用户-项目二部图

进行元路径提取，生成用户元路径视图

和项目元路径视图

具体的：

元路径P定义为

(缩写为A₁A₂...A_l+1)形式的路径，描述节点A₁和A_l+1之间组合关系

其中

表示关系上的组合运算符。如图2所示，用户-项目交互图有两个元路径，IJI和JIJ。IJI表示与同一项目交互过的两个用户。JIJ表示用户交互的两个项目。通过元路径，可以很容易地捕获路径级信息。

S203、将所述用户节点嵌入

和所述用户元路径视图

输入元路径视图编码器中，获取所述用户元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算用户侧对比损失

所述元路径视图编码器包括GNN、GCN、GAT中的一种，这里，以GNN进行举例说明；具体的：

定义：

式中，

是节点i在

上的一组相邻节点，d_i和d_i′分别是节点i和i′的度，

是节点i的邻域节点i′的用户节点嵌入。元路径视图上的聚合使节点嵌入

能够了解有关路径级别的信息。因此，

比

捕获更多的高阶信息。

根据所述用户元路径视图

生成列表Su，

式中，

表示节点i与

中的第n个相邻节点i′的共同交互项目的个数；

将节点i的负样本节点集标记为

这里，每个节点都有多个正样本，而不是一个，但在之前的对比学习工作中，都只考虑了一对正样本。例如，SimCLR只将原始图片和裁剪后的图片作为正样本。在推荐系统场景中，可能会有许多用户具有相似的兴趣。如果只使用一对正值，模型将很难学习有用的信息，从而导致模型性能受损。因此，使用多对正值更符合推荐任务的背景。

使用相同的非线性变换将

和

投影到同一向量空间中，其中，

式中，W是权重矩阵，b是常数，

是

投影后的节点嵌入，

是

投影后的节点嵌入；这里，可使用一个两层的MLP实来现，其中激活函数选择了ELU。

以用户-项目二部图

为主体计算对比损失

以用户元路径视图

为主体计算对比损失

其中，

式中，τ是温度参数；

计算用户侧对比损失

式中，λ是系数，I是用户集合，|I|为用户数量。

S204、将所述项目节点嵌入

和所述项目元路径视图

输入元路径视图编码器中，获取所述项目元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算项目侧对比损失

这里，仍以GNN进行举例说明，具体为：

定义：

式中，

是节点j在

上的一组相邻节点，d_j和d_j′分别是节点j和j′的度，

是节点j的邻域节点j′的项目节点嵌入；

根据所述用户元路径视图

生成列表Sv，

式中，

表示节点j与

中的第n个相邻节点j′的共同交互用户的个数；

将节点i的负样本节点集标记为

使用相同的非线性变换将

和

投影到同一向量空间中，其中，

式中，W是权重矩阵，b是常数，

是

投影后的节点嵌入，

是

投影后的节点嵌入；

以用户-项目二部图

为主体计算对比损失

以项目元路径视图

为主体计算对比损失

其中，

式中，τ是温度参数；

计算项目侧对比损失

式中，λ是系数，J是项目集合，|J|为项目数量。

S205、根据所述BPR损失

用户侧对比损失

和项目侧对比损失

计算推荐模型的整体损失

用

对推荐模型进行训练，直至

小于预设阈值，即得训练好的推荐模型；具体的：

计算推荐模型整体的对比损失

计算推荐模型的整体损失

采用

替换式1中的

来学习LightGCN的参数，直至

小于预设阈值，即得训练好的推荐模型。

本技术方案基于与节点和元路径对比学习增强的推荐方法相同的发明构思，理解本技术方案可参见推荐方法部分的描述。

本技术方案基于与节点和元路径对比学习增强的推荐方法相同的发明构思得到，可参考推荐方法部分的描述。本技术方案的电子设备不限于pc、终端、服务器。

本技术方案基于与节点和元路径对比学习增强的推荐方法相同的发明构思得到，可参考推荐方法部分的描述，以使本发明的推荐方法可以以软件产品的形式体现出来。

以下，以3个真实世界的数据集，如表1所示，来评估本发明的NPCRS模型的有益效果，结果见表2。由表2可知，本发明的模型显著地优于现有模型。

表1

表2

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图例。

Claims

1.节点和元路径对比学习增强的推荐方法，其特征在于，包括：

获取待推荐用户标识；

将所述用户嵌入与所述项目嵌入相乘，获得对应项目的得分，并按照得分的高低排序，生成与该排序对应的项目推荐列表；其中，

2.如权利要求1所述的节点和元路径对比学习增强的推荐方法，其特征在于，所述训练好的推荐模型通过以下步骤得到：

获取所有用户与项目的历史交互记录，生成用户-项目二部图

并计算

中的用户节点嵌入

和项目节点嵌入

根据

和

计算推荐模型的BPR损失

对所述用户-项目二部图

进行元路径提取，生成用户元路径视图

和项目元路径视图

将所述用户节点嵌入

和所述用户元路径视图

输入元路径视图编码器中，获取所述用户元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算用户侧对比损失

将所述项目节点嵌入

和所述项目元路径视图

输入元路径视图编码器中，获取所述项目元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算项目侧对比损失

根据所述BPR损失

用户侧对比损失

和项目侧对比损失

计算推荐模型的整体损失

用

对推荐模型进行训练，直至

小于预设阈值，即得训练好的推荐模型。

3.如权利要求2所述的节点和元路径对比学习增强的推荐方法，其特征在于，将所述用户节点嵌入

和所述用户元路径视图

输入元路径视图编码器中，获取所述用户元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算用户侧对比损失

具体为：

定义：

式中，

是节点i在

上的一组相邻节点，d_i和d_i′分别是节点i和i′的度，

是节点i的邻域节点i′的用户节点嵌入；

根据所述用户元路径视图

生成列表Su，

式中，

表示节点i与

中的第n个相邻节点i′的共同交互项目的个数；

将列表Su按降序排序，生成列表Su′，设置一个超参数T_posu，如果|Su′|>T_posu，我们从Su′中选择第一个T_posu节点作为节点i的正样本，否则将Su′中的所有节点视为正样本，并将节点i的正样本节点集标记为

将节点i的负样本节点集标记为

使用相同的非线性变换将

和

投影到同一向量空间中，其中，

式中，W是权重矩阵，b是常数，

是

投影后的节点嵌入，

是

投影后的节点嵌入；

以用户-项目二部图

为主体计算对比损失

以用户元路径视图

为主体计算对比损失

其中，

式中，τ是温度参数；

计算用户侧对比损失

式中，λ是系数，I是用户集合，|I|为用户数量。

4.如权利要求2所述的节点和元路径对比学习增强的推荐方法，其特征在于，将所述项目节点嵌入

和所述项目元路径视图

输入元路径视图编码器中，获取所述项目元路径视图

上的节点嵌入

将

和

投影到同一向量空间中，计算项目侧对比损失

具体为：

定义：

式中，

是节点j在

上的一组相邻节点，d_j和d_j′分别是节点j和j′的度，

是节点j的邻域节点j′的项目节点嵌入；

根据所述用户元路径视图

生成列表Sv，

式中，

表示节点j与

中的第n个相邻节点j′的共同交互用户的个数；

将列表Sv按降序排序，生成列表Sv′，设置一个超参数T_posv，如果|Sv′|>T_posv，我们从Sv′中选择第一个T_posv节点作为节点j的正样本，否则对Sv′中的所有节点视为正样本，并将节点j的正样本节点集标记为

将节点i的负样本节点集标记为

使用相同的非线性变换将

和

投影到同一向量空间中，其中，

式中，W是权重矩阵，b是常数，

是

投影后的节点嵌入，

是

投影后的节点嵌入；

以用户-项目二部图

为主体计算对比损失

以项目元路径视图

为主体计算对比损失

其中，

式中，τ是温度参数；

计算项目侧对比损失

式中，λ是系数，J是项目集合，|J|为项目数量。

5.如权利要求2所述的节点和元路径对比学习增强的推荐方法，其特征在于，根据所述BPR损失

用户侧对比损失

和项目侧对比损失

计算推荐模型的整体损失

具体为：

计算推荐模型整体的对比损失

计算推荐模型的整体损失

6.如权利要求2所述的节点和元路径对比学习增强的推荐方法，其特征在于，所述推荐模型包括LightGCN、NGCF、NeuMF中的一种。

7.如权利要求2所述的节点和元路径对比学习增强的推荐方法及装置，其特征在于，所述元路径视图编码器包括GNN、GCN、GAT中的一种。

8.节点和元路径对比学习增强的推荐系统，其特征在于，包括：

9.电子设备，其特征在于，包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求1-7中任一项所述的方法。

10.存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时，实现权利要求1-7中任一项所述的方法。