CN116628347B

CN116628347B - 基于引导式图结构增强的对比学习推荐方法

Info

Publication number: CN116628347B
Application number: CN202310890503.XA
Authority: CN
Inventors: 赵帅; 程志勇; 刘帆; 张宇; 卓涛; 李晓丽
Original assignee: Qilu University of Technology; Shandong Institute of Artificial Intelligence
Current assignee: Qilu University of Technology; Shandong Institute of Artificial Intelligence
Priority date: 2023-07-20
Filing date: 2023-07-20
Publication date: 2023-09-29
Anticipated expiration: 2043-07-20
Also published as: CN116628347A

Abstract

本发明涉及推荐系统及深度学习技术领域，尤其涉及一种基于引导式图结构增强的对比学习推荐方法。其包括以下步骤：在电子商务数据集中通过预处理得到训练集、验证集和测试集；对用户节点和物品节点进行嵌入参数初始化，生成节点嵌入信息；对每个用户建立一个由相似用户交互物品所组成的候选物品池；通过余玄相似度函数衡量用户节点嵌入和物品节点嵌入之间的相似度值；建立基于引导式图结构增强的对比学习推荐方法模型；根据最终的用户和物品嵌入向量，计算用户对物品的计算得分，实现物品推荐。

Description

基于引导式图结构增强的对比学习推荐方法

技术领域

本发明涉及推荐系统及深度学习技术领域，尤其涉及一种基于引导式图结构增强的对比学习推荐方法。

背景技术

推荐系统在现实应用中越来越受到重视，尤其是在电商、社交网络等领域，推荐系统已经成为了吸引用户、提高用户留存率和销售额的重要手段。虽然协同过滤在推荐系统中已经被广泛应用，但是在大多数推荐场景中，用户更常使用隐式反馈表达偏好，这使得从基于CF的隐式反馈中学习用户偏好成为学术界和工业界的重要课题。近年来，图神经网络为开发CF方法提供了一种新的技术途径。GNN是一种基于图结构的深度学习模型，通过利用用户-物品交互图，基于GNN的CF模型在推荐性能上取得了实质性的改进。近期，基于增强图的对比学习方法在推荐系统中取得了显著的性能提升。这类方法通过对用户-物品交互图施加不同的增强操作，生成多个视图，然后通过最大化相同交互序列在不同视图下的表示相似度，来学习更优的用户和物品嵌入向量，它们采用了不同的图结构增强策略和自监督学习技术，如随机进行节点扰动、边扰动、子图扰动，它们共同目标是通过学习一致性高的表示来提升推荐效果。同时，它们也可以通过自监督学习来辅助监督推荐任务。

尽管上述方法取得了成功，但在针对图结构增强的有效性方面存在明显问题。首先传统的图增强技术虽然有一定的进展，但是缺乏很好的解释性，图结构增强往往是基于随机性或者宏观计算得分和设置阈值来进行图结构加边减边的操作，缺乏对用户需求的深入理解，此外，随机性或者设置阈值的方式添加的边和删减的边往往缺乏合理性解释，难以满足每个用户的实际需求。这种方法往往导致图结构的变化难以解释，且不能反映用户的真实意图。

发明内容

本发明针对现有技术的不足，研制针对每个用户的多样性优化策略和精确降噪策略，可以从每个用户自身喜好出发，进行细粒度的增强，来捕获用户潜在需求和兴趣个性化推荐的一种能够基于引导式图结构增强的对比学习推荐方法，该发明可以通过深入理解用户的交互行为和兴趣偏好，对交互图进行有针对性的增强操作，能够更好地满足用户的实际需求，增强用户对推荐系统的信任感和满意度，从而提高推荐系统模型的泛化能力和准确度。

本发明解决技术问题的技术方案为：

一种基于引导式图结构增强的对比学习推荐方法，包括如下步骤：

(a)在电子商务数据集中通过预处理得到训练集、验证集和测试集；

(b)利用训练集构建用户和物品购买交互的邻接矩阵，对用户节点和物品节点进行嵌入参数初始化，生成节点嵌入信息；

(c)根据训练集中的用户购买记录，通过公共物品所占比得到目标用户与其对应的相似用户集合，对每个用户建立一个由相似用户交互物品所组成的候选物品池，用以后续对目标用户交互记录进行补充；

(d)通过余玄相似度函数衡量用户节点嵌入和物品节点嵌入之间的相似度值，作为后续的图结构多样性增强和图结构精确降噪的对应边处理的依据；

(e)通过计算每个用户与其对应的物品池中物品相似度得分，取得分较高的物品，作为当前用户潜在喜欢的物品添加到交互记录上；

(f)根据添加多样性的图结构交互记录，计算当前用户与其交互物品的相似度得分，取得分较低的物品，在当前的用户交互记录上删除；

(g)建立基于引导式图结构增强的对比学习推荐方法模型；

(h)基于BPR损失函数和InfoNCE对比损失函数迭代N次，得到训练后的基于引导式图结构增强的对比学习推荐方法模型；

(i)根据最终的用户和物品嵌入向量，计算用户对物品的计算得分，实现物品推荐；

步骤(g)具体如下：

(g-1)通过公式获得多样性增强图/>习到的用户物品嵌入表示，式中/>和/>分别表示多样性增强图的用户和物品的嵌入表示，/>和/>分别表示用户和物品的初始化嵌入表示，/> 通过公式在多样性增强图/>上传递消息，通过聚合邻域信息来学习嵌入表示，其中H和G分别表示节点的嵌入信息和相应图结构的邻接矩阵信息，式中是多样性的加权图/>的交互链接的边缘权重，N_u和N_i分别表示在多样性加权图/>中用户u和物品i的一跳邻居集，/>和/>表示用户u和物品i在k层传播后的嵌入表示，当k＝0时，它们被初始化为/>

(g-2)通过公式组合每一层学习到的节点嵌入，GNN输出的为用户嵌入表示/>和物品嵌入表示/>式中α_k≥0，α_x统一设置为1/(k+1)是分配给第k层的超参数，表示每层节点嵌入的重要性，k是K的子层集合，用来表示图卷积层数；

(g-3)通过公式获得精确降噪图/>学习到的用户物品嵌入表示，式中/>和/>分别表示精确降噪图的用户和物品的嵌入表示，GNN(H，G)模块同上(g-1)和(g-2)步骤；

步骤(h)具体如下：

(h-1)通过公式

计算得到BPR损失，其中表示多样性增强图/>的交互集合，/>表示在图/>中观察到用户u和物品i存在交互，/>表示在图/>中未观察到用户u和物品j存在交互，/>表示用户u对正样本i的得分,式中T为转置，其中/>和/>分别表示多样性增强图的用户和物品的嵌入表示，同理表示用户u对负样本j的得分，φ(·)为Sigmoid激活函数；

(h-2)通过公式采用对比损失来优化互信息的下限,其中/>τ是温度超参数，f(·，·）是余弦相似度函数，通过最小化辅助损失L_MIM；

(h-3)通过公式得到模型的总体损失优化函数，通过多任务学习策略集成图多样性模块和图降噪模块，式中L_BPR由公式(h-1)得到，表示BPR损失函数，L_MIM由公式(h-2)得到，表示InfoNCE对比损失函数，λ₁和λ₂是分别控制降噪图损失和L₂正则化强度的超参数；并且Θ＝{E_U，E_I}是模型参数集，||·||₂为L₂范数；

(h-4)利用BPR损失和InfoNCE对比损失通过Adam优化基于引导式图结构增强的对比学习推荐方法模型中的参数。

所述基于引导式图结构增强的对比学习推荐方法优选方案，步骤(b)包括如下步骤：

(b-1)在训练集中对于一组用户集合U和一组物品集合I的交互矩阵R^N×M，其中N和M分别是用户和物品的数量，其中如果用户u∈U和物品i∈I存在交互，则元素r_ui＝1，否则r_ui＝0；或者基于交互矩阵构造用户-物品二部图G＝(W，ω)，其中节点集W由用户节点和物品节点构成，ω表示边的集合，对于非零元素r_ui都存在一条链接边；

(b-2)对用户节点和物品节点进行嵌入参数初始化分别生成用户节点的嵌入信息和物品节点的嵌入信息/>嵌入参数使用Xavier方法初始化，嵌入大小设置为64。

所述基于引导式图结构增强的对比学习推荐方法优选方案，步骤(c)包括如下步骤：

(c-1)通过公式衡量用户交互集之间的相似性，式中和/>分别代表数据集中用户i和用户j交互的物品集合；

(c-2)通过公式得到目标用户i的相似用户集合，式中JC(u_i，u_j)是用户i和用户j的相似性得分，根据得分情况选取得分最高的M₁用户组成用户集合作为目标用户i的相似用户集合；

(c-3)通过公式将目标用户i的相似用户集合所交互的物品构建物品池/>并且去除目标用户i已交互的物品集合，式中/>和/>分别表示相似用户s所交互的物品集合和目标用户i所交互的物品集合，/>表示目标用户i的相似用户集合。

所述基于引导式图结构增强的对比学习推荐方法优选方案，步骤(d)包括如下步骤：

(d-1)通过公式学习到用户和物品的结构特征矩阵，式中/>和/>表示用户和物品的初始嵌入矩阵，/>为特征矩阵，d为特征嵌入的维度，N和M分别表示用户和物品的个数；

(d-2)通过公式得到每一个用户与其所对应物品池中物品集合的得分情况，式中/>和/>分别表示用户节点u和对应物品池中物品节点i的结构特征，<·，·>表示向量内积运算，||·||₂表示L₂范数函数；

(d-3)通过公式将得分的范围转换(0，1)，式中是每一个用户与其所对应物品池中物品集合的得分情况，S_u，i是用户u和对应物品池中物品i之间的可靠性得分，并且得分范围在(0,1)。

所述基于引导式图结构增强的对比学习推荐方法优选方案，步骤(e)包括如下步骤：

(e-1)通过公式得到每一个用户在物品池中获得的M₂个潜在交互物品，式中M₂表示每个用户添加潜在交互物品的个数，S_u，i表示用户u和对应物品池中物品i之间的可靠性得分，如果满足条件，将得分作为当前用户和物品的交互边缘的权重，即r_ui＝s_u，i否则r_ui＝0，即可靠性得分低，不作为潜在交互链接加入到用户的潜在交互中；

(e-2)通过公式在原始交互矩阵基础上添加潜在交互用户物品的边缘信息，将二者结合在一起，进一步形成多样性增强图/>式中/>表示保留的用户u潜与交互物品i的边缘得分，r_ui表示原始交互矩阵的用户物品交互得分，/>表示多样性增强图/>的用户物品边缘得分。

所述基于引导式图结构增强的对比学习推荐方法优选方案，步骤(f)包括如下步骤：

通过公式对多样性增强图/>进行精确降噪处理，对每个用户在图/>中交互过的所有物品可靠度得分较低的边进行删除，删除噪声和不可靠交互，生成降噪图/>得分的计算方法由(d)提供，式中M₃表示每个用户要删除噪声边的个数，表示多样性增强图/>的用户物品边缘得分，/>表示精确降噪图/>的用户物品边缘得分。

所述基于引导式图结构增强的对比学习推荐方法优选方案，步骤(i)包括如下步骤：通过公式计算得到用户对物品的预测得分y，式中T为转置，/>和/>分别表示多样性增强图的用户和物品的嵌入表示，根据预测得分y由高到低排序，实现物品推荐。

发明内容中提供的效果仅仅是实施例的效果，而不是发明所有的全部效果，上述技术方案具有如下优点或有益效果：

通过深入理解用户的交互行为和兴趣偏好，对交互图进行有针对性的增强操作，能够更好地满足用户的实际需求，增强用户对推荐系统的信任感和满意度，从而提高推荐系统模型的泛化能力和准确度。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1为本发明的方法流程图；

图2本发明基于引导式图结构增强的对比学习推荐方法模型图；

图3本发明引导式边缘优化策略对比其他模型边缘优化策略的效果对比图；

图4本发明对比其他模型针对不同交互数的用户性能提升情况。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明的数据集包括：

Amazon公布的Movies-and-TV数据集，是包含亚马逊电影和电视节目评论的数据集。我们对数据集进行预处理，为了保证数据质量，我们只保留超过10条交互记录的用户和项目交互信息，清洗过后该数据集包含33327个用户和21902个项目，具体交互数包含958986条交互记录。

(a)在电子商务数据集中通过预处理，将用户所交互的物品按照8：1：1比例进行随机划分，分别生成训练集、验证集和测试集，训练集用于模型的训练，验证集用于检测模型的训练结果，如果发生5次指标不会提升，就终止训练，测试集用于验证模型的最终推荐效果；

(b)训练集中包括N个用户、M个物品，利用训练集构建用户和物品购买交互的邻接矩阵，对用户节点进行嵌入参数初始化，生成节点嵌入信息对物品节点进行嵌入参数初始化，生成节点嵌入信息/>

(c)根据训练集中的用户购买记录，通过公共物品所占比得到目标用户u_i与其对应的相似用户集合对每个用户建立一个由相似用户交互物品所组成的候选物品池用以后续对目标用户交互记录进行补充；

(e)通过计算每个用户与其对应的物品池中物品相似度得分，取得分较高的M₂个物品，作为当前用户潜在喜欢的物品添加到交互记录上，用以丰富图结构的多样性，提高模型的泛化能力；

(f)根据添加多样性的图结构交互记录，计算当前用户与其交互物品的相似度得分，取得分较低的M₃个物品，在当前的用户交互记录上删除，用以减少图结构的噪声和干扰信息，提高模型的精确度；

(g)建立基于引导式图结构增强的对比学习推荐方法模型；

(h)基于BPR损失函数和InfoNCE对比损失函数迭代N次，得到训练后的基于引导式图结构增强的对比学习推荐方法模型，需要明白的是，BPR是一种常用的损失函数能够使得正样本和负样本的得分差距尽量最大化，InfoNCE是一种常用的对比损失函数，其原理在此不再赘述；

步骤(g)具体如下：

(g-1)通过公式获得多样性增强图/>习到的用户物品嵌入表示，式中/>和/>分别表示多样性增强图的用户和物品的嵌入表示，/>和分别表示用户和物品的初始化嵌入表示，/> 通过公式在多样性增强图/>上传递消息，通过聚合邻域信息来学习嵌入表示，其中H和G分别表示节点的嵌入信息和相应图结构的邻接矩阵信息，式中是多样性的加权图/>的交互链接的边缘权重，N_u和N_i分别表示在多样性加权图/>中用户u和物品i的一跳邻居集，/>和/>表示用户u和物品i在k层传播后的嵌入表示，当k＝0时，它们被初始化为/>

(g-2)通过公式组合每一层学习到的节点嵌入，GNN输出的为用户嵌入表示/>和物品嵌入表示/>式中α_k≥0，α_k统一设置为1/(k+1)是分配给第k层的超参数，表示每层节点嵌入的重要性，k是K的子层集合，用来表示图卷积层数；

步骤(h)具体如下：

(h-1)通过公式

计算得到BPR损失，其中表示多样性增强图/>的交互集合，/>表示在图/>中观察到用户u和物品i存在交互，/>表示在图/>中未观察到用户u和物品j存在交互，/>表示用户u对正样本i的得分,式中T为转置，其中/>和/>分别表示多样性增强图的用户和物品的嵌入表示，同理/>表示用户u对负样本j的得分，φ(·)为Sigmoid激活函数；

(h-2)通过公式采用对比损失来优化互信息的下限,其中/>τ是温度超参数，f(·，·)是余弦相似度函数，通过最小化辅助损失L_MIN；

本实施例中，步骤(b)包括如下步骤：

本实施例中，步骤(c)包括如下步骤：

(c-2)通过公式得到目标用户i的相似用户集合，式中JC(u_i，u_j)是用户i和用户j的相似性得分，根据得分情况选取得分最高的M₁个用户组成用户集合作为目标用户i的相似用户集合；

(c-3)通过公式将目标用户i的相似用户集合所交互的物品构建物品池/>并且去除目标用户i所交互的物品集合，式中/>和/>分别表示相似用户s所交互的物品集合和目标用户i所交互的物品集合，/>表示目标用户i的相似用户集合。

本实施例中，步骤(d)包括如下步骤：

本实施例中，步骤(e)包括如下步骤：

(e-1)通过公式得到每一个用户在物品池中获得的M₂个潜在交互物品，式中M₂表示每个用户添加潜在交互物品的个数，S_u，i表示用户u和对应物品池中物品i之间的可靠性得分，如果满足条件，将得分作为当前用户和物品的交互边缘的权重，即r_ui＝s_u，i，否则r_ui＝0，即可靠性得分低，不作为潜在交互链接加入到用户的潜在交互中；

本实施例中，步骤(f)包括如下步骤：

本实施例中，步骤i)包括如下步骤：通过公式计算得到用户对物品的预测得分y，式中T为转置，/>和/>分别表示多样性增强图的用户和物品的嵌入表示，根据预测得分y由高到低排序，实现物品推荐。

经过步骤(a)至(i)完成模型训练及推荐，为了验证模型的有效性，我们针对结果具体阐述本发明的性能优势，我们对比了另外两个最优的图结构增强模型，具体结果如表1.

表1本发明与目前最优的图结增强模型在Movies-and-TV数据集上的性能比较。

从表1中可以看到我们的模型对比其他图结构增强的基线模型性能都有明显的提升，并且优于目前主流的协同过滤与图结构增强对比的推荐模型，我们选择对用户推荐的物品数量的为10，在三个评价指标Recall(召回率)、NDCG(归一化折损累计增益)、HR(命中率)上都有明显的提升，并且分别提升了4.50％、3.80％和3.12％，这个归功于我们对用户的细粒度增强更能满足用户的真实需求，这是其他模型所不具备的特点。

本发明在合理性的边缘优化选择策略上也优势明显，如图3所示，本发明在优化较少边缘数量时就已经取得了最好的结果，大幅减少冗余边的添加或删除，对于每个用户，我们从物品池中选取候选物品，使模型更具合理性，从而使模型更加精简高效。由于现实中的数据集是具有稀疏性的，推荐系统在许多交互较少的节点嵌入学习效果并不理想，我们对不同交互数的用户进行了分组，以便更好地探究本发明的优势，如图4所示，在不同的数据集上对用户分组测试不同稀疏度分布的性能比较。其中，背景直方图表示每组所涉及的用户数量，线条显示了性能与指标命中率的关系，我们可以看到，随着交互的增加，我们的模型比最佳基线的改进变得更大，这也验证了本发明方法在针对不同交互数的用户时比其他模型有更明显的优势，证明了本发明方法的通用有效性。我们的模型同时受益于对比学习和GCN技术，GCN技术利用优化后的图形结构来学习用户和物品的表征，可以进一步提升模型的准确度。

本发明提出了的基于增强图的对比学习方法，解决了现有方法无法为用户和物品节点提供冗余度少但有效信息的问题。我们通过对用户-物品交互进行细粒度的增强，来捕获用户的潜在需求和兴趣。这种方法可以通过深入理解用户的交互行为和兴趣偏好，对交互图进行有针对性的增强操作，能够更好地满足用户的实际需求。

上述虽然结合附图对发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于引导式图结构增强的对比学习推荐方法，其特征在于，包括如下步骤：

(g)建立基于引导式图结构增强的对比学习推荐方法模型；

步骤(g)具体如下：

(g-3)通过公式

获得精确降噪图学习到的用户物品嵌入表示，式中/>和/>分别表示精确降噪图的用户和物品的嵌入表示，GNN(H，G)模块同上(g-1)和(g-2)步骤；

步骤(h)具体如下：

(h-1)通过公式

计算得到BPR损失，其中

表示多样性增强图/>的交互集合，/>表示在图/>中观察到用户u和物品i存在交互，/>表示在图/>中未观察到用户u和物品j存在交互，/>表示用户u对正样本i的得分,式中T为转置，其中和/>分别表示多样性增强图的用户和物品的嵌入表示，同理/>表示用户u对负样本j的得分，φ(·)为Sigmoid激活函数；

(h-2)通过公式

采用对比损失来优化互信息的下限,其中/>τ是温度超参数，f(·，·)是余弦相似度函数，通过最小化辅助损失L_MIM；

2.根据权利要求1所述基于引导式图结构增强的对比学习推荐方法，其特征在于，步骤(b)包括如下步骤：

(b-2)对用户节点和物品节点井行嵌入参数初始化分别生成用户节点的嵌入信息和物品节点的嵌入信息/>嵌入参数使用Xavier方法初始化，嵌入大小设置为64。

3.根据权利要求1所述基于引导式图结构增强的对比学习推荐方法，其特征在于，步骤(c)包括如下步骤：

(c-1)通过公式衡量用户交互集之间的相似性，式中/>和分别代表数据集中用户i和用户j交互的物品集合；

4.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法，其特征在于，步骤(d)包括如下步骤：

(d-1)通过公式学习到用户和物品的结构特征矩阵，式中和/>表示用户和物品的初始嵌入矩阵，/>为特征矩阵，d为特征嵌入的维度，N和M分别表示用户和物品的个数；

(d-2)通过公式得到每一个用户与其所对应物品池中物品集合的得分情况，式中/>和/>分别表示用户节点u和对应物品池中物品节点l的结构特征，<·，·>表示向量内积运算，||·||₂表示L₂范数函数；

(d-3)通过公式将得分的范围转换(0，1)，式中是每一个用户与其所对应物品池中物品集合的得分情况，S_u，i是用户u和对应物品池中物品i之间的可靠性得分，并且得分范围在(0，1)。

5.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法，其特征在于，步骤(e)包括如下步骤：

6.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法，其特征在于，步骤(f)包括如下步骤：

通过公式对多样性增强图/>进行精确降噪处理，对每个用户在图/>中交互过的所有物品可靠度得分较低的边进行删除，删除噪声和不可靠交互，生成降噪图/>得分的计算方法由(d)提供，式中M₃表示每个用户要删除噪声边的个数，/>表示多样性增强图/>的用户物品边缘得分，/>表示精确降噪图/>的用户物品边缘得分。

7.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法，其特征在于，步骤(i)包括如下步骤：通过公式计算得到用户对物品的预测得分y，式中T为转置，和/>分别表示多样性增强图的用户和物品的嵌入表示，根据预测得分y由高到低排序，实现物品推荐。