CN116662532A

CN116662532A - 一种基于图神经网络的神经时间门自适应融合会话推荐方法

Info

Publication number: CN116662532A
Application number: CN202310804951.3A
Authority: CN
Inventors: 陈乔松; 胡静; 黄泽锰; 汪祝; 周俊丞
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2023-07-03
Filing date: 2023-07-03
Publication date: 2023-08-29

Abstract

本发明公开了一种基于图神经网络的神经时间门自适应融合会话推荐方法。本模型分为五个层次：会话图构建层、会话嵌入层、注意力网络层、神经时间门层和评分预测层，具体包括：将用户历史会话点击序列作为输入来构建会话图；通过图神经网络学习项目在会话图上的嵌入，得到项目嵌入的向量表示；所有项目向量输入注意力网络，分别提取出用户的长期偏好和短期偏好；通过神经时间门融合长期偏好和短期偏好，生成最终的偏好嵌入；融合项目嵌入与最终的偏好嵌入，输入到归一化指数函数以对候选项目进行评分预测。本发明主要提出了一个基于神经时间门的长期偏好和短期偏好在维度层面的细粒度融合的方法，学习到更有代表性和更全面的融合偏好嵌入，使模型能挖掘到更精准的用户偏好，提高推荐系统的关键性能。

Description

一种基于图神经网络的神经时间门自适应融合会话推荐方法

技术领域

本发明属于推荐系统领域，涉及图神经网络、深度学习技术领域，尤其涉及基于图神经网络的会话推荐方法。

背景技术

随着技术的进步和在线服务的普及，人们能够以更快的方式获取大量的在线信息。然而，最近普适计算的发展导致了在线数据过载问题。因此，推荐系统的发展近来受到了极大的关注。一般而言，推荐系统充当信息过滤工具，为用户提供合适的个性化内容或信息。在推荐系统里，通常利用用户和物品的所有历史交互来学习用户对项目的偏好，基于会话的推荐正是这样的存在。其作为主要的推荐系统类别之一，需进一步发展以提供适用于不同应用场景的更高效的推荐。

会话是由一个时间段内用户的交互行为序列构成，基于会话的推荐是基于当前历史会话序列来推荐用户下一个点击的物品。由于会话内的点击序列是有序的，所以在对项目建模时考虑其时间顺序是非常必要的。作为一种特殊的推荐场景，基于会话的推荐一直以来有很多学者在对其研究。传统的方法主要是采用基于相似性或者马尔可夫链来生成推荐，但前者忽略了会话的顺序信息，后者则受到了强独立性假设的限制。最近，深度学习的快速发展为解决这些问题提供了一些新方向。研究发现，将循环神经网络(RNN)和图神经网络(GNN)等模型应用到会话推荐场景下，不仅对以上问题提供了有效的解决方案，而且对于获得精确的项目嵌入以及考虑项目的复杂转换方面，其需求也得到了明显的提升，因此，基于图神经网络的推荐方法。

尽管针对会话推荐已经提出了多种方法，但有一些问题仍未得到很好的解决。其中很重要的一点在于，用户在网上购物时，其意图往往是由多种不同程度的兴趣杂糅在一起而组成的，推荐系统需要挖掘用户的深层意图，才能准确地捕获用户的偏好，为用户生成精确的个性化推荐。为了实现这一目标，现有的方法开始对用户兴趣进行分层建模，分别提取长期偏好和短期偏好，以综合考虑用户偏好的全局稳定性和局部波动性，但在融合长短期偏好时，通常使用基于标量的加权模式来融合长期和短期偏好，这种方法过于粗糙，无法充分学习当前偏好的表达性嵌入。

因此，如何充分挖掘序列内部全局的时序关系以及细粒度融合长期和短期偏好，学习到更有代表性和更全面的融合偏好嵌入，使模型能挖掘到更精准的用户偏好，最终完成更为精准的推荐，成为了待解决的问题。

发明内容

本发明的目的是提供一种基于图神经网络的神经时间门自适应融合会话推荐方法，将会话中提取的长短期偏好通过神经时间门自适应地调节对当前兴趣的贡献，用以更加准确地对用户最终偏好进行建模，提升推荐性能。

本发明通过以下技术方案解决上述技术问题：

一种基于图神经网络的神经时间门自适应融合会话推荐方法，包括：

1)、会话图构建层：将用户的历史会话点击序列作为输入，构建成会话图；

2)、会话嵌入层：通过图神经网络学习项目在会话图上的嵌入，得到项目嵌入的向量表示；

3)、注意力网络层：所有项目向量输入注意力网络，分别提取出用户的长期偏好和短期偏好；

4)、神经时间门层：神经时间门融合长期偏好和短期偏好，生成最终的偏好嵌入；

5)、评分预测层：融合项目嵌入与最终偏好嵌入，其结果输入归一化指数函数，对候选项目进行评分预测。

具体地，所述步骤1)包括：

在数据处理方面，本模型主要基于图神经网络方法，需将用户原始的历史会话点击序列构建成具有原序列对应关系的会话图，使其更好地表示出原序列中的各个项目及其复杂的转换关系，具体如下：将所有会话中的唯一项表示为一个集合V＝{v₁,v₂,...,v_m}，s＝[v_s,1,v_s,2,...,v_s,n]表示按时间戳排序的匿名会话序列，其中v_s，i∈V表示用户在会话s内点击的第i个项目，以项目v_s，i∈V为会话图G_s的节点，(v_s，i-1，v_s，i)∈ε_s为会话图G_s的有向边，其边的方向代表一个用户在点击v_s，i-1之后点击v_s，i，将每个会话序列s构建成一个有向图G_s＝(V_s，ε_s)。

进一步地，步骤2)包括：

为了更好地处理图结构数据，引入了门控图神经网络方法。在考虑丰富节点连接的情况下，能够自动提取会话图的特征向量，即通过图神经网络学习项目在会话图上的嵌入向量v_i，其学习过程具体如下：将会话图中的每一个项目的特征表示到一个统一的空间中，得到的向量即为利用GNN得到的d维项目嵌入v_i，采用更适合处理序列数据的门控图神经网络对图G_s的节点进行更新，其计算过程为：

其中，被定义为两个相邻的序矩阵/>和/>的级联，表示会话图的传入和传出边的加权连接。邻接矩阵A_s区分了有向图中边的类型，定义了有向图中的节点如何通过传入和传出的边相互连接。/>为A_s中的第i行，代表节点v_s，i的出度值和入度值。此外，由于会话序列中可能出现重复项，因此需要对每条边计算一个归一化的赋值，该边的初始值除以该节点的传入或传出边的数量。

以上即为通过节点的入度值和出度值聚合其邻居节点的特征信息。其中，是聚合信息后节点的状态向量，/>是会话s中的节点向量的拼接矩阵，/>是可学习的权重矩阵，/>是偏差向量。

其中，是可学习的权重矩阵，σ(·)是sigmoid函数，将连续值映射到(0，1)之间。/>和/>分别是重置门和更新门，重置门过滤掉前一时刻节点状态与当前节点状态无关的部分，更新门决定以前的状态信息保存到当前时间步的内容。

其中，是可学习的权重，tanh(·)表示双曲正切函数，⊙是元素相乘。通过前一状态/>当前状态/>和重置门/>构造候选状态/>在更新门的控制下，将前一个隐藏状态和候选状态组合，不断更新会话图中的所有节点直到收敛之后，获得最终状态的节点向量，图中的节点对应序列中的不同项目，即得到项目嵌入的向量表示v_i。

进一步地，步骤3)包括：

为了更好的预测用户的下一次点击，精准提取用户偏好，制定了一种对用户的兴趣进行分层建模的策略。在得到所有项目向量之后，通过注意力网络分别提取用户的长期偏好和短期偏好，具体计算过程如下：

将每个会话表示为嵌入向量对于会话s＝[v_s，1，v_s，2，...，v_s，n]，局部嵌入s_l可以简单地定义为最后一个点击项v_s，n的项目向量v_n作为用户的短期偏好，即一个会话由参与该会话的最后一个节点向量直接表示：

s_l＝v_n

聚合所有的节点向量提取会话图G_s的全局嵌入s_g。由于嵌入中的信息可能具有不同级别的优先级，需要采用注意力机制来更好地表示长期会话偏好。在计算出会话中项目的注意力系数α_i后，用户的长期偏好可以表示为注意力系数α_i与会话的节点向量v_i的加权和，具体描述如下：

α_i＝q^Tσ(W₁v_n+W₂v_i+c)

其中参数和/>是控制项目嵌入向量的权重矩阵。

进一步地，步骤4)包括：

考虑到用户兴趣的全局稳定性和局部波动性，将会话的长期偏好和短期偏好相结合，能更好地反映当前会话的综合特征，以强调当前偏好与长期稳定偏好对于下一时刻用户兴趣变化的不同程度的影响，更适应用户复杂多变的交互行为。

为了充分融合会话的长短期偏好，使其生成的最终偏好的嵌入向量包含更多当前用户有用的特征信息，根据所提出的神经时间门自适应地融合s_l和s_g，生成最终偏好的嵌入，其流程如图3所示，具体计算过程如下：

神经时间门的任务是根据上次交互的时间与需要进行推荐的时间之间的滞后Δt，在维度水平上调整长期偏好嵌入和短期偏好嵌入的贡献值。为了将时间延迟编码为一个中间嵌入，将其离散化为给定用户任意两个连续交互之间的最小时间差Δmin的倍数。在这种思想下，离散化的时滞被计算为：

其中，表示δ的最大值。通过上述公式，将Δt映射到一个不超过C的正数，然后通过对一个可学习的嵌入矩阵/>的查找，可以得到时间嵌入/>

t＝Tδ

其中，为离散化时滞的独热向量。

通过sigmoid函数计算归一化的神经门控单元向量

g＝sigmoid(W_ls_l+W_gs_g+W_δt+b_g)

其中，和/>分别是神经门控中的参数和偏差向量。

给定用户的最终偏好嵌入s_z通过以下的融合得到：

其中，表示元素级乘积。另外，g是一个向量而非标量，其作用在于使神经时间门在维度层面上调节长期偏好和短期偏好对用户当前兴趣的贡献。

进一步地，步骤5)包括：

在评分预测层，结合用户的最终偏好，评估候选项目在用户兴趣中的匹配度，通过乘法计算得出每个候选项目的推荐得分，即通过融合偏好嵌入s_z和项目嵌入v_i，作为用户u对项目v_i的归一化评分的预测，应用一个softmax函数得到模型的输出向量

其中，表示所有候选项目的推荐分数，/>是一个0到1之间的小数，表示在会话s中出现下一次点击项目的概率。

对于每个会话图，定义了一个损失函数来计算候选项目的真实概率分布和预测评分之间的交叉熵，写成如下形式：

其中，m是训练集中的唯一项目的数量，y_i∈{0，1}是项目v_i的预测点击概率，函数用梯度下降法来实现最优化。

经过上述步骤1)到步骤5)的操作之后，得到用户点击某一候选项目的预测概率，具体模型流程如图2所示。对于不同的候选项目，根据计算出的预测概率值按从大到小的顺序排列，取排名前K的项目对于不同的候选项目，根据计算出的预测概率值按从大到小的顺序排列，取排名前K的项目作为推荐的候选项目。

本发明的有益效果如下：

1)、本发明是一种基于会话图的推荐方法，将会话构建成会话图，可以让模型捕捉到会话中极为复杂的项目转移关系。

2)、本发明是一种融合神经时间门的推荐方法，神经门可以自适应地提取与合并长短期偏好中最重要的部分，使得生成的最终偏好的嵌入向量包含更多有用的特征信息，更加全面地获取用户的个性化偏好，使推荐的结果更加符合用户的兴趣。

附图说明

图1为本发明一种基于图神经网络的神经时间门自适应融合会话推荐方法的流程示意图；

图2为本发明一种基于图神经网络的神经时间门自适应融合会话推荐方法的模型框架图；

图3为本发明基于神经时间门方法生成用户最终偏好的模块示意图。

具体实施方式

参照说明书附图和具体实施例对本发明做以下详细地说明。

首先，对需要用到的变量和公式给出相关定义。

定义1.V：所有会话中涉及的所有唯一项组成的集合，且V＝{v₁，v₂，...，v_m}，m代表唯一项集合中项目的数量。

定义2.s：按时间戳排序的匿名会话序列，s＝[v_s，1，v_s，2，...，v_s，n]，其中v_s，i∈V表示用户在会话s内点击的项目。

定义3.G_s：基于每个会话中交互的项目序列构建的有向图G_s＝(V_s，ε_s)，图中每个节点代表一个项目v_s，i∈V，每条边(v_s，i-1，v_s，i)∈ε_s表示一个用户在点击v_s，i-1之后点击v_s，i。

定义4.v：每个项目通过图神经网络学习到的节点向量其中d是维度。

定义5.s：将每个会话s用一个嵌入向量s表示，该向量由该会话图中使用的节点向量组成。

结合以上变量定义，将最终的问题定义为：给定历史会话序列，对用户兴趣建模，并根据用户偏好预测最可能的下一个点击项目。为了捕捉到会话中项目复杂的转换关系，需要将历史点击序列构建成会话图。出于对用户偏好的全局稳定性和局部波动性的考虑，在对用户兴趣建模的时候，分别提取长短期偏好，并通过神经时间门动态学习长短期偏好对形成用户最终兴趣表征不同程度的贡献。

为此，本发明提出了一种基于图神经网络的神经时间门自适应融合会话推荐方法，方法流程如图1所示，具体包括：

具体地，所述步骤1)包括：

将所有会话中的唯一项表示为一个集合V＝{v₁，v₂，...，v_m}，s＝[v_s，1，v_s，2，...，v_s，n]表示按时间戳排序的匿名会话序列，其中v_s，i∈V表示用户在会话s内点击的项目，将每个会话序列s构建成一个有向图G_s＝(V_s，ε_s)，任一项目v_s，i∈V为会话图G_s的节点，(v_s，i-1，v_s，i)∈ε_s为会话图G_s的有向边，表示一个用户在点击v_s，i-1之后点击v_s，i。

进一步地，步骤2)包括：

进一步地，步骤3)包括：

s_l＝v_n

α_i＝q^Tσ(W₁v_n+W₂v_i+c)

其中参数和/>是控制项目嵌入向量的权重矩阵。

进一步地，步骤4)包括：

t＝Tδ

其中，为离散化时滞的独热向量。

通过sigmoid函数计算归一化的神经门控单元向量

g＝sigmoid(W_ls_l+W_gs_g+W_δt+b_g)

其中，和/>分别是神经门控中的参数和偏差向量。

给定用户的最终偏好嵌入s_z通过以下的融合得到：

进一步地，步骤5)包括：

以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。本发明未详细描述的技术、形状、构造部分均为公知技术。

Claims

1.一种基于图神经网络的神经时间门自适应融合会话推荐方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于图神经网络的神经时间门自适应融合会话推荐方法，其特征在于，所述步骤1)包括：

在数据处理方面，本模型主要基于图神经网络方法，需将用户原始的历史会话点击序列构建成具有原序列对应关系的会话图，使其更好地表示出原序列中的各个项目及其复杂的转换关系，具体如下：将所有会话中的唯一项表示为一个集合V＝{v₁,v₂,...,v_m}，s＝[v_s,1,v_s,2,...,v_s,n]表示按时间戳排序的匿名会话序列，其中v_s,i∈V表示用户在会话s内点击的第i个项目，以项目v_s,i∈V为会话图G_s的节点，(v_s,i-1,v_s,i)∈ε_s为会话图G_s的有向边，其边的方向代表一个用户在点击v_s,i-1之后点击v_s,i，将每个会话序列s构建成一个有向图G_s＝(V_s,ε_s)。

3.根据权利要求1所述的一种基于图神经网络的神经时间门自适应融合会话推荐方法，其特征在于，所述步骤2)包括：

其中，被定义为两个相邻的序矩阵/>和/>的级联，表示会话图的传入和传出边的加权连接。邻接矩阵A_s区分了有向图中边的类型，定义了有向图中的节点如何通过传入和传出的边相互连接。/>为A_s中的第i行，代表节点v_s,i的出度值和入度值。此外，由于会话序列中可能出现重复项，因此需要对每条边计算一个归一化的赋值，该边的初始值除以该节点的传入或传出边的数量。

其中，是可学习的权重矩阵，σ(·)是sigmoid函数，将连续值映射到(0,1)之间。/>和/>分别是重置门和更新门，重置门过滤掉前一时刻节点状态与当前节点状态无关的部分，更新门决定以前的状态信息保存到当前时间步的内容。

4.根据权利要求1所述的一种基于图神经网络的神经时间门自适应融合会话推荐方法，其特征在于，所述步骤3)包括：

将每个会话表示为嵌入向量对于会话s＝[v_s,1,v_s,2,...,v_s,n]，局部嵌入s_l可以简单地定义为最后一个点击项v_s,n的项目向量v_n作为用户的短期偏好，即一个会话由参与该会话的最后一个节点向量直接表示：

s_l＝v_n

a_i＝q^Tσ(W₁v_n+W₂v_i+c)

其中参数和/>是控制项目嵌入向量的权重矩阵。

5.根据权利要求1所述的一种基于图神经网络的神经时间门自适应融合会话推荐方法，其特征在于，所述步骤4)包括：

神经时间门的任务是根据上次交互的时间与需要进行推荐的时间之间的滞后Δt，在维度水平上调整长期偏好嵌入和短期偏好嵌入的贡献值。为了将时间延迟编码为一个中间嵌入，将其离散化为给定用户任意两个连续交互之间的最小时间差Δmin的倍数。在这种思想下，离散化的时滞被定义为：

t＝Tδ

其中，为离散化时滞的独热向量。

通过sigmoid函数计算归一化的神经门控单元向量

g＝sigmoid(W_is_i+W_gs_g+W_δt+b_g)

其中，和/>分别是神经门控中的参数和偏差向量。

给定用户的最终偏好嵌入s_z通过以下的融合得到：

6.根据权利要求1所述的一种基于图神经网络的神经时间门自适应融合会话推荐方法，其特征在于，所述步骤5)包括：

其中，m是训练集中的唯一项目的数量，y_i∈{0,1}是项目v_i的预测点击概率，函数用梯度下降法来实现最优化。