CN112967112A

CN112967112A - 一种自注意力机制和图神经网络的电商推荐方法

Info

Publication number: CN112967112A
Application number: CN202110312156.3A
Authority: CN
Inventors: 彭博文
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2021-03-24
Filing date: 2021-03-24
Publication date: 2021-06-15
Anticipated expiration: 2041-03-24
Also published as: CN112967112B

Abstract

本发明提供一种自注意力机制和图神经网络的电商推荐方法。首先对电商交易数据进行预处理，提取到符合要求的会话，并生成序列和标签构成实验所用的数据集；根据预处理得到的数据集，构成会话图进行权重归一化处理后，输入到图神经网络里得到图内节点向量表示；最后从图内节点的向量表示提取出局部兴趣向量表示和全局向量表示，然后对局部兴趣向量表示和全局向量表示分别使用自注意力机制，得到对应局部自注意力向量和全局自注意力向量，并将这些向量聚合起来，得到混合兴趣的向量表示，用于给用户推荐喜欢的高评分物品。本发明充分考虑到用户以往的点击的相关信息，提供了一种效果更好的推荐方法。

Description

一种自注意力机制和图神经网络的电商推荐方法

技术领域

本发明属于数据挖掘应用中的个性化推荐技术领域，特别是涉及一种自注意力机制和图神经网络的电商推荐方法。

背景技术

当前，在海量数据的时代下，伴随着对于用户存在的信息茧房问题，如何基于用户的历史数据下，提供有效的个性化推荐结果是有待解决的重要问题。采用科学且有效的方法对数据进行挖掘提取出用户兴趣并生成合适的个性化推荐系统，是解决这一问题的主要手段。

与上述不同的是，实际工作中的用户历史行为数据往往是过长的，但面临海量数据、低延时、计算资源有限情况，即不得不将推荐算法建立在一个短会话的情况下，但同时这种将会话看成为序列化信息而提取，是没有完全考虑到不同物品的转换情况，故在这里提出一种利用图神经网络，构成会话图，通过图中物品与物品间的转换关系，即节点与节点的共现关系，来捕获更准确的物品向量表示。同时，通过自注意力机制更准确地提取出该会话内的对于物品的兴趣，也将更好地捕捉用户偏好。故提出一个基于自注意力机制和图神经网络的推荐方法。

发明内容

本发明的目的是克服没有充分利用用户画像和用户的以往的信息，会话图中物品和物品的转换关系提取不准确的不足，本发明通过自注意力机制和图神经网络对物品向量表示进行更准确的捕获，更好地获得物品与物品间的转换关系，有效地提取出用户的兴趣偏好。在此上，能够通过有效地学习用户兴趣，从而提供推荐效果更准确的推荐方法。

本发明的技术方案为一种自注意力机制和图神经网络的电商推荐方法，包含以下步骤：

步骤1，获取目标用户的电商交易数据构成数据集，并对数据集进行预处理，得到有效会话长度的电商交易数据集；

步骤2，根据步骤1所得数据集，根据时间戳生成对应的会话序列和标签作为实验数据集；

步骤3，根据步骤2所得的实验数据集中的会话序列以会话图的形式存储，每一个会话序列S＝[V₁,V₂,...,V_n]视为一个有向图G＝(V,E)，在会话图中，每个节点都对应一个物品V_i，边(V_i-1,V_i)对应用户在会话中点击了物品V_i-1之后又点击了物品V_i；

步骤4，根据步骤3所得的会话图，对图内边进行权重归一化方法处理，得到归一化会话图；

步骤5，根据步骤4所得归一化会话图，通过图神经网络学习到会话图内节点的向量表示；

步骤6，根据步骤5所得的节点的向量表示，提取出会话S＝[V₁，V₂，...，V_n]内的局部兴趣向量表示和全局兴趣向量表示；

步骤7，根据步骤6所得的局部兴趣向量表示和全局兴趣向量表示，输入到多头自注意力机制网络中，计算得到自注意力局部兴趣向量和自注意力全局兴趣向量表示；

步骤8，将局部兴趣向量表示，全局兴趣向量表示，自注意力局部兴趣向量和自注意力全局兴趣向量表示聚合起来，计算得到混合兴趣的向量表示V_h；

步骤9，根据混合兴趣的向量表示计算出用户在每个物品上的喜爱程度的评分；

步骤10，按照目标用户在每个物品上的喜爱程度，选择用户喜爱程度最高的前k个物品推荐给目标用户。

进一步的，所述步骤4中权重的计算方式如下；

步骤4.1，计算会话图内的每条边(V_i-1，V_i)的出现次数C，每个节点出度D_out，其中某节点出度是指由该节点为起点的边的个数；

步骤4.2，计算每条边的权重，并对图内边的权重归一化，权重的计算公式为：

其中，

表示边(V_i-1，V_i)的权重，

表示边(V_i-1，V_i)的出现次数，

表示节点v_i-1的出度。

进一步的，步骤5中通过图神经网络学习到会话图内节点的向量表示分为两个步骤，第一步是传播过程，第二步是输出过程；传播过程是指初始化节点表示，然后通过迭代获取节点表示的过程，具体计算公式如下：首先初始化节点表示

然后每个节点使用迭代方式更新表示，

其中

表示节点V在时刻t的向量表示，l_V表示节点V，l_Neighbor(V)表示节点V的邻居节点，

表示节点V的邻居节点的向量表示，f表示一种映射，将时刻t-1的邻居节点的向量表示映射到时刻t的节点V的向量表示；

输出过程是指根据节点表示得到目标输出的过程，具体计算公式如下：

其中O_V表示节点级别的输出向量表示，

表示节点V在时刻t的向量表示，l_V表示节点V，g表示一种映射，将节点的向量表示映射成输出向量。

进一步的，所述步骤6中通过提取会话图内兴趣的向量表示来得到用户的局部兴趣和全局兴趣，局部兴趣为某一次点击的节点向量作为局部兴趣的向量表示V_l＝V_n，选取最后一次点击的节点向量作为用户的局部兴趣的向量表示；对于全局兴趣的向量表示，通过对会话S内的所有节点的向量表示进行聚合操作，得到全局兴趣的向量表示，具体计算公式：V_g＝aggregate(V₁，V₂，...，V_n)；这里的聚合操作包括求和，求平均值，求方差中的任一种。

进一步的，所述步骤7具体包括；

通过将局部兴趣的向量表示V_l和全局兴趣的向量表示V_g分别输入到多头自注意力机制网络中计算得到自注意力局部兴趣向量和自注意力全局兴趣向量表示，具体计算公式如：LinearTransformation(V)＝A*V+B，其中V是输入向量，A是权重矩阵，B是偏差向量；

对于自注意力机制，其中Q，K，V分别是同一向量表示，d为Q向量的维度，这里将Q，K，V替换成V_l和V_g，分别计算出自注意力局部兴趣向量V_{s_l}和自注意力全部兴趣向量V_{s_g}。

进一步的，所述步骤8具体包括，将局部兴趣向量表示，全局兴趣向量表示，自注意力局部兴趣向量和自注意力全局兴趣向量表示聚合起来，计算得到混合兴趣的向量表示V_h，具体计算公式如：V_h＝concat(V_l，V_g，V_{s_l}，V_{s_g})，其中，V_l为局部兴趣的向量表示，V_g为全局兴趣的向量表示，V_{s_l}为自注意力局部兴趣向量表示，V_{s_h}为自注意力全局兴趣向量表示。

进一步的，所述步骤9具体包括，将混合兴趣的向量表示V_h输入到softmax函数，得到物品在会话s中成为下一次点击的概率，将该概率值作为对应物品的喜爱程度的评分，具体计算公式如：y＝softmax(V_h)。

本发明的优势在于，能够从用户的历史会话行为数据所构成的会话图中，通过图神经网络有效地捕获了会话内和会话间的物品与物品间的转换关系，更加准确地捕获到用户兴趣。同时，根据提取到的局部兴趣和全局兴趣，由自注意力机制进一步地提取用户兴趣表示，从而提供更加准确的推荐方法。

利用图神经网络能够从用户的历史会话行为数据，通过构成会话图，不仅有效地捕获会话内的物品与物品间的转换关系，还考虑到了会话间的物品与物品间的转换关系，更加准确地捕获到用户的兴趣。同时，根据捕获到的局部兴趣和全局兴趣，通过自注意力机制进一步更好地表示用户的兴趣，从而提供更加准确的推荐方法。

附图说明

图1是本发明实施例的流程图。

图2是本发明实施例构成会话图的示意图。

图3是图神经网络学习到节点向量表示的示意图。

图4是图神经网络进行消息传播的示意图。

图5是本发明实施例计算混合兴趣表示的示意图。

图6是本发明模型结构的示意图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

步骤1，获取目标用户的电商交易数据构成数据集，并对数据集进行预处理，过滤掉其中会话长度过短和过长的历史交易数据，得到有效会话长度的电商交易数据集；

对目标用户进行个性化推荐，需要基于已有的短会话下进行预处理，对于过长或过短的会话进行筛除。

本实施例中，实验数据集为两个具有代表性的真实数据，Yoochoose数据集和Diginetica数据集。Yoochoose数据集是来自RecSys 2015挑战赛，里面包括了在6个月内，用户在电商网站上的点击数据。Diginetica数据集来自CIMK 2016挑战赛，抽取里面交易数据进行使用。在这里过滤掉两个数据集中物品次数为1次的会话和物品出现次数少于4次的会话，所剩余的7981580个会话和37483个物品构成了Yoochoose数据集，204771个会话和43097个物品构成了Diginetica数据集。并将数据第一行作为表头标记每列数据的特征名，以dat格式进行存储到磁盘上。

给实验数据打标签是很重要的一个环节，可以通过打好的标签数据，构建好一个合理的验证集，便于后续实验的正常开展。在这里考虑到是通过已有的会话来预测目标用户在未来下一次的点击与否的情况，所以我们考虑取目标用户的会话S里的前k个物品作为对应用户点击过的序列，第k+1个物品作为数据集里需要预测用来确定是否点击是否的验证集标签，故此形成所需数据集。具体的例子如下，

例如，对于输入的会话S＝[V₁,V₂,...,V_n]是由用户访问过的一系列物品组成，生成了一系列的序列和标签([V₁]，V₂)，([V₁，V₂]，V₃)，...，([V₁，V₂，...，V_n-1]，V_n)其中[V₁，V₂，...，V_n-1]是生成的序列，V_n是下一个点击的物品，即该序列的标签；

步骤3，根据步骤2所得的实验数据集中的会话序列以会话图的形式存储。每一个会话序列S＝[V₁，V₂，...，V_n]都可以视为一个有向图G＝(V，E)。在会话图中，每个节点都对应的一个物品V_i，边(V_i-1，V_i)对应用户在会话中点击了物品V_i-1之后又点击了物品V_i；

在已经得到会话对应的序列和标签后，进行一个会话图的构建。封装好一个Data的数据结构，里面分别存储节点特征矩阵，节点索引，训练目标。节点特征矩阵存储每个节点的编号；节点索引以节点对的形式存储边，描述边的连接情况，默认是以有向边的情况存储，无向边则按双向有向边进行存储；训练目标存储图级别的标签。具体例子如下，

例如，对于输入的会话S＝[V₁，V₂，...，V_n]，其对应的序列和标签是([V₁，V₂，...，V_n-1]，V_n)

一个节点在图内的影响力往往取决于该节点的邻居节点的个数，为了解决对有着较多邻居节点的节点存在的影响力的偏差问题以及考虑到自身节点进行信息自传播的冗余信息情况，在这里通过引入图内边权重归一化方法进行处理，从而减少这些问题在信息传播的过程中带来的不好影响。具体计算公式如下，

其中，

表示边(V_i-1，V_i)的权重，

表示边(V_i-1，V_i)的出现次数，

表示节点v_i-1的出度，其中某节点出度是指由该节点为起点的边的个数。

图内节点的向量表示，综合考虑从网络内的结构和节点建模。将输入数据到图神经网络里得到结果，主要可以分为两个步骤，第一步是传播过程，第二步是输出过程。传播过程是指初始化节点表示，然后通过迭代获取节点表示的过程。具体计算公式如下：首先初始化节点表示

然后每个节点使用迭代方式更新表示，

其中

表示节点V的邻居节点的向量表示，f表示一种映射，将时刻t-1的邻居节点的向量表示映射到时刻t的节点V的向量表示，这里是选择通过神经网络映射。

输出过程是指根据节点表示得到目标输出的过程。具体计算公式如下：

其中O_V表示节点级别的输出向量表示，

表示节点V在时刻t的向量表示，l_V表示节点V，.g表示一种映射，将节点的向量表示映射成输出向量，这里是选择softmax函数。

用户的兴趣表示是对用户个性化表示的描述。通过提取会话图内兴趣的向量表示来得到用户的局部兴趣和全局兴趣。局部兴趣可以选择某一次点击的节点向量作为局部兴趣的向量表示V_l＝V_n，往往选取最后一次点击的节点向量作为用户的局部兴趣的向量表示；全局兴趣的向量表示可以选择用户在会话内遍历过的所有节点的向量表示进行聚合操作，V_g＝aggregate(V₁，V₂，...，V_n)；这里的聚合操作可以是求和，求平均值，求方差等等。

多头自注意力机制是先将输入向量做线性变换映射到不同空间内，再进行自注意力机制的计算，可以看作多个自注意力机制网络的结合。通过将局部兴趣的向量表示V_l和全局兴趣的向量表示V_g分别输入到多头自注意力机制网络中计算得到自注意力局部兴趣向量和自注意力全局兴趣向量表示，具体计算公式如：LinearTransformation(V)＝A*V+B，其中V是输入向量，A是权重矩阵，B是偏差向量。

对于自注意力机制，其中Q，K，V分别是同一向量表示，d为Q向量的维度，这里我们将Q，K，V替换成V_l和V_g，分别计算出自注意力局部兴趣向量V_{s_l}和自注意力全部兴趣向量V_{s_g}。

最后再将得到局部兴趣和全局兴趣的向量表示以及自注意力局部兴趣向量V_{s_l}和自注意力全局兴趣向量表示V_{s_g}连接起来，得到混合兴趣的向量表示，具体计算公式为，V_h＝concat(V_l，V_g，V_{s_}l，V_{s_g})。

将所有物品的混合兴趣的向量表示V_h输入到softmax函数里，得到对应物品在会话S中成为下一次点击的概率，并将计算所得概率值作为对应物品的喜爱程度的评分，具体计算公式为，y＝softmax(V_h)。

步骤10，按照目标用户在每个物品上的喜爱程度，选择评分高的物品。具体是，选择用户喜爱程度最高的前k个物品推荐给目标用户；

现有协同过滤，矩阵分解等推荐技术普遍存在没有充分利用用户画像，仅仅只是考虑了用户的最后一次曝光/点击，而忽略了以往的点击的相关信息等问题。本发明充分利用了图神经网络能够有效地提取出用户以往的历史会话行为数据，通过构成会话图，不仅有效地捕获会话内的物品与物品间的转换关系，还考虑到了会话间的物品与物品间的转换关系，更加准确地捕获到用户的兴趣。同时，根据局部兴趣，全局兴趣自注意力局部兴趣向量和自注意力全局兴趣向量表示来更好地表示用户的兴趣，且在模型结构上做了更多的创新，更好地解决不能充分提取会话图内的交互信息，且考虑到用户某一短期内的兴趣演化和长期内不同短期的兴趣演化的差异，能更好地提取到这些信息，并解决了用户兴趣提取不够准确和数据稀疏情况下，推荐效果不够准确的问题，从而提供更加准确的推荐方法。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种自注意力机制和图神经网络的电商推荐方法，其特征在于，包含以下步骤：

步骤6，根据步骤5所得的节点的向量表示，提取出会话S＝[V₁,V₂,...,V_n]内的局部兴趣向量表示和全局兴趣向量表示；

2.根据权利要求书1所述的一种自注意力机制和图神经网络的电商推荐方法，其特征在于：所述步骤4中权重的计算方式如下；

步骤4.1，计算会话图内的每条边(V_i-1,V_i)的出现次数C，每个节点出度D_out，其中某节点出度是指由该节点为起点的边的个数；

其中，

表示边(V_i-1,V_i)的权重，

表示边(V_i-1,V_i)的出现次数，

表示节点v_i-1的出度。

3.根据权利要求书1所述的一种自注意力机制和图神经网络的电商推荐方法，其特征在于：步骤5中通过图神经网络学习到会话图内节点的向量表示分为两个步骤，第一步是传播过程，第二步是输出过程；传播过程是指初始化节点表示，然后通过迭代获取节点表示的过程，具体计算公式如下：首先初始化节点表示

然后每个节点使用迭代方式更新表示，

其中

其中O_V表示节点级别的输出向量表示，

4.根据权利要求书1所述的一种自注意力机制和图神经网络的电商推荐方法，其特征在于：所述步骤6中通过提取会话图内兴趣的向量表示来得到用户的局部兴趣和全局兴趣，局部兴趣为某一次点击的节点向量作为局部兴趣的向量表示V_l＝V_n，选取最后一次点击的节点向量作为用户的局部兴趣的向量表示；对于全局兴趣的向量表示，通过对会话S内的所有节点的向量表示进行聚合操作，得到全局兴趣的向量表示，具体计算公式：V_g＝aggregate(V₁,V₂,…,V_n)；这里的聚合操作包括求和，求平均值，求方差中的任一种。

5.根据权利要求书1所述的一种自注意力机制和图神经网络的电商推荐方法，其特征在于：所述步骤7具体包括；

对于自注意力机制，其中Q,K,V分别是同一向量表示，d为Q向量的维度，这里将Q,K,V替换成V_l和V_g，分别计算出自注意力局部兴趣向量V_{s_l}和自注意力全部兴趣向量V_{s_g}。

6.根据权利要求书1所述的一种自注意力机制和图神经网络的电商推荐方法，其特征在于：所述步骤8具体包括，将局部兴趣向量表示，全局兴趣向量表示，自注意力局部兴趣向量和自注意力全局兴趣向量表示聚合起来，计算得到混合兴趣的向量表示V_h，具体计算公式如：V_h＝concat(V_l,V_g,V_{s_l},V_{s_g})，其中，V_l为局部兴趣的向量表示，V_g为全局兴趣的向量表示，V_{s_l}为自注意力局部兴趣向量表示，V_{s_g}为自注意力全局兴趣向量表示。

7.根据权利要求书1所述的一种自注意力机制和图神经网络的电商推荐方法，其特征在于：所述步骤9具体包括，将混合兴趣的向量表示V_h输入到softmax函数，得到物品在会话s中成为下一次点击的概率，将该概率值作为对应物品的喜爱程度的评分，具体计算公式如：y＝softmax(V_h)。