CN111783963A

CN111783963A - 一种基于星图神经网络的推荐方法

Info

Publication number: CN111783963A
Application number: CN202010724540.XA
Authority: CN
Inventors: 蔡飞; 潘志强; 毛彦颖; 李瞻哲; 宋城宇; 王祎童; 凌艳香; 陈皖玉; 陈洪辉
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-07-24
Filing date: 2020-07-24
Publication date: 2020-10-16

Abstract

本发明公开了一种基于星图神经网络的推荐方法，包括以下步骤：A、通过嵌入层会话中的每个物品x_i生成一个d维的向量x_i∈R^d，每个会话被构造成一个星会话图；B、嵌入的物品被输入到多层的星图神经网络中，使用高速网络来结合星图神经网络之前和之后的物品嵌入；C、通过结合会话中的一般偏好和近期兴趣来表示该会话；在获得会话表示之后，通过计算在所有候选物品上的分数来产生推荐。本发明能够解决现有技术的不足，提高了推荐效果。

Description

一种基于星图神经网络的推荐方法

技术领域

本发明属于推荐系统技术领域，具体是一种基于星图神经网络的推荐方法。

背景技术

荐系统可以帮助人们获得个性化的信息，在网络搜索、电子商务等中有着广泛应用。许多现存的推荐方法利用用户长期的历史交互来获取他们的偏好从而进行推荐，例如协同过滤 (CF)、因式分解个性化马尔可夫链(FPMC)，和基于深度学习的方法等。对于用户的长期历史交互不可利用的情境下，例如新用户，准确地获取用户的偏好是很有挑战的。基于会话的推荐就是仅仅基于正在进行的会话来产生推荐。当前的基于会话推荐的方法大多数通过循环神经网络(RNN)来关注于物品间的时序信息，注意力机制来抓住用户的主要意图。然而，循环神经网咯和注意力机制并不能完全地将物品间的传递关系考虑进去，因为传递关系远比简单的时间顺序要复杂。为了更加准确地建模物品间的传递关系，图神经网络被用于建模一个正在进行的会话。然而，基于图神经网络的方法只能从临济物品中传播信息，因此忽略了没有直接相连的物品中的信息。多层图神经网络可以被用来传递无直接相连关系的物品间的信息。然而，它们很容易过拟合。

发明内容

本发明要解决的技术问题是提供一种基于星图神经网络的推荐方法，能够解决现有技术的不足，提高了推荐效果。

本发明的内容包括以下步骤，

A、通过嵌入层会话中的每个物品x_i生成一个d维的向量x_i∈R^d，每个会话被构造成一个星会话图；

B、嵌入的物品被输入到多层的星图神经网络中，使用高速网络来结合星图神经网络之前和之后的物品嵌入；

C、通过结合会话中的一般偏好和近期兴趣来表示该会话；在获得会话表示之后，通过计算在所有候选物品上的分数来产生推荐。

作为优选，步骤A中，对于每个会话S＝{v₁，v₂，...v_t，...，v_n}，构建一个星图来表示会话中物品之间的传递关系，通过添加中心节点来包括未直接相连的物品，这里的中心节点与会话星图中的所有节点均有连接，V＝{v₁，v₂，...，v_|V|}表示所有会话内所有唯一的物品，这里|V|是所有唯一的物品的数目，v_t∈V表示会话内第t个物品；

每个会话都被表示为G_s＝{V_s，E_s}，V_s＝{{x₁，x₂，...x_m}，x_s}表示星图内所有唯一的节点，{x₁，x₂，...x_m}表示会话内所有唯一的节点，称为卫星节点，x_s是新添加的星节点，其中m≤n。

作为优选，星图包括卫星连接和中心连接两种类型的边。

作为优选，对于卫星连接，即边(x_i，x_j)∈E_s，用户在点击物品x_i之后点击了x_j，会话中两个物品之间的邻接关系使用入度矩阵和出度矩阵来表示。

作为优选，添加一个星节点来传递来自于非邻接物品的信息，在星图中添加一个星节点和卫星节点之间的双向边，使用从星节点到卫星节点的有向边来更新卫星节点，通过卫星节点，来自于未连接节点的信息可以通过将星节点作为中继节点的方法，以两跳的方式来传递；从卫星节点到星节点的有向边来更新星节点，通过考虑星图内的所有节点，来帮助生成准确的星节点的表示。

作为优选，步骤B中，在将节点传递进星图神经网络之前，首先初始化卫星节点和星节点的表示；对于卫星节点，直接将会话内不重复的物品的嵌入作为卫星节点表示：

h⁰＝{x₁，x₂，...，x_m}，

x_i∈R^d是星图中卫星节点i的一个d维的嵌入向量；对于星节点，用

来表示，在卫星节点上应用平均池化来得到中心节点的初始化，即

作为优选，步骤B中，按照以下步骤来更新卫星节点和中心节点；

对于卫星节点，用于传递信息的邻居节点来自于两种来源，即邻接节点和中心节点；当信息来自于邻接节点时，分别对应来自于有直接连接和无直接连接的节点；对于第1层星图中的每个卫星节点x_i使用入度矩阵和出度矩阵来获得传递的信息，

是节点x_i对应的入度权重和出度权重，即入度矩阵和出度矩阵的第i行， W^I，W^O∈R^d×d分别是对于入度边和出度边的可学习的权重，b^I，b^O∈R^1×d是偏置向量，从而获得

代表对于节点x_i的传递关系，将

和x_i的先前状态

输入到门控图神经网络，

W_z，W_r，W_h∈R^d×2d和U_z，U_r，U_h∈R^d×d是网络中可训练的参数，σ表示sigmoid激活函数，e表示元素级别的相乘，

和

是更新门和重置门，分别控制之前状态

被保存下来，以及控制之前状态中的信息被写进候选激活

当信息来自于中心节点时，使用自注意力机制来计算每个卫星节点x_s和中心节点x_i的相似度

W_q1，W_k1∈R^d×d是可训练的参数，

和

分别是对应于x_i和x_s的物品表示，使用一个门控网络来融合来自于邻接节点

和中心节点的信息

对于中心节点，引入自注意力机制来通过将中心节点作为query来对不同卫星节点赋予不同程度的重要性；每个卫星节点的重要性由中心节点来决定，

q∈R^1×d和K∈R^m×d分别由卫星节点和中心节点转换而来，W_q2，W_k2∈R^m×d是对应的可训练的参数，在获得重要性程度之后，使用线性结合将卫星节点结合起来作为中心节点的新的表示，

β∈R^m是所有卫星节点的权重。

作为优选，步骤B中，对于L层的星图神经网络，星图神经网络之前和之后的物品嵌入分别表示为h⁰和h^L，高速网络表示为：

h^f＝ge h⁰+(1-g)e h^L，

门控g∈R^m×d由多层图神经网络的输入和输出来决定，

g＝σ(W_g[h⁰；h^L])，

[·]表示拼接操作，W_g∈R^d×2d是可训练的参数，将拼接的向量从R^2d转化为R^d， σ是sigmoid函数。

作为优选，步骤C中，从对应的卫星节点h^f∈R^m×d来获得时序的物品表示u∈R^n×d，通过添加可学习的位置嵌入p∈R^n×d引入时序信息，即u^p＝u+p；将最后一个物品的表示作为用户的最近兴趣，即

将物品按照它们对应的优先级结合起来，

优先级γ_i由中心节点x_s和最近兴趣z_r同时决定，物品的权重由注意力机制来决定，

W₀∈R^1×d，W₁，W₂，W₃∈R^d×d是用于控制权重的可训练的参数，b∈R^d是偏置项，将用户的整体偏好和最近兴趣通过拼接的方式结合起来，

[·]是拼接操作，W₄∈R^d×2d将拼接后的矩阵从R^2d转化为R^d；在会话表示z_h和每个物品的嵌入表示v_i上使用层归一化，分别可以表示为

和

在归一化之后，通过将会话表示和所有的物品嵌入相乘来得到在每个候选物品上的分数

使用softmax层来归一化候选物品上的偏好分数；通过使用比例系数τ避免训练无法收敛的问题，最终的分数为

中分数最高的物品将被推荐给用户。

作为优选，使用反向传播算法训练包含高速网络的星图神经网络模型，采用交叉熵来作为目标函数学习参数，

y_i∈y是真实值的独热编码中一个物品的值，如果第i个物品是给定会话的目标物品，那么y_i＝1，反之y_i＝0。

本发明的有益效果是：本发明通过在信息传播中考虑远距离物品之间的关系，并且使用高速网络来解决图神经网络中的过拟合问题。在候选物品的数目较少时，本发明更能够将目标物品排在推荐列表中的前列，而在目标物品数目相对较多时，在命中目标物品上更加有效。对于长篇幅会话，本发明使得物品间的复杂传递关系能够被多层的星图神经网络更准确地调查，从而能够促进目标物品在推荐列表中的排序位置。

附图说明

图1为本发明包含高速网络的星图神经网络的工作原理图。

图2为本发明和另外两个现有推荐方法在Recall@20指标上的效果对比图。

图3为本发明和另外两个现有推荐方法在MRR@20指标上的效果对比图。

图4为本发明和另外两个现有推荐方法在不同的GNN层数情况下针对Yoochoose1/64数据集在Recall@20指标上的效果对比图。

图5为本发明和另外两个现有推荐方法在不同的GNN层数情况下针对Yoochoose1/64数据集在MRR@20指标上的效果对比图。

图6为本发明和另外两个现有推荐方法在不同的GNN层数情况下针对Yoochoose1/4数据集在Recall@20指标上的效果对比图。

图7为本发明和另外两个现有推荐方法在不同的GNN层数情况下针对Yoochoose1/4数据集在MRR@20指标上的效果对比图。

图8为本发明和另外两个现有推荐方法在不同的GNN层数情况下针对Diginetica数据集在Recall@20指标上的效果对比图。

图9为本发明和另外两个现有推荐方法在不同的GNN层数情况下针对Diginetica数据集在MRR@20指标上的效果对比图。

图10为不同会话长度的本发明和另外三个现有推荐方法针对Yoochoose 1/64数据集在 Recall@20指标上的效果对比图。

图11为不同会话长度的本发明和另外三个现有推荐方法针对Yoochoose 1/64数据集在 MRR@20指标上的效果对比图。

图12为不同会话长度的本发明和另外三个现有推荐方法针对Yoochoose 1/4数据集在 Recall@20指标上的效果对比图。

图13为不同会话长度的本发明和另外三个现有推荐方法针对Yoochoose 1/4数据集在 MRR@20指标上的效果对比图。

图14为不同会话长度的本发明和另外三个现有推荐方法针对Diginetica数据集在 Recall@20指标上的效果对比图。

图15为不同会话长度的本发明和另外三个现有推荐方法针对Diginetica数据集在 MRR@20指标上的效果对比图。

具体实施方式

参照图1，一种基于生成对抗网络的数据脱敏方法，包括以下步骤，

步骤A中，对于每个会话S＝{v₁，v₂，...v_t，...，v_n}，构建一个星图来表示会话中物品之间的传递关系，通过添加中心节点来包括未直接相连的物品，这里的中心节点与会话星图中的所有节点均有连接，V＝{v₁，v₂，...，v_|V|}表示所有会话内所有唯一的物品，这里|V|是所有唯一的物品的数目，v_t∈V表示会话内第t个物品；

星图包括卫星连接和中心连接两种类型的边。

对于卫星连接，即边(x_i，x_j)∈E_s，用户在点击物品x_i之后点击了x_j，会话中两个物品之间的邻接关系使用入度矩阵和出度矩阵来表示。

添加一个星节点来传递来自于非邻接物品的信息，在星图中添加一个星节点和卫星节点之间的双向边，使用从星节点到卫星节点的有向边来更新卫星节点，通过卫星节点，来自于未连接节点的信息可以通过将星节点作为中继节点的方法，以两跳的方式来传递；从卫星节点到星节点的有向边来更新星节点，通过考虑星图内的所有节点，来帮助生成准确的星节点的表示。

步骤B中，在将节点传递进星图神经网络之前，首先初始化卫星节点和星节点的表示；对于卫星节点，直接将会话内不重复的物品的嵌入作为卫星节点表示：

h⁰＝{x₁，x₂，...，x_m}，

步骤B中，按照以下步骤来更新卫星节点和中心节点；

代表对于节点x_i的传递关系，将

和x_i的先前状态

输入到门控图神经网络，

和

是更新门和重置门，分别控制之前状态

被保存下来，以及控制之前状态中的信息被写进候选激活

W_q1，W_k1∈R^d×d是可训练的参数，

和

和中心节点的信息

β∈R^m是所有卫星节点的权重。

步骤B中，对于L层的星图神经网络，星图神经网络之前和之后的物品嵌入分别表示为h⁰和h^L，高速网络表示为：

h^f＝ge h⁰+(1-g)e h^L，

门控g∈R^m×d由多层图神经网络的输入和输出来决定，

g＝σ(W_g[h⁰；h^L])，

步骤C中，从对应的卫星节点h^f∈R^m×d来获得时序的物品表示u∈R^n×d，通过添加可学习的位置嵌入p∈R^n×d引入时序信息，即u^p＝u+p；将最后一个物品的表示作为用户的最近兴趣，即

将物品按照它们对应的优先级结合起来，

和

中分数最高的物品将被推荐给用户。

使用反向传播算法训练包含高速网络的星图神经网络模型，采用交叉熵来作为目标函数学习参数，

实验验证

本实验在两个公开可获取的基准数据集，Yoochoose和Diginetica上评估本发明的表现。 Yoochoose是一个由RecSysChanllenge 2015放出的公开数据及，包含了一个电商网站在六个月内的点击流。Diginetica从CIKM Cup 2016上获得。这里我们只采用了交易数据。

对于Yoochoose，我们过滤了长度为1的会话和出现次数少于5次的物品。然后我们将会话分为训练集和测试集。最后一个的会话被用于测试，其余部分被当做训练集。另外，我们去除了没有在训练集中出现的物品。对于Diginetica来说，唯一的区别就是我们使用最后一周的数据用于测试。在预处理之后，Yoochoose数据集上还包含7,981,580个会话和37,483 个物品，在Diginetica数据集上还存在204,771个会话和43,097物品。

我们使用时序分割的预处理方法来增加训练样本。具体说，对于会话S＝{v₁，v₂，...，v_n} 我们生成序列和其对应的标签，({[v₁]，v₂}，{[v₁，v₂]，v₃}，...，{[v₁，v₂，...，v_n-1]，v_n})，用于训练和测试。另外，因为Yoochoose数据集过大，我们只采用最近的1/64和1/4用于训练，分别用Yoochoose 1/64和Yoochoose 1/4来表示。三个数据集，即Yoochoose1/64，Yoochoose 1/4，Diginetica的数据在表1中提供。

表1

数据	Yoochoose 1/64	Yoochoose 1/4	Diginetica
				点击数	557,248	8,236,407	982,961
训练会话数	369,859	5,917,746	719,470
				测试会话数	55,898	55,898	60,858
物品数	16,766	29,618	43,097
				平均会话长度	6.16	5.71	5.12

本实验中涉及到的现有模型如下：(1)两个传统方法，即S-POP和FPMC；(2)三个基于 RNN的方法，即GRU4REC，NARM和CSRM；(3)两个基于注意力的方法，即STAMP和SR-IEM；和(4)两个基于图神经网络的方法，即SR-GNN和NISER+。S-POP为当前会话推荐最流行的物品。FPMC是基于马尔科夫链的时序推荐上的最先进的模型。因为用户表示在基于会话的推荐中不可用，因此我们忽略掉它。GRU4REC使用GRU来建模基于会话的推荐中的时序行为，并且采用了会话并行的批训练策略。NARM应用GRU来建模时序行为，并且使用注意力机制来抓住用户的主要兴趣。CSRM通过使用并行记忆模块引入邻居会话作为辅助信息来帮助建模当前会话，来扩展NARM。STAMP使用注意力机制来获得整体偏好并且将最后一个物品作为近期兴趣来进行预测。R-IEM使用改进的注意力机制来衡量物品主要性，并且基于全局偏好和当前兴趣来进行推荐。R-GNN使用门控图神经网络来获取物品的嵌入向量，并且基于注意力机制生成会话表示从而进行推荐。NISER+引入L2归一化来解决长尾问题，并且使用dropout来缓解SR-GNN中的过拟合问题。

我们使用6层的SGNN来获得物品嵌入向量。从训练集中随机选出10％作为验证集并用于决定超参数。批大小被设为100，物品嵌入向量维度被设为256。我们采用Adam优化器，初始学习率设为1e-3，每3个epoch衰减0.1。另外，L2正则化被设为1e-5来防止过拟合，比例系数在3个数据集上都被设为12。所有的参数都使用平均值为0，标准差为0.1的高斯分布来进行初始化。

我们采用Recall@K和MRR@K来衡量推荐效果。

Recall@K：Recall@K衡量目标物品是否在推荐列表的前K个。

N是数据集中测试序列的数目，n_hit是目标物品在推荐列表里的数目。

MRR@K：MRR@K分数考虑了目标物品在推荐列表里的位置。如果目标物品在推荐列表的前 K个之外，它将被设为0.否则，将计算如下，

Rank(v_target)是推荐列表中目标物品的位置。与Recall@K相比，MRR@K是一个归一化的命中，将目标物品的位置考虑了进来。

表2展现了所提出的本发明(SGNN-HN)和基准模型的结果。

表2

对于基准模型，我们可以看到神经模型普遍优于传统模型，即S-POP和FPMC。神经模型可以被分为以下几种：

基于RNN的神经模型对于基于RNN的方法，我们可以看到NARM普遍优于GRU4REC，验证了强调用户主要意图的有效性。另外，比较CSRM和NARM，通过引入邻居会话作为辅助信息来表示当前会话，CSRM可以在三个数据集上的所有情况下优于NARM，意味着与当前会话具有相似意图的邻居会话能够帮助提高推荐表现。

基于注意力的神经模型对于基于注意力的方法，STAMP和SR-IEM，我们看到SR-IEM普遍优于STAMP。这里STAMP在注意力机制中应用所有物品的混合和最后一个物品的结合作为 query，而SR-IEM单独地比较每个物品与其他物品，来提取出物品重要性。这样，SR-IEM能够避免不相关物品带来的误差，因此能够做出准确的推荐。

基于图神经网络的神经模型考虑基于图神经网络的方法SR-GNN和NISER+，我们可以看到表现最好的方法NISER+在几乎所有情况下都普遍优于基于RNN和基于注意力的方法，证明了图神经网络建模会话内物品间传递关系的有效性。另外，NISER+在三个数据集上的大多数情况都能优于SR-GNN，除了在Yoochoose 1/4数据集上在MRR@20指标上表现弱于SR-GNN。这可能是由于长尾问题和过拟合问题在训练数据相对较少时更加严重。

从表2中，我们可以看到SGNN-HN可以在三个数据集上的所有情况下都有最好的结果。 SGNN-HN相比于基准模型的提升主要来自于两方面。一方面是所提出的星神经网络(SGNN)。通过因此中心节点作为会话内每两个物品的中继节点，SGNN能够不仅仅传递来自于邻接物品的信息，也可以从没有直接连接的物品获取信息。这样，每个节点就能从它们的邻居节点那里获取到丰富的信息。另外一个是通过使用高速网络来解决过拟合问题，我们的SGNN-HN模型能够叠加更多层的星图，使得物品的表示更好。

另外，我们发现SGNN-HN与最好的基准模型相比的提升在Yoochoose 1/64数据集上的提升分别是1.11％和2.84％，在Yoochoose 1/4上是1.46％和2.07％。在Yoochoose1/64和 Yoochoose 1/4数据集上在MRR@20指标上的相对提升比在Recall@20上更明显。相反，在 Diginetica上，在Recall@20上的提升比在MRR@20上更明显。这可能是由于Yoochoose和 Diginetica数据集中的候选物品的数目不同，Yoochoose 1/64和Yoochoose1/4数据集上候选物品的数目明显要比Diginetica上要少。

我们的结果显示，在候选物品的数目较少时，我们的SGNN-HN模型更能够将目标物品排在推荐列表中的前列，而在目标物品数目相对较多时，在命中目标物品上更加有效。

为了证明SGNN的有效性，我们将我们方法中的SGNN替换为两个替代品来传播物品间的信息，并且评估了在3个数据集上的Recall@20和MRR@20的效果。变体可以被表示为：(1) GGNN-HN，把SGNN替换为简单的GGNN；(2)SAT-HN：将SGNN替换为GAT。结果展示在图2和图3中。

从图2和图3中，我们可以看到SGNN-HN在3个数据集上的Recall@20和MRR@20指标上都实现了最好的效果。另外，对于变体模型，GGNN-HN比SAT-HN的效果更好。我们认为这可能是由于自注意力机制从会话内所有的物品传递信息，将会由于不相关的物品而引入误差。然而，基于图神经网络的方法，即GGNN-HN和SGNN-HN，都能够通过图神经网络来探索物品间复杂的传递关系，避免了不相关物品带来的误差，因此能够实现比SAT-HN更好的效果。另外，比较GGNN-HN和SGNN-HN，我们看到GGNN-HN只能从邻接物品传递信息，缺失了很多来自于不相连物品的信息，导致效果低于SGNN-HN。

为了调查GNN层数在所提出的SGNN-HN模型上的影响，并且证明高速网络的有效性，我们比较SGNN-HN和它的变体SGNN-HN，从SGNN-HN中移除了高速网络。另外，比较也包含了基于GNN方法类别中表现最好的方法NISER+。具体来说，我们将GNN层数从1提高到6，来展示NISER+，SGNN-SR和SGNN-HN在三个数据集上Recall@20和MRR@20的效果。结果见图4-图9。SGNN-HN在三个数据集上的Recall@20和MRR@20指标上几乎在所有情况下都可以实现最好的效果。对于Recall@20，我们可以看到随着GNN层数的增加，SGNN-SR和NISER+在三个数据集上都迅速下降。对于基于会话的推荐图神经网络面临严重的过拟合问题。另外，SGNN-SR在三个数据集的所有情况下都优于NISER+,说明了所提出的SGNN在表现会话中不同物品之间的传递关系时更加有效。对于所提出的SGNN-HN模型。随着层数的增加，我们可以看到Recall@20上的效果在Yoochoose 1/64和Yoochoose 1/4上略微下降，而在Diginetica 上保持稳定。另外，随着层数的上升，SGNN-HN与SGNN-SR和NISER+相比效果的差距更大。通过引入高速网络，SGNN-HN能够有效地解决过拟合问题，并且避免随着层数增加Recall@20 指标的快速递减的问题。对于MRR@20，我们可以看到随着层数的增加，SGNN-SR在三个数据集上展示出相似的降低的现象。另外，NISER+在Yoochoose 1/64和Diginetica下降，而在 Yoochoose 1/4上提高。另外，在层数较多时，NISER+的效果优于SGNN-SR。不同于SGNN-SR，我们可以看到SGNN-HN在三个数据集上的多数情况下都能够取得最好的效果。另外，随着层数的增加，SGNN-HN的表现一致地提升，可能是由于SGNN-HN中的高速网络能够动态地从物品表示的嵌入中选择信息。另外，将SGNN-HN与SGNN-SR相比，我们可以看到在GNN层数更多时，高速网络所带来的提升更加明显。这可能是由于包含高速网络，更多的GNN层能够被叠加，因此更多的关系传递关系的信息能够被获得。另外，比较SGNN-HN模型中高速网络在 Recall@20和MRR@20上的影响，我们可以看到随着GNN层数的增加，高速网络能够提升MRR@20 上的分数，而在Recall@20分数上相对稳定。这可能是由于通过使用高速网络，SGNN-HN更能够关注重要的物品，从而将目标物品推向更靠前的位置。

按照会话的长度，即点击的物品的数目，对其进行划分。具体地说，包含少于或者等于5个点击物品的会话被认为是“短”，其余的被看做是“长”。我们将阈值设定为5是因为它是最接近于三个数据集内会话平均长度的整数。Yoochoose 1/64和Yoochoose 1/4数据集上 “短”和“长”的比例分别是70.10％和29.90％。在Diginetica数据集上分别是76.40％和 23.60％。SGNN-HN和基准模型在Recall@20和MRR@20上的表现在图10-图15中被展示出来。我们可以看到SGNN-HN在三个数据集上的所有情况都表现最好。另外，随着会话长度的增加，三个数据集上所有模型在Recall@20和MRR@20上的表现都一致地降低。这可能是由于长会话更有可能包含不相关的物品，导致很难准确地识别用户偏好。对于Recall@20，如图4,6,8 所示，我们可以看到基准模型中，CSRM在三个数据集的“短”和“长”会话上都表现最差，说明了会话内的传递关系远比简单的时序信息要复杂。通过比较SR-IEM和NISER+，我们可以发现，在“短”会话上表现相似，但在“长”会话上NISER+的效果明显更好。这说明了通过建模物品间的复杂传递关系，在用户-物品交互相对较多时，图神经网络能够更准确地获取用户偏好来命中目标物品。

对于MRR@20，NISER+在Yoochoose 1/64数据集上的“短”和“长”会话上都没有比SR-IEM 的表现更好。在Yoochoose 1/4数据集上也是一样。然而，SGNN-HN可以在三个数据集上的所有情况下都优于SR-IEM。NISER+和SGNN-HN的差别可能是由于：(1)SGNN能够使得在信息传播时来自于长距离物品的信息也能被传递；另外(2)SGNN-HN中的高速网络使得物品间的复杂传递关系能够被多层的SGNN更准确地调查，从而能够促进目标物品在推荐列表中的排序位置。

另外，对于Recall@20，SGNN-HN相对于最好的基准模型NISER+在Yoochoose 1/64数据集上“短”和“长”上的提升分别是1.18％和0.79％；在Diginetica上分别是4.96％和4.67％。这说明了SGNN-HN在相对较短的会话上对于命中目标物品更加有效。另外，对于MRR@20， SGNN-HN相较于最好的基准模型NISER+和SR-IEM在Yoochoose 1/64“短”和“长”会话上的提升分别是1.23％和2.97％。这里在“长”会话上由更大的提升。不同的是，在Diginetica 数据集上，在“短”和“长”会话上的提升分别是4.62％和3.76％。MRR@20上两个数据集之间的不同可能是由于平均会话长度不同；Yoochoose 1/64的明显长于Diginetica。因为 Yoochoose 1/64中有更大比例的长会话，这解释了Yoochoose 1/64数据集上“长”会话的提高比“短”会话的提高更多的现象。

以电子商务网站应用场景为例,如日常使用的淘宝、京东等软件，用户与系统将持续进行交互直至用户的需求得到满足。这种场景下，对于没有注册账号的用户或者刚注册账号还没有长期历史交互信息的用户来说，其交互信息非常有限。从这些有限信息中精准地挖掘出用户偏好难度较大，许多现有的方法如协同过滤等不适用该场景。而通过本发明提供的推荐方法，可为用户生成推荐的商品列表。并且正如上文所述，本发明的方法在两个现实的电子商务数据集YOOCHOOSE和DIGINETICA上进行了测试，通过与之前算法的比较，结果表明本发明的模型能够在Recall和MRR指标上实现当前所有方法中的最优效果，证明了本发明所提出的模型的有效性。

Claims

1.一种基于星图神经网络的推荐方法，其特征在于包括以下步骤，

2.如权利要求1所述的基于星图神经网络的推荐方法，其特征在于：步骤A中，对于每个会话S＝{v₁，v₂，...v_t，...，v_n}，构建一个星图来表示会话中物品之间的传递关系，通过添加中心节点来包括未直接相连的物品，这里的中心节点与会话星图中的所有节点均有连接，V＝{v₁，v₂，...，v_|V|}表示所有会话内所有唯一的物品，这里|V|是所有唯一的物品的数目，v_t∈V表示会话内第t个物品；

3.如权利要求2所述的基于星图神经网络的推荐方法，其特征在于：星图包括卫星连接和中心连接两种类型的边。

4.如权利要求3所述的基于星图神经网络的推荐方法，其特征在于：对于卫星连接，即边(x_i，x_j)∈E_s，用户在点击物品x_i之后点击了x_j，会话中两个物品之间的邻接关系使用入度矩阵和出度矩阵来表示。

5.如权利要求4所述的基于星图神经网络的推荐方法，其特征在于：添加一个星节点来传递来自于非邻接物品的信息，在星图中添加一个星节点和卫星节点之间的双向边，使用从星节点到卫星节点的有向边来更新卫星节点，通过卫星节点，来自于未连接节点的信息可以通过将星节点作为中继节点的方法，以两跳的方式来传递；从卫星节点到星节点的有向边来更新星节点，通过考虑星图内的所有节点，来帮助生成准确的星节点的表示。

6.如权利要求1所述的基于星图神经网络的推荐方法，其特征在于：步骤B中，在将节点传递进星图神经网络之前，首先初始化卫星节点和星节点的表示；对于卫星节点，直接将会话内不重复的物品的嵌入作为卫星节点表示：

h⁰＝{x₁，x₂，...，x_m}，