CN111143705B

CN111143705B - 一种基于图卷积网络的推荐方法

Info

Publication number: CN111143705B
Application number: CN201911371099.5A
Authority: CN
Inventors: 韩笑; 徐晓斌; 赵辉
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2019-12-26
Filing date: 2019-12-26
Publication date: 2021-05-28
Anticipated expiration: 2039-12-26
Also published as: CN111143705A

Abstract

本发明涉及一种基于图卷积网络的推荐方法，用于解决现有方法中对用户‑项目关系特征挖掘不充分以及稀疏数据计算资源消耗巨大的问题。具体内容包括一种基于图卷积网络的推荐算法框架，在召回率和归一化折扣累积率这两项指标上较现有传统方法有较大提升。

Description

一种基于图卷积网络的推荐方法

技术领域

本方法涉及推荐算法、图卷积网络以及深度学习。

背景技术

随着大数据、云计算、物联网等技术的飞速发展，互联网空间中的应用种类层出不穷，导致了互联网空间中数据的爆炸式增长。根据国际数据集团(IDC) 2012年的一份报告显示：到2020年，预计全球数据总量是2011年的22倍，将达到35.2ZB。大数据为信息技术的发展带来了巨大的潜力和契机，但同时也带来了严重的信息过载问题。如何从纷繁复杂的数据中筛选出有价值的信息成为阻碍大数据发展的关键难题。推荐算法作为解决信息过载问题的一项关键技术，已经得到了学术界和工业界的广泛关注并应用到各个领域当中，如音乐、视频、新闻、广告、商品等。推荐算法通过对用户和项目进行特征提取和模型构建，计算后为用户推荐其感兴趣的内容或商品，提升用户满意度。近些年来，数据量的飞速增长使得传统方法在挖掘数据价值上的局限性越来越明显，限制了算法性能的发挥。随着计算机的计算能力不断提高，之前一些因为计算量巨大而无法良好使用的算法得到了人们的重视和发展，深度学习就是其中之一。深度学习作为大数据时代的一项重要技术已经被广泛应用到各个行业当中，如图像识别、自然语言处理等。卷积神经网络作为深度学习方法中的一种重要方法已经在图像等领域取得巨大成就，但随着人们研究的不断深入，人们发现卷积神经网络研究的对象只局限于欧几里得空间的数据，即具有规则空间结构的数据。对于一些非欧几里得空间的数据，如不规则三维模型、社交网络的抽象图谱等，卷积神经网络的卓越效果无法良好的发挥，于是图卷积网络应运而生。近些年来，图卷积网络已经在图像处理领域取得了丰硕的成果，它对非欧几里得空间数据的良好处理能力也吸引了推荐算法相关研究人员的关注，如何在推荐算法中良好地应用图卷积网络以提升用户体验已经成为现阶段推荐算法的一个研究热点。

现有方法

近些年来，深度学习在图像、自然语言处理、语音识别等领域都取得了突破性进展，为信息化时代带来了人工智能的热潮，同时也助力了推荐算法的发展。一方面，深度学习可以通过学习一种深层次非线性网络结构，用以表示用户与项目的特征，能够从样本中获取用户和项目的深层特征表示；另一方面，深度学习通过从多源异构数据中进行自动特征学习，从而将不同数据映射到一个相同的隐空间，能够获得数据的统一表征，结合传统推荐算法得到更好的推荐效果。现阶段基于深度学习技术的推荐系统主要分为以下五种：(1)基于内容的推荐算法，利用用户的显示或隐式反馈数据、用户画像、项目内容数据，以及各类的用户生成内容，采用深度学习方法来学习用户与项目的隐向量，并将与用户交互过的类似项目推荐给用户。(2)基于协同过滤的推荐算法，利用用户的显示或者隐式反馈数据，采用深度学习的方法学习用户或者项目的隐向量，从而基于隐向量预测用户的偏好。(3)混合推荐算法，模型层面主要是对基于内容的推荐和基于协同过滤的推荐相融合，包括后融合、中融合、前融合三种。后融合即指在决策层面上将两种算法相融合，中融合即指在模型层面将两种算法相融合，前融合即指在特征提取层面将两种算法相融合。(4)基于社交网络的推荐算法，利用用户的显示或隐式反馈数据、用户的社会化关系等数据，采用深度学习模型重点建模用户之间的社会关系影响，更好地发现用户偏好。(5)基于情景感知的推荐系统，利用用户的显示或隐式反馈数据以及用户的情景信息等各类数据，采用深度学习模型对用户的情景进行建模，发现用户在特定情景下的偏好。

方法缺陷

上述基于深度学习方法存在以下问题：

(1)数据价值挖掘不完全。在挖掘用户和项目数据信息时，上述方法只考虑了用户与项目之间的浅层联系，即一次交互关联，而没有考虑用户与用户之间、用户于项目之间的深层次关联，如两用户之间可能因另一个用户而存在潜在关联。

(2)推荐算法的数据通常为巨大稀疏数据，需要大规模的硬件和时间计算。

发明内容

本发明通过用户与项目数据集，建立基于图卷积网络的深度学习推荐模型，预测用户可能感兴趣的项目列表并给出排名。本方法通过将高阶稀疏特征向量转化为低阶稠密向量，并对其进行图卷积操作以挖掘用户之间更深层次的信息(这里用户与项目的联系可以看作是一种图结构)，从而解决数据价值挖掘不完全的问题，此外此方法将稀疏高维数据转化为稠密低维数据，大大减少了运算时间，节省了运算资源。具体技术方案如下：

(1)选择数据作为训练集，根据训练集数据生成用户-项目交互矩阵和反映用户与项目之间联系的领接矩阵(即用户-项目联系拓扑图的矩阵表示，见图3 )。本方法所使用的图卷积网络模型由嵌入层、嵌入传播层、隐藏层和预测层组成。训练集数据在进入模型时会通过嵌入层进行嵌入操作，之后通过嵌入传播层来挖掘数据的深层次关联信息，再将嵌入传播层得到的特征向量作为输入进入到隐藏层中进一步挖掘用户与项目直接的联系，最后通过预测层预测得到预测分数并与实际分数进行比较从而优化模型参数；

(2)将用户-项目交互矩阵输入嵌入层，得到一个统一的特征向量(e_u， e_i)，具体为：根据用户-项目交互矩阵通过one-hot编码将用户和项目映射到同一个潜在空间中，将稀疏的用户-项目交互矩阵抽象成稠密的用户的特征向量 e_u和项目的特征向量e_i；

(3)将(2)中的特征向量和之前通过处理训练集得到的邻接矩阵作为输入输入到嵌入传播层中。通过图卷积网络对数据进行更深层次的特征挖掘。具体来说，对于存在交互的用户-项目对(u,i)，对它们进行如下计算

这里W₁、W₂代表信息的可训练矩阵(即图卷积网络的参数矩阵)， N₁、N_i分别代表u、i邻居(即与u或i直接连接的节点数量)的数量，运算⊙表示元素乘积运算，得到代表用户u与项目i联系的信息(反映u-i联系的特征向量)m_1←i；

(4)接下来把用户u的每一条信息进行聚合，得到用户u的最终表示

这里函数f为激活函数；

(5)对项目i进行相同的操作得到项目i的最终表示

(6)将经过嵌入传播操作后的特征向量

和

输入到隐藏层中，通过多层感知积挖掘数据的非线性特征，通过内积运算挖掘用户的线性特征，并将两种特征连接后传入预测层中；

(7)最后，通过预测层计算用户u对项目i的偏好

并通过不断优化损失函数得到最佳模型参数；

(8)参数训练完毕后即可该算法模型并用测试集加以测试与应用。

有益效果

本方法将图卷积网络应用到基于深度学习的推荐算法当中，解决了传统方法对数据挖掘不充分和计算资源消耗过大的问题，达到了更好的推荐效果。

附图说明

图1 、方法流程图

图2 、模型结构图

图3 、用户-项目拓扑图及其邻接矩阵图

具体实施方式

(1)使用Gowalla数据集，该数据集为一款名为Gowalla的签到应用提供，其中用户与项目(地点)交互意为用户在此地点进行了签到。该数据集包含 29858个用户、40981个项目(地点)，其中存在的交互数量为1027370，数据稀疏度为0.00084。我们将其中百分之八十的交互数据作为训练集，其余的作为测试集。将训练集的交互数据生成用户-项目交互矩阵和能表示用户-项目拓扑图的邻接矩阵。

(2)将用户-项目交互矩阵输入到嵌入层，得到用户特征向量和项目特征向量，此特征为64元的一维向量。

(3)将(2)中的特征向量和(1)中生成的邻接矩阵输入到传播嵌入层，通过图卷积网络运算得到用户u与所有与之存在交互的项目i之间的信息m_1←i，再将这些信息连接后通过ReLU激活函数得到最终的用户特征向量

同样可以得到项目i的特征向量

这里的特征向量为64元的一维向量。

(4)将

和

传入隐藏层，通过矩阵内积运算挖掘线性特征，得到φ₁，此向量为64元的一维向量。

(5)将

和

连接后传入隐藏层，使用多层感知机挖掘非线性特征，多层感知机(MLP)是一种塔式网络结构，底层最宽，每个后继层具有更少的神经元数量。网络共有2层，每层的的神经元数量分别为128、64，该多层感知机定义为

这里w₁、w₂分别为多层感知机第一层和第二层的权重矩阵，b₁、b₂分别为第一层和第二层的神经阈值，σ()为ReLU激活函数。得到非线性特征φ₂，此向量为64元的一维向量。

(6)将(4)(5)中得到的φ₁和φ₂拼接为128元的一维向量φ后输入到预测层，预测层为一个一层神经元数量为128的全连接网络，此全连接网络定义为

这里w为全连接网络的权重矩阵，b为全连接网络的阈值，σ()为ReLU激活函数，得到预测结果

(7)最后选取贝叶斯个性化排序(BPR)函数作为损失函数，选择随机梯度下降(SGD)作为优化器对模型参数进行优化，当迭代次数达到400次之后模型趋于稳定，各项参数达到最优。

(8)用测试集对该模型进行测试，而且就两个指标召回率和归一化折扣累积率同传统模型进行比较，证明该方法模型的性能高于传统方法。

Claims

1.一种基于图卷积网络的推荐方法，其特征在于包括以下步骤：

(1)选择数据作为训练集，根据训练集数据生成用户-项目交互矩阵(e_ui)_U×I和反映用户与项目之间联系的邻接矩阵，即用户-项目联系拓扑图的矩阵表示；其中，本方法所使用的图卷积网络模型由嵌入层、嵌入传播层、隐藏层和预测层组成；

(2)将用户-项目交互矩阵作为输入输入到嵌入层，所述嵌入层用于将用户和项目映射到同一个潜在空间，具体为：将用户-项目交互矩阵输入嵌入层，得到用户的特征向量e_u和项目的特征向量e_i，并将二者连接得到一个统一的特征向量(e_u，e_i)；

(3)将(2)中的特征向量(e_u，e_i)和之前通过处理训练集得到的邻接矩阵输入到嵌入传播层，具体来说，对于存在交互的用户-项目对(u,i)，对它们进行如下计算

这里W₁、W₂代表信息的可训练矩阵，即图卷积网络的待训练参数矩阵，N_u代表用户u的邻居个数，即与节点u直接连接的节点的个数，N_i代表项目i的邻居个数，即与节点i直接连接的节点的个数，运算⊙表示元素乘积运算，得到表示用户u与项目i之间联系的特征向量m_u←i；

这里函数f为激活函数；

(5)对项目i进行相同的操作得到项目i的最终表示

(6)将经过嵌入传播操作后的特征向量

和

输入到隐藏层中，通过多层感知机挖掘数据的非线性特征，通过内积运算挖掘用户的线性特征，并将两种特征连接后传入预测层中；

(7)最后，通过预测层计算用户u对项目i的偏好

并通过不断优化损失函数得到最佳模型参数；

采用贝叶斯个性化排序(BPR)函数作为损失函数，选择随机梯度下降SGD作为优化器对对图卷积网络模型进行训练；

(8)使用训练完成的图卷积网络模型进行预测。

2.根据权利要求1所述的一种基于图卷积网络的推荐方法，其特征在于：所述多层感知机共有4层，每层的的神经元数量分别为128、64、32、8。

3.根据权利要求1所述的一种基于图卷积网络的推荐方法，其特征在于：所述的用户-项目交互矩阵(e_ui)_U×I，u＝1、2、…、U代表用户，i＝1、2、…、I代表项目，当用户u与项目i之间存在直接关系时，e_ui＝1，否则e_ui＝0。