CN111723285A

CN111723285A - 一种基于评分的深度谱卷积协同过滤推荐方法

Info

Publication number: CN111723285A
Application number: CN202010409241.7A
Authority: CN
Inventors: 喻梅; 朱琨; 于健; 赵满坤; 于瑞国; 徐天一; 邵奇璇
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2020-05-14
Filing date: 2020-05-14
Publication date: 2020-09-29

Abstract

本发明公开了一种基于评分的深度谱卷积协同过滤推荐方法，包括：对评分矩阵预测算法进行改进，获取填充稀疏的评分矩阵；对推荐相关用户‑项目交互信息进行图傅里叶变换空域‑谱域转换，将评分矩阵的交互评分转换成图信号存在于谱域之中，图信号直接由谱域中的特征向量表示，实现谱域特征提取；对不同频率域中的用户项目图信号进行卷积更新，动态调整每一个频率域的权重，将卷积后的图信号作为谱卷积循环神经网络的输入，输出卷积图信号序列；对卷积图信号序列进行深度循环神经网络训练；对训练结果，通过设计合理的目标函数进行迭代优化以完成Top‑N的推荐排序。

Description

一种基于评分的深度谱卷积协同过滤推荐方法

技术领域

本发明涉及权值计算技术和分类推荐技术领域，尤其涉及一种基于评分的深度谱卷积协同过滤推荐方法。

背景技术

深度学习(Deep Learning,DL)利用深度学习技术，对数据进行分析。通过多层非线性变换学习高复杂性数据的特征，达到提高分类或预测的准确性的目的。深层学习的特点是可以进行多层的学习过程，设置多层的神经网络结构。其原理是能够通过设置隐藏层来改善模型性能，增减隐藏层的数量也会有影响。深度学习的输入信息直接传入隐藏层，隐藏层将其转换成抽象的维度表示。在隐藏层的维度表示将以非线性的结构方式存储，一次挖掘数据之间隐藏的复杂关系，通过非线性结构来发现资料的特性。

基于协同过滤的推荐算法，核心思想是通过计算兴趣爱好相似度对未评分项进行评分预测，按照分数大小形成排序列表，达到推荐的目的。随着协同过滤算法的不断深入和深度学习技术的不断发展，越来越多的研究采用协同过滤推荐模型对二部图的网络结构进行了研究。在不考虑用户和项目内容特征的情况下，基于图的网络结构可以将用户和项目作为抽象节点进行使用。这种机制可以通过将用户信息合并到用户的选择关系中来克服数据的稀疏性。

目前虽然协同过滤算法已经得到了较多的应用，并且在实际应用中也得到了令人满意的效果，但是仍然存在几个问题。

首先是冷启动(cold start)问题，包括用户冷启动和项目冷启动两个方向。当缺少新用户或新项目的具体历史信息时，推荐系统不能向用户提供高质量的服务。

其次是数据稀疏问题，指的是推荐系统中往往面对较大规模的项目数量，用户一般只对其中某些项目进行评价，这将会引起明显的数据稀疏问题。在无人为设计奖惩或者鼓励机制的情况下，用户往往对于主动进行评分评价等行为的主观意愿并不强烈，因而推荐系统较难获取用户的兴趣偏好，对于用户交互信息共同行为的获取同样困难。传统协同过滤算法无法在交互数据稀疏时保证用户项目相似性计算的准确性。

发明目的：

针对传统协同过滤推荐算法通常遇到的冷启动及数据稀疏性问题，本发明提出了一种基于评分的深度谱卷积协同过滤推荐方法，将改善后的用户与项目信息带入谱卷积循环神经网络中进行连通性特征提取，完成混合推荐，详见下文描述：

一种基于评分的深度谱卷积协同过滤推荐方法，所述方法包括：

对评分矩阵预测算法进行改进，获取填充稀疏的评分矩阵；

对推荐相关用户-项目交互信息进行图傅里叶变换空域-谱域转换，将评分矩阵的交互评分转换成图信号存在于谱域之中，图信号直接由谱域中的特征向量表示，实现谱域特征提取；

对不同频率域中的用户项目图信号进行卷积更新，动态调整每一个频率域的权重，将卷积后的图信号作为谱卷积循环神经网络的输入，输出卷积图信号序列；

对卷积图信号序列进行深度循环神经网络训练；对训练结果，通过设计合理的目标函数进行迭代优化以完成Top-N的推荐排序。

其中，所述对不同频率域中的用户项目图信号进行卷积更新，动态调整每一个频率域的权重具体为：

将谱域中的特征向量输入卷积结构中，经过隐藏层逐层递归学习特征，定义卷积核结构动态计算每个频率分量的贡献。

进一步地，所述对卷积图信号序列进行深度循环神经网络训练具体为：

考虑模型深层结构存在的序列相关性，设计循环控制单元进行特征提取，用于卷积操作的分类过程；

采用循环神经网络结构进行深度训练学习，使得模型适应基于序列的用户，项目相关关系及潜在联系，挖掘内部连通性。

本发明的有益效果如下：

本发明使用召回率(Recall)和准确率(Precision)以及二者调和平均值数F1还有平均精度均值(Mean Average Precision,MAP)四个评价指标对推荐算法的性能进行评估，召回率衡量了建议推荐项目的比例，而平均精度均值(MAP)体现出用户实际选择的项目在推荐列表中的数量与推荐列表长度的关系，统计正样本所在位置，体现Top-N推荐列表的准确程度。

选择另外两个基线模型BPR和NCF进行对比实验：贝叶斯个性化排序(BPR)是隐式反馈的一种矩阵分解模型；神经矩阵分解(NCF)通过多层感知器模型进行项目排序的一种深度学习推荐模型。本文设计算法Deep SSCF在三个稀疏性不同的数据集上，对于Top-N推荐中的Recall@N和MAP@N指标均能够得到比另外两种推荐模型BPR和NCF更优的效果，证明DeepSSCF有效改善了推荐性能并很大程度上解决了数据稀疏对推荐的不利影响。

对冷启动问题，分别在MovieLens-100k与MovieLens-1M数据集上进行新用户的模拟实验进行验证。对数据集中每名用户选取一个项目做为训练集，其余与用户有交互的项目放入测试集中，以此来验证模型对于新加入的用户的冷启动问题的缓解。考虑到对比实验中BPR模型在排序性能上的良好表现，所以选择BPR作为对比实验。与BPR算法对比，本文提出的Deep SSCF模型在面临相同的冷启动的情况下，在Recall@N和MAP@N指标方面有较大幅度提升。以此证明本文算法确实能够很好的缓解冷启动问题，同时能供提供更可靠的推荐。

附图说明

图1为邻居集分类的示意图；

图2为卷积结构图；

图3为GRU单元图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面对本发明实施方式作进一步地详细描述。

谱域(Spectral Domain)理论是图卷积网络(Graph Convolution Network,GCN)结构的理论基础。图卷积神经网络在拓扑图上实现深度学习卷积运算。图卷积神经网路的研究进程为首先研究产生图信号概念(Graph Signal Processing,GSP)，产生了基于图的傅里叶变换操作(Fourier Transformation)，进而将深度学习进行结合，定义了图上的卷积操作，形成了图卷积网络。

本发明在于缓解目前主流的协同过滤推荐算法中所存在的冷启动问题和数据稀疏性问题，从而提出了改进的深度谱卷积协同过滤推荐算法(Deep SpectralCollaborative Filtering,Deep SCF)。将谱卷积网络应用于用户与项目二部图中，在谱域中使用卷积操作进行特征提取，设计循环神经网络结构进行深度训练，寻找用户项目深层关系及隐藏的连通信息，缓解推荐过程中的冷启动问题。同时考虑用户评分稀疏性对于推荐的影响，有针对性地提出改进的评分数据预测填充，考虑用户交互的共同评分项质量与数量，将目标用户的邻居相似度添加到评分预测权重改进算法中，实现评分矩阵的填充，与Deep SCF算法进行混合推荐，提出基于评分的深度谱卷积协同过滤算法(Deep ScoreSpectral Collaborative Filtering,Deep SSCF)，能够较大程度上解决数据稀疏性问题，提高推荐的准确性。

实施例1

为实现上述目的，本发明首先提出融合深度学习框架结合谱域理论的推荐系统框架：谱卷积循环神经网络(Deep SCF)模型进行推荐用户与项目的内在特征的提取。考虑评分信息稀疏性对于推荐算法的影响，形成最终的基于评分的谱卷积循环推荐算法，包含以下步骤：

101：对评分矩阵预测算法进行改进，获取填充稀疏的评分矩阵；

102：对推荐相关用户-项目交互信息进行图傅里叶变换空域-谱域转换，将评分矩阵的交互评分转换成图信号存在于谱域之中，图信号直接由谱域中的特征向量表示，实现谱域特征提取；

103：对步骤102的不同频率域中的用户项目图信号进行卷积更新，动态调整每一个频率域的权重，将卷积后的图信号作为循环网络的输入，输出卷积图信号序列；

104：对卷积图信号序列进行深度循环神经网络训练；

105：对训练结果，通过设计合理的目标函数进行迭代优化以完成Top-N的推荐排序。

在一个实施例中，步骤101中对评分矩阵预测算法进行改进，具体步骤如下：

将目标用户的邻居用户相似度值添加到评分预测公式权重中，调整融合参数进行评分预测，完成评分矩阵的填充，将填充后的用户-项目评分信息代入后续四个步骤构成的谱卷积循环神经网络模型中进行特征关系学习。

在一个实施例中，步骤102中的将评分矩阵的评分交互信息转换成图信号存在于谱域之中，具体步骤如下：

对于用户-项目交互评分矩阵进行图傅里叶变换频域-谱域转换，使得用户-项目交互信息转换成图信号存在谱域之中，图信号直接由谱域中的特征向量进行表示。

在一个实施例中，步骤103在步骤102的基础上是对不同频率域中的用户项目图信号(谱域中的特征向量)进行卷积更新，动态调整每一个频率域的权重，具体步骤如下：

设计卷积过程，将谱域中的特征向量输入卷积结构中，经过隐藏层逐层递归学习特征。定义卷积核结构g_θ，来动态计算每个频率分量的贡献。

在一个实施例中，步骤104在步骤103的基础上，将卷积后的图信号作为输入，进行深度循环神经网络训练，更新模型参数，具体步骤如下：

考虑模型深层结构存在的序列相关性，设计循环控制单元进行特征提取，用于卷积操作的分类过程。采用循环神经网络结构进行深度训练学习，使得模型能够更好适应基于序列的用户，项目相关关系及潜在联系，挖掘内部连通性。

在一个实施例中，步骤105对104的输出结果，通过设计目标函数进行迭代优化以完成Top-N的推荐排序，具体步骤如下：设计损失函数并选取适当的优化算法进行损失函数的最小化，进而达到优化模型参数的目的。

实施例2

下面结合具体的实例、计算公式对实施例1中的方案进行进一步地介绍，详见下文描述：

步骤201：将目标用户的邻居用户相似度值添加到评分预测公式权重中，调整融合参数进行评分预测，完成评分矩阵的填充，将填充后的用户-项目评分信息代入后续的谱卷积循环神经网络算法中进行特征关系学习；

在本次研究中考虑到共同评分项的质量与数目两个因素来改进算法，首先对最近邻居集做出合理地划分，得到两个部分，具体即为图1中所示，分别是对目标项目已经评分和未评分的邻居集，对应着深色圆圈和浅色圆圈。

图1中所示的深色圆圈表示已经评分的邻居集，浅色圆圈表示未评分的邻居集，为了有效地将所有用户应用到计算过程中，则根据已评分邻居用户的评分均值表示未评分邻居的评分值。

最后根据设置的权重对两部分进行融合处理。其中最近邻居用户集表示为N，已评分与未评分邻居用户集分别是N₁，N₂。

其中N₁的预测评分公式1所示。

N₂的预测评分公式2所示。

将上述两个公式按照适当的权重系数融合后得到公式3，也就是最终的评分结果。

p(u_i，a)＝μp(u_i，a)+(1-μ)p₂(u_i，a)μ∈[0，1] (3)

公式中各个参数的说明如下：p₁(u_i，a)为已经评分用户对项目a的预测评分；p₂(u_i,a)为未评分用户对项目a的预测评分；

分别表示目标用户与邻居用户的评分均值；u_i表示目标用户；N₁中的u_j表示已经对项目a评分的邻居用户；N₂中的u_j表示未对项目a评分的邻居用户；Sim(u_i,u_j)表示两个用户的相似度值；R_j,a表示邻居用户u_j的评分值。

步骤202：推荐要素谱域特征提取，将步骤S0101优化后的评分矩阵转换成空间域上用户与项目的交互二部图矩阵，P_ij表示用户i与项目j的交互情况，见公式(4)，转换以进行后续深度谱卷积循环算法关于推荐要素用户与项目内在连通性的特征挖掘：

步骤203：谱卷积过程，用户与项目图信号的联通信息存在于谱域的不同的频率域之中，因此需要动态调整更新每个频率域的重要性。为了达到这一目的，本算法设计了卷积过程。

定义卷积核结构来动态计算每个频率分量的贡献，以达到推荐的目的。图2是卷积过程，将谱域中的信号输入卷积结构中，经过隐藏层逐层递进学习特征。

步骤204：多层循环结构设计，本算法综合理论分析选用门控循环神经网络(GRU)进行模型构建，利用TensorFlow的Keras深度学习框架进行训练堆叠。图3为门控循环GRU单元示意图。

其中，r和z分别为重置门和更新门，h和

分别为激活门和候选门。GRU的更新门和重置门能够学习更新单元隐藏状态的时间和程度。t时刻的隐藏状态h_t由前一时刻的h_t-1与候选隐藏层

线性插值得到：

结构中的更新门状态由输入向量与前一时刻隐藏状态信息共同决定：

z_t＝σ(W_z*x_t+U_zh_t-1) (6)

其中，σ表示sigmoid激活函数，W_z，U_z为权值矩阵，x_t为当前时刻输入，h_t-1为前一时刻隐藏状态。

候选隐藏状态

的更新过程为：

其中，r_t为重置门单元，由

表示矩阵点乘，用来完成对于之前状态的选择。

重置门单元r_t决定以往信息的遗忘程度，更新公式为：

r_t＝σ(W_rx_t+U_rh_t-1) (8)

其中，W_r，U_r为权值矩阵。

通过多个循环单元的特征提取，能够获得模型参数特征的高级表示。

步骤205：目标函数优化，最终设计的Deep SSCF推荐算法需要设计损失函数并选取适当的优化算法进行损失函数的最小化。

对于推荐系统有两种常用的损失函数类型：逐点损失函数(point-wise)和无偏成对损失函数(pair-wise)。

无偏成对损失函数通常使用基于传统贝叶斯个性化排序算法BPR模型中的损失函数。与基于逐点的损失函数相比，BPR损失函数学习三元组(u,j,j’)的信息,其中项目j表示与用户u有交互的项目，而项目j’相反，通过最大化j和j’之间的偏好差异，BPR损失函数能够更好的迭代出最优的推荐结果。无偏损失函数公式为：

针对本节的算法，考虑到算法模型最后通过对用户与项目交互程度进行排序进行推荐，因此选用BPR损失函数作为基础设计目标函数，采取L2正则化项规避过拟合问题。

修改后的损失函数为：

优化算法方面，本算法最终选定性能较为优秀的Adam优化算法进行运用。

本发明主要针对协同过滤推荐算法的数据稀疏性和冷启动问题，设计基于评分的深度谱卷积算法Deep SSCF进行实验，保证了推荐结果的准确性和个性化推荐的质量。设计的算法能够有效地利用丰富的用户与项目的连通信息，缓解协同过滤算法中数据稀疏性和新用户的冷启动问题，实验说明该算法的推荐分类预测与推荐排序的准确性都较高。

实施例3

下面结合具体的实验对实施例1和2中的方案进行可行性验证，详见下文描述：

将本发明设计的结合评分的深度谱卷积协同过滤算法应用在多个电影数据集上进行实验，结果表明，本方法可以有效缓解冷启动问题，在数据稀疏性较大时能够提高推荐精度，同时解决推荐算法的个性化服务问题。

本算法在三个真实公开可用的带有评分数据的电影数据集上进行实验，验证了算法的合理性及有效性。数据集分别是MovieLens-100k,MovieLens-1M与HetRec2011数据集，数据集评分值均在1-5之间。

在实验中采用K折交叉验证法(K-fold Cross Validation)进行验证，K值选取为5，通过本文提出的深度推荐框架Deep SSCF为每个用户推荐按照预测偏好关系进行排序选出前N个项目(Top-N推荐)，并根据用户对这些项目的偏好对不同的推荐模型采用多项性能指标进行评估。

召回率(Recall)可以通过混淆矩阵进行描述。混淆矩阵由TP(true positive)，FP(false positive)，TN(true negative)，FN(false negative)组成，具体含义见表1。

Recall、Precision和F1的计算公式如公式(11)，(12)，(13)所示：

MAP计算公式如公式(14)，(15)所示：

公式(14)中对于用户u，AP_u表示平均准确率，N_u ^te表示测试集中对于用户u的Top-N排序中的排序，r_ui表示推荐列表中项目i的排序位置，r_uj<r_ui表示在对用户u的排序列表中物品j的排序位置在物品i的前面,则

表示排在物品i之前的物品的数量。

MAP即由AP_u公式对于所有用户u进行取均值操作,如公式(15)所示，U^te为测试集中的用户合集。

正式实验之前首先对模型参数进行选择，通过测试发现加入GRU单元结构的GRU-SCF算法模型能够获得较好的Recall和MAP指标，也就意味着能够得到好的推荐效果，故实验中默认Deep SSCF算法用到的特征训练结构为GRU门控循环单元。

本算法中对于评分矩阵的填充选取融合参数μ＝0.6，以得到更准确的预测得分项目来进行预测项目填充。填充后的评分矩阵在数据稀疏性上有了一定的改善，代入DeepSCF算法中形成最终的Deep SSCF算法，进行性能测试，以验证Deep SSCF算法的有效性，性能结果见表2。

根据表2可以看出最终设计的Deep SSCF算法模型加入评分信息的稀疏性填充，能够比Deep SCF算法模型在Recall和MAP指标上得到改善，验证了本文设计算法的合理性与有效性。

3个基线对比实验的实验效果如表3所示，贝叶斯个性化排序(BPR)是隐式反馈的一种矩阵分解模型。神经矩阵分解(NCF)通过多层感知器模型进行项目排序的一种深度学习推荐模型。分别在MovieLens-100k，MovieLens-1M和HetRec2011数据集上进行对比推荐算法实验。本文设计算法Deep SSCF在三个稀疏性不同的数据集上对于Top-N推荐中的Recall@N和MAP@N指标均能够得到比另外两种推荐模型BPR和NCF更优的效果。

针对冷启动问题，分别在MovieLens-100k与MovieLens-1M数据集上进行新用户的模拟实验进行验证。实验方法是将数据集中每名用户选取一个项目做为训练集，其余与用户有交互的项目放入测试集中，以此来验证模型对于新加入的用户的冷启动问题的缓解。考虑到对比实验中BPR模型在排序性能上的良好表现，所以选择BPR作为对比实验，分别对Recall@20和MAP@20指标进行记录，得到表4性能结果表。

可以看出，在面临交互数据稀少的新用户冷启动的问题，推荐模型的性能均下降，然而对比两种推荐模型可以发现，本文提出的Deep SSCF模型在面临相同的冷启动下仍然能得到比BPR算法更好的推荐性能。对于冷启动问题的改善，对于MovieLens-100k数据集而言，Recall@20指标与MAP@20指标相较于BPR模型，分别提高了34.1％和27.2％。对于MovieLens 1M数据集的Recall@20指标与MAP@20指标，Deep SSCF模型分别比BPR模型提高了40.7％和35.3％。通过MovieLens数据集上的指标提升，可以证明本文算法确实能够很好的缓解冷启动问题，同时能供提供更可靠的推荐。

表1 推荐系统中的混淆矩阵(Confusion Matrix)

表2 Deep SSCF算法性能结果

表3 对比实验性能结果

表4 不同数据集下不同冷启动情况下性能对比

本领域技术人员可以理解附图只是一个优选实施例的示意图，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于评分的深度谱卷积协同过滤推荐方法，其特征在于，所述方法包括：

对评分矩阵预测算法进行改进，获取填充稀疏的评分矩阵；

2.根据权利要求1所述的一种基于评分的深度谱卷积协同过滤推荐方法，其特征在于，对评分矩阵预测算法进行改进，获取填充稀疏的评分矩阵：

3.根据权利要求1所述的一种基于评分的深度谱卷积协同过滤推荐方法，其特征在于，所述对不同频率域中的用户项目图信号进行卷积更新，动态调整每一个频率域的权重具体为：

4.根据权利要求1所述的一种基于评分的深度谱卷积协同过滤推荐方法，其特征在于，所述对卷积图信号序列进行深度循环神经网络训练具体为：