CN108763493A

CN108763493A - 一种基于深度学习的推荐方法

Info

Publication number: CN108763493A
Application number: CN201810536538.2A
Authority: CN
Inventors: 石鑫; 屈鸿; 符明晟; 史冬霞
Original assignee: Shenzhen Di Di Information Technology Ltd By Share Ltd
Current assignee: Shenzhen Di Di Information Technology Ltd By Share Ltd
Priority date: 2018-05-30
Filing date: 2018-05-30
Publication date: 2018-11-06
Anticipated expiration: 2038-05-30
Also published as: CN108763493B

Abstract

本发明公开了一种基于深度学习的推荐方法，属于数据挖掘技术领域，解决现有的推荐方法，不能从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量，造成推荐不准确的问题；本发明对用户的历史行为数据的隐式反馈特性进行建模，建模后学习得到用户和项目的隐因子向量；将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的网络模型；对于未出现在用户历史行为数据中的新项目，将项目的文本内容信息中通过步骤(2)得到的网络模型预测得到项目的隐因子向量，然后将其与步骤(1)得到的用户隐因子向量直接匹配，并将匹配度进行排序，得到每个用户的新项目推荐列表。本发明用于新项目的推荐。

Description

一种基于深度学习的推荐方法

技术领域

一种基于深度学习的推荐方法，用于新项目的推荐，属于数据挖掘、自然语言处理、个性化推荐等技术领域。

背景技术

基于内容的推荐,通常从项目的描述和元数据等内容信息中预测用户偏好。最基础的推荐算法是根据项目的可用的元数据进行推荐，例如在电影推荐中，电影的元数据可能包括电影的类别属性、参与的演员、制作的导演和电影的大众评分等等。然而，这将导致可以预知的推荐。例如推荐用户已经熟知的演员的电影，通常这将不是有效的推荐。另一种推荐算法是根据项目的描述信息进行推荐，例如在电影推荐中，使用电影的标题和内容简介等描述信息，这些描述信息通常使用词袋模型进行表征，通过测量描述信息的表征向量之间的相似性，可以尝试为用户推荐与该用户以前看过的电影相似的电影。这种方法需要定义一个合适的相似性度量。这样的度量通常是基于描述信息的先验知识来自定义，因此它们不一定是基于内容的推荐方法的最佳选择。因此，一些研究人员已经使用用户偏好数据来调整相似性度量。

基于协同过滤的推荐方法可以是基于邻域或基于模型的。前一种方法依赖于用户或项目之间的相似性度量，他们推荐具有类似偏好的其他用户所消费的项目，或与用户已经消费的项目类似的项目。另一方面，基于模型的方法试图建模用户和项目的潜在特征，这些特征通常表示为潜在因素的向量。潜在因素模型的有效性在Netflix奖项中的电影推荐中得以证明，由此，潜在因素模型在推荐领域的应用也越来越广泛。潜在因子向量形成了用户口味在不同方面的简洁描述，同时也形成了相应的项目特征。由于很多项目的使用数据很少甚至缺失，对于使用数据很少的项目通常不能可靠地估计这些项目的潜在因子向量，而对于使用数据缺失的项目则无法获取该项目的潜在因子向量。因此，能够从包含项目的描述和元数据的文本内容信息来预测这些项目的潜在因子向量的混合推荐方法将是有效可行的推荐方法。这就是本文研究的推荐方法。

影响用户偏好的项目的潜在因子与项目的文本内容信息之间存在着巨大的语义差距。例如，从电影的文本内容信息中提取诸如艺术风格、商业性、科技性和寓意主题等高级属性需要强大的模型，能够捕捉复杂的文本语法和语义特征。此外，单单从电影的文本内容信息中不可能获得某些属性，如导演或者演员的知名度、名誉和位置。基于内容的推荐方法目前现有的推荐算法不能从同时包含项目的描述信息和项目的元数据的文本内容信息中精确地预测项目的潜在因子。即使表征文本内容信息的词袋模型可以在学习项目的整体表示和单词表示时提供有价值的信息，但是，这种表示方式忽略每个单词周围的单词和所处位置语境的顺序信息，在挖掘内容信息时存在着很大的瓶颈。因此，如何有效地从项目的文本内容信息中挖掘出影响用户对项目偏好的高级属性，一直是推荐系统领域的研究难点和重点。

最近的研究表明了深度学习在语音识别、图像分析和自然语言处理方面的革命性进展在应对信息检索和推荐任务方面的有效性。通过将深度学习应用到推荐领域中，使推荐系统取得了最先进的性能，并获得了高质量的推荐效果，因此基于深度学习的推荐技术得到了迅猛地发展。相比于传统的推荐技术，深度学习模型可以深层次地理解用户的需求和项目的特征，同时深层次地挖掘用户对项目的历史行为交互信息。在基于内容的推荐方法中，利用深度学习中的诸如使用带滑动窗口(内核)卷积层的卷积神经网络(CNN)模型具有捕捉单词的顺序和当前位置的语境的潜力。但是，CNN中的卷积核的大小在训练期间是固定的。为了获得足够好的性能，有时需要使用具有不同的卷积核大小的多个CNN的集合。门控循环神经网络(RNN)模型是一种更自然、更自适应的文本序列建模方法。门控RNN一次接收一个单词(或多个单词)，并让学习的门决定是合并还是忘记该单词。直观地说，使用门控RNN模型可以很好地建模包含项目的描述和元数据的文本内容序列的生成，从而更能有效地从项目的文本内容信息中挖掘出影响用户对项目偏好的高级属性。近年来，尝试开发推荐系统中的循环深度学习模型的研究人员较少，虽然有些方法涉及循环深度神经网络模型，但它们实际上属于基于协调过滤的推荐方法，因为它们并不包含项目的文本内容信息，事实上，深层次挖掘和理解项目的文本内容信息对准确推荐至关重要，在推荐领域中具有极高的研究和应用价值。

发明内容

本发明的目的在于：解决现有的推荐方法，不能有效地从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量，造成推荐不准确的问题；本发明提供了一种基于深度学习的推荐方法。

本发明采用的技术方案如下：

一种基于深度学习的推荐方法，其特征在于，如下步骤：

(1)对用户的历史行为数据的隐式反馈特性进行建模，建模后学习得到用户和项目的隐因子向量；

(2)将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的网络模型；

(3)对于未出现在用户历史行为数据中的新项目，将新项目的文本内容信息通过步骤(2)得到的网络模型预测得到项目的隐因子向量，然后将其与步骤(1)得到的用户隐因子向量直接匹配，并将匹配度进行排序，得到每个用户的新项目推荐列表。

进一步,所述步骤(1)中，采用基于隐式反馈的加权因子模型对用户的历史行为数据的隐式反馈特性进行建模。

进一步,所述步骤(1)的具体步骤如下：

(11)对用户历史行为数据r_ui进行归一化处理，通过引入一个二值变量p_ui，将用户u对项目i的偏好二值化为偏好矩阵其中，m表示用户的个数，n表示项目的个数；

(12)根据偏好矩阵并引入置信度变量c_ui，来衡量用户u对项目i的偏好的确定程度；

(13)基于确定程度，通过加权隐因子模型将用户和项目映射到共同的潜在因子低维空间，其空间维度为K，通过最小化带正则项的平方误差损失，学习得到所有用户的隐因子向量和所有项目的隐因子向量公式如下：

其中，p_ui为用户u对项目i的实际偏好值，x_u为用户u的隐因子向量，λ_x为x_u的精度参数，y_i为项目i的隐因子向量，λ_y为y_i的精度参数。

进一步,所述步骤(2)中，将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的基于Attention机制的GRU网络模型。

进一步,所述步骤(2)的具体步骤如下：

(21)使用基于Attention机制的GRU网络模型的输入层将项目的文本内容数据映射为单词序列x＝{x₁,x₂,x₃,…,x_T}，其中，T是单词序列的长度，是一个对文本内容中第t个单词的独热编码表示，V是数据集的单词表的大小，即代表所有不重复单词的个数，代表x_t是一个V维向量；

(22)对于文本内容中第t个单词对应的t时刻，基于Attention机制的GRU网络模型的单词嵌入层通过线性映射将单词的独热编码表示x_t转换成低维稠密向量e_t，公式如下：

e_t＝W_ex_t

其中，是单词嵌入层的参数，d_e是低维稠密矢量e_t的维度，W_e的每一列对应着单词表中的一个单词；

(23)单词嵌入层的输出{e₁,e₂,e₃,…,e_T}被前馈到基于Attention机制的GRU网络模型的GRU层作为输入序列，GRU层中的GRU单元在t时刻的激活同时决定了GRU单元更新它的先前激活和候选激活的多少，公式如下：

z_t＝σ(W_ze_t+U_zh_t-1)

r_t＝σ(W_re_t+U_rh_t-1)

其中,W_z、U_z、W_r、U_r、W为GRU层的参数，即网络训练时自动去学习所用参数，是网络作矩阵运算时的变量，z_t是表示更新门，r_t表示复位门，h_t-1表示先前激活，表示候选激活,h_t表示t时刻的激活，对应GRU单元在t时刻的隐藏编码状态，看作是第t个单词的向量表示；

(24)基于Attention的单词池化层将隐藏编码状态向量序列h＝{h₁,h₂,h₃,…,h_T}压缩成一个“上下文”向量c作为项目的文本内容表示，公式如下：

u_t＝v^Ttanh(W_hh_t)

其中，向量v和矩阵W_h是基于Attention的单词池化层的参数，T是单词序列的长度，u_k为第时刻k的原始分数，u_t为第时刻t的原始分数，α_t代表将时刻t对应的原始分数进行softmax标准化得到的最终的分数，即应该对第t个隐藏编码状态h_t给予多少关注；

(25)使用加权隐因子模型学习得到的项目的隐因子向量作为标签，对基于Attention机制的GRU网络模型进行训练，得到训练好的基于Attention机制的GRU网络模型，其目标函数如下：

其中，y_i为项目i的隐因子向量，由加权隐因子模型学习得到，y_i′为基于Attention机制的GRU网络模型对应的预测值，θ代表模型参数，泛指网络需要训练的所有参数。

进一步,所述步骤(3)的具体步骤如下：

(31)对于未出现在用户历史行为数据中的新项目j，从项目的文本内容信息中通过训练好的基于Attention机制的GRU网络模型预测得到项目的隐因子向量y_j；

(32)将预测的新项目j的隐因子向量y_j与加权隐因子模型学习得到的目标用户u的隐因子向量x_u进行匹配，并将匹配度作为预测偏好值p_uj，计算公式如下：

P_uj＝x_u ^Ty_j

式中，T表示转置运算；

(33)计算目标用户u对所有新项目的预测偏好值后，得到目标用户u的待推荐新项目列表；

(34)对待推荐新项目列表中的项目进行排序，为每个用户选取前M个预测偏好值最高的项目，得到每个用户的新项目推荐列表。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

A.本发明，从包含了项目的描述和元数据的文本内容信息中来预测该项目的潜在因子向量，能大大提高推荐的准确度。

B.本发明针对用户隐式反馈数据的特性提出了加权隐因子模型(WLFM模型)，将偏好的置信度引入到用户偏好学习当中，针对隐式反馈数据的训练效率问题改进了传统的ALS算法，提升了模型的训练效率。

C.本发明基于训练好的Attention的GRU深度神经网络模型能够有效地对文本内容的时序信息进行建模和深层次挖掘，通过GRU网络模型对文本中的单词进行语义编码，通过基于Attention的池化技术自动学习单词的权重，相对于传统的BOW表示方法，基于GRU网络的单词编码结构能够实现对文本中单词语义的准确编码，同时基于Attention的池化技术相对于传统的池化技术，能够为项目文本学习更精确的，从而提升推荐性能。

D.本发明提供的基于深度学习的推荐方法，将深度神经网络模型与基于协同过滤的浅层模型融合在一起，可以同时利用用户行为信息和项目文本内容信息的混合推荐模型，解决数据稀疏性和冷启动的问题对推荐性能的影响。

附图说明

图1为本发明的方法流程示意图；

图2为本发明的整体流程示意图；

图3为本发明的WLFM模型生成示意图；

图4为本发明的基于Attention机制的GRU网络连接示意图；

图5为本发明的基于Attention机制的池化网络示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

(1)采集用户的历史行为数据，针对隐式反馈的特性，使用基于隐式反馈的加权隐因子模型(WLFM)，对用户的历史行为信息进行建模，学习得到用户和项目的隐因子向量，具体步骤如下：

(11)对用户历史行为数据r_ui进行归一化处理，通过引入一个二值变量p_ui，假设有m个用户和n个项目，将用户u对项目i的偏好二值化为偏好矩阵公式如下：

(12)偏好矩阵P中同时包含了正、负反馈信息，通过引入置信度变量c_ui，来衡量用户u对项目i的偏好的确定程度，公式如下：

其中，α和β是超参数，如果用户对项目产生了交互行为，用户喜欢该项目的置信度c_ui为α，如果，用户对项目没有产生过行为，用户不喜欢该项目的置信度c_ui为β。，并且β>α，因为在隐式反馈的情况下，相比于正反馈，用户对项目负反馈信息较少，置信变量的值相对来说就会很低。由此，通过用户偏好矩阵P得到了用户置信矩阵

(13)基于确定程度，通过WLFM模型将用户和项目映射到共同的潜在因子低维空间，其空间维度为K，通过最小化带正则项的平方误差损失，学习得到所有用户的隐因子向量和所有项目的隐因子向量其中，m表示用户的个数，n表示项目的个数，公式如下：

min_X，Y∑_u，ic_ui(p_ui-x_u ^Ty_i)²+λ_x∑_u||x_u||²+λ_y∑_i||y_i||²。

其中，WLFM模型使用基于概率的矩阵分解模型，模型的生成过程如下：

(131)对于每个用户u，使得用户隐因子向量

(132)对于每个项目i，使得项目隐因子向量

(133)对于每个用户项目组合(u,i)，使其偏好值为：

其中，c_ui是p_ui的精度参数。I_K是一个K维单位矩阵。WLFM模型的概率图表示如图3所示。通过最小化带正则项的平方误差损失，学习得到所有用户隐因子向量和所有项目隐因子向量公式如下：

式中，p_ui为用户u对项目i的实际偏好值，λ_x为x_u的精度参数，λ_y为y_i的精度参数；本发明加入了c_ui，能够更好地衡量用户偏好的确定程度。

(2)采集项目的文本内容数据，针对项目文本内容信息的特点，使用对项目文本内容的时序信息进行建模和深层次地挖掘的基于Attention机制的GRU网络模型，以WLFM模型学习得到的项目的隐因子向量作为标签训练基于Attention机制的GRU网络模型，具体步骤如下：

(21)使用基于Attention机制的GRU网络模型的输入层将项目的文本内容数据映射为单词序列x＝{x₁,x₂,x₃,…,x_T}，其中，T是单词序列的长度，是一个对文本内容中第t个单词的独热编码表示(one-hot)，V是数据集的单词表的大小，即代表所有不重复单词的个数，代表x_t是一个V维向量，单词序列x严格考虑单词在项目文本中的顺序，为项目的文本表示保留时序信息；

e_t＝W_ex_t

其中，是单词嵌入层的参数，d_e是低维稠密矢量e_t的维度，W_e的每一列对应着单词表中的一个单词，通过网络的单词嵌入层来减少输入向量x_t的维度；

z_t＝σ(W_ze_t+U_zh_t-1)

r_t＝σ(W_re_t+U_rh_t-1)

其中，W_z、U_z、W_r、U_r、W为GRU层的参数，即网络训练时自动去学习所用参数，是网络作矩阵运算时的变量，z_t表示更新门，r_t表示复位门。更新门同时决定GRU单元更新它的先前激活和候选激活的多少。复位门有效地使单元忘记先前计算的状态或者最大程度地使用先前计算的状态来计算候选激活。h_t-1表示先前激活，表示候选激活,h_t表示t时刻的激活，对应GRU单元在t时刻的隐藏编码状态，可看作是第t个单词的向量表示；

(24)通过基于Attention的单词池化层将隐藏编码状态向量序列h＝{h₁,h₂,h₃,…,h_T}压缩成一个“上下文”向量c作为项目的文本内容表示，公式如下：

u_t＝v^Ttanh(W_hh_t)

其中，向量v和矩阵W_h是基于Attention的单词池化层的参数，T是单词序列的长度，u_k为第时刻k的原始分数，u_t为第t个时间步的原始分数，α_t表示将第t个时间步对应的原始分数进行softmax标准化得到的最终的分数，即应该对第t个隐藏编码状态h_t给予多少关注。通过Attention网络对长度为T的隐藏编码状态序列h创建了一个维度为T的Attention向量α，它的第t个元素α_t是对状态h_t给予的关注分数，它表明了相应时间步t的重要性，称其为Attention分数；

(25)使用加权隐因子模型学习得到的项目的隐因子向量作为标签，对基于Attention机制的GRU网络模型进行训练，其目标函数如下：

其中，y_i为项目i的隐因子向量，由加权隐因子模型学习得到，y′_i为基于Attention机制的GRU网络模型对应的预测值，θ代表模型参数。

(3)对于未出现在用户历史行为数据中的新项目，从项目的文本内容信息中通过训练好的基于Attention机制的GRU网络模型预测得到项目的隐因子向量，然后将其与WLFM模型学习得到的用户隐因子向量直接匹配，并将匹配度进行排序，得到每个用户的新项目推荐列表，将通过基于Attention机制的GRU网络模型预测得到项目的隐因子向量与WLFM模型学习得到的用户隐因子向量直接匹配，并将匹配度进行排序得到每个用户的新项目推荐列表的步骤如下：

P_uj＝x_u ^Ty_j

式中，T表示转置运算；

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的推荐方法，其特征在于，如下步骤：

2.根据权利要求1所述的一种基于深度学习的推荐方法，其特征在于：所述步骤(1)中，采用基于隐式反馈的加权因子模型对用户的历史行为数据的隐式反馈特性进行建模。

3.根据权利要求2所述的一种基于深度学习的推荐方法，其特征在于：所述步骤(1)的具体步骤如下：

4.根据权利要求1-3任意一项所述的一种基于深度学习的推荐方法，其特征在于，所述步骤(2)中，将项目的隐因子向量作为标签训练对项目文本内容的时序信息进行建模和深层次地挖掘的基于Attention机制的GRU网络模型。

5.根据权利要求4所述的一种基于深度学习的推荐方法，其特征在于，所述步骤(2)的具体步骤如下：

e_t＝W_ex_t

z_t＝σ(W_ze_t+U_zh_f-1)

r_t＝σ(W_re_t+U_rh_t-1)

u_t＝v^Ttanh(W_hh_t)

其中，y_i为项目i的隐因子向量，由加权隐因子模型学习得到，y′_i为基于Attention机制的GRU网络模型对应的预测值，θ代表模型参数，泛指网络需要训练的所有参数。

6.根据权利要求5所述的一种基于深度学习的推荐方法，其特征在于,所述步骤(3)的具体步骤如下：

p_uj＝x_u ^Ty_j

式中，T表示转置运算；