CN111159473A

CN111159473A - 一种基于深度学习与马尔科夫链的连接的推荐方法

Info

Publication number: CN111159473A
Application number: CN201911356091.1A
Authority: CN
Inventors: 张大朋
Original assignee: Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co ltd
Current assignee: Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2020-05-15

Abstract

本发明公开一种基于深度学习与马尔科夫链的连接的推荐方法，包括步骤：将历史数据分成用户观影历史和标量，对用户的观影历史做嵌入向量处理，利用马尔科夫链计算转移概率，再利用softmax归一化计算最终转换概率，然后计算连接向量，最后与标量首尾连接，送入神经网络经过候选、排序训练；预测时，加载已训练的模型，送入用户观影数据，选取前n个概率大的视频作为候选集供排序做进一步筛选，最终将筛选出来的视频推荐给用户。本发明将用户的行为视为马尔科夫链，即将用户的观影历史视为马尔科夫链，计算转移概率，再利用softmax归一化，然后计算连接向量，以降低噪声干扰，进而提升准确率和加速训练时的收敛。

Description

一种基于深度学习与马尔科夫链的连接的推荐方法

技术领域

本发明涉及人工智能技术领域，特别是涉及一种基于深度学习与马尔科夫链的连接的推荐方法。

背景技术

传统推荐方法包括协同过滤，基于内容的推荐方法和混合推荐方法。其中最经典是协同过滤，比如因子分解，其利用用户与项目之间的交互信息为用户产生推荐。传统方法采用的是浅层模型，需要人为设计特征。

随着互联网数据越来越多，包括视频、音频、图像、文本在内的多元异构数据蕴含着丰富的用户行为信息及个性化需求信息，传统推荐方法已经无法处理，伴随着深度学习发展，人们开始将深度学习引入推荐领域，深度学习可从样本中学习数据集本质特征的能力，另一方面，深度学习通过从多源异构数据中进行自动特征学习，从而将不同数据映射到一个相同的隐空间，能够获得数据的统一表征。

Covington等人通过利用用户信息、情景信息、历史为数据和项目的特征信息等多源异构数据，提出一种深度神经网络模型用于YouTube视频推荐。YouTube视频推荐面临三个方面挑战：可扩展性，新鲜度和数据噪声问题，为了克服这三个挑战，该研究将深度神经网络模型应有到视频推荐系统的两个关键过程：候选集生成和排序。其系统架构如图1所示。

候选集生成，目的是从海量视频库中筛选出和用户相关的几百个视频，利用用户在YouTube上的历史行为数据、用户特征和情景信息建模用户对视频的个性化偏好，核心方法是将推荐问题转化为一个基于深度神经网络的分类问题，寻找与用户向量(神经网络变换后的特征向量)距离最近的N个视频。排序过程是通过进一步考虑更多的视频特征，利用神经网络和逻辑回归模型对每个视频进行打分，并根据打分值对视频进行排序。

该基于MLP的YouTube视频推荐方法，对于用户行为，即观影历史数据之间的关系(embedded video watches)及用户的搜索历史(enbedded search tokens)，只是机械加和而没有考虑到其行为之间的关系而导致推荐不能满足要求。

发明内容

本发明的目的是针对现有技术中存在的技术缺陷，而提供一种基于深度学习与马尔科夫链的连接的推荐方法，将用户的行为，即观影历史数据视为马尔科夫链，计算转移概率，再利用softmax归一化，然后连接向量，以降低噪声的干扰，进而提升准确率和加速训练时的收敛，用于解决类别偏少的情况。

为实现本发明的目的所采用的技术方案是：

一种基于深度学习与马尔科夫链的连接的推荐方法，包括步骤：

将历史数据分成用户观影历史和标量，对用户的观影历史做嵌入向量处理，利用马尔科夫链计算转移概率，再利用softmax归一化计算最终转换概率，然后计算连接向量，最后与标量首尾连接，送入神经网络经过候选、排序训练；预测时，加载已训练的模型，送入用户观影数据，选取前n个概率大的视频作为候选集供排序做进一步筛选，最终将筛选出来的视频推荐给用户。

其中，对于搜索的推荐，是将搜索到的前n个视频嵌入向量化后，对其求平均做为观影行为的最后一个观影行为，然后再利用马尔科夫链计算连接向量，然后与标量首尾连接，送入神经网络经过候选、排序训练；预测时，加载已训练的模型，根据用户上下文输入，选取前n个概率大的视频作为候选集供排序做进一步筛选，最终将筛选出来的视频推荐给用户。

本发明将用户的行为视为马尔科夫链，即将用户的观影历史视为马尔科夫链，计算转移概率，再利用softmax归一化，然后计算连接向量，以降低噪声的干扰，进而提升准确率和加速训练时的收敛。

附图说明

图1是基于MLP的YouTube视频推荐方法的架构图；

图2是基于MLP的YouTube视频推荐方法的流程图；

图3是马尔科夫链层与映射层的示意图；

图4是马尔科夫链层与映射层部分的局部示意图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明基于深度学习与马尔科夫链的连接的推荐方法，包括步骤：将历史数据分成用户观影历史和标量，对用户的观影历史做嵌入向量处理，利用马尔科夫链计算连接向量，最后与标量首尾连接，送入神经网络经过候选、排序训练；预测时，加载已训练的模型，送入用户观影数据，模型选取前n个概率大的视频作为候选集供排序做进一步筛选，最终将筛选出来的视频推荐给用户。

下面，说明如何利用马尔科夫链计算向量：

1.转移概率，可采用以下三个方法中一种计算：

(1).概率法：设用户是u，设第i个行为a_i,i∈[1,2,...,n]，如用户观看的电影行为，t时刻的行为是

i∈[1,2,...,n],t∈任一时刻,如表示t时刻观看了α_i电影；下一时刻的行为是

j∈[1,2,...,n]，如表示t+1时刻观看了a_j电影；如果

存在，即t时刻看了a_i电影，t+1时刻看了a_j电影，则

如果

不存在，则

则转移概率：

(2).相似度：设当前时刻嵌入向量e_i，下一时刻嵌入向量是e_j，令其相似度是

令转移概率：p_ij＝s_ij。

(3).距离：转移概率也可有空间距离表示比如欧式距离，设当前时刻嵌入向量e_i，下一时刻嵌入向量是e_j，欧式距离为：

令转移概率：p_ij＝d_ij。

2.利用softmax归一化：

S_ij表示行为从i转向j时的归一化值，p_ij表示上文计算的转移概率，n表嵌入向量数量，则最终转移概率为P_ij＝S_ij。

3.计算连接向量E；

这是n对n的方法，即n个e到n个E，用于解决类别偏少的情况。当前嵌入向量e_i乘以当前转移概率P_i(i+1)，得到向量E_i＝e_i·P_i(i+1),逐个连接E_i，最后，连接最后一个时间步的嵌入向量E_n＝e_n.即E＝E₁,E₂,…,E_n-1,E_n，逗号表示连接。

本发明的视频推荐的总体流程如下：

将输入历史数据分成用户观影历史和一些标量，如地理位置，星期几等等，对用户的观影历史做嵌入向量处理，然后利用马尔科夫链计算连接向量，再然后与其它的标量首尾连接，送入神经网络，经过候选、排序训练，待预测时，加载已训练的模型，送入用户观影数据，模型选取前n个概率大的作为候选集，来供排序做进一步筛选，最终将筛选出来的视频推荐给用户。

此外，在网络训练时可使用一些技巧，比如利用Xavier/he对权重初始化，dropout，梯度修剪，BN(Batch Normalization，批规范化)。

另外，对于搜索的推荐，给出一个方法，将搜索到的前n个视频嵌入向量化后，对其求平均做为观影行为的最后一个观影行为，利用马尔科夫链求向量，之后就跟上述一致了。

训练时按照批处理的方式进行；预测时按照用户上下文输入。

本发明将用户的行为视为马尔科夫链，表现为将用户的观影历史视为马尔科夫链，计算转移概率，再利用softmax归一化，然后连接向量，以降低噪声的干扰，进而提升准确率和加速训练时的收敛。

以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于深度学习与马尔科夫链的连接的推荐方法，其特征在于，包括步骤：将历史数据分成用户观影历史和标量，对用户的观影历史做嵌入向量处理，利用马尔科夫链计算转移概率，再利用softmax归一化计算最终转换概率，然后计算连接向量，最后与标量首尾连接，送入神经网络经过候选、排序训练；预测时，加载已训练的模型，送入用户观影数据，选取前n个概率大的视频作为候选集供排序做进一步筛选，最终将筛选出来的视频推荐给用户。

2.根据权利要求1所述基于深度学习与马尔科夫链的连接的推荐方法，其特征在于，其中，对于搜索的推荐，是将搜索到的前n个视频嵌入向量化后，对其求平均做为观影行为的最后一个观影行为，然后再利用马尔科夫链计算连接向量，然后与标量首尾连接，送入神经网络经过候选、排序训练；预测时，加载已训练的模型，根据用户上下文输入，选取前n个概率大的视频作为候选集供排序做进一步筛选，最终将筛选出来的视频推荐给用户。

3.根据权利要求1或2所述基于深度学习与马尔科夫链的连接的推荐方法，其特征在于，所述连接向量计算如下：

E＝E₁,E₂,…,E_n-1,E_n，E_i＝e_i·P_i(i+1),

式中，E表示连接向量，e_i表示当前嵌入向量，P_i(i+1)表示当前转移概率,n表嵌入向量数量,i∈[1,2,...,n]。

4.根据权利要求3所述基于深度学习与马尔科夫链的连接的推荐方法，其特征在于，其中，所述的最终转移概率计算如下：

P_ij＝S_ij,

式中，S_ij表示行为从状态i转向j时利用softmax归一化的值,P_ij表示最终转移概率，p_ij表示归一化前计算的转移概率。

5.根据权利要求4所述基于深度学习与马尔科夫链的连接的推荐方法，其特征在于，所述归一化前计算的转移概率通过概率法，相似度或距离计算。