CN110019943B

CN110019943B - 视频推荐方法、装置、电子设备和存储介质

Info

Publication number: CN110019943B
Application number: CN201710812519.3A
Authority: CN
Inventors: 汤人杰; 翁乐怡; 张式勤; 严昱超; 钱岭; 全兵; 刘婷
Original assignee: China Mobile Communications Corp; China Mobile Suzhou Software Technology Co Ltd; China Mobile Group Zhejiang Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Suzhou Software Technology Co Ltd; China Mobile Group Zhejiang Co Ltd
Priority date: 2017-09-11
Filing date: 2017-09-11
Publication date: 2021-09-14
Anticipated expiration: 2037-09-11
Also published as: CN110019943A

Abstract

本发明实施例提供一种视频推荐方法、装置、电子设备和存储介质。所述方法包括获取用户在预设时间段内的目标人口统计学特征对应的特征向量embedding和目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；根据目标显著特征对应的embedding、目标不显著特征对应的embedding和目标历史视频特征对应的embedding，以及预先建立的深度评分模型，确定用户对每一候选视频的评分；根据用户对每一候选视频的评分，确定用户的推荐视频。所述方法通过考虑所述用户的目标不显著特征对应的embedding对于视频推荐的影响，可更加全面对候选模型进行进一步筛选，得到更符合用户偏好的推荐视频，能够提高视频推荐的准确性。

Description

视频推荐方法、装置、电子设备和存储介质

技术领域

本发明实施例涉及一种通信技术领域，特别是一种视频推荐方法、装置、电子设备和存储介质。

背景技术

随着互联网飞速发展，现今视频网站有着海量的视频与用户，给每位用户提供其感兴趣的视频推荐列表，避免因为用户淹没在过载信息中而导致用户的流失，是个性化视频推荐领域的核心问题，也是当下的热点与难点。良好的个性化视频推荐系统通过户历史观看行为、用户基本信息及视频信息等特征，建立用户与视频的较为精确的关系，以此对用户的未来观看行为进行有效预测，从而提供其感兴趣的视频列表。

协同过滤是现今推荐系统中应用最为成熟的一个推荐算法系类，它分为基于用户的协同过滤与基于物品的协同过滤两个子类。基于用户的协同过滤根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系，在有相同喜好的用户间进行商品推荐；基于物品的协同过滤通过计算不同用户对不同物品的评分获得物品间的关系。基于物品间的关系对用户进行相似物品的推荐。

然而协同过滤对于物品的特征描述单一，难以找到相似物品或用户，随着深度学习在诸多领域取得巨大成果，其能融合多样性特征及处理海量数据的优势凸显。

在此背景下，拥有海量视频与用户的YouTube提出了基于深度神经网络的个性化视频推荐系统。该系统的深度学习模型采用多层感知器(Multi-layer Perceptron，MLP)作为深度神经网络模型，以用户人口统计学特征(如用户ID、年龄、性别)、用户行为特征及视频特征对应的embeddings(特征向量)作为输入，输出推荐视频。

现有技术的基于深度学习的推荐系统存在以下技术问题:

实际应用中，用户是否会观看推荐视频的原因比较复杂，根据用户搜索历史与观看历史为用户确定的推荐视频，用户可能仍然没有兴趣点开观看，导致推荐视频的准确性不高。

目前，现有技术还没有相应的方法来解决上述问题。

发明内容

针对现有技术的缺陷，本发明实施例提供一种视频推荐方法、装置、电子设备和存储介质。

一方面，本发明实施例提供一种视频推荐方法，所述方法包括：

获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；

根据所述目标显著特征对应的embedding、所述目标不显著特征对应的embedding和所述目标历史视频特征对应的embedding，以及预先建立的深度评分模型，确定所述用户对每一候选视频的评分，所述深度评分模型表示显著特征对应的embedding、不显著特征对应的embedding和历史视频特征对应的embedding与每一候选视频的评分的对应关系，所述候选视频是预先获得的与所述目标历史视频特征相似的视频；

根据所述用户对每一候选视频的评分，确定所述用户的推荐视频。

另一方面，本发明实施例提供一种视频推荐装置，所述装置包括：

获取模块，用于获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；

确定模块，用于根据所述目标显著特征对应的embedding、所述目标不显著特征对应的embedding和所述目标历史视频特征对应的embedding，以及预先建立的深度评分模型，确定所述用户对每一候选视频的评分，所述深度评分模型表示显著特征对应的embedding、不显著特征对应的embedding和历史视频特征对应的embedding与每一候选视频的评分的对应关系，所述候选视频是预先获得的与所述目标历史视频特征相似的视频；

推荐模块，用于根据所述用户对每一候选视频的评分，确定所述用户的推荐视频。

另一方面，本发明实施例还提供一种电子设备，包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以上的步骤。

另一方面，本发明实施例还提供一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现以上的步骤。

由上述技术方案可知，本发明实施例提供的视频推荐方法、装置、电子设备和存储介质，所述方法通过考虑所述用户的目标不显著特征对应的embedding对于视频推荐的影响，可更加全面对候选模型进行进一步筛选，得到更符合用户偏好的推荐视频，能够提高视频推荐的准确性。

附图说明

图1为本发明实施例提供的一种视频推荐方法的流程示意图；

图2为本发明又一实施例提供的一种视频推荐方法的流程示意图；

图3为本发明又一实施例提供的视频推荐方法的深度候选模型和深度评分模型的示意图；

图4为本发明又一实施例提供的一种视频推荐装置的结构示意图；

图5为本发明又一实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本发明实施例一部分实施例，而不是全部的实施例。

本发明实施例可应用至多种深度学习系统中，如TensorFlow等。TensorFlow是谷歌研发的学习系统，包括有深度学习的基本框架，支持机器学习中的神经网络、逻辑回归、多层感知器等基础学习方法。

图1示出了本发明实施例提供的一种视频推荐方法的流程示意图。

如图1所示，本发明实施例提供的方法具体包括以下步骤：

步骤11、获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；

在步骤11之前，TensorFlow系统收集所述用户的原始数据，原始数据包括所述用户的行为信息特征和目标人口统计学特征。通过收集行为信息特征和目标人口统计学特征，分析用户的行为偏好、兴趣点等，刻画用户本质需求的属性集合，为每一个用户生成特有的画像。

可选地，所述行为信息特征包括用户ID、观看历史、观看时长、搜索历史、浏览历史、剩余流量、手机品牌等。根据所述行为信息特征的观看历史、搜索历史、浏览历史，获取所述用户的目标历史视频特征。通过获取所述用户的目标历史视频特征，为个性化视频推荐提供可靠的数据来源。

可选地，目标历史视频特征为所述用户在预设时间段内观看和搜索过的视频的特征，例如视频的内容类型、发行时间。

可选地，所述目标人口统计学特征包括有关用户的显著特征，所述目标显著特征是根据以下至少其中一者得到的：用户ID、年龄、性别。

可选地，所述目标人口统计学特征还包括有关用户的目标不显著特征。不显著特征是将包括多个维度、只有其中少量维度上可有效地表达与视频的相关性的特征，即属于稀疏特征。

在本发明实施例中，将属于稀疏特征的目标人口统计学特征称为不显著特征。所述不显著特征可能无法直接有效的影响视频推荐的效果，即所述不显著特征可能无法直接有效的影响用户是否会打开推荐的视频，但若完全忽略，也将影响视频推荐的准确性。

可选地，embedding是从一个空间映射到另外一个空间后，保留基本属性的特征向量，即经映射的特征向量。

在本步骤中，将所述目标显著特征的特征进行映射处理，得到所述目标显著特征对应的embedding，同样地，得到目标不显著特征对应的embedding和目标历史视频特征对应的embedding，将所述目标显著特征对应的embedding和目标不显著特征对应的embedding，称为目标人口统计学特征对应的embedding。

在本发明实施例中，借鉴因子机(Factorization Machine)中表明稀疏特征的组合能大幅提高预测精度，将各所述目标不显著特征对应的embedding作为下一步深度评分模型的输入，将目标不显著特征与其他影响因素(目标显著特征和目标历史视频特征)组合作为推荐视频的影响因素，可提高预测得到的推荐视频的准确性。

步骤12、根据所述目标显著特征对应的embedding、所述目标不显著特征对应的embedding和所述目标历史视频特征对应的embedding，以及预先建立的深度评分模型，确定所述用户对每一候选视频的评分，所述深度评分模型表示显著特征对应的embedding、不显著特征对应的embedding和历史视频特征对应的embedding与每一候选视频的评分的对应关系，所述候选视频是预先获得的与所述目标历史视频特征相似的视频；

可采用现有技术从海量视频中选取与所述用户的目标历史视频特征最相似的数百个视频作为所述候选视频。

TensorFlow系统预先建立深度评分模型，针对每一候选视频，确定显著特征对应的embedding、不显著特征对应的embedding和历史视频特征对应的embedding对应的评分。

将所述目标显著特征对应的embedding、所述目标不显著特征对应的embedding和所述目标历史视频特征对应的embedding作为所述深度评分模型的输入，可输出所述用户对每一候选视频的评分。

可以理解的是，所述候选视频是与用户曾观看、搜索过的视频相似的视频，而实际应用中，用户历史观看的视频可能没有看完，搜索过的视频可能没有打开观看，表示用户历史观看的视频并不完全是用户感兴趣的、喜欢的视频。在获得候选视频后，还需对候选视频进行进一步的筛选，应用本发明实施例的深度评分模型对所述候选视频进行评分，确定每一候选视频的内容受所述用户的喜欢程度。

步骤13、根据所述用户对每一候选视频的评分，确定所述用户的推荐视频。

可选地，所述推荐视频是向所述用户进行展示、推送的候选视频。

在得到所述用户对每一候选视频的评分后，可将所述评分从高到低进行排名，获取所述评分排在前N个的所述候选视频，其中N为正整数。

可选地，将前N个的所述候选视频，作为所述用户的推荐视频，向所述用户进行推荐。

本实施例提供的视频推荐方法，通过考虑所述用户的目标不显著特征对应的embedding对于视频推荐的影响，可更加全面对候选模型进行进一步筛选，得到更符合用户偏好的推荐视频，能够提高视频推荐的准确性。

图2为本发明又一实施例提供的一种视频推荐方法的流程示意图。

如图2所示，在上述实施例的基础上，本发明又一实施例提供的视频推荐方法，所述深度评分模型包括深度模型和广度模型，所述方法的步骤12具体为：

步骤121、将所述目标不显著特征对应的embedding输入至所述深度模型，进行特征提取，输出具代表性的目标不显著特征对应的embedding；

可选地，所述深度模型是TensorFlow系统的基础框架模型，主要功能是进行特征提取，特征提取包括特征转换、编码，得到的具代表性的目标不显著特征对应的embedding，相较于所述目标不显著特征对应的embedding，具有更低的维度，更具代表性。

可选地，在进行评分之前，将所述目标不显著特征对应的embedding进行特征提取，得到具代表性的目标不显著特征对应的embedding，可更清楚表达所述目标不显著特征，且将原本复杂的计算进行了简化。

步骤122、拼接所述具代表性的目标不显著特征对应的embedding、所述目标显著特征对应的embedding和所述目标历史视频特征对应的embedding，得到拼接embedding；

可选地，拼接是TensorFlow系统的一种特征组合方式，如将20维的特征向量与10维的特征向量进行拼接，可得到30维的特征向量。

步骤123、将拼接embedding输入至所述广度模型，输出所述用户对每一候选视频的评分，所述广度模型表示拼接embedding与每一候选视频的评分的对应关系。

可选地，所述广度模型是TensorFlow系统的基础框架模型，所述广度模型表示预先训练得到的拼接embedding与每一候选视频的评分的对应关系。

输入拼接embedding，根据拼接embedding与每一候选视频的评分的对应关系，可得到拼接embedding对每一候选视频的评分，即所述用户对每一候选视频的评分。

可选地，所述广度模型采用FTRL(Follow the-regularized-leader)优化器进行参数更新，所述深度模型部分采用AdaGrad优化器进行参数更新。

本发明实施例的其他步骤与上述实施例的步骤相似，本发明实施例不再赘述。

本实施例提供的视频推荐方法，通过深度模型清楚表达所述目标不显著特征，由深度模型和广度模型结合的策略，将复杂的计算进行了简化，从而易于实现对每一候选视频的评分。

如图2所示，在上述实施例的基础上，本发明又一实施例提供的视频推荐方法，步骤123中将所述拼接embedding输入至所述广度模型，输出所述用户对每一候选视频的评分，具体为：

将所述拼接embedding输入至所述广度模型，以训练用户对每一候选视频的观看时长比作为标签，输出所述用户对每一候选视频的评分。

可以理解的是，候选视频可视为与用户历史观看的视频相似的视频，而实际应用中，用户历史观看的视频可能没有看完，表示用户历史观看的视频并不完全是用户感兴趣的、喜欢的视频。在获得候选视频后，还对候选视频进行进一步的筛选，获取训练用户对每一候选视频的观看时长，确定每一候选视频的内容受用户的喜欢程度。

可选地，所述候选视频的观看时长比是观看时长与视频时长比值，按照[0.2,0.4,0.6,0.8,1]作为分割值，分别对应的区段为1-5，则该广度模型的输入标签为0、1、2、3、4、5。

本实施例提供的视频推荐方法，通过在获得候选视频后，还对候选视频以训练用户对每一候选视频的观看时长比进行进一步的筛选，确定每一候选视频的内容受用户的喜欢程度，从而进一步提高广度模型的精度。

如图1所示，在上述实施例的基础上，本发明又一实施例提供的视频推荐方法，步骤11与步骤12之间，在应用所述深度评分模型之前，还需确定所述候选视频。

所述方法还包括：

根据所述目标历史视频特征对应的embedding，以及预先建立的深度候选模型，确定所述用户对应的多个候选视频，所述深度候选模型表示历史视频特征对应的embedding与每一候选视频的对应关系。

可选地，对于海量的视频，所述深度候选模型表示具有历史视频特征对应的embedding的训练用户，对于每一候选视频的对应关系。

可选地，自视频信息库输入海量的视频对应的视频特征，经过全链接层进行编码，执行视频embedding，得到所述视频特征对应的embedding，自用户信息库输入训练用户的历史视频特征，经过全链接层进行编码，执行视频embedding，得到所述训练用户的历史视频特征对应的embedding。

求所述视频特征对应的embedding与所述训练用户的历史视频特征对应的embedding的相似度，将相似度高的n部候选视频输入至深度评分模型。

本发明实施例中，采用近似用户之间embedding余弦夹角最小化的思想，可将原本复杂的相似度计算问题进行了简化，解决了处理海量(百万量级)视频时数据量过大而带来的等待时间过长问题。

针对每一视频，提取视频特征，并获取视频特征对应的embedding。

可选地，获取所述用户的目标历史视频特征对应的embedding与视频特征对应的embedding的余弦距离。

针对每一视频，分别获取所述余弦距离，将所述余弦距离小于预设值时对应的视频，作为所述候选视频。可以理解的是，所述余弦距离小，表示所述用户的所述目标历史视频特征与所述视频特征相似度高。

本实施例提供的视频推荐方法，考虑所述用户的所述目标历史视频特征对于候选视频的影响，可更加全面对海量的视频进行筛选，以得到更符合用户偏好的候选视频。

如图1所示，在上述实施例的基础上，本发明又一实施例提供的视频推荐方法，建立所述深度评分模型的方式可为多种，本发明实施例以其中一种为例进行说明。

在所述步骤11之前，所述方法还包括：

获取训练用户在预设时间段内的离线数据，所述离线数据包括所述训练用户的人口统计学特征对应的特征向量embedding和所述训练用户的历史视频特征对应的embedding，其中，所述人口统计学特征对应的embedding包括显著特征的embedding和不显著特征embedding；

根据所述显著特征对应的embedding、所述不显著特征对应的embedding和所述历史视频特征对应的embedding，以训练用户对每一训练候选视频的观看时长比作为标签，通过归一化模型的逻辑损失函数进行训练，建立所述深度评分模型。

建立所述深度评分模型的过程为：获取训练的数据以及训练。

可以理解的是，训练的数据越多，则模型数据越准确。

现有技术的模型训练使用在线训练的方式，即仅仅是根据训练用户的在线行为做出训练，在此期间会影响用户的体验效果，且在线训练所拥有的数据量很少。

可选地，获取训练用户在预设时间段内的离线数据，所述离线数据包括所述训练用户的人口统计学特征和对应的特征向量embedding和所述训练用户的历史视频特征对应的embedding。

可选地，在确定训练的离线数据后，将所述目标不显著特征对应的embedding输入至所述深度模型，进行特征提取，输出具代表性的目标不显著特征对应的embedding。

通过embedding拼接层拼接所述具代表性的目标不显著特征对应的embedding和所述目标显著特征对应的embedding和所述目标历史视频特征对应的embedding，得到拼接embedding。

将拼接embedding经过全链接层进行编码后，将拼接embedding输入至归一化模型的逻辑损失函数(logistic loss)进行归一化处理。

然后，将归一化结果输入至所述广度模型(即图3中评分模型)，输出所述用户对每一候选视频的评分，所述广度模型表示拼接embedding与每一候选视频的评分的对应关系。

本发明实施例获取离线数据，离线数据相比于在线数据的数量量大很多，在很大程度上提高了深度学习模型的训练效果。

如图1所示，在上述实施例的基础上，本发明又一实施例提供的视频推荐方法，所述目标历史视频特征对应的embedding可为多种，本发明实施例以其中几种为例进行说明。

可选地，所述目标历史视频特征对应的embedding是根据以下至少其中一者得到的：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数。

可选地，根据所述行为信息特征的观看历史、搜索历史、浏览历史，确定所述目标历史视频特征。

可选地，所述目标历史视频特征包括有关用户的视频特征，所述目标历史视频特征是根据以下至少其中一者得到的：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数。

可以理解的是，现有技术中输入的视频相关特征仅仅根据观看序列训练出视频语料embeddings，在本发明实施例中，所述用户的目标历史视频特征不仅为观看、搜索过的视频ID，还包括视频本身的诸多特征，可更清楚的描述所述用户的目标历史视频特征。

在本步骤中，将所述目标历史视频特征进行映射处理，得到所述目标历史视频特征对应的embedding。

可选地，所述目标历史视频特征对应的embedding与映射前所述目标历史视频特征的基本属性相同，同样是根据以下至少其中一者得到的：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数。

本实施例提供的视频推荐方法，所述用户的目标历史视频特征不仅为观看、搜索过的视频ID，还包括视频本身的诸多特征，可更清楚的描述所述用户的目标历史视频特征。

如图1所示，在上述实施例的基础上，本发明又一实施例提供的视频推荐方法，所述目标不显著特征对应的embedding可为多种，本发明实施例以其中几种为例进行说明。

可选地，所述目标不显著特征对应的embedding是根据以下至少其中一者得到的：用户类型、证件类型、归属地、教育程度、工作类型、应用的套餐。

其中，用户类型为用户是企业用户、集团用户或个人用户，证件类型可表示所述用户的身份，如国籍，归属地表示用户所属地域，应用的套餐表示用户的消费行为。

也就是说，所述目标不显著特征可为运营商掌握的数据，从运营商的角度描述用户本身的特征，运营商相较于视频网站，掌握与用户本身的特征以及用户的消费行为相关的特征，由运营商描述的特征得到所述目标不显著特征，可更全面的描述所述用户的人口统计学特征。

在本步骤中，将所述目标不显著特征进行映射处理，得到所述目标不显著特征对应的embedding。

可选地，所述目标不显著特征对应的embedding与映射前所述目标不显著特征的基本属性相同，同样是与至少其中一者相关：用户类型、证件类型、归属地、教育程度、工作类型、应用的套餐等。

本实施例提供的视频推荐方法，考虑所述用户的目标不显著特征与运营商相关，获取更全面的目标人口统计学特征，从而能够提高视频推荐的准确性。

为了更充分理解本发明的技术内容，在上述实施例的基础上，详细说明本实施例提供的视频推荐方法。

现有技术方案中YouTube基于深度学习的推荐系统在训练用户embeddings时，其输入的视频相关特征仅仅根据观看序列训练出视频语料embeddings，并未融入视频的本身的诸多特征。因此，其训练的用户embeddings与视频语料embeddings的相似度具有一定片面性。此外，每次模型更新时候的在线训练仅仅是根据用户的在线行为做出训练，在此期间会影响用户的体验效果，且相比于大量的离线数据，在线训练所拥有的数据量很少，在很大程度上降低了深度学习模型的训练效果。因子机(Factorization Machine)表明稀疏特征间组合能大幅提高预测精度，而YouTube的上述深度学习模型中，并未考虑的稀疏特征间的组合。

本实施例的目的为了克服现有个性化推荐系统的技术缺陷，解决在视频推荐领域中推荐的有效性问题，提供一种基于深度学习的个性化视频推荐系统，针对海量用户与视频数据，通过深度神经网络融入多样性特征对用户做有效的个性化推荐。借鉴因子机(Factorization Machine)的特征组合思想，本发明的两个深度模型都加入了线性模型组合部分稀疏相关特征。本发明通过离线的用户数据、视频数据与用户行为数据，在候选模型中通过两个分别加入了线性模型的深度学习模型分别训练用户embeddings与视频embeddings。根据单个用户embedding与视频语料embeddings相似度筛选出一百个最相似的视频，作为候选电影集合。而在深度评分模型中，我们将再次使用上一步生成的候选推荐集合作为输入数据的一部分，最终获得该待推荐用户对于这一百部电影的预测评分，并将评分Top10所对应的电影推荐给此用户。

本实施例的详细阐述：

(一)特征收集

通过收集用户人口统计学特征和用户行为分析特征，分析用户的行为偏好、兴趣点等，刻画用户本质需求的属性集合，为每一个用户生成特有的画像；通过收集视频特征，量化视频属性，基于准确的用户模型和原始视频属性，为个性化推荐系统提供可靠的数据来源。

用户人口统计学特征：用户ID、年龄、性别、教育程度等；

视频特征：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数等；

用户行为信息特征：用户ID、观看历史、观看时长、搜索历史、浏览历史、剩余流量、手机品牌等。

(二)特征抽取与特征变换

由于原始特征可能维数很高，或包含大量的冗余特征和无关特征，会使后续算法的计算复杂度变得很高，通过进一步进行特征提取和特征变换，抽取样本最相关特征，降低数据维数和消除不相关特征和冗余特征。

观看时长占比：时长与该视频总时长比值；

年龄组ID：年龄转换为年龄段对应的ID；

所占存储空间、时长、剩余流量、播放次数、发行时间距今天数(发行时间距当前时间天数)做归一化处理；归一化处理采用根据实现设定的分位数，在两相邻分位数区间进行线性插值，计算相应特征值对应的概率值，特征值归一化到区间[0,1]。

搜索历史序列：提取最近搜索的10个字符；

观看历史序列：提取最近观看的10个视频ID。

图3示出了本发明实施例提供的视频推荐方法的深度候选模型和深度评分模型的示意图。

(三)深度候选模型训练

如图3所示，通过深度候选模型，训练出用户的embeddings，根据视频embeddings与用户embeddings相似度从大到小排序，从海量视频中选取相似度值靠前的数百个待推荐的候选视频，其包含以下模块：

1)训练视频ID与搜索记录字符的embeddings：拼接所有用户的观看视频记录，ID之间以空格分隔，然后使用CBOW训练出每个ID对应的embeddings；拼接所有用户的搜索记录字符，字符之间以空格分割，然后使用CBOW训练出每个字符对应embeddings；

2)候选模型输入拼接特征与标签：拼接用户最近10个观看视频ID embeddings的平均embedding、最近10个搜索字符embeddings的平均embeddings、观看时长占比、年龄组ID的初始化embeddings、教育程度的embedding、性别embedding、手机型号embedding、归一化后的发行时间距今天数与剩余流量作为候选模型输入；用户是否完成观看为输入标签，完成为1，否则为0。

也就是说，自视频信息库输入海量的视频对应的视频特征，经过全链接层进行编码，执行视频embedding，得到所述视频特征对应的embedding，自用户信息库输入训练用户的历史视频特征，经过全链接层进行编码，执行视频embedding，得到所述训练用户的历史视频特征对应的embedding，求所述视频特征对应的embedding与所述训练用户的历史视频特征对应的embedding的相似度，将相似度高的n部候选视频输入至深度评分模型。

在本步骤中，通过深度候选模型对海量的视频进行筛选，筛选出与用户历史视频特征相似的视频，作为候选视频，输入至深度评分模型中，以供深度评分模型对所述候选视频进行进一步地筛选。

(四)深度评分模型训练

如图3所示，通过深度评分模型，对待推荐视频进行评分，按照分值由大到小排序，选取前十个视频作为最终推荐视频，其包含以下模块：

1)深度评分模型特征选择：拼接候选模型输入层特征、归一化后的连续型特征(所占存储空间、时长、播放次数)、内容类型embeddings、候选集视频的embedding作为输入特征，将用户观看(所展示视频)时长比例区段数作为训练标签。候选集视频由候选模型生成，用户观看待展示视频行为由数天的离线实验获取，观看时长比例区段数计算方法——用户未观看为0，用户观看时长比例为观看时长与视频时长比值，按照[0.2,0.4,0.6,0.8,1]作为分割值，对应的区段为1-5，则该模型输入标签为0、1、2、3、4、5。

2)深度评分模型输入层：广度模型部分的输入为深度模型输入特征中的教育程度、性别、手机型号、内容类型、年龄组等这些特征所对应的embedings。广度模型的神经元选择为ReLU，层的神经元个数为输入的拼接的特征向量的列数，第二层神经元的个数为层神经元个数的一半，第三层为128个ReLU单元；深度评分模型采用逻辑损失函数(logisticloss function)进行训练，广度模型部分采用Follow the-regularized-leader(FTRL)优化器进行参数更新，深度模型部分采用AdaGrad优化器进行参数更新。

在本步骤中，深度评分模型包括深度模型、归一化模型以及广度模型。

在确定训练的离线数据以及候选视频后，将所述目标不显著特征对应的embedding输入至所述深度模型，进行特征提取，输出具代表性的目标不显著特征对应的embedding。

将拼接embedding经过全链接层进行编码后，将拼接embedding输入至归一化模型的逻辑损失进行归一化处理。

然后，将归一化结果输入至所述广度模型(如图3所示的评分模型)，输出所述用户对每一候选视频的评分，所述广度模型表示拼接embedding与每一候选视频的评分的对应关系。

由广度模型确定所述用户对每一候选视频的评分后，进一步进行评分排序，将排序高的前10个候选视频，作为推荐视频向所述用户进行展示。

(五)上线测试

进行模型对比：使用相同的离线数据，本发明的模型的离线评估指标(准确率、召回率等)，与协同过滤模型相比有所提高；与YouTube的深度学习推荐系统相比，本发明通过使用离线数据，避免了上线训练的弊端。

本发明的关键点是将深度学习技术引入推荐系统，通过借鉴当前主流的深度学习模型，并将其与推荐系统进行了融合，提升了推荐效果和推荐体验。

首先本发明的整个设计思路是借鉴了工业界推荐系统的通用构架。深度候选模型采用近似用户之间embedding余弦夹角最小化的思想，将原本复杂的相似度计算问题进行了简化，解决了处理海量(百万量级)视频时数据量过大而带来的等待时间过长问题；评分模型则采用深度模型和广度模型结合的策略，通过深度学习方法提升了整个推荐系统的工程化、泛化和个性化能力。在推荐系统中创新的引入深度学习模型，并且提出一种深度候选模型和深度评分模型的设计与使用。

与现有技术的方法相比，本发明实施例具有如下优点：

1.本发明实施例利用基于深度学习模型能融入多样的特征，避免了现有技术的算法只能融入部分特征，导致部分有效信息丢失。

2.本发明实施例解决了在海量数据中常用推荐算法所面临的数据稀疏性问题，通过用户基本信息的特征输入解决了协同过滤的冷启动问题。

3.本发明实施例利用了双模型分别融入了用户与视频及用户行为的特征训练用户与视频的embeddings，特征的多样性提高了模型的学习能力；最后发明借鉴因子机的特征组合思想，组合部分特征，进一步提高了推荐精度。在线测试表明，可大大提高了推荐效果，改善了用户体验，且满足服务效率。

图4示出了本发明又一实施例提供的一种视频推荐装置的结构示意图。

参照图4，在上述实施例的基础上，本实施例提供的视频推荐装置，所述装置包括获取模块41、确定模块42和推荐模块43，其中：

获取模块41用于获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；确定模块42用于根据所述目标显著特征对应的embedding、所述目标不显著特征对应的embedding和所述目标历史视频特征对应的embedding，以及预先建立的深度评分模型，确定所述用户对每一候选视频的评分，所述深度评分模型表示显著特征对应的embedding、不显著特征对应的embedding和历史视频特征对应的embedding与每一候选视频的评分的对应关系，所述候选视频是预先获得的与所述目标历史视频特征相似的视频；推荐模块43用于根据所述用户对每一候选视频的评分，确定所述用户的推荐视频。

获取模块41获取所述目标人口统计学特征，包括有关用户的显著特征，所述目标显著特征是根据以下至少其中一者得到的：用户ID、年龄、性别。

所述目标人口统计学特征还包括有关用户的目标不显著特征。不显著特征是将包括多个维度、只有其中少量维度上可有效地表达与视频的相关性的特征，即属于稀疏特征。

获取模块41将所述目标显著特征的特征进行映射处理，得到所述目标显著特征对应的embedding，同样地，得到目标不显著特征对应的embedding和目标历史视频特征对应的embedding，将所述目标显著特征对应的embedding和目标不显著特征对应的embedding，称为目标人口统计学特征对应的特征向量embedding。

预先建立深度评分模型，针对每一候选视频，确定显著特征对应的embedding、不显著特征对应的embedding和历史视频特征对应的embedding对应的评分。

确定模块42将所述目标显著特征对应的embedding、所述目标不显著特征对应的embedding和所述目标历史视频特征对应的embedding作为所述深度评分模型的输入，可输出所述用户对每一候选视频的评分。

推荐模块43将所述评分从高到低进行排名，将所述评分最高的前N个所对应的候选视频，作为所述用户的推荐视频，向所述用户进行推荐；其中N为正整数。

所述深度评分模型包括深度模型和广度模型，确定模块42还用于：将所述目标不显著特征对应的embedding输入至所述深度模型，进行特征提取，输出具代表性的目标不显著特征对应的embedding；拼接所述具代表性的目标不显著特征对应的embedding、所述目标显著特征对应的embedding和所述目标历史视频特征对应的embedding，得到拼接embedding；将所述拼接embedding输入至所述广度模型，输出所述用户对每一候选视频的评分，所述广度模型表示拼接embedding与每一候选视频的评分的对应关系。

确定模块42还用于将所述拼接embedding输入至所述广度模型，以训练用户对每一候选视频的观看时长比作为标签，输出所述用户对每一候选视频的评分。

确定模块42还用于根据所述目标历史视频特征对应的embedding，以及预先建立的深度候选模型，确定所述用户对应的多个候选视频，所述深度候选模型表示历史视频特征对应的embedding与每一候选视频的对应关系。

所述目标历史视频特征对应的embedding是根据以下至少其中一者得到的：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数。

所述目标不显著特征对应的embedding是根据以下至少其中一者得到的：用户类型、证件类型、归属地、教育程度、工作类型、应用的套餐。

所述装置还包括训练模块，所述训练模块用于获取训练用户在预设时间段内的离线数据，所述离线数据包括所述训练用户的人口统计学特征对应的特征向量embedding和所述训练用户的历史视频特征对应的embedding，其中，所述人口统计学特征对应的embedding包括显著特征的embedding和不显著特征embedding；根据所述显著特征对应的embedding、所述不显著特征对应的embedding和所述历史视频特征对应的embedding，以训练用户对每一训练候选视频的观看时长比作为标签，通过归一化模型的逻辑损失函数进行训练，建立所述深度评分模型。

本实施例提供的视频推荐装置，可用于执行上述方法实施例的方法，本实施不再赘述。

本实施例提供的视频推荐装置，通过考虑所述用户的目标不显著特征对应的embedding对于视频推荐的影响，确定模块可更加全面对候选模型进行进一步筛选，得到更符合用户偏好的推荐视频，能够提高视频推荐的准确性。

图5示出了本发明又一实施例提供的一种电子设备的结构示意图。

参阅图5，本发明实施例提供的电子设备，所述电子设备包括存储器51、处理器52、总线53以及存储在存储器51上并可在处理器52上运行的计算机程序，所述处理器52执行所述计算机程序时实现以下的方法的步骤。其中，所述存储器51、处理器52通过所述总线53完成相互间的通信。

所述处理器52用于调用所述存储器51中的程序指令，以执行所述程序时实现如图1-2的方法。

在另一种实施方式中，所述处理器执行所述程序时实现如下方法：

所述将拼接embedding输入至所述广度模型，输出所述用户对每一候选视频的评分的步骤具体为：

所述确定所述用户对每一候选视频的评分的步骤之前，所述方法还包括：

在另一种实施方式中，所述目标历史视频特征对应的embedding是根据以下至少其中一者得到的：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数。

在另一种实施方式中，所述目标不显著特征对应的embedding是根据以下至少其中一者得到的：用户类型、证件类型、归属地、教育程度、工作类型、应用的套餐。

所述获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding之前，所述方法还包括：

本实施例提供的电子设备，可用于执行上述方法实施例的方法对应的程序，本实施不再赘述。

本实施例提供的电子设备，通过所述处理器执行所述程序时实现考虑所述用户的目标不显著特征对应的embedding对于视频推荐的影响，可更加全面对候选模型进行进一步筛选，得到更符合用户偏好的推荐视频，能够提高视频推荐的准确性。

本发明又一实施例提供的一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如图1-2的方法。

本实施例提供的存储介质，所述程序被处理器执行时实现上述方法实施例的方法，本实施不再赘述。

本实施例提供的存储介质，所述程序被处理器执行时实现考虑所述用户的目标不显著特征对应的embedding对于视频推荐的影响，可更加全面对候选模型进行进一步筛选，得到更符合用户偏好的推荐视频，能够提高视频推荐的准确性。

本发明又一实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：

本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。

本领域技术人员可以理解，实施例中的各步骤可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。

虽然结合附图描述了本发明的实施方式，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种视频推荐方法，其特征在于，所述方法包括：

获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；所述目标显著特征是根据以下至少其中一者得到的：用户ID、年龄、性别，所述目标不显著特征是包括多个维度、只有其中少量维度上可有效地表达与视频的相关性的特征；

2.根据权利要求1所述的方法，其特征在于:所述深度评分模型包括深度模型和广度模型；相应地，所述确定所述用户对每一候选视频的评分的步骤具体为：

将所述目标不显著特征对应的embedding输入至所述深度模型，进行特征提取，输出具代表性的目标不显著特征对应的embedding；

拼接所述具代表性的目标不显著特征对应的embedding和所述目标显著特征对应的embedding和所述目标历史视频特征对应的embedding，得到拼接embedding；

将所述拼接embedding输入至所述广度模型，输出所述用户对每一候选视频的评分，所述广度模型表示拼接embedding与每一候选视频的评分的对应关系。

3.根据权利要求2所述的方法，其特征在于:所述将所述拼接embedding输入至所述广度模型，输出所述用户对每一候选视频的评分的步骤具体为：

4.根据权利要求1所述的方法，其特征在于:所述确定所述用户对每一候选视频的评分的步骤之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于：所述获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于：所述目标历史视频特征对应的embedding是根据以下至少其中一者得到的：视频ID、所占存储空间、时长、内容类型、发行时间、播放次数。

7.根据权利要求1-6任一项所述的方法，其特征在于：所述目标不显著特征对应的embedding是根据以下至少其中一者得到的：用户类型、证件类型、归属地、教育程度、工作类型、应用的套餐。

8.一种视频推荐装置，其特征在于，所述装置包括：

获取模块，用于获取用户在预设时间段内的所述用户的目标人口统计学特征对应的特征向量embedding和所述用户的目标历史视频特征对应的embedding，其中，所述目标人口统计学特征对应的embedding包括目标显著特征的embedding和目标不显著特征embedding；所述目标显著特征是根据以下至少其中一者得到的：用户ID、年龄、性别，所述目标不显著特征是包括多个维度、只有其中少量维度上可有效地表达与视频的相关性的特征；

9.一种电子设备，其特征在于，包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如权利要求1-7任意一项的步骤。

10.一种存储介质，其上存储有计算机程序，其特征在于：所述程序被处理器执行时实现如权利要求1-7任意一项的步骤。