CN108875022A

CN108875022A - 一种视频推荐方法及装置

Info

Publication number: CN108875022A
Application number: CN201810637661.3A
Authority: CN
Inventors: 雷迦吟
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2018-11-23
Anticipated expiration: 2038-06-20
Also published as: CN108875022B

Abstract

本申请公开的视频推荐方法及装置，通过训练得到的深度学习模型能够使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频，且第一视频的点击率小于第二视频的点击率，这样深度学习模型可以将候选推荐视频中，与用户兴趣点契合的点击率较高和点击率较低的视频均选择出来，进而推荐给用户。因此，本申请提供的视频推荐方法，既能从候选推荐视频中推荐出用户喜好的视频，又可以解决新视频冷启动问题。

Description

一种视频推荐方法及装置

技术领域

本发明涉及数据处理领域，更具体地说，涉及一种视频推荐方法及装置。

背景技术

目前，利用用户与视频的对应关系的历史数据，来训练机器学习模型，进而利用训练好的机器学习模型来分析哪些视频是用户喜欢的视频，以将用户喜欢的视频推荐给用户。但是，依据历史数据训练好的机器学习模型，分析出来的用户喜欢的视频，会偏向于高点击率的视频。

例如用户以往看的都是悬疑类型的视频，则给用户推荐的视频都是与用户以往看的悬疑类型相关且点击率较高的悬疑类型的视频，而对于与用户以往看的悬疑类型相关但点击率较低的悬疑类型的视频，则无法推荐给用户，这样会导致点击率较低的视频得不到一定的曝光，进而导致点击率较低的视频没有曝光点击数据支撑。在点击率较低的视频没有曝光点击数据支撑的情况下，现有机器学习模型更不会将点击率较低的视频推荐给用户，从而形成了恶性循环，特别对于经常有新视频上线的视频网站十分不利。

发明内容

有鉴于此，本发明提出一种视频推荐方法及装置，欲实现推荐与用户兴趣点契合的点击率较低的视频目的。

为了实现上述目的，现提出的方案如下：

一种视频推荐方法，包括：

获取用户身份标识和多个候选推荐视频；

获取模型输入数据，所述模型输入数据包括所述多个候选推荐视频各自对应的第一特征信息以及所述用户身份标识对应的第二特征信息；

将所述模型输入数据输入预先训练得到的深度学习模型，得到所述深度学习模型输出的每个所述候选推荐视频的预测点击率，其中训练得到的所述深度学习模型使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频，第一视频的点击率小于第二视频的点击率；

根据每个候选推荐视频的预测点击率，选取至少一个候选推荐视频作为目标推荐视频输出。

可选的，所述深度学习模型的训练过程，包括：

获取曝光且用户点击过的视频训练集中每个第二视频各自对应的第一特征信息、曝光但用户未点击的视频训练集中每个第一视频各自对应的第一特征信息、以及用户身份标识对应的第二特征信息；

将获得的每个第二视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为正样本；

将获得的每个第一视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为负样本；

利用所述正样本和所述负样本对初始深度学习模型进行训练，得到符合要求的所述深度学习模型。

可选的，在所述深度学习模型的训练过程中，所述正样本和所述负样本的比例在1:50至1:150之间。

可选的，所述用户身份标识对应的第二特征信息包括：视频播放设备信息、用户会员等级信息、用户家庭成员信息、用户活跃度信息、用户各种类型频道的观看时长信息、用户点击视频对应的第一特征信息、用户收藏视频对应的第一特征信息和用户搜索视频对应的第一特征信息中的至少一种；

所述用户点击视频对应的第一特征信息、所述用户收藏视频对应的第一特征信息、所述用户搜索视频对应的第一特征信息及所述候选推荐视频对应的第一特征信息均包括视频类型信息、视频集标识信息、视频剧标识信息、视频上线时间信息和视频主演信息中的至少一种。

一种视频推荐装置，包括：

数据获取单元，用于获取用户身份标识和多个候选推荐视频；

特征获取单元，用于获取模型输入数据，所述模型输入数据包括所述多个候选推荐视频各自对应的第一特征信息以及所述用户身份标识对应的第二特征信息；

数据处理单元，用于将所述模型输入数据输入预先训练得到的深度学习模型，得到所述深度学习模型输出的每个所述候选推荐视频的预测点击率，其中训练得到的所述深度学习模型使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频，第一视频的点击率小于第二视频的点击率；

视频推荐单元，用于根据每个候选推荐视频的预测点击率，选取至少一个候选推荐视频作为目标推荐视频输出。

可选的，视频推荐装置还包括：模型训练单元，所述模型训练单元具体包括：

特征获取子单元，用于获取曝光且用户点击过的视频训练集中每个第二视频各自对应的第一特征信息、曝光但用户未点击的视频训练集中每个第一视频各自对应的第一特征信息、以及用户身份标识对应的第二特征信息；

正样本子单元，用于将获得的每个第二视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为正样本；

负样本子单元，用于将获得的每个第一视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为负样本；

训练子单元，用于利用所述正样本和所述负样本对初始深度学习模型进行训练，得到符合要求的所述深度学习模型。

与现有技术相比，本发明的技术方案具有以下优点：

上述技术方案提供的视频推荐方法，训练得到的深度学习模型能够使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频，且第一视频的点击率小于第二视频的点击率，这样深度学习模型可以将候选推荐视频中，与用户兴趣点契合的点击率较高和点击率较低的视频均选择出来，进而推荐给用户。因此，本申请提供的视频推荐方法，既能从候选推荐视频中推荐出用户喜好的视频，又可以解决新视频冷启动问题。即本申请提供的视频推荐方法可以从候选推荐视频中推荐与用户兴趣点契合的点击率较高和点击率较低的视频。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种视频推荐方法的流程图；

图2为本发明实施例提供的深度学习模型的训练过程的流程图；

图3为本发明实施例提供的一种视频推荐装置的逻辑结构示意图；

图4为本发明实施例提供的模型训练单元的逻辑结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提出了一种视频推荐方法，基于服务器实现，例如视频服务商使用的服务器等。其中，服务器主要利用预先训练得到的深度学习模型，针对某个用户对不同的候选推荐视频进行点击率预测，按照预测点击率的高低，将预测点击率值较高或者大于某个范围的若干候选推荐视频作为目标推荐视频推荐给用户。

接下来对本发明提出的视频推荐方法进行介绍，参见图1，该方法包括步骤：

S11：获取用户身份标识和多个候选推荐视频。

用户在视频客户端进行注册时，会被分配一个用户身份标识，如用户在视频客户端注册一个账号，则注册的账号信息可以视为用户身份标识，或者用户在视频客户端注册的账号可以是用户在其他应用中注册的账号，如微信账号、QQ账号、新浪微博账号等任意一种方式，则用户在其他应用中注册的账号可以视为是用户身份标识，这样以后该用户每次登陆视频客户端，均可以通过该用户身份标识识别该用户。可选的，用户登录视频客户端后，服务器从视频客户端获取该用户对应的用户身份标识，为该用户推荐其感兴趣的目标推荐视频。视频客户端包括但不限于优酷视频客户端、腾讯视频客户端等。

在本实施例中，可以基于一定规则获取候选推荐视频。如基于一定规则选取候选推荐视频可以是但不限于是：选取新上映视频作为候选推荐视频和/或根据用户身份标识对应的用户的基本信息(如性别、爱好等)选取视频，将选取出的视频作为候选推荐视频。如将与用户的基本信息相关的视频作为候选推荐视频，例如，用户的基本信息中的爱好是战争类型视频，则从数据库中选取若干战争类型视频作为候选推荐视频。

S12：获取模型输入数据，模型输入数据包括多个候选推荐视频各自对应的第一特征信息以及用户身份标识对应的第二特征信息。

在本实施例中，各类视频对应的特征信息统称为第一特征信息，用户身份标识对应的特征信息称为第二特征信息。其中用户身份标识对应的第二特征信息可以包括视频播放设备信息、用户会员等级信息、用户家庭成员信息、用户活跃度信息、用户各种类型频道的观看时长信息、用户点击视频对应的第一特征信息、用户收藏视频对应的第一特征信息和用户搜索视频对应的第一特征信息中的至少一种。

视频播放设备信息包括但不限于设备生产厂商和设备品牌信号。用户会员等级信息表明用户是什么等级的VIP用户。用户家庭成员信息表明用户家庭有哪些成员，每个成员各自对应的信息，如每个成员各自对应的基本信息，如性别、年龄、爱好等。用户活跃度信息表明用户单位时间的观影时长，例如一个月的观影时长。用户各个类型频道的观看时长信息表明用户在少儿频道、法制频道、电影频道等各个频道的观看时长信息。

用户点击视频对应的第一特征信息即用户点击过的视频对应的第一特征信息，用户收藏视频对应的第一特征信息即用户收藏过的视频对应的第一特征信息，用户搜索视频对应的第一特征信息即用户搜索过的视频对应的第一特征信息，以上各类视频对应的第一特征信息均可以包括视频类型信息、视频集标识信息(episode_id)、视频剧标识信息(album_id)、视频上线时间信息和视频主演信息中的至少一种。候选推荐视频对应的第一特征信息与以上各类视频对应的第一特征信息包含的信息类型相同。视频集标识信息即视频标题，例如，《魔戒3之王者归来》就是视频标题；视频剧标识信息即剧标题，例如，《魔戒》就是剧标题。

S13：将获取的模型输入数据输入预先训练得到的深度学习模型，得到深度学习模型输出的每个候选推荐视频的预测点击率。

深度学习模型的训练过程中，将获得的正样本分为两部分，一部分用于深度学习模型的训练，另一部分用于深度学习模型的测试；同理，负样本也分为两部分，一部分用于深度学习模型的训练，另一部分用于深度学习模型的测试，其中负样本的点击率小于正样本的点击率。

在本实施例中，负样本可以是曝光但用户未点击的视频测试集中的视频(为了便于描述，曝光但用户未点击的视频测试集和视频训练集中的视频均称为第一视频)，正样本可以是曝光但用户点击过的视频测试集中的视频(为了便于描述，曝光且用户点击过的视频测试集和视频训练集中的视频均称为第二视频)，用于深度学习模型的测试。曝光且用户点击过是针对某个用户说的，例如视频A曝光给用户B，且用户B点击了曝光的视频A，则视频A就是曝光且用户B点击过的视频训练集中的一个视频数据；类似的，曝光但用户未点击也是针对某个用户说的，例如视频C曝光给用户B，但是用户并未点击曝光的视频C，则视频C就是曝光且用户C未点击的视频训练集中的一个视频数据。

如果训练后的深度学习模型，能够使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，则当前深度学习模型为符合要求的深度学习模型，则可以应用于视频推荐；否则继续对深度学习模型进行训练，直到符合上述要求为止，其中预测点击率大于预设的点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频。在得到符合要求的深度学习模型时，对应的第一特征信息和第二特征信息分别包含的信息类型，即为后续点击率预测时输入深度学习模型中的第一特征信息和第二特征信息分别包含的信息类型。

在本发明的一个具体实施例中，深度学习模型的结构可以采用谷歌提出的Wide&Deep模型的结构。Wide&Deep模型包括线性子模型和非线性子模型。将输入数据中的高维度类别特征信息输入非线性子模型，将输入数据中的低维度类别特征信息输入线性子模型。

具体的，以Wide&Deep模型作为深度学习模型时，将获取的模型输入数据输入预先训练得到的深度学习模型的可行方式可以是：将一个候选推荐视频对应的第一特征信息和用户身份标识对应的第二特征信息组合在一起作为一组数据输入深度学习模型，参照上述对第二特征信息的说明，具体输入可以是：将用户点击视频对应的第一特征信息、用户收藏视频对应的第一特征信息和用户搜索视频对应的第一特征信息及候选推荐视频对应的第一特征信息输入非线性子模型，将用户会员等级信息、用户家庭成员信息、用户活跃度信息、用户各种类型频道的观看时长信息输入线性子模型。进而得到深度学习模型输出的每个候选推荐视频的预测点击率。

S14：根据每个候选推荐视频的预测点击率，选取至少一个候选推荐视频作为目标推荐视频输出。

可以理解的是：预测点击率越高说明用户对该候选推荐视频越感兴趣，越有可能点击该候选推荐视频。服务器通过深度学习模型计算得到为每个候选推荐视频的预测点击率后，将候选推荐视频按照预测点击率从高到低依次排序，将排序靠前的若干候选推荐视频作为目标推荐视频输出至视频客户端，通过视频客户端为用户显示目标推荐视频；或者将预测点击率在某一个范围的若干候选推荐视频作为目标推荐视频输出，推荐给用户。在本实施例中，对于目标推荐视频的个数并不限定，可以根据具体情况进行自由设定。

本实施例提供视频推荐方法，训练得到的深度学习模型能够使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频，且第一视频的点击率小于第二视频的点击率。这样深度学习模型可以将候选推荐视频中，与用户兴趣点契合的点击率较高和点击率较低的视频均选择出来，进而推荐给用户。因此，本申请提供的视频推荐方案，既能从候选推荐视频中推荐出用户喜好的视频，又可以解决新视频冷启动问题。即从候选推荐视频中推荐与用户兴趣点契合的点击率较高和点击率较低的视频。点击率较低的视频包括视频网站中新更新的视频以及曝光但用户点击较少的视频。需要说明的是，视频的点击率是针对视频说的，利用视频A曝光给了100个用户，其中10个用户点击了曝光的视频A，则视频A的点击率为0.1。

在本实施例中，提供了深度学习模型的训练过程，参见图2，具体的训练过程包括以下步骤：

S21：获取曝光且用户点击过的视频训练集中每个第二视频各自对应的第一特征信息、曝光但用户未点击的视频训练集中每个第一视频各自对应的第一特征信息、以及用户身份标识对应的第二特征信息。

通过系统记录的视频曝光日志并结合系统记录的视频点击日志等，获得曝光且用户点击过的视频训练集中每个第二视频各自对应的第一特征信息、曝光但用户未点击的视频训练集中每个第一视频各自对应的第一特征信息、以及用户身份标识对应的第二特征信息。

需要说明的是，在深度学习模型的训练过程中，对于最初选择的第一视频和第二视频各自对应的第一特征信息包含的信息类型、以及用户身份标识对应的第二特征信息包含的信息类型不做限定。例如，最初选择的第一视频和第二视频各自对应的第一特征信息可以包括视频类型信息、视频集标识信息、视频剧标识信息、视频上线时间信息和视频主演信息；用户身份标识对应的第二特征信息可以包括视频播放设备信息、用户会员等级信息、用户家庭成员信息、用户活跃度信息、用户各种类型频道的观看时长信息、用户点击视频对应的第一特征信息、用户收藏视频对应的第一特征信息和用户搜索视频对应的第一特征信息。

S22：将获得的每个第二视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为正样本。

S23：将获得的每个第一视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为负样本。

S24：利用正样本和负样本对初始深度学习模型进行训练，得到符合要求的深度学习模型。

需要说明的是，本实施例上述介绍的是利用一个用户的数据进行深度学习模型训练的过程，实际的深度学习模型会利用多个用户的数据，而利用多个用户的数据进行深度学习模型训练的过程中，利用各个用户的数据对深度学习模型的训练过程均与上述S21～S24的过程一致。

初始深度学习模型是指设置好深度学习模型的初始参数，但是还没有进行训练的模型。在深度学习模型的训练过程中，如果修改深度学习模型的参数始终得不到符合要求的深度学习模型，则先修改样本数据中的视频对应的第一特征信息包含的信息类型，和/或，用户身份标识对应的第二特征信息包含的信息类型，再修改模型的参数以得到符合要求的深度学习模型。

具体的，将与某个用户对应的曝光且用户点击过的第二视频对应的第一特征信息、以及该用户的用户身份标识对应的第二特征信息作为模型输入数据，并以深度学习模型输出的预测点击率为1，对深度学习模型进行训练。以及，将与某个用户对应的曝光但用户未点击的第一视频对应的第一特征信息、以及该用户的用户身份标识对应的第二特征信息作为模型输入数据，并以深度学习模型输出的预测点击率为0，对深度学习模型进行训练。

在本实施例中对于点击率阈值的具体值不做限定，可以针对不同的视频网站情况或不同时期，采用不同的点击率阈值。

在本实施例中，并不限定训练数据(如上述与某个用户对应的第二视频对应的第一特征信息和该用户的用户身份标识对应的第二特征信息，以及上述与某个用户对应的第一视频对应的第一特征信息和该用户的用户身份标识对应的第二特征信息)的个数，但是为了更精确的训练，训练数据对的数量越多越好。在准备训练数据时，为了保障训练出合格的深度学习模型，设置正样本和负样本的比例在1:50至1:150之间的一个比例。可选的，设置正样本与负样本的比例为1:100。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。

下述为本发明装置实施例，可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节，请参照本发明方法实施例。

本实施例提供一种视频推荐装置，参见图3，该装置包括：数据获取单元11、特征获取单元12、数据处理单元13和视频推荐单元14。

数据获取单元11，用于获取用户身份标识和多个候选推荐视频；

特征获取单元12，用于获取模型输入数据，所述模型输入数据包括所述多个候选推荐视频各自对应的第一特征信息以及所述用户身份标识对应的第二特征信息；

数据处理单元13，用于将所述模型输入数据输入预先训练得到的深度学习模型，得到所述深度学习模型输出的每个所述候选推荐视频的预测点击率，其中训练得到的所述深度学习模型使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值，预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频，第一视频的点击率小于第二视频的点击率；

视频推荐单元14，用于根据每个候选推荐视频的预测点击率，选取至少一个候选推荐视频作为目标推荐视频输出。

本实施例提供的视频推荐装置，既能从候选推荐视频中推荐出用户喜好的视频，又可以解决新视频冷启动问题。即本申请提供的视频推荐方法可以从候选推荐视频中推荐与用户兴趣点契合的点击率较高和点击率较低的视频。

可选的，视频推荐装置还包括：模型训练单元，参见图4，所述模型训练单元具体包括：特征获取子单元21、正样本子单元22、负样本子单元23和训练子单元24。

特征获取子单21，用于获取曝光且用户点击过的视频训练集中每个第二视频各自对应的第一特征信息、曝光但用户未点击的视频训练集中每个第一视频各自对应的第一特征信息、以及用户身份标识对应的第二特征信息；

正样本子单元22，用于将获得的每个第二视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为正样本；

负样本子单元23，用于将获得的每个第一视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为负样本；

训练子单元24，用于利用所述正样本和所述负样本对初始深度学习模型进行训练，得到符合要求的所述深度学习模型。

可选的，所述正样本和所述负样本的比例在1:50至1:150之间。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对本发明所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种视频推荐方法，其特征在于，包括：

获取用户身份标识和多个候选推荐视频；

2.根据权利要求1所述的方法，其特征在于，所述深度学习模型的训练过程，包括：

3.根据权利要求2所述的方法，其特征在于，在所述深度学习模型的训练过程中，所述正样本和所述负样本的比例在1:50至1:150之间。

4.根据权利要求1～3任意一项所述的方法，其特征在于，

所述用户身份标识对应的第二特征信息包括：视频播放设备信息、用户会员等级信息、用户家庭成员信息、用户活跃度信息、用户各种类型频道的观看时长信息、用户点击视频对应的第一特征信息、用户收藏视频对应的第一特征信息和用户搜索视频对应的第一特征信息中的至少一种；

5.一种视频推荐装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，还包括：模型训练单元，所述模型训练单元具体包括：

7.根据权利要求6所述的装置，其特征在于，所述正样本和所述负样本的比例在1:50至1:150之间。

8.根据权利要求5～7任意一项所述的装置，其特征在于，