CN110717069B

CN110717069B - 视频推荐方法及装置

Info

Publication number: CN110717069B
Application number: CN201810758237.4A
Authority: CN
Inventors: 滕飞
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2018-07-11
Filing date: 2018-07-11
Publication date: 2022-08-05
Anticipated expiration: 2038-07-11
Also published as: CN110717069A

Abstract

本公开涉及视频推荐方法及装置。该方法包括：根据目标用户的用户行为数据，确定目标用户对应的初始用户特征向量，并确定目标用户对应的正样本视频和负样本视频；通过神经网络获取目标用户对应的第一优化用户特征向量、正样本视频对应的优化视频特征向量以及负样本视频对应的优化视频特征向量；根据正样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，以及负样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，优化神经网络的参数；基于优化后的神经网络，向目标用户进行视频推荐。本公开能够提高视频推荐的准确性。

Description

视频推荐方法及装置

技术领域

本公开涉及视频技术领域，尤其涉及一种视频推荐方法及装置。

背景技术

由于网络视频的信息参差不齐、内容繁杂，因此，视频网站的运营人员通常选择基于协同过滤的推荐算法进行视频推荐。近些年来，随着互联网行业和多媒体技术的飞速发展，网络视频量和视频用户量都在迅速增长。巨大的视频量和用户量使得协同过滤中的评分矩阵变得稀疏，从而导致视频推荐的准确性较低。

发明内容

有鉴于此，本公开提出了一种视频推荐方法及装置。

根据本公开的一方面，提供了一种视频推荐方法，包括：

根据目标用户的用户行为数据，确定所述目标用户对应的初始用户特征向量；

根据所述目标用户的用户行为数据，确定所述目标用户对应的正样本视频和负样本视频；

确定所述正样本视频对应的初始视频特征向量，以及所述负样本视频对应的初始视频特征向量；

将所述目标用户对应的初始用户特征向量、所述正样本视频对应的初始视频特征向量以及所述负样本视频对应的初始视频特征向量分别输入神经网络，获取所述目标用户对应的第一优化用户特征向量、所述正样本视频对应的优化视频特征向量以及所述负样本视频对应的优化视频特征向量；

根据所述正样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，以及所述负样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，优化所述神经网络的参数；

基于优化后的神经网络，向所述目标用户进行视频推荐。

在一种可能的实现方式中，根据目标用户的用户行为数据，确定所述目标用户对应的初始用户特征向量，包括：

确定所述目标用户的用户行为数据中的有效点击视频；

确定所述有效点击视频对应的初始视频特征向量；

根据所述有效点击视频对应的初始视频特征向量，确定所述目标用户对应的初始用户特征向量。

在一种可能的实现方式中，确定所述目标用户的用户行为数据中的有效点击视频，包括：

将所述目标用户的用户行为数据中观看时长与视频时长的比值大于有效性阈值的视频确定为有效点击视频。

在一种可能的实现方式中，根据所述有效点击视频对应的初始视频特征向量，确定所述目标用户对应的初始用户特征向量，包括：

将所述有效点击视频对应的初始视频特征向量的平均值确定为所述目标用户对应的初始用户特征向量。

根据所述有效点击视频对应的观看时长与视频时长的比值，确定所述有效点击视频对应的权重；

根据各个有效点击视频对应的权重，计算各个有效点击视频对应的初始视频特征向量的加权和，得到所述目标用户对应的初始用户特征向量。

在一种可能的实现方式中，根据所述目标用户的用户行为数据，确定所述目标用户对应的正样本视频和负样本视频，包括：

确定所述目标用户的用户行为数据中的有效点击视频；

将所述有效点击视频确定为所述目标用户对应的正样本视频；

根据向所述目标用户展示的视频中所述有效点击视频以外的视频，确定所述目标用户对应的负样本视频。

在一种可能的实现方式中，根据向所述目标用户展示的视频中所述有效点击视频以外的视频，确定所述目标用户对应的负样本视频，包括：

对向所述目标用户展示的视频中所述有效点击视频以外的视频进行采样，得到所述目标用户对应的负样本视频。

在一种可能的实现方式中，确定所述正样本视频对应的初始视频特征向量，以及所述负样本视频对应的初始视频特征向量，包括：

根据所述正样本视频的文本描述信息，确定所述正样本视频对应的初始视频特征向量；

根据所述负样本视频的文本描述信息，确定所述负样本视频对应的初始视频特征向量。

在一种可能的实现方式中，根据所述正样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，以及所述负样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，优化所述神经网络的参数，包括：

根据所述正样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，以及所述负样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，确定所述神经网络对应的目标优化函数；

采用梯度下降法对所述目标优化函数进行优化，以优化所述神经网络的参数。

在一种可能的实现方式中，基于优化后的神经网络，向所述目标用户进行视频推荐，包括：

确定候选视频对应的初始视频特征向量；

将所述目标用户对应的初始用户特征向量以及所述候选视频对应的初始视频特征向量分别输入所述优化后的神经网络，获取所述目标用户对应的第二优化用户特征向量以及所述候选视频对应的优化视频特征向量；

计算所述候选视频对应的优化视频特征向量与所述第二优化用户特征向量之间的相关性；

根据所述候选视频对应的优化视频特征向量与所述第二优化用户特征向量之间的相关性，向所述目标用户进行视频推荐。

根据本公开的另一方面，提供了一种视频推荐装置，包括：

第一确定模块，用于根据目标用户的用户行为数据，确定所述目标用户对应的初始用户特征向量；

第二确定模块，用于根据所述目标用户的用户行为数据，确定所述目标用户对应的正样本视频和负样本视频；

第三确定模块，用于确定所述正样本视频对应的初始视频特征向量，以及所述负样本视频对应的初始视频特征向量；

获取模块，用于将所述目标用户对应的初始用户特征向量、所述正样本视频对应的初始视频特征向量以及所述负样本视频对应的初始视频特征向量分别输入神经网络，获取所述目标用户对应的第一优化用户特征向量、所述正样本视频对应的优化视频特征向量以及所述负样本视频对应的优化视频特征向量；

优化模块，用于根据所述正样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，以及所述负样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，优化所述神经网络的参数；

推荐模块，用于基于优化后的神经网络，向所述目标用户进行视频推荐。

在一种可能的实现方式中，所述第一确定模块包括：

第一确定子模块，用于确定所述目标用户的用户行为数据中的有效点击视频；

第二确定子模块，用于确定所述有效点击视频对应的初始视频特征向量；

第三确定子模块，用于根据所述有效点击视频对应的初始视频特征向量，确定所述目标用户对应的初始用户特征向量。

在一种可能的实现方式中，所述第一确定子模块用于：

在一种可能的实现方式中，所述第三确定子模块用于：

在一种可能的实现方式中，所述第三确定子模块包括：

确定单元，用于根据所述有效点击视频对应的观看时长与视频时长的比值，确定所述有效点击视频对应的权重；

计算单元，用于根据各个有效点击视频对应的权重，计算各个有效点击视频对应的初始视频特征向量的加权和，得到所述目标用户对应的初始用户特征向量。

在一种可能的实现方式中，所述第二确定模块包括：

第四确定子模块，用于确定所述目标用户的用户行为数据中的有效点击视频；

第五确定子模块，用于将所述有效点击视频确定为所述目标用户对应的正样本视频；

第六确定子模块，用于根据向所述目标用户展示的视频中所述有效点击视频以外的视频，确定所述目标用户对应的负样本视频。

在一种可能的实现方式中，所述第六确定子模块用于：

在一种可能的实现方式中，所述第三确定模块包括：

第七确定子模块，用于根据所述正样本视频的文本描述信息，确定所述正样本视频对应的初始视频特征向量；

第八确定子模块，用于根据所述负样本视频的文本描述信息，确定所述负样本视频对应的初始视频特征向量。

在一种可能的实现方式中，所述优化模块包括：

第九确定子模块，用于根据所述正样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，以及所述负样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，确定所述神经网络对应的目标优化函数；

优化子模块，用于采用梯度下降法对所述目标优化函数进行优化，以优化所述神经网络的参数。

在一种可能的实现方式中，所述推荐模块包括：

第十确定子模块，用于确定候选视频对应的初始视频特征向量；

获取子模块，用于将所述目标用户对应的初始用户特征向量以及所述候选视频对应的初始视频特征向量分别输入所述优化后的神经网络，获取所述目标用户对应的第二优化用户特征向量以及所述候选视频对应的优化视频特征向量；

计算子模块，用于计算所述候选视频对应的优化视频特征向量与所述第二优化用户特征向量之间的相关性；

推荐子模块，用于根据所述候选视频对应的优化视频特征向量与所述第二优化用户特征向量之间的相关性，向所述目标用户进行视频推荐。

根据本公开的另一方面，提供了一种视频推荐装置，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行上述方法。

根据本公开的另一方面，提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其中，所述计算机程序指令被处理器执行时实现上述方法。

本公开的各方面的视频推荐方法及装置基于目标用户对应的正样本视频和负样本视频训练神经网络，挖掘目标用户与视频之间的深层次的语义关系，利用神经网络的深度学习的特征提取能力，提取目标用户和视频的低层特征信息，生成更加抽象的高层特征信息，并在此基础上进行视频推荐，从而能够提高视频推荐的准确性。

根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面，并且用于解释本公开的原理。

图1示出根据本公开一实施例的视频推荐方法的流程图。

图2示出根据本公开一实施例的视频推荐方法步骤S11的一示例性的流程图。

图3示出根据本公开一实施例的视频推荐方法步骤S113的一示例性的流程图。

图4示出根据本公开一实施例的视频推荐方法步骤S12的一示例性的流程图。

图5示出根据本公开一实施例的视频推荐方法步骤S15的一示例性的流程图。

图6示出根据本公开一实施例的视频推荐方法中神经网络的示意图。

图7示出根据本公开一实施例的视频推荐方法步骤S16的一示例性的流程图。

图8示出根据本公开一实施例的视频推荐装置的框图。

图9示出根据本公开一实施例的视频推荐装置的一示例性的框图。

图10是根据一示例性实施例示出的一种用于视频推荐的装置1900的框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

图1示出根据本公开一实施例的视频推荐方法的流程图。如图1所示，该方法包括步骤S11至步骤S16。

在步骤S11中，根据目标用户的用户行为数据，确定目标用户对应的初始用户特征向量。

在一种可能的实现方式中，可以根据指定时间段内目标用户的用户行为数据，确定目标用户对应的初始用户特征向量。例如，指定时间段为1个月。

在一种可能的实现方式中，可以根据目标用户的用户行为数据中的点击数据，确定目标用户对应的初始用户特征向量。

在步骤S12中，根据目标用户的用户行为数据，确定目标用户对应的正样本视频和负样本视频。

在一种可能的实现方式中，可以根据指定时间段内目标用户的用户行为数据，确定目标用户对应的正样本视频和负样本视频。

在一种可能的实现方式中，可以根据目标用户的用户行为数据中的有效点击视频，确定目标用户对应的正样本视频和负样本视频。

在另一种可能的实现方式中，可以根据目标用户的用户行为数据中的点击视频，确定目标用户对应的正样本视频和负样本视频。在该实现方式中，可以将目标用户的用户行为数据中目标用户点击的视频确定为目标用户对应的正样本视频，可以将向目标用户展示的视频中目标用户未点击的视频确定为目标用户对应的负样本视频。

在步骤S13中，确定正样本视频对应的初始视频特征向量，以及负样本视频对应的初始视频特征向量。

在一种可能的实现方式中，确定正样本视频对应的初始视频特征向量，以及负样本视频对应的初始视频特征向量，包括：根据正样本视频的文本描述信息，确定正样本视频对应的初始视频特征向量；根据负样本视频的文本描述信息，确定负样本视频对应的初始视频特征向量。在本公开实施例中，可以根据视频的文本描述信息，确定视频对应的初始视频特征向量。例如，视频的文本描述信息可以包括视频的标题、视频的内容简介、视频的制作地区、视频的导演、视频的主演、视频的编剧、视频的标签、视频的上传时间和视频的上传者等中的一项或多项。

在一种可能的实现方式中，根据视频的文本描述信息，确定视频对应的初始视频特征向量，可以包括：对视频的文本描述信息进行分词，得到分词结果；根据分词结果中的各个词的TF-IDF(Term Frequency–Inverse Document Frequency，词频–逆文档词频)，确定视频的关键词；根据视频的关键词，确定视频对应的初始视频特征向量。

作为该实现方式的一个示例，可以采用ICTCLAS分词系统对视频的文本描述信息进行分词，同时可以去除文本描述信息中的停用词。

作为该实现方式的一个示例，分词结果中的某个词的TF，可以等于该词在该视频的文本描述信息中出现的频率；该词的IDF，可以等于该词在所有视频的文本描述信息中出现的频率。

作为该实现方式的一个示例，可以将视频的分词结果中TF-IDF大于第一阈值的词确定为该视频的关键词。

作为该实现方式的另一个示例，可以将视频的分词结果中TF-IDF最大的Q个词确定为该视频的关键词，其中，Q为正整数。

作为该实现方式的一个示例，可以对各个视频的关键词进行统计，构建视频的关键词库，统计关键词总数，建立关键词索引。例如，关键词库中的关键词总数为K，则视频对应的初始视频特征向量可以表示为V_I＝{k₁,k₂,k₃,…,k_K}，其中，k₁表示该视频在关键词库中的第1个关键词上的TF-IDF值，k₂表示该视频在关键词库中的第2个关键词上的TF-IDF值，以此类推。

在步骤S14中，将目标用户对应的初始用户特征向量、正样本视频对应的初始视频特征向量以及负样本视频对应的初始视频特征向量分别输入神经网络，获取目标用户对应的第一优化用户特征向量、正样本视频对应的优化视频特征向量以及负样本视频对应的优化视频特征向量。

在本公开实施例中，神经网络可以用于对初始用户特征向量和初始视频特征向量进行逐层地抽象，最后输出低维的语义相关的第一优化用户特征向量和优化视频特征向量。

在步骤S15中，根据正样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，以及负样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，优化该神经网络的参数。

例如，优化视频特征向量y_v与第一优化用户特征向量y_U之间的相关性可以表示为

在步骤S16中，基于优化后的神经网络，向目标用户进行视频推荐。

本公开实施例基于目标用户对应的正样本视频和负样本视频训练神经网络，挖掘目标用户与视频之间的深层次的语义关系，利用神经网络的深度学习的特征提取能力，提取目标用户和视频的低层特征信息，生成更加抽象的高层特征信息，并在此基础上进行视频推荐，从而能够提高视频推荐的准确性。

图2示出根据本公开一实施例的视频推荐方法步骤S11的一示例性的流程图。如图2所示，步骤S11可以包括步骤S111至步骤S113。

在步骤S111中，确定目标用户的用户行为数据中的有效点击视频。

在一种可能的实现方式中，确定目标用户的用户行为数据中的有效点击视频，包括：将目标用户的用户行为数据中观看时长与视频时长的比值大于有效性阈值的视频确定为有效点击视频。例如，目标用户观看视频C的观看时长为T_UC，视频C的视频时长为T_C，若T_UC与T_C的比值大于有效性阈值，则可以确定视频C为有效点击视频。例如，有效性阈值为0.3。由于某些情况下用户点击视频只是粗略地浏览视频内容，并非代表用户对该视频真正感兴趣，因此为了使初始用户特征向量更能代表目标用户的兴趣，本公开实施例仅根据目标用户的用户行为数据中的有效点击视频确定目标用户对应的初始用户特征向量。

在步骤S112中，确定有效点击视频对应的初始视频特征向量。

在本公开实施例中，可以根据有效点击视频的文本描述信息确定有效点击视频对应的初始视频特征向量。

在步骤S113中，根据有效点击视频对应的初始视频特征向量，确定目标用户对应的初始用户特征向量。

在一种可能的实现方式中，根据有效点击视频对应的初始视频特征向量，确定目标用户对应的初始用户特征向量，包括：将有效点击视频对应的初始视频特征向量的平均值确定为目标用户对应的初始用户特征向量。例如，可以将指定时间段内有效点击视频对应的初始视频特征向量的平均值确定为目标用户对应的初始用户特征向量。例如，指定时间段为1个月，该指定时间段内有效点击视频的个数为L，则目标用户对应的初始用户特征向量可以表示为

其中，V_Il表示该指定时间段内第l个有效点击视频对应的初始视频特征向量。

图3示出根据本公开一实施例的视频推荐方法步骤S113的一示例性的流程图。如图3所示，步骤S113可以包括步骤S1131和步骤S1132。

在步骤S1131中，根据有效点击视频对应的观看时长与视频时长的比值，确定有效点击视频对应的权重。

例如，有效点击视频对应的权重可以表示为

其中，α_l表示第l个有效点击视频对应的观看时长与视频时长的比值，β_l表示第l个有效点击视频对应的权重，L表示有效点击视频的个数。

在步骤S1132中，根据各个有效点击视频对应的权重，计算各个有效点击视频对应的初始视频特征向量的加权和，得到目标用户对应的初始用户特征向量。

例如，

图4示出根据本公开一实施例的视频推荐方法步骤S12的一示例性的流程图。如图4所示，步骤S12可以包括步骤S121至步骤S123。

在步骤S121中，确定目标用户的用户行为数据中的有效点击视频。

在该步骤中，可以采用与上文相同的方式确定目标用户的用户行为数据中的有效点击视频，在此不再赘述。

在步骤S122中，将有效点击视频确定为目标用户对应的正样本视频。

在步骤S123中，根据向目标用户展示的视频中有效点击视频以外的视频，确定目标用户对应的负样本视频。

在一种可能的实现方式中，根据向目标用户展示的视频中有效点击视频以外的视频，确定目标用户对应的负样本视频，包括：对向目标用户展示的视频中有效点击视频以外的视频进行采样，得到目标用户对应的负样本视频。

图5示出根据本公开一实施例的视频推荐方法步骤S15的一示例性的流程图。如图5所示，步骤S15可以包括步骤S151和步骤S152。

在步骤S151中，根据正样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，以及负样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，确定该神经网络对应的目标优化函数。

在步骤S152中，采用梯度下降法对目标优化函数进行优化，以优化该神经网络的参数。

在一种可能的实现方式中，目标用户U点击观看某个视频V的概率可以表示为P(V|U)：

其中，γ表示平滑因子，v_A表示一组视频集合。理论上，集合v_A应该包括所有的正样本和负样本。然而在实际操作中，负样本是非常大的，为了节约计算成本，提高神经网络的训练效率，可以对负样本按照一定的方式进行采样。例如，可以取一个正样本组合(U,V⁺)和三个负样本(U,V^-)组合作为视频集合v_A。在实验过程中发现，样本的组合对最终的结果影响不大。因此，可将上面的公式近似地描述为：

其中

我们可以用最大似然函数来对该神经网络中的参数进行训练，即等价于对负对数似然函数进行最小化计算。负对数似然函数公式如下：

L(θ)是该神经网络对应的目标优化函数。其中θ表示的是神经网络中的参数集合{W_i，b_i}。

由于参数是可导的，因此本公开实施例可以采用梯度下降法对目标优化函数进行优化，

其中，λ_t是第t次迭代的学习率，θ_t和θ_t-1分别为神经网络在第t次和第t-1次迭代的参数。

在另一种可能的实现方式中，目标优化函数可以表示为L(θ)＝∑_Vg(U,V)，其中，g(U,V)＝-B·logσ(U,V)-(1-B)·logσ(U,V)。例如，对于正样本，B＝1；对于负样本，B＝0。

图6示出根据本公开一实施例的视频推荐方法中神经网络的示意图。在图6所示的示例中，该神经网络的网络模型由两部分组成，一部分是用户模型，另一部分是视频模型。该神经网络的输入可以是高维特征向量U_I和V_I，输出可以是低维稠密的语义特征向量U_O和V_O，它可以看成是神经网络对低层文本特征进行特征提取后的抽象化描述。例如，神经网络包括N-1个隐含层(图6中仅示出了3个)，x表示输入向量，y表示输出向量，h_i表示神经网络中的隐含层，i＝1,2,3...N-1，W_i表示网络中第i层的权重矩阵，b_i表示第i层的偏置，则：

h₁＝W₁x+b₁，

h_i＝f(W_ih_i-1+b_i),i＝1,2,3,...,N-1，

y＝f(W_Nh_N-1+b_N)。

其中，f(x)表示激活函数，在本公开实施例中作为隐藏层和输出层的激活函数。例如，

对于目标用户，x_U＝U_I，y_U＝U_O；对于视频，x_V＝V_I，y_V＝V_O。

图7示出根据本公开一实施例的视频推荐方法步骤S16的一示例性的流程图。如图7所示，步骤S16可以包括步骤S161至步骤S164。

在步骤S161中，确定候选视频对应的初始视频特征向量。

在一种可能的实现方式中，在确定候选视频对应的初始视频特征向量之前，该方法还包括：对视频库中的视频进行过滤处理和融合处理，得到候选视频。

作为该实现方式的一个示例，对视频库中的视频进行过滤处理可以包括：过滤视频库中文本描述信息的缺失字段数大于或等于M₁的视频，其中，M₁为正整数。通过过滤视频库中文本描述信息的缺失字段数大于或等于M₁的视频，能够保证候选视频在视频推荐过程中的数据完整性和可靠性，从而能够进一步保证视频推荐的准确性。例如，文本描述信息包括9个字段：标题字段、内容简介字段、制作地区字段、导演字段、主演字段、编剧字段、标签字段、上传时间字段和上传者字段。若M₁等于3，某一视频的文本描述信息包括5个字段，即该视频的文本描述信息的缺失字段数为4，则可以过滤该视频。

作为该实现方式的一个示例，对视频库中的视频进行融合处理可以包括：若视频库中的多个视频的文本描述信息的相同字段数大于或等于M₂，则保留该多个视频中的一个视频作为候选视频，从而能够提高视频推荐的效率，其中，M₂为正整数。例如，M₂等于7，某两个视频的文本描述信息中有8个字段相同，则可以保留这两个视频中的一个视频作为候选视频。例如，可以保留这两个视频中画质较清晰的视频作为候选视频。

在步骤S162中，将目标用户对应的初始用户特征向量以及候选视频对应的初始视频特征向量分别输入优化后的神经网络，获取目标用户对应的第二优化用户特征向量以及候选视频对应的优化视频特征向量。

在本公开实施例中，神经网络可以用于对初始用户特征向量和初始视频特征向量进行逐层地抽象，最后输出低维的语义相关的第二优化用户特征向量和优化视频特征向量。

在步骤S163中，计算候选视频对应的优化视频特征向量与第二优化用户特征向量之间的相关性。

其中，候选视频对应的优化视频特征向量与第二优化用户特征向量之间的相关性的计算方法与上文类似，在此不再赘述。

在步骤S164中，根据候选视频对应的优化视频特征向量与第二优化用户特征向量之间的相关性，向目标用户进行视频推荐。

在一种可能的实现方式中，可以向目标用户推荐与第二优化用户特征向量的相关性最大的Z个优化视频特征向量对应的候选视频，其中，Z为正整数。

本公开实施例利用深度学习在自然语言处理方面的技术，分析并处理视频的文本内容信息，提取其语义层面的特征向量，构建神经网络模型，深度挖掘视频与视频之间的内在关系，进而进行视频推荐，由此提供了一种基于内容的视频推荐方法，解决了协同过滤推荐算法中的冷启动问题和数据稀疏问题。例如，对于某个喜欢看时事新闻视频的用户而言，无论是中国还是美国的实时报道都会感兴趣，因此关键词“中国”和“美国”之间实际上具有一定的相关性，并非相对独立，因此，具有关键词“中国”的视频和具有关键词“美国”的视频之间实际上也具有一定的相关性。本公开实施例通过神经网络深度挖掘视频与视频之间的内在关系，能够提高视频推荐的准确性。

图8示出根据本公开一实施例的视频推荐装置的框图。如图8所示，该装置包括：第一确定模块21，用于根据目标用户的用户行为数据，确定目标用户对应的初始用户特征向量；第二确定模块22，用于根据目标用户的用户行为数据，确定目标用户对应的正样本视频和负样本视频；第三确定模块23，用于确定正样本视频对应的初始视频特征向量，以及负样本视频对应的初始视频特征向量；获取模块24，用于将目标用户对应的初始用户特征向量、正样本视频对应的初始视频特征向量以及负样本视频对应的初始视频特征向量分别输入神经网络，获取目标用户对应的第一优化用户特征向量、正样本视频对应的优化视频特征向量以及负样本视频对应的优化视频特征向量；优化模块25，用于根据正样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，以及负样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，优化该神经网络的参数；推荐模块26，用于基于优化后的神经网络，向目标用户进行视频推荐。

图9示出根据本公开一实施例的视频推荐装置的一示例性的框图。如图9所示：

在一种可能的实现方式中，第一确定模块21包括：第一确定子模块211，用于确定目标用户的用户行为数据中的有效点击视频；第二确定子模块212，用于确定有效点击视频对应的初始视频特征向量；第三确定子模块213，用于根据有效点击视频对应的初始视频特征向量，确定目标用户对应的初始用户特征向量。

在一种可能的实现方式中，第一确定子模块211用于：将目标用户的用户行为数据中观看时长与视频时长的比值大于有效性阈值的视频确定为有效点击视频。

在一种可能的实现方式中，第三确定子模块213用于：将有效点击视频对应的初始视频特征向量的平均值确定为目标用户对应的初始用户特征向量。

在一种可能的实现方式中，第三确定子模块213包括：确定单元，用于根据有效点击视频对应的观看时长与视频时长的比值，确定有效点击视频对应的权重；计算单元，用于根据各个有效点击视频对应的权重，计算各个有效点击视频对应的初始视频特征向量的加权和，得到目标用户对应的初始用户特征向量。

在一种可能的实现方式中，第二确定模块22包括：第四确定子模块221，用于确定目标用户的用户行为数据中的有效点击视频；第五确定子模块222，用于将有效点击视频确定为目标用户对应的正样本视频；第六确定子模块223，用于根据向目标用户展示的视频中有效点击视频以外的视频，确定目标用户对应的负样本视频。

在一种可能的实现方式中，第六确定子模块223用于：对向目标用户展示的视频中有效点击视频以外的视频进行采样，得到目标用户对应的负样本视频。

在一种可能的实现方式中，第三确定模块23包括：第七确定子模块231，用于根据正样本视频的文本描述信息，确定正样本视频对应的初始视频特征向量；第八确定子模块232，用于根据负样本视频的文本描述信息，确定负样本视频对应的初始视频特征向量。

在一种可能的实现方式中，优化模块25包括：第九确定子模块251，用于根据正样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，以及负样本视频对应的优化视频特征向量与第一优化用户特征向量之间的相关性，确定该神经网络对应的目标优化函数；优化子模块252，用于采用梯度下降法对目标优化函数进行优化，以优化该神经网络的参数。

在一种可能的实现方式中，推荐模块26包括：第十确定子模块261，用于确定候选视频对应的初始视频特征向量；获取子模块262，用于将目标用户对应的初始用户特征向量以及候选视频对应的初始视频特征向量分别输入优化后的神经网络，获取目标用户对应的第二优化用户特征向量以及候选视频对应的优化视频特征向量；计算子模块263，用于计算候选视频对应的优化视频特征向量与第二优化用户特征向量之间的相关性；推荐子模块264，用于根据候选视频对应的优化视频特征向量与第二优化用户特征向量之间的相关性，向目标用户进行视频推荐。

图10是根据一示例性实施例示出的一种用于视频推荐的装置1900的框图。例如，装置1900可以被提供为一服务器。参照图10，装置1900包括处理组件1922，其进一步包括一个或多个处理器，以及由存储器1932所代表的存储器资源，用于存储可由处理组件1922的执行的指令，例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1922被配置为执行指令，以执行上述方法。

装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理，一个有线或无线网络接口1950被配置为将装置1900连接到网络，和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统，例如Windows ServerTM，MacOS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

在示例性实施例中，还提供了一种非易失性计算机可读存储介质，例如包括计算机程序指令的存储器1932，上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。

本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种视频推荐方法，其特征在于，包括：

根据所述目标用户的用户行为数据，确定所述目标用户对应的正样本视频和负样本视频，其中，所述目标用户为待进行视频推荐的用户；

基于优化后的神经网络，向所述目标用户进行视频推荐。

2.根据权利要求1所述的方法，其特征在于，根据目标用户的用户行为数据，确定所述目标用户对应的初始用户特征向量，包括：

确定所述目标用户的用户行为数据中的有效点击视频；

确定所述有效点击视频对应的初始视频特征向量；

3.根据权利要求2所述的方法，其特征在于，确定所述目标用户的用户行为数据中的有效点击视频，包括：

4.根据权利要求2或3所述的方法，其特征在于，根据所述有效点击视频对应的初始视频特征向量，确定所述目标用户对应的初始用户特征向量，包括：

5.根据权利要求2或3所述的方法，其特征在于，根据所述有效点击视频对应的初始视频特征向量，确定所述目标用户对应的初始用户特征向量，包括：

6.根据权利要求1所述的方法，其特征在于，根据所述目标用户的用户行为数据，确定所述目标用户对应的正样本视频和负样本视频，包括：

确定所述目标用户的用户行为数据中的有效点击视频；

7.根据权利要求6所述的方法，其特征在于，根据向所述目标用户展示的视频中所述有效点击视频以外的视频，确定所述目标用户对应的负样本视频，包括：

8.根据权利要求1所述的方法，其特征在于，确定所述正样本视频对应的初始视频特征向量，以及所述负样本视频对应的初始视频特征向量，包括：

9.根据权利要求1所述的方法，其特征在于，根据所述正样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，以及所述负样本视频对应的优化视频特征向量与所述第一优化用户特征向量之间的相关性，优化所述神经网络的参数，包括：

10.根据权利要求1所述的方法，其特征在于，基于优化后的神经网络，向所述目标用户进行视频推荐，包括：

确定候选视频对应的初始视频特征向量；

11.一种视频推荐装置，其特征在于，包括：

第二确定模块，用于根据所述目标用户的用户行为数据，确定所述目标用户对应的正样本视频和负样本视频，其中，所述目标用户为待进行视频推荐的用户；

12.根据权利要求11所述的装置，其特征在于，所述第一确定模块包括：

13.根据权利要求12所述的装置，其特征在于，所述第一确定子模块用于：

14.根据权利要求12或13所述的装置，其特征在于，所述第三确定子模块用于：

15.根据权利要求12或13所述的装置，其特征在于，所述第三确定子模块包括：

16.根据权利要求11所述的装置，其特征在于，所述第二确定模块包括：

17.根据权利要求16所述的装置，其特征在于，所述第六确定子模块用于：

18.根据权利要求11所述的装置，其特征在于，所述第三确定模块包括：

19.根据权利要求11所述的装置，其特征在于，所述优化模块包括：

20.根据权利要求11所述的装置，其特征在于，所述推荐模块包括：

21.一种视频推荐装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行权利要求1至10中任意一项所述的方法。

22.一种非易失性计算机可读存储介质，其上存储有计算机程序指令，

其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至10中任意一项所述的方法。