CN111666450A

CN111666450A - 视频召回方法、装置、电子设备及计算机可读存储介质

Info

Publication number: CN111666450A
Application number: CN202010509482.9A
Authority: CN
Inventors: 杨随心
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2020-09-15
Anticipated expiration: 2040-06-04
Also published as: CN111666450B

Abstract

本发明实施例提供了一种视频召回方法、装置、电子设备及计算机可读存储介质，其中方法包括：获取目标用户的历史操作行为数据；基于已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；基于已观看视频，获得该目标用户的视频观看特征；基于已搜索视频，获得该目标用户的视频搜索特征；将消费兴趣特征，视频观看特征以及视频搜索特征进行拼接处理，得到拼接特征；将拼接特征输入预先训练好的视频特征预测模型中，基于拼接特征获得预测结果特征，作为预测的视频特征；基于预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。本发明实施例能够提高视频召回的准确性。

Description

视频召回方法、装置、电子设备及计算机可读存储介质

技术领域

本发明涉及视频处理技术领域，特别是涉及一种视频召回方法、装置、电子设备及计算机可读存储介质。

背景技术

在视频推荐过程中，为避免直接对视频库中海量的视频集合进行排序导致其计算压力过大的问题，通常需要先对视频集合中的视频进行召回处理，从视频集合中筛选出几百个视频，接着将筛选出的视频按照一定的方法进行排序，推荐给用户。

现有的视频召回方法中，通常利用用户的属性特征，例如年龄、性别、地理位置等特征，以及利用用户对视频的观看或搜索记录生成特征向量，并将这些特征向量输入神经网络模型中，得到预测结果特征，根据预测结果特征与视频集合中的各视频特征之间的相似度，从视频集合中筛选出预设数量个视频，完成视频召回的过程。

由于现有的视频召回方法中，利用的是用户的年龄、性别、地理位置等特征，以及利用用户对视频的观看或搜索记录生成特征向量，并将这些特征向量作为神经网络模型的模型输入，因此，输出的预测结果特征对应的视频，通常为与年龄、性别以及地理位置符合性较高的视频。但是用户实际的观看需求及喜好，并不一定与年龄、性别以及地理位置相符，例如，针对相同年龄的女性，可能喜欢的电影类别并不相同，而且差异较大，因此，现有的视频召回方法可能存在得到的预测结果特征对应的视频，与实际用户喜欢的视频相差较大的问题，即，现有的视频召回方法所得到的视频准确性较低。

发明内容

本发明实施例的目的在于提供一种视频召回方法、装置、电子设备及计算机可读存储介质，以提高视频召回的准确性。具体技术方案如下：

本发明实施例的第一方面，提供了一种视频召回方法，所述方法包括：

获取目标用户的历史操作行为数据，历史操作行为数据中包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频；

基于已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；

基于已观看视频，获得该目标用户的视频观看特征；

基于已搜索视频，获得该目标用户的视频搜索特征；

将消费兴趣特征，视频观看特征以及视频搜索特征进行拼接处理，得到拼接特征；

将拼接特征输入预先训练好的视频特征预测模型中，基于拼接特征获得预测结果特征，作为预测的视频特征，所述视频特征预测模型为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到；

基于所述预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。

作为本发明一种可选的实施方式，所述基于所述已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征的步骤，包括：

获得多个已消费视频标识对应的兴趣标签；

从多个所述兴趣标签中选取一个兴趣标签，将该兴趣标签对应的向量作为消费兴趣特征；

或者，计算多个所述兴趣标签的对应的向量的平均值，获得消费兴趣特征；

或者，计算多个所述兴趣标签的对应的向量的中位数，获得消费兴趣特征。

可选地，所述历史操作行为数据中还包括：至少一个评价行为对应的视频、操作行为标识、以及各所述操作行为发生的次数，所述操作行为标识包括：观看行为的标识和各个评价行为对应的评价标识，所述计算多个所述兴趣标签的对应的向量的平均值，获得消费兴趣特征的步骤，包括：

基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数，所述操作行为权重系数随所述操作行为发生的次数的增加而增加；

获得所述各个被操作视频对应的各当前兴趣标签；

基于预设的不同兴趣标签与视频之间的预设相关度，得到各个当前兴趣标签与各个被操作视频之间的当前预设相关度；

计算各个当前预设相关度与所述操作行为权重系数之间的乘积，作为各当前兴趣标签的权重系数；

从计算得到的当前兴趣标签的各个权重系数中，选取一个作为该当前兴趣标签的兴趣权重系数；

利用各兴趣权重系数，对各兴趣标签对应的向量进行加权平均处理，得到处理结果，作为所述消费兴趣特征。

可选地，所述历史操作行为数据中还包括：所述基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数的步骤，包括：

针对每个被操作视频，计算该被操作视频对应的各操作行为标识，与操作行为发生的次数之间的乘积，所述操作行为标识为数值标识；

计算各所述操作行为标识对应的乘积之和，作为该被操作视频的操作行为权重系数。

可选地，所述获得多个已消费视频标识对应的兴趣标签的步骤，包括：

查找预先存储的所述已消费视频标识与所述兴趣标签之间的对应关系，得到各所述已消费视频标识对应的兴趣标签；

针对重复的兴趣标签进行删除处理，得到多个兴趣标签。

可选地，所述历史操作行为数据中还包括：所述已观看视频的观看时长，所述基于所述已观看视频，获得该目标用户的视频观看特征的步骤，包括：

获得预设的各已观看视频标识对应的初始观看视频向量；

针对所述多个已观看视频标识，计算各所述观看时长，与预先存储的所述已观看视频标识对应的视频时长之间的比值，作为各个已观看视频的观看完成度；

将各所述观看完成度分别作为各所述初始观看视频向量的权重系数，对各所述初始观看视频向量进行加权平均处理，得到加权平均处理结果，作为所述视频观看特征。

可选地，所述基于所述已搜索视频，获得该目标用户的视频搜索特征的步骤，包括：

获得预设的各已搜索视频标识对应的初始搜索视频向量；

计算所述多个初始搜索视频向量的平均值，作为所述视频搜索特征。

可选地，所述基于所述预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频的步骤，包括：

分别计算所述预测的视频特征，与所述视频特征集合中各个视频的视频特征之间的相似度；

比较各所述相似度之间的大小，得到与所述预测的视频特征的相似度最高的多个目标视频特征；

基于特征集合中的各视频特征与视频之间的对应关系，得到多个视频特征对应的目标视频。

可选地，所述视频特征预测模型采用如下步骤进行训练：

确定初始视频特征预测模型的初始网络参数；

获取多个用户的样本历史操作行为数据，所述样本历史操作行为数据中包括：已样本消费视频、已样本观看视频和已样本搜索视频；

基于所述样本已消费视频和各个样本已消费视频预设的样本兴趣标签，获得该用户的样本消费兴趣特征，以及将样本对应的真实视频召回结果的视频特征作为真值；

基于所述样本已观看视频，获得该用户的样本视频观看特征；

基于所述样本已搜索视频，得到该用户的样本视频搜索特征；

将所述样本消费兴趣特征，所述样本视频观看特征以及所述样本视频搜索特征进行拼接处理，得到样本拼接特征；

将所述样本拼接特征输入所述初始视频特征预测模型中，基于所述样本拼接特征获得样本预测结果特征，作为预测的样本视频特征；

基于所述样本预测结果特征、所述真值和预设的损失函数，计算所述样本预测结果特征与所述真值之间的损失函数值；

判断迭代次数是否大于或等于预设迭代次数阈值，如果是，则所述特征预测模型训练完成；否则，利用所述损失函数值，调整所述特征预测模型的初始网络参数，并返回所述获取多个用户的样本历史操作行为数据的步骤。

在本发明实施的第二方面，还提供了一种视频召回装置，所述装置包括：

历史操作行为数据获取模块，用于获取目标用户的历史操作行为数据，所述历史操作行为数据中包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频；

消费兴趣特征获得模块，用于基于所述已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；

视频观看特征获得模块，用于基于所述已观看视频，获得该目标用户的视频观看特征；

视频搜索特征获得模块，用于基于所述已搜索视频，获得该目标用户的视频搜索特征；

特征拼接模块，用于将所述消费兴趣特征，所述视频观看特征以及所述视频搜索特征进行拼接处理，得到拼接特征；

特征预测模块，用于将所述拼接特征输入预先训练好的视频特征预测模型中，基于所述拼接特征获得预测结果特征，作为预测的视频特征，所述视频特征预测模型为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到；

相似度计算模块，用于基于所述预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。

可选地，所述消费兴趣特征获得模块，包括：

兴趣标签获得子模块，用于获得多个已消费视频标识对应的兴趣标签；

兴趣标签选取子模块，用于从多个所述兴趣标签中选取一个兴趣标签，将该兴趣标签对应的向量作为消费兴趣特征；

或者，向量平均值计算子模块，用于计算多个所述兴趣标签的对应的向量的平均值，获得消费兴趣特征；

或者，向量中位数计算模块，用于计算多个所述兴趣标签的对应的向量的中位数，获得消费兴趣特征。

可选地，所述历史操作行为数据中还包括：至少一个评价行为对应的视频、操作行为标识、以及各所述操作行为发生的次数，所述操作行为标识包括：观看行为的标识和各个评价行为对应的评价标识，所述向量平均值计算子模块，包括：

操作行为权重系数计算单元，用于基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数，所述操作行为权重系数随所述操作行为发生的次数的增加而增加；

兴趣标签获得单元，用于获得所述各个被操作视频对应的各当前兴趣标签；

当前预设相关度获得单元，用于基于预设的不同兴趣标签与视频之间的预设相关度，得到各个当前兴趣标签与各个被操作视频之间的当前预设相关度；

兴趣标签权重系数计算单元，用于计算各个当前预设相关度与所述操作行为权重系数之间的乘积，作为各当前兴趣标签的权重系数；

兴趣权重系数选取单元，用于从计算得到的当前兴趣标签的各个权重系数中，选取一个作为该当前兴趣标签的兴趣权重系数；

加权平均处理单元，用于利用各兴趣权重系数，对各兴趣标签对应的向量进行加权平均处理，得到处理结果，作为所述消费兴趣特征。

可选地，所述操作行为权重系数计算单元，包括：

乘积计算子单元，用于针对每个被操作视频，计算该被操作视频对应的各操作行为标识，与操作行为发生的次数之间的乘积，所述操作行为标识为数值标识；

操作行为权重系数计算子单元，用于计算各所述操作行为标识对应的乘积之和，作为该被操作视频的操作行为权重系数。

可选地，所述兴趣标签获得子模块，包括：

对应关系查找单元，用于查找预先存储的所述已消费视频标识与所述兴趣标签之间的对应关系，得到各所述已消费视频标识对应的兴趣标签；

兴趣标签删除单元，用于针对重复的兴趣标签进行删除处理，得到多个兴趣标签。

可选地，所述历史操作行为数据中还包括：所述已观看视频的观看时长，所述视频观看特征获得模块，包括：

初始观看视频向量获得子模块，用于获得预设的各已观看视频标识对应的初始观看视频向量；

观看完成度计算子模块，用于针对所述多个已观看视频标识，计算各所述观看时长，与预先存储的所述已观看视频标识对应的视频时长之间的比值，作为各个已观看视频的观看完成度；

加权平均处理子模块，用于将各所述观看完成度分别作为各所述初始观看视频向量的权重系数，对各所述初始观看视频向量进行加权平均处理，得到加权平均处理结果，作为所述视频观看特征。

可选地，所述视频搜索特征获得模块，包括：

初始搜索视频向量获得子模块，用于获得预设的各已搜索视频标识对应的初始搜索视频向量；

平均值计算子模块，用于计算所述多个初始搜索视频向量的平均值，作为所述视频搜索特征。

可选地，所述相似度计算模块，包括：

相似度计算子模块，用于分别计算所述预测的视频特征，与所述视频特征集合中各个视频的视频特征之间的相似度；

相似度比较子模块，用于比较各所述相似度之间的大小，得到与所述预测的视频特征的相似度最高的多个目标视频特征；

目标视频获得子模块，用于基于特征集合中的各视频特征与视频之间的对应关系，得到多个视频特征对应的目标视频。

可选地，所述装置还包括：

初始网络参数确定模块，用于确定初始视频特征预测模型的初始网络参数；

样本历史操作行为数据获取模块，用于获取多个用户的样本历史操作行为数据，所述样本历史操作行为数据中包括：已样本消费视频、已样本观看视频和已样本搜索视频；

样本消费兴趣特征获得模块，用于基于所述样本已消费视频和各个样本已消费视频预设的样本兴趣标签，获得该用户的样本消费兴趣特征，以及将样本对应的真实视频召回结果的视频特征作为真值；

样本视频观看特征获得模块，用于基于所述样本已观看视频，获得该用户的样本视频观看特征；

样本视频搜索特征获得模块，用于基于所述样本已搜索视频，得到该用户的样本视频搜索特征；

样本特征拼接模块，用于将所述样本消费兴趣特征，所述样本视频观看特征以及所述样本视频搜索特征进行拼接处理，得到样本拼接特征；

样本特征预测模块，用于将所述样本拼接特征输入所述初始视频特征预测模型中，基于所述样本拼接特征获得样本预测结果特征，作为预测的样本视频特征；

损失函数值计算模块，用于基于所述样本预测结果特征、所述真值和预设的损失函数，计算所述样本预测结果特征与所述真值之间的损失函数值；

迭代次数判断模块，用于判断迭代次数是否大于或等于预设迭代次数阈值，如果是，则所述特征预测模型训练完成；否则，利用所述损失函数值，调整所述特征预测模型的初始网络参数，并返回所述获取多个用户的样本历史操作行为数据的步骤。

在本发明实施例的第三方面，还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的视频召回方法的方法步骤。

在本发明实施的又一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的视频召回方法的方法步骤。

在本发明实施的又一方面，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的视频召回方法的方法步骤。

本发明实施例提供的一种视频召回方法、装置、电子设备及计算机可读存储介质，通过获取目标用户的历史操作行为数据，基于历史操作行为数据中的已消费视频和各已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；基于操作行为数据中的已观看视频，获得该目标用户的观看视频特征；基于操作行为数据中的已搜索视频，获得该目标用户的视频搜索特征，将消费兴趣特征、视频观看特征以及视频搜索特征拼接，得到拼接特征，将拼接特征输入预先训练好的视频特征预测模型中，获得预测结果特征，作为预测的视频特征，并基于该预测的视频特征，与视频特征集合中各视频的视频特征之间的相似度，得到多个目标视频。由于用户只有在想要观看某一个视频的情况下，才会付费观看，因此，已消费视频可以很好地表征用户的喜好，即，已消费视频的兴趣标签能够很好地表征用户的喜好。相对于现有技术，本发明实施例进一步增加了消费兴趣特征。因此，基于消费兴趣特征、视频观看特征以及视频搜索特征，得到预测结果特征，该预测结果特征与用户的喜好更为匹配，即，本发明实施例能够提高视频召回的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的视频召回方法的一种流程示意图；

图2为图1所示实施例中，S120的一种流程示意图；

图3为图2所示实施例中，S230的一种流程示意图；

图4为图3所示实施例中，S310的一种流程示意图；

图5为图2所示实施例中，S210的一种流程示意图；

图6为图1所示实施例中，S130的一种流程示意图；

图7为图1所示实施例中，S140的一种流程示意图；

图8为图1所示实施例中，S170的一种流程示意图；

图9为本发明实施例采用的神经网络的一种训练流程示意图；

图10为本发明实施例提供的视频召回方法的一种过程示意图；

图11为本发明实施例提供的视频召回装置的一种结构示意图；

图12为本发明实施例提供的电子设备的一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

现有的视频召回方法在得到预测的视频特征的过程中，通常利用用户的属性特征，例如年龄、性别、地理位置等特征，以及用户对视频的观看或搜索记录生成特征向量，并将这些特征向量输入神经网络模型中，得到预测结果向量但是，该种方法神经网络模型中输出的预测结果向量对应的视频，通常为与年龄、性别以及地理位置符合性较高的视频。但是用户实际的观看需求及喜好，并不一定与年龄、性别以及地理位置相符，例如，针对相同年龄的女性，可能喜欢的电影类别并不相同，而且差异较大，因此，现有的视频召回方法可能存在得到的预测结果向量对应的视频，与实际用户喜欢的视频相差较大的问题，即，现有的视频召回方法所得到的视频准确性较低。

有鉴于此，本发明实施例提供一种视频召回方法，应用于服务器中，从整体上而言，获取目标用户的历史操作行为数据，基于历史操作行为数据中的已消费视频和各已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；基于操作行为数据中的已观看视频，获得该目标用户的观看视频特征；基于操作行为数据中的已搜索视频，获得该目标用户的视频搜索特征，将消费兴趣特征、视频观看特征以及视频搜索特征拼接，得到拼接特征，将拼接特征输入预先训练好的视频特征预测模型中，获得预测结果特征，作为预测的视频特征，并基于该预测的视频特征，与视频特征集合中各视频的视频特征之间的相似度，得到多个目标视频。

具体的，如图1所示，本发明实施例提供了一种视频召回方法，该过程可以包括：

S110，获取目标用户的历史操作行为数据，历史操作行为数据中包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频。

S120，基于已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征。

S130，基于已观看视频，获得该目标用户的视频观看特征。

S140，基于已搜索视频，获得该目标用户的视频搜索特征。

S150，将消费兴趣特征，视频观看特征以及视频搜索特征进行拼接处理，得到拼接特征。

S160，将拼接特征输入预先训练好的视频特征预测模型中，基于拼接特征获得预测结果特征，作为预测的视频特征，所述视频特征预测模型为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到；

S170，基于所述预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。

本发明实施例提供的视频召回方法，通过获取目标用户的历史操作行为数据，基于历史操作行为数据中的已消费视频和各已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；基于操作行为数据中的已观看视频，获得该目标用户的观看视频特征；基于操作行为数据中的已搜索视频，获得该目标用户的视频搜索特征，将消费兴趣特征、视频观看特征以及视频搜索特征拼接，得到拼接特征，将拼接特征输入预先训练好的视频特征预测模型中，获得预测结果特征，作为预测的视频特征，并基于该预测的视频特征，与视频特征集合中各视频的视频特征之间的相似度，得到多个目标视频。由于用户只有在想要观看某一个视频的情况下，才会付费观看，因此，已消费视频可以很好地表征用户的喜好，即，已消费视频的兴趣标签能够很好地表征用户的喜好。因此，相对于现有技术，本发明实施例进一步增加了消费兴趣特征。因此，基于消费兴趣特征、视频观看特征以及视频搜索特征，得到预测结果特征，该预测结果特征与用户的喜好更为匹配，即，本发明实施例能够提高视频召回的准确性。

进一步地，图1所示实施例流程步骤S110中，历史操作行为数据中可以包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频，由于历史操作行为数据中通常包括可以用于表示各视频的标识。因此，该历史操作行为数据中可以包括已消费视频标识，已观看视频标识和已搜索视频标识，已消费视频标识、已观看视频标识和已搜索视频标识可以为视频的名称，也可以为预先设置的，且用于标识不同视频的数值标识。

可以实时获取目标用户的历史操作行为数据，即，在每次操作行为数据中的数据有变化的时刻获取该历史操作行为数据，例如，当用户打开视频APP(Application，应用程序)后，对某个视频进行了消费、观看或者搜索，终端则会将该消费、观看或者搜索的操作行为数据记录下来，并将该时刻的历史操作行为数据发送至服务器，服务器即可获取到该时刻的历史操作行为数据。

进一步地，图1所示实施例流程步骤S120中，为了对各不同的视频进行更好地分类或者描述，通常每个视频均预设有多个兴趣标签，这些兴趣标签可以表示该视频的导演、主演、配角演员、以及获得的奖项等内容。需要说明的是，兴趣标签可以为数值标识，或者向量。

进一步地，图1所示实施例流程步骤S130中，目标用户可能对多个视频进行观看，因此，历史操作行为数据中可以包括多个已观看视频，可以利用多个已观看视频，获得该目标用户的视频观看特征。由于每个视频可以通过数值标识或者向量进行表示，因此，可以通过多个已观看视频，得到各已观看视频对应的数值标识或者向量，接着基于多个已观看视频对应的数值标识或者向量，获得视频观看特征。此外，当已观看视频用数值标识表示时，则视频观看特征可以用数值进行表示；当已观看视频用向量进行表示时，则视频搜索特征也可以用向量进行表示。

进一步地，图1所示实施例流程步骤S140中，目标用户可能对多个视频进行了搜索，因此，历史操作行为数据中可以包括多个已搜索视频，可以利用多个已搜索视频，获得该目标用户的视频搜索特征。由于每个视频可以通过数值标识或者向量进行表示，因此，可以通过多个已搜索视频，得到各已搜索视频对应的数值标识或者向量，接着基于多个已搜索视频对应的数值标识或者向量，获得视频搜索特征。此外，当已搜索视频用数值标识表示时，则视频搜索特征可以用数值进行表示；当已搜索视频用向量进行表示时，则视频搜索特征也可以用向量进行标识。

进一步地，图1所示实施例流程步骤S150中，在得到消费兴趣特征、视频观看特征和视频搜索特征之后，可以对消费兴趣特征、视频观看特征和视频搜索特征进行拼接处理，得到拼接特征，得到的拼接特征中包括消费兴趣特征、视频观看特征和视频搜索特征中所有信息。

进一步地，图1所示实施例流程步骤S160中，该视频特征预测模型可以包括三个隐藏的DNN(Deep Neural Networks，深度神经网络)，该视频特征预测模型可以基于输入的拼接特征，预测目标用户可能观看的视频特征。因此，在得到拼接特征之后，可以将拼接特征输入预先训练好的视频特征预测模型中，并基于该拼接特征获得预测结果特征，作为预测的视频特征，该预测的视频特征可以表示用户可能观看的视频。

视频特征预测模型，可以为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到的，可以基于多个不同用户的样本历史操作行为数据，其中针对每一个用户，可以将该用户实际观看的视频对应的视频特征，作为样本对应的真实视频召回结果的视频特征，对视频特征预测模型进行训练。

进一步地，图1所示实施例流程步骤S170中，视频特征集合中可以包括在视频库中所存储的所有视频的视频特征，因此，可以根据视频库中存储的所有视频对应的视频特征，确定视频特征集合。在得到预测的视频特征之后，可以基于该预测的视频特征，与视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。其中相似度越大，表明视频特征集合中的视频特征与预测的视频特征越接近，则目标用户选择观看该视频特征对应的视频的概率越大。

作为本发明实施例一种可选的实施方式，如图2所示，图1所示实施例流程步骤S120，基于已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征，可以包括：

S210，获得多个已消费视频标识对应的兴趣标签。

可以在服务器中预先存储已消费视频标识对应的兴趣标签。在获得历史操作行为数据之后，可以先从中提取多个已消费视频标识，接着通过查询服务器，即可得到多个已消费视频标识中各已消费视频标识对应的兴趣标签。

S220，从多个兴趣标签中选取一个兴趣标签，将该兴趣标签对应的向量作为消费兴趣特征。

可以采用不同的向量表示不同的兴趣标签，而且可以预先存储各兴趣标签及其对应的向量。在得到多个已消费视频标识对应的兴趣标签之后，可以从多个兴趣标签中选取一个兴趣标签，并可以将该兴趣标签对应的向量作为消费兴趣特征。该兴趣标签对应的向量可以为1×N的一维向量。

或者，S230，计算多个兴趣标签的对应的向量的平均值，获得消费兴趣特征。

在得到多个兴趣标签之后，也可以通过查找兴趣标签与向量之间的对应关系，得到各兴趣标签对应的向量，并计算各兴趣标签对应的向量的平均值，将该平均值最为消费兴趣特征。由于平均值可以表示一组数据之间的平均水平，因此计算各兴趣标签对应的向量的平均值，并将该平均值作为消费兴趣特征，能够使得得到的消费兴趣特征与用户的喜好更加匹配。

或者，S240，计算多个兴趣标签的对应的向量的中位数，获得消费兴趣特征。

在得到多个兴趣标签之后，也可以通过查找兴趣标签与向量之间的对应关系，得到各兴趣标签对应的向量，并计算各兴趣标签对应的向量的中位数，将该中位数最为消费兴趣特征。计算各兴趣标签对应的向量的中位数的过程可以为：将各向量按照从小到大的顺序、或者从大到小的顺序进行排序，接着将位于中间位置的向量，确定为中位数。当所有向量的数量为偶数时，则计算位于中间位置的两个向量的平均值，并将该平均值最为中位数。由于中位数不受一组数据的极大或极小值影响，从而在一定程度上提高了中位数对一组数据的代表性，因此，该中位数也可以表示一组数据的平均水平。因此，计算各兴趣标签对应的向量的中位数，并将该中位数作为消费兴趣特征，能够使得得到的消费兴趣特征与用户的喜好更加匹配。需要说明的是，可以通过计算各兴趣标签对应的向量的模值，并利用该模值对各向量进行排序。

作为本发明实施例一种可选的实施方式，历史操作行为数据中还包括：至少一个评价行为对应的视频、操作行为标识、以及各操作行为发生的次数，操作行为标识包括：观看行为的标识和各个评价行为对应的评价标识。

评价行为可以包括：转发行为、点赞行为或者收藏行为等，因此，评价标识可以包括：转发行为对应的转发标识、点赞行为对应的点赞标识、或者收藏行为对应的收藏标识等。用户在视频APP中对视频进行操作时，除了可能观看视频、搜索视频之外，还可能转发视频、点赞视频或者收藏视频，这些评价行为均表示用户对视频的喜好。

操作行为发生的次数包括：观看次数，以及各评价行为对应的次数。各评价行为对应的次数可以包括：转发次数、点赞次数或者收藏次数。操作行为发生的次数可以表征目标用户对被操作视频的喜好程度。即，针对某一个被操作视频，目标用户的操作行为次数越多，表明目标用户越喜欢该被操作视频。

历史操作行为数据中包括的至少一个评价行为对应的视频包括：用户实际转发的视频、点赞的视频或者收藏的视频。此外，针对不同的操作行为，可以为采用不同的操作行为标识进行区分。可以预先设置观看行为的标识，该观看行为的标识与各评价行为对应的评价标识均不同，而且还可以按照观看行为以及各评价行为的不同重要程度，确定观看行为标识和各评价行为标识。

如图3所示，图2所示实施例流程步骤S230，计算多个兴趣标签的对应的向量的平均值，获得消费兴趣特征，可以包括：

S310，基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数。

首先可以从历史操作行为数据中获得各个操作行为对应的被操作视频，针对每个被操作视频，可以基于该被操作视频的操作行为标识以及对应的操作行为发生的次数，计算出该被操作视频的操作行为权重系数，其中，操作行为权重系数随操作行为发生的次数的增加而增加。也就是说，当操作行为发生的次数越多，则操作行为权重系数越大。该操作行为权重系数可以表征目标用户对该被操作视频的喜好程度。

S320，获得各个被操作视频对应的各当前兴趣标签。

可以通过查找视频与兴趣标签之间的对应关系，得到被操作视频对应的各当前兴趣标签，由于目标用户可能对多个不同的视频进行操作，因此，可以获取各个被操作视频对应的各当前兴趣标签。

S330，基于预设的不同兴趣标签与视频之间的预设相关度，得到各个当前兴趣标签与各个被操作视频之间的当前预设相关度。

一个视频可以对应多个兴趣标签，不同兴趣标签与该视频的相关度可以不同，例如，在一个视频中，主演和配角演员与该视频的相关度便不同，因此，可以预先设置各个兴趣标签与各视频的预设相关度。通过查找不同兴趣标签与视频之间的预设相关度，可以得到各个当前兴趣标签与各个被操作视频之间的当前预设相关度。

S340，计算各个当前预设相关度与操作行为权重系数之间的乘积，作为各当前兴趣标签的权重系数。

针对每个被操作视频，可以计算该被操作视频中各当前兴趣标签的预设相关度，与该被操作视频的操作行为权重系数之间的乘积，作为各当前兴趣标签的权重系数。由于操作行为权重系数可以表征目标用户对被操作视频的喜好程度，因此，通过计算当前预设相关度与操作行为权重系数之间的乘积，作为各当前兴趣标签的权重系数，该权重系数可以表征目标用户对该当前兴趣标签的喜好程度。例如，针对被操作视频L，其操作行为权重系数为l，主演与该被操作视频L的相关度为0.3，配角演员与该被操作视频L的相关度为0.1，则主演的权重系数为l*0.3，配角演员的权重系数为l*0.1。

S350，从计算得到的当前兴趣标签的各个权重系数中，选取一个作为该当前兴趣标签的兴趣权重系数。

在实际计算各当前兴趣标签的权重系数的过程中，可能历史操作行为数据中包括多个被操作视频，此时，可以计算各被操作视频中各兴趣标签的权重系数。不同被操作视频中可能包含相同的兴趣标签，因此，在得到多个当前兴趣标签的各个权重系数之后，可以从中选取一个权重系数，作为该当前兴趣标签的兴趣权重系数。

例如，两个不同的被操作视频，其中导演是一个人，那么表示导演的兴趣标签相同。但是，针对这两个被操作视频，目标用户的操作行为可能不同，或者操作行为相同但操作行为发生的次数不同。举例而言，针对这两个被操作视频，目标用户均进行了转发和点赞，转发两个视频的次数不同，这样两个被操作视频的操作行为权重系数不同，进而可能导致针对同一个当前兴趣标签计算得到的权重系数不同的结果，在该种情况下，可以选取一个权重系数作为该当前兴趣标签的兴趣权重系数。

此外，还可以实时存储和更新当前兴趣标签的兴趣权重系数，即，在获取目标用户的初始历史操作行为数据之后，可以采用上述步骤S410-S450得到当前兴趣标签的初始兴趣权重系数，接着可以存储该当前兴趣标签与该初始兴趣权重系数的对应关系。当再次获得历史操作行为数据之后，并计算得到当前兴趣标签的兴趣权重系数之后，可以先查找是否已经存储有该当前兴趣标签对应的兴趣权重系数，如果无，则将所得到的当前标签兴趣和兴趣权重系数一一对应进行存储；如果有，则将初始兴趣权重系数更新为新计算得到的兴趣权重系数。这样也可以使得同一个当前兴趣标签，始终存储有一个兴趣权重系数，而且该兴趣权重系数可以根据目标用户对视频的操作行为实时更新。例如，获得初始历史操作行为数据之后，得到当前兴趣标签的兴趣权重系数为C1，间隔一段时间后，再次获得历史操作行为数据，得到相同的当前兴趣标签的兴趣权重系数为C2；此时，可以将当前兴趣标签的兴趣权重系数更新为C2。

S360，利用各兴趣权重系数，对各兴趣标签对应的向量进行加权平均处理，得到处理结果，作为消费兴趣特征。

在得到各兴趣标签的兴趣权重系数之后，可以利用各兴趣权重系数，对各兴趣标签进行加权平均处理，得到消费兴趣特征。即，先计算各兴趣权重系数与各兴趣标签对应的向量之间的乘积，接着计算各乘积之和，得到的结果即为消费兴趣特征。例如，兴趣标签A1对应的向量为B1，其对应的兴趣权重系数为C1，兴趣标签A2对应的向量为B2，其对应的兴趣权重系数为C2，则消费兴趣特征可以采用：B1*C1+B2*C2计算得到。

在本发明实施例中，通过计算各兴趣标签的兴趣权重系数，并利用该兴趣权重系数对各兴趣标签进行加权平均处理，得到消费兴趣特征，由于兴趣权重系数是基于用户的操作行为计算得到的，而操作行为可以很好地表征用户对于被操作视频的喜好程度，因此，兴趣权重系数可以很好地表征用户对与该兴趣标签的喜好程度。利用兴趣权重系数对各兴趣标签进行加权平均处理，使得用户更为喜欢的兴趣标签所占的权重越高，计算结果越接近该兴趣标签，因此，消费兴趣特征能够更好地表征用户的喜好，进而能够进一步提高视频召回的准确性。

作为本发明实施例一种可选的实施方式，如图4所示，图3所示实施例流程步骤S310，基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数，可以包括：

S410，针对每个被操作视频，计算该被操作视频对应的各操作行为标识，与操作行为发生的次数之间的乘积。

在本发明实施例中，操作行为标识可以为数值标识，而由于操作行为标识可以包括：观看行为的标识和各个评价行为对应的评价标识，因此，观看行为的标识和评价标识均可以为数值标识。针对每个被操作视频，可以计算各操作行为标识与操作行为发生的次数之间的乘积。即，计算转发标识与转发次数之间的乘积，计算点赞标识与点赞次数之间的乘积，计算收藏标识与收藏次数之间的乘积，以及计算观看行为的标识与观看次数之间的乘积。例如，针对同一视频X，目标用户转发两次，收藏一次，点赞一次，观看两次，转发标识为x，收藏标识为y，点赞标识为z，观看行为的标识为m，则针对该视频X，转发行为对应的乘积为：x*2，收藏行为对应的乘积为y*1，点赞行为对应的乘积为z*1，观看行为对应的乘积为m*2。

S420，计算各操作行为标识对应的乘积之和，作为该被操作视频的操作行为权重系数。

可以计算各操作行为标识对应的乘积之和，作为该被操作视频对应的操作行为权重系数。例如，以步骤S510中所举的例子为例，被操作视频对应的操作行为权重系数可以为：x*2+y*1+z*1+m*2。

在本发明实施例中，充分考虑针对视频的观看行为和评价行为，计算各操作行为标识与操作行为发生的次数之间的乘积，并将各乘积之和，确定为该被操作视频对应的操作行为权重系数，因此，该被操作视频的操作行为权重系数能够更好地表征目标用户的喜好。

作为本发明实施例一种可选的实施方式，如图5所示，图2所示实施例流程步骤S210，获得多个已消费视频标识对应的兴趣标签，可以包括：

S510，查找预先存储的已消费视频标识与兴趣标签之间的对应关系，得到各已消费视频标识对应的兴趣标签。

可以预先存储已消费视频标识与兴趣标签之间的对应关系，当获得已消费视频标识后，可以利用已消费视频标识，查找已消费视频标识与兴趣标签之间的对应关系，得到各已消费视频对应的兴趣标签。

S520，针对重复的兴趣标签进行删除处理，得到多个兴趣标签。

由于针对不同的已消费视频，可能存在相同的兴趣标签，例如，针对目标用户消费的两个不同的视频，可能两个视频的导演是同一人，或者两个视频的主演是同一人，因此，在获得各已消费视频标识对应的兴趣标签之后，可以对各兴趣标签进行统计汇总，针对重复的兴趣标签，进行删除处理，即，针对重复的兴趣标签仅保留一个兴趣标签，最终可以得到多个兴趣标签。

在本发明实施例中，通过查找已消费视频标识与兴趣标签之间的对应关系，得到各已消费视频的兴趣标签，接着针对重复的兴趣标签进行删除处理，得到多个兴趣标签，上述获得多个兴趣标签的方法较为简单。

作为本发明实施例一种可选的实施方式，历史操作行为数据中还包括：已观看视频的观看时长，观看时长也可以表征用户对该已观看视频的喜好程度。

如图6所示，图1所示实施例流程步骤S130，基于已观看视频，获得该目标用户的视频观看特征，可以包括：

S610，获得预设的各已观看视频标识对应的初始观看视频向量。

针对不同的视频，可以预先设置各视频的视频向量，并建立视频标识与视频向量之间对应关系，因此，在获取到已观看视频标识之后，可以通过查找视频标识与视频向量之间的对应关系，得到已观看视频标识对应的初始观看视频向量。

S620，针对多个已观看视频标识，计算各观看时长，与预先存储的已观看视频标识对应的视频时长之间的比值，作为各个已观看视频的观看完成度。

可以在服务器中预先存储各视频标识对应的视频时长，在得到已观看视频的观看时长之后，则可以计算该观看时长，与该已观看视频的视频时长之间的比值，并将该比值作为该已观看视频的观看完成度。例如，当一个已观看视频的视频时长为90分钟，该已观看视频的观看时长为45分钟时，则观看完成度为45/90＝0.5。

S630，将各观看完成度分别作为各初始观看视频向量的权重系数，对各初始观看视频向量进行加权平均处理，得到加权平均处理结果，作为视频观看特征。

在得到各已观看视频的观看完成度之后，可以将各已观看视频的观看完成度，作为该已观看视频的初始观看视频向量的权重系数，对该初始观看视频向量进行加权平均处理，得到加权平均处理结果，作为视频观看特征。可以计算各已观看视频的观看完成度，与初始观看视频向量之间的乘积，接着计算各已观看视频对应的乘积之和，得到视频观看特征。例如，针对已观看视频a1，其观看完成度为b1，其对应的初始观看视频向量为视频向量c1；针对已观看视频a2，其观看完成度为b2，其对应的初始观看视频向量为视频向量c2，则视频观看特征为：b1*c1+b2*c2。

在本发明实施例中，通过计算各已观看视频的观看完成度，并利用观看完成度对各已观看视频的初始观看视频向量进行加权平均处理，得到视频观看特征。由于对已观看视频的观看完成度能够在一定程度上表征用户对于该已观看视频的喜好程度，观看完成度越高，表明目标用户越喜欢该已观看视频，使得最终计算得到的视频观看特征，与观看完成度越高的已观看视频的视频特征越接近，因此，该视频观看特征能够更好地表征目标用户的喜好。

作为本发明实施例一种可选的实施方式，如图7所示，图1所示实施例流程步骤S140，基于已搜索视频，获得该目标用户的视频搜索特征，可以包括：

S710，获得预设的各已搜索视频标识对应的初始搜索视频向量。

由于预先建立有视频标识与视频向量之间的对应关系，因此，在获取到已搜索视频标识之后，可以通过查找视频标识与视频向量之间的对应关系，得到已搜索视频标识对应的初始搜索视频向量。

S720，计算多个初始搜索视频向量的平均值，作为视频搜索特征。

可以计算各初始视频向量之间的平均值，作为视频搜索特征。由于平均值可以表征一组数据的平均水平，因此，通过计算各初始搜索视频向量的平均值，可以使得的视频搜索特征与目标用户的喜好更加匹配。

作为本发明实施例一种可选的实施方式，如图8所示，图1所示实施例流程步骤S170，基于预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频，可以包括：

S810，分别计算预测的视频特征，与视频特征集合中各个视频的视频特征之间的相似度。

预测的视频特征可以为向量，且该向量的元素个数可以与已观看视频标识对应的初始观看视频向量的元素个数相同，因此，在计算相似度时，可以计算预测的视频特征与视频特征集合中各视频的视频特征之间的欧式距离，并将该欧式距离作为两者的相似度，需要说明的是，可以采用现有的欧式距离计算公式，计算预测视频特征与视频特征集合中各视频的视频特征之间的欧式距离。当然，除所举的例子所示的实现方式以外，实现该特征的方式均属于本发明实施例的保护范围。

S820，比较各相似度之间的大小，得到与预测的视频特征的相似度最高的多个目标视频特征。

在得到预测的视频特征与各视频特征之间的相似度之后，可以比较各相似度之间的大小，得到与预测的视频特征的相似度最高的多个目标视频特征。在比较各相似度的大小之后，可以对多个相似度按照从大到小进行排序，从中选取多个目标视频特征。

S830，基于特征集合中的各视频特征与视频之间的对应关系，得到多个视频特征对应的目标视频。

在得到多个目标视频特征之后，可以通过查找特征集合中各视频特征与视频之间的对应关系，得到多个视频特征对应的目标视频。

在本发明实施例中，通过计算预测的视频特征与视频特征集合中各视频特征之间的相似度，并按照相似度的大小，从视频特征集合中选取与预测的视频特征之间相似度最高的多个目标视频特征，并利用各视频特征与视频之间的对应关系，得到多个目标是视频，本发明实施例获得多个目标视频的方法较为简单。

作为本发明实施例一种可选的实施方式，如图9所示，视频特征预测模型采用如下步骤进行训练：

S910，确定初始视频特征预测模型的初始网络参数。

针对视频特征预测模型，可以随机初始化其初始网络参数。

S920，获取多个用户的样本历史操作行为数据。

可以获取多个用户的样本历史操作行为数据，各样本历史操作行为数据中包括：已样本消费视频、已样本观看视频和已样本搜索视频。

S930，基于样本已消费视频和各个样本已消费视频预设的样本兴趣标签，获得该用户的样本消费兴趣特征，以及将样本对应的真实视频召回结果的视频特征作为真值。

针对各用户的样本历史操作行为数据，可以基于样本已消费视频和各个样本已消费视频预设的样本兴趣标签，获得该用户的样本消费兴趣特征。可以预先获取位于获取该用户的样本历史操作行为视频的获取时刻之后，用户实际观看的视频，并将该用户实际观看的视频对应的视频特征，作为样本对应的真实视频召回结果的视频特征。

S940，基于样本已观看视频，获得该用户的样本视频观看特征。

针对各用户的样本历史操作行为数据，可以基于样本已观看视频，获得该用户的样本视频观看特征。

S950，基于样本已搜索视频，得到该用户的样本视频搜索特征。

针对各用户的样本历史操作行为数据，可以基于样本已搜索视频，获得该用户的样本视频搜索特征。

S960，将样本消费兴趣特征，样本视频观看特征以及样本视频搜索特征进行拼接处理，得到样本拼接特征。

S970，将样本拼接特征输入初始视频特征预测模型中，基于样本拼接特征获得样本预测结果特征，作为预测的样本视频特征。

S980，基于样本预测结果特征、真值和预设的损失函数，计算样本预测结果特征与真值之间的损失函数值。

可以利用预设的损失函数计算公式，计算样本预测结果特征与真值之间的损失函数值。损失函数计算公式可以采用现有的，预先设置好的计算公式，例如，可以采用均方差误差损失函数计算公式、或者交叉熵损失函数计算公式。

S990，判断迭代次数是否大于或等于预设迭代次数阈值，如果是，执行步骤S991，否则，执行步骤S992。

S991，特征预测模型训练完成。

S992，利用损失函数值，调整特征预测模型的初始网络参数，并返回步骤S920，获取多个用户的样本历史操作行为数据的步骤。

由于视频特征训练过程，是一个需要多次迭代计算的过程，因此可以预先设置迭代次数阈值，在视频特征预测模型进行训练的过程中，如果迭代次数达到预设迭代次数阈值时，则认为视频特征预测模型训练完成；否则，则利用损失函数值，以及现有的网络参数调整算法，调整特征预测模型的初始网络参数，并进入下一次迭代计算，即，返回获取多个用户的样本历史操作行为数据的步骤。

本发明实施例能够获取多个用户的样本历史操作行为数据，基于样本已消费视频和各个样本已消费视频预设的样本兴趣标签，获得该用户的样本消费兴趣特征，获得该用户的样本视频观看特征和样本视频搜索特征，并将样本消费兴趣特征，样本视频观看特征以及样本视频搜索特征进行拼接处理，得到样本拼接特征，将该样本拼接特征作为初始视频特征模型的输入，对模型进行训练，因此，其在训练的过程中所采用的样本数据，与训练好的模型进行视频特征预测的数据相同，因此，能够提高视频特征预测模型的训练准确性。

如图10所示，本发明实施例提供了另一种视频召回方法，首先，可以针对已观看视频进行加权平均处理，得到加权平均值，作为视频观看特征；并针对已搜索视频进行平均值处理，得到平均值，作为视频搜索特征；并针对已消费视频进行加权平均处理，得到加权平均值，作为消费兴趣特征。

将视频观看特征、视频搜索特征和消费兴趣特征进行拼接处理得到拼接特征，并将拼接特征输入预先训练好的视频特征预测模型中，获得预测结果特征，作为预测的视频特征。

本发明实施例提供了一种视频召回装置的一种具体实施例，与图1所示流程相对应，参考图11，图11为本发明实施例的一种视频召回装置的一种结构示意图，包括：

历史操作行为数据获取模块111，用于获取目标用户的历史操作行为数据，历史操作行为数据中包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频。

消费兴趣特征获得模块112，用于基于已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征。

视频观看特征获得模块113，用于基于已观看视频，获得该目标用户的视频观看特征。

视频搜索特征获得模块114，用于基于已搜索视频，获得该目标用户的视频搜索特征。

特征拼接模块115，用于将消费兴趣特征，视频观看特征以及视频搜索特征进行拼接处理，得到拼接特征。

特征预测模块116，用于将拼接特征输入预先训练好的视频特征预测模型中，基于拼接特征获得预测结果特征，作为预测的视频特征，视频特征预测模型为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到。

相似度计算模块117，用于基于预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。

本发明实施例提供的视频召回装置，通过获取目标用户的历史操作行为数据，基于历史操作行为数据中的已消费视频和各已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；基于操作行为数据中的已观看视频，获得该目标用户的观看视频特征；基于操作行为数据中的已搜索视频，获得该目标用户的视频搜索特征，将消费兴趣特征、视频观看特征以及视频搜索特征拼接，得到拼接特征，将拼接特征输入预先训练好的视频特征预测模型中，获得预测结果特征，作为预测的视频特征，并基于该预测的视频特征，与视频特征集合中各视频的视频特征之间的相似度，得到多个目标视频。由于用户只有在想要观看某一个视频的情况下，才会付费观看，因此，已消费视频可以很好地表征用户的喜好，即，已消费视频的兴趣标签能够很好地表征用户的喜好。相对于现有技术，本发明实施例进一步增加了消费兴趣特征。因此，基于消费兴趣特征、视频观看特征以及视频搜索特征，得到预测结果特征，该预测结果特征与用户的喜好更为匹配，即，本发明实施例能够提高视频召回的准确性。

作为本发明一种可选的实施方式，上述消费兴趣特征获得模块112，可以包括：

兴趣标签获得子模块，用于获得多个已消费视频标识对应的兴趣标签。

兴趣标签选取子模块，用于从多个兴趣标签中选取一个兴趣标签，将该兴趣标签对应的向量作为消费兴趣特征。

或者，向量平均值计算子模块，用于计算多个兴趣标签的对应的向量的平均值，获得消费兴趣特征。

或者，向量中位数计算模块，用于计算多个兴趣标签的对应的向量的中位数，获得消费兴趣特征。

作为本发明实施例一种可选的实施方式，历史操作行为数据中还包括：至少一个评价行为对应的视频、操作行为标识、以及各操作行为发生的次数，操作行为标识包括：观看行为的标识和各个评价行为对应的评价标识，上述向量平均值计算子模块，可以包括：

操作行为权重系数计算单元，用于基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数，操作行为权重系数随操作行为发生的次数的增加而增加。

兴趣标签获得单元，用于获得各个被操作视频对应的各当前兴趣标签。

当前预设相关度获得单元，用于基于预设的不同兴趣标签与视频之间的预设相关度，得到各个当前兴趣标签与各个被操作视频之间的当前预设相关度。

兴趣标签权重系数计算单元，用于计算各个当前预设相关度与操作行为权重系数之间的乘积，作为各当前兴趣标签的权重系数。

兴趣权重系数选取单元，用于从计算得到的当前兴趣标签的各个权重系数中，选取一个作为该当前兴趣标签的兴趣权重系数。

加权平均处理单元，用于利用各兴趣权重系数，对各兴趣标签对应的向量进行加权平均处理，得到处理结果，作为消费兴趣特征。

作为本发明实施例一种可选的实施方式，上述操作行为权重系数计算单元，包括：

乘积计算子单元，用于针对每个被操作视频，计算该被操作视频对应的各操作行为标识，与操作行为发生的次数之间的乘积，操作行为标识为数值标识。

操作行为权重系数计算子单元，用于计算各操作行为标识对应的乘积之和，作为该被操作视频的操作行为权重系数。

作为本发明实施例一种可选的实施方式，上述兴趣标签获得子模块，可以包括：

对应关系查找单元，用于查找预先存储的已消费视频标识与兴趣标签之间的对应关系，得到各已消费视频标识对应的兴趣标签。

作为本发明实施例一种可选的实施方式，历史操作行为数据中还包括：已观看视频的观看时长，上述视频观看特征获得模块113，可以包括：

初始观看视频向量获得子模块，用于获得预设的各已观看视频标识对应的初始观看视频向量。

观看完成度计算子模块，用于针对多个已观看视频标识，计算各观看时长，与预先存储的已观看视频标识对应的视频时长之间的比值，作为各个已观看视频的观看完成度。

加权平均处理子模块，用于将各观看完成度分别作为各初始观看视频向量的权重系数，对各初始观看视频向量进行加权平均处理，得到加权平均处理结果，作为视频观看特征。

作为本发明实施例一种可选的实施方式，上述视频搜索特征获得模块114，可以包括：

初始搜索视频向量获得子模块，用于获得预设的各已搜索视频标识对应的初始搜索视频向量。

平均值计算子模块，用于计算多个初始搜索视频向量的平均值，作为视频搜索特征。

作为本发明实施例一种可选的实施方式，上述相似度计算模块117，可以包括：

相似度计算子模块，用于分别计算预测的视频特征，与视频特征集合中各个视频的视频特征之间的相似度。

相似度比较子模块，用于比较各相似度之间的大小，得到与预测的视频特征的相似度最高的多个目标视频特征。

作为本发明实施例一种可选的实施方式，本发明实施例提供的视频召回装置还可以包括：

初始网络参数确定模块，用于确定初始视频特征预测模型的初始网络参数。

样本历史操作行为数据获取模块，用于获取多个用户的样本历史操作行为数据，样本历史操作行为数据中包括：已样本消费视频、已样本观看视频和已样本搜索视频。

样本消费兴趣特征获得模块，用于基于样本已消费视频和各个样本已消费视频预设的样本兴趣标签，获得该用户的样本消费兴趣特征，以及将样本对应的真实视频召回结果的视频特征作为真值。

样本视频观看特征获得模块，用于基于样本已观看视频，获得该用户的样本视频观看特征。

样本视频搜索特征获得模块，用于基于样本已搜索视频，得到该用户的样本视频搜索特征。

样本特征拼接模块，用于将样本消费兴趣特征，样本视频观看特征以及样本视频搜索特征进行拼接处理，得到样本拼接特征。

样本特征预测模块，用于将样本拼接特征输入初始视频特征预测模型中，基于样本拼接特征获得样本预测结果特征，作为预测的样本视频特征。

损失函数值计算模块，用于基于样本预测结果特征、真值和预设的损失函数，计算样本预测结果特征与真值之间的损失函数值。

迭代次数判断模块，用于判断迭代次数是否大于或等于预设迭代次数阈值，如果是，则特征预测模型训练完成；否则，利用损失函数值，调整特征预测模型的初始网络参数，并返回获取多个用户的样本历史操作行为数据的步骤。

本发明实施例还提供了一种电子设备，如图12所示，包括处理器121、通信接口122、存储器123和通信总线124，其中，处理器121，通信接口122，存储器123通过通信总线124完成相互间的通信。

存储器123，用于存放计算机程序。

处理器121，用于执行存储器123上所存放的程序时，实现如下步骤：

获取目标用户的历史操作行为数据，历史操作行为数据中包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频。

基于已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征。

基于已观看视频，获得该目标用户的视频观看特征。

基于已搜索视频，获得该目标用户的视频搜索特征。

将消费兴趣特征，视频观看特征以及视频搜索特征进行拼接处理，得到拼接特征。

将拼接特征输入预先训练好的视频特征预测模型中，基于拼接特征获得预测结果特征，作为预测的视频特征，视频特征预测模型为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到。

基于预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例中任一所述的视频召回方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的视频召回方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频召回方法，其特征在于，所述方法包括：

获取目标用户的历史操作行为数据，所述历史操作行为数据中包括：目标用户已经操作过的已消费视频、已观看视频和已搜索视频；

基于所述已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征；

基于所述已观看视频，获得该目标用户的视频观看特征；

基于所述已搜索视频，获得该目标用户的视频搜索特征；

将所述消费兴趣特征，所述视频观看特征以及所述视频搜索特征进行拼接处理，得到拼接特征；

将所述拼接特征输入预先训练好的视频特征预测模型中，基于所述拼接特征获得预测结果特征，作为预测的视频特征，所述视频特征预测模型为预先基于多个样本历史操作行为数据以及样本对应的真实视频召回结果的视频特征进行训练得到；

2.根据权利要求1所述的方法，其特征在于，所述基于所述已消费视频和各个已消费视频预设的兴趣标签，获得该目标用户的消费兴趣特征的步骤，包括：

获得多个已消费视频标识对应的兴趣标签；

3.根据权利要求2所述的方法，其特征在于，所述历史操作行为数据中还包括：至少一个评价行为对应的视频、操作行为标识、以及各所述操作行为发生的次数，所述操作行为标识包括：观看行为的标识和各个评价行为对应的评价标识，所述计算多个所述兴趣标签的对应的向量的平均值，获得消费兴趣特征的步骤，包括：

获得所述各个被操作视频对应的各当前兴趣标签；

4.根据权利要求3所述的方法，其特征在于，所述基于操作行为标识、对应的操作行为发生的次数以及操作行为对应的被操作视频，针对每个被操作视频，计算出操作行为权重系数的步骤，包括：

5.根据权利要求2所述的方法，其特征在于，所述获得多个已消费视频标识对应的兴趣标签的步骤，包括：

针对重复的兴趣标签进行删除处理，得到多个兴趣标签。

6.根据权利要求1所述的方法，其特征在于，所述历史操作行为数据中还包括：所述已观看视频的观看时长，所述基于所述已观看视频，获得该目标用户的视频观看特征的步骤，包括：

获得预设的各已观看视频标识对应的初始观看视频向量；

7.根据权利要求1所述的方法，其特征在于，所述基于所述已搜索视频，获得该目标用户的视频搜索特征的步骤，包括：

获得预设的各已搜索视频标识对应的初始搜索视频向量；

8.根据权利要求1所述的方法，其特征在于，所述基于所述预测的视频特征，与预先确定的视频特征集合中的各个视频的视频特征之间的相似度，得到多个目标视频的步骤，包括：

9.根据权利要求1所述的方法，其特征在于，所述视频特征预测模型采用如下步骤进行训练：

确定初始视频特征预测模型的初始网络参数；

10.一种视频召回装置，其特征在于，所述装置包括：

11.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-9任一所述的方法步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-9任一所述的方法步骤。