CN114579801A

CN114579801A - 一种基于天鹰优化算法的长视频推荐方法

Info

Publication number: CN114579801A
Application number: CN202210459199.9A
Authority: CN
Inventors: 张灵晶; 金灿
Original assignee: Shenzhen SDMC Technology Co Ltd
Current assignee: Shenzhen SDMC Technology Co Ltd
Priority date: 2022-04-28
Filing date: 2022-04-28
Publication date: 2022-06-03
Anticipated expiration: 2042-04-28
Also published as: CN114579801B

Abstract

本申请公开提供了一种基于天鹰优化算法的长视频推荐方法，包括：通过召回方式得到粗筛的推荐结果；将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，所述长视频推荐模型是基于天鹰优化算法模型训练得到的；将所述待推荐队列存储至待播放列表，等待用户操作时推荐相应视频，解决了现有技术中，逻辑回归算法中Logistic回归系数，通常采用牛顿迭代法计算对数似然函数所得，牛顿迭代法在每次迭代中要重新计算海森矩阵，且在最优解附近的收敛速度急速下降的问题。

Description

一种基于天鹰优化算法的长视频推荐方法

技术领域

本发明涉及个性化推荐技术领域，具体涉及一种基于天鹰优化算法的长视频推荐方法。

背景技术

近年来，视频业务迅速发展，这种视频业务又被称为 0TT视频，是指基于互联网的视频服务，但是，0TT视频在长视频运营过程中存在人力投入大、运营效率低、用户体验差等问题，因此，实践中通过智能推荐系统对 0TT长视频进行智能运营，根据用户的历史观看视频的喜好推荐视频，做到个性化视频推送服务，以便提高用户体验。

在长视频个性化推荐实践中，系统首先须具备用户观影行为记录采集、存储和分析功能，通过算法模型从用户观影记录中挖掘用户可能偏好的影片，在现有的同类技术中主要是使用深度学习技术解决推荐算法模型的实现以及使用实时流技术应对用户观影记录数据的处理。

现有技术缺点：逻辑回归算法中Logistic 回归系数，通常采用 Newton 迭代法计算对数似然函数所得，Newton迭代法在每次迭代中要重新计算海森矩阵，且在最优解附近的收敛速度急速下降的问题；实时性场景不适配，长视频的侧重点在于内容，并且一次有效的播放时长一般以分钟为单位计时，对于推荐实时性要求不高，采用Flink实时流技术进行长视频信息处理不太合适，采用Spark配合Hive离线训练模型并存储推荐结果备用又过于僵化，无法灵活应对推荐场景的问题。

发明内容

因此，本发明要解决的技术问题在于克服现有技术中逻辑回归算法中Logistic回归系数，通常采用牛顿迭代法计算对数似然函数所得，牛顿迭代法在每次迭代中要重新计算海森矩阵，且在最优解附近的收敛速度急速下降的问题，从而提供一种基于天鹰优化算法的长视频推荐方法。

为解决上述技术问题，本发明公开实施例至少提供一种基于天鹰优化算法的长视频推荐方法。

第一方面，本发明公开实施例提供了一种长视频推荐模型训练的方法，包括：

根据播放记录数据生成用户属性特征、长视频属性特征和表征用户与长视频交互行为的评分表；

根据所述表征用户与长视频交互行为的评分表生成标签数据；

将所述用户属性特征、长视频属性特征和标签数据进行拼接，生成训练数据；

利用所述训练数据对天鹰优化算法模型进行训练，得到长视频推荐模型。

可选地，所述交互行为包括：点赞、收藏、观看时长和观看次数；

所述表征用户与长视频交互行为的评分表是按照以下方式生成的，包括：

根据所述播放记录数据中的用户及其播放的长视频，组成用户-长视频对；

对于每个用户-长视频对，按照下式计算表征该用户与该长视频交互行为的评分值：

其中，m表示是否点赞，n表示是否收藏，p表示观看时长，l表示该长视频的总时长，q表示观看次数，a、b、c、d为权重系数；

根据对于每个用户-长视频对的评分值生成所述评分表。

可选地，所述权重系数随时间的推移而递减。

可选地，所述根据所述表征用户与长视频交互行为的评分表生成标签数据，包括：

根据表征用户与长视频交互行为的评分表的评分值分布情况设置阈值；

对于每个用户-长视频对，若评分值大于等于所述阈值，则生成标签数据1；若评分值小于所述阈值，则生成标签数据0。

可选地，所述将所述用户属性特征、长视频属性特征和标签数据进行拼接，生成训练数据，包括：

将每个用户属性特征和长视频属性特征进行量化，得到特征量化值；

对所述特征量化值进行独热编码处理，得到每个用户属性特征和长视频属性特征的独热编码值；

对于每个用户-长视频对，将所述用户属性特征、长视频属性特征的独热编码值和标签数据顺序排列为一条二维记录，作为训练数据。

第二方面，本发明公开实施例还提供一种长视频推荐方法，包括：

通过召回方式得到粗筛的推荐结果；

将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，所述长视频推荐模型是基于天鹰优化算法模型训练得到的；

将所述待推荐队列存储至待播放列表，等待用户操作时推荐相应视频。

可选地，所述长视频推荐模型是根据第一方面中任一种可能的实施方式中的步骤训练得到的。

可选地，所述将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，包括：将所述粗筛的推荐结果的长视频属性特征和待推荐用户的用户属性特征输入训练好的长视频推荐模型得到推荐评分，若所述推荐评分高于预设阈值，则将推荐结果放入待推荐队列，反之舍弃。

第三方面，本发明公开实施例还提供一种计算机设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。

第四方面，本发明公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。

本发明的实施例提供的技术方案可以具有以下有益效果：

通过召回方式得到粗筛的推荐结果；将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，所述长视频推荐模型是基于天鹰优化算法模型训练得到的；将所述待推荐队列存储至待播放列表，等待用户操作时推荐相应视频，本发明引入新型优化算法—天鹰优化器替代逻辑回归算法中Logistic 回归系数寻优计算中传统的海森矩阵计算方式，克服LR算法运算量巨大且效率低下，训练容易欠拟合等问题，并且通过Spark分布式计算组件对所述改进进行实现；离线训练推荐模型，线上加载模型并输入用户和影片特征，既避免了长视频场景下个性化推荐中不必要的实时性，又避免了完全离线式的隔夜预计算推荐结果方式的灵活性不足问题；针对自身信息较为丰富的长视频，以及在用户规模不太大、特征信息有限的情景下，采用改进的长视频推荐模型进行个性化推荐，可减少开发人力成本与维护成本。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明公开实施例所提供的一种长视频推荐模型训练方法的流程图；

图2示出了本发明公开实施例所提供的一种长视频推荐方法的流程图；

图3示出了本发明公开实施例所提供的另一种长视频推荐方法的流程图；

图4示出了本发明公开实施例所提供的通过Azkaban调度时可视化图例示意图；

图5示出了本发明公开实施例所提供的一种计算机设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

实施例1

如图1所示，本发明公开实施例所提供的一种长视频推荐模型训练方法的流程图，该方法包括：

S11：根据播放记录数据生成用户属性特征、长视频属性特征和表征用户与长视频交互行为的评分表；

S12：根据所述表征用户与长视频交互行为的评分表生成标签数据；

S13：将所述用户属性特征、长视频属性特征和标签数据进行拼接，生成训练数据；

S14：利用所述训练数据对天鹰优化算法模型进行训练，得到长视频推荐模型。

在具体实践中，所述交互行为包括：点赞、收藏、观看时长和观看次数；

根据对于每个用户-长视频对的评分值生成所述评分表。

作为一个示例，根据所述播放记录数据，对用户与影片的交互行为进行权重打分，所述交互行为包括：点赞、收藏、观看时长和观看次数，其中用户A、视频B、点赞+1、收藏+0、观看时长100分钟和观看次数5，通过

，量化计算出用户 A对于视频B的评分

，以此类推计算出全部表征用户与长视频交互行为的评分表，并且权重系数随时间的推移而递减，并将打分结果写回数据仓库Hive，生成表征用户与长视频交互行为的评分表。

在具体实践中，所述权重系数随时间的推移而递减;

对于特定行为的权重系数，用户行为记录是一批一批处理的，一次评分表计算中包含一个时间段内的行为记录，每条记录的产生时间不一样，距离当前时间近的行为应当比距离当前时间远的行为具备不同权重的影响，需要根据时间推移递减权重分值，具体表述如下：

读入用户记录的时间区间间隔中起始时间

，末尾时间

，特定行为

，时间划分以整点小时计，同一天09:12和09:49同属于一个时间点，同一评分计算时间区间内权重最小值为

，最大值为

，则随着时间推移某特定行为的权重系数计算公式如下：

。

在具体实践中，所述根据所述表征用户与长视频交互行为的评分表生成标签数据，包括：

在具体实践中，所述将所述用户属性特征、长视频属性特征和标签数据进行拼接，生成训练数据，包括：

可以理解的是，本实施例提供的技术方案，根据播放记录数据生成用户属性特征、长视频属性特征和表征用户与长视频交互行为的评分表；根据所述表征用户与长视频交互行为的评分表生成标签数据；将所述用户属性特征、长视频属性特征和标签数据进行拼接，生成训练数据；利用所述训练数据对天鹰优化算法模型进行训练，得到长视频推荐模型，本发明引入新型优化算法—天鹰优化器替代逻辑回归算法中Logistic 回归系数寻优计算中传统的海森矩阵计算方式，克服LR算法运算量巨大且效率低下，训练容易欠拟合等问题，并且通过Spark分布式计算组件对所述改进进行实现。

实施例2

如图2所示，本发明实施例还提供了一种长视频推荐的方法，包括：

S21：通过召回方式得到粗筛的推荐结果；

在具体实践中，所述召回方式，包括：热度召回、用户标签召回、基于物品的协同过滤召回和基于用户的协同过滤召回；

所述用户标签召回，包括：兴趣标签召回、地理标签召回和偏好标签召回。

S22：将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，所述长视频推荐模型是基于天鹰优化算法模型训练得到的；

S23：将所述待推荐队列存储至待播放列表，等待用户操作时推荐相应视频。

在具体实践中，所述长视频推荐模型是根据实施例1中任一种可能的实施方式中的步骤训练得到的。

在具体实践中，所述将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，包括：将所述粗筛的推荐结果的长视频属性特征和待推荐用户的用户属性特征输入训练好的长视频推荐模型得到推荐评分，若所述推荐评分高于预设阈值，则将推荐结果放入待推荐队列，反之舍弃。

可以理解的是，本实施例提供的技术方案，通过召回方式得到粗筛的推荐结果；将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，所述长视频推荐模型是基于天鹰优化算法模型训练得到的；将所述待推荐队列存储至待播放列表，等待用户操作时推荐相应视频，本发明离线训练推荐模型，线上加载模型并输入用户和影片特征，既避免了长视频场景下个性化推荐中不必要的实时性，又避免了完全离线式的隔夜预计算推荐结果方式的灵活性不足问题；针对自身信息较为丰富的长视频，以及在用户规模不太大、特征信息有限的情景下，采用改进的长视频推荐模型进行个性化推荐，可减少开发人力成本与维护成本。

实施例3

如图3所示，本发明实施例还提供了另一种长视频推荐的方法，包括：

S31：数据上报

系统成功响应用户输入的播放请求后，用户终端以POST请求方式主动上报播放记录数据至数据采集接口，所述数据采集接口获取到数据后发送到Kafka消息队列中；

S32：数据ETL分析

原始播放记录通过 Kafka 的方式接入进来，经过统一的 ETL（Extract-Transform-Load）逻辑分析每个用户的长视频播放时长、点赞和收藏次数，并存储至Hive数仓中；

S33：特征工程处理

对原始播放记录中的用户属性特征和长视频属性特征进行处理。用户属性特征可以是年龄、性别、地理位置和喜欢的类别id特征，长视频属性特征可以是导演、主演、年代、地区、类型、题材、时长、语言和被播放次数属性。对连续变量进行归一化处理，非连续变量进行One-Hot独热编码处理，特征工程处理后的结果需要存储于业务数据库中，所述业务数据库例如选用MySQL数据库；

S34：生成用户评分表

对用户与影片的交互行为进行权重打分，并且权重系数随时间的推移而递减，本部分计算可选地通过Spark SQL完成，并将结果写回Hive数仓；

S35：模型训练

将特征工程处理后的数据与用户评分表拼接，形成训练数据，通过Spark MLlib对天鹰优化算法模型训练并导出模型文件；由此，得到了用于长视频推荐的长视频推荐模型。

作为一个示例，用户A有3个特征，视频B有2个特征，特征-评分结果为

，其中a和b代表A和B的特征量化值，再经过独热编码处理后的一行记录整理后的量化表示方式为：

，其中

表示该特征的独热编码值。

当需要进行推荐时，首先通过地域偏好推荐、偏好类型随机选择、近期热门等简单过滤方式可以快速召回多种粗筛结果，去重后得到初步筛选结果；

推荐服务是基于Springboot的推荐接口，可以对用户请求进行甄别和分析，获得用户的属性特征；

然后将初步筛选结果的属性特征和用户自身属性特征输入所述长视频推荐模型得到推荐评分，若评分高于设定阈值，则放入待推荐队列，反之舍弃，最终按批次将经过筛选的推荐结果进行排序并存储至待播放列表，通过CDN网络分发至用户的终端设备。

上述逻辑中，部分流程（S32,S33,S34,S35）执行上有先后顺序，并且需要定时执行得到推荐模型，必须等前置步骤执行完后再执行后续步骤，其中，步骤S32和步骤S34必须顺序执行，步骤S33和S32、S34可以并行执行或者更换执行顺序。Azkaban作为主流的调度系统，可以满足任务流的执行，任务流程图是一种有向无环图，通过Azkaban调度时可视化图例如图4所示。

实施例4

基于同一技术构思，本申请实施例还提供了一种计算机设备，包括存储器1和处理器2，如图5所示，所述存储器1存储有计算机程序，所述处理器2执行所述计算机程序时实现上述任一项所述的长视频推荐模型训练的方法和长视频推荐的方法。

其中，存储器1至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器（例如，SD或DX存储器等）、磁性存储器、磁盘、光盘等。存储器1在一些实施例中可以是长视频推荐模型训练系统和长视频推荐系统的内部存储单元，例如硬盘。存储器1在另一些实施例中也可以是长视频推荐模型训练系统和长视频推荐系统的外部存储设备，例如插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（SecureDigital, SD）卡，闪存卡（Flash Card）等。进一步地，存储器1还可以既包括长视频推荐模型训练和长视频推荐的内部存储单元也包括外部存储设备。存储器1不仅可以用于存储安装于长视频推荐模型训练和长视频推荐的应用软件及各类数据，例如长视频推荐模型训练程序和长视频推荐程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器2在一些实施例中可以是一中央处理器（Central Processing Unit,CPU）、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器1中存储的程序代码或处理数据，例如执行长视频推荐模型训练程序和长视频推荐程序等。

可以理解的是，本实施例提供的技术方案，通过召回方式得到粗筛的推荐结果；将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，所述长视频推荐模型是基于天鹰优化算法模型训练得到的；将所述待推荐队列存储至待播放列表，等待用户操作时推荐相应视频，本发明引入新型优化算法—天鹰优化器替代逻辑回归算法中Logistic 回归系数寻优计算中传统的海森矩阵计算方式，克服LR算法运算量巨大且效率低下，训练容易欠拟合等问题，并且通过Spark分布式计算组件对所述改进进行实现；离线训练推荐模型，线上加载模型并输入用户和影片特征，既避免了长视频场景下个性化推荐中不必要的实时性，又避免了完全离线式的隔夜预计算推荐结果方式的灵活性不足问题；针对自身信息较为丰富的长视频，以及在用户规模不太大、特征信息有限的情景下，采用改进的长视频推荐模型进行个性化推荐，可减少开发人力成本与维护成本。

本发明公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的方法的步骤。其中，该存储介质可以是易失性或非易失的计算机可读取存储介质。

本发明公开实施例所提供的长视频推荐模型训练方法和长视频推荐方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的方法的步骤，具体可参见上述方法实施例，在此不再赘述。

本发明公开实施例还提供一种计算机程序，该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包（Software DevelopmentKit，SDK）等等。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种长视频推荐模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，

所述交互行为包括：点赞、收藏、观看时长和观看次数；

根据对于每个用户-长视频对的评分值生成所述评分表。

3.根据权利要求2所述的方法，其特征在于，所述权重系数随时间的推移而递减。

4.根据权利要求1所述的方法，其特征在于，

所述根据所述表征用户与长视频交互行为的评分表生成标签数据，包括：

5.根据权利要求1所述的方法，其特征在于，

所述将所述用户属性特征、长视频属性特征和标签数据进行拼接，生成训练数据，包括：

6.一种长视频推荐方法，其特征在于，包括：

通过召回方式得到粗筛的推荐结果；

7.根据权利要求6所述的方法，其特征在于，所述长视频推荐模型是根据权利要求1-5任一项所述的方法训练得到的。

8.根据权利要求6所述的方法，其特征在于，

所述将所述粗筛的推荐结果输入长视频推荐模型得到待推荐队列，包括：将所述粗筛的推荐结果的长视频属性特征和待推荐用户的用户属性特征输入训练好的长视频推荐模型得到推荐评分，若所述推荐评分高于预设阈值，则将推荐结果放入待推荐队列，反之舍弃。

9.一种计算机设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1-5任一项所述的长视频推荐模型训练方法或权利要求6-8任一项所述的长视频推荐方法。

10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1-5任一项所述的长视频推荐模型训练方法或权利要求6-8任一项所述的长视频推荐方法。