CN109218829A

CN109218829A - 一种基于傅里叶变换的视频播放量可预测性分类方法

Info

Publication number: CN109218829A
Application number: CN201811280491.4A
Authority: CN
Inventors: 吴迪; 周彦
Original assignee: National Sun Yat Sen University
Current assignee: Sun Yat Sen University; National Sun Yat Sen University
Priority date: 2018-10-30
Filing date: 2018-10-30
Publication date: 2019-01-15
Anticipated expiration: 2038-10-30
Also published as: CN109218829B

Abstract

本发明涉及了一种基于傅里叶变换的视频播放量可预测性分类方法，以傅里叶变换为基础，引入了傅里叶变换对时间序列的频谱分析，通过计算视频的历史播放量的高频能量占比，去区分可预测性，高频能量占比高的视频分类为可预测性弱，而高频能量占比低的视频分类为可预测性强。本发明能够帮助视频提供网站提前区分视频的未来播放量预测难度，进而使得网站更好地选择预测算法和分配资源。

Description

一种基于傅里叶变换的视频播放量可预测性分类方法

技术领域

本发明涉及人工智能领域，更具体的，涉及一种基于傅里叶变换的视频播放量可预测性分类方法。

背景技术

互联网的出现和发展给普通用户带来了大量的信息，近年来，随着互联网技术的发展，观看在线视频成为了人们一种常见的娱乐方式。同时各个视频站点的观看量在近几年都呈现了爆炸性的增长趋势。以腾讯视频网站为例，2017年它的日活用户达到了1.5亿，平均每个用户每月贡献了437分钟的观看时长。对于如此大的观看人数和观看量，如何去调整视频缓存策略、如何做视频推荐以及如何投放广告等问题对于视频站点来说都是需要特别关注的。而解决这些问题的一个核心问题就是提前预估视频的播放量，所以如何去预测视频的播放量就成了现在企业以及学术界共同关注的一个问题。

在之前的研究中，有学者收集了大量视频播放量数据，通过统计分析的方法，发现了一个视频的后期播放量与它的早期播放量存在着极高的相关性，从而论证了用历史播放量数据去预测未来播放量的可行性。所以现有的绝大多数预测模型或算法都是基于历史播放量数据的，它们将每个视频的历史播放量数据作为输入，输出视频在未来某个时间点的播放量预测值。在预测方法上有很多种实现方式，如线性回归方法、机器学习方法、随机过程方法等。

但是，并不是所有视频的未来播放量都与前期播放量绝对相关，它们的播放量可预测性也是存在着差别。很多视频的播放量会因为外界的扰动而产生很大的变化。例如，将一个视频放在了视频站点的首页推荐列表上，一般就会导致视频的播放量急剧上升。反之，将一个视频从首页推荐列表上移除掉，它的播放量则会出现下降趋势。因为基于历史播放量的预测模型或算法大多都是去拟合历史播放量的发展趋势，然后进行未来播放量的预测。所以当历史播放量的时间序列曲线出现剧烈变化的时候这些模型并不能表现出良好的性能，本发明认为这种视频是可预测性弱的，反之如果一个视频的历史播放量曲线表现得比较平稳，就可以更好地去学习它的变化趋势，从而可以利用现有的模型进行预测，本发明认为这些视频是可预测性强的。

那么，如何去区分它们的可预测性就成了一个很重要的问题。如果能够区分出视频的可预测性，就能够针对可预测性不同的视频制定不同的播放量预测方法，例如针对可预测性强的视频可以直接使用现有方法，而对于可预测性弱的视频，可以只拟合出现剧烈变化后的播放量曲线，这样可以防止之前的播放量变化趋势对预测的干扰。同时，区分了视频播放量的可预测性，视频站点可以对不同预测性的视频进行统计分析，从而建立模型提早判断视频的可预测性是否强，然后将更多的资源分配到预测这些可预测性强的视频上，从而优化资源利用。例如，对于重点关注并且可预测性强的视频，就可以依据基于历史数据的预测算法去预测播放量，对于重点关注但是可预测性弱的视频，可能就需要在历史数据预测算法上再结合一些外部信息来预测，比如结合OSN的信息，或者视频提供网站结合自身的推荐策略更好地进行预测。

本发明基于傅里叶变换，设计了一种可以有效区分视频播放量可预测性的方法。由于可预测性的差异来自于历史播放量曲线的波动情况，那么怎么去量化这个波动情况就是区分可预测性的核心所在。视频的历史播放量也是一种时间序列，而傅里叶变换可以从频域去分析时间序列。在频域维度上，平稳变化的时间序列的高频分量较少，而波动比较大的时间序列的高频分量占比则比较大。所以，基于这个理论，本发明通过计算视频的历史播放量的高频能量占比，去区分可预测性。高频能量占比高的视频分类为可预测性弱，而高频能量占比低的视频分类为可预测性强。之后根据本发明的划分，视频提供网站就能够合理地分配资源去预测不同类型的视频。

发明内容

本发明提出了一种基于傅里叶变换的视频播放量可预测性分类方法，以傅里叶变换为基础，引入了傅里叶变换对时间序列的频谱分析，通过计算视频的历史播放量的高频能量占比，去区分可预测性，根据算法的划分，视频提供网站能够合理地分配资源去预测不同类型的视频。

为实现以上发明目的，采用的技术方案是：

一种基于傅里叶变换的视频播放量可预测性分类方法，包括以下步骤：

步骤S1：将每个视频的历史播放量数据整理成时间序列数据，然后使用FFT将时间序列数据转换到频域上，得到一系列的复数形式的序列；

步骤S2：根据上一步得到的复数形式的时间序列，选取高频能量和低频能量的划分点，从而计算每个视频高频能量占总能量的比重；

步骤S3：根据计算出来的高频能量占比，将所有的视频按照高频能量占比从小到大的形式进行排列，然后确定一个高频能量占比阈值R，将高频能量占比高于R的视频划分为可预测性弱的视频类，而将高频能量占比低于R的视频划分为可预测性强的视频类。

优选的，所述步骤S2的具体过程如下：

步骤S201：输入上一步得到的傅立叶变换之后的复数序列[c₁,c₂,c₃,……,c_n-1,c_n]，其中n为复数序列的长度；在复数序列中输入一个高低频划分点σ，整个复数序列在点σ之前的划分为低频部分，之后的划分为高频部分；

步骤S202：设置低频能量总和以及高频能量总和的初始值为0，用L表示低频能量总和，用H表示高频能量总和；

步骤S203：对复数序列[c₁,c₂,c₃,……,c_n-1,c_n]进行遍历，若遍历到的复数项下标值小于或等于σ，则划分为低频部分，并将该复数项对应的能量累加到低频能量总和L上，其中能量是复数项的模的平方；若遍历到的复数项下标值大于σ，则划分为高频部分，并将该复数项对应的能量累加到高频能量总和H上；

步骤S204：遍历完成后，得到最后的低频能量总和L以及高频能量总和H，求出高频能量总和占所有能量总和的比重，即高频能量占比。

优选的，所述步骤S3的具体执行过程如下：

步骤S301：将所有视频求得的高频能量占比整合成一个序列[r₁,r₂,r₃,……,r_v-1,r_v]，v表示视频的数量；将所有视频按照高频能量占比从小到大的顺序进行排列，得到新的序列[r₁′,r₂′,r₃′,……r_v-1′,r_v′]，r_v′为最大的高频能量占比；

步骤S302：设定划分比例阈值θ，将r_v′乘以划分比例阈值θ，得到划分高频能量占比的阈值R；

步骤S303：设可预测性强的集合C_s为空集，可预测性弱的集合C_w为空集；

步骤S304：遍历[r₁′,r₂′,r₃′,……r_v-1′,r_v′]，对于每一项，将它与R值进行比较，如果大于R值，划分该视频到可预测性弱的集合C_w，反之如果小于等于R值，将对应的视频划分到可预测性强的集合C_s中；

步骤305：遍历结束后，将两个集合输出。

优选的，高低频划分点σ为

与现有技术相比，本发明的有益效果是：

本发明提出了一种基于傅里叶变换的视频播放量可预测性分类方法，以傅里叶变换为基础，引入了傅里叶变换对时间序列的频谱分析，通过计算视频的历史播放量的高频能量占比，去区分可预测性。本发明能够帮助视频提供网站提前区分视频的未来播放量预测难度，进而使得网站更好地选择预测算法和分配资源。

附图说明

图1为本发明的流程图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

以下结合附图和实施例对本发明做进一步的阐述。

实施例1

如图1所示，一种基于傅里叶变换的视频播放量可预测性分类方法，包括以下步骤：

步骤S2：根据上一步得到的复数形式的时间序列，选取高频能量和低频能量的划分点，从而计算每个视频高频能量占总能量的比重，具体过程如下：

步骤S201：输入上一步得到的傅立叶变换之后的复数序列[c₁,c₂,c₃,……,c_n-1,c_n]，其中n为复数序列的长度；在复数序列中输入一个高低频划分点σ，高低频划分点σ为整个复数序列在点σ之前的划分为低频部分，之后的划分为高频部分；

步骤S3：根据计算出来的高频能量占比，将所有的视频按照高频能量占比从小到大的形式进行排列，然后确定一个高频能量占比阈值R，将高频能量占比高于R的视频划分为可预测性弱的视频类，而将高频能量占比低于R的视频划分为可预测性强的视频类，具体执行过程如下：

步骤305：遍历结束后，将两个集合输出。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于傅里叶变换的视频播放量可预测性分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于傅里叶变换的视频播放量可预测性分类方法，其特征在于，所述步骤S2的具体过程如下：

3.根据权利要求2所述的基于傅里叶变换的视频播放量可预测性分类方法，其特征在于，所述步骤S3的具体执行过程如下：

步骤305：遍历结束后，将两个集合输出。

4.根据权利要求3所述的基于傅里叶变换的视频播放量可预测性分类方法，其特征在于，高低频划分点σ为