CN109218829A - 一种基于傅里叶变换的视频播放量可预测性分类方法 - Google Patents

一种基于傅里叶变换的视频播放量可预测性分类方法 Download PDF

Info

Publication number
CN109218829A
CN109218829A CN201811280491.4A CN201811280491A CN109218829A CN 109218829 A CN109218829 A CN 109218829A CN 201811280491 A CN201811280491 A CN 201811280491A CN 109218829 A CN109218829 A CN 109218829A
Authority
CN
China
Prior art keywords
frequency energy
video
predictability
frequency
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811280491.4A
Other languages
English (en)
Other versions
CN109218829B (zh
Inventor
吴迪
周彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN201811280491.4A priority Critical patent/CN109218829B/zh
Publication of CN109218829A publication Critical patent/CN109218829A/zh
Application granted granted Critical
Publication of CN109218829B publication Critical patent/CN109218829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及了一种基于傅里叶变换的视频播放量可预测性分类方法,以傅里叶变换为基础,引入了傅里叶变换对时间序列的频谱分析,通过计算视频的历史播放量的高频能量占比,去区分可预测性,高频能量占比高的视频分类为可预测性弱,而高频能量占比低的视频分类为可预测性强。本发明能够帮助视频提供网站提前区分视频的未来播放量预测难度,进而使得网站更好地选择预测算法和分配资源。

Description

一种基于傅里叶变换的视频播放量可预测性分类方法
技术领域
本发明涉及人工智能领域,更具体的,涉及一种基于傅里叶变换的视频播放量可预测性分类方法。
背景技术
互联网的出现和发展给普通用户带来了大量的信息,近年来,随着互联网技术的发展,观看在线视频成为了人们一种常见的娱乐方式。同时各个视频站点的观看量在近几年都呈现了爆炸性的增长趋势。以腾讯视频网站为例,2017年它的日活用户达到了1.5亿,平均每个用户每月贡献了437分钟的观看时长。对于如此大的观看人数和观看量,如何去调整视频缓存策略、如何做视频推荐以及如何投放广告等问题对于视频站点来说都是需要特别关注的。而解决这些问题的一个核心问题就是提前预估视频的播放量,所以如何去预测视频的播放量就成了现在企业以及学术界共同关注的一个问题。
在之前的研究中,有学者收集了大量视频播放量数据,通过统计分析的方法,发现了一个视频的后期播放量与它的早期播放量存在着极高的相关性,从而论证了用历史播放量数据去预测未来播放量的可行性。所以现有的绝大多数预测模型或算法都是基于历史播放量数据的,它们将每个视频的历史播放量数据作为输入,输出视频在未来某个时间点的播放量预测值。在预测方法上有很多种实现方式,如线性回归方法、机器学习方法、随机过程方法等。
但是,并不是所有视频的未来播放量都与前期播放量绝对相关,它们的播放量可预测性也是存在着差别。很多视频的播放量会因为外界的扰动而产生很大的变化。例如,将一个视频放在了视频站点的首页推荐列表上,一般就会导致视频的播放量急剧上升。反之,将一个视频从首页推荐列表上移除掉,它的播放量则会出现下降趋势。因为基于历史播放量的预测模型或算法大多都是去拟合历史播放量的发展趋势,然后进行未来播放量的预测。所以当历史播放量的时间序列曲线出现剧烈变化的时候这些模型并不能表现出良好的性能,本发明认为这种视频是可预测性弱的,反之如果一个视频的历史播放量曲线表现得比较平稳,就可以更好地去学习它的变化趋势,从而可以利用现有的模型进行预测,本发明认为这些视频是可预测性强的。
那么,如何去区分它们的可预测性就成了一个很重要的问题。如果能够区分出视频的可预测性,就能够针对可预测性不同的视频制定不同的播放量预测方法,例如针对可预测性强的视频可以直接使用现有方法,而对于可预测性弱的视频,可以只拟合出现剧烈变化后的播放量曲线,这样可以防止之前的播放量变化趋势对预测的干扰。同时,区分了视频播放量的可预测性,视频站点可以对不同预测性的视频进行统计分析,从而建立模型提早判断视频的可预测性是否强,然后将更多的资源分配到预测这些可预测性强的视频上,从而优化资源利用。例如,对于重点关注并且可预测性强的视频,就可以依据基于历史数据的预测算法去预测播放量,对于重点关注但是可预测性弱的视频,可能就需要在历史数据预测算法上再结合一些外部信息来预测,比如结合OSN的信息,或者视频提供网站结合自身的推荐策略更好地进行预测。
本发明基于傅里叶变换,设计了一种可以有效区分视频播放量可预测性的方法。由于可预测性的差异来自于历史播放量曲线的波动情况,那么怎么去量化这个波动情况就是区分可预测性的核心所在。视频的历史播放量也是一种时间序列,而傅里叶变换可以从频域去分析时间序列。在频域维度上,平稳变化的时间序列的高频分量较少,而波动比较大的时间序列的高频分量占比则比较大。所以,基于这个理论,本发明通过计算视频的历史播放量的高频能量占比,去区分可预测性。高频能量占比高的视频分类为可预测性弱,而高频能量占比低的视频分类为可预测性强。之后根据本发明的划分,视频提供网站就能够合理地分配资源去预测不同类型的视频。
发明内容
本发明提出了一种基于傅里叶变换的视频播放量可预测性分类方法,以傅里叶变换为基础,引入了傅里叶变换对时间序列的频谱分析,通过计算视频的历史播放量的高频能量占比,去区分可预测性,根据算法的划分,视频提供网站能够合理地分配资源去预测不同类型的视频。
为实现以上发明目的,采用的技术方案是:
一种基于傅里叶变换的视频播放量可预测性分类方法,包括以下步骤:
步骤S1:将每个视频的历史播放量数据整理成时间序列数据,然后使用FFT将时间序列数据转换到频域上,得到一系列的复数形式的序列;
步骤S2:根据上一步得到的复数形式的时间序列,选取高频能量和低频能量的划分点,从而计算每个视频高频能量占总能量的比重;
步骤S3:根据计算出来的高频能量占比,将所有的视频按照高频能量占比从小到大的形式进行排列,然后确定一个高频能量占比阈值R,将高频能量占比高于R的视频划分为可预测性弱的视频类,而将高频能量占比低于R的视频划分为可预测性强的视频类。
优选的,所述步骤S2的具体过程如下:
步骤S201:输入上一步得到的傅立叶变换之后的复数序列[c1,c2,c3,……,cn-1,cn],其中n为复数序列的长度;在复数序列中输入一个高低频划分点σ,整个复数序列在点σ之前的划分为低频部分,之后的划分为高频部分;
步骤S202:设置低频能量总和以及高频能量总和的初始值为0,用L表示低频能量总和,用H表示高频能量总和;
步骤S203:对复数序列[c1,c2,c3,……,cn-1,cn]进行遍历,若遍历到的复数项下标值小于或等于σ,则划分为低频部分,并将该复数项对应的能量累加到低频能量总和L上,其中能量是复数项的模的平方;若遍历到的复数项下标值大于σ,则划分为高频部分,并将该复数项对应的能量累加到高频能量总和H上;
步骤S204:遍历完成后,得到最后的低频能量总和L以及高频能量总和H,求出高频能量总和占所有能量总和的比重,即高频能量占比。
优选的,所述步骤S3的具体执行过程如下:
步骤S301:将所有视频求得的高频能量占比整合成一个序列[r1,r2,r3,……,rv-1,rv],v表示视频的数量;将所有视频按照高频能量占比从小到大的顺序进行排列,得到新的序列[r1′,r2′,r3′,……rv-1′,rv′],rv′为最大的高频能量占比;
步骤S302:设定划分比例阈值θ,将rv′乘以划分比例阈值θ,得到划分高频能量占比的阈值R;
步骤S303:设可预测性强的集合Cs为空集,可预测性弱的集合Cw为空集;
步骤S304:遍历[r1′,r2′,r3′,……rv-1′,rv′],对于每一项,将它与R值进行比较,如果大于R值,划分该视频到可预测性弱的集合Cw,反之如果小于等于R值,将对应的视频划分到可预测性强的集合Cs中;
步骤305:遍历结束后,将两个集合输出。
优选的,高低频划分点σ为
与现有技术相比,本发明的有益效果是:
本发明提出了一种基于傅里叶变换的视频播放量可预测性分类方法,以傅里叶变换为基础,引入了傅里叶变换对时间序列的频谱分析,通过计算视频的历史播放量的高频能量占比,去区分可预测性。本发明能够帮助视频提供网站提前区分视频的未来播放量预测难度,进而使得网站更好地选择预测算法和分配资源。
附图说明
图1为本发明的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
如图1所示,一种基于傅里叶变换的视频播放量可预测性分类方法,包括以下步骤:
步骤S1:将每个视频的历史播放量数据整理成时间序列数据,然后使用FFT将时间序列数据转换到频域上,得到一系列的复数形式的序列;
步骤S2:根据上一步得到的复数形式的时间序列,选取高频能量和低频能量的划分点,从而计算每个视频高频能量占总能量的比重,具体过程如下:
步骤S201:输入上一步得到的傅立叶变换之后的复数序列[c1,c2,c3,……,cn-1,cn],其中n为复数序列的长度;在复数序列中输入一个高低频划分点σ,高低频划分点σ为整个复数序列在点σ之前的划分为低频部分,之后的划分为高频部分;
步骤S202:设置低频能量总和以及高频能量总和的初始值为0,用L表示低频能量总和,用H表示高频能量总和;
步骤S203:对复数序列[c1,c2,c3,……,cn-1,cn]进行遍历,若遍历到的复数项下标值小于或等于σ,则划分为低频部分,并将该复数项对应的能量累加到低频能量总和L上,其中能量是复数项的模的平方;若遍历到的复数项下标值大于σ,则划分为高频部分,并将该复数项对应的能量累加到高频能量总和H上;
步骤S204:遍历完成后,得到最后的低频能量总和L以及高频能量总和H,求出高频能量总和占所有能量总和的比重,即高频能量占比。
步骤S3:根据计算出来的高频能量占比,将所有的视频按照高频能量占比从小到大的形式进行排列,然后确定一个高频能量占比阈值R,将高频能量占比高于R的视频划分为可预测性弱的视频类,而将高频能量占比低于R的视频划分为可预测性强的视频类,具体执行过程如下:
步骤S301:将所有视频求得的高频能量占比整合成一个序列[r1,r2,r3,……,rv-1,rv],v表示视频的数量;将所有视频按照高频能量占比从小到大的顺序进行排列,得到新的序列[r1′,r2′,r3′,……rv-1′,rv′],rv′为最大的高频能量占比;
步骤S302:设定划分比例阈值θ,将rv′乘以划分比例阈值θ,得到划分高频能量占比的阈值R;
步骤S303:设可预测性强的集合Cs为空集,可预测性弱的集合Cw为空集;
步骤S304:遍历[r1′,r2′,r3′,……rv-1′,rv′],对于每一项,将它与R值进行比较,如果大于R值,划分该视频到可预测性弱的集合Cw,反之如果小于等于R值,将对应的视频划分到可预测性强的集合Cs中;
步骤305:遍历结束后,将两个集合输出。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (4)

1.一种基于傅里叶变换的视频播放量可预测性分类方法,其特征在于,包括以下步骤:
步骤S1:将每个视频的历史播放量数据整理成时间序列数据,然后使用FFT将时间序列数据转换到频域上,得到一系列的复数形式的序列;
步骤S2:根据上一步得到的复数形式的时间序列,选取高频能量和低频能量的划分点,从而计算每个视频高频能量占总能量的比重;
步骤S3:根据计算出来的高频能量占比,将所有的视频按照高频能量占比从小到大的形式进行排列,然后确定一个高频能量占比阈值R,将高频能量占比高于R的视频划分为可预测性弱的视频类,而将高频能量占比低于R的视频划分为可预测性强的视频类。
2.根据权利要求1所述的基于傅里叶变换的视频播放量可预测性分类方法,其特征在于,所述步骤S2的具体过程如下:
步骤S201:输入上一步得到的傅立叶变换之后的复数序列[c1,c2,c3,……,cn-1,cn],其中n为复数序列的长度;在复数序列中输入一个高低频划分点σ,整个复数序列在点σ之前的划分为低频部分,之后的划分为高频部分;
步骤S202:设置低频能量总和以及高频能量总和的初始值为0,用L表示低频能量总和,用H表示高频能量总和;
步骤S203:对复数序列[c1,c2,c3,……,cn-1,cn]进行遍历,若遍历到的复数项下标值小于或等于σ,则划分为低频部分,并将该复数项对应的能量累加到低频能量总和L上,其中能量是复数项的模的平方;若遍历到的复数项下标值大于σ,则划分为高频部分,并将该复数项对应的能量累加到高频能量总和H上;
步骤S204:遍历完成后,得到最后的低频能量总和L以及高频能量总和H,求出高频能量总和占所有能量总和的比重,即高频能量占比。
3.根据权利要求2所述的基于傅里叶变换的视频播放量可预测性分类方法,其特征在于,所述步骤S3的具体执行过程如下:
步骤S301:将所有视频求得的高频能量占比整合成一个序列[r1,r2,r3,……,rv-1,rv],v表示视频的数量;将所有视频按照高频能量占比从小到大的顺序进行排列,得到新的序列[r1′,r2′,r3′,……rv-1′,rv′],rv′为最大的高频能量占比;
步骤S302:设定划分比例阈值θ,将rv′乘以划分比例阈值θ,得到划分高频能量占比的阈值R;
步骤S303:设可预测性强的集合Cs为空集,可预测性弱的集合Cw为空集;
步骤S304:遍历[r1′,r2′,r3′,……rv-1′,rv′],对于每一项,将它与R值进行比较,如果大于R值,划分该视频到可预测性弱的集合Cw,反之如果小于等于R值,将对应的视频划分到可预测性强的集合Cs中;
步骤305:遍历结束后,将两个集合输出。
4.根据权利要求3所述的基于傅里叶变换的视频播放量可预测性分类方法,其特征在于,高低频划分点σ为
CN201811280491.4A 2018-10-30 2018-10-30 一种基于傅里叶变换的视频播放量可预测性分类方法 Active CN109218829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811280491.4A CN109218829B (zh) 2018-10-30 2018-10-30 一种基于傅里叶变换的视频播放量可预测性分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811280491.4A CN109218829B (zh) 2018-10-30 2018-10-30 一种基于傅里叶变换的视频播放量可预测性分类方法

Publications (2)

Publication Number Publication Date
CN109218829A true CN109218829A (zh) 2019-01-15
CN109218829B CN109218829B (zh) 2021-07-27

Family

ID=64997563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811280491.4A Active CN109218829B (zh) 2018-10-30 2018-10-30 一种基于傅里叶变换的视频播放量可预测性分类方法

Country Status (1)

Country Link
CN (1) CN109218829B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111565316A (zh) * 2020-07-15 2020-08-21 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质
CN112004120A (zh) * 2019-05-27 2020-11-27 广州虎牙信息科技有限公司 平台网络资源播放量的预测方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110302103A1 (en) * 2010-06-08 2011-12-08 International Business Machines Corporation Popularity prediction of user-generated content
CN103914475A (zh) * 2013-01-05 2014-07-09 腾讯科技(北京)有限公司 一种视频播放量的预测方法、系统和装置
CN104581215A (zh) * 2013-10-24 2015-04-29 中兴通讯股份有限公司 一种交互式网络电视内容调度方法及系统
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
CN107105320A (zh) * 2017-03-07 2017-08-29 上海交通大学 一种基于用户情绪的在线视频热度预测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110302103A1 (en) * 2010-06-08 2011-12-08 International Business Machines Corporation Popularity prediction of user-generated content
CN103914475A (zh) * 2013-01-05 2014-07-09 腾讯科技(北京)有限公司 一种视频播放量的预测方法、系统和装置
CN104581215A (zh) * 2013-10-24 2015-04-29 中兴通讯股份有限公司 一种交互式网络电视内容调度方法及系统
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
CN107105320A (zh) * 2017-03-07 2017-08-29 上海交通大学 一种基于用户情绪的在线视频热度预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YIPENG ZHOU 等: "Statistical Study of View Preferences for Online Videos With Cross-Platform Information", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *
ZHIYI TAN 等: "A Novel Time Series Approach for Predicting the Long-Term Popularity of Online Videos", 《IEEE TRANSACTIONS ON BROADCASTING》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112004120A (zh) * 2019-05-27 2020-11-27 广州虎牙信息科技有限公司 平台网络资源播放量的预测方法、装置、设备及存储介质
CN112004120B (zh) * 2019-05-27 2023-10-13 广州虎牙信息科技有限公司 平台网络资源播放量的预测方法、装置、设备及存储介质
CN111565316A (zh) * 2020-07-15 2020-08-21 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN109218829B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
Abisheva et al. Who watches (and shares) what on youtube? and when? using twitter to understand youtube viewership
Tsytsarau et al. Dynamics of news events and social media reaction
US20160012331A1 (en) Scoring concept terms using a deep network
US9965478B1 (en) Automatic generation of online media stations customized to individual users
Li et al. Characterizing and predicting the popularity of online videos
CN106294830A (zh) 多媒体资源的推荐方法及装置
CN110222975A (zh) 一种流失用户分析方法、装置、电子设备及存储介质
CN107832437A (zh) 音/视频推送方法、装置、设备及存储介质
Chang et al. Predicting the popularity of online serials with autoregressive models
CN102088626A (zh) 一种在线视频推荐方法及视频门户服务系统
CN108304490A (zh) 基于文本的相似度确定方法、装置及计算机设备
CN109511015A (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN109218829A (zh) 一种基于傅里叶变换的视频播放量可预测性分类方法
CN110290199A (zh) 内容推送方法、装置及设备
CN110059221A (zh) 视频推荐方法、电子设备及计算机可读存储介质
CN108629010A (zh) 一种基于主题和服务组合信息的web服务推荐方法
CN112163614A (zh) 一种主播分类方法、装置、电子设备及存储介质
CN107920260A (zh) 数字电视用户行为预测方法及装置
WO2023231542A1 (zh) 表示信息的确定方法、装置、设备及存储介质
Jie et al. A unified search federation system based on online user feedback
Zhou et al. Interpreting video recommendation mechanisms by mining view count traces
Kaligotla et al. Diffusion of competing rumours on social media
CN108595526A (zh) 资源推荐方法及装置
CN106604068B (zh) 一种更新媒体节目的方法及其系统
Pongnumkul et al. A bipartite fitness model for online music streaming services

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant