CN109587515B - 一种视频播放流量预测方法及装置 - Google Patents

一种视频播放流量预测方法及装置 Download PDF

Info

Publication number
CN109587515B
CN109587515B CN201811509795.3A CN201811509795A CN109587515B CN 109587515 B CN109587515 B CN 109587515B CN 201811509795 A CN201811509795 A CN 201811509795A CN 109587515 B CN109587515 B CN 109587515B
Authority
CN
China
Prior art keywords
video
predicted
time
information
playing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811509795.3A
Other languages
English (en)
Other versions
CN109587515A (zh
Inventor
胡晓亮
陈达
陈思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201811509795.3A priority Critical patent/CN109587515B/zh
Publication of CN109587515A publication Critical patent/CN109587515A/zh
Application granted granted Critical
Publication of CN109587515B publication Critical patent/CN109587515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2407Monitoring of transmitted content, e.g. distribution time, number of downloads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种视频播放流量预测方法及装置,该方法获取待预测视频在预测时间对应的视频信息,该视频信息包括与待预测视频的播放流量相关的信息。然后,从该视频信息中提取关键特征,并将该关键特征输入至时间序列预测模型中,得到该待预测视频在被预测时间对应的播放流量;被预测时间是开播后的任意一个预测时间步长,预测时间早于被预测时间。可见,该方法利用时间序列预测模型能够提前几天预测开播日及开播后每一个预测时间步长对应的待预测视频的播放流量。为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。

Description

一种视频播放流量预测方法及装置
技术领域
本发明属于机器学习技术领域,尤其涉及一种视频播放流量预测方法及装置。
背景技术
对于视频相关企业而言,视频播放流量(例如,视频播放数)是十分关键的参考指标。例如,对视频例如影视剧、综艺节目等的播放流量相关数据进行预测,可以为节目制作、策划、采购、决策、运营、推送、节省内容分发网络带宽和财务相关方面提供重要参考和支持。
视频流量预测对节省内容分发网络带宽、调整运营决策等意义重大。但是,目前的播放流量预测方式,例如,自回归积分滑动平均模型等,预测的范围只包括视频播放后的阶段,无法在视频播放前进行播放流量的预测。而且,无法实现超短期前(例如,几天)预测视频播出后的播放流量。
发明内容
有鉴于此,本发明提供一种视频播放流量预测方法及装置,以解决传统的播放流量预测方式无法在视频播放前提前预测播放后每一日的播放流量。
第一方面,本申请提供了一种视频播放流量预测方法,包括:
获取待预测视频在预测时间对应的视频信息,所述视频信息包括与所述待预测视频的播放流量相关联的信息;
从所述视频信息中提取关键特征;
将所述关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量,其中,该被预测时间是开播后的任意一个预测时间步长,且预测时间早于对应的被预测时间,所述时间序列预测模型利用已播出视频的视频信息对时间序列模型进行训练得到。
可选地,从所述视频信息中提取关键特征,包括:
从所述视频信息中提取静态关键信息和动态关键信息,所述静态关键信息为所述待预测视频开播前已确定的信息,所述动态关键信息是随不同的被预测时间而变化的信息;
将所述静态关键信息和所述动态关键信息转换为数值型数据;
对所述静态关键信息的数值型数据归一化变换得到静态关键特征;
对所述动态关键信息的数值型数据归一化变换得到动态关键特征。
可选地,对所述静态关键信息的数值型数据归一化变换得到静态关键特征,包括:
将所述静态关键信息中的非正态分布数据映射为正态分布数据;
对所述静态关键信息中的全部正态分布数据进行归一化变换得到静态关键特征;
对所述动态关键信息的数值型数据归一化变换得到动态关键特征,包括:
将所述动态关键信息中的非正态分布数据映射正态分布数据;
对所述动态关键信息中的全部正态分布数据进行归一化变换得到动态关键特征。
可选地,所述将关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量,包括:
依据在所述预测时间获得的所述待预测视频的静态关键特征和动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在开播日的播放流量;
依据在所述预测时间获得的所述待预测视频的动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在被预测时间的播放流量。
可选地,所述方法还包括:
获取训练样本数据集中的关键信息,所述训练样本数据集包括已播出视频的信息,所述关键信息包括该已播出视频的视频信息及该已播出视频播出后每个预测时间步长对应的播放流量真实值;
从所述训练样本数据集中的关键信息中获取关键特征;
将所述训练样本数据集包含的关键特征输入至时间序列模型中,得到播放流量预测值,并计算该播放流量预测值与对应的播放流量真实值之间的误差值;
判断所述误差值是否小于误差阈值,若否,则反复调整所述时间序列模型中的参数,直到利用反复调整后的时间序列模型得到误差值小于所述误差阈值;
如果所述误差值小于所述误差阈值,则确定得到该误差值的时间序列模型为用于预测待预测视频的播放流量的时间序列预测模型。
第二方面,本申请还提供了一种视频播放流量预测装置,包括:
第一获取模块,用于获取待预测视频在预测时间对应的视频信息,所述视频信息包括与所述待预测视频的播放流量相关联的信息;
特征提取模块,用于从所述视频信息中提取关键特征;
预测模块,用于将所述关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量,其中,该被预测时间是开播后的任意一个预测时间步长,且预测时间早于对应的被预测时间,所述时间序列预测模型利用已播出视频的视频信息对事件序列模型进行训练得到。
可选地,所述特征提取模块包括:
关键信息提取子模块,用于从所述视频信息中提取静态关键信息和动态关键信息,所述静态关键信息为所述待预测视频开播前已确定的信息,所述动态关键信息是随不同的被预测时间而变化的信息;
关键信息转换子模块,用于将所述静态关键信息和所述动态关键信息转换为数值型数据;
第一归一化变换子模块,用于对所述静态关键信息的数值型数据归一化变换得到静态关键特征;
第二归一化变换子模块,用于对所述动态关键信息的数值型数据归一化变换得到动态关键特征。
可选地,所述第一归一化变换子模块具体用于:将所述静态关键信息中的非正态分布数据映射为正态分布数据;对所述静态关键信息中的全部正态分布数据进行归一化变换得到静态关键特征;
所述第二归一化变换子模块具体用于:将所述动态关键信息中的非正态分布数据映射正态分布数据;对所述动态关键信息中的全部正态分布数据进行归一化变换得到动态关键特征。
可选地,所述预测模块具体用于:
依据在所述预测时间获得的所述待预测视频的静态关键特征和动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在开播日的播放流量;
依据在所述预测时间获得的所述待预测视频的动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在被预测时间的播放流量。
可选地,所述装置还包括:
第二获取模块,用于获取训练样本数据集中的关键信息,所述训练样本数据集包括已播出视频的信息,所述关键信息包括该已播出视频的视频信息及该已播出视频播出后每个预测时间步长对应的播放流量真实值;
第三获取模块,用于从所述训练样本数据集中的关键信息中获取关键特征;
误差计算模块,用于将所述训练样本数据集包含的关键特征输入至所述时间序列模型中,得到播放流量预测值,并计算该播放流量预测值与对应的播放流量真实值之间的误差值;
判断模块,用于判断所述误差值是否小于误差阈值,若否,则反复调整所述时间序列模型中的参数,直到利用反复调整后的时间序列模型得到误差值小于所述误差阈值;
预测模型确定模块,用于当所述误差值小于所述误差阈值时,确定得到该误差值的时间序列模型为用于预测待预测视频的播放流量的时间序列预测模型。
本实施例提供的视频播放流量预测方法,获取待预测视频在预测时间对应的视频信息,该视频信息包括与待预测视频的播放流量相关的信息。然后,从该视频信息中提取关键特征,并将该关键特征输入至时间序列预测模型中,得到该待预测视频在被预测时间对应的播放流量;被预测时间是开播后的任意一个预测时间步长,预测时间早于被预测时间。可见,该方法利用时间序列预测模型能够提前几天预测开播日及开播后每一个预测时间步长(例如,一天)对应的待预测视频的播放流量。为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种视频播放流量预测方法的流程图;
图2是本申请实施例提供的一种获取待预测视频的视频信息过程的流程图;
图3是本申请实施例提供的一种时间序列预测模型的原理框图;
图4是本申请实施例提供的另一种视频播放流量预测方法的流程图;
图5是本申请实施例提供的一种视频播放流量预测装置的框图;
图6是本申请实施例提供的另一种视频播放流量预测装置的框图。
具体实施方式
目前预测视频播放流量的方式,尤其是应用在时间序列上的常用方法,例如,自回归积分滑动平均模型等,不具备视频播放前进行预测的能力。本申请提供了一种视频播放流量预测方法及装置,通过特征工程和机器学习的方法提供在开播前就能预测视频播出后流量相关指标。为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,示出了本申请实施例一种视频播放流量预测方法的流程图,该方法应用于终端或服务器中,如图1所示,该方法可以包括以下步骤:
S110,获取待预测视频在预测时间对应的视频信息。
预测时间是指当前预测待预测视频的播放流量的时间,该预测时间可以以小时、天、周等为预测时间步长的单位,例如,预测时间步长是5小时、1天、1周等等。
被预测时间是指未来播放待预测视频的时间,例如,在1月1日预测某个待预测视频在1月10播放时对应的播放流量,则1月1日为预测时间,1月10日为被预测时间。
待预测视频可以是截止当前预测时刻未在任意一个播放平台(例如,视频网站平台、电视平台、影院等)播放的任意一个视频,其中,针对电视剧等具有一系列相关联的视频的类型,待预测视频是该电视剧包括的全部剧集。
所述视频信息包括与待预测视频播放流量相关的信息;其中,视频信息可以包括静态信息和动态信息,其中,静态信息是视频开播前能够确定的信息,静态信息可以包括视频本身涉及的信息,例如,播放网站、制作公司、开播时间、涉及到的人的影响力、视频本身的影响力等;动态信息是视频播放前到播放后逐渐获得的信息,而且,动态信息随被预测时间的不同而变化,例如,待预测视频从开播日到被预测时间前一天每天的真实流量相关数值、视频在被预测时间将要播放的集数、被预测时间与上次剧集更新的间隔时间等。
其中,静态信息只在预测开播日的待预测视频的播放流量时使用,而动态信息在预测每一个预测时间步长的播放流量时都会用到。
此外,本申请可以通过不同的数据源渠道获取待预测视频的视频信息,不同数据源渠道获得的数据可以进行弥补和校验,用于校正数据的准确性和数据补全。如图2所示,S110可以包括:
S111,利用网络爬虫爬取待预测视频的数据资源。
利用网络爬虫从网站爬取与该待预测视频相关的数据。
S112,获取待预测视频的企业内部数据资源。
例如,若待预测视频是影视剧,则待预测视频对应的企业可以是制片公司、发行公司等。可以从此类企业获得与该待预测视频的企业内部数据资源。
S113,依据爬取的数据资源及企业内部数据资源进行弥补和校验。
来自不同数据源渠道的数据资源所具有的特征可能不同,例如,从企业内部获得的数据资源所表征的含义或特征可能包括网络爬取的数据资源所不具备的特征。同理,网络爬取的数据资源所表征的含义或特征可能包含企业内部数据资源所不具备的特征。两类数据资源中具有相似含义的信息可以对照使用。
S114,确定弥补和校验后的数据资源为所述待预测视频的视频信息。
将相互弥补和校验后的数据资源确定为该待预测视频的视频信息。
S120,从视频信息中提取关键特征。
将待预测视频的视频信息转换为机器学习模型的输入特征,例如,可以包括将字符串类特征和类别型特征转换为数值型特征,并聚合和转换数值型特征。
1、静态信息
i)播放待预测视频的视频网站;其为类别型数据,视频网站可以预先定义;例如,预先定义的视频网站为a~d四个,如果待预测视频A的播放网站包括a和b,则视频网站a和b对于A赋值为1,其余c和d为0;
ii)待预测视频的制作公司;其为类别型数据,制作公司可以预先定义,例如,预先定义的制作公司为a~d四个,如果待预测视频A的制作公司包括a和b,则制作公司a和b对于A赋值为1,其余c和d为0;
iii)待预测视频的开播时间;例如,开播月份、年份和首集在网站上线的具体时间;
iv)待预测视频中涉及到的影人(例如,影视剧中的导演,演员,编剧,制作人等)的影响力;例如,具体可以为相关影人在某个时间段内(例如播放半年内或者播出前几天)的网络指数的平均值,中位值,最大值,和每日数值等;
v)待预测视频本身(例如,影视剧的正式名称,别名等)的影响力;具体可以为相关剧名等在某个时间段内(例如播放前半年内或者播放前几天)的网络指数的平均值,中位值,最大值,和每日数值等;
vi)如果待预测视频是系列作品,本系列作品的影响力;具体可以为系列作品在某个时间段内(例如播放前半年内)的网络指数的平均值,中位值,最大值等;
网络指数是指待预测视频的名称的网络搜索指数,其中,网络搜索指数包括搜索引擎网站的搜索指数(例如,百度搜索指数)、社交媒体网站的搜索指数(例如,微博搜索指数)、视频网站内搜索指数等;
vii)如果待预测视频由其他类型作品改编,被改编作品和作者的影响力;具体可以为系列作品在某个时间段内(例如播放前半年内)的网络指数的平均值,中位值,最大值等;
viii)待预测视频中涉及到的影人(包括影视剧中的导演,演员,编剧,制作人等)的视频流量相关指标,具体为相关影人在某个时间段内,例如播放前半年内的所涉及到的其他视频的流量相关指标的平均值,中位值,最大值等;
其中,上述静态信息是待预测视频开播前就能够确定的信息,其只在预测开播日当天的播放流量时使用。
在本申请的一个实施例中,对于静态信息中的非正态分布数据(例如,与网络指数相关的特征,即vi~viii所涉及的数据)映射成正态分布数据;然后,对静态信息所包含的全部正态分布数据(包括i~v对应的正态分布数据,以及vi~viii映射转换得到的正态分布数据)进行归一化变换得到时间序列预测模型的输入特征;
在本申请的一个实施例中,对于网络指数相关的数据做log变换,log变换后使得非正态分布数据分布更均衡更接近正态分布,从而有利于模型优化。
其它数据(例如,类别性数据)通常是0或1的特征,对此类特征做log变换后其分布特征、数值和范围均不会改变,因此,不需要对于此类数据做log变换。
在本申请的一个实施例中,归一化变换可以采用最大最小归一化变换,即将原始数据线性化地转换到[0,1]范围内,最大最小归一化公式为:
x*=(x-xmin)/(xmax-xmin);
其中,xmax为样本数据的最大值,xmin为样本数据的最小值,x为待归一化的样本数据,x*为归一化后的样本数据。
2、动态信息
i)被预测时间(比如预测时间之后的1~5天)所在预测时间步长对应的时间段将要播放视频的集数;其中,预测时间步长是相邻两次预测之间的间隔时间,例如,预测时间步长是一天,或者,小于一天,或者,大于一天。
ii)被预测时间所在预测时间步长对应的时间段内整个剧集是否播放完结,例如,预测时间步长是一天,则该项信息为被预测时间当天整个剧集是否播放完结;
iii)被预测时间与上次剧集更新之间间隔的预测时间步长数量;
iv)被预测时间是否为周末或者节假日;
v)待预测视频开播日到被预测时间的前一个预测时间步长,每个预测时间步长对应的真实播放流量数值;(例如,预测时间步长是一天,剧集开播日是1月1日,被预测时间是1月10日,则获取从1月1日到1月9日每一天对应的真实流量数值)
vi)待预测视频开播日前N日(比如1~5天)到被预测时间前一天每天的网络指数。(例如,开播日是1月5日,N=5,被预测时间为1月7日,则统计从1月1日到1月6日每日的网络指数)。
其中,上述动态信息是待预测视频播放前到播出中逐渐获得的信息,且随被预测时间的不同而变化,在每一天的播放流量预测过程中都会使用到。
在本申请的一个实施例中,对于动态信息中的非正态分布数据(例如,与网络指数相关的特征,即vi涉及的数据)映射成正态分布数据;然后,对动态信息所包含的全部正态分布数据(包括i~v对应的正态分布数据,以及vi映射转换得到的正态分布数据)进行归一化变换,最终得到输入至时间序列预测模型的动态关键特征。
归一化变换过程与静态信息的归一化变换相同,此处不再赘述。
在本实施例中,特征转换过程(例如,log变换和归一化变换)在输入至时间序列预测模型之前完成,即该步骤得到的特征输入至时间序列预测模型中。
在本申请的另一个实施例中,特征转换过程集成在时间序列预测模型内部,即,直接将静态关键信息及动态关键信息对应的数值型数据输入至时间序列预测模型中,时间序列预测模型对数值型数据进行特征转换。
S130,将关键特征输入至时间序列预测模型,得到待预测视频在被预测时间对应的播放流量。
其中,该被预测时间是开播日后的任意一个预测时间步长,该预测时间早于对应的被预测时间,例如,预测时间为1月1日,预测时间比被预测时间早5天,则被预测时间为1月6日。
所述时间序列预测模型利用已播出视频的视频信息训练得到。其中,已播出视频是指在获得预测模型之前已经播放完结的视频;视频信息包括上述静态信息和动态信息。
如图3所示,示出了时间序列预测模型的原理框图,该时间序列预测模型包括多个预测模块(即,图3中的Day1~DayX),每个预测模块用于预测待预测视频在某个预测时间步长的播放流量。
本实施例中,时间序列预测模型采用基于长期短期记忆网络(Long Short-TermMemory,LSTM)的时间序列预测模型,其中LSTM是一种时间递归神经网络,适合处理和预测时间序列中间隔、延迟相对较长的场景。
其中,预测模块的数量由设定的需要预测的预测时间步长数量确定,例如,预测时间步长是一天,且需要预测开播日及以后3天的播放流量,则只需要四个预测模块进行预测每一日的播放流量。
例如,Day1模块用于预测待预测视频在开播日当天的播放流量,Day2模块用于预测待预测视频在开播日后的第1天当天的播放流量,依次类推DayX模块用于预测待预测视频在开播日后的第X-1天当天的播放流量。若开播日是1月1日,则Day1模块预测得到待预测视频在1月1日的播放流量,Day2模块预测得到待预测视频在1月2日的播放流量,依次类推,DayX模块预测得到待预测视频在开播日后的第X-1天。
对于时间序列预测模型中的Day1模块,输入的特征包括静态关键特征和动态关键特征;而且,静态关键特征只在Day1模块中使用,其它模块只使用预测日当日获得的动态关键特征。
输入至Day1模块中的静态关键特征经过第一全连接模块进行处理,动态关键特征经过第二全连接模块进行处理;第一全连接模块和第二全连接模块的输出经过元素相加模块进行元素级别的加和处理;该元素相加模块的输出输入至LSTM模块,LSTM模块的输出连接第三全连接模块后输出对应的播放流量预测值。
长期短期记忆网络(即LSTM网络)是使用反向传播时间训练并克服消失梯度问题的递归神经网络。
当然,在本申请的其它实施例中,还可以采用其它时间序列预测模型,本申请对此并不限定。
本申请实施例中,全连接模块即神经网络中的全连接层,其作用是维度变换,尤其是能够将高维特征变换为低维特征,同时将有用信息保留下来,有利于模型优化。
对于时间序列预测模型中的其它模块,动态关键特征经过一个全连接模块处理后的结果输入至LSTM模块;LSTM模块的输出经过另一个全连接模块进行处理后,得到对应的播放流量预测值。
在本申请的一个实施例中,与LSTM模块的输入连接的全连接模块所涉及激活函数的作用是将该全连接模块的输出归一化到某个数值范围之内。例如,该激活函数可以是tanh函数,该tanh函数使该模块的输出限定在(-1,1)之间。当然,在其它实施例中还可以采用其它激活函数,例如,sigmoid,softsign等函数,确保全连接模块的输出归一化某个数值范围之内。
在本申请的一个实施例中,与LSTM模块的输出连接的全连接模块所涉及激活函数为线性整流函数,例如,ReLU函数;当然,在其它实施例中还可以采用其它的线性整流函数,例如,softplus函数等。
另一方面,时间序列预测模型中,对于不同预测模块(Dayi对应的预测模块),动态关键特征中的部分特征可能不同,需要根据预测时间获得的动态信息确定。
此外,如果预测时间比被预测时间早2天或者以上时,动态关键特征中的部分特征在预测时间可能获取不到,例如,每个预测时间步长对应的真实播放流量数值,可以采用上一个预测模块的播放流量预测值;如,当前预测时间是1月2日,对应的被预测时间是1月6日,开播日是1月5日,此种情况下,1月2日获取不到1月5日的真实播放流量,可以用1月1日预测的1月5日对应的播放流量来代替。
本实施例提供的视频播放流量预测方法,获取待预测视频在预测时间对应的视频信息,该视频信息包括与待预测视频的播放流量相关的信息。然后,从该视频信息中提取关键特征,并将该关键特征输入至时间序列预测模型中,得到该待预测视频在被预测时间对应的播放流量;被预测时间是从开播后的任意一个预测时间步长,预测时间早于被预测时间。可见,该方法利用时间序列预测模型能够提前几天预测待预测视频在开播日及开播后每一个预测时间步长对应的播放流量。从而为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。
请参见图4,示出了本申请实施例另一种视频播放流量预测方法的流程图,本实施例将着重介绍训练时间序列预测模型的过程,时间序列模型如图3所示。
如图4所示,该方法可以包括以下步骤:
S210,从训练样本数据集中提取关键信息。
训练样本数据集是大量已播出视频的视频信息,该视频信息包括已播出视频的播放流量相关联的信息,以及,已播出视频在每个预测时间步长内的播放流量真实值。
已播出视频是指截止预测时间已经播放了一段时间或已经播放完结的视频,例如,预测时间是1月1日,视频A的开播日是12月1日,截止1月1日,该视频A已经播放了1个月。
S220,从训练样本数据集的关键信息中获取关键特征。
提取关键特征的过程与上述方法实施例的关键特征提取过程相同,此处不再赘述。
S230,将训练样本数据集包含的关键特征输入至时间序列模型中,得到播放流量预测值。
时间序列模型的目标函数是
Figure BDA0001900410500000131
其中,yi为时间序列中预测时间之后每一个预测时间步长对应的真实播放流量值,例如,视频剧集A在开播后一个月内的每日播放数;n是训练集中示例的个数,例如,一个视频剧集是一个示例;
L是正则项,可以为L=α*∑||w||,或者,L=α*∑||w||2,其中α是预先设定的参数,||w||是模型中所有待优化的参数的绝对值。
将训练样本数据集中的关键特征代入上述目标函数进行计算得到对应与训练样本数据集中的示例相对应的播放流量预测值。
S240,计算该播放流量预测值与对应的播放流量真实值之间的误差值。
然后,计算训练样本数据集中同一示例对应的播放流量预测值与播放流量真实值之间的误差值,其中,播放流量真实值是训练样本数据集中已有的数据。
S250,判断误差值是否小于误差阈值,若否,则执行S260;若是,则执行S270;
然后,判断S240步骤得到的误差值是否小于对应的误差阈值,该误差阈值可以根据实际需求设定。如果误差值不小于误差阈值,则认为当前时间序列模型不符合优化要求需要调整模型内部的参数;如果误差值小于误差阈值,则认为当前时间序列模型符合优化要求。
S260,调整时间序列模型中的待优化参数,并返回执行S230。
如果确定误差值不小于误差阈值,则调整时间序列模型中的可调参数(即,上述目标函数中的||w||),得到更新后的时间序列模型(即时间序列模型对应的变更后的目标函数)。并返回执行S230~S250,将训练样本数据集中的关键特征输入至变更后的目标函数中,重新计算得到播放流量预测值,以及误差值,直到得到的误差值小于误差阈值时结束。
反复调整时间序列模型中的待优化参数直到误差值小于误差阈值,得到最终的时间序列预测模型。
S270,确定得到该误差值的时间序列模型为用于预测待预测视频的播放流量的时间序列预测模型。
当误差值小于误差阈值时,确定得到该误差值的时间序列模型为最终用于预测待预测视频的预测模型。后续可以直接利用该预测模型预测未播放视频的播放流量。
本实施例提供的视频播放流量预测方法,利用时间序列预测模型能够提前N天预测开播后每一天对应的待预测视频的播放流量。为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。
相应于上述的视频播放流量预测方法实施例,本申请还提供了视频播放流量预测装置实施例。
请参见图5,示出了本申请实施例一种视频播放流量预测装置的框图,该装置可以应用于终端或服务器中。如图5所示,该装置可以包括:第一获取模块110、特征提取模块120和预测模块130。
第一获取模块110,用于获取待预测视频在预测时间对应的视频信息。
待预测视频是截止预测时间没有在任何平台或媒介上播出的视频,例如,未上映的影视剧。
例如,在1月1日预测某个待预测视频在1月10播放时对应的播放流量,则1月1日为预测时间,1月10日为被预测时间。
视频信息包括与待预测视频的播放流量相关联的信息;其中,视频信息可以包括静态信息和动态信息;静态信息是视频开播前能够确定的信息,静态信息可以包括视频本身涉及的信息,例如,播放网站、制作公司、开播时间、涉及到的人的影响力、视频本身的影响力等;动态信息是视频播放前到播放后逐渐获得的信息,而且,动态信息随被预测时间的不同而变化,例如,动态信息可以包括视频在被预测时间对应时间段内将要播放的集数、被预测时间与上次剧集更新的间隔时间、待预测视频从开播日到被预测时间前一天每天的真实流量相关数值。
特征提取模块120,用于从视频信息中提取关键特征。
将待预测视频的视频信息转换为机器学习模型的输入特征,例如,可以包括将字符串类特征和类别型特征转换为数值型特征,并聚合和转换数值型特征。
在本申请的一个实施例中,该特征提取模块包括:关键信息提取子模块、关键信息转换子模块、第一归一化变换子模块和第二归一化变换子模块;
该关键信息提取子模块,用于从视频信息中提取静态关键信息和动态关键信息。
关键信息转换子模块,用于将所述静态关键信息和所述动态关键信息转换为数值型数据。
第一归一化变换子模块,用于对所述静态关键信息的数值型数据归一化变换得到静态关键特征;
该第一归一化变换子模块具体用于:将静态关键信息中的非正态分布数据映射为正态分布数据;对静态关键信息中的全部正态分布数据进行归一化变换得到静态关键特征。
第二归一化变换子模块,用于对动态关键信息的数值型数据归一化变换得到动态关键特征。
该第二归一化变换子模块具体用于:将动态关键信息中的非正态分布数据映射正态分布数据;对动态关键信息中的全部正态分布数据进行归一化变换得到动态关键特征。
预测模块130,用于将所述关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量。
其中,该被预测时间是开播后的任意一个预测时间步长,且预测时间早于对应的被预测时间,所述时间序列预测模型利用已播出视频的视频信息对事件序列模型进行训练得到。
对于被预测时间是待预测视频的开播日的场景,依据在预测时间获得的待预测视频的静态关键特征和动态关键特征,利用预先训练的预测模型参数,预测得到待预测视频在开播日的播放流量。
对于被预测时间是开播日以后的时间的场景,依据在预测时间获得的待预测视频的动态关键特征,利用预先训练的预测模型参数,预测得到待预测视频在被预测时间的播放流量。
本实施例提供的视频播放流量预测装置,获取待预测视频在预测时间对应的视频信息,该视频信息包括与待预测视频的播放流量相关的信息。然后,从该视频信息中提取关键特征,并将该关键特征输入至时间序列预测模型中,得到该待预测视频在被预测时间对应的播放流量;被预测时间是从开播后的任意一个预测时间步长,预测时间早于被预测时间。可见,该方法利用时间序列预测模型能够提前几天预测待预测视频在开播日及开播后每一个预测时间步长对应的播放流量。从而为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。
请参见图6,示出了本申请实施例另一种视频播放流量预测装置的框图,本实施例着重介绍训练得到事件序列预测模型的过程,如图6所示,该装置图5所示实施例的基础上还包括:第二获取模块210、第三获取模块220、误差计算模块230、判断模块240和预测模型确定模块250。
第二获取模块210,用于获取训练样本数据集中的关键信息。
该训练样本数据集包括已播出视频的相关信息,关键信息包括该已播出视频的视频信息及该已播出视频播出后每个预测时间步长对应的播放流量真实值。
第三获取模块220,用于从训练样本数据集中的关键信息中获取关键特征。
此处获取关键特征的过程与S120的提取过程相同,此处不再赘述。
误差计算模块230,用于将训练样本数据集包含的关键特征输入至时间序列模型中,得到播放流量预测值,并计算该播放流量预测值与对应的播放流量真实值之间的误差值。
将训练样本数据集中的关键特征代入上述目标函数进行计算得到对应与训练样本数据集中的示例相对应的播放流量预测值。然后,计算训练样本数据集中同一示例对应的播放流量预测值与播放流量真实值之间的误差值,其中,播放流量真实值是训练样本数据集中已有的数据。
判断模块240,用于判断所述误差值是否小于误差阈值,若否,则反复调整所述时间序列模型中的参数,直到利用反复调整后的时间序列模型得到误差值小于误差阈值。
如果误差值不小于误差阈值,则调整时间序列模型中的参数,反复调整时间序列模型中的待优化参数直到误差值小于误差阈值,得到最终的时间序列预测模型。
预测模型确定模块250,用于当所述误差值小于所述误差阈值时,确定得到该误差值的时间序列模型为用于预测待预测视频的播放流量的时间序列预测模型。
当误差值小于误差阈值时,确定得到该误差值的时间序列模型为最终用于预测待预测视频的预测模型。后续可以直接利用该预测模型预测未播放视频的播放流量。
本实施例提供的视频播放流量预测装置,利用时间序列预测模型能够提前N天预测开播后每一天对应的待预测视频的播放流量。为节目播放决策、运营、推送、内容分发网络带宽节省等相关方面提供数据支持。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请各实施例中的装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种视频播放流量预测方法,其特征在于,包括:
获取待预测视频在预测时间对应的视频信息,所述视频信息包括与所述待预测视频的播放流量相关联的信息;
从所述视频信息中提取关键特征;
将所述关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量,其中,该被预测时间是开播后的任意一个预测时间步长,且预测时间早于对应的被预测时间,所述时间序列预测模型利用已播出视频的视频信息对时间序列模型进行训练得到;
其中,所述视频信息包括静态关键信息和动态关键信息,所述静态关键信息是所述待预测视频开播前已确定的信息,用于预测开播日的播放流量;所述动态关键信息是所述待预测视频播放前到播出中逐渐获得的信息且随被预测时间的不同而变化的信息,用于预测所述待预测视频每个被预测时间对应的播放流量。
2.根据权利要求1所述的方法,其特征在于,从所述视频信息中提取关键特征,包括:
将所述静态关键信息和所述动态关键信息转换为数值型数据;
对所述静态关键信息的数值型数据归一化变换得到静态关键特征;
对所述动态关键信息的数值型数据归一化变换得到动态关键特征。
3.根据权利要求2所述的方法,其特征在于,对所述静态关键信息的数值型数据归一化变换得到静态关键特征,包括:
将所述静态关键信息中的非正态分布数据映射为正态分布数据;
对所述静态关键信息中的全部正态分布数据进行归一化变换得到静态关键特征;
对所述动态关键信息的数值型数据归一化变换得到动态关键特征,包括:
将所述动态关键信息中的非正态分布数据映射正态分布数据;
对所述动态关键信息中的全部正态分布数据进行归一化变换得到动态关键特征。
4.根据权利要求2或3所述的方法,其特征在于,所述将所述关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量,包括:
依据在所述预测时间获得的所述待预测视频的静态关键特征和动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在开播日的播放流量;
依据在所述预测时间获得的所述待预测视频的动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在被预测时间的播放流量。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取训练样本数据集中的关键信息,所述训练样本数据集包括已播出视频的信息,所述关键信息包括该已播出视频的视频信息及该已播出视频播出后每个预测时间步长对应的播放流量真实值;
从所述训练样本数据集中的关键信息中获取关键特征;
将所述训练样本数据集包含的关键特征输入至时间序列模型中,得到播放流量预测值,并计算该播放流量预测值与对应的播放流量真实值之间的误差值;
判断所述误差值是否小于误差阈值,若否,则反复调整所述时间序列模型中的参数,直到利用反复调整后的时间序列模型得到误差值小于所述误差阈值;
如果所述误差值小于所述误差阈值,则确定得到该误差值的时间序列模型为用于预测待预测视频的播放流量的时间序列预测模型。
6.一种视频播放流量预测装置,其特征在于,包括:
第一获取模块,用于获取待预测视频在预测时间对应的视频信息,所述视频信息包括与所述待预测视频的播放流量相关联的信息;
特征提取模块,用于从所述视频信息中提取关键特征;
预测模块,用于将所述关键特征输入至时间序列预测模型,得到所述待预测视频在被预测时间对应的播放流量,其中,该被预测时间是开播后的任意一个预测时间步长,且预测时间早于对应的被预测时间,所述时间序列预测模型利用已播出视频的视频信息对事件序列模型进行训练得到;
其中,所述视频信息包括静态关键信息和动态关键信息,所述静态关键信息是所述待预测视频开播前已确定的信息,用于预测开播日的播放流量;所述动态关键信息是所述待预测视频播放前到播出中逐渐获得的信息且随被预测时间的不同而变化的信息,用于预测所述待预测视频每个被预测时间对应的播放流量。
7.根据权利要求6所述的装置,其特征在于,所述特征提取模块包括:
关键信息转换子模块,用于将所述静态关键信息和所述动态关键信息转换为数值型数据;
第一归一化变换子模块,用于对所述静态关键信息的数值型数据归一化变换得到静态关键特征;
第二归一化变换子模块,用于对所述动态关键信息的数值型数据归一化变换得到动态关键特征。
8.根据权利要求7所述的装置,其特征在于,所述第一归一化变换子模块具体用于:将所述静态关键信息中的非正态分布数据映射为正态分布数据;对所述静态关键信息中的全部正态分布数据进行归一化变换得到静态关键特征;
所述第二归一化变换子模块具体用于:将所述动态关键信息中的非正态分布数据映射正态分布数据;对所述动态关键信息中的全部正态分布数据进行归一化变换得到动态关键特征。
9.根据权利要求7或8所述的装置,其特征在于,所述预测模块具体用于:
依据在所述预测时间获得的所述待预测视频的静态关键特征和动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在开播日的播放流量;
依据在所述预测时间获得的所述待预测视频的动态关键特征,利用预先训练的预测模型参数,预测得到所述待预测视频在被预测时间的播放流量。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取训练样本数据集中的关键信息,所述训练样本数据集包括已播出视频的信息,所述关键信息包括该已播出视频的视频信息及该已播出视频播出后每个预测时间步长对应的播放流量真实值;
第三获取模块,用于从所述训练样本数据集中的关键信息中获取关键特征;
误差计算模块,用于将所述训练样本数据集包含的关键特征输入至所述时间序列模型中,得到播放流量预测值,并计算该播放流量预测值与对应的播放流量真实值之间的误差值;
判断模块,用于判断所述误差值是否小于误差阈值,若否,则反复调整所述时间序列模型中的参数,直到利用反复调整后的时间序列模型得到误差值小于所述误差阈值;
预测模型确定模块,用于当所述误差值小于所述误差阈值时,确定得到该误差值的时间序列模型为用于预测待预测视频的播放流量的时间序列预测模型。
CN201811509795.3A 2018-12-11 2018-12-11 一种视频播放流量预测方法及装置 Active CN109587515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811509795.3A CN109587515B (zh) 2018-12-11 2018-12-11 一种视频播放流量预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811509795.3A CN109587515B (zh) 2018-12-11 2018-12-11 一种视频播放流量预测方法及装置

Publications (2)

Publication Number Publication Date
CN109587515A CN109587515A (zh) 2019-04-05
CN109587515B true CN109587515B (zh) 2021-10-12

Family

ID=65929579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811509795.3A Active CN109587515B (zh) 2018-12-11 2018-12-11 一种视频播放流量预测方法及装置

Country Status (1)

Country Link
CN (1) CN109587515B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110225407B (zh) * 2019-04-23 2021-09-03 北京奇艺世纪科技有限公司 一种播放数据的获取方法和装置及计算机可读存储介质
CN110149238B (zh) * 2019-06-18 2022-10-28 北京百度网讯科技有限公司 用于预测流量的方法和装置
CN110933492B (zh) * 2019-12-10 2022-03-04 北京爱奇艺科技有限公司 一种播放时长预测方法及装置
CN111062527B (zh) * 2019-12-10 2023-12-05 北京爱奇艺科技有限公司 一种视频集流量预测方法及装置
CN116709569B (zh) * 2023-08-02 2023-12-12 南京朗立微集成电路有限公司 一种基于视频预测的Wi-Fi QoS保障方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1408691A2 (en) * 2002-09-10 2004-04-14 Canon Kabushiki Kaisha Receiving apparatus, receiving method, and method of predicting audience rating
WO2016077127A1 (en) * 2014-11-11 2016-05-19 Massachusetts Institute Of Technology A distributed, multi-model, self-learning platform for machine learning
CN107547154A (zh) * 2016-06-23 2018-01-05 华为技术有限公司 一种建立视频流量预测模型的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914475B (zh) * 2013-01-05 2018-05-04 腾讯科技(北京)有限公司 一种视频播放量的预测方法、系统和装置
US20140259037A1 (en) * 2013-03-07 2014-09-11 Rawllin International Inc. Predicted video content aggregation
CN103914743B (zh) * 2014-04-21 2017-01-25 中国科学技术大学先进技术研究院 一种基于自回归模型的在线连载内容流行度预测方法
CN104902293B (zh) * 2015-06-08 2017-11-17 福州大学 数字电视收视率统计管理系统的实现方法
CN105635762B (zh) * 2016-01-15 2018-11-27 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
US11074595B2 (en) * 2017-01-23 2021-07-27 Adobe Inc. Predicting brand personality using textual content
CN107241623B (zh) * 2017-05-26 2019-08-02 中国传媒大学 广播电视用户收视行为预测方法及系统
CN108898415A (zh) * 2018-05-29 2018-11-27 北京奇艺世纪科技有限公司 一种视频剧集的流量相关指标预测方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1408691A2 (en) * 2002-09-10 2004-04-14 Canon Kabushiki Kaisha Receiving apparatus, receiving method, and method of predicting audience rating
WO2016077127A1 (en) * 2014-11-11 2016-05-19 Massachusetts Institute Of Technology A distributed, multi-model, self-learning platform for machine learning
CN107547154A (zh) * 2016-06-23 2018-01-05 华为技术有限公司 一种建立视频流量预测模型的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于SARIMA模型的视频播放量预测软件设计与实现";刘艳;《中国优秀硕士学位论文全文数据库》;20130731;全文 *

Also Published As

Publication number Publication date
CN109587515A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109587515B (zh) 一种视频播放流量预测方法及装置
US11416536B2 (en) Content recommendation system
US10191949B2 (en) Recommendation system using a transformed similarity matrix
CN110430471B (zh) 一种基于瞬时计算的电视推荐方法和系统
JP6494777B2 (ja) 端末にプッシュされるデータコンテンツを選択するための方法およびデバイス
CN108875022B (zh) 一种视频推荐方法及装置
US9674579B1 (en) Rating videos based on parental feedback
US20110145040A1 (en) Content recommendation
CN105144141A (zh) 用于使用距离关联性散列法对媒体数据库定址的系统和方法
CN108521586B (zh) 兼顾时间上下文与隐式反馈的iptv电视节目个性化推荐方法
Chang et al. Predicting the popularity of online serials with autoregressive models
US9672534B2 (en) Preparing content packages
CN108462888A (zh) 用户电视及上网行为的智能关联分析方法及系统
Scaglione et al. The diffusion of mobile social networking: Exploring adoption externalities in four G7 countries
CN111062527B (zh) 一种视频集流量预测方法及装置
US20160012454A1 (en) Database systems for measuring impact on the internet
Altman et al. Measuring audience retention in YouTube
US20140095413A1 (en) Associating a Web Session with a Household Member
CN109151521B (zh) 一种用户原创值获取方法、装置、服务器及存储介质
CN106204103B (zh) 一种移动广告平台寻找相似用户的方法
Flensburg et al. Networks of power. Analysing the evolution of the Danish internet infrastructure
CN110121088B (zh) 一种用户属性信息确定方法、装置及电子设备
Liu Music trend prediction based on improved LSTM and random forest algorithm
US11470370B2 (en) Crowdsourcing platform for on-demand media content creation and sharing
Halim et al. The impact of motivation to watch youtube, subjective norms, behavior control, information success model to watching youtube engagement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant