CN108600836B - 一种视频处理方法及装置 - Google Patents
一种视频处理方法及装置 Download PDFInfo
- Publication number
- CN108600836B CN108600836B CN201810292062.2A CN201810292062A CN108600836B CN 108600836 B CN108600836 B CN 108600836B CN 201810292062 A CN201810292062 A CN 201810292062A CN 108600836 B CN108600836 B CN 108600836B
- Authority
- CN
- China
- Prior art keywords
- video
- time period
- watched
- sample
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44204—Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
- H04N21/23106—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion involving caching operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/262—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
- H04N21/26208—Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
Abstract
本发明实施例提供了一种视频处理方法及装置。在本发明实施例中,对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值;根据该视频在每一个第一时间段对应的被观看次数、该视频在每一个第一时间段对应的比值以及预设视频流行度预测模型,可以准确地确定出该视频的流行度,进而使得视频服务器可以根据流行度来确定是否需要向缓存服务器推送该视频。
Description
技术领域
本发明涉及视频技术领域,特别是涉及一种视频处理方法及装置。
背景技术
当前,观看视频成为广大用户的一种重要的娱乐方式,随着互联网技术的飞速发展,越来越多的用户选择观看视频服务器中的网络视频,
每当一个用户需要观看视频服务器中的某一网络视频时,视频服务器就需要向用户发送该网络视频。有时候,会有大量的用户在同一时段需要观看视频服务器中的网络视频,如此会急剧增加视频服务器的网络压力和系统压力,进而可能会导致视频服务器的网络崩溃或者视频服务器的系统崩溃。
因此,为了避免视频服务器的网络崩溃以及避免视频服务器的系统崩溃,通常会使用CDN(Content Delivery Network,内容分发网络)来为广大用户提供视频服务,CDN中除了包括视频服务器以外,还包括多个缓存服务器。
视频服务器可以将流行度较高的部分网络视频推送给缓存服务器,以使缓存服务器存储流行度较高的部分网络视频。之后,当用户需要观看该部分网络视频时,CDN可以将用户的观看视频的请求路由至缓存服务器,进而由缓存服务器向用户发送该部分网络视频,从而可以缓解视频服务器的网络压力和系统压力。
然而,如何确定视频的流行度是一个亟待解决的技术问题。
发明内容
为解决上述技术问题,本发明实施例示出了一种视频处理方法及装置。
第一方面,本发明实施例示出了一种视频处理方法,所述方法包括:
对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在所述第一时间段的被观看次数,获取所述被观看次数与所述视频在所述第一时间段结束时的历史被观看总次数之间的比值;
根据所述视频在每一个第一时间段对应的被观看次数、所述视频在每一个第一时间段对应的比值以及预设视频流行度预测模型确定所述视频的流行度。
在一个可选的实现方式中,所述预设视频流行度预测模型通过如下方式获得:
获取多个样本视频;
对于当前之前的多个第二时间段中的每一个第二时间段以及对于多个样本视频中的每一个样本视频,获取所述样本视频在所述第二时间段的被观看次数,获取所述被观看次数与所述样本视频在所述第二时间段结束时的历史被观看总次数之间的比值,第二时间段的数量大于第一时间段的数量;
根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度;
根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及每一个样本视频的流行度训练预设随机森林模型,得到所述预设视频流行度预测模型。
在一个可选的实现方式中,所述根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度,包括:
从多个样本视频中选择至少两个目标视频;
对于每一个剩余的样本视频和每一个目标视频,根据所述剩余的样本视频在每一个第二时间段对应的被观看次数和所述目标视频在每一个第二时间段对应的被观看次数,确定所述剩余的样本视频与所述目标视频之间的第一距离;
根据所述剩余的样本视频在每一个第二时间段对应的比值和所述目标视频在每一个第二时间段对应的比值,确定所述剩余的样本视频与所述目标视频之间的第二距离;
根据所述K-means算法,将每一个剩余的样本视频分别与每一个目标视频之间的第一距离、每一个剩余的样本视频分别与每一个目标视频之间的第二距离迭代,从而得到每一个样本视频的流行度。
在一个可选的实现方式中,所述方法还包括:
在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与所述目标视频在每一个第二时间段对应的被观看次数中的第二最高值是否相同;
如果不同,则根据所述第一最高值与所述第二最高值之间的比值调整所述目标视频在每一个第二时间段对应的被观看次数,或,根据所述第二最高值与所述第一最高值之间的比值调整所述剩余的样本视频在每一个第二时间段对应的被观看次数。
在一个可选的实现方式中,所述方法还包括:
在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段是否相同;
如果不同,则将所述剩余的样本视频在每一个第二时间段对应的被观看次数或所述目标视频在每一个第二时间段对应的被观看次数循环移位,以使所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段相同。
第二方面,本发明实施例示出了一种视频处理装置,所述装置包括:
第一获取模块,用于对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在所述第一时间段的被观看次数,获取所述被观看次数与所述视频在所述第一时间段结束时的历史被观看总次数之间的比值;
第一确定模块,用于根据所述视频在每一个第一时间段对应的被观看次数、所述视频在每一个第一时间段对应的比值以及预设视频流行度预测模型确定所述视频的流行度。
在一个可选的实现方式中,所述预设视频流行度预测模型通过如下方式获得:
第二获取模块,用于获取多个样本视频;
第三获取模块,用于对于当前之前的多个第二时间段中的每一个第二时间段以及对于多个样本视频中的每一个样本视频,获取所述样本视频在所述第二时间段的被观看次数,获取所述被观看次数与所述样本视频在所述第二时间段结束时的历史被观看总次数之间的比值,第二时间段的数量大于第一时间段的数量;
第二确定模块,用于根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度;
训练模块,用于根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及每一个样本视频的流行度训练预设随机森林模型,得到所述预设视频流行度预测模型。
在一个可选的实现方式中,所述第二确定模块包括:
选择单元,用于从多个样本视频中选择至少两个目标视频;
第一确定单元,用于对于每一个剩余的样本视频和每一个目标视频,根据所述剩余的样本视频在每一个第二时间段对应的被观看次数和所述目标视频在每一个第二时间段对应的被观看次数,确定所述剩余的样本视频与所述目标视频之间的第一距离;
第二确定单元,用于根据所述剩余的样本视频在每一个第二时间段对应的比值和所述目标视频在每一个第二时间段对应的比值,确定所述剩余的样本视频与所述目标视频之间的第二距离;
迭代单元,用于根据所述K-means算法,将每一个剩余的样本视频分别与每一个目标视频之间的第一距离、每一个剩余的样本视频分别与每一个目标视频之间的第二距离迭代,从而得到每一个样本视频的流行度。
在一个可选的实现方式中,所述装置还包括:
第三确定单元,用于在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与所述目标视频在每一个第二时间段对应的被观看次数中的第二最高值是否相同;
调整单元,用于如果不同,则根据所述第一最高值与所述第二最高值之间的比值调整所述目标视频在每一个第二时间段对应的被观看次数,或,根据所述第二最高值与所述第一最高值之间的比值调整所述剩余的样本视频在每一个第二时间段对应的被观看次数。
在一个可选的实现方式中,所述装置还包括:
第四确定单元,用于在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段是否相同;
移位单元,用于如果不同,则将所述剩余的样本视频在每一个第二时间段对应的被观看次数或所述目标视频在每一个第二时间段对应的被观看次数循环移位,以使所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段相同。
与现有技术相比,本发明实施例包括以下优点:
在本发明实施例中,对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值;根据该视频在每一个第一时间段对应的被观看次数、该视频在每一个第一时间段对应的比值以及预设视频流行度预测模型,可以准确地确定出该视频的流行度,进而使得视频服务器可以根据流行度来确定是否需要向缓存服务器推送该视频。
附图说明
图1是本发明的一种视频处理方法实施例的步骤流程图;
图2是本发明的一种视频处理装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种视频处理方法实施例的步骤流程图,具体可以包括如下步骤:
在步骤S101中,对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值;
在本发明实施例中,第一时间段的持续时长可以为1小时、6小时、24小时或者48小时等等,不同的第一时间段不重合。
对于某一视频,当视频服务器确定是否需要向缓存服务器预先推送该视频时,视频服务器首先需要确定该视频的流行度,如果该视频的流行度较高,则说明该视频之后被观看的次数往往较高,为了缓解视频服务器的系统压力以及降低视频服务器的网络压力,可以向缓存服务器推送该视频,以使缓存服务器缓存该视频。然而,如果该视频的流行度较低,则说明该视频之后被观看的次数较低,向缓存服务器推送该视频也几乎无法缓解视频服务器的系统压力和网络压力,进而无需向缓存服务器推送该视频。
其中,在确定该视频的流行度时,首先需要确定当前之前的多个第一时间段,然后对于任一第一时间段,获取该视频在第一时间段的被观看次数,并获取该被观看次数与该视频在第一时间段结束时的历史被观看总次数之间的比值,对于其他每一第一时间段,同样执行上述操作。然后执行步骤S102。
在一个可选的实现方式中,对于当前之前的多个第一时间段中的任意一个第一时间段,在该第一时间段开始之后,当该视频被第一次观看时,则设置该视频在该第一时间段的被观看次数为1,之后每当该视频在该第一时间段被观看一次,则增加该视频在该第一时间段的被观看次数,在该第一时间段结束时,将当前记录的该视频的被观看次数作为该视频在该第一时间段的被观看次数,然后将该视频的视频标识、该第一时间段与该被观看次数组成对应表项,并存储在已存储的视频标识、时间段与被观看次数三者之间的对应关系中。对于当前之前的多个第一时间段中的其他每一第一时间段,同样执行上述操作。
因此,在本步骤中,当需要获取该视频在某一第一时间段的被观看次数时,可以在已存储的视频标识、时间段与被观看次数三者之间的对应关系中,查找与该视频的视频标识和该第一时间段相对应的被观看次数,并作为该视频在该第一时间段的被观看次数。
在另一个可选的实现方式中,对于当前之前的多个第一时间段中的任意一个第一时间段,在得到该视频在该第一时间段的被观看次数之后,可以统计该视频在该第一时间段的结束时刻之前的所有第一时间段的被观看次数的总和,并作为该视频在第一时间段结束时的历史被观看总次数,然后计算该视频在该第一时间段的被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值,再将该视频的视频标识、该第一时间段、该比值组成对应表项,并存储在已存储的视频标识、时间段与比值三者之间的对应关系中。对于当前之前的多个第一时间段中的其他每一第一时间段,同样执行上述操作。
因此,在本步骤中,当需要获取该被观看次数与该视频在某一第一时间段结束时的历史被观看总次数之间的比值时,可以在已存储的视频标识、时间段与比值三者之间的对应关系中,查找与该视频的视频标识和该第一时间段相对应的比值,并作为该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值。
在步骤S102中,根据该视频在每一个第一时间段对应的被观看次数、该视频在每一个第一时间段对应的比值以及预设视频流行度预测模型确定该视频的流行度。
为了在该视频在每一个第一时间段对应的被观看次数以及该视频在每一个第一时间段对应的比值之后,能够得到该视频的流行度。在本发明实施例中,事先需要训练出预设视频流行度预测模型。
其中,预设视频流行度预测模型通过如下方式获得:
11)、获取多个样本视频;
12)、对于当前之前的多个第二时间段中的每一个第二时间段以及对于多个样本视频中的每一个样本视频,获取该样本视频在该第二时间段的被观看次数,获取该被观看次数与该样本视频在该第二时间段结束时的历史被观看总次数之间的比值,其中,第二时间段的数量大于第一时间段的数量;
在本步骤中,可以事先获取多个样本视频,以及确定多个第二时间段,多个第二时间段为在训练预设视频流行度预测模型之前的时间段,不同的第二时间段不重合。第二时间段的持续时长与第一时间段的持续时长可以相同,确定的第二时间段的数量大于第一时间段的数量,例如,确定的第二时间段的数量可以数倍于第一时间段的数量,例如,第二时间段的数量为30个,而第一时间段的数量为7个。
其中,获取该样本视频在该第二时间段的被观看次数,获取该被观看次数与该样本视频在该第二时间段结束时的历史被观看总次数之间的比值的过程,可以参考在步骤S101中的获取视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值的过程,在此不做详述。
13)、根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度;
其中,可以从多个样本视频中选择至少两个目标视频;对于每一个剩余的样本视频和每一个目标视频,根据该剩余的样本视频在每一个第二时间段对应的被观看次数和该目标视频在每一个第二时间段对应的被观看次数,确定该剩余的样本视频与该目标视频之间的第一距离;其中,剩余的样本视频包括多个样本视频中除目标视频以外的视频。然后根据该剩余的样本视频在每一个第二时间段对应的比值和该目标视频在每一个第二时间段对应的比值,确定该剩余的样本视频与该目标视频之间的第二距离;再根据K-means算法,将每一个剩余的样本视频分别与每一个目标视频之间的第一距离、每一个剩余的样本视频分别与每一个目标视频之间的第二距离迭代,从而得到每一个样本视频的流行度。
其中,在确定该剩余的样本视频与该目标视频之间的第一距离时,可以将该剩余的样本视频在每一个第二时间段对应的被观看次数按照时间段的先后顺序组成第一向量,并将该目标视频在每一个第二时间段对应的被观看次数按照时间段的先后顺序组成第二向量,然后计算第一向量与第二向量之间的欧氏距离,并作为该剩余的样本视频与该目标视频之间的第一距离。
在一个可选的实现方式中,在确定该剩余的样本视频与该目标视频之间的第一距离之前,可以确定该剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与该目标视频在每一个第二时间段对应的被观看次数中的第二最高值是否相同;
如果该剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与该目标视频在每一个第二时间段对应的被观看次数中的第二最高值不同,则可以根据第一最高值与第二最高值之间的比值调整该目标视频在每一个第二时间段对应的被观看次数,或,根据第二最高值与第一最高值之间的比值调整该剩余的样本视频在每一个第二时间段对应的被观看次数,从而使得该剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与该目标视频在每一个第二时间段对应的被观看次数中的第二最高值相同。
其中,在确定该剩余的样本视频与该目标视频之间的第二距离时,可以将该剩余的样本视频在每一个第二时间段对应的比值按照时间段的先后顺序组成第三向量,并将该目标视频在每一个第二时间段对应的比值按照时间段的先后顺序组成第四向量,然后计算第三向量与第四向量之间的欧氏距离,并作为该剩余的样本视频与该目标视频之间的第二距离。
在另一个可选的实现方式中,在确定该剩余的样本视频与该目标视频之间的第一距离之前,可以确定该剩余的样本视频的被观看次数最高的第二时间段与该目标视频的被观看次数最高的第二时间段是否相同;
如果该剩余的样本视频的被观看次数最高的第二时间段与该目标视频的被观看次数最高的第二时间段不同,则可以将该剩余的样本视频在每一个第二时间段对应的被观看次数或该目标视频在每一个第二时间段对应的被观看次数循环移位,以使该剩余的样本视频的被观看次数最高的第二时间段与该目标视频的被观看次数最高的第二时间段相同。
14)、根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及每一个样本视频的流行度训练预设随机森林模型,得到预设视频流行度预测模型。
其中,预设随机森林模型适合处理高纬大数据,可以解决过拟合的问题,由于预设视频流行度预测模型是根据预设随机森林模型训练得到的,从而使得预设视频流行度预测模型也适合处理高纬大数据,并可以解决过拟合的问题。
进一步地,在根据视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值以及预设视频流行度预测模型确定出该视频的流行度之后,可以根据该视频的流行度来确定是否需要向缓存服务器推送该视频。
例如,如果该视频的流行度大于或等于预设流行度阈值,则说明该视频之后被观看的次数可能较高,进而可以向缓存服务器推送该视频,从而可以缓解由该视频带给视频服务器的系统压力和网络压力,如果该视频的流行度小于预设流行度阈值,则说明该视频之后可能很少被观看,即使缓存服务器缓存有该视频,由于该视频之后可能很少被观看,缓存服务器缓存该视频对缓解视频服务器的系统压力和网络压力的作用非常小,为了节省缓存服务器中有限的存储空间,以使缓存服务器中能够缓存更多的、对缓解视频服务器的系统压力和网络压力的作用较大的其他视频,无需缓存服务器缓存该视频,也就无需向缓存服务器推送该视频。
在本发明实施例中,按照视频的流行度可以将视频划分为三种类型,包括垃圾视频、病毒性视频以及普通视频。其中,垃圾视频的被观看次数在某一时间段达到峰值,且在之后的时间段的被观看次数迅速下降至低点。病毒性视频的被观看次数在某一时间段达到峰值,且在之后的时间段的被观看次数的下降速度非常缓慢。普通视频的被观看次数在某一时间段达到峰值,且在之后的时间段的被观看次数的下降速度位于迅速和缓慢之间。
如果该视频是垃圾视频,则视频服务器无需向缓存服务器推送该视频,如果该视频为病毒性视频或普通视频,则视频服务器可以向缓存服务器推送该视频。
在本发明实施例中,对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值;根据该视频在每一个第一时间段对应的被观看次数、该视频在每一个第一时间段对应的比值以及预设视频流行度预测模型,可以准确地确定出该视频的流行度,进而使得视频服务器可以根据流行度来确定是否需要向缓存服务器推送该视频。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图2,示出了本发明一种视频处理装置实施例的结构框图,该装置具体可以包括如下模块:
第一获取模块11,用于对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在所述第一时间段的被观看次数,获取所述被观看次数与所述视频在所述第一时间段结束时的历史被观看总次数之间的比值;
第一确定模块12,用于根据所述视频在每一个第一时间段对应的被观看次数、所述视频在每一个第一时间段对应的比值以及预设视频流行度预测模型确定所述视频的流行度。
在一个可选的实现方式中,所述预设视频流行度预测模型通过如下方式获得:
第二获取模块,用于获取多个样本视频;
第三获取模块,用于对于当前之前的多个第二时间段中的每一个第二时间段以及对于多个样本视频中的每一个样本视频,获取所述样本视频在所述第二时间段的被观看次数,获取所述被观看次数与所述样本视频在所述第二时间段结束时的历史被观看总次数之间的比值,第二时间段的数量大于第一时间段的数量;
第二确定模块,用于根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度;
训练模块,用于根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及每一个样本视频的流行度训练预设随机森林模型,得到所述预设视频流行度预测模型。
在一个可选的实现方式中,所述第二确定模块包括:
选择单元,用于从多个样本视频中选择至少两个目标视频;
第一确定单元,用于对于每一个剩余的样本视频和每一个目标视频,根据所述剩余的样本视频在每一个第二时间段对应的被观看次数和所述目标视频在每一个第二时间段对应的被观看次数,确定所述剩余的样本视频与所述目标视频之间的第一距离;
第二确定单元,用于根据所述剩余的样本视频在每一个第二时间段对应的比值和所述目标视频在每一个第二时间段对应的比值,确定所述剩余的样本视频与所述目标视频之间的第二距离;
迭代单元,用于根据所述K-means算法,将每一个剩余的样本视频分别与每一个目标视频之间的第一距离、每一个剩余的样本视频分别与每一个目标视频之间的第二距离迭代,从而得到每一个样本视频的流行度。
在一个可选的实现方式中,所述装置还包括:
第三确定单元,用于在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与所述目标视频在每一个第二时间段对应的被观看次数中的第二最高值是否相同;
调整单元,用于如果不同,则根据所述第一最高值与所述第二最高值之间的比值调整所述目标视频在每一个第二时间段对应的被观看次数,或,根据所述第二最高值与所述第一最高值之间的比值调整所述剩余的样本视频在每一个第二时间段对应的被观看次数。
在一个可选的实现方式中,所述装置还包括:
第四确定单元,用于在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段是否相同;
移位单元,用于如果不同,则将所述剩余的样本视频在每一个第二时间段对应的被观看次数或所述目标视频在每一个第二时间段对应的被观看次数循环移位,以使所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段相同。
在本发明实施例中,对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在该第一时间段的被观看次数,获取该被观看次数与该视频在该第一时间段结束时的历史被观看总次数之间的比值;根据该视频在每一个第一时间段对应的被观看次数、该视频在每一个第一时间段对应的比值以及预设视频流行度预测模型,可以准确地确定出该视频的流行度,进而使得视频服务器可以根据流行度来确定是否需要向缓存服务器推送该视频。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种视频处理方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种视频处理方法,其特征在于,所述方法包括:
对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在所述第一时间段的被观看次数,获取所述被观看次数与所述视频在所述第一时间段结束时的历史被观看总次数之间的比值,其中,所述被观看次数为:所述第一时间段的被观看次数,所述视频在所述第一时间段结束时的历史被观看总次数为:所述视频在所述第一时间段的结束时刻之前的所有第一时间段的被观看次数的总和;
根据所述视频在每一个第一时间段对应的被观看次数、所述视频在每一个第一时间段对应的比值以及预设视频流行度预测模型确定所述视频的流行度。
2.根据权利要求1所述的方法,其特征在于,所述预设视频流行度预测模型通过如下方式获得:
获取多个样本视频;
对于当前之前的多个第二时间段中的每一个第二时间段以及对于多个样本视频中的每一个样本视频,获取所述样本视频在所述第二时间段的被观看次数,获取所述被观看次数与所述样本视频在所述第二时间段结束时的历史被观看总次数之间的比值,第二时间段的数量大于第一时间段的数量;
根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度;
根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及每一个样本视频的流行度训练预设随机森林模型,得到所述预设视频流行度预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度,包括:
从多个样本视频中选择至少两个目标视频;
对于每一个剩余的样本视频和每一个目标视频,根据所述剩余的样本视频在每一个第二时间段对应的被观看次数和所述目标视频在每一个第二时间段对应的被观看次数,确定所述剩余的样本视频与所述目标视频之间的第一距离;
根据所述剩余的样本视频在每一个第二时间段对应的比值和所述目标视频在每一个第二时间段对应的比值,确定所述剩余的样本视频与所述目标视频之间的第二距离;
根据所述K-means算法,将每一个剩余的样本视频分别与每一个目标视频之间的第一距离、每一个剩余的样本视频分别与每一个目标视频之间的第二距离迭代,从而得到每一个样本视频的流行度。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与所述目标视频在每一个第二时间段对应的被观看次数中的第二最高值是否相同;
如果不同,则根据所述第一最高值与所述第二最高值之间的比值调整所述目标视频在每一个第二时间段对应的被观看次数,或,根据所述第二最高值与所述第一最高值之间的比值调整所述剩余的样本视频在每一个第二时间段对应的被观看次数。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段是否相同;
如果不同,则将所述剩余的样本视频在每一个第二时间段对应的被观看次数或所述目标视频在每一个第二时间段对应的被观看次数循环移位,以使所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段相同。
6.一种视频处理装置,其特征在于,所述装置包括:
第一获取模块,用于对于当前之前的多个第一时间段中的每一个第一时间段,获取视频在所述第一时间段的被观看次数,获取所述被观看次数与所述视频在所述第一时间段结束时的历史被观看总次数之间的比值,其中,所述被观看次数为:所述第一时间段的被观看次数,所述视频在所述第一时间段结束时的历史被观看总次数为:所述视频在所述第一时间段的结束时刻之前的所有第一时间段的被观看次数的总和;
第一确定模块,用于根据所述视频在每一个第一时间段对应的被观看次数、所述视频在每一个第一时间段对应的比值以及预设视频流行度预测模型确定所述视频的流行度。
7.根据权利要求6所述的装置,其特征在于,所述预设视频流行度预测模型通过如下方式获得:
第二获取模块,用于获取多个样本视频;
第三获取模块,用于对于当前之前的多个第二时间段中的每一个第二时间段以及对于多个样本视频中的每一个样本视频,获取所述样本视频在所述第二时间段的被观看次数,获取所述被观看次数与所述样本视频在所述第二时间段结束时的历史被观看总次数之间的比值,第二时间段的数量大于第一时间段的数量;
第二确定模块,用于根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及预设K-means算法确定每一个样本视频的流行度;
训练模块,用于根据每一个样本视频在每一个第二时间段对应的被观看次数、每一个样本视频在每一个第二时间段对应的比值以及每一个样本视频的流行度训练预设随机森林模型,得到所述预设视频流行度预测模型。
8.根据权利要求7所述的装置,其特征在于,所述第二确定模块包括:
选择单元,用于从多个样本视频中选择至少两个目标视频;
第一确定单元,用于对于每一个剩余的样本视频和每一个目标视频,根据所述剩余的样本视频在每一个第二时间段对应的被观看次数和所述目标视频在每一个第二时间段对应的被观看次数,确定所述剩余的样本视频与所述目标视频之间的第一距离;
第二确定单元,用于根据所述剩余的样本视频在每一个第二时间段对应的比值和所述目标视频在每一个第二时间段对应的比值,确定所述剩余的样本视频与所述目标视频之间的第二距离;
迭代单元,用于根据所述K-means算法,将每一个剩余的样本视频分别与每一个目标视频之间的第一距离、每一个剩余的样本视频分别与每一个目标视频之间的第二距离迭代,从而得到每一个样本视频的流行度。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第三确定单元,用于在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频在每一个第二时间段对应的被观看次数中的第一最高值与所述目标视频在每一个第二时间段对应的被观看次数中的第二最高值是否相同;
调整单元,用于如果不同,则根据所述第一最高值与所述第二最高值之间的比值调整所述目标视频在每一个第二时间段对应的被观看次数,或,根据所述第二最高值与所述第一最高值之间的比值调整所述剩余的样本视频在每一个第二时间段对应的被观看次数。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第四确定单元,用于在确定所述剩余的样本视频与所述目标视频之间的第一距离之前,确定所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段是否相同;
移位单元,用于如果不同,则将所述剩余的样本视频在每一个第二时间段对应的被观看次数或所述目标视频在每一个第二时间段对应的被观看次数循环移位,以使所述剩余的样本视频的被观看次数最高的第二时间段与所述目标视频的被观看次数最高的第二时间段相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810292062.2A CN108600836B (zh) | 2018-04-03 | 2018-04-03 | 一种视频处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810292062.2A CN108600836B (zh) | 2018-04-03 | 2018-04-03 | 一种视频处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108600836A CN108600836A (zh) | 2018-09-28 |
CN108600836B true CN108600836B (zh) | 2020-11-13 |
Family
ID=63625304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810292062.2A Active CN108600836B (zh) | 2018-04-03 | 2018-04-03 | 一种视频处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108600836B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111050195B (zh) * | 2018-10-12 | 2021-11-26 | 中国电信股份有限公司 | 流媒体缓存方法、装置及计算机可读存储介质 |
CN109769135B (zh) * | 2018-12-07 | 2021-02-19 | 北京交通大学 | 基于联合请求速率的在线视频缓存管理方法和系统 |
CN110225407B (zh) * | 2019-04-23 | 2021-09-03 | 北京奇艺世纪科技有限公司 | 一种播放数据的获取方法和装置及计算机可读存储介质 |
CN111629216B (zh) * | 2020-04-20 | 2021-04-06 | 南京邮电大学 | 边缘网络环境下基于随机森林算法的vod业务缓存替换方法 |
CN114640890A (zh) * | 2020-12-15 | 2022-06-17 | 武汉斗鱼鱼乐网络科技有限公司 | 一种视频数据动态加载方法、装置、电子设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007272451A (ja) * | 2006-03-30 | 2007-10-18 | Toshiba Corp | 推薦番組情報提供装置、推薦番組情報提供方法及びプログラム |
KR101145877B1 (ko) * | 2010-11-26 | 2012-05-15 | 주식회사 씨제이헬로비전 | 방송 콘텐츠 인기도 산출 시스템 및 방법 |
CN102957969A (zh) * | 2012-05-18 | 2013-03-06 | 华东师范大学 | 为iptv终端用户推荐节目的装置及方法 |
CN102833503A (zh) * | 2012-09-14 | 2012-12-19 | 高亿实业有限公司 | 电视机智能选台的方法及装置 |
CN104077339B (zh) * | 2013-07-09 | 2016-05-11 | 腾讯科技(深圳)有限公司 | 多媒体数据的用户偏好度获取的方法、装置和系统 |
CN103888810B (zh) * | 2014-03-19 | 2017-11-07 | 深圳市九洲电器有限公司 | 一种电视节目排布方法及系统 |
CN104394433B (zh) * | 2014-11-27 | 2019-04-12 | 北京国双科技有限公司 | 检测电视频道中多媒体文件的播放次数的方法和装置 |
CN107249145B (zh) * | 2017-05-05 | 2019-08-02 | 中广热点云科技有限公司 | 一种推送视频的方法 |
CN107241623B (zh) * | 2017-05-26 | 2019-08-02 | 中国传媒大学 | 广播电视用户收视行为预测方法及系统 |
-
2018
- 2018-04-03 CN CN201810292062.2A patent/CN108600836B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108600836A (zh) | 2018-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108600836B (zh) | 一种视频处理方法及装置 | |
US10452621B2 (en) | Network coded storage with multi-resolution codes | |
US10623823B2 (en) | Method, system, and website server for playing website video | |
US9913001B2 (en) | System and method for generating segmented content based on related data ranking | |
US20160360254A1 (en) | Manifest re-assembler for a streaming video channel | |
CN105763960B (zh) | 一种网络视频播放的方法和装置 | |
JP5175908B2 (ja) | 情報処理装置及びプログラム | |
EP2830288A1 (en) | Method for caching of data items in a cache area of a data processing system and corresponding device | |
CN107766360B (zh) | 一种视频热度预测方法和装置 | |
US9659256B2 (en) | Network service recommendation method and apparatus | |
CN110324680B (zh) | 一种视频推送方法、装置及服务器、客户端、存储介质 | |
EP3193509A1 (en) | Video advertisement filtering method, device and equipment | |
US11184669B2 (en) | Distribution of network traffic for streaming content | |
US8996557B2 (en) | Query and matching for content recognition | |
CN108184170B (zh) | 一种数据处理方法及装置 | |
CN106326388A (zh) | 一种信息处理方法和装置 | |
JP6823170B2 (ja) | コンテンツストリームにおける中断期間の予測 | |
CN114025199A (zh) | 一种直播视频剪辑方法、装置和系统 | |
CN102970380A (zh) | 获取云存储文件的媒体数据的方法以及云存储服务器 | |
CN113039805B (zh) | 一种基于指纹匹配的媒体片段提取方法及系统 | |
CN108495150B (zh) | 一种视频点击满意度的确定方法及装置 | |
WO2016128350A1 (en) | Client, live-streaming server and data stream using an information on a current segment of a sequence of segments | |
JP2016110505A (ja) | 興味タイミング推定装置及び興味タイミング推定方法 | |
WO2014127658A1 (en) | Method, apparatus and system for processing user generated content | |
US20150189354A1 (en) | Sorting content assets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |