发明内容
为了尽量减少播放量滞后性对搜索排序的影响,本发明基于对较小时间粒度网络视频播放量的统计,实现了网络视频实时关注度的计算方法、装置和系统。具体来说,本发明提供一种网络视频实时关注度的计算方法,其包括如下步骤:
步骤一、设定网络视频播放量的统计粒度;
步骤二、根据设定的网络视频播放量统计粒度,获得需要进行统计处理的网络视频播放数据;
步骤三、计算统计粒度内每一网络视频的播放量;
步骤四、根据每一网络视频的播放量计算每一网络视频在所属类别中的播放关注度;
步骤五、将步骤三获得的每一网络视频的播放量与步骤四中获得的每一网络视频的网络视频播放关注度类别信息相加,作为每一网络视频在特定时间段内的实时播放量,根据播放量的大小获得每一网络视频的实时关注度。
此外,本发明还提供一种计算网络视频实时关注度的装置,其特征在于包括如下模块:
统计粒度设定模块,用于设定网络视频播放量的统计粒度;
网络视频播放数据获取模块,用于根据设定的网络视频播放量统计粒度,获得需要进行统计处理的网络视频播放数据;
网络视频播放量计算模块,用于计算统计粒度内每一网络视频的播放量;
网络视频类别播放关注度计算模块,用于根据每一网络视频的播放量计算每一网络视频在所属类别中的播放关注度;
网络视频实时关注度计算模块,用于将网络视频播放量计算模块获得的每一网络视频的播放量与网络视频类别播放关注度计算模块获得的每一网络视频的网络视频播放关注度类别信息相加,作为每一网络视频在特定时间段内的实时播放量,根据播放量的大小获得每一网络视频的实时关注度。
进一步,本发明还提供一种计算网络视频实时关注度的系统,其特征在于包括如下装置:
统计粒度设定装置,用于设定网络视频播放量的统计粒度;
网络视频播放数据获取模块,用于根据设定的网络视频播放量统计粒度,获得需要进行统计处理的网络视频播放数据;
网络视频播放量计算装置,用于计算统计粒度内每一网络视频的播放量;
网络视频类别播放关注度计算模块,用于根据每一网络视频的播放量计算每一网络视频在所属类别中的播放关注度;
网络视频实时关注度计算装置,用于将网络视频播放量计算模块获得的每一网络视频的播放量与网络视频类别播放关注度计算模块获得的每一网络视频的网络视频播放关注度类别信息相加,作为每一网络视频在特定时间段内的实时播放量,根据播放量的大小获得每一网络视频的实时关注度。
本发明的技术方案解决了使用历史累积播放量在较短时间内无法及时发现关注度较高的网络视频的缺点。使用这种方法,将过去一天才能发现的网络视频关注度减少到3小时左右,提高了搜索引擎服务器针对关注度较高的网络视频的响应速度,向用户及时提供网络视频热点,并能够使得搜索后台尽快对突发或者热门事件做出反应。
具体实施方式
为使本发明的上述目的、特征和优点更加明显易懂,下面结合附图和具体实施例对本发明作进一步详细的说明。
为了尽量减少播放量滞后性对搜索排序的影响,必须找到一个标量来标识网络视频当前的关注度,以使搜索引擎服务器尽快对突发或者热门事件做出响应。这个标量在本专利中定义为:Video_Rank_0,用此标量来表示网络视频的实时关注度。在实践中,通过引入Video_Rank_0标量,对于热门突发的网络视频的响应,站内搜索已经提高到3小时左右。因此,本发明所述计算网络视频实时关注度的技术方案关键在于如何计算Video_Rank_0标量。
图1是本发明所述计算网络视频实时关注度方法的流程图;如图所示,本发明所述的网络视频实时关注度的计算方法包括如下步骤:
步骤一、设定网络视频播放量的统计粒度;
历史累积播放量之所以有滞后性是因为历史累积播放量平均一天或者几天统计一次。为了避免这个问题,首先要缩小网络视频播放量的统计粒度,由当前统计网络视频播放量是每天一次缩小为以每两小时为单位进行统计,如果有更细的需要可以将粒度进一步缩小到1小时,30分钟......,当然这个粒度不一定越小越好,而需要根据实际选择。
步骤二、根据设定的网络视频播放量统计粒度,获得需要进行统计处理的网络视频播放数据;
由于存在很多同时被播放的网络视频数据,所以需要后台,即服务器端,对所有网络视频的播放情况进行记录,记录时需要根据所设定的网络视频播放量统计粒度分别进行统计,以便于后面针对单一网络视频播放情况进行统计处理时获得需要的网络视频播放数据。
步骤三、计算统计粒度内每一网络视频的播放量;
根据网络视频的特点,需要处理统计到的网络视频播放数据时,在持续一段时间内,某个网络视频可能会被用户大量观看,可能连续一段时间的统计中都包含有本网络视频的播放量(VV),就单个网络视频来说,在连续一段时间内(一个统计粒度)都有可能有用户观看产生网络视频播放量(VV)。因此首先需要对统计数据进行纵向处理。比如以两小时为单位时间进行统计,累积处理24小时的数据,然后根据需要,平均分成六段时间,即将当前数据分成六组
针对每段时间内的单个网络视频播放量进行以下处理,即,将单一的网络视频播放量进一步转换如下:
其中:v代表某个特定的网络视频
j代表第j个时间区间
vv代表统计到的某网络视频某个小时的播放量
k为第j个时间段开始的时间序号,m为第j个时间段结束的时间序号。
公式(1)实际上就是计算某网络视频在某段时间内网络视频播放量(VV)按照小时平均值的对数,+e的原因是为了保证这个值大于1,VideoHitPower(v,j)表示网络视频V在第j段时间内平均网络视频播放量(vv)的一个变形(即权重);公式(2)中,VideoHitLevel(v,j)表示以2n为阶梯的话,网络视频V在第j段时间平均网络视频播放量(VV)所处的级别位置。对网络视频播放量进行转换的目的在于方便后面计算每一网络视频在所属类别中的播放关注度。
步骤四、根据每一网络视频的播放量计算每一网络视频在所属类别中的播放关注度;
根据网络视频的特点,每个网络视频都有其特定的分类,需要对根据单一网络视频播放量(VV)来判断其在所属类别中的播放关注度,也就是计算网络视频播放关注度的类别信息。网络视频播放关注度的类别信息计算如下:
单一网络视频在网站内部都属于相应的类别,因此可以根据统计到的单一网络视频的VV来计算某分段网络视频播放的类别信息。针对以上某个分段计算某类别网络视频算数平均如下:
其中:
v代表某个特定网络视频
Ci代表某个特定分类
nCount只在这段时间内这个类别被播放网络视频的个数。
步骤五、将步骤三获得的每一网络视频的播放量与步骤四中获得的每一网络视频的网络视频播放关注度类别信息相加,作为每一网络视频在特定时间段内的实时播放量,根据播放量的大小获得每一网络视频的实时关注度。
具体来说,首先,计算分段的ClassAvrLevel(Ci)的均方差Class_FC:具体计算公式如下:
然后,根据前面计算出的VideoHitPower(v,j)和VideoHitLevel(v,j),进一步计算:
其中:n为整个分组数量
videoMidLevel(v)是所统计到的某网络视频平均level值
videoMidPower(v)是统计到的某网络视频平均Power值
videoLastPowLevel(v)是某网络视频power的标准差
videoHi(t A,l∈l vj是某网络视频根据其power值计算的一个power
βj(videoHitL(e v,ε是根据网络视频类别不同和所处的level不同设定的一个值,level越高此值越高,体现了网络视频的关注度
α
ji,α
ji代表第i段时间在整体中所占的权重,它符合
根据上述计算结果,计算最终的两个权重值,即vid_eo Rank(∈,Pjo (网络视频本身的一个权重值)和video_Rank_Class_Power(v,v∈Cj)(网络视频相对于类别的权重值),进而将前两者作为参数输入到某一特定函数f中计算而得的数值,作为我们最终的Video_Rank_0值,具体计算过程如下:
video_Rank_0(v,v∈Cj)=
f(video_Rank_Power(v,v∈Cj),video_Rank_Class_Power(v,v∈Cj)).........................(12)
本发明技术方案可以在一单独装置中实现,由此也可以获得一种能够完成此技术方案的实体装置,图2是本发明所述计算网络视频实时关注度的装置的框图;具体包括如下模块:
统计粒度设定模块,用于设定网络视频播放量的统计粒度;
网络视频播放数据获取模块,用于根据设定的网络视频播放量统计粒度,获得需要进行统计处理的网络视频播放数据;
网络视频播放量计算模块,用于计算统计粒度内每一网络视频的播放量;
网络视频类别播放关注度计算模块,用于根据每一网络视频的播放量计算每一网络视频在所属类别中的播放关注度;
网络视频实时关注度计算模块,用于将网络视频播放量计算模块获得的每一网络视频的播放量与网络视频类别播放关注度计算模块获得的每一网络视频的网络视频播放关注度类别信息相加,作为每一网络视频在特定时间段内的实时播放量,根据播放量的大小获得每一网络视频的实时关注度。
此外,本发明也可以通过分离的各个装置来协同完成,由此可以获得一种能够完成此技术方案的系统,图3是本发明所述计算网络视频实时关注度的系统的框图;具体包括如下装置:
统计粒度设定装置,用于设定网络视频播放量的统计粒度;
网络视频播放数据获取模块,用于根据设定的网络视频播放量统计粒度,获得需要进行统计处理的网络视频播放数据;
网络视频播放量计算装置,用于计算统计粒度内每一网络视频的播放量;
网络视频类别播放关注度计算模块,用于根据每一网络视频的播放量计算每一网络视频在所属类别中的播放关注度;
网络视频实时关注度计算装置,用于将网络视频播放量计算模块获得的每一网络视频的播放量与网络视频类别播放关注度计算模块获得的每一网络视频的网络视频播放关注度类别信息相加,作为每一网络视频在特定时间段内的实时播放量,根据播放量的大小获得每一网络视频的实时关注度。
以上是对本发明的优选实施例进行的详细描述,但本领域的普通技术人员应该意识到,在本发明的范围内和精神指导下,各种改进、添加和替换都是可能的,例如调整接口调用顺序、改变消息格式和内容、使用不同的编程语言(如C、C++、Java等)实现等。这些都在本发明的权利要求所限定的保护范围内。