发明内容
本发明的目的在于提出一种站台门控系统及方法,能够使得系统具有较高的安全性、稳定性及可靠性。---
为达此目的,本发明采用以下技术方案:
一种基于意见领袖的视频推荐方法,包括如下步骤:
步骤1:基于热门视频定义,获得某天发布的,在M天内达到要求的所有视频VideoID,所述热门视频为发布后M天,播放量在N以上的视频,其中1≤M≤20,1000≤N≤100000;
步骤2:基于有效播放的定义,获取自发布日后L天内的视频播放记录中的有效播放的观看日志ALLlog,基于有预见性观看定义,获取所述L天内的视频播放记录中所有预见性观看的观看日志EffectiveLog,其中L<M,所述有效播放为播放完成度大于P的播放,其中5%≤P≤50%,所述有预见性观看为在热门视频中位于前10%,且观看者为登录用户,且非视频上传者本人的有效播放记为一次有预见性观看;
步骤3:对步骤2中AllLog分用户,分时间,分观看频道进行分组统计获得基于键值对<Key,Value>的数据集A,在数据集A中,Key=UserId_VisitTitme_ChannelID,Value为该组内有效播放数AllViewCount,对步骤2中EffectiveLog分用户,分时间,分观看频道进行分组统计获得基于键值对<Key,Value>的数据集B,在数据集B中,Key=UserId_VisitTitme_ChannelID,Value为该组内预见性观看播放数EffectiveViewCount,UserId表示用户ID,VisitTitme表示用户观看视频时间,ChannelID表示用户所观看的频道;
步骤4,利用UserId和ChannelID,对数据集A,B进行合并操作,得到基于新的键值对<Key,Value>的数据集C,在数据集C中Key=UserID_ChannelID,Value为分别通过不同的VisitTime对EffectiveViewCount和AllViewCount进行归类的多个值;
步骤5,利用步骤4得到数据集C,按如下定义进行计算影响力的上限和下限,
影响力上限,
影响力下限,
AllViewCount(InEffectiveDays)表示发生有预见性观看的那些日子总有效播放量之和;
利用下述公式分别计算某用户在某频道下影响力,
其中,x带入影响力上限,y带入影响力下限;
步骤6:基于步骤5得到的结果,取InfluenceValue某个值的记录,这些记录对应的UserID_ChannelID,表示UserID用户在ChannelID频道下的影响力,通过影响力大小排序或者阈值筛选,从而得到相应的意见领袖集合,系统根据意见领袖的观看记录进行视频的推荐。
优选地,对于步骤5,在计算得到影响力上、下限后,使用置信水平95%时的Z=1.6的威尔逊区间下限对影响力上、下限进行修正,然后再计算影响力,
修正公式为
其中,p带入影响力上限或下限,z=1.6,n为当前计算的总播放量,即影响力上限或下限中的分母。。
优选地,在步骤1中,M=14,N=10000,在步骤2中,L=7。
本发明摆脱了传统上根据视频本身内容或者用户之间相似性进行推荐的局限性。通过寻找意见领袖这类人,基于意见领袖改进运营策略,制作媒体热点,提高视频传播效率,节约运营成本。本发明能够较为准确的预测视频将会热的概率,进而按需分配带宽,运营人员进行运作,能够提高资源利用率,节约人力物力,对于从没有或只有很少观看记录的用户的推荐具有良好的效果。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本发明介绍如下的在视频领域中的常用概念:
热门视频:发布后14天(区间值,1~20天均可),播放量在1w(可定义,1k~10w均可)以上的视频。
有效播放:播放完成度大于10%(可定义值,5%~50%均可)的播放
有预见性观看:热门视频定义中位于前10%,且观看者为登录用户,且非视频上传者本人的有效播放记为一次有预见性观看。
视频热门度影响力:度量某用户观看视频能在接下来一段时间内变为热门视频的值。
意见领袖:视频热门度影响力居于前列的用户,基于其观看记录能为我们预测热门视频提供很大帮助。
参见图1,示出了根据本发明的基于意见领袖的视频推荐方法的流程图,包括如下步骤:
步骤1:基于热门视频定义,获得某天发布的,在M天内达到要求的所有视频VideoID,所述热门视频为发布后M天,播放量在N以上的视频,其中1≤M≤20,1000≤N≤100000,优选地,M=14,N=10000。
例如,获得某天(如7月12日)发布的,在14天内达到要求的所有视频VideoID(如:1000000,1000003,1000110,1003000……)。
步骤2:基于有效播放的定义,获取自发布日后在L天内的视频播放记录中的有效播放的观看日志ALLlog,基于有预见性观看定义,获取所述L天内的视频播放记录中所有预见性观看的观看日志EffectiveLog,其中L<M,使得可以过滤在发布日靠后的分布不均匀的观看记录,其中所述有效播放为播放完成度大于P的播放,其中5%≤P≤50%,所述有预见性观看为在热门视频中位于前10%,且观看者为登录用户,且非视频上传者本人的有效播放记为一次有预见性观看。
例如,可以获取自7月12~7月18日期间7天内的有效播放的观看日志AllLog,和有预见性观看的观看日志EffectiveLog,日期可以为7天,在3-14天内可选。
步骤3:对步骤2中AllLog分用户,分时间,分观看频道进行分组统计获得基于键值对<Key,Value>的数据集A,在数据集A中,Key=UserId_VisitTitme_ChannelID,Value为该组内有效播放数AllViewCount,对步骤2中EffectiveLog分用户,分时间,分观看频道进行分组统计获得基于键值对<Key,Value>的数据集B,在数据集B中,Key=UserId_VisitTitme_ChannelID,Value为该组内预见性观看播放数EffectiveViewCount,UserId表示用户ID,VisitTitme表示用户观看视频时间,ChannelID表示用户所观看的频道。
例如,数据A的示例包括:<用户999_20140712_频道A,10>,<用户998_20140715_频道B,20>…
数据集B的示例包括:<用户999_20140712_频道A,20>,<用户998_20140715_频道B,22>…
步骤4,利用UserId和ChannelID,对数据集A,B进行合并操作,得到基于新的键值对<Key,Value>的数据集C,在数据集C中Key=UserID_ChannelID,Value为分别通过不同的VisitTime对EffectiveViewCount和AllViewCount进行归类的多个值,形如[VisitTime_EffectiveViewCount_AllViewCount],…;
例如,<用户999_频道A,20140712_10_20,20140713_0_5,20140714_15_25>……
步骤5,利用步骤4得到数据集C,按如下定义进行计算影响力的上限和下限,其中,Key定义如数据集C定义,
影响力上限,
影响力下限,
AllViewCount(InEffectiveDays)表示发生有预见性观看的那些日子总有效播放量之和。例如,20140713没有发生有预见性观看,则当日不计算在内。
即,上述两个公式分子均为步骤2定义中L天(此处为7天)内所有有预见性观看总和,影响力上限计算公式中分母为发生有预见性观看的那些日子总有效播放量之和,影响力下限计算公式中分母为所述L天期间总有效播放量之和。
然后,利用下述公式分别计算某用户在某频道下影响力,
其中,x带入影响力上限,y带入影响力下限。
优选地,考虑到不同用户观看视频总数及预见性观看次数存在置信度问题,使用置信水平95%时的Z=1.6的威尔逊区间下限对影响力上、下限进行修正,然后再计算影响力,
修正公式为
其中,
p带入影响力上限或下限,z=1.6,n为当前计算的总播放量,即影响力上限或下限中的分母。
步骤6:基于步骤5得到的结果,取InfluenceValue某个值的记录,这些记录对应的UserID_ChannelID,表示UserID用户在ChannelID频道下的影响力,通过影响力大小排序或者阈值筛选,从而得到相应的意见领袖集合,系统根据意见领袖的观看记录进行视频的推荐。
例如,用户999在频道A下是意见领袖。
因此,本发明摆脱了传统上根据视频本身内容或者用户之间相似性进行推荐的局限性。通过寻找意见领袖这类人,基于意见领袖改进运营策略,制作媒体热点,提高视频传播效率,节约运营成本。本发明能够较为准确的预测视频将会热的概率,进而按需分配带宽,运营人员进行运作,能够提高资源利用率,节约人力物力,对于从没有或只有很少观看记录的用户的推荐具有良好的效果。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。