网络多媒体对象播放信息的估算方法
技术领域
本申请涉及互联网技术领域,具体地说,涉及一种网络多媒体对象播放信息的估算方法。
背景技术
当前提供多媒体对象资源以供客户访问的网站,例如视频网站所采购的多媒体对象资源基本上都是有版权或者播放限制的。例如电视剧的版权分为联播和独播。比如《咱们结婚吧》是网络联播,即几家视频网站同时拥有播放版本;而《爱情公寓》是爱奇艺独播的,即仅有爱奇艺拥有播放版本。
随着移动互联网等技术的快速发展,通过网络在线浏览、收听音视频等多媒体对象已经成为都市人享受影音娱乐的首选方式。如何根据例如多个网络平台对特定多媒体对象的播放总量估算此多媒体对象仅在其中一个网络平台进行独播可能产生的播放量,以评估多媒体对象的价值,成为亟待解决的技术问题。而在现有技术中,尚未有比较成熟的视频网站单平台播放量评估方法。
发明内容
有鉴于此,本申请的目的在于提供了一种网络多媒体对象播放信息的估算方法,根据特定多媒体对象在服务器中的搜索量估计在该服务器上实际可能产生的播放量。
为了解决上述技术问题,本发明提供一种网络多媒体对象播放信息的估算方法,用于第一服务器,其特征在于,包括:
步骤1,针对一组样本网络多媒体对象,分别对该组样本网络多媒体对象中的每一个,统计关于该样本网络多媒体对象的在所述第一服务器中的搜索记录信息,以及统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息;
步骤2,基于所述搜索记录信息以及所述播放记录信息,建立关于该组样本网络多媒体对象的搜索与播放关系模型;以及
步骤3,将待估算的网络多媒体对象在所述第一服务器的搜索记录信息输入至所述搜索与播放关系模型中,以获得所述网络多媒体对象的估计播放信息。
优选地,其中,在步骤1之前还包括对多个样本网络多媒体对象进行分类处理,以得到不同类别的多组样本网络多媒体对象;以及
在步骤3之前还包括将所述待估算的网络多媒体对象进行分类处理,
其中,步骤3还包括将所述待估算的网络多媒体对象在所述第一服务器的搜索记录信息输入至相应类别组的搜索与播放关系模型中。
优选地,其中,还包括收集相应样本网络多媒体对象于特定时间期间内在所述第二服务器的播放记录信息以进行统计,其中,所述特定时间期间是基于该样本网络多媒体对象在所述第二服务器内存储的起始时间与最后更新时间确定的。
优选地,其中,还包括基于相应网络多媒体对象的主题所包含的词的检索记录确定该网络多媒体对象的搜索记录信息以进行统计。
优选地,其中,每一网络多媒体对象包括具有相同主题的多个多媒体文件,统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息包括累加该样本网络多媒体对象所包含的多个多媒体文件的播放次数。
优选地,其中,所述组样本网络多媒体对象包含的第一样本网络多媒体对象仅在所述第二服务器中被存储,步骤1中统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息仅包括:统计关于该第一样本网络多媒体对象的在所述第二服务器中的播放记录信息。
优选地,其中,所述组样本网络多媒体对象包含的第一样本网络多媒体对象在所述第一服务器以及所述第二服务器中均被存储,步骤1中还包括累加关于该第一样本网络多媒体对象的在所述第一服务器以及所述第二服务器中的播放记录信息以进行统计。
优选地,其中,所述第一服务器以及所述第二服务器分别属于不同的网络播放平台。
优选地,其中,播放记录信息包括相应网络对媒体对象的播放次数以及搜索记录信息包括相应网络对媒体对象的搜索次数。
优选地,其中,所述网络多媒体对象包括网络视频对象以及网络音频对象中至少之一。
与现有技术相比,本申请所述的网络多媒体对象播放信息的估算方法,达到了如下效果:
1)本发明采用的网络多媒体对象播放信息的估算方法能够基于事先构建的模型而仅通过输入用户在本网络平台服务器中的搜索记录得到可能的实际本平台播放量,以较低的复杂度完成估算过程。
2)本发明根据容易获取的用户在本网络平台服务器中的搜索量、播放量以及其他网络平台公开的播放信息构建模型,大大降低了采集建模样本的难度。
3)本发明中针对不同类别的多媒体对象分别进行建模从而可以获得较为精准的模型并据此获得可靠的估算结果。
4)本发明可用于某一多媒体对象在其他网络平台播放而未在本网络平台播放的情况下,估算该多媒体对象在本网络平台的可能播放量水平,从而为多媒体对象版权采购提供有效的历史数据。
当然,实施本申请的方法必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明提供的网络多媒体对象播放信息的估算方法流程图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
实施例一:
本申请中,将提供一种网络多媒体对象播放信息的估算方法,结合图1,所述方法用于第一服务器,本实施例中的第一服务器为优酷土豆公司的云服务器,所述方法包括以下步骤:
S101:针对一组样本网络多媒体对象,分别对该组样本网络多媒体对象中的每一个,统计关于该样本网络多媒体对象的在所述第一服务器中的搜索记录信息,以及统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息。
这里的网络多媒体对象例如为电视剧、综艺节目等网络视频。样本网络多媒体对象例如为在网络平台播出过的热门历史网络视频,比如通过本网络平台优酷土豆、以及爱奇艺、乐视、搜狐、腾讯等其他网络平台播出过的电视剧。其中的第二服务器包括播放过所选定的样本多媒体对象的上述其他网络平台的服务器,例如是一个或多个云服务器的集合。在所选定的样本多媒体对象仅在本网络平台服务器独播的情况下,只需统计第一服务器中的播放记录;在所选定的样本多媒体对象仅在其他网络平台服务器播放的情况下,只需统计第二服务器中的播放记录;在所选定的样本多媒体对象在各个网络平台均播放过的情况下,统计第一服务器以及第二服务器上的播放记录并且累加关于该选定的样本网络多媒体对象的在所述第一服务器以及所述第二服务器中的播放记录。
搜索记录信息例如包括搜索次数,具体地,例如基于相应网络多媒体对象的主题所包含的词的检索记录确定该网络多媒体对象的搜索次数以进行统计。此外,播放记录信息例如包括播放次数,在一些示例中还可以包括播放时间长度等信息。每一网络多媒体对象可以为特定的一个视频文件;此外每一网络多媒体对象也可以包括具有相同主题的多个多媒体文件,例如同一部电视剧的多个剧集,统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息包括累加该样本网络多媒体对象所包含的多个多媒体文件的播放次数。
进一步地,为了统计有效的播放记录信息/减小运算量,S101中还可以包含收集相应样本网络多媒体对象于特定时间期间内在所述第二服务器的播放记录信息,其中,所述特定时间期间是基于该样本网络多媒体对象在所述第二服务器内存储的起始时间与最后更新时间确定的。具体地,例如《咱们结婚吧》除了在优酷土豆站播出外,还在搜狐视频播出,相应地在搜狐的连载时间是2013年2月1日(上线时间)至2013年3月1日(最后一集更新时间),则根据本发明的这个示例,仅收集《咱们结婚吧》在上述时段内于搜狐视频的播放记录信息。
S102:基于所述搜索记录信息以及所述播放记录信息,建立关于该组样本网络多媒体对象的搜索与播放关系模型。
具体地,例如利用搜索记录信息作为自变量,节目本身信息(比如类型,导演,主演等)及播放记录信息作为因变量,依据样本网络多媒体对象的搜索量及播放量估计回归模型,以建立搜索量与播放量的关系模型而用于后续的估计。
S103:将待估算的网络多媒体对象在所述第一服务器的搜索记录信息输入至所述搜索与播放关系模型中,以获得所述网络多媒体对象的估计播放信息。
待估算的网络多媒体对象在本实施例中可以是所关心的在其他网络平台播出的热播电视剧或其他节目,具体地,例如将所关心的热播节目在优酷土豆站内的搜索量作为自变量输入至在S102中建立好的模型当中即可获得输出的所估计得在优酷土豆站内的播放量。其中,基于建模样本的数量多寡,所建立的搜索与播放关系模型的精度可能有所不同,具体输出的估计播放量在模型较为精确的情况下可以是估计的播放次数,或者在模型较为粗略的情况下,估计播放量可以为预先确定的多个播放次数量级中的一个量级。具体地,模型的精度可以例如通过代入已知的优酷土豆独播剧的搜索量与播放量进行确定。
实施例二:
本实施例在实施例一的基础上,提供一种网络多媒体对象播放信息的估算方法,用于第一服务器,本实施例中的第一服务器为优酷土豆公司的云服务器,所述方法包括以下步骤:
S201:对多个样本网络多媒体对象进行分类处理,以得到不同类别的多组样本网络多媒体对象。
这里的网络多媒体对象例如为电视剧、综艺节目等网络视频。样本网络多媒体对象例如为在网络平台播出过的热门历史网络视频,比如通过本网络平台优酷土豆、以及爱奇艺、乐视、搜狐、腾讯等其他网络平台播出过的电视剧。其中,可以基于样本网络多媒体对象的主题、题材、来源国家等基本信息中的一个或多个的结合进行分类处理。例如将属于韩国的竞技综艺节目的样本网络多媒体对象划分为一个类别组,将属于美国的科幻电影的样本网络多媒体对象划分为另一个类别组。
S101:针对一组样本网络多媒体对象,分别对该组样本网络多媒体对象中的每一个,统计关于该样本网络多媒体对象的在所述第一服务器中的搜索记录信息,以及统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息。
其中的第二服务器包括播放过所选定的样本多媒体对象的上述其他网络平台的服务器,例如是一个或多个云服务器的集合。在所选定的样本多媒体对象仅在本网络平台服务器独播的情况下,只需统计第一服务器中的播放记录;在所选定的样本多媒体对象仅在其他网络平台服务器播放的情况下,只需统计第二服务器中的播放记录;在所选定的样本多媒体对象在各个网络平台均播放过的情况下,统计第一服务器以及第二服务器上的播放记录并且累加关于该选定的样本网络多媒体对象的在所述第一服务器以及所述第二服务器中的播放记录。
搜索记录信息例如包括搜索次数,具体地,例如基于相应网络多媒体对象的主题所包含的词的检索记录确定该网络多媒体对象的搜索次数以进行统计。此外,播放记录信息例如包括播放次数,在一些示例中还可以包括播放时间长度等信息。每一网络多媒体对象可以为特定的一个视频文件;此外每一网络多媒体对象也可以包括具有相同主题的多个多媒体文件,例如同一部电视剧的多个剧集,统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息包括累加该样本网络多媒体对象所包含的多个多媒体文件的播放次数。
进一步地,为了统计有效的播放记录信息/减小运算量,S101中还可以包含收集相应样本网络多媒体对象于特定时间期间内在所述第二服务器的播放记录信息,其中,所述特定时间期间是基于该样本网络多媒体对象在所述第二服务器内存储的起始时间与最后更新时间确定的。具体地,例如《咱们结婚吧》除了在优酷土豆站播出外,还在搜狐视频播出,相应地在搜狐的连载时间是2013年2月1日(上线时间)至2013年3月1日(最后一集更新时间),则根据本发明的这个示例,仅收集《咱们结婚吧》在上述时段内于搜狐视频的播放记录信息。
S102:基于所述搜索记录信息以及所述播放记录信息,建立关于该组样本网络多媒体对象的搜索与播放关系模型。
具体地,例如利用搜索记录信息作为自变量,节目本身信息(比如类型,导演,主演等)及播放记录信息作为因变量,依据该组样本网络多媒体对象的搜索量及播放量估计回归模型,以建立搜索量与播放量的关系模型而用于后续同类别网络多媒体对象的播放量估计。
S202:将所述待估算的网络多媒体对象进行分类处理。
待估算的网络多媒体对象在本实施例中可以是所关心的在其他网络平台播出的热播电视剧或其他节目。对待估算的网络多媒体对象根据S201所描述的具体方式进行分类处理。
S103:将待估算的网络多媒体对象在所述第一服务器的搜索记录信息输入至相应类别组的搜索与播放关系模型中,以获得所述网络多媒体对象的估计播放信息。
具体地,例如将所关心的热播节目在优酷土豆站内的搜索量作为自变量输入至在S102中建立好的相应类别组的模型当中即可获得输出的所估计得在优酷土豆站内的播放量。例如将《阿凡达》输入至美国科幻电影类别对应的搜索与播放关系模型中。其中,基于建模样本的数量多寡,所建立的搜索与播放关系模型的精度可能有所不同,具体输出的估计播放量在模型较为精确的情况下可以是估计的播放次数,或者在模型较为粗略的情况下,估计播放量可以为预先确定的多个播放次数量级中的一个量级。具体地,模型的精度可以例如通过代入已知的优酷土豆独播剧的搜索量与播放量进行确定。
实施例三:
本实施例在实施例一的基础上,提供一种网络多媒体对象播放信息的估算方法,所述方法用于第一服务器,本实施例中的第一服务器为本网络平台的云服务器,所述方法包括以下步骤:
S101:针对一组样本网络多媒体对象,分别对该组样本网络多媒体对象中的每一个,统计关于该样本网络多媒体对象的在所述第一服务器中的搜索记录信息,以及统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息。
这里的网络多媒体对象例如为音乐、语音等音频。样本网络多媒体对象例如为在网络平台提供播放的历史音乐文件,比如通过本网络平台、以及QQ音乐、百度音乐、酷我等其他网络平台提供的歌曲。其中的第二服务器包括提供所选定的样本多媒体对象的上述其他网络平台的服务器,例如是一个或多个云服务器的集合。在所选定的样本多媒体对象仅在本网络平台服务器独家供应的情况下,只需统计第一服务器中的播放记录;在所选定的样本多媒体对象仅在其他网络平台服务器供应的情况下,只需统计第二服务器中的播放记录;在所选定的样本多媒体对象在各个网络平台均供应的情况下,统计第一服务器以及第二服务器上的播放记录并且累加关于该选定的样本网络多媒体对象的在所述第一服务器以及所述第二服务器中的播放记录。
搜索记录信息例如包括搜索次数,具体地,例如基于相应网络多媒体对象的主题所包含的词的检索记录确定该网络多媒体对象的搜索次数以进行统计。此外,播放记录信息例如包括播放次数,在一些示例中还可以包括播放时间长度等信息。每一网络多媒体对象可以为特定的一个音频文件;此外每一网络多媒体对象也可以包括具有相同主题的多个多媒体文件,例如同一专辑中的多首歌曲,统计关于该样本网络多媒体对象的在所述第一服务器以及/或者第二服务器中的播放记录信息包括累加该样本网络多媒体对象所包含的多个多媒体文件的播放次数。
S102:基于所述搜索记录信息以及所述播放记录信息,建立关于该组样本网络多媒体对象的搜索与播放关系模型。
具体地,例如利用搜索记录信息作为自变量,节目本身信息(比如类型,导演,主演等)及播放记录信息作为因变量,依据样本网络多媒体对象的搜索量及播放量估计回归模型,以建立搜索量与播放量的关系模型而用于后续的估计。
S103:将待估算的网络多媒体对象在所述第一服务器的搜索记录信息输入至所述搜索与播放关系模型中,以获得所述网络多媒体对象的估计播放信息。
待估算的网络多媒体对象在本实施例中可以是所关心的在其他网络平台供应的歌曲,具体地,例如将所关心的热播歌曲在本网络平台站内的搜索量作为自变量输入至在S102中建立好的模型当中即可获得输出的所估计得在本网络平台站内的播放量。其中,基于建模样本的数量多寡,所建立的搜索与播放关系模型的精度可能有所不同,具体输出的估计播放量在模型较为精确的情况下可以是估计的播放次数,或者在模型较为粗略的情况下,估计播放量可以为预先确定的多个播放次数量级中的一个量级。具体地,模型的精度可以例如通过代入已知的本网络平台独家版权歌曲的搜索量与播放量进行确定。
与现有技术相比,本申请所述网络多媒体对象播放信息的估算方法,达到了如下效果:
1)本发明采用的网络多媒体对象播放信息的估算方法能够基于事先构建的模型而仅通过输入用户在本网络平台服务器中的搜索记录得到可能的实际本平台播放量,以较低的复杂度完成估算过程。
2)本发明根据容易获取的用户在本网络平台服务器中的搜索量、播放量以及其他网络平台公开的播放信息构建模型,大大降低了采集建模样本的难度。
3)本发明中针对不同类别的多媒体对象分别进行建模从而可以获得较为精准的模型并据此获得可靠的估算结果。
4)本发明可用于某一多媒体对象在其他网络平台播放而未在本网络平台播放的情况下,估算该多媒体对象在本网络平台的可能播放量水平,从而为多媒体对象版权采购提供有效的历史数据。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。