CN113312515A - 一种播放数据预测方法、系统、电子设备及介质 - Google Patents

一种播放数据预测方法、系统、电子设备及介质 Download PDF

Info

Publication number
CN113312515A
CN113312515A CN202110484815.1A CN202110484815A CN113312515A CN 113312515 A CN113312515 A CN 113312515A CN 202110484815 A CN202110484815 A CN 202110484815A CN 113312515 A CN113312515 A CN 113312515A
Authority
CN
China
Prior art keywords
data
drama
playing
target
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110484815.1A
Other languages
English (en)
Other versions
CN113312515B (zh
Inventor
章佳敏
陆祁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202110484815.1A priority Critical patent/CN113312515B/zh
Publication of CN113312515A publication Critical patent/CN113312515A/zh
Application granted granted Critical
Publication of CN113312515B publication Critical patent/CN113312515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种播放数据预测方法、系统、电子设备及介质,涉及互联网技术领域。方法包括:获取第一时段内的各待播剧目的剧目特征,第一时段为目标剧目的上映时间段;基于各待播剧目的剧目特征,确定播放指标数据,包括:第一时段的总播放数据、目标剧目的长尾系数、目标剧目在第二时段中的播放数据占比,第二时段属于第一时段;基于总播放数据、长尾系数、播放数据占比,确定目标剧目的播放数据预测值;输出目标剧目的预测结果,预测结果包括:总播放数据、长尾系数、播放数据占比中的至少一个,以及,播放数据预测值。本发明利用多种播放指标数据,提高了预测准确性,且为目标剧目应用决策提供了多维度数据支持,能充分满足应用需求。

Description

一种播放数据预测方法、系统、电子设备及介质
技术领域
本发明涉及互联网技术领域,尤其涉及一种播放数据预测方法、系统、电子设备及介质。
背景技术
对于视频播放类软件而言,进行电影的采购、运营、推送等决策时,电影票房是十分关键的参考指标。因此影片票房的预估意义重大。
但是,目前对于影片票房进行预测都是直接预测总票房,这种预测方式得到的结果单一,而对电影的运营决策仅依靠这一结果往往指导力度不够,因此目前对影片票房的预测结果不能满足电影的应用需求,应用效果差。
发明内容
本发明提供一种播放数据预测方法、系统、电子设备及介质,解决现有技术中对影片票房的预测结果单一,不能满足电影的应用需求的问题。
在本发明实施的第一方面,提供了一种播放数据预测方法,包括:
获取第一时段内的各待播剧目的剧目特征,其中,所述第一时段为目标剧目的上映时间段;
基于各待播剧目的所述剧目特征,确定播放指标数据,所述播放指标数据包括:所述第一时段的总播放数据、所述目标剧目的长尾系数、所述目标剧目在第二时段中的播放数据占比,其中,所述第二时段属于所述第一时段;
基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值;
输出所述目标剧目的预测结果,所述预测结果包括:所述总播放数据、所述长尾系数、所述播放数据占比中的至少一个,以及,所述播放数据预测值。
在本发明的第二方面,还提供了一种播放数据预测系统,包括:
第一获取模块,用于获取第一时段内的各待播剧目的剧目特征,其中,所述第一时段为目标剧目的上映时间段;
第一确定模块,用于基于各待播剧目的所述剧目特征,确定播放指标数据,所述播放指标数据包括:所述第一时段的总播放数据、所述目标剧目的长尾系数、所述目标剧目在第二时段中的播放数据占比,其中,所述第二时段属于所述第一时段;
第二确定模块,用于基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值;
输出模块,用于输出所述目标剧目的预测结果,所述预测结果包括:所述总播放数据、所述长尾系数、所述播放数据占比中的至少一个,以及,所述播放数据预测值。
在本发明的第三方面,还提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线;其中,处理器、通信接口以及存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如上所述的播放数据预测方法中的步骤。
在本发明的第四方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上所述的播放数据预测方法。
针对在先技术,本发明具备如下优点:
本发明实施例中,首先获取第一时段内的各待播剧目的剧目特征,第一时段为目标剧目的上映时间段;再基于各待播剧目的剧目特征,确定播放指标数据,播放指标数据包括第一时段的总播放数据、目标剧目的长尾系数、目标剧目在第二时段中的播放占比,第二时段属于第一时段;其中总播放数据能够反映在目标剧目上映时间段内整体市场环境下的播放情况,长尾系数能够反映受剧目品质影响、口碑相传等带来的长尾效应,目标剧目在第二时段的播放占比能够反映目标剧目短期的播放情况;然后基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,而整体市场环境、长尾效应等是影响目标剧目播放情况的重要因素,因此综合总播放数据、长尾系数、播放数据占比等多个播放指标数据进行播放预测,提高了预测的准确性。且最后输出的预测结果包括总播放数据、长尾系数、播放数据占比中的至少一个,以及播放数据预测值多种预测结果,总播放数据、长尾系数、播放数据占比对于目标剧目的推广应用都具有现实指导意义。例如在对目标剧目进行排播量、广告投放量等决策时,长尾系数体现了受剧目品质影响、口碑相传等带来的长尾效应,因此基于长尾系数能够对剧目本身价值做出更加准确地评估,从而得到更适配的排播和广告投放等决策方案。且基于总播放数据、长尾系数、播放数据占比和播放数据预测值,也为目标剧目的推广应用决策提供了多维度的数据支持,能够充分满足应用需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的播放数据预测方法的流程示意图;
图2为本发明实施例提供的播放数据预测方法中子步骤的流程示意图;
图3为本发明实施例提供的播放数据预测系统的示意框图;
图4为本发明实施例提供的电子设备的示意框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解的是,还可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本发明实施例中术语“多个”是指两个或两个以上,其它量词与之类似。
本发明实施例涉及的电子设备,可以是指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备等。电子设备可以是移动终端设备,如移动电话和具有移动终端设备的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。例如,个人通信业务(Personal Communication Service,PCS)电话、无绳电话、会话发起协议(Session InitiatedProtocol,SIP)话机、无线本地环路(Wireless Local Loop,WLL)站、个人数字助理(Personal DigitalAssistant,PDA)等设备。电子设备也可以称为系统、订户单元(subscriber unit)、订户站(subscriber station),移动站(mobilestation)、移动台(mobile)、远程站(remote station)、接入点(access point)、远程终端设备(remote terminal)、接入终端设备(access terminal)、用户终端设备(userterminal)、用户代理(user agent)、用户装置(user device),本发明实施例中并不限定。
图1是本发明实施例提供的播放数据预测方法的流程示意图,参见图1所示,该播放数据预测方法包括:
步骤101:获取第一时段内的各待播剧目的剧目特征,其中,所述第一时段为目标剧目的上映时间段。
这里,通过获取第一时段内的各待播剧目的剧目特征,以综合各待播剧目的剧目特征,来进行目标剧目的播放数据预测,提高预测的准确性。
其中,目标剧目可以是任意需要进行播放预测的剧目。第一时段为目标剧目的上映时间段,可以是任意时间段。
其中,第一时段内的各待播剧目指的是在第一时段内上映的各待播剧目,包括目标剧目。
其中,本发明实施例中所提及的剧目的表现形式可以包括但不限于电影、舞台剧、音乐剧、戏剧、话剧、相声、脱口秀等任意形式,在此不作限定。
基于预测时机的不同,该步骤所获取到的剧目特征也有所不同,后续详述。
步骤102:基于各待播剧目的所述剧目特征,确定播放指标数据,所述播放指标数据包括:所述第一时段的总播放数据、所述目标剧目的长尾系数、所述目标剧目在第二时段中的播放数据占比,其中,所述第二时段属于所述第一时段。
这里,得到各待播剧目的剧目特征后,基于各待播剧目的剧目特征,确定播放指标数据,播放指标数据包括第一时段,即目标剧目上映时间段的总播放数据,目标剧目的长尾系数,以及目标剧目在第二时段中的播放数据占比,第二时段属于第一时段,以基于多种播放指标数据进行播放预测,提高预测的准确性。
其中,第二时段属于第一时段,第二时段可以是第一时段内的任意时段。
其中,总播放数据能够反映在目标剧目上映时间段内整体市场环境下的播放情况。很多情况下上映时间段市场环境会对剧目的播放产生影响,例如在市场环境比较好的情况下上映的剧目播放情况普遍比较好,但在市场环境比较差,如遇到经济危机、病毒传播、洪涝灾害等情况时,上映的剧目播放情况也会出现落差,因此通过总播放数据增加了对整体市场环境的考量,能够提高预测的准确性。
其中,长尾系数能够反映受剧目品质影响、口碑相传等带来的长尾效应。剧目的长尾效应也是影响播放情况的一个重要因素。一般优质的剧目品质、良好的口碑才能释放长尾效应,长尾效应越好播放情况也越好,因此通过长尾系数增加对长尾效应的考量,也能够提高预测的准确性。
以电影为例,一般小于1亿的电影具有较高的长尾系数,如《X生有你2019》首周7天票房总计4544万元,长尾性上下限区间为92%-99%。大于1亿的电影一般具有较低的长尾系数,如《X刃出鞘》首周7天票房总计1.25亿元,长尾性上下限区间为50%-60%。是否长尾,看电影的质量,要结合类型和题材。
其中,目标剧目在第二时段的播放占比能够反映目标剧目短期的播放情况,通过分析目标剧目短期的播放情况,避免了体量过大对预测准确性的不利影响,同样能够提高预测的准确性。
可选的,所述第二时段为所述第一时段内的第一天到第七天。此时步骤102获取的播放指标数据包括目标剧目在第一时段内的第一天到第七天,即首周的播放数据占比,通过分析目标剧目首周的播放情况,避免了体量过大对预测准确性的不利影响。例如假设第一时段为1月24日-2月24日,第二时段可以是1月24日-1月30日。
步骤103:基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值。
这里,基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,且避免了体量过大对预测准确性的不利影响,提高了预测的准确性。
步骤104:输出所述目标剧目的预测结果,所述预测结果包括:所述总播放数据、所述长尾系数、所述播放数据占比中的至少一个,以及,所述播放数据预测值。
这里,输出的预测结果包括总播放数据、长尾系数、播放数据占比中的至少一个,以及播放数据预测值多种预测结果,总播放数据、长尾系数、播放数据占比对于目标剧目的推广应用都具有现实指导意义。例如在对目标剧目进行排播量、广告投放量等决策时,长尾系数体现了受剧目品质影响、口碑相传等带来的长尾效应,因此基于长尾系数能够对剧目本身价值做出更加准确地评估,从而得到更适配的排播和广告投放等决策方案。且基于总播放数据、长尾系数、播放数据占比和播放数据预测值,也为目标剧目的推广应用决策提供了多维度的数据支持,能够充分满足应用需求。
本发明实施例的播放数据预测方法,基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,并避免了体量过大对预测准确性的不利影响,提高了预测的准确性,且能够得到多种预测结果,作为目标剧目进行排播量、广告投放量等决策的重要依据,为决策方案提供了多维度的数据支持,能够充分满足应用需求。
其中,本发明实施例中所提到的播放数据可以包括但不限于以下至少一种:票房、卖座率等。
本发明实施例中对于目标剧目的播放预测,可以是目标剧目上映前,也可以是目标剧目上映后的任意一天。在不同阶段获取到的剧目特征有所不同,下面对两种情况分别进行说明。
情况一:可选的,上述步骤101包括:
在目标剧目上映前,获取第一时段内的各待播剧目的基础数据,以作为各待播剧目的剧目特征。
这里,在目标剧目上映前,由于没有上映后的数据,因此获取各待播剧目的基础数据,作为剧目特征。
需要说明的是,虽然是在目标剧目上映前预测,但是待播剧目的上映时间一般是提前确定好的,所以能够得到前文步骤101所说的第一时段,以及第一时段内的各待播剧目。
其中,所述基础数据包括但不限于如下至少一种:各待播剧目的制作数据、上映前用户倾向数据。
这里,各待播剧目的制作数据能够体现出剧目的基本制作水平,是影响播放数据的主要元素;上映前用户倾向数据能够体现出剧目的受关注度和受众群体,也是影响播放数据的元素。因此,获取各待播剧目的制作数据、上映前用户倾向数据这些基础数据,以作为剧目特征,可对播放数据进行准确预测。
其中,所述制作数据包括但不限于如下至少一项:基本属性信息、后期制作信息、类型信息、演职人员数据、排片信息、上映时间段信息。
这里,各待播剧目的基本属性信息包括但不限于如下至少一项:剧目名称、剧目时长、剧目表现形式、剧目系列等。其中,剧目表现形式包括但不限于电影、舞台剧、音乐剧、戏剧、话剧、相声、脱口秀等。剧目系列指的是由多个具有相关性的剧目组成的系列,如X战警系列、超人系列等。
后期制作信息包括但不限于如下至少一项:导演组信息、制片组信息、编剧信息、摄影组信息等。其中,导演组信息包括但不限于导演身份信息、导演舆情信息、导演前作播放数据、导演前作质量评分数据等。制片组信息包括但不限于制片人身份信息、制片人舆情信息、制片人前作播放数据、制片人前作质量评分数据等。编剧信息包括但不限于编剧身份信息、编剧舆情信息、编剧前作播放数据、编剧前作指令评分数据等。摄影组信息包括但不限于摄影师身份信息、摄影师舆情信息、摄影师前作播放数据、摄影师前作指令评分数据等。
类型信息可包括但不限于如下至少一项:按照地区分类的类型信息、按照年份分类的类型信息、按照情感分类的类型信息、按照题材分类的类型信息、按照规格分类的类型信息等。其中,按照地区分类的类型信息包括但不限于华语、港台、韩剧、美剧、日剧等。按照年份分类的类型信息包括但不限于80年代、90年代、2016-2011等。按照情感分类的类型信息包括但不限于喜剧、悲剧、恐怖、悬疑等。按照题材分类的类型信息包括但不限于爱情、贺岁、动作、枪战、犯罪、惊悚、家庭、奇幻、魔幻、科幻、战争、青春等。按照规格分类的类型信息包括但不限于巨制、院线、独播、网络剧目等。
演职人员数据可包括但不限于如下至少一项:主演信息、配音演员信息。其中,主演信息包括但不限于主演身份信息、主演舆情信息、主演前作播放流量数据、主演前作质量评分数据等。配音演员信息包括但不限于配音演员身份信息、配音演员舆情信息、配音演员前作播放流量数据、配音演员前作质量评分数据等。
排片信息包括但不限于如下至少一项:上映剧场、上映影院、在各剧场上映场次、在各影院上映场次。其中,对于排片信息可通过对网络上排片数据的定时爬取来获取,但并不局限于此。
上映时间段信息包括但不限于如下至少一项:上映日期、上映档期、上映档期与类型交叉信息、上映档期与演员交叉信息、上映档期与导演交叉信息。
这里,上映日期指上映时间段的具体日期,如1月24日-1月30日上映。上映档期指的是上映时间段所属的档期,档期是依据节假日属性对时间段划分获得的,档期如可包括但不限于如下至少一项:春节档、元旦档、贺岁档、国庆档、中秋档、暑期档、五一档、清明档、寒假档、情人节档。节假日的档期有更多的看剧需求,对播放数据预测起到关键作用。
上映档期与类型交叉信息指的是上映档期内上映某种特定类型的剧目,当上映档期与某种特定类型的剧目交叉时一般会带来有益的播放效果。例如春节档与贺岁类剧目交叉,即春节档上映贺岁类的剧目,又例如情人节档与爱情类剧目交叉,即情人节档上映爱情类的剧目,都会增加播放数据。
上映档期与演员交叉信息指的是上映档期内上映某演员主演的剧目,当上映档期与某演员交叉时同样会带来有益的播放效果。例如春节档与大家熟知的喜剧演员交叉,即春节档上映大家熟知的喜剧演员主演的剧目,也会带来播放数据的增加。类似的,上映档期与导演交叉信息指的是上映档期内上映某导演所导的剧目,当上映档期与某导演交叉时同样会带来有益的播放效果。例如春节档与大家熟知的喜剧导演交叉,即春节档上映大家熟知的喜剧导演所导的剧目,也会带来播放数据的增加。
其中,所述上映前用户倾向数据包括但不限于如下至少一项:基于用户倾向操作得到的倾向数据、基于数据倾向分析得到的倾向数据。
这里,用户倾向操作包括但不限于在购票平台购买预售、点赞、收藏、点击想看等操作,基于用户倾向数据可以直接得到倾向数据;另外还可以基于数据分析得到倾向数据,例如,基于演职人员的前作数据来预测得到倾向数据。
特别的,当本发明实施例所提及的剧目的表现形式为电影时,在电影上映前,上述步骤101还可获取各待播剧目点映的播放数据。点映指的是选择在个别的地方影院放映指定的影片,通常是预先放映还未正式上映电影。当下越来越多的电影采取点映的方式,提前点燃市场热情,通过口碑撬动更多的上映后播放数据,因此点映的播放数据也可列入作为预估上映后播放数据的重要考量。
情况二:可选的,上述步骤101包括:
在目标剧目上映后,获取第一时段内的各待播剧目的基础数据与反馈数据,以作为各待播剧目的剧目特征。
这里,在目标剧目上映后,除了能获取各待播剧目的基础数据以外,还能获取到上映后的反馈数据,作为剧目特征。
应当理解,在本方案中,在目标剧目上映后,也可以直接将基础数据或反馈数据作为剧目特征执行该播放数据预测方法,但实际场景中,以基础数据与反馈数据都作为剧目特征来执行该方法,更有利于得到与实际数据相近的结果,有利于提高预测结果的准确度,因此,本案主要对上映后利用基础数据与反馈数据作为剧目特征的实现方式进行说明。
其中,基础数据可参照情况一的描述,在此不做赘述。所述反馈数据包括但不限于如下至少一种:播放数据、用户反馈数据;
这里,各待播剧目的播放数据和用户反馈数据都能够直观地体现出剧目上映后的受欢迎程度,是预测播放数据的有力依据,因此,获取各待播剧目的播放数据以及用户反馈数据,以作为剧目特征,可以对播放数据进行准确预测。
其中,所述播放数据包括但不限于如下至少一项:票房数据、卖座率。
这里,需要说明的是,步骤101在目标剧目上映后,所获取的播放数据指的是目标剧目上映后但未到下映日时,已经上映的这段时间的播放数据,而步骤103所确定的播放数据预测值指的是目标剧目在整个上映期间的播放数据。在目标剧目上映后但未到下映日的任意一天,可以得到目标剧目已上映的这段时间的播放数据,以对目标剧目从上映日的第一天到下映日的整个上映期间,即第一时段内的播放数据进行预测,得到播放数据预测值。其中,所述用户反馈数据包括但不限于第三方平台反馈数据。
这里,第三方平台反馈数据指的是从第三方平台获得的各待播剧目的反馈数据。其中,第三方平台可以包括但不限于影评平台,例如豆X等;第三方平台也可以包括但不限于公众交互类平台,例如微X、知X、微X朋友圈等;第三方平台还可以包括但不限于第三方视频平台,例如X酷视频、X讯视频等。
需要说明的是,上述列举的特征数据仅为举例说明,本发明实施例的特征数据并不局限于上述列举。
本发明实施例中,可以利用一个预测模型直接预测各播放指标数据,此时,上述步骤102包括:
将各待播剧目的所述剧目特征输入总预测模型,并获取所述总预测模型输出的各播放指标数据。
这里,先基于机器学习方法训练得到总预测模型,将各待播剧目的所述剧目特征输入该总预测模型,能够得到总预测模型输出的第一时段的总播放数据、目标剧目的长尾系数、目标剧目在第二时段中的播放数据占比多种播放指标数据。
其中,可获取已上映剧目的基础数据、反馈数据、上映时间段内的总播放数据、长尾系数和播放数据占比来构建样本数据集,然后从样本数据集中选取多个样本数据,将样本数据的基础数据、反馈数据作为输入,上映时间段内的总播放数据、长尾系数和播放数据占比作为输出,对总预测模型不断进行训练,直到总预测模型的预测结果与实际值的误差在预设范围内。
关于已上映剧目的基础数据、反馈数据可参见前文,在此不做赘述。
或者,本发明实施例中,也可以利用多个预测模型分别预测各播放指标数据,此时,上述步骤102包括:
将各待播剧目的所述剧目特征分别输入预先训练的多个指标预测模型,并获取各指标预测模型分别输出的播放指标数据。
这里,可基于机器学习方法训练多个指标预测模型,如用于预测总播放数据的指标预测模型、用于预测长尾系数的指标预测模型、用于预测播放数据占比的指标预测模型,然后将各待播剧目的剧目特征分别输入到各个指标预测模型中,得到每个指标预测模型分别输出的播放指标数据。如将各待播剧目的剧目特征分别输入到用于预测总播放数据的指标预测模型、用于预测长尾系数的指标预测模型、用于预测播放数据占比的指标预测模型,得到各指标预测模型分别输出的第一时段的总播放数据、目标剧目的长尾系数、目标剧目在第二时段中的播放数据占比。
其中,可获取已上映剧目的基础数据、反馈数据、上映时间段内的总播放数据、长尾系数和播放数据占比来构建样本数据集,然后从样本数据集中选取多个样本数据,分别对各指标预测模型进行训练。其中对于各指标预测模型所选取的样本数据可以相同也可以不同。如将样本数据的基础数据、反馈数据作为输入,上映时间段内的总播放数据作为输出,对用于预测总播放数据的指标预测模型不断进行训练,直到该指标预测模型的预测结果与实际值的误差在预设范围内;将样本数据的基础数据、反馈数据作为输入,长尾系数作为输出,对用于预测长尾系数的指标预测模型不断进行训练,直到该指标预测模型的预测结果与实际值的误差在预设范围内;将样本数据的基础数据、反馈数据作为输入,播放数据占比作为输出,对用于预测播放数据占比的指标预测模型不断进行训练,直到该指标预测模型的预测结果与实际值的误差在预设范围内。
关于已上映剧目的基础数据、反馈数据可参见前文,在此不做赘述。
可选的,所述总预测模型或者所述指标预测模型包括:由梯度提升决策树GBDT构建的模型、由逻辑回归LR构建的模型和由K最邻近KNN构建的模型中的一项或多项。
这里,可以从由GBDT(GradientBoosting Decision Tree,梯度提升决策树)构建的模型、由LR(Logistic Regression,逻辑回归)构建的模型和由KNN(K-NearestNeighbor,K最邻近)构建的模型中选择一项进行总预测模型或者指标预测模型训练,并得到相应的总预测模型或者指标预测模型;也可从由GBDT构建的模型、由LR构建的模型和由KNN构建的模型中选择多项分别进行总预测模型或者指标预测模型训练,相应的会得到多个总预测模型或者指标预测模型,可从这多个总预测模型或者指标预测模型中选择预测结果最准确的一个,作为相应的总预测模型或者指标预测模型,或者也可从这多个总预测模型或者指标预测模型中随机选择一个,作为相应的总预测模型或者指标预测模型。
在上映前,获得各待播剧目的基础数据,或者在上映后,获得各待播剧目的基础数据与反馈数据以后,需要把这些数据输入到预测模型中进行处理,但这些数据的格式可能并不符合模型的输入要求,因此需要对获得的基础数据或反馈数据进行预处理,以符合模型的输入要求。
具体的,可根据数据的类型进行预处理,例如对于数值类的数据可直接输入,对于非数值类的数据可以转化为数值后输入。如对于剧目的表现形式数据可设置编号,对于导演、制片、编剧、主演、摄影、配音演员等人物的信息可综合分析得到舆情指数,对于类型信息可设置编号,对于排片信息可综合分析得到上映剧场个数、上映影院个数等,对于上映档期可设置编号,对于用户倾向操作数据可设置关键字编号或者分析得到操作次数,对于用户反馈数据同样可设置关键字编号或者分析得到操作次数等。
对获取得到的视频集合的基础数据或反馈数据进行预处理后,获得特征数据,再利用预测模型处理特征数据,即可得到预测模型输出的总播放数据、长尾系数和播放数据占比。
本发明实施例中,如果是在目标剧目上映前预测,可以在目标剧目上映后的任意一天,利用上映后的数据对预测模型进行调整;或者如果是在目标剧目上映后短期内(如1/2天)预测,可以在目标剧目上映后一段时间(如1周),利用之后的播放数据对预测模型进行调整。下面进行详细介绍。
可选的,如图2所示,所述方法还包括:
步骤105:当所述目标剧目上映后,获取各待播剧目的实际播放数据。
这里,通过获取目标剧目上映后各待播剧目的实际播放数据,以对预测模型进行调整。其中,如果是在目标剧目上映前进行的预测,可以在目标剧目上映后的任意一天获取实际播放数据;如果是在目标剧目上映后短期内进行的预测,可以在目标剧目上映后一段时间获取实际播放数据。
步骤106:基于所述实际播放数据,调整所述总预测模型和/或所述指标预测模型。
这里,基于上映后的实际播放数据,调整总预测模型和/或指标预测模型,能够进一步提高模型预测的准确性。
可选的,上述步骤106可基于目标剧目的实际播放数据,更新或者重新训练总预测模型和/或指标预测模型。
可选的,上述步骤106的执行过程可以是,假设步骤105是在目标剧目上映后N天(N为大于或等于1的整数),获取的各待播剧目的实际播放数据,则基于上映后N天各待播剧目的实际播放数据,获取上映后N天的实际总播放数据、上映后N天目标剧目的实际长尾系数、上映后N天目标剧目的实际播放数据占比;然后在已经训练好的总预测模型和/或指标预测模型的基础上,将各待播剧目的基础数据作为输入,上映后N天的实际总播放数据、上映后N天目标剧目的实际长尾系数、上映后N天目标剧目的实际播放数据占比作为输出,再次对总预测模型和/或指标预测模型进行训练,以更新模型;或者将各待播剧目的基础数据、上映后N天的实际总播放数据、上映后N天目标剧目的实际长尾系数、上映后N天目标剧目的实际播放数据占比作为一个样本数据,结合已上映剧目构建的样本数据集中的样本数据,重新对总预测模型和/或指标预测模型进行训练。
此时,通过上映后的实际播放数据,对总预测模型和/或指标预测模型进行调整,提高了播放指标数据预测的准确性,从而提高了播放数据预测的准确性,以保证视频排播量、广告投放量等决策方案的准确性。
利用模型预测得到总播放数据、长尾系数和播放数据占比之后,需要基于总播放数据、长尾系数和播放数据占比,获取目标剧目的播放数据预测值,以作为目标剧目的排播量、广告投放量等决策的重要依据。下面对基于总播放数据、长尾系数和播放数据占比,确定目标剧目的播放数据预测值,即步骤103的实现过程进行介绍。可选的,上述步骤103包括:
基于目标关系,确定所述目标剧目的播放数据预测值;
其中,所述目标关系为:第一乘积等于第二乘积,其中,所述第一乘积为所述目标剧目的播放数据预测值与所述长尾系数之积,所述第二乘积为所述总播放数据与所述播放数据占比之积。
这里,目标剧目的长尾系数理论上等于目标剧目短期的播放数据,比上目标剧目在整个上映期间的播放数据,本发明实施例中目标剧目短期的播放数据即为目标剧目在第二时段中的播放数据,目标剧目在整个上映期间的播放数据即为目标剧目的播放数据预测值,因此本发明实施例中目标剧目的长尾系数等于目标剧目在第二时段中的播放数据,比上目标剧目的播放数据预测值,转换可得,长尾数据与目标剧目的播放数据预测值之积,即第一乘积,等于目标剧目在第二时段中的播放数据。而目标剧目在第二时段中的播放数据占比理论上等于目标剧目在第二时段中的播放数据,比上第一时段各待播数据的总播放数据,转换可得,总播放数据与播放数据占比之积,即第二乘积,也等于目标剧目在第二时段中的播放数据。通过上述可知第一乘积等于第二乘积,从而得到上述目标关系。
此时,目标剧目的播放数据预测值与长尾系数、总播放数据、播放数据占比之间存在目标关系,基于该目标关系以及确定出的长尾系数、总播放数据、播放数据占比,能够准确确定目标剧目的播放数据预测值。
具体的,假设总播放数据为A,播放数据占比为B,长尾系数为S,目标剧目的播放数据预测值为Q,则基于上述目标关系可以得到如下公式:
Q=A*B/S。
通过上述公式的计算即可确定出目标剧目的播放数据预测值。
当然,通过上述公式计算目标剧目的播放数据预测值的方式仅为本发明实施例的一种可选的实施方式,本发明实施例也可采用其他方式基于上述目标关系,确定目标剧目的播放数据预测值,例如将长尾系数、总播放数据、播放数据占比分别乘上各自设定的权重之后,再利用目标关系计算得到目标剧目的播放数据预测值。
此时,基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,且避免了体量过大对预测准确性的不利影响,提高了预测的准确性。
本发明实施例中,基于总播放数据、长尾系数、播放数据占比,确定出目标剧目的播放数据预测值之后,可输出包括总播放数据、长尾系数、播放数据占比中的至少一个,以及播放数据预测值的预测结果,利用该预测结果可以实现对目标剧目的应用决策,下面进行介绍。
可选的,上述步骤104输出所述目标剧目的预测结果之后,所述方法还包括:
基于所述目标剧目的预测结果,确定所述目标剧目在平台的排播量和/或广告投放量。
这里,输出的预测结果包括总播放数据、长尾系数、播放数据占比中的至少一个,以及播放数据预测值多种预测结果,总播放数据、长尾系数、播放数据占比和播放数据预测值对于目标剧目的推广应用都具有现实指导意义,基于总播放数据、长尾系数、播放数据占比和播放预测值能够对目标剧目价值做出更加准确地评估,从而得到更适配的排播量和广告投放量决策方案。且基于总播放数据、长尾系数、播放数据占比和播放数据预测值,也为目标剧目的推广应用决策提供了多维度的数据支持,能够充分满足应用需求。因此基于总播放数据、长尾系数、播放数据占比和播放数据预测值,确定出目标剧目在平台的排播量和广告投放量更加准确,符合应用需求。
具体的,如可预先建立不同级别的播放指标数据,同时指定不同级别的播放指标数据中总播放数据、长尾系数、播放数据占比和播放数据预测值的数值范围;并建立不同级别的排播量和/或广告投放量,同时指定基于不同级别的排播量和/或广告投放量对应的排播量和/或广告投放量的量级范围;然后建立不同级别的排播量和/或广告投放量与不同级别的播放指标数据之间的对应关系。基于所述目标剧目的预测结果,确定所述目标剧目在平台的排播量和/或广告投放量可以包括:,先根据播放数据预测值,以及总播放数据、长尾系数、播放数据占比中的至少一个确定对应的播放指标数据级别;其中,如果播放数据预测值与总播放数据、长尾系数、播放数据占比对应到不同级别的播放指标数据,则选取最小级别的播放指标数据;然后根据播放指标数据级别确定对应的排播量级别和/或广告投放量级别;最后基于对应的排播量级别和/或广告投放量级别,确定目标剧目在平台的排播量和/或广告投放量。
以广告投放量为例,如可预先将播放指标数据分成三个级别,其中第一级别的总播放数据在100-200万、长尾系数范围在60%-100%、播放数据占比在0-10%、播放数据预测值在10-50万,第二级别的的总播放数据在200-400万、长尾系数范围在30%-60%、播放数据占比在10-20%、播放数据预测值在50-100万,第三级别的总播放数据在400-800万、长尾系数范围在0-30%、播放数据占比在20-50%、播放数据预测值在100-200万。同时可将广告投放量按照量级分成三个级别,其中第一级别的广告投放量在1-3个,第二级别的广告投放量在3-6个,第三级别的广告投放量在6-10个。并可建立第一级别的播放指标数据与第一级别的广告投放量之间的对应关系、第二级别的播放指标数据与第二级别的广告投放量之间的对应关系、第三级别的播放指标数据与第三级别的广告投放量之间的对应关系。假设目标剧目的总播放数据为500万、长尾系数为75%、播放数据占比为30%、播放数据预测值为150万,则可确定目标剧目的长尾系数在第三级别;然后基于对应关系可确定第三级别的长尾系数对应第三级别的广告投放量;最后基于第三级别的广告投放量,可确定目标剧目在平台的广告投放量为6-10个。
当然,上述通过建立对应关系来确定排播量和/或广告投放量的方式仅为一种优选的实施方式,并不局限于此。
本发明实施例的播放数据预测方法,基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,并避免了体量过大对预测准确性的不利影响,提高了预测的准确性,且能够得到多种预测结果,作为目标剧目进行排播量、广告投放量等决策的重要依据,为决策方案提供了多维度的数据支持,能够充分满足应用需求。
本发明实施例的播放数据预测方法,当剧目类型为电影,播放数据为票房时,可实现对电影票房的自动预测,以作为电影采购、排播、广告投放等的重要商业智能参考。
参见图3所示,本发明的实施例还提供了一种播放数据预测系统300,包括:
第一获取模块301,用于获取第一时段内的各待播剧目的剧目特征,其中,所述第一时段为目标剧目的上映时间段;
第一确定模块302,用于基于各待播剧目的所述剧目特征,确定播放指标数据,所述播放指标数据包括:所述第一时段的总播放数据、所述目标剧目的长尾系数、所述目标剧目在第二时段中的播放数据占比,其中,所述第二时段属于所述第一时段;
第二确定模块303,用于基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值;
输出模块304,用于输出所述目标剧目的预测结果,所述预测结果包括:所述总播放数据、所述长尾系数、所述播放数据占比中的至少一个,以及,所述播放数据预测值。
本发明实施例的播放数据预测系统300,基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,并避免了体量过大对预测准确性的不利影响,提高了预测的准确性,且能够得到多种预测结果,作为目标剧目进行排播量、广告投放量等决策的重要依据,为决策方案提供了多维度的数据支持,能够充分满足应用需求。
可选的,所述第一获取模块301包括:
第一获取子模块,用于在目标剧目上映前,获取第一时段内的各待播剧目的基础数据,以作为各待播剧目的剧目特征;
其中,所述基础数据包括如下至少一种:各待播剧目的制作数据、上映前用户倾向数据;
其中,所述制作数据包括如下至少一项:基本属性信息、后期制作信息、类型信息、演职人员数据、排片信息、上映时间段信息;
所述上映前用户倾向数据包括如下至少一项:基于用户倾向操作得到的倾向数据、基于数据倾向分析得到的倾向数据。
可选的,所述第一获取模块301包括:
第二获取子模块,用于在目标剧目上映后,获取第一时段内的各待播剧目的基础数据与反馈数据,以作为各待播剧目的剧目特征;
其中,所述反馈数据包括如下至少一种:播放数据、用户反馈数据;
其中,所述播放数据包括如下至少一项:票房数据、卖座率;
所述用户反馈数据包括第三方平台反馈数据。
可选的,所述第一确定模块302包括:
第一确定子模块,用于将各待播剧目的所述剧目特征输入总预测模型,并获取所述总预测模型输出的各播放指标数据;或者,
第二确定子模块,用于将各待播剧目的所述剧目特征分别输入预先训练的多个指标预测模型,并获取各指标预测模型分别输出的播放指标数据。
可选的,所述系统还包括:
第二获取模块,用于当所述目标剧目上映后,获取各待播剧目的实际播放数据;
调整模块,用于基于所述实际播放数据,调整所述总预测模型和/或所述指标预测模型。
可选的,所述总预测模型或者所述指标预测模型包括:由梯度提升决策树GBDT构建的模型、由逻辑回归LR构建的模型和由K最邻近KNN构建的模型中的一项或多项。
可选的,所述第二确定模块303包括:
第三确定子模块,用于基于目标关系,确定所述目标剧目的播放数据预测值;
其中,所述目标关系为:第一乘积等于第二乘积,其中,所述第一乘积为所述目标剧目的播放数据预测值与所述长尾系数之积,所述第二乘积为所述总播放数据与所述播放数据占比之积。
可选的,所述系统还包括:
第三确定模块,用于基于所述目标剧目的预测结果,确定所述目标剧目在平台的排播量和/或广告投放量。
本发明实施例的播放数据预测系统300,基于总播放数据、长尾系数、播放数据占比,来确定目标剧目的播放数据预测值,增加了对上映时间段内整体市场环境的考量以及长尾效应的考量,并避免了体量过大对预测准确性的不利影响,提高了预测的准确性,且能够得到多种预测结果,作为目标剧目进行排播量、广告投放量等决策的重要依据,为决策方案提供了多维度的数据支持,能够充分满足应用需求。
对于上述系统实施例而言,由于其与方法实施例基本相似,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,该电子设备可以是服务器。如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。
存储器403,用于存放计算机程序。
处理器401用于执行存储器403上所存放的程序时,实现如上所述的播放数据预测方法中的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(RandomAccess Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable GateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中所述的播放数据预测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中所述的播放数据预测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,包含在本发明的保护范围内。

Claims (11)

1.一种播放数据预测方法,其特征在于,包括:
获取第一时段内的各待播剧目的剧目特征,其中,所述第一时段为目标剧目的上映时间段;
基于各待播剧目的所述剧目特征,确定播放指标数据,所述播放指标数据包括:所述第一时段的总播放数据、所述目标剧目的长尾系数、所述目标剧目在第二时段中的播放数据占比,其中,所述第二时段属于所述第一时段;
基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值;
输出所述目标剧目的预测结果,所述预测结果包括:所述总播放数据、所述长尾系数、所述播放数据占比中的至少一个,以及,所述播放数据预测值。
2.根据权利要求1所述的播放数据预测方法,其特征在于,所述获取第一时段内的各待播剧目的剧目特征,包括:
在目标剧目上映前,获取第一时段内的各待播剧目的基础数据,以作为各待播剧目的剧目特征;
其中,所述基础数据包括如下至少一种:各待播剧目的制作数据、上映前用户倾向数据;
其中,所述制作数据包括如下至少一项:基本属性信息、后期制作信息、类型信息、演职人员数据、排片信息、上映时间段信息;
所述上映前用户倾向数据包括如下至少一项:基于用户倾向操作得到的倾向数据、基于数据倾向分析得到的倾向数据。
3.根据权利要求1所述的播放数据预测方法,其特征在于,所述获取第一时段内的各待播剧目的剧目特征,包括:
在目标剧目上映后,获取第一时段内的各待播剧目的基础数据与反馈数据,以作为各待播剧目的剧目特征;
其中,所述反馈数据包括如下至少一种:播放数据、用户反馈数据;
其中,所述播放数据包括如下至少一项:票房数据、卖座率;
所述用户反馈数据包括第三方平台反馈数据。
4.根据权利要求1-3中任一项所述的播放数据预测方法,其特征在于,所述基于各待播剧目的所述剧目特征,确定播放指标数据,包括:
将各待播剧目的所述剧目特征输入总预测模型,并获取所述总预测模型输出的各播放指标数据;或者,
将各待播剧目的所述剧目特征分别输入预先训练的多个指标预测模型,并获取各指标预测模型分别输出的播放指标数据。
5.根据权利要求4所述的播放数据预测方法,其特征在于,所述方法还包括:
当所述目标剧目上映后,获取各待播剧目的实际播放数据;
基于所述实际播放数据,调整所述总预测模型和/或所述指标预测模型。
6.根据权利要求4所述的播放数据预测方法,其特征在于,所述总预测模型或者所述指标预测模型包括:由梯度提升决策树GBDT构建的模型、由逻辑回归LR构建的模型和由K最邻近KNN构建的模型中的一项或多项。
7.根据权利要求1-3中任一项所述的播放数据预测方法,其特征在于,基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值的步骤包括:
基于目标关系,确定所述目标剧目的播放数据预测值;
其中,所述目标关系为:第一乘积等于第二乘积,其中,所述第一乘积为所述目标剧目的播放数据预测值与所述长尾系数之积,所述第二乘积为所述总播放数据与所述播放数据占比之积。
8.根据权利要求1-3中任一项所述的播放数据预测方法,其特征在于,输出所述目标剧目的预测结果之后,所述方法还包括:
基于所述目标剧目的预测结果,确定所述目标剧目在平台的排播量和/或广告投放量。
9.一种播放数据预测系统,其特征在于,包括:
第一获取模块,用于获取第一时段内的各待播剧目的剧目特征,其中,所述第一时段为目标剧目的上映时间段;
第一确定模块,用于基于各待播剧目的所述剧目特征,确定播放指标数据,所述播放指标数据包括:所述第一时段的总播放数据、所述目标剧目的长尾系数、所述目标剧目在第二时段中的播放数据占比,其中,所述第二时段属于所述第一时段;
第二确定模块,用于基于所述总播放数据、所述长尾系数、所述播放数据占比,确定所述目标剧目的播放数据预测值;
输出模块,用于输出所述目标剧目的预测结果,所述预测结果包括:所述总播放数据、所述长尾系数、所述播放数据占比中的至少一个,以及,所述播放数据预测值。
10.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线;其中,处理器、通信接口以及存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如权利要求1至8任一项所述的播放数据预测方法中的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8任一项所述的播放数据预测方法。
CN202110484815.1A 2021-04-30 2021-04-30 一种播放数据预测方法、系统、电子设备及介质 Active CN113312515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110484815.1A CN113312515B (zh) 2021-04-30 2021-04-30 一种播放数据预测方法、系统、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110484815.1A CN113312515B (zh) 2021-04-30 2021-04-30 一种播放数据预测方法、系统、电子设备及介质

Publications (2)

Publication Number Publication Date
CN113312515A true CN113312515A (zh) 2021-08-27
CN113312515B CN113312515B (zh) 2023-07-14

Family

ID=77371456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110484815.1A Active CN113312515B (zh) 2021-04-30 2021-04-30 一种播放数据预测方法、系统、电子设备及介质

Country Status (1)

Country Link
CN (1) CN113312515B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191689A1 (en) * 2009-01-27 2010-07-29 Google Inc. Video content analysis for automatic demographics recognition of users and videos
US20130204664A1 (en) * 2012-02-07 2013-08-08 Yeast, LLC System and method for evaluating and optimizing media content
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
CN106101832A (zh) * 2016-07-19 2016-11-09 东软集团股份有限公司 用于评价互联网媒体的指标的计算方法和装置
CN106651426A (zh) * 2016-10-11 2017-05-10 北京红马传媒文化发展有限公司 有价值长尾项目的筛选方法
CN107133699A (zh) * 2017-05-12 2017-09-05 百度国际科技(深圳)有限公司 电影票房趋势预测方法和装置、设备、存储介质
US20180012248A1 (en) * 2010-08-20 2018-01-11 Blue Kai, Inc. Real time audience forecasting
CN108427658A (zh) * 2018-03-12 2018-08-21 北京奇艺世纪科技有限公司 一种数据预测方法、装置及电子设备
CN109949089A (zh) * 2019-03-18 2019-06-28 腾讯科技(深圳)有限公司 一种确定展示率的方法、装置及终端
US10748215B1 (en) * 2017-05-30 2020-08-18 Michael C. Winfield Predicting box office performance of future film releases based upon determination of likely patterns of competitive dynamics on a particular future film release date
CN112511901A (zh) * 2020-12-07 2021-03-16 北京秒针人工智能科技有限公司 综艺剧目播放量预测方法、系统、计算机设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191689A1 (en) * 2009-01-27 2010-07-29 Google Inc. Video content analysis for automatic demographics recognition of users and videos
US20180012248A1 (en) * 2010-08-20 2018-01-11 Blue Kai, Inc. Real time audience forecasting
US20130204664A1 (en) * 2012-02-07 2013-08-08 Yeast, LLC System and method for evaluating and optimizing media content
CN105635762A (zh) * 2016-01-15 2016-06-01 深圳大学 一种基于深度信念网络的视频热度预测方法及其系统
CN106101832A (zh) * 2016-07-19 2016-11-09 东软集团股份有限公司 用于评价互联网媒体的指标的计算方法和装置
CN106651426A (zh) * 2016-10-11 2017-05-10 北京红马传媒文化发展有限公司 有价值长尾项目的筛选方法
CN107133699A (zh) * 2017-05-12 2017-09-05 百度国际科技(深圳)有限公司 电影票房趋势预测方法和装置、设备、存储介质
US10748215B1 (en) * 2017-05-30 2020-08-18 Michael C. Winfield Predicting box office performance of future film releases based upon determination of likely patterns of competitive dynamics on a particular future film release date
CN108427658A (zh) * 2018-03-12 2018-08-21 北京奇艺世纪科技有限公司 一种数据预测方法、装置及电子设备
CN109949089A (zh) * 2019-03-18 2019-06-28 腾讯科技(深圳)有限公司 一种确定展示率的方法、装置及终端
CN112511901A (zh) * 2020-12-07 2021-03-16 北京秒针人工智能科技有限公司 综艺剧目播放量预测方法、系统、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113312515B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
US11588767B2 (en) System and interface that facilitate selecting videos to share in a messaging application
US9788066B2 (en) Information processing apparatus, information processing method, computer program, and information sharing system
JP5981024B2 (ja) ソーシャルネットワーキングを介してテレビ番組およびビデオ番組を共有すること
US8825668B2 (en) Method and apparatus for updating song playlists based on received user ratings
JP2020017297A (ja) スマートデバイス用リソースプッシュ方法、スマートデバイス及びコンピュータ可読記憶媒体
CN109165302A (zh) 多媒体文件推荐方法及装置
US11234051B2 (en) Predictive media routing
WO2022052749A1 (zh) 一种消息处理方法、装置、设备及存储介质
CN111279709B (zh) 提供视频推荐
CN109635155A (zh) 为用户推送视频的方法、装置、电子设备及存储介质
WO2016115943A1 (zh) 一种音乐推荐方法及装置
US11388561B2 (en) Providing a summary of media content to a communication device
US20170094364A1 (en) Social news aggregation and distribution
CN109688217B (zh) 一种消息推送方法、装置及电子设备
US20140163956A1 (en) Message composition of media portions in association with correlated text
US11960536B2 (en) Methods and systems for organizing music tracks
CN113312515B (zh) 一种播放数据预测方法、系统、电子设备及介质
CN110502307A (zh) 一种基于Android平台的小说阅读器
CN111984866B (zh) 一种数据的排行榜生成方法及装置
US11960537B1 (en) User-defined mixed playlist playback mode
US20230410508A1 (en) Systems, methods, and apparatuses for selecting/generating visual representations of media content
JP4961760B2 (ja) コンテンツ出力装置、及びコンテンツ出力方法
CN116541588A (zh) 内容推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant