CN106339771A - 一种影片票房数据的预测方法及装置 - Google Patents
一种影片票房数据的预测方法及装置 Download PDFInfo
- Publication number
- CN106339771A CN106339771A CN201610648318.XA CN201610648318A CN106339771A CN 106339771 A CN106339771 A CN 106339771A CN 201610648318 A CN201610648318 A CN 201610648318A CN 106339771 A CN106339771 A CN 106339771A
- Authority
- CN
- China
- Prior art keywords
- box office
- data
- film
- office data
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012544 monitoring process Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims description 84
- 238000000605 extraction Methods 0.000 claims description 18
- 238000004140 cleaning Methods 0.000 claims description 15
- 241001061260 Emmelichthys struhsakeri Species 0.000 claims description 9
- 238000012417 linear regression Methods 0.000 claims description 8
- 238000013500 data storage Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims description 3
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 3
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 3
- 235000008434 ginseng Nutrition 0.000 claims description 3
- 230000006870 function Effects 0.000 description 9
- 238000012216 screening Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种影片票房数据的预测方法及装置,该方法包括:获取待预测影片的上映类型;当待预测影片为首映影片时,根据待预测影片的首映日期的类型和首映日放映时间段的类型从票房数据预测模型中选取相应的票房数据预测子模型;当待预测影片为非首映影片时,获取待预测影片的当前票房数据;根据预测日的类型从票房数据预测模型中选取相应的票房数据预测子模型。本发明实施例通过根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,同时,选用专资办发布的票房数据、实时票房数据、监控网站的售票订单数据这三类数据作为模型输入数据,从而提高了票房预测的准确度,进而能够对影院的排片起到准确地指导作用。
Description
技术领域
本发明涉及电影票房统计的技术领域,具体而言,涉及一种影片票房数据的预测方法及装置。
背景技术
目前,随着中国电影市场的快速发展,电影上映量也随之增加,电影的票房数据作为电影行业的重要指标之一,由于电影的次日票房数据对于各个影院的排片安排具有重要的指导意义,因而,准确地预测电影的次日票房数据显得十分重要。
当前,相关技术中提供了一种影片票房数据的预测方法,主要是查看一些专业影评人结合专资办发布的前几日的影片的票房数据根据经验预估的该影片的次日票房数据。在实现本发明的过程中,发明人发现相关技术中至少存在以下问题:采用目前的影片票房数据的预测方法来确定影片次日票房数据存在准确度低、参考性差的问题,无法实现对影院的排片起到准确地指导作用。
发明内容
有鉴于此,本发明实施例的目的在于提供一种影片票房数据的预测方法及装置,以提高票房预测的准确度,进而实现对影院的排片起到准确地指导作用。
第一方面,本发明实施例提供了一种影片票房数据的预测方法,该方法包括:
获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;
当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;
当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,上述获取待预测影片的上映类型之前,还包括:
获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;
采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据,包括:
获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;
根据提取到的多个所述特征值生成所述待预测影片的特征向量;
根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的首映日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,上述利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据,包括:
对输入的所述当前票房数据进行特征提取,得到多个特征值;
根据提取到的多个所述特征值生成所述待预测影片的特征向量;
根据所述特征向量和线性公式y2=WX+b计算得到所述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,上述方法还包括:
采用流式滚动抓取数据的方式从监控的售票系统中抓取当日多个影院的多个场次座位占用数据,并将抓取到的所述场次座位占用数据依次存入相应的数据库中;
将所述数据库中的场次座位占用数据输入至预先训练的票房数据清洗模型,对所述场次座位占用数据进行清洗,得到清洗后的场次座位占用数据;
将清洗后的场次座位占用数据输入至预先训练的票房数据计算模型,利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,并将所述各个影片截止目前时刻的当日全国票房数据存入至票房数据存储数据库中;
根据所述待预测影片的影片名称从所述票房数据存储数据库中调取所述待预测影片的实时票房数据。
结合第一方面的第四种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,上述利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,包括:
根据清洗后的场次座位占用数据计算各个影片的特征参量的实际数值,其中,所述特征参量包括以下中的一种或者多种:当日抓取的影片的场次数、当日抓取的影片的总场次座位占用数、前一日抓取的影片的场次数、或者前一日抓取的影片的总场次座位占用数;
当影片为非首映影片时,从票房数据计算模型中调取所述影片对应的特征参量的特征系数,以及当影片为首映影片时,将票房数据计算模型中所有首映影片的各个特征参量的特征系数的平均值作为所述影片对应的各个特征参量的特征系数;
根据公式所述各个特征参量的特征系数和各个所述特征参量的实际数值,计算得到所述影片截止目前时刻的当日全国票房数据,其中,Y表示影片的当日全国票房数据,i表示影片各个特征参量的序号,wi表示第i个特征参量对应的特征系数,xi表示第i个特征参量的实际数值。
第二方面,本发明实施例还提供了一种影片票房数据的预测装置,该装置包括:
上映类型获取模块,用于获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;
第一票房数据预测模块,用于当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;
第二票房数据预测模块,用于当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,上述装置还包括:
训练样本获取模块,用于获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;
预测模型训练模块,用于采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,上述第一票房数据预测模块包括:
第一特征提取单元,用于获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;
第一特征向量确定单元,用于根据提取到的多个所述特征值生成所述待预测影片的特征向量;
首映日票房数据计算单元,用于根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,上述第二票房数据预测模块包括:
第二特征提取单元,用于对输入的所述当前票房数据进行特征提取,得到多个特征值;
第二特征向量确定单元,用于根据提取到的多个所述特征值生成所述待预测影片的特征向量;
次日票房数据计算单元,用于根据所述特征向量和线性公式y2=WX+b计算得到所述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
在本发明实施例提供的影片票房数据的预测方法及装置中,获取待预测影片的上映类型;当待预测影片为首映影片时,根据待预测影片的首映日期的类型和首映日放映时间段的类型从票房数据预测模型中选取相应的票房数据预测子模型;当待预测影片为非首映影片时,获取待预测影片的当前票房数据;根据预测日的类型从票房数据预测模型中选取相应的票房数据预测子模型。本发明实施例通过根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,同时,选用专资办发布的票房数据、实时票房数据、监控网站的售票订单数据这三类数据作为模型输入数据,从而提高了票房预测的准确度,进而能够对影院的排片起到准确地指导作用。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的一种影片票房数据的预测方法的流程示意图;
图2示出了本发明实施例所提供的另一种影片票房数据的预测方法的流程示意图;
图3示出了本发明实施例所提供的又一种影片票房数据的预测方法的流程示意图;
图4示出了本发明实施例所提供的票房数据预测模型中的各个子模型的构成示意图;
图5示出了本发明实施例所提供的一种影片票房数据的预测装置的结构示意图;
图6示出了本发明实施例所提供的另一种影片票房数据的预测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到采用目前的影片票房数据的预测方法来确定影片次日票房数据存在准确度低、参考性差的问题,无法实现对影院的排片起到准确地指导作用。基于此,本发明实施例提供了一种影片票房数据的预测方法及装置,下面通过实施例进行描述。
如图1所示,本发明实施例提供了一种影片票房数据的预测方法,该方法包括步骤S106-S110,具体如下:
步骤S106:获取待预测影片的上映类型,其中,该上映类型包括:首映或者非首映;
步骤S108:当上述待预测影片为首映影片时,根据上述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的上述票房数据预测子模型确定上述待预测影片的首映日票房数据;
步骤S110:当上述待预测影片为非首映影片时,获取上述待预测影片的当前票房数据,其中,该当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的上述待预测影片的上述当前票房数据输入至选取的上述票房数据预测子模型,利用选取的上述票房数据预测子模型确定上述待预测影片的次日票房数据。
其中,由于在票房数据预测模型过程中,选用多种数据来源作为票房数据预测模型的训练样本数据,该多种数据来源主要包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据,相应的,在进行票房数据预测过程中,同样将多种数据来源作为票房数据预测模型的输入数据,可以提高预测出的票房数据的准确性;另外,由于考虑到首映影片与非首映影片的票房数据可能存在比较大的差距、以及一周期间工作日与非工作日的票房数据也可能存在比较大的差距,在票房数据预测模型过程中,首先对训练样本数据进行分类,对于一类训练样本数据采用机器学习方法分别训练得到相应的票房数据预测子模型,相应的,在进行票房数据预测过程中,根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,这样能够提高预测出的票房数据的准确性。
在本发明提供的实施例中,通过根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,同时,选用专资办发布的票房数据、实时票房数据、监控网站的售票订单数据这三类数据作为模型输入数据,从而提高了票房预测的准确度,进而能够对影院的排片起到准确地指导作用。
进一步的,如图2所示,上述获取待预测影片的上映类型之前,还包括:
步骤S102:获取训练票房数据预测模型所需的训练样本数据,其中,上述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、上述预设时间段内的实时票房数据、以及上述预设时间段内监控网站的售票订单数据;
步骤S104:采用线性回归算法根据上述训练样本数据训练得到票房数据预测模型,其中,上述票房数据预测模型包括:多个票房数据预测子模型,上述票房数据预测子模型包含每部影片的预测比例系数向量,上述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。
其中,通过线性回归算法进行票房数据模型训练时,首先对训练样本数据进行分类,对于每一类训练样本数据分别采用机器学习方法训练得到相应的票房数据预测子模型,另外,在本发明实施例中不仅选用专资办数据化作为训练样本数据(专资办的数据是目前国内唯一精准的电影票房数据来源),同时还选用实时票房数据和监控网站的售票订单数据作为训练样本数据,即将多种数据来源作为票房数据预测模型的训练样本数据,可以提高确定出的预测比例系数向量的准确度;
具体的,如图3所示,在本发明提供的实施例中一种优选的票房数据预测方法的流程示意图,其中,该票房数据预测方法中主要包括:模型训练过程和数据预测过程,在模型训练过程中,将预设时间段内专资办发布的各个影片的票房数据、实时票房数据、以及监控网站的售票订单数据作为训练样本数据,采用线性回归算法训练得到票房数据预测模型;在数据预测过程中,对于非首映影片,将当前的专资办发布的各个影片的票房数据、实时票房数据、以及监控网站的售票订单数据作为特征数据输入至上述票房数据预测模型中相应的票房数据预测子模型中,预测得到影片的次日票房数据(即利用前一日数据预测次日票房数据),对于首映影片,将该影片的预售数据作为特征数据输入至上述票房数据预测模型中相应的票房数据预测子模型中,预测得到影片的首映日票房数据;
其中,考虑到对于首映影片而言,影片的票房数据与首映日是否为节假日或者首映日影片上映是否为零点的相关性比较大,因而,如图4所示,示出了票房数据预测模型中的各个子模型的构成示意图,对于首映影片的票房数据预测子模型可以包括:首映日为节假日的票房数据预测子模型、首映日为非节假日的票房数据预测子模型、首映日放映时间段为零点场的票房数据预测子模型;相应的,考虑到对于非首映影片而言,影片的票房数据与预测日是否为工作日的相关性比较法,因而,对于非首映影片的票房数据预测子模型可以包括:周一型票房数据预测子模型、周二至周四型票房数据预测子模型、周五型票房数据预测子模型、周六型票房数据预测子模型、周日型票房数据预测子模型;
需要说明的是,图4中只给出了票房数据预测模型中的部分子模型的示意图,并非对票房数据预测模型中的子模型进行限定,可以根据实际需求训练所需的其他子模型,以提高后续票房数据预测的准确度。
具体的,上述利用选取的上述票房数据预测子模型确定上述待预测影片的首映日票房数据,具体包括:
获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;
根据提取到的多个所述特征值生成所述待预测影片的特征向量;
根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的首映日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
具体的,上述利用选取的上述票房数据预测子模型确定上述待预测影片的次日票房数据,具体包括:
对输入的上述当前票房数据进行特征提取,得到多个特征值;
根据提取到的多个上述特征值生成上述待预测影片的特征向量;
根据上述特征向量和线性公式y2=WX+b计算得到上述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
进一步的,考虑到相关技术中并未给出确定影片的实时票房数据的具体实现方案,基于此,上述方法还包括:
采用流式滚动抓取数据的方式从监控的售票系统中抓取当日多个影院的多个场次座位占用数据,并将抓取到的上述场次座位占用数据依次存入相应的数据库中;
将上述数据库中的场次座位占用数据输入至预先训练的票房数据清洗模型,对上述场次座位占用数据进行清洗,得到清洗后的场次座位占用数据;
将清洗后的场次座位占用数据输入至预先训练的票房数据计算模型,利用上述票房数据计算模型根据上述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,并将上述各个影片截止目前时刻的当日全国票房数据存入至票房数据存储数据库中;
根据上述待预测影片的影片名称从上述票房数据存储数据库中调取上述待预测影片的实时票房数据。
具体的,上述利用上述票房数据计算模型根据上述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,包括:
根据清洗后的场次座位占用数据计算各个影片的特征参量的实际数值,其中,所述特征参量包括以下中的一种或者多种:当日抓取的影片的场次数、当日抓取的影片的总场次座位占用数、前一日抓取的影片的场次数、或者前一日抓取的影片的总场次座位占用数;
当影片为非首映影片时,从票房数据计算模型中调取所述影片对应的特征参量的特征系数,以及当影片为首映影片时,将票房数据计算模型中所有首映影片的各个特征参量的特征系数的平均值作为所述影片对应的各个特征参量的特征系数;
根据公式所述各个特征参量的特征系数和各个所述特征参量的实际数值,计算得到所述影片截止目前时刻的当日全国票房数据,其中,Y表示影片的当日全国票房数据,i表示影片各个特征参量的序号,wi表示第i个特征参量对应的特征系数,xi表示第i个特征参量的实际数值。
需要说明的是,对于非首映影片,可以选用当日抓取的影片的场次数、当日抓取的影片的总场次座位占用数、前一日抓取的影片的场次数、以及前一日抓取的影片的总场次座位占用数作为影片的特征参数;而对于首映影片,可以选用当日抓取的影片的场次数、当日抓取的影片的总场次座位占用数作为影片的特征参数。
在本发明提供的实施例中,通过根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,同时,选用专资办发布的票房数据、实时票房数据、监控网站的售票订单数据这三类数据作为模型输入数据,从而提高了票房预测的准确度,进而能够对影院的排片起到准确地指导作用;进一步的,给出了训练票房数据预测子模型的具体实现方案、以及利用预先训练的票房数据预测子模型进行票房预测的具体实现方案;更进一步的,给出了确定待预测影片的实时票房数据的具体实现方案,从而满足了将实时票房数据作为训练样本数据、以及将实时票房数据作为预测输入数据的实际需求。
本发明实施例还提供一种影片票房数据的预测装置,如图5所示,该装置包括:
上映类型获取模块306,用于获取待预测影片的上映类型,其中,上述上映类型包括:首映或者非首映;
第一票房数据预测模块308,用于当上述待预测影片为首映影片时,根据上述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的上述票房数据预测子模型确定上述待预测影片的首映日票房数据;
第二票房数据预测模块310,用于当上述待预测影片为非首映影片时,获取上述待预测影片的当前票房数据,其中,上述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的上述待预测影片的上述当前票房数据输入至选取的上述票房数据预测子模型,利用选取的上述票房数据预测子模型确定上述待预测影片的次日票房数据。
进一步的,如图6所示,上述装置还包括:
训练样本获取模块302,用于获取训练票房数据预测模型所需的训练样本数据,其中,上述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、上述预设时间段内的实时票房数据、以及上述预设时间段内监控网站的售票订单数据;
预测模型训练模块304,用于采用线性回归算法根据上述训练样本数据训练得到票房数据预测模型,其中,上述票房数据预测模型包括:多个票房数据预测子模型,上述票房数据预测子模型包含每部影片的预测比例系数向量,上述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。
进一步的,上述第一票房数据预测模块308包括:
第一特征提取单元,用于获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;
第一特征向量确定单元,用于根据提取到的多个所述特征值生成所述待预测影片的特征向量;
首映日票房数据计算单元,用于根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
进一步的,上述第二票房数据预测模块310包括:
第二特征提取单元,用于对输入的上述当前票房数据进行特征提取,得到多个特征值;
第二特征向量确定单元,用于根据提取到的多个上述特征值生成上述待预测影片的特征向量;
次日票房数据计算单元,用于根据上述特征向量和线性公式y2=WX+b计算得到上述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
基于上述分析可知,本发明实施例提供的影片票房数据的预测装置中,通过根据待预测影片的类型选取相应的票房数据预测子模型进行票房预测,同时,选用专资办发布的票房数据、实时票房数据、监控网站的售票订单数据这三类数据作为模型输入数据,从而提高了票房预测的准确度,进而能够对影院的排片起到准确地指导作用;进一步的,给出了训练票房数据预测子模型的具体实现方案、以及利用预先训练的票房数据预测子模型进行票房预测的具体实现方案;更进一步的,给出了确定待预测影片的实时票房数据的具体实现方案,从而满足了将实时票房数据作为训练样本数据、以及将实时票房数据作为预测输入数据的实际需求。
本发明实施例所提供的影片票房数据的预测装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种影片票房数据的预测方法,其特征在于,所述方法包括:
获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;
当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;
当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。
2.根据权利要求1所述的方法,其特征在于,所述获取待预测影片的上映类型之前,还包括:
获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;
采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。
3.根据权利要求1所述的方法,其特征在于,所述利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据,包括:
获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;
根据提取到的多个所述特征值生成所述待预测影片的特征向量;
根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的首映日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
4.根据权利要求1所述的方法,其特征在于,所述利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据,包括:
对输入的所述当前票房数据进行特征提取,得到多个特征值;
根据提取到的多个所述特征值生成所述待预测影片的特征向量;
根据所述特征向量和线性公式y2=WX+b计算得到所述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采用流式滚动抓取数据的方式从监控的售票系统中抓取当日多个影院的多个场次座位占用数据,并将抓取到的所述场次座位占用数据依次存入相应的数据库中;
将所述数据库中的场次座位占用数据输入至预先训练的票房数据清洗模型,对所述场次座位占用数据进行清洗,得到清洗后的场次座位占用数据;
将清洗后的场次座位占用数据输入至预先训练的票房数据计算模型,利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,并将所述各个影片截止目前时刻的当日全国票房数据存入至票房数据存储数据库中;
根据所述待预测影片的影片名称从所述票房数据存储数据库中调取所述待预测影片的实时票房数据。
6.根据权利要求5所述的方法,其特征在于,所述利用所述票房数据计算模型根据所述清洗后的场次座位占用数据分别确定各个影片截止目前时刻的当日全国票房数据,包括:
根据清洗后的场次座位占用数据计算各个影片的特征参量的实际数值,其中,所述特征参量包括以下中的一种或者多种:当日抓取的影片的场次数、当日抓取的影片的总场次座位占用数、前一日抓取的影片的场次数、或者前一日抓取的影片的总场次座位占用数;
当影片为非首映影片时,从票房数据计算模型中调取所述影片对应的特征参量的特征系数,以及当影片为首映影片时,将票房数据计算模型中所有首映影片的各个特征参量的特征系数的平均值作为所述影片对应的各个特征参量的特征系数;
根据公式所述各个特征参量的特征系数和各个所述特征参量的实际数值,计算得到所述影片截止目前时刻的当日全国票房数据,其中,Y表示影片的当日全国票房数据,i表示影片各个特征参量的序号,wi表示第i个特征参量对应的特征系数,xi表示第i个特征参量的实际数值。
7.一种影片票房数据的预测装置,其特征在于,所述装置包括:
上映类型获取模块,用于获取待预测影片的上映类型,其中,所述上映类型包括:首映或者非首映;
第一票房数据预测模块,用于当所述待预测影片为首映影片时,根据所述待预测影片的首映日期的类型和首映日放映时间段的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;利用选取的所述票房数据预测子模型确定所述待预测影片的首映日票房数据;
第二票房数据预测模块,用于当所述待预测影片为非首映影片时,获取所述待预测影片的当前票房数据,其中,所述当前票房数据包括:专资办发布的票房数据、实时票房数据、监控网站的售票订单数据;根据预测日的类型从预先训练的票房数据预测模型中选取相应的票房数据预测子模型;将获取到的所述待预测影片的所述当前票房数据输入至选取的所述票房数据预测子模型,利用选取的所述票房数据预测子模型确定所述待预测影片的次日票房数据。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
训练样本获取模块,用于获取训练票房数据预测模型所需的训练样本数据,其中,所述训练样本数据包括:预设时间段内专资办发布的各个影片的票房数据、所述预设时间段内的实时票房数据、以及所述预设时间段内监控网站的售票订单数据;
预测模型训练模块,用于采用线性回归算法根据所述训练样本数据训练得到票房数据预测模型,其中,所述票房数据预测模型包括:多个票房数据预测子模型,所述票房数据预测子模型包含每部影片的预测比例系数向量,所述预测比例系数向量表示影片的前一日票房数据与后一日票房数据的比例关系。
9.根据权利要求7所述的装置,其特征在于,所述第一票房数据预测模块包括:
第一特征提取单元,用于获取所述待预测影片的预售数据,并对所述预售数据进行特征提取,得到多个特征值;
第一特征向量确定单元,用于根据提取到的多个所述特征值生成所述待预测影片的特征向量;
首映日票房数据计算单元,用于根据所述特征向量和线性公式y1=WX+b计算得到所述待预测影片的首映日票房数据,其中,y1表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
10.根据权利要求7所述的装置,其特征在于,所述第二票房数据预测模块包括:
第二特征提取单元,用于对输入的所述当前票房数据进行特征提取,得到多个特征值;
第二特征向量确定单元,用于根据提取到的多个所述特征值生成所述待预测影片的特征向量;
次日票房数据计算单元,用于根据所述特征向量和线性公式y2=WX+b计算得到所述待预测影片的次日票房数据,其中,y2表示待预测影片的次日票房数据,X表示预测影片的特征向量,W表示选取的票房数据子模型中的预测比例系数向量,b表示选取的票房数据子模型中的训练常数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610648318.XA CN106339771A (zh) | 2016-08-09 | 2016-08-09 | 一种影片票房数据的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610648318.XA CN106339771A (zh) | 2016-08-09 | 2016-08-09 | 一种影片票房数据的预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106339771A true CN106339771A (zh) | 2017-01-18 |
Family
ID=57824491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610648318.XA Pending CN106339771A (zh) | 2016-08-09 | 2016-08-09 | 一种影片票房数据的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106339771A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038494A (zh) * | 2017-03-06 | 2017-08-11 | 中国电影科学技术研究所 | 一种影院票房预测方法及装置 |
CN107169585A (zh) * | 2017-03-29 | 2017-09-15 | 北京百度网讯科技有限公司 | 基于人工智能的影片票房预测方法、装置及存储介质 |
CN108734329A (zh) * | 2017-04-21 | 2018-11-02 | 北京微影时代科技有限公司 | 一种预测电影次日票房的方法及装置 |
CN108898444A (zh) * | 2018-07-12 | 2018-11-27 | 北京猫眼文化传媒有限公司 | 一种影厅售票数统计方法及装置 |
CN109087146A (zh) * | 2018-08-15 | 2018-12-25 | 深圳快购科技有限公司 | 影院票房收入的预测方法及系统 |
CN109101346A (zh) * | 2018-07-12 | 2018-12-28 | 北京猫眼文化传媒有限公司 | 一种数据服务提供方法及装置 |
CN109165963A (zh) * | 2018-06-19 | 2019-01-08 | 北京猫眼文化传媒有限公司 | 一种数据预测方法、装置及电子设备 |
CN111435486A (zh) * | 2019-01-15 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 验票资源的调配方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035994A (zh) * | 2014-06-11 | 2014-09-10 | 华东师范大学 | 一种基于网络数据的电视剧点播量预测方法 |
CN105468770A (zh) * | 2015-12-09 | 2016-04-06 | 合一网络技术(北京)有限公司 | 一种数据处理方法及系统 |
-
2016
- 2016-08-09 CN CN201610648318.XA patent/CN106339771A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035994A (zh) * | 2014-06-11 | 2014-09-10 | 华东师范大学 | 一种基于网络数据的电视剧点播量预测方法 |
CN105468770A (zh) * | 2015-12-09 | 2016-04-06 | 合一网络技术(北京)有限公司 | 一种数据处理方法及系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038494A (zh) * | 2017-03-06 | 2017-08-11 | 中国电影科学技术研究所 | 一种影院票房预测方法及装置 |
CN107169585A (zh) * | 2017-03-29 | 2017-09-15 | 北京百度网讯科技有限公司 | 基于人工智能的影片票房预测方法、装置及存储介质 |
CN108734329A (zh) * | 2017-04-21 | 2018-11-02 | 北京微影时代科技有限公司 | 一种预测电影次日票房的方法及装置 |
CN109165963A (zh) * | 2018-06-19 | 2019-01-08 | 北京猫眼文化传媒有限公司 | 一种数据预测方法、装置及电子设备 |
CN108898444A (zh) * | 2018-07-12 | 2018-11-27 | 北京猫眼文化传媒有限公司 | 一种影厅售票数统计方法及装置 |
CN109101346A (zh) * | 2018-07-12 | 2018-12-28 | 北京猫眼文化传媒有限公司 | 一种数据服务提供方法及装置 |
CN109087146A (zh) * | 2018-08-15 | 2018-12-25 | 深圳快购科技有限公司 | 影院票房收入的预测方法及系统 |
CN111435486A (zh) * | 2019-01-15 | 2020-07-21 | 阿里巴巴集团控股有限公司 | 验票资源的调配方法及装置 |
CN111435486B (zh) * | 2019-01-15 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 验票资源的调配方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106339771A (zh) | 一种影片票房数据的预测方法及装置 | |
Qasim et al. | Learning representations of irregular particle-detector geometry with distance-weighted graph networks | |
Wolinski et al. | Parameter estimation and comparative evaluation of crowd simulations | |
KR20210082210A (ko) | 신경망을 사용한 통합 회로 플로어 플랜 생성 | |
CN110287477A (zh) | 实体情感分析方法及相关装置 | |
CN105912990A (zh) | 人脸检测的方法及装置 | |
Hachisuka et al. | A progressive error estimation framework for photon density estimation | |
CN110956272A (zh) | 实现数据处理的方法和系统 | |
CN110059672A (zh) | 一种利用增量学习对显微镜细胞图像检测模型进行增类学习的方法 | |
CN106663228A (zh) | 用于商业应用系统的规则到约束翻译器 | |
Burns et al. | Interpreting black box models via hypothesis testing | |
CN109670267A (zh) | 一种数据处理方法和装置 | |
CN109547546A (zh) | 一种请求任务的调度方法及调度中心服务器 | |
CN107977703A (zh) | 用于修剪神经网络以实现资源有效推理的系统和方法 | |
KR20160050562A (ko) | 예측 모델 생성 장치 및 방법 | |
CN109154938A (zh) | 使用离散非踪迹定位数据将数字图中的实体分类 | |
CN111052128B (zh) | 用于检测和定位视频中的对象的描述符学习方法 | |
CN109844776A (zh) | 具有片上学习和随机时间步长控制的可编程神经元核心 | |
CN109190646A (zh) | 一种基于神经网络的数据预测方法、装置及神经网络系统 | |
Günther et al. | Decoupled opacity optimization for points, lines and surfaces | |
CN108875519A (zh) | 对象检测方法、装置和系统及存储介质 | |
CN109598285A (zh) | 一种模型的处理方法、装置及设备 | |
CN109727376A (zh) | 生成配置文件的方法、装置及售货设备 | |
CN106326356B (zh) | 一种确定影片的实时票房数据的方法及装置 | |
CN109189922A (zh) | 评论评估模型的训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination |