CN115983499A - 一种票房预测方法、装置、电子设备及存储介质 - Google Patents
一种票房预测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115983499A CN115983499A CN202310198724.0A CN202310198724A CN115983499A CN 115983499 A CN115983499 A CN 115983499A CN 202310198724 A CN202310198724 A CN 202310198724A CN 115983499 A CN115983499 A CN 115983499A
- Authority
- CN
- China
- Prior art keywords
- information
- box
- movie
- similarity
- office
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 230000000875 corresponding effect Effects 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000002596 correlated effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 9
- 230000002265 prevention Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种票房预测方法、装置、电子设备及存储介质,服务器接收用户设备发送目标电影的票房预测请求,目标电影的票房预测请求包括目标电影信息;获取历史上映时间的电影集合,历史上映时间为第一信息对应的历史上映时间;获取第三信息,第三信息为历史上映时间的电影信息,对第二信息与第三信息进行相似度计算,得到第一相似度,当第一相似度大于或等于预设相似度阈值时,将第一相似度对应的第三信息汇总到预设数据库中;获取预设数据库中第三信息对应的历史票房收入;将历史票房收入作为目标电影的票房预测结果,给用户设备发送第一票房预测结果,第一票房预测结果为目标电影的票房预测结果。采用上述方法,提升票房预测的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其是涉及一种票房预测方法、装置、电子设备及存储介质。
背景技术
目前,中国的电影市场正处于蓬勃发展期,未来中国电影票房很可能超越美国成为电影第一大国。通过预测电影票房,可以给电影的投资、运营、宣发、排片以及广告定价等一系列行为带来参考依据,因此,如何准确的预测电影票房,具有重要的意义。
电影投资方在电影未上映之前,会对待上映的电影进行票房预测。目前所采用的预测方法虽然会从多个维度进行考虑,但随着电影市场的变化,每个维度的重要性会发生变化,如果采用一成不变的票房预测模型容易造成票房预测不准确的情况发生。
因此,亟需可解决上述技术问题的一种票房预测方法、装置、电子设备及存储介质。
发明内容
针对相关技术中存在的不足,本申请提供一种票房预测方法、装置、电子设备及存储介质,该方法将目标电影与目标电影相似的电影进行识别,根据电影的目标电影信息计算目标电影与目标电影相似的电影之间的相似度,将相似度高于预设相似度的电影历史票房进行统计,从而得到目标电影的票房预测结果。采用本方法改进了传统的票房预测模型,进而提升票房预测的准确性。
本申请第一方面提供一种票房预测方法,应用于服务器中,所述方法包括:接收用户设备发送目标电影的票房预测请求,所述目标电影的票房预测请求包括目标电影信息;其中,所述目标电影信息包括第一信息和第二信息,所述第一信息包括待上映时间;所述第二信息包括电影类型、导演、演员以及出品方中的一种或多种;获取历史上映时间的电影集合,所述历史上映时间为所述第一信息对应的历史上映时间;获取第三信息,所述第三信息为所述历史上映时间的电影信息,所述第三信息包括电影类型、导演、演员以及出品方中的一种或多种;对所述第二信息与所述第三信息进行相似度计算,得到第一相似度,当所述第一相似度大于或等于预设相似度阈值时,将所述第一相似度对应的所述第三信息汇总到预设数据库中;获取所述预设数据库中所述第三信息对应的历史票房收入;将所述历史票房收入作为所述目标电影的票房预测结果,给所述用户设备发送第一票房预测结果,所述第一票房预测结果为所述目标电影的票房预测结果。
采用上述技术方案,根据目标电影的待上映时间,将历史该上映的电影进行汇总集合,便于计算目标电影与电影集合中每一步电影的相似度,将大于预设相似度阈值的电影汇总到预设数据库中;计算预设数据库中电影的历史票房收入,将历史票房收入作为目标电影的票房预测结果。改变了传统票房预测模型的方法,提升了电影票房预测的准确性。
本申请第二方面提供一种票房预测装置,所述装置为服务器,所述服务器包括接收单元、处理单元以及发送单元;所述接收单元,接收用户设备发送目标电影的票房预测请求,所述目标电影的票房预测请求包括目标电影信息;其中,所述目标电影信息包括第一信息和第二信息,所述第一信息包括待上映时间;所述第二信息包括电影类型、导演、演员以及出品方的一种或多种;所述处理单元,获取历史上映时间的电影集合,所述历史上映时间为所述第一信息对应的历史上映时间;获取第三信息,所述第三信息为所述历史上映时间的电影信息,所述第三信息包括电影类型、导演、演员以及出品方的一种或多种;对所述第二信息与所述第三信息进行相似度计算,得到相似度,当所述相似度大于或等于预设相似度阈值时,将所述相似度对应的所述第三信息汇总到预设数据库中;获取所述预设数据库中所述第三信息对应的历史票房收入;所述发送单元,将所述历史票房收入作为所述目标电影的票房预测结果,给所述用户设备发送第一票房预测结果,所述第一票房预测结果为所述目标电影的票房预测结果。
采用上述技术方案,根据目标电影的待上映时间,将历史该上映的电影进行汇总集合,便于计算目标电影与电影集合中每一步电影的相似度,将大于预设相似度阈值的电影汇总到预设数据库中;计算预设数据库中电影的历史票房收入,将历史票房收入作为目标电影的票房预测结果。改变了传统票房预测模型的方法,提升了电影票房预测的准确性。
可选的,所述处理单元还包括计算子单元,所述计算子单元为对所述第二信息的文本信息进行处理,得到处理后的预处理文本集;根据所述预处理文本集,采用Word2Vec构建知识库文本模型,将所述预处理文本集转换为向量;将所述向量,利用余弦相似度算法计算所述第二信息与所述第三信息之间的相似度,得到第一相似度。
采用上述技术方案,通过采用上述两种算法,计算目标电影与其他电影的相似度,基于相似度确认其他电影是否与目标电影是同一类型的电影。
可选的,所述接收单元获取所述第三信息,所述处理单元判断所述第三信息是否包括所述疫情信息;当所述第三信息包括所述疫情信息时,计算所述第二信息与所述第三信息的第二相似度。
采用上述技术方案,为了防止票房预测结果相差较大的情况,要考虑目标电影的上映时间在疫情防控阶段,将在疫情防控阶段上线的其他电影作为目标电影票房预测的依据。
可选的,所述判断单元中当所述第三信息不包括所述疫情信息时;计算所述第二信息与所述第三信息的第三相似度;根据所述第三相似度,得到第一变量因数;所述第三相似度与所述第一变量因数呈负相关;所述发送单元给所述用户设备发送所述目标电影的第二票房预测结果,所述第二票房预测结果是所述第一票房预测结果与所述第一变量因数的乘积。
采用上述技术方案,疫情信息是影响票房预测结果的一个变量,当目标电影上映的时间疫情已结束,输出的票房预测结果会在原基础上会持续上升,反之会下降。
可选的,所述处理单元对所述历史票房收入按小到大进行排序;计算所述历史票房收入的中位数,所述发送单元将所述中位数作为所述目标电影的票房预测结果进行输出。
采用上述技术方案,通过排序了解其他电影的历史票房收入,通过计算中位数,得到票房预测结果。
可选的,所述接收单元获取第四信息,所述第四信息为所述第一信息对应上映时间的电影;所述第四信息包括电影类型、导演、演员以及出品方中的一种或多种;所述处理单元计算所述第二信息与所述第四信息的第四相似度;根据所述第四相似度,得到第二变量因数;所述第四相似度与所述第二变量因数呈负相关;所述发送单元给所述用户设备发送所述目标电影的第三票房预测结果,所述第三票房预测结果是所述第一票房预测结果与所述第二变量因数的乘积。
采用上述技术方案,同一阶段上线的同类型电影也是影响票房预测结果的一个变量,当同类型电影与目标电影相似度越高,输出的票房预测结果会持续下降,反之则上升。
可选的,所述接收单元获取当前的社会热点对应的社会热点标签;所述判断单元计算所述第二信息与所述社会热点标签的第五相似度;根据所述第五相似度,得到第三变量因数;所述第五相似度与所述第三变量因数呈正相关;所述发送单元给所述用户设备发送所述目标电影的第四票房预测结果,所述第四票房预测结果是所述第一票房预测结果与所述第三变量因数的乘积。
采用上述技术方案,社会热点也是影响票房预测结果的一个变量,当社会热点信息与目标电影相似度越高,输出的票房预测结果会持续上升,反之则下降。
本申请第三方面提供一种电子设备,电子设备包括处理器、存储器、用户接口及网络接口,所述存储器用于存储指令,所述用户接口和网络接口用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,使得一种电子设备执行如本申请第一方面任意一项所述的方法。
本申请第四方面提供一种计算机可读存储介质,计算机可读存储介质存储有指令,当指令被执行时,执行本申请第一方面任意一项所述的方法。
与相关技术相比,本申请的有益效果是:获取目标电影的待上映时间与对应历史上映时间的电影,计算目标电影与历史上映电影的相似度;将相似度大于预设相似度阈值的电影汇总到预设数据库中,根据预设数据库中电影的历史票房收入作为目标电影的票房预测结果;票房预测结果还考虑了疫情信息、同一时间段上映电影以及社会热点等变量,根据不同的情况,对应调整票房预测结果的输出。
附图说明
图1是本申请实施例提供的一种票房预测方法的流程示意图;
图2是本申请实施例提供的又一种票房预测方法的流程示意图;
图3是本申请实施例提供的再一种票房预测方法的流程示意图;
图4是本申请实施例提供的另一种票房预测方法的流程示意图;
图5是本申请实施例提供的一种票房预测方法的流程示意图;
图6是本申请实施例提供的一种票房预测装置的结构示意图;
图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在本申请实施例的描述中,“示性的”、“例如”或者“举例来说”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示性的”、“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示性的”、“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
此外,本申请说明书中的术语“第一”、“第二”、等是用于区别不同对象,而不是用于描述特定顺序,可以明示或者隐含地包括一个或者多个该特征。
在对本申请实施例进行介绍之前,首先对本申请实施例中涉及的一些名词进行定义和说明。
余弦相似度:余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。
Word2Vec:是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在Word2Vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,Word2Vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。
本申请中服务器是指预测电影票房结果平台,本申请主要是针对在电影院上映的电影进行预测票房。
现阶段,电影投资方在电影未上映之前,会对待上映的电影进行票房预测。目前所采用的预测方法虽然会从多个维度进行考虑,但随着电影市场的变化,每个维度的重要性会发生变化,如果采用一成不变的票房预测模型容易造成票房预测不准确的情况发生。
如何提升票房预测不准确的问题,本申请实施例提供了一种票房预测方法,应用于服务器中,本申请以预测电影票房为例,此时服务器是指电影院或第三方为电影院提供服务的平台。图1是本申请实施例提供的一种票房预测方法的流程示意图;参考图1,该方法包含以下步骤S101-步骤S106。
步骤S101:接收用户设备发送目标电影的票房预测请求,目标电影的票房预测请求包括目标电影信息;其中,目标电影信息包括第一信息和第二信息。
在上述步骤中,第一信息包括待上映时间,待上映时间是指一部电影,预想在未来的某一个时间段上映的时间。第二信息包括电影类型、导演、演员以及出品方中的一种或多种。电影类型按观众类别可以分四大类:儿童片、青春片、男性片、女性片。还可以按情节来分,可以分为五大类:线性叙事、非线性叙事、多线性叙事、回忆叙事、环形结构叙事。五大类电影类型又分为动作片、间谍片、警匪片、医学片、武侠片、古装片、运动片、战争片、历史片、灾难片、冒险片、西部片、玄幻片、奇幻片、科幻片、幻想片、贺岁片、犯罪片、伦理片、喜剧片、爱情片、恐怖片、悬疑片、青春片、动画片、纪录片、戏曲片、爱国片、歌舞片、短片等。导演是指创作影视作品的组织者和领导者,是借助演员表达自己思想的艺术家,是把影视文学剧本搬上荧屏的总负责人。简单来说导演就是拍摄电影的总负责人。演员是指在电影中,扮演电影中某个角色的表演者,或采集电影表演的专业人员。出品方是指投资方,主要是指电影的出资方,它可以是公司,也可以是个人。出品方负责整部影片票房收益和版权收益的主要受益人。
步骤S102:获取历史上映时间的电影集合,历史上映时间为第一信息对应的历史上映时间;获取第三信息,第三信息为历史上映时间的电影信息。
在上述步骤中,根据目标电影的待上映时间,获取目标电影待上映时间对应的历史上映时间电影集合;获取电影集合中的第三信息,第三信息是指电影集合中每一部的电影信息,第三信息包括电影类型、导演、演员以及出品方中的一种或多种。
举例来说,当目标电影未来想在2021年7月上映,根据待上映时间为7月份,将过去几年在7月份上线的电影进行查找;根据查找结果,将电影汇总到一个集合中,获取集合中每一部电影的电影类型、导演、演员以及出品方。具体选择过去几年,以实际情况而定,这里不做限定。
步骤S103:对第二信息与第三信息进行相似度计算,得到第一相似度,当第一相似度大于或等于预设相似度阈值时,将第一相似度对应的第三信息汇总到预设数据库中。
在上述步骤中,对目标电影的第二信息的文本信息进行处理,得到处理后的预处理文本集;根据预处理文本集,采用Word2Vec构建知识库文本模型,将预处理文本集转换为向量;将向量,利用余弦相似度算法计算目标电影的第二信息与历史电影集合中第三信息之间的相似度,得到第一相似度。预设相似度阈值是判断同类型电影的阈值,当第一相似度大于或等于预设相似度阈值,确认第一相似度对应的这一个历史电影与目标电影是同类型的。将第一相似度对应的这个历史电影汇总到预设数据库中。
因此,算法的具体流程如下:获取目标电影输入的文本信息;提取目标电影的电影类型、导演、演员以及出品方中的一种或多种,将提取到的文本存储在预处理文本集。获取历史电影的电影类型、导演、演员以及出品方中一种或多种,将提取到的文本存储在另外一个预处理文本集中。建立Word2Vec词向量模型,将预处理文本集输入Word2Vec模型进行训练,得到目标电影的词向量。
余弦相似度的公式如下所示:
表示相似度;表示目标电影的向量;表示其他电影的向量;当相似度越接近1,证明目标电影与其他电影越相似,为同一类型的电影概率越大。
在本申请的实施例中,目标电影的第二信息是包括四个维度,目标电影为(),历史电影的第三信息包括四个维度,第三信息为(),余弦相似度公式如下所示:
举例来说,目标电影A与历史电影集合中的B计算相似度时,使用算法得到A与B的相似度为0.65,预设相似度阈值设置为0.55,相似度0.65大于预设相似度阈值0.55,确认目标电影A和历史电影B是同类型电影,将历史电影B汇总到预设数据库中。预设相似度阈值的设置以实际情况为主,这里不做限定。
步骤S104:获取预设数据库中第三信息对应的历史票房收入。
在上述步骤中,预设数据库中的历史电影,与目标电影属于同一类型的电影。将预设数据库中每一个已上映电影的历史票房收入进行获取。
步骤S105:将历史票房收入作为目标电影的票房预测结果,给用户设备发送第一票房预测结果,第一票房预测结果为目标电影的票房预测结果。
在上述步骤中,第一票房预测结果是根据预设数据库中,同类型电影的历史票房收入作为目标电影的票房预测结果。通过计算查找同类型的电影,在结合同类型电影的历史票房收入,作为目标电影的票房预测结果输出,便于用户进行查看目标电影的预测票房结果。
此外,获取预设数据库中每个电影的历史票房收入,对历史票房收入按小到大进行排序;计算历史票房收入的中位数,中位数作为目标电影的票房预测结果进行输出。
举例来说,预设数据库中有6个电影,获取这6个电影的历史票房收入,按从小到大进行排序为c、d、e、f、g、h。将e和f相加如何除2,得到中位数k,那么k作为目标电影的票房预测结果进行输出。
在一种可能的实施例中,图2是本申请实施例提供的又一种票房预测方法的流程示意图;参考图2,该方法包括步骤S201-步骤S202。
步骤S201:获取第三信息,判断第三信息是否包括疫情信息。
在上述步骤中,目标电影的第二信息还包括疫情信息,疫情信息是指疫情防控信息,并不是指有的地方现在无疫情防控,就不算疫情信息,而是只要有疫情防控信息当前就是在疫情信息内。
步骤S202:当第三信息包括疫情信息时,计算第二信息与第三信息的第二相似度。
在上述步骤中,查看历史上映的电影中,查看在疫情信息期间上映的电影,疫情信息可从网上发布的疫情防控信息获取。
举例来说,目标电影C预想在2021年10月上映,根据获取网上的疫情防控信息,确认当前目标电影C中考虑疫情信息;已上映的电影D,判断电影D中是否包括疫情信息,确认电影D中包括疫情信息,计算目标电影C和电影D的相似度。再根据相似度判断
因此,本说明书针对上述第一票房预测结果,基于其他因素的影响,还构建了三种票房预测结果的方式,这三种票房预测结果相对于只时采用同类型的历史票房收入进行预测的方式,准确性更高。
下面对这三种票房预测结果的方式分别进行说明。
在一种可能的实施例中,票房预测结果中第一种方式包括步骤S301-步骤S303。即如图3所示,图3是本申请实施例提供的再一种票房预测方法的流程示意图。
步骤S301:计算第二信息与第三信息的第三相似度。
在上述步骤中,在计算第三相似度的前提下,是第三信息中不包括疫情信息,即在疫情信息之前上映的电影。计算历史上映电影中不包括疫情信息,但目标电影中包括疫情信息两者之间的相似度。
在电影上映之前,还要考虑疫情信息的影响,由于疫情防控管理,在公共场合的人数聚集不能超过多少人,这些都是有要求的。如在一些大的电影院,有可以容纳100多个人的观影厅,但因为疫情防控要求,避免较多人聚集在一个封闭的场景,这个可以容纳100多个人的观影厅现在只能接受50多人,电影院的观影厅的人数受到限制,也会导致票房预测不准确的情况产生。
举例来说,目标电影E中包括疫情信息,历史电影F中不包括疫情信息,还是按照上述步骤中计算目标电影E和历史电影F的相似度,得到相似度j。
步骤S302:根据第三相似度,得到第一变量因数;第三相似度与第一变量因数呈负相关。
在上述步骤中,根据公式公式中表示相似度,h1表示变量因数,a表示定值。在定值a不变的前提下,当相似度越大,第一变量因数h1就越小;当相似度越小,第一变量因数h1就越大。根据上述公式,得到第一变量因数。
步骤S303:给用户设备发送目标电影的第二票房预测结果,第二票房预测结果是第一票房预测结果与第一变量因数的乘积。
在上述步骤中,由于票房预测结果受疫情信息影响,故票房预测结果要考虑疫情信息这个变量因数。在第一票房预测结果的基础上乘以变量因数,得到第二票房预测结果。
举例来说,目标电影F中包括疫情信息,历史电影G中不包括疫情信息,计算F和G的相似度,得到相似度,为0.55。根据公式,定值的值可设置为1,得到变量因数为0.45。获取历史电影的票房收入为m,目标电影的票房预测结果为m与变量因数的乘积。定值的设置以实际情况为主,这里不做限定。
在一种可能的实施例中,票房预测结果中第二种方式包括步骤S401-步骤S404。即如图4所示,图4是本申请实施例提供的另一种票房预测方法的流程示意图。
步骤S401:获取第四信息,第四信息为第一信息对应上映时间的电影。
在上述步骤中,第一信息是指目标电影的待上映时间,与目标电影待上映时间相同时间上映的电影,获取与目标电影同一待上映时间的第四信息,第四信息包括电影类型、导演、演员以及出品方中的一种或多种。
步骤S402:计算第二信息与第四信息的第四相似度。
在上述步骤中,计算目标电影与目标电影对应的待上映电影的相似度。
步骤S403:根据第四相似度,得到第二变量因数;第四相似度与第二变量因数呈负相关。
在上述步骤中,根据公式,公式中表示相似度,表示第二变量因数,表示定值。在定值不变的前提下,当相似度越大,第二变量因数就越小;当相似度越小,第二变量因数就越大。根据上述公式,得到第二变量因数。
步骤S404:给用户设备发送目标电影的第三票房预测结果,第三票房预测结果是第一票房预测结果与第二变量因数的乘积。
在上述步骤中,由于电影的票房预测结果还受同一时间段上映电影的影响,在票房预测结果时,要考虑同一时间段上映的电影,当目标电影的电影类型是校园片。在同一时间段,还有另外一部要上映的电影类型也是校园片。当两部电影类型相同的电影同时上映时,用户会在这两个相同类型的电影中,选择其中一部电影进行观看,导致用户在观看电影时分流,影响票房预测结果,造成预测不准确的情况出现。故要考虑同一时间段上映的电影。
举例来说,目标电影S中有演员y,在同一时间段上映的电影W中也有演员y;用户去电影院观看电影时,会基于该演员的影响,选择两部电影中的一个电影进行观看;从两部电影中选择一个电影,导致用户在这个阶段会分流。计算S和W的相似度,得到相似度,为0.30。根据公式,定值的值可设置为1,得到变量因数为0.70。获取历史电影的票房收入为m,目标电影的票房预测结果为m与变量因数的乘积。定值的设置以实际情况为主,这里不做限定。
在一种可能的实施例中,票房预测结果中第三种方式包括步骤S501-步骤S504。即如图5所示,图5是本申请实施例提供的一种票房预测方法的流程示意图。
步骤S501:获取当前的社会热点对应的社会热点标签。
在上述步骤中,社会热点标签是指获取当前各大网站的社会热点中的电影标签,电影标签包括科幻电影、红色电影、历史电影、爱情电影、爱国电影以及武侠电影等。
举例来说,获取百度浏览器的热点排名前十名,在前十名的热点中,提及到国庆节;国庆节对应的是爱国、历史以及红色电影,根据热点的排名,实时了解当前用户所关注的信息。具体获取某个网站或多个网站的社会热点以实际情况为主,这里不做限定。
步骤S502:计算第二信息与社会热点标签的第五相似度。
在上述步骤中,获取目标电影的第二信息,获取各大网站的排名前十热点信息,计算各热点信息与目标电影的第二信息的相似度。
步骤S503:根据第五相似度,得到第三变量因数;第五相似度与第三变量因数呈正相关。
在上述步骤中,公式为,表示相似度,表示第三变量因数;当相似度越大,第三变量就越大;当相似度越小,第三变量因数就越小;根据相似度得到第三变量因数。
步骤S504:给用户设备发送目标电影的第四票房预测结果,第四票房预测结果是第一票房预测结果与第三变量因数的乘积。
在上述步骤中,由于电影的票房预测结果还受社会热点的影响,在票房预测结果时,还需考虑社会热点这个变量因数。
举例来说,通过获取到当前热点信息中,在电影标签中,有关于爱情电影是用户所不关注的;而目标电影的电影类型是爱情类型,要针对于当前热点信息,判断目标电影与当前热点信息的相似度,当相似度越高时,可能会对目标的票房预测结果产生影响;故要考虑社会热点这个因素。
当上述提到的三种变量因数同时存在时,将三种变量因数结合在一起,同时进行计算,得到的计算结果为票房预测结果。
采用上述方法,获取目标电影的待上映时间与对应历史上映时间的电影,计算目标电影与历史上映电影的相似度;将相似度大于预设相似度阈值的电影汇总到预设数据库中,根据预设数据库中电影的历史票房收入作为目标电影的票房预测结果;票房预测结果还考虑了疫情信息、同一时间段上映电影以及社会热点等变量,根据不同的情况,对应调整票房预测结果的输出。
本申请实施例还提供了一种票房预测装置,图6是本申请实施例提供的一种票房预测装置的结构示意图;参考图6,服务器包括接收单元601、处理单元602以及发送单元603。
接收单元601,接收用户设备发送目标电影的票房预测请求,目标电影的票房预测请求包括目标电影信息;其中,目标电影信息包括第一信息和第二信息,第一信息包括待上映时间;第二信息包括电影类型、导演、演员以及出品方的一种或多种。
处理单元602,获取历史上映时间的电影集合,历史上映时间为第一信息对应的历史上映时间;获取第三信息,第三信息为历史上映时间的电影信息,第三信息包括电影类型、导演、演员以及出品方的一种或多种;对第二信息与第三信息进行相似度计算,得到相似度,当相似度大于或等于预设相似度阈值时,将相似度对应的第三信息汇总到预设数据库中;获取预设数据库中第三信息对应的历史票房收入。
发送单元603,将历史票房收入作为目标电影的票房预测结果,给用户设备发送第一票房预测结果,第一票房预测结果为目标电影的票房预测结果。
在一种可能的实施例中,处理单元602还包括计算子单元,计算子单元为对第二信息的文本信息进行处理,得到处理后的预处理文本集;根据预处理文本集,采用Word2Vec构建知识库文本模型,将预处理文本集转换为向量;将向量,利用余弦相似度算法计算第二信息与第三信息之间的相似度,得到第一相似度。
在一种可能的实施例中,接收单元601获取第三信息,处理单元602判断第三信息是否包括疫情信息;当第三信息包括疫情信息时,计算第二信息与第三信息的第二相似度。
在一种可能的实施例中,判断单元602中当第三信息不包括疫情信息时;计算第二信息与第三信息的第三相似度;根据第三相似度,得到第一变量因数;第三相似度与第一变量因数呈负相关;发送单元603给用户设备发送目标电影的第二票房预测结果,第二票房预测结果是第一票房预测结果与第一变量因数的乘积。
在一种可能的实施例中,处理单元602对历史票房收入按小到大进行排序;计算历史票房收入的中位数,发送单元603将中位数作为目标电影的票房预测结果进行输出。
在一种可能的实施例中,接收单元601获取第四信息,第四信息为第一信息对应上映时间的电影;第四信息包括电影类型、导演、演员以及出品方中的一种或多种;处理单元602计算第二信息与第四信息的第四相似度;根据第四相似度,得到第二变量因数;第四相似度与第二变量因数呈负相关;发送单元603给用户设备发送目标电影的第三票房预测结果,第三票房预测结果是第一票房预测结果与第二变量因数的乘积。
在一种可能的实施例中,接收单元601获取当前的社会热点对应的社会热点标签;判断单元602计算第二信息与社会热点标签的第五相似度;根据第五相似度,得到第三变量因数;第五相似度与第三变量因数呈正相关;发送单元603给用户设备发送目标电影的第四票房预测结果,第四票房预测结果是第一票房预测结果与第三变量因数的乘积。
需要说明的是:上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置和方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参见图7,图7为本申请实施例提供了一种电子设备的结构示意图。如图7所示,所述电子设备700可以包括:至少一个处理器701,至少一个网络接口704,用户接口703,存储器705,至少一个通信总线702。
其中,通信总线702用于实现这些组件之间的连接通信。
其中,用户接口703可以包括显示屏(Display)、摄像头(Camera),可选用户接口703还可以包括标准的有线接口、无线接口。
其中,网络接口704可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器701可以包括一个或者多个处理核心。处理器701利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器705内的指令、程序、代码集或指令集,以及调用存储在存储器705内的数据,执行服务器的各种功能和处理数据。可选的,处理器701可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogicArray,PLA)中的至少一种硬件形式来实现。处理器701可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用请求等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器701中,单独通过一块芯片进行实现。
其中,存储器705可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-OnlyMemory)。可选的,该存储器705包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器705可用于存储指令、程序、代码、代码集或指令集。存储器705可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及的数据等。存储器705可选的还可以是至少一个位于远离前述处理器701的存储装置。
如图7所示,作为一种计算机存储介质的存储器705中可以包括操作系统、网络通信模块、用户接口模块以及票房预测的应用程序。
在图7所示的电子设备700中,用户接口703主要用于为用户提供输入的接口,获取用户输入的数据;而处理器701可以用于调用存储器705中存储票房预测的应用程序,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。
一种电子设备可读存储介质,所述电子设备可读存储介质存储有指令。当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必需的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所披露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践真理的公开后,将容易想到本公开的其他实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。
Claims (10)
1.一种票房预测方法,其特征在于,应用于服务器中,所述方法包括:
接收用户设备发送目标电影的票房预测请求,所述目标电影的票房预测请求包括目标电影信息;其中,所述目标电影信息包括第一信息和第二信息,所述第一信息包括待上映时间;所述第二信息包括电影类型、导演、演员以及出品方中的一种或多种;
获取历史上映时间的电影集合,所述历史上映时间为所述第一信息对应的历史上映时间;获取第三信息,所述第三信息为所述历史上映时间的电影信息,所述第三信息包括电影类型、导演、演员以及出品方中的一种或多种;
对所述第二信息与所述第三信息进行相似度计算,得到第一相似度,当所述第一相似度大于或等于预设相似度阈值时,将所述第一相似度对应的所述第三信息汇总到预设数据库中;
获取所述预设数据库中所述第三信息对应的历史票房收入;
将所述历史票房收入作为所述目标电影的票房预测结果,给所述用户设备发送第一票房预测结果,所述第一票房预测结果为所述目标电影的票房预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述第二信息与所述第三信息进行相似度计算,得到第一相似度;具体包括:
对所述第二信息的文本信息进行处理,得到处理后的预处理文本集;
根据所述预处理文本集,采用Word2Vec构建知识库文本模型,将所述预处理文本集转换为向量;
将所述向量,利用余弦相似度算法计算所述第二信息与所述第三信息之间的相似度,得到第一相似度。
3.根据权利要求1所述的方法,其特征在于,所述第二信息还包括疫情信息;所述方法还包括:
获取所述第三信息,判断所述第三信息是否包括所述疫情信息;
当所述第三信息包括所述疫情信息时,计算所述第二信息与所述第三信息的第二相似度。
4.根据权利要求3所述的方法,其特征在于,当所述第三信息不包括所述疫情信息时;所述方法还包括:
计算所述第二信息与所述第三信息的第三相似度;
根据所述第三相似度,得到第一变量因数;所述第三相似度与所述第一变量因数呈负相关;
给所述用户设备发送所述目标电影的第二票房预测结果,所述第二票房预测结果是所述第一票房预测结果与所述第一变量因数的乘积。
5.根据权利要求1所述的方法,其特征在于,在所述获取所述预设数据库中所述第三信息对应的历史票房收入之后,所述方法还包括:
对所述历史票房收入按小到大进行排序;
计算所述历史票房收入的中位数,所述中位数作为所述目标电影的票房预测结果进行输出。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第四信息,所述第四信息为所述第一信息对应上映时间的电影;所述第四信息包括电影类型、导演、演员以及出品方中的一种或多种;
计算所述第二信息与所述第四信息的第四相似度;
根据所述第四相似度,得到第二变量因数;所述第四相似度与所述第二变量因数呈负相关;
给所述用户设备发送所述目标电影的第三票房预测结果,所述第三票房预测结果是所述第一票房预测结果与所述第二变量因数的乘积。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取当前的社会热点对应的社会热点标签;
计算所述第二信息与所述社会热点标签的第五相似度;
根据所述第五相似度,得到第三变量因数;所述第五相似度与所述第三变量因数呈正相关;
给所述用户设备发送所述目标电影的第四票房预测结果,所述第四票房预测结果是所述第一票房预测结果与所述第三变量因数的乘积。
8.一种票房预测装置,其特征在于,所述装置为服务器,所述服务器包括接收单元、处理单元以及发送单元;
所述接收单元,接收用户设备发送目标电影的票房预测请求,所述目标电影的票房预测请求包括目标电影信息目标电影信息目标电影信息;其中,所述目标电影信息包括第一信息和第二信息,所述第一信息包括待上映时间;所述第二信息包括电影类型、导演、演员以及出品方的一种或多种;
所述处理单元,获取历史上映时间的电影集合,所述历史上映时间为所述第一信息对应的历史上映时间;获取第三信息,所述第三信息为所述历史上映时间的电影信息,所述第三信息包括电影类型、导演、演员以及出品方的一种或多种;对所述第二信息与所述第三信息进行相似度计算,得到相似度,当所述相似度大于或等于预设相似度阈值时,将所述相似度对应的所述第三信息汇总到预设数据库中;获取所述预设数据库中所述第三信息对应的历史票房收入;
所述发送单元,将所述历史票房收入作为所述目标电影的票房预测结果,给所述用户设备发送第一票房预测结果,所述第一票房预测结果为所述目标电影的票房预测结果。
9.一种电子设备,其特征在于,包括处理器、存储器、用户接口及网络接口,所述存储器用于存储指令,所述用户接口和网络接口用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如权利要求1-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1-7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310198724.0A CN115983499A (zh) | 2023-03-03 | 2023-03-03 | 一种票房预测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310198724.0A CN115983499A (zh) | 2023-03-03 | 2023-03-03 | 一种票房预测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115983499A true CN115983499A (zh) | 2023-04-18 |
Family
ID=85958279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310198724.0A Pending CN115983499A (zh) | 2023-03-03 | 2023-03-03 | 一种票房预测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115983499A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117177013A (zh) * | 2023-09-15 | 2023-12-05 | 山东心法科技有限公司 | 一种基于语言模型的媒体内容预测方法、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087146A (zh) * | 2018-08-15 | 2018-12-25 | 深圳快购科技有限公司 | 影院票房收入的预测方法及系统 |
CN111061996A (zh) * | 2019-12-09 | 2020-04-24 | 昆明理工大学 | 一种结合Word2vec词向量和LSH局部敏感哈希的推荐算法 |
CN111159437A (zh) * | 2019-12-26 | 2020-05-15 | 中国传媒大学 | 影视作品的传播结果及类型的预测方法及系统 |
CN111833083A (zh) * | 2019-04-17 | 2020-10-27 | 杭州晨熹多媒体科技有限公司 | 多媒体内容的数据处理方法及装置 |
CN113743352A (zh) * | 2021-09-15 | 2021-12-03 | 央视国际网络无锡有限公司 | 一种视频内容相似度的比较方法及装置 |
-
2023
- 2023-03-03 CN CN202310198724.0A patent/CN115983499A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087146A (zh) * | 2018-08-15 | 2018-12-25 | 深圳快购科技有限公司 | 影院票房收入的预测方法及系统 |
CN111833083A (zh) * | 2019-04-17 | 2020-10-27 | 杭州晨熹多媒体科技有限公司 | 多媒体内容的数据处理方法及装置 |
CN111061996A (zh) * | 2019-12-09 | 2020-04-24 | 昆明理工大学 | 一种结合Word2vec词向量和LSH局部敏感哈希的推荐算法 |
CN111159437A (zh) * | 2019-12-26 | 2020-05-15 | 中国传媒大学 | 影视作品的传播结果及类型的预测方法及系统 |
CN113743352A (zh) * | 2021-09-15 | 2021-12-03 | 央视国际网络无锡有限公司 | 一种视频内容相似度的比较方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117177013A (zh) * | 2023-09-15 | 2023-12-05 | 山东心法科技有限公司 | 一种基于语言模型的媒体内容预测方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
CN111062871B (zh) | 一种图像处理方法、装置、计算机设备及可读存储介质 | |
CN108304435B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
JP7537060B2 (ja) | 情報生成方法、装置、コンピュータ機器、記憶媒体及びコンピュータプログラム | |
CN110234018B (zh) | 多媒体内容描述生成方法、训练方法、装置、设备及介质 | |
TWI594203B (zh) | 用於協同媒體收集之系統、機器可讀取儲存媒體及方法 | |
CN108961157B (zh) | 图片处理方法、图片处理装置及终端设备 | |
CN111611436A (zh) | 一种标签数据处理方法、装置以及计算机可读存储介质 | |
CN110489574B (zh) | 一种多媒体信息推荐方法、装置和相关设备 | |
CN109348262B (zh) | 一种主播相似度的计算方法、装置、设备和存储介质 | |
CN112507163B (zh) | 时长预测模型训练方法、推荐方法、装置、设备及介质 | |
CN113688310B (zh) | 一种内容推荐方法、装置、设备及存储介质 | |
CN110516734B (zh) | 一种图像匹配方法、装置、设备及存储介质 | |
EP2756473A1 (en) | Facilitating television based interaction with social networking tools | |
CN115983499A (zh) | 一种票房预测方法、装置、电子设备及存储介质 | |
CN106407268A (zh) | 一种基于覆盖率最优化法的内容检索方法及系统 | |
CN105956061B (zh) | 一种用户间相似度确定方法及装置 | |
US12120389B2 (en) | Systems and methods for recommending content items based on an identified posture | |
CN110704679B (zh) | 视频分类方法、装置及电子设备 | |
CN114691853A (zh) | 句子推荐方法、装置、设备及计算机可读存储介质 | |
KR20210093743A (ko) | 미디어 인리치먼트 제공 방법 및 장치 | |
CN116596752B (zh) | 脸部图像替换方法、装置、设备及存储介质 | |
WO2024103620A1 (zh) | 内容生成方法、装置、计算机设备和存储介质 | |
CN116561695A (zh) | 语料处理方法、装置、电子设备、存储介质及产品 | |
CN115238177A (zh) | 一种表情图片推荐方法及装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230418 |