CN107633332A - 一种金融电子资源预测方法和系统 - Google Patents

一种金融电子资源预测方法和系统 Download PDF

Info

Publication number
CN107633332A
CN107633332A CN201710937725.7A CN201710937725A CN107633332A CN 107633332 A CN107633332 A CN 107633332A CN 201710937725 A CN201710937725 A CN 201710937725A CN 107633332 A CN107633332 A CN 107633332A
Authority
CN
China
Prior art keywords
film
time period
electronic resource
financial electronic
movie
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710937725.7A
Other languages
English (en)
Inventor
王肃
杨耀威
杨涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoxin Youe Data Co Ltd
Original Assignee
Guoxin Youe Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoxin Youe Data Co Ltd filed Critical Guoxin Youe Data Co Ltd
Priority to CN201710937725.7A priority Critical patent/CN107633332A/zh
Publication of CN107633332A publication Critical patent/CN107633332A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提供了一种金融电子资源预测方法,包括:基于电影的预设属性特征,构建对电影相关金融电子资源走势进行预测的金融电子资源预测模型;针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征;针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练;获取所述待预测电影在当前放映时间段内的预设属性特征,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段待预测电影相关金融电子资源的走势。

Description

一种金融电子资源预测方法和系统
技术领域
本发明涉及数据分析技术领域,具体而言,涉及一种金融电子资源预测方法和系统。
背景技术
影视行业中,电影在筹拍过程中需要投资者投入大量的资金,以保证电影的拍摄以及后期的剪辑、宣传工作。因此,在电影上映后,票房的好坏直接关系到前期投资人的利益,同时,电影票房的好坏与电影相应股票的涨跌之间存在较强的联系,影片的票房可能影响发行影片的电影公司的股价,甚至可以决定影视公司的生死。而现阶段,在一部影片上映后,无法对电影相应股票走势进行预测,无法保障投资人的利益,因此,对电影相关股票预测则显得尤为重要。
发明内容
有鉴于此,本发明的目的在于提供一种金融电子资源预测方法和系统,用于解决现有技术中的无法对金融电子资源进行预测的问题,以降低投资者的投资风险。
第一方面,本发明实施例提供一种金融电子资源预测方法,该方法包括:
基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;
针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;
针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;
获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。
可选地,所述预设属性特征包括:电影特征;所述电影特征包括:同类型电影投资比和影片获奖指数;
所述同类型电影投资比基于对应电影的投资额与预设同类型电影投资额中位数之间的比值确定;
所述影片获奖指数基于对应电影当前是否已获得预设奖项确定;若对应电影当前已获得任一预设奖项,则确定对应电影的影片获奖指数值为第一预设数值;若对应电影当前未获得任一预设奖项,则确定对应电影的影片获奖指数值为第二预设数值。
可选地,所述预设属性特征包括:口碑特征;所述口碑特征包括:影片媒体曝光度、影片评论特征、和影片评分;
采用如下公式确定影片媒体曝光度ME
其中,x表征对应时间段内报道对应电影的新闻数量总和;N表征对应时间段内报道对应电影的媒体数量和;N′表征对应时间段内监控的媒体数量和;α、β为权重系数,且α+β=1;
所述影片评论特征的值基于对应时间段内预设社交媒体中对对应影片的正面或负面评论数量与评论总数量之间的比值确定;
采用如下公式确定影片评分Ms
其中,Si表征对应时间段内第i个影评单位为对应电影的评分;S′i表征第i个影片单位的电影评分区间上限;Wi表征第i个影评单位的权重,且∑Wi=1,i∈[1,n]。
可选地,所述预设属性特征包括:票房特征;所述票房特征包括:影片排座占比和影片盈利指数;
所述影片排座占比基于对应时间段内所有上映对应电影的影院中播放该对应电影的放映厅数量与放映厅总数的比值确定;
所述影片盈利指数基于对应电影当前累计票房收入与对应电影投资额的比值确定。
可选地,所述预设属性特征包括:金融电子资源特征;所述金融电子资源特征包括:当前金融电子资源走势特征;
所述当前金融电子资源走势特征基于对应电影当前放映时间段金融电子资源价格与上一放映时间段金融电子资源价格的大小关系确定;若当前放映时间段金融电子资源价格高于上一放映时间段金融电子资源价格,则确定当前金融电子资源走势特征取第一特征值,否则,取第二特征值。
可选地,针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重,具体包括:
将获取的多个已放映电影对应的预设属性特征信息划分为训练数据集和测试数据集;
为构建的金融电子资源预测模型生成表征任一历史放映时间段内已放映电影的预设属性特征的自变量矩阵,以及表征各预算属性特征权重的权重矩阵;
针对训练数据集中每个已放映电影的每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值输入所述自变量矩阵,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,采用多种预设机器学习算法,对所述金融电子资源预测模型进行训练;
针对采用多种机器学习算法对所述金融电子资源预测模型进行训练得后得到的模型,将所述测试数据集中对应已放映电影的每个历史放映时间段内预设属性特征信息输入该模型,得到由该模型确定的对应历史放映时间段的下一历史放映时间段的金融电子资源的走势;
将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对;
根据比对结果的准确性确定最终采用的训练后的金融电子资源预测模型。
可选地,将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对,具体包括:
根据以下公式确定任一训练后的金融电子资源预测模型对应的错误估计函数值:
其中,q表征所述训练后的股票价格走势预测模型对应的错误估计函数值;hw(xi)表征模型确定的第i个历史放映时间段的金融电子资源走势取值;y(i)表征所述测试数据集中对应的该第i个历史放映时间段的金融电子资源走势取值;a表征调整系数,且为正整数;n表征所述测试数据集中测试预测的金融电子资源走势次数,且为正整数。
第二方面,本发明实施例提供一种金融电子资源预测系统,该系统包括:
模型构建单元,用于基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;
获取单元,用于针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;
权重确定单元,用于针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;
预测单元,用于获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。
第三方面,本发明实施例提供一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。
本发明实施例的金融电子资源预测方法和系统,该方法包括:基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。本发明提供的金融电子资源预测方法,通过机器学习方法构建金融电子资源预测模型,利用金融电子资源预测模型对金融电子资源的走势进行预测,提高了对金融电子资源的走势进行预测的精确度,降低投资者的投资风险。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明一实施例提供的一种金融电子资源预测方法的流程示意图;
图2为本发明一实施例提供的一种金融电子资源预测方法中确定各自变量的权重的流程示意图
图3为本发明一实施例提供的一种金融电子资源预测系统的第一种结构示意图;
图4为本发明一实施例提供的一种金融电子资源预测系统的第二种结构示意图;
图5为本发明一实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种金融电子资源预测方法,如图1所示,具体包括以下步骤:
S101,基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;
S102,针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;
S103,针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;
S104,获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。
具体地,预设属性特征至少包括电影特征、口碑特征、票房特征、金融电子资源特征等;其中,电影特征包括同类型电影投资比、影片获奖指数等;口碑特征包括影片媒体曝光度、影片评论特征、和影片评分等;票房特征包括影片排座占比和影片盈利指数等;金融电子资源特征包括当前金融电子资源走势特征等;金融电子资源可以为与待预测电影相关的股票。
历史放映时间段可以为与待预测电影同类型已放映电影的放映期内,按照时间顺序依次排列的多个时间段,每个历史放映时间段的时间长度都是一致的,可以根据实际的需求进行具体的设定。如,可以将历史放映时间段设定为:一天、一周、两周、一个月、一个季度等,若将历史放映时间段设定为一周,不足一周的以一周为准。
当前放映时间段可以为待预测电影的放映期内,按照时间顺序依次排列的多个时间段,每个当前放映时间段的时间长度都是一致的,可以根据实际的需求进行具体的设定;如,可以将当前放映时间段设定为:一天、一周、两周、一个月、一个季度等,在将当前放映时间段设定为一周时,待预测电影的放映期中时间长度不足一周的记为一周。在具体应用中,当前放映时间段的时间长度可以与历史放映时间段的时间长度一致,以保证对相关金融电子资源的走势的预测精度。
待预测电影的当前放映时间段对应的相关金融电子资源的走势是已知的,当前放映时间段的下一个放映时间段对应的相关金融电子资源的走势是未知的。
本发明提供的金融电子资源预测方法,通过机器学习方法构建金融电子资源预测模型,利用金融电子资源预测模型对金融电子资源的走势进行预测,提高了对金融电子资源的走势进行预测的精确度,降低投资者的投资风险。
以下针对每个预设属性特征进行详细叙述:
1)预设属性特征为电影特征,电影特征包括同类型电影投资比和影片获奖指数。
由于导演和演员存在一定的不确定性,面对电影市场的高速变化,导演和演员的组合并不能绝对保障票房,不同类型电影的票房预期和观众接受度有较大不同,但是,电影的获奖情况在一定程度上标明其获得了大众的认可,同时,对电影的宣传起到积极作用。因此,电影特征采用同类型电影投资比和影片获奖指数。
同类型电影投资比基于对应电影的投资额与预设同类型电影投资额中位数之间的比值确定;
根据以下公式计算同类型电影投资比MI
MI=I/I′
其中,MI表征对应电影的同类型电影投资比;I表征对应电影的投资额;I′表征预设型电影投资额的中位数。
同类型电影投资比MI表征影片对投资方的重要程度以及影片投资方对票房收入的逾期。在实际应用中,存在个别电影的投资额远超或远低于同类型影片中位数投资额,因此,需要对MI进行特征值量化,使之属于[0,1]。在对MI进行量化时可参考表1:
表1同类型电影投资比量化表
MI 特征值
5<MI 1
3<MI≤5 0.9
1<MI≤3 0.7
MI=1 0.5
0.6≤MI<1 0.3
0.3≤MI<1 0.1
MI<0.3 0.05
例如,计算得到的同类型电影投资比MI=2,则对MI进行量化后的特征值为0.7。
影片获奖指数基于对应电影当前是否已获得预设奖项确定;若对应电影当前已获得任一预设奖项,则确定对应电影的影片获奖指数值为第一预设数值;若对应电影当前未获得任一预设奖项,则确定对应电影的影片获奖指数值为第二预设数值。
具体地,预设奖项可以是重要的奖项,例如奥斯卡奖,也可以为普通的奖项如金鸡百花奖等。无论影片获得的是重要的奖项,或者是普通的奖项,则认为该电影的影片获奖指数为第一预设数值,否则,为第二预设数值。优选地,第一预设数值可以为1,第二预设数值可以为0。
根据以下公式确定影片获奖指数MH
例如,电影在未上映前或放映期间会参与各种奖项评定,若在放映之前,该已放映电影未获得任何奖项,在放映期的第二周获得奥斯卡奖,在放映期的第五周获得金鸡百花将,则该已放映电影在放映期的第一周对应的影片获奖指数为0,第二周之后的每一周对应的影片获奖指数均为1,也就是说,只要影片获得奖项,在获奖之后的每周无论该影片是否再次获得奖项,该影片对应的影片获奖指数均为1。
2)预设属性特征包括口碑特征,口碑特征包括:影片媒体曝光度、影片评论特征、和影片评分。
电影上映后的电影的口碑会影响未观影群体对该电影的判断,同时,也会影响股票投资人的情绪和决策。因此,口碑特征使用以下三个特征:影片媒体曝光度、影片评论特征、和影片评分。
采用如下公式确定影片媒体曝光度ME
其中,ME表征对应电影的影片媒体曝光度;x表征对应时间段内报道对应电影的新闻数量总和;N表征对应时间段内报道对应电影的媒体数量和;N′表征对应时间段内监控的媒体数量和;α、β为权重系数,且α+β=1。
例如,若影视公司监控的媒体数量N′为30家,其中有N=20家媒体对该电影进行了宣传对比,统计电影上映期间20家媒体对电影的报道的数量的总和记为x。
影片评论特征的值基于对应时间段内预设社交媒体中对对应影片的正面或负面评论数量与评论总数量之间的比值确定;
根据以下公式确定影片评论特征的值MC
MC=C/C′
其中,MC表征对应影片在对应时间段的影片评论特征的值;C表征对应影片在对应时间段的正面评论数量或负面评论数量,C′为对应时间段内评论总数量。
在实际应用中,对于同一个影片而言,放映期中的每个时间段对应的影片评论特征的值应统一为正面评论数量和评论总数量的比值,或者统一为负面评论数量和品论总数量的比值。如,放映期中第一周确定的影片评论特征的值为正面评论数量和评论总数量的比值,则之后的每一周直到放映期结束,均采用正面评论数量和评论总数量的比值作为对应周的影片评论特征的值。
采用如下公式确定影片评分Ms:
其中,Si表征对应时间段内第i个影评单位为对应电影的评分;S′i表征第i个影片单位的电影评分区间上限;Wi表征第i个影评单位的权重,且∑Wi=1,i∈[1,n]。
影片评分取自专业的或影响力较大的影片单位,如,豆瓣、互联网电影数据库(IMDB)、爱奇艺等。每个影片单位对电影的评分以对应时间段结束时的评分作为最终评分,如,在某一个时间段中影片评分为9.2分,在该时间段结束时,影片评分更新为8.5分,此时,该时间段的电影的评分为8.5分;电影评分区间上限为对电影评价的理想最高值,如,豆瓣的电影评分区间为[0,10],则电影评分区间上限为10;由于各个影片单位的影响力不同,据此为每个影片单位设置权重;由于各个影片单位的评分机制不同,因此,需要获取的各个影片单位对电影的评分进行归一化,使电影评分值Ms映射在[0,1]范围内。
3)预设属性特征包括票房特征;票房特征包括影片排座占比和影片盈利指数。
由于电影在上映期间,每周累计票房收入反应了电影的赢利情况,,采用影片排座占比表征影片放映结构对电影的重视程度,以便影片放映结构根据影片排座占比对影片的放映资源进行调整。
影片排座占比基于对应时间段内所有上映对应电影的影院中播放该对应电影的放映厅数量与放映厅总数的比值确定;
根据以下公式确定影片排座占比MA
MA=P/P’
其中,P表征对应时间段内所有上映对应电影的影院中播放对应电影的放映厅数量;P’表征所有上映对应电影的影院中的放映厅的总数。
影片盈利指数基于对应电影当前累计票房收入与对应电影投资额的比值确定。
根据以下公式确定影片赢利指数MWI
MWI=W/I
其中,W表征对应电影的当前累计票房收入;I为对应电影的投资额。
MWI表征影片的盈利情况。在实际应用中,需要对MWI进行特征值量化,使之属于[0,1]。在对MWI进行量化时可参考表2:
表2影片赢利指数量化表
例如,影片赢利指数MWI为3,则对应的特征值为0.9。
4)预设属性特征包括金融电子资源特征;金融电子资源特征包括当前金融电子资源走势特征。
金融电子资源特征可以为电影相关股票特征,当前金融电子资源走势特征可以为当前电影相关股票走势特征。
当前金融电子资源走势特征基于对应电影当前放映时间段金融电子资源价格与上一放映时间段金融电子资源价格的大小关系确定;若当前放映时间段金融电子资源价格高于上一放映时间段金融电子资源价格,则确定当前金融电子资源走势特征取第一特征值,否则,取第二特征值。
以电影相关股票作为金融电子资源为例进行说明,在确定当前金融电子资源走势时,将当前放映时间段内每个单位时间股票收盘价的平均价作为金融电子资源价格,若电影相关股市在当前放映时间段处于停牌阶段或进入停牌阶段,则使用上一放映时间段金融电子资源价格,定义两个变量:1表示上升、0表示无变化或下降。
根据以下公式确定当前金融电子资源走势特征Sc
其中,Sc表征当前金融电子资源走势;Xc表示当前放映时间段金融电子资源价格;Xc+1表示上一放映时间段金融电子资源价格;其中c为[1,t],t为放映期最后一个放映时间段。
进一步地,由于预设属性特征值在任一放映时间段(包括历史放映时间段)内的不同时间点可能不同,在获取任一放映时间段内的任一预设属性特征值时,可以预先设置在对应时间段内获取预设属性特征值的时间点,并将在该时间点获取的预设属性特征值作为对应时间段内获取的特征值,例如:每个放映时间段的最后一天。
在步骤S103中,针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重,通过步骤S201-206实现,具体包括以下步骤:
S201,将获取的多个已放映电影对应的预设属性特征信息划分为训练数据集和测试数据集;
具体地,可以将第一预设百分比的多个已放映电影对应的预设属性特征信息确定为训练数据集,将第二预设百分比的多个已放映电影对应的预设属性特征信息确定为测试数据集。可选地,第一预设百分比可以为80%,第二预设百分比可以为20%,具体可视实际情况而定。
S202,为构建的金融电子资源预测模型生成表征任一历史放映时间段内已放映电影的预设属性特征的自变量矩阵,以及表征各预算属性特征权重的权重矩阵;
S203,针对训练数据集中每个已放映电影的每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值输入所述自变量矩阵,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,采用多种预设机器学习算法,对所述金融电子资源预测模型进行训练;
具体地,每个历史放映时间段已放映电影相关金融电子资源的走势的确定方法与当前金融电子资源走势的确定方法相同,不再进行介绍;预设机器学习算法包括但不限于:逻辑回归(Logistic Regression)算法、支持向量机(Support Vector Machines)算法、相关向量机(Relevance Vector Machine)算法、K近邻(k-Nearest Neighbors)算法、贝叶斯分类器(Naive Bayes classifier)算法、决策树(Decision Tree)算法、随机森林(RandomForrest)算法、感知机(Perceptron)算法等。
在实际应用中,已有的机器学习工具包已经封装好了若干机器学习的算法,以scikit-learn实现为例,通过以下步骤实现:
from sklearn.linear_model import LogisticRegression
#使用逻辑回归算法
logreg=LogisticRegression()
#使用逻辑回归算法训练模型,X_train为训练集因变量,Y_train为训练集自变量
logreg.fit(X_train,Y_train)
#使用训练好模型对测试集进行预测,X_test为测试集因变量
Y_pred=logreg.predict(X_test)
#输出预测准确度分数
acc_log=round(logreg.score(X_train,Y_train)*100,2)
S204,针对采用多种机器学习算法对所述金融电子资源预测模型进行训练得后得到的模型,将所述测试数据集中对应已放映电影的每个历史放映时间段内预设属性特征信息输入该模型,得到由该模型确定的对应历史放映时间段的下一历史放映时间段的金融电子资源的走势;
例如,使用本发明实施例提供一种运算矩阵
hw(xi)=WTX
其中,hw(xi)表征训练后的模型确定的第i个历史放映时间段的金融电子资源走势的取值;
为自变量矩阵,x0、x1、……、xn为自变量,即已放映电影的预设属性特征信息作为自变量的值;
为参数矩阵,其中,w0、w1、……、wn分别对应为各个自变量的参数,即w0、w1、……、wn分别对应为x0、x1、……、xn的参数。
S205,将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对;
S206,根据比对结果的准确性确定最终采用的训练后的金融电子资源预测模型。
进一步地,在执行步骤S205时,将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对,具体包括:
根据以下公式确定任一训练后的金融电子资源预测模型对应的错误估计函数值:
其中,q表征所述训练后的股票价格走势预测模型对应的错误估计函数值;hw(xi)表征模型确定的第i个历史放映时间段的金融电子资源走势取值;y(i)表征所述测试数据集中对应的该第i个历史放映时间段的金融电子资源走势取值;a表征调整系数,且为正整数;n表征所述测试数据集中测试预测的金融电子资源走势次数,且为正整数。
具体地,根据上述错误估计函数值公式计算每个训练后的股票价格走势预测模型对应的错误估计函数值,将最小的错误估计函数值对应的股票价格走势预测模型确定为最终采用的训练后的金融电子资源预测模型,增加了对金融电子资源的走势进行预测的精确度。
本发明实施例提供一种金融电子资源预测系统,如图3所示,该系统包括:
模型构建单元31,用于基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;
获取单元32,用于针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;
权重确定单元33,用于针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;
预测单元34,用于获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。
可选地,所述预设属性特征包括:电影特征;所述电影特征包括:同类型电影投资比和影片获奖指数;
所述同类型电影投资比基于对应电影的投资额与预设同类型电影投资额中位数之间的比值确定;
所述影片获奖指数基于对应电影当前是否已获得预设奖项确定;若对应电影当前已获得任一预设奖项,则确定对应电影的影片获奖指数值为第一预设数值;若对应电影当前未获得任一预设奖项,则确定对应电影的影片获奖指数值为第二预设数值。
可选地,所述预设属性特征包括:口碑特征;所述口碑特征包括:影片媒体曝光度、影片评论特征、和影片评分;
采用如下公式确定影片媒体曝光度ME
其中,x表征对应时间段内报道对应电影的新闻数量总和;N表征对应时间段内报道对应电影的媒体数量和;N′表征对应时间段内监控的媒体数量和;α、β为权重系数,且α+β=1;
所述影片评论特征的值基于对应时间段内预设社交媒体中对对应影片的正面或负面评论数量与评论总数量之间的比值确定;
采用如下公式确定影片评分Ms
其中,Si表征对应时间段内第i个影评单位为对应电影的评分;S′i表征第i个影片单位的电影评分区间上限;Wi表征第i个影评单位的权重,且∑Wi=1,i∈[1,n]。
可选地,所述预设属性特征包括:票房特征;所述票房特征包括:影片排座占比和影片盈利指数;
所述影片排座占比基于对应时间段内所有上映对应电影的影院中播放该对应电影的放映厅数量与放映厅总数的比值确定;
所述影片盈利指数基于对应电影当前累计票房收入与对应电影投资额的比值确定。
可选地,所述预设属性特征包括:金融电子资源特征;所述金融电子资源特征包括:当前金融电子资源走势特征;
所述当前金融电子资源走势特征基于对应电影当前放映时间段金融电子资源价格与上一放映时间段金融电子资源价格的大小关系确定;若当前放映时间段金融电子资源价格高于上一放映时间段金融电子资源价格,则确定当前金融电子资源走势特征取第一特征值,否则,取第二特征值。
可选地,如图4所示,本发明实施例提供一种权重确定单元的具体结构,该权重确定单元33包括:
数据划分单元331,用于将获取的多个已放映电影对应的预设属性特征信息划分为训练数据集和测试数据集;
生成单元332,用于为构建的金融电子资源预测模型生成表征任一历史放映时间段内已放映电影的预设属性特征的自变量矩阵,以及表征各预算属性特征权重的权重矩阵;
模型训练单元333,用于针对训练数据集中每个已放映电影的每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值输入所述自变量矩阵,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,采用多种预设机器学习算法,对所述金融电子资源预测模型进行训练;
走势确定单元334,针对采用多种机器学习算法对所述金融电子资源预测模型进行训练得后得到的模型,将所述测试数据集中对应已放映电影的每个历史放映时间段内预设属性特征信息输入该模型,得到由该模型确定的对应历史放映时间段的下一历史放映时间段的金融电子资源的走势;
比对单元335,用于将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对;
模型确定单元336,用于根据比对结果的准确性确定最终采用的训练后的金融电子资源预测模型。
可选地,比对单元335具体用于:
根据以下公式确定任一训练后的金融电子资源预测模型对应的错误估计函数值:
其中,q表征所述训练后的股票价格走势预测模型对应的错误估计函数值;hw(xi)表征模型确定的第i个历史放映时间段的金融电子资源走势取值;y(i)表征所述测试数据集中对应的该第i个历史放映时间段的金融电子资源走势取值;a表征调整系数,且为正整数;n表征所述测试数据集中测试预测的金融电子资源走势次数,且为正整数。
对应于图1中的用户推荐方法,本发明实施例还提供了一种计算机设备,如图5所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述金融电子资源预测方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述金融电子资源预测方法,从而解决现有技术中无法进行金融电子资源走势预测的问题,通过机器学习方法构建金融电子资源预测模型,利用金融电子资源预测模型对金融电子资源的走势进行预测,提高了对金融电子资源的走势进行预测的精确度,降低投资者的投资风险。
对应于图1中的金融电子资源预测方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述金融电子资源预测方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述金融电子资源预测方法,从而解决现有技术中无法进行金融电子资源走势预测的问题,通过机器学习方法构建金融电子资源预测模型,利用金融电子资源预测模型对金融电子资源的走势进行预测,提高了对金融电子资源的走势进行预测的精确度,降低投资者的投资风险。
在本发明所提供的实施例中,应该理解到,所揭露系统和方法,可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种金融电子资源预测方法,其特征在于,该方法包括:
基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;
针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;
针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;
获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。
2.如权利要求1所述的方法,其特征在于,所述预设属性特征包括:电影特征;所述电影特征包括:同类型电影投资比和影片获奖指数;
所述同类型电影投资比基于对应电影的投资额与预设同类型电影投资额中位数之间的比值确定;
所述影片获奖指数基于对应电影当前是否已获得预设奖项确定;若对应电影当前已获得任一预设奖项,则确定对应电影的影片获奖指数值为第一预设数值;若对应电影当前未获得任一预设奖项,则确定对应电影的影片获奖指数值为第二预设数值。
3.如权利要求1所述的方法,其特征在于,所述预设属性特征包括:口碑特征;所述口碑特征包括:影片媒体曝光度、影片评论特征、和影片评分;
采用如下公式确定影片媒体曝光度ME
<mrow> <msub> <mi>M</mi> <mi>E</mi> </msub> <mo>=</mo> <mi>&amp;alpha;</mi> <mo>*</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mn>0.1</mn> <mi>x</mi> </mrow> </msup> </mrow> </mfrac> <mo>+</mo> <mi>&amp;beta;</mi> <mo>*</mo> <mrow> <mo>(</mo> <mfrac> <mi>N</mi> <msup> <mi>N</mi> <mo>&amp;prime;</mo> </msup> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,x表征对应时间段内报道对应电影的新闻数量总和;N表征对应时间段内报道对应电影的媒体数量和;N′表征对应时间段内监控的媒体数量和;α、β为权重系数,且α+β=1;
所述影片评论特征的值基于对应时间段内预设社交媒体中对对应影片的正面或负面评论数量与评论总数量之间的比值确定;
采用如下公式确定影片评分Ms
<mrow> <msub> <mi>M</mi> <mi>s</mi> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>W</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mfrac> <msub> <mi>S</mi> <mi>i</mi> </msub> <mrow> <msub> <msup> <mi>S</mi> <mo>&amp;prime;</mo> </msup> <mi>i</mi> </msub> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,Si表征对应时间段内第i个影评单位为对应电影的评分;S′i表征第i个影片单位的电影评分区间上限;Wi表征第i个影评单位的权重,且∑Wi=1,i∈[1,n]。
4.如权利要求1所述的方法,其特征在于,所述预设属性特征包括:票房特征;所述票房特征包括:影片排座占比和影片盈利指数;
所述影片排座占比基于对应时间段内所有上映对应电影的影院中播放该对应电影的放映厅数量与放映厅总数的比值确定;
所述影片盈利指数基于对应电影当前累计票房收入与对应电影投资额的比值确定。
5.如权利要求1所述的方法,其特征在于,所述预设属性特征包括:金融电子资源特征;所述金融电子资源特征包括:当前金融电子资源走势特征;
所述当前金融电子资源走势特征基于对应电影当前放映时间段金融电子资源价格与上一放映时间段金融电子资源价格的大小关系确定;若当前放映时间段金融电子资源价格高于上一放映时间段金融电子资源价格,则确定当前金融电子资源走势特征取第一特征值,否则,取第二特征值。
6.如权利要求1所述的方法,其特征在于,针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重,具体包括:
将获取的多个已放映电影对应的预设属性特征信息划分为训练数据集和测试数据集;
为构建的金融电子资源预测模型生成表征任一历史放映时间段内已放映电影的预设属性特征的自变量矩阵,以及表征各预算属性特征权重的权重矩阵;
针对训练数据集中每个已放映电影的每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值输入所述自变量矩阵,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,采用多种预设机器学习算法,对所述金融电子资源预测模型进行训练;
针对采用多种机器学习算法对所述金融电子资源预测模型进行训练得后得到的模型,将所述测试数据集中对应已放映电影的每个历史放映时间段内预设属性特征信息输入该模型,得到由该模型确定的对应历史放映时间段的下一历史放映时间段的金融电子资源的走势;
将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对;
根据比对结果的准确性确定最终采用的训练后的金融电子资源预测模型。
7.如权利要求6所述的方法,其特征在于,将由模型确定的下一历史放映时间段的金融电子资源走势与所述测试数据集中该下一历史放映时间段的金融电子资源走势作比对,具体包括:
根据以下公式确定任一训练后的金融电子资源预测模型对应的错误估计函数值:
<mrow> <mi>q</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>a</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mi>w</mi> </msub> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>)</mo> <mo>-</mo> <msup> <mi>y</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </msup> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中,q表征所述训练后的股票价格走势预测模型对应的错误估计函数值;hw(xi)表征模型确定的第i个历史放映时间段的金融电子资源走势取值;y(i)表征所述测试数据集中对应的该第i个历史放映时间段的金融电子资源走势取值;a表征调整系数,且为正整数;n表征所述测试数据集中测试预测的金融电子资源走势次数,且为正整数。
8.一种金融电子资源预测系统,其特征在于,该系统包括:
模型构建单元,用于基于电影的预设属性特征,构建用于对电影相关金融电子资源走势进行预测的金融电子资源预测模型;
获取单元,用于针对与待预测电影同类型已放映电影,获取该已放映电影在放映期间连续多个历史放映时间段内的预设属性特征信息;
权重确定单元,用于针对每个历史放映时间段,将该历史放映时间段内已放映电影的预设属性特征信息作为自变量的值,将该历史放映时间段的下一历史放映时间段该已放映电影相关金融电子资源的走势作为因变量的值,对所述金融电子资源预测模型进行训练,得到各自变量的权重;
预测单元,用于获取所述待预测电影在当前放映时间段内的预设属性特征信息,并输入完成训练的金融电子资源预测模型,预测当前放映时间段的下一放映时间段所述待预测电影相关金融电子资源的走势。
9.一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至7任一项所述的方法的步骤。
CN201710937725.7A 2017-09-30 2017-09-30 一种金融电子资源预测方法和系统 Pending CN107633332A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710937725.7A CN107633332A (zh) 2017-09-30 2017-09-30 一种金融电子资源预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710937725.7A CN107633332A (zh) 2017-09-30 2017-09-30 一种金融电子资源预测方法和系统

Publications (1)

Publication Number Publication Date
CN107633332A true CN107633332A (zh) 2018-01-26

Family

ID=61103032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710937725.7A Pending CN107633332A (zh) 2017-09-30 2017-09-30 一种金融电子资源预测方法和系统

Country Status (1)

Country Link
CN (1) CN107633332A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034908A (zh) * 2018-08-07 2018-12-18 大连理工大学 一种结合排序学习的电影排名预测方法
CN109191165A (zh) * 2018-07-12 2019-01-11 北京猫眼文化传媒有限公司 一种票房走势预测方法及装置
CN110443374A (zh) * 2019-08-14 2019-11-12 腾讯科技(深圳)有限公司 一种资源信息处理方法、装置及设备
CN110503332A (zh) * 2019-08-21 2019-11-26 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191165A (zh) * 2018-07-12 2019-01-11 北京猫眼文化传媒有限公司 一种票房走势预测方法及装置
CN109034908A (zh) * 2018-08-07 2018-12-18 大连理工大学 一种结合排序学习的电影排名预测方法
CN110443374A (zh) * 2019-08-14 2019-11-12 腾讯科技(深圳)有限公司 一种资源信息处理方法、装置及设备
CN110503332A (zh) * 2019-08-21 2019-11-26 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法
CN110503332B (zh) * 2019-08-21 2022-12-30 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法

Similar Documents

Publication Publication Date Title
Brynjolfsson et al. GDP-B: Accounting for the value of new and free goods in the digital economy
US20200090268A1 (en) Method and apparatus for determining level of risk of user, and computer device
CN107633332A (zh) 一种金融电子资源预测方法和系统
Brynjolfsson et al. The digital economy, GDP and consumer welfare: Theory and evidence
US20150310358A1 (en) Modeling consumer activity
McKenzie Revealed word-of-mouth demand and adaptive supply: Survival of motion pictures at the Australian box office
Chen et al. Learning about movies: The impact of movie release types on the nationwide box office
US10832262B2 (en) Modeling consumer activity
US20230186213A1 (en) Systems and methods for identifying, quantifying, and mitigating risk
Cole Learning and the effectiveness of central bank forward guidance
WO2020024718A1 (zh) 外汇交易量预测方法和装置
CN110838043A (zh) 商品推荐方法及装置
Ibhagui External debt and current account adjustments: The Role of Trade Openness
Balan et al. Simulating hospital merger simulations
US20240046194A1 (en) Performance evaluation systems and methods
CN113570257A (zh) 基于评分模型的指标数据评估方法和装置、介质、设备
US20140195312A1 (en) System and method for management of processing workers
US20060190369A1 (en) Predicting risk and return for a portfolio of entertainment projects
EP4208837A1 (en) Methods and systems for monitoring brand performance based on consumer behavior metric data and expenditure data related to a competitive brand set over time
CN108665312B (zh) 用于生成信息的方法和装置
US20240062286A1 (en) Method and device for operating financial service on the basis of stage, and computer-readable recording medium
US20170011414A1 (en) Systems and methods for reward prediction and offer selection
CN107274043B (zh) 预测模型的质量评价方法、装置及电子设备
Lee et al. The diffusion pattern of new products: evidence from the Korean movie industry
US10083459B2 (en) Methods and apparatus to generate a media rank

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180126