CN113723678A - 基于电证指数的股票预测方法、装置、设备和存储介质 - Google Patents

基于电证指数的股票预测方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113723678A
CN113723678A CN202110990178.5A CN202110990178A CN113723678A CN 113723678 A CN113723678 A CN 113723678A CN 202110990178 A CN202110990178 A CN 202110990178A CN 113723678 A CN113723678 A CN 113723678A
Authority
CN
China
Prior art keywords
historical
electric
index
stock
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110990178.5A
Other languages
English (en)
Inventor
权锐
孔德诗
彭小庆
柯行思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110990178.5A priority Critical patent/CN113723678A/zh
Publication of CN113723678A publication Critical patent/CN113723678A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Finance (AREA)
  • Pure & Applied Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据分析技术领域,公开了一种基于电证指数的股票预测方法、装置、设备和存储介质,所述方法包括:获取企业集合中各个企业的历史电力数据和历史股票数据;获取历史电力数据和历史股票数据间的相关系数;基于相关系数获取历史电证指数,历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;基于历史电证指数对股票走势进行预测。本发明通过探索电力数据与股票数据间的相关联系,利用电力数据来对股市走势进行预测,为投资者提供数据支持。

Description

基于电证指数的股票预测方法、装置、设备和存储介质
技术领域
本发明涉及数据分析技术领域,具体是指一种基于电证指数的股票预测方法、装置、设备和存储介质。
背景技术
在证券领域,随着经济结构的不断升级,以需求稳定为特征的可选消费、日常消费、医疗保健行业的规模大幅提升,钢铁、有色金属、化工等周期股等的比例由于确定性不强,其规模在持续降低。事实上,并不是投资者不喜欢炒周期股,而是无法持续关注公司的业绩情况。特别以资源股为例,由于其强周期性,资源股存在明显的“三年不开张,开张吃三年”的情况,当行业周期转好时,业绩经常呈现大幅增长,股价在短时间内会大幅增长。但由于资源股的供需受到全球经济的影响,跟踪难度非常大,投资者很难预测其走势变化。因此,目前在证券领域,缺少一种能够有效对资源股进行跟踪预测的方法。
发明内容
基于以上技术问题,本发明提供了一种基于电证指数的股票预测方法、装置、设备和存储介质,其通过探索电力数据与股票数据间的相关联系,利用电力数据来对股市走势进行预测,为投资者提供数据支持,具体包括以下技术方案:
一种基于电证指数的股票预测方法,包括:
获取企业集合中各个企业的历史电力数据和历史股票数据;
获取历史电力数据和历史股票数据间的相关系数;
基于相关系数获取历史电证指数,历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;
基于历史电证指数对股票走势进行预测。
一种基于用电数据的股市预测装置,包括:
数据获取模块,数据获取模块用于获取企业集合中各个企业的历史电力数据和历史股票数据;
相关系数获取模块,相关系数获取模块用于获取历史电力数据和历史股票数据间的相关系数;
电证指数获取模块,电证指数获取模块用于基于相关系数获取历史电证指数,历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;
股票走势预测模块,股票走势预测模块用于基于历史电证指数对股票走势进行预测。
一种计算机设备,其特征在于,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现上述基于电证指数的股票预测方法的步骤。
一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述基于电证指数的股票预测方法的步骤。
与现有技术相比,本发明的有益效果是:
上述方法、装置、计算机设备和存储介质,利用企业的历史电力数据和历史股票数据,研究两者的联动效应和相关性,挖掘历史电力数据价值,生成可以反映企业、行业以及地区的生产运营情况的电证指数,并以此对股市进行进一步的预测,为投资者提供数据支持。此外,本申请中的电证指数还可以拓展电力数字经济,丰富电力公司效益增长点,为社会经济发展规划提供支撑,为企业发展规划和融资提供参考,为政府、第三方投资机构等决策提供数据支撑,促进社会金融产品持续创新和有序发展。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。其中:
图1为基于电证指数的股票预测方法流程示意图。
图2为获取企业历史电证指数流程示意图。
图3为获取行业历史电证指数或地区历史电证指数流程示意图。
图4为基于历史电证指数对股票走势进行预测流程示意图。
图5为ARMA模型构建流程示意图。
图6为泸州老窖的历史电力数据与历史股票数据时间序列图。
图7为和邦生物的历史电力数据与历史股票数据时间序列图。
图8为五粮液的历史电力数据与历史股票数据时间序列图。
图9为泸州老窖的历史电证指数与历史电力数据变化时间序列图。
图10为和邦生物的历史电证指数与历史电力数据变化时间序列图。
图11为五粮液的历史电证指数与历史电力数据变化时间序列图。
图12为化工行业历史电证指数时间序列图。
图13为机械设备行业历史电证指数时间序列图。
图14为食品饮料行业历史电证指数时间序列图。
图15为四川地区历史电证指数时间序列图。
图16为泸州老窖历史电证指数分解图。
图17为泸州老窖历史电证指数预测结果示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
参阅图1,在一些实施例中,基于电证指数的股票预测方法,包括:
S101,获取企业集合中各个企业的历史电力数据和历史股票数据;
具体的,历史电力数据为企业用电量。
具体的,历史股票数据为企业流通市值。
S102,获取历史电力数据和历史股票数据间的相关系数;
具体的,相关系数为Pearson相关系数。
S103,基于相关系数获取历史电证指数,历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;
S104,基于历史电证指数对股票走势进行预测。
优选的,为了能够直观观察数据的变化趋势,,历史电力数据、历史股票数据和历史电证指数均为基于时间序列的数据。
具体的,时间序列的周期为一个月。
在本实施例中,如今股票市场中常以上海证券交易所发布的综合股价指数(上证指数)作为指标对某个行业生产运行情况进行衡量,该指标也是目前作为股票投资的主要依据。而电力在一定程度上也可反映一个企业或者行业的生产运营情况,不同企业或行业的电力与经济走势存在着不同程度的相关性关系。随着能源转型的不断深入,去碳化、数字化、智能化已成为行业共识。可再生能源占比的提升,电网形态的变化,包括能源流、信息流、业务流的深度融合,以及电力市场化和经营管理面临的挑战,都要求电力企业不断提升自身竞争力,通过数字化手段实现企业转型升级。
数据成为驱动商业模式创新和发展的核心力量,将成为新的关键生产要素,随着电力信息化工作不断深入,目前电力已产生海量生产过程数据和结果数据,大数据相关数据挖掘技术已非常成熟,但电力相关的大数据产品还相对较少,需要持续提升历史电力数据应用场景。
因此,本申请基于对电力数据与股票数据的相关性的研究,通过电力数据对股票走势进行预测,特别是对于资源股而言,提供了一种有效的股票预测方法。
参阅图2,在一些实施例中,获取企业历史电证指数包括:
S201,基于相关系数构建调整函数;
其中,由于企业历史电证指数一方面需要反映该企业的用电量情况,因此首先需要计算出企业的用电量变化率的时间序列数据;另一方面,若企业的用电量与该企业的股票市值有较强的相关性,则企业历史电证指数还需反映一定程度的股票市值趋势。结合企业历史电证指数的需求与目标,本申请参考现有的统计指标设计出企业历史电证指数算法,如计量经济学中用到的调整可决系数(判断回归模型的拟合程度),考虑将自由度引入指标中作为惩罚项;AIC和BIC准则(用于选择最优模型),同样将自由度和样本容量都引入指标都作为惩罚参数。
基于类似的思想,本申请利用企业用电量与流通市值的相关系数构建调整函数,该调整函数需满足如下几个特点:
①当企业的用电量与流通市值呈正相关关系时,说明该企业用电量增加时,企业的股票市值较高。因此,用电量增加时,历史电证指数应较高,调整函数对用电量变化有正的影响。
②当企业的用电量与流通市值呈负相关关系时,说明该企业的用电量指标增加时,股票市值减小。因此,用电量增加时,历史电证指数应较小,此时调整函数对用电量的变化有负的惩罚作用。
③当企业的用电量与流通市值无显著影响时,说明该企业的用电量变化不能反映股票市值情况。因此,该企业的历史电证指数仅能反映用电量的变化,此时调整函数对用电量的变化无影响。
基于以上特点,具体的,调整函数具体为:
Figure BDA0003232037390000041
其中,L表示调整函数,ρ是企业的历史电力数据与历史股票数据间的Pearson相关系数。
由上式可看出,由于相关系数值ρ∈[-1,1],当ρ>0时,L>1,即原本用电量变化在该函数乘积的影响下会变大,符合上文中的第一个特点:当ρ<0时,L<1,则用电量变化在该调整函数的乘积下会变小,符合上文中的第二个特点;当ρ=0时,L=1,则用电量变化率在该函数的乘积下数值不会发生改变。
S202,基于历史电力数据变化率获取电力指数;
其中,历史电力数据变化率是各个时期的用电量相较于基期而言的变化率;
具体的,电力指数为基期的数值加上变化率,基期只是作为历史电证指数的起始点,需要关注的是电力指数相较基期的变化程度。因此,对于基期的选择没有要求,本申请选取样本数据的起始点为基期。举例来说,令基期的电力指数为100,如果当前时期相较于基期用电量增加了0.1,则当前时期的电力指数为100.1。
具体的,设基期的用电量为X1,报告期的用电量为Xt,则报告期的用电量变化率Ri的计算公式为:
Figure BDA0003232037390000051
S203,基于调整函数和电力指数获取企业历史电证指数。
具体的,将调整函数与电力指数相乘便可获取企业历史电证指数。
参阅图3,在一些实施例中,获取行业历史电证指数或地区历史电证指数包括:
S301,将企业集合中各个企业按行业或地区进行分类获得分类企业集合;
S302,基于分类企业集合中各个企业其历史电力数据和历史股票数据间的相关系数确定各个企业对应的权重;
其中,由于一个行业或地区包含多个企业,各企业的生产运行方式都有所差异,因此某个行业的历史电证指数需要考虑各个企业的电力对行业的贡献度。若企业的电力变化变化伴随着较大的股票市值变化,说明该企业的电力变化会对行业或地区的历史电证指数产生较大的贡献度,反之,若企业的电力变化对该企业的股票市值变化影响度较小,则说明该企业的电力变化会对行业或地区的历史电证指数产生较小的贡献度。
基于以上思路,项目利用企业的用电量和流通市值的相关系数作为反映电力市场与股票市值的相关性强弱的指标,并以此指标设置行业中各企业的权重,用以反映各自的贡献度。权重系数一般满足以下几个基本特征:
①对综合指标贡献更大的因素,其权重wi绝对值越大;
② 0≤|wi|≤1;
Figure BDA0003232037390000052
因此,项目确定了某行业中各企业的权重的绝对值大小为
Figure BDA0003232037390000053
其中,ρi为行业中第i个企业的用电量与流通市值的Pearson相关系数。由于不同企业的相关系数正负号对该行业的历史电证指数有相反的作用,因此权重的符号应与相关系数的符号保持一致。最终,项目确定了计算行业历史电证指数时各企业的权重为
Figure BDA0003232037390000061
S303,基于分类企业集合中各个企业的历史电力数据变化率获取各个企业对应的电力指数;
其中,确定了每个企业的电力变化的权重之后,再计算出各企业的电力变化率ri,其计算公式通获取企业历史电证指数处的用电量变化率的公式相同,具体为:
Figure BDA0003232037390000062
其中,Consumptioni1为第i个企业基期的用电量,Consumptionit是第i个企业报告期的用电量,即rit可表示为第i个企业随时间变化的用电量变化的指数序列。
S304,将权重和电力指数代入加权平均算法得到行业历史电证指数或地区历史电证指数。
具体的,行业历史电证指数或地区历史电证指数具体为:
Figure BDA0003232037390000063
由上式可知,当某个企业的电力市场与股票市值呈正相关时,该企业的用电量增加,将会带动行业的股票市值,历史电证指数增加,且相关系数越大,行业的历史电证指数增加越多;反之,若某企业的电力市场与股票市值呈负相关时,该企业的用电量增加时,将拉低行业的股票市值,历史电证指数减小,且相关系数绝对值越大时,行业的历史电证指数减小量越多。
优选的,由于不同的企业上市时间不一致,因此行业的历史电证指数需要每隔半年或一年的时间进行修正:(1)将新上市的企业在上市之日纳入指数计算,并更新各企业的相关系数和权重;(2)将退出该行业的企业剔除指数计算范围。
具体的,由于不同公司的上市时间有区别,在不同时间段内都有新的企业加入或原有的企业退出,因此还需要对历史电证指数进行定期修正。本项目参考了股票市场中各个指数的修正方法,对行业的历史电证指数做了如下修正:
当有新企业上市时,以该企业加入行业的时间为更新时刻,对行业里各个企业的用电量和流通市值的相关系数和企业的权重做了更新,重新计算更新时刻之后的历史电证指数数值,直到下一个更新时刻。
当有原有企业退出时,以该企业退出后的第二天作为更新时间,重新更新行业中剩余企业的用电量与流通市值的相关系数和企业的权重,并重新计算更新时刻后的历史电证指数数值,直到下一个更新时刻。
因此,在该行业(地区)历史电证指数运营阶段,应定期(比如一年或者半年)对该指数进行修正与更新,及时将变化的企业对该行业的历史电证指数造成的影响进行修正。
在一些实施例中,基于所述历史电证指数对股票走势进行预测包括:
基于所述历史电证指数获取将来时段的将来电证指数;
基于所述将来电证指数对股票走势进行预测。
在本实施例中,结合上文可知,由于电证指数是由电力数据与股票数据获得的,那么电证指数本身便与股票数据间具有相关性,因此,在获取将来电证指数之后,便可以利用电证指数与股票数据将的相关性,通过将来电证指数预测将来时段内的股票走势。
相应的,从企业历史电证指数、行业历史电证指数和地区历史电证指数中便可获得企业股票走势、行业股票走势和地区股票走势的相关预测结果。
参阅图4,在一些实施例中,基于所述历史电证指数获取将来时段的将来电证指数包括:
S401,构建时间预测模型,时间预测模型为ARMA模型;
其中,传统的时间序列模型中占有重要地位的是平稳时间序列分析,Box和Jenkiens于20世纪70年代提出一整套关于时间序列的ARMA模型建模技术。具有如下结构的模型称为自回归求和移动平均(Auto Regressive lntegratedMoving Average)模型,简记为ARMA(p,q):
Figure BDA0003232037390000071
始终,Φ(B)=1-φ1B-…-φpBp为p阶自回归系数多项式;Θ(B)=1-θ1B-…-θaBq为q阶移动平均系数多项式。
当然,当q=0时,ARMA(p,q)模型就退化成了AR(p)模型;当p=0时,ARMA(p,q)模型就退化成了MA(q)模型。所以,AR(p)模型和MA(q)模型实际上是ARMA(p,q)模型的特例,它们统称为ARMA模型。而ARMA(p,q)模型的统计性质也正是AR(p)模型和MA(q)模型统计性质的有机组合。
若一个时间序列{Xt}的d次差分
Figure BDA0003232037390000072
是一个平稳的ARMA模型,则称{Xt}为自回归滑动平均求和模型。如果Wt服从ARMA(p,q)模型,则称{Xt}为ARIMA(p,d,q)过程。
实际生活中,有许多社会经济现象会受到季节的影响,在一年内有规律地出现季节更替现象,周期常为一年4个季度或12个月。一般定义季节周期为s的乘法季节SARMA(p,d)×(P,Q)模型是AR特征多项式为φ(x)Φ(x),MA特征多项式为θ(x)Θ(x)的模型,其中:
Figure BDA0003232037390000073
Figure BDA0003232037390000074
该模型是一个特殊的ARMA模型,它的AR项阶数为p+Ps,MA项阶数为q+Qs,但其系数不具有完全的一般性,而仅由p+q+P+Q个系数决定。
同样,若一个时间序列{Xt}的d次非季节差分和D次季节差分之后的序列
Figure BDA0003232037390000081
是一个平稳的SARMA(p,d)×(P,Q)模型,则过程{Xt}称为季节周期s,非季节阶数为p,d和q,季节阶数为P,D和Q的乘法季节SARlMA模型。
具体的,ARMA建模的基本步骤参阅图5。
S402,将历史电证指数输入时间预测模型获取预测结果。
在一些实施例中,本申请还公开了一种基于用电数据的股市预测装置,包括:
数据获取模块,数据获取模块用于获取企业集合中各个企业的历史电力数据和历史股票数据;
相关系数获取模块,相关系数获取模块用于获取历史电力数据和历史股票数据间的相关系数;
电证指数获取模块,电证指数获取模块用于基于相关系数获取历史电证指数,历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;
股票走势预测模块,股票走势预测模块用于基于历史电证指数对股票走势进行预测。
在一些实施例中,本申请还公开了一种计算机设备,其特征在于,包括存储器和处理器,存储器中存储有计算机程序,处理器执行计算机程序时实现上述基于电证指数的股票预测方法的步骤。
其中,所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器可以是所述计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,所述存储器也可以是所述计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设备。本实施例中,所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软件,例如基于电证指数的股票预测方法的程序代码等。此外,所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述计算机设备的总体操作。本实施例中,所述处理器用于运行所述存储器中存储的程序代码或者处理数据,例如运行所述基于电证指数的股票预测方法的程序代码。
在一些实施例中,本申请还公开了一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述基于电证指数的股票预测方法的步骤。
其中,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于电证指数的股票预测方法的程序代码的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器或者网络设备等)执行本申请各个实施例所述的方法。
综合上述实施例,本申请对典型企业的用电量数据和流通市值进行相关性分析,可得到两者的相关系数估计值,判断出电力数据与股票数据之间的相关性强弱。
利用企业的用电量和流通市值,以Pearson相关系数作为企业的电力与股市联动性的指标,并以它的函数构建惩罚参数,对电力变化率进行调整。依照此思路,设计企业的历史电证指数算法,并根据样本数据得到基期以来代表企业的历史电证指数序列,并对序列进行建模与预测。
同股票市场中的上证指数类似,上市企业隶属于多个不同的行业,即股票市场可分为多个行业,每个行业都有不同数量的公司。由于不同企业的生产方式和运营模式不同,用电量情况与股市市值相关程度会有所差异。考虑到这个因素,本申请先算出一个行业内每个企业的用电量和流通市值的相关系数,依据这个指标设置出行业里各公司的权重,并以各公司用电量相对于基期的变化率做为历史电证指数的核心。按照上述思想,可计算出某行业里各个公司历史电证指数对该行业历史电证指数的贡献度,从而计算出行业的历史电证指数。
与行业的历史电证指数算法相同,计算地区的历史电证指数时则需计算出本地区所有上市企业的用电量与流通市值的相关系数,一个企业的权重设置为该企业对应的用电量与流通市值相关系数除以求出的所有企业对应的用电量与流通市值的相关系数绝对值之总和。随后计算出各个企业的用电量随着时间推移时相较于基期的变化率,故地区的历史电证指数则为各企业较基期相比的电量变化率的加权平均。
按照上述的算法构建出企业、行业以及地区的历史电证指数后,随后做出历史电证指数序列图,按照时间序列建模的方法对该指数进行分析与预测,预测出未来一段时间的股票走向与趋势。
下面将结合具体行业或地区的具体企业对本申请中的基于电证指数的股票预测方法进行说明:
首先,以泸州老窖作为代表企业对企业的用电量与流通市值的相关性进行分析。本申请中获取了泸州老窖自2012年至2021年来的月度数据,主要用到的数据指标为公司的用电量(即历史电力数据)和流通市值(即历史股票数据)。
为了在同一个时序图中观察两个变量的变化趋势,而消除量纲影响和变量自身变异大小的影响,需对数据进行标准化处理。
本申请中采用的标准化方法是“Z-score标准化”,该方法可将数据按比例缩放,使之落入一个特定区间,转化为均值为0,方差为1的新数据。泸州老窖的历史电力数据、历史股票数据经过标准化后的变量具有相同的量纲,因此,可以将同时将两个数据放在同一组坐标轴中,观察两个指标的变化趋势,时序图如图6所示。
由上面的时序图6可以看出,泸州老窖的月度用电量数据在2019年之前呈平稳状态,在2019年后出现大幅度的增长。而流通市值的时序图可以看出,在2019年前该企业的流通市值波动较小,同样在2019年后增长趋势变大。故可初步判断,泸州老窖的电力与股票市场有较强的相关性。
参阅图6,历史电力数据和历史股票数据的变化趋势整体上大致相似,用电量增长时流通市值也有所增长,可判断出泸州老窖的用电量与流通市值可能呈正相关。为了定量判断相关性,本申请利用Pearson相关系数、非参数方法中的Spearman相关系数和Kendall-τ相关系数对两个变量进行了相关性检验,用到的指标包括。结果如下表表1所示。
Figure BDA0003232037390000101
表1泸州老窖历史电力数据和历史股票数据的相关系数结果
由上表可知,三个相关系数指标检验结果的P值都远远小于显著性水0.05,说明相关性检验显著,应拒绝原假设(原假设为用电量和流通市值的相关系数为0),认为泸州老窖的用电量和流通市值有相关关系。由表1中相关系数估计值可知,三种相关系数都为正,本申请选择Pearson相关系数作为两个变量之间相关性强弱的指标,即泸州老窖的用电量与流通市值的相关系数为0.721,具有很强的正相关效应。
具体的,对于Pearson相关系数、非参数方法中的Spearman相关系数和Kendall-τ相关系数的获取可以通过R软件内置的相关函数获取。
然后,利用企业历史电力数据与历史股票数据之间的相关系数获取企业历史电证指数、行业历史电证指数或者地区历史电证指数。
对于企业历史电证指数,本申请选择三个企业作为代表企业,分别代表相关关系较强、相关关系较弱以及用电量与流通市值无显著相关性的企业,筛选出的三个企业分别为泸州老窖、和邦生物和五粮液。三个企业对应的用电量和流通市值经过标准化后的曲线图如图6、图7和图8所示。
由图6、图7和图8可看出,不同企业的电力与股票市值相关性都不同,初步可看出泸州老窖的用电量和流通市值的变化趋势大致一致,和邦生物的流通市值与用电量也有较为相似的波动趋势,而通过五粮液企业的曲线图可看出该企业的用电量波动较大,而流通市值几乎无波动,只呈现出了随时间增长的趋势。
求出三个企业的Pearson相关系数和对应的P值分别如下表表2所示。
Figure BDA0003232037390000111
表2泸州老窖、和邦生物、五粮液的历史电力数据和历史股票数据的相关性分析结果
本申请选择拒绝原假设的显著性水平都是0.05,因此,P值小于0.05才可拒绝原假设(原假设为用电量和流通市值的相关系数为0),认为该企业的用电量与流通市值有显著相关性。上表可看出,泸州老窖、和邦生物的P值都小于0.05,因此这两个企业的用电量和流通市值有显著的相关性,且都为正相关,相关系数分别为0.721和0.287。而五粮液的相关性检验的P值大于0.05,说明该企业的检验中不能拒绝原假设,即五粮液的用电量与流通市值无显著的相关性。
由于统计学中常用到的显著性水平有0.01,0.05和0.1,若按照0.1的显著水平来看,可认为五粮液的用电量和流通市值也呈现相关性,只是相关系数较小。因此,三个企业按照前文介绍的调整函数计算公式可依此求出三个企业的调整函数为:
Figure BDA0003232037390000121
Figure BDA0003232037390000122
Figure BDA0003232037390000123
由计算结果可知,泸州老窖的电力和股市市值正相关性最强,因此算出来的调整函数最大;五粮液的两个变量之间呈现负相关,但相关系数较小,因此调整函数的数值小于1,对原本用电量变化率有惩罚作用;和邦生物的两个变量有显著的正相关关系,但相关系数低于泸州老窖的相关系数,因此调整函数的数值大于1,但小于泸州老窖对应的数值。
由于选取的样本数据时间为2012年1月至2021年1月,且基期只是作为历史电证指数的起始点,需要关注的是指数相较基期的变化程度。因此,本申请选取样本数据的起始点为基期,计算之后的每个月相较基期而言的指数变化。值得一提的是,和邦生物公司获取的样本数据起始点为2012年7月,因此该企业的指数基期定为2012年7月。计算出基期之后2020年部分每个月的用电量变化率如下表表3所示。
Figure BDA0003232037390000124
表3泸州老窖、和邦生物、五粮液2020年用电量变化数据
对电力指数乘以调整参数L,得到最终的历史电证指数,三个企业的历史电证指数部分数据如下表表4所示。
Figure BDA0003232037390000131
表4泸州老窖、和邦生物、五粮液2020年历史电证指数月度数据
由表3和表4对比可知,对于泸州老窖和和邦生物企业,当用电力指数大于100时,历史电证指数比用电力指数更大,当用电力指数小于100时,历史电证指数比用电力指数更小。而五粮液企业的相关系数为负,当用电力指数低于100时,股票市值反而较好,因此历史电证指数会高于用电力指数;相反,当用电力指数高于100时,股票市值情况较差,由于L的惩罚作用,该企业的历史电证指数会低于用电力指数。
为了更直观地展示调整参数对用电量变化的影响,报告展示了三个企业各自的用电力指数和历史电证指数的时序图,它们分别如下图9、图10、图11所示。
由上面的三幅图可看出,当企业的用电量与流通市值呈正相关时,用电量增加时(用电力指数大于100),历史电证指数在用电量变化指数之上,反之,用电量减小时(用电力指数小于100),历史电证指数会在电量变化指数序列的下方。当企业的用电量与流通市值呈负相关时,则出现相反的结果。
由企业的电证指数的算法可知,企业的历史电证指数计算公式为:
Figure BDA0003232037390000132
式中,ρ代表该企业的用电量与流通市值的Pearson相关系数,用以反映股票市场与电力市场的相关性强弱;Xt表示任意t时期的企业用电量,X1代表基期的企业用电量。
首先,从理论上可看出,企业的电证指数是对该企业的用电量进行了线性变换。由统计学中相关关系的性质:
Cov(X,Y)=Cov(L(X),L(Y))
式中,L(X),L(Y)分别为变量X和Y的线性变换。
因此,企业的电证指数与证券指数的相关系数应该等于该企业的用电量与流通市值的相关系数。若企业本身的电力数据与股票行情数据没有相关性,则电证指数不能反映股票市场情况,因此,本次报告中选取了两个用电量与流通市值有相关性的代表企业进行企业的电证指数的适应性检验。
其一,泸州老窖的电证指数检验,求出的泸州老窖企业的电证指数和该企业的股票的流通市值进行相关性检验。
为了定量分析这两个序列之间的相关性,本项目接着进行了相关性检验,得到两者的相关系数和相关性检验的P值,由相关性检验的结果可看出,泸州老窖的企业电证指数与流通市值的相关系数为0.7206044,而P值几乎为0,显著小于显著性水平0.05,则应该拒绝原假设(原假设为两个序列的相关系数为0)。因此,泸州老窖的企业电证指数与股票行情呈显著的正相关,且相关系数为0.7206。
其二,和邦生物的电证指数检验,对和邦生物的企业电证指数的分析与泸州老窖企业的方法相同。
和邦生物的企业电证指数与流通市值的相关系数为0.2653833,相关性检验的P值为0.006744,显著小于显著性水平0.05,应该拒绝原假设,可判断出和邦生物的企业电证指数与股票行情由显著的正相关,不过该企业的电力与股票的相关性强度弱于泸州老窖企业。
对于行业历史电证指数,本申请选取了申万行业中具有代表性的三个行业,分别为化工、机械设备和食品饮料。其中,每个行业有不同的企业,化工行业包含新金路、四川美丰、泸天化等13个企业;机械设备行业包括川润股份、新筑股份、利君股份等12个企业;食品饮料行业则包括泸州老窖、五粮液、ST舍得等7个企业。
由于化工行业中的新金路在2017年10月之后的用电量数据缺失,而和邦生物、国光股份和达威股份也是2012年之后陆续上市的新企业。因此,化工行业中各企业的相关系数和权重会分别在2012年7月、2015年3月、2016年8月以及2017年10月发生更新。报告中展示了最后一次更新后的相关信息(由于新金路的数据缺失较多,最后一次更新时将该企业视为已退出行业)。化工行业中最后一次更新后十二个企业对应的相关信息如下表表5所示:
Figure BDA0003232037390000151
Figure BDA0003232037390000152
表5化工行业各个企业基本信息
机械设备行业中由于中密控股、厚普股深冷股份等七个企业在2012年之后才陆续上市,因此企业的权重进行了6次更新,最后一次的企业的相关系数与权重更新结果如下表表6所示:
Figure BDA0003232037390000153
Figure BDA0003232037390000154
表6机械设备行业各个企业基本信息
食品饮料行业中由于千禾味业、新乳液和天味食品是在2016年3月、2019年1月和同年4月才陆续上市,因此计算行业的历史电证指数时对各企业的权重进行了三次更新。报告展示的最后一次更新结果如下表表7所示:
Figure BDA0003232037390000155
Figure BDA0003232037390000156
表7食品饮料行业各个企业基本信息
算出各个企业报告期相较于基期的用电量变化率,在权重的调整下最后求出三个代表行业的历史电证指数。为了直观地观察行业的历史电证指数,项目利用R软件做出了三个代表行业的历史电证指数时序图,图12、图13、图14。
上面的曲线图可看出,代表行业的历史电证指数都呈现了长期的趋势性和短期的周期波动性。其中,化工行业和食品饮料随时间增长的趋势较明显,指数随时间变化的波动范围较大;机械设备行业的历史电证指数增长较平缓,指数变动较小,推测主要原因是目前中国正在提倡发展第三产业,消费与服务业正逐步兴盛,而机械制造业近几年增长放缓。
对于地区历史电证指数,四川地区的历史电证指数与行业历史电证指数算法相同,区别在于该历史电证指数包含了四川地区所有的上市企业,一共有112家企业。经过筛选,创意信息和中科信息企业的缺失值异常多,且用获得的电量数据与实际相悖,项目采用剔除异常公司的做法,将剩余的110企业纳入四川地区的历史电证指数计算。
利用R软件将历史电证指数数据可视化,按照时间的顺序绘制曲线图的结果如图15所示。
由图15可看出,四川地区的历史电证指数变动范围远远小于各个行业的历史电证指数变化范围,其波动区间范围大致为1个指数点,这说明了四川地区的上市企业近几年来用电量波动较为稳定,生产运营模式可能没有发生较大的变革。
对于将来电证指数的预测,以泸州老窖为例,计算出的2012年1月至2021年1月共109个月的历史电证指数序列做了季节分解,趋势分解与随机波动,最终成果以曲线图16展示。
参阅图16可看出,图16的四个折线图中,从上往下依次为原序列图,季节效应、趋势效应和随机波动的曲线图。季节分解曲线图可看出泸州老窖的历史电证指数存在规律的季节周期性,在每年的第一季度和第三季度都呈现了不同程度的峰值;由趋势分解的结果可看出,从2019年开始,该企业的历史电证指数大幅增加。因此,可初步判断出该时间序列数据满足SARIMA模型
选择最优模型的标准是赤池信息准则AIC(Akaike information criterion),若众多模型中AIC值最小,则该模型为最优模型。由R的运行结果可知,该序列经过一阶的非季节差分可转化为平稳的乘积季节时间序列模型,季节周期为12的SARIMA(2,1,2)×(0,0,1)模型,由参数的估计值可知模型的数学表达式为
(1-0.0432B+0.3674B2)(Xt-Xt-1)=(1+0.1773B+0.4837B2)(1-0.6998B12t
随后利用R估计出的该模型进行预测,并作出预测值的曲线和置信区间,结果如图17所示。
参阅图17中,2021年之后为未来一年的预测值,而预测值曲线周围的小区间代表95%的置信区间,说明有95%的可能性会落在该小段区域内;而大区间则代表80%的置信区间,说明有80%的可能性会落在该大段区域内。未来值的估计结果如下表表8所示。
Figure BDA0003232037390000171
表8泸州老窖2021年历史电证指数预测值
同样的,对于行业或地区企业的将来电证指数预测与企业将来电证指数预测相同,此处便不再赘述。
综上所述,本申请主要是对电力市场和股票市场的联动分析,依据股票市场中上证指数的计算方法分别构建了企业、行业和四川地区的历史电证指数的算法,其中行业和四川地区的历史电证指数算法相同。其中,泸州老窖的历史电证指数与化工行业、食品饮料行业的历史电证指数波动范围较大,而五粮液、和邦生物、机械行业和四川地区的历史电证指数波动范围较小,这是由于不同企业、行业的生产方式和经营模式的差异。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明的验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (10)

1.基于电证指数的股票预测方法,其特征在于,包括:
获取企业集合中各个企业的历史电力数据和历史股票数据;
获取所述历史电力数据和所述历史股票数据间的相关系数;
基于所述相关系数获取历史电证指数,所述历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;
基于所述历史电证指数对股票走势进行预测。
2.根据权利要求1所述的基于电证指数的股票预测方法,其特征在于:
所述相关系数为Pearson相关系数。
3.根据权利要求2所述的基于电证指数的股票预测方法,其特征在于,获取所述企业历史电证指数包括:
基于所述相关系数构建调整函数;
基于所述历史电力数据变化率获取电力指数;
基于所述调整函数和所述电力指数获取所述企业历史电证指数。
4.根据权利要求3所述的基于电证指数的股票预测方法,其特征在于,所述调整函数具体为:
Figure FDA0003232037380000011
其中,L表示调整函数,ρ是企业的历史电力数据与历史股票数据间的Pearson相关系数。
5.根据权利要求2所述的基于电证指数的股票预测方法,其特征在于,获取所述行业历史电证指数或所述地区历史电证指数包括:
将所述企业集合中各个企业按行业或地区进行分类获得分类企业集合;
基于所述分类企业集合中各个企业其历史电力数据和历史股票数据间的相关系数确定各个企业对应的权重;
基于所述分类企业集合中各个企业的历史电力数据变化率获取各个企业对应的电力指数;
将所述权重和所述电力指数代入加权平均算法得到所述行业历史电证指数或所述地区历史电证指数。
6.根据权利要求1所述的基于电证指数的股票预测方法,其特征在于,基于所述历史电证指数对股票走势进行预测包括:
基于所述历史电证指数获取将来时段的将来电证指数;
基于所述将来电证指数对股票走势进行预测。
7.根据权利要求6所述的基于电证指数的股票预测方法,其特征在于,基于所述历史电证指数获取将来时段的将来电证指数包括:
构建时间预测模型,所述时间预测模型为ARMA模型;
将所述历史电证指数输入所述时间预测模型获取预测结果。
8.一种基于用电数据的股市预测装置,其特征在于,包括:
数据获取模块,所述数据获取模块用于获取企业集合中各个企业的历史电力数据和历史股票数据;
相关系数获取模块,所述相关系数获取模块用于获取所述历史电力数据和所述历史股票数据间的相关系数;
电证指数获取模块,所述电证指数获取模块用于基于所述相关系数获取历史电证指数,所述历史电证指数包括企业历史电证指数、行业历史电证指数和地区历史电证指数;
股票走势预测模块,所述股票走势预测模块用于基于所述历史电证指数对股票走势进行预测。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于电证指数的股票预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于电证指数的股票预测方法的步骤。
CN202110990178.5A 2021-08-26 2021-08-26 基于电证指数的股票预测方法、装置、设备和存储介质 Pending CN113723678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110990178.5A CN113723678A (zh) 2021-08-26 2021-08-26 基于电证指数的股票预测方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110990178.5A CN113723678A (zh) 2021-08-26 2021-08-26 基于电证指数的股票预测方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN113723678A true CN113723678A (zh) 2021-11-30

Family

ID=78678271

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110990178.5A Pending CN113723678A (zh) 2021-08-26 2021-08-26 基于电证指数的股票预测方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113723678A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118069910A (zh) * 2024-04-25 2024-05-24 国网四川省电力公司营销服务中心 一种用电数据与股市指数联动展示方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118069910A (zh) * 2024-04-25 2024-05-24 国网四川省电力公司营销服务中心 一种用电数据与股市指数联动展示方法及装置

Similar Documents

Publication Publication Date Title
Huang et al. A hybrid model for carbon price forecasting using GARCH and long short-term memory network
Chalmardi et al. A bi-level programming model for sustainable supply chain network design that considers incentives for using cleaner technologies
Diabat et al. An integrated supply chain problem with environmental considerations
DeSarbo et al. A heterogeneous resource based view for exploring relationships between firm performance and capabilities
Stanton et al. Inside the integrated assessment models: Four issues in climate economics
Yang et al. Optimization on emission permit trading and green technology implementation under cap-and-trade scheme
Clark Can out‐of‐sample forecast comparisons help prevent overfitting?
Han et al. Collection channel and production decisions in a closed-loop supply chain with remanufacturing cost disruption
CN104598986B (zh) 基于大数据的电力负荷预测方法
Zheng et al. Forecasting the hydroelectricity consumption of China by using a novel unbiased nonlinear grey Bernoulli model
Sawik A stochastic optimisation approach to maintain supply chain viability under the ripple effect
CN105678414A (zh) 对资源消耗量进行预测的数据处理方法
CN112365056A (zh) 一种电气负荷联合预测方法、装置、终端及存储介质
Li et al. What can be learned from the historical trend of crude oil prices? An ensemble approach for crude oil price forecasting
Sari et al. Statistical reliability of wind power scenarios and stochastic unit commitment cost
CN113723678A (zh) 基于电证指数的股票预测方法、装置、设备和存储介质
Zhu et al. A novel discrete conformable fractional grey system model for forecasting carbon dioxide emissions
Scott et al. Calculating impacts of energy standards on energy demand in US buildings with uncertainty in an integrated assessment model
Yalta Bootstrap inference of level relationships in the presence of serially correlated errors: a large scale simulation study and an application in energy demand
Oelrich et al. Local prediction pools
CN115689026A (zh) 一种住宅负荷短期预测方法和系统
Dhavale et al. Integrating carbon market uncertainties into a sustainable manufacturing investment decision: A Bayesian NPV approach
Zhou et al. DETERMINANTS OF CORPORATE CARBON EFFICIENCY: EVIDENCE FROM CDP 2011-2014 QUESTIONNAIRE FOR STANDARD & POOR'S 500 INDEX COMPANIES.
CN113743994A (zh) 一种供应商的旺季预测方法、系统、设备及存储介质
Jayasree et al. Analysis of the performance of competing models for aggregate demand forecasting using observable data characteristics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination