CN110264352A - 基于神经网络模型和时间序列的股指预测方法及装置 - Google Patents
基于神经网络模型和时间序列的股指预测方法及装置 Download PDFInfo
- Publication number
- CN110264352A CN110264352A CN201910406667.4A CN201910406667A CN110264352A CN 110264352 A CN110264352 A CN 110264352A CN 201910406667 A CN201910406667 A CN 201910406667A CN 110264352 A CN110264352 A CN 110264352A
- Authority
- CN
- China
- Prior art keywords
- data
- time series
- neural network
- stock index
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及提供的基于神经网络模型和时间序列的股指预测方法及装置,通过对待预测股指的时间序列数据进行提取,得到特征数据;对所述特征数据进行预处理,得到第一数据;对所述第一数据进行时间序列处理,得到第二数据;通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测,提高了股指预测的准确率和预测长度。
Description
技术领域
本发明涉及大数据金融技术领域,特别涉及基于神经网络模型和时间序列的股指预测方法及装置。
背景技术
(1)在金融市场的主流预测研究
时间、价格、成交量被视为金融市场中三个最基本的要素,许多的基础研究都围绕这三个要素展开的,早在1976年,就已经从不同角度刻画成交量与价格的变化,后续相关技术再次进行扩充,充分论证了金融市场中时间、价格、成交量关联关系。后来演变为知情交易概率(Probablity of information-based trading,PIN)的矛盾,即PIN影响股票收益的结论在全球范围内显著还是不显著的,然而西方金融学界仍然比较认可PIN理论,随着大数据的技术应用,越来越多的研究更倾向于PIN与股票收益无关。以时间角度上研究价格、成交量并进行预测,ARCH、GARCH、ARMA、ARIMA等模型在金融市场的预测中占据很大的作用,研究中这些模型也出现一些变型,如:Copula-GARCH、ARIMA-TARCH-M、OGARCH等,不过总体结果都进一步证实了金融市场中历史成交量与未来价格成正比,即高成交量的股票在未来跟随着高收益。在近几年的研究中,尤其是大数据、时间序列等技术的快速发展,研究一方面趋向网页新闻、论坛数据、网络搜索、事件分析(突发事件、重大事件等)、信息不对称等数据挖掘,另一方面则偏向关注度、搜索量、投资者情绪和行为等行为金融学,由此判断股票市场指数和波动率的升降。其中,运用网络大数据分析,也有研究成果表明消息数量与当期的异常收益率和交易量有关,小盘股的关系则更为显著,而运用大数据分析和预测上市公司盈利也是研究的趋势。
(2)时间序列和神经网络在金融市场的理论研究
一方面,不管是基于交易时间,还是基于日历时间,金融市场的时间序列分析都是基于时间的进程,由于金融市场交易制度和各国经济周期的时间长度不同,因此在研究金融市场、国家经济等的时间刻度就不能完全依赖于日、周、月、季、年等,各个时间阶段所反应的经济变量就可能是以经济时间线性发展,也有可能是非线性的推进,即FinancialTime Series(FTS)。在金融时间序列主流预测是根据不同的经验模式,分析了不同国家的股市和金融市场,主要代表是EMD方法,后来分解后形成多级IMF序列和VMD。为了更好地理解和预测市场,行为金融学研究人员更喜欢把时序与“量价关系”和大规模社交媒体数据一起做研究。另一方面,从最初的BP神经网络开始,就已经有很多学者在金融领域扩展神经网络理论的研究,从神经网络技术层面展开各种应用研究,如ANN,SVM,以及决策树与随机森林等。大部分运用神经网络从实证上结合相关模型,确实能有效提升金融市场预测及风险防范能力,随着这方面的相关研究的展开,一些跨学科的研究者从神经网络的角度开始更加深入的研究金融市场预测。对于时间序列这种序列数据来说,采用最广泛的模型为循环神经网络(RNN)模型,还有深层次的神经网络LSTM,改进的长短时记忆网络S-LSTM,以循环神经网络为代表的深度学习,不断扩展金融领域的研究。近年来,金融时间序列和神经网络结合的研究,有结合经验模式分解(EMD),也有运用LSTM神经网络综合预测,许多都能对实际股票指数的进行预测,然而通过时间序列和深度学习相结合对金融市场的预测研究还是比较少。
(3)时间序列和神经网络在股票市场的技术成果
刘震;王惠敏;薛腾腾(浙江工业大学)专利号为CN108154435A的中国专利公开了一种基于循环神经网络的股指价格预测方法,该方法可以很巧妙的提取出股指价格的各类影响因子的深层特征,与简单的单因子循环网络或者传统的多因子循环网络相比,该方法主要是基于注意力机制来提高股指价格预测的准确性,而对成交量没有深入研究。张元鸣;沈志鹏;蒋建波(浙江工业大学)专利号为CN107832897A的中国专利公开了一种基于深度学习的股票市场预测方法,运用卷积网络和循环神经网络各自的优势,提出基于深度学习的股票市场价格预测方法,包括:数据预处理、构建LSTM#DCC股票市场预测模型,能够自动学习股票自身序列以及相关影响因素的数据特征,对未来的价格及其走势进行预测。比较相关的技术还有股票收益率(河南理工大学的余伟阳;张利伟;李辉等人,专利号为CN108229750A)和波动率预测(四川倍发科技有限公司的赵天;晏奇;俸旻等人,专利号为CN106934502A),主要利用技术指标对收益率进行预测,为投资者的交易行为和做好事前风险管理提供较有价值的参考。
总体而言,股票市场相关预测技术比较成熟,也有一定的准确率,但对数据的预处理过多或对数据预测基础上再预测是比较普遍的,因此预测准确率和预测长度仍然是急需进一步解决的问题。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供基于神经网络模型和时间序列的股指预测方法及装置,能够提高股指预测的准确率和预测长度。
(二)技术方案
为了达到上述目的,本发明采用的一种技术方案为:
基于神经网络模型和时间序列的股指预测方法,包括步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
S3、对所述第一数据进行时间序列处理,得到第二数据;
S4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测。
为了达到上述目的,本发明采用的另一种技术方案为:
基于神经网络模型和时间序列的股指预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
S3、对所述第一数据进行时间序列处理,得到第二数据;
S4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测。
(三)有益效果
本发明的有益效果在于:通过对待预测股指的时间序列数据进行提取,得到特征数据;对所述特征数据进行预处理,得到第一数据;对所述第一数据进行时间序列处理,得到第二数据;通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测,提高了股指了测的准确率和预测长度。
附图说明
图1为本发明实施例的基于神经网络模型和时间序列的股指预测方法流程图;
图2为本发明实施例的基于神经网络模型和时间序列的股指预测装置的结构示意图;
图3为本发明实施例的指数预处理前的数据和指数预处理后的数据对比图;
图4为本发明实施例的成交量预处理前的数据和成交量预处理后的数据对比图;
图5为本发明实施例的滑动窗口动态提取金融时间序列(TSA1);
图6为本发明实施例的滑动窗口的示意图;
图7为本发明实施例的神经网络模型示意图;
图8为本发明实施例的TSA3的训练结果示意图;
图9为本发明实施例的TSA3循环神经网络上证指数和个股(中国豫光金铅)预测示意图;
图10为本发明实施例的TSA3循环神经网络道琼斯指数预测示意图;
图11为本发明实施例的TSA3循环神经网络个股(美国苹果公司)预测示意图;
图12为本发明实施例的TSA3和TSA4的个股(中国上海莱士)预测对比示意图;
图13为本发明实施例的TSA3和TSA4的个股(美国苹果公司)预测对比示意图;
图14为本发明实施例的误差比较示意图。
【附图标记说明】
1:基于神经网络模型和时间序列的股指预测装置;
2:存储器;
3:处理器。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
请参照图1,基于神经网络模型和时间序列的股指预测方法,包括步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
S3、对所述第一数据进行时间序列处理,得到第二数据;
S4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测。
由上述描述可知,通过对待预测股指的时间序列数据进行提取,得到特征数据;对所述特征数据进行预处理,得到第一数据;对所述第一数据进行时间序列处理,得到第二数据;通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测,提高了股指预测的准确率和预测长度。
进一步的,步骤S2还包括:
判断所述预处理是否完成,若是,则执行步骤S3。
由上述描述可知,通过判断所述预处理是否完成,若是,则执行步骤S3,保证了后续数据处理的准确性。
进一步的,所述预处理具体包括以下处理中的一种或多种:
通过预设的填充方式对所述特征数据中的缺失值进行填充;
根据数据之间的关联性对所述特征数据中的异常值进行替换;
对所述特征数据进行标准化处理;
对所述特征数据进行归一化处理。
由上述描述可知,通过预设的填充方式对所述特征数据中的缺失值进行填充;根据数据之间的关联性对所述特征数据中的异常值进行替换,保证了后续数据处理的精度,通过对所述特征数据进行标准化处理;对所述特征数据进行归一化处理,保证了数据的统一性,便于进行后续处理。
进一步的,步骤S3具体为:
建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据。
由上述描述可知,通过建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据,保证了后续进行股指预测的准确性。
进一步的,所述的对所述第一数据进行时间序列处理具体为以下处理中的一种或多种:
对所述第一数据进行滑动窗口动态提取处理;
按时间轴的顺序对所述第一数据进行权重分配处理。
由上述描述可知,通过对所述第一数据进行滑动窗口动态提取处理;按时间轴的顺序对所述第一数据进行权重分配处理,保证了后续股指预测的准确率和预测长度。
请参照图2,基于神经网络模型和时间序列的股指预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
S3、对所述第一数据进行时间序列处理,得到第二数据;
S4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测。
由上述描述可知,通过对待预测股指的时间序列数据进行提取,得到特征数据;对所述特征数据进行预处理,得到第一数据;对所述第一数据进行时间序列处理,得到第二数据;通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测,提高了股指预测的准确率和预测长度。
进一步的,步骤S2还包括:
判断所述预处理是否完成,若是,则执行步骤S3。
由上述描述可知,通过判断所述预处理是否完成,若是,则执行步骤S3,保证了后续数据处理的准确性。
进一步的,所述预处理具体包括以下处理中的一种或多种:
通过预设的填充方式对所述特征数据中的缺失值进行填充;
根据数据之间的关联性对所述特征数据中的异常值进行替换;
对所述特征数据进行标准化处理;
对所述特征数据进行归一化处理。
由上述描述可知,通过预设的填充方式对所述特征数据中的缺失值进行填充;根据数据之间的关联性对所述特征数据中的异常值进行替换,保证了后续数据处理的精度,通过对所述特征数据进行标准化处理;对所述特征数据进行归一化处理,保证了数据的统一性,便于进行后续处理。
进一步的,步骤S3具体为:
建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据。
由上述描述可知,通过建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据,保证了后续进行股指预测的准确性。
进一步的,所述的对所述第一数据进行时间序列处理具体为以下处理中的一种或多种:
对所述第一数据进行滑动窗口动态提取处理;
按时间轴的顺序对所述第一数据进行权重分配处理。
由上述描述可知,通过对所述第一数据进行滑动窗口动态提取处理;
按时间轴的顺序对所述第一数据进行权重分配处理,保证了后续股指预测的准确率和预测长度。
实施例一
请参照图1,基于神经网络模型和时间序列的股指预测方法,包括步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
所述预处理具体包括以下处理中的一种或多种:
通过预设的填充方式对所述特征数据中的缺失值进行填充;
根据数据之间的关联性对所述特征数据中的异常值进行替换;
对所述特征数据进行标准化处理;
对所述特征数据进行归一化处理;
步骤S2还包括:
判断所述预处理是否完成,若是,则执行步骤S3;
S3、对所述第一数据进行时间序列处理,得到第二数据;
步骤S3具体为:
建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据;
所述的对所述第一数据进行时间序列处理具体为以下处理中的一种或多种:
对所述第一数据进行滑动窗口动态提取处理;
按时间轴的顺序对所述第一数据进行权重分配处理。
实施例二
本实施例和实施例一的区别在于,本实施例将结合具体的应用场景,进一步说明本发明上述基于神经网络模型和时间序列的股指预测方法是如何实现的:
一、时序金融数据采集及预处理
1、对待预测股指的时间序列数据进行提取,得到特征数据;
金融数据大体上可分为金融机构内部的数据、金融市场交易的数据和金融市场相关的数据,这些数据大多数的数据结构比较规范,而且基本是按时间顺序。这些金融数据的来源非常广泛,有来自专业的财经网站东方财富网、和讯网、网易财经、新浪财经等,这些数据可以通过爬虫技术获得,另外,也有专业的数据提供商,发展成金融数据库(如:国泰安)和大数据金融(如:同花顺),这些需要付费获得数据,但整理的数据具有良好的规范性、完备性等优势。以美国道琼斯为例,从三要素获得其数据,图3中由左至右依次为指数预处理前的数据和指数预处理后的数据,图4中由左至右依次为成交量预处理前的数据和成交量预处理后的数据,如图3指数预处理前的数据连续性非常齐全,不过也有一些数据异常如图4中成交量预处理前的数据,明显中间有数据突变或者部分缺失值问题,则需要进行金融数据预处理,图3中指数预处理后的数据和图4中成交量预处理后的数据,其数据的平滑度和可分析性明显变强很多。
本发明所采用的数据来源以同花顺大数据金融为主,以国泰安专业金融数据库为辅。
2、对所述特征数据进行预处理,得到第一数据;
所述预处理具体包括以下处理中的一种或多种:
通过预设的填充方式对所述特征数据中的缺失值进行填充;
具体的,无论数据是来自网络爬虫还是专业数据库,均会出现集合中有个别空值空串或"-"、"--"以及非正常零值等,这就需要对这值加以填充,本发明主要填充方式有:
①若填充值可计算如 道琼斯2013年09月02日的开收盘价,苹果公司2017年11月21日和2001年10月26日出现的涨跌幅缺失值都可以通过预定的计算获得;
其中,Chg代表涨跌幅,Change代表涨跌,Priceclose、Priceopen分别代表收盘价、开盘价;
②对于连续性比较强的数据,而且出现空值比较少且不连续则采用一定历史长度进行移动平均,如果历史数据过少则前后平均,
如道琼斯2017年03月24日的成交量;
③出现比较连续的缺失值,大部分是由于市场的特殊原因造成的如中国银行和中信证券都属于大规模的银行、证券业,出现连续缺失值是因为连续的停牌造成的,因此这部分数据可以在分析时删除。
根据数据之间的关联性对所述特征数据中的异常值进行替换;
具体的,数据在收集过程中可能由采集算法或字段规格等原因造成一些异常值,而这些异常值又偏离了正常数据范围,则可以运用前后数据相关性,对于前后数据比较相关求平均值替代。
对所述特征数据进行标准化处理;
具体的,不同接口获得数据规范不一致问题,如列名不同(有中文、英文不同字段),数据值单位不同(元、万元、万股、亿手)等,因此收集的文件系统中需要对这些列名进行统一规范再导入到数据库中,其中数据值单位要换算为同一计量单位后导入系统。
对所述特征数据进行归一化处理;
神经网络在训练时各节点之间的数据不适合差距过大,因此需要对数据进行归一化处理,本发明采用①取LOG10,可以控制数据在10以内,同时再除以10,获得比较好的归一性即Log10(value)÷10,②对于正常值0则不适合用取对数,则运用当前值除以记录中的最大值以获得归一的数据。
步骤2还包括:
判断所述预处理是否完成,若是,则执行步骤3;
二、基于时间序列的成交量模型
3、对所述第一数据进行时间序列处理,得到第二数据;
步骤3具体为:
建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据;
所述的对所述第一数据进行时间序列处理具体为以下处理中的一种或多种:
对所述第一数据进行滑动窗口动态提取处理,即TSA1(Time-Series Analysis1);
按时间轴的顺序对所述第一数据进行权重分配处理,即TSA2(Time-SeriesAnalysis 2)、TSA3(Time-Series Analysis 3)
和TSA4(Time-Series Analysis 4)
具体的,在金融市场的理论研究和实证分析,主要围绕时间、价格和成交量展开,而且根据数据流的定义,金融市场是一种实时、连续而有序的数据序列。在应用于专家预测研究中,这种数据序列从时间上最新的信息往往具有较大决定作用,而历史数据又不能丢弃。在很多的时间序列中运用Autoregressive moving average model(ARMA)和Autoregressive Integrated Moving Average model(ARIMA)模型处理数据,然而其平稳序列所做的差分和参数估算均比较繁琐。因此利用滑动窗口来对金融时间序列进行动态分析也受到很多学者的关注,因其计算主要通过移动平均,也有学者称之为移动窗口、观察窗口,示意图如下图5所示:
图5中设定窗口的宽度为m,对于任意时间ti都有固定的宽度,而且数据流是从左向右传输即ti,ti+1,…,ti+m-1。之与相对应的数据项为(d1,t1),(d2,t2),…(dn,tn),其中d代表数据样本,本发明以成交量作为时序数据流,用Volt即为成交量数据流。
TSA1
一般在实验研究中,针对金融市场数据进行训练时主要包含该时间点前后的数据,因此多数采用统计学的中心化处理即中心移动平均值,其计算步骤如下:
3.1:以一个时间节点ti为中心,计算时间前后相同时间跨度m的平均值
3.2:往后移动一个时间点,再计算其时间前后相同时间跨度m的平均值
3.3:然后对前次的结果再平均,获得中心移动平均值CMAt。
金融市场数据随着时间的移动会呈现出影响强弱之分,单纯的中心移动平均值也存一定的不适应性,本发明尝试在滑动窗口m增加三种假设:
TSA2
当前的数据比历史的重要即当前的成交量所反应的市场信息更重要,相当于为当前的成交量赋予更大的权重,赋予权重用一次线性表达,对上述中心移动平均值计算增加权重wi(Wk=wmax-kw,k=1,2,3...,m)具体如下:
TSA3
当前的数据比历史的不重要即以“价走量先行”(It takes volume to makeprices move)表示历史成交量所反应未来市场方向更突出,这个重要性和窗口宽度有一定的关系,太早的时间成交量也会导致失效,权重计算改变为wi(Wk=1+kw,k=1,2,3...,m)
TSA4
由于金融市场瞬息万变,金融领域专家更在注重当前突发的事件对近期市场的影响,尽管长期来讲,这种突发的成交量变化可能影响也不会很大,因此在(2)的基础上对权重进行调整如下
图6中分别对应上面滑动窗口的三种假设,图6由左至右依次为滑动窗口假设当前重要(TSA2)、假设历史重要(TSA3)和假设3历史重要加当前突变(TSA4),许多实验主要建立在未经假设的前提下进行的,本发明结合神经网络的训练,发现假设后的实验效果比单纯的中心移动平均值更为有效。
4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测;
具体的,多数金融数据提供商均能提供金融市场中成交数据(量价),统计方式有日、周、月、季等,神经网络在训练时不适合训练数据太少,因此用日成交信息数据作为输入比较合理,输入节点,通过隐藏层来回训练,输出节点为价格,不断训练以期获得比较理想的结果,神经网络传递过程如图7所示。
图7循环神经网络预测模型(I表示隐藏层每个节点都分成两部分信息,前半部分为上一层输入与权重的计算结果,后半部分是通过激活函数产生下一层的输入;II表示隐藏层循环训练,本发明用三重循环即可较好的实现预测功能)
该模型运行步骤如下:
4.1.读取第二数据,获得成交量输入矩阵I和价格目标输出矩阵O
4.2.建立权重矩阵Wij,i为当前层节点数第一次为初始输入节点数,j为下一层的节点数,最后一层节点数即为输出层的节点数
X=W·I (8)
4.3.组合数据并应用激活函数传输给下一层,X是组合后的数据,还需要对X进行平滑也称激活,本文采用tanh激活函数f=((1-e∧(-2x)))/((1+e^(-2x))),还有其它激活形式,不同激活函数会影响其效果。
O=f(X) (9)
4.4.隐藏层重复4.3和4.4操作步骤,直至输出到最后一层即输出层,即某个时间点t对应神经元的输出表示为
Ot=f(Xt)
Ot+1=f(Xt+1)+f(Ot)=f(Xt+1)+f(f(Xt))
Ot+2=f(Xt+2)+f(Ot+1) (10)
4.5.计算误差error,输出层与目标值之间比较
eoutput=target-Ooutput (11)
4.6.反向传播误差,根据输入权重分配各自的误差是当前神经网络中最普遍的一种做法,反向传播时需要对输入的权重矩阵Wij进行转置即WT,重复传播误差直至网络的第一层。
en-1=en·WT (12)
4.7.权重修正,通过误差来修正权重,在此引入神经网络的学习率a即梯度下降
4.8.重复4.2至4.7直至误差最小才退出网络。
(2)预测窗口优化
时间序列和循环神经网络在预测功能上均有各自的优势,比如在时间序列中找出变量变化的特征、趋势以及发展规律,从而对变量的未来变化进行有效地预测,因此时间序列优势在于分析和处理数据,而神经网络在归一化的数据集中更容易寻找出数据之间的联系,其多重拟合往往比时间序列有更高的准确率。而运用现有历史数据对未来进行预测时,如果数据过多是通过历史数据分析拟合而来的,建立在这些本身就具有一定的误差数据基础上进行预测,再好的模型也会出现偏差,因此有必要将预测周期变小,越长的时间的预测越不准确这是常有的现象,但在短周期内的预测如果能大大提升其准确率则推广价值就显得很有意义,这也能解决受限于历史数据的约束,对未来的预测准备数据不充分或不科学时将导致预测失效。基于时间序列的神经网络模型,把滑动窗口的整体数据作为神经网络的输入,一方面实际数据在训练时会减少滑动窗口的宽度,另一方面可以让滑动窗口的整体数据尽量保持未经时间序列预测过的,步骤如下:
Step I:首先按时间纵向排序的成交量改为横向布局构建新的训练集合(假定集合长度为n),创建滑动窗口的宽度(m)的成交量节点voli,j(i=m,m+1,m+2,...,n,n+1,n+2,...,j=0,1,2,...m-1),这些节点分别存储历史的成交量信息,其中volume表示当前成交量。
Step II:在进入预测窗口时,当前成交量已经无法得知,通过移动平均计算预测节点获得而其它滑动窗口中的成产量仍然通过历史信息中获得。
Step III:设置训练周期和重复次数,导入循环神经网络进行重复训练;
本发明的技术方案改变了传统时间序列的滑动窗口算法,通过改进滑动窗口宽度(TSA1)和权重提出了三种滑动窗口假设:TSA2,TSA3,TSA4,通过循环神经网络训练获得不同的实验结果,结果表明基于TSA3的循环神经网络预测准确率大大提升,在比较稳定市场中,股市的涨跌判断上可以实现接近90%的准确率,其准确率和应用面都很高的参考价值;
三、实施环境
本发明在软件上使用Microsoft Visual Studio 2015和MyEclipse 2017CI开发工具相结合,开发语言为C#和python3.7,数据集处理存储形式包括SQL SERVER 2012数据库和csv文本,因数据集预处理比较多,因此使用Visual Studio可视化编程更容易准备数据,而训练网络则使用python,具体循环神经网络参数如下表1所示。
表1 循环神经网络参数效果对比
四、不同时间序列实施结果
以中国上证指数1999年(前几年因市场刚建立,存在较多不稳定的数据)至2019年为例,训练样本范围为2018年5月之前的数据,后续样本至2019年4月(1年的数据)均为训练和测试样本,训练目标为收盘价、开盘价、最高价和最低价。基于时间序列不同的处理后在循环神经网络模型中训练结果进行对比,表现出的准确性用实际值与预测值相差,并取平均值。通过累计误差大小来判断结果的准确率,适合于多数预测方法,假定有n期的预测中,第i期的实际值和预测值用Ti、Pi表示,预测误差Error(越小表示准确率越高)表示为,表2为不同时间序列训练结果误差对比,图7为TSA3的实际与预测对比:
表2 不同时间序列训练结果误差对比
Time Type | close | open | high | low |
TSA1 | 0.116 | 0.112 | 0.108 | 0.116 |
TSA2 | 0.118 | 0.114 | 0.111 | 0.113 |
TSA3 | 0.106 | 0.100 | 0.103 | 0.106 |
图8由左至右依次为(I)实际与预测对比和(II)误差趋势
图8中表示了TSA3的训练结果通过17年的数据训练后其误差已经降低很多了,误差趋势在(II)表示,呈越来越小的趋势,从表2和图8中可以看出该训练效果更为有效。
为了让TSA3各个参数调节更为合理,更有利于后续研究,因此我们需要对TSA3的滑动窗口宽度和权重进行调试和验证。另外,需要让误差尽可能出现比较明显的区别,本研究延长预测窗口期,从上述一年的预测数据增加为两年,同时观察对比不同的滑动窗口宽度(表3)和不同的权重(表4)对其准确率的影响。
表3 不同的滑动窗口宽度的误差比较(权重为0.025)
Days(wide) | close | open | high | low |
60 | 0.275 | 0.265 | 0.286 | 0.283 |
30 | 0.239 | 0.220 | 0.222 | 0.236 |
20 | 0.270 | 0.257 | 0.235 | 0.266 |
15 | 0.290 | 0.268 | 0.286 | 0.295 |
10 | 0.345 | 0.335 | 0.324 | 0.348 |
表4 不同的权重的误差比较(宽度为30)
weight | close | open | high | low |
0.020 | 0.240 | 0.231 | 0.233 | 0.245 |
0.025 | 0.236 | 0.226 | 0.221 | 0.237 |
0.030 | 0.237 | 0.250 | 0.246 | 0.240 |
表3中时间的滑动窗口宽度过长和过短都会影响了预测结果,过长的历史交易量数据对现在的影响不明显,过短的历史交易量由于神经网络的输入节点原因导致其训练结果也不理想,本研究取30的宽度相对比较不理想。表4权重调节过大和过小,也会有所影响,相对于时间窗口宽度影响较少,取0.025权重的线性调节。
五、基于TSA3的循环神经网络预测
经上述实施结果得出本发明基于TSA3的循环神经网络预测参数,相关设定如表5所示,通过预测长度最大控制在20%以内,其准确率可以大大提升,判断其准确率我们采用涨跌标志Arise(上涨还是下跌)和收盘点位的准确率Arate(百分百的准确率是不现实的,因此我们采用精确率0.5%区间的判断),然后再对准确率进行累加再除以总预测期数。
表5 基于TSA3的循环神经网络预测参数
我们将本模型运用于中国的上证指数(周期较短)和个股(豫光金铅)分析、美国的道琼斯指数(周期较长)和个股(苹果)分析,效果如图9所示。
图9中由左至右依次为TSA3循环神经网络预测(I)上证指数和(II)个股(中国豫光金铅)预测示意图;
图9中中国上证指数虽然周期没有美国的道琼斯指数长,但仍然具有很好的稳定性,因此其预测值与实际值对比涨跌准确率达到85.02%以上,而收盘点位的准确率也能实现70.16%,在个股的应用上,预测准确率部分时期可以连续达到90%以上,但也却有部分时间只能在55%左右。
在图10中美国的道琼斯指数和个股(美国苹果公司)的预测准确性都是图9的高,尤其表现在个股稳定性方面,美国苹果公司在2014年6月9日股票1拆7(股价变七分之一),并没有很大的影响后续神经网络的训练(在扩展研究这种突发,中美市场个股对比),其涨跌准确率达到86.3%以上,而收盘价格的准确率也能比较连续的实现80.1%以上,基本没有出现过类似图8(II)中的这种准确性的不稳定情况。
(4)扩展突变评估
TSA4的对量的突变有一定的适应性,取美国苹果公司在分股之前做训练预测和中国上海莱士多次价格变化导致价量全乱,不按常理的数据给预测带来很大的困难,如该公司2018年2月22日开始停牌重组,在2018年12月7日至12月20日连续十几个跌停,这种现象在中国股市并不少见,而且本股票仍然是中大市值且有一定的稳定性股票,通过TSA3和TSA4的预测对比如图12和图13所示。
图12TSA3和TSA4的预测对比(I)个股(中国上海莱士)
图13为本发明实施例的TSA3和TSA4的个股(美国苹果公司)预测对比示意图从图12中明显可以看出美国苹果公司的股票更具有稳定性,而且在突变时仍然可以很好的平滑,从数据背后也可以得出一些股市信息,苹果股票数量将变为现在的7倍,但苹果股价将变为现在的七分之一,从量价原则上其实是比较吻合的。而中国股市中个股的除权、贴权等各拉高股价,量并未跟从量价原则,因此在训练的结果上出现偏差也是比较正常的。而两只股票都存在突变情况,其中美国苹果公司突发一次,中国上海莱士突变三次,以突变时做误差检验,把实际收盘价和预测进行相差取绝对值并除以实际收盘价,即误差对比如图14所示。
图14中美国苹果公司突发时产生的误差相当大,但经过五天的修复,就迅速收敛,而上海莱士每次突发再收敛的修复周期都要20天左右,因此成熟的市场价量理论更加稳定,用于预测和风险防控的指标更有意义。
TSA4的对量的突变对美国苹果公司训练有更高的适应性,但对中国上海莱士并没有明显改善,从训练周期来看,美国苹果公司历史比较久,上市数据较多也有一定的训练优势。因此成熟、稳定的金融市场更具有计算机大数据分析和预测的优势,其风险可控度也比不成熟的市场好。
实施例三
请参照图2,基于神经网络模型和时间序列的股指预测装置1,包括存储器2、处理器3及存储在存储器2上并可在处理器3上运行的计算机程序,所述处理器3执行所述程序时实现实施例一中的各个步骤。
Claims (10)
1.基于神经网络模型和时间序列的股指预测方法,其特征在于,包括步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
S3、对所述第一数据进行时间序列处理,得到第二数据;
S4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测。
2.根据权利要求1所述的基于神经网络模型和时间序列的股指预测方法,其特征在于,步骤S2还包括:
判断所述预处理是否完成,若是,则执行步骤S3。
3.根据权利要求1所述的基于神经网络模型和时间序列的股指预测方法,其特征在于,所述预处理具体包括以下处理中的一种或多种:
通过预设的填充方式对所述特征数据中的缺失值进行填充;
根据数据之间的关联性对所述特征数据中的异常值进行替换;
对所述特征数据进行标准化处理;
对所述特征数据进行归一化处理。
4.根据权利要求1所述的基于神经网络模型和时间序列的股指预测方法,其特征在于,步骤S3具体为:
建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据。
5.根据权利要求1所述的基于神经网络模型和时间序列的股指预测方法,其特征在于,所述的对所述第一数据进行时间序列处理具体为以下处理中的一种或多种:
对所述第一数据进行滑动窗口动态提取处理;
按时间轴的顺序对所述第一数据进行权重分配处理。
6.基于神经网络模型和时间序列的股指预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
S1、对待预测股指的时间序列数据进行提取,得到特征数据;
S2、对所述特征数据进行预处理,得到第一数据;
S3、对所述第一数据进行时间序列处理,得到第二数据;
S4、通过神经网络模型对所述第二数据进行训练,并对所述待预测股指的价格进行预测。
7.根据权利要求6所述的基于神经网络模型和时间序列的股指预测装置,其特征在于,步骤S2还包括:
判断所述预处理是否完成,若是,则执行步骤S3。
8.根据权利要求6所述的基于神经网络模型和时间序列的股指预测装置,其特征在于,所述预处理具体包括以下处理中的一种或多种:
通过预设的填充方式对所述特征数据中的缺失值进行填充;
根据数据之间的关联性对所述特征数据中的异常值进行替换;
对所述特征数据进行标准化处理;
对所述特征数据进行归一化处理。
9.根据权利要求6所述的基于神经网络模型和时间序列的股指预测装置,其特征在于,步骤S3具体为:
建立时序模型,并对所述第一数据进行时间序列处理,得到第二数据。
10.根据权利要求6所述的基于神经网络模型和时间序列的股指预测装置,其特征在于,所述的对所述第一数据进行时间序列处理具体为以下处理中的一种或多种:
对所述第一数据进行滑动窗口动态提取处理;
按时间轴的顺序对所述第一数据进行权重分配处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910406667.4A CN110264352A (zh) | 2019-05-16 | 2019-05-16 | 基于神经网络模型和时间序列的股指预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910406667.4A CN110264352A (zh) | 2019-05-16 | 2019-05-16 | 基于神经网络模型和时间序列的股指预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110264352A true CN110264352A (zh) | 2019-09-20 |
Family
ID=67914720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910406667.4A Pending CN110264352A (zh) | 2019-05-16 | 2019-05-16 | 基于神经网络模型和时间序列的股指预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110264352A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111652722A (zh) * | 2020-05-28 | 2020-09-11 | 杭州师范大学 | 一种基于人工神经网络的金融板块指数预测方法 |
CN111783356A (zh) * | 2020-06-29 | 2020-10-16 | 清华大学深圳国际研究生院 | 一种基于人工智能的石油产量预测方法和装置 |
CN112801798A (zh) * | 2021-04-08 | 2021-05-14 | 成都数联铭品科技有限公司 | 关联网络的影响传播分析和模式识别方法、系统、设备 |
CN115964620A (zh) * | 2023-03-15 | 2023-04-14 | 阿里巴巴(中国)有限公司 | 数据处理方法、存储介质和电子设备 |
-
2019
- 2019-05-16 CN CN201910406667.4A patent/CN110264352A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111652722A (zh) * | 2020-05-28 | 2020-09-11 | 杭州师范大学 | 一种基于人工神经网络的金融板块指数预测方法 |
CN111783356A (zh) * | 2020-06-29 | 2020-10-16 | 清华大学深圳国际研究生院 | 一种基于人工智能的石油产量预测方法和装置 |
CN111783356B (zh) * | 2020-06-29 | 2024-03-29 | 清华大学深圳国际研究生院 | 一种基于人工智能的石油产量预测方法和装置 |
CN112801798A (zh) * | 2021-04-08 | 2021-05-14 | 成都数联铭品科技有限公司 | 关联网络的影响传播分析和模式识别方法、系统、设备 |
CN115964620A (zh) * | 2023-03-15 | 2023-04-14 | 阿里巴巴(中国)有限公司 | 数据处理方法、存储介质和电子设备 |
CN115964620B (zh) * | 2023-03-15 | 2023-12-12 | 阿里巴巴(中国)有限公司 | 数据处理方法、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110264352A (zh) | 基于神经网络模型和时间序列的股指预测方法及装置 | |
Zhang et al. | Measuring and improving regional energy security: A methodological framework based on both quantitative and qualitative analysis | |
CN105303262A (zh) | 一种基于核主成分分析和随机森林的短期负荷预测方法 | |
Zhang et al. | Wind speed forecasting based on model selection, fuzzy cluster, and multi-objective algorithm and wind energy simulation by Betz's theory | |
Huang et al. | Convolutional neural network forecasting of European Union allowances futures using a novel unconstrained transformation method | |
CN107833137A (zh) | 基于多目标优化的量化交易策略生成方法及装置、设备和存储介质 | |
Min et al. | Robust mean-risk portfolio optimization using machine learning-based trade-off parameter | |
Gao | The use of machine learning combined with data mining technology in financial risk prevention | |
Yu et al. | Short-term photovoltaic power point-interval forecasting based on double-layer decomposition and WOA-BiLSTM-Attention and considering weather classification | |
Ma et al. | Stock prediction based on random forest and LSTM neural network | |
Ye et al. | A relationship-aligned transfer learning algorithm for time series forecasting | |
Xu et al. | An optimized decomposition integration framework for carbon price prediction based on multi-factor two-stage feature dimension reduction | |
Wang et al. | An enhanced hybrid model based on multiple influencing factors and divide-conquer strategy for carbon price prediction | |
Yuan et al. | A dynamic clustering ensemble learning approach for crude oil price forecasting | |
Karim et al. | A deep learning-based approach for stock price prediction using bidirectional gated recurrent unit and bidirectional long short term memory model | |
Deng et al. | An integrated approach of ensemble learning methods for stock index prediction using investor sentiments | |
Si et al. | Establishment and improvement of financial decision support system using artificial intelligence and big data | |
Wątróbski et al. | New multi-criteria method for evaluation of sustainable RES management | |
Luo | Construction of artificial neural network economic forecasting model based on the consideration of state transition diagram | |
CN110807543A (zh) | 一种基于群决策智能搜索的投资组合优化方法和装置 | |
CN108197729A (zh) | 基于机器学习的价值投资分析方法、设备和存储介质 | |
He et al. | Development mode of internet economy based on artificial intelligence technology | |
Wang et al. | MSGraph: Modeling multi-scale K-line sequences with graph attention network for profitable indices recommendation | |
CN113570455A (zh) | 股票推荐方法及装置、计算机设备、存储介质 | |
Luchko et al. | Artificial Neural Networks in Export and Import Forecasting: An Analysis of Opportunities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190920 |
|
RJ01 | Rejection of invention patent application after publication |