CN109190834A - 基于神经网络的股票价格趋势预测方法及系统 - Google Patents
基于神经网络的股票价格趋势预测方法及系统 Download PDFInfo
- Publication number
- CN109190834A CN109190834A CN201811064533.0A CN201811064533A CN109190834A CN 109190834 A CN109190834 A CN 109190834A CN 201811064533 A CN201811064533 A CN 201811064533A CN 109190834 A CN109190834 A CN 109190834A
- Authority
- CN
- China
- Prior art keywords
- neural network
- data
- stock
- module
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 88
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 38
- 238000005457 optimization Methods 0.000 claims abstract description 32
- 238000003062 neural network model Methods 0.000 claims abstract description 27
- 238000012360 testing method Methods 0.000 claims description 58
- 230000006870 function Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 11
- 238000013139 quantization Methods 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 230000001174 ascending effect Effects 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 3
- 230000000644 propagated effect Effects 0.000 abstract 1
- 230000008859 change Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 238000013277 forecasting method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 241000272778 Cygnus atratus Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于神经网络的股票价格趋势预测方法及其系统,本发明的神经网络模型基于多层人工神经网络结构而构建,多层人工神经网络结构采用的算法能快速收敛计算得到最小化损失函数,并且在损失函数中引入的λ参数能够避免了宏观经济环境变化或股票基本面突发性变化所带来的预测偏差,极大的优化了神经网络模型预测的准确度,适用范围广。同时,本发明多层人工神经网络所采用的损失函数中采用前向和反向传播训练算法找到优化的权重参数ji (L),采用的卷积训练算法收敛较快,程序运行效率高、实时性强,对硬件配置无需很高要求,系统性价比高。
Description
技术领域
本发明涉及股票量化技术领域,特别涉及一种基于神经网络的股票价格趋势预测方法及系统。
背景技术
在数据时代,可通过实时监测、跟踪研究股票交易数据来进行挖掘分析,以揭示出规律性的东西,将实时数据流分析和历史相关数据相结合,分析并发现股票价格波动的模型,从而对股票价格趋势进行预测。但股票价格基本上是动态的,非线性的,相当程度的受人为因素的影响;同时,股票价格的变动也受许多宏观经济因素的影响,如政治事件、公司的政策、商品价格指数、银行利率等等。因此,预测股票价格的是件复杂并具有挑战的事情。即便如此,股票预测仍然一直都是学术界和金融界的研究热点。因为,投资者如果能够精确的把握股票市场的变化规律,不仅可以获取巨大收益,还可以规避投资风险。
自从股票市场诞生以来,众多国家的科学家和专业人士先后尝试了各种方法来预测股票价格的时间序列,包括统计学方法、计量经济学模型、人工智能与机器学习等。但预测是一种重要的数据分析形式,数据预测由学习阶段和预测阶段组成,学习阶段通过从历史数据集“学习”从而构造系统模型,学习中的训练过程是有监督的或无监督的,采用不同的方法对最后结果影响极大、预测难度较大,且预测结果准确性不高。例如申请号为CN201610942370.6的中国发明专利申请公开了一种基于多机器学习的股票预测方法及系统,方法包括以下步骤:获取股票交易历史数据,并基于特征选择和实际操作经验选择数据的模型,以作为训练的输入训练集;基于神经网络理论构建神经网络模型,其中,神经网络模块包括输入层、第一至第三隐藏层和输出层;基于决策树算法和极限向量机算法,根据输入训练集和神经网络模型构建决策模型,并根据决策模型得到股票预测结果及股票交易建议。该预测方法能够对股票的走势进行预测,并给出合理的股票交易建议。但其对于神经网络模型的输入参数的选择较窄,得到的预测结果较为局限,仅适用于整个股票的大环境处于平稳状态下的分析与预测,而无法应对黑天鹅事件、经济环境、货币政策、国际经济政治局势等因素的影响。同时,其构建的神经网络、决策树、在线极限学习机三种回归模型,与单各预测模型相比,虽然股价预测的准确度有所提升,但整个系统的运算处理效率变慢、复杂程度高,当运算数据累计到一定容量后极易引发整个系统的崩溃,系统运行稳定性差。
发明内容
本发明的发明目的是,针对上述问题,提供一种基于神经网络的股票价格趋势预测方法,通过建立多层人工神经网络模型,输入股票交易的历史数据,实现对人工神经网络系统的有监督的学习、测试与优化,得到的股票预测数据准确而稳定。
为达到上述目的,本发明所采用的技术方案是:
基于神经网络的股票价格趋势预测方法,包括以下步骤:
S1、根据选取原则选取作为多层人工神经网络的输入变量的股票技术特征参数,并获取目标股票的交易历史数据,以作为训练的输入训练集;
S2、构建基于多层人工神经网络结构的神经网络模型,其中,所述多层人工神经网络结构包括一个输入层、一个输出层和两个以上的隐层,所述输入层设有n个节点,输出层设有一个节点且输出层的输出结果用以表示所预测的目标股票交易价格的升跌概率;其中所述多层人工神经网络结构的损失函数如下:
式中m为训练数据组的个数,x为输入变量,λ为基本面量化参数,h(x)为输出层的输出结果,ji (L)为权重参数;
S3、将目标股票的交易历史数据构建得到训练数据集和测试数据集;
S4、向多层神经网络结构中输入训练数据集,多层神经网络进行训练及有监督的学习,得到初步的用于预测股票交易价格趋势的神经网络预测模型;
S5、向步骤S4得到的神经网络预测模型输入测试数据集,对神经网络预测模型进行泛化能力测试,并根据测试结果进行参数调整和优化处理,得到最终的预测模型。
作为优选实施方式,步骤S2中,对式(1)利用反向传播算法计算,可得:
其中,
输出节点的误差δj4=aj4-yj,L层其中的节点的误差为δL=aL-yi。
作为优选实施方式,所述多层人工神经网络结构的训练,包括步骤如下:
S41、随机初始化权重参数ji (L),以使各参数ji (L)为接近于0的数值,λ初始值亦设为接近于0的数值;S42、执行前向传播算法,得到h(x)i,并对应于任意一个xi,然后计算出损失函数J();S43、执行反向传播算法计算偏导数,以检测梯度下降结果的有效性,得到最小化损失函数J()后,则确定权重参数ji (L),从而使多层人工神经网络结构的模型收敛。
进一步地,所述多层神经网络采用Leaky ReLU函数、PReLU函数、Tanh函数中的任意一种作为隐层的激活函数,采用Tanh函数或softmax函数作为输出层的激活函数,其中Leaky ReLU函数是ReLU函数的改良,且其定义为x<0时,f(x)=ax,当x>=0时,f(x)=x。
作为优选实施方式,步骤S1中,所述多层人工神经网络为大于等于3且小于等于7层的人工神经网络,其中,输入层设有与输入变量的个数相一致的节点数,隐层设有大于或等于5个节点,且各隐层的节点数小于等于输入变量的数目。
作为优选实施方式,步骤S3中,所述输入训练集将获取的交易历史数据作为多层神经网络结构的训练集和测试集,具体是:
S31、以交易历史数据的先后时间顺序每隔N天交替选取的数据分别作为第一训练集和第一测试集的数据,N为≥1的整数;
S32、以随机的时间间隔选取的数据分别作为第二训练集和第二测试集的数据,且第一训练集、第一测试集、第二训练集以及第二测试集选择得到的数据相互不重复,所述时间间隔按天计;
S33、将第一训练集和第二训练集的数据进行整合后,再进行归一化或相对化的数据处理,得到训练数据库,以提供步骤S4的监督学习;
S34、将第一测试集和第二测试集的数据进行整合后,再进行归一化或相对化的数据处理,得到测试数据库,以提供步骤S5的参数调整与优化处理的测试数据。
作为优选实施方式,所选取的输入变量为11个,分别表示为x1、x2、x3、x4、x5、x6、x7、x8、x9、x10和x11,具体如下:
①将股票技术特征参数中的随机指标KDJ中的K、D、J分别对应三个变量x1、x2、x3,赋值时对同时点的日线、周线和月线取不同权重;
②将股票技术特征参数中的指数移动平均线MACD中的DIF、DEA、(DIF-DEA)×2(MACD柱状图)分别对应三个变量x4、x5、x6;
③将变量x7表示为股票技术特征参数中的OBV(On balance volume)指标,取指标的相对值;
④将变量x8表示股票技术特征参数中的MA,为股价N日内的均值,MA=N日内的收盘价之和÷N;
⑤将变量x9表示为股票技术特征参数中的成交量比率(VR),VR(N日)=N日内上升日成交量总和÷N日内下降日成交量总和;
⑥将变量x10表示为股票技术特征参数中的标准差MD,MD=N-1日的(收盘价-MA)的两次方之和除以N再取平方根;
⑦将变量x11表示为基本面量化参数λ,所述基本面量化参数用以表示宏观经济环境、货币政策、国际经济政治形势、行业状况及突发事件对应不同大小等级的数值。
本发明还提供基于上述神经网络的股票价格趋势预测方法在预测系统,所述预测系统,包括股票交易历史数据输入模块、算法执行及参数优化模块、预测模块、实时股票交易数据输入模块和输出模块,
所述股票交易历史数据输入模块,用于根据选取原则选取作为多层人工神经网络的输入变量的股票特征参数,并获取目标股票的交易历史数据以作为训练的输入训练集;
所述算法执行及参数优化模块内基于多层人工神经网络结构构建有神经网络模型,并接收所述股票交易历史数据输入模块发来的输入训练集的数据进行参数优化处理,得到用于预测股票交易价格趋势的神经网络模型,并向预测模块输出;
所述预测模块内设有所述算法执行及参数优化模块输出的神经网络模型,用以接收实时股票交易数据输入模块发来的实时股票的交易数据,取多次数据的平均值后,将股票价格趋势的预测结果发送至输出模块上显示。
作为优选实施方式,还包括第一数据预处理模块和第二数据预处理模块,所述第一数据预处理模块将股票交易数据输入模块发来的目标股票的交易历史数据分为训练集数据和测试集数据,其中训练集数据库与算法执行及参数优化模块连接,用以向算法执行及参数优化模块提供监督学习数据;所述测试集数据与预测模块连接,用以向预测模块提供和参数调整和优化处理的测试数据;
所述第二数据预处理模块的输入端与实时股票交易数据输入模块连接、其输出端与预测模块连接,用以对实时股票交易数据进行归一化或相对化处理。
由于采用上述技术方案,本发明具有以下有益效果:
1.本发明的神经网络模型基于多层人工神经网络结构而构建,本发明的多层人工神经网络结构采用的算法能快速收敛计算得到最小化损失函数,并且在损失函数中引入的λ参数能够避免宏观经济环境变化或股票基本面突发性变化所带来的预测偏差,极大的优化了神经网络模型预测的准确度,适用范围广。
2、本发明多层人工神经网络所采用的损失函数中,采用前向和反向传播训练算法找到优化的权重参数ji (L),采用的卷积训练算法收敛较快,程序运行效率高、实时性强,对硬件配置无需很高要求,系统性价比高。
3、本发明的与现有股票价格预测技术的不同之处在于:在多层人工神经网络的损失函数中引入了能够评价宏观经济环境、货币政策和国际经济政治局势的基本面量化参数λ,加入的量化参数λ将突发基本面和政策面变化所带来的实际股价剧烈波动的因素纳入其中,从而使得构建得到的神经网络模型能适应微观和宏观各种数据的变化情况,解决了现有股票趋势预测方法所存在的缺陷。
4、本发明对于多层人工神经网络结构的输入变量x的选取原则是:需反映股票价格指数波动的平均变化趋势、中短期趋势、波动范围、交易量变化趋势、人气指标和意愿指标等,而现有的股票预测没有考虑多种特征变量,仅考虑当天的开盘价、最低最高价、收盘价和成交量,完全忽视了价格变化的趋势、交易心里因素及宏观基本面的影响,使得得到的预测结果较为狭窄、股票预测结果的参考价值有待考量。因此,本发明建立得到的神经网络模型对于影响股票价格的参数变量更全面,得到的股票价格预测结果更准确,更具参考价值。
5、本发明多层人工神经网络的隐层和输出层所采用的激活函数,不仅适应较大的输入变量的取值范围,还有利于卷积训练过程中算法收敛快、避免因梯度消失和梯度爆炸问题。而现有的股票预测方法的激活函数多为Sigmoid函数,不能避免计算时无法收敛、梯度消失和梯度爆炸等问题。
附图说明
图1是本发明基于神经网络的股票价格趋势预测方法的流程框图。
图2是所述多层人工神经网络结构的一种示意图。
图3是本发明基于神经网络的股票价格趋势预测系统的组成框图。
具体实施方式
以下结合附图对发明的具体实施进一步说明。
如图1所示,基于神经网络的股票价格趋势预测方法,包括以下步骤:
S1、根据选取原则选取作为多层人工神经网络的输入变量的股票技术特征参数,并获取目标股票的交易历史数据,以作为输入训练集。
现有的股票预测技术未考虑多种特征变量因素,仅考虑当天的开盘价、最低最高价、收盘价和成交量,完全忽视了价格变化的趋势、交易心里因素及宏观基本面的影响,如此做法将会对神经网络的模型构建、卷积训练以及最终预测结果的准确性带来巨大的影响。
基于上述缺陷,本发明对所述输入变量的选取原则为:综合考虑股票平均价格波动的变化趋势、随机指标、中短期变化趋势、波动范围、交易量变化趋势、人气指标和意愿指标等特征技术指标,使输入变量能较全面的体现股票价格随机波动的规律性,即隐含于数据中的统计特征。本实施中,所选取的输入变量为11个,分别表示为x1、x2、x3、x4、x5、x6、x7、x8、x9、x10和x11,具体如下:
①将股票技术特征参数中的随机指标KDJ中的K、D、J分别对应三个变量x1、x2、x3;
②将股票技术特征参数中的指数移动平均线MACD中的DIF、DEA、(DIF-DEA)×2(MACD柱状图)分别对应三个变量x4、x5、x6;
③将变量x7表示为股票技术特征参数中的OBV(On balance volume)指标,取指标的相对值;
④将变量x8表示股票技术特征参数中的MA,为股价N日内的均值,MA=N日内的收盘价之和÷N;
⑤将变量x9表示为股票技术特征参数中的成交量比率(VR),VR(N日)=N日内上升日成交量总和÷N日内下降日成交量总和;
⑥将变量x10表示为股票技术特征参数中的标准差MD,MD=N-1日的(收盘价-MA)的两次方之和除以N再取平方根;
⑦将变量x11表示为基本面量化参数λ,所述基本面量化参数用以表示宏观经济环境、货币政策、国际经济政治形势、行业状况及突发事件对应不同大小等级的数值。
当然除上述输入变量外,也可根据前述输入变量的选取原则,选择其他常见的股票技术特征参数。
S2、构建基于多层人工神经网络结构的神经网络模型,其中,所述多层人工神经网络结构包括一个输入层、一个输出层和两个以上的隐层,所述输入层设有n个节点,输出层设有一个节点且输出层的输出结果表示所预测的目标股票交易价格的升跌概率。
如图2所示,所述多层人工神经网络为大于等于3且小于等于7层的人工神经网络,其中,输入层设有与输入变量的个数相一致的节点数,隐层设有大于或小于5个节点。
本实施例中,所述人工神经网络为5层结构,设有一个输入层、一个输出层和三个隐层。其中所述输入层节点数为11,则所述输入变量对应为11个。输出层只有一个节点y1,其输出表示所预测的目标股票交易价格的升跌概率,三个隐层均有5个节点。当然,所述人工升降网络亦可为三层、四层或其他层数结构,但不大于7层,因为大于7层后人工神经网络在本算法使用过程,其模型不能收敛。
基于现有股票预测技术大多采用的是Sigmoid函数作为神经网络的激活函数,存在不能避免计算过程无法收敛、梯度消失、梯度爆炸等问题。因此,本发明人工神经网络选择激活函数的选取原则为:一是应适合较大的输入变量取值范围,二是利于训练过程中算法收敛快。
具体地,所述人工神经网络采用Leaky ReLU函数、PReLU函数、Tanh函数中的任意一种作为隐层的激活函数,本实施例采用Leaky ReLU作为隐层的激活函数。采用Tanh函数或softmax函数作为输出层的激活函数,本实施例Tanh函数作为输出层的激活函数。其中Leaky ReLU函数是ReLU函数的改良,且其定义为x<0时,f(x)=ax,a=0.002;当x>=0时,f(x)=x。x为输入变量。
其中,所述多层人工神经网络结构的损失函数如下:
式中m为训练数据组的个数,x为输入变量,λ为基本面量化参数,h(x)为输出层的输出结果,ji (L)为权重参数。在上述损失函数中引入所述λ,用于将因突发基本面和政策面变化而引起实际股价剧烈波动的因素纳入影响股票价格的输入变量中。λ值的取值范围是0~ 10000,具体取值根据宏观经济环境、货币政策、国际经济政治形势、行业状况及突发事件影响下的股票历史数据及神经网络训练结果得出,不同影响程度所对应的偏离原有趋势的程度大小确定λ值。λ的参数初始值设为0.00001,在训练过程优化取值即可。
进一步地,对式(1)利用反向传播算法计算,可得:
其中,
输出节点的误差L层其中的节点的误差为δL=aL-yi。
S3、将所述输入训练集进行分类,并构建得到训练数据集、测试数据集。
本实施例中,所述输入训练集将获取的交易历史数据作为多层神经网络结构的训练集和测试集,具体是:
S31、以交易历史数据的先后时间顺序每隔N天交替选取的数据分别作为第一训练集和第一测试集的数据,N为≥1的整数;所述N可为3天、5天、7天等。
S32、以随机的时间间隔选取的数据分别作为第二训练集和第二测试集的数据,且第一训练集、第一测试集、第二训练集以及第二测试集选择得到的数据相互不重复,所述时间间隔按天计。同时,所选取的交易历史数据是最近一年或两年的数据。对于所述时间间隔天数可与上述N的值相等或不相等,但所述N的值应当与待预测的股票价格的时间周期相一致。例如要对3天到9天时间段的股票价格进行预测,则选取的交易历史数据应当按这个时间周期取数或求平均数后,得到的训练和测试数据。
S33、将第一训练集和第二训练集的数据进行整合后,再进行归一化或相对化的数据处理,得到训练数据库,以提供步骤S4的监督学习与训练。
S34、将第一测试集和第二测试集的数据进行整合后,再进行归一化或相对化的数据处理,得到测试数据库,以提供步骤S5的参数调整与优化处理的测试数据。
S4、向多层神经网络结构中输入训练数据集,多层神经网络进行训练和有监督的学习,得到初步的用于预测股票交易价格趋势的神经网络预测模型。
其中,所述多层人工神经网络的训练,包括步骤如下:
S41、随机初始化权重参数ji (L),以使各参数ji (L)为接近于0的数值,λ初始值亦设为接近于0的数值;S42、执行前向传播算法,得到h(x)i,并对应于任意一个xi,然后计算出损失函数J();S43、执行反向传播算法计算偏导数,以检测梯度下降结果的有效性,得到最小化损失函数J()后,则确定权重参数ji (L),从而使多层人工神经网络结构的模型收敛。即采用训练数据库中的数据对多层人工网络结构进行训练,直至模型收敛。
S5、向步骤S4得到的神经网络预测模型输入测试数据集,对神经网络预测模型进行泛化能力测试,并根据测试结果进行参数调整和优化处理,得到最终的预测模型。即采用测试数据库中的数据对神经网络模型进行检测,以验证得到的神经网络模型输出结果的差异性。
如3所示,基于神经网络的股票价格趋势预测系统,包括股票交易历史数据输入模块、算法执行及参数优化模块、预测模块、实时股票交易数据输入模块和输出模块,
所述股票交易历史数据输入模块,用于根据选取原则选取作为多层人工神经网络的输入变量的股票特征参数,并获取目标股票的交易历史数据以作为训练的输入训练集。
所述算法执行及参数优化模块内基于多层人工神经网络结构构建有神经网络模型,并接收所述股票交易历史数据输入模块发来的输入训练集的数据进行训练和参数优化处理,得到用于预测股票交易价格趋势的神经网络模型,并向预测模块输出。
所述预测模块内设有所述算法执行及参数优化模块输出的神经网络模型,用以接收实时股票交易数据输入模块发来的实时股票的交易数据,取多次数据的平均值后,将股票价格趋势的预测结果发送至输出模块上显示。
所述股票价格趋势预测系统,还包括第一数据预处理模块,所述第一数据预处理模块将股票交易数据输入模块发来的目标股票的交易历史数据分为训练集数据和测试集数据,其中训练集数据库与算法执行及参数优化模块连接,用以向算法执行及参数优化模块提供训练和参数优化处理的数据;所述测试集数据与预测模块连接,用以向提供预测模块输出结果的检测优化处理的测试数据。
进一步地,所述股票价格趋势预测系统,还包括第一数据预处理模块和第二数据预处理模块,所述第一数据预处理模块将股票交易数据输入模块发来的目标股票的交易历史数据分为训练集数据和测试集数据,其中训练集数据库与算法执行及参数优化模块连接,用以向算法执行及参数优化模块提供监督学习数据;所述测试集数据与预测模块连接,用以向预测模块提供和参数调整和优化处理的测试数据。
所述第二数据预处理模块的输入端与实时股票交易数据输入模块连接、其输出端与预测模块连接,用以对实时股票交易数据进行归一化或相对化处理。
试验例
本发明选取单个股票交易的历史数据作为训练数据集和测试数据集,以交易历史数据的先后时间顺序每隔一天交替选取的数据分别作为训练集和测试集的数据,同时以随机的时间间隔(分别为三天、五天、七天)选取的数据分别作为训练集和测试集的数据,并保证两种选择数据的方法得到的数据不重合,且选取的历史交易数据是最近一年的数据。
随机初始化权重参数ji (L),使各参数ji (L)为很小的接近于0的随机数。λ参数初始值设为0.00001,训练过程优化取值。
基于多层人工神经网络结构的神经网络模型建立完成后,通过实时输入股票当前交易数据,预测股价变化的趋势。本发明构建的神经网络模型,对于股价趋势的预测准确度有明显提升,30天内股价预测误差率缩小到10%以内。对于宏观经济环境出现的重大变化,预测误差率达到46.9%,故λ值需要通过重新训练和优化后得出,重新输入新λ值后,预测误差率即恢复到10%以内。
上述说明是针对本发明较佳可行实施例的详细说明,但实施例并非用以限定本发明的专利申请范围,凡本发明所提示的技术精神下所完成的同等变化或修饰变更,均应属于本发明所涵盖专利范围。
Claims (9)
1.基于神经网络的股票价格趋势预测方法,其特征在于,包括以下步骤:
S1、根据选取原则选取作为多层人工神经网络的输入变量的股票技术特征参数,并获取目标股票的交易历史数据,以作为训练的输入训练集;
S2、构建基于多层人工神经网络结构的神经网络模型,其中,所述多层人工神经网络结构包括一个输入层、一个输出层和两个以上的隐层,所述输入层设有n个节点,输出层设有一个节点且输出层的输出结果用以表示所预测的目标股票交易价格的升跌概率;其中所述多层人工神经网络结构的损失函数如下:
式中m为训练数据组的个数,x为输入变量,λ为基本面量化参数,h(x)为输出层的输出结果,ji (L)为权重参数;
S3、将所述目标股票的交易历史数据构建训练数据集和测试数据集;
S4、向多层神经网络结构中输入训练数据集,多层神经网络进行训练和有监督的学习,得到初步的用于预测股票交易价格趋势的神经网络预测模型;
S5、向步骤S4得到的神经网络预测模型输入测试数据集,对神经网络预测模型进行泛化能力测试,并根据测试结果进行参数调整和优化处理,得到最终的预测模型。
2.根据权利要求1所述的基于神经网络的股票价格趋势预测方法,其特征在于:步骤S2中,对式(1)利用反向传播算法计算,可得:
其中,
输出节点的误差δj 4=aj 4-yj,L层其中的节点的误差为δL=aL-yi。
3.根据权利要求2所述的基于神经网络的股票价格趋势预测方法,其特征在于:步骤S4中,所述多层人工神经网络结构的训练包括步骤如下:
S41、随机初始化权重参数ji (L),以使各参数ji (L)为接近于0的数值,λ初始值亦设为接近于0的数值;S42、执行前向传播算法,得到h(x)i,并对应于任意一个xi,然后计算出损失函数J();S43、执行反向传播算法计算偏导数,以检测梯度下降结果的有效性,得到最小化损失函数J()后,则确定权重参数ji (L),从而使多层人工神经网络结构的模型收敛。
4.根据权利要求1所述的基于神经网络的股票价格趋势预测方法,其特征在于:所述多层神经网络采用Leaky ReLU函数、PReLU函数、Tanh函数中的任意一种作为隐层的激活函数,采用Tanh函数或softmax函数作为输出层的激活函数,其中Leaky ReLU函数是ReLU函数的改良,且其定义为x<0时,f(x)=ax,当x>=0时,f(x)=x。
5.根据权利要求1所述的基于神经网络的股票价格趋势预测方法,其特征在于:步骤S1中,所述多层人工神经网络为大于等于3且小于等于7层的人工神经网络,其中,输入层设有与输入变量的个数相一致的节点数,隐层设有大于或等于5个节点,且各隐层的节点数小于等于输入变量的数目。
6.根据权利要求1所述的基于神经网络的股票价格趋势预测方法,其特征在于:步骤S3中,所述输入训练集将获取的交易历史数据作为多层神经网络结构的训练集和测试集,具体是:
S31、以交易历史数据的先后时间顺序每隔N天交替选取的数据分别作为第一训练集和第一测试集的数据,N为≥1的整数;
S32、以随机的时间间隔选取的数据分别作为第二训练集和第二测试集的数据,且第一训练集、第一测试集、第二训练集以及第二测试集选择得到的数据相互不重复,所述时间间隔按天计;
S33、将第一训练集和第二训练集的数据进行整合后,再进行归一化或相对化的数据处理,得到训练数据库,以提供步骤S4的监督学习;
S34、将第一测试集和第二测试集的数据进行整合后,再进行归一化或相对化的数据处理,得到测试数据库,以提供步骤S5的参数调整与优化处理的测试数据。
7.根据权利要求1所述的基于神经网络的股票价格趋势预测方法,其特征在于:选取的输入变量为11个,分别表示为x1、x2、x3、x4、x5、x6、x7、x8、x9、x10和x11,具体如下:
①将股票技术特征参数中的随机指标KDJ中的K、D、J分别对应三个变量x1、x2、x3,赋值时对同时点的日线、周线和月线取不同权重;
②将股票技术特征参数中的指数移动平均线MACD中的DIF、DEA、(DIF-DEA)×2(MACD柱状图)分别对应三个变量x4、x5、x6;
③将变量x7表示为股票技术特征参数中的OBV指标,取指标的相对值;
④将变量x8表示股票技术特征参数中的MA,为股价N日内的均值,MA=N日内的收盘价之和÷N;
⑤将变量x9表示为股票技术特征参数中的成交量比率VR,VR(N日)=N日内上升日成交量总和÷N日内下降日成交量总和;
⑥将变量x10表示为股票技术特征参数中的标准差MD,MD=N-1日的(收盘价-MA)的两次方之和除以N再取平方根;
⑦将变量x11表示为基本面量化参数λ,所述基本面量化参数用以表示宏观经济环境、货币政策、国际经济政治形势、行业状况及突发事件对应不同大小等级的数值。
8.基于神经网络的股票价格趋势预测系统,其特征在于:包括股票交易历史数据输入模块、算法执行及参数优化模块、预测模块、实时股票交易数据输入模块和输出模块,
所述股票交易历史数据输入模块,用于根据选取原则选取作为多层人工神经网络的输入变量的股票特征参数,并获取目标股票的交易历史数据以作为输入训练集;
所述算法执行及参数优化模块内基于多层人工神经网络结构构建有神经网络模型,并接收所述股票交易历史数据输入模块发来的输入训练集的数据进行训练和参数优化处理,得到用于预测股票交易价格趋势的神经网络模型,并向预测模块输出;
所述预测模块内设有所述算法执行及参数优化模块输出的神经网络模型,用以接收实时股票交易数据输入模块发来的实时股票的交易数据,取多次数据的平均值后,将股票价格趋势的预测结果发送至输出模块上显示。
9.根据权利要求8所述的基于神经网络的股票价格趋势预测系统,其特征在于:还包括第一数据预处理模块和第二数据预处理模块,所述第一数据预处理模块将股票交易数据输入模块发来的目标股票的交易历史数据分为训练集数据和测试集数据,其中训练集数据库与算法执行及参数优化模块连接,用以向算法执行及参数优化模块提供监督学习与卷积训练训练数据;所述测试集数据与预测模块连接,用以向预测模块提供和参数调整和优化处理的测试数据;
所述第二数据预处理模块的输入端与实时股票交易数据输入模块连接、其输出端与预测模块连接,用以对实时股票交易数据进行归一化或相对化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811064533.0A CN109190834A (zh) | 2018-09-12 | 2018-09-12 | 基于神经网络的股票价格趋势预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811064533.0A CN109190834A (zh) | 2018-09-12 | 2018-09-12 | 基于神经网络的股票价格趋势预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109190834A true CN109190834A (zh) | 2019-01-11 |
Family
ID=64910682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811064533.0A Pending CN109190834A (zh) | 2018-09-12 | 2018-09-12 | 基于神经网络的股票价格趋势预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109190834A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767039A (zh) * | 2019-01-14 | 2019-05-17 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 技术交易的数据处理方法、装置、计算机设备和存储介质 |
CN110458328A (zh) * | 2019-07-11 | 2019-11-15 | 清华大学 | 基于主客观联合预测的黑天鹅事件决策方法及装置 |
CN110782096A (zh) * | 2019-10-29 | 2020-02-11 | 山东科技大学 | 一种外汇时间序列预测方法 |
CN110888857A (zh) * | 2019-10-14 | 2020-03-17 | 平安科技(深圳)有限公司 | 基于神经网络的数据标签生成方法、装置、终端及介质 |
CN111652722A (zh) * | 2020-05-28 | 2020-09-11 | 杭州师范大学 | 一种基于人工神经网络的金融板块指数预测方法 |
CN111724221A (zh) * | 2019-03-19 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 确定商品匹配信息的方法、系统、电子设备及存储介质 |
CN112232495A (zh) * | 2020-12-10 | 2021-01-15 | 北京瑞莱智慧科技有限公司 | 预测模型的训练方法、装置、介质和计算设备 |
CN112648923A (zh) * | 2020-12-12 | 2021-04-13 | 山东省农业机械科学研究院 | 一种虚拟计算的产品零部件尺寸检测方法 |
CN113793217A (zh) * | 2021-09-10 | 2021-12-14 | 上海卡方信息科技有限公司 | 一种基于卷积神经网络的股票交易反转点与异常点检测方法 |
CN114694774A (zh) * | 2022-02-23 | 2022-07-01 | 电子科技大学 | 一种基于神经网络快速预测多层吸波材料s参数的方法 |
CN116777506A (zh) * | 2023-05-16 | 2023-09-19 | 济南明泉数字商务有限公司 | 一种基于生成式ai服务的大宗品交易决策方法及系统 |
-
2018
- 2018-09-12 CN CN201811064533.0A patent/CN109190834A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767039A (zh) * | 2019-01-14 | 2019-05-17 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 技术交易的数据处理方法、装置、计算机设备和存储介质 |
CN111724221A (zh) * | 2019-03-19 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 确定商品匹配信息的方法、系统、电子设备及存储介质 |
CN110458328A (zh) * | 2019-07-11 | 2019-11-15 | 清华大学 | 基于主客观联合预测的黑天鹅事件决策方法及装置 |
CN110888857A (zh) * | 2019-10-14 | 2020-03-17 | 平安科技(深圳)有限公司 | 基于神经网络的数据标签生成方法、装置、终端及介质 |
CN110888857B (zh) * | 2019-10-14 | 2023-11-07 | 平安科技(深圳)有限公司 | 基于神经网络的数据标签生成方法、装置、终端及介质 |
CN110782096A (zh) * | 2019-10-29 | 2020-02-11 | 山东科技大学 | 一种外汇时间序列预测方法 |
CN111652722A (zh) * | 2020-05-28 | 2020-09-11 | 杭州师范大学 | 一种基于人工神经网络的金融板块指数预测方法 |
CN112232495A (zh) * | 2020-12-10 | 2021-01-15 | 北京瑞莱智慧科技有限公司 | 预测模型的训练方法、装置、介质和计算设备 |
CN112648923A (zh) * | 2020-12-12 | 2021-04-13 | 山东省农业机械科学研究院 | 一种虚拟计算的产品零部件尺寸检测方法 |
CN113793217A (zh) * | 2021-09-10 | 2021-12-14 | 上海卡方信息科技有限公司 | 一种基于卷积神经网络的股票交易反转点与异常点检测方法 |
CN114694774A (zh) * | 2022-02-23 | 2022-07-01 | 电子科技大学 | 一种基于神经网络快速预测多层吸波材料s参数的方法 |
CN116777506A (zh) * | 2023-05-16 | 2023-09-19 | 济南明泉数字商务有限公司 | 一种基于生成式ai服务的大宗品交易决策方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190834A (zh) | 基于神经网络的股票价格趋势预测方法及系统 | |
CN112215446A (zh) | 一种基于神经网络的单位动态火灾风险评估方法 | |
CN116167527B (zh) | 纯数据驱动的电力系统静态安全运行风险在线评估方法 | |
Varshitha et al. | Prediction of used car prices using artificial neural networks and machine learning | |
Sundararajan et al. | Regression and generalized additive model to enhance the performance of photovoltaic power ensemble predictors | |
Cheng et al. | Predicting the remaining useful life of rolling element bearings using locally linear fusion regression | |
Wang et al. | Evaluation and Prediction Method of Rolling Bearing Performance Degradation Based on Attention‐LSTM | |
Yu et al. | DWE-IL: a new incremental learning algorithm for non-stationary time series prediction via dynamically weighting ensemble learning | |
CN117390184B (zh) | 一种基于大数据技术的网络舆情预警方法及系统 | |
CN110533109A (zh) | 一种喷涂生产监测数据的存储及特征分析方法及其装置 | |
Maciel et al. | Exchange rate forecasting using echo state networks for trading strategies | |
CN115619099A (zh) | 变电站安全防护评价方法、装置、计算机设备和存储介质 | |
CN115659201A (zh) | 物联网气体浓度检测方法及监控系统 | |
CN110739030B (zh) | 一种乙烯生产过程小样本的软测量方法 | |
Haryono et al. | Stock price forecasting in Indonesia stock exchange using deep learning: A comparative study | |
Yao et al. | Financial time series forecasting: A combinatorial forecasting model based on STOA optimizing VMD | |
CN114491511A (zh) | 一种基于变分自编码器和深度回声状态网络入侵检测方法 | |
CN111563767A (zh) | 股票价格预测方法及装置 | |
CN112183814A (zh) | 一种短期风速预测方法 | |
CN112330435A (zh) | 一种基于遗传算法优化Elman神经网络的信用风险预测方法和系统 | |
CN113379455B (zh) | 订单量预测方法和设备 | |
Su et al. | Application of bp neural network optimization algorithm based on genetic algorithm in credit risk early-warning of commercial bank | |
CN113705093B (zh) | 一种杆塔力学响应预测方法、装置、设备和介质 | |
CN113327162B (zh) | 一种信贷风控规则制定系统 | |
CN112685933B (zh) | 一种滚轮丝杠副剩余使用寿命预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190111 |
|
RJ01 | Rejection of invention patent application after publication |