CN107832897A - 一种基于深度学习的股票市场预测方法 - Google Patents
一种基于深度学习的股票市场预测方法 Download PDFInfo
- Publication number
- CN107832897A CN107832897A CN201711232195.2A CN201711232195A CN107832897A CN 107832897 A CN107832897 A CN 107832897A CN 201711232195 A CN201711232195 A CN 201711232195A CN 107832897 A CN107832897 A CN 107832897A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msup
- data
- represent
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于深度学习的股票市场价格预测方法,包括:数据预处理、构建LSTM‑DCC股票市场预测模型。本发明结合了扩张因果卷积网络和循环神经网络各自的优势,能够自动学习股票自身序列以及相关影响因素的数据特征,对未来的价格及其走势进行预测。
Description
技术领域
本发明专利涉及一种基于深度学习的股票市场价格预测方法。
背景技术
金融领域是国家经济运转的重心,而股票市场在一个侧面也能反应一个国家的整体经济状况,并且随着国家经济的发展,人们对资本管理亦更加重视,投资理财也成为了一种常态,因此对股票市场时间序列数据进行分析建模,预测未来一段时间的股票市场走势具有重大实际意义。
股票市场时间序列数据相比与一般的时间序列数据(气温、风力等)具有数据维度高、非线性、非平稳等特点,这些特点使得针对股票市场的时间序列数据的预测成为一个研究难点和热点。
股票市场预测问题的本质可以归结为时间序列预测问题,时间序列是指将某种统计指标在不同时刻所表示的数值按照其发生的先后顺序排列而成的序列,时间序列数据则是时间序列所反应的实际数据。由于股票市场的变化还与其他外部影响因素有关所以股票市场预测问题又属于多条件时间序列预测问题。
时间序列预测通用模型包括经典的自回归模型(AR)、滑动平均模型(MA)以及结合这二者的自回归滑动平均模型ARMA模型(Iie Transactions,2015),同时由于时间序列数据通常呈现出非平稳的特点,研究者提出自回归积分滑动模型(ARIMA),其对时间序列数据进行单步或多步差分,使得数据变得平稳(Journal of the American StatisticalAssociation,1970)。
此外由于现实世界的系统大多都是非线性产生的,所以时间序列除了非平稳的特点外通常还是非线性的,这就导致经典的自回归模型无法很好的进行拟合,所以针对非平稳、非线性的时间序列采用非线性的模型通常会获得更好的效果,例如使用带有核函数的SVM或LS-SVM的回归模型(Neural Networks and Brain,2005),通过核函数将时间序列数据映射到一个高维空间中,在这个高维空间中拟合一个线性模型。此外根据万能近似理论神经网络可以以任意精度来近似任何从一个有限维空间到另一个有限维空间的Borel可测函数,所以有学者提出基于神经网络的预测模型(Neural Networks,1989),此外利用神经网络和ARIMA分别在非线性和线性建模的优势,有学者提出联合神经网络和ARIMA的混合模型(Neurocomputing,2003),在时间序列上取得了较好的预测结果。
此外一些研究也使用深度学习的方法,例如Connor等提出使用循环神经网络(RNN)对时间序列数据进行建模,RNN可以充分利用序列数据的历史信息(IEEETransactions on Neural Networks,1994);Chen等(IEEE International Conference onBig Data,2015)利用循环神经网络进行股票预测;Sutskever等(InternationalConference on Machine Learning,2011)利用循环神经网络进行文本生成;Gregor等(International Conference on Machine Learning,2015)利用循环神经网络将图片在序列上建模自动进行图片生成;
但是,RNN存在梯度消失的问题导致无法很好的利用长期历史信息。为了解决这个问题,研究者提出了长短期记忆网络(Long Short-Term Memory Network,LSTM)(Neuralcomputation,1997),其对循环神经网络中隐层单元的特殊改进,增加记忆单元、输入门、遗忘门和输出门,通过三种门结构,控制历史信息在神经网络中状态的记忆和遗忘,能够学习到长期的历史信息;
长短期记忆网络LSTM已被广泛地应用于对序列数据进行建模,例如:Venugopalan等(IEEE International Conference on Computer Vision,2015)利用LSTM网络使用Sequence to Sequence的网络结构,进行视频文本转换;Alex等(InternationalConference on Machine Learning,2014)利用LSTM网络提出一种端到端的语音识别模型。
除了循环神经网络,卷积神经网络也能够很好的对时序数据进行建模,例如Mittelman提出非采样的全卷积神经网络,通过使用卷积操作而不是RNN的循环结构来避免RNN中容易出现的梯度消失和梯度爆炸问题。
利用卷积神经网络Google DeepMind提出Wavenet模型(arXiv,2016),用以生成比传统方法更自然的声音,其最核心的操作为因果卷积和扩张卷积操作,通过堆叠不同的扩张卷积层使得模型能够获得大的感受野来获得长期间隔信息,而因果卷积操作可以保证按序列时间顺序进行卷积。
传统股票市场预测方法通常难以有效地提取到好的数据特征,使得预测结果的准确度往往不高,
发明内容
本发明要克服现有技术的上述缺点,提供一种基于深度学习的股票市场预测方法。
针对股票市场时间序列数据高维度、非线性、非平稳的特点,本发明结合扩张因果卷积网络和循环神经网络处理时序数据的各自优势,能够自动学习股票市场数据本身以及相关影响因素的数据特征,对未来的走势进行预测。
本发明的基于深度学习的股票市场预测方法,包括以下步骤:
(1)数据预处理;
(1.1)特征筛选;
考虑到股票市场序列数据通常会受到其他众多外部因素的影响例如上证指数通常会受到美国市场、欧洲市场、汇率等影响,所以需要对所有可能的相关特征做特征筛选,剔除无用的特征,计算影响因素与股票市场时间序列的相关性,采用Pearson相关系数作为评价依据,Pearson相关系数用以度量两个变量之间的相关程度其计算公式如下:
其中r表示Pearson相关系数,取值范围为[-1,1],其中0表示不相关,其值越接近1则正相关性越大,越接近-1则是负相关性越大;x和y为两个数据特征变量;Cov(x,y)表示协方差,σx,σy表示标准差;
通过以上计算结果可以知道两个数据特征变量之间的相关程度,如上证指数与美国市场标普500的相关程度、上证指数与人民币-美元汇率的相关程度、上证指数与恒生指数的相关性;
Pearson相关系数的绝对值越接近0则相关程度越弱,r的值作为特征选择的依据,剔除弱相关性的相应特征即相关系数r的绝对值小于0.3;
(1.2)归一化处理;
由于股票市场序列数据与其他影响因素数据在数值上相差较大且有较到的波动,故必须对这些数据进行归一化处理,其方法是将各类数值缩放到同一尺度,其计算公式如下:
其中x为原始数值,xmin为当前维度所有数据中数值最小的值,xmax为当前维度所有数据中数值最大的值,x*为缩放后的数值;
(2)构建LSTM-DCC股票市场预测模型;
将长短期记忆网络LSTM和扩张因果卷积网络DCC相结合,设计了一种混合深度学习模型,称为LSTM-DCC网络,LSTM的任务是提取序列的粗粒度特征,并降低输入数据特征维度,DCC网络通过扩张卷积操作可以同时利用不同时间间隔长度的序列特征;
设股票市场时间序列数据为X=(xt,x2,...,xt-1,xt),xt是t时刻的股票市场,则股票市场预测问题即是根据已知时间序列数据X,求得xt+1时刻的最大似然估计p(x):
xt+1时刻的值将会完全利用到序列之前所有时间步信息;
针对多条件股票市场序列数据,则此时公式(3)以如下形式进行表示:
其中xt表示t时刻股市场,表示t时刻的第i个影响因素数据的值,则i=1,2,3,...,n表示有n个条件;
公式(3)与公式(4)是股票市场的预测目标,图1给出LSTM-DCC网络结构图,图2给出LSTM内部单元结构图,本模型利用LSTM网络初步提取时间序列特征,将多变量时间序列输入通过LSTM网络降维后与DCNN网络连接,其t时刻计算过程如下:
it=sigmoid(Wxixt+Whiht-1+Wcict+bi) (5)
ft=sigmoid(Wxfxt+Whfht-1+Wcfct+bf) (6)
ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc) (7)
ot=sigmoid(Wxoxt+Whoht-1+Wcoct+bo) (8)
ht=ottanh(ct) (9)
其中xt表示t时刻的输入,it,ft,ot分别表示t时刻输入门、遗忘门、输出门的输出,ct表示t时刻记忆单元cell的输出,ht表示t时刻隐层输出,Wxi表示从输入层到输入门的连接权重,Whi表示从隐藏层到输入门的连接权重,Wci表示从记忆单元到输入门的连接权重,bi为其偏置项,Wxf表示从输入层到遗忘门的连接权重,Whf表示从隐藏层到遗忘门的连接权重,Wcf表示从记忆单元到遗忘门的连接权重,bf为其偏置项,Wxc表示从输入层到记忆单元的连接权重,Whc表示从隐藏层到记忆单元的连接权重,bc为其偏置项,Wxo表示从输入门到输出层的连接权重,Who表示从隐藏层到输出门的连接权重,Wco表示从记忆单元到遗忘门的连接权重,bo为其偏置项,根据it,ft,ot在[0,1]范围的取值,来控制历史信息在t时刻通过门结构的比例,sigmoid和tanh为激活函数。
以公式(8)的输出ht=ottanh(ct)作为DCCN部分的输入,扩张因果卷积神经网络利用禅茶学习通过堆叠残差连接块加深网络的深度,从而使网络可以获得更大的接受域,同时可以很好检测出数据微小的扰动;
在残差连接块的每层输入后使用批规范化(Batch Normalization),对每一层的输入重新进行归一化,避免极深网络而引起的梯度消失,使得网络可以很好的被训练。
本发明的优点是:可以充分发挥LSTM和DCCN两种深度学习网络在处理时序数据时的优点,提取到不同时间间隔的抽象特征,最终将这些抽象特征组合起来形成一个包含不同时间间隔的组合特征,从时间序列数据中抽取多范围和多层次的数据特征,对未来的价格、走势能够进行更准确的预测。
附图说明
图1是本发明的LSTM-DCC网络结构图。
图2是本发明的LSTM内部单元结构图。
具体实施方式
以上证指数预测为例,进一步说明本发明的内容及所使用的技术手段;上证指数除受所有在上海证券交易所上市交易的股票影响,还会受到其他因素的影响,如标普500、人民币兑美元汇率和香港恒生指数,上证指数及其影响因素的数据名称、时间跨度和数据总量如表1所示,部分详细数据如表2所示;
表1数据说明
行业名称 | 时间跨度 | 数据总量 |
上证指数 | 2000-01—2015-06 | 3897条 |
标普500指数 | 2000-01—2015-06 | 3897条 |
人民币兑美元汇率 | 2000-01—2015-06 | 3897条 |
香港恒生指数 | 2000-01—2015-06 | 3897条 |
表2历史数据
上证指数 | 标普500指数 | 人民币兑美元汇率 | 香港恒生指数 |
1366.579956 | 1469.250000 | 8.2798 | 17057.69922 |
1368.692993 | 1455.219971 | 8.2799 | 17303 |
1407.828979 | 1399.420044 | 8.2798 | 16608.55078 |
1406.036011 | 1402.109985 | 8.2797 | 15942.07031 |
1477.154053 | 1403.449951 | 8.2794 | 15329.33984 |
… | … | … | … |
4399.933105 | 2102.620117 | 6.209 | 27016.089844 |
4289.770996 | 2098.629883 | 6.2088 | 26560.130859 |
4006.753906 | 2061.189941 | 6.201 | 25944.029297 |
结合以上数据,本发明的具体实施方式步骤如下:
(1)数据预处理过程;
(1.1)特征筛选
根据Pearson相关系数计算公式:
分别计算上证指数与标普500指数、上证指数与人民币兑美元汇率、上证指数与香港恒生指数的相关系数,得到以下相关系数:
[0.26378636 -0.53129497 0.67939294]
剔除弱相关的特征(相关系数的绝对值小于0.3),即删除标普500指数数据,余下的影响因素与上证指数一起作为模型特征集合;
(1.2)归一化处理;
由于股票市场与其他影响因素数据在数值上相差较大且有较大的波动,所以为了使模型能快速收敛,并且在所有特征维度上进行建模,故需进行数值缩放,考虑到数据的特点本发明使用的缩放方式为min-max归一化,此操作会将所有维度的数据缩放到[0,1]之间;
以上证指数为例进行说明:
从2000年1月3日至2015年06月30日总计3897条数据,最大数值为6057.428223,最小数值为1007.901001,对每一天的上证指数数据按公式2进行缩放得到的结果如表3所示:
表3上证指数预处理结果
日期 | 归一化后上证指数数据 |
2000-01-03 | 0.07103219 |
2000-01-04 | 0.07145065 |
2000-01-05 | 0.07920107 |
2000-01-06 | 0.078846 |
2000-01-07 | 0.0929301 |
2000-01-08 | 0.10373467 |
… | … |
2016-06-29 | 0.64993609 |
2017-06-30 | 0.59388786 |
(2)LSTM-DCC股票市场预测模型;
将归一化后的上证指数数据,以及影响因素数据作为LSTM-DCC预测模型的输入进行训练,以90天作为训练数据时间步长,根据以上数据模型构建3维输入张量,形状为(batch size,time step,features),其中batch size为样本输入batch大小,time step为时间步长,features为总特征个数,本示例中batch size为128,time step为90,features为3,LSTM-DCC预测模型将根据历史90天中所有的数据去发现输入数据的潜在规律,本示例使用两层LSTM网络和四层残差连接块构建LSTM-DCC模型,模型具体结构参数见表4:
表4 LSTM-DCC预测模型结构参数
模型训练参数如下表5所示:
表5 LSTM-DCC预测模型训练参数
超参数名称 | 具体设置 |
学习算法 | RMSprop |
学习率 | 0.001 |
损失函数 | MSE |
Dropout率 | 0.5 |
批次大小(batch size) | 128 |
时间步长 | 90 |
迭代次数 | 1000 |
LSTM-DCC股票市场预测模型的输入为上述3维张量,模型的输出为未来的股票市场相关数据;
在预测阶段使用与训练阶段相同的数据预处理过程,构建3维输入张量,其形状为(1,90,4),数据输入至LSTM-DCC股票市场预测模型中,最终得到预测结果。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (1)
1.一种基于深度学习的股票市场预测方法,包括以下步骤:
(1)数据预处理;
(1.1)特征筛选;
计算影响因素与股票市场时间序列的相关性,采用Pearson相关系数作为评价依据,Pearson相关系数用以度量两个变量之间的相关程度其计算公式如下:
<mrow>
<mi>r</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mi>C</mi>
<mi>o</mi>
<mi>v</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>&sigma;</mi>
<mi>x</mi>
<mi>&sigma;</mi>
<mi>y</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中r表示Pearson相关系数,取值范围为[-1,1],其中0表示不相关,其值越接近1则正相关性越大,越接近-1则是负相关性越大;x和y为两个数据特征变量;Cov(x,y)表示协方差,σx,σy表示标准差;
通过以上计算结果可以知道两个数据特征变量之间的相关程度,如上证指数与美国市场标普500的相关程度、上证指数与人民币-美元汇率的相关程度、上证指数与恒生指数的相关性;
Pearson相关系数的绝对值越接近0则相关程度越弱,r的值作为特征选择的依据,剔除弱相关性的相应特征即相关系数r的绝对值小于0.3;
(1.2)归一化处理;
由于股票市场序列数据与其他影响因素数据在数值上相差较大且有较到的波动,故必须对这些数据进行归一化处理,其方法是将各类数值缩放到同一尺度,其计算公式如下:
<mrow>
<msup>
<mi>x</mi>
<mo>*</mo>
</msup>
<mo>=</mo>
<mfrac>
<mrow>
<mi>x</mi>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>min</mi>
</msub>
</mrow>
<mrow>
<msub>
<mi>x</mi>
<mi>max</mi>
</msub>
<mo>-</mo>
<msub>
<mi>x</mi>
<mi>min</mi>
</msub>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中x为原始数值,xmin为当前维度所有数据中数值最小的值,xmax为当前维度所有数据中数值最大的值,x*为缩放后的数值;
(2)构建LSTM-DCC股票市场预测模型;
将长短期记忆网络LSTM和扩张因果卷积网络DCC相结合,设计了一种混合深度学习模型,称为LSTM-DCC网络,LSTM的任务是提取序列的粗粒度特征,并降低输入数据特征维度,DCC网络通过扩张卷积操作可以同时利用不同时间间隔长度的序列特征;
设股票市场时间序列数据为X=(xt,x2,...,xt-1,xt),xt是t时刻的股票市场,则股票市场预测问题即是根据已知时间序列数据X,求得xt+1时刻的最大似然估计p(x):
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>X</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mi>&Pi;</mi>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msup>
<mo>|</mo>
<msup>
<mi>x</mi>
<mn>1</mn>
</msup>
<mo>,</mo>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<msup>
<mi>x</mi>
<mi>t</mi>
</msup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
xt+1时刻的值将会完全利用到序列之前所有时间步信息;
针对多条件股票市场序列数据,则此时公式(3)以如下形式进行表示:
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>X</mi>
<mo>|</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mi>&Pi;</mi>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msup>
<mo>|</mo>
<msup>
<mi>x</mi>
<mn>1</mn>
</msup>
<mo>,</mo>
<msup>
<mi>x</mi>
<mn>2</mn>
</msup>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<msup>
<mi>x</mi>
<mi>t</mi>
</msup>
<mo>,</mo>
<msubsup>
<mi>y</mi>
<mn>1</mn>
<mn>1</mn>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>y</mi>
<mn>1</mn>
<mn>2</mn>
</msubsup>
<mo>,</mo>
<mn>...</mn>
<mo>,</mo>
<msubsup>
<mi>y</mi>
<mi>i</mi>
<mi>t</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中xt表示t时刻股市场,表示t时刻的第i个影响因素数据的值,则i=1,2,3,...,n表示有n个条件;
公式(3)与公式(4)是股票市场的预测目标,利用LSTM网络初步提取时间序列特征,将多变量时间序列输入通过LSTM网络降维后与DCNN网络连接,其t时刻计算过程如下:
it=sigmoid(Wxixt+Whiht-1+Wcict+bi) (5)
ft=sigmoid(Wxfxt+Whfht-1+Wcfct+bf) (6)
ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc) (7)
ot=sigmoid(Wxoxt+Whoht-1+Wcoct+bo) (8)
ht=ottanh(ct) (9)
其中xt表示t时刻的输入,it,ft,ot分别表示t时刻输入门、遗忘门、输出门的输出,ct表示t时刻记忆单元cell的输出,ht表示t时刻隐层输出,Wxi表示从输入层到输入门的连接权重,Whi表示从隐藏层到输入门的连接权重,Wci表示从记忆单元到输入门的连接权重,bi为其偏置项,Wxf表示从输入层到遗忘门的连接权重,Whf表示从隐藏层到遗忘门的连接权重,Wcf表示从记忆单元到遗忘门的连接权重,bf为其偏置项,Wxc表示从输入层到记忆单元的连接权重,Whc表示从隐藏层到记忆单元的连接权重,bc为其偏置项,Wxo表示从输入门到输出层的连接权重,Who表示从隐藏层到输出门的连接权重,Wco表示从记忆单元到遗忘门的连接权重,bo为其偏置项,根据it,ft,ot在[0,1]范围的取值,来控制历史信息在t时刻通过门结构的比例,sigmoid和tanh为激活函数。
以公式(8)的输出ht=ottanh(ct)作为DCCN部分的输入,扩张因果卷积神经网络利用禅茶学习通过堆叠残差连接块加深网络的深度,从而使网络可以获得更大的接受域,同时可以很好检测出数据微小的扰动;
在残差连接块的每层输入后使用批规范化,对每一层的输入重新进行归一化,避免极深网络而引起的梯度消失,使得网络可以很好的被训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711232195.2A CN107832897A (zh) | 2017-11-30 | 2017-11-30 | 一种基于深度学习的股票市场预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711232195.2A CN107832897A (zh) | 2017-11-30 | 2017-11-30 | 一种基于深度学习的股票市场预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107832897A true CN107832897A (zh) | 2018-03-23 |
Family
ID=61646855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711232195.2A Pending CN107832897A (zh) | 2017-11-30 | 2017-11-30 | 一种基于深度学习的股票市场预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107832897A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733909A (zh) * | 2018-05-16 | 2018-11-02 | 中国科学院遥感与数字地球研究所 | 一种冰盖融化区探测方法 |
CN109343367A (zh) * | 2018-10-26 | 2019-02-15 | 齐鲁工业大学 | 一种基于神经网络预测控制烟气脱硫的方法 |
CN109543716A (zh) * | 2018-10-23 | 2019-03-29 | 华南理工大学 | 一种基于深度学习的k线形态图像识别方法 |
CN109559163A (zh) * | 2018-11-16 | 2019-04-02 | 广州麦优网络科技有限公司 | 一种基于机器学习的模型构建方法及销售预测方法 |
WO2019205384A1 (zh) * | 2018-04-26 | 2019-10-31 | 平安科技(深圳)有限公司 | 电子装置、基于机器学习的股票择时方法及存储介质 |
WO2019214143A1 (zh) * | 2018-05-10 | 2019-11-14 | 平安科技(深圳)有限公司 | 服务器、金融时序数据的处理方法及存储介质 |
WO2019223133A1 (zh) * | 2018-05-25 | 2019-11-28 | 平安科技(深圳)有限公司 | 股市风险预测方法、装置、计算机设备及存储介质 |
WO2020000715A1 (zh) * | 2018-06-29 | 2020-01-02 | 平安科技(深圳)有限公司 | 基于指数特征提取的股指预测方法、服务器及存储介质 |
CN110705743A (zh) * | 2019-08-23 | 2020-01-17 | 国网浙江省电力有限公司 | 一种基于长短期记忆神经网络的新能源消纳电量预测方法 |
CN110782096A (zh) * | 2019-10-29 | 2020-02-11 | 山东科技大学 | 一种外汇时间序列预测方法 |
CN111652722A (zh) * | 2020-05-28 | 2020-09-11 | 杭州师范大学 | 一种基于人工神经网络的金融板块指数预测方法 |
WO2020186376A1 (en) * | 2019-03-15 | 2020-09-24 | State Street Corporation | Techniques to forecast financial data using deep learning |
CN111882157A (zh) * | 2020-06-24 | 2020-11-03 | 东莞理工学院 | 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 |
CN112418560A (zh) * | 2020-12-10 | 2021-02-26 | 长春理工大学 | 一种pm2.5浓度预测方法及系统 |
WO2021082810A1 (zh) * | 2019-10-29 | 2021-05-06 | 山东科技大学 | 一种外汇时间序列预测的构建方法 |
CN114971748A (zh) * | 2022-07-27 | 2022-08-30 | 阿里健康科技(中国)有限公司 | 预测数据生成、模型训练方法、计算机设备以及存储介质 |
-
2017
- 2017-11-30 CN CN201711232195.2A patent/CN107832897A/zh active Pending
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019205384A1 (zh) * | 2018-04-26 | 2019-10-31 | 平安科技(深圳)有限公司 | 电子装置、基于机器学习的股票择时方法及存储介质 |
WO2019214143A1 (zh) * | 2018-05-10 | 2019-11-14 | 平安科技(深圳)有限公司 | 服务器、金融时序数据的处理方法及存储介质 |
CN108733909A (zh) * | 2018-05-16 | 2018-11-02 | 中国科学院遥感与数字地球研究所 | 一种冰盖融化区探测方法 |
WO2019223133A1 (zh) * | 2018-05-25 | 2019-11-28 | 平安科技(深圳)有限公司 | 股市风险预测方法、装置、计算机设备及存储介质 |
WO2020000715A1 (zh) * | 2018-06-29 | 2020-01-02 | 平安科技(深圳)有限公司 | 基于指数特征提取的股指预测方法、服务器及存储介质 |
CN109543716B (zh) * | 2018-10-23 | 2021-12-21 | 华南理工大学 | 一种基于深度学习的k线形态图像识别方法 |
CN109543716A (zh) * | 2018-10-23 | 2019-03-29 | 华南理工大学 | 一种基于深度学习的k线形态图像识别方法 |
CN109343367A (zh) * | 2018-10-26 | 2019-02-15 | 齐鲁工业大学 | 一种基于神经网络预测控制烟气脱硫的方法 |
CN109559163A (zh) * | 2018-11-16 | 2019-04-02 | 广州麦优网络科技有限公司 | 一种基于机器学习的模型构建方法及销售预测方法 |
WO2020186376A1 (en) * | 2019-03-15 | 2020-09-24 | State Street Corporation | Techniques to forecast financial data using deep learning |
US11620589B2 (en) | 2019-03-15 | 2023-04-04 | State Street Corporation | Techniques to forecast financial data using deep learning |
CN110705743A (zh) * | 2019-08-23 | 2020-01-17 | 国网浙江省电力有限公司 | 一种基于长短期记忆神经网络的新能源消纳电量预测方法 |
CN110705743B (zh) * | 2019-08-23 | 2023-08-18 | 国网浙江省电力有限公司 | 一种基于长短期记忆神经网络的新能源消纳电量预测方法 |
CN110782096A (zh) * | 2019-10-29 | 2020-02-11 | 山东科技大学 | 一种外汇时间序列预测方法 |
WO2021082810A1 (zh) * | 2019-10-29 | 2021-05-06 | 山东科技大学 | 一种外汇时间序列预测的构建方法 |
CN111652722A (zh) * | 2020-05-28 | 2020-09-11 | 杭州师范大学 | 一种基于人工神经网络的金融板块指数预测方法 |
CN111882157A (zh) * | 2020-06-24 | 2020-11-03 | 东莞理工学院 | 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 |
CN112418560A (zh) * | 2020-12-10 | 2021-02-26 | 长春理工大学 | 一种pm2.5浓度预测方法及系统 |
CN112418560B (zh) * | 2020-12-10 | 2024-05-14 | 长春理工大学 | 一种pm2.5浓度预测方法及系统 |
CN114971748A (zh) * | 2022-07-27 | 2022-08-30 | 阿里健康科技(中国)有限公司 | 预测数据生成、模型训练方法、计算机设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832897A (zh) | 一种基于深度学习的股票市场预测方法 | |
Celik et al. | Evaluating and forecasting banking crises through neural network models: An application for Turkish banking sector | |
Widiputra et al. | Multivariate CNN‐LSTM Model for Multiple Parallel Financial Time‐Series Prediction | |
CN106886846A (zh) | 一种基于长短期记忆循环神经网络的银行网点备付金预测方法 | |
CN106384166A (zh) | 一种结合财经新闻的深度学习股市预测方法 | |
CN107481048A (zh) | 一种基于混合模型的金融品种价格预测方法及系统 | |
CN106503853A (zh) | 一种基于多标度卷积神经网络的外汇交易预测模型 | |
Matviychuk et al. | Neuro-fuzzy model of country's investment potential assessment | |
Xie et al. | Research based on stock predicting model of neural networks ensemble learning | |
Zhou et al. | Numerical solution for ruin probability of continuous time model based on neural network algorithm | |
Lv et al. | An improved long short-term memory neural network for stock forecast | |
Lee et al. | Hidden markov models for forex trends prediction | |
Fang | Adaptive neurofuzzy inference system in the application of the financial crisis forecast | |
Safi | A comparison of artificial neural network and time series models for forecasting GDP in Palestine | |
CN114255121A (zh) | 信贷风险预测模型的训练方法和信贷风险预测方法 | |
Li et al. | Financial risk prediction for listed companies using IPSO-BP neural network | |
Sudipa et al. | Trend Forecasting of the Top 3 Indonesian Bank Stocks Using the ARIMA Method | |
Wei et al. | Energy financial risk early warning model based on Bayesian network | |
Jia | Deep Learning Algorithm‐Based Financial Prediction Models | |
Chen et al. | Financial distress prediction using data mining techniques | |
CN116364203A (zh) | 一种基于深度学习的水质预测方法、系统和装置 | |
Zhao | Research on management model based on deep learning | |
Zhang | Research of default risk of commercial bank's personal loan based on rough sets and neural network | |
Du et al. | Design and Implementation of China Financial Risk Monitoring and Early Warning System Based on Deep Learning | |
CN114529063A (zh) | 一种基于机器学习的金融领域数据预测方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180323 |
|
RJ01 | Rejection of invention patent application after publication |