CN112132352A - 一种基于注意力以及密集连接的股价趋势预测方法 - Google Patents
一种基于注意力以及密集连接的股价趋势预测方法 Download PDFInfo
- Publication number
- CN112132352A CN112132352A CN202011041920.XA CN202011041920A CN112132352A CN 112132352 A CN112132352 A CN 112132352A CN 202011041920 A CN202011041920 A CN 202011041920A CN 112132352 A CN112132352 A CN 112132352A
- Authority
- CN
- China
- Prior art keywords
- data
- stock
- attention
- dense connection
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000007246 mechanism Effects 0.000 claims abstract description 18
- 230000004913 activation Effects 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 10
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 5
- 230000010339 dilation Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 14
- 238000000605 extraction Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 2
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于注意力以及密集连接的股价趋势预测方法,所述方法包括:获取待预测股票对应的若干价量数据;基于所述若干价量数据,确定所述预测股票对应的特征数据;基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。本申请通过若干价量数据,利用注意力机制和密集连接使得模型关注于若干价量数据的短期信息,从而提高预测股价趋势的准确性。同时,本申请仅需要股票的价量信息,使用简单,适用范围较广,可以广泛应用到投资决策的过程中。
Description
技术领域
本申请涉及趋势预测技术领域,特别涉及一种基于注意力以及密集连接的股价趋势预测方法。
背景技术
现有的股价建模技术主要是基于因子的,其中,多因子模型是由套利定价理论(APT)发展而来,其本质是将对股票预测转变成对于因子的收益预测。由于因子代表了不同个股的共性信息,相较于对个股建模更具有一般性,使得多因子模型成为了最为主流的趋势发现模型。
多因子模型的关键在于找到超越市场表现的Alpha因子来赚取超额收益。然而,根据有效市场假说(Efficient-Market Hypothesis,EMH),在法律健全、功能良好、透明度高、竞争充分的股票市场,一切有价值的信息已经及时、准确、充分地反映在股价走势当中,其中,包括企业当前和未来的价值,除非存在市场操纵,否则投资者不可能通过分析以往价格获得高于市场平均水平的超额利润。当一个Alpha因子被挖掘出来并使用,其信息也随之进入市场。当市场完全消化新因子的信息之后,根据有效市场假说,该因子终将失效。随着越来越多的新因子不断经过“发掘-使用-失效”的过程最终变为公开信息,发掘新的Alpha因子越来越难。
由于因子模型的局限性,已经有从业者开始使用基于机器学习的方法对股价建模。目前,已经有学者将决策树、聚类等传统机器学习方法运用到股价建模的任务中,并且取得了一定的效果。然而,这些方案相当依赖于输入数据的质量,比如在决策树中,通过研究上市公司的动态财务比率指标,包括公司营业利润等二十条财务比率变量,与公司个股相对收益率的内在关系来对股价进行建模。该方法要求大量财务数据,但是在实际应用中会遇到如下问题:(1)上市公司的财报公布频率较低;(2)财务数据可能造假;(3)不同种类的公司财务特征不同。在数据质量不好时,很难得到通用的、及时的、可靠的机器学习股价模型,进而影响实际应用的效果。
发明内容
本申请要解决的技术问题在于,针对现有技术的不足,提供一种基于注意力以及密集连接的股价趋势预测方法。
为了解决上述技术问题,本申请实施例第一方面提供了一种基于注意力以及密集连接的股价趋势预测方法,所述方法包括:
获取待预测股票对应的若干价量数据;
基于所述若干价量数据,确定所述预测股票对应的特征数据;
基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。
所述基于注意力以及密集连接的股价趋势预测方法,其中,所述若干价量数据为连续价量数据,并且每个价量数据对应的交易日期均早于所述预测股价趋势对应的交易日期。
所述基于注意力以及密集连接的股价趋势预测方法,其中,所述方法应用于股价趋势预测模型,所述股价趋势预测模型若干级联的残差模块,若干残差模块中的每个残差模块均包括时域单元以及密集连接单元;所述基于所述若干价量数据,确定所述预测股票对应的特征数据具体包括:
将若干价量数据作为输入数据,并将按照级联顺序位于最前的残差模块作为目标残差模块;
将该输入数据输入目标残差模块中的时域单元及密集连接单元,通过该时域单元确定输入数据对应的时域特征数据,并通过该密集连接单元确定输入数据对应的密集特征数据;
基于该输入数据、时域特征数据以及密集特征数据确定该输入数据对应的输出数据;
将该输出数据作为输入数据,将按照级联顺序位于目标残差模块后的残差模块作为目标残差模块;
继续执行将该输入数据输入目标残差模块中的时域单元及密集连接单元,直至目标残差模块为最后的残差模块,以得到所述预测股票对应的特征数据。
所述基于注意力以及密集连接的股价趋势预测方法,其中,所述时域卷积单元包括若干级联的时域扩张卷积块,若干级联的时域扩张卷积块中的每个时域卷积块均包括时域扩张卷积层、第一正则化层以及第一激活层,所述时域扩张卷积层与所述第一正则层相连接,所述第一正则层与所述第一激活层相连接。
所述基于注意力以及密集连接的股价趋势预测方法,其中,所述密集连接单元包括若干级联的密集连接块,若干级联的密集连接块中的每个密集连接块均包括密集连接层、第二正则化层以及第二激活层,所述时域扩张卷积层与所述第二正则层相连接,所述第二正则层与所述第二激活层相连接。
所述基于注意力以及密集连接的股价趋势预测方法,其中,所述若干级联的密集连接块与若干级联的时域扩张卷积块一一对应,对于每个密集连接块,该密集连接块中的密集连接层对应的密集连接数据为基于该密集连接块对应的时域扩张卷积块对应的膨胀系数确定。
所述基于注意力以及密集连接的股价趋势预测方法,其中,若干残差模块中的各残差模块包括的时域卷积单元中的时域扩张卷积块配置的膨胀系数互不相同,且各时域扩张卷积块配置的膨胀系数按照残差模块的级联顺序增大。
所述基于注意力以及密集连接的股价趋势预测方法,其中,所述方法应用于股价趋势预测模型,所述股价趋势预测模型包括注意力模块,所述注意力模块配置有时域注意力机制,所述基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势具体为:
将所述特征数据输入所述注意力模块,通过所述注意力模块输出所述待预测股票对应的预测股价趋势。
本申请实施例第二方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的基于注意力以及密集连接的股价趋势预测方法中的步骤。
一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如上任一所述的基于注意力以及密集连接的股价趋势预测方法中的步骤。
有益效果:与现有技术相比,本申请提供了一种基于注意力以及密集连接的股价趋势预测方法,所述方法包括:获取待预测股票对应的若干价量数据;基于所述若干价量数据,确定所述预测股票对应的特征数据;基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。本申请通过若干价量数据,利用注意力机制和密集连接使得模型关注于若干价量数据的短期影响,从而提高预测股价趋势的准确性。同时,本申请仅需要股票的价量信息,使用简单,适用范围较广,可以广泛应用到投资决策的过程中。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在不符创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为1日对应的股价趋势的短期效应和时间衰减特性的示意图。
图2为5日对应的股价趋势的短期效应和时间衰减特性的示意图。
图3为10日对应的股价趋势的短期效应和时间衰减特性的示意图。
图4为本申请提供的基于注意力以及密集连接的股价趋势预测方法的流程图。
图5为本申请提供的基于注意力以及密集连接的股价趋势预测方法的流程原理图。
图6为本申请提供的终端设备的结构原理图。
具体实施方式
本申请提供一种基于注意力以及密集连接的股价趋势预测方法,为使本申请的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本申请进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
发明人经过研究发现,由于因子模型的局限性,已经有从业者开始使用基于机器学习的方法对股价建模。目前,已经有学者将决策树、聚类等传统机器学习方法运用到股价建模的任务中,并且取得了一定的效果。然而,这些方案相当依赖于输入数据的质量,比如在决策树中,通过研究上市公司的动态财务比率指标,包括公司营业利润等二十条财务比率变量,与公司个股相对收益率的内在关系来对股价进行建模。该方法要求大量财务数据,但是在实际应用中会遇到如下问题:(1)上市公司的财报公布频率较低;(2)财务数据可能造假;(3)不同种类的公司财务特征不同。在数据质量不好时,很难得到通用的、及时的、可靠的机器学习股价模型,进而影响实际应用的效果。
发明人对A股市场的主要个股进行了统计分析,按照日的收益率情况,将个股分为两组:胜者组(Winner):t日的收益率为正,败者组(Loser):t日的收益率为负。根据t日的收益率信息,在t+1日分别对两组中的个股进行等额买入,持仓n日,在t+1+n日买出,统计两组的累积收益率,结果如图1-3所示。在如图1-3中,曲线A为胜者组的累积收益率,曲线B是败者组的累积收益率,对应了图中左侧的坐标轴,曲线C是胜者组与败者组的收益率之差,对应了图中右侧的坐标轴。
如图1所示,当n=1时,曲线A明显大于曲线B,两者的差值显著大于零,说明在这个周期中股市表现为动量效应,即t日表现好的个股在t+2日表现依然很好。如图2所示,当n=5时,曲线A明显小于曲线B,两者的差值显著小于零,说明在这个周期中股市表现为反转效应,即t日表现好的个股在t+6日表现变差,t日的影响反转。如图3所示,当n=10时,曲线A和曲线B没有显著差别,两者的差值接近于零,说明t日表现的影响在t+11日已经减弱直至消失。
当n=1时,两组累积收益率的差值为正且绝对值最大;当n=5时,两组累积收益率的差值为负且绝对值相对减小;当n=10时,两组累积收益率的差值基本为零。这说明t日的收益率信息对未来的股价波动趋势产生了影响,且随着时间流逝,这种影响的方向产生变化且趋势不断减弱。由此可知,短期信息为股价波动趋势的预测的影响因素,从而在预测股价趋势时可以注重于关注股市的短期效应。
神经网络基于层次化结构,每一层有大量的神经元构成,不同层的神经元通过连接关联到一起,浅层的神经元提取到数据的浅层特征,深层的神经元提取到数据的深层特征;通过将多层神经元叠加,神经网络可以捕获输入数据的细致特征,以此来学习数据的分布。通常情况下,不同层之间的连接往往是均匀的,下一层接收到上一层的信息也是均匀的。然而,由于股价波动往往对短期信息十分敏感,从而模型需要可以关注于股价的短期表现。而对于神经网络来说,深层网络希望获得上一层更多的短期信息,即上一层的近邻点。然而,普通网络连接的均匀分布很难产生类似的效果。
基于此,在本申请实施例的一个应用场景中,本实施例提供的一种基于注意力以及密集连接的股价趋势预测方法可以应用于股价趋势预测模型,所述股价趋势预测模型配置有密集连接,并通过股价趋势预测模型获取待预测股票对应的若干价量数据;基于所述若干价量数据,确定所述预测股票对应的特征数据;基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。这样使其深层节点能接收到更多来自浅层的近邻点信息,以此来加强网络对股价时间序列短期表现的学习,提高股价趋势预测模型的预测效果,同时可以提高预测股价趋势的准确性。
下面结合附图,通过对实施例的描述,对申请内容作进一步说明。
本实施提供了一种基于注意力以及密集连接的股价趋势预测方法,如图4和图5所示,所述方法包括:
S10、获取待预测股票对应的若干价量数据。
具体地,所述待预测股票可以为股市中的任一股票,所述若干价量数据中的每个价量数据均为该待预测股票过去交易日的价量数据。可以理解的是,若干价量数据中的每个价量数据对应的交易日期均早于所述预测股价趋势对应的交易日期。例如,待预测股票对应的预测股价趋势对应的交易日为2020年9月22日,若干价量数据包括价量数据A和价量数据B,那么价量数据A对应的交易日和价量数据B对应的交易日均早于2020年9月22日,如,价量数据A对应的交易日为2020年9月18日,价量数据B对应的交易日为2020年9月17日。
此外,所述若干价量数据为连续价量数据,其中,所述连续价量数据指的是当将若干价量数据按照时间顺序排列时,相邻两个价量数据各自对应的交易日期相邻。例如,价量数据A和价量数据B为相邻的两个价量数据,并且价量数据B的交易日期晚于价量数据A的交易日期,那么价量数据A对应的交易日期为2020年9月17日,价量数据B对应的交易日期为2020你那9月18日。在本实施例的一个具体实现方式中,若干价量数据可以包括预测股价趋势对应的交易日期之前一年内的各交易日期对应的价量数据,其中,所述价量数据可以包括开盘价,最高价,最低价、收盘价、成交量、换手率、股票代码、交易日期、市净率、市销率、股息以及市盈率中的一种或者多种。
S20、基于所述若干价量数据,确定所述预测股票对应的特征数据。
具体地,所述特征数据用于反映若干价量数据的短期信息,所述特征数据可以采用数据向量形式,并且所述数据向量包括的数据元素的数量与所述若干价量数据的数据量相等。换句话说,所述特征数据对应的数据量与所述若干价量数据的数据量相同,其中,所述若干价量数据的数据量指的是若干价量数据包括的价量数据的个数。
在本实施例的一个实现方式中,所述方法应用于股价趋势预测模型,所述股价趋势预测模型若干级联的残差模块,若干残差模块中的每个残差模块均包括时域单元以及密集连接单元;所述基于所述若干价量数据,确定所述预测股票对应的特征数据具体包括:
将若干价量数据作为输入数据,并将按照级联顺序位于最前的残差模块作为目标残差模块;
将该输入数据输入目标残差模块中的时域单元及密集连接单元,通过该时域单元确定输入数据对应的时域特征数据,并通过该密集连接单元确定输入数据对应的密集特征数据;
基于该输入数据、时域特征数据以及密集特征数据确定该输入数据对应的输出数据;
将该输出数据作为输入数据,将按照级联顺序位于目标残差模块后的残差模块作为目标残差模块;
继续执行将该输入数据输入目标残差模块中的时域单元及密集连接单元,直至目标残差模块为最后的残差模块,以得到所述预测股票对应的特征数据。
具体地,所述若干残差模块依次级联构成所述股价趋势预测模型的特征提取结构,通过所述特征提取结构确定若干价量数据对应的特征数据。可以理解的是,若干价量数据为特征提取结构的输入项,特征数据为特征提取结构的输出项,并且特征提取结构的输入项的数据维度与输出项的数据维度相同。由此,在将若干价量数据输入特征提取结构之前,可以对若干价量数据转换为价量数据向量,价量数据向量的向量维度与所述若干价量数据的数据量相同,并且价量数据向量的向量维度与所述特征数据的向量维度相同。
在本实施例的一个实现方式中,所述若干残差模块的模型结构相同,但各残差模块配置的模型参数不相同,例如,若干残差模块包括残差模块A和残差模块B,那么残差模块A包括的网络层结构与残差模块B包括的网络层结构相同,残差模块A中的网络层配置的网络参数与残差模块B中的网络层配置的网络参数不相同。若干残差模块中位于最前的残差模块的输入项为若干家了数据,相邻两个残差模块中前一残差模块的输出项为后一残差模块的输入项,最后一个残差模块的输出项为特征数据。
在本实施例的一个实现方式中,残差模块包括时域单元以及密集连接单元,所述时域单元与所述密集连接单元,所述时域单元的输入项和密集连接单元的输入项相同,所述数据单元的输出项、密集连接单元的输出项以及时域单元的输入项进行残差运算,残差运算得到的数据为残差模块的输出项。由此,在一个具体实现方式中,所述残差模块包括残差单元,所述残差单元的输入项为时域单元的输出项,密集连接单元的输出项以及时域单元/密集连接单元的输入项(时域单元的输入项和密集连接单元的输入项相同),残差单元的输出项为残差模块的输出项。例如,残差模块的输出项记为y,时域单元的输出项记为F(x),密集连接单元的输出项记为G(x),时域单元和密集连接单元的输入项相同,记为x,那么残差模块的输出项可以表示为:y=F(x)+G(x))+k*x,其中,k为权重参数。此外,在实际应用中,所述残差模块还可以包括激活函数层,所述激活函数层可以配置有ReLU函数。
所述时域单元包括所述时域卷积单元包括若干级联的时域扩张卷积块,若干级联的时域扩张卷积块中的每个时域卷积块均包括时域扩张卷积层、第一正则化层以及第一激活层,所述时域扩张卷积层与所述第一正则层相连接,所述第一正则层与所述第一激活层相连接。本实施例中的时域卷积单元采用时域扩张卷积层,所述时域卷积为单边卷积,在计算时仅适用当前节点与其过程一次的节点进行运行,这样可以避免普通的时域卷积在处理时间序列问题时不能获得足够大的感受野。这样由于普通的卷积层的感受野随着层数增加而线性增加,对于一维时域卷积,其感受野大小ReceptiveField可以为ReceptiveField=(k-1)×l+1;其中,k为卷积核的大小,l为网络的深度(卷积层的层数)。而本实施例中的时域扩张卷积的卷积操作为:
其中,d为膨胀系数,k为卷积核的大小,f(i)表示卷积核的第i个元素的值;*d f表示进行膨胀系数为d的扩张卷积操作;d为膨胀系数。
在本实施例的一个实现方式,所述d取值随着层数增加指数级上升,以使得感受野可以随着层数增加指数级别扩大。例如,第一时域扩张卷积层的膨胀系数为2^1=2,第二时域扩张卷积层的膨胀系数为2^2=4,第三时域扩张卷积层的膨胀系数为2^3=8。
时域扩张卷积的感受野随着层数增加指数级别扩大,而对于较高的层其连接会变的非常稀疏,这可能造成股价趋势预测模型忽略深层紧邻点的信息。然而,这些深层紧邻点会蕴涵了股价时间序列的短期信息,摈弃短期信息在基于股价时间序列进行股票趋势预测中具有很重要的影响。基于此,所述残差模块包括密集连接单元,通过密集连接单元自适应的调整连接密度,使得连接在深层近邻点处稠密,在偏远点处稀疏,这样使得股票趋势预测侧重于学习短期信息,从而可以提高股票趋势预测的模型效果,从而可以提高预测股价趋势的准确性。
在本实施例的一个实现方式中,所述密集连接单元包括若干级联的密集连接块,若干级联的密集连接块中的每个密集连接块均包括密集连接层、第二正则化层以及第二激活层,所述时域扩张卷积层与所述第二正则层相连接,所述第二正则层与所述第二激活层相连接。所述密集连接单元与所述时域扩张单元一起工作,又由于不同时域扩张卷积层配置的膨胀系数不同,其中,时域扩张卷积层的层数越高,配置膨胀系数越大,相应的,对于短期信息的提取表现的越为稀疏。由此,为每个时域扩张卷层块配置一个密集连接块,即若干级联的密集连接块与若干级联的时域扩张卷积块一一对应,对于每个密集连接块,该密集连接块中的密集连接层对应的密集连接数据为基于该密集连接块对应的时域扩张卷积块对应的膨胀系数d确定。在本实施例的一个具体实现方式中,所述时域单元中的时域扩张卷积块的数量和密集连接单元中的密集连接块的数量均为2。
若干残差模块中的各残差模块包括的时域卷积单元中的时域扩张卷积块配置的扩张系数互不相同,且各时域扩张卷积块配置的扩张系数按照残差模块的级联顺序增大。可以累积的是,所述密集连接的数量基于其对应的时域扩张卷积层的膨胀系数确定,在本实施例的一个具体实现方式中,所述密集连接的数量可以等于其对应的膨胀系数-1。例如,密集连接层对应的时域扩张卷积层的膨胀系数为8,那么密集连接层包括的密集连接数量为8-1=7。
基于此,在本实施例的一个实现方式中,序列元素t上的密集连接操作G可以表示为:
其中,d表示膨胀因子,t-i表示过去t-i时刻,g(i)表示密集连接的第i个元素的值。
S30、基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。
具体地,所述预测股价趋势用于反映待预测股票的股票价格的变化趋势,其中,所述预测股价趋势包括涨趋势或跌趋势,涨趋势指的是相对于过去相邻交易日的股票价格的变化趋势为涨;跌趋势指的是相对于过去相邻交易日的股票价格的变化趋势为跌。例如,预测股票趋势为获取该预测股票趋势为若干价量数据中按照时间顺序最后一个价量数据的下一交易日的股票价格涨趋势,或者跌趋势。
其中,CloseT为T日的收盘价
在本实施例的一个实现方式中,所述股价趋势预测模型包括注意力模块,所述注意力模块配置有时域注意力机制,所述基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势具体为:
将所述特征数据输入所述注意力模块,通过所述注意力模块输出所述待预测股票对应的预测股价趋势。
在改变连接密度的基础上,我们还引入了注意力机制来提高模型的性能。注意力机制是一种针对时间序列建模的有效方法[9,10,11],通过学习一个归一化权重,使网络为不同的特征赋权,筛选有用的信息。注意力机制的表述如下:
其中,W为权重系数,b为偏置,αt,βt为中间变量,γ为网络最终输出(预测股价趋势)。这样通过改变连接密度与注意力机制相结合,股价趋势预测模型可以更好的拟合股价变动,提高预测股价趋势的准确性。
综上所述,本实施例提供了一种基于注意力以及密集连接的股价趋势预测方法,所述方法包括:获取待预测股票对应的若干价量数据;基于所述若干价量数据,确定所述预测股票对应的特征数据;基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。本申请通过若干价量数据,利用注意力机制和密集连接使得模型关注于若干价量数据的短期信息,从而提高预测股价趋势的准确性。同时,本申请仅需要股票的价量信息,使用简单,适用范围较广,可以广泛应用到投资决策的过程中。
基于上述基于注意力以及密集连接的股价趋势预测方法,本实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述实施例所述的基于注意力以及密集连接的股价趋势预测方法中的步骤。
基于上述基于注意力以及密集连接的股价趋势预测方法,本申请还提供了一种终端设备,如图6所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(Communications Interface)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。
此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
此外,上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述方法包括:
获取待预测股票对应的若干价量数据;
基于所述若干价量数据,确定所述预测股票对应的特征数据;
基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势。
2.根据权利要求1所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述若干价量数据为连续价量数据,并且每个价量数据对应的交易日期均早于所述预测股价趋势对应的交易日期。
3.根据权利要求1-2任一所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述方法应用于股价趋势预测模型,所述股价趋势预测模型若干级联的残差模块,若干残差模块中的每个残差模块均包括时域单元以及密集连接单元;所述基于所述若干价量数据,确定所述预测股票对应的特征数据具体包括:
将若干价量数据作为输入数据,并将按照级联顺序位于最前的残差模块作为目标残差模块;
将该输入数据输入目标残差模块中的时域单元及密集连接单元,通过该时域单元确定输入数据对应的时域特征数据,并通过该密集连接单元确定输入数据对应的密集特征数据;
基于该输入数据、时域特征数据以及密集特征数据确定该输入数据对应的输出数据;
将该输出数据作为输入数据,将按照级联顺序位于目标残差模块后的残差模块作为目标残差模块;
继续执行将该输入数据输入目标残差模块中的时域单元及密集连接单元,直至目标残差模块为最后的残差模块,以得到所述预测股票对应的特征数据。
4.根据权利要求3所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述时域卷积单元包括若干级联的时域扩张卷积块,若干级联的时域扩张卷积块中的每个时域卷积块均包括时域扩张卷积层、第一正则化层以及第一激活层,所述时域扩张卷积层与所述第一正则层相连接,所述第一正则层与所述第一激活层相连接。
5.根据权利要求4所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述密集连接单元包括若干级联的密集连接块,若干级联的密集连接块中的每个密集连接块均包括密集连接层、第二正则化层以及第二激活层,所述时域扩张卷积层与所述第二正则层相连接,所述第二正则层与所述第二激活层相连接。
6.根据权利要求5所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述若干级联的密集连接块与若干级联的时域扩张卷积块一一对应,对于每个密集连接块,该密集连接块中的密集连接层对应的密集连接数据为基于该密集连接块对应的时域扩张卷积块对应的膨胀系数确定。
7.根据权利要求4所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,若干残差模块中的各残差模块包括的时域卷积单元中的时域扩张卷积块配置的膨胀系数互不相同,且各时域扩张卷积块配置的膨胀系数按照残差模块的级联顺序增大。
8.根据权利要求1-2任一所述基于注意力以及密集连接的股价趋势预测方法,其特征在于,所述方法应用于股价趋势预测模型,所述股价趋势预测模型包括注意力模块,所述注意力模块配置有时域注意力机制,所述基于时域注意力机制以及所述特征数据,确定所述待预测股票对应的预测股价趋势具体为:
将所述特征数据输入所述注意力模块,通过所述注意力模块输出所述待预测股票对应的预测股价趋势。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-8任意一项所述的基于注意力以及密集连接的股价趋势预测方法中的步骤。
10.一种终端设备,其特征在于,包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如权利要求1-8任意一项所述的基于注意力以及密集连接的股价趋势预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011041920.XA CN112132352A (zh) | 2020-09-28 | 2020-09-28 | 一种基于注意力以及密集连接的股价趋势预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011041920.XA CN112132352A (zh) | 2020-09-28 | 2020-09-28 | 一种基于注意力以及密集连接的股价趋势预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112132352A true CN112132352A (zh) | 2020-12-25 |
Family
ID=73844344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011041920.XA Pending CN112132352A (zh) | 2020-09-28 | 2020-09-28 | 一种基于注意力以及密集连接的股价趋势预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132352A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114648102A (zh) * | 2022-05-24 | 2022-06-21 | 华东交通大学 | 火灾报警方法、系统、可读存储介质及计算机设备 |
-
2020
- 2020-09-28 CN CN202011041920.XA patent/CN112132352A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114648102A (zh) * | 2022-05-24 | 2022-06-21 | 华东交通大学 | 火灾报警方法、系统、可读存储介质及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Matsunaga et al. | Exploring graph neural networks for stock market predictions with rolling window analysis | |
Singh et al. | How are reinforcement learning and deep learning algorithms used for big data based decision making in financial industries–A review and research agenda | |
US6735580B1 (en) | Artificial neural network based universal time series | |
Yun et al. | Interpretable stock price forecasting model using genetic algorithm-machine learning regressions and best feature subset selection | |
Ludwig | Robust estimation of shape-constrained state price density surfaces | |
CN111489259A (zh) | 一种基于深度学习的股票市场风险预测智能实现方法 | |
Kroha et al. | Hurst Exponent and Trading Signals Derived from Market Time Series. | |
CN112132356A (zh) | 一种基于时空图注意力机制的股价预测方法 | |
Li et al. | Stock trading strategies based on deep reinforcement learning | |
Alkhodhairi et al. | Bitcoin candlestick prediction with deep neural networks based on real time data | |
Dong et al. | Cost index predictions for construction engineering based on LSTM neural networks | |
Mahadik et al. | Stock price prediction using lstm and arima | |
Aaryan et al. | Forecasting stock market price using LSTM-RNN | |
CN112132352A (zh) | 一种基于注意力以及密集连接的股价趋势预测方法 | |
Sharma et al. | Data visualization and stock market and prediction | |
KR102409041B1 (ko) | 액터 크리틱 모델을 이용한 포트폴리오 자산배분 강화학습방법 | |
KR102614595B1 (ko) | 실시간 거시지표 예측 기반 주가 예측 시스템 | |
EP3739517A1 (en) | Image processing | |
Liashenko et al. | Neural Networks in Application to Cryptocurrency Exchange Modeling. | |
Myint et al. | Time Series Forecasting System for Stock Market Data | |
Park et al. | Improved predictive deep temporal neural networks with trend filtering | |
Yao et al. | A foreign exchange portfolio management mechanism based on fuzzy neural networks | |
Worth | Painting2auction: Art price prediction with a siamese cnn and lstm | |
Chaturvedi et al. | A Neural Stock Price Predictor using Quantitative Data. | |
US12002129B1 (en) | Systems and methods of generating a display data structure from an input signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201225 |
|
RJ01 | Rejection of invention patent application after publication |