CN109360097A - 基于深度学习的股票预测方法、装置、设备及存储介质 - Google Patents

基于深度学习的股票预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109360097A
CN109360097A CN201811144154.2A CN201811144154A CN109360097A CN 109360097 A CN109360097 A CN 109360097A CN 201811144154 A CN201811144154 A CN 201811144154A CN 109360097 A CN109360097 A CN 109360097A
Authority
CN
China
Prior art keywords
stock
prediction
deep learning
data
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811144154.2A
Other languages
English (en)
Inventor
任江涛
陈兆鹏
梁华淇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN201811144154.2A priority Critical patent/CN109360097A/zh
Publication of CN109360097A publication Critical patent/CN109360097A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于深度学习的股票预测方法,包括:获取目标股票和关联股票的最新交易数据,生成所述最新交易数据对应的多维特征矩阵,将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,本发明还公开了一种基于深度学习的股票预测装置、基于深度学习的股票预测设备和存储介质,本发明通过先利用复合神经网络中的卷积神经网络学习目标股票和关联股票的交易数据的特征,再将特征输入到复合神经网络中的长短期记忆网络进行处理,得到对股票涨跌的预测,提供了一种基于深度学习和群体智能的股票预测方法,可以准确地预测股票的涨跌。

Description

基于深度学习的股票预测方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于深度学习的股票预测方法、基于深度学习的股票预测装置、基于深度学习的股票预测设备及计算机存储介质。
背景技术
股票预测是指利用股票相关信息,预测其在未来一段时间内的涨跌情况;深度神经网络在图像处理或者自然语言处理方面有了很深度的应用,但是在股票预测领域的研究和应用才刚刚起步。
LSTM是长短期记忆网络,是一种特殊的RNN结构,用于解决序列问题中的长期依赖问题。现有技术中有一种基于LSTM模型的股票预测算法,抽取市场信息的关键特征,适用于周期性强的序列数据,解决长期依赖问题,
由于市场信息会形成市场预期从而对股票价格产生影响,所以市场信息数据经常被输入到神经网络进行处理,以进行股票预测。但是,市场信息数种类繁多且数据量过于庞大,市场信息一方面包括国家政策影响,行业热度,或者市场信心等宏观因素,另一方面对于单只股票而言,包括股票自身价格信息、上市公司披露的相关操作盈利情况和舆情反馈等,所以基于对市场信息的一般的处理和分析不能很好的对单只股票的涨跌情况作出准确的预测。此外,仅使用市场信息而非真实交易数据对股票进行预测,其准确度不高,实际应用价值较低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于深度学习的股票预测方法、基于深度学习的股票预测装置、基于深度学习的股票预测设备和计算机存储介质,旨在解决现有技术中仅使用市场信息而非真实交易数据对股票进行预测,其准确度不高,实际应用价值较低的技术问题。
为实现上述目的,本发明提供一种基于深度学习的股票预测的方法,所述基于深度学习的股票预测的方法包括如下步骤:
获取目标股票和关联股票的最新交易数据;
生成所述最新交易数据对应的多维特征矩阵;
将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,其中,所述复合神经网络的参数由所述目标股票和所述关联股票的历史交易数据训练得到,所述关联股票与所述目标股票相关联。
优选地,所述获取所述目标股票和所述关联股票的最新交易数据的步骤之前还包括:
获取目标股票和关联股票的历史交易数据;
生成所述历史交易数据对应的多维特征矩阵;
将所述历史交易数据对应的多维特征矩阵输入复合神经网络进行训练,得到训练后的复合神经网络,其中,所述复合神经网络包括卷积神经网络和长短期记忆循环神经网络。
优选地,所述将所述历史交易数据对应的多维特征矩阵输入复合神经网络进行训练,得到训练后的复合神经网络的步骤包括:
将所述历史交易数据对应的多维特征矩阵输入所述卷积神经网络进行处理,得到所述历史交易数据对应的特征向量;
将所述历史交易数据对应的特征向量输入所述长短期记忆循环神经网络进行处理,得到所述目标股票的预测结果;
基于所述预测结果采用反向传播算法更新所述卷积神经网络和所述长短期记忆循环神经网络的参数,得到训练后的复合神经网络。
优选地,所述生成所述历史交易数据对应的多维特征矩阵的步骤包括:
将所述历史交易数据以预设时间间隔划分为多组子数据;
根据各组所述子数据生成各个多维特征矩阵;
所述将所述历史交易数据对应的多维特征矩阵输入卷积神经网络进行处理,得到所述历史交易数据对应的特征向量的步骤包括:
分别将各个所述多维特征矩阵输入卷积神经网络进行处理,得到所述历史交易数据对应的各个特征向量。
优选地,所述将所述历史交易数据对应的特征向量输入复合神经网络进行处理,得到所述目标股票的预测结果的步骤包括:
获取预设时间间隔内的股票属性数据,并根据所述股票属性数据生成对应的特征向量,其中,所述股票属性数据包括最高价,最低价,开盘价,收盘价,清仓数量,清仓比例,建仓数量,建仓比例,大单数量,大单比例,总的交易股数;
将所述股票属性数据对应的特征向量和所述历史交易数据对应的特征向量拼接成输入特征向量;
将所述输入特征向量输入所述长短期记忆循环神经网络进行处理,得到所述目标股票的预测结果。
优选地,所述历史交易数据包括:
交易笔数、买入股数和卖出股数。
优选地,所述获取目标股票和关联股票的最新交易数据的步骤之前还包括:
获取上市公司信息,所述上市公司信息包括上市公司名称、上市公司所属行业和上市公司控股信息;
根据所述上市公司信息生成知识图谱;
确定目标股票,并根据所述知识图谱确定关联股票,其中,所述关联股票和所述目标股票相关联。
此外,为实现上述目的,本发明还提供基于深度学习的股票预测装置,该装置包括:
获取模块,所述获取模块用于获取目标股票和关联股票的最新交易数据;
特征生成模块,所述特征生成模块用于生成所述最新交易数据对应的多维特征矩阵;
预测模块,所述预测模块用于将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,其中,所述复合神经网络的参数由所述目标股票和所述关联股票的历史交易数据训练得到,所述关联股票与所述目标股票相关联。
此外,为实现上述目的,本发明还提供基于深度学习的股票预测设备,该设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的股票预测处理程序,所述基于深度学习的股票预测处理程序被所述处理器执行时实现如上所述的基于深度学习的股票预测方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机存储介质,其特征在于,所述计算机存储介质上存储有基于深度学习的股票预测处理程序,所述基于深度学习的股票预测处理程序被处理器执行时实现如上所述的基于深度学习的股票预测方法的步骤。
本发明实施例提出的一种基于深度学习的股票预测方法、基于深度学习的股票预测装置、基于深度学习的股票预测设备和计算机存储介质,获取目标股票和关联股票的最新交易数据,生成所述最新交易数据对应的多维特征矩阵,将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果。本发明通过先利用复合神经网络中的卷积神经网络学习目标股票和关联股票的交易数据的特征,再将特征输入到复合神经网络中的长短期记忆网络进行处理,得到对股票涨跌的预测,提供了一种基于深度学习和群体智能的股票预测方法,可以准确地预测股票的涨跌。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明基于深度学习的股票预测方法第一实施例的流程示意图;
图3为本发明基于深度学习的股票预测方法中的复合神经网络结构示意图;
图4为本发明基于深度学习的股票预测方法第二实施例的流程示意图;
图5为本发明基于深度学习的股票预测装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的服务器(又叫事件处理设备,其中,事件处理设备可以是由单独的事件处理装置构成,也可以是由其他装置与事件处理装置组合形成)结构示意图。
本发明实施例服务器指一个管理资源并为用户提供服务的计算机,通常分为文件服务器、数据库服务器和应用程序服务器。运行以上软件的计算机或计算机系统也被称为服务器。相对于普通PC(personal computer)个人计算机来说,服务器在稳定性、安全性、性能等方面都要求较高;如图1所示,该服务器可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),网络接口1004,用户接口1003,存储器1005,通信总线1002、芯片组、磁盘系统、网络等硬件等。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WIFI接口)。存储器1005可以是高速随机存取存储器(random access memory,RAM),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,服务器还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除WiFi外,蓝牙、探针、3G/4G/5G(前面的数字表示的是蜂窝移动通信网络的代数。就是表示是第几代的网络。英文字母G表示generation)联网基站设备等等。本领域技术人员可以理解,图1中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,如RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的服务器中,网络接口1004主要用于连接后台数据库,与后台数据库进行数据通信;用户接口1003主要用于连接客户端(客户端,又叫用户端或终端,本发明实施例终端可以固定终端,也可以是移动终端,在此不再赘述),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的事件处理方法中的步骤。
参照图2,本发明第一实施例提供一种基于深度学习的股票预测方法,所述方法包括:
步骤S10,获取目标股票和关联股票的最新交易数据。
目标股票为待预测涨跌的股票,关联股票为和目标股票相关联的股票,最新交易数据包括交易笔数、买入股数和卖出股数。最新交易数据是指当天和当天之前一段时间内的交易数据,可以对最新交易数据所包含的天数进行设置,比如设置为30天,本实施例不对其进行限制。
先确定待预测的目标股票,再通过获取上市公司信息和对其的分析处理确定关联股票,其中,上市公司信息包括上市公司名称、上市公司所属行业和上市公司控股信息。
具体地,爬取所有上市公司、行业作为节点输入到基于Neo4j的图数据库中,然后将公司之间的控股、公司所属行业、公司上下游作为边输入,形成一个完整的公司知识图谱数据库。通过随机游走算法,计算出所有公司节点的节点向量,然后通过计算所有节点与目标股票所属公司的节点的余弦相似度,抽取余弦相似度最大的N个节点,作为与目标股票关系最密切的N只关联股票。
步骤S20,生成所述最新交易数据对应的多维特征矩阵。
需要说明的是,使用最新交易数据输入复合神经网络进行处理以获得对目标股票涨跌的预测,使用历史交易数据输入复合神经网络进行训练,以获得复合神经网络的最优参数,而最新交易数据和历史交易数据所包含的数据信息种类是相同的,同时,最新交易数据对应的多维特征矩阵的生成方法和历史交易数据对应的多维特征矩阵的生成方法也是相同的,将最新交易数据和历史交易数据统称为交易数据,下面介绍交易数据对应的多维特征矩阵的生成方法。
在生成交易数据对应的多维特征矩阵时,需要将交易数据以天为单位划分为多组子数据,根据各组子数据生成各个多维特征矩阵。
由于各组短数据为每天的交易数据,而每天的交易数据包含数目众多的客户的交易数据,为了降低交易数据对应的多维特征矩阵的维数,需要先将数目众多的客户按照一定的规则进行分类。例如按照客户交易活跃度、客户盈亏或者客户平均交易金额大小对客户进行分类。
在获得客户的分类后,在处理每组子数据的过程中,先将子数据按照股票进行分类,再将每支股票的数据按照分类后的客户进行数据的统计,例如统计出每类客户的交易笔数、买入股数和卖出股数。最后根据这些统计数据生成三维特征矩阵,特征矩阵的三维分别为:交易数据所包含的信息的种类、目标股票或关联股票以及客户种类。
需要说明的是,由于特征矩阵中不同信息种类之间的数值大小相差较大,需要对特征矩阵中的数值进行归一化处理。优选地,根据以下公式对特征矩阵中的数值进行归一化处理,其中X为待归一化的特征矩阵中的数值,Amax为特征矩阵中的最大值,Amin为特征矩阵中的最小值,Y为归一化后的值。
Y=(X-Amin)/(Amax-Amin)
步骤S30,将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,其中,所述复合神经网络的参数由所述目标股票和所述关联股票的历史交易数据训练得到,所述关联股票与所述目标股票相关联。
在本实施例中,将上述步骤中得到的多维特征矩阵输入到包含CNN卷积神经网络和LSTM长短期记忆循环神经网络的复合神经网络进行训练,从而得到对目标股票的预测结果。
CNN卷积神经网络负责特征提取,通过将历史交易数据对应的多维特征矩阵输入到CNN网络中进行处理,获得历史交易数据对应的特征向量。LSTM长短期记忆循环神经网络负责对目标股票的预测,通过将历史交易数据对应的特征向量输入长短期记忆循环神经网络进行处理,得到目标股票的预测结果,同时基于预测结果采用反向传播算法更新卷积神经网络和长短期记忆循环神经网络的参数,得到训练后的复合神经网络。
如图3所示,复合神经网络包括LSTM长短期记忆循环神经网络301和CNN卷积神经网络305,其中,LSTM长短期记忆循环神经网络301包括输入层302、隐藏层303和输出层304,CNN卷积神经网络305包括输入层306、卷积层307、池化层308和全连接层309,其中,CNN卷积神经网络可包括多个卷积层、多个池化层和多个全连接层,本实施例不对此结构进行限定。CNN的全连接层与LSTM的输入层相连接,以供CNN的全连接层的输出的特征向量输入到LSTM循环网络的输出层进行处理。
下面以具体例子说明基于该复合神经网络训练的处理过程。
1、将目标股票选定为中信证券,并确定和中信证券最密切相关联的十九支股票。获取目标股票和关联股票这十九支股票的历史交易数据,先将历史交易数据按天划分成每天的历史交易数据,再将历史交易数据涉及的客户按照交易活跃度、客户盈亏分成五类客户,按照客户分类从每天历史交易数据中统计每类客户每天的历史交易数据,其中,历史交易数据包括三种数据:买入股票的数量、卖出股票的数量、成交的总笔数,最终生成3种历史交易数据*20支股票*10类用户的三维特征矩阵。
2、当有1500天的历史交易数据时,对应生成1500个上述三维特征矩阵,将每一个三维特征矩阵作为原始输入数据输入到卷积神经网络的输入层中,进行归一化处理后输入到卷积神经网络的第一个卷积层中,经过64个3*3的核函数的卷积处理,并使用Relu的激活函数进行处理,得到20*10*64维的第一个卷积层的多维特征矩阵。
3、将第一个卷积层多维特征矩阵输入到卷积神经网络的第一个池化层中进行处理,得到10*5*64维的第一个池化层的多维特征矩阵,其中,第一个池化层处理函数维度为2*2。
4、将第一个池化层的多维特征矩阵输入到卷积神经网络的第二个卷积层中,使用256个3*3的核函数对其进行卷积处理,并使用Relu的激活函数,得到10*5*256维的第二个卷积层的多维特征矩阵。
5、将第二个卷积层的多维特征矩阵输入到卷积神经网络的第二个池化层进行处理,得到5*3*256维的第二个池化层的多维特征矩阵,其中,第二个池化层处理函数维度为2*2。
6、将5*3*256维的第二个池化层的多维特征矩阵变换成一维向量,并将其输入到全连接层进行处理,得到20维的特征向量,特征向量具体为客户的群体操作向量,其中,激活函数为Relu。
7、设置参数为通过前30天的输入来预测后1天股票的涨跌,由于每天都有20维的向量作为输入,所以将20*31维的特征矩阵输入到双向LSTM长短期记忆网络中进行处理,其中内部输出的激活函数可以设置为Relu,并将双向LSTM长短期记忆网络的隐藏层设置为256维。
8、双向LSTM的隐藏层为256维,将矩阵输入到双向LSTM模型中,并且将正向输出向量和反向输出向量拼接起来得到总输出向量。
9、将总输出向量经过双向LSTM长短期记忆网络的全连接层后输出二维向量,并经过softmax层的处理输出多个概率值,将概率值最大的结果作为预测结果,进行涨跌的预测。
10、将预测结果与实际值比对,基于所述比对结果采用反向传播算法更新卷积神经网络和长短期记忆循环神经网络的参数,得到训练后的复合神经网络。其中,损失函数设置为交叉熵,更新参数所用的梯度下降方法优选使用Adam(adaptive moment estimation)自适应矩估计算法,Adam算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计动态调整针对于每个参数的学习速率。Adam算法每次迭代参数的学习步长都有一个确定的范围,不会因为很大的梯度导致很大的学习步长,参数的值比较稳定。
当基于1500天的历史交易数据根据上述步骤得到训练后的复合神经网络时,可以获取最新的交易数据输入到训练后的复合神经网络中进行处理以得到对目标股票的涨跌预测结果,具体的实施步骤和上述步骤基本相同,区别在于是生成最新交易数据的三维特征矩阵输入到作为原始输入数据输入到卷积神经网络的输入层中。
本实施例通过先利用复合神经网络中的卷积神经网络学习目标股票和关联股票的交易数据的特征,再将特征输入到复合神经网络中的长短期记忆网络进行处理,得到对股票涨跌的预测,提供了一种基于深度学习和群体智能的股票预测方法,可以准确地预测股票的涨跌。
进一步的,参照图4,本发明第二实施例基于第一实施例提供一种基于深度学习的股票预测方法,本实施例包括:
步骤S40,获取目标股票和关联股票的历史交易数据。
步骤S50,生成所述历史交易数据对应的多维特征矩阵。
步骤S60,将所述历史交易数据对应的多维特征矩阵输入复合神经网络的卷积神经网络进行处理,得到所述历史交易数据对应的特征向量。
步骤S70,获取预设时间间隔内的股票属性数据,并根据所述股票属性数据生成对应的特征向量,其中,所述股票属性数据包括最高价,最低价,开盘价,收盘价,清仓数量,清仓比例,建仓数量,建仓比例,大单数量,大单比例,总的交易股数。
在本实施例中,股票属性数据为目标股票的股票属性数据。
建仓比例为建仓交易数目和所有交易数目的比值,清仓比例为清仓交易数目和所有交易数目的比值。大单数目为交易金额较大的交易数目,小单数目为交易金额较小的交易数目,其中,大单和小单可以按照每笔交易买卖的股票数量来划分。每类股票的大小单的数量可以不一样,例如中信证券单笔交易买入2000股为大单,小于2000股的交易为小单。
需要说明的是,预设时间间隔可以为当天的一整天的时间,也可以为当天和当天之前的一段时间,其中,预设时间间隔所包含的天数可根据需要进行设置。当预设时间间隔包含多天时,对于每一种股票属性数据,可以将多天的数据进行平均,以股票属性数据的平均值构建股票属性数据对应的特征向量。
步骤S80,将所述股票属性数据对应的特征向量和所述历史交易数据对应的特征向量拼接成输入特征向量。
目标股票的股票属性数据对目标股票的涨跌走势会产生影响,但由于股票的属性数据包含的数据种类较多,如果将股票属性数据和历史交易数据一样输入到卷积神经网络进行特征提取,复杂度太高,容易导致数据的过拟合。所以将目标股票的股票属性数据对应的特征向量和历史交易数据对应的特征向量拼接在一起,形成包含所有特征的输入特征向量。
例如,历史交易数据对应的特征向量为20维、股票属性数据对应的特征向量为11维时,将两个向量进行拼接得到31维的特征向量。
步骤S90,将所述输入特征向量输入所述长短期记忆循环神经网络进行处理,得到所述目标股票的预测结果。
例如当通过前30天的输入来预测后1天股票的涨跌时,由于每天都有31维的向量作为输入,所以将30*31维的特征矩阵输入到双向LSTM长短期记忆网络中进行处理,其中内部输出的激活函数可以设置为Relu,并将双向LSTM长短期记忆网络的隐藏层设置为256维。
步骤S100,基于所述预测结果采用反向传播算法更新所述卷积神经网络和所述长短期记忆循环神经网络的参数,得到训练后的复合神经网络。
可以理解的是,将最新的交易数据输入到训练后的复合神经网络进行股票预测时,为了提高预测结果的准确性,也可以获取目标股票最新的股票属性数据,将股票属性数据对应的特征向量和最新交易数据对应的特征向量拼接成输入特征向量,将输入特征向量输入到训练后的复合神经网络的长短期记忆循环神经网络中进行处理,得到对目标股票的涨跌的最新预测结果。
本实施例通过将股票属性数据对应的特征向量和历史交易数据对应的特征向量拼接成输入特征向量,并将输入特征向量输入所述长短期记忆循环神经网络进行处理,以得到更优的复合神经网络的参数,可以提高股票预测的准确性。
参照图5,本发明还提供一种基于基于深度学习的股票预测装置,该基于深度学习的股票预测装置包括:
获取模块10,所述获取模块10用于获取目标股票和关联股票的最新交易数据;
特征生成模块20,所述特征生成模块20用于生成所述最新交易数据对应的多维特征矩阵;
预测模块30,所述预测模块30用于将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,其中,所述复合神经网络的参数由所述目标股票和所述关联股票的历史交易数据训练得到,所述关联股票与所述目标股票相关联。
可选地,所述获取模块10还用于获取目标股票和关联股票的历史交易数据;
所述特征生成模块20还用于生成所述历史交易数据对应的多维特征矩阵;
所述基于深度学习的股票预测装置还包括训练模块,所述训练模块用于将所述历史交易数据对应的多维特征矩阵输入复合神经网络进行训练,得到训练后的复合神经网络,其中,所述复合神经网络包括卷积神经网络和长短期记忆循环神经网络。
可选地,所述训练模块还包括:
卷积神经网络单元,所述卷积神经网络单元用于处理所述历史交易数据对应的多维特征矩阵,得到所述历史交易数据对应的特征向量;
长短期记忆循环神经网络单元,所述长短期记忆循环神经网络单元用于处理所述历史交易数据对应的特征向量,得到所述目标股票的预测结果;
所述训练模块还用于基于所述预测结果采用反向传播算法更新所述卷积神经网络和所述长短期记忆循环神经网络的参数,得到训练后的复合神经网络。
可选地,所述特征生成模块还包括:
子数据生成单元,所述子数据生成模块用于将所述历史交易数据以预设时间间隔划分为多组子数据;
特征生成单元,所述特征生成单元用于根据各组所述子数据生成各个多维特征矩阵;
所述训练模块30还用于分别将各个所述多维特征矩阵输入卷积神经网络进行处理,得到所述历史交易数据对应的各个特征向量。
可选地,所述获取模块10还包括股票属性获取模块,所述股票属性获取模块用于获取预设时间间隔内的股票属性数据,并根据所述股票属性数据生成对应的特征向量,其中,所述股票属性数据包括最高价,最低价,开盘价,收盘价,清仓数量,清仓比例,建仓数量,建仓比例,大单数量,大单比例,总的交易股数;
所述特征生成模块20还用于将所述股票属性数据对应的特征向量和所述历史交易数据对应的特征向量拼接成输入特征向量;
所述预测模块30还用于将所述输入特征向量输入所述复合神经网络进行处理,得到所述目标股票的预测结果。
可选地,所述获取模块10还用于获取上市公司信息,所述上市公司信息包括上市公司名称、上市公司所属行业和上市公司控股信息;
所述基于深度学习的股票预测装置还包括:
图谱生成模块,所述图谱生成模块用于根据所述上市公司信息生成知识图谱;
股票确定模块,所述股票确定模块用于确定目标股票,并根据所述知识图谱确定关联股票,其中,所述关联股票和所述目标股票相关联。
本发明还提供一种基于深度学习的股票预测设备,该基于深度学习的股票预测设备包括:存储器、处理器、摄像头及存储在所述存储器上并可在所述处理器上运行的基于深度学习的股票预测处理程序,所述基于深度学习的股票预测处理程序被所述处理器执行时实现所述的基于深度学习的股票预测方法的步骤。
此外,本发明实施例还提出一种计算机存储介质,所述计算机存储介质上存储有基于深度学习的股票预测处理程序,所述基于深度学习的股票预测处理程序被处理器执行时实现所述的基于深度学习的股票预测方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于深度学习的股票预测方法,其特征在于,所述基于深度学习的股票预测方法包括以下步骤:
获取目标股票和关联股票的最新交易数据;
生成所述最新交易数据对应的多维特征矩阵;
将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,其中,所述复合神经网络的参数由所述目标股票和所述关联股票的历史交易数据训练得到,所述关联股票与所述目标股票相关联。
2.如权利要求1所述的基于深度学习的股票预测方法,其特征在于,所述获取所述目标股票和所述关联股票的最新交易数据的步骤之前还包括:
获取目标股票和关联股票的历史交易数据;
生成所述历史交易数据对应的多维特征矩阵;
将所述历史交易数据对应的多维特征矩阵输入复合神经网络进行训练,得到训练后的复合神经网络,其中,所述复合神经网络包括卷积神经网络和长短期记忆循环神经网络。
3.如权利要求2所述的基于深度学习的股票预测方法,其特征在于,所述将所述历史交易数据对应的多维特征矩阵输入复合神经网络进行训练,得到训练后的复合神经网络的步骤包括:
将所述历史交易数据对应的多维特征矩阵输入所述卷积神经网络进行处理,得到所述历史交易数据对应的特征向量;
将所述历史交易数据对应的特征向量输入所述长短期记忆循环神经网络进行处理,得到所述目标股票的预测结果;
基于所述预测结果采用反向传播算法更新所述卷积神经网络和所述长短期记忆循环神经网络的参数,得到训练后的复合神经网络。
4.如权利要求2所述的基于深度学习的股票预测方法,其特征在于,所述生成所述历史交易数据对应的多维特征矩阵的步骤包括:
将所述历史交易数据以预设时间间隔划分为多组子数据;
根据各组所述子数据生成各个多维特征矩阵;
所述将所述历史交易数据对应的多维特征矩阵输入卷积神经网络进行处理,得到所述历史交易数据对应的特征向量的步骤包括:
分别将各个所述多维特征矩阵输入卷积神经网络进行处理,得到所述历史交易数据对应的各个特征向量。
5.如权利要求2所述的基于深度学习的股票预测方法,其特征在于,所述将所述历史交易数据对应的特征向量输入所述长短期记忆循环神经网络进行处理,得到所述目标股票的预测结果的步骤包括:
获取预设时间间隔内的股票属性数据,并根据所述股票属性数据生成对应的特征向量,其中,所述股票属性数据包括最高价,最低价,开盘价,收盘价,清仓数量,清仓比例,建仓数量,建仓比例,大单数量,大单比例,总的交易股数;
将所述股票属性数据对应的特征向量和所述历史交易数据对应的特征向量拼接成输入特征向量;
将所述输入特征向量输入所述长短期记忆循环神经网络进行处理,得到所述目标股票的预测结果。
6.如权利要求1至5任一项所述的基于深度学习的股票预测方法,其特征在于,所述历史交易数据包括:
交易笔数、买入股数和卖出股数。
7.如权利要求1至5所述的任一项基于深度学习的股票预测方法,其特征在于,所述获取目标股票和关联股票的最新交易数据的步骤之前还包括:
获取上市公司信息,所述上市公司信息包括上市公司名称、上市公司所属行业和上市公司控股信息;
根据所述上市公司信息生成知识图谱;
确定目标股票,并根据所述知识图谱确定关联股票,其中,所述关联股票和所述目标股票相关联。
8.一种基于深度学习的股票预测装置,其特征在于,所述基于深度学习的股票预测装置包括:
获取模块,所述获取模块用于获取目标股票和关联股票的最新交易数据;
特征生成模块,所述特征生成模块用于生成所述最新交易数据对应的多维特征矩阵;
预测模块,所述预测模块用于将所述最新交易数据对应的多维特征矩阵输入复合神经网络进行处理,得到所述目标股票的预测结果,其中,所述复合神经网络的参数由所述目标股票和所述关联股票的历史交易数据训练得到,所述关联股票与所述目标股票相关联。
9.一种基于深度学习的股票预测设备,其特征在于,所述基于深度学习的股票预测设备包括:存储器、处理器、摄像头及存储在所述存储器上并可在所述处理器上运行的基于深度学习的股票预测的处理程序,所述基于深度学习的股票预测的处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于深度学习的股票预测的方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于深度学习的股票预测处理程序,所述基于深度学习的股票预测处理程序被处理器执行时实现如权利要求1至7中任一项所述的基于深度学习的股票预测方法的步骤。
CN201811144154.2A 2018-09-28 2018-09-28 基于深度学习的股票预测方法、装置、设备及存储介质 Pending CN109360097A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811144154.2A CN109360097A (zh) 2018-09-28 2018-09-28 基于深度学习的股票预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811144154.2A CN109360097A (zh) 2018-09-28 2018-09-28 基于深度学习的股票预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN109360097A true CN109360097A (zh) 2019-02-19

Family

ID=65347884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811144154.2A Pending CN109360097A (zh) 2018-09-28 2018-09-28 基于深度学习的股票预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109360097A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047002A (zh) * 2019-03-28 2019-07-23 莆田学院 一种基于数据分析的期货推荐方法及系统
CN110047001A (zh) * 2019-03-28 2019-07-23 莆田学院 一种期货数据人工智能分析方法及系统
CN110246037A (zh) * 2019-04-19 2019-09-17 阿里巴巴集团控股有限公司 交易特征预测方法、装置、服务器及可读存储介质
CN110415119A (zh) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备
CN110781690A (zh) * 2019-10-31 2020-02-11 北京理工大学 一种多源神经机器翻译模型的融合和压缩方法
CN110782096A (zh) * 2019-10-29 2020-02-11 山东科技大学 一种外汇时间序列预测方法
CN111143539A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111402042A (zh) * 2020-02-17 2020-07-10 中信建投证券股份有限公司 一种用于股市大盘形态分析的数据分析与显示方法
CN111583033A (zh) * 2020-04-01 2020-08-25 北京智信度科技有限公司 基于上市公司和股东之间联系的关联分析方法及装置
WO2021082810A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测的构建方法
WO2021082809A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测的训练优化方法
CN112884211A (zh) * 2021-02-02 2021-06-01 上海卡方信息科技有限公司 一种基于深度学习的股价预测系统及方法
WO2021111252A1 (en) * 2019-12-02 2021-06-10 International Business Machines Corporation Deep contour-correlated forecasting
CN113392739A (zh) * 2021-06-02 2021-09-14 中南民族大学 滚动轴承状态的监测方法、装置、设备及存储介质
CN114072835A (zh) * 2020-03-11 2022-02-18 格步计程车控股私人有限公司 费用预测方法及费用预测数据系统
WO2023159756A1 (zh) * 2022-02-22 2023-08-31 平安科技(深圳)有限公司 价格数据的处理方法和装置、电子设备、存储介质

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047002A (zh) * 2019-03-28 2019-07-23 莆田学院 一种基于数据分析的期货推荐方法及系统
CN110047001A (zh) * 2019-03-28 2019-07-23 莆田学院 一种期货数据人工智能分析方法及系统
CN110047001B (zh) * 2019-03-28 2022-06-24 莆田学院 一种期货数据人工智能分析方法及系统
CN110246037A (zh) * 2019-04-19 2019-09-17 阿里巴巴集团控股有限公司 交易特征预测方法、装置、服务器及可读存储介质
CN110246037B (zh) * 2019-04-19 2023-01-17 创新先进技术有限公司 交易特征预测方法、装置、服务器及可读存储介质
CN110415119A (zh) * 2019-07-30 2019-11-05 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备
CN110415119B (zh) * 2019-07-30 2022-03-25 中国工商银行股份有限公司 模型训练、票据交易预测方法、装置、存储介质及设备
WO2021082809A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测的训练优化方法
CN110782096A (zh) * 2019-10-29 2020-02-11 山东科技大学 一种外汇时间序列预测方法
WO2021082810A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测的构建方法
WO2021082811A1 (zh) * 2019-10-29 2021-05-06 山东科技大学 一种外汇时间序列预测方法
CN110781690A (zh) * 2019-10-31 2020-02-11 北京理工大学 一种多源神经机器翻译模型的融合和压缩方法
WO2021111252A1 (en) * 2019-12-02 2021-06-10 International Business Machines Corporation Deep contour-correlated forecasting
GB2605719B (en) * 2019-12-02 2024-01-24 Ibm Deep contour-correlated forecasting
GB2605719A (en) * 2019-12-02 2022-10-12 Ibm Deep contour-correlated forecasting
US11586705B2 (en) 2019-12-02 2023-02-21 International Business Machines Corporation Deep contour-correlated forecasting
CN111143539A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111143539B (zh) * 2019-12-31 2023-06-23 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111402042B (zh) * 2020-02-17 2023-10-27 中信建投证券股份有限公司 一种用于股市大盘形态分析的数据分析与显示方法
CN111402042A (zh) * 2020-02-17 2020-07-10 中信建投证券股份有限公司 一种用于股市大盘形态分析的数据分析与显示方法
CN114072835B (zh) * 2020-03-11 2024-03-08 格步计程车控股私人有限公司 费用预测方法及费用预测数据系统
CN114072835A (zh) * 2020-03-11 2022-02-18 格步计程车控股私人有限公司 费用预测方法及费用预测数据系统
CN111583033A (zh) * 2020-04-01 2020-08-25 北京智信度科技有限公司 基于上市公司和股东之间联系的关联分析方法及装置
CN112884211A (zh) * 2021-02-02 2021-06-01 上海卡方信息科技有限公司 一种基于深度学习的股价预测系统及方法
CN113392739B (zh) * 2021-06-02 2022-09-30 中南民族大学 滚动轴承状态的监测方法、装置、设备及存储介质
CN113392739A (zh) * 2021-06-02 2021-09-14 中南民族大学 滚动轴承状态的监测方法、装置、设备及存储介质
WO2023159756A1 (zh) * 2022-02-22 2023-08-31 平安科技(深圳)有限公司 价格数据的处理方法和装置、电子设备、存储介质

Similar Documents

Publication Publication Date Title
CN109360097A (zh) 基于深度学习的股票预测方法、装置、设备及存储介质
US20230088171A1 (en) Method and apparatus for training search recommendation model, and method and apparatus for sorting search results
CN110046304A (zh) 一种用户推荐方法和装置
CN109919316A (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
CN105320724A (zh) 用于优化用于学习排序的非凸函数的新探索
CN116010684A (zh) 物品推荐方法、装置及存储介质
CN110288350A (zh) 用户价值预测方法、装置、设备及存储介质
CN108549685A (zh) 行为分析方法、装置、系统及可读存储介质
CN112785005B (zh) 多目标任务的辅助决策方法、装置、计算机设备及介质
CN112131261B (zh) 基于社区网络的社区查询方法、装置和计算机设备
CN108052670A (zh) 一种相机特效的推荐方法及装置
CN108229536A (zh) 分类预测模型的优化方法、装置及终端设备
Shiue et al. Development of machine learning‐based real time scheduling systems: using ensemble based on wrapper feature selection approach
CN109978575A (zh) 一种挖掘用户流量经营场景的方法及装置
CN108122029A (zh) 一种相机特效的推荐方法及装置
CN110263973A (zh) 预测用户行为的方法及装置
CN109075987A (zh) 优化数字组件分析系统
CN108764489B (zh) 基于虚拟样本的模型训练方法及设备
Anelli et al. Prioritized multi-criteria federated learning
CN113255231B (zh) 一种数据处理方法、装置、设备及存储介质
CN110457387A (zh) 一种应用于网络中用户标签确定的方法及相关装置
CN114358186A (zh) 一种数据处理方法、装置及计算机可读存储介质
KR102266151B1 (ko) 인공지능 기반 투표플랫폼을 통한 소비자 선호도를 제공하는 방법
KR102266153B1 (ko) 인공지능 기반 자가심리분석플랫폼을 통한 소비자 선호도를 제공하는 방법
CN115455306B (zh) 推送模型训练、信息推送方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190219