CN117495563A - 基于深度神经网络的股票算法交易方法、电子设备及介质 - Google Patents
基于深度神经网络的股票算法交易方法、电子设备及介质 Download PDFInfo
- Publication number
- CN117495563A CN117495563A CN202311511173.5A CN202311511173A CN117495563A CN 117495563 A CN117495563 A CN 117495563A CN 202311511173 A CN202311511173 A CN 202311511173A CN 117495563 A CN117495563 A CN 117495563A
- Authority
- CN
- China
- Prior art keywords
- stock
- data
- neural network
- trading
- market
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 138
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 41
- 230000008859 change Effects 0.000 claims abstract description 56
- 230000007246 mechanism Effects 0.000 claims abstract description 14
- 238000003860 storage Methods 0.000 claims description 48
- 238000012545 processing Methods 0.000 claims description 45
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 33
- 230000008451 emotion Effects 0.000 claims description 31
- 230000006399 behavior Effects 0.000 claims description 29
- 230000006870 function Effects 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 18
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 238000011160 research Methods 0.000 claims description 11
- 238000009826 distribution Methods 0.000 claims description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 4
- 230000007787 long-term memory Effects 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 20
- 230000015556 catabolic process Effects 0.000 abstract description 5
- 238000006731 degradation reaction Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 32
- 238000005516 engineering process Methods 0.000 description 21
- 238000007726 management method Methods 0.000 description 12
- 230000002787 reinforcement Effects 0.000 description 12
- 238000012549 training Methods 0.000 description 12
- 238000010606 normalization Methods 0.000 description 10
- 238000013135 deep learning Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 6
- 238000004140 cleaning Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了基于深度神经网络的股票算法交易方法、电子设备及介质,属于人工智能技术领域。本申请通过采集多种股票市场数据,基于深度神经网络的模型对该多种股票市场数据进行充分分析,来预测出股票市场变化情况,也即充分地分析了股票市场上的各种风险,并基于风险生成股票交易策略,从而实现了股票交易的有效管理,在市场信息瞬息万变的股票市场上也能够避免因忽视股票市场的风险而出现大规模损失的情况,不仅能够满足交易量的增长需求,同时也能保证股票交易的正确性。进一步,通过残差卷积神经网络,能够解决深度神经网络过深时产生的网络退化现象。进一步,通过自注意力机制,能够较好处理长距离依赖问题。
Description
技术领域
本申请涉及人工智能技术领域,特别涉及基于深度神经网络的股票算法交易方法、电子设备及介质。
背景技术
互联网的高速发展使得电子管理系统在各行各业都有了广泛且重要的应用。而在市场信息瞬息万变、交易需求不断扩大的股票市场,具有速度快、成本低和突破场地限制等优势的电子化交易方式,不仅能够极大地满足交易量的增长需求,而且能将时间延迟带来的损失降到最低,使人们及时掌握股票市场行情。
基于电子管理系统的股票算法交易方法需要较高的计算资源和存储容量,采用高性能的服务器、GPU加速器等电子设备进行计算,同时需要存储大量历史数据和模型参数,可采用大容量硬盘、固态硬盘等存储介质进行存储。同时,为了方便使用和管理,也可采用云计算和分布式存储技术实现算法交易系统的部署和管理,提高系统的可靠性和可扩展性。
但是股票市场存在较高的风险和不确定性,股票算法交易方法的应用需要建立在充分的风险控制和管理基础之上,避免出现大规模损失,上述电子管理系统完全没有考虑到这一点,只是简单的进行计算和存储,并无考虑到股票市场的复杂情况,因而很容易出现大规模损失。
发明内容
本申请实施例提供了一种基于深度神经网络的股票算法交易方法、电子设备及介质,能够达到避免出现大规模损失,提高准确性的效果。所述技术方案如下:
一方面,提供了一种基于深度神经网络的股票算法交易方法,所述方法包括:
采集股票市场数据,所述股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种;
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型根据所述股票交易模型的参数,对所述股票市场数据中每种数据进行特征提取得到第一特征,通过残差卷积神经网络对所述第一特征进行特征提取得到第二特征,将所述第一特征和所述第二特征联结得到组合特征,通过自注意力机制对所述组合特征以及所述组合特征在所述股票市场数据中的上下文信息进行处理得到股票市场特征,基于所述股票市场特征预测未来的股票市场变化情况;
根据所述未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略;
自动执行所述股票交易策略所指示的交易行为。
在一些实施例中,所述残差卷积神经网络包括卷积块和至少一个残差块,所述卷积块包括卷积核,每个所述残差块包括两个卷积层;
所述通过残差卷积神经网络对所述第一特征进行特征提取得到第二特征,包括:
通过所述卷积块获取所述第一特征与所述卷积核权重的乘积,获取所述乘积与偏置值之和后,通过激活函数对所述乘积与偏置值之和进行归一化;
通过所述至少一个残差块的两个卷积层对归一化后的特征进行两次卷积处理,得到每个残差块的输出特征;
将所述至少一个残差块的输出特征之和作为第二特征。
在一些实施例中,所述通过自注意力机制对所述组合特征以及所述组合特征在所述股票市场数据中的上下文信息进行处理得到股票市场特征,包括:
基于所述组合特征和所述组合特征在所述股票市场数据中的上下文信息,得到输出向量;
通过缩放点积法计算所述输出向量的Query矩阵和Key矩阵的相似度,得到权重;
通过Softmax函数对所述权重进行归一化,得到概率分布的权重;
将所述概率分布的权重和所述输出向量的Value矩阵进行加权求和,得到股票市场特征。
进一步地,所述股票交易模型包括多个子模型,每个子模型用于对一种类型的数据进行特征提取;
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型根据所述股票交易模型的参数,对所述股票市场数据中每种数据进行特征提取得到第一特征,包括:
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型判断所述股票市场数据中每种数据的类型,将所述每种数据输入所述类型对应的子模型中,由每个子模型对所述每种数据进行特征提取得到第一特征。
进一步地,所述多个子模型包括长短期记忆LSTM神经网络、循环神经网络RNN、反向传播BP神经网络、多层感知机MLP模型中至少两种;
所述由所述股票交易模型判断所述股票市场数据中每种数据的类型,包括:
响应于所述股票市场数据中任一种数据为时序类型数据,将所述任一种数据输入所述长短期记忆LSTM神经网络或循环神经网络RNN中的至少一种网络中;
响应于所述股票市场数据中任一种数据为非时序类型数据,将所述任一种数据输入所述反向传播BP神经网络、多层感知机MLP模型中的至少一种网络中。
进一步地,所述未来的股票市场变化情况包括股票价格走势和市场情绪指数变化,所述股票交易的生成规则中不同的股票价格走势和不同的市场情绪指数变化的任意组合对应有候选股票交易策略;
所述根据所述未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略,包括:
对所述股票价格走势和市场情绪指数变化,与所述股票交易的生成规则进行匹配,将所述股票价格走势和市场情绪指数变化的组合对应的候选股票交易策略,作为所述股票交易策略。
进一步地,所述股票交易策略包括买入、卖出和持有;
所述自动执行所述股票交易策略所指示的交易行为,包括:
响应于所述股票交易策略为买入,自动在股票交易平台中登录目标账号的情况下,基于所述目标账号的账号数据执行买入行为;
响应于所述股票交易策略为卖出,自动在股票交易平台中登陆目标账号的情况下,基于所述目标账号的账号数据执行卖出行为;
响应于所述股票交易策略为持有,自动在股票交易平台中登陆目标账号的情况下,基于所述目标账号的账号数据执行持有行为。
在一些实施例中,所述将所述股票市场数据输入基于深度神经网络的股票交易模型中,包括:
对采集到的所述股票市场数据进行预处理,所述预处理包括数据清洗、归一化、标准化中的至少一种;
将所述预处理后的所述股票市场数据输入基于深度神经网络的股票交易模型中。
进一步地,所述采集股票市场数据,包括:
获取股票交易平台中目标账号的股票市场数据;
响应于所述目标账号的股票市场数据中存在交易,获取所述股票市场数据中交易中、历史交易过的目标股票的市场数据、所述目标股票的相关股票的市场数据、所述股票交易平台所有股票的市场数据中至少一项。
一方面,提供了一种基于深度神经网络的股票算法交易装置,所述装置包括:
采集模块,用于采集股票市场数据,所述股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种;
预测模块,用于将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型根据所述股票交易模型的参数,对所述股票市场数据中每种数据进行特征提取得到第一特征,通过残差卷积神经网络对所述第一特征进行特征提取得到第二特征,将所述第一特征和所述第二特征联结得到组合特征,通过自注意力机制对所述组合特征以及所述组合特征在所述股票市场数据中的上下文信息进行处理得到股票市场特征,基于所述股票市场特征预测未来的股票市场变化情况;
生成模块,用于根据所述未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略;
执行模块,用于自动执行所述股票交易策略所指示的交易行为。
在一些实施例中,所述残差卷积神经网络包括卷积块和至少一个残差块,所述卷积块包括卷积核,每个所述残差块包括两个卷积层;
所述预测模块用于:
通过所述卷积块获取所述第一特征与所述卷积核权重的乘积,获取所述乘积与偏置值之和后,通过激活函数对所述乘积与偏置值之和进行归一化;
通过所述至少一个残差块的两个卷积层对归一化后的特征进行两次卷积处理,得到每个残差块的输出特征;
将所述至少一个残差块的输出特征之和作为第二特征。
在一些实施例中,所述预测模块用于:
基于所述组合特征和所述组合特征在所述股票市场数据中的上下文信息,得到输出向量;
通过缩放点积法计算所述输出向量的Query矩阵和Key矩阵的相似度,得到权重;
通过Softmax函数对所述权重进行归一化,得到概率分布的权重;
将所述概率分布的权重和所述输出向量的Value矩阵进行加权求和,得到股票市场特征。
进一步地,所述股票交易模型包括多个子模型,每个子模型用于对一种类型的数据进行特征提取;
所述预测模块用于:
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型判断所述股票市场数据中每种数据的类型,将所述每种数据输入所述类型对应的子模型中,由每个子模型对所述每种数据进行特征提取得到第一特征。
进一步地,所述多个子模型包括长短期记忆LSTM神经网络、循环神经网络RNN、反向传播BP神经网络、多层感知机MLP模型中至少两种;
所述预测模块用于:
响应于所述股票市场数据中任一种数据为时序类型数据,将所述任一种数据输入所述长短期记忆LSTM神经网络或循环神经网络RNN中的至少一种网络中;
响应于所述股票市场数据中任一种数据为非时序类型数据,将所述任一种数据输入所述反向传播BP神经网络、多层感知机MLP模型中的至少一种网络中。
进一步地,所述未来的股票市场变化情况包括股票价格走势和市场情绪指数变化,所述股票交易的生成规则中不同的股票价格走势和不同的市场情绪指数变化的任意组合对应有候选股票交易策略;
所述生成模块用于对所述股票价格走势和市场情绪指数变化,与所述股票交易的生成规则进行匹配,将所述股票价格走势和市场情绪指数变化的组合对应的候选股票交易策略,作为所述股票交易策略。
进一步地,所述股票交易策略包括买入、卖出和持有;
所述执行模块用于:
响应于所述股票交易策略为买入,自动在股票交易平台中登录目标账号的情况下,基于所述目标账号的账号数据执行买入行为;
响应于所述股票交易策略为卖出,自动在股票交易平台中登陆目标账号的情况下,基于所述目标账号的账号数据执行卖出行为;
响应于所述股票交易策略为持有,自动在股票交易平台中登陆目标账号的情况下,基于所述目标账号的账号数据执行持有行为。
在一些实施例中,所述预测模块用于:
对采集到的所述股票市场数据进行预处理,所述预处理包括数据清洗、归一化、标准化中的至少一种;
将所述预处理后的所述股票市场数据输入基于深度神经网络的股票交易模型中。
进一步地,所述采集模块用于:
获取股票交易平台中目标账号的股票市场数据;
响应于所述目标账号的股票市场数据中存在交易,获取所述股票市场数据中交易中、历史交易过的目标股票的市场数据、所述目标股票的相关股票的市场数据、所述股票交易平台所有股票的市场数据中至少一项。
一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器加载并执行以实现上述基于深度神经网络的股票算法交易方法的各种可选实现方式。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现上述基于深度神经网络的股票算法交易方法的各种可选实现方式。
一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或所述计算机程序包括一条或多条程序代码,所述一条或多条程序代码存储在计算机可读存储介质中。电子设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条程序代码,所述一个或多个处理器执行所述一条或多条程序代码,使得电子设备能够执行上述任一种可能实施方式的基于深度神经网络的股票算法交易方法。
有益效果:本申请实施例通过采集多种股票市场数据,基于深度神经网络的模型对该多种股票市场数据进行充分分析,来预测出股票市场变化情况,也即充分地分析了股票市场上的各种风险,并基于风险生成股票交易策略,从而实现了股票交易的有效管理,在市场信息瞬息万变的股票市场上也能够避免因忽视股票市场的风险而出现大规模损失的情况,不仅能够满足交易量的增长需求,同时也能保证股票交易的正确性。进一步,通过残差卷积神经网络,能够解决深度神经网络过深时产生的网络退化现象。进一步,通过自注意力机制,能够较好处理长距离依赖问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还能够根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于深度神经网络的股票算法交易方法的实施环境的示意图;
图2是本申请实施例提供的一种基于深度神经网络的股票算法交易方法的流程图;
图3是本申请实施例提供的一种基于深度神经网络的股票算法交易装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。还应理解,尽管以下描述使用术语第一、第二等来描述各种元素,但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如,在不脱离各种所述示例的范围的情况下,第一图像能够被称为第二图像,并且类似地,第二图像能够被称为第一图像。第一图像和第二图像都能够是图像,并且在某些情况下,能够是单独且不同的图像。
本申请中术语“至少一个”的含义是指一个或多个,本申请中术语“多个”的含义是指两个或两个以上,例如,多个数据包是指两个或两个以上的数据包。
应理解,在本文中对各种所述示例的描述中所使用的术语只是为了描述特定示例,而并非旨在进行限制。如在对各种所述示例的描述和所附权利要求书中所使用的那样,单数形式“一个(“a”、“an”)”和“该”旨在也包括复数形式,除非上下文另外明确地指示。
还应理解,本文中所使用的术语“和/或”是指并且涵盖相关联的所列出的项目中的一个或多个项目的任何和全部可能的组合。术语“和/或”,是一种描述关联对象的关联关系,表示能够存在三种关系,例如,A和/或B,能够表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本申请中的字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,在本申请的各个实施例中,各个过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
还应理解,根据A确定B并不意味着仅仅根据A确定B,还能够根据A和/或其它信息确定B。
还应理解,术语“包括”(也称“inCludes”、“inCluding”、“Comprises”和/或“Comprising”)当在本说明书中使用时指定存在所陈述的特征、整数、步骤、操作、元素、和/或部件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元素、部件、和/或其分组。
还应理解,术语“如果”可被解释为意指“当...时”(“when”或“upon”)或“响应于确定”或“响应于检测到”。类似地,根据上下文,短语“如果确定...”或“如果检测到[所陈述的条件或事件]”可被解释为意指“在确定...时”或“响应于确定...”或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。
下面对本申请涉及到的名词进行说明。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(ComputerVision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。
计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
深度学习:这个概念源于对人工神经网络的研究。比如含多隐层的多层感知器即为一种深度学习结构。其中,深度学习通过组合低层特征形成更加抽象的高层特征,以发掘数据的分布式特征表示。
换一种表达方式,深度学习是一种基于对数据进行表征学习的方法。对于观测值(例如一幅图像)可以使用多种方式来表示。比如可用该图像中每个像素强度值的向量进行表示,或者可将该图像更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法能更容易从实例中进行任务学习,比如进行人脸识别或面部表情识别等。其中,深度学习的好处是利用非监督式或监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
卷积神经网络(Convolutional Neural Networks,CNN):是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。
本申请实施例提供的方案涉及人工智能的计算机视觉、机器学习等技术,具体通过如下实施例进行说明。
云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
作为云计算的基础能力提供商,会建立云计算资源池(简称云平台),一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
按照逻辑功能划分,在IaaS(Infrastructure as a Service,基础设施即服务)层上可以部署PaaS(Platform as a Service,平台即服务)层,PaaS层之上再部署SaaS(Software as a Service,软件即服务)层,也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台,如数据库、web容器等。SaaS为各式各样的业务软件,如web门户网站、短信群发器等。一般来说,SaaS和PaaS相对于IaaS是上层。
云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。
目前,存储系统的存储方法为:创建逻辑卷,在创建逻辑卷时,就为每个逻辑卷分配物理存储空间,该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据,也就是将数据存储在文件系统上,文件系统将数据分成许多部分,每一部分是一个对象,对象不仅包含数据而且还包含数据标识(ID,ID entity)等额外的信息,文件系统将每个对象分别写入该逻辑卷的物理存储空间,且文件系统会记录每个对象的存储位置信息,从而当客户端请求访问数据时,文件系统能够根据每个对象的存储位置信息让客户端对数据进行访问。
存储系统为逻辑卷分配物理存储空间的过程,具体为:按照对存储于逻辑卷的对象的容量估量(该估量往往相对于实际要存储的对象的容量有很大余量)和独立冗余磁盘阵列(RAID,RedundantArray ofIndependent Disk)的组别,预先将物理存储空间划分成分条,一个逻辑卷可以理解为一个分条,从而为逻辑卷分配了物理存储空间。
数据库(Database),简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
数据库管理系统(英语:Database Management System,简称DBMS)是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、XML(Extensible MarkupLanguage,即可扩展标记语言);或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如SQL(结构化查询语言Structured QueryLanguage)、XQuery;或依据性能冲量重点来作分类,例如最大规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,例如,同时支持多种查询语言。
人工智能云服务,一般也被称作是AIaaS(AI as a Service,中文为“AI即服务”)。这是目前主流的一种人工智能平台的服务方式,具体来说AIaaS平台会把几类常见的AI服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过API接口的方式来接入使用平台提供的一种或者是多种人工智能服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。
下面对本申请的实施环境进行说明。
图1是本申请实施例提供的一种基于深度神经网络的股票算法交易方法的实施环境的示意图。该实施环境包括终端101,或者该实施环境包括终端101和基于深度神经网络的股票交易平台102。终端101通过无线网络或有线网络与基于深度神经网络的股票交易平台102相连。
终端101能够是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts GroupAudio Layer III,动态影像专家压缩标准音频层面3)播放器或MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器,膝上型便携计算机中的至少一种。终端101安装和运行有支持基于深度神经网络的股票交易的应用程序,例如,该应用程序能够是股票软件。
示例性地,该终端101能够具有股票交易功能,能够采集股票市场数据并对股票市场的变化情况进行预测从而做出正确的交易行为。该终端101能够独立完成该工作,也能够通过基于深度神经网络的股票交易平台102为其提供数据服务。本申请实施例对此不作限定。
基于深度神经网络的股票交易平台102包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。基于深度神经网络的股票交易平台102用于为基于深度神经网络的股票交易的应用程序提供后台服务。可选地,基于深度神经网络的股票交易平台102承担主要处理工作,终端101承担次要处理工作;或者,基于深度神经网络的股票交易平台102承担次要处理工作,终端101承担主要处理工作;或者,基于深度神经网络的股票交易平台102或终端101分别能够单独承担处理工作。或者,基于深度神经网络的股票交易平台102和终端101两者之间采用分布式计算架构进行协同计算。
可选地,该基于深度神经网络的股票交易平台102包括至少一台服务器1021以及数据库1022,该数据库1022用于存储数据,在本申请实施例中,该数据库1022中能够存储有样本股票市场数据、历史股票市场数据或股票交易模型等,为至少一台服务器1021提供数据服务。
服务器能够是独立的物理服务器,也能够是多个物理服务器构成的服务器集群或者分布式系统,还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端能够是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
本领域技术人员能够知晓,上述终端101、服务器1021的数量能够更多或更少。比如上述终端101、服务器1021能够仅为一个,或者上述终端101、服务器1021为几十个或几百个,或者更多数量,本申请实施例对终端或服务器的数量和设备类型不加以限定。
图2是本申请实施例提供的一种基于深度神经网络的股票算法交易方法的流程图,该方法应用于电子设备中,该电子设备为终端或服务器,参见图2,该方法包括以下步骤。
201、电子设备采集股票市场数据,该股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种。
在本申请实施例中,电子设备可以采集股票相关的多种数据,来对股票市场进行分析,以预测出股票市场如何变化,从而基于这种变化来生成股票交易策略,并基于股票交易策略自动执行相应的交易行为。该股票交易全过程实现了全部自动化,能够自动采集数据,能够通过深度神经网络实现股票市场的预测,并能够生成策略并自动完成交易行为。股票交易全过程实现自动化,且需要进行风险分析,自然也就需要采集股票市场数据作为后续分析的数据基础。
股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种。也即是,股票市场数据可以包括多种数据,可以包括上述几种数据中的任两种,或者包括任三种、任四种、任五种或者全部六种。
该股票市场数据具体包括哪几种数据可以由相关技术人员根据需求进行设置,该股票市场数据还可以包括其他数据,本申请实施例对此不作限定。
其中,股票价格可以包括很多种价格,例如,每日开盘价格为个股在单个交易日的开盘时价格。每日收盘价格为个股在单个交易日的收盘时价格。每日最高价格为个股在单个交易日内的盘中最高价格。每日最低价格为个股在单个交易日内的盘中最低价格。每日前复权价格为个股在单个交易日的收盘价格按前复权计算后的价格。每日交易额为个股在单个交易日内的全部交易额(交易金额总额)。每日交易量为个股在单个交易日内的全部交易量(笔数)。每日价格变动值为本交易日较上个交易日的收盘价格变化值。每日价格变动幅度,为本交易日较上个交易日的收盘价格变化百分比。目标日交易均价为按照移动平均方法计算的前目标个交易日的平均价格。
股票相关的财务数据可以包括收益率数据等。
在一些实施例中,电子设备可以获取股票交易平台所有股票的市场数据。
在另一些实施例中,电子设备可以获取目标账号已持有的一些股票,根据这些股票相关的其他股票的市场数据,后续能够基于采集到的数据对该目标账号需要采取哪种交易行为进行分析。具体地,该步骤201中,电子设备获取股票交易平台中目标账号的股票市场数据,然后响应于该目标账号的股票市场数据中存在交易,获取该股票市场数据中交易中、历史交易过的目标股票的市场数据、该目标股票的相关股票的市场数据、该股票交易平台所有股票的市场数据中至少一项。
上述提供了几种采集哪几种股票市场数据的可能实施方式,本申请实施例对此不作限定。
在一些实施例中,该电子设备实时采集股票市场数据,就可以及时获取到股票市场变化,从而及时做出相应的交易行为,以避免因延时或因无法及时获取到股票市场变化而造成大规模损失的情况出现。
202、电子设备将该股票市场数据输入基于深度神经网络的股票交易模型中,由该股票交易模型根据该股票交易模型的参数,对该股票市场数据中每种数据进行特征提取得到第一特征,通过残差卷积神经网络对该第一特征进行特征提取得到第二特征,将该第一特征和该第二特征联结得到组合特征,通过自注意力机制对该组合特征以及该组合特征在该股票市场数据中的上下文信息进行处理得到股票市场特征,基于该股票市场特征预测未来的股票市场变化情况。
电子设备采集到的股票市场数据后,可以基于深度神经网络进行股票市场变化情况的预测。该股票交易模型采用深度神经网络的架构,并基于样本股票市场数据训练、测试和验证得到。该深度神经网络可以提前训练好,以便于在需要进行股票市场变化情况预测时能够调用。
也即是,在股票交易模型应用之前,股票交易模型采用深度神经网络算法,设计适当的网络结构和参数,建立预测模型,通过大量历史数据训练模型,并通过验证数据和测试数据进行评估和调整。
在一些实施例中,该股票交易模型可以提前训练好并存储于该电子设备中,在该电子设备需要对股票市场变化情况进行预测时,可以从本地存储中调用该股票交易模型。在另一些实施例中,该股票交易模型也可以提前训练好并存储于服务器的数据库中,在该电子设备需要对股票市场变化情况进行预测时,可以从服务器的数据库中调用该股票交易模型,也可以将采集到的各种股票市场数据发送至该服务器,由该服务器执行步骤202中的预测股票市场变化情况的步骤,然后将输出的股票市场变化情况返回该电子设备。上述提供了两种可能的实施例,本申请实施例对该股票交易模型的存储地址不作限定。
对于该股票交易模型的训练过程,下面提供几种可能的训练过程,但并不限定只能采用下述方式,本申请实施例对具体采用哪种训练方式不作限定。
在一些实施例中,对深度强化学习神经网络进行训练的过程可以为:获取大量历史股票交易数据,基于深度强化学习环境,输出股票交易数据时间序列;将股票交易数据时间序列的每一序列值输入深度强化学习神经网络,输出每一序列值对应的股票交易行为,然后根据由每一序列值对应的股票交易行为获得的反馈参数,更新深度强化学习神经网络的参数。该过程有些可以采用循环神经网络实现,可以采集到的历史股票交易数据,然后将每个时刻的股票市场数据作为股票交易环境,然后将下一时刻做出的交易行为作为目标交易行为,然后Agent(控制器)根据股票交易环境,预测出一个下一时刻做出的交易行为,然后将该交易行为放到股票交易环境中,看下一时刻该股票交易环境发生的变化作为反馈,基于反馈更新Agent的参数。
在另一些实施例中,对深度强化学习神经网络进行训练的过程可以为:获取大量历史股票交易数据,基于深度强化学习环境,输出股票交易数据时间序列;将股票交易数据时间序列的每一序列值输入深度强化学习神经网络,输出每一序列值对应的预测股票市场变化情况,然后再去根据下一序列值对应的股票市场与该序列值对应的股票市场进行对比,确定出股票变化情况来与预测股票市场变化情况进行对比,来对神经网络的参数进行更新。
在另一些实施例中,构建深度强化学习神经网络的过程可以为:利用深度强化学习,以股票交易数据作为输入,以股票交易风险度量指标作为目标函数,根据股票市场变化情况构建深度强化学习神经网络。又例如,可以将收益率、回撤的技术指标作为目标函数,例如将微分夏普比率(Sharpratio)作为目标函数,计算微分夏普比率、最大回撤率(maxdrawdown)等风险度量指标。微分夏普比率作为衡量风险和收益的指标更能表现投资是否稳健,较高的微分夏普比率代表着较高的收益和较低的风险。深度强化学习神经网络把金融时间序列作为输入,以最大化微分夏普比率为目标函数,然后根据股票市场变化情况构建深度神经网络。其中,股票交易风险度量指标可以包括微分夏普比率或最大回撤率中至少一个。微分夏普比率作为衡量风险和收益的指标,可以表明股票交易是否稳健,较高的微分夏普比率代表着较高的收益和较低的风险;最大回撤率也可以作为重要的风险指标,可以表明股票抗风险的能力。
下面针对该步骤202中股票交易模型的相关处理过程进行说明。
在一些实施例中,在将股票市场数据输入股票交易模型之前,可以先对股票市场数据进行预处理后再输入股票交易模型中进行后续处理。具体地,电子设备可以对采集到的该股票市场数据进行预处理,该预处理包括数据清洗、归一化、标准化中的至少一种,然后将该预处理后的该股票市场数据输入基于深度神经网络的股票交易模型中。
其中,数据清洗是指对数据进行处理和加工,以使其适合进行分析和建模。数据清洗包括去除重复数据、填补缺失值、处理异常值和转换数据格式等操作,以提高数据的准确性和可靠性。数据清洗通常是数据处理过程的一个必要步骤,它可以消除数据错误和噪声,并提高分析和建模的精度。
数据去重:去除数据集中的重复记录。这可以通过比较记录中的唯一标识符或关键字段来实现。
缺失值处理:填补数据集中的缺失值。这可以使用插值、平均值、中位数、众数等方法进行处理。
异常值处理:检测和处理数据集中的异常值。异常值可以被删除或替换为可接受的值。
数据标准化:将数据格式标准化为一致的格式,以便于处理和分析。例如,可以将日期格式标准化为ISO格式。
数据转换:数据转换实质上是将数据的格式进行转换,其目的主要是为了便于处理和分析数据。例如,将文本格式的日期转换为日期格式。
数据验证:确保数据集中的数据准确性和完整性。例如,可以验证邮件地址是否符合标准格式,或验证电话号码是否正确。
归一化:在机器学习领域中,不同评价指标(即特征向量中的不同特征就是不同评价指标)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果。为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。简而言之,归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响。
标准化和归一化都是特征缩放的方法。
上面提供了几种可能的预处理步骤,在一些实施例中,预处理过程还可以包括其他步骤,本申请实施例对此不作限定。
该股票交易模型对输入的股票市场数据的处理过程可以划分为以下几个子步骤。
子步骤一:股票市场数据输入和特征提取得到第一特征。
对于股票市场数据输入,在一些实施例中,该股票交易模型可以为一个复合模型、多网络模型。具体地,该股票交易模型包括多个子模型,每个子模型用于对一种类型的数据进行特征提取。这样该股票交易模型可以针对多种类型的数据进行特征提取,综合多种数据的处理结果能够更加全面、准确,因而这样的股票交易模型具有很强的预测能力。另外,该股票交易模型的自动选择类型功能比较智能,无需由人为设置哪种数据输入哪一个子模型中,而是由股票交易模型对输入的数据进行类型判别从而自主选择,实现了完全自动化。
具体地,该步骤202可以为:电子设备将该股票市场数据输入基于深度神经网络的股票交易模型中,由该股票交易模型判断该股票市场数据中每种数据的类型,将该每种数据输入该类型对应的子模型中,由每个子模型对该每种数据进行特征提取得到第一特征。
在这些实施例中,股票市场模型能够自动判别数据的类型,并根据数据类型将其输入最适合处理这类数据的子模型中,无需多个大模型,而是用一个模型处理多种数据,且这一个模型的参数是一起训练得到的,也就能够得到更准确的处理结果。
在一些实施例中,该多个子模型包括长短期记忆(Long Short Term Memory,LSTM)神经网络、循环神经网络(RecurrentNeural Networks,RNN)、反向传播(BackPropagation,BP)神经网络、多层感知机(MultilayerPerceptron,MLP)模型中至少两种。
相应地,上述根据数据的类型为其选择相应类型的子模型输入的过程可以包括以下两种情况。
情况一:响应于该股票市场数据中任一种数据为时序类型数据,电子设备将该任一种数据输入该LSTM神经网络或RNN中的至少一种网络中。
情况二:响应于该股票市场数据中任一种数据为非时序类型数据,电子设备将该任一种数据输入该BP神经网络、MLP模型中的至少一种网络中。
可以理解地,不同类型的数据需要用不同的神经网络来进行处理,不同结构的神经网络具有的特征提取能力不一定相同。LSTM神经网络和RNN能够对时序数据进行特征提取,以提取到上下文之间的语义信息。而BP神经网络和MLP模型在非时序数据上的处理能力更优,因而各取所长,每个子模型都使用最优的方案对数据进行处理,且该股票交易模型的多个子模型的参数是联合训练得到的,而不是对单个子模型训练后再简单地放置在大模型中。单个子模型训练只能提高单个子模型的准确性,多个子模型之间并无关系,后续多个一起用,则无法保证最后结果的准确性。而联合训练后,多个子模型能够体现出多个子模型训练结果叠加起来的效果,能够在训练过程中提高多个子模型整体的准确性。
子步骤二:对第一特征进行进一步处理得到第二特征。
在上述子步骤一中得到第一特征后,可以对其进一步处理,从而得到多种角度表征该股票市场数据的特征,从而基于多样的特征预测未来的股票市场变化情况也就更加准确。
具体地,该子步骤二可以通过残差卷积神经网络实现。该残差卷积神经网络包括卷积块和至少一个残差块,该卷积块包括卷积核,每个该残差块包括两个卷积层。
具体地,该子步骤二可以包括下述步骤1-步骤3。
步骤1:电子设备可以通过所述卷积块获取所述第一特征与所述卷积核权重的乘积,获取所述乘积与偏置值之和后,通过激活函数对所述乘积与偏置值之和进行归一化。
该步骤1即为电子设备通过卷积块对第一特征进行卷积操作后进行归一化的过程,该步骤1可以通过F(w*a+b)表示,其中,F()为激活函数,w为卷积核权重,a为第一特征,b为偏置值。
步骤2:电子设备通过所述至少一个残差块的两个卷积层对归一化后的特征进行两次卷积处理,得到每个残差块的输出特征。
该卷积处理操作同上,对于一个残差块来说,第一层卷积层进行卷积处理后,可以将结果输入到第二层卷积层中再进行卷积处理,最终每个残差块输出的为输出特征。
残差块可以看做成一个循环单元,上一个残差块的输出结果会输入到下一个残差块中,作为下一个残差块的输入。
步骤3:电子设备将所述至少一个残差块的输出特征之和作为第二特征。
该步骤3也即是将残差块的第二层卷积层的输出进行求和,得到第二特征。将残差块的输出特征进行求和,能够很好地避免信息在深层网络传播过程中出现梯度消失的问题。
子步骤三:对第一特征和第二特征进行进一步处理得到股票市场特征。
在一些实施例中,该子步骤三中可以先将第一特征和第二特征进行联结,得到组合特征,再对组合特征进行进一步处理,得到股票市场特征。
其中,对第一特征和第二特征进行联结的过程可以通过将两种特征进行拼接的方式实现,也可以通过对第一特征和第二特征进行加权求和的方式实现,本申请实施例对此不作限定。
得到组合特征后,本申请实施例中还可以通过自注意力机制对组合特征进行处理,以挖掘特征之间的联系。具体地,对组合特征进行处理的过程可以包括下述步骤A-步骤C。
步骤A:电子设备基于该组合特征和该组合特征在该股票市场数据中的上下文信息,得到输出向量。
该输出向量可以通过双向长短期记忆(Bi-directional Long Short-TermMemory,BiLSTM)实现。可以将组合特征输入BiLSTM中,由BiLSTM捕捉输入的组合特征的上下文信息,得到输出向量。
步骤B:电子设备通过缩放点积法计算该输出向量的Query矩阵和Key矩阵的相似度,得到权重。
该Query矩阵和Key矩阵由该输出向量与相应的权重矩阵相乘得到。在一些实施例中,在计算相似度时,为了防止相似度结果过大,会除以一个尺度标度√dk,其中,dk为Query矩阵和Key矩阵的维度,被称为缩放因子。
步骤C:电子设备通过Softmax函数对该权重进行归一化,得到概率分布的权重。
步骤D:电子设备将该概率分布的权重和该输出向量的Value矩阵进行加权求和,得到股票市场特征。
该Value矩阵由该输出向量与相应的权重矩阵相乘得到。
子步骤四:基于股票市场特征预测未来的股票市场变化情况。
通过上述步骤得到了股票市场特征,该股票市场综合了多种股票市场数据,能够从股票市场全局出发进行分析,确定出更准确的股票市场变化情况。且该过程中还利用了残差卷积神经网络,能够避免深度神经网络过深而产生的网络退化现象。且该过程还通过自注意力机制,能够较好处理长距离依赖问题。
在一些实施例中,该股票市场变化情况可以包括股票价格走势和市场情绪指数变化。该股票价格走势可以包括该股票的涨跌趋势和涨跌幅度等。市场情绪指数变化为包括用户对股票的情绪变化情况。
203、电子设备根据该未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略。
电子设备通过股票交易模型预测到未来的股票市场变化情况,则可以根据提前设定好的股票交易的生成规则,来生成当前的股票交易策略。该股票交易策略基于很多种数据得到的,考虑了全局的情况,更加准确。
在一些实施例中,该股票市场变化情况包括股票价格走势和市场情绪指数变化,该股票交易的生成规则中不同的股票价格走势和不同的市场情绪指数变化的任意组合对应有候选股票交易策略。例如,某一支股票的股票价格走势为涨,市场情绪很好,则该组合对应的候选股票交易策略为买入。
相应地,该步骤203中,电子设备可以对该股票价格走势和市场情绪指数变化,与该股票交易的生成规则进行匹配,将该股票价格走势和市场情绪指数变化的组合对应的候选股票交易策略,作为该股票交易策略。
对于股票交易策略,该股票交易策略可以包括买入、卖出和持有。当然,该股票交易策略还可以包括其他情况,例如,做多(long)、做空(short)、空仓(观望)等,本申请实施例对此不作限定。
204、电子设备自动执行该股票交易策略所指示的交易行为。
在步骤203中生成股票交易策略后,该电子设备可以实现自动化实际交易操作。也即是,根据生成的交易策略,进行实际的交易操作,自动化执行买入、卖出等操作。
在一些实施例中,该股票交易策略包括买入、卖出和持有。相应的,该步骤204可以包括以下几种情况。
情况A、响应于该股票交易策略为买入,自动在股票交易平台中登录目标账号的情况下,基于该目标账号的账号数据执行买入行为。
情况B、响应于该股票交易策略为卖出,自动在股票交易平台中登陆目标账号的情况下,基于该目标账号的账号数据执行卖出行为。
情况C、响应于该股票交易策略为持有,自动在股票交易平台中登陆目标账号的情况下,基于该目标账号的账号数据执行持有行为。
上述仅以电子设备执行上述预测和交易行为执行的步骤为例进行说明,在一些实施例中,上述步骤201至步骤204可以通过云计算和云存储实现,例如,上述步骤201至步骤204可以通过多个云服务器协作完成,采集到的数据以及生成的数据可以通过云存储技术存储于多个云服务器中。
本申请实施例通过采集多种股票市场数据,基于深度神经网络的模型对该多种股票市场数据进行充分分析,来预测出股票市场变化情况,也即充分地分析了股票市场上的各种风险,并基于风险生成股票交易策略,从而实现了股票交易的有效管理,在市场信息瞬息万变的股票市场上也能够避免因忽视股票市场的风险而出现大规模损失的情况,不仅能够满足交易量的增长需求,同时也能保证股票交易的正确性。进一步,通过残差卷积神经网络,能够解决深度神经网络过深时产生的网络退化现象。进一步,通过自注意力机制,能够较好处理长距离依赖问题。
上述所有可选技术方案,能够采用任意结合形成本申请的可选实施例,在此不再一一赘述。
图3是本申请实施例提供的一种基于深度神经网络的股票算法交易装置的结构示意图,参见图3,该装置包括:
采集模块301,用于采集股票市场数据,该股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种;
预测模块302,用于将该股票市场数据输入基于深度神经网络的股票交易模型中,由该股票交易模型根据该股票交易模型的参数,对该股票市场数据中每种数据进行特征提取得到第一特征,通过残差卷积神经网络对该第一特征进行特征提取得到第二特征,将该第一特征和该第二特征联结得到组合特征,通过自注意力机制对该组合特征以及该组合特征在该股票市场数据中的上下文信息进行处理得到股票市场特征,基于该股票市场特征预测未来的股票市场变化情况;
生成模块303,用于根据该未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略;
执行模块304,用于自动执行该股票交易策略所指示的交易行为。
在一些实施例中,该残差卷积神经网络包括卷积块和至少一个残差块,该卷积块包括卷积核,每个该残差块包括两个卷积层;
该预测模块302用于:
通过该卷积块获取该第一特征与该卷积核权重的乘积,获取该乘积与偏置值之和后,通过激活函数对该乘积与偏置值之和进行归一化;
通过该至少一个残差块的两个卷积层对归一化后的特征进行两次卷积处理,得到每个残差块的输出特征;
将该至少一个残差块的输出特征之和作为第二特征。
在一些实施例中,该预测模块302用于:
基于该组合特征和该组合特征在该股票市场数据中的上下文信息,得到输出向量;
通过缩放点积法计算该输出向量的Query矩阵和Key矩阵的相似度,得到权重;
通过Softmax函数对该权重进行归一化,得到概率分布的权重;
将该概率分布的权重和该输出向量的Value矩阵进行加权求和,得到股票市场特征。
在一些实施例中,该股票交易模型包括多个子模型,每个子模型用于对一种类型的数据进行特征提取;
该预测模块302用于:
将该股票市场数据输入基于深度神经网络的股票交易模型中,由该股票交易模型判断该股票市场数据中每种数据的类型,将该每种数据输入该类型对应的子模型中,由每个子模型对该每种数据进行特征提取得到第一特征。
在一些实施例中,该多个子模型包括长短期记忆LSTM神经网络、循环神经网络RNN、反向传播BP神经网络、多层感知机MLP模型中至少两种;
该预测模块302用于:
响应于该股票市场数据中任一种数据为时序类型数据,将该任一种数据输入该长短期记忆LSTM神经网络或循环神经网络RNN中的至少一种网络中;
响应于该股票市场数据中任一种数据为非时序类型数据,将该任一种数据输入该反向传播BP神经网络、多层感知机MLP模型中的至少一种网络中。
在一些实施例中,该股票市场变化情况包括股票价格走势和市场情绪指数变化,该股票交易的生成规则中不同的股票价格走势和不同的市场情绪指数变化的任意组合对应有候选股票交易策略;
该生成模块303用于对该股票价格走势和市场情绪指数变化,与该股票交易的生成规则进行匹配,将该股票价格走势和市场情绪指数变化的组合对应的候选股票交易策略,作为该股票交易策略。
在一些实施例中,该股票交易策略包括买入、卖出和持有;
该执行模块304用于:
响应于该股票交易策略为买入,自动在股票交易平台中登录目标账号的情况下,基于该目标账号的账号数据执行买入行为;
响应于该股票交易策略为卖出,自动在股票交易平台中登陆目标账号的情况下,基于该目标账号的账号数据执行卖出行为;
响应于该股票交易策略为持有,自动在股票交易平台中登陆目标账号的情况下,基于该目标账号的账号数据执行持有行为。
在一些实施例中,该预测模块302用于:
对采集到的该股票市场数据进行预处理,该预处理包括数据清洗、归一化、标准化中的至少一种;
将该预处理后的该股票市场数据输入基于深度神经网络的股票交易模型中。
在一些实施例中,该采集模块301用于:
获取股票交易平台中目标账号的股票市场数据;
响应于该目标账号的股票市场数据中存在交易,获取该股票市场数据中交易中、历史交易过的目标股票的市场数据、该目标股票的相关股票的市场数据、该股票交易平台所有股票的市场数据中至少一项。
本申请实施例提供的装置,通过采集多种股票市场数据,基于深度神经网络的模型对该多种股票市场数据进行充分分析,来预测出股票市场变化情况,也即充分地分析了股票市场上的各种风险,并基于风险生成股票交易策略,从而实现了股票交易的有效管理,在市场信息瞬息万变的股票市场上也能够避免因忽视股票市场的风险而出现大规模损失的情况,不仅能够满足交易量的增长需求,同时也能保证股票交易的正确性。进一步,通过残差卷积神经网络,能够解决深度神经网络过深时产生的网络退化现象。进一步,通过自注意力机制,能够较好处理长距离依赖问题。
需要说明的是:上述实施例提供的基于深度神经网络的股票算法交易装置在基于深度神经网络的股票交易时,仅以上述各功能模块的划分进行举例说明,实际应用中,能够根据需要而将上述功能分配由不同的功能模块完成,即将基于深度神经网络的股票算法交易装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于深度神经网络的股票算法交易装置与基于深度神经网络的股票算法交易方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图4是本申请实施例提供的一种电子设备的结构示意图,该电子设备400可因配置或性能不同而产生比较大的差异,能够包括一个或一个以上处理器(Central ProcessingUnits,CPU)401和一个或一个以上的存储器402,其中,该存储器402中存储有至少一条计算机程序,该至少一条计算机程序由该处理器401加载并执行以实现上述各个方法实施例提供的基于深度神经网络的股票算法交易方法。该电子设备还能够包括其他用于实现设备功能的部件,例如,该电子设备还能够具有有线或无线网络接口以及输入输出接口等部件,以便进行输入输出。本申请实施例在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括至少一条计算机程序的存储器,上述至少一条计算机程序由可由处理器执行以完成上述实施例中的基于深度神经网络的股票算法交易方法。例如,计算机可读存储介质能够是只读存储器(Read-Only Memory,简称:ROM)、随机存取存储器(RandomAccess Memory,简称:RAM)、只读光盘(Compact Disc Read-Only Memory,简称:CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或该计算机程序包括一条或多条程序代码,该一条或多条程序代码存储在计算机可读存储介质中。电子设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条程序代码,所述一个或多个处理器执行所述一条或多条程序代码,使得电子设备能够执行上述基于深度神经网络的股票算法交易方法。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应理解,根据A确定B并不意味着仅仅根据A确定B,还能够根据A和/或其它信息确定B。
本领域普通技术人员能够理解实现上述实施例的全部或部分步骤能够通过硬件来完成,也能够通过程序来指令相关的硬件完成,该程序能够存储于一种计算机可读存储介质中,上述提到的存储介质能够是只读存储器,磁盘或光盘等。
以上描述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于深度神经网络的股票算法交易方法,其特征在于,所述方法包括:
采集股票市场数据,所述股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种;
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型根据所述股票交易模型的参数,对所述股票市场数据中每种数据进行特征提取得到第一特征,通过残差卷积神经网络对所述第一特征进行特征提取得到第二特征,将所述第一特征和所述第二特征联结得到组合特征,通过自注意力机制对所述组合特征以及所述组合特征在所述股票市场数据中的上下文信息进行处理得到股票市场特征,基于所述股票市场特征预测未来的股票市场变化情况;
根据所述未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略;
自动执行所述股票交易策略所指示的交易行为。
2.根据权利要求1所述的基于深度神经网络的股票算法交易方法,其特征在于,所述残差卷积神经网络包括卷积块和至少一个残差块,所述卷积块包括卷积核,每个所述残差块包括两个卷积层;
所述通过残差卷积神经网络对所述第一特征进行特征提取得到第二特征,包括:
通过所述卷积块获取所述第一特征与所述卷积核权重的乘积,获取所述乘积与偏置值之和后,通过激活函数对所述乘积与偏置值之和进行归一化;
通过所述至少一个残差块的两个卷积层对归一化后的特征进行两次卷积处理,得到每个残差块的输出特征;
将所述至少一个残差块的输出特征之和作为第二特征。
3.根据权利要求1所述的基于深度神经网络的股票算法交易方法,其特征在于,所述通过自注意力机制对所述组合特征以及所述组合特征在所述股票市场数据中的上下文信息进行处理得到股票市场特征,包括:
基于所述组合特征和所述组合特征在所述股票市场数据中的上下文信息,得到输出向量;
通过缩放点积法计算所述输出向量的Query矩阵和Key矩阵的相似度,得到权重;
通过Softmax函数对所述权重进行归一化,得到概率分布的权重;
将所述概率分布的权重和所述输出向量的Value矩阵进行加权求和,得到股票市场特征。
4.根据权利要求1所述的基于深度神经网络的股票算法交易方法,其特征在于,所述股票交易模型包括多个子模型,每个子模型用于对一种类型的数据进行特征提取;
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型根据所述股票交易模型的参数,对所述股票市场数据中每种数据进行特征提取得到第一特征,包括:
将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型判断所述股票市场数据中每种数据的类型,将所述每种数据输入所述类型对应的子模型中,由每个子模型对所述每种数据进行特征提取得到第一特征。
5.根据权利要求4所述的基于深度神经网络的股票算法交易方法,其特征在于,所述多个子模型包括长短期记忆LSTM神经网络、循环神经网络RNN、反向传播BP神经网络、多层感知机MLP模型中至少两种;
所述由所述股票交易模型判断所述股票市场数据中每种数据的类型,将所述每种数据输入所述类型对应的子模型中,包括:
响应于所述股票市场数据中任一种数据为时序类型数据,将所述任一种数据输入所述长短期记忆LSTM神经网络或循环神经网络RNN中的至少一种网络中;
响应于所述股票市场数据中任一种数据为非时序类型数据,将所述任一种数据输入所述反向传播BP神经网络、多层感知机MLP模型中的至少一种网络中。
6.根据权利要求1所述的基于深度神经网络的股票算法交易方法,其特征在于,所述未来的股票市场变化情况包括股票价格走势和市场情绪指数变化,所述股票交易的生成规则中不同的股票价格走势和不同的市场情绪指数变化的任意组合对应有候选股票交易策略;
所述根据所述未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略,包括:
对所述股票价格走势和市场情绪指数变化,与所述股票交易的生成规则进行匹配,将所述股票价格走势和市场情绪指数变化的组合对应的候选股票交易策略,作为所述股票交易策略。
7.根据权利要求1所述的基于深度神经网络的股票算法交易方法,其特征在于,所述股票交易策略包括买入、卖出和持有;
自动执行所述股票交易策略所指示的交易行为,包括:
响应于所述股票交易策略为买入,自动在股票交易平台中登录目标账号的情况下,基于所述目标账号的账号数据执行买入行为;
响应于所述股票交易策略为卖出,自动在股票交易平台中登陆目标账号的情况下,基于所述目标账号的账号数据执行卖出行为;
响应于所述股票交易策略为持有,自动在股票交易平台中登陆目标账号的情况下,基于所述目标账号的账号数据执行持有行为。
8.一种基于深度神经网络的股票算法交易装置,其特征在于,所述装置包括:
采集模块,用于采集股票市场数据,所述股票市场数据包括股票价格、市场情绪指数、股票相关的财务数据、股票相关的政策新闻、股票研究报告、股票社交软件中的评论信息中的至少两种;
预测模块,用于将所述股票市场数据输入基于深度神经网络的股票交易模型中,由所述股票交易模型根据所述股票交易模型的参数,对所述股票市场数据中每种数据进行特征提取得到第一特征,通过残差卷积神经网络对所述第一特征进行特征提取得到第二特征,将所述第一特征和所述第二特征联结得到组合特征,通过自注意力机制对所述组合特征以及所述组合特征在所述股票市场数据中的上下文信息进行处理得到股票市场特征,基于所述股票市场特征预测未来的股票市场变化情况;
生成模块,用于根据所述未来的股票市场变化情况和股票交易的生成规则,生成股票交易策略;
执行模块,用于自动执行所述股票交易策略所指示的交易行为。
9.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求7任一项所述的基于深度神经网络的股票算法交易方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的基于深度神经网络的股票算法交易方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311511173.5A CN117495563A (zh) | 2023-11-14 | 2023-11-14 | 基于深度神经网络的股票算法交易方法、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311511173.5A CN117495563A (zh) | 2023-11-14 | 2023-11-14 | 基于深度神经网络的股票算法交易方法、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117495563A true CN117495563A (zh) | 2024-02-02 |
Family
ID=89674163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311511173.5A Pending CN117495563A (zh) | 2023-11-14 | 2023-11-14 | 基于深度神经网络的股票算法交易方法、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117495563A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476418A (zh) * | 2020-04-08 | 2020-07-31 | 智谭(浙江)信息科技有限公司 | 基于深度神经网络和多任务学习的股票数据波动预测方法 |
CN112884211A (zh) * | 2021-02-02 | 2021-06-01 | 上海卡方信息科技有限公司 | 一种基于深度学习的股价预测系统及方法 |
CN114386580A (zh) * | 2022-01-14 | 2022-04-22 | 中国农业银行股份有限公司 | 决策模型训练、决策方法、装置、电子设备及存储介质 |
CN114998010A (zh) * | 2022-05-19 | 2022-09-02 | 上海交通大学宁波人工智能研究院 | 一种基于深度强化学习和市场情绪的股票交易决策方法 |
-
2023
- 2023-11-14 CN CN202311511173.5A patent/CN117495563A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476418A (zh) * | 2020-04-08 | 2020-07-31 | 智谭(浙江)信息科技有限公司 | 基于深度神经网络和多任务学习的股票数据波动预测方法 |
CN112884211A (zh) * | 2021-02-02 | 2021-06-01 | 上海卡方信息科技有限公司 | 一种基于深度学习的股价预测系统及方法 |
CN114386580A (zh) * | 2022-01-14 | 2022-04-22 | 中国农业银行股份有限公司 | 决策模型训练、决策方法、装置、电子设备及存储介质 |
CN114998010A (zh) * | 2022-05-19 | 2022-09-02 | 上海交通大学宁波人工智能研究院 | 一种基于深度强化学习和市场情绪的股票交易决策方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019015631A1 (zh) | 生成机器学习样本的组合特征的方法及系统 | |
CN111898703B (zh) | 多标签视频分类方法、模型训练方法、装置及介质 | |
US11538029B2 (en) | Integrated machine learning and blockchain systems and methods for implementing an online platform for accelerating online transacting | |
CN114612251A (zh) | 风险评估方法、装置、设备及存储介质 | |
CN111563187A (zh) | 关系确定方法、装置、系统和电子设备 | |
CN114997916A (zh) | 潜在用户的预测方法、系统、电子设备和存储介质 | |
CN112819024A (zh) | 模型处理方法、用户数据处理方法及装置、计算机设备 | |
CN111310462A (zh) | 用户属性的确定方法、装置、设备及存储介质 | |
Peng et al. | Bank financial risk prediction model based on big data | |
Qasem et al. | Extreme learning machine for credit risk analysis | |
Liu | Application of hadoop-based cloud computing in teaching platform research | |
Li et al. | An improved genetic-XGBoost classifier for customer consumption behavior prediction | |
CN114722941A (zh) | 信贷违约识别方法、装置、设备和介质 | |
Dass et al. | Amelioration of Big Data analytics by employing Big Data tools and techniques | |
CN112052365B (zh) | 一种跨境场景画像构建方法和装置 | |
US11762896B2 (en) | Relationship discovery and quantification | |
Olszak et al. | Big Data Approach to Analyzing the IT Job Market | |
CN117495563A (zh) | 基于深度神经网络的股票算法交易方法、电子设备及介质 | |
CN114549174A (zh) | 用户行为预测方法、装置、计算机设备和存储介质 | |
CN118469715B (zh) | 一种跨境电子商务交易行为的风险管理方法及系统 | |
US20220318327A1 (en) | Ranking similar users based on values and personal journeys | |
Liu | Design of Massive Data Management System Based on DBN Algorithm | |
Wahab et al. | Applications of artificial intelligence in smart distributed processing and big data mining | |
Fallahian | Synthesizing Contextually Relevant Tabular Data Using Context-Aware Conditional Tabular Gan and Transfer Learning | |
KR20240106441A (ko) | 업무 사용자 맞춤형 지식 검색 및 컨텐츠 제공을 위한 업무지원 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |