CN108764291A - 电子装置、基于机器学习的股票择时方法及存储介质 - Google Patents

电子装置、基于机器学习的股票择时方法及存储介质 Download PDF

Info

Publication number
CN108764291A
CN108764291A CN201810387139.4A CN201810387139A CN108764291A CN 108764291 A CN108764291 A CN 108764291A CN 201810387139 A CN201810387139 A CN 201810387139A CN 108764291 A CN108764291 A CN 108764291A
Authority
CN
China
Prior art keywords
day
trade
tendency
cluster
factor values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810387139.4A
Other languages
English (en)
Inventor
李正洋
周璟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810387139.4A priority Critical patent/CN108764291A/zh
Priority to PCT/CN2018/102224 priority patent/WO2019205384A1/zh
Publication of CN108764291A publication Critical patent/CN108764291A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种电子装置、基于机器学习的股票择时方法及存储介质,首先通过获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;然后根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;再根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;最后根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。提高了股票择时交易的效率及准确性。

Description

电子装置、基于机器学习的股票择时方法及存储介质
技术领域
本发明涉及金融市场分析领域,尤其涉及一种电子装置、基于机器学习的股票择时方法及存储介质。
背景技术
随着金融市场以及金融理论的不断完善及发展,股票量化投资成为很多金融机构用来吸引股票投资者的有利因素。目前,对股票量化投资的研究主要以择时交易为主,择时交易是指利用某种方法来判断投资标的,如股票、期货、外汇等在预先确定的时间段内的走势,并根据走势确定买卖时间点的一种交易手段。而通常对股票择时交易的分析需要专业人员研究对应的趋势性择时指标,如股票的趋势性择时指标包括MA(双均线)、DMA(平均线差)、TRIX(三重指数平滑移动)等的变化,并根据择时指标的变化确定买卖交易的时间点,存在效率低下,且准确率不高的问题。
发明内容
有鉴于此,本发明提出一种电子装置、基于机器学习的股票择时方法及存储介质,能够提高股票择时交易分析的效率及准确性。
首先,本申请提出一种电子装置,所述电子装置包括存储器、及与所述存储器连接的处理器,所述处理器用于执行所述存储器上存储的基于机器学习的股票择时程序,所述基于机器学习的股票择时程序被所述处理器执行时实现如下步骤:
A10、获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
A20、根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
A30、根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
A40、根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
优选地,所述预先训练完成的择时策略分析模型为循环神经网络模型;
所述循环神经网络包括输入层、隐藏层、以及输出层;所述输入层用于输入预设时间段内各交易日对应的预设类型指标因子;所述输出层用于输出预设时间段内的相对收益率;所述隐藏层包含多层神经元,且各神经元的各个节点之间存在互连的作用,用于将所述输入层输入的预设类型指标因子通过神经元训练学习变换之后,生成各交易日对应的走势因子值。
优选地,所述预先确定的聚类算法为k-means聚类算法;所述步骤A30包括如下步骤:
E1、分别假设n个对象以及簇的数目,所述n个对象为获取的各个交易日对应的走势因子值,所述簇的数目为预定义的k类走势类别,其中n≥k,且均为正整数;
F1、从所述n个对象中任意选取k个对象分别作为预定义的初始簇,k个对象分别为预定义的初始簇的平均值;
G1、分别计算所述n个对象与各个初始簇的平均值之间的欧几里得距离,并根据计算结果,将所述n个对象分别赋予对应欧几里得距离最小的簇;
H1、重新计算各个簇的平均值,并重复执行上述步骤G1,直至预定义的准则函数收敛,则聚类结束。
优选地,所述预定义的准则函数为平方误差准则函数,所述平方误差准则函数为:
其中,E是n个交易日对应的走势因子值构成的所有对象的平方误差的总和,p是n个交易日的走势因子,mi是簇Ci的平均值。
优选地,所述走势因子值对应为不同K线形态中的点,所述走势因子值对应的走势类别包括不同的K线形态。
此外,本申请提出一种基于机器学习的股票择时方法,所述方法包括如下步骤:
S100、获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
S200、根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
S300、根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
S400、根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
优选地,所述预先训练完成的择时策略分析模型为循环神经网络模型;
所述循环神经网络包括输入层、隐藏层、以及输出层;所述输入层用于输入预设时间段内各交易日对应的预设类型指标因子;所述输出层用于输出预设时间段内的相对收益率;所述隐藏层包含多层神经元,且各神经元的各个节点之间存在互连的作用,用于将所述输入层输入的预设类型指标因子通过神经元训练学习变换之后,生成各交易日对应的走势因子值。
优选地,所述预先确定的聚类算法为k-means聚类算法;所述步骤S300包括如下步骤:
E2、分别假设n个对象以及簇的数目,所述n个对象为获取的各个交易日对应的走势因子值,所述簇的数目为预定义的k类走势类别,其中n≥k,且均为正整数;
F2、从所述n个对象中任意选取k个对象分别作为预定义的初始簇,k个对象分别为预定义的初始簇的平均值;
G2、分别计算所述n个对象与各个初始簇的平均值之间的欧几里得距离,并根据计算结果,将所述n个对象分别赋予对应欧几里得距离最小的簇;
H2、重新计算各个簇的平均值,并重复执行上述步骤G2,直至预定义的准则函数收敛,则聚类结束。
优选地,所述预定义的准则函数为平方误差准则函数,所述平方误差准则函数为:
其中,E是n个交易日对应的走势因子值构成的所有对象的平方误差的总和,p是n个交易日的走势因子,mi是簇Ci的平均值。
此外,本申请还提出一种计算机可读存储介质,所述计算机可读存储介质存储有基于机器学习的股票择时程序,所述基于机器学习的股票择时程序可被至少一个处理器执行,以使所述至少一个处理器执行如上所述的基于机器学习的股票择时方法的步骤。
相较于现有技术,本发明所提出的电子装置、基于机器学习的股票择时方法及存储介质,首先通过获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;然后根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;再根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;最后根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。提高了股票择时交易分析的效率及准确性。
附图说明
图1是本发明提出的电子装置一可选的硬件架构的示意图;
图2是本发明电子装置一实施例中基于机器学习的股票择时程序模块示意图;
图3是本发明基于机器学习的股票择时方法较佳实施例的实施流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明提出的电子装置一可选的硬件架构示意图。本实施例中,电子装置10可包括,但不仅限于,可通过通信总线14相互通信连接的存储器11、处理器12、网络接口13。需要指出的是,图1仅示出了具有组件11-14的电子装置10,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储器11至少包括一种类型的计算机可读存储介质,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器11可以是电子装置10的内部存储单元,例如电子装置10的硬盘或内存。在另一些实施例中,存储器11也可以是电子装置10的外包存储设备,例如电子装置10上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器11还可以既包括电子装置10的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于电子装置10的操作系统和各类应用软件,例如基于机器学习的股票择时程序等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。处理器12通常用于控制电子装置10的总体操作。本实施例中,处理器12用于运行存储器11中存储的程序代码或者处理数据,例如运行的基于机器学习的股票择时程序等。
网络接口13可包括无线网络接口或有线网络接口,网络接口13通常用于在电子装置10与其他电子设备之间建立通信连接。
通信总线14用于实现组件11-13之间的通信连接。
图1仅示出了具有组件11-14以及基于机器学习的股票择时程序的电子装置10,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,电子装置10还可以包括用户接口(图1中未示出),用户接口可以包括显示器、输入单元比如键盘,其中,用户接口还可以包括标准的有线接口、无线接口等。
可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED触摸器等。进一步地,显示器也可称为显示屏或显示单元,用于显示在电子装置10中处理信息以及用于显示可视化的用户界面。
在一实施例中,存储器11中存储的基于机器学习的股票择时程序被处理器12执行时,实现如下操作:
A10、获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
具体地,预先确定的股票市场指数指的是具有流动性强、规模大、能够代表股票的股价综合变动,且能够为投资者提供权威的投资方向的股票市场参考数据,例如上证50、沪深300、或者中证500等的常用参考数据。其中,上证50对应的是沪市的50只大盘股,沪深300对应的是两市市值30名以外的300只蓝筹股,其中只有极少部分与上证50重合,如浦发、联通等,中证500对应的是两市市值适中的500只个股,有许多与沪深300重合。具体地,预设类型指标因子为影响预先确定的股票市场指数的宏观指标,例如,在本实施例中,以沪深300为例,对应的预设类型指标因子包括,但不仅限于,中债国债到期收益率-中债企业债到期收益率、风险溢价、股息率、SlowD、MACD Histogram、Bollinger Bands、MA of RSI(14)[M=22]、4-period MA of 4-week MA of modified OBV-(MA4*4)、CR指标、大小盘换手率比值、RSRS指标、沪深300溢价率、沪深300主动买入额等13维指标。
其中,中债企业债到期收益率(AAA)10年-中债国债10年期,可以从大致趋势上来看当利差上升阶段,大盘也开始上行,小盘下行。反之当利差下降时指标大盘下行,小盘上行。从图上来看利差近期出现下降拐点,预示大盘开始下行,小盘风格占优。
风险溢价与股息率呈现反相关性,当股市的收益率高于债市时,资金将从债市流向股市;反之,当股指收益率低于债市时,资金将从股市流向债市。(平稳通道为average加减1std)
股息率,沪深300股息率与沪深300收盘价呈负相关性。(平稳通道为average加减1std)
SlowD,当slowD<10超卖信号出现,做多指数;当slowD>10超卖信号消失,做空指数。
MACD Histogram当MACD Histogram由负转正,做多信号出现,MACD由正转负,做空信号出现;
Bollinger Bands,当股价<下轨线BN,买入信号出现。
MA of RSI(14)[M=22],当22-day MA of RSI(14)<40时,买入信号出现,投资期限为22个交易日。
4-period MA of 4-week MA of modified OBV-(MA4*4),当股价走势和MA4*4一致时,买入信号出现,背离时,卖出信号出现。
CR指标,CR<260,能量较低,加仓信号出现。
大小盘换手率比值
当换手率<=0.1,且振幅<=-10%,市场从小盘转为大盘风格;当换手率>=0.3,且振幅>=10%,市场从大盘转为小盘。
RSRS指标,当zscore>0.7且当日MA(20)收盘价>过去三日MA(20)收盘价的时候,买入信号;当zscore<-0.7且当日MA(20)收盘价<过去三日MA(20)收盘价的时候,卖出信号
沪深300溢价率,溢价率>0,市场乐观;溢价率<0,市场悲观;历史上,溢价率触及5时,为卖出信号;溢价率触及-1时,为买入信号。
沪深300主动买入额,溢价率>0,市场乐观;溢价率<0,市场悲观;历史上,溢价率触及5时,为卖出信号;溢价率触及-1时,为买入信号。
通常,根据预设时间段内包含的交易日数目不同,预设时间段可分为超短期,短期,中期,长期,以及超长期等,例如在本实施例中,预定义超短期包含的交易日数目小于等于5,短期包含的交易日数目大于5,且小于等于10,中期包含的交易日数目大于10,且小于等于15,长期包含的交易日数目大于15日,且小于一年,超长期包含的交易日数目大于一年等。一般而言,在实际应用中,超短期和短期时间段内的时间序列数据具有较好的拟合效果,但是包含的信息较少,可用于超短线择时参考;中长期时间序列的数据包含的信息较多,但是时序间数据的依赖关系没有短期明显,导致拟合效果没有超短期和短期好,所以通常通过超长期数据刻画宏观经济形势与经济走势,并结合中长期数据,用于中长线择时参考。
A20、根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
具体地,预先训练完成的择时策略模型为采用机器学习的思路,将预设时间段内各交易日的预设类型指标因子作为机器学习模型的输入,通过机器学习预测输出各交易日对应的走势因子值。
优选地,在本实施例中,预先训练完成的择时策略模型为循环神经网络(RNN),通过循环神经网络作为机器学习算法。具体地,循环神经网络包括输入层、隐藏层(状态学习层)、以及输出层;在本实施例中,输出层用于输出预设时间段内的相对收益率,具体地,相对收益率为与预设时间段内股票市场的总收益相关的收益率;在本实施例中,相对收益率用来训练机器学习模型的反向更新梯度,而将隐藏层输出的各交易日对应的不同因子值作为择时策略模型输出的各交易日对应的走势因子值。
需要说明的是,循环神经网络(RNN)的隐藏层包括多个节点,各节点之间存在互连的作用,为整个机器学习模型的关键层。通常输入层输入的特征通过隐藏层训练学习变换之后,到达输出层。而在隐藏层包含多层神经元,可以看成一个在时间上传递的神经网络,它的深度是时间的长度,通常随着深度的加深,“梯度消失”的现象就会出现,这是由于在时间t时刻,它产生的梯度在时间轴上向历史传播几层之后就消失了,因此,在训练的过程中,需要借助输出层输出的数据训练机器学习模型的反向更新梯度,而隐藏层的神经网络对应将输入层输入的各个交易日的预设类型指标进行训练学习之后,得到各个交易日对应的因子数值,并将各个因子数值在对应的节点输出。
通过上述分析可知,本方案所使用的择时策略模型并不用于收益率的预测,在思想上更加接近于一个生成模型。本方案所涉及的择时策略模型的输出,是对应于每个交易日的隐藏层数值的分类,相当于对每一个交易日而言,生成一个标签。
A30、根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
具体地,预先确定的聚类算法为k-means聚类算法,k-means聚类算法是划分方法中较经典的聚类算法之一。由于该算法的效率高,所以在对大规模数据进行聚类时被广泛应用。目前,许多算法均围绕着该算法进行扩展和改进。
k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。在本实施例中,k-means算法的处理过程如下:首先,假设有n个交易日,随机地选择k个交易日对应的走势因子值为对象,其中,n>k,且n,k均为正整数;每个对象初始地代表了一个簇的平均值或中心;对剩余的每个对象,根据其与各簇中心的距离,将它赋给最近的簇;然后重新计算每个簇的平均值。这个过程不断重复,直到准则函数收敛。通常,准则函数采用平方误差准则,其定义如下:
其中,E是n个交易日对应的走势因子值构成的所有对象的平方误差的总和,p是空间中需要聚类的点,在本实施例中,p是n个交易日的走势因子,mi是簇Ci的平均值。该目标函数使生成的簇尽可能紧凑独立,使用的距离度量是欧几里得距离,当然也可以用其他距离度量。k-means聚类算法的算法流程如下:输入包含n个对象的数据库和簇的数目k,在本实施例中,将n个交易日对应的走势因子值作为上述n个对象,预设的k类走势类别作为簇的数目;输出k个簇,使平方误差准则最小。在本实施例中,具体包括:任意选择k个交易日的走势因子值作为初始的簇中心;根据簇中对象的平均值,将每个对象(重新)赋予最类似的簇;更新簇的平均值,即计算每个簇中对象的平均值;直到计算结果不再发生变化,则聚类结束。
进一步地,常见的走势类别可在不同K线形态中形象地表示,例如常见的K线形态有“V”字型、反转十字型、“W”型、低位档五阳线、圆弧底型、上升中途跳高弓形线、上升中途跳高剑形线、跳空攀援线等等,而走势因子值对应为各种K线形态中的一个点。
A40、根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
具体地,在本实施例的一种实施方式中,以沪深300为例,假设将一年内各交易日对应的走势因子值进行聚类分析,得到各交易日的走势因子值对应的k类市场走势类别。分别分析各交易日在各自对应的K线形态中对应的位置点,进一步确定对应的位置点后续的K线变化形态,具体地,获取历史时间段内(本实施例中,假设分析周期为1年)分别出现类似K线形态的市场走势类别,例如,统计分析一周内沪深300的走势形态,假设该一周内的各交易日对应的走势因子值对应的走势类别中有“w”底的K线变化形态,且历史上在一周内出现“w”底的K线变化形态后,在后续预设时间内,假设一周内,对应的K线变化形态更可能接近于另一确定的走势类别,假设为上升中途跳高弓形线,则确定根据上升中途跳高弓形线来确定未来一周的择时交易策略。
由上述事实施例可知,本发明提出的电子装置,首先通过获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;然后根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;再根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;最后根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。提高了股票择时交易的效率及准确性。
进一步需要说明的是,本发明的基于机器学习的股票择时程序依据其各部分所实现的功能不同,可用具有相同功能的程序模块进行描述。请参阅图2所示,是本发明电子装置一实施例中基于机器学习的股票择时程序的程序模块示意图。本实施例中,基于机器学习的股票择时程序依据其各部分所实现的功能的不同,可以被分割成获取模块201、分析模块202、聚类模块203、以及确定模块204。由上面的描述可知,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述基于机器学习的股票择时程序在电子装置10中的执行过程。所述模块201-204所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
获取模块201用于获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
分析模块202用于根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
聚类模块203用于根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
确定模块204用于根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
此外,本发明还提出一种基于机器学习的股票择时方法,请参阅图3所示,所述基于机器学习的股票择时方法包括如下步骤:
S100、获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
具体地,预先确定的股票市场指数指的是具有流动性强、规模大、能够代表股票的股价综合变动,且能够为投资者提供权威的投资方向的股票市场参考数据,例如上证50、沪深300、或者中证500等的常用参考数据。其中,上证50对应的是沪市的50只大盘股,沪深300对应的是两市市值30名以外的300只蓝筹股,其中只有极少部分与上证50重合,如浦发、联通等,中证500对应的是两市市值适中的500只个股,有许多与沪深300重合。具体地,预设类型指标因子为影响预先确定的股票市场指数的宏观指标,例如,在本实施例中,以沪深300为例,对应的预设类型指标因子包括,但不仅限于,中债国债到期收益率-中债企业债到期收益率、风险溢价、股息率、SlowD、MACD Histogram、Bollinger Bands、MA of RSI(14)[M=22]、4-period MA of 4-week MA of modified OBV-(MA4*4)、CR指标、大小盘换手率比值、RSRS指标、沪深300溢价率、沪深300主动买入额等13维指标。
其中,中债企业债到期收益率(AAA)10年-中债国债10年期,可以从大致趋势上来看当利差上升阶段,大盘也开始上行,小盘下行。反之当利差下降时指标大盘下行,小盘上行。从图上来看利差近期出现下降拐点,预示大盘开始下行,小盘风格占优。
风险溢价与股息率呈现反相关性,当股市的收益率高于债市时,资金将从债市流向股市;反之,当股指收益率低于债市时,资金将从股市流向债市。(平稳通道为average加减1std)
股息率,沪深300股息率与沪深300收盘价呈负相关性。(平稳通道为average加减1std)
SlowD,当slowD<10超卖信号出现,做多指数;当slowD>10超卖信号消失,做空指数。
MACD Histogram当MACD Histogram由负转正,做多信号出现,MACD由正转负,做空信号出现;
Bollinger Bands,当股价<下轨线BN,买入信号出现。
MA of RSI(14)[M=22],当22-day MA of RSI(14)<40时,买入信号出现,投资期限为22个交易日。
4-period MA of 4-week MA of modified OBV-(MA4*4),当股价走势和MA4*4一致时,买入信号出现,背离时,卖出信号出现。
CR指标,CR<260,能量较低,加仓信号出现。
大小盘换手率比值
当换手率<=0.1,且振幅<=-10%,市场从小盘转为大盘风格;当换手率>=0.3,且振幅>=10%,市场从大盘转为小盘。
RSRS指标,当zscore>0.7且当日MA(20)收盘价>过去三日MA(20)收盘价的时候,买入信号;当zscore<-0.7且当日MA(20)收盘价<过去三日MA(20)收盘价的时候,卖出信号
沪深300溢价率,溢价率>0,市场乐观;溢价率<0,市场悲观;历史上,溢价率触及5时,为卖出信号;溢价率触及-1时,为买入信号。
沪深300主动买入额,溢价率>0,市场乐观;溢价率<0,市场悲观;历史上,溢价率触及5时,为卖出信号;溢价率触及-1时,为买入信号。
通常,根据预设时间段内包含的交易日数目不同,预设时间段可分为超短期,短期,中期,长期,以及超长期等,例如在本实施例中,预定义超短期包含的交易日数目小于等于5,短期包含的交易日数目大于5,且小于等于10,中期包含的交易日数目大于10,且小于等于15,长期包含的交易日数目大于15日,且小于一年,超长期包含的交易日数目大于一年等。一般而言,在实际应用中,超短期和短期时间段内的时间序列数据具有较好的拟合效果,但是包含的信息较少,可用于超短线择时参考;中长期时间序列的数据包含的信息较多,但是时序间数据的依赖关系没有短期明显,导致拟合效果没有超短期和短期好,所以通常通过超长期数据刻画宏观经济形势与经济走势,并结合中长期数据,用于中长线择时参考。
S200、根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
具体地,预先训练完成的择时策略模型为采用机器学习的思路,将预设时间段内各交易日的预设类型指标因子作为机器学习模型的输入,通过机器学习预测输出各交易日对应的走势因子值。
优选地,在本实施例中,预先训练完成的择时策略模型为循环神经网络(RNN),通过循环神经网络作为机器学习算法。具体地,循环神经网络包括输入层、隐藏层(状态学习层)、以及输出层;在本实施例中,输出层用于输出预设时间段内的相对收益率,具体地,相对收益率为与预设时间段内股票市场的总收益相关的收益率;在本实施例中,相对收益率用来训练机器学习模型的反向更新梯度,而将隐藏层输出的各交易日对应的不同因子值作为择时策略模型输出的各交易日对应的走势因子值。
需要说明的是,循环神经网络(RNN)的隐藏层节点之间存在互连的作用,为整个机器学习模型的关键层。通常输入层输入的特征通过隐藏层训练学习变换之后,到达输出层。而在隐藏层包含多层神经元,可以看成一个在时间上传递的神经网络,它的深度是时间的长度,通常随着深度的加深,“梯度消失”的现象就会出现,这是由于在时间t时刻,它产生的梯度在时间轴上向历史传播几层之后就消失了,因此,在训练的过程中,需要借助输出层输出的数据训练机器学习模型的反向更新梯度,而隐藏层的神经网络对应将输入层输入的各个交易日的预设类型指标进行训练学习之后,得到各个交易日对应的因子数值,并将各个因子数值在对应的节点输出。
通过上述分析可知,本方案所使用的择时策略模型并不用于收益率的预测,在思想上更加接近于一个生成模型。本方案所涉及的择时策略模型的输出,是对应于每个交易日的隐藏层数值的分类,相当于对每一个交易日而言,生成一个标签。
S300、根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
具体地,预先确定的聚类算法为k-means聚类算法,k-means聚类算法是划分方法中较经典的聚类算法之一。由于该算法的效率高,所以在对大规模数据进行聚类时被广泛应用。目前,许多算法均围绕着该算法进行扩展和改进。
k-means算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。在本实施例中,k-means算法的处理过程如下:首先,假设有n个交易日,随机地选择k个交易日对应的走势因子值为对象,其中,n>k,且n,k均为正整数;每个对象初始地代表了一个簇的平均值或中心;对剩余的每个对象,根据其与各簇中心的距离,将它赋给最近的簇;然后重新计算每个簇的平均值。这个过程不断重复,直到准则函数收敛。通常,准则函数采用平方误差准则,其定义如下:
其中,E是n个交易日对应的走势因子值构成的所有对象的平方误差的总和,p是空间中的点,mi是簇Ci的平均值。该目标函数使生成的簇尽可能紧凑独立,使用的距离度量是欧几里得距离,当然也可以用其他距离度量。k-means聚类算法的算法流程如下:输入包含n个对象的数据库和簇的数目k,在本实施例中,将n个交易日对应的走势因子值作为上述n个对象,预设的k类走势类别作为簇的数目;输出k个簇,使平方误差准则最小。在本实施例中,具体包括:任意选择k个交易日的走势因子值作为初始的簇中心;根据簇中对象的平均值,将每个对象(重新)赋予最类似的簇;更新簇的平均值,即计算每个簇中对象的平均值;直到计算结果不再发生变化,则聚类结束。
进一步地,常见的走势类别可在不同K线形态中形象地表示,例如常见的K线形态有“V”字型、反转十字型、“W”型、低位档五阳线、圆弧底型、上升中途跳高弓形线、上升中途跳高剑形线、跳空攀援线等等,而走势因子值对应为各种K线形态中的一个点。
S400、根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
具体地,在本实施例的一种实施方式中,以沪深300为例,假设将一年内各交易日对应的走势因子值进行聚类分析,得到各交易日的走势因子值对应的k类市场走势类别。分别分析各交易日在各自对应的K线形态中对应的位置点,进一步确定对应的位置点后续的K线变化形态,具体地,获取历史时间段内(本实施例中,假设分析周期为1年)分别出现类似K线形态的市场走势类别,例如,统计分析一周内沪深300的走势形态,假设该一周内的各交易日对应的走势因子值对应的走势类别中有“w”底的K线变化形态,且历史上在一周内出现“w”底的K线变化形态后,在后续预设时间内,假设一周内,对应的K线变化形态更可能接近于另一确定的走势类别,假设为上升中途跳高弓形线,则确定根据上升中途跳高弓形线来确定未来一周的择时交易策略。
由上述事实施例可知,本发明提出的基于机器学习的股票择时方法,首先通过获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;然后根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;再根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;最后根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。提高了股票择时交易的效率及准确性。
此外,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于机器学习的股票择时程序,所述基于机器学习的股票择时程序被处理器执行时实现如下操作:
获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
本发明计算机可读存储介质具体实施方式与上述电子装置以及基于机器学习的股票方法各实施例基本相同,在此不作累述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种电子装置,其特征在于,所述电子装置包括存储器、及与所述存储器连接的处理器,所述处理器用于执行所述存储器上存储的基于机器学习的股票择时程序,所述基于机器学习的股票择时程序被所述处理器执行时实现如下步骤:
A10、获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
A20、根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
A30、根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
A40、根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
2.如权利要求1所述的电子装置,其特征在于,所述预先训练完成的择时策略分析模型为循环神经网络模型;
所述循环神经网络包括输入层、隐藏层、以及输出层;所述输入层用于输入预设时间段内各交易日对应的预设类型指标因子;所述输出层用于输出预设时间段内的相对收益率;所述隐藏层包含多层神经元,且各神经元的各个节点之间存在互连的作用,用于将所述输入层输入的预设类型指标因子通过神经元训练学习变换之后,生成各交易日对应的走势因子值。
3.如权利要求2所述的电子装置,其特征在于,所述预先确定的聚类算法为k-means聚类算法;所述步骤A30包括如下步骤:
E1、分别假设n个对象以及簇的数目,所述n个对象为获取的各个交易日对应的走势因子值,所述簇的数目为预定义的k类走势类别,其中n≥k,且均为正整数;
F1、从所述n个对象中任意选取k个对象分别作为预定义的初始簇,k个对象分别为预定义的初始簇的平均值;
G1、分别计算所述n个对象与各个初始簇的平均值之间的欧几里得距离,并根据计算结果,将所述n个对象分别赋予对应欧几里得距离最小的簇;
H1、重新计算各个簇的平均值,并重复执行上述步骤G1,直至预定义的准则函数收敛,则聚类结束。
4.如权利要求3所述的电子装置,其特征在于,所述预定义的准则函数为平方误差准则函数,所述平方误差准则函数为:
其中,E是n个交易日对应的走势因子值构成的所有对象的平方误差的总和,p是n个交易日的走势因子,mi是簇Ci的平均值。
5.如权利要求1-4任意所述的电子装置,其特征在于,所述走势因子值对应为不同K线形态中的点,所述走势因子值对应的走势类别包括不同的K线形态。
6.一种基于机器学习的股票择时方法,其特征在于,所述方法包括如下步骤:
S100、获取预先确定的股票市场指数在预设时间段内的各交易日对应的预设类型指标因子;
S200、根据预先训练完成的择时策略分析模型分别对获取的各交易日的预设类型指标因子进行分析,以输出各交易日对应的走势因子值;
S300、根据预先确定的聚类算法对各交易日对应的走势因子值进行聚类分析,以得到各交易日的走势因子值对应的走势类别;
S400、根据得到的各交易日的走势因子值对应的走势类别,确定择时交易策略。
7.如权利要求6所述的基于机器学习的股票择时方法,其特征在于,所述预先训练完成的择时策略分析模型为循环神经网络模型;
所述循环神经网络包括输入层、隐藏层、以及输出层;所述输入层用于输入预设时间段内各交易日对应的预设类型指标因子;所述输出层用于输出预设时间段内的相对收益率;所述隐藏层包含多层神经元,且各神经元的各个节点之间存在互连的作用,用于将所述输入层输入的预设类型指标因子通过神经元训练学习变换之后,生成各交易日对应的走势因子值。
8.如权利要求6所述的基于机器学习的股票择时方法,其特征在于,所述预先确定的聚类算法为k-means聚类算法;所述步骤S300包括如下步骤:
E2、分别假设n个对象以及簇的数目,所述n个对象为获取的各个交易日对应的走势因子值,所述簇的数目为预定义的k类走势类别,其中n≥k,且均为正整数;
F2、从所述n个对象中任意选取k个对象分别作为预定义的初始簇,k个对象分别为预定义的初始簇的平均值;
G2、分别计算所述n个对象与各个初始簇的平均值之间的欧几里得距离,并根据计算结果,将所述n个对象分别赋予对应欧几里得距离最小的簇;
H2、重新计算各个簇的平均值,并重复执行上述步骤G2,直至预定义的准则函数收敛,则聚类结束。
9.如权利要求6所述的基于机器学习的股票择时方法,其特征在于,所述预定义的准则函数为平方误差准则函数,所述平方误差准则函数为:
其中,E是n个交易日对应的走势因子值构成的所有对象的平方误差的总和,p是n个交易日的走势因子,mi是簇Ci的平均值。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有基于机器学习的股票择时程序,所述基于机器学习的股票择时程序可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求6-9中任一项所述的基于机器学习的股票择时方法的步骤。
CN201810387139.4A 2018-04-26 2018-04-26 电子装置、基于机器学习的股票择时方法及存储介质 Pending CN108764291A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810387139.4A CN108764291A (zh) 2018-04-26 2018-04-26 电子装置、基于机器学习的股票择时方法及存储介质
PCT/CN2018/102224 WO2019205384A1 (zh) 2018-04-26 2018-08-24 电子装置、基于机器学习的股票择时方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810387139.4A CN108764291A (zh) 2018-04-26 2018-04-26 电子装置、基于机器学习的股票择时方法及存储介质

Publications (1)

Publication Number Publication Date
CN108764291A true CN108764291A (zh) 2018-11-06

Family

ID=64012111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810387139.4A Pending CN108764291A (zh) 2018-04-26 2018-04-26 电子装置、基于机器学习的股票择时方法及存储介质

Country Status (2)

Country Link
CN (1) CN108764291A (zh)
WO (1) WO2019205384A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110895585A (zh) * 2019-10-18 2020-03-20 深圳市富途网络科技有限公司 股票数据获取方法、装置、终端设备及存储介质
CN111402042A (zh) * 2020-02-17 2020-07-10 中信建投证券股份有限公司 一种用于股市大盘形态分析的数据分析与显示方法
CN111429272A (zh) * 2020-02-20 2020-07-17 中信建投证券股份有限公司 自动生成量化交易因子及重要性评判的方法、装置
CN114638701A (zh) * 2022-03-28 2022-06-17 中国银行股份有限公司 股债性价比分析方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435623B (zh) * 2020-03-23 2024-07-19 北京沃东天骏信息技术有限公司 一种预警方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952161A (zh) * 2017-03-31 2017-07-14 洪志令 一种基于长短期记忆深度学习网络的股票近期走势预测方法
CN107844865A (zh) * 2017-11-20 2018-03-27 天津科技大学 基于特征参数选取与lstm模型的股指预测方法
CN107832897A (zh) * 2017-11-30 2018-03-23 浙江工业大学 一种基于深度学习的股票市场预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110895585A (zh) * 2019-10-18 2020-03-20 深圳市富途网络科技有限公司 股票数据获取方法、装置、终端设备及存储介质
CN110895585B (zh) * 2019-10-18 2022-08-23 深圳市富途网络科技有限公司 股票数据获取方法、装置、终端设备及存储介质
CN111402042A (zh) * 2020-02-17 2020-07-10 中信建投证券股份有限公司 一种用于股市大盘形态分析的数据分析与显示方法
CN111402042B (zh) * 2020-02-17 2023-10-27 中信建投证券股份有限公司 一种用于股市大盘形态分析的数据分析与显示方法
CN111429272A (zh) * 2020-02-20 2020-07-17 中信建投证券股份有限公司 自动生成量化交易因子及重要性评判的方法、装置
CN111429272B (zh) * 2020-02-20 2023-08-22 中信建投证券股份有限公司 自动生成量化交易因子及重要性评判的方法、装置
CN114638701A (zh) * 2022-03-28 2022-06-17 中国银行股份有限公司 股债性价比分析方法及装置

Also Published As

Publication number Publication date
WO2019205384A1 (zh) 2019-10-31

Similar Documents

Publication Publication Date Title
CN108764291A (zh) 电子装置、基于机器学习的股票择时方法及存储介质
US10152752B2 (en) Methods and systems for computing trading strategies for use in portfolio management and computing associated probability distributions for use in option pricing
CN107146015A (zh) 多变量时间序列预测方法和系统
TWI769763B (zh) 資料處理方法及裝置
CN110443715A (zh) 基金产品推荐方法、装置、设备及计算机可读存储介质
US20160086277A1 (en) Stochastic Dynamic Programming in a Computer Using a Multi-Part Utility Function and Local Search to Efficiently Compute Asset Allocation and Consumption
Zhang et al. Combining expert weights for online portfolio selection based on the gradient descent algorithm
CN111047140A (zh) 一种处理方法、装置及设备
CN117035948B (zh) 基于大数据的任务智能处理方法及系统
CN108376301A (zh) 股票走势预测装置、方法及可读存储介质
CN109583937A (zh) 一种产品推荐方法和装置
Chiarella et al. An adaptive model on asset pricing and wealth dynamics with heterogeneous trading strategies
CN112292699A (zh) 确定执行设备的动作选择方针
CN107239853B (zh) 一种基于云计算的智慧管家系统及其工作方法
CN112184305A (zh) 一种企业估值方法、装置、电子设备及可读存储介质
CN113688297A (zh) 期权信息的显示和分析方法、装置、设备及存储介质
CN104321800A (zh) 价格目标生成器
Jung et al. Developing a dynamic portfolio selection model with a self-adjusted rebalancing method
US20220044325A1 (en) Option pricing
Yu et al. FinCon: A Synthesized LLM Multi-Agent System with Conceptual Verbal Reinforcement for Enhanced Financial Decision Making
Nkomo et al. Kalman filtering and online learning algorithms for portfolio selection
CN109636088A (zh) 一种用于评估银行间市场流动性的方法及装置
CN109447793A (zh) 高频数据的波动率获取方法、装置及计算机可读存储介质
Campisi et al. Forecasting returns in the US market through fuzzy rule-based classification systems
Liu et al. Lcyanalysis: An R package for technical analysis in stock markets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181106