CN111292188A - 配对交易智能一体化回测系统 - Google Patents

配对交易智能一体化回测系统 Download PDF

Info

Publication number
CN111292188A
CN111292188A CN202010067204.2A CN202010067204A CN111292188A CN 111292188 A CN111292188 A CN 111292188A CN 202010067204 A CN202010067204 A CN 202010067204A CN 111292188 A CN111292188 A CN 111292188A
Authority
CN
China
Prior art keywords
paired
stocks
stock
data
transaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010067204.2A
Other languages
English (en)
Inventor
于晓雨
毕秀春
李力婉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202010067204.2A priority Critical patent/CN111292188A/zh
Publication of CN111292188A publication Critical patent/CN111292188A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种配对交易智能一体化回测系统,系统可以实时更新行情数据,无需手动更新行情;可以通过两种配对股票的选取方法,使得配对股票的选择性更加多元;同时,支持自动生成针对配对交易效果的回测分析报告,无需用户根据回测数据人为分析,避免了用户的分析出现主观偏差的现象。

Description

配对交易智能一体化回测系统
技术领域
本发明涉及配对交易回测技术领域,尤其涉及一种配对交易智能一体化回测系统。
背景技术
配对交易为两种类型:一类是基于统计套利的配对交易,一类是基于风险套利的配对交易,基于统计套利的配对交易策略是一种市场中性策略。目前在选择配对股票时,大多采用协整性检验的方式。
目前针对配对交易的阈值研究主要涉及三类研究方法:随机控制方法、时间序列方法和智能算法,以实现配对交易的回测分析。rnstein-Uhlenbeck(O-U)模型是随机控制方法中最常见的模型,其主要思想为通过假设股票的对数价格服从O-U过程,通过求解HJB方程得到最优效用下的交易阈值。另外,还有Geometric Brownian Motion(GBM)模型、Levy跳模型、机会成本模型等。时间序列方法主要是通过GARCH模型来预测股票波动率,利用波动率来决定交易阈值。但是,上述两种方法的结果不够可靠。智能算法主要是通过神经网络、机器学习、仿生寻优算法等智能预测和优化算法来预测价差走势、决定交易阈值。与传统的随机控制、时间序列方法相比,智能算法得到的结果更贴合实际,能够灵活有效的计算和更新参数,拥有广阔的发展空间。
但是,目前的配对交易回测系统往往不支持实时行情接口和智能算法,由于历史数据库内的历史行情数据是静态的,导致行情数据不会实时更新,其次回测系统往往不支持智能算法的回测,例如基于神经网络、机器学习类的算法在很多平台上无法实时跑通,导致策略无法进行回测。
发明内容
本发明的目的是提供一种配对交易智能一体化回测系统,可以实现行情数据实时更新,可以支持智能算法计算交易阈值,从而准确实现交易回测。
本发明的目的是通过以下技术方案实现的:
一种配对交易智能一体化回测系统,包括:实时行情接口、历史行情数据库、配对股票选取模块、智能阈值计算模块、精确回测系统和智能分析系统;其中:
所述实时行情接口,用于提供实时行情的对接,并且同步写入历史行情数据库,实时更新历史行情数据库;
所述历史行情数据库,用于储存历史产生的配对股票的交易行情数据,给系统提供历史行情数据;
所述配对股票选取模块,用于采用协整性检验或者部分协整性检验方式对配对股票进行校验,选出符合校验要求的配对股票并计算配对股票的信息;
所述智能阈值计算模块,用于根据配对股票的信息,利用智能算法计算配对股票的最优交易阈值;
所述精确回测系统,用于利用配对股票的最优交易阈值结合相应配对股票的数据进行回测,获得配对股票的回测数据;
所述智能分析系统,用于对配对股票的回测数据进行分析,得到配对股票的分析报告。
由上述本发明提供的技术方案可以看出,系统可以实时更新行情数据,无需手动更新行情;且提供两种协整性检验和部分协整性检验两种方式选择配对股票,使得配对股票的选择性更加多元;同时,支持自动生成针对配对交易效果的回测分析报告,无需用户根据回测数据人为分析,避免了用户的分析出现主观偏差的现象,可以使得分析结果更为准确。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种配对交易智能一体化回测系统的示意图。
图2为本发明实施例提供的遗传算法中交叉示意图;
图3为本发明实施例提供的遗传算法中变异示意图;
图4为本发明实施例提供的开平仓示意图;
图5为本发明实施例提供的历史最大回撤示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种配对交易智能一体化回测,如图1所示,其主要包括:实时行情接口、历史行情数据库、配对股票选取模块、智能阈值计算模块、精确回测系统和智能分析系统;其中:
所述实时行情接口,用于提供实时行情的对接,并且同步写入历史行情数据库,实时更新历史行情数据库;
所述历史行情数据库,用于储存历史产生的配对股票的交易行情数据,给系统提供历史行情数据;
所述配对股票选取模块,用于采用协整性检验或者部分协整性检验方式对配对股票进行校验,选出符合校验要求的配对股票并计算配对股票的信息;
所述智能阈值计算模块,用于根据配对股票的信息,利用智能算法计算配对股票的最优交易阈值;
所述精确回测系统,用于利用配对股票的最优交易阈值结合相应配对股票的数据进行回测,获得配对股票的回测数据;
所述智能分析系统,用于对配对股票的回测数据进行分析,得到配对股票的分析报告。
为了便于理解,下面针对上述系统做进一步介绍。
一、实时行情接口。
本发明实施例中,实时行情接口获取实时行情的方式为:1)通过交易所提供的ctp接口获取实时行情;2)无法若无法获得交易所提供的行情接口,则可通过网络爬虫的方法或使用当前市场上公开免费的接口(例如Tushare)获取实时行情,但该获取方式与实时行情ctp接口相比有所延迟,无法实现高频交易的实盘操作。
本发明实施例总,实时行情的周期为tick级别或者分钟级别,可根据用户的需求设置。
本发明实施例提供的实时行情接口,可实时更新行情数据,无需手动更新行情,还可支持实盘交易。
二、历史行情数据库
本发明实施例中,历史行情数据库通过mysql实现,其包含两类数据,分别为tick数据和1分钟数据,并且每类数据中均包括中国A股市场所有股票分行业的行情数据。
本领域技术人员可以理解,Tick的含义为帧。本领域中,可以理解为高频,Tick级别的数据即是高频数据,Tick级别的交易即是高频交易。
示例性的,行业分类标准可以参照MSCI发布的全球行业分类标准,共分为材料、房地产、工业、公共事业、金融、可选消费、能源、日常消费品、信息技术、医疗保健和电信业务共11个行业。
三、配对股票选取模块。
本发明实施例中,提供两种配对股票的选取方法(协整性检验和部分协整检验)使配对股票的选择更多元。——协整性检验适合长期投资的股票对,部分协整检验适合高频交易。
1、协整性检验。
现有协整方法中应用最广泛的是Engle-Granger检验法和Johansen检验法,下面以Engle-Granger检验法进行协整性检验为例进行介绍,介绍之前,给出单整和协整的定义:
1)若一个时间序列{yt}在成为稳定序列之前必须经过d次差分,则称该时间序列是d阶单整,记为yt~I(d)。
2)设随机向量{Xt}中所含分量均为d阶单整,记为Xt~I(d);如果存在一个非零向量β,使得随机向量Yt=βXt~I(d-b),b>0,则称随机向量Xt具有d,b阶协整关系,记为Xt~CI(d,b),向量β被称为协整向量。
协整性检验的优选实施方式如下:
1)对股票每日复权收盘价时间序列进行ADF(Augmented Dickey-Fuller test)平稳性检验,若序列不满足平稳性要求,则进行一阶差分后再进行平稳性检验;若满足平稳性要求,则相应时间序列为一阶单整。此步骤可以使用的python statsmodels;tsa;stattools包中的adfuller函数实现。
2)协整性检验,对一阶单整的时间序列进行两两协整性检验,将通过协整性检验的股票对加入配对股票池中。此步骤可以使用python statsmodels;tsa;stattools包中的coint函数实现。
计算配对股票的Z-score序列:通过OLS法(最小二乘法)计算符合协整性配对股票的线性回归方程yt=α+β*xt的回归方程的截距α值与回归方程的斜率β值,其中,yt与xt分别表示配对股票中两个股票的价格时间序列。
残差为et=yt-(α+β*xt),Z-score为标准化后的残差序列,其中t时刻的Z-score值的计算公式为:
Figure BDA0002376328520000051
其中,mean、sd分别表示平均值和标准差。
2、部分协整检验。
部分协整理论是协整理论的弱化,它允许残差序列同时具有均值回归和随机游走性质,优选实施方式如下:
1)假设X1=(X1,t)t∈T和X2=(X2,t)t∈T为两个时间序列,X1,t与X2,t为两个股票在t时刻的价格,T为总时刻;X1与X2部分协整,则:
X2,t=β′X1,t+Wt
Wt=Mt+Rt
Figure BDA0002376328520000052
Figure BDA0002376328520000053
其中,参数β′为实数,Mt、Mt-1分别表示t、t-1时刻两支股票价格差中的均值回归部分,Rt、Rt-1分别表示t、t-1时刻两支股票价格差中的随机游走部分,一阶自回归系数ρ∈(-1,1),εM,t、εR,t分别为期望为0,方差为
Figure BDA0002376328520000054
的独立高斯白噪声过程;
时间序列X1和X2服从残差为W=(Wt)t∈T的偏自回归关系,均值回归部分的方差在总残差方差中的占比是偏自回归模型的关键统计量,记为:
Figure BDA0002376328520000055
其中,Var表示方差,B是滞后算子,当
Figure BDA0002376328520000056
时,表示均值回归部分占比为0,全部都是随机游走部分,当
Figure BDA0002376328520000057
时,意味着随机游走部分占比为0,全部都是均值回归部分;
由于Mt和Rt是不可直接观察的,根据卡尔曼滤波极大似然函数法估计参数β′,ρ,σMR,通过卡尔曼滤波等式计算得到Mt和Rt的值;
记t时刻标准化后的均值回归部分值为:
Figure BDA0002376328520000061
通过上述方式计算出了求得了协整检验和部分协整检验的Z-score(也即配对股票的信息),下一步骤的阈值就是求解Z-score值的最优交易阈值。
四、智能阈值计算模块。
通过前述公式可以看出,Z-score值是通过股票价格时间序列计算得出的,可以理解为经过处理的配对股票价格差,求解最优交易阈值就是从Z-score值中找出最优的数值,使得收益最大化。
本发明实施例中,阈值的选取方式更智能,历史回测结果较之前的阈值选择方式来说更好,在系统中可以支持人工智能方向的迭代,这是当前很多系统不支持的。
本发明实施例中,所利用的智能算法为遗传算法、粒子群算法或者神经网络算法。
其中,遗传算法是一类借鉴生物界的进化规律即适者生存、优胜劣汰遗传机制演化而来的随机化搜索方法,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。遗传算法已被广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域,是现代有关智能计算中的关键技术。
遗传算法使用二进制遗传编码,通过遗传算法获得最优交易阈值的优选实施方式如下:
首先,参数设置如下:由于Z-score是标准化后的均值回归值或者残差序列,为与常见的开平仓阈值范围[-2.5,2.5]保持一致,同时预留更多的选择空间,设置上开仓阈值L1o搜索范围为[0,3],上平仓阈值L1c搜索范围为L1o+[-6,0];下开仓阈值L2o搜索范围为[-3,0],下平仓阈值L2c搜索范围为L2o+[0,6];止损阈值Lloss搜索范围为[0,0.1];将设置的上述交易阈值的范围,以及Z-score值通过遗传算法求解配对股票的最优交易阈值,也即从各交易阈值范围中选出最优值使得收益达到最大;遗传算法步骤如下:
1、初始化:设置种群规模N,交叉概率Pc,变异概率Pm,最大进化代数K,进化代数计数器k=0,随机生成N个个体作为初始种群P(0)。
2、个体评价:计算种群P(k)中各个个体的适应度,适应度计算方式可参见现有技术。
3、种群进化:分为选择母体、交叉、变异和选择子代四个步骤。
1)选择母体:从种群P(k)中通过选择算子选择出M/2对母体,M≥N。当在一个种群中进行自然选择时,适应度越大的母体被选择的概率也就越大;个体Ii的采样概率如下定义,
Figure BDA0002376328520000071
其中,f(Ii)为个体Ii的适应度。
2)交叉:对所选的M/2对母体,以概率Pc交叉形成M个中间个体。即模拟两条染色体交换基因片段;与人类的双倍染色体不同,遗传算法的染色体是单倍体,如图2所示,为遗传算法中交叉示意图,交叉时两条染色体之间交换以编码表示的等位基因。
3)变异:对M个中间个体分别以概率Pm变异,形成M个候选个体。即某个基因位发生变化,表示在算法中即某个位置的编码发生突变。如图3所示,为遗传算法中变异示意图,箭头标记位置变异前编码为1,变异后编码变为0。
4)选择子代:从M个候选个体中通过适应度从大到小的排序中选择出前N个个体组成新一代种群P(k+1)。
4、终止检验:若k=K,则以进化过程中所得到的具有最大适应度个体作为最优解输出,从而获得各类型交易阈值的最优交易阈值,终止计算。
为保证计算充分,可以设置最大进化代数K=500为建议值K∈[100,500]的最高值;可以设置种群规模N=100,变异概率为Pm=0.1%;为防止过拟合,遗传算法的参数没有经过调试,都为默认参数或建议参数。
粒子群算法与神经网络算法的实现过程可见参见现有技术,故不再赘述。
本发明实施例中,Z-score值、以及最优交易阈值都是针对一个配对股票而言,所有配对股票均可按照上述方式计算出对应的Z-score值、以及最优交易阈值。
五、精确回测系统。
本发明实施例中,回测考虑到了滑点、手续费、成交量等因素,回测系统与实际交易贴合紧密。
本发明实施例中,所述精确回测系统包括:行情数据的定制、区分训练集和测试集、仓位与收益的计算、开平仓与止损方式、以及回测指标计算。即,通过行情数据的定制确定数据形式,通过区分训练集和测试集计算出最优交易阈值,并利用最优交易阈值进行回测,开平仓与止损方式是通过最优交易阈值进行开平仓与止损,仓位与收益的计算是通过开平仓与止损的方式计算收益,回测指标计算是基于收益计算回测指标。
1、所述行情数据的定制,是指从历史行情数据库中提取tick数据或者1分钟数据,再在回测系统中通过一日内的tick数据或者1分钟数据,合成日收盘价数据;以1分钟数据为例,合成方法为提取当前日的最后一个1分钟数据,其收盘价即为日收盘价。
2、区分训练集和测试集:对于一个配对股票,需要设置前K个数据为训练数据,后S个数据为测试数据,通过训练数据求得最优交易阈值,再在测试数据中进行回测;所述的每一个数据是指一天的日收盘价数据。
本发明实施例中,可以设置K=1000,S=300。也就是说,可以利用配对股票的前1000天的数据作为训练数据,通过智能阈值计算模块计算出最优交易阈值,回测过程中,只需要根据测试数据计算相应的Z-score值,然后直接利用最优交易阈值进行相应配对股票的回测。
3、开平仓与止损方式:最优交易阈值包含上开仓阈值L1o、上平仓阈值L1c、下开仓阈值L2o、下平仓阈值L2c、止损阈值为Lloss,配对股票的信息记为Zt(可以是通过前文介绍的方式计算出的
Figure BDA0002376328520000081
或者
Figure BDA0002376328520000082
),则:
1)开仓条件:L1o<Zt<L1c,或L2c<Zt<L2o且此时无仓位时开仓,所述开仓是同时开多仓的股票Q或股票P,和空仓的股票P或股票Q。
2)平仓条件:Zt≥L1c,或Zt≤L2c且此时多仓和空仓的仓位时平仓。
3)止损条件:每个交易日实时监控当前总资金,若当前总资金Vt2与开仓前的总资金Vt1相比处于亏损状态,且亏损比例(Vt2-Vt1)/V0≥Lloss,则进行止损平仓,等待下个交易机会。
4)强制平仓条件:若回测时间到达最后一个有数据的交易日,而此时还有未平仓仓位时,则进行强制平仓。
图4给出了开平仓示意图,图4的四条虚线,从下至上依次为下开仓线、上平仓线、上开仓线、下平仓线,四条虚线对应数值也即对应的阈值。
4、仓位与收益的计算:假设通过部分协整校验选出的配对股票为P和Q,股票价格关系为X2,t=β′*X1,t+Wt,其中X1,t表示t时刻股票P的价格,X2,t表示t时刻股票Q的价格;这意味着,买多一手股票Q,同时要卖空β手股票P,买多1元的股票Q,代表买了1/X2,t手的股票Q,此时,应卖空βX1,t/X2,t的股票P,代表卖了β/X2,t手的股票P,很显然βX1,t/X2,t与开始时的1元不等价,为了保持市场中性,设置:
1)若βX1,t/X2,t≤1,则投资V元在股票Q上,即V/X2,t手股票Q,同时投资V*βX1,t/X2,t在股票P上,即β*V/X2,t手股票P。
2)若βX1,t/X2,t>1,则投资V元在股票P上,即V/X1,t手股票P,同时投资VX2,t/βX1,t在股票Q上,即V/βX1,t手股票股票Q。
本领域技术人员可以理解,因为配对要一方做多、另一方做空才能完成,因此此处的投资包含有买多与卖空的概念。
同时,在收益计算时,还考虑手续费(固定比例),每一笔交易都会产生相应的手续费,根据交易数额计算。
假设初始资金V0为1000万人民币,交易手续费为单笔万分之五,每个交易日实时更新当前资金情况,通过资金曲线计算收益。每次开仓由初始资金计算仓位,止损按照初始资金的比例进行判断,其余资金不做任何操作,排除连续复利导致的收益虚高的情况,使实证结果更贴合实际。
5、回测指标计算。
回测的目的就是计算回测指标,整体的思路是计算出最优交易阈值,基于最优交易阈值与开平仓与止损方式进行回测,并按照上部分提到方式计算收益。回测时开平仓与止损将影响回测的表现,例如,止损从10%改为20%,那么回测的收益率会有所变化,但具体的变化无法用公式描述,这些回测指标是基于开平仓与止损方式的收益率数据计算得到的。示例性的:
(1)假设今天10块钱买了一只股票,明天15元卖出。
(2)假设昨天5块钱买了一只股票,也是明天15元卖出。
(1)和(2)的策略导致的收益不同,一个是5元,一个是10元。也就是说,开平仓与止损方式变化会影响最后的收益,而开平仓与止损方式变化又通过最优交易阈值来控制。
回测指标主要包括:
1)夏普比:计算公式为
Figure BDA0002376328520000091
E(Rp)表示投资组合预期回报率,是指以日为单位计算得到的收益率;Rf是以日为单位的无风险利率;σp表示投资组合标准差,通过计算每日收益率的标准差来表示;乘
Figure BDA0002376328520000092
得到年化夏普比;
2)历史最大回撤:通过收益曲线动态历史最高点和最低点的差值计算得出,是动态累积记录的过程。
历史最大回撤就是指在回测时间内,发生的最大的损失。
示例性的:上周以1元买股票A,它在这周的价格走势是:1——2——3——2——1——4——3,则发生的最大的损失就是从3跌到1,所以历史最大回撤就是2元(损失)/1元(初始投资)=200%。
如图5所示,为历史最大回撤示意图,图5中曲线为收益率曲线,历史最大回撤区间发生在2012年10月至2013年2月间,共损失23%的总利润。
3)单日最大回撤:单个交易日的动态收益的最大回撤。
如上个示例所述,单日最大回撤就是从3跌到了2,单日最大回撤=1元(损失)/1元(初始投资)=100%。
4)交易次数:回测期间总交易次数,一次开仓和一次平仓综合成为一次交易。
5)交易频率:总交易日与交易次数的比值。
六、智能分析系统。
本发明实施例中,智能分析系统支持自动生成针对配对交易效果的回测分析报告,无需用户根据回测数据人为分析,避免了用户的分析出现主观偏差的现象,解决用户在选择配对股票时的痛点。
本发明实施例中,配对股票的分析报告主要包括:
1)配对股票训练和回测期间的夏普比排名情况。
2)配对股票训练和回测期间的最大回撤,包括历史最大回撤和单次最大回撤。
3)配对股票训练和回测期间的年化收益率,可日为单位计算得到的收益率计算得到。
4)配对股票训练和回测期间的交易次数与交易频率;
5)配对股票训练和回测期间的手续费情况。
根据以上5点进行配对股票的排名,按照打分制进行打分,输出最终分值情况。
分析报告包括以上5点的排名和具体情况、总分数、总分数排名、低分区域(例如,某配对股票夏普比排名靠前,但交易频率排名落后,低分区域会提醒用户该配对股票的交易频率较低)、合理建议(根据不同情况设置不同建议)等。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (7)

1.一种配对交易智能一体化回测系统,其特征在于,包括:实时行情接口、历史行情数据库、配对股票选取模块、智能阈值计算模块、精确回测系统和智能分析系统;其中:
所述实时行情接口,用于提供实时行情的对接,并且同步写入历史行情数据库,实时更新历史行情数据库;
所述历史行情数据库,用于储存历史产生的配对股票的交易行情数据,给系统提供历史行情数据;
所述配对股票选取模块,用于采用协整性检验或者部分协整性检验方式对配对股票进行校验,选出符合校验要求的配对股票并计算配对股票的信息;
所述智能阈值计算模块,用于根据配对股票的信息,利用智能算法计算配对股票的最优交易阈值;
所述精确回测系统,用于利用配对股票的最优交易阈值结合相应配对股票的数据进行回测,获得配对股票的回测数据;
所述智能分析系统,用于对配对股票的回测数据进行分析,得到配对股票的分析报告。
2.根据权利要求1所述的一种配对交易智能一体化回测系统,其特征在于,
实时行情接口获取实时行情的方式为:通过交易所提供的ctp接口获取实时行情;或者,通过网络爬虫的方法或使用当前市场上公开免费的接口获取实时行情;
实时行情的周期为tick级别或者分钟级别。
3.根据权利要求1所述的一种配对交易智能一体化回测系统,其特征在于,历史行情数据库通过mysql实现,其包含两类数据,分别为tick数据和1分钟数据,并且每类数据中均包括中国A股市场所有股票分行业的行情数据。
4.根据权利要求1所述的一种配对交易智能一体化回测系统,其特征在于,采用协整性检验或者部分协整性检验方式对配对股票进行校验,选出符合校验要求的配对股票并计算配对股票的信息包括:
协整性检验,步骤包括:
对配对股票每日复权收盘价时间序列进行ADF平稳性检验,若序列不满足平稳性要求,则进行一阶差分后再进行平稳性检验;若满足平稳性要求,则相应时间序列为一阶单整;
协整性检验,对一阶单整的时间序列进行两两协整性检验,将通过协整性检验的股票对加入配对股票池中;
计算配对股票的Z-score序列:通过最小二乘法计算符合协整性配对股票的线性回归方程yt=α+β*xt的回归方程的截距α值与回归方程的斜率β值,其中,yt与xt分别表示配对股票中两个股票的价格时间序列,残差为et=yt-(α+β*xt),Z-score为标准化后的残差序列,其中t时刻的Z-score值的计算公式为:
Figure FDA0002376328510000021
其中,mean、sd分别表示平均值和标准差;
或者,进行部分协整检验,步骤包括:
假设X1=(X1,t)t∈T和X2=(X2,t)t∈T为两个时间序列,X1,t与X2,t为两个股票在t时刻的价格,T为总时刻;X1与X2部分协整,则:
X2,t=β′X1,t+Wt
Wt=Mt+Rt
Figure FDA0002376328510000022
Figure FDA0002376328510000023
其中,参数β′为实数,Mt、Mt-1分别表示t、t-1时刻两支股票价格差中的均值回归部分,Rt、Rt-1分别表示t、t-1时刻两支股票价格差中的随机游走部分,一阶自回归系数ρ∈(-1,1),εM,t、εR,t分别为期望为0,方差为
Figure FDA0002376328510000024
的独立高斯白噪声过程;
时间序列X1和X2服从残差为W=(Wt)t∈T的偏自回归关系,均值回归部分的方差在总残差方差中的占比是偏自回归模型的关键统计量,记为:
Figure FDA0002376328510000025
其中,Var表示方差,B是滞后算子,当
Figure FDA0002376328510000026
时,表示均值回归部分占比为0,全部都是随机游走部分,当
Figure FDA0002376328510000027
时,意味着随机游走部分占比为0,全部都是均值回归部分;
根据卡尔曼滤波极大似然函数法估计参数β′,ρ,σM,σR,通过卡尔曼滤波等式计算得到Mt和Rt的值;
记t时刻标准化后的均值回归部分值为:
Figure FDA0002376328510000028
5.根据权利要求1所述的一种配对交易智能一体化回测系统,其特征在于,根据配对股票的信息,利用智能算法计算配对股票的交易阈值,并获得最优交易阈值,所利用的智能算法为遗传算法、粒子群算法或者神经网络算法;其中,利用遗传算法获得最优交易阈值的方式包括:
参数设置如下:设置上开仓阈值L1o搜索范围为[0,3],上平仓阈值L1c搜索范围为L1o+[-6,0];下开仓阈值L2o搜索范围为[-3,0],下平仓阈值L2c搜索范围为L2o+[0,6];止损阈值Lloss搜索范围为[0,0.1];将设置的上述交易阈值的范围,以及Z-score值通过遗传算法求解配对股票的最优交易阈值,也即从各交易阈值范围中选出最优值使得收益达到最大;遗传算法步骤如下:
初始化:设置种群规模N,交叉概率Pc,变异概率Pm,最大进化代数K,进化代数计数器k=0,随机生成N个个体作为初始种群P(0);
个体评价:计算种群P(k)中各个个体的适应度;
种群进化:分为选择母体、交叉、变异和选择子代四个步骤;
选择母体:从种群P(k)中通过选择算子选择出M/2对母体,M≥N;
交叉:对所选的M/2对母体,以概率Pc交叉形成M个中间个体;
变异:对M个中间个体分别以概率Pm变异,形成M个候选个体;
选择子代:从M个候选个体中通过适应度从大到小的排序中选择出前N个个体组成新一代种群P(k+1);
终止检验:若k=K,则以进化过程中所得到的具有最大适应度个体作为最优解输出,从而获得各类型交易阈值的最优交易阈值,终止计算。
6.根据权利要求1所述的一种配对交易智能一体化回测系统,其特征在于,所述精确回测系统包括:行情数据的定制、区分训练集和测试集、仓位与收益的计算、开平仓与止损方式、以及回测指标计算;即,通过行情数据的定制确定数据形式,通过区分训练集和测试集计算出最优交易阈值,并利用最优交易阈值进行回测,开平仓与止损方式是通过最优交易阈值进行开平仓与止损,仓位与收益的计算是通过开平仓与止损的方式计算收益,回测指标计算是基于收益计算回测指标;其中:
所述行情数据的定制,是指从历史行情数据库中提取tick数据或者1分钟数据,再在回测系统中通过一日内的tick数据或者1分钟数据,合成日收盘价数据;
区分训练集和测试集:对于一个配对股票,设置前K个数据为训练数据,后S个数据为测试数据,通过训练数据求得最优交易阈值,再在测试数据中进行回测;所述的每一个数据是指一天的日收盘价数据;回测过程,根据测试数据计算相应的Z-score值,即Zt,然后直接利用最优交易阈值进行相应配对股票的回测;
开平仓与止损方式:最优交易阈值包含上开仓阈值L1o、上平仓阈值L1c、下开仓阈值L2o、下平仓阈值L2c、止损阈值为Lloss,则:
开仓条件:L1o<Zt<L1c,或L2c<Zt<L2o且此时无仓位时开仓,所述开仓是同时开多仓的股票Q或股票P,和空仓的股票P或股票Q;
平仓条件:Zt≥L1c,或Zt≤L2c且此时有该方向的仓位时平仓;
止损条件:每个交易日实时监控当前总资金,若当前总资金Vt2与开仓前的总资金Vt1相比处于亏损状态,且亏损比例(Vt2-Vt1)/V0≥Lloss,则进行止损平仓,等待下个交易机会;
强制平仓条件:若回测时间到达最后一个有数据的交易日,而此时还有未平仓仓位时,则进行强制平仓;
仓位与收益的计算:假设通过部分协整校验选出的配对股票为P和Q,股票价格关系为X2,t=β′*X1,t+Wt,其中X1,t表示t时刻股票P的价格,X2,t表示t时刻股票Q的价格,设置:若βX1,t/X2,t≤1,则投资V元在股票Q上,即V/X2,t手股票Q,同时投资V*βX1,t/X2,t在股票P上,即β*V/X2,t手股票P;若βX1,t/X2,t>1,则投资V元在股票P上,即V/X1,t手股票P,同时投资VX2,t/βX1,t在股票Q上,即V/βX1,t手股票股票Q;收益计算时,根据交易数额计算手续费,每一笔交易均产生相应数额的手续费,每个交易日实时更新当前资金情况,通过资金曲线计算收益,每次开仓由初始资金计算仓位,止损按照初始资金的比例进行判断,其余资金不做任何操;
回测指标计算包括:
夏普比:计算公式为
Figure FDA0002376328510000041
E(Rp)表示投资组合预期回报率,是指以日为单位计算得到的收益率;Rf是以日为单位的无风险利率;σp表示投资组合标准差,通过计算每日收益率的标准差来表示;乘
Figure FDA0002376328510000042
得到年化夏普比;
历史最大回撤:通过收益曲线动态历史最高点和最低点的差值计算得出,是动态累积记录的过程;
单日最大回撤:单个交易日的动态收益的最大回撤;
交易次数:回测期间总交易次数,一次开仓和一次平仓综合成为一次交易;
交易频率:总交易日与交易次数的比值。
7.根据权利要求1所述的一种配对交易智能一体化回测系统,其特征在于,所述配对股票的分析报告包括:
配对股票训练和回测期间的夏普比排名情况;
配对股票训练和回测期间的最大回撤,包括历史最大回撤和单次最大回撤;
配对股票训练和回测期间的年化收益率;
配对股票训练和回测期间的交易次数与交易频率;
配对股票训练和回测期间的手续费情况。
CN202010067204.2A 2020-01-20 2020-01-20 配对交易智能一体化回测系统 Pending CN111292188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010067204.2A CN111292188A (zh) 2020-01-20 2020-01-20 配对交易智能一体化回测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010067204.2A CN111292188A (zh) 2020-01-20 2020-01-20 配对交易智能一体化回测系统

Publications (1)

Publication Number Publication Date
CN111292188A true CN111292188A (zh) 2020-06-16

Family

ID=71021262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010067204.2A Pending CN111292188A (zh) 2020-01-20 2020-01-20 配对交易智能一体化回测系统

Country Status (1)

Country Link
CN (1) CN111292188A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159773A (zh) * 2021-04-28 2021-07-23 中国工商银行股份有限公司 一种量化交易回测数据生成方法及装置
CN114092241A (zh) * 2021-10-29 2022-02-25 杭州衡泰技术股份有限公司 一种资产组合实时波动率绘制方法、装置及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159773A (zh) * 2021-04-28 2021-07-23 中国工商银行股份有限公司 一种量化交易回测数据生成方法及装置
CN113159773B (zh) * 2021-04-28 2024-03-22 中国工商银行股份有限公司 一种量化交易回测数据生成方法及装置
CN114092241A (zh) * 2021-10-29 2022-02-25 杭州衡泰技术股份有限公司 一种资产组合实时波动率绘制方法、装置及存储介质

Similar Documents

Publication Publication Date Title
Chen et al. A hybrid approach for portfolio selection with higher-order moments: Empirical evidence from Shanghai Stock Exchange
De Andrés et al. Bankruptcy forecasting: A hybrid approach using Fuzzy c-means clustering and Multivariate Adaptive Regression Splines (MARS)
AU2022211812A1 (en) Method and system of dynamic model selection for time series forecasting
TW530234B (en) Methods and systems for efficiently sampling portfolios for optimal underwriting
US7529703B2 (en) Method and system for artificial neural networks to predict price movements in the financial markets
Kaucic Investment using evolutionary learning methods and technical rules
Callejón et al. A System of Insolvency Prediction for industrial companies using a financial alternative model with neural networks
WO2001050310A9 (en) Methods and systems for automated inferred valuation of credit scoring
JP2003526146A (ja) 評価値を求めてリスクを低減する方法とシステム
WO2001050315A2 (en) Methods and apparatus for automated underwriting of segmentable portfolio assets
Hindrayani et al. Indonesian stock price prediction including covid19 era using decision tree regression
CN109784779A (zh) 财务风险预测方法、装置及存储介质
CN109345050A (zh) 一种量化交易预测方法、装置及设备
Boguslauskas et al. The selection of financial ratios as independent variables for credit risk assessment
Cheng et al. A Seasonal Time‐Series Model Based on Gene Expression Programming for Predicting Financial Distress
CN111292188A (zh) 配对交易智能一体化回测系统
Sarmento et al. A machine learning based pairs trading investment strategy
Hassan Multiobjective genetic programming for financial portfolio management in dynamic environments
Rahmadeyan Long Short-Term Memory and Gated Recurrent Unit for Stock Price Prediction
CN111861752A (zh) 一种基于强化学习的趋势交易方法及系统
Bounid et al. Advanced financial data processing and labeling methods for machine learning
CN110807543A (zh) 一种基于群决策智能搜索的投资组合优化方法和装置
Chalvatzis et al. High-performance stock index trading: making effective use of a deep LSTM neural network
CN115860924A (zh) 供应链金融信用风险预警方法及相关设备
Alfonso-Sánchez et al. Optimizing credit limit adjustments under adversarial goals using reinforcement learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200616