CN113379546A - 一种预测股票间相关性风险的方法及终端设备 - Google Patents
一种预测股票间相关性风险的方法及终端设备 Download PDFInfo
- Publication number
- CN113379546A CN113379546A CN202110688159.7A CN202110688159A CN113379546A CN 113379546 A CN113379546 A CN 113379546A CN 202110688159 A CN202110688159 A CN 202110688159A CN 113379546 A CN113379546 A CN 113379546A
- Authority
- CN
- China
- Prior art keywords
- matrix
- stock
- risk
- prediction
- covariance matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 239000011159 matrix material Substances 0.000 claims abstract description 180
- 230000015654 memory Effects 0.000 claims abstract description 62
- 230000006870 function Effects 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 11
- 238000002474 experimental method Methods 0.000 claims abstract description 9
- 230000000694 effects Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 238000005096 rolling process Methods 0.000 claims description 7
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000013485 heteroscedasticity test Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000006116 polymerization reaction Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 230000017105 transposition Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 description 8
- 238000013136 deep learning model Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 206010035664 Pneumonia Diseases 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000039077 Copula Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 108010015046 cell aggregation factors Proteins 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000010030 laminating Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种预测股票间相关性风险的方法及终端设备,该方法包括:数据采集,选取一段时期内股票市场行情和基本面数据;数据处理,使用多因子模型计算得到公共风险因子收益矩阵,达到降维的目的;计算协方差矩阵;采用cholesky分解将协方差矩阵分解为下三角阵和其转置的乘积;对比实验;以最小损失函数对应的编码‑预测卷积长短时记忆网络模型作为最优模型实现未来一天股票间相关性预测。本发明将时空序列卷积长短时记忆网络应用于股票间相关性预测,解决传统金融模型假设限制过多、待估参数过多、无法拟合非线性和尾部风险问题,提高预测准确性;并采用随机矩阵理论识别协方差矩阵中真实信息和噪声,解决“伪相关”问题。
Description
技术领域
本发明涉及信息技术领域,特别是涉及一种预测股票间相关性风险的方法、终端设备及计算机可读存储介质。
背景技术
股票间的相关性对于投资者进行资产定价与评估、投资组合风险管理、制定交易和对冲策略有重要参考价值。依据Markowitz的投资组合理论,投资组合的风险取决于构成该组合所有股票的特征及股票之间的相关程度。Bloomberg统计数据显示,2020年新冠肺炎疫情导致美国标普500成分股在2月19日至3月31日期间的平均相关系数上涨到0.82,同比增长67%。股票间相关程度的增加导致全市场配置失去意义,投资组合和对冲策略失效,股市系统性风险也就相对越大。然而由于金融市场的复杂性和非线性、尾部风险的加剧,该预测股票间相关性的任务颇具挑战性,已成为金融风控领域的热门研究课题。
股票收益率的协方差矩阵是估计组合相关性的重要工具。众多学者对于该问题进行了大量研究,但多集中于传统的计量和数学模型,如样本协方差矩阵、因子模型、压缩矩阵模型、随机矩阵理论、指数加权移动平均、GARCH族模型、Copulas函数等,这些方法发展至今已经非常成熟,且进行了很多改进和迭代,尤其是GARCH族模型。然而传统的计量模型在预测方差-协方差矩阵时,由于模型结构和形式本身的限制,仍然存在以下问题无法解决:1.在模型设定时施加一些不一定真实的约束条件,与现实世界的情况不完全符合,从而削弱对建立投资组合的参考价值;2.待估参数过多,引起维数灾难;即使是最简化的标量BEKK(1,1)模型也存在N(N+1)/2+2个待估参数,对于包含10支股票的序列来说,待估参数高达57个,不仅计算困难,而且产生较大的估计误差;3.最经典的多元GARCH模型容易出现估计收敛问题,从而难以获得所有参数的可靠估计;4.传统计量模型的结构无法满足我国经济复杂性的发展,对于大数据的处理能力较差,对于数据间非线性关系的拟合效果不理想,其预测准确性遭受质疑,从而导致其模型预测存在一定的局限性。
发明内容
本发明的目的是为了解决现有技术中预测误差大、难度高、噪声强的问题,提出一种预测股票间相关性风险的方法及终端设备。
为解决上述技术问题,本发明提出以下技术方案:
本发明提出一种预测股票间相关性风险的方法,其特征在于,包括如下步骤:S1:数据采集,选取一段时期内股票的市场行情和基本面数据;S2:数据处理,使用多因子模型选择出影响股票风险的公共因子,计算得到公共风险因子收益矩阵;S3:计算协方差矩阵,对修正后的公共风险因子收益计算对数收益率,取固定时间窗口,按因子收益率时间序列计算方差协方差矩阵,得到协方差矩阵;S4:协方差矩阵分解,采用cholesky分解将协方差矩阵分解为下三角阵和其转置的乘积,对下三角阵进行预测;S5:对比实验,将下三角阵作为模型输入,输入到编码-预测结构的卷积长短时记忆网络中;S6:预测未来一天股票间相关性,经过迭代训练,得到以最小损失函数对应的编码-预测卷积长短时记忆网络模型作为最优模型,预测下一天的股票间相关性风险下三角阵,通过协方差矩阵分解计算得出下一天的协方差矩阵,从而实现预测。
在一些实施例中,S5步骤后还包括:模型稳健型检验,在其他类似数据集上重复实验,评估编码预测卷积长短时记忆网络在股票相关性预测问题的鲁棒性。
在一些实施例中,在S1步骤中,所述市场行情使用日数据,所述基本面使用公司财务报告的季报和年报的数据;去除过去一年中ST特别处理和过去一个月停牌时间大于10天的股票;在选取数据期间,对公司发生的重大事件,进行合理处理以保持数据的前后一致性和可比性。
在一些实施例中,S2步骤包括:S21:描述性变量的选择、检验与处理;在市场行情和基本面数据中,选择描述性变量,采用中位数去极值法和Z-Score标准化处理,以消除极端值和量纲的影响;S22:纳入风险指数;用资产回报、行业因子、单个描述性变量做向前逐步回归,检验显著性,将通过显著性检验的描述性变量纳入风险指数,形成初始因子;S23:通过聚类和主成分分析有效降维,得到聚合因子;S24:行业配置;采用多行业配置法,把公司按指标比例归类到一种或多种行业中;S25:广义最小二乘回归计算公共风险因子报酬;采用广义最小二乘回归解决异方差问题。
在一些实施例中,在S2步骤中,所述多因子模型以股票超额收益R、因子暴露与因子报酬F间的线性结构来分析股票间报酬关系,假设市场上有n种股票,k个公共风险因子,则股票i的超额收益率Ri为:Ri=αi+βi1F1+...+βikFk+εi i=1,…,n;当股票风险用股票回报率的协方差矩阵衡量,上式转化为矩阵:∑=Y·φ·YT+△,其中,Y是n*k的因子暴露矩阵,φ是因子收益F1,…,Fk的协方差矩阵,△是股票特异质收益ε的对角阵,表示个股的波动性;通过预测公共风险因子的协方差矩阵,计算股票风险,转化为对k*k的因子收益协方差矩阵的预测,张量γ∈RQ*k*k,
在一些实施例中,在S3步骤中,将协方差矩阵作为第一个时期内相关性风险的度量,继续向后滚动1天,再取n个交易日计算公共风险因子的下一时期的历史协方差矩阵,不断向后滚动计算,最终得到方差协方差矩阵。
在一些实施例中,在S4步骤中,若矩阵A∈Rn*n对称正定,则存在一个对角元为正数的下三角矩阵L∈Rn*n,使A=LLT成立;在python中调用函数计算协方差矩阵的下三角因子阵;在进行预测时,计算下三角阵和其转置的乘积,恢复协方差矩阵。
在一些实施例中,在S5步骤中,将全连接长短时记忆网络中的点乘改为卷积运算,通过卷积结构提取因子收益率协方差矩阵的空间特征,长短时记忆网络提取历史矩阵序列的时间特征,以实现空间结构表征能力:其中,‘*’表示卷积运算符,表示点积,σ表示sigmoid激活函数,it、ft、ot表示输入门、遗忘门、输出门和输入X1,…,Xt,存储单元输出C1,…,Ct,隐藏状态H1,…,Ht都是3D张量。
在一些实施例中,在S5步骤中,采用3层编码预测网络结构建立端到端的可训练模型,由若干卷积长短时记忆网络层叠加而成;编码网络通过卷积操作将输入序列压缩为隐藏状态张量,传递给预测网络,作为初始状态和单元输出,数据的高度重要特征被送到预测模块;将预测网络中的所有状态连接,将其输入到卷积层中,生成预测结果 该结构具有多个堆叠的卷积长短时记忆网络层,适合对复杂的动力系统进行预测。
在一些实施例中,所述3层编码预测网络结构包含64、96和96个隐藏状态,卷积核的大小为5*5;计算随机矩阵理论改进的均方误差损失函数,以PG+方法修正后的协方差矩阵为目标变量,与预测值计算均方误差;测量预测值与真实相关性的偏差,分配10倍权重;对于从噪声协方差矩阵计算的均方误差,分配1倍的权重;随机矩阵理论均方误差损失函数为两者总和,对协方差矩阵中识别的真实信息给予高权重,对噪声给予低权重;采用编码预测卷积长短时记忆网络模型,与传统的指数加权移动平均方法、全连接长短时记忆网络方法对比预测效果。
在一些实施例中,所述PG+法用零代替相关系数矩阵的噪声特征值:Lambda*=diag{0,...,0,λk+1,λn},用新的特征值矩阵重构相关矩阵C*,确保去噪后的矩阵C*和原相关矩阵C相等,将主对角线元素设为1,C*=PLambda*P’,P为正交矩阵,P’为矩阵P的转置,PP’=1。
在一些实施例中,在S6步骤中,构建数据集基于MSCI的CNE6模型,稳健性检验采用CNE5模型的数据集;经过广义最小二乘回归,得到风险因子回报矩阵,以n个交易日为固定时间窗口长度,向后滚动得到历史协方差矩阵;将数据集输入到不同模型中分别训练得到样本外损失函数并对比,验证证明卷积长短时记忆网络模型的鲁棒性。
在一些实施例中,在S7步骤中,使用先前观测到的股票收益率协方差矩阵序列预测未来一段时间的协方差矩阵,以T天为窗口期,生成历史的协方差矩阵序列,并在接下来的1天内进行预测;假设在N*N矩阵的每个单元内,有Q个度量随时间变化,那么任何时刻的观测值都可以用张量表示,R代表观测特征的域;如果定期储存观测值,将得到张量在给定先前H个观测值(包括当前观测值)的情况下,预测未来第t+1个观测值:
本发明还提出一种预测股票间相关性风险的终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如以上任一所述方法的步骤。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如以上任一所述方法的步骤。
与现有技术相比,本发明的有益效果有:将时空序列卷积长短时记忆网络应用于股票间相关性的预测,通过卷积运算提取因子收益率协方差矩阵的空间特征,长短时记忆网络提取历史矩阵序列的时间特征,实现空间结构的表征能力;解决原先传统金融模型的假设限制过多、待估参数过多、无法拟合非线性和尾部风险、估计无法收敛的问题,提高预测准确性。
在一些实施例中,本发明的有益效果有:提前预警股票的系统性风险,从而对投资组合的有效性有更稳健的指导意义;通过随机矩阵理论改进的均方误差损失函数评价,指数加权移动平均的误差为0.8805,全连接长短时记忆网络的误差为0.1465,而本发明提出的编码-预测卷积长短时记忆网络,误差最小为0.1116,证明了该方法在股票相关性预测中的有效性。
在一些实施例中,本发明的有益效果有:采用随机矩阵理论识别协方差矩阵中的真实信息和噪声,剔除干扰信息,校正协方差矩阵,解决“伪相关”的问题,预测股票间的真实相关性风险。
附图说明
图1为本发明实施例的预测股票间相关性风险的方法及终端设备示意图;
图2为本发明实施例的BARRA多因子模型的步骤示意图;
图3为本发明实施例的ConvLSTM卷积长短时记忆网络的内部结构示意图;
图4为本发明实施例的股票间相关性风险预测的编码-预测网络结构示意图。
附图标记说明:H1,…,Ht-隐藏状态的3D张量;C1,…,Ct-存储单元的3D张量;X1,…,Xt-输入变量的3D张量;it-输入门;ft-遗忘门;ot-输出门;σ-sigmoid激活函数;W-权重;Conv-卷积运算;Inputs-输入数据;ConvLSTM-时间序列的卷积运算;DeConv-反卷积运算;Outputs-输出数据。
具体实施方式
为了使本发明实施例所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。另外,连接即可以是用于固定作用也可以是用于电路连通作用。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多该特征。在本发明实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
股票间相关性预测的目的是使用先前观测到的股票收益率协方差矩阵序列预测未来一段时间(通常是1天)的协方差矩阵。股票收益取收盘价的日度数据,以T天为窗口期,生成历史的协方差矩阵序列,并在接下来的1天内进行预测。从机器学习的角度来看,这个问题可以看作是时空序列预测。假设在N*N矩阵的每个单元内,有Q个度量随时间变化;那么任何时刻的观测值都可以用张量表示,R代表观测特征的域。如果定期储存观测值,将得到张量问题被定义为给定先前H个观测值(包括当前观测值)的情况下,预测未来第t+1个观测值:
本发明提出对于规模大、维度多、动态的金融时间序列而言,深度学习模型基本不需要施加假定和限制条件,具有强大的表征能力,能完美识别数据中的复杂非线性规律,有效提升预测准确性,从而更好地指导投资组合的构建与优化。因此,本发明开创性地将时空序列卷积长短时记忆网络(Convolutional LSTM,ConvLSTM)应用于股票间相关性风险的预测。为了进行评估,创建了一个真实的包含我国15年A股市场的数据集,基于BARRA多因子模型聚合出33个公共风险因子,通过预测公共风险因子的收益率协方差矩阵来测度股票间的相关性。同时,采用随机矩阵理论(Random Matrix Theory,RMT)改进均方误差损失函数(Mean Square Error,MSE),对矩阵中的真实相关性信息赋予高权重,避免噪声在预测中占主导作用。实验表明,深度学习模型的预测效果优于传统指数加权移动平均(Exponentially Weighted Moving-Average,EWMA),卷积长短时记忆网络比全连接长短时记忆网络(Fully Connected LSTM,FC-LSTM)的预测误差更小,并进一步验证该模型的稳定性和有效性。
随机矩阵理论,基于对协方差矩阵进行特征分解,对比相关系数矩阵和随机高维矩阵特征值的关系,识别真实信息和噪声。“去噪”主要有LCPB、PG+和KR三种方法。PG+“去噪”效果最优,误差最小。本发明采用PG+法实现“去噪”的目的。PG+法认为随机矩阵理论预测范围内的特征值与随机矩阵特征值具有相同的属性,不能反映变量间的相互关系,该预测范围内特征值所包含的信息为“噪声信息”,用零代替相关系数矩阵的噪声特征值:Lambda*=diag{0,...,0,λk+1,λn};并用新的特征值矩阵重构相关矩阵C*,确保去噪后的矩阵C*和原相关矩阵C的迹相等,将主对角线元素设为1,C*=PLambda*P’,P为正交矩阵,P’为矩阵P的转置,PP’=1。
参考图1,为本发明实施例的预测股票间相关性的方法及流程示意图,具体包括:
1.数据采集:使用的是2005年1月1日到2020年6月14日中国A股市场所有股票的市场行情和基本面数;包含2008年金融危机和2020年新冠肺炎的异常市场情况,去除周末、节假日等休市期,原始数据有效交易天数为3753天。市场行情使用日数据,基本面使用公司财务报告的季报和年报的数据;共3841支股票,去除过去一年中ST特别处理和过去一个月停牌时间大于10天的股票后,最终有效股票3632支。在选取数据期间,对公司发生的股利发放、资本重组等重大事件,进行合理处理以保持数据的前后一致性和可比性。
2.数据处理:由于我国股市发展历程较短,市场机制尚未成熟,因此能得到的有效数据非常有限,导致序列长度比需要预测的股票协方差少,易引起过拟合、不显著等问题,因此首先使用BARRA多因子模型降维。BARRA多因子模型的具体步骤如图2所示,计算得到1934*33的公共风险因子收益矩阵。具体如下:
(1)描述性变量的选择、检验与处理:在市场行情和基本面的数据中,选择有实际经济意义,对市场划分比较合理,对风险分类描述比较全面的描述性变量,采用中位数去极值法和Z-Score标准化处理,以消除极端值和量纲的影响。
(2)风险指数:用资产的回报与行业因子和单个描述性变量做向前逐步回归,并检验显著性,将通过显著性检验的描述性变量纳入风险指数,形成初始因子。
(3)通过聚类和主成分分析有效降维,得到精简高效的聚合因子。重新划分因子体系包括9个一级风格因子、48个二级风格因子和24个行业因子,如下表1所示:
(4)行业配置:很多大公司的业务是多元化的,因此采用多行业配置法。把公司按照一定的指标(如总资产、销售或者营业利润等)按比例归类到多种行业中。因子暴露代表该因子在公司指标中的比重。
(5)广义最小二乘回归计算公共风险因子报酬:通过数据检验,发现残差存在异方差性,因此采用广义最小二乘回归解决异方差问题。部分股票公共风险因子收益如表2所示(注:NaN对应非交易日)。
表1因子体系表
表2部分股票公共风险因子收益表
多因子模型以股票超额收益R,因子暴露与因子报酬F间简单的线性结构来分析股票间报酬关系,设一个市场上有n种股票,k个公共风险因子,则股票i的超额收益率Ri可以写成:Ri=αi+βi1F1+...+βikFk+εi i=1,…,n。
股票风险用股票回报率协方差矩阵衡量,上式转化为矩阵形式:∑=Y·φ·YT+△;其中,Y是n*k的因子暴露矩阵,φ是因子收益F1,…,Fk的协方差矩阵,△是股票特异质收益ε的对角阵,表示个股的波动性。因此BARRA多因子模型认为股票风险是由公共风险因子的相关性和个股特异质风险共同决定的。
3.计算协方差矩阵:对上述修正后的公共风险因子收益计算对数收益率,取固定时间窗口(22个交易日,约1个月),对于22*33的因子收益率时间序列,按列计算方差-协方差矩阵,得到33*33的协方差矩阵,作为第一个时期内相关性风险的度量。继续向后滚动1天,再取22个交易日计算公共风险因子的下一时期的历史协方差矩阵,不断向后滚动计算,最终得到1911个33*33的方差-协方差矩阵。
4.cholesky分解:为了保证协方差矩阵(半)正定的特性,采用cholesky分解将协方差矩阵分解为下三角阵和其转置的乘积,对下三角阵进行预测。
cholesky分解的原理是若矩阵A∈Rn*n对称正定,则存在一个对角元为正数的下三角矩阵L∈Rn*n,使A=LLT成立。基于协方差矩阵的对称(半)正定性质,在python中调用numpy.linalg.cholesky函数计算协方差矩阵的下三角因子阵。后续的实验对象变为下三角阵,在进行预测时,进一步计算下三角阵和其转置的乘积,即可恢复协方差矩阵。
5.对比实验:将下三角阵的时间序列作为模型的输入,输入到编码-预测结构的卷积长短时记忆网络中(如图3和图4所示)。
图3展示卷积长短时记忆网络的1个单元内部结构,将全连接长短时记忆网络中的hadamard点乘改为卷积运算,通过卷积结构提取因子收益率协方差矩阵的空间特征,长短时记忆网络提取历史矩阵序列的时间特征,以解决全连接造成的空间数据冗余问题,实现了空间结构的表征能力:其中,‘*’表示卷积运算符,表示点积,σ表示sigmoid激活函数,it、ft、ot表示输入门、遗忘门、输出门和输入X1,…,Xt,存储单元输出C1,…,Ct,隐藏状态H1,…,Ht都是3D张量。
图4采用3层编码-预测网络结构建立端到端的可训练模型,这两个网络都是由若干个卷积长短时记忆网络层叠加而成。编码网络通过卷积操作将输入序列压缩为一个隐藏状态张量,传递给预测网络,作为初始状态和单元输出,数据的高度重要特征被送到预测模块。由于最后的预测目标具有与输入相同的维数,所以将预测网络中的所有状态连接起来,并将其输入到一个1×1的卷积层中,生成最终的预测结果 该结构具有多个堆叠的卷积长短时记忆网络层,适合于对复杂的动力系统进行预测。
数据集分为一组20帧(输入和预测都是10帧),学习率设置为0.01。编码和预测结构都使用3层卷积长短时记忆网络,分别包含64、96和96个隐藏状态,卷积核的大小为5*5。
然后,计算随机矩阵理论改进的均方误差损失函数。以PG+方法修正后的协方差矩阵为目标变量,与预测值计算均方误差。测量预测值与真实相关性的偏差,并分配10倍权重。对于从噪声协方差矩阵计算的均方误差,分配1倍的权重。最终的随机矩阵理论_均方误差损失函数RMT_MSE是两者的总和,对协方差矩阵中识别的真实信息给予高权重,对噪声给予低权重。
最后,本发明采用的编码-预测卷积长短时记忆网络模型ConvLSTM,并与传统的指数加权移动平均方法EWMA,全连接长短时记忆网络方法FC-LSTM对比预测效果,不同模型的样本外损失函数对比如表3所示。
表3不同模型的样本外损失函数对比
实验结果表明,深度学习模型的样本外预测效果优于传统金融模型,验证集的MSE和RMT_MSE较小,尤其是经过随机矩阵理论去噪后。这是因为深度学习模型可以有效提取数据之间的非线性关系,很好地拟合尾部风险。但传统的财务模型只是拟合历史线性关系。另外,卷积长短时记忆网络进行端到端的训练,通过网络的非线性和卷积结构学习更复杂的时空矩阵序列,因此具有最好的预测效果。
6.模型稳健型检验:为了评估编码-预测卷积长短时记忆网络在股票相关性预测问题上的鲁棒性,在其他类似数据集上重复实验,观察预测效果是否随数据集不同而变化。本发明构建的数据集基于MSCI发布的CNE6模型,但未提供原始数据集。因此,稳健性检验采用CNE5模型的官方数据集,具有不同的因子系统和构建方法。CNE5数据集时间长度自2005年1月1日至2021年3月20日,风险因素包括10个风格因素和32个行业因素。经过广义最小二乘回归,得到一个5923*42的风险因子回报矩阵。同上,以22个交易日为固定时间窗口长度,向后滚动得到(3915,42*42)历史协方差矩阵。将数据集输入到3个模型中并分别训练得到样本外MSE和RMT_MSE,不同模型在CNE5数据集上的样本外损失函数对比如表4所示。
表4不同模型在CNE5数据集上的样本外损失函数对比
结果表明,无论是CNE5数据集的样本外MSE还是RMT_MST,卷积长短时记忆网络仍然是最小的,而指数加权移动平均法是最大的。证明本发明得出的结论,在股票相关性预测问题上,深度学习模型确实优于传统金融模型,并且卷积长短时记忆网络可以学习更多的空间信息,因此其预测误差小于全连接长短时记忆网络。对不同数据集的验证进一步证明了卷积长短时记忆网络模型的鲁棒性。
7.预测未来一天的股票间相关性:经过不断地迭代训练,得到以最小损失函数对应的编码-预测卷积长短时记忆网络模型,主要是调整后的权重。将其作为最优模型,代入到最近10帧数据中,预测下一天的股票间相关性风险下三角阵,再通过Cholesky分解的原理,计算得出下一天的协方差矩阵,即股票间公共风险因子的相关性,从而对资产定价与评估、投资组合风险管理、制定交易和对冲策略等提供指导。
参考图2,BARRA多因子模型;数据处理,根据BARRA多因子模型选择出影响股票风险的公共因子,通过预测公共风险因子的相关性,计算股票间的相关性,对问题进行简化、降维。BARRA多因子模型,为描述性变量选择和检验、去极值与标准化、风险指数形成与因子暴露计算、风险因子选择、估计因子报酬(加权最小二乘回归)。
参考图3,卷积长短时网络结构;输入模型,输入层-隐藏层-输出层;卷积结构提取因子收益率协方差矩阵的空间特征,LSTM提取历史矩阵序列的时间特征;解决全连接造成的空间数据冗余问题,实现空间结构的表征能力。
卷积长短时网络结构,为BARRA多因子模型处理后的公共风险因子收益矩阵,进行数据检验与修正后计算协方差矩阵,输入到卷积长短时网络中。卷积长短时记忆网络,通过卷积结构提取因子收益率协方差矩阵的空间特征,长短时记忆网络提取历史矩阵序列的时间特征,以解决全连接长短时记忆网络造成的空间数据冗余问题,实现空间结构的表征能力。相比于全连接长短时记忆网络,卷积长短时记忆网络在当前时刻输入到状态和状态到状态的转换中进行了卷积计算,通过其本地邻居的输入和过去状态来确定网格中某个单元的未来状态。
参考图4,编码-预测结构;复杂结构,编码网络将输入序列压缩为一个包含高度重要特征的张量,传给预测网络,反卷积解码,将预测网络中的所有状态连接起来;并将其输入到一个1×1的卷积层中,生成最终的预测结果;该结构具有多个堆叠的卷积长短时记忆网络层,适合于对复杂的动力系统进行预测。
编码-预测结构,为将卷积长短时网络堆叠形成编码-预测的网络结构,更加适用于复杂系统的预测。编码-预测网络结构,由若干个卷积长短时记忆网络层叠加而成,建立端到端的可训练模型。编码网络通过卷积操作将输入序列压缩为一个隐藏状态张量,传递给预测网络,作为初始状态和单元输出。数据的高度重要特征被送到预测模块。由于最后的预测目标具有与输入相同的维数,所以将预测网络中的所有状态连接起来;并将其输入到一个1×1的卷积层中,,生成最终的预测结果。该结构具有多个堆叠的卷积长短时记忆网络层,适合于对复杂的动力系统进行预测。
随机矩阵理论改进均方误差损失函数;计算误差,识别相关性的真实信息,去除噪声信息;解决“伪相关”问题。随机矩阵理论改进均方误差损失函数,为将编码-预测卷积长短时网络预测的结果与原始结果计算随机矩阵理论改进的均方误差,作为评估模型效果的标准。
本发明的目的是为了解决现有技术中待估参数过多、无法拟合非线性和尾部风险、估计无法收敛的问题,以及现有技术中难以满足指数级增长的数据量需求,导致预测误差大、难度高、噪声强的问题,提出基于时空特征的卷积长短时网络预测股票间相关性的方法。
本发明开创性地将时空序列卷积长短时记忆网络应用于股票间相关性的预测,通过卷积运算提取因子收益率协方差矩阵的空间特征,长短时记忆网络提取历史矩阵序列的时间特征,实现空间结构的表征能力。解决原先传统金融模型的假设限制过多、待估参数过多、无法拟合非线性和尾部风险、估计无法收敛的问题,提高预测准确性。
本发明提升股票间相关性的预测准确性,提前预警股票的系统性风险,从而对投资组合的有效性有更稳健的指导意义;通过随机矩阵理论改进的均方误差损失函数评价,指数加权移动平均的误差为0.8805,全连接长短时记忆网络的误差为0.1465,而本发明提出的编码-预测卷积长短时记忆网络,误差最小为0.1116,证明了该方法在股票相关性预测中的有效性。同时,应用编码-预测结构,连接多个卷积长短时记忆网络,适合于对复杂的动力系统进行预测。
另外,采用随机矩阵理论(Random Matrix Theory,RMT)改进的均方误差为损失函数;对协方差矩阵中真正有效的信息赋予较高权重,对噪音赋予较低权重,实现“去噪”的目的,解决“伪相关”问题。实验表明,深度学习模型在该问题上的表现均优于传统计量模型,相比全连接长短时记忆网络,编码-预测结构的卷积长短时记忆网络预测误差更小,证明模型的有效性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
Claims (15)
1.一种预测股票间相关性风险的方法,其特征在于,包括如下步骤:
S1:数据采集,选取一段时期内股票的市场行情和基本面数据;
S2:数据处理,使用多因子模型选择出影响股票风险的公共因子,计算得到公共风险因子收益矩阵;
S3:计算协方差矩阵,对修正后的公共风险因子收益计算对数收益率,取固定时间窗口,按因子收益率时间序列计算方差协方差矩阵,得到协方差矩阵;
S4:cholesky分解,将协方差矩阵分解为下三角阵和其转置的乘积,对下三角阵进行预测;
S5:对比实验,将下三角阵的时间序列作为模型输入,输入到编码-预测结构的卷积长短时记忆网络中;
S6:预测未来一天股票间相关性,经过迭代训练,得到以最小损失函数对应的编码-预测卷积长短时记忆网络模型作为最优模型,预测下一天的股票间相关性风险下三角阵,通过cholesky分解计算得出下一天的协方差矩阵,从而实现预测。
2.如权利要求1所述的预测股票间相关性风险的方法,其特征在于,S5步骤后还包括:
模型稳健型检验,在其他类似数据集上重复实验,评估编码预测卷积长短时记忆网络在股票相关性预测问题的鲁棒性。
3.如权利要求1所述的预测股票间相关性风险的方法,其特征在于:
在S1步骤中,所述市场行情使用日数据,所述基本面使用公司财务报告的季报和年报的数据;去除过去一年中ST特别处理和过去一个月停牌时间大于10天的股票;在选取数据期间,对公司发生的重大事件,进行合理处理以保持数据的前后一致性和可比性。
4.如权利要求1所述的预测股票间相关性风险的方法,其特征在于,S2步骤包括:
S21:描述性变量的选择、检验与处理;在市场行情和基本面数据中,选择描述性变量,采用中位数去极值法和Z-Score标准化处理,以消除极端值和量纲的影响;
S22:纳入风险指数;用资产回报、行业因子、单个描述性变量做向前逐步回归,检验显著性,将通过显著性检验的描述性变量纳入风险指数,形成初始因子;
S23:通过聚类和主成分分析有效降维,得到聚合因子;
S24:行业配置;采用多行业配置法,把公司按指标比例归类到一种或多种行业中;
S25:广义最小二乘回归计算公共风险因子报酬;采用广义最小二乘回归解决异方差问题。
5.如权利要求1所述的预测股票间相关性风险的方法,其特征在于:
在S2步骤中,所述多因子模型以股票超额收益R、因子暴露与因子报酬F间的线性结构来分析股票间报酬关系,假设市场上有n种股票,k个公共风险因子,则股票i的超额收益率Ri为:Ri=αi+βi1F1+...+βikFk+εii=1,…,n;
当股票风险用股票回报率的协方差矩阵衡量,上式转化为矩阵:∑=Y·φ·YT+△,其中,Y是n*k的因子暴露矩阵,φ是因子收益F1,…,Fk的协方差矩阵,△是股票特异质收益ε的对角阵,表示个股的波动性;
6.如权利要求1所述的预测股票间相关性风险的方法,其特征在于:
在S3步骤中,将协方差矩阵作为第一个时期内相关性风险的度量,继续向后滚动1天,再取n个交易日计算公共风险因子的下一时期的历史协方差矩阵,不断向后滚动计算,最终得到方差-协方差矩阵。
7.如权利要求1所述的预测股票间相关性风险的方法,其特征在于:
在S4步骤中,若矩阵A∈Rn*n对称正定,则存在一个对角元为正数的下三角矩阵L∈Rn*n,使A=LLT成立;在python中调用函数计算协方差矩阵的下三角因子阵;在进行预测时,计算下三角阵和其转置的乘积,恢复协方差矩阵。
10.如权利要求9所述的预测股票间相关性风险的方法,其特征在于:
所述3层编码预测网络结构包含64、96和96个隐藏状态,卷积核的大小为5*5;计算随机矩阵理论改进的均方误差损失函数,以PG+方法修正后的协方差矩阵为目标变量,与预测值计算均方误差;
测量预测值与真实相关性的偏差,分配10倍权重;对于从噪声协方差矩阵计算的均方误差,分配1倍的权重;随机矩阵理论均方误差损失函数为两者总和,对协方差矩阵中识别的真实信息给予高权重,对噪声给予低权重;
采用编码预测卷积长短时记忆网络模型,与传统的指数加权移动平均方法、全连接长短时记忆网络方法对比预测效果。
11.如权利要求10所述的预测股票间相关性风险的方法,其特征在于:
所述PG+法用零代替相关系数矩阵的噪声特征值:Lambda*=diag{0,...,0,λk+1,λn},用新的特征值矩阵重构相关矩阵C*,确保去噪后的矩阵C*和原相关矩阵C相等,将主对角线元素设为1,C*=PLambda*P’,P为正交矩阵,P’为矩阵P的转置,PP’=1。
12.如权利要求1所述的预测股票间相关性风险的方法,其特征在于:
在S6步骤中,构建数据集基于MSCI的CNE6模型,稳健性检验采用CNE5模型的数据集;经过广义最小二乘回归,得到风险因子回报矩阵,以n个交易日为固定时间窗口长度,向后滚动得到历史协方差矩阵;将数据集输入到不同模型中分别训练得到样本外损失函数并对比,验证证明卷积长短时记忆网络模型的鲁棒性。
14.一种预测股票间相关性风险的终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-13任一所述方法的步骤。
15.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-13任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110688159.7A CN113379546A (zh) | 2021-06-21 | 2021-06-21 | 一种预测股票间相关性风险的方法及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110688159.7A CN113379546A (zh) | 2021-06-21 | 2021-06-21 | 一种预测股票间相关性风险的方法及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113379546A true CN113379546A (zh) | 2021-09-10 |
Family
ID=77578155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110688159.7A Pending CN113379546A (zh) | 2021-06-21 | 2021-06-21 | 一种预测股票间相关性风险的方法及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113379546A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115034832A (zh) * | 2022-07-05 | 2022-09-09 | 广东电网有限责任公司 | 一种天然气和电力的协调调度方法、装置及系统 |
-
2021
- 2021-06-21 CN CN202110688159.7A patent/CN113379546A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115034832A (zh) * | 2022-07-05 | 2022-09-09 | 广东电网有限责任公司 | 一种天然气和电力的协调调度方法、装置及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hansen et al. | Testing for two-regime threshold cointegration in vector error-correction models | |
Bauwens et al. | The contribution of structural break models to forecasting macroeconomic series | |
LeSage et al. | Models for spatially dependent missing data | |
Krueger et al. | Computing equilibrium in OLG models with stochastic production | |
Chen et al. | Forecasting volatility with support vector machine‐based GARCH model | |
Celik et al. | Evaluating and forecasting banking crises through neural network models: An application for Turkish banking sector | |
Clements et al. | The Oxford handbook of economic forecasting | |
Graham | Dyadic regression | |
Dominicy et al. | The method of simulated quantiles | |
Loaiza‐Maya et al. | Time series copulas for heteroskedastic data | |
Bodurtha et al. | Non-parametric estimation of an implied volatility surface | |
Dempster et al. | Estimating exponential affine models with correlated measurement errors: Applications to fixed income and commodities | |
Kang et al. | On variable ordination of modified Cholesky decomposition for estimating time‐varying covariance matrices | |
Gierjatowicz et al. | Robust pricing and hedging via neural stochastic differential equations | |
BenSaïda | The good and bad volatility: A new class of asymmetric heteroskedastic models | |
CN113379546A (zh) | 一种预测股票间相关性风险的方法及终端设备 | |
Filiz et al. | Graphical models for correlated defaults | |
McAlinn et al. | Volatility forecasts using stochastic volatility models with nonlinear leverage effects | |
Zadrozny et al. | Weighted‐Covariance Factor Decomposition of Varma Models Applied to Forecasting Quarterly US Real GDP at Monthly Intervals | |
Cavicchioli | Statistical analysis of mixture vector autoregressive models | |
Sànchez García et al. | Macrofinancial determinants of volatility transmission in a network of European sovereign debt markets | |
Agarwal et al. | On multivariate singular spectrum analysis and its variants | |
Mehrdoust et al. | Valuation of option price in commodity markets described by a Markov-switching model: A case study of WTI crude oil market | |
van Delden et al. | Methods for estimating the quality of multisource statistics | |
Masih et al. | Bivariate and multivariate tests of money–price causality: robust evidence from a small developing country |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210910 |
|
RJ01 | Rejection of invention patent application after publication |