CN107481048A

CN107481048A - 一种基于混合模型的金融品种价格预测方法及系统

Info

Publication number: CN107481048A
Application number: CN201710672177.XA
Authority: CN
Inventors: 黄冬; 王晓龙; 吴少聪
Original assignee: Shenzhen Hai Zhi Technology Co Ltd; Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Hai Zhi Technology Co Ltd; Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2017-08-08
Filing date: 2017-08-08
Publication date: 2017-12-15

Abstract

本发明提供一种基于混合模型的金融品种价格预测方法及系统，属于金融数据处理领域。本发明方法包括如下步骤：构建金融品种历史行情数据库，用于存储金融品种在过去某一时间段内的历史行情数据；在金融品种历史行情数据库的基础上构建混合模型，所述混合模型包括深度学习模型和结合小波变换降噪的ARIMA模型；运用混合模型对金融品种价格变动趋势进行预测，并对来自不同模型的预测结果进行综合从而得到精确度更高的预测结果；检验混合模型的预测结果是否准确，并根据检验结果对混合模型的子模型进行参数调节从而优化混合模型结构。本发明具有良好的预测性能，能够准确的预测金融品种在未来的价格变换趋势，预测的结果更加精确。

Description

一种基于混合模型的金融品种价格预测方法及系统

技术领域

本发明涉及金融数据处理领域，尤其涉及一种基于混合模型的金融品种价格预测方法，还涉及一种实现所述金融品种价格预测方法的系统。

背景技术

随着计算机技术的发展，基于机器学习的方法与模型逐步被应用于预测金融品种的未来走势，研究者们不断提出一些表现良好的方法模型来尝试预测金融品种的未来趋势变动情况。

近些年来，诸如神经网络和支持向量机等浅层机器学习方法已广泛应用于金融品种的趋势预测中，并由于其在预测上优良表现，神经网络和支持向量机均已被成功应用到发现金融品种趋势的问题中，其中Sureshkumar和Elango等研究者利用人工神经网络预测股票价格并评估了神经网络体系在股票预测问题上的性能表现。L.Cao和F.Tay则是采用支持向量机对金融市场中股票及债券等金融品种的价格进行了预测。同时，也有研究指出利用更复杂的混合模型方法可以获得比单一模型更高的预测精度。

随着深度学习相关理论及技术的不断发展，深度学习相比起传统的神经网络及支持向量机等浅层学习具有更高的准确率，更强大的学习能力以及对抽象理念更复杂更全面的描述能力，这些优良的特性都表明深度学习的方法及模型在预测金融品种的未来趋势变动上会有更加优秀的表现。

发明内容

为解决现有技术中的问题，本发明提供一种基于混合模型的金融品种价格预测方法，还提供一种实现所述金融品种价格预测方法的系统。

本发明金融品种价格预测方法包括如下步骤：

A：构建金融品种历史行情数据库，用于存储金融品种在过去某一时间段内的历史行情数据；

B：在金融品种历史行情数据库的基础上构建混合模型，所述混合模型包括深度学习模型和结合小波变换降噪的ARIMA模型；

C：运用混合模型对金融品种价格变动趋势进行预测，并对来自不同模型的预测结果进行综合从而得到精确度更高的预测结果。

本发明作进一步改进，还包括步骤D：检验混合模型的预测结果是否准确，并根据检验结果对混合模型的子模型进行参数调节从而优化混合模型结构。

本发明作进一步改进，在步骤B中，所述深度学习模型为LSTM模型，即长短时记忆模型，所述长短时记忆模型通过训练能够发掘出金融品种的价格变动规律及潜在的变动逻辑，并通过对价格规律及变动逻辑的处理实现金融品种未来价格变动趋势的预测。

本发明作进一步改进，述长短时记忆模型将金融品种的历史行情数据进行划分从而生成模型训练数据集，该模型训练数据集分为训练输入及训练输出两部分，训练输入及训练输出数据长度为L，训练输入与训练输出之间相距T个时间周期；同时采用ReLU函数作为长短时记忆模型中状态处理及模型输出环节的激活函数，该激活函数定义为：

Y＝Max(0，x)

其中，x为自变量。

本发明作进一步改进，所述长短时记忆模型为引入门结构的循环神经网络结构，所述门机构包括输入门、输出门及遗忘门，其中，

所述输入门用于控制有多少信息可以流入模型的记忆体，经由输入门处理后的数据流入当前状态中；

所述遗忘门用于控制有多少上一时刻的模型记忆体信息可以累积到当前时刻的记忆体中，经由遗忘门处理的数据信息流入当前状态中；

所述输出门用于控制有多少当前状态的信息能够流入下一次学习阶段的记忆体中，

数据信息经过三个门结构的处理完成一轮循环，处理后的数据信息经由输出门进入下一阶段的模型学习循环，如此反复直至模型训练完成。

本发明作进一步改进，所述门结构采用Sigmoid函数作为激活函数，所述Sigmoid函数定义为：

本发明作进一步改进，在步骤B中，结合小波变换降噪的ARIMA模型的处理过程分为两部分：

S1：采用小波变换的方法对金融品种的历史行情数据进行降噪处理，从而得到低噪声高质量的有效行情数据；

S2：将经过小波变换降噪处理后的金融品种历史行情数据进行ARIMA模型建模，

在步骤S1中，将金融品种的历史行情数据作为一种带噪声的信号数据，该信号数据由以下公式定义：

f(i)＝s(i)+e(i)

其中，i为记录历史行情数据的每一个时间周期，e(i)为信号数据所携带的噪声，s(i)为金融品种的真实有效的历史行情数据信号，小波变换的目的在于通过对f(i)的处理，得到金融品种真实有效的历史行情数据信号部分，即s(i)部分。

本发明作进一步改进，在步骤S2中，所述ARIMA模型为：

ARIMA(p，d，q)＝AR(p)+Difference(d)+MA(q)

其中，AR(p)表示p阶的自回归模型组分，Difference(d)表示行情数据成为平稳数据所需进行的d次差分变换，MA(q)表示q阶的移动平均模型组分，ARIMA模型的构建过程即为p、d、q三个参数的选定过程。

本发明作进一步改进，在步骤C中，运用混合模型对金融品种价格变动趋势进行预测的处理过程包括：

C1：运用训练好的LSTM模型及ARIMA模型分别对金融品种价格进行预测；

C2：对两个子模型的预测结果进行综合从而得到最终的预测结果，其中，步骤C2中，采用加权平均法进行综合处理。

本发明还提供一种实现所述金融品种价格预测方法的系统，包括，

金融品种历史行情数据库构建模块：用于存储金融品种在过去某一时间段内的历史行情数据；

混合模型构建模块：用于在金融品种历史行情数据库的基础上构建混合模型，所述混合模型包括深度学习模型和结合小波变换降噪的ARIMA模型；

价格变动趋势预测模块：用于运用混合模型对金融品种价格变动趋势进行预测，并对来自不同模型的预测结果进行综合从而得到精确度更高的预测结果。

与现有技术相比，本发明的有益效果是：适用于实际金融市场环境的预测，能够更加有效的利用各金融品种的历史行情数据并从中更好的发掘经济市场变动规律和涨跌逻辑，相比起运用单一模型预测的方法，本发明具有良好的预测性能，能够准确的预测金融品种在未来的价格变换趋势，预测的结果更加精确。

附图说明

图1为本发明方法流程图；

图2为长短时记忆模型的结构示意图；

图3为长短时记忆模型的门结构示意图；

图4为长短时记忆模型训练输入及训练输出结构示意图；

图5为构建的长短时记忆模型整体结构示意图；

图6为mini-batch结构示意图；

图7为小波变换降噪方法流程图；

图8为ARIMA模型的构建方法流程示意图。

具体实施方式

下面结合附图和实施例对本发明做进一步详细说明。

如图1所示，本发明金融品种价格预测方法包括如下步骤：

其中，ARIMA模型全称为自回归积分滑动平均模型(Autoregressive IntegratedMoving Average Model,简记ARIMA)，是由博克思(Box)和詹金斯(Jenkins)于70年代初提出一著名时间序列预测方法。

还包括步骤D：检验混合模型的预测结果是否准确，并根据检验结果对混合模型的子模型进行参数调节从而优化混合模型结构。

在步骤A中，构建金融品种历史行情数据库需要从YAHOO财经及新浪财经等金融公开数据源中收集数据，当以“股票”这一金融品种作为预测目标时，选取2016年1月4日(2016年第一个交易日)至2016年12月30日(2016年最后一个交易日)为区间，收集各股票及指数在此时间区间内的历史行情数据，并以“交易日”为数据收集的时间间隔周期，所构建的金融品种历史行情数据库结构如表1所示：

表1金融品种历史行情数据库结构

股票代码	股票名称	日期	开盘价	收盘价	最高价	最低价
							000001	上证指数	2016-01-04	3536.59	3296.66	3538.69	3295.74
……	……	……	……	……	……	……
							000001	上证指数	2016-12-30	3097.35	3103.64	3108.84	3089.99
399001	深证成指	2016-01-04	12650.72	11630.93	12659.41	11626.48
							……	……	……	……	……	……	……
399001	深证成指	2016-12-30	10175.5	10177.14	10204.09	10145.11
							……	……	……	……	……	……	……

此时，可选开盘价、收盘价、最高价及最低价等价格作为预测目标。

当拥有了各金融品种的历史行情数据之后，可在此基础上构建混合模型。本例混合模型的构建分为深度学习模型构建及结合小波变换降噪的ARIMA模型构建两部分。

本例的深度学习模型采用长短时记忆模型(以下简称LSTM模型)，所述LSTM模型通过训练能够发掘出金融品种的价格变动规律及潜在的变动逻辑，并通过对价格规律及变动逻辑的处理实现金融品种未来价格变动趋势的预测。所述长短时记忆模型将金融品种的历史行情数据进行划分从而生成模型训练数据集，该模型训练数据集分为训练输入及训练输出两部分，训练输入及训练输出数据长度为L，训练输入与训练输出之间相距T个时间周期；同时采用ReLU函数作为长短时记忆模型中状态处理及模型输出环节的激活函数，该激活函数定义为：Y＝Max(0，x)，其中，x为自变量。

如图2所示，A表示LSTM模型的循环神经网络的主体结构，输入层为X_t，输出层为h_t，在每一个时刻t，循环神经网络的主体结构A会读取t时刻的数据输入X_t，并在进行运算处理后得到输出值h_t，与此同时，主体结构A的状态会进行下一步循环，传递到t+1时刻。由此不难看出，LSTM趋近于同一神经网络结构在循环中被无限复制的结果，在每一个时刻t时都有一个对应的输入X_t，随后根据循环神经网络的当前状态A_t提供一个相对应的输入h_t，而此处的A_t是由上一时刻的状态A_t-1及此时的输入X_t二者共同决定的。该模型结构解决了传统循环神经网络结构的缺陷：长程依赖，能够实现对较长历史数据的记忆及长期规律的发掘。

本例的LSTM模型是一种特殊的循环神经网络结构，它引入了门的概念，从而实现了对数据信息的长期记忆及分析，其门结构如图3所示。LSTM模型所具备的门结构包含三种：输入门、输出门及遗忘门，LSTM模型通过这些门结构让信息有选择性地影响模型中每个时刻的状态。

LSTM模型的三个门结构的作用及其算法流程如下：

输入门：主要用于控制有多少信息可以流入模型的记忆体(即：Memory Cell)中，其由以下公式定义：

Input_t＝sigmoid(W_xix_t+W_hih_t-1+b_i)

式中，W及b代表相应的权重及偏置，经由“输入门”处理后的数据流入当前状态C_t中。此时，“遗忘门”则控制有多少上一时刻的模型记忆体信息可以累积到当前时刻的记忆体中，“遗忘门”的公式定义如下所示：

Forget_t＝sigomid(W_xfx_t+W_hfh_t-1+b_f)

式中的W及b代表相应的权重及偏置，同样，经由“遗忘门”处理的数据信息流入当前状态C_t中，所有信息在当前状态C_t处得到汇总并传入“输出门”进行最终处理。“输出门”在LSTM模型中的作用在于控制有多少当前时刻的记忆体信息(即当前状态C_t的信息)能够流入下一次学习阶段的记忆体中，其由以下公式定义：

Output_t＝sigmoid(W_xox_t+W_hoh_t-1+b_o)

至此，数据信息经过三个门结构的处理完成一轮循环，处理后的数据信息经由输出门进入下一阶段的模型学习循环，如此反复直至模型训练完成。

由上述公式可知，门结构的本质是一个基于Sigmoid函数的神经网络进行按位乘法操作。与LSTM模型中其余状态控制及结果输出神经元所采用ReLU函数作为激活函数不同，门结构的实现有赖于Sigmoid函数的特性，该函数定义为：

使用Sigmoid函数作为激活函数的神经网络会输出一个0到1之间的数值，这个数值表示会有多少数据信息量通过能够该门结构，当Sigmoid函数输出值为1时，表示当前所有信息都能通过，而当Sigmoid函数输出值为0时，则表示任何信息都无法通过，当Sigmoid函数输出值介于0与1之间时，则表示当前信息仅有部分能够通过，因而，在LSTM模型中各个门结构采用Sigmoid函数作为其激活函数，而在模型的其余状态控制及结果输出环节中选用ReLU函数作为激活函数以便进行数据处理。

综上所述，本例的深度学习模型的构建具体包括五个处理过程：

(1)构建训练输入及对应的训练输出，其训练数据集如图4所示，图中t代表timesteps，表示一个滞后周期，当t的值为1时，表示训练输入及训练输出仅相距1天，如训练输入第1天、第2天、第3天直到第n天的收盘价数值，则训练输出为训练输入滞后1天的序列，即第2天、第3天、第4天直至第n+1天的数据。训练输入为某一时间段内样本的收盘价序列，所对应的训练输出则为滞后一定时间后样本的收盘价序列(即样本未来的收盘价序列)，这样的输入及输出意在训练LSTM学习样本序列前后的关联及规律；

(2)构建对应的LSTM模型结构，其结构图如图5所示，图5中左侧为LSTM模型展开的详细结构示意图，图5中的右侧则为LSTM模型的缩略概括结构示意图，所述LSTM模型的门结构处于隐藏层中，此处不对其实现细节进行赘述；

(3)选用ReLU函数代替传统的tanh函数作为LSTM模型中状态控制及结果输出环节等非门结构部分的神经元激活函数，ReLU函数本身比较简单，在自变量小于0时，其对应的函数值恒为0，当自变量大于0时，其函数值等同于自变量本身。该ReLU函数能保证梯度的稳定变化从而使LSTM模型的构建更加平稳；

(4)采用L2正则化及MSE损失函数以避免LSTM模型构建过程中出现过拟合，MSE损失函数全称为Mean Squared Error(均方误差)函数，由以下公式定义：

上述公式中，y_i表示第i个数据所对应的正确输出，y’_i则表示第i个数据所对应的神经网络预测值输出，n为数据的总个数。在深度学习模型的训练中，损失函数能够有效地描述当前模型在训练数据上的表现是否已经令人满意，而L2正则化则能够通过对损失函数进行进一步处理以防止模型过度的学习训练数据中无意义的噪声数据，使得模型的训练更加精准。

L2正则化作用的主要途径是限制权重的大小，其定义如下所示：

上述公式中，w为模型的权重Weight，即需要计算正则化损失的参数。通过选择MSE损失函数及对损失函数进行L2正则化，可以有效避免模型在训练过程中的过拟合，使得模型能够将注意力集中在股票收盘价序列真正的波动规律而非随机噪声上。

(5)采用mini-batch的方法，使得LSTM模型能够高效准确地构建。“mini-batch”即为“最小批量梯度下降法”，梯度下降是模型调整参数的最重要的途径，梯度下降的质量直接决定模型的质量，mini-batch法结合了梯度下降及随机梯度下降的优缺点，并进行了折中处理，对当前模型的训练数据进行批量划分，模型的参数调整与优化也仅围绕当前批量的数据进行。mini-batch法的结构如图6所示，图中m代表一个batch(批量)的规模大小，当m值较大时，完整的时序数据便能用少量的batch覆盖，但每一个batch所包含的数据量较大，模型在单个batch上的训练耗时较长，但模型能从更多的数据上对参数进行调节，因此需要对m进行合理取值，兼顾模型训练耗时及训练成效。

在步骤B中，还需要对ARIMA模型进行构建。本发明提出一种结合小波变换降噪的ARIMA模型。通过相关研究，金融品种的历史行情数据中含有一定量的噪音，而常规的ARIMA模型方法中并没有对这部分噪音进行处理。

因此，本例结合小波变换降噪的ARIMA模型的处理过程分为两部分：

在步骤S1中，将金融品种的历史行情数据作为一种带噪声的信号数据，这种信号符合时域上的连续，并且负载了金融品种相应的信息内容，该信号数据由以下公式定义：

f(i)＝s(i)+e(i)

其中，i为记录历史行情数据的每一个时间周期，f(i)表示带噪声的金融品种历史行情数据信号，e(i)为信号数据所携带的噪声，s(i)为金融品种的真实有效的历史行情数据信号，在此基础上可以参考信号降噪的方式对金融品种历史行情数据进行清洗，使得ARIMA模型能够更容易的分辨出金融品种价格的变化规律。信号降噪在一定程度上也是对信号的增强，通过该过程，能够使金融品种的规律更加突出，这对于金融品种价格预测存在一定的助益。小波变换的目的在于通过对f(i)的处理，得到金融品种真实有效的历史行情数据信号部分，即s(i)部分。

小波变换(Wavelet Transform，WT)是近些年逐步发展起来的一种信号处理方法，这种方法源于傅里叶分析。从信号学的角度来看，小波降噪实则是一个信号滤波的过程，很大程度上小波降噪能够视为一种低通滤波的方式，但其优势在滤波后仍能保留信号的原始特征，这一特性使得小波降噪优于传统的信号滤波方法，其流程示意图如图7所示。通过小波变换降噪后，金融品种的历史行情信息得以增强，价格变动规律更加明显。

在步骤S2中，在经过小波变换降噪处理后将处理后的金融品种历史行情数据用于ARIMA模型建模，此处的ARIMA模型全称为自回归差分移动平均模型，所述ARIMA模型为：

ARIMA(p，d，q)＝AR(p)+Difference(d)+MA(q)

其中，AR(p)表示p阶的自回归模型组分，Difference(d)表示行情数据成为平稳数据所需进行的d次差分变换，MA(q)表示q阶的移动平均模型组分，ARIMA模型的构建过程即为p、d、q三个参数的选定过程。本例中，选定这三个参数的主要方法包括ACF(Autocorrelation Funtion，自相关函数)、PACF(The Partial AutocorrelationFuntion，偏自相关函数)以及数据平稳性检验和平稳化处理。其中，ACF函数描述了时间序列当前值与历史值的线性相关性，即时间序列与其自身滞后序列之间的关联性；PACF函数则描述了在给定中间观测值的情况下时间序列前后的线性相关性；在数据平稳性检验中，通常采用ADF检验法。ADF检验法又称“增广迪基-富勒检验法(Augmented Dcikey-FullerTest)”，是在DF检验法基础上改进的方法，常用于金融时序数据的平稳性检验。而对于非平稳的数据，则采用差分法进行平稳化处理。

如图8所示，本例ARIMA模型的构建过程为：

首先，构建金融时间序列，进行平稳性判断，如果不符合标准，则进行平稳化处理直至符合标准，如果符合标准，构建ARIMA模型；

其次，分别确定AR模型阶数、查分阶数和MA模型阶数，根据相应阶数构建完整的ARIMA模型；

最后，检验模型效果完成构建。

在步骤C中，在得到构建好的模型后，运用混合模型对金融品种价格变动趋势进行预测的处理过程包括：

C2：对两个子模型的预测结果进行综合从而得到最终的预测结果。

其中，步骤C2中，采用加权平均法进行综合处理，本例的处理公式为：

其中，Value_hybrid表示混合模型的最终预测结果，Value_LSTM和Value_ARIMA分别代表混合模型中两个子模型——LSTM模型及ARIMA模型的预测结果，Weight_LSTM和Weight_ARIMA则分别代表LSTM模型及ARIMA模型的权重。

混合模型构建模块：用于在金融品种历史行情数据库的基础上构建混合模型，所述混合模型包括LSTM模型和结合小波变换降噪的ARIMA模型；

价格变动趋势预测模块：用于运用混合模型对金融品种价格变动趋势进行预测，并对来自不同模型的预测结果进行综合从而得到精确度更高的预测结果

还包括检验优化模块：用于检验混合模型的预测结果是否准确，并根据检验结果对混合模型的子模型进行参数调节从而优化混合模型结构。

为了更加形象全面的阐述本发明所提出的方法，本发明以一实施例为代表进行说明：

本例选取000001(上证综指)这一指数作为金融品种的样例，以该股票从2016年1月4日起至2016年12月23日止的历史行情数据为基础，预测其从2016年12月26日至同年12月30日共计5个交易日的收盘价价格序列。分别构建深度学习模型及结合小波变换降噪的ARIMA模型从而得到完整的混合模型，并运用该混合模型中的深度学习模型及ARIMA模型分别得出预测结果，最终采用加权平均的策略对预测结果进行综合，其结果如表2所示：

表2真实值与本发明预测结果比较

由表2可看出，在000001(上证综指)这一金融品种样本的收盘价预测上，本发明所提出的预测方法及系统具有良好的预测性能，能够准确的预测金融品种在未来的价格变换趋势。由此说明本发明所提出的基于混合模型的金融品种价格预测方法及系统适用于实际金融市场环境的预测。

以上所述之具体实施方式为本发明的较佳实施方式，并非以此限定本发明的具体实施范围，本发明的范围包括并不限于本具体实施方式，凡依照本发明所作的等效变化均在本发明的保护范围内。

Claims

1.一种基于混合模型的金融品种价格预测方法，其特征在于包含如下步骤：

2.根据权利要求1所述的金融品种价格预测方法，其特征在于还包括步骤D：检验混合模型的预测结果是否准确，并根据检验结果对混合模型的子模型进行参数调节从而优化混合模型结构。

3.根据权利要求1或2所述的金融品种价格预测方法，其特征在于：在步骤B中，所述深度学习模型为LSTM模型，所述LSTM模型通过训练能够发掘出金融品种的价格变动规律及潜在的变动逻辑，并通过对价格规律及变动逻辑的处理实现金融品种未来价格变动趋势的预测。

4.根据权利要求3所述的金融品种价格预测方法，其特征在于：所述LSTM模型将金融品种的历史行情数据进行划分从而生成模型训练数据集，该模型训练数据集分为训练输入及训练输出两部分，训练输入及训练输出数据长度为L，训练输入与训练输出之间相距T个时间周期；同时采用ReLU函数作为长短时记忆模型中状态处理及模型输出环节的激活函数，该激活函数定义为：

Y＝Max(0，x)

其中，x为自变量。

5.根据权利要求4所述的金融品种价格预测方法，其特征在于：所述LSTM模型为引入门结构的循环神经网络结构，所述门机构包括输入门、输出门及遗忘门，其中，

数据信息经过三个门结构的处理完成一轮循环，处理后的数据信息经由输出门进入下一阶段的模型学习循环，如此反复直至LSTM模型训练完成。

6.根据权利要求5所述的金融品种价格预测方法，其特征在于：所述门结构采用Sigmoid函数作为激活函数，所述Sigmoid函数定义为：

7.根据权利要求1或2所述的金融品种价格预测方法，其特征在于：在步骤B中，结合小波变换降噪的ARIMA模型的处理过程分为两部分：

f(i)＝s(i)+e(i)

8.根据权利要求7所述的金融品种价格预测方法，其特征在于：在步骤S2中，所述ARIMA模型为：

ARIMA(p，d，q)＝AR(p)+Difference(d)+MA(q)

9.根据权利要求1或2所述的金融品种价格预测方法，其特征在于：在步骤C中，运用混合模型对金融品种价格变动趋势进行预测的处理过程包括：

C1：运用训练好的深度学习模型及ARIMA模型分别对金融品种价格进行预测；

10.一种实现权利要求1-9任一项所述金融品种价格预测方法的系统，其特征在于包括：金融品种历史行情数据库构建模块：用于存储金融品种在过去某一时间段内的历史行情数据；