CN112819136A - 基于cnn-lstm神经网络模型与arima模型的时间序列预测方法及系统 - Google Patents
基于cnn-lstm神经网络模型与arima模型的时间序列预测方法及系统 Download PDFInfo
- Publication number
- CN112819136A CN112819136A CN202110076545.0A CN202110076545A CN112819136A CN 112819136 A CN112819136 A CN 112819136A CN 202110076545 A CN202110076545 A CN 202110076545A CN 112819136 A CN112819136 A CN 112819136A
- Authority
- CN
- China
- Prior art keywords
- lstm
- layer
- prediction
- sequence
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003062 neural network model Methods 0.000 title claims abstract description 46
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 title claims abstract description 38
- 238000012937 correction Methods 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000005311 autocorrelation function Methods 0.000 claims description 25
- 238000013528 artificial neural network Methods 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 9
- 230000001364 causal effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 abstract description 7
- 210000004027 cell Anatomy 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 11
- 238000010606 normalization Methods 0.000 description 8
- 239000000306 component Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 230000006403 short-term memory Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了时间序列预测技术领域的一种基于CNN‑LSTM神经网络模型与ARIMA模型的时间序列预测方法及系统,旨在解决现有技术中没有充分提取时间序列的周期特征从而导致预测精度不够的问题。包括:获取待预测的时间序列数据,构建输入样本;将输入样本输入经过训练的基于CNN‑LSTM的神经网络模型,得到第一预测结果;将第一预测结果与输入样本的观测值进行比对,得到误差序列;将误差序列输入建立的ARIMA模型对误差序列进行误差修正预测,得到第二预测结果;将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
Description
技术领域
本发明属于时间序列预测技术领域,具体涉及一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法及系统。
背景技术
在实际生产和科学研究中,时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。时间序列预测应用广泛,与现实生活中多种场景息息相关,例如金融市场的波动趋势分析、工业机构的能源消耗量预测、城市道路的交通流量预测等。现有的时间序列预测方法大多数采用传统线性模型或循环神经网络,传统线性模型非常依赖模型参数的选择,并且难以提取非线性时间序列中的复杂模式以及时间序列中的前后依赖。循环神经网络在处理复杂的多变量时间序列时具有明显的优越性,但由于其内部结构所限,并不能很好的提取到时间序列的周期特征,从而影响预测精度。
发明内容
本发明的目的在于提供一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法及系统,以解决现有技术中没有充分提取时间序列的周期特征从而导致预测精度不够的问题。
为达到上述目的,本发明所采用的技术方案是:一种时间序列预测方法,包括:获取待预测的时间序列数据,构建输入样本;将输入样本输入经过训练的基于CNN-LSTM的神经网络模型,得到第一预测结果;将第一预测结果与输入样本的观测值进行比对,得到误差序列;将误差序列输入建立的ARIMA模型对误差序列进行误差修正预测,得到第二预测结果;将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
进一步地,所述基于CNN-LSTM的神经网络模型,包括时间卷积层、模式提取层和全连接层;所述时间卷积层包括若干层采用因果卷积的卷积神经网络;所述模式提取层包括一个LSTM层和一个skip-LSTM层,所述LSTM层采用双曲正切函数tanh作为激活函数;所述skip-LSTM层是设置了跳跃组件的LSTM层,采用双曲正切函数tanh作为激活函数,所述跳跃组件使每个LSTM细胞直接与下一周期的LSTM细胞相连接;所述时间卷积层同时和所述LSTM层和所述skip-LSTM层相连接;所述全连接层用于将所述LSTM层和所述skip-LSTM层的输出向量转换为预测目标值,包括若干层隐藏层,每层所述隐藏层采用线性整流函数ReLU作为激活函数。
进一步地,所述时间卷积层包括三层采用因果卷积的卷积神经网络,每层所述采用因果卷积的卷积神经网络的卷积核大小为5且不设置池化层。
进一步地,所述LSTM层的隐藏单元数为20。
进一步地,所述全连接层包括三层隐藏层,每层所述隐藏层的隐藏单元数分别为256、64和32。
进一步地,所述基于CNN-LSTM的神经网络模型的训练方法,包括:获取时间序列数据并进行预处理,构建训练样本;将训练样本输入基于CNN-LSTM的神经网络模型,不断优化更新基于CNN-LSTM的神经网络模型的权重矩阵W和全连接层的第i个隐藏层的第j个隐藏单元的偏置矩阵Bij,直至损失函数最小。
进一步地,所述损失函数为:
其中,observedt为实际观测值,predictedt为神经网络模型输出的预测值。
进一步地,所述预处理包括:用平均值为0且标准差为0.01的高斯分布随机初始化基于CNN-LSTM的神经网络模型的权重矩阵W;初始化Bij为0,其中,Bij为全连接层的第i各隐藏层的第j个隐藏单元的偏置矩阵。
进一步地,所述ARIMA模型的建立方法包括:通过时序图法对误差序列进行检验,判断误差序列是否属于非平稳时间序列,如误差序列属于非平稳时间序列,则采用差分法对误差序列进行差分,直到得到新的平稳误差序列;计算新的平稳误差序列的自相关函数ACF以及偏自相关函数PACF从而确定使用的模型;自相关系数ACF的计算公式如下:
其中,μ为序列均值,k为序列的滞后次数;
若偏自相关函数不截尾,则采用自回归即AR(p)模型,其定义如下:
其中et为对误差进行修正预测的结果,p为AR模型的阶数,γi为自相关系数;
若自相关函数ACF不截尾(落在置信区间内),则采用移动平均MA(q)模型:
其中,q为MA模型的阶数,θi是所求参数,ε为误差项;
若自相关函数以及偏自相关函数均不截尾,则采用ARIMA(p,d,q)模型,该模型为自回归与移动平均的结合,其公式定义为:
保存p,d,q的值,完成模型的定阶从而建立ARIMA模型。
一种时间序列预测系统,包括:第一模块,用于获取待预测的时间序列数据作为输入样本;第二模块,用于将输入样本输入经过训练的基于CNN-LSTM的神经网络模型,得到第一预测结果;第三模块,用于将第一预测结果与输入样本的观测值进行比对,得到误差序列;第四模块,用于将误差序列输入建立的ARIMA模型对误差序列进行误差修正预测,得到第二预测结果;第五模块,用于将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
与现有技术相比,本发明所达到的有益效果:
(1)本发明通过基于CNN-LSTM的神经网络模型,利用带有跳跃组件的长短期记忆网络充分提取时间序列的周期性特征,解决了现有技术中没有充分提取时间序列的周期特征从而导致预测精度不够的问题;
(2)本发明通过基于CNN-LSTM神经网络模型与ARIMA模型,使用ARIMA模型对神经网络预测结果的误差值建模分析,修正预测误差,由于ARIMA模型为线性模型因而能捕捉到时间序列之中的线性特征,弥补了单一使用神经网络从而忽视了时间序列中的线性特征的不足;
(3)本发明所提出的基于CNN-LSTM的神经网络模型,在进行训练之前,首先对时间序列数据进行预处理,其中包含了归一化处理和滑动窗口处理;通过归一化处理,将数据转换至0~1之间,节约了计算资源,加快了神经网络的收敛速度;通过滑动窗口处理使得数据更加平稳。
附图说明
图1是本发明实施例提供的一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法的流程示意图;
图2是本发明实施例提供的一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法的系统结构示意图;
图3是本发明实施例提供的一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法中因果卷积的示意图;
图4是本发明实施例提供的一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法中长短期记忆网络的内部单元结构图;
图5是本发明实施例提供的一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法中长短期记忆网络在时间维度上的展开图;
图6是本发明实施例提供的一种基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法中ARIMA模型的定阶方法示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例一:
一种时间序列预测方法,包括:获取待预测的时间序列数据,构建输入样本;将输入样本输入经过训练的基于CNN(卷积神经网络)-LSTM(长短期记忆人工神经网络)的神经网络模型,得到第一预测结果;将第一预测结果与输入样本的观测值进行比对,得到误差序列;将误差序列输入建立的ARIMA模型(差分整合移动平均自回归模型)对误差序列进行误差修正预测,得到第二预测结果;将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
本实施例中,基于CNN-LSTM的神经网络模型,包括时间卷积层、模式提取层和全连接层;时间卷积层包括三层采用因果卷积的卷积神经网络,每层网络的卷积核大小为5且不设置池化层;模式提取层包括一个LSTM(长短时记忆网络)层和一个skip-LSTM层,每层LSTM层的隐藏单元数为20;均采用tanh(双曲正切函数)作为激活函数;skip-LSTM层是设置了跳跃组件的LSTM层,采用双曲正切函数tanh作为激活函数,跳跃组件使每个LSTM细胞直接与下一周期的LSTM细胞相连接,从而捕捉时间序列的周期性;时间卷积层同时和LSTM层和skip-LSTM层相连接;全连接层用于将LSTM层和skip-LSTM层的输出向量转换为预测目标值,通过该层进行线性变换之后得到神经网络的预测结果,包括若三层隐藏层,每层隐藏层的隐藏单元数分别为256、64和32且采用线性整流函数ReLU作为激活函数。
如图1~图6所示,本实施例的具体实现步骤如下:
步骤一:使用开源人工神经网络库Kreas搭建基于CNN-LSTM的神经网络模型,按照上述结构设置好模型的参数。
步骤二:对基于CNN-LSTM的神经网络模型进行训练,包括:获取时间序列数据并进行预处理,构建训练样本:
假设获取时间序列数据X={x0,x1,...,xT},其中T为时间序列的截止时刻,xi为时间序列中i(0<i<T)时刻的观测值;为了将数据映射至0到1之间,从而加快神经网络的训练速度。对时间序列X进行归一化处理得到序列X′={x′0,x′1,...,x′T},对于每个观测值xi,其归一化方法为:
其中,xmax和xmin分别对应着观测值中的的最大值和最小值,x′i为归一化之后的结果;
步骤三:使用窗口大小为P、步长为1的滑动窗口在经过归一化处理后的时间序列X′上滑动,得到窗口序列集W={x′j,x′j+1,...,x′j+P-1},其中j∈[0,T-P+1]。在时间维度上对窗口序列集按7:3的比例进行划分,从而得到训练样本与测试样本。
预处理还包括:用平均值为0且标准差为0.01的高斯分布随机初始化基于CNN-LSTM的神经网络模型的权重矩阵W;初始化Bij为0,其中,Bij为全连接层的第i各隐藏层的第j个隐藏单元的偏置矩阵。
步骤四:将训练样本输入基于CNN-LSTM的神经网络模型,不断优化更新基于CNN-LSTM的神经网络模型的权重矩阵W和全连接层的第i个隐藏层的第j个隐藏单元的偏置矩阵Bij,直至损失函数最小:根据训练结果更新W和Bij;将更新后的W和Bij带入神经网络,并计算损失函数;重复W和Bij的更新和代入过程,直至损失函数最小,保存此时的W和Bij,获取训练好的神经网络。
使用划分好的训练样本对CNN-LSTM神经网络模型进行训练,特别地,窗口序列数据将首先进入时间卷积层以提取数据在时间维度上的短期依赖。时间卷积层采用因果卷积以确保输出不会违反数据的顺序,经过三层卷积层后得到特征向量Conv;
步骤五:将特征向量Conv输入到模式提取层,模式提取层由一个LSTM层与一个带有跳跃组件的LSTM层(即skip-LSTM层)所组成,Conv将同时输入至这两层网络进行计算:
LSTM即长短期记忆网络,是一种特殊的RNN(循环神经网络),主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。LSTM的核心部件称作LSTM细胞,LSTM细胞可以通过内部特有的门结构,包括遗忘门,更新门,输出门,来对之前的输入信息进行增加与遗忘。每个细胞之中的内部运算主要依赖于本状态输入的特征向量x<t>、上一单元输入的隐藏状态值a<t-1>、单元状态值c<t>以及确定单元状态值的中间变量
LSTM细胞内部结构如图4所示,现结合图4说明LSTM基本单元状态更新以及结果输出的过程:
(1)特征向量Conv经过遗忘门:
其中,Wf是用来控制遗忘门行为的权重矩阵,遗忘门将a<t-1>和x<t>连接起来并用Wf去乘连接后的矩阵,然后在加上一个偏置bf,最后通过sigmoid函数将值映射到区间[0,1]。遗忘门的输出结果将会与上一个单元的状态值进行对应元素的乘法运算。因此,如果中的一个值为0或接近0,那么上一个单元c<t-1>的对应信息将被丢弃,如果中的值为1,那么对应的信息将被保留。
(2)在遗忘门中对状态信息进行遗忘后,还需要对状态进行更新写入,更新门就是执行这一操作,其过程如下:
而传递至下一个单元的隐藏状态值a<t>为:
LSTM层的参数在时间维度上进行更新,计算过程在时间维度上的展开如图5所示,每个神经元之间共享参数;
特别地,skip-LSTM层为一个设有跳跃组件的LSTM,通过跳跃组件将每个细胞与下一周期的细胞相连接,从而捕捉时间序列之中的周期性规律。其具体工作原理与普通LSTM基本相同,故不再赘述。Skip-LSTM的前向传播过程如下:
其中,M是跳过的细胞的数量,对于具有明显周期性的数据集可使用其周期作为M值。例如纽约电能消耗数据集(以小时作为采样间隔)的M为24,长沙轨道交通流量数据集(以日作为采样间隔)的M为7。
步骤六:将特征提取层的输出结果输入至全连接层进行线性变换从而得到神经网络的预测值,该全连接层共设有三个隐藏层,隐藏单元数量分别为256、64、32。使用线性整流函数(ReLU)作为激活函数,每层网络的前向传播过程如下:
其中,l代表网络的层数,W[l]是第l层的权重矩阵,Bl是第l层的偏置矩阵,A[l]则是第l层的输出。训练采用均方根误差(RMSE)作为损失函数,其定义式如下:
其中,observedt为实际观测值,predictedt为神经网络模型输出的预测值。使用Kreas中的Adam优化器(keras.optimizers.Adam)通过梯度下降的方法不断优化更新权重矩阵W与偏置矩阵B,直至损失函数最小,此时神经网络收敛。保存该神经网络模型并使用其进行预测而得到预测结果P′。
步骤七:将神经网络输出的结果序列与观测值进行对比,得到误差序列E={ei,ei+1,...,eT},采用ARIMA模型对E进行误差修正预测,ARIMA(p,d,q)模型全称为差分自回归移动平均模型,将非平稳时间序列转化为平稳时间序列然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型,ARIMA模型的建立方法,具体如下:
通过时序图法对E进行检验,判断E是否属于非平稳时间序列,若E属于非平稳时间序列,则需要采用差分法对E进行差分,直到得到新的平稳序列E′。其中,差分的次数则为模型的参数d;
如图6所示,计算E′的自相关系数ACF以及偏自相关系数PACF从而确定使用的模型。自相关系数ACF的计算公式如下:
其中,μ为序列均值,k为序列的滞后次数。偏自相关系数PACF的计算较为复杂,一般采用最小二乘法;
若偏自相关函数不截尾,则采用自回归即AR(p)模型,其定义如下:
其中et为对误差进行修正预测的结果,p为AR模型的阶数,γi为自相关系数;
若自相关函数ACF不截尾(落在置信区间内),则采用移动平均MA(q)模型:
MA模型主要聚焦于AR模型中的误差项的累加,其中,q为MA模型的阶数,θi是所求参数,ε为误差项;
若自相关函数以及偏自相关函数均不截尾,则采用ARIMA(p,d,q)模型,该模型为自回归与移动平均的结合,其公式定义为:
保存p,d,q的值,完成模型的定阶从而建立最适合的误差预测模型;
步骤八:保存训练好的神经网络模型以及定阶后的ARIMA模型。对任何与训练模型时使用的序列具有相同特征的时间序列,均可采用上述模型进行预测。具体方法如下:首先将该训练输入至神经网络进行预测并得到结果P′,再使用ARIMA(p,d,q)模型对误差进行修正预测,得到结果Perr。最终将P′与Perr相加即可得到对于该时间序列的预测结果P。
本实施例所提出的基于CNN-LSTM的神经网络模型,在进行训练之前,首先对时间序列数据进行预处理,其中包含了归一化处理和滑动窗口处理;通过归一化处理,将数据转换至0~1之间,节约了计算资源,加快了神经网络的收敛速度;通过滑动窗口处理使得数据更加平稳。
本实施例通过基于CNN-LSTM的神经网络模型,利用带有跳跃组件的长短期记忆网络充分提取时间序列的周期性特征,解决了现有技术中没有充分提取时间序列的周期特征从而导致预测精度不够的问题;通过基于CNN-LSTM神经网络模型与ARIMA模型,使用ARIMA模型对神经网络预测结果的误差值建模分析,修正预测误差,由于ARIMA模型为线性模型因而能捕捉到时间序列之中的线性特征,弥补了单一使用神经网络从而忽视了时间序列中的线性特征的不足。
实施例二:
基于实施例一所述的时间序列预测方法,本实施例提供一种时间序列预测系统,包括:
第一模块,用于获取待预测的时间序列数据作为输入样本;
第二模块,用于将输入样本输入经过训练的基于CNN-LSTM的神经网络模型,得到第一预测结果;
第三模块,用于将第一预测结果与输入样本的观测值进行比对,得到误差序列;
第四模块,用于将误差序列输入建立的ARIMA模型对误差序列进行误差修正预测,得到第二预测结果;
第五模块,用于将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (10)
1.一种时间序列预测方法,其特征是,包括:
获取待预测的时间序列数据,构建输入样本;
将输入样本输入经过训练的基于CNN-LSTM的神经网络模型,得到第一预测结果;
将第一预测结果与输入样本的观测值进行比对,得到误差序列;
将误差序列输入建立的ARIMA模型对误差序列进行误差修正预测,得到第二预测结果;
将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
2.根据权利要求1所述的时间序列预测方法,其特征是,所述基于CNN-LSTM的神经网络模型,包括时间卷积层、模式提取层和全连接层;
所述时间卷积层包括若干层采用因果卷积的卷积神经网络;
所述模式提取层包括一个LSTM层和一个skip-LSTM层,所述LSTM层采用双曲正切函数tanh作为激活函数;所述skip-LSTM层是设置了跳跃组件的LSTM层,采用双曲正切函数tanh作为激活函数,所述跳跃组件使每个LSTM细胞直接与下一周期的LSTM细胞相连接;
所述时间卷积层同时和所述LSTM层和所述skip-LSTM层相连接;
所述全连接层用于将所述LSTM层和所述skip-LSTM层的输出向量转换为预测目标值,包括若干层隐藏层,每层所述隐藏层采用线性整流函数ReLU作为激活函数。
3.根据权利要求2所述的时间序列预测方法,其特征是,所述时间卷积层包括三层采用因果卷积的卷积神经网络,每层所述采用因果卷积的卷积神经网络的卷积核大小为5且不设置池化层。
4.根据权利要求2所述的时间序列预测方法,其特征是,所述LSTM层的隐藏单元数为20。
5.根据权利要求2所述的时间序列预测方法,其特征是,所述全连接层包括三层隐藏层,每层所述隐藏层的隐藏单元数分别为256、64和32。
6.根据权利要求2所述的时间序列预测方法,其特征是,所述基于CNN-LSTM的神经网络模型的训练方法,包括:
获取时间序列数据并进行预处理,构建训练样本;
将训练样本输入基于CNN-LSTM的神经网络模型,不断优化更新基于CNN-LSTM的神经网络模型的权重矩阵W和全连接层的第i个隐藏层的第j个隐藏单元的偏置矩阵Bij,直至损失函数最小。
8.根据权利要求6所述的时间序列预测方法,其特征是,所述预处理包括:用平均值为0且标准差为0.01的高斯分布随机初始化基于CNN-LSTM的神经网络模型的权重矩阵W;初始化Bij为0,其中,Bij为全连接层的第i个隐藏层的第j个隐藏单元的偏置矩阵。
9.根据权利要求1所述的时间序列预测方法,其特征是,所述ARIMA模型的建立方法包括:
通过时序图法对误差序列进行检验,判断误差序列是否属于非平稳时间序列,如误差序列属于非平稳时间序列,则采用差分法对误差序列进行差分,直到得到新的平稳误差序列;
计算新的平稳误差序列的自相关函数ACF以及偏自相关函数PACF从而确定使用的模型;自相关系数ACF的计算公式如下:
其中,μ为序列均值,k为序列的滞后次数;
若偏自相关函数不截尾,则采用自回归即AR(p)模型,其定义如下:
其中et为对误差进行修正预测的结果,p为AR模型的阶数,γi为自相关系数;
若自相关函数ACF不截尾(落在置信区间内),则采用移动平均MA(q)模型:
其中,q为MA模型的阶数,θi是所求参数,ε为误差项;
若自相关函数以及偏自相关函数均不截尾,则采用ARIMA(p,d,q)模型,该模型为自回归与移动平均的结合,其公式定义为:
保存p,d,q的值,完成模型的定阶从而建立ARIMA模型。
10.一种时间序列预测系统,其特征是,包括:
第一模块,用于获取待预测的时间序列数据作为输入样本;
第二模块,用于将输入样本输入经过训练的基于CNN-LSTM的神经网络模型,得到第一预测结果;
第三模块,用于将第一预测结果与输入样本的观测值进行比对,得到误差序列;
第四模块,用于将误差序列输入建立的ARIMA模型对误差序列进行误差修正预测,得到第二预测结果;
第五模块,用于将第一预测结果和第二预测结果相加得到时间序列的最终预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110076545.0A CN112819136A (zh) | 2021-01-20 | 2021-01-20 | 基于cnn-lstm神经网络模型与arima模型的时间序列预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110076545.0A CN112819136A (zh) | 2021-01-20 | 2021-01-20 | 基于cnn-lstm神经网络模型与arima模型的时间序列预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112819136A true CN112819136A (zh) | 2021-05-18 |
Family
ID=75858695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110076545.0A Pending CN112819136A (zh) | 2021-01-20 | 2021-01-20 | 基于cnn-lstm神经网络模型与arima模型的时间序列预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819136A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926264A (zh) * | 2021-02-23 | 2021-06-08 | 大连理工大学 | 可用泊位数的集成预测方法 |
CN113377834A (zh) * | 2021-06-08 | 2021-09-10 | 东南大学 | 一种基于大数据技术的电力数据挖掘分析方法 |
CN113670369A (zh) * | 2021-07-09 | 2021-11-19 | 南京航空航天大学 | 基于移动终端的风速测量及风噪声检测方法及装置 |
CN113705915A (zh) * | 2021-09-01 | 2021-11-26 | 沈阳建筑大学 | 一种基于cnn-lstm-arima组合短期电力负荷预测方法 |
CN113783717A (zh) * | 2021-08-12 | 2021-12-10 | 北京邮电大学 | 智慧城市网络流量预测方法及系统 |
CN114048790A (zh) * | 2021-08-01 | 2022-02-15 | 北京工业大学 | 一种基于耦合双向lstm和卷积结构网络的道路基层应变分析方法 |
CN115545361A (zh) * | 2022-12-02 | 2022-12-30 | 国网湖北省电力有限公司信息通信公司 | 一种电网传输线路气候环境预测方法、系统及介质 |
CN115758089A (zh) * | 2022-11-08 | 2023-03-07 | 海南师范大学 | 一种钻孔应变数据预测方法 |
CN116432542A (zh) * | 2023-06-12 | 2023-07-14 | 国网江西省电力有限公司电力科学研究院 | 一种基于误差序列修正的开关柜母排温升预警方法及系统 |
CN117031310A (zh) * | 2023-09-05 | 2023-11-10 | 南京工业大学 | 一种电动汽车动力电池剩余使用寿命预测方法 |
CN117633494A (zh) * | 2023-11-20 | 2024-03-01 | 中国矿业大学 | 一种基于awc-lstm模型的煤矿地表形变预测方法 |
-
2021
- 2021-01-20 CN CN202110076545.0A patent/CN112819136A/zh active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112926264A (zh) * | 2021-02-23 | 2021-06-08 | 大连理工大学 | 可用泊位数的集成预测方法 |
CN113377834A (zh) * | 2021-06-08 | 2021-09-10 | 东南大学 | 一种基于大数据技术的电力数据挖掘分析方法 |
CN113670369A (zh) * | 2021-07-09 | 2021-11-19 | 南京航空航天大学 | 基于移动终端的风速测量及风噪声检测方法及装置 |
CN114048790B (zh) * | 2021-08-01 | 2024-05-24 | 北京工业大学 | 一种基于耦合双向lstm和卷积结构网络的道路基层应变分析方法 |
CN114048790A (zh) * | 2021-08-01 | 2022-02-15 | 北京工业大学 | 一种基于耦合双向lstm和卷积结构网络的道路基层应变分析方法 |
CN113783717A (zh) * | 2021-08-12 | 2021-12-10 | 北京邮电大学 | 智慧城市网络流量预测方法及系统 |
WO2023016159A1 (zh) * | 2021-08-12 | 2023-02-16 | 北京邮电大学 | 智慧城市网络流量预测方法及系统 |
CN113705915A (zh) * | 2021-09-01 | 2021-11-26 | 沈阳建筑大学 | 一种基于cnn-lstm-arima组合短期电力负荷预测方法 |
CN115758089A (zh) * | 2022-11-08 | 2023-03-07 | 海南师范大学 | 一种钻孔应变数据预测方法 |
CN115545361A (zh) * | 2022-12-02 | 2022-12-30 | 国网湖北省电力有限公司信息通信公司 | 一种电网传输线路气候环境预测方法、系统及介质 |
CN115545361B (zh) * | 2022-12-02 | 2023-05-09 | 国网湖北省电力有限公司信息通信公司 | 一种电网传输线路气候环境预测方法、系统及介质 |
CN116432542A (zh) * | 2023-06-12 | 2023-07-14 | 国网江西省电力有限公司电力科学研究院 | 一种基于误差序列修正的开关柜母排温升预警方法及系统 |
CN116432542B (zh) * | 2023-06-12 | 2023-10-20 | 国网江西省电力有限公司电力科学研究院 | 一种基于误差序列修正的开关柜母排温升预警方法及系统 |
CN117031310A (zh) * | 2023-09-05 | 2023-11-10 | 南京工业大学 | 一种电动汽车动力电池剩余使用寿命预测方法 |
CN117633494A (zh) * | 2023-11-20 | 2024-03-01 | 中国矿业大学 | 一种基于awc-lstm模型的煤矿地表形变预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112819136A (zh) | 基于cnn-lstm神经网络模型与arima模型的时间序列预测方法及系统 | |
CN111899510B (zh) | 基于发散卷积和gat的智能交通系统流量短期预测方法及系统 | |
CN110223517B (zh) | 基于时空相关性的短时交通流量预测方法 | |
CN110909926A (zh) | 基于tcn-lstm的太阳能光伏发电预测方法 | |
CN111027772A (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
CN109583565A (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
Dong et al. | An integrated deep neural network approach for large-scale water quality time series prediction | |
CN110570035B (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
CN110689183B (zh) | 一种集群光伏功率概率预测方法、系统、介质及电子设备 | |
CN112508265A (zh) | 面向业务流程管理的时间与活动多任务预测方法及系统 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN112765894B (zh) | 一种基于k-lstm的铝电解槽状态预测方法 | |
CN113887801A (zh) | 建筑冷负荷预测方法、系统、设备及可读存储介质 | |
CN115018193A (zh) | 基于lstm-ga模型的时间序列风能数据预测方法 | |
CN113705915A (zh) | 一种基于cnn-lstm-arima组合短期电力负荷预测方法 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN115759461A (zh) | 一种面向物联网的多元时间序列预测方法及系统 | |
CN114572229B (zh) | 一种基于图神经网络的车速预测方法、装置、介质及设备 | |
CN114065996A (zh) | 基于变分自编码学习的交通流预测方法 | |
CN114492978A (zh) | 一种基于多层注意力机制的时空序列预测方法及设备 | |
CN114548591A (zh) | 一种基于混合深度学习模型和Stacking的时序数据预测方法及系统 | |
CN116244647A (zh) | 一种无人机集群的运行状态估计方法 | |
CN113988415B (zh) | 一种中长期电力负荷预测方法 | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及系统 | |
CN111292121A (zh) | 一种基于园区画像的园区负荷预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210518 |