CN111428908B - 一种基于stl-nn模型的海表面温度预测算法 - Google Patents
一种基于stl-nn模型的海表面温度预测算法 Download PDFInfo
- Publication number
- CN111428908B CN111428908B CN202010106716.5A CN202010106716A CN111428908B CN 111428908 B CN111428908 B CN 111428908B CN 202010106716 A CN202010106716 A CN 202010106716A CN 111428908 B CN111428908 B CN 111428908B
- Authority
- CN
- China
- Prior art keywords
- trend
- sst
- model
- term
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000001932 seasonal effect Effects 0.000 claims abstract description 36
- 238000013528 artificial neural network Methods 0.000 claims abstract description 33
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 19
- 238000009499 grossing Methods 0.000 claims description 15
- 230000000737 periodic effect Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 230000014509 gene expression Effects 0.000 claims description 9
- 238000012804 iterative process Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 11
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 11
- 230000000694 effects Effects 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000002688 persistence Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013277 forecasting method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 101100128278 Mus musculus Lins1 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于STL‑NN模型的海表面温度预测算法,其包括以下步骤:S1.采用基于局部加权回归的周期‑趋势分解方法将SST数据T分解为季节项S、趋势项C和余项R;S2.将分解得到的季节项S、趋势项C和余项R输入到神经网络预测模型中,得到若干天SST数据的预测值。该模型首先通过STL分解出SST的季节分量、趋势分量和剩余分量,确保SST数据的高效利用;在搭建神经网络预测模型时有效结合了LSTM模型的优点,能够利用其较强非线性逼近能力有效的对数据进行建模,最终预测出未来五天内的SST。在充分考虑序列数据特性的前提下,本发明方法不仅可以用于预测SST,在未来还可以推广至其它海洋要素序列数据的预测,具有非常广阔的推广应用前景。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种基于STL-NN模型的海表面温度预测算法。
背景技术
海洋表面温度(Sea Surface Temperature,简称SST)[1]不仅是全球大气系统中的一个重要参数,而且对海洋生态系统也有极大的影响。SST是赤潮、厄尔尼诺等海洋灾害发生的关键因子,同时它的变化还可以影响降雨的分布,从而引发洪涝灾害。准确的SST预测结果,为风暴潮、台风、赤潮等海洋灾害的精准预报提供支撑。现有的SSTP预测方法主要分为两类:(1)数值预报法[2],需要考虑SST的实际情况,然后在一定的初值和边界条件下,通过数值计算求解方程组来预测未来一定时间的SST;(2)统计预报法[3],通过筛选出影响SST的关键因子,再使用统计学方法预测SST。
SST是单要素时间序列数据,SST的预测便可视为一个单要素时间序列回归问题,因此研究者便利用时间序列分析方法来预测SST,期望实现SST高精度预测。由此可知对于SST预测,选择一种合适的时间序列预测方法对预测结果具有非常重要的意义。SST具有周期性、持续性、非平稳性以及非线性等特点,由于现有的时间序列预测模型如自回归(Autoregressive,简称AR)模型[4]、滑动平均(Moving Average,简称MA)模型[5]以及自回归滑动平均(Autoregressive Moving Average,简称ARMA)模型[6]等均是线性模型,无法满足SST预测的实际应用需求,因此研究者逐渐致力于研究非线性预测方法。支持向量机(Support Vector Machines,SVM)[7]是在1995年由Vapnik提出,该方法适用于处理小样本和非线性问题,具有较好的鲁棒性。Lins等人[8]将SVM与SST知识相结合来预测热带大西洋的SST,该方法主要侧重于SST的季节性和季节内的变化规律,实验数据为浮标数据,并分别以原始SST序列、SST曲率序列和SST斜率序列三种形式来预测SST,取得了较好的效果。人工神经网络(Artificial Neural Network,简称NN)作为现代人工智能(ArtificialIntelligence,简称AI)的一个重要分支,它具有优良的非线性逼近能力和容错性,在众多领域都有广泛应用,BP神经网络[9]是目前应用最为广泛的神经网络模型。循环神经网络(Recurrent Neural Networks,简称RNN)[10]在自然语言处理(Natural LanguageProcessing,简称NLP)中取得了巨大的成功,特别适用于语音识别、语言处理等基于时间序列数据的处理,但在迭代后期会出现“梯度爆炸”的现象。为解决RNN长时依赖的问题,Hochreiter和Schmidhuber[11]在1997年提出了长短期记忆网络(Long Short-TermMemory,简称LSTM),通过增加门机制从而解决了
该问题。门控循环单元(Gated Recurrent Unit,简称GRU)[12]神经网络具有与LSTM类似的门结构,常用于NLP领域。随着海洋科学和人工智能的紧密结合,许多深度学习(Deep Learning,简称DL)的方法不断在海洋科学领域得到广泛应用。Zhang等人[13]在2017年首次利用LSTM对SST时间关系进行建模,再通过全连接将LSTM层的输出映射到最终的预测结果,并将中国沿海海域的SST数据作为实验数据集进行实验,获得的高精度预测结果验证了其有效性。
尽管上述方法均能有效预测SST,但是上述方法只考虑SST的非线性,而在预测时也要考虑SST周期性、持续性和非平稳性,不然会使得预测精度不高。为了完善SST预测模型,并能充分利用这些特性,最终实现提高SST预测精度。
参考文献
[1]肖林,史剑,蒋国荣等.台风背景下海浪对海表流场和海表温度的影响[J].海洋通报,2018,(4):396-403.
[2]Mendoza V M,Villanueva E E,Adem J.Numerical experiments on theprediction of sea surface temperature anomalies in the Gulf of Mexico[J].Journal of Marine Systems,1997,13(s1–4):83–99.
[3]Repelli C A,Nobre P.Statistical prediction of sea-surfacetemperature over the tropical Atlantic[J].International Journal ofClimatology,2004,24(1):45-55.
[4]Zambon D,Grattarola D,Livi L,et al.Autoregressive Models forSequences of Graphs[J].2019.HARE L,TESSIER A.Predicting animal cadmiumconcentrations in lakes[J].Nature,1996,380:430-432.
[5]Albarracin O Y E,Alencar A P,Ho L L.Generalized autoregressive andmoving average models:multicollinearity,interpretation and a new modifiedmodel[J].Journal of Statistical Computation and Simulation,2019,89(10):1819-1840.
[6]Baptista M,Sankararaman S,Medeiros I P D,et al.Forecasting faultevents for predictive maintenance using data-driven techniques and ARMAmodeling[J].Computers&Industrial Engineering,2018,115:41-53.
[7]Vapnik V N.The Nature of Statistical Learning Theory[M]//Thenature of statistical learning theory.Springer,1995:988-999.
[8]Lins I D,Araujo M,Moura,Márcio das Chagas,et al.Prediction of seasurface temperature in the tropical Atlantic by support vector machines[J].Computational Statistics&Data Analysis,2013,61:187-198.
[9]王甜甜,刘强.基于BAS-BP模型的风暴潮灾害损失预测[J].海洋环境科学,2018,37(3):457-463.
[10]Graves A,Mohamed A R,Hinton G.Speech Recognition with DeepRecurrent Neural Networks[J].Acoustics,Speech,and Signal Processing,1988.ICASSP-88.1988International Conference on,2013,38.
[11]Hochreiter S,Schmidhuber J.Long Short-Term Memory.NeuralComputation,1997,9(8):1735-1780.
[12]Dey R,Salemt F M.Gate-variants of Gated Recurrent Unit(GRU)neuralnetworks[C]//IEEE International Midwest Symposium on Circuits&Systems.2017.
[13]Zhang Q,Wang H,Dong J,et al.Prediction of Sea Surface TemperatureUsing Long Short-Term Memory[J].IEEE Geoscience and Remote Sensing Letters,2017,14(10):1745-1749.
[14]Cleveland,Robert B.,William S.Cleveland,and Irma Terpenning."STL:A seasonal-trend decomposition procedure based on loess."Journal of OfficialStatistics 6.1(1990):3.
发明内容
针对上述现有技术中的不足,本发明提供一种基于STL-NN模型的海表面温度预测算法,该算法将STL分解与神经网络算法相结合,解决了现有技术中没有考虑周期性、持续性和非平稳性的问题。
为了解决上述问题,本发明提供一种基于STL-NN模型的海表面温度预测算法,其包括以下步骤:
S1.采用基于局部加权回归的周期-趋势分解方法将SST数据T分解为季节项S、趋势项C和余项R;
S2.将分解得到的季节项S、趋势项C和余项R输入到神经网络预测模型中,得到若干天SST数据的预测值;所述神经网络预测模型为采用历史的SST数据训练得到的模型。
本发明的进一步改进在于,基于局部加权回归的周期-趋势分解方法将SST数据T的序列分解为季节项S、趋势项C和余项R的表达式为:
Tt=St+Ct+Rt(t|0≤t≤|T|,t∈Z)
该过程为迭代过程,每次迭代过程包括内循环以及外循环;在内循环的过程中,更新季节分量S、趋势项C;在外循环的过程中,通过余项R判断是否收敛,若收敛则输出季节分量S、趋势项C和余项R,并停止迭代。
本发明的进一步改进在于,在第i+1次迭代过程中,内循环包括以下步骤:
S101.去趋势:用原始序列T减去在第i次迭代中获得的估计趋势分量以获得周期子序列/>其表达式为:/>
S102.周期子序列平滑:用局部加权回归的方式对周期子序列平滑化,获得初步季节分量/>
S103.平滑周期子序列的低通滤波:使用低通滤波器处理步骤S102中获得的初步季节分量然后利用局部加权回归获得低通值/>
S104.平滑周期子序列的去趋势,得到季节分量:季节分量是低通值和初步季节分量的差值/>
S105.去季节性:原始序列T减去季节分量Si+1获得
S106.利用局部加权回归的方式对平滑化后获得趋势分量/>
本发明的进一步改进在于,在第i+1次迭代过程中,外循环包括以下步骤:
S111.利用内循环中得到的季节分量S和趋势分量C来计算剩余分量R,其表达式为:Rt=Tt-St-Ct;
S112.寻找剩余分量R中过大的数值,并将其作为异常值;若异常值小于阈值则判断收敛,停止迭代,并输出季节分量S、趋势项C和余项R;否则判断不收敛,并引入稳健性权重,在下一次迭代的内循环过程中采用稳健性权重减小异常值的影响。
本发明的进一步改进在于,神经网络预测模型包括依次连接的批量标准化层、卷积层、全连接层以及LSTM网络;神经网络预测模型对输入数据进行处理,并得到预测结果的过程包括以下步骤:
S21.将输入的趋势项、季节项和余项作为神经网络预测模型的输入;
S22.利用批量标准化层对数据进行批量归一化;
S23.将批量标准化之后的数据依次经过卷积层以及全连接层;
S24.使用Softmax对全连接层的输出进行处理;
S25.将Softmax的输出结果与卷积层的输出进行Hadamard乘积,并将其作为LSTM网络的输入,并将LSTM网络的输出作为另一个全连接层的输入,该全连接层的输出为神经网络预测模型输出的预测值。
本发明的有益技术效果为:将STL算法与神经网络预测模型相结合,提出了STL-NN模型,该模型首先通过STL分解出SST的季节分量、趋势分量和剩余分量,确保SST数据的高效利用;在搭建神经网络预测模型时有效结合了LSTM模型的优点,能够利用其较强非线性逼近能力有效的对数据进行建模,最终预测出未来五天内的SST。在充分考虑序列数据特性的前提下,本发明方法不仅可以用于预测SST,在未来还可以推广至其它海洋要素序列数据的预测,具有非常广阔的推广应用前景。
附图说明
图1为本发明中算法的流程图;
图2为STL内循环过程示意图;
图3为LSTM细胞单元结构示意图。
具体实施方式
下面根据附图1,给出本发明的较佳实施例,并予以详细描述,使能更好地理解本发明的功能、特点。
请参阅图1所示,本发明的实施例包括一种基于STL-NN模型的海表面温度预测算法,该算法主要包括以下步骤:
S1.采用基于局部加权回归(locally weighted regression,简称Loess)的周期-趋势分解方法(Seasonal-Trend decomposition procedure based on Loess,简称STL)将SST数据T分解为季节项S、趋势项C和余项R;SST数据T、季节项S、趋势项C和余项R均为序列;该步骤不仅可以在原始数据的基础上消除随机噪声,还能够挖掘其中的潜在信息;
S2.将分解得到的季节项S、趋势项C和余项R输入到神经网络预测模型中,得到若干天SST数据的预测值;所述神经网络预测模型为采用历史的SST数据训练得到的模型。神经网络预测模型具有强非线性逼近能力。
如图2所示,基于局部加权回归的周期-趋势分解方法将SST数据T的序列分解为季节项S、趋势项C和余项R的表达式为:
Tt=St+Ct+Rt(t|0≤t≤|T|,t∈Z)
该过程(STL)为迭代过程,每次迭代过程包括内循环以及外循环;在内循环的过程中,更新季节分量S、趋势项C;在外循环的过程中,通过余项R判断是否收敛,若收敛则输出季节分量S、趋势项C和余项R,并停止迭代。
具体的,在第i+1次迭代过程中,内循环包括以下步骤:
S101.去趋势:用原始序列T减去在第i次迭代中获得的估计趋势分量以获得周期子序列/>其表达式为:/>
S102.周期子序列平滑:用局部加权回归的方式对周期子序列平滑化,获得初步季节分量/>
S103.平滑周期子序列的低通滤波:使用低通滤波器处理步骤S102中获得的初步季节分量然后利用局部加权回归获得低通值/>
S104.平滑周期子序列的去趋势,得到季节分量:季节分量是低通值和初步季节分量的差值/>
S105.去季节性:原始序列T减去季节分量Si+1获得
S106.利用局部加权回归的方式对平滑化后获得趋势分量/>
在第i+1次迭代过程中,外循环包括以下步骤:
S111.利用内循环中得到的季节分量S和趋势分量C来计算剩余分量R,其表达式为:Rt=Tt-St-Ct;
S112.寻找剩余分量R中过大的数值,并将其作为异常值;若异常值小于阈值则判断收敛,停止迭代,并输出季节分量S、趋势项C和余项R;否则判断不收敛,并引入稳健性权重,在下一次迭代的内循环过程中采用稳健性权重减小异常值的影响。
如图1所示,本实施例中采用的神经网络预测模型包括依次连接的批量标准化层、卷积层、全连接层以及LSTM网络。神经网络预测模型对输入数据进行处理,并得到预测结果的过程包括以下步骤:
S21.将SST数据序列的趋势项、季节项和余项,将该三项作为神经网络预测模型的输入;
S22.利用批量标准化(Batch Normalization,简称BN)层对数据进行批量归一化,其作用不仅可以加快模型的训练速度,还能防止过拟合;
S23.通过卷积层能够获得N=[n1,n2,...,ni-1,ni],i代表的是每次输入数据的长度。全连接层的每一个结点都会与上一层连接,用于综合提取的特征,其公式如下表达:
F=tanh(Wf*N+bf)
S24.将全连接层的输出作为softma的输入。softmax在深度学习中有着广泛的应用,常用于多分类问题,公式表达如下:
S=softmax(Ws*F+bs)
S25.连接LSTM网络,如图3所示,LSTM中共有三个门结构,它们分别是输入门xt、遗忘门Ct和输出门Ht。输入门的作用是有选择性的保留输入的信息,并对细胞状态进行更新;遗忘门的作用是有选择性的遗忘冗余信息;输出门的作用是决定输出细胞状态的哪些部分,具体表达如下:
it=σ(Wi*[Ht-1,xt]+bi)
gt=σ(Wg*[Ht-1,xt]+bg)
ot=σ(Wo*[Ht-1,xt]+bo)
Ht=ot*tanh(Ct)
本实施例中,将卷积层的输出N与softmax层的输出S的Hadamard乘积作为LSTM网络的输入xt。LSTM网络的输出连接有另一个全连接层,该全连接层可以将LSTM网络输出的特征整合到一起,形成最终的预测结果。
本实施例中,神经网络预测模型采用网络结构使得其不仅具有较强非线性逼近能力,还可兼顾SST数据的周期性、持续性和非平稳性,最终使得本实施例的算法具有更好的预测精度。
在使用本实施例的算法进行实验的过程中,所用数据为卫星遥感中国近海的SST实测数据,共5个点的SST时间序列数据。每条SST数据时间跨度为2004年1月1日至2016年12月31日,该数据每天记录一次,共4749天。
本发明算法均使用python实现,采用Keras框架搭建神经网络预测模型,Keras是一个深度学习的框架,有许多模块包,方便模型构建。实验运行环境为Windows10,IntelCore i5,2.6GHz,8G RAM。
实验性能指标
为验证本发明方法的有效性,选择使用均方根误差(Root Mean Square Error,简称RMSE)和平均绝对百分误差(Mean Absolute Percentage Error,简称MAPE)作为评价指标,对比不同预测模型分别预测SST时预测性能的好坏。RMSE和MAPE的公式如下表示:
模型在预测时,对于RMSE指标来说,RMSE越小,模型性能越好,MAPE的指标也是如此,模型性能越好。那么在模型性能最佳时,需要RMSE最小,MAPE最小。
实验结果分析
验证神经网络预测模型的有效性,首先将SST数据分为训练集和验证集,其中将前3799天的SST数据用于训练模型,剩余950天的SST数据用于评估模型的预测性能。于此同时,分别与鲁棒性较强的SVM和当前主流的时间序列预测模型GRU、LSTM进行对比,通过比较不同预测方法获得的RMSE指标和MAPE指标来评价模型的性能。
表1 SVM、GRU、LSTM和STL-NN的RMSE指标
表1是SVM、GRU、LSTM和STL-NN预测SST的RMSE指标,Avg是五次预测获得的RMSE指标的平均值。SVM在预测第二条SST序列时获得的RMSE指标为0.79,是该方法在五次预测中效果最好的,但相比于GRU、LSTM和STL-NN预测第二条SST序列获得的RMSE指标,可以看出GRU、LSTM和STL-NN比SVM的预测效果好。通过对比其它序列的预测效果和Avg,也不难看出,GRU、LSTM和STL-NN的预测性能在整体上均优于SVM。STL-NN的RMSE指标的平均值为0.50,低于GRU和LSTM的RMSE指标的平均值;再对比五条序列的预测结果,可以发现STL-NN的RMSE指标都要优于GRU和LSTM,说明本发明的方法具有一定的可行性。
表2 SVM、GRU、LSTM和STL-NN的MAPE指标
表2是SVM、GRU、LSTM和STL-NN预测SST的MAPE值,其中Avg是五次预测获得的MAPE指标的平均值。对于每条SST序列,SVM的MAPE指标都要高于GRU、LSTM和STL-NN,可知SVM的Avg也高于GRU、LSTM和STL-NN,表明SVM的预测性能在这四个预测模型中是最差的,因此SVM解决单变量时间序列预测问题的能力不如GRU、LSTM和STL-NN。GRU在预测第五条序列略
优于LSTM,而预测另外四条序列时不如LSTM,从整体而言,LSTM对SST的预测能力略优于GRU。STL-NN在预测每条序列时的MAPE指标都低于GRU和LSTM的MAPE指标,表明STL-NN要优于GRU和LSTM。主要原因是STL-NN不仅充分利用了LSTM算法的优点,并在预测前还利用STL分解来利用SST的其它特性进行预测以减小误差。
综上所述,无论在RMSE指标还是在MAPE指标下,GRU和LSTM均要优于SVM,而STL-NN优于GRU和LSTM,说明在三者中,本发明方法具有最好的预测性能,验证了本发明方法的有效性。
以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。
Claims (2)
1.一种基于STL-NN模型的海表面温度预测算法,包括以下步骤:
S1.采用基于局部加权回归的周期-趋势分解方法将SST数据T分解为季节项S、趋势项C和余项R;
S2.将分解得到的季节项S、趋势项C和余项R输入到神经网络预测模型中,得到若干天SST数据的预测值;所述神经网络预测模型为采用历史的SST数据训练得到的模型;
步骤S1中,基于局部加权回归的周期-趋势分解方法将SST数据T的序列分解为季节项S、趋势项C和余项R的表达式为:
Tt=St+Ct+Rt(t|0≤t≤|T|,t∈Z)
该过程为迭代过程,每次迭代过程包括内循环以及外循环;在内循环的过程中,更新季节分量S、趋势项C;在外循环的过程中,通过余项R判断是否收敛,若收敛则输出季节分量S、趋势项C和余项R,并停止迭代;
在第i+1次迭代过程中,内循环包括以下步骤:
S101.去趋势:用原始序列T减去在第i次迭代中获得的估计趋势分量以获得周期子序列/>其表达式为:/>
S102.周期子序列平滑:用局部加权回归的方式对周期子序列平滑化,获得初步季节分量/>
S103.平滑周期子序列的低通滤波:使用低通滤波器处理步骤S102中获得的初步季节分量然后利用局部加权回归获得低通值/>
S104.平滑周期子序列的去趋势,得到季节分量:季节分量是低通值和初步季节分量的差值/>
S105.去季节性:原始序列T减去季节分量Si+1获得
S106.利用局部加权回归的方式对平滑化后获得趋势分量/>
在第i+1次迭代过程中,外循环包括以下步骤:
S111.利用内循环中得到的季节分量S和趋势分量C来计算剩余分量R,其表达式为:Rt=Tt-St-Ct;
S112.寻找剩余分量R中过大的数值,并将其作为异常值;若异常值小于阈值则判断收敛,停止迭代,并输出季节分量S、趋势项C和余项R;否则判断不收敛,并引入稳健性权重,在下一次迭代的内循环过程中采用稳健性权重减小异常值的影响。
2.根据权利要求1所述的一种基于STL-NN模型的海表面温度预测算法,其特征在于,神经网络预测模型包括依次连接的批量标准化层、卷积层、全连接层以及LSTM网络;神经网络预测模型对输入数据进行处理,并得到预测结果的过程包括以下步骤:
S21.将输入的趋势项、季节项和余项作为神经网络预测模型的输入;
S22.利用批量标准化层对数据进行批量归一化;
S23.将批量标准化之后的数据依次经过卷积层以及全连接层;
S24.使用Softmax对全连接层的输出进行处理;
S25.将Softmax的输出结果与卷积层的输出进行Hadamard乘积,并将其作为LSTM网络的输入,并将LSTM网络的输出作为另一个全连接层的输入,该全连接层的输出为神经网络预测模型输出的预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010106716.5A CN111428908B (zh) | 2020-02-21 | 2020-02-21 | 一种基于stl-nn模型的海表面温度预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010106716.5A CN111428908B (zh) | 2020-02-21 | 2020-02-21 | 一种基于stl-nn模型的海表面温度预测算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111428908A CN111428908A (zh) | 2020-07-17 |
CN111428908B true CN111428908B (zh) | 2023-08-25 |
Family
ID=71547076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010106716.5A Active CN111428908B (zh) | 2020-02-21 | 2020-02-21 | 一种基于stl-nn模型的海表面温度预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111428908B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380778A (zh) * | 2020-11-26 | 2021-02-19 | 华南理工大学 | 一种基于海温的气象干旱预报方法 |
CN113792366A (zh) * | 2021-09-07 | 2021-12-14 | 上海交通大学 | 一种基于stl分解的隧道收敛变形预测方法 |
CN115494418A (zh) * | 2022-11-22 | 2022-12-20 | 湖北工业大学 | 基于时间序列分解算法的锂电池单体异常检测方法及系统 |
CN116756529B (zh) * | 2023-08-21 | 2023-10-20 | 莒南凯佳化工有限公司 | 一种吊白块生产设备运行状态检测系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015184225A (ja) * | 2014-03-25 | 2015-10-22 | 地方独立行政法人青森県産業技術センター | 所定層予測水温算出装置およびその方法とプログラム |
CN108229760A (zh) * | 2018-02-08 | 2018-06-29 | 北京航空航天大学 | 面向灾害预测的不等间距时间序列异常趋势分析方法 |
CN110084417A (zh) * | 2019-04-19 | 2019-08-02 | 淮阴工学院 | 一种基于grnn神经网络的草莓温室环境参数智能监测系统 |
-
2020
- 2020-02-21 CN CN202010106716.5A patent/CN111428908B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015184225A (ja) * | 2014-03-25 | 2015-10-22 | 地方独立行政法人青森県産業技術センター | 所定層予測水温算出装置およびその方法とプログラム |
CN108229760A (zh) * | 2018-02-08 | 2018-06-29 | 北京航空航天大学 | 面向灾害预测的不等间距时间序列异常趋势分析方法 |
CN110084417A (zh) * | 2019-04-19 | 2019-08-02 | 淮阴工学院 | 一种基于grnn神经网络的草莓温室环境参数智能监测系统 |
Non-Patent Citations (1)
Title |
---|
贺琪 等.Spark平台下的海表面温度并行预测算法.《海洋通报》.2019,第38卷卷(第38卷期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111428908A (zh) | 2020-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428908B (zh) | 一种基于stl-nn模型的海表面温度预测算法 | |
Wang et al. | Hydrological time series forecast model based on wavelet de-noising and ARIMA-LSTM | |
Wang et al. | A compound framework for wind speed forecasting based on comprehensive feature selection, quantile regression incorporated into convolutional simplified long short-term memory network and residual error correction | |
Bae et al. | Monthly dam inflow forecasts using weather forecasting information and neuro-fuzzy technique | |
Dong et al. | Wind power prediction based on recurrent neural network with long short-term memory units | |
CN110363349B (zh) | 一种基于ascs的lstm神经网络水文预测方法及系统 | |
CN111815033A (zh) | 一种基于rcnn和气象时序特征的海上风电功率预测方法 | |
CN111767517B (zh) | 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质 | |
CN111652425A (zh) | 一种基于粗糙集和长短期记忆网络的河流水质预测方法 | |
CN114912077B (zh) | 一种融合随机搜索与混合分解误差订正的海浪预报方法 | |
CN117035201A (zh) | 平原河网水工程集群多目标调度规则制定方法及系统 | |
CN116187203A (zh) | 一种流域水质预测方法、系统、电子设备及存储介质 | |
CN116307291B (zh) | 一种基于小波分解的分布式光伏发电预测方法及预测终端 | |
CN115630101A (zh) | 水文参数智能化监控与水资源大数据管理系统 | |
CN114492217B (zh) | 一种基于混合时间序列感知机模型的台风浪高预测方法 | |
CN111141879B (zh) | 一种深度学习的空气质量监测方法以及装置、设备 | |
CN115983493A (zh) | 一种基于多任务学习及深度学习模型的水质预测方法 | |
Alfredo et al. | Time series forecasting of significant wave height using gru, cnn-gru, and lstm | |
Anh et al. | Wavelet-artificial neural network model for water level forecasting | |
Li et al. | An interpretable hierarchical neural network insight for long-term water quality forecast: A study in marine ranches of Eastern China | |
Wang et al. | Filling gaps in significant wave height time series records using bidirectional gated recurrent unit and cressman analysis | |
Zhou et al. | Tidal forecasting based on ARIMA-LSTM neural network | |
CN116432812A (zh) | 樽海鞘算法优化lstm的新能源功率预测方法 | |
CN111461416B (zh) | 风速预测方法、系统、电子设备及存储介质 | |
CN114492945A (zh) | 电力市场背景下的短期光伏功率预测方法、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |