CN117407660A - 一种基于深度学习的区域海浪预报方法 - Google Patents
一种基于深度学习的区域海浪预报方法 Download PDFInfo
- Publication number
- CN117407660A CN117407660A CN202311706967.7A CN202311706967A CN117407660A CN 117407660 A CN117407660 A CN 117407660A CN 202311706967 A CN202311706967 A CN 202311706967A CN 117407660 A CN117407660 A CN 117407660A
- Authority
- CN
- China
- Prior art keywords
- time
- forecasting
- mode
- decomposition
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 30
- 238000013277 forecasting method Methods 0.000 title claims abstract description 16
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 21
- 230000032683 aging Effects 0.000 claims abstract description 12
- 238000000926 separation method Methods 0.000 claims abstract description 4
- 210000002569 neuron Anatomy 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 230000007774 longterm Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 13
- 238000011160 research Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于深度学习的区域海浪预报方法,包括采用EOF法对有效波高数据进行时空分离,再通过CEEMDAN法对时间系数进行分离,得到时间子模态IMF,最后得到海浪多时空模态数据集;采用LSTM神经网络对数据集中的时间子模态IMF进行训练和预报,得到预报时效为1h、6h、12h、24h的时间子模态IMF;结合空间特征矩阵V与时间子模态IMF的预报结果得到预报时效为1h、6h、12h、24h的区域海浪有效波高。本发明首次采用EOF分解结合CEEMDAN分解的方式,完成基于区域化海浪预报,采用分解法将数据进行分解能够简化数据,降低神经网络训练难度,该思路也对神经网络的应用具有启示作用。
Description
技术领域
本发明涉及一种基于深度学习的区域海浪预报方法,属于海洋科学与神经网络技术领域。
背景技术
海浪预报分为动力学和统计学两种方法。动力学方法是采用基于海浪运动方程与能量守恒方程等的数值模式,如第三代海浪数值模式WAM、WAVEWARCH III(WW3)、SWAN等,这些模型已广泛应用于业务化的海浪预报。动力学方法需要对海浪运动方程与能量守恒方程等进行求解,由于海浪数据量大且计算求解复杂,需要高性能计算机和显著的时间成本,便捷性与灵活性受限。然而,随着海岸工程的快速发展,行业对海浪预报灵活性和便捷性的需求更高,动力学方法由于时间成本和硬件条件高的问题难以满足需求。在这种背景下,采用计算速度快,计算条件要求低的统计学方法是解决上述问题的最佳手段。
统计学方法采用历史波浪数据构建统计模型,用于预测波高、周期等波参数,以统计学方法为理论基础的神经网络预报模型是当前学者关注的技术热点。
神经网络能够模拟人脑结构,由大批神经处理单元(以下简称神经元)以权重的方式连接组成,具有强大的学习能力。常见的神经网络模型如误差反向传播模型(Error BackPropagation Training model, BP)、人工神经网络(Artificial Neural Network, ANN)、循环神经网络(Recurrent Neural Ntework,RNN)、长短期记忆神经网络(Long Short –Term Memory,LSTM)、门控循环神经网络(Gated Recurrent Unit, GRU)等,这些神经网络获取结果较快,计算条件要求低,预报的灵活性与和便捷性强于数值模式。
深度学习模型是含有多个隐藏层的神经网络模型,近年来,随着观测技术和人工智能技术的快速发展,观测数据大量积累,采用大数据结合深度学习的方法是当今数字时代进行预报的新兴方法。深度学习方法通过拟合历史海浪数据,捕获历史和未来数据间的关系特征,进而完成预测。然而,在大区域的海浪预报中,除了过去和未来之间的时间特征外,区域内的空间特征同样重要,传统的深度学习难以同时对空间特征与时间特征进行训练和模拟,无法准确的识别复杂的时空规律,从而影响区域海浪预报的精度。随着研究的发展,人们发现将分解算法应用于深度学习预报,能够有效提高预报精度。基于以上的研究方向,本文采用EOF分解与CEEMDAN分解提高基于深度学习的区域海浪预报的精度,为区域化海洋预报提供新思路,同时探究这些思路在数值模式预报的应用,具有一定的研究意义。
国外主要重视单点海浪预报,随着机器学习的发展,神经网络模型不断更新,单点有效波高预报的精度得到较高的提升。Deo提出了一种前馈网络预报有效波高,与ANN相比,该方法具有更强的通用性、灵活性和适应性。Mandal和Prabaharan首次采用RNN进行有效波高的预报,发现RNN的相关系数高于前馈网络,证明RNN更适合时间序列的预测。
Mahjoobi和Adeli Mosabbeb尝试采用支持向量机(Support Vector Machine,SVM)来预测波高,结果表明,SVM预报具有一定的准确性,相较于ANN,SVM预报精度基本不变,但计算速度更快。Etemad-Shahidi和Mahjoobi对苏利尔湖的预测效果进行了各种研究,对比了模型树和前馈传播ANN的预报结果,证明模型树法具有较高的精度。Dixit et al在使用ANN预测海浪高度时发现了预测滞后的现象,因此,他们使用了离散小波变换增强了预测值,消除预测时间上的滞后。Fan等人采用LSTM神经网络对NDBC数据进行预报分析,并将结果与对比并与bp、残差网络、极限学习机、SVM和随机森林网络的预报结果进行比较,结果表明LSTM预报效果最好。
国外的神经网络经过众多的研究,得到的LSTM神经网络可依靠历史信息来协助当前决策,在时间预测方面有很强的优势。因此,使用LSTM神经网络进行预报研究存在其合理性。然而,由于波浪数据的非线性和非平稳特性,单一的深度学习模型在预测波高时存在一定的局限性。值得注意的是,学者们越来越多地致力于在这种情况下使用混合方法。典型的混合模型通常结合分解算法和神经网络预测模型。Zhou S、Hao W、Raj N等人均采用了基于经验模态分解(EMD)和LSTM的混合模型来预测波高,实验结果表明,相较于单个深度学习模型,采用EMD与LSTM相结合的方式预报精度更高。
国内对基于深度学习的海浪预报进行了大量的探索。陈希等在2002年首次采用bp神经网络模拟风浪与风的关系,经过2369次训练迭代将均方根误差控制在0.05m以下,预报效果较好,但该研究忽略了海浪中的涌浪成分,难以对总体海浪进行预报。随着神经网络的不断更新,针对时间序列的RNN与LSTM神经网络被广泛应用,这两个模型能将上个时刻的神经元状态传递到当前时刻,构成神经元在时间维度上的联系,相较于仅在神经元之间存在关联的bp神经网络,RNN与LSTM更善于时间序列的模拟。赵建鹏在进行海浪波倾角的预报中,对比了bp、RNN与LSTM3者的预报结果,LSTM神经网络的平均绝对百分比误差为13%,远低于BP神经网络与RNN神经网络,证明了LSTM神经网络更适合应用于预报。高丽斌首次采用LSTM神经网络对中国台湾海峡部分站点的有效波高进行预报,在时效性为1h的预报中均方误差均在0.1m以下,预报准确性较高,同时提出ConvLSTM神经网络的预报方法,初步实现了海浪的区域性预报[。ConvLSTM结合了卷积神经网络CNN与LSTM神经网络,通过卷积层对海浪的空间规律进行学习,并采用LSTM神经网络学习海浪的时间信息,最终得到一个汇集海浪时空信息的神经网络,但采用ConvLSTM的海浪预报误差仍然较大,且预报时效低,在高丽斌的研究中,预报时效在3小时以上的海浪预报均方误差达到了2m。高丽斌仅是以此展示了区域海洋预报的可能性,该技术存在改进的空间。郝剑波将有效波高分为1~3级,同时采用卷积神经网络CNN的方法对海浪危险等级进行训练,将复杂有效波高转化为简单直观的危险等级,对海浪进行抽象处理,便于CNN神经网络的学习,有效提升了分析准确性,该方法得到海浪数据过于简单,难以广泛应用于海浪分析,但该研究证明数据的复杂程度对神经网络训练效果有重大影响,数据越简单,训练效果越好。
因此现有技术的发展证明了深度学习在单点海浪预报的优越性,但基于深度学习的区域海浪预报仍存在预报误差较大、预报时效较低的问题,而通过简化数据能够有效提升深度学习的训练效果。
发明内容
本发明目的是提供一种基于深度学习的区域海浪预报方法,以解决传统的深度学习难以同时对空间特征与时间特征同时进行训练和模拟,无法准确的识别复杂的时空规律,导致基于深度学习的区域海浪预报仍存在预报误差较大、预报时效较低的问题。
为解决以上问题,本发明将在传统深度学习模型的基础上,结合EOF、CEEMDAN分解,构建EOF- CEEMDAN-LSTM区域化预报方法,以提高深度学习预报的时效性与准确性。
一种基于深度学习的区域海浪预报方法,其特征是包括以下步骤:
(0)有效波高是波浪谱中三分之一最大波高的平均高度,可代表一组波浪的理论高度,本文选用ERA5数据库中的有效波高数据集,获取指定海域的有效波高数据,时间分辨率为1h,空间分辨率为0.5°× 0.5°,时间范围为2年,以确保最高预报时效不低于6h。
(1)将有效波高数据分解为海浪多时空模态数据集H:
采用EOF法对有效波高数据进行时空分离,得到各模态的空间特征矩阵V与时间系数T 1,T 2,…,T m,m为测量点个数,再通过CEEMDAN法对时间系数T 1,T 2,…,T m进行分离,得到时间子模态IMF,最后得到海浪多时空模态数据集H,该数据集包含时间与空间两个部分,空间部分为空间特征矩阵V,不随时间变化;而时间部分为时间子模态IMF,随时间变化,以运动频率分为不同的时间子模态IMF1,IMF2,…,IMFs,s为子模态总数。
(2)然后采用具有记忆长期依赖信息、善于处理存在时间依赖性的LSTM神经网络对数据集H中的时间子模态IMF进行训练和预报,然后利用训练好的网络得到预报时效为1h、6h、12h、24h的时间子模态IMF。
(3)结合空间特征矩阵V与时间子模态IMF的预报结果得到预报时效为1h、6h、12h、24h的区域海浪有效波高。
所述步骤(1)中EOF分解步骤为:
1)设数据集H存在m个测量点,n为其时间序列长度,数据集H的矩阵形式为:
(1)
2)将数据集H乘以其转置,得方阵D
(2)
计算方阵D的特征值并进行排序:λ1,λ2,…,λm,其对应的特征向量为V 1,V 2,…,V m,特征值λi对应的特征向量V i为第i模态的空间特征,而将空间特征投影到数据集中,得到对应的时间系数T i:
(3)
3)计算各模态的方差贡献率,计算公式为:
(4)
至此,数据集H完成了EOF分解,得到了各个模态的空间特征V 1,V 2,…,V m与对应的时间系数T 1,T 2,…,T m,同时可将方差贡献率较低的模态剔除,获得主要的时空信息。实践中,剔除方差贡献率小于0.1%的模态,选取剩余的分解后的模态用于后续流程。
所述步骤(1)中CEEMDAN分解步骤为:
1)时间系数序列附加噪声后表示为
(5)
其中,T(t)为时间系数序列,a 0为噪声幅度,v d (t)为添加的白噪声,d=1,2,…,k,k为添加白噪声的次数;
将附加噪声的时间系数序列T d (t)进行EMD分解k次,获得EMD分解的第1个模态分量C 1 d (t)与EMD分解的残差r 1 d (t);
(6)
对产生的k个模态分量进行总体平均就得到CEEMDAN分解的第1个时间子模态:
(7)
计算去除第一个模态分量后的CEEMDAN的残差:
(8)
2)采用EMD对白噪声v d (t)分解k次,得到k个子模态,然后利用白噪声分解后的k组子模态将残差r 1(t)分解k次,进行以下计算:
(9)
其中E 1(v d (t))为分解后白噪声v d (t)的第1子模态,a 1为噪声幅度,C 2 d (t)为EMD分解的第2个模态分量,r 2 d (t)为EMD分解的残差,由此得到CEEMDAN分解的第2个时间子模态:
(10)
3)对于剩下的每一阶段,即i=2,3,…,s,s为IMF的总数,第i个残差计算如下:
(11)
4)利用白噪声分解后的k个子模态将将残差r i (t)分解k次,如下所示:
(12)
重复3)和4)直到i=s时为止,最后的残差是R(t),原始数据被分解为:
(13)。
所述步骤(2)中,选取LSTM神经网络构建有效波高预报模型,以下是具体的方法步骤:
取数据集H中的时间子模态IMF前90%的作为训练集建立监督学习序列,后10%的数据作为验证集;
采用训练集训练LSTM神经网络预报模型,并进行验证集的预报;
统合2)预报的各时间系数,将数据集中的空间特征矩阵与这些时间系数相乘得到各格网点的有效波高预测值。
所述步骤(2)中,采用N-24,N-23,…,N -1共24小时的有效波高对第N、N +5、N +11、N +23等时刻进行预报,N为当前时刻,这类型的预报存在大量的低阶特征,而高阶特征较少,需要针对这一特点设计神经元的数量。需要注意的是,与在每一层中添加更多的神经元相比,添加层数能获得更大的性能提升。因此,本文设计第1、2、3LSTM层拥有的神经元数量分别为64、32、16,确保神经网络能够在第1、2LSTM层能够更好的学习低阶特征。
所述步骤(2)中,选用tanh作为激活函数。
所述基于深度学习的区域海浪预报方法,还包括步骤(4)通过预测的有效波高与验证集的误差、样例点预测与真实的有效波高数据的误差为评价模型预报结果标准,采用相关系数(R)、平均绝对误差(MAE)、均方根误差(RMSE)、结构相似性系数(SSIM)指标,对预报模型进行评估;若评估结果是未达到设定要求,则返回步骤2重新对数据进行训练。
本发明首次采用EOF分解结合CEEMDAN分解的方式,完成基于区域化海浪预报,具有一定的创新性。此外,采用分解法将数据进行分解能够简化数据,降低神经网络训练难度,该思路对神经网络的应用具有一定的启示作用。
CEEMDAN分解将时间序列分解为多个子序列,将复杂的时间序列视为多个简单的子序列的集合,并采用LSTM分别对多个子序列进行训练,建立多个LSTM神经网络预测模型,有效避免了各子序列的混淆;同时,在同一模态下,不进行CEEMDAN分解仅能构建1个LSTM神经网络,而进行CEEMDAN分解后,同一模态下的时间系数可构建13-14个LSTM神经网络,容错率具有极大的提升;经过CEEMDAN分解后,大部分子序列的均值为0,起到去中心化的作用,有利于LSTM的收敛。
附图说明
图1 本发明的总体流程图;
图2 南海海域2014-2015年ERA5数据示意图(有效波高数据);
图3 EOF分解后的空间特征矩阵结构示意图;
图4 EOF分解后的时间系数图(IMF1~IMF13);
图5 LSTM网络神经元内部结构图。
具体实施方式
如图1所示,一种基于深度学习的区域海浪预报方法,其特征是包括以下步骤:
(0)有效波高是波浪谱中三分之一最大波高的平均高度,可代表一组波浪的理论高度,本文选用ERA5数据库中的有效波高数据集,获取指定海域的有效波高数据,时间分辨率为1h,空间分辨率为0.5°× 0.5°,时间范围为2年,以确保最高预报时效不低于6h。
(1)将有效波高数据分解为海浪多时空模态数据集H:
采用EOF法对有效波高数据进行时空分离,得到各模态的空间特征矩阵V与时间系数T 1,T 2,…,T m,m为测量点个数,再通过CEEMDAN法对时间系数T 1,T 2,…,T m进行分离,得到时间子模态IMF,最后得到海浪多时空模态数据集H,该数据集包含时间与空间两个部分,空间部分为空间特征矩阵V(如图3),不随时间变化;而时间部分为时间子模态IMF,随时间变化,以运动频率分为不同的时间子模态IMF1,IMF2,…,IMFs(如图4),s为子模态总数。
EOF分解是一种分析数据场结构特征并提炼主要模态的方法,可以将时空场分解为各个模态,每个模态中包含不随时间变化的空间特征矩阵和随时间变化的时间系数,常用于主要影响因子分析、因子时空变化分析与动力模型参数化中。LSTM神经网络仅需对各模态的时间系数进行训练学习,避免了学习空间特征引起的误差,同时通过EOF分解可剔除方差贡献率低的模态,提炼有效信息,有效减少计算量。
所述步骤(1)中EOF分解步骤为:
1)设数据集H存在m个测量点,n为其时间序列长度,数据集H的矩阵形式为:
(1)
2)将数据集H乘以其转置,得方阵D
(2)
计算方阵D的特征值并进行排序:λ1,λ2,…,λm,其对应的特征向量为V 1,V 2,…,V m,特征值λi对应的特征向量V i为第i模态的空间特征,而将空间特征投影到数据集中,得到对应的时间系数T i:
(3)
3)计算各模态的方差贡献率,计算公式为:
(4)
至此,数据集H完成了EOF分解,得到了各个模态的空间特征V 1,V 2,…,V m与对应的时间系数T 1,T 2,…,T m,同时可将方差贡献率较低的模态剔除,获得主要的时空信息。实践中,剔除方差贡献率小于0.1%的模态,选取剩余的分解后的模态用于后续流程。
传统的分解方法EMD过程可以将非平稳和非线性信号分解为若干个分量,但在实际应用中经常遇到模式混合问题,而CEEMDAN算法克服了EMD可能产生的模态混合问题,能更好的分离噪声。
所述步骤(1)中CEEMDAN分解步骤为:
1)时间系数序列附加噪声后表示为
(5)
其中,T(t)为时间系数序列,a 0为噪声幅度,v d (t)为添加的白噪声,d=1,2,…,k,k为添加白噪声的次数;
将附加噪声的时间系数序列T d (t)进行EMD分解k次,获得EMD分解的第1个模态分量C 1 d (t)与EMD分解的残差r 1 d (t);
(6)
对产生的k个模态分量进行总体平均就得到CEEMDAN分解的第1个时间子模态:
(7)
计算去除第一个模态分量后的CEEMDAN的残差:
(8)
2)采用EMD对白噪声v d (t)分解k次,得到k个子模态,然后利用白噪声分解后的k组子模态将残差r 1(t)分解k次,进行以下计算:
(9)
其中E 1(v d (t))为分解后白噪声v d (t)的第1子模态,a 1为噪声幅度,C 2 d (t)为EMD分解的第2个模态分量,r 2 d (t)为EMD分解的残差,由此得到CEEMDAN分解的第2个时间子模态:
(10)
3)对于剩下的每一阶段,即i=2,3,…,s,s为IMF的总数,第i个残差计算如下:
(11)
4)利用白噪声分解后的k个子模态将将残差r i (t)分解k次,如下所示:
(12)
重复3)和4)直到i=s时为止,最后的残差是R(t),原始数据被分解为:
(13)。
(2)然后采用具有记忆长期依赖信息、善于处理存在时间依赖性的LSTM神经网络对数据集H中的时间子模态IMF进行训练和预报,然后利用训练好的网络得到预报时效为1h、6h、12h、24h的时间子模态IMF。
所述步骤(2)中,选取LSTM神经网络构建有效波高预报模型,以下是具体的方法步骤:
取数据集H中的时间子模态IMF前90%的作为训练集建立监督学习序列,后10%的数据作为验证集;
采用训练集训练LSTM神经网络预报模型,并进行验证集的预报;
统合2)预报的各时间系数,将数据集中的空间特征矩阵与这些时间系数相乘得到各格网点的有效波高预测值。
所述步骤(2)中,采用N-24,N-23,…,N -1共24小时的有效波高对第N、N +5、N +11、N +23等时刻进行预报,N为当前时刻,这类型的预报存在大量的低阶特征,而高阶特征较少,需要针对这一特点设计神经元的数量。需要注意的是,与在每一层中添加更多的神经元相比,添加层数能获得更大的性能提升。因此,本文设计第1、2、3LSTM层拥有的神经元数量分别为64、32、16,确保神经网络能够在第1、2LSTM层能够更好的学习低阶特征。
所述步骤(2)中,选用tanh作为激活函数。
(3)结合空间特征矩阵V与时间子模态IMF的预报结果得到预报时效为1h、6h、12h、24h的区域海浪有效波高。
所述基于深度学习的区域海浪预报方法,还包括步骤(4)通过预测的有效波高与验证集的误差、样例点预测与真实的有效波高数据的误差为评价模型预报结果标准,采用相关系数(R)、平均绝对误差(MAE)、均方根误差(RMSE)、结构相似性系数(SSIM)指标,对预报模型进行评估;若评估结果是未达到设定要求,则返回步骤2重新对数据进行训练。
本发明的LSTM网络模式:
LSTM由输入层、输出层与多层输出层构成,与RNN不同的是,LSTM的神经元结构包含输入门、输出门、遗忘门和记忆单元,其中遗忘门是解决梯度爆炸的关键。记忆单元可存储过往时刻下的神经元状态,输入门、输出门负责对输入数据进行处理并传递到下个神经元,而遗忘门决定了记忆单元中神经元状态是否需要修改,遗忘门打开,记忆单元中的信息可保留至下个时刻;遗忘门关闭则将之前储存的状态清除。LSTM通过遗忘门可剔除训练中的错误或冗余的信息,确保模型能够精确的捕获数据的变化规律。LSTM中神经元内部结构如图5所示。
1)利用上一时刻的输出ht-1和当前时刻输入xt计算出输入门it、遗忘门ft,输出门Ot,以及候选状态C′t;
2)结合遗忘门ft和输入门it更新记忆单元Ct;
3)结合输出门Ot,将内部状态的信息传递给ht,并输出数据yt。
本发明的效果验证:
(1)本文以ERA5南海有效波高数据为例,其数据图如图2所示。
(2)为进一步说明本文设计的深度学习方法的优越性,以预报时效为24h的有效波高预报为例,采用其他常用预报方法对南海有效波高进行预报,并与本文构建的预报方法进行对比。
(3)为讨论EOF与CEEMDAN在区域海浪预报中的作用,采用控制变量的方式设计对比方案,同样以预报时效为24h的有效波高预报为例,采用R、MAE、SSIM等相关指标,对各方案进行评估分析,探究二者对深度学习预报的影响机制。
各预报时效的结果变化的趋势与验证数据相差不大,本文认为这是CEEMD AN分解的优势。结果表明,本方法的预报结果基本上可以准确刻画南海的有效波高场,且预报的准确性与预报时效相关,预报时效越高,准确性越低,准确性1h>6h>12h>24h。如表1所示,在24h预报中,平均SSIM高达0.9814,平均R高达0.9715,RMSE与MAE保持在0.2m以下,证明该方法的预报准确性较高。
表1预报结果
。
同时以预报时效为24h为例,采用该方法与传统的ConvLSTM进行预报对比,该方法获得的SSIM、R、RMSE、MAE均优于传统的ConvLSTM。如表2所示,相较于ConvLSTM,本方法的SSIM提升约0.13,R提升约0.16。
表2 与Conv LSTM对比结果
。
为了评价模型的预报效果,本文选择4个指标衡量预报结果是否准确,从而衡量预报模型的性能。
1)相关系数
相关系数(R)是预测值和实际观测值之间线性相关程度的指标,R越高说明预测效果越好,反之,R越低说明波预测效果越差。其计算公式如下,
(14)
上式中,Cov(x,y)为x与y的协方差,Var[x]为x的方差,Var[y]为y的方差。
2)平均绝对误差
平均绝对误差(MAE)度量的是预测值和实际观测值之间绝对差之和的平均值,其计算公式如下:
(15)
上式中, y i 为预测值,为实际观测值。
3)均方根误差
均方根误差度量的是预测值与实际观测值之间差的平方的均值,其计算公式如下:
(16)
上式中,y i 为预测值,为实际观测值。
4)结构相似性系数
结构相似性系数(SSIM)用于度量预测值和实际观测值之间空间结构相似程度,其计算公式如下:
(17)
其中μ x 是x的平均值,μ y 是y的平均值,σx是x的方差,σy是y的方差,σxy是x和y的协方差。c 1=(k 1 L)2,c 2=(k 2 L)2,是防止分子分母等于0的常数。L是像素值的动态范围,k 1 =0.01,k 2 =0.03。
预报方案对比:
通过对不同预报方案的预报结果对比,分析了LSTM,bp,RNN,GRU的时间系数预报结果,以及EOF - CEEMDAN-LSTM,EOF- CEEMDAN-BP,EOF- CEEMDAN- RNN,EOF- CEEMDAN-GRU和ConvLSTM的有效波高预报结果,结果显示,LSTM预报准确性最高,且EOF和CEEMDAN双重分解的结构比采用卷积的方式预报更加精准。
Claims (7)
1.一种基于深度学习的区域海浪预报方法,其特征是包括以下步骤:
(0)选用ERA5数据库中的有效波高数据集,获取指定海域的有效波高数据,时间分辨率为1h,空间分辨率为0.5°× 0.5°,时间范围为2年;
(1)将有效波高数据分解为海浪多时空模态数据集H:
采用EOF法对有效波高数据进行时空分离,得到各模态的空间特征矩阵V与时间系数T 1,T 2,…,T m,m为测量点个数,再通过CEEMDAN法对时间系数T 1,T 2,…,T m进行分离,得到时间子模态IMF,最后得到海浪多时空模态数据集H,该数据集包含时间与空间两个部分,空间部分为空间特征矩阵V,不随时间变化;而时间部分为时间子模态IMF,随时间变化,以运动频率分为不同的时间子模态IMF1,IMF2,…,IMFs,s为子模态总数;
(2)采用具有记忆长期依赖信息、善于处理存在时间依赖性的LSTM神经网络对数据集H中的时间子模态IMF进行训练和预报,然后利用训练好的网络得到预报时效为1h、6h、12h、24h的时间子模态IMF;
(3)结合空间特征矩阵V与时间子模态IMF的预报结果得到预报时效为1h、6h、12h、24h的区域海浪有效波高。
2.如权利要求1所述的一种基于深度学习的区域海浪预报方法,其特征是步骤(1)中EOF分解步骤为:
1)设数据集H存在m个测量点,n为其时间序列长度,数据集H的矩阵形式为:
(1)
2)将数据集H乘以其转置,得方阵D
(2)
计算方阵D的特征值并进行排序:λ1,λ2,…,λm,其对应的特征向量为V 1,V 2,…,V m,特征值λi对应的特征向量V i为第i模态的空间特征,而将空间特征投影到数据集中,得到对应的时间系数T i:
(3)
3)计算各模态的方差贡献率,计算公式为:
(4)
至此,数据集H完成了EOF分解,得到了各个模态的空间特征V 1,V 2,…,V m与对应的时间系数T 1,T 2,…,T m,同时将方差贡献率小于0.1%的模态剔除,选取剩余的分解后的模态用于后续流程。
3.如权利要求1所述的一种基于深度学习的区域海浪预报方法,其特征是步骤(1)中CEEMDAN分解步骤为:
1)时间系数序列附加噪声后表示为
(5)
其中,T(t)为时间系数序列,a 0为噪声幅度,v d (t)为添加的白噪声,d=1,2,…,k,k为添加白噪声的次数;
将附加噪声的时间系数序列T d (t)进行EMD分解k次,获得EMD分解的第1个模态分量C 1 d (t)与EMD分解的残差r 1 d (t);
(6)
对产生的k个模态分量进行总体平均就得到CEEMDAN分解的第1个时间子模态:
(7)
计算去除第一个模态分量后的CEEMDAN的残差:
(8)
2)采用EMD对白噪声v d (t)分解k次,得到k个子模态,然后利用白噪声分解后的k组子模态将残差r 1(t)分解k次,进行以下计算:
(9)
其中E 1(v d (t))为分解后白噪声v d (t)的第1子模态,a 1为噪声幅度,C 2 d (t)为EMD分解的第2个模态分量,r 2 d (t)为EMD分解的残差,由此得到CEEMDAN分解的第2个时间子模态:
(10)
3)对于剩下的每一阶段,即i=2,3,…,s,s为IMF的总数,第i个残差计算如下:
(11)
4)利用白噪声分解后的k个子模态将将残差r i (t)分解k次,如下所示:
(12)
重复3)和4)直到i=s时为止,最后的残差是R(t),原始数据被分解为:
(13)。
4.如权利要求1所述的一种基于深度学习的区域海浪预报方法,其特征是步骤(2)中选取LSTM神经网络构建有效波高预报模型,采用以步骤:
取数据集H中的时间子模态IMF前90%的作为训练集建立监督学习序列,后10%的数据作为验证集;
采用训练集训练LSTM神经网络预报模型,并进行验证集的预报;
统合2)预报的各时间系数,将数据集中的空间特征矩阵与这些时间系数相乘得到各格网点的有效波高预测值。
5.如权利要求1所述的一种基于深度学习的区域海浪预报方法,其特征是步骤(2)中,采用N-24,N-23,…,N -1共24小时的有效波高对第N、N +5、N +11、N +23时刻进行预报,N为当前时刻,并设计第1、2、3LSTM层拥有的神经元数量分别为64、32、16。
6.如权利要求5所述的一种基于深度学习的区域海浪预报方法,其特征是步骤(2)中选用tanh作为激活函数。
7.如权利要求1所述的一种基于深度学习的区域海浪预报方法,其特征是还包括步骤(4)通过预测的有效波高与验证集的误差、样例点预测与真实的有效波高数据的误差为评价模型预报结果标准,采用相关系数R、平均绝对误差MAE、均方根误差RMSE、结构相似性系数SSIM指标,对预报模型进行评估;若评估结果是未达到设定要求,则返回步骤2重新对数据进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311706967.7A CN117407660B (zh) | 2023-12-13 | 2023-12-13 | 一种基于深度学习的区域海浪预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311706967.7A CN117407660B (zh) | 2023-12-13 | 2023-12-13 | 一种基于深度学习的区域海浪预报方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117407660A true CN117407660A (zh) | 2024-01-16 |
CN117407660B CN117407660B (zh) | 2024-07-12 |
Family
ID=89492885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311706967.7A Active CN117407660B (zh) | 2023-12-13 | 2023-12-13 | 一种基于深度学习的区域海浪预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117407660B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103268572A (zh) * | 2013-05-06 | 2013-08-28 | 国家电网公司 | 一种千万千瓦级大型风电基地测风网络的微观选址方法 |
CN104021308A (zh) * | 2014-06-20 | 2014-09-03 | 河海大学 | 基于ERA-Interim和ERA40预测海浪有效波高的方法 |
CN104050514A (zh) * | 2014-05-29 | 2014-09-17 | 河海大学 | 一种基于再分析数据的海浪有效波高的长期趋势预测方法 |
CN115660041A (zh) * | 2022-08-04 | 2023-01-31 | 武汉理工大学 | 海浪高度预测及模型训练方法、电子设备及存储介质 |
CN116933152A (zh) * | 2023-06-07 | 2023-10-24 | 哈尔滨工业大学(威海) | 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及系统 |
-
2023
- 2023-12-13 CN CN202311706967.7A patent/CN117407660B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103268572A (zh) * | 2013-05-06 | 2013-08-28 | 国家电网公司 | 一种千万千瓦级大型风电基地测风网络的微观选址方法 |
CN104050514A (zh) * | 2014-05-29 | 2014-09-17 | 河海大学 | 一种基于再分析数据的海浪有效波高的长期趋势预测方法 |
CN104021308A (zh) * | 2014-06-20 | 2014-09-03 | 河海大学 | 基于ERA-Interim和ERA40预测海浪有效波高的方法 |
CN115660041A (zh) * | 2022-08-04 | 2023-01-31 | 武汉理工大学 | 海浪高度预测及模型训练方法、电子设备及存储介质 |
CN116933152A (zh) * | 2023-06-07 | 2023-10-24 | 哈尔滨工业大学(威海) | 一种基于多维emd-pso-lstm神经网络的海浪信息预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
XIAOBO WU等: "Learning–Based Prediction of Kuroshio Path South of Japan", 《JOURNAL OF ATMPSPHERIC AND OCEANIC TECHNOLOGY》, vol. 40, no. 2, 28 February 2023 (2023-02-28), pages 175 - 190 * |
Also Published As
Publication number | Publication date |
---|---|
CN117407660B (zh) | 2024-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A comprehensive wind speed prediction system based on Monte Carlo and artificial intelligence algorithms | |
Chen et al. | Short-term wind speed forecasting based on long short-term memory and improved BP neural network | |
Tian et al. | Multi-step short-term wind speed prediction based on integrated multi-model fusion | |
Liu et al. | Data multi-scale decomposition strategies for air pollution forecasting: a comprehensive review | |
CN110309603B (zh) | 一种基于风速特性的短期风速预测方法及系统 | |
CN107292446B (zh) | 一种基于考虑分量关联性小波分解的混合风速预测方法 | |
CN112116162B (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
Zhang et al. | Short term wind energy prediction model based on data decomposition and optimized LSSVM | |
CN113159361A (zh) | 基于VDM和Stacking模型融合的短期负荷预测方法及系统 | |
CN110443724B (zh) | 一种基于深度学习的电力系统快速状态估计方法 | |
CN110991721A (zh) | 基于改进经验模态分解和支持向量机的短期风速预测方法 | |
Shen et al. | Remaining useful life prediction of rolling bearing based on multi-head attention embedded Bi-LSTM network | |
Zhang et al. | A hybrid forecasting system with complexity identification and improved optimization for short-term wind speed prediction | |
CN111506868B (zh) | 一种基于hht权值优化的超短期风速预测方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN113343564A (zh) | 一种基于多元经验模态分解的变压器顶层油温预测方法 | |
CN114970774A (zh) | 一种智能变压器故障预测方法和装置 | |
Zu et al. | Short-term wind power prediction method based on wavelet packet decomposition and improved GRU | |
CN117239722A (zh) | 一种考虑多元负荷影响的系统风荷短期预测方法 | |
CN111141879B (zh) | 一种深度学习的空气质量监测方法以及装置、设备 | |
Fu et al. | Multi-step-ahead significant wave height prediction using a hybrid model based on an innovative two-layer decomposition framework and LSTM | |
Yang et al. | A prediction model of aquaculture water quality based on multiscale decomposition | |
Wei et al. | A three-stage multi-objective heterogeneous integrated model with decomposition-reconstruction mechanism and adaptive segmentation error correction method for ship motion multi-step prediction | |
Zhang et al. | Encoding time series as images: A robust and transferable framework for power system DIM identification combining rules and VGGNet | |
CN117407660B (zh) | 一种基于深度学习的区域海浪预报方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |