CN117407660A

CN117407660A - 一种基于深度学习的区域海浪预报方法

Info

Publication number: CN117407660A
Application number: CN202311706967.7A
Authority: CN
Inventors: 于华明; 叶佳承; 马启棣; 徐杰; 王春晓
Original assignee: Sanya Institute Of Oceanography Ocean University Of China
Current assignee: Sanya Institute Of Oceanography Ocean University Of China
Priority date: 2023-12-13
Filing date: 2023-12-13
Publication date: 2024-01-16
Anticipated expiration: 2043-12-13
Also published as: CN117407660B

Abstract

一种基于深度学习的区域海浪预报方法，包括采用EOF法对有效波高数据进行时空分离，再通过CEEMDAN法对时间系数进行分离，得到时间子模态IMF，最后得到海浪多时空模态数据集；采用LSTM神经网络对数据集中的时间子模态IMF进行训练和预报，得到预报时效为1h、6h、12h、24h的时间子模态IMF；结合空间特征矩阵V与时间子模态IMF的预报结果得到预报时效为1h、6h、12h、24h的区域海浪有效波高。本发明首次采用EOF分解结合CEEMDAN分解的方式，完成基于区域化海浪预报，采用分解法将数据进行分解能够简化数据，降低神经网络训练难度，该思路也对神经网络的应用具有启示作用。

Description

一种基于深度学习的区域海浪预报方法

技术领域

本发明涉及一种基于深度学习的区域海浪预报方法，属于海洋科学与神经网络技术领域。

背景技术

海浪预报分为动力学和统计学两种方法。动力学方法是采用基于海浪运动方程与能量守恒方程等的数值模式，如第三代海浪数值模式WAM、WAVEWARCH III（WW3）、SWAN等，这些模型已广泛应用于业务化的海浪预报。动力学方法需要对海浪运动方程与能量守恒方程等进行求解，由于海浪数据量大且计算求解复杂，需要高性能计算机和显著的时间成本，便捷性与灵活性受限。然而，随着海岸工程的快速发展，行业对海浪预报灵活性和便捷性的需求更高，动力学方法由于时间成本和硬件条件高的问题难以满足需求。在这种背景下，采用计算速度快，计算条件要求低的统计学方法是解决上述问题的最佳手段。

统计学方法采用历史波浪数据构建统计模型，用于预测波高、周期等波参数，以统计学方法为理论基础的神经网络预报模型是当前学者关注的技术热点。

神经网络能够模拟人脑结构，由大批神经处理单元（以下简称神经元）以权重的方式连接组成，具有强大的学习能力。常见的神经网络模型如误差反向传播模型(Error BackPropagation Training model, BP)、人工神经网络(Artificial Neural Network, ANN)、循环神经网络(Recurrent Neural Ntework，RNN)、长短期记忆神经网络(Long Short –Term Memory，LSTM)、门控循环神经网络(Gated Recurrent Unit, GRU)等，这些神经网络获取结果较快，计算条件要求低，预报的灵活性与和便捷性强于数值模式。

深度学习模型是含有多个隐藏层的神经网络模型，近年来，随着观测技术和人工智能技术的快速发展，观测数据大量积累，采用大数据结合深度学习的方法是当今数字时代进行预报的新兴方法。深度学习方法通过拟合历史海浪数据，捕获历史和未来数据间的关系特征，进而完成预测。然而，在大区域的海浪预报中，除了过去和未来之间的时间特征外，区域内的空间特征同样重要，传统的深度学习难以同时对空间特征与时间特征进行训练和模拟，无法准确的识别复杂的时空规律，从而影响区域海浪预报的精度。随着研究的发展，人们发现将分解算法应用于深度学习预报，能够有效提高预报精度。基于以上的研究方向，本文采用EOF分解与CEEMDAN分解提高基于深度学习的区域海浪预报的精度，为区域化海洋预报提供新思路，同时探究这些思路在数值模式预报的应用，具有一定的研究意义。

国外主要重视单点海浪预报，随着机器学习的发展，神经网络模型不断更新，单点有效波高预报的精度得到较高的提升。Deo提出了一种前馈网络预报有效波高，与ANN相比，该方法具有更强的通用性、灵活性和适应性。Mandal和Prabaharan首次采用RNN进行有效波高的预报，发现RNN的相关系数高于前馈网络，证明RNN更适合时间序列的预测。

Mahjoobi和Adeli Mosabbeb尝试采用支持向量机(Support Vector Machine，SVM)来预测波高，结果表明，SVM预报具有一定的准确性，相较于ANN，SVM预报精度基本不变，但计算速度更快。Etemad-Shahidi和Mahjoobi对苏利尔湖的预测效果进行了各种研究，对比了模型树和前馈传播ANN的预报结果，证明模型树法具有较高的精度。Dixit et al在使用ANN预测海浪高度时发现了预测滞后的现象，因此，他们使用了离散小波变换增强了预测值，消除预测时间上的滞后。Fan等人采用LSTM神经网络对NDBC数据进行预报分析，并将结果与对比并与bp、残差网络、极限学习机、SVM和随机森林网络的预报结果进行比较，结果表明LSTM预报效果最好。

国外的神经网络经过众多的研究，得到的LSTM神经网络可依靠历史信息来协助当前决策，在时间预测方面有很强的优势。因此，使用LSTM神经网络进行预报研究存在其合理性。然而，由于波浪数据的非线性和非平稳特性，单一的深度学习模型在预测波高时存在一定的局限性。值得注意的是，学者们越来越多地致力于在这种情况下使用混合方法。典型的混合模型通常结合分解算法和神经网络预测模型。Zhou S、Hao W、Raj N等人均采用了基于经验模态分解(EMD)和LSTM的混合模型来预测波高，实验结果表明，相较于单个深度学习模型，采用EMD与LSTM相结合的方式预报精度更高。

国内对基于深度学习的海浪预报进行了大量的探索。陈希等在2002年首次采用bp神经网络模拟风浪与风的关系，经过2369次训练迭代将均方根误差控制在0.05m以下，预报效果较好，但该研究忽略了海浪中的涌浪成分，难以对总体海浪进行预报。随着神经网络的不断更新，针对时间序列的RNN与LSTM神经网络被广泛应用，这两个模型能将上个时刻的神经元状态传递到当前时刻，构成神经元在时间维度上的联系，相较于仅在神经元之间存在关联的bp神经网络，RNN与LSTM更善于时间序列的模拟。赵建鹏在进行海浪波倾角的预报中，对比了bp、RNN与LSTM3者的预报结果，LSTM神经网络的平均绝对百分比误差为13%，远低于BP神经网络与RNN神经网络，证明了LSTM神经网络更适合应用于预报。高丽斌首次采用LSTM神经网络对中国台湾海峡部分站点的有效波高进行预报，在时效性为1h的预报中均方误差均在0.1m以下，预报准确性较高，同时提出ConvLSTM神经网络的预报方法，初步实现了海浪的区域性预报^[。ConvLSTM结合了卷积神经网络CNN与LSTM神经网络，通过卷积层对海浪的空间规律进行学习，并采用LSTM神经网络学习海浪的时间信息，最终得到一个汇集海浪时空信息的神经网络，但采用ConvLSTM的海浪预报误差仍然较大，且预报时效低，在高丽斌的研究中，预报时效在3小时以上的海浪预报均方误差达到了2m。高丽斌仅是以此展示了区域海洋预报的可能性，该技术存在改进的空间。郝剑波将有效波高分为1~3级，同时采用卷积神经网络CNN的方法对海浪危险等级进行训练，将复杂有效波高转化为简单直观的危险等级，对海浪进行抽象处理，便于CNN神经网络的学习，有效提升了分析准确性，该方法得到海浪数据过于简单，难以广泛应用于海浪分析，但该研究证明数据的复杂程度对神经网络训练效果有重大影响，数据越简单，训练效果越好。

因此现有技术的发展证明了深度学习在单点海浪预报的优越性，但基于深度学习的区域海浪预报仍存在预报误差较大、预报时效较低的问题，而通过简化数据能够有效提升深度学习的训练效果。

发明内容

本发明目的是提供一种基于深度学习的区域海浪预报方法，以解决传统的深度学习难以同时对空间特征与时间特征同时进行训练和模拟，无法准确的识别复杂的时空规律，导致基于深度学习的区域海浪预报仍存在预报误差较大、预报时效较低的问题。

为解决以上问题，本发明将在传统深度学习模型的基础上，结合EOF、CEEMDAN分解，构建EOF- CEEMDAN-LSTM区域化预报方法，以提高深度学习预报的时效性与准确性。

一种基于深度学习的区域海浪预报方法，其特征是包括以下步骤：

（0）有效波高是波浪谱中三分之一最大波高的平均高度，可代表一组波浪的理论高度，本文选用ERA5数据库中的有效波高数据集，获取指定海域的有效波高数据，时间分辨率为1h，空间分辨率为0.5°× 0.5°，时间范围为2年，以确保最高预报时效不低于6h。

（1）将有效波高数据分解为海浪多时空模态数据集H：

采用EOF法对有效波高数据进行时空分离，得到各模态的空间特征矩阵V与时间系数T ₁，T ₂，…，T _m，m为测量点个数，再通过CEEMDAN法对时间系数T ₁，T ₂，…，T _m进行分离，得到时间子模态IMF，最后得到海浪多时空模态数据集H，该数据集包含时间与空间两个部分，空间部分为空间特征矩阵V，不随时间变化；而时间部分为时间子模态IMF，随时间变化，以运动频率分为不同的时间子模态IMF₁，IMF₂，…，IMF_s，s为子模态总数。

（2）然后采用具有记忆长期依赖信息、善于处理存在时间依赖性的LSTM神经网络对数据集H中的时间子模态IMF进行训练和预报，然后利用训练好的网络得到预报时效为1h、6h、12h、24h的时间子模态IMF。

（3）结合空间特征矩阵V与时间子模态IMF的预报结果得到预报时效为1h、6h、12h、24h的区域海浪有效波高。

所述步骤（1）中EOF分解步骤为：

1）设数据集H存在m个测量点，n为其时间序列长度，数据集H的矩阵形式为：

（1）

2）将数据集H乘以其转置，得方阵D

（2）

计算方阵D的特征值并进行排序：λ₁，λ₂，…，λ_m，其对应的特征向量为V ₁，V ₂，…，V _m，特征值λ_i对应的特征向量V _i为第i模态的空间特征，而将空间特征投影到数据集中，得到对应的时间系数T _i：

（3）

3）计算各模态的方差贡献率，计算公式为：

（4）

至此，数据集H完成了EOF分解，得到了各个模态的空间特征V ₁，V ₂，…，V _m与对应的时间系数T ₁，T ₂，…，T _m，同时可将方差贡献率较低的模态剔除，获得主要的时空信息。实践中，剔除方差贡献率小于0.1%的模态，选取剩余的分解后的模态用于后续流程。

所述步骤（1）中CEEMDAN分解步骤为：

1）时间系数序列附加噪声后表示为

（5）

其中，T(t)为时间系数序列，a ₀为噪声幅度，v ^d(t)为添加的白噪声，d=1,2,…,k，k为添加白噪声的次数；

将附加噪声的时间系数序列T ^d(t)进行EMD分解k次，获得EMD分解的第1个模态分量C ₁ ^d(t)与EMD分解的残差r ₁ ^d(t)；

（6）

对产生的k个模态分量进行总体平均就得到CEEMDAN分解的第1个时间子模态：

（7）

计算去除第一个模态分量后的CEEMDAN的残差：

（8）

2）采用EMD对白噪声v ^d(t)分解k次，得到k个子模态，然后利用白噪声分解后的k组子模态将残差r ₁(t)分解k次，进行以下计算：

（9）

其中E ₁(v ^d(t))为分解后白噪声v ^d(t)的第1子模态，a ₁为噪声幅度，C ₂ ^d(t)为EMD分解的第2个模态分量，r ₂ ^d(t)为EMD分解的残差，由此得到CEEMDAN分解的第2个时间子模态：

（10）

3）对于剩下的每一阶段，即i=2，3，…，s，s为IMF的总数，第i个残差计算如下：

（11）

4）利用白噪声分解后的k个子模态将将残差r _i(t)分解k次，如下所示：

（12）

重复3）和4）直到i=s时为止，最后的残差是R(t)，原始数据被分解为：

（13）。

所述步骤（2）中，选取LSTM神经网络构建有效波高预报模型，以下是具体的方法步骤：

取数据集H中的时间子模态IMF前90%的作为训练集建立监督学习序列，后10%的数据作为验证集；

采用训练集训练LSTM神经网络预报模型，并进行验证集的预报；

统合2)预报的各时间系数，将数据集中的空间特征矩阵与这些时间系数相乘得到各格网点的有效波高预测值。

所述步骤（2）中，采用N-24，N-23，…，N -1共24小时的有效波高对第N、N +5、N +11、N +23等时刻进行预报，N为当前时刻，这类型的预报存在大量的低阶特征，而高阶特征较少，需要针对这一特点设计神经元的数量。需要注意的是，与在每一层中添加更多的神经元相比，添加层数能获得更大的性能提升。因此，本文设计第1、2、3LSTM层拥有的神经元数量分别为64、32、16，确保神经网络能够在第1、2LSTM层能够更好的学习低阶特征。

所述步骤（2）中，选用tanh作为激活函数。

所述基于深度学习的区域海浪预报方法，还包括步骤（4）通过预测的有效波高与验证集的误差、样例点预测与真实的有效波高数据的误差为评价模型预报结果标准，采用相关系数（R）、平均绝对误差（MAE）、均方根误差（RMSE）、结构相似性系数（SSIM）指标，对预报模型进行评估；若评估结果是未达到设定要求，则返回步骤2重新对数据进行训练。

本发明首次采用EOF分解结合CEEMDAN分解的方式，完成基于区域化海浪预报，具有一定的创新性。此外，采用分解法将数据进行分解能够简化数据，降低神经网络训练难度，该思路对神经网络的应用具有一定的启示作用。

CEEMDAN分解将时间序列分解为多个子序列，将复杂的时间序列视为多个简单的子序列的集合，并采用LSTM分别对多个子序列进行训练，建立多个LSTM神经网络预测模型，有效避免了各子序列的混淆；同时，在同一模态下，不进行CEEMDAN分解仅能构建1个LSTM神经网络，而进行CEEMDAN分解后，同一模态下的时间系数可构建13-14个LSTM神经网络，容错率具有极大的提升；经过CEEMDAN分解后，大部分子序列的均值为0，起到去中心化的作用，有利于LSTM的收敛。

附图说明

图1 本发明的总体流程图；

图2 南海海域2014-2015年ERA5数据示意图（有效波高数据）；

图3 EOF分解后的空间特征矩阵结构示意图；

图4 EOF分解后的时间系数图（IMF1~IMF13）；

图5 LSTM网络神经元内部结构图。

具体实施方式

如图1所示，一种基于深度学习的区域海浪预报方法，其特征是包括以下步骤：

（1）将有效波高数据分解为海浪多时空模态数据集H：

采用EOF法对有效波高数据进行时空分离，得到各模态的空间特征矩阵V与时间系数T ₁，T ₂，…，T _m，m为测量点个数，再通过CEEMDAN法对时间系数T ₁，T ₂，…，T _m进行分离，得到时间子模态IMF，最后得到海浪多时空模态数据集H，该数据集包含时间与空间两个部分，空间部分为空间特征矩阵V（如图3），不随时间变化；而时间部分为时间子模态IMF，随时间变化，以运动频率分为不同的时间子模态IMF₁，IMF₂，…，IMF_s（如图4），s为子模态总数。

EOF分解是一种分析数据场结构特征并提炼主要模态的方法，可以将时空场分解为各个模态，每个模态中包含不随时间变化的空间特征矩阵和随时间变化的时间系数，常用于主要影响因子分析、因子时空变化分析与动力模型参数化中。LSTM神经网络仅需对各模态的时间系数进行训练学习，避免了学习空间特征引起的误差，同时通过EOF分解可剔除方差贡献率低的模态，提炼有效信息，有效减少计算量。

所述步骤（1）中EOF分解步骤为：

（1）

2）将数据集H乘以其转置，得方阵D

（2）

（3）

3）计算各模态的方差贡献率，计算公式为：

（4）

传统的分解方法EMD过程可以将非平稳和非线性信号分解为若干个分量，但在实际应用中经常遇到模式混合问题，而CEEMDAN算法克服了EMD可能产生的模态混合问题，能更好的分离噪声。

所述步骤（1）中CEEMDAN分解步骤为：

1）时间系数序列附加噪声后表示为

（5）

（6）

（7）

计算去除第一个模态分量后的CEEMDAN的残差：

（8）

（9）

（10）

（11）

（12）

（13）。

所述步骤（2）中，选用tanh作为激活函数。

本发明的LSTM网络模式：

LSTM由输入层、输出层与多层输出层构成，与RNN不同的是，LSTM的神经元结构包含输入门、输出门、遗忘门和记忆单元，其中遗忘门是解决梯度爆炸的关键。记忆单元可存储过往时刻下的神经元状态，输入门、输出门负责对输入数据进行处理并传递到下个神经元，而遗忘门决定了记忆单元中神经元状态是否需要修改，遗忘门打开，记忆单元中的信息可保留至下个时刻；遗忘门关闭则将之前储存的状态清除。LSTM通过遗忘门可剔除训练中的错误或冗余的信息，确保模型能够精确的捕获数据的变化规律。LSTM中神经元内部结构如图5所示。

1）利用上一时刻的输出h_t-1和当前时刻输入x_t计算出输入门i_t、遗忘门f_t，输出门O_t，以及候选状态C′_t；

2）结合遗忘门f_t和输入门i_t更新记忆单元C_t；

3）结合输出门O_t，将内部状态的信息传递给h_t，并输出数据y_t。

本发明的效果验证：

（1）本文以ERA5南海有效波高数据为例，其数据图如图2所示。

（2）为进一步说明本文设计的深度学习方法的优越性，以预报时效为24h的有效波高预报为例，采用其他常用预报方法对南海有效波高进行预报，并与本文构建的预报方法进行对比。

（3）为讨论EOF与CEEMDAN在区域海浪预报中的作用，采用控制变量的方式设计对比方案，同样以预报时效为24h的有效波高预报为例，采用R、MAE、SSIM等相关指标，对各方案进行评估分析，探究二者对深度学习预报的影响机制。

各预报时效的结果变化的趋势与验证数据相差不大，本文认为这是CEEMD AN分解的优势。结果表明，本方法的预报结果基本上可以准确刻画南海的有效波高场，且预报的准确性与预报时效相关，预报时效越高，准确性越低，准确性1h>6h>12h>24h。如表1所示，在24h预报中，平均SSIM高达0.9814，平均R高达0.9715，RMSE与MAE保持在0.2m以下，证明该方法的预报准确性较高。

表1预报结果

。

同时以预报时效为24h为例，采用该方法与传统的ConvLSTM进行预报对比，该方法获得的SSIM、R、RMSE、MAE均优于传统的ConvLSTM。如表2所示，相较于ConvLSTM，本方法的SSIM提升约0.13，R提升约0.16。

表2 与Conv LSTM对比结果

。

为了评价模型的预报效果，本文选择4个指标衡量预报结果是否准确，从而衡量预报模型的性能。

1）相关系数

相关系数（R）是预测值和实际观测值之间线性相关程度的指标，R越高说明预测效果越好，反之，R越低说明波预测效果越差。其计算公式如下，

（14）

上式中，Cov(x,y)为x与y的协方差，Var[x]为x的方差，Var[y]为y的方差。

2）平均绝对误差

平均绝对误差(MAE)度量的是预测值和实际观测值之间绝对差之和的平均值，其计算公式如下：

（15）

上式中， y _i为预测值，为实际观测值。

3）均方根误差

均方根误差度量的是预测值与实际观测值之间差的平方的均值，其计算公式如下：

（16）

上式中，y _i为预测值，为实际观测值。

4）结构相似性系数

结构相似性系数(SSIM)用于度量预测值和实际观测值之间空间结构相似程度，其计算公式如下：

（17）

其中μ _x是x的平均值，μ _y是y的平均值，σ_x是x的方差，σ_y是y的方差，σ_xy是x和y的协方差。c ₁=(k ₁ L)²，c ₂=(k ₂ L)²，是防止分子分母等于0的常数。L是像素值的动态范围，k ₁ =0.01，k ₂ =0.03。

预报方案对比：

通过对不同预报方案的预报结果对比，分析了LSTM，bp，RNN，GRU的时间系数预报结果，以及EOF - CEEMDAN-LSTM，EOF- CEEMDAN-BP，EOF- CEEMDAN- RNN，EOF- CEEMDAN-GRU和ConvLSTM的有效波高预报结果，结果显示，LSTM预报准确性最高，且EOF和CEEMDAN双重分解的结构比采用卷积的方式预报更加精准。

Claims

1.一种基于深度学习的区域海浪预报方法，其特征是包括以下步骤：

（0）选用ERA5数据库中的有效波高数据集，获取指定海域的有效波高数据，时间分辨率为1h，空间分辨率为0.5°× 0.5°，时间范围为2年；

（1）将有效波高数据分解为海浪多时空模态数据集H：

采用EOF法对有效波高数据进行时空分离，得到各模态的空间特征矩阵V与时间系数T ₁，T ₂，…，T _m，m为测量点个数，再通过CEEMDAN法对时间系数T ₁，T ₂，…，T _m进行分离，得到时间子模态IMF，最后得到海浪多时空模态数据集H，该数据集包含时间与空间两个部分，空间部分为空间特征矩阵V，不随时间变化；而时间部分为时间子模态IMF，随时间变化，以运动频率分为不同的时间子模态IMF₁，IMF₂，…，IMF_s，s为子模态总数；

（2）采用具有记忆长期依赖信息、善于处理存在时间依赖性的LSTM神经网络对数据集H中的时间子模态IMF进行训练和预报，然后利用训练好的网络得到预报时效为1h、6h、12h、24h的时间子模态IMF；

2.如权利要求1所述的一种基于深度学习的区域海浪预报方法，其特征是步骤（1）中EOF分解步骤为：

（1）

2）将数据集H乘以其转置，得方阵D

（2）

（3）

3）计算各模态的方差贡献率，计算公式为：

（4）

至此，数据集H完成了EOF分解，得到了各个模态的空间特征V ₁，V ₂，…，V _m与对应的时间系数T ₁，T ₂，…，T _m，同时将方差贡献率小于0.1%的模态剔除，选取剩余的分解后的模态用于后续流程。

3.如权利要求1所述的一种基于深度学习的区域海浪预报方法，其特征是步骤（1）中CEEMDAN分解步骤为：

1）时间系数序列附加噪声后表示为

（5）

（6）

（7）

计算去除第一个模态分量后的CEEMDAN的残差：

（8）

（9）

（10）

（11）

（12）

（13）。

4.如权利要求1所述的一种基于深度学习的区域海浪预报方法，其特征是步骤（2）中选取LSTM神经网络构建有效波高预报模型，采用以步骤：

5.如权利要求1所述的一种基于深度学习的区域海浪预报方法，其特征是步骤（2）中，采用N-24，N-23，…，N -1共24小时的有效波高对第N、N +5、N +11、N +23时刻进行预报，N为当前时刻，并设计第1、2、3LSTM层拥有的神经元数量分别为64、32、16。

6.如权利要求5所述的一种基于深度学习的区域海浪预报方法，其特征是步骤（2）中选用tanh作为激活函数。

7.如权利要求1所述的一种基于深度学习的区域海浪预报方法，其特征是还包括步骤（4）通过预测的有效波高与验证集的误差、样例点预测与真实的有效波高数据的误差为评价模型预报结果标准，采用相关系数R、平均绝对误差MAE、均方根误差RMSE、结构相似性系数SSIM指标，对预报模型进行评估；若评估结果是未达到设定要求，则返回步骤2重新对数据进行训练。