CN117114168A

CN117114168A - 一种长时间尺度的海面温度智能预报方法

Info

Publication number: CN117114168A
Application number: CN202310904711.0A
Authority: CN
Inventors: 张蒙蒙; 董智超; 徐宾宾; 杨润来; 武晓博; 韩桂军; 李威; 胡向锋; 张友毕; 武浩文
Original assignee: Tianjin University; CCCC First Harbor Engineering Co Ltd; No 3 Engineering Co Ltd of CCCC First Harbor Engineering Co Ltd
Current assignee: Tianjin University; CCCC First Harbor Engineering Co Ltd; No 3 Engineering Co Ltd of CCCC First Harbor Engineering Co Ltd
Priority date: 2023-07-24
Filing date: 2023-07-24
Publication date: 2023-11-24

Abstract

本发明属于海洋信息技术领域，本发明涉及一种长时间尺度的海面温度智能预报方法。包括数据预处理、预报模型的构建与训练、温度的预测与评估步骤。本发明通过EOF分析建立了研究区域不同离散点之间的空间相关性，提取主要的空间正交模态信息，减少计算工作量；CEEMDAN具有很强的处理非线性的能力，增加了PC的可预测性，延长了预报时效；LSTM神经网络方法的应用，高效挖掘了数据中的信息，与传统数值模式相比，不受参数选择和计算平台的限制；本发明的混合模型实现了南海海面温度50天的长期预报，脱离海洋数值预报受气象驱动时效10天左右的限制，大幅提高了海洋变量预报时效，具有广泛的应用前景。

Description

一种长时间尺度的海面温度智能预报方法

技术领域

本发明属于海洋信息技术领域，本发明涉及一种长时间尺度的海面温度智能预报方法。

背景技术

海面温度(Sea surface temperature，SST)不仅是用于描述海洋表层热状况的主要指标，而且海表面温度异常(Sea surface temperature anomaly，SSTA)还是海洋影响大气环流和气候变化的重要因子。所以，海面温度一直是人们观测、研究和预报的重点对象。且随着卫星技术和数值模式的不断发展，大量的表层海洋遥感实时资料，结合日益成熟的高时空分辨率的数值模式结果和大范围的现场观测数据，基于大数据的预报研究逐渐成为研究的热点之一。

常用的海洋要素传统预测方法如人工经验和数值模型，这些方法受参数设置和人类认知程度的影响较大，且复杂的海洋过程不能通过复杂的公式和繁琐的计算获得较好的结果。在大数据背景下，基于人工智能的纯数据驱动海洋信息来构建复杂海洋现象的模型与预报方法逐渐成为热门，具有广阔的应用前景。人工神经网络是最受欢迎和最有影响力的模型之一，由于其灵活性和强大的非线性处理能力而被广泛应用。将神经网络应用于海洋大数据的预测研究，是将新一代技术与海洋现象预测应用相结合，拓展人工智能等关键技术在海洋中应用的重要方法。

目前，智能预报方法己经应用于海洋要素预测中。其预测方法主要分为两类，一类是将海洋中每一个空间格点看作是孤立的，通过挖掘时间序列中的有用信息来实现预测。这种模型考虑了不同格点的差异性，但每个格点需要足够的训练数据，计算成本很高。另一类是可以考虑空间相关性，但预测时效较短。

发明内容

为了克服现有技术的不足，本发明提供一种长时间尺度的海面温度智能预报方法，基于传统的经验正交函数分析(Empirical orthogonal function，EOF)、自适应噪声完全集合经验模态分解(Complete ensemble empirical mode decomposition withadaptive noise，CEEMDAN)结合长短时记忆神经网络(Long short-term memory，LSTM)，开发纯海洋数据驱动的混合模型(EOF-CEEMDAN-LSTM)，目的是实现南海海面温度的长期预报。

本发明的上述目的是通过以下技术方案实现的：一种长时间尺度的海面温度智能预报方法，其特征是，包括以下步骤：

S1.数据预处理：基于高分辨率卫星遥感融合最优插值的海表面温度资料，剔除季节信号和全球变暖趋势后，得到逐日海表面温度距平矩阵，作为后续分析的样本矩阵；

S2.预报模型的构建与训练：首先，对数据矩阵采用EOF，得到空间模态EOFs和相应的主成分PCs；然后，对主成分PCs进行CEEMDAN分解，得到CEEMDAN衍生的PCs作为后续输入；最后，使用LSTM神经网络方法对衍生的PCs进行训练与验证；

S3.温度的预测与评估：将混合模型预测出的的PCs与第二步中的EOFs相结合，得到预测的温度矩阵；采用均方根误差RMSE和空间距平相关系数ACC评估模型预报效果。

所述数据预处理，具体包括以下步骤：

基于卫星融合最优插值的南海海域海表面温度数据集，时间范围为1982年1月1日到开始预测时，空间分辨率为0.25°；将数据集分为训练集、验证集和测试集，选取前80％的年限数据进行训练，剩下后20％的年限数据用于验证和测试；最后，剔除季节信号和全球变暖趋势后，得到逐日海表面温度距平矩阵，作为后续分析的样本矩阵。

所述剩下后20％的年限数据用于验证和测试中，选择最远的1年数据作为验证期，其余年用于测试和评判模型标准。

所述预报模型的构建与训练，具体包括以下步骤：

S21.经验正交函数分析

将海面温度数据集以矩阵形式给出：

其中，m为空间格点个数，n为时间序列长度或样本数；在海洋学中，更多的研究海表面温度异常，故需减去气候态：

其中，为气候态；X即为后续研究的数据矩阵；求其协方差矩阵为：

计算协方差矩阵的特征根和特征向量：

CV＝VΛ (4)

其中，Λ＝diag(λ₁，...，λ_m)，V为空间模态，时间系数PC＝V^T×X；

对训练集数据进行EOF，获得空间模态EOFs和时间系数PCs，当累积方差达到98％时，认为重构数据足以保留原始数据的主要特征；假设可以认为时间序列是平稳的，训练数据量足够大，将测试集投影到上述EOFs生成相应的伪PCs，用于验证预测结果；

S22.自适应噪声完全集合经验模态分解

设E_j(.)为经过CEEMDAN分解后的第j个本征模态分量，w_i(t)为满足标准正态分布的高斯白噪声信号，i＝1,2,…l为加入白噪声次数，∈₀为噪声系数；x(t)为待分解的信号；在原始时间序列数据中加入白噪声得到新信号：

X_i(t)＝x(t)+∈₀w_i(t) (5)对产生的模态分量进行总体平均就得到了CEEMDAN分解的第一个本征模态分量：

然后计算去除第一个模态分量后的残差：

在R₁(t)中加入正负成对的高斯白噪声得到新信号R₁(t)+ε₁E₁(w_i(t))，以新信号为载体进行分解，得到CEEMDAN分解的第二个本征模态分量：

重复上述步骤，直到获得到残差信号为单调函数，不能继续分解，最终残差为：

将预报模型的构建与训练中方差占比为98％的PCs进行CEEMDAN分解，得到CEEMDAN衍生的PCs，其中每个PC由多个本征模态函数和残差组成，作为下一步神经网络的输入；

S23.长短时记忆神经网络

LSTM网络的控制数学方程如下：

f_t＝σ(W_f[h_t-1，x_t]+b_f) ((10)

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (11)

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (12)

C_t＝f_t*C_t-1+i_t*tan h(C_t) (14)

h_t＝o_t*tanh(C_t) (15)

其中，h_t和C_t为隐藏层向量，x_t为输入向量，b_f，b_i，b_c和b_o为偏差向量，W_f，W_i，W_c和W_o为权重矩阵，σ为激活函数；

使用的LSTM网络基于Keras进行搭建，并通过python3.9编程实现，设定神经网络模块由一层输入层，一层LSTM层和一层全连接层组成，LSTM层神经元个数为16，所有层激活函数为“ReLU”函数，采用此网络对CEEMDAN衍生的PCs进行训练和验证；至此，EOF-CEEMDAN-LSTM混合模型搭建完毕。

所述温度的预测与评估，具体包括以下步骤：

使用上述训练好的EOF-CEEMDAN-LSTM混合模型，得到预测的PCs，与S21中的EOFs相结合，得到重构的SSTA，将剩下的2％的方差通过惯性预报的方式对重构的SSTA进行订正，完成了对海面温度的预报过程；采用RMSE和ACC评估模型预报效果，计算公式如下：

其中，RMSE表示第i个网格点的均方根误差值，ACC表示第j天所有网格点的空间异常相关系数，X^P和X^T为第i个网格点第j天的预测值和真实值，M为网格点数，N为时间序列的长度；混合模型预测在第五十天的RMSE和ACC分别为0.47℃和64％。

本发明与现有技术相比的有益效果是：

(1)EOF分析建立了研究区域不同离散点之间的空间相关性，提取主要的空间正交模态信息，减少计算工作量。此外，由于EOF分析的正交特性，不同PC之间正交，说明对每个PC进行单独预测是可行的。

(2)CEEMDAN具有很强的处理非线性的能力，增加了PC的可预测性，延长了预报时效。

(3)LSTM神经网络方法的应用，高效挖掘了数据中的信息，与传统数值模式相比，不受参数选择和计算平台的限制。

(4)本发明的混合模型实现了南海海面温度50天的长期预报，脱离海洋数值预报受气象驱动时效10天左右的限制，大幅提高了海洋变量预报时效，具有广泛的应用前景。

附图说明

图1为一种长时间尺度的海面温度智能预报方法流程图。

图2为本发明EOF-CEEMDAN-LSTM模型均方根误差(℃)图，其中黑色虚线为气候态。

图3为本发明EOF-CEEMDAN-LSTM模型空间距平相关系数图，其中黑色虚线为有效值0.6。

图4为本发明EOF-CEEMDAN-LSTM模型海面温度预报时效为50天的对比图，其中(a)为真实场，(b)为预报场。

具体实施方式

下面通过附图与具体实施例详述本发明，但不限制本发明的保护范围。

实施例

如图1所示，一种长时间尺度的海面温度智能预报方法，包括以下步骤：

S1.数据预处理：基于卫星融合最优插值的南海海域海表面温度数据集，时间范围为1982年1月1日到2021年12月31日，空间分辨率为0.25°；将数据集分为训练集(1982年1月1日到2013年12月31日)、验证集(2014年1月1日到2014年12月31日)和测试集(2015年1月1日到2021年12月31日)，选取了前80％的数据进行训练，一是保证了足够多的训练数据，二是模态分解也达到稳定，剩下20％的数据用于验证和测试。1年的验证期可以提高模式运行效率，最后7年用于测试和评判模型标准。最后，剔除季节信号和全球变暖趋势后，得到逐日海表面温度距平矩阵，作为后续分析的样本矩阵；

S2.预报模型的构建与训练：首先，对数据矩阵采用EOF，得到空间模态EOFs和相应的主成分PCs；然后，对主成分PCs进行CEEMDAN分解，得到CEEMDAN衍生的PCs作为后续输入；最后，使用LSTM神经网络方法对衍生的PCs进行训练与验证；具体包括以下步骤：

S21.经验正交函数分析

经验正交函数分析方法，最早由统计学家Pearson在1902年提出，Lorenz在20世纪50年代首次将其引入气象和气候研究，它是一种常用的变量场分解方法，目前在海洋科学的研究中应用广泛。这种方法能对分布不规则的气象要素场进行时空分解，得到的各特征向量相互正交，空间模态在一定程度上可反映要素场的空间分布特点，而时间系数反映相应空间模态随时间的权重变化。

将海面温度数据集以矩阵形式给出：

计算协方差矩阵的特征根和特征向量：

CV＝VΛ (4)

本发明对训练集数据进行EOF，获得空间模态EOFs和时间系数PCs，实现数据降维，加快计算速度，提高混合算法的效率，且当累积方差达到98％时，认为重构数据足以保留原始数据的主要特征；假设可以认为时间序列是平稳的，训练数据量足够大，将测试集投影到上述EOFs生成相应的伪PCs，用于验证预测结果；

S22.自适应噪声完全集合经验模态分解

CEEMDAN是由EMD、EEMD和CEEMD发展而来的。这些基于EMD的方法可以自适应地将原始数据分解为多个具有不同频率和尺度的本征模态函数和一个残差。CEEMDAN不仅解决了EMD的模态混叠问题，还有效地解决了EEMD和CEEMD白噪声从高频到低频的转移传递问题。

X_i(t)＝x(t)+∈₀w_i(t) (5)

对产生的模态分量进行总体平均就得到了CEEMDAN分解的第一个本征模态分量：

然后计算去除第一个模态分量后的残差：

S23.长短时记忆神经网络

LSTM是递归神经网络(Recurrent neural network，RNN)的一种变体，主要用于解决长序列训练过程中的梯度消失和梯度爆炸问题。LSTM的核心是细胞状态，通过三个门(遗忘门、输入门和输出门)对细胞状态进行删除或者添加信息，用于保护和控制细胞状态。LSTM网络在每个单元中都有门控机制，通过门控状态来控制传输状态。LSTM网络的控制数学方程如下：

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (10)

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (11)

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (12)

C_t＝f_t*C_t-1+i_t*tan h(C_t) (14)

h_t＝o_t*tanh(C_t) (15)

其中，h_t和C_t为隐藏层向量，x_t为输入向量，b_f,b_i,b_c和b_o为偏差向量，W_f，W_i，W_c和W_o为权重矩阵，σ为激活函数；

使用的LSTM网络基于Keras进行搭建，并通过python3.9编程实现，设定神经网络模块由一层输入层，一层LSTM层和一层全连接层组成，LSTM层神经元个数为16，所有层激活函数为“ReLU”函数，采用此网络对CEEMDAN衍生的PCs进行训练和验证；至此，EOF-CEEMDAN-LSTM混合模型搭建完毕；

S3.温度的预测与评估：使用上述训练好的EOF-CEEMDAN-LSTM混合模型，得到预测的PCs，与S21中的EOFs相结合，得到重构的SSTA，将剩下的2％的方差通过惯性预报的方式对重构的SSTA进行订正，完成了对海面温度的预报过程；采用RMSE和ACC评估模型预报效果，计算公式如下：

以上所述实施方式仅为本发明的优选实施例，而并非本发明可行实施的全部实施例。对于本领域一般技术人员而言，在不背离本发明原理和精神的前提下对其所作出的任何显而易见的改动，都应当被认为包含在本发明的权利要求保护范围之内。

Claims

1.一种长时间尺度的海面温度智能预报方法，其特征是，包括以下步骤：

S3.温度的预测与评估：将混合模型预测出的PCs与第二步中的EOFs相结合，得到预测的温度矩阵；采用均方根误差RMSE和空间距平相关系数ACC评估模型预报效果。

2.根据权利要求1所述的一种长时间尺度的海面温度智能预报方法，其特征是，所述数据预处理，具体包括以下步骤：

3.根据权利要求2所述的一种长时间尺度的海面温度智能预报方法，其特征是，所述剩下后20％的年限数据用于验证和测试中，选择最远的1年数据作为验证期，其余年用于测试和评判模型标准。

4.根据权利要求1所述的一种长时间尺度的海面温度智能预报方法，其特征是，所述预报模型的构建与训练，具体包括以下步骤：

S21.经验正交函数分析

将海面温度数据集以矩阵形式给出：

计算协方差矩阵的特征根和特征向量：

CV＝VΛ (4)

S22.自适应噪声完全集合经验模态分解

X_i(T)＝x(t)+∈₀w_i(t) (5)

然后计算去除第一个模态分量后的残差：

S23.长短时记忆神经网络

LSTM网络的控制数学方程如下：

f_t＝σ(Wx·[h_t-1，x_t]+b_f) (10)

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (11)

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (12)

C_t＝f_t*C_t-1+i_t*tan h(C_t) (14)

h_t＝o_t*tanh(C_t) (15)

5.根据权利要求1所述的一种长时间尺度的海面温度智能预报方法，其特征是，所述温度的预测与评估，具体包括以下步骤：