CN117875493A

CN117875493A - 一种基于原型校正的多步海表面高度时空预测算法

Info

Publication number: CN117875493A
Application number: CN202410041069.2A
Authority: CN
Inventors: 任甜; 周圆; 李硕士; 陈克然; 张宇; 杨明哲
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2024-01-11
Filing date: 2024-01-11
Publication date: 2024-04-12

Abstract

本发明涉及人工智能海洋学中的海洋信息预测领域，更具体地，涉及到一种基于原型校正的多步海表面高度时空预测算法。传统基于循环神经网络的时空预测模型在更新记忆状态时，旧的记忆状态会被立即刷新，模型无法有效保留时间序列的长期依赖关系和变化趋势，从而使预测误差随着预测步长的增加而严重累积。本发明所述的方法设计了原型校正时空网络，利用原型校正模块学习样本的原型特征，从而提取时间域中的关键信息，校正当前时间步的海表面高度特征，有效缓解多步预测中的严重误差积累问题；设计了多步信息输入策略，使模型能够从更广泛的时间步长中获得更全面准确的上下文信息。采用本发明所述的方法，极大地提高了多步海表面高度的时空预测精度。

Description

一种基于原型校正的多步海表面高度时空预测算法

技术领域

本发明涉及人工智能海洋学中的海洋信息预测领域，更具体地，涉及到一种基于原型校正的多步海表面高度时空预测算法。

背景技术

海表面高度是指海洋表面相对于参考海平面的高度变化，是描述海洋动力学、气候变化和海洋生态系统的重要参数。准确的海表面高度预测可以为海洋气象、海洋资源开发、航运、渔业等相关领域提供重要的信息和决策支持。海洋是一个连续动态的时空信息载体，海表面高度数据具有时间关联性、空间关联性和时空依赖性等特征。如何综合考虑不同时间跨度和不同空间范围的多尺度时空信息，以更准确地捕捉海表面高度的时序特征和空间特征，实现准确的多步海表面高度时空预测，是海洋预测领域亟待解决的问题。

海表面高度预测方法通常可分为数值分析方法和数据驱动方法。数值分析方法利用海洋数学模型进行数值预报，可以准确地模拟海洋气象等相关现象。然而，先前研究已经证明了传统的数值分析方法在模拟复杂的自然现象时会受到限制。相比之下，数据驱动方法通过对充足的数据集进行训练，可以有效提取深藏在时空序列中的复杂规则，为复杂海洋现象的分析和预测提供新的机会。

深度学习作为一种数据驱动方法，以其强大的大数据挖掘分析能力已被广泛应用于海洋预测领域。在深度学习中，循环神经网络及其变体特别擅长通过提取隐藏在数据中的底层时间模式来处理时间序列数据。Braakmann-Folgmann等人[1]采用由循环神经网络和卷积神经网络组成的混合架构分别从时间和空间维度分析和预测海表面高度的变化模式。Sun等人[2]将长短期记忆模型与季节性自回归移动平均模型相结合，实现了对中国海海平面异常的高精度预测。Liu等人[3]提出长短期记忆模型与注意力机制相结合的深度学习模型，实现了可靠且高性能的海表面高度预测。Zhou等人[4]开发了多层融合循环神经网络模型来挖掘海表面高度的时空信息，实现了准确的海表面高度时空预测。

然而，以往基于循环神经网络的多步海表面高度预测方法一直面临着一个严峻的挑战，即模型在更新记忆状态时，旧的记忆状态会被立即刷新，无法有效地保留时间序列的长期依赖关系和变化趋势。这导致在多步海表面高度预测中，模型无法充分挖掘时间域的重要特征，先前时间步长的时空信息急剧恶化，从而使预测误差随着预测步长的增加而严重累积。

参考文献：

[1]Braakmann-Folgmann A,Roscher R,Wenzel S,et al.Sea level anomalyprediction using recurrent neural networks[J].arXiv preprint arXiv:1710.07099,2017.

[2]Sun Q,Wan J,Liu S.Estimation of sea level variability in the ChinaSea and its vicinity using the SARIMA and LSTM models[J].IEEE Journal ofSelected Topics in Applied Earth Observations and Remote Sensing,2020,13:3317-3326.

[3]Liu J,Jin B,Wang L,et al.Sea surface height prediction with deeplearning based on attention mechanism[J].IEEE Geoscience and Remote SensingLetters,2020.

[4]Zhou Y,Lu C,Chen K,et al.Multilayer fusion recurrent neuralnetwork for sea surface height anomaly field prediction[J].IEEE Transactionson Geoscience and Remote Sensing,2021,60:1-11.

发明内容

针对现有技术中存在的缺陷，本发明的目的是学习一种多步海表面高度时空预测器，该预测器可以有效缓解循环神经网络在多步预测过程中的严重误差累积问题，实现海表面高度时空序列的准确多步时空预测。

为达到以上目的，本发明采用的技术方案是：一种基于原型校正的多步海表面高度时空预测算法，本发明通过学习海表面高度样本的原型特征，提取时间域中的关键信息，并校正捕获的海表面高度高维时间特征，从而有效缓解误差的累积，包括以下步骤：

(1)海表面高度数据预处理

对卫星观测海表面高度数据进行归一化处理，利用滑动窗口构建海表面高度时空序列。

(2)输入海表面高度时空序列获取编码特征

在每个时间步，利用多步信息输入策略将步骤(1)得到的过去及当前共n个时刻的海表面高度时空序列输入到由多层3D卷积组成的编码器中，提取海表面高度时空序列的高维特征。

(3)编码特征的循环预测

将步骤(2)中获得的海表面高度高维特征输入到循环预测器中，循环预测器将这些特征通过堆叠的记忆状态更新单元进行传递，以捕获海表面高度时空序列的长期时间依赖性和变化趋势，并有效缓解误差累积。

(4)特征解码及预测序列生成

将步骤(3)得到的循环张量输入到解码器中，采用与编码器相同组成的解码器，将循环预测器的输出张量转换为输出的目标张量，得到预测的海表面高度时空序列。

本发明设计的算法采用编码器-解码器结构，主要包括五个部分：输入、编码器、循环预测器、解码器和输出。首先，由多层3D卷积组成的编码器，从历史海表面高度时空序列中提取海表面高度的高维特征。其次，循环预测器将这些海表面高度特征通过堆叠的记忆状态更新单元传递，以捕获长期时空依赖性，并有效缓解误差累积。最后，采用与编码器相同组成的解码器，将循环预测器的输出张量转换为输出目标张量。与现有技术相比，本发明的效果在于极大地提高了多步海表面高度时空预测的准确率。

附图说明

图1是本发明的训练阶段流程图；

图2是本发明的网络结构图；

图3是本发明所述的记忆状态更新单元；

图4是本发明在测试集中与现有先进网络的性能比较(粗体最优)。

具体实施方式

为使本发明的技术方案更加清楚，下面结合附图对本发明做进一步阐述。本发明按以下步骤具体实现：

步骤一，海表面高度数据预处理

具体地，为了加快模型的训练速度，对海表面高度数据进行最大、最小标准化，将所有数据标准化到[0,1]，公式如下：

其中，x′是归一化后的海表面高度，x是实际观测的海表面高度，x_min是实际观测海表面高度的最小值，x_max是实际观测海表面高度的最大值。

针对多步时空预测实验，数据集使用宽度为15帧的滑动窗口对连续图像进行切片，其中10个输入帧、5个预测帧。

步骤二，输入海表面高度时空序列获取编码特征

在每个时间步，利用多步信息输入策略将步骤一得到的过去及当前共n个时刻的海表面高度时空序列输入到由多层3D卷积组成的编码器中，提取海表面高度时空序列的高维特征。

具体地，为了获得更丰富的时间信息并增强模型对长期时间依赖性的感知能力，本发明提出了一种多步信息输入策略，以扩大模型的时间感受野。传统的循环神经网络模型在每个时间步只输入当前时间步的海表面高度来预测下一个时间步的海表面高度。本发明算法模型在每个时间步输入n个连续时间步的海表面高度序列，并利用3D卷积来充分挖掘海表面高度的历史时空信息。通过这种多步信息输入策略和3D卷积的结合，模型能够充分利用海表面高度的历史时空信息，并在预测当前时间步的海表面高度值时获得更全面和准确的结果。这增强了模型对长期时间依赖的建模能力，提高了模型的预测性能。通过将多个时间步的海表面高度序列一起输入到模型中，能够提供更长的时间跨度，从而捕捉到更广泛的时间特征。这种多步信息输入策略允许模型在预测当前时间步的海表面高度值时，同时考虑之前海表面高度n个时间步的信息，从而更好地理解和利用海表面高度的历史时空演变规律。

进一步，为了有效地利用连续时间步的信息，本发明算法模型使用了3D卷积操作，其能够在时间、纬度和经度三个维度上有效提取特征，以充分挖掘海表面高度的历史时空信息。通过在三维空间中进行卷积操作，模型能够学习到海表面高度的时空特征表示，从而更准确地进行多步海表面高度时空预测。

步骤三，编码特征的循环预测

将步骤二中获得的海表面高度高维特征输入到循环预测器中，循环预测器将这些特征通过堆叠的记忆状态更新单元进行传递，以捕获海表面高度时空序列的长期时间依赖性和变化趋势，并有效缓解误差累积。

(1)记忆状态更新单元

如图3所示，本发明设计了记忆状态更新单元作为模型的核心构建单元，。该单元在ST-LSTM单元的基础上设计了原型校正模块，通过学习海表面高度样本的原型特征，提取时间域中的关键信息，并校正捕获的海表面高度高维时间特征，从而有效缓解误差的累积。

在处理时空数据时，记忆状态更新单元仍然利用ST-LSTM单元来捕获空间维度的相关信息。为了缓解模型无法充分挖掘时间域的变化特征而导致时间维度上的误差累积问题，原型校正模块利用原型特征来校正海表面高度的高维时间特征，以减小时间步上误差的累积效应。最终，通过融合机制将时间和空间信息结合起来，实现时空信息的统一建模，以促进海表面高度时空预测。

时间建模：首先，利用原型校正模块来校正前一时间步的标准时间记忆状态其次，基于当前层的输入状态X_t和前一时间步的隐藏状态/>利用3D卷积门结构提取当前时间步的海表面高度特征信息。最后，利用门结构生成当前时间步的标准时间记忆状态时间维度信息传递的过程可以用以下公式表示：

其中，PC(·)表示原型校正模块中的校正操作，σ是sigmoid激活函数，*和⊙分别表示3D卷积算子和哈达玛乘积，输入调制门g_t、输入门i_t和遗忘门f_t控制着标准时间记忆状态的信息流，W_xi和W_hi分别是输入门i_t中X_t和的权重，W_xg和W_hg分别是输入调制门g_t中X_t和/>的权重，W_xf和W_hf分别是遗忘门f_t中X_t和/>的权重，b_i、b_g和b_f分别是输入门i_t、输入调制门g_t和遗忘门f_t中的偏置量。

空间建模：首先，根据前一层的隐藏状态和空间域的空间记忆状态/>采用3D卷积门结构传递当前层的海表面高度变化信息。其次，利用该信息来校正前一层的空间记忆状态/>以生成新的空间记忆状态/>空间维度信息传递的过程可以用以下公式表示：

其中，输入门i′_t、输入调制门g′_t和遗忘门f′_t控制着空间记忆状态的信息流,W′_xi和W_mi分别是输入门i′_t中X_t和的权重，W′_xg和W_mg分别是输入调制门g′_t中X_t和/>的权重，W′_xf和W_mf分别是遗忘门f′_t中X_t和/>的权重，b′_i、b'_g和b'_f分别是输入门i′_t、输入调制门g′_t和遗忘门f′_t中的偏置量。

融合机制：记忆状态更新单元的融合机制采用共享输出门O_t，有效融合时空域的海表面高度记忆特征，从而生成最终的隐藏状态。该融合方法能够实现时空信息的统一建模，提高多步海表面高度时空序列的预测精度。融合机制最终生成后续记忆状态更新单元的输入或构建最终的预测帧可以用以下公式表示：

其中，表示将/>与/>按通道维度进行拼接，W_xo、W_ho、W_co和W_mo分别是输出门O_t中X_t、/>和/>的权重，W_1×1×1是用于通道数变换以匹配维度的1×1×1卷积，b_o是输出门O_t中的偏置量。

(2)原型校正模块

在记忆状态更新单元内，原型校正模块通过对所有时间步的标准时间记忆状态的共同特征进行建模，来校正在当前时间步输入到单元中的标准时间记忆状态该模块有效缓解了循环神经网络在多步预测过程中的严重误差累积问题。

具体来说，原型特征P被初始化为具有与相同维度的可学习参数的张量。原型特征在训练过程中不断地被更新，以学习所有时间步的标准时间记忆状态的共同特征，提取时间域的关键信息。通过学习所有时间步的统计特征，P能够提供一个全局的视角，帮助校正当前时间步输入到单元中的时间记忆状态/>然后，原型特征P与上一个时间步的标准时间记忆状态/>沿通道维度拼接起来，得到一个张量。该张量被输入到由3D卷积层组成的3DCNN网络中进行特征提取，并用于校正前一时间步的时间记忆状态/>此外，为了避免梯度消失或爆炸的问题，原型校正模块使用残差连接来防止有效信息丢失。原型校正模块中的校正过程可以用以下公式表示：

其中，是指原型特征P和时间记忆状态/>的拼接，/>是校正后的时间记忆状态，C_3DCNN表示3D CNN网络。

步骤四，特征解码及预测序列生成

将步骤三得到的循环张量输入到解码器中，采用与编码器相同组成的解码器，将循环预测器的输出张量转换为输出的目标张量，得到预测的海表面高度时空序列。

进一步，热带太平洋是地球上最大和最重要的海洋区域之一，具有重要的地理、气候和生态环境。了解该区域的海表面高度规律并预测未来的海表面高度不仅具有科学意义，而且对海洋经济、军事、工程等领域具有广泛的实用价值。此外，热带太平洋地区常常受到飓风、风暴潮和洪水等自然灾害的影响。研究热带太平洋海平面变化可以帮助科学家更好地评估和预测自然灾害的风险。本文选取热带太平洋地区的一个子区域作为研究区域，利用该区域的卫星遥感海表面高度时空序列来评估本发明算法模型的预测性能。

再进一步，本发明从哥白尼海洋环境监测服务下载了1993年1月1日至2020年12月31日热带太平洋海域对应的日平均海表面高度数据作为本文的数据集。在实验设置中，针对多步时空预测实验，数据集使用宽度为15帧的滑动窗口对连续图像进行切片，其中10个输入帧、5个预测帧。因此数据集总共被分为10174个序列，其中7138个序列用于训练，3061个序列用于测试。

再进一步，在实验中，所有模型的堆叠层数为4，滤波器尺寸为2×3×3，隐藏状态数为64。本发明算法和所有比较方法均在Pytorch框架下训练并通过Adam算法优化。采用MAE损失函数来优化模型，学习率设置为0.0001来调节模型的更新率1，每2500次迭代减少0.9倍。训练过程在80000次迭代后停止，每次迭代的批量大小为8。所有实验均在NvidiaGeForce GTX 3090GPU服务器上进行。

再进一步，为了评估本发明算法的预测性能，本发明将训练得到的模型与四种更先进的时空预测模型ConvLSTM、PredRNN、Self-AttentionConvLSTM和MLFrnn分别在热带太平洋海域进行多步时空预测实验，实验结果如图4所示。RMSE和MAE值越小，R越大，表明模型的预测误差越小，预测性能越好。在各种基于深度学习的时空预测方法中，本发明算法在每个时间步都优于所有其他模型。随着预测步长的增加，预测的难度随之增加，所有模型的预测误差也越大。定量分析结果表明，本发明算法利用原型来校正时间记忆状态，有效缓解了循环神经网络中的误差累积问题，提高了多步海表面高度时空预测性能。

Claims

1.一种基于原型校正的多步海表面高度时空预测算法，包括以下步骤：

(1)海表面高度数据预处理

(2)输入海表面高度时空序列获取编码特征

(3)编码特征的循环预测

(4)特征解码及预测序列生成

2.如权利要求1所述的一种基于原型校正的多步海表面高度时空预测算法，其特征在于：利用多步信息输入策略，使模型能够从更广泛的时间步长中获得更全面准确的上下文信息。

3.如权利要求1所述的一种基于原型校正的多步海表面高度时空预测算法，其特征在于：所述循环预测器由记忆状态更新单元堆叠而成。

4.如权利要求3所述的一种基于原型校正的多步海表面高度时空预测算法，其特征在于：记忆状态更新单元在ST-LSTM单元的基础上设计了原型校正模块，通过学习海表面高度样本的原型特征，提取时间域中的关键信息，并校正捕获的海表面高度高维时间特征，从而有效缓解误差的累积。

5.如权利要求4所述的一种基于原型校正的多步海表面高度时空预测算法，其特征在于：原型校正模块通过对所有时间步的标准时间记忆状态的共同特征进行建模，来校正在当前时间步输入到单元中的标准时间记忆状态，有效缓解了循环神经网络在多步预测过程中的严重误差累积问题。