CN117875493A - 一种基于原型校正的多步海表面高度时空预测算法 - Google Patents
一种基于原型校正的多步海表面高度时空预测算法 Download PDFInfo
- Publication number
- CN117875493A CN117875493A CN202410041069.2A CN202410041069A CN117875493A CN 117875493 A CN117875493 A CN 117875493A CN 202410041069 A CN202410041069 A CN 202410041069A CN 117875493 A CN117875493 A CN 117875493A
- Authority
- CN
- China
- Prior art keywords
- time
- sea surface
- surface height
- prediction
- prototype
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims abstract description 20
- 230000015654 memory Effects 0.000 claims abstract description 35
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000009825 accumulation Methods 0.000 claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims abstract description 10
- 230000008859 change Effects 0.000 claims abstract description 9
- 230000007774 longterm Effects 0.000 claims abstract description 8
- 238000013461 design Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000004927 fusion Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 230000000306 recurrent effect Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006886 spatial memory Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000006424 Flood reaction Methods 0.000 description 1
- 241000728173 Sarima Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能海洋学中的海洋信息预测领域,更具体地,涉及到一种基于原型校正的多步海表面高度时空预测算法。传统基于循环神经网络的时空预测模型在更新记忆状态时,旧的记忆状态会被立即刷新,模型无法有效保留时间序列的长期依赖关系和变化趋势,从而使预测误差随着预测步长的增加而严重累积。本发明所述的方法设计了原型校正时空网络,利用原型校正模块学习样本的原型特征,从而提取时间域中的关键信息,校正当前时间步的海表面高度特征,有效缓解多步预测中的严重误差积累问题;设计了多步信息输入策略,使模型能够从更广泛的时间步长中获得更全面准确的上下文信息。采用本发明所述的方法,极大地提高了多步海表面高度的时空预测精度。
Description
技术领域
本发明涉及人工智能海洋学中的海洋信息预测领域,更具体地,涉及到一种基于原型校正的多步海表面高度时空预测算法。
背景技术
海表面高度是指海洋表面相对于参考海平面的高度变化,是描述海洋动力学、气候变化和海洋生态系统的重要参数。准确的海表面高度预测可以为海洋气象、海洋资源开发、航运、渔业等相关领域提供重要的信息和决策支持。海洋是一个连续动态的时空信息载体,海表面高度数据具有时间关联性、空间关联性和时空依赖性等特征。如何综合考虑不同时间跨度和不同空间范围的多尺度时空信息,以更准确地捕捉海表面高度的时序特征和空间特征,实现准确的多步海表面高度时空预测,是海洋预测领域亟待解决的问题。
海表面高度预测方法通常可分为数值分析方法和数据驱动方法。数值分析方法利用海洋数学模型进行数值预报,可以准确地模拟海洋气象等相关现象。然而,先前研究已经证明了传统的数值分析方法在模拟复杂的自然现象时会受到限制。相比之下,数据驱动方法通过对充足的数据集进行训练,可以有效提取深藏在时空序列中的复杂规则,为复杂海洋现象的分析和预测提供新的机会。
深度学习作为一种数据驱动方法,以其强大的大数据挖掘分析能力已被广泛应用于海洋预测领域。在深度学习中,循环神经网络及其变体特别擅长通过提取隐藏在数据中的底层时间模式来处理时间序列数据。Braakmann-Folgmann等人[1]采用由循环神经网络和卷积神经网络组成的混合架构分别从时间和空间维度分析和预测海表面高度的变化模式。Sun等人[2]将长短期记忆模型与季节性自回归移动平均模型相结合,实现了对中国海海平面异常的高精度预测。Liu等人[3]提出长短期记忆模型与注意力机制相结合的深度学习模型,实现了可靠且高性能的海表面高度预测。Zhou等人[4]开发了多层融合循环神经网络模型来挖掘海表面高度的时空信息,实现了准确的海表面高度时空预测。
然而,以往基于循环神经网络的多步海表面高度预测方法一直面临着一个严峻的挑战,即模型在更新记忆状态时,旧的记忆状态会被立即刷新,无法有效地保留时间序列的长期依赖关系和变化趋势。这导致在多步海表面高度预测中,模型无法充分挖掘时间域的重要特征,先前时间步长的时空信息急剧恶化,从而使预测误差随着预测步长的增加而严重累积。
参考文献:
[1]Braakmann-Folgmann A,Roscher R,Wenzel S,et al.Sea level anomalyprediction using recurrent neural networks[J].arXiv preprint arXiv:1710.07099,2017.
[2]Sun Q,Wan J,Liu S.Estimation of sea level variability in the ChinaSea and its vicinity using the SARIMA and LSTM models[J].IEEE Journal ofSelected Topics in Applied Earth Observations and Remote Sensing,2020,13:3317-3326.
[3]Liu J,Jin B,Wang L,et al.Sea surface height prediction with deeplearning based on attention mechanism[J].IEEE Geoscience and Remote SensingLetters,2020.
[4]Zhou Y,Lu C,Chen K,et al.Multilayer fusion recurrent neuralnetwork for sea surface height anomaly field prediction[J].IEEE Transactionson Geoscience and Remote Sensing,2021,60:1-11.
发明内容
针对现有技术中存在的缺陷,本发明的目的是学习一种多步海表面高度时空预测器,该预测器可以有效缓解循环神经网络在多步预测过程中的严重误差累积问题,实现海表面高度时空序列的准确多步时空预测。
为达到以上目的,本发明采用的技术方案是:一种基于原型校正的多步海表面高度时空预测算法,本发明通过学习海表面高度样本的原型特征,提取时间域中的关键信息,并校正捕获的海表面高度高维时间特征,从而有效缓解误差的累积,包括以下步骤:
(1)海表面高度数据预处理
对卫星观测海表面高度数据进行归一化处理,利用滑动窗口构建海表面高度时空序列。
(2)输入海表面高度时空序列获取编码特征
在每个时间步,利用多步信息输入策略将步骤(1)得到的过去及当前共n个时刻的海表面高度时空序列输入到由多层3D卷积组成的编码器中,提取海表面高度时空序列的高维特征。
(3)编码特征的循环预测
将步骤(2)中获得的海表面高度高维特征输入到循环预测器中,循环预测器将这些特征通过堆叠的记忆状态更新单元进行传递,以捕获海表面高度时空序列的长期时间依赖性和变化趋势,并有效缓解误差累积。
(4)特征解码及预测序列生成
将步骤(3)得到的循环张量输入到解码器中,采用与编码器相同组成的解码器,将循环预测器的输出张量转换为输出的目标张量,得到预测的海表面高度时空序列。
本发明设计的算法采用编码器-解码器结构,主要包括五个部分:输入、编码器、循环预测器、解码器和输出。首先,由多层3D卷积组成的编码器,从历史海表面高度时空序列中提取海表面高度的高维特征。其次,循环预测器将这些海表面高度特征通过堆叠的记忆状态更新单元传递,以捕获长期时空依赖性,并有效缓解误差累积。最后,采用与编码器相同组成的解码器,将循环预测器的输出张量转换为输出目标张量。与现有技术相比,本发明的效果在于极大地提高了多步海表面高度时空预测的准确率。
附图说明
图1是本发明的训练阶段流程图;
图2是本发明的网络结构图;
图3是本发明所述的记忆状态更新单元;
图4是本发明在测试集中与现有先进网络的性能比较(粗体最优)。
具体实施方式
为使本发明的技术方案更加清楚,下面结合附图对本发明做进一步阐述。本发明按以下步骤具体实现:
步骤一,海表面高度数据预处理
对卫星观测海表面高度数据进行归一化处理,利用滑动窗口构建海表面高度时空序列。
具体地,为了加快模型的训练速度,对海表面高度数据进行最大、最小标准化,将所有数据标准化到[0,1],公式如下:
其中,x′是归一化后的海表面高度,x是实际观测的海表面高度,xmin是实际观测海表面高度的最小值,xmax是实际观测海表面高度的最大值。
针对多步时空预测实验,数据集使用宽度为15帧的滑动窗口对连续图像进行切片,其中10个输入帧、5个预测帧。
步骤二,输入海表面高度时空序列获取编码特征
在每个时间步,利用多步信息输入策略将步骤一得到的过去及当前共n个时刻的海表面高度时空序列输入到由多层3D卷积组成的编码器中,提取海表面高度时空序列的高维特征。
具体地,为了获得更丰富的时间信息并增强模型对长期时间依赖性的感知能力,本发明提出了一种多步信息输入策略,以扩大模型的时间感受野。传统的循环神经网络模型在每个时间步只输入当前时间步的海表面高度来预测下一个时间步的海表面高度。本发明算法模型在每个时间步输入n个连续时间步的海表面高度序列,并利用3D卷积来充分挖掘海表面高度的历史时空信息。通过这种多步信息输入策略和3D卷积的结合,模型能够充分利用海表面高度的历史时空信息,并在预测当前时间步的海表面高度值时获得更全面和准确的结果。这增强了模型对长期时间依赖的建模能力,提高了模型的预测性能。通过将多个时间步的海表面高度序列一起输入到模型中,能够提供更长的时间跨度,从而捕捉到更广泛的时间特征。这种多步信息输入策略允许模型在预测当前时间步的海表面高度值时,同时考虑之前海表面高度n个时间步的信息,从而更好地理解和利用海表面高度的历史时空演变规律。
进一步,为了有效地利用连续时间步的信息,本发明算法模型使用了3D卷积操作,其能够在时间、纬度和经度三个维度上有效提取特征,以充分挖掘海表面高度的历史时空信息。通过在三维空间中进行卷积操作,模型能够学习到海表面高度的时空特征表示,从而更准确地进行多步海表面高度时空预测。
步骤三,编码特征的循环预测
将步骤二中获得的海表面高度高维特征输入到循环预测器中,循环预测器将这些特征通过堆叠的记忆状态更新单元进行传递,以捕获海表面高度时空序列的长期时间依赖性和变化趋势,并有效缓解误差累积。
(1)记忆状态更新单元
如图3所示,本发明设计了记忆状态更新单元作为模型的核心构建单元,。该单元在ST-LSTM单元的基础上设计了原型校正模块,通过学习海表面高度样本的原型特征,提取时间域中的关键信息,并校正捕获的海表面高度高维时间特征,从而有效缓解误差的累积。
在处理时空数据时,记忆状态更新单元仍然利用ST-LSTM单元来捕获空间维度的相关信息。为了缓解模型无法充分挖掘时间域的变化特征而导致时间维度上的误差累积问题,原型校正模块利用原型特征来校正海表面高度的高维时间特征,以减小时间步上误差的累积效应。最终,通过融合机制将时间和空间信息结合起来,实现时空信息的统一建模,以促进海表面高度时空预测。
时间建模:首先,利用原型校正模块来校正前一时间步的标准时间记忆状态其次,基于当前层的输入状态Xt和前一时间步的隐藏状态/>利用3D卷积门结构提取当前时间步的海表面高度特征信息。最后,利用门结构生成当前时间步的标准时间记忆状态时间维度信息传递的过程可以用以下公式表示:
其中,PC(·)表示原型校正模块中的校正操作,σ是sigmoid激活函数,*和⊙分别表示3D卷积算子和哈达玛乘积,输入调制门gt、输入门it和遗忘门ft控制着标准时间记忆状态的信息流,Wxi和Whi分别是输入门it中Xt和的权重,Wxg和Whg分别是输入调制门gt中Xt和/>的权重,Wxf和Whf分别是遗忘门ft中Xt和/>的权重,bi、bg和bf分别是输入门it、输入调制门gt和遗忘门ft中的偏置量。
空间建模:首先,根据前一层的隐藏状态和空间域的空间记忆状态/>采用3D卷积门结构传递当前层的海表面高度变化信息。其次,利用该信息来校正前一层的空间记忆状态/>以生成新的空间记忆状态/>空间维度信息传递的过程可以用以下公式表示:
其中,输入门i′t、输入调制门g′t和遗忘门f′t控制着空间记忆状态的信息流,W′xi和Wmi分别是输入门i′t中Xt和的权重,W′xg和Wmg分别是输入调制门g′t中Xt和/>的权重,W′xf和Wmf分别是遗忘门f′t中Xt和/>的权重,b′i、b'g和b'f分别是输入门i′t、输入调制门g′t和遗忘门f′t中的偏置量。
融合机制:记忆状态更新单元的融合机制采用共享输出门Ot,有效融合时空域的海表面高度记忆特征,从而生成最终的隐藏状态。该融合方法能够实现时空信息的统一建模,提高多步海表面高度时空序列的预测精度。融合机制最终生成后续记忆状态更新单元的输入或构建最终的预测帧可以用以下公式表示:
其中,表示将/>与/>按通道维度进行拼接,Wxo、Who、Wco和Wmo分别是输出门Ot中Xt、/>和/>的权重,W1×1×1是用于通道数变换以匹配维度的1×1×1卷积,bo是输出门Ot中的偏置量。
(2)原型校正模块
在记忆状态更新单元内,原型校正模块通过对所有时间步的标准时间记忆状态的共同特征进行建模,来校正在当前时间步输入到单元中的标准时间记忆状态该模块有效缓解了循环神经网络在多步预测过程中的严重误差累积问题。
具体来说,原型特征P被初始化为具有与相同维度的可学习参数的张量。原型特征在训练过程中不断地被更新,以学习所有时间步的标准时间记忆状态的共同特征,提取时间域的关键信息。通过学习所有时间步的统计特征,P能够提供一个全局的视角,帮助校正当前时间步输入到单元中的时间记忆状态/>然后,原型特征P与上一个时间步的标准时间记忆状态/>沿通道维度拼接起来,得到一个张量。该张量被输入到由3D卷积层组成的3DCNN网络中进行特征提取,并用于校正前一时间步的时间记忆状态/>此外,为了避免梯度消失或爆炸的问题,原型校正模块使用残差连接来防止有效信息丢失。原型校正模块中的校正过程可以用以下公式表示:
其中,是指原型特征P和时间记忆状态/>的拼接,/>是校正后的时间记忆状态,C3DCNN表示3D CNN网络。
步骤四,特征解码及预测序列生成
将步骤三得到的循环张量输入到解码器中,采用与编码器相同组成的解码器,将循环预测器的输出张量转换为输出的目标张量,得到预测的海表面高度时空序列。
进一步,热带太平洋是地球上最大和最重要的海洋区域之一,具有重要的地理、气候和生态环境。了解该区域的海表面高度规律并预测未来的海表面高度不仅具有科学意义,而且对海洋经济、军事、工程等领域具有广泛的实用价值。此外,热带太平洋地区常常受到飓风、风暴潮和洪水等自然灾害的影响。研究热带太平洋海平面变化可以帮助科学家更好地评估和预测自然灾害的风险。本文选取热带太平洋地区的一个子区域作为研究区域,利用该区域的卫星遥感海表面高度时空序列来评估本发明算法模型的预测性能。
再进一步,本发明从哥白尼海洋环境监测服务下载了1993年1月1日至2020年12月31日热带太平洋海域对应的日平均海表面高度数据作为本文的数据集。在实验设置中,针对多步时空预测实验,数据集使用宽度为15帧的滑动窗口对连续图像进行切片,其中10个输入帧、5个预测帧。因此数据集总共被分为10174个序列,其中7138个序列用于训练,3061个序列用于测试。
再进一步,在实验中,所有模型的堆叠层数为4,滤波器尺寸为2×3×3,隐藏状态数为64。本发明算法和所有比较方法均在Pytorch框架下训练并通过Adam算法优化。采用MAE损失函数来优化模型,学习率设置为0.0001来调节模型的更新率1,每2500次迭代减少0.9倍。训练过程在80000次迭代后停止,每次迭代的批量大小为8。所有实验均在NvidiaGeForce GTX 3090GPU服务器上进行。
再进一步,为了评估本发明算法的预测性能,本发明将训练得到的模型与四种更先进的时空预测模型ConvLSTM、PredRNN、Self-AttentionConvLSTM和MLFrnn分别在热带太平洋海域进行多步时空预测实验,实验结果如图4所示。RMSE和MAE值越小,R越大,表明模型的预测误差越小,预测性能越好。在各种基于深度学习的时空预测方法中,本发明算法在每个时间步都优于所有其他模型。随着预测步长的增加,预测的难度随之增加,所有模型的预测误差也越大。定量分析结果表明,本发明算法利用原型来校正时间记忆状态,有效缓解了循环神经网络中的误差累积问题,提高了多步海表面高度时空预测性能。
Claims (5)
1.一种基于原型校正的多步海表面高度时空预测算法,包括以下步骤:
(1)海表面高度数据预处理
对卫星观测海表面高度数据进行归一化处理,利用滑动窗口构建海表面高度时空序列。
(2)输入海表面高度时空序列获取编码特征
在每个时间步,利用多步信息输入策略将步骤(1)得到的过去及当前共n个时刻的海表面高度时空序列输入到由多层3D卷积组成的编码器中,提取海表面高度时空序列的高维特征。
(3)编码特征的循环预测
将步骤(2)中获得的海表面高度高维特征输入到循环预测器中,循环预测器将这些特征通过堆叠的记忆状态更新单元进行传递,以捕获海表面高度时空序列的长期时间依赖性和变化趋势,并有效缓解误差累积。
(4)特征解码及预测序列生成
将步骤(3)得到的循环张量输入到解码器中,采用与编码器相同组成的解码器,将循环预测器的输出张量转换为输出的目标张量,得到预测的海表面高度时空序列。
2.如权利要求1所述的一种基于原型校正的多步海表面高度时空预测算法,其特征在于:利用多步信息输入策略,使模型能够从更广泛的时间步长中获得更全面准确的上下文信息。
3.如权利要求1所述的一种基于原型校正的多步海表面高度时空预测算法,其特征在于:所述循环预测器由记忆状态更新单元堆叠而成。
4.如权利要求3所述的一种基于原型校正的多步海表面高度时空预测算法,其特征在于:记忆状态更新单元在ST-LSTM单元的基础上设计了原型校正模块,通过学习海表面高度样本的原型特征,提取时间域中的关键信息,并校正捕获的海表面高度高维时间特征,从而有效缓解误差的累积。
5.如权利要求4所述的一种基于原型校正的多步海表面高度时空预测算法,其特征在于:原型校正模块通过对所有时间步的标准时间记忆状态的共同特征进行建模,来校正在当前时间步输入到单元中的标准时间记忆状态,有效缓解了循环神经网络在多步预测过程中的严重误差累积问题。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410041069.2A CN117875493A (zh) | 2024-01-11 | 2024-01-11 | 一种基于原型校正的多步海表面高度时空预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410041069.2A CN117875493A (zh) | 2024-01-11 | 2024-01-11 | 一种基于原型校正的多步海表面高度时空预测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117875493A true CN117875493A (zh) | 2024-04-12 |
Family
ID=90589779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410041069.2A Pending CN117875493A (zh) | 2024-01-11 | 2024-01-11 | 一种基于原型校正的多步海表面高度时空预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117875493A (zh) |
-
2024
- 2024-01-11 CN CN202410041069.2A patent/CN117875493A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112232543B (zh) | 一种基于图卷积网络的多站点预测方法 | |
CN111784041A (zh) | 一种基于图卷积神经网络的风电功率预测方法及系统 | |
CN112561058A (zh) | 基于Stacking-集成学习短期光伏功率预测方法 | |
CN114549925A (zh) | 一种基于深度学习的海浪有效波高时间序列预测方法 | |
CN112541613B (zh) | 一种基于遥感数据的多层ConvLSTM海表面温度预测计算方法 | |
CN116090602A (zh) | 一种用电负荷预测方法及系统 | |
CN110570035A (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
CN115409258A (zh) | 一种混合深度学习短期辐照度预测方法 | |
CN114399073A (zh) | 一种基于深度学习的海洋表面温度场预测方法 | |
CN113671421A (zh) | 一种变压器状态评估与故障预警方法 | |
CN117394306A (zh) | 基于新能源并网的风电功率预测模型建立方法及其应用 | |
Niu et al. | De-Trend First, Attend Next: A Mid-Term PV forecasting system with attention mechanism and encoder–decoder structure | |
CN117576910A (zh) | 一种基于循环时空注意力机制的交通流量预测方法 | |
Wang et al. | An quality prediction model based on CNN-BiNLSTM-attention | |
CN114881358A (zh) | 一种基于自适应动态图神经网络的空气质量预测方法 | |
Wei et al. | Deterministic ship roll forecasting model based on multi-objective data fusion and multi-layer error correction | |
CN113947235A (zh) | 一种基于深度全天图像学习的光伏发电预测混合方法 | |
CN117391139A (zh) | 基于改进UNet神经网络的天气现象预报订正方法 | |
CN117371331A (zh) | 基于kddin的航空发动机剩余寿命预测方法 | |
CN117374926A (zh) | 一种联合优化预测光伏功率的方法、系统、设备及介质 | |
Fu et al. | Prediction and analysis of sea surface temperature based on LSTM-transformer model | |
CN115936185B (zh) | 基于dcnn-lstm-ae-am的短期电力负荷和碳排放量预测方法及系统 | |
CN112270123A (zh) | 一种基于卷积生成对抗网络的流域水库群径流随机生成方法 | |
CN117875493A (zh) | 一种基于原型校正的多步海表面高度时空预测算法 | |
CN116630113A (zh) | 一种基于scc-rce预测单元的预测网络及网格化pm2.5浓度预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |