CN117114168A - 一种长时间尺度的海面温度智能预报方法 - Google Patents
一种长时间尺度的海面温度智能预报方法 Download PDFInfo
- Publication number
- CN117114168A CN117114168A CN202310904711.0A CN202310904711A CN117114168A CN 117114168 A CN117114168 A CN 117114168A CN 202310904711 A CN202310904711 A CN 202310904711A CN 117114168 A CN117114168 A CN 117114168A
- Authority
- CN
- China
- Prior art keywords
- data
- sea surface
- surface temperature
- pcs
- forecasting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013277 forecasting method Methods 0.000 title claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000000354 decomposition reaction Methods 0.000 claims description 25
- 238000005370 electroosmosis Methods 0.000 claims description 23
- 239000013388 element-organic framework Substances 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 22
- 238000012360 testing method Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 230000001932 seasonal effect Effects 0.000 claims description 5
- 238000010792 warming Methods 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000011160 research Methods 0.000 abstract description 7
- 230000032683 aging Effects 0.000 abstract description 4
- 230000007774 longterm Effects 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 238000011156 evaluation Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Fuzzy Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于海洋信息技术领域,本发明涉及一种长时间尺度的海面温度智能预报方法。包括数据预处理、预报模型的构建与训练、温度的预测与评估步骤。本发明通过EOF分析建立了研究区域不同离散点之间的空间相关性,提取主要的空间正交模态信息,减少计算工作量;CEEMDAN具有很强的处理非线性的能力,增加了PC的可预测性,延长了预报时效;LSTM神经网络方法的应用,高效挖掘了数据中的信息,与传统数值模式相比,不受参数选择和计算平台的限制;本发明的混合模型实现了南海海面温度50天的长期预报,脱离海洋数值预报受气象驱动时效10天左右的限制,大幅提高了海洋变量预报时效,具有广泛的应用前景。
Description
技术领域
本发明属于海洋信息技术领域,本发明涉及一种长时间尺度的海面温度智能预报方法。
背景技术
海面温度(Sea surface temperature,SST)不仅是用于描述海洋表层热状况的主要指标,而且海表面温度异常(Sea surface temperature anomaly,SSTA)还是海洋影响大气环流和气候变化的重要因子。所以,海面温度一直是人们观测、研究和预报的重点对象。且随着卫星技术和数值模式的不断发展,大量的表层海洋遥感实时资料,结合日益成熟的高时空分辨率的数值模式结果和大范围的现场观测数据,基于大数据的预报研究逐渐成为研究的热点之一。
常用的海洋要素传统预测方法如人工经验和数值模型,这些方法受参数设置和人类认知程度的影响较大,且复杂的海洋过程不能通过复杂的公式和繁琐的计算获得较好的结果。在大数据背景下,基于人工智能的纯数据驱动海洋信息来构建复杂海洋现象的模型与预报方法逐渐成为热门,具有广阔的应用前景。人工神经网络是最受欢迎和最有影响力的模型之一,由于其灵活性和强大的非线性处理能力而被广泛应用。将神经网络应用于海洋大数据的预测研究,是将新一代技术与海洋现象预测应用相结合,拓展人工智能等关键技术在海洋中应用的重要方法。
目前,智能预报方法己经应用于海洋要素预测中。其预测方法主要分为两类,一类是将海洋中每一个空间格点看作是孤立的,通过挖掘时间序列中的有用信息来实现预测。这种模型考虑了不同格点的差异性,但每个格点需要足够的训练数据,计算成本很高。另一类是可以考虑空间相关性,但预测时效较短。
发明内容
为了克服现有技术的不足,本发明提供一种长时间尺度的海面温度智能预报方法,基于传统的经验正交函数分析(Empirical orthogonal function,EOF)、自适应噪声完全集合经验模态分解(Complete ensemble empirical mode decomposition withadaptive noise,CEEMDAN)结合长短时记忆神经网络(Long short-term memory,LSTM),开发纯海洋数据驱动的混合模型(EOF-CEEMDAN-LSTM),目的是实现南海海面温度的长期预报。
本发明的上述目的是通过以下技术方案实现的:一种长时间尺度的海面温度智能预报方法,其特征是,包括以下步骤:
S1.数据预处理:基于高分辨率卫星遥感融合最优插值的海表面温度资料,剔除季节信号和全球变暖趋势后,得到逐日海表面温度距平矩阵,作为后续分析的样本矩阵;
S2.预报模型的构建与训练:首先,对数据矩阵采用EOF,得到空间模态EOFs和相应的主成分PCs;然后,对主成分PCs进行CEEMDAN分解,得到CEEMDAN衍生的PCs作为后续输入;最后,使用LSTM神经网络方法对衍生的PCs进行训练与验证;
S3.温度的预测与评估:将混合模型预测出的的PCs与第二步中的EOFs相结合,得到预测的温度矩阵;采用均方根误差RMSE和空间距平相关系数ACC评估模型预报效果。
所述数据预处理,具体包括以下步骤:
基于卫星融合最优插值的南海海域海表面温度数据集,时间范围为1982年1月1日到开始预测时,空间分辨率为0.25°;将数据集分为训练集、验证集和测试集,选取前80%的年限数据进行训练,剩下后20%的年限数据用于验证和测试;最后,剔除季节信号和全球变暖趋势后,得到逐日海表面温度距平矩阵,作为后续分析的样本矩阵。
所述剩下后20%的年限数据用于验证和测试中,选择最远的1年数据作为验证期,其余年用于测试和评判模型标准。
所述预报模型的构建与训练,具体包括以下步骤:
S21.经验正交函数分析
将海面温度数据集以矩阵形式给出:
其中,m为空间格点个数,n为时间序列长度或样本数;在海洋学中,更多的研究海表面温度异常,故需减去气候态:
其中,为气候态;X即为后续研究的数据矩阵;求其协方差矩阵为:
计算协方差矩阵的特征根和特征向量:
CV=VΛ (4)
其中,Λ=diag(λ1,...,λm),V为空间模态,时间系数PC=VT×X;
对训练集数据进行EOF,获得空间模态EOFs和时间系数PCs,当累积方差达到98%时,认为重构数据足以保留原始数据的主要特征;假设可以认为时间序列是平稳的,训练数据量足够大,将测试集投影到上述EOFs生成相应的伪PCs,用于验证预测结果;
S22.自适应噪声完全集合经验模态分解
设Ej(.)为经过CEEMDAN分解后的第j个本征模态分量,wi(t)为满足标准正态分布的高斯白噪声信号,i=1,2,…l为加入白噪声次数,∈0为噪声系数;x(t)为待分解的信号;在原始时间序列数据中加入白噪声得到新信号:
Xi(t)=x(t)+∈0wi(t) (5)对产生的模态分量进行总体平均就得到了CEEMDAN分解的第一个本征模态分量:
然后计算去除第一个模态分量后的残差:
在R1(t)中加入正负成对的高斯白噪声得到新信号R1(t)+ε1E1(wi(t)),以新信号为载体进行分解,得到CEEMDAN分解的第二个本征模态分量:
重复上述步骤,直到获得到残差信号为单调函数,不能继续分解,最终残差为:
将预报模型的构建与训练中方差占比为98%的PCs进行CEEMDAN分解,得到CEEMDAN衍生的PCs,其中每个PC由多个本征模态函数和残差组成,作为下一步神经网络的输入;
S23.长短时记忆神经网络
LSTM网络的控制数学方程如下:
ft=σ(Wf[ht-1,xt]+bf) ((10)
it=σ(Wi·[ht-1,xt]+bi) (11)
ot=σ(Wo·[ht-1,xt]+bo) (12)
Ct=ft*Ct-1+it*tan h(Ct) (14)
ht=ot*tanh(Ct) (15)
其中,ht和Ct为隐藏层向量,xt为输入向量,bf,bi,bc和bo为偏差向量,Wf,Wi,Wc和Wo为权重矩阵,σ为激活函数;
使用的LSTM网络基于Keras进行搭建,并通过python3.9编程实现,设定神经网络模块由一层输入层,一层LSTM层和一层全连接层组成,LSTM层神经元个数为16,所有层激活函数为“ReLU”函数,采用此网络对CEEMDAN衍生的PCs进行训练和验证;至此,EOF-CEEMDAN-LSTM混合模型搭建完毕。
所述温度的预测与评估,具体包括以下步骤:
使用上述训练好的EOF-CEEMDAN-LSTM混合模型,得到预测的PCs,与S21中的EOFs相结合,得到重构的SSTA,将剩下的2%的方差通过惯性预报的方式对重构的SSTA进行订正,完成了对海面温度的预报过程;采用RMSE和ACC评估模型预报效果,计算公式如下:
其中,RMSE表示第i个网格点的均方根误差值,ACC表示第j天所有网格点的空间异常相关系数,XP和XT为第i个网格点第j天的预测值和真实值,M为网格点数,N为时间序列的长度;混合模型预测在第五十天的RMSE和ACC分别为0.47℃和64%。
本发明与现有技术相比的有益效果是:
(1)EOF分析建立了研究区域不同离散点之间的空间相关性,提取主要的空间正交模态信息,减少计算工作量。此外,由于EOF分析的正交特性,不同PC之间正交,说明对每个PC进行单独预测是可行的。
(2)CEEMDAN具有很强的处理非线性的能力,增加了PC的可预测性,延长了预报时效。
(3)LSTM神经网络方法的应用,高效挖掘了数据中的信息,与传统数值模式相比,不受参数选择和计算平台的限制。
(4)本发明的混合模型实现了南海海面温度50天的长期预报,脱离海洋数值预报受气象驱动时效10天左右的限制,大幅提高了海洋变量预报时效,具有广泛的应用前景。
附图说明
图1为一种长时间尺度的海面温度智能预报方法流程图。
图2为本发明EOF-CEEMDAN-LSTM模型均方根误差(℃)图,其中黑色虚线为气候态。
图3为本发明EOF-CEEMDAN-LSTM模型空间距平相关系数图,其中黑色虚线为有效值0.6。
图4为本发明EOF-CEEMDAN-LSTM模型海面温度预报时效为50天的对比图,其中(a)为真实场,(b)为预报场。
具体实施方式
下面通过附图与具体实施例详述本发明,但不限制本发明的保护范围。
实施例
如图1所示,一种长时间尺度的海面温度智能预报方法,包括以下步骤:
S1.数据预处理:基于卫星融合最优插值的南海海域海表面温度数据集,时间范围为1982年1月1日到2021年12月31日,空间分辨率为0.25°;将数据集分为训练集(1982年1月1日到2013年12月31日)、验证集(2014年1月1日到2014年12月31日)和测试集(2015年1月1日到2021年12月31日),选取了前80%的数据进行训练,一是保证了足够多的训练数据,二是模态分解也达到稳定,剩下20%的数据用于验证和测试。1年的验证期可以提高模式运行效率,最后7年用于测试和评判模型标准。最后,剔除季节信号和全球变暖趋势后,得到逐日海表面温度距平矩阵,作为后续分析的样本矩阵;
S2.预报模型的构建与训练:首先,对数据矩阵采用EOF,得到空间模态EOFs和相应的主成分PCs;然后,对主成分PCs进行CEEMDAN分解,得到CEEMDAN衍生的PCs作为后续输入;最后,使用LSTM神经网络方法对衍生的PCs进行训练与验证;具体包括以下步骤:
S21.经验正交函数分析
经验正交函数分析方法,最早由统计学家Pearson在1902年提出,Lorenz在20世纪50年代首次将其引入气象和气候研究,它是一种常用的变量场分解方法,目前在海洋科学的研究中应用广泛。这种方法能对分布不规则的气象要素场进行时空分解,得到的各特征向量相互正交,空间模态在一定程度上可反映要素场的空间分布特点,而时间系数反映相应空间模态随时间的权重变化。
将海面温度数据集以矩阵形式给出:
其中,m为空间格点个数,n为时间序列长度或样本数;在海洋学中,更多的研究海表面温度异常,故需减去气候态:
其中,为气候态;X即为后续研究的数据矩阵;求其协方差矩阵为:
计算协方差矩阵的特征根和特征向量:
CV=VΛ (4)
其中,Λ=diag(λ1,...,λm),V为空间模态,时间系数PC=VT×X;
本发明对训练集数据进行EOF,获得空间模态EOFs和时间系数PCs,实现数据降维,加快计算速度,提高混合算法的效率,且当累积方差达到98%时,认为重构数据足以保留原始数据的主要特征;假设可以认为时间序列是平稳的,训练数据量足够大,将测试集投影到上述EOFs生成相应的伪PCs,用于验证预测结果;
S22.自适应噪声完全集合经验模态分解
CEEMDAN是由EMD、EEMD和CEEMD发展而来的。这些基于EMD的方法可以自适应地将原始数据分解为多个具有不同频率和尺度的本征模态函数和一个残差。CEEMDAN不仅解决了EMD的模态混叠问题,还有效地解决了EEMD和CEEMD白噪声从高频到低频的转移传递问题。
设Ej(.)为经过CEEMDAN分解后的第j个本征模态分量,wi(t)为满足标准正态分布的高斯白噪声信号,i=1,2,…l为加入白噪声次数,∈0为噪声系数;x(t)为待分解的信号;在原始时间序列数据中加入白噪声得到新信号:
Xi(t)=x(t)+∈0wi(t) (5)
对产生的模态分量进行总体平均就得到了CEEMDAN分解的第一个本征模态分量:
然后计算去除第一个模态分量后的残差:
在R1(t)中加入正负成对的高斯白噪声得到新信号R1(t)+ε1E1(wi(t)),以新信号为载体进行分解,得到CEEMDAN分解的第二个本征模态分量:
重复上述步骤,直到获得到残差信号为单调函数,不能继续分解,最终残差为:
将预报模型的构建与训练中方差占比为98%的PCs进行CEEMDAN分解,得到CEEMDAN衍生的PCs,其中每个PC由多个本征模态函数和残差组成,作为下一步神经网络的输入;
S23.长短时记忆神经网络
LSTM是递归神经网络(Recurrent neural network,RNN)的一种变体,主要用于解决长序列训练过程中的梯度消失和梯度爆炸问题。LSTM的核心是细胞状态,通过三个门(遗忘门、输入门和输出门)对细胞状态进行删除或者添加信息,用于保护和控制细胞状态。LSTM网络在每个单元中都有门控机制,通过门控状态来控制传输状态。LSTM网络的控制数学方程如下:
ft=σ(Wf·[ht-1,xt]+bf) (10)
it=σ(Wi·[ht-1,xt]+bi) (11)
ot=σ(Wo·[ht-1,xt]+bo) (12)
Ct=ft*Ct-1+it*tan h(Ct) (14)
ht=ot*tanh(Ct) (15)
其中,ht和Ct为隐藏层向量,xt为输入向量,bf,bi,bc和bo为偏差向量,Wf,Wi,Wc和Wo为权重矩阵,σ为激活函数;
使用的LSTM网络基于Keras进行搭建,并通过python3.9编程实现,设定神经网络模块由一层输入层,一层LSTM层和一层全连接层组成,LSTM层神经元个数为16,所有层激活函数为“ReLU”函数,采用此网络对CEEMDAN衍生的PCs进行训练和验证;至此,EOF-CEEMDAN-LSTM混合模型搭建完毕;
S3.温度的预测与评估:使用上述训练好的EOF-CEEMDAN-LSTM混合模型,得到预测的PCs,与S21中的EOFs相结合,得到重构的SSTA,将剩下的2%的方差通过惯性预报的方式对重构的SSTA进行订正,完成了对海面温度的预报过程;采用RMSE和ACC评估模型预报效果,计算公式如下:
其中,RMSE表示第i个网格点的均方根误差值,ACC表示第j天所有网格点的空间异常相关系数,XP和XT为第i个网格点第j天的预测值和真实值,M为网格点数,N为时间序列的长度;混合模型预测在第五十天的RMSE和ACC分别为0.47℃和64%。
以上所述实施方式仅为本发明的优选实施例,而并非本发明可行实施的全部实施例。对于本领域一般技术人员而言,在不背离本发明原理和精神的前提下对其所作出的任何显而易见的改动,都应当被认为包含在本发明的权利要求保护范围之内。
Claims (5)
1.一种长时间尺度的海面温度智能预报方法,其特征是,包括以下步骤:
S1.数据预处理:基于高分辨率卫星遥感融合最优插值的海表面温度资料,剔除季节信号和全球变暖趋势后,得到逐日海表面温度距平矩阵,作为后续分析的样本矩阵;
S2.预报模型的构建与训练:首先,对数据矩阵采用EOF,得到空间模态EOFs和相应的主成分PCs;然后,对主成分PCs进行CEEMDAN分解,得到CEEMDAN衍生的PCs作为后续输入;最后,使用LSTM神经网络方法对衍生的PCs进行训练与验证;
S3.温度的预测与评估:将混合模型预测出的PCs与第二步中的EOFs相结合,得到预测的温度矩阵;采用均方根误差RMSE和空间距平相关系数ACC评估模型预报效果。
2.根据权利要求1所述的一种长时间尺度的海面温度智能预报方法,其特征是,所述数据预处理,具体包括以下步骤:
基于卫星融合最优插值的南海海域海表面温度数据集,时间范围为1982年1月1日到开始预测时,空间分辨率为0.25°;将数据集分为训练集、验证集和测试集,选取前80%的年限数据进行训练,剩下后20%的年限数据用于验证和测试;最后,剔除季节信号和全球变暖趋势后,得到逐日海表面温度距平矩阵,作为后续分析的样本矩阵。
3.根据权利要求2所述的一种长时间尺度的海面温度智能预报方法,其特征是,所述剩下后20%的年限数据用于验证和测试中,选择最远的1年数据作为验证期,其余年用于测试和评判模型标准。
4.根据权利要求1所述的一种长时间尺度的海面温度智能预报方法,其特征是,所述预报模型的构建与训练,具体包括以下步骤:
S21.经验正交函数分析
将海面温度数据集以矩阵形式给出:
其中,m为空间格点个数,n为时间序列长度或样本数;在海洋学中,更多的研究海表面温度异常,故需减去气候态:
其中,为气候态;X即为后续研究的数据矩阵;求其协方差矩阵为:
计算协方差矩阵的特征根和特征向量:
CV=VΛ (4)
其中,Λ=diag(λ1,...,λm),V为空间模态,时间系数PC=VT×X;
对训练集数据进行EOF,获得空间模态EOFs和时间系数PCs,当累积方差达到98%时,认为重构数据足以保留原始数据的主要特征;假设可以认为时间序列是平稳的,训练数据量足够大,将测试集投影到上述EOFs生成相应的伪PCs,用于验证预测结果;
S22.自适应噪声完全集合经验模态分解
设Ej(.)为经过CEEMDAN分解后的第j个本征模态分量,wi(t)为满足标准正态分布的高斯白噪声信号,i=1,2,…l为加入白噪声次数,∈0为噪声系数;x(t)为待分解的信号;在原始时间序列数据中加入白噪声得到新信号:
Xi(T)=x(t)+∈0wi(t) (5)
对产生的模态分量进行总体平均就得到了CEEMDAN分解的第一个本征模态分量:
然后计算去除第一个模态分量后的残差:
在R1(t)中加入正负成对的高斯白噪声得到新信号R1(t)+ε1E1(wi(t)),以新信号为载体进行分解,得到CEEMDAN分解的第二个本征模态分量:
重复上述步骤,直到获得到残差信号为单调函数,不能继续分解,最终残差为:
将预报模型的构建与训练中方差占比为98%的PCs进行CEEMDAN分解,得到CEEMDAN衍生的PCs,其中每个PC由多个本征模态函数和残差组成,作为下一步神经网络的输入;
S23.长短时记忆神经网络
LSTM网络的控制数学方程如下:
ft=σ(Wx·[ht-1,xt]+bf) (10)
it=σ(Wi·[ht-1,xt]+bi) (11)
ot=σ(Wo·[ht-1,xt]+bo) (12)
Ct=ft*Ct-1+it*tan h(Ct) (14)
ht=ot*tanh(Ct) (15)
其中,ht和Ct为隐藏层向量,xt为输入向量,bf,bi,bc和bo为偏差向量,Wf,Wi,Wc和Wo为权重矩阵,σ为激活函数;
使用的LSTM网络基于Keras进行搭建,并通过python3.9编程实现,设定神经网络模块由一层输入层,一层LSTM层和一层全连接层组成,LSTM层神经元个数为16,所有层激活函数为“ReLU”函数,采用此网络对CEEMDAN衍生的PCs进行训练和验证;至此,EOF-CEEMDAN-LSTM混合模型搭建完毕。
5.根据权利要求1所述的一种长时间尺度的海面温度智能预报方法,其特征是,所述温度的预测与评估,具体包括以下步骤:
使用上述训练好的EOF-CEEMDAN-LSTM混合模型,得到预测的PCs,与S21中的EOFs相结合,得到重构的SSTA,将剩下的2%的方差通过惯性预报的方式对重构的SSTA进行订正,完成了对海面温度的预报过程;采用RMSE和ACC评估模型预报效果,计算公式如下:
其中,RMSE表示第i个网格点的均方根误差值,ACC表示第j天所有网格点的空间异常相关系数,XP和XT为第i个网格点第j天的预测值和真实值,M为网格点数,N为时间序列的长度;混合模型预测在第五十天的RMSE和ACC分别为0.47℃和64%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310904711.0A CN117114168A (zh) | 2023-07-24 | 2023-07-24 | 一种长时间尺度的海面温度智能预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310904711.0A CN117114168A (zh) | 2023-07-24 | 2023-07-24 | 一种长时间尺度的海面温度智能预报方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117114168A true CN117114168A (zh) | 2023-11-24 |
Family
ID=88806421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310904711.0A Pending CN117114168A (zh) | 2023-07-24 | 2023-07-24 | 一种长时间尺度的海面温度智能预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117114168A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117668477A (zh) * | 2024-01-31 | 2024-03-08 | 山东科技大学 | 一种海洋大数据智能轻量化处理方法及系统 |
-
2023
- 2023-07-24 CN CN202310904711.0A patent/CN117114168A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117668477A (zh) * | 2024-01-31 | 2024-03-08 | 山东科技大学 | 一种海洋大数据智能轻量化处理方法及系统 |
CN117668477B (zh) * | 2024-01-31 | 2024-04-26 | 山东科技大学 | 一种海洋大数据智能轻量化处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Callens et al. | Using Random forest and Gradient boosting trees to improve wave forecast at a specific location | |
Tian | Modes decomposition forecasting approach for ultra-short-term wind speed | |
Wang et al. | A compound framework for wind speed forecasting based on comprehensive feature selection, quantile regression incorporated into convolutional simplified long short-term memory network and residual error correction | |
CN112488415A (zh) | 基于经验模态分解和长短时记忆网络的电力负荷预测方法 | |
Zhang et al. | Multi-head attention-based probabilistic CNN-BiLSTM for day-ahead wind speed forecasting | |
CN112116162B (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
CN111967679A (zh) | 基于tcn模型的电离层总电子含量预报方法 | |
CN114707688A (zh) | 基于卫星云图和时空神经网络的光伏功率超短期预测方法 | |
CN114510513A (zh) | 用于光伏功率超短期预测的短临气象预报数据处理方法 | |
Jiang et al. | Forecasting hourly PM2. 5 based on deep temporal convolutional neural network and decomposition method | |
VS | Forecasting significant wave height using RNN-LSTM models | |
CN116485010B (zh) | 一种基于循环神经网络的s2s降水预测方法 | |
Jin et al. | A nonlinear artificial intelligence ensemble prediction model for typhoon intensity | |
Yao et al. | Wave height forecast method with multi-step training set extension LSTM neural network | |
CN117114168A (zh) | 一种长时间尺度的海面温度智能预报方法 | |
CN115081269B (zh) | 基于混合输入神经网络模型的桥梁热边界条件预测方法、装置及介质 | |
Li et al. | Decomposition-ANN methods for long-term discharge prediction based on Fisher’s ordered clustering with MESA | |
Wang et al. | A novel wind power forecasting system integrating time series refining, nonlinear multi-objective optimized deep learning and linear error correction | |
Sen | Time series prediction based on improved deep learning | |
Zhang et al. | All‐factor short‐term photovoltaic output power forecast | |
Liu et al. | Multistep-ahead prediction of ocean SSTA based on hybrid empirical mode decomposition and gated recurrent unit model | |
Kamel et al. | On the Performance Robustness of Artificial Neural Network Approaches and Gumbel Extreme Value Distribution for Prediction of Wind Speed | |
Huang et al. | Short-term PV power forecasting based on CEEMDAN and ensemble DeepTCN | |
Li et al. | A multi-factor combination prediction model of carbon emissions based on improved CEEMDAN | |
Naeini et al. | A novel hybrid machine learning model for rapid assessment of wave and storm surge responses over an extended coastal region |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |