CN114692999A - 一种基于集成学习的海水表层温度预测方法 - Google Patents
一种基于集成学习的海水表层温度预测方法 Download PDFInfo
- Publication number
- CN114692999A CN114692999A CN202210447842.6A CN202210447842A CN114692999A CN 114692999 A CN114692999 A CN 114692999A CN 202210447842 A CN202210447842 A CN 202210447842A CN 114692999 A CN114692999 A CN 114692999A
- Authority
- CN
- China
- Prior art keywords
- training
- verification
- model
- surface temperature
- retention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013535 sea water Substances 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 155
- 238000012795 verification Methods 0.000 claims abstract description 110
- 230000014759 maintenance of location Effects 0.000 claims abstract description 50
- 238000010606 normalization Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 12
- 210000002569 neuron Anatomy 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000000717 retained effect Effects 0.000 claims description 5
- 238000010200 validation analysis Methods 0.000 claims 1
- 239000010410 layer Substances 0.000 description 17
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000011160 research Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 241000393831 Hydropuntia fisheri Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical class C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于集成学习的海水表层温度预测方法,涉及海水表层温度预测。将海表温度历史数据作为训练验证数据集作高斯归一化处理;按时间先后顺序将训练验证数据集在时间上的前一半数据作为留存训练验证子集一,后一半数据作为留存训练验证子集二;分别划分训练集和验证集;选取MLP、LSTM、CNN和CNNLSTM作为初级模型,在留存训练验证子集一上进行每个初级模型的训练和验证,保存通过验证的四个初级模型;选取ConvLSTM作为次级模型,分别加载保存的四个初级模型,在留存训练验证子集二上预测,以预测值作为次级模型的训练输入样本,训练和验证次级模型;用通过验证的次级模型进行海表温度新数据预测。提高预测能力和精度。
Description
技术领域
本发明涉及海水表层温度(以下简称“海表温度”)预测,特别是涉及一种基于集成学习的海水表层温度预测方法。
背景技术
准确预测海表温度可以帮助了解几个月前的降雨模式,还有助于跟踪旋风的发生和规划海洋生态系统(如:监视海洋微生物生长等)。同时,对理解全球或局地气候变化、计划各种海上活动(如:渔业和采矿业,海洋环境保护,海洋军事事务等)、提前识别潜在的极端天气并尽可能减轻损失等科学研究和应用至关重要(Frank J.Wentz,ChelleGentemann,Deborah Smith,and Dudley Chelton,2000.Satellite measurements of seasurface temperature through clouds.Science,288(5467),847-850)。
当前,海表温度预测方法主要有数值模型方法和数据驱动方法两类。
(1)数值模型方法
基于复杂的物理过程,数值模型方法获取大空间的平均信息建立数学模型,从大气-海洋的热传递过程描述海表温度变化。主要技术有:马尔科夫模型(Yan Xue and AntsLeetmaa,2000.Forecasts of tropical Pacific SST and sea level using a Markovmodel.Geophysical Research Letters,27(17),2701-2704)、规范相关分析(D.C.Collins,C.J.C.Reason,and F.Tangang,2004.Predictability of Indian Oceansea surface temperature using canonical correlation analysis.ClimateDynamics,22,481-497)、统计预测模型(Jong-Seong Kug,In-Sik Kang,June-Yi Lee,andJong-Ghap Jhun,2004.A statistical approach to Indian Ocean sea surfacetemperature prediction using a dynamical ENSO prediction.Geophysical ResearchLetters,31(9),L09212)、季节性预报技术(T.N.Krishnamurti,Arindam Chakraborty,Ruby Krishnamurti,William K.Dewar,and Carol Anne Clayson,2006.SeasonalPrediction of Sea Surface Temperature Anomalies Using a Suite of 13CoupledAtmosphere–Ocean Models.Journal of Climate,19,6069-6088)等。由于对海表温度发生发展的机理尚不能给出清晰的物理解释,解决局部区域物理子过程的难度较大,故这类模型的构建一般并不准确,且相对复杂,计算成本高,比较适合用于大范围海表温度预测,分辨率粗糙。
(2)数据驱动方法
数据驱动方法研究数据本身特性及内部规律,预测海表温度。主要方法有:支持向量机(Isis Didier Lins,Moacyr Araujo,Márcio das Chagas Moura,Marcus AndréSilva,and Enrique López Droguett,2013.Prediction of sea surface temperaturein the tropical Atlantic by support vector machines.Computational Statisticsand Data Analysis,61,187-198)、遗传算法(Neetu,Rashmi Sharma,S2016.Multilevelvector autoregressive prediction of sea surface temperature in the NorthTropical Atlantic Ocean and the Caribbean Sea.Climate Dynamics,47,95-106)、多级向量自回归模型和神经网络(张韧,2000.非线性BP网络映射与赤道太平洋海温预测.海洋通报,19(4),1-7;Aiming Wu,William W.Hsieh,and Benyang Tang,2006.Neuralnetwork forecasts of the tropical Pacific sea surface temperatures.NeuralNetworks,19,145-154)。这类方法绕过海表温度复杂的形成、变化机制,通过对大量已知样本进行训练,让计算机从数据中自行学习规则,进行预测。
上述文献中的数据驱动方法一般涉及单一机器学习模型,而集成学习是机器学习的一种通用元方法,它通过组合来自多个单一模型的预测来寻求更好的预测表现。集成学习技术中的堆叠法试图在同一数据集上拟合多种不同的模型类型,并使用另一个模型在另一数据集上来学习如何更好地组合预测。
发明内容
本发明的目的在于针对现有技术存在的上述问题,提供将集成学习技术中的堆叠法引入海表温度预测,可有效提高海表温度的短期预测精度的一种基于集成学习的海水表层温度预测方法。
一种基于集成学习的海水表层温度预测方法,包括以下步骤:
步骤1、将海表温度历史数据作为训练验证数据集,作高斯归一化处理;
步骤2、根据时间先后顺序,将归一化处理后的训练验证数据集在时间上的前一半数据作为留存训练验证子集一,归一化后训练验证数据集在时间上的后一半数据作为留存训练验证子集二;
步骤3、根据时间先后顺序,对于留存训练验证子集一和留存训练验证子集二,分别划分训练集和验证集;
步骤4、分别选取多层感知器(Multilayer Perceptron,MLP)、长短时记忆(LongShort-Term Memory,LSTM)、卷积神经网络(Convolutional Neural Network,CNN)和卷积神经网络-长短时记忆(Convolutional Neural Network Long Short-Term Memory,CNNLSTM)作为初级模型,在留存训练验证子集一上进行每个初级模型的训练和验证,并保存通过验证的四个初级模型;
步骤5、选取卷积长短时记忆(Convolutional LSTM,ConvLSTM)作为次级模型,分别加载保存的四个初级模型,在留存训练验证子集二上进行预测,以预测值作为次级模型的训练输入样本,训练和验证次级模型,并保存通过验证的次级模型;
步骤6、使用通过验证的次级模型进行海表温度新数据的预测。
在步骤1中,所述高斯归一化处理的公式为:
其中,y和y*分别表示高斯归一化前后海表温度训练验证数据,ymean表示海表温度训练验证数据平均值,ystd表示海表温度训练验证数据标准差;高斯归一化处理后的训练验证数据集符合标准正态分布。
在步骤3中,所述根据时间先后顺序,对于留存训练验证子集一和留存训练验证子集二,分别划分训练集和验证集的具体步骤可为:对于留存训练验证子集一,划分训练集和验证集,训练集用于训练每个初级模型,验证集用于评估每个初级模型的训练情况,并以此调整每个初级模型的网络参数;对于留存训练验证子集二,划分训练集和验证集,训练集用于训练次级模型,验证集用于评估次级模型的训练情况,并以此调整次级模型的网络参数;针对留存训练验证子集一和留存训练验证子集二,根据时间先后顺序分别进行训练集和验证集的划分,训练集和验证集的数据量比例可为4︰1。
在步骤4中,所述在留存训练验证子集一上进行每个初级模型的训练和验证,并保存通过验证的四个初级模型的具体步骤可为:对于每种初级模型,首先为海表温度留存训练验证子集一构建监督学习关系,即:设在时间t进行某天海表温度的观测,那么t-n(n为正整数)代表其n天前观测的海表温度历史数据,以t-n,…,t-1,t的海表温度历史数据作为输入,而海表温度观测数据t+m(m为正整数)作为目标输出,从而构建监督学习关系;然后从网络关键参数经验范围中,通过网格搜索确定每个初级模型的关键参数值,对于MLP和LSTM主要有参数:隐藏层层数,每层神经元个数,训练迭代周期,每批次送入网络进行训练的样本数量,对应的网格搜索范围分别为(1,2,3)层,(10,20,30)个,(100,200,300,400)次和(32,64,128,256)个;对于CNN和CNNLSTM主要有参数:隐藏层层数,每层神经元个数,训练迭代周期,每批次送入网络进行训练的样本数量,滤波器个数,卷积核大小,对应的网格搜索范围分别为(1,2,3)层,(10,20,30)个,(100,200,300,400)次,(32,64,128,256)个,(16,32,64,128)个,和(1,3,5);最后进行每个初级模型的训练,根据每个初级模型在留存训练验证子集一中验证集上的表现来评估模型,调整模型参数,并保存通过验证的四个初级模型。
在步骤5中,所述选取卷积长短时记忆(Convolutional LSTM,ConvLSTM)作为次级模型,分别加载保存的四个初级模型,在留存训练验证子集二上进行预测,以预测值作为次级模型的训练输入样本,训练和验证次级模型,并保存通过验证的次级模型的具体步骤可为:
首先分别加载保存的四个初级模型,按照时间序列海表温度留存训练验证子集一的监督学习关系构建方法,对留存训练验证子集二进行监督学习关系构建,并进行预测,形成次级模型的训练输入样本;然后从网络关键参数经验范围中,通过网格搜索确定次级模型ConvLSTM的网络关键参数,主要有隐藏层层数,训练迭代周期,每批次送入网络进行训练的样本数量,滤波器个数,卷积核大小等,对应的网格搜索范围分别为(1,2,3)层,(100,200,300,400)次,(32,64,128,256)个,(16,32,64,128)个,和(1,3,5),使用四个初级模型在留存训练验证子集二上的预测值作为样本输入特征,留存训练验证子集二的海表温度观测值作为目标输出,进行训练,根据次级模型在留存训练验证子集二中验证集上的表现来评估模型,调整模型参数,并保存通过验证的次级模型。
本发明将集成学习中的堆叠法引入海表温度预测,首先对海表温度历史数据进行高斯归一化处理,然后在留存训练验证子集一上训练、验证每个初级模型,最后在留存训练验证子集二上使用通过验证的每个初级模型进行预测,形成次级模型的训练样本,训练并验证次级模型;以均方根误差指标来评估堆叠后次级模型ConvLSTM的预测能力,本发明可提升初级模型海表温度的预测能力,实现海表温度短期预测精度0.367℃。
相对于现有技术,本发明技术方案取得的有益效果是:对初级模型进行堆叠集成,训练次级模型进行预测,能够较好组合各种初级模型,发挥每种初级模型的优势,同时规避每种初级模型的缺点,实现集成后次级模型更好的预测表现。
附图说明
图1为某海域某位置1982-2019年海表温度的原始日平均数据;
图2为该海域位置海表温度历史数据高斯归一化处理后数据;
图3为初级模型MLP在该海域位置2020年海表温度预测结果(预测时间步长1天);
图4为初级模型LSTM在该海域位置2020年海表温度预测结果(预测时间步长1天);
图5为初级模型CNN在该海域位置2020年海表温度预测结果(预测时间步长1天);
图6为初级模型CNNLSTM在该海域位置2020年海表温度预测结果(预测时间步长1天);
图7为次级模型ConvLSTM在该海域位置2020年海表温度预测结果(预测时间步长1天)。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚,以下结合附图和实施例,对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
本发明实施例包括以下步骤:
步骤1、将海表温度历史数据作为训练验证数据集,作高斯归一化处理。在本实施例中,具体为:
(1)本实施例中选取1982-2019年某海域某位置卫星反演的海表温度原始数据作为训练验证数据。
(2)对该海域位置1982-2019年海表温度原始数据进行高斯归一化处理。高斯归一化处理前后海表温度数据分别如图1和2所示。
步骤2、根据时间先后顺序,将归一化后的该海域位置1982-2019年共38年的训练验证数据集在时间上的前一半数据,即1982-2000年共19年的数据作为留存训练验证子集一,在时间上的后一半数据,即2001-2019年共19年的数据作为留存训练验证子集二。
步骤3、根据时间先后顺序,对于留存训练验证子集一,按照数据量4︰1划分训练集和验证集,同样地,对于留存训练验证子集二,也按照数据量4︰1划分训练集和验证集。
步骤4、在此实施例中,具体如下:
(1)设在时间t进行某天海表温度的观测,令n=3,m=1,即以t-3,t-2,t-1,和t的海表温度历史数据作为输入,而预测时间步长设置为1天,即海表温度数据t+1作为目标输出,为每种初级模型构建监督学习关系;
(2)使用网格搜索方法确定每种初级模型的关键参数如下:对于MLP,有隐藏层层数1层,每层神经元个数30,训练迭代周期300次,每批次送入网络进行训练的样本数量128个;对于LSTM,有隐藏层层数1层,每层神经元个数10个,训练迭代周期400次,每批次送入网络进行训练的样本数量64个;对于CNN,有隐藏层层数2层,每层神经元个数10个,训练迭代周期400次,每批次送入网络进行训练的样本数量64个,滤波器个数128个,卷积核大小3;对于CNNLSTM,有隐藏层层数2层,每层神经元个数20个,训练迭代周期300次,每批次送入网络进行训练的样本数量64个,滤波器个数64个,卷积核大小3;
(3)进行每个初级模型的训练,根据每个初级模型在留存训练验证子集一中验证集上的表现来评估模型,调整模型参数,并保存通过验证的四个初级模型。
步骤5、在此实施例中,具体如下:
(1)分别加载保存的四个初级模型;
(2)按照时间序列海表温度留存训练验证子集一的监督学习关系构建方法,对留存训练验证子集二进行监督学习关系构建,即:对于留存训练验证子集二以t-3,t-2,t-1,和t的海表温度历史数据作为输入,而海表温度数据t+1作为目标输出;
(3)使用每种初级模型进行预测,形成次级模型的训练输入样本;
(4)使用网格搜索方法确定次级模型ConvLSTM的关键参数如下:隐藏层层数2层,训练迭代周期400次,每批次送入网络进行训练的样本数量128个,滤波器个数64个,卷积核大小3;
(5)使用四个初级模型在留存训练验证子集二上的预测值作为样本输入特征,留存训练验证子集二的海表温度观测作为目标输出,进行训练,根据次级模型ConvLSTM在留存训练验证子集二中验证集上的表现来评估模型,调整模型参数,并保存通过验证的次级模型。
步骤6、以和步骤4和步骤5中相同的方式对某海域位置2020年海表温度日平均数据构建监督学习关系,使用通过验证的次级模型ConvLSTM进行预测。
根据实施例中步骤1-6,将训练验证的初级模型MLP、LSTM、CNN、CNNLSTM和次级模型ConvLSTM对某海域位置2020年海表温度日平均数据预测值与相应海表温度观测值分别进行比较,结果分别如图3~7所示。
使用均方根误差(Root Mean Square Error,RMSE)指标来评估初级模型MLP、LSTM、CNN、CNNLSTM,和堆叠后次级模型ConvLSTM在该海域位置2020年海表温度数据上的预测能力,RMSE计算公式如下:
其中,X表示海表温度观测值,Y表示海表温度预测值,N表示海表温度数据个数。
表2初级模型和次级模型的预测精度(预测时长1天)
从表2中指标RMSE可知,相比于各种初级模型的预测表现,次级模型ConvLSTM的预测RMSE更小,表明:使用堆叠法对初级模型进行集成,堆叠后模型ConvLSTM的预测能力得到提升,预测精度更高。
上述实施例仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。
Claims (6)
1.一种基于集成学习的海水表层温度预测方法,其特征在于包括以下步骤:
步骤1、将海表温度历史数据作为训练验证数据集,作高斯归一化处理;
步骤2、根据时间先后顺序,将归一化处理后的训练验证数据集在时间上的前一半数据作为留存训练验证子集一,归一化后训练验证数据集在时间上的后一半数据作为留存训练验证子集二;
步骤3、根据时间先后顺序,对于留存训练验证子集一和留存训练验证子集二,分别划分训练集和验证集;
步骤4、分别选取MLP、LSTM、CNN和CNNLSTM作为初级模型,在留存训练验证子集一上进行每个初级模型的训练和验证,并保存通过验证的四个初级模型;
步骤5、选取ConvLSTM作为次级模型,分别加载保存的四个初级模型,在留存训练验证子集二上进行预测,以预测值作为次级模型的训练输入样本,训练和验证次级模型,并保存通过验证的次级模型;
步骤6、使用通过验证的次级模型进行海表温度新数据的预测。
3.如权利要求1所述一种基于集成学习的海水表层温度预测方法,其特征在于在步骤3中,所述根据时间先后顺序,对于留存训练验证子集一和留存训练验证子集二,分别划分训练集和验证集的具体步骤为:对于留存训练验证子集一,划分训练集和验证集,训练集用于训练每个初级模型,验证集用于评估每个初级模型的训练情况,并以此调整每个初级模型的网络参数;对于留存训练验证子集二,划分训练集和验证集,训练集用于训练次级模型,验证集用于评估次级模型的训练情况,并以此调整次级模型的网络参数;针对留存训练验证子集一和留存训练验证子集二,根据时间先后顺序分别进行训练集和验证集的划分。
4.如权利要求3所述一种基于集成学习的海水表层温度预测方法,其特征在于所述训练集和验证集的数据量比例为4︰1。
5.如权利要求1所述一种基于集成学习的海水表层温度预测方法,其特征在于在步骤4中,所述在留存训练验证子集一上进行每个初级模型的训练和验证,并保存通过验证的四个初级模型的具体步骤为:对于每种初级模型,首先为海表温度留存训练验证子集一构建监督学习关系,即:设在时间t进行某天海表温度的观测,那么t-n(n为正整数)代表其n天前观测的海表温度历史数据,以t-n,…,t-1,t的海表温度历史数据作为输入,而海表温度观测数据t+m(m为正整数)作为目标输出,从而构建监督学习关系;然后从网络关键参数经验范围中,通过网格搜索确定每个初级模型的关键参数值,对于MLP和LSTM包括参数:隐藏层层数、每层神经元个数、训练迭代周期、每批次送入网络进行训练的样本数量,对应的网格搜索范围分别为(1,2,3)层,(10,20,30)个,(100,200,300,400)次和(32,64,128,256)个;对于CNN和CNNLSTM包括参数:隐藏层层数、每层神经元个数、训练迭代周期、每批次送入网络进行训练的样本数量、滤波器个数、卷积核大小,对应的网格搜索范围分别为(1,2,3)层,(10,20,30)个,(100,200,300,400)次,(32,64,128,256)个,(16,32,64,128)个,和(1,3,5);最后进行每个初级模型的训练,根据每个初级模型在留存训练验证子集一中验证集上的表现来评估模型,调整模型参数,并保存通过验证的四个初级模型。
6.如权利要求1所述一种基于集成学习的海水表层温度预测方法,其特征在于在步骤5中,所述选取ConvLSTM作为次级模型,分别加载保存的四个初级模型,在留存训练验证子集二上进行预测,以预测值作为次级模型的训练输入样本,训练和验证次级模型,并保存通过验证的次级模型的具体步骤为:
首先分别加载保存的四个初级模型,按照时间序列海表温度留存训练验证子集一的监督学习关系构建方法,对留存训练验证子集二进行监督学习关系构建,并进行预测,形成次级模型的训练输入样本;然后从网络关键参数经验范围中,通过网格搜索确定次级模型ConvLSTM的网络关键参数,包括隐藏层层数、训练迭代周期、每批次送入网络进行训练的样本数量、滤波器个数、卷积核大小,对应的网格搜索范围分别为(1,2,3)层,(100,200,300,400)次,(32,64,128,256)个,(16,32,64,128)个,和(1,3,5),使用四个初级模型在留存训练验证子集二上的预测值作为样本输入特征,留存训练验证子集二的海表温度观测值作为目标输出,进行训练,根据次级模型在留存训练验证子集二中验证集上的表现来评估模型,调整模型参数,并保存通过验证的次级模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210447842.6A CN114692999A (zh) | 2022-04-26 | 2022-04-26 | 一种基于集成学习的海水表层温度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210447842.6A CN114692999A (zh) | 2022-04-26 | 2022-04-26 | 一种基于集成学习的海水表层温度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114692999A true CN114692999A (zh) | 2022-07-01 |
Family
ID=82144833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210447842.6A Pending CN114692999A (zh) | 2022-04-26 | 2022-04-26 | 一种基于集成学习的海水表层温度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114692999A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014075108A2 (en) * | 2012-11-09 | 2014-05-15 | The Trustees Of Columbia University In The City Of New York | Forecasting system using machine learning and ensemble methods |
CN112561058A (zh) * | 2020-12-15 | 2021-03-26 | 广东工业大学 | 基于Stacking-集成学习短期光伏功率预测方法 |
CN112906989A (zh) * | 2021-03-31 | 2021-06-04 | 国家海洋信息中心 | 一种基于cnn-lstm的区域海表面温度预测方法 |
CN114139590A (zh) * | 2021-05-27 | 2022-03-04 | 中国海洋大学 | 用于估算海洋温度的方法 |
-
2022
- 2022-04-26 CN CN202210447842.6A patent/CN114692999A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014075108A2 (en) * | 2012-11-09 | 2014-05-15 | The Trustees Of Columbia University In The City Of New York | Forecasting system using machine learning and ensemble methods |
CN112561058A (zh) * | 2020-12-15 | 2021-03-26 | 广东工业大学 | 基于Stacking-集成学习短期光伏功率预测方法 |
CN112906989A (zh) * | 2021-03-31 | 2021-06-04 | 国家海洋信息中心 | 一种基于cnn-lstm的区域海表面温度预测方法 |
CN114139590A (zh) * | 2021-05-27 | 2022-03-04 | 中国海洋大学 | 用于估算海洋温度的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jun | A comparison of a gradient boosting decision tree, random forests, and artificial neural networks to model urban land use changes: The case of the Seoul metropolitan area | |
CN109117883B (zh) | 基于长短时记忆网络的sar影像海冰分类方法及系统 | |
CN113468803B (zh) | 一种基于改进的woa-gru洪水流量预测方法及系统 | |
CN111080070A (zh) | 一种基于空间误差的城市土地利用模拟元胞自动机方法 | |
CN113807562A (zh) | 海洋表面温度的预测方法 | |
Ma et al. | Active pointillistic pattern search | |
CN114266384A (zh) | 一种基于融合模型的快速预测台风路径的方法及其装置 | |
Apaydın et al. | Evaluation of air temperature with machine learning regression methods using Seoul City meteorological data | |
CN114676923A (zh) | 发电功率的预测方法、装置、计算机设备和存储介质 | |
CN116702992A (zh) | 一种发电功率预测方法、装置、电子设备及存储介质 | |
Lubkov et al. | Method for reconstructing the monthly mean water transparencies for the northwestern part of the Black Sea as an example | |
CN114692999A (zh) | 一种基于集成学习的海水表层温度预测方法 | |
CN116304941A (zh) | 一种基于多模型组合的海洋数据质量控制方法及装置 | |
Cocianu et al. | The Use of LSTM Neural Networks to Implement the NARX Model. A Case Study of EUR-USD Exchange Rates. | |
Zhang | Short-term load forecasting of power model based on CS-Catboost algorithm | |
CN113139624A (zh) | 基于机器学习的网络用户分类方法 | |
CN112927085A (zh) | 基于区块链、大数据和算法的股票风险预警系统 | |
Zhao et al. | Rain prediction based on machine learning | |
CN110909943A (zh) | 一种多尺度多因子联合驱动的月径流概率预报方法 | |
CN112161621B (zh) | 一种无模型辅助导航适配区域选取方法 | |
Maceda et al. | Rainfall Classification Model for the Philippines using Optimized K-nearest Neighbor Algorithm with GridSearchCV Hyperparameter Tuning | |
CN117421562B (zh) | 海洋溶解氧含量时空分布预测方法、系统、介质及设备 | |
Shi | Comparison of Real Estate Price Prediction Based on LSTM and LGBM | |
El Motaki et al. | Systematic comparison of feature selection methods for solar energy forecasting | |
Guo | Knowledge-enabled short-term load forecasting based on pattern-base using classification & regression tree and support vector regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |