CN116341391B - 基于STPM-XGBoost模型的降水预测方法 - Google Patents
基于STPM-XGBoost模型的降水预测方法 Download PDFInfo
- Publication number
- CN116341391B CN116341391B CN202310587361.XA CN202310587361A CN116341391B CN 116341391 B CN116341391 B CN 116341391B CN 202310587361 A CN202310587361 A CN 202310587361A CN 116341391 B CN116341391 B CN 116341391B
- Authority
- CN
- China
- Prior art keywords
- predictor
- prediction
- time
- relevant
- precipitation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001556 precipitation Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000010354 integration Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 44
- 238000010219 correlation analysis Methods 0.000 claims description 14
- 230000008878 coupling Effects 0.000 claims description 13
- 238000010168 coupling process Methods 0.000 claims description 13
- 238000005859 coupling reaction Methods 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 9
- 230000000875 corresponding effect Effects 0.000 description 19
- 238000012360 testing method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000010355 oscillation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 108010014173 Factor X Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/14—Rainfall or precipitation gauges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Environmental Sciences (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Ecology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Atmospheric Sciences (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Hydrology & Water Resources (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于STPM‑XGBoost模型的降水预测方法,属于降水预测技术领域。本发明针对不同预报因子,以STPM为基础设计不同的目标站点的STPM预报模型,进行次季节降水预报,然后采用XGBoost模型对所有STPM预报模型的输出进行非线性集成,优化预报结果,本发明通过构建的STPM预报模型进行预报,并应用XGBoost模型进行集成,无需复杂的动力学建模及分析,提高了次季节预报的速度。
Description
技术领域
本发明涉及降水预测技术领域,特别是涉及一种基于STPM-XGBoost模型的降水预测方法。
背景技术
次季节预报(10-30天)作为天气预报(10天以内)和短期气候预测(30天以上)之间的桥梁,既是大气的初始化问题,同时也是天气系统的边界耦合问题。因为大气的混沌特性,其初始信息的贡献在次季节尺度上已很大程度地衰减,然而陆面、海洋等下垫面信号的作用却还显现得不够充分,使得次季节预报被称为“可预测性沙漠”。然而两周至两月的次季节降水预报,尤其是对极端降水的准确预报,却是防灾减灾建设至关重要的环节之一。目前,季节性预测中最常用的工具是全球气候模型,其中代表了海洋-冰-陆地-大气气候系统中许多高度复杂的动力学过程,受限于计算机性能以及数据同化的发展,数值模式预报缓慢。
发明内容
本发明的目的是提供一种基于STPM-XGBoost模型的降水预测方法及系统,以提高次季节预报的速度。
为实现上述目的,本发明提供了如下方案:
本发明提供一种基于STPM-XGBoost模型的降水预测方法,所述方法包括如下步骤:
对预报因子历史数据和目标站点的历史降水量进行最大滞后相关性分析,获取每个预报因子和目标站点的降水量相关的格点作为相关格点,并确定每个预报因子的每个相关格点的固定滞后期;预报因子的相关格点的固定滞后期为在所述相关格点的所述预报因子和目标站点的降雨量的最大相关系数对应的滞后期;
基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次;
基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数;
基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量。
可选的,基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次的公式为:
;
其中,为第j个预报因子的相关格点/>的最优预报时次,为预测时次,/>为第j个预报因子的相关格点/>的固定滞后期。
可选的,基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数,具体包括:
将每个预报因子的每个相关格点的最优预报时次的实测量投影到协方差上,获得每个预报因子影响的预测时次的投影系数为:
;
其中,为第j个预报因子影响的预测时次的投影系数,为第j个预报因子的相关格点/>的耦合系数,为第j个预报因子的相关格点/>的最优预报时次/>的实测量。
可选的,基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数,之前还包括:
确定每个预报因子的每个相关格点的耦合系数为:
;
其中,为第j个预报因子的相关格点/>的耦合系数,/>为训练集中第i个训练样本中的预测时次,/>为训练集中第i个训练样本中的目标站点在预测时次的降雨量,/>为训练集中第i个训练样本中的第j个预报因子的相关格点/>的最优预报时次/>的实测量,n表示训练样本的数量。
可选的,基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量为:
;
其中,为预测时次的降水预报量,/>为第j个预报因子影响的预测时次的投影系数,J为预报因子的数量,/>为XGBoost模型。
一种基于STPM-XGBoost模型的降水预测系统,所述系统应用于上述的方法,所述系统包括:
最大滞后相关性分析模块,用于对预报因子历史数据和目标站点的历史降水量进行最大滞后相关性分析,获取每个预报因子和目标站点的降水量相关的格点作为相关格点,并确定每个预报因子的每个相关格点的固定滞后期;预报因子的相关格点的固定滞后期为在所述相关格点的所述预报因子和目标站点的降雨量的最大相关系数对应的滞后期;
最优预报时次确定模块,用于基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次;
预测模块,用于基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数;
集成模块,用于基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量。
一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现上述的方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明实施例提供一种基于STPM-XGBoost模型的降水预测方法,本发明使用STPM预报模型,考虑了大尺度信号时空演变与目标降水之间的关系,而XGBoost模型可以提取降水与其协变量的非线性关系,且具备并行运算的能力。针对不同预报因子,以STPM为基础设计不同的目标站点的STPM预报模型,进行次季节降水预报,然后采用XGBoost模型对所有STPM预报模型的输出进行非线性集成,优化预报结果,本发明通过构建的STPM预报模型进行预报,并应用XGBoost模型进行集成,无需复杂的动力学建模及分析,提高了次季节预报的速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于STPM-XGBoost模型的降水预测方法的流程图;
图2为本发明实施例提供的基于STPM-XGBoost模型的降水预测方法的原理图;
图3为本发明实施例提供的最大滞后相关性分析的原理图;
图4为本发明实施例提供的STPM模型预报流程图;
图5为本发明实施例提供的XGBoost-SHAP集成策略框图;
图6为本发明实施例提供的在相对湿度方面STPM预报技巧图;
图7为本发明实施例提供的在位势高度方面STPM预报技巧图;
图8为本发明实施例提供的在纬向风速方面STPM预报技巧图;
图9为本发明实施例提供的在下垫面方面STPM预报技巧图;
图10为本发明实施例提供的STPM与DNN、BLS模型对比结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于STPM-XGBoost模型的降水预测方法及系统,以提高次季节预报的速度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
本发明实施例1提供一种基于STPM-XGBoost模型的降水预测方法。其中,STPM为Spatiotemporal projection model的简称,中文含义为时空投影模型,XGBoost为eXtremeGradient Boosting的简称,中文含义为优化的分布式梯度增强库。STPM考虑了大尺度信号时空演变与目标降水之间的关系,而XGBoost模型可以提取降水与其协变量的非线性关系,且具备并行运算的能力。针对不同预报因子,以STPM为基础设计不同的带预测区域(示例性的如江西省)的次季节降水预报模型,然后采用XGBoost模型对所有降水预报模型进行非线性集成,优化预报结果,如图1和图2所示,所述方法包括如下步骤:
步骤101,对预报因子历史数据和目标站点的历史降水量进行最大滞后相关性分析,获取每个预报因子和目标站点的降水量相关的格点作为相关格点,并确定每个预报因子的每个相关格点的固定滞后期;预报因子的相关格点的固定滞后期为在所述相关格点的所述预报因子和目标站点的降雨量的最大相关系数对应的滞后期。
1)采集目标站点的历史降水序列数据Y,以及与之相关的预报因子序列Xj (j=1,2,…,J),其中Y为一维时间序列,Xj为第j个预报因子的时空序列,为三维数据,将预报因子X和预报量Y划分为训练集Xjtrain、Ytrain和测试集Xjtest、Ytest。示例性的,获取目标站点或格点近20年观测6-8月的真实日降水数据,即每年有92天的数据,同时获取与该地区降水形成相关的大气环流(位势高度、纬向风等)、下垫面数据(海温、土壤湿度等)以及指数预报因子(热带季节振荡、厄尔尼诺等)。
2)先兆信号分析
鉴于次季节尺度的预报中,低频的降水分量更具有实际意义,且能有效降低预报模型的建立难度,采用巴特沃斯带通滤波器提取降水序列的低频分量,同时为了揭示可能影响江西省低频降水事件的大尺度前期季节内信号,建立预报模型前必须最大程度筛选出预报提前期内与预报要素显著相关的区域。选取其中一个预报因子记为X,格点坐标用(lat,lon)表示,在训练集中预报因子记为Xtrain,对应的实际降雨量为Ytrain,测试集中为预报因子记为Xtest,对应的实际降雨量为Ytest,考虑到目前比较成熟的次季节-季节性预测是基于低频的大气环流信号和缓慢变化边界压迫信号为前提,而这些大尺度信号通常为周期10-90天的振荡序列,同时两个同周期的序列在滞后半个周期内必然出现最值,为了提高大尺度前期信号的利用率,本发明实施例提出最大滞后相关性分析法,在训练集,Xtrain和Ytrain的0-45天的滞后期中选择相关性系数最大的滞后期作为该格点的固定滞后期,由此得到各个格点与预报要素相关系数最大的滞后期lagmax及对应的最大相关系数cmax。设当前时次为t,预报时次为tp,即提前期为tp-t,则格点的筛选要求为:(1)相关性系数大于设定的阈值tol,即cmax>tol;(2)滞后期大于提前期,可从中筛选出G个符合要求的格点(即相关格点)及对应的相关系数最大的滞后期lagmax作为该预报因子的固定滞后期。
示例性的,将前15年数据划分为训练集,后5年数据划分为测试集。设计巴特沃斯滤波器提取降水以及预报因子10~90天的低频分量,并对训练集中序列进行标准化。对标准化后的训练集采用最大滞后相关性分析方法,最大滞后相关性分析方法的基本原理如附图3所示,利用Pearson分析法得到滞后0-45天的预报因子与当前时次的标准化降水相关性最大的滞后期以及相关性系数大于tol的格点,并据此得到模型输入,本发明实施例中的最大滞后相关性分析法在先兆信号环节中空间特征的利用率高于滞后相关性分析法。
步骤102,基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次。
示例性的,基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次的公式为:
(1);
其中,为第j个预报因子的相关格点/>的最优预报时次,为预测时次,/>为第j个预报因子的相关格点/>的固定滞后期,/>为格点的横坐标,/>为格点的纵坐标。
步骤103,基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数。
模型训练时,以时次的格点数据建立预报因子Xtrain与对应tp时次的实际降雨量Ytrain的耦合信息,设Ytrain的序列长度为ltrain,对应的训练样本的数量为n,此时计算公式如式(2)所示。
(2);
其中,为第j个预报因子的相关格点/>的耦合系数,为训练集中第i个训练样本中的预测时次,/>为训练集中第i个训练样本中的目标站点在预测时次的降雨量,/>为训练集中第i个训练样本中的第j个预报因子的相关格点/>的最优预报时次/>的实测量,n表示训练样本的数量。
将预报因子投影在COV可得到一个训练样本的投影系数:
(3);
其中,即是训练集中第j个预报因子影响的预测时次的投影系数,为训练集中训练样本的第j个预报因子的相关格点/>的最优预报时次/>的实测量,Grids为当前时次格点集合。通过训练线性回归模型(XGBoost模型)即可进行独立预报。对所有预报因子进行训练可得到J个投影系数序列。
模型测试时,直接将当前时次格点集合Grids中的测试集中的投影在耦合系数上,得到测试样本的投影系数/>:
(4);
其中,为测试集中第j个预报因子影响的预测时次的投影系数,为测试集中的第j个预报因子的相关格点/>的最优预报时次/>的实测量。
模型预测时,根据图4的预报流程,将训练集得到的模型输入按虚线步骤与标准化降水进行时空投影,首先通过式(2)计算训练集中所选格点的预报因子序列与标准化降水序列的协方差,得到时空耦合型态,即耦合系数,再通过式(3)将预报因子投影到COV上得到预报信息。
步骤104,基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量。
由于降水的形成依赖多种预报因子的非线性耦合,单独STPM预报模型的预报效果一般难以满足次季节预报要求,因此建立XGBoost模型对步骤103中每个预报因子得到的预报信息(即投影系数)进行集成。
在基于STPM模型独立预报的基础上,通过XGBoost模型进行非线性集成,弥补不同预报因子的预报缺陷,提高预报技巧。
XGBoost模型是提升树模型的一种,即不断地添加新的树去拟合上一棵树的预测残差,从而逼近目标值。因此,XGBoost本质上是由K个基模型相加的集成模型,其预测输出可表述为:
(5);
其中,为第i个训练样本对应的XGBoost模型的预测输出;/>为第i个训练样本对应的XGBoost模型的输入,即步骤103获得的每个预报因子影响的目标站点的预测时次的投影系数;/>为XGBoost模型中的第k棵树,K为XGBoost模型中树的数量。
XGBoost模型在模型预测偏差基础上加入正则化项作为其损失函数,以保证较小的方差并抑制模型复杂度。设样本数量为n,则目标函数Obj可写成:
(6);
其中,为损失函数,/>为第i个训练样本中的实测降雨量,/>表示第k棵树的正则化项,T表示每棵树的叶子节点数,ω表示每棵树叶子的权重,为了抑制树的生长和防止模型过拟合,加入了/>和/>,其中/>为L2正则化系数,/>为分裂阈值。
基于式(6)对XGBoost模型进行训练,XGBoost模型训练过程中会自动调整特征权值,过滤无效特征,XGBoost集成策略可以弥补传统基于STPM模型采用经验选取预报因子带来的缺陷,接下来以步骤103得到的投影系数序列作为XGBoost模型的输入,训练集Ytrain作为输出,训练XGBoost模型。所得到的集成模型记为Fx,即:
(7)。
其中,为预测时次的降水预报量,/>为第j个预报因子影响的预测时次的投影系数,J为预报因子的数量,/>为XGBoost模型。
作为一种优选的实施方式,本发明实施例在预测过程中还SHAP模型对XGBoost模型输出结果进行解释,具体为:
XGBoost模型在通过对多个单预报器的预报结果进行非线性集成,形成具有最优预测精度的预报模型的同时,使得预报模型缺乏解释性,利用SHAP针对机器学习模型的可解释性优势,设计基于SHAP法的XGBoost模型解释框架。
SHAP是以估计Shapley值为核心提出的用于机器学习模型的解释预测框架。每个特征值的Shapley值是该特征值对预测的贡献,将所有组合情况进行穷举。把每个组合中的Shapley值对应的特征值的进行加权求和得到:
(8)
其中,表示特征xobj的Shapley值,J为预报因子个数,{x1,…,xJ}是所有XGBoost输入的集合,{x1,…,xJ}\{xobj}为不包括{xobj}的所有输入可能的集合,S为属于{x1,…,xJ}\{xobj}的子集,Fx(S)为XGBoost集成模型以特征集S为输入的预测值,为XGBoost集成模型以特征集/>为输入的预测值,/>表示阶乘。每个特征的Shapley值说明了该特征对于总体预测结果的贡献,表征平均模型预测与实际预测之间的差异。为了压缩模型输入,简化预报模型,将各个特征在训练集n次预报的Shapley值绝对值之和进行降序排列,取前10个预报因子作为模型的最终输入,并通过再次训练得到输入简化后的XGBoost集成模型F’x。同时以/>为模型输入得到集成输出,以相关性指标评价/>和Ytest,以确保模型满足预报要求。
示例性的,对步骤104建立的XGBoost模型通过图5建立解释框架,本发明实施例建立XGBoost模型再次对训练集的降水数据进行预报,每次预报中每个预报因子的预报信息都会通过SHAP模型得到相应的Shapley值,每个预报因子包含了1380次预报过程,将这1380个Shapley值取绝对值并求和,得到每个预报因子的边际贡献,将贡献值排序后可剔除低贡献的预报因子。
作为一种具体的实施方式,根据图4的预报流程,实时预报按实线步骤进行,直接将测试集的预报因子数据投影到步骤103中的时空耦合型态COV,得到预报信息Xp,并将其作为步骤104中训练的XGBoost模型输入,得到低频降水的集成预报结果。
图6-图9为各预报因子建立的STPM预报器预报技巧,图10为STPM与DNN((DeepNeural Networks,深度神经网络)、BLS(Broad Learning System,宽度学习系统)模型、maxSTPM模型以及STPM-XGBoost模型的技巧对比。如图6-图9所示,为了测试模型的整体性能,设计以57598号站点为例的回报实验,预报因子选取850、500、200百帕的纬向风场(对应图6中的rhum925、rhum850、rhum500)、850、500、200百帕的位势高度场(对应图7中的hgt850、hgt500、hgt200)、925、850、500百帕的相对湿度场(对应图8中的uwnd850、uwnd500、uwnd200)、海平面温度(对应图9中的sst)、土壤湿度(对应图9中的soilw)以及MJO(Madden-Julian Oscillation,热带大气季节内振荡)指数,以气象局推荐的时间相关性系数作为评价指标,如图6-图9及图10所示,可以看出本发明对于传统STPM模型的改进效果是显著的,同时预报技巧远远优于当前主流的机器学习模型,对于区域性的次季节降水预报效果具有巨大优势。
实施例2
本发明实施例2提供一种基于STPM-XGBoost模型的降水预测系统,所述系统应用于实施例1的方法,所述系统包括:
最大滞后相关性分析模块,用于对预报因子历史数据和目标站点的历史降水量进行最大滞后相关性分析,获取每个预报因子和目标站点的降水量相关的格点作为相关格点,并确定每个预报因子的每个相关格点的固定滞后期;预报因子的相关格点的固定滞后期为在所述相关格点的所述预报因子和目标站点的降雨量的最大相关系数对应的滞后期;
最优预报时次确定模块,用于基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次;
预测模块,用于基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数;
集成模块,用于基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量。
实施例3
本发明实施例3提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例1提供的方法。
实施例4
本发明实施例4提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现上述实施例1提供的方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种基于STPM-XGBoost模型的降水预测方法,其特征在于,所述方法包括如下步骤:
对预报因子历史数据和目标站点的历史降水量进行最大滞后相关性分析,获取每个预报因子和目标站点的降水量相关的格点作为相关格点,并确定每个预报因子的每个相关格点的固定滞后期;预报因子的相关格点的固定滞后期为在所述相关格点的所述预报因子和目标站点的降雨量的最大相关系数对应的滞后期;
基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次;
基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数;
基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量;
基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次的公式为:
tj′(lat,lon)=tp-lagmax,j(lat,lon);
其中,tj′(lat,lon)为第j个预报因子的相关格点(lat,lon)的最优预报时次,tp为预测时次,lagmax,j(lat,lon)为第j个预报因子的相关格点(lat,lon)的固定滞后期,(lat,lon)为相关格点的坐标。
2.根据权利要求1所述的基于STPM-XGBoost模型的降水预测方法,其特征在于,基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数,具体包括:
将每个预报因子的每个相关格点的最优预报时次的实测量投影到协方差上,获得每个预报因子影响的预测时次的投影系数为:
其中,Xj(tp)为第j个预报因子影响的预测时次的投影系数,COVj(lat,lon)为第j个预报因子的相关格点(lat,lon)的耦合系数,Xj(lat,lon,tj′)为第j个预报因子的相关格点(lat,lon)的最优预报时次tj'的实测量,(lat,lon)为相关格点的坐标。
3.根据权利要求1所述的基于STPM-XGBoost模型的降水预测方法,其特征在于,基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数,之前还包括:
确定每个预报因子的每个相关格点的耦合系数为:
其中,COVj(lat,lon)为第j个预报因子的相关格点(lat,lon)的耦合系数,tpi为训练集中第i个训练样本中的预测时次,Ytrain(tpi)为训练集中第i个训练样本中的目标站点在预测时次的降雨量,Xtrain,j(lat,lon,t′i,j)为训练集中第i个训练样本中的第j个预报因子的相关格点(lat,lon)的最优预报时次t′i,j的实测量,n表示训练样本的数量,(lat,lon)为相关格点的坐标。
4.根据权利要求1所述的基于STPM-XGBoost模型的降水预测方法,其特征在于,基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量为:
其中,为预测时次的降水预报量,Xj(tp)为第j个预报因子影响的预测时次的投影系数,J为预报因子的数量,F()为XGBoost模型。
5.一种基于STPM-XGBoost模型的降水预测系统,其特征在于,所述系统应用于权利要求1-4任一项所述的方法,所述系统包括:
最大滞后相关性分析模块,用于对预报因子历史数据和目标站点的历史降水量进行最大滞后相关性分析,获取每个预报因子和目标站点的降水量相关的格点作为相关格点,并确定每个预报因子的每个相关格点的固定滞后期;预报因子的相关格点的固定滞后期为在所述相关格点的所述预报因子和目标站点的降雨量的最大相关系数对应的滞后期;
最优预报时次确定模块,用于基于每个预报因子的每个相关格点的固定滞后期,计算每个预报因子的每个相关格点的最优预报时次;
预测模块,用于基于每个预报因子的每个相关格点的最优预报时次的实测量,采用STPM预报模型,确定每个预报因子影响的目标站点的预测时次的投影系数;
集成模块,用于基于XGBoost模型对每个预报因子影响的目标站点的预测时次的投影系数进行非线性集成,获得预测时次的降水预报量。
6.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被执行时实现如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310587361.XA CN116341391B (zh) | 2023-05-24 | 2023-05-24 | 基于STPM-XGBoost模型的降水预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310587361.XA CN116341391B (zh) | 2023-05-24 | 2023-05-24 | 基于STPM-XGBoost模型的降水预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116341391A CN116341391A (zh) | 2023-06-27 |
CN116341391B true CN116341391B (zh) | 2023-08-04 |
Family
ID=86882654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310587361.XA Active CN116341391B (zh) | 2023-05-24 | 2023-05-24 | 基于STPM-XGBoost模型的降水预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116341391B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116976149B (zh) * | 2023-09-22 | 2023-12-29 | 广东海洋大学 | 一种海表温度预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005195381A (ja) * | 2003-12-26 | 2005-07-21 | Takashi Nishimura | 気象情報提供システム |
WO2021077729A1 (zh) * | 2019-10-23 | 2021-04-29 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种雷电预测方法 |
CN113537600A (zh) * | 2021-07-20 | 2021-10-22 | 浙江省水利水电勘测设计院 | 一种全过程耦合机器学习的中长期降水预报建模方法 |
CN114781576A (zh) * | 2022-04-19 | 2022-07-22 | 广东海洋大学 | 一种基于随机森林算法的声速剖面估计方法及装置 |
CN115236770A (zh) * | 2022-06-29 | 2022-10-25 | 广西壮族自治区气象科学研究所 | 基于时空堆叠和样本重构的非线性短时临近降水预报方法 |
-
2023
- 2023-05-24 CN CN202310587361.XA patent/CN116341391B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005195381A (ja) * | 2003-12-26 | 2005-07-21 | Takashi Nishimura | 気象情報提供システム |
WO2021077729A1 (zh) * | 2019-10-23 | 2021-04-29 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种雷电预测方法 |
CN113537600A (zh) * | 2021-07-20 | 2021-10-22 | 浙江省水利水电勘测设计院 | 一种全过程耦合机器学习的中长期降水预报建模方法 |
CN114781576A (zh) * | 2022-04-19 | 2022-07-22 | 广东海洋大学 | 一种基于随机森林算法的声速剖面估计方法及装置 |
CN115236770A (zh) * | 2022-06-29 | 2022-10-25 | 广西壮族自治区气象科学研究所 | 基于时空堆叠和样本重构的非线性短时临近降水预报方法 |
Non-Patent Citations (1)
Title |
---|
EOF-CCA模型在山东季降水预测中的应用;胡桂芳, 张苏平, 谢考宪;气象(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116341391A (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Razmi et al. | Non-stationary frequency analysis of extreme water level: application of annual maximum series and peak-over threshold approaches | |
CN110648014B (zh) | 一种基于时空分位数回归的区域风电预测方法及系统 | |
CN109146162B (zh) | 一种基于集成循环神经网络的概率风速预测方法 | |
CN111079989B (zh) | 一种基于dwt-pca-lstm的供水公司供水量预测装置 | |
CN111665575B (zh) | 一种基于统计动力的中长期降雨分级耦合预报方法及系统 | |
CN110689183B (zh) | 一种集群光伏功率概率预测方法、系统、介质及电子设备 | |
CN116341391B (zh) | 基于STPM-XGBoost模型的降水预测方法 | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN112288193A (zh) | 基于注意力机制的gru深度学习的海洋站表层盐度预测方法 | |
CN111652425A (zh) | 一种基于粗糙集和长短期记忆网络的河流水质预测方法 | |
CN104036328A (zh) | 自适应风电功率预测系统及预测方法 | |
CN116449462B (zh) | 海浪有效波高时空序列预测方法、系统、存储介质及设备 | |
CN111931983A (zh) | 一种降水量预测方法及系统 | |
CN115146842A (zh) | 基于深度学习的多元时间序列趋势预测方法和系统 | |
CN114862032B (zh) | 一种基于XGBoost-LSTM的电网负荷预测方法及装置 | |
CN115310536A (zh) | 基于神经网络和gcn深度学习模型的水库水位预测预警方法 | |
CN114065996A (zh) | 基于变分自编码学习的交通流预测方法 | |
CN114417740B (zh) | 一种深海养殖态势感知方法 | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
CN113344290B (zh) | 基于U-Net网络的次季节降水气象预报订正方法 | |
CN110175639B (zh) | 一种基于特征选取的短期风电功率预测方法 | |
CN115222024B (zh) | 基于深度特征选择网络的短期光伏发电预测方法和系统 | |
CN116702627B (zh) | 一种基于深度卷积神经网络的城市暴雨内涝快速模拟方法 | |
Aiden et al. | A neural network model for time series forecasting of UP East rainfall | |
CN116522163A (zh) | 一种建筑能耗预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |