CN115860268A - 基于cnn-xgboost模型的短时强降水预测方法 - Google Patents

基于cnn-xgboost模型的短时强降水预测方法 Download PDF

Info

Publication number
CN115860268A
CN115860268A CN202310134699.XA CN202310134699A CN115860268A CN 115860268 A CN115860268 A CN 115860268A CN 202310134699 A CN202310134699 A CN 202310134699A CN 115860268 A CN115860268 A CN 115860268A
Authority
CN
China
Prior art keywords
data
index
cnn
short
precipitation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310134699.XA
Other languages
English (en)
Other versions
CN115860268B (zh
Inventor
薛丰昌
韩宇
万家权
陈笑娟
陈迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Chenxiang Space Information Technology Co ltd
Nanjing University of Information Science and Technology
Original Assignee
Nanjing Chenxiang Space Information Technology Co ltd
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Chenxiang Space Information Technology Co ltd, Nanjing University of Information Science and Technology filed Critical Nanjing Chenxiang Space Information Technology Co ltd
Priority to CN202310134699.XA priority Critical patent/CN115860268B/zh
Publication of CN115860268A publication Critical patent/CN115860268A/zh
Application granted granted Critical
Publication of CN115860268B publication Critical patent/CN115860268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于CNN‑XGBOOST模型的短时强降水预测方法,属于城市内涝监测预警领域。现有短时强降水预测模型多依赖雷达数据,不适用于雷达数据缺失或失真的情况。此外还可以依赖大气环境物理量进行预测,但多使用机器学习方法和CNN等深度学习方法,机器学习方法无法很好的应对特征变量很多的情况及提取特征变量的时间变化特征;而CNN等深度学习方法可以很好的提取特征,但无法很好的运行特征进行预测。因此,提出一种基于CNN‑XGBOOST模型的短时强降水预测方法,本方法可以在不需求雷达回波数据的情况下进行短时强降水预测,同时可以提取特征变量的时间变化特征,并充分利用提取出的特征进行预测。

Description

基于CNN-XGBOOST模型的短时强降水预测方法
技术领域
本发明属于城市内涝监测预警领域,尤其涉及一种基于CNN-XGBOOST模型的短时强降水预测方法。
背景技术
短时强降水是造成洪涝灾害的主要降水形式。现有短时强降水预测模型多依赖雷达数据,不适用于雷达数据缺失或失真的情况。此外还可以依赖大气环境物理量进行预测,但多使用机器学习方法和CNN等深度学习方法,机器学习方法无法很好的应对特征变量很多的情况及提取特征变量的时间变化特征;而CNN等深度学习方法可以很好的提取特征,但无法很好的运行特征进行预测。研究解决如何在没有雷达回波数据的情况下进行短时强降水预测,提取降水特征变量的时间变化特征,实现短时强降水预测预报,具有重要理论与技术意义,同时也是提升气象预报部门业务能力,提高降水预报的准确性与可靠性的重要技术途径。
发明内容
发明目的:本发明的目的在于提供一种基于CNN-XGBOOST模型的短时强降水预测方法,可以在不需求雷达回波数据的情况下进行短时强降水预测,同时可以提取特征变量的时间变化特征,并充分利用提取出的特征进行预测方法。
技术方案:本发明的基于CNN-XGBOOST模型的短时强降水预测方法,按如下步骤,训练获得短时强降水预测模型,并应用短时强降水预测模型实现目标预测时刻的预测;
步骤1:提取目标区域内在预设各历史时刻是否发生短时降水的结果,以及目标区域内分别在各历史时刻向预设间隔时长的大气再分析数据,并提取覆盖目标区域的各气象监测站点的经纬度;
步骤2:分别针对各大气再分析数据,根据大气再分析数据计算目标区域对应CNN-XGBOOST模型所需的特征物理量;
步骤3:以历史时刻是否发生短时降水的结果,以及目标区域内在历史时刻向预设间隔时长的大气再分析数据、及特征物理量,结合覆盖目标区域的各气象监测站点的经纬度,构成样本,获得各个样本,进而构建训练集和测试集;
步骤4:基于训练集,以大气再分析数据、特征物理量和各气象监测站点的经纬度作为输入,目标区域是否发生短时降水的预测结果作为输出,针对CNN-XGBOOST模型进行训练,并通过计算损失并通过反向传播算法对CNN-XGBOOST模型的参数进行调整,获得优化后的CNN-XGBOOST模型;
步骤5:通过测试集测试优化后的CNN-XGBOOST模型的精度,若模型在10个训练轮次内精度未达到当前记录的最佳精度,则终止训练,否则更新当前模型的最佳精度,返回步骤4,直至达到预设的训练轮次,在训练停止后,将达到最佳精度的模型确定为短时强降水预测模型。
进一步的,步骤1中,所述大气再分析数据包括1000hpa、925hpa、850hpa、700hpa、500hpa大气高度下分别对应的位势涡度、散度、垂直速度、比湿、相对湿度、气温、风U分量和风V分量。
进一步的,步骤2中,所述特征物理量包括修正的K指数MK、对流稳定度指数IC、条件-对流稳定性指数ILC、强天气威胁指数SWEAT、总指数TT、水汽通量散度和假相当位温;具体计算公式如下:
(1)修正的K指数MK:
K指数是一种用于分析大气稳定程度的气象学单位,MK指数相比K指数考虑地面温度的状况,MK值越大表示气团底层越暖湿,稳定度越小,越有利于对流产生,其表达式为:
Figure SMS_1
式中T 0 ,T 500 ,T 850 T 700 分别代表地表、500hpa、850hpa和700hpa高度的温度K,T d0 T d850 T d700 分别代表地表、850hpa、700hpa高度的露点温度K;
(2)对流稳定度指数IC:
对流稳定度描述了抬升气层层底和层顶的客观能量的状态,这种能量状态分布决定了整个气层受迫整体抬升后,气层内的稳定度状况,其计算公式为:
Figure SMS_2
式中θ se500 θ se850 分别代表500hpa、850hpa高度的假相当位温;
(3)条件-对流稳定性指数ILC:
条件-对流稳定性指数在对流稳定性指数的基础上引入了条件稳定性指数,以表征气块收扰动抬升后与周围环境相比,其稳定性的情况,其表达式为:
Figure SMS_3
式中θ * se500 表示500hpa高度的饱和假相当位温,θ se0 表示地表的假相当位温;
(4)总指数TT:
总指数通过温度和湿度的垂直梯度来衡量强对流天气发生的概率及其严重程度,总指数越大,越容易发生对流天气,其计算方式如下:
Figure SMS_4
(5)强天气威胁指数SWEAT:
强天气威胁指数综合反映了中低层大气的热力稳定度特征及适宜强对流天气发生的动力环境,其表达式为:
Figure SMS_5
Figure SMS_6
式中f 850 f 500 代表850hpa, 500hpa高度的风速(knots/h),a 500 ,a 850 代表850hpa,500hpa高度的风向,式中各项在小于0时取0值,强天气威胁指数永远为正数;
(6)水汽通量散度:
水汽通量散度定量的描述了水汽输送的方向,水汽通量散度为正表明水汽从该地向外部辐散;水汽通量散度为负表明水汽从外部向该地输入,有利于降水的产生,其表达式如下:
Figure SMS_7
式中g代表地表加速度,通常取9.8m/s,q代表比湿(g/g),uv分别代表风的u分量和v分量(m/s):
(7)假相当位温:
假相当位温是指未饱和湿空气块上升,直到气块内水汽全部凝结后,再按干绝热下沉到1000hpa处,此时气块所具有的温度,当假相当位温随气压降低而减小时,气块为对流不稳定状态,其表达式为:
Figure SMS_8
式中T代表大气温度K,p代表气压hPa,p 0 代表参考大气压1000hPa,T c 代表冷凝温度K,r代表水汽混合比kg/kg。
进一步的,步骤3具体为:
每个样本由三部分数据组成:第一部分数据是气象监测站点的经度和纬度;第二部分数据是气象监测站点所在经纬度的修正的K指数、对流稳定度指数、条件-对流稳定性指数、强天气威胁指数、总指数;第三部分数据是气象监测站点所在经纬度的1000hpa、925hpa、850hpa、700hpa、500hpa大气高度上的散度、位势涡度、垂直速度、水汽通量散度、假相当位温、露点温度差数据;
(a)构建训练集:
选取区域所有站点近十年中小时降水量大于等于20mm的数据作为正样本,选取每个站点小时降水量小于20mm的数据中小时降水量最大的50条数据作为负样本;
(b)构建测试集:
选取区域所有站点近两年中小时降水量大于等于20mm的数据作为正样本,选取每个站点小时降水量小于20mm的数据中小时降水量最大的20条数据作为负样本。
进一步的,所述第二部分数据和第三部分数据为预测时间点前三小时内的数据。
进一步的,步骤4中,将训练集输入卷积层中进行特征提取,将提取的特征进行拼接并输入全连接层,具体为:
(1)针对步骤3中第一部分数据的输入构建一维卷积结构进行特征提取,输入channel为2,输出channel为8,输入前数据大小为B×2,提取特征后数据大小为B×8;针对步骤3中第二部分数据的输入构建一维卷积结构进行特征提取,输入channel为3,输出channel为64,输入前数据大小为B×5×3,提取特征后数据大小为B×64×10;针对步骤3中第三部分数据的输入构建二维卷积结构进行特征提取,卷积核大小为3×3,输入channel为6,输出channel为64,输入前数据大小为6×B×5×12,提取特征后数据大小为B×64×3×10,其中B为每一轮输入的样本数量;
(2)将卷积层中输出的第二、三部分数据输入到一个最大池化层中,池化核大小为1×2,池化后输出数据的大小分别为B×64×5、B×64×3×5;
(3)对所有提取出的特征进行拼接,拼接后特征的大小为B×8+64×5+64×3×5;
(4)最后通过两个全连接层进行对样本的预测,计算损失,通过反向传播算法对参数进行调整;第一个全连接层将特征数由8+64×5+64×3×5个映射为50个,第二个全连接层将特征数由50个映射为两个,输出模型对是否会发生短时强降水的预测结果。
进一步的,计算损失具体为通过交叉熵损失函数计算损失,其计算公式如下:
Figure SMS_9
式中L为交叉熵损失;N为样本个数;y i 表示第i个样本的标签,正样本为1,负样本为0;p i 表示第i个样本是正样本的概率。
有益效果:与现有技术相比,本发明具有如下显著优点:本方法可以在不需求雷达回波数据的情况下进行短时强降水预测,同时可以提取特征变量的时间变化特征,并充分利用提取出的特征进行预测。该方法能够有效解决在没有雷达回波数据的情况下进行短时强降水预测的技术难题,提升气象预报部门业务能力,提高降水预报的准确性与可靠性。
附图说明
图1为本发明所述基于CNN-XGBOOST的短时强降水预测模型结构示意图;
图2为本发明所述短时强降水预测的流程示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图2所示,本发明的流程如下:
步骤一:获取构建基于CNN-XGBOOST的短时强降水预测模型数据集需要的再分析数据;
步骤二:根据特定方式计算基于CNN-XGBOOST的短时强降水预测模型预测需要的特征物理量;
步骤三:根据特定规则构建基于CNN-XGBOOST的短时强降水预测模型所需数据集;
步骤四:构建基于CNN-XGBOOST的短时强降水预测模型,将CNN集成为可训练的特征提取器来自动从输入中获取特征,将XGBOOST集成为网络顶层的识别器来生成结果。
步骤五:训练基于CNN-XGBOOST的短时强降水预测模型;
步骤六:测试基于CNN-XGBOOST模型的短时强降水预测模型,直接将对应时刻的输入网络,利用训练好的权重参数,输出气象站点是否会检测到短时强降水的判断;
进一步,以上技术步骤包括如下实现步骤:
步骤一再分析数据获取通过以下方法实现:
通过ERA5再分析数据网站获取模型构建所需要的1000hpa、925hpa、850hpa、700hpa、500hpa大气高度的位势涡度(Potential vorticity)、散度(Divergence)、垂直速度(Vertical velocity)、比湿(Specifichumidity)、相对湿度(Relative humidity)、气温(Temperature)、风U分量(U-component of wind)、风V分量(V-component of wind)。
步骤二计算特征物理量通过以下方法实现: 根据获取的再分析数据,计算在1000hpa、925hpa、850hpa、700hpa、500hpa大气高度上的修正的K指数(MK)、对流稳定度指数(IC)、条件-对流稳定性指数(ILC)、强天气威胁指数(SWEAT)、总指数(TT)、水汽通量散度、假相当位温等物理量。具体计算公式如下所示:
(1)修正的K指数(MK):
K指数是一种用于分析大气稳定程度的气象学单位,MK指数相比K指数考虑了地面温度的状况,MK值越大表示气团底层越暖湿,稳定度越小,越有利于对流产生。其表达式为:
Figure SMS_10
式中T 0 ,T 500 ,T 850 T 700 分别代表地表、500hpa、850hpa和700hpa高度的温度(K),T d0 T d850 T d700 分别代表地表、850hpa、700hpa高度的露点温度(K)。
(2)对流稳定度指数(IC):
对流稳定度描述了抬升气层层底和层顶的客观能量(假相当位温)的状态,这种能量状态分布决定了整个气层受迫整体抬升后,气层内的稳定度状况。其计算公式为:
Figure SMS_11
式中θ se500 θ se850 分别代表500hpa、850hpa高度的假相当位温。
(3)条件-对流稳定性指数(ILC):
条件-对流稳定性指数在对流稳定性指数的基础上引入了条件稳定性指数,以表征气块收扰动抬升后与周围环境相比,其稳定性的情况。其表达式为:
Figure SMS_12
式中θ * se500 表示500hpa高度的饱和假相当位温,θ se0 表示地表的假相当位温。
(4)总指数(TT):
总指数通过温度和湿度的垂直梯度来衡量强对流天气发生的概率及其严重程度,总指数越大,越容易发生对流天气。其计算方式如下:
Figure SMS_13
(5)强天气威胁指数(SWEAT):
强天气威胁指数综合反映了中低层大气的热力稳定度特征及适宜强对流天气发生的动力环境。其表达式为:
Figure SMS_14
Figure SMS_15
式中f 850 f 500 代表850hpa, 500hpa高度的风速(knots/h),a 500 ,a 850 代表850hpa,500hpa高度的风向。式中各项在小于0时取0值,强天气威胁指数永远为正数。
(6)水汽通量散度:
水汽通量散度定量的描述了水汽输送的方向,水汽通量散度为正表明水汽从该地向外部辐散;水汽通量散度为负表明水汽从外部向该地输入,有利于降水的产生。其表达式如下:
Figure SMS_16
式中g代表地表加速度,通常取9.8m/s,q代表比湿(g/g),uv分别代表风的u分量和v分量(m/s):
(7)假相当位温:
假相当位温是指未饱和湿空气块上升,直到气块内水汽全部凝结后,再按干绝热下沉到1000hpa处,此时气块所具有的温度。当假相当位温随气压降低而减小时,气块为对流不稳定状态。其表达式为:
Figure SMS_17
式中T代表大气温度(K),p代表气压(hPa),p 0 代表参考大气压(1000hPa),T c 代表冷凝温度(K),r代表水汽混合比(kg/kg):
步骤三:
构建基于CNN-XGBOOST的短时强降水预测的训练、测试数据集通过以下方法实现:
样本选取范围为广西壮族自治区南宁、钦州、北海、防城港四市2012-2021年气象监测站点中小时降水量缺失小于20%的170个站点。
(1)训练集构建:
选取170个站点中2012-2019年小时降水量大于等于20mm的数据作为正样本,选取每个站点小时降水量小于20mm的数据中小时降水量最大的50条数据作为负样本。
(2)测试集构建:
选取170个站点中2020、2021年小时降水量大于等于20mm的数据作为正样本,选取每个站点小时降水量小于20mm的数据中小时降水量最大的20条数据作为负样本。
每个样本由三部分数据组成:第一部分是气象监测站点的经度和纬度;第二部分是气象监测站点所在经纬度的修正的K指数、对流稳定度指数、条件-对流稳定性指数、强天气威胁指数、总指数;第三部分是气象监测站点所在经纬度的1000hpa、925hpa、850hpa、700hpa、500hpa大气高度上的散度、位势涡度、垂直速度、水汽通量散度、假相当位温、露点温度差数据。第二、三部分数据包括预测时间点前三小时的数据。
步骤四构建基于CNN-XGBOOST的短时强降水预测模型通过以下方法实现:
将步骤三中得到的训练集作为网络模型的输入,构建基于CNN-XGBOOST的短时强降水预测模型,模型的结构如图1所示,具体构建流程如下。
(1)针对步骤三中第一部分数据的输入构建一维卷积结构进行特征提取,输入channel为2,输出channel为8,输入前数据大小为B×2,提取特征后数据大小为B×8;针对步骤三中第二部分数据的输入构建一维卷积结构进行特征提取,输入channel为3,输出channel为64,输入前数据大小为B×5×3,提取特征后数据大小为B×64×10;针对步骤三中第三部分数据的输入构建二维卷积结构进行特征提取,卷积核大小为3×3,输入channel为6,输出channel为64,输入前数据大小为6×B×5×12,提取特征后数据大小为B×64×3×10,其中B为每一轮输入的样本数量;
(2)将卷积层中输出的第二、三部分数据输入到一个最大池化层中,池化核大小为1×2,池化后输出数据的大小分别为B×64×5、B×64×3×5。
(3)对所有提取出的特征进行拼接,拼接后特征的大小为B×8+64×5+64×3×5。
(4)最后通过两个全连接层进行对样本的预测,计算损失,通过反向传播算法对参数进行调整。第一个全连接层将特征数由8+64×5+64×3×5个映射为50个,第二个全连接层将特征数由50个映射为两个,输出模型对是否会发生短时强降水的预测结果。
B为每一轮输入的样本数量。
模型的损失函数选择交叉熵损失,其计算公式如下所示:
Figure SMS_18
式中L为交叉熵损失;N为样本个数;y i 表示第i个样本的标签,正样本为1,负样本为0;p i 表示第i个样本是正样本的概率。
模型的激活函数选择Relu函数,其计算公式如下所示:
Figure SMS_19
步骤五训练基于CNN-XGBOOST的短时强降水预测模型通过以下方法实现:
首先训练CNN模型,完成训练后将提取出的特征送入XGBOOST模型中进行训练。针对两种模型的训练参数设定如下:
(1)CNN模型:共训练200轮,学习率为0.00025,优化器为Adam,优化器参数β1=0.9,β2=0.999,每次训练输入的样本量为64。
(2)XGBOOST模型:learning rate为0.3,gamma为0.2,max_depth为5,alpha为0.1,lambda为3,subsample为0.7,colsample_bytree为0.7,min_child_weight为2,nthread为6,num_rounds为2000。
步骤六测试基于CNN-XGBOOST的短时强降水预测模型通过以下方法实现:
将2020、2021年的测试样本输入模型,模型输出对应样本是否会发生短时强降水的判断。

Claims (7)

1.一种基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,按如下步骤,训练获得短时强降水预测模型,并应用短时强降水预测模型实现目标预测时刻的预测;
步骤1:提取目标区域内在预设各历史时刻是否发生短时降水的结果,以及目标区域内分别在各历史时刻向预设间隔时长的大气再分析数据,并提取覆盖目标区域的各气象监测站点的经纬度;
步骤2:分别针对各大气再分析数据,根据大气再分析数据计算目标区域对应CNN-XGBOOST模型所需的特征物理量;
步骤3:以历史时刻是否发生短时降水的结果,以及目标区域内在历史时刻向预设间隔时长的大气再分析数据、及特征物理量,结合覆盖目标区域的各气象监测站点的经纬度,构成样本,获得各个样本,进而构建训练集和测试集;
步骤4:基于训练集,以大气再分析数据、特征物理量和各气象监测站点的经纬度作为输入,目标区域是否发生短时降水的预测结果作为输出,针对CNN-XGBOOST模型进行训练,并通过计算损失并通过反向传播算法对CNN-XGBOOST模型的参数进行调整,获得优化后的CNN-XGBOOST模型;
步骤5:通过测试集测试优化后的CNN-XGBOOST模型的精度,若模型在10个训练轮次内精度未达到当前记录的最佳精度,则终止训练,否则更新当前模型的最佳精度,返回步骤4,直至达到预设的训练轮次,在训练停止后,将达到最佳精度的模型确定为短时强降水预测模型。
2.根据权利要求1所述基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,步骤1中,所述大气再分析数据包括1000hpa、925hpa、850hpa、700hpa、500hpa大气高度下分别对应的位势涡度、散度、垂直速度、比湿、相对湿度、气温、风U分量和风V分量。
3.根据权利要求1所述基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,步骤2中,所述特征物理量包括修正的K指数MK、对流稳定度指数IC、条件-对流稳定性指数ILC、强天气威胁指数SWEAT、总指数TT、水汽通量散度和假相当位温;具体计算公式如下:
(1)修正的K指数MK:
K指数是一种用于分析大气稳定程度的气象学单位,MK指数相比K指数考虑地面温度的状况,MK值越大表示气团底层越暖湿,稳定度越小,越有利于对流产生,其表达式为:
Figure QLYQS_1
式中T 0 , T 500 , T 850 T 700 分别代表地表、500hpa、850hpa和700hpa高度的温度K, T d0 T d850 T d700 分别代表地表、850hpa、700hpa高度的露点温度K;
(2)对流稳定度指数IC:
对流稳定度描述了抬升气层层底和层顶的客观能量的状态,这种能量状态分布决定了整个气层受迫整体抬升后,气层内的稳定度状况,其计算公式为:
Figure QLYQS_2
式中θ se500 θ se850 分别代表500hpa、850hpa高度的假相当位温;
(3)条件-对流稳定性指数ILC:
条件-对流稳定性指数在对流稳定性指数的基础上引入了条件稳定性指数,以表征气块收扰动抬升后与周围环境相比,其稳定性的情况,其表达式为:
Figure QLYQS_3
式中θ * se500 表示500hpa高度的饱和假相当位温, θ se0 表示地表的假相当位温;
(4)总指数TT:
总指数通过温度和湿度的垂直梯度来衡量强对流天气发生的概率及其严重程度,总指数越大,越容易发生对流天气,其计算方式如下:
Figure QLYQS_4
(5)强天气威胁指数SWEAT:
强天气威胁指数综合反映了中低层大气的热力稳定度特征及适宜强对流天气发生的动力环境,其表达式为:
Figure QLYQS_5
Figure QLYQS_6
式中f 850 f 500 代表850hpa, 500hpa高度的风速(knots/h),a 500 , a 850 代表850hpa,500hpa高度的风向,式中各项在小于0时取0值,强天气威胁指数永远为正数;
(6)水汽通量散度:
水汽通量散度定量的描述了水汽输送的方向,水汽通量散度为正表明水汽从该地向外部辐散;水汽通量散度为负表明水汽从外部向该地输入,有利于降水的产生,其表达式如下:
Figure QLYQS_7
式中g代表地表加速度,通常取9.8m/s,q代表比湿(g/g),uv分别代表风的u分量和v分量(m/s):
(7)假相当位温:
假相当位温是指未饱和湿空气块上升,直到气块内水汽全部凝结后,再按干绝热下沉到1000hpa处,此时气块所具有的温度,当假相当位温随气压降低而减小时,气块为对流不稳定状态,其表达式为:
Figure QLYQS_8
式中T代表大气温度K,p代表气压hPa,p 0 代表参考大气压1000hPa,T c 代表冷凝温度K,r代表水汽混合比kg/kg。
4.根据权利要求3所述基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,步骤3具体为:
每个样本由三部分数据组成:第一部分数据是气象监测站点的经度和纬度;第二部分数据是气象监测站点所在经纬度的修正的K指数、对流稳定度指数、条件-对流稳定性指数、强天气威胁指数、总指数;第三部分数据是气象监测站点所在经纬度的1000hpa、925hpa、850hpa、700hpa、500hpa大气高度上的散度、位势涡度、垂直速度、水汽通量散度、假相当位温、露点温度差数据;
(a)构建训练集:
选取区域所有站点近十年中小时降水量大于等于20mm的数据作为正样本,选取每个站点小时降水量小于20mm的数据中小时降水量最大的50条数据作为负样本;
(b)构建测试集:
选取区域所有站点近两年中小时降水量大于等于20mm的数据作为正样本,选取每个站点小时降水量小于20mm的数据中小时降水量最大的20条数据作为负样本。
5.根据权利要求4所述基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,所述第二部分数据和第三部分数据为预测时间点前三小时内的数据。
6.根据权利要求4所述基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,步骤4中,将训练集输入卷积层中进行特征提取,将提取的特征进行拼接并输入全连接层,具体为:
(1)针对步骤3中第一部分数据的输入构建一维卷积结构进行特征提取,输入channel为2,输出channel为8,输入前数据大小为B×2,提取特征后数据大小为B×8;针对步骤3中第二部分数据的输入构建一维卷积结构进行特征提取,输入channel为3,输出channel为64,输入前数据大小为B×5×3,提取特征后数据大小为B×64×10;针对步骤3中第三部分数据的输入构建二维卷积结构进行特征提取,卷积核大小为3×3,输入channel为6,输出channel为64,输入前数据大小为6×B×5×12,提取特征后数据大小为B×64×3×10,其中B为每一轮输入的样本数量;
(2)将卷积层中输出的第二、三部分数据输入到一个最大池化层中,池化核大小为1×2,池化后输出数据的大小分别为B×64×5、B×64×3×5;
(3)对所有提取出的特征进行拼接,拼接后特征的大小为B×8+64×5+64×3×5;
(4)最后通过两个全连接层进行对样本的预测,计算损失,通过反向传播算法对参数进行调整;第一个全连接层将特征数由8+64×5+64×3×5个映射为50个,第二个全连接层将特征数由50个映射为两个,输出模型对是否会发生短时强降水的预测结果。
7.根据权利要求6所述基于CNN-XGBOOST模型的短时强降水预测方法,其特征在于,计算损失具体为通过交叉熵损失函数计算损失,其计算公式如下:
Figure QLYQS_9
其中L为交叉熵损失;N为样本个数;y i 表示第i个样本的标签,正样本为1,负样本为0;p i 表示第i个样本是正样本的概率。
CN202310134699.XA 2023-02-20 2023-02-20 基于cnn-xgboost模型的短时强降水预测方法 Active CN115860268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310134699.XA CN115860268B (zh) 2023-02-20 2023-02-20 基于cnn-xgboost模型的短时强降水预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310134699.XA CN115860268B (zh) 2023-02-20 2023-02-20 基于cnn-xgboost模型的短时强降水预测方法

Publications (2)

Publication Number Publication Date
CN115860268A true CN115860268A (zh) 2023-03-28
CN115860268B CN115860268B (zh) 2023-07-14

Family

ID=85658426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310134699.XA Active CN115860268B (zh) 2023-02-20 2023-02-20 基于cnn-xgboost模型的短时强降水预测方法

Country Status (1)

Country Link
CN (1) CN115860268B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116245268A (zh) * 2023-04-12 2023-06-09 中国水产科学研究院南海水产研究所 一种渔业渔船捕捞路线规划方法、系统及介质
CN117290810A (zh) * 2023-11-27 2023-12-26 南京气象科技创新研究院 基于循环卷积神经网络的短时强降水概率预报融合方法
CN117908166A (zh) * 2024-03-18 2024-04-19 南京气象科技创新研究院 基于机器学习的强降水超级单体识别预警方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363327A (zh) * 2019-06-04 2019-10-22 东南大学 基于ConvLSTM和3D-CNN的短临降水预测方法
CN112668238A (zh) * 2020-12-30 2021-04-16 杭州鲁尔物联科技有限公司 一种降雨量处理方法、装置、设备和存储介质
CN112699614A (zh) * 2021-01-14 2021-04-23 长安大学 基于XGBoost的序列预测模型构建、降水趋势预测方法及装置
CN112731403A (zh) * 2021-03-17 2021-04-30 北京墨迹风云科技股份有限公司 一种降水预测方法以及装置
CN114154705A (zh) * 2021-11-26 2022-03-08 国能大渡河大数据服务有限公司 应用于降水预报的数据处理方法、装置、设备和介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110363327A (zh) * 2019-06-04 2019-10-22 东南大学 基于ConvLSTM和3D-CNN的短临降水预测方法
CN112668238A (zh) * 2020-12-30 2021-04-16 杭州鲁尔物联科技有限公司 一种降雨量处理方法、装置、设备和存储介质
CN112699614A (zh) * 2021-01-14 2021-04-23 长安大学 基于XGBoost的序列预测模型构建、降水趋势预测方法及装置
CN112731403A (zh) * 2021-03-17 2021-04-30 北京墨迹风云科技股份有限公司 一种降水预测方法以及装置
CN114154705A (zh) * 2021-11-26 2022-03-08 国能大渡河大数据服务有限公司 应用于降水预报的数据处理方法、装置、设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
安晓澜: "水库入库流量短期预测的多模型对比分析" *
陈礼斌;郭林;郑礼新;张玲;: "两场短时强降水过程的对比分析" *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116245268A (zh) * 2023-04-12 2023-06-09 中国水产科学研究院南海水产研究所 一种渔业渔船捕捞路线规划方法、系统及介质
CN117290810A (zh) * 2023-11-27 2023-12-26 南京气象科技创新研究院 基于循环卷积神经网络的短时强降水概率预报融合方法
CN117290810B (zh) * 2023-11-27 2024-02-02 南京气象科技创新研究院 基于循环卷积神经网络的短时强降水概率预报融合方法
CN117908166A (zh) * 2024-03-18 2024-04-19 南京气象科技创新研究院 基于机器学习的强降水超级单体识别预警方法
CN117908166B (zh) * 2024-03-18 2024-05-24 南京气象科技创新研究院 基于机器学习的强降水超级单体识别预警方法

Also Published As

Publication number Publication date
CN115860268B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN115860268A (zh) 基于cnn-xgboost模型的短时强降水预测方法
Zhang et al. Mechanisms affecting the transition from shallow to deep convection over land: Inferences from observations of the diurnal cycle collected at the ARM Southern Great Plains site
Mehta et al. Diurnal variability of the atmospheric boundary layer height over a tropical station in the Indian monsoon region
Chen et al. Diurnal variations in convective storm activity over contiguous North China during the warm season based on radar mosaic climatology
Wu et al. Influence of assimilating satellite-derived atmospheric motion vector observations on numerical analyses and forecasts of tropical cyclone track and intensity
Davy et al. Statistical downscaling of wind variability from meteorological fields
Suomi et al. Methodology for obtaining wind gusts using Doppler lidar
Garreaud et al. Orographic precipitation in coastal southern Chile: Mean distribution, temporal variability, and linear contribution
Chen et al. Diurnal evolution and distribution of warm‐season convective storms in different prevailing wind regimes over contiguous North China
Yang et al. Evaluating the impact of the COSMIC RO bending angle data on predicting the heavy precipitation episode on 16 June 2008 during SoWMEX-IOP8
CN114325874B (zh) 一种强对流天气个例库系统的建立方法
CN113553766B (zh) 一种使用机器学习反演北极积雪深度的方法
Lin et al. Objective prediction of warm season afternoon thunderstorms in northern Taiwan using a fuzzy logic approach
Saslo et al. Prediction of lake-effect snow using convection-allowing ensemble forecasts and regional data assimilation
Tang et al. Multilevel tower observations of vertical eddy diffusivity and mixing length in the tropical cyclone boundary layer during landfalls
Luo et al. On the use of CloudSat and MODIS data for estimating hurricane intensity
CN110968926B (zh) 一种基于改进背景误差协方差矩阵预测大气参数的方法
Wang et al. A new horizontal mixing-length formulation for numerical simulations of tropical cyclones
Qin et al. Assimilation of Doppler radar observations with an ensemble square root filter: A squall line case study
CN111597692B (zh) 一种地表净辐射估算方法、系统、电子设备和存储介质
Lee et al. Improving wind predictions in the marine atmospheric boundary layer through parameter estimation in a single-column model
Figurski et al. The impact of initial and boundary conditions on severe weather event simulations using a high-resolution WRF model. Case study of the derecho event in Poland on 11 August 2017
Chang et al. The influence of erroneous background, beam‐blocking and microphysical non‐linearity on the application of a four‐dimensional variational Doppler radar data assimilation system for quantitative precipitation forecasts
Pattnayak et al. How good is regional climate model version 4 in simulating the monsoon onset over Kerala?
Stensrud et al. Importance of cold pools to NCEP mesoscale Eta Model forecasts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant