CN117908166A - 基于机器学习的强降水超级单体识别预警方法 - Google Patents
基于机器学习的强降水超级单体识别预警方法 Download PDFInfo
- Publication number
- CN117908166A CN117908166A CN202410303465.8A CN202410303465A CN117908166A CN 117908166 A CN117908166 A CN 117908166A CN 202410303465 A CN202410303465 A CN 202410303465A CN 117908166 A CN117908166 A CN 117908166A
- Authority
- CN
- China
- Prior art keywords
- strong precipitation
- early warning
- precipitation
- super
- strong
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001556 precipitation Methods 0.000 title claims abstract description 174
- 239000000178 monomer Substances 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000010801 machine learning Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000012216 screening Methods 0.000 claims abstract description 21
- 230000006855 networking Effects 0.000 claims abstract description 10
- 238000004891 communication Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 238000004590 computer program Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 3
- ZPOLOEWJWXZUSP-WAYWQWQTSA-N bis(prop-2-enyl) (z)-but-2-enedioate Chemical compound C=CCOC(=O)\C=C/C(=O)OCC=C ZPOLOEWJWXZUSP-WAYWQWQTSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/88—Radar or analogous systems specially adapted for specific applications
- G01S13/95—Radar or analogous systems specially adapted for specific applications for meteorological use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Electromagnetism (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及天气预报技术领域,具体公开一种基于机器学习的强降水超级单体识别预警方法,包括如下步骤:选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。本发明融合多源数据,结合CatBoost机器学习算法,能够准确、快速识别和预警强降水超级单体风暴,这对于减少由于强降水超级单体引起的天气灾害的影响尤为重要。
Description
技术领域
本发明涉及天气预报技术领域,具体是涉及一种基于机器学习的强降水超级单体识别预警方法。
背景技术
超级单体风暴是一种强烈的天气系统,也是造成天气灾害的主要系统之一,并伴有深厚持久的中气旋。当中气旋全部或大部分区域伴随着强降水,且强降水的强度达到50mm/h时,这类超级单体风暴即为强降水超级单体风暴。强降水超级单体风暴在近些年引起的天气灾害及造成的各类损失使得针对强降水超单的预警预报技术需求尤为迫切。
强降水超级单体风暴往往发生发展迅速,且大部分持续时间较短,现有技术很难快速有效的对其进行识别,预报预警能力很低。一方面,强降水超级单体发生的背景场复杂,不同的环境因子往往会产生不同风暴类型的演变和发展;此外,风暴和环境的相互作用也会影响风暴的强度和组织。另一方面,强降水超级单体常常出现在中尺度对流系统中,但由于中尺度对流系统的回波形态和结构本身具有多样性,观测上很难直观的识别出强降水超级单体。因此,需要研发新的技术以便快速识别预警强降水超级单体。
目前,对强降水超级单体发生时背景场的研究主要集中于大尺度环境因子研究,但由于强降水超级单体本身尺度较小,风暴发生地的地形以及下垫面类型的差异对风暴发生演变的影响往往被忽视;此外,由于超级单体总是伴随着一个持久深厚的中气旋,中气旋的不同特征往往对应着不同类型的超级单体,因此,通过多普勒雷达数据,采用机器学习技术准确判识出强降水超级单体的中气旋特征并联合对应的地形及下垫面将是有效判识强降水超单的途径之一。
发明内容
本发明旨在至少在一定程度上解决相关技术中存在的技术问题之一。
本发明的一个目的在于提供一种基于机器学习的强降水超级单体识别预警方法,融合多源数据,解决强降水超级单体识别预警困难的问题。
本发明的另一个目的在于提供一种基于机器学习的强降水超级单体识别预警系统。
为了达到上述的目的,本发明一方面提供一种基于机器学习的强降水超级单体识别预警方法,包括如下步骤:
S100、选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
S200、依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
S300、将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
进一步的,步骤S100所述选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集,包括:
S110、选取强降水超级单体个例;
S120、筛选出选取的各强降水超级单体个例对应的风暴特征参数,形成特征数据集;
S130、对获得的特征数据集进行数据处理。
进一步的,步骤S110所述选取强降水超级单体个例,具体方法为:
S111、获取逐小时降水量的统计数据,并按照从小到大的顺序,将逐小时降水量重新排列,获得序列:
;
其中, 为 />在序列中的序号, />为序列总的样本数;
S112、据下式计算的概率P:
;
当P=99.9%时,所对应的 值,作为强降水的最低小时降水量标准;
S113、根据自动站资料获得满足强降水标准的降水对应位置和时间,并利用中气旋识别方法,反演该降水对应的中气旋相关参数;
S114、在多普勒天气雷达探测到该降水有中气旋且满足如下条件时,选取该降水为强降水超级单体个例:
(1)涡旋垂直伸展至少3km,涡旋底部的高度不超过5km;
(2)距离雷达站不同距离的旋转速度满足二维特征强度阈值;
(3)涡旋持续两个体扫及以上。
进一步的,步骤S120所述筛选出选取的各强降水超级单体个例对应的风暴特征参数,形成特征数据集,具体方法为:
S121、提取所有强降水超级单体个例的中气旋特征,以及强降水超级单体个例的地形高度、下垫面类型数据、风暴发生的初始时间以及风暴路径的经纬度信息;
S122、利用SHAP方法对S121获得的全部特征进行计算筛选,得到八个重要相关变量,分别是:最强切变、地形高度、顶高、中气旋直径方位角方向、底高、最强切变高度、中气旋直径径向方向和下垫面类型;
S123、将S122筛选出的八个特征参数的数据和该特征对应是否形成强降水超级单体作为训练数据集,据此形成强降水超级单体识别预警模型的训练特征数据集。
进一步的,步骤S130所述对获得的特征数据集进行数据处理,包括清洗数据、处理缺失值,以及对特征值进行标准化或归一化处理。
进一步的,步骤S200所述依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型,包括:
S210、依据特征数据集,采用随机森林、贝叶斯、XGBoost、CatBoost、LightGBM和SVM多种机器学习模型分别进行训练学习;
S220、计算各模型的预报命中率、空报率、临界成功指数与偏差,选择CatBoost作为最优框架,设置合适的超参数对最优模型作进一步的训练,获得强降水超级单体识别预警模型。
进一步的,步骤S220完成后还采用交叉验证以及模型评估方法对强降水超级单体识别预警模型进行验证和评估。
本发明另一方面提供一种基于机器学习的强降水超级单体识别预警系统,包括:
数据采集模块,用于选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
模型构建模块,用于依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
预警产品输出模块,用于将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
本发明再一方面还提供一种非暂态计算机可读存储介质,其上存储有计算机指令,该计算机指令使计算机执行上述的基于机器学习的强降水超级单体识别预警方法。
本发明再一方面还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,处理器调用存储器中的逻辑指令,以执行上述的基于机器学习的强降水超级单体识别预警方法。
有益效果:本发明融合多源数据,结合CatBoost机器学习算法,能够准确、快速识别和预警强降水超级单体风暴,这对于减少由于强降水超级单体引起的天气灾害的影响尤为重要。
本方法融合了雷达资料、自动站资料以及其他相关参数(如地形高度、下垫面类型等),这种综合分析能够利用更全面的信息来理解和预警强降水超级单体风暴。
本发明通过构建强降水超级单体风暴的特征数据集,并应用CatBoost进行训练和检验,可以更有效地捕捉到与强降水超单相关的关键特征,从而提高识别预警的准确性。
附图说明
图1为实施例中基于机器学习的强降水超级单体识别预警方法流程图;
图2是特征参数重要性SHAP值分布图;
图3是模型复杂度(Tree Depth)以及学习速度(Learning Rate)与临界成功指数(CSI)关系图。
具体实施方式
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例:本实施例提供一种基于机器学习的强降水超级单体识别预警方法,如图1所示,包括如下步骤:
S100、选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;包括:
S110、选取强降水超级单体个例;
以某地1980-2013年6-8月逐小时降水量为例,将其按照从小到大的顺序,重新排列,获得序列:
;
其中,为/>在序列中的序号, />为序列总的样本数;
据下式计算 的概率P:
;
当P=99.9%时,所对应的值,作为强降水的最低小时降水量标准;
根据自动站资料获得满足强降水标准的降水对应位置和时间,并利用中气旋识别方法,反演该降水对应的中气旋相关参数;
在多普勒天气雷达探测到该降水有中气旋且满足如下条件时,选取该降水为强降水超级单体个例:
(1)涡旋垂直伸展至少3km,涡旋底部的高度不超过5km;
(2)距离雷达站不同距离的旋转速度满足二维特征强度阈值;
(3)涡旋持续两个体扫及以上。
S120、筛选出选取的各强降水超级单体个例对应的风暴特征参数,形成特征数据集;
利用SHAP方法筛选超级单体风暴特征参数,构建特征数据集。提取所有强降水超级单体风暴的中气旋特征,包括中气旋的底高、顶高、中气旋直径、最大切变伸展高度以及切变强度;提取强降水超级单体风暴地形高度、下垫面类型数据、风暴发生的初始时间以及风暴路径的经纬度信息。
提取该地2020-2022年共3年的地面降水观测数据和雷达数据,采用上述的强降水超级单体的筛选标准,选定70个自动站点上的所有强降水超级单体风暴。超级单体的生命史从有中气旋出现的时刻为起始时刻,消失时刻为终止时刻。提取与强降水超级单体生命史相同时段的雷达观测的中气旋底高、顶高、中气旋直径、最大切变伸展高度以及切变强度;强降水超级单体风暴路径上的地形高度、下垫面类型数据以及风暴发生的初始时间,形成样本数据集。然后利用SHAP方法进行特征重要性筛选,具体筛选步骤如下:
首先,计算基线预测值,即模型在没有任何输入特征时的预测,通常是训练数据的平均输出。其次,通过权衡组合得到贡献。对于上述每个特征,SHAP算法考虑包含和不包含该特征的所有可能特征子集,对于每个特征子集,算法计算出模型预测的变化。接着,应用Shapley值公式计算每个特征对于预测的平均边际贡献。根据Shapley值的定义,对所有特征子集的贡献进行加权求和。特征i的Shapley值计算如下:
;
其中:N是所有特征的集合;|N|是特征集合 N的总数量,S是不包含特征i的特征子集;|S|是集合S中的特征数量。v(S)是特征子集S的模型预测值;v(S∪i)是在特征子集S中添加特征 i 后的模型预测值。 最后进行规范化处理:将计算得到的所有特征的Shapley值进行求和,再加上基线值,以确保最后得到的总和等于模型对特定输入的实际预测值。
利用上述方法最终计算筛选得到8个重要相关变量,分别是:最强切变、地形高度、顶高、DIAM AZ(中气旋直径方位角方向)、底高、最强切变高度、DIAM RAD(中气旋直径径向方向)和下垫面类型。各特征SHAP值如图2所示。
将上述8个特征参数的数据和是否形成强降水超级单体作为训练数据集,据此形成强降水超级单体识别预警训练数据集。
S130、对获得的特征数据集进行数据处理,对数据进行处理时主要包括如下步骤:清洗数据;处理缺失值;对特征值进行标准化或归一化处理等。
S200、依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
将数据集分为训练集和测试集,采用70%的数据作为训练集,30%作为测试集。
选用随机森林、贝叶斯、XGBoost、CatBoost、LightGBM、SVM等多种机器学习模型分别进行训练学习,计算得到上述各模型的POD(预报命中率)、FAR(空报率)、CSI(临界成功指数)、BIAS(偏差)等各项分类评分如表1所示。
表1 模型各项分类评分
综合上述各项指标,最终对比选定CatBoost为最优机器学习模型,设置合适的超参数,如学习率、树的深度和数量等作进一步的训练。
交叉验证:使用交叉验证方法(如K折交叉验证)来评估模型的泛化能力和性能。这有助于防止过拟合,并确保模型在未见数据上的表现良好。
模型评估:利用一系列评估指标(如准确率、召回率、F1分数等)对模型进行评估,确定其在识别预警强降水超级单体风暴方面的效能。
通过上述步骤完成强降水超级单体识别预警模型的构建。
对CatBoost模型做进一步的调整和优化,以提高其预测的准确性。在CatBoost中进行调优时,关键是找到一个平衡点,即模型复杂度(如树的深度)和学习速度(如学习率)的最优组合。如图3所示,当树的深度从 2 增加到 6;学习率从 0.001 提升到 0.1时,CSI都显是先著提升达到峰值,从而保证了模型拟合及学习率均达到最优解。
S300、将待识别区域的天气雷达组网观测数据、地形数据及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性,具体包括:
进行阈值设定并输出识别预警产品。确定模型识别结果的阈值为0.5,当识别结果大于0.5时,有强降水超级单体发生,结果越接近1,则强降水超级单体出现的可能性越大。模型每6分钟输出识别预警产品。
2023年9月19日一次真实强降水超级单体通过本发明实施例提供的方法识别结果:
该区域模型21:18分的识别结果为0.6,表明该区域所在范围(中气旋直径范围)有强降水超级单体发生。实况降水显示,在21:20-22:20,该处小时降水量为109.9 mm。
由于强降水超级单体的发生与多种影响因子相关,利用传统线性统计方法寻求它们之间的关系并进行预报存在较大的局限性。本发明利用先进的机器学习方法,考虑了强降水超级单体与多因子之间的非线性关系,增强了对复杂背景场的解析能力。该预警方法可以直接应用于天气预报和灾害预警系统,有助于及时向公众和相关部门提供关键信息,从而采取有效措施以减少经济损失和人员伤亡。
本发明的一些实施例中提供一种基于机器学习的强降水超级单体识别预警系统,包括:
数据采集模块,用于选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
模型构建模块,用于依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
预警产品输出模块,用于将待识别区域的天气雷达组网观测数据、地形数据和下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行基于机器学习方法的强降水超级单体识别预警方法,具体包括:
S100、选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
S200、依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
S300、将待识别区域的天气雷达组网观测数据、地形数据和下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机指令,该计算机指令使计算机执行上述基于机器学习的强降水超级单体识别预警方法,具体包括:
S100、选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
S200、依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
S300、将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
再一方面,本发明还提供一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,处理器调用存储器中的逻辑指令,以执行上述的基于机器学习的强降水超级单体识别预警方法,具体包括:
S100、选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
S200、依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
S300、将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。
Claims (10)
1.一种基于机器学习的强降水超级单体识别预警方法,其特征在于,包括如下步骤:
S100、选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
S200、依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
S300、将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
2.根据权利要求1所述的基于机器学习的强降水超级单体识别预警方法,其特征在于,步骤S100所述选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集,包括:
S110、选取强降水超级单体个例;
S120、筛选出选取的各强降水超级单体个例对应的风暴特征参数,形成特征数据集;
S130、对获得的特征数据集进行数据处理。
3.根据权利要求2所述的基于机器学习的强降水超级单体识别预警方法,其特征在于,步骤S110所述选取强降水超级单体个例,具体方法为:
S111、获取逐小时降水量的统计数据,并按照从小到大的顺序,将逐小时降水量重新排列,获得序列:
;
其中,为/>在序列中的序号,/>为序列总的样本数;
S112、据下式计算的概率P:
;
当P=99.9%时,所对应的值,作为强降水的最低小时降水量标准;
S113、根据自动站资料获得满足强降水标准的降水对应位置和时间,并利用中气旋识别方法,反演该降水对应的中气旋相关参数;
S114、在多普勒天气雷达探测到该降水有中气旋且满足如下条件时,选取该降水为强降水超级单体个例:
(1)涡旋垂直伸展至少3km,涡旋底部的高度不超过5km;
(2)距离雷达站不同距离的旋转速度满足二维特征强度阈值;
(3)涡旋持续两个体扫及以上。
4.根据权利要求3所述的基于机器学习的强降水超级单体识别预警方法,其特征在于,步骤S120所述筛选出选取的各强降水超级单体个例对应的风暴特征参数,形成特征数据集,具体方法为:
S121、提取所有强降水超级单体个例的中气旋特征,以及强降水超级单体个例的地形高度、下垫面类型数据、风暴发生的初始时间以及风暴路径的经纬度信息;
S122、利用SHAP方法对S121获得的全部特征进行计算筛选,得到八个重要相关变量,分别是:最强切变、地形高度、顶高、中气旋直径方位角方向、底高、最强切变高度、中气旋直径径向方向和下垫面类型;
S123、将S122筛选出的八个特征参数的数据和该特征对应是否形成强降水超级单体作为训练数据集,据此形成强降水超级单体识别预警模型的训练特征数据集。
5.根据权利要求4所述的基于机器学习的强降水超级单体识别预警方法,其特征在于,步骤S130所述对获得的特征数据集进行数据处理,包括清洗数据、处理缺失值,以及对特征值进行标准化或归一化处理。
6.根据权利要求1所述的基于机器学习的强降水超级单体识别预警方法,其特征在于,步骤S200所述依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型,包括:
S210、依据特征数据集,采用随机森林、贝叶斯、XGBoost、CatBoost、LightGBM和SVM多种机器学习模型分别进行训练学习;
S220、计算各模型的预报命中率、空报率、临界成功指数与偏差,选择CatBoost作为最优框架,设置合适的超参数对最优模型作进一步的训练,获得强降水超级单体识别预警模型。
7.根据权利要求6所述的基于机器学习的强降水超级单体识别预警方法,其特征在于,步骤S220完成后还采用交叉验证以及模型评估方法对强降水超级单体识别预警模型进行验证和评估。
8.一种基于机器学习的强降水超级单体识别预警系统,其特征在于,包括:
数据采集模块,用于选取强降水超级单体个例,并筛选出各强降水超级单体个例对应的风暴特征参数,由此形成特征数据集;
模型构建模块,用于依据特征数据集,采用基于CatBoost的框架,训练获得强降水超级单体识别预警模型;
预警产品输出模块,用于将待识别区域的天气雷达组网观测数据、地形数据以及下垫面数据输入所述强降水超级单体识别预警模型,获得识别结果,在识别结果超出设定阈值时,判断有强降水超级单体发生可能性。
9.一种非暂态计算机可读存储介质,其上存储有计算机指令,该计算机指令使计算机执行权利要求1-7任意一项所述的基于机器学习的强降水超级单体识别预警方法。
10.一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,处理器调用存储器中的逻辑指令,以执行权利要求1-7任意一项所述的基于机器学习的强降水超级单体识别预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410303465.8A CN117908166B (zh) | 2024-03-18 | 2024-03-18 | 基于机器学习的强降水超级单体识别预警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410303465.8A CN117908166B (zh) | 2024-03-18 | 2024-03-18 | 基于机器学习的强降水超级单体识别预警方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117908166A true CN117908166A (zh) | 2024-04-19 |
CN117908166B CN117908166B (zh) | 2024-05-24 |
Family
ID=90690898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410303465.8A Active CN117908166B (zh) | 2024-03-18 | 2024-03-18 | 基于机器学习的强降水超级单体识别预警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117908166B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170336533A1 (en) * | 2016-05-20 | 2017-11-23 | The Climate Corporation | Radar based precipitation estimates using spatiotemporal interpolation |
CN111796343A (zh) * | 2020-06-15 | 2020-10-20 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于人工智能算法的强对流天气短时临近识别方法 |
WO2021196743A1 (zh) * | 2020-03-31 | 2021-10-07 | 中国科学院空天信息创新研究院 | 热带气旋强度预报信息的生成方法及系统 |
KR102489376B1 (ko) * | 2021-12-21 | 2023-01-18 | (주)에코브레인 | 실시간 강우패턴 반응형 집중호우 예측시스템 |
CN115860268A (zh) * | 2023-02-20 | 2023-03-28 | 南京信息工程大学 | 基于cnn-xgboost模型的短时强降水预测方法 |
CN115933008A (zh) * | 2022-11-22 | 2023-04-07 | 广东电网有限责任公司广州供电局 | 一种强对流天气预报预警方法 |
CN116609858A (zh) * | 2023-05-06 | 2023-08-18 | 中国人民解放军国防科技大学 | 一种基于可解释性XGBoost模型的热带气旋大气波导预测方法及系统 |
CN116680604A (zh) * | 2023-04-28 | 2023-09-01 | 广东省阳江市气象局 | 强对流特征分类识别方法、电子设备及介质 |
CN117008217A (zh) * | 2023-07-11 | 2023-11-07 | 哈尔滨工程大学 | 一种融合自注意力模块与Unet模型的短时强降水预报方法 |
WO2023216583A1 (zh) * | 2022-05-13 | 2023-11-16 | 河海大学 | 基于多通道深度残差收缩网络的冰雹天气识别与分类方法 |
-
2024
- 2024-03-18 CN CN202410303465.8A patent/CN117908166B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170336533A1 (en) * | 2016-05-20 | 2017-11-23 | The Climate Corporation | Radar based precipitation estimates using spatiotemporal interpolation |
WO2021196743A1 (zh) * | 2020-03-31 | 2021-10-07 | 中国科学院空天信息创新研究院 | 热带气旋强度预报信息的生成方法及系统 |
CN111796343A (zh) * | 2020-06-15 | 2020-10-20 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于人工智能算法的强对流天气短时临近识别方法 |
KR102489376B1 (ko) * | 2021-12-21 | 2023-01-18 | (주)에코브레인 | 실시간 강우패턴 반응형 집중호우 예측시스템 |
WO2023216583A1 (zh) * | 2022-05-13 | 2023-11-16 | 河海大学 | 基于多通道深度残差收缩网络的冰雹天气识别与分类方法 |
CN115933008A (zh) * | 2022-11-22 | 2023-04-07 | 广东电网有限责任公司广州供电局 | 一种强对流天气预报预警方法 |
CN115860268A (zh) * | 2023-02-20 | 2023-03-28 | 南京信息工程大学 | 基于cnn-xgboost模型的短时强降水预测方法 |
CN116680604A (zh) * | 2023-04-28 | 2023-09-01 | 广东省阳江市气象局 | 强对流特征分类识别方法、电子设备及介质 |
CN116609858A (zh) * | 2023-05-06 | 2023-08-18 | 中国人民解放军国防科技大学 | 一种基于可解释性XGBoost模型的热带气旋大气波导预测方法及系统 |
CN117008217A (zh) * | 2023-07-11 | 2023-11-07 | 哈尔滨工程大学 | 一种融合自注意力模块与Unet模型的短时强降水预报方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117908166B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112506990B (zh) | 一种基于时空信息的水文数据异常检测方法 | |
CN113496104A (zh) | 基于深度学习的降水预报订正方法及系统 | |
Schirmer et al. | Statistical forecasting of regional avalanche danger using simulated snow-cover data | |
Murgatroyd et al. | A predictive model for improving placement of wind turbines to minimise collision risk potential for a large soaring raptor | |
CN113723446B (zh) | 地灾监测预警方法、装置、计算机设备及存储介质 | |
CN115600513B (zh) | 一种岩溶塌陷监测预警及防控一体化信息化模拟研判系统 | |
CN116027324A (zh) | 基于毫米波雷达的跌倒检测方法、装置及毫米波雷达设备 | |
CN115728841A (zh) | 基于检验评估的强对流天气预警方法 | |
CN117523420B (zh) | 一种基于雷达产品数据的闪电落区识别方法及系统 | |
CN117908166B (zh) | 基于机器学习的强降水超级单体识别预警方法 | |
CN110808947B (zh) | 一种自动化的脆弱性量化评估方法及系统 | |
CN112347872B (zh) | 一种基于地面观测的雷暴大风风暴体标识方法及系统 | |
Talukdar et al. | Application of hybrid machine learning algorithms for flood susceptibility modeling | |
CN112232329A (zh) | 入侵信号识别的多核svm训练、报警方法、装置及系统 | |
CN117235434B (zh) | 林业碳汇项目基线构建方法、系统、终端及介质 | |
Zebiri et al. | Biogeography based optimization for distributed CFAR detection in Pareto clutter | |
CN117934139B (zh) | 基于Stacking融合算法的银行卡诈骗预测方法 | |
CN117725839B (zh) | 基于多源数据专注监测的输电塔易损性评估方法 | |
CN111783821B (zh) | 强对流阵风的判别方法及系统 | |
CN118425992B (zh) | 一种适于轨道交通列车的卫星导航欺骗干扰评估方法和系统 | |
Bharath et al. | Flood Detection on Adverse Natural Conditions using CatBoost algorithm | |
Ndulue et al. | Modeling Of a Data Driven Flood Detection and Early Warning System Using Machine Learning Technique | |
Kumar et al. | Improving flood susceptibility forecasting with an innovative deep learning approach | |
Nocerino et al. | Maximizing Prediction Accuracy in Wildfire Severity: A Comprehensive Analysis of Machine Learning Models Using Environmental Features | |
Macdonald et al. | Robust Storm Surge Forecasts for Early Warning System: A Machine Learning Approach Using Adaptive Monte Carlo Bayesian Model Selection Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |