CN117520902A - 基于机器学习的南海台风生成预测方法 - Google Patents
基于机器学习的南海台风生成预测方法 Download PDFInfo
- Publication number
- CN117520902A CN117520902A CN202311654899.4A CN202311654899A CN117520902A CN 117520902 A CN117520902 A CN 117520902A CN 202311654899 A CN202311654899 A CN 202311654899A CN 117520902 A CN117520902 A CN 117520902A
- Authority
- CN
- China
- Prior art keywords
- typhoon
- convolution
- data
- south china
- branches
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 title claims description 25
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000011161 development Methods 0.000 claims description 41
- 239000013598 vector Substances 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 2
- 238000013277 forecasting method Methods 0.000 abstract description 2
- 239000011159 matrix material Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical class C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Environmental & Geological Engineering (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及台风预报技术领域,尤其涉及一种基于机器学习的南海台风生成预测方法,包括以下步骤:S10,确定出用于南海台风预测的多个关键因子,分别为200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风;S20,基于各个关键因子的数据,构造南海扰动样本集;S30,设计为ResNet34网络的结构,并基于所述南海扰动/低压样本集进行训练,最终得到用于南海台风预报的南海台风生成预测模型;S40,采集当前已形成的南海扰动的关键因子的数据,利用所述南海台风生成预测模型对所述关键因子的数据进行处理,输出得到未来该扰动是否发展为台风的预报结论。本发明不仅可以提高预报准确度,而且还可以提高预报效率。
Description
技术领域
本发明属于台风预报技术领域,尤其涉及一种基于机器学习的南海台风生成预测方法。
背景技术
南海台风是影响华南地区的主要天气系统之一,台风影响或登陆期间,常常会给华南地区带来强降水、雷电和大风等灾害性天气。南海扰动/低压能否加强为台风,对气象要素预报有一定的指示作用。
随着机器学习技术的飞速发展,使得利用机器学习技术来统筹研究台风所处环境场、台风下垫面海洋反馈、台风历史观测路径和强度发展等要素成为可能。本发明即是提出一种基于机器学习的南海台风生成预测方法。
发明内容
本发明的目的在于提供一种基于机器学习的南海台风生成预测方法,利用机器学习的客观性及强大学习能力,提高台风预报的准确性及效率,而且通过更准确的输入变量,进一步提高预报效率。
为了实现上述目的,本发明提供了一种基于机器学习的南海台风生成预测方法,包括以下步骤:
S10,确定出用于南海台风预测的多个关键因子,分别为200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风;
S20,基于各个关键因子的数据,构造南海扰动样本集;
S30,设计为ResNet34网络的结构,并基于所述南海扰动/低压样本集进行训练,最终得到用于南海台风预报的南海台风生成预测模型;
S40,采集当前已形成的南海扰动的关键因子的数据,利用所述南海台风生成预测模型对所述关键因子的数据进行处理,输出得到未来该扰动是否发展为台风的预报结论。
所述S10包括以下步骤:
S101,初始确定出影响台风发展的M个因子,M为大于1的整数;
S102,以中国气象局最佳台风路径集和ERA5再分析数据为基础,构造样本集;
S103,基于所述样本集,分别针对每个因子划分出发展组和不发展组,将发展组数据和不发展组数据均转换为向量,并计算余弦相似度,根据余弦相似度值筛选出所述多个关键因子。
上述方案中,先初步确定出影响台风的代表性因子,然后再基于历史数据构造样本集,再基于样本集筛选出少量的关键因子。基于余弦相似度进行关键因子筛选,可靠性及准确信高。
所述南海台风生成预测模型包含5个卷积组,每个卷积组包含1个或多个卷积计算单元,一个卷积计算单元包括卷积核、归一化层、线性输出层。
与现有技术相比,本发明不仅可以提高预报准确度,而且还可以提高预报效率。本发明的技术优势具体表现在以下方面:
1)预测模型仅5个输入变量,输入变量少,一方面是数据资料获取容易,另一方面是数据处理简单,预测模型轻量化,相较于传统数值模式,不需要服务器算力,仅使用单机算力即可实现预测,实现成本低。
2)由于预测模型输入变量少,因此计算效率高,继而大大提高了预测模型的训练效率。
3)预测模型的输入变量是从众多影响因子中基于余弦相似度筛选出来的关键因子,且配合ResNet34网络结构,使得台风预测的准确度也有所提升。
本发明还具有的其他优势请见实施例部分的相关描述。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于机器学习的南海台风生成预测方法的流程图。
图2为步骤S10确定出用于南海台风预测的多个关键因子的流程图。
图3为12个因子的余弦相似度值对比图。
图4为S20基于各个关键因子的数据构造南海扰动样本集的流程图。
图5a、图5b分别为南海台风生成预测模型中第二个卷积组、第三个卷积组的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
请参阅图1,本实施例中提供了一种基于机器学习的南海台风生成预测方法,包括以下步骤:
S10,确定出用于南海台风预测的多个关键因子,分别为200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风。
台风的生成和发展受海温、水平风切变、涡度、低层湿度、高层散度、水汽混合比等气象海洋物理量的限制和影响。因此,影响台风生成的气象要素有很多,常规技术是将所有气象要素都用来作为台风预测的因子,然而,要素越多,预测所分析的数据就越多,分析所消耗的时间就越长。然而经过研究发现,并不是所有气象要素对台风生成的影响程度相同,即有的气象要素影响程度大,有的气象要素的影响程度小,基于预测结果的准确性要求和预测效率提高的平衡,对于影响程度小的气象要素实际是可以忽略的。本实施例方法就是从众多的气象要素中筛选出重要的气象要素,以此作为南海台风预测的关键因子。
S20,基于各个关键因子的数据,构造南海扰动(低压)样本集。
利用中国气象局最佳台风路径集和ERA5再分析资料,筛选出南海海域上,热带扰动/低压的每一个时间片,提取每个时间片1000km*1000km的范围内的各个关键因子的数据,形成南海扰动/低压样本集。即,提取每个时间片1000km*1000km的范围内的200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风数据,形成南海扰动/低压样本集。
S30,设计为ResNet34网络的结构,并基于所述南海扰动/低压样本集进行训练,最终得到用于南海台风预报的南海台风生成预测模型。
所述南海台风生成预测模型为ResNet34网络,包含5个卷积组,每个卷积组包含1个或多个卷积计算单元(Conv->BN->ReLU)。
S40,采集当前已形成的南海扰动(低压)的200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风数据,利用预先训练完成的南海台风生成预测模型对采集的5个气象要素数据进行处理,输出得到未来该扰动(低压)是否发展为台风的预报结论。
采集到200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风数据,确定数据矩阵是5*41*41后直接输入预测模型即可输出预测结果,处理简单。
更具体地,请参阅图2,上述步骤S10中,包含以下步骤:
S101,初始确定出影响台风发展的因子。
本实施例选取了200hPa散度、500hPa位势涡度、925hPa位势涡度、500hPa涡度、1000hPa相对湿度、1000hPa温度,500hPa径向风、500hPa纬向风、500hPa垂直速度、925hPa径向风、925hPa纬向风、925hPa垂直速度,共12个要素作为影响台风发展的因子。这些因子是对台风强度变化有重要作用的气象要素,比较有代表性。
S102,以中国气象局最佳台风路径集和ERA5(欧洲中心数据集)再分析数据为基础,构造样本集。
具体的,利用中国气象局最佳台风路径集数据,包含编号的台风和未编号的低压/扰动,将最佳台风路径集中的南海个例筛选出来,再根据是否发展成台风分为两类,分别为发展组和不发展组。
将所有个例中每一个未达到热带风暴级的时间片的扰动/低压所在位置的物理参数(如下表所示)作为一个样本。时间片指的是某一时刻,例如05时某个低压为一个样本,08时这个低压为另一个样本。中国气象局最佳台风路径集标记每个台风每个时刻的等级及位置,热带风暴级指的是其中心附近地面最大风力达8-9级(17.2-24.4米/秒)的台风。需要说明的是,每个样本均是未编号时刻的数据,也就是只选取未编号时刻的数据,同时也包含整个生命周期都没有发展为台风的热带扰动/低压。
中国气象局最佳台风路径集中,包含编号的台风,以及整个生命周期都没有编号的低压,数据格式及说明如下:
一个台风/低压数据中包含N个时间片的物理参数,将每个台风/低压数据中未编号的时刻作为一个样本,将样本分成两类:发展或不发展。
编号意味着已经加强为台风,故发展后编号的时间片不算在样本集中。基于筛选出来的个例,通过分类和数据处理,共得到2387个样本,其中,发展的样本1399例,不发展的样本988例。分别提取每个样本的12个要素的数据,选取范围是以南海扰动中心为中心,周围1000km*1000km(差不多是一般南海台风的大小)范围的要素数据,形成样本集。
S103,利用余弦相似度确定南海台风生成的关键因子。
余弦相似度是通过测量两个向量之间的夹角的余弦值来度量两者之间的相似程度。0度角的余弦值是1,其他的任何角度的余弦值都不大于1,最小值是-1,从而两个向量之间角度的余弦值确定了两个向量是否指向同一个方向。两个向量的指向相同时,余弦相似度为1,当两个向量的夹角是90度时,余弦相似度的值为0,两个向量的指向完全相反时,余弦相似度的值为-1。这个结果与向量的长度无关,仅仅与向量的指向有关。余弦相似度通常用于正空间,因此一般的值为0到1之间。两个向量之间的余弦值可以通过使用欧几里得点积公式求出:
相似度=(A·B)/‖A‖‖B‖(式1)
其中,A,B均为向量,“·”表示点积。
为了量化各个变量之间的差异,将台风的各个影响要素转换成一个向量,用向量之间的垂直投影距离长短(余弦相似度法)来判断是否存在显著差异。将所有样本数据按照发展组和不发展组分别对时间维取平均,得到某一变量发展组和不发展组两个组的均值。这个变量发展组和不发展组对应的均值都是一组41*41矩阵,再对每个二维矩阵按行首尾相接,分别转换为一维向量。分别对比同一个变量中,发展组和不发展组扰动对应的两个向量的余弦距离的大小(式1,越接近1表示越相似)。之后按照同样的方法,对以上合成分析的12个变量分别计算余弦相似度值。
下面以200hPa散度这个变量为例,取南海扰动中心附近1000km*1000km的200hPa散度值,对应格点数据为41*41格点数据,组成41*41的矩阵。再将所有样本分为两组,发展组和不发展组,并分别对每组数据通过合成分析取平均值,得到发展组200hPa散度平均值矩阵A1,和不发展组200hPa散度平均值矩阵B1,分别表示为式2、式3。
利用相似度公式,分别计算发展组与不发展组200hPa散度相似度C1=(A1·B1)/‖A1‖‖B1‖。
利用同样的方法,对12个变量分别求相似度,得到相似度C1,C2,...,C12,分别对应变量200hPa散度、500hPa位势涡度、925hPa位势涡度、500hPa涡度、1000hPa相对湿度和温度、500hPa和925hPa风的经、纬向风以及垂直速度。计算结果如图3所示。
余弦距离越小(远离1)表明该要素在发展和不发展南海扰动之间的差别就越大,可拟作为优选的预报指标。从上图2的余弦距离结果中可以看出,余弦距离最小的五个要素分别是:200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风,因此选取该五个要素作为南海台风生成的关键因子。
本实施例中,具体的,如图4所示,上述步骤S20包括以下步骤:
S201,选择CMA热带气旋最佳路径数据集下载热带气旋数据。
选择中国气象局热带气旋资料中心提供的CMA热带气旋最佳路径数据集。该数据集提供1949以来年西北太平洋(含南海,赤道以北,东经180°以西)海域热带气旋每6小时的位置和强度,按年份分别放在单独的文本文件中。本研究选取1979年至2018年的数据进行下载。
S202,对热带气旋数据进行预处理,形成分类文件南海扰动统计数据集,所述预处理包括提取热带扰动和对扰动进行分类。
将下载的按年统计存放的多个文本文件整合为一个csv文件,方便后续处理。
首先定义南海范围为:2.5°N—23.5°N,99.2°E—121.8°E,再将位于上述区域的扰动提取出来。最后根据强度标记,将这些热带扰动分为发展和不发展两类。分类方法是:若整个扰动从开始至结束均为热带低压以下(含)的级别,则定义为不发展;若扰动发展过程中达到过热带低压以上的强度,则定义为发展。最终形成分类文件南海扰动统计数据集。
S203,从气象数据资料ERA5数据中下载关键因子的数据。
下载所需变量表为:200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风数据。即从ERA5数据中下载200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风数据。
S204,从所述南海扰动统计数据集中提取台风资料作为目标。
从所述南海扰动统计数据集中提取出所有南海扰动个例的时间、经度、纬度和是否发展的数据。提取时间、经度、纬度是为了从ERA5数据集中找到对应的时间和经纬度范围的数据。
S205,基于关键因子的数据和所述南海扰动统计数据集制作训练集。
具体的,首先,从下载的关键因子数据中提取相应时间、对应位置的台风多变量高维特征作为训练集。然后,将训练输入目标设定为5*41*41的三维图像。然后,从所述南海扰动统计数据集提取每年的台风时刻、位置信息。然后,从ERA5数据中的5个关键因子数据中框出对应时刻、中心位置为台风中心的1000km*1000km范围,作为训练集输入变量。最后,从南海扰动统计数据集中提取最终强度(最终强度是指台风整个生命周期的最大强度)作为是否发展的判据,即模型的训练目标(target);将输入变量和训练目标合成训练集。
例如,具体实现时,将ERA5数据根据S204中的时间和位置信息提取得到5通道*41*41的三维图像,这就是训练集的输入变量。然后,在S204得到的数据中提取每个台风个例整个生命周期的最大强度,若强度小于等于1(热带低压)则定为未发展,标记为0,若强度大于等于2(热带风暴)则定为发展,标记为1。将每个台风个例每个时次的记录作为一个样本,最终的样本形式为:
上述步骤S30中,南海台风生成预测模型为ResNet34网络,包含5个卷积组。每个卷积组包含1个或多个卷积计算单元(Conv->BN->ReLU)。Conv指卷积核,BN(BatchNormalization)指归一化层,ReLU指线性输出层。
第一个卷积组只包含1次卷积计算操作,使用3×3卷积核,之后进行批量归一化层(Batch Normalization)和线性输出层(ReLU)。
第二个卷积组包含3个BasicBlock模块。如图5a所示,每个BasicBlock模块包含两个分支:(1)、未经处理直接输出;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入下一个BasicBlock模块。
如图5b所示,第三个卷积组包含4个BasicBlock模块,在该组第1个BasicBlock模块有两个分支:(1)、经过一次1×1的卷积处理;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入第2个BasicBlock模块。第2个至第4个BasicBlock模块结构与第二卷积组的BasicBlock模块相同,包含两个分支:(1)、未经处理直接输出;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入下一个BasicBlock模块。
第四个卷积组6个BasicBlock模块,在该组第1个BasicBlock模块有两个分支:(1)、经过一次1×1的卷积处理;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入第2个BasicBlock模块。第2个至第5个BasicBlock模块结构与第二卷积组的BasicBlock模块相同,包含两个分支:(1)、未经处理直接输出;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入下一个BasicBlock模块。
第五个卷积组包括3个BasicBlock模块,在该组第1个BasicBlock模块有两个分支:(1)、经过一次1×1的卷积处理;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入第2个BasicBlock模块。第2个至第3个BasicBlock模块结构与第二卷积组的BasicBlock模块相同,包含两个分支:(1)、未经处理直接输出;(2)、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层(ReLU),作为输入进入下一个BasicBlock模块。
第五卷积组输出的结果再依次经过平均池化层、线性输出层和二分类输出层,最终得到是(1)否(0)发展两个结论。
构建好南海台风发展预测模型后,对该模型进行训练:
将1979-2016年台风最佳路径数据集和对应时次的ERA5气象要素数据构建训练样本,即是指步骤S20中构建的样本集。
利用台风发展预测模型,对每个样本进行处理,得到未来该扰动或低压是否发展为台风的结论;根据预测结论和实际结果计算损失函数CE loss,再基于损失函数值和梯度下降法(Stochastic Gradient Descent,SGD),更新台风发展预测模型的参数。损失函数如下:
其中,M:正样本数量,N:负样本数量,yi:真实值,yi=1表示发展成台风,yi=0表示未发展成台风,pi:预测值,pi=1表示发展成台风,pi=0表示未发展成台风。
另外,针对模型学习率,采用学习率动态调整方法(HTD下降法):
lr=lrmin+(lrlast-lrmin)*(1-tanh(lrlo+(lrup-lrlo)*r))/2
其中,lrmin=0,lrlo=-6,lrup=3。lrlast表示前一次更新的学习率、r表示训练轮数比例,即当前训练轮数/总的设计训练轮数,tanh()是双曲正切函数。
学习率动态调整方法在训练的初始阶段让学习率的下降较慢,中间加快,最后又减慢,呈现一个“tanh”图像。学习率的动态下降能够有效加速模型的收敛过程。
用2017~2018年的所有南海低压/扰动个例进行测试,结果显示,在287个样本中有228个预测正确,其中发展的个例预测正确184个,准确率达91%。
以上所述实施例,仅为本发明具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改、替换和改进等等,这些修改、替换和改进都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (7)
1.一种基于机器学习的南海台风生成预测方法,其特征在于,包括以下步骤:
S10,确定出用于南海台风预测的多个关键因子,分别为200hPa散度、500hpa纬向风、925hpa垂直速度、925hpa纬向风和500hpa径向风;
S20,基于各个关键因子的数据,构造南海扰动样本集;
S30,设计为ResNet34网络的结构,并基于所述南海扰动/低压样本集进行训练,最终得到用于南海台风预报的南海台风生成预测模型;
S40,采集当前已形成的南海扰动的关键因子的数据,利用所述南海台风生成预测模型对所述关键因子的数据进行处理,输出得到未来该扰动是否发展为台风的预报结论。
2.根据权利要求1所述的基于机器学习的南海台风生成预测方法,其特征在于,所述S10包括以下步骤:
S101,初始确定出影响台风发展的M个因子,M为大于1的整数;
S102,以中国气象局最佳台风路径集和ERA5再分析数据为基础,构造样本集;
S103,基于所述样本集,分别针对每个因子划分出发展组和不发展组,将发展组数据和不发展组数据均转换为向量,并计算余弦相似度,根据余弦相似度值筛选出所述多个关键因子。
3.根据权利要求2所述的基于机器学习的南海台风生成预测方法,其特征在于,所述M个因子分别为:200hPa散度、500hPa位势涡度、925hPa位势涡度、500hPa涡度、1000hPa相对湿度、1000hPa温度,500hPa径向风、500hPa纬向风、500hPa垂直速度、925hPa径向风、925hPa纬向风、925hPa垂直速度。
4.根据权利要求1所述的基于机器学习的南海台风生成预测方法,其特征在于,所述S20包括以下步骤:
S201,选择CMA热带气旋最佳路径数据集下载热带气旋数据;
S202,对热带气旋数据进行预处理,形成分类文件南海扰动统计数据集,所述预处理包括提取热带扰动和对扰动进行分类;
S203,从气象数据资料ERA5数据中下载关键因子的数据;
S204,从所述南海扰动统计数据集中提取台风资料作为目标;
S205,基于关键因子的数据和所述南海扰动统计数据集制作训练集。
5.根据权利要求4所述的基于机器学习的南海台风生成预测方法,其特征在于,所述S205具体为:首先,从下载的关键因子数据中提取相应时间、对应位置的台风多变量高维特征作为训练集;然后,将训练输入目标设定为5*41*41的三维图像;然后,从所述南海扰动统计数据集提取每年的台风时刻、位置信息;然后,从ERA5数据中框出对应时刻、中心位置为台风中心的1000km*1000km范围,作为训练集输入变量;最后,从所述南海扰动统计数据集中提取最终强度作为训练目标;将输入变量和训练目标合成训练集。
6.根据权利要求1所述的基于机器学习的南海台风生成预测方法,其特征在于,所述南海台风生成预测模型包含5个卷积组,每个卷积组包含1个或多个卷积计算单元,一个卷积计算单元包括卷积核、归一化层、线性输出层。
7.根据权利要求6所述的基于机器学习的南海台风生成预测方法,其特征在于,第一个卷积组只包含1次卷积计算操作,使用3×3卷积核,之后进行批量归一化层和线性输出层;
第二个卷积组包含3个BasicBlock模块,每个BasicBlock模块包含两个分支,分别为未经处理直接输出、经过两次3×3的卷积处理;然后将两个分支输出进行结合输出至线性输出层,作为输入进入下一个BasicBlock模块;
第三个卷积组包含4个BasicBlock模块,在该组第1个BasicBlock模块有两个分支,分别为经过一次1×1的卷积处理、经过两次3×3的卷积处理,然后将两个分支输出进行结合输出至线性输出层,作为输入进入第2个BasicBlock模块;第2个至第4个BasicBlock模块结构与第二卷积组的BasicBlock模块相同,包含两个分支,分别为未经处理直接输出、经过两次3×3的卷积处理,然后将两个分支输出进行结合输出至线性输出层,作为输入进入下一个BasicBlock模块;
第四个卷积组6个BasicBlock模块,在该组第1个BasicBlock模块有两个分支,分别为经过一次1×1的卷积处理、经过两次3×3的卷积处理,然后将两个分支输出进行结合输出至线性输出层,作为输入进入第2个BasicBlock模块;第2个至第5个BasicBlock模块结构与第二卷积组的BasicBlock模块相同,包含两个分支,分别为未经处理直接输出、经过两次3×3的卷积处理,然后将两个分支输出进行结合输出至线性输出层,作为输入进入下一个BasicBlock模块;
第五个卷积组包括3个BasicBlock模块,在该组第1个BasicBlock模块有两个分支,分别为经过一次1×1的卷积处理、经过两次3×3的卷积处理,然后将两个分支输出进行结合输出至线性输出层,作为输入进入第2个BasicBlock模块;第2个至第3个BasicBlock模块结构与第二卷积组的BasicBlock模块相同,包含两个分支,分别为未经处理直接输出、经过两次3×3的卷积处理,然后将两个分支输出进行结合输出至线性输出层,作为输入进入下一个BasicBlock模块;
第五卷积组输出的结果再依次经过平均池化层、线性输出层和二分类输出层,最终得到是否发展两个结论。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311654899.4A CN117520902A (zh) | 2023-12-05 | 2023-12-05 | 基于机器学习的南海台风生成预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311654899.4A CN117520902A (zh) | 2023-12-05 | 2023-12-05 | 基于机器学习的南海台风生成预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117520902A true CN117520902A (zh) | 2024-02-06 |
Family
ID=89764470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311654899.4A Pending CN117520902A (zh) | 2023-12-05 | 2023-12-05 | 基于机器学习的南海台风生成预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117520902A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020017110A (ko) * | 2000-08-28 | 2002-03-07 | 신대진 | 진화전략과 쌍선형 회귀성 신경망을 이용한 태풍 예측시스템 |
CN112329172A (zh) * | 2020-11-05 | 2021-02-05 | 上海交通大学 | 基于并联式神经网络的盾构机刀盘扭矩预测方法及系统 |
CN114048929A (zh) * | 2022-01-12 | 2022-02-15 | 深圳希施玛数据科技有限公司 | 股价数据预测方法及装置 |
CN114818860A (zh) * | 2022-03-24 | 2022-07-29 | 夏新宇 | 一种基于多元特征的台风轨迹预测方法 |
EP4163916A1 (en) * | 2021-10-11 | 2023-04-12 | Tata Consultancy Services Limited | System and method for molecular property prediction using hierarchical layer-wise propagation of graph pooling layer |
CN116595857A (zh) * | 2023-03-29 | 2023-08-15 | 江苏科技大学 | 基于深度迁移学习的滚动轴承多级退化剩余寿命预测方法 |
CN116701935A (zh) * | 2023-06-06 | 2023-09-05 | 中国工商银行股份有限公司 | 敏感度预测模型训练方法、敏感信息处理方法及装置 |
CN117131768A (zh) * | 2023-08-22 | 2023-11-28 | 常州大学 | 考虑滞后影响机理的高拱坝温度场因果预测方法 |
-
2023
- 2023-12-05 CN CN202311654899.4A patent/CN117520902A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020017110A (ko) * | 2000-08-28 | 2002-03-07 | 신대진 | 진화전략과 쌍선형 회귀성 신경망을 이용한 태풍 예측시스템 |
CN112329172A (zh) * | 2020-11-05 | 2021-02-05 | 上海交通大学 | 基于并联式神经网络的盾构机刀盘扭矩预测方法及系统 |
EP4163916A1 (en) * | 2021-10-11 | 2023-04-12 | Tata Consultancy Services Limited | System and method for molecular property prediction using hierarchical layer-wise propagation of graph pooling layer |
CN114048929A (zh) * | 2022-01-12 | 2022-02-15 | 深圳希施玛数据科技有限公司 | 股价数据预测方法及装置 |
CN114818860A (zh) * | 2022-03-24 | 2022-07-29 | 夏新宇 | 一种基于多元特征的台风轨迹预测方法 |
CN116595857A (zh) * | 2023-03-29 | 2023-08-15 | 江苏科技大学 | 基于深度迁移学习的滚动轴承多级退化剩余寿命预测方法 |
CN116701935A (zh) * | 2023-06-06 | 2023-09-05 | 中国工商银行股份有限公司 | 敏感度预测模型训练方法、敏感信息处理方法及装置 |
CN117131768A (zh) * | 2023-08-22 | 2023-11-28 | 常州大学 | 考虑滞后影响机理的高拱坝温度场因果预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114254561B (zh) | 一种内涝预测方法、系统及存储介质 | |
Choi et al. | Development of heavy rain damage prediction model using machine learning based on big data | |
Nayak et al. | Prediction of extreme rainfall event using weather pattern recognition and support vector machine classifier | |
KR101026071B1 (ko) | 군집별 태풍 개수 예측 방법 및 여름철 태풍 진로 예측 방법 | |
CN110555841B (zh) | 基于自注意图像融合和dec的sar图像变化检测方法 | |
Song et al. | Improving multi-model ensemble forecasts of tropical cyclone intensity using Bayesian model averaging | |
Joseph et al. | Rainfall prediction using data mining techniques | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
Galanis et al. | Statistical post processes for the improvement of the results of numerical wave prediction models. A combination of Kolmogorov-Zurbenko and Kalman filters | |
CN103226826A (zh) | 基于局部熵视觉注意模型的遥感图像变化检测方法 | |
CN114254767A (zh) | 基于Stacking集成学习的气象水文特征预测方法及系统 | |
Schön et al. | The error is the feature: How to forecast lightning using a model prediction error | |
Jin et al. | Deep learning for seasonal precipitation prediction over China | |
CN113139327B (zh) | 一种基于gru网络模型的电离层tec单点预测方法及系统 | |
CN117725448A (zh) | 气象导航信号特征的聚类分析方法 | |
Mooneyham et al. | SWRL Net: A spectral, residual deep learning model for improving short-term wave forecasts | |
Pegion et al. | Understanding predictability of daily southeast US precipitation using explainable machine learning | |
CN113671599A (zh) | 一种基于全球气候模式的登陆气旋识别方法 | |
Ouyang et al. | Wave forecast in the Atlantic Ocean using a double-stage ConvLSTM network | |
Ibarra-Berastegi et al. | Wave energy forecasting at three coastal buoys in the Bay of Biscay | |
CN117152435A (zh) | 一种基于U-Net3+的遥感语义分割方法 | |
CN112200363A (zh) | 一种滑坡的预测方法、装置、设备和存储介质 | |
CN117520902A (zh) | 基于机器学习的南海台风生成预测方法 | |
Wang et al. | Xihe: A data-driven model for global ocean eddy-resolving forecasting | |
Pusponegoro et al. | Group Lasso for rainfall data modeling in Indramayu district, West Java, Indonesia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |