CN113837283B - 一种基于均值聚类与线性判别的热带气旋等级划分方法 - Google Patents

一种基于均值聚类与线性判别的热带气旋等级划分方法 Download PDF

Info

Publication number
CN113837283B
CN113837283B CN202111125728.3A CN202111125728A CN113837283B CN 113837283 B CN113837283 B CN 113837283B CN 202111125728 A CN202111125728 A CN 202111125728A CN 113837283 B CN113837283 B CN 113837283B
Authority
CN
China
Prior art keywords
tracking
climate
tropical
mean value
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111125728.3A
Other languages
English (en)
Other versions
CN113837283A (zh
Inventor
林夏婧
黄国和
宋唐女
张重
王丝雨
田初引
鲁晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202111125728.3A priority Critical patent/CN113837283B/zh
Publication of CN113837283A publication Critical patent/CN113837283A/zh
Application granted granted Critical
Publication of CN113837283B publication Critical patent/CN113837283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于均值聚类与线性判别的热带气旋等级划分方法,选取多套CMIP6HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息,利用暖核探测方法识别出非TC类别与TC类别,利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件;将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和所述气候信息之间的关系。

Description

一种基于均值聚类与线性判别的热带气旋等级划分方法
技术领域
本发明属于气候预测领域,具体涉及一种基于均值聚类与线性判别的热带气旋等级划分方法。
背景技术
热带气旋(TC)在内陆沿海地区造成了严重的自然灾害,包括毁灭性的风暴潮、季节性降雨、城市洪水和持续的大风。它们被认为是经济损失的最大驱动力,是极端气候的主要贡献者。已命名风暴的分类对于现阶段TC事件的风险评估,以及对在气候变化条件下TC频率变化的探究至关重要。Saffir-Simpson分类法是在1970年代早期一场名为“卡米尔”的强风暴之后被创建的,并已被应急管理人员、公众和气象学家广泛使用。该分类法主要依据观测获取的近地表最大持续风速对飓风/TC事件进行分类,包括了最大持续风速超过17m/s(34kt)的热带风暴,以及超过10.8m/s(21kt)的热带低压。然而,近年来,北大西洋盆地出现了多个定义为较弱级别的TC事件并被发现与其真实破坏性不相匹配的情况。例如,Sandy被定义为3类飓风(50~58m/s;Saffir-Simpson强度等级的96~112节),却造成了近750亿美元的损失。尽管Saffir-Simpson分类法已被广泛用于评估历史、当前和未来TC的强度等级,但那些被低估了实际强度的TC事件已导致多位学者对仅使用最大风速作为分类标准产生了质疑。
近年来,无论是在历史飓风数据集(HURDAT)还是在全球气候耦合模式(CMIP3、5和6)中,研究者不断提出了一系列新指标来表征热带气旋的强度。部分科学家,包括KerryEmanuel和Lakshmi Kantha,评价Saffir-Simpson分类标准过于简单,表明该尺度既没有考虑到风暴的物理大小,也没有考虑到它所携带的大气信息。Kantha提出了三种飓风分类指数:飓风强度指数(HII)、飓风危害指数(HHI)和飓风涌浪指数(HSI)。HII使用连续性方程对飓风强度进行分类,指出流体施加的力与高雷诺数下的动压力成比例。HHI通过一个指数以获得飓风登陆时的损失估计,而HSI则根据飓风产生的风暴潮对飓风进行分类。此外,Powell和Reinhold首次提出了热带气旋综合动能(IKE)概念,以描述风暴的破坏潜力。IKE是通过将10米持续风速逐象限积分计算得出的热带强度。评估TC的活性的指标,如ACE和PDI,也很大程度上依赖于定量方法,因为前者是通过每6小时间隔的最大持续风力的平方来估计,而后者是则是通过其立方来估计。然而,与IKE相比,ACE和PDI高估了TC的累积能量,因为它没有考虑气旋结构。
在上述指标中,TC事件的强度大多定义为近地表风速的函数。然而,该强度的变化实际上与控制热带气旋空间分布和运动特征的许多其他大气变量强相关,而不是仅与近地表风速有关。例如,由于TC是一种涡旋运动,相对涡度(以下简称涡度)和中心压力有助于表征其中心的位置和强度;这在网格化气候数据中尤其突出。此外,全球气候模型模拟数据通常会低估真实的大气风速,而利用同一时刻的气压与垂直涡度差等气象资料将更有助于获取较为准确的TC强度;因此,在近地表风速之外考虑这些参数将有助于提供更可靠的TC等级分类依据。
发明内容
本发明的目的是提供一种基于均值聚类与线性判别的热带气旋等级划分方法,通过建立TC事件强度与近地面风速、气压和垂直涡度的函数关系,对全球气候模式中的热带气旋进行等级划分。
一种基于均值聚类与线性判别的热带气旋等级划分方法,包括如下步骤:
步骤1、选取多套CMIP6 HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息;
步骤2、利用暖核探测方法识别出非TC类别与TC类别;
步骤3、利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件;
步骤4、将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和所述气候信息之间的关系。
优选地,所述时间尺度为6小时。
优选地,所述气候信息包括近地表风速、850hPa气压、250hpa与850hpa的垂直涡度差。
进一步,所述步骤2中,地表风速低于10.8m/s且未探测到暖核的追踪点将被定义为非TC事件;地表风速高于10.8m/s且探测到暖核的追踪点将被定义为TC事件。
进一步,所述步骤3中,利用Kmeans聚类方法对获取的每一时间尺寸下的TC追踪点的强度进行重新分类,并依据Saffir-Simpson分类法的类别名称对划分的7个类别进行命名,即由小到大分别为热带低压(TD)、热带风暴(TS)、飓风(H1~H5)。
进一步,聚类时,对于每个样本点,计算它们与k个中心之间的距离,并将其分组到距离最小的中心所在的簇中;在对所有样本点进行排序后,重新计算k簇的中心;重复上述过程,直到放置到样本点的簇保持不变。
进一步,所述步骤4中,利用Fisher线性判别法建立TC类型与其对应的气候变量之间的线性判别方程式,使每个类型对应一个特定的判别方程式,通过对历史时期错误率的交叉验证,利用判别器对未知类型的TC事件进行预测和分类,错误率控制在10%以下。
更进一步,根据类内方差尽可能小,类间方差尽可能大的聚类结果来计算判别函数。
附图说明
图1是本发明的一种基于均值聚类与线性判别的热带气旋等级划分方法的流程图。
具体实施方式
下面结合附图,对实施例作详细说明。
如图1所示,本发明为一种基于均值聚类与线性判别的热带气旋等级划分方法,实现步骤如下:
步骤1、选取多套CMIP6 HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息,时间尺度一般为6小时,气候信息包括近地表风速、850hPa气压、250hpa与850hpa的垂直涡度差。将全球的TC事件及其所携带的气候信息按南北半球分类,有利于后续的类别判定与分析。
步骤2、利用暖核探测方法识别出非TC类别与TC类别。
详细地说,在模拟模型中确定的地表风速低于10.8m/s且未探测到暖核的追踪点将被定义为非TC事件;而相反的,地表风速高于10.8m/s且探测到暖核的追踪点将被定义为TC事件。
步骤3、利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件。
具体地,利用Kmeans聚类方法对获取的每6小时TC追踪点的强度进行重新分类,并依据Saffir-Simpson分类法的类别名称对划分的7个类别进行命名,即由小到大分别为热带低压(TD)、热带风暴(TS)、飓风(H1~H5)。聚类分析可以根据风暴的气候特征,如近地表风速、850hPa气压、垂直层涡度差等客观地将某一海域的风暴划分为不同强度的亚类。本发明中,采用Kmeans聚类方法来确定观测和模拟数据集中的最终类别。对于每个样本点,计算它们与k个中心之间的距离,并将其分组到距离最小的中心所在的簇中。在对所有样本点进行排序后,重新计算k簇的中心。重复上述过程,直到放置到样本点的簇保持不变。在给定n组观测值的情况下,Kmeans聚类的目的是将n个观测值划分为k(≤n)簇。设置S={S1,S2,…,Sk},以最小化簇内平方和(WCSS)(即方差)。从形式上讲,目标是找到:
μi是Si中点的平均值。这相当于最小化同一簇质心的成对平方偏差:
步骤4、将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和相关近地表风速、气压、以及垂直涡度差等三个变量之间的关系。
判别分析是根据特定的标准,用给定的TC事件类别及其相应的特征值(近地表风速、850hPa气压、850-250hpa涡度差(对流层涡旋切变))建立线性判别方程。通过对历史时期错误率的交叉验证,利用判别器对未知类型的TC事件进行预测和分类,错误率控制在10%以下。新提出的聚类判别方法根据类内方差尽可能小,类间方差尽可能大的聚类结果来计算判别函数。该方法的基本思想是投影,即将原始空间中的自变量组合投影到低维空间中,然后进行分类。Fisher判别法的优点是,它对分布(如正态分布)、方差(如等类协方差)等没有限制和假设,但这一准则要求每组变量的平均值存在显著差异。Fisher线性判别式将每两个组定义为类间方差(SSbetween)与类内方差(SSwithin)的比率,规则是最大化SSbetween和SSwithin之间的比率,并找到预测组的预测因子的线性组合:
其中,是群平均数,∑0,∑1是群协方差;/>是特征线性组合的手段;/>是特征线性组合的方差。
利用Fisher线性判别法可建立TC类型与其对应的气候变量之间的线性判别方程式,使每个类型对应一个特定的判别方程式。利用给定的任意时刻风速,气压,以及垂直涡度差,即可识别和预测未来模拟中热带气旋最可能的类型和强度(y为最大值的判别方程所对应的类别)。由此,通过获取的CMIP6HighResMIP提供的气候信息,即可获取未来时期(至2050年)热带气旋的空间分布和强度等级。
表1为训练数据交叉验证的误判率结果,其中NH表示北半球,SH表示南半球。
表1.训练数据交叉验证的误判率结果
此实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (7)

1.一种基于均值聚类与线性判别的热带气旋等级划分方法,包括如下步骤:
步骤1、选取多套CMIP6 HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息;所述气候信息包括近地表风速、850hPa气压、250hpa与850hpa的垂直涡度差;
步骤2、利用暖核探测方法识别出非TC类别与TC类别;
步骤3、利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件;
步骤4、将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和所述气候信息之间的关系。
2.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述时间尺度为6小时。
3.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述步骤2中,地表风速低于10.8m/s且未探测到暖核的追踪点将被定义为非TC事件;地表风速高于10.8m/s且探测到暖核的追踪点将被定义为TC事件。
4.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述步骤3中,利用Kmeans聚类方法对获取的每一时间尺度下的TC追踪点的强度进行重新分类,并依据Saffir-Simpson分类法的类别名称对划分的7个类别进行命名,即由小到大分别为热带低压TD、热带风暴TS、飓风H1~H5。
5.根据权利要求4所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,聚类时,对于每个样本点,计算它们与k个中心之间的距离,并将其分组到距离最小的中心所在的簇中;在对所有样本点进行排序后,重新计算k簇的中心;重复上述过程,直到放置到样本点的簇保持不变。
6.根据权利要求4所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述步骤4中,利用Fisher线性判别法建立TC类型与其对应的气候信息之间的线性判别方程式,使每个类型对应一个特定的判别方程式,通过对历史时期错误率的交叉验证,利用判别器对未知类型的TC事件进行预测和分类,错误率控制在10%以下。
7.根据权利要求6所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,根据类内方差尽可能小,类间方差尽可能大的聚类结果来计算判别函数。
CN202111125728.3A 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法 Active CN113837283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111125728.3A CN113837283B (zh) 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111125728.3A CN113837283B (zh) 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法

Publications (2)

Publication Number Publication Date
CN113837283A CN113837283A (zh) 2021-12-24
CN113837283B true CN113837283B (zh) 2024-01-30

Family

ID=78970071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111125728.3A Active CN113837283B (zh) 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法

Country Status (1)

Country Link
CN (1) CN113837283B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114722967B (zh) * 2022-04-29 2024-04-12 广东海洋大学 一种爆发性气旋分类的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012201275A1 (en) * 2006-09-28 2012-03-22 Howard W. Lutnick Products and processes for processing information related to weather and other events
CN106296431A (zh) * 2016-08-16 2017-01-04 神农架林区气象服务中心 神农架绿茶气候生态品质评价模式
CN106919792A (zh) * 2017-02-24 2017-07-04 天津大学 基于高精度数值风场资料的涡旋中心自动识别方法
CN110428102A (zh) * 2019-07-31 2019-11-08 杭州电子科技大学 基于hc-tc-lda的重大事件趋势预测方法
CN111832289A (zh) * 2020-07-13 2020-10-27 重庆大学 一种基于聚类和高斯lda的服务发现方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8562422B2 (en) * 2006-09-28 2013-10-22 Cfph, Llc Products and processes for processing information related to weather and other events

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012201275A1 (en) * 2006-09-28 2012-03-22 Howard W. Lutnick Products and processes for processing information related to weather and other events
CN106296431A (zh) * 2016-08-16 2017-01-04 神农架林区气象服务中心 神农架绿茶气候生态品质评价模式
CN106919792A (zh) * 2017-02-24 2017-07-04 天津大学 基于高精度数值风场资料的涡旋中心自动识别方法
CN110428102A (zh) * 2019-07-31 2019-11-08 杭州电子科技大学 基于hc-tc-lda的重大事件趋势预测方法
CN111832289A (zh) * 2020-07-13 2020-10-27 重庆大学 一种基于聚类和高斯lda的服务发现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Xin Wang等.Tropical Cyclone Intensity Change Prediction Based on Surrounding Environmental Conditions with Deep Learning.《Water》.2020,第12卷(第10期),2685. *
陈睿.基于深度学习的台风预测关键技术研究.《中国优秀硕士学位论文全文数据库 基础科学辑》.2021,(第01期),A009-81. *

Also Published As

Publication number Publication date
CN113837283A (zh) 2021-12-24

Similar Documents

Publication Publication Date Title
Feloni et al. Flood vulnerability assessment using a GIS‐based multi‐criteria approach—The case of Attica region
Roy et al. Tropical cyclone track forecasting techniques―A review
Toledo et al. Cluster analysis: A new approach applied to lidar measurements for atmospheric boundary layer height estimation
Lakshmanan et al. Data mining storm attributes from spatial grids
Burlando et al. Mesoscale wind climate analysis: identification of anemological regions and wind regimes
CN111539450B (zh) 地震区滑坡易发性评价方法
CN114330812A (zh) 基于机器学习的滑坡灾害风险评估方法
CN110929939A (zh) 一种基于聚类-信息量耦合模型下的滑坡灾害易发性空间预测方法
Spassiani et al. Application of Self-organizing Maps to classify the meteorological origin of wind gusts in Australia
CN113837283B (zh) 一种基于均值聚类与线性判别的热带气旋等级划分方法
El Rafei et al. Analysis of extreme wind gusts using a high-resolution Australian regional reanalysis
Feser et al. North Atlantic winter storm activity in modern reanalyses and pressure-based observations
O'Sullivan et al. Rain estimation from infrared and visible GOES satellite data
Shafer et al. An assessment of areal coverage of severe weather parameters for severe weather outbreak diagnosis
Gentile et al. Attribution of observed extreme marine wind speeds and associated hazards to midlatitude cyclone conveyor belt jets near the British Isles
Miller et al. A preliminary assessment of using spatiotemporal lightning patterns for a binary classification of thunderstorm mode
Surkova et al. Atmospheric circulation and storm events in the Baltic Sea
Pavlova et al. Storm surges and storm wind waves in the Caspian Sea in the present and future climate
Cahyanti et al. Whirlwind prediction using cloud movement patterns on satellite image
CN113689053A (zh) 一种基于随机森林的强对流天气架空线停电预测方法
Erfani et al. Automated synoptic typing of freezing rain events for hazard analysis
Gallus Jr et al. Differences in near-storm parameters useful for forecasting intensity of nocturnal and diurnal bow echo winds
Yang et al. Radar‐Derived Quantitative Precipitation Estimation Based on Precipitation Classification
Spassiani Climatology of severe convective wind gusts in Australia
Papin et al. Using the Rossby radius of deformation as a forecasting tool for tropical cyclogenesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant