CN113837283A - 一种基于均值聚类与线性判别的热带气旋等级划分方法 - Google Patents

一种基于均值聚类与线性判别的热带气旋等级划分方法 Download PDF

Info

Publication number
CN113837283A
CN113837283A CN202111125728.3A CN202111125728A CN113837283A CN 113837283 A CN113837283 A CN 113837283A CN 202111125728 A CN202111125728 A CN 202111125728A CN 113837283 A CN113837283 A CN 113837283A
Authority
CN
China
Prior art keywords
clustering
tracking
climate
tropical cyclone
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111125728.3A
Other languages
English (en)
Other versions
CN113837283B (zh
Inventor
林夏婧
黄国和
宋唐女
张重
王丝雨
田初引
鲁晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN202111125728.3A priority Critical patent/CN113837283B/zh
Publication of CN113837283A publication Critical patent/CN113837283A/zh
Application granted granted Critical
Publication of CN113837283B publication Critical patent/CN113837283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于均值聚类与线性判别的热带气旋等级划分方法,选取多套CMIP6HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息,利用暖核探测方法识别出非TC类别与TC类别,利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件;将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和所述气候信息之间的关系。

Description

一种基于均值聚类与线性判别的热带气旋等级划分方法
技术领域
本发明属于气候预测领域,具体涉及一种基于均值聚类与线性判别的热带气旋等级划分方法。
背景技术
热带气旋(TC)在内陆沿海地区造成了严重的自然灾害,包括毁灭性的风暴潮、季节性降雨、城市洪水和持续的大风。它们被认为是经济损失的最大驱动力,是极端气候的主要贡献者。已命名风暴的分类对于现阶段TC事件的风险评估,以及对在气候变化条件下TC频率变化的探究至关重要。Saffir-Simpson分类法是在1970年代早期一场名为“卡米尔”的强风暴之后被创建的,并已被应急管理人员、公众和气象学家广泛使用。该分类法主要依据观测获取的近地表最大持续风速对飓风/TC事件进行分类,包括了最大持续风速超过17m/s(34kt)的热带风暴,以及超过10.8m/s(21kt)的热带低压。然而,近年来,北大西洋盆地出现了多个定义为较弱级别的TC事件并被发现与其真实破坏性不相匹配的情况。例如,Sandy被定义为3类飓风(50~58m/s;Saffir-Simpson强度等级的96~112节),却造成了近750亿美元的损失。尽管Saffir-Simpson分类法已被广泛用于评估历史、当前和未来TC的强度等级,但那些被低估了实际强度的TC事件已导致多位学者对仅使用最大风速作为分类标准产生了质疑。
近年来,无论是在历史飓风数据集(HURDAT)还是在全球气候耦合模式(CMIP3、5和6)中,研究者不断提出了一系列新指标来表征热带气旋的强度。部分科学家,包括KerryEmanuel和Lakshmi Kantha,评价Saffir-Simpson分类标准过于简单,表明该尺度既没有考虑到风暴的物理大小,也没有考虑到它所携带的大气信息。Kantha提出了三种飓风分类指数:飓风强度指数(HII)、飓风危害指数(HHI)和飓风涌浪指数(HSI)。HII使用连续性方程对飓风强度进行分类,指出流体施加的力与高雷诺数下的动压力成比例。HHI通过一个指数以获得飓风登陆时的损失估计,而HSI则根据飓风产生的风暴潮对飓风进行分类。此外,Powell和Reinhold首次提出了热带气旋综合动能(IKE)概念,以描述风暴的破坏潜力。IKE是通过将10米持续风速逐象限积分计算得出的热带强度。评估TC的活性的指标,如ACE和PDI,也很大程度上依赖于定量方法,因为前者是通过每6小时间隔的最大持续风力的平方来估计,而后者是则是通过其立方来估计。然而,与IKE相比,ACE和PDI高估了TC的累积能量,因为它没有考虑气旋结构。
在上述指标中,TC事件的强度大多定义为近地表风速的函数。然而,该强度的变化实际上与控制热带气旋空间分布和运动特征的许多其他大气变量强相关,而不是仅与近地表风速有关。例如,由于TC是一种涡旋运动,相对涡度(以下简称涡度)和中心压力有助于表征其中心的位置和强度;这在网格化气候数据中尤其突出。此外,全球气候模型模拟数据通常会低估真实的大气风速,而利用同一时刻的气压与垂直涡度差等气象资料将更有助于获取较为准确的TC强度;因此,在近地表风速之外考虑这些参数将有助于提供更可靠的TC等级分类依据。
发明内容
本发明的目的是提供一种基于均值聚类与线性判别的热带气旋等级划分方法,通过建立TC事件强度与近地面风速、气压和垂直涡度的函数关系,对全球气候模式中的热带气旋进行等级划分。
一种基于均值聚类与线性判别的热带气旋等级划分方法,包括如下步骤:
步骤1、选取多套CMIP6 HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息;
步骤2、利用暖核探测方法识别出非TC类别与TC类别;
步骤3、利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件;
步骤4、将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和所述气候信息之间的关系。
优选地,2.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述时间尺度为6小时。
优选地,所述气候信息包括近地表风速、850hPa气压、250hpa与850hpa的垂直涡度差。
进一步,所述步骤2中,地表风速低于10.8m/s且未探测到暖核的追踪点将被定义为非TC事件;地表风速高于10.8m/s且探测到暖核的追踪点将被定义为TC事件。
进一步,所述步骤3中,利用Kmeans聚类方法对获取的每一时间尺寸下的TC追踪点的强度进行重新分类,并依据Saffir-Simpson分类法的类别名称对划分的7个类别进行命名,即由小到大分别为热带低压(TD)、热带风暴(TS)、飓风(H1~H5)。
进一步,聚类时,对于每个样本点,计算它们与k个中心之间的距离,并将其分组到距离最小的中心所在的簇中;在对所有样本点进行排序后,重新计算k簇的中心;重复上述过程,直到放置到样本点的簇保持不变。
进一步,所述步骤4中,利用Fisher线性判别法建立TC类型与其对应的气候变量之间的线性判别方程式,使每个类型对应一个特定的判别方程式,通过对历史时期错误率的交叉验证,利用判别器对未知类型的TC事件进行预测和分类,错误率控制在10%以下。
更进一步,根据类内方差尽可能小,类间方差尽可能大的聚类结果来计算判别函数。
附图说明
图1是本发明的一种基于均值聚类与线性判别的热带气旋等级划分方法的流程图。
具体实施方式
下面结合附图,对实施例作详细说明。
如图1所示,本发明为一种基于均值聚类与线性判别的热带气旋等级划分方法,实现步骤如下:
步骤1、选取多套CMIP6 HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息,时间尺度一般为6小时,气候信息包括近地表风速、850hPa气压、250hpa与850hpa的垂直涡度差。将全球的TC事件及其所携带的气候信息按南北半球分类,有利于后续的类别判定与分析。
步骤2、利用暖核探测方法识别出非TC类别与TC类别。
详细地说,在模拟模型中确定的地表风速低于10.8m/s且未探测到暖核的追踪点将被定义为非TC事件;而相反的,地表风速高于10.8m/s且探测到暖核的追踪点将被定义为TC事件。
步骤3、利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件。
具体地,利用Kmeans聚类方法对获取的每6小时TC追踪点的强度进行重新分类,并依据Saffir-Simpson分类法的类别名称对划分的7个类别进行命名,即由小到大分别为热带低压(TD)、热带风暴(TS)、飓风(H1~H5)。聚类分析可以根据风暴的气候特征,如近地表风速、850hPa气压、垂直层涡度差等客观地将某一海域的风暴划分为不同强度的亚类。本发明中,采用Kmeans聚类方法来确定观测和模拟数据集中的最终类别。对于每个样本点,计算它们与k个中心之间的距离,并将其分组到距离最小的中心所在的簇中。在对所有样本点进行排序后,重新计算k簇的中心。重复上述过程,直到放置到样本点的簇保持不变。在给定n组观测值的情况下,Kmeans聚类的目的是将n个观测值划分为k(≤n)。设置S={S1,S2,…,Sk},以最小化簇内平方和(WCSS)(即方差)。从形式上讲,目标是找到:
Figure BDA0003278669520000051
μ是Si中点的平均值。这相当于最小化同一簇质心的成对平方偏差:
Figure BDA0003278669520000052
步骤4、将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和相关近地表风速、气压、以及垂直涡度差等三个变量之间的关系。
判别分析是根据特定的标准,用给定的TC事件类别及其相应的特征值(近地表风速、850hPa气压、850-250hpa涡度差(对流层涡旋切变))建立线性判别方程。通过对历史时期错误率的交叉验证,利用判别器对未知类型的TC事件进行预测和分类,错误率控制在10%以下。新提出的聚类判别方法根据类内方差尽可能小,类间方差尽可能大的聚类结果来计算判别函数。该方法的基本思想是投影,即将原始空间中的自变量组合投影到低维空间中,然后进行分类。Fisher判别法的优点是,它对分布(如正态分布)、方差(如等类协方差)等没有限制和假设,但这一准则要求每组变量的平均值存在显著差异。Fisher线性判别式将每两个组定义为类间方差(SSbetween)与类内方差(SSwithin)的比率,规则是最大化SSbetween和SSwithin之间的比率,并找到预测组的预测因子的线性组合:
Figure BDA0003278669520000053
其中,
Figure BDA0003278669520000054
是群平均数,∑0,∑1是群协方差;
Figure BDA0003278669520000055
是特征线性组合的手段;
Figure BDA0003278669520000061
是特征线性组合的方差。
利用Fisher线性判别法可建立TC类型与其对应的气候变量之间的线性判别方程式,使每个类型对应一个特定的判别方程式。利用给定的任意时刻风速,气压,以及垂直涡度差,即可识别和预测未来模拟中热带气旋最可能的类型和强度(y为最大值的判别方程所对应的类别)。由此,通过获取的CMIP6HighResMIP提供的气候信息,即可获取未来时期(至2050年)热带气旋的空间分布和强度等级。
表1为训练数据交叉验证的误判率结果,其中NH表示北半球,SH表示南半球。
表1.训练数据交叉验证的误判率结果
Figure BDA0003278669520000062
此实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种基于均值聚类与线性判别的热带气旋等级划分方法,包括如下步骤:
步骤1、选取多套CMIP6 HighResMIP气候数据集,并依据tracking algorithm追踪法则在气候格点数据集中追踪所有TC轨迹,提取每一时间尺度下每个追踪点所携带的气候信息;
步骤2、利用暖核探测方法识别出非TC类别与TC类别;
步骤3、利用Kmeans聚类方法,并依据所有TC类别追踪点所携带的气候信息,划分出7类TC事件;
步骤4、将非TC类别与已划分出的7类TC事件共8个类别作为预测的初始判据,并通过Fisher线性判别法建立热带气旋强度和所述气候信息之间的关系。
2.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述时间尺度为6小时。
3.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述气候信息包括近地表风速、850hPa气压、250hpa与850hpa的垂直涡度差。
4.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述步骤2中,地表风速低于10.8m/s且未探测到暖核的追踪点将被定义为非TC事件;地表风速高于10.8m/s且探测到暖核的追踪点将被定义为TC事件。
5.根据权利要求1所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述步骤3中,利用Kmeans聚类方法对获取的每一时间尺寸下的TC追踪点的强度进行重新分类,并依据Saffir-Simpson分类法的类别名称对划分的7个类别进行命名,即由小到大分别为热带低压(TD)、热带风暴(TS)、飓风(H1~H5)。
6.根据权利要求5所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,聚类时,对于每个样本点,计算它们与k个中心之间的距离,并将其分组到距离最小的中心所在的簇中;在对所有样本点进行排序后,重新计算k簇的中心;重复上述过程,直到放置到样本点的簇保持不变。
7.根据权利要求5所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,所述步骤4中,利用Fisher线性判别法建立TC类型与其对应的气候变量之间的线性判别方程式,使每个类型对应一个特定的判别方程式,通过对历史时期错误率的交叉验证,利用判别器对未知类型的TC事件进行预测和分类,错误率控制在10%以下。
8.根据权利要求7所述的一种基于均值聚类与线性判别的热带气旋等级划分方法,其特征在于,根据类内方差尽可能小,类间方差尽可能大的聚类结果来计算判别函数。
CN202111125728.3A 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法 Active CN113837283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111125728.3A CN113837283B (zh) 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111125728.3A CN113837283B (zh) 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法

Publications (2)

Publication Number Publication Date
CN113837283A true CN113837283A (zh) 2021-12-24
CN113837283B CN113837283B (zh) 2024-01-30

Family

ID=78970071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111125728.3A Active CN113837283B (zh) 2021-09-26 2021-09-26 一种基于均值聚类与线性判别的热带气旋等级划分方法

Country Status (1)

Country Link
CN (1) CN113837283B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114722967A (zh) * 2022-04-29 2022-07-08 广东海洋大学 一种爆发性气旋分类的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080081684A1 (en) * 2006-09-28 2008-04-03 Lutnick Howard W Products and processes for processing information related to weather and other events
AU2012201275A1 (en) * 2006-09-28 2012-03-22 Howard W. Lutnick Products and processes for processing information related to weather and other events
CN106296431A (zh) * 2016-08-16 2017-01-04 神农架林区气象服务中心 神农架绿茶气候生态品质评价模式
CN106919792A (zh) * 2017-02-24 2017-07-04 天津大学 基于高精度数值风场资料的涡旋中心自动识别方法
CN110428102A (zh) * 2019-07-31 2019-11-08 杭州电子科技大学 基于hc-tc-lda的重大事件趋势预测方法
CN111832289A (zh) * 2020-07-13 2020-10-27 重庆大学 一种基于聚类和高斯lda的服务发现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080081684A1 (en) * 2006-09-28 2008-04-03 Lutnick Howard W Products and processes for processing information related to weather and other events
AU2012201275A1 (en) * 2006-09-28 2012-03-22 Howard W. Lutnick Products and processes for processing information related to weather and other events
CN106296431A (zh) * 2016-08-16 2017-01-04 神农架林区气象服务中心 神农架绿茶气候生态品质评价模式
CN106919792A (zh) * 2017-02-24 2017-07-04 天津大学 基于高精度数值风场资料的涡旋中心自动识别方法
CN110428102A (zh) * 2019-07-31 2019-11-08 杭州电子科技大学 基于hc-tc-lda的重大事件趋势预测方法
CN111832289A (zh) * 2020-07-13 2020-10-27 重庆大学 一种基于聚类和高斯lda的服务发现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIN WANG等: "Tropical Cyclone Intensity Change Prediction Based on Surrounding Environmental Conditions with Deep Learning", 《WATER》, vol. 12, no. 10, pages 2685 *
陈睿: "基于深度学习的台风预测关键技术研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》, no. 01, pages 009 - 81 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114722967A (zh) * 2022-04-29 2022-07-08 广东海洋大学 一种爆发性气旋分类的方法
CN114722967B (zh) * 2022-04-29 2024-04-12 广东海洋大学 一种爆发性气旋分类的方法

Also Published As

Publication number Publication date
CN113837283B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
Roy et al. Tropical cyclone track forecasting techniques―A review
Alpert et al. Semi‐objective classification for daily synoptic systems: Application to the eastern Mediterranean climate change
CN112561274A (zh) 基于多要素情境的台风诱发地质灾害风险评估方法
Brocca et al. Application of a model-based rainfall-runoff database as efficient tool for flood risk management
Burlando et al. Mesoscale wind climate analysis: identification of anemological regions and wind regimes
Toledo et al. Cluster analysis: A new approach applied to lidar measurements for atmospheric boundary layer height estimation
Bitencourt et al. Application of multivariate statistical techniques in alongshore differentiation of coastal barriers
CN113837283B (zh) 一种基于均值聚类与线性判别的热带气旋等级划分方法
Pavlova et al. Storm surges and extreme wind waves in the Caspian Sea in the present and future climate
Feser et al. North Atlantic winter storm activity in modern reanalyses and pressure-based observations
O'Sullivan et al. Rain estimation from infrared and visible GOES satellite data
Surkova et al. Atmospheric circulation and storm events in the Baltic Sea
Gao et al. Evolutionary characteristics of the atmospheric circulations for frequent and infrequent dust storm springs in northern China and the detection of potential future seasonal forecast signals
Pavlova et al. Storm surges and storm wind waves in the Caspian Sea in the present and future climate
CN103605988A (zh) 一种基于空间金字塔随机映射的地基云图分类方法
Bȧrring et al. Filters and approximate confidence intervals for interpreting rainfall anomaly indices
Odon et al. Evaluation of reanalyses over British Columbia. Part I: Daily and extreme 2-m temperature
Erfani et al. Automated synoptic typing of freezing rain events for hazard analysis
Xie et al. Climatology of winter extratropical cyclones over the coastal waters of China
Blazevic et al. Assessment and analysis of wind energy potential in the mountain area around Sarajevo
Papin et al. Using the Rossby radius of deformation as a forecasting tool for tropical cyclogenesis
CN112799156B (zh) 气象一体化突发事件预警发布方法及装置
Singh et al. Detection and tracking of tropical cyclone using NCEP-GFS model analysis and forecasts
Mecklenburg Nowcasting precipitation in an Alpine region with a radar echo tracking algorithm
Nelko et al. Rip current prediction in ocean city Maryland

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant