CN117688853A - 基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统 - Google Patents
基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统 Download PDFInfo
- Publication number
- CN117688853A CN117688853A CN202410156274.3A CN202410156274A CN117688853A CN 117688853 A CN117688853 A CN 117688853A CN 202410156274 A CN202410156274 A CN 202410156274A CN 117688853 A CN117688853 A CN 117688853A
- Authority
- CN
- China
- Prior art keywords
- typhoon
- data
- path
- typhoons
- wind speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001066 destructive effect Effects 0.000 title claims abstract description 67
- 238000011156 evaluation Methods 0.000 title claims abstract description 54
- 230000007774 longterm Effects 0.000 title claims abstract description 24
- 238000011160 research Methods 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims abstract description 70
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 63
- 238000003066 decision tree Methods 0.000 claims abstract description 35
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000007637 random forest analysis Methods 0.000 claims abstract description 16
- 239000002131 composite material Substances 0.000 claims abstract description 8
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012937 correction Methods 0.000 claims description 46
- 238000005070 sampling Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 14
- 238000004088 simulation Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000007689 inspection Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000011835 investigation Methods 0.000 claims description 5
- 238000000611 regression analysis Methods 0.000 claims description 5
- 230000001788 irregular Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241001282736 Oriens Species 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013329 compounding Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/28—Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Tourism & Hospitality (AREA)
- Computer Hardware Design (AREA)
- Molecular Biology (AREA)
- Geometry (AREA)
- Biomedical Technology (AREA)
- Environmental & Geological Engineering (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Fluid Mechanics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
Abstract
本发明公开了一种基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统,包括如下步骤:采集研究区域内的台风历史路径数据,并对其进行预处理;采用基于决策树模型和经验公式的复合方法,进行最大风速修正;获取研究区域内的逐时潮位或高低潮位,采用调和分析方法计算台风期间的风暴增水;采用随机森林法构建台风路径–增水关系的预测模型,筛选出影响研究区域内的台风路径;计算台风路径的影响时间,确定台风路径的有效影响范围;计算研究区域内的热带气旋破坏性评估指标。本发明提高了早期气象资料的精度,实现了研究区域的台风路径识别,同时通过热带气旋的气象直接对区域风暴潮破坏性进行评估。
Description
技术领域
本发明属于灾害风险评估领域,公开了一种基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统。
背景技术
在气候变化背景下,极端天气和气候事件频发。20世纪70年代以来,全球海洋持续变暖,超强台风出现的比例明显变大,东亚和东南亚沿海地区登陆的强台风数量明显增加。对河口地区堤防等防洪基础设施,人民生命安全和城市发展构成重大威胁。一般而言,台风路径等气象资料的数据观测开始时间早于绝大部分地区的潮位观测数据。
当前对热带气旋活动变化趋势的研究多集中在台风频数及登陆频数,台风对区域的影响程度与台风强度,距离,最大风速半径,持续时间及登陆位置等密切相关,频数只能反映热带气旋对近岸影响能力的一部分,综合评价仍需其他指标予以补充。目前的方案主要包括:采用气旋能量指数PDI研究西太平洋热带气旋与海表温度的相关关系;或者采用热带气旋累计能量ACE统计分析1950~1999年热带风暴和飓风逐季变化特征;将热带气旋累积能力进行了改进;或者采用热带气旋潜在影响指数PI建立了热带气旋和海表温度、拖曳力等变量之间的联系。亦或,采用气旋活动指数对热带气旋活动特征变化进行了评估,为克服观测资料误差带来的影响。
上述指标从台风内部主要构造特征参数对台风影响能力进行刻画,其描述对象为大范围区域如大洋乃至全球,而台风在小范围地区影响能力评估指标尚未见到,因此现有技术针对区域热带气旋破坏性的评估指标较少,无法满足一些区域的精细化评估要求。
因此需要进一步研究和创新,以解决现有技术存在的上述问题。
发明内容
发明目的,提供一种基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统,以解决现有技术存在的上述问题。
技术方案,根据本申请的一个方面,基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,包括如下步骤:
S1、采集研究区域内的台风历史路径数据,并对其进行预处理;台风历史路径数据包括台风编号、名称、时间、位置和最大风速;
S2、将台风历史路径数据划分成至少两个时段;针对每个时段,分别采用决策树模型和经验公式进行修正,并比较修正的准确率,根据修正准确率将时段分成决策树模型修正时段和经验公式修正时段,并分别进行修正;所述决策树模型包括XGBoost模型、CatBoost模型和NGBoost模型;
S3、获取研究区域内的各个站点逐时潮位或高低潮位,采用调和分析方法,得到天文潮的模拟值,基于天文潮的模拟值,计算台风期间的风暴增水;
S4、基于风暴增水和修正后的最大风速,构建台风路径-增水关系的随机森林预测模型,计算每场台风在研究区域内产生风暴增水的概率;筛选出影响研究区域内的台风路径;
S5、基于筛选出的台风路径,计算台风路径的影响时间,确定台风路径的有效影响范围并栅格化,采用插值或平滑的方法,在有效影响范围内的台风路径进行均一化;
S6、基于均一化后的台风路径和有效影响范围,针对每场台风行进过程中的每个预定时刻,分别计算研究区域内的热带气旋破坏性评估指标TCRD并累加,输出热带气旋的破坏性数值;
TCRD=∑i=1 NVi 2ki,ki=min{Ri/di,1};
其中,N为该台风路径中进入有效影响区的采样点的个数,分辨率为1小时,i=1,2, 3…N,Vi为第i个采样点处的台风最大风速半径处的风速;Ri为第i个采样点处台风最大风速半径;di为第i个路径采样点到研究区的距离。
根据本申请的一个方面,步骤S1进一步为:
S11、从数据网站获取研究区域内的台风历史路径数据,包括台风编号、名称、时间、位置和最大风速;
S12、对台风历史路径数据进行质量检查,剔除异常和重复的数据,对保留下来的台风历史路径数据进行统一格式化和标准化处理。
根据本申请的一个方面,步骤S2进一步为:
S21、获取标准化处理后的台风历史路径数据,设定滑动窗口,对台风历史数据进行修正点检验,获取修正点数据,根据已知的修正点数据核验修正点检测的准确性;根据确定后的修正点,将台风历史路径数据分成至少两个时段;
S22、针对每个时段的台风历史路径数据,获取每场台风的行进时段和最大风速,逐一采用决策树模型和经验公式进行修正,并计算修正的准确率;
S23、根据准确率计算结果,针对每个时段的每场台风,建立行进时段的最大风速修正与决策树模型或经验公式之间的映射关系;
S24、采用基于决策树模型和经验公式的复合方法,对预处理后的最大风速进行修正。
根据本申请的一个方面,步骤S3进一步为:
S31、从数据网站获取研究区域内的逐时潮位或高低潮位,对逐时潮位或高低潮位进行质量检查和插值处理;
S32、基于处理后的逐时潮位或高低潮位,采用调和分析方法,计算研究区域内各个潮位站点的天文潮的主要分潮的振幅和相位,得到天文潮的模拟值;
S33、基于天文潮的模拟值,计算台风期间的风暴增水。
根据本申请的一个方面,步骤S4进一步为:
S41、根据修正后的最大风速和台风历史路径数据,计算台风路径-增水关系的特征变量,包括台风中心与研究区域的距离、台风最大风速半径、台风路径方位和台风进入研究区域的时长;
S42、根据修正后的最大风速和台风历史路径数据,计算台风的强度;基于台风的强度,动态调节台风最大风速半径;
S43、采用随机森林法,根据特征变量和风暴增水,构建台风路径-增水关系的预测模型,计算每场台风在研究区域内产生风暴增水的概率;
S44、根据计算的概率的大小和分布,设定阈值,筛选出影响研究区域内的台风路径。
根据本申请的一个方面,步骤S5进一步为:
S51、基于筛选出的台风路径,计算台风路径的影响时间,在影响时间内,每隔预定时间段,记录台风的位置和风速半径;
S52、基于台风的位置和风速半径,基于预构建的神经网络模型,得到每个预定时刻的台风的影响圆半径,确认台风影响圆;
S53、根据下垫面情况,将台风影响圆划分为预定个区域,采集研究区域内的地域信息,基于地域信息和风速半径,计算不同区域的风力等级,根据不同区域的风力等级,调整台风的影响圆半径的大小,得到每个预定时刻的不规则的有效影响范围;累加各个时刻的有效影响范围,作为该场台风的总的影响范围;
S54、采用三次样条插值的方法,对在有效影响范围内的台风路径进行均一化,得到均一化后的台风路径。
根据本申请的一个方面,步骤S6进一步为:
S61、基于均一化后的台风路径和有效影响范围,计算研究区域内的热带气旋破坏性评估指标;
S62、基于研究区域内的热带气旋破坏性评估指标,对每个台风的破坏性进行评估,并将其累加得到总的破坏指标;
S63、将总的覆盖面积和总的破坏指标与历史数据进行对比,分析研究区域的风暴潮破坏性的变化趋势和规律。
根据本申请的一个方面,步骤S61进一步为:
S611、将每个预定时刻的有效影响范围划分为预定个网格单元,基于均一化后的台风路径,计算每个网格单元内的热带气旋破坏性评估指标;
S612、基于每个网格单元内的热带气旋破坏性评估指标,计算每个预定时刻的有效影响范围内的热带气旋破坏性评估指标,将每个预定时刻的有效影响范围内的热带气旋破坏性评估指标累加,得到总的热带气旋破坏性评估指标。
根据本申请的一个方面,步骤S33还包括对台风期间的风暴增水进行修正,具体为:
S33a、将研究区域划分为预定个网格单元,计算每个单元内的指标,包括人口数量、人口密度、经济总量、经济结构和城市化水平,对每个指标进行标准化处理;
S33b、基于风暴增水和标准化处理后的指标,采用多元回归分析的方法,建立回归方程,得到各个指标的回归系数,作为各个指标的权重系数;
S33c、根据各个指标的权重系数,计算每个单元的易损性指数,基于每个单元的易损性指数,修正台风期间的风暴增水。
根据本申请的另一个方面,基于短期潮位和长期气象资料的区域风暴潮破坏性评估系统,其特征在于,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述任一项技术方案所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法。
有益效果:为了满足精细化评估的要求,首先采用类似于集成学习或组合学习的思路,对台风数据进行精细化修正,提高数据精确性;其次,将台风行进过程和影响区域栅格化,对每场台风每个预定时刻的影响范围进行精细化处理和计算,从而解决不同下垫面对于同一台风的受影响程度不同。最后给出了破坏性评估指标。通过破坏性评估指标,对每场台风的破坏性进行精细化评估,从而达到预期的精细化评估。总之,本发明提高了早期气象资料的精度,实现了研究区域的台风路径识别,同时提出热带气旋区域破坏性指标,通过热带气旋的气象直接对区域风暴潮破坏性进行评估,具有一定的理论价值和实践意义。
附图说明
图1为本发明的流程图。
图2为本发明步骤S1的流程图。
图3为本发明步骤S2的流程图。
图4为台风路径点最大风速核密度估计图。
图5为不同风速区间内决策树模型和公式法的均方根误差对比图。
图6为决策树模型和公式法修正风速与实际风速在1966年的对比图。
图7为本发明步骤S3的流程图。
图8为本发明步骤S4的流程图。
图9为各特征对随机森林法分类的重要程度直方图。
图10为本发明步骤S5的流程图。
图11为本发明步骤S6的流程图。
具体实施方式
如图1所示,基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,包括如下步骤:
S1、采集研究区域内的台风历史路径数据,并对其进行预处理;台风历史路径数据包括台风编号、名称、时间、位置和最大风速。
如图2所示,步骤S1进一步包括:
S11、从数据网站获取研究区域内的台风历史路径数据,包括台风编号、名称、时间、位置和最大风速;
S12、对台风历史路径数据进行质量检查,剔除异常和重复的数据,对保留下来的台风历史路径数据进行统一格式化和标准化处理。
在本实施例中,采用中国气象局1949~2020年CMA台风最佳路径资料数据集进行数值模拟相关风场计算。该资料数据集中1949~1971年的材料由中国气象局和上海气象局组织、多家单位协助整编,而1971年以后由上海台风研究所负责编制年度台风资料。采集资料数据集中的台风历史路径数据,对台风路径数据进行质量控制,检查并删除异常值、缺失值、重复值等。还可以对台风路径数据进行插值,使得每个台风的路径点间隔为6小时,保证数据的一致性和完整性。
对于台风影响的风暴潮,数据采集和处理的过程基本是一致的,在一些文献中也有描述,在此不再详述。
S2、将台风历史路径数据划分成至少两个时段;针对每个时段,分别采用决策树模型和经验公式进行修正,并比较修正的准确率,根据修正准确率将时段分成决策树模型修正时段和经验公式修正时段,并分别进行修正;所述决策树模型包括XGBoost模型、CatBoost模型和NGBoost模型;
如图3所示,步骤S2具体为:
S21、基于预处理后的台风历史路径数据,采用CNN机器学习模型,预测台风的最大风速,计算学习误差;
S22、基于预处理后的台风历史路径数据,采用经验公式,计算台风的最大风速,得到经验误差;
S23、基于学习误差和经验误差,采用基于CNN机器学习模型和经验公式的复合方法,对预处理后的最大风速进行修正。
在本实施例中,由于早期的台风观测技术不够精确,导致最大风速的数据存在较大的误差,这会影响风暴增水的计算和预测。因此,提出了基于决策树模型和经验公式的复合方法,来修正最大风速的数据。经验公式是根据实测数据和理论分析得到的一个数学表达式,可以直接计算出最大风速的值。台风中心最低气压P0和最大风速半径处风速Vm的经验关系如下:
Vm=a(P∞- P0)b;
其中,a和b分别为经验系数和指数;P∞为台风外缘圆形闭合等压线最大可能值,西太平洋一般取1010 hPa。
最大风速的修正主要是消除非自然因子导致的系统性误差,需要逐年逐纬度进行修正。但其根据这种方法分组后的数据量过小,有些年份纬度组合中得到的参数出现负值。
因此,本实施例对原方法进行改进:
Vm1=a(Ф,4971)(1010-P0)b(Ф,4971)
Vm2=a(Ф,7220)(1010-P0)b(Ф,7220)
Vm'=Vm-(Vm1-Vm2)
其中,a(Ф,4971),b(Ф,4971)和a(Ф,7220),b(Ф,7220)分别为1949~1971年和1972~2020年时段内采用纬度为Ф的台风数据拟合得到的参数;Vm和P0分别为待订正的风速和对应气压;Vm'为修正后的风速。分别求出1972~2020年和1941~1971年两时段内的参数,将气压代入,以上述两式结果的差值作为待修正风速和真值的差值,从而消除台风路径数据集中早期风速数据在不同年和不同纬度上的误差。以a0=6,b0=0.6为初值,采用最小二乘法对上式进行求解。下面选取了1972~2020年各纬度a, b参数值(纬度在10~40°N)。由于我国东海大陆海岸线一般在10~40°范围内,仅间隔一度展示该纬度范围内回归参数:
当纬度为10°时,参数a为8.29,参数b为0.57,样本数为1098;当纬度为12°时,参数a为8.17,参数b为0.58,样本数为1480;当纬度为14°时,参数a为7.62,参数b为0.60,样本数为1876;当纬度为16°时,参数a为7.48,参数b为0.60,样本数为1953;当纬度为18°时,参数a为7.07,参数b为0.62,样本数为2116;当纬度为20°时,参数a为6.78,参数b为0.63,样本数为2042;当纬度为22°时,参数a为6.24,参数b为0.65,样本数为1604;当纬度为24°时,参数a为6.05,参数b为0.65,样本数为1203;当纬度为26°时,参数a为6.34,参数b为0.64,样本数为1014;当纬度为28°时,参数a为6.52,参数b为0.63,样本数为852;当纬度为30°时,参数a为6.65,参数b为0.63,样本数为707;当纬度为32°时,参数a为6.82,参数b为0.62,样本数为622;当纬度为34°时,参数a为7.29,参数b为0.59,样本数为460;当纬度为36°时,参数a为7.70,参数b为0.57,样本数为334;当纬度为38°时,参数a为9.20,参数b为0.50,样本数为286;当纬度为40°时,参数a为8.74,参数b为0.51,样本数为267。
可以看出,当纬度从10~40°N增大时,系数a先变小后变大,并在25°N左右达到最小;指数b的变化规律恰恰相反,并在25°N左右达到最大。台风中心最低气压是台风最大风速的主导因素,纬度是最大风速的次要因素。
如下为1949~1971年各纬度a, b参数值:
当纬度为10°时,参数a为5.10,参数b为0.77,样本数为621;当纬度为12°时,参数a为6.32,参数b为0.70,样本数为806;当纬度为14°时,参数a为7.17,参数b为0.67,样本数为892;当纬度为16°时,参数a为7.81,参数b为0.64,样本数为925;当纬度为18°时,参数a为6.82,参数b为0.67,样本数为969;当纬度为20°时,参数a为5.72,参数b为0.72,样本数为991;当纬度为22°时,参数a为6.64,参数b为0.67,样本数为776;当纬度为24°时,参数a为5.73,参数b为0.71,样本数为562;当纬度为26°时,参数a为4.77,参数b为0.76,样本数为450;当纬度为28°时,参数a为5.70,参数b为0.71,样本数为382;当纬度为30°时,参数a为7.02,参数b为0.64,样本数为299;当纬度为32°时,参数a为4.81,参数b为0.74,样本数为253;当纬度为34°时,参数a为4.82,参数b为0.73,样本数为207;当纬度为36°时,参数a为3.38,参数b为0.83,样本数为185;当纬度为38°时,参数a为2.69,参数b为0.85,样本数为143;当纬度为40°时,参数a为0.89,参数b为1.15,样本数为166。
其中a, b值杂乱无章,没有明显规律。因此对早期台风数据的修正是非常必要的。
决策树模型利用卷积神经网络对台风历史路径数据进行特征提取和回归分析,从而得到台风的最大风速的预测值。
在进一步的实施例中,步骤S2还可以为:
S21、获取标准化处理后的台风历史路径数据,设定滑动窗口,对台风历史数据进行修正点检验,获取修正点数据,根据已知的修正点数据核验修正点检测的准确性;根据确定后的修正点,将台风历史路径数据分成至少两个时段;
S22、针对每个时段的台风历史路径数据,获取每场台风的行进时段和最大风速,逐一采用决策树模型和经验公式进行修正,并计算修正的准确率;
S23、根据准确率计算结果,针对每个时段的每场台风,建立行进时段的最大风速修正与决策树模型或经验公式之间的映射关系;
S24、采用基于决策树模型和经验公式的复合方法,对预处理后的最大风速进行修正。
本实施例提出了一种新的数据修正方法,首先,目前台风的风速是否精确,是基于现有研究给出的,根据不同时期的测量方法的精度不同,给出分段,然后针对分段进行修正。针对分出的时段,目前在数据层面给出验证。因此,本申请通过修正点来进行检验,查找台风准确率发生变化的点,并跟现有的分段点进行比较,给出了从数据层面判断和验证台风时段的方法。
然后对于每场需要修正的台风,不同的修正模型和方法的准确度是不同的,对于同一场台风,某个时段,风速大,某个时段风速小;采用同一种方法进行修正,整体的效果不好。因此将每场台风,根据风速的数值,分成若干个时段,然后采用不同的模型和方法进行修正,从而提高修正准确率。这里实际是将台风化成若干个不同长度的时段,然后每段进行修正,因此准确度更高。
如图4为台风路径点最大风速核密度估计图。从图中可以看出,核密度分布曲线是偏峰的,台风采样点风速主要集中在13~35 m/s区间内,风速在18 m/s附近数据点最为密集,频率最高(约为0.07)。台风风速超过40 m/s 后,台风风速数据变稀疏。
如图5为不同风速区间内决策树模型和公式法的均方根误差对比图。从图中可以看出,在风速较小(<20 m/s)或较大(>55 m/s)时,公式法的均方根误差较大;风速在20~40m/s 区间内时,两者均方根误差相当;风速在41~55 m/s 区间内时,公式法误差小于决策树模型(最大相差约0.5 m/s)。因此,采用公式法与决策树模型相结合的方法,即当风速在41~55 m/s 区间内时采用公式法,其余情况采用决策树模型,最终均方根误差可下降到1.69m/s。复合法相较于“公式法”修正结果误差下降了12.0%,相较于传统决策树模型结果预测风速误差下降了9.2%。因此,复合法对历史早期台风最大风速的修正效果更好。
如图6为决策树模型和公式法修正风速与实际风速在1966年的对比图。从整体上看,两者差别较大。决策树模型更接近待修正的风速点,且预测风速普遍大于公式法结果。由于早期台风资料来源复杂,风速时距不统一(1分钟, 2分钟, 10分钟均有),风速精度较差(取数间隔为5 m/s),观测设备和编制负责单位的改变等,早期台风最大风速与真实值偏离较大。公式法可以在一定程度上减少1949~1971年与1972~2020年间台风风速的整体特征区别,但其在保留自身特征的同时也无法完全消除自身误差的影响。决策树模型仅采用1972年后的数据进行训练,对于模型来说1949~1971的数据未知的,从而避免该时段内含有误差的风速数据影响。对于1949~1971年所有台风风速数据,决策树模型的与实测值均方根误差为4.76 m/s,公式法的均方根误差为5.90 m/s。可见决策树模型对风速的修正更保守,相较于公式法订正后的风速更大。从河口防灾减灾角度来看,决策树模型和复合法修正的风速更适合风暴潮模型的风场计算。
S3、获取研究区域内的各个站点逐时潮位或高低潮位,采用调和分析方法,得到天文潮的模拟值,基于天文潮的模拟值,计算台风期间的风暴增水;
如图7所示,步骤S3具体为:
S31、从数据网站获取研究区域内的逐时潮位或高低潮位,对逐时潮位或高低潮位进行质量检查和插值处理;
S32、基于处理后的逐时潮位或高低潮位,采用调和分析方法,计算研究区域内各个潮位站点的天文潮的主要分潮的振幅和相位,得到天文潮的模拟值;
S33、基于天文潮的模拟值,计算台风期间的风暴增水。
在本实施例中,从全球潮位观测数据集中提取研究区域内的潮位站点数据,包括站点编号、名称、位置、逐时潮位或高低潮位等信息。这些数据需要进行格式转换、质量检查、空间匹配等预处理,以便于后续的分析和计算。可以对潮位站点数据进行质量控制,检查并删除异常值、缺失值、重复值等;还可以对潮位站点数据进行插值,使得每个站点的潮位数据间隔为1小时,保证数据的一致性和完整性。
利用调和分析的方法,从实测潮位中分离出天文潮和风暴增水的成分。调和分析是一种基于傅里叶级数的数学方法,可以将潮位数据分解为若干个周期不同的正弦波,每个正弦波代表一个潮汐分潮的贡献。通过选择合适的分潮和参数,得到天文潮的模拟值,然后与实测潮位相减,得到风暴增水的时间序列。这样,就可以得到近30年的风暴增水时间序列,作为后续分析的基础数据。
S4、基于风暴增水和修正后的最大风速,构建台风路径-增水关系的随机森林预测模型,计算每场台风在研究区域内产生风暴增水的概率;筛选出影响研究区域内的台风路径;
如图8所示,步骤S4具体为:
S41、根据修正后的最大风速和台风历史路径数据,计算台风路径-增水关系的特征变量,包括台风中心与研究区域的距离、台风最大风速半径、台风路径方位和台风进入研究区域的时长;
S42、根据修正后的最大风速和台风历史路径数据,计算台风的强度;基于台风的强度,动态调节台风最大风速半径;
S43、采用随机森林法,根据特征变量和风暴增水,构建台风路径-增水关系的预测模型,计算每场台风在研究区域内产生风暴增水的概率;
S44、根据计算的概率的大小和分布,设定阈值,筛选出影响研究区域内的台风路径。
在本实施例中,提出了基于随机森林机器学习模型的长江口影响台风识别方法。基于调和分析研究成果,1989~2020年长江口增水是可以明确计算出来的。随机森林模型以此为标签数据,对1949~1988年西太平洋发生的台风进行分类。
机器学习模型是数据驱动的模型,输入数据特征是否合理会在很大程度上影响分类结果。因此,在进行模型训练之前,首先需要基于物理过程和实际意义对数据特征进行构造。一般台风距离目标地点越近,台风强度越高,造成增水的可能性越大。因此本实施例将长江口的位置概化为一个点(崇明岛东岸,122°E, 31.5°N),计算每场台风路径与该点的距离并以最小值作为距离特征,此时台风采样点的中心最低气压和最大风速作为气压Pc和风速Vmax特征,台风最大风速半径为台风半径特征Rmax。台风右侧风速一般大于左侧,因而从长江口南侧登陆的台风引起的增水往往更大。因此增加台风路径方位特征Orien,在长江口北侧登陆的台风路径赋值为1,其他类台风路径赋值为0。构造时间特征R400和R500,分别代表了台风进入长江口台风最大影响圆400 km和500 km范围内的时长。若台风路径距离较远,在其生命过程中未进入上述两区域,则该特征的值为0。
如图9所示,台风中心与长江口的距离对分类结果影响最大,最小距离、长江口台风影响圆R400和R500三个特征重要度合计为74.4%。最大风速半径特征Rmax的重要程度为7.4%,台风是否在长江口北侧登陆台风路径方位特征Orien的重要程度为6.7%。重要程度最低的反而是气压Pc和风速Vmax,占比合计约11.5%。事实上,在其他特征相同的条件下,台风最大风速半径特征Rmax越大,表明台风离目标区域越近。台风最大风速半径特征Rmax也应计入距离特征内,距离特征的重要程度合计超过了80%。因此,在没有其他依据的情况下,根据台风路径到目标地点的距离大致判断其是否会影响到目标区域具有一定合理性。
随机森林机器学习分类模型采用1989~2020年的台风路径为训练数据,测试集占比15%。训练数据中包含了没有编号的台风,可以帮助模型学习无编号台风的特征并对含有该特征的所有台风予以排除。采用GridSearchCV工具对主要参数进行调优得:弱学习器的最大迭代次数n-estimators=16,最大深度max-depth=5, 最大特征数max-features=4,叶子节点最少样本数min-samples-leaf=3,内部节点再划分所需最小样本数min-samples-split=4,判断准则criterion为基尼系数,模型分类准确率为96.6%(通过参数为5的交叉验证)。本实施例从西太平洋台风中尽可能多地识别出影响长江口的台风,以减少后续风暴潮数值模拟工作量。因为数值模拟结果可以对增水进行二次验证,所以本工作对模型错误率有一定容忍度。但要求错误最好为第二类错误,减少第一次错误。即可以接受“假台风”(台风没有影响长江口,但是模型认为影响了),但不能拒绝“真台风”(台风影响长江口,但模型未识别出)。因此,当计算的概率超过50%,则认为该台风可能在长江口产生增水。模型验证结果中仅有3场未影响长江口台风被误识别在内,满足要求。
因此,采用随机森林机器学习分类模型对西太平洋的台风进行识别,可大幅提高长江口风暴潮数值模拟工作的计算效率。但只有输入合理且有意义的数据特征才能得到正确的结果。随机森林模型具有难度低,计算快,准确率高的优点。
进一步的,步骤S41还包括:
S41a、根据修正后的最大风速和台风历史路径数据,计算台风的强度;
S41b、基于台风的强度,动态调节台风最大风速半径。
本实施例通过动态调节台风最大风速半径,更准确地反映了台风的风场结构和变化。台风的最大风速半径是指台风中心到最大风速处的距离,它是描述台风大小和强度的重要参数。不同强度的台风,其最大风速半径一般有不同的范围。西北太平洋上的超强台风的最大风速半径平均为40 km,而弱台风的最大风速半径平均为100 km。因此,如果使用固定的最大风速半径来计算台风的风场,可能会忽略台风强度的影响,导致风场的误差。动态调节台风最大风速半径的方法是根据台风的强度,按照一定的经验公式或关系曲线,确定合适的最大风速半径,从而使风场更符合实际情况。
S5、基于筛选出的台风路径,计算台风路径的影响时间,确定台风路径的有效影响范围并栅格化,采用插值或平滑的方法,在有效影响范围内的台风路径进行均一化;
如图10所示,步骤S5具体为:
S51、基于筛选出的台风路径,计算台风路径的影响时间,在影响时间内,每隔预定时间段,记录台风的位置和风速半径;
S52、基于台风的位置和风速半径,基于预构建的神经网络模型,得到每个预定时刻的台风的影响圆半径,确认台风影响圆;
S53、根据下垫面情况,将台风影响圆划分为预定个区域,采集研究区域内的地域信息,基于地域信息和风速半径,计算不同区域的风力等级,根据不同区域的风力等级,调整台风的影响圆半径的大小,得到每个预定时刻的不规则的有效影响范围;累加各个时刻的有效影响范围,作为该场台风的总的影响范围;
S54、采用三次样条插值的方法,对在有效影响范围内的台风路径进行均一化,得到均一化后的台风路径。
在本实施例中,基于筛选出的台风路径,计算其影响时间,每隔6小时,记录台风的位置和风速半径,构建训练数据集,包括台风的经纬度、中心气压、最大风速和风速半径等输入变量,以及台风的影响圆半径等输出变量。构建神经网络模型,将训练数据集划分为训练集和验证集,用训练集对神经网络模型进行训练,即通过反复调整网络的权重和偏置,使得网络的输出与期望的输出尽可能接近,从而最小化损失函数,用验证集对神经网络模型进行评估,检验模型的预测性能和准确度,最后得到台风影响圆,将台风影响圆划分为8个区域,分别为东北、东、东南、南、西南、西、西北和北,采集研究区域内的地域信息,包括海拔、人口密度、建筑物类型等,基于地域信息和风速半径,计算不同区域的风力等级,根据不同区域的风力等级,调整台风的影响圆半径的大小,得到每个预定时刻不规则的有效影响范围。这样可以更好地反映台风的影响范围和风险等级,为防灾减灾提供更有针对性的信息和建议,减少台风造成的人员伤亡和财产损失。
在本申请的另一实施例中,步骤S53中根据研究区域的地域信息,计算风力等级,给出影响范围的过程进一步为:
步骤S531、获取研究区域范围并栅格化,形成至少M个栅格;M为自然数;
步骤S532、根据研究区域的下垫面情况,对栅格进行聚类;例如分成居民区、山林区、工业区、农业区、浅海养殖区和深海区等;
步骤S533、调用历史台风数据和破坏数据,计算每个栅格受台风影响的破坏性指标。
S6、基于均一化后的台风路径和有效影响范围,针对每场台风行进过程中的每个预定时刻,分别计算研究区域内的热带气旋破坏性评估指标TCRD并累加,输出热带气旋的破坏性数值;
TCRD=∑i=1 NVi 2ki,ki=min{Ri/di,1};
其中,N为该台风路径中进入有效影响区的采样点的个数,分辨率为1小时,i=1,2, 3…N,Vi为第i个采样点处的台风最大风速半径处的风速;Ri为第i个采样点处台风最大风速半径;di为第i个路径采样点到研究区的距离。
如图11所示,步骤S6具体为:
S61、基于均一化后的台风路径和有效影响范围,计算研究区域内的热带气旋破坏性评估指标;
S62、基于研究区域内的热带气旋破坏性评估指标,对每个台风的破坏性进行评估,并将其累加得到总的破坏指标;
S63、将总的覆盖面积和总的破坏指标与历史数据进行对比,分析研究区域的风暴潮破坏性的变化趋势和规律。
在本实施例中,提出一个新的指标,热带气旋区域破坏性指标。该指标认为只有台风眼进入有效影响区的台风,才会在研究区造成较为严重的灾害,因而计入TCRD指标。同时,TCRD在风速权重方面的考虑取了平方,更贴合能量的概念,对于某一台风路径,其计算其公式为:
TCRD=∑i=1 NVi 2ki,ki=min{Ri/di,1}
其中,N为该台风路径中进入有效影响区的采样点的个数,分辨率为1小时,i=1,2, 3…N,Vi为第i个采样点处的台风最大风速半径处的风速,单位为m/s;Ri为第i个采样点处台风最大风速半径,单位为km;di为第i个路径采样点到研究区的距离,单位为km。
在步骤S62的过程中,对于海洋和陆地,同样的风速,造成的破坏是不同的。因此需要将台风影响区域的进行详细划分,从而给出更加精细的评估。
在某个实施例中,具体过程如下:
步骤S621、获取台风路径数据,并查找台风眼和最大风速半径;以台风眼和最大风速半径(比如为R)覆盖的面积,作为第一影响区域;以最大风速半径向外预定距离的环形区域作为第二影响区域(比如为2R或3R);
步骤S622、每隔第一预定时间,判断第一影响区域和第二影响区域是否与研究区域重叠;若重叠,每个第二预定时间(短于第一预定时间)获取台风路径数据,获得第一影响区域和第二影响区域;这个步骤就是获取台风影响到研究区域的过程中,每个预定时刻,各个区域的影响程度。
步骤S623、获取研究区域内的地域信息,比如下垫面信息,然后进行网格划分,并将台风风速插值到网格中;
步骤S624、逐一时间每个台风影响研究区域的各个时刻的每个网格的破坏指标,然后累加。在这个实施例中,将台风的影响划分到每个时刻和每个网格,然后逐一分析每个网格的受影响情况,然后给给出总的破坏情况。
在数据上,可以建立覆盖矩阵,即采用台风影响区域的矩阵与栅格化的研究区域做哈达玛积,然后给出每个时刻的破坏情况,然后将整个台风影响过程的总的破坏情况计算出来。
进一步的,步骤S33还包括对台风期间的风暴增水进行修正,具体为:
S33a、将研究区域划分为预定个网格单元,计算每个单元内的指标,包括人口数量、人口密度、经济总量、经济结构和城市化水平,对每个指标进行标准化处理;
S33b、基于风暴增水和标准化处理后的指标,采用多元回归分析的方法,建立回归方程,得到各个指标的回归系数,作为各个指标的权重系数;
S33c、根据各个指标的权重系数,计算每个单元的易损性指数,基于每个单元的易损性指数,修正台风期间的风暴增水。
在进一步的实施例中,首先将研究区域进行网格划分,计算每个网格单元内的人口数量、人口密度、经济总量、经济结构和城市化水平等指标,对每个指标进行标准化处理,即将每个指标的值减去其均值,再除以其标准差,使得每个指标的值都在0附近,方差为1,消除不同指标之间的量纲和尺度差异。
然后,采用多元回归分析的方法,建立回归方程,即使用风暴增水作为因变量,标准化处理后的指标作为自变量,求解各个指标的回归系数,作为各个指标的权重系数。回归系数的大小反映了各个指标对风暴增水的影响程度,可以用来评估各个指标的重要性。
最后,根据各个指标的权重系数,计算每个单元的易损性指数,即使用加权平均法,将各个指标的值乘以其权重系数,再求和,得到每个单元的易损性指数。易损性指数的大小反映了每个单元对风暴增水的敏感性和脆弱性,可以用来评估每个单元的风险等级。基于每个单元的易损性指数,修正台风期间的风暴增水,使用加权平均法,将风暴增水乘以每个单元的易损性指数,再求和,得到修正后的风暴增水。
步骤S61进一步为:
S611、将每个预定时刻的有效影响范围划分为预定个网格单元,基于均一化后的台风路径,计算每个网格单元内的热带气旋破坏性评估指标;
S612、基于每个网格单元内的热带气旋破坏性评估指标,计算每个预定时刻的有效影响范围内的热带气旋破坏性评估指标,将每个预定时刻的有效影响范围内的热带气旋破坏性评估指标累加,得到总的热带气旋破坏性评估指标。
本实施例为评估台风造成的损失和风险提供一个量化的指标。
在进一步的实施例中,区域风暴潮破坏性评估方法,具体步骤如下:
步骤一、收集资料。收集最佳台风路径数据;收集研究区域现有的逐时潮位或高低潮位资料。
步骤二、早期台风路径资料中最大风速的修正。提出基于决策树模型和经验公式的复合方法,对早期台风路径资料中最大风速进行修正。
步骤三、基于现有的实测逐时潮位或高低潮位,采用合适的调和分析的方法对天文潮进行回报,通过两者之差计算台风期间的风暴增值,可以得到风暴增水时间序列。如采用近30年潮位数据进行调和分析,可以得到近30年的风暴增水时间序列。
步骤四、影响研究区域的台风路径识别问题。以步骤三计算出的风暴增水为训练目标Y值,步骤二中修正后的最大风速为输入特性X,通过随机森林法建立“台风路径--增水”关系,进而计算每场台风在研究区产生增水的概率,即识别早期台风路径是否会在研究区域产生风暴增水。
步骤五、台风路径影响时间的确定。风暴潮影响时间是风暴潮灾害强度的重要指标。当台风在大洋中时,对距离较远的研究区影响较小,且不同的台风路径长度不一。以研究区为中心、500公里为半径的圆形区域为台风路径有效影响区,即只计入台风路径中进入该区域的部分。
步骤六、台风路径的均一化。由于不同时间段、不同区域提供的台风路径采样频率并不一致。如早期中国气象局的台风路径数据集的采样频率为6小时/次,但是近年由于设备进步,近岸台风采样频率改为3小时/次。为保持一致,将步骤五中进入有效影响区中的台风路径信息插值到1小时分辨率。
步骤七、区域热带气旋破坏性的评估指标的提出。
现有技术针对区域热带气旋破坏性的评估指标较少,还存在早期气象资料精度差,研究区域的台风路径识别困难问题。本实施例首先采用决策模块和经验公式复合法,修正了早期台风最大风速;其次采用调和分析的方法用短期潮位实测资料计算短期的增水,进而采用随机森林法建立了“台风—区域增水”的关系,实现了通过“长期气象资料+短期水位资料”识别长期增水尤其是历史早期增水的目标;最后提出了经合风暴强度,大小,与研究区距离的热带气旋区域破坏性指标。该方法对通过热带气旋的气象直接对区域风暴潮破坏性进行评估具有一定的理论价值和实践意义。
基于短期潮位和长期气象资料的区域风暴潮破坏性评估系统,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述任一项技术方案所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法。
以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。
Claims (10)
1.基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,包括如下步骤:
S1、采集研究区域内的台风历史路径数据,并对其进行预处理;台风历史路径数据包括台风编号、名称、时间、位置和最大风速;
S2、将台风历史路径数据划分成至少两个时段;针对每个时段,分别采用决策树模型和经验公式进行修正,并比较修正的准确率,根据修正准确率将时段分成决策树模型修正时段和经验公式修正时段,并分别进行修正;所述决策树模型包括XGBoost模型、CatBoost模型和NGBoost模型;
S3、获取研究区域内的各个站点逐时潮位或高低潮位,采用调和分析方法,得到天文潮的模拟值,基于天文潮的模拟值,计算台风期间的风暴增水;
S4、基于风暴增水和修正后的最大风速,构建台风路径-增水关系的随机森林预测模型,计算每场台风在研究区域内产生风暴增水的概率;筛选出影响研究区域内的台风路径;
S5、基于筛选出的台风路径,计算台风路径的影响时间,确定台风路径的有效影响范围并栅格化,采用插值或平滑的方法,在有效影响范围内的台风路径进行均一化;
S6、基于均一化后的台风路径和有效影响范围,针对每场台风行进过程中的每个预定时刻,分别计算研究区域内的热带气旋破坏性评估指标TCRD并累加,输出热带气旋的破坏性数值;
TCRD=∑i=1 N Vi 2 ki,ki=min{Ri/di,1};
其中,N为该台风路径中进入有效影响区的采样点的个数,分辨率为1小时,i=1, 2,3…N,Vi为第i个采样点处的台风最大风速半径处的风速;Ri为第i个采样点处台风最大风速半径;di为第i个路径采样点到研究区的距离。
2.根据权利要求1所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S1进一步为:
S11、从数据网站获取研究区域内的台风历史路径数据,包括台风编号、名称、时间、位置和最大风速;
S12、对台风历史路径数据进行质量检查,剔除异常和重复的数据,对保留下来的台风历史路径数据进行统一格式化和标准化处理。
3.根据权利要求2所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S2进一步为:
S21、获取标准化处理后的台风历史路径数据,设定滑动窗口,对台风历史数据进行修正点检验,获取修正点数据,根据已知的修正点数据核验修正点检测的准确性;根据确定后的修正点,将台风历史路径数据分成至少两个时段;
S22、针对每个时段的台风历史路径数据,获取每场台风的行进时段和最大风速,逐一采用决策树模型和经验公式进行修正,并计算修正的准确率;
S23、根据准确率计算结果,针对每个时段的每场台风,建立行进时段的最大风速修正与决策树模型或经验公式之间的映射关系;
S24、采用基于决策树模型和经验公式的复合方法,对预处理后的最大风速进行修正。
4.根据权利要求3所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S3进一步为:
S31、从数据网站获取研究区域内的逐时潮位或高低潮位,对逐时潮位或高低潮位进行质量检查和插值处理;
S32、基于处理后的逐时潮位或高低潮位,采用调和分析方法,计算研究区域内各个潮位站点的天文潮的主要分潮的振幅和相位,得到天文潮的模拟值;
S33、基于天文潮的模拟值,计算台风期间的风暴增水。
5.根据权利要求4所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S4进一步为:
S41、根据修正后的最大风速和台风历史路径数据,计算台风路径-增水关系的特征变量,包括台风中心与研究区域的距离、台风最大风速半径、台风路径方位和台风进入研究区域的时长;
S42、根据修正后的最大风速和台风历史路径数据,计算台风的强度;基于台风的强度,动态调节台风最大风速半径;
S43、采用随机森林法,根据特征变量和风暴增水,构建台风路径-增水关系的预测模型,计算每场台风在研究区域内产生风暴增水的概率;
S44、根据计算的概率的大小和分布,设定阈值,筛选出影响研究区域内的台风路径。
6.根据权利要求5所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S5进一步为:
S51、基于筛选出的台风路径,计算台风路径的影响时间,在影响时间内,每隔预定时间段,记录台风的位置和风速半径;
S52、基于台风的位置和风速半径,基于预构建的神经网络模型,得到每个预定时刻的台风的影响圆半径,确认台风影响圆;
S53、根据下垫面情况,将台风影响圆划分为预定个区域,采集研究区域内的地域信息,基于地域信息和风速半径,计算不同区域的风力等级,根据不同区域的风力等级,调整台风的影响圆半径的大小,得到每个预定时刻的不规则的有效影响范围;累加各个时刻的有效影响范围,作为该场台风的总的影响范围;
S54、采用三次样条插值的方法,对在有效影响范围内的台风路径进行均一化,得到均一化后的台风路径。
7.根据权利要求6所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S6进一步为:
S61、基于均一化后的台风路径和有效影响范围,计算研究区域内的热带气旋破坏性评估指标;
S62、基于研究区域内的热带气旋破坏性评估指标,对每个台风的破坏性进行评估,并将其累加得到总的破坏指标;
S63、将总的覆盖面积和总的破坏指标与历史数据进行对比,分析研究区域的风暴潮破坏性的变化趋势和规律。
8.根据权利要求7所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S61进一步为:
S611、将每个预定时刻的有效影响范围划分为预定个网格单元,基于均一化后的台风路径,计算每个网格单元内的热带气旋破坏性评估指标;
S612、基于每个网格单元内的热带气旋破坏性评估指标,计算每个预定时刻的有效影响范围内的热带气旋破坏性评估指标,将每个预定时刻的有效影响范围内的热带气旋破坏性评估指标累加,得到总的热带气旋破坏性评估指标。
9.根据权利要求7所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法,其特征在于,步骤S33还包括对台风期间的风暴增水进行修正,具体为:
S33a、将研究区域划分为预定个网格单元,计算每个单元内的指标,包括人口数量、人口密度、经济总量、经济结构和城市化水平,对每个指标进行标准化处理;
S33b、基于风暴增水和标准化处理后的指标,采用多元回归分析的方法,建立回归方程,得到各个指标的回归系数,作为各个指标的权重系数;
S33c、根据各个指标的权重系数,计算每个单元的易损性指数,基于每个单元的易损性指数,修正台风期间的风暴增水。
10. 基于短期潮位和长期气象资料的区域风暴潮破坏性评估系统,其特征在于,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求1至9任一项所述的基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410156274.3A CN117688853B (zh) | 2024-02-04 | 2024-02-04 | 基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410156274.3A CN117688853B (zh) | 2024-02-04 | 2024-02-04 | 基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117688853A true CN117688853A (zh) | 2024-03-12 |
CN117688853B CN117688853B (zh) | 2024-04-09 |
Family
ID=90130448
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410156274.3A Active CN117688853B (zh) | 2024-02-04 | 2024-02-04 | 基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117688853B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102354002A (zh) * | 2011-06-20 | 2012-02-15 | 国家气候中心 | 一种热带气旋潜在破坏力的测定方法 |
CN112036691A (zh) * | 2020-07-24 | 2020-12-04 | 东南大学 | 一种基于jpm-os-q模型的河口地区极端风暴潮水位计算方法 |
CN117390894A (zh) * | 2023-12-08 | 2024-01-12 | 中国海洋大学 | 一种预测极端风暴潮位的方法 |
-
2024
- 2024-02-04 CN CN202410156274.3A patent/CN117688853B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102354002A (zh) * | 2011-06-20 | 2012-02-15 | 国家气候中心 | 一种热带气旋潜在破坏力的测定方法 |
CN112036691A (zh) * | 2020-07-24 | 2020-12-04 | 东南大学 | 一种基于jpm-os-q模型的河口地区极端风暴潮水位计算方法 |
CN117390894A (zh) * | 2023-12-08 | 2024-01-12 | 中国海洋大学 | 一种预测极端风暴潮位的方法 |
Non-Patent Citations (1)
Title |
---|
周才扬等: "长江口台风影响能力研究", 人民长江, 28 January 2021 (2021-01-28) * |
Also Published As
Publication number | Publication date |
---|---|
CN117688853B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114280696B (zh) | 一种海雾等级智能预报方法及系统 | |
Ray et al. | Analysis of wind shear models and trends in different terrains | |
Leahy et al. | Short duration rainfall extremes in Ireland: influence of climatic variability | |
Kettle | Unexpected vertical wind speed profiles in the boundary layer over the southern North Sea | |
CN117634325B (zh) | 资料受限河口区域极值事件识别和复合洪水灾害分析方法和系统 | |
CN114935759A (zh) | 基于高频地波雷达观测的波浪场缺失值填补方法及系统 | |
CN111898089B (zh) | 确定台风影响海域有效波高和增水联合概率的方法 | |
Bethel et al. | Forecasting hurricane-forced significant wave heights using a long short-term memory network in the Caribbean Sea | |
CN117526274A (zh) | 极端气候下新能源功率预测方法、电子设备和存储介质 | |
Lubkov et al. | Method for reconstructing the monthly mean water transparencies for the northwestern part of the Black Sea as an example | |
CN112883577B (zh) | 一种海上风电场出力典型场景生成方法及存储介质 | |
CN117688853B (zh) | 基于短期潮位和长期气象资料的区域风暴潮破坏性评估方法及系统 | |
CN112070320B (zh) | 一种基于动态谐波回归的超短期风电功率预测方法及系统 | |
CN116596410A (zh) | 基于组合赋权法的台风风暴潮灾害脆弱性评价方法 | |
CN116739151B (zh) | 一种近海区域盐雾预测修正及准确度评估方法 | |
Alvarado et al. | Statistical analysis for the evaluation of solar and wind resources, measured in Querétaro | |
CN117828490B (zh) | 一种基于集成学习的对台风灾害预报方法及系统 | |
Turukmane et al. | Proper Weather Forecasting Internet of Things Sensor Framework with Machine Learning | |
Kim et al. | Storm Surge Frequency Analysis of Major Coasts Along the Korean Peninsula Using Historical Typhoons | |
Olsen | Long Term Trends in Lake Michigan Wave Climate | |
Li et al. | SARAL-AltiKa Wind and Significant Wave Height for Offshore Wind Energy Applications in the New England Region. Remote Sens. 2021, 13, 57 | |
CN115952690B (zh) | 一种长重现期台风风场的构建方法及系统 | |
Watson et al. | Predicting offshore wind energy resources (POWER) | |
Tasnim et al. | Assessment and Characterization of Potential Locations for Wind Energy Harvest in Bangladesh | |
CN118228569A (zh) | 一种基于深度学习的热带气旋小时降水参数模型构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |