CN116976227A - 一种基于lstm机器学习的风暴增水预报方法及系统 - Google Patents
一种基于lstm机器学习的风暴增水预报方法及系统 Download PDFInfo
- Publication number
- CN116976227A CN116976227A CN202311226654.1A CN202311226654A CN116976227A CN 116976227 A CN116976227 A CN 116976227A CN 202311226654 A CN202311226654 A CN 202311226654A CN 116976227 A CN116976227 A CN 116976227A
- Authority
- CN
- China
- Prior art keywords
- typhoon
- storm water
- virtual
- data
- lstm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 127
- 238000010801 machine learning Methods 0.000 title claims abstract description 17
- 238000013277 forecasting method Methods 0.000 title claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 29
- 238000012795 verification Methods 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000007787 long-term memory Effects 0.000 claims description 31
- 210000002569 neuron Anatomy 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 9
- 230000006403 short-term memory Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 230000015654 memory Effects 0.000 claims description 5
- 230000002265 prevention Effects 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005291 magnetic effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical class C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Environmental & Geological Engineering (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Computer Hardware Design (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Geometry (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
Abstract
本发明公开了一种基于LSTM机器学习的风暴增水预报方法及系统,该方法包括:收集并处理目标区域所在海域的历史台风数据;采用基于核密度估计法的经验路径法构建虚拟台风并获取虚拟台风数据;筛选出对目标区域有影响的历史台风数据和虚拟台风数据,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;对风暴增水数据集划分训练集、验证集和测试集,设定输入层和输出层,构建LSTM风暴增水智能预报模型并进行训练;将待预测的台风信息输入LSTM风暴增水智能预报模型进行风暴增水预报。本发明直接通过当前发生的台风信息来预测未来时刻的风暴潮数据,为实现风暴潮的精细预警和精准预防提供重要技术支撑。
Description
技术领域
本发明涉及风暴增水预报技术领域,具体涉及一种基于LSTM机器学习的风暴增水预报方法及系统。
背景技术
风暴潮,又称“风暴增水”、“风暴海啸”、“气象海啸”、“风潮”等,是由于剧烈的大气扰动,如强风和气压骤变(通常指台风和温带气旋等灾害性天气系统)导致海水异常升降,使受其影响的海区的潮位大大地超过平常潮位的现象。其影响的范围一般为数十至上千米,持续的时间达几小时到上百小时不等。
风暴潮灾害居海洋灾害之首位,其引起的灾害损失占比达九成以上。为了科学抵御风暴潮灾害,准确预测风暴潮所带来的灾害影响,需要开展风暴潮预报方法研究,不断提升风暴潮的预报精度和预报时效。
目前风暴增水预报的方式主要为基于水动力模型的数值计算,其预报精度依赖于准确的实测地形和模型边界条件,且模型参数设定很大程度上需依据建模者的经验;此外,水动力模型对数学方程组的离散求解过程也极为费时,尤其是当水动力模型网格较密时,难以满足预报时效性要求。
发明内容
针对当前风暴增水预报模式中存在的计算资源消耗大、高精度预报对边界条件与实测地形的准确性依赖大等问题,本发明提出一种基于LSTM机器学习的风暴增水预报方法及系统,基于人工智能算法对风暴增水进行预报,并在浙江宁波沿海进行示范应用,为实现风暴潮的精细预警和精准预防提供重要技术支撑。
为了实现上述目的,本发明通过如下的技术方案来实现:
一种基于LSTM机器学习的风暴增水预报方法,所述方法包括:
收集并处理目标区域所在海域的历史台风数据;
基于所述历史台风数据,采用基于核密度估计法的经验路径法构建虚拟台风,并获取虚拟台风数据;
筛选出对目标区域有影响的历史台风数据和虚拟台风数据,组合构成目标区域台风数据集;
基于所述目标区域台风数据集,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;
对所述风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
选取起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及目标区域所设站点的气压与风速作为输入层,选取起报时刻后第二预设时间的风暴增水值作为输出层,构建LSTM风暴增水智能预报模型;
基于划分的训练集和验证集、设定的输入层和输出层进行超参数调优以确定模型超参数,确定模型超参数后,对LSTM风暴增水智能预报模型进行训练;
基于所述测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型的预测性能;
将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
作为本发明的一种优选方案,所述历史台风数据和虚拟台风数据分别包括每个历史台风和虚拟台风的移动速度、移动方向、台风中心所在经纬度、台风中心风速、台风中心最低气压。
作为本发明的一种优选方案,所述基于核密度估计法的经验路径法构建虚拟台风,并获取虚拟台风数据,具体包括:
基于所述历史台风数据,统计目标区域内历史台风的年发生频率及历史台风起始特征参数,并进行概率分布拟合;所述历史台风起始特征参数包括历史台风的初始移动速度、初始移动方向以及台风中心风速;
对目标区域进行网格划分,并统计各网格中历史台风的特征参数变化量,采用核密度估计法对所述特征参数变化量进行条件概率分布拟合;所述特征参数变化量包括移动速度变化量、移动方向变化量及最大风速变化量;
基于各网格中历史台风的年发生频率和历史台风起始特征参数的概率分布随机确定虚拟台风的起始位置和虚拟台风起始特征参数,生成虚拟台风;所述虚拟台风起始特征参数包括虚拟台风的初始移动速度、初始移动方向以及台风中心风速;
确定虚拟台风起始特征参数后,以预设的时间步模拟虚拟台风的轨迹和强度,具体为:在每个时间步中,确定虚拟台风所处的网格位置,基于虚拟台风起始特征参数从所处网格对应的历史台风的特征参数变化量的条件概率分布中进行条件采样,确定虚拟台风的特征参数变化量,以此确定下一个时间步虚拟台风的位置和特征参数变化量;这一过程不断循环,直至满足虚拟台风终止条件。
作为本发明的一种优选方案,所述虚拟台风终止条件包括:台风中心风速低于5.2m/s,台风中心所处位置的海温低于10℃,基于历史台风在各网格中的终止概率进行随机采样确定是否终止;满足三个条件中的任意一个,虚拟台风终止,表示虚拟台风构建完成。
作为本发明的一种优选方案,所述对目标区域有影响,认定标准具体为台风与目标区域的距离小于250km。
作为本发明的一种优选方案,所述第一预设时间为12h,所述第二预设时间为1h、3h、6h或12h。
作为本发明的一种优选方案,所述对LSTM风暴增水智能预报模型进行训练,具体包括:
神经元时序数据输入:输入起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及站点的气压与风速作为神经元时序数据;
输入合并:将神经元时序数据与当前时刻短期记忆信息/>合并为/>;
遗忘门sigmoid函数开关:通过遗忘门权重矩阵和/>进行sigmoid函数计算得到遗忘门输出/>,/>,/>用于确定本次输出是否需要使用以及使用多大程度的长期记忆信息/>;
产生新信息:通过权重矩阵和/>以及tanh函数产生本轮新信息/>;
输入门sigmoid函数开关:通过输入门权重矩阵和/>进行sigmoid函数计算得到输入门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的新信息叠加到长期记忆信息/>;
产生新的长期记忆信息:将上一时刻的长期记忆信息与产生的本轮新信息/>叠加,得到新的长期记忆信息/>:/>;
产生输出:通过长期记忆信息以及tanh函数产生输出信息/>;
输出门sigmoid函数开关:通过输出门权重矩阵和/>进行sigmoid函数计算得到输出门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的长期记忆信息;/>作为短期记忆信息保存至/>中;
神经元输出:输出和/>,其中/>作为单元输出值以及传递至下一神经元的短期记忆信息,/>作为传递至下一神经元的长期记忆信息。
一种基于LSTM机器学习的风暴增水预报系统,所述系统包括:
历史台风数据模块,用于收集并处理目标区域所在海域的历史台风数据;
虚拟台风数据模块,用于基于所述历史台风数据,采用基于核密度估计法的经验路径法构建虚拟台风并获取虚拟台风数据;
数据筛选模块,用于筛选出对目标区域有影响的历史台风数据和虚拟台风数据,组合构成目标区域台风数据集;
数据集构建模块,用于基于所述目标区域台风数据集,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;
模型构建模块,用于构建LSTM风暴增水智能预报模型;
风暴增水预报模块,用于将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
作为本发明的一种优选方案,所述模型构建模块包括:数据集划分单元、模型设定单元、超参数调优单元、模型训练单元,以及模型测试单元;
所述数据集划分单元用于对所述风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
所述模型设定单元用于选取起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及目标区域所设站点的气压与风速作为LSTM风暴增水智能预报模型的输入层,起报时刻后第二预设时间的风暴增水值作为LSTM风暴增水智能预报模型的输出层;
所述超参数调优单元用于对所述LSTM风暴增水智能预报模型进行超参数调优,以确定模型超参数;
所述模型训练单元用于对LSTM风暴增水智能预报模型进行训练;
所述模型测试单元用于基于所述测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型的预测性能。
与现有技术相比,本发明的有益效果是:考虑实测的历史台风数据不足以构建一个稳定、高效的风暴增水智能预报模型,因此通过构建大量的虚拟台风,并提供基于核密度估计法的经验路径法构建虚拟台风的具体方法,共同驱动水动力模型以构建风暴增水数据集,解决历史台风数据不够全面的问题;通过深度学习算法建立风暴增水与台风特征参数之间的量化关系,构建得到LSTM风暴增水智能预报模型,并在浙江宁波沿海进行示范应用,通过构建的LSTM模型预测风暴增水,实现更快速、更高精度的潮位短期预报,不需要借助于台风的预报信息,直接通过当前发生的台风信息来预测未来时刻的风暴潮数据,为实现风暴潮的精细预警和精准预防提供重要技术支撑。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。其中:
图1为本发明的方法流程图;
图2为本发明实施例的技术原理图;
图3为本发明实施例的LSTM风暴增水智能预报模型对各站点测试及上预报结果与增水目标值的曲线对比图;
图4为本发明实施例的LSTM风暴增水智能预报模型对各站点上风暴增水预报均方根误差统计图;
图5为本发明的系统模块化结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明的一个实施例,该实施例提供了一种基于LSTM机器学习的风暴增水预报方法,具体包括如下步骤:
S1:收集并处理目标区域所在海域的历史台风数据;
S2:基于历史台风数据,采用基于核密度估计法的经验路径法构建大量的虚拟台风,并获取虚拟台风数据;
实测的历史台风数据不足以构建一个稳定、高效的风暴增水智能预报模型,因此本发明的方法构建了大量的虚拟台风,共同驱动水动力模型以构建风暴增水数据集,解决历史台风数据不够全面的问题。
历史台风数据和虚拟台风数据分别包括每个历史台风和虚拟台风的移动速度、移动方向、台风中心所在经纬度、台风中心风速、台风中心最低气压等。
在一个实施例中,基于核密度估计法的经验路径法构建虚拟台风,并获取虚拟台风数据,具体步骤为:
S21:基于历史台风数据,统计目标区域内历史台风的年发生频率及历史台风起始特征参数,并进行概率分布拟合;
历史台风起始特征参数包括历史台风的初始移动速度、初始移动方向以及台风中心风速;
S22:对目标区域进行网格划分,并统计各网格中历史台风的特征参数变化量,台风的特征参数变化量依赖于前一时刻的参数值,故采用核密度估计法对特征参数变化量进行条件概率分布拟合;
特征参数变化量包括移动速度变化量、移动方向变化量及最大风速变化量;
S23:基于各网格中历史台风的年发生频率和历史台风起始特征参数的概率分布随机确定虚拟台风的起始位置和虚拟台风起始特征参数,进一步生成虚拟台风;
虚拟台风起始特征参数包括虚拟台风的初始移动速度、初始移动方向以及台风中心风速;
S24:确定虚拟台风起始特征参数后,以预设的时间步模拟虚拟台风的轨迹和强度;
在每个时间步中,确定虚拟台风所处的网格位置,基于虚拟台风起始特征参数从所处网格对应的历史台风的特征参数变化量的条件概率分布中进行条件采样,确定虚拟台风的特征参数变化量,以此确定下一个时间步的虚拟台风的位置和特征参数变化量;这一过程不断循环,直至满足虚拟台风终止条件;
优选地,预设的时间步为3h。
在一个具体的实施例中,虚拟台风终止条件包括:台风中心风速低于5.2m/s,台风中心所处位置的海温低于10℃,基于历史台风在各网格中的终止概率进行随机采样确定是否终止。满足三个条件中的任意一个,虚拟台风终止,表示虚拟台风构建完成。
S3:筛选出对目标区域有影响的历史台风数据和虚拟台风数据,组合构成目标区域台风数据集;
优选地,认定标准具体为台风与目标区域的距离小于250km,则台风对目标区域有影响。
S4:基于目标区域台风数据集,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;根据水动力模型构建风暴增水数据集采用现有技术,在此不再赘述。
S5:对风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
S6:选取起报时间点前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及目标区域所设站点的气压与风速作为输入层,选取起报时刻后第二预设时间的风暴增水值,即目标区域水动力模型的模拟值,作为输出层,构建LSTM风暴增水智能预报模型;
优选地,第一预设时间为12h,第二预设时间为1h、3h、6h或12h。
借助LSTM神经网络可以建立起报时刻前12小时的台风中心所在经纬度、台风中心最低气压、台风中心风速以及站点的气压与风速与起报时刻后若干小时(1h、3h、6h或12h)的风暴增水的非线性映射关系,通过构建LSTM风暴增水智能预报模型进行风暴增水的快速预报。
LSTM神经网络由输入层、隐藏层及输出层组成,输入层用于接收数据,输出层用于设定神经网络训练目标,隐藏层用于执行各类非线性变换以建立输入层与输出层之间的非线性关系。相较于传统神经网络,LSTM隐藏层神经元中添加了三个非线性门控结构,包含遗忘门、输出门及输出门,遗忘门决定从上一神经元状态中丢弃哪些信息,输入门决定对神经元状态添加哪些新的信息,输出门则向下一神经元输出当前神经元状态及输出值;LSTM中的输入数据均需通过隐藏层神经元的输入门、遗忘门和输出门进行信息的遗忘与更新,在传递至输出层输出LSTM模型的预测值。
S7:基于划分的训练集和验证集、设定的输入层和输出层进行超参数调优以确定模型超参数,确定模型超参数后,对LSTM风暴增水智能预报模型进行训练;
在一些实施例中,对LSTM风暴增水智能预报模型进行训练,具体包括:
神经元时序数据输入:输入起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及站点的气压与风速作为神经元时序数据;
输入合并:将神经元时序数据与当前时刻短期记忆信息/>合并为/>;
遗忘门sigmoid函数开关:通过遗忘门权重矩阵和/>进行sigmoid函数计算得到遗忘门输出/>,/>,/>用于确定本次输出是否需要使用以及使用多大程度的长期记忆信息/>;
产生新信息:通过权重矩阵和/>以及tanh函数产生本轮新信息/>;
输入门sigmoid函数开关:通过输入门权重矩阵和/>进行sigmoid函数计算得到输入门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的新信息叠加到长期记忆信息/>;
产生新的长期记忆信息:将上一时刻的长期记忆信息与产生的本轮新信息/>叠加,得到新的长期记忆信息/>:/>;
产生输出:通过长期记忆信息以及tanh函数产生输出信息/>;
输出门sigmoid函数开关:通过输出门权重矩阵和/>进行sigmoid函数计算得到输出门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的长期记忆信息;/>作为短期记忆信息保存至/>中;
神经元输出:输出和/>,其中/>作为单元输出值以及传递至下一神经元的短期记忆信息,/>作为传递至下一神经元的长期记忆信息。
S8:基于测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型对风暴增水的预测性能。
S9:将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
如图2-图4所示,以下以宁波沿海区域为例对本发明的方法进一步说明。
宁波沿海所在海域为西北太平洋,所设站点包括镇海、毛礁、湖头渡、强蛟和西泽。
S1:收集1978~2021年西北太平洋的历史台风数据;
S2:基于历史台风数据,采用基于核密度估计法的经验路径法构建大量的虚拟台风,并获取虚拟台风数据,具体包括:
S21:基于历史台风数据,统计宁波沿海区域内历史台风的年发生频率及历史台风起始特征参数,并进行概率分布拟合;
S22:对宁波沿海进行网格划分,并统计各网格中历史台风的特征参数变化量,采用核密度估计法对特征参数变化量进行条件概率分布拟合;
S23:基于各网格中历史台风的年发生频率和历史台风起始特征参数的概率分布随机确定虚拟台风的起始位置和虚拟台风起始特征参数,生成虚拟台风;
S24:确定虚拟台风起始特征参数后,以3h为一个时间步来模拟虚拟台风的轨迹和强度,具体为:在每个时间步中,首先确定虚拟台风所处的网格位置,然后基于虚拟台风起始特征参数从所处网格对应的历史台风的特征参数变化量的条件概率分布中进行条件采样,确定虚拟台风的特征参数变化量,以此确定下一个时间步虚拟台风的位置和特征参数变化量;这一过程不断循环,直至满足虚拟台风终止条件;
S3:认定当台风与宁波沿海距离小于250km时,台风对宁波沿海有影响,筛选出对宁波沿海有影响的历史台风数据和虚拟台风数据,组合构成宁波沿海台风数据集;
S4:基于宁波沿海台风数据集,驱动构建基于ADCIRC的宁波沿海水动力模型,进而构建风暴增水数据集;
S5:对风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
S6:选取起报时刻前12h的台风中心所在经纬度、台风中心最低气压、台风中心风速以及站点的气压与风速作为输入层,选取起报时刻后6h的风暴增水值(即:宁波沿海水动力模型的模拟值)作为输出层,构建LSTM风暴增水智能预报模型;
S7:基于划分的训练集和验证集、设定的输入层和输出层进行超参数调优以确定模型超参数,确定模型超参数后,对LSTM风暴增水智能预报模型进行训练,具体包括:
神经元时序数据输入:输入起报时刻前12h的台风中心所在经纬度、台风中心最低气压、台风中心风速以及站点的气压与风速作为神经元时序数据;
输入合并:将神经元时序数据与当前时刻短期记忆信息/>合并为/>;
遗忘门sigmoid函数开关:通过遗忘门权重矩阵和/>进行sigmoid函数计算得到遗忘门输出/>,/>,/>用于确定本次输出是否需要使用以及使用多大程度的长期记忆信息/>;
产生新信息:通过权重矩阵和/>以及tanh函数产生本轮新信息/>;
输入门sigmoid函数开关:通过输入门权重矩阵和/>进行sigmoid函数计算得到输入门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的新信息叠加到长期记忆信息/>;
产生新的长期记忆信息:将上一时刻的长期记忆信息与产生的本轮新信息/>叠加,得到新的长期记忆信息/>:/>;
产生输出:通过长期记忆信息以及tanh函数产生输出信息/>;
输出门sigmoid函数开关:通过输出门权重矩阵和/>进行sigmoid函数计算得到输出门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的长期记忆信息;/>作为短期记忆信息保存至/>中;
神经元输出:输出和/>,其中/>作为单元输出值以及传递至下一神经元的短期记忆信息,/>作为传递至下一神经元的长期记忆信息。
S8:基于测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型的预测性能;
S9:将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
如图3所示,单步预测的LSTM风暴增水智能预报模型的预报结果在5个测站上均与增水目标值拟合良好。图4进一步统计了1h、3h、6h及12h预见期的LSTM风暴增水智能预报模型在各站点上对增水大于10cm的预报误差(RMSE),可以看到随着预见期的增加,模型的预报误差也逐渐增大,1h预见期的LSTM风暴增水智能预报模型预报增水的RMSE范围为0.05m~0.07m;3h预见期的LSTM风暴增水智能预报模型预报增水的RMSE范围为0.06m~0.08m;6h预见期的LSTM风暴增水智能预报模型预报增水的RMSE范围为0.07m~0.11m;12h预见期的LSTM风暴增水智能预报模型预报增水的RMSE范围为0.12m~0.16m。
如图5所示,为本发明的另一实施例,该实施例提供了一种基于LSTM机器学习的风暴增水预报系统,具体包括:
历史台风数据模块,用于收集并处理目标区域所在海域的历史台风数据;
虚拟台风数据模块,用于基于历史台风数据,采用基于核密度估计法的经验路径法构建虚拟台风并获取虚拟台风数据;
数据筛选模块,用于筛选出对目标区域有影响的历史台风数据和虚拟台风数据,组合构成目标区域台风数据集;
数据集构建模块,用于基于目标区域台风数据集,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;
模型构建模块,用于构建LSTM风暴增水智能预报模型;
风暴增水预报模块,用于将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
在一个优选实施例中,模型构建模块包括:数据集划分单元、模型设定单元、超参数调优单元、模型训练单元,以及模型测试单元;
数据集划分单元用于对风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
模型设定单元用于选取起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及目标区域所设站点的气压与风速作为LSTM风暴增水智能预报模型的输入层,起报时刻后第二预设时间的风暴增水值作为LSTM风暴增水智能预报模型的输出层;
超参数调优单元用于对LSTM风暴增水智能预报模型进行超参数调优,以确定模型超参数;
模型训练单元用于对LSTM风暴增水智能预报模型进行训练;
模型测试单元用于基于测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型的预测性能。
综上所述,本发明通过构建大量的虚拟台风,并提供基于核密度估计法的经验路径法构建虚拟台风的具体方法,共同驱动水动力模型以构建风暴增水数据集,解决历史台风数据不够全面的问题;通过深度学习算法建立风暴增水与台风特征参数之间的量化关系,构建得到LSTM风暴增水智能预报模型,并在浙江宁波沿海进行示范应用,通过构建的LSTM模型预测风暴增水,实现更快速、更高精度的潮位短期预报,不需要借助于台风的预报信息,直接通过当前发生的台风信息来预测未来时刻的风暴潮数据,为实现风暴潮的精细预警和精准预防提供重要技术支撑。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其他任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现,计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,该存储介质可以是只读存储器,磁盘或光盘等
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述方法包括:
收集并处理目标区域所在海域的历史台风数据;
基于所述历史台风数据,采用基于核密度估计法的经验路径法构建虚拟台风,并获取虚拟台风数据;
筛选出对目标区域有影响的历史台风数据和虚拟台风数据,组合构成目标区域台风数据集;
基于所述目标区域台风数据集,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;
对所述风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
选取起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及目标区域所设站点的气压与风速作为输入层,选取起报时刻后第二预设时间的风暴增水值作为输出层,构建LSTM风暴增水智能预报模型;
基于划分的训练集和验证集、设定的输入层和输出层进行超参数调优以确定模型超参数,确定模型超参数后,对LSTM风暴增水智能预报模型进行训练;
基于所述测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型的预测性能;
将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
2.根据权利要求1所述的一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述历史台风数据和虚拟台风数据分别包括每个历史台风和虚拟台风的移动速度、移动方向、台风中心所在经纬度、台风中心风速、台风中心最低气压。
3.根据权利要求1所述的一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述基于核密度估计法的经验路径法构建虚拟台风,并获取虚拟台风数据,具体包括:
基于所述历史台风数据,统计目标区域内历史台风的年发生频率及历史台风起始特征参数,并进行概率分布拟合;所述历史台风起始特征参数包括历史台风的初始移动速度、初始移动方向以及台风中心风速;
对目标区域进行网格划分,并统计各网格中历史台风的特征参数变化量,采用核密度估计法对所述特征参数变化量进行条件概率分布拟合;所述特征参数变化量包括移动速度变化量、移动方向变化量及最大风速变化量;
基于各网格中历史台风的年发生频率和历史台风起始特征参数的概率分布随机确定虚拟台风的起始位置和虚拟台风起始特征参数,生成虚拟台风;所述虚拟台风起始特征参数包括虚拟台风的初始移动速度、初始移动方向以及台风中心风速;
确定虚拟台风起始特征参数后,以预设的时间步模拟虚拟台风的轨迹和强度,具体为:在每个时间步中,确定虚拟台风所处的网格位置,基于虚拟台风起始特征参数从所处网格对应的历史台风的特征参数变化量的条件概率分布中进行条件采样,确定虚拟台风的特征参数变化量,以此确定下一个时间步虚拟台风的位置和特征参数变化量;这一过程不断循环,直至满足虚拟台风终止条件。
4.根据权利要求3所述的一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述虚拟台风终止条件包括:台风中心风速低于5.2m/s,台风中心所处位置的海温低于10℃,基于历史台风在各网格中的终止概率进行随机采样确定是否终止;满足三个条件中的任意一个,虚拟台风终止,表示虚拟台风构建完成。
5.根据权利要求1所述的一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述对目标区域有影响,认定标准具体为台风与目标区域的距离小于250km。
6.根据权利要求1所述的一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述第一预设时间为12h,所述第二预设时间为1h、3h、6h或12h。
7.根据权利要求1所述的一种基于LSTM机器学习的风暴增水预报方法,其特征在于,所述对LSTM风暴增水智能预报模型进行训练,具体包括:
神经元时序数据输入:输入起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及站点的气压与风速作为神经元时序数据;
输入合并:将神经元时序数据与当前时刻短期记忆信息/>合并为/>;
遗忘门sigmoid函数开关:通过遗忘门权重矩阵和/>进行sigmoid函数计算得到遗忘门输出/>,/>,/>用于确定本次输出是否需要使用以及使用多大程度的长期记忆信息/>;
产生新信息:通过权重矩阵和/>以及tanh函数产生本轮新信息/>;
输入门sigmoid函数开关:通过输入门权重矩阵和/>进行sigmoid函数计算得到输入门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的新信息叠加到长期记忆信息/>;
产生新的长期记忆信息:将上一时刻的长期记忆信息与产生的本轮新信息/>叠加,得到新的长期记忆信息/>:/>;
产生输出:通过长期记忆信息以及tanh函数产生输出信息/>;
输出门sigmoid函数开关:通过输出门权重矩阵和/>进行sigmoid函数计算得到输出门输出/>,/>,/>用于确定是否需要使用以及使用多大程度的长期记忆信息/>;作为短期记忆信息保存至/>中;
神经元输出:输出和/>,其中/>作为单元输出值以及传递至下一神经元的短期记忆信息,/>作为传递至下一神经元的长期记忆信息。
8.基于权利要求1-7任一项所述的一种基于LSTM机器学习的风暴增水预报方法的预报系统,其特征在于,所述系统包括:
历史台风数据模块,用于收集并处理目标区域所在海域的历史台风数据;
虚拟台风数据模块,用于基于所述历史台风数据,采用基于核密度估计法的经验路径法构建虚拟台风并获取虚拟台风数据;
数据筛选模块,用于筛选出对目标区域有影响的历史台风数据和虚拟台风数据,组合构成目标区域台风数据集;
数据集构建模块,用于基于所述目标区域台风数据集,驱动构建基于ADCIRC的目标区域水动力模型,进而构建风暴增水数据集;
模型构建模块,用于构建LSTM风暴增水智能预报模型;
风暴增水预报模块,用于将待预测的台风信息输入到训练好的LSTM风暴增水智能预报模型,进行风暴增水预报。
9.根据权利要求8所述的一种基于LSTM机器学习的风暴增水预报方法的预报系统,其特征在于,所述模型构建模块包括:数据集划分单元、模型设定单元、参数调优单元、模型训练单元,以及模型测试单元;
所述数据集划分单元用于对所述风暴增水数据集进行划分,将风暴增水数据集中对应的虚拟台风数据按照7:3划分训练集和验证集,将风暴增水数据集中全部的历史台风数据作为测试集;
所述模型设定单元用于选取起报时刻前第一预设时间的台风中心所在经纬度、台风中心最低气压、台风中心风速以及目标区域所设站点的气压与风速作为LSTM风暴增水智能预报模型的输入层,起报时刻后第二预设时间的风暴增水值作为LSTM风暴增水智能预报模型的输出层;
所述超参数调优单元用于对所述LSTM风暴增水智能预报模型进行超参数调优,以确定模型超参数;
所述模型训练单元用于对LSTM风暴增水智能预报模型进行训练;
所述模型测试单元用于基于所述测试集对训练好的LSTM风暴增水智能预报模型进行精度测试,评估LSTM风暴增水智能预报模型的预测性能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311226654.1A CN116976227B (zh) | 2023-09-22 | 2023-09-22 | 一种基于lstm机器学习的风暴增水预报方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311226654.1A CN116976227B (zh) | 2023-09-22 | 2023-09-22 | 一种基于lstm机器学习的风暴增水预报方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116976227A true CN116976227A (zh) | 2023-10-31 |
CN116976227B CN116976227B (zh) | 2023-12-08 |
Family
ID=88478205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311226654.1A Active CN116976227B (zh) | 2023-09-22 | 2023-09-22 | 一种基于lstm机器学习的风暴增水预报方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116976227B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117471575A (zh) * | 2023-12-28 | 2024-01-30 | 河海大学 | 基于bo-lstm神经网络模型的台风浪波高预报方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106501878A (zh) * | 2016-10-18 | 2017-03-15 | 河海大学 | 预估偏差法集合化台风预报方法 |
CN111222677A (zh) * | 2019-10-22 | 2020-06-02 | 浙江运达风电股份有限公司 | 一种基于长短期记忆时间神经网络的风速预测方法及系统 |
CN113723024A (zh) * | 2021-08-30 | 2021-11-30 | 浙江大学 | 一种适用于滨海地区的“溪流”-“河道”-“河口”分布式洪水过程模拟方法 |
CN115840975A (zh) * | 2022-11-15 | 2023-03-24 | 广东省水利水电科学研究院 | 一种风暴潮增水漫堤预警方法、系统、装置和存储介质 |
CN116467933A (zh) * | 2023-03-21 | 2023-07-21 | 厦门大学 | 基于深度学习的风暴潮增水预测方法及系统 |
-
2023
- 2023-09-22 CN CN202311226654.1A patent/CN116976227B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106501878A (zh) * | 2016-10-18 | 2017-03-15 | 河海大学 | 预估偏差法集合化台风预报方法 |
CN111222677A (zh) * | 2019-10-22 | 2020-06-02 | 浙江运达风电股份有限公司 | 一种基于长短期记忆时间神经网络的风速预测方法及系统 |
CN113723024A (zh) * | 2021-08-30 | 2021-11-30 | 浙江大学 | 一种适用于滨海地区的“溪流”-“河道”-“河口”分布式洪水过程模拟方法 |
CN115840975A (zh) * | 2022-11-15 | 2023-03-24 | 广东省水利水电科学研究院 | 一种风暴潮增水漫堤预警方法、系统、装置和存储介质 |
CN116467933A (zh) * | 2023-03-21 | 2023-07-21 | 厦门大学 | 基于深度学习的风暴潮增水预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
XIAOXIAN GUO 等: "Predicting heave and surge motions of a semi-submersible with neural networks", 《APPLIED OCEAN RESEARCH》, vol. 112, pages 1 - 12 * |
姚帏: "基于机器学习的南海北部风暴增水预报研究", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 02, pages 010 - 23 * |
苑希民 等: "基于LSTM-GM神经网络模型的风暴潮增水预报方法研究", 《水资源保护》, pages 1 - 13 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117471575A (zh) * | 2023-12-28 | 2024-01-30 | 河海大学 | 基于bo-lstm神经网络模型的台风浪波高预报方法 |
CN117471575B (zh) * | 2023-12-28 | 2024-03-08 | 河海大学 | 基于bo-lstm神经网络模型的台风浪波高预报方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116976227B (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310968B (zh) | 一种基于互信息的lstm神经网络循环水文预报方法 | |
Hung et al. | An artificial neural network model for rainfall forecasting in Bangkok, Thailand | |
CN111767517B (zh) | 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质 | |
CN107193060B (zh) | 一种多路径台风风暴潮快速预测方法及系统 | |
CN116976227B (zh) | 一种基于lstm机器学习的风暴增水预报方法及系统 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
CN107480781A (zh) | 神经网络自适应卡尔曼滤波的核事故源项反演方法 | |
CN114493052B (zh) | 多模型融合自适应新能源功率预测方法和系统 | |
CN115423163A (zh) | 一种流域短期洪水事件预测方法、装置及终端设备 | |
CN112307536B (zh) | 一种大坝渗流参数反演方法 | |
CN117494586B (zh) | 一种基于深度学习的山洪时空预测方法 | |
CN115877483A (zh) | 一种基于随机森林和gru的台风路径预报方法 | |
CN115983132A (zh) | 流域径流对未来气候及土地利用变化的响应研究方法 | |
CN110852415B (zh) | 基于神经网络算法的植被指数预测方法、系统及设备 | |
CN117556197A (zh) | 一种基于人工智能的台风涡旋初始化方法 | |
CN116467933A (zh) | 基于深度学习的风暴潮增水预测方法及系统 | |
CN116910534A (zh) | 一种不同海域海洋环境要素时空智能预测方法和装置 | |
CN114676621A (zh) | 基于深度学习权重负载提高陆地水储量异常准确性方法 | |
CN117195749B (zh) | 一种气候变化对区域公路网风险预测方法及可读存储介质 | |
CN116861766A (zh) | 一种基于生成对抗网络的台风风场预测方法和系统 | |
CN115829150A (zh) | 一种积水预测系统 | |
Qiu et al. | A short-term precipitation prediction model based on spatiotemporal convolution network and ensemble empirical mode decomposition | |
CN115034159A (zh) | 一种海上风电场的功率预测方法、装置、存储介质及系统 | |
Huang et al. | Probabilistic prediction intervals of wind speed based on explainable neural network | |
Putranto et al. | Deep Learning Approach for Heavy Rainfall Prediction Using Himawari-8 And RDCA Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |