CN116579468A - 基于云系记忆的台风生成预测方法、装置、设备及介质 - Google Patents
基于云系记忆的台风生成预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116579468A CN116579468A CN202310472861.9A CN202310472861A CN116579468A CN 116579468 A CN116579468 A CN 116579468A CN 202310472861 A CN202310472861 A CN 202310472861A CN 116579468 A CN116579468 A CN 116579468A
- Authority
- CN
- China
- Prior art keywords
- model
- convlstm
- vgg
- training
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 66
- 238000013145 classification model Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims abstract description 31
- 238000012795 verification Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 39
- 238000010276 construction Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims 2
- 238000013135 deep learning Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于云系记忆的台风生成预测方法、装置、设备及介质,方法包括:获取历史热带气旋生命周期的卫星云图数据集,对卫星云图数据集进行预处理后,将卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;分别构建时序预测模型ConvLSTM和VGG分类模型;通过构建的时序预测模型ConvLSTM和所述VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。本发明基于卫星云图数据,根据时序预测模型ConvLSTM和VGG分类模型能客观、高效的预测热带扰动是否在未来两天内发展成台风。
Description
技术领域
本文件涉及台风预测技术领域,尤其涉及一种基于云系记忆的台风生成预测方法、装置、设备及介质。
背景技术
台风是一种极具破坏性的自然灾害,常带来狂风、暴雨和风暴潮,给沿海地区人民的生活和城市经济造成重大损失。为了减少台风带来的损失,提前预防台风灾害,研发高效精确的台风预测技术迫在眉睫。
在过去的几十年里,各种设备已经被开发和利用于台风(TC)研究。其中,气象卫星因其能够在广阔的海洋区域提供全天候的TC遥感探测而受到越来越多的关注。目前,卫星云图(SCI)可能是TC成因预报中最主要的数据。在SCI的帮助下,TC成因预报工具的发展似乎有三种主要方法:统计方法、基于数值天气预报(NWP)模型和统计动力学方法。在统计学方法中,其中一个代表是Dvorak技术,它通过分析SCI中的云模式和特征对TC的初始系统进行分类和估计。Dvorak技术也随着时间的推移而不断完善,目前仍是气象局最常使用的TC生成预报方法。在NWP方法中,全球数值模式是其中的一个代表,它通过在给定的初始和边界条件下对大气运动的一组基本方程进行数值解算来预测TC的生成。该方法的可行性也得到了广泛的验证。在统计动力学方法中,统计飓风强度预测方案(SHIPS)是其中的一个代表,它在TC行为和从动力学模型得到的预测因子之间建立了统计关系。目前,有许多研究工作者在从事这方面的工作。
上述方法都是利用TC的关键参数进行预测,这些参数能够代表TC的一些特征,如SST、相对涡度、降水率、温度等,这是毋庸置疑的,但TC复杂的演化过程仅靠少数参数是难以完全描述的。最近,深度学习技术得到了快速发展,为TC演化的超参数模拟提供了新的可能,但是技术上仍存在局限性。数值模式方法参数化方案和初始条件的不同会对预测的准确度有很大的影响,使得预测结果存在不稳定性。现有的统计方法难以考虑各变量之间的非线性关系,机器学习方法未考虑到各变量的时空相关性,使得预测的准确度有所降低。
发明内容
本发明提供一种基于云系记忆的台风生成预测方法、装置、设备及介质,旨在解决上述问题。
本发明提供一种基于云系记忆的台风生成预测方法,包括:
S1、获取历史热带气旋生命周期的卫星云图数据集,对所述卫星云图数据集进行预处理后,将卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;
S2、分别构建时序预测模型ConvLSTM和VGG分类模型;
S3、通过训练集对构建的时序预测模型ConvLSTM和VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;
S4、通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。
本发明提供一种基于云系记忆的台风生成预测装置,包括:
数据获取模块,用于获取历史热带气旋生命周期的卫星云图数据集,对所示卫星云图数据集进行预处理后,将卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;
模型构建模块,用于分别构建时序预测模型ConvLSTM和VGG分类模型;
模型训练模块,用于通过训练集对构建的时序预测模型ConvLSTM和所述VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;
台风预测模块,用于通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。
本发明提供一种电子设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行如基于云系记忆的台风生成预测方法的步骤。
本发明提供一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现如基于云系记忆的台风生成预测方法的步骤。
通过采用本发明实施例,使用历史热带气旋的卫星云图数据集,通过用ConvLSTM提取台风发生发展过程中的时间序列信息,预测未来两天的卫星云图,结合采用图像分类模型(VGG)识别预测的卫星云图中热带云团的强度是否达到热带风暴。在台风预测领域较为创新并且具备较高潜力。经过大量的样本数据测试显示,模型对台风是否生成预测表现了较高准确度。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的基于云系记忆的台风生成预测方法的流程图;
图2为本发明实施例的ConvLSTM模型的结构示意图;
图3为本发明实施例的VGG模型的深度神经网络结构图;
图4为本发明实施例的ConvLSTM-VGG模型的流程图;
图5分类模型识别不同阶段预测的Sci的热图;
图6为本发明实施例的基于云系记忆的台风生成预测装置示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
方法实施例
本发明实施例提供了一种基于云系记忆的台风生成预测方法,图1为本发明实施例的基于云系记忆的台风生成预测方法的流程图,根据图1所示,本发明实施例的基于云系记忆的台风生成预测方法具体包括:
S1、获取历史热带气旋生命周期的卫星云图数据集,对所述卫星云图数据集进行预处理后,将所述卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;步骤S1具体包括:
S11、从热带气旋官方网站下载近几年来的合适的历史热带气旋的卫星云图数据,选择热带气旋生成海区进行划分的区域的热带气旋生命周期数据集,每一个区域热带气旋数据集中包括不同年份的热带气旋生成记录,从热带气旋形成前1-2天到其消散后几天每小时拍摄一次的卫星云图。
S12、清洗原始数据,清除卫星云图数据坏点。
S13、本实验数据集是以台风为对象,由混乱的数据包组成的,它是由滑动窗口在图像序列中一步步滑动形成的,按照时序形式,滑动窗口取相同时间间隔的n张图片,滑动步长为s。
S14、令需要预测台风的某一固定区域为区域A1,A1的全部热带气旋生命周期卫星云图数据集为Q1,将Q1中的所有台风进行随机排序,令N1为Q1的台风记录个数,初始化台风记录序号np=1,台风np按照时序形式对应第1,2,...,i张卫星云图像数据为
S15、构建ConvLSTM模型的数据集R1,S5具体包括:
S151、以第np台风为对象,按照时序,选取相同时间间隔的6张卫星云图,时间间隔为t,第np台风卫星云图总数为N。单个台风卫星云图按照时序对应序号x,初始化序号x=1,打包6张卫星云图为输入X,卫星云图/>为标签Y(标签为真实的图片)
S152、令x=x+1,若x≤N-11,则执行S151;若x>N,则执行S153;
S153、令np=np+1,若np≤N1,则执行S151;若np>N1,说明已得到合适的数据集,将其打包构建输入数据集R1。
S16、构建VGG模型的数据集R2,步骤如下:
S161、将数据集Q1中第np台风的所有台风卫星云图导出,初始化台风记录序号np=1。
S162、令np=np+1,若np≤N1,则执行S161;若np>N1,说明已得到合适的数据集,将卫星云图进行随机顺序打乱,并通过水平翻转进行数据增强,将其打包构建输入数据集R2。
S17、将数据集R1,R2分层为训练集、验证集和测试集,训练集和验证集分别用于训练和验证时间序列预报模型和图像分类模型,而测试集则用于检验模型的整体性能。在本研究中,SCI图像数据集的划分方式是无序打乱选取,训练集、验证集和测试集的比例大约为8:1:1。
S18、将所有数据集(训练集、验证集、测试集)归一化:先求出训练集的均值、标准差,对数据集所有图像进行标准化,公式如下:
其中μ为训练集的均值,σ为训练集的标准差。
S19、本实验为了满足模型对输入信息的要求,并在训练过程中促进收敛,将卫星云图像压缩到64×64像素的平面。
S2、分别构建时序预测模型ConvLSTM和VGG分类模型;步骤S2具体包括:
S21、搭建深度学习环境,在服务器上安装先搭建Pytorch-GPU的虚拟环境,再安装Pytorch库。
S22、基于深度学习库Pytorch构建深度学习ConvLSTM台风预测模型。步骤S22具体包括:
S221、图2为本发明实施例的ConvLSTM模型的结构示意图,ConvLSTM模型由4层ConvLSTM循环层组成,每一层使用尺寸为3x3的卷积核。并在ConvLSTM层后加入批标准化层(Batch Norm2d),通过对每层的输出进行批标准化处理,防止过拟合并提高模型的训练速度。
S222、所有层的神经元选择的激活函数为‘Relu’函数,具体形式为Relu(x)=max(0,x)(即取0和x中的最大值)。‘Relu’函数一方面可以增强模型的非线性性,另一方面可以增强网络的稀疏性。
S23、构建VGG分类模型,搭建网络结构。图3为本发明实施例的VGG模型的深度神经网络结构图,该网络模型较简单,主要包括卷积层,池化层,全连接层,步骤S23具体包括:
S231、VGG由13层卷积层(Conv)、4层全连接层(FC)、池化层(MaxPool2d)以及Softmax输出层构成。
S232、所有隐层的激活单元都采用函数nn.ReLU()。
S233、每两层卷积层(Conv)后铺设nn.MaxPool2d池化层,可以起到减少神经网络的数据量,简化数据,加快数据处理的作用。
S234、Dropout(0.5)使得神经网络中的部分神经元处于暂时关闭状态,精简模型,通过调整Dropout项可以有效减少过拟合的影响。
S235、本实验通道数目变化依次为1->64->128->256->512,Softmax回归将其结果映射到区间(0,1),0对应没有台风,1对应有台风。
S3、通过所述训练集对构建的时序预测模型ConvLSTM和所述VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;步骤S3具体包括:
S31、将ConvLSTM、VGG模型分别对应数据集R1、R2通过随机打乱,分为训练集(R11、R21),验证集(R12、R22)和测试集(R13、R23),训练集、验证集和测试集的比例大约为8:1:1。
S32、对应模型输入训练集(R11、R21),通过构建好的ConvLSTM、VGG模型分别进行训练拟合,步骤S32具体包括:
S321、选择SSIM作为ConvLSTM模型的损失函数,公式如下:
其中μx,μy是代表图像X,Y的均值,c1,c2是稳定函数,σxy为图像X,Y的协方差。
S322、选择交叉熵函数L作为VGG分类模型的损失函数,函数形式如下:
yi表示样本i的标签,正类为1,负类为0。pi表示样本i被预测为正类的概率.
S323、选择SSIM作为ConvLSTM模型的评价指标,SSIM的值越接近于1,预测结果越好。
S324、通过多维度方式评价VGG模型,客观方式根据损失函数曲线收敛时,验证损失曲线最小的epoch,取该epoch对应的模型。
S325、对应ConvLSTM模型输入训练集R11,通过构建好的ConvLSTM模型进行训练拟合,步骤S325具体包括:
S3251、初始化循环次数序号nc=1;
S3252、初始化迭代次数epoch=0;epoch取值区间为0~100;
S3253、批次大小batchsize=4;
S3254、初始化学习率lr=0.001,每隔20个轮回学习率减半;
S3255、使用Pytorch框架构建ConvLSTM模型,参数设置损失函数loss为SSIM,优化器optimizer为Adam算法,学习率lr为lr,评价指标metrics为SSIM;
S3256、通过Pytorch内置函数来拟合ConvLSTM模型,得到训练集的损失函数值loss_value。将函数的参数设定为:训练数据为R11的NL个输入数据,训练标签数据为R11的NL个标签数据,迭代次数epochs为epoch,批大小batch_size为batchsize;
S3257、通过Pytorch内置函数来评估ConvLSTM模型,得到ConvLSTM模型的SSIM。将函数的参数设定为:测试数据data_test为R12的NL′个输入数据,测试数据labels_test为R12的NL′个标签数据;
S3258、记录第nc次循环的epoch,lr,训练集的损失函数值loss_value以及验证集的SSIM,调用Pytorch的模型保存函数保存nc次循环得到的模型。令nc=nc+1,若epoch≤100,则执行步骤S3252;若epoch>100,则执行步骤S3259;
S3258、将第1,2,...,nc,...,C次循环所记录的epoch,lr,loss_value,SSIM整合成一个拟合模型的完整记录。从中搜索出最小的loss_value2和最大的SSIM所对应的循环次数序号nc'。将第nc'次保存的epoch,lr作为部分最优超参数,将第nc'次保存的模型作为台风时序预测模型。
S326、对应VGG模型输入训练集R21,通过构建好的VGG模型进行训练拟合,步骤S326具有包括:
S3261、初始化循环次数序号nv=1;
S3262、初始化迭代次数epoch=0;epoch取值区间为0~100。
S3263、批次大小batchsize=128。
S3264、初始化学习率lr=0.01,每隔15个轮回学习率减半。
S3265、使用Pytorch框架构建VGG模型,参数设置损失函数loss为交叉熵损失函数L,优化器optimizer为SGD算法,学习率lr为lr,评价指标为损失函数曲线图像。
S3266、通过Pytorch内置函数来拟合VGG模型,得到训练集的损失函数值loss_value3。将函数的参数设定为:训练数据为R21的Ni个输入数据,训练标签数据为R21的Ni的个标签数据,迭代次数epochs为epoch,批大小batch_size为batchsize。
S3267、通过Pytorch内置函数来评估混合VGG模型,得到VGG模型的SSIM。将函数的参数设定为:测试数据data_test为R22的Ni'个输入数据,测试数据labels_test为R22的Ni'个标签数据。
S3268、记录第na次循环的epoch,lr,训练集的损失函数值loss_value以及保存测试集的损失函数曲线图像,调用Pytorch的模型保存函数保存na次循环得到的模型。令na=na+1,若epoch≤100,则执行步骤S3263,;若epoch>100则执行步骤S3269;
S3269、将第1,2,...,na,...,C次循环所记录的epoch,lr,loss_value,测试损失函数曲线图像整合成一个拟合模型的完整记录。从中搜索出最小的loss_value3和验证集损失函数曲线收敛时,最小epoch所对应的循环次数序号na',将第na'次保存的epoch,lr作为部分最优超参数,将第na'次保存的模型作为分类模型。图4为本发明实施例的ConvLSTM-VGG模型的流程图。
S4、通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。步骤S4具体包括:
S41、初始化预测次序号nf=1,将未使用的测试集R13数据输入训练完成的ConvLSTM模型,进行时序预测台风图像,将第nf卫星云图数据输入后得到预测后台风图像Inf(根据选定时间间隔t,令t=T/6,T为预测时间,且为6的正整数倍);
S42、令nf=nf+1,若nf≤总数Nj,则执行步骤S41,若nf>Nj,则将所有预测图像打包构建数据集R3。
S43、将数据集R3输入训练好的VGG分类模型,进行图像分类,初始化次序号nz=1,将第nz预测后台风图像输入后,得出分类结果/>
S44、令nz=nz+1,若nz≤总数Nj,则执行步骤S43,若nz>Nj,则得到全部台风是否生成的分类结果图5分类模型识别不同阶段预测的Sci的热图。
本发明公开了一种基于云系记忆的ConvLSTM-VGG的台风生成预测方法,首先通过获取历史热带气旋生命周期的卫星云图数据集,分别处理打包数据,将其分为三组:训练集、验证集和测试集。然后分别构建时序预测模型ConvLSTM,分类模型VGG。输入训练数据集,通过构建的ConvLSTM、VGG模型分别进行训练拟合,评估模型。最后采用训练好的混合ConvLSTM-VGG的台风预测模型对台风是否形成进行预测,通过大量数据验证具有较高的准确率。
采用本发明能取得以下效果:
1.本发明可以便捷的采用现有的公开卫星云图数据集以及深度学习框架进行模型的构建和预测。第一步从热带气旋官方网站获取现有的公开数据集用于模型构建和训练的准备,第二步使用深度学习框架Pytorch进行模型的构建。因此具有便捷性。
2.本发明不同于以往的数值预测预测方法、统计预测方法、以及传统的机器学习预测方法。该方法使用历史热带气旋的卫星云图数据集,通过用ConvLSTM提取台风发生发展过程中的时间序列信息,预测未来两天的卫星云图,结合采用图像分类模型(VGG)识别预测的卫星云图中热带云团的强度是否达到热带风暴。在台风预测领域较为创新并且具备较高潜力。
3.本发明第三步通过训练拟合台风形成模型,第四步利用模型能成功对台风是否形成进行预测,经过大量的样本数据测试显示,模型对台风是否生成预测表现了较高准确度。
装置实施例一
本发明实施例提供了一种基于云系记忆的台风生成预测装置,图6为本发明实施例的基于云系记忆的台风生成预测装置示意图,根据图6所示,本发明实施例的基于云系记忆的台风生成预测装置具体包括:
数据获取模块60,用于获取历史热带气旋生命周期的卫星云图数据集,对所示卫星云图数据集进行预处理后,将卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;
模型构建模块62,用于分别构建时序预测模型ConvLSTM和VGG分类模型;
模型训练模块64,用于通过训练集对构建的时序预测模型ConvLSTM和所述VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;
台风预测模块66,用于通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。
装置实施例二
本发明实施例提供了一种电子设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行上述方法实施例的步骤。
装置实施例三
本发明实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现如上述方法实施例所述的步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于云系记忆的台风生成预测方法,其特征在于,包括:
S1、获取历史热带气旋生命周期的卫星云图数据集,对所述卫星云图数据集进行预处理后,将所述卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;
S2、分别构建时序预测模型ConvLSTM和VGG分类模型;
S3、通过所述训练集对构建的时序预测模型ConvLSTM和所述VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;
S4、通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:
S11、对获取历史热带气旋生命周期的卫星云图数据集进行数据清洗,清除卫星云图数据坏点,并按照时序对所述卫星云图数据进行排序;
S12、以预设的第一筛选规则构建ConvLSTM模型的数据集R1;
S13、以预设的第二筛选规则构建VGG模型的数据集R2;
S14、将数据集R1和数据集R2划分为训练集、验证集以及测试集;
S15、将所述训练集、验证集以及测试集进行归一化处理。
3.根据权利要求1所述的方法,其特征在于,所述构建时序预测模型ConvLSTM具体包括:
为所述ConvLSTM模型构建4层ConvLSTM循环层,每一层循环层使用尺寸为3x3的卷积核,并在ConvLSTM层后加入批标准化层,设置所有层的神经元选择的激活函数为:
Relu(x)=max(0,x)公式1。
4.根据权利要求1所述的方法,其特征在于,所述构建分类模型VGG具体包括:
所述VGG分类模型包括:13层卷积层、4层全连接层、池化层以及Softmax输出层构成,所有隐层的激活单元都采用函数nn.ReLU();每两层卷积层后铺设池化层。
5.根据权利要求1所述的方法,其特征在于,所述步骤S3具体包括:
S31、将ConvLSTM、VGG模型分别对应数据集R1、R2通过随机打乱,分为训练集(R11、R21),验证集(R12、R22)和测试集(R13、R23),训练集、验证集和测试集的比例设置为8:1:1;
S32、对模型输入训练集(R11、R21),通过构建好的ConvLSTM、VGG模型分别进行训练拟合。
6.根据权利要求5所述的方法,其特征在于,所述步骤S32具体包括:
S321、选择SSIM作为ConvLSTM模型的损失函数,公式如下:
其中μx,μy是代表图像X,Y的均值,c1,c2是稳定函数,σxy为图像X,Y的协方差;
S322、选择交叉熵函数L作为VGG分类模型的损失函数,所述交叉熵函数L形式如下:
其中,yi表示样本i的标签,正类为1,负类为0,pi表示样本i被预测为正类的概率;
S323、选择所述损失函数SSIM作为ConvLSTM模型的评价指标,其中,SSIM的值越接近于1,预测结果越好;
S324、通过多维度方式评价VGG模型,客观方式根据损失函数曲线收敛时,验证损失曲线最小的epoch,取该epoch对应的模型;
S325、对应ConvLSTM模型输入训练集R11,通过构建好的ConvLSTM模型进行训练拟合;
S326、对应VGG模型输入训练集R21,通过构建好的VGG模型进行训练拟合。
7.根据权利要求6所述的方法,其特征在于,所述步骤S4具体包括:
S41、初始化预测次序号nf=1,将测试集R13数据输入训练完成的ConvLSTM模型,进行时序预测台风图像,将第nf卫星云图数据输入后得到预测后台风图像
S42、令nf=nf+1,若nf≤总数Nj,则执行步骤S41,若nf>Nj,则将所有预测图像打乱顺序,打包构建数据集R3;
S43、将数据集R3输入训练好的VGG分类模型,进行图像分类,初始化次序号nz=1,将第nz预测后台风图像输入后,得出分类结果/>
S44、令nz=nz+1,若nz≤总数Nj,则执行步骤S43,若nz>Nj,则得到全部台风是否生成的分类结果
8.一种基于云系记忆的台风生成预测装置,其特征在于,包括:
数据获取模块,用于获取历史热带气旋生命周期的卫星云图数据集,对所示卫星云图数据集进行预处理后,将所述卫星云图数据集按照预设的比例划分为训练集、验证集以及测试集;
模型构建模块,用于分别构建时序预测模型ConvLSTM和VGG分类模型;
模型训练模块,用于通过所述训练集对构建的时序预测模型ConvLSTM和所述VGG模型分别进行训练拟合,获取训练好的时序预测模型ConvLSTM和训练好的VGG分类模型;
台风预测模块,用于通过训练好的ConvLSTM时序预测模型和训练好的VGG分类模型进行组合,进行台风生成预测。
9.一种电子设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器执行如权利要求1-7所述的基于云系记忆的台风生成预测方法的步骤。
10.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现如权利要求1-7所述的基于云系记忆的台风生成预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310472861.9A CN116579468A (zh) | 2023-04-26 | 2023-04-26 | 基于云系记忆的台风生成预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310472861.9A CN116579468A (zh) | 2023-04-26 | 2023-04-26 | 基于云系记忆的台风生成预测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116579468A true CN116579468A (zh) | 2023-08-11 |
Family
ID=87536881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310472861.9A Pending CN116579468A (zh) | 2023-04-26 | 2023-04-26 | 基于云系记忆的台风生成预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116579468A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117036983A (zh) * | 2023-10-08 | 2023-11-10 | 中国海洋大学 | 一种基于物理增强深度学习的台风中心定位方法 |
-
2023
- 2023-04-26 CN CN202310472861.9A patent/CN116579468A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117036983A (zh) * | 2023-10-08 | 2023-11-10 | 中国海洋大学 | 一种基于物理增强深度学习的台风中心定位方法 |
CN117036983B (zh) * | 2023-10-08 | 2024-01-30 | 中国海洋大学 | 一种基于物理增强深度学习的台风中心定位方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11835677B2 (en) | Systems and methods for selecting global climate simulation models for training neural network climate forecasting models | |
US20220146708A1 (en) | Methods and systems for climate forecasting using artificial neural networks | |
CN111291809B (zh) | 一种处理装置、方法及存储介质 | |
CN111898703B (zh) | 多标签视频分类方法、模型训练方法、装置及介质 | |
CN110321805B (zh) | 一种基于时序关系推理的动态表情识别方法 | |
CN114332545B (zh) | 一种基于低比特脉冲神经网络的图像数据分类方法和装置 | |
CN112766283B (zh) | 一种基于多尺度卷积网络的两相流流型识别方法 | |
CN116579468A (zh) | 基于云系记忆的台风生成预测方法、装置、设备及介质 | |
CN112180471A (zh) | 天气预报方法、装置、设备及存储介质 | |
CN113762331A (zh) | 关系型自蒸馏方法、装置和系统及存储介质 | |
CN111783688B (zh) | 一种基于卷积神经网络的遥感图像场景分类方法 | |
CN117611838A (zh) | 一种基于自适应超图卷积网络的多标签图像分类方法 | |
CN116306780B (zh) | 一种动态图链接生成方法 | |
CN116844041A (zh) | 一种基于双向卷积时间自注意力机制的耕地提取方法 | |
CN117197632A (zh) | 一种基于Transformer的电镜花粉图像目标检测方法 | |
CN115830865A (zh) | 基于自适应超图卷积神经网络的车流量预测方法及装置 | |
CN114723998A (zh) | 基于大边界贝叶斯原型学习的小样本图像分类方法及装置 | |
CN114566048A (zh) | 一种基于多视角自适应时空图网络的交通控制方法 | |
Yu et al. | Spatio-temporal ocean wave conditions forecasting using MA-TrajGRU model in the South China sea | |
CN109241070B (zh) | 一种基于大数据的气象数据不一致性的时间维度统一方法 | |
Zhang | Deep learning-based hybrid short-term solar forecast using sky images and meteorological data | |
CN112801058B (zh) | Uml图片的识别方法及系统 | |
CN116662766B (zh) | 基于数据二维重构的风速预测方法及装置、电子设备 | |
CN114154679B (zh) | 一种基于Spark的PCFOA-KELM风功率预测方法及装置 | |
CN117745423B (zh) | 一种异常账户的识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |