CN114724012A - 基于时空跨尺度注意力融合热带不稳定波预警方法及装置 - Google Patents
基于时空跨尺度注意力融合热带不稳定波预警方法及装置 Download PDFInfo
- Publication number
- CN114724012A CN114724012A CN202210651501.0A CN202210651501A CN114724012A CN 114724012 A CN114724012 A CN 114724012A CN 202210651501 A CN202210651501 A CN 202210651501A CN 114724012 A CN114724012 A CN 114724012A
- Authority
- CN
- China
- Prior art keywords
- scale
- tropical
- early warning
- loss
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000004927 fusion Effects 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000007246 mechanism Effects 0.000 claims abstract description 22
- 230000002146 bilateral effect Effects 0.000 claims abstract description 16
- 230000015654 memory Effects 0.000 claims abstract description 12
- 238000005457 optimization Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 25
- 238000010586 diagram Methods 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 15
- 230000001131 transforming effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 15
- 238000004088 simulation Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 102100031184 C-Maf-inducing protein Human genes 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 101000993081 Homo sapiens C-Maf-inducing protein Proteins 0.000 description 1
- 240000002625 Salsola soda Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C13/00—Surveying specially adapted to open water, e.g. sea, lake, river or canal
- G01C13/002—Measuring the movement of open water
- G01C13/004—Measuring the movement of open water vertical movement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Ecology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Atmospheric Sciences (AREA)
- Environmental Sciences (AREA)
- Hydrology & Water Resources (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Emergency Alarm Devices (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于时空跨尺度注意力融合热带不稳定波预警方法及装置,方法包括:将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。装置包括:处理器和存储器。本发明对热带不稳定波的高效预警,减少了自然灾害。
Description
技术领域
本发明涉及热带不稳定波预警领域,尤其涉及一种基于时空跨尺度注意力融合热带不稳定波预警方法及装置。
背景技术
热带不稳定波是太平洋赤道冷舌区最强的中尺度海洋现象,热带不稳定波的运动和发展影响厄尔尼诺/拉尼娜事件(ENSO)等大尺度海气耦合过程,热带不稳定波的高频海流扰动对热带地区的水文、生物化学和大气环境有直接影响,对大洋环流、ENSO循环有反馈作用。海表温度与热带不稳定波密切相关,通过预测海表温度的时空分布能够掌握热带不稳定波的发展演变趋势。我国云南、广东、海南、港澳台等地区地处热带,易受热带不稳定波发展的影响,因此预警与热带不稳定波相关的海表温度时空演变对人类进行海上作业、海上军事活动、航海、渔业、近岸工程等活动至关重要。
传统热带不稳定波的预测方法通常是采用基于物理方程的数值模拟方法对海表温度进行统计分析建模。热带不稳定波会影响海洋动力学、大气-海洋-生物环境相互作用、气候变化等过程,同时这些过程中热量、动量和物质传输也会影响热带不稳定波的发展。为使模型更加准确,基于物理方程的数值模拟方法需要考虑复杂的过程,但实现这种建模十分困难。
近年来,基于深度神经网络的深度学习技术迎来了蓬勃的发展,出现了许多成熟有效的网络结构,例如:卷积神经网络、循环神经网络、生成对抗网络、长短期记忆模型等。神经网络技术主要依靠卷积层、池化层、全连接层、注意力机制等部件设计出完整的网络架构,这种网络架构通过提取数据的特征并利用损失函数计算误差,应用反向传播原理更新模型参数,不断优化网络。这种方法通过在大量数据上重复学习,能够以端到端的方式学习到数据的特征,并基于这种特征加以应用。大量研究成果表明拥有大量数据的情况下,深度学习的建模优于基于统计、数值计算或者专家系统的建模方法。
深度学习模型在海洋学和其他地球科学领域的应用仍处于起步阶段,因此需要根据数据要素构成、预报场景及数据特征针对性地设计深度学习网络,提高对热带不稳定波预测的准确性和及时性,减少热带不稳定波及其次生灾害对海上作业、海上军事活动、航海、渔业、近岸工程等活动的影响。
发明内容
本发明提供了一种基于时空跨尺度注意力融合热带不稳定波预警方法及装置,本发明使用端到端的方法,利用不同尺度的卷积核具有不同的感受野的原理,提取多尺度数据,然后在不同尺度下利用注意力机制关注不同尺度的空间信息,最后利用双边局部注意力机制实现跨尺度空间图融合;提高算法模型对海洋图像不同尺度空间信息的编码能力,进而实现了对热带不稳定波的高效预警,减少了自然灾害,详见下文描述:
第一方面,一种基于时空跨尺度注意力融合热带不稳定波预警方法,所述方法包括:
基于所有时刻、各个位置的海表二维温度图像,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;
将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;
将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;
基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
其中,所述将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算具体为:
构建多尺度特征网络分支,每个分支网络提取空间特征图,每个分支网络CNNk由五层卷积神经网络构成,共包含三层卷积、最大池化操作以及一个多层感知机模块;
三个卷积层均为二维卷积操作,其输出维度分别为1024*1024,512*512和256*256;最大池化的核尺寸为4*4;多层感知机模块由全连接层核ReLU激活函数构成,ReLU函数为ReLU(x)=max(x,0),其中max为最大值函数。
其中,所述将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合具体为:
构建跨尺度注意力机制减少不同尺度特征图之间的冗余信息,其利用softmax层生成注意力Ak,通过散度正则化项增大不同尺度注意力之间的散度,散度正则化项的公式如下:
ldiv(Ak, Al) = 1 - sim(Ak, Al)
其中,Al为注意力特征,ldiv为散度正则化计算结果,sim为相似度计算函数。
进一步地,所述正则化损失为:
利用分支网络提取不同尺度的特征图,按照散度正则化项计算散度损失,利用散度损失优化分支网络,损失函数如下所示:
其中,所述将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合具体为:
将大尺度特征图变换为匹配的尺寸:
其中,P表示间隔为2的最大池化操作,wc是卷积的参数;
对融合特征图进行局部分解操作,将每一时刻的Ft均匀分解成 h*w 个子区域,在子区域中通过平均池化得到最终融合特征图。
其中,所述利用全局特征描述图计算预测损失具体为:
根据通道选择权重变换特征图,获取全局特征图:利用变换后的全局特征图计算预测损失:
其中,m为横坐标下标,n为纵坐标下标,SST为t时刻真实标签值,Gridsoutput为遍历二维输出的坐标。
第二方面、一种基于时空跨尺度注意力融合热带不稳定波预警装置,所述装置包括:
生成多尺度空间数据模块,用于基于所有时刻、各个位置的海表二维温度图像,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;
计算正则化损失模块,用于将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;
优化训练模块,用于将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;
热带不稳定波的预警模块,用于基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
第三方面、一种基于时空跨尺度注意力融合热带不稳定波预警装置,所述装置包括:处理器和存储器,
所述存储器中存储有程序指令,所述处理器调用存储器中存储的程序指令以使装置执行第一方面中的任一项所述的方法步骤。
第四方面、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时使所述处理器执行第一方面中的任一项所述的方法步骤。
本发明提供的技术方案的有益效果是:
1、本发明克服了传统数值模拟或者统计分析方法的复杂建模过程的同时考虑复杂的感受野,从多尺度数据中提取特征;
2、本方法属于端到端的神经网络模型,只需要给出连续时刻的海表温度数据就可以完成模型训练,不需要额外人工处理,实际应用中可以快速部署;
3、本发明对海洋图像不同尺度空间信息编码,实现对热带不稳定波的高效预警,有助于降低热带不稳定波时空演变及其次生灾害对海上作业、海上军事活动、航海、渔业、近岸工程等活动的影响。
附图说明
图1为一种基于时空跨尺度注意力融合热带不稳定波预警方法的流程图;
图2为多尺度海表温度空间数据生成示意图;
图3为多尺度特征提取分支网络结构图;
图4为一种基于时空跨尺度注意力融合热带不稳定波预警装置的结构示意图;
图5为一种基于时空跨尺度注意力融合热带不稳定波预警装置的另一结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
实施例1
一种基于时空跨尺度注意力融合的热带不稳定波预警方法主要分为四部分:多尺度空间数据生成部分、多分支特征图提取部分、跨尺度特征图融合部分、预警部分。
其中,多尺度空间数据生成部分利用不同的感受野,感受野的差异可以提高算法模型对海洋图像不同尺度空间信息的编码能力;多分支特征图提取部分用于提取低信息冗余的特征图,进一步提高模型的跨尺度预测能力;跨尺度特征图融合部分利用双边局部注意力机制实现跨尺度空间图融合;预警部分根据计算出的热带不稳定波数值绘制热带不稳定波的时空图像,根据时空图像对热带不稳定波进行实时的预警。
一种基于时空跨尺度注意力融合的热带不稳定波预警方法,参见图1,该热带不稳定波预警方法包括以下步骤:
101:根据与时刻、坐标相关联的海表温度数据生成海表温度时空数据,该海表温度时空数据为二维图像形式,获取二维时空图像后即可构成海表温度时空数据库;
102:按照步骤101获得所有时刻、各个位置的海表二维温度图像后,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;
103:将步骤102得到的多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;
104:将步骤103中的多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与步骤103正则化损失联合用于神经网络的优化训练;
105:基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
综上所述,本发明实施例通过上述步骤101-步骤105,克服了传统数值模拟或者统计分析方法的复杂建模过程的同时考虑复杂的感受野,从多尺度数据中提取特征,应用端到端的神经网络模型,只需要给出连续时刻的海表温度数据就可以完成模型训练,不需要额外人工处理,实际应用中可以快速部署,提高了海洋表面温度预测的精度和效率,进而实现了对热带不稳定波的预警,减少热带不稳定波及其次生灾害对海上作业、海上军事活动、航海、渔业、近岸工程等活动的影响。
实施例2
下面结合具体的计算公式、实例、图2-图3对实施例1中的方案进行进一步地介绍,详见下文描述:
201:气候与应用前沿研究院ICAR提供的历史气候观测和模拟数据集;
其中,数据包括CMIP5/6模式的历史模拟数据和美国SODA模式重建的近100多年历史观测同化数据。
202:选取海表温度数据时间跨度为2006至2019年共计13年,将这段时间分为2006年1月1日至2009年12月31日和2010年1月1日至2019年3月31日两个不重叠的时间段,两个时间段分别对应训练集数据Dtrain和测试集数据Dtest;
203:在步骤202的两个时间段内均采样东赤道太平洋10°S ~ 10°N和180°W ~120°W的海洋表面温度数据,采样分辨率为9km × 9km,东赤道太平洋10°S ~ 10°N和180°W~ 120°W之间的区域得到232 × 696个温度点,采样区域海表温度的方式是取对应9km ×9km区域海洋表面温度的平均值;
204:将步骤203中的温度点对应经纬坐标生成一张二维图像表示对应时刻海表温度的空间数据图像,按照步骤202的时间顺序排列空间数据图像,得到海表温度的时空序列数据,xt表示t时刻东赤道太平洋10°S ~ 10°N和180°W ~ 120°W地区的海洋表面温度图像数据;
205:分别使用卷积、反卷积网络对海表温度的时空序列数据D进行上、下采样,生成多尺度空间数据;
其中,本发明实施例生成了3个尺度的时空数据,即可以选择卷积核尺寸为:2*2,4*4,8*8,具体实现时,可以根据实际应用中的需要进行尺寸的限定,本发明实施例对此不做限制。
通过上述步骤201到206实现了对多尺度时空数据的构建和划分。
207:构建多尺度特征网络分支,每个分支网络独自提取空间特征图,每个分支网络CNNk由五层卷积神经网络构成,共包含三层卷积(Convolutional, Cov)、最大池化(Maxpooling, MP)操作以及一个多层感知机模块(MLP);
其中,三个卷积层均为二维卷积操作,其输出维度分别为1024*1024,512*512和256*256;进行最大池化操作,其核尺寸为4*4;多层感知机模块由全连接层核ReLU激活函数构成,ReLU函数为ReLU(x)=max(x,0),其中max为最大值函数。
209:构建跨尺度注意力机制模块减少不同尺度特征图之间的冗余信息,其利用softmax层生成注意力Ak,通过散度正则化项增大不同尺度注意力之间的散度,散度正则化项的公式如下:
ldiv(Ak, Al) = 1 - sim(Ak, Al)(2)
其中,Al为注意力特征,ldiv为散度正则化计算结果,sim为相似度计算函数。
210:利用分支网络提取不同尺度的特征图,然后按照步骤209的散度正则化项计算散度损失,利用散度损失优化分支网络模块,损失函数如下所示:
基于步骤207到步骤210实现了低冗余多尺度特征图的特征提取,提高了算法模型对海洋图像不同尺度空间信息的编码能力。
211:根据步骤208的网络提取到海表温度特征图为,表示第k个分支网络提取到的t时刻的特征,首先将不同分支特征图融合为一个特征图,以相邻两种尺度分支融合为例,假设大尺度分支输出特征图大小为,中尺度分支的特征图大小为,R为实数空间,跨尺度融合首先将大尺度特征图变换为匹配的尺寸:
其中,GAP为全局平均池化操作算子,K为尺度数,本发明细节设置为3,Fi为步骤212中的区域中心特征。
随后根据全局特征表示 u 生成通道选择权重:
其中,Wi为算子矩阵,Wj为算子矩阵。
214:根据步骤213的通道选择权重变换特征图,获取全局特征图:
通过步骤211到214实现了从多尺度特征图到全局特征图的变换,全局特征图融合了多尺度的信息,得到更加全面的信息。
215:利用变换后的全局特征图计算预测损失:
其中,m为横坐标下标,n为纵坐标下标,SST为t时刻真实标签值,Gridsoutput为遍历二维输出的坐标。
将步骤210中的正则化损失和步骤215中的预测损失相结合共同优化神经网络,总损失函数如下所示:
216:假设待预测海表温度的时间为T,选择T时刻之前的K个时刻数据输入优化后的神经网络,优化后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,将预测值与历年预警阈值对比,结合图像分析,实现对热带不稳定波的预警。
综上所述,本发明实施例通过上述步骤201-步骤216,运用复杂的感受野,从多尺度数据中提取特征,应用端到端的神经网络模型,只需要给出连续时刻的海表温度数据就可以完成模型训练,不需要额外人工处理,实际应用中可以快速部署,提高了热带不稳定波预测的精度和效率,有助于降低热带不稳定波时空演变及其次生灾害对海上作业、海上军事活动、航海、渔业、近岸工程等活动的影响。
实施例3
下面结合具体的实验,对实施例1和2中的方案进行可行性验证,详见下文描述:
一、数据集:
本实验是气候与应用前沿研究院ICAR提供的历史气候观测和模拟数据集。数据包括CMIP5/6模式的历史模拟数据和美国SODA模式重建的近100多年历史观测同化数据;对于CMIP数据共4645,其中1-2265为CMIP6中15个模式提供的151年的历史模拟数据(总共:151年 *15 个模式=2265);2266-4645为CMIP5中17个模式提供的140年的历史模拟数据(总共:140年 *17 个模式=2380)。对于历史观测同化数据为美国提供的SODA数据。
二、评估标准:
1、MSE:是展示温度预测精度的关键指标,可以直观地显示预测效果。
2、可视化图像:将预测结果转变为二维图像,直观反映预测效果。
三、实验结果:
可以发现,本发明提出的基于时空跨尺度注意力融合的热带不稳定波预测方法选择T时刻之前的K个时刻数据实现热带不稳定波在T时刻的时空分布预测,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,将预测值与历年预警阈值对比,结合图像分析,实现对热带不稳定波的预警。
实施例4
一种基于时空跨尺度注意力融合热带不稳定波预警装置,参见图4,该装置包括:
生成多尺度空间数据模块,用于基于所有时刻、各个位置的海表二维温度图像,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;
计算正则化损失模块,用于将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;
优化训练模块,用于将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;
热带不稳定波的预警模块,用于基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
综上所述,本发明实施例通过上述模块提高了热带不稳定波预测的精度和效率,有助于降低热带不稳定波时空演变及其次生灾害对海上作业、海上军事活动、航海、渔业、近岸工程等活动的影响。
实施例5
一种基于时空跨尺度注意力融合热带不稳定波预警装置,参见图5,该装置包括:处理器和存储器,存储器中存储有程序指令,处理器调用存储器中存储的程序指令以使装置执行实施例1中的以下方法步骤:
基于所有时刻、各个位置的海表二维温度图像,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;
将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;
将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;
基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
其中,将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算具体为:
构建多尺度特征网络分支,每个分支网络提取空间特征图,每个分支网络CNNk由五层卷积神经网络构成,共包含三层卷积、最大池化操作以及一个多层感知机模块;
三个卷积层均为二维卷积操作,其输出维度分别为1024*1024,512*512和256*256;最大池化的核尺寸为4*4;多层感知机模块由全连接层核ReLU激活函数构成,ReLU函数为ReLU(x)=max(x,0),其中max为最大值函数。
进一步地,分支网络为:
其中,将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合具体为:
构建跨尺度注意力机制减少不同尺度特征图之间的冗余信息,其利用softmax层生成注意力Ak,通过散度正则化项增大不同尺度注意力之间的散度,散度正则化项的公式如下:
其中,Al为注意力特征,ldiv为散度正则化计算结果,sim为相似度计算函数。
进一步地,正则化损失为:
利用分支网络提取不同尺度的特征图,按照散度正则化项计算散度损失,利用散度损失优化分支网络,损失函数如下所示:
其中,将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合具体为:
将大尺度特征图变换为匹配的尺寸:
其中,P表示间隔为2的最大池化操作,wc是卷积的参数;
对融合特征图进行局部分解操作,将每一时刻的Ft均匀分解成 h*w 个子区域,在子区域中通过平均池化得到最终融合特征图。
其中,利用全局特征描述图计算预测损失具体为:
根据通道选择权重变换特征图,获取全局特征图:利用变换后的全局特征图计算预测损失:
其中,m为横坐标下标,n为纵坐标下标,SST为t时刻真实标签值,Gridsoutput为遍历二维输出的坐标。
这里需要指出的是,以上实施例中的装置描述是与实施例中的方法描述相对应的,本发明实施例在此不做赘述。
上述的处理器1和存储器2的执行主体可以是计算机、单片机、微控制器等具有计算功能的器件,具体实现时,本发明实施例对执行主体不做限制,根据实际应用中的需要进行选择。
存储器2和处理器1之间通过总线3传输数据信号,本发明实施例对此不做赘述。
基于同一发明构思,本发明实施例还提供了一种计算机可读存储介质,存储介质包括存储的程序,在程序运行时控制存储介质所在的设备执行上述实施例中的方法步骤。
该计算机可读存储介质包括但不限于快闪存储器、硬盘、固态硬盘等。
这里需要指出的是,以上实施例中的可读存储介质描述是与实施例中的方法描述相对应的,本发明实施例在此不做赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。
计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者通过计算机可读存储介质进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质或者半导体介质等。
本发明实施例对各器件的型号除做特殊说明的以外,其他器件的型号不做限制,只要能完成上述功能的器件均可。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于时空跨尺度注意力融合热带不稳定波预警方法,其特征在于,所述方法包括:
基于所有时刻、各个位置的海表二维温度图像,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
2.根据权利要求1所述的一种基于时空跨尺度注意力融合热带不稳定波预警方法,其特征在于,所述将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算具体为:
构建多尺度特征网络分支,每个分支网络提取空间特征图,每个分支网络CNNk由五层卷积神经网络构成,共包含三层卷积、最大池化操作以及一个多层感知机模块;
三个卷积层均为二维卷积操作,其输出维度分别为1024*1024,512*512和256*256;最大池化的核尺寸为4*4;多层感知机模块由全连接层核ReLU激活函数构成,ReLU函数为ReLU(x)=max(x,0),其中max为最大值函数。
7.一种基于时空跨尺度注意力融合热带不稳定波预警装置,其特征在于,所述装置包括:
生成多尺度空间数据模块,用于基于所有时刻、各个位置的海表二维温度图像,利用卷积、反卷积网络对海表温度时空数据进行上、下采样,生成多尺度空间数据;
计算正则化损失模块,用于将多尺度空间数据输入对应的分支网络进行相应尺度下特征图的计算,并计算正则化损失;优化训练模块,用于将多尺度特征图利用双边局部注意力机制实现跨尺度空间图融合,生成全局特征描述图,利用全局特征描述图计算预测损失,并将预测损失与正则化损失联合用于神经网络的优化训练;热带不稳定波的预警模块,用于基于优化训练后的神经网络对时刻T的海表温度进行预测,选择T时刻之前的K个时刻数据输入优化训练后的神经网络,该优化训练后的神经网络的输出为热带不稳定波的预测值,通过将预测值与坐标关联,绘制热带不稳定波的时空图像,实现对热带不稳定波的预警。
8.一种基于时空跨尺度注意力融合热带不稳定波预警装置,其特征在于,所述装置包括:处理器和存储器,所述存储器中存储有程序指令,所述处理器调用存储器中存储的程序指令以使装置执行权利要求1-6中的任一项所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时使所述处理器执行权利要求1-6中的任一项所述的方法步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210651501.0A CN114724012B (zh) | 2022-06-10 | 2022-06-10 | 基于时空跨尺度注意力融合热带不稳定波预警方法及装置 |
US18/133,881 US20230400301A1 (en) | 2022-06-10 | 2023-04-12 | Tropical instability wave early warning method and device based on temporal-spatial cross-scale attention fusion |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210651501.0A CN114724012B (zh) | 2022-06-10 | 2022-06-10 | 基于时空跨尺度注意力融合热带不稳定波预警方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114724012A true CN114724012A (zh) | 2022-07-08 |
CN114724012B CN114724012B (zh) | 2022-08-23 |
Family
ID=82232709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210651501.0A Active CN114724012B (zh) | 2022-06-10 | 2022-06-10 | 基于时空跨尺度注意力融合热带不稳定波预警方法及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230400301A1 (zh) |
CN (1) | CN114724012B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115269948A (zh) * | 2022-09-27 | 2022-11-01 | 北京科技大学 | 支持时空数据智能尺度变换的变尺度数据分析方法及装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117576649B (zh) * | 2023-12-26 | 2024-04-30 | 华东师范大学 | 一种基于分割点和双特征增强的车道线检测方法及系统 |
CN117555049B (zh) * | 2024-01-09 | 2024-03-29 | 成都师范学院 | 基于时空注意力门控融合网络的闪电临近预报方法及装置 |
CN117669838B (zh) * | 2024-01-31 | 2024-05-10 | 江西荧光磁业有限公司 | 钕铁硼磁铁生产的优化控制系统及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112016472A (zh) * | 2020-08-31 | 2020-12-01 | 山东大学 | 基于目标动态信息的驾驶员注意力区域预测方法及系统 |
CN112733749A (zh) * | 2021-01-14 | 2021-04-30 | 青岛科技大学 | 融合注意力机制的实时行人检测方法 |
CN112949673A (zh) * | 2019-12-11 | 2021-06-11 | 四川大学 | 一种基于全局注意力的特征融合目标检测与识别方法 |
CN113360659A (zh) * | 2021-07-19 | 2021-09-07 | 云南大学 | 一种基于半监督学习的跨领域情感分类方法及系统 |
CN113657380A (zh) * | 2021-08-17 | 2021-11-16 | 福州大学 | 融合多模态注意力机制的图像美学质量评价方法 |
CN113673307A (zh) * | 2021-07-05 | 2021-11-19 | 浙江工业大学 | 一种轻量型的视频动作识别方法 |
CN113989343A (zh) * | 2021-10-31 | 2022-01-28 | 南京理工大学 | 基于注意力机制的传感器融合深度重建数据驱动方法 |
CN114255474A (zh) * | 2020-09-25 | 2022-03-29 | 上海舜瞳科技有限公司 | 一种基于多尺度、多粒度行人重识别方法 |
CN114463677A (zh) * | 2022-01-19 | 2022-05-10 | 北京工业大学 | 一种基于全局注意力的安全帽配戴检测方法 |
CN114547298A (zh) * | 2022-02-14 | 2022-05-27 | 大连理工大学 | 基于多头注意力和图卷积网络结合R-Drop机制的生物医学关系抽取方法、装置和介质 |
-
2022
- 2022-06-10 CN CN202210651501.0A patent/CN114724012B/zh active Active
-
2023
- 2023-04-12 US US18/133,881 patent/US20230400301A1/en active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949673A (zh) * | 2019-12-11 | 2021-06-11 | 四川大学 | 一种基于全局注意力的特征融合目标检测与识别方法 |
CN112016472A (zh) * | 2020-08-31 | 2020-12-01 | 山东大学 | 基于目标动态信息的驾驶员注意力区域预测方法及系统 |
CN114255474A (zh) * | 2020-09-25 | 2022-03-29 | 上海舜瞳科技有限公司 | 一种基于多尺度、多粒度行人重识别方法 |
CN112733749A (zh) * | 2021-01-14 | 2021-04-30 | 青岛科技大学 | 融合注意力机制的实时行人检测方法 |
CN113673307A (zh) * | 2021-07-05 | 2021-11-19 | 浙江工业大学 | 一种轻量型的视频动作识别方法 |
CN113360659A (zh) * | 2021-07-19 | 2021-09-07 | 云南大学 | 一种基于半监督学习的跨领域情感分类方法及系统 |
CN113657380A (zh) * | 2021-08-17 | 2021-11-16 | 福州大学 | 融合多模态注意力机制的图像美学质量评价方法 |
CN113989343A (zh) * | 2021-10-31 | 2022-01-28 | 南京理工大学 | 基于注意力机制的传感器融合深度重建数据驱动方法 |
CN114463677A (zh) * | 2022-01-19 | 2022-05-10 | 北京工业大学 | 一种基于全局注意力的安全帽配戴检测方法 |
CN114547298A (zh) * | 2022-02-14 | 2022-05-27 | 大连理工大学 | 基于多头注意力和图卷积网络结合R-Drop机制的生物医学关系抽取方法、装置和介质 |
Non-Patent Citations (2)
Title |
---|
QI HAN: "ON THE CONNECTION BETWEEN LOCAL ATTENTION", 《ARXIV:2106.04263V4》 * |
TAN YU: "BOAT: Bilateral Local Attention Vision Transformer", 《ARXIV:2201.13027V1》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115269948A (zh) * | 2022-09-27 | 2022-11-01 | 北京科技大学 | 支持时空数据智能尺度变换的变尺度数据分析方法及装置 |
CN115269948B (zh) * | 2022-09-27 | 2023-10-13 | 北京科技大学 | 支持时空数据智能尺度变换的变尺度数据分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20230400301A1 (en) | 2023-12-14 |
CN114724012B (zh) | 2022-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114724012B (zh) | 基于时空跨尺度注意力融合热带不稳定波预警方法及装置 | |
Castro et al. | Stconvs2s: Spatiotemporal convolutional sequence to sequence network for weather forecasting | |
Guan et al. | An artificial-neural-network-based, constrained CA model for simulating urban growth | |
CN111507521A (zh) | 台区电力负荷预测方法及预测装置 | |
Shi et al. | Gnn-surrogate: A hierarchical and adaptive graph neural network for parameter space exploration of unstructured-mesh ocean simulations | |
Ye et al. | SPLNet: A sequence-to-one learning network with time-variant structure for regional wind speed prediction | |
CN115660041A (zh) | 海浪高度预测及模型训练方法、电子设备及存储介质 | |
CN115759291B (zh) | 一种基于集成学习的空间非线性回归方法及系统 | |
CN116738983A (zh) | 模型进行金融领域任务处理的词嵌入方法、装置、设备 | |
Lu et al. | PUConv: Upsampling convolutional network for point cloud semantic segmentation | |
Yang et al. | AS-Net: An attention-aware downsampling network for point clouds oriented to classification tasks | |
JP2020091171A (ja) | 気象予測システム、気象予測方法、および気象予測プログラム | |
CN116108735A (zh) | 边界和初始条件未知的流体数据时空高分辨率重建方法 | |
Zhao et al. | MCAGCN: Multi‐component attention graph convolutional neural network for road travel time prediction | |
CN113935458A (zh) | 基于卷积自编码深度学习的空气污染多站点联合预测方法 | |
CN113344146A (zh) | 基于双重注意力机制的图像分类方法、系统及电子设备 | |
Ye et al. | PEPNet: A barotropic primitive equations-based network for wind speed prediction | |
WO2024071377A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Sarkar | Transfer learning approaches for knowledge discovery in grid-based geo-spatiotemporal data | |
Di et al. | Data-Driven Mapping With Prediction Neural Network for the Future Wide-Swath Satellite Altimetry | |
Zhao et al. | Spatio-temporal Model Combining VMD and AM for Wind Speed Prediction | |
Lee et al. | Inducing Point Operator Transformer: A Flexible and Scalable Architecture for Solving PDEs | |
Wang et al. | A Four‐Dimensional Variational Constrained Neural Network‐Based Data Assimilation Method | |
CN116050640B (zh) | 基于自适应多图卷积的多模式交通系统短时客流预测方法 | |
CN112801294B (zh) | 基于图信号处理的用于加速神经网络推理的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 300072 Tianjin City, Nankai District Wei Jin Road No. 92 Patentee after: Tianjin University Patentee after: Qingdao Marine Science and Technology Center Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92 Patentee before: Tianjin University Patentee before: QINGDAO NATIONAL LABORATORY FOR MARINE SCIENCE AND TECHNOLOGY DEVELOPMENT CENTER |