CN116432702A - 一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 - Google Patents
一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 Download PDFInfo
- Publication number
- CN116432702A CN116432702A CN202310678856.3A CN202310678856A CN116432702A CN 116432702 A CN116432702 A CN 116432702A CN 202310678856 A CN202310678856 A CN 202310678856A CN 116432702 A CN116432702 A CN 116432702A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- ecmwf
- representing
- forecast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 52
- 238000013135 deep learning Methods 0.000 title claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 230000007246 mechanism Effects 0.000 claims description 23
- 238000010586 diagram Methods 0.000 claims description 13
- 230000009977 dual effect Effects 0.000 claims description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 230000005855 radiation Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 238000012876 topography Methods 0.000 claims description 6
- 230000007935 neutral effect Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 230000004907 flux Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000002679 ablation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/18—Testing or calibrating meteorological apparatus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/17—Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Environmental Sciences (AREA)
- Mathematical Optimization (AREA)
- Ecology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Atmospheric Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种用于ECMWF预报产品订正的深度学习NFC‑Net网络模型。首先获取待订正区域内的DEM数据、FY‑4A卫星数据、ECMWF格点预报数据和ERA5再分析数据;随后构建预报订正网络NFC‑Net,该网络包括空间分辨率对齐模块、时空特征提取模块和UNet订正模块。空间分辨率对齐模块用于将FY‑4A卫星数据、DEM数据与ECMWF数据进行对齐。时空特征提取模块用于提取ERA5历史再分析数据和FY‑4A卫星数据的时空特征,UNet订正模块用于将上述多源异构数据的时空特征进行学习,输出订正结果。本方法能够融合多源异构数据的特征,对ECMWF预报产品进行有效订正。
Description
技术领域
本发明属于智慧气象技术领域,尤其涉及一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型。
背景技术
数值天气预报是公共气象服务和商业气象服务的核心技术,研发和迭代难度大、牵涉领域广。近年来受益于大气科学理论和计算机软硬件技术的不断进步,数值预报模式的精度和时空分辨率不断提高,并朝着专业化、精细化等方向进一步发展。但由于偏微分方程在描述大气运动和热交换时不可避免的误差,模式只是真实大气的数学物理近似,存在系统误差和随机误差,因此对数值模式预报的结果进行订正就显得尤为重要。
目前这种订正工作是交给各个地方的预报员,预报员根据传统的气象学的方法进行订正,然而传统订正手段主要是针对单个气象要素,忽略了气象要素之间的联系,丢失气象要素之间的特征。近年来,机器学习,深度学习算法在各行各业效果显著,突破了传统算法的壁垒、在空间或时序问题上都有很好的表现,并且精细化的气象要素格点订正也是一种时空特征提取问题,但在此领域中,超精细化预测、多要素之间的多维度特征提取和自动化辅助人工订正等一系列关键技术亟待解决。ECMWF预报产品是天气预报中心提供全世界公认全球数值模式预报最精准的预报结果,格点数据已经被广泛用于世界各地和相关行业,然而在实际使用过程中依然存在一定的误差。现有订正模型在特征提取时很难同时兼顾时间、空间和要素相关性,且现有的数值预报的订正方法对复杂的大气运动陆面过程考虑不充分。预报结果不仅与大型环流背景和中小尺度天气系统有关,还与当地的地形地貌密切相关。如果仅仅考虑地形的海拔高度,会导致数值模式精度偏低。
发明内容
发明目的:本发明的目的在于提供一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,该网络能够充分融合高分辨率的DEM数据和三维空间FY-4A卫星数据特征,提高气象预测精度。
技术方案:本发明的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,建立了用于ECMWF预报产品订正的深度学习NFC-Net网络模型,NFC-Net网络包括三个模块:分别是基于卷积神经网络的空间分辨率对齐模块、基于双自注意力机制的时空特征提取模块和UNet订正模块,通过执行以下步骤,获得符合步骤E架构的深度学习NFC-Net网络模型,并基于该模型,实现对待订正地区的ECMWF预报产品的订正;
步骤A. 基于待订正地区的ECMWF预报产品,获取待订正地区内预设历史范围内各历史时间点的DEM数据、FY-4A卫星数据、ERA5再分析数据和ECMWF格点预报数据,然后进入步骤B;
步骤B. 将待订正地区各历史时间点的FY-4A卫星数据和DEM数据输入基于卷积神经网络的空间分辨率对齐模块,将FY-4A卫星数据和DEM数据的空间分辨率与ECMWF格点预报数据和ERA5再分析数据的空间分辨率对齐,得到空间分辨率对齐后DEM数据和FY-4A卫星数据,然后进入步骤C;
步骤C. 全部历史时间点的分组t-6至t,分别针对各个历史时间分组,将步骤B中经过空间分辨率对齐后的t-6时刻至t-1时刻的FY-4A卫星数据和ERA5历史再分析数据输入到基于双自注意力机制的时空特征提取模块中,提取FY-4A卫星数据和ERA5历史再分析数据的预设各个时空相关性和要素相关性特征,然后进入步骤D;
步骤D. 将步骤B中经过空间分辨率对齐后DEM数据、步骤C中经过时空特征提取模块后的ERA5历史再分析数据特征、FY-4A卫星数据特征和t时刻的ECMWF格点预报数据进行通道融合,融合后的结果输入到UNet订正模块中,输出订正结果,然后进入步骤E;
步骤E. 以t时刻的ECMWF格点预报数据,DEM数据,t-6至t-1时刻ERA5历史再分析数据和FY-4A卫星数据为输入,以t时刻ERA5再分析数据作为标签,搭建模型训练数据集,然后进入步骤F;
步骤F. 根据步骤E搭建的数据集,计算深度学习NFC-Net网络模型损失,优化网络参数,获得符合步骤E架构的模型。
作为本发明的一种优选技术方案:所述步骤A中DEM数据、FY-4A数据和ERA5再分析数据具有如下特征:DEM数据空间分辨率为1 km×1 km,包括海拔高度、坡度、坡面曲率、坡向和流向共5种要素, FY-4A卫星数据空间分辨率为40 km×40km,包括云相态、云检测、云顶温度、高层水汽云导风、低层水汽云导风、大气水汽总量、地表比辐射率、陆表气温、降水估计、地面入射太阳辐射和地表上行长波辐射共11种要素,ERA5再分析数据包括2m露点气温、2m气温、云面积分数、10m经向风分量、10m中性经向风分量、10m纬向风分量、10m中性纬向风分量、后处理10 m阵风、瞬时10 m阵风、相对湿度、绝对湿度、后处理2m最低气温、后处理2m最高气温、平均海平面气压、平均表面潜热通量、平均表面显热通量、表面气温和地面气压共18种要素。
作为本发明的一种优选技术方案:所述步骤B中基于卷积神经网络的空间分辨率对齐模块由Upsampling Network(以下简称UPS-Net)和MultiscaleResidual Network(以下简称MSR-Net)网络实现。
UPS-Net网络实现FY-4A卫星数据空间分辨率对齐。UPS-Net网络采用先插值后卷积的操作。首先将输入的FY-4A卫星数据通过双三次插值放大到目标大小,插值算法利用待采样格点周围16个格点的数据来实现。将插值后的结果输入到三个串联卷积层中。第一个卷积层提取出卫星数据中重叠的特征,卷积核大小9×9;第二个卷积层做非线性映射,卷积核大小1×1;第三个卷积层则将卫星数据映射成11×48×48的特征图,卷积核大小5×5。所述操作公式为:
作为本发明的一种优选技术方案:所述MSR-Net网络实现DEM数据空间分辨率对齐,具体为:首先,将DEM数据并行通过3个不同大小卷积核的卷积层,三个卷积核分别为3×3,5×5,7×7,以提取出高分辨DEM数据的局部多尺度特征;随后,利用卷积核大小为1×1的卷积层对上述三个卷积层输出的结果做非线性映射和通道降维;最后,MSR-Net模块对相加后的结果进行下采样,下采样层由五个复合层组成,每个复合层由BN层,卷积核大小为3×3的卷积层和均值池化层串联构成,DEM数据经过MSR-Net模块后最终被转化为5×48×48的网格数据,所述操作公式为:
作为本发明的一种优选技术方案:所述MSR-Net网络还利用一个卷积核大小为1×1卷积层作残差连接,以提取地形地貌的全局特征,为了最大限度地利用高分辨率DEM数据,将局部多尺度特征与全局特征进行逐元素相加,以解决局部特征或全局特征在传输过程中信息损失问题。
作为本发明的一种优选技术方案:所述步骤C中基于双自注意力机制的时空特征提取模块由嵌入了双自注意力机制DSA的Convlstm网络构成,所述的Convlstm公式为:
其中,tanh分别表示sigmoid和tanh运算;/>和/>代表各种门机制;/>表示输入数据,/>表示先前Convlstm细胞输出的重复状态;/>和/>代表门机制的权重和偏差;/>和/>分别代表Hadamard和Matmul;
作为本发明的一种优选技术方案:所述双自注意力机制DSA模块接受三个输入,即t时刻的输入数据、t-1时刻细胞状态/>和隐藏状态/>,具体为:首先,将t-1时刻Convlstm单元状态的输出/>和/>分别与t时刻的输入/>进行Concat通道拼接,拼接结果分别通过三个不同的1×1的卷积层,使网络在降低通道数的同时提取出t时刻和t-1时刻气象时空特征的三个特征图,三个特征图分别用Q、K和V表示,其中,Q用来匹配其他特征图,K用来被其他单元匹配,V被用来提取信息;随后,通过自注意力公式计算出当前时刻输入数据与前一时刻Convlstm的细胞状态和隐藏状态的自注意力加权得分,从而获得多源数据的要素相关性特征和时空相关性特征,再将上述两个特征分别与细胞状态/>和隐藏状态进行Concat通道拼接;最后,分别通过1×1的卷积层得到更新后的细胞状态和隐藏状态,循环执行上述过程,将t-6至t-1时刻的ERA5实况数据的18种气象要素和FY-4A卫星数据的11种气象要素依次输入DSAConvlstm网络,实现对两种数据的时空特征提取和通道降维,最终得到维度为10×48×48的ERA5气象要素和维度为6×48×48的FY-4A卫星数据时空特征图;所述操作公式为:
其中表示Concat运算,用于数据间的通道融合;/>表示t时刻的气象数据,/>表示t-1时刻气象信息的细胞状态;/>表示t-1时刻气象信息的隐藏状态;W和b表示卷积操作的权重和偏差;/>和/>分别表示Hadamard和Matmul运算。
有益效果:与现有技术相比,本发明具有如下显著优点:
(1)本发明设计了一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,该方法能够充分考虑多源数据间的时空相关性和要素相关性,并利用地形DEM数据优化模式的陆面过程。同时,该方法还融合了卫星数据产品,能够显著改善订正效果。
(2)本发明设计了一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,针对FY-4A卫星数据、DEM数据与ECWMF数据具有不同的空间分辨率,设计了一种空间分辨率对齐算法,该算法由UPS-Net和MSR-Net网络实现,解决了多源数据融合中的维度匹配问题并避免了DEM数据在特征提取中的信息损失。
(3)本发明设计了一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,在时空特征提取方面设计了一种能够更好捕捉多源数据时空相关性和要素相关性的双自注意力机制,并将其嵌入到传统Convlstm网络内部结构中,构建了DSAConvlstm网络。该DSAConvlstm网络可以自适应地提取与待订正数据更加强相关的气象要素特征来改善订正效果。
附图说明
图1是本发明设计一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型流程图;
图2是本发明设计中深度学习NFC-Net网络模型结构图;
图3是本发明设计中FY-4A空间分辨率对齐网络(UPS-Net)结构图;
图4是本发明设计中DEM数据空间分辨率对齐网络(MSR-Net)结构图;
图5是本发明设计中DSA模块网络结构图;
图6是本发明设计中DSAConvlstm网络结构图;
图7是本发明中2021年全年2 m气温均方根误差空间分布;
图8是本发明中2021年全年10 m风速均方根误差空间分布;
图9是本发明中2021年7月24日12时2 m气温订正对比实验图;
图10是本发明中2022年1月18日12时10 m风速订正对比实验图;
图11是本发明中2 m气温时效性和季节性对比实验图;
图12是本发明中10 m风速时效性和季节性对比实验图;
图13是本发明中2 m气温在各季节订正个例图;
图14是本发明中10 m风速在各季节订正个例图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
本发明设计了一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,如图1和图2所示,通过步骤A至步骤F,对ECMWF预报产品进行订正。
步骤A. 获取待订正区域内预设历史范围内各历史时间点的DEM数据、FY-4A卫星数据、ERA5再分析数据和ECMWF格点预报数据,然后进入步骤B;
实际应用中,DEM数据空间分辨率为1 km×1 km,包括海拔高度、坡度、坡面曲率、坡向和流向共5种要素, FY-4A卫星数据空间分辨率为40 km×40km,包括云相态、云检测、云顶温度、高层水汽云导风、低层水汽云导风、大气水汽总量、地表比辐射率、陆表气温、降水估计、地面入射太阳辐射和地表上行长波辐射共11种要素,ERA5再分析数据包括2m露点气温、2m气温、云面积分数、10m经向风分量、10m中性经向风分量、10m纬向风分量、10m中性纬向风分量、后处理10 m阵风、瞬时10 m阵风、相对湿度、绝对湿度、后处理2m最低气温、后处理2m最高气温、平均海平面气压、平均表面潜热通量、平均表面显热通量、表面气温和地面气压共18种要素。
步骤B. 将FY-4A卫星数据和DEM数据输入基于卷积神经网络的空间分辨率对齐模块,将FY-4A卫星数据和DEM数据的空间分辨率与ECMWF格点预报数据和ERA5再分析数据对齐,得到空间分辨率对齐后DEM数据特征和FY-4A卫星数据特征,然后进入步骤C;
所述步骤B中基于卷积神经网络的空间分辨率对齐模块由UPS-Net和MSR-Net网络实现。
UPS-Net网络实现FY-4A卫星数据空间分辨率对齐。UPS-Net网络采用先插值后卷积的操作。首先将输入的FY-4A卫星数据通过双三次插值放大到目标大小,插值算法利用待采样格点周围16个格点的数据来实现。将插值后的结果输入到三个串联卷积层中。第一个卷积层提取出卫星数据中重叠的特征,卷积核大小9×9;第二个卷积层做非线性映射,卷积核大小1×1;第三个卷积层则将卫星数据映射成11×48×48的特征图,卷积核大小5×5。所述操作公式为:
MSR-Net网络实现DEM数据空间分辨率对齐。首先,将DEM数据并行通过3个不同大小卷积核的卷积层,三个卷积核分别为3×3,5×5,7×7,以提取出高分辨DEM数据的局部多尺度特征。随后,利用卷积核大小为1×1的卷积层对上述三个卷积层输出的结果做非线性映射和通道降维。此外,MSR-Net网络还利用一个卷积核大小为1×1卷积层作残差连接,以提取地形地貌的全局特征。为了最大限度地利用高分辨率DEM数据,将局部多尺度特征与全局特征进行逐元素相加,以解决局部特征或全局特征在传输过程中信息损失问题。最后,MSR-Net模块对相加后的结果进行下采样,下采样层由五个复合层组成,每个复合层由BN层(Batch Normalization),卷积核大小为3×3的卷积层和均值池化层串联构成。DEM数据经过MSR-Net模块后最终被转化为5×48×48的网格数据,所述操作公式为:
步骤C. 将步骤B中经过空间分辨率对齐后的t-6时刻至t-1时刻的FY-4A卫星数据特征和ERA5历史再分析数据输入到基于双自注意力机制的时空特征提取模块中,提取FY-4A卫星数据和ERA5历史再分析数据的时空相关性和要素相关性特征,然后进入步骤D;
基于双自注意力机制的时空特征提取模块由嵌入了双自注意力机制(Doubleself-attention mechanism,DSA)的Convlstm网络构成,所述的Convlstm公式为:
其中,tanh分别表示sigmoid和tanh运算;/>和/>代表各种门机制;/>表示输入数据,/>表示先前Convlstm细胞输出的重复状态;/>和/>代表门机制的权重和偏差;/>和/>分别代表Hadamard和Matmul;
所述的DSA模块接受三个输入,即t时刻的输入数据、t-1时刻细胞状态/>和隐藏状态/>,具体为:首先,将t-1时刻Convlstm单元状态的输出/>和/>分别与t时刻的输入/>进行Concat通道拼接,拼接结果分别通过三个不同的1×1的卷积层,使网络在降低通道数的同时提取出t时刻和t-1时刻气象时空特征的三个特征图,三个特征图分别用Q(Query)、K(Key)和V(Value)表示。其中,Q用来匹配其他特征图,K用来被其他单元匹配,V被用来提取信息。随后,通过自注意力公式计算出当前时刻输入数据与前一时刻Convlstm的细胞状态和隐藏状态的自注意力加权得分,从而获得多源数据的要素相关性特征和时空相关性特征,再将上述两个特征分别与细胞状态/>和隐藏状态/>进行Concat通道拼接。最后,分别通过1×1的卷积层得到更新后的细胞状态和隐藏状态。循环执行上述过程,将T-6至T-1时刻的ERA5实况数据的18种气象要素和FY-4A卫星数据的11种气象要素依次输入DSAConvlstm网络,实现对两种数据的时空特征提取和通道降维,最终得到维度为10×48×48的ERA5气象要素和维度为6×48×48的FY-4A卫星数据时空特征图。所述操作公式为:
其中表示Concat运算,用于数据间的通道融合;/>表示t时刻的气象数据,/>表示t-1时刻气象信息的细胞状态;/>表示t-1时刻气象信息的隐藏状态;W和b表示卷积操作的权重和偏差;/>和/>分别表示Hadamard和Matmul运算。
步骤D. 将步骤B中经过空间分辨率对齐后DEM数据特征、步骤C中经过时空特征提取后的ERA5历史再分析数据特征、FY-4A卫星数据特征和t时刻的ECMWF格点预报数据进行通道融合,融合后的结果输入到UNet订正模块中,输出订正结果,然后进入步骤E;
步骤E. 以t时刻的ECMWF格点预报数据,DEM数据,t-6至t-1时刻ERA5历史再分析数据和FY-4A卫星数据为输入,以t时刻ERA5再分析数据作为标签,搭建模型训练数据集,然后进入步骤F;
步骤F. 根据步骤E搭建的数据集,计算深度学习NFC-Net网络模型损失,优化网络参数,得到ECMWF预报产品订正结果。
实施例
本发明所展示的实验结果所依赖的研究区域位于35.125°–47°N和103°–126.875°E之间的矩形区域,大致覆盖西北地区东部、华北地区和大兴安岭西部,山区与高原彼此交错,海拔变化明显。本发明采用2019年2月至2021年1月时间段的数据作为训练集,2021年2月至2022年7月时间段的数据作为测试集,对ECMWF预报产品的2 m气温10 m风速进行订正。
为展示本发明的有益效果并验证双自注意力DSA模块和多源数据融合方案在数值预报产品订正中的正向作用,开展消融实验。在订正网络中逐次加入DSA模块(DSA方案)、DEM数据(DSA- DEM方案)和FY-4A卫星数据(DSA-DEM-FY方案)开展订正实验,并比较了在2021年全年的均方根误差(RMSE)和相关系数(CC)两个评价指标的变化情况,结果如表1所示。
表1 消融实验结果
此外,为了验证DEM数据和FY-4A卫星数据对ECMWF预报产品订正的影响,将实验区域分为东西两个半区进行分析。其中西部半区地形较为复杂,东部半区较为简单。2 m气温和10 m风速在两个半区订正效果如图7和图8所示。分别评估了加入DEM数据后东西两个半区的订正效果,结果表明,DSA-DEM方案在西部半区的RMSE降低了31.17%,CC提升了0.04,而相同方案在东部半区的RMSE仅降低了13.57%,CC仅提升0.01。详细结果见表2。
表2 2 m气温和10 m风速订正结果对比
将NFC-Net模型的订正结果与ECWMF预报结果、ANO动力模式订正结果、经典Convlstm网络订正结果和Fuse-CUnet网络订正结果进行对比,以验证NFC-Net模型的先进性。图9和图10展示了2 m气温和10 m风速的订正对比实验结果。
为验证NFC-Net模型的泛化能力和应用时效,在不同季节和不同时间尺度下开展了订正实验。图11中的(a)、(b)和图12中的(a)、(b)展示了2 m气温和10 m风速的时效性和季节性对比实验结果,图13和图14展示了2 m气温和10 m风速在各季节中的订正结果。
Claims (8)
1.一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,建立了用于ECMWF预报产品订正的深度学习NFC-Net网络模型,NFC-Net网络包括三个模块:分别是基于卷积神经网络的空间分辨率对齐模块、基于双自注意力机制的时空特征提取模块和UNet订正模块,通过执行以下步骤,获得符合步骤E架构的深度学习NFC-Net网络模型,并基于该模型,实现对待订正地区的ECMWF预报产品的订正;
步骤A. 基于待订正地区的ECMWF预报产品,获取待订正地区内预设历史范围内各历史时间点的DEM数据、FY-4A卫星数据、ERA5再分析数据和ECMWF格点预报数据,然后进入步骤B;
步骤B. 将待订正地区各历史时间点的FY-4A卫星数据和DEM数据输入基于卷积神经网络的空间分辨率对齐模块,将FY-4A卫星数据和DEM数据的空间分辨率与ECMWF格点预报数据和ERA5再分析数据的空间分辨率对齐,得到空间分辨率对齐后DEM数据和FY-4A卫星数据,然后进入步骤C;
步骤C. 全部历史时间点的分组t-6至t,分别针对各个历史时间分组,将步骤B中经过空间分辨率对齐后的t-6时刻至t-1时刻的FY-4A卫星数据和ERA5历史再分析数据输入到基于双自注意力机制的时空特征提取模块中,提取FY-4A卫星数据和ERA5历史再分析数据的预设各个时空相关性和要素相关性特征,然后进入步骤D;
步骤D. 将步骤B中经过空间分辨率对齐后DEM数据、步骤C中经过时空特征提取模块后的ERA5历史再分析数据特征、FY-4A卫星数据特征和t时刻的ECMWF格点预报数据进行通道融合,融合后的结果输入到UNet订正模块中,输出订正结果,然后进入步骤E;
步骤E. 以t时刻的ECMWF格点预报数据,DEM数据,t-6至t-1时刻ERA5历史再分析数据和FY-4A卫星数据为输入,以t时刻ERA5再分析数据作为标签,搭建模型训练数据集,然后进入步骤F;
步骤F. 根据步骤E搭建的数据集,计算深度学习NFC-Net网络模型损失,优化网络参数,获得符合步骤E架构的模型。
2.根据权利要求1所述的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,所述步骤A中DEM数据、FY-4A数据和ERA5再分析数据具有如下特征:DEM数据空间分辨率为1 km×1 km,包括海拔高度、坡度、坡面曲率、坡向和流向共5种要素, FY-4A卫星数据空间分辨率为40 km×40km,包括云相态、云检测、云顶温度、高层水汽云导风、低层水汽云导风、大气水汽总量、地表比辐射率、陆表气温、降水估计、地面入射太阳辐射和地表上行长波辐射共11种要素,ERA5再分析数据包括2m露点气温、2m气温、云面积分数、10m经向风分量、10m中性经向风分量、10m纬向风分量、10m中性纬向风分量、后处理10 m阵风、瞬时10 m阵风、相对湿度、绝对湿度、后处理2m最低气温、后处理2m最高气温、平均海平面气压、平均表面潜热通量、平均表面显热通量、表面气温和地面气压共18种要素。
3.根据权利要求1所述的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,所述步骤B中基于卷积神经网络的空间分辨率对齐模块由UpsamplingNetwork和Multiscale Residual Network网络实现,以下分别称为UPS-Net和MSR-Net;UPS-Net网络实现FY-4A卫星数据空间分辨率对齐,MSR-Net网络实现DEM数据空间分辨率对齐。
4.根据权利要求3所述的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,所述UPS-Net网络实现FY-4A卫星数据空间分辨率对齐,具体为:UPS-Net网络采用先插值后卷积的操作,首先将输入的FY-4A卫星数据通过双三次插值放大到目标大小,插值算法利用待采样格点周围16个格点的数据来实现,将插值后的结果输入到三个串联卷积层中,第一个卷积层提取出卫星数据中重叠的特征,卷积核大小9×9;第二个卷积层做非线性映射,卷积核大小1×1;第三个卷积层则将卫星数据映射成11×48×48的特征图,卷积核大小5×5,所述操作公式为:
5.根据权利要求3所述的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,所述MSR-Net网络实现DEM数据空间分辨率对齐,具体为:首先,将DEM数据并行通过3个不同大小卷积核的卷积层,三个卷积核分别为3×3,5×5,7×7,以提取出高分辨DEM数据的局部多尺度特征;随后,利用卷积核大小为1×1的卷积层对上述三个卷积层输出的结果做非线性映射和通道降维;最后,MSR-Net模块对相加后的结果进行下采样,下采样层由五个复合层组成,每个复合层由BN层,卷积核大小为3×3的卷积层和均值池化层串联构成,DEM数据经过MSR-Net模块后最终被转化为5×48×48的网格数据,所述操作公式为:
6.根据权利要求5所述的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,所述MSR-Net网络还利用一个卷积核大小为1×1卷积层作残差连接,以提取地形地貌的全局特征,为了最大限度地利用高分辨率DEM数据,将局部多尺度特征与全局特征进行逐元素相加,以解决局部特征或全局特征在传输过程中信息损失问题。
8.根据权利要求7所述的一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型,其特征在于,所述双自注意力机制DSA模块接受三个输入,即t时刻的输入数据、t-1时刻细胞状态/>和隐藏状态/>,具体为:首先,将t-1时刻Convlstm单元状态的输出/>和分别与t时刻的输入/>进行Concat通道拼接,拼接结果分别通过三个不同的1×1的卷积层,使网络在降低通道数的同时提取出t时刻和t-1时刻气象时空特征的三个特征图,三个特征图分别用Q、K和V表示,其中,Q用来匹配其他特征图,K用来被其他单元匹配,V被用来提取信息;随后,通过自注意力公式计算出当前时刻输入数据与前一时刻Convlstm的细胞状态和隐藏状态的自注意力加权得分,从而获得多源数据的要素相关性特征和时空相关性特征,再将上述两个特征分别与细胞状态/>和隐藏状态/>进行Concat通道拼接;最后,分别通过1×1的卷积层得到更新后的细胞状态和隐藏状态,循环执行上述过程,将t-6至t-1时刻的ERA5实况数据的18种气象要素和FY-4A卫星数据的11种气象要素依次输入DSAConvlstm网络,实现对两种数据的时空特征提取和通道降维,最终得到维度为10×48×48的ERA5气象要素和维度为6×48×48的FY-4A卫星数据时空特征图;所述操作公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310678856.3A CN116432702B (zh) | 2023-06-09 | 2023-06-09 | 一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310678856.3A CN116432702B (zh) | 2023-06-09 | 2023-06-09 | 一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116432702A true CN116432702A (zh) | 2023-07-14 |
CN116432702B CN116432702B (zh) | 2023-08-29 |
Family
ID=87083565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310678856.3A Active CN116432702B (zh) | 2023-06-09 | 2023-06-09 | 一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116432702B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116953653A (zh) * | 2023-09-19 | 2023-10-27 | 成都远望科技有限责任公司 | 一种基于多波段天气雷达组网回波外推方法 |
CN117172134A (zh) * | 2023-10-19 | 2023-12-05 | 武汉大学 | 基于融合地形特征的月表多尺度dem建模方法及系统 |
CN117434624A (zh) * | 2023-09-28 | 2024-01-23 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于语义分割的强对流天气识别和发展预判方法 |
CN118050729A (zh) * | 2024-04-15 | 2024-05-17 | 南京信息工程大学 | 一种基于改进U-Net的雷达回波时间降尺度订正方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113807432A (zh) * | 2021-09-16 | 2021-12-17 | 成都卡普数据服务有限责任公司 | 一种基于深度学习的气温预报数据订正方法 |
CN114611608A (zh) * | 2022-03-14 | 2022-06-10 | 中国人民解放军国防科技大学 | 基于深度学习模型的海表面高度数值预报偏差订正方法 |
CN114742179A (zh) * | 2022-06-13 | 2022-07-12 | 南京信息工程大学 | 基于ecmwf的格点预报偏差修正方法 |
-
2023
- 2023-06-09 CN CN202310678856.3A patent/CN116432702B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113807432A (zh) * | 2021-09-16 | 2021-12-17 | 成都卡普数据服务有限责任公司 | 一种基于深度学习的气温预报数据订正方法 |
CN114611608A (zh) * | 2022-03-14 | 2022-06-10 | 中国人民解放军国防科技大学 | 基于深度学习模型的海表面高度数值预报偏差订正方法 |
CN114742179A (zh) * | 2022-06-13 | 2022-07-12 | 南京信息工程大学 | 基于ecmwf的格点预报偏差修正方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116953653A (zh) * | 2023-09-19 | 2023-10-27 | 成都远望科技有限责任公司 | 一种基于多波段天气雷达组网回波外推方法 |
CN116953653B (zh) * | 2023-09-19 | 2023-12-26 | 成都远望科技有限责任公司 | 一种基于多波段天气雷达组网回波外推方法 |
CN117434624A (zh) * | 2023-09-28 | 2024-01-23 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于语义分割的强对流天气识别和发展预判方法 |
CN117434624B (zh) * | 2023-09-28 | 2024-04-16 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于语义分割的强对流天气识别和发展预判方法 |
CN117172134A (zh) * | 2023-10-19 | 2023-12-05 | 武汉大学 | 基于融合地形特征的月表多尺度dem建模方法及系统 |
CN117172134B (zh) * | 2023-10-19 | 2024-01-16 | 武汉大学 | 基于融合地形特征的月表多尺度dem建模方法 |
CN118050729A (zh) * | 2024-04-15 | 2024-05-17 | 南京信息工程大学 | 一种基于改进U-Net的雷达回波时间降尺度订正方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116432702B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116432702B (zh) | 一种用于ECMWF预报产品订正的深度学习NFC-Net网络模型 | |
Zhou et al. | A review on global solar radiation prediction with machine learning models in a comprehensive perspective | |
Heo et al. | Multi-channel convolutional neural network for integration of meteorological and geographical features in solar power forecasting | |
CN114742179B (zh) | 基于ecmwf的格点预报偏差修正方法 | |
Heo et al. | Digital elevation model-based convolutional neural network modeling for searching of high solar energy regions | |
CN109657839A (zh) | 一种基于深度卷积神经网络的风电功率预测方法 | |
Li et al. | Actual evapotranspiration estimation over the Tuojiang River Basin based on a hybrid CNN-RF model | |
CN111178304A (zh) | 基于全卷积神经网络的高分辨率遥感影像像素级解译方法 | |
CN111814398A (zh) | 一种基于图的融合时空注意力的地表太阳辐射度预测方法 | |
Hatanaka et al. | Diffusion models for high-resolution solar forecasts | |
Li et al. | Short-term Forecasting Approach Based on bidirectional long short-term memory and convolutional neural network for Regional Photovoltaic Power Plants | |
Chen et al. | Dynamic multiscale fusion generative adversarial network for radar image extrapolation | |
Zheng et al. | Weather image-based short-term dense wind speed forecast with a ConvLSTM-LSTM deep learning model | |
CN117233870B (zh) | 一种基于多气象要素的短临降水集合预报及降尺度方法 | |
CN114330641A (zh) | 基于复杂地形的深度学习的短期风速订正模型的建立方法 | |
Zhang et al. | A deep learning method for real-time bias correction of wind field forecasts in the Western North Pacific | |
CN116722544B (zh) | 分布式光伏短期预测方法、装置、电子设备及存储介质 | |
CN114463616B (zh) | 一种基于Stacking与EMOS-CSG的多源卫星降水融合方法 | |
CN114970222B (zh) | 基于hasm的区域气候模式日平均气温偏差订正方法和系统 | |
CN111582547A (zh) | 一种利用风场数据集获取不同地方时风场分布的方法 | |
TW202107306A (zh) | 以人工智慧估測地理位置日照量之系統、方法及儲存媒體 | |
CN114819264A (zh) | 一种基于时空依赖的光伏电站辐照度超短期预测方法及存储介质 | |
Li et al. | Recognition algorithm for deep convective clouds based on FY4A | |
Ning et al. | Precipitation scale effect of the TRMM satellite in Tianshan, China | |
Wan et al. | Turbine location wind speed forecast using convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |