CN116484995A

CN116484995A - 一种快速预报区域大气气溶胶浓度的方法及系统

Info

Publication number: CN116484995A
Application number: CN202211138529.0A
Authority: CN
Inventors: 冯琎
Original assignee: Beijing Institute Of Urban Meteorology
Current assignee: Beijing Institute Of Urban Meteorology
Priority date: 2022-09-19
Filing date: 2022-09-19
Publication date: 2023-07-25
Anticipated expiration: 2042-09-19
Also published as: CN116484995B

Abstract

本发明提供一种快速预报区域大气气溶胶浓度的方法及系统，该系统通过获取待预报区域中的多种气象以及非气象数据，将现有的深度学习的卷积和解码‑编码网络技术和大气气溶胶的局地、短距离输送和长距离输送物理过程相结合，将过去多个时段的网格化区域气溶胶观测、过去多个时段的网格化区域气象数据放在解码网络中，将未来待预测时段的网格化区域气象预报数据放在编码网络中，使得上述数据相互融合，进而获取未来待预测时刻的大气气溶胶浓度。该方案目的在于解决现有大气化学传输模式预测方法中存在的气溶胶浓度预报准确度不佳的问题，同时可以更快提供预测结果。

Description

一种快速预报区域大气气溶胶浓度的方法及系统

技术领域

本发明涉及大气预报技术领域，尤其涉及一种快速预报区域大气气溶胶浓度的方法及系统。

背景技术

大气气溶胶是悬浮于大气中的固体颗粒物的统称。其中的细粒子气溶胶称之为PM2.5。工业化以来，气溶胶的浓度水平及人类活动气溶胶的占比呈现明显上升趋势。气溶胶浓度的增加可造成空气污染，严重地影响人类的身体健康，增加了呼吸系统疾病的发病率和死亡率。气溶胶浓度预报是空气质量预报最重要的组成部分，准确的气溶胶浓度预报可以为环境治理、出行、城市管理和人体健康管理提供参考，是满足社会需求的重要研究和应用方向。

当前的区域气溶胶浓度预报主要基于大气化学传输模型(CTM)。大气化学传输模型在需要给定排放清单，在此基础上详细模拟气溶胶相关物理化学过程，包括生成、扩散、运输和沉积，从而模拟出气溶胶浓度。基于CTM的模拟不仅提供了气溶胶浓度的估计，而且还提供了物理化学过程的信息，可以方便地分析气溶胶污染的机制。然而，大气化学传输模型中的参数化和排放清单具有极大不确定性，这导致了气溶胶浓度的显著模拟预报误差。以最常用的天气预报和研究-化学模型(WRF-Chem)为例，Sicard等报告说，根据2015年的高分辨率模拟，中国每日表面PM2.5(直径小于2.5微米的颗粒物)浓度的模拟和观测之间的皮尔逊相关系数为0.44(相当于决定系数(R2)约为0.2)。此外，CTM包括许多粒子和气体示踪剂的复杂计算，导致巨量的计算资源需求和计算速度极慢。大气化学传输模型的计算资源消耗是同样空间分辨率的数值天气预报模型的3-5倍。这也导致其难以应用到没有计算资源的部门。

因此需要提供一种运算速度快，计算资源需求低的快速预报方法。

发明内容

本发明的目的在于提供一种快速预报区域大气气溶胶浓度的方法及系统，从而解决现有技术中存在的前述问题。

为了实现上述目的，本发明采用的技术方案如下：

一种快速预报区域大气气溶胶浓度的方法，包括以下步骤：

S1，生成编码时段的特征变量数据集，包括格点气象数据、格点准静态数据和格点气溶胶观测数据；

S2，生成解码时段的特征变量数据集，包括格点气象预报数据和格点准静态数据；

S3，构建数据编码神经网络以及数据解码神经网络，基于所述数据编码神经网络和数据解码神经网络，建立待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型；

S4，将步骤S1获得的编码阶段的特征变量数据集和S2中获得的解码时段的特征变量数据集分别分为训练集和测试集，采用训练集训练步骤S3中的待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型，采用测试集测试后得到最终的预报模型；

S5,采用最终的预报模型对待预报区域未来某时刻发大气气溶胶浓度进行预测。

优选的，步骤S1前还包括划分格点：将待预报区域划分为N_Y×N_X个格点，其中N_Y和N_X分别代表南北和东西方向的格点数量。格点可以为经纬度格点，也可以为地图投影的距离格点，取决于所使用的气象数据。

优选的，步骤S1中具体包括：

S11，收集待预报范围内编码时段格点基本气象数据和非气象变量数据，所述编码时段以起报时刻为分界，起报时刻及其之前已经发生的时段为编码时段，共L_enc个时刻，所述编码时段格点基本气象数据来自于数值天气预报输出数据，包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度；所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据；

S12，计算编码时段的衍生气象数据，所述衍生气象数据包括但不限于地面24小时变压、850hPa的24小时变压和变温；

S13，制作编码时段格点气溶胶浓度观测：将L_enc个时刻的气溶胶浓度观测插值到步骤S11所述的对应格点中，对每一个时刻t，采集的气溶胶浓度观测为上一个时刻的浓度观测；

S14,制作编码时段局地特征张量数据集：将步骤S11中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据，步骤S12中得到的全部衍生气象变量以及步骤S13中的全部气溶胶浓度观测打包，合并为一个N_VL×N_Y×N_X的张量,记作其中N_VL代表编码时段局地特征变量的数量；

S15，生成编码时段非局地特征张量数据集：将步骤S11中的850hPa和10米高度处的东西风、南北风，以及地面高程合并为一个N_VN×N_Y×N_X的张量，记作其中N_VN代表编码时段非局地特征变量的数量。

更优选的，步骤S13中的插值方法采用距离反向权重、双线性、克里金插值法等方式之一。

优选的，步骤S2具体包括：

S21，收集待预报范围内解码时段格点基本气象数据和非气象变量数据，所述解码时段以起报时刻为分界，起报时刻之后的时段为解码时段，共L_dec个时刻，所述解码时段格点基本气象数据来自于数值天气预报输出数据，包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度；所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据；通常的观测高度为2米高度。

S22，计算解码时段的衍生气象数据，所述衍生气象数据包括但不限于地面24小时变压、850hPa的24小时变压和变温；

S23，制作解码时段格点气溶胶浓度二维观测真值：将L_dec个时刻的气溶胶浓度观测插值到步骤S11所述的对应格点中，对每一个时刻t，采集的气溶胶浓度观测为上一个时刻的浓度观测，采集的气溶胶浓度观测为O_t；

S24,制作解码时段局地特征张量数据集：将步骤S21中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据，步骤S22中得到的全部衍生气象变量以及步骤S23中的全部气溶胶浓度观测打包，合并为一个M_VL×N_Y×N_X的张量其中M_VL代表编码时段局地特征变量的数量；

S25，生成解码时段非局地特征张量数据集：将步骤S11中的850hPa和10米高度处的东西风、南北风，以及地面高程合并为一个M_VN×N_Y×N_X的张量其中M_VN代表编码时段非局地特征变量的数量；

S26，制作起报时刻气溶胶浓度二维观测O_start：将起报时刻的气溶胶浓度观测插值到S11所示相同的格点中，得到O_start。

优选的，步骤S3具体包括：

S31，构建编码网络：所述编码网络的基本结构采用PredRNN，每一层均为卷积长短期记忆网络convLSTM，连接时间和空间；在空间上，每一层向上层网络输出卷积后的新张量，包括局地卷积层、短距离扩散层以及长距离输送层，具体包括：

S311，局地层：输入变量为S14得到的编码时段局地特征张量放入卷积核大小为1×1的convLSTM层中计算，输出张量表示为T_enc0,其通道数量16；单个时间步上的局地卷积层映射可以表示为

S312，短距离扩散层：首先将输入变量为S311中的输出张量T_enc0和S15中得到的非局地特征张量合并得到一个新的张量T_enc1，即：

其中代表通道合并，再将张量T_enc1放入一个convLSTM层中计算，卷积核为3×3，得到输出通道数量为16的新张量T_enc2，单个时间步上的短距离扩散卷积层的映射过程可以表示为：

T_enc1→T_enc2

S313，长距离输送层：将S312中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算，输出通道数量为16，单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为：

T_enc2→T_enc3

S314,与S321-S323同步，在时间上，t时刻第l层将生成的隐藏传递状态张量C_t,l和H_t,l传递给下一时间步，记忆张量M_t则负责上一时间步最后一层和下一时间步第一层之间的信息交换，初始C_t＝0,l、H_t＝0,l和M_t＝0张量均赋初始值为0；经过L_enc个时刻之后，C_t＝0,l、H_t＝0,l和M_t＝0被映射为起报时刻的C_t＝24,l，H_t＝24,l和M_t＝24，即：

C_t＝0,l→C_t＝24,l

H_t＝0,l→H_t＝24,l

M_t＝0→M_t＝24

S32，构建解码网络，所述解码网络包括局地层、短距离扩散层和长距离输送层：

S321，局地层：输入变量为S25得到的编码时段局地特征张量在第1时刻，将/>与S26获取的起报时刻上的气溶胶浓度场O_start进行张量通道合并，即

在其他时刻，将与S324在上一个时间步预报的气溶胶浓度P_t进行张量通道合并，即

将放入卷积核大小为1×1的convLSTM层中计算，输出张量表示为T_dec0，其通道数量为16。单个时间步上的局地卷积层映射可以表示为

S322，短距离扩散层。首先将输入变量为S321中的输出张量T_dec0和S25中得到的非局地特征张量合并得到一个新的张量T_dec1，即：

其中代表通道合并，再将张量T_dec1放入一个convLSTM层中计算，卷积核为3×3，得到输出通道数量为16的新张量T_dec2，单个时间步上的短距离扩散卷积层的映射过程可以表示为：

T_dec1→T_dec2

S323，长距离输送层：将S322中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算，输出通道数量为16，单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为：

T_dec2→T_dec3

S324，通道合并：将S323第t步输出的T_dec3的16通道张量相加为单通道张量P_t，公式为：

每一时间步所生成的P就是24个时间步上预报的二维气溶胶浓度场。

S325，与S321-S324同步，在时间上，在第一个预报时刻的第l层将S314生成的张量C_t＝24,l，H_t＝24,l和M_t＝24传递进来作为解码阶段C、H和M的初始值，送入对应的局地层、短距离输送层和长距离输送层；

S326，循环步骤S321-S325最终得到所有时间步上的P_t，也就是解码时间内所有时刻的二维气溶胶浓度预报场。

优选的，步骤S4中的模型训练具体包括：

对S3中构建的模型开展训练，训练目标为S23中得到的气溶胶浓度二维观测真值O_t，以S326中计算的二维气溶胶浓度预报场P_t和O_t的均方误差为代价函数L，b个训练样本上的代价函数公式为：

训练最终得到最终预报模型使得代价函数L最小。

本发明的另一个目的在于提供了一种快速预报区域大气气溶胶浓度的系统，包括数据生成模块，模型训练模块以及预报模块，

所述数据生成模块通过收集编码时段的基本气象数据、非气象变量数据以及计算衍生气象数据，制作编码时段格点气溶胶浓度观测，生成编码时段局地特征张量数据集和非局地特征张量数据集作为训练集；

所述模型训练模块包括解码时段数据集生成子模块，模型构建子模块以及训练模型子模块，所述解码时段数据集生成子模块用于通过收集解码时段的基本气象数据、非气象变量数据以及计算衍生气象数据，制作解码时段格点气溶胶浓度观测，生成解码时段局地特征张量数据集和非局地特征张量数据集；

所述模型构建子模块构建待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型，所述训练模型子模块采用数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集对待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型进行训练，得到最优的大气气溶胶浓度预测的时空编码-解码神经网络模型；

所述预报模块采用最优的大气气溶胶浓度预测的时空编码-解码神经网络模型，以数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集作为变量输入，输出大气气溶胶浓度的预报结果。

本发明的有益效果是：

本发明提供一种快速预报区域大气气溶胶浓度的方法及系统，该系统通过获取待预报区域中的多种气象以及非气象数据，将现有的深度学习的卷积和解码-编码网络技术和大气气溶胶的局地、短距离输送和长距离输送物理过程相结合，将过去多个时段的网格化区域气溶胶观测、过去多个时段的网格化区域气象数据放在解码网络中，将未来待预测时段的网格化区域气象预报数据放在编码网络中，使得上述数据相互融合，进而获取未来待预测时刻的大气气溶胶浓度。该方案目的在于提供二维区域(而非单点)的气溶胶浓度预测，解决现有大气化学传输模式预测方法中存在的气溶胶浓度预报准确度不佳的问题，同时可以更快提供预测结果。

附图说明

图1是实施例1中提供的快速预报区域大气气溶胶浓度的方法流程示意图；

图2是实施例1中提供的编码网络结构示意图；

图3是实施例1中提供的解码网络结构示意图；

图4是实施例1中的观测(左上图)和预报(右上图)的气溶胶浓度(单位：微克每立方米)、观测和模拟的均方根误差(左下图，单位：微克每立方米)和决定系数(右下图)；

图5是实施例1中预测的京津冀区域12城市气溶胶浓度和WRF-Chem模式预测的气溶胶浓度预测的对比示意图，自上而下分别为和观测的决定系数(越大越好)、均方根误差(越小越好)和平均偏差(约接近0越好)，三个色柱分别代表本方案0-24小时预报平均，本方案48-72小时预报平均和WRF-Chem的0-24小时预报平均。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不用于限定本发明。

实施例1

本实施例提供了一种快速预报区域大气气溶胶浓度的方法，如图1所示，包括以下步骤：

S5，采用最终的预报模型对待预报区域未来某时刻发大气气溶胶浓度进行预测。

本实施例以京津冀区域为待预报区域，采用WRF地图投影格点划分格点，格点分辨率为9km，格点数量为80x80，即南北和东西方向的格点数量分别为80个。

训练时段为2020年一整年，具体实施过程如下：

S1，编码数据收集：

S11，收集编码时段格点基本气象数据。起报时段为每日0000UTC，编码时段为之前的3天，每3小时采样一次，共24个时刻。基本气象数据为天气预报和研究模式(WRF)的历史预报数据(每日0000UTC启动一次，每次运行24小时)。收集的变量包括11个：2米高度处的温度、2米高度处的相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、风速、风向角、850hPa的东西风和南北风。

S12，计算编码时段的衍生气象数据。共3个，包括地面24小时变压、850hPa的24小时变压和变温。

S13，收集6个格点非气象变量数据，包括地面高程、土地利用类型、气溶胶的排放清单数据。排放清单数据包括SO₂、NO_x、颗粒物和VOC。非气象变量数据包括24个时刻，格点和S11中的格点一致。

S14，制作编码时段格点气溶胶浓度观测。将24个时刻的气溶胶浓度观测使用距离反向权重插值法插值到S11所示相同的格点中。对每一个时刻t，采集的气溶胶浓度观测为上一个时刻(t-1时刻)的浓度观测。

S15，打包S11-S14中的部分变量为编码时段局地特征张量数据集。这些变量包括：S11得到的除850hPa风之外的9个基本气象变量；S12得到的3个衍生气象变量；S13得到的6个非气象变量；S14得到的气溶胶浓度观测。这些变量被合并为一个19×80×80的张量,记作

S16，生成编码时段非局地特征张量数据集。这些变量包括：S11得到的850hPa和10米高度处的东西风、南北风；步骤S13得到的地面高程。这些变量被合并为一个5×80×80的张量，记作

S2，收集解码数据：

S21，同S11，但针对起报时刻之后的解码时段开展数据收集，为3天每3小时预报一次，共24个时刻。解码时段是未来的预报时段，基本气象数据来自于数值天气预报输出数据。

S22，同S12，但计算解码时段的衍生气象变量。

S23，同S13，但收集解码时段非气象变量数据。

S24，制作编码时段格点气溶胶浓度二维观测真值。将24个时刻的气溶胶浓度观测使用距离反向权重法插值到S11所示相同的格点中。对每一个时刻t，采集的气溶胶浓度观测为O_t。

S25，打包S21-S23中的部分变量为编码时段局地特征变量数据集。这些变量包括：S21得到的除850hPa风之外的9个基本气象变量；S22得到的3个衍生气象变量；S23得到的6个非气象变量。这些变量被合并为一个18×80×80的张量

S26，生成解码时段非局地特征变量数据集。变量和S16选择变量一致。被合并为一个5×80×80的张量

S27，制作起报时刻气溶胶浓度二维观测O_start。将起报时刻的气溶胶浓度观测使用距离反向权重、双线性、克里金插值法等方式之一插值到S11所示相同的格点中，得到O_start。

S3，神经网络模型构建：

S31，构建数据编码神经网络，如图2所示，基本结构采用PredRNN。每一层均为卷积长短期记忆网络convLSTM连接时间和空间。在空间上，每一层向上层网络输出卷积后的新张量，各层分别描述为(S311-S313)：

S311,局地层。输入变量为S15得到的编码时段局地特征张量T_{enc_local}，放入卷积核大小为1×1的convLSTM层中计算，输出张量表示为T_enc0,其通道数量16。单个时间步上的局地卷积层映射可以表示为

S312,短距离扩散层。首先将输入变量为S311中的输出张量T_enc0和S16中得到的非局地特征张量合并得到一个新的张量T_enc1，其维度为21×80×80。即：

其中代表通道合并。再将张量T_enc1放入一个convLSTM层中计算，卷积核为3×3，得到输出通道数量为16的新张量T_enc2。单个时间步上的短距离扩散卷积层的映射过程可以表示为：

T_enc1→T_enc2

S313,长距离输送层。将S312中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算，输出通道数量为16。单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为：

T_enc2→T_enc3

S314,与S321-S323同步，在时间上，t时刻第l层将生成的隐藏传递状态张量C_t,l和H_t,l传递给下一时间步，记忆张量M_t则负责上一时间步最后一层和下一时间步第一层之间的信息交换。初始C_t＝0,l、H_t＝0,l和M_t＝0张量均赋初始值为0。C、H和M的定义可见文献。经过14个时间步之后，C_t＝0,l、H_t＝0,l和M_t＝0被映射为起报时刻的C_t＝24,l，H_t＝24,l和M_t＝24，即：

C_t＝0,l→C_t＝24,l

H_t＝0,l→H_t＝24,l

M_t＝0→M_t＝24

S32，构建数据解码(预报)网络(图3)。具体可以描述为：

S321,局地层。输入变量为S25得到的编码时段局地特征张量T_{dec_local}，在第1时刻，将T_{dec_local}与S27获取的起报时刻上的气溶胶浓度场O_start进行张量通道合并，即

在其他时刻，将将T_{dec_local}与S324在上一个时间步预报的气溶胶浓度P_t进行张量通道合并，即

S322,短距离扩散层。首先将输入变量为S321中的输出张量T_dec0和S16中得到的非局地特征张量合并得到一个新的张量T_dec1，其维度为21×80×80。即：

其中代表通道合并。再将张量T_dec1放入一个convLSTM层中计算，卷积核为3×3，得到输出通道数量为16的新张量T_dec2。单个时间步上的短距离扩散卷积层的映射过程可以表示为：

T_dec1→T_dec2

S323,长距离输送层。将S322中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算，输出通道数量为16。单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为：

T_dec2→T_dec3

S324,通道合并。将S323第t步输出的T_dec3的16通道张量相加为单通道张量P_t，公式为：

每一时间步所生成的P就是24个时间步(每3小时一次)上预报的二维气溶胶浓度场。

S325,与S321-S324同步，在时间上，在第一个预报时刻的第l层将S314生成的张量C_t＝24,l，H_t＝24,l和M_t＝24传递进来作为解码阶段C、H和M的初始值。并类似于S314中所示在L_dec个时间步上参与convLSTM的计算。

S326，循环S321-S325得到所有时间步上的P_t，也就是所有时刻的二维气溶胶浓度预报场。

S4，模型训练：

对S3中构建的模型开展训练，训练目标为S24中得到的气溶胶浓度二维观测真值O_t。以S326中计算的二维气溶胶浓度预报场P_t和O_t的均方误差为代价函数L。b个训练样本上的代价函数公式为：

训练最终得到最终预报模型使得代价函数L最小。

S5，应用模型开展预报。

应用基于该模型的系统得到未来若时刻的大气气溶胶浓度的预报。将S1-S2获得的数据集输入S4中得到的最终预报模型，输出未来若干时刻的大气气溶胶浓度的预报。应用的时候，可以用于训练的同一区域的其他任意时间段。也就是，训练和应用使得的采样数据不同。

图4为模型所有预报(模型第24个时刻)和对应观测的PM_2.5浓度、均方根误差和决定系数。其中，观测(左上图)和预报(右上图)的气溶胶浓度(单位：微克每立方米)。观测和模拟的均方根误差(左下图，单位：微克每立方米)和决定系数(右下图)。可见模式能预测出京津冀地区的气溶胶浓度的空间分布，京津冀地区的均方根误差小于30μg/m³，决定系数大都在0.6以上。

图5为本方案预测的京津冀区域12城市气溶胶浓度和WRF-Chem模式预测的气溶胶浓度预测的对比，自上而下分别为和观测的决定系数(越大越好)、均方根误差(越小越好)和平均偏差(约接近0越好)。三个色柱分别代表本方案0-24小时预报平均，本方案48-72小时预报平均和WRF-Chem的0-24小时预报平均。由图中可知，采用本申请中的气溶胶预测京津冀地区12城市气溶胶浓度和WRF-Chem模式预测的气溶胶浓度预测的对比，包括北京、天津、石家庄在内的8个城市的本系统48-72小时预报优于WRF-Chem的0-24小时预报，9个城市的0-24预报优于WRF-Chem的0-24小时预报，全部城市的48-72小时预报的均方根误差明显小于WRF-Chem的0-24小时预报。表明本发明的预报方法有效性明显高于WRF-Chem模式。

实施例2

本实施例提供了一种快速预报区域大气气溶胶浓度的系统，实现实施例1中所提供的快速预报区域大气气溶胶浓度的方法，包括数据生成模块，模型训练模块以及预报模块，

通过采用本发明公开的上述技术方案，得到了如下有益的效果：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种快速预报区域大气气溶胶浓度的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的快速预报区域大气气溶胶浓度的方法，其特征在于，步骤S1前还包括划分格点：将待预报区域划分为N_Y×N_X个格点，其中N_Y和N_X分别代表南北和东西方向的格点数量。

3.根据权利要求1所述的快速预报区域大气气溶胶浓度的方法，其特征在于，步骤S1中具体包括：

S14,制作编码时段局地特征张量数据集：将步骤S11中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据，步骤S12中得到的全部衍生气象变量以及步骤S13中的全部气溶胶浓度观测打包，合并为一个N_VL×N_Y×N_X的张量,记作T_enclocal，其中N_VL代表编码时段局地特征变量的数量；

S15，生成编码时段非局地特征张量数据集：将步骤S11中的850hPa和10米高度处的东西风、南北风，以及地面高程合并为一个N_VN×N_Y×N_X的张量，记作T_encnonlocal，其中N_VN代表编码时段非局地特征变量的数量。

4.根据权利要求3所述的快速预报区域大气气溶胶浓度的方法，其特征在于，步骤S2具体包括：

S21，收集待预报范围内解码时段格点基本气象数据和非气象变量数据，所述解码时段以起报时刻为分界，起报时刻之后的时段为解码时段，共L_dec个时刻，所述解码时段格点基本气象数据来自于数值天气预报输出数据，包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度；所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据；

S25，生成解码时段非局地特征张量数据集：将步骤S11中的850hPa和10米高度处的东西风、南北风，以及地面高程合并为一个M_VN×N_Y×N_X大小的张量其中M_VN代表编码时段非局地特征变量的数量；

5.根据权利要求1所述的快速预报区域大气气溶胶浓度的方法，其特征在于，步骤S3具体包括：

T_enc1→T_enc2

T_enc2→T_enc3

S314,与S321-S323同步，在时间上，t时刻第l层将生成的C_t,l和H_t,l传递给下一时间步，M_t则负责上一时间步最后一层和下一时间步第一层之间的信息交换，C，H和M均为M_VN×N_Y×N_X大小的张量，其中C为各层的记忆单元张量、H为各层的隐藏张量、M为跨层记忆单元张量；初始C_t＝0,l、H_t＝0,l和M_t＝0张量赋初始值为0；经过L_enc个时刻之后，C_t＝0,l、H_t＝0,l和M_t＝0被映射为起报时刻的C_t＝24,l，H_t＝24,l和M_t＝24，即：

C_t＝0,l→C_t＝24,l

H_t＝0,l→H_t＝24,l

M_t＝0→M_t＝24

S321，局地层：输入变量为S25得到的编码时段局地特征张量在第1时刻，将与S26获取的起报时刻上的气溶胶浓度场O_start进行张量通道合并，即

将放入卷积核大小为1×1的convLSTM层中计算，输出张量表示为T_dec0，其通道数量为16，单个时间步上的局地卷积层映射可以表示为：

S322,短距离扩散层：首先将输入变量为S321中的输出张量T_dec0和S25中得到的非局地特征张量合并得到一个新的张量T_dec1，即：

T_dec1→T_dec2

T_dec2→T_dec3

每一时间步所生成的P就是24个时间步上预报的二维气溶胶浓度场；

6.根据权利要求5所述的快速预报区域大气气溶胶浓度的方法，其特征在于，步骤S4中的模型训练具体包括：

对步骤S3中构建的模型开展训练，训练目标为S23中得到的气溶胶浓度二维观测真值O_t；以S326中计算的二维气溶胶浓度预报场P_t和O_t的均方误差为代价函数L，b个训练样本上的代价函数公式为：

训练最终得到最终预报模型使得代价函数L最小。

7.一种快速预报区域大气气溶胶浓度的系统，其特征在于，包括数据生成模块，模型训练模块以及预报模块，