CN116484995A - 一种快速预报区域大气气溶胶浓度的方法及系统 - Google Patents

一种快速预报区域大气气溶胶浓度的方法及系统 Download PDF

Info

Publication number
CN116484995A
CN116484995A CN202211138529.0A CN202211138529A CN116484995A CN 116484995 A CN116484995 A CN 116484995A CN 202211138529 A CN202211138529 A CN 202211138529A CN 116484995 A CN116484995 A CN 116484995A
Authority
CN
China
Prior art keywords
data
tensor
time
layer
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211138529.0A
Other languages
English (en)
Other versions
CN116484995B (zh
Inventor
冯琎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute Of Urban Meteorology
Original Assignee
Beijing Institute Of Urban Meteorology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute Of Urban Meteorology filed Critical Beijing Institute Of Urban Meteorology
Priority to CN202211138529.0A priority Critical patent/CN116484995B/zh
Publication of CN116484995A publication Critical patent/CN116484995A/zh
Application granted granted Critical
Publication of CN116484995B publication Critical patent/CN116484995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种快速预报区域大气气溶胶浓度的方法及系统,该系统通过获取待预报区域中的多种气象以及非气象数据,将现有的深度学习的卷积和解码‑编码网络技术和大气气溶胶的局地、短距离输送和长距离输送物理过程相结合,将过去多个时段的网格化区域气溶胶观测、过去多个时段的网格化区域气象数据放在解码网络中,将未来待预测时段的网格化区域气象预报数据放在编码网络中,使得上述数据相互融合,进而获取未来待预测时刻的大气气溶胶浓度。该方案目的在于解决现有大气化学传输模式预测方法中存在的气溶胶浓度预报准确度不佳的问题,同时可以更快提供预测结果。

Description

一种快速预报区域大气气溶胶浓度的方法及系统
技术领域
本发明涉及大气预报技术领域,尤其涉及一种快速预报区域大气气溶胶浓度的方法及系统。
背景技术
大气气溶胶是悬浮于大气中的固体颗粒物的统称。其中的细粒子气溶胶称之为PM2.5。工业化以来,气溶胶的浓度水平及人类活动气溶胶的占比呈现明显上升趋势。气溶胶浓度的增加可造成空气污染,严重地影响人类的身体健康,增加了呼吸系统疾病的发病率和死亡率。气溶胶浓度预报是空气质量预报最重要的组成部分,准确的气溶胶浓度预报可以为环境治理、出行、城市管理和人体健康管理提供参考,是满足社会需求的重要研究和应用方向。
当前的区域气溶胶浓度预报主要基于大气化学传输模型(CTM)。大气化学传输模型在需要给定排放清单,在此基础上详细模拟气溶胶相关物理化学过程,包括生成、扩散、运输和沉积,从而模拟出气溶胶浓度。基于CTM的模拟不仅提供了气溶胶浓度的估计,而且还提供了物理化学过程的信息,可以方便地分析气溶胶污染的机制。然而,大气化学传输模型中的参数化和排放清单具有极大不确定性,这导致了气溶胶浓度的显著模拟预报误差。以最常用的天气预报和研究-化学模型(WRF-Chem)为例,Sicard等报告说,根据2015年的高分辨率模拟,中国每日表面PM2.5(直径小于2.5微米的颗粒物)浓度的模拟和观测之间的皮尔逊相关系数为0.44(相当于决定系数(R2)约为0.2)。此外,CTM包括许多粒子和气体示踪剂的复杂计算,导致巨量的计算资源需求和计算速度极慢。大气化学传输模型的计算资源消耗是同样空间分辨率的数值天气预报模型的3-5倍。这也导致其难以应用到没有计算资源的部门。
因此需要提供一种运算速度快,计算资源需求低的快速预报方法。
发明内容
本发明的目的在于提供一种快速预报区域大气气溶胶浓度的方法及系统,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种快速预报区域大气气溶胶浓度的方法,包括以下步骤:
S1,生成编码时段的特征变量数据集,包括格点气象数据、格点准静态数据和格点气溶胶观测数据;
S2,生成解码时段的特征变量数据集,包括格点气象预报数据和格点准静态数据;
S3,构建数据编码神经网络以及数据解码神经网络,基于所述数据编码神经网络和数据解码神经网络,建立待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型;
S4,将步骤S1获得的编码阶段的特征变量数据集和S2中获得的解码时段的特征变量数据集分别分为训练集和测试集,采用训练集训练步骤S3中的待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型,采用测试集测试后得到最终的预报模型;
S5,采用最终的预报模型对待预报区域未来某时刻发大气气溶胶浓度进行预测。
优选的,步骤S1前还包括划分格点:将待预报区域划分为NY×NX个格点,其中NY和NX分别代表南北和东西方向的格点数量。格点可以为经纬度格点,也可以为地图投影的距离格点,取决于所使用的气象数据。
优选的,步骤S1中具体包括:
S11,收集待预报范围内编码时段格点基本气象数据和非气象变量数据,所述编码时段以起报时刻为分界,起报时刻及其之前已经发生的时段为编码时段,共Lenc个时刻,所述编码时段格点基本气象数据来自于数值天气预报输出数据,包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度;所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据;
S12,计算编码时段的衍生气象数据,所述衍生气象数据包括但不限于地面24小时变压、850hPa的24小时变压和变温;
S13,制作编码时段格点气溶胶浓度观测:将Lenc个时刻的气溶胶浓度观测插值到步骤S11所述的对应格点中,对每一个时刻t,采集的气溶胶浓度观测为上一个时刻的浓度观测;
S14,制作编码时段局地特征张量数据集:将步骤S11中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据,步骤S12中得到的全部衍生气象变量以及步骤S13中的全部气溶胶浓度观测打包,合并为一个NVL×NY×NX的张量,记作其中NVL代表编码时段局地特征变量的数量;
S15,生成编码时段非局地特征张量数据集:将步骤S11中的850hPa和10米高度处的东西风、南北风,以及地面高程合并为一个NVN×NY×NX的张量,记作其中NVN代表编码时段非局地特征变量的数量。
更优选的,步骤S13中的插值方法采用距离反向权重、双线性、克里金插值法等方式之一。
优选的,步骤S2具体包括:
S21,收集待预报范围内解码时段格点基本气象数据和非气象变量数据,所述解码时段以起报时刻为分界,起报时刻之后的时段为解码时段,共Ldec个时刻,所述解码时段格点基本气象数据来自于数值天气预报输出数据,包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度;所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据;通常的观测高度为2米高度。
S22,计算解码时段的衍生气象数据,所述衍生气象数据包括但不限于地面24小时变压、850hPa的24小时变压和变温;
S23,制作解码时段格点气溶胶浓度二维观测真值:将Ldec个时刻的气溶胶浓度观测插值到步骤S11所述的对应格点中,对每一个时刻t,采集的气溶胶浓度观测为上一个时刻的浓度观测,采集的气溶胶浓度观测为Ot
S24,制作解码时段局地特征张量数据集:将步骤S21中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据,步骤S22中得到的全部衍生气象变量以及步骤S23中的全部气溶胶浓度观测打包,合并为一个MVL×NY×NX的张量其中MVL代表编码时段局地特征变量的数量;
S25,生成解码时段非局地特征张量数据集:将步骤S11中的850hPa和10米高度处的东西风、南北风,以及地面高程合并为一个MVN×NY×NX的张量其中MVN代表编码时段非局地特征变量的数量;
S26,制作起报时刻气溶胶浓度二维观测Ostart:将起报时刻的气溶胶浓度观测插值到S11所示相同的格点中,得到Ostart
优选的,步骤S3具体包括:
S31,构建编码网络:所述编码网络的基本结构采用PredRNN,每一层均为卷积长短期记忆网络convLSTM,连接时间和空间;在空间上,每一层向上层网络输出卷积后的新张量,包括局地卷积层、短距离扩散层以及长距离输送层,具体包括:
S311,局地层:输入变量为S14得到的编码时段局地特征张量放入卷积核大小为1×1的convLSTM层中计算,输出张量表示为Tenc0,其通道数量16;单个时间步上的局地卷积层映射可以表示为
S312,短距离扩散层:首先将输入变量为S311中的输出张量Tenc0和S15中得到的非局地特征张量合并得到一个新的张量Tenc1,即:
其中代表通道合并,再将张量Tenc1放入一个convLSTM层中计算,卷积核为3×3,得到输出通道数量为16的新张量Tenc2,单个时间步上的短距离扩散卷积层的映射过程可以表示为:
Tenc1→Tenc2
S313,长距离输送层:将S312中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算,输出通道数量为16,单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为:
Tenc2→Tenc3
S314,与S321-S323同步,在时间上,t时刻第l层将生成的隐藏传递状态张量Ct,l和Ht,l传递给下一时间步,记忆张量Mt则负责上一时间步最后一层和下一时间步第一层之间的信息交换,初始Ct=0,l、Ht=0,l和Mt=0张量均赋初始值为0;经过Lenc个时刻之后,Ct=0,l、Ht=0,l和Mt=0被映射为起报时刻的Ct=24,l,Ht=24,l和Mt=24,即:
Ct=0,l→Ct=24,l
Ht=0,l→Ht=24,l
Mt=0→Mt=24
S32,构建解码网络,所述解码网络包括局地层、短距离扩散层和长距离输送层:
S321,局地层:输入变量为S25得到的编码时段局地特征张量在第1时刻,将/>与S26获取的起报时刻上的气溶胶浓度场Ostart进行张量通道合并,即
在其他时刻,将与S324在上一个时间步预报的气溶胶浓度Pt进行张量通道合并,即
放入卷积核大小为1×1的convLSTM层中计算,输出张量表示为Tdec0,其通道数量为16。单个时间步上的局地卷积层映射可以表示为
S322,短距离扩散层。首先将输入变量为S321中的输出张量Tdec0和S25中得到的非局地特征张量合并得到一个新的张量Tdec1,即:
其中代表通道合并,再将张量Tdec1放入一个convLSTM层中计算,卷积核为3×3,得到输出通道数量为16的新张量Tdec2,单个时间步上的短距离扩散卷积层的映射过程可以表示为:
Tdec1→Tdec2
S323,长距离输送层:将S322中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算,输出通道数量为16,单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为:
Tdec2→Tdec3
S324,通道合并:将S323第t步输出的Tdec3的16通道张量相加为单通道张量Pt,公式为:
每一时间步所生成的P就是24个时间步上预报的二维气溶胶浓度场。
S325,与S321-S324同步,在时间上,在第一个预报时刻的第l层将S314生成的张量Ct=24,l,Ht=24,l和Mt=24传递进来作为解码阶段C、H和M的初始值,送入对应的局地层、短距离输送层和长距离输送层;
S326,循环步骤S321-S325最终得到所有时间步上的Pt,也就是解码时间内所有时刻的二维气溶胶浓度预报场。
优选的,步骤S4中的模型训练具体包括:
对S3中构建的模型开展训练,训练目标为S23中得到的气溶胶浓度二维观测真值Ot,以S326中计算的二维气溶胶浓度预报场Pt和Ot的均方误差为代价函数L,b个训练样本上的代价函数公式为:
训练最终得到最终预报模型使得代价函数L最小。
本发明的另一个目的在于提供了一种快速预报区域大气气溶胶浓度的系统,包括数据生成模块,模型训练模块以及预报模块,
所述数据生成模块通过收集编码时段的基本气象数据、非气象变量数据以及计算衍生气象数据,制作编码时段格点气溶胶浓度观测,生成编码时段局地特征张量数据集和非局地特征张量数据集作为训练集;
所述模型训练模块包括解码时段数据集生成子模块,模型构建子模块以及训练模型子模块,所述解码时段数据集生成子模块用于通过收集解码时段的基本气象数据、非气象变量数据以及计算衍生气象数据,制作解码时段格点气溶胶浓度观测,生成解码时段局地特征张量数据集和非局地特征张量数据集;
所述模型构建子模块构建待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型,所述训练模型子模块采用数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集对待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型进行训练,得到最优的大气气溶胶浓度预测的时空编码-解码神经网络模型;
所述预报模块采用最优的大气气溶胶浓度预测的时空编码-解码神经网络模型,以数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集作为变量输入,输出大气气溶胶浓度的预报结果。
本发明的有益效果是:
本发明提供一种快速预报区域大气气溶胶浓度的方法及系统,该系统通过获取待预报区域中的多种气象以及非气象数据,将现有的深度学习的卷积和解码-编码网络技术和大气气溶胶的局地、短距离输送和长距离输送物理过程相结合,将过去多个时段的网格化区域气溶胶观测、过去多个时段的网格化区域气象数据放在解码网络中,将未来待预测时段的网格化区域气象预报数据放在编码网络中,使得上述数据相互融合,进而获取未来待预测时刻的大气气溶胶浓度。该方案目的在于提供二维区域(而非单点)的气溶胶浓度预测,解决现有大气化学传输模式预测方法中存在的气溶胶浓度预报准确度不佳的问题,同时可以更快提供预测结果。
附图说明
图1是实施例1中提供的快速预报区域大气气溶胶浓度的方法流程示意图;
图2是实施例1中提供的编码网络结构示意图;
图3是实施例1中提供的解码网络结构示意图;
图4是实施例1中的观测(左上图)和预报(右上图)的气溶胶浓度(单位:微克每立方米)、观测和模拟的均方根误差(左下图,单位:微克每立方米)和决定系数(右下图);
图5是实施例1中预测的京津冀区域12城市气溶胶浓度和WRF-Chem模式预测的气溶胶浓度预测的对比示意图,自上而下分别为和观测的决定系数(越大越好)、均方根误差(越小越好)和平均偏差(约接近0越好),三个色柱分别代表本方案0-24小时预报平均,本方案48-72小时预报平均和WRF-Chem的0-24小时预报平均。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供了一种快速预报区域大气气溶胶浓度的方法,如图1所示,包括以下步骤:
S1,生成编码时段的特征变量数据集,包括格点气象数据、格点准静态数据和格点气溶胶观测数据;
S2,生成解码时段的特征变量数据集,包括格点气象预报数据和格点准静态数据;
S3,构建数据编码神经网络以及数据解码神经网络,基于所述数据编码神经网络和数据解码神经网络,建立待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型;
S4,将步骤S1获得的编码阶段的特征变量数据集和S2中获得的解码时段的特征变量数据集分别分为训练集和测试集,采用训练集训练步骤S3中的待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型,采用测试集测试后得到最终的预报模型;
S5,采用最终的预报模型对待预报区域未来某时刻发大气气溶胶浓度进行预测。
本实施例以京津冀区域为待预报区域,采用WRF地图投影格点划分格点,格点分辨率为9km,格点数量为80x80,即南北和东西方向的格点数量分别为80个。
训练时段为2020年一整年,具体实施过程如下:
S1,编码数据收集:
S11,收集编码时段格点基本气象数据。起报时段为每日0000UTC,编码时段为之前的3天,每3小时采样一次,共24个时刻。基本气象数据为天气预报和研究模式(WRF)的历史预报数据(每日0000UTC启动一次,每次运行24小时)。收集的变量包括11个:2米高度处的温度、2米高度处的相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、风速、风向角、850hPa的东西风和南北风。
S12,计算编码时段的衍生气象数据。共3个,包括地面24小时变压、850hPa的24小时变压和变温。
S13,收集6个格点非气象变量数据,包括地面高程、土地利用类型、气溶胶的排放清单数据。排放清单数据包括SO2、NOx、颗粒物和VOC。非气象变量数据包括24个时刻,格点和S11中的格点一致。
S14,制作编码时段格点气溶胶浓度观测。将24个时刻的气溶胶浓度观测使用距离反向权重插值法插值到S11所示相同的格点中。对每一个时刻t,采集的气溶胶浓度观测为上一个时刻(t-1时刻)的浓度观测。
S15,打包S11-S14中的部分变量为编码时段局地特征张量数据集。这些变量包括:S11得到的除850hPa风之外的9个基本气象变量;S12得到的3个衍生气象变量;S13得到的6个非气象变量;S14得到的气溶胶浓度观测。这些变量被合并为一个19×80×80的张量,记作
S16,生成编码时段非局地特征张量数据集。这些变量包括:S11得到的850hPa和10米高度处的东西风、南北风;步骤S13得到的地面高程。这些变量被合并为一个5×80×80的张量,记作
S2,收集解码数据:
S21,同S11,但针对起报时刻之后的解码时段开展数据收集,为3天每3小时预报一次,共24个时刻。解码时段是未来的预报时段,基本气象数据来自于数值天气预报输出数据。
S22,同S12,但计算解码时段的衍生气象变量。
S23,同S13,但收集解码时段非气象变量数据。
S24,制作编码时段格点气溶胶浓度二维观测真值。将24个时刻的气溶胶浓度观测使用距离反向权重法插值到S11所示相同的格点中。对每一个时刻t,采集的气溶胶浓度观测为Ot
S25,打包S21-S23中的部分变量为编码时段局地特征变量数据集。这些变量包括:S21得到的除850hPa风之外的9个基本气象变量;S22得到的3个衍生气象变量;S23得到的6个非气象变量。这些变量被合并为一个18×80×80的张量
S26,生成解码时段非局地特征变量数据集。变量和S16选择变量一致。被合并为一个5×80×80的张量
S27,制作起报时刻气溶胶浓度二维观测Ostart。将起报时刻的气溶胶浓度观测使用距离反向权重、双线性、克里金插值法等方式之一插值到S11所示相同的格点中,得到Ostart
S3,神经网络模型构建:
S31,构建数据编码神经网络,如图2所示,基本结构采用PredRNN。每一层均为卷积长短期记忆网络convLSTM连接时间和空间。在空间上,每一层向上层网络输出卷积后的新张量,各层分别描述为(S311-S313):
S311,局地层。输入变量为S15得到的编码时段局地特征张量Tenc_local,放入卷积核大小为1×1的convLSTM层中计算,输出张量表示为Tenc0,其通道数量16。单个时间步上的局地卷积层映射可以表示为
S312,短距离扩散层。首先将输入变量为S311中的输出张量Tenc0和S16中得到的非局地特征张量合并得到一个新的张量Tenc1,其维度为21×80×80。即:
其中代表通道合并。再将张量Tenc1放入一个convLSTM层中计算,卷积核为3×3,得到输出通道数量为16的新张量Tenc2。单个时间步上的短距离扩散卷积层的映射过程可以表示为:
Tenc1→Tenc2
S313,长距离输送层。将S312中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算,输出通道数量为16。单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为:
Tenc2→Tenc3
S314,与S321-S323同步,在时间上,t时刻第l层将生成的隐藏传递状态张量Ct,l和Ht,l传递给下一时间步,记忆张量Mt则负责上一时间步最后一层和下一时间步第一层之间的信息交换。初始Ct=0,l、Ht=0,l和Mt=0张量均赋初始值为0。C、H和M的定义可见文献。经过14个时间步之后,Ct=0,l、Ht=0,l和Mt=0被映射为起报时刻的Ct=24,l,Ht=24,l和Mt=24,即:
Ct=0,l→Ct=24,l
Ht=0,l→Ht=24,l
Mt=0→Mt=24
S32,构建数据解码(预报)网络(图3)。具体可以描述为:
S321,局地层。输入变量为S25得到的编码时段局地特征张量Tdec_local,在第1时刻,将Tdec_local与S27获取的起报时刻上的气溶胶浓度场Ostart进行张量通道合并,即
在其他时刻,将将Tdec_local与S324在上一个时间步预报的气溶胶浓度Pt进行张量通道合并,即
放入卷积核大小为1×1的convLSTM层中计算,输出张量表示为Tdec0,其通道数量为16。单个时间步上的局地卷积层映射可以表示为
S322,短距离扩散层。首先将输入变量为S321中的输出张量Tdec0和S16中得到的非局地特征张量合并得到一个新的张量Tdec1,其维度为21×80×80。即:
其中代表通道合并。再将张量Tdec1放入一个convLSTM层中计算,卷积核为3×3,得到输出通道数量为16的新张量Tdec2。单个时间步上的短距离扩散卷积层的映射过程可以表示为:
Tdec1→Tdec2
S323,长距离输送层。将S322中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算,输出通道数量为16。单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为:
Tdec2→Tdec3
S324,通道合并。将S323第t步输出的Tdec3的16通道张量相加为单通道张量Pt,公式为:
每一时间步所生成的P就是24个时间步(每3小时一次)上预报的二维气溶胶浓度场。
S325,与S321-S324同步,在时间上,在第一个预报时刻的第l层将S314生成的张量Ct=24,l,Ht=24,l和Mt=24传递进来作为解码阶段C、H和M的初始值。并类似于S314中所示在Ldec个时间步上参与convLSTM的计算。
S326,循环S321-S325得到所有时间步上的Pt,也就是所有时刻的二维气溶胶浓度预报场。
S4,模型训练:
对S3中构建的模型开展训练,训练目标为S24中得到的气溶胶浓度二维观测真值Ot。以S326中计算的二维气溶胶浓度预报场Pt和Ot的均方误差为代价函数L。b个训练样本上的代价函数公式为:
训练最终得到最终预报模型使得代价函数L最小。
S5,应用模型开展预报。
应用基于该模型的系统得到未来若时刻的大气气溶胶浓度的预报。将S1-S2获得的数据集输入S4中得到的最终预报模型,输出未来若干时刻的大气气溶胶浓度的预报。应用的时候,可以用于训练的同一区域的其他任意时间段。也就是,训练和应用使得的采样数据不同。
图4为模型所有预报(模型第24个时刻)和对应观测的PM2.5浓度、均方根误差和决定系数。其中,观测(左上图)和预报(右上图)的气溶胶浓度(单位:微克每立方米)。观测和模拟的均方根误差(左下图,单位:微克每立方米)和决定系数(右下图)。可见模式能预测出京津冀地区的气溶胶浓度的空间分布,京津冀地区的均方根误差小于30μg/m3,决定系数大都在0.6以上。
图5为本方案预测的京津冀区域12城市气溶胶浓度和WRF-Chem模式预测的气溶胶浓度预测的对比,自上而下分别为和观测的决定系数(越大越好)、均方根误差(越小越好)和平均偏差(约接近0越好)。三个色柱分别代表本方案0-24小时预报平均,本方案48-72小时预报平均和WRF-Chem的0-24小时预报平均。由图中可知,采用本申请中的气溶胶预测京津冀地区12城市气溶胶浓度和WRF-Chem模式预测的气溶胶浓度预测的对比,包括北京、天津、石家庄在内的8个城市的本系统48-72小时预报优于WRF-Chem的0-24小时预报,9个城市的0-24预报优于WRF-Chem的0-24小时预报,全部城市的48-72小时预报的均方根误差明显小于WRF-Chem的0-24小时预报。表明本发明的预报方法有效性明显高于WRF-Chem模式。
实施例2
本实施例提供了一种快速预报区域大气气溶胶浓度的系统,实现实施例1中所提供的快速预报区域大气气溶胶浓度的方法,包括数据生成模块,模型训练模块以及预报模块,
所述数据生成模块通过收集编码时段的基本气象数据、非气象变量数据以及计算衍生气象数据,制作编码时段格点气溶胶浓度观测,生成编码时段局地特征张量数据集和非局地特征张量数据集作为训练集;
所述模型训练模块包括解码时段数据集生成子模块,模型构建子模块以及训练模型子模块,所述解码时段数据集生成子模块用于通过收集解码时段的基本气象数据、非气象变量数据以及计算衍生气象数据,制作解码时段格点气溶胶浓度观测,生成解码时段局地特征张量数据集和非局地特征张量数据集;
所述模型构建子模块构建待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型,所述训练模型子模块采用数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集对待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型进行训练,得到最优的大气气溶胶浓度预测的时空编码-解码神经网络模型;
所述预报模块采用最优的大气气溶胶浓度预测的时空编码-解码神经网络模型,以数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集作为变量输入,输出大气气溶胶浓度的预报结果。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
本发明提供一种快速预报区域大气气溶胶浓度的方法及系统,该系统通过获取待预报区域中的多种气象以及非气象数据,将现有的深度学习的卷积和解码-编码网络技术和大气气溶胶的局地、短距离输送和长距离输送物理过程相结合,将过去多个时段的网格化区域气溶胶观测、过去多个时段的网格化区域气象数据放在解码网络中,将未来待预测时段的网格化区域气象预报数据放在编码网络中,使得上述数据相互融合,进而获取未来待预测时刻的大气气溶胶浓度。该方案目的在于提供二维区域(而非单点)的气溶胶浓度预测,解决现有大气化学传输模式预测方法中存在的气溶胶浓度预报准确度不佳的问题,同时可以更快提供预测结果。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (7)

1.一种快速预报区域大气气溶胶浓度的方法,其特征在于,包括以下步骤:
S1,生成编码时段的特征变量数据集,包括格点气象数据、格点准静态数据和格点气溶胶观测数据;
S2,生成解码时段的特征变量数据集,包括格点气象预报数据和格点准静态数据;
S3,构建数据编码神经网络以及数据解码神经网络,基于所述数据编码神经网络和数据解码神经网络,建立待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型;
S4,将步骤S1获得的编码阶段的特征变量数据集和S2中获得的解码时段的特征变量数据集分别分为训练集和测试集,采用训练集训练步骤S3中的待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型,采用测试集测试后得到最终的预报模型;
S5,采用最终的预报模型对待预报区域未来某时刻发大气气溶胶浓度进行预测。
2.根据权利要求1所述的快速预报区域大气气溶胶浓度的方法,其特征在于,步骤S1前还包括划分格点:将待预报区域划分为NY×NX个格点,其中NY和NX分别代表南北和东西方向的格点数量。
3.根据权利要求1所述的快速预报区域大气气溶胶浓度的方法,其特征在于,步骤S1中具体包括:
S11,收集待预报范围内编码时段格点基本气象数据和非气象变量数据,所述编码时段以起报时刻为分界,起报时刻及其之前已经发生的时段为编码时段,共Lenc个时刻,所述编码时段格点基本气象数据来自于数值天气预报输出数据,包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度;所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据;
S12,计算编码时段的衍生气象数据,所述衍生气象数据包括但不限于地面24小时变压、850hPa的24小时变压和变温;
S13,制作编码时段格点气溶胶浓度观测:将Lenc个时刻的气溶胶浓度观测插值到步骤S11所述的对应格点中,对每一个时刻t,采集的气溶胶浓度观测为上一个时刻的浓度观测;
S14,制作编码时段局地特征张量数据集:将步骤S11中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据,步骤S12中得到的全部衍生气象变量以及步骤S13中的全部气溶胶浓度观测打包,合并为一个NVL×NY×NX的张量,记作Tenclocal,其中NVL代表编码时段局地特征变量的数量;
S15,生成编码时段非局地特征张量数据集:将步骤S11中的850hPa和10米高度处的东西风、南北风,以及地面高程合并为一个NVN×NY×NX的张量,记作Tencnonlocal,其中NVN代表编码时段非局地特征变量的数量。
4.根据权利要求3所述的快速预报区域大气气溶胶浓度的方法,其特征在于,步骤S2具体包括:
S21,收集待预报范围内解码时段格点基本气象数据和非气象变量数据,所述解码时段以起报时刻为分界,起报时刻之后的时段为解码时段,共Ldec个时刻,所述解码时段格点基本气象数据来自于数值天气预报输出数据,包括但不限于观测高度处的温度、相对湿度、地面气压、每个时间间隔内的降水量、边界层高度、10米高度的东西风、南北风、850hPa的东西风和南北风和850hPa的位势高度;所述非气象数据包括但不限于地面高程、土地利用类型、气溶胶的排放清单数据;
S22,计算解码时段的衍生气象数据,所述衍生气象数据包括但不限于地面24小时变压、850hPa的24小时变压和变温;
S23,制作解码时段格点气溶胶浓度二维观测真值:将Ldec个时刻的气溶胶浓度观测插值到步骤S11所述的对应格点中,对每一个时刻t,采集的气溶胶浓度观测为上一个时刻的浓度观测,采集的气溶胶浓度观测为Ot
S24,制作解码时段局地特征张量数据集:将步骤S21中得到的除850hPa位势高度之外的全部的基本气象变量和非气象变量数据,步骤S22中得到的全部衍生气象变量以及步骤S23中的全部气溶胶浓度观测打包,合并为一个MVL×NY×NX的张量其中MVL代表编码时段局地特征变量的数量;
S25,生成解码时段非局地特征张量数据集:将步骤S11中的850hPa和10米高度处的东西风、南北风,以及地面高程合并为一个MVN×NY×NX大小的张量其中MVN代表编码时段非局地特征变量的数量;
S26,制作起报时刻气溶胶浓度二维观测Ostart:将起报时刻的气溶胶浓度观测插值到S11所示相同的格点中,得到Ostart
5.根据权利要求1所述的快速预报区域大气气溶胶浓度的方法,其特征在于,步骤S3具体包括:
S31,构建编码网络:所述编码网络的基本结构采用PredRNN,每一层均为卷积长短期记忆网络convLSTM,连接时间和空间;在空间上,每一层向上层网络输出卷积后的新张量,包括局地卷积层、短距离扩散层以及长距离输送层,具体包括:
S311,局地层:输入变量为S14得到的编码时段局地特征张量放入卷积核大小为1×1的convLSTM层中计算,输出张量表示为Tenc0,其通道数量16;单个时间步上的局地卷积层映射可以表示为
S312,短距离扩散层:首先将输入变量为S311中的输出张量Tenc0和S15中得到的非局地特征张量合并得到一个新的张量Tenc1,即:
其中代表通道合并,再将张量Tenc1放入一个convLSTM层中计算,卷积核为3×3,得到输出通道数量为16的新张量Tenc2,单个时间步上的短距离扩散卷积层的映射过程可以表示为:
Tenc1→Tenc2
S313,长距离输送层:将S312中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算,输出通道数量为16,单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为:
Tenc2→Tenc3
S314,与S321-S323同步,在时间上,t时刻第l层将生成的Ct,l和Ht,l传递给下一时间步,Mt则负责上一时间步最后一层和下一时间步第一层之间的信息交换,C,H和M均为MVN×NY×NX大小的张量,其中C为各层的记忆单元张量、H为各层的隐藏张量、M为跨层记忆单元张量;初始Ct=0,l、Ht=0,l和Mt=0张量赋初始值为0;经过Lenc个时刻之后,Ct=0,l、Ht=0,l和Mt=0被映射为起报时刻的Ct=24,l,Ht=24,l和Mt=24,即:
Ct=0,l→Ct=24,l
Ht=0,l→Ht=24,l
Mt=0→Mt=24
S32,构建解码网络,所述解码网络包括局地层、短距离扩散层和长距离输送层:
S321,局地层:输入变量为S25得到的编码时段局地特征张量在第1时刻,将与S26获取的起报时刻上的气溶胶浓度场Ostart进行张量通道合并,即
在其他时刻,将与S324在上一个时间步预报的气溶胶浓度Pt进行张量通道合并,即
放入卷积核大小为1×1的convLSTM层中计算,输出张量表示为Tdec0,其通道数量为16,单个时间步上的局地卷积层映射可以表示为:
S322,短距离扩散层:首先将输入变量为S321中的输出张量Tdec0和S25中得到的非局地特征张量合并得到一个新的张量Tdec1,即:
其中代表通道合并,再将张量Tdec1放入一个convLSTM层中计算,卷积核为3×3,得到输出通道数量为16的新张量Tdec2,单个时间步上的短距离扩散卷积层的映射过程可以表示为:
Tdec1→Tdec2
S323,长距离输送层:将S322中生成的张量放入卷积核为3×3或者5×5的convLSTM层中计算,输出通道数量为16,单个时间步上的长距离扩散卷积层对输入输出张量维度的映射可以表示为:
Tdec2→Tdec3
S324,通道合并:将S323第t步输出的Tdec3的16通道张量相加为单通道张量Pt,公式为:
每一时间步所生成的P就是24个时间步上预报的二维气溶胶浓度场;
S325,与S321-S324同步,在时间上,在第一个预报时刻的第l层将S314生成的张量Ct=24,l,Ht=24,l和Mt=24传递进来作为解码阶段C、H和M的初始值,送入对应的局地层、短距离输送层和长距离输送层;
S326,循环步骤S321-S325最终得到所有时间步上的Pt,也就是解码时间内所有时刻的二维气溶胶浓度预报场。
6.根据权利要求5所述的快速预报区域大气气溶胶浓度的方法,其特征在于,步骤S4中的模型训练具体包括:
对步骤S3中构建的模型开展训练,训练目标为S23中得到的气溶胶浓度二维观测真值Ot;以S326中计算的二维气溶胶浓度预报场Pt和Ot的均方误差为代价函数L,b个训练样本上的代价函数公式为:
训练最终得到最终预报模型使得代价函数L最小。
7.一种快速预报区域大气气溶胶浓度的系统,其特征在于,包括数据生成模块,模型训练模块以及预报模块,
所述数据生成模块通过收集编码时段的基本气象数据、非气象变量数据以及计算衍生气象数据,制作编码时段格点气溶胶浓度观测,生成编码时段局地特征张量数据集和非局地特征张量数据集作为训练集;
所述模型训练模块包括解码时段数据集生成子模块,模型构建子模块以及训练模型子模块,所述解码时段数据集生成子模块用于通过收集解码时段的基本气象数据、非气象变量数据以及计算衍生气象数据,制作解码时段格点气溶胶浓度观测,生成解码时段局地特征张量数据集和非局地特征张量数据集;
所述模型构建子模块构建待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型,所述训练模型子模块采用数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集对待优化的大气气溶胶浓度预测的时空编码-解码神经网络模型进行训练,得到最优的大气气溶胶浓度预测的时空编码-解码神经网络模型;
所述预报模块采用最优的大气气溶胶浓度预测的时空编码-解码神经网络模型,以数据生成模块中的训练集以及解码时段数据集生成子模块生成的数据集作为变量输入,输出大气气溶胶浓度的预报结果。
CN202211138529.0A 2022-09-19 2022-09-19 一种快速预报区域大气气溶胶浓度的方法及系统 Active CN116484995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211138529.0A CN116484995B (zh) 2022-09-19 2022-09-19 一种快速预报区域大气气溶胶浓度的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211138529.0A CN116484995B (zh) 2022-09-19 2022-09-19 一种快速预报区域大气气溶胶浓度的方法及系统

Publications (2)

Publication Number Publication Date
CN116484995A true CN116484995A (zh) 2023-07-25
CN116484995B CN116484995B (zh) 2023-10-27

Family

ID=87216528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211138529.0A Active CN116484995B (zh) 2022-09-19 2022-09-19 一种快速预报区域大气气溶胶浓度的方法及系统

Country Status (1)

Country Link
CN (1) CN116484995B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507533A (zh) * 2020-04-22 2020-08-07 中科三清科技有限公司 空气污染物浓度预测方法、装置、电子设备及存储介质
CN112464999A (zh) * 2020-11-19 2021-03-09 深圳大学 一种混合气体种类与浓度识别方法、装置及存储介质
CN112748483A (zh) * 2020-12-24 2021-05-04 北京思湃德信息技术有限公司 一种基于深度学习的气温预报偏差订正方法及装置
CN113807432A (zh) * 2021-09-16 2021-12-17 成都卡普数据服务有限责任公司 一种基于深度学习的气温预报数据订正方法
US20220214322A1 (en) * 2021-01-07 2022-07-07 Tsinghua University Air pollutants concentration forecasting method and apparatus and storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507533A (zh) * 2020-04-22 2020-08-07 中科三清科技有限公司 空气污染物浓度预测方法、装置、电子设备及存储介质
CN112464999A (zh) * 2020-11-19 2021-03-09 深圳大学 一种混合气体种类与浓度识别方法、装置及存储介质
CN112748483A (zh) * 2020-12-24 2021-05-04 北京思湃德信息技术有限公司 一种基于深度学习的气温预报偏差订正方法及装置
US20220214322A1 (en) * 2021-01-07 2022-07-07 Tsinghua University Air pollutants concentration forecasting method and apparatus and storage medium
CN113807432A (zh) * 2021-09-16 2021-12-17 成都卡普数据服务有限责任公司 一种基于深度学习的气温预报数据订正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邓丽;邬群勇;杨水荣;: "融合SSAE深度特征学习和LSTM网络的PM_(2.5)小时浓度预测", 环境科学学报, no. 09 *

Also Published As

Publication number Publication date
CN116484995B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN111859800B (zh) 用于pm2.5浓度分布的时空估算和预测方法
CN112905560B (zh) 一种多源时空大数据深度融合的空气污染预测方法
CN108983320B (zh) 一种沿海台风极值风速的数值天气预报-人工智能耦合预测方法
CN112330215B (zh) 一种城市用车需求量预测方法、设备及存储介质
CN113297528B (zh) 一种基于多源大数据的no2高分辨率时空分布计算方法
CN109524993B (zh) 用于中长期优化调度的风电光伏典型周出力场景生成方法
CN109522603A (zh) 基于云平台的车载拉格朗日实时大气污染溯源系统及方法
Lin et al. Mining public datasets for modeling intra-city PM2. 5 concentrations at a fine spatial resolution
CN106651036A (zh) 空气质量预报系统
CN111210082A (zh) 一种基于优化的bp神经网络算法的降水量预测方法
CN104239706A (zh) 一种地面观测气温时空数据集的制备方法
CN111242395B (zh) 用于od数据的预测模型构建方法及装置
CN111242292A (zh) 基于深度时空网络的od数据预测方法及系统
Zheng et al. Weather image-based short-term dense wind speed forecast with a ConvLSTM-LSTM deep learning model
CN116070500B (zh) 一种基于深度学习空气质量浓度场模拟仿真器
CN112100922A (zh) 一种基于wrf和cnn卷积神经网络的风资源预测方法
Liao et al. Air quality prediction by integrating mechanism model and machine learning model
Agga et al. Short-term load forecasting: based on hybrid CNN-LSTM neural network
CN113641749B (zh) 一种基于二部图的人口流动网络估计方法及系统
CN113515798B (zh) 一种城市三维空间扩张模拟方法及装置
CN114626586A (zh) 基于prophet-LightGBM混合模型的大规模建筑能耗预测方法
CN113537596B (zh) 一种城市轨道交通新线站点短时客流预测方法
Li et al. Comparative analysis of land use change prediction models for land and fine wetland types: Taking the wetland cities Changshu and Haikou as examples
CN118070010A (zh) 一种基于生成对抗网络的可再生能源场景生成方法
CN116484995B (zh) 一种快速预报区域大气气溶胶浓度的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant