CN115345075B - 一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统 - Google Patents

一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统 Download PDF

Info

Publication number
CN115345075B
CN115345075B CN202210985139.0A CN202210985139A CN115345075B CN 115345075 B CN115345075 B CN 115345075B CN 202210985139 A CN202210985139 A CN 202210985139A CN 115345075 B CN115345075 B CN 115345075B
Authority
CN
China
Prior art keywords
aerosol
meteorological
pollution
data set
concentration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210985139.0A
Other languages
English (en)
Other versions
CN115345075A (zh
Inventor
冯琎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute Of Urban Meteorology
Original Assignee
Beijing Institute Of Urban Meteorology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute Of Urban Meteorology filed Critical Beijing Institute Of Urban Meteorology
Priority to CN202210985139.0A priority Critical patent/CN115345075B/zh
Publication of CN115345075A publication Critical patent/CN115345075A/zh
Application granted granted Critical
Publication of CN115345075B publication Critical patent/CN115345075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种一体化气溶胶污染气象指数‑气溶胶浓度估算方法及系统,通过构建基于深度神经网络构建的气溶胶污染气象指数时空深度神经网络模型对气溶胶污染气象指数进行准确的估算,同时可以给出精确的气溶胶浓度估算公式,实现一体化估算气溶胶污染气象指数‑气溶胶浓度值。本方案中的数据集的选择不仅包括基本气象变量,还包括多种自定义的和气溶胶浓度变化相关的二级气象变量,有利于提高模型拟合能力。同时,本方法提出使用气象场空间窗口采样并使用带有门的网络结构在时间上关联这些采样,根据气象场主要对气溶胶浓度短期变率起作用的特征,首次提出分离开背景浓度和气溶胶污染气象指数,使得估算结果准确度更高。

Description

一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统
技术领域
本发明涉及环境监测计算领域,尤其涉及一种一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统。
背景技术
大气气溶胶是悬浮于大气中的固体颗粒物的统称。其中的细粒子气溶胶称之为PM2.5。工业化以来,气溶胶的浓度水平及人类活动气溶胶的占比呈现明显上升趋势。气溶胶浓度的增加可造成空气污染,严重地影响人类的身体健康,增加了呼吸系统疾病的发病率和死亡率。大气气溶胶颗粒还通过直接和间接效应影响地-气系统之间的热量交换,进一步影响地面温度、降水等区域天气、气候因子以及更大尺度的大气环流系统。
由于溶胶浓度的变化受气溶胶相关污染物排放和气象要素的共同影响,而气象要素主要影响气溶胶浓度的短期、大幅的变化,所以定量评估气溶胶污染气象条件,以及使用气象变量估算气溶胶浓度是当前污染防治的一个重要问题。给出上述变量的精确估算模型至少可以应用于两个问题:一个是结合当前和未来天气预报给出当前和未来的气溶胶浓度的估计,另一个是气溶胶污染减排措施效果的后评估,因为气溶胶估算模型给出的是气象驱动的气溶胶浓度,再和观测气溶胶浓度求差可知减排措施是否起作用。
当前并不存在一体化的区域气溶胶污染气象指数-气溶胶浓度的估算模型。前人一般对这两个问题分别开展建模。一方面,气溶胶污染气象指数往往采用半物理-半经验方式建模,当前较为实用的有气象-气溶胶链接指数和静稳天气指数。但这两个指数和气溶胶浓度的变化相关紧密度不高,无法满足精确评估气象场对气溶胶的影响的要求,也无法进一步根据这些指数在实际应用中估算气溶胶浓度。另一方面,当前的气溶胶浓度估算模型则不仅使用了气象变量、还进一步使用了卫星气溶胶光学厚度观测、能见度观测、污染物排放清单数据甚至大气化学传输模式模拟数据等、使用机器学习方法(例如梯度提升树、随机森林、多层感知机等)开展数据融合估算,使得估算精度有所提高,但其主要问题在于采用方法较为简单,估算精度不足,缺乏针对气溶胶物理过程特点开展的模型设计,仅仅将基本气象和其他变量放入通用机器学习模型中进行训练。这会导致模型和物理过程脱节,其模型的适用性不足。
因此,如何建立一体化的区域气溶胶污染气象指数-气溶胶浓度的估算模型,解决之前这两个方面模型在精度和适用性方面的问题,尤其是解决在区域上使用气象变量精确估算气溶胶浓度,是当前大气环境领域一个亟待解决的问题。
发明内容
本发明的目的在于提供一种一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种一体化气溶胶污染气象指数-气溶胶浓度估算方法,包括以下步骤:
S1,生成估算特征变量数据集,所述估算特征变量数据集包括基本气象变量、二级气象变量和准静态变量;
S2,使用历史气溶胶浓度观测数据集C计算气溶胶背景浓度
Figure GDA0004060028370000021
和气溶胶污染气象指数真值r;
S3,建立待优化的气溶胶污染气象指数时空深度神经网络模型;
S4,采用步骤S1中生成的特征变量数据集作为训练集,训练步骤S3中建立的时空深度神经网络模型,拟合气溶胶污染气象指数真值r得到气溶胶污染气象指数估计值
Figure GDA0004060028370000022
结合气溶胶污染气象指数估算值
Figure GDA0004060028370000023
和气溶胶背景浓度
Figure GDA0004060028370000024
得到实际的气溶胶浓度估算值
Figure GDA0004060028370000025
具体包括;
S41、将步骤S1中得到的估算特征变量数据集划分为训练数据集和测试数据集,使用训练数据集采用留出验证训练或者10折交叉验证训练对步骤S3中生成的神经网络模型开展训练过程,训练目标为步骤S3中得到的气溶胶污染气象指数真值r,以气溶胶污染气象指数估计值
Figure GDA0004060028370000026
和真值r的均方误差为代价函数L,s个训练样本上的代价函数公式为:
Figure GDA0004060028370000027
训练最终得到最优的气溶胶污染气象指数时空深度神经网络模型使得代价函数L最小;
S42、采用S41中的测试数据集对最优的气溶胶污染气象指数时空深度神经网络模型进行测试,计算得到测试数据集上气溶胶污染气象指数真值r和估计值
Figure GDA0004060028370000031
的均方根误差为气溶胶污染气象指数的估计误差;
S43、任一时间、任一网格上,使用倍数参数q、气溶胶污染气象指数估计值
Figure GDA0004060028370000032
和气溶胶背景浓度
Figure GDA0004060028370000033
估算气溶胶浓度估计值
Figure GDA0004060028370000034
估算公式为:
Figure GDA0004060028370000035
其中测试数据集上的估算气溶胶浓度和观测气溶胶浓度的均方根误差为气溶胶浓度的估计误差。
优选的,步骤S1具体包括:
S11、收集基本气象变量,包括但不限于以下变量:大气各层的风向、风速、边界层高度、日降水量、2米高度处的温度、位势高度、2米高度处的比湿、2米高度处的相对湿度、云量和地面气压;
S12、使用步骤S11中收集的及本期向变量计算和气溶胶浓度变化相关的二级气象变量,包括但不限于2米高度处的位温、2米高度处的湿位温、2米高度处的湿平衡位温、湿沉降发生阈值w以及近地层扩散系数d,
其中所述湿沉降发生阈值w公式为:
Figure GDA0004060028370000036
其中p为日降水量(单位:毫米);
所述近地层扩散系数d计算公式为:
Figure GDA0004060028370000037
其中z为指定大气层离地高度,取所在高度,U为全风速;
S13、收集历史数据中的准静态变量,包括但不限于地面高程、植被高度、土地利用类型、人口密度、沙尘气溶胶年均值或逐日的年循环值;
S14、合并S11-S13形成的三类数据集到同一时间段、空间区域和分辨率下形成基础的网格化数据集,特征变量为S11-S13所涉及的全部变量;
S15、在基础数据集中进行窗口采样得到样本数据集,即搜索所有历史气溶胶观测的时间和地点,以此为中心,以i×j网格为窗口范围,提取该范围内所有特征变量,i和j选择3-15的预设自然数。
优选的,步骤S2具体包括:
S21、使用m年的历史气溶胶浓度观测数据C计算观测时前后n天的气溶胶背景浓度
Figure GDA0004060028370000041
计算公式如下:
Figure GDA0004060028370000042
S22、使用历史气溶胶浓度观测数据集和气溶胶背景浓度计算气溶胶污染气象指数真值r,计算公式为:
Figure GDA0004060028370000043
其中q为倍数参数,选择1.1-4.0在内的预设实数。
优选的,步骤S3中具体包括:
S31,使用包括深度不少于5层的空间特征提取神经网络在获取的样本数据集中提取空间特征,所述特征提取网络包括但不限于各种残差网络和稠密网络;
S32、使用带有门控的循环神经网络将S31中提取的当前时刻t及之前的t-1个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure GDA0004060028370000044
本发明的另一个目的在于提供一种一体化气溶胶污染气象指数-气溶胶浓度估算系统,包括数据生成模块、模型构建模块、模型训练模块、气溶胶污染气象指数估算模块以及气溶胶浓度估算模块,
所述数据生成模块用于生成包括基本气象变量、二级气象变量和准静态变量在内的估算特征变量数据集,同时使用历史气溶胶浓度观测数据集计算气溶胶背景浓度和气溶胶污染气象指数真值;
所述模型构建模块用于构建待优化的气溶胶污染气象指数时空深度神经网络模型;
所述模型训练模块用于采用所述数据生成模块获取的估算特征变量数据集中的一部分作为训练数据集对构建的待优化的气溶胶污染气象指数时空深度神经网络模型进行训练,得到优化后的气溶胶污染气象指数时空深度神经网络模型;
所述气溶胶污染气象指数估算模块用于采用估算特征变量数据集的剩余部分作为测试数据集,利用优化后的气溶胶污染气象指数时空深度神经网络模型计算得到气溶胶污染气象指数估算值;
所述气溶胶浓度估算模块采用所述气溶胶污染气象指数估算模块得到的气溶胶污染气象指数估算值以及数据生成模块中计算得到的气溶胶背景浓度估算得到气溶胶浓度估算值。
优选的,所述数据生成模块生成包括基本气象变量、二级气象变量和准静态变量在内的估算特征变量数据集,具体包括以下步骤:
A1、收集基本气象变量,包括但不限于以下变量:大气各层的风向、风速、边界层高度、日降水量、温度、位势高度、比湿、相对湿度、云量和地面气压;
A2、使用步骤A1中收集的及本期向变量计算和气溶胶浓度变化相关的二级气象变量,包括但不限于位温、湿位温、湿平衡位温、湿沉降发生阈值w以及近地层扩散系数d,
其中所述湿沉降发生阈值w公式为:
Figure GDA0004060028370000051
其中p为日降水量(单位:毫米);
所述近地层扩散系数d计算公式为:
Figure GDA0004060028370000052
其中z为指定大气层离地高度,取不小于100米的指定高度,U为全风速;
A3、收集历史数据中的准静态变量,包括但不限于地面高程、植被高度、土地利用类型、人口密度、沙尘气溶胶年均值或逐日的年循环值;
A4、合并A1-A3形成的三类数据集到同一时间段、空间区域和分辨率下形成基础的网格化数据集,特征变量为S11-S13所涉及的全部变量;
A5、在基础数据集中进行窗口采样得到样本数据集,即搜索所有历史气溶胶观测的时间和地点,以此为中心,以i×j网格为窗口范围,对所有特征变量开展采样,i和j选择3-15的预设自然数。
优选的,所述数据生成模块中使用历史气溶胶浓度观测数据集计算气溶胶背景浓度和气溶胶污染气象指数真值,具体包括:
B1、使用m年的历史气溶胶浓度观测数据C计算观测时前后n天的气溶胶背景浓度
Figure GDA0004060028370000061
计算公式如下:
Figure GDA0004060028370000062
B2、使用历史气溶胶浓度观测数据集和气溶胶背景浓度计算气溶胶污染气象指数真值r,计算公式为:
Figure GDA0004060028370000063
其中q为倍数参数,选择1.1-4.0在内的预设实数。
优选的,所述模型构建模块中构建待优化的气溶胶污染气象指数时空深度神经网络模型具体包括:
C1,使用包括深度不少于5层的空间特征提取神经网络在获取的样本数据集中提取空间特征,所述特征提取网络包括但不限于各种残差网络和稠密网络;
C2、使用带有门控的循环神经网络将C1中提取的当前时刻t及之前的t-1个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure GDA0004060028370000064
优选的,所述模型训练模块在进行训练时,采用留出验证训练或者10折交叉验证训练对模型生成模块中生成的模型开展训练,训练目标为得到气溶胶污染气象指数真值r,以气溶胶污染气象指数估计值
Figure GDA0004060028370000065
和真值r的均方误差为代价函数L,s个训练样本上的代价函数公式为:
Figure GDA0004060028370000066
训练最终得到最优模型使得代价函数L最小。
优选的,所述气溶胶污染气象指数估算模块得到气溶胶污染气象指数估算值
Figure GDA0004060028370000071
所述气溶胶浓度估算模块在任一时间、任一网格上,使用倍数参数q、气溶胶污染气象指数估计值
Figure GDA0004060028370000072
和气溶胶背景浓度
Figure GDA0004060028370000073
估算气溶胶浓度估计值
Figure GDA0004060028370000074
估算公式为:
Figure GDA0004060028370000075
本发明的有益效果是:
本发明提供了一种一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统,通过构建给出了一种基于深度神经网络构建的气溶胶污染气象指数时空深度神经网络模型对气溶胶污染气象指数进行准确的估算,同时可以给出精确的气溶胶浓度估算公式,使得可以实现一体化估算气溶胶污染气象指数-气溶胶浓度值。本方案中的数据集的选择不仅包括基本气象变量,还包括多种自定义的和气溶胶浓度变化相关的二级气象变量,有利于提高模型拟合能力。同时,本方法提出使用气象场空间窗口采样并使用带有门的网络结构在时间上关联这些采样,之前的气溶胶浓度估计的相关技术未将两者联合使用。最后,本发明根据气象场主要对气溶胶浓度短期变率起作用的特征,首次提出分离开背景浓度和气溶胶污染气象指数,使得估算结果准确度更高。
附图说明
图1是实施例1中记载的一体化气溶胶污染气象指数-气溶胶浓度估算方法流程图;
图2是实施例1中记载的气溶胶污染气象指数深度神经网络模型原理示意图;
图3是实施例1中提供的气溶胶污染气象指数真值r和估计值
Figure GDA0004060028370000076
的对比散点图;
图4是实施例1中提供的气溶胶浓度真值C和估计值
Figure GDA0004060028370000077
的对比散点图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供了一种一体化气溶胶污染气象指数-气溶胶浓度估算方法,如图1所示,主要包括以下步骤:
S1,生成估算特征变量数据集,所述估算特征变量数据集包括基本气象变量、二级气象变量和准静态变量;
S2,使用历史气溶胶浓度观测数据集C计算气溶胶背景浓度
Figure GDA0004060028370000081
和气溶胶污染气象指数真值r;
S3,建立待优化的气溶胶污染气象指数时空深度神经网络模型;
S4,采用步骤S1中生成的特征变量数据集作为训练集,训练步骤S3中建立的时空深度神经网络模型,拟合气溶胶污染气象指数真值r得到气溶胶污染气象指数估计值
Figure GDA0004060028370000082
结合气溶胶污染气象指数估算值
Figure GDA0004060028370000083
和气溶胶背景浓度
Figure GDA0004060028370000084
得到实际的气溶胶浓度估算值
Figure GDA0004060028370000085
其中,步骤S1中的数据以2016年-2021年中国地区的气象数据为例,具体包括:
S11、收集2016-2021年中国地区基本气象变量包括10m、100m的风向、风速、边界层高度、日降水量、2米高度处的温度、850hPa位势高度、2米高度处的比湿、2米高度处的相对湿度、云量、地面气压。
S12、计算2米高度处的位温、2米高度处的湿位温、2米高度处的湿平衡位温、湿沉降发生阈值w,其公式为:
Figure GDA0004060028370000086
其中p为日降水量(单位:毫米),以及近地层扩散系数d,其公式为:
Figure GDA0004060028370000087
其中z为100米所在高度,U为10、100米高度处的全风速。
S13、收集中国地区历史数据中的地面高程、植被高度、土地利用类型、人口密度、沙尘气溶胶逐日的年循环值。
S14、合并S11-S13形成的三类数据集到同一时间段、空间区域和分辨率下形成基础的网格化数据集。该数据集样本数量为267万,特征变量为S11-S13所涉及的全部变量。
S15、在基础数据集中进行窗口采样得到样本数据集。即搜索所有有历史气溶胶观测的时间和地点,以此为中心,以9×9网格为窗口范围,对所有特征变量开展采样。
步骤S2中的历史气溶胶浓度观测数据也是采用2016年-2021年的数据,具体包括:
S21、使用6年的历史气溶胶浓度观测数据C计算观测前后15天的气溶胶背景浓度
Figure GDA0004060028370000091
计算公式如下
Figure GDA0004060028370000092
S22、使用历史气溶胶浓度观测数据集和气溶胶背景浓度计算气溶胶污染气象指数真值r,使用2作为倍数参数,计算公式为:
Figure GDA0004060028370000093
本实施例中构建的气溶胶污染气象指数时空深度神经网络模型原理如图2所示,具体包括:
S31、使用ResNet18提取步骤S1中的样本数据集的空间特征。
S32、使用GRU将S31中提取的当前时刻t及之前的t-1个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure GDA0004060028370000094
本实施例中的当前时刻设置为3,也就是说,使用GRU将S31中提取的当前时刻3及之前的2个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure GDA0004060028370000095
这里的时刻可以自定义为一天或几天,一个小时或几个小时为一个时刻。
步骤S4中进行训练时,具体包括以下步骤:
S41,首先需要将步骤S1中获取的样本数据集划分为训练数据集和样本数据集,使用训练数据集采用留出验证训练或者10折交叉验证训练对步骤S3中生成的神经网络模型开展训练过程,训练目标为步骤S2中得到的气溶胶污染气象指数真值r,以气溶胶污染气象指数估计值
Figure GDA0004060028370000101
和真值r的均方误差为代价函数L,s个训练样本上的代价函数公式为:
Figure GDA0004060028370000102
训练最终得到最优的气溶胶污染气象指数时空深度神经网络模型使得代价函数L最小;
S42、采用S41中的测试数据集对最优的气溶胶污染气象指数时空深度神经网络模型进行测试,计算得到测试数据集上气溶胶污染气象指数真值r和估计值
Figure GDA0004060028370000103
的均方根误差为气溶胶污染气象指数的估计误差;该估计误差为0.198,真值r和估计值
Figure GDA0004060028370000104
的决定系数为0.928,决定系数是估计对真值拟合优度的度量,如图3所示。
S43、任一时间、任一网格上,使用倍数参数q、气溶胶污染气象指数估计值
Figure GDA0004060028370000105
和气溶胶背景浓度
Figure GDA0004060028370000106
估算气溶胶浓度估计值
Figure GDA0004060028370000107
估算公式为:
Figure GDA0004060028370000108
其中测试数据集上的估算气溶胶浓度和观测气溶胶浓度的均方根误差为气溶胶浓度的估计误差。该估计误差为7.197μg m-3,真值C和估计值
Figure GDA0004060028370000109
的决定系数为0.955,如图4所示。
实施例2
本实施例提供了一种一体化气溶胶污染气象指数-气溶胶浓度估算系统,其特征在于,包括数据生成模块、模型构建模块、模型训练模块、气溶胶污染气象指数估算模块以及气溶胶浓度估算模块,
所述数据生成模块用于生成包括基本气象变量、二级气象变量和准静态变量在内的估算特征变量数据集,同时使用历史气溶胶浓度观测数据集计算气溶胶背景浓度和气溶胶污染气象指数真值;
所述模型构建模块用于构建待优化的气溶胶污染气象指数时空深度神经网络模型;
所述模型训练模块用于采用所述数据生成模块获取的估算特征变量数据集中的一部分作为训练数据集对构建的待优化的气溶胶污染气象指数时空深度神经网络模型进行训练,得到优化后的气溶胶污染气象指数时空深度神经网络模型;
所述气溶胶污染气象指数估算模块用于采用估算特征变量数据集的剩余部分作为测试数据集,利用优化后的气溶胶污染气象指数时空深度神经网络模型计算得到气溶胶污染气象指数估算值;
所述气溶胶浓度估算模块采用所述气溶胶污染气象指数估算模块得到的气溶胶污染气象指数估算值以及数据生成模块中计算得到的气溶胶背景浓度估算得到气溶胶浓度估算值。
本实施例中的所述数据生成模块生成包括基本气象变量、二级气象变量和准静态变量在内的估算特征变量数据集,具体包括以下步骤:
A1、收集基本气象变量,包括但不限于以下变量:850hPa的风向、风速、边界层高度、日降水量、2米高度处的温度、地面位势高度、2米高度处的比湿、2米高度处的相对湿度、云量和地面气压;
A2、使用步骤A1中收集的及本期向变量计算和气溶胶浓度变化相关的二级气象变量,包括但不限于2米高度处的位温、2米高度处的湿位温、2米高度处的湿平衡位温、湿沉降发生阈值w以及近地层扩散系数d,
其中所述湿沉降发生阈值w公式为:
Figure GDA0004060028370000111
其中p为日降水量(单位:毫米);
所述近地层扩散系数d计算公式为:
Figure GDA0004060028370000112
其中z为指定大气层离地高度,取不小于100米的指定高度,U为全风速;
A3、收集历史数据中的准静态变量,包括但不限于地面高程、植被高度、土地利用类型、人口密度、沙尘气溶胶年均值或逐日的年循环值;
A4、合并A1-A3形成的三类数据集到同一时间段、空间区域和分辨率下形成基础的网格化数据集,特征变量为S11-S13所涉及的全部变量;
A5、在基础数据集中进行窗口采样得到样本数据集,即搜索所有历史气溶胶观测的时间和地点,以此为中心,以i×j网格为窗口范围,对所有特征变量开展采样,i和j选择3-15的预设自然数。
本实施例中的所述数据生成模块中使用历史气溶胶浓度观测数据集计算气溶胶背景浓度和气溶胶污染气象指数真值,具体包括:
B1、使用m年的历史气溶胶浓度观测数据C计算观测时前后n天的气溶胶背景浓度
Figure GDA0004060028370000121
计算公式如下:
Figure GDA0004060028370000122
B2、使用历史气溶胶浓度观测数据集和气溶胶背景浓度计算气溶胶污染气象指数真值r,计算公式为:
Figure GDA0004060028370000123
其中q为倍数参数,选择1.1-4.0在内的预设实数。
本实施例中的所述模型构建模块中构建待优化的气溶胶污染气象指数时空深度神经网络模型具体包括:
C1,使用包括深度不少于5层的空间特征提取神经网络在获取的样本数据集中提取空间特征,所述特征提取网络包括但不限于各种残差网络和稠密网络;
C2、使用带有门控的循环神经网络将C1中提取的当前时刻t及之前的t-1个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure GDA0004060028370000124
本实施例中的所述模型训练模块在进行训练时,采用留出验证训练或者10折交叉验证训练对模型生成模块中生成的模型开展训练,训练目标为得到气溶胶污染气象指数真值r,以气溶胶污染气象指数估计值
Figure GDA0004060028370000125
和真值r的均方误差为代价函数L,s个训练样本上的代价函数公式为:
Figure GDA0004060028370000126
训练最终得到最优模型使得代价函数L最小。
本实施例中的所述气溶胶污染气象指数估算模块得到气溶胶污染气象指数估算值
Figure GDA0004060028370000131
所述气溶胶浓度估算模块在任一时间、任一网格上,使用倍数参数q、气溶胶污染气象指数估计值
Figure GDA0004060028370000132
和气溶胶背景浓度
Figure GDA0004060028370000133
估算气溶胶浓度估计值
Figure GDA0004060028370000134
估算公式为:
Figure GDA0004060028370000135
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (2)

1.一种一体化气溶胶污染气象指数-气溶胶浓度估算方法,其特征在于,包括以下步骤:
S1,生成估算特征变量数据集,所述估算特征变量数据集包括基本气象变量、二级气象变量和准静态变量;
S2,使用历史气溶胶浓度观测数据集C计算气溶胶背景浓度
Figure FDA0004100762590000011
和气溶胶污染气象指数真值r;
S3,建立待优化的气溶胶污染气象指数时空深度神经网络模型;
S4,采用步骤S1中生成的特征变量数据集作为训练集,训练步骤S3中建立的时空深度神经网络模型,拟合气溶胶污染气象指数真值r得到气溶胶污染气象指数估计值
Figure FDA0004100762590000012
结合气溶胶污染气象指数估算值
Figure FDA0004100762590000013
和气溶胶背景浓度
Figure FDA0004100762590000014
得到实际的气溶胶浓度估算值
Figure FDA0004100762590000015
具体包括;
S41、将步骤S1中得到的估算特征变量数据集划分为训练数据集和测试数据集,使用训练数据集采用留出验证训练或者10折交叉验证训练对步骤S3中生成的神经网络模型开展训练过程,训练目标为步骤S3中得到的气溶胶污染气象指数真值r,以气溶胶污染气象指数估计值
Figure FDA0004100762590000016
和真值r的均方误差为代价函数L,s个训练样本上的代价函数公式为:
Figure FDA0004100762590000017
训练最终得到最优的气溶胶污染气象指数时空深度神经网络模型使得代价函数L最小;
S42、采用S41中的测试数据集对最优的气溶胶污染气象指数时空深度神经网络模型进行测试,计算得到测试数据集上气溶胶污染气象指数真值r和估计值
Figure FDA0004100762590000018
的均方根误差为气溶胶污染气象指数的估计误差;
S43、任一时间、任一网格上,使用倍数参数q、气溶胶污染气象指数估计值
Figure FDA0004100762590000019
和气溶胶背景浓度
Figure FDA00041007625900000110
估算气溶胶浓度估计值
Figure FDA00041007625900000111
估算公式为:
Figure FDA00041007625900000112
其中测试数据集上的估算气溶胶浓度和观测气溶胶浓度的均方根误差为气溶胶浓度的估计误差;
步骤S1具体包括:
S11、收集基本气象变量,包括以下变量:850hPa的风向、风速、边界层高度、日降水量、2米高度处的温度、地面位势高度、2米高度处的比湿、2米高度处的相对湿度、云量和地面气压;
S12、使用步骤S11中收集的及本期向变量计算和气溶胶浓度变化相关的二级气象变量,包括2米高度处的位温、2米高度处的湿位温、2米高度处的湿平衡位温、湿沉降发生阈值w以及近地层扩散系数d,
其中所述湿沉降发生阈值w公式为:
Figure FDA0004100762590000021
其中p为日降水量(单位:毫米);
所述近地层扩散系数d计算公式为:
Figure FDA0004100762590000022
其中z为指定大气层离地高度,取不小于100米的指定高度,U为全风速;
S13、收集历史数据中的准静态变量,包括地面高程、植被高度、土地利用类型、人口密度、沙尘气溶胶年均值或逐日的年循环值;
S14、合并S11-S13形成的三类数据集到同一时间段、空间区域和分辨率下形成基础的网格化数据集,特征变量为S11-S13所涉及的全部变量;
S15、在基础数据集中进行窗口采样得到样本数据集,即搜索所有历史气溶胶观测的时间和地点,以此为中心,以i×j网格为窗口范围,提取该范围内所有特征变量,i和j选择3-15的预设自然数;
步骤S2具体包括:
S21、使用m年的历史气溶胶浓度观测数据C计算观测时前后n天的气溶胶背景浓度
Figure FDA0004100762590000023
计算公式如下:
Figure FDA0004100762590000024
S22、使用历史气溶胶浓度观测数据集和气溶胶背景浓度计算气溶胶污染气象指数真值r,计算公式为:
Figure FDA0004100762590000031
其中q为倍数参数,选择1.1-4.0在内的预设实数;
步骤S3中具体包括:
S31,使用包括深度不少于5层的空间特征提取神经网络在获取的样本数据集中提取空间特征,所述特征提取网络包括各种残差网络和稠密网络;
S32、使用带有门控的循环神经网络将S31中提取的当前时刻t及之前的t-1个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure FDA0004100762590000032
2.一种一体化气溶胶污染气象指数-气溶胶浓度估算系统,其特征在于,包括数据生成模块、模型构建模块、模型训练模块、气溶胶污染气象指数估算模块以及气溶胶浓度估算模块,
所述数据生成模块用于生成包括基本气象变量、二级气象变量和准静态变量在内的估算特征变量数据集,同时使用历史气溶胶浓度观测数据集计算气溶胶背景浓度和气溶胶污染气象指数真值;
所述模型构建模块用于构建待优化的气溶胶污染气象指数时空深度神经网络模型;
所述模型训练模块用于采用所述数据生成模块获取的估算特征变量数据集中的一部分作为训练数据集对构建的待优化的气溶胶污染气象指数时空深度神经网络模型进行训练,得到优化后的气溶胶污染气象指数时空深度神经网络模型;
所述气溶胶污染气象指数估算模块用于采用估算特征变量数据集的剩余部分作为测试数据集,利用优化后的气溶胶污染气象指数时空深度神经网络模型计算得到气溶胶污染气象指数估算值;
所述气溶胶浓度估算模块采用所述气溶胶污染气象指数估算模块得到的气溶胶污染气象指数估算值以及数据生成模块中计算得到的气溶胶背景浓度估算得到气溶胶浓度估算值;
所述数据生成模块生成包括基本气象变量、二级气象变量和准静态变量在内的估算特征变量数据集,具体包括以下步骤:
A1、收集基本气象变量,包括以下变量:850hPa的风向、风速、边界层高度、日降水量、2米高度处的温度、地面位势高度、2米高度处的比湿、2米高度处的相对湿度、云量和地面气压;
A2、使用步骤A1中收集的及本期向变量计算和气溶胶浓度变化相关的二级气象变量,包括2米高度处的位温、2米高度处的湿位温、2米高度处的湿平衡位温、湿沉降发生阈值w以及近地层扩散系数d,
其中所述湿沉降发生阈值w公式为:
Figure FDA0004100762590000041
其中p为日降水量(单位:毫米);
所述近地层扩散系数d计算公式为:
Figure FDA0004100762590000042
其中z为指定大气层离地高度,取不小于100米的指定高度,U为全风速;
A3、收集历史数据中的准静态变量,包括地面高程、植被高度、土地利用类型、人口密度、沙尘气溶胶年均值或逐日的年循环值;
A4、合并A1-A3形成的三类数据集到同一时间段、空间区域和分辨率下形成基础的网格化数据集,特征变量为S11-S13所涉及的全部变量;
A5、在基础数据集中进行窗口采样得到样本数据集,即搜索所有历史气溶胶观测的时间和地点,以此为中心,以i×j网格为窗口范围,对所有特征变量开展采样,i和j选择3-15的预设自然数;
所述数据生成模块中使用历史气溶胶浓度观测数据集计算气溶胶背景浓度和气溶胶污染气象指数真值,具体包括:
B1、使用m年的历史气溶胶浓度观测数据C计算观测时前后n天的气溶胶背景浓度
Figure FDA0004100762590000043
计算公式如下:
Figure FDA0004100762590000051
B2、使用历史气溶胶浓度观测数据集和气溶胶背景浓度计算气溶胶污染气象指数真值r,计算公式为:
Figure FDA0004100762590000052
其中q为倍数参数,选择1.1-4.0在内的预设实数;
所述模型构建模块中构建待优化的气溶胶污染气象指数时空深度神经网络模型具体包括:
C1,使用包括深度不少于5层的空间特征提取神经网络在获取的样本数据集中提取空间特征,所述特征提取网络包括各种残差网络和稠密网络;
C2、使用带有门控的循环神经网络将C1中提取的当前时刻t及之前的t-1个时刻的空间特征链接在一起,带有门控的循环神经网络在最后一个时刻的输出值为气溶胶污染气象指数估计值
Figure FDA0004100762590000053
所述模型训练模块在进行训练时,采用留出验证训练或者10折交叉验证训练对模型生成模块中生成的模型开展训练,训练目标为得到气溶胶污染气象指数真值r,以气溶胶污染气象指数估计值
Figure FDA0004100762590000054
和真值r的均方误差为代价函数L,s个训练样本上的代价函数公式为:
Figure FDA0004100762590000055
训练最终得到最优模型使得代价函数L最小;
所述气溶胶污染气象指数估算模块得到气溶胶污染气象指数估算值
Figure FDA0004100762590000056
所述气溶胶浓度估算模块在任一时间、任一网格上,使用倍数参数q、气溶胶污染气象指数估计值
Figure FDA0004100762590000057
和气溶胶背景浓度
Figure FDA0004100762590000058
估算气溶胶浓度估计值
Figure FDA0004100762590000059
估算公式为:
Figure FDA00041007625900000510
CN202210985139.0A 2022-08-17 2022-08-17 一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统 Active CN115345075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210985139.0A CN115345075B (zh) 2022-08-17 2022-08-17 一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210985139.0A CN115345075B (zh) 2022-08-17 2022-08-17 一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统

Publications (2)

Publication Number Publication Date
CN115345075A CN115345075A (zh) 2022-11-15
CN115345075B true CN115345075B (zh) 2023-04-18

Family

ID=83952928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210985139.0A Active CN115345075B (zh) 2022-08-17 2022-08-17 一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统

Country Status (1)

Country Link
CN (1) CN115345075B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110389087A (zh) * 2019-08-02 2019-10-29 中国科学院遥感与数字地球研究所 一种污染天气下的pm2.5浓度卫星遥感估算方法
CN110411919A (zh) * 2019-08-02 2019-11-05 中国科学院遥感与数字地球研究所 一种基于卫星多光谱技术的pm2.5浓度遥感估算方法
CN112905560A (zh) * 2021-02-02 2021-06-04 中国科学院地理科学与资源研究所 一种多源时空大数据深度融合的空气污染预测方法
WO2021208393A1 (zh) * 2020-04-15 2021-10-21 北京工业大学 一种大气污染物排放清单的反演估算方法
CN113901384A (zh) * 2021-09-24 2022-01-07 武汉大学 顾及全局空间自相关性和局部异质性的地面pm2.5浓度建模方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101327331B (zh) * 2008-07-11 2012-07-25 清华大学 一种控制气固相生物反应器尾气中有毒生物气溶胶的方法
CN103942439B (zh) * 2014-04-24 2017-05-17 中国科学院遥感与数字地球研究所 一种基于气象观测数据的可吸入颗粒物浓度估算方法
CN108009674A (zh) * 2017-11-27 2018-05-08 上海师范大学 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN109374488B (zh) * 2018-11-14 2021-06-29 国网安徽省电力有限公司电力科学研究院 用于分布式光伏电站雾霾天气能见度的预测方法
CN111340292B (zh) * 2020-02-26 2022-05-10 福州大学 一种基于聚类的集成神经网络pm2.5预测方法
CN112766549A (zh) * 2021-01-07 2021-05-07 清华大学 一种空气污染物浓度预报方法、装置及存储介质
CN114462837A (zh) * 2022-01-25 2022-05-10 济南市疾病预防控制中心 一种基于大数据的空气质量健康指数平台及其实现方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110389087A (zh) * 2019-08-02 2019-10-29 中国科学院遥感与数字地球研究所 一种污染天气下的pm2.5浓度卫星遥感估算方法
CN110411919A (zh) * 2019-08-02 2019-11-05 中国科学院遥感与数字地球研究所 一种基于卫星多光谱技术的pm2.5浓度遥感估算方法
WO2021208393A1 (zh) * 2020-04-15 2021-10-21 北京工业大学 一种大气污染物排放清单的反演估算方法
CN112905560A (zh) * 2021-02-02 2021-06-04 中国科学院地理科学与资源研究所 一种多源时空大数据深度融合的空气污染预测方法
CN113901384A (zh) * 2021-09-24 2022-01-07 武汉大学 顾及全局空间自相关性和局部异质性的地面pm2.5浓度建模方法

Also Published As

Publication number Publication date
CN115345075A (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
Brandt Simulation of the size distribution and erosivity of raindrops and throughfall drops
US7228235B2 (en) System and method for enhanced measure-correlate-predict for a wind farm location
CN110232471B (zh) 一种降水传感网节点布局优化方法及装置
CN111913156A (zh) 基于深度学习模型与特征联合的雷达辐射源个体识别方法
CN108896021B (zh) 基于航空摄影测量点云提取人工林林分结构参数的方法
CN110646867A (zh) 一种城市排水监测预警方法和系统
CN111680870B (zh) 目标运动轨迹质量综合评估方法
CN109472283B (zh) 一种基于多重增量回归树模型的危险天气预测方法和装置
CN114662344B (zh) 基于连续在线观测数据的大气污染溯源预测方法及系统
CN108152868A (zh) 利用闪电定位数据计算雷暴日天数的方法及装置
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
CN116609858A (zh) 一种基于可解释性XGBoost模型的热带气旋大气波导预测方法及系统
Latysh et al. Improved mapping of National Atmospheric Deposition Program wet-deposition in complex terrain using PRISM-gridded data sets
CN108491439B (zh) 一种基于历史数据统计特性的遥测缓变参数自动判读方法
CN109190640A (zh) 一种基于大数据的浮游生物的拦截式采集方法及采集系统
CN110968926B (zh) 一种基于改进背景误差协方差矩阵预测大气参数的方法
CN115345075B (zh) 一体化气溶胶污染气象指数-气溶胶浓度估算方法及系统
CN114066070A (zh) 基于人工智能和数值计算的天气预报方法
CN113935228A (zh) 一种基于机器学习的l波段粗糙海面辐射亮温模拟方法
CN117370813A (zh) 一种基于k线模式匹配算法的大气污染深度学习预测方法
CN115422782B (zh) 一种基于水文模型的洪水预报系统
CN116840447A (zh) 一种基于多传感器与神经网络的土壤紧实度检测方法
CN112632799B (zh) 输电线路设计风速取值方法及装置
CN113536657A (zh) 基于机器学习的海洋大气折射率预测方法
Carvalho Analysis of stationary periods during the Perdigao 2017 campaign

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant