CN115438848A - 基于深度混合图神经网络的pm2.5浓度长期预测方法 - Google Patents
基于深度混合图神经网络的pm2.5浓度长期预测方法 Download PDFInfo
- Publication number
- CN115438848A CN115438848A CN202211040459.5A CN202211040459A CN115438848A CN 115438848 A CN115438848 A CN 115438848A CN 202211040459 A CN202211040459 A CN 202211040459A CN 115438848 A CN115438848 A CN 115438848A
- Authority
- CN
- China
- Prior art keywords
- ground
- data
- gnn
- pollutant monitoring
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 39
- 230000007774 longterm Effects 0.000 title claims abstract description 36
- 239000003344 environmental pollutant Substances 0.000 claims abstract description 144
- 231100000719 pollutant Toxicity 0.000 claims abstract description 144
- 238000012544 monitoring process Methods 0.000 claims abstract description 108
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 19
- 239000000356 contaminant Substances 0.000 claims abstract description 9
- 238000011160 research Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000004088 simulation Methods 0.000 claims abstract description 4
- 230000005540 biological transmission Effects 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000000630 rising effect Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000002203 pretreatment Methods 0.000 claims description 2
- 239000002245 particle Substances 0.000 abstract description 8
- 230000009467 reduction Effects 0.000 abstract description 5
- 238000004949 mass spectrometry Methods 0.000 abstract 1
- 230000008859 change Effects 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000013618 particulate matter Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000000809 air pollutant Substances 0.000 description 1
- 231100001243 air pollutant Toxicity 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度混合图神经网络的PM2.5浓度长期预测方法,包括:收集研究区域内地面污染物监测站点包括PM2.5的污染物的时序数据、气象站点数据以及AOD数据,对获得的污染物时序数据进行预处理,并将气象站点数据和AOD数据与地面污染物监测站点进行匹配;构建地面污染物站点之间的关系图,并将风向和风速特征融入图中;根据图建立GNN图神经网络并在GNN图神经网络中添加LSTM层和全连接层从而构建用于预测PM2.5未来长时刻浓度的GNN‑LSTM模型;根据步骤1得到的数据对GNN‑LSTM模型进行训练、验证和测试,采用模拟精度符合要求的GNN‑LSTM模型对PM2.5进行预测。本发明充分聚合了邻域的空间信息,为LSTM提供可靠的空间特征,减缓了长期预测精度的降低速率,实现了可靠的长期预测。
Description
技术领域
本发明属于空气污染物预测的技术领域,具体涉及一种基于深度混合图神经网络的PM2.5浓度长期预测方法。
背景技术
PM2.5(空气动力学中直径小于或等于2.5μm的颗粒物)是造成雾霾的主要成因,对人体和生态环境有着较大的危害,特别是长期暴露于高浓度的PM2.5环境中,会引发心血管疾病,呼吸系统损伤等,也有研究表明PM2.5能够作为载体在空气中传播病毒。因此,准确预测PM2.5的长期规律能够有效降低暴露风险和减少疾病发病率,也能够为空气污染防治提供有效的技术支持。
现阶段对PM2.5未来浓度进行预测的主流方法主要分为两种:以机器学习为主要方式的统计模型和化学分析为代表的确定性方法。确定性方法基于数学模型、化学模型以及气象场等因素,建立起关于PM2.5浓度的扩散、沉降及化学反应,常见如WRF-CMAQ模型。确定性方法能够实现空间全覆盖的预测,但是数据获取困难,预测准确性较低,难以满足实时、准确的预测。统计模型通过多种数据之间的关系,分析和预测未来可能出现的情况,主要方法分为线性模型和机器学习模型。线性模型在预测过程中往往效果不佳,主要因为PM2.5浓度的变化趋势与其他因素之间并不是简单的线性关系,线性模型难以表达。后来,机器学习模型逐渐流行,在多个领域大放异彩,也被引入到PM2.5浓度预测的研究中,可以得到比线性模型更好的结果。深度神经网络是机器学习中的一个分支,近来发展迅速,逐渐被用于PM2.5未来浓度的预测。多个研究结果表明,深度神经网络模型的预测结果要更加优越。更深的网络层数和更高复杂度的网络结构能够更充分的逼近PM2.5与其他因素之间的高维非线性关系。
PM2.5浓度的变化受到了多个因素的影响,不仅过去时刻的浓度会对其造成影响,其他地区的污染物也会传输和扩散,通常是一种范围性的污染事件,覆盖了一定的空间范围。污染物的颗粒可以通过风力的作用在空间中传输和游走,影响别的地方的浓度水平。因此,空间信息在预测中愈发的重要,正确的聚合邻域的空间信息是目前提升预测预测结果准确性的重要手段。目前常用于提取空间信息的深度神经网络模型有一下几种,分别是卷积神经网络(CNN),图卷积神经网络(GCN)以及图神经网络(GNN)等,三种网络存在一定的区别和优劣。相比于CNN和GCN模型来说,GNN可以学习图中顶点和连边的消息传递,增强邻域信息的提取,能够模拟污染物粒子流动的物理特征。CNN的本质是对卷积核识别的特征进行加权求和,对未来时刻特征进行累计响应,但可能会陷在局部特征钟。GCN是一种特殊的卷积网络,其构建的图是无向图,无法输入连边属性,传递信息无法获得,存在一定的缺陷。CNN在处理空间离散点时带入了较多的冗余信息,这限制了对空间中地面污染物站点的空间信息的卷积能力。此外,CNN的感受野与卷积核的大小有关,而站点间的联系较为复杂,CNN 可能不能完整捕获其中的特征。
目前,PM2.5未来浓度预测还存在着一些挑战,相关的预测算法很难预测 12小时之后的变化趋势,预测结果不可靠。因此,如何准确预测未来较长时间的浓度并及时预警是目前需要研究的重点。
发明内容
本发明的目的在于针对现有技术的不足之处,提供一种基于深度混合图神经网络的PM2.5浓度长期预测方法,该方法充分聚合了邻域的空间信息,为 LSTM提供可靠的空间特征,减缓长期预测精度的降低速率,实现可靠的长期预测。
为解决上述技术问题,本发明采用如下技术方案:
一种基于深度混合图神经网络的PM2.5浓度长期预测方法,包括如下步骤:
步骤1:收集研究区域内地面污染物监测站点包括PM2.5的污染物的时序数据、气象站点数据以及AOD数据,对获得的污染物时序数据进行预处理,并将气象站点数据和AOD数据与地面污染物监测站点进行匹配;
步骤2:构建地面污染物站点之间的关系图,并将风向和风速特征融入图中;
步骤3:根据步骤2构建的图建立GNN图神经网络并在GNN图神经网络中添加LSTM层和全连接层从而构建用于预测PM2.5未来长时刻浓度的 GNN_LSTM模型,其中,GNN图神经网络提取图中地面污染物站点间的传输和空间信息,且将提取的空间信息与步骤1得到的数据作为LSTM层的输入;
步骤4:根据步骤1得到的数据对GNN_LSTM模型进行训练、验证和测试,采用模拟精度符合要求的GNN_LSTM模型对未来时刻的PM2.5进行预测。
进一步地,地面污染物监测站点还收集对PM2.5浓度变化造成影响的PM10、 CO、NO2、O3、SO2在对应时间的时序浓度数据。
进一步地,步骤1中预处理的方法为:将各污染物的浓度数据按照时间的先后顺序排列,选出存在连续缺失大于一定时刻的地面污染物监测站点,将未被选出的其余地面污染物监测站点使用线性插值补全,然后遍历补全后的地面污染物监测站点,并计算缺失大于一定时刻的地面污染物监测站点与其他补全后的地面污染物监测站点两两间的欧式距离,将距离最近的补全后的地面污染物监测站点的升高、降低的趋势赋予该站点,然后将缺失的部分进行线性插值补全,得到完整的时序数据。
进一步地,步骤1中将气象站点数据和AOD数据与地面污染物监测站点进行匹配的方法为:
地面污染物监测站点和地面气象站点通过地理学第一定律进行空间匹配,距离地面污染物站点最近的气象站点数据作为该地面污染物监测站点的气象数据;
AOD数据重采样后根据每个地面污染物监测站点的经纬度坐标进行空间上的匹配。
进一步地,步骤2构建图的方法为:
确定图的顶点和连边,具体地,顶点为研究的地面污染物监测站点,在确定连边之间先根据经纬度判断某个地面污染物监测站点与与其相邻的其他地面污染物监测站点之间的相对位置,并遍历每个地面污染物监测站点与其他地面污染物监测站点两两之间的欧氏距离,若计算的欧式距离小于设定的距离阈值,则两地面污染物监测站点之间则产生连边。
进一步地,在地面污染物监测站点之间产生连边后,构建邻接矩阵来表示地面污染物监测站点之间的关系,邻接矩阵为一个行和列数均等于站点的个数的n*n全0矩阵,遍历每个地面污染物站点与其他所有地面污染物监测站点之间的联系,如果该地面污染物监测站点符合产生连边的规则,则该位置的元素用1替换掉0,以此规则遍历每个地面污染物监测站点与其他地面污染物监测站点之间是否能够产生联系。
进一步地,步骤3还包括:
在参数传递过程中将风向和风速数据融入到GNN图神经网络中,判断不同地面污染物监测站点之间的距离和方向,给出其他相关地面污染物监测站点对目标地面污染物监测站点的影响贡献,并将其作为特征输入到GNN图神经网络中,从而提取出地面污染物监测站点之间的传输和空间信息;
将提取的地面污染物监测站点间的传输和空间信息以及步骤1得到的数据输入到LSTM层,全连接层接收和优化来自LSTM层的输出,并按照指定的维度输出。
进一步地,步骤4包括:
构建GNN_LSTM模型的三维的数据格式,该三维的数据格式包括输入参数种类、用于建模的地面污染物监测站点个数以及步骤1中得到的且按照时间先后顺序排列的地面污染物监测站点预处理后的污染物数据、气象数据以及 AOD数据;
将按照时间先后顺序排列的地面污染物监测站点预处理后的污染物数据、气象数据以及AOD数据,根据时间段划分为训练集、验证集和测试;
采用训练集训练GNN_LSTM模型,再将验证集输入到训练完成的 GNN_LSTM模型中验证训练后的GNN_LSTM模型;最后,将测试集输入到验证后的GGNN_LSTM模型中进行预测,通过将预测结果与测试集的实测数据进行对比,得到模型的精度。
进一步地,在训练GNN_LSTM模型的过程中引入包括但不限于Dropout、 L1L2正则化、提前停止的方法以防止过拟合的发生。
进一步地,步骤4中采用多种不同的评价指标评价GNN_LSTM模型预测结果的精度,包括拟合优度的确定系数R2、均方根误差RMSE以及平均绝对误差MAE。
与现有技术相比,本发明的有益效果为:
本发明将地面污染物监测站点通过一定的条件产生两边构建图数据,尽可能地模拟污染物粒子在空间中的传输机理,充分利用邻域的空间信息,这是基于空间信息在PM2.5未来浓度预测中占据着越来越重要的作用,但是空间信息也存在冗余和错误的情况,不正确的空间信息可能会抑制预测结果的准确性,因此本发明采用GNN模型更准确地描述站点与站点之间的相互联系,提供正确的邻域信息,LSTM模型在时序数据的预测中展现出良好的性能,将二者结合起来对区域内所有地面污染物站点的未来长期PM2.5浓度变化趋势进行预测,提升了PM2.5浓度长期预测结果的准确性,实现了更好的空间泛化预测;
本发明构建的GNN_LSTM模型能够充分聚合邻域的空间信息,为LSTM 提供可靠的空间特征,减缓长期预测精度的降低速率,实现可靠的长期预测。
附图说明
图1为本发明实施例PM2.5浓度长期预测方法的流程图;
图2为本发明实施例采用GNN-LSTM模型预测的示意图;
图3为本发明实施例五种模型对所有参与建模的地面污染物监测站点预测结果的R2对比图;
图4为本发明实施例五种模型的长期预测结果对比图。
具体实施方式
下面将结合本发明实施例对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
针对目前对PM2.5长期浓度预测结果可信度不足,模型的空间泛化性较差的问题。本发明将地面污染物监测站点通过一定的条件产生两边构建图数据,尽可能的模拟污染物粒子在空间中的传输机理,充分利用邻域的空间信息,采用更多的特征预测未来长期的变化趋势。空间信息在PM2.5未来浓度预测中占据着越来越重要的作用,但是空间信息也存在冗余和错误的情况,不正确的空间信息可能会抑制预测结果的准确性。GNN模型可以更好的描述站点与站点之间的相互联系,提供正确的邻域信息,LSTM模型在时序数据的预测中展现出良好的性能,将二者结合起来对区域内所有站点的未来长期PM2.5浓度变化趋势进行预测,能够表现出较好的性能。
为了实现对PM2.5浓度短期和长期的浓度预测,本发明实施例提供一种基于深度混合图神经网络的PM2.5浓度长期预测方法,如图1所示,包括如下步骤:
步骤1:收集研究区域内地面污染物站点包括PM2.5的污染物的时序数据、气象站点数据以及AOD数据,对获得的污染物时序数据进行预处理,并将气象站点数据和AOD数据与地面污染物站点进行空间匹配;
在该步骤中,收集研究区域内所有地面污染物监测站点的PM2.5浓度小时数据,按照时间的先后顺序排列,构成时序数据。由于地地面污染物监测站点的物理传感器无法避免的会出现错误的传输,停止工作等原因,造成数据的缺失,需要对其进行缺失值补全的操作。选出存在连续缺失大于500个时刻的地面污染物监测站点,将未被选出的其余地面污染物监测站点使用线性插值补全,然后遍历补全后的地面污染物监测站点,并计算缺失大于500个连续时刻的地面污染物监测站点与其他补全后的地面污染物监测站点间的欧式距离,选择距离最近的补全后的地面污染物监测站点对其进行辅助补全,因为距离越近,相关性越高,整个浓度变化规律越相似。将距离最近的补全后的地面污染物监测站点的升高、降低的趋势(连续6个时刻及以上时刻连续升高或降低)赋予该站点,然后将缺失的部分进行线性插值补全,得到完整的时序数据。
其他污染物会对PM2.5浓度变化造成很大的影响,比如PM10,NO2等,所以也需要收集对应时间其他污染物浓度的小时数据,包括五种:PM10、CO、 NO2、O3、SO2等,同样数据中会出现缺失值,需要以PM2.5相同的方式进行补全。
准备所选研究区内所有拥有气象数据的站点,气象数据能够很大程度的影响PM2.5浓度的变化规律,是预测模型的重要输入参数。本研究选择了美国国家海洋和大气局(NOAA)的地面站点的气象数据,包括温度(记作T)、露点温度 (记作DT)、风向(记作U)、风速(记作T),气象数据的时间分辨率为每小时,与 PM2.5浓度数据的时间分辨率相吻合。根据地理学第一定律(距离越近,相关性越高)的内容,将与地面污染物监测站点距离最近的NOAA气象站点的数据相匹配,作为该地面污染物监测站点的气象条件。
遥感AOD数据与PM2.5之间存在较大的相关性,常用于地表PM2.5浓度的估算和反演,作为预测PM2.5的输入参数目前还较少,因为存在较大的限制条件,连续24小时的AOD产品不多,且空间缺失较为严重,这严重的限制了其作为预测PM2.5未来时刻浓度的条件。MERRA-2是Earth data网站中具有连续小时级的全球AOD产品,与地面监测站点PM2.5的时间分辨率吻合;该产品的空间分辨率为0.5°*0.625°,空间分辨率较粗,而中国地面的污染物监测站点在东部地区呈现密集的特征,如果使用此空间分辨率与站点匹配,可能存在多个站点的AOD相同的情况,所以可能需要将其重采样。多次实验发现5km的栅格可以较好的分割地面站点,并且能够代表一个区域的污染程度,因此以此作为重采样的指标。
数据匹配:将地面污染物站点和NOAA的地面气象站点通过地理学第一定律进行空间匹配,并将距离污染物站点最近的气象站点作为该站点的气象条件。AOD数据重采样值5km后根据每个站点的经纬度坐标进行空间上的匹配。
步骤2:构建地面污染物监测站点之间的关系图,并将风向和风速特征融入图中;
由于PM2.5污染是一种区域性的污染,会覆盖一定的范围,而且细颗粒会因为风力的作用向别的区域传播,形成一种由点到面的情况,所以需要在地面污染物监测站点之间建立相互联系,形成点与点之间的结构关系图,以模拟 PM2.5粒子传输的物理过程。
在数学定义中,图是由顶点(Vertex)以及连接顶点的边(Edge)构成,顶点表示研究的对象,边表示两个对象之间的特定关系。图可以表示为顶点和边的集合记为G=(V,E),其中V为顶点的集合,E是边的集合,其中一条连接顶点vi, vj的边记为(vi,vj)或者ei,j。
确定图的顶点和连边:顶点为各地面污染物监测站点,在确定连边前需要判断不同地面污染物监测站点的相对方向,某个地面污染物监测站点与其相邻的其他地面污染物监测站点的相对位置,需要通过经纬度来判断。现假设,定义不同地面污染物监测站点之间的相对位置的表达式为loci(lat,lon),lat为纬度差值,lon为经度差值,i为地面污染物监测站点。根据中心点(遍历所有站点,每个站点在确定其邻近站点时都是中心点)与其他地面污染物监测站点之间的经纬度差值的正负情况判断相对位置。然后,用每个地面污染物监测站点的经纬度计算其与不同地面污染物监测站点两两之间的欧式距离,如果计算的欧式距离小于设定的距离阈值,那么两站点之间就产生连边,连边表示两个站点之间的PM2.5会相互传输和影响,距离是以km为单位。
在地面污染物监测站点之间产生连边后需要构建一个邻接矩阵来表示站点之间的关系。本实施例构建的邻接矩阵是一个行和列数等于站点的个数的n*n 全0矩阵,遍历每个站点与其他所有站点,如果站点符合产生连边的规则,则该位置的元素用1替换掉0(表示有连边),以此规则遍历每个站点与其他站点之间是否能够产生联系,从而形成地面污染物监测站点之间的关系图。图建立之后需要将风向和风速特征融入图中。
步骤3:根据步骤2构建的图建立GNN图神经网络并在GNN图神经网络中添加LSTM层和全连接层从而构建用于预测PM2.5未来长时刻浓度的 GNN_LSTM模型,其中,GNN图神经网络提取图中地面污染物站点间的传输和空间信息,且将提取的空间信息与步骤1得到的数据作为LSTM层的输入;
GNN图神经网络包含了顶点、连边、风向以及风速特征(每个地面污染物监测站点对应最近位置的气象站点数据),在参数传递过程中把风向和风速数据融入到GNN图神经网络中,判断不同站点之间的距离和方向,给出每个连边对目标地面污染物站点的影响贡献,并将其作为特征输入到GNN图神经网络中,从而提取出地面污染物监测站点之间的传输和空间信息。其中,GNN图神经网络的激活函数采用线性整流函数ReLU(),优化函数采用RMSpro(),损失函数为Mse_loss()。
由于GNN图神经网络主要用于对地面污染物监测站点间的传输和空间信息进行提取,其无法获取时间序列上的特征,也就无法预测PM2.5的未来时刻浓度,所以需要在GNN图神经网络中添加一个可以实现时序预测LSTM层,把步骤1得到的数据作为输入参数与从图中获取的空间信息均输入到LSTM层中用于预测,最后添加一个全连接层用于接收和优化来自LSTM层的输出,并按照指定的维度输出。
步骤4:根据步骤1得到的数据对GNN_LSTM模型进行训练、验证和测试,采用模拟精度符合要求的GNN_LSTM模型对未来时刻的PM2.5进行预测。
本发明预期达到训练GNN_LSTM模型可以预测图中所有站点,基于此要求,需要构建一个三维的数据格式,该三维的数据格式具体包括输入参数的种类、用于建模的地面污染物站点个数以及步骤1中得到的且按照时间先后顺序排列的地面污染物站点预处理后的污染物数据、气象数据以及AOD数据;
将按照时间先后顺序排列的地面污染物站点预处理后的污染物数据、气象数据以及AOD数据,根据时间段划分为训练集、验证集和测试;
采用训练集训练GNN_LSTM模型,再将验证集输入到训练完成的 GNN_LSTM模型中验证训练后的GNN_LSTM模型;最后,将测试集输入到验证后的GNN_LSTM模型中进行预测,通过将预测结果需要与测试集的实测数据进行对比,得到模型的精度。
在GNN_LSTM模型训练过程中会出现过拟合现象,过拟合的情况在神经网络模型中是一种常见现象,具体表现为模型的训练损失越来越小,而验证损失在一定的迭代次数后验证损失反而增加。为了预防这种情况,GNN_LSTM模型在训练过程中引入了一些预防的方法,比如Dropout、L1、L2正则化、早停等。提前停止可以简单有效的防止过拟合情况的发生,得到更加客观的预测结果。
采用测试集对验证后的GNN-LSTM模型的精度进行平均,需要将 GNN_LSTM模型的预测结果与测试集的实测数据进行对比,对比结果需要科学的指标进行量化,本发明采用3中不同的评价指标评价模型预测结果的准确性,分别是拟合优度的确定系数R2,用于评价预测结果与实测数据的拟合程度;均方根误差RMSE用于评价预测值与真实值偏差的平方与观测次数n比值的平方根,能够很好的反应出估算结果的精确性;平均绝对误差MAE用于准确反映实际估算误差,避免了两组数据误差抵消;不同的评价指标所针对的细节不同,可以更加客观的评价准确性。
为了说明本发明的有效性,下面以实际站点的数据测试该GNN-LSTM模型的预测性能。具体地,国家建立污染物地面监测站点已有较长时间(2013-至今),有大量的历史数据可以用于对深度学习模型的训练,这是检验本发明预测性能的关键。为此,收集2016.1.1-2020.9.30期间京津冀及其周边主要城市共 140个地面检测站点的数据进行验证和说明。
1、实施目标
以实现区域内所有参与建图的地面污染物监测站点PM2.5未来浓度的同时预测,以及长期浓度的可信预测。领域的空间信息加入可以有些小降低长期预测结果准确性降低的幅度,提升峰值和谷值的预测准确性。
2、数据选择
本实例使用的数据包括MERRA-2AOD数据、气象站点数据、污染物站点数据等三种类型数据,分别对应来自于Earth data、https://gmao.gsfc.nasa.gov/reanalysis/MERRA-2)、NOAA (www.noaa.gov//weather),中国环保部(http://datacenter.mep.gov.cn),时间跨度为 2016.1.1-2020.9.30,时间分辨率均为小时。污染物数据包括6种主要污染物,分别是PM10、PM2.5、SO2、NO2、CO、O3,气象参数包括4种对PM2.5浓度影响较大的种类,分别是T、DT、U、V。污染物数据会出现较多的缺失值,挑选出存在连续缺失大于500个时刻的站点,将其余站点使用线性插值补全,然后遍历补全后的站点,并计算欧式距离,选择距离最近的站点对其进行辅助补全,因为距离越近,相关性越高,整个浓度变化规律越相似。然后根据这一规律匹配每个污染物站点最近的气象站点,作为该站点的气象条件。AOD数据是栅格数据,根据每个污染物站点的经纬度坐标进行空间匹配。
3、实施过程
A、数据类型和数据集的划分
1)收集2016年-2020年京津冀及其周边主要城市共140个地面监测站点的PM2.5浓度时序数据以及对应时间段内的其他5种污染物数据和地面站点的气象要素数据(4种)。MERRA-2AOD数据也作为一种可以表示范围污染程度的指标放入到模型预测中;
2)划每种输入参数都是按照时间的先后顺序排序,因此可以按照时间来划分不同的数据集。将2016.1.1-2018.12.31划分为训练集,2019.1.1-2019.12.31划分为验证集,2020.1.1-2020.9.30划分为测试集。训练集共有3年的时间,能够让模型充分获得时序上的特征;验证集用于验证模型训练过程中的性能以及实现早停防止过拟合的功能;测试集共6000多个连续时刻的数据,峰值和谷值较多,变化特征明显,可以更好的测试模型的性能。
B、GNN_LSTM模型对所有站点短期和长期未来浓度的预测结果
1)图与GNN_LSTM模型的构建过程如流程图1所示;
2)GNN_LSTM模型可以实现未来多个时间步的预测,分别以T+n的形式表示预测的时间长度。T+1时刻就是对未来1小时的浓度进行预测,T+6时刻就是用T和T时刻之前(等于时间步长)的数据预测未来6小时的浓度,以此类推,T+12、T+24、T+48以及T+72时刻使用T和T时刻之前的数据来预测未来12、24、48以及72小时的PM2.5浓度,具体预测流程如图2所示;
将图中所有顶点都训练一个相同的模型去预测未来的浓度变化情况,得到的预测结果与实测的数据进行对比,采用三种评价指标对模型的性能进行综合评价。
4、结果评价
为了实现参与建图的所有站点的同时预测,设计了一个三维的数据格式,分别储存每种训练参数的时序列数据、站点的个数以及训练参数的种类。在模型训练过程中可以对所有站点进行训练并同时预测每个站点未来时刻的PM2.5 浓度。防止神经网络模型训练和测试过程中的不确定性,每个模型都训练和预测10次,求10次的平均作为该模型的预测表现。
从图3中可以看出,Data1数据集的140个站点T+1时刻预测结果的R2在 0.7到1之间上下波动,多数站点的R2在0.8以上,准确性较好。Data2数据集的R2波动情况更加稳定且大多数站点都在0.9以上。总的来说,Data2数据集的预测准确性总体上高于Data1,输入参数对供暖期高浓度的特征更加敏感。 LSTM,GC_LSTM以及GNN_LSTM等3个模型的稳定性相对来说更好,在 MLP和GRU模型中有着较大降低幅度的站点上依旧能够很好的预测。从两个数据集的5个模型叠加在一起之后的图中可以看出MLP模型的性能最差, GC_LSTM与GNN_LSTM两个模型最好,这表明邻域信息对预测结果的提升效果在不同数据集上也同样适用,在空间上有更好的泛化性能。
随着预测时长的增加,预测结果的准确性也随之不断降低,如图4所示。从T+6时刻开始,GNN_LSTM模型的优势慢慢开始突显,MLP,LSTM,GRU 三个无法获取站点之间邻域信息的模型结果恶化速度更快,GC_LSTM模型虽然能够获得站点之间的空间信息,但是该信息却没有给与较大的提升,与其他 3个模型的预测结果很相近。T+48和T+72时刻的GNN_LSTM模型几乎在每个站点上都要优于其他4个模型,这说明本研究的建图方式以及对图中顶点和连边信息的提取能够丰富LSTM预测未来浓度的特征,提升了长期预测结果的准确性。即使在未来48小时和72小时,GNN_LSTM在一些站点上的R2依旧可以达到0.8以上,结果可行性较好,所有站点的R2均值分别为0.77(T+47)和 0.699(T+72),可信度较高。
本发明提出的GNN_LSTM模型能够更好的获取邻域的空间信息,模拟污染物在区域内传输的物理机理,进一步提升预测的准确性。在5种模型的对比结果中可知,GNN_LSTM模型有着最准确的长期预测结果和最好的空间泛化性。相比于GC_LSTM模型来说,可以获得连边的信息作为额外特征,结果有着较大的改进。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
Claims (10)
1.一种基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,包括如下步骤:
步骤1:收集研究区域内地面污染物监测站点包括PM2.5的污染物的时序数据、气象站点数据以及AOD数据,对获得的污染物时序数据进行预处理,并将气象站点数据和AOD数据与地面污染物监测站点进行匹配;
步骤2:构建地面污染物站点之间的关系图,并将风向和风速特征融入图中;
步骤3:根据步骤2构建的图建立GNN图神经网络并在GNN图神经网络中添加LSTM层和全连接层从而构建用于预测PM2.5未来长时刻浓度的GNN_LSTM模型,其中,GNN图神经网络提取图中地面污染物站点间的传输和空间信息,且将提取的空间信息与步骤1得到的数据作为LSTM层的输入;
步骤4:根据步骤1得到的数据对GNN_LSTM模型进行训练、验证和测试,采用模拟精度符合要求的GNN_LSTM模型对未来时刻的PM2.5进行预测。
2.根据权利要求1所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,地面污染物监测站点还收集对PM2.5浓度变化造成影响的PM10、CO、NO2、O3、SO2在对应时间的时序浓度数据。
3.根据权利要求1所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,步骤1中预处理的方法为:将各污染物的浓度数据按照时间的先后顺序排列,选出存在连续缺失大于一定时刻的地面污染物监测站点,将未被选出的其余地面污染物监测站点使用线性插值补全,然后遍历补全后的地面污染物监测站点,并计算缺失大于一定时刻的地面污染物监测站点与其他补全后的地面污染物监测站点两两间的欧式距离,将距离最近的补全后的地面污染物监测站点的升高、降低的趋势赋予该站点,然后将缺失的部分进行线性插值补全,得到完整的时序数据。
4.根据权利要求1所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,步骤1中将气象站点数据和AOD数据与地面污染物监测站点进行匹配的方法为:
将地面污染物监测站点和地面气象站点通过地理学第一定律进行空间匹配,并将距离地面污染物站点最近的气象站点数据作为该地面污染物监测站点的气象数据;
AOD数据重采样后根据每个地面污染物监测站点的经纬度坐标进行空间上的匹配。
5.根据权利要求1所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,步骤2构建图的方法为:
确定图的顶点和连边,具体地,顶点为研究的地面污染物监测站点,在确定连边之间先根据经纬度判断某个地面污染物监测站点与与其相邻的其他地面污染物监测站点之间的相对位置,并遍历每个地面污染物监测站点与其他地面污染物监测站点两两之间的欧氏距离,若计算的欧式距离小于设定的距离阈值,则两地面污染物监测站点之间则产生连边。
6.根据权利要求5所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,在地面污染物监测站点之间产生连边后,构建邻接矩阵来表示地面污染物监测站点之间的关系,邻接矩阵为一个行和列数均等于站点的个数的n*n全0矩阵,遍历每个地面污染物站点与其他所有地面污染物监测站点之间的联系,如果该地面污染物监测站点符合产生连边的规则,则该位置的元素用1替换掉0,以此规则遍历每个地面污染物监测站点与其他地面污染物监测站点之间是否能够产生联系。
7.根据权利要求1所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,步骤3还包括:
在参数传递过程中将风向和风速数据融入到GNN图神经网络中,判断不同地面污染物监测站点之间的距离和方向,给出其他相关地面污染物监测站点对目标地面污染物监测站点的影响贡献,并将其作为特征输入到GNN图神经网络中,从而提取出地面污染物监测站点之间的传输和空间信息;
将提取的地面污染物监测站点间的传输和空间信息以及步骤1得到的数据输入到LSTM层,全连接层接收和优化来自LSTM层的输出,并按照指定的维度输出。
8.根据权利要求1所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,步骤4包括:
构建GNN_LSTM模型的三维的数据格式,该三维的数据格式包括输入参数种类、用于建模的地面污染物监测站点个数以及步骤1中得到的且按照时间先后顺序排列的地面污染物监测站点预处理后的污染物数据、气象数据以及AOD数据;
将按照时间先后顺序排列的地面污染物监测站点预处理后的污染物数据、气象数据以及AOD数据,根据时间段划分为训练集、验证集和测试;
采用训练集训练GNN_LSTM模型,再将验证集输入到训练完成的GNN_LSTM模型中验证训练后的GNN_LSTM模型;最后,将测试集输入到验证后的GNN_LSTM模型中进行预测,通过将预测结果与测试集的实测数据进行对比,得到模型的精度。
9.根据权利要求8所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,在训练GNN_LSTM模型的过程中引入包括但不限于Dropout、L1、L2正则化、提前停止的方法以防止过拟合的发生。
10.根据权利要求8所述的基于深度混合图神经网络的PM2.5浓度长期预测方法,其特征在于,步骤4中采用多种不同的评价指标评价GNN_LSTM模型模型预测结果的精度,包括拟合优度的确定系数R2、均方根误差RMSE以及平均绝对误差MAE。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211040459.5A CN115438848A (zh) | 2022-08-29 | 2022-08-29 | 基于深度混合图神经网络的pm2.5浓度长期预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211040459.5A CN115438848A (zh) | 2022-08-29 | 2022-08-29 | 基于深度混合图神经网络的pm2.5浓度长期预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115438848A true CN115438848A (zh) | 2022-12-06 |
Family
ID=84244082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211040459.5A Pending CN115438848A (zh) | 2022-08-29 | 2022-08-29 | 基于深度混合图神经网络的pm2.5浓度长期预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115438848A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115792137A (zh) * | 2023-01-17 | 2023-03-14 | 河北先河环保科技股份有限公司 | 大气污染溯源方法及装置、终端 |
CN116008481A (zh) * | 2023-01-05 | 2023-04-25 | 山东理工大学 | 基于大范围地面监测站点的空气污染物监测方法、装置 |
CN116739189A (zh) * | 2023-08-14 | 2023-09-12 | 中科三清科技有限公司 | 传输溯源方法、装置、存储介质及电子设备 |
CN117093832A (zh) * | 2023-10-18 | 2023-11-21 | 山东公用环保集团检测运营有限公司 | 一种用于空气质量数据缺失的数据插补方法及系统 |
CN117592619A (zh) * | 2023-12-18 | 2024-02-23 | 中国科学院空天信息创新研究院 | 一种基于gnn-lstm的县域冬小麦估产分析方法和系统 |
-
2022
- 2022-08-29 CN CN202211040459.5A patent/CN115438848A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116008481A (zh) * | 2023-01-05 | 2023-04-25 | 山东理工大学 | 基于大范围地面监测站点的空气污染物监测方法、装置 |
CN115792137A (zh) * | 2023-01-17 | 2023-03-14 | 河北先河环保科技股份有限公司 | 大气污染溯源方法及装置、终端 |
CN116739189A (zh) * | 2023-08-14 | 2023-09-12 | 中科三清科技有限公司 | 传输溯源方法、装置、存储介质及电子设备 |
CN117093832A (zh) * | 2023-10-18 | 2023-11-21 | 山东公用环保集团检测运营有限公司 | 一种用于空气质量数据缺失的数据插补方法及系统 |
CN117093832B (zh) * | 2023-10-18 | 2024-01-26 | 山东公用环保集团检测运营有限公司 | 一种用于空气质量数据缺失的数据插补方法及系统 |
CN117592619A (zh) * | 2023-12-18 | 2024-02-23 | 中国科学院空天信息创新研究院 | 一种基于gnn-lstm的县域冬小麦估产分析方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115438848A (zh) | 基于深度混合图神经网络的pm2.5浓度长期预测方法 | |
CN112905560B (zh) | 一种多源时空大数据深度融合的空气污染预测方法 | |
CN113919448B (zh) | 一种任意时空位置二氧化碳浓度预测影响因素分析方法 | |
CN106650825B (zh) | 一种机动车尾气排放数据融合系统 | |
CN112884079A (zh) | 一种基于Stacking集成模型的近地面二氧化氮浓度估算方法 | |
Pitt et al. | Assessing London CO 2, CH 4 and CO emissions using aircraft measurements and dispersion modelling | |
Ma et al. | Statistical spatial-temporal modeling of ambient ozone exposure for environmental epidemiology studies: A review | |
CN113011455B (zh) | 一种空气质量预测svm模型构建方法 | |
CN114578457B (zh) | 一种基于进化集成学习的大气污染物浓度时空预测方法 | |
Yu et al. | Deep learning-based downscaling of tropospheric nitrogen dioxide using ground-level and satellite observations | |
CN110533239A (zh) | 一种智慧城市空气品质高精度测量方法 | |
Uddin et al. | Performance assessment of spatial interpolation methods for the estimation of atmospheric carbon dioxide in the wider geographic extent | |
Wang et al. | Estimation of observation errors for large-scale atmospheric inversion of CO2 emissions from fossil fuel combustion | |
CN105243503A (zh) | 基于空间变量和logistic回归的海岸带生态安全评估方法 | |
Akinosho et al. | A scalable deep learning system for monitoring and forecasting pollutant concentration levels on UK highways | |
Li et al. | Improving air quality assessment using physics-inspired deep graph learning | |
CN117219183A (zh) | 多云雨地区的高覆盖度近地面no2浓度估算方法及系统 | |
Solaiman | Uncertainty estimation of extreme precipitations under climate change: A non-parametric approach | |
CN117521873A (zh) | 基于综合数据处理和随机森林的pm2.5反演方法及系统 | |
CN116297062B (zh) | 一种面向多维时空因子的pm2.5浓度精细化时空模拟与定量分析方法 | |
Li et al. | Physics-informed deep learning to reduce the bias in joint prediction of nitrogen oxides | |
Velásquez et al. | Automatic calibration methodology using machine learning with low-cost and meteorological sensors | |
CN116429648B (zh) | 改进的时空LightGBM的地表PM10估算方法 | |
CN117744849A (zh) | 基于混合深度神经网络的pm2.5浓度预测方法、系统及设备 | |
CN117589646B (zh) | 大气细颗粒物浓度监测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |