CN113496310A - 基于深度学习模型的大气污染物预测方法和系统 - Google Patents
基于深度学习模型的大气污染物预测方法和系统 Download PDFInfo
- Publication number
- CN113496310A CN113496310A CN202110667206.XA CN202110667206A CN113496310A CN 113496310 A CN113496310 A CN 113496310A CN 202110667206 A CN202110667206 A CN 202110667206A CN 113496310 A CN113496310 A CN 113496310A
- Authority
- CN
- China
- Prior art keywords
- model
- node
- data
- concentration
- monitoring station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003344 environmental pollutant Substances 0.000 title claims abstract description 66
- 231100000719 pollutant Toxicity 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013136 deep learning model Methods 0.000 title claims abstract description 32
- 238000012544 monitoring process Methods 0.000 claims abstract description 92
- 238000000547 structure data Methods 0.000 claims abstract description 16
- 230000003993 interaction Effects 0.000 claims abstract description 11
- 230000015654 memory Effects 0.000 claims description 19
- 239000000356 contaminant Substances 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 238000010219 correlation analysis Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000001568 sexual effect Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 7
- 230000008901 benefit Effects 0.000 abstract description 6
- 238000013527 convolutional neural network Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于深度学习模型的大气污染物预测方法,包括:将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;利用GNN模型学习监测站点之间的空间交互性;将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。本发明考虑环境监测站点的稀疏性和非欧式分布特性,结合GNN对空间交互关系的优势进行空间相关性建模预测;结合GRU对时间相关性的捕捉性能,融入注意力机制捕捉全局信息提高对时间相关性的建模预测能力;结合多源数据中的土地利用类型数据加强模型对空间相关性的捕获,从而提高模型预测的准确率。
Description
技术领域
本发明涉及大气污染物预测技术领域,尤其涉及一种基于深度学习模型的大气污染物预测方法和系统。
背景技术
大气污染对人类自身及其赖以生存的生态环境产生重大影响,其中,PM2.5是雾霾的主要成分,危害人类健康,增加心脑血管和呼吸系统疾病的发病率和死亡率。大气污染物浓度的及时和准确预测有助于科学预防并有效减少污染事件造成的损失。
近年来,随着观测数据的急剧增长,传统的数值预报和统计学方法难以充分利用海量数据建模。可适应大数据分析的深度学习方法成为研究热点。早期的深度学习模型主要考虑数据的时间依赖性,采用循环神经网络(RNN)和长短时记忆网络(LSTM)对时间依赖关系建模,缺少对过去时刻关键信息的聚焦。
为捕获空间相关性,根据输入数据的结构特性,空间建模一般分为基于图像和基于图的方法。基于图像的方法,通常包含两类,一种是基于照片的方法估算大气污染物浓度,往往不涉及污染物浓度预测。卷积神经网络(CNN)是一种前馈神经网络,经常被用于处理网格数据拓扑,可以通过卷积挖掘不同网格特征之间的相关性,是提取图像相关特征的一种常用方法。Zhang等(2016)基于照片创建数据集采用CNN网络估算空气质量,证明了基于照片进行大气污染浓度分析的可行性。Chakma(2017)等利用CNN估算照片中PM2.5浓度,采用微调CNN和基于CNN特征的随机森林两种迁移学习方法将图像分类,实验结果证明该方法对PM2.5浓度分类有一定效果。Ma等(2018)基于CNN提出一种单幅图像混合的空气质量分类方法,基于图像去雾方法结合原来的RGB图像训练混合神经网络对PM2.5进行分类。另一种基于图像方法的基本思想是将监测站的浓度插值到图像中,通过CNN网络来近似一个高度平滑的非线性函数,完成从观测数据到污染物预测的非线性映射过程。但监测站在城乡地区分布不均,CNN并不能区分图像上的城乡网格,对于非均匀分布的稀疏监测站点插值可能会产生误差,导致预测不准确。
相反,基于图的网络模型可以很自然的避开插值误差问题,图卷积神经网络(GCN)将监测站点的观测数据以及监测站点之间的关系转化成一个含有结构信息的图,并针对输入的图结构数据进行有效的空间相关性建模(Zhou等,2018)。Lin等(2018)建立一个无向图并通过利用单个城市内的领域信息来计算空间相似度。为了解决利用CNN可能会产生的插值误差问题,Yi等(2018)将图像分为几个区域并提出了一个空间变换分量,将来自相同区域的网格转换为一致的输入以模拟污染源。相比之下,基于图的方法会避免上述问题,它将浓度值作为图节点并将其原始分布保留在图结构中。Lin等(2018)提出了基于传感器的环境相似性构造图并使用图结构的扩散卷积模块来捕获空间依赖关系。Qi等(2019)使用混合深度学习模型构造了一个图,其中每个节点代表一个监测站,并设计了一个图卷积网络用来学习图序列之间的时空相关性。Wang等(2020)根据监测站的气象信息和地理信息构建了一个有向图,并开发了一种新的基于领域知识增强的模型PM2.5-GNN,该模型能够捕捉空间交互性,对PM2.5进行预测。
总的来说,当前大气污染深度学习预测方法,将大气污染物浓度和气象数据及简单的地理信息结合起来,考虑城市之间空间交互动态性及空间相关性建模,缺乏站点本身的复杂下垫面信息,未能有效利用多源数据;另外,在对污染物浓度时间依赖性的捕获上,现有的方法虽然一定程度上提取了历史数据的时间相关性特征,但忽略了过去不同时刻的特征状态对未来污染物浓度的影响。
发明内容
本发明基于多源时空数据,利用深度学习方法对大气污染物的时空相关性展开建模,增加土地利用数据以提升模型对空间相关性的捕获,考虑环境监测站点的稀疏性和非欧式分布特性以及大气污染物及其影响因子的非线性时空特征,结合图神经网络(GNN)对空间交互关系的建模优势和门控循环单元网络(GRU)对时间相关性的捕捉性能,融入注意力机制捕捉全局信息提高对时序信息的建模能力,提出了一种全新的深度学习模型(GNN-GRUA)模拟并预测大气污染物浓度。
本发明实施例提供一种基于深度学习模型的大气污染物预测方法,其特征在于,包括以下步骤:
步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
步骤S4、结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
在本发明提供的基于深度学习模型的大气污染物预测方法中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
在本发明提供的基于深度学习模型的大气污染物预测方法中,在所述步骤S2中,GNN模型的公式表达如下:
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为通过结合之前时间步的预测浓度和当前的节点属性Pi t得到,附近节点对节点i的影响表示为通过结合其连接节点的污染物浓度和自身边属性得到,空间相关信息通过汇总i节点所有相邻节点的影响得到。
在本发明提供的基于深度学习模型的大气污染物预测方法中,所述GRUA模型的公式表达如下:
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示及空间相关信息作为输入信息代表更新门,ri t代表重置门,代表当前时间步的记忆信息,通过更新门决定当前时间步记忆信息和前一时间步需要获取的信息,之后经过Attention模块,计算出加权输出向量s和最终记忆信息最后通过一个全连接层Ω得到预测的PM2.5浓度。
在本发明提供的基于深度学习模型的大气污染物预测方法中,5、在步骤S1之前,还包括:
步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
根据本发明的另一方面,还提供一种基于深度学习模型的大气污染物预测系统,包括:
图结构数据生成单元,用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
GNN模型计算单元,用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
GRUA模型计算单元,用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
预测单元,用于结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
在本发明提供的基于深度学习模型的大气污染物预测系统中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
在本发明提供的基于深度学习模型的大气污染物预测系统中,所述GNN模型的公式表达如下:
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为通过结合之前时间步的预测浓度和当前的节点属性Pi t得到,附近节点对节点i的影响表示为通过结合其连接节点的污染物浓度和自身边属性得到,空间相关信息通过汇总i节点所有相邻节点的影响得到。
在本发明提供的基于深度学习模型的大气污染物预测系统中,所述GRUA模型的公式表达如下:
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示及空间相关信息作为输入信息代表更新门,ri t代表重置门,代表当前时间步的记忆信息,通过更新门决定当前时间步记忆信息和前一时间步需要获取的信息,计算出加权输出向量s和最终记忆信息最后通过一个全连接层Ω得到预测的PM2.5浓度。
在本发明提供的基于深度学习模型的大气污染物预测系统中,还包括训练单元,用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
实施本发明实施例,具有如下有益效果:本发明基于污染物、气象等多源时空数据,考虑环境监测站点的稀疏性和非欧式分布特性以及大气污染物与其影响因子的非线性时空特征,结合图神经网络(GNN)对空间交互关系的建模优势和门控循环单元网络(GRU)对时间相关性的捕捉性能,融入注意力机制(Attention)捕捉全局信息提高对时序信息的建模能力,提出了一种全新的深度学习模型(GNN-GRUA)模拟并预测大气污染物浓度,同时结合土地利用类型数据加强模型对空间相关性的捕获;经过在数据集上与其他模型方法的验证和对比,证明GNN-GRUA能有效提高大气污染物浓度预测的准确率并减小误报率,反映了本模型方法提取时空特征的有效性,提升了对污染物浓度的预测能力,同时也证明了土地利用类型数据对空间相关性捕获的裨益。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示是本发明一实施例提供的基于深度学习模型的大气污染物预测方法的流程图;
图2所示是本发明一实施例的有向图节点与边关系示意图;
图3所示是GRU模型的结构示意图;
图4所示是GRUA模型的结构示意图;
图5所示是各模型72小时预测平均绝对误差MAE、均方根误差RMSE对比(LU代表土地利用类型数据);
图6所示是各模型72小时预测命中率POD对比;
图7所示是各模型不同预测时长均方根误差RMSE对比;
图8所示是各模型不同预测时长预测命中率POD对比。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1所示是本发明一实施例提供的基于深度学习模型的大气污染物预测方法的流程图;如图1所示,本发明提供的基于深度学习模型的大气污染物预测方法包括以下步骤:
步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据。
具体地,在本发明一实施例中,首先将基于监测站点的非结构化输入数据转化成含有结构信息的图结构。对于图结构中的节点而言,其数据特征的构建需要考虑当前监测站点的气象因子和土地利用类型等因子影响。气象因子包含降水、边界层高度、温度等,它们通过光照、动态或热力学效应影响的PM2.5生成和垂直扩散。本发明以站点周边一定缓冲区内各土地利用类型的比例作为间接的影响因子。对于图结构中的边而言,通过创建有向边来刻画源监测站点对目标站点的污染物浓度影响。鉴于风上游方向的站点对下游站点污染物浓度有较大的影响这一观察,主要考虑风向、风速以及空间距离、海拔高度构建此有向边。如图2所示,灰色节点的污染物浓度受到周边监测站点污染物浓度的影响,假设灰色节点i为当前监测站点,白色节点j为一个源监测站点,那么源监测站点j对当前监测站点i的污染物影响程度可以通过公式(1)刻画出来。其中是源监测站点j的风速,d是节点j与i之间的距离,是风向与两个节点之间方向(源监测站点到当前监测站点)的夹角。值得注意的是,我们通过采用ReLU函数确保风向与两个节点之间的角度大于90°时,源监测站点对当前监测站点的影响为0。
此外,我们需要计算节点的相关性来建立邻接矩阵。两市周边的山区会阻碍PM2.5污染物的输送,因此我们通过对邻接矩阵的权值进行约束。例如,我们设置城市之间距离阈值和海拔高度阈值为200km和1000m。也就是说,只有当两个城市之间的距离小于200km,两座城市之间的山脉小于1000m时,PM2.5才能从一个城市传输到另一个城市。
因此,在本发明中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响。
具体地,在本发明一实施例中,基于信息迭代方法的GNN网络捕捉城市之间的空间交互性,即对每个城市节点而言,既要考虑附近城市PM2.5浓度的输入量,也要考虑当前站点对外的输出量。GNN利用邻近信息和更新节点表示来捕获污染物水平传输。具体地,GNN模型的公式表达如下:
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为通过结合之前时间步的预测浓度和当前的节点属性Pi t得到,附近节点对节点i的影响表示为通过结合其连接节点的污染物浓度和自身边属性得到,空间相关信息通过汇总i节点所有相邻节点的影响得到。
步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性。
具体地,在本发明一实施例中,监测站点采集的污染物数据是典型的时序数据,并且存在着年、季节、日等波动周期,因此对污染物浓度的建模不仅要考虑数据时间依赖性的特征,也要考虑每个时间点的时间信息。鉴于门控循环单元网络(GRU)在长期记忆性和梯度收敛等方面优于普通的RNN网络,使用GRU网络捕获数据的时间依赖性特征。如图3所示,在每一个时间步中,先将所有监测站点数据构建成一个图结构表达,然后对这个图结构表达使用GNN计算更新,以保证每一个监测站点都获取了附近站点对其的影响,最后将图结构中的所有节点特征输入到GRU单元中去计算。鉴于注意力机制在文本任务以及自然语言处理上具有适用性和有效性,拟引入注意力机制帮助模型更好地利用输入数据中的有效信息,聚焦关键信息,减缓信息冗余过载的压力,从而提高预测任务的效率和准确率,GRUA结构如图4所示。
进一步地,所述GRUA模型的公式表达如下:
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示及空间相关信息作为输入信息代表更新门,ri t代表重置门,代表当前时间步的记忆信息,通过更新门决定当前时间步记忆信息和前一时间步需要获取的信息,之后计算出加权输出向量s和最终记忆信息最后通过一个全连接层Ω得到预测的PM2.5浓度。
步骤S4、结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
进一步地,在步骤S1之前,还包括:
步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
PM2.5受到气象、其他污染物、土地利用等特征因子的影响。气象数据有气压、风速、风向、温度、相对湿度、水汽压、降雨量、水平能见度、风力等17个气象要素的逐小时资料,土地利用类型有耕地、森林、不透水面等8种类型。为了提高预测的准确性,我们将这些领域知识作为节点和边的属性来建立我们的图,然后学习基于图的传输和扩散过程。在这之前,通过特征选择与预测目标相关关系较为显著的一些特征作为输入变量因子进行网络训练,从而降低输入特征的维度,剔除与预测目标相关性不高的特征因子,在一定程度上避免了过拟合的问题。
采用皮尔森(Pearson)相关性分析分析大气污染物与其他特征因子的相关性大小,通过计算相关系数来判断。相关系数计算公式如下:
其中,时间系列特征向量X=(x1,x2,...,xn),另一时间序列特征向量Y=(y1,y2,...,yn),n表示样本数量,当0<r(x,y)<1时这两种特征向量呈正相关,当-1<r(x,y)<0时这两种特征向量呈负相关。r(x,y)的绝对值越靠近1则两个特征向量的相关性越高。
通过相关性分析从多种特征因子中选取与PM2.5相关性较高的特征因子作为节点和边的特征作为输入数据进行模型训练和预测。
基于同一发明构思,本发明还公开了一种基于深度学习模型的大气污染物预测系统,包括:
图结构数据生成单元,用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
GNN模型计算单元,用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
GRUA模型计算单元,用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
预测单元,用于结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测;
训练单元,用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
具体地,在本发明一实施例中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
具体地,在本发明一实施例中,所述GNN模型的公式表达如下:
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为通过结合之前时间步的预测浓度和当前的节点属性Pi t得到,附近节点对节点i的影响表示为通过结合其连接节点的污染物浓度和自身边属性得到,空间相关信息通过汇总i节点所有相邻节点的影响得到。
所述GRUA模型的公式表达如下:
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示及空间相关信息作为输入信息代表更新门,ri t代表重置门,代表当前时间步的记忆信息,通过更新门决定当前时间步记忆信息和前一时间步需要获取的信息,计算出加权输出向量s和最终记忆信息最后通过一个全连接层Ω得到预测的PM2.5浓度。
本发明经过实验与现有预测模型方法进行对比,证明可行,对比结果见附图5-8,实验结果概括如下:
(1)基于184个城市节点的研究区域,3小时预测任务中GNN-GRUA在各数据集上的预测命中率可达89%以上,均方根误差在各数据集上保持在6.5-15.2之间,误报率在8.1%以下,相比其他模型是最优的。在长时间预测任务中,GNN-GRUA的预测优势更明显,在72小时预测任务中,GNN-GRUA在数据集1上的预测命中率达到61.5%以上,比GNN提升约1%,均方根误差为19.94也是最优值,证明了本模型在长时间预测上可靠的时空特征提取和污染物浓度预测能力。
(2)基于291个城市节点的研究区域,在3小时预测任务中,GNN-GRUA在各数据集上的预测命中率达到87%以上,均方根误差在各数据集上保持在6.0-12.7之间,误报率在8.6%以下,各指标均优于原本未采用注意力机制的GNN模型,体现了注意力机制对于时间依赖性信息捕获的优越性。在72小时预测任务中,GNN-GRUA在数据集3上的预测命中率达到79.4%以上,并且采用土地利用类型及比例的GNN-GRUA模型预测命中率达到80%以上,相比GNN模型提升约2%,取得了较为可观的性能提升,说明土地利用类型数据对于PM2.5预测是有益的。
需要指出的是,上文对各种模块的描述中,分割成这些模块,是为了说明清楚。然而,在实际实施中,各种模块的界限可以是模糊的。例如,本文中的任意或所有功能性模块可以共享各种硬件和/或软件元件。又例如,本文中的任何和/或所有功能模块可以由共有的处理器执行软件指令来全部或部分实施。另外,由一个或多个处理器执行的各种软件子模块可以在各种软件模块间共享。相应地,除非明确要求,本发明的范围不受各种硬件和/或软件元件间强制性界限的限制。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种基于深度学习模型的大气污染物预测方法,其特征在于,包括以下步骤:
步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
步骤S4、结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
2.根据权利要求1所述的基于深度学习模型的大气污染物预测方法,其特征在于,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
5.根据权利要求1所述的基于深度学习模型的大气污染物预测方法,其特征在于,在步骤S1之前,还包括:
步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
6.一种基于深度学习模型的大气污染物预测系统,其特征在于,包括:
图结构数据生成单元,用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
GNN模型计算单元,用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
GRUA模型计算单元,用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
预测单元,用于结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
7.根据权利要求6所述的基于深度学习模型的大气污染物预测系统,其特征在于,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
10.根据权利要求6所述的基于深度学习模型的大气污染物预测系统,其特征在于,还包括训练单元,用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110667206.XA CN113496310A (zh) | 2021-06-16 | 2021-06-16 | 基于深度学习模型的大气污染物预测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110667206.XA CN113496310A (zh) | 2021-06-16 | 2021-06-16 | 基于深度学习模型的大气污染物预测方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113496310A true CN113496310A (zh) | 2021-10-12 |
Family
ID=77997537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110667206.XA Pending CN113496310A (zh) | 2021-06-16 | 2021-06-16 | 基于深度学习模型的大气污染物预测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113496310A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113971372A (zh) * | 2021-11-02 | 2022-01-25 | 浙江凌镜智能有限公司 | 基于神经网络的风速预测方法及装置 |
CN114137541A (zh) * | 2021-11-18 | 2022-03-04 | 国家超级计算深圳中心(深圳云计算中心) | 基于Transformer-IRB的短临降雨预测方法、装置和存储介质 |
CN114266200A (zh) * | 2022-02-24 | 2022-04-01 | 山东大学 | 二氧化氮浓度预测方法及系统 |
CN114548751A (zh) * | 2022-02-21 | 2022-05-27 | 山东大学 | 一种监管场景下的突发事件智能推演方法、系统、设备及存储介质 |
CN116739189A (zh) * | 2023-08-14 | 2023-09-12 | 中科三清科技有限公司 | 传输溯源方法、装置、存储介质及电子设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105493109A (zh) * | 2013-06-05 | 2016-04-13 | 微软技术许可有限责任公司 | 使用多个数据源的空气质量推断 |
US20180224415A1 (en) * | 2017-02-08 | 2018-08-09 | International Business Machines Corporation | Multi-Source Data Assimilation for Three-Dimensional Environmental Monitoring |
CN109147826A (zh) * | 2018-08-22 | 2019-01-04 | 平安科技(深圳)有限公司 | 音乐情感识别方法、装置、计算机设备及计算机存储介质 |
CN109816163A (zh) * | 2019-01-15 | 2019-05-28 | 深圳中兴网信科技有限公司 | 污染度预测方法、预测系统及计算机可读存储介质 |
CN109978228A (zh) * | 2019-01-31 | 2019-07-05 | 中南大学 | 一种pm2.5浓度预测方法、装置及介质 |
CN111210081A (zh) * | 2020-01-09 | 2020-05-29 | 中国人民解放军国防科技大学 | 一种基于Bi-GRU的PM2.5数据处理与预测方法 |
CN111242369A (zh) * | 2020-01-09 | 2020-06-05 | 中国人民解放军国防科技大学 | 基于多重融合卷积gru的pm2.5数据预测方法 |
CN111275168A (zh) * | 2020-01-17 | 2020-06-12 | 南京信息工程大学 | 基于卷积全连接的双向门控循环单元的空气质量预测方法 |
CN112085163A (zh) * | 2020-08-26 | 2020-12-15 | 哈尔滨工程大学 | 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法 |
CN112116080A (zh) * | 2020-09-24 | 2020-12-22 | 中国科学院沈阳计算技术研究所有限公司 | 一种融合了注意力机制的cnn-gru水质预测方法 |
CN113092684A (zh) * | 2021-04-07 | 2021-07-09 | 青岛理工大学 | 一种基于时空矩阵分解的空气质量推断方法 |
-
2021
- 2021-06-16 CN CN202110667206.XA patent/CN113496310A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105493109A (zh) * | 2013-06-05 | 2016-04-13 | 微软技术许可有限责任公司 | 使用多个数据源的空气质量推断 |
US20160125307A1 (en) * | 2013-06-05 | 2016-05-05 | Yu Zheng | Air quality inference using multiple data sources |
US20180224415A1 (en) * | 2017-02-08 | 2018-08-09 | International Business Machines Corporation | Multi-Source Data Assimilation for Three-Dimensional Environmental Monitoring |
CN109147826A (zh) * | 2018-08-22 | 2019-01-04 | 平安科技(深圳)有限公司 | 音乐情感识别方法、装置、计算机设备及计算机存储介质 |
CN109816163A (zh) * | 2019-01-15 | 2019-05-28 | 深圳中兴网信科技有限公司 | 污染度预测方法、预测系统及计算机可读存储介质 |
CN109978228A (zh) * | 2019-01-31 | 2019-07-05 | 中南大学 | 一种pm2.5浓度预测方法、装置及介质 |
CN111210081A (zh) * | 2020-01-09 | 2020-05-29 | 中国人民解放军国防科技大学 | 一种基于Bi-GRU的PM2.5数据处理与预测方法 |
CN111242369A (zh) * | 2020-01-09 | 2020-06-05 | 中国人民解放军国防科技大学 | 基于多重融合卷积gru的pm2.5数据预测方法 |
CN111275168A (zh) * | 2020-01-17 | 2020-06-12 | 南京信息工程大学 | 基于卷积全连接的双向门控循环单元的空气质量预测方法 |
CN112085163A (zh) * | 2020-08-26 | 2020-12-15 | 哈尔滨工程大学 | 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法 |
CN112116080A (zh) * | 2020-09-24 | 2020-12-22 | 中国科学院沈阳计算技术研究所有限公司 | 一种融合了注意力机制的cnn-gru水质预测方法 |
CN113092684A (zh) * | 2021-04-07 | 2021-07-09 | 青岛理工大学 | 一种基于时空矩阵分解的空气质量推断方法 |
Non-Patent Citations (5)
Title |
---|
HAOFEI XIE ET AL.: "Research of PM2.5 prediction system based on CNNs-GRU in Wuxi urban Area", IOP CONFERENCE SERIES: EARTH AND ENVIRONMENTAL SCIENCE, vol. 300, pages 207 * |
SHUO WANG ET AL.: "PM2.5-GNN:A domain knowledge enhanced graph neural network for PM2.5 forecasting", SIGSPATIAL\'20:PROCEEDINGS OF THE 28TH INTERNATIONAL CONFERENCE ON ADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS, pages 1 - 5 * |
赵鹏飞;魏宏安;: "基于深度学习的城市大气PM2.5浓度预测研究", 现代计算机, no. 12 * |
闫增祥: "基于多源时空数据的PM2.5浓度预测", 《中国优秀硕士学位论文全文数据库 工程科技I辑》, no. 08 * |
陈敏: "认知计算导论", 31 May 2017, 华中科技大学出版社 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113971372A (zh) * | 2021-11-02 | 2022-01-25 | 浙江凌镜智能有限公司 | 基于神经网络的风速预测方法及装置 |
CN114137541A (zh) * | 2021-11-18 | 2022-03-04 | 国家超级计算深圳中心(深圳云计算中心) | 基于Transformer-IRB的短临降雨预测方法、装置和存储介质 |
CN114548751A (zh) * | 2022-02-21 | 2022-05-27 | 山东大学 | 一种监管场景下的突发事件智能推演方法、系统、设备及存储介质 |
CN114548751B (zh) * | 2022-02-21 | 2024-05-31 | 山东大学 | 一种监管场景下的突发事件智能推演方法、系统、设备及存储介质 |
CN114266200A (zh) * | 2022-02-24 | 2022-04-01 | 山东大学 | 二氧化氮浓度预测方法及系统 |
CN114266200B (zh) * | 2022-02-24 | 2022-07-05 | 山东大学 | 二氧化氮浓度预测方法及系统 |
CN116739189A (zh) * | 2023-08-14 | 2023-09-12 | 中科三清科技有限公司 | 传输溯源方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210271934A1 (en) | Method and System for Predicting Wildfire Hazard and Spread at Multiple Time Scales | |
CN113496310A (zh) | 基于深度学习模型的大气污染物预测方法和系统 | |
CN111639787B (zh) | 一种基于图卷积网络的时空数据预测方法 | |
Ceci et al. | Predictive modeling of PV energy production: How to set up the learning task for a better prediction? | |
Zhang et al. | Correction model for rainfall forecasts using the LSTM with multiple meteorological factors | |
US11720727B2 (en) | Method and system for increasing the resolution of physical gridded data | |
CN114240000A (zh) | 一种基于时空图卷积网络的空气质量预测方法 | |
Zheng et al. | Weather image-based short-term dense wind speed forecast with a ConvLSTM-LSTM deep learning model | |
CN117556197B (zh) | 一种基于人工智能的台风涡旋初始化方法 | |
Ramseyer et al. | Atmospheric controls on Puerto Rico precipitation using artificial neural networks | |
CN116894384B (zh) | 一种多风机风速时空预测方法及系统 | |
Vakitbilir et al. | Hybrid deep learning models for multivariate forecasting of global horizontal irradiation | |
Shi et al. | SA-JSTN: Self-attention joint spatiotemporal network for temperature forecasting | |
CN118094487B (zh) | 基于时空感知机制的多源气象要素预测降水的方法及系统 | |
KR20220095092A (ko) | 인공 지능을 이용한 산불 취약성 지도 생성 방법 및 그 장치 | |
Nourani et al. | Multi-step-ahead solar irradiance modeling employing multi-frequency deep learning models and climatic data | |
CN109829583B (zh) | 基于概率编程技术的山火风险预测方法 | |
CN116722544A (zh) | 分布式光伏短期预测方法、装置、电子设备及存储介质 | |
Zhang et al. | A deep-learning real-time bias correction method for significant wave height forecasts in the Western North Pacific | |
Sahai et al. | A bias-correction and downscaling technique for operational extended range forecasts based on self organizing map | |
Dong et al. | Tropical cyclone track prediction with an encoding-to-forecasting deep learning model | |
Yang et al. | HiGRN: a hierarchical graph recurrent network for global sea surface temperature prediction | |
Kim et al. | Analysis of AI-based techniques for forecasting water level according to rainfall | |
Chen et al. | A Spatio-Temporal Attention Graph Convolutional Networks for Sea Surface Temperature Prediction | |
CN117233866A (zh) | 基于cnop的气象集合预报系统、方法与存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |