CN113496310A

CN113496310A - 基于深度学习模型的大气污染物预测方法和系统

Info

Publication number: CN113496310A
Application number: CN202110667206.XA
Authority: CN
Inventors: 黄典; 闫增祥; 冯圣中
Original assignee: NATIONAL SUPERCOMPUTING CENTER IN SHENZHEN (SHENZHEN CLOUD COMPUTING CENTER)
Current assignee: NATIONAL SUPERCOMPUTING CENTER IN SHENZHEN (SHENZHEN CLOUD COMPUTING CENTER)
Priority date: 2021-06-16
Filing date: 2021-06-16
Publication date: 2021-10-12

Abstract

本发明提供一种基于深度学习模型的大气污染物预测方法，包括：将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据；利用GNN模型学习监测站点之间的空间交互性；将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM_2.5的时间依赖性；结合要预测的未来时刻k的特征因子，利用全连接网络完成对未来k时刻PM_2.5浓度的预测。本发明考虑环境监测站点的稀疏性和非欧式分布特性，结合GNN对空间交互关系的优势进行空间相关性建模预测；结合GRU对时间相关性的捕捉性能，融入注意力机制捕捉全局信息提高对时间相关性的建模预测能力；结合多源数据中的土地利用类型数据加强模型对空间相关性的捕获，从而提高模型预测的准确率。

Description

基于深度学习模型的大气污染物预测方法和系统

技术领域

本发明涉及大气污染物预测技术领域，尤其涉及一种基于深度学习模型的大气污染物预测方法和系统。

背景技术

大气污染对人类自身及其赖以生存的生态环境产生重大影响，其中，PM_2.5是雾霾的主要成分，危害人类健康，增加心脑血管和呼吸系统疾病的发病率和死亡率。大气污染物浓度的及时和准确预测有助于科学预防并有效减少污染事件造成的损失。

近年来，随着观测数据的急剧增长，传统的数值预报和统计学方法难以充分利用海量数据建模。可适应大数据分析的深度学习方法成为研究热点。早期的深度学习模型主要考虑数据的时间依赖性，采用循环神经网络(RNN)和长短时记忆网络(LSTM)对时间依赖关系建模，缺少对过去时刻关键信息的聚焦。

为捕获空间相关性，根据输入数据的结构特性，空间建模一般分为基于图像和基于图的方法。基于图像的方法，通常包含两类，一种是基于照片的方法估算大气污染物浓度，往往不涉及污染物浓度预测。卷积神经网络(CNN)是一种前馈神经网络，经常被用于处理网格数据拓扑，可以通过卷积挖掘不同网格特征之间的相关性，是提取图像相关特征的一种常用方法。Zhang等(2016)基于照片创建数据集采用CNN网络估算空气质量，证明了基于照片进行大气污染浓度分析的可行性。Chakma(2017)等利用CNN估算照片中PM_2.5浓度，采用微调CNN和基于CNN特征的随机森林两种迁移学习方法将图像分类，实验结果证明该方法对PM_2.5浓度分类有一定效果。Ma等(2018)基于CNN提出一种单幅图像混合的空气质量分类方法，基于图像去雾方法结合原来的RGB图像训练混合神经网络对PM_2.5进行分类。另一种基于图像方法的基本思想是将监测站的浓度插值到图像中，通过CNN网络来近似一个高度平滑的非线性函数，完成从观测数据到污染物预测的非线性映射过程。但监测站在城乡地区分布不均，CNN并不能区分图像上的城乡网格，对于非均匀分布的稀疏监测站点插值可能会产生误差，导致预测不准确。

相反，基于图的网络模型可以很自然的避开插值误差问题，图卷积神经网络(GCN)将监测站点的观测数据以及监测站点之间的关系转化成一个含有结构信息的图，并针对输入的图结构数据进行有效的空间相关性建模(Zhou等，2018)。Lin等(2018)建立一个无向图并通过利用单个城市内的领域信息来计算空间相似度。为了解决利用CNN可能会产生的插值误差问题，Yi等(2018)将图像分为几个区域并提出了一个空间变换分量，将来自相同区域的网格转换为一致的输入以模拟污染源。相比之下，基于图的方法会避免上述问题，它将浓度值作为图节点并将其原始分布保留在图结构中。Lin等(2018)提出了基于传感器的环境相似性构造图并使用图结构的扩散卷积模块来捕获空间依赖关系。Qi等(2019)使用混合深度学习模型构造了一个图，其中每个节点代表一个监测站，并设计了一个图卷积网络用来学习图序列之间的时空相关性。Wang等(2020)根据监测站的气象信息和地理信息构建了一个有向图，并开发了一种新的基于领域知识增强的模型PM_2.5-GNN，该模型能够捕捉空间交互性，对PM_2.5进行预测。

总的来说，当前大气污染深度学习预测方法，将大气污染物浓度和气象数据及简单的地理信息结合起来，考虑城市之间空间交互动态性及空间相关性建模，缺乏站点本身的复杂下垫面信息，未能有效利用多源数据；另外，在对污染物浓度时间依赖性的捕获上，现有的方法虽然一定程度上提取了历史数据的时间相关性特征，但忽略了过去不同时刻的特征状态对未来污染物浓度的影响。

发明内容

本发明基于多源时空数据，利用深度学习方法对大气污染物的时空相关性展开建模，增加土地利用数据以提升模型对空间相关性的捕获，考虑环境监测站点的稀疏性和非欧式分布特性以及大气污染物及其影响因子的非线性时空特征，结合图神经网络(GNN)对空间交互关系的建模优势和门控循环单元网络(GRU)对时间相关性的捕捉性能，融入注意力机制捕捉全局信息提高对时序信息的建模能力，提出了一种全新的深度学习模型(GNN-GRUA)模拟并预测大气污染物浓度。

本发明实施例提供一种基于深度学习模型的大气污染物预测方法，其特征在于，包括以下步骤：

步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据；

步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响；

步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM_2.5的时间依赖性；

步骤S4、结合要预测的未来时刻k的特征因子，利用全连接网络完成对未来k时刻PM_2.5浓度的预测。

在本发明提供的基于深度学习模型的大气污染物预测方法中，所述图结构数据包括节点属性和边属性，所述节点属性包括当前监测站点的气象因子和土地利用类型，所述边属性表示源监测站点对当前监测站点的污染物浓度影响，包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。

在本发明提供的基于深度学习模型的大气污染物预测方法中，在所述步骤S2中，GNN模型的公式表达如下：

其中，图结构G＝(V,E)，P、Q代表节点属性和边属性，在t时刻节点i的污染物浓度表示为

通过结合之前时间步的预测浓度

和当前的节点属性P_i ^t得到，附近节点对节点i的影响表示为

通过结合其连接节点的污染物浓度和自身边属性

得到，空间相关信息

通过汇总i节点所有相邻节点的影响得到。

在本发明提供的基于深度学习模型的大气污染物预测方法中，所述GRUA模型的公式表达如下：

其中，W_z,W_r,W_h,W，v均为可学习的权重矩阵，所述GRUA模型结合节点表示

及空间相关信息

作为输入信息

代表更新门，r_i ^t代表重置门，

代表当前时间步的记忆信息，

通过更新门

决定当前时间步记忆信息

和前一时间步

需要获取的信息，之后经过Attention模块，计算出加权输出向量s和最终记忆信息

最后通过一个全连接层Ω得到预测的PM_2.5浓度。

在本发明提供的基于深度学习模型的大气污染物预测方法中，5、在步骤S1之前，还包括：

步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM_2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。

根据本发明的另一方面，还提供一种基于深度学习模型的大气污染物预测系统，包括：

图结构数据生成单元，用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据；

GNN模型计算单元，用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响；

GRUA模型计算单元，用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM_2.5的时间依赖性；

预测单元，用于结合要预测的未来时刻k的特征因子，利用全连接网络完成对未来k时刻PM_2.5浓度的预测。

在本发明提供的基于深度学习模型的大气污染物预测系统中，所述图结构数据包括节点属性和边属性，所述节点属性包括当前监测站点的气象因子和土地利用类型，所述边属性表示源监测站点对当前监测站点的污染物浓度影响，包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。

在本发明提供的基于深度学习模型的大气污染物预测系统中，所述GNN模型的公式表达如下：

通过结合之前时间步的预测浓度

和当前的节点属性P_i ^t得到，附近节点对节点i的影响表示为

通过结合其连接节点的污染物浓度和自身边属性

得到，空间相关信息

通过汇总i节点所有相邻节点的影响得到。

在本发明提供的基于深度学习模型的大气污染物预测系统中，所述GRUA模型的公式表达如下：

及空间相关信息

作为输入信息

代表更新门，r_i ^t代表重置门，

代表当前时间步的记忆信息，

通过更新门

决定当前时间步记忆信息

和前一时间步

需要获取的信息，计算出加权输出向量s和最终记忆信息

最后通过一个全连接层Ω得到预测的PM_2.5浓度。

在本发明提供的基于深度学习模型的大气污染物预测系统中，还包括训练单元，用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM_2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。

实施本发明实施例，具有如下有益效果：本发明基于污染物、气象等多源时空数据，考虑环境监测站点的稀疏性和非欧式分布特性以及大气污染物与其影响因子的非线性时空特征，结合图神经网络(GNN)对空间交互关系的建模优势和门控循环单元网络(GRU)对时间相关性的捕捉性能，融入注意力机制(Attention)捕捉全局信息提高对时序信息的建模能力，提出了一种全新的深度学习模型(GNN-GRUA)模拟并预测大气污染物浓度，同时结合土地利用类型数据加强模型对空间相关性的捕获；经过在数据集上与其他模型方法的验证和对比，证明GNN-GRUA能有效提高大气污染物浓度预测的准确率并减小误报率，反映了本模型方法提取时空特征的有效性，提升了对污染物浓度的预测能力，同时也证明了土地利用类型数据对空间相关性捕获的裨益。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1所示是本发明一实施例提供的基于深度学习模型的大气污染物预测方法的流程图；

图2所示是本发明一实施例的有向图节点与边关系示意图；

图3所示是GRU模型的结构示意图；

图4所示是GRUA模型的结构示意图；

图5所示是各模型72小时预测平均绝对误差MAE、均方根误差RMSE对比(LU代表土地利用类型数据)；

图6所示是各模型72小时预测命中率POD对比；

图7所示是各模型不同预测时长均方根误差RMSE对比；

图8所示是各模型不同预测时长预测命中率POD对比。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1所示是本发明一实施例提供的基于深度学习模型的大气污染物预测方法的流程图；如图1所示，本发明提供的基于深度学习模型的大气污染物预测方法包括以下步骤：

步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据。

具体地，在本发明一实施例中，首先将基于监测站点的非结构化输入数据转化成含有结构信息的图结构。对于图结构中的节点而言，其数据特征的构建需要考虑当前监测站点的气象因子和土地利用类型等因子影响。气象因子包含降水、边界层高度、温度等，它们通过光照、动态或热力学效应影响的PM_2.5生成和垂直扩散。本发明以站点周边一定缓冲区内各土地利用类型的比例作为间接的影响因子。对于图结构中的边而言，通过创建有向边来刻画源监测站点对目标站点的污染物浓度影响。鉴于风上游方向的站点对下游站点污染物浓度有较大的影响这一观察，主要考虑风向、风速以及空间距离、海拔高度构建此有向边。如图2所示，灰色节点的污染物浓度受到周边监测站点污染物浓度的影响，假设灰色节点i为当前监测站点，白色节点j为一个源监测站点，那么源监测站点j对当前监测站点i的污染物影响程度可以通过公式(1)刻画出来。其中是源监测站点j的风速，d是节点j与i之间的距离，是风向与两个节点之间方向(源监测站点到当前监测站点)的夹角。值得注意的是，我们通过采用ReLU函数确保风向与两个节点之间的角度大于90°时，源监测站点对当前监测站点的影响为0。

此外，我们需要计算节点的相关性来建立邻接矩阵。两市周边的山区会阻碍PM_2.5污染物的输送，因此我们通过对邻接矩阵的权值进行约束。例如，我们设置城市之间距离阈值和海拔高度阈值为200km和1000m。也就是说，只有当两个城市之间的距离小于200km，两座城市之间的山脉小于1000m时，PM_2.5才能从一个城市传输到另一个城市。

因此，在本发明中，所述图结构数据包括节点属性和边属性，所述节点属性包括当前监测站点的气象因子和土地利用类型，所述边属性表示源监测站点对当前监测站点的污染物浓度影响，包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。

步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响。

具体地，在本发明一实施例中，基于信息迭代方法的GNN网络捕捉城市之间的空间交互性，即对每个城市节点而言，既要考虑附近城市PM_2.5浓度的输入量，也要考虑当前站点对外的输出量。GNN利用邻近信息和更新节点表示来捕获污染物水平传输。具体地，GNN模型的公式表达如下：

通过结合之前时间步的预测浓度

和当前的节点属性P_i ^t得到，附近节点对节点i的影响表示为

通过结合其连接节点的污染物浓度和自身边属性

得到，空间相关信息

通过汇总i节点所有相邻节点的影响得到。

步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM_2.5的时间依赖性。

具体地，在本发明一实施例中，监测站点采集的污染物数据是典型的时序数据，并且存在着年、季节、日等波动周期，因此对污染物浓度的建模不仅要考虑数据时间依赖性的特征，也要考虑每个时间点的时间信息。鉴于门控循环单元网络(GRU)在长期记忆性和梯度收敛等方面优于普通的RNN网络，使用GRU网络捕获数据的时间依赖性特征。如图3所示，在每一个时间步中，先将所有监测站点数据构建成一个图结构表达，然后对这个图结构表达使用GNN计算更新，以保证每一个监测站点都获取了附近站点对其的影响，最后将图结构中的所有节点特征输入到GRU单元中去计算。鉴于注意力机制在文本任务以及自然语言处理上具有适用性和有效性，拟引入注意力机制帮助模型更好地利用输入数据中的有效信息，聚焦关键信息，减缓信息冗余过载的压力，从而提高预测任务的效率和准确率，GRUA结构如图4所示。

进一步地，所述GRUA模型的公式表达如下：

及空间相关信息

作为输入信息

代表更新门，r_i ^t代表重置门，

代表当前时间步的记忆信息，

通过更新门

决定当前时间步记忆信息

和前一时间步

需要获取的信息，之后计算出加权输出向量s和最终记忆信息

最后通过一个全连接层Ω得到预测的PM_2.5浓度。

进一步地，在步骤S1之前，还包括：

PM_2.5受到气象、其他污染物、土地利用等特征因子的影响。气象数据有气压、风速、风向、温度、相对湿度、水汽压、降雨量、水平能见度、风力等17个气象要素的逐小时资料，土地利用类型有耕地、森林、不透水面等8种类型。为了提高预测的准确性，我们将这些领域知识作为节点和边的属性来建立我们的图，然后学习基于图的传输和扩散过程。在这之前，通过特征选择与预测目标相关关系较为显著的一些特征作为输入变量因子进行网络训练，从而降低输入特征的维度，剔除与预测目标相关性不高的特征因子，在一定程度上避免了过拟合的问题。

采用皮尔森(Pearson)相关性分析分析大气污染物与其他特征因子的相关性大小，通过计算相关系数来判断。相关系数计算公式如下：

其中，时间系列特征向量X＝(x₁,x₂,...,x_n)，另一时间序列特征向量Y＝(y₁,y₂,...,y_n)，n表示样本数量，当0＜r_(x,y)＜1时这两种特征向量呈正相关，当-1＜r_(x,y)＜0时这两种特征向量呈负相关。r_(x,y)的绝对值越靠近1则两个特征向量的相关性越高。

通过相关性分析从多种特征因子中选取与PM_2.5相关性较高的特征因子作为节点和边的特征作为输入数据进行模型训练和预测。

基于同一发明构思，本发明还公开了一种基于深度学习模型的大气污染物预测系统，包括：

预测单元，用于结合要预测的未来时刻k的特征因子，利用全连接网络完成对未来k时刻PM_2.5浓度的预测；

训练单元，用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM_2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。

具体地，在本发明一实施例中，所述图结构数据包括节点属性和边属性，所述节点属性包括当前监测站点的气象因子和土地利用类型，所述边属性表示源监测站点对当前监测站点的污染物浓度影响，包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。

具体地，在本发明一实施例中，所述GNN模型的公式表达如下：

通过结合之前时间步的预测浓度

和当前的节点属性P_i ^t得到，附近节点对节点i的影响表示为

通过结合其连接节点的污染物浓度和自身边属性

得到，空间相关信息

通过汇总i节点所有相邻节点的影响得到。

所述GRUA模型的公式表达如下：

及空间相关信息

作为输入信息

代表更新门，r_i ^t代表重置门，

代表当前时间步的记忆信息，

通过更新门

决定当前时间步记忆信息

和前一时间步

需要获取的信息，计算出加权输出向量s和最终记忆信息

最后通过一个全连接层Ω得到预测的PM_2.5浓度。

本发明经过实验与现有预测模型方法进行对比，证明可行，对比结果见附图5－8，实验结果概括如下：

(1)基于184个城市节点的研究区域，3小时预测任务中GNN-GRUA在各数据集上的预测命中率可达89％以上，均方根误差在各数据集上保持在6.5-15.2之间，误报率在8.1％以下，相比其他模型是最优的。在长时间预测任务中，GNN-GRUA的预测优势更明显，在72小时预测任务中，GNN-GRUA在数据集1上的预测命中率达到61.5％以上，比GNN提升约1％，均方根误差为19.94也是最优值，证明了本模型在长时间预测上可靠的时空特征提取和污染物浓度预测能力。

(2)基于291个城市节点的研究区域，在3小时预测任务中，GNN-GRUA在各数据集上的预测命中率达到87％以上，均方根误差在各数据集上保持在6.0-12.7之间，误报率在8.6％以下，各指标均优于原本未采用注意力机制的GNN模型，体现了注意力机制对于时间依赖性信息捕获的优越性。在72小时预测任务中，GNN-GRUA在数据集3上的预测命中率达到79.4％以上，并且采用土地利用类型及比例的GNN-GRUA模型预测命中率达到80％以上，相比GNN模型提升约2％，取得了较为可观的性能提升，说明土地利用类型数据对于PM2.5预测是有益的。

需要指出的是，上文对各种模块的描述中，分割成这些模块，是为了说明清楚。然而，在实际实施中，各种模块的界限可以是模糊的。例如，本文中的任意或所有功能性模块可以共享各种硬件和/或软件元件。又例如，本文中的任何和/或所有功能模块可以由共有的处理器执行软件指令来全部或部分实施。另外，由一个或多个处理器执行的各种软件子模块可以在各种软件模块间共享。相应地，除非明确要求，本发明的范围不受各种硬件和/或软件元件间强制性界限的限制。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。

虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种基于深度学习模型的大气污染物预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于深度学习模型的大气污染物预测方法，其特征在于，所述图结构数据包括节点属性和边属性，所述节点属性包括当前监测站点的气象因子和土地利用类型，所述边属性表示源监测站点对当前监测站点的污染物浓度影响，包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。

3.根据权利要求1所述的基于深度学习模型的大气污染物预测方法，其特征在于，在所述步骤S2中，GNN模型的公式表达如下：

通过结合之前时间步的预测浓度

和当前的节点属性P_i ^t得到，附近节点对节点i的影响表示为

通过结合其连接节点的污染物浓度和自身边属性

得到，空间相关信息

通过汇总i节点所有相邻节点的影响得到。

4.根据权利要求1所述的基于深度学习模型的大气污染物预测方法，其特征在于，所述GRUA模型的公式表达如下：

及空间相关信息

作为输入信息

代表更新门，

代表重置门，

代表当前时间步的记忆信息，

通过更新门

决定当前时间步记忆信息

和前一时间步

需要获取的信息，之后计算出加权输出向量s和最终记忆信息

最后通过一个全连接层Ω得到预测的PM_2.5浓度。

5.根据权利要求1所述的基于深度学习模型的大气污染物预测方法，其特征在于，在步骤S1之前，还包括：

6.一种基于深度学习模型的大气污染物预测系统，其特征在于，包括：

7.根据权利要求6所述的基于深度学习模型的大气污染物预测系统，其特征在于，所述图结构数据包括节点属性和边属性，所述节点属性包括当前监测站点的气象因子和土地利用类型，所述边属性表示源监测站点对当前监测站点的污染物浓度影响，包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。

8.根据权利要求6所述的基于深度学习模型的大气污染物预测系统，其特征在于，所述GNN模型的公式表达如下：