CN113516304A

CN113516304A - 基于时空图网络的区域污染物时空联合预测方法及装置

Info

Publication number: CN113516304A
Application number: CN202110725762.8A
Authority: CN
Inventors: 张波; 吴泽权
Original assignee: Shanghai Normal University
Current assignee: Shanghai Normal University
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2021-10-19
Anticipated expiration: 2041-06-29
Also published as: CN113516304B

Abstract

本发明涉及一种基于时空图网络的区域污染物时空联合预测方法及装置。其中，方法包括：步骤S1：以PM2.5作为预测的空气污染物，构建空气污染物浓度预测模型，其中，空气污染物浓度预测模型包括图注意力网络和改进LSTM网络；步骤S2：输入时空图序列数据至图注意力网络，获得各时刻污染物传播的空间关联；步骤S3：根据各时刻污染物传播的空间关联，使用向量拉伸拼接的方法，构造各时刻的隐向量z；步骤S3：将各时刻隐向量z作为改进LSTM网络的输入，得到预测结果，其中，改进LSTM网络中，内置有重置门，基于连续两个输入计算重置门的值，当重置门的值超限时，网络重置记忆。与现有技术相比，本发明具有提高预测准确性等优点。

Description

基于时空图网络的区域污染物时空联合预测方法及装置

技术领域

本发明涉及区域污染物浓度预测领域，尤其是涉及一种基于时空图网络的区域污染物时空联合预测方法及装置。

背景技术

近年来，随着工业化和城市化的发展，空气污染逐渐引起了各国的关注。根据世界卫生组织(WHO)的数据，全球有近十分之九的人正遭受日益严重的空气污染，空气污染会严重危害人们的健康和社会效率，提前预测空气污染物浓度对人们的出行计划和政府决策具有重要意义。然而，空气污染物的传播受到许多因素的影响，城市的空气污染物浓度不仅与上一时段的浓度相关，还受到相邻城市的污染物浓度影响。这种复杂的时空相关性使得空气污染物浓度预测成为了一个巨大的挑战。当前，随着传感器和监测站点日益增多，我们拥有了大量监测数据，这为我们提出并应用新型深度学习模型来预测空气污染物浓度提供了基础。

国内外许多学者都对空气污染物浓度预测进行了研究。传统方法通常利用对大气物理学和化学理论的知识来分析污染物的传播和扩散过程，然后建立回归方程来预测不同污染物的浓度。随着传感器收集的历史监测数据日益增多，研究人员开始使用统计学方法从历史数据中建立模型。但是，由于计算能力的限制，大多数模型无法充分利用海量的观测数据，限制了这些模型的预测精度。此外，传统方法也很少同时考虑空气污染物浓度的时间和空间相关性。近年来，深度学习在很多领域都展现了其强大的非线性建模能力，一些研究人员为了对空气污染物复杂的非线性空间依赖关系进行建模，提出了一些基于卷积神经网络(CNN)的模型。然而CNN是针对欧式空间下的网格数据(如图像和视频等)设计的，对于诸如地面监测站之类的自然设施等非欧式空间下的数据，使用CNN的卷积运算会影响数据本身的语义，不适合处理采集自非欧式空间下的空气污染物数据，因此基于CNN的模型存在瓶颈。

发明内容

本发明的目的就是为了提供一种基于时空图网络的区域污染物时空联合预测方法及装置，该方法能够实现对时空大数据的充分利用，并结合气象数据和时空辅助信息来挖掘污染物传播的复杂动态依赖关系，从而降低预测误差，提高预测准确率。

本发明的目的可以通过以下技术方案来实现：

一种基于时空图网络的区域污染物时空联合预测方法，包括：

步骤S1：以PM2.5作为预测的空气污染物，构建空气污染物浓度预测模型，其中，所述空气污染物浓度预测模型包括图注意力网络和改进LSTM网络，以时空图序列数据为输入，预测区域未来一段时间内的PM2.5浓度为输出；

步骤S2：输入时空图序列数据至图注意力网络，获得各时刻污染物传播的空间关联；

步骤S3：根据各时刻污染物传播的空间关联，使用向量拉伸拼接的方法，构造各时刻的隐向量z；

步骤S4：将各时刻隐向量z作为改进LSTM网络的输入，得到预测结果，其中，所述改进LSTM网络中，内置有重置门，基于连续两个输入计算重置门的值，当重置门的值超限时，网络重置记忆，输入时空图序列数据，得到未来一段时间目标站点的PM2.5浓度预测值，然后根据损失函数计算预测值和真实值之间的误差，利用梯度下降法进行多轮训练，最终确定预测模型参数和模型结构。

所述时空图序列数据的构建过程包括：

步骤A1：将预测区域内所有监测站点处的空气污染物数据、气象数据、时空属性视为图信号，建立节点特征向量；

步骤A2：计算所有监测站点间的距离和节点间特征向量相似度，在节点间距离小于200Km和相似度大于0.5的节点之间建立边，构建图网络；

步骤A3：将所有站点同一时刻采集的数据，按照步骤A1和A2建立节点和连边，构建为图结构，然后按照监测站点的采集时序，每个时刻建立一张图网络，最终将一段时间内的所有图网络构建为时空图序列数据。

所述空气污染物浓度预测模型具体以区域内多个监测站点的前72小时的时空图序列数据为输入，预测区域未来24小时的PM2.5浓度为输出。

所述改进LSTM网络的重置门具体为：

Z^r＝sigmoid(W_r*[Z^t,Z^t-1]+b_r

其中：Z^r为重置门，sigmoid为激活函数，W_r为权重矩阵，Z^t为当前时刻的输入，Z^t-1为上一时刻的输入，b_r为偏置项。

所述改进LSTM网络的状态更新过程具体包括：

步骤B1：判断重置门Z^r是否小于或等于设定阈值K，若为是，则执行步骤B2，反之则执行步骤B3；

步骤B2：根据下式计算状态向量：

C^t＝Z^r⊙C^t-1+(1-Z^r)Z^t

其中：C^t为当前时刻LSTM的状态向量，C^t-1为上一时刻的状态向量，步骤B3：根据下式计算状态向量：

C^t＝Z^f⊙C^t-1+Zⁱ⊙Z^t

其中：Z^f为遗忘门，Zⁱ为输入门，

步骤B4：确定改进LSTM网络的输出状态：

h^t＝Z^o⊙tanh(C^t)

其中：h^t为当前时刻LSTM的输出，Z^o为输出门。

一种基于时空图网络的区域污染物时空联合预测装置，包括处理器、存储器，以及存储于所述存储器并由处理器执行的程序，所述处理器执行所述程序时实现以下步骤：

步骤S4：将各时刻隐向量z作为改进LSTM网络的输入，得到预测结果，其中，所述改进LSTM网络中，内置有重置门，基于连续两个输入计算重置门的值，当重置门的值超限时，网络重置记忆。

与现有技术相比，本发明具有以下有益效果：

1)直接利用时空大数据来进行建模，充分考虑了空气污染物传播的空间和时间依赖关系，并未根据复杂的动力学和化学模型来建立数值预测模型。

2)能够处理非欧式分布下的空气污染物监测数据，并且利用自注意力机制，为不同的邻居站点分配不同的注意力系数，模拟污染物传播过程，挖掘空气污染物传播的时空依赖关系。

3)通过重置门，预测的准确度相比传统方法有较大提升，且对异常数据不敏感，效率较高。

附图说明

图1为本发明实施例的主要步骤流程示意图；

图2为本发明提出的构建时空图序列数据的方法示意图；

图3为本发明提出的空气污染物浓度预测模型结构示意图；

图4为本发明提出的改进的LSTM单元结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

首先对空气污染物浓度预测给出如下定义：

定义1空气污染物浓度预测：空气污染物浓度预测是指利用历史污染物浓数据、气象数据和其他辅助数据等建立模型预测未来一段时间内某类污染物浓度的值。这类预测通常涉及环境科学，气象科学和计算机科学，是一类具有学科交叉性质的研究。

定义2空气污染物浓度传统预测方法：非深度学习的空气污染物浓度预测方法和基于卷积神经网络(CNN)的预测方法统称为传统方法。

一种基于时空图网络的区域污染物时空联合预测方法，整体过程如图1所示，，该方法可以是通过计算机程序的形式由计算机系统实现，包括：

步骤S1：以PM2.5作为预测的空气污染物，构建空气污染物浓度预测模型，其中，空气污染物浓度预测模型包括图注意力网络和改进LSTM网络，以时空图序列数据为输入，预测区域未来一段时间内的PM2.5浓度为输出；

具体的，空气污染物浓度预测模型的构建过程如下：基于深度学习原理和GAT及LSTM神经网络的特点，以某一具体污染物为预测目标(如PM2.5或SO2等)，构建空气污染物浓度预测模型。模型以图注意力网络(GAT)为底层，提取污染物传播的空间关联。图注意力网络(GAT)引入了自注意力机制，计算图中每个节点的隐藏表示，并且可以为每个邻居分配不同的注意力分数，以识别更重要的邻居，进而更新节点的特征向量。改进的长短期记忆网络(LSTM)是一类专门处理时序数据样本的神经网络，通过增加一个门控单元，能够考虑输入污染物浓度骤增或骤降的情况，最终经过全连接网络的处理之后产生最终的预测结果。

步骤S4：将各时刻隐向量z作为改进LSTM网络的输入，得到预测结果，其中，改进LSTM网络中，内置有重置门，基于连续两个输入计算重置门的值，当重置门的值超限时，网络重置记忆。

其中，时空图序列数据的构建过程包括：

具体的，对数据集进行异常值和标准化处理，然后根据收集到的区域内所有监测站点的空气污染物数据，气象数据和站点的经纬度以及时间信息，构造时空图序列。首先，将上述数据作为图中节点的特征向量，其次，计算图中节点之间的欧式距离和节点之间的特征相似度，只有节点之间距离不超过200Km且相似度大于0.5的节点之间才认为有边存在。计算公式如下。

其中D(·)和r(·)表示节点s_i和节点s_j之间的距离和相似度；x和y表示对应站点的经度和维度；Cov(·)表示节点之间的协方差，σ(·)表示标准差。

经过本步骤处理之后，区域内多站点的历史空气污染物数据，气象数据和地理位置及时间数据被构造为时空图序列数据，最终形成的时空图序列数据如图二所示。

本实施例中，空气污染物浓度预测模型具体以区域内多个监测站点的前72小时的时空图序列数据为输入，预测区域未来24小时的PM2.5浓度为输出。

其中，节点的特征向量包含以下数据：空气污染物浓度数据：PM2.5浓度值、过去24小时PM2.5滑动平均值、PM10浓度值、过去24小时PM10滑动平均值、SO2浓度值、过去24小时SO2滑动平均值、NO2浓度值、过去24小时NO2滑动平均值、O3浓度值、过去24小时O3滑动平均值、CO浓度值、过去24小时CO滑动平均值；气象数据：风速、风向、湿度、气压、温度；时空间数据：站点经度，站点纬度，记录时间，年，月，星期，周次。

本发明使用的数据标准化方法为z-score方法，公式如下：

其中μ是数据集中对应属性的均值，σ是对应属性的标准差。经过处理之后，数据集中的属性都符合标准正态分布。

从海量数据中挖掘出来的时空图序列数据，整个数据集按照80％,20％和20％的比例划分为训练集，验证集和测试集。使用训练集中的数据来训练模型，验证集中的数据调整模型，测试集中的数据来评估模型。

本实施例中，改进LSTM网络的重置门具体为：

Z^r＝sigmoid(W_r*[Z^t,Z^t-1]+b_r

本实施例中，改进LSTM网络的状态更新过程具体包括：

步骤B2：根据下式计算状态向量：

C^t＝Z^r⊙C^t-1+(1-Z^r)Z^t

C^t＝Z^f⊙C^t-1+Zⁱ⊙Z^t

其中：Z^f为遗忘门，Zⁱ为输入门，

步骤B4：确定改进LSTM网络的输出状态：

h^t＝Z^o⊙tanh(C^t)

其中：h^t为当前时刻LSTM的输出，Z^o为输出门。

此外，在模型的训练和评估过程，需要合理设置模型的超参数。对于图注意力网络(GAT)设置为2层，第一层和第二层GAT网络处理后节点的特征向量都设置为10；对于长短期记忆网络(LSTM)设置为2层，隐藏神经元的数量设置为128，学习率设置为0.001-0.1之间，迭代轮次为200次。

训练预测模型过程中使用训练集中的时空图序列数据逐阶段训练模型。定义模型训练阶段的损失函数为均方根误差函数，采用反向传播算法，使得模型损失函数的值最小化，减少预测值与真实值之间的误差。均方根误差函数的公式如下：

其中：RMSE为均方根误差函数，y_i为污染物浓度的真实值，p_i为污染物浓度的预测值，n为预测序列的长度。

训练结束后，利用验证集中的数据调整模型超参数，直至模型最优。对于测试集，将其输入模型，得到预测结果，利用平均绝对误差、平方根误差和比较绝对百分数误差衡量模型的误差。计算公式如下：

其中P_i表示预测值，O_i表示实际值。n为测试集所含时空图的数量。若上述3个指标优于传统方法，说明模型满足预期，可以用于预测未来一定时间内的PM2.5浓度。

下面以一个具体案例进行介绍，在一些实施例中，对于图注意力神经网络的计算过程，可以用以下公式表示：

其中σ(·)表示激活函数，

是融合了邻居节点信息的新特征向量，W是权重矩阵，α_ij是注意力系数。α_ij的计算公式如下：

其中W是权重矩阵，h_i和h_j是两个相邻的节点，[·|·]表示连接运算；e_ij表示节点i和j之间的相关系数，LeakyReLU是一种非线性激活函数。

根据LSTM网络的结构，每个LSTM单元的计算公式如下所示：

z＝tanh(W_gh^(t-1)+U_gx^(t)+b_g)

zⁱ＝sigmoid(W_ih^(t-1)+U_ix^(t)+b_i)

z^f＝sigmoid(W_fh^(t-1)+U_fx^(t)+b_f)

z^o＝sigmoid(W_oh^(t-1)+U_ox^(t)+b_o)

Z^r＝sigmoid(W_r*[X^t,X^t-1]+b_r)

其中tanh是激活函数，σ是sigmod函数，⊙是矩阵的哈达玛积，W是相应的输出权重，U表示对应的输入权重，b_g等为偏移量。

对于图注意力网络(GAT)设置为2层，第一层和第二层GAT网络处理后节点的特征向量都设置为10；对于长短期记忆网络(LSTM)设置为2层，隐藏神经元的数量设置为128；学习率设置为0.001-0.1之间，迭代轮次为200次。

使用训练集中的时空图序列数据逐阶段训练模型。定义模型训练阶段的损失函数为均方根误差函数，采用反向传播算法，使得模型损失函数的值最小化，减少预测值与真实值之间的误差。均方根误差函数的公式如下：

其中y_i为PM2.5浓度的真实值，p_i为PM2.5浓度的预测值，n为预测序列的长度。

利用验证后的预测模型进行城市PM2.5预测。

综上所述，本发明所构建的基于图注意力网络(Graph Attention Network)和改进的长短期记忆网络(Improved Long Short-term Memory Network)的预测模型是建立在已存在的两种深度神经网络的研究之上，进行改进和组合的。利用这两种网络的优点，建立了一种可以预测未来一定时间内PM2.5浓度的模型。所使用的损失函数也是以往的研究中存在的，且被证明具有良好的评估结果准确性的作用。本发明针对现有预测方法的不足，充分利用各类时空大数据和已有的研究成果，提出了一种构建时空图序列的方法和一种混合预测模型。构建时空图序列的方法考虑了图节点之间的空间距离和特征相似度，既能够排除一些干扰邻居节点又能保留有效邻居。该模型以图注意力网络(GAT)为底层，能够为相邻节点分配不同的注意力系数来更新节点自身特征，从而提取污染物传播的非线性空间依赖；GAT网络的输出结果作为高层LSTM网络的输入，进而提取空气污染物数据的时间序列特征。改进的LSTM单元能够描述输入隐向量的变化程度，当输入数据发生剧烈变化时，能够及时重置记忆单元。实验结果表明，本发明和现有方法相比得到了更为具有精确的预测结果，因而具有实际的应用价值和前景。

Claims

1.一种基于时空图网络的区域污染物时空联合预测方法，其特征在于，包括：

2.根据权利要求1所述的一种基于时空图网络的区域污染物时空联合预测方法，其特征在于，所述时空图序列数据的构建过程包括：

步骤A1：将预测区域内所有监测站点处的空气污染物数据、气象数据、时空属性视为图信号，每个监测站点视为图网络的节点，建立节点特征向量；

3.根据权利要求1所述的一种基于时空图网络的区域污染物时空联合预测方法，其特征在于，所述空气污染物浓度预测模型具体以区域内多个监测站点的前72小时的时空图序列数据为输入，预测区域未来24小时的PM2.5浓度为输出。

4.根据权利要求1所述的一种基于时空图网络的区域污染物时空联合预测方法，其特征在于，所述改进LSTM网络的重置门具体为：

Z^r＝sigmoid(W_r*[Z^t，Z^t-1]+b_r

5.根据权利要求4所述的一种基于时空图网络的区域污染物时空联合预测方法，其特征在于，所述改进LSTM网络的状态更新过程具体包括：

步骤B2：根据下式计算状态向量：

C^t＝Z^r⊙C^t-1+(1-Z^r)Z^t

其中：C^t为当前时刻LSTM的状态向量，C^t-1为上一时刻的状态向量，

步骤B3：根据下式计算状态向量：

C^t＝Z^f⊙C^t-1+Zⁱ⊙Z^t

其中：Z^f为遗忘门，Zⁱ为输入门，

步骤B4：确定改进LSTM网络的输出状态：

h^t＝Z^o⊙tanh(C^t)

其中：h^t为当前时刻LSTM的输出，Z^o为输出门。

6.一种基于时空图网络的区域污染物时空联合预测装置，包括处理器、存储器，以及存储于所述存储器并由处理器执行的程序，其特征在于，所述处理器执行所述程序时实现以下步骤：

7.根据权利要求6所述的一种基于时空图网络的区域污染物时空联合预测装置，其特征在于，所述时空图序列数据的构建过程包括：

8.根据权利要求6所述的一种基于时空图网络的区域污染物时空联合预测装置，其特征在于，所述空气污染物浓度预测模型具体以区域内多个监测站点的前72小时的时空图序列数据为输入，预测区域未来24小时的PM2.5浓度为输出。

9.根据权利要求6所述的一种基于时空图网络的区域污染物时空联合预测装置，其特征在于，所述改进LSTM网络的重置门具体为：

Z^r＝sigmoid(W_r*[Z^t，Z^t-1]+b_r

10.根据权利要求9所述的一种基于时空图网络的区域污染物时空联合预测装置，其特征在于，所述改进LSTM网络的状态更新过程具体包括：

步骤B2：根据下式计算状态向量：

C^t＝Z^r⊙C^t-1+(1-Z^r)Z^t

其中：C^t为当前时刻LSTM的状态向量，C^t-1为上一时刻的状态向量，⊙为矩阵的哈达玛积，

步骤B3：根据下式计算状态向量：

C^t＝Z^f⊙C^t-1+Zⁱ⊙Z^t

其中：Z^f为遗忘门，Zⁱ为输入门，

步骤B4：确定改进LSTM网络的输出状态：

h^t＝Z^o⊙tanh(C^t)

其中：h^t为当前时刻LSTM的输出，Z^o为输出门。