CN116341763B

CN116341763B - 一种空气质量预测方法

Info

Publication number: CN116341763B
Application number: CN202310581242.3A
Authority: CN
Inventors: 江永全; 石乾宏; 史鸿乐; 陈强; 姜涛; 杨燕; 范武波; 李媛
Original assignee: SICHUAN ACADEMY OF ENVIRONMENTAL SCIENCES; Southwest Jiaotong University
Current assignee: SICHUAN ACADEMY OF ENVIRONMENTAL SCIENCES; Southwest Jiaotong University
Priority date: 2023-05-23
Filing date: 2023-05-23
Publication date: 2023-07-28
Anticipated expiration: 2043-05-23
Also published as: CN116341763A

Abstract

本发明公开了一种空气质量预测方法，包括基于时空特征提取空气质量参数进行预测，属于数据挖掘技术领域。首先对数据集进行处理，其次构建了一种包含图卷积神经网络、长短期记忆网络以及时间卷积网络的时空子网络提取数据的空间特征和时间特征。最后，构建预测器融合抽取的时空特征实现最终的多任务空气质量预测。本发明可用于实际场景当中，它能够获取空气质量数据中的时空特性，同时该发明实现了多任务空气污染物浓度的预测，具有良好的普适性。

Description

一种空气质量预测方法

技术领域

本发明属于数据挖掘技术领域，尤其涉及一种基于时空特征提取的空气质量预测方法。

背景技术

随着工业化和城市化的快速发展，人们对空气质量的变化越来越重视，空气质量指数可以表示空气污染程度，要计算空气质量指数就要分别计算细颗粒物、可吸入颗粒物、二氧化硫、二氧化氮、臭氧、一氧化碳等各项污染物的实测浓度值。通过预测各项空气污染物的浓度从而预测出未来的空气质量，对严重污染事件发出预警，提前指定方案应对，对人类社会具有重要意义。近年来，空气质量预测模型经过了物理模型、数据驱动模型到深度学习模型的转变。特别地，循环卷积神经网络（recurrent neural network，RNN）以及它的变体模型：门控卷积网络（gate recurrent unit，GRU）和长短时记忆网络（long short-termmemory，LSTM），它们在捕获时间依赖性方面表现良好。卷积神经网络（convolutionalneural network，CNN）常被用于提取局部的特征去建模时空相关性，图卷积网络（graphconvolutional network，GCN）由于它强大的处理非欧几里得结构数据的能力，大幅度地提高了空气质量预测性能。但是，空气质量预测仍然存在着以下的问题：第一，基于目前现有的空气质量预测模型对数据的空间特征与时间特征提取不充分，使得预测效果不佳。第二，目前现有的模型往往是对单个任务例如未来细颗粒物浓度进行预测，很少考虑同时对多个任务例如二氧化硫、臭氧、可吸入颗粒物、一氧化碳等空气污染物浓度进行预测。因此，探索基于深度学习时空特征提取的多任务空气质量预测方法是十分有意义的。

1.时空特征提取

通过对现有的专利及相关技术的检索发现，现有的与空气质量预测时空特征提取相关的方法有：

（1）韩启龙,门瑞,陈睿等。一种基于多维度二次特征提取的多任务学习的空气质量预测方法:CN111814956A[P].2020. 提出一种基于多维度二次特征提取的多任务学习的空气质量预测方法。该方法从空间,时间和时空三个角度考虑与污染物值相关的影响信息，使信息相互影响，达到较为准确的空气质量预测；

（2）贾永坡,来博文,李毅仁,et al.一种基于相关图卷积网络的钢厂空气质量预测方法:CN114723127A[P].2022.提出了一种基于相关图卷积网络的钢厂空气质量预测方法。该模型通过单层感知器获得监测点之间的图关系；进一步地，通过学习历史时间步钢厂空气质量时空网络序列的图信号特征,对未来多个小时的空气质量指数进行预测；

目前的时空特征提取方法虽然实现了时间特征与空间特征的提取，但是并没有考虑到不同的监测站点构图以及时间特征二次提取对有效提高空气质量预测精度的必要性。

2.多任务学习

通过对现有的专利及相关技术的检索发现，现有的与多任务学习相关的空气质量预测方法有：

（1）王敬昌,陈岭,丁怡芳等。一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法:CN109063908A[P].2018.提出了能够预测空气质量的多任务预测模型，该模型将不同任务的损失函数相加后进行优化，实现了多任务预测；

但是，以上方法对于不同任务的损失函数只是简单相加，这会导致损失函数较大的任务例如臭氧、细颗粒物的预测占主导情况，而loss较小的任务例如一氧化碳、二氧化硫无法得到准确的更新。因此，我们对多任务损失函数进行了算法设计，提出了可学习的噪声参数使不同范围的数据都能够得到有效的更新。

发明内容

本发明的目的是提供一种空气质量预测方法，它能有效地解决地区无法实现准确的空气质量预测的技术问题。

实现本发明的技术路线如下：

1. 一种空气质量预测方法，基于时空特征提取空气质量参数，包括以下步骤：

步骤1、预处理空气质量数据，包括：

1.1数据采集：获取监测站点相关传感器数据中空气污染物二氧化硫、二氧化氮、一氧化碳、臭氧、细颗粒物、可吸入颗粒物浓度数据，以及采集包括传感器经纬度数据、气温、气压、风速、风向、湿度气象数据，得到原始空气质量数据集；

1.2针对原始空气质量数据中存在缺失值和异常值，采用线性插值方法填补、修正；

1.3对填补、修正后的空气质量数据集，采用零均值标准化方法进行归一化处理，计算公式为：

（1）

其中，x是某个时刻传感器的特征的数据，μ是对应特征样本数据的均值，σ是对应特征样本数据的标准差，z是标准化后的值；

1.4构建模型输入图数据：将空气质量监测站点的拓扑结构看成一张图G，图中节点为空气质量检测站点，用边将具有相关性的空气质量监测站点相连，图G便于模型在空气质量预测时对空间特征进行提取；以邻接矩阵的形式存储模型输入图G中监测站点间的相关性，邻接矩阵是一个N*N的二维矩阵，值为0或1；其中N代表监测站点数量，邻接矩阵的值中0表示两个站点不相关，1表示两个站点相关，这里邻接矩阵记为A；计算数据集中不同监测站点同一时刻浓度的相关系数r，若r>自定义值/>则代表监测站之间具有相关性，构建模型输入图/>的邻接矩阵/>；计算数据集中不同监测站点的物理距离d，若d<自定义值/>则代表监测站点之间具有相关性，构建模型输入图/>的邻接矩阵/>；

1.5构建模型输入序列数据：设p表示输入模型的历史时间步，将距离当前时刻t的前p个时间步的历史数据按照时间先后进行叠加，形成输入序列数据，在t时刻输入序列数据具体表示为：

（2）

（3）

（4）

其中，监测点数量为n，T表示矩阵转置，为监测站点j的序列数据，/>为i时刻的小时值，/>为i时刻所属月份，/>为i时刻二氧化硫浓度，/>为i时刻二氧化氮浓度，/>为i时刻一氧化碳浓度，/>为i时刻臭氧浓度，/>为i时刻PM2.5浓度，/>为i时刻PM10浓度，/>为i时刻气温，/>为i时刻气压，/>为i时刻湿度，/>为i时刻风向，为i时刻风速；

步骤2、设置最大训练次数为E；

步骤3、构建时空子网络：该时空子网络用于提取时间特征与空间特征，需要利用模型输入图卷积网络GCN与长短期记忆网络LSTM、时间卷积网络TCN构建时空子网络，并处理时空子网络时间与空间的关联性，具体过程包括：

3.1模型输入图卷积网络需要输入序列数据和邻接矩阵/>、邻接矩阵/>；将[，/>]与[/>，/>]输入到两个模型输入图卷积网络GCN提取数据的空间特征，层与层之间采用修正线性单元ReLU或其他激活函数作为激活函数：

（5）

（6）

其中，GCNConv表示模型输入图卷积块，表示第i个模型输入图卷积网络的第l层的隐藏特征，/>表示第i个模型输入图卷积网络的最后一层输出的隐藏特征，/>表示第i个模型输入图卷积网络的倒数第二层输出的隐藏特征，/>表示第i个邻接矩阵，i=1或2，L≥2；

3.2长短期记忆网络需要输入序列数据，使用长短期记忆网络LSTM初次提取数据的时间特征:

（7）

其中，表示长短期记忆网络输出的隐藏特征；

3.3时间卷积网络需要输入长短期记忆网络的输出，对数据的时间特征进行二次提取，每层由三个或其他数量的一维卷积块以及残差模块组成，它们的输出分别为、/>、/>、/>，卷积块之间采用修正线性单元ReLU或其他激活函数作为激活函数：

（8）

（9）

（10）

（11）

其中，、/>、/>为卷积核矩阵；/>、/>、/>为偏置；/>为卷积运算；

使用时间卷积网络TCN对数据的时间特征进行二次提取：

（12）

（13）

其中，表示时间卷积网络的第1层的隐藏特征表示，/>表示时间卷积网络最后一层输出的隐藏特征；/>表示时间卷积网络的倒数第二层输出的隐藏特征，L≥2；

步骤4、构建预测器：将模型输入图卷积网络根据输入的不同邻接矩阵得到的输出、/>中，目标监测站点j的隐藏特征/>、/>与LSTM-TCN混合模型二次特征提取得到的隐藏特征/>组合，作为预测器的输入，使用多层感知机MLP输出预测结果，即：

（14）

（15）

其中，表示第j个目标监测站点在时刻t的第k个空气任务的预测值，k为预测设置的总任务数；

步骤5、根据预测结果，采用均方根误差函数作为单个任务的损失函数：

（16）

（17）

其中，是目标监测站点j在时刻t的第一个任务真实值，M为预测值的总个数；表示第1个任务的损失值，/>表示第k个任务的损失值；/>表示第1个任务的可学习噪声参数，/>表示第k个任务的可学习噪声参数，将其放在分母是为了防止不确定性很高的一个或多个任务在计算损失函数时的权值中具有主导影响的情况；LOSS表示多任务的总损失值；常数项/>为自定义的较小值，避免LOSS公式中除0的问题；

步骤6、利用梯度下降方法不断更新模型参数；

步骤7、重复以上步骤3、4、5、6，直到训练次数等于E，最终输出训练好的基于深度学习时空特征提取的空气质量预测模型。

与现有技术相比，本发明的特征在于：

（1）该发明针对普通神经网络模型无法充分提取空气质量数据时空特征的问题，提出一种基于深度学习的时空特征提取的多任务空气质量预测方法，使用图卷积网络、长短期记忆网络和时间卷积网络充分提取数据的空间和时间特征，预测误差小，准确程度较高。（2）该发明将多任务学习引入空气质量预测领域，能够同时预测出未来多项污染物浓度值，节约训练成本。（3）该发明提出的框架，能够扩展到其他相关的城市时空数据领域，解决类似问题，具有普适性。

附图说明

图1为本发明的流程图，

图2为本发明的框架结构图。

实施方式

以下结合附图实施对本发明作进一步详细描述。

本发明的流程图和框架结构分别如图1、图2所示，即基于深度学习的时空特征提取的多任务空气质量预测模型。它主要分为三个部分：（i）数据输入，对数据集进行处理，分别基于监测站距离以及历史数据相关系数构图。（ii）时空子网络，该模块通过两个图卷积网络进行空间特征的充分提取，通过长短期记忆网络和时间卷积网络混合模型进行时间特征的充分提取。（iii）预测器，该模块主要由多层感知机构成，将时空子网络输出的三段隐藏特征组合，输入到多层感知机中，经过非线性映射，得到目标监测站某一时刻多个空气质量预测任务的预测结果。

实施例

1.一种空气质量预测方法，基于时空特征提取空气质量参数进行预测，包括以下步骤：

步骤1、预处理空气质量数据，包括：

（1）

（2）

（3）

（4）

步骤2、设置最大训练次数为E；

（5）

（6）

（7）

其中，表示长短期记忆网络输出的隐藏特征；

（8）

（9）

（10）

（11）

使用时间卷积网络TCN对数据的时间特征进行二次提取：

（12）

（13）

其中，表示时间卷积网络的第1层的隐藏特征表示，/>表示时间卷积网络最后一层输出的隐藏特征；/>表示时间卷积网络的倒数第二层输出的隐藏特征，L≥2；如图2所示，基于TCN空洞卷积的原理，TCN从第二层开始，在进行特征提取时，并非所有TCN块的隐藏特征信息都会传输到下一层；

（14）

（15）

（16）

（17）

其中，是目标监测站点j在时刻t的第一个任务真实值，M为预测值的总个数；表示第1个任务的损失值，/>表示第k个任务的损失值；/>表示第1个任务的可学习噪声参数，/>表示第k个任务的可学习噪声参数，k=1,2,3…k，将w放在分母是为了防止不确定性很高的一个或多个任务在计算损失函数时的权值中具有主导影响的情况；LOSS表示多任务的总损失值；常数项/>为自定义的较小值，避免LOSS公式中除0的问题；

步骤6、利用梯度下降方法不断更新模型参数；

Claims

1.一种空气质量预测方法，包括基于时空特征提取空气质量参数，其特征在于，包括以下步骤：

步骤1、预处理空气质量数据，包括：

（1）

（2）

（3）

（4）

其中，监测点数量为n，T表示矩阵转置，为监测站点j的序列数据，/>为i时刻的小时值，/>为i时刻所属月份，/>为i时刻二氧化硫浓度，/>为i时刻二氧化氮浓度，/>为i时刻一氧化碳浓度，/>为i时刻臭氧浓度，/>为i时刻PM2.5浓度，/>为i时刻PM10浓度，/>为i时刻气温，/>为i时刻气压，/>为i时刻湿度，/>为i时刻风向，/>为i时刻风速；

步骤2、设置最大训练次数为E；

3.1模型输入图卷积网络需要输入序列数据和邻接矩阵/>、邻接矩阵/>；将[/>，/>]与[/>，/>]输入到两个模型输入图卷积网络GCN提取数据的空间特征，层与层之间采用修正线性单元ReLU或其他激活函数作为激活函数：

（5）

（6）

（7）

其中，表示长短期记忆网络输出的隐藏特征；

3.3时间卷积网络需要输入长短期记忆网络的输出，对数据的时间特征进行二次提取，每层由三个或其他数量的一维卷积块以及残差模块组成，它们的输出分别为/>、/>、、/>，卷积块之间采用修正线性单元ReLU或其他激活函数作为激活函数：

（8）

（9）

（10）

（11）

使用时间卷积网络TCN对数据的时间特征进行二次提取：

（12）

（13）

（14）

（15）

（16）

（17）

其中，是目标监测站点j在时刻t的第一个任务真实值，M为预测值的总个数；/>表示第1个任务的损失值，/>表示第k个任务的损失值；/>表示第1个任务的可学习噪声参数，表示第k个任务的可学习噪声参数，k=1,2,3…k，将w放在分母是为了防止不确定性很高的一个或多个任务在计算损失函数时的权值中具有主导影响的情况；LOSS表示多任务的总损失值；常数项/>为自定义的较小值，避免LOSS公式中除0的问题；

步骤6、利用梯度下降方法不断更新模型参数；