CN116485015A

CN116485015A - 一种基于Conv-LSTM-RA网络的空气质量指数预测方法

Info

Publication number: CN116485015A
Application number: CN202310354751.2A
Authority: CN
Inventors: 于永涛; 李银银; 姜涛; 卢伟彬; 顾涵竹; 黄龙; 吴庆国; 王蓉蓉
Original assignee: Huaiyin Institute of Technology
Current assignee: Huaiyin Institute of Technology
Priority date: 2023-04-04
Filing date: 2023-04-04
Publication date: 2023-07-25

Abstract

本专利公开了一种基于Conv‑LSTM‑RA网络的空气质量指数预测方法，首先，对获取到的历史空气质量数据进行预处理；其次，利用卷积神经网络（CNN）中的一维卷积结构（Conv1D）进行特征提取，并在卷积神经网络中加入残差模块，以获取更多的特征信息；然后，使用长短期记忆（LSTM）在时间维度上根据设定的窗口进行未来空气质量指数的预测；最后，在LSTM中使用注意力机制，利用注意力机制学习输入序列的权重分布，得出最终预测结果。与现有的单一网络模型相比，本发明提出的混合模型方法能够更加有效的预测数据，提高预测模型的准确率。

Description

一种基于Conv-LSTM-RA网络的空气质量指数预测方法

技术领域

本发明属于空气质量预测技术领域，特别涉及一种基于Conv-LSTM-RA网络的空气质量指数预测方法。

背景技术

近年来，我国科技和经济水平处于高速发展的时期，在人民生活质量显著提高的同时，环境污染问题也越发严重。其中，空气污染作为环境污染的主要方面之一，受到人们的广泛关注。

空气质量指数(AQI,Air Quality Index)是定量描述空气质量状况的无量纲指数，根据环境空气质量标准和PM10、PM2.5、CO、SO₂、NO₂、O₃等污染物对人体健康、生态、环境的影响，将常规监测的空气污染物浓度简化成为单一的概念性指数值形式，来表示空气污染程度和空气质量状况的分级指数。我国各地环保局实时发布的空气质量指数相关数值，是环境监测的重要指标。基于AQI指数实施日常监测和评价空气质量，定量描述空气质量状况，对生产生活具有指导意义。AQI指数为制定环境保护政策和污染防治措施提供决策依据，从而达到改善环境、促进人们身体健康的最终目的。因此，对空气质量指数准确、高效、全面的预测是十分重要的。

王鑫等使用LSTM(long short term memory network)循环神经网络对故障时间序列进行预测，这种方法并未充分提取相关的特征信息；Shi等人提出了ConvLSTM(Conventional LSTM)网络对降雨量的预测，王海瑶等人提出了CNN-AGU的空气质量指数预测方法，但是上述技术方案都没有解决卷积神经网络中的退化问题。

发明内容

发明目的：针对传统的一些神经网络模型只是简单的堆放LSTM或者CNN，不能全面地反映空气质量的复杂特性，本发明提出了一种基于Conv-LSTM-RA网络的空气质量指数预测方法，在长短期记忆中加入卷积神经网络、残差网络和注意力机制，利用CNN中的降维操作和残差网络提取更多的与空气质量相关的特征信息，并使用注意力机制来捕捉不同时刻的重要信息。

技术方案：本发明提出了一种基于Conv-LSTM-RA网络的空气质量指数预测方法，具体步骤如下：

步骤1：对已获取到的历史数据集命名为AirQuality，对其进行预处理，得到处理之后的数据集，将其命名为Pro_AirQuality，所述历史数据集包括PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数；

步骤2：搭建CNN卷积神经网络，并在卷积神经网络中加入残差网络，利用一维卷积结构和残差模块提取更多的与空气质量相关的特征；

步骤3：在搭建好的CNN和残差网络之后使用长短期记忆LSTM在时间维度上根据设定的窗口进行未来空气质量指数的预测；

步骤4：在步骤3搭建的Conv-LSTM网络中加入注意力机制RA，搭建Conv-LSTM-RA网络，对不同时间段的数据赋予不同的权重，学习输入序列中的权重分布，输出特征H_k；

步骤5：利用搭建好的Conv-LSTM-RA网络对数据集进行训练并在测试集上进行验证，实现对空气质量指数(AQI)的预测。

进一步地，所述步骤1数据预处理的具体步骤为：

(1.1)将已获取到的历史数据集AirQuality定义为：AirQuality＝[x¹,x²,x³,…,x^t,…,xⁿ]^T，共n条数据，其中x^t＝[x₁ ^t,x₂ ^t,…,x₁₀ ^t]表示第t个小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数；

J_k表示第t+1小时到第t+k小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数；

(1.2)进行数据清洗，使用线性插值的方法填充数据集中的空值，用one-hot编码方式对wd列转换为数据类型；

(1.3)使用Z-score方法对步骤(1.2)中处理好的数据进行归一化处理，将处理之后的数据集定以为Pro_AirQuality；；

(1.4)构造训练集和测试集，将步骤(1.3)获得的数据集Pro_AirQuality中数据打乱随机划分，设置70％的训练集和30％的测试集，其中训练集为tr，测试集为te。

进一步地，所述步骤2的具体步骤为：

(2.1)搭建CNN卷积神经网络，将第t+1小时到第t+k小时的数据J_k进行一维卷积计算和最大池化计算，提取与空气质量相关的特征M_k；

(2.2)在步骤(2.1)中的CNN网络中加入残差网络，在CNN的输入和输出之间直接引入一条通路，实现跳跃连接，消除卷积神经网络的退化问题，提取更多的特征信息M_k+J_k。

进一步地，所述步骤3中在搭建好的CNN和残差网络之后加入LSTM的具体步骤为：

在步骤(2.2)中已搭建好的CNN和残差网络中加入LSTM，利用LSTM的门控单元结构来学习时间顺序上的信息，通过输入门、遗忘门和输出门计算得到输出H_t-k+i和隐藏层状态输出h_t-k+i。

进一步地，所述步骤4中在Conv-LSTM网络中加入注意力机制RA的具体步骤为：

(4.1)在Conv-LSTM网络中加入注意力机制RA，其中权重序列的计算公式如下：

s_t-k+i＝v·(w·h_t-k+i+b)

其中，v，w为权重矩阵，可学习的参数，b为偏置项；

(4.2)由步骤(4.1)得到注意力分布a_t-k+i与Conv-LSTM网络计算获得的H_t-k+i做加权求和计算，具体公式如下：

H_k＝∑a_t-k+iH_t-k+i

进一步地，所述步骤5中具体步骤为：

(5.1)将步骤4中的特征H_k拼接成特征向量Y_k并输入到回归层进行训练，将训练好的Conv-LSTM-RA网络应用到测试集中，输出预测值实现用第t+1小时到第t+k小时的数据预测第t+k+1小时的空气质量指数；

(5.2)对测试集数据最终的预测结果进行评价与分析，将测试值与实际值y_i进行比较，采用平均绝对误差MAE和确定系数R²作为评价指标，其具体计算公式如下：

有益效果：

本发明将长短期记忆和卷积神经网络相结合，利用CNN的卷积层和池化层来提取与空气质量相关的特征，LSTM对时间序列进行预测；同时在卷积神经网络中加入残差网络，消除了CNN的退化问题，在LSTM中加入注意力机制来学习较早时刻的重要信息。使用卷积神经网络中的卷积层和池化层进行降维，提取与空气质量相关的特征。在CNN网络中加入残差网络，在CNN的输入和输出之间直接引入一条通路，实现跳跃连接，消除卷积神经网络的退化问题，提取更多的特征信息M_k+J_k，从而提高预测准确率。另外，在Conv-LSTM网络中加入注意力机制，可以有效避免神经元状态随着时间推移较早时刻的权重越来越小，注意力机制可以分析当前隐藏状态输出与之前隐藏状态输出的关联，发现时间序列中不同时刻的数据特征，从而为不同时刻赋予不同的权重，有效学习较早时刻的重要信息。附图说明

图1为Conv-LSTM-RA网络的整体流程框图；

图2为在CNN中加入残差网络图；

图3为将注意力机制加到Conv-LSTM网络中图。

具体实施方式

下面结合附图和具体实施方式，进一步阐明本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如附图1所示，本发明公开的基于Conv-LSTM-RA网络的空气质量指数预测方法，具体步骤如下：

步骤1：对已获取到的历史数据集命名为AirQuality，对其进行预处理，得到处理之后的数据集，将其命名为Pro_AirQuality，具体步骤如下：

(1.1)将已获取到的历史数据集AirQuality定义为：AirQuality＝[x¹,x²,x³,…,x^t,…,xⁿ]^T，共n条数据，其中x^t＝[x₁ ^t,x₂ ^t,…,x₁₀ ^t]表示第t小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数。

J_k表示第t+1小时到第t+k小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数。

(1.2)进行数据清洗，使用线性插值的方法填充数据集中的空值，用one-hot编码方式对wd列转换为数据类型。

(1.3)使用Z-score方法对步骤(1.2)中处理好的数据进行归一化处理，将处理之后的数据集定以为Pro_AirQuality。

步骤2：搭建CNN卷积神经网络，并在卷积神经网络中加入残差网络，利用一维卷积结构和残差模块提取更多的与空气质量相关的特征，参见图2，具体步骤如下：

(2.1)搭建卷积神经网络，将第t+1小时到第t+k小时的数据J_k进行一维卷积计算和最大池化计算，提取与空气质量相关的特征M_k。

(2.2)在步骤(2.1)中的CNN网络中加入残差网络，在CNN的输入和输出之间直接引入一条通路，实现跳跃连接，消除卷积神经网络的退化问题，提取更多的特征信息M_k+J_k，从而提高预测准确率，具体参见图2。

步骤3：在搭建好的CNN和残差网络之后使用长短期记忆(LSTM)在时间维度上根据设定的窗口进行未来空气质量指数的预测。具体步骤如下：

在步骤(2.2)中已搭建好的CNN中加入LSTM，利用LSTM的门控单元结构来学习时间顺序上的信息，通过输入门、遗忘门和输出门计算得到输出H_t-k+i和隐藏层状态输出h_t-k+i。

步骤4：在Conv-LSTM网络中加入注意力机制对不同时间段的数据赋予不同的权重，学习输入序列中的权重分布，参见图3，具体步骤如下：

(4.1)在Conv-LSTM网络中加入注意力机制，可以有效避免神经元状态随着时间推移较早时刻的权重越来越小，注意力机制可以分析当前隐藏状态输出与之前隐藏状态输出的关联，发现时间序列中不同时刻的数据特征，从而为不同时刻赋予不同的权重，有效学习较早时刻的重要信息，其中权重序列的计算公式如下：

s_t-k+i＝v·(w·h_t-k+i+b)

其中，v，w为权重矩阵，可学习的参数，b为偏置项。

(4.2)由步骤(4.1)得到注意力分布a_t-k+i与Conv-LSTM模块计算获得的H_t-k+i做加权求和计算，具体公式如下：

H_k＝∑a_t-k+iH_t-k+i

步骤5：利用搭建好的Conv-LSTM-RA网络对数据集进行训练并在测试集上进行验证，实现对空气质量指数(AQI)的预测，具体步骤如下：

(5.1)将步骤(4.2)中的特征H_k拼接成特征向量Y_k并输入到回归层进行训练，将训练好的Conv-LSTM-RA网络应用到测试集中，输出预测值实现用第t+1小时到第t+k小时的数据预测第t+k+1小时的空气质量指数。

(5.2)为评价模型效果，因此对测试集数据最终的预测结果进行评价与分析，将测试值与实际值y_i进行比较，采用平均绝对误差MAE和确定系数R²作为评价指标，其具体计算公式如下：

上述实施方式只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于Conv-LSTM-RA网络的空气质量指数预测方法，其特征在于，具体步骤如下：

2.根据权利要求1所述的基于Conv-LSTM-RA网络的空气质量指数预测方法，其特征在于，所述步骤1数据预处理的具体步骤为：

(2.1)将已获取到的历史数据集AirQuality定义为：AirQuality＝[x¹,x²,x³,…,x^t,…,xⁿ]^T，共n条数据，其中x^t＝[x₁ ^t,x₂ ^t,…,x₁₀ ^t]表示第t个小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数；J_k表示第t+1小时到第t+k小时的PM2.5浓度、PM10浓度、二氧化硫浓度、二氧化氮浓度、一氧化氮浓度、臭氧浓度、温度、降雨量、风向和空气质量指数；

(2.2)进行数据清洗，使用线性插值的方法填充数据集中的空值，用one-hot编码方式对wd列转换为数据类型；

(2.3)使用Z-score方法对步骤(2.2)中处理好的数据进行归一化处理，将处理之后的数据集定以为Pro_AirQuality；

(2.4)构造训练集和测试集，将步骤(2.3)获得的数据集Pro_AirQuality中数据打乱随机划分，设置70％的训练集和30％的测试集，其中训练集为tr，测试集为te。

3.根据权利要求1所述的基于Conv-LSTM-RA网络的空气质量指数预测方法，其特征在于，所述步骤2的具体步骤为：

(3.1)搭建CNN卷积神经网络，将第t+1小时到第t+k小时的数据J_k进行一维卷积计算和最大池化计算，提取与空气质量相关的特征M_k；

(3.2)在步骤(3.1)中的CNN网络中加入残差网络，在CNN的输入和输出之间直接引入一条通路，实现跳跃连接，消除卷积神经网络的退化问题，提取更多的特征信息M_k+J_k。

4.根据权利要求3所述的基于Conv-LSTM-RA网络的空气质量指数预测方法，其特征在于，所述步骤3中在搭建好的CNN和残差网络之后加入LSTM的具体步骤为：

在步骤(3.2)中已搭建好的CNN和残差网络中加入LSTM，利用LSTM的门控单元结构来学习时间顺序上的信息，通过输入门、遗忘门和输出门计算得到输出H_t-k+i和隐藏层状态输出h_t-k+i。

5.根据权利要求4所述的基于Conv-LSTM-RA网络的空气质量指数预测方法，其特征在于，所述步骤4中在Conv-LSTM网络中加入注意力机制RA的具体步骤为：

(5.1)在Conv-LSTM网络中加入注意力机制RA，其中权重序列的计算公式如下：

s_t-k+i＝v·(w·h_t-k+i+b)

其中，v，w为权重矩阵，可学习的参数，b为偏置项；

(5.2)由步骤(5.1)得到注意力分布a_t-k+i与Conv-LSTM网络计算获得的H_t-k+i做加权求和计算，具体公式如下：

H_k＝∑a_t-k+iH_t-k+i。

6.根据权利要求1所述的基于Conv-LSTM-RA网络的空气质量指数预测方法，其特征在于，所述步骤5中具体步骤为：

(6.1)将步骤4中的特征H_k拼接成特征向量Y_k并输入到回归层进行训练，将训练好的Conv-LSTM-RA网络应用到测试集中，输出预测值实现用第t+1小时到第t+k小时的数据预测第t+k+1小时的空气质量指数；

(6.2)对测试集数据最终的预测结果进行评价与分析，将测试值与实际值y_i进行比较，采用平均绝对误差MAE和确定系数R²作为评价指标，其具体计算公式如下：