CN111242369B

CN111242369B - 基于多重融合卷积gru的pm2.5数据预测方法

Info

Publication number: CN111242369B
Application number: CN202010023897.5A
Authority: CN
Inventors: 马武彬; 鲁赢; 吴继冰; 邓苏; 黄宏斌; 吴亚辉; 刘丽华; 李璇
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-01-09
Filing date: 2020-01-09
Publication date: 2023-06-02
Anticipated expiration: 2040-01-09
Also published as: CN111242369A

Abstract

本发明公开了基于多重融合卷积GRU的PM2.5数据预测方法，包括以下步骤：构建PM2.5数据的预测模型；利用训练集数据，对所述PM2.5数据的预测模型进行训练；将测试集数据输入训练完毕的PM2.5数据的预测模型中，计算获得PM2.5的预测值；所述预测模型包括第一融合层、第二融合层和输出层，各层之间依次顺序连接，前一层的输出为后一层的输入。本发明方法通过三个卷积层将两个双向GRU层串行融合在一起，通过同时对序列特征和上下文特征的共同识别，采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题，模型具备较好的收敛性和准确度，使得PM2.5的预测有更高的精度和更好的性能。

Description

基于多重融合卷积GRU的PM2.5数据预测方法

技术领域

本发明属于空气污染数据处理与预测技术领域，具体涉及基于多重融合卷积GRU(Gated Recurrent Unit，门控循环单元)的PM2.5数据预测方法。

背景技术

空气污染问题已经成为了社会普遍关注的重要问题之一。每年空气污染会导致300万人死亡，并且这个人数还在不断上升。在中国，雾霾的影响日益增大，其中最为关键的PM2.5及以下的微粒。由于PM2.5在吸入人体以后，其中75％会在肺泡内沉积，导致呼吸系统感染，胎儿发育等严重健康问题。政府一直致力于如何减少空气污染以及对人们健康的影响。一方面，政府通过限制污染企业、提倡绿色清洁能源的使用，努力治理减少空气污染物排放的同时，另一方面通过提前预测未来PM2.5浓度信息发布公众，提醒人们在极端恶劣的条件下减少户外活动，能够给人们的身体健康给与最大限度的保护。因此，对于PM2.5污染浓度的预测研究尤为重要。

目前对于PM2.5污染浓度的预测精度仍然不够，难以满足人们的需求。主要采用的方法有基于回归的预测、基于随机森林的预测、基于SVM的预测以及基于神经网络的预测。近年来，随着人工智能技术的发展，越来越多的人发现基于神经网络的预测方法优势较为突出，能够取得较好效果。大量学者采用了LSTM、Con-LSTM方法对空气污染浓度进行了预测，然而精度不够理想。并且实验证明，单纯的增加LSTM或者Con-LSTM单元的个数并不能对预测精度进行提高。

发明内容

有鉴于此，本发明的目的在于提供基于多重融合卷积GRU(门控循环单元)的PM2.5数据预测方法，通过三重卷积的方式将两个双向循环GRU模型进行连接，使得对PM2.5数据的预测取得了较好的效果。

本发明的目的是这样实现的，包括以下步骤：

步骤1，构建PM2.5数据的预测模型；

步骤2，利用训练集数据，对所述PM2.5数据的预测模型进行训练；

步骤3，将测试集数据输入训练完毕的PM2.5数据的预测模型中，计算获得PM2.5的预测值；

所述预测模型包括第一融合层、第二融合层和输出层，所述第一融合层包括第一卷积层和第一双向GRU层，所述第二融合层包括第二卷积层和第二双向GRU层，所述输出层包括第三卷积层和全连接输出层，所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层，各层之间依次顺序连接，所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构，所述的双向结构的GRU模型输出两个合并的GRU信号；

所述训练集数据包括影响因素数据和已知的PM2.5观测数据；

所述的测试集数据为待预测的PM2.5数据的影响因素数据。

具体地，所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据；所述时间分为白天和黑夜2栏；所述的季节分为春季、夏季、秋季、冬季4栏，风向分为东风、南风、西风、北风、无风5栏；其中，predictionHours是一个预设参数，代表预测未来predictionHours小时的PM2.5浓度。

优选地，对所述训练集数据根据不同时间或季节进行分类，使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型；预测模型训练完成以后，针对当前测试集数据，利用测试集数据对应类型的预测模型，计算获得PM2.5的预测值。

具体地，第一卷积层接受序列数据的输入，其输出为

x_t表示序列数据，η¹()表示第一卷积层的卷积函数，/>

同时作为第一双向GRU层和第二双向GRU层的输入，

为第一双向GRU层的输出，/>

表示将第一双向GRU层中正向GRU的输出/>

与第一双向GRU层中反向GRU输出/>

进行合并，第一融合层的输出为/>

是对第一双向GRU层的输出乘以权重向量/>

并加上偏移向量/>

的结果，/>

将/>

与η¹(x_t)的输出/>

进行合并成/>

作为第二层卷积层的输入；/>

是第二卷积层的输出，/>

卷积函数η²中包含了一个全连接操作Dense()，将/>

进行全连接转换成卷积函数可以接受的输入，连接到第二双向GRU层，第二融合层的输出为

是对第二双向GRU层的输出乘以权重向量/>

并加上偏移向量

的结果，/>

表示将第二双向GRU层中正向GRU的输出/>

与第一双向GRU层中反向GRU输出/>

进行合并；将/>

与/>

进行合并，作为第三卷积层的输入，第三卷积层的输出为/>

卷积函数η³中还包含了一个全连接操作Dense()；第三卷积层通过全连接输出层得到输出O_t，/>

O_t为一个具体值，代表predictionHours后的PM2.5浓度，其中，/>

为各部分的权重向量，/>

和/>

为各部分的偏移向量。

所述第一双向GRU层中正向GRU模型的输出

反向GRU模型的输出/>

对正向GRU模型和反向GRU模型的输出的聚合操作，得到输出/>

表示将/>

与/>

进行合并连接，作为所述的第一双向GRU层的输出；所述第二双向GRU层中正向GRU模型的输出/>

反向GRU模型的输出/>

对正向GRU模型和反向GRU模型的输出的聚合操作，得到输出/>

表示将/>

与/>

进行合并连接，作为所述的第二双向GRU层的输出，其中z¹ _t、/>

为第一双向GRU层中正向GRU模型的中间值，z² _t、/>

为第一双向GRU层中反向GRU模型的中间值，z³ _t、/>

为第二双向GRU层中正向GRU模型的中间值，z⁴ _t、/>

为第二双向GRU层中反向GRU模型的中间值。

优选地，所述预测模型中的损失函数采用标准归一化MSE，激活函数采用Relu函数，步骤2的训练过程中，通过Adam函数进行学习，得到参数神经网络参数模型。

本发明方法中的多重融合卷积GRU模型是改进的GRU模型，通过三个卷积网络将两个双向GRU卷积串行融合在一起，通过同时对序列特征和上下文特征的共同识别，采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题，模型具备较好的收敛性和准确度，使得对PM2.5数据的预测有更高的精度和更好的性能。

附图说明

图1为本发明方法的流程示意图；

图2为本发明方法的预测模型结构图；

图3为本发明实施例中GRU的结构图；

图4为本发明实施例中双向GRU层的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，基于多重融合卷积GRU的PM2.5数据预测方法，包括以下步骤：

步骤1，构建PM2.5数据的预测模型；

如图2所示，所述预测模型包括第一融合层、第二融合层和输出层，所述第一融合层包括第一卷积层和第一双向GRU层，所述第二融合层包括第二卷积层和第二双向GRU层，所述输出层包括第三卷积层和全连接输出层，所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层，各层之间依次顺序连接，所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构，所述的双向结构的GRU模型输出两个合并的GRU信号；

所述训练集数据包括影响因素数据和已知的PM2.5观测数据；

所述的测试集数据为待预测的PM2.5数据的影响因素数据。

具体地，所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据；所述时间分为白天和黑夜2栏；所述的季节分为春季、夏季、秋季、冬季4栏，风向分为东风、南风、西风、北风、无风5栏；其中，predictionHours是一个预设参数，代表预测未来predictionHours小时的PM2.5浓度；

GRU模型是传统的在LSTM模型上的一个改进版，其基本结构如图3所示，其中包含了遗忘门和更新门两个主要处理单元，该结构能够对时间序列的长时间依赖进行有效记忆和遗忘，从而保证时序数据的预测精度。其数学表达式如下：

遗忘门的输出：f_t＝σ(W_f[H_t-1,x_t]+B_f),其中σ(x)＝1/(1+e^-x)；在更新门中，z_t＝σ(W_z[H_t-1,x_t]+B_z),

输出层：y_t＝W_o·H_t+B_o，模型中需要训练的参数包括[W_f,B_f],[W_Z,B_Z],[W_h,B_h]，[W_o,B_o]。

双向GRU层是一种改进的GRU模型，通过连接两个GRU模型(正向GRU和反向GRU)形成的一个双向结构，在GRU的基础上能够更加充分的获取序列数据的上下文信息。其网络结构如图4所示。与GRU不同之处在于，每一个双向GRU层输出两个合并的GRU信号，正向GRU信号H_t和反向GRU信号H'_t，计算方式不变。

具体地，所述的双向GRU层中正向GRU模型的中间输出

反向GRU模型的中间输出/>

对正向GRU模型和反向GRU模型的中间输出的聚合操作，得到输出/>

表示将正向GRU模型的输出/>

与反向GRU模型输出/>

进行合并连接，作为所述的双向GRU层的输出；其中z¹ _t、/>

为正向GRU模型的中间值，z² _t、/>

为反向GRU模型的中间值。

正向GRU模型中第一层遗忘门输出为：f¹ _t＝σ(W¹ _f[H¹ _t-1,x_t]+B¹ _f)，f¹ _t为NumberofGRUCells×20的2维中间矩阵，NumberofGRUCells代表正向GRU模型的内部神经单元数量，x_t为2维矩阵数据，维度为Windowsize×20，Windowsize为输入数据的长度；在正向GRU更新门中，第一输出为：z¹ _t＝σ(W¹ _z[H¹ _t-1,x_t]+B¹ _z)，z¹ _t的数据格式同f¹ _t一样，第二输出为：

反向GRU模型相应的第一输出为：z² _t＝σ(W² _z[H² _t-1,x_t]+B² _z)，第二输出：/>

为NumberofGRUCells×20的2维中间矩阵。

具体地，第一卷积层接受序列数据的输入，其输出为

x_t表示序列数据，η¹()表示第一卷积层的卷积函数，/>

同时作为第一双向GRU层和第二双向GRU层的输入，

为第一双向GRU层的输出，/>

表示将第一双向GRU层中正向GRU的输出/>

与第一双向GRU层中反向GRU输出/>

进行合并，第一融合层的输出为/>

是对第一双向GRU层的输出乘以权重向量/>

并加上偏移向量/>

的结果，/>

将/>

与η¹(x_t)的输出/>

进行合并成/>

作为第二层卷积层的输入；/>

是第二卷积层的输出，/>

卷积函数η²中包含了一个全连接操作Dense()，将P_t ¹进行全连接转换成卷积函数可以接受的输入，连接到第二双向GRU层，第二融合层的输出为

是对第二双向GRU层的输出乘以权重向量/>

并加上偏移向量

的结果，/>

表示将第二双向GRU层中正向GRU的输出/>

与第一双向GRU层中反向GRU输出/>

进行合并；将/>

与P_t ¹进行合并，作为第三卷积层的输入，第三卷积层的输出为/>

O_t为一个具体值，代表predictionHours后的PM2.5浓度，其中，/>

为各部分的权重向量，/>

和/>

为各部分的偏移向量。

所述第一双向GRU层中正向GRU模型的输出

反向GRU模型的输出/>

对正向GRU模型和反向GRU模型的输出的聚合操作，得到输出/>

表示将/>

与/>

反向GRU模型的输出/>

对正向GRU模型和反向GRU模型的输出的聚合操作，得到输出/>

表示将/>

与/>

为第一双向GRU层中正向GRU模型的中间值，z² _t、/>

为第一双向GRU层中反向GRU模型的中间值，z³ _t、/>

为第二双向GRU层中正向GRU模型的中间值，z⁴ _t、/>

为第二双向GRU层中反向GRU模型的中间值。

优选地，所述的卷积层为1维卷积网络。典型的1维卷积网络包含一维卷积核向量，过滤尺寸(filter size)k＝4，卷积间隔(dilation factors)d＝1。

对所述预测模型的训练，包括对各类权重向量和偏移向量的训练。

本实验采用广州的城市空气污染数据集，一共包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据。数据样本每1小时采集一次。

对已有的数据集主要做如下处理：1、样本数据中删除年份数据和月份数据，对小时数据进行分类，对应白天和黑夜，分为两类进行替换。2、对其中的缺失数据进行插值和删除处理，因为每个城市都包含了多个传感器的空气检测点，有些传感器空气检测点的数据是丢失的，因此采用横向插值法，将同一时刻距离较近的空气采集数据按照距离进行平均，插入到该数据项中。3、数据分类裂项处理：a)将代表类别的数据，例如季节、风向数据，按照每一个不同值增加一列数据项进行裂项处理；b)对于连续型数值，进行数据归一化到[0,1]间的值。表1为实验中的变量参数取值。

表1：变量参数取值

参数名称	变量名	方法或取值
			学习率	LEARNING_RATE	0.0004
滑动窗口大小	WINDOW_SIZE	20
			批尺寸大小	BATCH_SIZE	100
学习比率	TRAIN_RATE	0.8
			验证比率	VALIDATE_RATE	0.1
测试比率	TEST_RATE	0.1

本实验所采用的硬件为：电脑主要配置为：Pentium(R)Dual-core 3.06CPU，8GRAM内存。

效果评估：本实验的性能评估采用的参数包括RMSE、MAE、MAPE以及CC：

RMSE(Root Mean Square Error，均方根误差)，其计算方式为：

MAE(Mean Absolutely Error，平均绝对误差)，其计算方式为：

MAPE(Mean Absolutely Percentage Error平均绝对百分误差)，其计算方式为：

CCV(correlation coefficient value)，相关系数，其计算方式为：

需要说明的是，RMSE、MAE以及MAPE都是对预测误差的衡量，其值越小代表越准确，而CCV参数代表两个序列数量的相关系数，其值越大，代表两个序列数据越为相关，预测效果越好。

首先预测广州未来1小时的PM2.5的浓度，预测精度如下：

表2 不同算法的预测结果值

模型名称	RMSE	MAE	MAPE	CCV
					LSTM	11.3428	8.3127	0.2596	0.8803
GRU	12.5977	9.1921	0.3071	0.8500
					本发明方法	9.8528	6.8434	0.2154	0.9132

从表1中可以看出，在针对广州未来1小时的PM2.5浓度预测计算中，本发明方法中比起其他两种模型方法具有较好的性能。

同理，下面分析在未来3小时不同模型的性能差异。

针对预测未来3小时的PM2.5的浓度，不同模型的计算精度如表3所示。

表3 未来3小时不同模型的预测精度

模型名称	RMSE	MAE	MAPE	CCV
					LSTM	18.3702	13.3433	0.4236	0.6549
GRU	22.7272	16.2215	0.5372	0.5335
					本发明方法	13.4423	9.4154	0.2929	0.8108

由发明内容和实施例可知，本发明基于多重融合卷积GRU的PM2.5数据预测方法，多重融合卷积GRU模型是改进的GRU模型，通过三个一维卷积网络将两个双向GRU卷积串行融合在一起，通过同时对序列特征和上下文特征的共同识别，采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题，模型具备较好的收敛性和准确度，使得对PM2.5数据的预测有更高的精度和更好的性能。

Claims

1.基于多重融合卷积GRU的PM2.5数据预测方法，包括以下步骤：

步骤1，构建PM2.5数据的预测模型；

其特征在于，所述预测模型包括第一融合层、第二融合层和输出层，所述第一融合层包括第一卷积层和第一双向GRU层，所述第二融合层包括第二卷积层和第二双向GRU层，所述输出层包括第三卷积层和全连接输出层，所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层，各层之间依次顺序连接，所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构，所述的双向结构的GRU模型输出两个合并的GRU信号；

所述训练集数据包括影响因素数据和已知的PM2.5观测数据；

所述的测试集数据为待预测的PM2.5数据的影响因素数据；

第一卷积层接受序列数据的输入，其输出为

x_t表示输入的序列数据，η¹()表示第一卷积层的卷积函数，/>

同时作为第一双向GRU层和第二双向GRU层的输入，

为第一双向GRU层的输出，/>

表示将第一双向GRU层中正向GRU的输出/>

与第一双向GRU层中反向GRU输出/>

进行合并，第一融合层的输出为/>

是对第一双向GRU层的输出乘以权重向量/>

并加上偏移向量/>

的结果，/>

将/>

与η¹(x_t)的输出/>

进行合并成/>

作为第二层卷积层的输入；/>

是第二卷积层的输出，/>

卷积函数η²中包含了一个全连接操作Dense()，将/>

是对第二双向GRU层的输出乘以权重向量/>

并加上偏移向量

的结果，/>

表示将第二双向GRU层中正向GRU的输出/>

与第一双向GRU层中反向GRU输出/>

进行合并；将/>

与/>

进行合并，作为第三卷积层的输入，第三卷积层的输出为/>

O_t为一个具体值，代表predictionHours后的PM2.5浓度，其中，/>

和/>

为各部分的权重向量，/>

和/>

为各部分的偏移向量；

所述第一双向GRU层中正向GRU模型的输出

反向GRU模型的输出/>

对正向GRU模型和反向GRU模型的输出的聚合操作，得到输出

表示将/>

与/>

反向GRU模型的输出

对正向GRU模型和反向GRU模型的输出的聚合操作，得到输出

表示将/>

与/>

为第一双向GRU层中正向GRU模型的中间值，z² _t、/>

为第一双向GRU层中反向GRU模型的中间值，z³ _t、/>

为第二双向GRU层中正向GRU模型的中间值，z⁴ _t、/>

为第二双向GRU层中反向GRU模型的中间值。

2.根据权利要求1所述的PM2.5数据预测方法，其特征在于，所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据；所述时间分为白天和黑夜2栏；所述的季节分为春季、夏季、秋季、冬季4栏，风向分为东风、南风、西风、北风、无风5栏；其中，predictionHours是一个预设参数，代表预测未来predictionHours小时的PM2.5浓度。

3.根据权利要求2所述的PM2.5数据预测方法，其特征在于，对所述训练集数据根据不同时间或季节进行分类，使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型；预测模型训练完成以后，针对当前测试集数据，利用测试集数据对应类型的预测模型，计算获得PM2.5的预测值。

4.根据权利要求1所述的PM2.5数据预测方法，其特征在于，所述预测模型中的损失函数采用标准归一化MSE，激活函数采用Relu函数，步骤2的训练过程中，通过Adam函数进行学习，得到参数神经网络参数模型。