CN111242369B - 基于多重融合卷积gru的pm2.5数据预测方法 - Google Patents
基于多重融合卷积gru的pm2.5数据预测方法 Download PDFInfo
- Publication number
- CN111242369B CN111242369B CN202010023897.5A CN202010023897A CN111242369B CN 111242369 B CN111242369 B CN 111242369B CN 202010023897 A CN202010023897 A CN 202010023897A CN 111242369 B CN111242369 B CN 111242369B
- Authority
- CN
- China
- Prior art keywords
- layer
- gru
- output
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000005286 illumination Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000012300 Sequence Analysis Methods 0.000 abstract description 3
- 230000007774 longterm Effects 0.000 abstract description 3
- 238000003915 air pollution Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 241000288105 Grus Species 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 239000000809 air pollutant Substances 0.000 description 1
- 231100001243 air pollutant Toxicity 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008175 fetal development Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:构建PM2.5数据的预测模型;利用训练集数据,对所述PM2.5数据的预测模型进行训练;将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;所述预测模型包括第一融合层、第二融合层和输出层,各层之间依次顺序连接,前一层的输出为后一层的输入。本发明方法通过三个卷积层将两个双向GRU层串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得PM2.5的预测有更高的精度和更好的性能。
Description
技术领域
本发明属于空气污染数据处理与预测技术领域,具体涉及基于多重融合卷积GRU(Gated Recurrent Unit,门控循环单元)的PM2.5数据预测方法。
背景技术
空气污染问题已经成为了社会普遍关注的重要问题之一。每年空气污染会导致300万人死亡,并且这个人数还在不断上升。在中国,雾霾的影响日益增大,其中最为关键的PM2.5及以下的微粒。由于PM2.5在吸入人体以后,其中75%会在肺泡内沉积,导致呼吸系统感染,胎儿发育等严重健康问题。政府一直致力于如何减少空气污染以及对人们健康的影响。一方面,政府通过限制污染企业、提倡绿色清洁能源的使用,努力治理减少空气污染物排放的同时,另一方面通过提前预测未来PM2.5浓度信息发布公众,提醒人们在极端恶劣的条件下减少户外活动,能够给人们的身体健康给与最大限度的保护。因此,对于PM2.5污染浓度的预测研究尤为重要。
目前对于PM2.5污染浓度的预测精度仍然不够,难以满足人们的需求。主要采用的方法有基于回归的预测、基于随机森林的预测、基于SVM的预测以及基于神经网络的预测。近年来,随着人工智能技术的发展,越来越多的人发现基于神经网络的预测方法优势较为突出,能够取得较好效果。大量学者采用了LSTM、Con-LSTM方法对空气污染浓度进行了预测,然而精度不够理想。并且实验证明,单纯的增加LSTM或者Con-LSTM单元的个数并不能对预测精度进行提高。
发明内容
有鉴于此,本发明的目的在于提供基于多重融合卷积GRU(门控循环单元)的PM2.5数据预测方法,通过三重卷积的方式将两个双向循环GRU模型进行连接,使得对PM2.5数据的预测取得了较好的效果。
本发明的目的是这样实现的,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。
优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
具体地,第一卷积层接受序列数据的输入,其输出为xt表示序列数据,η1()表示第一卷积层的卷积函数,/>同时作为第一双向GRU层和第二双向GRU层的输入,为第一双向GRU层的输出,/>表示将第一双向GRU层中正向GRU的输出/>与第一双向GRU层中反向GRU输出/>进行合并,第一融合层的输出为/> 是对第一双向GRU层的输出乘以权重向量/>并加上偏移向量/>的结果,/>将/>与η1(xt)的输出/>进行合并成/>作为第二层卷积层的输入;/>是第二卷积层的输出,/> 卷积函数η2中包含了一个全连接操作Dense(),将/>进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为 是对第二双向GRU层的输出乘以权重向量/>并加上偏移向量的结果,/> 表示将第二双向GRU层中正向GRU的输出/>与第一双向GRU层中反向GRU输出/>进行合并;将/>与/>进行合并,作为第三卷积层的输入,第三卷积层的输出为/> 卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot,/>Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,/> 为各部分的权重向量,/>和/>为各部分的偏移向量。
所述第一双向GRU层中正向GRU模型的输出反向GRU模型的输出/>对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/> 表示将/>与/>进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出/>反向GRU模型的输出/>对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/> 表示将/>与/>进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t、/>为第一双向GRU层中正向GRU模型的中间值,z2 t、/>为第一双向GRU层中反向GRU模型的中间值,z3 t、/>为第二双向GRU层中正向GRU模型的中间值,z4 t、/>为第二双向GRU层中反向GRU模型的中间值。
优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
本发明方法中的多重融合卷积GRU模型是改进的GRU模型,通过三个卷积网络将两个双向GRU卷积串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得对PM2.5数据的预测有更高的精度和更好的性能。
附图说明
图1为本发明方法的流程示意图;
图2为本发明方法的预测模型结构图;
图3为本发明实施例中GRU的结构图;
图4为本发明实施例中双向GRU层的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
如图2所示,所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度;
优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
GRU模型是传统的在LSTM模型上的一个改进版,其基本结构如图3所示,其中包含了遗忘门和更新门两个主要处理单元,该结构能够对时间序列的长时间依赖进行有效记忆和遗忘,从而保证时序数据的预测精度。其数学表达式如下:
遗忘门的输出:ft=σ(Wf[Ht-1,xt]+Bf),其中σ(x)=1/(1+e-x);在更新门中,zt=σ(Wz[Ht-1,xt]+Bz),输出层:yt=Wo·Ht+Bo,模型中需要训练的参数包括[Wf,Bf],[WZ,BZ],[Wh,Bh],[Wo,Bo]。
双向GRU层是一种改进的GRU模型,通过连接两个GRU模型(正向GRU和反向GRU)形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息。其网络结构如图4所示。与GRU不同之处在于,每一个双向GRU层输出两个合并的GRU信号,正向GRU信号Ht和反向GRU信号H't,计算方式不变。
具体地,所述的双向GRU层中正向GRU模型的中间输出反向GRU模型的中间输出/>对正向GRU模型和反向GRU模型的中间输出的聚合操作,得到输出/> 表示将正向GRU模型的输出/>与反向GRU模型输出/>进行合并连接,作为所述的双向GRU层的输出;其中z1 t、/>为正向GRU模型的中间值,z2 t、/>为反向GRU模型的中间值。
正向GRU模型中第一层遗忘门输出为:f1 t=σ(W1 f[H1 t-1,xt]+B1 f),f1 t为NumberofGRUCells×20的2维中间矩阵,NumberofGRUCells代表正向GRU模型的内部神经单元数量,xt为2维矩阵数据,维度为Windowsize×20,Windowsize为输入数据的长度;在正向GRU更新门中,第一输出为:z1 t=σ(W1 z[H1 t-1,xt]+B1 z),z1 t的数据格式同f1 t一样,第二输出为:反向GRU模型相应的第一输出为:z2 t=σ(W2 z[H2 t-1,xt]+B2 z),第二输出:/> 为NumberofGRUCells×20的2维中间矩阵。
具体地,第一卷积层接受序列数据的输入,其输出为xt表示序列数据,η1()表示第一卷积层的卷积函数,/>同时作为第一双向GRU层和第二双向GRU层的输入,为第一双向GRU层的输出,/>表示将第一双向GRU层中正向GRU的输出/>与第一双向GRU层中反向GRU输出/>进行合并,第一融合层的输出为/> 是对第一双向GRU层的输出乘以权重向量/>并加上偏移向量/>的结果,/>将/>与η1(xt)的输出/>进行合并成/>作为第二层卷积层的输入;/>是第二卷积层的输出,/> 卷积函数η2中包含了一个全连接操作Dense(),将Pt 1进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为 是对第二双向GRU层的输出乘以权重向量/>并加上偏移向量的结果,/> 表示将第二双向GRU层中正向GRU的输出/>与第一双向GRU层中反向GRU输出/>进行合并;将/>与Pt 1进行合并,作为第三卷积层的输入,第三卷积层的输出为/> 卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot,/>Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,/> 为各部分的权重向量,/>和/>为各部分的偏移向量。
所述第一双向GRU层中正向GRU模型的输出反向GRU模型的输出/>对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/> 表示将/>与/>进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出/>反向GRU模型的输出/>对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/> 表示将/>与/>进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t、/>为第一双向GRU层中正向GRU模型的中间值,z2 t、/>为第一双向GRU层中反向GRU模型的中间值,z3 t、/>为第二双向GRU层中正向GRU模型的中间值,z4 t、/>为第二双向GRU层中反向GRU模型的中间值。
优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
优选地,所述的卷积层为1维卷积网络。典型的1维卷积网络包含一维卷积核向量,过滤尺寸(filter size)k=4,卷积间隔(dilation factors)d=1。
对所述预测模型的训练,包括对各类权重向量和偏移向量的训练。
本实验采用广州的城市空气污染数据集,一共包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据。数据样本每1小时采集一次。
对已有的数据集主要做如下处理:1、样本数据中删除年份数据和月份数据,对小时数据进行分类,对应白天和黑夜,分为两类进行替换。2、对其中的缺失数据进行插值和删除处理,因为每个城市都包含了多个传感器的空气检测点,有些传感器空气检测点的数据是丢失的,因此采用横向插值法,将同一时刻距离较近的空气采集数据按照距离进行平均,插入到该数据项中。3、数据分类裂项处理:a)将代表类别的数据,例如季节、风向数据,按照每一个不同值增加一列数据项进行裂项处理;b)对于连续型数值,进行数据归一化到[0,1]间的值。表1为实验中的变量参数取值。
表1:变量参数取值
参数名称 | 变量名 | 方法或取值 |
学习率 | LEARNING_RATE | 0.0004 |
滑动窗口大小 | WINDOW_SIZE | 20 |
批尺寸大小 | BATCH_SIZE | 100 |
学习比率 | TRAIN_RATE | 0.8 |
验证比率 | VALIDATE_RATE | 0.1 |
测试比率 | TEST_RATE | 0.1 |
本实验所采用的硬件为:电脑主要配置为:Pentium(R)Dual-core 3.06CPU,8GRAM内存。
效果评估:本实验的性能评估采用的参数包括RMSE、MAE、MAPE以及CC:
RMSE(Root Mean Square Error,均方根误差),其计算方式为:
MAE(Mean Absolutely Error,平均绝对误差),其计算方式为:
MAPE(Mean Absolutely Percentage Error平均绝对百分误差),其计算方式为:
CCV(correlation coefficient value),相关系数,其计算方式为:
需要说明的是,RMSE、MAE以及MAPE都是对预测误差的衡量,其值越小代表越准确,而CCV参数代表两个序列数量的相关系数,其值越大,代表两个序列数据越为相关,预测效果越好。
首先预测广州未来1小时的PM2.5的浓度,预测精度如下:
表2 不同算法的预测结果值
模型名称 | RMSE | MAE | MAPE | CCV |
LSTM | 11.3428 | 8.3127 | 0.2596 | 0.8803 |
GRU | 12.5977 | 9.1921 | 0.3071 | 0.8500 |
本发明方法 | 9.8528 | 6.8434 | 0.2154 | 0.9132 |
从表1中可以看出,在针对广州未来1小时的PM2.5浓度预测计算中,本发明方法中比起其他两种模型方法具有较好的性能。
同理,下面分析在未来3小时不同模型的性能差异。
针对预测未来3小时的PM2.5的浓度,不同模型的计算精度如表3所示。
表3 未来3小时不同模型的预测精度
模型名称 | RMSE | MAE | MAPE | CCV |
LSTM | 18.3702 | 13.3433 | 0.4236 | 0.6549 |
GRU | 22.7272 | 16.2215 | 0.5372 | 0.5335 |
本发明方法 | 13.4423 | 9.4154 | 0.2929 | 0.8108 |
由发明内容和实施例可知,本发明基于多重融合卷积GRU的PM2.5数据预测方法,多重融合卷积GRU模型是改进的GRU模型,通过三个一维卷积网络将两个双向GRU卷积串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得对PM2.5数据的预测有更高的精度和更好的性能。
Claims (4)
1.基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
其特征在于,所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据;
第一卷积层接受序列数据的输入,其输出为xt表示输入的序列数据,η1()表示第一卷积层的卷积函数,/>同时作为第一双向GRU层和第二双向GRU层的输入,为第一双向GRU层的输出,/>表示将第一双向GRU层中正向GRU的输出/>与第一双向GRU层中反向GRU输出/>进行合并,第一融合层的输出为/> 是对第一双向GRU层的输出乘以权重向量/>并加上偏移向量/>的结果,/>将/>与η1(xt)的输出/>进行合并成/>作为第二层卷积层的输入;/>是第二卷积层的输出,/> 卷积函数η2中包含了一个全连接操作Dense(),将/>进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为 是对第二双向GRU层的输出乘以权重向量/>并加上偏移向量的结果,/> 表示将第二双向GRU层中正向GRU的输出/>与第一双向GRU层中反向GRU输出/>进行合并;将/>与/>进行合并,作为第三卷积层的输入,第三卷积层的输出为/> 卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot,/>Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,/>和/>为各部分的权重向量,/>和/>为各部分的偏移向量;
所述第一双向GRU层中正向GRU模型的输出反向GRU模型的输出/>对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出表示将/>与/>进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出/>反向GRU模型的输出对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出表示将/>与/>进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t、/>为第一双向GRU层中正向GRU模型的中间值,z2 t、/>为第一双向GRU层中反向GRU模型的中间值,z3 t、/>为第二双向GRU层中正向GRU模型的中间值,z4 t、/>为第二双向GRU层中反向GRU模型的中间值。
2.根据权利要求1所述的PM2.5数据预测方法,其特征在于,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。
3.根据权利要求2所述的PM2.5数据预测方法,其特征在于,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
4.根据权利要求1所述的PM2.5数据预测方法,其特征在于,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023897.5A CN111242369B (zh) | 2020-01-09 | 2020-01-09 | 基于多重融合卷积gru的pm2.5数据预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023897.5A CN111242369B (zh) | 2020-01-09 | 2020-01-09 | 基于多重融合卷积gru的pm2.5数据预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111242369A CN111242369A (zh) | 2020-06-05 |
CN111242369B true CN111242369B (zh) | 2023-06-02 |
Family
ID=70864641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010023897.5A Active CN111242369B (zh) | 2020-01-09 | 2020-01-09 | 基于多重融合卷积gru的pm2.5数据预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111242369B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113807758B (zh) * | 2020-12-02 | 2023-11-03 | 北京京东振世信息技术有限公司 | 一种数据生成方法和装置 |
CN113496310A (zh) * | 2021-06-16 | 2021-10-12 | 国家超级计算深圳中心(深圳云计算中心) | 基于深度学习模型的大气污染物预测方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109822399A (zh) * | 2019-04-08 | 2019-05-31 | 浙江大学 | 基于并行深度神经网络的数控机床刀具磨损状态预测方法 |
CN109978228A (zh) * | 2019-01-31 | 2019-07-05 | 中南大学 | 一种pm2.5浓度预测方法、装置及介质 |
CN110070224A (zh) * | 2019-04-20 | 2019-07-30 | 北京工业大学 | 一种基于多步骤递归预测的空气质量预测方法 |
CN110346517A (zh) * | 2019-07-25 | 2019-10-18 | 中南大学 | 一种智慧城市工业大气污染可视化预警方法及其系统 |
CN110363760A (zh) * | 2019-07-22 | 2019-10-22 | 广东工业大学 | 用于识别医学图像的计算机系统 |
CN110415266A (zh) * | 2019-07-19 | 2019-11-05 | 东南大学 | 一种基于本车周围车辆轨迹预测安全行驶的方法 |
CN110647980A (zh) * | 2019-09-18 | 2020-01-03 | 成都理工大学 | 一种基于gru神经网络的时间序列预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2691214C1 (ru) * | 2017-12-13 | 2019-06-11 | Общество с ограниченной ответственностью "Аби Продакшн" | Распознавание текста с использованием искусственного интеллекта |
-
2020
- 2020-01-09 CN CN202010023897.5A patent/CN111242369B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978228A (zh) * | 2019-01-31 | 2019-07-05 | 中南大学 | 一种pm2.5浓度预测方法、装置及介质 |
CN109822399A (zh) * | 2019-04-08 | 2019-05-31 | 浙江大学 | 基于并行深度神经网络的数控机床刀具磨损状态预测方法 |
CN110070224A (zh) * | 2019-04-20 | 2019-07-30 | 北京工业大学 | 一种基于多步骤递归预测的空气质量预测方法 |
CN110415266A (zh) * | 2019-07-19 | 2019-11-05 | 东南大学 | 一种基于本车周围车辆轨迹预测安全行驶的方法 |
CN110363760A (zh) * | 2019-07-22 | 2019-10-22 | 广东工业大学 | 用于识别医学图像的计算机系统 |
CN110346517A (zh) * | 2019-07-25 | 2019-10-18 | 中南大学 | 一种智慧城市工业大气污染可视化预警方法及其系统 |
CN110647980A (zh) * | 2019-09-18 | 2020-01-03 | 成都理工大学 | 一种基于gru神经网络的时间序列预测方法 |
Non-Patent Citations (1)
Title |
---|
王文广 ; 赵文杰 ; .基于GRU神经网络的燃煤电站NO_x排放预测模型.华北电力大学学报(自然科学版).2019,第47卷(第01期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111242369A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | A novel optimal-hybrid model for daily air quality index prediction considering air pollutant factors | |
CN113919448B (zh) | 一种任意时空位置二氧化碳浓度预测影响因素分析方法 | |
CN107909206B (zh) | 一种基于深层结构循环神经网络的pm2.5预测方法 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN110085327A (zh) | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 | |
CN111242369B (zh) | 基于多重融合卷积gru的pm2.5数据预测方法 | |
CN112036075A (zh) | 一种基于环境监测数据关联关系的异常数据判定方法 | |
CN110289987B (zh) | 基于表征学习的多智能体系统网络抗攻击能力评估方法 | |
CN108399470B (zh) | 一种基于多示例遗传神经网络的室内pm2.5预测方法 | |
CN112991721A (zh) | 基于图卷积网络节点关联度的城市路网交通速度预测方法 | |
CN113591380A (zh) | 基于图高斯过程的交通流预测方法、介质及设备 | |
CN115269675A (zh) | 工业园区大气污染时空解析方法 | |
CN113189014A (zh) | 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法 | |
CN113205698A (zh) | 一种基于igwo-lstm的短时交通流预测的导航提醒方法 | |
CN110020712A (zh) | 一种基于聚类的优化粒子群bp网络预测方法和系统 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
CN114970946A (zh) | 基于深度学习模型与经验模态分解耦合的pm2.5污染浓度长时空预测方法 | |
Liu et al. | Air quality index forecasting via genetic algorithm-based improved extreme learning machine | |
CN113836808A (zh) | 一种基于重污染特征约束的pm2.5深度学习预测方法 | |
CN118396482B (zh) | 面向气候变化的耕地质量动态监测方法 | |
Feng et al. | A dual-staged attention based conversion-gated long short term memory for multivariable time series prediction | |
CN115063972A (zh) | 基于图卷积和门控循环单元的交通速度预测方法和系统 | |
CN111210081A (zh) | 一种基于Bi-GRU的PM2.5数据处理与预测方法 | |
CN114648095A (zh) | 一种基于深度学习的空气质量浓度反演方法 | |
CN117436653A (zh) | 一种网约车出行需求的预测模型构建方法和预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |