CN111242369A - 基于多重融合卷积gru的pm2.5数据预测方法 - Google Patents

基于多重融合卷积gru的pm2.5数据预测方法 Download PDF

Info

Publication number
CN111242369A
CN111242369A CN202010023897.5A CN202010023897A CN111242369A CN 111242369 A CN111242369 A CN 111242369A CN 202010023897 A CN202010023897 A CN 202010023897A CN 111242369 A CN111242369 A CN 111242369A
Authority
CN
China
Prior art keywords
layer
gru
output
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010023897.5A
Other languages
English (en)
Other versions
CN111242369B (zh
Inventor
马武彬
鲁赢
吴继冰
邓苏
黄宏斌
吴亚辉
刘丽华
李璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010023897.5A priority Critical patent/CN111242369B/zh
Publication of CN111242369A publication Critical patent/CN111242369A/zh
Application granted granted Critical
Publication of CN111242369B publication Critical patent/CN111242369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:构建PM2.5数据的预测模型;利用训练集数据,对所述PM2.5数据的预测模型进行训练;将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;所述预测模型包括第一融合层、第二融合层和输出层,各层之间依次顺序连接,前一层的输出为后一层的输入。本发明方法通过三个卷积层将两个双向GRU层串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得PM2.5的预测有更高的精度和更好的性能。

Description

基于多重融合卷积GRU的PM2.5数据预测方法
技术领域
本发明属于空气污染数据处理与预测技术领域,具体涉及基于多重融合卷积GRU(Gated Recurrent Unit,门控循环单元)的PM2.5数据预测方法。
背景技术
空气污染问题已经成为了社会普遍关注的重要问题之一。每年空气污染会导致300万人死亡,并且这个人数还在不断上升。在中国,雾霾的影响日益增大,其中最为关键的PM2.5及以下的微粒。由于PM2.5在吸入人体以后,其中75%会在肺泡内沉积,导致呼吸系统感染,胎儿发育等严重健康问题。政府一直致力于如何减少空气污染以及对人们健康的影响。一方面,政府通过限制污染企业、提倡绿色清洁能源的使用,努力治理减少空气污染物排放的同时,另一方面通过提前预测未来PM2.5浓度信息发布公众,提醒人们在极端恶劣的条件下减少户外活动,能够给人们的身体健康给与最大限度的保护。因此,对于 PM2.5污染浓度的预测研究尤为重要。
目前对于PM2.5污染浓度的预测精度仍然不够,难以满足人们的需求。主要采用的方法有基于回归的预测、基于随机森林的预测、基于SVM的预测以及基于神经网络的预测。近年来,随着人工智能技术的发展,越来越多的人发现基于神经网络的预测方法优势较为突出,能够取得较好效果。大量学者采用了 LSTM、Con-LSTM方法对空气污染浓度进行了预测,然而精度不够理想。并且实验证明,单纯的增加LSTM或者Con-LSTM单元的个数并不能对预测精度进行提高。
发明内容
有鉴于此,本发明的目的在于提供基于多重融合卷积GRU(门控循环单元) 的PM2.5数据预测方法,通过三重卷积的方式将两个双向循环GRU模型进行连接,使得对PM2.5数据的预测取得了较好的效果。
本发明的目的是这样实现的,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得 PM2.5的预测值;
所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向 GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来 predictionHours小时的PM2.5浓度。
优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5 的预测值。
具体地,第一卷积层接受序列数据的输入,其输出为
Figure RE-RE-GDA0002453461450000031
xt表示序列数据,η1()表示第一卷积层的卷积函数,
Figure RE-RE-GDA0002453461450000032
同时作为第一双向GRU层和第二双向GRU层的输入,
Figure RE-RE-GDA0002453461450000033
为第一双向GRU层的输出,
Figure RE-RE-GDA0002453461450000034
表示将第一双向GRU层中正向GRU的输出
Figure RE-RE-GDA0002453461450000035
与第一双向GRU层中反向GRU输出
Figure RE-RE-GDA0002453461450000036
进行合并,第一融合层的输出为
Figure RE-RE-GDA0002453461450000037
Figure RE-RE-GDA0002453461450000038
是对第一双向GRU层的输出乘以权重向量
Figure RE-RE-GDA0002453461450000039
并加上偏移向量
Figure RE-RE-GDA00024534614500000310
的结果,
Figure 4
Figure RE-RE-GDA00024534614500000312
与η1(xt)的输出
Figure RE-RE-GDA00024534614500000313
进行合并成
Figure RE-RE-GDA00024534614500000314
作为第二层卷积层的输入;
Figure RE-RE-GDA00024534614500000315
是第二卷积层的输出,
Figure RE-RE-GDA00024534614500000316
Figure RE-RE-GDA00024534614500000317
卷积函数η2中包含了一个全连接操作Dense(),将
Figure RE-RE-GDA00024534614500000318
进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为
Figure 5
Figure RE-RE-GDA00024534614500000320
是对第二双向GRU层的输出乘以权重向量
Figure RE-RE-GDA00024534614500000321
并加上偏移向量
Figure RE-RE-GDA00024534614500000322
的结果,
Figure 6
Figure RE-RE-GDA00024534614500000324
表示将第二双向GRU层中正向GRU的输出
Figure RE-RE-GDA00024534614500000325
与第一双向GRU层中反向GRU输出
Figure RE-RE-GDA00024534614500000326
进行合并;将
Figure RE-RE-GDA00024534614500000327
Figure RE-RE-GDA00024534614500000328
进行合并,作为第三卷积层的输入,第三卷积层的输出为
Figure RE-RE-GDA0002453461450000041
Figure RE-RE-GDA0002453461450000042
卷积函数η3中还包含了一个全连接操作 Dense();第三卷积层通过全连接输出层得到输出Ot
Figure 7
Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,
Figure RE-RE-GDA0002453461450000044
Figure RE-RE-GDA0002453461450000045
为各部分的权重向量,
Figure RE-RE-GDA0002453461450000046
Figure RE-RE-GDA0002453461450000047
为各部分的偏移向量。
所述第一双向GRU层中正向GRU模型的输出
Figure RE-RE-GDA0002453461450000048
反向GRU 模型的输出
Figure RE-RE-GDA0002453461450000049
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure RE-RE-GDA00024534614500000410
表示将
Figure RE-RE-GDA00024534614500000411
Figure RE-RE-GDA00024534614500000412
进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出
Figure RE-RE-GDA00024534614500000413
反向GRU模型的输出
Figure RE-RE-GDA00024534614500000414
对正向GRU 模型和反向GRU模型的输出的聚合操作,得到输出
Figure RE-RE-GDA00024534614500000415
表示将
Figure RE-RE-GDA00024534614500000416
Figure RE-RE-GDA00024534614500000417
进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t
Figure RE-RE-GDA00024534614500000418
为第一双向GRU层中正向GRU模型的中间值,z2 t
Figure RE-RE-GDA00024534614500000419
为第一双向GRU层中反向GRU模型的中间值,z3 t
Figure RE-RE-GDA00024534614500000420
为第二双向GRU层中正向GRU模型的中间值,z4 t
Figure RE-RE-GDA00024534614500000421
为第二双向GRU层中反向GRU模型的中间值。
优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用 Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
本发明方法中的多重融合卷积GRU模型是改进的GRU模型,通过三个卷积网络将两个双向GRU卷积串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得对PM2.5数据的预测有更高的精度和更好的性能。
附图说明
图1为本发明方法的流程示意图;
图2为本发明方法的预测模型结构图;
图3为本发明实施例中GRU的结构图;
图4为本发明实施例中双向GRU层的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得 PM2.5的预测值;
如图2所示,所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU 模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU 信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来 predictionHours小时的PM2.5浓度;
优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5 的预测值。
GRU模型是传统的在LSTM模型上的一个改进版,其基本结构如图3所示,其中包含了遗忘门和更新门两个主要处理单元,该结构能够对时间序列的长时间依赖进行有效记忆和遗忘,从而保证时序数据的预测精度。其数学表达式如下:
遗忘门的输出:ft=σ(Wf[Ht-1,xt]+Bf),其中σ(x)=1/(1+e-x);在更新门中, zt=σ(Wz[Ht-1,xt]+Bz),
Figure RE-RE-GDA0002453461450000071
输出层: yt=WogHt+Bo,模型中需要训练的参数包括[Wf,Bf],[WZ,BZ],[Wh,Bh],[Wo,Bo]。
双向GRU层是一种改进的GRU模型,通过连接两个GRU模型(正向GRU和反向GRU)形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息。其网络结构如图4所示。与GRU不同之处在于,每一个双向GRU 层输出两个合并的GRU信号,正向GRU信号Ht和反向GRU信号H't,计算方式不变。
具体地,所述的双向GRU层中正向GRU模型的中间输出
Figure RE-RE-GDA0002453461450000072
反向GRU模型的中间输出
Figure RE-RE-GDA0002453461450000073
对正向GRU模型和反向GRU模型的中间输出的聚合操作,得到输出
Figure RE-RE-GDA0002453461450000074
表示将正向GRU模型的输出
Figure RE-RE-GDA0002453461450000075
与反向GRU模型输出Ht 2进行合并连接,作为所述的双向GRU层的输出;其中z1 t
Figure RE-RE-GDA0002453461450000076
为正向GRU模型的中间值,z2 t
Figure RE-RE-GDA0002453461450000077
为反向 GRU模型的中间值。
正向GRU模型中第一层遗忘门输出为:f1 t=σ(W1 f[H1 t-1,xt]+B1 f),f1 t为NumberofGRUCells×20的2维中间矩阵,NumberofGRUCells代表正向GRU模型的内部神经单元数量,xt为2维矩阵数据,维度为Windowsize×20,Windowsize为输入数据的长度;在正向GRU更新门中,第一输出为:z1 t=σ(W1 z[H1 t-1,xt]+B1 z),z1 t的数据格式同f1 t一样,第二输出为:
Figure RE-RE-GDA0002453461450000078
反向GRU模型相应的第一输出为:z2 t=σ(W2 z[H2 t-1,xt]+B2 z),第二输出:
Figure RE-RE-GDA0002453461450000079
Figure RE-RE-GDA00024534614500000710
为NumberofGRUCells×20的2维中间矩阵。
具体地,第一卷积层接受序列数据的输入,其输出为
Figure RE-RE-GDA0002453461450000081
xt表示序列数据,η1()表示第一卷积层的卷积函数,
Figure RE-RE-GDA0002453461450000082
同时作为第一双向GRU层和第二双向GRU层的输入,
Figure RE-RE-GDA0002453461450000083
为第一双向GRU层的输出,
Figure RE-RE-GDA0002453461450000084
表示将第一双向GRU层中正向GRU的输出
Figure RE-RE-GDA0002453461450000085
与第一双向GRU层中反向GRU输出
Figure RE-RE-GDA0002453461450000086
进行合并,第一融合层的输出为
Figure RE-RE-GDA0002453461450000087
Figure RE-RE-GDA0002453461450000088
是对第一双向GRU层的输出乘以权重向量
Figure RE-RE-GDA0002453461450000089
并加上偏移向量
Figure RE-RE-GDA00024534614500000810
的结果,
Figure 1
Figure RE-RE-GDA00024534614500000812
与η1(xt)的输出
Figure RE-RE-GDA00024534614500000813
进行合并成
Figure RE-RE-GDA00024534614500000814
作为第二层卷积层的输入;
Figure RE-RE-GDA00024534614500000815
是第二卷积层的输出,
Figure RE-RE-GDA00024534614500000816
Figure RE-RE-GDA00024534614500000817
卷积函数η2中包含了一个全连接操作Dense(),将Pt 1进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为
Figure 2
Figure RE-RE-GDA00024534614500000819
是对第二双向GRU层的输出乘以权重向量
Figure RE-RE-GDA00024534614500000820
并加上偏移向量
Figure RE-RE-GDA00024534614500000821
的结果,
Figure 3
Figure RE-RE-GDA00024534614500000823
表示将第二双向GRU层中正向GRU的输出
Figure RE-RE-GDA00024534614500000824
与第一双向GRU层中反向GRU输出
Figure RE-RE-GDA00024534614500000825
进行合并;将
Figure RE-RE-GDA00024534614500000826
Figure RE-RE-GDA00024534614500000827
进行合并,作为第三卷积层的输入,第三卷积层的输出为
Figure RE-RE-GDA00024534614500000828
Figure RE-RE-GDA00024534614500000829
卷积函数η3中还包含了一个全连接操作 Dense();第三卷积层通过全连接输出层得到输出Ot
Figure 8
Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,
Figure RE-RE-GDA00024534614500000831
Figure RE-RE-GDA00024534614500000832
为各部分的权重向量,
Figure RE-RE-GDA00024534614500000833
Figure RE-RE-GDA00024534614500000834
为各部分的偏移向量。
所述第一双向GRU层中正向GRU模型的输出
Figure RE-RE-GDA00024534614500000835
反向 GRU模型的输出
Figure RE-RE-GDA00024534614500000836
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure RE-RE-GDA00024534614500000837
表示将
Figure RE-RE-GDA00024534614500000838
Figure RE-RE-GDA00024534614500000839
进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出
Figure RE-RE-GDA0002453461450000091
反向GRU模型的输出
Figure RE-RE-GDA0002453461450000092
对正向 GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure RE-RE-GDA0002453461450000093
表示将
Figure RE-RE-GDA0002453461450000094
Figure RE-RE-GDA0002453461450000095
进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t
Figure RE-RE-GDA0002453461450000096
为第一双向GRU层中正向GRU模型的中间值,z2 t
Figure RE-RE-GDA0002453461450000097
为第一双向GRU层中反向GRU模型的中间值,z3 t
Figure RE-RE-GDA0002453461450000098
为第二双向GRU层中正向GRU模型的中间值,z4 t
Figure RE-RE-GDA0002453461450000099
为第二双向GRU层中反向GRU模型的中间值。
优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用 Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
优选地,所述的卷积层为1维卷积网络。典型的1维卷积网络包含一维卷积核向量,过滤尺寸(filter size)k=4,卷积间隔(dilation factors) d=1。
对所述预测模型的训练,包括对各类权重向量和偏移向量的训练。
本实验采用广州的城市空气污染数据集,一共包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据。数据样本每1 小时采集一次。
对已有的数据集主要做如下处理:1、样本数据中删除年份数据和月份数据,对小时数据进行分类,对应白天和黑夜,分为两类进行替换。2、对其中的缺失数据进行插值和删除处理,因为每个城市都包含了多个传感器的空气检测点,有些传感器空气检测点的数据是丢失的,因此采用横向插值法,将同一时刻距离较近的空气采集数据按照距离进行平均,插入到该数据项中。3、数据分类裂项处理:a)将代表类别的数据,例如季节、风向数据,按照每一个不同值增加一列数据项进行裂项处理;b)对于连续型数值,进行数据归一化到[0,1]间的值。表1为实验中的变量参数取值。
表1:变量参数取值
参数名称 变量名 方法或取值
学习率 LEARNING_RATE 0.0004
滑动窗口大小 WINDOW_SIZE 20
批尺寸大小 BATCH_SIZE 100
学习比率 TRAIN_RATE 0.8
验证比率 VALIDATE_RATE 0.1
测试比率 TEST_RATE 0.1
本实验所采用的硬件为:电脑主要配置为:Pentium(R)Dual-core 3.06CPU, 8GRAM内存。
效果评估:本实验的性能评估采用的参数包括RMSE、MAE、MAPE以及CC:
RMSE(Root Mean Square Error,均方根误差),其计算方式为:
Figure RE-RE-GDA0002453461450000101
MAE(Mean Absolutely Error,平均绝对误差),其计算方式为:
Figure RE-RE-GDA0002453461450000102
MAPE(Mean Absolutely Percentage Error平均绝对百分误差),其计算方式为:
Figure RE-RE-GDA0002453461450000111
CCV(correlation coefficient value),相关系数,其计算方式为:
Figure RE-RE-GDA0002453461450000112
需要说明的是,RMSE、MAE以及MAPE都是对预测误差的衡量,其值越小代表越准确,而CCV参数代表两个序列数量的相关系数,其值越大,代表两个序列数据越为相关,预测效果越好。
首先预测广州未来1小时的PM2.5的浓度,预测精度如下:
表2不同算法的预测结果值
模型名称 RMSE MAE MAPE CCV
LSTM 11.3428 8.3127 0.2596 0.8803
GRU 12.5977 9.1921 0.3071 0.8500
本发明方法 9.8528 6.8434 0.2154 0.9132
从表1中可以看出,在针对广州未来1小时的PM2.5浓度预测计算中,本发明方法中比起其他两种模型方法具有较好的性能。
同理,下面分析在未来3小时不同模型的性能差异。
针对预测未来3小时的PM2.5的浓度,不同模型的计算精度如表3所示。
表3未来3小时不同模型的预测精度
模型名称 RMSE MAE MAPE CCV
LSTM 18.3702 13.3433 0.4236 0.6549
GRU 22.7272 16.2215 0.5372 0.5335
本发明方法 13.4423 9.4154 0.2929 0.8108
由发明内容和实施例可知,本发明基于多重融合卷积GRU的PM2.5数据预测方法,多重融合卷积GRU模型是改进的GRU模型,通过三个一维卷积网络将两个双向GRU卷积串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得对PM2.5数据的预测有更高的精度和更好的性能。

Claims (6)

1.基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
其特征在于,所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
2.根据权利要求1所述的PM2.5数据预测方法,其特征在于,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。
3.根据权利要求2所述的PM2.5数据预测方法,其特征在于,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
4.根据权利要求1所述的PM2.5数据预测方法,其特征在于,第一卷积层接受序列数据的输入,其输出为
Figure FDA0002361761080000021
xt表示输入的序列数据,η1()表示第一卷积层的卷积函数,
Figure FDA0002361761080000022
同时作为第一双向GRU层和第二双向GRU层的输入,
Figure FDA0002361761080000023
为第一双向GRU层的输出,
Figure FDA0002361761080000024
表示将第一双向GRU层中正向GRU的输出
Figure FDA0002361761080000025
与第一双向GRU层中反向GRU输出
Figure FDA0002361761080000026
进行合并,第一融合层的输出为
Figure FDA0002361761080000027
Figure FDA0002361761080000028
是对第一双向GRU层的输出乘以权重向量
Figure FDA0002361761080000029
并加上偏移向量
Figure FDA00023617610800000210
的结果,
Figure FDA00023617610800000211
Figure FDA00023617610800000212
与η1(xt)的输出
Figure FDA00023617610800000213
进行合并成
Figure FDA00023617610800000214
作为第二层卷积层的输入;
Figure FDA00023617610800000215
是第二卷积层的输出,
Figure FDA00023617610800000216
Figure FDA00023617610800000217
卷积函数η2中包含了一个全连接操作Dense(),将Pt 1进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为
Figure FDA00023617610800000219
Figure FDA00023617610800000220
是对第二双向GRU层的输出乘以权重向量
Figure FDA00023617610800000221
并加上偏移向量
Figure FDA00023617610800000222
的结果,
Figure FDA00023617610800000223
Figure FDA00023617610800000224
表示将第二双向GRU层中正向GRU的输出
Figure FDA00023617610800000225
与第一双向GRU层中反向GRU输出
Figure FDA00023617610800000226
进行合并;将
Figure FDA00023617610800000227
与Pt 1进行合并,作为第三卷积层的输入,第三卷积层的输出为
Figure FDA00023617610800000228
Figure FDA00023617610800000229
卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot
Figure FDA00023617610800000230
Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,
Figure FDA00023617610800000231
Figure FDA00023617610800000232
为各部分的权重向量,
Figure FDA00023617610800000233
Figure FDA00023617610800000234
为各部分的偏移向量。
5.根据权利要求4所述的PM2.5数据预测方法,其特征在于,所述第一双向GRU层中正向GRU模型的输出
Figure FDA00023617610800000235
反向GRU模型的输出
Figure FDA0002361761080000031
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure FDA0002361761080000032
Figure FDA0002361761080000033
表示将
Figure FDA0002361761080000034
Figure FDA0002361761080000035
进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出
Figure FDA0002361761080000036
反向GRU模型的输出
Figure FDA0002361761080000037
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure FDA0002361761080000038
Figure FDA0002361761080000039
表示将
Figure FDA00023617610800000310
Figure FDA00023617610800000311
进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t
Figure FDA00023617610800000312
为第一双向GRU层中正向GRU模型的中间值,z2 t
Figure FDA00023617610800000313
为第一双向GRU层中反向GRU模型的中间值,z3 t
Figure FDA00023617610800000314
为第二双向GRU层中正向GRU模型的中间值,z4 t
Figure FDA00023617610800000315
为第二双向GRU层中反向GRU模型的中间值。
6.根据权利要求1所述的PM2.5数据预测方法,其特征在于,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
CN202010023897.5A 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法 Active CN111242369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010023897.5A CN111242369B (zh) 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010023897.5A CN111242369B (zh) 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法

Publications (2)

Publication Number Publication Date
CN111242369A true CN111242369A (zh) 2020-06-05
CN111242369B CN111242369B (zh) 2023-06-02

Family

ID=70864641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010023897.5A Active CN111242369B (zh) 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法

Country Status (1)

Country Link
CN (1) CN111242369B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496310A (zh) * 2021-06-16 2021-10-12 国家超级计算深圳中心(深圳云计算中心) 基于深度学习模型的大气污染物预测方法和系统
CN113807758A (zh) * 2020-12-02 2021-12-17 北京京东振世信息技术有限公司 一种数据生成方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109822399A (zh) * 2019-04-08 2019-05-31 浙江大学 基于并行深度神经网络的数控机床刀具磨损状态预测方法
US20190180154A1 (en) * 2017-12-13 2019-06-13 Abbyy Development Llc Text recognition using artificial intelligence
CN109978228A (zh) * 2019-01-31 2019-07-05 中南大学 一种pm2.5浓度预测方法、装置及介质
CN110070224A (zh) * 2019-04-20 2019-07-30 北京工业大学 一种基于多步骤递归预测的空气质量预测方法
CN110346517A (zh) * 2019-07-25 2019-10-18 中南大学 一种智慧城市工业大气污染可视化预警方法及其系统
CN110363760A (zh) * 2019-07-22 2019-10-22 广东工业大学 用于识别医学图像的计算机系统
CN110415266A (zh) * 2019-07-19 2019-11-05 东南大学 一种基于本车周围车辆轨迹预测安全行驶的方法
CN110647980A (zh) * 2019-09-18 2020-01-03 成都理工大学 一种基于gru神经网络的时间序列预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190180154A1 (en) * 2017-12-13 2019-06-13 Abbyy Development Llc Text recognition using artificial intelligence
CN109978228A (zh) * 2019-01-31 2019-07-05 中南大学 一种pm2.5浓度预测方法、装置及介质
CN109822399A (zh) * 2019-04-08 2019-05-31 浙江大学 基于并行深度神经网络的数控机床刀具磨损状态预测方法
CN110070224A (zh) * 2019-04-20 2019-07-30 北京工业大学 一种基于多步骤递归预测的空气质量预测方法
CN110415266A (zh) * 2019-07-19 2019-11-05 东南大学 一种基于本车周围车辆轨迹预测安全行驶的方法
CN110363760A (zh) * 2019-07-22 2019-10-22 广东工业大学 用于识别医学图像的计算机系统
CN110346517A (zh) * 2019-07-25 2019-10-18 中南大学 一种智慧城市工业大气污染可视化预警方法及其系统
CN110647980A (zh) * 2019-09-18 2020-01-03 成都理工大学 一种基于gru神经网络的时间序列预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王文广;赵文杰;: "基于GRU神经网络的燃煤电站NO_x排放预测模型" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807758A (zh) * 2020-12-02 2021-12-17 北京京东振世信息技术有限公司 一种数据生成方法和装置
CN113807758B (zh) * 2020-12-02 2023-11-03 北京京东振世信息技术有限公司 一种数据生成方法和装置
CN113496310A (zh) * 2021-06-16 2021-10-12 国家超级计算深圳中心(深圳云计算中心) 基于深度学习模型的大气污染物预测方法和系统

Also Published As

Publication number Publication date
CN111242369B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
CN111626518A (zh) 基于深度学习神经网络的城市天级需水量在线预测方法
CN111178611B (zh) 一种日电量预测的方法
CN111340292A (zh) 一种基于聚类的集成神经网络pm2.5预测方法
CN112036075A (zh) 一种基于环境监测数据关联关系的异常数据判定方法
Fu et al. Multi-stations’ weather prediction based on hybrid model using 1D CNN and Bi-LSTM
CN112287294B (zh) 一种基于深度学习的时空双向土壤含水量插值方法
CN110991690A (zh) 一种基于深度卷积神经网络的多时次风速预测方法
CN111242369A (zh) 基于多重融合卷积gru的pm2.5数据预测方法
CN108399470B (zh) 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN115269675A (zh) 工业园区大气污染时空解析方法
CN114818579B (zh) 基于一维卷积长短期记忆网络的模拟电路故障诊断方法
CN114662791A (zh) 一种基于时空注意力的长时序pm2.5预测方法及系统
CN111210081A (zh) 一种基于Bi-GRU的PM2.5数据处理与预测方法
CN116168548A (zh) 一种基于多特征融合的时空注意图卷积网络的交通流预测方法
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
CN114580696A (zh) 一种pm2.5浓度预测方法
CN114841412A (zh) 一种海参生长水质中酸碱度的预测方法
CN114970946A (zh) 基于深度学习模型与经验模态分解耦合的pm2.5污染浓度长时空预测方法
CN113642255A (zh) 基于多尺度卷积循环神经网络的光伏发电功率预测方法
Jiang et al. Long short-term memory based PM2. 5 concentration prediction method
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
CN112668808A (zh) 基于图卷积的手足口病发病趋势预测系统
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法
CN113657042A (zh) 一种基于多尺度注意力机制的空气质量参数预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant