CN111242369B - 基于多重融合卷积gru的pm2.5数据预测方法 - Google Patents

基于多重融合卷积gru的pm2.5数据预测方法 Download PDF

Info

Publication number
CN111242369B
CN111242369B CN202010023897.5A CN202010023897A CN111242369B CN 111242369 B CN111242369 B CN 111242369B CN 202010023897 A CN202010023897 A CN 202010023897A CN 111242369 B CN111242369 B CN 111242369B
Authority
CN
China
Prior art keywords
layer
gru
output
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010023897.5A
Other languages
English (en)
Other versions
CN111242369A (zh
Inventor
马武彬
鲁赢
吴继冰
邓苏
黄宏斌
吴亚辉
刘丽华
李璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010023897.5A priority Critical patent/CN111242369B/zh
Publication of CN111242369A publication Critical patent/CN111242369A/zh
Application granted granted Critical
Publication of CN111242369B publication Critical patent/CN111242369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:构建PM2.5数据的预测模型;利用训练集数据,对所述PM2.5数据的预测模型进行训练;将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;所述预测模型包括第一融合层、第二融合层和输出层,各层之间依次顺序连接,前一层的输出为后一层的输入。本发明方法通过三个卷积层将两个双向GRU层串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得PM2.5的预测有更高的精度和更好的性能。

Description

基于多重融合卷积GRU的PM2.5数据预测方法
技术领域
本发明属于空气污染数据处理与预测技术领域,具体涉及基于多重融合卷积GRU(Gated Recurrent Unit,门控循环单元)的PM2.5数据预测方法。
背景技术
空气污染问题已经成为了社会普遍关注的重要问题之一。每年空气污染会导致300万人死亡,并且这个人数还在不断上升。在中国,雾霾的影响日益增大,其中最为关键的PM2.5及以下的微粒。由于PM2.5在吸入人体以后,其中75%会在肺泡内沉积,导致呼吸系统感染,胎儿发育等严重健康问题。政府一直致力于如何减少空气污染以及对人们健康的影响。一方面,政府通过限制污染企业、提倡绿色清洁能源的使用,努力治理减少空气污染物排放的同时,另一方面通过提前预测未来PM2.5浓度信息发布公众,提醒人们在极端恶劣的条件下减少户外活动,能够给人们的身体健康给与最大限度的保护。因此,对于PM2.5污染浓度的预测研究尤为重要。
目前对于PM2.5污染浓度的预测精度仍然不够,难以满足人们的需求。主要采用的方法有基于回归的预测、基于随机森林的预测、基于SVM的预测以及基于神经网络的预测。近年来,随着人工智能技术的发展,越来越多的人发现基于神经网络的预测方法优势较为突出,能够取得较好效果。大量学者采用了LSTM、Con-LSTM方法对空气污染浓度进行了预测,然而精度不够理想。并且实验证明,单纯的增加LSTM或者Con-LSTM单元的个数并不能对预测精度进行提高。
发明内容
有鉴于此,本发明的目的在于提供基于多重融合卷积GRU(门控循环单元)的PM2.5数据预测方法,通过三重卷积的方式将两个双向循环GRU模型进行连接,使得对PM2.5数据的预测取得了较好的效果。
本发明的目的是这样实现的,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。
优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
具体地,第一卷积层接受序列数据的输入,其输出为
Figure BDA0002361761090000031
xt表示序列数据,η1()表示第一卷积层的卷积函数,/>
Figure BDA0002361761090000032
同时作为第一双向GRU层和第二双向GRU层的输入,
Figure BDA0002361761090000033
为第一双向GRU层的输出,/>
Figure BDA0002361761090000034
表示将第一双向GRU层中正向GRU的输出/>
Figure BDA0002361761090000035
与第一双向GRU层中反向GRU输出/>
Figure BDA0002361761090000036
进行合并,第一融合层的输出为/>
Figure BDA0002361761090000037
Figure BDA0002361761090000038
是对第一双向GRU层的输出乘以权重向量/>
Figure BDA0002361761090000039
并加上偏移向量/>
Figure BDA00023617610900000310
的结果,/>
Figure BDA00023617610900000311
将/>
Figure BDA00023617610900000312
与η1(xt)的输出/>
Figure BDA00023617610900000313
进行合并成/>
Figure BDA00023617610900000314
作为第二层卷积层的输入;/>
Figure BDA00023617610900000315
是第二卷积层的输出,/>
Figure BDA00023617610900000316
Figure BDA00023617610900000317
卷积函数η2中包含了一个全连接操作Dense(),将/>
Figure BDA00023617610900000318
进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为
Figure BDA00023617610900000319
Figure BDA00023617610900000320
是对第二双向GRU层的输出乘以权重向量/>
Figure BDA00023617610900000321
并加上偏移向量
Figure BDA00023617610900000322
的结果,/>
Figure BDA00023617610900000323
Figure BDA00023617610900000324
表示将第二双向GRU层中正向GRU的输出/>
Figure BDA00023617610900000325
与第一双向GRU层中反向GRU输出/>
Figure BDA00023617610900000326
进行合并;将/>
Figure BDA0002361761090000041
与/>
Figure BDA0002361761090000042
进行合并,作为第三卷积层的输入,第三卷积层的输出为/>
Figure BDA0002361761090000043
Figure BDA0002361761090000044
卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot,/>
Figure BDA0002361761090000045
Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,/>
Figure BDA0002361761090000046
Figure BDA0002361761090000047
为各部分的权重向量,/>
Figure BDA0002361761090000048
和/>
Figure BDA0002361761090000049
为各部分的偏移向量。
所述第一双向GRU层中正向GRU模型的输出
Figure BDA00023617610900000410
反向GRU模型的输出/>
Figure BDA00023617610900000411
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/>
Figure BDA00023617610900000412
Figure BDA00023617610900000424
表示将/>
Figure BDA00023617610900000413
与/>
Figure BDA00023617610900000414
进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出/>
Figure BDA00023617610900000415
反向GRU模型的输出/>
Figure BDA00023617610900000416
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/>
Figure BDA00023617610900000425
Figure BDA00023617610900000426
表示将/>
Figure BDA00023617610900000418
与/>
Figure BDA00023617610900000419
进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t、/>
Figure BDA00023617610900000420
为第一双向GRU层中正向GRU模型的中间值,z2 t、/>
Figure BDA00023617610900000421
为第一双向GRU层中反向GRU模型的中间值,z3 t、/>
Figure BDA00023617610900000422
为第二双向GRU层中正向GRU模型的中间值,z4 t、/>
Figure BDA00023617610900000423
为第二双向GRU层中反向GRU模型的中间值。
优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
本发明方法中的多重融合卷积GRU模型是改进的GRU模型,通过三个卷积网络将两个双向GRU卷积串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得对PM2.5数据的预测有更高的精度和更好的性能。
附图说明
图1为本发明方法的流程示意图;
图2为本发明方法的预测模型结构图;
图3为本发明实施例中GRU的结构图;
图4为本发明实施例中双向GRU层的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
如图2所示,所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据。
具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度;
优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
GRU模型是传统的在LSTM模型上的一个改进版,其基本结构如图3所示,其中包含了遗忘门和更新门两个主要处理单元,该结构能够对时间序列的长时间依赖进行有效记忆和遗忘,从而保证时序数据的预测精度。其数学表达式如下:
遗忘门的输出:ft=σ(Wf[Ht-1,xt]+Bf),其中σ(x)=1/(1+e-x);在更新门中,zt=σ(Wz[Ht-1,xt]+Bz),
Figure BDA0002361761090000071
输出层:yt=Wo·Ht+Bo,模型中需要训练的参数包括[Wf,Bf],[WZ,BZ],[Wh,Bh],[Wo,Bo]。
双向GRU层是一种改进的GRU模型,通过连接两个GRU模型(正向GRU和反向GRU)形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息。其网络结构如图4所示。与GRU不同之处在于,每一个双向GRU层输出两个合并的GRU信号,正向GRU信号Ht和反向GRU信号H't,计算方式不变。
具体地,所述的双向GRU层中正向GRU模型的中间输出
Figure BDA0002361761090000072
反向GRU模型的中间输出/>
Figure BDA0002361761090000073
对正向GRU模型和反向GRU模型的中间输出的聚合操作,得到输出/>
Figure BDA00023617610900000710
Figure BDA00023617610900000711
表示将正向GRU模型的输出/>
Figure BDA0002361761090000075
与反向GRU模型输出/>
Figure BDA0002361761090000076
进行合并连接,作为所述的双向GRU层的输出;其中z1 t、/>
Figure BDA0002361761090000077
为正向GRU模型的中间值,z2 t、/>
Figure BDA00023617610900000712
为反向GRU模型的中间值。
正向GRU模型中第一层遗忘门输出为:f1 t=σ(W1 f[H1 t-1,xt]+B1 f),f1 t为NumberofGRUCells×20的2维中间矩阵,NumberofGRUCells代表正向GRU模型的内部神经单元数量,xt为2维矩阵数据,维度为Windowsize×20,Windowsize为输入数据的长度;在正向GRU更新门中,第一输出为:z1 t=σ(W1 z[H1 t-1,xt]+B1 z),z1 t的数据格式同f1 t一样,第二输出为:
Figure BDA0002361761090000079
反向GRU模型相应的第一输出为:z2 t=σ(W2 z[H2 t-1,xt]+B2 z),第二输出:/>
Figure BDA0002361761090000081
Figure BDA0002361761090000082
为NumberofGRUCells×20的2维中间矩阵。
具体地,第一卷积层接受序列数据的输入,其输出为
Figure BDA0002361761090000083
xt表示序列数据,η1()表示第一卷积层的卷积函数,/>
Figure BDA0002361761090000084
同时作为第一双向GRU层和第二双向GRU层的输入,
Figure BDA0002361761090000085
为第一双向GRU层的输出,/>
Figure BDA0002361761090000086
表示将第一双向GRU层中正向GRU的输出/>
Figure BDA0002361761090000087
与第一双向GRU层中反向GRU输出/>
Figure BDA0002361761090000088
进行合并,第一融合层的输出为/>
Figure BDA0002361761090000089
Figure BDA00023617610900000810
是对第一双向GRU层的输出乘以权重向量/>
Figure BDA00023617610900000811
并加上偏移向量/>
Figure BDA00023617610900000812
的结果,/>
Figure BDA00023617610900000813
将/>
Figure BDA00023617610900000814
与η1(xt)的输出/>
Figure BDA00023617610900000815
进行合并成/>
Figure BDA00023617610900000816
作为第二层卷积层的输入;/>
Figure BDA00023617610900000817
是第二卷积层的输出,/>
Figure BDA00023617610900000818
Figure BDA00023617610900000819
卷积函数η2中包含了一个全连接操作Dense(),将Pt 1进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为
Figure BDA00023617610900000821
Figure BDA00023617610900000822
是对第二双向GRU层的输出乘以权重向量/>
Figure BDA00023617610900000823
并加上偏移向量
Figure BDA00023617610900000824
的结果,/>
Figure BDA00023617610900000825
Figure BDA00023617610900000826
表示将第二双向GRU层中正向GRU的输出/>
Figure BDA00023617610900000827
与第一双向GRU层中反向GRU输出/>
Figure BDA00023617610900000828
进行合并;将/>
Figure BDA00023617610900000829
与Pt 1进行合并,作为第三卷积层的输入,第三卷积层的输出为/>
Figure BDA00023617610900000830
Figure BDA00023617610900000831
卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot,/>
Figure BDA00023617610900000832
Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,/>
Figure BDA00023617610900000833
Figure BDA00023617610900000834
为各部分的权重向量,/>
Figure BDA00023617610900000835
和/>
Figure BDA00023617610900000836
为各部分的偏移向量。
所述第一双向GRU层中正向GRU模型的输出
Figure BDA00023617610900000837
反向GRU模型的输出/>
Figure BDA00023617610900000838
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/>
Figure BDA00023617610900000842
Figure BDA00023617610900000843
表示将/>
Figure BDA00023617610900000840
与/>
Figure BDA00023617610900000841
进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出/>
Figure BDA0002361761090000091
反向GRU模型的输出/>
Figure BDA0002361761090000092
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出/>
Figure BDA0002361761090000093
Figure BDA0002361761090000094
表示将/>
Figure BDA0002361761090000095
与/>
Figure BDA0002361761090000096
进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t、/>
Figure BDA0002361761090000097
为第一双向GRU层中正向GRU模型的中间值,z2 t、/>
Figure BDA00023617610900000911
为第一双向GRU层中反向GRU模型的中间值,z3 t、/>
Figure BDA0002361761090000099
为第二双向GRU层中正向GRU模型的中间值,z4 t、/>
Figure BDA00023617610900000910
为第二双向GRU层中反向GRU模型的中间值。
优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
优选地,所述的卷积层为1维卷积网络。典型的1维卷积网络包含一维卷积核向量,过滤尺寸(filter size)k=4,卷积间隔(dilation factors)d=1。
对所述预测模型的训练,包括对各类权重向量和偏移向量的训练。
本实验采用广州的城市空气污染数据集,一共包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据。数据样本每1小时采集一次。
对已有的数据集主要做如下处理:1、样本数据中删除年份数据和月份数据,对小时数据进行分类,对应白天和黑夜,分为两类进行替换。2、对其中的缺失数据进行插值和删除处理,因为每个城市都包含了多个传感器的空气检测点,有些传感器空气检测点的数据是丢失的,因此采用横向插值法,将同一时刻距离较近的空气采集数据按照距离进行平均,插入到该数据项中。3、数据分类裂项处理:a)将代表类别的数据,例如季节、风向数据,按照每一个不同值增加一列数据项进行裂项处理;b)对于连续型数值,进行数据归一化到[0,1]间的值。表1为实验中的变量参数取值。
表1:变量参数取值
参数名称 变量名 方法或取值
学习率 LEARNING_RATE 0.0004
滑动窗口大小 WINDOW_SIZE 20
批尺寸大小 BATCH_SIZE 100
学习比率 TRAIN_RATE 0.8
验证比率 VALIDATE_RATE 0.1
测试比率 TEST_RATE 0.1
本实验所采用的硬件为:电脑主要配置为:Pentium(R)Dual-core 3.06CPU,8GRAM内存。
效果评估:本实验的性能评估采用的参数包括RMSE、MAE、MAPE以及CC:
RMSE(Root Mean Square Error,均方根误差),其计算方式为:
Figure BDA0002361761090000101
MAE(Mean Absolutely Error,平均绝对误差),其计算方式为:
Figure BDA0002361761090000102
MAPE(Mean Absolutely Percentage Error平均绝对百分误差),其计算方式为:
Figure BDA0002361761090000103
CCV(correlation coefficient value),相关系数,其计算方式为:
Figure BDA0002361761090000111
需要说明的是,RMSE、MAE以及MAPE都是对预测误差的衡量,其值越小代表越准确,而CCV参数代表两个序列数量的相关系数,其值越大,代表两个序列数据越为相关,预测效果越好。
首先预测广州未来1小时的PM2.5的浓度,预测精度如下:
表2 不同算法的预测结果值
模型名称 RMSE MAE MAPE CCV
LSTM 11.3428 8.3127 0.2596 0.8803
GRU 12.5977 9.1921 0.3071 0.8500
本发明方法 9.8528 6.8434 0.2154 0.9132
从表1中可以看出,在针对广州未来1小时的PM2.5浓度预测计算中,本发明方法中比起其他两种模型方法具有较好的性能。
同理,下面分析在未来3小时不同模型的性能差异。
针对预测未来3小时的PM2.5的浓度,不同模型的计算精度如表3所示。
表3 未来3小时不同模型的预测精度
模型名称 RMSE MAE MAPE CCV
LSTM 18.3702 13.3433 0.4236 0.6549
GRU 22.7272 16.2215 0.5372 0.5335
本发明方法 13.4423 9.4154 0.2929 0.8108
由发明内容和实施例可知,本发明基于多重融合卷积GRU的PM2.5数据预测方法,多重融合卷积GRU模型是改进的GRU模型,通过三个一维卷积网络将两个双向GRU卷积串行融合在一起,通过同时对序列特征和上下文特征的共同识别,采用融合卷积的形式解决了GRU在时间序列分析中长期依赖丢失问题,模型具备较好的收敛性和准确度,使得对PM2.5数据的预测有更高的精度和更好的性能。

Claims (4)

1.基于多重融合卷积GRU的PM2.5数据预测方法,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
其特征在于,所述预测模型包括第一融合层、第二融合层和输出层,所述第一融合层包括第一卷积层和第一双向GRU层,所述第二融合层包括第二卷积层和第二双向GRU层,所述输出层包括第三卷积层和全连接输出层,所述全连接输出层包括输出层为10的第一全连接层和输出层为1的第二全连接层,各层之间依次顺序连接,所述的双向GRU层均由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述的双向结构的GRU模型输出两个合并的GRU信号;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因素数据;
第一卷积层接受序列数据的输入,其输出为
Figure FDA0004128480570000011
xt表示输入的序列数据,η1()表示第一卷积层的卷积函数,/>
Figure FDA0004128480570000012
同时作为第一双向GRU层和第二双向GRU层的输入,
Figure FDA0004128480570000013
为第一双向GRU层的输出,/>
Figure FDA0004128480570000014
表示将第一双向GRU层中正向GRU的输出/>
Figure FDA0004128480570000015
与第一双向GRU层中反向GRU输出/>
Figure FDA0004128480570000016
进行合并,第一融合层的输出为/>
Figure FDA0004128480570000017
Figure FDA0004128480570000018
是对第一双向GRU层的输出乘以权重向量/>
Figure FDA0004128480570000019
并加上偏移向量/>
Figure FDA00041284805700000110
的结果,/>
Figure FDA00041284805700000111
将/>
Figure FDA00041284805700000112
与η1(xt)的输出/>
Figure FDA00041284805700000113
进行合并成/>
Figure FDA00041284805700000114
作为第二层卷积层的输入;/>
Figure FDA00041284805700000115
是第二卷积层的输出,/>
Figure FDA00041284805700000116
Figure FDA00041284805700000117
卷积函数η2中包含了一个全连接操作Dense(),将/>
Figure FDA00041284805700000118
进行全连接转换成卷积函数可以接受的输入,连接到第二双向GRU层,第二融合层的输出为
Figure FDA0004128480570000021
Figure FDA0004128480570000022
是对第二双向GRU层的输出乘以权重向量/>
Figure FDA0004128480570000023
并加上偏移向量
Figure FDA0004128480570000024
的结果,/>
Figure FDA0004128480570000025
Figure FDA0004128480570000026
表示将第二双向GRU层中正向GRU的输出/>
Figure FDA0004128480570000027
与第一双向GRU层中反向GRU输出/>
Figure FDA0004128480570000028
进行合并;将/>
Figure FDA0004128480570000029
与/>
Figure FDA00041284805700000210
进行合并,作为第三卷积层的输入,第三卷积层的输出为/>
Figure FDA00041284805700000211
Figure FDA00041284805700000212
卷积函数η3中还包含了一个全连接操作Dense();第三卷积层通过全连接输出层得到输出Ot,/>
Figure FDA00041284805700000213
Ot为一个具体值,代表predictionHours后的PM2.5浓度,其中,/>
Figure FDA00041284805700000214
和/>
Figure FDA00041284805700000215
为各部分的权重向量,/>
Figure FDA00041284805700000216
和/>
Figure FDA00041284805700000217
为各部分的偏移向量;
所述第一双向GRU层中正向GRU模型的输出
Figure FDA00041284805700000218
反向GRU模型的输出/>
Figure FDA00041284805700000219
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure FDA00041284805700000220
表示将/>
Figure FDA00041284805700000221
与/>
Figure FDA00041284805700000222
进行合并连接,作为所述的第一双向GRU层的输出;所述第二双向GRU层中正向GRU模型的输出/>
Figure FDA00041284805700000223
反向GRU模型的输出
Figure FDA00041284805700000224
对正向GRU模型和反向GRU模型的输出的聚合操作,得到输出
Figure FDA00041284805700000225
表示将/>
Figure FDA00041284805700000226
与/>
Figure FDA00041284805700000227
进行合并连接,作为所述的第二双向GRU层的输出,其中z1 t、/>
Figure FDA00041284805700000228
为第一双向GRU层中正向GRU模型的中间值,z2 t、/>
Figure FDA00041284805700000229
为第一双向GRU层中反向GRU模型的中间值,z3 t、/>
Figure FDA00041284805700000230
为第二双向GRU层中正向GRU模型的中间值,z4 t、/>
Figure FDA00041284805700000231
为第二双向GRU层中反向GRU模型的中间值。
2.根据权利要求1所述的PM2.5数据预测方法,其特征在于,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。
3.根据权利要求2所述的PM2.5数据预测方法,其特征在于,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。
4.根据权利要求1所述的PM2.5数据预测方法,其特征在于,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。
CN202010023897.5A 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法 Active CN111242369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010023897.5A CN111242369B (zh) 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010023897.5A CN111242369B (zh) 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法

Publications (2)

Publication Number Publication Date
CN111242369A CN111242369A (zh) 2020-06-05
CN111242369B true CN111242369B (zh) 2023-06-02

Family

ID=70864641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010023897.5A Active CN111242369B (zh) 2020-01-09 2020-01-09 基于多重融合卷积gru的pm2.5数据预测方法

Country Status (1)

Country Link
CN (1) CN111242369B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807758B (zh) * 2020-12-02 2023-11-03 北京京东振世信息技术有限公司 一种数据生成方法和装置
CN113496310A (zh) * 2021-06-16 2021-10-12 国家超级计算深圳中心(深圳云计算中心) 基于深度学习模型的大气污染物预测方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109822399A (zh) * 2019-04-08 2019-05-31 浙江大学 基于并行深度神经网络的数控机床刀具磨损状态预测方法
CN109978228A (zh) * 2019-01-31 2019-07-05 中南大学 一种pm2.5浓度预测方法、装置及介质
CN110070224A (zh) * 2019-04-20 2019-07-30 北京工业大学 一种基于多步骤递归预测的空气质量预测方法
CN110346517A (zh) * 2019-07-25 2019-10-18 中南大学 一种智慧城市工业大气污染可视化预警方法及其系统
CN110363760A (zh) * 2019-07-22 2019-10-22 广东工业大学 用于识别医学图像的计算机系统
CN110415266A (zh) * 2019-07-19 2019-11-05 东南大学 一种基于本车周围车辆轨迹预测安全行驶的方法
CN110647980A (zh) * 2019-09-18 2020-01-03 成都理工大学 一种基于gru神经网络的时间序列预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2691214C1 (ru) * 2017-12-13 2019-06-11 Общество с ограниченной ответственностью "Аби Продакшн" Распознавание текста с использованием искусственного интеллекта

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978228A (zh) * 2019-01-31 2019-07-05 中南大学 一种pm2.5浓度预测方法、装置及介质
CN109822399A (zh) * 2019-04-08 2019-05-31 浙江大学 基于并行深度神经网络的数控机床刀具磨损状态预测方法
CN110070224A (zh) * 2019-04-20 2019-07-30 北京工业大学 一种基于多步骤递归预测的空气质量预测方法
CN110415266A (zh) * 2019-07-19 2019-11-05 东南大学 一种基于本车周围车辆轨迹预测安全行驶的方法
CN110363760A (zh) * 2019-07-22 2019-10-22 广东工业大学 用于识别医学图像的计算机系统
CN110346517A (zh) * 2019-07-25 2019-10-18 中南大学 一种智慧城市工业大气污染可视化预警方法及其系统
CN110647980A (zh) * 2019-09-18 2020-01-03 成都理工大学 一种基于gru神经网络的时间序列预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王文广 ; 赵文杰 ; .基于GRU神经网络的燃煤电站NO_x排放预测模型.华北电力大学学报(自然科学版).2019,第47卷(第01期),全文. *

Also Published As

Publication number Publication date
CN111242369A (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
Wu et al. A novel optimal-hybrid model for daily air quality index prediction considering air pollutant factors
CN113919448B (zh) 一种任意时空位置二氧化碳浓度预测影响因素分析方法
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN110085327A (zh) 基于注意力机制的多通道lstm神经网络流感疫情预测方法
CN111242369B (zh) 基于多重融合卷积gru的pm2.5数据预测方法
CN112036075A (zh) 一种基于环境监测数据关联关系的异常数据判定方法
CN110289987B (zh) 基于表征学习的多智能体系统网络抗攻击能力评估方法
CN108399470B (zh) 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN112991721A (zh) 基于图卷积网络节点关联度的城市路网交通速度预测方法
CN113591380A (zh) 基于图高斯过程的交通流预测方法、介质及设备
CN115269675A (zh) 工业园区大气污染时空解析方法
CN113189014A (zh) 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法
CN113205698A (zh) 一种基于igwo-lstm的短时交通流预测的导航提醒方法
CN110020712A (zh) 一种基于聚类的优化粒子群bp网络预测方法和系统
CN112101132B (zh) 一种基于图嵌入模型和度量学习的交通状况预测方法
CN114970946A (zh) 基于深度学习模型与经验模态分解耦合的pm2.5污染浓度长时空预测方法
Liu et al. Air quality index forecasting via genetic algorithm-based improved extreme learning machine
CN113836808A (zh) 一种基于重污染特征约束的pm2.5深度学习预测方法
CN118396482B (zh) 面向气候变化的耕地质量动态监测方法
Feng et al. A dual-staged attention based conversion-gated long short term memory for multivariable time series prediction
CN115063972A (zh) 基于图卷积和门控循环单元的交通速度预测方法和系统
CN111210081A (zh) 一种基于Bi-GRU的PM2.5数据处理与预测方法
CN114648095A (zh) 一种基于深度学习的空气质量浓度反演方法
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant