CN114444561A - 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 - Google Patents
基于CNNs-GRU融合深度学习模型的PM2.5预测方法 Download PDFInfo
- Publication number
- CN114444561A CN114444561A CN202110966164.XA CN202110966164A CN114444561A CN 114444561 A CN114444561 A CN 114444561A CN 202110966164 A CN202110966164 A CN 202110966164A CN 114444561 A CN114444561 A CN 114444561A
- Authority
- CN
- China
- Prior art keywords
- gru
- cnns
- air quality
- model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000004927 fusion Effects 0.000 title claims abstract description 32
- 238000013136 deep learning model Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 27
- 230000000737 periodic effect Effects 0.000 claims abstract description 17
- 238000012544 monitoring process Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 230000002159 abnormal effect Effects 0.000 claims abstract description 10
- 238000012795 verification Methods 0.000 claims abstract description 9
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000012937 correction Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 44
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000007774 longterm Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000012821 model calculation Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims description 3
- 230000001932 seasonal effect Effects 0.000 claims description 3
- 238000011425 standardization method Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims 1
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010187 selection method Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000288105 Grus Species 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/06—Investigating concentration of particle suspensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Dispersion Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于CNNs‑GRU融合深度学习模型的PM2.5预测方法,包括如下步骤:S1:获取某区域若干个监测站的空气质量相关数据,构成多站点多模态空气质量数据集Ω*;S2:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分;S3:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于PM2.5预测的深度学习模型CNNs‑GRU;S4:基于训练集、验证集训练CNNs‑GRU模型,并对模型进行优化;S5:在测试集上运行最优CNNs‑GRU模型,获得某区域未来24小时PM2.5浓度的精细化预测结果。本发明具有考虑多站点多模态空气质量数据的空间分布特征、预测时间步多、泛化能力强和预测准确率高的特点。
Description
技术领域
本发明属于环境科学技术领域,具体涉及一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法。
背景技术
随着工业化和现代化进程的不断深入发展,空气质量问题已经引发了社会的广泛关注,空气中携带的病菌、悬浮的固体颗粒污染物对人体健康构成实质性威胁。2017年Lancet刊载的一项权威研究报告指出,PM2.5污染已经成为排名第五的致死风险因素。因此,开展关于PM2.5浓度质量的预测研究具有十分重要的现实意义。
PM2.5浓度变化受多种因素影响,具有显著的非线性特点,准确预测PM2.5 难度较大。近几年,学术领域基于统计模型对PM2.5的预测进行了大量研究。 Mahajan等人利用ANN模型预测未来1小时PM2.5浓度变化。Pai等人通过七种灰度模型GM(1,1),预测板桥市未来1小时的PM2.5小时浓度。Mahajan 等人提出一种指数平滑模型,基于单站点PM2.5历史数据,预测未来1小时和3小时的PM2.5小时浓度。Biancofiore等人使用循环神经网络(RNN)预测未来3天的PM2.5日平均浓度。Li等人使用深度学习模型LSTM,预测未来 1小时的PM2.5小时浓度。虽然以上方法在特定场景下取得一定成效,但存在预测时间步太少或时间粒度过大的问题,实用价值较差。同时,模型过度依赖于人工特征选择方法,导致模型泛化能力差,忽略相邻区域站点间的空间关联特征,不利于对扩散性较强的PM2.5进行预测。
相关研究表明,考虑时间和空间关系对空气质量分析至关重要。Li等人提出一种时空深度学习模型STDL,利用堆叠自动编码器自动提取空气质量因子的特征,实验证明,通过考虑多站点的空间关联特性,该模型预测未来1 小时PM2.5小时浓度的性能优于其他不考虑空间特征的传统模型,且避免了使用人工特征选择方法,但存在输入特征种类太少、预测时间步少的问题。 Zheng等人提出一种混合模型框架FFA,分别使用线性回归(LR)和ANN模型,提取不同站点输入数据的时间和空间特征,该时空模型较传统模型能更好预测未来6小时的PM2.5小时浓度,不足是依赖人工特征选择,空间预测器仅使用相邻站点划分区域后的特征均值、中值作为输入,降低了模型对多站点空间特征的灵敏度,没有充分利用多站点的空间信息。Huang等人提出一种基于CNN和LSTM的深度学习模型APNet,利用CNN能够自动提取特征的特性, 自动完成对单站点多种特征序列的逐层抽象,LSTM能够记忆序列的前后依赖关系,实验证明,该模型比单独使用CNN、LSTM能更准确地预测未来1小时 PM2.5小时浓度,CNN能够有效代替传统人工特征选择方法,但该模型没有考虑空间关系,预测时间步太短。
为此,我们提出一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,以解决上述背景技术中提到的问题。
发明内容
本发明的目的在于提供一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,包括如下步骤:
S1:获取某区域若干个监测站的空气质量相关数据,构成多站点多模态空气质量数据集Ω*;
S2:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分;
S3:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于 PM2.5预测的深度学习模型CNNs-GRU;
S4:基于训练集、验证集训练CNNs-GRU模型,并对模型进行优化;
S5:在测试集上运行最优CNNs-GRU模型,获得某区域未来24小时PM2.5 浓度的精细化预测结果。
优选的,所述步骤S1中空气质量相关数据包括空气质量因子、气象因子、交通流量数据、区域工业污染源排放量。
优选的,对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分,包括如下:
STEP1:根据所述步骤S1获得的实验数据集Ω*,由于部分特征如风速、风向用文字化形式表示为“3级”、“东南风”,故使用LabelEncoder方法对其进行数值化编码,使输入数据具有统一的二维矩阵结构;
STEP2:根据所述步骤S1获得的实验数据集Ω*,存在时间序列不连续问题,对于缺失时间低于12小时使用三次样条函数插值法填充,超过12小时使用前后一天同时段序列平均值填充,超过24小时,数据集被划分成独立的两部分。
STEP3:根据所述步骤S1获得的实验数据集Ω*,存在个别特征数值异常的情况,处理方法为将该值重置为前后时刻的平均值;
STEP4:根据所述步骤S1获得的实验数据集Ω*,由于空气质量易受周期性社会活动和季节性因素的影响,表现出明显的周期性特点,按照月份和小时的不同组合,扩展1维周期性特征作为模型输入;
STEP5:根据所述步骤S1获得的实验数据集Ω*,不同特征量纲不同,导致大小相差明显,不利于模型计算和收敛,需要对数据集进行标准化处理,此处使用Z-Score标准化方法。
STEP6:根据所述步骤STEP1至STEP5获得的预处理数据集Ω,将全部数据集的20%用于模型测试,剩余数据集的80%用于模型训练、20%用作验证集。
优选的,基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于PM2.5预测的深度学习模型CNNs-GRU,包括如下:
STEP1:构建CNNs结构,该结构由并列、级联连接的1维CNN构成;并列连接的CNN单元和同等数量的二维输入矩阵单元对应,每组二维矩阵由某区域全部监测站的单模态空气质量数据时间序列构成,多模态对应多组二维输入矩阵单元,通过并列CNN单元层自动提取多组多站点单模态输入的局部变化趋势和空间关联特征;级联CNN层进行特征水平的融合和更深层的特征抽象,输出多站点多模态空气质量数据的融合时空特征;
STEP2:构建GRU网络,由若干GRU层构成;GRU有更新门和重置门两个门结构,如果更新门被激活,GRU能捕获多模态空气时间序列的长期依赖特征;反之,它会记忆短期的历史信息;将某区域的多站点多模态空气质量数据的抽象融合时空特征作为GRU网络的输入,能进一步提取隐含着的长期依赖特征,有助于PM2.5预测;
STEP3:构建全连接网络,由输入适量矢量化层和全连接层构成,它以 y=x为线性激活函数,输出某区域站点附近未来24小时PM2.5浓度的精细化预测结果。
优选的,基于训练集、验证集训练CNNs-GRU模型,并对模型进行优化,包括如下:
STEP1:设置CNNs-GRU网络结构和其他训练相关的超参数,使其适用于 PM2.5预测;
STEP2:对CNNs-GRU融合深度学习模型的优化。
优选的,在测试集上运行该最优CNNs-GRU模型,获得某区域未来24小时PM2.5浓度的精细化预测结果,包括如下:
在测试集上运行最优CNNs-GRU模型,获得标准化预测结果,并对该结果进行逆标准化操作,最终获得某区域未来24小时PM2.5浓度的精细化预测结果。
与现有技术相比,本发明的有益效果是:
(1)独特的CNNs结构设计,能够自动提取、融合多站点多模态空气数据的局部变化趋势特征和空间关联特征,代替传统的人工特征选取方法,有助于PM2.5预测准确率的提升和预测模型的泛化能力;
(2)使用了处理时间序列性能优异的GRU模型,GRU能够充分挖掘时间序列中隐藏的长时依赖特性,提升PM2.5预测准确度;
(3)CNNs-GRU融合深度学习模型提供未来24小时PM2.5浓度的精细化预测,而不像传统方法仅预测未来几个或一个小时(天)浓度值,甚至只简单地预测污染等级,因此更具有实用价值。
附图说明
图1为本发明所述的PM2.5预测总体流程图;
图2为本发明所述的CNNs-GRU融合深度学习模型;
图3为本发明所述的1维CNN卷积原理示意图;
图4为本发明所述的GRU典型结构图;
图5为本发明所述的CNNs-GRU模型训练流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明针对以上问题,基于卷积神经网络(CNN)和门限循环单元(GRU),提出一种能自动提取多站点多模态空气质量数据时空特征的PM2.5预测模型。该模型以某区域多个空气质量监测站的空气质量因子、气象因子时间序列为输入,通过CNNs自动提取、融合多站点多模态空气质量数据的局部变化趋势和空间关联特征,并将CNNs输出的结果输入到GRU网络,进一步捕获空气质量数据的长期依赖特征。最后,构建全连接网络,以GRU网络输出的时空特征为输入,输出未来24小时PM2.5浓度的精细化预测结果。
如本发明图1PM2.5预测总体流程图所示,主要分为以下步骤:S1:获取某区域多个监测站的空气质量相关数据,构成多站点多模态空气质量数据集Ω*;S2:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分;S3:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于PM2.5预测的深度学习模型CNNs-GRU;S4:基于训练集、验证集训练CNNs-GRU模型,并对模型进行优化;S5:在测试集上运行最优CNNs-GRU模型,获得某区域未来24小时PM2.5 的精细化预测结果。
S1:获取某区域多个监测站的空气质量相关数据,构成多站点多模态空气质量数据集Ω*,包括如下:
由于要考虑多种空气质量污染相关数据和站点空间分布对PM2.5浓度变化的影响,因此,需要获取研究区域内多个监测站的空气质量相关数据,如空气质量因子、气象因子、交通流量数据、区域工业污染源排放量等,构成多站点多模态空气质量数据集Ω*。本专利获得了无锡市环保局提供的空气质量数据集,多站点多模态数据集采集自无锡市13个空气质量监测站的两类数据:空污染因子、气象因子,各模态数据的采集周期均为小时,详细见表1 所示。如果能获取到对应区域的交通流量、工业排放量等数据,将进一步提升该模型的预测性能。
表1多站点多模态空气质量数据集
S2:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分,包括如下:
STEP1:根据所述步骤S1获得的实验数据集Ω*,由于部分特征如风速、风向用文字化形式表示为“3级”、“东南风”,故使用LabelEncoder方法对其进行数值化编码,使输入数据具有统一的二维矩阵结构;
STEP2:根据所述步骤S1获得的实验数据集Ω*,存在时间序列不连续问题,对于缺失时间低于12小时使用三次样条函数插值法填充,超过12小时使用前后一天同时段序列平均值填充,超过24小时,数据集被划分成独立的两部分;
STEP3:根据所述步骤S1获得的实验数据集Ω*,存在个别特征数值异常的情况,处理方法为将该值重置为前后时刻的平均值;
STEP4:根据所述步骤S1获得的实验数据集Ω*,由于空气质量易受周期性社会活动和季节性因素的影响,表现出明显的周期性特点,按照月份和小时的不同组合,扩展1维周期性特征作为模型输入,具体转换标准见表2;
表2空气质量周期性特征构造标准
STEP5:根据所述步骤S1获得的实验数据集Ω*,不同特征量纲不同,导致大小相差明显,不利于模型计算和收敛,需要对数据集进行标准化处理,此处使用Z-Score标准化方法。
STEP6:根据所述步骤STEP1至STEP5获得的预处理数据集Ω,将全部数据集的20%用于模型测试,剩余数据集的80%用于模型训练、20%用作验证集。
S3:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于 PM2.5预测的深度学习模型CNNs-GRU,结合本发明图2所示的CNNs-GRU模型架构,包括如下:
STEP1:构建CNNs结构,该结构由并列、级联连接的1维CNN构成。并列连接的CNN和同等数量的二维输入矩阵单元对应,每组二维矩阵由某区域全部监测站的单模态空气质量数据(如PM2.5、NO2或风速等)时间序列构成,多模态对应多组二维输入矩阵单元,通过并列CNN层自动提取多组多站点单模态输入的局部变化趋势和空间关联特征。级联CNN层进行特征水平的融合和更深层的特征抽象,输出多站点多模态空气质量数据的融合时空特征。
如本发明图3所示的1维CNN卷积原理,CNNs结构的核心组成单元是1 维CNN,每个1维CNN包含若干大小相同的1维卷积核。以某个区域所有空气质量监测站采集的PM2.5数据为例,图3展示了1维CNN如何自动提取、融合多站点单模数据的时空特征。
1维卷积核的长度表示局部感受野大小,对应延时间轴方向覆盖的多站点 PM2.5序列向量的个数,宽度默认覆盖来自目标区域的全部空气质量监测站的单模态PM2.5序列,其跨度等于监测站数量。卷积核通过赋不同的值给连接多个站点的PM2.5输入,学习多站点数据之间的空间关联特征。卷积核延时间轴滑动,自动提取多站点单模态PM2.5时间维度的局部变化趋势。多个卷积核从不同角度学习多种特征向量表示,多个特征向量沿着数据维度合并,输出多站点单模态输入的时空特征,继续作为后续层输入。
以下是对CNNs结构的公式化推导过程。假设有N组样本数据,M种空气质量属性,数据源自P个监测站,则多站点单模态n构成的二维输入矩阵单元可表示为:
假设CNN单元包含V个1维卷积核,第i个卷积核ki表示为Wi∈RT×P,T表示卷积核沿时间轴一次处理的时间序列长度,对应的卷积过程可表示为:
其中,σ为激活函数,本专利采用ELU(Exponential Linear Unit)。卷积核ki沿着时间轴滑动,这里假设stride=1,卷积结果为[N-T+1]×1大小的特征向量V个1维卷积核的卷积结果沿特征方向合并为[t,t+T-1]×V大小的An, An表示多站点单模态空气质量属性n对应的时空特征矩阵。
以上是1维CNN单元的公式化表示,完成了多站点单模态空气质量输入(如 PM2.5)的时空特征抽象。由于有M空气质量属性,CNNs结构首先通过并列的 1维CNN单元,将以上过程作用于其他模态的空气质量数据(如PM10、SO2、风速等),从而自动提取多种多站点单模态空气质量数据的时空特征抽象,并进行特征级别的融合,获得多站点多模态空气质量数据的融合时空特征矩阵 A,如公式(7)所示。然后,将A作为后续级联1维CNN层的输入,继续按照公式(3)-(7)提取更抽象的融合时空特征。
A=[A1,A2,…,AM] (8)
STEP2:构建GRU网络,由若干GRU层构成。GRU模型结构如图4所示,门结构保证其能够处理时间序列长短期依赖问题,计算公式如下:
zt=σ(Z(z)·[ht-1,xt]) (9)
rt=σ(W(r)·[ht-1,xt]) (10)
其中,zt、rt分别表示更新门、重置门,ht、分别代表t时刻的隐含状态和候选隐含状态,σ是激活函数。基于以上过程,如果更新门被激活,GRU能捕获到空气质量时间序列的长期依赖特征;反之,它会记忆短期历史信息。将某区域多站点多模态空气质量数据的抽象融合时空特征输入GRU网络,能进一步提取隐含着的长期依赖特征,有助于PM2.5预测。
STEP3:构建全连接网络,由输入适量矢量化层和全连接层构成,它以y=x 为线性激活函数,输出某区域站点附近未来24小时PM2.5浓度的精细化预测结果。
S4:基于训练集、验证集训练CNNs-GRU模型,并对模型进行优化,包括如下:
STEP1:设置CNNs-GRU网络的拓扑结构和训练相关的超参数。其中模型输入按照S3中介绍的1维CNN原理,确定并列连接的CNN个数和输入序列的大小,输出是具有24个神经元的全连接层。本专利结合基于多站点多模态空气质量数据某区域未来24小时PM2.5浓度变化的目标,构建的CNNs-GRU模型具有8层网络,结构设置如表3所示。训练超参数设置需要经过不断试验,找到效果相对理想的参数组合,具体设置如表4所示;
表3 CNNs-GRU模型的网络结构参数设置
表4 CNNs-GRU模型的训练超参数设置
STEP2:为了促进模型快速收敛、减少过拟合的发生,对CNNs-GRU融合深度学习模型进行了优化,使用了参数为min_delta=0.002、patience=10的 Earlystop方法,batchNormalization使用默认参数,而dropout的参数 dropout_rate设置为0.35。
基于以上设置,按照如本发明图5所示的训练流程图进行模型训练以,获得最优的CNNs-GRU模型。
S5:在测试集上运行最优CNNs-GRU模型,获得某区域未来24小时PM2.5 的精细化预测结果,其包括如下:
在测试集上,运行S4获得的最优CNNs-GRU融合深度学习模型,获得目标区域未来24小时PM2.5浓度的精细化预测结果。
综上所述,与现有技术相比:本发明独特的CNNs结构设计,能够自动提取、融合多站点多模态空气数据的局部变化趋势特征和空间关联特征,代替传统的人工特征选取方法,有助于PM2.5预测准确率的提升和预测模型的泛化能力;
使用了处理时间序列性能优异的GRU模型,GRU能够充分挖掘时间序列中隐藏的长时依赖特性,提升PM2.5预测准确度;
CNNs-GRU融合深度学习模型提供未来24小时PM2.5浓度的精细化预测,而不像传统方法仅预测未来几个或一个小时(天)浓度值,甚至只简单地预测污染等级,因此更具有实用价值。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,其特征在于:包括如下步骤:
S1:获取某区域若干个监测站的空气质量相关数据,构成多站点多模态空气质量数据集Ω*;
S2:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分;
S3:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于PM2.5预测的深度学习模型CNNs-GRU;
S4:基于训练集、验证集训练CNNs-GRU模型,并对模型进行优化;
S5:在测试集上运行最优CNNs-GRU模型,获得某区域未来24小时PM2.5浓度的精细化预测结果。
2.根据权利要求1所述的一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,其特征在于:所述步骤S1中空气质量相关数据包括空气质量因子、气象因子、交通流量数据、区域工业污染源排放量。
3.根据权利要求1所述的一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,其特征在于:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分,包括如下:
STEP1:根据所述步骤S1获得的实验数据集Ω*,由于部分特征如风速、风向用文字化形式表示为“3级”、“东南风”,故使用LabelEncoder方法对其进行数值化编码,使输入数据具有统一的二维矩阵结构;
STEP2:根据所述步骤S1获得的实验数据集Ω*,存在时间序列不连续问题,对于缺失时间低于12小时使用三次样条函数插值法填充,超过12小时使用前后一天同时段序列平均值填充,超过24小时,数据集被划分成独立的两部分;
STEP3:根据所述步骤S1获得的实验数据集Ω*,存在个别特征数值异常的情况,处理方法为将该值重置为前后时刻的平均值;
STEP4:根据所述步骤S1获得的实验数据集Ω*,由于空气质量易受周期性社会活动和季节性因素的影响,表现出明显的周期性特点,按照月份和小时的不同组合,扩展1维周期性特征作为模型输入;
STEP5:根据所述步骤S1获得的实验数据集Ω*,不同特征量纲不同,导致大小相差明显,不利于模型计算和收敛,需要对数据集进行标准化处理,此处使用Z-Score标准化方法;
STEP6:根据所述步骤STEP1至STEP5获得的预处理数据集Ω,将全部数据集的20%用于模型测试,剩余数据集的80%用于模型训练、20%用作验证集。
4.根据权利要求1所述的一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,其特征在于:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于PM2.5预测的深度学习模型CNNs-GRU,包括如下:
STEP1:构建CNNs结构,该结构由并列、级联连接的1维CNN构成;并列连接的CNN单元和同等数量的二维输入矩阵单元对应,每组二维矩阵由某区域全部监测站的单模态空气质量数据时间序列构成,多模态对应多组二维输入矩阵单元,通过并列CNN单元层自动提取多组多站点单模态输入的局部变化趋势和空间关联特征;级联CNN层进行特征水平的融合和更深层的特征抽象,输出多站点多模态空气质量数据的融合时空特征;
STEP2:构建GRU网络,由若干GRU层构成;GRU有更新门和重置门两个门结构,如果更新门被激活,GRU能捕获多模态空气时间序列的长期依赖特征;反之,它会记忆短期的历史信息;将某区域的多站点多模态空气质量数据的抽象融合时空特征作为GRU网络的输入,能进一步提取隐含着的长期依赖特征,有助于PM2.5预测;
5.根据权利要求1所述的一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,其特征在于:基于训练集、验证集训练CNNs-GRU模型,并对模型进行优化,包括如下:
STEP1:设置CNNs-GRU网络结构和其他训练相关的超参数,使其适用于PM2.5预测;
STEP2:对CNNs-GRU融合深度学习模型的优化。
6.根据权利要求1所述的一种基于CNNs-GRU融合深度学习模型的PM2.5预测方法,其特征在于:在测试集上运行该最优CNNs-GRU模型,获得某区域未来24小时PM2.5浓度的精细化预测结果,包括如下:
在测试集上运行最优CNNs-GRU模型,获得标准化预测结果,并对该结果进行逆标准化操作,最终获得某区域未来24小时PM2.5浓度的精细化预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110966164.XA CN114444561A (zh) | 2021-08-23 | 2021-08-23 | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110966164.XA CN114444561A (zh) | 2021-08-23 | 2021-08-23 | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114444561A true CN114444561A (zh) | 2022-05-06 |
Family
ID=81362660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110966164.XA Pending CN114444561A (zh) | 2021-08-23 | 2021-08-23 | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114444561A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114694767A (zh) * | 2022-05-31 | 2022-07-01 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
CN114897250A (zh) * | 2022-05-22 | 2022-08-12 | 浙江农林大学 | 融合空间和统计特征的cnn-gru臭氧浓度预测模型建立方法、预测方法及模型 |
CN115690556A (zh) * | 2022-11-08 | 2023-02-03 | 河北北方学院附属第一医院 | 一种基于多模态影像学特征的图像识别方法及系统 |
CN116448966A (zh) * | 2023-06-15 | 2023-07-18 | 吉林省中农阳光数据有限公司 | 基于智能物联网和深度学习相结合的空气质量评估方法 |
-
2021
- 2021-08-23 CN CN202110966164.XA patent/CN114444561A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114897250A (zh) * | 2022-05-22 | 2022-08-12 | 浙江农林大学 | 融合空间和统计特征的cnn-gru臭氧浓度预测模型建立方法、预测方法及模型 |
CN114694767A (zh) * | 2022-05-31 | 2022-07-01 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
CN115690556A (zh) * | 2022-11-08 | 2023-02-03 | 河北北方学院附属第一医院 | 一种基于多模态影像学特征的图像识别方法及系统 |
CN116448966A (zh) * | 2023-06-15 | 2023-07-18 | 吉林省中农阳光数据有限公司 | 基于智能物联网和深度学习相结合的空气质量评估方法 |
CN116448966B (zh) * | 2023-06-15 | 2023-09-12 | 吉林省中农阳光数据有限公司 | 基于智能物联网和深度学习相结合的空气质量评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492830B (zh) | 一种基于时空深度学习的移动污染源排放浓度预测方法 | |
CN114444561A (zh) | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 | |
CN108900346B (zh) | 基于lstm网络的无线网络流量预测方法 | |
CN107909206B (zh) | 一种基于深层结构循环神经网络的pm2.5预测方法 | |
CN113554466B (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN111695731B (zh) | 基于多源数据和混合神经网络的负荷预测方法、系统及设备 | |
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
CN110046743A (zh) | 基于ga-ann的公共建筑能耗预测方法和系统 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN112130086B (zh) | 一种动力电池剩余寿命预测方法及系统 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN117668743B (zh) | 一种关联时空关系的时序数据预测方法 | |
CN114492978B (zh) | 一种基于多层注意力机制的时空序列预测方法及设备 | |
CN114297907A (zh) | 温室环境空间分布预测方法及装置 | |
CN109034500A (zh) | 一种多时序协同的中期电力负荷预测方法 | |
CN110619427A (zh) | 基于序列到序列学习模型的交通指数预测方法和装置 | |
CN110889560A (zh) | 一种具有深度可解释性的快递序列预测的方法 | |
CN115222106A (zh) | 一种自适应模型的用户日前负荷预测方法 | |
CN114694767B (zh) | 基于时空图常微分方程网络的pm2.5浓度预测方法 | |
CN113516304A (zh) | 基于时空图网络的区域污染物时空联合预测方法及装置 | |
CN114580762A (zh) | 一种基于XGBoost的水文预报误差校正方法 | |
CN113033081A (zh) | 一种基于som-bpnn模型的径流模拟方法及系统 | |
CN115456245A (zh) | 一种感潮河网区溶解氧预测方法 | |
CN113947182A (zh) | 基于双阶段堆叠图卷积网络的交通流预测模型构建方法 | |
CN115755219A (zh) | 基于stgcn的洪水预报误差实时校正方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |