CN110782093A - 一种融合ssae深度特征学习和lstm网络的pm2.5小时浓度预测方法及系统 - Google Patents

一种融合ssae深度特征学习和lstm网络的pm2.5小时浓度预测方法及系统 Download PDF

Info

Publication number
CN110782093A
CN110782093A CN201911026860.1A CN201911026860A CN110782093A CN 110782093 A CN110782093 A CN 110782093A CN 201911026860 A CN201911026860 A CN 201911026860A CN 110782093 A CN110782093 A CN 110782093A
Authority
CN
China
Prior art keywords
ssae
lstm
network
training
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911026860.1A
Other languages
English (en)
Other versions
CN110782093B (zh
Inventor
邬群勇
邓丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201911026860.1A priority Critical patent/CN110782093B/zh
Publication of CN110782093A publication Critical patent/CN110782093A/zh
Application granted granted Critical
Publication of CN110782093B publication Critical patent/CN110782093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法及系统,构建SSAE‑LSTM模型,将一定时间步长的空气污染物时间序列输入该模型,采用SSAE网络通过无监督的方法提取输入数据的抽象特征,将提取的特征作为LSTM网络的输入特征,获取一定时间步长内空气污染物信息的特征分布,最后结合全连接网络预测PM2.5小时浓度。本发明能够有效提高预测的准确率。

Description

一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测 方法及系统
技术领域
本发明涉及PM2.5预测领域,特别是一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法及系统。
背景技术
近年来,以PM2.5为重要组分的雾霾污染高度频发,给人类生活和生态环境带来了严重的危害。考虑到大气环境的时效性及动态性,实现精准的PM2.5浓度小时预测,可以有效地提高对空气污染的预报预警能力,亦是当前空气质量预报和防治的重要研究方向。
目前空气污染物浓度预测模型大致分为机理模型和非机理模型两种。其中,机理模型通过模拟空气污染物的扩散过程预测污染物浓度,其结果的优劣很大程度上依赖于空气污染物排放源清单的精度。非机理模型以污染物浓度及气象要素的历史数据为基础,采用多元线性回归、随机森林、人工神经网络等方法预测空气污染物浓度,其具有构建简单、数据易获取等优点,在空气质量预报中得到广泛应用。非机理模型中,具有时序记忆性的长短期记忆神经网络(long-short term memory,LSTM)在PM2.5预测方面取得了一定成果,但仍存在以下2个问题:1)现有的一些方法仅考虑了气象因素对PM2.5的影响或者仅考虑空气污染物对PM2.5的影响,忽略了PM2.5的空间相关性且没有将PM2.5的影响因素综合起来考虑;2)现有的方法根据某种评价准则或根据经验知识从大量影响特征中选取对PM2.5具有重要影响力的特征,很难选出最优的组合。
发明内容
有鉴于此,本发明的目的是提出一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法及系统,能够有效提高预测的准确率。
本发明采用以下方案实现:一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,具体为:构建SSAE-LSTM模型,将一定时间步长的空气污染物时间序列输入该模型,采用SSAE网络通过无监督的方法提取输入数据的抽象特征,将提取的特征作为LSTM网络的输入特征,获取一定时间步长内空气污染物信息的特征分布,最后结合全连接网络预测PM2.5小时浓度。
进一步地,所述一定时间步长的空气污染物时间序列为X=(X1,X2,...,Xt,...XM),M为输入时间序列的步长,Xt包含站点sn在t时刻的空气污染物变量、气象变量、时间特征变量和空间特征变量的小时值数据,其中空气污染物变量包括站点位置处的包括PM2.5、PM10、SO2、NO2、O3和CO在内的空气污染物小时浓度数据及24小时浓度均值;气象变量包括站点位置处的气温、相对湿度、降雨量、风速和风向小时数据;时间特征变量包括年份、季节、月份、日内小时时刻;空间特征变量包括站点位置、站点所在的城市、以及距离站点最邻近的k个站点的包括PM2.5、PM10、SO2、NO2、O3和CO在内的空气污染物小时浓度数据及24小时浓度均值。
进一步地,k=6。
进一步地,所述SSAE-LSTM模型包括SSAE网络模块、LSTM网络模块以及全连接网络模块;
所述SSAE网络模块由3个SAE堆叠而成,各SAE之间,前一个SAE的隐含层作为下一个SAE的输入层,最后一个SAE的隐含层ht为输入向量Xt最终的深度特征表示;
所述LSTM网络模块由三个门控制,这三个门分别是遗忘门、输入门和输出门;其中遗忘门遗忘记忆单元中无用的历史信息,输入门根据t时刻SSAE网络模块的输出向量以及t-1时刻LSTM网络模块的输出向量对t-1时刻的记忆单元进行状态更新并得到t时刻的记忆单元,输出门对t时刻记忆单元的信息进行筛选并得到t时刻LSTM网络的输出变量;
所述全连接网络模块由2个全连接层组成,以多层人工神经网络的方式对LSTM网络模块的输出特征进行整合和降维,并输出下一时刻的PM2.5小时浓度预测值。
进一步地,全连接网络模块得到预测值后,计算预测值和真实值的误差,以调整网络各层的连接权值。
进一步地,所述SSAE-LSTM模型的训练和验证具体为:从空气污染物时间序列中选取样本集,并划分为训练数据集、测试数据集和验证数据集,通过训练数据集和验证数据集对所述的SSAE-LSTM模型进行训练和验证。
进一步地,所述SSAE-LSTM模型的训练和验证具体包括以下步骤:
步骤S1:对于任一站点,按照时间顺序依次从空气污染物时间序列中提取样本,第i个样本结构为
Figure BDA0002248916350000031
其中,
Figure BDA0002248916350000032
为第i时刻、距离i时刻最近的6个时刻、距离i时刻24小时的时刻的历史时序数据,
Figure BDA0002248916350000033
为i+1时刻PM2.5小时浓度值;
步骤S2:将样本集划分为测试集、训练集和验证集,验证集用于验证模型的预测效果并防止过拟合;
步骤S3:通过训练数据集对SSAE-LSTM模型进行训练,其中,模型训练分为2个阶段,分别是逐层预训练和整体微调;在逐层预训练阶段,采用无监督学习机制利用逐层贪婪学习方法训练同结构的SSAE网络模块,这一阶段SSAE网络的输入和输出均为样本中的部分;在整体精调阶段,采用监督学习机制,首先将训练得到的SSAE网络参数设为SSAE-LSTM模型中SSAE网络模块的初始参数,然后以预测数据与真实数据之间的损失值为网络收敛代价,使用梯度下降法调整SSAE-LSTM模型的整体权值,这一阶段SSAE-LSTM模型的输入为样本中的部分,输出为样本中的
Figure BDA0002248916350000045
部分;
步骤S4:通过验证数据集对SSAE-LSTM模型进行验证,首先计算SSAE-LSTM模型在验证集上的预测效果,如果预测效果低于预设的阈值,则调整模型SSAE-LSTM参数,继续训练网络,反之则停止训练,保存SSAE-LSTM模型。
进一步地,在逐层预训练阶段,SSAE网络模块的训练目标为最小化输入Xt与输出
Figure BDA0002248916350000042
的重构误差。
进一步地,在整体精调阶段,SSAE-LSTM模型的训练目标为最小化预测值与真实值
Figure BDA0002248916350000043
的均方误差。
本发明还提供了一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测系统,包括存储器、处理器以及存储在存储器上并能够在处理器上运行的计算机程序,当所述处理器执行所述计算机程序时能够实现如上文所述的方法步骤。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当该计算机程序被处理器执行时,能够实现如上文所述的方法步骤。
与现有技术相比,本发明有以下有益效果:
1、本发明综合考虑了时间因素、空间因素、气象因素和相关空气污染物对PM2.5的影响,使得SSAE-LSTM模型能够同时对各个空气监测站点的PM2.5浓度进行协同训练和预测,解决了传统机器学习方法需对每个站点进行逐个训练和预测的问题,并在一定程度上提高了预测准确率。
2、本发明采用栈式稀疏自编码器从大量PM2.5影响特征中自动选取抽象特征,且相较于传统的特征提取方法,本发明中基于栈式稀疏自编码器的特征提取方法具有通用性,更加实用。
附图说明
图1为本发明实施例的SSAE-LSTM网络结构示意图。
图2为本发明实施例的SSAE网络结构示意图。
图3为本发明实施例的LSTM网络结构示意图。
图4为本发明实施例的方法流程示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例提供了一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,具体为:构建SSAE-LSTM模型,将一定时间步长的空气污染物时间序列输入该模型,采用SSAE网络通过无监督的方法提取输入数据的抽象特征,将提取的特征作为LSTM网络的输入特征,获取一定时间步长内空气污染物信息的特征分布,最后结合全连接网络预测PM2.5小时浓度。
较佳的,分析PM2.5的影响因素发现:1)PM2.5与PM10、SO2、NO2、CO、O3等空气污染物浓度具有较强的相关性;2)PM2.5浓度与温度、风速、降雨呈负相关关系,与相对湿度呈正相关关系,且不同风向对PM2.5影响显著;3)PM2.5浓度在年、季度、月度、日内小时等四个时间尺度上具有不同的时间变化规律。4)空气监测站点的空气质量浓度与空间上邻近站点的空气质量浓度有较强的相关性,且不同站点由于所处城市不同,而具有不同的PM2.5分布特征。故本实施例选取上述各个影响因素为PM2.5的预测特征,收集相关的空气污染物数据和气象要素数据,对空气污染物时间序列进行属性扩展。
具体的,在本实施例中,所述一定时间步长的空气污染物时间序列为X=(X1,X2,...,Xt,...XM),M为输入时间序列的步长,Xt包含站点sn在t时刻的空气污染物变量、气象变量、时间特征变量和空间特征变量的小时值数据,其中空气污染物变量包括站点位置处的包括PM2.5、PM10、SO2、NO2、O3和CO在内的空气污染物小时浓度数据及24小时浓度均值;气象变量包括站点位置处的气温、相对湿度、降雨量、风速和风向小时数据;时间特征变量包括年份、季节、月份、日内小时时刻;空间特征变量包括站点位置、站点所在的城市、以及距离站点最邻近的k个站点的包括PM2.5、PM10、SO2、NO2、O3和CO在内的空气污染物小时浓度数据及24小时浓度均值。
经分析发现PM2.5与邻近6个站点的空气污染物具有较强的相关性,因此,本实施例中,k=6。
在本实施例中,所述SSAE-LSTM模型包括SSAE网络模块、LSTM网络模块以及全连接网络模块;如图1所示,输入数据模块按照时间维度将空气污染物序列输入到SSAE网络中;SSAE网络模块提取输入数据的抽象特征,并按照时间先后序列将SSAE网络最后一个隐藏层的最高阶特征输入到LSTM网络中;LSTM网络模块输出空气污染物信息的分布特征;全连接网络模块以多层人工神经网络的方式对LSTM模块的输出特征进行整合和降维,并预测空气监测站点在后一时刻的PM2.5小时浓度。
各模块的具体内容如下:
如图2所示,所述SSAE网络模块由3个SAE堆叠而成,各SAE之间,前一个SAE的隐含层作为下一个SAE的输入层,最后一个SAE的隐含层ht为输入向量Xt最终的深度特征表示;
SAE是一种对称的3层神经网络,分为输入层、隐含层和输出层3层。在编码阶段,通过式(1)将输入层的Xt映射到低维隐含层,得到编码向量ht
ht=f(W1Xt+b1);(1)
式中,f(*)是激活函数,本实施例采用Relu激活函数,W1表示编码层的权重矩阵,b1表示编码层的偏置。
在解码阶段,通过式(2)将隐含层的低维编码向量ht映射到高维输出层,对输入Xt进行重建:
Figure BDA0002248916350000081
式中,f(*)是激活函数,本实施例采用Relu激活函数,W2表示解码层的权重矩阵,b2表示解码层的偏置。
SAE训练目标为尽可能减少输入Xt和输出
Figure BDA0002248916350000082
的重构误差,损失函数可以表示为:
Figure BDA0002248916350000083
式中,
Figure BDA0002248916350000084
为输入Xt和输出的均方误差代价函数项,M为时间序列步长。
Figure BDA0002248916350000086
为隐含层神经元的稀疏性约束项,β表示稀疏性约束项的权重,s2表示网络隐含层的神经元数目,索引j表示第j个隐含层神经元,KL表示Kullback-Leibler散度函数,表示隐含层神经元的平均活跃度,ρ为稀疏性参数,是一个接近于0的常量,通常取0.01。表示分别以
Figure BDA0002248916350000089
和ρ为均值的两个变量之间的相对熵,计算公式如下:
Figure BDA00022489163500000810
如图3所示,所述LSTM网络模块由三个门控制,这三个门分别是遗忘门、输入门和输出门;其中遗忘门遗忘记忆单元中无用的历史信息,输入门根据t时刻SSAE网络模块的输出向量以及t-1时刻LSTM网络模块的输出向量对t-1时刻的记忆单元进行状态更新并得到t时刻的记忆单元,输出门对t时刻记忆单元的信息进行筛选并得到t时刻LSTM网络的输出变量;
令St表示t时刻SSAE网络的输出向量,ht-1表示t-1时刻LSTM网络的输出向量,Ct-1表示t-1时刻LSTM网络的记忆单元,则LSTM的具体工作机制如下:
首先,遗忘门将记忆单元Ct-1乘上衰减系数ft,遗忘记忆单元中无用的历史信息,ft的计算公式如下:
ft=σ(Wf·[ht-1,St]+bf);
接着,输入门根据St和ht-1对记忆单元Ct-1进行状态更新:
it=σ(Wi·[ht-1,St]+bi);
Figure BDA0002248916350000091
Figure BDA0002248916350000092
最后,输出门输出当前时刻ht的信息:
ot=σ(Wσ·[ht-1,St]+bσ);
ht=ot*tanh(Ct);
其中,σ是sigmoid函数,tanh是tanh激活函数,Wf,Wi,WC,Wσ和bf,bi,bC,bσ分别表示权重矩阵和偏置。
所述全连接网络模块由2个全连接层组成,以多层人工神经网络的方式对LSTM网络模块的输出特征进行整合和降维,并输出下一时刻的PM2.5小时浓度预测值。全连接层主要公式如下:
式中,f(·)为Relu激活函数,wij为第l层的节点j到第l+1层的节点i的权值,Bl为偏置。
在本实施例中,全连接网络模块得到预测值后,计算预测值和真实值的误差,以调整网络各层的连接权值。假定输出的预测序列为
Figure BDA0002248916350000102
真实的PM2.5小时浓度为Y=(y1,...,yi,...,yn),定义全连接层的损失函数为预测值和真实值的平方损失函数,公式如下:
Figure BDA0002248916350000103
在本实施例中,所述SSAE-LSTM模型的训练和验证具体为:从空气污染物时间序列中选取样本集,并划分为训练数据集、测试数据集和验证数据集,通过训练数据集和验证数据集对所述的SSAE-LSTM模型进行训练和验证。
在本实施例中,所述SSAE-LSTM模型的训练和验证具体包括以下步骤:
步骤S1:对于任一站点,按照时间顺序依次从空气污染物时间序列中提取样本,第i个样本结构为其中,
Figure BDA0002248916350000105
为第i时刻、距离i时刻最近的6个时刻、距离i时刻24小时的时刻的历史时序数据,
Figure BDA0002248916350000106
Figure BDA0002248916350000107
为i+1时刻PM2.5小时浓度值;
步骤S2:将样本集划分为测试集、训练集和验证集,验证集用于验证模型的预测效果并防止过拟合;
步骤S3:通过训练数据集对SSAE-LSTM模型进行训练,其中,模型训练分为2个阶段,分别是逐层预训练和整体微调;在逐层预训练阶段,采用无监督学习机制利用逐层贪婪学习方法训练同结构的SSAE网络模块,这一阶段SSAE网络的输入和输出均为样本中的
Figure BDA0002248916350000114
部分,训练目标为最小化输入Xt与输出的重构误差;在整体精调阶段,采用监督学习机制,首先将训练得到的SSAE网络参数设为SSAE-LSTM模型中SSAE网络模块的初始参数,然后以预测数据与真实数据之间的损失值为网络收敛代价,使用梯度下降法调整SSAE-LSTM模型的整体权值,这一阶段SSAE-LSTM模型的输入为样本中的
Figure BDA0002248916350000111
部分,输出为样本中的
Figure BDA0002248916350000112
部分;在该整体精调阶段,SSAE-LSTM模型的训练目标为最小化预测值与真实值
Figure BDA0002248916350000113
的均方误差;
步骤S4:通过验证数据集对SSAE-LSTM模型进行验证,首先计算SSAE-LSTM模型在验证集上的预测效果,如果预测效果低于预设的阈值,则调整模型SSAE-LSTM参数,继续训练网络,反之则停止训练,保存SSAE-LSTM模型。
本实施例还提供了一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测系统,包括存储器、处理器以及存储在存储器上并能够在处理器上运行的计算机程序,当所述处理器执行所述计算机程序时能够实现如上文所述的方法步骤。
本实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当该计算机程序被处理器执行时,能够实现如上文所述的方法步骤。
特别的,为了更好地说明本实施例的技术效果,接下来结合具体的例子进行说明。
如图4所示,本实施例提供以下具体步骤:
步骤S1:收集数据。实例以PM2.5空气污染较严重的京津冀地区为研究区域,使用的实验数据包括两类:地面监测站实测空气质量浓度数据以及城市气象监测数据。
空气质量监测数据来自于中国环境监测总站的全国城市空气质量实时发布平台,考虑到数据缺失问题,选取了2016年1月1日至2018年12月31日期间京津冀地区71个监测站点的空气质量监测数据,共186万多条,数据更新频率为1次/h,除时间标识外,每条数据包括当前时刻的PM2.5、PM10、SO2、NO2、O3、CO小时浓度,以及此前24小时的PM2.5、PM10、SO2、NO2、O3、CO浓度均值。
气象监测数据来自与环境云官方网站(http://www.envicloud.cn/),通过环境云网站提供的城市编码和指定小时历史天气API获取了2016年1月1日至2018年12月31日期间京津冀71个空气监测站点所在的城市城区的天气数据,共16万多条,数据更新频率为1次/h,除时间标识外,每条数据包括当前时刻的气温,相对湿度,降雨量,风向,风速等5个指标。
步骤S2:数据预处理。数据质量直接影响预测模型的效果,因此需对数据进行预处理,数据预处理主要包括数据缺失值处理、异常值处理、量纲归一化和特征化处理。
步骤S3:属性扩展。选取时间因素、空间因素、气象因素和相关空气污染物等PM2.5的各个影响因素,对京津冀地区71个站点的空气污染数据数据进行属性扩展。由于有研究表明京津冀地区空气监测站点与渤海湾的相对位置不同(渤海湾以南或渤海湾以北)而具有不同的PM2.5分布特征,故实例在空间因素中加入‘站点相对于渤海湾的位置’变量。对于任一站点,在2016/1/1至2018/12/31期间内共获取26304条小时数据,组成的时间序列为X=(X1,X2,...,Xt,...,X26304),每个Xt为属性扩展后的向量,Xt包含站点在t时刻的空气污染物、气象要素、时间特征和空间特征等96项相关特征:
(1)空气污染物变量:站点位置处的PM2.5、PM10、SO2、NO2、O3和CO等空气污染物小时浓度数据及24小时浓度均值,共12个空气污染物变量。
(2)气象变量:站点位置处的气温、相对湿度、降雨量、风速和风向数据,共5个变量气象变量。
(3)时间特征变量:年份、季节、月份、日内小时时刻,共4个时间特征变量。
(4)空间特征变量:站点位置(由于部分站点距离较近,站点间的经纬度差异不明显,故本实例用站点编号表示站点位置,将不同站点分开)、站点所在的城市、站点相对于渤海湾的位置(渤海湾以南或渤海湾以北)、以及距离站点最邻近的6个站点的PM2.5、PM10、SO2、NO2、O3和CO等空气污染物小时浓度和24小时浓度均值,共75个空间特征变量。
步骤S4:选取样本集。从每个站点的时间序列中提取样本集。对于任一站点,按照时间顺序依次从序列X提取样本,第i个样本结构为
Figure BDA0002248916350000131
其中,
Figure BDA0002248916350000132
为第i时刻、距离i时刻最近的6个时刻、距离i时刻24小时的时刻的历史时序数据,
Figure BDA0002248916350000133
Figure BDA0002248916350000134
为i+1时刻PM2.5小时浓度值,每个站点共提取26280个样本,71个站点共提取1,865,880个样本,构成样本集。
步骤S5:从样本集中选取训练集、测试集和验证集。为了验证模型对不同季节的PM2.5的预测效果,实例按季节划分训练样本集和测试样本集。综合考虑光照、温度等各种因素,以3、4、5月为春季;6、7、8月为夏季,9、10、11月为秋季,12、1、2月为冬季。从每个站点中选取每个季度最后15天的样本为测试集,其余的为训练集,另外,采用Holdout验证法防止过拟合,在训练集中抽取2%的样本作为模型训练时的验证集。
步骤S6:构建SSAE-LSTM模型。由于SSAE-LSTM预测模型中SSAE的层数和LSTM的层数没有一个固定的确定算法,实例中根据经验和一般原则设计了4种SSAE-LSTM网络模型,即SSAE3-LSTM1、SSAE4-LSTM1、SSAE3-LSTM2和SSAE4-LSTM2。令ssae_1,ssae_2,ssae_3,ssae_4分别代表SSAE网络的第一层,第二层,第三层,第四层,lstm_1和lstm_2分别代表LSTM网络的第一层和第二层,dense_1和dense_2分别代表全连接网络的第一层和第二层,构建的4种SSAE-LSTM网络模型的具体结构如表1所示,表中数字代表代表模型在对应网络层的神经元数量,none代表模型不具有该网络层。
表1 4种SSAE-LSTM网络模型的具体结构
Figure BDA0002248916350000141
模型训练过程中涉及到的重要参数包括包括时间步参数(M)、预训练阶段学习率(p_lr)、微调阶段学习率(f_lr)、预训练阶段训练批次(p_batch)、微调阶段训练批次(f_batch)、预训练阶段训练次数(p_epoch)、微调阶段训练次数(f_epoch)、随机失活率(dropout)、SSAE网络的稀疏性约束项的权重(β)和稀疏性参数(ρ),这些参数共同作用影响神经网络模型的计算效率和预测效果,需要进行设置。对于时间步参数的设置,实例综合考虑PM2.5的时变性和周期性,在对目标时刻的PM2.5小时浓度进行预测时选取该时刻、距离该时刻最近的6个时刻、距离该时刻24小时的时刻的历史时序数据作为模型的输入,因此在SSAE-LSTM模型中输入序列的时间步设置为8,LSTM网络的时间步参数也设置为8。此外,对于其它参数,采用网格搜索法进行实验,确定的最佳参数如表2所示:
表2 SSAE-LSTM预测模型参数设置
Figure BDA0002248916350000151
步骤S7:训练SSAE-LSTM模型。将训练样本输入至构建好的SSAE-LSTM模型进行训练,训练包括逐层预训练和整体精调2个阶段。
步骤S8:模型验证。计算模型在验证集上的精度,并设置期望精度,比较验证集精度和期望精度,如果预测效果低于期望精度则调整SSAE-LATM模型参数,继续训练网络,重复步骤S7,直到达到预期精度。
步骤S9:保存模型,对PM2.5进行在线实时预测。由于收集的空气、气象数据集为历史数据,故本案例实施中假设测试样本为对应空气监测站点获取的实时数据,将实时数据输入至已训练好的SSAE-LSTM模型中,通过前向传播,输出站点在后一时刻PM2.5小时浓度,实现PM2.5在线实时预测。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (10)

1.一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,构建SSAE-LSTM模型,将一定时间步长的空气污染物时间序列输入该模型,采用SSAE网络通过无监督的方法提取输入数据的抽象特征,将提取的特征作为LSTM网络的输入特征,获取一定时间步长内空气污染物信息的特征分布,最后结合全连接网络预测PM2.5小时浓度。
2.根据权利要求1所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,所述一定时间步长的空气污染物时间序列为X=(X1,X2,...,Xt,...XM),M为输入时间序列的步长,Xt包含站点sn在t时刻的空气污染物变量、气象变量、时间特征变量和空间特征变量的小时值数据,其中空气污染物变量包括站点位置处的包括PM2.5、PM10、SO2、NO2、O3和CO在内的空气污染物小时浓度数据及24小时浓度均值;气象变量包括站点位置处的气温、相对湿度、降雨量、风速和风向小时数据;时间特征变量包括年份、季节、月份、日内小时时刻;空间特征变量包括站点位置、站点所在的城市、以及距离站点最邻近的k个站点的包括PM2.5、PM10、SO2、NO2、O3和CO在内的空气污染物小时浓度数据及24小时浓度均值。
3.根据权利要求2所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,k=6。
4.根据权利要求1所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,所述SSAE-LSTM模型包括SSAE网络模块、LSTM网络模块以及全连接网络模块;
所述SSAE网络模块由3个SAE堆叠而成,各SAE之间,前一个SAE的隐含层作为下一个SAE的输入层,最后一个SAE的隐含层ht为输入向量Xt最终的深度特征表示;
所述LSTM网络模块由三个门控制,这三个门分别是遗忘门、输入门和输出门;其中遗忘门遗忘记忆单元中无用的历史信息,输入门根据t时刻SSAE网络模块的输出向量以及t-1时刻LSTM网络模块的输出向量对t-1时刻的记忆单元进行状态更新并得到t时刻的记忆单元,输出门对t时刻记忆单元的信息进行筛选并得到t时刻LSTM网络的输出变量;
所述全连接网络模块由2个全连接层组成,以多层人工神经网络的方式对LSTM网络模块的输出特征进行整合和降维,并输出下一时刻的PM2.5小时浓度预测值。
5.根据权利要求4所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,全连接网络模块得到预测值后,计算预测值和真实值的误差,以调整网络各层的连接权值。
6.根据权利要求1所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,所述SSAE-LSTM模型的训练和验证具体为:从空气污染物时间序列中选取样本集,并划分为训练数据集、测试数据集和验证数据集,通过训练数据集和验证数据集对所述的SSAE-LSTM模型进行训练和验证。
7.根据权利要求6所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,所述SSAE-LSTM模型的训练和验证具体包括以下步骤:
步骤S1:对于任一站点,按照时间顺序依次从空气污染物时间序列中提取样本,第i个样本结构为
Figure FDA0002248916340000031
其中,
Figure FDA0002248916340000032
为第i时刻、距离i时刻最近的6个时刻、距离i时刻24小时的时刻的历史时序数据,
Figure FDA0002248916340000033
Figure FDA0002248916340000034
为i+1时刻PM2.5小时浓度值;
步骤S2:将样本集划分为测试集、训练集和验证集,验证集用于验证模型的预测效果并防止过拟合;
步骤S3:通过训练数据集对SSAE-LSTM模型进行训练,其中,模型训练分为2个阶段,分别是逐层预训练和整体微调;在逐层预训练阶段,采用无监督学习机制利用逐层贪婪学习方法训练同结构的SSAE网络模块,这一阶段SSAE网络的输入和输出均为样本中的部分;在整体精调阶段,采用监督学习机制,首先将训练得到的SSAE网络参数设为SSAE-LSTM模型中SSAE网络模块的初始参数,然后以预测数据与真实数据之间的损失值为网络收敛代价,使用梯度下降法调整SSAE-LSTM模型的整体权值,这一阶段SSAE-LSTM模型的输入为样本中的
Figure FDA0002248916340000036
部分,输出为样本中的
Figure FDA0002248916340000037
部分;
步骤S4:通过验证数据集对SSAE-LSTM模型进行验证,首先计算SSAE-LSTM模型在验证集上的预测效果,如果预测效果低于预设的阈值,则调整模型SSAE-LSTM参数,继续训练网络,反之则停止训练,保存SSAE-LSTM模型。
8.根据权利要求7所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,在逐层预训练阶段,SSAE网络模块的训练目标为最小化输入Xt与输出
Figure FDA0002248916340000038
的重构误差。
9.根据权利要求7所述的一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测方法,其特征在于,在整体精调阶段,SSAE-LSTM模型的训练目标为最小化预测值与真实值
Figure FDA0002248916340000041
的均方误差。
10.一种融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测系统,包括存储器、处理器以及存储在存储器上并能够在处理器上运行的计算机程序,其特征在于,当所述处理器执行所述计算机程序时能够实现如权利要求1-8任一项所述的方法步骤。
CN201911026860.1A 2019-10-26 2019-10-26 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统 Active CN110782093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911026860.1A CN110782093B (zh) 2019-10-26 2019-10-26 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911026860.1A CN110782093B (zh) 2019-10-26 2019-10-26 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统

Publications (2)

Publication Number Publication Date
CN110782093A true CN110782093A (zh) 2020-02-11
CN110782093B CN110782093B (zh) 2022-05-27

Family

ID=69386845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911026860.1A Active CN110782093B (zh) 2019-10-26 2019-10-26 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统

Country Status (1)

Country Link
CN (1) CN110782093B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310386A (zh) * 2020-02-13 2020-06-19 北京中科锐景科技有限公司 一种近地面臭氧浓度估算方法
CN111445076A (zh) * 2020-03-30 2020-07-24 福建工程学院 一种基于lstm的空气污染分析方法
CN112288156A (zh) * 2020-10-26 2021-01-29 哈尔滨工程大学 基于元学习和图注意力时空神经网络的空气质量预测方法
CN112561215A (zh) * 2021-02-24 2021-03-26 江苏铨铨信息科技有限公司 一种基于sae-lstm模型的大气雾霾预测方法
CN112598171A (zh) * 2020-12-21 2021-04-02 国网雄安金融科技集团有限公司 一种电力大数据下的企业电费预测方法及系统
CN112766454A (zh) * 2020-12-04 2021-05-07 山东科技大学 一种空气pm2.5浓度预测方法、系统、终端及存储介质
CN112862213A (zh) * 2021-03-09 2021-05-28 中国华能集团清洁能源技术研究院有限公司 一种基于周期回馈lstm的供热需求量预估方法、系统及设备
CN112906936A (zh) * 2021-01-07 2021-06-04 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法
CN113128776A (zh) * 2021-04-26 2021-07-16 中国科学技术大学先进技术研究院 数据自迁移的多车型柴油车排放预测方法及系统
CN113516304A (zh) * 2021-06-29 2021-10-19 上海师范大学 基于时空图网络的区域污染物时空联合预测方法及装置
CN113887815A (zh) * 2021-10-19 2022-01-04 厦门海洋职业技术学院 空气质量指数预测方法、装置、终端及存储介质
CN114936700A (zh) * 2022-05-30 2022-08-23 北京环境特性研究所 气溶胶浓度时空分布预测模型的构建方法及预测方法
CN115130747A (zh) * 2022-06-28 2022-09-30 重庆邮电大学 一种基于云模型的空气污染物浓度预测方法及系统
CN115840908A (zh) * 2022-05-02 2023-03-24 河海大学 基于lstm模型的微波链路构建pm2.5三维动态监测场的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485353A (zh) * 2016-09-30 2017-03-08 中国科学院遥感与数字地球研究所 空气污染物浓度预报方法及系统
CN108426812A (zh) * 2018-04-08 2018-08-21 浙江工业大学 一种基于记忆神经网络的pm2.5浓度值预测方法
CN110334881A (zh) * 2019-07-17 2019-10-15 深圳大学 一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法,装置及服务器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485353A (zh) * 2016-09-30 2017-03-08 中国科学院遥感与数字地球研究所 空气污染物浓度预报方法及系统
CN108426812A (zh) * 2018-04-08 2018-08-21 浙江工业大学 一种基于记忆神经网络的pm2.5浓度值预测方法
CN110334881A (zh) * 2019-07-17 2019-10-15 深圳大学 一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法,装置及服务器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
范竣翔等: "基于RNN的空气污染时空预报模型研究", 《测绘科学》 *
邓丽 等: "融合SSAE深度特征学习和LSTM网络的PM2.5小时浓度预测", 《环境科学学报》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310386B (zh) * 2020-02-13 2023-04-21 北京中科锐景科技有限公司 一种近地面臭氧浓度估算方法
CN111310386A (zh) * 2020-02-13 2020-06-19 北京中科锐景科技有限公司 一种近地面臭氧浓度估算方法
CN111445076A (zh) * 2020-03-30 2020-07-24 福建工程学院 一种基于lstm的空气污染分析方法
CN111445076B (zh) * 2020-03-30 2023-12-29 福建工程学院 一种基于lstm的空气污染分析方法
CN112288156B (zh) * 2020-10-26 2023-03-31 哈尔滨工程大学 基于元学习和图注意力时空神经网络的空气质量预测方法
CN112288156A (zh) * 2020-10-26 2021-01-29 哈尔滨工程大学 基于元学习和图注意力时空神经网络的空气质量预测方法
CN112766454A (zh) * 2020-12-04 2021-05-07 山东科技大学 一种空气pm2.5浓度预测方法、系统、终端及存储介质
CN112598171A (zh) * 2020-12-21 2021-04-02 国网雄安金融科技集团有限公司 一种电力大数据下的企业电费预测方法及系统
CN112906936A (zh) * 2021-01-07 2021-06-04 中地大海洋(广州)科学技术研究院有限公司 基于集成神经网络的河流污染物通量智能计算与预测方法
CN112561215A (zh) * 2021-02-24 2021-03-26 江苏铨铨信息科技有限公司 一种基于sae-lstm模型的大气雾霾预测方法
CN112862213B (zh) * 2021-03-09 2024-02-20 中国华能集团清洁能源技术研究院有限公司 一种基于周期回馈lstm的供热需求量预估方法、系统及设备
CN112862213A (zh) * 2021-03-09 2021-05-28 中国华能集团清洁能源技术研究院有限公司 一种基于周期回馈lstm的供热需求量预估方法、系统及设备
CN113128776B (zh) * 2021-04-26 2023-07-07 中国科学技术大学先进技术研究院 数据自迁移的多车型柴油车排放预测方法及系统
CN113128776A (zh) * 2021-04-26 2021-07-16 中国科学技术大学先进技术研究院 数据自迁移的多车型柴油车排放预测方法及系统
CN113516304A (zh) * 2021-06-29 2021-10-19 上海师范大学 基于时空图网络的区域污染物时空联合预测方法及装置
CN113516304B (zh) * 2021-06-29 2024-01-23 上海师范大学 基于时空图网络的区域污染物时空联合预测方法及装置
CN113887815A (zh) * 2021-10-19 2022-01-04 厦门海洋职业技术学院 空气质量指数预测方法、装置、终端及存储介质
CN115840908B (zh) * 2022-05-02 2023-07-14 河海大学 基于lstm模型的微波链路构建pm2.5三维动态监测场的方法
CN115840908A (zh) * 2022-05-02 2023-03-24 河海大学 基于lstm模型的微波链路构建pm2.5三维动态监测场的方法
CN114936700A (zh) * 2022-05-30 2022-08-23 北京环境特性研究所 气溶胶浓度时空分布预测模型的构建方法及预测方法
CN115130747A (zh) * 2022-06-28 2022-09-30 重庆邮电大学 一种基于云模型的空气污染物浓度预测方法及系统

Also Published As

Publication number Publication date
CN110782093B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN110782093B (zh) 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
CN108701274B (zh) 一种城市小尺度空气质量指数预测方法与系统
CN110363347B (zh) 基于决策树索引的神经网络预测空气质量的方法
CN111832814B (zh) 一种基于图注意力机制的空气污染物浓度预测方法
Zhang et al. A feature selection and multi-model fusion-based approach of predicting air quality
Gilik et al. Air quality prediction using CNN+ LSTM-based hybrid deep learning architecture
CN108426812B (zh) 一种基于记忆神经网络的pm2.5浓度值预测方法
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
Jiang et al. Deepurbanmomentum: An online deep-learning system for short-term urban mobility prediction
CN110264709A (zh) 基于图卷积网络的道路的交通流量的预测方法
Jalalkamali Using of hybrid fuzzy models to predict spatiotemporal groundwater quality parameters
CN109143408B (zh) 基于mlp的动态区域联合短时降水预报方法
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
CN112287294A (zh) 一种基于深度学习的时空双向土壤含水量插值方法
CN105869100A (zh) 一种基于大数据思维的滑坡多场监测数据的融合及预测方法
CN115860286B (zh) 一种基于时序门机制的空气质量预测方法及系统
Fang et al. DESA: a novel hybrid decomposing-ensemble and spatiotemporal attention model for PM2. 5 forecasting
Casallas et al. Long short-term memory artificial neural network approach to forecast meteorology and PM 2.5 local variables in Bogotá, Colombia
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN110533239A (zh) 一种智慧城市空气品质高精度测量方法
CN114694767B (zh) 基于时空图常微分方程网络的pm2.5浓度预测方法
Lim et al. Air pollution matter prediction using recurrent neural networks with sequential data
Schornobay-Lui et al. Prediction of short and medium term PM10 concentration using artificial neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant