CN113971477A - 一种基于时间序列和深度学习框架的pm2.5估算方法 - Google Patents
一种基于时间序列和深度学习框架的pm2.5估算方法 Download PDFInfo
- Publication number
- CN113971477A CN113971477A CN202111128866.7A CN202111128866A CN113971477A CN 113971477 A CN113971477 A CN 113971477A CN 202111128866 A CN202111128866 A CN 202111128866A CN 113971477 A CN113971477 A CN 113971477A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- space
- time series
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013135 deep learning Methods 0.000 title claims abstract description 22
- 238000003062 neural network model Methods 0.000 claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 238000013112 stability test Methods 0.000 claims abstract description 7
- 230000002123 temporal effect Effects 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 38
- 239000013618 particulate matter Substances 0.000 claims description 23
- 238000002790 cross-validation Methods 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000003190 augmentative effect Effects 0.000 claims description 2
- 230000007774 longterm Effects 0.000 abstract description 5
- 238000003915 air pollution Methods 0.000 abstract description 2
- 230000002265 prevention Effects 0.000 abstract description 2
- 238000012795 verification Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000013136 deep learning model Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000000443 aerosol Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012950 reanalysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004441 surface measurement Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于时间序列和深度学习框架的PM2.5估算方法,包括获取待估算区域的PM2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据,并共同作为多源数据;将多源数据编码为时间序列格式,以获得时间序列数据;依次构建时空增强神经网络模型的空间模块、时间模块和增强模块,以对待估算区域的PM2.5进行反演估算;将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中,对待估算区域目标时间内的PM2.5进行空间连续估算,得到空间分辨率为1km的PM2.5时空分布产品。本发明充分利用了PM2.5和遥感数据的时空变化,可以生成长期、更详细、更可靠、分辨率更高的PM2.5产品,对我国的空气污染预防和治理具有重要的理论与实际意义。
Description
技术领域
本发明属于大气污染物反演预测领域,具体涉及一种基于时间序列和深度学习框架的PM2.5估算方法。
背景技术
PM2.5是指空气动力学直径小于或等于2.5μg的颗粒物。根据柳叶刀的一篇文章报道,PM2.5在2015年已成为世界第五大死亡危险因素(Cohen et al.,2017),在全球造成了约420万人的死亡。自2013年以来,我国PM2.5观测站数量逐年增加。然而,这些监测网的地理覆盖范围仍然有限且不均匀,这意味着收集到的浓度不一定代表该地区的PM2.5浓度。仅从地面测量很难评估PM2.5的区域变异性。
与传统的地面监测相比,卫星遥感技术具有宏观、快速获取信息的特点,逐渐成为重要的监测手段。基于卫星遥感手段的PM2.5预测常采用光学气溶胶厚度(AOD)这一指标,光学气溶胶厚度描述了气溶胶对光的减弱作用,被证明与近地颗粒物有密切的相关性。比较常见的用于PM2.5反演的遥感产品包括MODIS、MISR等。基于PM2.5和AOD遥感产品之间的相关关系,早期的研究开发了各种估算PM2.5的统计回归方法,包括简单线性回归、多元线性回归以及考虑时空异质性的地统计回归,例如,地理加权回归(GWR)模型、地理和时间加权回归(GTWR)模型。同时,机器学习模型也被广泛用于估算PM2.5。然而,PM2.5受多种相关的自然条件和人为因素决定,具体强烈的空间变异、相关性和时间依赖性。统计回归方法的特征学习能力较弱,无法在PM2.5和AOD之间建立稳定的关系;机器学习模型可以很好地拟合非线性关系,但它们仅基于大数据特征建模,隐藏在PM2.5时间序列和地理空间分布中的物理特征没有得到充分利用。
近年来,深度学习在从时间序列中发现目标对象复杂的非线性关系方面取得了显著的成功。例如循环神经网络(RNN)及其变体LSTM这两个突出的深度学习模型,它们专门用于识别长时间序列的时间变化模式以及捕捉复杂的非线性关系。PM2.5具有很强的时间依赖性。因此,一些研究人员已经应用深度学习方法,使用长时间序列数据来估计和预测PM2.5。Qi等使用LSTM模型估算了逐小时的PM2.5浓度并验证了深度学习模型的优越性。为了进一步提高神经网络的时空学习能力,Pak等人结合了多种神经网络:卷积神经网络(CNN)、人工神经网络(ANN)和LSTM来预测每日PM2.5浓度。然而,深度学习模型较弱的空间泛化能力限制了对PM2.5的空间连续变化和地理分布的预测。此外,用于PM2.5预测的深度学习模型大多在短时间尺度(即每天和每小时)进行;深度学习模型在长期趋势分析中的潜力尚未被探索。并且大多数基于时间序列的RNN模型都忽略了空间异质性和空间相关性。因此,建立一个稳健的、基于遥感产品的、可以更好的处理PM2.5的空间相关性和时间依赖性的PM2.5估算模型至关重要。
发明内容
本发明的目的在于解决现有技术中存在的问题,并提供一种基于时间序列和深度学习框架的PM2.5估算方法。
本发明所采用的具体技术方案如下:
本发明提供了一种基于时间序列和深度学习框架的PM2.5估算方法,具体如下:
S1:获取待估算区域的PM2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据,并共同作为多源数据;将所述多源数据编码为时间序列格式,以获得时间序列数据;
S2:依次构建时空增强神经网络模型的空间模块、时间模块和增强模块,以对待估算区域的PM2.5进行反演估算;
所述空间模块的构建方法具体如下:依据PM2.5地面观测站点的空间分布,选取邻近目标站点的若干PM2.5地面观测站点,分别计算两者的空间距离,根据所选取PM2.5地面观测站点所得的PM2.5浓度,进行空间组合加权,得到相邻若干站点对目标站点PM2.5浓度的影响效应,记为空间信号;随后将空间信号与所述时间序列数据一同作为时空序列数据;
所述时间模块的构建方法具体如下:搭建双向长短期记忆模型,并为所述时空序列数据赋予时间特征,得到输出值ht;
所述增强模块的构建方法具体如下:搭建注意力机制结构,为所述输出值ht中不同的变量赋予不同权重;
S3:将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中,对待估算区域目标时间内的PM2.5进行空间连续估算,得到空间分辨率为1km的PM2.5时空分布产品。
作为优选,所述待估算区域为中国。
作为优选,所述步骤S1中,PM2.5地面观测数据为逐日的地面站点数据;AOD产品数据采用经大气多角度校正算法生成的MODIS 1km AOD产品;气象数据包括风速、湿度、温度、气压和行星边界层高度;土地利用/覆被和经济社会数据包括数字高程模型、归一化植被指数、土地利用数据和人口密度。
作为优选,所述步骤S1中,利用ArcGIS 10.3和R语言,将AOD产品数据、气象数据、土地利用/覆被和经济社会数据,预处理为与PM2.5地面观测数据具有相同的时空尺度;随后利用双线性插值方法确保所有数据处于相同的时空分辨率;接着按照所述多源数据的时间先后关系,利用python将其编码为时间序列格式,并获得时间序列数据。
作为优选,所述步骤S2的空间模块构建过程中,每个目标站点i的空间信号SSi的计算方法具体如下:
其中,Xj是指邻近目标站点i的PM2.5地面观测站点j所测得的PM2.5浓度;dji是站点i和站点j的空间距离;n是所选取的邻近目标站点i的PM2.5地面观测站点的数量,优选为3;(xi,yi)与(xj,yj)分别为站点i和站点j的坐标。
进一步的,所述步骤S2的空间模块构建过程中,将每个时间节点t处的空间信号与所述时间序列数据一同编码为向量xt,向量xt的形式为[v1,v2,...,vm],m为空间信号和时间序列数据中所有数据的总数量;将一个时间步长T内的所有向量xt拼接为一个时空序列数据,其形式为[x1,x2,...xt,...,xT],其中T为输入下一模块的时间步长。
更进一步的,所述步骤S2的时间模块构建过程中,输出值ht的计算方法具体如下:
ft=σ(Wf·[ht-1,xt]+bf) (3)
it=σ(Wi·[ht-1,xt]+bi) (4)
Ct=ft*Ct-1+it*tanh(WC·[ht-1,xt]+bC) (5)
ot=σ(Wo·[ht-1,xt]+bo) (6)
ht=ot*tanh(Ct) (7)
其中,ft、it、ot、Ct分别表示遗忘门、输入门、输出门和单元状态的向量,Wf、Wi、WC、Wo均是权重,bf、bi、bC、bo表示分别对应的门和单元状态;ht-1和ht是不同时间步长t-1和t的输出变量,xt是当前输入,[ht-1,xt]代表将两个向量合并为一个向量;σ和tanh为激活函数。
再进一步的,所述步骤S2的增强模块构建过程中,将时间特征ht作为输入向量,地面PM2.5地面观测数据作为目标向量yt,通过输入向量ht和目标向量yt的信息及相互关系得到注意力向量随后使用Softmax函数计算权重值αt;最后,基于权重值αt,通过加权求和得到调整向量具体公式如下:
其中,WC和Ws均为模型参数,tanh为激活函数,T为输入下一模块的时间步长。
作为优选,所述步骤S3中,稳定性检验采用基于样本的交叉验证、空间交叉验证和时间交叉验证方法。
作为优选,所述步骤S3中,精度评价采用决定系数、均方根误差、平均绝对误差、相对预测误差和预测偏差对时空增强神经网络模型的估算结果进行检验。
本发明相对于现有技术而言,具有以下有益效果:
本发明开发了一种空间可推广的深度学习模型,即时空增强神经网络(STENN),通过将多时相的遥感产品、气象指标和人类活动指标相结合,更精确的预测待研究区域内PM2.5的空间分布与时间演变。通过将空间信号输入到能够处理时间序列的循环神经网络中,该模型提供了一种地理数据驱动的方法来更好的处理PM2.5受空间异质性和时间依赖性的影响,因此其表现显著优于大多数先前的PM2.5预测模型。此外,该模型还具有强大的时空可迁移性,可以外推到没有PM2.5地面监测的年份和地区。
本发明充分利用了PM2.5和遥感数据的时空变化特征,可以生成长期的、更详细的、更可靠的高分辨率PM2.5产品,对PM2.5污染及其对人体危害的研究有较大帮助,为改善中国空气质量的方针政策制定提供重要参考,存在推广应用的价值。
附图说明
图1是实施例中,STENN模型与当前流行的深度学习和机器学习模型的比较情况,其中,(a)~(d)分别为STENN模型、LSTM模型、RF模型、Cubist模型预测的PM2.5相对于地面观测的PM2.5的验证结果;
图2是实施例中,采用不同交叉验证方法得到的验证结果,其中,(a)为2015-2020年时间交叉验证结果,(b)为中国七大地理分区的空间交叉验证结果;
图3是实施例中,获得的2014至2020年年平均以及7年(2014-2020)平均PM2.5浓度时空分布产品。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下,均可进行相应组合。
PM2.5受自然和人为因素等多重作用的影响,目前常见的PM2.5估算方法都忽略了其复杂的时间依赖性和空间相关性,因此本发明搭建了一个具有空间泛化能力的深度学习模型来估算中国多年的PM2.5浓度及空间分布,即提供了一种基于时间序列和深度学习框架的PM2.5估算方法,具体如下:
S1:获取待估算区域(如中国)的PM2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据,并共同作为多源数据。其中,PM2.5地面观测数据为逐日的地面站点数据;AOD产品数据采用大气多角度校正(MAIAC)算法生成的MODIS 1km AOD产品;气象数据包括风速(WS,Wind speed)、湿度(RHU,Relative humidity)、温度(TEMP,Temperature)、气压(P,Pressure)、行星边界层高度(BLH,boundary layer height);土地利用/覆被和经济社会数据包括数字高程模型(DEM,Digital elevation model)、归一化植被指数(NDVI,Normalized difference vegetation index)、土地利用数据(LUCC,landuse/cover change)、人口密度(POP,Population distribution)。
随后将上述多源数据编码为时间序列格式,以获得时间序列数据,具体如下:
利用ArcGIS 10.3和R语言,将AOD产品数据、气象数据、土地利用/覆被和经济社会数据,预处理为与PM2.5地面观测数据具有相同的时空尺度。随后利用双线性插值方法对1km网格单元的气象数据和土地利用/覆被和经济社会数据进行重采样,计算AOD和BLH数据的平均值,以确保所有数据处于相同的时空分辨率。接着按照所获得的多源数据的时间先后关系,利用python将其编码为时间序列格式:即用python写一个代码,把单独的每年的产品编码到一起变成每几年一个文件,最后获得了时间序列数据。
S2:搭建时空增强神经网络(STENN,SpatioTemporal Enhanced Neural Network)模型用于对待估算区域的PM2.5浓度进行反演估算,该模型包含空间模块、时间模块和增强模块3个部分。时空增强神经网络(STENN)模型,是以多时相多源遥感产品和PM2.5地面观测数据作为输入,根据空间相关性获取空间信号,通过LSTM模型获取时空特征,并通过注意力机制增强时空特征,将下一个时间步长作为PM2.5预测的输出结果。STENN模型有较强的空间泛化能力,能够将站点级别的PM2.5预测扩展到国家范围内的1km分辨率的预测。
具体每个模块的操作步骤如下:
S21(构建空间模块):依据PM2.5地面观测站点的空间分布,选取邻近目标站点的若干PM2.5地面观测站点,分别计算两者的空间距离,根据所选取PM2.5地面观测站点所得的PM2.5浓度,进行空间组合加权,得到相邻若干站点对目标站点PM2.5浓度的影响效应,记为空间信号(SS,Spatial signal)。
其中,空间信号考虑目标点i周围的邻近观测点j(j=1,2...,n)的影响,利用距离加权来增强或减弱邻近观测点的影响。
该操作中,每个目标站点i的空间信号SSi的计算方法具体如下:
式中,Xj是指邻近目标站点i的PM2.5地面观测站点j所测得的PM2.5浓度;dji是站点i和站点j的空间距离(即欧几里得距离);n是所选取的邻近目标站点i的PM2.5地面观测站点的数量,模型的性能与n的大小无显著关系,当n为3时模型性能最好;(xi,yi)与(xj,yj)分别为站点i和站点j的坐标。
随后将空间信号与其他变量(即时间序列数据)一同作为时空序列数据。,具体如下:
将每个时间节点t处的空间信号与其他预处理后的环境变量(即时间序列数据)一同编码为向量xt,向量xt的形式为[v1,v2,...,vm],m为空间信号和时间序列数据中所有数据的总数量。随后将一个时间步长T内的所有向量xt拼接为一个时空序列数据,其形式为[x1,x2,...xt,...,xT],其中T为输入下一模块的时间步长。
S22(构建时间模块):搭建双向长短期记忆(BiLSTM,Bidirectional long short-term memory)模型,并为通过S21获得的时空序列数据赋予时间特征,得到输出值ht。
双向长短期记忆(BiLSTM)模型是长短期记忆(LSTM)模型的拓展版,LSTM弥补了RNN模型在处理长时间序列数据中出现的梯度消失或梯度爆炸的问题,其定义具体如下:
LSTM模型采用了“门”的结构,该结构决定了LSTM模块的状态是否更新以及更新到什么程度。每个LSTM模块包含一个遗忘门ft,它决定从时间步t-1开始需要保留多少信息;一个输入门it,它决定从当前时间步t开始存储多少信息;一个单元状态Ct,它用于更新当前单元的状态;一个输出门ot,它决定当前单元状态Ct要输出多少信息。
LSTM模型在时间步为t的等式,具体如下:
ft=σ(Wf·[ht-1,xt]+bf) (3)
it=σ(Wi·[ht-1,xt]+bi) (4)
Ct=ft*Ct-1+it*tanh(WC·[ht-1,xt]+bC) (5)
ot=σ(Wo·[ht-1,xt]+bo) (6)
ht=ot*tanh(Ct) (7)
其中,ft、it、ot、Ct分别表示遗忘门、输入门、输出门和单元状态的向量,Wf、Wi、WC、Wo均是权重,bf、bi、bC、bo表示分别对应的门和单元状态;ht-1和ht是不同时间步长t-1和t的输出变量,xt是当前输入,[ht-1,xt]代表将两个向量合并为一个向量;σ和tanh为激活函数。
双向长短期记忆模型(Bidirectional LSTM,Bi-LSTM)是LSTM的扩展,它改变了LSTM中时间序列只向前流动的缺陷,允许其向前和向后双向流动。在双向长短期记忆模型中,t时刻的输出向量扩展为两个向量,分别为和两个来自相反时间方向流动的向量组合起来构成最终输出向量即ht。
S23(构建增强模块):搭建注意力机制结构(Attentional mechanism),将S22时间模块中输出作为该模块输入,为通过S22得到的输出值ht中不同的变量赋予不同权重。即注意力机制通过学习数据间的相互关系,为不同环境变量赋予不同权重,来关注更为重要的环境变量。
其中,WC和Ws是计算所需的模型参数,tanh为激活函数。
S3:对S2中模型进行稳定性检验和精度评价,以保证PM2.5估算的准确性。随后将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中,对待估算区域目标时间内的PM2.5进行空间连续估算,得到空间分辨率为1km的PM2.5时空分布产品。
其中,稳定性检验采用基于样本的交叉验证、空间交叉验证和时间交叉验证方法。精度评价采用决定系数、均方根误差、平均绝对误差、相对预测误差和预测偏差对时空增强神经网络模型的估算结果进行检验。
三种交叉验证的具体方法如下:
(1)基于样本交叉验证:即较常见的十折交叉验证。将数据集随机分为10份,其中9份用于建立和训练模型,剩余1份用于模型验证,然后交替轮换,直到10份中每1份均用于模型验证。
(2)时间交叉验证:通过选用1年的数据进行模型验证,而其他年份的数据则用于模型拟合,并且轮换,直到所有年份均用于验证。
(3)空间交叉验证:根据数据的地理位置,按照中国7大地理分区将数据集划分为7份,其中1份用于模型验证,其余6份用于训练模型,并依次轮换进行验证。
五项评价指标:决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、相对预测误差(PRE,%)、预测偏差(Predicted bias)的计算公式如下:
Predicted Bias=fi-yi (15)
其中,n是数据样本的总数,fi、yi分别是地面观测的PM2.5和模型估计的PM2.5。
实施例
选取中国作为研究区,使用本发明的上述方法进行分析,具体步骤如下:
步骤1)数据获取:2013-2020年逐日PM2.5地面观测数据来自中国国家环境监测中心(CNEMC,http://www.cnemc.cn/),在2013-2020年间,监测站数量由835个增长至1700个;多时相(2011-2019年)MODIS 1-km AOD数据是由MODIS卫星通过大气校正多角度(MAIAC)算法生成的数据产品,空间分辨率为1km,将数据通过几何校正后,选择550nm波长的AOD数据,通过重投影和拼接获得覆盖全中国范围的数据;气象数据包括风速(WS)、湿度(RHU)、温度(TEMP)、气压(P)、行星边界层高度(BLH)等5个变量,气象数据是由欧洲中期天气预报中心(ECMWF)第五代气候和天气产品(ERA5)全球大气再分析工具生成的;土地利用/覆被和经济社会数据包括数字高程模型(DEM)、归一化植被指数(NDVI)、土地利用数据(LUCC)、人口密度(POP),数据来源为中国科学院资源环境科学与数据中心。气象与土地利用/覆被和经济社会数据的时间覆盖范围均为2011年至2019年。
步骤2)数据预处理:通过ArcGIS 10.3和R语言进行数据处理,将AOD产品数据、气象数据、土地利用/覆被和经济社会数据等多源遥感产品进行预处理,与PM2.5地面观测数据达到相同的时空尺度。随后使用双线性插值方法对1km网格单元的气象数据和土地利用/覆被和经济社会数据进行重采样,计算AOD和BLH数据的平均值,确保所有数据处于相同的时间分辨率(逐年)和空间分辨率(1km)。
步骤3)模型构建:使用Python中的深度学习API:Keras搭建STENN模型。在输入模型之前,首先对建模集数据进行标准化。在STENN模型的时间模块包含三个具有512个隐藏单元的BiLSTM层,每个BiLSTM层的betch size为72,增强模块中有1个注意力层。为防止过拟合在增强模块中设置了一个dropout层,网络迭代次数设定为300次,采用基于梯度下降的优化器Adam和学习率调度器,其中学习速率被设定为每50个迭代减少1/10。
步骤4)模型验证:使用三种交叉验证方式对STENN模型的表现进行验证,同时使用了当前流行的深度学习/机器学习模型:LSTM、随机森林(RF)、Cubist模型进行对比研究。结果如图1和2所示。
图1为STENN(a)、LSTM(b)、RF(c)和Cubist(d)的预测PM2.5相对于地面观测PM2.5的密度散点图;虚线表示线性回归的最佳拟合线,实线表示1:1线;图中RMSE和MAE的单位是μgm-3。从图1中可以看出,STENN模型在各项指标中均表现最优,具有最高的R2和最低的RMSE、MAE、RPE,分别为0.89、5.84μg m-3、3.97μg m-3、12.74%。从散点的分布中也可以看出,STENN模型的拟合回归线最为接近1:1线。其他三个模型的表现基本一致,虽然它们都具有不错的准确性,但对异常高值或低值的预测能力较差。
STENN模型在中国2015-2020年的时间交叉验证结果如图2(a)所示。STENN模型每年的性能并不一致,模型在2020年预测的不确定性最低,模型表现最优。总体而言,预测的结果与不同年份的地表观测结果较为吻合(R2=0.78-0.87)STENN模型在中国七个地理区域(西北、东北、北部、中部、东部、南部和西南)的空间交叉验证结果如图2(b)所示。模型在不同区域表现略有不同,模型预测性能在华东和华中地区最优,R2为0.85。相比之下,模型在中国西北地区表现最差。模型表现差异的原因可能有两个,一是监测站的密度和分布决定了空间信号的计算及其对目标PM2.5的响应;其次,不同的气候条件和地表覆盖导致模型在不同地区的性能存在差异。
步骤5):将预测集的数据输入搭建好的STENN模型,得到2014-2020年研究区(中国)的1km PM2.5空间分布产品。如图3所示,为中国2014-2020年平均PM2.5浓度的空间分布(a-g)、7年平均PM2.5浓度的空间分布(h)。可见该产品具有较高的空间分辨率和较高的预测准确度,基于此可对中国PM2.5精细尺度的时空变化展开分析,为制定相关污染防治政策提供依据。
本发明充分利用了PM2.5和遥感数据的时空变化,可以生成长期、更详细、更可靠、分辨率更高的PM2.5产品,对我国的空气污染预防和治理具有重要的理论与实际意义。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (10)
1.一种基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,具体如下:
S1:获取待估算区域的PM2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据,并共同作为多源数据;将所述多源数据编码为时间序列格式,以获得时间序列数据;
S2:依次构建时空增强神经网络模型的空间模块、时间模块和增强模块,以对待估算区域的PM2.5进行反演估算;
所述空间模块的构建方法具体如下:依据PM2.5地面观测站点的空间分布,选取邻近目标站点的若干PM2.5地面观测站点,分别计算两者的空间距离,根据所选取PM2.5地面观测站点所得的PM2.5浓度,进行空间组合加权,得到相邻若干站点对目标站点PM2.5浓度的影响效应,记为空间信号;随后将空间信号与所述时间序列数据一同作为时空序列数据;
所述时间模块的构建方法具体如下:搭建双向长短期记忆模型,并为所述时空序列数据赋予时间特征,得到输出值ht;
所述增强模块的构建方法具体如下:搭建注意力机制结构,为所述输出值ht中不同的变量赋予不同权重;
S3:将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中,对待估算区域目标时间内的PM2.5进行空间连续估算,得到空间分辨率为1km的PM2.5时空分布产品。
2.如权利要求1所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述待估算区域为中国。
3.如权利要求1所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述步骤S1中,PM2.5地面观测数据为逐日的地面站点数据;AOD产品数据采用经大气多角度校正算法生成的MODIS 1km AOD产品;气象数据包括风速、湿度、温度、气压和行星边界层高度;土地利用/覆被和经济社会数据包括数字高程模型、归一化植被指数、土地利用数据和人口密度。
4.如权利要求1所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述步骤S1中,利用ArcGIS 10.3和R语言,将AOD产品数据、气象数据、土地利用/覆被和经济社会数据,预处理为与PM2.5地面观测数据具有相同的时空尺度;随后利用双线性插值方法确保所有数据处于相同的时空分辨率;接着按照所述多源数据的时间先后关系,利用python将其编码为时间序列格式,并获得时间序列数据。
6.如权利要求5所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述步骤S2的空间模块构建过程中,将每个时间节点t处的空间信号与所述时间序列数据一同编码为向量xt,向量xt的形式为[v1,v2,…,vm],m为空间信号和时间序列数据中所有数据的总数量;将一个时间步长T内的所有向量xt拼接为一个时空序列数据,其形式为[x1,x2,...xt,...,xT],其中T为输入下一模块的时间步长。
7.如权利要求6所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述步骤S2的时间模块构建过程中,输出值ht的计算方法具体如下:
ft=σ(Wf·[ht-1,xt]+bf) (3)
it=σ(Wi·[ht-1,xt]+bi) (4)
Ct=ft*Ct-1+it*tanh(WC·[ht-1,xt]+bC) (5)
ot=σ(Wo·[ht-1,xt]+bo) (6)
ht=ot*tanh(Ct) (7)
其中,ft、it、ot、Ct分别表示遗忘门、输入门、输出门和单元状态的向量,Wf、Wi、WC、Wo均是权重,bf、bi、bC、bo表示分别对应的门和单元状态;ht-1和ht是不同时间步长t-1和t的输出变量,xt是当前输入,[ht-1,xt]代表将两个向量合并为一个向量;σ和tanh为激活函数。
9.如权利要求1所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述步骤S3中,稳定性检验采用基于样本的交叉验证、空间交叉验证和时间交叉验证方法。
10.如权利要求1所述的基于时间序列和深度学习框架的PM2.5估算方法,其特征在于,所述步骤S3中,精度评价采用决定系数、均方根误差、平均绝对误差、相对预测误差和预测偏差对时空增强神经网络模型的估算结果进行检验。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111128866.7A CN113971477B (zh) | 2021-09-26 | 2021-09-26 | 一种基于时间序列和深度学习框架的pm2.5估算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111128866.7A CN113971477B (zh) | 2021-09-26 | 2021-09-26 | 一种基于时间序列和深度学习框架的pm2.5估算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113971477A true CN113971477A (zh) | 2022-01-25 |
CN113971477B CN113971477B (zh) | 2025-04-08 |
Family
ID=79586820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111128866.7A Active CN113971477B (zh) | 2021-09-26 | 2021-09-26 | 一种基于时间序列和深度学习框架的pm2.5估算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113971477B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115146937A (zh) * | 2022-06-23 | 2022-10-04 | 生态环境部南京环境科学研究所 | 一种城市群减污降评估方法 |
CN116011561A (zh) * | 2023-03-28 | 2023-04-25 | 武汉大学 | 基于神经网络的信息外推方法、装置、设备及存储介质 |
CN117216480A (zh) * | 2023-09-18 | 2023-12-12 | 宁波大学 | 一种深度耦合地理时空信息的近地表臭氧遥感估算方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200096993A1 (en) * | 2016-05-09 | 2020-03-26 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for intelligent data collection for a production line |
CN111639748A (zh) * | 2020-05-15 | 2020-09-08 | 武汉大学 | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
-
2021
- 2021-09-26 CN CN202111128866.7A patent/CN113971477B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200096993A1 (en) * | 2016-05-09 | 2020-03-26 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for intelligent data collection for a production line |
CN111639748A (zh) * | 2020-05-15 | 2020-09-08 | 武汉大学 | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
Non-Patent Citations (2)
Title |
---|
李硕;李春莲;陈颂超;徐冬云;史舟;: "基于野外可见近红外光谱和水分影响校正算法的土壤剖面有机碳预测", 光谱学与光谱分析, no. 4, 30 April 2021 (2021-04-30), pages 1234 - 1239 * |
杜震洪;吴森森;王中一;汪愿愿;张丰;刘仁义;: "基于地理神经网络加权回归的中国PM_(2.5)浓度空间分布估算方法", 地球信息科学学报, no. 01, 25 January 2020 (2020-01-25), pages 126 - 139 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115146937A (zh) * | 2022-06-23 | 2022-10-04 | 生态环境部南京环境科学研究所 | 一种城市群减污降评估方法 |
CN116011561A (zh) * | 2023-03-28 | 2023-04-25 | 武汉大学 | 基于神经网络的信息外推方法、装置、设备及存储介质 |
CN117216480A (zh) * | 2023-09-18 | 2023-12-12 | 宁波大学 | 一种深度耦合地理时空信息的近地表臭氧遥感估算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113971477B (zh) | 2025-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liao et al. | Deep learning for air quality forecasts: a review | |
Zhao et al. | A Comparative Study of Landslide Susceptibility Mapping Using SVM and PSO‐SVM Models Based on Grid and Slope Units | |
Li et al. | Satellite-based estimation of full-coverage ozone (O3) concentration and health effect assessment across Hainan Island | |
Rahmati et al. | Hybridized neural fuzzy ensembles for dust source modeling and prediction | |
Kuligowski et al. | Experiments in short-term precipitation forecasting using artificial neural networks | |
CN113971477A (zh) | 一种基于时间序列和深度学习框架的pm2.5估算方法 | |
Sekertekin et al. | Short-term air temperature prediction by adaptive neuro-fuzzy inference system (ANFIS) and long short-term memory (LSTM) network | |
CN112200358B (zh) | 一种滑坡等级预测方法、装置、设备和存储介质 | |
Marofi et al. | Predicting spatial distribution of snow water equivalent using multivariate non-linear regression and computational intelligence methods | |
Yu et al. | Deep learning-based downscaling of tropospheric nitrogen dioxide using ground-level and satellite observations | |
Ebrahimi-Khusfi et al. | Accuracy, uncertainty, and interpretability assessments of ANFIS models to predict dust concentration in semi-arid regions | |
CN112699959B (zh) | 基于能量泛函模型的多源多尺度降水数据融合方法和装置 | |
CN118228923A (zh) | 基于多尺度和多维度的水域污染预测方法 | |
Razin et al. | Wavelet neural networks using particle swarm optimization training in modeling regional ionospheric total electron content | |
Xiang et al. | Fully distributed rainfall-runoff modeling using spatial-temporal graph neural network | |
CN116702981A (zh) | 一种臭氧浓度预测方法、装置、电子设备及介质 | |
Lu et al. | Forecasting multi-step ahead monthly reference evapotranspiration using hybrid extreme gradient boosting with grey wolf optimization algorithm | |
Song et al. | Heuristic cellular automaton model for simulating soil organic carbon under land use and climate change: A case study in eastern China | |
Ramdani et al. | An artificial neural network approach to predict the future land use land cover of Great Malang region, Indonesia | |
Alsaedi et al. | Spatial and temporal data analysis with deep learning for air quality prediction | |
CN119168164B (zh) | 基于深度学习的海洋抗生素污染迁移分析方法及系统 | |
Haji-Aghajany et al. | Machine learning-based wet refractivity prediction through GNSS troposphere tomography for ensemble troposphere conditions forecasting | |
CN119128448A (zh) | 基于多源模态融合深度学习的高分辨雨情分析生成方法 | |
CN112200355B (zh) | 一种滑坡的预测方法、装置、设备和存储介质 | |
Rahmana et al. | Comparative study of extraction features and regression algorithms for predicting drought rates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |