CN113971477A

CN113971477A - 一种基于时间序列和深度学习框架的pm2.5估算方法

Info

Publication number: CN113971477A
Application number: CN202111128866.7A
Authority: CN
Inventors: 史舟; 王之戈; 伍温强; 周银
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-09-26
Filing date: 2021-09-26
Publication date: 2022-01-25
Anticipated expiration: 2041-09-26
Also published as: CN113971477B

Abstract

本发明公开了一种基于时间序列和深度学习框架的PM_2.5估算方法，包括获取待估算区域的PM_2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据，并共同作为多源数据；将多源数据编码为时间序列格式，以获得时间序列数据；依次构建时空增强神经网络模型的空间模块、时间模块和增强模块，以对待估算区域的PM_2.5进行反演估算；将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中，对待估算区域目标时间内的PM_2.5进行空间连续估算，得到空间分辨率为1km的PM_2.5时空分布产品。本发明充分利用了PM_2.5和遥感数据的时空变化，可以生成长期、更详细、更可靠、分辨率更高的PM_2.5产品，对我国的空气污染预防和治理具有重要的理论与实际意义。

Description

一种基于时间序列和深度学习框架的PM2.5估算方法

技术领域

本发明属于大气污染物反演预测领域，具体涉及一种基于时间序列和深度学习框架的PM_2.5估算方法。

背景技术

PM_2.5是指空气动力学直径小于或等于2.5μg的颗粒物。根据柳叶刀的一篇文章报道，PM_2.5在2015年已成为世界第五大死亡危险因素(Cohen et al.，2017)，在全球造成了约420万人的死亡。自2013年以来，我国PM_2.5观测站数量逐年增加。然而，这些监测网的地理覆盖范围仍然有限且不均匀，这意味着收集到的浓度不一定代表该地区的PM_2.5浓度。仅从地面测量很难评估PM_2.5的区域变异性。

与传统的地面监测相比，卫星遥感技术具有宏观、快速获取信息的特点，逐渐成为重要的监测手段。基于卫星遥感手段的PM_2.5预测常采用光学气溶胶厚度(AOD)这一指标，光学气溶胶厚度描述了气溶胶对光的减弱作用，被证明与近地颗粒物有密切的相关性。比较常见的用于PM_2.5反演的遥感产品包括MODIS、MISR等。基于PM_2.5和AOD遥感产品之间的相关关系，早期的研究开发了各种估算PM_2.5的统计回归方法，包括简单线性回归、多元线性回归以及考虑时空异质性的地统计回归，例如，地理加权回归(GWR)模型、地理和时间加权回归(GTWR)模型。同时，机器学习模型也被广泛用于估算PM_2.5。然而，PM_2.5受多种相关的自然条件和人为因素决定，具体强烈的空间变异、相关性和时间依赖性。统计回归方法的特征学习能力较弱，无法在PM_2.5和AOD之间建立稳定的关系；机器学习模型可以很好地拟合非线性关系，但它们仅基于大数据特征建模，隐藏在PM_2.5时间序列和地理空间分布中的物理特征没有得到充分利用。

近年来，深度学习在从时间序列中发现目标对象复杂的非线性关系方面取得了显著的成功。例如循环神经网络(RNN)及其变体LSTM这两个突出的深度学习模型，它们专门用于识别长时间序列的时间变化模式以及捕捉复杂的非线性关系。PM_2.5具有很强的时间依赖性。因此，一些研究人员已经应用深度学习方法，使用长时间序列数据来估计和预测PM_2.5。Qi等使用LSTM模型估算了逐小时的PM_2.5浓度并验证了深度学习模型的优越性。为了进一步提高神经网络的时空学习能力，Pak等人结合了多种神经网络：卷积神经网络(CNN)、人工神经网络(ANN)和LSTM来预测每日PM_2.5浓度。然而，深度学习模型较弱的空间泛化能力限制了对PM_2.5的空间连续变化和地理分布的预测。此外，用于PM_2.5预测的深度学习模型大多在短时间尺度(即每天和每小时)进行；深度学习模型在长期趋势分析中的潜力尚未被探索。并且大多数基于时间序列的RNN模型都忽略了空间异质性和空间相关性。因此，建立一个稳健的、基于遥感产品的、可以更好的处理PM_2.5的空间相关性和时间依赖性的PM_2.5估算模型至关重要。

发明内容

本发明的目的在于解决现有技术中存在的问题，并提供一种基于时间序列和深度学习框架的PM_2.5估算方法。

本发明所采用的具体技术方案如下：

本发明提供了一种基于时间序列和深度学习框架的PM_2.5估算方法，具体如下：

S1：获取待估算区域的PM_2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据，并共同作为多源数据；将所述多源数据编码为时间序列格式，以获得时间序列数据；

S2：依次构建时空增强神经网络模型的空间模块、时间模块和增强模块，以对待估算区域的PM_2.5进行反演估算；

所述空间模块的构建方法具体如下：依据PM_2.5地面观测站点的空间分布，选取邻近目标站点的若干PM_2.5地面观测站点，分别计算两者的空间距离，根据所选取PM_2.5地面观测站点所得的PM_2.5浓度，进行空间组合加权，得到相邻若干站点对目标站点PM_2.5浓度的影响效应，记为空间信号；随后将空间信号与所述时间序列数据一同作为时空序列数据；

所述时间模块的构建方法具体如下：搭建双向长短期记忆模型，并为所述时空序列数据赋予时间特征，得到输出值h_t；

所述增强模块的构建方法具体如下：搭建注意力机制结构，为所述输出值h_t中不同的变量赋予不同权重；

S3：将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中，对待估算区域目标时间内的PM_2.5进行空间连续估算，得到空间分辨率为1km的PM_2.5时空分布产品。

作为优选，所述待估算区域为中国。

作为优选，所述步骤S1中，PM_2.5地面观测数据为逐日的地面站点数据；AOD产品数据采用经大气多角度校正算法生成的MODIS 1km AOD产品；气象数据包括风速、湿度、温度、气压和行星边界层高度；土地利用/覆被和经济社会数据包括数字高程模型、归一化植被指数、土地利用数据和人口密度。

作为优选，所述步骤S1中，利用ArcGIS 10.3和R语言，将AOD产品数据、气象数据、土地利用/覆被和经济社会数据，预处理为与PM_2.5地面观测数据具有相同的时空尺度；随后利用双线性插值方法确保所有数据处于相同的时空分辨率；接着按照所述多源数据的时间先后关系，利用python将其编码为时间序列格式，并获得时间序列数据。

作为优选，所述步骤S2的空间模块构建过程中，每个目标站点i的空间信号SS_i的计算方法具体如下：

其中，X_j是指邻近目标站点i的PM_2.5地面观测站点j所测得的PM_2.5浓度；d_ji是站点i和站点j的空间距离；n是所选取的邻近目标站点i的PM_2.5地面观测站点的数量，优选为3；(x_i，y_i)与(x_j，y_j)分别为站点i和站点j的坐标。

进一步的，所述步骤S2的空间模块构建过程中，将每个时间节点t处的空间信号与所述时间序列数据一同编码为向量x_t，向量x_t的形式为[v₁，v₂，...，v_m]，m为空间信号和时间序列数据中所有数据的总数量；将一个时间步长T内的所有向量x_t拼接为一个时空序列数据，其形式为[x₁，x₂，...x_t，...，x_T]，其中T为输入下一模块的时间步长。

更进一步的，所述步骤S2的时间模块构建过程中，输出值h_t的计算方法具体如下：

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (3)

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (4)

C_t＝f_t*C_t-1+i_t*tanh(W_C·[h_t-1，x_t]+b_C) (5)

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (6)

h_t＝o_t*tanh(C_t) (7)

其中，f_t、i_t、o_t、C_t分别表示遗忘门、输入门、输出门和单元状态的向量，W_f、W_i、W_C、W_o均是权重，b_f、b_i、b_C、b_o表示分别对应的门和单元状态；h_t-1和h_t是不同时间步长t-1和t的输出变量，x_t是当前输入，[h_t-1，x_t]代表将两个向量合并为一个向量；σ和tanh为激活函数。

再进一步的，所述步骤S2的增强模块构建过程中，将时间特征h_t作为输入向量，地面PM_2.5地面观测数据作为目标向量y_t，通过输入向量h_t和目标向量y_t的信息及相互关系得到注意力向量

随后使用Softmax函数计算权重值α_t；最后，基于权重值α_t，通过加权求和得到调整向量

具体公式如下：

其中，W_C和W_s均为模型参数，tanh为激活函数，T为输入下一模块的时间步长。

作为优选，所述步骤S3中，稳定性检验采用基于样本的交叉验证、空间交叉验证和时间交叉验证方法。

作为优选，所述步骤S3中，精度评价采用决定系数、均方根误差、平均绝对误差、相对预测误差和预测偏差对时空增强神经网络模型的估算结果进行检验。

本发明相对于现有技术而言，具有以下有益效果：

本发明开发了一种空间可推广的深度学习模型，即时空增强神经网络(STENN)，通过将多时相的遥感产品、气象指标和人类活动指标相结合，更精确的预测待研究区域内PM_2.5的空间分布与时间演变。通过将空间信号输入到能够处理时间序列的循环神经网络中，该模型提供了一种地理数据驱动的方法来更好的处理PM_2.5受空间异质性和时间依赖性的影响，因此其表现显著优于大多数先前的PM_2.5预测模型。此外，该模型还具有强大的时空可迁移性，可以外推到没有PM_2.5地面监测的年份和地区。

本发明充分利用了PM_2.5和遥感数据的时空变化特征，可以生成长期的、更详细的、更可靠的高分辨率PM_2.5产品，对PM_2.5污染及其对人体危害的研究有较大帮助，为改善中国空气质量的方针政策制定提供重要参考，存在推广应用的价值。

附图说明

图1是实施例中，STENN模型与当前流行的深度学习和机器学习模型的比较情况，其中，(a)～(d)分别为STENN模型、LSTM模型、RF模型、Cubist模型预测的PM_2.5相对于地面观测的PM_2.5的验证结果；

图2是实施例中，采用不同交叉验证方法得到的验证结果，其中，(a)为2015-2020年时间交叉验证结果，(b)为中国七大地理分区的空间交叉验证结果；

图3是实施例中，获得的2014至2020年年平均以及7年(2014-2020)平均PM_2.5浓度时空分布产品。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步阐述和说明。本发明中各个实施方式的技术特征在没有相互冲突的前提下，均可进行相应组合。

PM_2.5受自然和人为因素等多重作用的影响，目前常见的PM_2.5估算方法都忽略了其复杂的时间依赖性和空间相关性，因此本发明搭建了一个具有空间泛化能力的深度学习模型来估算中国多年的PM_2.5浓度及空间分布，即提供了一种基于时间序列和深度学习框架的PM_2.5估算方法，具体如下：

S1：获取待估算区域(如中国)的PM_2.5地面观测数据、AOD产品数据、气象数据、土地利用/覆被和经济社会数据，并共同作为多源数据。其中，PM_2.5地面观测数据为逐日的地面站点数据；AOD产品数据采用大气多角度校正(MAIAC)算法生成的MODIS 1km AOD产品；气象数据包括风速(WS,Wind speed)、湿度(RHU,Relative humidity)、温度(TEMP,Temperature)、气压(P,Pressure)、行星边界层高度(BLH,boundary layer height)；土地利用/覆被和经济社会数据包括数字高程模型(DEM,Digital elevation model)、归一化植被指数(NDVI,Normalized difference vegetation index)、土地利用数据(LUCC,landuse/cover change)、人口密度(POP,Population distribution)。

随后将上述多源数据编码为时间序列格式，以获得时间序列数据，具体如下：

利用ArcGIS 10.3和R语言，将AOD产品数据、气象数据、土地利用/覆被和经济社会数据，预处理为与PM_2.5地面观测数据具有相同的时空尺度。随后利用双线性插值方法对1km网格单元的气象数据和土地利用/覆被和经济社会数据进行重采样，计算AOD和BLH数据的平均值，以确保所有数据处于相同的时空分辨率。接着按照所获得的多源数据的时间先后关系，利用python将其编码为时间序列格式：即用python写一个代码，把单独的每年的产品编码到一起变成每几年一个文件，最后获得了时间序列数据。

S2：搭建时空增强神经网络(STENN,SpatioTemporal Enhanced Neural Network)模型用于对待估算区域的PM_2.5浓度进行反演估算，该模型包含空间模块、时间模块和增强模块3个部分。时空增强神经网络(STENN)模型，是以多时相多源遥感产品和PM_2.5地面观测数据作为输入，根据空间相关性获取空间信号，通过LSTM模型获取时空特征，并通过注意力机制增强时空特征，将下一个时间步长作为PM_2.5预测的输出结果。STENN模型有较强的空间泛化能力，能够将站点级别的PM_2.5预测扩展到国家范围内的1km分辨率的预测。

具体每个模块的操作步骤如下：

S21(构建空间模块)：依据PM_2.5地面观测站点的空间分布，选取邻近目标站点的若干PM_2.5地面观测站点，分别计算两者的空间距离，根据所选取PM_2.5地面观测站点所得的PM_2.5浓度，进行空间组合加权，得到相邻若干站点对目标站点PM_2.5浓度的影响效应，记为空间信号(SS,Spatial signal)。

其中，空间信号考虑目标点i周围的邻近观测点j(j＝1,2...,n)的影响，利用距离加权来增强或减弱邻近观测点的影响。

该操作中，每个目标站点i的空间信号SS_i的计算方法具体如下：

式中，X_j是指邻近目标站点i的PM_2.5地面观测站点j所测得的PM_2.5浓度；d_ji是站点i和站点j的空间距离(即欧几里得距离)；n是所选取的邻近目标站点i的PM_2.5地面观测站点的数量，模型的性能与n的大小无显著关系，当n为3时模型性能最好；(x_i，y_i)与(x_j，y_j)分别为站点i和站点j的坐标。

随后将空间信号与其他变量(即时间序列数据)一同作为时空序列数据。，具体如下：

将每个时间节点t处的空间信号与其他预处理后的环境变量(即时间序列数据)一同编码为向量x_t，向量x_t的形式为[v₁，v₂，...，v_m]，m为空间信号和时间序列数据中所有数据的总数量。随后将一个时间步长T内的所有向量x_t拼接为一个时空序列数据，其形式为[x₁，x₂，...x_t，...，x_T]，其中T为输入下一模块的时间步长。

S22(构建时间模块)：搭建双向长短期记忆(BiLSTM，Bidirectional long short-term memory)模型，并为通过S21获得的时空序列数据赋予时间特征，得到输出值h_t。

双向长短期记忆(BiLSTM)模型是长短期记忆(LSTM)模型的拓展版，LSTM弥补了RNN模型在处理长时间序列数据中出现的梯度消失或梯度爆炸的问题，其定义具体如下：

LSTM模型采用了“门”的结构，该结构决定了LSTM模块的状态是否更新以及更新到什么程度。每个LSTM模块包含一个遗忘门f_t，它决定从时间步t-1开始需要保留多少信息；一个输入门i_t，它决定从当前时间步t开始存储多少信息；一个单元状态C_t，它用于更新当前单元的状态；一个输出门o_t，它决定当前单元状态C_t要输出多少信息。

LSTM模型在时间步为t的等式，具体如下：

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (3)

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (4)

C_t＝f_t*C_t-1+i_t*tanh(W_C·[h_t-1，x_t]+b_C) (5)

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (6)

h_t＝o_t*tanh(C_t) (7)

双向长短期记忆模型(Bidirectional LSTM，Bi-LSTM)是LSTM的扩展，它改变了LSTM中时间序列只向前流动的缺陷，允许其向前和向后双向流动。在双向长短期记忆模型中，t时刻的输出向量扩展为两个向量，分别为

和

两个来自相反时间方向流动的向量组合起来构成最终输出向量

即h_t。

S23(构建增强模块)：搭建注意力机制结构(Attentional mechanism)，将S22时间模块中输出作为该模块输入，为通过S22得到的输出值h_t中不同的变量赋予不同权重。即注意力机制通过学习数据间的相互关系，为不同环境变量赋予不同权重，来关注更为重要的环境变量。

在注意力机制中，首先通过输入向量h_t和目标向量y_t的信息及相互关系得到注意力向量

然后使用Softmax函数计算权重值α_t。最后，基于权重值α_t，通过加权求和得到调整向量

具体公式如下：

其中，W_C和W_s是计算所需的模型参数，tanh为激活函数。

S3：对S2中模型进行稳定性检验和精度评价，以保证PM_2.5估算的准确性。随后将预测集的数据输入经过稳定性检验和精度评价的时空增强神经网络模型中，对待估算区域目标时间内的PM_2.5进行空间连续估算，得到空间分辨率为1km的PM_2.5时空分布产品。

其中，稳定性检验采用基于样本的交叉验证、空间交叉验证和时间交叉验证方法。精度评价采用决定系数、均方根误差、平均绝对误差、相对预测误差和预测偏差对时空增强神经网络模型的估算结果进行检验。

三种交叉验证的具体方法如下：

(1)基于样本交叉验证：即较常见的十折交叉验证。将数据集随机分为10份，其中9份用于建立和训练模型，剩余1份用于模型验证，然后交替轮换，直到10份中每1份均用于模型验证。

(2)时间交叉验证：通过选用1年的数据进行模型验证，而其他年份的数据则用于模型拟合，并且轮换，直到所有年份均用于验证。

(3)空间交叉验证：根据数据的地理位置，按照中国7大地理分区将数据集划分为7份，其中1份用于模型验证，其余6份用于训练模型，并依次轮换进行验证。

五项评价指标：决定系数(R²)、均方根误差(RMSE)、平均绝对误差(MAE)、相对预测误差(PRE,％)、预测偏差(Predicted bias)的计算公式如下：

Predicted Bias＝f_i-y_i (15)

其中，n是数据样本的总数，f_i、y_i分别是地面观测的PM_2.5和模型估计的PM_2.5。

实施例

选取中国作为研究区，使用本发明的上述方法进行分析，具体步骤如下：

步骤1)数据获取：2013-2020年逐日PM_2.5地面观测数据来自中国国家环境监测中心(CNEMC,http://www.cnemc.cn/)，在2013-2020年间，监测站数量由835个增长至1700个；多时相(2011-2019年)MODIS 1-km AOD数据是由MODIS卫星通过大气校正多角度(MAIAC)算法生成的数据产品，空间分辨率为1km，将数据通过几何校正后，选择550nm波长的AOD数据，通过重投影和拼接获得覆盖全中国范围的数据；气象数据包括风速(WS)、湿度(RHU)、温度(TEMP)、气压(P)、行星边界层高度(BLH)等5个变量，气象数据是由欧洲中期天气预报中心(ECMWF)第五代气候和天气产品(ERA5)全球大气再分析工具生成的；土地利用/覆被和经济社会数据包括数字高程模型(DEM)、归一化植被指数(NDVI)、土地利用数据(LUCC)、人口密度(POP)，数据来源为中国科学院资源环境科学与数据中心。气象与土地利用/覆被和经济社会数据的时间覆盖范围均为2011年至2019年。

步骤2)数据预处理：通过ArcGIS 10.3和R语言进行数据处理，将AOD产品数据、气象数据、土地利用/覆被和经济社会数据等多源遥感产品进行预处理，与PM2.5地面观测数据达到相同的时空尺度。随后使用双线性插值方法对1km网格单元的气象数据和土地利用/覆被和经济社会数据进行重采样，计算AOD和BLH数据的平均值，确保所有数据处于相同的时间分辨率(逐年)和空间分辨率(1km)。

步骤3)模型构建：使用Python中的深度学习API：Keras搭建STENN模型。在输入模型之前，首先对建模集数据进行标准化。在STENN模型的时间模块包含三个具有512个隐藏单元的BiLSTM层，每个BiLSTM层的betch size为72，增强模块中有1个注意力层。为防止过拟合在增强模块中设置了一个dropout层，网络迭代次数设定为300次，采用基于梯度下降的优化器Adam和学习率调度器，其中学习速率被设定为每50个迭代减少1/10。

步骤4)模型验证：使用三种交叉验证方式对STENN模型的表现进行验证，同时使用了当前流行的深度学习/机器学习模型：LSTM、随机森林(RF)、Cubist模型进行对比研究。结果如图1和2所示。

图1为STENN(a)、LSTM(b)、RF(c)和Cubist(d)的预测PM_2.5相对于地面观测PM_2.5的密度散点图；虚线表示线性回归的最佳拟合线，实线表示1:1线；图中RMSE和MAE的单位是μgm^-3。从图1中可以看出，STENN模型在各项指标中均表现最优，具有最高的R²和最低的RMSE、MAE、RPE，分别为0.89、5.84μg m^-3、3.97μg m^-3、12.74％。从散点的分布中也可以看出，STENN模型的拟合回归线最为接近1:1线。其他三个模型的表现基本一致，虽然它们都具有不错的准确性，但对异常高值或低值的预测能力较差。

STENN模型在中国2015-2020年的时间交叉验证结果如图2(a)所示。STENN模型每年的性能并不一致，模型在2020年预测的不确定性最低，模型表现最优。总体而言，预测的结果与不同年份的地表观测结果较为吻合(R²＝0.78-0.87)STENN模型在中国七个地理区域(西北、东北、北部、中部、东部、南部和西南)的空间交叉验证结果如图2(b)所示。模型在不同区域表现略有不同，模型预测性能在华东和华中地区最优，R²为0.85。相比之下，模型在中国西北地区表现最差。模型表现差异的原因可能有两个，一是监测站的密度和分布决定了空间信号的计算及其对目标PM_2.5的响应；其次，不同的气候条件和地表覆盖导致模型在不同地区的性能存在差异。

步骤5)：将预测集的数据输入搭建好的STENN模型，得到2014-2020年研究区(中国)的1km PM_2.5空间分布产品。如图3所示，为中国2014-2020年平均PM_2.5浓度的空间分布(a-g)、7年平均PM_2.5浓度的空间分布(h)。可见该产品具有较高的空间分辨率和较高的预测准确度，基于此可对中国PM_2.5精细尺度的时空变化展开分析，为制定相关污染防治政策提供依据。

本发明充分利用了PM_2.5和遥感数据的时空变化，可以生成长期、更详细、更可靠、分辨率更高的PM_2.5产品，对我国的空气污染预防和治理具有重要的理论与实际意义。

以上所述的实施例只是本发明的一种较佳的方案，然其并非用以限制本发明。有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。

Claims

1.一种基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，具体如下：

2.如权利要求1所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述待估算区域为中国。

3.如权利要求1所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S1中，PM_2.5地面观测数据为逐日的地面站点数据；AOD产品数据采用经大气多角度校正算法生成的MODIS 1km AOD产品；气象数据包括风速、湿度、温度、气压和行星边界层高度；土地利用/覆被和经济社会数据包括数字高程模型、归一化植被指数、土地利用数据和人口密度。

4.如权利要求1所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S1中，利用ArcGIS 10.3和R语言，将AOD产品数据、气象数据、土地利用/覆被和经济社会数据，预处理为与PM_2.5地面观测数据具有相同的时空尺度；随后利用双线性插值方法确保所有数据处于相同的时空分辨率；接着按照所述多源数据的时间先后关系，利用python将其编码为时间序列格式，并获得时间序列数据。

5.如权利要求1所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S2的空间模块构建过程中，每个目标站点i的空间信号SS_i的计算方法具体如下：

6.如权利要求5所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S2的空间模块构建过程中，将每个时间节点t处的空间信号与所述时间序列数据一同编码为向量x_t，向量x_t的形式为[v₁，v₂，…，v_m]，m为空间信号和时间序列数据中所有数据的总数量；将一个时间步长T内的所有向量x_t拼接为一个时空序列数据，其形式为[x₁，x₂，...x_t，...，x_T]，其中T为输入下一模块的时间步长。

7.如权利要求6所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S2的时间模块构建过程中，输出值h_t的计算方法具体如下：

f_t＝σ(W_f·[h_t-1，x_t]+b_f) (3)

i_t＝σ(W_i·[h_t-1，x_t]+b_i) (4)

C_t＝f_t*C_t-1+i_t*tanh(W_C·[h_t-1，x_t]+b_C) (5)

o_t＝σ(W_o·[h_t-1，x_t]+b_o) (6)

h_t＝o_t*tanh(C_t) (7)

8.如权利要求7所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S2的增强模块构建过程中，将时间特征h_t作为输入向量，地面PM_2.5地面观测数据作为目标向量y_t，通过输入向量h_t和目标向量y_t的信息及相互关系得到注意力向量

具体公式如下：

9.如权利要求1所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S3中，稳定性检验采用基于样本的交叉验证、空间交叉验证和时间交叉验证方法。

10.如权利要求1所述的基于时间序列和深度学习框架的PM_2.5估算方法，其特征在于，所述步骤S3中，精度评价采用决定系数、均方根误差、平均绝对误差、相对预测误差和预测偏差对时空增强神经网络模型的估算结果进行检验。