CN115796359A

CN115796359A - 基于深度Koopman算符的PM2.5时空预测方法

Info

Publication number: CN115796359A
Application number: CN202211506538.0A
Authority: CN
Inventors: 汪愿愿; 周洪叶; 覃梦娇
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-11-28
Filing date: 2022-11-28
Publication date: 2023-03-14

Abstract

本发明公开了一种基于深度Koopman算符的PM2.5时空预测方法，属于地理信息技术(GIS)领域。该方法针对海量PM2.5监测数据，基于Koopman算符，融合图嵌入方法以及编码器‑解码器，构建Koopman线性不变子空间映射网络，利用深度学习实现时空动力系统内在模式表征，从而进行动力系统的重构，可实现PM2.5站点浓度的小时级预测。本发明能够实现PM2.5站点浓度的时空预测，在大气环境监测、智慧城市发展等领域具有重要的意义。

Description

基于深度Koopman算符的PM2.5时空预测方法

技术领域

本发明涉及地理信息技术(GIS)领域，具体涉及一种基于深度Koopman 算符的PM2.5时空预测方法。

背景技术

PM2.5是雾霾的主要成分，危害人类健康，增加心脑血管和呼吸系统疾病的发病率和死亡率。利用历史数据高效准确地预测未来较长一段时间的 PM2.5浓度有助于科学预防并有效减少污染事件造成的损失。PM2.5时空预测方法主要可以分为传统数值模拟方法与数据驱动方法，目前，这两种方法在预测上都在非线性的时空预测问题上表现出明显的发展瓶颈，制约了复杂时空过程预测精度的提升。Koopman算符为人们提供了一个有效的数学工具，其主要思想是将一个非线性的时空动力系统映射到一个无限维的线性空间下，并通过线性算符实现系统状态预测。该方法不依赖于明确的动力学方程，直接从观测数据中挖掘动力系统隐含的时空演化模式。通过Koopman算符，能够在得到原时空动力系统非线性特性的同时，保证系统不会丢失任何信息。然而现有的基于Koopman 的时空预测方法在选择基函数时存在明显的主观性，同时无法将地理空间信息进行嵌入。

发明内容

本发明的目的是克服现有技术的不足，提供一种基于深度Koopman算符的 PM2.5时空预测方法。

为实现上述发明目的，本发明具体采用的技术方案如下：

一种基于深度Koopman算符的PM2.5时空预测方法，它的步骤如下：

S1、获取目标区域内的PM2.5监测站点历史数据集，并将PM2.5监测站点的历史PM2.5监测数据编码为时间序列格式，从而获得每个PM2.5监测站点对应的PM2.5浓度时间序列，对各PM2.5浓度时间序列进行预处理，使序列中的数据在时间上连续，从而得到历史序列数据集；

S2、构建深度学习网络，所述深度学习网络包括空间信息嵌入模块、第一状态空间映射模块、线性动力学预测模块和第二状态空间映射模块；

所述深度学习网络的网络输入为目标区域内不同PM2.5监测站点的PM2.5 浓度时间序列；

所述空间信息嵌入模块用于通过图嵌入方法对网络输入进行空间信息嵌入，使PM2.5监测站点之间形成空间关联，得到图嵌入结果；

所述第一状态空间映射模块用于通过编码器将图嵌入结果由非线性状态空间转换到线性相空间；

所述线性动力学预测模块中设有两层用于近似表示Koopman算符的线性层，第一线性层用于在前向推演过程中基于编码器的编码结果进行线性空间下的下一步状态预测，第二线性层用于在逆向推演过程中基于编码器的编码结果进行线性空间下的上一步状态预测，两个线性层中均只包含权重而不包含偏置；

所述第二状态空间映射模块用于通过解码器将下一步状态预测从线性相空间转换回原始的非线性状态空间，得到未来时刻PM2.5的预测结果；

S3、利用所述历史序列数据集对所述深度学习网络进行训练，并对所述深度学习网络中的超参数进行调整，获得空气污染物浓度预测模型；

S4.获取目标区域内待测监测站点的历史PM2.5浓度时间序列，并将其输入到所述空气污染物浓度预测模型中，得到未来时刻的PM2.5浓度预测值。

作为优选，所述步骤S1中，对各PM2.5浓度时间序列进行预处理的过程具体为：计算PM2.5浓度时间序列的数据缺失率，剔除PM2.5浓度时间序列的数据缺失率超过阈值的监测站点数据，然后利用线性插值方法对于剩余的PM2.5 浓度时间序列进行时序补全，获得时间上连续的PM2.5浓度时间序列数据，用于作为网络输入。

作为优选，所述空间信息嵌入模块中，采用图嵌入方法进行空间信息嵌入，其中构建图结构的步骤如下：

所述深度学习网络输入的监测站点数量为N，则将这N个监测站点组织为具有N个节点的图G＝(V,E)，其中V表示图中节点的集合，E为图中边的集合；图G的邻接矩阵用A表示，A中的每个元素A_ij都表示两个站点之间的空间相关性；其中邻接矩阵中边权重的构建方法为反距离函数法，d_ij表示监测站点i与监测站点j之间的直线距离，公式表达如下：

基于所述输入模块输入的N个监测站点的PM2.5浓度时间序列和构建的图 G，将监测站点在每个时刻的输入转换为图信号，并通过图卷积神经网络GCN 进行图嵌入，得到图嵌入结果。

作为优选，所述线性动力学预测模块中，两个线性层中的线性转换公式表达如下：

其中f_k表示当前第k时刻的输入经过图嵌入模块后得到的图嵌入结果，

和

分别表示下一步演化后的图嵌入结果和上一步的图嵌入结果；C表示第一线性层的权重矩阵，用于计算下一步的演化状态；D表示第二线性层的权重矩阵，用于反推上一步的状态；χ_e为第一状态空间映射模块中的编码器，χ_d为第二状态空间映射模块中的解码器；符号○代表网络层之间的级联。

作为优选，所述深度学习网络训练采用的损失函数组成如下：

其中：ε_id表示编码器-解码器的重建损失项，ε_fwd、ε_bwd分别表示动力系统正向推演与逆向推演的预测损失项，ε_con表示矩阵C与矩阵D的一致性损失项； n表示PM2.5浓度时间序列的长度，x_k和

分别表示第k时刻网络输入的监测站点PM2.5浓度真值与预测值；λ_s表示预测的总步数；f_k+l和

分别表示第 k+l时刻的图嵌入结果真值和预测值；f_k-l和

分别表示第k-l时刻的图嵌入结果真值和预测值；D_k*和C_*k分别表示矩阵D的上k行和矩阵C的左k行，||·||_F表示矩阵的范数，κ表示矩阵D和矩阵C的维度；

将所有的损失项加权组合在一起，得到深度学习网络训练采用的总损失函数，公式表达如下：

ε＝λ_idε_id+λ_fwdε_fwd+λ_bwdε_bwd+λ_conε_con

其中λ_id、λ_fwd、λ_bwd、λ_con为用于控制各项损失函数贡献度的网络超参数。

作为优选，所述λ_id、λ_fwd、λ_bwd、λ_con分别为1、1、0.01和0.01。

作为优选，所述权重矩阵C和D的维度取32维。

作为优选，所述编码器和解码器采用自编码器(AE)实现。

相对于现有技术而言，本发明具体以下有益效果：

本发明通过引入Koopman算符，利用深度学习挖掘时空动力系统内在模式表征，解释时空过程中的运动规律，从而实现动力系统的重构与预测。本发吗利用深度学习实现从非线性状态空间到Koopman不变子空间的映射，并在状态空间转换时考虑PM2.5站点间地理空间关系，利用图表示学习方法实现空间信息嵌入。本发明对于PM2.5时空预测研究和应用具有重要的意义。

附图说明

图1为基于深度Koopman算符的PM2.5时空预测方法的步骤流程示意图；

图2为基于深度Koopman算符的PM2.5时空预测方法深度学习网络架构图；

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，以下内容将结合附图以及公式阐述对本发明的优选实施例进行详细的介绍，介绍内容包括从基本原理，到实际如何使用，涵盖所有在本发明的基础上做的改进和修改的方法和措施。

如图1所示，在本发明的一个较佳实施例中，提供了一种基于深度Koopman 算符的PM2.5时空预测方法，它的步骤如下：

S1、获取目标区域内的PM2.5监测站点历史数据集，并将PM2.5监测站点的历史PM2.5监测数据编码为时间序列格式，从而获得每个PM2.5监测站点对应的PM2.5浓度时间序列，对各PM2.5浓度时间序列进行预处理，使序列中的数据在时间上连续，从而得到历史序列数据集。

需要说明的是，本发明对PM2.5浓度时间序列进的上述预处理，其主要目的是去除异常数据，补全缺失数据。因此，进行预处理时，可采用缺失值补全、异常值修正、缺失站点剔除、数据集划分等操作。

在本发明的实施例中，对各PM2.5浓度时间序列进行预处理的过程具体为：计算PM2.5浓度时间序列的数据缺失率，剔除PM2.5浓度时间序列的数据缺失率超过阈值的监测站点数据，然后利用线性插值方法对于剩余的PM2.5浓度时间序列进行时序补全，获得时间上连续的PM2.5浓度时间序列数据，用于作为网络输入。本发明中，可将数据缺失率定义为：数据缺失率＝nan值个数/浓度数据总数×100％，根据监测站点上污染物的数据缺失率剔除部分监测站点。剔除监测站点所用的阈值，可根据实际进行确定，例如可设置5％，如果该监测站点上的数据缺失率大于5％，就将这个监测站点剔除，不作为后续网络的输入，避免降低预测精度。

上述目标区域是指本发明需要预测的区域，可根据实际选择。例如，可获取中国范围内的PM2.5监测站点数据，包括站点名称、站点经度、站点纬度，以及PM2.5监测浓度信息，时间粒度为小时，基于Python进行数据处理和分析。并将PM2.5时序数据划分为多个时间窗口，并对所有时间窗口进行随机采样。为了保证网络训练的进行，可进行数据集划分，例如按60％、20％、20％的比例将总数据集划分为训练集、验证集与测试集。

S2、构建深度学习网络，所述深度学习网络包括空间信息嵌入模块、第一状态空间映射模块、线性动力学预测模块和第二状态空间映射模块。

如图2所示，展示了该深度学习网络的模型原理图，下面对各模块的具体原理和实现方式进行详细描述。

深度学习网络的网络输入为目标区域内不同PM2.5监测站点的PM2.5浓度时间序列。空间信息嵌入模块用于通过图嵌入方法对网络输入进行空间信息嵌入，使PM2.5监测站点之间形成空间关联，得到图嵌入结果。第一状态空间映射模块用于通过编码器将图嵌入结果由非线性状态空间转换到线性相空间。线性动力学预测模块中设有两层用于近似表示Koopman算符的线性层，第一线性层用于在前向推演过程中基于编码器的编码结果进行线性空间下的下一步状态预测，第二线性层用于在逆向推演过程中基于编码器的编码结果进行线性空间下的上一步状态预测，两个线性层中均只包含权重而不包含偏置。第二状态空间映射模块用于通过解码器将下一步状态预测从线性相空间转换回原始的非线性状态空间，得到未来时刻PM2.5的预测结果。

具体而言，在本发明的实施例中，上述空间信息嵌入模块中，采用图嵌入方法进行空间信息嵌入，其中需要先构建图再进行图嵌入。PM2.5的传输是一种典型的动力系统，而在动力系统中变量之间往往存在一定相关关系，尤其在时空动力系统中，不同位置的系统状态相互影响。传统的深度Koopman算符中，自动编码器在进行空间映射时忽略了不同位置上系统状态之间的关系。。但深度学习与 Koopman算符的结合使得模型的输入变得更加灵活，也为模型考虑系统空间信息提供了可能性。因此，在本发明中，构建图结构时将PM2.5站点间地理空间关系引入输入数据中进行考虑。

在本发明的实施例中，构建图结构的步骤如下：

假设深度学习网络输入的监测站点数量为N，则将这N个监测站点组织为具有N个节点的图G＝(V,E)，其中V表示图中节点的集合，E为图中边的集合。图G的邻接矩阵用A表示，A中的每个元素A_ij代表了两个节点之间的边权重，其含义是两个站点之间的空间相关性。在本发明中，为了将PM2.5站点间地理空间关系引入输入数据中，可在构建邻接矩阵A中边权重的过程中基于检测站点的直线距离结合反距离函数法来计算边权重，假设d_ij表示监测站点i与监测站点j之间的直线距离，则其计算公式表达如下：

基于网络的输入模块输入的N个监测站点的PM2.5浓度时间序列和构建的图G，即可将监测站点在每个时刻的输入转换为图信号，并通过图卷积神经网络 GCN进行图嵌入，得到图嵌入结果。

将N个监测站点视为一个包含N个坐标的时空动力系统，模型将系统在t 时刻下的状态x_t组织成图g_t＝(V_t，E)，其中节点集合

表示动力系统中的所有坐标位置，边集合

表示每两点之间的关系。本文使用 PM2.5站点间的直线距离作为边权重。经过图表示学习模块，得到f_t＝U(g_t)，其中U表示空间信息嵌入模块。空域中的图卷积可以类比为图片像素上的卷积操作。每个节点从相邻节点上收集信息，由于节点与相邻节点之间的关系强度不同，需要对所有节点的值进行加权平均计算。使用张量表示图节点上的信号，则节点信息更新的过程可以写成：

X^*＝AX

为了结合节点本身的特征，通常在更新节点状态时添加自环：

X^*＝(A+I)X

邻接矩阵和相应的度矩阵可以写成

与

由于节点的边权重差异较大，需要在更新节点之前对信息进行归一化：

最后，为了将该节点的聚合特征X^*转换为相应维度，将线性变换矩阵W应用于聚合特征：

另外，上述第一状态空间映射模块和第二状态空间映射模块，可以通过采用自编码器(AE)实现的一对编码器和解码器。若将系统状态表示为

经过空间信息嵌入后，网络使用一个自动编码器，使用编码器χ_e通过非线性映射将输入数据嵌入到新坐标系下。相对应的，使用解码器χ_d重建系统状态变量。

定义

为输入数据x经过编码器-解码器的结果表达为：

其中

为输入数据经过解码器后的预测结果，U表示图嵌入模块，χ_e为第一状态空间映射模块中的编码器，χ_d为第二状态空间映射模块中的解码器。

但在本发明中，还需要引入Koopman算符来模拟状态的演化，Koopman算符定义了在Koopman不变子空间下系统从某个状态演化到下一个状态的规则。为了考虑模型前向推演与逆向推演的正确性与一致性，网络使用了两个线性层来表示近似的Koopman算符。值得注意的是，由于这两个线性层是用于近似 Koopman算符，因此两个线性层均只包含权重，不包含偏置。因此，在线性动力学预测模块中，两个线性层中的线性转换公式表达如下：

和

从上述两个线性转换公式可见，逆向动力学的约束仅限于矩阵D，而矩阵C 与矩阵D是完全独立的。对于一个时空动力系统，C和D应该是统一的，观测数据经过矩阵C演化到下一状态，则也可以通过逆向的矩阵C反推回上一个状态，即矩阵D的作用：

因此，基于矩阵C和D，可以通过设计约束来将正向演化和逆向反推矩阵形成一致性。

最终，本发明针对深度学习网络训练设计了如下的损失函数形式，总损失函数包含四个损失项，分别如下：

分别表示第 k+l时刻的图嵌入结果真值和预测值；f_k-l和

分别表示第k-l时刻的图嵌入结果真值和预测值；D_k*和C_*k分别表示矩阵D的上k行和矩阵C的左k行，||·||_F表示矩阵的范数，κ表示矩阵D和矩阵C的维度。

ε＝λ_idε_id+λ_fwdε_fwd+λ_bwdε_bwd+λ_conε_con

其中λ_id、λ_fwd、λ_bwd、λ_con为用于控制各项损失函数贡献度的网络超参数。这四个权重参数可以根据实际需要进行优化，在本发明的实施例中最终被优化为λ_id、λ_fwd、λ_bwd、λ_con分别为1、1、0.01和0.01。

另外，两个线性层中的权重矩阵C和D的维度对于最终的模型预测结果也有决定性影响，需要进行合理优化。在本发明的实施例中权重矩阵C和D的维度最终被优化为取32维。

在本发明的实施例中，可用训练集对深度学习网络进行训练，用验证集对训练的深度学习网络进行验证，并进行消融实验，对网络超参数进行调整，直到满足预定条件为止，得到训练好的空气污染物浓度预测模型。

需要注意的是，输入模型的历史PM2.5浓度时间序列，也需要按照样本的形式进行相应的预处理。该模型的预测可以是单步预测，也可以是多步预测，本发明实施例中采用多步预测，选取历史步数为24小时，预测步数为12小时。在模型推理过程中，其推理过程为：将系统状态在t时刻下的观测值即PM2.5浓度时间序列作为模型输入，结合空间信息将数据组织成图结构，利用图表示方法将空间信息嵌入得到图嵌入结果，图嵌入结果经过编码器实现状态空间的映射，并在线性矩阵C的作用下实现新坐标系下状态的演化。最后网络通过一个解码器得到每个图节点上的预测值。

为了便于理解本发明的改进意义所在，下面本发明进一步基于上述实施例中前述S1～S4所述的基于深度Koopman算符的PM2.5时空预测方法，将其应用至具体的实例中对其效果进行展示。

实施例

下面以长三角洲地区中的江苏省、浙江省与上海市的PM2.5监测数据作为研究对象，选取2018年1月1日至2019年12月31日逐小时的地面污染物监测数据作为研究对象，数据来源为中国环境监测中心。

基于该数据集，利用前述S1～S4步骤的基于深度Koopman算符的PM2.5时空预测方法进行PM2.5时空预测，其具体做法如图2所示，步骤如下：

第一步：通过中国环境监测中心网站采集研究区域实时空气质量数据，选取 2018年1月1日至2019年12月31日逐小时的地面污染物监测数据作为研究对象，为了保证数据的可用性和准确性，剔除了数据缺失较严重的站点数据，并采用时间线性插值的方法将缺失数据补全。最终得到研究区域内共121个监测站点，每个站点的序列总长度为16986小时，总记录数为2055306条。统一选取历史步数为24小时，预测步数为12小时，并将PM2.5时序数据划分为多个时间窗口，并对所有时间窗口进行随机采样，按60％、20％、20％的比例将总数据集划分为训练集、验证集与测试集。

第二步：将时间向量输入到深度Koopman时空预测模型中，将系统状态结合空间信息将数据组织成图结构，利用图表示方法将空间信息嵌入，经过自动编码器实现状态空间的映射，并在线性矩阵的作用下实现新坐标系下状态的演化。最后网络通过一个解码器得到每个图节点上的预测值。

第三步：对网络超参数进行优化调整。对于所述深度学习模型，主要涉及两类超参数：(1)网络结构相关：网络中间层数量、类型、每层神经元数量、激活函数等；(2)模型训练相关：损失函数、优化方法、批次大小、迭代次数、学习率、初始化方法等。在训练过程中，通过参数在验证集上的准确率来评判超参数效果，并选择效果最好的一组超参数。

第四步：获取研究区域内待测监测站点的历史PM2.5浓度监测值，经过预处理后得到待测监测站点的历史PM2.5浓度时间序列；待测监测站点的历史 PM2.5浓度时间序列输入到所述深度Koopman模型中，得到PM2.5浓度预测值。

为了验证本模型预测的性能，需要将预测值与实际值进行对比，选用平均绝对误差MAE，均方根误差RMSE，皮尔逊相关系数r、拟合指数IA作为误差评价指标。

此外，为了验证本发明中基于深度Koopman算符的PM2.5时空预测方法(以下简称本发明方法)的优越性，使用现有技术中几种其他的时空缺失数据补全方法进行对比，各方法具体如下：

LSTM：LSTM模型是循环神经网络的一种变体，通过门控机制捕获序列数据中的长期依赖关系。由于模型无法对空间关系进行建模，因此仅适用于单个站点时序预测。

PCL：未进行空间信息嵌入的深度Koopman模型。

本发明方法：即按照前述S1～S4步骤进行浓度预测。

最终不同算法的PM2.5时空预测性能分别如表1所示。

表1各模型精度评估指标

基于上述超参数的选择，本实施例对比了LSTM、PCL与本发明方法连续预测12步的预测精度。基于Koopman理论的预测模型与LSTM相比，在预测精度上存在明显提升。以第一步预测为例，PCL与本发明方法的四项指标较 LSTM分别提升18％、26％(MAE)，15％、24％(RMSE)，相关系数从0.73 分别提升至0.83、0.86，IA从0.79分别提升至0.89、0.92。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种基于深度Koopman算符的PM2.5时空预测方法，其特征在于它的步骤如下：

所述深度学习网络的网络输入为目标区域内不同PM2.5监测站点的PM2.5浓度时间序列；

2.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述步骤S1中，对各PM2.5浓度时间序列进行预处理的过程具体为：计算PM2.5浓度时间序列的数据缺失率，剔除PM2.5浓度时间序列的数据缺失率超过阈值的监测站点数据，然后利用线性插值方法对于剩余的PM2.5浓度时间序列进行时序补全，获得时间上连续的PM2.5浓度时间序列数据，用于作为网络输入。

3.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述空间信息嵌入模块中，采用图嵌入方法进行空间信息嵌入，其中构建图结构的步骤如下：

基于所述输入模块输入的N个监测站点的PM2.5浓度时间序列和构建的图G，将监测站点在每个时刻的输入转换为图信号，并通过图卷积神经网络GCN进行图嵌入，得到图嵌入结果。

4.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述线性动力学预测模块中，两个线性层中的线性转换公式表达如下：

和

分别表示下一步演化后的图嵌入结果和上一步的图嵌入结果；C表示第一线性层的权重矩阵，用于计算下一步的演化状态；D表示第二线性层的权重矩阵，用于反推上一步的状态；χ_e为第一状态空间映射模块中的编码器，χ_d为第二状态空间映射模块中的解码器；符号

代表网络层之间的级联。

5.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述深度学习网络训练采用的损失函数组成如下：

其中：ε_id表示编码器-解码器的重建损失项，ε_fwd、ε_bwd分别表示动力系统正向推演与逆向推演的预测损失项，ε_con表示矩阵C与矩阵D的一致性损失项；n表示PM2.5浓度时间序列的长度，x_k和

分别表示第k+l时刻的图嵌入结果真值和预测值；f_k-l和

分别表示第k-l时刻的图嵌入结果真值和预测值；D_k*和C_*k分别表示矩阵D的上k行和矩阵C的左k行，||·||F表示矩阵的范数，κ表示矩阵D和矩阵C的维度；

ε＝λ_idε_id+λ_fwdε_fwd+λ_bwdε_bwd+λ_conε_con

6.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述λ_id、λ_fwd、λ_bwd、λ_con分别为1、1、0.01和0.01。

7.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述权重矩阵C和D的维度取32维。

8.如权利要求1所述的基于深度Koopman算符的PM2.5时空预测方法，其特征在于，所述编码器和解码器采用自编码器(AE)实现。