CN115860286A

CN115860286A - 一种基于时序门机制的空气质量预测方法及系统

Info

Publication number: CN115860286A
Application number: CN202310185638.6A
Authority: CN
Inventors: 赵瀚森; 陈泊明; 李妍慧; 陈杰皓; 郑铁; 任华荣; 王筱淳; 武若曦; 闻立杰
Original assignee: Jiangsu Ecological Environment Monitoring Co ltd; Tsinghua University
Current assignee: Jiangsu Ecological Environment Monitoring Co ltd; Tsinghua University
Priority date: 2023-03-01
Filing date: 2023-03-01
Publication date: 2023-03-28
Anticipated expiration: 2043-03-01
Also published as: CN115860286B

Abstract

本发明提供一种基于时序门机制的空气质量预测方法及系统。该基于时序门机制的空气质量预测方法包括以下步骤：S1.以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据。S2.将监测数据进行预处理，并输入预先训练好的预测模型中，进而输出各监测站点T时刻以后一个时间周期a的预测结果。S3.将预测模型根据预设的参数集进行迭代训练，随即令迭代前后的预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，根据对比结果做出相应决策。本发明采用了时序门机制的图神经网络模型，相比于基于注意力机制模型，具有更高的计算效率和更好的鲁棒性。

Description

一种基于时序门机制的空气质量预测方法及系统

技术领域

本发明涉及环境监测技术领域，具体为一种基于时序门机制的空气质量预测方法及系统。

背景技术

空气质量预测预警对于中重度污染天气的防治与管控具有重要意义。目前，常用的空气质量预测技术包括基于大气物理/化学数值模拟模型的预测预报系统以及基于大数据与深度学习的人工智能预测预报系统。

其中，基于大气物理/化学模型的数值模拟预测预报系统通过数值解算相关物理化学偏微分方程，计算各个模拟网格内空气质量随时间的变化，具有物理意义明确，技术成熟，应用广泛的优势，但同时存在输入数据要求高（如地形、土地利用、排放源清单），部分输入数据获取成本高（如排放源清单需要进行逐年调查更新），计算量大（通常需要超算平台）等问题；

随着环境监测大数据的普及应用，基于历史环境质量变化情况训练人工智能模型进行空气质量预报成为新一代技术潮流。该技术具有输入数据简单，计算速度快等优势。通常后者包括收集并整理历史空气质量、气象及污染源监测数据、训练模型，以及进行空气质量回归计算三个步骤。但后者目前也存在模型更新困难、对中重度污染天气预测预报能力弱等问题。

与大多数机器学习模型一样，基于环境监测大数据训练空气质量预测预报模型要求训练样本、测试样本以及验证样本具有基本相同的分布情况，或具有基本一致的系统内在机制，使得模型从训练集学习到的数据关联关系能够适用于测试/验证集以及实际应用条件。由于影响空气质量的因素众多，且这些内含因素（如污染排放情况、季节/年际变化、地质变化等）随时间容易发生变化，采用一定历史数据训练获得的模型预测性能可能随时间逐渐下降，因此，为了维持模型系统的高准确性，需要利用环境监测大数据流对模型进行滚动迭代更新。

现有技术方案如基于注意力机制的图神经网络模型训练难度大，往往需要专业人员对模型进行精细调参以获得较好的训练效果，这一过程导致模型迭代成本高，影响了该技术的推广应用。

发明内容

基于此，有必要针对现有方案训练难度大，模型迭代成本高的问题，提供一种基于时序门机制的空气质量预测方法及系统。

为了实现上述目的，本发明是技术方案如下：

本发明提供一种基于时序门机制的空气质量预测方法，包括以下步骤：

S1.以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据。监测数据包括空气质量数据和气象数据。

S2.将监测数据进行预处理，并将处理后的监测数据输入预先训练好的预测模型中，进而输出各监测站点T时刻以后一个时间周期a的预测结果。

其中，预测模型的构建包括以下步骤：

S21.将预测区域各监测站点的历史监测数据进行预处理，并将预处理后的历史监测数据归集成训练集。

S22.将训练集进行膨胀因果卷积，并将卷积结果

输入至时序门机制计算出时间节点特征h，时间节点特征h的计算公式为：

。其中，g、σ’为激活函数，θ₁和b分别对应激活函数g内输入信号的权重和偏移量，θ₂和c₀分别对应激活函数σ’内输入信号的权重和偏移量。

S23.通过时间节点特征h对训练集进行空间卷积，得到多个空间卷积层，将多个空间卷积层进行权连接合并，构建出预测模型。

S3.将预测模型根据预设的参数集进行迭代训练，随即令迭代后预测模型与迭代前预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，并做出如下决策：

（1）若迭代后预测模型的预测结果优于迭代前预测模型的预测结果，则将迭代后预测模型取代迭代前预测模型。

（2）若迭代前预测模型的预测结果优于迭代后预测模型的预测结果，则保留迭代前预测模型。

进一步的，监测数据预处理的方法包括以下步骤：

对监测数据进行归集，得到各监测站点每个污染因子的历史时序监测数据集合Xt={x₁,x₂,...,x_N}。

对历史时序监测数据集合Xt进行单点数据值突变检测，并通过平均值替换法对单点数据突变的数据值进行替换。

对替换后的历史时序监测数据集合Xt进行关联检测，并通过迭代自回归方法对连续缺失数据进行补充。

将补充后的各监测站点每个污染因子的历史时序监测数据集合Xt进行标准化整理，得到所需处理后的监测数据。

进一步的，单点数据值突变检测方法包括以下步骤：

计算历史时序监测数据集合Xt中任意一个数据点x_t与其下一数据点x_t+1的数值差δx_f：

。其中，x_m为历史时序监测数据集合Xt的均值，N为历史时序监测数据集合Xt的长度。

计算数据点x_t与其上一数据点x_t-1的数值差δx_b：

。

判断δx_f和δx_b是否满足如下条件：

。

是则判定数据点x_t为单点数据突变。

进一步的，迭代自回归方法包括以下步骤：

对历史时序监测数据集合Xt从头开始遍历，确定历史时序监测数据集合Xt中的数据点x_t为缺失值。

计算数据点x_t：

。其中，c’为待拟合的常数项，ε_t为随机误差值，p是自回归模型的阶数，取值为2，φ_i为待拟合的自回归模型参数。

进一步的，预测模型的迭代训练包括以下步骤：

根据用户需求对不同污染因子设置对应的参数集。参数集的参数包括训练数据时段长度、迭代次数、终止条件、初始学习率、学习率衰减比率和随机失活率。

根据参数集的参数条件对预测模型进行调整，并将监测数据输入至预测模型进行训练，并以日志的形式输出迭代训练结果报告。训练结果报告内容包括参数集、目标函数优化曲线、最优模型性能指标。

进一步的，污染因子包括二氧化硫、氮氧化物、臭氧、PM10、PM2.5。其中，PM10为空气中空气动力学粒径小于等于10微米的所有颗粒物，PM2.5为空气中空气动力学粒径小于等于2.5微米的所有颗粒物。

进一步的，训练集空间卷积的具体步骤如下：

根据各监测站点的连接关系构建邻接矩阵

。其中，M为监测站点的总数量。

根据各监测站点的空间关系在邻接矩阵A的基础上构建自适应临界矩阵Ã_adp：

。

其中，

是在训练过程中的学习参数，c为隐藏空间的维度。

根据扩散图卷积和自适应邻接矩阵计算空间卷积层Z：

。

其中，P_f ^k是前向状态转移矩阵。P_b ^k是后向状态转移矩阵。W_k1是前向扩散权重矩阵。W_k2是后向扩散权重矩阵，X是空间卷积层的输入矩阵，K是扩散总步数，k是扩散步数层，W_k是第k步扩散的权重矩阵。

进一步的，各监测站点T时刻以后一个时间周期a的预测结果输出前，对重点超标值通过对损失函数进行加权处理，进而扩大重点超标值在预测结果的占比。其中，损失函数w_i：

。ŷ为模型预测结果，y为真实值，k₃为缩放系数。

进一步的，气象数据包括风向、温度、湿度、风速、气压、光照条件。

本发明还提供了一种基于时序门机制的空气质量预测系统，其采用前述的基于时序门机制的空气质量预测方法，其包括数据采集模块、数据处理模块和数据输出模块。

数据采集模块用于以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据。监测数据包括空气质量数据和气象数据。

数据处理模块用于将监测数据进行预处理，并将处理后的监测数据输入预先训练好的预测模型中。还用于将预测模型根据预设的参数集进行迭代训练，随即令迭代后预测模型与迭代前预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，并做出如下决策:（1）若迭代后预测模型的预测结果优于迭代前预测模型的预测结果，则将迭代后预测模型取代迭代前预测模型。（2）若迭代前预测模型的预测结果优于迭代后预测模型的预测结果，则保留迭代前预测模型。

数据输出模块用于输出各监测站点T时刻以后一个时间周期a的预测结果。

与现有技术相比，本发明的有益效果包括：

1、本发明采用了时序门机制的图神经网络模型，相比于基于注意力机制模型架构，门机制具有更高的计算效率和对于训练数据和训练超参数具有更好的鲁棒性，且在预先设置的参数集以及训练结果报告的配合下，使得预测模型可以实现自动化迭代训练而无需进行精细的人工调参，降低了预测模型迭代和系统维护的成本。

2、本发明通过前后比较法识别检测训练数据中的单点突变值，考虑了数据本身的时序关系，相比于传统的基于阈值的异常检测方法降低了对正常合理的稀少的中重度污染样本的检测假阳性率，提升了数据预处理质量。

3、本发明通过采用2阶自相关拟合实现缺失数据的填补，考虑了空气质量数据的连续变化性，相比于平均值填充等传统方案，更好的还原了空气质量数据的时序变化趋势，提升了数据预处理质量。

4、本发明通过对损失函数进行加权处理，提升了预测模型对稀少的中重度污染天气的预测能力，减少长尾效应造成的对中重度污染天气预测预报能力不足的情况，满足不同用户在不同应用场景对预测结果的需求。

附图说明

参照附图来说明本发明的公开内容。应当了解，附图仅仅用于说明目的，而并非意在对本发明的保护范围构成限制。其中：

图1为本发明实施例1的一种基于时序门机制的空气质量预测方法的流程图；

图2为基于图1的时间卷积的原理示意图；

图3为基于图1的图神经网络Graph WaveNet架构预测模型的示意图；

图4为基于图1的基于时序门机制的空气质量预测方法的逻辑框图。

具体实施方式

容易理解，根据本发明的技术方案，在不变更本发明实质精神下，本领域的一般技术人员可以提出可相互替换的多种结构方式以及实现方式。因此，以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明，而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。

实施例1

本实施例介绍了一种基于时序门机制的空气质量预测方法，包括以下步骤：

步骤1.以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据；监测数据包括空气质量数据和气象数据。

时间周期a优选24个小时。空气质量数据包括不同的污染因子对环境的影响，污染因子主要包括5种，即二氧化硫、氮氧化物、臭氧、PM10、PM2.5；其中，PM10为空气中空气动力学粒径小于等于10微米的所有颗粒物，PM2.5为空气中空气动力学粒径小于等于2.5微米的所有颗粒物。根据实际需求可以将其它影响空气质量的污染因子也一并考虑。气象数据主要包括风向、温度、湿度、光照条件

步骤2.将监测数据进行预处理，并将处理后的监测数据输入预先训练好的预测模型中，进而输出各监测站点T时刻以后一个时间周期a的预测结果。

由于预测模型需要预先训练，因此需要用历史监测数据进行模型训练。为保障训练出的预测模型的准确性，优先采用过去两年内的监测数据，监测数据中还要包含预测区域内空气监测站点（站点ID，经纬度）及训练数据时段（起始及终止日期年月日时）。对于训练用历史监测数据一般分辨率为逐小时。不管是历史监测数据，还是过去一个时间周期a内的监测数据，预处理的方式相同。

首先，对监测数据的预处理进行详细说明。

由于数据传输、传感器故障等多方面原因，存在显著的数据异常与数据缺失问题，需要在模型训练前进行适当的预处理。数据异常主要表现在单点数据值突变，数据缺失主要表现在监测数据中的缺失值连续缺失。

对于单点数据值突变的处理，考虑到预测模型重点关注数据中的大值，若使用传统数据清洗办法容易将大量正常超标数据删除，对模型预测结果影响极大，因此本实施例采用了前后差值比较的方法。对于每个站点的每个污染物，存在时序数据集合Xt={x₁,x₂,...,x_N}。x_t是t时刻该站点该污染物的浓度监测结果。首先计算均值x_m。对于任意一个数据点x_t，计算其与前后数值的差异：

当满足以下条件：

则判断x_t为单点数据突变，用x_m代替x_t。其中，N是时序数据集合Xt的长度；δx_f是x_t与下一时刻x_t+1监测结果的差；δx_b是x_t与上一时刻x_t-1监测结果的差。

对于缺失值的补充，监测数据中的缺失值普遍为连续缺失，传统的固定值替换（如采用平均值替换）方案难以复原数据连续变化趋势（如臭氧的日变化趋势）。考虑到空气质量监测数据的自相关性，本实施例为了更好地拟合空气质量数据与时间的关系，采用自回归模型对于缺失值进行预测填补，对于Xt={x₁,x₂,...,x_N}，从x₁开始遍历，遇到缺失值x_t则利用：

进行拟合以预测x_t的数值，其中： c’是待拟合的常数项；ε_t被假设为平均数等于0，标准差等于σ的随机误差值；σ被假设为对于任何的t都不变。p是自回归模型的阶数，取值为2，φ_i为待拟合的自回归模型参数。拟合数据集为{x₁，x₂，...，x_t-1}，拟合以最小化ε_t的平方和为目标函数，当t小于10时，数据不足以拟合二阶自回归模型，以数据集平均值代替x_t。

待监测数据预处理后，将处理后的历史监测数据归集成训练集，并进行模型训练。采用时空卷积神经网络Graph WaveNet作为模型基本网络，并结合实际应用需求进行优化改进。该模型在空间方向采用图卷积神经网络GCN来捕捉空间特征，时间方向采用有门的时间卷积Gated TCN来捕捉时间特征。

现有研究中，空气质量预测模型在时间方向可以采用RNN、Transformer、一维卷积等多种方法，其中一维卷积在实际使用时有着较高的效率。本发明采用膨胀因果卷积作为时间卷积层TCN。膨胀因果卷积是一种特殊的一维卷积，卷积算子对输入时间序列的处理如图2所示。由图2可以看出，以卷积核为4举例，在进行膨胀卷积时，第一层的八个数据通过卷积成四个，第二层由四个卷积成两个，第三层由两个卷积成一个。堆叠膨胀因子指数增加的卷积层，感受野随层数的增加而指数增加，从而能够捕捉长时记忆，具体公式如下：

其中，x表示膨胀因果卷积层的输入序列，f为膨胀因果卷积算子，K是卷积核大小，在本实施例中取值为4，d是膨胀因子，本发明中逐层取值分别为1，2，4，f(s)为待训练的卷积权重参数，s为计算过程中的累加变量，s=[0,1，...，K-1]。

随后，采用门机制捕捉长短时记忆，时间节点特征h的计算公式为：

其中，x₀即xⁱ为输入信号，是经过因果膨胀卷积后多个维度重新拼接后的矩阵，x₀=[x¹,x²，...]，g、σ’为激活函数，θ₁和b分别对应激活函数g内输入信号的权重和偏移量，θ₂和c₀分别对应激活函数σ’内输入信号的权重和偏移量。⊙表示元素点乘。g是一个激活函数，此处选用tanh函数，σ’是一个sigmoid函数，决定激活后的通过量。此处的Sigmoid函数常被用作神经网络的激活函数，将变量映射到[0,1]之间。

对于空间卷积，把空气质量预测的实际问题抽象成一个数学问题描述为，已知图G=(V,E)，其中V为节点集合，E为边的集合，图G相当于预测区域。图G节点（即各监测站点）之间的连接关系构成邻接矩阵A=R^M*M。M是监测站点的数量；R表示实数。在每个时间步t，图上所有节点的特征构成矩阵X^(t)=R^M*D。D是每个时刻监测站点与污染物浓度有关的特征数量，特征包括污染物浓度、温度、湿度、风向、风速、气压、季节编码等。

为了提取节点特征和空间结构信息，图卷积神经网络是必要的操作。GraphWaveNet中采用的是扩散图卷积，具体形式如下

其中，P^k是扩散过程的状态转移矩阵。K是扩散总步数，取值可以为2；k表示第k步扩散；X是卷积层的输入矩阵，对于模型的输入层X，X即为节点特征矩阵X^(t)=R^M*D。但是空间卷积需要在时间卷积的基础上进行，因此加入时间节点特征h，即X=h。W_k是第k步扩散的权重矩阵，W_k是卷积层待训练的参数。在有向图中，扩散过程有两个方向，所以有两个状态转移矩阵

，则相应的扩散图卷积公式为：

P_f ^k是前向状态转移矩阵；P_b ^k是后向状态转移矩阵；W_k1是前向扩散权重矩阵；W_k2是后向扩散权重矩阵；Z为该扩散图卷积层的输出，也是下一层的输入。在实际计算中，邻接矩阵A不一定能够很好的反映节点之间的空间拓扑关系，为了弥补这个问题，可以在静态临界矩阵的基础上，采取动态的自适应临界矩阵，从而更好的建模节点之间的空间关系。GraphWaveNet中自适应临界矩阵的形式为：

其中

是在训练过程中需要学习的参数，用于将M个图节点（即为监测站点）嵌入到隐藏空间种，c为隐藏空间的维度。通过结合扩散图卷积和自适应邻接矩阵，我们得到最终的空间卷积层公式为：

最终Graph WaveNet的网络架构如图3所示，信号输入后先经过TCN（时间卷积），再经过GCN（空间卷积），作为一个时空卷积层，通过多层堆叠，可以得到不同时间水平上的空间特征。训练的目标函数是未来T个时刻污染物浓度的平均绝对误差。

下面结合图3详细介绍本实施例的模型训练。首先数据输入，在模型训练过程中，数据输入不仅包括历史监测数据，也包括空气监测站点（站点ID，经纬度）及训练数据时段（起始及终止日期年月日时）。训练用监测数据一般分辨率为逐小时。输入数据先进行线性变化，随后分别通过不同的激活函数进行特征提取，使得特征提取更为精准，本实施例选用的激活函数分别为tanh函数和

（sigmoid）函数，经过门时序卷积后，在进行GCN（空间卷积），卷积结果输出的同时还作为下一层的输入，重复上述操作，直至K层卷积结束。K层卷积结束后,将多层卷积层通过ReLU激活函数以及线性变化，得到训练好的预测模型，预测模型的输出即为预测结果。

因此将多个空间卷积层进行权连接合并，构建出所需的预测模型。也就是说，当第一层空间卷积结束后，该层的输出作为下层的输入继续卷积，同时该层的输出还与其它层的输出进行权连接，直至所有空间卷积层的权连接在一起，构建成预测模型。通过过去一个时间周期a内的监测数据输入，即得到各监测站点T时刻以后一个时间周期a的预测结果。

基于此，本实施例在实际使用时，更改模型输入输出序列长度：通过将卷积核大小从2改为4，使模型预测时间长度由12小时扩展到24小时。增加气象数据作为辅助特征输入到模型中，进一步提高对污染物因子浓度的预测准确率。原始Graph WaveNet模型只输入一种变量，得到该变量未来一段时间的预测值，即为单输入单输出模型。这种模型基本可以满足空气质量预测的需要，为考虑气象因素如风向、温度、湿度以及其他污染物对目标污染物浓度的影响，本实施例扩展了基础模型的结构，搭建了多输入单输出模型。

但是空气质量监测数据存在显著的长尾效应，即中重度污染天气在环境监测数据集中占比较少，大量样本集中于污染物浓度较小的优良天气。大部分数据为小值（正常空气质量），实际预测中最为关注的大值（异常空气质量）在所有数据中占比仅为3%左右，部分污染物异常数据占比小于千分之一。已有技术方案虽然能够较好地拟合数据整体变化情况，但对重点关注的超标值预测能力不足。因此，本发明修改了模型训练的损失函数，对于损失函数进行加权处理，增大超标值对模型结果的影响，得到较好的预测结果。

其中：ŷ为模型预测结果，y为真实值，k₃为缩放系数。

因此，以时间周期a为24小时为例，首先获取T-24至T-1时刻全部参与训练的监测站点历史空气质量及气象监测数据，参照上述预处理的方式进行数据预处理，输入对应空气质量预测模型中进行推理，获取全部站点对未来24小时的预测结果。

步骤3.将预测模型根据预设的参数集进行迭代训练，随即令迭代后预测模型与迭代前预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，并做出如下决策：

（1）若迭代后预测模型的预测结果优于迭代前预测模型的预测结果，则将迭代后预测模型取代迭代前预测模型；

循环迭代训练对于维持预测预报系统的准确性具有重要意义，其本质是通过不断吸纳新的监测历史数据，保持训练数据集与验证集，实际应用样本保持同一分布。循环迭代训练依靠后台系统计划任务自动执行，并以日志的形式通过前端进行报告，以使得运维人员可以方便的查看更新结果。此外，时间周期b的取值根据实际情况决定，但是为保证预测的准确性，时间周期b的周期长至少大于7天，这样减少偶然性事件对预测结果的影响。

对于迭代训练的具体步骤为：

第一步：设定参数集。预测模型迭代训练参照用户设定的参数集，该参数集可通过运维管理系统的前端进行设定和管理。参数集规定了模型的重要参数，包括训练数据时段长度（如2年）、训练集、测试集与验证集划分比例、训练硬件设定、邻接矩阵类型、是否纳入图卷积层、是否纳入自适应邻接矩阵、隐藏层数量、批大小、学习率、dropout率、学习率衰减比率、随机失活率、迭代次数、终止条件等。这些参数可以根据实际情况进行调整，进而确定迭代训练的参数条件。

第二步：执行迭代训练。根据设置的参数集，将预测模型进行迭代训练。若有M个参数集，且循坏迭代训练步骤主要针对5种主要污染因子（二氧化硫、氮氧化物、臭氧、PM10、PM2.5），则训练5M个模型。

第三步：输出结果。预测模型训练结果报告包括采用参数集、训练时长，训练迭代次数、目标函数优化曲线、最优模型性能指标等。预测模型训练结束后，将与迭代前模型同步开展空气质量预测预报，如迭代模型优于迭代前模型，则可以通过系统手动确认用迭代后模型取代迭代前模型。

基于此，请参阅图4，若是模型直接训练后在预测，本实施例方法的工作流程也可以分为四部分。

1.收集预测区域监测站点空气质量及气象历史数据，进行数据清洗以提高数据质量。

2. 基于图神经网络Graph WaveNet和加权损失函数训练预测模型。

3.针对用户需求对特定站点未来空气质量进行回归预测。

4.根据预先设置定期自主更新迭代模型。

因此，本实施例利用时间维度门机制优化了空气质量预测预报图神经网络，提升了其训练和预测的效率以及对输入数据和训练参数的鲁棒性，为自动化模型更新迭代奠定了基础。利用参数集设定、模型训练报告及预测准确性评估，实现了对模型迭代过程的控制，建立了一种可行有效的模型自动化迭代机制。通过对损失函数进行加权处理，提升了模型对稀少的中重度污染天气的预测能力。利用2阶自相关回归填补训练数据集中的连续缺失值，优化了数据预处理效果。利用前后比较法识别检测训练数据中的单点突变值，优化了数据预处理效果。

实施例2

本实施例介绍了一种基于时序门机制的空气质量预测系统，其应用于实施例1的一种基于时序门机制的空气质量预测方法，包括数据采集模块、数据处理模块、数据输出模块。

数据采集模块用于以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据；监测数据包括空气质量数据和气象数据；

数据处理模块用于将监测数据进行预处理，并将处理后的监测数据输入预先训练好的预测模型中；还用于将预测模型根据预设的参数集进行迭代训练，随即令迭代后预测模型与迭代前预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，并做出如下决策:（1）若迭代后预测模型的预测结果优于迭代前预测模型的预测结果，则将迭代后预测模型取代迭代前预测模型；（2）若迭代前预测模型的预测结果优于迭代后预测模型的预测结果，则保留迭代前预测模型；

数据输出模块还可与显示模块连接，能够显示预测结果，方便相关人员查看。也可以根据用户输入提取对应站点预测数据进行前端显示。

本实施例具有和实施例1相同的有益效果。

本发明的技术范围不仅仅局限于上述说明中的内容，本领域技术人员可以在不脱离本发明技术思想的前提下，对上述实施例进行多种变形和修改，而这些变形和修改均应当属于本发明的保护范围内。

Claims

1.一种基于时序门机制的空气质量预测方法，其特征在于，所述基于时序门机制的空气质量预测方法包括以下步骤：

S1.以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据；所述监测数据包括空气质量数据和气象数据；

S2.将所述监测数据进行预处理，并将处理后的监测数据输入预先训练好的预测模型中，进而输出各监测站点T时刻以后一个时间周期a的预测结果；

其中，所述预测模型的构建包括以下步骤：

S21.将预测区域各监测站点的历史监测数据进行预处理，并将预处理后的历史监测数据归集成训练集；

S22.将所述训练集进行膨胀因果卷积，并将卷积结果

；其中，g、σ’为激活函数，θ₁和b分别对应激活函数g内输入信号的权重和偏移量，θ₂和c₀分别对应激活函数σ’内输入信号的权重和偏移量；

S23.通过时间节点特征h对所述训练集进行空间卷积，得到多个空间卷积层，将多个空间卷积层进行权连接合并，构建出所述预测模型；

S3.将所述预测模型根据预设的参数集进行迭代训练，随即令迭代后预测模型与迭代前预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，并做出如下决策：

2.根据权利要求1所述的基于时序门机制的空气质量预测方法，其特征在于，所述监测数据预处理的方法包括以下步骤：

对监测数据进行归集，得到各监测站点每个污染因子的历史时序监测数据集合Xt={x₁,x₂,...,x_N}；

对历史时序监测数据集合Xt进行单点数据值突变检测，并通过平均值替换法对单点数据突变的数据值进行替换；

对替换后的历史时序监测数据集合Xt进行关联检测，并通过迭代自回归方法对连续缺失数据进行补充；

3.根据权利要求2所述的基于时序门机制的空气质量预测方法，其特征在于，单点数据值突变检测方法包括以下步骤：

；其中，x_m为历史时序监测数据集合Xt的均值，N为历史时序监测数据集合Xt的长度；

计算数据点x_t与其上一数据点x_t-1的数值差δx_b：

；

判断δx_f和δx_b是否满足如下条件：

；

是则判定数据点x_t为单点数据突变。

4.根据权利要求2所述的基于时序门机制的空气质量预测方法，其特征在于，迭代自回归方法包括以下步骤：

对历史时序监测数据集合Xt从头开始遍历，确定历史时序监测数据集合Xt中的数据点Xt为缺失值；

计算数据点x_t：

；其中，c’为待拟合的常数项，ε_t为随机误差值，p是自回归模型的阶数，取值为2，φ_i为待拟合的自回归模型参数。

5.根据权利要求1所述的基于时序门机制的空气质量预测方法，其特征在于，所述预测模型的迭代训练包括以下步骤：

根据用户需求对不同污染因子设置对应的参数集；所述参数集的参数包括训练数据时段长度、迭代次数、终止条件、初始学习率、学习率衰减比率和随机失活率；

根据所述参数集的参数条件对所述预测模型进行调整，并将所述监测数据输入至所述预测模型进行训练，随即以日志的形式输出迭代训练结果报告；所述训练结果报告内容包括所述参数集、目标函数优化曲线、最优模型性能指标。

6.根据权利要求5所述的基于时序门机制的空气质量预测方法，其特征在于，所述污染因子包括二氧化硫、氮氧化物、臭氧、PM10、PM2.5；其中，PM10为空气中空气动力学粒径小于等于10微米的所有颗粒物，PM2.5为空气中空气动力学粒径小于等于2.5微米的所有颗粒物。

7.根据权利要求1所述的基于时序门机制的空气质量预测方法，其特征在于，所述训练集空间卷积的具体步骤如下：

根据各监测站点的连接关系构建邻接矩阵

；其中，M为监测站点的总数量；

；

其中，

是在训练过程中的学习参数，c为隐藏空间的维度；

根据扩散图卷积和自适应邻接矩阵计算空间卷积层Z：

；

其中，P_f ^k是前向状态转移矩阵；P_b ^k是后向状态转移矩阵；W_k1是前向扩散权重矩阵；W_k2是后向扩散权重矩阵，X是空间卷积层的输入矩阵，K是扩散总步数，k是扩散步数层，W_k是第k步扩散的权重矩阵。

8.根据权利要求1所述的基于时序门机制的空气质量预测方法，其特征在于，各监测站点T时刻以后一个时间周期a的预测结果输出前，对重点超标值通过对损失函数进行加权处理，进而扩大重点超标值在预测结果的占比；其中，损失函数w_i：

；ŷ为模型预测结果，y为真实值，k₃为缩放系数。

9.根据权利要求1所述的基于时序门机制的空气质量预测方法，其特征在于，所述气象数据包括风向、温度、湿度、风速、气压、光照条件。

10.一种基于时序门机制的空气质量预测系统，其特征在于，其采用如权利要求1-9中任意一项所述的基于时序门机制的空气质量预测方法，其包括：

数据采集模块，其用于以T时刻为预测起点，采集T时刻之前一个预设的时间周期a内的预测区域各监测站点的监测数据；所述监测数据包括空气质量数据和气象数据；

数据处理模块，其用于将所述监测数据进行预处理，并将处理后的监测数据输入预先训练好的预测模型中；还用于将所述预测模型根据预设的参数集进行迭代训练，随即令迭代后预测模型与迭代前预测模型进行同步预测，并将二者在一个预设的时间周期b内的预测结果与实际数据进行对比验证，并做出如下决策:（1）若迭代后预测模型的预测结果优于迭代前预测模型的预测结果，则将迭代后预测模型取代迭代前预测模型；（2）若迭代前预测模型的预测结果优于迭代后预测模型的预测结果，则保留迭代前预测模型；

数据输出模块，其用于输出各监测站点T时刻以后一个时间周期a的预测结果。