CN113188968A

CN113188968A - 基于组合深度学习模型的空气污染物浓度预测方法及系统

Info

Publication number: CN113188968A
Application number: CN202110489654.5A
Authority: CN
Inventors: 陈曦; 何世柱
Original assignee: Changsha University of Science and Technology
Current assignee: Changsha University of Science and Technology
Priority date: 2021-05-06
Filing date: 2021-05-06
Publication date: 2021-07-30

Abstract

本申请涉及一种基于组合深度学习模型的空气污染物浓度预测方法及系统。所述方法获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列；并利用该时间序列对构建的组合深度学习网络进行训练，并采用贝叶斯优化方式进行超参数，得到训练好的空气污染物浓度预测模型；获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理，将预处理结果输入空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。本发明提出的组合深度学习模型可以高效提取不同时间段的空气污染物的时间相关性，并有效提取地区内的不同空气监测站之间的空气污染物浓度的空间相关性，使得预测效果得到提升。

Description

基于组合深度学习模型的空气污染物浓度预测方法及系统

技术领域

本申请涉及空气质量监控技术领域，特别涉及一种基于组合深度学习模型的空气污染物浓度预测方法及系统。

背景技术

工业化和技术的飞速发展的同时，伴随着能源的大量消耗，环境被严重破坏，从而引发了一系列环境问题，例如全球变暖、废物处置、空气污染、酸雨、水污染等。世界范围内先后出现过煤烟型污染、光化学烟雾等空气污染问题，据估计空气污染每年导致全球700万人死亡，2018年世界卫生组织报告指出全球多个国家和地区仍然有严重的空气污染问题，90％的人类在污染的空气环境中生活，空气污染已经成为全世界高度关注的环境问题。

空气质量一直是国内外学者的研究热点，为了预测空气中各种污染物的浓度，现有多种建模方法。包括确定性方法、统计方法、机器学习、神经网络。确定性方法也称为化学迁移模型，专注于大气物理和化学反应对空气污染物的排放、扩散过程建模。Byun等采用多尺度空气质量模型(CMAQ)模拟空气中的污染物传输过程建模。Wang Z等用嵌套空气质量预测建模系统(NAQPMS)研究在城市范围内各种规模的大气运动中化学物质和人为气溶胶的各种过程。

现有的长短期记忆网络(Long Short-Term Memory简称：LSTM)或者线性回归预测方法只考虑单个站点pm2.5数据，从而预测时会产生一定的误差。

发明内容

基于此，有必要针对上述技术问题，提供一种能够利用多个空气质量站检测的空气污染物PM2.5浓度数据之间的时间和空间的相关性，降低预测误差的基于组合深度学习模型的空气污染物浓度预测方法及系统。

一种基于组合深度学习模型的空气污染物浓度预测方法，所述方法包括：

获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列。

构建组合深度学习网络；所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络，所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同；所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding；所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联，提取空气污染物PM2.5浓度之间的时间相关性特征；所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征，在图结构上实现卷积操作，提取地区内的不同空气监测站之间的空间相关性特征；所述输出网络用于输出预测结果。

根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列。

将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。

在其中一个实施例中，获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列，包括：

获取多个空气质量站的空气污染物PM2.5浓度。

对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值，得到每个空气质量站的空气污染物PM2.5的时间序列。

在其中一个实施例中，根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型，包括：

将所述空气污染物PM2.5的时间序列分为训练样本和测试样本。

将所述训练样本输入到所述时间embedding提取模块中，得到所述空气污染物PM2.5的时间序列的时间embedding。

将所述时间embedding输入到所述长短期记忆神经网络中，得到空气污染物PM2.5浓度之间的时间相关性特征。

经所述时间相关性特征输入到所述图卷积神经网络中，得到地区内的不同空气监测站之间的空间相关性特征。

将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值，得到预估的空气污染物浓度预测模型。

利用测试样本对预估的空气污染物浓度预测模型进行测试，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

在其中一个实施例中，所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。

一种基于组合深度学习模型的空气污染物浓度预测系统，所述系统包括：

数据获取和预处理模块，用于获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列。

模型构建模块，用于构建组合深度学习网络；所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络，所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同；所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding；所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联，提取空气污染物PM2.5浓度之间的时间相关性特征；所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征，在图结构上实现卷积操作，提取地区内的不同空气监测站之间的空间相关性特征；所述输出网络用于输出预测结果。

模型训练模块，用于根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

目标站空气污染物PM2.5浓度预测值确定模块：获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列；将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。

在其中一个实施例中，数据获取和预处理模块，还用于获取多个空气质量站的空气污染物PM2.5浓度；对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值，得到每个空气质量站的空气污染物PM2.5的时间序列。

在其中一个实施例中，模型训练模块，还用于将所述空气污染物PM2.5的时间序列分为训练样本和测试样本；将所述训练样本输入到所述时间embedding提取模块中，得到所述空气污染物PM2.5的时间序列的时间embedding；将所述时间embedding输入到所述长短期记忆神经网络中，得到空气污染物PM2.5浓度之间的时间相关性特征；经所述时间相关性特征输入到所述图卷积神经网络中，得到地区内的不同空气监测站之间的空间相关性特征；将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值，迭代训练结束后，得到预估的空气污染物浓度预测模型；利用测试样本对预估的空气污染物浓度预测模型进行测试，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

上述基于组合深度学习模型的空气污染物浓度预测方法及系统，所述方法获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列；构建组合深度学习网络；所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络；根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型；获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列；将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。本发明提出的组合深度学习模型可以高效提取不同时间段的空气污染物的时间相关性，并有效提取地区内的不同空气监测站之间的空气污染物浓度的空间相关性，使得预测效果得到提升。

附图说明

图1为一个实施例中基于组合深度学习模型的空气污染物浓度预测方法的流程示意图；

图2为一个实施例中基于组合深度学习模型的空气污染物浓度预测系统的结构框图；

图3为一个实施例中组合深度学习网络模型的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，提供了一种基于组合深度学习模型的空气污染物浓度预测方法，该方法包括以下步骤：

步骤100：获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列。

空气污染物PM2.5浓度是多个空气质量站在2018年1月1日到2019年1月1日共365天，每天24小时内各个小时的PM2.5数据作为数据集。

预处理是对数据集中在时间轴上缺失的数据进行补全的操作。

步骤102：构建组合深度学习网络。

组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络，时间embedding提取模块和长短期记忆神经网络的数量与空气质量站的数量相同。

时间embedding提取模块用于提取空气污染物PM2.5的时间序列的时间embedding。

长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联，提取空气污染物PM2.5浓度之间的时间相关性特征。

图卷积神经网络用于接收多个长短期记忆神经网络输出的时间相关性特征，在图结构上实现卷积操作，提取地区内的不同空气监测站之间的空间相关性特征；输出网络用于输出预测结果。

在时间embedding提取模块中将数据进行归一化后，通过Time2Vec(Learning aVector Representation of Time，学习时间的向量表示)模块生成时间向量，捕获其原始时间序列中的周期性行为和非周期性行为，以便于提取出原始时间序列中时间相关性。

采用长短期记忆神经网络可以高效提取不同时间段的空气污染物的时间相关性。

步骤104：根据空气污染物PM2.5的时间序列对组合深度学习网络进行训练，并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

按照时间先后顺序将空气污染物PM2.5的时间序列中前80％数据作为训练集，后20％数据作为验证集，用训练集对组合深度学习网络进行训练，用验证集对训练的组合深度学习网络进行验证，并采用采用贝叶斯优化方式进行网络超参数进行调整，直到满足预定条件为止，得到训练好的空气污染物浓度预测模型。

贝叶斯优化是对长短期记忆神经网络(LSTM)中的隐藏层神经元个数、LSTM的层数以及和图卷积神经网络(Graph Convolutional Network，简称：GCN)中的层数进行优化调整。

步骤106：获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列。

步骤108：将待测空气污染物PM2.5的时间序列输入到空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。

该模型是用多个空气质量站过去8个小时PM2.5浓度来预测未来1小时的PM2.5浓度。

上述基于组合深度学习模型的空气污染物浓度预测方法中，通过获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列；构建组合深度学习网络；所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络；根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型；获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列；将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。本发明提出的组合深度学习模型可以高效提取不同时间段的空气污染物的时间相关性，并有效提取地区内的不同空气监测站之间的空气污染物浓度的空间相关性，使得预测效果得到提升。

在其中一个实施例中，步骤100还包括：获取多个空气质量站的空气污染物PM2.5浓度；对每个空气质量站的空气污染物PM2.5浓度采用插值法补全空缺值，得到每个空气质量站的空气污染物PM2.5的时间序列。

在其中一个实施例中，步骤104还包括：将空气污染物PM2.5的时间序列分为训练样本和测试样本；将训练样本输入到时间embedding提取模块中，得到空气污染物PM2.5的时间序列的时间embedding；将时间embedding输入到长短期记忆神经网络中，得到空气污染物PM2.5浓度之间的时间相关性特征；经时间相关性特征输入到图卷积神经网络中，得到地区内的不同空气监测站之间的空间相关性特征；将空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值，迭代训练结束后，得到预估的空气污染物浓度预测模型；利用测试样本对预估的空气污染物浓度预测模型进行测试，并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

在其中一个实施例中，时间embedding提取模块中采用Time2Vec方式进行空气污染物PM2.5的时间序列的时间embedding提取。

应该理解的是，虽然图1的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图2所示，提供了一种基于组合深度学习模型的空气污染物浓度预测系统，系统包括数据获取和预处理模块、模型构建模块、模型训练模块以及目标站空气污染物PM2.5浓度预测值确定模块，其中：

模型构建模块，用于构建组合深度学习网络；组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络，时间embedding提取模块和长短期记忆神经网络的数量与空气质量站的数量相同；时间embedding提取模块用于提取空气污染物PM2.5的时间序列的时间embedding；长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联，提取空气污染物PM2.5浓度之间的时间相关性特征；图卷积神经网络用于接收多个长短期记忆神经网络输出的时间相关性特征，在图结构上实现卷积操作，提取地区内的不同空气监测站之间的空间相关性特征；输出网络用于输出预测结果。

模型训练模块，用于根据空气污染物PM2.5的时间序列对组合深度学习网络进行训练，并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

目标站空气污染物PM2.5浓度预测值确定模块：获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列；将待测空气污染物PM2.5的时间序列输入到空气污染物浓度预测模型中，得到目标站空气污染物PM2.5浓度预测值。

在其中一个实施例中，数据获取和预处理模块，还用于获取多个空气质量站的空气污染物PM2.5浓度；对每个空气质量站的空气污染物PM2.5浓度采用插值法补全空缺值，得到每个空气质量站的空气污染物PM2.5的时间序列。

在其中一个实施例中，模型训练模块，还用于将空气污染物PM2.5的时间序列分为训练样本和测试样本；将训练样本输入到时间embedding提取模块中，得到空气污染物PM2.5的时间序列的时间embedding；将时间embedding输入到长短期记忆神经网络中，得到空气污染物PM2.5浓度之间的时间相关性特征；经时间相关性特征输入到图卷积神经网络中，得到地区内的不同空气监测站之间的空间相关性特征；将空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值，迭代训练结束后，得到预估的空气污染物浓度预测模型；利用测试样本对预估的空气污染物浓度预测模型进行测试，并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

关于基于组合深度学习模型的空气污染物浓度预测系统的具体限定可以参见上文中对于基于组合深度学习模型的空气污染物浓度预测方法的限定，在此不再赘述。上述基于组合深度学习模型的空气污染物浓度预测系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，组合深度学习网络模型的结构如图3所示，组合深度学习网络深度学习模型的空气污染物浓度预测方法包括如下步骤：

步骤一：通过北京市环境保护检测中心网站采集北京市实时空气质量数据，取出其中2018年1月1日到2019年1月1日共365天，每天24小时内各个小时的PM2.5数据作为数据集，对其中有缺失的数据采用线性插值补全空缺值，前80％数据作为训练集，后20％数据作为验证集，用过去8个小时PM2.5浓度来预测未来1小时的PM2.5浓度。

步骤二：将数据进行归一化后，通过Time2Vec模块生成时间向量，捕获其原始时间序列中的周期性行为和非周期性行为，以便于更好地提取出原始时间序列中时间相关性。

步骤三：将时间向量输入到长短期记忆网络-图卷积神经网络(简称：LSTM-GCN模型)中，LSTM部分提取各时间段之间的时间相关性，GCN部分提取多站点之间的空间相关性，最后通过完全连接层预测输出，进行反归一化后得到结果。

步骤四：通过贝叶斯优化，对LSTM-GCN模型中的LSTM的批大小、时期、隐藏层神经元个数、LSTM的层数以及GCN的层数进行优化调整，来获得更好的预测效果；其中：批大小是指每个批中训练样本的数量；时期是指代所有的数据送入网络中完成一次前向计算及反向传播的过程。

采集了北京市三个空气质量监测站：东四、东四坛、天坛，其中2018年1月1日到2019年1月1日共365天，每天24小时内各个小时的PM2.5数据，应用HA、SVR、LR、ARIMA、LSTM、TCN、CNN以及Time2Vec-LSTM等模型用过去8个小时PM2.5浓度来预测未来1小时的PM2.5浓度。不同模型预测效果分析结果如表1所示。

表1不同模型预测效果分析

	均方根误差	平均绝对误差	决定系数
				HA	27.20	16.91	0.81
SVR	27.37	12.84	0.80
				LR	68.82	49.91	0.24
ARIMA	66.90	44.00	0.17
				LSTM	11.55	7.02	0.97
TCN	12.98	8.12	0.96
				CNN	11.95	7.47	0.96
Time2Vec-LSTM	11.39	6.86	0.97

从表1中的数据可以看出，ARIMA(整合移动平均自回归模型)是典型的统计方法，不能处理复杂的时空数据，表现比较差。传统的机器学习方法由于误差累计效果也一般。深度学习模型表现比较好，其中通过Time2Vec提取时间embedding让LSTM学习预测的方法效果最佳，备注：Time2Vec-LSTM模型是发明中模型的前半部分模型。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于组合深度学习模型的空气污染物浓度预测方法，其特征在于，所述方法包括：

获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到多个空气质量站的空气污染物PM2.5的时间序列；

构建组合深度学习网络；所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络，所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同；所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding；所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联，提取空气污染物PM2.5浓度之间的时间相关性特征；所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征，在图结构上实现卷积操作，提取地区内的不同空气监测站之间的空间相关性特征；所述输出网络用于输出预测结果；

根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型；

获取多个空气质量站的待测空气污染物PM2.5浓度，并进行预处理得到待测空气污染物PM2.5的时间序列；

2.根据权利要求1所述的方法，其特征在于，获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列，包括：

获取多个空气质量站的空气污染物PM2.5浓度；

3.根据权利要求1所述的方法，其特征在于，根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型，包括：

将每个空气质量站的所述空气污染物PM2.5的时间系列作为1路输入，并将多个空气质量站的所述空气污染物PM2.5的时间序列分为训练样本和测试样本；

将所述训练样本一一对应输入到多个所述时间embedding提取模块中，得到多个空气监测站的所述空气污染物PM2.5的时间序列的时间embedding；

将多个所述时间embedding一一对应输入到多个所述长短期记忆神经网络中，得到多个空气监测站的空气污染物PM2.5浓度之间的时间相关性特征；

将多个所述时间相关性特征输入到所述图卷积神经网络中，得到地区内的不同空气监测站之间的空间相关性特征；

将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值，迭代训练结束后，得到预估的空气污染物浓度预测模型；

4.根据权利要求1-3任一项所述的方法，其特征在于，所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。

5.一种基于组合深度学习模型的空气污染物浓度预测系统，所述系统包括：

数据获取和预处理模块，用于获取多个空气质量站的空气污染物PM2.5浓度，并进行预处理得到空气污染物PM2.5的时间序列；

模型构建模块，用于构建组合深度学习网络；所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络，所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同；所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding；所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联，提取空气污染物PM2.5浓度之间的时间相关性特征；所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征，在图结构上实现卷积操作，提取地区内的不同空气监测站之间的空间相关性特征；所述输出网络用于输出预测结果；

模型训练模块，用于根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型；

6.根据权利要求5所述的系统，其特征在于，数据获取和预处理模块，还用于获取多个空气质量站的空气污染物PM2.5浓度；对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值，得到每个空气质量站的空气污染物PM2.5的时间序列。

7.根据权利要求5所述的系统，其特征在于，模型训练模块，还用于将所述空气污染物PM2.5的时间序列分为训练样本和测试样本；将所述训练样本输入到所述时间embedding提取模块中，得到所述空气污染物PM2.5的时间序列的时间embedding；将所述时间embedding输入到所述长短期记忆神经网络中，得到空气污染物PM2.5浓度之间的时间相关性特征；经所述时间相关性特征输入到所述图卷积神经网络中，得到地区内的不同空气监测站之间的空间相关性特征；将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值，迭代训练结束后，得到预估的空气污染物浓度预测模型；利用测试样本对预估的空气污染物浓度预测模型进行测试，并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整，得到训练好的空气污染物浓度预测模型。

8.根据权利要求5-7任一项所述的系统，其特征在于，所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。