CN117171546A

CN117171546A - 一种结合污染扩散指数的城市空气质量预测方法

Info

Publication number: CN117171546A
Application number: CN202311258843.7A
Authority: CN
Inventors: 胡俊涛; 张士诚; 方勇
Original assignee: Anhui Entropy Wo Intelligent Technology Co ltd
Current assignee: Anhui Entropy Wo Intelligent Technology Co ltd
Priority date: 2023-09-27
Filing date: 2023-09-27
Publication date: 2023-12-05

Abstract

本发明涉及一种结合污染扩散指数的城市空气质量预测方法，包括以下步骤：1)对城市范围内多个站点的空气污染物浓度和气象数据进行采集、预处理；2)城市区域网格划分及污染扩散指数的计算，构建区域相互影响模型，解释污染物跨区域传输机制；3)构建CNN‑LSTM混合网络模型进行特征提取和融合，建立污染扩散指数、气象数据与PM2.5浓度值的映射关系；4)城市污染物浓度预测预测模型并进行训练参数调优后，获取区域PM2.5浓度预测结果。与现有技术相比，本发明引入污染扩散指数作为预测模型的新特征，充分考虑了不同气象条件对污染物扩散传输的影响，揭示大气污染物跨区域传播机制，有效提高空气污染物预测模型的精度。

Description

一种结合污染扩散指数的城市空气质量预测方法

技术领域

本发明涉及城市污染和空气质量预测技术领域，具体为一种结合污染扩散指数的城市空气质量预测方法。

背景技术

最近几十年来，随着城市化进程的加速和工业化程度的提高，城市空气污染已经成为一个严重的全球性问题。城市化和工业化进程导致大量的污染物排放，例如：汽车尾气、工业排放、建筑施工和燃料燃烧等，城市空气污染的问题还受到气候条件的影响。例如，在气温升高、风速减弱的夏季，空气中的污染物更容易积聚和滞留，从而导致污染物的浓度增加。城市空气污染的影响因素非常复杂，需要综合考虑各种因素的影响，需要通过不断的科学研究和数据分析，预测城市空气质量的变化趋势，制定出针对性的空气污染控制和治理措施。

现有的应用在城市空气污染预测的算法模型虽能够取得一定的预测效果，但仍然存在一些缺点和挑战，例如：模型复杂度高，计算量大，增加了模型训练和调整的难度，也会限制模型在实际应用中的效率和可靠性。预测误差较大，预测精度受到天气、交通流量、污染物排放源等多种因素的干扰，难以实现预测水平的提升，提取数据内部关联特征能力单一，因此限制了预测模型在不同城市间的通用性和迁移性。

发明内容

有鉴于此，本发明的目的在于提供一种结合污染扩散指数的城市空气质量预测方法，全面考虑城市区域内污染物扩散情况对空气质量的影响，有效提高城市空气质量预测的准确率和可靠性。

为达到上述目的，本发明提供如下技术方案：

一种结合污染扩散指数的城市空气质量预测方法,包括以下步骤：

S1:对城市区域内空气质量监测站和气象站的历史数据进行采集和分析，并进行数据预处理，建立时序关系的城市污染物浓度序列。

S2:城市区域网格化，依据气象数据和污染扩散模型计算各区域污染扩散指数，构建区域相互影响模型，全面评估污染物区域扩散的状况。

S3:构建基于CNN-LSTM的空气污染物特征提取网络，并通过神经网络将各污染物时序特征、气象辅助特征和区域污染扩散指数进行融合，确定模型输入结构。

S4:构建城市空气质量预测模型并进行训练参数调优后，以空气污染物浓度、气象数据和污染扩散指数作为训练好的预测模型输入，获取城市污染物浓度预测结果。

进一步，所述步骤S1具体包括以下步骤：

对采集的原始数据进行预处理，包括缺失值填充和异常值剔除，在数据清洗过程中，提高数据的质量。

其中采用线性插值法对数据集中的缺失数据进行数值填充，补全数据集中的缺失值，计算公式为：

式中，x_i为缺失部分的值，x_j为x_i前面已知的值，x_k为x_i后面已知的值，i、j、k为大于或等于1的自然数。

计算各特征之间的皮尔逊相关系数，将与所要预测的特征不相关的其他特征剔除，减少数据冗余；

皮尔逊相关系数的计算公式为：

式中，COV(X，Y)是特征X和Y之间的协方差，σ_X、σ_Y分别为特征X和Y的标准差。

最后采用最大最小归一化处理，归一化指定区间为0到1,消除特征之间的量纲影响，以解决数据指标之间的可比性。

所述最大最小归一化公式为：

Y＝X*(mx-mi)+mi

式中,X为归一化后的中间值,x为原始值,x_min为原始数据的最小值,x_max为原始数据的最大值,Y为最终结果,mx为指定区间的最大值,mi为指定区间的最小值。

进一步，所述步骤S2具体包括以下步骤：

根据空气污染扩散气象条件指数的定义和计算方式，提出污染扩散指数，利用气象数据和污染扩散模型来计算选定区域的污染扩散指数，表征当前气象背景下整个区域内污染物传输的状况。

将城市区域划分为网格，解析污染物扩散的微观机制。根据城市内空气质量监测站和气象站的地理位置和监测半径来对城市区域进行网格划分，得到城市空气质量网格化的污染分布图，可以精细化反映出城市不同重点区域污染物变化态势。

按照各气象因子分指数最大值和最小值的比值从小到大进行排序，剔除其中相关系数未通过显著性检验的自相关因子，确定各气象因子阈值，根据各因子在不同阈值范围内对空气污染扩散条件形成作用的大小分配权重，通过计算该区域内气象因子的大小和综合贡献度来得出所选区域的污染扩散指数。

各气象因子的权重等级划分见表1：

气象因子的优先级，数值越大，优先级越高，对污染扩散的贡献值越高。

对所有落在阈值范围内的气象因子和污染物浓度数值权重求和，得到城市各区域污染扩散指数(Pollution diffusion index，PDI)，其计算公式为：

式中，w_i为各气象因子的权重，p_i为各气象因子的优先级，η_i为各气象因子的数值。

污染物扩散条件等级依据污染物扩散指数确定，分为三个等级，各等级划分和描述见表2：

将得到的污染物扩散条件等级值利用ONE-HOT编码量化为连续的特征分量。

依据上述城市区域的网格划分结果，得到整个城市网格的数量和区域范围，将各污染物时序特征、气象辅助特征和计算出的污染扩散指数匹配到每个区域网格中，生成城市污染物变化相关的历史序列。

构建区域相互影响模型(Regional Inter-Continental Transport model，简称RICT)定量描述一个区域对另一个区域污染物浓度的整体影响，包括水平和垂直方向的输送，并通过对流、扩散和化学反应等过程的数学描述，计算出城市区域污染物传输和扩散状况。

设定以上风向和下风向形成的直线方向和位置相邻为污染扩散传输路径，随着距离的增大扩散影响越弱，设置扩散范围阈值，超过这一阈值将不会传输污染物。区域内某个网格污染物扩散范围及对应的污染物浓度贡献系数：

ξ_k＝exp(ac_i*PDI_i)

式中，i表示选定污染物的类别，k的取值为{1,2,L,m}，m是指当前污染扩散指数下该网格污染传输范围的尺度，表示网格内的第i种污染物对第k个网格区域中同类型污染物的贡献系数。

RICT模型将城市看作一个区域，城市区域内的每个网格的污染物浓度由两部分组成：一部分是自身网格内污染源所产生浓度；另一部分是城市内其他区域网格所贡献的污染物浓度。

每个网格中的污染物浓度可以用以下公式来计算：

式中，C_mi(t)是选定区域第i种污染物浓度，P_mi(t)是网格区域中第i种污染物的原始区域浓度，P_mi,k(t)是污染传输的第k个作用网格。

利用某个网格的气象指数和污染扩散指数的相互组合计算出该网格对其他网格区域内污染物的贡献度，组成每个网格的扩散范围数值矩阵，最终计算出城市所有网格区域各项污染物对应的扩散指数等级。

进一步，所述步骤S3具体包括以下步骤：

基于CNN-LSTM混合网络提取空气污染物特征及气象因子，特征提取网络以CNN网络作为底层，以基于多层LSTM的网络作为顶层，CNN层用于提取序列中的局部特征，而LSTM层用于学习序列中的长期依赖关系。

将空气污染物浓度数据和气象数据转化为CNN网络可接收的具有时间序列的二维矩阵，并输入到CNN网络中提取空间特征，作为LSTM网络的输入；

其中CNN模型用于提取污染物和气象因子数据的逐小时时间特征。卷积层的卷积核进行特征提取操作，通过激活函数对卷积的结果进行非线性变换而得到输出的特征图。

卷积操作过程为：

式中，y_l为经过l层卷积操作后的输出，σ()激活函数，为是第l层第m部分卷积区域的输入，/>为第l层第m部分的权重，/>为卷积运算，/>为第l层的偏置项。

卷积之后，输出特征图作为池化层的输入，进行最大池化(Maxpoling)操作，池化过滤器按设定步幅进行移动扫描，选择最大值输出到下一层，最大池化操作过程为：

式中，为第l层第m个数组区域中第p个数的池化结果，pooling_k()为池化函数。

多维特征数据池化后进行Reshape操作，将矩阵转化为一维向量，作为LSTM层的输入，LSTM层提取城市空气污染物浓度和气象数据的时序特征，实现对历史污染物的浓度和气象数据的编码，生成隐藏向量C的表达式为：

y_t＝f_L(x_t，y_t-1)

C＝φ({h₁L h_T})

式中，x_t为t时刻的输入值，y_t-1、y_t分别为LSTM层在t-1和t时刻的输出，f_L表示LSTM层函数，φ为隐藏状态计算函数，隐藏向量C具体为LSTM层中的最后时刻单元的输出状态。

利用矩阵拼接将城市区域网格内的污染物浓度，气象因子和污染扩散指数等时序特征进行融合，作为模型的输入，确定预测模型输入矩阵的阶数。

进一步，所述步骤S4具体包括以下步骤：

城市污染物浓度预测模型训练参数调优及预测的具体步骤如下：

训练所构建的基于CNN-LSTM的空气污染物预测网络，并用训练好的模型预测未来空气污染物浓度值。采用解码器结合隐藏向量C和当前t时刻的输入数据预测下一时刻的污染物浓度，则有：

y_t,s_t＝f_L(y_t-1,s_t-1,C)

p_t＝Wh_t+b

其中，s_t-1、s_t分别表示LSTM层t-1和t时刻的记忆单元，p_t为t时刻污染物浓度的预测输出值，W表示网络参数，b表示偏置量。

初始化预测模型结构，确定网络卷积核数量、初始权重、时间窗口、激活函数、隐藏层层数和迭代次数；

使用预测集来测试模型的预测精度，以均方根误差(RMSE)为评价指标，得到模型的预测精度及误差评价指标；

与现有技术相比，本发明具有以下优点：

一、引入空气污染扩散指数作为预测模型的新特征，分析城市空气污染过程及总体趋势，充分考虑了不同气象条件对污染物扩散的影响，更好地描述城市污染物浓度的时空变化规律，有效提高空气污染物预测模型的精度。

二、利用特征选择和提取等方法实现多模态信息的融合，构建多源异构的数据集。对气象因子不同类别分配权重系数，合理计算出区域的污染扩散指数，根据特征重要性排序结果实现多个特征的融合，降低了模型的过拟合问题，精细化处理不同维度特征，并且能够一定程度避免因步长过长造成的记忆丢失和梯度弥散。

三、精细划分城市区域网格，挖掘城市内多站点间空气污染物和气象数据的时空关联性，准确反映城市各区域的污染特征和污染传输状况，解决传统模型的特征匹配损失大以及特征相关性不强等问题。即通过城市空气污染气象条件类型确定区域内污染梯度扩散方向及对应的扩散能力等级，表述整个城市区域污染物变化规律，能够从空气污染扩散气象条件的角度去进一步提升预测模型的精确度。

附图说明

图1为本发明方法的主要步骤流程示意图。

图2为东南风向下某一网格内污染物扩散传输的过程图。

图3为本发明所构建的预测模型的整体结构示意图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

本发明一种结合污染扩散指数的城市空气质量预测方法，包括以下步骤：

S1:获取上海市2014年至2018年所有国家空气质量监测站和气象站的历史数据，并进行数据分析及预处理，建立时序关系的城市污染物浓度序列。

采集的数据存储在MySQL数据库中，对原始数据中的异常值和缺失值进行预处理，避免缺失值影响预测结果；

其中采用线性插值法对缺失数据进行数值填充，补全数据集中的缺失值，计算公式为：

利用皮尔逊相关系数方法对预处理后的数据进行相关性分析，挖掘气象因子与不同污染物之间的相关性，根据皮尔逊相关系数分析的结果，按关联性数值进行排序，筛选得到关联性高于阈值的空气污染物和气象因素。

最后采用最大最小归一化处理，归一化指定区间为0到1，消除特征之间的量纲影响，以解决数据指标之间的可比性。

所述最大最小归一化公式为：

Y＝X*(mx-mi)+mi

根据空气污染扩散气象条件指数的定义和计算方式，提出区域污染扩散指数，表征当前气象背景下整个区域内污染物传输的状况。

其中依据已发行的中华人民共和国气象行业标准，空气污染扩散气象条件指数是不考虑污染源的情况下，从气象角度出发，对未来大气污染物的稀释、扩散、聚积和清除能力进行评价，主要考虑的气象因素是温度、湿度、风速和天气现象，对气象条件进行分分级，空气污染扩散条件指数分为5级，级数越高气象条件越不利于污染物的扩散。

利用气象数据和污染扩散模型来计算选定区域的污染扩散指数，按照各气象因子分指数最大值和最小值的比值从小到大进行排序，剔除其中相关系数未通过显著性检验的自相关气象因子，确定各气象因子作用阈值，根据各气象因子在不同阈值范围内对空气污染扩散条件形成作用的大小分配权重，通过计算该区域内气象因子的大小和综合贡献度来得出所选区域的污染扩散指数。

各气象因子的权重等级划分见表1：

气象指标	优先级	权重
			灾害天气预警	5	100
降水量	4	80
			风速	3	60
温度	2	40
			天气类型	1	20

其中根据国家气象局发布的不同城市扩散气象条件指数的历史数据得到气象因子权重系数的经验公式，客观反映出气象因子对污染物扩散状况的贡献程度，作用越大给予越高的优先级和权重。

将城市区域划分为网格，解析污染物扩散的微观机制。根据城市内空气质量监测站和气象站的地理位置和监测半径来对城市区域进行网格划分，得到城市空气质量网格化的污染分布图，可以精细化反映出整个城市不同区域的污染物变化态势。

根据选定区域内的气象因子计算出区域污染扩散指数，综合考虑了大气水平扩散、垂直扩散、相对湿度等气象要素，该指数越高，代表大气扩散能力越强。

对所有落在阈值范围内的气象因子权重求和，得到污染扩散指数(Pollutiondiffusion index，PDI)，其计算公式为：

公式中，w_i为各气象因子的权重，p_i为各气象因子的优先级，η_i为各气象因子的数值。

将得到的污染物扩散条件等级非数值通过ONE-HOT进行编码。

依据城市区域的网格划分结果，得到整个城市网格的数量和区域范围，将各污染物时序特征、气象辅助特征和污染扩散指数匹配到每个区域网格中，生成城市污染物变化相关的特征序列。

构建区域相互影响模型(Regional Inter-Continental Transport model，简称RICT)作为城市污染扩散模型，将城市区域划分为网格，并通过对流、扩散和化学反应等过程的数学描述，模拟污染物在大气中的输送和转化，定量描述一个区域对另一个区域污染物浓度的整体影响。

RICT模型的计算过程包括两个主要部分：气象场模拟和污染物扩散模拟。气象场模拟部分利用大气动力学原理，模拟大气中的风场、温度、湿度等气象要素。污染物扩散模拟部分则根据气象场的数据，以及污染源的位置、排放量等参数，模拟污染物在大气中的传输和扩散过程。

在城市空气污染物扩散模拟中，RICT模型可以将城市看作一个区域，将周围地区看作另一个区域，并描述它们之间的相互影响。RICT模型中，城市区域和周围地区都可以被划分为若干个网格，利用各区域网格的气象指数和污染扩散指数计算出整个区域污染物间的贡献度，组成每个网格的扩散范围数值矩阵，可以直观表现出不同位置区域网格间污染物浓度变化的耦合影响。

以上风向和下风向形成的直线方向和位置相邻为污染扩散影响区域，随着距离的增大扩散影响越弱，设置扩散范围阈值，超过这一阈值将不会传输污染物。

区域内某个网格污染物扩散范围及对应的污染物浓度贡献系数：

ξ_k＝exp(ac_i*PDI_i)

式中，i表示污染物的类别，k的取值为{1,2,L,m}，m是指当前污染扩散指数下该网格污染传输范围的尺度，表示网格内的第i种污染物对第k个网格区域中同类型污染物的贡献系数。

城市区域内的每个网格的污染物浓度由两部分组成：一部分是自身网格内污染源所产生浓度；另一部分是城市内其他网格所贡献的污染物浓度。每个网格中的污染物浓度可以用以下公式来计算：

依据上述步骤最终计算出城市所有网格区域各项污染物对应的扩散指数等级。

S3:构建基于CNN-LSTM的空气污染物特征提取网络，并通过神经网络将各污染物时序特征、气象辅助特征和污染扩散指数进行融合，确定模型输入结构。

所述步骤3中，构建基于CNN-LSTM的空气污染物特征提取网络，整体网络结构如图3所示。特征提取网络以CNN网络作为底层，以基于多层LSTM网络作为顶层，CNN层用于提取序列中的局部特征，而LSTM层用于学习序列中的长期依赖关系。通过卷积神经网络(CNN)和长短时记忆网络(LSTM)组件学习筛选后的各污染物和历史数据逐日和逐小时的变化规律，利用CNN对高关联气象数据进行特征提取，经过Reshape操作得到各个污染物及气象因子的时序特征；接着，利用add并行策略，将多个特征向量拼接成特征矩阵作为网络输入，预测得到各个污染物预测输出，具体步骤如下：

将空气污染物浓度数据和气象数据转化为具有时间序列的二维矩阵，并输入到CNN网络中提取空间特征，作为LSTM网络的输入；

将步骤1处理后的污染物数据转化为矩阵X₁(M×N矩阵)，X₁的列代表污染物类型，X₁的行代表每小时记录的污染物浓度数据，同时，气象因子数据转化为矩阵X₂(M×N矩阵)，最后利用矩阵相加拼接为二维矩阵X。

采用CNN模型提取污染物和气象因子数据的逐小时时间特征，卷积层的上一层输出的特征图由该卷积层的卷积核k进行特征提取并学习，通过激活函数对卷积的结果进行非线性变换而得到输出的特征图。卷积层操作为：

式中，y_l为经过l层卷积操作后的输出，σ()为Relu激活函数，为是第l层第m部分卷积区域的输入，/>为第l层第m部分的权重，/>为卷积运算，/>为第l层的偏置项，m为特征图的通道数。

经过CNN中的卷积层卷积过后，得到N个特征图，作为池化层的输入，进行最大池化(Maxpoling)操作，生成大小为所选块的最大值(K×K，K超参数)的池化过滤器，过滤器按步幅K进行移动扫描，不会对输入矩阵的重叠部分进行过滤，选择最大值输出到下一层，将输出N个缩小后的特征图，后续将这N个特征图展开成N个一维向量，再经过全连接层的解码，最后可以得到提取后的特征序列。

其中所述最大池化操作过程为：

为了提取污染物与气象因子之间的时间互关联性，将Reshape之后的特征输入LSTM网络层，得到污染物关系融合的时序特征，单个LSTM的具体计算方式如下：

将上一阶段训练好的CNN权重参数迁移到基于多层LSTM的网络模型当中，实现对历史污染物的浓度和气象数据的编码，然后形成一个具有时序特征的隐藏向量C，隐藏向量作为解码器端的输入，进一步作时序预测：

y_t＝f_L(x_t，y_t-1)

C＝φ({y₁L y_T})

利用矩阵拼接将城市区域网格内的污染物浓度，气象因子和污染扩散指数等时序特征进行融合，将多种高关联污染物变化相关数据堆叠为多通道矩阵，融合后特征序列作为LSTM网络的输入，确定模型输入矩阵的阶数。

将隐藏向量C作为解码器部分的输入，解码器部分将每个时刻的隐藏状态输入

到全连接层并产生最终的预测结果，即下一时刻目标污染物的浓度预测值：

y_t,s_t＝f_L(y_t-1,s_t-1,C)

p_t＝Wh_t+b

按照设定比例划分训练样本和测试样本，将数据集中2014-2017年数据作为训练集，2018年的数据作为测试集，训练所构建的基于的空气污染物预测网络，并用训练好的模型预测未来空气污染物浓度值。

初始化预测模型结构，调节网络的参数，确定网络卷积核数量、初始权重、时间窗口、激活函数、隐藏层层数和迭代次数，最终得到最优的参数；

具体地，为防止过拟合，在CNN中引入Dropout，参数设置为0.2，并且在整个模型中使用随机梯度下降法，通过误差反向传播的方式计算误差函数来对网络全部权重和偏置值的梯度进行更新，直至模型的性能符合期望。

使用预测集来测试模型的预测精度，以RMSE为评价指标，得到模型的预测精度，RMSE误差损失函数为：

其中，为t时刻测试集的真实值，/>为预测模型t时刻输出的预测值，n由测试集大小确定。

采用训练好的城市污染物浓度预测模型进行预测，将预测值进行反归一化处理，得到目标污染物PM2.5浓度的预测结果。

上面结合附图对本发明进行了示例性描述，显然本发明具体实现不受上述方式的限制，只要采用了本发明的方法构思和技术方案进行的各种改进，或未经过该进直接应用于其他场合，均在本发明的保护范围之内。

Claims

1.一种结合污染扩散指数的城市空气质量预测方法，其特征在于：包括以下步骤：

S1:对城市区域内空气质量监测站和气象站的历史数据进行采集和分析，并进行数据预处理，建立时序关系的城市污染物浓度序列；

S2:城市区域网格化，依据气象数据和污染扩散模型计算各区域污染扩散指数，构建区域相互影响模型，全面评估污染物区域扩散的状况；

S3:构建基于CNN-LSTM的空气污染物特征提取网络，并通过神经网络将各污染物时序特征、气象辅助特征和区域污染扩散指数进行融合，确定模型输入结构；

2.根据权利要求1所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：所述步骤S1具体包括以下步骤：

采集的国家空气质量监测站和气象站的历史数据包括多种大气污染物浓度值、温度、湿度、降水量、风速风向和灾害天气预警信息；

采用线性插值法对数据集中的缺失数据进行数值填充，补全数据集中的缺失值，计算公式为：

式中，x_i为缺失部分的值，x_j为x_i前面已知的值，x_k为x_i后面已知的值，i、j、k为大于或等于1的自然数；

计算多个特征之间的皮尔逊相关系数，将与所要预测的目标特征不相关的其他特征剔除，减少数据冗余，最后采用最大最小归一化处理，归一化指定区间为0到1,消除特征之间的量纲影响，以解决数据指标之间的可比性；

在完成污染物和气象数据采集和预处理流程后，建立时序关系的城市污染物浓度序列以进行预测建模和训练。

3.根据权利要求1所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：所述步骤S2具体包括以下步骤：

根据城市内空气质量监测站和气象站的地理位置和监测半径来对城市区域进行网格划分，得到城市污染物分布的网格细化图，可以精细化反映出城市不同重点区域污染物变化过程；

采集所在城市区域的空气污染扩散气象条件指数数据，根据其定义和计算方式，利用气象数据和污染扩散模型来计算选定区域内各网格的污染扩散指数，表征当前气象背景下整个区域内污染物传输和邻近输送的状况。

4.根据权利要求3所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：步骤S2所述的计算城市各个区域的污染扩散指数，具体包括：

按照各气象因子分指数最大值和最小值的比值从小到大进行排序，剔除其中相关系数未通过显著性检验的自相关因子，确定各气象因子阈值，根据各因子在不同阈值范围内对空气污染扩散条件形成作用的大小分配权重，通过计算该区域内气象因子的大小和综合贡献度来得出所选区域的污染扩散指数；

各气象因子的权重等级划分见表1：

气象指标优先级权重灾害天气预警 5 100 降水量 4 80 风速 3 60 温度 2 40 天气类型 1 20

气象因子的优先级，数值越大，优先级越高，对污染扩散的贡献值越高；

式中，w_i为各气象因子的权重，p_i为各气象因子的优先级，η_i为各气象因子的数值；

等级污染扩散指数描述气象条件较差 [0,80] 不利于污染物稀释、扩散和清除气象条件一般 [80,160] 对污染物稀释、扩散和清除无明显影响气象条件良好 [160,+oo] 有利于污染物稀释、扩散和清除

将得到的污染物扩散条件等级类别值利用ONE-HOT编码量化为连续的特征分量。

5.根据权利要求3所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：步骤S2所述的污染扩散模型构建，具体包括：

依据整个城市网格的数量和区域范围构建区域相互影响模型，定量描述一个区域对另一个区域污染物浓度的整体影响，包括水平和垂直方向的输送，并通过对流、扩散和化学反应等过程的数学描述，计算出城市区域污染物传输和扩散状况；

利用某个网格的气象指数和污染扩散指数的相互组合计算出该网格对其他网格区域内污染物的贡献度，组成每个网格的扩散范围数值矩阵，最终计算出城市所有网格中各项污染物浓度值。

6.根据权利要求5所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：步骤S2所述的污染物跨域传输过程和网格污染物浓度计算，具体包括：

设定以上风向和下风向形成的直线方向和位置相邻为污染扩散传输路径，随着距离的增大扩散影响越弱，设置扩散范围阈值，超过这一阈值将不会传输污染物；区域内某个网格污染物扩散范围及对应的污染物浓度贡献系数：

ξ_k＝exp(ac_i*PDI_i)

式中，i表示选定污染物的类别，k的取值为{1,2,L,m}，m是指当前污染扩散指数下该网格污染传输范围的尺度，表示网格内的第i种污染物对第k个网格区域中同类型污染物的贡献系数；

城市区域内的每个网格的污染物浓度由两部分组成：一部分是自身网格内污染源所产生浓度；另一部分是城市内其他区域网格所贡献的污染物浓度；

每个网格中的污染物浓度可以用以下公式来计算：

7.根据权利要求1所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：所述步骤S3具体包括以下步骤：

基于CNN-LSTM混合网络提取空气污染物特征及气象因子，特征提取网络以CNN网络作为底层，以基于多层LSTM的网络作为顶层，将空气污染物浓度数据和气象数据转化为CNN网络可接收的具有时间序列的二维矩阵，并输入到CNN网络中提取空间特征，作为LSTM网络的输入，得到污染扩散指数、气象数据与污染物浓度值的映射关系。

8.根据权利要求7所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：所述步骤S3的CNN-LSTM预测网络结构，具体包括以下步骤：

CNN层用于提取污染物和气象因子数据的逐小时时间特征，序列数据由卷积层进行特征提取操作，通过激活函数对卷积的结果进行非线性变换而得到输出的特征图，输出特征图作为池化层的输入，进行最大池化操作，池化过滤器进行移动扫描，选择最大值输出到下一层；

多维特征数据池化后再进行Reshape操作，将矩阵转化为一维向量，作为LSTM层的输入，LSTM层提取城市空气污染物浓度和气象数据的时序特征，实现对历史污染物的浓度和气象数据的编码。

9.根据权利要求1所述的一种结合污染扩散指数的城市空气质量预测方法，其特征在于：所述步骤S4的城市空气质量预测模型构建，具体包括以下步骤：

利用矩阵拼接将城市区域网格内的污染物浓度，气象因子和污染扩散指数等时序特征进行融合，作为模型的输入，确定预测模型输入矩阵的阶数；

训练参数调优，确定预测网络卷积核数量、初始权重、时间窗口、激活函数、隐藏层层数和迭代次数等参数，最终得到城市污染物浓度预测结果。