CN114609008A

CN114609008A - 一种气体浓度预测模型的训练方法和气体浓度预测方法

Info

Publication number: CN114609008A
Application number: CN202210322328.XA
Authority: CN
Inventors: 田莉
Original assignee: Institute of Geographic Sciences and Natural Resources of CAS
Current assignee: Institute of Geographic Sciences and Natural Resources of CAS
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2022-06-10
Anticipated expiration: 2042-03-30
Also published as: CN114609008B

Abstract

本发明涉及气体浓度预测技术领域，具体涉及一种气体浓度预测模型的训练方法和气体浓度预测方法。本发明首先计算所有周边站点的空气质量数据信息与目标站点空气质量数据信息之间的相关度，然后根据该相关度从所有的周边站点中挑选出优选站点。最后根据优选站点的空气质量数据信息去训练目标站点的气体浓度预测模型。本发明采用优选站点的数据去训练目标站点的气体浓度预测模型，充分考虑了周边站点气体浓度对目标站点气体浓度的影响，这与实际环境中不同站点之间的气体相互扩散相吻合，从而提高了本发明的气体浓度预测模型预测目标站点气体浓度的准确性。

Description

一种气体浓度预测模型的训练方法和气体浓度预测方法

技术领域

本发明涉及气体浓度预测技术领域，具体是涉及一种气体浓度预测模型的训练方法和气体浓度预测方法。

背景技术

不断加重的工业化和城市化进程导致了严重的空气污染问题，为了针对空气污染问题制定相应的策略，需要提前预测出空气中各种有害气体的浓度，比如为了保证居住环境中的空气质量，需要一个预测模型预测PM2.5浓度，这是因为人类长期暴露在高浓度的PM2.5中会显著增加其患病风险，使人体自身的呼吸系统、神经系统、心血管系统及生殖系统遭受严重损害。如何对PM2.5浓度进行精确化预测，已成为大气环境保护和公众健康的重要研究课题。

在PM2.5浓度预测建模方面，已有很多先驱性工作。这些研究大致可以分为4类，即传统的线性统计模型和时间序列模型、浅层神经网络、基于深度学习的建模和专业模型。专业模型基于气象、物化反应等先验知识模拟并预测PM2.5的扩散与演化，但物化反应中关键知识的不足将导致模型预测表现欠佳。传统的线性统计模型和基于时间序列的方法不能反映复杂的非线性系统。浅层神经网络对非线性系统有一定反映能力，但不适用于对复杂函数的表达，从而制约了其泛化能力。深度学习中的LSTM、GRU等RNN变种模型利用长期记忆机制捕获时序中的时间依赖性关系，然而，这些基于RNN的序列建模存在迭代传播耗时、梯度爆炸和梯度消失的问题。图模型可以提高预测精度，因为空间依赖关系可以通过图节点和图之间的边权值自然地表达出来。现有的图模型假设一个节点的未来信息取决于其历史信息，更倾向于依赖马尔可夫假设来使跨变量交互的建模更易于处理。现有的上述气体预测模型都是基于目标站点自身的空气质量数据信息而获得的预测模型，而忽视了在实际环境中周边站点气体的扩散也会影响目标站点的气体浓度这一事实，从而降低了气体预测模型的准确性。

综上所述，现有的气体预测模型降低了气体浓度预测的准确性。

因此，现有技术还有待改进和提高。

发明内容

为解决上述技术问题，本发明提供了一种气体浓度预测模型的训练方法和气体浓度预测方法，解决了现有的气体预测模型降低了气体浓度预测准确性的问题。

为实现上述目的，本发明采用了以下技术方案：

第一方面，本发明提供一种气体浓度预测模型的训练方法，其中，包括：

根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度；

依据所述目标站点与各个所述周边站点之间的相关度，得到所有所述周边站点中与所述目标站点所对应的优选站点；

依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型。

在一种实现方式中，所述根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度，包括：

依据所述空气质量数据信息，得到所述空气质量数据信息中的空气质量历史指数；

将所述目标站点的所述空气质量历史指数按照降序方式进行排序，得到第一排序序列；

将各个所述周边站点的所述空气质量历史指数按照升序方式进行排序，得到第二排序序列；

将所述第二排序序列中与所述第一排序序列中的相同序列号所对应的所述空气质量历史指数相减，得到相减结果；

依据所述相减结果，得到所述目标站点与各个所述周边站点之间的相关度。

在一种实现方式中，依据所述相减结果，得到所述目标站点与各个所述周边站点之间的相关度，包括：

计算所述相减结果的平方值；

将所有所述相同序列号所对应的所述平方值进行相加，得到相加结果；

获取所述第一排序序列和所述第二排序序列所对应的序列号数量；

将所述序列号数量的平方值减去一，得到中间结果；

将所述中间结果乘以所述序列号数量，得到相乘结果；

将所述相加结果除以所述相乘结果，得到除法结果；

依据所述除法结果，得到所述目标站点与各个所述周边站点之间的相关度。

在一种实现方式中，所述依据所述目标站点与各个所述周边站点之间的相关度，得到所有所述周边站点中与所述目标站点所对应的优选站点，包括：

以所述目标站点为圆心，以设定半径画圆，得到各个圆形；

依据各个所述周边站点，得到各个所述周边站点中的位于各个所述圆形上的站点；

计算所述目标站点与各个所述圆形上的每个站点之间的相关度；

依据所述目标站点与各个所述圆形上的每个站点之间的相关度，得到各个所述圆形所对应的相关性平均值；

依据各个所述圆形所对应的相关性平均值，得到各个所述圆形中的优选圆形；

依据所述优选圆形上的各个站点，得到与所述目标站点所对应的优选站点。

在一种实现方式中，所述依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型，包括：

依据所述空气质量数据信息，得到所述空气质量数据信息中的各个空气质量历史数据；

依据各个所述空气质量历史数据，得到各个所述空气质量历史数据所对应的时间步长；

依据所述优选站点，得到所述优选站点所对应的站点通道；

依据各个所述空气质量历史数据、所述时间步长、所述站点通道，构建三维矩阵；

对所述三维矩阵应用1x1卷积神经网络，得到1x1卷积神经网络输出的二维矩阵；

通过所述二维矩阵训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型。

对膨胀卷积内核应用超参数调优，得到调优之后的所述膨胀卷积内核；

依据所述优选站点的空气质量数据信息，得到所述空气质量数据信息所包含的所述优选站点的各个空气质量历史数据；

对所述优选站点的各个空气质量历史数据应用调优之后的所述膨胀卷积内核对各个空气质量历史数据进行采样，得到空气质量历史采样数据；

依据所述气体浓度预测模型，得到所述气体浓度预测模型中的PM_2.5浓度预测模型；

获取与所述空气质量历史采样数据所对应的PM_2.5样本浓度；

将所述空气质量历史采样数据输入到所述PM_2.5浓度预测模型，得到所述PM_2.5浓度预测模型输出的PM_2.5预测浓度；

依据所述PM_2.5样本浓度和所述PM_2.5预测浓度，训练所述PM_2.5浓度预测模型，得到所述目标站点的已训练所述PM_2.5浓度预测模型。

第二方面，本发明实施例还提供一种气体浓度预测方法，其中，包括：

获取目标站点的待预测气体所对应的预测时长；

依据所述预测时长，得到与所述预测时长所对应的采集时长；

依据所述采集时长，采集优先站点与所述采集时长所对应的空气质量历史数据信息，所述优先站点为根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度，再依据所述目标站点与各个所述周边站点之间的相关度而获得的站点；

将所述优先站点的所述空气质量历史数据信息输入到已训练的气体浓度预测模型，得到已训练的气体浓度预测模型输出的所述待预测气体在预测时长内的浓度。

第三方面，本发明实施例还提供一种气体浓度预测模型的训练装置，其中，所述装置包括如下组成部分：

相关度计算模块，用于根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度；

优选站点计算模块，用于依据所述目标站点与各个所述周边站点之间的相关度，得到所有所述周边站点中与所述目标站点所对应的优选站点；

训练模块，用于依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型。

第四方面，本发明实施例还提供一种终端设备，其中，所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的气体浓度预测模型的训练程序，所述处理器执行所述气体浓度预测模型的训练程序时，实现上述所述的气体浓度预测模型的训练方法的步骤。

第五方面，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有气体浓度预测模型的训练程序，所述气体浓度预测模型的训练程序被处理器执行时，实现上述所述的气体浓度预测模型的训练方法的步骤。

有益效果：本发明首先计算所有的周边站点(位于目标站点周围的站点)的空气质量数据信息与目标站点的空气质量数据信息的相关度，然后根据该相关度从所有的周边站点中挑选出优选站点。最后根据优选站点的空气质量数据信息去训练目标站点的气体浓度预测模型。本发明采用优选站点的数据去训练目标站点的气体浓度预测模型，充分考虑了周边站点气体浓度对目标站点气体浓度的影响，这与实际环境中不同站点之间的气体相互扩散而导致的相互影响相吻合，从而提高了本发明的气体浓度预测模型预测目标站点气体浓度的准确性。

附图说明

图1为本发明的整体流程图；

图2为本发明的空间特征提取流程图；

图3为本发明时间特征提取流程图；

图4为实施例中的预测流程图；

图5为实施例中的学习率对比仿真图；

图6为实施例中的内核大小对比仿真图；

图7为实施例中的输入窗口值对比仿真图；

图8为本发明实施例提供的终端设备的内部结构原理框图。

具体实施方式

以下结合实施例和说明书附图，对本发明中的技术方案进行清楚、完整地描述。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

经研究发现，不断加重的工业化和城市化进程导致了严重的空气污染问题，为了针对空气污染问题制定相应的策略，需要提前预测出空气中各种有害气体的浓度，比如为了保证居住环境中的空气质量，需要一个预测模型预测PM2.5浓度，这是因为人类长期暴露在高浓度的PM2.5中会显著增加其患病风险，使人体自身的呼吸系统、神经系统、心血管系统及生殖系统遭受严重损害。如何对PM2.5浓度进行精确化预测，已成为大气环境保护和公众健康的重要研究课题。在PM2.5浓度预测建模方面，已有很多先驱性工作。这些研究大致可以分为4类，即传统的线性统计模型和时间序列模型、浅层神经网络、基于深度学习的建模和专业模型。专业模型基于气象、物化反应等先验知识模拟并预测PM2.5的扩散与演化，但物化反应中关键知识的不足将导致模型预测表现欠佳。传统的线性统计模型和基于时间序列的方法不能反映复杂的非线性系统。浅层神经网络对非线性系统有一定反映能力，但不适用于对复杂函数的表达，从而制约了其泛化能力。深度学习中的LSTM、GRU等RNN变种模型利用长期记忆机制捕获时序中的时间依赖性关系，然而，这些基于RNN的序列建模存在迭代传播耗时、梯度爆炸和梯度消失的问题。图模型可以提高预测精度，因为空间依赖关系可以通过图节点和图之间的边权值自然地表达出来。现有的图模型假设一个节点的未来信息取决于其历史信息，更倾向于依赖马尔可夫假设来使跨变量交互的建模更易于处理。现有的上述气体预测模型都是基于目标站点自身的空气质量数据信息而获得的预测模型，而忽视了在实际环境中周边站点气体的扩散也会影响目标站点的气体浓度这一事实，从而降低了气体预测模型的准确性。

为解决上述技术问题，本发明提供了一种气体浓度预测模型的训练方法和气体浓度预测方法，解决了现有的气体预测模型降低了气体浓度预测准确性的问题。具体实施时，本实施例首先根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度；之后依据所述目标站点与各个所述周边站点之间的相关度，得到所有所述周边站点中与所述目标站点所对应的优选站点；最后依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型。本实施例的气体浓度预测模型能够提高对目标站点的气体浓度预测准确性。

举例说明，A地为目标站点，A地周边有B地(周边站点)、C地(周边站点)、D地(周边站点)。首先计算B地的空气质量数据信息与A地的空气质量数据信息的相关度，记为第一相关度；计算C地的空气质量数据信息与A地的空气质量数据信息的相关度，记为第二相关度；计算D地的空气质量数据信息与A地的空气质量数据信息的相关度，记为第三相关度。然后比较第一相关度、第二相关度、第三相关度的大小，如果第二相关度最大，那么C地就是三个周边站点中针对A地的优选站点。之后就是采集C地的空气质量数据信息训练A地针对待预测气体(气体甲)的气体浓度预测模型。本实施例再训练A地的气体浓度预测模型采用的C地的空气质量数据信息，这与实际环境中C地中的待预测气体会向A地扩散相吻合，从而提高了得到的已训练的气体浓度预测模型准确性。

示例性方法

本实施例的一种气体浓度预测模型的训练方法可应用于终端设备中，所述终端设备可为具有计算功能的终端产品，比如电脑等。在本实施例中，如图1中所示，所述气体浓度预测模型的训练方法具体包括如下步骤：

S100，根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度。

用于表示空气质量数据信息的指标(特征)有PM_2.5、AQI、PM_2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI、风速、湿度这十项。其中，PM_2.5代表本实施例的预测对象PM_2.5浓度；AQI是空气质量指数(Air Quality Index，简称AQI)的缩写，定量化描述了空气清洁或污染的程度，主要通过空气质量分指数(Individual Air Quality Index，简称IAQI)进行估算；PM_2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI；PM_2.5_IAQI为PM_2.5这一污染物对应的空气质量分指数，由对PM_2.5的浓度计算得出；PM10_IAQI为PM10这一污染物对应的空气质量分指数，由对PM10的浓度计算得出；CO_IAQI为CO这一污染物对应的空气质量分指数，由对CO的浓度计算得出；SO2_IAQI为SO2(二氧化硫)这一污染物对应的空气质量分指数，由对SO2的浓度计算得出；NO2_IAQI为NO2(二氧化氮)这一污染物对应的空气质量分指数，由对NO2的浓度计算得出；O3_IAQI为O3(臭氧)这一污染物对应的空气质量分指数，由对O3的浓度计算得出，PM_2.5_IAQI、PM10_IAQI、CO_IAQI、SO2_IAQI、NO2_IAQI、O3_IAQI这六个空气质量分指数构成了AQI。步骤S100包括如下的步骤S101、S102、S103、S104、S105、S106、S107、S108、S109、S1010、S1011：

S101，依据所述空气质量数据信息，得到所述空气质量数据信息中的空气质量历史指数。

本实施例中的空气质量数据信息指的是AQI。

S102，将所述目标站点的所述空气质量历史指数按照降序方式进行排序，得到第一排序序列。

S103，将各个所述周边站点的所述空气质量历史指数按照升序方式进行排序，得到第二排序序列。

举例说明，目标站点为A地，周边站点为B和C，采集A地某一天上午八点的AQI值为Q11、上午九点的AQI值为Q12、上午十点的AQI值为Q13；B地某一天上午八点的AQI值为Q21、上午九点的AQI值为Q22、上午十点的AQI值为Q23；C地某一天上午八点的AQI值为Q31、上午九点的AQI值为Q32、上午十点的AQI值为Q33。Q11大于Q12，Q13大于Q11，Q11、Q12、Q13按照降序排列就是Q13、Q11、Q12(第一排序序列)。同样对于Q21、Q22、Q23按照升序排列就是Q22、Q21、Q23(B对应的第二排序序列)。对于Q31、Q32、Q33按照升序排列就是Q32、Q31、Q33。

S104，将所述第二排序序列中与所述第一排序序列中的相同序列号所对应的所述空气质量历史指数相减，得到相减结果。

S105，计算所述相减结果的平方值。

S106，将所有所述相同序列号所对应的所述平方值进行相加，得到相加结果；

S107，获取所述第一排序序列和所述第二排序序列所对应的序列号数量；

S108，将所述序列号数量的平方值减去一，得到中间结果；

S109，将所述中间结果乘以所述序列号数量，得到相乘结果；

S1010，将所述相加结果除以所述相乘结果，得到除法结果；

S1011，依据所述除法结果，得到所述目标站点与各个所述周边站点之间的相关度。

步骤S104-步骤S1011是依据如下公式得到的：

式中，Yⁱ为目标站点所对应的第一排序序列中序列号为i的AQI值、

为周边站点k所对应的第二排序序列中序列号为i的AQI值，N为第一排序序列和第二排序序列所对应的序列号数量(第一排序序列和第二排序序列的序列号数量都是N)，

为步骤S106中的相加结果。

通过公式(1)可以计算出目标站点与所有的周边站点构成的相关系数列表ρ_*：

S200，依据所述目标站点与各个所述周边站点之间的相关度，得到所有所述周边站点中与所述目标站点所对应的优选站点。

通过步骤S100计算出了目标站点与所有周边站点之间的相关度，步骤S200就是根据相关度从所有周边站点中挑选出与目标站点相匹配的优选站点。步骤S200包括如下的步骤S201、S202、S203、S204、S205、S206：

S201，以所述目标站点为圆心，以设定半径画圆，得到各个圆形。

S202，依据各个所述周边站点，得到各个所述周边站点中的位于各个所述圆形上的站点。

比如以目标站点为圆心，以设定半径r1、r2、r3为半径画圆，就得到了三个圆形(第一个圆形、第二个圆形、第三个圆形)。三个圆形上的站点就是目标站点的周边站点。

S203，计算所述目标站点与各个所述圆形上的每个站点之间的相关度。

假如第一个圆形上、第二个圆形、第三个圆形分别均有两个站点，分别计算第一圆形上的其中一个站点与目标站点的相关度P11、另一个站点与目标站点的相关度P12，计算第二圆形上的其中一个站点与目标站点的相关度P21、另一个站点与目标站点的相关度P22，计算第三圆形上的其中一个站点与目标站点的相关度P31、另一个站点与目标站点的相关度P32。

S204，依据所述目标站点与各个所述圆形上的每个站点之间的相关度，得到各个所述圆形所对应的相关性平均值。

第一个圆形所对应的相关性平均值为(P11+P12)/2，第二个圆形所对应的相关性平均值为(P21+P22)/2，第三个圆形所对应的相关性平均值为(P31+P32)/2。

S205，依据各个所述圆形所对应的相关性平均值，得到各个所述圆形中的优选圆形。

相关性平均值最大所对应的圆形作为优选圆形，当P11+P12)/2比(P21+P22)/2以及P31+P32)/2都大，那么优选圆形就是第一个圆形。

S206，依据所述优选圆形上的各个站点，得到与所述目标站点所对应的优选站点。

第一圆形上两个站点就是优选站点。

步骤S200是基于如下原理得到优选站点的：

本文分别计算了距离目标站点不同远近范围内的平均相关性系数。以目际站点为中心，最初的范围只包含距离目标站点最近的站点。随着范围的扩大，将前一次范围外离目标站点最近的站点划入范围。

利用公式(2)中的各站点与目标点的相关性系数，不同空间范围与不同空间范围内的平均相关性系数如下所示：

S＝[S₁，S₂，…，S_n] (3)

如(3)、(4)式所示，每个空间范围对应一个平均相关性系数。空间范围的选取由ρ_ij和S_j内的站点信息是否全面且具有代表性两个变量共同决定。其中ρ_ij通过上式计算获得，而S_j内的站点信息是否全面且具有代表性无法通过公式计算或用一个标准衡量，因此我们采用暴力搜索法，从所有的S_j内确定了使模型预测性能最优的空间范围，记为S_*，此时S_*内的站点便是与目标站点具有空间强相关性的站点。相关性站点集合如下：

A＝{A_i|Y_i∈S_*，i∈1，...，P} (5)

上式中A_i表示与优化选取空间范围内站点的二维特征矩阵，即A_i∈R^T×F，其中T代表历史数据时间步长，F代表特征数量。A代表整合最优空间范围内站点的三维特征矩阵，即A∈R^T×F×P，其中P代表该空间范围内的站点数目

S300，依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型。

通过步骤S200得到了优选站点，步骤S300就是利用优选站点的空气质量历史数据信息去训练目标站点的待预测气体所对应的气体浓度预测模型。

待预测气体包括AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI。当目标站点的AQI为待预测气体时，采集优选站点的历史AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度(风速和湿度构成气象数据)去训练AQI所对应的气体浓度预测模型。同样当目标站点的PM_2.5_IAQI为待预测气体时，采集优选站点的历史AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度去训练PM_2.5_IAQI所对应的气体浓度预测模型。当目标站点的待预测气体为其它气体时，也是采用同样的方式训练预测模型。

步骤S300包括如下的步骤S301、S302、S303、S304、S305、S306：

S301，依据所述空气质量数据信息，得到所述空气质量数据信息中的各个空气质量历史数据。

S302，依据各个所述空气质量历史数据，得到各个所述空气质量历史数据所对应的时间步长。

S303，依据所述优选站点，得到所述优选站点所对应的站点通道。

S304，依据各个所述空气质量历史数据、所述时间步长、所述站点通道，构建三维矩阵。

比如上述步骤S206中第一圆形上两个站点为优选站点，每一个优选站点上的空气质量历史数据对应了不同的时间步长，比如要预测目标站点下午两点的气体浓度，那么就要采集优选站点的上午八点、十点、十二点的空气质量历史数据，时间步长就是两小时。R^T ^×F×P第P个站点(通道)的T个时间步长下的F气体的质量历史数据，R^T×F×P就是三维矩阵，而三维矩阵与气体浓度预测模型(S-TCN模型)所要求的输入数据类型不匹配，因此需要将三维矩阵转成二维矩阵。

S305，对所述三维矩阵应用1x1卷积神经网络，得到1x1卷积神经网络输出的二维矩阵。

本实施例是基于如下原理将三维矩阵转换成二维矩阵的：

如图2所示，利用一维卷积核，对A∈R^T×F×P中P个通道的特征值进行线性组合实现升维和降维操作，将三维特征矩阵聚合至二维矩阵。利用CNN中的1x1卷积核以改变输出通道数的方式对特征矩阵A进行升维和降维。首先使用M个滤波器对A进行升维操作。滤波器维度为1x1xP，P为通道数，它既是A内站点数同时也是卷积核数。一个卷积核应用于一个通道，与输入的特征矩阵A进行卷积操作，使通道维数升至M，生成新的三维特征矩阵A_*∈R^T×F×M，其中M＞P。其次需要将三维特征矩阵降维至二维，即将通道数降为1。使用卷积核数为M的filter与A_*进行卷积生成M个通道，对这些通道执行矩阵加法操作，得到A_**∈R^T×F。卷积计算公式如下：

A_**ij＝σ(A_jk_i+b_i) (6)

其中A_j代表第j个特征单元，k_i表示第i个卷积核，b_i为偏置项。使用1x1卷积核增加维度，扩增了数据量，提高了对空间强相关站点数据特征的提取能力。通过跨通道整合特征数据，达到减少参数降维的目的，使空间强相关特征矩阵满足膨胀卷积模型的输入规模。

S306，通过所述二维矩阵训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型。

将二维矩阵训练所包含的数据输入到目标站点的气体浓度预测模型中，根据模型输出的数据调整模型中的参数就可以实现去模型的训练。

步骤S301-步骤S306是通过对采集到的数据进行降维以完成对数据的处理，当然也可以在采集的时候就将数据按照二维数据进行排列，然后将采集到的数据输入到预测模型中，实现对预测模型的训练。因此步骤S300还包括如下的步骤S307、S308、S309、S3010、S3011、S3012、S3013：

S307，对膨胀卷积内核应用超参数调优，得到调优之后的所述膨胀卷积内核。

本实施例模型的膨胀卷积内核采用超参数调优后的参数值，将膨胀卷积网络深度设置为5，且使用d＝3ⁱ(i是网络深度)的膨胀因子，以此来保证预测结果覆盖到长期有效的历史数据，避免引入过多的噪声数据。

S308，依据所述优选站点的空气质量数据信息，得到所述空气质量数据信息所包含的所述优选站点的各个空气质量历史数据。

S309，对所述优选站点的各个空气质量历史数据应用调优之后的所述膨胀卷积内核对各个空气质量历史数据进行采样，得到空气质量历史采样数据。

本实施例并不是将采集到优选站点的所有空气质量历史数据都应用到对模型的训练中，而是通过采样的方式挑选出一些数据。本实施例是通过如下方式进行采样的：

如3所示，不同的是膨胀卷积引入了扩张率，允许卷积核处理数据时跳过(d-1)个数据进行处理，即间隔采样，不需扩展网络深度就可以增大感受野获得长距离的历史数据，不仅降低了空间损失和信息损失同时使得数据分析和特征提取更全面，有利于提高预测精度。在x_t处的膨胀因子为d的膨胀卷积如下所示：

如公式(7)所示，F＝(f₁,f₂,···,f_K)表示波虑器，序列X＝(x₁,x₂,···,x_T)，*_d为膨胀卷积运算符。K表示膨胀卷积内核大小，T代表历史数据时长。

本实施例，如图6所示，通过设置模型内核大小分别为2、3、4、5和6进行实验对比可知模型内核大小为4时模型表现最佳。

S3010，依据所述气体浓度预测模型，得到所述气体浓度预测模型中的PM_2.5浓度预测模型。

S3011，获取与所述空气质量历史采样数据所对应的PM_2.5样本浓度。

S3012，将所述空气质量历史采样数据输入到所述PM_2.5浓度预测模型，得到所述PM_2.5浓度预测模型输出的PM_2.5预测浓度。

S3013，依据所述PM_2.5样本浓度和所述PM_2.5预测浓度，训练所述PM_2.5浓度预测模型，得到所述目标站点的已训练所述PM_2.5浓度预测模型。

当PM_2.5样本浓度和PM_2.5预测浓度差值大于设定差值时就调整模型的参数，直至两者的差值小于设定差值，完成对模型的训练。

本实施例的PM_2.5浓度预测模型为S-TCN模型，在对S-TCN模型进行训练之前设置模型的学习率，如图5所示，通过将模型学习率值设置为0.1、0.005、0.001、0.0005和0.0001进行对比实验可知，选择学习率为0.001预测表现最优。

同时借鉴时间注意力机制的原理，将滑动窗口步长设定在3～24的范围内，筛选表现最优的滑动窗口尺寸，如图7所示，通过对比实验结果可知，选择滑动窗口尺寸为24进行后续的研究。

步骤S3013是基于如下步骤(a)和(b)实现对模型训练的：

(a)利用预处理后的数据集训练参数调优后的S-TCN模型。

本实施例中的数据训练集就是优选站点的各个时间点的空气质量数据信息(用AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度等变量表示)。获取到数据集之后需要对数据进行预处理，预处理包括如下过程：

缺失值的处理：对采集到的空气质量指数和气象数据中的缺失值进行填充。对于单一缺失值采用一阶拉格朗日线性插值(线性插值)进行填充，使得整体数据符合变化规律。

特征值选择：所示采用了斯皮尔曼来识别与PM_2.5浓度弱相关的特征并剔除，从AQI、PM_2.5_IAQI、PM₁₀_IAQI、CO_IAQI、SO₂_IAQI、NO₂_IAQI、O₃_IAQI、风速、湿度等变量中选择与PM_2.5浓度相关性强的因素作为输入模型的特征。

(b)与baseline模型进行单一站点对比实验。基于平稳时间序列的自回归模型(AR)，通过F检验选择合适的阶数P＝3，采用自适应的方法预测。滑动平均模型MA首先确定模型的阶P＝3，其次确定历史数据与当前数据的自相关性进行预测。基于非平稳时间序列的ARMA模型经过平稳性检验、模型识别和检验确定模型，将ARMA模型的p、q阶数分别设置为5、6。人工神经网络(ANN)可将其看作是从输入空间到输出空间的一个非线性映射,ANN模型设置包含有两个隐藏层，每个隐藏层各包含50个神经元，使用ReLU激活函数与Adam随机梯度优化器等模型参数。支持向量机回归(SVR)选择适当的函数子集、判别函数以及RBF核函数和参数值C＝1000完成预测。GRU模型设置舍弃率为0.2、隐藏层为1和隐藏节点数(16,25)进行实验。LSTM模型对前向信息特别是长距离前向信息有很好的保留作用,此实验采用三层隐含层，节点数分别为30、50、70，学习率为1。我们还考虑了一种名为STGCN的基于图的模型。STGCN区块三层通道分别为64、16和64。STGCN将图卷积核大小K和时间卷积核大小Kt设置为3。通过实验结果可知，S-TCN模型RMSE、MAE和R²性能指标均优于基准模型.

本实施例通过步骤S100、S200、S300完成了对预测模型的训练，当训练完成之后就可以使用预测模型进行实际气体浓度的预测了。具体包括如下步骤S401、S402、S403、S404：

S401，获取目标站点的待预测气体所对应的预测时长。

比如当前时刻是中午十二点，想要预测下午四点的PM2.5.的浓度，那么预测时长就是四个小时。

S402，依据所述预测时长，得到与所述预测时长所对应的采集时长。

预测时长越大，对应的采集时长就越大，这样才能得到更多的数据以提高预测的精度。

S403，依据所述采集时长，采集优先站点与所述采集时长所对应的空气质量历史数据信息，所述优先站点为根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度，再依据所述目标站点与各个所述周边站点之间的相关度而获得的站点。

S404，将所述优先站点的所述空气质量历史数据信息输入到已训练的气体浓度预测模型，得到已训练的气体浓度预测模型输出的所述待预测气体在预测时长内的浓度。

本实施例的构建预测模型(S-TCN模型)以及应用预测模型进行气体浓度的预测，如图4所示，包括如下过程：首先采集空气质量指数和气象天气数据，然后对数据缺失值、异常值的差值处理，之后对多维影响因素进行特征选择以及构建S-TCN模型。对模型学习率、膨胀卷积内核等超参数利用网格随机搜索的超参数调优方法进行实验以辅助优化模型。最后将多维特征数据集用于对该模型的训练，得出对目标站点PM2.5浓度的精确化预测值

综上，本发明首先计算所有的周边站点(位于目标站点周围的站点)的空气质量数据信息与目标站点的空气质量数据信息的相关度，然后根据该相关度从所有的周边站点中挑选出优选站点。最后根据优选站点的空气质量数据信息去训练目标站点的气体浓度预测模型。本发明采用优选站点的数据去训练目标站点的气体浓度预测模型，充分考虑了周边站点气体浓度对目标站点气体浓度的影响，这与实际环境中不同站点之间的气体相互扩散相吻合，从而提高了本发明的气体浓度预测模型预测目标站点气体浓度的准确性

另外本发明将站点间的时空相关性、气象因子和不同污染物之间的相互作用纳入PM_2.5浓度预测模型，同时扩展了时域之间的卷积，克服了传统RNN、LSTM模型的弊端。该模型利用时间注意机制和堆叠膨胀卷积重写了一个基于CNN的时空卷积网络优化了时空特征的提取。为PM_2.5浓度预测提供了一个可扩展、通用、健壮的S-TCN模型，可以应用于不同地区的各类空气污染物浓度预测任务，从而有效防范高浓度空气污染物对人类的危害。

示例性装置

本实施例还提供一种气体浓度预测模型的训练装置，所述装置包括如下组成部分：

基于上述实施例，本发明还提供了一种终端设备，其原理框图可以如图8所示。该终端设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、温度传感器。其中，该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种气体浓度预测方法。该终端设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该终端设备的温度传感器是预先在终端设备内部设置，用于检测内部设备的运行温度。

本领域技术人员可以理解，图8中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的终端设备的限定，具体的终端设备以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种终端设备，终端设备包括存储器、处理器及存储在存储器中并可在处理器上运行的气体浓度预测程序，处理器执行气体浓度预测程序时，实现如下操作指令：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种气体浓度预测模型的训练方法，其特征在于，包括：

2.如权利要求1所述的气体浓度预测模型的训练方法，其特征在于，所述根据目标站点的空气质量数据信息与各个周边站点的空气质量数据信息，得到所述目标站点与各个所述周边站点之间的相关度，包括：

3.如权利要求2所述的气体浓度预测模型的训练方法，其特征在于，依据所述相减结果，得到所述目标站点与各个所述周边站点之间的相关度，包括：

计算所述相减结果的平方值；

将所述序列号数量的平方值减去一，得到中间结果；

将所述中间结果乘以所述序列号数量，得到相乘结果；

将所述相加结果除以所述相乘结果，得到除法结果；

4.如权利要求1所述的气体浓度预测模型的训练方法，其特征在于，所述依据所述目标站点与各个所述周边站点之间的相关度，得到所有所述周边站点中与所述目标站点所对应的优选站点，包括：

以所述目标站点为圆心，以设定半径画圆，得到各个圆形；

5.如权利要求1所述的气体浓度预测模型的训练方法，其特征在于，所述依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型，包括：

依据所述优选站点，得到所述优选站点所对应的站点通道；

6.如权利要求1所述的气体浓度预测模型的训练方法，其特征在于，所述依据所述优选站点的空气质量数据信息，训练所述目标站点的气体浓度预测模型，得到所述目标站点的已训练所述气体浓度预测模型，包括：

获取与所述空气质量历史采样数据所对应的PM_2.5样本浓度；

7.一种气体浓度预测方法，其特征在于，包括：

获取目标站点的待预测气体所对应的预测时长；

8.一种气体浓度预测模型的训练装置，其特征在于，所述装置包括如下组成部分：

9.一种终端设备，其特征在于，所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的气体浓度预测模型的训练程序，所述处理器执行所述气体浓度预测模型的训练程序时，实现如权利要求1-6任一项所述的气体浓度预测模型的训练方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有气体浓度预测模型的训练程序，所述气体浓度预测模型的训练程序被处理器执行时，实现如权利要求1-6任一项所述的气体浓度预测模型的训练方法的步骤。