CN118072873A - 一种空气质量预测方法 - Google Patents

一种空气质量预测方法 Download PDF

Info

Publication number
CN118072873A
CN118072873A CN202410472238.8A CN202410472238A CN118072873A CN 118072873 A CN118072873 A CN 118072873A CN 202410472238 A CN202410472238 A CN 202410472238A CN 118072873 A CN118072873 A CN 118072873A
Authority
CN
China
Prior art keywords
space
time
data
monitored
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410472238.8A
Other languages
English (en)
Other versions
CN118072873B (zh
Inventor
张舒
张克萌
王杨
陈雁
张翀
谢文波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Petroleum University
Original Assignee
Southwest Petroleum University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Petroleum University filed Critical Southwest Petroleum University
Priority to CN202410472238.8A priority Critical patent/CN118072873B/zh
Publication of CN118072873A publication Critical patent/CN118072873A/zh
Application granted granted Critical
Publication of CN118072873B publication Critical patent/CN118072873B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种空气质量预测方法,属于空气预测技术领域,该方法从已监测站点获取历史时间序列数据,并其进行预处理;结合所有监测站点的地理位置信息数据,构建时空网络邻接矩阵;构建时空图生成对抗网络的生成器和判别器;利用已监测站点的历史时间序列数据以及地理位置信息数据,训练时空图生成对抗网络;利用已训练的时空图生成对抗网络,对未监测站点区域的空气质量进行预测。本发明通过构建并优化一个时空图生成对抗网络,能准确地利用稀疏的空气质量监测数据来预测整个城市或区域的空气质量。这不仅为地区规划和公共健康管理提供了强有力的工具,还为环境监测和管理提供了一种更高效、经济的方法。

Description

一种空气质量预测方法
技术领域
本发明属于空气质量预测技术领域,尤其涉及一种空气质量预测方法。
背景技术
传统的数据分析方法往往依赖于分布密集的监测站点以及移动的监测设备检测到大量的数据,这种方法虽然可以提供较为准确的局部空气质量信息,但部署和维护大量的监测站需要显著的资金投入。并且大规模监测网络的维护是一项复杂且耗时的任务,尤其是在遭遇恶劣天气或地理位置偏远的情况下无法部署。更重要的是处理和分析来自大量监测站的数据需要高级的数据管理系统和专业技术支持。即使是大规模的监测网络,也可能无法覆盖所有关键区域,尤其是在偏远或难以访问的地区。
现有技术中,针对目前大多数模型均未对已监测区域的空气质量进行预测,而少有对未监测区域进行预测的问题,综合考虑气象因素、空间相关性和时间依赖性对空气质量的影响,提出了一种联合训练模型 MLP&ST(MLP&spatial-temporal),模拟预测某市未监测区域未来时刻的空气质量指数。存在以下一些缺点:
(1)局限于特定空气质量指数预测:MLP&ST 模型主要用于预测空气质量指数(AQI),而不考虑其他空气污染物的浓度。这限制了其在某些应用场景下的适用性,特别是需要详细了解不同污染物浓度的情况。
(2)未充分考虑减少监测成本:MLP&ST 模型没有充分考虑如何利用有限监测站点数据来预测更大范围的空气质量,以及如何减少监测成本的问题。
发明内容
针对现有技术中的上述不足,本发明提供的一种空气质量预测方法,解决了使用有限的监测站点数据来预测大范围(包括未监测区域)空气质量的问题,同时减少建立和维护监测网络的成本。
为了达到以上目的,本发明采用的技术方案为:一种空气质量预测方法,包括以下步骤:
S1、从已监测站点获取历史时间序列数据,并对历史时间序列数据进行预处理;
S2、根据经预处理后的历史时间序列数据,结合所有监测站点的地理位置信息数据,构建时空网络邻接矩阵;
S3、基于时空网络邻接矩阵,构建时空图生成对抗网络的生成器和判别器;
S4、根据构建的生成器和判别器,利用已监测站点的历史时间序列数据,以及所有监测站点的地理位置信息数据,训练时空图生成对抗网络,其中,所有监测站点包括已监测站点和未监测站点;
S5、利用已训练的时空图生成对抗网络,对未监测站点区域的空气质量进行预测。
本发明的有益效果是:本发明利用时空图神经网络和生成对抗网络相结合的优势,更有效地捕捉了空气质量数据之间的时空关联性和复杂关系,从而提高了空气质量预测的准确性;传统方法往往依赖于密集的监测站点和大量的移动监测设备产生数据,而本发明利用时空图生成对抗网络填补监测网络中的空白区域,插值缺失数据,从而能够预测多种空气污染物的浓度,如浓度、/>浓度、/>浓度、/>浓度、/>浓度以及/>浓度等,为空气质量监测提供了更全面的数据支持;传统监测方法需要大量监测站点和设备,这导致了显著的资金投入和维护成本。相比之下,本发明通过时空图生成对抗网络,利用少数监测站点数据预测更大范围的空气质量,填补监测网络中的空白区域,从而有效降低了监测成本。
进一步地,所述S1包括以下步骤:
S101、从各已监测站点获取不同污染物浓度的历史时间序列数据;
S102、从各已监测站点获取不同气象数据的历史时间序列数据;
S103、对S101和S102获取的历史时间序列数据进行预处理。
上述进一步方案的有益效果是:本发明通过对历史时间序列数据进行预处理,能提高历史时间序列数据质量,保证后续分析的准确性。历史时间序列数据预处理也包括时间序列的构建,这有可以揭示污染物浓度和气象条件随时间的变化趋势。
再进一步地,所述S2包括以下步骤:
S201、将所有监测站点的地理位置信息数据作为时空图神经网络节点,其中,所有监测站点包括已监测站点和未监测站点;
S202、根据已监测站点之间的地理位置信息数据和气象数据,构建边的集合;
S203、结合已监测站点的污染物浓度的权重、相似度Jaccard的权重以及时空图神经网络节点间的欧几里得距离的权重,为每条边计算总权重;
S204、根据S201-S203得到的结果,构建带权图G;
S205、根据构建的带权图G,定义时空网络邻接矩阵,并对时空网络邻接矩阵进行归一化处理,完成时空网络邻接矩阵的构建。
上述进一步方案的有益效果是:通过获取所有监测站点的地理位置信息,并将这些地理位信息用作空间维度的输入参数和时空图的节点,提高空间分辨率,增强时空相关性建模,提升数据处理效率。
再进一步地,所述时空网络邻接矩阵的表达式如下:;其中,/>表示时空网络邻接矩阵,、/>和/>均表示权重系数,/>、/>和/>分别表示污染物浓度权重,相似度Jaccard权重以及时空图神经网络节点间欧几里得距离的权重。
上述进一步方案的有益效果是:本发明通过构建时空网络邻接矩阵,增强模型泛化能力,更准确的空间分辨率,减少数据需求。
再进一步地,所述时空图生成对抗网络的生成器包括:
空间特征提取模块,用于根据时空网络邻接矩阵,利用图卷积神经网络提取监测站点数据的空间特征,其中,监测站点数据包括已监测站点的历史时间序列数据和所有监测站点的地理位置信息数据;
时域特征提取模块,用于根据历史时间序列数据,利用长短期记忆网络提取监测站点数据的时域特征,其中,监测站点数据包括已监测站点的历史时间序列数据和已监测站点的地理位置信息数据;
特征整合层,用于利用多层感知机,整合空间特征和时域特征;
第一输出层,用于输出整合后的特征。
上述进一步方案的有益效果是:增强特征提取能力,提高准确性和鲁棒性,模型泛化改善。
再进一步地,所述时空图生成对抗网络的生成器的损失函数的表达式如下:;其中,/>表示时空图生成对抗网络的生成器的损失函数,/>表示样本数量,/>表示第/>个样本,/>表示生成器对/>的预测向量,/>表示真实标签向量,/>表示向量的L2范数,/>表示第/>个样本的输入向量。
上述进一步方案的有益效果是:本发明通过损失函数反馈,判断模型性能,提高准确性。
再进一步地,所述时空图生成对抗网络的判别器的判别过程表达式如下:;/>;/>;其中,/>、/>和/>均表示时空图生成对抗网络中连续层的输出,表示判别器对于X的输出,X表示时间序列数据,/>表示修正线性单元激活函数数,/>表示逻辑S型激活函数,/>、/>、/>和/>分别表示第一个隐藏层、第一个隐藏层到第二个隐藏层、第二个隐藏层到第三个隐藏层以及第三个隐藏层到第二输出层的连接,/>、/>、/>以及/>均表示偏置向量,/>表示生成器生成的向量。
再进一步地,所述时空图生成对抗网络的判别器的损失函数的表达式如下:;其中,/>表示时空图生成对抗网络的判别器的损失函数,/>表示样本数量,/>表示第/>个样本,/>表示生成器对/>的预测向量,/>表示真实标签向量,/>表示向量的L2范数,/>表示第/>个样本的输入向量。
附图说明
图1为本发明的方法流程图。
图2为生成器的结构示意图。
图3为判别器的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例
如图1所示,本发明提供了一种空气质量预测方法,其实现方法如下:
S1、从已监测站点获取历史时间序列数据,并对历史时间序列数据进行预处理,其实现方法如下:
S101、从各已监测站点获取不同污染物浓度的历史时间序列数据;
S102、从各已监测站点获取不同气象数据的历史时间序列数据;
S103、对S101和S102获取的历史时间序列数据进行预处理;
S2、根据经预处理后的历史时间序列数据,结合所有监测站点的地理位置信息数据,构建时空网络邻接矩阵,其实现方法如下:
S201、将所有监测站点的地理位置信息数据作为时空图神经网络节点,其中,所有监测站点包括已监测站点和未监测站点;
S202、根据已监测站点之间的地理位置信息数据和气象数据,构建边的集合;
S203、结合已监测站点的污染物浓度的权重、相似度Jaccard的权重以及时空图神经网络节点间的欧几里得距离的权重,为每条边计算总权重;
S204、根据S201-S203得到的结果,构建带权图G;
S205、根据构建的带权图G,定义时空网络邻接矩阵,并对时空网络邻接矩阵进行归一化处理,完成时空网络邻接矩阵的构建;
S3、基于时空网络邻接矩阵,构建时空图生成对抗网络的生成器和判别器;
所述时空图生成对抗网络的生成器包括:
空间特征提取模块,用于根据时空网络邻接矩阵,利用图卷积神经网络提取监测站点数据的空间特征,其中,监测站点数据包括已监测站点的历史时间序列数据和所有监测站点的地理位置信息数据;
时域特征提取模块,用于根据历史时间序列数据,利用长短期记忆网络提取监测站点数据的时域特征,其中,监测站点数据包括已监测站点的历史时间序列数据和已监测站点的地理位置信息数据;
特征整合层,用于利用多层感知机,整合空间特征和时域特征;
第一输出层,用于输出整合后的特征;
S4、根据构建的生成器和判别器,利用已监测站点的历史时间序列数据,以及所有监测站点的地理位置信息数据,训练时空图生成对抗网络,其中,所有监测站点包括已监测站点和未监测站点;
S5、利用已训练的时空图生成对抗网络,对未监测站点区域的空气质量进行预测。
本实施例中,本发明采用时空图生成对抗网络对未监测区域的空气质量进行预测。具体而言,首先收集已监测区域的地理信息数据、空气污染浓度因子和气象数据,其中,已监测区域数据作为训练数据,未监测区域数据作为预测目标。随后,利用了时空图生成对抗网络模型,分析已监测区域和未监测区域之间的时间依赖性和空间相关性。在模型训练过程中,将已监测区域的地理信息数据、空气污染因子浓度和气象数据作为输入,以学习时间依赖性和空间相关性。最终,利用所学到的模式和关联,对未监测区域进行预测,生成各个未监测区域的空气质量数据。
本实施例中,从各已监测站点获取历史时间序列数据,包括空气污染物因子浓度和气象因子。对历史时间序列数据进行预处理,并将其划分为训练集、验证集和测试集,作为时空维度的输入参数。
本实施例中,污染物浓度数据采集和处理:各个监测站点下不同污染物浓度的历史时间序列数据包括浓度、/>浓度、/>浓度、/>浓度、/>浓度以及/>浓度。
构建污染物浓度变化矩阵;其中,/>表示在t+n时刻该污染物的浓度,/>表示在t+n时刻该污染物的浓度,/>表示在t+n时刻该污染物的浓度,/>表示在t+n时刻该污染物的浓度,/>表示在t+n时刻该污染物的浓度,/>表示在t+n时刻该污染物的浓度,每一行代表一个监测站,每一列代表一个污染物浓度。t时刻的浓度位于第一行,t+1时刻的浓度位于第二行,以此类推。这个矩阵中的元素是具体的浓度数值,n表示第n个时刻。
气象数据的采集和处理:各个已监测站点下不同气象数据的历史时间序列数据,包括:温度、湿度、风速、风向和降水。
构建气象变化矩阵:/>;其中,表示在t+n时刻该气象条件数据,/>表示在t+n时刻该气象条件数据,/>表示在t+n时刻该气象条件数据,/>表示在t+n时刻该气象条件数据,/>表示在t+n时刻该气象条件数据,每一行代表一个监测站,每一列代表一个气象因素。t时刻的气象因素位于第一行,t+1时刻的气象因素位于第二行,以此类推。这个矩阵中的元素是具体的气象因素数值。T表示温度,H表示湿度,WS表示风速,WD表示风向,P表示降水,n表示第n个时刻。每一行对应一个监测站,每一列对应特定时间的气象因素。
数据预处理:处理缺失值:检查数据是否存在缺失值,并选择适当的方法填充或删除这些缺失值。处理异常值:识别和处理可能是异常的数据点,以防止它们对模型产生负面影响。时间对齐:确保时序数据的时间戳是对齐的,以便更容易进行时间序列分析和建模。
训练集、验证集、测试集划分:按照7∶2∶1的比例将原始数据集划分为训练集、验证集和测试集;
数据归一化:为了使所有特征都在相似的尺度上,一搬采用归一化将其缩放在[0,1]范围内,对于特殊情况如温度可以将其缩放在[-1,1]的范围内。;其中,/>表示原始值,/>表示归一化后的值,/>表示数据集中的最大值,/>表示数据集中的最小值。
本实施例中,时空图网络邻接矩阵的构建:获取所有监测站点的地理位置信息数据,包括经纬度,构建相应的时空图结构,作为空间维度的输入参数。
获取所有监测站点地理位置信息(所有监测站点包括已监测站点和未监测站点),将其作为时空图神经网络节点,根据已监测站点之间的距离、风速、风向、温度、湿度、降水来构建边的集合,根据已监测站点的污染物浓度、相似度jaccard和时空图神经网络节点间的欧几里得距离综合计算权重。
构建带权图G={V,E,A};其中,节点集合V包含所有监测站的空间地理信息(坐标),边集合E包含已监测站直接的空间距离、气象因素(温度、湿度、风向、风速和降水),节点之间的连接关系由边集合E表示,而这些边上具有权重,权重由已监测站直接的空气污染浓度、相似度Jaccard和时空图神经网络节点间的欧几里得距离的综合权重构成。
定义邻接矩阵:;其中,表示时空网络邻接矩阵,/>、/>和/>均表示权重系数用于调整各个因素对最终权重的贡献,/>、/>和/>分别表示污染物浓度权重,相似度Jaccard权重以及时空图神经网络节点间欧几里得距离权重。
对以上邻接矩阵进行归一化处理:矩阵归一化:/>;其中,/>表示邻接矩阵中A的第i行第j列元素,代表节点i到节点j的连接权重,k表示第k个节点,使用上述公式分别对行列进行归一化处理,归一化后的邻接矩阵中第i行第j列的元素,n表示节点的数量。邻接矩阵A表示节点的连接关系和边上的权重。
本实施例中,构建完整时空图生成对抗网络的生成器:采用时空图神经网络STGNN作为生成对抗网络的生成器,对已监测站点和所有监测站点数据进行空间特征和时域特征提取;其中,利用时空图神经网络STGNN提取特征步骤如下:
时空图神经网络STGNN的框架由一个空间特征提取模块,时域特征提取模块,特征整合层和一个输出层组成。生成器结构如图2所示。
空间特征提取模块:使用空间特征提取模块来处理已监测站点的历史时间序列数据和已监测站点的地理位置信息数据的空间特征。图卷积神经网络GCN来处理这些空间特征。对于监测站点数据,将站点视为图的节点,站点之间的连接或距离视为图的边。图卷积神经网络GCN可以从每个监测站点的观测值中提取空间特征,以捕获不同站点之间的关系和空间结构。
本实施例中,加入图神经网络提取空间特征,提取空间特征步骤如下:
1. 图卷积操作:定义图卷积操作,它通过邻接矩阵/>将节点特征进行更新。假设/>是第/>层的节点特征矩阵,则图卷积操作/>可以表示为:/>
2. 多层图卷积:可以堆叠多个图卷积层,以逐步提取更高层次的空间特征。
3. 空间特征提取:最终的节点表示(/>表示图卷积层数)包含了从输入特征中学到的空间特征。这可以作为提取到的空间特征的表示。其中,/>是第/>层的节点特征矩阵,/>表示图卷积操作,/>表示邻接矩阵,/>表示图卷积层数。通过多层的图卷积操作,网络可以逐步提取和传播节点的空间特征。
时域特征提取模块:时域特征提取模块用于处理已监测站点数据的时域特征。使用长短期记忆网络模型LSTM,以捕获时间序列数据中的时间依赖性和趋势。加入长短期记忆网络模型LSTM进行时间特征提取,其中时间特征提取步骤如下:
初始化:给定一个时间序列数据,其中,/>表示时间步/>的输入特征向量。初始时刻的隐藏状态/>和记忆单元/>为零向量。
参数:长短期记忆网络模型LSTM包含一组参数,包括权重矩阵和偏置项/>
输入门(Input Gate):输入门决定更新记忆单元的程度。其计算过程如下:;其中,/>表示激活函数,/>表示时间步/>的输入特征向量,/>表示在时间步t-1的隐藏状态向量,/>表示偏置向量。
遗忘门(Forget Gate):遗忘门决定保留或遗忘前一时刻的记忆。其计算过程如下:;其中,/>表示在长短期记忆网络模型LSTM中,时间步t的遗忘门forget gate的激活值,/>表示遗忘门的权重矩阵,为神经网络中的参数,通过训练得到优化,/>表示遗忘门的偏置向量,通过训练得到优化的参数。
记忆单元更新:记忆单元更新如下:/>;其中,/>表示细胞状态的权重矩阵,用于当前时间步的输入和前一隐藏状态的组合,/>表示细胞状态的偏置向量,/>表示时间步t-1的细胞状态,/>表示在时间步t-1的输入门激活值,决定了多少新信息被添加到细胞状态中。
输出门(Output Gate):输出门决定隐藏状态的更新,其计算过程如下:
隐藏状态更新:隐藏状态更新如下:/>;其中,/>、/>、/>分别表示对应输入门、遗忘门和输出门的开关状态,/>表示候选细胞状态,/>表示当前时刻的细胞状态/>表示当前时刻的隐藏状态,/>表示输入序列在当前时刻的值,/>和/>分别表示权重和偏置,/>表示sigmoid 函数,/>表示双曲正切函数。
时间特征提取:在时间序列的最后一个时间步,提取隐藏状态/>作为时间特征。
特征整合层:
引入多层感知机MLP结构作为特征整合层,特征整合层用于整合从空间特征提取模块和时域特征提取模块中提取的特征,空间特征和时域特征分别作为引入多层感知机MLP结构的输入。这些特征可以是通过图卷积神经网络GCN和长短期记忆网络模型LSTM提取得到的高维特征表示。
输入的空间特征由图卷积神经网络GCN输出的向量表示为,维度为/>,时域特征由长短期记忆网络模型LSTM输出的向量表示为/>,维度为/>
多层感知机MLP结构如下:;/>;/>;/>;其中,/>表示输入层的输出,是空间特征和时域特征的连接,/>、/>和/>分别表示三个隐藏层的输出,通过ReLU激活函数处理,/>、/>、/>以及/>、/>、/>分别表示三个隐藏层的权重矩阵和偏置向量,/>和/>分别表示输出层的权重矩阵和偏置向量,/>表示输出层的权重矩阵和偏置向量。
多层感知机MLP结构包含了三个隐藏层,每个隐藏层都有 100 个神经元,整合后的特征表示可以作为生成器的输入。
第一输出层:第一输出层是一个具有单个神经元的全连接层,该神经元的输出表示预测的时间序列下一个时间点的值。
经过空间特征提取,时域特征提取和特征整合后。数据最后进入到输出层,具有m个神经元的全连接层作为输出层(m为预测的变量个数),输出层会为每个要预测的变量分配一个神经元。输出层的计算可以表示为:;其中,/>表示生成器预测的时间序列下一个时间点的值。/>表示特征整合后的输入,/>表示输出层的权重矩阵,维度为/>,/>表示特征整合后的输入的维度,/>表示输出层的偏置向量,维度为m(预测变量数)。
生成器生成数据后,通过时空图生成对抗网络的生成器的损失函数对生成的数据和真实数据计算平均差值,并希望时空图生成对抗网络的生成器的损失函数/>尽可能小,生成器的损失函数/>定义如下:/>;其中,/>表示时空图生成对抗网络的生成器的损失函数,/>表示样本数量,/>表示第/>个样本,/>表示生成器对/>的预测向量,/>表示真实标签向量,/>表示向量的L2范数,/>表示第/>个样本的输入向量。
本实施例中,构建时空图生成对抗网络的判别器:时空图生成对抗网络的判别器用于判别生成器生成的数据的真假,判别器采用构造四层的全连接神经网络来判别生成器输出预测数据的真假,输入数据维度为D,输出数据维度是1(表示真假的标签)判别器结构如下图3所示。
输入层:输入维度为D。
第一隐藏层、第二隐藏层和第三隐藏层均包含个神经元,使用ReLU激活函数;
输入层为一个神经元,使用Sigmoid激活函数,输出一个0到1之间的值,表示输入数据是真实数据的概率。
判别器的整体结构如下:
输入层(Input) ->第一隐藏层(Hidden Layer 1) ->第二隐藏层(Hidden Layer2) ->第三隐藏层(Hidden Layer 3) ->第二输出层(Output Layer)。
判别器判别过程表示如下:;/>;/>;其中,/>、/>和/>均表示时空图生成对抗网络中连续层的输出,/>表示判别器对于X的输出,X表示时间序列数据,/>表示修正线性单元激活函数数,/>表示逻辑S型激活函数,/>、/>、/>和/>分别表示第一个隐藏层、第一个隐藏层到第二个隐藏层、第二个隐藏层到第三个隐藏层以及第三个隐藏层到第二输出层的连接,/>、/>、/>以及/>均表示偏置向量,/>表示生成器生成的向量。
本实施例中,在时空图生成对抗网络中,生成器的使用分两个过程,首先用真实数据和生成数据作为输入对其训练,让其能够识别出真实数据的特征,要使判别器训练的输出时空图生成对抗网络的判别器的损失函数尽可能小,时空图生成对抗网络的判别器的损失函数定义如下:/>;其中,/>表示时空图生成对抗网络的判别器的损失函数,/>表示样本数量,/>表示第/>个样本,/>表示生成器对/>的预测向量,/>表示真实标签向量,/>表示向量的L2范数,/>表示第/>个样本的输入向量。
本实施例中,生成器用于预测空气质量,而判别器则用于区分预测的数据和真实的监测数据。
本实施例中,构建完整的时空图生成对抗网络生成预测空气质量数据:时空图对抗生成网络根据输入的历史监测数据和地理信息数据,不断的生成预测数据,最终生成最接近真实数据的空气质量数据,同时使用相关系数分析衡量生成的数据与真实数据之间的线性相关性。相关系数越接近1,表示两者之间的线性关系越强,预测准确度越高。
综上,本发明设计了时空图生成对抗网络,其结合了时空图神经网络ST-GNN和生成对抗网络GAN,通过学习监测站数据中的时空模式和关联,能够有效应对上述问题带来的挑战。时空图神经网络能够在时空维度上捕获数据的复杂关系,实现对监测站数据的有效建模和分析。生成对抗网络GAN能够生成具有近似真实的数据,填补监测网络中的空白区域,并插值缺失数据,增强数据的完整性和多样性,从而扩展监测网络的覆盖范围,适应不规则布局以及进行全局优化,从而提高了空气质量监测的准确性和可靠性。
本发明的有益效果:
(1)更全面的空气质量数据:传统方法往往依赖于密集的监测站点和大量的移动监测设备产生数据,而时空图生成对抗网络技术方案通过生成对抗网络填补监测网络中的空白区域,插值缺失数据,从而能够预测多种空气污染物的浓度,如浓度、/>浓度、浓度、/>浓度、/>浓度以及/>浓度等,为空气质量监测提供了更全面的数据支持。
(2)降低监测成本:传统监测方法需要大量监测站点和设备,这导致了显著的资金投入和维护成本。相比之下,时空图生成对抗网络技术方案利用少数监测站点数据预测更大范围的空气质量,填补监测网络中的空白区域,从而有效降低了监测成本。
(3)提高预测准确性:时空图生成对抗网络技术方案利用时空图神经网络和生成对抗网络相结合的优势,更有效地捕捉了空气质量数据之间的时空关联性和复杂关系,从而提高了空气质量预测的准确性。
(4)适应不规则布局和全局优化:传统方法可能受到监测站点布局的限制,而时空图生成对抗网络技术方案能够适应不规则布局的监测站点,并进行全局优化,提高了空气质量监测的效率和精度。

Claims (8)

1.一种空气质量预测方法,其特征在于,包括以下步骤:
S1、从已监测站点获取历史时间序列数据,并对历史时间序列数据进行预处理;
S2、根据经预处理后的历史时间序列数据,结合所有监测站点的地理位置信息数据,构建时空网络邻接矩阵;
S3、基于时空网络邻接矩阵,构建时空图生成对抗网络的生成器和判别器;
S4、根据构建的生成器和判别器,利用已监测站点的历史时间序列数据,以及所有监测站点的地理位置信息数据,训练时空图生成对抗网络,其中,所有监测站点包括已监测站点和未监测站点;
S5、利用已训练的时空图生成对抗网络,对未监测站点区域的空气质量进行预测。
2.根据权利要求1所述的空气质量预测方法,其特征在于,所述S1包括以下步骤:
S101、从各已监测站点获取不同污染物浓度的历史时间序列数据;
S102、从各已监测站点获取不同气象数据的历史时间序列数据;
S103、对S101和S102获取的历史时间序列数据进行预处理。
3.根据权利要求1所述的空气质量预测方法,其特征在于,所述S2包括以下步骤:
S201、将所有监测站点的地理位置信息数据作为时空图神经网络节点,其中,所有监测站点包括已监测站点和未监测站点;
S202、根据已监测站点之间的地理位置信息数据和气象数据,构建边的集合;
S203、结合已监测站点的污染物浓度的权重、相似度Jaccard的权重以及时空图神经网络节点间的欧几里得距离的权重,为每条边计算总权重;
S204、根据S201-S203得到的结果,构建带权图G;
S205、根据构建的带权图G,定义时空网络邻接矩阵,并对时空网络邻接矩阵进行归一化处理,完成时空网络邻接矩阵的构建。
4.根据权利要求3所述的空气质量预测方法,其特征在于,所述时空网络邻接矩阵的表达式如下:
其中,表示时空网络邻接矩阵,/>、/>和/>均表示权重系数,/>、/>分别表示污染物浓度权重,相似度Jaccard权重以及时空图神经网络节点间欧几里得距离的权重。
5.根据权利要求1所述的空气质量预测方法,其特征在于,所述时空图生成对抗网络的生成器包括:
空间特征提取模块,用于根据时空网络邻接矩阵,利用图卷积神经网络提取监测站点数据的空间特征,其中,监测站点数据包括已监测站点的历史时间序列数据和所有监测站点的地理位置信息数据;
时域特征提取模块,用于根据历史时间序列数据,利用长短期记忆网络提取监测站点数据的时域特征,其中,监测站点数据包括已监测站点的历史时间序列数据和已监测站点的地理位置信息数据;
特征整合层,用于利用多层感知机,整合空间特征和时域特征;
第一输出层,用于输出整合后的特征。
6.根据权利要求5所述的空气质量预测方法,其特征在于,所述时空图生成对抗网络的生成器的损失函数的表达式如下:
其中,表示时空图生成对抗网络的生成器的损失函数,/>表示样本数量,/>表示第个样本,/>表示生成器对/>的预测向量,/>表示真实标签向量,/>表示向量的L2范数,/>表示第/>个样本的输入向量。
7.根据权利要求1所述的空气质量预测方法,其特征在于,所述时空图生成对抗网络的判别器的判别过程表达式如下:
其中,、/>和/>均表示时空图生成对抗网络中连续层的输出,/>表示判别器对于X的输出,X表示时间序列数据,/>表示修正线性单元激活函数数,表示逻辑S型激活函数,/>、/>、/>和/>分别表示第一个隐藏层、第一个隐藏层到第二个隐藏层、第二个隐藏层到第三个隐藏层以及第三个隐藏层到第二输出层的连接,/>、/>、/>以及/>均表示偏置向量,/>表示生成器生成的向量。
8.根据权利要求1所述的空气质量预测方法,其特征在于,所述时空图生成对抗网络的判别器的损失函数的表达式如下:
其中,表示时空图生成对抗网络的判别器的损失函数,/>表示样本数量,/>表示第个样本,/>表示生成器对/>的预测向量,/>表示真实标签向量,/>表示向量的L2范数,/>表示第/>个样本的输入向量。
CN202410472238.8A 2024-04-19 2024-04-19 一种空气质量预测方法 Active CN118072873B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410472238.8A CN118072873B (zh) 2024-04-19 2024-04-19 一种空气质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410472238.8A CN118072873B (zh) 2024-04-19 2024-04-19 一种空气质量预测方法

Publications (2)

Publication Number Publication Date
CN118072873A true CN118072873A (zh) 2024-05-24
CN118072873B CN118072873B (zh) 2024-07-05

Family

ID=91104120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410472238.8A Active CN118072873B (zh) 2024-04-19 2024-04-19 一种空气质量预测方法

Country Status (1)

Country Link
CN (1) CN118072873B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113919231A (zh) * 2021-10-25 2022-01-11 北京航天创智科技有限公司 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统
CN114565136A (zh) * 2022-01-27 2022-05-31 内蒙古工业大学 一种基于生成对抗网络的空气质量预测优化方法
WO2022217839A1 (zh) * 2021-04-14 2022-10-20 江南大学 一种基于深度时空相似性的空气质量预测方法
CN116913409A (zh) * 2023-07-11 2023-10-20 上海缔安科技股份有限公司 一种基于生成对抗网络的颗粒污染预测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022217839A1 (zh) * 2021-04-14 2022-10-20 江南大学 一种基于深度时空相似性的空气质量预测方法
CN113919231A (zh) * 2021-10-25 2022-01-11 北京航天创智科技有限公司 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统
CN114565136A (zh) * 2022-01-27 2022-05-31 内蒙古工业大学 一种基于生成对抗网络的空气质量预测优化方法
CN116913409A (zh) * 2023-07-11 2023-10-20 上海缔安科技股份有限公司 一种基于生成对抗网络的颗粒污染预测方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZAHRA-SADAT ASAEI-MOAMAM等: "Air quality particulate-pollution prediction applying GAN network and the Neural Turing Machine", 《APPLIED SOFT COMPUTING》, vol. 147, 22 August 2023 (2023-08-22), pages 110723 *
汪祖民等: "基于生成对抗网络模型的小样本PM2.5预测", 《计算机应用与软件》, vol. 40, no. 10, 31 October 2023 (2023-10-31), pages 114 - 119 *
许镇义: "基于时空数据挖掘的城市移动源污染综合监管问题研究", 《中国博士学位论文全文数据库 工程科技I辑》, no. 1, 15 January 2021 (2021-01-15), pages 027 - 130 *

Also Published As

Publication number Publication date
CN118072873B (zh) 2024-07-05

Similar Documents

Publication Publication Date Title
Qin et al. A novel combined prediction scheme based on CNN and LSTM for urban PM 2.5 concentration
Ma et al. Spatiotemporal prediction of PM2. 5 concentrations at different time granularities using IDW-BLSTM
US11270579B2 (en) Transportation network speed foreeasting method using deep capsule networks with nested LSTM models
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
Zhang et al. A graph-based temporal attention framework for multi-sensor traffic flow forecasting
CN109063908B (zh) 一种基于深度多任务学习的城市aqi预测与空间细粒度aqi等级估计方法
CN111832814A (zh) 一种基于图注意力机制的空气污染物浓度预测方法
Zhu et al. Investigation of nearby monitoring station for hourly PM2. 5 forecasting using parallel multi-input 1D-CNN-biLSTM
Wu et al. A hybrid support vector regression approach for rainfall forecasting using particle swarm optimization and projection pursuit technology
CN115618296A (zh) 一种基于图注意力网络的大坝监测时序数据异常检测方法
CN112508265A (zh) 面向业务流程管理的时间与活动多任务预测方法及系统
CN115376317B (zh) 一种基于动态图卷积和时序卷积网络的交通流预测方法
CN111815075B (zh) 一种重大公共卫生事件下交通出行需求的预测方法
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
Hu et al. Air quality prediction using spatio-temporal deep learning
Haputhanthri et al. Short-term traffic forecasting using LSTM-based deep learning models
CN117556197A (zh) 一种基于人工智能的台风涡旋初始化方法
CN114973019A (zh) 一种基于深度学习的地理空间信息变化检测分类方法及系统
CN117233869B (zh) 一种基于GRU-BiTCN的站点短期风速预测方法
Kim et al. Massive scale deep learning for detecting extreme climate events
Misra et al. Statistical downscaling of high-resolution precipitation in India using convolutional long short-term memory networks
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
CN117077843A (zh) 基于CBAM-CNN-Transformer的时空注意力细粒度PM2.5浓度预测方法
CN117131991A (zh) 基于混合神经网络的城市降雨量预测方法及平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant