CN114240000A - 一种基于时空图卷积网络的空气质量预测方法 - Google Patents

一种基于时空图卷积网络的空气质量预测方法 Download PDF

Info

Publication number
CN114240000A
CN114240000A CN202111669087.8A CN202111669087A CN114240000A CN 114240000 A CN114240000 A CN 114240000A CN 202111669087 A CN202111669087 A CN 202111669087A CN 114240000 A CN114240000 A CN 114240000A
Authority
CN
China
Prior art keywords
time
space
data
convolution
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111669087.8A
Other languages
English (en)
Inventor
刘博�
王明烁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202111669087.8A priority Critical patent/CN114240000A/zh
Publication of CN114240000A publication Critical patent/CN114240000A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于时空图卷积网络的空气质量预测方法,首先对数据集中各监测站点下的时序数据进行预处理,包括污染物浓度和气象因子观测值,并划分训练集、验证集和测试集;根据各监测站点的经纬度坐标构建邻接矩阵,然后一并输入至时空注意力机制卷积单元中。利用时空注意力机制捕获时空维度的动态相关性,通过在时间维度部署标准卷积和在空间维度部署图卷积网络分别捕获时空维度的特征及依赖。最后连接一层全连接层得到最终的输出。本发明可以更好的捕获数据中的时空特征及动态变化,纯卷积结构可以提高运算效率,减少因循环导致的误差积累,从而更好的完成预测任务。

Description

一种基于时空图卷积网络的空气质量预测方法
技术领域
本发明属于数据挖掘技术领域,特别涉及一种基于时空图卷积网络的空气质量预测方法。
背景技术
空气质量数据属于时空序列数据,同时具有时间和空间特性。目前空气质量预测的方法 主要是基于传统参数的时间序列预测方法,例如差分自回归移动平均模型(Autoregressive Integrated MovingAverage Model,ARIMA)。通过计算物质守恒方程对大气中的污染物进行 数值计算,旨在模拟一种真实的大气环境,并根据大气环境下的变化呈现出不同的预测结果, 但该类方法忽略了空气质量数据的空间信息,且需要研究人员具有充分的先验知识,事先选 定参数模型,并通过大量计算求解出相应的参数,速度较慢,且预测的准确率不高。在现今 的大数据时代,基于机器学习的预测方法已被广泛应用。Shuyue Zhang等【1】于2020年使 用长短期记忆网络(Long Short-Term Memory,LSTM)对空气质量进行预测,TAOYING LI 等【2】在LSTM的基础之上融合了卷积神经网络(Convolutional Neural Networks,CNN), 利用CNN直接有效地提取空气质量相关特征,利用LSTM学习输入时间序列数据的长期历 史过程,均得到较好的预测效果。LSTM是一种特殊的循环神经网络(Recurrent Neural Network, RNN),通过使用上一时刻学习得到的信息进行当前时刻的学习,从而可以很好地解决长时间 依赖问题。
何加伟等【3】提出一种空气质量指数AQI的预测方法和装置,使用网格划分的方法融入 地理位置信息,提高了预测AQI的准确度。但人为划分网格的方法较机械,无法使模型灵活 的学习得到动态的空间特征,且时间特征和空间特征提取相对割裂,预测准确率不高。
发明内容
针对上述现有技术中的不足,本发明提出一种基于时空图卷积网络的空气质量预测方法。 通过引入时空维度注意力机制以更好的关注空气质量时空序列数据中的动态相关性,同时在 时间维度部署一维卷积以挖掘时间时序数据中的时间相关性,在空间维度部署图卷积网络以 挖掘各站点间的空间相关性,从而对空气质量时空序列数据完成更加精准的预测任务。
本发明提出的一种基于时空图卷积网络的空气质量预测方法,首先将收集得到的数据集 中的时间序列数据以及监测站点本身固有的空间数据分开处理。将时间序列数据进行缺失值 填充等预处理工作,然后划分训练集、验证集和测试集,得到时间维度的输入数据。根据监 测站点的空间位置数据得到带权邻接矩阵,得到全部监测站点在图结构上的统一表征,即空 间维度的输入数据。然后将时空数据一并输入至时空注意力机制卷积单元中,该单元包括时 空注意力机制层和时空卷积层。其中,利用时空注意力机制分别对时间维度和空间维度的重 点信息给予更多的关注,从而获得更多的关键细节信息,提高模型对时空动态相关性的提取 能力。在时空特征提取方面均采用卷积方式,通过在时间维度部署一维卷积层,可以在捕获 时序特征的基础之上,减少随着预测步长增加所导致的误差累积现象,同时可以提高预测性 能;空间维度则采用图卷积网络以适应各监测站点组成的非结构化拓扑图结构。最后连接一 个全连接层,从而得到完整的基于时空图卷积网络的空气质量预测方法。
一种基于时空图卷积网络的空气质量预测方法,包括以下步骤:
步骤1、获取各监测站点的空气污染物因子浓度以及气象因子的历史时间序列数据,进行 数据预处理,而后划分训练集、验证集和测试集,并作为时间维度的输入参量;
步骤2、获取各监测站点的地理位置信息数据,包括经纬度信息等,构建相应的图结构, 并作为空间维度的输入参量;
步骤3、将经过所述预处理后的时序数据集与图结构一并输入至时空卷积单元,包括时空 注意力机制模块和时空卷积模块,进行协同训练,以同时捕获时间和空间特性;
步骤4、将所述时空注意力机制模块和时空卷积模块协同训练后,级联一层全连接层,使 模块的输出具有与预测目标相同的维度,从而输出最终的预测结果。
优选地,所述步骤1具体为:
步骤1.1、污染物因子数据采集:同一监测站点下不同污染物因子的历史时序数据,包括 CO、NO2、SO2、O3、PM10、PM2.5,每个时刻污染物浓度向量为χt1= {Ct(CO),Ct(NO2),Ct(SO2),Ct(O3),Ct(PM10),Ct(PM2.5)},向量中每个值代表不同污染物因子在 t时刻的浓度值;
步骤1.2、气象因子数据采集:同一监测站点下不同气象因子的历史时间序列数据,包括 温度、风力、降雨量、湿度,每个时刻气象因子向量为χt2={Tempt,Windt,Raint,Humit}, 向量中每个值代表不同气象因子在t时刻的观测值;
步骤1.3、数据预处理:对上述所采集的空气污染物因子和气象因子的时序数据集进行缺 失值填充和异常值处理,以得到完整可用的数据集;
步骤1.4、训练集、验证集、测试集划分:按照7:2:1的比例将原始数据集划分为训练集、 验证集和测试集;
步骤1.5、数据归一化:利用最大最小归一化算法(Min-Max归一化)对划分好的训练集、 验证集和测试集进行标准化处理,Min-Max标准化公式如下:
Figure BDA0003452426600000021
其中,max(xi)代表数组中的最大值,min(xi)代表数组中的最小值,xi代表转换前的数据,x'i表示经过归一化后的数据;
优选地,所述步骤2具体为:
步骤2.1、监测站点地理位置信息数据采集:收集所有监测站点的空间信息,包括经纬度 信息等;
步骤2.2、图结构构建:根据上述所采集的各监测站点的地理位置信息数据,生成对应的 带权邻接矩阵并构建相应的图结构,以表示地理空间数据的空间关系。图结构表示为:
G=(V,E,A)
其中,G表示无向图,V表示节点集合,E表示边集合,代表节点之间的连接,A∈RN×N表示 节点的邻接矩阵;
优选地,所述步骤3具体为:
步骤3.1、空间注意力机制捕获节点中的动态相关性:将上述已经过数据预处理的历史时 序数据和图结构输入至时空注意力机制模块,由空间注意力机制自适应的捕获节点中的动态 相关性,公式如下:
S=Vs·σ((χP1)P2(P3χ)T+bs)
Figure BDA0003452426600000031
其中,χ∈RN×C×T是时空模块的输入,C是输入时序数据的维度,T是输入时序数据的长度, Vs,bs∈RN×N,P1∈RT,P2∈RC×T,P3∈RC均为可学习参数,sigmoid作为激活函数。根据当前输入动态计算得到空间相关矩阵S,S'i,j表示节点之间的相关强度。在进行图卷积时,同 时使用邻接矩阵A和S'动态调整节点间的权重;
步骤3.2、时间注意力机制捕获时间片间的动态相关性:将上述已经过数据预处理的历史 时序数据和图结构输入至时空注意力机制模块,由时间注意力机制自适应的捕获时间片间的 动态相关性,公式如下:
E=Ve·σ((χQ1)Q2(Q3χ)T+be)
Figure BDA0003452426600000032
其中,Ve,be∈RT*T,Q1∈RN,Q2∈RC*N,Q3∈RC均为可学习参数,时间相关矩阵由不同的输入 决定,E'i,j代表不同时间片间的相关性。然后将通过归一化的时间相关矩阵作为输入,合并相 关信息,动态调整输入得到
Figure BDA0003452426600000033
公式如下:
Figure BDA0003452426600000034
其中,
Figure BDA0003452426600000041
步骤3.3、图卷积捕获邻域空间依赖性:将上述经过时空注意力机制调整后的输出输入至 时空卷积模块,由空间维度的图卷积捕获来自邻域的空间依赖性;
步骤3.3.1、计算图结构的拉普拉斯矩阵并归一化:
L=D-A
其中,L∈RN×N,归一化后为:
Figure BDA0003452426600000042
其中,A是邻接矩阵,IN是单位矩阵,D∈RN×N是度矩阵,由节点的度组成,也是对角矩阵, Dii=∑jAij
步骤3.3.2、拉普拉斯的特征值分解:
L=UΛUT
其中,Λ=diag([λ01,…,λN-1])是对角矩阵,U是傅里叶基;
步骤3.3.3、对节点信号进行图卷积操作,公式如下:
Figure BDA0003452426600000043
其中,*G代表图卷积操作,θ∈RK是多项式系数矩阵,
Figure BDA0003452426600000044
λmax是拉普拉斯矩阵 的最大特征值;
步骤3.3.4、使用线性整流函数(Rectified Linear Unit,ReLU)作为卷积模块的激活函数:
ReLU(gθ*Gχ)
步骤3.4.5、动态调整节点间的相关性:
Figure BDA0003452426600000045
其中,
Figure BDA0003452426600000046
是切比雪夫递归多项式,Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,T1(x)=x;
步骤3.4、标准卷积捕获时间依赖性:将上述图卷积操作后的输出输入至时间卷积模块, 由时间维度的标准卷积合并相邻时间片的信息,并更新节点信息,从而捕获时间依赖性:
Figure BDA0003452426600000047
其中,χ'∈RC×N×T,*代表标注卷积,Φ是标准卷积核的参数,使用ReLU作为激活函数;
步骤3.5、本专利采用均方误差(Mean Square Error,MSE)作为损失函数,循环步骤3.1 至步骤3.4,直到模型收敛或迭代次数大于设定阈值。
本发明具有以下有益效果:
(1)本发明提出了一种基于时空图卷积网络的空气质量预测方法,提出一种时空注意力 机制卷积单元,可以很好地完成同时对全部监测站点下历史数据的时空特征和时空动态相关 性建模的目的,充分利用固有的空间结构信息并挖掘历史时序数据信息,以提高预测准确率;
(2)本发明中提出一种时空注意力机制模块,包含两种注意力机制:空间注意力机制和 时间注意力机制。其中利用空间注意力机制自适应地捕获空间维度上节点间的动态相关性, 利用时间注意力机制自适应地捕获时间维度上附近时间片的动态相关性,从而利用时空注意 力机制模块捕获历史数据中的时空动态相关性;
(3)本发明中提出一种时空卷积模块,包含两种卷积:图卷积和标准卷积。其中利用图 卷积捕获空间维度上每个节点的邻近信息,利用标准卷积捕获时间维度上附近时间片的信息, 以更新节点信息,从而利用时空卷积模块捕获历史数据中的时空特性;
(4)本发明可以很好地解决传统方法需要大量人为干预调整数据的问题,通过模型学习 可以有效且自动捕获数据间的隐含关系,在保证预测精度的基础上,可以极大的降低研究人 员的工作量,同时可以为相关管理部门的防治措施以及广大人民群众的出行计划提供可靠的 指导意见。
附图说明
图1为本发明提出的整体方法流程图
图2为本发明提出的时空注意力机制卷积单元框架图
具体实施方式
下面对本发明的具体实施方式进行描述,不用于限制本发明,本发明的保护范围由权利 要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或 等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。
实施例
本发明的基本思想是充分利用各监测站点收集到的空气污染物因子和气象因子的时序数 据,以及各监测站点本身固有的空间地理位置信息,以达到同时对空气质量数据的时空特征 和动态相关性建模的目的。本发明提出一种时空注意力机制卷积单元,用以从时序数据以及 空间地理位置信息中捕获时空依赖。
其中时空注意力机制卷积单元包含两部分:时空注意力机制模块和时空卷积模块。时空 注意力机制模块中包含两种注意力机制,即空间注意力机制和时间注意力机制。在空间维度 上,不同位置的空气状况是存在相互影响的,并且是高度动态相关的,同样在时间维度上, 不同时间段的空气状况也存在相关性,且不同情况下相关性不同,故使用注意力机制来自适 应的捕获动态时空相关性。时空卷积模块由空间维度上的图卷积和沿时间维度的标准卷积组 成,利用图卷积操作捕获空间维度上每个节点的邻近信息,然后在时间维度上利用标准卷积 堆叠以通过合并邻近时间片上的信息来更新节点的信号,从而捕获时空依赖。
时空注意力机制模块使网络自动对有价值的信息予以更多的关注,由时空注意力机制调 整后的输出被输入到时空卷积模块中,由空间维度上的图卷积从邻居中捕获空间相关性,沿 时间维度进行标准卷积,从附近的时间片中捕获时间依赖性,从而充分挖掘数据中的隐藏信 息,提高空气质量预测的准确率。
如图1所示,本发明提供了一种基于时空图卷积网络的空气质量预测方法,该方法的具 体实现步骤如下:
步骤1、获取各监测站点的空气污染物因子浓度以及气象因子的历史时间序列数据,进行 数据预处理,而后划分训练集、验证集和测试集,并作为输入参量;
步骤1.1、获取各监测站点的空气污染物因子浓度历史时序数据并持久化到数据库存储: 利用爬虫程序定时对中国天气网的污染物因子数据进行爬取,获取得到不同监测站点下逐时 污染物因子浓度,并将数据持久化到数据库存储,作为时间维度的输入参量。本文应用到的 城市范围内空气监测站点的历史污染物因子浓度数据,其中污染物因子包括CO、NO2、SO2、 O3、PM10、PM2.5,然后构建每个时刻污染物因子浓度向量为χt1= {Ct(CO),Ct(NO2),Ct(SO2),Ct(O3),Ct(PM10),Ct(PM2.5)},向量中每个值代表不同污染物因子在 t时刻的浓度值;
步骤1.2、获取各监测站点的气象因子历史时序数据并持久化到数据库存储:利用爬虫程 序定时对中国天气网的气象数据进行爬取,获取得到不同监测站点下逐时气象因子数值,并 将数据持久化到数据库存储,作为输入参量。本文应用到的城市范围内空气监测站点的历史 气象因子数据,包括温度、风力、降雨量和湿度,然后构建每个时刻气象因子向量为χt2= {Tempt,Windt,Raint,Humit},向量中每个值代表不同气象因子在t时刻的观测值;
步骤1.3、构建模型的输入数据和输出数据:构建模型的输入向量X={x1,x2,…,xn}和输 出向量Y={y1,y2,…,yn}。X中的每个变量表示空气污染物浓度因子浓度和气象因子观测值, 取当前时刻相关因子的历史数据;Y是期望输出,每个变量表示当前时刻未来24小时内逐时 的空气污染物浓度因子浓度和气象因子数值。其中在空气质量预测中n为24;
步骤1.4、数据预处理:对上述所采集的空气污染物因子和气象因子的时序数据集进行缺 失值填充和异常值处理,以得到完整可用的数据集;
步骤1.5、训练集、验证集、测试集划分:对所述经过数据预处理后的数据集以7:2:1的 比例划分训练集、验证集和测试集;
步骤1.6、数据归一化:利用最大最小归一化算法(Min-Max归一化)对划分好的训练集、 验证集和测试集进行标准化处理,归一化可以去除数据的量纲,数据将会被限制在一个很小 的区间内,可以是[0,1],[-1,1]等,归一化的主要目的是加快神经网络的收敛。Min-Max标准 化公式如下:
Figure BDA0003452426600000071
其中,max(xi)代表数组中的最大值,min(xi)代表数组中的最小值,xi代表转换前的数据,x'i表示经过归一化后的数据;
步骤2、获取各监测站点的地理位置信息数据,构建相应的图结构,并作为输入参量;
步骤2.1、获取各监测站点的地理位置信息并持久化到数据库存存储:将本文应用到的城 市范围内监测站点的经纬度信息数据持久化到数据库存储,即为各监测站点的空间位置信息, 作为输入参量;
步骤2.2、图结构构建:根据上述所采集的各监测站点的地理位置信息数据,构建相应的 图结构,以表示地理空间数据的空间关系。根据监测站点的经纬度信息,计算站点间具体的 物理距离,以生成可以表征监测站点相对位置信息的邻接矩阵。
步骤3、将经过所述预处理后的时序数据集与图结构数据输入至时空注意力机制卷积单元, 包括时空注意力机制模块和时空卷积模块,进行协同训练,以同时捕获时空间特征及动态相 关性;
步骤3.1、空间注意力机制捕获节点中的动态相关性:将上述已经过数据预处理的历史时 序数据和图结构数据输入至时空注意力机制模块,由空间注意力机制自适应的捕获相邻节点 中的动态相关性,公式如下:
S=Vs·σ((χP1)P2(P3χ)T+bs)
Figure BDA0003452426600000072
其中,χ∈RN×C×T是时空模块的输入,C是输入时序数据的维度,T是输入时序数据的长度, Vs,bs∈RN×N,P1∈RT,P2∈RC×T,P3∈RC均为可学习参数,sigmoid作为激活函数。根据当前输入动态计算得到空间相关矩阵S,S'i,j表示节点之间的相关强度。在进行图卷积时,同 时使用邻接矩阵A和S'动态调整节点间的权重;
步骤3.2、时间注意力机制捕获时间片间的动态相关性:将上述已经过数据预处理的历史 时序数据和图结构数据输入至时空注意力机制模块,由时间注意力机制自适应的捕获附近时 间片间的动态相关性,公式如下:
E=Ve·σ((χQ1)Q2(Q3χ)T+be)
Figure BDA0003452426600000081
其中,χ∈RN×C×T是时空模块的输入,C是输入时序数据的维度,T是输入时序数据的长度, Ve,be∈RT*T,Q1∈RN,Q2∈RC*N,Q3∈RC均为可学习参数,时间相关矩阵由不同的输入决定, E'i,j代表不同时间片间的相关性。然后通过归一化的时间相关矩阵作为输入,合并相关信息, 动态调整输入得到
Figure BDA0003452426600000082
公式如下:
Figure BDA0003452426600000083
其中,
Figure BDA0003452426600000084
步骤3.3、图卷积捕获邻域空间依赖性:将上述经过时空注意力机制调整后的输出输入至 时空卷积模块,由空间维度的图卷积捕获来自邻域的空间依赖性;
步骤3.3.1、计算图结构的拉普拉斯矩阵并归一化:
L=D-A
其中,L∈RN×N,归一化后为:
Figure BDA0003452426600000085
其中,A是邻接矩阵,IN是单位矩阵,D∈RN×N是度矩阵,由节点的度组成,也是对角矩阵, Dii=∑jAij
步骤3.3.2、拉普拉斯的特征值分解:
L=UΛUT
其中,Λ=diag([λ01,…,λN-1])是对角矩阵,U是傅里叶基;
步骤3.3.3、对节点信号进行图卷积操作,公式如下:
Figure BDA0003452426600000086
其中,*G代表图卷积操作,θ∈RK是多项式系数矩阵,
Figure BDA0003452426600000087
λmax是拉普拉斯矩阵 的最大特征值;
步骤3.3.4、使用线性整流函数(Rectified Linear Unit,ReLU)作为卷积模块的激活函数:
h=ReLU(gθ*Gχ)
步骤3.4.5、动态调整节点间的相关性:
Figure BDA0003452426600000091
其中,
Figure BDA0003452426600000092
是切比雪夫递归多项式,Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,T1(x)=x;
步骤3.4、标准卷积捕获时间依赖性:由时间维度的标准卷积合并相邻时间片的相关信息, 并更新节点信息,从而捕获时间依赖性:
Figure BDA0003452426600000093
其中,χ'∈RC×N×T,*代表标注卷积,Φ是标准卷积核的参数,使用ReLU作为激活函数;
步骤3.5、本专利采用均方误差(Mean Square Error,MSE)作为损失函数,循环步骤3.1 至步骤3.4,直到模型收敛或迭代次数大于设定阈值。MSE公式具体如下:
Figure BDA0003452426600000094
其中yi是污染物浓度的观测值,ypi是污染物浓度的预测值;
步骤4、将所述时空注意力机制模块和时空卷积模块协同训练后,级联一层全连接层,使 模块的输出具有与预测目标相同的维度,从而输出最终的预测结果。
本发明提出了一种基于时空图卷积网络的空气质量预测方法,设计一种时空注意力机制 卷积单元,融合时空注意力机制模块和时空卷积模块。其中时空卷积模块包括空间维度的图 卷积和时间维度的标准卷积,时空注意力机制模块使网络自动对有价值的信息予以更多关注, 从而达到同时捕获数据中的动态时空相关性以及时空依赖的目的。
[1]Shuyue Zhang,Minfeng Lin,Xiuguo Zou,Steven Su,Wentian Zhang,XuhuiZhang,Zijie Guo. LSTM-based Air Quality Predicted Model for Large Cities inChina[J].Nature Environment& Polution Technology,2020,19(1).
[2]Li T,Hua M,Wu X.A Hybrid CNN-LSTM Model for ForecastingParticulate Matter(PM2.5) [J].IEEEAccess,2020,PP(99):1-1.
[3]何加伟,钟辉强,刘亮,尹存祥,方军.空气质量指数AQI的预测方法和装置[P].北京市: CN111222672A,2020-06-02.

Claims (4)

1.一种基于时空图卷积网络的空气质量预测方法,其特征在于,包括以下步骤:
步骤1、获取各监测站点的空气污染物因子浓度以及气象因子的历史时间序列数据,进行数据预处理,而后划分训练集、验证集和测试集,并作为时间维度的输入参量;
步骤2、获取各监测站点的地理位置信息数据,包括经纬度信息等,构建相应的图结构,并作为空间维度的输入参量;
步骤3、将经过所述预处理后的时序数据集与图结构一并输入至时空卷积单元,包括时空注意力机制模块和时空卷积模块,进行协同训练,以同时捕获时间和空间特性;
步骤4、将所述时空注意力机制模块和时空卷积模块协同训练后,级联一层全连接层,使模块的输出具有与预测目标相同的维度,从而输出最终的预测结果。
2.根据权利要求1所述的一种基于时空图卷积网络的空气质量预测方法,其特征在于,所述步骤1具体为:
步骤1.1、污染物因子数据采集:同一监测站点下不同污染物因子的历史时序数据,包括CO、NO2、SO2、O3、PM10、PM2.5,每个时刻污染物浓度向量为:χt1={Ct(CO),Ct(NO2),Ct(SO2),Ct(O3),Ct(PM10),Ct(PM2.5)},向量中每个值代表不同污染物因子在t时刻的浓度值;
步骤1.2、气象因子数据采集:同一监测站点下不同气象因子的历史时间序列数据,包括温度、风力、降雨量、湿度,每个时刻气象因子向量为χt2={Tempt,Windt,Raint,Humit},向量中每个值代表不同气象因子在t时刻的观测值;
步骤1.3、数据预处理:对所采集的空气污染物因子和气象因子的时序数据集进行缺失值填充和异常值处理,得到完整可用的数据集;
步骤1.4、训练集、验证集、测试集划分:按照7∶2∶1的比例将原始数据集划分为训练集、验证集和测试集;
步骤1.5、数据归一化:利用最大最小归一化算法对划分好的训练集、验证集和测试集进行标准化处理,Min-Max标准化公式如下:
Figure FDA0003452426590000011
其中,max(xi)代表数组中的最大值,min(xi)代表数组中的最小值,xi代表转换前的数据,x′i表示经过归一化后的数据。
3.根据权利要求1所述的一种基于时空图卷积网络的空气质量预测方法,其特征在于,所述步骤2具体为:
步骤2.1、监测站点地理位置信息数据采集:收集所有监测站点的空间信息,包括经纬度信息等;
步骤2.2、图结构构建:根据上述所采集的各监测站点的地理位置信息数据,生成对应的带权邻接矩阵并构建相应的图结构,以表示地理空间数据的空间关系;图结构表示为:
G=(V,E,A)
其中,G表示无向图,V表示节点集合,E表示边集合,代表节点之间的连接,A∈RN×N表示节点的邻接矩阵。
4.根据权利要求1所述的一种基于时空图卷积网络的空气质量预测方法,其特征在于,所述步骤3具体为:
步骤3.1、空间注意力机制捕获节点中的动态相关性:将上述已经过数据预处理的历史时序数据和图结构输入至时空注意力机制模块,由空间注意力机制自适应的捕获节点中的动态相关性,如下:
S=Vs·σ((χP1)P2(P3χ)T+bs)
Figure FDA0003452426590000021
其中,χ∈RN×C×T是时空模块的输入,C是输入时序数据的维度,T是输入时序数据的长度,Vs,bs∈RN×N,P1∈RT,P2∈RC×T,P3∈RC均为可学习参数,sigmoid作为激活函数;根据当前输入动态计算得到空间相关矩阵S,S′i,j表示节点之间的相关强度;在进行图卷积时,同时使用邻接矩阵A和S′动态调整节点间的权重;
步骤3.2、时间注意力机制捕获时间片间的动态相关性:将上述已经过数据预处理的历史时序数据和图结构输入至时空注意力机制模块,由时间注意力机制自适应的捕获时间片间的动态相关性,公式如下:
E=Ve·σ((χQ1)Q2(Q3χ)T+be)
Figure FDA0003452426590000022
其中,Ve,be∈RT*T,Q1∈RN,Q2∈RC*N,Q3∈RC均为可学习参数,时间相关矩阵由不同的输入决定,E′i,j代表不同时间片间的相关性;然后将通过归一化的时间相关矩阵作为输入,合并相关信息,动态调整输入得到
Figure FDA0003452426590000023
公式如下:
Figure FDA0003452426590000024
其中,
Figure FDA0003452426590000025
步骤3.3、图卷积捕获邻域空间依赖性:将上述经过时空注意力机制调整后的输出输入至时空卷积模块,由空间维度的图卷积捕获来自邻域的空间依赖性;
步骤3.3.1、计算图结构的拉普拉斯矩阵并归一化:
L=D-A
其中,L∈RN×N,归一化后为:
Figure FDA0003452426590000026
其中,A是邻接矩阵,IN是单位矩阵,D∈RN×N是度矩阵,由节点的度组成,也是对角矩阵,Dii=∑jAij
步骤3.3.2、拉普拉斯的特征值分解:
L=UΛUT
其中,Λ=diag([λ0,λ1,...,λN-1])是对角矩阵,U是傅里叶基;
步骤3.3.3、对节点信号进行图卷积操作,公式如下:
Figure FDA0003452426590000031
其中,*G代表图卷积操作,θ∈RK是多项式系数矩阵,
Figure FDA0003452426590000032
λmax是拉普拉斯矩阵的最大特征值;
步骤3.3.4、使用线性整流函数(Rectified Linear Unit,ReLU)作为卷积模块的激活函数:
ReLU(gθ*Gχ)
步骤3.4.5、动态调整节点间的相关性:
Figure FDA0003452426590000033
其中,
Figure FDA0003452426590000034
是切比雪夫递归多项式,Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,T1(x)=x;
步骤3.4、标准卷积捕获时间依赖性:将图卷积操作后的输出输入至时间卷积模块,由时间维度的标准卷积合并相邻时间片的信息,并更新节点信息,从而捕获时间依赖性:
Figure FDA0003452426590000035
其中,χ′∈RC×N×T,*代表标注卷积,Φ是标准卷积核的参数,使用ReLU作为激活函数;
步骤3.5、采用均方误差作为损失函数,循环步骤3.1至步骤3.4,直到模型收敛或迭代次数大于设定阈值。
CN202111669087.8A 2021-12-31 2021-12-31 一种基于时空图卷积网络的空气质量预测方法 Pending CN114240000A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111669087.8A CN114240000A (zh) 2021-12-31 2021-12-31 一种基于时空图卷积网络的空气质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111669087.8A CN114240000A (zh) 2021-12-31 2021-12-31 一种基于时空图卷积网络的空气质量预测方法

Publications (1)

Publication Number Publication Date
CN114240000A true CN114240000A (zh) 2022-03-25

Family

ID=80745240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111669087.8A Pending CN114240000A (zh) 2021-12-31 2021-12-31 一种基于时空图卷积网络的空气质量预测方法

Country Status (1)

Country Link
CN (1) CN114240000A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456314A (zh) * 2022-11-11 2022-12-09 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种大气污染物时空分布预测系统及方法
CN115600643A (zh) * 2022-10-17 2023-01-13 中国科学技术大学(Cn) 一种毒害气体快速预测方法及系统
CN115759413A (zh) * 2022-11-21 2023-03-07 合肥本源量子计算科技有限责任公司 一种气象预测方法、装置、存储介质及电子设备
CN115796402A (zh) * 2023-02-08 2023-03-14 成都理工大学 一种基于组合模型的空气质量指数预测方法
CN115860286A (zh) * 2023-03-01 2023-03-28 江苏省生态环境监测监控有限公司 一种基于时序门机制的空气质量预测方法及系统
CN116307212A (zh) * 2023-03-24 2023-06-23 淮阴工学院 一种新型空气质量预测方法及系统
CN117074627A (zh) * 2023-10-16 2023-11-17 三科智能(山东)集团有限公司 基于人工智能的医疗实验室空气质量监测系统
CN117111540A (zh) * 2023-10-25 2023-11-24 南京德克威尔自动化有限公司 一种用于io远程控制总线模块的环境监测预警方法及系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115600643B (zh) * 2022-10-17 2023-06-09 中国科学技术大学 一种毒害气体快速预测方法及系统
CN115600643A (zh) * 2022-10-17 2023-01-13 中国科学技术大学(Cn) 一种毒害气体快速预测方法及系统
CN115456314A (zh) * 2022-11-11 2022-12-09 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种大气污染物时空分布预测系统及方法
CN115456314B (zh) * 2022-11-11 2023-03-24 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种大气污染物时空分布预测系统及方法
CN115759413A (zh) * 2022-11-21 2023-03-07 合肥本源量子计算科技有限责任公司 一种气象预测方法、装置、存储介质及电子设备
CN115796402A (zh) * 2023-02-08 2023-03-14 成都理工大学 一种基于组合模型的空气质量指数预测方法
US11816556B1 (en) 2023-02-08 2023-11-14 Chengdu University Of Technology Method for predicting air quality index (AQI) based on a fusion model
CN115860286A (zh) * 2023-03-01 2023-03-28 江苏省生态环境监测监控有限公司 一种基于时序门机制的空气质量预测方法及系统
CN116307212A (zh) * 2023-03-24 2023-06-23 淮阴工学院 一种新型空气质量预测方法及系统
CN116307212B (zh) * 2023-03-24 2023-12-19 淮阴工学院 一种空气质量预测方法及系统
CN117074627A (zh) * 2023-10-16 2023-11-17 三科智能(山东)集团有限公司 基于人工智能的医疗实验室空气质量监测系统
CN117074627B (zh) * 2023-10-16 2024-01-09 三科智能(山东)集团有限公司 基于人工智能的医疗实验室空气质量监测系统
CN117111540A (zh) * 2023-10-25 2023-11-24 南京德克威尔自动化有限公司 一种用于io远程控制总线模块的环境监测预警方法及系统
CN117111540B (zh) * 2023-10-25 2023-12-29 南京德克威尔自动化有限公司 一种用于io远程控制总线模块的环境监测预警方法及系统

Similar Documents

Publication Publication Date Title
CN114240000A (zh) 一种基于时空图卷积网络的空气质量预测方法
CN111798051B (zh) 基于长短期记忆神经网络的空气质量时空预测方法
US20220373984A1 (en) Hybrid photovoltaic power prediction method and system based on multi-source data fusion
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
Ceci et al. Predictive modeling of PV energy production: How to set up the learning task for a better prediction?
CN113673769A (zh) 基于多元时间序列插补的图神经网络交通流预测方法
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
CN114707688A (zh) 基于卫星云图和时空神经网络的光伏功率超短期预测方法
CN116307212B (zh) 一种空气质量预测方法及系统
CN112232543A (zh) 一种基于图卷积网络的多站点预测方法
CN113496310A (zh) 基于深度学习模型的大气污染物预测方法和系统
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
CN114265913A (zh) 工业物联网边缘设备上基于联邦学习的空时预测算法
Saffari et al. Deep convolutional graph rough variational auto-encoder for short-term photovoltaic power forecasting
CN109829583B (zh) 基于概率编程技术的山火风险预测方法
Zhao et al. Mastgn: Multi-attention spatio-temporal graph networks for air pollution prediction
CN116307291A (zh) 一种基于小波分解的分布式光伏发电预测方法及预测终端
Ramirez-Vergara et al. Review of forecasting methods to support photovoltaic predictive maintenance
CN115036922A (zh) 一种分布式光伏发电电量预测方法及系统
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
CN117556197B (zh) 一种基于人工智能的台风涡旋初始化方法
CN116307287B (zh) 一种光伏发电有效时段的预测方法、系统及预测终端
Li et al. PV resource evaluation based on Xception and VGG19 two-layer network algorithm
CN117033923A (zh) 一种基于可解释性机器学习的犯罪数量预测方法及系统
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination