CN113496310A - 基于深度学习模型的大气污染物预测方法和系统 - Google Patents

基于深度学习模型的大气污染物预测方法和系统 Download PDF

Info

Publication number
CN113496310A
CN113496310A CN202110667206.XA CN202110667206A CN113496310A CN 113496310 A CN113496310 A CN 113496310A CN 202110667206 A CN202110667206 A CN 202110667206A CN 113496310 A CN113496310 A CN 113496310A
Authority
CN
China
Prior art keywords
model
node
data
concentration
monitoring station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110667206.XA
Other languages
English (en)
Inventor
黄典
闫增祥
冯圣中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NATIONAL SUPERCOMPUTING CENTER IN SHENZHEN (SHENZHEN CLOUD COMPUTING CENTER)
Original Assignee
NATIONAL SUPERCOMPUTING CENTER IN SHENZHEN (SHENZHEN CLOUD COMPUTING CENTER)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NATIONAL SUPERCOMPUTING CENTER IN SHENZHEN (SHENZHEN CLOUD COMPUTING CENTER) filed Critical NATIONAL SUPERCOMPUTING CENTER IN SHENZHEN (SHENZHEN CLOUD COMPUTING CENTER)
Priority to CN202110667206.XA priority Critical patent/CN113496310A/zh
Publication of CN113496310A publication Critical patent/CN113496310A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于深度学习模型的大气污染物预测方法,包括:将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;利用GNN模型学习监测站点之间的空间交互性;将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。本发明考虑环境监测站点的稀疏性和非欧式分布特性,结合GNN对空间交互关系的优势进行空间相关性建模预测;结合GRU对时间相关性的捕捉性能,融入注意力机制捕捉全局信息提高对时间相关性的建模预测能力;结合多源数据中的土地利用类型数据加强模型对空间相关性的捕获,从而提高模型预测的准确率。

Description

基于深度学习模型的大气污染物预测方法和系统
技术领域
本发明涉及大气污染物预测技术领域,尤其涉及一种基于深度学习模型的大气污染物预测方法和系统。
背景技术
大气污染对人类自身及其赖以生存的生态环境产生重大影响,其中,PM2.5是雾霾的主要成分,危害人类健康,增加心脑血管和呼吸系统疾病的发病率和死亡率。大气污染物浓度的及时和准确预测有助于科学预防并有效减少污染事件造成的损失。
近年来,随着观测数据的急剧增长,传统的数值预报和统计学方法难以充分利用海量数据建模。可适应大数据分析的深度学习方法成为研究热点。早期的深度学习模型主要考虑数据的时间依赖性,采用循环神经网络(RNN)和长短时记忆网络(LSTM)对时间依赖关系建模,缺少对过去时刻关键信息的聚焦。
为捕获空间相关性,根据输入数据的结构特性,空间建模一般分为基于图像和基于图的方法。基于图像的方法,通常包含两类,一种是基于照片的方法估算大气污染物浓度,往往不涉及污染物浓度预测。卷积神经网络(CNN)是一种前馈神经网络,经常被用于处理网格数据拓扑,可以通过卷积挖掘不同网格特征之间的相关性,是提取图像相关特征的一种常用方法。Zhang等(2016)基于照片创建数据集采用CNN网络估算空气质量,证明了基于照片进行大气污染浓度分析的可行性。Chakma(2017)等利用CNN估算照片中PM2.5浓度,采用微调CNN和基于CNN特征的随机森林两种迁移学习方法将图像分类,实验结果证明该方法对PM2.5浓度分类有一定效果。Ma等(2018)基于CNN提出一种单幅图像混合的空气质量分类方法,基于图像去雾方法结合原来的RGB图像训练混合神经网络对PM2.5进行分类。另一种基于图像方法的基本思想是将监测站的浓度插值到图像中,通过CNN网络来近似一个高度平滑的非线性函数,完成从观测数据到污染物预测的非线性映射过程。但监测站在城乡地区分布不均,CNN并不能区分图像上的城乡网格,对于非均匀分布的稀疏监测站点插值可能会产生误差,导致预测不准确。
相反,基于图的网络模型可以很自然的避开插值误差问题,图卷积神经网络(GCN)将监测站点的观测数据以及监测站点之间的关系转化成一个含有结构信息的图,并针对输入的图结构数据进行有效的空间相关性建模(Zhou等,2018)。Lin等(2018)建立一个无向图并通过利用单个城市内的领域信息来计算空间相似度。为了解决利用CNN可能会产生的插值误差问题,Yi等(2018)将图像分为几个区域并提出了一个空间变换分量,将来自相同区域的网格转换为一致的输入以模拟污染源。相比之下,基于图的方法会避免上述问题,它将浓度值作为图节点并将其原始分布保留在图结构中。Lin等(2018)提出了基于传感器的环境相似性构造图并使用图结构的扩散卷积模块来捕获空间依赖关系。Qi等(2019)使用混合深度学习模型构造了一个图,其中每个节点代表一个监测站,并设计了一个图卷积网络用来学习图序列之间的时空相关性。Wang等(2020)根据监测站的气象信息和地理信息构建了一个有向图,并开发了一种新的基于领域知识增强的模型PM2.5-GNN,该模型能够捕捉空间交互性,对PM2.5进行预测。
总的来说,当前大气污染深度学习预测方法,将大气污染物浓度和气象数据及简单的地理信息结合起来,考虑城市之间空间交互动态性及空间相关性建模,缺乏站点本身的复杂下垫面信息,未能有效利用多源数据;另外,在对污染物浓度时间依赖性的捕获上,现有的方法虽然一定程度上提取了历史数据的时间相关性特征,但忽略了过去不同时刻的特征状态对未来污染物浓度的影响。
发明内容
本发明基于多源时空数据,利用深度学习方法对大气污染物的时空相关性展开建模,增加土地利用数据以提升模型对空间相关性的捕获,考虑环境监测站点的稀疏性和非欧式分布特性以及大气污染物及其影响因子的非线性时空特征,结合图神经网络(GNN)对空间交互关系的建模优势和门控循环单元网络(GRU)对时间相关性的捕捉性能,融入注意力机制捕捉全局信息提高对时序信息的建模能力,提出了一种全新的深度学习模型(GNN-GRUA)模拟并预测大气污染物浓度。
本发明实施例提供一种基于深度学习模型的大气污染物预测方法,其特征在于,包括以下步骤:
步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
步骤S4、结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
在本发明提供的基于深度学习模型的大气污染物预测方法中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
在本发明提供的基于深度学习模型的大气污染物预测方法中,在所述步骤S2中,GNN模型的公式表达如下:
Figure BDA0003117851940000031
Figure BDA0003117851940000032
Figure BDA0003117851940000033
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为
Figure BDA0003117851940000041
通过结合之前时间步的预测浓度
Figure BDA0003117851940000042
和当前的节点属性Pi t得到,附近节点对节点i的影响表示为
Figure BDA0003117851940000043
通过结合其连接节点的污染物浓度和自身边属性
Figure BDA0003117851940000044
得到,空间相关信息
Figure BDA0003117851940000045
通过汇总i节点所有相邻节点的影响得到。
在本发明提供的基于深度学习模型的大气污染物预测方法中,所述GRUA模型的公式表达如下:
Figure BDA0003117851940000046
Figure BDA0003117851940000047
Figure BDA0003117851940000048
Figure BDA0003117851940000049
Figure BDA00031178519400000410
Figure BDA00031178519400000411
Figure BDA00031178519400000412
Figure BDA00031178519400000413
Figure BDA00031178519400000414
Figure BDA00031178519400000415
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示
Figure BDA00031178519400000416
及空间相关信息
Figure BDA00031178519400000417
作为输入信息
Figure BDA00031178519400000418
代表更新门,ri t代表重置门,
Figure BDA00031178519400000419
代表当前时间步的记忆信息,
Figure BDA00031178519400000420
通过更新门
Figure BDA00031178519400000421
决定当前时间步记忆信息
Figure BDA00031178519400000422
和前一时间步
Figure BDA00031178519400000423
需要获取的信息,之后经过Attention模块,计算出加权输出向量s和最终记忆信息
Figure BDA00031178519400000424
最后通过一个全连接层Ω得到预测的PM2.5浓度。
在本发明提供的基于深度学习模型的大气污染物预测方法中,5、在步骤S1之前,还包括:
步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
根据本发明的另一方面,还提供一种基于深度学习模型的大气污染物预测系统,包括:
图结构数据生成单元,用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
GNN模型计算单元,用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
GRUA模型计算单元,用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
预测单元,用于结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
在本发明提供的基于深度学习模型的大气污染物预测系统中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
在本发明提供的基于深度学习模型的大气污染物预测系统中,所述GNN模型的公式表达如下:
Figure BDA0003117851940000051
Figure BDA0003117851940000052
Figure BDA0003117851940000053
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为
Figure BDA0003117851940000054
通过结合之前时间步的预测浓度
Figure BDA0003117851940000055
和当前的节点属性Pi t得到,附近节点对节点i的影响表示为
Figure BDA0003117851940000056
通过结合其连接节点的污染物浓度和自身边属性
Figure BDA0003117851940000057
得到,空间相关信息
Figure BDA0003117851940000058
通过汇总i节点所有相邻节点的影响得到。
在本发明提供的基于深度学习模型的大气污染物预测系统中,所述GRUA模型的公式表达如下:
Figure BDA0003117851940000061
Figure BDA0003117851940000062
Figure BDA0003117851940000063
Figure BDA0003117851940000064
Figure BDA0003117851940000065
Figure BDA0003117851940000066
Figure BDA0003117851940000067
Figure BDA0003117851940000068
Figure BDA0003117851940000069
Figure BDA00031178519400000610
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示
Figure BDA00031178519400000611
及空间相关信息
Figure BDA00031178519400000612
作为输入信息
Figure BDA00031178519400000613
代表更新门,ri t代表重置门,
Figure BDA00031178519400000614
代表当前时间步的记忆信息,
Figure BDA00031178519400000615
通过更新门
Figure BDA00031178519400000616
决定当前时间步记忆信息
Figure BDA00031178519400000617
和前一时间步
Figure BDA00031178519400000618
需要获取的信息,计算出加权输出向量s和最终记忆信息
Figure BDA00031178519400000619
最后通过一个全连接层Ω得到预测的PM2.5浓度。
在本发明提供的基于深度学习模型的大气污染物预测系统中,还包括训练单元,用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
实施本发明实施例,具有如下有益效果:本发明基于污染物、气象等多源时空数据,考虑环境监测站点的稀疏性和非欧式分布特性以及大气污染物与其影响因子的非线性时空特征,结合图神经网络(GNN)对空间交互关系的建模优势和门控循环单元网络(GRU)对时间相关性的捕捉性能,融入注意力机制(Attention)捕捉全局信息提高对时序信息的建模能力,提出了一种全新的深度学习模型(GNN-GRUA)模拟并预测大气污染物浓度,同时结合土地利用类型数据加强模型对空间相关性的捕获;经过在数据集上与其他模型方法的验证和对比,证明GNN-GRUA能有效提高大气污染物浓度预测的准确率并减小误报率,反映了本模型方法提取时空特征的有效性,提升了对污染物浓度的预测能力,同时也证明了土地利用类型数据对空间相关性捕获的裨益。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示是本发明一实施例提供的基于深度学习模型的大气污染物预测方法的流程图;
图2所示是本发明一实施例的有向图节点与边关系示意图;
图3所示是GRU模型的结构示意图;
图4所示是GRUA模型的结构示意图;
图5所示是各模型72小时预测平均绝对误差MAE、均方根误差RMSE对比(LU代表土地利用类型数据);
图6所示是各模型72小时预测命中率POD对比;
图7所示是各模型不同预测时长均方根误差RMSE对比;
图8所示是各模型不同预测时长预测命中率POD对比。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1所示是本发明一实施例提供的基于深度学习模型的大气污染物预测方法的流程图;如图1所示,本发明提供的基于深度学习模型的大气污染物预测方法包括以下步骤:
步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据。
具体地,在本发明一实施例中,首先将基于监测站点的非结构化输入数据转化成含有结构信息的图结构。对于图结构中的节点而言,其数据特征的构建需要考虑当前监测站点的气象因子和土地利用类型等因子影响。气象因子包含降水、边界层高度、温度等,它们通过光照、动态或热力学效应影响的PM2.5生成和垂直扩散。本发明以站点周边一定缓冲区内各土地利用类型的比例作为间接的影响因子。对于图结构中的边而言,通过创建有向边来刻画源监测站点对目标站点的污染物浓度影响。鉴于风上游方向的站点对下游站点污染物浓度有较大的影响这一观察,主要考虑风向、风速以及空间距离、海拔高度构建此有向边。如图2所示,灰色节点的污染物浓度受到周边监测站点污染物浓度的影响,假设灰色节点i为当前监测站点,白色节点j为一个源监测站点,那么源监测站点j对当前监测站点i的污染物影响程度可以通过公式(1)刻画出来。其中是源监测站点j的风速,d是节点j与i之间的距离,是风向与两个节点之间方向(源监测站点到当前监测站点)的夹角。值得注意的是,我们通过采用ReLU函数确保风向与两个节点之间的角度大于90°时,源监测站点对当前监测站点的影响为0。
Figure BDA0003117851940000081
此外,我们需要计算节点的相关性来建立邻接矩阵。两市周边的山区会阻碍PM2.5污染物的输送,因此我们通过对邻接矩阵的权值进行约束。例如,我们设置城市之间距离阈值和海拔高度阈值为200km和1000m。也就是说,只有当两个城市之间的距离小于200km,两座城市之间的山脉小于1000m时,PM2.5才能从一个城市传输到另一个城市。
因此,在本发明中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响。
具体地,在本发明一实施例中,基于信息迭代方法的GNN网络捕捉城市之间的空间交互性,即对每个城市节点而言,既要考虑附近城市PM2.5浓度的输入量,也要考虑当前站点对外的输出量。GNN利用邻近信息和更新节点表示来捕获污染物水平传输。具体地,GNN模型的公式表达如下:
Figure BDA0003117851940000091
Figure BDA0003117851940000092
Figure BDA0003117851940000093
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为
Figure BDA0003117851940000094
通过结合之前时间步的预测浓度
Figure BDA0003117851940000095
和当前的节点属性Pi t得到,附近节点对节点i的影响表示为
Figure BDA0003117851940000096
通过结合其连接节点的污染物浓度和自身边属性
Figure BDA0003117851940000097
得到,空间相关信息
Figure BDA0003117851940000098
通过汇总i节点所有相邻节点的影响得到。
步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性。
具体地,在本发明一实施例中,监测站点采集的污染物数据是典型的时序数据,并且存在着年、季节、日等波动周期,因此对污染物浓度的建模不仅要考虑数据时间依赖性的特征,也要考虑每个时间点的时间信息。鉴于门控循环单元网络(GRU)在长期记忆性和梯度收敛等方面优于普通的RNN网络,使用GRU网络捕获数据的时间依赖性特征。如图3所示,在每一个时间步中,先将所有监测站点数据构建成一个图结构表达,然后对这个图结构表达使用GNN计算更新,以保证每一个监测站点都获取了附近站点对其的影响,最后将图结构中的所有节点特征输入到GRU单元中去计算。鉴于注意力机制在文本任务以及自然语言处理上具有适用性和有效性,拟引入注意力机制帮助模型更好地利用输入数据中的有效信息,聚焦关键信息,减缓信息冗余过载的压力,从而提高预测任务的效率和准确率,GRUA结构如图4所示。
进一步地,所述GRUA模型的公式表达如下:
Figure BDA0003117851940000101
Figure BDA0003117851940000102
Figure BDA0003117851940000103
Figure BDA0003117851940000104
Figure BDA0003117851940000105
Figure BDA0003117851940000106
Figure BDA0003117851940000107
Figure BDA0003117851940000108
Figure BDA0003117851940000109
Figure BDA00031178519400001010
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示
Figure BDA00031178519400001011
及空间相关信息
Figure BDA00031178519400001012
作为输入信息
Figure BDA00031178519400001013
代表更新门,ri t代表重置门,
Figure BDA00031178519400001014
代表当前时间步的记忆信息,
Figure BDA00031178519400001015
通过更新门
Figure BDA00031178519400001016
决定当前时间步记忆信息
Figure BDA00031178519400001017
和前一时间步
Figure BDA00031178519400001018
需要获取的信息,之后计算出加权输出向量s和最终记忆信息
Figure BDA00031178519400001019
最后通过一个全连接层Ω得到预测的PM2.5浓度。
步骤S4、结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
进一步地,在步骤S1之前,还包括:
步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
PM2.5受到气象、其他污染物、土地利用等特征因子的影响。气象数据有气压、风速、风向、温度、相对湿度、水汽压、降雨量、水平能见度、风力等17个气象要素的逐小时资料,土地利用类型有耕地、森林、不透水面等8种类型。为了提高预测的准确性,我们将这些领域知识作为节点和边的属性来建立我们的图,然后学习基于图的传输和扩散过程。在这之前,通过特征选择与预测目标相关关系较为显著的一些特征作为输入变量因子进行网络训练,从而降低输入特征的维度,剔除与预测目标相关性不高的特征因子,在一定程度上避免了过拟合的问题。
采用皮尔森(Pearson)相关性分析分析大气污染物与其他特征因子的相关性大小,通过计算相关系数来判断。相关系数计算公式如下:
Figure BDA0003117851940000111
其中,时间系列特征向量X=(x1,x2,...,xn),另一时间序列特征向量Y=(y1,y2,...,yn),n表示样本数量,当0<r(x,y)<1时这两种特征向量呈正相关,当-1<r(x,y)<0时这两种特征向量呈负相关。r(x,y)的绝对值越靠近1则两个特征向量的相关性越高。
通过相关性分析从多种特征因子中选取与PM2.5相关性较高的特征因子作为节点和边的特征作为输入数据进行模型训练和预测。
基于同一发明构思,本发明还公开了一种基于深度学习模型的大气污染物预测系统,包括:
图结构数据生成单元,用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
GNN模型计算单元,用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
GRUA模型计算单元,用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
预测单元,用于结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测;
训练单元,用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
具体地,在本发明一实施例中,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
具体地,在本发明一实施例中,所述GNN模型的公式表达如下:
Figure BDA0003117851940000121
Figure BDA0003117851940000122
Figure BDA0003117851940000123
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为
Figure BDA0003117851940000124
通过结合之前时间步的预测浓度
Figure BDA0003117851940000125
和当前的节点属性Pi t得到,附近节点对节点i的影响表示为
Figure BDA0003117851940000126
通过结合其连接节点的污染物浓度和自身边属性
Figure BDA0003117851940000127
得到,空间相关信息
Figure BDA0003117851940000128
通过汇总i节点所有相邻节点的影响得到。
所述GRUA模型的公式表达如下:
Figure BDA0003117851940000129
Figure BDA00031178519400001210
Figure BDA00031178519400001211
Figure BDA00031178519400001212
Figure BDA0003117851940000131
Figure BDA0003117851940000132
Figure BDA0003117851940000133
Figure BDA0003117851940000134
Figure BDA0003117851940000135
Figure BDA0003117851940000136
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示
Figure BDA0003117851940000137
及空间相关信息
Figure BDA0003117851940000138
作为输入信息
Figure BDA0003117851940000139
代表更新门,ri t代表重置门,
Figure BDA00031178519400001310
代表当前时间步的记忆信息,
Figure BDA00031178519400001311
通过更新门
Figure BDA00031178519400001312
决定当前时间步记忆信息
Figure BDA00031178519400001313
和前一时间步
Figure BDA00031178519400001314
需要获取的信息,计算出加权输出向量s和最终记忆信息
Figure BDA00031178519400001315
最后通过一个全连接层Ω得到预测的PM2.5浓度。
本发明经过实验与现有预测模型方法进行对比,证明可行,对比结果见附图5-8,实验结果概括如下:
(1)基于184个城市节点的研究区域,3小时预测任务中GNN-GRUA在各数据集上的预测命中率可达89%以上,均方根误差在各数据集上保持在6.5-15.2之间,误报率在8.1%以下,相比其他模型是最优的。在长时间预测任务中,GNN-GRUA的预测优势更明显,在72小时预测任务中,GNN-GRUA在数据集1上的预测命中率达到61.5%以上,比GNN提升约1%,均方根误差为19.94也是最优值,证明了本模型在长时间预测上可靠的时空特征提取和污染物浓度预测能力。
(2)基于291个城市节点的研究区域,在3小时预测任务中,GNN-GRUA在各数据集上的预测命中率达到87%以上,均方根误差在各数据集上保持在6.0-12.7之间,误报率在8.6%以下,各指标均优于原本未采用注意力机制的GNN模型,体现了注意力机制对于时间依赖性信息捕获的优越性。在72小时预测任务中,GNN-GRUA在数据集3上的预测命中率达到79.4%以上,并且采用土地利用类型及比例的GNN-GRUA模型预测命中率达到80%以上,相比GNN模型提升约2%,取得了较为可观的性能提升,说明土地利用类型数据对于PM2.5预测是有益的。
需要指出的是,上文对各种模块的描述中,分割成这些模块,是为了说明清楚。然而,在实际实施中,各种模块的界限可以是模糊的。例如,本文中的任意或所有功能性模块可以共享各种硬件和/或软件元件。又例如,本文中的任何和/或所有功能模块可以由共有的处理器执行软件指令来全部或部分实施。另外,由一个或多个处理器执行的各种软件子模块可以在各种软件模块间共享。相应地,除非明确要求,本发明的范围不受各种硬件和/或软件元件间强制性界限的限制。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种基于深度学习模型的大气污染物预测方法,其特征在于,包括以下步骤:
步骤S1、将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
步骤S2、利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
步骤S3、将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
步骤S4、结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
2.根据权利要求1所述的基于深度学习模型的大气污染物预测方法,其特征在于,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
3.根据权利要求1所述的基于深度学习模型的大气污染物预测方法,其特征在于,在所述步骤S2中,GNN模型的公式表达如下:
Figure FDA0003117851930000011
Figure FDA0003117851930000012
Figure FDA0003117851930000013
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为
Figure FDA0003117851930000014
通过结合之前时间步的预测浓度
Figure FDA0003117851930000015
和当前的节点属性Pi t得到,附近节点对节点i的影响表示为
Figure FDA0003117851930000016
通过结合其连接节点的污染物浓度和自身边属性
Figure FDA0003117851930000021
得到,空间相关信息
Figure FDA0003117851930000022
通过汇总i节点所有相邻节点的影响得到。
4.根据权利要求1所述的基于深度学习模型的大气污染物预测方法,其特征在于,所述GRUA模型的公式表达如下:
Figure FDA0003117851930000023
Figure FDA0003117851930000024
Figure FDA0003117851930000025
Figure FDA0003117851930000026
Figure FDA0003117851930000027
Figure FDA0003117851930000028
Figure FDA0003117851930000029
Figure FDA00031178519300000210
Figure FDA00031178519300000211
Figure FDA00031178519300000212
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示
Figure FDA00031178519300000213
及空间相关信息
Figure FDA00031178519300000214
作为输入信息
Figure FDA00031178519300000215
Figure FDA00031178519300000223
代表更新门,
Figure FDA00031178519300000216
代表重置门,
Figure FDA00031178519300000217
代表当前时间步的记忆信息,
Figure FDA00031178519300000218
通过更新门
Figure FDA00031178519300000219
决定当前时间步记忆信息
Figure FDA00031178519300000220
和前一时间步
Figure FDA00031178519300000221
需要获取的信息,之后计算出加权输出向量s和最终记忆信息
Figure FDA00031178519300000222
最后通过一个全连接层Ω得到预测的PM2.5浓度。
5.根据权利要求1所述的基于深度学习模型的大气污染物预测方法,其特征在于,在步骤S1之前,还包括:
步骤S0、通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
6.一种基于深度学习模型的大气污染物预测系统,其特征在于,包括:
图结构数据生成单元,用于将基于监测站点的非结构化输入数据转化成含有结构信息的图结构数据;
GNN模型计算单元,用于利用GNN模型学习监测站点之间的空间交互性以保证每一个监测站点都获取了附近监测站点对其的影响;
GRUA模型计算单元,用于将完成空间关系交互的监测站点数据输入到GRUA模型中来捕获PM2.5的时间依赖性;
预测单元,用于结合要预测的未来时刻k的特征因子,利用全连接网络完成对未来k时刻PM2.5浓度的预测。
7.根据权利要求6所述的基于深度学习模型的大气污染物预测系统,其特征在于,所述图结构数据包括节点属性和边属性,所述节点属性包括当前监测站点的气象因子和土地利用类型,所述边属性表示源监测站点对当前监测站点的污染物浓度影响,包括源监测站点的风向、源监测站点的风速、源监测站点与当前监测站点之间的空间距离、源监测站点与当前监测站点之间的海拔高度差值。
8.根据权利要求6所述的基于深度学习模型的大气污染物预测系统,其特征在于,所述GNN模型的公式表达如下:
Figure FDA0003117851930000031
Figure FDA0003117851930000032
Figure FDA0003117851930000033
其中,图结构G=(V,E),P、Q代表节点属性和边属性,在t时刻节点i的污染物浓度表示为
Figure FDA0003117851930000034
通过结合之前时间步的预测浓度
Figure FDA0003117851930000035
和当前的节点属性Pi t得到,附近节点对节点i的影响表示为
Figure FDA0003117851930000036
通过结合其连接节点的污染物浓度和自身边属性
Figure FDA0003117851930000037
得到,空间相关信息
Figure FDA0003117851930000038
通过汇总i节点所有相邻节点的影响得到。
9.根据权利要求6所述的基于深度学习模型的大气污染物预测系统,其特征在于,所述GRUA模型的公式表达如下:
Figure FDA0003117851930000039
Figure FDA00031178519300000310
Figure FDA0003117851930000041
Figure FDA0003117851930000042
Figure FDA0003117851930000043
Figure FDA0003117851930000044
Figure FDA0003117851930000045
Figure FDA0003117851930000046
Figure FDA0003117851930000047
Figure FDA0003117851930000048
其中,Wz,Wr,Wh,W,v均为可学习的权重矩阵,所述GRUA模型结合节点表示
Figure FDA0003117851930000049
及空间相关信息
Figure FDA00031178519300000410
作为输入信息
Figure FDA00031178519300000411
Figure FDA00031178519300000412
代表更新门,
Figure FDA00031178519300000413
代表重置门,
Figure FDA00031178519300000414
代表当前时间步的记忆信息,
Figure FDA00031178519300000415
通过更新门
Figure FDA00031178519300000416
决定当前时间步记忆信息
Figure FDA00031178519300000417
和前一时间步
Figure FDA00031178519300000418
需要获取的信息,计算出加权输出向量s和最终记忆信息
Figure FDA00031178519300000419
最后通过一个全连接层Ω得到预测的PM2.5浓度。
10.根据权利要求6所述的基于深度学习模型的大气污染物预测系统,其特征在于,还包括训练单元,用于通过相关性分析从结合污染物数据、气象数据、土地利用类型数据中选取与PM2.5相关性较高的特征因子作为节点属性和边属性的特征并作为输入数据进行模型训练和预测。
CN202110667206.XA 2021-06-16 2021-06-16 基于深度学习模型的大气污染物预测方法和系统 Pending CN113496310A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110667206.XA CN113496310A (zh) 2021-06-16 2021-06-16 基于深度学习模型的大气污染物预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110667206.XA CN113496310A (zh) 2021-06-16 2021-06-16 基于深度学习模型的大气污染物预测方法和系统

Publications (1)

Publication Number Publication Date
CN113496310A true CN113496310A (zh) 2021-10-12

Family

ID=77997537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110667206.XA Pending CN113496310A (zh) 2021-06-16 2021-06-16 基于深度学习模型的大气污染物预测方法和系统

Country Status (1)

Country Link
CN (1) CN113496310A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971372A (zh) * 2021-11-02 2022-01-25 浙江凌镜智能有限公司 基于神经网络的风速预测方法及装置
CN114137541A (zh) * 2021-11-18 2022-03-04 国家超级计算深圳中心(深圳云计算中心) 基于Transformer-IRB的短临降雨预测方法、装置和存储介质
CN114266200A (zh) * 2022-02-24 2022-04-01 山东大学 二氧化氮浓度预测方法及系统
CN114548751A (zh) * 2022-02-21 2022-05-27 山东大学 一种监管场景下的突发事件智能推演方法、系统、设备及存储介质
CN116739189A (zh) * 2023-08-14 2023-09-12 中科三清科技有限公司 传输溯源方法、装置、存储介质及电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105493109A (zh) * 2013-06-05 2016-04-13 微软技术许可有限责任公司 使用多个数据源的空气质量推断
US20180224415A1 (en) * 2017-02-08 2018-08-09 International Business Machines Corporation Multi-Source Data Assimilation for Three-Dimensional Environmental Monitoring
CN109147826A (zh) * 2018-08-22 2019-01-04 平安科技(深圳)有限公司 音乐情感识别方法、装置、计算机设备及计算机存储介质
CN109816163A (zh) * 2019-01-15 2019-05-28 深圳中兴网信科技有限公司 污染度预测方法、预测系统及计算机可读存储介质
CN109978228A (zh) * 2019-01-31 2019-07-05 中南大学 一种pm2.5浓度预测方法、装置及介质
CN111210081A (zh) * 2020-01-09 2020-05-29 中国人民解放军国防科技大学 一种基于Bi-GRU的PM2.5数据处理与预测方法
CN111242369A (zh) * 2020-01-09 2020-06-05 中国人民解放军国防科技大学 基于多重融合卷积gru的pm2.5数据预测方法
CN111275168A (zh) * 2020-01-17 2020-06-12 南京信息工程大学 基于卷积全连接的双向门控循环单元的空气质量预测方法
CN112085163A (zh) * 2020-08-26 2020-12-15 哈尔滨工程大学 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法
CN112116080A (zh) * 2020-09-24 2020-12-22 中国科学院沈阳计算技术研究所有限公司 一种融合了注意力机制的cnn-gru水质预测方法
CN113092684A (zh) * 2021-04-07 2021-07-09 青岛理工大学 一种基于时空矩阵分解的空气质量推断方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105493109A (zh) * 2013-06-05 2016-04-13 微软技术许可有限责任公司 使用多个数据源的空气质量推断
US20160125307A1 (en) * 2013-06-05 2016-05-05 Yu Zheng Air quality inference using multiple data sources
US20180224415A1 (en) * 2017-02-08 2018-08-09 International Business Machines Corporation Multi-Source Data Assimilation for Three-Dimensional Environmental Monitoring
CN109147826A (zh) * 2018-08-22 2019-01-04 平安科技(深圳)有限公司 音乐情感识别方法、装置、计算机设备及计算机存储介质
CN109816163A (zh) * 2019-01-15 2019-05-28 深圳中兴网信科技有限公司 污染度预测方法、预测系统及计算机可读存储介质
CN109978228A (zh) * 2019-01-31 2019-07-05 中南大学 一种pm2.5浓度预测方法、装置及介质
CN111210081A (zh) * 2020-01-09 2020-05-29 中国人民解放军国防科技大学 一种基于Bi-GRU的PM2.5数据处理与预测方法
CN111242369A (zh) * 2020-01-09 2020-06-05 中国人民解放军国防科技大学 基于多重融合卷积gru的pm2.5数据预测方法
CN111275168A (zh) * 2020-01-17 2020-06-12 南京信息工程大学 基于卷积全连接的双向门控循环单元的空气质量预测方法
CN112085163A (zh) * 2020-08-26 2020-12-15 哈尔滨工程大学 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法
CN112116080A (zh) * 2020-09-24 2020-12-22 中国科学院沈阳计算技术研究所有限公司 一种融合了注意力机制的cnn-gru水质预测方法
CN113092684A (zh) * 2021-04-07 2021-07-09 青岛理工大学 一种基于时空矩阵分解的空气质量推断方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HAOFEI XIE ET AL.: "Research of PM2.5 prediction system based on CNNs-GRU in Wuxi urban Area", IOP CONFERENCE SERIES: EARTH AND ENVIRONMENTAL SCIENCE, vol. 300, pages 207 *
SHUO WANG ET AL.: "PM2.5-GNN:A domain knowledge enhanced graph neural network for PM2.5 forecasting", SIGSPATIAL\'20:PROCEEDINGS OF THE 28TH INTERNATIONAL CONFERENCE ON ADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS, pages 1 - 5 *
赵鹏飞;魏宏安;: "基于深度学习的城市大气PM2.5浓度预测研究", 现代计算机, no. 12 *
闫增祥: "基于多源时空数据的PM2.5浓度预测", 《中国优秀硕士学位论文全文数据库 工程科技I辑》, no. 08 *
陈敏: "认知计算导论", 31 May 2017, 华中科技大学出版社 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113971372A (zh) * 2021-11-02 2022-01-25 浙江凌镜智能有限公司 基于神经网络的风速预测方法及装置
CN114137541A (zh) * 2021-11-18 2022-03-04 国家超级计算深圳中心(深圳云计算中心) 基于Transformer-IRB的短临降雨预测方法、装置和存储介质
CN114548751A (zh) * 2022-02-21 2022-05-27 山东大学 一种监管场景下的突发事件智能推演方法、系统、设备及存储介质
CN114548751B (zh) * 2022-02-21 2024-05-31 山东大学 一种监管场景下的突发事件智能推演方法、系统、设备及存储介质
CN114266200A (zh) * 2022-02-24 2022-04-01 山东大学 二氧化氮浓度预测方法及系统
CN114266200B (zh) * 2022-02-24 2022-07-05 山东大学 二氧化氮浓度预测方法及系统
CN116739189A (zh) * 2023-08-14 2023-09-12 中科三清科技有限公司 传输溯源方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US20210271934A1 (en) Method and System for Predicting Wildfire Hazard and Spread at Multiple Time Scales
CN113496310A (zh) 基于深度学习模型的大气污染物预测方法和系统
CN111639787B (zh) 一种基于图卷积网络的时空数据预测方法
Ceci et al. Predictive modeling of PV energy production: How to set up the learning task for a better prediction?
Zhang et al. Correction model for rainfall forecasts using the LSTM with multiple meteorological factors
US11720727B2 (en) Method and system for increasing the resolution of physical gridded data
CN114240000A (zh) 一种基于时空图卷积网络的空气质量预测方法
Zheng et al. Weather image-based short-term dense wind speed forecast with a ConvLSTM-LSTM deep learning model
CN117556197B (zh) 一种基于人工智能的台风涡旋初始化方法
Ramseyer et al. Atmospheric controls on Puerto Rico precipitation using artificial neural networks
CN116894384B (zh) 一种多风机风速时空预测方法及系统
Vakitbilir et al. Hybrid deep learning models for multivariate forecasting of global horizontal irradiation
Shi et al. SA-JSTN: Self-attention joint spatiotemporal network for temperature forecasting
CN118094487B (zh) 基于时空感知机制的多源气象要素预测降水的方法及系统
KR20220095092A (ko) 인공 지능을 이용한 산불 취약성 지도 생성 방법 및 그 장치
Nourani et al. Multi-step-ahead solar irradiance modeling employing multi-frequency deep learning models and climatic data
CN109829583B (zh) 基于概率编程技术的山火风险预测方法
CN116722544A (zh) 分布式光伏短期预测方法、装置、电子设备及存储介质
Zhang et al. A deep-learning real-time bias correction method for significant wave height forecasts in the Western North Pacific
Sahai et al. A bias-correction and downscaling technique for operational extended range forecasts based on self organizing map
Dong et al. Tropical cyclone track prediction with an encoding-to-forecasting deep learning model
Yang et al. HiGRN: a hierarchical graph recurrent network for global sea surface temperature prediction
Kim et al. Analysis of AI-based techniques for forecasting water level according to rainfall
Chen et al. A Spatio-Temporal Attention Graph Convolutional Networks for Sea Surface Temperature Prediction
CN117233866A (zh) 基于cnop的气象集合预报系统、方法与存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination