CN113988348A - 一种网格化监测的空气质量预测方法 - Google Patents

一种网格化监测的空气质量预测方法 Download PDF

Info

Publication number
CN113988348A
CN113988348A CN202010661832.3A CN202010661832A CN113988348A CN 113988348 A CN113988348 A CN 113988348A CN 202010661832 A CN202010661832 A CN 202010661832A CN 113988348 A CN113988348 A CN 113988348A
Authority
CN
China
Prior art keywords
monitoring
air
matrix
pollutant concentration
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010661832.3A
Other languages
English (en)
Inventor
祁柏林
王宁
郭昆鹏
杨彬
杜毅明
魏景峰
王继娜
刘闽
王兴刚
范秋枫
孟繁星
陈月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Institute of Computing Technology of CAS
Original Assignee
Shenyang Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Institute of Computing Technology of CAS filed Critical Shenyang Institute of Computing Technology of CAS
Priority to CN202010661832.3A priority Critical patent/CN113988348A/zh
Publication of CN113988348A publication Critical patent/CN113988348A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

本发明涉及一种网格化监测中的空气质量预测方法。该方法首先将用户输入的网格化监测中各个监测站的位置信息和历史空气污染物浓度信息进行数据清洗,然后将处理过的数据输入GCN来提取各个监测站之间的空间关联信息,再将具备空间信息的数据输入LSTM提取时间特征,最后由一个线性回归层来综合GCN和LSTM所提取的特征并产生预测结果,返回给用户。本发明方法通过相关实验验证了方法的有效性。

Description

一种网格化监测的空气质量预测方法
技术领域
本发明涉及深度学习领域,具体的说是一种基于GCN和LSTM的网格化监测的空气质量预测方法。
背景技术
随着我国环境监测技术和理念的不断发展,空气中污染物浓度的网格化监测技术越来越受到相关工作人员的青睐,这种空气中污染物浓度的网格化监测技术可以在一定程度上达到污染源头早发现,早治理的效果,但是由于网格化监测所产生的各个监测站的监测数据是具有明显的空间关联信息的,而现有的空气质量预测算法很少会考虑到监测站之间的空间关联特征,这也就使得在网格化监测中使用常规的预测方法会由于忽略网格化监测中的空间关联特征而导致一定的预测精度的损失。
发明内容
针对上述技术不足,通过分析网格化监测中监测站的空气中污染物浓度数据的变化趋势发现,在网格化监测中空气中污染物浓度数据的变化趋势和网格化监测中的各个监测点的空间关联具有一定的联系,本发明要解决的技术问题就是提取网格化监测中监测站点之间的空间关联特征,并提高网格化监测的空气中污染物浓度数据(空气质量)的预测精度。
本发明解决其技术问题所采用的技术方案是:一种网格化监测的空气质量预测方法,包括以下步骤:
1)获取空气质量网格化监测区域内各个监测站采集的K个时刻内历史空气中污染物浓度数据;
2)将历史空气中污染物浓度数据转换成时间序列并归一化;
3)利用各个监测站的经纬度信息和监测站之间的最大影响距离获取空气质量网格化监测区域中监测站的空间关联拓扑图并归一化;
4)将归一化后的每组空气中污染物浓度的时间序列的前n个时刻数据和归一化后的空间关联拓扑图即邻接矩阵输入至预测模型中,每组时间序列中从第n+1到第n+k时刻的各个监测站历史空气中污染物浓度数据作为预测模型的期望输出,对预测模型进行训练;k为需要预测的时间长度;
5)获取需要预测的时间段中第一个时刻的前n个时刻的空气中污染物浓度数据,转换成时间序列并归一化,将归一化后的时间序列和归一化后的空间关联拓扑图输入至训练好的预测模型中,通过逆归一化处理得到需要预测时刻的污染物浓度。
所述将历史空气中污染物浓度数据转换成时间序列,具体如下:
将每个时刻的N个监测站的空气中污染物浓度数据聚合成一个N×1的矩阵Xi,i表示第i个时刻;
然后再将所有时刻的空气中污染物浓度数据X1...Xi...XM按照每若干个时刻为一组构成空气中污染物浓度的时间序列,M表示按照上述N个监测站聚合成一个矩阵的方式将所有输入数据聚合后产生的矩阵个数,M=L*(n+k);其中前n个时刻的数据为特征数据作为模型训练时的输入,从n+1到n+k个时刻的数据为标签作为模型训练时的期望输出用来调整预测模型,最终得出时间序列的维度为(L,n+k,N),其中L表示空气中污染物浓度序列个数。
所述利用各个监测站的经纬度信息和监测站之间的最大影响距离获取空气质量网格化监测区域内监测站的空间关联拓扑图,具体如下:
首先,根据空气质量网格化监测区域中每两个监测站之间的距离构建一个N×N的距离矩阵V;V的各距离元素d通过下式得到:
Figure BDA0002578857120000021
其中,d代表两个监测站之间的地表距离,R代表地球的半径,
Figure BDA0002578857120000022
分别表示两个监测站纬度的弧度值,γ表示两个监测站之间的经度差值的弧度值,辅助函数haversin(θ)=sin2(θ/2),θ表示由以地心为圆心的监测站点的经纬度转换而成的弧度值。
然后,根据设定的监测站之间的最大影响距离来调整距离矩阵V:将距离矩阵中超过最大影响距离的距离元素d值调整为0,得到监测站的邻接矩阵A;
最后,再通过在邻接矩阵中添加自环,得到调整后的邻接矩阵A′;其中A′=A+I,I为N×N的单位矩阵。
空间关联拓扑图即邻接矩阵的归一化具体如下:
根据邻接矩阵A′获取A′的度矩阵D;
通过下式完成空间关联拓扑图的对称归一化
Figure BDA0002578857120000031
其中,
Figure BDA0002578857120000032
为对称归一化后的空间关联拓扑图即邻接矩阵。
所述对预测模型进行训练包括以下步骤:
(1)建立GCN、LSTM和线性回归层顺序组合而成的预测模型:
GCN的输入包括归一化后的空气中污染物时间序列中每一组的前n个时刻的特征数据和归一化后的空间关联拓扑图
Figure BDA0002578857120000033
GCN的输出矩阵为P,P的大小是N×J,其中N表示网格化监测区域中的监测站个数,J表示GCN网络中最后一层的隐含节点的数量;
LSTM的输入为矩阵P,LSTM的输出为J×O的矩阵G,其中J表示GCN网络中最后一层的隐含节点的数量,O表示LSTM网络中最后一层的隐含节点数量;
线性回归层的输入为LSTM的输出矩阵G,线性回归层的输出为N×1的矩阵S;
(2)根据预测模型产生的矩阵S、与输入的归一化后的空气中污染物的时间序列的标签即每一组中的从第n+1个时刻到第n+k个时刻各个监测站的空气中污染物浓度之间的损失函数来调整GCN、LSTM和线性回归层中的参数;
(3)将调整好的参数带入预测模型中,得到训练好的预测模型。
所述逆归一化具体如下:
Figure BDA0002578857120000041
其中,yi为逆归一化后的空气中污染物浓度的真实预测值,
Figure BDA0002578857120000042
为预测模型产生的逆归一化之前处于[0,1]范围内的空气中污染物浓度的预测值,xmax为输入的历史n时刻中空气中污染物浓度数据中的最大空气中污染物浓度,xmin为输入的历史n时刻中空气中污染物浓度数据中最小的空气中污染物浓度。
一种网格化监测的空气质量预测装置,包括存储器,存储器上存有程序,所述程序通过处理器调用执行如权利要求1所述的一种网格化监测的空气质量预测方法的步骤。
本发明具有以下有益效果及优点:
1.本发明通过加入GCN网络结构,实现了网格化监测中不同监测点之间空间关联信息的特征提取,提高了网格化监测中空气中污染物浓度的预测精度。
2.本发明使用了LSTM网络,可以更好的通过时间序列的输入抽取数据主要的特征,相比于传统的RNN可以更好的解决特征的长期依赖问题,提高网格化监测中空气中污染物浓度的预测精度。
3.本发明通过线性回归层来综合GCN和LSTM提取的时空特征,调整结果的输入维度,提高了模型的拟合效果,进一步提高预测的精度。
附图说明
图1为本发明的网格化监测的空气质量预测算法流程图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明。
本发明为实现上述目的所采用的技术方案是:一种网格化监测的空气质量预测算法,包括以下步骤:
步骤1:用户输入网格化监测中各个监测站的历史空气中污染物浓度数据,网格化监测中各个监测站的经纬度信息和网格化监测中监测站之间的最大影响距离。其中,网格化监测为:按照一定的划分方式在常规的监测区域内使用大量的小微型监测站构成一个分布密集的,监测站之间具备空间关联的空气质量监测网络。
步骤2:将用户输入的历史空气中污染物浓度数据转换成时间序列。
步骤3:利用输入的监测站的经纬度信息和监测站之间的最大影响距离获取网格化监测中监测站的空间关联拓扑图(邻接矩阵)。
步骤4:将空气中污染物浓度的时间序列进行归一化。
步骤5:将网格化监测中监测站的空间关联拓扑图进行对称归一化。
步骤6:将空气中污染物浓度的时间序列和网格化监测中监测站之间的邻接矩阵输入GCN网络中,提取空间特征。
步骤7:将由GCN网络产生的带有空间特征的时间序列输入到LSTM网络中,提取时间特征。
步骤8:将由LSTM网络产生的具备时空特征的数据输入到线性回归层,得到各个监测站的空气中污染物浓度(空气质量)预测数据。
步骤9:将预测的空气中污染物浓度进行逆归一化处理得到真实的预测结果。
步骤10:将空气中污染物浓度(空气质量)的预测结果返回给用户。
以下说明为使用网格化监测中各个监测站的前6个小时的历史空气质量数据来预测未来1个小时的空气质量为例。
空气中污染物浓度数据时间序列转换方法如下:
首先将按照空气中污染物浓度数据的采集时间划分,将每个小时的N个监测站的空气中污染物浓度数据聚合成一个N×1的矩阵Xi,然后再将所有时刻的空气中污染物浓度数据X1...Xi...XM按照每7个小时为一组构成空气中污染物浓度的时间序列,其中前6个小时为特征数据,第7个小时为标签,最终得出的时间序列维度为(L,7,N)其中L表示一共有L组空气中污染物浓度序列。
网格化监测中监测站的空间关联拓扑图构建方法如下:
首先利用如下公式来计算网格化监测中每个监测站之间的距离构建一个N×N的距离矩阵V。
Figure BDA0002578857120000061
其中d代表两个监测站之间的距离,R代表地球的半径6371km,
Figure BDA0002578857120000062
表示两个监测站的纬度的弧度值,γ表示两个监测站点之间的经度的差值的弧度值,haversin()是一个辅助函数,haversin()的计算公式如下:
haversin(θ)=sin2(θ/2)
其中的θ表示弧度。
然后根据用户输入的监测站之间的最大影响距离来调整距离矩阵V,也就是将距离矩阵中距离超过最大影响距离的位置的值调整为0,得到监测站的邻接矩阵A,最后再通过在邻接矩阵中添加自环,得到调整后的邻接矩阵A′。其中A′=A+I,I为N×N的单位矩阵。
空气中污染物浓度时间序列的归一化算法如下:
首先遍历空气中污染物浓度的时间序列找出最大值xmax和最小值xmin然后使用如下公式:
Figure BDA0002578857120000063
将空气中污染物浓度的时间序列进行归一化,其中xi为归一化之前的空气中污染物的浓度值,
Figure BDA0002578857120000064
为归一化之后的值。
网格化监测中监测站的空间关联拓扑图的对称归一化算法如下:
首先根据之前得到的网格化监测中监测站的邻接矩阵A′获取A′的度矩阵D然后使用如下公式来完成空间关联拓扑图的对称归一化
Figure BDA0002578857120000065
其中
Figure BDA0002578857120000066
为对称归一化后的空间关联拓扑图,也就是对称归一化的网格化监测中监测站之间的邻接矩阵。
运用GCN网络来抽取网格化监测中各个监测站之间的空间关联特征:
GCN是图卷积神经网络模型,其原理是通过图的邻接矩阵和节点的特征矩阵来提取图上空间特征的一种卷积神经网络。使用GCN网络的好处就是相比于CNN和RNN,GCN可以有效的提取非欧结构的图数据之间的空间特征,而网格化监测中监测站之间的空间关联拓扑图就是一种典型的非欧结构的图数据。
在本发明的预测模型中,GCN层的输入为归一化后的空气中污染物的时间序列中每一组的前6个小数数据也就是时间序列中的特征数据和对称归一化后的邻接矩阵,对于一个经过GCN处理后的输出矩阵P,P的大小是N×J,其中N表示网格化监测中的监测站个数,J表示GCN网络中最后一层的隐含节点的数量。运用LSTM网络来抽取历史空气中污染物浓度数据中的时间特征:
LSTM就是长短期记忆神经网络,其原理是通过输入门,输出门和遗忘门这3种门控单元来控制网络中的信息传递的一种循环神经网络,使用LSTM的好处在于LSTM网络可以通过3种门结构解决传统RNN中信息的长期依赖问题,从而达到一个更好的特征提取结果。
在本发明的预测模型中,LSTM的输入为调整过的上一步GCN所产生输出矩阵PN×J,LSTM的输出为J×O的矩阵G,其中J表示GCN网络中最后一层的隐含节点的数量,O表示LSTM网络中最后一层的隐含节点数量。
运用线性回归层来产生未来1小时的空气中污染物浓度(空气质量)的预测值:
线性回归层的原理是通过神经网络中的训练来不断调整a和b,使得
Figure BDA0002578857120000071
尽可能小。使用线性回归层可以将之前几步提取的空间特征和时间特征进行综合然后得出未来1小时网格化监测中各个监测站的空气中污染物的浓度。其中a和b表示线性回归层的模型参数,i表示第i组时间序列,m表示模型训练时输入的时间序列组数。
在本发明的预测模型中,线性回归层的输入为LSTM的输出矩阵GJ×O,线性回归层的输出为N×1的矩阵S,其中N表示网格化监测中的监测站的数量,最后根据模型产生的预测矩阵S与输入的归一化后的空气中污染物的时间序列的标签也就是每一组中的第7个小时各个监测站的空气中污染物浓度之间的损失函数来调整GCN,LSTM和线性回归层中的参数。
空气中污染物浓度预测值的逆归一化方法:
此步骤出现在模型的使用阶段,当用户使用训练完成的预测模型时,需要输入需要预测时刻的前6个小时已知的网格化监测中各个监测站的空气中污染物浓度值,各个监测站的经纬度信息和用户定义的网格化监测中监测站之间的最大影响距离,然后使用上述方法将前6个小时的空气中污染物浓度值进行时间序列转换和归一化,将监测站之间的经纬度信息和最大影响距离转换为监测站之间的邻接矩阵,然后对邻接矩阵进行归一化,最后将归一化后的污染物时间序列和邻接矩阵输入到训练完成的预测模型中得出处于[0,1]之间的未来一小时污染物浓度预测,然后使用如下公式来进行空气中污染物浓度预测值的逆归一化转变:
Figure BDA0002578857120000081
其中的yi为逆归一化后的空气中污染物浓度的真实预测值,
Figure BDA0002578857120000082
为模型产生的逆归一化之前处于[0,1]范围内的空气中污染物浓度的预测值,xmax为输入的历史6小时中空气中污染物浓度原始数据中的最大空气中污染物浓度,xmin为为输入的历史6小时中空气中污染物浓度数据中最小的空气中污染物浓度。
其中步骤2中输入的历史空气中污染物浓度的原始数据格式如下(以PM2.5的浓度数据为例):
监测站 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00
A站
B站
将原始数据转换成时间序列的方式为:按列聚合成N个B矩阵,其中N为输入数据的时间长度,B矩阵是一个M×1的矩阵,M为监测站点的个数,然后再将B矩阵按照7(6+1)个小时的时间间隔聚合成N-7个X矩阵,X矩阵为7×M的矩阵,这样得到的X1到XN-7为转换后的时间序列。
步骤3:用户输入的原始数据格式如下:
站点 经度 纬度
A站
B站
首先使用原始数据计算出各个站点之间的距离矩阵,然后根据用户输入的最大影响距离得出邻接矩阵。
实例:
输入为:
站点 经度 纬度
A站 123.556854 41.762261
B站 123.525083 41.751233
C站 123.439275 41.715011
首先计算各个站点之间的距离矩阵,得出距离矩阵为:(距离单位km)
Figure BDA0002578857120000091
然后根据用户输入的监测站之间的最大影响距离k调整距离矩阵,假设用户输入的最大影响距离k=9(单位km),则调整后的矩阵为:
Figure BDA0002578857120000092
然后对调整后的距离矩阵添加自环,得出调整后的邻接矩阵:
Figure BDA0002578857120000093
步骤4:这一步是将步骤2所得到的空气中污染物浓度的时间序列矩阵映射到[0,1]之间,也就是归一化。
实例:
假设步骤二中转换后的空气中污染物浓度的时间序列中的最大空气中污染物浓度xmax=300,最小空气中污染物浓度xmin=24,在时间序列中任取一个空气中污染物浓度使用如下公式进行转换:
Figure BDA0002578857120000094
假设xi的取值为100时归一化后的
Figure BDA0002578857120000095
为0.275。
步骤5:将步骤3得到的网格化监测中的各个监测站之间的邻接矩阵进行对称归一化处理。
实例:
首先由步骤3得到的邻接矩阵为:
Figure BDA0002578857120000101
然后由邻接矩阵得出邻接矩阵的度矩阵为:
Figure BDA0002578857120000102
最后根据公式
Figure BDA0002578857120000103
得出对称归一化后的邻接矩阵:
Figure BDA0002578857120000104
步骤6:将上述处理好的数据输入到GCN网络中提取空间特征。
步骤7:将步骤6产生的具备空间特征的数据输入到LSTM网络中,提取时间特征。
步骤8:将步骤7产生的具备时空特征的数据输入线性回归层得出预测数据,然后根据模型产生的预测数据与输入的时间序列的期望输出之间的损失函数值来调整预测模型。
步骤9:利用训练完成的预测模型来产生预测数据并将预测数据进行逆归一化得到真实的预测值,其中模型的输入为需要预测时刻的前6个时刻的网格化检测中各个监测站的空气中污染物浓度的归一化后的值,和根据网格化监测中各个监测站的经纬度信息和网格化监测中最大影响距离,得出的网格化监测中监测站的邻接矩阵(需要将邻接矩阵进行对称归一化处理),然后再通过模型得到处于[0,1]之间的预测数据,最后再对产生的预测数据进行逆归一化处理
实例:
当训练完成的预测模型根据输入产生的某个监测站的预测数据为0.563时,逆归一化后的预测数据为:179.388。
步骤10:将最终得到的各个监测站的预测结果返回给用户。
本发明不但可以有效的使用由网格化监测中各个监测站所产生的空气中污染物浓度数据和网格化检测中各个监测站之间的空间关联信息,还可以提高网格化监测中各个监测站未来空气中污染物浓度(空气质量)的预测精度。
因此本发明给出了一种网格化监测的空气质量预测算法,可以利用网格化监测中监测站之间的空间关联信息和历史空气中污染物浓度数据来给出更加精准的未来网格化监测中各个监测站的空气中污染物浓度(空气质量)的预测数据。

Claims (7)

1.一种网格化监测的空气质量预测方法,其特征在于包括以下步骤:
1)获取空气质量网格化监测区域内各个监测站采集的K个时刻内历史空气中污染物浓度数据;
2)将历史空气中污染物浓度数据转换成时间序列并归一化;
3)利用各个监测站的经纬度信息和监测站之间的最大影响距离获取空气质量网格化监测区域中监测站的空间关联拓扑图并归一化;
4)将归一化后的每组空气中污染物浓度的时间序列的前n个时刻数据和归一化后的空间关联拓扑图即邻接矩阵输入至预测模型中,每组时间序列中从第n+1到第n+k时刻的各个监测站历史空气中污染物浓度数据作为预测模型的期望输出,对预测模型进行训练;k为需要预测的时间长度;
5)获取需要预测的时间段中第一个时刻的前n个时刻的空气中污染物浓度数据,转换成时间序列并归一化,将归一化后的时间序列和归一化后的空间关联拓扑图输入至训练好的预测模型中,通过逆归一化处理得到需要预测时刻的污染物浓度。
2.根据权利要求1所述的一种网格化监测的空气质量预测方法,其特征在于:所述将历史空气中污染物浓度数据转换成时间序列,具体如下:
将每个时刻的N个监测站的空气中污染物浓度数据聚合成一个N×1的矩阵Xi,i表示第i个时刻;
然后再将所有时刻的空气中污染物浓度数据X1...Xi...XM按照每若干个时刻为一组构成空气中污染物浓度的时间序列,M表示按照上述N个监测站聚合成一个矩阵的方式将所有输入数据聚合后产生的矩阵个数,M=L*(n+k);其中前n个时刻的数据为特征数据作为模型训练时的输入,从n+1到n+k个时刻的数据为标签作为模型训练时的期望输出用来调整预测模型,最终得出时间序列的维度为(L,n+k,N),其中L表示空气中污染物浓度序列个数。
3.根据权利要求1所述的一种网格化监测的空气质量预测方法,其特征在于:所述利用各个监测站的经纬度信息和监测站之间的最大影响距离获取空气质量网格化监测区域内监测站的空间关联拓扑图,具体如下:
首先,根据空气质量网格化监测区域中每两个监测站之间的距离构建一个N×N的距离矩阵V;V的各距离元素d通过下式得到:
Figure FDA0002578857110000021
其中,d代表两个监测站之间的地表距离,R代表地球的半径,
Figure FDA0002578857110000022
分别表示两个监测站纬度的弧度值,γ表示两个监测站之间的经度差值的弧度值,辅助函数haversin(θ)=sin2(θ/2),θ表示由以地心为圆心的监测站点的经纬度转换而成的弧度值。
然后,根据设定的监测站之间的最大影响距离来调整距离矩阵V:将距离矩阵中超过最大影响距离的距离元素d值调整为0,得到监测站的邻接矩阵A;
最后,再通过在邻接矩阵中添加自环,得到调整后的邻接矩阵A′;其中A′=A+I,I为N×N的单位矩阵。
4.根据权利要求1所述的一种网格化监测的空气质量预测方法,其特征在于:空间关联拓扑图即邻接矩阵的归一化具体如下:
根据邻接矩阵A′获取A′的度矩阵D;
通过下式完成空间关联拓扑图的对称归一化
Figure FDA0002578857110000023
其中,
Figure FDA0002578857110000024
为对称归一化后的空间关联拓扑图即邻接矩阵。
5.根据权利要求1所述的一种网格化监测的空气质量预测方法,其特征在于:所述对预测模型进行训练包括以下步骤:
(1)建立GCN、LSTM和线性回归层顺序组合而成的预测模型:
GCN的输入包括归一化后的空气中污染物时间序列中每一组的前n个时刻的特征数据和归一化后的空间关联拓扑图
Figure FDA0002578857110000031
GCN的输出矩阵为P,P的大小是N×J,其中N表示网格化监测区域中的监测站个数,J表示GCN网络中最后一层的隐含节点的数量;
LSTM的输入为矩阵P,LSTM的输出为J×O的矩阵G,其中J表示GCN网络中最后一层的隐含节点的数量,O表示LSTM网络中最后一层的隐含节点数量;
线性回归层的输入为LSTM的输出矩阵G,线性回归层的输出为N×1的矩阵S;
(2)根据预测模型产生的矩阵S、与输入的归一化后的空气中污染物的时间序列的标签即每一组中的从第n+1个时刻到第n+k个时刻各个监测站的空气中污染物浓度之间的损失函数来调整GCN、LSTM和线性回归层中的参数;
(3)将调整好的参数带入预测模型中,得到训练好的预测模型。
6.根据权利要求1所述的一种网格化监测的空气质量预测方法,其特征在于:所述逆归一化具体如下:
Figure FDA0002578857110000032
其中,yi为逆归一化后的空气中污染物浓度的真实预测值,
Figure FDA0002578857110000033
为预测模型产生的逆归一化之前处于[0,1]范围内的空气中污染物浓度的预测值,xmax为输入的历史n时刻中空气中污染物浓度数据中的最大空气中污染物浓度,xmin为输入的历史n时刻中空气中污染物浓度数据中最小的空气中污染物浓度。
7.一种网格化监测的空气质量预测装置,其特征在于,包括存储器,存储器上存有程序,所述程序通过处理器调用执行如权利要求1所述的一种网格化监测的空气质量预测方法的步骤。
CN202010661832.3A 2020-07-10 2020-07-10 一种网格化监测的空气质量预测方法 Pending CN113988348A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010661832.3A CN113988348A (zh) 2020-07-10 2020-07-10 一种网格化监测的空气质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010661832.3A CN113988348A (zh) 2020-07-10 2020-07-10 一种网格化监测的空气质量预测方法

Publications (1)

Publication Number Publication Date
CN113988348A true CN113988348A (zh) 2022-01-28

Family

ID=79731252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010661832.3A Pending CN113988348A (zh) 2020-07-10 2020-07-10 一种网格化监测的空气质量预测方法

Country Status (1)

Country Link
CN (1) CN113988348A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115792137A (zh) * 2023-01-17 2023-03-14 河北先河环保科技股份有限公司 大气污染溯源方法及装置、终端
CN116168771A (zh) * 2023-04-26 2023-05-26 北京建工环境修复股份有限公司 一种基于物联网的河流中全氟化合物污染监测方法及系统
CN116341763A (zh) * 2023-05-23 2023-06-27 西南交通大学 一种空气质量预测方法
CN116776104A (zh) * 2023-08-21 2023-09-19 华南理工大学 基于机器学习实现大气成分的变化规律分析方法及系统
CN117129638A (zh) * 2023-10-26 2023-11-28 江西怡杉环保股份有限公司 一种区域空气环境质量监测方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115792137A (zh) * 2023-01-17 2023-03-14 河北先河环保科技股份有限公司 大气污染溯源方法及装置、终端
CN115792137B (zh) * 2023-01-17 2023-06-06 河北先河环保科技股份有限公司 大气污染溯源方法及装置、终端
CN116168771A (zh) * 2023-04-26 2023-05-26 北京建工环境修复股份有限公司 一种基于物联网的河流中全氟化合物污染监测方法及系统
CN116341763A (zh) * 2023-05-23 2023-06-27 西南交通大学 一种空气质量预测方法
CN116341763B (zh) * 2023-05-23 2023-07-28 西南交通大学 一种空气质量预测方法
CN116776104A (zh) * 2023-08-21 2023-09-19 华南理工大学 基于机器学习实现大气成分的变化规律分析方法及系统
CN116776104B (zh) * 2023-08-21 2023-11-10 华南理工大学 基于机器学习实现大气成分的变化规律分析方法及系统
CN117129638A (zh) * 2023-10-26 2023-11-28 江西怡杉环保股份有限公司 一种区域空气环境质量监测方法及系统
CN117129638B (zh) * 2023-10-26 2024-01-12 江西怡杉环保股份有限公司 一种区域空气环境质量监测方法及系统

Similar Documents

Publication Publication Date Title
CN113988348A (zh) 一种网格化监测的空气质量预测方法
CN111210633B (zh) 一种基于深度学习的短时交通流预测方法
CN109308522B (zh) 一种基于循环神经网络的gis故障预测方法
CN111223301B (zh) 一种基于图注意力卷积网络的交通流量预测方法
CN110427846B (zh) 一种利用卷积神经网络对不平衡小样本的人脸识别方法
CN111080032A (zh) 一种基于Transformer结构的负荷预测方法
CN111506835B (zh) 一种融合用户时间特征和个性特征的数据特征提取方法
CN112634608B (zh) 一种区域交通流量预测方法及系统
CN110119853B (zh) 基于时间序列监测数据分析的供水管网漏损报警阈值选取方法
CN113240170A (zh) 一种基于季节性循环神经网络的空气质量预测方法
Xu et al. HighAir: A hierarchical graph neural network-based air quality forecasting method
CN110346518B (zh) 一种交通排放污染可视化预警方法及其系统
CN109086926B (zh) 一种基于组合神经网络结构的短时轨道交通客流预测方法
CN112766600B (zh) 一种城市区域人群流量预测方法及系统
CN112149887A (zh) 一种基于数据时空特征的pm2.5浓度预测方法
CN112733693B (zh) 一种全局感知高分辨率遥感影像多尺度残差道路提取方法
CN116307152A (zh) 时空交互式动态图注意力网络的交通预测方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN116307212A (zh) 一种新型空气质量预测方法及系统
CN115862319A (zh) 一种面向时空图自编码器的交通流量预测方法
CN115238749A (zh) 一种基于Transformer的特征融合的调制识别方法
CN113657582A (zh) 一种基于时空数据的时空图神经网络瓦斯浓度预测方法
CN116341763B (zh) 一种空气质量预测方法
CN113657023A (zh) 基于机器学习和深度学习结合的近地面臭氧浓度反演方法
CN112862084A (zh) 基于深度迁移融合学习的交通流量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination