CN116341763B - 一种空气质量预测方法 - Google Patents
一种空气质量预测方法 Download PDFInfo
- Publication number
- CN116341763B CN116341763B CN202310581242.3A CN202310581242A CN116341763B CN 116341763 B CN116341763 B CN 116341763B CN 202310581242 A CN202310581242 A CN 202310581242A CN 116341763 B CN116341763 B CN 116341763B
- Authority
- CN
- China
- Prior art keywords
- time
- data
- air quality
- input
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000007787 long-term memory Effects 0.000 claims abstract description 15
- 230000006403 short-term memory Effects 0.000 claims abstract description 13
- 239000000809 air pollutant Substances 0.000 claims abstract description 6
- 231100001243 air pollutant Toxicity 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000012544 monitoring process Methods 0.000 claims description 46
- 239000011159 matrix material Substances 0.000 claims description 33
- 239000004973 liquid crystal related substance Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 25
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 12
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 9
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 claims description 9
- 229910002091 carbon monoxide Inorganic materials 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- MGWGWNFMUOTEHG-UHFFFAOYSA-N 4-(3,5-dimethylphenyl)-1,3-thiazol-2-amine Chemical compound CC1=CC(C)=CC(C=2N=C(N)SC=2)=C1 MGWGWNFMUOTEHG-UHFFFAOYSA-N 0.000 claims description 7
- JCXJVPUVTGWSNB-UHFFFAOYSA-N nitrogen dioxide Inorganic materials O=[N]=O JCXJVPUVTGWSNB-UHFFFAOYSA-N 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 3
- 239000010419 fine particle Substances 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 239000002245 particle Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 5
- 238000007418 data mining Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 22
- 239000003344 environmental pollutant Substances 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 229910000831 Steel Inorganic materials 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013618 particulate matter Substances 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 239000010959 steel Substances 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种空气质量预测方法,包括基于时空特征提取空气质量参数进行预测,属于数据挖掘技术领域。首先对数据集进行处理,其次构建了一种包含图卷积神经网络、长短期记忆网络以及时间卷积网络的时空子网络提取数据的空间特征和时间特征。最后,构建预测器融合抽取的时空特征实现最终的多任务空气质量预测。本发明可用于实际场景当中,它能够获取空气质量数据中的时空特性,同时该发明实现了多任务空气污染物浓度的预测,具有良好的普适性。
Description
技术领域
本发明属于数据挖掘技术领域,尤其涉及一种基于时空特征提取的空气质量预测方法。
背景技术
随着工业化和城市化的快速发展,人们对空气质量的变化越来越重视,空气质量指数可以表示空气污染程度,要计算空气质量指数就要分别计算细颗粒物、可吸入颗粒物、二氧化硫、二氧化氮、臭氧、一氧化碳等各项污染物的实测浓度值。通过预测各项空气污染物的浓度从而预测出未来的空气质量,对严重污染事件发出预警,提前指定方案应对,对人类社会具有重要意义。近年来,空气质量预测模型经过了物理模型、数据驱动模型到深度学习模型的转变。特别地,循环卷积神经网络(recurrent neural network,RNN)以及它的变体模型:门控卷积网络(gate recurrent unit,GRU)和长短时记忆网络(long short-termmemory,LSTM),它们在捕获时间依赖性方面表现良好。卷积神经网络(convolutionalneural network,CNN)常被用于提取局部的特征去建模时空相关性,图卷积网络(graphconvolutional network,GCN)由于它强大的处理非欧几里得结构数据的能力,大幅度地提高了空气质量预测性能。但是,空气质量预测仍然存在着以下的问题:第一,基于目前现有的空气质量预测模型对数据的空间特征与时间特征提取不充分,使得预测效果不佳。第二,目前现有的模型往往是对单个任务例如未来细颗粒物浓度进行预测,很少考虑同时对多个任务例如二氧化硫、臭氧、可吸入颗粒物、一氧化碳等空气污染物浓度进行预测。因此,探索基于深度学习时空特征提取的多任务空气质量预测方法是十分有意义的。
1.时空特征提取
通过对现有的专利及相关技术的检索发现,现有的与空气质量预测时空特征提取相关的方法有:
(1)韩启龙,门瑞,陈睿等。一种基于多维度二次特征提取的多任务学习的空气质量预测方法:CN111814956A[P].2020. 提出一种基于多维度二次特征提取的多任务学习的空气质量预测方法。该方法从空间,时间和时空三个角度考虑与污染物值相关的影响信息,使信息相互影响,达到较为准确的空气质量预测;
(2)贾永坡,来博文,李毅仁,et al.一种基于相关图卷积网络的钢厂空气质量预测方法:CN114723127A[P].2022.提出了一种基于相关图卷积网络的钢厂空气质量预测方法。该模型通过单层感知器获得监测点之间的图关系;进一步地,通过学习历史时间步钢厂空气质量时空网络序列的图信号特征,对未来多个小时的空气质量指数进行预测;
目前的时空特征提取方法虽然实现了时间特征与空间特征的提取,但是并没有考虑到不同的监测站点构图以及时间特征二次提取对有效提高空气质量预测精度的必要性。
2.多任务学习
通过对现有的专利及相关技术的检索发现,现有的与多任务学习相关的空气质量预测方法有:
(1)王敬昌,陈岭,丁怡芳等。一种基于深度多任务学习的城市AQI预测与空间细粒度AQI等级估计方法:CN109063908A[P].2018.提出了能够预测空气质量的多任务预测模型,该模型将不同任务的损失函数相加后进行优化,实现了多任务预测;
但是,以上方法对于不同任务的损失函数只是简单相加,这会导致损失函数较大的任务例如臭氧、细颗粒物的预测占主导情况,而loss较小的任务例如一氧化碳、二氧化硫无法得到准确的更新。因此,我们对多任务损失函数进行了算法设计,提出了可学习的噪声参数使不同范围的数据都能够得到有效的更新。
发明内容
本发明的目的是提供一种空气质量预测方法,它能有效地解决地区无法实现准确的空气质量预测的技术问题。
实现本发明的技术路线如下:
1. 一种空气质量预测方法,基于时空特征提取空气质量参数,包括以下步骤:
步骤1、预处理空气质量数据,包括:
1.1数据采集:获取监测站点相关传感器数据中空气污染物二氧化硫、二氧化氮、一氧化碳、臭氧、细颗粒物、可吸入颗粒物浓度数据,以及采集包括传感器经纬度数据、气温、气压、风速、风向、湿度气象数据,得到原始空气质量数据集;
1.2针对原始空气质量数据中存在缺失值和异常值,采用线性插值方法填补、修正;
1.3对填补、修正后的空气质量数据集,采用零均值标准化方法进行归一化处理,计算公式为:
(1)
其中,x是某个时刻传感器的特征的数据,μ是对应特征样本数据的均值,σ是对应特征样本数据的标准差,z是标准化后的值;
1.4构建模型输入图数据:将空气质量监测站点的拓扑结构看成一张图G,图中节点为空气质量检测站点,用边将具有相关性的空气质量监测站点相连,图G便于模型在空气质量预测时对空间特征进行提取;以邻接矩阵的形式存储模型输入图G中监测站点间的相关性,邻接矩阵是一个N*N的二维矩阵,值为0或1;其中N代表监测站点数量,邻接矩阵的值中0表示两个站点不相关,1表示两个站点相关,这里邻接矩阵记为A;计算数据集中不同监测站点同一时刻浓度的相关系数r,若r>自定义值/>则代表监测站之间具有相关性,构建模型输入图/>的邻接矩阵/>;计算数据集中不同监测站点的物理距离d,若d<自定义值/>则代表监测站点之间具有相关性,构建模型输入图/>的邻接矩阵/>;
1.5构建模型输入序列数据:设p表示输入模型的历史时间步,将距离当前时刻t的前p个时间步的历史数据按照时间先后进行叠加,形成输入序列数据,在t时刻输入序列数据具体表示为:
(2)
(3)
(4)
其中,监测点数量为n,T表示矩阵转置,为监测站点j的序列数据,/>为i时刻的小时值,/>为i时刻所属月份,/>为i时刻二氧化硫浓度,/>为i时刻二氧化氮浓度,/>为i时刻一氧化碳浓度,/>为i时刻臭氧浓度,/>为i时刻PM2.5浓度,/>为i时刻PM10浓度,/>为i时刻气温,/>为i时刻气压,/>为i时刻湿度,/>为i时刻风向,为i时刻风速;
步骤2、设置最大训练次数为E;
步骤3、构建时空子网络:该时空子网络用于提取时间特征与空间特征,需要利用模型输入图卷积网络GCN与长短期记忆网络LSTM、时间卷积网络TCN构建时空子网络,并处理时空子网络时间与空间的关联性,具体过程包括:
3.1模型输入图卷积网络需要输入序列数据和邻接矩阵/>、邻接矩阵/>;将[,/>]与[/>,/>]输入到两个模型输入图卷积网络GCN提取数据的空间特征,层与层之间采用修正线性单元ReLU或其他激活函数作为激活函数:
(5)
(6)
其中,GCNConv表示模型输入图卷积块,表示第i个模型输入图卷积网络的第l层的隐藏特征,/>表示第i个模型输入图卷积网络的最后一层输出的隐藏特征,/>表示第i个模型输入图卷积网络的倒数第二层输出的隐藏特征,/>表示第i个邻接矩阵,i=1或2,L≥2;
3.2长短期记忆网络需要输入序列数据,使用长短期记忆网络LSTM初次提取数据的时间特征:
(7)
其中,表示长短期记忆网络输出的隐藏特征;
3.3时间卷积网络需要输入长短期记忆网络的输出,对数据的时间特征进行二次提取,每层由三个或其他数量的一维卷积块以及残差模块组成,它们的输出分别为、/>、/>、/>,卷积块之间采用修正线性单元ReLU或其他激活函数作为激活函数:
(8)
(9)
(10)
(11)
其中,、/>、/>为卷积核矩阵;/>、/>、/>为偏置;/>为卷积运算;
使用时间卷积网络TCN对数据的时间特征进行二次提取:
(12)
(13)
其中,表示时间卷积网络的第1层的隐藏特征表示,/>表示时间卷积网络最后一层输出的隐藏特征;/>表示时间卷积网络的倒数第二层输出的隐藏特征,L≥2;
步骤4、构建预测器:将模型输入图卷积网络根据输入的不同邻接矩阵得到的输出、/>中,目标监测站点j的隐藏特征/>、/>与LSTM-TCN混合模型二次特征提取得到的隐藏特征/>组合,作为预测器的输入,使用多层感知机MLP输出预测结果,即:
(14)
(15)
其中,表示第j个目标监测站点在时刻t的第k个空气任务的预测值,k为预测设置的总任务数;
步骤5、根据预测结果,采用均方根误差函数作为单个任务的损失函数:
(16)
(17)
其中,是目标监测站点j在时刻t的第一个任务真实值,M为预测值的总个数;表示第1个任务的损失值,/>表示第k个任务的损失值;/>表示第1个任务的可学习噪声参数,/>表示第k个任务的可学习噪声参数,将其放在分母是为了防止不确定性很高的一个或多个任务在计算损失函数时的权值中具有主导影响的情况;LOSS表示多任务的总损失值;常数项/>为自定义的较小值,避免LOSS公式中除0的问题;
步骤6、利用梯度下降方法不断更新模型参数;
步骤7、重复以上步骤3、4、5、6,直到训练次数等于E,最终输出训练好的基于深度学习时空特征提取的空气质量预测模型。
与现有技术相比,本发明的特征在于:
(1)该发明针对普通神经网络模型无法充分提取空气质量数据时空特征的问题,提出一种基于深度学习的时空特征提取的多任务空气质量预测方法,使用图卷积网络、长短期记忆网络和时间卷积网络充分提取数据的空间和时间特征,预测误差小,准确程度较高。(2)该发明将多任务学习引入空气质量预测领域,能够同时预测出未来多项污染物浓度值,节约训练成本。(3)该发明提出的框架,能够扩展到其他相关的城市时空数据领域,解决类似问题,具有普适性。
附图说明
图1为本发明的流程图,
图2为本发明的框架结构图。
实施方式
以下结合附图实施对本发明作进一步详细描述。
本发明的流程图和框架结构分别如图1、图2所示,即基于深度学习的时空特征提取的多任务空气质量预测模型。它主要分为三个部分:(i)数据输入,对数据集进行处理,分别基于监测站距离以及历史数据相关系数构图。(ii)时空子网络,该模块通过两个图卷积网络进行空间特征的充分提取,通过长短期记忆网络和时间卷积网络混合模型进行时间特征的充分提取。(iii)预测器,该模块主要由多层感知机构成,将时空子网络输出的三段隐藏特征组合,输入到多层感知机中,经过非线性映射,得到目标监测站某一时刻多个空气质量预测任务的预测结果。
实施例
1.一种空气质量预测方法,基于时空特征提取空气质量参数进行预测,包括以下步骤:
步骤1、预处理空气质量数据,包括:
1.1数据采集:获取监测站点相关传感器数据中空气污染物二氧化硫、二氧化氮、一氧化碳、臭氧、细颗粒物、可吸入颗粒物浓度数据,以及采集包括传感器经纬度数据、气温、气压、风速、风向、湿度气象数据,得到原始空气质量数据集;
1.2针对原始空气质量数据中存在缺失值和异常值,采用线性插值方法填补、修正;
1.3对填补、修正后的空气质量数据集,采用零均值标准化方法进行归一化处理,计算公式为:
(1)
其中,x是某个时刻传感器的特征的数据,μ是对应特征样本数据的均值,σ是对应特征样本数据的标准差,z是标准化后的值;
1.4构建模型输入图数据:将空气质量监测站点的拓扑结构看成一张图G,图中节点为空气质量检测站点,用边将具有相关性的空气质量监测站点相连,图G便于模型在空气质量预测时对空间特征进行提取;以邻接矩阵的形式存储模型输入图G中监测站点间的相关性,邻接矩阵是一个N*N的二维矩阵,值为0或1;其中N代表监测站点数量,邻接矩阵的值中0表示两个站点不相关,1表示两个站点相关,这里邻接矩阵记为A;计算数据集中不同监测站点同一时刻浓度的相关系数r,若r>自定义值/>则代表监测站之间具有相关性,构建模型输入图/>的邻接矩阵/>;计算数据集中不同监测站点的物理距离d,若d<自定义值/>则代表监测站点之间具有相关性,构建模型输入图/>的邻接矩阵/>;
1.5构建模型输入序列数据:设p表示输入模型的历史时间步,将距离当前时刻t的前p个时间步的历史数据按照时间先后进行叠加,形成输入序列数据,在t时刻输入序列数据具体表示为:
(2)
(3)
(4)
其中,监测点数量为n,T表示矩阵转置,为监测站点j的序列数据,/>为i时刻的小时值,/>为i时刻所属月份,/>为i时刻二氧化硫浓度,/>为i时刻二氧化氮浓度,/>为i时刻一氧化碳浓度,/>为i时刻臭氧浓度,/>为i时刻PM2.5浓度,/>为i时刻PM10浓度,/>为i时刻气温,/>为i时刻气压,/>为i时刻湿度,/>为i时刻风向,为i时刻风速;
步骤2、设置最大训练次数为E;
步骤3、构建时空子网络:该时空子网络用于提取时间特征与空间特征,需要利用模型输入图卷积网络GCN与长短期记忆网络LSTM、时间卷积网络TCN构建时空子网络,并处理时空子网络时间与空间的关联性,具体过程包括:
3.1模型输入图卷积网络需要输入序列数据和邻接矩阵/>、邻接矩阵/>;将[,/>]与[/>,/>]输入到两个模型输入图卷积网络GCN提取数据的空间特征,层与层之间采用修正线性单元ReLU或其他激活函数作为激活函数:
(5)
(6)
其中,GCNConv表示模型输入图卷积块,表示第i个模型输入图卷积网络的第l层的隐藏特征,/>表示第i个模型输入图卷积网络的最后一层输出的隐藏特征,/>表示第i个模型输入图卷积网络的倒数第二层输出的隐藏特征,/>表示第i个邻接矩阵,i=1或2,L≥2;
3.2长短期记忆网络需要输入序列数据,使用长短期记忆网络LSTM初次提取数据的时间特征:
(7)
其中,表示长短期记忆网络输出的隐藏特征;
3.3时间卷积网络需要输入长短期记忆网络的输出,对数据的时间特征进行二次提取,每层由三个或其他数量的一维卷积块以及残差模块组成,它们的输出分别为、/>、/>、/>,卷积块之间采用修正线性单元ReLU或其他激活函数作为激活函数:
(8)
(9)
(10)
(11)
其中,、/>、/>为卷积核矩阵;/>、/>、/>为偏置;/>为卷积运算;
使用时间卷积网络TCN对数据的时间特征进行二次提取:
(12)
(13)
其中,表示时间卷积网络的第1层的隐藏特征表示,/>表示时间卷积网络最后一层输出的隐藏特征;/>表示时间卷积网络的倒数第二层输出的隐藏特征,L≥2;如图2所示,基于TCN空洞卷积的原理,TCN从第二层开始,在进行特征提取时,并非所有TCN块的隐藏特征信息都会传输到下一层;
步骤4、构建预测器:将模型输入图卷积网络根据输入的不同邻接矩阵得到的输出、/>中,目标监测站点j的隐藏特征/>、/>与LSTM-TCN混合模型二次特征提取得到的隐藏特征/>组合,作为预测器的输入,使用多层感知机MLP输出预测结果,即:
(14)
(15)
其中,表示第j个目标监测站点在时刻t的第k个空气任务的预测值,k为预测设置的总任务数;
步骤5、根据预测结果,采用均方根误差函数作为单个任务的损失函数:
(16)
(17)
其中,是目标监测站点j在时刻t的第一个任务真实值,M为预测值的总个数;表示第1个任务的损失值,/>表示第k个任务的损失值;/>表示第1个任务的可学习噪声参数,/>表示第k个任务的可学习噪声参数,k=1,2,3…k,将w放在分母是为了防止不确定性很高的一个或多个任务在计算损失函数时的权值中具有主导影响的情况;LOSS表示多任务的总损失值;常数项/>为自定义的较小值,避免LOSS公式中除0的问题;
步骤6、利用梯度下降方法不断更新模型参数;
步骤7、重复以上步骤3、4、5、6,直到训练次数等于E,最终输出训练好的基于深度学习时空特征提取的空气质量预测模型。
Claims (1)
1.一种空气质量预测方法,包括基于时空特征提取空气质量参数,其特征在于,包括以下步骤:
步骤1、预处理空气质量数据,包括:
1.1数据采集:获取监测站点相关传感器数据中空气污染物二氧化硫、二氧化氮、一氧化碳、臭氧、细颗粒物、可吸入颗粒物浓度数据,以及采集包括传感器经纬度数据、气温、气压、风速、风向、湿度气象数据,得到原始空气质量数据集;
1.2针对原始空气质量数据中存在缺失值和异常值,采用线性插值方法填补、修正;
1.3对填补、修正后的空气质量数据集,采用零均值标准化方法进行归一化处理,计算公式为:
(1)
其中,x是某个时刻传感器的特征的数据,μ是对应特征样本数据的均值,σ是对应特征样本数据的标准差,z是标准化后的值;
1.4构建模型输入图数据:将空气质量监测站点的拓扑结构看成一张图G,图中节点为空气质量检测站点,用边将具有相关性的空气质量监测站点相连,图G便于模型在空气质量预测时对空间特征进行提取;以邻接矩阵的形式存储模型输入图G中监测站点间的相关性,邻接矩阵是一个N*N的二维矩阵,值为0或1;其中N代表监测站点数量,邻接矩阵的值中0表示两个站点不相关,1表示两个站点相关,这里邻接矩阵记为A;计算数据集中不同监测站点同一时刻浓度的相关系数r,若r>自定义值/>则代表监测站之间具有相关性,构建模型输入图/>的邻接矩阵/>;计算数据集中不同监测站点的物理距离d,若d<自定义值/>则代表监测站点之间具有相关性,构建模型输入图/>的邻接矩阵/>;
1.5构建模型输入序列数据:设p表示输入模型的历史时间步,将距离当前时刻t的前p个时间步的历史数据按照时间先后进行叠加,形成输入序列数据,在t时刻输入序列数据具体表示为:
(2)
(3)
(4)
其中,监测点数量为n,T表示矩阵转置,为监测站点j的序列数据,/>为i时刻的小时值,/>为i时刻所属月份,/>为i时刻二氧化硫浓度,/>为i时刻二氧化氮浓度,/>为i时刻一氧化碳浓度,/>为i时刻臭氧浓度,/>为i时刻PM2.5浓度,/>为i时刻PM10浓度,/>为i时刻气温,/>为i时刻气压,/>为i时刻湿度,/>为i时刻风向,/>为i时刻风速;
步骤2、设置最大训练次数为E;
步骤3、构建时空子网络:该时空子网络用于提取时间特征与空间特征,需要利用模型输入图卷积网络GCN与长短期记忆网络LSTM、时间卷积网络TCN构建时空子网络,并处理时空子网络时间与空间的关联性,具体过程包括:
3.1模型输入图卷积网络需要输入序列数据和邻接矩阵/>、邻接矩阵/>;将[/>,/>]与[/>,/>]输入到两个模型输入图卷积网络GCN提取数据的空间特征,层与层之间采用修正线性单元ReLU或其他激活函数作为激活函数:
(5)
(6)
其中,GCNConv表示模型输入图卷积块,表示第i个模型输入图卷积网络的第l层的隐藏特征,/>表示第i个模型输入图卷积网络的最后一层输出的隐藏特征,/>表示第i个模型输入图卷积网络的倒数第二层输出的隐藏特征,/>表示第i个邻接矩阵,i=1或2,L≥2;
3.2长短期记忆网络需要输入序列数据,使用长短期记忆网络LSTM初次提取数据的时间特征:
(7)
其中,表示长短期记忆网络输出的隐藏特征;
3.3时间卷积网络需要输入长短期记忆网络的输出,对数据的时间特征进行二次提取,每层由三个或其他数量的一维卷积块以及残差模块组成,它们的输出分别为/>、/>、、/>,卷积块之间采用修正线性单元ReLU或其他激活函数作为激活函数:
(8)
(9)
(10)
(11)
其中,、/>、/>为卷积核矩阵;/>、/>、/>为偏置;/>为卷积运算;
使用时间卷积网络TCN对数据的时间特征进行二次提取:
(12)
(13)
其中,表示时间卷积网络的第1层的隐藏特征表示,/>表示时间卷积网络最后一层输出的隐藏特征;/>表示时间卷积网络的倒数第二层输出的隐藏特征,L≥2;
步骤4、构建预测器:将模型输入图卷积网络根据输入的不同邻接矩阵得到的输出、/>中,目标监测站点j的隐藏特征/>、/>与LSTM-TCN混合模型二次特征提取得到的隐藏特征/>组合,作为预测器的输入,使用多层感知机MLP输出预测结果,即:
(14)
(15)
其中,表示第j个目标监测站点在时刻t的第k个空气任务的预测值,k为预测设置的总任务数;
步骤5、根据预测结果,采用均方根误差函数作为单个任务的损失函数:
(16)
(17)
其中,是目标监测站点j在时刻t的第一个任务真实值,M为预测值的总个数;/>表示第1个任务的损失值,/>表示第k个任务的损失值;/>表示第1个任务的可学习噪声参数,表示第k个任务的可学习噪声参数,k=1,2,3…k,将w放在分母是为了防止不确定性很高的一个或多个任务在计算损失函数时的权值中具有主导影响的情况;LOSS表示多任务的总损失值;常数项/>为自定义的较小值,避免LOSS公式中除0的问题;
步骤6、利用梯度下降方法不断更新模型参数;
步骤7、重复以上步骤3、4、5、6,直到训练次数等于E,最终输出训练好的基于深度学习时空特征提取的空气质量预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310581242.3A CN116341763B (zh) | 2023-05-23 | 2023-05-23 | 一种空气质量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310581242.3A CN116341763B (zh) | 2023-05-23 | 2023-05-23 | 一种空气质量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116341763A CN116341763A (zh) | 2023-06-27 |
CN116341763B true CN116341763B (zh) | 2023-07-28 |
Family
ID=86884374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310581242.3A Active CN116341763B (zh) | 2023-05-23 | 2023-05-23 | 一种空气质量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116341763B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117233869B (zh) * | 2023-11-15 | 2024-02-23 | 南京信息工程大学 | 一种基于GRU-BiTCN的站点短期风速预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN113188968A (zh) * | 2021-05-06 | 2021-07-30 | 长沙理工大学 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
CN113988348A (zh) * | 2020-07-10 | 2022-01-28 | 中国科学院沈阳计算技术研究所有限公司 | 一种网格化监测的空气质量预测方法 |
CN114462572A (zh) * | 2022-01-18 | 2022-05-10 | 上海交通大学 | 一种基于时空融合图的空气质量预测方法及装置 |
CN114694767A (zh) * | 2022-05-31 | 2022-07-01 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
CN114841400A (zh) * | 2022-03-25 | 2022-08-02 | 哈尔滨工程大学 | 基于多任务时空图卷积的空气质量预测方法 |
-
2023
- 2023-05-23 CN CN202310581242.3A patent/CN116341763B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN113988348A (zh) * | 2020-07-10 | 2022-01-28 | 中国科学院沈阳计算技术研究所有限公司 | 一种网格化监测的空气质量预测方法 |
CN113188968A (zh) * | 2021-05-06 | 2021-07-30 | 长沙理工大学 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
CN114462572A (zh) * | 2022-01-18 | 2022-05-10 | 上海交通大学 | 一种基于时空融合图的空气质量预测方法及装置 |
CN114841400A (zh) * | 2022-03-25 | 2022-08-02 | 哈尔滨工程大学 | 基于多任务时空图卷积的空气质量预测方法 |
CN114694767A (zh) * | 2022-05-31 | 2022-07-01 | 山东科技大学 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
Non-Patent Citations (6)
Title |
---|
A hybrid model for spatiotemporal forecasting of PM2.5 based on graph convolutional neural network and long short-term memory;Yanlin Qi 等;Science of the Total Environment;第664卷;1-10 * |
A new ensemble spatio-temporal PM2.5 prediction method based on graph attention recursive networks and reinforcement learning;Jing Tan 等;Chaos, Solitons and Fractals;第162卷;1-14 * |
A novel hybrid model based on spatiotemporal correlation for air quality prediction;Ao Dun 等;Mobile Information Systems;1-12 * |
Dynamic graph convolution neural network based on spatial-temporal correlation for air quality prediction;Ao Dun 等;Ecological Informatics;第70卷;1-10 * |
基于图神经网络的PM2.5浓度预测算法研究;孙小新;中国博士学位论文全文数据库工程科技I辑(第11期);B027-22 * |
基于深度学习的特定区域空气质量预测研究;吉萌萌;中国优秀硕士学位论文全文数据库工程科技I辑(第02期);B027-4257 * |
Also Published As
Publication number | Publication date |
---|---|
CN116341763A (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111798051B (zh) | 基于长短期记忆神经网络的空气质量时空预测方法 | |
Yi et al. | A neural network model forecasting for prediction of daily maximum ozone concentration in an industrialized urban area | |
CN111832814A (zh) | 一种基于图注意力机制的空气污染物浓度预测方法 | |
CN110346517B (zh) | 一种智慧城市工业大气污染可视化预警方法及其系统 | |
CN110555551B (zh) | 一种智慧城市的空气质量大数据管理方法及系统 | |
CN116341763B (zh) | 一种空气质量预测方法 | |
CN112986492B (zh) | 一种建立气体浓度预测模型的方法及装置 | |
CN111339092B (zh) | 一种基于深度学习的多尺度空气质量预报方法 | |
CN110533239B (zh) | 一种智慧城市空气品质高精度测量方法 | |
CN110346518B (zh) | 一种交通排放污染可视化预警方法及其系统 | |
CN113919231A (zh) | 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统 | |
CN113240170A (zh) | 一种基于季节性循环神经网络的空气质量预测方法 | |
CN113505521B (zh) | 一种耦合神经网络-数值模拟的城市内涝快速预报方法 | |
CN115759488B (zh) | 一种基于边缘计算的碳排放监测预警分析系统及其方法 | |
CN115237896B (zh) | 一种基于深度学习预报空气质量的数据前处理方法及系统 | |
CN115730684A (zh) | 一种基于lstm-cnn模型的空气质量检测系统 | |
CN114154619A (zh) | 一种基于cnn和bilstm的船舶轨迹预测方法 | |
CN114819360A (zh) | 一种交通流量预测方法、装置及设备 | |
CN114861840A (zh) | 一种多源降水数据融合方法 | |
CN114822709A (zh) | 大气污染多粒度精准成因分析方法及装置 | |
CN117077843A (zh) | 基于CBAM-CNN-Transformer的时空注意力细粒度PM2.5浓度预测方法 | |
CN117494034A (zh) | 基于交通拥堵指数和多源数据融合的空气质量预测方法 | |
Alsaedi et al. | Spatial and temporal data analysis with deep learning for air quality prediction | |
CN116699731A (zh) | 一种热带气旋路径短期预报方法、系统及存储介质 | |
CN115408483B (zh) | 一种北斗导航服务定位性能智能预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |