CN113188968A - 基于组合深度学习模型的空气污染物浓度预测方法及系统 - Google Patents
基于组合深度学习模型的空气污染物浓度预测方法及系统 Download PDFInfo
- Publication number
- CN113188968A CN113188968A CN202110489654.5A CN202110489654A CN113188968A CN 113188968 A CN113188968 A CN 113188968A CN 202110489654 A CN202110489654 A CN 202110489654A CN 113188968 A CN113188968 A CN 113188968A
- Authority
- CN
- China
- Prior art keywords
- air
- time
- concentration
- deep learning
- pollutants
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000809 air pollutant Substances 0.000 title claims abstract description 208
- 231100001243 air pollutant Toxicity 0.000 title claims abstract description 208
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013136 deep learning model Methods 0.000 title claims abstract description 22
- 238000013135 deep learning Methods 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 20
- 238000012544 monitoring process Methods 0.000 claims abstract description 19
- 238000013528 artificial neural network Methods 0.000 claims description 52
- 238000000605 extraction Methods 0.000 claims description 39
- 230000015654 memory Effects 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 18
- 230000006403 short-term memory Effects 0.000 claims description 14
- 230000007787 long-term memory Effects 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 239000000356 contaminant Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 8
- 238000003915 air pollution Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 239000003344 environmental pollutant Substances 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000003916 acid precipitation Methods 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004071 soot Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/06—Investigating concentration of particle suspensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Dispersion Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Feedback Control In General (AREA)
- Air Conditioning Control Device (AREA)
Abstract
本申请涉及一种基于组合深度学习模型的空气污染物浓度预测方法及系统。所述方法获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列;并利用该时间序列对构建的组合深度学习网络进行训练,并采用贝叶斯优化方式进行超参数,得到训练好的空气污染物浓度预测模型;获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理,将预处理结果输入空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。本发明提出的组合深度学习模型可以高效提取不同时间段的空气污染物的时间相关性,并有效提取地区内的不同空气监测站之间的空气污染物浓度的空间相关性,使得预测效果得到提升。
Description
技术领域
本申请涉及空气质量监控技术领域,特别涉及一种基于组合深度学习模型的空气污染物浓度预测方法及系统。
背景技术
工业化和技术的飞速发展的同时,伴随着能源的大量消耗,环境被严重破坏,从而引发了一系列环境问题,例如全球变暖、废物处置、空气污染、酸雨、水污染等。世界范围内先后出现过煤烟型污染、光化学烟雾等空气污染问题,据估计空气污染每年导致全球700万人死亡,2018年世界卫生组织报告指出全球多个国家和地区仍然有严重的空气污染问题,90%的人类在污染的空气环境中生活,空气污染已经成为全世界高度关注的环境问题。
空气质量一直是国内外学者的研究热点,为了预测空气中各种污染物的浓度,现有多种建模方法。包括确定性方法、统计方法、机器学习、神经网络。确定性方法也称为化学迁移模型,专注于大气物理和化学反应对空气污染物的排放、扩散过程建模。Byun等采用多尺度空气质量模型(CMAQ)模拟空气中的污染物传输过程建模。Wang Z等用嵌套空气质量预测建模系统(NAQPMS)研究在城市范围内各种规模的大气运动中化学物质和人为气溶胶的各种过程。
现有的长短期记忆网络(Long Short-Term Memory简称:LSTM)或者线性回归预测方法只考虑单个站点pm2.5数据,从而预测时会产生一定的误差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够利用多个空气质量站检测的空气污染物PM2.5浓度数据之间的时间和空间的相关性,降低预测误差的基于组合深度学习模型的空气污染物浓度预测方法及系统。
一种基于组合深度学习模型的空气污染物浓度预测方法,所述方法包括:
获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列。
构建组合深度学习网络;所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络,所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同;所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding;所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联,提取空气污染物PM2.5浓度之间的时间相关性特征;所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征,在图结构上实现卷积操作,提取地区内的不同空气监测站之间的空间相关性特征;所述输出网络用于输出预测结果。
根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列。
将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。
在其中一个实施例中,获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列,包括:
获取多个空气质量站的空气污染物PM2.5浓度。
对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值,得到每个空气质量站的空气污染物PM2.5的时间序列。
在其中一个实施例中,根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型,包括:
将所述空气污染物PM2.5的时间序列分为训练样本和测试样本。
将所述训练样本输入到所述时间embedding提取模块中,得到所述空气污染物PM2.5的时间序列的时间embedding。
将所述时间embedding输入到所述长短期记忆神经网络中,得到空气污染物PM2.5浓度之间的时间相关性特征。
经所述时间相关性特征输入到所述图卷积神经网络中,得到地区内的不同空气监测站之间的空间相关性特征。
将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值,得到预估的空气污染物浓度预测模型。
利用测试样本对预估的空气污染物浓度预测模型进行测试,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
在其中一个实施例中,所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。
一种基于组合深度学习模型的空气污染物浓度预测系统,所述系统包括:
数据获取和预处理模块,用于获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列。
模型构建模块,用于构建组合深度学习网络;所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络,所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同;所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding;所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联,提取空气污染物PM2.5浓度之间的时间相关性特征;所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征,在图结构上实现卷积操作,提取地区内的不同空气监测站之间的空间相关性特征;所述输出网络用于输出预测结果。
模型训练模块,用于根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
目标站空气污染物PM2.5浓度预测值确定模块:获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列;将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。
在其中一个实施例中,数据获取和预处理模块,还用于获取多个空气质量站的空气污染物PM2.5浓度;对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值,得到每个空气质量站的空气污染物PM2.5的时间序列。
在其中一个实施例中,模型训练模块,还用于将所述空气污染物PM2.5的时间序列分为训练样本和测试样本;将所述训练样本输入到所述时间embedding提取模块中,得到所述空气污染物PM2.5的时间序列的时间embedding;将所述时间embedding输入到所述长短期记忆神经网络中,得到空气污染物PM2.5浓度之间的时间相关性特征;经所述时间相关性特征输入到所述图卷积神经网络中,得到地区内的不同空气监测站之间的空间相关性特征;将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值,迭代训练结束后,得到预估的空气污染物浓度预测模型;利用测试样本对预估的空气污染物浓度预测模型进行测试,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
在其中一个实施例中,所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。
上述基于组合深度学习模型的空气污染物浓度预测方法及系统,所述方法获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列;构建组合深度学习网络;所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络;根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型;获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列;将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。本发明提出的组合深度学习模型可以高效提取不同时间段的空气污染物的时间相关性,并有效提取地区内的不同空气监测站之间的空气污染物浓度的空间相关性,使得预测效果得到提升。
附图说明
图1为一个实施例中基于组合深度学习模型的空气污染物浓度预测方法的流程示意图;
图2为一个实施例中基于组合深度学习模型的空气污染物浓度预测系统的结构框图;
图3为一个实施例中组合深度学习网络模型的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种基于组合深度学习模型的空气污染物浓度预测方法,该方法包括以下步骤:
步骤100:获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列。
空气污染物PM2.5浓度是多个空气质量站在2018年1月1日到2019年1月1日共365天,每天24小时内各个小时的PM2.5数据作为数据集。
预处理是对数据集中在时间轴上缺失的数据进行补全的操作。
步骤102:构建组合深度学习网络。
组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络,时间embedding提取模块和长短期记忆神经网络的数量与空气质量站的数量相同。
时间embedding提取模块用于提取空气污染物PM2.5的时间序列的时间embedding。
长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联,提取空气污染物PM2.5浓度之间的时间相关性特征。
图卷积神经网络用于接收多个长短期记忆神经网络输出的时间相关性特征,在图结构上实现卷积操作,提取地区内的不同空气监测站之间的空间相关性特征;输出网络用于输出预测结果。
在时间embedding提取模块中将数据进行归一化后,通过Time2Vec(Learning aVector Representation of Time,学习时间的向量表示)模块生成时间向量,捕获其原始时间序列中的周期性行为和非周期性行为,以便于提取出原始时间序列中时间相关性。
采用长短期记忆神经网络可以高效提取不同时间段的空气污染物的时间相关性。
步骤104:根据空气污染物PM2.5的时间序列对组合深度学习网络进行训练,并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
按照时间先后顺序将空气污染物PM2.5的时间序列中前80%数据作为训练集,后20%数据作为验证集,用训练集对组合深度学习网络进行训练,用验证集对训练的组合深度学习网络进行验证,并采用采用贝叶斯优化方式进行网络超参数进行调整,直到满足预定条件为止,得到训练好的空气污染物浓度预测模型。
贝叶斯优化是对长短期记忆神经网络(LSTM)中的隐藏层神经元个数、LSTM的层数以及和图卷积神经网络(Graph Convolutional Network,简称:GCN)中的层数进行优化调整。
步骤106:获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列。
步骤108:将待测空气污染物PM2.5的时间序列输入到空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。
该模型是用多个空气质量站过去8个小时PM2.5浓度来预测未来1小时的PM2.5浓度。
上述基于组合深度学习模型的空气污染物浓度预测方法中,通过获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列;构建组合深度学习网络;所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络;根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型;获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列;将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。本发明提出的组合深度学习模型可以高效提取不同时间段的空气污染物的时间相关性,并有效提取地区内的不同空气监测站之间的空气污染物浓度的空间相关性,使得预测效果得到提升。
在其中一个实施例中,步骤100还包括:获取多个空气质量站的空气污染物PM2.5浓度;对每个空气质量站的空气污染物PM2.5浓度采用插值法补全空缺值,得到每个空气质量站的空气污染物PM2.5的时间序列。
在其中一个实施例中,步骤104还包括:将空气污染物PM2.5的时间序列分为训练样本和测试样本;将训练样本输入到时间embedding提取模块中,得到空气污染物PM2.5的时间序列的时间embedding;将时间embedding输入到长短期记忆神经网络中,得到空气污染物PM2.5浓度之间的时间相关性特征;经时间相关性特征输入到图卷积神经网络中,得到地区内的不同空气监测站之间的空间相关性特征;将空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值,迭代训练结束后,得到预估的空气污染物浓度预测模型;利用测试样本对预估的空气污染物浓度预测模型进行测试,并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
在其中一个实施例中,时间embedding提取模块中采用Time2Vec方式进行空气污染物PM2.5的时间序列的时间embedding提取。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图2所示,提供了一种基于组合深度学习模型的空气污染物浓度预测系统,系统包括数据获取和预处理模块、模型构建模块、模型训练模块以及目标站空气污染物PM2.5浓度预测值确定模块,其中:
数据获取和预处理模块,用于获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列。
模型构建模块,用于构建组合深度学习网络;组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络,时间embedding提取模块和长短期记忆神经网络的数量与空气质量站的数量相同;时间embedding提取模块用于提取空气污染物PM2.5的时间序列的时间embedding;长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联,提取空气污染物PM2.5浓度之间的时间相关性特征;图卷积神经网络用于接收多个长短期记忆神经网络输出的时间相关性特征,在图结构上实现卷积操作,提取地区内的不同空气监测站之间的空间相关性特征;输出网络用于输出预测结果。
模型训练模块,用于根据空气污染物PM2.5的时间序列对组合深度学习网络进行训练,并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
目标站空气污染物PM2.5浓度预测值确定模块:获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列;将待测空气污染物PM2.5的时间序列输入到空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。
在其中一个实施例中,数据获取和预处理模块,还用于获取多个空气质量站的空气污染物PM2.5浓度;对每个空气质量站的空气污染物PM2.5浓度采用插值法补全空缺值,得到每个空气质量站的空气污染物PM2.5的时间序列。
在其中一个实施例中,模型训练模块,还用于将空气污染物PM2.5的时间序列分为训练样本和测试样本;将训练样本输入到时间embedding提取模块中,得到空气污染物PM2.5的时间序列的时间embedding;将时间embedding输入到长短期记忆神经网络中,得到空气污染物PM2.5浓度之间的时间相关性特征;经时间相关性特征输入到图卷积神经网络中,得到地区内的不同空气监测站之间的空间相关性特征;将空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值,迭代训练结束后,得到预估的空气污染物浓度预测模型;利用测试样本对预估的空气污染物浓度预测模型进行测试,并采用贝叶斯优化方式对组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
在其中一个实施例中,时间embedding提取模块中采用Time2Vec方式进行空气污染物PM2.5的时间序列的时间embedding提取。
关于基于组合深度学习模型的空气污染物浓度预测系统的具体限定可以参见上文中对于基于组合深度学习模型的空气污染物浓度预测方法的限定,在此不再赘述。上述基于组合深度学习模型的空气污染物浓度预测系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,组合深度学习网络模型的结构如图3所示,组合深度学习网络深度学习模型的空气污染物浓度预测方法包括如下步骤:
步骤一:通过北京市环境保护检测中心网站采集北京市实时空气质量数据,取出其中2018年1月1日到2019年1月1日共365天,每天24小时内各个小时的PM2.5数据作为数据集,对其中有缺失的数据采用线性插值补全空缺值,前80%数据作为训练集,后20%数据作为验证集,用过去8个小时PM2.5浓度来预测未来1小时的PM2.5浓度。
步骤二:将数据进行归一化后,通过Time2Vec模块生成时间向量,捕获其原始时间序列中的周期性行为和非周期性行为,以便于更好地提取出原始时间序列中时间相关性。
步骤三:将时间向量输入到长短期记忆网络-图卷积神经网络(简称:LSTM-GCN模型)中,LSTM部分提取各时间段之间的时间相关性,GCN部分提取多站点之间的空间相关性,最后通过完全连接层预测输出,进行反归一化后得到结果。
步骤四:通过贝叶斯优化,对LSTM-GCN模型中的LSTM的批大小、时期、隐藏层神经元个数、LSTM的层数以及GCN的层数进行优化调整,来获得更好的预测效果;其中:批大小是指每个批中训练样本的数量;时期是指代所有的数据送入网络中完成一次前向计算及反向传播的过程。
采集了北京市三个空气质量监测站:东四、东四坛、天坛,其中2018年1月1日到2019年1月1日共365天,每天24小时内各个小时的PM2.5数据,应用HA、SVR、LR、ARIMA、LSTM、TCN、CNN以及Time2Vec-LSTM等模型用过去8个小时PM2.5浓度来预测未来1小时的PM2.5浓度。不同模型预测效果分析结果如表1所示。
表1不同模型预测效果分析
均方根误差 | 平均绝对误差 | 决定系数 | |
HA | 27.20 | 16.91 | 0.81 |
SVR | 27.37 | 12.84 | 0.80 |
LR | 68.82 | 49.91 | 0.24 |
ARIMA | 66.90 | 44.00 | 0.17 |
LSTM | 11.55 | 7.02 | 0.97 |
TCN | 12.98 | 8.12 | 0.96 |
CNN | 11.95 | 7.47 | 0.96 |
Time2Vec-LSTM | 11.39 | 6.86 | 0.97 |
从表1中的数据可以看出,ARIMA(整合移动平均自回归模型)是典型的统计方法,不能处理复杂的时空数据,表现比较差。传统的机器学习方法由于误差累计效果也一般。深度学习模型表现比较好,其中通过Time2Vec提取时间embedding让LSTM学习预测的方法效果最佳,备注:Time2Vec-LSTM模型是发明中模型的前半部分模型。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种基于组合深度学习模型的空气污染物浓度预测方法,其特征在于,所述方法包括:
获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到多个空气质量站的空气污染物PM2.5的时间序列;
构建组合深度学习网络;所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络,所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同;所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding;所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联,提取空气污染物PM2.5浓度之间的时间相关性特征;所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征,在图结构上实现卷积操作,提取地区内的不同空气监测站之间的空间相关性特征;所述输出网络用于输出预测结果;
根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型;
获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列;
将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。
2.根据权利要求1所述的方法,其特征在于,获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列,包括:
获取多个空气质量站的空气污染物PM2.5浓度;
对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值,得到每个空气质量站的空气污染物PM2.5的时间序列。
3.根据权利要求1所述的方法,其特征在于,根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型,包括:
将每个空气质量站的所述空气污染物PM2.5的时间系列作为1路输入,并将多个空气质量站的所述空气污染物PM2.5的时间序列分为训练样本和测试样本;
将所述训练样本一一对应输入到多个所述时间embedding提取模块中,得到多个空气监测站的所述空气污染物PM2.5的时间序列的时间embedding;
将多个所述时间embedding一一对应输入到多个所述长短期记忆神经网络中,得到多个空气监测站的空气污染物PM2.5浓度之间的时间相关性特征;
将多个所述时间相关性特征输入到所述图卷积神经网络中,得到地区内的不同空气监测站之间的空间相关性特征;
将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值,迭代训练结束后,得到预估的空气污染物浓度预测模型;
利用测试样本对预估的空气污染物浓度预测模型进行测试,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。
5.一种基于组合深度学习模型的空气污染物浓度预测系统,所述系统包括:
数据获取和预处理模块,用于获取多个空气质量站的空气污染物PM2.5浓度,并进行预处理得到空气污染物PM2.5的时间序列;
模型构建模块,用于构建组合深度学习网络;所述组合深度学习网络包括多个时间embedding提取模块、多个长短期记忆神经网络、1个图卷积神经网络以及1个输出网络,所述时间embedding提取模块和长短期记忆神经网络的数量与所述空气质量站的数量相同;所述时间embedding提取模块用于提取所述空气污染物PM2.5的时间序列的时间embedding;所述长短期记忆神经网络用于将历史时间段的空气污染物PM2.5浓度信息和下一时刻的信息进行关联,提取空气污染物PM2.5浓度之间的时间相关性特征;所述图卷积神经网络用于接收多个所述长短期记忆神经网络输出的时间相关性特征,在图结构上实现卷积操作,提取地区内的不同空气监测站之间的空间相关性特征;所述输出网络用于输出预测结果;
模型训练模块,用于根据所述空气污染物PM2.5的时间序列对所述组合深度学习网络进行训练,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型;
目标站空气污染物PM2.5浓度预测值确定模块:获取多个空气质量站的待测空气污染物PM2.5浓度,并进行预处理得到待测空气污染物PM2.5的时间序列;将所述待测空气污染物PM2.5的时间序列输入到所述空气污染物浓度预测模型中,得到目标站空气污染物PM2.5浓度预测值。
6.根据权利要求5所述的系统,其特征在于,数据获取和预处理模块,还用于获取多个空气质量站的空气污染物PM2.5浓度;对每个空气质量站的所述空气污染物PM2.5浓度采用插值法补全空缺值,得到每个空气质量站的空气污染物PM2.5的时间序列。
7.根据权利要求5所述的系统,其特征在于,模型训练模块,还用于将所述空气污染物PM2.5的时间序列分为训练样本和测试样本;将所述训练样本输入到所述时间embedding提取模块中,得到所述空气污染物PM2.5的时间序列的时间embedding;将所述时间embedding输入到所述长短期记忆神经网络中,得到空气污染物PM2.5浓度之间的时间相关性特征;经所述时间相关性特征输入到所述图卷积神经网络中,得到地区内的不同空气监测站之间的空间相关性特征;将所述空间相关性特征输入到输出层得到空气污染物PM2.5浓度预测值,迭代训练结束后,得到预估的空气污染物浓度预测模型;利用测试样本对预估的空气污染物浓度预测模型进行测试,并采用贝叶斯优化方式对所述组合深度学习网络中的超参数进行调整,得到训练好的空气污染物浓度预测模型。
8.根据权利要求5-7任一项所述的系统,其特征在于,所述时间embedding提取模块中采用Time2Vec方式进行所述空气污染物PM2.5的时间序列的时间embedding提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110489654.5A CN113188968A (zh) | 2021-05-06 | 2021-05-06 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110489654.5A CN113188968A (zh) | 2021-05-06 | 2021-05-06 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113188968A true CN113188968A (zh) | 2021-07-30 |
Family
ID=76983864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110489654.5A Pending CN113188968A (zh) | 2021-05-06 | 2021-05-06 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113188968A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111239014A (zh) * | 2020-01-09 | 2020-06-05 | 河北工业大学 | 一种空气中pm2.5的检测方法、装置、设备及介质 |
CN113762642A (zh) * | 2021-09-23 | 2021-12-07 | 大连理工大学人工智能大连研究院 | 基于bo-emd-lstm深度学习算法的教室空气质量预测方法 |
CN113837361A (zh) * | 2021-09-01 | 2021-12-24 | 中咨公路养护检测技术有限公司 | 一种空气污染物浓度预测方法及系统 |
CN114239943A (zh) * | 2021-12-09 | 2022-03-25 | 中国建筑科学研究院天津分院 | 一种气溶胶浓度预测方法 |
CN114689478A (zh) * | 2022-04-08 | 2022-07-01 | 江苏锦测环保科技有限公司 | 一种空气质量检测装置及方法 |
CN116341763A (zh) * | 2023-05-23 | 2023-06-27 | 西南交通大学 | 一种空气质量预测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492822A (zh) * | 2018-11-24 | 2019-03-19 | 上海师范大学 | 空气污染物浓度时空域关联预测方法 |
US20190312898A1 (en) * | 2018-04-10 | 2019-10-10 | Cisco Technology, Inc. | SPATIO-TEMPORAL ANOMALY DETECTION IN COMPUTER NETWORKS USING GRAPH CONVOLUTIONAL RECURRENT NEURAL NETWORKS (GCRNNs) |
CN111160628A (zh) * | 2019-12-13 | 2020-05-15 | 重庆邮电大学 | 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN111832814A (zh) * | 2020-07-01 | 2020-10-27 | 北京工商大学 | 一种基于图注意力机制的空气污染物浓度预测方法 |
CN112101480A (zh) * | 2020-09-27 | 2020-12-18 | 西安交通大学 | 一种多变量聚类与融合的时间序列组合预测方法 |
CN112651665A (zh) * | 2021-01-14 | 2021-04-13 | 浙江鸿程计算机系统有限公司 | 一种基于图神经网络的地表水水质指标预测方法和装置 |
-
2021
- 2021-05-06 CN CN202110489654.5A patent/CN113188968A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190312898A1 (en) * | 2018-04-10 | 2019-10-10 | Cisco Technology, Inc. | SPATIO-TEMPORAL ANOMALY DETECTION IN COMPUTER NETWORKS USING GRAPH CONVOLUTIONAL RECURRENT NEURAL NETWORKS (GCRNNs) |
CN109492822A (zh) * | 2018-11-24 | 2019-03-19 | 上海师范大学 | 空气污染物浓度时空域关联预测方法 |
CN111160628A (zh) * | 2019-12-13 | 2020-05-15 | 重庆邮电大学 | 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法 |
CN111832814A (zh) * | 2020-07-01 | 2020-10-27 | 北京工商大学 | 一种基于图注意力机制的空气污染物浓度预测方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN112101480A (zh) * | 2020-09-27 | 2020-12-18 | 西安交通大学 | 一种多变量聚类与融合的时间序列组合预测方法 |
CN112651665A (zh) * | 2021-01-14 | 2021-04-13 | 浙江鸿程计算机系统有限公司 | 一种基于图神经网络的地表水水质指标预测方法和装置 |
Non-Patent Citations (2)
Title |
---|
宋耀宇: "基于深度神经网络的大气污染物分布预测——以郑州市为例", 《中国优秀博硕士学位论文全文数据库(硕士)》, 15 January 2021 (2021-01-15), pages 4 - 11 * |
祁柏林等: "基于GCN-LSTM的空气质量预测", 《计算机系统应用》, vol. 30, no. 3, 3 March 2021 (2021-03-03), pages 208 - 213 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111239014A (zh) * | 2020-01-09 | 2020-06-05 | 河北工业大学 | 一种空气中pm2.5的检测方法、装置、设备及介质 |
CN113837361A (zh) * | 2021-09-01 | 2021-12-24 | 中咨公路养护检测技术有限公司 | 一种空气污染物浓度预测方法及系统 |
CN113762642A (zh) * | 2021-09-23 | 2021-12-07 | 大连理工大学人工智能大连研究院 | 基于bo-emd-lstm深度学习算法的教室空气质量预测方法 |
CN114239943A (zh) * | 2021-12-09 | 2022-03-25 | 中国建筑科学研究院天津分院 | 一种气溶胶浓度预测方法 |
CN114689478A (zh) * | 2022-04-08 | 2022-07-01 | 江苏锦测环保科技有限公司 | 一种空气质量检测装置及方法 |
CN114689478B (zh) * | 2022-04-08 | 2022-11-15 | 江苏锦测环保科技有限公司 | 一种空气质量检测装置及方法 |
CN116341763A (zh) * | 2023-05-23 | 2023-06-27 | 西南交通大学 | 一种空气质量预测方法 |
CN116341763B (zh) * | 2023-05-23 | 2023-07-28 | 西南交通大学 | 一种空气质量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113188968A (zh) | 基于组合深度学习模型的空气污染物浓度预测方法及系统 | |
CN109492830B (zh) | 一种基于时空深度学习的移动污染源排放浓度预测方法 | |
Ma et al. | A Lag-FLSTM deep learning network based on Bayesian Optimization for multi-sequential-variant PM2. 5 prediction | |
US20220214322A1 (en) | Air pollutants concentration forecasting method and apparatus and storage medium | |
Gilik et al. | Air quality prediction using CNN+ LSTM-based hybrid deep learning architecture | |
CN110782093B (zh) | 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统 | |
Pechlivanidis et al. | Catchment scale hydrological modelling: A review of model types, calibration approaches and uncertainty analysis methods in the context of recent developments in technology and applications | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN116011317B (zh) | 一种基于多方法融合的小尺度近实时大气污染溯源方法 | |
CN113962489A (zh) | 一种基于st-ccn-pm2.5的pm2.5浓度细粒度预测方法 | |
CN112149285A (zh) | 一种基于优化参数选择的滑坡预测方法 | |
CN117688846A (zh) | 用于建筑能耗的强化学习预测方法及系统、存储介质 | |
Gunasekar et al. | Sustainable optimized LSTM-based intelligent system for air quality prediction in Chennai | |
CN112365082A (zh) | 一种基于机器学习的公共能源消耗预测方法 | |
CN110232437B (zh) | 基于cnn的时间序列预测方法和模型确定方法 | |
CN112651314A (zh) | 一种基于语义门及双时态lstm的滑坡承灾体自动识别方法 | |
CN116757971A (zh) | 一种基于周围光的图像自动调整方法 | |
CN116013426A (zh) | 一种高时空分辨率的站点臭氧浓度预测方法 | |
CN114626605A (zh) | 基于模态分解的混合模型的空气污染物浓度预测方法 | |
CN115392567A (zh) | 一种电力负荷预测方法、电子设备、装置及可读存储介质 | |
Nguyen et al. | Deep learning for construction emission monitoring with low-cost sensor network | |
CN114971041A (zh) | 一种基于残差网络的海冰面积预测方法及系统 | |
EP4027277A1 (en) | Method, system and computer program product for drift detection in a data stream | |
Utku | Deep Learning Based an Efficient Hybrid Model for Urban Traffic Prediction | |
CN117271959B (zh) | 一种pm2.5浓度预测结果的不确定性评估方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210730 |