CN114694767B - 基于时空图常微分方程网络的pm2.5浓度预测方法 - Google Patents
基于时空图常微分方程网络的pm2.5浓度预测方法 Download PDFInfo
- Publication number
- CN114694767B CN114694767B CN202210603132.8A CN202210603132A CN114694767B CN 114694767 B CN114694767 B CN 114694767B CN 202210603132 A CN202210603132 A CN 202210603132A CN 114694767 B CN114694767 B CN 114694767B
- Authority
- CN
- China
- Prior art keywords
- data
- time
- concentration
- space
- differential equation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000010586 diagram Methods 0.000 title claims abstract description 51
- 238000012544 monitoring process Methods 0.000 claims abstract description 114
- 239000011159 matrix material Substances 0.000 claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000009792 diffusion process Methods 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000010219 correlation analysis Methods 0.000 claims abstract description 5
- 230000008569 process Effects 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 9
- 238000004220 aggregation Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000012952 Resampling Methods 0.000 claims description 4
- 239000000809 air pollutant Substances 0.000 claims description 4
- 231100001243 air pollutant Toxicity 0.000 claims description 4
- 101100001669 Emericella variicolor andD gene Proteins 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 230000008447 perception Effects 0.000 abstract description 2
- 239000007789 gas Substances 0.000 description 19
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 101150068770 Gcna gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/20—Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
Abstract
本发明公开了一种基于时空图常微分方程网络的PM2.5浓度预测方法,预测场景是工业园区,属于智能大气感知技术领域,包括如下步骤:在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;把工业园区中所有气体监测站构建成图的形式;对空气湿度数据进行数据处理;构建时空图常微分方程网络模型;将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练。本发明提出的时空图常微分方程网络具有更高的模型训练效率,对PM2.5浓度具有更高的预测精度。
Description
技术领域
本发明属于智能大气感知技术领域,具体涉及基于时空图常微分方程网络的PM2.5浓度预测方法。
背景技术
随着我国经济的快速发展,工业化和城市化进程逐步加快,以PM2.5为主的空气污染物造成的空气污染问题越来越突出,由此引发的空气污染不仅危害着人们的身体健康,严重时还会干扰社会秩序,对人们的生产和生活产生了越来越严重的影响,工业园区是PM2.5的主要来源之一,对工业园区的PM2.5浓度进行预测就显得格外重要。
目前,PM2.5浓度预测的方法主要分为基于统计规律模型的统计预测方法、基于传统机器学习的预测方法以及基于深度学习的预测方法,具体而言,主要有以下几种方法:(1)整合移动平均自回归模型(ARIMA);(2)线性回归方法(LR);(3)支持向量机回归方法(SVR);(4)基于长短时记忆网络的方法(LSTM);(5)基于卷积神经网络的方法(CNN);(6)时空图卷积神经网络方法(STGCN)。这些解决PM2.5浓度预测的方法,分别从空间因素、时间因素及时空因素等方面加以考虑。精准的对工业园区PM2.5浓度进行预测,对于园区工作人员的生产生活以及城市周边环境管控而言都具有指导意义。但是,工业园区PM2.5浓度的精准预测是一个非常有挑战性的问题,这主要是由于以下三个原因。第一,工业园区PM2.5的来源具有多样性,在风场的作用下,PM2.5会自由扩散,这使得各个监测站之间具有空间依赖性,这种空间依赖性不仅仅是局部的,更是具有大尺度的全局依赖性。另一方面,工业园区PM2.5浓度在时间维度上也具有依赖性,某个时刻的浓度值与其相近时刻和某一天相对应时刻的浓度值具有高度相关性。第二,空气湿度对PM2.5浓度产生了很大的影响,影响某个区域PM2.5浓度的原因是多样化的。当进行PM2.5浓度预测时,不能只从历史数据的角度去挖掘PM2.5浓度隐含的规律模式,还应该考虑风向、湿度等对PM2.5产生的影响。第三,如何在考虑时空依赖并结合外部影响因素的情况下达到较高的预测精度,并且使模型的训练效率更高,也是一个困难的问题。
发明内容
针对现有技术中存在的上述问题,本发明提出了一种基于时空图常微分方程网络的PM2.5浓度预测方法,解决了工业园区PM2.5浓度预测不够精准以及模型训练耗时的问题。
本发明的技术方案如下:
一种基于时空图常微分方程网络的PM2.5浓度预测方法,采用构建的时空图常微分方程网络对工业园区PM2.5浓度进行实时预测,具体包括如下步骤:
步骤1、在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;
步骤2、根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;
步骤3、把工业园区中所有气体监测站构建成图的形式来表征监测站之间在空间上的相关性,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;
步骤4、对空气湿度数据进行数据处理;
步骤5、构建时空图常微分方程网络模型;
步骤6、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;
步骤7、各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
进一步地,步骤1的具体过程如下:
步骤1.1、对采集到的工业园区PM2.5浓度、空气湿度、风向数据进行数据预处理,数据预处理包括数据填充、数据筛选、数据标准化;具体为:
步骤1.1.1、数据填充;对于数据的缺失值,用相关系数最大的监测站的值来填补;
步骤1.1.2、数据筛选;对数据进行重采样,将时间间隔调整为10分钟,保证数据集的规整性;
步骤1.1.3、数据标准化;通过z-score方法对数据进行标准化,加快模型训练过程;
步骤1.2、分析各个气体监测站PM2.5浓度、空气湿度数据之间的相关性,分析PM2.5浓度和空气湿度之间的周期性、不同气体监测站的差异性以及空气湿度数据和风向对PM2.5浓度的影响。
进一步地,步骤2的具体过程如下:
步骤2.1、根据高斯扩散模型,在工业园区场景下,将高斯扩散模型抽象为公式(1),
由于工业园区的地理空间有限,各个监测站在同一时刻的风向看作是相同的,所以公式(1)简化为(2),其中常数项省略;
其中,cost(E ij )用来描述空气污染物从监测站i到监测站j扩散的难度;E ij 是两监测站之间的边;D i 和D j 表示ij两监测站的风向方位角;D M 表示E ij 的方位角;L ij 代表E ij 的长度,也就是监测站i与监测站j的距离;F表示计算方位角差的绝对值的函数;
步骤2.2、构建邻接矩阵,邻接矩阵A的各个元素为监测站之间的空间关联程度a ij ,表示为公式(3),
其中,i和j都表示监测站的序号,也分别表示为邻接矩阵的行和列。
进一步地,步骤3的具体过程如下:
步骤3.1、将PM2.5浓度数据构造成形状为[T,N,F]的矩阵形式,T代表数据集总的时间跨度;N代表监测站个数;F表示每个监测站所利用的特征数,这里只用PM2.5浓度,所以F等于1;
步骤3.2、将步骤2构建的邻接矩阵构造成形状为[N,N]的矩阵形式,N代表监测站个数。
进一步地,步骤4的具体过程如下:
步骤4.1、将空气湿度数据构造成形状为[T,1]的矩阵形式,T代表数据集总的时间跨度;
步骤4.2、将处理后的空气湿度数据根据滑窗法划分数据,最终的形状为[T-m-n+1,m,1],T代表数据集总的时间跨度;m代表观测窗的长度;n代表预测窗的长度。
进一步地,步骤5的具体过程如下:
时空图常微分方程网络模型由时空图常微分方程模块、辅助特征提取模块和输出模块组成;
该时空图常微分方程网络模型共包括两个时空图常微分方程模块,每个时空图常微分方程模块均采用三层结构,由两个时间卷积网络和一个STGODE层组成,这种结构捕获时空信息流更充分,堆叠的三层结构进一步扩展了模型挖掘PM2.5复杂时空相关性的能力;
其中,STGODE层的公式表示为(5)和(6):
时间卷积网络计算过程表示为:
两个串联的时空图常微分方程模块的函数抽象表示为:
在辅助特征提取模块中,引入了两层全连接神经网络对空气湿度数据进行嵌入学习;空气湿度的初步特征表示为O other ,其表达式如公式(9)所示,
在输出模块中,将初步特征O h 和O other 进行特征的融合;使用拼接的方法进行特征融合,在该模块中,首先执行最大池操作以选择性地聚合来自不同块的信息,然后设计了一个两层MLP作为输出层;本发明将输出模块函数表示为f 2,将融合后的特征表示为特征向量O,如公式(10),则最终的预测值表示为公式(11);
进一步地,步骤6的具体过程如下:
步骤6.1、将数据输入网络中,通过时空图常微分方程模块,对工业园区PM2.5浓度进行时空相关性建模;通过辅助特征提取模块,对空气湿度数据进行特征建模;
步骤6.2、将上述两种模块建模所得的初步特征进行特征融合,并按照指定维度拼接成一个新的张量;
步骤6.3、将处理好的张量输入到输出模块中建模得到训练好的模型;
步骤6.4、将测试集输入到训练好的模型中,得到最终的预测结果。
本发明所带来的有益技术效果:
本发明提出了一种基于时空图常微分方程网络的工业园区PM2.5浓度预测方法,从时间和空间因素的特征出发,提出的时空图常微分方程网络具有更高的模型训练效率,模型训练时间更短,除此之外对工业园区PM2.5浓度还具有更高的预测精度;本发明提出了一种邻接矩阵的构建方法,该方法可以更充分的表征各个监测站之间的空间关联;本发明充分挖掘了空气湿度对PM2.5产生的影响,进一步提高了模型预测的准确度。
附图说明
图1 为本发明基于时空图常微分方程网络的PM2.5浓度预测方法的流程图;
图2为本发明数据预处理流程图;
图3为本发明数据集来源示意图;
图4为本发明时间维度上不同监测站PM2.5浓度的动态特性曲线;
图5为本发明描述空气湿度与PM2.5浓度相互关系的曲线;
图6 为本发明对工业园区所有监测站构建的拓扑关系示意图;
图7为本发明时空图常微分方程网络示意图;
图8为本发明实验中各个模型在测试集上预测值与真实值的曲线图;
图9为本发明实验中各个模型在训练过程中的训练时间比较图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
本发明构建了一种全新的时空图常微分方程网络,基于该网络对工业园区内的PM2.5浓度进行实时预测。如图1所示,本发明实施例的方法主要包括以下过程:在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;把工业园区中所有气体监测站构建成图的形式来表征监测站之间在空间上的相关性,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;对空气湿度数据进行数据处理;构建时空图常微分方程网络模型;将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
基于构建的时空图常微分方程网络对工业园区PM2.5浓度进行预测的方法具体包括如下步骤:
步骤1、在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;具体过程如下:
步骤1.1、将采集到的工业园区PM2.5浓度、空气湿度、风向数据进行数据预处理,数据预处理流程如图2所示,包括数据填充、数据筛选、数据标准化;具体为:
步骤1.1.1、数据填充;对于数据的缺失值,用相关系数最大的监测站的值来填补,尽可能多的保留数据的变化特征;
步骤1.1.2、数据筛选;对数据进行重采样,将时间间隔调整为10分钟,保证数据集的规整性,重采样时间间隔过短会出现数据的冗余,过长则会丢失部分数据特征。
步骤1.1.3、数据标准化;通过z-score方法对数据进行标准化,以加快模型训练过程。
步骤1.2、分析各个气体监测站PM2.5浓度、空气湿度数据之间的相关性,分析PM2.5浓度和空气湿度之间的周期性、不同气体监测站的差异性以及空气湿度数据和风向对PM2.5浓度的影响。
图3是数据集来源示意图。本发明实施例所使用的数据集来自东明南工业园区真实的大气数据,收集这些数据的设备主要是对工业园区排放的烟气、有毒有害气体进行监测的物联网感知设备(比如,通过物联网相连的气体监测站),这些对大气监测的感知设备按照点、线、面的布局原则分布在园区边界、企业边界、企业内部、敏感区域等,通过大气监测网关设备将监测大气感知设备采集的数据利用4G或有线网络上传至数据库。然后,电脑从数据库中提取数据处理之后形成本发明所使用的数据集。
图4是时间维度上不同监测站PM2.5浓度的动态特性曲线,通过图4,可以得出如下结论:
(1) 数据周期性。不同监测站的PM2.5浓度呈现相同的周期性,例如:在图4中,01#、07#、08#分别为1号监测站、7号监测站、8号监测站,对比发现1号监测站、7号监测站、8号监测站的PM2.5浓度变化规律相同。
(2) 区域数据差异性。不同监测站的PM2.5浓度存在较大的差异性,例如:在图4中,对比发现8号监测站的PM2.5浓度大于1号监测站,1号监测站的PM2.5浓度大于7号监测站,因为8号监测站受到周边污染源的影响更大,7号监测站周边由于几乎没有污染源,所以受到周边污染源的影响较小,进而PM2.5浓度数值最小。
图5是描述空气湿度与PM2.5浓度相互关系的曲线,05#、07#分别为5号监测站、7号监测站,通过图5,可以得出如下结论:空气湿度变化趋势与PM2.5变化趋势基本一致,都具有周期性,但是空气湿度的变化趋势要超前于PM2.5。当空气湿度达到最大值时,PM2.5并没有达到最大值,反而在空气湿度逐渐下降时,PM2.5呈现上升趋势直至最大值。这是因为当空气湿度增大时,空气中的水汽含量变大,空气中的PM2.5颗粒物周围被水分包裹,导致其密度变小,进而导致PM2.5浓度减小。由以上分析可知,空气湿度的确是影响PM2.5浓度水平的一个关键因素。
步骤2、根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;各个监测站周围的PM2.5会随着风场进行自由扩散,所以风场是影响PM2.5的一个重要因素。根据高斯扩散模型的通用模式,在工业园区场景下将高斯扩散模型抽象为工业园区场景下的适配模式,根据风向数据,计算扩散代价,进而构造邻接矩阵。具体过程如下:
步骤2.1、根据高斯扩散模型,在工业园区场景下,将高斯扩散模型抽象为公式(1),
由于工业园区的地理空间有限,各个监测站在同一时刻的风向可以看作是相同的,所以公式(1)又可简化为(2),其中常数项可以省略。
其中,cost(E ij )用来描述空气污染物从监测站i到监测站j扩散的难度;E ij 是两监测站之间的边;D i 和D j 表示ij两监测站的风向方位角;D M 表示E ij 的方位角;L ij 代表E ij 的长度,也就是监测站i与监测站j的距离;F表示计算方位角差的绝对值的函数。
步骤2.2、构建邻接矩阵,邻接矩阵A的各个元素为监测站之间的空间关联程度a ij ,表示为公式(3),
其中,i和j都表示监测站的序号,也分别表示为邻接矩阵的行和列。
如图6所示,对某工业园区所有气体监测站构建拓扑关系,图中数字1-9为监测站序号,a表示监测站之间的空间关联程度,例如,图中a 21表示2号监测站与1号监测站之间的空间关联程度,即PM2.5从2号监测站到1号监测站扩散的难度。在风场的影响下,该拓扑图为有向图。在复杂的工业园区场景下,构造网格化数据是不切实际的,所以本发明将工业园区的监测站分布图构造成图的形式来表征监测站之间在空间上的相关性。将某时刻N个监测站的空间分布抽象为一个图G=(V,E,A),其中V是监测站站点的有限集合;E为边集;A为图的邻接矩阵。
步骤3、把工业园区中所有气体监测站构建成图的形式,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;具体过程如下:
步骤3.1、将PM2.5浓度数据构造成形状为[T,N,F]的矩阵形式,T代表数据集总的时间跨度;N代表监测站个数;F表示每个监测站所利用的特征数,这里只用PM2.5浓度,所以F等于1;
步骤3.2、将步骤2构建的邻接矩阵构造成形状为[N,N]的矩阵形式,N代表监测站个数。
步骤4、对空气湿度数据进行数据处理;具体过程如下:
步骤4.1、将空气湿度数据构造成形状为[T,1]的矩阵形式,T代表数据集总的时间跨度;
步骤4.2、将处理后的空气湿度数据根据滑窗法划分数据,最终的形状为[T-m-n+1,m,1],T代表数据集总的时间跨度;m代表观测窗的长度;n代表预测窗的长度;
步骤5、构建时空图常微分方程网络模型;
如图7所示,时空图常微分方程网络模型由时空图常微分方程模块、辅助特征提取模块和输出模块组成,每个模块的介绍如下。
普通图卷积网络通过使用图卷积操作聚合它们自己和邻居的特征来更新节点的嵌入,卷积运算的经典形式可以表述为公式(1):
然而,当网络变得更深时,这种图神经网络已被证明存在过度平滑的问题,这在很大程度上限制了对远距离依赖关系建模的能力。出于这个原因,本发明引入了STGODE层。STGODE层是通过神经常微分方程对普通图卷积网络的改进,因此它可以构建更深的网络,并且模型训练时的参数更少,从而具有更高的训练效率。STGODE层的公式表示为(5)和(6):
其中,H(t)表示第t层的输出,H 0表示初始输入,ODESolve为常微分方程求解器;U是时间变换矩阵,I是单位矩阵。
PM2.5浓度具有时间相关性,如何充分的捕获这种相关性也十分重要。现有工作大多使用循环神经网络来捕获时间相关性,但这些网络存在迭代耗时等问题。
时间卷积网络(TCN)是2018年提出的时序卷积神经网络模型,它可以大规模的进行并行处理,因此在训练和验证时网络的速度都会更快;可以通过增加层数、改变膨胀系数和滤波器的大小改变感受野,历史信息长短上更加灵活,避免了RNN中的梯度弥散和梯度爆炸的问题;训练时占用的内存更少,尤其是对于长序列。为了提高模型对长期时间依赖的建模能力,本发明采用TCN。其计算过程可表示为:
时空图常微分方程网络模型共包括两个时空图常微分方程模块,每个时空图常微分方程模块均采用三层结构,由两个时间卷积网络(TCN)和一个STGODE层组成,这种结构可以更充分的捕获时空信息流,堆叠的三层结构进一步扩展了模型挖掘PM2.5复杂时空相关性的能力。两个时空图常微分方程模块可共同抽象表示为:
在辅助特征提取模块中,引入了两层全连接神经网络对空气湿度数据进行嵌入学习。空气湿度的初步特征表示为O other ,其表达式如公式(9)所示。
在输出模块中,将初步特征O h 和O other 进行特征的融合。特征融合的方式有很多,本发明使用拼接的方法,因为该方法可以最大可能的保留不同特征的差异性,如果使用特征相加的融合方式,会把不同的特征混合到一个变量中,进而弱化了不同特征的差异性。在该模块中,首先执行最大池操作以选择性地聚合来自不同块的信息,然后设计了一个两层MLP作为输出层。本发明将输出模块函数表示为f 2,将融合后的特征表示为特征向量O,如公式(10),则最终的预测值可表示为公式(11)。
步骤6、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;具体过程如下:
步骤6.1、将数据输入网络中,通过时空图常微分方程模块,对工业园区PM2.5浓度进行时空相关性建模;通过辅助特征提取模块,对空气湿度数据进行特征建模;
步骤6.2、将上述两种模块建模所得的初步特征进行特征融合,并按照指定维度拼接成一个新的张量;
步骤6.3、将处理好的张量输入到输出模块中建模得到训练好的模型,具体训练参数如表1所示:
表1 训练模型的参数
步骤6.4、将测试集输入到训练好的模型中,得到最终的预测结果。预测结果的好坏用平均绝对误差(MAE)、均方根误差(RMSE)以及平均绝对百分比误差(MAPE)来衡量,与基准模型进行比较。
为了证明本发明方法训练出的模型的可行性和优越性,与现有技术LSTM、GRU、STGCN、STAM-STGCN做了对比实验,实验结果如表2所示:
表2 各个模型的性能比较
MAE、RMSE、MAPE值越小代表模型预测能力越强,通过实验结果可以看出,本发明方法取得了最好的预测成绩,MAE、RMSE、MAPE值均为最小。为了更直观的表示本发明方法的预测能力,绘制了STAM-STGCN、STGCN模型和本发明模型在测试集上的预测值与测试集真实值的曲线图,如图8所示。从图8中可以看出,本发明方法模型的预测值和真实值之间呈现最佳拟合。
为了进一步研究比较各模型的性能,绘制上述基准模型中最优的STAM-STGCN模型和本发明模型在训练过程中的训练时间比较图,如图9所示。从模型训练时间对比图中可以看出,本发明方法模型具有更快的训练时间,平均训练时间为62秒,而对比模型的平均训练时间为76秒,在训练时间上缩短了18.4%。
步骤7、各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (3)
1.一种基于时空图常微分方程网络的PM2.5浓度预测方法,其特征在于,采用构建的时空图常微分方程网络对工业园区PM2.5浓度进行实时预测,具体包括如下步骤:
步骤1、在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;
步骤2、根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;具体过程如下:
步骤2.1、根据高斯扩散模型,在工业园区场景下,将高斯扩散模型抽象为公式(1),
由于工业园区的地理空间有限,各个监测站在同一时刻的风向看作是相同的,所以公式(1)简化为(2);
其中,cost(E ij )用来描述空气污染物从监测站i到监测站j扩散的难度;E ij 是两监测站之间的边;D i 和D j 表示i、j两监测站的风向方位角;D M 表示E ij 的方位角;L ij 代表E ij 的长度,也就是监测站i与监测站j的距离;F表示计算方位角差的绝对值的函数;
步骤2.2、构建邻接矩阵,邻接矩阵A的各个元素为监测站之间的空间关联程度a ij ,表示为公式(3),
其中,i和j都表示监测站的序号,也分别表示为邻接矩阵的行和列;
步骤3、把工业园区中所有气体监测站构建成图的形式来表征监测站之间在空间上的相关性,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;具体过程如下:
步骤3.1、将PM2.5浓度数据构造成形状为[T,N,F]的矩阵形式,T代表数据集总的时间跨度;N代表监测站个数;F表示每个监测站所利用的特征数,这里只用PM2.5浓度,所以F等于1;
步骤3.2、将步骤2构建的邻接矩阵构造成形状为[N,N]的矩阵形式,N代表监测站个数;
步骤4、对空气湿度数据进行数据处理;具体过程如下:
步骤4.1、将空气湿度数据构造成形状为[T,1]的矩阵形式,T代表数据集总的时间跨度;
步骤4.2、将处理后的空气湿度数据根据滑窗法划分数据,最终的形状为[T-m-n+1,m,1],T代表数据集总的时间跨度;m代表观测窗的长度;n代表预测窗的长度;
步骤5、构建时空图常微分方程网络模型;具体过程如下:
时空图常微分方程网络模型由时空图常微分方程模块、辅助特征提取模块和输出模块组成;
该时空图常微分方程网络模型共包括两个时空图常微分方程模块,每个时空图常微分方程模块均采用三层结构,由两个时间卷积网络和一个STGODE层组成,这种结构捕获时空信息流更充分,堆叠的三层结构进一步扩展了模型挖掘PM2.5复杂时空相关性的能力;
其中,STGODE层的公式表示为(5)和(6):
时间卷积网络计算过程表示为:
两个串联的时空图常微分方程模块的函数均抽象表示为:
在辅助特征提取模块中,引入了两层全连接神经网络对空气湿度数据进行嵌入学习;空气湿度的初步特征表示为O other ,其表达式如公式(9)所示,
在输出模块中,将初步特征O h 和O other 进行特征的融合;使用拼接的方法进行特征融合,在该模块中,首先执行最大池操作以选择性地聚合来自不同块的信息,然后设计了一个两层MLP作为输出层;将输出模块函数表示为f 2,将融合后的特征表示为特征向量O,如公式(10),则最终的预测值表示为公式(11);
步骤6、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;
步骤7、各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
2.根据权利要求1所述基于时空图常微分方程网络的PM2.5浓度预测方法,其特征在于,所述步骤1的具体过程如下:
步骤1.1、对采集到的工业园区PM2.5浓度、空气湿度、风向数据进行数据预处理,数据预处理包括数据填充、数据筛选、数据标准化;具体为:
步骤1.1.1、数据填充;对于数据的缺失值,用相关系数最大的监测站的值来填补;
步骤1.1.2、数据筛选;对数据进行重采样,将时间间隔调整为10分钟,保证数据集的规整性;
步骤1.1.3、数据标准化;通过z-score方法对数据进行标准化,加快模型训练过程;
步骤1.2、分析各个气体监测站的PM2.5浓度之间的相关性、分析各个气体监测站的空气湿度数据之间的相关性,包括分析得出不同气体监测站的PM2.5浓度存在周期性和差异性、分析得出不同气体监测站的空气湿度存在周期性;各个监测站周围的PM2.5会随着风场进行自由扩散,风场是影响PM2.5的重要因素,所以分析得出风向对PM2.5浓度的影响。
3.根据权利要求1所述基于时空图常微分方程网络的PM2.5浓度预测方法,其特征在于,所述步骤6的具体过程如下:
步骤6.1、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络中,通过时空图常微分方程模块,对工业园区PM2.5浓度进行时空相关性建模;通过辅助特征提取模块,对空气湿度数据进行特征建模;
步骤6.2、将上述两种模块建模所得的初步特征进行特征融合,并按照指定维度拼接成一个新的张量;
步骤6.3、将处理好的张量输入到输出模块中建模得到训练好的模型;
步骤6.4、将测试集输入到训练好的模型中,得到最终的预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210603132.8A CN114694767B (zh) | 2022-05-31 | 2022-05-31 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210603132.8A CN114694767B (zh) | 2022-05-31 | 2022-05-31 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114694767A CN114694767A (zh) | 2022-07-01 |
CN114694767B true CN114694767B (zh) | 2022-08-26 |
Family
ID=82131015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210603132.8A Active CN114694767B (zh) | 2022-05-31 | 2022-05-31 | 基于时空图常微分方程网络的pm2.5浓度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114694767B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116341763B (zh) * | 2023-05-23 | 2023-07-28 | 西南交通大学 | 一种空气质量预测方法 |
CN117074627B (zh) * | 2023-10-16 | 2024-01-09 | 三科智能(山东)集团有限公司 | 基于人工智能的医疗实验室空气质量监测系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949749A (zh) * | 2020-07-30 | 2020-11-17 | 中国科学技术大学 | 基于高阶图卷积网络的空气质量监测站点位置推荐方法 |
CN114330143A (zh) * | 2022-01-24 | 2022-04-12 | 青岛理工大学 | 一种基于多源时空信息的分布式参数系统状态预测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT201700064056A1 (it) * | 2017-06-09 | 2018-12-09 | Sense Square S R L S | Mappatura delle sorgenti d’inquinamento atmosferico e tracciamento degli inquinanti mediante l’utilizzo di reti di monitoraggio della qualità dell’aria ad alta risoluzione spazio-temporale |
US11790213B2 (en) * | 2019-06-12 | 2023-10-17 | Sri International | Identifying complex events from hierarchical representation of data set features |
CN114444561A (zh) * | 2021-08-23 | 2022-05-06 | 感知集团有限公司 | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 |
CN113919231B (zh) * | 2021-10-25 | 2023-04-07 | 北京航天创智科技有限公司 | 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统 |
-
2022
- 2022-05-31 CN CN202210603132.8A patent/CN114694767B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949749A (zh) * | 2020-07-30 | 2020-11-17 | 中国科学技术大学 | 基于高阶图卷积网络的空气质量监测站点位置推荐方法 |
CN114330143A (zh) * | 2022-01-24 | 2022-04-12 | 青岛理工大学 | 一种基于多源时空信息的分布式参数系统状态预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114694767A (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN111832814B (zh) | 一种基于图注意力机制的空气污染物浓度预测方法 | |
CN114694767B (zh) | 基于时空图常微分方程网络的pm2.5浓度预测方法 | |
CN109508360B (zh) | 一种基于元胞自动机的地理多元流数据时空自相关分析方法 | |
CN110782093B (zh) | 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统 | |
CN108009674A (zh) | 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法 | |
CN112085163A (zh) | 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法 | |
CN107346459B (zh) | 一种基于遗传算法改进的多模式污染物集成预报方法 | |
CN113516304B (zh) | 基于时空图网络的区域污染物时空联合预测方法及装置 | |
CN112381673B (zh) | 一种基于数字孪生的园区用电信息分析方法及装置 | |
Zhang et al. | Short-term power load forecasting using integrated methods based on long short-term memory | |
CN114492922A (zh) | 一种中长期发电量预测方法 | |
CN115629160A (zh) | 一种基于时空图的空气污染物浓度预测方法及系统 | |
CN108399470A (zh) | 一种基于多示例遗传神经网络的室内pm2.5预测方法 | |
CN106526710A (zh) | 一种雾霾预测方法及装置 | |
CN114444561A (zh) | 基于CNNs-GRU融合深度学习模型的PM2.5预测方法 | |
CN116307287B (zh) | 一种光伏发电有效时段的预测方法、系统及预测终端 | |
CN114841400A (zh) | 基于多任务时空图卷积的空气质量预测方法 | |
Luo et al. | A fast PM2. 5 forecast approach based on time-series data analysis, regression and regularization | |
CN118350678B (zh) | 基于物联网与大数据的水环境监测数据处理方法及系统 | |
CN114492978A (zh) | 一种基于多层注意力机制的时空序列预测方法及设备 | |
CN115860286A (zh) | 一种基于时序门机制的空气质量预测方法及系统 | |
CN116384565A (zh) | 一种基于缺失数据填补的层次式大气臭氧浓度预测方法 | |
Gunasekar et al. | Sustainable optimized LSTM-based intelligent system for air quality prediction in Chennai | |
Gomathi et al. | Real time air pollution prediction in urban cities using deep learning algorithms and IoT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |