CN114694767B - 基于时空图常微分方程网络的pm2.5浓度预测方法 - Google Patents

基于时空图常微分方程网络的pm2.5浓度预测方法 Download PDF

Info

Publication number
CN114694767B
CN114694767B CN202210603132.8A CN202210603132A CN114694767B CN 114694767 B CN114694767 B CN 114694767B CN 202210603132 A CN202210603132 A CN 202210603132A CN 114694767 B CN114694767 B CN 114694767B
Authority
CN
China
Prior art keywords
data
time
concentration
space
differential equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210603132.8A
Other languages
English (en)
Other versions
CN114694767A (zh
Inventor
陈赓
曾庆田
王超
段华
邵睿
徐先杰
张旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202210603132.8A priority Critical patent/CN114694767B/zh
Publication of CN114694767A publication Critical patent/CN114694767A/zh
Application granted granted Critical
Publication of CN114694767B publication Critical patent/CN114694767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/13Differential equations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/20Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)

Abstract

本发明公开了一种基于时空图常微分方程网络的PM2.5浓度预测方法,预测场景是工业园区,属于智能大气感知技术领域,包括如下步骤:在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;把工业园区中所有气体监测站构建成图的形式;对空气湿度数据进行数据处理;构建时空图常微分方程网络模型;将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练。本发明提出的时空图常微分方程网络具有更高的模型训练效率,对PM2.5浓度具有更高的预测精度。

Description

基于时空图常微分方程网络的PM2.5浓度预测方法
技术领域
本发明属于智能大气感知技术领域,具体涉及基于时空图常微分方程网络的PM2.5浓度预测方法。
背景技术
随着我国经济的快速发展,工业化和城市化进程逐步加快,以PM2.5为主的空气污染物造成的空气污染问题越来越突出,由此引发的空气污染不仅危害着人们的身体健康,严重时还会干扰社会秩序,对人们的生产和生活产生了越来越严重的影响,工业园区是PM2.5的主要来源之一,对工业园区的PM2.5浓度进行预测就显得格外重要。
目前,PM2.5浓度预测的方法主要分为基于统计规律模型的统计预测方法、基于传统机器学习的预测方法以及基于深度学习的预测方法,具体而言,主要有以下几种方法:(1)整合移动平均自回归模型(ARIMA);(2)线性回归方法(LR);(3)支持向量机回归方法(SVR);(4)基于长短时记忆网络的方法(LSTM);(5)基于卷积神经网络的方法(CNN);(6)时空图卷积神经网络方法(STGCN)。这些解决PM2.5浓度预测的方法,分别从空间因素、时间因素及时空因素等方面加以考虑。精准的对工业园区PM2.5浓度进行预测,对于园区工作人员的生产生活以及城市周边环境管控而言都具有指导意义。但是,工业园区PM2.5浓度的精准预测是一个非常有挑战性的问题,这主要是由于以下三个原因。第一,工业园区PM2.5的来源具有多样性,在风场的作用下,PM2.5会自由扩散,这使得各个监测站之间具有空间依赖性,这种空间依赖性不仅仅是局部的,更是具有大尺度的全局依赖性。另一方面,工业园区PM2.5浓度在时间维度上也具有依赖性,某个时刻的浓度值与其相近时刻和某一天相对应时刻的浓度值具有高度相关性。第二,空气湿度对PM2.5浓度产生了很大的影响,影响某个区域PM2.5浓度的原因是多样化的。当进行PM2.5浓度预测时,不能只从历史数据的角度去挖掘PM2.5浓度隐含的规律模式,还应该考虑风向、湿度等对PM2.5产生的影响。第三,如何在考虑时空依赖并结合外部影响因素的情况下达到较高的预测精度,并且使模型的训练效率更高,也是一个困难的问题。
发明内容
针对现有技术中存在的上述问题,本发明提出了一种基于时空图常微分方程网络的PM2.5浓度预测方法,解决了工业园区PM2.5浓度预测不够精准以及模型训练耗时的问题。
本发明的技术方案如下:
一种基于时空图常微分方程网络的PM2.5浓度预测方法,采用构建的时空图常微分方程网络对工业园区PM2.5浓度进行实时预测,具体包括如下步骤:
步骤1、在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;
步骤2、根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;
步骤3、把工业园区中所有气体监测站构建成图的形式来表征监测站之间在空间上的相关性,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;
步骤4、对空气湿度数据进行数据处理;
步骤5、构建时空图常微分方程网络模型;
步骤6、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;
步骤7、各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
进一步地,步骤1的具体过程如下:
步骤1.1、对采集到的工业园区PM2.5浓度、空气湿度、风向数据进行数据预处理,数据预处理包括数据填充、数据筛选、数据标准化;具体为:
步骤1.1.1、数据填充;对于数据的缺失值,用相关系数最大的监测站的值来填补;
步骤1.1.2、数据筛选;对数据进行重采样,将时间间隔调整为10分钟,保证数据集的规整性;
步骤1.1.3、数据标准化;通过z-score方法对数据进行标准化,加快模型训练过程;
步骤1.2、分析各个气体监测站PM2.5浓度、空气湿度数据之间的相关性,分析PM2.5浓度和空气湿度之间的周期性、不同气体监测站的差异性以及空气湿度数据和风向对PM2.5浓度的影响。
进一步地,步骤2的具体过程如下:
步骤2.1、根据高斯扩散模型,在工业园区场景下,将高斯扩散模型抽象为公式(1),
Figure 15683DEST_PATH_IMAGE001
(1)
由于工业园区的地理空间有限,各个监测站在同一时刻的风向看作是相同的,所以公式(1)简化为(2),其中常数项省略;
Figure 318488DEST_PATH_IMAGE002
(2)
其中,cost(E ij )用来描述空气污染物从监测站i到监测站j扩散的难度;E ij 是两监测站之间的边;D i D j 表示ij两监测站的风向方位角;D M 表示E ij 的方位角;L ij 代表E ij 的长度,也就是监测站i与监测站j的距离;F表示计算方位角差的绝对值的函数;
步骤2.2、构建邻接矩阵,邻接矩阵A的各个元素为监测站之间的空间关联程度a ij ,表示为公式(3),
Figure 800285DEST_PATH_IMAGE003
(3)
其中,ij都表示监测站的序号,也分别表示为邻接矩阵的行和列。
进一步地,步骤3的具体过程如下:
步骤3.1、将PM2.5浓度数据构造成形状为[T,N,F]的矩阵形式,T代表数据集总的时间跨度;N代表监测站个数;F表示每个监测站所利用的特征数,这里只用PM2.5浓度,所以F等于1;
步骤3.2、将步骤2构建的邻接矩阵构造成形状为[N,N]的矩阵形式,N代表监测站个数。
进一步地,步骤4的具体过程如下:
步骤4.1、将空气湿度数据构造成形状为[T,1]的矩阵形式,T代表数据集总的时间跨度;
步骤4.2、将处理后的空气湿度数据根据滑窗法划分数据,最终的形状为[T-m-n+1,m,1],T代表数据集总的时间跨度;m代表观测窗的长度;n代表预测窗的长度。
进一步地,步骤5的具体过程如下:
时空图常微分方程网络模型由时空图常微分方程模块、辅助特征提取模块和输出模块组成;
该时空图常微分方程网络模型共包括两个时空图常微分方程模块,每个时空图常微分方程模块均采用三层结构,由两个时间卷积网络和一个STGODE层组成,这种结构捕获时空信息流更充分,堆叠的三层结构进一步扩展了模型挖掘PM2.5复杂时空相关性的能力;
其中,STGODE层的公式表示为(5)和(6):
Figure 213949DEST_PATH_IMAGE004
(5)
Figure 97591DEST_PATH_IMAGE005
(6)
其中,H(t)表示第t层的输出,H 0表示初始输入,ODESolve为常微分方程求解器;
Figure 836877DEST_PATH_IMAGE006
是归一化的邻接矩阵,U是时间变换矩阵,I是单位矩阵,W是一个可学习的参数矩阵;
时间卷积网络计算过程表示为:
Figure 805970DEST_PATH_IMAGE007
(7)
其中,X是时间卷积网络的输入,
Figure 23325DEST_PATH_IMAGE008
是时间卷积网络第l层的输出,W l 表示时间 卷积网络第l层的卷积核,
Figure 27053DEST_PATH_IMAGE009
表示激活函数;为了扩大感受野,令
Figure 671661DEST_PATH_IMAGE010
L为时间卷积 网络的总层数;
两个串联的时空图常微分方程模块的函数抽象表示为:
Figure 128050DEST_PATH_IMAGE011
(8)
其中,f 1表示STGODE模块函数,
Figure 883516DEST_PATH_IMAGE012
表示PM2.5浓度数据,A表示邻接矩阵,O h 表示该 模块所提取的PM2.5初步特征;
在辅助特征提取模块中,引入了两层全连接神经网络对空气湿度数据进行嵌入学习;空气湿度的初步特征表示为O other ,其表达式如公式(9)所示,
Figure 741751DEST_PATH_IMAGE013
(9)
其中,
Figure 88419DEST_PATH_IMAGE014
Figure 32104DEST_PATH_IMAGE015
分别表示第一层和第二层全连接神经网络的权值矩阵,
Figure 591261DEST_PATH_IMAGE016
Figure 304002DEST_PATH_IMAGE017
分别表示第一层和第二层全连接神经网络的偏置矩阵,
Figure 290413DEST_PATH_IMAGE018
是激活函数,m t 表示在时间t的空气湿度;
在输出模块中,将初步特征O h O other 进行特征的融合;使用拼接的方法进行特征融合,在该模块中,首先执行最大池操作以选择性地聚合来自不同块的信息,然后设计了一个两层MLP作为输出层;本发明将输出模块函数表示为f 2,将融合后的特征表示为特征向量O,如公式(10),则最终的预测值表示为公式(11);
Figure 455815DEST_PATH_IMAGE019
(10)
Figure 553084DEST_PATH_IMAGE020
(11)。
进一步地,步骤6的具体过程如下:
步骤6.1、将数据输入网络中,通过时空图常微分方程模块,对工业园区PM2.5浓度进行时空相关性建模;通过辅助特征提取模块,对空气湿度数据进行特征建模;
步骤6.2、将上述两种模块建模所得的初步特征进行特征融合,并按照指定维度拼接成一个新的张量;
步骤6.3、将处理好的张量输入到输出模块中建模得到训练好的模型;
步骤6.4、将测试集输入到训练好的模型中,得到最终的预测结果。
本发明所带来的有益技术效果:
本发明提出了一种基于时空图常微分方程网络的工业园区PM2.5浓度预测方法,从时间和空间因素的特征出发,提出的时空图常微分方程网络具有更高的模型训练效率,模型训练时间更短,除此之外对工业园区PM2.5浓度还具有更高的预测精度;本发明提出了一种邻接矩阵的构建方法,该方法可以更充分的表征各个监测站之间的空间关联;本发明充分挖掘了空气湿度对PM2.5产生的影响,进一步提高了模型预测的准确度。
附图说明
图1 为本发明基于时空图常微分方程网络的PM2.5浓度预测方法的流程图;
图2为本发明数据预处理流程图;
图3为本发明数据集来源示意图;
图4为本发明时间维度上不同监测站PM2.5浓度的动态特性曲线;
图5为本发明描述空气湿度与PM2.5浓度相互关系的曲线;
图6 为本发明对工业园区所有监测站构建的拓扑关系示意图;
图7为本发明时空图常微分方程网络示意图;
图8为本发明实验中各个模型在测试集上预测值与真实值的曲线图;
图9为本发明实验中各个模型在训练过程中的训练时间比较图。
具体实施方式
下面结合附图以及具体实施方式对本发明作进一步详细说明:
本发明构建了一种全新的时空图常微分方程网络,基于该网络对工业园区内的PM2.5浓度进行实时预测。如图1所示,本发明实施例的方法主要包括以下过程:在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;把工业园区中所有气体监测站构建成图的形式来表征监测站之间在空间上的相关性,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;对空气湿度数据进行数据处理;构建时空图常微分方程网络模型;将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
基于构建的时空图常微分方程网络对工业园区PM2.5浓度进行预测的方法具体包括如下步骤:
步骤1、在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;具体过程如下:
步骤1.1、将采集到的工业园区PM2.5浓度、空气湿度、风向数据进行数据预处理,数据预处理流程如图2所示,包括数据填充、数据筛选、数据标准化;具体为:
步骤1.1.1、数据填充;对于数据的缺失值,用相关系数最大的监测站的值来填补,尽可能多的保留数据的变化特征;
步骤1.1.2、数据筛选;对数据进行重采样,将时间间隔调整为10分钟,保证数据集的规整性,重采样时间间隔过短会出现数据的冗余,过长则会丢失部分数据特征。
步骤1.1.3、数据标准化;通过z-score方法对数据进行标准化,以加快模型训练过程。
步骤1.2、分析各个气体监测站PM2.5浓度、空气湿度数据之间的相关性,分析PM2.5浓度和空气湿度之间的周期性、不同气体监测站的差异性以及空气湿度数据和风向对PM2.5浓度的影响。
图3是数据集来源示意图。本发明实施例所使用的数据集来自东明南工业园区真实的大气数据,收集这些数据的设备主要是对工业园区排放的烟气、有毒有害气体进行监测的物联网感知设备(比如,通过物联网相连的气体监测站),这些对大气监测的感知设备按照点、线、面的布局原则分布在园区边界、企业边界、企业内部、敏感区域等,通过大气监测网关设备将监测大气感知设备采集的数据利用4G或有线网络上传至数据库。然后,电脑从数据库中提取数据处理之后形成本发明所使用的数据集。
图4是时间维度上不同监测站PM2.5浓度的动态特性曲线,通过图4,可以得出如下结论:
(1) 数据周期性。不同监测站的PM2.5浓度呈现相同的周期性,例如:在图4中,01#、07#、08#分别为1号监测站、7号监测站、8号监测站,对比发现1号监测站、7号监测站、8号监测站的PM2.5浓度变化规律相同。
(2) 区域数据差异性。不同监测站的PM2.5浓度存在较大的差异性,例如:在图4中,对比发现8号监测站的PM2.5浓度大于1号监测站,1号监测站的PM2.5浓度大于7号监测站,因为8号监测站受到周边污染源的影响更大,7号监测站周边由于几乎没有污染源,所以受到周边污染源的影响较小,进而PM2.5浓度数值最小。
图5是描述空气湿度与PM2.5浓度相互关系的曲线,05#、07#分别为5号监测站、7号监测站,通过图5,可以得出如下结论:空气湿度变化趋势与PM2.5变化趋势基本一致,都具有周期性,但是空气湿度的变化趋势要超前于PM2.5。当空气湿度达到最大值时,PM2.5并没有达到最大值,反而在空气湿度逐渐下降时,PM2.5呈现上升趋势直至最大值。这是因为当空气湿度增大时,空气中的水汽含量变大,空气中的PM2.5颗粒物周围被水分包裹,导致其密度变小,进而导致PM2.5浓度减小。由以上分析可知,空气湿度的确是影响PM2.5浓度水平的一个关键因素。
步骤2、根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;各个监测站周围的PM2.5会随着风场进行自由扩散,所以风场是影响PM2.5的一个重要因素。根据高斯扩散模型的通用模式,在工业园区场景下将高斯扩散模型抽象为工业园区场景下的适配模式,根据风向数据,计算扩散代价,进而构造邻接矩阵。具体过程如下:
步骤2.1、根据高斯扩散模型,在工业园区场景下,将高斯扩散模型抽象为公式(1),
Figure 651490DEST_PATH_IMAGE021
(1)
由于工业园区的地理空间有限,各个监测站在同一时刻的风向可以看作是相同的,所以公式(1)又可简化为(2),其中常数项可以省略。
Figure 543223DEST_PATH_IMAGE022
(2)
其中,cost(E ij )用来描述空气污染物从监测站i到监测站j扩散的难度;E ij 是两监测站之间的边;D i D j 表示ij两监测站的风向方位角;D M 表示E ij 的方位角;L ij 代表E ij 的长度,也就是监测站i与监测站j的距离;F表示计算方位角差的绝对值的函数。
步骤2.2、构建邻接矩阵,邻接矩阵A的各个元素为监测站之间的空间关联程度a ij ,表示为公式(3),
Figure 467359DEST_PATH_IMAGE023
(3)
其中,ij都表示监测站的序号,也分别表示为邻接矩阵的行和列。
如图6所示,对某工业园区所有气体监测站构建拓扑关系,图中数字1-9为监测站序号,a表示监测站之间的空间关联程度,例如,图中a 21表示2号监测站与1号监测站之间的空间关联程度,即PM2.5从2号监测站到1号监测站扩散的难度。在风场的影响下,该拓扑图为有向图。在复杂的工业园区场景下,构造网格化数据是不切实际的,所以本发明将工业园区的监测站分布图构造成图的形式来表征监测站之间在空间上的相关性。将某时刻N个监测站的空间分布抽象为一个图G=(V,E,A),其中V是监测站站点的有限集合;E为边集;A为图的邻接矩阵。
步骤3、把工业园区中所有气体监测站构建成图的形式,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;具体过程如下:
步骤3.1、将PM2.5浓度数据构造成形状为[T,N,F]的矩阵形式,T代表数据集总的时间跨度;N代表监测站个数;F表示每个监测站所利用的特征数,这里只用PM2.5浓度,所以F等于1;
步骤3.2、将步骤2构建的邻接矩阵构造成形状为[N,N]的矩阵形式,N代表监测站个数。
步骤4、对空气湿度数据进行数据处理;具体过程如下:
步骤4.1、将空气湿度数据构造成形状为[T,1]的矩阵形式,T代表数据集总的时间跨度;
步骤4.2、将处理后的空气湿度数据根据滑窗法划分数据,最终的形状为[T-m-n+1,m,1],T代表数据集总的时间跨度;m代表观测窗的长度;n代表预测窗的长度;
步骤5、构建时空图常微分方程网络模型;
如图7所示,时空图常微分方程网络模型由时空图常微分方程模块、辅助特征提取模块和输出模块组成,每个模块的介绍如下。
普通图卷积网络通过使用图卷积操作聚合它们自己和邻居的特征来更新节点的嵌入,卷积运算的经典形式可以表述为公式(1):
Figure 368319DEST_PATH_IMAGE024
(4)
其中,GCN表示普通图卷积网络,H k 表示第k个图卷积层的输入,
Figure 790073DEST_PATH_IMAGE025
表示激活函数,
Figure 118286DEST_PATH_IMAGE026
是归一化的邻接矩阵,W是一个可学习的参数矩阵。
然而,当网络变得更深时,这种图神经网络已被证明存在过度平滑的问题,这在很大程度上限制了对远距离依赖关系建模的能力。出于这个原因,本发明引入了STGODE层。STGODE层是通过神经常微分方程对普通图卷积网络的改进,因此它可以构建更深的网络,并且模型训练时的参数更少,从而具有更高的训练效率。STGODE层的公式表示为(5)和(6):
Figure 992702DEST_PATH_IMAGE027
(5)
Figure 697352DEST_PATH_IMAGE028
(6)
其中,H(t)表示第t层的输出,H 0表示初始输入,ODESolve为常微分方程求解器;U是时间变换矩阵,I是单位矩阵。
PM2.5浓度具有时间相关性,如何充分的捕获这种相关性也十分重要。现有工作大多使用循环神经网络来捕获时间相关性,但这些网络存在迭代耗时等问题。
时间卷积网络(TCN)是2018年提出的时序卷积神经网络模型,它可以大规模的进行并行处理,因此在训练和验证时网络的速度都会更快;可以通过增加层数、改变膨胀系数和滤波器的大小改变感受野,历史信息长短上更加灵活,避免了RNN中的梯度弥散和梯度爆炸的问题;训练时占用的内存更少,尤其是对于长序列。为了提高模型对长期时间依赖的建模能力,本发明采用TCN。其计算过程可表示为:
Figure 239192DEST_PATH_IMAGE029
(7)
其中X是TCN的输入,
Figure 738307DEST_PATH_IMAGE030
是TCN第l层的输出,W l 表示TCN第l层的卷积核,
Figure 365597DEST_PATH_IMAGE031
表示 激活函数。为了扩大感受野,令
Figure 608360DEST_PATH_IMAGE032
L为时间卷积网络的总层数。
时空图常微分方程网络模型共包括两个时空图常微分方程模块,每个时空图常微分方程模块均采用三层结构,由两个时间卷积网络(TCN)和一个STGODE层组成,这种结构可以更充分的捕获时空信息流,堆叠的三层结构进一步扩展了模型挖掘PM2.5复杂时空相关性的能力。两个时空图常微分方程模块可共同抽象表示为:
Figure 739127DEST_PATH_IMAGE033
(8)
其中,f 1表示STGODE模块函数,
Figure 409142DEST_PATH_IMAGE034
表示PM2.5浓度数据,A表示邻接矩阵,O h 表示该模 块所提取的PM2.5初步特征。
在辅助特征提取模块中,引入了两层全连接神经网络对空气湿度数据进行嵌入学习。空气湿度的初步特征表示为O other ,其表达式如公式(9)所示。
Figure 523729DEST_PATH_IMAGE035
(9)
其中,
Figure 304603DEST_PATH_IMAGE036
Figure 821035DEST_PATH_IMAGE037
分别表示第一层和第二层全连接神经网络的权值矩阵,
Figure 661952DEST_PATH_IMAGE038
Figure 263835DEST_PATH_IMAGE039
分别表示第一层和第二层全连接神经网络的偏置矩阵,
Figure 848400DEST_PATH_IMAGE040
是激活函数,m t 表 示在时间t的空气湿度。
在输出模块中,将初步特征O h O other 进行特征的融合。特征融合的方式有很多,本发明使用拼接的方法,因为该方法可以最大可能的保留不同特征的差异性,如果使用特征相加的融合方式,会把不同的特征混合到一个变量中,进而弱化了不同特征的差异性。在该模块中,首先执行最大池操作以选择性地聚合来自不同块的信息,然后设计了一个两层MLP作为输出层。本发明将输出模块函数表示为f 2,将融合后的特征表示为特征向量O,如公式(10),则最终的预测值可表示为公式(11)。
Figure 219338DEST_PATH_IMAGE041
(10)
Figure 965577DEST_PATH_IMAGE042
(11)
步骤6、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;具体过程如下:
步骤6.1、将数据输入网络中,通过时空图常微分方程模块,对工业园区PM2.5浓度进行时空相关性建模;通过辅助特征提取模块,对空气湿度数据进行特征建模;
步骤6.2、将上述两种模块建模所得的初步特征进行特征融合,并按照指定维度拼接成一个新的张量;
步骤6.3、将处理好的张量输入到输出模块中建模得到训练好的模型,具体训练参数如表1所示:
表1 训练模型的参数
Figure 789177DEST_PATH_IMAGE043
步骤6.4、将测试集输入到训练好的模型中,得到最终的预测结果。预测结果的好坏用平均绝对误差(MAE)、均方根误差(RMSE)以及平均绝对百分比误差(MAPE)来衡量,与基准模型进行比较。
为了证明本发明方法训练出的模型的可行性和优越性,与现有技术LSTM、GRU、STGCN、STAM-STGCN做了对比实验,实验结果如表2所示:
表2 各个模型的性能比较
Figure 177433DEST_PATH_IMAGE044
MAE、RMSE、MAPE值越小代表模型预测能力越强,通过实验结果可以看出,本发明方法取得了最好的预测成绩,MAE、RMSE、MAPE值均为最小。为了更直观的表示本发明方法的预测能力,绘制了STAM-STGCN、STGCN模型和本发明模型在测试集上的预测值与测试集真实值的曲线图,如图8所示。从图8中可以看出,本发明方法模型的预测值和真实值之间呈现最佳拟合。
为了进一步研究比较各模型的性能,绘制上述基准模型中最优的STAM-STGCN模型和本发明模型在训练过程中的训练时间比较图,如图9所示。从模型训练时间对比图中可以看出,本发明方法模型具有更快的训练时间,平均训练时间为62秒,而对比模型的平均训练时间为76秒,在训练时间上缩短了18.4%。
步骤7、各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (3)

1.一种基于时空图常微分方程网络的PM2.5浓度预测方法,其特征在于,采用构建的时空图常微分方程网络对工业园区PM2.5浓度进行实时预测,具体包括如下步骤:
步骤1、在工业园区内设置若干气体监测站,通过各个气体监测站采集园区内PM2.5浓度、空气湿度、风向三种大气数据,并进行数据预处理和相关性分析;
步骤2、根据高斯扩散模型,融合监测站欧氏距离和风向数据构建邻接矩阵;具体过程如下:
步骤2.1、根据高斯扩散模型,在工业园区场景下,将高斯扩散模型抽象为公式(1),
Figure 23504DEST_PATH_IMAGE001
(1)
由于工业园区的地理空间有限,各个监测站在同一时刻的风向看作是相同的,所以公式(1)简化为(2);
Figure 573434DEST_PATH_IMAGE002
(2)
其中,cost(E ij )用来描述空气污染物从监测站i到监测站j扩散的难度;E ij 是两监测站之间的边;D i D j 表示ij两监测站的风向方位角;D M 表示E ij 的方位角;L ij 代表E ij 的长度,也就是监测站i与监测站j的距离;F表示计算方位角差的绝对值的函数;
步骤2.2、构建邻接矩阵,邻接矩阵A的各个元素为监测站之间的空间关联程度a ij ,表示为公式(3),
Figure 454803DEST_PATH_IMAGE003
(3)
其中,ij都表示监测站的序号,也分别表示为邻接矩阵的行和列;
步骤3、把工业园区中所有气体监测站构建成图的形式来表征监测站之间在空间上的相关性,整个数据集构造成图时间序列数据,图中数据包括邻接矩阵和PM2.5浓度数据;具体过程如下:
步骤3.1、将PM2.5浓度数据构造成形状为[T,N,F]的矩阵形式,T代表数据集总的时间跨度;N代表监测站个数;F表示每个监测站所利用的特征数,这里只用PM2.5浓度,所以F等于1;
步骤3.2、将步骤2构建的邻接矩阵构造成形状为[N,N]的矩阵形式,N代表监测站个数;
步骤4、对空气湿度数据进行数据处理;具体过程如下:
步骤4.1、将空气湿度数据构造成形状为[T,1]的矩阵形式,T代表数据集总的时间跨度;
步骤4.2、将处理后的空气湿度数据根据滑窗法划分数据,最终的形状为[T-m-n+1,m,1],T代表数据集总的时间跨度;m代表观测窗的长度;n代表预测窗的长度;
步骤5、构建时空图常微分方程网络模型;具体过程如下:
时空图常微分方程网络模型由时空图常微分方程模块、辅助特征提取模块和输出模块组成;
该时空图常微分方程网络模型共包括两个时空图常微分方程模块,每个时空图常微分方程模块均采用三层结构,由两个时间卷积网络和一个STGODE层组成,这种结构捕获时空信息流更充分,堆叠的三层结构进一步扩展了模型挖掘PM2.5复杂时空相关性的能力;
其中,STGODE层的公式表示为(5)和(6):
Figure 686064DEST_PATH_IMAGE004
(5)
Figure 336488DEST_PATH_IMAGE005
(6)
其中,H(t)表示第t层的输出,H 0表示初始输入,ODESolve为常微分方程求解器;
Figure 260582DEST_PATH_IMAGE006
是归一化的邻接矩阵,U是时间变换矩阵,I是单位矩阵,W是一个可学习的参数矩阵;
时间卷积网络计算过程表示为:
Figure 363667DEST_PATH_IMAGE007
(7)
其中,X是时间卷积网络的输入,
Figure 38100DEST_PATH_IMAGE008
是时间卷积网络第l层的输出,W l 表示时间卷积网络第l层的卷积核,
Figure 543030DEST_PATH_IMAGE009
表示激活函数;为了扩大感受野,令
Figure 638025DEST_PATH_IMAGE010
L为时间卷积网络的总层数;
两个串联的时空图常微分方程模块的函数均抽象表示为:
Figure 228407DEST_PATH_IMAGE011
(8)
其中,f 1表示STGODE模块函数,
Figure 67050DEST_PATH_IMAGE012
表示PM2.5浓度数据,A表示邻接矩阵,O h 表示该模块所提取的PM2.5初步特征;
在辅助特征提取模块中,引入了两层全连接神经网络对空气湿度数据进行嵌入学习;空气湿度的初步特征表示为O other ,其表达式如公式(9)所示,
Figure 426487DEST_PATH_IMAGE013
(9)
其中,
Figure 489121DEST_PATH_IMAGE014
Figure 268596DEST_PATH_IMAGE015
分别表示第一层和第二层全连接神经网络的权值矩阵,
Figure 910930DEST_PATH_IMAGE016
Figure 187190DEST_PATH_IMAGE017
分别表示第一层和第二层全连接神经网络的偏置矩阵,
Figure 623988DEST_PATH_IMAGE018
是激活函数,m t 表示在时间t的空气湿度;
在输出模块中,将初步特征O h O other 进行特征的融合;使用拼接的方法进行特征融合,在该模块中,首先执行最大池操作以选择性地聚合来自不同块的信息,然后设计了一个两层MLP作为输出层;将输出模块函数表示为f 2,将融合后的特征表示为特征向量O,如公式(10),则最终的预测值表示为公式(11);
Figure 392224DEST_PATH_IMAGE019
(10)
Figure 369407DEST_PATH_IMAGE020
(11)
步骤6、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络进行模型训练;
步骤7、各个气体监测站实时采集园区内当前时刻的PM2.5浓度、空气湿度、风向三种大气数据,基于训练完成的模型对园区内的PM2.5浓度进行实时预测。
2.根据权利要求1所述基于时空图常微分方程网络的PM2.5浓度预测方法,其特征在于,所述步骤1的具体过程如下:
步骤1.1、对采集到的工业园区PM2.5浓度、空气湿度、风向数据进行数据预处理,数据预处理包括数据填充、数据筛选、数据标准化;具体为:
步骤1.1.1、数据填充;对于数据的缺失值,用相关系数最大的监测站的值来填补;
步骤1.1.2、数据筛选;对数据进行重采样,将时间间隔调整为10分钟,保证数据集的规整性;
步骤1.1.3、数据标准化;通过z-score方法对数据进行标准化,加快模型训练过程;
步骤1.2、分析各个气体监测站的PM2.5浓度之间的相关性、分析各个气体监测站的空气湿度数据之间的相关性,包括分析得出不同气体监测站的PM2.5浓度存在周期性和差异性、分析得出不同气体监测站的空气湿度存在周期性;各个监测站周围的PM2.5会随着风场进行自由扩散,风场是影响PM2.5的重要因素,所以分析得出风向对PM2.5浓度的影响。
3.根据权利要求1所述基于时空图常微分方程网络的PM2.5浓度预测方法,其特征在于,所述步骤6的具体过程如下:
步骤6.1、将PM2.5浓度数据、邻接矩阵以及空气湿度数据输入到时空图常微分方程网络中,通过时空图常微分方程模块,对工业园区PM2.5浓度进行时空相关性建模;通过辅助特征提取模块,对空气湿度数据进行特征建模;
步骤6.2、将上述两种模块建模所得的初步特征进行特征融合,并按照指定维度拼接成一个新的张量;
步骤6.3、将处理好的张量输入到输出模块中建模得到训练好的模型;
步骤6.4、将测试集输入到训练好的模型中,得到最终的预测结果。
CN202210603132.8A 2022-05-31 2022-05-31 基于时空图常微分方程网络的pm2.5浓度预测方法 Active CN114694767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210603132.8A CN114694767B (zh) 2022-05-31 2022-05-31 基于时空图常微分方程网络的pm2.5浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210603132.8A CN114694767B (zh) 2022-05-31 2022-05-31 基于时空图常微分方程网络的pm2.5浓度预测方法

Publications (2)

Publication Number Publication Date
CN114694767A CN114694767A (zh) 2022-07-01
CN114694767B true CN114694767B (zh) 2022-08-26

Family

ID=82131015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210603132.8A Active CN114694767B (zh) 2022-05-31 2022-05-31 基于时空图常微分方程网络的pm2.5浓度预测方法

Country Status (1)

Country Link
CN (1) CN114694767B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116341763B (zh) * 2023-05-23 2023-07-28 西南交通大学 一种空气质量预测方法
CN117074627B (zh) * 2023-10-16 2024-01-09 三科智能(山东)集团有限公司 基于人工智能的医疗实验室空气质量监测系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949749A (zh) * 2020-07-30 2020-11-17 中国科学技术大学 基于高阶图卷积网络的空气质量监测站点位置推荐方法
CN114330143A (zh) * 2022-01-24 2022-04-12 青岛理工大学 一种基于多源时空信息的分布式参数系统状态预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT201700064056A1 (it) * 2017-06-09 2018-12-09 Sense Square S R L S Mappatura delle sorgenti d’inquinamento atmosferico e tracciamento degli inquinanti mediante l’utilizzo di reti di monitoraggio della qualità dell’aria ad alta risoluzione spazio-temporale
US11790213B2 (en) * 2019-06-12 2023-10-17 Sri International Identifying complex events from hierarchical representation of data set features
CN114444561A (zh) * 2021-08-23 2022-05-06 感知集团有限公司 基于CNNs-GRU融合深度学习模型的PM2.5预测方法
CN113919231B (zh) * 2021-10-25 2023-04-07 北京航天创智科技有限公司 基于时空图神经网络的pm2.5浓度时空变化预测方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949749A (zh) * 2020-07-30 2020-11-17 中国科学技术大学 基于高阶图卷积网络的空气质量监测站点位置推荐方法
CN114330143A (zh) * 2022-01-24 2022-04-12 青岛理工大学 一种基于多源时空信息的分布式参数系统状态预测方法

Also Published As

Publication number Publication date
CN114694767A (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN111832814B (zh) 一种基于图注意力机制的空气污染物浓度预测方法
CN114694767B (zh) 基于时空图常微分方程网络的pm2.5浓度预测方法
CN109508360B (zh) 一种基于元胞自动机的地理多元流数据时空自相关分析方法
CN110782093B (zh) 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统
CN108009674A (zh) 基于cnn和lstm融合神经网络的空气pm2.5浓度预测方法
CN112085163A (zh) 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法
CN107346459B (zh) 一种基于遗传算法改进的多模式污染物集成预报方法
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
CN112381673B (zh) 一种基于数字孪生的园区用电信息分析方法及装置
Zhang et al. Short-term power load forecasting using integrated methods based on long short-term memory
CN114492922A (zh) 一种中长期发电量预测方法
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
CN108399470A (zh) 一种基于多示例遗传神经网络的室内pm2.5预测方法
CN106526710A (zh) 一种雾霾预测方法及装置
CN114444561A (zh) 基于CNNs-GRU融合深度学习模型的PM2.5预测方法
CN116307287B (zh) 一种光伏发电有效时段的预测方法、系统及预测终端
CN114841400A (zh) 基于多任务时空图卷积的空气质量预测方法
Luo et al. A fast PM2. 5 forecast approach based on time-series data analysis, regression and regularization
CN118350678B (zh) 基于物联网与大数据的水环境监测数据处理方法及系统
CN114492978A (zh) 一种基于多层注意力机制的时空序列预测方法及设备
CN115860286A (zh) 一种基于时序门机制的空气质量预测方法及系统
CN116384565A (zh) 一种基于缺失数据填补的层次式大气臭氧浓度预测方法
Gunasekar et al. Sustainable optimized LSTM-based intelligent system for air quality prediction in Chennai
Gomathi et al. Real time air pollution prediction in urban cities using deep learning algorithms and IoT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant