CN115438582A - 一种联合多要素和图注意力的pm2.5浓度预测方法 - Google Patents
一种联合多要素和图注意力的pm2.5浓度预测方法 Download PDFInfo
- Publication number
- CN115438582A CN115438582A CN202211070069.2A CN202211070069A CN115438582A CN 115438582 A CN115438582 A CN 115438582A CN 202211070069 A CN202211070069 A CN 202211070069A CN 115438582 A CN115438582 A CN 115438582A
- Authority
- CN
- China
- Prior art keywords
- data
- sampling time
- node
- time point
- concentration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012544 monitoring process Methods 0.000 claims abstract description 44
- 238000011176 pooling Methods 0.000 claims abstract description 16
- 230000007246 mechanism Effects 0.000 claims abstract description 9
- 238000003062 neural network model Methods 0.000 claims abstract description 9
- 238000010220 Pearson correlation analysis Methods 0.000 claims abstract description 6
- 238000005070 sampling Methods 0.000 claims description 140
- 238000013528 artificial neural network Methods 0.000 claims description 64
- 239000010410 layer Substances 0.000 claims description 35
- 238000012549 training Methods 0.000 claims description 33
- 238000012795 verification Methods 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000010365 information processing Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 2
- 230000035772 mutation Effects 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 239000003344 environmental pollutant Substances 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 239000000809 air pollutant Substances 0.000 description 1
- 231100001243 air pollutant Toxicity 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N15/00—Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
- G01N15/06—Investigating concentration of particle suspensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Dispersion Chemistry (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种联合多要素和图注意力的PM2.5浓度预测方法,本发明方法充分考虑了相关气象要素对PM2.5浓度的影响,通过皮尔逊相关性分析先筛选出对PM2.5浓度影响较大的气象要素,然后和PM2.5浓度数据一起输入到网络中学习特征,通过考虑多要素的影响从而指导PM2.5浓度突变情况下的预测;此外,在神经网络模型中设计了图注意力模块,采用图注意力机制对每个监测站点的邻居站点进行自适应分析,根据潜在相关度的强弱赋予不同大小的注意力权值,然后通过社交池化机制将不同邻居站点的差异性影响信息进行整合,将其考虑到当前站点的预测中,通过学习站点的局部时空相关性提高模型的预测精度。
Description
技术领域
发明属于环境数据预测技术领域,具体是一种联合多要素和图注意力的PM2.5浓度预测方法。
背景技术
空气污染是环境科学的一个重点研究内容,PM2.5对人类健康构成极大威胁,因此有必要提前预测PM2.5浓度的变化趋势。然而,PM2.5的浓度变化受污染源、周边环境变化、气象因素等多种复杂因素的影响,使得准确预测PM2.5浓度的变化趋势十分具有挑战性。
目前,国内外学者关于PM2.5浓度的预测方法主要分为两类:确定性方法和统计方法。确定性方法是指利用空气动力学理论和物理化学方程建立大气污染物浓度扩散模型。这类模型不需要大量的数据,而是通过了解污染源、污染排放量、各类气体的化学成分和大气扩散的物理过程等来对污染物的分布进行预测。在早期污染预测中,确定性方法得到了广泛的应用。然而,确定性方法都具有相似的局限性,那就是它们都需要丰富的先验知识和高速的计算机器,并且所建立的数值模型与区域的相关性极强,因此模型的泛化能力比较弱。
而随着统计方法的出现,确定性方法的局限性逐渐被缓解。统计方法可以利用大量的历史数据,通过较为简单的模型学习出污染物的变化规律。其中,功能强大的人工神经网络为后期PM2.5浓度的预测提供了新思路,加速推进了预测问题的进步,所以利用神经网络对污染物进行预测逐渐获得了众多学者的关注。其中,循环神经网络和其变体长短期记忆网络被广泛应用于各类预测任务中。长短期记忆网络能够模拟空气的时空演化,有效地从空气污染物的时间序列模式中提取有用的特征,因此适用于建模PM2.5的历史浓度数据,从而产生较为可靠的预测。
然而,目前关于PM2.5浓度预测研究还存在很多问题:一是许多预测方法没有充分考虑目标站点PM2.5浓度与周边地区的相关性;二是受污染排放和相关要素影响,PM2.5浓度变化剧烈,突变情况下很难进行准确预测。
发明内容
针对现有技术的不足,本发明拟解决的技术问题是,提供一种联合多要素和图注意力的PM2.5浓度预测方法。本发明预测方法考虑了影响PM2.5浓度的多种气象要素,并在神经网络模型中设计了图注意力机制,大大提升了PM2.5浓度预测的准确性。
本发明解决所述技术问题采用的技术方案如下:设计一种联合多要素和图注意力的PM2.5浓度预测方法,其特征在于,该方法包括如下步骤:
第一步、获取某一区域的K个监测站点的PM2.5浓度与气象要素的历史数据集,该历史数据集包括PM2.5浓度的micaps格点数据和多个气象要素的micaps格点数据,PM2.5浓度的micaps格点数据或一个气象要素的micaps格点数据为一个时空序列向量;
第二步、对历史数据集中的缺失值进行填值处理,然后利用皮尔逊相关性分析,筛选出历史数据集中与PM2.5浓度强相关的其他气象要素;最后,将筛选出来的与PM2.5浓度强相关的其他气象要素数据与PM2.5浓度数据分别进行标准化处理,获得原始数据集;
第三步、根据监测站点的经纬度坐标,将原始数据集中的PM2.5浓度数据和与其强相关的其他气象要素数据分别利用克里金插值法进行插值处理,分别得到G种数据的一定像素大小的网格数据时间序列;然后将每个采样时刻点的网格数据划分成若干个R*R大小的小网格数据,并将G种数据的小网格数据根据监测站点与采样时刻点对应进行拼接,得到若干个小网格数据集,一个小网格数据集为包含N个监测站点的G种数据的阵列数据,N=R2,得到训练数据;
第四步、利用训练数据和平衡注意力社交长短期记忆神经网络进行PM2.5浓度数据预测,具体包括如下步骤:
步骤4.1:将第三步中得到的训练数据以采样时刻点的数量按顺序划分为训练集、验证集;
步骤4.2:将训练集按采样时刻点划分为数量相等的若干组,将一组数据中的前部分的采样时刻点的数据作为BAS-LSTM神经网络的输入,得到后部分的采样时刻点的数据的预测值;具体的,将一组数据的前部分的采样时刻点的每个小网格数据集依次输入到BAS-LSTM神经网络,BAS-LSTM神经网络由多组神经网络模块构成,一组神经网络模块包括一个LSTM单元、一个图注意力层和一个社交池化层;每一组神经网络模块对应一组数据中的前部分一个采样时刻点;
对于第t个采样时刻点,对于监测站点i,对应的神经网络模块的LSTM单元的信息处理方程如下:
其中,与是第t个采样时刻点的的LSTM单元的输入;其中,与第t个采样时刻点的一个小网格数据集中的监测站点i的真实数据相关,为包含G种数据的阵列数据;与第t-1个采样时刻点的神经网络模块的社交池化层输出的社交状态信息相关;为遗忘门,为第t-1个采样时刻点的LSTM单元状态,为输入门,为LSTM单元临时状态,为输出门,为隐藏状态信息;Wf、Wi、Wc和Wo分别是遗忘门、输入门、输入单元和输出门的权重矩阵,bf、bi、bc和bo依次为遗忘门、输入门、输入单元和输出门的偏置;σ为sigmoid激活函数,tanh也是激活函数,表示按位素乘;
由一个小网格数据集得到当前采样时刻点的N个监测站点的隐藏状态信息h,h=其中N为节点个数,这里N=R2,F为每个节点隐藏状态信息的特征维数;将作为第t个采样时刻点的图注意力层的输入,以学习相邻监测站间的注意力权重,具体过程为:在每个采样时刻点,将局部区域R*R内的监测站看作是完整图上的节点,利用图注意力机制对邻居节点的信息进行处理,将不同的重要性权重分别赋予不同的邻居节点信息,学习相邻节点之间的图注意力权重,公式如下:
其中,t=1,2,…Tobs,||为拼接运算;a∈R2F',为单层前馈神经网络的权重向量,T代表转置操作;ei,j为节点j在第t个采样时刻点对节点i的注意力权重系数;在每个采样时刻点,首先将节点i和其邻居节点j的隐藏状态信息进行线性变化;W∈RF'*F,为应用于每个节点的共享线性变换的权值矩阵,F为的特征维数,F'为输出的维数;然后将和进行拼接,将拼接好的状态信息与一个可学习的权重向量aT做点积操作,再将得到的数值通过LeakyReLU激活函数得到注意力权重系数ei,j,最后经过softmax函数对ei,j进行归一化,得到规范化的权重αi,j就是节点j对于节点i的注意力权重;Νi表示节点i在图上的邻居集,学习节点i与其他邻居节点k之间的注意力权重与之类似;图注意力层的输出为注意力权重矩阵A,A∈RN*N,生成的权重矩阵会被输入到下一层即社交池化层,通过下一层汇聚邻居节点的不同影响信息;
社交池化层对周围相关节点的隐藏状态信息进行加权汇集,对于每一个目标节点而言,将其和邻居节点的隐藏状态信息与对应的注意力权重矩阵相乘,然后在水平和垂直方向进行求和,得到社交状信息利用式(11)和式(12)进行空间相关性学习,整合邻居节点的相关状态信息从而学习节点之间的空间交互作用:
其中,1mn(sx,sy)是一个指示函数,用于检查(sx,sy)是否在第(m,n)网格单元中,(sxk,syk)代表节点k的空间相对坐标,j∈N(i),N(i)代表节点i的相邻点的集合,αi,j代表节点j相对于节点i的注意力权重;为第t个时刻点节点j的LSTM单元的隐藏状态信息,是节点i经过整合后的社交状态信息,包含了自身和周围相关邻居节点的隐藏状态信息;
第t个采样时刻点的神经网络模块向第t+1个采样时刻点的神经网络模块传递的是社交状态信息,将节点i的第t个采样时刻点的社交状态信息与第t+1个时刻点的真实数据作为第t+1个时刻的LSTM单元的输入,具体方式为:将第t个时刻的社交状态信息嵌入到向量中,并将第t+1个时刻的PM2.5浓度和相关气象要素的真实数据嵌入到中,然后将和输入到第t+1个时刻的LSTM单元中,得到公式如下:
其中,φ(·)是带有ReLU激活函数的嵌入函数,Wex和Weh是嵌入权重,是节点i在第t个采样时刻点的社交状态信息,是第t+1个采样时刻点节点i的真实数据;Wl是LSTM模型的权重,是节点i在第t+1个采样时刻点的LSTM单元隐藏状态信息;公式(15)表示,将和作为第t+1个时刻点的LSTM单元的输入,根据公式(3)-(8),得到再根据公式公式(9)-(12),即可得到第t+1个采样时刻点的神经网络模块输出的社交状态信息
在BAS-LSTM神经网络开始训练时,各参数初始化采用pytorch框架中的默认值,并令初始隐藏状态信息与初始单元状态信息C0均为0,然后将训练集的一组数据的前部分的采样时刻点的每个小网格数据集依次输入到对应采样时刻点的神经网络模块中,依次迭代学习,直到最后一个采样时刻点,得到各个节点最后一个采样时刻点的LSTM单元的隐藏状态信息;对于节点i,其最后一个采样时刻点的LSTM单元的隐藏状态信息为将经过一个线性层处理,将其转换成G种数据的Tpred维矩阵,公式如下:
其中,是节点i在第Tobs个采样时刻点的LSTM单元的隐藏状态信息, Tobs是采样时刻点的总数,即一组数据的前部分的采样时刻点数量;Tpred是预测时刻点的总数,即一组数据的后部分的采样时刻点数量;Wp是可学习的参数,为一个变换矩阵,即线性层;选择出中的PM2.5的浓度数据 即得节点i的Tpred个预测时刻点的PM2.5浓度数据;
通过最小化B-MSE损失更新网络参数,网络参数更新采用RMSprop优化算法,B-MSE公式如下:
其中,K是某一区域的监测站点总个数,Tobs是采样时刻点的总数,Tpred是预测时刻点的总数,代表第n个预测时刻点第i个监测站点的权重,和分别对应于第n个预测时刻点监测站点i的PM2.5浓度的真实值和预测值;根据该组数据的B-MSE损失更新一次网络参数,然后输入下一组数据,重新迭代计算,得到下一组数据的B-MSE损失,再更新一次网络参数;重复过程,直至计算完最后一组数据的B-MSE损失,然后再更新一次网络参数,BAS-LSTM神经网络的一轮训练完成,保存网络模型;
步骤4.3:将验证集输入到步骤4.2中保存的网络模型中,验证集包括多组数据,一组数据的采样时刻点数量与训练集中的一组数据的采样时刻点数量相同,将验证集的前部分采样时刻点的每个小网格数据集依次输入到BAS-LSTM神经网络模型中,得到后部分采样时刻点的PM2.5浓度的预测数据;利用公式(17)-(18)计算验证集中每组数据的B-MSE值,然后求所有组数据的平均B-MSE损失;
步骤4.4:将步骤4.2中保存的网络模型的参数作为BAS-LSTM神经网络下一轮训练的初始参数,重复步骤4.2-步骤4.3的过程,得到一个新的网络模型和验证集在该网络模型下的平均B-MSE损失;将上一个网络模型的参数作为神经网络下一轮训练的初始参数,不断重复步骤4.2-步骤4.3的过程,若验证集的平均B-MSE损失连续20轮次不下降,则将学习率缩小10倍;如果验证集的平均B-MSE损失连续30轮次不下降,则停止训练;将使验证集的平均B-MSE损失最小的网络模型选择为最优网络模型;
步骤4.5:利用BAS-LSTM神经网络模型进行PM2.5浓度的预测;待预测时刻点的数量为验证集中一组数据的后部分采样时刻点的数量相同,获取顺接在待预测时刻点之前的与验证集中一组数据前部分采样时刻点数量相同的时刻点的数据,将该数据的每个小网格数据集依次输入到步骤4.4中的最优网络模型中,得到待预测时刻点的PM2.5浓度的预测数据。
与现有技术相比,本发明的优点和有益效果是:
1.本发明方法充分考虑了相关气象要素对PM2.5浓度的影响,通过皮尔逊相关性分析先筛选出对PM2.5浓度影响较大的气象要素,然后和PM2.5浓度数据一起输入到网络中学习特征,通过考虑多要素的影响从而指导PM2.5浓度突变情况下的预测;
2.本发明方法在神经网络模型设计了图注意力模块以学习周围站点对目标站点的不同影响;采用图注意力机制对每个监测站点的邻居站点进行自适应分析,根据潜在相关度的强弱赋予不同大小的注意力权值,然后通过社交池化机制将不同邻居的差异性影响信息进行整合,将其考虑到当前站点的预测中,通过学习站点的局部时空相关性以提高模型的预测精度。
附图说明
图1为本发明一种联合多要素和图注意力的PM2.5浓度预测方法的BAS-LSTM神经网络的流程与原理示意图。
图2为本发明一种联合多要素和图注意力的PM2.5浓度预测方法的BAS-LSTM神经网络的LSTM单元的原理示意图(图中字符省略监测站点标识)。
图3为本发明一种联合多要素和图注意力的PM2.5浓度预测方法的BAS-LSTM神经网络的图注意力层的原理示意图。
图4为本发明一种联合多要素和图注意力的PM2.5浓度预测方法的BAS-LSTM神经网络的社交池化层的原理示意图。
具体实施方式
下面结合附图和具体实现方式对本发明的技术方案进行详细说明,并不以此限定本申请的保护范围。
本发明为一种联合多要素和图注意力的PM2.5浓度预测方法(简称方法,参见图1-4),该方法包括如下步骤:
第一步、获取某一区域的K个监测站点的PM2.5浓度与气象要素的历史数据集,该历史数据集包括PM2.5浓度的micaps格点数据和多个气象要素的micaps格点数据,PM2.5浓度的micaps格点数据或一个气象要素的micaps格点数据为一个时空序列向量;
获取PM2.5浓度与气象要素数据集,例如华北地区数据集,该数据集由中国河北省气象局提供,原始数据集包括全国1591个监测站点的35种气象要素数据和PM2.5浓度数据;监测时间为2017年11月1日至2018年3月31日,采样频率以3小时为间隔;因为监测期间华北地区是典型的PM2.5污染区域,污染具有显著的季节性和区域相关性;从全国1591个监测站点中选取出北京市、天津市和河北省所有的合计87个监测站点的PM2.5浓度数据和气象数据制作数据集;数据集覆盖范围为北纬36°34′39″至40°0′40″,东经114°21′15″至119°45′45″;
第二步、对历史数据集中的缺失值进行填值处理,然后利用皮尔逊相关性分析,筛选出历史数据集中与PM2.5浓度强相关的其他气象要素;最后,将筛选出来的与PM2.5浓度强相关的其他气象要素数据与PM2.5浓度数据分别进行标准化处理,获得原始数据集;
由于PM2.5的浓度受到其他相关气象要素的影响,通过考虑其他相关要素的影响能够指导PM2.5浓度的预测,特别是在PM2.5浓度突变情况下,通过学习相关多要素的特征能够及时改善PM2.5的特征学习,提高PM2.5的预测精度;为此,通过皮尔逊相关性分析,计算出各项气象要素与PM2.5之间的相关性,然后利用相关度大小筛选出对PM2.5浓度影响比较大的气象要素,融合相关要素进行预测;具体实现过程如下:
2-1)对气象数据和PM2.5浓度数据进行数据预处理:首先是缺失值处理,采用拉格朗日插值法对35个气象要素和PM2.5浓度数据中的缺失值进行填值处理;
2-2)计算各气象要素与PM2.5浓度数据之间的皮尔逊相关系数:利用式(1)分别计算35个气象要素与PM2.5浓度要素之间的皮尔逊相关系数,筛选出皮尔逊相关系数的绝对值大于0.5的要素;当皮尔逊相关性系数的绝对值大于0.5,则认为是强相关关系,该要素对PM2.5影响较大;
其中,cov(X,Y)表示两个变量之间的协方差,σX和σY分别表示变量X和变量Y的标准差,μX和μY分别表示变量X和变量Y的均值,ρX,Y代表两变量之间的相关性系数;
根据定义,皮尔逊相关性系数的范围在[-1,+1]之间,若两要素的相关性系数介于-1~0之间,表明变量之间存在负相关关系;相关性系数在0~+1之间,则表明变量之间存在正相关关系;相关性系数越接近于0,相关性强度越弱,反之系数的绝对值越接近于1则相关度越强;并且当相关性系数的绝对值在0.1~0.3之间,认为两个变量之间是弱相关关系;相关性系数绝对值在0.3~0.5之间,则可以认为两个变量之间是中度相关关系;如果相关性系数的绝对值大于0.5,则认为是强相关关系;
2-3)对筛选出的多要素数据和PM2.5浓度数据进行标准化处理;根据变量间的皮尔逊相关度大小筛选出相关性最强的9个气象要素,分别为2m相对湿度、700hpa位温、850hpa位温、925hpa位温、999hpa混合层高度、2m露点温度、999hpa能见度、999hpa海平面气压和过去12h v方向通风量;将筛选出的9个气象要素以及PM2.5浓度,合计10个要素,利用公式(2)进行标准化处理:
第三步、根据监测站点的经纬度坐标,将原始数据集中的PM2.5浓度数据和与其强相关的其他气象要素数据分别利用克里金插值法进行插值处理,分别得到G种数据的一定像素大小的网格数据时间序列;然后将每个采样时刻点的网格数据划分成若干个R*R大小的小网格数据,并将G种数据的小网格数据根据监测站点与采样时刻点对应进行拼接,得到若干个小网格数据集,一个小网格数据集为包含N个监测站点的G种数据的阵列数据,N=R2,得到训练数据;
本实施例中,原始数据集中共计1208个采样时刻点、87个监测站点的PM2.5浓度数据和9个气象要素数据,PM2.5浓度数据或每个气象要素数据经过克里金插值法处理形成1208个大小为311×251像素的网格数据;最后将每个网格数据划分成若干个R*R大小的小网格,考虑R2个监测站点之间的局部时空相关性,对于单一监测点来说,另外R2-1个监测站点就视为它的邻居站点,这里R取值为2,如图1所示;则一个小网格数据集为包含4个监测站点的10种数据的阵列数据;
第四步、利用训练数据和平衡注意力社交长短期记忆(Balanced AttentionSocial Long Short-Term Memory,简称BAS-LSTM)神经网络进行PM2.5浓度数据预测,具体包括如下步骤:
步骤4.1:将第三步中得到的训练数据以采样时刻点的数量按顺序划分为训练集、验证集;
步骤4.2:将训练集按采样时刻点划分为数量相等的若干组,将一组数据中的前部分的采样时刻点的数据作为BAS-LSTM神经网络的输入,得到后部分的采样时刻点的数据的预测值;具体的,将一组数据的前部分的采样时刻点的每个小网格数据集依次输入到BAS-LSTM神经网络,BAS-LSTM神经网络由多组神经网络模块构成,一组神经网络模块包括一个LSTM单元、一个图注意力(Graph Attention,GAT)层和一个社交池化层(Social-Pooling,S-P);每一组神经网络模块对应一组数据中的前部分一个采样时刻点。
对于第t个采样时刻点,对于监测站点i,对应的神经网络模块的LSTM单元的信息处理方程如下:
其中,与是第t个采样时刻点的的LSTM单元的输入;其中,与第t个采样时刻点的一个小网格数据集中的监测站点i的真实数据相关,为包含G种数据的阵列数据;与第t-1个采样时刻点的神经网络模块的社交池化层输出的社交状态信息相关;为遗忘门,为第t-1个采样时刻点的LSTM单元状态,为输入门,为LSTM单元临时状态,为输出门,为隐藏状态信息;Wf、Wi、Wc和Wo分别是遗忘门、输入门、输入单元和输出门的权重矩阵,bf、bi、bc和bo依次为遗忘门、输入门、输入单元和输出门的偏置;σ为sigmoid激活函数,tanh也是激活函数,表示按位素乘;
LSTM单元的遗忘门负责丢弃第t-1个采样时刻点的单元状态中需要被更新的部分;LSTM单元的输入门控制临时状态有多少部分可以更新到中,由两部分组成:第一部分是经过处理后的前一采样时刻点的单元信息,第二部分是经过处理后的临时状态信息两部分内容经过线性结合得到更新后的当前采样时刻点的单元状态LSTM单元的输出门控制单元状态有多少部分输出到中,当前采样时刻点的单元状态经过tanh函数的处理,再经过输出门后,便得到了当前采样时刻点的隐藏状态信息
由一个小网格数据集得到当前采样时刻点的N个监测站点的隐藏状态信息h, 其中N为节点个数,这里N=R2,F为每个节点隐藏状态信息的特征维数;将作为第t个采样时刻点的图注意力层的输入,以学习相邻监测站间的注意力权重,具体过程为:在每个采样时刻点,将局部区域R*R内的监测站看作是完整图上的节点,利用图注意力机制对邻居节点的信息进行处理,将不同的重要性权重分别赋予不同的邻居节点信息,学习相邻节点之间的图注意力权重(如图3所示),公式如下:
其中,t=1,2,…Tobs,||为拼接运算;a∈R2F',为单层前馈神经网络的权重向量,T代表转置操作;ei,j为节点j在第t个采样时刻点对节点i的注意力权重系数;在每个采样时刻点,首先将节点i和其邻居节点j的隐藏状态信息进行线性变化,W∈RF'*F,为应用于每个节点的共享线性变换的权值矩阵,F为的特征维数,F'为输出的维数;然后将和进行拼接,将拼接好的状态信息与一个可学习的权重向量aT做点积操作,再将得到的数值通过LeakyReLU激活函数得到注意力权重系数ei,j,最后经过softmax函数对ei,j进行归一化,得到规范化的权重αi,j就是节点j对于节点i的注意力权重;Νi表示节点i在图上(即R*R范围内)的邻居集,学习节点i与其他邻居节点k之间的注意力权重与之类似;图注意力层的输出为注意力权重矩阵A,A∈RN*N,生成的权重矩阵会被输入到下一层即社交池化层,通过下一层汇聚邻居节点的不同影响信息;
社交池化层(Social-Pooling,S-P)对周围相关节点的隐藏状态信息进行加权汇集(图4展示了一个小网格中的R2个监测节点之间学习空间交互信息的过程),对于每一个目标节点而言,将其和邻居节点的隐藏状态信息与对应的注意力权重矩阵相乘,然后在水平和垂直方向进行求和,得到社交状信息利用式(11)和式(12)进行空间相关性学习,整合邻居节点的相关状态信息从而学习节点之间的空间交互作用:
其中,1mn(sx,sy)是一个指示函数,用于检查(sx,sy)是否在第(m,n)网格单元中,(sxk,syk)代表节点k的空间相对坐标,j∈N(i),N(i)代表节点i的相邻点的集合,αi,j代表节点j相对于节点i的注意力权重,为第t个时刻点节点j的LSTM单元的隐藏状态信息,是节点i经过整合后的社交状态信息,包含了自身和周围相关邻居节点的隐藏状态信息;
第t个采样时刻点的神经网络模块向第t+1个采样时刻点的神经网络模块传递的是社交状态信息,将节点i的第t个采样时刻点的社交状态信息与第t+1个时刻点的真实数据作为第t+1个时刻的LSTM单元的输入,具体方式为:将第t个时刻的社交状态信息嵌入到向量中,并将第t+1个时刻的PM2.5浓度和相关气象要素的真实数据嵌入到中,然后将和输入到第t+1个时刻的LSTM单元中,得到公式如下:
其中,φ(·)是带有ReLU激活函数的嵌入函数,Wex和Weh是嵌入权重,是节点i在第t个采样时刻点的社交状态信息,是第t+1个采样时刻点节点i的真实数据;Wl是LSTM模型的权重,是节点i在第t+1个采样时刻点的LSTM单元隐藏状态信息;公式(15)表示,将和作为第t+1个时刻点的LSTM单元的输入,根据公式(3)-(8),得到再根据公式公式(9)-(12),即可得到第t+1个采样时刻点的神经网络模块输出的社交状态信息
在BAS-LSTM神经网络开始训练时,各参数初始化采用pytorch框架中的默认值,并令初始隐藏状态信息与初始单元状态信息C0均为0,然后将训练集的一组数据的前部分的采样时刻点的每个小网格数据集依次输入到对应采样时刻点的神经网络模块中,依次迭代学习,直到最后一个采样时刻点,得到各个节点最后一个采样时刻点的LSTM单元的隐藏状态信息;对于节点i,其最后一个采样时刻点的LSTM单元的隐藏状态信息为将经过一个线性层处理,将其转换成G种数据的Tpred维矩阵,公式如下:
其中,是节点i在第Tobs个采样时刻点的LSTM单元的隐藏状态信息, Tobs是采样时刻点的总数,即一组数据的前部分的采样时刻点数量;Tpred是预测时刻点的总数,即一组数据的后部分的采样时刻点数量;Wp是可学习的参数,为一个变换矩阵,即线性层;选择出中的PM2.5的浓度数据 即得节点i的Tpred个预测时刻点的PM2.5浓度数据;本实施例中,Tobs=Tpred,即一组数据中前部分的采样时刻点数量与后部分的采样时刻点数量相等。
通过最小化B-MSE(Balanced-Mean Square Error,B-MSE)损失更新网络参数,网络参数更新采用adam优化算法,B-MSE公式如下:
其中,K是某一区域的监测站点总个数,Tobs是采样时刻点的总数,Tpred是预测时刻点的总数,代表第n个预测时刻点第i个监测站点的权重,和分别对应于第n个预测时刻点监测站点i的PM2.5浓度的真实值和预测值;在每一个浓度区间范围内,权重的设计根据该对应等级的上限阈值缩小10倍得到,PM2.5污染等级划分依据国家《环境空气质量指数(AQI)技术规定(试行)》标准;根据该组数据的B-MSE损失更新一次网络参数,然后输入下一组数据,重新迭代计算,得到下一组数据的B-MSE损失,再更新一次网络参数;重复过程,直至计算完最后一组数据的B-MSE损失,然后再更新一次网络参数,BAS-LSTM神经网络的一轮训练完成,保存网络模型。
步骤4.3:将验证集输入到步骤4.2中保存的网络模型中,验证集包括多组数据,一组数据的采样时刻点数量与训练集中的一组数据的采样时刻点数量相同,将验证集的前部分采样时刻点的每个小网格数据集依次输入到BAS-LSTM神经网络模型中,得到后部分采样时刻点的PM2.5浓度的预测数据;利用公式(17)-(18)计算验证集中每组数据的B-MSE值,然后求所有组数据的平均B-MSE损失;
步骤4.4:将步骤4.2中保存的网络模型的参数作为BAS-LSTM神经网络下一轮训练的初始参数,重复步骤4.2-步骤4.3的过程,得到一个新的网络模型和验证集在该网络模型下的平均B-MSE损失;将上一个网络模型的参数作为神经网络下一轮训练的初始参数,不断重复步骤4.2-步骤4.3的过程,若验证集的平均B-MSE损失连续20轮次不下降,则将学习率缩小10倍;如果验证集的平均B-MSE损失连续30轮次不下降,则停止训练;将使验证集的平均B-MSE损失最小的网络模型选择为最优网络模型;
步骤4.5:利用BAS-LSTM神经网络模型进行PM2.5浓度的预测;待预测时刻点的数量为验证集中一组数据的后部分采样时刻点的数量相同,获取顺接在待预测时刻点之前的与验证集中一组数据前部分采样时刻点数量相同的时刻点的数据(该数据的获取方法与第一步到第三步所描述的方法相同),将该数据的每个小网格数据集依次输入到步骤4.4中的最优网络模型中,得到待预测时刻点的PM2.5浓度的预测数据。
为了验证本发明方法的效果,利用华北地区多要素数据集,使用LSTM模型和本申请的BAS-LSTM模型进行PM2.5浓度预测;采样时间以3小时为间隔,模型预测时监测时长为8个时刻点即24h,预测未来8个时刻点即24h的PM2.5浓度,以平均绝对误差(Mean AbsoluteError,MAE)、均方根误差(Root Mean Square Error,RMSE)作为评价指标,对比实验结果如表1所示。
表1不同模型在华北地区数据集的对比实验结果
从表1可知,与LSTM相比,本申请的BAS-LSTM模型在两个评价指标均有明显改善,表明通过图注意力社交池化机制学习邻居站点的局部时空相关性能够提升预测准确度。
本发明未述及之处适用于现有技术。
Claims (5)
1.一种联合多要素和图注意力的PM2.5浓度预测方法,其特征在于,该方法包括如下步骤:
第一步、获取某一区域的K个监测站点的PM2.5浓度与气象要素的历史数据集,该历史数据集包括PM2.5浓度的micaps格点数据和多个气象要素的micaps格点数据,PM2.5浓度的micaps格点数据或一个气象要素的micaps格点数据为一个时空序列向量;
第二步、对历史数据集中的缺失值进行填值处理,然后利用皮尔逊相关性分析,筛选出历史数据集中与PM2.5浓度强相关的其他气象要素;最后,将筛选出来的与PM2.5浓度强相关的其他气象要素数据与PM2.5浓度数据分别进行标准化处理,获得原始数据集;
第三步、根据监测站点的经纬度坐标,将原始数据集中的PM2.5浓度数据和与其强相关的其他气象要素数据分别利用克里金插值法进行插值处理,分别得到G种数据的一定像素大小的网格数据时间序列;然后将每个采样时刻点的网格数据划分成若干个R*R大小的小网格数据,并将G种数据的小网格数据根据监测站点与采样时刻点对应进行拼接,得到若干个小网格数据集,一个小网格数据集为包含N个监测站点的G种数据的阵列数据,N=R2,得到训练数据;
第四步、利用训练数据和平衡注意力社交长短期记忆神经网络进行PM2.5浓度数据预测,具体包括如下步骤:
步骤4.1:将第三步中得到的训练数据以采样时刻点的数量按顺序划分为训练集、验证集;
步骤4.2:将训练集按采样时刻点划分为数量相等的若干组,将一组数据中的前部分的采样时刻点的数据作为BAS-LSTM神经网络的输入,得到后部分的采样时刻点的数据的预测值;具体的,将一组数据的前部分的采样时刻点的每个小网格数据集依次输入到BAS-LSTM神经网络,BAS-LSTM神经网络由多组神经网络模块构成,一组神经网络模块包括一个LSTM单元、一个图注意力层和一个社交池化层;每一组神经网络模块对应一组数据中的前部分一个采样时刻点;
对于第t个采样时刻点,对于监测站点i,对应的神经网络模块的LSTM单元的信息处理方程如下:
其中,与是第t个采样时刻点的的LSTM单元的输入;其中,与第t个采样时刻点的一个小网格数据集中的监测站点i的真实数据相关,为包含G种数据的阵列数据;与第t-1个采样时刻点的神经网络模块的社交池化层输出的社交状态信息相关;为遗忘门,为第t-1个采样时刻点的LSTM单元状态,为输入门,为LSTM单元临时状态,为输出门,为隐藏状态信息;Wf、Wi、Wc和Wo分别是遗忘门、输入门、输入单元和输出门的权重矩阵,bf、bi、bc和bo依次为遗忘门、输入门、输入单元和输出门的偏置;σ为sigmoid激活函数,tanh也是激活函数,表示按位素乘;
由一个小网格数据集得到当前采样时刻点的N个监测站点的隐藏状态信息h, 其中N为节点个数,这里N=R2,F为每个节点隐藏状态信息的特征维数;将作为第t个采样时刻点的图注意力层的输入,以学习相邻监测站间的注意力权重,具体过程为:在每个采样时刻点,将局部区域R*R内的监测站看作是完整图上的节点,利用图注意力机制对邻居节点的信息进行处理,将不同的重要性权重分别赋予不同的邻居节点信息,学习相邻节点之间的图注意力权重,公式如下:
其中,t=1,2,...Tobs,||为拼接运算;a∈R2F′,为单层前馈神经网络的权重向量,T代表转置操作;ei,j为节点j在第t个采样时刻点对节点i的注意力权重系数;在每个采样时刻点,首先将节点i和其邻居节点j的隐藏状态信息进行线性变化;W∈RF′*F,为应用于每个节点的共享线性变换的权值矩阵,F为的特征维数,F′为输出的维数;然后将和进行拼接,将拼接好的状态信息与一个可学习的权重向量aT做点积操作,再将得到的数值通过LeakyReLU激活函数得到注意力权重系数ei,j,最后经过softmax函数对ei,j进行归一化,得到规范化的权重αi,j就是节点j对于节点i的注意力权重;Ni表示节点i在图上的邻居集,学习节点i与其他邻居节点k之间的注意力权重与之类似;图注意力层的输出为注意力权重矩阵A,A∈RN*N,生成的权重矩阵会被输入到下一层即社交池化层,通过下一层汇聚邻居节点的不同影响信息;
社交池化层对周围相关节点的隐藏状态信息进行加权汇集,对于每一个目标节点而言,将其和邻居节点的隐藏状态信息与对应的注意力权重矩阵相乘,然后在水平和垂直方向进行求和,得到社交状信息利用式(11)和式(12)进行空间相关性学习,整合邻居节点的相关状态信息从而学习节点之间的空间交互作用:
其中,1mn(sx,sy)是一个指示函数,用于检查(sx,sy)是否在第(m,n)网格单元中,(sxk,syk)代表节点k的空间相对坐标,j∈N(i),N(i)代表节点i的相邻点的集合,αi,j代表节点j相对于节点i的注意力权重;为第t个时刻点节点j的LSTM单元的隐藏状态信息,是节点i经过整合后的社交状态信息,包含了自身和周围相关邻居节点的隐藏状态信息;
第t个采样时刻点的神经网络模块向第t+1个采样时刻点的神经网络模块传递的是社交状态信息,将节点i的第t个采样时刻点的社交状态信息与第t+1个时刻点的真实数据作为第t+1个时刻的LSTM单元的输入,具体方式为:将第t个时刻的社交状态信息嵌入到向量中,并将第t+1个时刻的PM2.5浓度和相关气象要素的真实数据嵌入到中,然后将和输入到第t+1个时刻的LSTM单元中,得到公式如下:
其中,φ(·)是带有ReLU激活函数的嵌入函数,Wex和Weh是嵌入权重,是节点i在第t个采样时刻点的社交状态信息,是第t+1个采样时刻点节点i的真实数据;Wl是LSTM模型的权重,是节点i在第t+1个采样时刻点的LSTM单元隐藏状态信息;公式(15)表示,将和作为第t+1个时刻点的LSTM单元的输入,根据公式(3)-(8),得到再根据公式公式(9)-(12),即可得到第t+1个采样时刻点的神经网络模块输出的社交状态信息
在BAS-LSTM神经网络开始训练时,各参数初始化采用pytorch框架中的默认值,并令初始隐藏状态信息与初始单元状态信息C0均为0,然后将训练集的一组数据的前部分的采样时刻点的每个小网格数据集依次输入到对应采样时刻点的神经网络模块中,依次迭代学习,直到最后一个采样时刻点,得到各个节点最后一个采样时刻点的LSTM单元的隐藏状态信息;对于节点i,其最后一个采样时刻点的LSTM单元的隐藏状态信息为将经过一个线性层处理,将其转换成G种数据的Tpred维矩阵,公式如下:
其中,是节点i在第Tobs个采样时刻点的LSTM单元的隐藏状态信息, Tobs是采样时刻点的总数,即一组数据的前部分的采样时刻点数量;Tpred是预测时刻点的总数,即一组数据的后部分的采样时刻点数量;Wp是可学习的参数,为一个变换矩阵,即线性层;选择出中的PM2.5的浓度数据 即得节点i的Tpred个预测时刻点的PM2.5浓度数据;
通过最小化B-MSE损失更新网络参数,网络参数更新采用RMSprop优化算法,B-MSE公式如下:
其中,K是某一区域的监测站点总个数,Tobs是采样时刻点的总数,Tpred是预测时刻点的总数,代表第n个预测时刻点第i个监测站点的权重,和分别对应于第n个预测时刻点监测站点i的PM2.5浓度的真实值和预测值;根据该组数据的B-MSE损失更新一次网络参数,然后输入下一组数据,重新迭代计算,得到下一组数据的B-MSE损失,再更新一次网络参数;重复过程,直至计算完最后一组数据的B-MSE损失,然后再更新一次网络参数,BAS-LSTM神经网络的一轮训练完成,保存网络模型;
步骤4.3:将验证集输入到步骤4.2中保存的网络模型中,验证集包括多组数据,一组数据的采样时刻点数量与训练集中的一组数据的采样时刻点数量相同,将验证集的前部分采样时刻点的每个小网格数据集依次输入到BAS-LSTM神经网络模型中,得到后部分采样时刻点的PM2.5浓度的预测数据;利用公式(17)-(18)计算验证集中每组数据的B-MSE值,然后求所有组数据的平均B-MSE损失;
步骤4.4:将步骤4.2中保存的网络模型的参数作为BAS-LSTM神经网络下一轮训练的初始参数,重复步骤4.2-步骤4.3的过程,得到一个新的网络模型和验证集在该网络模型下的平均B-MSE损失;将上一个网络模型的参数作为神经网络下一轮训练的初始参数,不断重复步骤4.2-步骤4.3的过程,若验证集的平均B-MSE损失连续20轮次不下降,则将学习率缩小10倍;如果验证集的平均B-MSE损失连续30轮次不下降,则停止训练;将使验证集的平均B-MSE损失最小的网络模型选择为最优网络模型;
步骤4.5:利用BAS-LSTM神经网络模型进行PM2.5浓度的预测;待预测时刻点的数量为验证集中一组数据的后部分采样时刻点的数量相同,获取顺接在待预测时刻点之前的与验证集中一组数据前部分采样时刻点数量相同的时刻点的数据,将该数据的每个小网格数据集依次输入到步骤4.4中的最优网络模型中,得到待预测时刻点的PM2.5浓度的预测数据。
2.根据权利要求1所述的一种联合多要素和图注意力的PM2.5浓度预测方法,其特征在于,第一步中,历史数据集中采样时刻点的间隔为3h。
3.根据权利要求1所述的一种联合多要素和图注意力的PM2.5浓度预测方法,其特征在于,第二步中,采用拉格朗日插值法进行填值处理。
5.根据权利要求1所述的一种联合多要素和图注意力的PM2.5浓度预测方法,其特征在于,第四步中,Tobs=Tpred。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211070069.2A CN115438582A (zh) | 2022-08-30 | 2022-08-30 | 一种联合多要素和图注意力的pm2.5浓度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211070069.2A CN115438582A (zh) | 2022-08-30 | 2022-08-30 | 一种联合多要素和图注意力的pm2.5浓度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115438582A true CN115438582A (zh) | 2022-12-06 |
Family
ID=84247511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211070069.2A Pending CN115438582A (zh) | 2022-08-30 | 2022-08-30 | 一种联合多要素和图注意力的pm2.5浓度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115438582A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116776104A (zh) * | 2023-08-21 | 2023-09-19 | 华南理工大学 | 基于机器学习实现大气成分的变化规律分析方法及系统 |
CN117313551A (zh) * | 2023-11-28 | 2023-12-29 | 中国科学院合肥物质科学研究院 | 基于gat-lstm的放射性核素扩散预测方法及系统 |
-
2022
- 2022-08-30 CN CN202211070069.2A patent/CN115438582A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116776104A (zh) * | 2023-08-21 | 2023-09-19 | 华南理工大学 | 基于机器学习实现大气成分的变化规律分析方法及系统 |
CN116776104B (zh) * | 2023-08-21 | 2023-11-10 | 华南理工大学 | 基于机器学习实现大气成分的变化规律分析方法及系统 |
CN117313551A (zh) * | 2023-11-28 | 2023-12-29 | 中国科学院合肥物质科学研究院 | 基于gat-lstm的放射性核素扩散预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639748B (zh) | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 | |
CN115438582A (zh) | 一种联合多要素和图注意力的pm2.5浓度预测方法 | |
CN107909206B (zh) | 一种基于深层结构循环神经网络的pm2.5预测方法 | |
CN104616060B (zh) | 基于bp神经网络和模糊逻辑的绝缘子污秽度预测方法 | |
CN114626512B (zh) | 一种基于有向图神经网络的高温灾害预报方法 | |
CN113486078B (zh) | 一种分布式配电网运行监控方法及系统 | |
CN109087277B (zh) | 一种空气细颗粒物pm2.5测量方法 | |
CN109635763B (zh) | 一种人群密度估计方法 | |
CN111814956B (zh) | 一种基于多维度二次特征提取的多任务学习的空气质量预测方法 | |
CN113011455B (zh) | 一种空气质量预测svm模型构建方法 | |
CN113591215A (zh) | 基于不确定性的异常卫星组件布局检测方法 | |
CN114462718A (zh) | 基于时间滑动窗口的cnn-gru风电功率预测方法 | |
CN115545334B (zh) | 土地利用类型预测方法、装置、电子设备及存储介质 | |
CN106228197A (zh) | 一种基于自适应极限学习机的卫星图像云量识别方法 | |
CN115629160A (zh) | 一种基于时空图的空气污染物浓度预测方法及系统 | |
CN114723188A (zh) | 水质预测方法、装置、计算机设备和存储介质 | |
CN115146874A (zh) | 一种基于多图卷积网络的河流水质预测方法 | |
CN116844041A (zh) | 一种基于双向卷积时间自注意力机制的耕地提取方法 | |
CN114662791A (zh) | 一种基于时空注意力的长时序pm2.5预测方法及系统 | |
Richards et al. | Regression modelling of spatiotemporal extreme US wildfires via partially-interpretable neural networks | |
CN113657023A (zh) | 基于机器学习和深度学习结合的近地面臭氧浓度反演方法 | |
Richards et al. | A unifying partially-interpretable framework for neural network-based extreme quantile regression | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
CN116525135A (zh) | 基于气象因素的时空模型对疫情发展态势进行预测的方法 | |
Xu et al. | Multi-layer networks for ensemble precipitation forecasts postprocessing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |