CN112288156B - 基于元学习和图注意力时空神经网络的空气质量预测方法 - Google Patents

基于元学习和图注意力时空神经网络的空气质量预测方法 Download PDF

Info

Publication number
CN112288156B
CN112288156B CN202011155619.1A CN202011155619A CN112288156B CN 112288156 B CN112288156 B CN 112288156B CN 202011155619 A CN202011155619 A CN 202011155619A CN 112288156 B CN112288156 B CN 112288156B
Authority
CN
China
Prior art keywords
data
neural network
time
air quality
city
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011155619.1A
Other languages
English (en)
Other versions
CN112288156A (zh
Inventor
张可佳
张旭
刘鹏
卢丹
宋洪涛
韩启龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202011155619.1A priority Critical patent/CN112288156B/zh
Publication of CN112288156A publication Critical patent/CN112288156A/zh
Application granted granted Critical
Publication of CN112288156B publication Critical patent/CN112288156B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于元学习和图注意力时空神经网络的空气质量预测方法,属于空气质量预测技术领域。获取数据;将多个城市划分为源城市和目标城市;根据城市监测站点地理空间数据构建图结构,将监测站点位置作为图的顶点,通过设置距离阀值来确定任意两顶点是否存在边;根据城市监测站点图结构构造输入特征向量,输入图注意力时空神经网络模型进行计算,图注意力时空神经网络模型是由图注意力网络(GAT)和双层长短期记忆网络(LSTM)组成,获取监测站之间的空间相关性和时间相关性;从多个源城市中迁移知识,对注意力时空神经网络模型进行有效的初始化。本发明可以在数据缺失的情况下保持空气质量的时空预测的准确性。

Description

基于元学习和图注意力时空神经网络的空气质量预测方法
技术领域
本发明涉及基于元学习和图注意力时空神经网络的空气质量预测方法,属于空气质量预测技术领域。
背景技术
近年来,空气质量是大家最为关心的问题。在很多国家空气质量成为评价城市幸福指数中的重要一项。为了实现空气质量的实时监控,国家在城市主要区域建设了监测点,还出现了许多便携式监测设备。尽管如此,由于空气因素的复杂性、动态性,以及部分数据的不公开,预测模型在这种情况下保持预测的精确性和稳定性,是极具挑战性的。
随着数据收集技术的提高,与空气质量相关的数据也逐渐被收集全面,再结合当前普遍使用的时空网络模型使得预测的准确性有了进一步的提升。根据数据分析,相邻地区间的依赖关系对空气质量预测有着重要影响。但是,以往的研究在刻画地区之间相关性方面明显不足。该方向上研究的难点在于一方面,很难根据地理距离的远近来判断两个地区空气质量是否相似,因为污染物的扩散受地理、风向、风速等各种因素影响。另一方面,相邻的多个区域对预测区域的影响强度也各有不同。其次,在实际的项目应用中发现,空气质量相关数据很难收集完整。例如,一些城市的数据集不公开或者国控监测站点稀少导致数据集缺失。迁移学习是当前用于应对数据量不足最为有效的方法,然而,传统的迁移方法要求源域和目标域具有很强的相似性,由于不同的地区间的空气质量、气象数据、兴趣点(POI)等数据的分布有很大的差异,这会导致模型的泛化能力不强,有时候还会有负迁移的风险。
发明内容
本发明的目的是提出基于元学习和图注意力时空神经网络的空气质量预测方法,以解决上述现有问题存在的缺陷。
基于元学习和图注意力时空神经网络的空气质量预测方法,所述预测方法包括以下步骤:
步骤一、获取与空气质量相关的时序数据,所述时序数据包括:城市监测站点地理空间数据、历史空气质量数据、气象数据和天气预报数据;
步骤二、将多个城市划分为源城市和目标城市;
步骤三、根据所述城市监测站点地理空间数据构建图结构,将监测站点位置作为图的顶点,通过设置距离阀值来确定任意两顶点是否存在边,边上权值则通过GAT学习获得;
步骤四、构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,根据步骤三得到的城市监测站点图结构构造输入特征向量,将特征向量输入到图注意力时空神经网络模型进行计算;
步骤五、从多个源城市中迁移知识,对注意力时空神经网络模型进行有效的初始化,用于目标城市的空气质量预测;
步骤六、在目标城市数据集上进行模型评估。
进一步的,步骤一具体包括以下步骤:
步骤一一、定时获取城市监测站点地区的空气质量数据,每个监测站s所在地区的空气质量数据向量为
Figure BDA0002742691070000021
向量中t表示某一时刻;
步骤一二、每个监测站s所在地区的气象数据向量为
Figure BDA0002742691070000022
向量中t表示某一时刻;
步骤一三、每个监测站s所在地区的天气预报数据向量为
Figure BDA0002742691070000023
向量中t表示某一时刻,l表示预测的时长;
步骤一四、对于原始数据中的缺失值和异常值使用均值插补法进行补全或替换,如果缺失值或异常值过多则删除。
进一步的,步骤二具体为:设置一个城市为目标城市,其它城市为源城市,从多个源城市中提取包含空间相关性和时间相关性等综合的时空相关性知识,以便在不同场景下实现拥有有限数据集的目标城市的预测任务。
进一步的,步骤三具体包括以下步骤:
步骤三一、已知城市监测站点的经纬度,以一个监测站点为圆心,设置半径为R,该监测站点与圆内所有监测站点之间均存在边,最终获得一张城市监测站点空间图结构;
步骤三二、通过修改R的大小来确定一个站点的入度数,入度数越大则表示与之相关的其它监测站点数越多。
进一步的,步骤四具体包括以下步骤:
步骤四一、使用城市所有监测站点过去一段时间的数据预测某个监测站点未来某一段时间的空气质量,监测站所在地区的气象数据表示为矩阵
Figure BDA0002742691070000031
监测站所在地区的空气质量数据表示为矩阵/>
Figure BDA0002742691070000032
要预测的监测站所在地区的天气预报数据表示为向量/>
Figure BDA0002742691070000033
步骤四二:根据城市监测站点图结构构造输入特征向量,构造一个三维的特征矩阵
Figure BDA0002742691070000034
T为时间跨度,N为监测站点个数,F为所有相关特征维度,输入矩阵为:
Figure BDA0002742691070000035
其中
Figure BDA0002742691070000036
S是监测站点集合,F表示每个站点的特征维数,作为图注意力层的输入值;/>
步骤四三:构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,将步骤四二构造的特征向量输入到图注意力时空神经网络模型进行计算,其中,需调节的参数为图注意力层参数和LSTM层参数;
步骤四四:GAT层通过共享权值矩阵W将输入特征转换成更高级的特征,利用一个单层前馈神经网络将高维特征映射到一个实数上,获得节点间的注意力系数,最后通过softmax层获得归一化后的注意力系数;
步骤四五:将叠加了空间相关性的输出结果输入到第一层LSTM中获取时间相关性,再和原始数据拼接后输入到第二层LSTM中,通过一层全连接层获得最终的预测值。
进一步的,步骤五具体包括以下步骤:
步骤五一、准备好源城市数据集Cs,随机初始化模型参数θ0
步骤五二、从源城市数据集Cs中选择一个任务
Figure BDA0002742691070000041
用/>
Figure BDA0002742691070000042
对图注意力时空神经网络进行模型训练,并对该任务的模型参数/>
Figure BDA0002742691070000043
进行梯度更新;
步骤五三、在测试数据集上测试更新后的网络,计算误差;
步骤五四、根据各个任务更新后的网络的表现求初始化参数的梯度,并对元学习模型的参数θ0进行更新;
步骤五五、保存模型。
进一步的,步骤六具体包括以下步骤:
步骤六一、准备好目标城市数据集Ct,和步骤五学习得到的参数θ0
步骤六二、在目标城市数据集Ct中选择一个任务
Figure BDA0002742691070000044
并对该任务的模型参数/>
Figure BDA0002742691070000045
进行梯度更新;
步骤六三、向图注意力时空神经网络中输入测试集数据,获得预测结果;
步骤六四、将预测结果与真实值比较。
本发明的主要优点是:本发明针对传统预测模型在捕获空间相关性上的问题,提出了创新和先进的方法,通过将城市监测站点用图结构表示,然后借助图注意力网络学习它们之间的关系系数,有效的提取空间相关性,再用长短期记忆网络提取时间相关性。在构造输入特征方面,加入时间维度,用过去一段时间的空气质量走向预测未来某一时刻的空气质量。
为了使模型具有实用性,本发明针对数据不足情况下的空气质量预测问题,给出了解决方案,通过融合元学习框架,从多个数据充足的城市中迁移知识,快速的对模型进行初始化,能够广泛覆盖多种情况。
附图说明
图1是基于元学习和图注意力时空神经网络的空气质量预测方法的流程图;
图2是基于元学习和图注意力时空神经网络结构图;
图3是北京市监测站点结构图;
图4是图注意力时空神经网络结构图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
基于元学习和图注意力时空神经网络的空气质量预测方法,所述预测方法包括以下步骤:
步骤一、获取与空气质量相关的时序数据,所述时序数据包括:城市监测站点地理空间数据、历史空气质量数据、气象数据和天气预报数据;
步骤二、将多个城市划分为源城市和目标城市;
步骤三、根据所述城市监测站点地理空间数据构建图结构,将监测站点位置作为图的顶点,通过设置距离阀值来确定任意两顶点是否存在边,边上权值则通过GAT学习获得;
步骤四、构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,根据步骤三得到的城市监测站点图结构构造输入特征向量,将特征向量输入到图注意力时空神经网络模型进行计算;
步骤五、从多个源城市中迁移知识,对注意力时空神经网络模型进行有效的初始化,用于目标城市的空气质量预测;
步骤六、在目标城市数据集上进行模型评估。
进一步的,步骤一具体包括以下步骤:
步骤一一、定时获取城市监测站点地区的空气质量数据,每个监测站s所在地区的空气质量数据向量为
Figure BDA0002742691070000061
向量中t表示某一时刻;
步骤一二、每个监测站s所在地区的气象数据向量为
Figure BDA0002742691070000062
向量中t表示某一时刻;
步骤一三、每个监测站s所在地区的天气预报数据向量为
Figure BDA0002742691070000063
向量中t表示某一时刻,l表示预测的时长;
步骤一四、对于原始数据中的缺失值和异常值使用均值插补法进行补全或替换,如果缺失值或异常值过多则删除。
进一步的,步骤二具体为:设置一个城市为目标城市,其它城市为源城市,从多个源城市中提取包含空间相关性和时间相关性等综合的时空相关性知识,以便在不同场景下实现拥有有限数据集的目标城市的预测任务。
进一步的,步骤三具体包括以下步骤:
步骤三一、已知城市监测站点的经纬度,以一个监测站点为圆心,设置半径为R,该监测站点与圆内所有监测站点之间均存在边,最终获得一张城市监测站点空间图结构;
步骤三二、通过修改R的大小来确定一个站点的入度数,入度数越大则表示与之相关的其它监测站点数越多。
进一步的,步骤四具体包括以下步骤:
步骤四一、使用城市所有监测站点过去一段时间的数据预测某个监测站点未来某一段时间的空气质量,监测站所在地区的气象数据表示为矩阵
Figure BDA0002742691070000064
监测站所在地区的空气质量数据表示为矩阵/>
Figure BDA0002742691070000065
要预测的监测站所在地区的天气预报数据表示为向量/>
Figure BDA0002742691070000066
步骤四二:根据城市监测站点图结构构造输入特征向量,构造一个三维的特征矩阵
Figure BDA0002742691070000067
T为时间跨度,N为监测站点个数,F为所有相关特征维度,输入矩阵为:
Figure BDA0002742691070000071
其中
Figure BDA0002742691070000072
S是监测站点集合,F表示每个站点的特征维数,作为图注意力层的输入值;
步骤四三:构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,将步骤四二构造的特征向量输入到图注意力时空神经网络模型进行计算,其中,需调节的参数为图注意力层参数和LSTM层参数;
步骤四四:GAT层通过共享权值矩阵W将输入特征转换成更高级的特征,利用一个单层前馈神经网络将高维特征映射到一个实数上,获得节点间的注意力系数,最后通过softmax层获得归一化后的注意力系数;
步骤四五:将叠加了空间相关性的输出结果输入到第一层LSTM中获取时间相关性,再和原始数据拼接后输入到第二层LSTM中,通过一层全连接层获得最终的预测值。
进一步的,步骤五具体包括以下步骤:
步骤五一、准备好源城市数据集Cs,随机初始化模型参数θ0
步骤五二、从源城市数据集Cs中选择一个任务
Figure BDA0002742691070000073
用/>
Figure BDA0002742691070000074
对图注意力时空神经网络进行模型训练,并对该任务的模型参数/>
Figure BDA0002742691070000075
进行梯度更新;
步骤五三、在测试数据集上测试更新后的网络,计算误差;
步骤五四、根据各个任务更新后的网络的表现求初始化参数的梯度,并对元学习模型的参数θ0进行更新;
步骤五五、保存模型。
进一步的,步骤六具体包括以下步骤:
步骤六一、准备好目标城市数据集Ct,和步骤五学习得到的参数θ0
步骤六二、在目标城市数据集Ct中选择一个任务
Figure BDA0002742691070000081
并对该任务的模型参数/>
Figure BDA0002742691070000082
进行梯度更新;
步骤六三、向图注意力时空神经网络中输入测试集数据,获得预测结果;
步骤六四、将预测结果与真实值比较。
以下为本发明的具体实施例:
如图1所示为本实施例的方法流程图,本方法具体步骤如下:
步骤一、获取与空气质量相关的时序数据,其中包括:城市监测站点地理空间数据、历史空气质量数据、气象数据、天气预报数据;
(1)本发明以北京、天津、深圳、广州四个城市为例;
(2)空气质量数据来自中国环境监测总站的全国城市空气质量实时发布平台,定时获取城市监测站点地区的空气质量数据,每个监测站s所在地区的空气质量数据向量为
Figure BDA0002742691070000083
Figure BDA0002742691070000084
本发明中t设置为8h;
(3)气象数据来自美国国家气候数据中心(NCDC)和中国天气网,每个监测站s所在地区的气象数据向量为
Figure BDA0002742691070000085
本发明中t设置为8;
(4)天气预报数据来自中国天气网,每个监测站s的天气预报数据向量为
Figure BDA0002742691070000086
Figure BDA0002742691070000087
本发明中t设置为8,l表示预测的时长,本文分别预测了6h、12h、24h、48h时长的空气质量;
(5)原始数据中存在数据异常和数据缺失等情况,为了尽可能的利用已有数据,使用12小时内的数据均值进行补全或替换,如果缺失值过多则删除。
步骤二、将多个城市划分为源城市和目标城市,目的是从数据充足的源城市中迁移知识用于数据有限的目标城市,从而提高目标城市空气质量预测的准确性,如图2;
(1)为了验证本发明方法在数据不足的情况下能保证预测的稳定性,设置北京为目标城市,其它三个城市为源城市。从三个源城市中提取包含空间相关性和时间相关性等综合的时空相关性知识,以便在不同场景下实现北京市的监测站点的空气质量预测。
步骤三、根据城市监测站点地理空间数据构建图结构,将监测站点位置作为图的顶点,通过设置距离阀值来确定任意两顶点是否存在边,边上权值则是通过GAT学习获得;
(1)以北京市为例,已知北京市内监测站点的经纬度,以一个监测站点为圆心,半径设置为20km,该监测站点与圆内所有监测站点之间均存在边,最终将获得一张北京市监测站点空间图结构如图3;
(2)可以通过修改半径的大小来确定一个站点的入度数,入度数越大则表示与之相关的其它监测站点数越多,所消耗的计算资源就越多,本发明通过试验发现半径设置为20km最为合适。
步骤四、构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,根据城市监测站点图结构构造输入特征向量,将特征向量输入到图注意力时空神经网络模型进行计算,如图4;
(1)本发明用城市所有监测站点过去一段时间的数据预测某个监测站点未来某一段时间的空气质量,所有监测站所在地区的气象数据可以表示为矩阵
Figure BDA0002742691070000091
所有监测站所在地区的空气质量数据可以表示为矩阵
Figure BDA0002742691070000092
要预测的监测站所在地区的天气预报数据可以表示为向量/>
Figure BDA0002742691070000093
(2)根据城市监测站点图结构构造输入特征向量,构造一个三维的特征矩阵
Figure BDA0002742691070000094
Figure BDA0002742691070000095
T为时间跨度,N为监测站点个数,F为所有相关特征维度,输入矩阵为:
Figure BDA0002742691070000096
其中
Figure BDA0002742691070000097
S是监测站点集合,F表示每个站点的特征维数,作为图注意力层的输入值;
(3)构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,将构造的特征向量输入到图注意力时空神经网络模型进行计算,其中主要需要调节的参数为图注意力层和LSTM层参数;
(4)GAT层通过共享权值矩阵W将输入特征转换成更高级的特征,利用一个单层前馈神经网络将高维特征映射到一个实数上,获得节点间的注意力系数,最后使用softmax层获得归一化后的注意力系数;
(5)将叠加了空间相关性的输出结果输入到第一层LSTM中获取时间相关性,再和原始数据拼接后输入到第二层LSTM中,经过一层全连接层获得最终的预测值。
步骤五、从多个源城市中迁移知识,对注意力时空神经网络模型进行有效的初始化,用于目标城市的空气质量预测;
(1)准备好源城市数据集Cs,随机初始化模型参数θ0
(2)从源城市数据集Cs中选择一个任务
Figure BDA0002742691070000101
用/>
Figure BDA0002742691070000102
对图注意力时空神经网络进行模型训练,并对该任务的模型参数/>
Figure BDA0002742691070000103
进行梯度更新;
(3)在测试数据集上测试更新后的网络,计算误差;
(4)根据各个任务更新后的网络的表现求初始化参数的梯度,并对元学习模型的参数θ0进行更新;
(5)保存模型。
步骤六、在目标城市数据集上进行模型评估;
步骤六一、准备好目标城市数据集Ct,和步骤5学习得到的参数θ0
步骤六二、在目标城市数据集Ct中选择一个任务
Figure BDA0002742691070000104
并对该任务的模型参数/>
Figure BDA0002742691070000105
进行梯度更新;
步骤六三、向图注意力时空神经网络中输入测试集数据,获得预测结果;
步骤六四、将预测结果与真实值比较,来评估模型。
应该说明的是,以上所述是一种基于元学习和图注意力时空神经网络的空气质量预测方法的优选实施方式,基于元学习和图注意力时空神经网络的空气质量预测方法的保护范围并不局限于上述实施例,凡属于该思路下的技术方案均属于发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (6)

1.基于元学习和图注意力时空神经网络的空气质量预测方法,其特征在于,所述预测方法包括以下步骤:
步骤一、获取与空气质量相关的时序数据,所述时序数据包括:城市监测站点地理空间数据、历史空气质量数据、气象数据和天气预报数据;
步骤二、将多个城市划分为源城市和目标城市;
步骤三、根据所述城市监测站点地理空间数据构建图结构,将监测站点位置作为图的顶点,通过设置距离阀值来确定任意两顶点是否存在边,边上权值则通过GAT学习获得;
步骤四、构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,根据步骤三得到的城市监测站点图结构构造输入特征向量,将特征向量输入到图注意力时空神经网络模型进行计算;
步骤五、从多个源城市中迁移知识,对注意力时空神经网络模型进行有效的初始化,用于目标城市的空气质量预测;
步骤六、在目标城市数据集上进行模型评估,
其中,步骤四具体包括以下步骤:
步骤四一、使用城市所有监测站点过去一段时间的数据预测某个监测站点未来某一段时间的空气质量,监测站所在地区的气象数据表示为矩阵
Figure FDA0003904746080000011
监测站所在地区的空气质量数据表示为矩阵/>
Figure FDA0003904746080000012
要预测的监测站所在地区的天气预报数据表示为向量/>
Figure FDA0003904746080000013
步骤四二:根据城市监测站点图结构构造输入特征向量,构造一个三维的特征矩阵
Figure FDA0003904746080000014
T为时间跨度,N为监测站点个数,F为所有相关特征维度,输入矩阵为:
Figure FDA0003904746080000015
其中
Figure FDA0003904746080000021
S是监测站点集合,F表示每个站点的特征维数,作为图注意力层的输入值;
步骤四三:构造图注意力时空神经网络,图注意力时空神经网络模型是由GAT和双层LSTM组成,利用GAT学习监测站点之间的空间相关性,使用LSTM学习时间上的相关性,将步骤四二构造的特征向量输入到图注意力时空神经网络模型进行计算,其中,需调节的参数为图注意力层参数和LSTM层参数;
步骤四四:GAT层通过共享权值矩阵W将输入特征转换成更高级的特征,利用一个单层前馈神经网络将高维特征映射到一个实数上,获得节点间的注意力系数,最后通过softmax层获得归一化后的注意力系数;
步骤四五:将叠加了空间相关性的输出结果输入到第一层LSTM中获取时间相关性,再和原始数据拼接后输入到第二层LSTM中,通过一层全连接层获得最终的预测值。
2.根据权利要求1所述的基于元学习和图注意力时空神经网络的空气质量预测方法,其特征在于,步骤一具体包括以下步骤:
步骤一一、定时获取城市监测站点地区的空气质量数据,每个监测站s所在地区的空气质量数据向量为
Figure FDA0003904746080000024
向量中t表示某一时刻;
步骤一二、每个监测站s所在地区的气象数据向量为
Figure FDA0003904746080000025
向量中t表示某一时刻;
步骤一三、每个监测站s所在地区的天气预报数据向量为
Figure FDA0003904746080000026
向量中t表示某一时刻,l表示预测的时长;
步骤一四、对于原始数据中的缺失值和异常值使用均值插补法进行补全或替换,如果缺失值或异常值过多则删除。
3.根据权利要求1所述的基于元学习和图注意力时空神经网络的空气质量预测方法,其特征在于,步骤二具体为:设置一个城市为目标城市,其它城市为源城市,从多个源城市中提取包含空间相关性和时间相关性的时空相关性知识,以便在不同场景下实现拥有有限数据集的目标城市的预测任务。
4.根据权利要求1所述的基于元学习和图注意力时空神经网络的空气质量预测方法,其特征在于,步骤三具体包括以下步骤:
步骤三一、已知城市监测站点的经纬度,以一个监测站点为圆心,设置半径为R,该监测站点与圆内所有监测站点之间均存在边,最终获得一张城市监测站点空间图结构;
步骤三二、通过修改R的大小来确定一个站点的入度数,入度数越大则表示与之相关的其它监测站点数越多。
5.根据权利要求1所述的基于元学习和图注意力时空神经网络的空气质量预测方法,其特征在于,步骤五具体包括以下步骤:
步骤五一、准备好源城市数据集Cs,随机初始化模型参数θ0
步骤五二、从源城市数据集Cs中选择一个任务
Figure FDA0003904746080000031
用/>
Figure FDA0003904746080000032
对图注意力时空神经网络进行模型训练,并对该任务的模型参数/>
Figure FDA0003904746080000033
进行梯度更新;
步骤五三、在测试数据集上测试更新后的网络,计算误差;
步骤五四、根据各个任务更新后的网络的表现求初始化参数的梯度,并对元学习模型的参数θ0进行更新;
步骤五五、保存模型。
6.根据权利要求1所述的基于元学习和图注意力时空神经网络的空气质量预测方法,其特征在于,步骤六具体包括以下步骤:
步骤六一、准备好目标城市数据集Ct,和步骤五学习得到的参数θ0
步骤六二、在目标城市数据集Ct中选择一个任务
Figure FDA0003904746080000034
并对该任务的模型参数/>
Figure FDA0003904746080000035
进行梯度更新;
步骤六三、向图注意力时空神经网络中输入测试集数据,获得预测结果;
步骤六四、将预测结果与真实值比较。
CN202011155619.1A 2020-10-26 2020-10-26 基于元学习和图注意力时空神经网络的空气质量预测方法 Active CN112288156B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011155619.1A CN112288156B (zh) 2020-10-26 2020-10-26 基于元学习和图注意力时空神经网络的空气质量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011155619.1A CN112288156B (zh) 2020-10-26 2020-10-26 基于元学习和图注意力时空神经网络的空气质量预测方法

Publications (2)

Publication Number Publication Date
CN112288156A CN112288156A (zh) 2021-01-29
CN112288156B true CN112288156B (zh) 2023-03-31

Family

ID=74373136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011155619.1A Active CN112288156B (zh) 2020-10-26 2020-10-26 基于元学习和图注意力时空神经网络的空气质量预测方法

Country Status (1)

Country Link
CN (1) CN112288156B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095575B (zh) * 2021-04-16 2022-04-29 清华大学深圳国际研究生院 一种基于迁移学习的车流量预测方法和系统
CN113516304B (zh) * 2021-06-29 2024-01-23 上海师范大学 基于时空图网络的区域污染物时空联合预测方法及装置
CN113642235B (zh) * 2021-08-09 2023-12-22 贵州电网有限责任公司 一种基于局部时空特征融合的覆冰预测方法
CN113673769B (zh) * 2021-08-24 2024-02-02 北京航空航天大学 基于多元时间序列插补的图神经网络交通流预测方法
CN114280239B (zh) * 2021-12-22 2023-06-16 中科三清科技有限公司 确定城市空气情况的方法、装置、电子设备及介质
CN115358904B (zh) * 2022-10-20 2023-02-03 四川国蓝中天环境科技集团有限公司 一种动静结合的城市区域空气质量监测站选址方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN110782093A (zh) * 2019-10-26 2020-02-11 福州大学 一种融合ssae深度特征学习和lstm网络的pm2.5小时浓度预测方法及系统
CN111160628A (zh) * 2019-12-13 2020-05-15 重庆邮电大学 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9983829B2 (en) * 2016-01-13 2018-05-29 Sandisk Technologies Llc Physical addressing schemes for non-volatile memory systems employing multi-die interleave schemes
CN110458336B (zh) * 2019-07-23 2020-06-09 内蒙古工业大学 一种基于深度学习的网约车供需预测方法
CN110415521B (zh) * 2019-07-31 2021-03-05 京东城市(北京)数字科技有限公司 交通数据的预测方法、装置和计算机可读存储介质
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN111161535B (zh) * 2019-12-23 2021-03-02 山东大学 基于注意力机制的图神经网络交通流量预测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN110782093A (zh) * 2019-10-26 2020-02-11 福州大学 一种融合ssae深度特征学习和lstm网络的pm2.5小时浓度预测方法及系统
CN111160628A (zh) * 2019-12-13 2020-05-15 重庆邮电大学 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Air Pollution Forecasting Using RNN with LSTM";Yi-Ting Tsai;《2018 IEEE 16th Intl Conf on Dependable,Autonomic and Secure Computing,16th Intl Conf on Pervasive Intelligence and Computing,4th Intl Conf on Big Data Intelligence and Computing and Cyber Science and Technology Congress》;20180923;第1074-1079页 *
"移动污染源排污浓度预测方法研究";李永安;《中国优秀硕士学位论文全文数据库》;20200115;B027-727页 *

Also Published As

Publication number Publication date
CN112288156A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
CN112288156B (zh) 基于元学习和图注意力时空神经网络的空气质量预测方法
CN107703564B (zh) 一种降雨预测方法、系统及电子设备
CN112561191B (zh) 预测模型的训练、预测方法、装置、设备、程序和介质
CN106651036A (zh) 空气质量预报系统
CN113222328B (zh) 基于路段污染相似性的空气质量监测设备布点选址方法
CN111428942B (zh) 基于变网格技术提取微地形因子的线路覆冰厚度预测方法
CN110346518B (zh) 一种交通排放污染可视化预警方法及其系统
US20230419823A1 (en) Methods and systems for managing exhaust emission in a smart city based on industrial internet of things
CN110134907B (zh) 一种降雨缺失数据填补方法、系统及电子设备
CN110826244B (zh) 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
Meng et al. Automatic classification of rural building characteristics using deep learning methods on oblique photography
CN115775085B (zh) 一种基于数字孪生的智慧城市管理方法及系统
CN104520861A (zh) 风功率密度预测方法
CN112215059B (zh) 一种基于深度学习的城中村识别和人口估计方法、系统及计算机可读存储介质
CN116539004A (zh) 一种采用无人机测绘的通信线路工程勘察设计方法与系统
CN115795996A (zh) 一种基于现实网络图的图神经网络的城市数据实时管理方法及其系统
CN105956691A (zh) 预测区域不同方位、观测点pm2.5背景浓度计算方法
CN113837134A (zh) 一种基于面向对象的深度学习模型和迁移学习的湿地植被识别方法
CN111178283A (zh) 一种基于无人机图像的既定航线地物识别与定位方法
CN114021830A (zh) 一种基于cnn-lstm的多时间范围风速预测方法
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
CN116341773A (zh) 车辆需求预测方法、装置、计算机设备和存储介质
CN116227362A (zh) 一种基于图与深度学习的市政排水管网状态预测方法
Tiancheng et al. Application of improved naive bayesian-CNN classification algorithm in sandstorm prediction in inner mongolia

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant