CN110321932B - 一种基于深度多源数据融合的全城市空气质量指数估计方法 - Google Patents

一种基于深度多源数据融合的全城市空气质量指数估计方法 Download PDF

Info

Publication number
CN110321932B
CN110321932B CN201910497190.5A CN201910497190A CN110321932B CN 110321932 B CN110321932 B CN 110321932B CN 201910497190 A CN201910497190 A CN 201910497190A CN 110321932 B CN110321932 B CN 110321932B
Authority
CN
China
Prior art keywords
air quality
image
loss
feature image
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910497190.5A
Other languages
English (en)
Other versions
CN110321932A (zh
Inventor
陈岭
龙晗宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910497190.5A priority Critical patent/CN110321932B/zh
Publication of CN110321932A publication Critical patent/CN110321932A/zh
Application granted granted Critical
Publication of CN110321932B publication Critical patent/CN110321932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于深度多源数据融合的全城市空气质量指数估计方法,具体实施步骤如下:1)基于每个时刻的城市多源数据构建特征图像作为样本,得到训练数据集;2)利用深度神经网络融合各特征图像来估计完整的空气质量指数特征图像,进而得到各区域的空气质量指数估计值;3)利用有空气质量监测站区域空气质量指数估计、临近区域空气质量相关性约束和特征图像重构三种损失联合训练空气质量指数估计模型,得到参数调优后的空气质量指数估计模型。本发明结合深度学习和图像融合对城市各区域空气质量进行估计,在卫生健康、环境治理、城市规划等领域都具有广阔的应用前景。

Description

一种基于深度多源数据融合的全城市空气质量指数估计方法
技术领域
本发明涉及城市空气质量估计领域,具体涉及一种基于深度多源数据融合的全城市空气质量指数估计方法。
背景技术
随着城市化和工业化的不断推进,很多城市出现大气能见度下降、空气质量不达标等问题,越来越多的人开始关注周边的空气质量。然而城市中空气质量监测站数量有限,无法提供任意区域的空气质量信息。城市空气质量估计可以估计任意区域的空气质量,是城市计算中极具价值的研究方向,在卫生健康、环境治理、城市规划等领域都具有广阔的应用前景。
传统城市空气质量估计研究一般采用半监督的机器学习方法结合城市中的多源数据来估计区域空气质量,如申请公开号为CN104834944A的基于协同训练的城市区域空气质量估计方法和申请公开号为CN108509565A的基于迁移半监督学习的非城市区域空气质量指数空间估计方法。该类方法在对空气质量建模时,从多源数据中选取空气质量的相关影响因素,同时通过半监督学习利用未标注数据,对空气质量与相关影响因素之间的关系进行建模。但是,半监督学习的空气质量估计方法中,使用的特征由人工定义,存在信息丢失。
为了解决特征中信息丢失的问题,研究人员提出了基于深度学习的空气质量估计方法,这类方法通过神经网络自动构建空气质量相关影响因素的特征,端到端地学习城市空气质量与相关影响因素的关系。研究表明深度学习方法利用神经网络自动构建特征,可以比传统方法人工定义的特征在空气质量估计上取得更好的效果。然而,现有空气质量估计方法在对城市空气质量建模时,独立估计各区域的空气质量,忽略了各区域空气质量之间的相关性和各区域影响因素之间的相关性。
发明内容
本发明有效利用城市各区域空气质量之间的相关性和各区域影响因素之间的相关性,提出一种基于深度多源数据融合的全城市空气质量指数估计方法,该全城市空气质量指数估计方法能够快速有效地估计全城市空气质量。
本发明点技术方案为:
一种基于深度多源数据融合的全城市空气质量指数估计方法,包括以下步骤:
(1)基于每个时刻的城市多源数据构建兴趣点特征图像、气象特征图像、交通特征图像、企业自测特征图像和空气质量特征图像五大类特征图像作为训练样本,得到训练数据集;
(2)基于深度神经网络构建空气质量指数估计模型,该空气质量指数估计模型包括特征图像重构单元,特征图像重组单元以及特征图像融合单元,其中,特征图像重构单元主要用于对输入的特征图像进行重构,输出重构特征图像和特征图像块;特征图像重组单元主要用于对特征图像块按块进行重组,输出重组特征图像块;特征图像融合单元主要用于对重组特征图像块进行融合估计,输出空气质量指数估计值;
(3)根据特征图像、重构特征图像、空气质量监测站监测的空气质量指数真值以及空气质量指数估计值构建损失函数,并根据损失函数和训练样本对空气质量指数估计模型进行训练,得到参数调优后的空气质量指数估计模型;
(4)应用时,将待检测城市对应的五大类特征图像输入至参数调优后的空气质量指数估计模型中,经计算输出全城市空气质量指数的估计值。
本发明提供的全城市空气质量指数估计方法中,以图像表示不同来源的城市大数据,引入按块重组实现多图像融合,利用空间和因素上的交叉形成有效表示,同时引入自注意力机制,捕获区域空气质量与多源城市大数据间的动态相关性。同时利用地理学第一定律对临近区域空气质量的变化进行约束,缓解模型参数过多带来的过拟合问题。经过训练获得的空气质量指数估计模型能够快速较准确地预测全城市空气质量指数。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是空气质量指数估计整体流程图;
图2是空气质量指数估计整体框架图;
图3是网格单元;
图4是交通设施特征图像;
图5是兴趣点特征图像;
图6是基于SegNet的表示构建;
图7是基于SegNet的块表示构建;
图8是各特征图像块表示的按块重组;
图9是基于自注意力机制的块内多特征融合;
图10是自底向上的多块表示融合。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
参见图1~图10,本实施例提供的基于深度多源数据融合的全城市空气质量指数估计方法,包括以下步骤:
步骤1,将一个城市划分成若干大小相同边长为l的网格单元,记为G,gij∈G代表第i行,第j列的网格单元。
将一个城市划分成若干大小相同边长为l的网格单元,记为G,如图3所示。其中gij∈G表示第i行,第j列的网格单元。本发明假设一个网格单元内空气质量是相同的,并且将一个网格单元称作城市的一个区域。
步骤2,对于每个时刻的城市多源数据,基于网格单元构建兴趣点特征图像POI、气象特征图像Meteorology、交通特征图像Traffic、企业自测特征图像Pollutant和空气质量特征图像Air Quality五大类特征图像作为样本,得到训练数据集。
将每个时刻城市中带有位置属性的多源数据,按照网格单元划分,统计网格单元中属性的值或数量构建该时刻的特征图像。本发明主要涉及兴趣点、气象、交通、企业自测和空气质量特征,每种特征下的多个类别可以构建各自的特征图像,例如,根据网格单元gij中交通设施类兴趣点(包括公交站、地铁站等)的数量
Figure BDA0002089012630000041
可以构建交通设施特征图像POItranspotation spot,如图4所示。
将每个特征下的多个类别构建的特征图像叠加在一起,如兴趣点特征的交通设施特征图像POItransportation spot、工厂特征图像POIfactory、公园特征图像POIpark、商店特征图像POIstore、饮食场所特征图像POIeating and drinking establishment、体育馆特征图像POIstadium、学校特征图像POIschool、房地产特征图像POIreal estate、娱乐场所特征图像POIentertainment、其他地点特征图像POIother establishment等小类特征图像叠加在一起,类似于包含RGB通道彩色图像的处理方式,得到兴趣点特征图像POI,如图5所示。
同样,将如温度特征图像Meteorologytemperature、湿度特征图像Meteorologyhumidity、降雨量特征图像Meteorologyrainfall、风力特征图像Meteorologywind force、风向特征图像Meteorologywind direct等特征图像叠加在一起,类似于包含RGB通道彩色图像的处理方式,得到气象特征图像Meteorology。将如车速特征图像Trafficspeed和拥堵等级特征图像Trafficcongestion level等特征图像叠加在一起,类似于包含RGB通道彩色图像的处理方式,得到交通特征图像Traffic。将如二氧化硫特征图像
Figure BDA0002089012630000051
烟尘特征图像Pollutantsmoke和氮氧化物特征图像Pollutantnitrogen oxides等特征图像叠加在一起,类似于包含RGB通道彩色图像的处理方式,得到企业自测特征图像Pollutant。将如二氧化硫特征图像Air
Figure BDA0002089012630000052
二氧化氮特征图像Air
Figure BDA0002089012630000053
PM10特征图像Air
Figure BDA0002089012630000054
一氧化氮特征图像Air QualityCO、臭氧特征图像Air
Figure BDA0002089012630000055
PM2.5浓度特征图像Air
Figure BDA0002089012630000056
和空气质量指数特征图像Air QualityAQI等特征图像叠加在一起,类似于包含RGB通道彩色图像的处理方式,得到空气质量特征图像Air Quality。
以上每个时刻得到的趣点特征图像POI、气象特征图像Meteorology、交通特征图像Traffic、企业自测特征图像Pollutant和空气质量特征图像Air Quality作为一个样本,构建训练数据集。
步骤3,构建基于深度神经网络构建空气质量指数估计模型。
本实施例中,空气质量指数估计模型主要包括特征图像重构单元,特征图像重组单元以及特征图像融合单元,其中,特征图像重构单元主要用于对输入的特征图像进行重构,输出重构特征图像和特征图像块;特征图像重组单元主要用于对特征图像块按块进行重组,输出重组特征图像块;特征图像融合单元主要用于对重组特征图像块进行融合估计,输出空气质量指数估计值。
其中,特征图像重构单元可以为由卷积层、池化层和反卷积层组成的SegNet,主要用于提取不同深度的图像特征,形成特征图像块和重构特征图像。图6中所示的为特征图像重构单元的一个实施例,@前的数值表示卷积核或反卷积核的大小,@后的数值表示卷积核或反卷积核的数目,池化层中的数值代表池化范围的大小,
其中,卷积层:以δ作为输入,对其进行卷积运算,输出前一层的特征映射:
Figure BDA0002089012630000061
其中,
Figure BDA0002089012630000062
为第l层的特征经过卷积操作后得到的下一层第k个特征映射,σ(·)为非线性的激活函数,本发明使用ReLU函数,Ll为第l层特征映射的数量,
Figure BDA0002089012630000063
为当前使用的卷积核,
Figure BDA0002089012630000064
为第l层的第f个特征映射,
Figure BDA0002089012630000065
为偏差项。
池化层:使用平均池化层对前一层的输入进行映射:
Figure BDA0002089012630000066
其中,
Figure BDA0002089012630000067
表示第l层经过平均池化层之后的特征映射,
Figure BDA0002089012630000068
为位置i,j,h的相邻区域。
反卷积层:以δ作为输入,对其进行卷积的逆运算:
Figure BDA0002089012630000071
其中,
Figure BDA0002089012630000072
为第l层的输入的特征映射,Ll+1为第l+1层特征映射的数量,
Figure BDA0002089012630000073
为当前使用的反卷积核,
Figure BDA0002089012630000074
为第l+1层的第f个特征映射。
在特征图像重构单元中,前半部分是由若干个卷积层和池化层组成的编码器,在编码器中,卷积层被池化层间隔开来,形成多个由连续连接卷的积层组成的特征提取单元,每个特征提取单元块会提取不同深度的图像特征,形成特征图像块。
在特征提取单元中,包含至少由2个卷积核的大小和数量均相同的卷积层组成,每个卷积层输出的特征图进行拼接操作,形成特征图像块,每个特征提取单元中的尺寸均不相同,即形成的特征图像块尺寸不同,如图7所示,池化层将卷积层间隔开来,形成5个特征提取单元,每个特征提取单元中,卷积层输出的特征图通过符号为
Figure BDA0002089012630000075
的拼接操作进行图像拼接,共计形成5个特征图像块,分别表示为第1特征图像块BR1,第2特征图像块BR2,第3特征图像块BR3,第4特征图像块BR4和第5特征图像块BR5
针对兴趣点特征图像POI,经过编码器,得到的5个特征图像块分别表示为
Figure BDA0002089012630000076
针对气象特征图像Meteorology,得到的5个特征图像块分别表示为
Figure BDA0002089012630000077
Figure BDA0002089012630000078
针对交通特征图像Traffic,得到的5个特征图像块分别表示为
Figure BDA0002089012630000079
Figure BDA00020890126300000710
针对企业自测特征图像Pollutant,得到的5个特征图像块分别表示为
Figure BDA00020890126300000711
Figure BDA0002089012630000081
针对空气质量特征图像Air Quality,得到的5个特征图像块分别表示为
Figure BDA0002089012630000082
特征图像重构单元的后半部分是解码器,其结构与编码器结构基本对称,不同的是,编码器中的卷积层换成了反卷积层,主要用于解码成重构特征图像,编码器最终输出的特征图进入到解码器中,经过卷积和反卷积操作,输出重构特征图像。趣点特征图像POI、气象特征图像Meteorology、交通特征图像Traffic、企业自测特征图像Pollutant和空气质量特征图像AirQuality输入至特征图像重构单元后,经过编码和解码后输出重构特征图像
Figure BDA0002089012630000083
和Air
Figure BDA0002089012630000084
特征图像重组单元主要用于对特征图像块按块进行重组,输出重组特征图像块。具体地,如图8所示,抽取每大类型图像特征块中相同序号的特征图像块进行重组,形成重组特征图像块。即将特征图像块
Figure BDA0002089012630000085
特征图像块
Figure BDA0002089012630000086
特征图像块
Figure BDA0002089012630000087
特征图像块
Figure BDA0002089012630000088
以及特征图像块
Figure BDA0002089012630000089
进行重组,形成重组特征图像块MFR1;将特征图像块
Figure BDA00020890126300000810
Figure BDA00020890126300000812
以及
Figure BDA00020890126300000811
进行重组,形成重组特征图像块MFR2;将特征图像块
Figure BDA00020890126300000813
Figure BDA00020890126300000814
以及
Figure BDA00020890126300000815
进行重组,形成重组特征图像块MFR3;将特征图像块
Figure BDA00020890126300000816
Figure BDA00020890126300000817
以及
Figure BDA00020890126300000818
进行重组,形成重组特征图像块MFR4;将特征图像块
Figure BDA00020890126300000819
Figure BDA00020890126300000820
Figure BDA00020890126300000821
以及
Figure BDA00020890126300000822
进行重组,形成重组特征图像块MFR5
特征图像融合单元主要用于对重组特征图像块进行融合估计,输出空气质量指数估计值。主要采用自注意力机制融合重组特征图像块MFR1,MFR2,MFR3,MFR4和MFR5内各特征图像,得到相应的融合表示MFFR1、MFFR2、MFFR3、MFFR4和MFFR5
具体地,针对重组特征图像块,利用自注意力机制来学习重组特征图像块内各特征的权重,如图9所示。具体计算方式如下所示:
Figure BDA0002089012630000091
Figure BDA0002089012630000092
Figure BDA0002089012630000093
其中,Wn
Figure BDA0002089012630000094
为学习的网络参数,分别为自注意力机制的权重和偏差项,n代表第n块重组特征图像块,(n∈[1,2,3,4,5]),
Figure BDA0002089012630000095
表示第n块重组特征图像块内的第t个特征,
Figure BDA0002089012630000096
为t特征的权重。MFFRn为MFRn经过自注意力机制加权后得到的融合表示,称作第n块融合特征图像。每块重组特征图像块通过基于自注意力机制的块内多特征融合得到相应的融合特征图像MFFR1、MFFR2、MFFR3、MFFR4和MFFR5
针对融合特征图像MFFR1、MFFR2、MFFR3、MFFR4和MFFR5,再采用反卷积操作按照融合特征图像尺寸由小到大的顺序依次融合估计,获得空气质量指数特征图像Air
Figure BDA0002089012630000097
进而得到各区域的空气质量指数估计值。
具体地,如图10所示,将融合特征图像MFFR5、融合特征图像MFFR4、融合特征图像MFFR3、融合特征图像MFFR2和融合特征图像MFFR1通过反卷积和拼接操作依次融合在一起,估计完整的空气质量指数特征图像Air
Figure BDA0002089012630000098
其中,
Figure BDA0002089012630000099
为拼接(Concatenate)操作,融合特征图像MFFR5经过反卷积后,与融合特征图像MFFR4拼接得到第一拼接结果;再将第一拼接结果经过反卷积与融合特征图像MFFR3拼接得到第二拼接结果;再将第二拼接结果经过反卷积与融合特征图像MFFR2拼接得到第三拼接结果;再将第三拼接结果经过反卷积与融合特征图像MFFR1拼接得到第四拼接结果;第四拼接结果再经过反卷积操作,得到空气质量指数特征图像Air
Figure BDA0002089012630000103
该空气质量指数特征图像Air
Figure BDA0002089012630000104
中的具体数值即为网格单元gij的空气质量指数估计值。
各融合表示的反卷积和拼接具体计算方式如下所示:
Figure BDA0002089012630000101
Concatn=[MFFRn;Deconvn+1] (8)
Figure BDA0002089012630000102
其中,式(8)为融合特征图像MFFR5单独的反卷积计算方式,ζ5为反卷积核,
Figure BDA0002089012630000105
为融合特征图像MFFR5经过反卷积后的第f个特征映射。由于融合特征图像MFFR5是最底部的表示,不需要跟其他表示拼接,直接经过反卷积操作,所以单独由式(8)给出计算过程。其融合特征图像的融合表示需要经过拼接与反卷积两步操作,其计算过程由式(9)和式(10)给出,[·;·]表示拼接操作,Concatn为第n+1块反卷积结果与第n块融合特征图像拼接得到的拼接结果,Deconvn表示对Concatn的反卷积结果,其中n∈[1,2,3,4]。
步骤4,根据特征图像、重构特征图像、空气质量监测站监测的空气质量指数真值以及空气质量指数估计值构建损失函数。
本发明中,构建的损失函数包括空气质量指数估计损失、临近区域空气质量的相似性损失以及重构特征图像整体损失。
针对空气质量指数估计损失,根据空气质量监测站监测的空气质量指数真值Ground Truth与空气质量指数估计值Air
Figure BDA0002089012630000106
计算有监测站区域的空气质量指数估计损失Lossabsoluteerror,具体公式如下:
Figure BDA0002089012630000111
其中,S为城市中有空气质量监测站的区域集合,x为空气质量指数特征图像AirQualityAQI中带有监测站的区域空气质量指数真值构成的向量,
Figure BDA0002089012630000114
为Air
Figure BDA0002089012630000115
中有监测站的区域空气质量指数估计值构成的向量,A为训练样本的集合;
针对临近区域空气质量的相似性损失,即对于没有空气质量监测站的区域,计算特征图像Air
Figure BDA0002089012630000116
中临近区域空气质量的相似性损失Lossneighbor similarity,根据临近区域空气质量相关性约束来计算其损失,具体计算方式如下:
Figure BDA0002089012630000112
Figure BDA0002089012630000113
其中,Bij为临近区域空气质量相关性约束矩阵B第i行,第j列的值,i∈[1,2,3,…,H],j∈[1,2,3,…,W],Bij的值代表网格单元gij与周边临近区域空气质量指数的差异,W和H分别为Air
Figure BDA0002089012630000117
的宽度和高度,d(·,·)为城市中两个区域之间空间上的欧式距离,Air
Figure BDA0002089012630000118
为区域gmn的空气质量指数估计值,Air
Figure BDA0002089012630000119
为区域gij的空气质量指数估计值,l∈[3,5,8]为区域gij的临近区域数量,不考虑超出特征图像Air
Figure BDA00020890126300001110
边界的区域,Bk表示第k个样本的约束矩阵,A为训练样本的集合;
针对重构特征图像整体损失,利用平均绝对误差,计算兴趣点特征图像POI、气象特征图像Meteorology、交通特征图像Traffic、企业自测特征图像Pollutant和空气质量特征图像Air Quality与构特征图像
Figure BDA00020890126300001111
Figure BDA0002089012630000127
和Air
Figure BDA0002089012630000128
的损失,进而得到重构特征图像整体损失Lossre
对于兴趣点特征图像POI,其重构特征图像的损失计算如下:
Figure BDA0002089012630000121
对于气象特征图像Meteorology,其重构特征图像的损失计算如下:
Figure BDA0002089012630000122
对于交通特征图像Traffic,其重构特征图像的损失计算如下:
Figure BDA0002089012630000123
对于企业自测特征图像Pollutant,其重构特征图像的损失计算如下:
Figure BDA0002089012630000124
对于空气质量特征图像Air Quality,其重构特征图像的损失计算如下:
Figure BDA0002089012630000125
其中,W为特征图像的宽度,H为特征图像的高度,A为训练样本的集合,k表示当前训练批次中第k个样本;
重构特征图像整体损失Lossre为:
Lossre=LossPOI+LossTraffic+LossMeteorlogy+LossPollutant+LossAir Quality (18)
综上,总损失函数Ls为:
Ls=Lossabsolute error+Lossneighbor similarity+Lossre (19)
步骤5,将训练数据集按照固定的批量大小m进行分批,批次总数为N。
根据人为经验设定的批量大小m对训练数据集进行分批,批次总数为N。具体计算方式如下:
Figure BDA0002089012630000126
其中,Samples为训练数据集中样本总数。
步骤6,根据批中所有样本的损失L,对整个空气质量指数估计模型中的网络参数进行调整。
计算批中所有样本的损失函数L,具体计算方式如下所示:
Figure BDA0002089012630000131
其中,Ls为每个样本的损失函数,m为每个批中样本的数量。在本发明中,根据损失函数L,对空气质量指数估计模型中的网络参数进行调整。直到训练数据集的所有批次都参与了模型训练,且达到了指定迭代次数,获得参数调优后的空气质量指数估计模型。
步骤7,应用时,将待检测城市对应的五大类特征图像输入至参数调优后的空气质量指数估计模型中,经计算输出全城市空气质量指数的估计值。
即将待检测城市的兴趣点特征图像、气象特征图像、交通特征图像、企业自测特征图像和空气质量特征图像输入至参数调优后的空气质量指数估计模型中,经计算输出全城市空气质量指数的估计值,实现对全城市空气质量指数的估计。
上述全城市空气质量指数估计方法中,以图像表示不同来源的城市大数据,引入按块重组实现多图像融合,利用空间和因素上的交叉形成有效表示,同时引入自注意力机制,捕获区域空气质量与多源城市大数据间的动态相关性。同时利用地理学第一定律对临近区域空气质量的变化进行约束,缓解模型参数过多带来的过拟合问题。经过训练获得的空气质量指数估计模型能够快速较准确地预测全城市空气质量指数。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于深度多源数据融合的全城市空气质量指数估计方法,包括以下步骤:
(1)基于每个时刻的城市多源数据构建兴趣点特征图像、气象特征图像、交通特征图像、企业自测特征图像和空气质量特征图像五大类特征图像作为训练样本,得到训练数据集;
(2)基于深度神经网络构建空气质量指数估计模型,该空气质量指数估计模型包括特征图像重构单元,特征图像重组单元以及特征图像融合单元,其中,特征图像重构单元采用由卷积层、池化层和反卷积层组成的SegNet,用于对输入的特征图像进行重构,输出重构特征图像和特征图像块;特征图像重组单元用于对特征图像块按块进行重组,具体地,抽取每大类型图像特征块中相同序号的特征图像块进行重组,输出重组特征图像块;特征图像融合单元用于对重组特征图像块进行融合估计,融合时,采用自注意力机制融合重组特征图像块,具有计算过程为:
Figure FDA0003033751720000011
Figure FDA0003033751720000012
Figure FDA0003033751720000013
其中,Wn
Figure FDA0003033751720000014
为学习的网络参数,分别为自注意力机制的权重和偏差项,n代表第n块重组特征图像块,n∈[1,2,3,4,5],
Figure FDA0003033751720000015
表示第n块重组特征图像块内的第t个特征,
Figure FDA0003033751720000016
为t特征的权重,MFFRn为MFRn经过自注意力机制加权后得到的融合表示,称作第n块融合特征图像;
针对融合特征图像,再采用反卷积操作按照融合特征图像尺寸由小到大的顺序依次融合估计,获得空气质量指数特征图像;
(3)根据特征图像、重构特征图像、空气质量监测站监测的空气质量指数真值以及空气质量指数估计值构建损失函数,并根据损失函数和训练样本对空气质量指数估计模型进行训练,得到参数调优后的空气质量指数估计模型;
其中,构建的损失函数包括空气质量指数估计损失Lossabsolute error、临近区域空气质量的相似性损失Lossneighbor similarity以及重构特征图像整体损失Lossre,即损失函数Ls为:
Ls=Lossabsolute error+Lossneighbor similarity+Lossre
针对空气质量指数估计损失,根据空气质量监测站监测的空气质量指数真值GroundTruth与空气质量指数估计值
Figure FDA0003033751720000021
计算有监测站区域的空气质量指数估计损失Lossabsolute error,具体公式如下:
Figure FDA0003033751720000022
其中,S为城市中有空气质量监测站的区域集合,x为空气质量指数特征图像AirQualityAQI中带有监测站的区域空气质量指数真值构成的向量,
Figure FDA0003033751720000023
Figure FDA0003033751720000024
中有监测站的区域空气质量指数估计值构成的向量,A为训练样本的集合;针对临近区域空气质量的相似性损失,即对于没有空气质量监测站的区域,计算特征图像
Figure FDA0003033751720000025
中临近区域空气质量的相似性损失Lossneighbor similarity,根据临近区域空气质量相关性约束来计算其损失,具体计算方式如下:
Figure FDA0003033751720000026
Figure FDA0003033751720000027
其中,Bij为临近区域空气质量相关性约束矩阵B第i行,第j列的值,i∈[1,2,3,…,H],j∈[1,2,3,…,W],Bij的值代表网格单元gij与周边临近区域空气质量指数的差异,W和H分别为
Figure FDA0003033751720000031
的宽度和高度,d(·,·)为城市中两个区域之间空间上的欧式距离,
Figure FDA0003033751720000032
为区域gmn的空气质量指数估计值,
Figure FDA0003033751720000033
为区域gij的空气质量指数估计值,l∈[3,5,8]为区域gij的临近区域数量,不考虑超出特征图像
Figure FDA0003033751720000034
边界的区域,Bk表示第k个样本的约束矩阵,A为训练样本的集合;
针对重构特征图像整体损失,利用平均绝对误差,计算兴趣点特征图像POI、气象特征图像Meteorology、交通特征图像Traffic、企业自测特征图像Pollutant和空气质量特征图像Air Quality与重构特征图像
Figure FDA00030337517200000312
Figure FDA0003033751720000035
Figure FDA0003033751720000036
的损失,进而得到重构特征图像整体损失Lossre
对于兴趣点特征图像POI,其重构特征图像的损失计算如下:
Figure FDA0003033751720000037
对于气象特征图像Meteorology,其重构特征图像的损失计算如下:
Figure FDA0003033751720000038
对于交通特征图像Traffic,其重构特征图像的损失计算如下:
Figure FDA0003033751720000039
对于企业自测特征图像Pollutant,其重构特征图像的损失计算如下:
Figure FDA00030337517200000310
对于空气质量特征图像AirQuality,其重构特征图像的损失计算如下:
Figure FDA00030337517200000311
其中,W为特征图像的宽度,H为特征图像的高度,A为训练样本的集合,k表示当前训练批次中第k个样本;
重构特征图像整体损失Lossre为:
Lossre=LossPOI+LossTraffic+LossMeteorlogy+LossPollutant+LossAir Quality
(4)应用时,将待检测城市对应的五大类特征图像输入至参数调优后的空气质量指数估计模型中,经计算输出全城市空气质量指数的估计值。
2.如权利要求1所述的深度多源数据融合的全城市空气质量指数估计方法,其特征在于,
在特征图像重构单元中,前半部分是由若干个卷积层和池化层组成的编码器,在编码器中,卷积层被池化层间隔开来,形成多个由连续连接卷的积层组成的特征提取单元,每个特征提取单元块会提取不同深度的图像特征,形成特征图像块;其中,在特征提取单元中,包含至少由2个卷积核的大小和数量均相同的卷积层组成,每个卷积层输出的特征图进行拼接操作,形成特征图像块;
特征图像重构单元的后半部分是解码器,其结构与编码器结构对称,不同的是,编码器中的卷积层换成了反卷积层,用于解码成重构特征图像,编码器最终输出的特征图进入到解码器中,经过卷积和反卷积操作,输出重构特征图像。
CN201910497190.5A 2019-06-10 2019-06-10 一种基于深度多源数据融合的全城市空气质量指数估计方法 Active CN110321932B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910497190.5A CN110321932B (zh) 2019-06-10 2019-06-10 一种基于深度多源数据融合的全城市空气质量指数估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910497190.5A CN110321932B (zh) 2019-06-10 2019-06-10 一种基于深度多源数据融合的全城市空气质量指数估计方法

Publications (2)

Publication Number Publication Date
CN110321932A CN110321932A (zh) 2019-10-11
CN110321932B true CN110321932B (zh) 2021-06-25

Family

ID=68120710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910497190.5A Active CN110321932B (zh) 2019-06-10 2019-06-10 一种基于深度多源数据融合的全城市空气质量指数估计方法

Country Status (1)

Country Link
CN (1) CN110321932B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827312B (zh) * 2019-11-12 2023-04-28 北京深境智能科技有限公司 一种基于协同视觉注意力神经网络的学习方法
CN111144126A (zh) * 2019-12-24 2020-05-12 北京三快在线科技有限公司 一种语义分析模型的训练方法、语义分析方法及装置
CN111652330B (zh) * 2020-08-05 2020-11-13 深圳市优必选科技股份有限公司 图像处理方法、装置、系统、电子设备及可读存储介质
CN112084917B (zh) * 2020-08-31 2024-06-04 腾讯科技(深圳)有限公司 一种活体检测方法及装置
CN112381299A (zh) * 2020-11-17 2021-02-19 深圳前海微众银行股份有限公司 一种确定空气质量的方法及装置
CN112308093B (zh) * 2020-11-24 2023-05-30 腾讯科技(深圳)有限公司 基于图像识别的空气质量感知方法、模型训练方法及系统
CN116226789B (zh) * 2023-05-08 2023-08-18 锋睿领创(珠海)科技有限公司 基于人工智能的数据同分布判别方法、装置、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295714A (zh) * 2016-08-22 2017-01-04 中国科学院电子学研究所 一种基于深度学习的多源遥感图像融合方法
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统
CN106779054A (zh) * 2016-12-31 2017-05-31 中国科学技术大学 一种基于雾天图像的pm2.5估计方法
CN106845371A (zh) * 2016-12-31 2017-06-13 中国科学技术大学 一种城市路网机动车尾气排放遥感监控系统
CN108133178A (zh) * 2017-12-08 2018-06-08 重庆广睿达科技有限公司 一种基于图像识别的智能环境监控系统与方法
CN108446293A (zh) * 2018-01-22 2018-08-24 中电海康集团有限公司 一种基于城市多源异构数据构建城市画像的方法
CN108537336A (zh) * 2018-03-26 2018-09-14 上海电力学院 一种基于深度神经网络的空气质量预测方法
CN109063908A (zh) * 2018-07-30 2018-12-21 浙江鸿程计算机系统有限公司 一种基于深度多任务学习的城市aqi预测与空间细粒度aqi等级估计方法
CN109214570A (zh) * 2018-09-03 2019-01-15 安徽优思天成智能科技有限公司 一种基于深度时空修正模型的城市区域尾气污染预测方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012136079A1 (en) * 2011-04-07 2012-10-11 The Chinese University Of Hong Kong Method and device for retinal image analysis
CN104297117A (zh) * 2014-10-23 2015-01-21 浙江省环境保护科学设计研究院 基于遥感技术的风景名胜区道路交通污染预警装置及方法
US9613058B2 (en) * 2014-12-17 2017-04-04 Adobe Systems Incorporated Neural network image curation control
CN105181898B (zh) * 2015-09-07 2017-03-22 李岩 基于大密度部署传感器的大气污染监控及管理方法及系统
WO2017076433A1 (en) * 2015-11-03 2017-05-11 Siemens Aktiengesellschaft Intelligent heat, ventilation, and air conditioning system
CN107516168A (zh) * 2017-08-28 2017-12-26 中国测绘科学研究院 一种生态环境质量综合评价方法
CN108537383A (zh) * 2018-04-09 2018-09-14 山东建筑大学 一种基于模型融合的室内空气预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295714A (zh) * 2016-08-22 2017-01-04 中国科学院电子学研究所 一种基于深度学习的多源遥感图像融合方法
CN106650825A (zh) * 2016-12-31 2017-05-10 中国科学技术大学 一种机动车尾气排放数据融合系统
CN106779054A (zh) * 2016-12-31 2017-05-31 中国科学技术大学 一种基于雾天图像的pm2.5估计方法
CN106845371A (zh) * 2016-12-31 2017-06-13 中国科学技术大学 一种城市路网机动车尾气排放遥感监控系统
CN108133178A (zh) * 2017-12-08 2018-06-08 重庆广睿达科技有限公司 一种基于图像识别的智能环境监控系统与方法
CN108446293A (zh) * 2018-01-22 2018-08-24 中电海康集团有限公司 一种基于城市多源异构数据构建城市画像的方法
CN108537336A (zh) * 2018-03-26 2018-09-14 上海电力学院 一种基于深度神经网络的空气质量预测方法
CN109063908A (zh) * 2018-07-30 2018-12-21 浙江鸿程计算机系统有限公司 一种基于深度多任务学习的城市aqi预测与空间细粒度aqi等级估计方法
CN109214570A (zh) * 2018-09-03 2019-01-15 安徽优思天成智能科技有限公司 一种基于深度时空修正模型的城市区域尾气污染预测方法

Also Published As

Publication number Publication date
CN110321932A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110321932B (zh) 一种基于深度多源数据融合的全城市空气质量指数估计方法
WO2021073210A1 (zh) 空间自相关的机器学习卫星降水数据降尺度方法、系统
CN108227041B (zh) 基于站点实测数据和模式结果的水平能见度预报方法
CN101976429B (zh) 基于游弋图像的水面鸟瞰图成像方法
CN106780089B (zh) 基于神经网络元胞自动机模型的永久性基本农田划定方法
CN110619282A (zh) 一种无人机正射影像建筑物自动提取方法
CN109635748B (zh) 高分辨率影像中道路特征的提取方法
CN115049936A (zh) 一种面向高分遥感影像的边界增强型语义分割方法
CN112288156B (zh) 基于元学习和图注意力时空神经网络的空气质量预测方法
CN114677507A (zh) 一种基于双向注意力网络的街景图像分割方法及系统
CN112633602B (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
CN113298039B (zh) 一种顾及遥感图像旋转目标的目标检测方法
CN113343858B (zh) 路网地理位置识别方法、装置、电子设备及存储介质
CN110110679A (zh) 基于全卷积网络和条件随机场的地物覆盖率计算方法
CN114841400A (zh) 基于多任务时空图卷积的空气质量预测方法
CN115661655B (zh) 高光谱和高分影像深度特征融合的西南山区耕地提取方法
CN116778146A (zh) 基于多模态数据的道路信息提取方法及装置
CN116913088A (zh) 一种用于高速公路的智能流量预测方法
Zhang et al. SolarGAN: Synthetic annual solar irradiance time series on urban building facades via Deep Generative Networks
Shi et al. An improved framework for assessing the impact of different urban development strategies on land cover and ecological quality changes-A case study from Nanjing Jiangbei New Area, China
CN114462572A (zh) 一种基于时空融合图的空气质量预测方法及装置
CN116452983B (zh) 一种基于无人机航拍影像的国土地貌变化快速发现方法
CN111726535A (zh) 基于车辆感知的智慧城市cim视频大数据画质控制方法
CN107729941B (zh) 一种基于深层地形特征的空气污染物浓度估计方法
CN108053053A (zh) 基于空间自回归模型的电动自行车非通勤出行预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant