CN108241779B - 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法 - Google Patents

基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法 Download PDF

Info

Publication number
CN108241779B
CN108241779B CN201711479275.8A CN201711479275A CN108241779B CN 108241779 B CN108241779 B CN 108241779B CN 201711479275 A CN201711479275 A CN 201711479275A CN 108241779 B CN108241779 B CN 108241779B
Authority
CN
China
Prior art keywords
concentration
ground
model
feature vector
filter value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711479275.8A
Other languages
English (en)
Other versions
CN108241779A (zh
Inventor
陈玉敏
张静祎
吴钱娇
肖雨薇
杨帆
徐仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201711479275.8A priority Critical patent/CN108241779B/zh
Publication of CN108241779A publication Critical patent/CN108241779A/zh
Application granted granted Critical
Publication of CN108241779B publication Critical patent/CN108241779B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,包括数据获取与模型变量的选择,数据处理与匹配,由研究区国控点位置构建空间邻接矩阵,进行中心化并计算矩阵特征值和特征向量,从向量组中提取合适的特征向量作为PM2.5浓度的空间影响因子;得到PM2.5浓度的特征向量空间滤值回归模型,将提取的特征向量均插值为与AOD具有相同空间分辨率的栅格图像,带入特征向量空间滤值回归模型进行栅格计算,得到研究区内连续的PM2.5浓度空间分布模型。本发明针对地面国控点数量较少且分布不均的问题,选取分辨率较高且连续分布的遥感数据进行地面PM2.5浓度的反演可供大范围内PM2.5时空特征研究使用。

Description

基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法
技术领域
本发明属于空间统计分析服务应用技术领域,特别涉及一种基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法。
背景技术
PM2.5对大气环境质量和人体健康都有着极大的危害。一方面,PM2.5污染会造成腐蚀,植被破坏等环境问题,细颗粒物的散射消光作用使得大气能见度下降。另一方面,由于PM2.5的体积小(直径约为人类头发平均粗细的1/30),它可以通过呼吸深入人体肺部,携带表面的有毒物质一起渗入血液,对人体健康产生不利影响,并且它在大气中漂浮时间长、传播距离远,危害作用强于其他空气污染物(2006,参考背景文献1)。
近几年来我国政府越来越关注PM2.5污染问题,全国地面PM2.5浓度监测站(简称“国控点”)的数量至今已增加到1586个。但是国控点的数量仍远远不够,而且分布稀疏不均,主要集中在城市中心,在农村和郊区则分布较少。为了研究大范围内连续的PM2.5浓度分布情况,有研究者使用GIS领域的空间插值方法,如反距离权重法、普通克里格法和协同克里格法等,由离散的站点数据获得连续的PM2.5面状分布(2016,参考背景文献2),但是插值精度受站点数量和空间分布的限制。遥感影像一般具有较高的空间分辨率、大范围连续分布且容易获取,因此研究者们使用遥感数据反演地面PM2.5浓度(2005,参考背景文献3)。
反演地面PM2.5浓度最主要的遥感数据是气溶胶厚度(AOD),它表征无云大气铅直气柱中气溶胶散射造成的消光程度,在可见光和近红外波段反演的AOD所对应的颗粒物直径在0.1~2um之间,与PM2.5的直径范围接近(2001,参考背景文献4)。Engelcox等(2004,参考背景文献5)使用2002年全美国的PM2.5浓度数据构建其与AOD间的线性回归模型,得到它们间的相关系数为0.4。Wang等(2003,参考背景文献6)使用2002年美国阿拉巴马州杰斐逊县7个站点的PM2.5数据,构建与AOD的线性回归方程,证明了二者之间存在良好的线性关系。Liu等(2010,参考背景文献7)发现使用大气边界层高度(PBLH)对AOD进行垂直订正,使用相对湿度(RH)对AOD进行湿度订正后,AOD与PM2.5的相关性更强。此外,研究表明影响PM2.5浓度的还有气象因子如气温、气压、风速、降水等(2015,参考背景文献8),土地利用状况(2012,参考背景文献9),道路网和人口密度(2016,参考背景文献10)等,建模时具体选择哪些变量要根据研究区情况而定。
多元线性回归模型的结构简单,易于构建,是PM2.5浓度建模中最常用的模型,但它是全局性模型,适用条件是因变量呈独立随机分布,不受空间影响。PM2.5的分布具有空间异质性:不同区域的PM2.5浓度存在差异,并且PM2.5与自变量之间的关系也随着空间的变化而变化(2015,参考背景文献11)。因此,使用全局线性模型进行PM2.5浓度建模,忽略了空间影响因素,模型精度受限。地理加权回归模型(GWR)(2014,参考背景文献12)的回归系数随空间位置的变化而变化,可以消除一部分空间影响,提升模型精度,但其残差仍存在空间自相关性,不符合回归模型的假设,说明对空间影响消除的不彻底。另外还有物理模型(2014,参考背景文献13)、神经网络模型(2013,参考背景文献14)等更复杂的PM2.5建模方法。
现有发明中,也有很多PM2.5浓度估算的模型。例如:贺建峰等(2014,参考背景文献15)提出基于特征向量和最小二乘支持向量机的PM2.5浓度预测方法。它通过计算综合气象指数,并对与PM2.5浓度相关的污染物浓度数据、综合气象指数进行相关性分析,得到包含综合气象指数的特征向量A和去除综合气象指数的特征向量B,最后将二者作为训练样本训练得到LS-SVM模型。陈良富等(2017,参考背景文献16)提出地统计插值与卫星遥感联合反演地面PM2.5的方法。它基于时空克里金插值模型和构建的时空变异函数模型,获取研究区PM2.5的第一浓度值,基于卫星AOD反演模型获取第二浓度值,根据两个浓度值的均方根误差建立权重关系,加权平均得到研究区的PM2.5最终浓度值。王桥等(2016,参考背景文献17)提出基于遥感数据的PM2.5浓度估算方法及系统。它先从地面站点获取PM2.5数据,由卫星遥感数据反演AOD,从全球气象预报系统中获取大气边界层高度HPBL和近地面相对湿度RH,然后根据空间匹配后的PM2.5、AOD、HPBL以及RH建立地理加权回归模型估算PM2.5浓度。刘阳等(2017,参考背景文献18)也提出一种基于卫星遥感的地面PM2.5反演方法,是将AOD、地面PM2.5数据、气象数据以及土地利用数据分别重采样到创建的网格进行数据匹配,构建反映时间变异的线性混合效应模型进行初步PM2.5浓度估算,再根据站点地理坐标和土地利用数据构建反映空间变异的广义加性模型来获取线性混合效应模型的PM2.5残差,将残差与PM2.5初步估值相加得到最终值。这些发明的建模过程和模型结构都较为繁琐,且无法直接在模型上体现空间影响因子。背景文献:
1.Pope C A,Dockery D W.Health effects of fine particulate airpollution:Lines that connect[J].Journal of The Air&Waste ManagementAssociation,2006,56(10):709-742.
2.李杰,翟亮,桑会勇,等.PM2.5浓度插值中不同空间插值方法对比[J].测绘科学,2016,41(4):50-54,101.
3.Liu Y,Sarnat J A,Kilaru V,et al.Estimating Ground-Level PM2.5in theEastern United States Using Satellite Remote Sensing[J].EnvironmentalScience&Technology,2005,39(9):3269-3278.
4.Kahn R,Banerjee P,Mcdonald D.Sensitivity of multiangle imaging tonatural mixtures of aerosols over ocean[J].Journal of Geophysical ResearchAtmospheres,2001,106(D16):18219-18238.
5.Engelcox J A,Holloman C H,Coutant B W,et al.Qualitative andquantitative evaluation of MODIS satellite sensor Data for regional and urbanscale air quality[J].Atmospheric Environment,2004,38(16):2495-2509.
6.Wang J,Christopher S A.Inter-comparison between satellite-derivedaerosol optical thickness and PM2.5mass:implications for air quality studies[J].Geophysical Research Letters,2003,30(21):2095-2099.
7.Wang Z G,Chen L,Tao J,et al.Satellite-based estimation of regionalparticulate matter(PM)in Beijing using vertical-and-RH correcting method[J].Remote Sensing of Environment,2010,114(1):50-63.
8.陈冠益,张雯,侯立安,等.天津蓟县夏季PM2.5污染特征及影响因素[J].天津大学学报:自然科学与工程技术版,2015(2):95-102.
9.Eeftens M,Beelen R,De Hoogh K,et al.Development of Land UseRegression Models for PM2.5,PM2.5Absorbance,PM10and PMcoarse in 20EuropeanStudy Areas-Results of the ESCAPE Project[J].Environmental Science&Technology,2012,46(20):195-205.
10.Fang X,Zou B,Liu X,et al.Satellite-based ground PM2.5estimationusing timely structure adaptive modeling[J].Remote Sensing of Environment,2016,186:152-163.
11.Lin,G.,J.Fu,D.Jiang,J.Wang,Q.Wang,and D.Dong.Spatial variation ofthe relationship between PM 2.5concentrations and meteorological parametersin China[J].Biomed Res Int,2015:684618.
12.Song W,Jia H,Huang J,et al.A satellite-based geographicallyweighted regression model for regional PM2.5estimation over the Pearl RiverDelta region in China[J].Remote Sensing of Environment,2014:1-7.
13.魏薇,傅丽芳.基于改进高斯模型的哈尔滨市PM2.5扩散问题实证分析[J].数学的实践与认识,2014,44(22):205-211.
14.王敏,邹滨,郭宇,等.基于BP人工神经网络的城市PM2.5浓度空间预测[J].环境污染与防治,2013,35(9):63-66.
15.贺建峰,李龙,马磊,邵党国,易三莉,相艳,刘立芳.一种基于特征向量和最小二乘支持向量机的PM25浓度预测方法[P].云南:CN104008278A,2014-08-27.
16.陈良富,李荣,陶明辉,王子峰,陶金花.地统计插值与卫星遥感联合反演地面PM2.5的方法及系统[P].北京:CN106404620A,2017-02-15.
17.王桥,陈辉,厉青,王中挺,张丽娟,毛慧琴,周春艳,马鹏飞,张玉环,陈翠红.一种PM2.5浓度的估算方法及系统[P].北京:CN105678085A,2016-06-15.
18.刘阳,马宗伟,毕军,陈良富,陶金花,李莘莘,王子峰.基于卫星遥感的地面PM2.5反演方法及系统[P].北京:CN106442236A,2017-02-22.
19.Griffith D A,Peresneto P R.Spatial Modeling in Ecology:TheFlexibility of eigenfunction spatial analyses[J].Ecology,2006,87(10):2603-2613.
20.Getis A,Griffith D A.Comparative spatial filtering in regressionanalysis[J].Geographical Analysis,2002,34(2):130-140.
发明内容
为了解决地面PM2.5的分布受空间因素影响,使用传统的回归模型无法完全消除空间影响、准确估算PM2.5浓度的问题,本发明提供了一种基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法。
本发明所采用的技术方案包括一种基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,包括以下步骤,
步骤1,数据获取与模型变量的选择,包括获取PM2.5站点数据并剔除异常值,地面PM2.5浓度反演模型中自变量包含气溶胶厚度AOD;
步骤2,数据处理与匹配,包括统一所有变量的时间尺度,所有自变量的空间分辨率转化为与AOD一致,获取国控点位置上的自变量X,与站点的PM2.5浓度Y相匹配,剔除存在空值的站点;
步骤3,由国控点位置构建空间邻接矩阵W0,步骤如下,
步骤3.1,由国控点构建泰森多边形;
步骤3.2,创建泰森多边形的空间邻接矩阵,得到国控点的邻接矩阵;
步骤4,对邻接矩阵W0进行中心化,结果记为W1,计算矩阵W1的特征值和特征向量,矩阵W1的所有特征向量构成的向量组记为E;
步骤5,从步骤4所得的向量组E中提取合适的特征向量作为PM2.5浓度的空间影响因子;
步骤6,将步骤5提取的所有特征向量添加到自变量中,使用最小二乘法求解回归系数,得到PM2.5浓度的特征向量空间滤值回归模型如下,
Y=β01AOD+Xauxβt+Ekβk
其中,β0表示截距,β1表示AOD的回归系数,Xaux表示步骤1中选出的t个辅助自变量构成的矩阵,Ek是步骤5中提取出的k个特征向量构成的矩阵,βt和βk分别表示Xaux和Ek的回归系数所构成的向量,Ekβk表示PM2.5浓度的空间影响因素,ε是一个n×1的误差向量;
步骤7,将提取的特征向量均插值为与AOD具有相同空间分辨率的栅格图像,带入步骤6所得的特征向量空间滤值回归模型进行栅格计算,得到研究区内连续的PM2.5浓度空间分布模型。
而且,步骤1中,地面PM2.5浓度反演模型中在气溶胶厚度AOD以外,其余辅助自变量要根据研究区的特征,通过计算Pearson指数和共线性诊断来确定。
而且,步骤3中,先由国控点位置构建泰森多边形,再由泰森多边形的邻接关系,依据Queen临接法则,构建二元邻接矩阵,作为国控点的空间邻接矩阵。
而且,对步骤6所得的特征向量空间滤值回归模型从两方面进行模型评价,使用R2、Adj.R2、Pseudo R2、RMSE和MAPE评估模型精度;通过计算残差Moran’sI及显著性检验判断残差是否呈随机分布,得到是否符合线性模型假设的结果,以评估其可靠性。
而且,步骤7中得的PM2.5浓度空间分布模型是可视化的PM2.5空间分布模型,能够用于研究区内PM2.5浓度空间特征分析。
本发明所提供的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,可以有效消除空间异质性和空间自相关性对PM2.5浓度建模的影响,提高浓度估算模型的精度,建模过程和模型结构简单,而且可以直接在模型中表示出空间影响因子。
附图说明
图1为本发明实施例的流程图。
图2为本发明实施例步骤1中选择辅助自变量的子流程图。
图3为本发明实施例步骤2的子流程图。
图4为本发明实施例步骤4的子流程图。
具体实施方式
为了便于本领域普通技术人员理解以及实施本发明,下面结合附图及实施例对本发明作进一步阐述,应当理解,此处所述的实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明要解决的问题是:地面国控点数量不足使得难以获取大范围内连续的PM2.5浓度分布情况,并且地面PM2.5浓度受空间因素的影响,使用传统的线性回归方法,无法准确进行浓度估算。针对这些问题,本发明基于遥感影像数据,使用特征向量空间滤值方法构建地面PM2.5浓度模型,进而制作PM2.5分布图。
即,针对地面国控点数量较少且分布不均的问题,选取分辨率较高且连续分布的遥感数据进行地面PM2.5浓度的反演;针对PM2.5分布受空间影响的问题,采用特征向量空间滤值方法,通过构建国控点空间权重矩阵,计算特征值和特征向量,使用迭代回归从矩阵的特征向量中选择适当的向量,将其作为PM2.5浓度的空间影响因子加入到模型中,消除空间因素的影响,可以有效提高PM2.5浓度估算模型的精度,进而得到高精度的地面PM2.5浓度连续分布图,可供大范围内PM2.5时空特征研究使用。
本发明中基于遥感数据,使用特征向量空间滤值方法进行地面PM2.5浓度建模。该方法通过空间邻接矩阵描述样本点的空间关系,计算邻接矩阵的特征向量,通过提取合适的特征向量,把回归扰动项中具有空间特征的因子“过滤”出来,加到自变量中,这样自变量中同时含有空间影响因子和非空间影响因子,就可以使用经典的线性回归参数估计方法并避免模型误设(2006,参考背景文献19),十分适合估计具有空间非稳定性的因变量(2002,参考背景文献20)。使用特征向量空间滤值方法构建地面PM2.5浓度估算模型,不仅能提高模型精度,而且保留了普通线性回归模型简单的结构,并且能直接在模型中表示出空间影响因子。
参见图1,本发明实施例提供的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,包括以下步骤:
步骤1:数据获取与模型变量的选择。
获取数据并剔除异常值。气溶胶厚度AOD是地面PM2.5浓度反演模型中必需的自变量,其余自变量可依据研究区的特征,从备选的自变量集合中选择。
进一步地,模型自变量除AOD固定外,其余辅助自变量根据研究区的特征,通过计算Pearson指数和共线性诊断来确定。
具体实施时,本步骤可以预先执行。
实施例从中国环境监测中心(CEME,http://106.37.208.233:20035)获取研究区国控点的PM2.5实时监测数据。对PM2.5站点数据进行质量检查,剔除明显异常值。AOD是地面PM2.5浓度反演模型中主要的也是必需的自变量,遥感AOD数据可以从现有气溶胶产品中获取,如MODIS、MISR和VIIRS等,也可以由地表反射率自行反演获得。
除了AOD,可以根据研究区特征,选择其他辅助自变量,进一步提高模型精度,具体实现方法参见图2。
实施例中,初始的辅助自变量备选集合{X1,X2,……,Xr}中是根据现有文献选出的与PM2.5浓度相关的r个变量,如气温、气压、相对湿度、边界层高度、降水量、风速、道路网密度、人口密度、NDVI等。辅助自变量的选择应符合两个原则:一是变量与PM2.5浓度间存在显著相关性,以Pearson相关系数衡量,计算公式如下:
Xi和Yi分别表示国控点i处的自变量值和PM2.5浓度,分别表示相应的平均值,n是样本数,即国控点的数量。逐个计算备选的辅助自变量与PM2.5浓度的Pearson相关系数PC,若PC值不等于0且通过了显著性检验(显著性检验结果p值<0.1),则该变量与PM2.5浓度相关,可以保留下来,否则剔除该变量。假设第一步筛选后,保留下来s个辅助自变量{X1,X2,……,Xs},根据第二个原则继续筛选。原则二是加入所有自变量之后模型不存在严重的共线性问题,这一步筛选需要构建初步的线性回归模型进行共线性诊断,剔除方差膨胀因子(VIF)大于10的变量,得到最终可以加入回归模型的t个辅助自变量{X1,X2,……,Xt}。Pearson相关系数计算与共线性诊断都可在SPSS软件中进行。
步骤2:数据处理与匹配。
根据研究需要统一所有变量的时间尺度,所有自变量的空间分辨率转化为与AOD一致,获取国控点位置上的自变量X,与站点的PM2.5浓度Y相匹配,剔除存在空值的站点。
实施例中,PM2.5原始数据为每小时平均浓度,依次计算日均、月均、季均和年均浓度值,根据具体研究选择合适时间尺度的数据,同时通过均值计算使所有自变量的时间尺度与PM2.5一致。辅助自变量的空间分辨率要转化与AOD一致,若自变量原始空间分辨率高于AOD,则进行重采样;若原始分辨率低于AOD,则使用空间插值。然后要获取自变量X与站点PM2.5浓度Y相匹配,方法是提取国控点所在栅格单元处的自变量值,具体实施时可以使用ArcGIS Desktop中的“Extract multi values to points”工具,然后剔除存在空值的站点。
步骤3:构建研究区内国控点的空间邻接矩阵W0,具体实现方法参见图3。
进一步地,先由国控点位置构建泰森多边形,再由泰森多边形的邻接关系,依据Queen临接法则,构建二元邻接矩阵,作为国控点的空间邻接矩阵。
实施例采用以下子流程:
步骤3.1构建泰森多边形:实施例由国控点构建泰森多边形。
由于国控点是离散分布的点要素,点的邻接关系不易确定,因此选择先构建泰森多边形,将研究区划分为连续不重叠的面要素,每个多边形中包含一个站点,这样多边形的邻接关系就是其所对应的站点间的邻接关系。
步骤3.2创建空间邻接矩阵:创建泰森多边形空的间邻接矩阵即为国控点的邻接矩阵。
然后根据Queen邻接法则,由泰森多边形的邻接关系构建二元邻接矩阵W0,即多边形i和j相邻,则元素W0(i,j)等于1,否则等于0。由于国控点与泰森多边形是一一对应的,因此W0即是国控点的空间邻接矩阵。
步骤4:对邻接矩阵W0进行中心化,结果记为W1,计算矩阵W1的特征值和特征向量,矩阵中心化的公式如下:
其中,I为n维单位矩阵,11T是一个n×n的矩阵,矩阵内所有元素都等于1,n是国控点的数量。再使用数学分解的方法,求解W1的特征值和特征向量,W1的所有特征向量构成的向量组记为E={E1,E2,E3,……,En},该过程可使用Matlab等软件中自带函数Eig()进行计算。
步骤5:提取合适的特征向量作为PM2.5浓度的空间影响因子。
进一步地,使用逐步回归的方法,从步骤4所得的向量组E中提取合适的特征向量作为PM2.5浓度的空间影响因子。
参见图4,具体步骤如下:
步骤5.1:对自变量X、因变量Y进行中心化,结果分别记为Xcent和Ycent,公式如下:
Xcent=(I-P)X,Ycent=(I-P)Y
其中,I为n维单位矩阵;P为一个n*n的矩阵,其所有元素的值都为1/n,n是国控点的数量;然后求解回归残差e和e的莫兰指数Moran’s I,公式如下:
其中W0为步骤3中的空间邻接矩阵。
步骤5.2:对e的Moran’s I进行显著性检验,实施例中,显著性检验的方法具体如下:
a.随机排列残差,结果记为ernd,计算随机排列后的残差的莫兰指数,结果记为Moran’s Irnd
b.步骤b重复进行999次,计算显著性检验结果p值,p=(num+1)/(999+1)。
其中,num为999次随机排列中,Moran’s Irnd大于非随机排列残差Moran’sI的次数。若p值小于阈值(阈值一般选取0.05或0.01),则结果显著,说明回归残差存在空间自相关性,不符合线性模型的假设,执行步骤5.3。否则,结果不显著,执行步骤6。
步骤5.3:循环遍历所有特征向量,每次从E中选择一个特征向量Ei(i=1,2,……,n),加入到自变量X中,即
X=X+Ei
逐个计算回归残差Moran’s I,当所有特征向量遍历一遍之后,所有残差Moran’sI组成向量I={i1,i2,……,in}。选取最小残差Moran’s I所对应的特征向量,将其作为一个新的自变量保留下来,并从原特征向量组E中剔除,然后基于新的自变量X和相应e的Moran’s I返回步骤5.2,进入下一次迭代。
步骤6:将步骤5提取的所有特征向量添加到自变量中,使用最小二乘法求解回归系数,得到PM2.5浓度的特征向量空间滤值回归模型,即PM2.5浓度估算统计模型。
Y=β01AOD+Xauxβt+Ekβk
其中,β0表示截距,β1表示AOD的回归系数,Xaux表示步骤1中选出的t个辅助自变量构成的矩阵,Ek是步骤5中提取出的k个特征向量构成的矩阵,βt和βk分别表示Xaux和Ek的回归系数所构成的向量,式中的Ekβk可以表示PM2.5浓度的空间影响因素,ε是一个n×1的误差向量。
为保证质量,可以进行模型精度评估。
优选地,从两方面对所得模型进行评价:使用R2、Adj.R2、Pseudo R2、RMSE和MAPE评估模型精度;通过计算残差Moran’s I及显著性检验判断残差是否呈随机分布,即是否符合线性模型假设,评估其可靠性。
实施例中,计算所得模型的拟合优度(R2)、调整后拟合优度Adj.R2)、PseudoR2、均方根误差(RMSE)、平均绝对误差百分比(MAPE)以及残差Moran’s I作为评价指标,以验证所提出的基于遥感数据的地面PM2.5浓度特征向量空间滤值模型的精度。
其中yi是站点i的PM2.5浓度观测值,是观测数据的平均值,是模型预测的站点i的PM2.5浓度,n是国控点的个数;
其中p是自变量的个数;R2和Adj.R2的取值范围是0~1,值越大说明模型精度越高。绘制模型估算值与地面实测值的散点图,做二者的线性拟合线并求拟合线的R2,即为Pseudo R2,该值越大说明拟合效果越好。
式中参数含义同上,RMSE和MAPE越小说明模型精度越高
其中ei是由模型得到的站点i的PM2.5浓度残差,是平均值,cij是站点i和j之间的反距离空间权重。I的取值范围是-1~1,值越接近于0,残差空间自相关性越弱,模型越可靠。
如果验证满足要求,即可进入后续步骤进行使用。
步骤7:构建PM2.5浓度空间分布模型:将提取的特征向量均插值为与AOD具有相同空间分辨率的栅格图像,带入步骤6所得的PM2.5浓度估算统计模型进行栅格计算,得到研究区内连续的PM2.5浓度空间分布模型。
步骤6已经得到PM2.5的数学统计模型,即特征向量空间滤值回归模型,通过如下步骤将其可视化:将提取的特征向量均插值为与AOD具有相同空间分辨率的栅格图像,带入步骤6所得的统计模型进行栅格计算,得到研究区内连续的PM2.5浓度空间分布模型,可以用于PM2.5浓度时空演变特征分析、PM2.5污染原因分析等,为空气污染治理提供指导性建议。
本步骤中,使用栅格计算的方法将数学模型转换为可视化的PM2.5空间分布模型,可用于研究区内PM2.5浓度空间特征分析,具有实际应用价值。
具体实施时,以上流程可采用计算机软件技术实现自动运行。
应当理解的是,上述针对本发明中较佳实施例的表述较为详细,但不能因此认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在本发明权利要求保护范围内,可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围以所附权利要求书为准。

Claims (5)

1.一种基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,其特征在于,包括以下步骤,
步骤1,数据获取与模型变量的选择,包括获取PM2.5站点数据并剔除异常值,地面PM2.5浓度反演模型中自变量包含气溶胶厚度AOD;
步骤2,数据处理与匹配,包括统一所有变量的时间尺度,所有自变量的空间分辨率转化为与AOD一致,获取地面PM2.5浓度监测站位置上的自变量X,与站点的PM2.5浓度Y相匹配,剔除存在空值的站点;
步骤3,由地面PM2.5浓度监测站位置构建空间邻接矩阵W0,步骤如下,
步骤3.1,由地面PM2.5浓度监测站构建泰森多边形;
步骤3.2,创建泰森多边形的空间邻接矩阵,得到地面PM2.5浓度监测站的邻接矩阵;
步骤4,对邻接矩阵W0进行中心化,结果记为W1,计算矩阵W1的特征值和特征向量,矩阵W1的所有特征向量构成的向量组记为E;
步骤5,从步骤4所得的向量组E中通过逐步回归提取特征向量作为PM2.5浓度的空间影响因子;
步骤6,将步骤5提取的所有特征向量添加到自变量中,使用最小二乘法求解回归系数,得到PM2.5浓度的特征向量空间滤值回归模型如下,
Y=β01AOD+Xauxβt+Ekβk
其中,β0表示截距,β1表示AOD的回归系数,Xaux表示步骤1中选出的t个辅助自变量构成的矩阵,Ek是步骤5中提取出的k个特征向量构成的矩阵,βt和βk分别表示Xaux和Ek的回归系数所构成的向量,Ekβk表示PM2.5浓度的空间影响因素,ε是一个n×1的误差向量;
步骤7,将提取的特征向量均插值为与AOD具有相同空间分辨率的栅格图像,带入步骤6所得的特征向量空间滤值回归模型进行栅格计算,得到研究区内连续的PM2.5浓度空间分布模型。
2.如权利要求1所述的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,其特征在于:步骤1中,地面PM2.5浓度反演模型中在气溶胶厚度AOD以外,其余辅助自变量要根据研究区的特征,通过计算Pearson指数和共线性诊断来确定。
3.权利要求1所述的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,其特征在于:步骤3中,先由地面PM2.5浓度监测站位置构建泰森多边形,再由泰森多边形的邻接关系,依据Queen临接法则,构建二元邻接矩阵,作为地面PM2.5浓度监测站的空间邻接矩阵。
4.如权利要求1所述的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,其特征在于:对步骤6所得的特征向量空间滤值回归模型从两方面进行模型评价,使用R2、Adj.R2、Pseudo R2、RMSE和MAPE评估模型精度;通过计算残差Moran’s I及显著性检验判断残差是否呈随机分布,得到是否符合线性模型假设的结果,以评估其可靠性。
5.如权利要求1或2或3或4所述的基于遥感数据的地面PM2.5浓度特征向量空间滤值建模方法,其特征在于:步骤7中得的PM2.5浓度空间分布模型是可视化的PM2.5空间分布模型,能够用于研究区内PM2.5浓度空间特征分析。
CN201711479275.8A 2017-12-29 2017-12-29 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法 Active CN108241779B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711479275.8A CN108241779B (zh) 2017-12-29 2017-12-29 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711479275.8A CN108241779B (zh) 2017-12-29 2017-12-29 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法

Publications (2)

Publication Number Publication Date
CN108241779A CN108241779A (zh) 2018-07-03
CN108241779B true CN108241779B (zh) 2019-11-26

Family

ID=62701147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711479275.8A Active CN108241779B (zh) 2017-12-29 2017-12-29 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法

Country Status (1)

Country Link
CN (1) CN108241779B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359890B (zh) * 2018-11-16 2021-10-22 中电科新型智慧城市研究院有限公司 一种降雨天气对城市道路通行影响程度的评估方法
CN109582910A (zh) * 2018-12-11 2019-04-05 国网湖南省电力有限公司 基于空气混合高度的地面pm2.5的计算方法及系统
CN109856021B (zh) * 2018-12-24 2021-10-12 天津珞雍空间信息研究院有限公司 一种pm2.5反演方法及监测区域分割方法
CN109784552B (zh) * 2018-12-29 2022-12-13 武汉大学 一种基于Re-ESF算法的空间变系数PM2.5浓度估算模型的构建方法
CN110110025B (zh) * 2019-04-30 2021-07-20 武汉大学 基于特征向量空间滤值的区域人口密度模拟方法
CN110287455A (zh) * 2019-05-28 2019-09-27 武汉大学 一种结合遥感数据与社会感知数据的pm2.5深度学习反演方法
CN110261272B (zh) * 2019-07-05 2020-08-18 西南交通大学 基于地理探测和pca对pm2.5浓度分布的关键影响因子筛选方法
CN110363442B (zh) * 2019-07-19 2021-09-10 中国农业大学 获取省域耕地自然等指数的方法及装置
CN110989038B (zh) * 2019-11-22 2022-03-04 北京中科锐景科技有限公司 一种近地面颗粒浓度估算方法及系统
CN111104639B (zh) * 2019-12-24 2022-06-10 福州大学 一种点面融合的时序pm2.5空间分布估算方法
CN111256745A (zh) * 2020-02-28 2020-06-09 芜湖职业技术学院 一种便携式空气质量监测仪数据校准方法
CN111738600A (zh) * 2020-06-23 2020-10-02 南通大学 一种基于高精度pm2.5反演结果的城市道路空气质量评价方法
CN111723525B (zh) * 2020-06-23 2023-10-31 南通大学 一种基于多源数据和神经网络模型的pm2.5反演方法
CN111859304B (zh) * 2020-07-28 2023-11-21 行星数据科技(苏州)有限公司 一种基于时空自相关性的卫星气溶胶缺失预测方法及系统
CN112818747A (zh) * 2020-12-31 2021-05-18 上海应用技术大学 一种基于空间大数据的城市特色街区人口密度估算方法和系统方法
US20230168647A1 (en) * 2021-11-29 2023-06-01 Airsset Technologies Inc. Cognitive performance determination based on indoor air quality
CN115859026B (zh) * 2022-11-18 2023-12-05 二十一世纪空间技术应用股份有限公司 一种高分辨率近地面pm2.5浓度遥感反演方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101013449A (zh) * 2006-12-31 2007-08-08 中国海洋大学 利用交叉模型交叉模态的结构模型修正方法
WO2015107164A1 (fr) * 2014-01-17 2015-07-23 Universite De Bretagne Occidentale Procédé de réglage d'un masque d'un filtre planaire, produit programme d'ordinateur, médium et dispositif de réglage correspondants
CN106021872A (zh) * 2016-05-10 2016-10-12 浙江大学 一种基于低分辨率卫星遥感数据的环境变量动态筛选建模降尺度方法
CN106600578A (zh) * 2016-11-22 2017-04-26 武汉大学 基于遥感影像的特征函数空间滤值回归模型并行化方法
CN106920007A (zh) * 2017-02-27 2017-07-04 北京工业大学 基于二阶自组织模糊神经网络的pm2.5智能预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100030382A1 (en) * 2008-07-31 2010-02-04 University Of Medicine And Dentistry Of New Jersey Inhalable particulate environmental robotic sampler

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101013449A (zh) * 2006-12-31 2007-08-08 中国海洋大学 利用交叉模型交叉模态的结构模型修正方法
WO2015107164A1 (fr) * 2014-01-17 2015-07-23 Universite De Bretagne Occidentale Procédé de réglage d'un masque d'un filtre planaire, produit programme d'ordinateur, médium et dispositif de réglage correspondants
CN106021872A (zh) * 2016-05-10 2016-10-12 浙江大学 一种基于低分辨率卫星遥感数据的环境变量动态筛选建模降尺度方法
CN106600578A (zh) * 2016-11-22 2017-04-26 武汉大学 基于遥感影像的特征函数空间滤值回归模型并行化方法
CN106920007A (zh) * 2017-02-27 2017-07-04 北京工业大学 基于二阶自组织模糊神经网络的pm2.5智能预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MPI+OpenMP环境下的特征函数空间滤值并行化方法研究;祁昆仑 等;《武汉大学学报.信息科学版》;20130630;第38卷(第6期);第742-745、750页 *

Also Published As

Publication number Publication date
CN108241779A (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
CN108241779B (zh) 基于遥感数据的地面pm2.5浓度特征向量空间滤值建模方法
CN112905560B (zh) 一种多源时空大数据深度融合的空气污染预测方法
Yin et al. Surface ozone at Nam Co in the inland Tibetan Plateau: variation, synthesis comparison and regional representativeness
CN105160192B (zh) 基于M5‑LocalR的TRMM卫星降雨数据降尺度方法
Chen et al. A data-model fusion approach for upscaling gross ecosystem productivity to the landscape scale based on remote sensing and flux footprint modelling
CN105550423B (zh) 基于Fuzzy-OLS和多环境因子变量的CMORPH卫星降雨产品降尺度的方法
CN110334446A (zh) 基于卫星降水数据的降尺度处理的山洪临界雨量计算方法
CN112699959B (zh) 基于能量泛函模型的多源多尺度降水数据融合方法和装置
Zhao et al. High-precision ZTD model of altitude-related correction
CN114724647B (zh) 一种高时空分辨率co2通量反演系统及方法
CN110110025A (zh) 基于特征向量空间滤值的区域人口密度模拟方法
Yun et al. Mitigating atmospheric effects in InSAR measurements through high-resolution data assimilation and numerical simulations with a weather prediction model
Du et al. Evaluation of MERRA-2 hourly surface solar radiation across China
Yao et al. A novel NIR–red spectral domain evapotranspiration model from the Chinese GF-1 satellite: Application to the Huailai agricultural region of China
CN110334412A (zh) 一种无遥感数据时期湿地景观格局的重建方法
Xiong et al. Using the global hydrodynamic model and GRACE follow-on data to access the 2020 catastrophic flood in Yangtze river basin
Tao et al. Water storage monitoring in the Aral Sea and its Endorheic Basin from multisatellite data and a hydrological model
Li et al. Estimation of Terrestrial water storage changes at small basin scales based on multi-source data
Kann et al. Verification of operational analyses using an extremely high-density surface station network
Nabavi et al. Spatiotemporal variation of radionuclide dispersion from nuclear power plant accidents using FLEXPART mini-ensemble modeling
CN115755103A (zh) 一种抗差自适应的gnss水汽层析方法
Fan et al. A temporal disaggregation approach for TRMM monthly precipitation products using AMSR2 soil moisture data
Abid et al. Assessment of long term MOD16 and LSA SAF actual evapotranspiration using Budyko curve
Wang et al. Spatial downscaling of surface ozone concentration calculation from remotely sensed data based on mutual information
Mao et al. Terrestrial evapotranspiration over China from 1982 to 2020: Consistency of multiple data sets and impact of input data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant