CN111723524B - 一种基于日变化约束的pm2.5卫星遥感反演方法 - Google Patents

一种基于日变化约束的pm2.5卫星遥感反演方法 Download PDF

Info

Publication number
CN111723524B
CN111723524B CN202010580721.XA CN202010580721A CN111723524B CN 111723524 B CN111723524 B CN 111723524B CN 202010580721 A CN202010580721 A CN 202010580721A CN 111723524 B CN111723524 B CN 111723524B
Authority
CN
China
Prior art keywords
data
satellite
observation
variation
day
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010580721.XA
Other languages
English (en)
Other versions
CN111723524A (zh
Inventor
白鹤鸣
王理
刘伟
张远鹏
张玲玲
吴媛媛
李俊琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Nantong Research Institute for Advanced Communication Technologies Co Ltd
Original Assignee
Nantong University
Nantong Research Institute for Advanced Communication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University, Nantong Research Institute for Advanced Communication Technologies Co Ltd filed Critical Nantong University
Priority to CN202010580721.XA priority Critical patent/CN111723524B/zh
Publication of CN111723524A publication Critical patent/CN111723524A/zh
Application granted granted Critical
Publication of CN111723524B publication Critical patent/CN111723524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D21/00Measuring or testing not otherwise provided for
    • G01D21/02Measuring two or more variables by means not covered by a single other subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种基于日变化约束的PM2.5卫星遥感反演方法,包括如下步骤:S10数据采集;S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配;S30日变化特征的量化;S40构建PM2.5反演算法;以及S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。本发明的一种基于日变化约束的PM2.5卫星遥感反演方法,采用静止卫星数据可提供白天逐小时的观测值,同时将日变化特征根据季节和时间点的不同进行量化,并与所述PM2.5数据、所述静止卫星数据以及所述气象数据进行融合获得训练数据集,提高了PM2.5反演精度。

Description

一种基于日变化约束的PM2.5卫星遥感反演方法
技术领域
本发明涉及遥感技术领域,具体涉及一种基于日变化约束的PM2.5卫星遥感反演方法。
背景技术
地面PM2.5浓度是空气质量观测的重要内容,通常有两种观测手段,其一为常规的地面站点观测,该技术手段虽然可以提供较为准确的PM2.5观测值,但是运行成本较高,空间覆盖有限;其二为基于卫星观测的反演方法,由于卫星观测通常具有较大的空间范围和重复连续观测的特点,因此利用卫星观测可提供长时间序列且空间覆盖很高的PM2.5反演值。
基于卫星遥感反演PM2.5技术通常使用气溶胶光学厚度(该变量表征整个大气柱的消光能力,通常与气溶胶浓度呈正比)作为反演模型的输入量,利用该模型计算的PM2.5区域平均值存在较大误差。近期,有研究者使用另外一种卫星观测变量(大气层顶反射率)去反演PM2.5,该模型改善了样本偏差,进而提高了PM2.5区域平均值的反演精度,但是该模型仍存在一定的局限性,在模型构建过程中,并没有考虑PM2.5日变化因子对模型的影响,考虑到不同地区PM2.5通常都具有明显的日变化特征(日变化特征表示的是空气污染浓度在一天内逐小时的规律性变化),因此,将日变化因子纳入到反演模型中可能会提高PM2.5的反演精度。在尝试利用日变化因子反演PM2.5的过程中,有两个技术难点:
(1)通常使用的数据为极轨卫星产品,该类型的卫星只能提供每天某一固定时间的观测,并不能提供日变化特征信息;
(2)如何定量表征日变化特征,在PM2.5反演模型构建中,需要将日变量特征定量化,进而作为模型的输入变量。
发明内容
为了解决上述问题,本发明提供一种基于日变化约束的PM2.5卫星遥感反演方法,采用静止卫星数据可提供白天逐小时的观测值,同时将日变化特征根据季节和时间点的不同进行量化,并与所述PM2.5数据、所述静止卫星数据以及所述气象数据进行融合获得训练数据集,提高了PM2.5反演精度。
为了实现以上目的,本发明采取的一种技术方案是:
一种基于日变化约束的PM2.5卫星遥感反演方法,包括如下步骤:S10数据采集,采集PM2.5数据、静止卫星数据以及气象数据,所述静止卫星数据为可见光观测值,所述静止卫星数据以及所述气象数据为栅格数据;S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配,其中,所述时空匹配包括:所述地面观测站点的空间位置与所述静止卫星和所述气象数据对应栅格数据空间匹配,以及所述地面观测站点观测时段与所述静止卫星数据和所述气象数据时间匹配;S30日变化特征的量化,所述日变化特征包括不同季节PM2.5随时间的变化特征以及变异系数;所述不同季节PM2.5随时间的变化特征通过一元二次多项式拟合获得;所述变异系数为每天同一时间点PM2.5波动的幅度,所述变异系数为同一时间点的所有PM2.5观测数据的标准差与平均值之比;S40构建PM2.5反演算法,将所述PM2.5数据、所述静止卫星数据、所述气象数据以及所述日变化特征进行融合,获得训练数据集,使用所述训练集训练机器学习模型,获得所述PM2.5反演算法模型;以及S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。
进一步地,所述PM2.5数据为地面观测站点逐小时PM2.5观测数据以及相应的地面观测站点经纬度信息;所述静止卫星数据为三个不同波段的反射率、四个卫星观测角度以及卫星的云掩膜数据产品逐小时观测数据,其中,三个不同波段分别为0.47、0.64以及2.3微米,四个卫星观测角度分别为卫星方位角、卫星天顶角、太阳方位角、太阳天顶角;所述气象数据包括地表气压、相对湿度、10米风速、2米气温、总柱水量、总柱臭氧、大气边界层高度。
进一步地,所述机器学习模型为随机森林模型、XGBoost模型、梯度提升模型或支持向量机模型。
进一步地,采用十折交叉验证的方法对所述PM2.5反演算法模型的精度进行测试。
本发明的上述技术方案相比现有技术具有以下优点:
本发明的一种基于日变化约束的PM2.5卫星遥感反演方法,采用静止卫星数据可提供白天逐小时的观测值,解决了传统使用极轨卫星只能每天固定时间观测的问题;将日变化特征根据季节和时间点的不同进行量化,并与所述PM2.5数据、所述静止卫星数据以及所述气象数据进行融合获得训练数据,使用所述训练数据对反演模型进行训练进一步提高了PM2.5反演精度。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其有益效果显而易见。
图1所示为本发明一实施例的一种基于日变化约束的PM2.5卫星遥感反演方法的流程图;
图2所示为本发明一实施例的一种基于日变化约束的PM2.5卫星遥感反演方法的流程简图;
图3所示为长三角地区2016年PM2.5年均值分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了一种基于日变化约束的PM2.5卫星遥感反演方法,如图1~2所示,包括如下步骤:S10数据采集,采集PM2.5数据、静止卫星数据以及气象数据,所述静止卫星数据为可见光观测值,所述静止卫星数据以及所述气象数据为栅格数据。S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配,其中,所述时空匹配包括:所述地面观测站点的空间位置与所述静止卫星和所述气象数据对应栅格数据空间匹配,以及所述地面观测站点观测时段与所述静止卫星数据和所述气象数据时间匹配。S30日变化特征的量化,所述日变化特征包括不同季节PM2.5随时间的变化特征以及变异系数;所述不同季节PM2.5随时间的变化特征通过一元二次多项式拟合获得;所述变异系数为每天同一时间点PM2.5波动的幅度,所述变异系数为同一时间点的所有PM2.5观测数据的标准差与平均值之比。S40构建PM2.5反演算法,将所述PM2.5数据、所述静止卫星数据、所述气象数据以及所述日变化特征进行融合,获得训练数据集,使用所述训练集训练机器学习模型,获得所述PM2.5反演算法模型。以及S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。
所述步骤S10所述PM2.5数据为地面观测站点逐小时PM2.5观测数据以及相应的地面观测站点经纬度信息。所述静止卫星数据为三个不同波段的反射率、四个卫星观测角度以及卫星的云掩膜数据产品逐小时观测数据,其中,三个不同波段分别为0.47、0.64以及2.3微米,四个卫星观测角度分别为卫星方位角、卫星天顶角、太阳方位角、太阳天顶角,使用卫星的云掩膜数据产品去挑选晴空像素。由于最终反演算法的输入是卫星和气象数据,考虑到卫星为栅格数据,因此气象数据也选择该类型的数据,气象数据来自欧洲数值预报中心的再分析资料,所述气象数据包括地表气压、相对湿度、10米风速、2米气温、总柱水量、总柱臭氧、大气边界层高度。反演算法中所使用的卫星数据为可见光观测值,因此在晚上是没有有效观测值,所以仅仅利用白天时段的观测值进行反演。
所述步骤S20在反演算法中,因变量为地面PM2.5浓度,自变量为卫星反射率、卫星角度、气象要素等变量。在反演算法构建前,需要将地面PM2.5站点观测资料与卫星数据、气象数据进行时空匹配,即站点空间位置与对应栅格数据空间匹配,站点观测时段与卫星和气象数据进行时间匹配。经过时空匹配后就建立了算法的训练数据集(包括因变量和自变量),通过该训练数据集对算法的参数进行调整。
所述步骤S30日变化特征的量化是本发明中着重解决的难点问题。解决该问题需要解决两个技术难点:首先是如何量化日变化特征。通过文献调研和数据分析,我们发现基于地面观测站的PM2.5浓度在白天存在较为明显的逐小时变化规律,以长三角地区为例,PM2.5浓度在凌晨8:00-10:00期间缓慢上升,其后至傍晚持续下降,而该变化规律在不同季节均成立,因此,我们利用一元二次多项式去拟合这种PM2.5随时间的变化特征,考虑到不同季节的PM2.5的日变化幅度不同,因此我们针对四个不同季节去分别拟合。此外,针对每天某一固定时间,PM2.5也存在一定程度的波动(举例来说,针对上午10点,每天的PM2.5浓度肯定存在变化)。我们采用变异系数去量化这种波动的幅度,即利用地面PM2.5在某一固定时间的所有观测资料计算标准差与平均值之比。综上所述,针对每个PM2.5地面观测站点,我们可以得到四组拟合曲线,分别表示不同季节PM2.5浓度的日变化规律,此外,每个站点另有11个特征参数,该特征参数表示对应时刻的变异系数,因为仅反演白天8:00-18:00,因此有11个参数。
另外一个技术难点是:地面站点的日变化特征可以根据地面观测数据去量化,那针对除地面站点其它区域如何去获取日变化特征呢?为解决这一问题,我们首先在反演建模的时候,不将日变化特征作为模型的自变量,直接利用卫星和气象数据反演整个研究区域的PM2.5浓度,利用该反演得到的PM2.5进而计算每个栅格点的日变化特征,再将该日变化特征融入到最终的反演算法中,进而提高反演精度。在解决该技术难点的时候就需要卫星观测可以提供一天逐小时的重复观测,而常规的极轨卫星产品只能实现同一地区白天观测一次,因此,这里就需要静止卫星的数据产品,比如日本的葵花卫星。在得到上述日变化特征后,具体参与反演算法的过程为:针对某一格点每一时刻,利用对应的日变化拟合曲线,预测该时刻的PM2.5浓度值,将该值纳入反演算法的自变量中,此外,将对应的变异系数也归入算法的自变量中。
所述步骤S40在最终构建的PM2.5反演算法中,因变量为PM2.5浓度,自变量包括23个变量,具体包括时间变量3个(月、日、小时)、位置变量2个(经纬度)、日变化特征变量2个、卫星观测角度变量4个、卫星观测反射率变量3个、NDVI指数、气象变量8个。算法中,PM2.5浓度与其它变量是典型的非线性关系,而机器学习模型是描述非线性关系的有效工具,我们选取了四个典型的机器学习模型,通过对比不同模型的反演精度,进而选取最优的机器算法模型。四个典型机器学习模型分别为:随机森林模型(Random Forest)、XGBoost模型、梯度提升模型(Gradient Boosting Regression)或支持向量机模型(Support VectorRegression)。
在评估算法的反演精度时,我们采用的是10折交叉验证方案,通过交叉验证优化参数可以有效避免算法的过拟合问题。另外,我们采用确定性系数(R2)和均方根误差(RMSE)来定量表征算法的反演精度,R2越大,表示算法反演精度越高,RMSE越大,表示算法反演精度越差。
实施例1
以2016年长三角地区为例,利用卫星和气象数据,结合本申请专利的技术方法反演整个长三角地区逐小时的PM2.5浓度。
S10数据采集
S11.PM2.5数据来自中国环境监测总站(http://www.cnemc.cn),收集了2016年长三角地区26个城市137个台站的数据。所述PM2.5数据包含每个台站的经纬度信息,观测时间,以及对应的PM2.5质量浓度值(单位为μg m-3)。由于我们利用卫星的可见光数据,因此只反演白天的PM2.5,因此,PM2.5数据只采集白天的数据(8:00-18:00)。每个台站的PM2.5数据包含的特征字段包括以下要素:省份城市城市编码站点站点编码经度纬度pm2_5pm2_5_24hpubtime;其中pm2_5为逐小时PM2.5观测值,pm2_5_24h为24小时PM2.5平均值,pubtime为观测时间,并具体到小时。如下表1安徽省合肥市各个台站信息以及表2安徽省合肥市1270A台站2016年1月1日白天的PM2.5观测数据。
表1
省份 城市 城市编码 站点 站点编码 经度 维度
安徽省 合肥市 340100 明珠广场 1270A 117.196 31.7848
安徽省 合肥市 340100 三里街 1271A 117.307 31.8766
安徽省 合肥市 340100 琥珀山庄 1272A 117.259 31.8706
安徽省 合肥市 340100 董铺水库 1273A 117.16 31.9051
安徽省 合肥市 340100 长江中路 1274A 117.25 31.8572
安徽省 合肥市 340100 庐阳区 1275A 117.266 31.9438
安徽省 合肥市 340100 瑶海区 1276A 117.336 31.8585
安徽省 合肥市 340100 包河区 1277A 117.302 31.7956
安徽省 合肥市 340100 滨湖新区 1278A 117.278 31.7386
安徽省 合肥市 340100 高新区 1279A 117.124 31.8516
表2
S12.卫星数据。卫星数据来自日本葵花静止卫星的观测产品,包括反射率(Level1B)和气溶胶产品(Level 2),数据可从该卫星官网下载(ftp://ftp.ptree.jaxa.jp/),数据空间覆盖整个东亚地区,空间分辨率为5公里,时间分辨率为10分钟。具体使用的数据要素为:1)大气层顶的三个波段的反射率(0.47μm、0.64μm以及2.3μm);2)四个观测角度(卫星方位角、卫星天顶角、太阳方位角、太阳天顶角);3)云掩膜产品。其中,数据要素1和要素2来自反射率产品,要素3来自气溶胶产品。
S13.气象数据。气象数据来自欧洲数值预报中心的再分析资料,数据可从该中心的官网下载(https://apps.ecmwf.int/datasets/data/interim-full-daily/levtype=sfc/),具体选取8个气象要素,分别为地表气压(sp_day)、相对湿度(RH_day)、10米风速-u变量(u10_day)、10米风速-v变量(v10_day)、2米气温(t2m_day)、总柱水量(tcw_day)、总柱臭氧(tco3_day)、大气边界层高度(PBLH_day)。这些数据的空间分辨率为0.75°×0.75°,除大气边界层高度外(12小时),其它要素的时间分辨率为6小时。
S20数据预处理。PM2.5数据与卫星数据和气象数据匹配。该步骤将三类数据依据采样时间、空间位置进行匹配和融合,融合后的数据如下表3所示:
表3.
在该步骤中,将所有台站的PM2.5数据(8:00-18:00)与卫星、气象数据进行融合,除站点编码外(station_code),包含时间变量(month、day、hour),台站位置信息,PM2.5,卫星的各个变量和各个气象变量。其中各个气象变量具体对应的名称参见数据采集中对气象数据的描述,卫星各个变量具体含义如下所示:SAA_day:卫星方位角;SAZ_day:卫星天顶角;SOA_day:太阳方位角;SOZ_day:太阳天顶角;abl1_day、abl3_day、alb6_day分别大气层顶的三个波段的反射率(0.47,0.64和2.3μm);ndvi_day为归一化植被指数,计算方法采用公式:(abl4_day-abl6_day)/(abl4_day+abl6_day),其中alb4_day为大气层顶的0.86μm波段的反射率。
S30日变化特征的量化。根据地面PM2.5逐小时观测数据,分季节拟合PM2.5白天随时间的变化,并计算每个小时的变异系数。拟合PM2.5的白天变化时,我们采用一元二次多项式,四个不同季节分别拟合,因此每个台站就有3×4=12个参数(如表4所示),另外,每个台站计算白天不同时刻的变异系数(每个台站共计11个参数,如表5所示)。
表4
以1141A台站春季为例,系数分别为co1_mam、co2_mam、co3_mam,PM2.5随白天逐小时的变化为PM2.5=co1_mam×hour2+co2_mam×hour+co3_mam,其中hour为白天对应的时刻:8-18。
表5
station_code vc_08 vc_09 vc_10 vc_11 vc_12 vc_13 vc_14 vc_15 vc_16 vc_17 vc_18
1141A 0.7629 0.7634 0.7577 0.7453 0.7444 0.7302 0.7192 0.7182 0.7129 0.7381 0.7511
1142A 0.759 0.7537 0.7487 0.7372 0.7072 0.6989 0.6549 0.671 0.7019 0.72 0.7323
1143A 0.7706 0.7662 0.7538 0.7605 0.7206 0.7325 0.7123 0.7083 0.7212 0.7495 0.7545
1144A 0.7956 0.8008 0.8087 0.7948 0.7708 0.7455 0.7314 0.7281 0.7396 0.7594 0.7773
1145A 0.7947 0.8117 0.8002 0.7663 0.7547 0.7453 0.7338 0.7361 0.7465 0.764 0.7728
1146A 0.6569 0.6647 0.6928 0.7138 0.7138 0.7 0.6738 0.662 0.6642 0.6789 0.6924
1147A 0.7305 0.7291 0.7228 0.7188 0.6966 0.6862 0.6653 0.6615 0.658 0.6768 0.709
1148A 0.8458 0.8784 0.8677 0.8252 0.7923 0.8055 0.7918 0.7932 0.7997 0.7959 0.7773
1149A 0.8067 0.8085 0.8082 0.7755 0.7669 0.7674 0.7394 0.7438 0.7446 0.7817 0.8021
1150A 0.7528 0.7674 0.78 0.7458 0.7182 0.7101 0.6945 0.6934 0.6965 0.7229 0.7391
1151A 0.6616 0.6835 0.6802 0.7069 0.7403 0.7469 0.7264 0.7589 0.761 0.7625 0.7797
1152A 0.6654 0.6728 0.6809 0.733 0.7432 0.7165 0.7616 0.7424 0.7559 0.755 0.777
1153A 0.7392 0.7353 0.7685 0.7886 0.8348 0.8076 0.7978 0.8096 0.8161 0.8163 0.8391
1154A 0.7135 0.7056 0.7398 0.7916 0.8203 0.8018 0.7751 0.8004 0.8197 0.8318 0.8392
1155A 0.6298 0.6351 0.6576 0.6927 0.6789 0.6714 0.6747 0.6891 0.6934 0.6905 0.707
1156A 0.7187 0.7396 0.7509 0.792 0.8052 0.8014 0.8055 0.8218 0.8268 0.8333 0.8575
1157A 0.7355 0.7305 0.7455 0.7863 0.8112 0.8197 0.8153 0.841 0.8298 0.8412 0.8378
1158A 0.6689 0.6583 0.6675 0.7052 0.6977 0.6945 0.6831 0.684 0.6954 0.6824 0.6907
1159A 0.7729 0.7975 0.8051 0.8329 0.8385 0.8425 0.8622 0.8917 0.905 0.9035 0.917
以1141A台站8时的变异系数为例,具体对应的变量为vc_08(0.7629)。
S41融合日变化特征、PM2.5地面观测、卫星和气象数据。在上述数据预处理的基础上,在表3中添加日变化特征项,融合后数据如表6所示:
表6
其中,在已知台站编码、月份、小时的情况下,表6中vc(变异系数)可由表5提供,PM25_diu为日变化预测值,根据台站编码和月份信息,查询表4中对应的日变化拟合系数,并根据时刻值,计算日变化预测值。
S42模型构建。a)模型输入。构建模型的数据为表6中融合后的数据,该数据包含样本157898,PM2.5为模型的因变量,其余23个参数为模型的自变量
(不包含台站编码)。b)建模方法。为了验证本方法的普适性,我们选取了四个典型的机器学习方法,分别为随机森林算法(Random Forest)、XGBboost 算法、支持向量机算法(Support Vector Regression)和梯度提升算法(Gradient Boosting Regression)。在模型调参时,采用10折交叉验证的方法,进而有效避免过拟合问题。另外,我们采用确定性系数(R2)和均方根误差(RMSE)来定量表征算法的反演精度,R2越大,表示算法反演精度越高,RMSE越大,表示算法反演精度越差。
S50将建立的PM2.5反演算法模型应用于所有的卫星和气象观测数据集上,获得PM2.5逐格点的反演结果,以随机森林算法为例,PM2.5年均值的空间分布如图3所示。
申请人利用日本葵花静止卫星的观测数据,同时结合气象再分析资料和地面PM2.5观测数据,基于本发明的算法反演了长三角地区2016年全年的PM2.5浓度,同时对比了不考虑日变化约束的算法精度,如下表所示,
表7考虑与不考虑日变化约束的PM2.5反演算法精度对比
表中内容均为交叉验证后的分析结果,从该表可知,在采用本发明的算法后,确定性系数(R2)有较大提升,同时均方根误差(RMSE)均减小,说明本发明的算法提高了PM2.5的反演精度。此外,反演精度的提高在四个不同机器学习模型中均有所体现,说明本发明的算法具有普适性。
以上所述仅为本发明的示例性实施例,并非因此限制本发明专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,包括如下步骤:
S10数据采集,采集PM2.5数据、静止卫星数据以及气象数据,所述静止卫星数据为可见光观测值,所述静止卫星数据以及所述气象数据为栅格数据;S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配,其中,所述时空匹配包括:地面观测站点的空间位置与所述静止卫星和所述气象数据对应栅格数据空间匹配,以及所述地面观测站点观测时段与所述静止卫星数据和所述气象数据时间匹配;
S30日变化特征的量化,所述日变化特征包括不同季节PM2.5随时间的变化特征以及变异系数;所述不同季节PM2.5随时间的变化特征通过一元二次多项式拟合获得;所述变异系数为每天同一时间点PM2.5波动的幅度,所述变异系数为同一时间点的所有PM2.5观测数据的标准差与平均值之比;
S40构建PM2.5反演算法,将所述PM2.5数据、所述静止卫星数据、所述气象数据以及所述日变化特征进行融合,获得训练数据集,使用训练集训练机器学习模型,获得所述PM2.5反演算法模型;以及
S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。
2.根据权利要求1所述的基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,所述PM2.5数据为地面观测站点逐小时PM2.5观测数据以及相应的地面观测站点经纬度信息;所述静止卫星数据为三个不同波段的反射率、四个卫星观测角度以及卫星的云掩膜数据产品逐小时观测数据,其中,三个不同波段分别为0.47、0.64以及2.3微米,四个卫星观测角度分别为卫星方位角、卫星天顶角、太阳方位角、太阳天顶角;所述气象数据包括地表气压、相对湿度、10米风速、2米气温、总柱水量、总柱臭氧、大气边界层高度。
3.根据权利要求2所述的基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,所述机器学习模型为随机森林模型、XGBoost模型、梯度提升模型或支持向量机模型。
4.根据权利要求1所述的基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,采用十折交叉验证的方法对所述PM2.5反演算法模型的精度进行测试。
CN202010580721.XA 2020-06-23 2020-06-23 一种基于日变化约束的pm2.5卫星遥感反演方法 Active CN111723524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010580721.XA CN111723524B (zh) 2020-06-23 2020-06-23 一种基于日变化约束的pm2.5卫星遥感反演方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010580721.XA CN111723524B (zh) 2020-06-23 2020-06-23 一种基于日变化约束的pm2.5卫星遥感反演方法

Publications (2)

Publication Number Publication Date
CN111723524A CN111723524A (zh) 2020-09-29
CN111723524B true CN111723524B (zh) 2024-01-30

Family

ID=72568419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010580721.XA Active CN111723524B (zh) 2020-06-23 2020-06-23 一种基于日变化约束的pm2.5卫星遥感反演方法

Country Status (1)

Country Link
CN (1) CN111723524B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117434009A (zh) * 2020-10-27 2024-01-23 淮阴师范学院 基于梯度提升算法的内陆湖泊水体藻蓝素浓度遥感反演模型和方法
CN112380781B (zh) * 2020-11-30 2022-10-18 中国人民解放军国防科技大学 基于再分析资料和不平衡学习的卫星观测补全方法
CN112985607B (zh) * 2021-01-25 2021-09-24 中国科学院空天信息创新研究院 纠正静止卫星地表上行长波辐射产品热辐射方向性的方法
CN113468799A (zh) * 2021-05-13 2021-10-01 国家卫星气象中心(国家空间天气监测预警中心) 一种静止气象卫星观测中获取近地面pm2.5浓度的方法及系统
CN113534158B (zh) * 2021-06-10 2024-06-11 国家卫星气象中心(国家空间天气监测预警中心) 基于深度学习的静止轨道气象卫星雷达反射率因子反演方法
CN117009818B (zh) * 2023-04-12 2024-01-23 中国科学院空天信息创新研究院 一种基于多项式改正的大气co2融合方法和系统
CN116340433B (zh) * 2023-05-31 2023-07-28 中国水利水电第七工程局有限公司 施工监测信息存储计算方法、存储介质、设备及系统
CN117592005B (zh) * 2024-01-19 2024-04-26 中国科学院空天信息创新研究院 Pm2.5浓度卫星遥感估算方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080067402A (ko) * 2007-01-16 2008-07-21 연세대학교 산학협력단 단일 가시광 채널을 갖는 정지궤도 인공위성을 이용한에어러솔 광학깊이 산출방법
CN103674794A (zh) * 2013-12-16 2014-03-26 中国科学院遥感与数字地球研究所 遥感监测近地表细颗粒物质量浓度pm2.5的多元回归方法
CN204241344U (zh) * 2014-10-23 2015-04-01 浙江省环境保护科学设计研究院 基于遥感技术的风景名胜区道路交通污染预警装置
CN109580003A (zh) * 2018-12-18 2019-04-05 成都信息工程大学 一种静止气象卫星热红外数据估算近地面大气温度方法
CN110595968A (zh) * 2019-08-02 2019-12-20 中国科学院遥感与数字地球研究所 一种基于静止轨道卫星的pm2.5浓度估算方法
KR20200059085A (ko) * 2018-11-20 2020-05-28 서울대학교산학협력단 해양 표층 표류부이 관측 수온자료와 인공위성 적외영상자료를 활용한 해양 표층 해수면온도 산출 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019173381A1 (en) * 2018-03-06 2019-09-12 Applied Particle Technology, Inc. Wireless exposure monitor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080067402A (ko) * 2007-01-16 2008-07-21 연세대학교 산학협력단 단일 가시광 채널을 갖는 정지궤도 인공위성을 이용한에어러솔 광학깊이 산출방법
CN103674794A (zh) * 2013-12-16 2014-03-26 中国科学院遥感与数字地球研究所 遥感监测近地表细颗粒物质量浓度pm2.5的多元回归方法
CN204241344U (zh) * 2014-10-23 2015-04-01 浙江省环境保护科学设计研究院 基于遥感技术的风景名胜区道路交通污染预警装置
KR20200059085A (ko) * 2018-11-20 2020-05-28 서울대학교산학협력단 해양 표층 표류부이 관측 수온자료와 인공위성 적외영상자료를 활용한 해양 표층 해수면온도 산출 방법
CN109580003A (zh) * 2018-12-18 2019-04-05 成都信息工程大学 一种静止气象卫星热红外数据估算近地面大气温度方法
CN110595968A (zh) * 2019-08-02 2019-12-20 中国科学院遥感与数字地球研究所 一种基于静止轨道卫星的pm2.5浓度估算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冷云催化宏微观物理响应的探测与研究;孙玉稳;银燕;孙霞;刘伟;韩洋;闫旭升;;高原气象(第05期);全文 *

Also Published As

Publication number Publication date
CN111723524A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
CN111723524B (zh) 一种基于日变化约束的pm2.5卫星遥感反演方法
Yin et al. Surface ozone at Nam Co in the inland Tibetan Plateau: variation, synthesis comparison and regional representativeness
CN113297528B (zh) 一种基于多源大数据的no2高分辨率时空分布计算方法
WO2018145229A1 (zh) 一种近地面气温的大面积精确反演方法
Williamson et al. Spring and summer monthly MODIS LST is inherently biased compared to air temperature in snow covered sub-Arctic mountains
Yang et al. Biases and improvements in three dynamical downscaling climate simulations over China
CN105160192A (zh) 基于M5-Local的TRMM卫星降雨数据降尺度方法
Heo et al. Digital elevation model-based convolutional neural network modeling for searching of high solar energy regions
Kim et al. Statistical downscaling for daily precipitation in Korea using combined PRISM, RCM, and quantile mapping: Part 1, methodology and evaluation in historical simulation
EP3794386B1 (en) Determination of location-specific weather information for agronomic decision support
Brouziyne et al. SWAT streamflow modeling for hydrological components’ understanding within an agro-sylvo-pastoral watershed in Morocco
Charabi et al. Production of solar radiation bankable datasets from high-resolution solar irradiance derived with dynamical downscaling Numerical Weather prediction model
CN111079835B (zh) 一种基于深度全连接网络的Himawari-8大气气溶胶反演方法
CN105956691A (zh) 预测区域不同方位、观测点pm2.5背景浓度计算方法
CN111401644A (zh) 一种基于神经网络的降水降尺度空间预测方法
CN111723525A (zh) 一种基于多源数据和神经网络模型的pm2.5反演方法
Khesali et al. A method in near-surface estimation of air temperature (NEAT) in times following the satellite passing time using MODIS images
Effat Mapping solar energy potential zones, using SRTM and spatial analysis, application in Lake Nasser Region, Egypt
Li et al. Temporal and spatial variations of global solar radiation over the Qinghai–Tibetan Plateau during the past 40 years
Maulana et al. Analysis of water availability based on satellite rainfall in the upper brantas river basin
CN117494419A (zh) 一种多模型耦合的流域水土流失遥感监测方法
Nourani et al. Implication of remotely sensed data to incorporate land cover effect into a linear reservoir-based rainfall–runoff model
Xie et al. Spatial downscaling of TRMM precipitation using an optimal regression model with NDVI in inner Mongolia, China
CN115372287A (zh) 基于高分五号卫星数据的二氧化硫排放清单构建方法
Li et al. Improvement of the multi-source weighted-ensemble precipitation dataset and application in the arid area of Tianshan Mountains, central Asia

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant