CN111723524B - 一种基于日变化约束的pm2.5卫星遥感反演方法 - Google Patents
一种基于日变化约束的pm2.5卫星遥感反演方法 Download PDFInfo
- Publication number
- CN111723524B CN111723524B CN202010580721.XA CN202010580721A CN111723524B CN 111723524 B CN111723524 B CN 111723524B CN 202010580721 A CN202010580721 A CN 202010580721A CN 111723524 B CN111723524 B CN 111723524B
- Authority
- CN
- China
- Prior art keywords
- data
- satellite
- observation
- variation
- day
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 46
- 230000003068 static effect Effects 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000010276 construction Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000010801 machine learning Methods 0.000 claims description 10
- 238000002310 reflectometry Methods 0.000 claims description 8
- 238000007637 random forest analysis Methods 0.000 claims description 7
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000011002 quantification Methods 0.000 claims description 5
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 claims description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 2
- 239000013618 particulate matter Substances 0.000 description 95
- 230000002354 daily effect Effects 0.000 description 39
- 239000003337 fertilizer Substances 0.000 description 12
- 239000000443 aerosol Substances 0.000 description 4
- 241000208818 Helianthus Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D21/00—Measuring or testing not otherwise provided for
- G01D21/02—Measuring two or more variables by means not covered by a single other subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种基于日变化约束的PM2.5卫星遥感反演方法,包括如下步骤:S10数据采集;S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配;S30日变化特征的量化;S40构建PM2.5反演算法;以及S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。本发明的一种基于日变化约束的PM2.5卫星遥感反演方法,采用静止卫星数据可提供白天逐小时的观测值,同时将日变化特征根据季节和时间点的不同进行量化,并与所述PM2.5数据、所述静止卫星数据以及所述气象数据进行融合获得训练数据集,提高了PM2.5反演精度。
Description
技术领域
本发明涉及遥感技术领域,具体涉及一种基于日变化约束的PM2.5卫星遥感反演方法。
背景技术
地面PM2.5浓度是空气质量观测的重要内容,通常有两种观测手段,其一为常规的地面站点观测,该技术手段虽然可以提供较为准确的PM2.5观测值,但是运行成本较高,空间覆盖有限;其二为基于卫星观测的反演方法,由于卫星观测通常具有较大的空间范围和重复连续观测的特点,因此利用卫星观测可提供长时间序列且空间覆盖很高的PM2.5反演值。
基于卫星遥感反演PM2.5技术通常使用气溶胶光学厚度(该变量表征整个大气柱的消光能力,通常与气溶胶浓度呈正比)作为反演模型的输入量,利用该模型计算的PM2.5区域平均值存在较大误差。近期,有研究者使用另外一种卫星观测变量(大气层顶反射率)去反演PM2.5,该模型改善了样本偏差,进而提高了PM2.5区域平均值的反演精度,但是该模型仍存在一定的局限性,在模型构建过程中,并没有考虑PM2.5日变化因子对模型的影响,考虑到不同地区PM2.5通常都具有明显的日变化特征(日变化特征表示的是空气污染浓度在一天内逐小时的规律性变化),因此,将日变化因子纳入到反演模型中可能会提高PM2.5的反演精度。在尝试利用日变化因子反演PM2.5的过程中,有两个技术难点:
(1)通常使用的数据为极轨卫星产品,该类型的卫星只能提供每天某一固定时间的观测,并不能提供日变化特征信息;
(2)如何定量表征日变化特征,在PM2.5反演模型构建中,需要将日变量特征定量化,进而作为模型的输入变量。
发明内容
为了解决上述问题,本发明提供一种基于日变化约束的PM2.5卫星遥感反演方法,采用静止卫星数据可提供白天逐小时的观测值,同时将日变化特征根据季节和时间点的不同进行量化,并与所述PM2.5数据、所述静止卫星数据以及所述气象数据进行融合获得训练数据集,提高了PM2.5反演精度。
为了实现以上目的,本发明采取的一种技术方案是:
一种基于日变化约束的PM2.5卫星遥感反演方法,包括如下步骤:S10数据采集,采集PM2.5数据、静止卫星数据以及气象数据,所述静止卫星数据为可见光观测值,所述静止卫星数据以及所述气象数据为栅格数据;S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配,其中,所述时空匹配包括:所述地面观测站点的空间位置与所述静止卫星和所述气象数据对应栅格数据空间匹配,以及所述地面观测站点观测时段与所述静止卫星数据和所述气象数据时间匹配;S30日变化特征的量化,所述日变化特征包括不同季节PM2.5随时间的变化特征以及变异系数;所述不同季节PM2.5随时间的变化特征通过一元二次多项式拟合获得;所述变异系数为每天同一时间点PM2.5波动的幅度,所述变异系数为同一时间点的所有PM2.5观测数据的标准差与平均值之比;S40构建PM2.5反演算法,将所述PM2.5数据、所述静止卫星数据、所述气象数据以及所述日变化特征进行融合,获得训练数据集,使用所述训练集训练机器学习模型,获得所述PM2.5反演算法模型;以及S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。
进一步地,所述PM2.5数据为地面观测站点逐小时PM2.5观测数据以及相应的地面观测站点经纬度信息;所述静止卫星数据为三个不同波段的反射率、四个卫星观测角度以及卫星的云掩膜数据产品逐小时观测数据,其中,三个不同波段分别为0.47、0.64以及2.3微米,四个卫星观测角度分别为卫星方位角、卫星天顶角、太阳方位角、太阳天顶角;所述气象数据包括地表气压、相对湿度、10米风速、2米气温、总柱水量、总柱臭氧、大气边界层高度。
进一步地,所述机器学习模型为随机森林模型、XGBoost模型、梯度提升模型或支持向量机模型。
进一步地,采用十折交叉验证的方法对所述PM2.5反演算法模型的精度进行测试。
本发明的上述技术方案相比现有技术具有以下优点:
本发明的一种基于日变化约束的PM2.5卫星遥感反演方法,采用静止卫星数据可提供白天逐小时的观测值,解决了传统使用极轨卫星只能每天固定时间观测的问题;将日变化特征根据季节和时间点的不同进行量化,并与所述PM2.5数据、所述静止卫星数据以及所述气象数据进行融合获得训练数据,使用所述训练数据对反演模型进行训练进一步提高了PM2.5反演精度。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其有益效果显而易见。
图1所示为本发明一实施例的一种基于日变化约束的PM2.5卫星遥感反演方法的流程图;
图2所示为本发明一实施例的一种基于日变化约束的PM2.5卫星遥感反演方法的流程简图;
图3所示为长三角地区2016年PM2.5年均值分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了一种基于日变化约束的PM2.5卫星遥感反演方法,如图1~2所示,包括如下步骤:S10数据采集,采集PM2.5数据、静止卫星数据以及气象数据,所述静止卫星数据为可见光观测值,所述静止卫星数据以及所述气象数据为栅格数据。S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配,其中,所述时空匹配包括:所述地面观测站点的空间位置与所述静止卫星和所述气象数据对应栅格数据空间匹配,以及所述地面观测站点观测时段与所述静止卫星数据和所述气象数据时间匹配。S30日变化特征的量化,所述日变化特征包括不同季节PM2.5随时间的变化特征以及变异系数;所述不同季节PM2.5随时间的变化特征通过一元二次多项式拟合获得;所述变异系数为每天同一时间点PM2.5波动的幅度,所述变异系数为同一时间点的所有PM2.5观测数据的标准差与平均值之比。S40构建PM2.5反演算法,将所述PM2.5数据、所述静止卫星数据、所述气象数据以及所述日变化特征进行融合,获得训练数据集,使用所述训练集训练机器学习模型,获得所述PM2.5反演算法模型。以及S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。
所述步骤S10所述PM2.5数据为地面观测站点逐小时PM2.5观测数据以及相应的地面观测站点经纬度信息。所述静止卫星数据为三个不同波段的反射率、四个卫星观测角度以及卫星的云掩膜数据产品逐小时观测数据,其中,三个不同波段分别为0.47、0.64以及2.3微米,四个卫星观测角度分别为卫星方位角、卫星天顶角、太阳方位角、太阳天顶角,使用卫星的云掩膜数据产品去挑选晴空像素。由于最终反演算法的输入是卫星和气象数据,考虑到卫星为栅格数据,因此气象数据也选择该类型的数据,气象数据来自欧洲数值预报中心的再分析资料,所述气象数据包括地表气压、相对湿度、10米风速、2米气温、总柱水量、总柱臭氧、大气边界层高度。反演算法中所使用的卫星数据为可见光观测值,因此在晚上是没有有效观测值,所以仅仅利用白天时段的观测值进行反演。
所述步骤S20在反演算法中,因变量为地面PM2.5浓度,自变量为卫星反射率、卫星角度、气象要素等变量。在反演算法构建前,需要将地面PM2.5站点观测资料与卫星数据、气象数据进行时空匹配,即站点空间位置与对应栅格数据空间匹配,站点观测时段与卫星和气象数据进行时间匹配。经过时空匹配后就建立了算法的训练数据集(包括因变量和自变量),通过该训练数据集对算法的参数进行调整。
所述步骤S30日变化特征的量化是本发明中着重解决的难点问题。解决该问题需要解决两个技术难点:首先是如何量化日变化特征。通过文献调研和数据分析,我们发现基于地面观测站的PM2.5浓度在白天存在较为明显的逐小时变化规律,以长三角地区为例,PM2.5浓度在凌晨8:00-10:00期间缓慢上升,其后至傍晚持续下降,而该变化规律在不同季节均成立,因此,我们利用一元二次多项式去拟合这种PM2.5随时间的变化特征,考虑到不同季节的PM2.5的日变化幅度不同,因此我们针对四个不同季节去分别拟合。此外,针对每天某一固定时间,PM2.5也存在一定程度的波动(举例来说,针对上午10点,每天的PM2.5浓度肯定存在变化)。我们采用变异系数去量化这种波动的幅度,即利用地面PM2.5在某一固定时间的所有观测资料计算标准差与平均值之比。综上所述,针对每个PM2.5地面观测站点,我们可以得到四组拟合曲线,分别表示不同季节PM2.5浓度的日变化规律,此外,每个站点另有11个特征参数,该特征参数表示对应时刻的变异系数,因为仅反演白天8:00-18:00,因此有11个参数。
另外一个技术难点是:地面站点的日变化特征可以根据地面观测数据去量化,那针对除地面站点其它区域如何去获取日变化特征呢?为解决这一问题,我们首先在反演建模的时候,不将日变化特征作为模型的自变量,直接利用卫星和气象数据反演整个研究区域的PM2.5浓度,利用该反演得到的PM2.5进而计算每个栅格点的日变化特征,再将该日变化特征融入到最终的反演算法中,进而提高反演精度。在解决该技术难点的时候就需要卫星观测可以提供一天逐小时的重复观测,而常规的极轨卫星产品只能实现同一地区白天观测一次,因此,这里就需要静止卫星的数据产品,比如日本的葵花卫星。在得到上述日变化特征后,具体参与反演算法的过程为:针对某一格点每一时刻,利用对应的日变化拟合曲线,预测该时刻的PM2.5浓度值,将该值纳入反演算法的自变量中,此外,将对应的变异系数也归入算法的自变量中。
所述步骤S40在最终构建的PM2.5反演算法中,因变量为PM2.5浓度,自变量包括23个变量,具体包括时间变量3个(月、日、小时)、位置变量2个(经纬度)、日变化特征变量2个、卫星观测角度变量4个、卫星观测反射率变量3个、NDVI指数、气象变量8个。算法中,PM2.5浓度与其它变量是典型的非线性关系,而机器学习模型是描述非线性关系的有效工具,我们选取了四个典型的机器学习模型,通过对比不同模型的反演精度,进而选取最优的机器算法模型。四个典型机器学习模型分别为:随机森林模型(Random Forest)、XGBoost模型、梯度提升模型(Gradient Boosting Regression)或支持向量机模型(Support VectorRegression)。
在评估算法的反演精度时,我们采用的是10折交叉验证方案,通过交叉验证优化参数可以有效避免算法的过拟合问题。另外,我们采用确定性系数(R2)和均方根误差(RMSE)来定量表征算法的反演精度,R2越大,表示算法反演精度越高,RMSE越大,表示算法反演精度越差。
实施例1
以2016年长三角地区为例,利用卫星和气象数据,结合本申请专利的技术方法反演整个长三角地区逐小时的PM2.5浓度。
S10数据采集
S11.PM2.5数据来自中国环境监测总站(http://www.cnemc.cn),收集了2016年长三角地区26个城市137个台站的数据。所述PM2.5数据包含每个台站的经纬度信息,观测时间,以及对应的PM2.5质量浓度值(单位为μg m-3)。由于我们利用卫星的可见光数据,因此只反演白天的PM2.5,因此,PM2.5数据只采集白天的数据(8:00-18:00)。每个台站的PM2.5数据包含的特征字段包括以下要素:省份城市城市编码站点站点编码经度纬度pm2_5pm2_5_24hpubtime;其中pm2_5为逐小时PM2.5观测值,pm2_5_24h为24小时PM2.5平均值,pubtime为观测时间,并具体到小时。如下表1安徽省合肥市各个台站信息以及表2安徽省合肥市1270A台站2016年1月1日白天的PM2.5观测数据。
表1
省份 | 城市 | 城市编码 | 站点 | 站点编码 | 经度 | 维度 |
安徽省 | 合肥市 | 340100 | 明珠广场 | 1270A | 117.196 | 31.7848 |
安徽省 | 合肥市 | 340100 | 三里街 | 1271A | 117.307 | 31.8766 |
安徽省 | 合肥市 | 340100 | 琥珀山庄 | 1272A | 117.259 | 31.8706 |
安徽省 | 合肥市 | 340100 | 董铺水库 | 1273A | 117.16 | 31.9051 |
安徽省 | 合肥市 | 340100 | 长江中路 | 1274A | 117.25 | 31.8572 |
安徽省 | 合肥市 | 340100 | 庐阳区 | 1275A | 117.266 | 31.9438 |
安徽省 | 合肥市 | 340100 | 瑶海区 | 1276A | 117.336 | 31.8585 |
安徽省 | 合肥市 | 340100 | 包河区 | 1277A | 117.302 | 31.7956 |
安徽省 | 合肥市 | 340100 | 滨湖新区 | 1278A | 117.278 | 31.7386 |
安徽省 | 合肥市 | 340100 | 高新区 | 1279A | 117.124 | 31.8516 |
表2
S12.卫星数据。卫星数据来自日本葵花静止卫星的观测产品,包括反射率(Level1B)和气溶胶产品(Level 2),数据可从该卫星官网下载(ftp://ftp.ptree.jaxa.jp/),数据空间覆盖整个东亚地区,空间分辨率为5公里,时间分辨率为10分钟。具体使用的数据要素为:1)大气层顶的三个波段的反射率(0.47μm、0.64μm以及2.3μm);2)四个观测角度(卫星方位角、卫星天顶角、太阳方位角、太阳天顶角);3)云掩膜产品。其中,数据要素1和要素2来自反射率产品,要素3来自气溶胶产品。
S13.气象数据。气象数据来自欧洲数值预报中心的再分析资料,数据可从该中心的官网下载(https://apps.ecmwf.int/datasets/data/interim-full-daily/levtype=sfc/),具体选取8个气象要素,分别为地表气压(sp_day)、相对湿度(RH_day)、10米风速-u变量(u10_day)、10米风速-v变量(v10_day)、2米气温(t2m_day)、总柱水量(tcw_day)、总柱臭氧(tco3_day)、大气边界层高度(PBLH_day)。这些数据的空间分辨率为0.75°×0.75°,除大气边界层高度外(12小时),其它要素的时间分辨率为6小时。
S20数据预处理。PM2.5数据与卫星数据和气象数据匹配。该步骤将三类数据依据采样时间、空间位置进行匹配和融合,融合后的数据如下表3所示:
表3.
在该步骤中,将所有台站的PM2.5数据(8:00-18:00)与卫星、气象数据进行融合,除站点编码外(station_code),包含时间变量(month、day、hour),台站位置信息,PM2.5,卫星的各个变量和各个气象变量。其中各个气象变量具体对应的名称参见数据采集中对气象数据的描述,卫星各个变量具体含义如下所示:SAA_day:卫星方位角;SAZ_day:卫星天顶角;SOA_day:太阳方位角;SOZ_day:太阳天顶角;abl1_day、abl3_day、alb6_day分别大气层顶的三个波段的反射率(0.47,0.64和2.3μm);ndvi_day为归一化植被指数,计算方法采用公式:(abl4_day-abl6_day)/(abl4_day+abl6_day),其中alb4_day为大气层顶的0.86μm波段的反射率。
S30日变化特征的量化。根据地面PM2.5逐小时观测数据,分季节拟合PM2.5白天随时间的变化,并计算每个小时的变异系数。拟合PM2.5的白天变化时,我们采用一元二次多项式,四个不同季节分别拟合,因此每个台站就有3×4=12个参数(如表4所示),另外,每个台站计算白天不同时刻的变异系数(每个台站共计11个参数,如表5所示)。
表4
以1141A台站春季为例,系数分别为co1_mam、co2_mam、co3_mam,PM2.5随白天逐小时的变化为PM2.5=co1_mam×hour2+co2_mam×hour+co3_mam,其中hour为白天对应的时刻:8-18。
表5
station_code | vc_08 | vc_09 | vc_10 | vc_11 | vc_12 | vc_13 | vc_14 | vc_15 | vc_16 | vc_17 | vc_18 |
1141A | 0.7629 | 0.7634 | 0.7577 | 0.7453 | 0.7444 | 0.7302 | 0.7192 | 0.7182 | 0.7129 | 0.7381 | 0.7511 |
1142A | 0.759 | 0.7537 | 0.7487 | 0.7372 | 0.7072 | 0.6989 | 0.6549 | 0.671 | 0.7019 | 0.72 | 0.7323 |
1143A | 0.7706 | 0.7662 | 0.7538 | 0.7605 | 0.7206 | 0.7325 | 0.7123 | 0.7083 | 0.7212 | 0.7495 | 0.7545 |
1144A | 0.7956 | 0.8008 | 0.8087 | 0.7948 | 0.7708 | 0.7455 | 0.7314 | 0.7281 | 0.7396 | 0.7594 | 0.7773 |
1145A | 0.7947 | 0.8117 | 0.8002 | 0.7663 | 0.7547 | 0.7453 | 0.7338 | 0.7361 | 0.7465 | 0.764 | 0.7728 |
1146A | 0.6569 | 0.6647 | 0.6928 | 0.7138 | 0.7138 | 0.7 | 0.6738 | 0.662 | 0.6642 | 0.6789 | 0.6924 |
1147A | 0.7305 | 0.7291 | 0.7228 | 0.7188 | 0.6966 | 0.6862 | 0.6653 | 0.6615 | 0.658 | 0.6768 | 0.709 |
1148A | 0.8458 | 0.8784 | 0.8677 | 0.8252 | 0.7923 | 0.8055 | 0.7918 | 0.7932 | 0.7997 | 0.7959 | 0.7773 |
1149A | 0.8067 | 0.8085 | 0.8082 | 0.7755 | 0.7669 | 0.7674 | 0.7394 | 0.7438 | 0.7446 | 0.7817 | 0.8021 |
1150A | 0.7528 | 0.7674 | 0.78 | 0.7458 | 0.7182 | 0.7101 | 0.6945 | 0.6934 | 0.6965 | 0.7229 | 0.7391 |
1151A | 0.6616 | 0.6835 | 0.6802 | 0.7069 | 0.7403 | 0.7469 | 0.7264 | 0.7589 | 0.761 | 0.7625 | 0.7797 |
1152A | 0.6654 | 0.6728 | 0.6809 | 0.733 | 0.7432 | 0.7165 | 0.7616 | 0.7424 | 0.7559 | 0.755 | 0.777 |
1153A | 0.7392 | 0.7353 | 0.7685 | 0.7886 | 0.8348 | 0.8076 | 0.7978 | 0.8096 | 0.8161 | 0.8163 | 0.8391 |
1154A | 0.7135 | 0.7056 | 0.7398 | 0.7916 | 0.8203 | 0.8018 | 0.7751 | 0.8004 | 0.8197 | 0.8318 | 0.8392 |
1155A | 0.6298 | 0.6351 | 0.6576 | 0.6927 | 0.6789 | 0.6714 | 0.6747 | 0.6891 | 0.6934 | 0.6905 | 0.707 |
1156A | 0.7187 | 0.7396 | 0.7509 | 0.792 | 0.8052 | 0.8014 | 0.8055 | 0.8218 | 0.8268 | 0.8333 | 0.8575 |
1157A | 0.7355 | 0.7305 | 0.7455 | 0.7863 | 0.8112 | 0.8197 | 0.8153 | 0.841 | 0.8298 | 0.8412 | 0.8378 |
1158A | 0.6689 | 0.6583 | 0.6675 | 0.7052 | 0.6977 | 0.6945 | 0.6831 | 0.684 | 0.6954 | 0.6824 | 0.6907 |
1159A | 0.7729 | 0.7975 | 0.8051 | 0.8329 | 0.8385 | 0.8425 | 0.8622 | 0.8917 | 0.905 | 0.9035 | 0.917 |
以1141A台站8时的变异系数为例,具体对应的变量为vc_08(0.7629)。
S41融合日变化特征、PM2.5地面观测、卫星和气象数据。在上述数据预处理的基础上,在表3中添加日变化特征项,融合后数据如表6所示:
表6
其中,在已知台站编码、月份、小时的情况下,表6中vc(变异系数)可由表5提供,PM25_diu为日变化预测值,根据台站编码和月份信息,查询表4中对应的日变化拟合系数,并根据时刻值,计算日变化预测值。
S42模型构建。a)模型输入。构建模型的数据为表6中融合后的数据,该数据包含样本157898,PM2.5为模型的因变量,其余23个参数为模型的自变量
(不包含台站编码)。b)建模方法。为了验证本方法的普适性,我们选取了四个典型的机器学习方法,分别为随机森林算法(Random Forest)、XGBboost 算法、支持向量机算法(Support Vector Regression)和梯度提升算法(Gradient Boosting Regression)。在模型调参时,采用10折交叉验证的方法,进而有效避免过拟合问题。另外,我们采用确定性系数(R2)和均方根误差(RMSE)来定量表征算法的反演精度,R2越大,表示算法反演精度越高,RMSE越大,表示算法反演精度越差。
S50将建立的PM2.5反演算法模型应用于所有的卫星和气象观测数据集上,获得PM2.5逐格点的反演结果,以随机森林算法为例,PM2.5年均值的空间分布如图3所示。
申请人利用日本葵花静止卫星的观测数据,同时结合气象再分析资料和地面PM2.5观测数据,基于本发明的算法反演了长三角地区2016年全年的PM2.5浓度,同时对比了不考虑日变化约束的算法精度,如下表所示,
表7考虑与不考虑日变化约束的PM2.5反演算法精度对比
表中内容均为交叉验证后的分析结果,从该表可知,在采用本发明的算法后,确定性系数(R2)有较大提升,同时均方根误差(RMSE)均减小,说明本发明的算法提高了PM2.5的反演精度。此外,反演精度的提高在四个不同机器学习模型中均有所体现,说明本发明的算法具有普适性。
以上所述仅为本发明的示例性实施例,并非因此限制本发明专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (4)
1.一种基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,包括如下步骤:
S10数据采集,采集PM2.5数据、静止卫星数据以及气象数据,所述静止卫星数据为可见光观测值,所述静止卫星数据以及所述气象数据为栅格数据;S20数据处理,将所述PM2.5数据与所述静止卫星数据以及所述气象数据进行时空匹配,其中,所述时空匹配包括:地面观测站点的空间位置与所述静止卫星和所述气象数据对应栅格数据空间匹配,以及所述地面观测站点观测时段与所述静止卫星数据和所述气象数据时间匹配;
S30日变化特征的量化,所述日变化特征包括不同季节PM2.5随时间的变化特征以及变异系数;所述不同季节PM2.5随时间的变化特征通过一元二次多项式拟合获得;所述变异系数为每天同一时间点PM2.5波动的幅度,所述变异系数为同一时间点的所有PM2.5观测数据的标准差与平均值之比;
S40构建PM2.5反演算法,将所述PM2.5数据、所述静止卫星数据、所述气象数据以及所述日变化特征进行融合,获得训练数据集,使用训练集训练机器学习模型,获得所述PM2.5反演算法模型;以及
S50将待测气象数据以及待测静止卫星数据输入所述PM2.5反演算法模型获得PM2.5反演结果。
2.根据权利要求1所述的基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,所述PM2.5数据为地面观测站点逐小时PM2.5观测数据以及相应的地面观测站点经纬度信息;所述静止卫星数据为三个不同波段的反射率、四个卫星观测角度以及卫星的云掩膜数据产品逐小时观测数据,其中,三个不同波段分别为0.47、0.64以及2.3微米,四个卫星观测角度分别为卫星方位角、卫星天顶角、太阳方位角、太阳天顶角;所述气象数据包括地表气压、相对湿度、10米风速、2米气温、总柱水量、总柱臭氧、大气边界层高度。
3.根据权利要求2所述的基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,所述机器学习模型为随机森林模型、XGBoost模型、梯度提升模型或支持向量机模型。
4.根据权利要求1所述的基于日变化约束的PM2.5卫星遥感反演方法,其特征在于,采用十折交叉验证的方法对所述PM2.5反演算法模型的精度进行测试。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010580721.XA CN111723524B (zh) | 2020-06-23 | 2020-06-23 | 一种基于日变化约束的pm2.5卫星遥感反演方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010580721.XA CN111723524B (zh) | 2020-06-23 | 2020-06-23 | 一种基于日变化约束的pm2.5卫星遥感反演方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111723524A CN111723524A (zh) | 2020-09-29 |
CN111723524B true CN111723524B (zh) | 2024-01-30 |
Family
ID=72568419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010580721.XA Active CN111723524B (zh) | 2020-06-23 | 2020-06-23 | 一种基于日变化约束的pm2.5卫星遥感反演方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111723524B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117434009A (zh) * | 2020-10-27 | 2024-01-23 | 淮阴师范学院 | 基于梯度提升算法的内陆湖泊水体藻蓝素浓度遥感反演模型和方法 |
CN112380781B (zh) * | 2020-11-30 | 2022-10-18 | 中国人民解放军国防科技大学 | 基于再分析资料和不平衡学习的卫星观测补全方法 |
CN112985607B (zh) * | 2021-01-25 | 2021-09-24 | 中国科学院空天信息创新研究院 | 纠正静止卫星地表上行长波辐射产品热辐射方向性的方法 |
CN113468799A (zh) * | 2021-05-13 | 2021-10-01 | 国家卫星气象中心(国家空间天气监测预警中心) | 一种静止气象卫星观测中获取近地面pm2.5浓度的方法及系统 |
CN113534158B (zh) * | 2021-06-10 | 2024-06-11 | 国家卫星气象中心(国家空间天气监测预警中心) | 基于深度学习的静止轨道气象卫星雷达反射率因子反演方法 |
CN117009818B (zh) * | 2023-04-12 | 2024-01-23 | 中国科学院空天信息创新研究院 | 一种基于多项式改正的大气co2融合方法和系统 |
CN116340433B (zh) * | 2023-05-31 | 2023-07-28 | 中国水利水电第七工程局有限公司 | 施工监测信息存储计算方法、存储介质、设备及系统 |
CN117592005B (zh) * | 2024-01-19 | 2024-04-26 | 中国科学院空天信息创新研究院 | Pm2.5浓度卫星遥感估算方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080067402A (ko) * | 2007-01-16 | 2008-07-21 | 연세대학교 산학협력단 | 단일 가시광 채널을 갖는 정지궤도 인공위성을 이용한에어러솔 광학깊이 산출방법 |
CN103674794A (zh) * | 2013-12-16 | 2014-03-26 | 中国科学院遥感与数字地球研究所 | 遥感监测近地表细颗粒物质量浓度pm2.5的多元回归方法 |
CN204241344U (zh) * | 2014-10-23 | 2015-04-01 | 浙江省环境保护科学设计研究院 | 基于遥感技术的风景名胜区道路交通污染预警装置 |
CN109580003A (zh) * | 2018-12-18 | 2019-04-05 | 成都信息工程大学 | 一种静止气象卫星热红外数据估算近地面大气温度方法 |
CN110595968A (zh) * | 2019-08-02 | 2019-12-20 | 中国科学院遥感与数字地球研究所 | 一种基于静止轨道卫星的pm2.5浓度估算方法 |
KR20200059085A (ko) * | 2018-11-20 | 2020-05-28 | 서울대학교산학협력단 | 해양 표층 표류부이 관측 수온자료와 인공위성 적외영상자료를 활용한 해양 표층 해수면온도 산출 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019173381A1 (en) * | 2018-03-06 | 2019-09-12 | Applied Particle Technology, Inc. | Wireless exposure monitor |
-
2020
- 2020-06-23 CN CN202010580721.XA patent/CN111723524B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080067402A (ko) * | 2007-01-16 | 2008-07-21 | 연세대학교 산학협력단 | 단일 가시광 채널을 갖는 정지궤도 인공위성을 이용한에어러솔 광학깊이 산출방법 |
CN103674794A (zh) * | 2013-12-16 | 2014-03-26 | 中国科学院遥感与数字地球研究所 | 遥感监测近地表细颗粒物质量浓度pm2.5的多元回归方法 |
CN204241344U (zh) * | 2014-10-23 | 2015-04-01 | 浙江省环境保护科学设计研究院 | 基于遥感技术的风景名胜区道路交通污染预警装置 |
KR20200059085A (ko) * | 2018-11-20 | 2020-05-28 | 서울대학교산학협력단 | 해양 표층 표류부이 관측 수온자료와 인공위성 적외영상자료를 활용한 해양 표층 해수면온도 산출 방법 |
CN109580003A (zh) * | 2018-12-18 | 2019-04-05 | 成都信息工程大学 | 一种静止气象卫星热红外数据估算近地面大气温度方法 |
CN110595968A (zh) * | 2019-08-02 | 2019-12-20 | 中国科学院遥感与数字地球研究所 | 一种基于静止轨道卫星的pm2.5浓度估算方法 |
Non-Patent Citations (1)
Title |
---|
冷云催化宏微观物理响应的探测与研究;孙玉稳;银燕;孙霞;刘伟;韩洋;闫旭升;;高原气象(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111723524A (zh) | 2020-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723524B (zh) | 一种基于日变化约束的pm2.5卫星遥感反演方法 | |
Yin et al. | Surface ozone at Nam Co in the inland Tibetan Plateau: variation, synthesis comparison and regional representativeness | |
CN113297528B (zh) | 一种基于多源大数据的no2高分辨率时空分布计算方法 | |
WO2018145229A1 (zh) | 一种近地面气温的大面积精确反演方法 | |
Williamson et al. | Spring and summer monthly MODIS LST is inherently biased compared to air temperature in snow covered sub-Arctic mountains | |
Yang et al. | Biases and improvements in three dynamical downscaling climate simulations over China | |
CN105160192A (zh) | 基于M5-Local的TRMM卫星降雨数据降尺度方法 | |
Heo et al. | Digital elevation model-based convolutional neural network modeling for searching of high solar energy regions | |
Kim et al. | Statistical downscaling for daily precipitation in Korea using combined PRISM, RCM, and quantile mapping: Part 1, methodology and evaluation in historical simulation | |
EP3794386B1 (en) | Determination of location-specific weather information for agronomic decision support | |
Brouziyne et al. | SWAT streamflow modeling for hydrological components’ understanding within an agro-sylvo-pastoral watershed in Morocco | |
Charabi et al. | Production of solar radiation bankable datasets from high-resolution solar irradiance derived with dynamical downscaling Numerical Weather prediction model | |
CN111079835B (zh) | 一种基于深度全连接网络的Himawari-8大气气溶胶反演方法 | |
CN105956691A (zh) | 预测区域不同方位、观测点pm2.5背景浓度计算方法 | |
CN111401644A (zh) | 一种基于神经网络的降水降尺度空间预测方法 | |
CN111723525A (zh) | 一种基于多源数据和神经网络模型的pm2.5反演方法 | |
Khesali et al. | A method in near-surface estimation of air temperature (NEAT) in times following the satellite passing time using MODIS images | |
Effat | Mapping solar energy potential zones, using SRTM and spatial analysis, application in Lake Nasser Region, Egypt | |
Li et al. | Temporal and spatial variations of global solar radiation over the Qinghai–Tibetan Plateau during the past 40 years | |
Maulana et al. | Analysis of water availability based on satellite rainfall in the upper brantas river basin | |
CN117494419A (zh) | 一种多模型耦合的流域水土流失遥感监测方法 | |
Nourani et al. | Implication of remotely sensed data to incorporate land cover effect into a linear reservoir-based rainfall–runoff model | |
Xie et al. | Spatial downscaling of TRMM precipitation using an optimal regression model with NDVI in inner Mongolia, China | |
CN115372287A (zh) | 基于高分五号卫星数据的二氧化硫排放清单构建方法 | |
Li et al. | Improvement of the multi-source weighted-ensemble precipitation dataset and application in the arid area of Tianshan Mountains, central Asia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |