CN117076819B - 融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法 - Google Patents

融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法 Download PDF

Info

Publication number
CN117076819B
CN117076819B CN202311019320.7A CN202311019320A CN117076819B CN 117076819 B CN117076819 B CN 117076819B CN 202311019320 A CN202311019320 A CN 202311019320A CN 117076819 B CN117076819 B CN 117076819B
Authority
CN
China
Prior art keywords
data
satellite
inversion
soil moisture
earth surface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311019320.7A
Other languages
English (en)
Other versions
CN117076819A (zh
Inventor
布金伟
张永凤
左小清
邓荣
刘馨雨
朱大明
李勇发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202311019320.7A priority Critical patent/CN117076819B/zh
Publication of CN117076819A publication Critical patent/CN117076819A/zh
Application granted granted Critical
Publication of CN117076819B publication Critical patent/CN117076819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开融合星载GNSS‑R和多源RS数据协同反演地表土壤水分和植被含水量的方法,分别提出基于梯度提升决策树和极端梯度提升算法融合双基地雷达散射截面、有效散射面积、CYGNSS变量参数以及地表辅助参数构建全球高时空分辨率地表土壤水分和植被含水量反演的集成机器学习树模型。本发明首次实现了星载GNSS‑R数据和多源卫星遥感数据协同反演全球高时空分辨率地表土壤水分和植被含水量,提供了一种新的地表土壤水分和植被含水量获取手段;并实现了一种考虑多种影响因素的星载GNSS‑R反演土壤水分和植被含水量的方法,提高了星载GNSS‑R反演的精度。

Description

融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被 含水量的方法
技术领域
本发明涉及GNSS地表土壤水分和植被含水量反演技术领域,特别是涉及一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法。
背景技术
土壤水分(Soil Moisture,SM)是一个重要的气候变量,控制着降水非线性分配为入渗和径流,从而影响水文和农业过程、干旱发展和河流流量,同时还会对气候系统产生影响,是各大洲蒸散的来源并参与水和能源循环。而植被含水量(Vegetation WaterContent,VWC)作为影响植被活动和生物量的主要因子,在许多关键的生物地球化学过程中起着重要作用。植被含水量表示植被单位的水量,可以清晰的显示植被的干湿状况,而传统的植被水分状态监测方法及耗时又费力,而且专注于微波遥感方面,在大尺度上分布极不均匀。全球导航卫星系统反射测量(Global Navigation Satellite System-Reflectometry,GNSS-R)是一种被动式双基遥感技术,它依赖于接收从地球表面反射的机会信号来推断反射表面本身的属性。在基于星载GNSS-R反演地表土壤水分和植被含水量研究当中,一般首先通过搭载在卫星上的反射信号接收天线观测得到的DDM(Delay DopplerMap)观测值计算土壤表面反射率,然后通过将表面反射率与土壤湿度(或植被含水量)相关联并建立线性模型,从而达到反演土壤湿度(或植被含水量)的目的。但是在目前的实际应用过程中还存在许多的问题和挑战:
(1)现有遥感卫星手段时空分辨率不足,并且目前使用融合星载GNSS-R数据和多源卫星遥感数据协同反演全球高时空分辨率地表土壤水分和植被含水量的方法尚未达到成熟水平;
(2)现有星载GNSS-R技术反演土壤湿度和植被含水量研究中忽略了地表温度、降雨以及干旱指数的影响,导致在一些温度变化较大的地区土壤湿度和植被含水量测量不够准确。
综上,星载GNSS-R技术融合多源卫星遥感数据可有效提高反演的时空分辨率。因此,本发明提出了一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法。
发明内容
为了克服现有CYGNSS卫星星载GNSS-R地表土壤水分和植被含水量反演方法的不足,本发明提供一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,该方法融合BRCS、有效散射面积、CYGNSS变量参数、地表辅助参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)分别构建GBDT和XGBoost两种集成机器学习树模型,有效地提高了星载GNSS-R全球地表土壤水分和植被含水量的反演精度。
为实现上述目的,本发明提供了如下技术方案:
一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,包括以下步骤:
步骤S1,分别获取CYGNSS卫星星载GNSS-R数据以及SMAP、GPM、SMOS、AMSRU和scPDSI数据;
步骤S2,将数据及其产品统一到SMAP 9km×9km格网上并根据预设配置进行数据筛选及质量控制;
步骤S3,使用CYGNSS卫星星载GNSS-R数据计算地表发射率;
步骤S4,训练集(占60%)、验证集(占15%)和测试集(占25%)数据划分;
步骤S5,利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R地表土壤水分反演模型,并将测试数据集输入到训练后的梯度提升决策树(GBDT)模型中以估算地表土壤水分,最后采用SMOS土壤水分和AMSRU土壤水分数据进行验证。
步骤S6,利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R植被含水量反演模型,并将测试数据集输入到训练后的极端梯度提升(XGBoost)模型中以估算植被含水量,最后采用SMAP数据作为参考值验证模型反演性能。
进一步地,采用的CYGNSS卫星星载GNSS-R数据包含以下几个变量参数:1)与发射信号图像相关:双基地雷达散射截面(BRCS)、有效散射面积(eff_scatter)、功率DDM(power_analog);2)与DDM特征值相关:DDM信噪比(ddm_snr)、归一化双基地雷达截面(Normalized Bistatic Radar Cross Section,NBRCS);3)与接收机相关:GNSS-R接收机的接收天线增益(sp_rx_gain)、GPS发射器的等效各向同性辐射功率(gps_eirp);4)与几何相关:GNSS-R接收机到镜面反射点距离(rx_to_sp_range)、GNSS发射机到镜面反射点距离(tx_to_sp_range)、镜面反射点纬度(sp_lat)、镜面反射点经度(sp_lon)、镜面反射点入射角(sp_inc_angle);距离校正增益(range corrected gain,RCG);5)与星载GNSS-R数据质量相关:采用了质量标识(quality_flag)。采用的地表辅助参数包括:1)SMAP升降轨的土壤湿度(soil_moisture)、地表温度(surface_temperature)、植被含水量(vegetation watercontent)、粗糙度系数(roughness_coefficient)、植被光学厚度(vegetation_opacity_dca)以及质量标识(retrieval_qual_flag);2)GPM降雨数据(precipitationCal);3)SMOS地表温度(Skin_Temperature_ECMWF)和土壤湿度(Soil_Moisture);4)AMSRU土壤水分数据(Soil Moisture);5)scPDSI干旱指数(Drought Index)。
进一步地,步骤S2所述的将数据及其产品统一到SMAP 9km×9km格网上并根据预设配置进行数据筛选及质量控制,将数据和产品统一到SMAP 9km×9格网上时,首先将GPM降雨产品、SMOS地表温度产品和土壤湿度产品、AMSRU土壤水分产品、scPDSI干旱指数数据在时间和空间维度上与SMAP 9km×9km格网相统一,然后将CYGNSS数据重新处理并投射到SMAP数据采用的EASE-Grid网格中,生成与目标区域包含格网点数量相同的数据组,其中GNSS-R数据及其其他数据和产品均采用双线性插值算法进行重采样。此外为了确保模型反演结果的可靠性及精度,还需要对不同的数据组进行质量控制筛除质量不合格的数据组,具体的筛除项配置有:1)卫星CYGNSS星载GNSS-R数据根据其元数据提供的变量质量标志quality_flags对数据组进行质量控制筛除精度不高的采样点;2)SMAP数据产品采用其数据集当中的质量标识(retrieval_qual_flag)数据用于质量控制,以确保土壤湿度、地表温度、植被含水量、粗糙度系数达到推荐质量(用0和8表示)。本发明剔除了土壤湿度、地表温度、植被含水量、粗糙度系数小于0.02和-9999的值,保留retrieval_qual_flag等于0(二进制为“0000”)或等于8(二进制为“1000”)的高质量反演值;3)SMOS数据产品使用其数据集当中的质量标识(Quality_Flag)进行质量控制,保留Quality_Flag=0的反演推荐质量数据;4)所有数据产品剔除含有NAN值的数据。
进一步地,步骤S3使用CYGNSS卫星星载GNSS-R数据计算地表发射率按如下公式计算:
式中,PDDM为DDM的模拟散射功率的峰值;PtGt为发射机的等效全向辐射功率;Pt为GNSS卫星右旋圆极化导航信号的发射功率;Gt为发射天线增益;Gr为接收机天线增益;λ为发射信号的载波波长;Rt和Rr分别为发射机到地表发射点的距离及接收机到地表发射点的距离,N为DDM本底噪声。以上数据均来自CYGNSS L1文件的元数据,N和PDDM均可以从DDM当中得到。
进一步地,步骤S4所述的数据划分,将时间和空间匹配后的数据集按照观测时间顺序选择划分为训练集、验证集和测试集,分别占过滤后总数据集的60%、15%和25%。
进一步地,步骤S5利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R地表土壤水分反演模型,并将测试数据集输入到训练后的梯度提升决策树(GBDT)模型中以估算地表土壤水分,最后采用SMOS土壤水分和AMSRU土壤水分数据进行验证。具体的步骤如下:
步骤S5.1,将划分好的训练集作为GBDT模型输入量。
步骤S5.2,输入图像、地表反射率、GNSS-R观测值参数、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)。
步骤S5.3,将SMAP土壤湿度值作为目标值输入GBDT模型中进行训练。GBDT是一种基于boosting集成思想的加法模型,训练时采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART树来拟合之前t-1棵树的预测结果与训练样本真实值的残差。GBDT模型算法原理如下:
1)初始化弱学习器:
2)当m=1,2,3..........,对于每个样本i=1,2,.......n,残差定义如下:
公式的得到的结果是新样本的真实值,并将(xi,rim),i=1,2,…,N的数据作为新树的输入和输出。得到一个新的决策树fm(x)和相应的决策树模型叶节点区域Rjm,j=1,2,...J。j是回归树的叶节点数。叶面积j=1,2,...,J的最佳拟合值的定义如下:
更新强学习器:
3)得到最终学习器GBDT:
本发明使用的GBDT模型参数设置如下表:
表1GBDT模型参数设置
步骤S5.4,当训练完成后,将测试数据集输入到训练后的GBDT模型中,得到反演土壤湿度值,并将结果与SMOS和AMSRU土壤水分数据进行对比。
进一步地,步骤S6所述的利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R植被含水量反演模型,并将测试数据集输入到训练后的极端梯度提升(XGBoost)模型中以估算植被含水量,最后采用SMAP数据作为参考值验证模型反演性能。具体步骤如下:
步骤S6.1,将划分好的训练集作为XGBoost模型输入量。
步骤S6.2,输入图像、地表反射率、GNSS-R观测值参数、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)。
步骤S6.3,将SMAP植被含水量输入XGBoost模型中进行训练。XGBoost算法原理如下:
XGBoost的目标函数由损失函数和正则化项两部分组成,如下的公式所示:
式中,为损失函数,表示/>预测值与真实值yi之间的偏差,/>表示k棵树的复杂度,其中Ω(fk)为正则化项,有助于控制模型的复杂度,避免过拟合;N是样本的数量。为了尽可能地使正则化学习目标最小化,以上公式将对多个回合进行最小化。在每一轮中,ft被增加到公式中,所以第t轮的正则化学习目标如下所示:
正则化学习目标可以如下的泰勒公式展开来近似处理:
式中,为损失函数的一阶导,/>是损失函数的二阶导。第t轮的规则化学习目标如下:
式中,和/>分别表示叶子节点j所包含样本的一阶偏导数累加之和和二阶偏导数累加之和,是一个常数;Ij={i|q(xi)=j},其中q是叶子节点的映射关系;T是树叶子节点数数量。第j个叶节点的最佳权重ωj可以确定为:
并且,目标函数Obj(t)的相应最优值由下式确定:
本发明采用的XGBoost模型参数设置如下表:
表2XGBoost模型参数设置
步骤S6.4,当训练完成后,将测试数据集输入到训练后的XGBoost模型中,得到反演植被含水量值,并将结果与SMAP植被含水量产品进行对比验证。
本发明公开一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,分别提出基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)和极端梯度提升(Extreme Gradient Boosting,XGBoost)算法融合双基地雷达散射截面(Bistatic Radar Cross Section,BRCS)、有效散射面积(Effective Scattering Area)、CYGNSS变量参数以及地表辅助参数构建全球高时空分辨率地表土壤水分和植被含水量反演的集成机器学习树模型,包括以下步骤:分别获取CYGNSS卫星星载GNSS-R、SMAP、GPM、SMOS、AMSRU和scPDSI数据;将数据及其产品统一到SMAP 9km×9km格网上并根据预设配置进行数据筛选及质量控制;使用CYGNSS卫星星载GNSS-R数据计算地表发射率;训练集(占60%)、验证集(占15%)和测试集(占25%)数据划分;利用CYGNSS卫星观测的反射信号图像、观测变量以及地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R地表土壤水分反演模型,并将测试数据集输入到训练后的梯度提升决策树(GBDT)模型中以估算地表土壤水分,最后采用SMOS和AMSRU土壤水分数据进行验证;利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R植被含水量反演模型,并将测试数据集输入到训练后的极端梯度提升(XGBoost)模型中以估算植被含水量,最后采用SMAP数据作为参考值验证模型反演性能。本发明首次实现了星载GNSS-R数据和多源卫星遥感数据协同反演全球高时空分辨率地表土壤水分和植被含水量,提供了一种新的地表土壤水分和植被含水量获取手段;并实现了一种考虑多种影响因素的星载GNSS-R反演土壤水分和植被含水量的方法,提高了星载GNSS-R反演的精度。
采用上述技术方案后,本发明与现有技术相比具有以下有益效果。
本发明采用基于集成机器学习算法的GBDT模型实现全球高时空分辨率地表土壤水分的反演,GBDT模型包括提升树和梯度提升两个部分,本发明在使用GBDT模型时,首先输入训练数据集,然后对数据进行初始化,计算每个数据,将计算后的数据进行拟合学习一颗回归树,得到第m颗树的叶节点区域的一颗由J个叶子结点组成的树。然后计算每个区域的最优输出结果,最后进行更新得到梯度提升树。本发明采用的GBDT模型具有预测阶段的计算速度较快,树与树之间可以进行并行化计算;在分布稠密的数据集上,泛化能力和表达能力较好;采用决策树作为弱分类器使GBDT具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系,并且也不需要对数据进行特殊的处理如归一化,通过训练后得到的最佳GBDT模型对土壤水分的反演精度较好。而XGBoost模型的基本思想与GBDT一致,但是相对于GBDT模型,XGBoost模型是GBDT模型的优化,具有二阶导数使损失函数更精准,正则项避免树过拟合,Block存储可以并行计算等优点,利用XGBoost模型反演植被含水量的反演精度较好。
下面结合附图对本发明的具体实施方式作进一步详细的描述。
附图说明
附图作为本申请的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:
图1为本发明实施例中提供的一种融合星载GNSS-R数据和多源卫星遥感数据协同反演全球高时空分辨率全球地表土壤水分和植被含水量的方法流程图;
图2(a)为本发明实施案例中提供的GBDT模型算法流程图;
图2(b)为本发明实施案例中提供的XGBoost模型算法流程图;
图3为本发明实施案例中提供的五种模型反演地表土壤水分散点密度图;
图4为本发明实施案例中提供的五种模型反演植被含水量散点密度图;
图5为本发明实施案例中提供的不同机器学习模型反演土壤水分与SMAP地表土壤水分对比图;
图6为本发明实施案例中提供的不同机器学习模型反演植被含水量与SMAP植被含水量对比图。;
图7为本发明实施案例中提供的五种模型反演土壤水分与SMAP土壤水分之间的偏差分布直方图;
图8为本发明实施案例中提供的五种模型反演植被含水量与SMAP植被含水量之间的偏差分布直方图。
需要说明的是,这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对实施例中的技术方案进行清楚、完整地描述,以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
本发明提供了一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,为了验证本发明所提方法的优点,基于GBDT算法构建的土壤水分反演模型反演出的土壤水分与极端梯度提升XGBoost算法、轻量的梯度提升机(Light GradientBoosting Machine,LightGBM)、袋装树(Bagging Tree,BT)、随机森林(Random Forest,RF)模型反演的地表土壤水分结果进行比较;同样地,将基于XGBoost算法构建的植被含水量反演模型反演出的植被含水量与GBDT,LightGBM,BT和RF模型反演的植被含水量结果进行比较。
本实施例的实验平台的基本配置如表3所示:
表3实验平台的配置
一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,技术方案实施流程如附图1所示,包括以下步骤:
步骤S1,分别获取CYGNSS卫星星载GNSS-R数据以及SMAP、GPM、SMOS、AMSRU和scPDSI数据;
步骤S2,将数据及其产品统一到SMAP 9km×9km格网上并根据预设配置进行数据筛选及质量控制;
步骤S3,使用CYGNSS卫星星载GNSS-R数据计算地表发射率;
步骤S4,训练集(占60%)、验证集(占15%)和测试集(占25%)数据划分;
步骤S5,利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R地表土壤水分反演模型,并将测试数据集输入到训练后的梯度提升决策树(GBDT)模型中以估算地表土壤水分,最后采用SMOS土壤水分和AMSRU土壤水分数据进行验证。
步骤S6,利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R植被含水量反演模型,并将测试数据集输入到训练后的极端梯度提升(XGBoost)模型中以估算植被含水量,最后采用SMAP数据作为参考值验证模型反演性能。
作为本实施例的一种实施方式,步骤S1中,所述的CYGNSS卫星星载GNSS-R包含如下观测变量参数:
表4本发明所使用的CYGNSS观测变量
其中RCG为距离校正增益,这是接收散射信号质量的有效指标,计算公式如下:
式中,和/>分别是镜面发射点到GNSS发射器之间的距离和镜面反射点到接收器之间的距离;/>是接收机天线增益方向图,RCG的单位为1027×dBi×m-4
本发明使用的地表辅助参数包括以下数据产品:
表5本发明使用的地表辅助参数数据产品
作为本实施例的一种实施方式,作为优选,步骤S2所述的将数据及其产品统一到SMA P 9km×9km格网上并根据预设配置进行数据筛选及质量控制,对数据和产品统一到SMAP 9km×9km格网上时,首先将GPM降雨产品、SMOS地表温度产品和土壤湿度产品、AMS RU土壤水分产品、scPDSI干旱指数数据在时间和空间维度上与SMAP 9km×9km格网相统一,然后将CYGNSS数据重新处理并投射到SMAP数据采用的EASE-Grid网格中,生成与目标区域包含格网点数量相同的数据组,其中GNSS-R数据及其其他数据和产品均采用双线性插值算法进行重采样。此外为了确保模型反演结果的可靠性及精度,还需要对不同的数据组进行质量控制筛除质量不合格的数据组,具体的筛除项配置有:1)CYGNSS卫星星载GNSS-R数据的质量控制采用其元数据里提供的变量质量标志quality_flags对数据组进行质量控制筛除精度不高的采样点。本发明使用的CYGNSS卫星星载GNSS-R数据的质量标志设置如下表6所示。2)SMAP数据产品采用其数据集当中的质量标识(retrieval_qual_flag)数据用于质量控制,以确保土壤湿度、地表温度、植被含水量、粗糙度系数达到推荐质量(用0和8表示)。本发明剔除了土壤湿度、地表温度、植被含水量、粗糙度系数小于0.02和-9999的值,保留了retrieval_qual_flag等于0(二进制为“0000”)或等于8(二进制为“1000”)的高质量反演值;3)SMOS数据产品使用其数据集当中的质量标识(Quality_Flag)进行质量控制,保留Quality_Flag=0的反演推荐质量数据;4)所有数据产品剔除含有NAN值的数据。
表6本发明使用的CYGNSS数据过滤使用的质量标志
作为本实施例的一种实施方式,步骤S3使用CYGNSS卫星星载GNSS-R数据计算地表发射率按如下公式计算:
式中,PDDM为DDM的模拟散射功率的峰值;PtGt为发射机的等效全向辐射功率;Pt为GNSS卫星右旋圆极化导航信号的发射功率;Gt为发射天线增益;Gr为接收机天线增益;λ为发射信号的载波波长;Rt和Rr分别为发射机到地表发射点的距离及接收机到地表发射点的距离,N为DDM本底噪声。以上数据均来自CYGNSS L1文件的元数据,N和PDDM均可以从DDM当中得到。
作为本实施例的一种实施方式,步骤S4所述的数据划分,将时间和空间匹配后的数据集按照观测时间顺序选择划分为训练集、验证集和测试集,分别占过滤后总数据集的60%、15%和25%。
作为优选,步骤S5利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R地表土壤水分反演模型,并将测试数据集输入到训练后的梯度提升决策树(GBDT)模型中以估算地表土壤水分,最后采用SMOS土壤水分和AMSRU土壤水分数据进行验证。具体的步骤如下:
步骤S5.1,将划分好的训练集作为GBDT模型输入量。
步骤S5.2,输入图像、地表反射率、GNSS-R观测值参数、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)。
步骤S5.3,将SMAP土壤湿度值作为目标值输入GBDT模型中进行训练。GBDT算法流程如图2(a)所示。
步骤S5.4,当训练完成后,将测试数据集输入到训练后的GBDT模型中,得到反演土壤湿度值,并将结果与SMOS和AMSRU土壤水分数据进行对比。
作为本实施例的一种实施方式,步骤S6所述的利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)构建星载GNSS-R植被含水量反演模型,并将测试数据集输入到训练后的极端梯度提升(XGBoost)模型中以估算植被含水量,最后采用SMAP数据作为参考值验证模型反演性能。具体步骤如下:
步骤S6.1,将划分好的训练集作为XGBoost模型输入量。
步骤S6.2,输入图像、地表反射率、GNSS-R观测值参数、地表辅助变量参数(如SMAP地表温度、GPM降雨量、scPDSI干旱指数)。
步骤S6.3,将SMAP植被含水量输入XGBoost模型中进行训练。XGBoost算法流程如图2(b)所示。
步骤S6.4,当训练完成后,将测试数据集输入到训练后的XGBoost模型中,得到反演植被含水量值,并将结果与SMAP植被含水量进行对比和验证。
采用均方根误差(RMSE)、Pearson相关系数(CC)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)作为评估模型反演性能的指标。首先,采用训练后的GBDT模型进行全球土壤湿度反演,并将GBDT模型反演的实验结果与XGBoost、LightGBM、BT、RF模型结果进行对比评估;然后,采用训练后的XGBoost模型进行全球植被含水量反演,并将XGBoost模型反演的实验结果与GBDT、LightGBM、BT、RF模型结果进行对比评估。最终结果如表7和表8所示,分别给出了GBDT模型和XGBoost模型反演方法的反演精度统计。从表中可以得出以下结论:
从表7中可以看出:利用GBDT模型方法反演SM的相关系数是最优的,性能均明显优于XGBoost、BT、LightGBM、RF模型方法。GBDT模型在RMSE方面相比其他四个模型精度分别提升了1.38%、14.03%、2.73%、15.93%,在MAE方面相比XGBoost、BT、RAF分别提升了2.24%、9.36%、11.56%,在MAPE方面相比XGBoost、BT、RF分别提升了2.02%、7.48%、11.61%;从表8中可以看出:XGBoost模型方法在反演植被含水量方面性能是最好的,性能均优于其他四种,其次性能较好的是GBDT模型方法。XGBoost模型方法相比GBDT、BT、LightGBM、RF这三种模型,在RMSE方面,反演精度分别提升了3.28%,19.29%,15.36%、20.50%;在MAE方面,分别提升了2.01%,13.85%,8.54%、14.78%;在MAPE方面,精度优于BT和RF,精度分别提升了4.23%,5.29%。
表7不同模型在测试数据集上反演SM的精度
表8不同模型在测试数据集上反演VWC的精度
此外,为了比较本实施案例所提的GBDT模型反演地表土壤水分相比其他反演方法与SMAP地表土壤水分产品在相关性方面的突出改进,如附图3所示可以看出,本实施例所提的GBDT模型反演SM与SMAP SM之间的相关性较好,优于XGBoost、BT、LightGBM、RF这四种模型方法,GBDT模型方法围绕y=x直线分布的点最多,而散乱的点相对较少,说明GBDT反演的地表土壤水分与SMAP SM之间的相关性最好;同样地,如附图4所示,XGBoost模型在反演植被含水量方面的性能是最优的,优于其他四种模型方法。这清楚地表明了本实施案例所提的GBDT模型和XGBoost模型方法分别在反演SM和VWC时性能均优于其他集成机器学习树模型。
如附图5、图6所示,本实施案例所提的GBDT模型和XGBoost模型分别在反演全球地表土壤水分和植被含水量获得了较高的反演精度,与SMAP全球SM和VWC较为一致;从图5可以看出RF、LightGBM、GBDT、BT、XGBoost五种模型方法分别对应的RMSE分别为0.069(cm3/cm3)、0.06(cm3/cm3)、0.058(cm3/cm3)、0.067(cm3/cm3)、0.059(cm3/cm3),其中GBDT模型的反演精度是五种模型当中最好的;从图6中可以看出,RF、LightGBM、GBDT、BT、XGBoost五种模型方法反演全球VWC的RMSE分别为0.754(kg/m2)、0.708(kg/m2)、0.62(kg/m2)、0.743(kg/m2)、0.6(kg/m2),其中XGBoost模型在反演全球植被含水量的性能是最好的,GBDT模型次之,而BT模型的反演性能是最差的。
为了进一步评估本案例GBDT模型和XGBoost模型在反演全球SM和全球VWC的性能,如附图7、图8所示分别给出了以SMAP SM和SMAP VWC数据为参考,GBDT模型和XGBoost模型估算的SM和VWC的全球偏差分布直方图(图中给出了平均偏差(μ)、标准差(σ)、平均绝对误差(MAE)和偏差的85%分位数(Qua),可以看出,GBDT模型反演的SM和XGBoost模型反演的VWC与参考值较为一致,相比其他机器学习模型,本发明所提的GBDT模型和XGBoost模型在反演全球地表土壤水分和植被含水量方面具有显著优势。
以上所述仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专利的技术人员在不脱离本发明技术方案范围内,当可利用上述提示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明方案的范围内。

Claims (4)

1.一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,其特征在于,包括以下步骤:
步骤S1,分别获取CYGNSS卫星星载GNSS-R数据以及SMAP、GPM、SMOS、AMSRU和scPDSI数据;
步骤S2,将数据及其产品统一到SMAP 9km×9km格网上并根据预设配置进行数据筛选及质量控制;
步骤S3,使用CYGNSS卫星星载GNSS-R数据计算地表发射率,计算如下:
式中,PDDM为DDM的模拟散射功率的峰值;PtGt为发射机的等效全向辐射功率;Pt为GNSS卫星右旋圆极化导航信号的发射功率;Gt为发射天线增益;Gr为接收机天线增益;λ为发射信号的载波波长;Rt和Rr分别为发射机到地表发射点的距离及接收机到地表发射点的距离,N为DDM本底噪声;以上数据均来自CYGNSS L1文件的元数据,N和PDDM均可以从DDM当中计算得到;
步骤S4,训练集、验证集和测试集数据划分;
步骤S5,利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数构建星载GNSS-R地表土壤水分反演模型,并将测试数据集输入到训练后的梯度提升决策树GBDT模型中以估算地表土壤水分,最后采用SMOS土壤水分和AMSRU土壤水分数据进行验证,具体的步骤如下:
步骤S5.1,将划分好的训练集作为GBDT模型输入量;
步骤S5.2,输入BRCS图像、有效散射面积(Effective Scattering Area)、地表反射率、GNSS-R观测值参数、地表辅助变量参数,其中,地表辅助变量参数包括SMAP地表温度、GPM降雨量、scPDSI干旱指数;
步骤S5.3,将SMAP土壤湿度值作为目标值输入GBDT模型中进行训练;GBDT模型是一种基于boosting集成思想的加法模型,训练时采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART树来拟合之前t-1棵树的预测结果与训练样本真实值的残差,GBDT算法原理如下:
1)初始化弱学习器:
2)当m=1,2,3...,M,对于每个样本i=1,2,.......n,残差定义如下:
公式(3)的得到的结果是新样本的真实值,并将(xi,rim),i=1,2,...,N的数据作为新树的输入和输出,得到一个新的决策树fm(x)和相应的决策树模型叶节点区域Rjm,j=1,2,...J;j是回归树的叶节点数;叶面积j=1,2,...,J的最佳拟合值的定义如下:
更新强学习器:
3)得到最终学习器GBDT:
步骤S5.4,当训练完成后,将测试数据集输入到训练后的GBDT模型中,得到反演土壤水分值,并将结果与SMOS土壤水分和AMSRU土壤水分数据进行对比;
步骤S6,利用CYGNSS卫星观测的反射信号图像、观测变量、地表辅助变量参数构建星载GNSS-R植被含水量反演模型,并将测试数据集输入到训练后的极端梯度提升XGBoost模型中以估算植被含水量,最后采用SMAP数据作为参考值验证模型反演性能,具体步骤如下:
步骤S6.1,将划分好的训练集作为XGBoost模型输入量;
步骤S6.2,输入BRCS图像、有效散射面积(Effective Scattering Area)、地表反射率、GNSS-R观测值参数、地表辅助变量参数,地表辅助变量参数包括SMAP地表温度、GPM降雨量、scPDSI干旱指数;
步骤S6.3,将SMAP植被含水量作为目标值输入XGBoost模型中进行训练;XGBoost算法原理如下:
XGBoost的目标函数由损失函数和正则化项两部分组成,如下的公式所示:
式中为损失函数,表示/>预测值与真实值yi之间的偏差,/>表示k棵树的复杂度,其中Ω(fk)为正则化项,有助于控制模型的复杂度,避免过拟合;N是样本的数量;为了尽可能地使正则化学习目标最小化,以上公式(7)将对多个回合进行最小化;在每一轮中,ft被增加到公式(7)中,所以第t轮的正则化学习目标如下所示:
正则化学习目标可以如下的泰勒公式展开来近似处理:
式中为损失函数的一阶导,/>是损失函数的二阶导;第t轮的规则化学习目标如下:
式中,和/>分别表示叶子节点j所包含样本的一阶偏导数累加之和和二阶偏导数累加之和,是一个常数;Ij={i|q(xi)=j},其中q是叶子节点的映射关系;T是树叶子节点数数量;第j个叶节点的最佳权重ωj可以确定为:
并且目标函数Obj(t)的相应最优值由下式确定:
步骤S6.4,当训练完成后,将测试数据集输入到训练后的XGBoost模型中,得到反演植被含水量值,并将结果与SMAP植被含水量进行对比验证。
2.根据权利要求1所述的一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,其特征在于,采用的CYGNSS卫星星载GNSS-R数据包含以下几个变量参数:
1)与发射信号图像相关:双基地雷达散射截面BRCS、有效散射面积、功率DDM;
2)与DDM特征值相关:DDM信噪比、归一化双基地雷达截面;
3)与接收机相关:GNSS-R接收机的接收天线增益、GPS发射器的等效各向同性辐射功率;
4)与几何相关:GNSS-R接收机到镜面反射点距离、GNSS发射机到镜面反射点距离、镜面反射点纬度、镜面反射点经度、镜面反射点入射角;距离校正增益;
5)与星载GNSS-R数据质量相关:采用了质量标识;
以及,采用的地表辅助参数包括:1)SMAP升降轨的土壤湿度、地表温度、植被含水量、粗糙度系数、植被光学厚度以及质量标识;2)GPM降雨数据;3)SMOS地表温度和土壤湿度;4)AMSRU土壤水分数据;5)scPDSI干旱指数。
3.根据权利要求1所述的一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,其特征在于:步骤S2所述的将数据及其产品统一到SMAP 9km×9km格网上并根据预设配置进行数据筛选及质量控制,具体步骤为:
将数据和产品统一到SMAP 9km×9格网上时,首先将GPM降雨产品、SMOS地表温度产品和土壤湿度产品、AMSRU土壤水分产品、scPDSI干旱指数数据在时空维度上与SMAP 9km×9km格网分辨率相统一,然后将CYGNSS数据重新处理并投射到SMAP数据采用的EASE-Grid网格中,生成与目标区域包含格网点数量相同的数据组,其中GNSS-R数据及其其他数据及其产品均采用双线性插值算法进行重采样;再对不同的数据组进行质量控制筛除质量不合格的数据组,具体的筛除项配置有:
1)GYGNSS卫星星载CYGNSS-R数据根据其元数据里提供的变量质量标志quality_flags对数据组进行质量控制筛除精度不高的采样点;2)SMAP数据产品采用其数据集当中的质量标识retrieval_qual_flag数据进行质量控制,以确保土壤湿度、地表温度、植被含水量、粗糙度系数达到推荐质量,剔除土壤湿度、地表温度、植被含水量、粗糙度系数小于0.02和-9999的值,保留retrieval_qual_flag等于0(二进制为“0000”)或等于8(二进制为“1000”)的高质量反演值;3)SMOS数据产品使用其数据集当中的质量标识Quality_Flag进行质量控制,保留Quality_Flag=0的反演推荐质量数据;4)所有数据产品剔除含有NAN值的数据。
4.根据权利要求1所述的一种融合星载GNSS-R和多源RS数据协同反演地表土壤水分和植被含水量的方法,其特征在于:步骤S4所述的数据划分,将时间和空间匹配后的数据集按照观测时间顺序选择划分为训练集、验证集和测试集,分别占过滤后总数据集的60%、15%和25%。
CN202311019320.7A 2023-08-14 2023-08-14 融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法 Active CN117076819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311019320.7A CN117076819B (zh) 2023-08-14 2023-08-14 融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311019320.7A CN117076819B (zh) 2023-08-14 2023-08-14 融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法

Publications (2)

Publication Number Publication Date
CN117076819A CN117076819A (zh) 2023-11-17
CN117076819B true CN117076819B (zh) 2024-06-04

Family

ID=88707267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311019320.7A Active CN117076819B (zh) 2023-08-14 2023-08-14 融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法

Country Status (1)

Country Link
CN (1) CN117076819B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117313563B (zh) * 2023-11-30 2024-02-27 江汉大学 物理约束与深度学习耦合下土壤水分重建模型的配置方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110672640A (zh) * 2019-11-13 2020-01-10 武汉大学 一种植被覆盖区域的土壤湿度估计方法及装置
CN112488008A (zh) * 2020-12-04 2021-03-12 中国科学院地理科学与资源研究所 一种基于多源遥感数据融合的土壤水分测量方法及装置
CN114186484A (zh) * 2021-11-30 2022-03-15 长安大学 一种适用于高海拔地区的地表土壤湿度遥感反演方法
CN115293198A (zh) * 2022-06-29 2022-11-04 中国空间技术研究院 一种基于多隐层神经网络提高gnss-r测高反演精度的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114371182B (zh) * 2022-03-22 2022-05-31 中国科学院地理科学与资源研究所 一种基于cygnss数据的星载gnss-r高精度土壤水分估算方法
CN115047499B (zh) * 2022-05-31 2023-11-07 武汉大学 星载gnss-r土壤温度与湿度的反演方法、系统
CN116105697A (zh) * 2023-01-17 2023-05-12 昆明理工大学 一种基于深度学习的星载gnss-r全球海面有效波高反演方法
CN116519913B (zh) * 2023-07-03 2023-09-08 中国科学院地理科学与资源研究所 基于星载和地基平台融合的gnss-r数据土壤水分监测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110672640A (zh) * 2019-11-13 2020-01-10 武汉大学 一种植被覆盖区域的土壤湿度估计方法及装置
CN112488008A (zh) * 2020-12-04 2021-03-12 中国科学院地理科学与资源研究所 一种基于多源遥感数据融合的土壤水分测量方法及装置
CN114186484A (zh) * 2021-11-30 2022-03-15 长安大学 一种适用于高海拔地区的地表土壤湿度遥感反演方法
CN115293198A (zh) * 2022-06-29 2022-11-04 中国空间技术研究院 一种基于多隐层神经网络提高gnss-r测高反演精度的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于星载GNSS-R技术的土壤湿度反演方法研究;李江洋;《中国优秀硕士学位论文全文数据库 农业科技辑》;20230715(第07期);D043-6 *

Also Published As

Publication number Publication date
CN117076819A (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
Paloscia et al. A comparison of algorithms for retrieving soil moisture from ENVISAT/ASAR images
Baret et al. Estimating canopy characteristics from remote sensing observations: Review of methods and associated problems
US20060164063A1 (en) Atmospheric refractivity profiling apparatus and methods
CN117076819B (zh) 融合星载gnss-r和多源rs数据协同反演地表土壤水分和植被含水量的方法
Meng et al. Modeling alpine grassland above ground biomass based on remote sensing data and machine learning algorithm: A case study in east of the Tibetan Plateau, China
Paloscia et al. Generation of soil moisture maps from ENVISAT/ASAR images in mountainous areas: a case study
CN112906300B (zh) 基于双通道卷积神经网络的极化sar土壤湿度反演方法
CN112906310A (zh) 考虑萤火虫算法优化bp神经网络微波遥感土壤水分反演方法
CN114529097B (zh) 多尺度农作物物候期遥感降维预测方法
CN113255972B (zh) 基于Attention机制的短临降水预测方法
CN114894819B (zh) 一种星载gnss-r土壤湿度反演方法
CN116452023B (zh) 基于低频微波雷达vod数据的公里级碳储量评估方法
CN115860269B (zh) 一种基于三重注意力机制的农作物产量预测方法
Huang et al. A data-driven method for hybrid data assimilation with multilayer perceptron
Feng et al. A comparison of two local moment-matching nonlinear filters: Local particle filter (LPF) and local nonlinear ensemble transform filter (LNETF)
CN108764326A (zh) 基于深度置信网络的城市不透水层提取方法
CN116698691B (zh) 大气细粒子aod反演方法、装置、电子设备及存储介质
CN109212553A (zh) 无人机LiDAR和随机森林提取银杏生物物理特性的方法
Singh et al. An efficient modeling with GA approach to retrieve soil texture, moisture and roughness from ERS-2 SAR data
Santi Neural networks applications for the remote sensing of hydrological parameters
Kseneman et al. Soil-moisture estimation from X-band data using Tikhonov regularization and neural net
Ettalbi et al. Soil Moisture Retrieval in Bare Agricultural Areas Using Sentinel-1 Images
CN107977943A (zh) 一种基于提纯优化的空间目标光谱解混方法
Santi et al. A merged SMAP–Sentinel-1 soil moisture product using Artificial Neural Networks: a case study in Central Italy
Fascetti et al. Empirical fitting of forward backscattering models for multitemporal retrieval of soil moisture from radar data at L-band

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant