CN117035066A - 一种耦合地理加权与随机森林的地表温度降尺度方法 - Google Patents
一种耦合地理加权与随机森林的地表温度降尺度方法 Download PDFInfo
- Publication number
- CN117035066A CN117035066A CN202311004642.4A CN202311004642A CN117035066A CN 117035066 A CN117035066 A CN 117035066A CN 202311004642 A CN202311004642 A CN 202311004642A CN 117035066 A CN117035066 A CN 117035066A
- Authority
- CN
- China
- Prior art keywords
- surface temperature
- random forest
- data
- model
- geographic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000008878 coupling Effects 0.000 title claims abstract description 23
- 238000010168 coupling process Methods 0.000 title claims abstract description 23
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000002310 reflectometry Methods 0.000 claims description 17
- 238000003066 decision tree Methods 0.000 claims description 14
- 238000011160 research Methods 0.000 claims description 13
- 239000002689 soil Substances 0.000 claims description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 9
- 208000027066 STING-associated vasculopathy with onset in infancy Diseases 0.000 claims description 8
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000005855 radiation Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000012952 Resampling Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 238000012549 training Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 238000003331 infrared imaging Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002277 temperature effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10032—Satellite or aerial image; Remote sensing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10048—Infrared image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Educational Administration (AREA)
- Computational Mathematics (AREA)
- Development Economics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种耦合地理加权与随机森林的地表温度降尺度方法,属于遥感图像处理技术领域。该方法包括以下步骤:获取遥感数据及预处理;尺度因子的选择及计算;地理加权随机森林降尺度模型的建立与参数优化;将预处理后的高分辨率尺度因子及残差输入到地理加权随机森林降尺度模型得到高分辨率地表温度,最后通过决定系数,均方根误差,平均绝对误差评估模型精度。本发明在地理加权回归模型的基础上通过引入随机森林回归模型,表达地表温度与尺度因子的非平稳性以及非线性。
Description
技术领域
本发明属于遥感图像处理技术领域,涉及一种耦合地理加权与随机森林的地表温度降尺度方法。
背景技术
地表温度(LST)作为描述区域和全球尺度陆地生态系统中大气和地表相互作用、物质循环和能量交换的最重要参数之一,在地表能量平衡中起着至关重要的作用。LST被广泛用于估算蒸发量,分析干旱对植被的影响,检测森林火灾,以及监测城市热岛效应。近年来,LST的重要性得到了越来越多的关注。
目前较大范围的地表温度获取方式仍主要是通过卫星搭载的热传感器来获取,热红外遥感可以动态、宏观地检测和描述地表温度的空间差异和多样性,而常规的地面站点观测方式难以获得区域和全球尺度的地表温度时空分布。由于遥感卫星载荷的限制和传感器制造技术的瓶颈,难以同时在空间和时间尺度上获得精细分辨率的热红外数据,无法在单一卫星或传感器上同时获取高空间分辨率的地表温度数据。同时热混合效应和云层覆盖的影响也进一步减少了可用的热红外影像。为了获得高分辨率的时空数据,需要采用选定的方法对热红外数据进行处理,地表温度降尺度就是其中一种有效且常用的方法,该方法在假设尺度不变性的假设的前提下通过探索尺度因子与地表温度的统计回归关系,结合低空间分辨率地表温度与高空间分辨率的辅助数据获取高空间分辨率的地表温度。
虽然研究人员在非均质地区通过各种统计回归方法,从线性到非线性,从全局到局部,努力提高LST降尺度算法的准确性和可靠性,但仍有一些问题需要进一步研究,比如当前大部分降尺度方法在尺度因子的选择上是单一的,这对于不同地表覆盖类型对地表温度的影响表征不足,同时对于降尺度模型的泛化能力也是缺乏的。其中最关键的问题是,这些统计降尺度算法主要是解决地表温度与尺度因子之间的空间非平稳性,而针对城市等空间异质性强的区域很少同时考虑地表温度与尺度因子之间的空间非平稳性和非线性关系。
发明内容
有鉴于此,本发明的目的在于提供一种耦合地理加权与随机森林的地表温度降尺度方法。
为达到上述目的,本发明提供如下技术方案:
根据权利要求1所述的一种耦合地理加权与随机森林的地表温度降尺度方法,该方法包括以下步骤:
S1:获取遥感数据及预处理;获取研究区域范围内热红外遥感影像和多光谱遥感影像,并进行预处理;
S2:尺度因子的选择及计算;选择可见光近红外的反射率数据、根据研究区域土地覆盖类型选择能够表征植被、裸土、城市不透水面、水体的光谱因子以及表征地形的DEM数据及其衍生指数,接着通过皮尔逊相关系数筛选与地表温度相关性大的尺度因子作为最终模型的尺度因子;
S3:地理加权随机森林降尺度模型的建立与参数优化;地理加权随机森林降尺度模型参数包括决策树的数量,每个决策树使用的特征数量,以及局部带宽大小;利用地表覆盖类型数据对带宽内数据进行地理加权表达样本点的空间非平稳性,对每一个样本点及其带宽内的数据建立地理加权随机森林模型,通过逐步调优的方式,采用网格搜索循环调整单个参数的值,使用10折交叉验证获取最优参数值;得到各个参数的最优值后使用袋外误差重新训练数据,计算泛化误差,根据建立的回归关系得到低空间分辨率下的残差,通过普通克里金插值将残差分辨率提高到目标高空间分辨率;
S4:将预处理后的高分辨率尺度因子输入到地理加权随机森林回归模型GWRF,根据低空间分辨率下地表温度与尺度因子的回归关系得到高空间分辨率下的地表温度值,通过决定系数R2、均方根误差RMSE、平均绝对误差MAE评估模型精度。
可选的,对所述遥感数据进行辐射校正、大气校正和几何校正,遥感数据预处理包括将多光谱遥感影像重采样、裁剪、重投影至同一研究区域;获取的遥感数据包括MODIS地表温度数据和Landsat 8地表反射率数据,DEM数字高程数据,其中MODIS地表温度数据来自温度产品MOD11A1,空间分辨率为1000米;Landsat 8地表反射率数据空间分辨率为30米;对Landsat 8热红外遥感影像采用辐射传输方程法进行温度反演得到研究区域的地表温度作为模型的交叉验证数据。
可选的,所述Landsat 8地表反射率数据用于尺度因子以及计算光谱指数,具体包括归一化植被指数NDVI、调节土壤植被指数SAVI、归一化水体指数NDWI、改进归一化水体指数MNDWI、建筑指数NDBI、归一化差值裸地与建筑用地指数NDBBI、城市指数UI、土壤调节植被指数SAVI、归一化差异干旱指数NDDI,光谱指数的计算是由单个或多个可见光近红外波段、短波红外波段组合衍生出来的;利用数字高程模型DEM计算天空视域因子SVF、坡度、坡向。
可选的,所述地理加权随机森林回归模型GWRF是将地理加权的思想耦合到随机森林模型中,以多个局部空间加权随机森林的形式对地理空间变化特征进行局部非线性建模,使得GWRF对地理空间中响应变量与预测变量之间同时具有处理空间非平稳性以及空间变量非线性之间的关系的能力;GWRF通过数据间的地理空间位置,在自适应带宽或者固定带宽内构建局部训练集,带宽内的数据利用地理加权的思想以及不同覆盖类型对具有空间非平衡数据进行距离加权,再利用随机森林模型对于非平稳空间数据进行非线性拟合,最佳带宽通过最小化随机森林模型的袋外误差EOOB确定,使用遍历搜索的方式确定耦合模型的超参数包括随机森林的树个数,每棵树的预测变量个数;
将地理加权与随机森林耦合模型应用到地表温度降尺度时,对于具有覆盖类型的地区,随机森林耦合模型通过多种空间尺度因子对地表温度进行非线性分解,并且根据在不同覆盖类型下尺度因子对于地表温度的重要性动态调整空间地理权重,使耦合模型能够充分表征空间尺度因子对于地表温度在不同区域的影响;将尺度因子与地表温度使用皮尔逊相关系数进行特征的初步筛选,然后通过全局随机森林回归模型进行特征重要性排序选取合适特征作为降尺度因子;随机森林的构建是由多棵决策树根据袋外误差最小化来优化决策树的特征选择,通过改变特征选择计算袋外误差得到特征重要性,即改变前后误差越大表示特征越重要;袋外误差EOOB公式如下:
n为袋外样本个数:为根据给定样本Xi基于随机森林回归模型的输出数据;Yi为观测数据;
进行随机森林回归模型拟合非线性关系时,根据带宽为每个样本点建立局部随机森林回归模型,并考虑空间异质性为每个样本点赋予不同的权重,该权重函数基于某两点之间的地理空间距离以及考虑样本点的地表覆盖类型来计算权重,权重计算如下:
该权重函数通过考虑不同地表覆盖类型,即在带宽范围内的样本点为同一覆盖类型时权重更大,如果带宽内样本点的个数过少则考虑不同覆盖类型但距离最近的样本点,为不同覆盖类型的样本点考虑不同权重,其中lci为第i个样本点的地表覆盖类型,dij为样本点i到样本点j的空间距离,b为带宽,α为距离的倍数,取大于1的数;
将地理加权与随机森林耦合模型应用到地表温度降尺度时在低分辨下建立的尺度因子与地表温度的地理加权随机森林回归模型如下:
其中Tb(W·Xi)表示随机森林模型中的第b颗决策树,W表示空间距离权重,GWRFi表示构建的第i个数据点的耦合模型,表示低空间分辨率下数据点i的地表温度,即MODIS地表温度,/>为低空间分辨率下数据点i的第k个尺度因子,/>为模型预测值,/>为低分辨率下的MODIS地表温度与模型预测值的残差;
基于尺度不变性,将低空间分辨率下的回归关系应用到高分辨率,计算高空间分辨率下的地表温度值,计算公式为:
其中,表示高空间分辨率下数据点i的预测地表温度,/>为高空间分辨率下数据点i的第k个尺度因子,/>为/>经过普通克里金插值高分辨率下的残差。
可选的,所述S4后还包括S5:使用经过降尺度后的高分辨率的地表温度数据与Landsat8热红外波段反演出的来高分辨率地表温度结果进行评价,利用决定系数R和均方根误差RMSE指标综合考察降尺度结果精度
本发明的有益效果在于:本发明提出了一种耦合GWR与随机森林的地表温度降尺度新方法,选择多种光谱指数、反射率、地表形态指数作为尺度候选因子,将MODIS LST的空间分辨率由1000米提高到100米。该算法在地理加权回归模型的基础上通过引入随机森林回归模型,表达地表温度与尺度因子的非平稳性以及非线性,可以更好地描述LST和尺度因子之间的关系。
本发明主要创新点是考虑研究区的空间异质性以及地表温度和尺度因子的复杂非线性,提出一种新的地表温度降尺度模型—地理加权随机森林回归模型(Geographically Weighted Random Forest Model,GWRF),与现有技术相比,本发明根据半经验方法首先选取与地表温度相关性较大的尺度因子,然后利用随机森林对变量的不敏感的特性使用多种尺度因子表征地表温度实现了尺度因子的自适应选择,增强了降尺度模型对于不同地表覆盖区域的泛化性。选取了光谱指数包括归一化植被指数NDVI、调节土壤植被指数SAVI、归一化水体指数NDWI、改进归一化水体指数MNDWI、建筑指数NDBI、归一化差值裸地与建筑用地指数NDBBI、城市指数UI、土壤调节植被指数SAVI、归一化差异干旱指数NDDI,光谱指数的计算是由单个或多个可见光近红外波段、短波红外波段组合衍生出来的;利用数字高程模型DEM计算天空视域因子SVF、坡度、坡向;反射率包括红光波段反射率,蓝光波段反射率,绿光波段反射率,短波红外反射率SWIR等降尺度因子,将MODIS温度产品的空间分辨率降尺度到更精细的分辨率,得到无云情况下高精度、高分辨率的地表温度。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明流程图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
如图1所示,提出了一种耦合地理加权与随机森林的地表温度降尺度方法,将随机森林(RF)引入地理加权回归(GWR),同时考虑地区间的空间非平稳和地表温度与尺度因子之间的非线性关系,可以更好地描述地表温度和尺度因子之间的关系。具体包括以下步骤:
S1:获取遥感数据及预处理;获取研究区域范围内热红外遥感影像和多光谱遥感影像,并进行预处理;
S2:尺度因子的选择及计算;在传统光谱指数的基础上引入城市形态因子;将各尺度因子分别升尺度到1000米和100米;
S3:地理加权随机森林回归模型的建立与参数优化;地理加权随机森林回归模型参数包括决策树的数量,每个决策树使用的特征数量,以及局部带宽大小;利用地表覆盖类型数据对带宽内数据进行加权,通过逐步调优的方式,采用网格搜索循环调整单个参数的值,使用10折交叉验证获取最优参数值;得到各个参数的最优值后使用袋外误差重新训练数据,计算泛化误差,最终得到地理加权随机森林回归模型,根据建立的回归关系得到低空间分辨率下的残差,通过普通克里金插值将残差的提高到目标高空间分辨率;
S4:将预处理后的高分辨率尺度因子输入到地理加权随机森林回归模型,根据低空间分辨率下地表温度与尺度因子的回归关系得到高空间分辨率下的地表温度值,通过决定系数R2、均方根误差RMSE、平均绝对误差MAE评估模型精度。
优选地,本研究对所采用的遥感数据进行了辐射校正、大气校正和几何校正,本发明预处理主要包括将多光谱遥感影像重采样,裁剪,重投影至同一研究区域.获取的遥感数据包括MODIS地表温度数据和Landsat 8地表反射率数据,DEM数字高程数据,其中MODIS地表温度数据来自温度产品MOD11A1,空间分辨率为1000米;Landsat 8地表反射率数据空间分辨率为30米。而后对Landsat 8热红外遥感影像采用辐射传输方程法进行温度反演得到研究区域的地表温度作为模型的交叉验证数据。
优选地,利用Landsat 8地表反射率数据计算光谱指数主要包括归一化植被指数NDVI、调节土壤植被指数SAVI、归一化水体指数NDWI、改进归一化水体指数MNDWI、建筑指数NDBI、归一化差值裸地与建筑用地指数NDBBI、城市指数UI、土壤调节植被指数SAVI、归一化差异干旱指数NDDI,光谱指数的计算是由单个或多个可见光近红外波段、短波红外波段组合衍生出来的;利用数字高程模型DEM计算天空视域因子SVF、坡度、坡向,基于随机森林在高维特征处理方面表现优异的特性引入多种尺度因子而无需考虑特征共线性问题,并且随机森林回归模型可以根据特征对袋外误差影响程度的大小导出特征重要性,将尺度因子与地表温度使用皮尔逊相关系数进行特征的初步筛选,然后通过全局随机森林回归模型进行特征重要性排序选取合适特征作为降尺度因子。
优选地,进行随机森林回归模型拟合非线性关系时,考虑样本点本身的不平衡性,即地理学第一定律表明,在地理变量的空间关系中,任何事物都是空间相关的,距离近的事物比距离远的事物的空间相关性更大,所以离预测点近的观测数据要比离预测点远的加权更多,不同位置观测点给予的权重随其离观测点的距离不同而变化。根据带宽为每个样本点建立局部随机森林回归模型,并考虑空间异质性为每个样本点赋予不同的权重,该权重函数基于某两点之间的地理空间距离来计算权重,权重计算如下权重计算如下:
该权重函数通过考虑不同地表覆盖类型,即在带宽范围内的样本点为同一覆盖类型时权重更大,如果带宽内样本点的个数过少则考虑不同覆盖类型但距离最近的样本点,为不同覆盖类型的样本点考虑不同权重,其中lci为第i个样本点的地表覆盖类型,dij为样本点i到样本点j的空间距离,b为带宽,α为距离的倍数,取大于1的自然数。
随机森林的构建是由多棵决策树根据袋外误差最小化来优化决策树的特征选择,并且通过改变特征选择计算袋外误差得到特征重要性,即改变前后误差越大表示特征越重要,这为本发明提供特征选择依据。袋外误差(Error of out of bag,EOOB),公式如下:
n为袋外样本个数:为根据给定样本Xi基于随机森林回归模型的输出数据;Yi为观测数据。
在低分辨下建立的尺度因子与地表温度的地理加权随机森林回归模型如下:
其中,表示低空间分辨率下数据点i的地表温度,即MODIS地表温度,/>为低空间分辨率下数据点i的第k个尺度因子,/>为模型预测值,/>为低分辨率下的MODIS地表温度与模型预测值的差值。
进一步的,基于尺度不变性,将低空间分辨率下的回归关系应用到高分辨率,计算高空间分辨率下的地表温度值,计算公式为:
其中,表示高空间分辨率下数据点i的地表温度﹐即MODIS地表温度,/>为高空间分辨率下数据点i的第k个尺度因子,/>为/>经过普通克里金插值高分辨率下的残差。
优选的,使用经过降尺度后的高分辨率的地表温度数据与Landsat 8热红外波段反演出的来高分辨率地表温度结果进行精度评价,利用决定系数R和均方根误差RMSE指标综合考察降尺度结果精度。
本发明提出了一种基于GWRF模型的地表温度降尺度新方法,选择多种光谱指数、反射率、地表形态指数作为尺度候选因子,将MODIS LST的空间分辨率由1000米提高到100米。该算法在地理加权回归模型的基础上通过引入随机森林回归模型,表达地表温度与尺度因子的非平稳性以及非线性,可以更好地描述LST和尺度因子之间的关系。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.根据权利要求1所述的一种耦合地理加权与随机森林的地表温度降尺度方法,其特征在于:该方法包括以下步骤:
S1:获取遥感数据及预处理;获取研究区域范围内热红外遥感影像和多光谱遥感影像,并进行预处理;
S2:尺度因子的选择及计算;选择可见光近红外的反射率数据、根据研究区域土地覆盖类型选择能够表征植被、裸土、城市不透水面、水体的光谱因子以及表征地形的DEM数据及其衍生指数,接着通过皮尔逊相关系数筛选与地表温度相关性大的尺度因子作为最终模型的尺度因子;
S3:地理加权随机森林降尺度模型的建立与参数优化;地理加权随机森林降尺度模型参数包括决策树的数量,每个决策树使用的特征数量,以及局部带宽大小;利用地表覆盖类型数据对带宽内数据进行地理加权表达样本点的空间非平稳性,对每一个样本点及其带宽内的数据建立地理加权随机森林模型,通过逐步调优的方式,采用网格搜索循环调整单个参数的值,使用10折交叉验证获取最优参数值;得到各个参数的最优值后使用袋外误差重新训练数据,计算泛化误差,根据建立的回归关系得到低空间分辨率下的残差,通过普通克里金插值将残差分辨率提高到目标高空间分辨率;
S4:将预处理后的高分辨率尺度因子输入到地理加权随机森林回归模型GWRF,根据低空间分辨率下地表温度与尺度因子的回归关系得到高空间分辨率下的地表温度值,通过决定系数R2、均方根误差RMSE、平均绝对误差MAE评估模型精度。
2.根据权利要求1所述的一种耦合地理加权与随机森林的地表温度降尺度方法,其特征在于:对所述遥感数据进行辐射校正、大气校正和几何校正,遥感数据预处理包括将多光谱遥感影像重采样、裁剪、重投影至同一研究区域;获取的遥感数据包括MODIS地表温度数据和Landsat 8地表反射率数据,DEM数字高程数据,其中MODIS地表温度数据来自温度产品MOD11A1,空间分辨率为1000米;Landsat 8地表反射率数据空间分辨率为30米;对Landsat8热红外遥感影像采用辐射传输方程法进行温度反演得到研究区域的地表温度作为模型的交叉验证数据。
3.根据权利要求1所述的一种耦合地理加权与随机森林的地表温度降尺度方法,其特征在于:所述Landsat 8地表反射率数据用于尺度因子以及计算光谱指数,具体包括归一化植被指数NDVI、调节土壤植被指数SAVI、归一化水体指数NDWI、改进归一化水体指数MNDWI、建筑指数NDBI、归一化差值裸地与建筑用地指数NDBBI、城市指数UI、土壤调节植被指数SAVI、归一化差异干旱指数NDDI,光谱指数的计算是由单个或多个可见光近红外波段、短波红外波段组合衍生出来的;利用数字高程模型DEM计算天空视域因子SVF、坡度、坡向。
4.根据权利要求1所述的一种耦合地理加权与随机森林的地表温度降尺度方法,其特征在于:所述地理加权随机森林回归模型GWRF是将地理加权的思想耦合到随机森林模型中,以多个局部空间加权随机森林的形式对地理空间变化特征进行局部非线性建模,使得GWRF对地理空间中响应变量与预测变量之间同时具有处理空间非平稳性以及空间变量非线性之间的关系的能力;GWRF通过数据间的地理空间位置,在自适应带宽或者固定带宽内构建局部训练集,带宽内的数据利用地理加权的思想以及不同覆盖类型对具有空间非平衡数据进行距离加权,再利用随机森林模型对于非平稳空间数据进行非线性拟合,最佳带宽通过最小化随机森林模型的袋外误差EOOB确定,使用遍历搜索的方式确定耦合模型的超参数包括随机森林的树个数,每棵树的预测变量个数;
将地理加权与随机森林耦合模型应用到地表温度降尺度时,对于具有覆盖类型的地区,随机森林耦合模型通过多种空间尺度因子对地表温度进行非线性分解,并且根据在不同覆盖类型下尺度因子对于地表温度的重要性动态调整空间地理权重,使耦合模型能够充分表征空间尺度因子对于地表温度在不同区域的影响;将尺度因子与地表温度使用皮尔逊相关系数进行特征的初步筛选,然后通过全局随机森林回归模型进行特征重要性排序选取合适特征作为降尺度因子;随机森林的构建是由多棵决策树根据袋外误差最小化来优化决策树的特征选择,通过改变特征选择计算袋外误差得到特征重要性,即改变前后误差越大表示特征越重要;袋外误差EOOB公式如下:
n为袋外样本个数:为根据给定样本Xi基于随机森林回归模型的输出数据;Yi为观测数据;
进行随机森林回归模型拟合非线性关系时,根据带宽为每个样本点建立局部随机森林回归模型,并考虑空间异质性为每个样本点赋予不同的权重,该权重函数基于某两点之间的地理空间距离以及考虑样本点的地表覆盖类型来计算权重,权重计算如下:
该权重函数通过考虑不同地表覆盖类型,即在带宽范围内的样本点为同一覆盖类型时权重更大,如果带宽内样本点的个数过少则考虑不同覆盖类型但距离最近的样本点,为不同覆盖类型的样本点考虑不同权重,其中lci为第i个样本点的地表覆盖类型,dij为样本点i到样本点j的空间距离,b为带宽,α为距离的倍数,取大于1的数;
将地理加权与随机森林耦合模型应用到地表温度降尺度时在低分辨下建立的尺度因子与地表温度的地理加权随机森林回归模型如下:
其中Tb(W·Xi)表示随机森林模型中的第b颗决策树,W表示空间距离权重,GWRFi表示构建的第i个数据点的耦合模型,表示低空间分辨率下数据点i的地表温度,即MODIS地表温度,/>为低空间分辨率下数据点i的第k个尺度因子,/>为模型预测值,/>为低分辨率下的MODIS地表温度与模型预测值的残差;
基于尺度不变性,将低空间分辨率下的回归关系应用到高分辨率,计算高空间分辨率下的地表温度值,计算公式为:
其中,表示高空间分辨率下数据点i的预测地表温度,/>为高空间分辨率下数据点i的第k个尺度因子,/>为/>经过普通克里金插值高分辨率下的残差。
5.根据权利要求1所述的一种耦合地理加权与随机森林的地表温度降尺度方法,其特征在于:所述S4后还包括S5:使用经过降尺度后的高分辨率的地表温度数据与Landsat 8热红外波段反演出的来高分辨率地表温度结果进行评价,利用决定系数R和均方根误差RMSE指标综合考察降尺度结果精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311004642.4A CN117035066A (zh) | 2023-08-10 | 2023-08-10 | 一种耦合地理加权与随机森林的地表温度降尺度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311004642.4A CN117035066A (zh) | 2023-08-10 | 2023-08-10 | 一种耦合地理加权与随机森林的地表温度降尺度方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117035066A true CN117035066A (zh) | 2023-11-10 |
Family
ID=88640761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311004642.4A Pending CN117035066A (zh) | 2023-08-10 | 2023-08-10 | 一种耦合地理加权与随机森林的地表温度降尺度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117035066A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390969A (zh) * | 2023-12-05 | 2024-01-12 | 易智瑞信息技术有限公司 | 一种用于生成地表温度的方法、电子设备和存储介质 |
-
2023
- 2023-08-10 CN CN202311004642.4A patent/CN117035066A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117390969A (zh) * | 2023-12-05 | 2024-01-12 | 易智瑞信息技术有限公司 | 一种用于生成地表温度的方法、电子设备和存储介质 |
CN117390969B (zh) * | 2023-12-05 | 2024-03-12 | 易智瑞信息技术有限公司 | 一种用于生成地表温度的方法、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109884664B (zh) | 一种城市地上生物量光学微波协同反演方法及系统 | |
CN113128134B (zh) | 一种矿区生态环境演变驱动因子权重量化分析方法 | |
CN110174359B (zh) | 一种基于高斯过程回归的航空高光谱影像土壤重金属浓度评估方法 | |
dela Torre et al. | Remote sensing-based estimation of rice yields using various models: A critical review | |
Yu et al. | Kriging interpolation method and its application in retrieval of MODIS aerosol optical depth | |
CN111368817B (zh) | 一种基于地表类型进行热效应定量评价方法及系统 | |
CN105608293A (zh) | 融合光谱与纹理特征的森林地上生物量反演方法及系统 | |
CN106501186B (zh) | 一种土壤含水量产品降尺度方法 | |
CN111798327A (zh) | 基于高光谱影像的小麦产量计算模型的构建方法及其应用 | |
CN107688003B (zh) | 一种消除植被冠层结构和地表背景影响的叶片反射率卫星遥感提取方法 | |
CN111523525A (zh) | 农作物分类识别方法、装置和电子设备 | |
CN113553697B (zh) | 基于长时序多源数据的煤炭开采植被扰动分析方法 | |
CN100365435C (zh) | 一种遥感影像光谱细分方法 | |
CN113486000A (zh) | 基于多源数据和深度学习的地表蒸散发数据降尺度方法 | |
CN117035066A (zh) | 一种耦合地理加权与随机森林的地表温度降尺度方法 | |
CN113205014A (zh) | 一种基于图像锐化的时序数据耕地提取方法 | |
Bai et al. | Optimal window size selection for spectral information extraction of sampling points from UAV multispectral images for soil moisture content inversion | |
Lou et al. | An effective method for canopy chlorophyll content estimation of marsh vegetation based on multiscale remote sensing data | |
Vlachopoulos et al. | Evaluation of crop health status with UAS multispectral imagery | |
Han et al. | Integrating an attention-based deep learning framework and the SAFY-V model for winter wheat yield estimation using time series SAR and optical data | |
CN113408111A (zh) | 大气可降水量反演方法及系统、电子设备和存储介质 | |
CN113159420A (zh) | 一种GSA-MLs相结合的小麦LAI估算方法 | |
Zhu et al. | Estimation of canopy water content for wheat through combining radiative transfer model and machine learning | |
CN114296061B (zh) | 基于多元变量检测和不同辐射传输模型的交叉定标方法 | |
CN113836731B (zh) | 陆表稳定目标大气层顶反射率模型的构建方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |