CN115115948A - 一种基于随机森林和辅助因子的林地信息精细化提取方法 - Google Patents
一种基于随机森林和辅助因子的林地信息精细化提取方法 Download PDFInfo
- Publication number
- CN115115948A CN115115948A CN202210886383.1A CN202210886383A CN115115948A CN 115115948 A CN115115948 A CN 115115948A CN 202210886383 A CN202210886383 A CN 202210886383A CN 115115948 A CN115115948 A CN 115115948A
- Authority
- CN
- China
- Prior art keywords
- model
- afs
- land
- forest land
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 89
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000005192 partition Methods 0.000 claims abstract description 4
- 238000007670 refining Methods 0.000 claims abstract description 3
- 238000012360 testing method Methods 0.000 claims description 42
- 230000003595 spectral effect Effects 0.000 claims description 27
- 239000002689 soil Substances 0.000 claims description 22
- 238000012937 correction Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 16
- 230000000007 visual effect Effects 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000011160 research Methods 0.000 claims description 9
- 238000012800 visualization Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000002310 reflectometry Methods 0.000 claims description 4
- 239000000498 cooling water Substances 0.000 claims description 3
- 238000005286 illumination Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000001228 spectrum Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 241000894007 species Species 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 4
- 208000027066 STING-associated vasculopathy with onset in infancy Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 244000166124 Eucalyptus globulus Species 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 244000101284 Pinus kesiya Species 0.000 description 1
- 235000005026 Pinus kesiya Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/188—Vegetation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种基于随机森林和辅助因子的林地信息精细化提取方法,包括如下步骤:步骤一,遥感影像数据预处理;步骤二,辅助因子AFs测算;步骤三,创建渔网与分区统计;步骤四,模型样本选择;步骤五,基于RF模型的一级地类提取模型训练、精度评估与信息提取;步骤六,基于RF‑AFs模型的二级林地提取模型训练与精度评估;步骤七,基于RF‑AFs模型的二级林地信息精细化提取。本发明借助ENVI、Arcgis和RStudio多元平台,运用自主编程技术开展自上而下的林地信息提取。较林地信息的直接提取而言,本发明扩大了林地同其他一级地类以及各个二级林地之间的遥感信息差异,提高了林地信息的可分性,保证了林地信息提取结果的准确性。
Description
技术领域
本发明属于林业遥感及其应用领域,尤其涉及一种基于随机森林和辅助因子的林地信息精细化提取方法。
背景技术
植被作为生态系统重要的组成部分,维持着生态系统平衡,是全球环境变化的“指示器”。植被信息提取是开展植被覆盖状况和动态变化规律研究的基础,植被生长、活力及遥感信息可为环境监测、林业经营管理、生态安全维护提供有益借鉴。如何准确、快速获取林地信息是林业研究和精准管理的前提。由于不同植被对光的反射和辐射率存在差异,不同林地类型在遥感影像上呈现不同的光谱特征和纹理特征。遥感技术已成为快速准确获取植被信息的最有效的方法之一。
目前林地信息提取方法众多,包括人工目视解译法、监督与非监督分类法、专家知识法、面向对象法、植被物候特征提取法、多源遥感数据融合法、机器学习法、混合像元分解法等。随机森林(Random Forest,RF)是一种基于集成学习的机器学习方法,在训练集的随机性与节点分裂最优属性的两处随机性共同作用下,可以快速高效处理海量的、非线性的多维数据,模型具有很强的泛化能力,有效提高了植被信息提取的精度和效率。近年来,RF模型在林地信息提取中得到有效应用。上述所提及的林地信息提取方法多基于植被的光谱特征和纹理特征展开研究。然而,不同林地类型的“同谱异物”(即在某一个谱段区,两个不同地物可能呈现相同的光谱特征)和“同物异谱”(即同一个地物,由于处于不同状态,如对太阳光相对角度不同,密度不同,含水量不同等等,呈现不同的光谱特征)的现象比较突出,仅依靠遥感影像自身的光谱特征和纹理特征难以准确提取各类林地信息,尤其对于一些特殊的树种更难甄别。各种植被指数(Vegetation Indices,VIs)对遥感影像自身的光谱特征进行了更深入的探索,也常被用作植被提取的重要辅助信息。VIs通过不同波段的运算,可以减少遥感影像相似光谱特征对植被信息的干扰,有助于林地信息的精确提取。此外,不同林地的分布还受地形、气候、土壤和人类活动等立地条件(Site Conditions,SCs)的影响。因此,在林地遥感分类中,兼顾林地的立地条件和植被指数等辅助因子(AuxiliaryFactors,AFs)特征是非常必要的。然而,目前林地信息提取对包括立地条件和植被指数在内的其他重要的辅助信息关注不足,林地信息精细化提取技术尚未成熟,林地信息尤其是特殊树种信息提取精度较低。这导致林地的空间布局规律不能被及时和准确掌握,难以有效指导区域林业结构调整、空间格局优化和生态环境改善。
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供了一种基于随机森林和辅助因子的林地信息精细化提取方法,用于解决目前林地信息尤其是特殊树种信息提取中辅助因子考虑不足、提取技术不成熟和提取精度不够等问题。
本发明为解决上述技术问题采用以下技术方案:
一种基于随机森林和辅助因子的林地信息精细化提取方法,包括如下步骤:
步骤一,遥感影像数据预处理;通过卫星地图软件下载林地信息待提取区的哨兵2号Sentinel-2卫星影像,并对影像进行大气校正和辐射定标处理,随后进行波段融合操作,获取多光谱和高分辨率的Sentinel-2A影像及其波段信息;
步骤二,辅助因子AFs测算;辅助因子AFs包括立地条件和植被指数两类因子,共计16项因子,用于扩大二级林地间的差异性,以提高二级林地信息提取精度;首先,基于ArcGIS软件计算海拔、坡度、坡向、气温、降水、土壤类型和距居民点距离共7个立地条件因子SCs,并进行空间可视化表达,使之在Sentinel-2A影像中直接体现;基于步骤一所得Sentinel-2A影像及其波段信息,采用ENVI软件分别计算比值植被指数、归一化植被指数、归一化红边植被指数、垂直植被指数、增强植被指数、土壤调节植被指数、转换型土壤调节植被指数、再归一化植被指数和植被衰减指数共9个植被指数VIs,并进行空间可视化表达,明确SCs和VIs的空间分布及阈值范围,使之在Sentinel-2A影像中直接体现;
步骤三,创建渔网与分区统计;基于步骤一所得Sentinel-2A影像,运用ArcGIS软件创建渔网,并赋予各个渔网单元唯一的编号属性;以渔网编号分别统计由步骤二计算的16项AFs的值,使得Sentinel-2A影像对应的每个渔网编号均可获取其所属的AFs值,作为RF-AFs模型的辅助因子信息;
步骤四,模型样本选择;基于待提取的一级地类和二级林地类型,在野外为一级地类和二级林地类型选取相应的野外样本点;由于野外实地选取的样本数量有限,因此基于一级地类和二级林地类型的野外样本点在Sentinel-2A影像上的光谱和纹理特征,结合高分辨率的谷歌影像,以目视判读方式在Sentinel-2A影像上选取大量与野外实地选取一级地类和二级林地类型相近似的样本作为模型分类的最终样本;
步骤五,基于RF模型的一级地类信息提取模型训练与精度评估;将步骤四中一级地类的最终样本以及Sentinel-2A影像数据,划分为训练样本和测试样本,并输入RF模型进行模型训练和开展基于总体精度和kappa系数的RF模型精度评估,将除训练样本和测试样本以外的其他待识别一级地类类型的渔网单元输入RF模型,提取一级地类信息,并进行空间可视化表达;
步骤六,基于RF-AFs模型的二级林地提取模型训练与精度评估;在步骤五获取的一级地类的林地范围中进行进一步提取二级林地,将步骤四中的二级林地的最终样本进一步划分训练样本和测试样本,每个样本均包含了16项AFs值;将训练样本输入RF-AFs模型进行模型训练,形成16项AFs值与二级林地类型之间的联系,获取模型mtry和ntree两个最佳参数,进一步将确定的mtry和ntree两个最优参数输入RF-AFs模型,获取最优的RF-AFs模型;将测试样本输入并运行获取的最优的RF-AFs模型,开展基于总体精度和kappa系数的最优RF-AFs模型的精度评估;
步骤七,基于RF-AFs模型的二级林地信息精细化提取;将除训练样本和测试样本以外的其它待识别所属林地类型的渔网单元输入步骤六中已训练完毕的最优RF-AFs模型识别各个样本所属的林地类型,并进行空间制图与数据分析。
进一步的,步骤一中,通过欧洲太空局开发的Sen2cor软件分别对遥感影像进行大气校正和辐射定标处理,并采用SNAP进行波段融合操作,获取多光谱和高分辨率的Sentinel-2A影像;其中,Sentinel-2A中的“A”是经过了大气校正和辐射定标处理以后影像的级别编号;大气校正是指为消除Sentinel-2影像中由大气和光照等因素对地物反射的造成的误差而进行的校正,以得到地物真实反射率;辐射定标是指将Sentinel-2影像的亮度灰度值转换为绝对辐射亮度。
进一步的,步骤二中,较传统的林地信息提取而言,本发明兼顾了SCs和VIs等重要的辅助因子,进一步扩大不同二级林地信息特征的差异性;海拔、坡度、坡向由林地信息待提取区的数字高程模型提取得到;降水和气温数据通过气象站点数据插值得到;距离居民点距离由ArcGIS的缓冲区分析得到;VIs由Sentinel-2A的各波段计算得到。
进一步的,步骤三中,以Sentinel-2A影像为基础,采用ArcGIS软件中的创建渔网工具,生成林地信息待提取区渔网,并赋予编号;进一步采用分区统计工具,统计各个渔网内海拔、坡度、坡向、气温、降水、土壤类型、距居民点距离、比值植被指数、归一化植被指数、归一化红边植被指数、垂直植被指数、增强植被指数、土壤调节植被指数、转换型土壤调节植被指数、再归一化植被指数和植被衰减指数共16项AFs的值。
进一步的,步骤四中,按照中科院土地利用/覆盖分类标准,一级地类包括耕地、林地、草地、水域、建设用地和未利用地6种类型;二级林地根据林地信息待提取区实际以及研究目的来确定;步骤四中提及的光谱特征反映了地物反射电磁波能量的大小,指由遥感影像中不同波段组合所呈现出的影像颜色、亮度等特征;纹理特征指不同地类在影像中呈现出地物的视觉粗糙度,体现了影像表面的具有缓慢变化或者周期性变化的表面结构组织排列属性和形状信息;用于提取二级林地的RF-AFs模型中,每一个林地样本都包含17项属性信息,分别是16项AFs和所属的林地类型;RF-AFs模型中除了林地样本以外的其他待识别林地类型的渔网单元,仅包括16项AFs;RF-AFs模型中多样性的辅助特征可以获取遥感影像更为丰富的信息,有效解决了“同谱异物”和“同物异谱”现象所导致的分类精度较低的问题,有效提高林地信息提取精度。
进一步的,步骤五中,由于耕地、林地、草地、水域、建设用地和未利用地间的光谱和纹理特征差异较大,无需结合合多项AFs参与地类提取也能很好地区分,因此在一级地类信息提取中没有考虑AFs,也暂未考虑mtry和ntree的两个最优参数;一级地类信息提取精度是基于一级地类测试样本与RF模型分类结果的混淆矩阵计算总体精度和kappa系数来评价,总体精度和kappa系数在0.75以上就表明模型提取结果精度较高,其值越大,精度越高。
进一步的,步骤六中,RF-AFs模型是在RStudio平台通过自主编程实现。在精确提取二级林地的过程中,不同的林地类型由于相似的光谱和纹理特征而难以区分。因此,必须同时考虑不同林地类型的重要解释特征,并进一步探索增加不同林地类型间差异性的其他辅助特征,全面提高林地的提取精度。因此,RF-AFs模型同样是基于RF模型的基本原理来开展的,二者的本质区别就在于RF模型在提取地类信息过程中没有考虑辅助因子AFs,而RF-AFs模型在提取地类信息过程中考虑了辅助因子AFs;在进行模型训练时,通过RF-AFs模型建立16项AFs值与二级林地类型间的联系;由于训练集的随机性与节点分裂最优属性的两处随机性,这种联系极其复杂且是隐性的,自身蕴含在RF-AFs模型中。RF-AFs模型精度评估就是基于这种隐性联系,运用测试样本来开展评估。
进一步的,步骤七中,将除训练样本和测试样本以外的其他带待识别林地类型的渔网单元输入训练完毕的RF-AFs模型,精细化提取二级林地信息,进一步将精细化林地类型在AcrGIS中进行空间可视化制图,并进行数据分析。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明借助ENVI、Arcgis和RStudio多元平台,运用自主编程技术开展自上而下的林地信息提取(即从林地一级地类到二级林地的逐次提取)。较林地信息的直接提取而言,本发明扩大了林地同其他一级地类以及各个二级林地之间的遥感信息差异,提高了林地信息的可分性,保证了林地信息提取结果的准确性;
2、本发明基于野外样本点在Sentinel-2A遥感影像上的光谱特征和纹理特征,同时参照高分辨率的谷歌影像,以目视判读方式选取林地样本,并结合立地条件(SCs)和植被指数(VIs)等重要辅助因子(AFs),获取了更加丰富的林地遥感信息。通过RF-AFs模型实现了林地辅助因子和林地类型的有效衔接,较传统林地信息提取而言,有效解决了“同谱异物”和“同物异谱”所导致的分类精度较低的问题,大大提高了林地信息提取的精度;
3、本发明兼顾林地的光谱特征、纹理特征以及辅助因子,利用训练样本和测试样本进行RF-AF模型训练,通过编程技术实现了模型的最优参数—mtry和ntree的确定。该方法简单、高效、便捷,可直接在Rstudio开源平台上获取,大大提高了林地信息提取的准确性;
4、本发明提出的RF-AFs模型避免了辅助因子(AFs)的等级划分的和权重赋值,在一定程度上降低了评价结果的主观性。同时本发明提出的自上而下的林地精细化提取方法可为及时和准确掌握林地的空间布局规律,科学调整区域林地结构、优化林地空间格局和改善生态环境提供有益指导;
5、本发明的关键点和保护点为将遥感影像自身的光谱特征、纹理特征以及包括立地条件和植被指数在内的辅助因子联系在一起,通过R语言的自主编程技术构建一种基于随机森林和辅助因子的自上而下提取林地信息的RF-AFs模型,实现了林地信息尤其是特殊树种信息的精细化提取,为揭示林地的空间布局规律、调整林地结构、改善生态环境提供方法和技术支撑。
附图说明
图1为基于随机森林和辅助信息的林地信息精细化提取方法的技术路线图;
图2为RF-AFs模型原理示意图;
图3为RF模型的基本原理示意图;
图4为澜沧县2020年一级地类信息的提取结果示意图;
图5为基于RF-AFs模型的不同mtry值对应平均OOB误差率示意图;
图6为基于RF-AFs模型不同ntree值对应的OOB误差率示意图;
图7为基于RF-AFs模型的澜沧县2020年二级林地信息提取结果示意图;
图8为基于未考虑AFs的RF模型的澜沧县2020年二级林地信息提取结果示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明公开一种基于随机森林和辅助因子的林地信息精细化提取的方法,如图1、2和3所示,包括如下步骤:
步骤一,遥感影像数据预处理;通过卫星地图软件下载林地信息待提取区的哨兵2号Sentinel-2卫星影像,并对影像进行大气校正和辐射定标处理,随后进行波段融合操作,获取多光谱和高分辨率的Sentinel-2A影像及其波段信息。
具体的,通过欧洲太空局开发的Sen2cor软件分别对遥感影像进行大气校正和辐射定标处理,并采用SNAP进行波段融合操作,获取多光谱(12个波段)和高分辨率(10m×10m)的Sentinel-2A影像;其中,Sentinel-2A中的“A”是经过了大气校正和辐射定标处理以后影像的级别编号;大气校正和辐射定标是获取Sentinel-2影像中真实的光谱反射率或光谱辐射亮度必须进行的操作;大气校正是指为消除Sentinel-2影像中由大气和光照等因素对地物反射的造成的误差而进行的校正,以得到地物真实反射率;辐射定标是指将Sentinel-2影像的亮度灰度值转换为绝对辐射亮度。Sentinel-2影像的各波之间存在60m×60m、20m×20m和10m×10m三种分辨率,融合是为了将Sentinel-2影像的各个波段融合至分辨率最高的10m×10m分辨率。通过Sen2cor软件和SNAP软件进行大气校正、辐射定标和波段融合操作,较传统的基于ENVI软件的操作运行更加快捷。
步骤二,辅助因子AFs测算;辅助因子AFs包括立地条件和植被指数两类因子,共计16项因子,用于扩大二级林地间的差异性,以提高二级林地信息提取精度;首先,基于ArcGIS软件计算海拔、坡度、坡向、气温、降水、土壤类型和距居民点距离共7个立地条件因子SCs,并进行空间可视化表达(即以地图的形式呈现各个因子数据),使之在Sentinel-2A影像中直接体现;基于步骤一所得Sentinel-2A影像及其波段信息,采用ENVI软件分别计算比值植被指数RVI、归一化植被指数NDVI、归一化红边植被指数NDVIre、垂直植被指数PVI、增强植被指数EVI、土壤调节植被指数SAVI、转换型土壤调节植被指数TSAVI、再归一化植被指数RDVI和植被衰减指数PSRI共9个植被指数VIs,并进行空间可视化表达,明确SCs和VIs的空间分布及阈值范围,使之在Sentinel-2A影像中直接体现。
具体的,较传统的林地信息提取而言,本发明兼顾了SCs和VIs等重要的辅助因子,进一步扩大不同二级林地信息特征的差异性;海拔、坡度、坡向由林地信息待提取区的数字高程模型(Digital Elevation Model,DEM)提取得到;降水和气温数据通过气象站点数据插值得到;距离居民点距离由ArcGIS的缓冲区分析得到;VIs由Sentinel-2A的各波段计算得到。
各项VIs的具体计算公式如下表所示:
式中,ρ2,ρ3,ρ4,ρ6,ρ8,andρ8A为Sentinel-2A影像中蓝、绿、红、植被红边(6波段)、近红外、植被红边(8A波段)对应的反射率;a and b分别为土壤线的坡度和截距,a=10.849,b=6.604;L为调整因子,参考相关文献,设置L=0.5。
步骤三,创建渔网与分区统计;基于步骤一所得Sentinel-2A影像,运用ArcGIS软件创建渔网(即基于影像所创建的与影像像元大小相等的矢量格网,用于统计各像元对应的各项辅助因子),并赋予各个渔网单元唯一的编号属性;以渔网编号分别统计由步骤二计算的16项AFs的值(包括立地条件因子SCs和植被指数VIs),使得Sentinel-2A影像对应的每个渔网编号均可获取其所属的AFs值,作为RF-AFs模型的辅助因子信息。
具体的,以Sentinel-2A影像为基础,采用ArcGIS软件中的创建渔网工具,生成林地信息待提取区渔网,并赋予编号;进一步采用分区统计工具,统计各个渔网内海拔、坡度、坡向、气温、降水、距居民点距离、比值植被指数RVI、归一化植被指数NDVI、归一化红边植被指数NDVIre、垂直植被指数PVI、增强植被指数EVI、土壤调节植被指数SAVI、转换型土壤调节植被指数TSAVI、再归一化植被指数RDVI和植被衰减指数PSRI共16项AFs的值。
步骤四,模型样本选择;基于待提取的一级地类(包括耕地、林地、草地、水域、建设用地和未利用地类型)和二级林地类型(根据研究实际所需要提取的相应林地子类型),在野外为一级地类和二级林地类型选取相应的野外样本点(即一级地类和二级林地类型各自对应的野外真实地类);由于野外实地选取的样本数量有限,因此基于一级地类和二级林地类型的野外样本点在Sentinel-2A影像上的光谱和纹理特征,结合高分辨率的谷歌影像,以目视判读方式在Sentinel-2A影像上选取大量与野外实地选取一级地类和二级林地类型相近似的样本作为模型分类的最终样本。
具体的,按照中科院土地利用/覆盖分类标准,一级地类包括耕地、林地、草地、水域、建设用地和未利用地6种类型;二级林地根据林地信息待提取区实际以及研究目的来确定;步骤四中提及的光谱特征反映了地物反射电磁波能量的大小,指由遥感影像中不同波段组合所呈现出的影像颜色、亮度等特征;纹理特征指不同地类在影像中呈现出地物的视觉粗糙度,体现了影像表面的具有缓慢变化或者周期性变化的表面结构组织排列属性和形状信息;用于提取二级林地的RF-AFs模型中,每一个林地样本都包含17项属性信息,分别是16项AFs和样本所属的林地类型;RF-AFs模型中除了林地样本以外的其他待识别林地类型的渔网单元,仅包括16项AFs(如图2);相对而言,RF-AFs模型中多样性的辅助特征可以获取遥感影像更为丰富的信息,有效解决了“同谱异物”和“同物异谱”现象所导致的分类精度较低的问题,可以有效提高林地信息提取精度。
步骤五,基于RF模型的一级地类信息提取模型训练、精度评估与信息提取;将步骤四中一级地类的最终样本以及Sentinel-2A影像数据,划分为训练样本和测试样本,并输入RF模型进行模型训练和开展基于总体精度和kappa系数的RF模型精度评估,将除训练样本和测试样本以外的其他待识别一级地类类型的渔网单元输入RF模型,提取一级地类信息,并进行空间可视化表达。
具体的,由于耕地、林地、草地、水域、建设用地和未利用地间的光谱和纹理特征差异较大,无需结合合多项AFs参与地类提取也能很好地区分,因此在一级地类信息提取中没有考虑AFs,也暂未考虑mtry和ntree的两个最优参数;一级地类信息提取精度是基于一级地类测试样本与RF模型分类结果的混淆矩阵计算总体精度和kappa系数来评价,总体精度和kappa系数在0.75以上就表明模型提取结果精度较高,其值越大,精度越高。
如图3所示,RF模型基本原理如下:
随机森林(RF)模型通过自助法(bootstrap)抽样技术,从原始训练样本集N中有放回地重复随机抽取n个样本生成新的训练样本集训练决策树,然后按以上步骤生成k棵决策树组成随机森林,新数据的分类结果按分类树投票多少形成的分数而定。公式如下:
f(x)=m_vote{hi(x)}(i=1,2,…,k)
式中,m_vote{}为投票函数,hi(x)为基于模型预测出的第i个样本对应的分类结果。
总体精度和kappa系数的计算原理如下:
若共有待分类的地类为A和B两类,A、B两类的测试样本总数为n,基于测试样本和模型提取结果组成的混淆矩阵为:
类别 | 模型识别为A | 模型识别为B |
实际为A | TP | FN |
实际为B | FP | TN |
注:A、B为两种不同地类;TP:实际为A,模型识别结果也为A的像元(渔网单元)数;FP:实际为B,模型识别结果为A的像元(渔网单元)数;FN:实际为A,模型识别结果为B的像元(渔网单元)数;TN:实际为B,识别结果也为B的像元(渔网单元)数。
kappa系数的计算公式如下:
步骤六,基于RF-AFs模型的二级林地提取模型训练与精度评估;在步骤五获取的一级地类的林地范围中进行进一步提取二级林地,将步骤四中的二级林地的最终样本进一步划分训练样本和测试样本,每个样本均包含了16项AFs值;将训练样本输入RF-AFs模型进行模型训练,形成16项AFs值与二级林地类型之间的联系,获取模型mtry(随机森林中用于构建决策树的变量个数)和ntree(随机森林中包含的决策树的数目)两个最佳参数,进一步将确定的mtry和ntree两个最优参数输入RF-AFs模型,获取最优的RF-AFs模型;将测试样本输入并运行获取的最优的RF-AFs模型,开展基于总体精度和kappa系数的最优RF-AFs模型的精度评估。
具体的,RF-AFs模型是在RStudio平台通过自主编程实现。在精确提取二级林地的过程中,不同的林地类型由于相似的光谱和纹理特征而难以区分。因此,必须同时考虑不同林地类型的重要解释特征,并进一步探索增加不同林地类型间差异性的其他辅助特征,全面提高林地的提取精度。因此,RF-AFs模型同样是基于RF模型的基本原理来开展的,二者的本质区别就在于RF模型在提取地类信息过程中没有考虑辅助因子AFs,而RF-AFs模型在提取地类信息过程中考虑了辅助因子AFs(图2)。在进行模型训练时,通过RF-AFs模型可建立16项AFs值与二级林地类型间的联系(即由16项AFs形成的二级林地分类规则)。由于训练集的随机性与节点分裂最优属性的两处随机性,这种联系极其复杂且是隐性的,自身蕴含在RF-AFs模型中。RF-AFs模型精度评估就是基于这种隐性联系(分类规则),运用测试样本来开展评估。具体步骤如下:
首先,将步骤四中的林地样本采用createDataPartition()函数划分为训练样本占比为a,测试样本占比为1-a的样本集合,R语言代码如下:
进一步地,将训练样本和测试样本输入RF-AFs模型,进行模型训练,寻求最佳的mtry和ntree参数。其中,mtry值以模型中平均OOB误差率最小值对应的mtry值来确定;ntree值以模型中不同类型的OOB误差率曲线的平稳性和可分性来确定。R语言代码如下:
进一步地,基于最优mtry值、ntree值和训练样本数据(trainset)构建最优的RF-AFs模型。将测试样本数据(testset)中的16项AFs数据(data1)输入RF-AFs模型进行林地类型识别。进一步将识别出的林地类型(rf.pred.label)与testset的实际林地类型(testset$TYPE)进行混淆矩阵判断,以总体精度和Kappa系数来估模型的精度。R语言代码如下:
步骤七,基于RF-AFs模型的二级林地信息精细化提取;将除训练样本和测试样本以外的其它待识别所属林地类型的渔网单元输入步骤六中已训练完毕的最优RF-AFs模型识别各个样本所属的林地类型,并进行空间制图与数据分析。
具体的,将除训练样本和测试样本以外的其他带待识别林地类型的渔网单元输入训练完毕的RF-AFs模型,精细化提取二级林地信息,R语言代码如下:
y<-predict(rf_train,data2)#data2为余下待识别林地类型的渔网单元;
进一步将精细化提取的林地类型在AcrGIS中进行空间可视化制图,并进行数据分析。
本发明的关键点和保护点为将遥感影像自身的光谱特征、纹理特征以及包括立地条件和植被指数在内的辅助因子联系在一起,通过R语言的自主编程技术构建一种基于随机森林和辅助因子的自上而下提取林地信息的RF-AFs模型,实现了林地信息尤其是特殊树种信息的精细化提取,为揭示林地的空间布局规律、调整林地结构、改善生态环境提供方法和技术支撑。
除上述技术方案外,本发明步骤一中的遥感数据源还可以是Landsat系列、SPOT系列、高分系列等其他卫星影像等。不同系列卫星获取的遥感影像存在不同的波段信息。在本发明的技术运用中,可选择不同系列的卫星影像,根据不同卫星影像的波段信息进行植被指数运算。
此外,步骤二中用于林地遥感信息的辅助因子(AFs)中的立地条件(SCs)还可以同时纳入土壤肥力、距道路距离、距河流距离等其他因子,植被指数(VIs)还可以同时纳入差值植被指数(Difference Vegetation Inde,DVI)、叶面积指数(leaf area index,LAI)、土壤调整植被指数(modified SAVI,MSAVI)等其他指数。可结合林地信息待提取区的特色,选取更适宜的立地条件因子和植被指数作为辅助因子开展林地信息精细化提取。
下面结合附图和具体实施例,以位于中国滇西南山地、生物多样性丰富、人工经济园林大规模种植的澜沧县为案例区,以澜沧县主要的人工经济园林信息精细化提取为例,进行实施方案的详细描述。该实施例仅用于说明本发明,而不应视为限制本发明的空间和时间范围。
如图1所示,基于随机森林和辅助因子的澜沧县2020年主要人工经济园林信息精细化提取方法,包括以下步骤一至步骤七:
步骤一,遥感影像数据预处理。
采用欧洲太空局开发的Sen2cor软件分别对下载的澜沧县2020年的Sentinel 2影像进行大气校正和辐射定标处理,并采用SNAP软件对处理后的影像进行波段融合操作,获取澜沧县多光谱(12个波段)和高分辨率(10m×10m)的Sentinel-2A影像。
步骤二,AFs测算。
基于ArcGIS平台,计算海拔、坡度、坡向、气温、降水、土壤类型和距居民点距离等立地条件(SCs),并进行空间可视化表达;基于步骤一所得的澜沧县Sentinel-2A影像及其波段信息,基于ENVI和ArcGIS平台计算RVI、NDVI、NDVIre、PVI、EVI、SAVI、TSAVI、RDVI和PSRI等植被指数(VIs),并进行空间可视化表达,明确SCs和VIs的空间分布及阈值范围,使之在Sentinel-2A影像中直接体现。
步骤三,创建渔网与分区统计。
基于步骤一所得澜沧县Sentinel-2A影像,采用ArcGIS中的创建渔网工具创建林地信息待提取区渔网,并赋予各个渔网单元唯一的编号属性。以渔网编号分别统计由步骤二计算的各项AFs值,作为RF-AFs模型的辅助因子信息。
步骤四,模型样本选择。
基于在澜沧县实地获取的野外样本点数据,结合其在Sentinel-2A遥感影像上的光谱特征和纹理特征,参照高分辨率的谷歌影像,以目视判读方式在Sentinel-2A遥感影像上选取大量与耕地、林地、草地、水域、建设用地和未利用地等一级地类样本和桉树、思茅松、橡胶、茶园、其他灌木和其他林地等二级林地样本相类似的样本作为最终样本,选择的样本信息如下:
步骤五,基于RF模型的一级地类信息提取模型训练、精度评估与信息提取。
基于步骤四中一级地类样本以及澜沧县的Sentinel-2A影像,在ENVI平台中训练和测试RF模型,提取耕地、林地、草地、水域、建设用地和未利用地等一级地类信息(图4),并基于一级地类测试样本与分类结果的混淆矩阵计算总体精度和kappa系数,进行精度评估。在该实施例的步骤五中,澜沧县一级地类信息提取模型的总体精度为0.9645,kappa系数为0.9531,表明一级地类信息提取模型精度非常高。将除训练样本和测试样本以外的其他待识别一级地类类型的渔网单元输入RF模型,提取一级地类信息。由图4可知,澜沧县澜沧县土地利用类型以林地为主,集中分布于南部地区;未利用地面积最小,邻近建设用地呈现零星分布。
步骤六,二级林地信息提取模型训练与精度评估。
基于步骤五获取的林地分布区,结合图2的RF-AFs模型原理,运用自主编程技术,采用createDataPartition()函数将步骤四中二级林地的最终样本按照训练样本和测试样本为3:1的比例划分训练和测试样本(即训练样本占二级林地样本的3/4,共7500个样本,测试样本占二级林地样本的1/4,共2500个样本,训练样本和测试样本中均包括了16项AFs值)。将训练样本输入RF-AFs模型进行模型训练,形成16项AFs和二级林地类型之间的联系(分类规则),并获取RF-AFs模型的最佳参数:mtry和ntree;进一步将最佳的mtry和ntree参数输入被训练完毕的RF-AFs模型,获取最优的RF-AFs模型。将测试样本输入并运行最优的RF-AFs模型,进行基于总体精度和kappa系数的最优RF-AFs模型精度评估。
首先,训练样本和测试样本划分。
其次,mtry和ntree参数寻优(结果为图5和图6)。
由此可得图5。由图5可知当mtry=13时,RF-AFs模型的平均OOB误差率(Mean OOBerror rate)取得最小值,因此最优mtry值为13。
由此可得图6,可知当ntree≥100时,RF-AFs模型中各二级林地的OOB误差率曲线趋于平滑,各二级林地能被很好的区分,因此最优ntree值为100。
进一步,将最优mtry值、ntree值与训练样本、测试样本一同输入由本步骤中R语言编写的RF-AFs模型,进行最优模型构建和运行,并进行精度评估。
通过实施例验证,RF-AFs模型对澜沧县林地信息提取的总体精度为0.96,kappa系数为0.9493,表明RF-AFs模型精度非常高,准确性十分可靠。实施例的混淆矩阵如下表所示:
总体精度=(481+485+245+56+83+750)/2500=0.96
kappa=((481+485+245+56+83+750)/2500-((481+1+0+2+0+0)×(481+4+0+0+0+15)+(4+485+1+5+7+0)×(1+485+0+0+0+14)+(0+0+245+0+4+0)×(0+1+245+1+0+3)+(0+0+1+356+3+0)×(2+5+0+356+1+11)+(0+0+0+1+83+0)×(0+7+4+3+83+0)+(15+14+3+11+0+750)×(0+0+0+0+0+750))/25002)/(1-((481+1+0+2+0+0)×(481+4+0+0+0+15)+(4+485+1+5+7+0)×(1+485+0+0+0+14)+(0+0+245+0+4+0)×(0+1+245+1+0+3)+(0+0+1+356+3+0)×(2+5+0+356+1+11)+(0+0+0+1+83+0)×(0+7+4+3+83+0)+(15+14+3+11+0+750)×(0+0+0+0+0+750))/25002)=0.9493。
步骤七,将除训练样本和测试样本以外的其他带待识别林地类型的渔网单元输入训练完毕最优的RF-AFs模型,精细化提取二级林地信息,并在AcrGIS中进行空间进行可视化表达,由此可得到澜沧县主要人工经济园林的空间分布图(图7)。由图7可知,思茅松是澜沧县最主要的人工经济园林,主要分布于研究区中部、西南部以及北部部分地区;茶园主要分布于研究区北部和南部地区;桉树作为引种树种在各个乡镇均有分散分布;橡胶林在人工经济园林中占比最小,主要分布在研究区的东部地区,且沿河谷分布的空间分布特征明显。
此外,为了突出RF-AFs模型在林地信息精细化提取中的优势,将步骤六中的训练样本和测试样本去除AFs属性后输入RF模型中进行模型训练和精度评估,随后将其它待识别所属林地类型的渔网单元输入已训练好的RF模型识别其所属的林地类型,并进行空间制图(图8)。
通过实施例验证,由前文的总体精度和kappa系数的计算公式可计算出未考虑AFs的RF模型对提取澜沧县林地信息的总体精度为0.8436,kappa系数为0.8024。比较而言,RF-AFs模型对林地信息提取的总体精度和kappa系数较未考虑AFs的RF模型的分别提升11.64%和14.69%,进一步证明基于RF-AFs模型的林地信息提取结果更为准确。基于未考虑AFs的RF模型的混淆矩阵如下表所示:
总体精度=(466+424+229+360+41+589)/2500=0.8436
kappa=((466+424+229+360+41+589)/2500-((466+4+2+0+9+64)×(466+6+2+0+1+25)+(6+424+1+4+35+85)×(4+424+0+4+2+66)+(2+0+229+2+8+7)×(2+1+229+7+3+8)+(0+4+7+360+3+1)×(0+4+2+360+2+7)+(1+2+3+2+41+4)×(9+32+8+3+41+32)+(25+66+8+7+32+589)×(64+85+7+1+4+589))/25002)/(1-((466+4+2+0+9+64)×(466+6+2+0+1+25)+(6+424+1+4+35+85)×(4+424+0+4+2+66)+(2+0+229+2+8+7)×(2+1+229+7+3+8)+(0+4+7+360+3+1)×(0+4+2+360+2+7)+(1+2+3+2+41+4)×(9+32+8+3+41+32)+(25+66+8+7+32+589)×(64+85+7+1+4+589))/25002)=0.8024。
本实施例中所有英文缩写术语如下:
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。上面对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以再不脱离本发明宗旨的前提下做出各种变化。
Claims (8)
1.一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:包括如下步骤:
步骤一,遥感影像数据预处理;通过卫星地图软件下载林地信息待提取区的哨兵2号Sentinel-2卫星影像,并对影像进行大气校正和辐射定标处理,随后进行波段融合操作,获取多光谱和高分辨率的Sentinel-2A影像及其波段信息;
步骤二,辅助因子AFs测算;辅助因子AFs包括立地条件和植被指数两类因子,共计16项因子,用于扩大二级林地间的差异性,以提高二级林地信息提取精度;首先,基于ArcGIS软件计算海拔、坡度、坡向、气温、降水、土壤类型和距居民点距离共7个立地条件因子SCs,并进行空间可视化表达,使之在Sentinel-2A影像中直接体现;基于步骤一所得Sentinel-2A影像及其波段信息,采用ENVI软件分别计算比值植被指数、归一化植被指数、归一化红边植被指数、垂直植被指数、增强植被指数、土壤调节植被指数、转换型土壤调节植被指数、再归一化植被指数和植被衰减指数共9个植被指数VIs,并进行空间可视化表达,明确SCs和VIs的空间分布及阈值范围,使之在Sentinel-2A影像中直接体现;
步骤三,创建渔网与分区统计;基于步骤一所得Sentinel-2A影像,运用ArcGIS软件创建渔网,并赋予各个渔网单元唯一的编号属性;以渔网编号分别统计由步骤二计算的16项AFs的值,使得Sentinel-2A影像对应的每个渔网编号获取其所属的AFs值,作为RF-AFs模型的辅助因子信息;
步骤四,模型样本选择;基于待提取的一级地类和二级林地类型,在野外为一级地类和二级林地类型选取相应的野外样本点;由于野外实地选取的样本数量有限,因此基于一级地类和二级林地类型的野外样本点在Sentinel-2A影像上的光谱和纹理特征,结合高分辨率的谷歌影像,以目视判读方式在Sentinel-2A影像上选取大量与野外实地选取一级地类和二级林地类型相近似的样本作为模型分类的最终样本;
步骤五,基于RF模型的一级地类提取模型训练、精度评估与信息提取;将步骤四中一级地类的最终样本以及Sentinel-2A影像数据,划分为训练样本和测试样本,并输入RF模型进行模型训练,开展基于总体精度和kappa系数的RF模型精度评估;将除训练样本和测试样本以外的其他待识别一级地类类型的渔网单元输入RF模型,提取一级地类信息,并进行空间可视化表达;
步骤六,基于RF-AFs模型的二级林地提取模型训练与精度评估;在步骤五获取的一级地类的林地范围中进行进一步提取二级林地,将步骤四中的二级林地的最终样本进一步划分训练样本和测试样本,每个样本均包含了16项AFs值;将训练样本输入RF-AFs模型进行模型训练,形成16项AFs值与二级林地类型之间的联系,获取模型mtry和ntree两个最佳参数,进一步将确定的mtry和ntree两个最优参数输入RF-AFs模型,获取最优的RF-AFs模型;将测试样本输入并运行获取的最优的RF-AFs模型,开展基于总体精度和kappa系数的最优RF-AFs模型的精度评估;
步骤七,基于RF-AFs模型的二级林地信息精细化提取;将除训练样本和测试样本以外的其它待识别所属林地类型的渔网单元输入步骤六中已训练完毕的最优RF-AFs模型识别各个样本所属的林地类型,并进行空间制图与数据分析。
2.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤一中,通过欧洲太空局开发的Sen2cor软件分别对遥感影像进行大气校正和辐射定标处理,并采用SNAP进行波段融合操作,获取多光谱和高分辨率的Sentinel-2A影像;其中,Sentinel-2A中的“A”是经过了大气校正和辐射定标处理以后影像的级别编号;大气校正是指为消除Sentinel-2影像中由大气和光照等因素对地物反射的造成的误差而进行的校正,以得到地物真实反射率;辐射定标是指将Sentinel-2影像的亮度灰度值转换为绝对辐射亮度。
3.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤二中,较传统的林地信息提取而言,本发明兼顾了SCs和VIs等重要的辅助因子,进一步扩大不同二级林地信息特征的差异性;海拔、坡度、坡向由林地信息待提取区的数字高程模型提取得到;降水和气温数据通过气象站点数据插值得到;距离居民点距离由ArcGIS的缓冲区分析得到;VIs由Sentinel-2A的各波段计算得到。
4.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤三中,以Sentinel-2A影像为基础,采用ArcGIS软件中的创建渔网工具,生成林地信息待提取区渔网,并赋予编号;进一步采用分区统计工具,统计各个渔网内海拔、坡度、坡向、气温、降水、土壤类型、距居民点距离、比值植被指数、归一化植被指数、归一化红边植被指数、垂直植被指数、增强植被指数、土壤调节植被指数、转换型土壤调节植被指数、再归一化植被指数和植被衰减指数共16项AFs的值。
5.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤四中,按照中科院土地利用/覆盖分类标准,一级地类包括耕地、林地、草地、水域、建设用地和未利用地6种类型;二级林地根据林地信息待提取区实际以及研究目的来确定;步骤四中提及的光谱特征反映了地物反射电磁波能量的大小,指由遥感影像中不同波段组合所呈现出的影像颜色、亮度等特征;纹理特征指不同地类在影像中呈现出地物的视觉粗糙度,体现了影像表面的具有缓慢变化或者周期性变化的表面结构组织排列属性和形状信息;用于提取二级林地的RF-AFs模型中,每一个林地样本都包含17项属性信息,分别是16项AFs和所属的林地类型;RF-AFs模型中除了林地样本以外的其他待识别林地类型的渔网单元,仅包括16项AFs;通过RF-AFs模型中多样性的辅助特征获取遥感影像更为丰富的信息,提高林地信息提取精度。
6.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤五中,由于耕地、林地、草地、水域、建设用地和未利用地间的光谱和纹理特征差异较大,无需结合合多项AFs参与地类提取也能很好地区分,因此在一级地类信息提取中没有考虑AFs,也暂未考虑mtry和ntree的两个最优参数;一级地类信息提取精度是基于一级地类测试样本与RF模型分类结果的混淆矩阵计算总体精度和kappa系数来评价,总体精度和kappa系数在0.75以上就表明模型提取结果精度较高,其值越大,精度越高。
7.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤六中,RF-AFs模型是在RStudio平台通过自主编程实现;在精确提取二级林地的过程中,不同的林地类型由于相似的光谱和纹理特征而难以区分;因此,必须同时考虑不同林地类型的重要解释特征,并进一步探索增加不同林地类型间差异性的其他辅助特征,全面提高林地的提取精度;因此,RF-AFs模型同样是基于RF模型的基本原理来开展的,二者的本质区别就在于RF模型在提取地类信息过程中没有考虑辅助因子AFs,而RF-AFs模型在提取地类信息过程中考虑了辅助因子AFs;在进行模型训练时,通过RF-AFs模型建立16项AFs值与二级林地类型间的联系;由于训练集的随机性与节点分裂最优属性的两处随机性,这种联系极其复杂且是隐性的,自身蕴含在RF-AFs模型中;RF-AFs模型精度评估就是基于这种隐性联系,运用测试样本来开展评估。
8.根据权利要求1所述的一种基于随机森林和辅助因子的林地信息精细化提取方法,其特征在于:步骤七中,将除训练样本和测试样本以外的其他带待识别林地类型的渔网单元输入训练完毕的RF-AFs模型,精细化提取二级林地信息,进一步将精细化林地类型在AcrGIS中进行空间可视化制图,并进行数据分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210886383.1A CN115115948B (zh) | 2022-07-26 | 2022-07-26 | 一种基于随机森林和辅助因子的林地信息精细化提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210886383.1A CN115115948B (zh) | 2022-07-26 | 2022-07-26 | 一种基于随机森林和辅助因子的林地信息精细化提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115115948A true CN115115948A (zh) | 2022-09-27 |
CN115115948B CN115115948B (zh) | 2024-03-29 |
Family
ID=83333999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210886383.1A Active CN115115948B (zh) | 2022-07-26 | 2022-07-26 | 一种基于随机森林和辅助因子的林地信息精细化提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115948B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116310366A (zh) * | 2023-02-21 | 2023-06-23 | 中国科学院地理科学与资源研究所 | 一种高山林线的自动化提取方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200225075A1 (en) * | 2019-01-14 | 2020-07-16 | Wuhan University | Method and system for optical and microwave synergistic retrieval of aboveground biomass |
AU2020101054A4 (en) * | 2020-06-19 | 2020-07-30 | Guizhou Institute Of Pratacultural | A Multi-source Remote Sensing Data Classification Method Based On the Classification Sample Points Extracted By the UAV |
CN112257531A (zh) * | 2020-10-13 | 2021-01-22 | 西安电子科技大学 | 基于多样性特征联合的林地变化遥感监测方法 |
CN113408468A (zh) * | 2021-07-01 | 2021-09-17 | 中国科学院东北地理与农业生态研究所 | 基于Sentinel卫星影像和随机森林算法的森林沼泽提取方法 |
CN114091613A (zh) * | 2021-11-26 | 2022-02-25 | 安徽师范大学 | 一种基于高分联合组网数据的森林生物量估算方法 |
-
2022
- 2022-07-26 CN CN202210886383.1A patent/CN115115948B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200225075A1 (en) * | 2019-01-14 | 2020-07-16 | Wuhan University | Method and system for optical and microwave synergistic retrieval of aboveground biomass |
AU2020101054A4 (en) * | 2020-06-19 | 2020-07-30 | Guizhou Institute Of Pratacultural | A Multi-source Remote Sensing Data Classification Method Based On the Classification Sample Points Extracted By the UAV |
CN112257531A (zh) * | 2020-10-13 | 2021-01-22 | 西安电子科技大学 | 基于多样性特征联合的林地变化遥感监测方法 |
CN113408468A (zh) * | 2021-07-01 | 2021-09-17 | 中国科学院东北地理与农业生态研究所 | 基于Sentinel卫星影像和随机森林算法的森林沼泽提取方法 |
CN114091613A (zh) * | 2021-11-26 | 2022-02-25 | 安徽师范大学 | 一种基于高分联合组网数据的森林生物量估算方法 |
Non-Patent Citations (3)
Title |
---|
任传帅;黄文江;叶回春;崔贝;: "利用高分二号数据提取香蕉林信息及精度分析", 遥感信息, no. 06, 15 December 2017 (2017-12-15) * |
任冲;鞠洪波;张怀清;黄建文;郑应选;: "多源数据林地类型的精细分类方法", 林业科学, no. 06, 15 June 2016 (2016-06-15) * |
杨振兴;文哲;张贵;周璀;卢海燕;: "基于Sentinel-2A数据的森林覆盖变化研究", 中南林业科技大学学报, no. 08, 31 December 2020 (2020-12-31) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116310366A (zh) * | 2023-02-21 | 2023-06-23 | 中国科学院地理科学与资源研究所 | 一种高山林线的自动化提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115115948B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111709379B (zh) | 基于遥感影像的丘陵区柑橘种植地块监测方法及系统 | |
CN111598045B (zh) | 一种基于对象图谱和混合光谱的遥感耕地变化检测方法 | |
Chubey et al. | Object-based analysis of Ikonos-2 imagery for extraction of forest inventory parameters | |
Duadze | Land use and land cover study of the savannah ecosystem in the Upper West Region (Ghana) using remote sensing | |
CN111445023B (zh) | 遗传算法优化的bp神经网络gf-2影像森林分类方法 | |
Rudke et al. | Land cover data of Upper Parana River Basin, South America, at high spatial resolution | |
Linhui et al. | Extracting the forest type from remote sensing images by random forest | |
CN116543316B (zh) | 一种利用多时相高分辨率卫星影像识别稻田内草皮的方法 | |
Ma et al. | Mapping vegetation across large geographic areas: integration of remote sensing and GIS to classify multisource data | |
Adam | Integration of remote sensing and GIS in studying vegetation trends and conditions in the gum Arabic belt in North Kordofan, Sudan | |
Herbei et al. | Processing and Use of Satellite Images in Order to Extract Useful Information in Precision Agriculture. | |
CN115965812B (zh) | 无人机影像对湿地植被物种和地物分类的评估方法 | |
Hirschmugl et al. | Review on the possibilities of mapping old-growth temperate forests by remote sensing in Europe | |
CN115115948B (zh) | 一种基于随机森林和辅助因子的林地信息精细化提取方法 | |
Yu et al. | Factors affecting spatial variation of classification uncertainty in an image object-based vegetation mapping | |
Nayyar et al. | Roughness classification utilizing remote sensing techniques for wind resource assessment | |
CN115830464A (zh) | 基于多源数据的高原山地农业大棚自动提取方法 | |
Ørka et al. | Large-area inventory of species composition using airborne laser scanning and hyperspectral data | |
van Niekerk et al. | THE APPLICATION OF NATIONAL SCALE REMOTELY SENSED EVAPOTRANSPIRATION (ET) ESTIMATES TO QUANTIFY WATER USE AND DIFFERENCES BETWEEN PLANTATIONS IN COMMERCIAL FORESTRY REGIONS OF SOUTH AFRICA | |
Shen | Multi-layer perceptron-markov chain based geospatial analysis of land use and land cover change: A case study of Stoney Creek Watershed, BC, Canada | |
An et al. | Research on feature selection method oriented to crop identification using remote sensing image classification | |
Feng et al. | Analysis of Cultivated Land in Maonan District, Maoming Based on RS and GIS | |
Minh et al. | ASSESSING WIND DAMAGE RISK IN COMPLEX TERRAIN USING AN AERODYNAMIC MODEL IN ACACIA HYBRID PLANTATIONS IN QUANG TRI, VIETNAM | |
CN118378960A (zh) | 一种天然林质量评价方法及系统 | |
Álvarez | Monitoring Land Cover Changes using Landsat Data and Maximum Likelihood Classification: A Case Study of Hanoi, Vietnam |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |