CN117075138A - 一种区域30米森林冠层高度遥感测算方法、系统及介质 - Google Patents

一种区域30米森林冠层高度遥感测算方法、系统及介质 Download PDF

Info

Publication number
CN117075138A
CN117075138A CN202311041744.3A CN202311041744A CN117075138A CN 117075138 A CN117075138 A CN 117075138A CN 202311041744 A CN202311041744 A CN 202311041744A CN 117075138 A CN117075138 A CN 117075138A
Authority
CN
China
Prior art keywords
forest
data
canopy height
canopy
height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311041744.3A
Other languages
English (en)
Inventor
王威
桑梦婷
金志立
何俊辰
王楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202311041744.3A priority Critical patent/CN117075138A/zh
Publication of CN117075138A publication Critical patent/CN117075138A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C5/00Measuring height; Measuring distances transverse to line of sight; Levelling between separated points; Surveyors' levels
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/86Combinations of lidar systems with systems other than lidar, radar or sonar, e.g. with direction finders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/48Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
    • G01S7/4802Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Electromagnetism (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种区域30米森林冠层高度遥感测算方法、系统及介质,涉及林业冠层高度估算技术领域。所述方法包括:获取目标区域的森林冠层高度数据和多源遥感因子;利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。本发明能够提高对于区域30米森林冠层的高度绘制精度。

Description

一种区域30米森林冠层高度遥感测算方法、系统及介质
技术领域
本发明涉及林业冠层高度估算技术领域,特别是涉及一种区域30米森林冠层高度遥感测算方法、系统及介质。
背景技术
森林作为陆地生态系统主体,在全球碳循环和气候变化中发挥着重要作用。其中,森林植被生物量占陆地植被生物量总量的80%,因而准确核算森林碳储量的空间分布格局及其动态变化是理解碳循环机制和核算森林碳汇的重要基础。估算森林植被碳储量主要通过计算森林地上生物量,地上生物量主要取决于树种、树高、覆盖度和胸径等林分参数。其中,树高作为森林地上生物量的关键指示因子,精确绘制大范围森林高度是区域森林碳储量估算的重要数据基础。
森林冠层高度指的是树冠顶端到地面之间的距离。目前,森林冠层高度的估测方法包括:实地清查方法、模型模拟方法和遥感测算方法。首先,传统样地测量法费时费力,同时会破坏森林植被,不具备大区域长时序监测的能力。其次,模型模拟方法建立在实地测量的基础上,基于冠层高度实测数据进行建模,进而减少测定冠层高度的外业工作。一旦模型建立,对于同种林分森林即可估计整片森林的冠层高度,而且估算结果有一定的精度保证。但是,由于各类林分冠层高度模型的建模体系及适用范围不同,其无法实现模型大区域、多场景的应用。
遥感技术已实现连续性大范围的对地观测,数据源丰富,弥补了传统实地测量法的不足,已被公认为大区域森林高度制图的有力手段。其中,被动光学遥感数据可较好反映森林冠层水平方向的二维信息,但无法直接获取冠层垂直结构信息且信号易饱和,尤其是影像易受云污染,其估算精度普遍较低。相比于被动遥感,微波遥感具有一定的冠层穿透能力,在提取森林垂直结构参数具有一定优势。合成孔径雷达技术探测森林高度具有一定的优势,但微波信号受地形起伏影响较大,尤其是面对高生物量问题,信号可能会出现严重的饱和现象。相较于上述遥感技术,激光雷达技术通过激光测距实现了对包括冠层高度在内的森林垂直结构的直接测量,具有广阔的应用前景。激光雷达主要通过发射激光束对地物表面进行密集采样,不受云雾影响,直接穿透森林冠层进而精确获取森林冠层的三维结构信息。根据按搭载平台不同,机载激光雷达与地面激光扫描仪可提供小范围高精度的森林激光数据,但成本高且空间范围覆盖有限。
目前,筛选激光数据中不可靠的光子片段有如下方法:(i)选择夜间;(ii)选择强光;(iii)排除高云置信度;(iv)排除高冠层不确定性;(v)排除分布稀疏的光子片段;(vi)设置合理的冠层高度范围;(vii)根据光子的地形高度与参考高度的差值判断是否为异常光子。然而使用以上传统的筛选方法所保留的光子仍存在较大的不确定性,对于改善森林冠层高度的估计精度相对有限。
发明内容
本发明的目的是提供一种区域30米森林冠层高度遥感测算方法、系统及介质,能够提高对于区域30米森林冠层的高度绘制精度。
为实现上述目的,本发明提供了如下方案:
一种区域30米森林冠层高度遥感测算方法,包括:
获取目标区域的森林冠层高度数据和多源遥感因子;
利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;
利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;
利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。
可选地,利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量,具体包括:
对所述森林冠层高度数据的采样点足迹进行二维平面展开,依次对每个采样点进行最近点搜索,并通过计算邻域平均高度差值对每个采样点进行判断,筛除异常点,得到筛选后的森林冠层高度数据;
去除所述多源遥感因子中云覆盖的像素,按照图像时间序列合成为中值图像,并将图像统一为30米空间分辨率,提取在统一分辨率下筛选后的森林冠层高度数据对应的预测变量。
可选地,利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型,具体包括:
将所述筛选后的森林冠层高度数据及对应的预测变量进行空间匹配,组合为建模数据;
利用bagging算法或bootstrap算法,根据所述建模数据构建决策树集合,通过在所述决策树集合中随机抽取样本对随机森林模型进行训练,并将训练好的随机森林模型确定为冠层高度反演模型。
可选地,利用bagging算法或bootstrap算法,根据所述建模数据构建决策树集合,通过在所述决策树集合中随机抽取样本对随机森林模型进行训练,并将训练好的随机森林模型确定为冠层高度反演模型,具体包括:
利用bagging算法或bootstrap算法,根据所述建模数据构建构建决策树集合的N个训练子集,对一个数量为n的测试集,有放回地抽样n次得到数量为n的训练集合;
随机选择特征,从样本的M个特征中随机选取出m个特征,满足条件m<<M,然后通过计算基尼指数从这m个特征中来选择1个作为节点的分裂特征;
构建N个决策树,在每棵决策树的形成过程中根据节点的分裂特征进行分裂,直至无法分裂为止,最终建立N个决策树,构成随机森林模型;
将所述决策树集合中未被抽到的样本数据输入随机森林模型进行训练,对模型叶子节点数目进行调整,并将训练好的随机森林模型确定为冠层高度反演模型。
可选地,利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制,具体包括:
对所述建模数据进行标准空间网格化处理,利用所述冠层高度反演模型对所述目标区域内每个像素点的冠层高度进行估算,得到预测数据,并根据所述预测数据进行绘制。
本发明提供了一种区域30米森林冠层高度遥感测算系统,包括:
采集模块,用于获取目标区域的森林冠层高度数据和多源遥感因子;
筛选模块,用于利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;
模型构建模块,用于利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;
高度绘制模块,用于利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。
本发明提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的区域30米森林冠层高度遥感测算方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开了一种区域30米森林冠层高度遥感测算方法、系统及介质,所述方法包括获取目标区域的森林冠层高度数据和多源遥感因子;利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。本发明能够提高对于区域30米森林冠层的高度绘制精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明区域30米森林冠层高度遥感测算方法的流程示意图;
图2为本实施例中局部噪声去除算法邻域搜索示意图;
图3为本实施例中ICESat-2/ATL08冠层参数去噪前后对比图;其中,(a)部分为去噪前的示意图;(b)部分为去噪后的示意图;
图4为本实施例中不同随机森林模型参数的误差变化图;
图5为本实施例中两种方法估算的冠层高度与ICESat-2冠层高度之间的散点图;其中,(a)部分为传统方法进行直接验证的结果示意图;(b)部分为本实施例方法进行直接验证的结果示意图;(c)部分为传统方法进行10折交叉验证的结果示意图;(d)部分为本实施例方法进行10折交叉验证的结果示意图;
图6为本实施例中模型预测的湖南省30米森林冠层高度空间分布图;
图7为本实施例中的产品与两种公开产品的像素级差值分布图;其中,(a)部分为本产品与第一种公开树高产品的像素级差值分布图;(b)部分为本产品与第二种公开树高产品的像素级差值分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种区域30米森林冠层高度遥感测算方法、系统及介质,能够提高对于区域30米森林冠层的高度绘制精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供了一种区域30米森林冠层高度遥感测算方法,包括:
步骤100:获取目标区域的森林冠层高度数据和多源遥感因子;
步骤200:利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;具体包括:
对所述森林冠层高度数据的采样点足迹进行二维平面展开,依次对每个采样点进行最近点搜索,并通过计算邻域平均高度差值对每个采样点进行判断,筛除异常点,得到筛选后的森林冠层高度数据;去除所述多源遥感因子中云覆盖的像素,按照图像时间序列合成为中值图像,并将图像统一为30米空间分辨率,提取在统一分辨率下筛选后的森林冠层高度数据对应的预测变量。
步骤300:利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;具体包括:
将所述筛选后的森林冠层高度数据及对应的预测变量进行空间匹配,组合为建模数据;利用bagging算法或bootstrap算法,根据所述建模数据构建决策树集合,通过在所述决策树集合中随机抽取样本对随机森林模型进行训练,并将训练好的随机森林模型确定为冠层高度反演模型。
其中,冠层高度反演模型的训练过程为:
利用bagging算法或bootstrap算法,根据所述建模数据构建构建决策树集合的N个训练子集,对一个数量为n的测试集,有放回地抽样n次得到数量为n的训练集合,每一个样本被抽到的概率使用以下公式计算:
随机选择特征,从样本的M个特征中随机选取出m个特征,满足条件m<<M,然后通过计算基尼指数从这m个特征中来选择1个作为节点的分裂特征;
构建N个决策树,在每棵决策树的形成过程中根据节点的分裂特征进行分裂,直至无法分裂为止,最终建立N个决策树,构成随机森林模型;
将所述决策树集合中未被抽到的样本数据输入随机森林模型进行训练,对模型叶子节点数目进行调整,并将训练好的随机森林模型确定为冠层高度反演模型。
步骤400:利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制;具体包括:
对所述建模数据进行标准空间网格化处理,利用所述冠层高度反演模型对所述目标区域内每个像素点的冠层高度进行估算,得到预测数据,并根据所述预测数据进行绘制。
在上述技术方案的基础上,提出如下具体实施例。
步骤1、下载并处理星载激光雷达冠层高度数据和多源遥感因子。
(1)下载位于实施例区域的星载激光雷达ICESat-2植被高度产品ATL08,使用一种局部噪声算法对冠层参数h_canopy进行质量筛选。
通过访问国家冰雪数据中心(NSIDC)下载了2019年4月至2021年9月之间的第五版ATL08产品,这里使用h_canopy作为高度反演指标,它代表能量返回过程中的98%相对高度。除此,为了保证数据的准确性,我们还提取了一系列指标,包括经度、纬度、最佳拟合地、地形不确定性、冠层不确定性、土地覆盖类别、日夜标识、云层置信以及飞行方向。根据实地调查结果,这里去除了树冠高度小于0米和大于60米的异常点,并排除了位于实施例区外的足迹。
将所有的ICESat-2高度足迹进行二维平面展开,依次对每个点实施最近点搜索(图2),通过计算邻域平均高度差值对每个点进行判断是否为异常点,具体的算法流程如下:
①以当前点o为中心,在给定最大范围dmax内,搜索其在二维平面中k个最近点,计算所有最近点与中心点的高度绝对差值的均值;
②当高差均值大于给定阈值(这里设置为邻域标准差)时,该点被视为噪声点,予以去除,否则保留为有效点。
由于坡度与冠层高度提取的误差存在一定的正相关性,这里最近点数目k由中心点坡度决定。该方法以5为初始点数,根据自身坡度大小正向划分增长点数,最终k不超过25。除此,这里阈值设为邻域所有点的高度标准差,当阈值越来越小时,该方式所保留的点数越少。图3给出了原始ATL08数据去噪前后的对比。
为了验证局部噪声去除方式的可行性,这里根据ATL08产品属性进行了质量筛选,这里称之为传统方法,包括:选择夜间强光数据;去除含云量>=2的点;去除冠层不确定性大于20的点;去除光子地形高度与参考DEM的绝对差值大于50的点。两种方法获取的所有点均参与后续的机器学习建模,以便于精度的直接对比。
(2)分析并收集森林冠层高度的预测变量,包括:地形因子、地表反射率、植被指数、植被覆盖度以及气候数据,将各数据进行合成处理并统一到30米空间分辨率。
通过访问Earthdata网站分别下载了2020年至2021年生长季节(6月~11月)的Landsat-8与Sentinel-2地表反射率产品,空间分辨率为30米,使用质量评估产品去除图像中的云,图像时间序列被合成为一幅中值影像。对于Landsat-8数据,预测变量包括5种光谱带的表面反射率:蓝波段(Blue)、绿波段(Green)、红波段(Red)、近红外波段(NIR)和中波红外波段(SWIR);6种植被指数:比值植被指数(RVI)、绿度指数(GLI)、归一化红绿指数(RGVI)、耐大气植被指数(ARVI)、归一化红外指数(NDII2)和优化土壤调节指数(MSAVI)。对于Sentinel-2数据,预测变量包括红边植被指数(NDVI58A、NDVI56和NDVI47)、红边叶绿素指数(RECI)和植物敏感反射指数(PSRI)。所有影像经过重新拼接合成,均存储在地理坐标中以便于后期的数据处理。
利用全球校正SRTM数字地面高程产品获取了实施例区的高程数据,空间分辨率约为0.00023弧度,根据33网格单元计算区域的坡度。
利用MODIS传感器的两种植被产品:一是植被连续场(VCF)产品,空间分辨率约为250米,根据提供的数据质量指数(值>2)进而排除有云覆盖的像素;二是叶面积指数(LAI)产品,空间分辨率约为500米,同理也去除了云覆盖的像素。
利用WorldClim全球气候数据库选择了年平均温度(AMT)、温度季节性(TQ)、降水季节性(PQ)、最热季度降水量(PHQ)和最冷季度降水量(PCQ)作为气候预测变量,其空间分辨率约为1千米。
利用GLC_FCS30全球土地覆盖产品获取全球陆地区域近30种精细覆盖分类信息,空间分辨率约为30米,其中包括不同的森林类型。
所有的ICESat-2/ATL08星下点数据、地形数据、地表反射率、植被指数以及气候数据统一投影至通用横轴墨卡托(UTM)系统,重新划分到0.00027弧度×0.00027弧度(30米分辨率)的网格内便于后续的建模处理。
步骤2、将森林冠层高度与预测变量进行空间匹配并组成建模数据集,使用随机森林算法对匹配数据集进行建模,通过10折交叉验证实现模型精度评估。
将森林高度作为响应变量,将所有数据划分训练集和验证集,使用随机森林算法训练样本并构建回归模型。随机森林模型构建的流程如下:
随机森林是一种以决策树为基学习器的集成学习算法,使用bagging或bootstrap算法构建N个决策树集合,通过随机抽取样本进而训练N个独立的决策模型,最后输出模型平均的投票结果,具体流程如下:
(1)构建N个训练子集,对一个数量为n的测试集,有放回地抽样n次得到数量为n的训练集合,每一个样本被抽到的概率使用以下公式计算:
对于每一颗子树而言,当样本数足够大时,每个元素被选到的概率约为0.6,这部分没有被选中作为训练集的数据称之为袋外数据。
(2)随机选择特征,从样本的M个特征中随机选取出m个特征,满足条件m<<M,然后通过计算基尼(Gini)指数从这m个特征中来选择1个作为该节点的分裂特征。
对于分裂过程中如何选择最佳待切分特征,首先,遍历数据集对应特征的所有特征值,计算按该特征值进行数据集二分时的误差;然后,选择使得切分后的两个子集的误差最小的特征及其相应值作为最佳切分特征值;子集误差用基尼指数表示,基尼指数表示一个随机选中的样本被分错的概率,基尼指数越大,说明分错概率越大,计算公式如下:
其中,pk表示选中的样本属于k类别的概率;
对数据集进行切分,按照最佳切分特征将数据集切分为左右子树,特征的值大于最佳切分特征的值则属于左子树,反之属于右子树,获取左右子节点,若不能继续切分,则作为叶子节点;
(3)构建N个决策树,在每棵决策树的形成过程中每个节点严格按照步骤(2)进行分裂,直至无法分裂为止,最终建立N个决策树,构成随机森林。
(4)基于随机森林的预测,将袋外样本输入回归模型,获取其特征值,并计算袋外误差,可作为模型预测的准确率。
在模型构建过程中,需要确定两个模型超参数:一是树(基学习器)的数量;二是树中叶子节点包含预测值的数量。我们使用了原始数据进行测试,设置叶子节点从1至50,分析当树数量依次增长时模型累计均方误差的变化。为了防止结果受到干扰,测试过程循环了100次。图4显示了最终的调试结果,当生长树数目大于100时,模型泛化误差趋于稳定,这里最佳叶子节点数被选为5。
除了统计模型训练完成后的直接拟合结果,还采用了基于样本序列的十折交叉验证方式对模型进行验证,这样能避免模型中潜在的过拟合问题。将训练集随机分为10份,选择其中一份作为验证集,剩下9份作为训练集,循环10次从而遍历所有数据,计算平均的性能指标。我们分别使用决定系数R2,均方根误差RMSE以及平均绝对误差MAE对最终的模型精度进行评估,以下是3个统计指标的公式。
决定系数R2表示预测值对于真实值的解释程度,可用于衡量模型预测能力好坏的标准。
均方根误差RMSE反映预测值与真实值之间的拟合程度,对异常值特别敏感。
平均绝对误差MAE用来表示预测值与真实值之间的差距,更好地反映预测值误差的实际情况。
平均绝对误差MAE用来表示预测值与真实值之间的差距,更好地反映预测值误差的实际情况。
其中,hi为高度观察值,为高度预测值,/>为高度观察的平均值,n为样本数量。
使用上述精度指标对模型的精度进行验证,得到的结果如图5所示。直接拟合结果:R2=0.94,RMSE=1.31米,MAE=1.04米,基于样本序列的十折交叉验证结果:R2=0.55,RMSE=3.09米,MAE=2.44米。从验证结果可以看出,相较于传统模型,本实施例模型对于原始数据估计的无偏性更好,R2从0.36增加至0.55,RMSE从6.28米减少至3.09米,MAE从4.63米减少至2.44米,整体精度提升一倍左右。因此,本实施例可以有效避免了不可靠光子的干扰,提高模型估算能力,可以用来进行面域的森林冠层高度反演。
步骤3、利用搭建好的冠层高度反演模型进行估算,从而实现区域30米森林冠层高度的精确绘制。
星载激光雷达由于离散采样特性(图3),所提供的冠层高度产品均呈现条带式分布,无法实现对冠层高度面域上的持续观测。融合空间连续的遥感影像(包括多光谱数据、地形数据以及其他数据等),结合星载激光雷达森林高度产品,使用机器学习方法建立预测模型,已经成为大范围连续绘制植被高度的主要方法。本实施例融合多源遥感数据和离散的星载激光雷达冠层数据,利用建立好的随机森林回归模型,对森林区域内每个像素点的冠层高度进行估算,最终成功实现了湖南省30米分辨率的森林冠层高度的精确绘制(图6)。总体上,湖南省森林冠层高度在2.53至22.79米之间,平均值为15.74米,标准偏差为1.36米。
为了分析本实施例的森林冠层高度数据集,通过与两种现有冠层高度数据进行区域精度对比,分析所获取的数据集与其他高度产品的像素级差异。从图7可见,本实施例产品与两个参考高度产品在像素级别上的平均差值分别为3.31米和2.40米,平均绝对误差分别为4.17米和4.11米左右,误差的标准差为3.73米和4.43米。除此,与两个产品的像素级相关性分别为0.59和0.35,说明了本产品与参考数据集具有较为良好的匹配性。总之,使用一种联合局部噪声去除和随机森林方法生成的湖南省森林高度产品精度较为可靠,具有精细的分辨率。因此,本实施例可以实现高分辨率的、空间连续的区域森林冠层高度的精确绘制。
此外,本发明提供了一种区域30米森林冠层高度遥感测算系统,包括:
采集模块,用于获取目标区域的森林冠层高度数据和多源遥感因子;
筛选模块,用于利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;
模型构建模块,用于利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;
高度绘制模块,用于利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。
本发明提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的区域30米森林冠层高度遥感测算方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种区域30米森林冠层高度遥感测算方法,其特征在于,包括:
获取目标区域的森林冠层高度数据和多源遥感因子;
利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;
利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;
利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。
2.根据权利要求1所述的区域30米森林冠层高度遥感测算方法,其特征在于,利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量,具体包括:
对所述森林冠层高度数据的采样点足迹进行二维平面展开,依次对每个采样点进行最近点搜索,并通过计算邻域平均高度差值对每个采样点进行判断,筛除异常点,得到筛选后的森林冠层高度数据;
去除所述多源遥感因子中云覆盖的像素,按照图像时间序列合成为中值图像,并将图像统一为30米空间分辨率,提取在统一分辨率下筛选后的森林冠层高度数据对应的预测变量。
3.根据权利要求1所述的区域30米森林冠层高度遥感测算方法,其特征在于,利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型,具体包括:
将所述筛选后的森林冠层高度数据及对应的预测变量进行空间匹配,组合为建模数据;
利用bagging算法或bootstrap算法,根据所述建模数据构建决策树集合,通过在所述决策树集合中随机抽取样本对随机森林模型进行训练,并将训练好的随机森林模型确定为冠层高度反演模型。
4.根据权利要求3所述的区域30米森林冠层高度遥感测算方法,其特征在于,利用bagging算法或bootstrap算法,根据所述建模数据构建决策树集合,通过在所述决策树集合中随机抽取样本对随机森林模型进行训练,并将训练好的随机森林模型确定为冠层高度反演模型,具体包括:
利用bagging算法或bootstrap算法,根据所述建模数据构建构建决策树集合的N个训练子集,对一个数量为n的测试集,有放回地抽样n次得到数量为n的训练集合;
随机选择特征,从样本的M个特征中随机选取出m个特征,满足条件m<<M,然后通过计算基尼指数从这m个特征中来选择1个作为节点的分裂特征;
构建N个决策树,在每棵决策树的形成过程中根据节点的分裂特征进行分裂,直至无法分裂为止,最终建立N个决策树,构成随机森林模型;
将所述决策树集合中未被抽到的样本数据输入随机森林模型进行训练,对模型叶子节点数目进行调整,并将训练好的随机森林模型确定为冠层高度反演模型。
5.根据权利要求3所述的区域30米森林冠层高度遥感测算方法,其特征在于,利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制,具体包括:
对所述建模数据进行标准空间网格化处理,利用所述冠层高度反演模型对所述目标区域内每个像素点的冠层高度进行估算,得到预测数据,并根据所述预测数据进行绘制。
6.一种区域30米森林冠层高度遥感测算系统,其特征在于,包括:
采集模块,用于获取目标区域的森林冠层高度数据和多源遥感因子;
筛选模块,用于利用局部噪声算法,对所述森林冠层高度数据进行筛选,并根据所述多源遥感因子确定筛选后的森林冠层高度数据对应的预测变量;所述预测变量包括地形因子、地表反射率、植被指数、植被覆盖度和气候数据;
模型构建模块,用于利用随机森林算法,对所述筛选后的森林冠层高度数据及对应的预测变量进行建模,得到冠层高度反演模型;
高度绘制模块,用于利用所述冠层高度反演模型进行区域30米森林冠层高度的估算,并根据估算后的预测数据进行绘制。
7.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中所述的区域30米森林冠层高度遥感测算方法。
CN202311041744.3A 2023-08-18 2023-08-18 一种区域30米森林冠层高度遥感测算方法、系统及介质 Pending CN117075138A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311041744.3A CN117075138A (zh) 2023-08-18 2023-08-18 一种区域30米森林冠层高度遥感测算方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311041744.3A CN117075138A (zh) 2023-08-18 2023-08-18 一种区域30米森林冠层高度遥感测算方法、系统及介质

Publications (1)

Publication Number Publication Date
CN117075138A true CN117075138A (zh) 2023-11-17

Family

ID=88711011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311041744.3A Pending CN117075138A (zh) 2023-08-18 2023-08-18 一种区域30米森林冠层高度遥感测算方法、系统及介质

Country Status (1)

Country Link
CN (1) CN117075138A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117520733A (zh) * 2024-01-05 2024-02-06 云南师范大学 森林冠层高度与地理环境协变量关系确定方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117520733A (zh) * 2024-01-05 2024-02-06 云南师范大学 森林冠层高度与地理环境协变量关系确定方法及系统
CN117520733B (zh) * 2024-01-05 2024-03-19 云南师范大学 森林冠层高度与地理环境协变量关系确定方法及系统

Similar Documents

Publication Publication Date Title
Bastin et al. Aboveground biomass mapping of African forest mosaics using canopy texture analysis: toward a regional approach
Avitabile et al. Capabilities and limitations of Landsat and land cover data for aboveground woody biomass estimation of Uganda
Derwin et al. Estimating tree canopy cover using harmonic regression coefficients derived from multitemporal Landsat data
CN114220022A (zh) 一种基于卫星与无人机协同观测的水稻倒伏遥感监测方法
CN117075138A (zh) 一种区域30米森林冠层高度遥感测算方法、系统及介质
Kan et al. Snow Cover Mapping for Mountainous Areas by Fusion of MODIS L1B and Geographic Data Based on Stacked Denoising Auto-Encoders.
CN116912690A (zh) 一种基于数据融合的森林叶面积指数反演获取方法和系统
Lou et al. An effective method for canopy chlorophyll content estimation of marsh vegetation based on multiscale remote sensing data
CN113534083B (zh) 基于sar的玉米留茬方式识别方法、装置和介质
Zhu et al. High-precision sugarcane yield prediction by integrating 10-m Sentinel-1 VOD and Sentinel-2 GRVI indexes
Huang et al. Monitoring forest dynamics with multi-scale and time series imagery
CN115830464A (zh) 基于多源数据的高原山地农业大棚自动提取方法
Zhou et al. Comparison of object-oriented and Maximum Likelihood Classification of land use in Karst area
Cui et al. AGTML: A novel approach to land cover classification by integrating automatic generation of training samples and machine learning algorithms on Google Earth Engine
CN114611699A (zh) 土壤水分降尺度方法、装置、电子设备及存储介质
Liping et al. Image classification based on the linear unmixing and GEOBIA
Khunrattanasiri Application of Remote Sensing Vegetation Indices for Forest Cover Assessments
Guo et al. Estimating aboveground biomass of alpine grassland during the wilting period using in situ hyperspectral, Sentinel-2 and Sentinel-1 data
Wang et al. Generalized fine-resolution FPAR estimation using Google Earth Engine: Random forest or multiple linear regression
Kukkonen et al. Volumes by tree species can be predicted using photogrammetric UAS data, Sentinel-2 images and prior field measurements
Liu et al. Comparison of three modeling methods for estimating forest biomass using TM, GLAS and field measurement data
Luo et al. Evaluation of machine learning-based urban surface mapping using a new moderate-resolution satellite imagery dataset
Dong et al. Forest aboveground biomass estimation using GEDI and earth observation data through attention-based deep learning
Seong et al. Crop classification in South Korea for multitemporal PlanetScope imagery using SFC-DenseNet-AM
Zhu et al. Mapping fractional cropland covers in Brazil through integrating LSMA and SDI techniques applied to MODIS imagery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination