CN116879176A - 基于遥感技术区域生态环境监测和森林密度估测方法 - Google Patents
基于遥感技术区域生态环境监测和森林密度估测方法 Download PDFInfo
- Publication number
- CN116879176A CN116879176A CN202211514231.5A CN202211514231A CN116879176A CN 116879176 A CN116879176 A CN 116879176A CN 202211514231 A CN202211514231 A CN 202211514231A CN 116879176 A CN116879176 A CN 116879176A
- Authority
- CN
- China
- Prior art keywords
- forest
- remote sensing
- model
- density
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000005516 engineering process Methods 0.000 title claims abstract description 26
- 238000012544 monitoring process Methods 0.000 title claims abstract description 19
- 238000009826 distribution Methods 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000012937 correction Methods 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000005855 radiation Effects 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 claims description 9
- 238000002310 reflectometry Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000011835 investigation Methods 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 32
- 239000004973 liquid crystal related substance Substances 0.000 description 12
- 238000011160 research Methods 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- 238000002790 cross-validation Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 244000166124 Eucalyptus globulus Species 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 241000219495 Betulaceae Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000218691 Cupressaceae Species 0.000 description 2
- 244000305267 Quercus macrolepis Species 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 241000218645 Cedrus Species 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C17/00—Compasses; Devices for ascertaining true or magnetic north for navigation or surveying purposes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N2021/1793—Remote sensing
- G01N2021/1795—Atmospheric mapping of gases
Landscapes
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Image Processing (AREA)
Abstract
本发明公开了基于遥感技术区域生态环境监测和森林密度估测方法,所述估测方法包括以下步骤:S1:对估测区域森林设置若干样地,使用工具测量每个样地的综合数据→S2:基于遥感技术分析估测区域森林的空间分布特征;→S3:采集森林遥感影像后构建森林密度模型,构建森林密度模型包括模型变量提取、密度模型建模以及密度模型的输出。本发明估测方法基于遥感技术采集森林区域图像,并结合人工野外采集数据的方式采集森林数据,采集效率高,速度快,并对采集图像进行变量提取、建模处理,从而便于后期对该森林区域的密度以及其它数据进行调查,有利于降低成本,对指导森林经营具有重要意义。
Description
技术领域
本发明涉及遥感监测技术领域,具体涉及基于遥感技术区域生态环境监测和森林密度估测方法。
背景技术
森林是人类文明发展的依托,是人类进化生存的基础,森林作为至关重要的一部分在社会经济发展和资源的可持续利用中扮演着不可替代的角色,森林生态系统不仅可以从缓解气候变暖、水土保持、防风固沙、保证生物多样性等方面起到可持续发展的作用,森林生态系统还可以通过资源再生、维持美丽风景等方面满足人们的物质、文化、精神生活的要求;
森林作为生态系统中重要的组成部分,无论在分布范围、涵盖面积、组成成分、资源种类等都处于极高的价值地位,森林生态系统不仅在保持生物的多样性、涵养水源、碳源固持等生态方面发挥着重要作用,还能通过提供生物资源从而发挥经济价值,所以掌握森林的资源变化和消长情况极其重要。
专利号CN113553907A公开了一种基于遥感技术的森林生态环境状况评价方法,属于环境监测领域。本发明方法通过构建森林遥感生态指数指标体系及采用遥感生态指数法评价森林区域的生态环境状况:首先选取能代表森林生态环境状况的指标构建森林遥感生态指数指标体系;然后,参考已有各指标的反演模型建立适用于评价森林区域的反演模型,并通过归一化法消除各反演结果的量纲不一致性;最终通过空间主成分分析法得到评价森林区域的RSEI,并对森林的生态环境状况进行评价分析。本发明方法可以简单直观地得到森林区域的生态环境状况,具有一定的普适性,可为森林区域的保护、修复和管理提供科学依据和技术指导,利于推动区域尺度遥感生态指数普适性模型的发展。
现有的森林资源调查不仅数据更新需要大量时间,而且还会耗费大量的劳动力和财力,也不能对大范围的区域进行调查,存在调查数据困难,且成本高的缺陷。此外,森林密度是森林经营的关键数据,如何快速估算森林密度空间分布特征具有较大挑战。
发明内容
本发明的目的是提供基于遥感技术区域生态环境监测和森林密度估测方法,以解决背景技术中不足。
为了实现上述目的,本发明提供如下技术方案:基于遥感技术区域生态环境监测和森林密度估测方法,所述估测方法包括以下步骤:
S1:对估测区域森林划分若干样地,使用工具测量每个样地的综合数据;
S2:基于遥感技术分析估测区域森林的空间分布特征;
S3:采集森林遥感影像后构建森林密度模型,构建森林密度模型包括模型变量提取、密度模型建模以及密度模型的输出,其中,
S3.1:模型变量提取
遥感影像数据后得到光谱波段,根据每个观测点的坐标对遥感图像进行变量提取;
S3.2:密度模型建模
通过提取的模型变量,基于模型算法对森林密度建模;
S3.3:密度模型的输出
S4:对模型依次进行数据处理、参数设置以及变量筛选后输出森林密度模型。
优选的,步骤S1中,工具包括GPS导航定位、森林罗盘仪,样地数据包括坡度、坡向、经纬度、海拔以及每一样地中的乔木种类并对其进行编号。
优选的,基于遥感技术分析估测区域森林的空间分布特征后,对所需的遥感影像进行下载,选择满足要求最近月份的遥感影像进行后续预处理,处理后的遥感影像分辨率为30m。
优选的,所述遥感影像的采集方式包括Sentinel-2采集以及Landsat8采集。
优选的,所述Landsat8采集数据后预处理包括对获取的数据直接进行辐射定标和大气校正;
(1)辐射定标:使用ENVI软件中辐射校正中的辐射定标工具,选择多光谱数据,使用默认参数进行辐射定标;
(2)大气校正:大气校正使用辐射校正—大气校正模块—FLAASH大气校正工具。
优选的,所述模型变量提取中,通过ENVI软件和R-Studio软件根据每个观测点的坐标对遥感图像进行变量提取,变量包括波段反射率、植被指数、纹理特征;
波段反射率用于对遥感图像提取出所需要的波段;
植被指数用于利用Sentinel-2B遥感影像的波段进行计算,提取植被指数;
纹理特征用于通过灰度共生矩阵法描述纹理。
优选的,所述密度模型建模中,模型算法包括极端梯度提升算法,极端梯度提升算法包括xgboost函数、xgb.DMatrix函数、xgb.cv函数以及xgb.train函数。
优选的,所述密度模型的输出中,数据的预处理包括以下方法:
(1)使用read.csv函数将提取出的变量读入;
(2)使用data.matrix将自变量转化为矩阵;
(3)通过Matrix函数将sparse参数设置为TRUE,把自变量转化为稀疏矩阵;
(4)因变量转化为numeric;
(5)使用list函数将自变量和因变量拼接到同一个数据集中,完成数据处理。
优选的,密度模型的精度通过KFold方法验证,设K为10;每轮选择一个部分作为测试数据集,其余九个部分作为训练模型来预测目标值,对于观察的每个部分,进行十次后决定系数R2和均方根误差RMSE作为精准度评价标准,具体的计算公式为:
通过计算模型的决定系数R2和均方根误差RMSE衡量模型精度。
在上述技术方案中,本发明提供的技术效果和优点:
本发明估测方法基于遥感技术采集森林区域图像,并结合人工野外采集数据的方式采集森林数据,采集效率高,速度快,并对采集图像进行变量提取、建模处理,从而便于后期对该森林区域的密度以及其它数据进行调查,有利于降低成本,指导森林经营。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明的森林密度估测流程图。
图2为本发明森林空间分布的遥感图。
图3为森林密度空间分布特征。
图4为本发明Sentinel-2B-B1波段的纹理特征示意图。
图5为本发明中龙泉山森林公园的林分密度模型精度验证图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。
实施例1
请参阅图1所示,本实施例所述基于遥感技术区域生态环境监测和森林密度估测方法,所述估测方法包括以下步骤:
对估测区域森林划分若干样地,使用GPS导航定位、地质罗盘仪等工具测量每个样地的坡度、坡向、经纬度和海拔,记录每一样地中的乔木种类并对其进行编号,利用胸径尺、树高仪器等测量工具对其胸径、树高、枝下高等数据进行测定,将测得的数据进行整理,基于遥感技术分析估测区域森林的空间分布特征,对所需的遥感影像进行下载,选择满足要求最近月份的遥感影像进行后续预处理,将处理过后的遥感影像分辨率统一为30m。
采集森林遥感影像后,需要构建森林密度模型,构建森林密度模型包括模型变量提取、密度模型建模以及密度模型的输出,其中,
(1)模型变量提取:遥感影像数据后得到光谱波段,根据每个观测点的坐标对遥感图像进行变量提取;
(2)密度模型建模:通过提取的模型变量,基于模型算法对森林密度建模;
(3)密度模型的输出:对模型依次进行数据处理、参数设置以及变量筛选后输出森林密度模型。
使用ENVI软件对遥感影像数据进行辐射校准、大气校正、几何校正、裁剪等预处理后,获得所需的光谱波段,统一处理为30m分辨率,通过ENVI软件和R-Studio软件根据每个观测点的坐标对遥感图像进行变量提取,共提取176个变量,变量主要由三个部分组成,分别是波段反射率、植被指数、纹理特征。
本实施例中,遥感影像的采集方式主要包括Sentinel-2采集以及Landsat8采集;
其中,
Sentinel-2是欧洲航天局的多光谱卫星,旨在实现精细的空间分辨率全球监测;
Sentinel-2由两颗卫星组成:分为2A和2B两颗卫星,一颗卫星的重访周期为10天,两颗互补,重访周期为5天,两者相互配合对全球范围进行监测,仅需要5天就可以完成一个周期的数据获取;
Sentinel-2卫星通过携带的多光谱仪器(MSI),对13个光谱带进行监测,地面分辨率分别有10m、20m和60m,传感器波段参数如表1所示:
表1
Landsat8是美国国家航空航天局(NASA)与美国地质调查局(USGS)合作产生的项目;
Landsat8携带了两种传感器他们分别是陆地成像仪(OLI)和热红外传感器(STIR)两种传感器,其中,OLI传感器的波段如表2所示:
表2
由于遥感影像的采集方式包括Sentinel-2采集以及Landsat8采集,因此,两种采集方式中均需要进行数据预处理;
其中,
Landsat-8OLI数据预处理包括对获取的数据直接进行辐射定标、大气校正和大气裁剪,具体如下:
(1)辐射定标:使用ENVI软件中辐射校正中的辐射定标工具,选择多光谱数据,使用默认参数进行辐射定标。
(2)大气校正:大气校正主要使用辐射校正—大气校正模块—FLAASH大气校正工具;
首先要使用ENVI自带全球高程数据对高程进行计算,因为FLAASH大气校正需要影像区域的平均高程;
随后回到FLAASH工具,设置其他参数;
传感器类型设置为Landsat-8OLI,根据遥感影像获取的时间和所覆盖的范围,参考大气模型表3选择大气模型,确定大气模型为T,大气模型如表3所示:
表3
气溶胶模型根据研究区域的土地类型选择为Rural;其他参数按照默认设置,进行大气校正。
因为在Landsat-8遥感图像中,研究区域范围包含在一景影像中,所以不需要进行影像镶嵌,直接进行图像裁剪。
将森林区域范围的shp文件导入ENVI,并加载到视图中,然后在工具箱中选择ROI的子集数据工具,将研究区域范围的遥感影像截取出来,得到所需影像。
Sentinel-2B数据预处理包括对L1C级产品进行辐射定标和大气校正,Sentinel-2B数据的预处理跟Landsat-8OLI数据的预处理有所不同,随着数据的更新,近些年来下Sentinel-2遥感影像产品的等级达到了L1C级,即可以进行几何校正和地形校正,具体如下:
首先还是对L1C级产品进行辐射定标和大气校正,使用的处理软件为sen2cor,将Sen2Cor插件下载完成后,在电脑使用Win+R输入cmd,输入cd和插件的位置回车;
然后在窗口中输入L2A_Process.bat——help回车,输入L2A_Process+原始图像绝对路径(L1C产品位置)对数据进行处理;
最后得到L2A级产品,即为经过辐射定标和大气校正的产品处理后得到的遥感数据。
由于处理过后的遥感影像不满足在ENVI软件中打开的格式,所以使用SNAP软件进行格式的转换,具体为:打开SNAP软件,加载处理过后的遥感数据,然后使用重采样(resample)将分辨率统一到30m,然后进行格式转换,输出为ENVI格式。
请参阅图2所示,在ENVI软件中打开遥感数据,将单个波段合成为一幅影像,使用ENVI软件中光栅管理—图层堆叠工具进行合成;
然后使用图像镶嵌工具对两景影像进行镶嵌;
最后导入研究区域范围的shp文件,使用ROI的子集数据工具对研究范围进行裁剪,即可得到的处理过后的遥感图像。
实施例2
采集森林遥感影像后,需要构建森林密度模型,构建森林密度模型包括模型变量提取、密度模型建模以及密度模型的输出,其中,
(1)模型变量提取:遥感影像数据后得到光谱波段,根据每个观测点的坐标对遥感图像进行变量提取;
使用ENVI软件对遥感影像数据进行辐射校准、大气校正、几何校正、裁剪等预处理后,获得所需的光谱波段,统一处理为30m分辨率,通过ENVI软件和R-Studio软件根据每个观测点的坐标对遥感图像进行变量提取,共提取176个变量,变量主要由三个部分组成,分别是波段反射率、植被指数、纹理特征;
其中,波段反射率:将ENVI软件处理过后的遥感图像提取出所需要的波段,导出为TIF格式,在R软件中对照野外实测的地理坐标,对若干个样地点的波段反射率进行提取,于Sentinel-2B遥感影像中提取了11个波段,Landsat8OLI遥感影像中提取了7个波段,共计18个波段,具体提取波段如表4所示:
表4
植被指数:使用R软件利用Sentinel-2B遥感影像的7个波段进行计算,提取出14个植被指数,分别是归一化绿蓝差分指数(NGBDI)、归一化红外指数(NDII)、红边比值植被指数(MSR)、水分胁迫指数(MSI)、有效叶面积指数(SLAVI)、可见大气阻力指数(VARI)、转换型植被指数(TVI)、垂直植被指数(PVI)、归一化水指数(NDWI)、调整型土壤调节植被指数(MSAVI)、绿红波段比值指数(GRRI)、绿蓝波段比值指数(GBRI)、增强植被指数(EVI)以及差值植被指数(DVI)。
其中,
植被指数的定义及计算公式如表5所示:
表5
纹理特征:纹理是影像中大量规律性很强或很弱的相似元素或者图形结构,一般理解为影像灰度在空间上的变化和重复,或影像中反复出现的局部模式(纹理单元)和它们的排列规则;
每一种地物具有其特有的纹理结构,所以通过纹理特征既可以充分利用高光谱遥感影像信息,又可以解决“同物异谱”现象,提高分类精度。
纹理特征通过灰度共生矩阵法(GLCM)描述纹理,灰度共生矩阵法(GLCM)是通过研究灰度的空间相关特性来描述纹理,灰度共生矩阵提供了影像灰度方向、间隔和变化幅度的信息,但它并不能直接提供区别纹理的特性,因此需要在灰度共生矩阵的基础上提取用来定量描述纹理特征的统计属性。
Haralick定义了14种纹理特征,本实施例中提取了其中8个常见的纹理特征,包括均值(Mean)、方差(Variance)、同质性(Homogeneity)、对比度(Contrast)、非相似性(Dissimilarity)、嫡(Entropy)、角二阶矩(AngularSecondMoment)以及相关性(Correlation),纹理指数如表6所示:
表6
使用ENVI软件对Sentinel-2B遥感影像中的11个波段和Landsat8OLI遥感影像中的7个波段进行纹理指数的计算:使用的是GLCM方法(空间灰度共生矩阵),ENVI中的Co-occurrenceMeasures工具,设置处理的参数进行计算,其中,选取3×3的窗口,取位于中心像元右下45°像元,即x=1,y=1,灰度量化水平为64;
请参阅图4所示,分别得到每个波段8个纹理指数,其余波段也使用相同的方法得到纹理特征遥感影像。
(2)密度模型建模:通过提取的模型变量,基于模型算法对森林密度建模;
所述模型算法包括eXtremeGradientBoosting(极端梯度提升);
XGBoost是Chen和Guestrin在梯度提升决策树(GBDT)和随机森林(RF)的基础上提出的,并开发了C++版本,XGBoost是boosting算法中的一种,其核心思想是整合多个弱分类器(CART),形成—个强分类器;
它是对GBDT的改进,使其功能更强大,适用于更广泛的应用,因此,XGBoost因其高精度、可并行处理和可移植性而被广泛应用于各个领域,此外,该算法具有没有过拟合的优点,然而,由于参数众多,XGboost的参数调优过程非常复杂,eXtremeGradientBoosting算法的相关参数如表7所示:
表7
XGBoost算法主要包括xgboost函数、xgb.DMatrix函数、xgb.cv函数以及xgb.train函数;
其中,
1)xgboost函数
xgboost(data,label,max.depth,eta,nround,objective)函数:
创建xgboost模型的一个接口,可以使用更先进的xgb.train()函数接口。
data为dgCMatrix、本地文件或者xgb.DMatrix;
label为响应变量,如果为本地文件或xgb.DMatrix时不必设置此文件;
eta为每提高一步的时间步长;
max.depth为树的最大深度;
nround为最大迭代次数;
objective函数,reg:linear表示线性回归,binary:logistic表示分类的逻辑线性回归。
2)xgb.DMatrix函数
xgb.DMatrix(data,missing)函数:
构建xgb.dmatrix对象从稠密矩阵,稀疏矩阵或本地文件;
data为数据对象;
missing表示为稠密矩阵时,选择充当缺失值的数。
3)xgb.cv函数
xgboost包中的xgb.cv(data,label,max.depth,eta,nround,objective,nfold)函数:
创建xgboost模型的CrossValudation功能。
data为dgCMatrix、本地文件或者xgb.DMatrix;
label为响应变量,如果为本地文件或xgb.DMatrix时不必设置此文件;
eta为每提高一步的时间步长;
max.depth为树的最大深度;
nround为最大迭代次数;
objective函数,reg:linear表示线性回归,binary:logistic表示分类的逻辑线性回归;
nfold为原始数据集随机划分成大小相等的子样本nfold。
4)xgb.train函数
xgboost包中的xgb.train(param=list(),data,nrounds)函数:极限阶梯训练模型。param为参数列表;
data作为一个xgb.dmatrix作为输入;
nrounds表示迭代的最大次数。
(3)密度模型的输出:对模型依次进行数据处理、参数设置以及变量筛选后输出森林密度模型;
其中,
1)数据的预处理
首先使用read.csv函数将提取出的变量读入;使用data.matrix将自变量转化为矩阵;利用Matrix函数,将sparse参数设置为TRUE,把自变量转化为稀疏矩阵;将因变量转化为numeric;然后使用list函数将自变量和因变量拼接到同一个数据集中;因为构建模型需要xgb.DMatrix对象,且处理对象为稀疏矩阵,所以使用xgb.DMatrix函数将拼接的数据集转换为xgb.DMatrix对象。
2)模型参数的设置
使用list函数定义模型参数,具体的参数如下,
max_depth=1,eta=0.6,min_child_weight=4,objective='reg:squarederror,nround=150
3)变量的筛选
使用xgb.train函数选择处理过后的变量;然后使用xgb.importance函数选取重要性排序前10个变量参与建模,重要性大到小排序,所使用的参数预计含义如表8所示:
表8
4)建立模型
使用caret包中的train函数,指定具体的模型形式为xgbTree,使用筛选得到的相关变量进行建模。
实施例3
本实施例提出一种对上述实施例2中模型精度评价的方法,所述方法包括交叉验证;
通常我们将数据集分为两部分,即训练集和测试集,训练集数据是用于模型训练和开发,测试集是用于验证模型的性能,交叉验证是重复多次选取训练集,并将全部数据遍历验证的过程;
交叉验证方法对于模型的优化至关重要,通过选择合适的评判指标,我们就可以评价模型的精度,所述交叉验证包括KFold、StratifiedKFold、GroupKFold以及TimeSeriesSplit;
其中,
1)KFold:在这种K折交叉验证技术中,整个数据集被划分为K个相等大小的部分,每个分区称为一个“折叠”,因此,因为我们有K个部分,所以我们称之为K折叠,其中1折用作验证集,其余K-1折用作训练集,该技术重复K次,直到每个折叠用作验证集,其余折叠用作训练集,模型的最终精度是通过取k-models验证数据的平均精度来计算的,这种方法是最常见的交叉验证方法。
2)StratifiedKFold:KFold方法不适用于不平衡的数据集,所以StratifiedKFold交叉验证来解决这个问题,在分层k倍交叉验证中,数据集被划分为k个组或折叠,以使验证数据具有相等数量的目标类标签实例。这样可以确保在验证或训练数据中不会出现一个特定的类,尤其是在数据集不平衡的时候。
3)GroupKFold:是KFold一个变体,目的在于将group严格分开,以减少过拟合现象。
4)StratifiedGroupKFold:类似于GroupKFold和KFold的关系,StratifiedGroupKFold是GroupKFold专门处理分层问题而设计的。
5)TimeSeriesSplit:数据的顺序对于与时间序列相关的问题非常重要,对于与时间相关的数据集,将数据随机拆分或k倍拆分为训练和验证可能不会产生良好的结果,对于时间序列数据集,根据时间将数据分为训练和验证,也称为前向链接方法或滚动交叉验证。
综上所述,本实施例中,我们优选KFold方法验证模型的精度,将K选定为10,也就是十折交叉验证;
数据集分别为十个部分,每个部分包含相似数量的样本,在建模过程中,每轮选择一个部分作为测试数据集,其余九个部分作为训练模型来预测目标值,对于观察的每个部分,这样的过程进行了十次,以决定系数(R2)和均方根误差RMSE作为精准度评价标准,具体的计算公式如下:
请参阅图5所示,通过计算模型的决定系数(R2)和均方根误差(RMSE)来衡量模型的精度,模型精度评价值如表9所示:
表9
然后,利用所构建的模型,对所得到的结果进行了分析,得到相应的结果。
实施例4
上述实施例中的森林样地以龙泉山森林公园为样地,根据在R-Studio软件中获得的模型和相关的参数,具体的参数按重要性排序,林分密度估算值如表10所示:
表10
其中,在软件中进行出图,得到龙泉山森林公园林分密度空间分布特征,针对柏木、桤木、桉树、栎树这四种主要的乔木种类分别对其进行空间分布的特征分析。
森林的分布主要集中在研究范围的中部和南部,且林分密度较高,而北部由于人类活动丰富,森林的位置呈现破碎化分布,由于龙泉山脉的影响,龙泉山森林公园区域范围的海拔,以西南-东北走向为中心,呈现为中间高,进而向四周递减的变化情况,由于地形和海拔的影响,人类活动主要集中在研究区域的临界范围,从而导致了森林分布也以龙泉山脉为核心,进而向四周辐射递减的情况,并且林分密度也呈现为中心大,四周小的分布特点。
通过官方资料,得到龙泉山森林公园占地面积为134885.23公顷,通过R-Studio软件使用处理得到的模型,对龙泉山森林公园的森林和主要树种进行估算。
从上世纪七八十年代开始,龙泉山便开始了大规模人工造林活动,主要以柏木纯林为主。所以柏木分布范围最广,其占地面积达到了21776.056公顷,估算平均林分密度为1018株/公顷,林分密度的最大值为3789株/公顷。
可以看出柏木在龙泉山的中部和北部大范围分布,在南部主要集中在中心地带,呈现从东北到西南,从离散到聚集的分布格局。
桤木在研究区域内占地面积为791.34公顷,估算平均林分密度为833株/公顷,林分密度的最大值为3632株/公顷。桤木主要分布在研究区域的北部,以点状和零星状态为主,在其余区域也略有分布。
桉树具有生长快、产材多、经济效益好、固碳能力强等优点,但如果不合理的种植大面积的桉树纯林会导致发生一系列的生态问题。通过对林分密度的分析,经过合理的布局,可以有效解决这些问题。
桉树估算的平均林分密度为795株/公顷,林分密度的最大值为3838株/公顷。其占地面积为1946.62公顷。桉树主要分布在研究区域的东侧,集中分布在研究范围的双流区,也就是研究区域的西南方向。
栎树估算的平均林分密度为783株/公顷,林分密度的最大值为3868株/公顷,占地面积为3447.78公顷。主要分布在研究区域的中部偏北的位置,呈点状分布。
需要说明的是,在本文中,如若存在第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:所述估测方法包括以下步骤:
S1:对估测区域森林设置若干样地,使用工具测量每个样地的综合数据;
S2:基于遥感技术分析估测区域森林的空间分布特征;
S3:采集森林遥感影像后构建森林密度模型,构建森林密度模型包括模型变量提取、密度模型建模以及密度模型的输出,其中,
S3.1:模型变量提取
遥感影像数据后得到光谱波段,根据每个观测点的坐标对遥感图像进行变量提取;
S3.2:密度模型建模
通过提取的模型变量,基于模型算法对森林密度建模;
S3.3:密度模型的输出
S4:对模型依次进行数据处理、参数设置以及变量筛选后输出森林密度模型。
2.根据权利要求1所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:步骤S1中,工具包括GPS导航定位、地质罗盘仪,样地数据包括坡度、坡向、经纬度、海拔以及每一样地中的乔木种类并对其进行编号。
3.根据权利要求2所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:基于遥感技术分析估测区域森林的空间分布特征后,对所需的遥感影像进行下载,选择满足要求最近月份的遥感影像进行后续预处理,处理后的遥感影像分辨率为30m。
4.根据权利要求3所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:所述遥感影像的采集方式包括Sentinel-2采集以及Landsat8采集。
5.根据权利要求4所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:所述Landsat8采集数据后预处理包括对获取的数据直接进行辐射定标和大气校正;
(1)辐射定标:使用ENVI软件中辐射校正中的辐射定标工具,选择多光谱数据,使用默认参数进行辐射定标;
(2)大气校正:大气校正使用辐射校正—大气校正模块—FLAASH大气校正工具。
6.根据权利要求5所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:所述模型变量提取中,通过ENVI软件和R-Studio软件根据每个观测点的坐标对遥感图像进行变量提取,变量包括波段反射率、植被指数、纹理特征;
波段反射率用于对遥感图像提取出所需要的波段;
植被指数用于利用Sentinel-2B遥感影像的波段进行计算,提取植被指数;
纹理特征用于通过灰度共生矩阵法描述纹理。
7.根据权利要求6所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:所述密度模型建模中,模型算法包括极端梯度提升算法,极端梯度提升算法包括xgboost函数、xgb.DMatrix函数、xgb.cv函数以及xgb.train函数。
8.根据权利要求7所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:所述密度模型的输出中,数据的预处理包括以下方法:
(1)使用read.csv函数将提取出的变量读入;
(2)使用data.matrix将自变量转化为矩阵;
(3)通过Matrix函数将sparse参数设置为TRUE,把自变量转化为稀疏矩阵;
(4)因变量转化为numeric;
(5)使用list函数将自变量和因变量拼接到同一个数据集中,完成数据处理。
9.根据权利要求1-8任一项所述的基于遥感技术区域生态环境监测和森林密度估测方法,其特征在于:密度模型的精度通过KFold方法验证,设K为10;每轮选择一个部分作为测试数据集,其余九个部分作为训练模型来预测目标值,对于观察的每个部分,进行十次后决定系数R2和均方根误差RMSE作为精准度评价标准,具体的计算公式为:
通过计算模型的决定系数R2和均方根误差RMSE衡量模型精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211514231.5A CN116879176A (zh) | 2022-11-29 | 2022-11-29 | 基于遥感技术区域生态环境监测和森林密度估测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211514231.5A CN116879176A (zh) | 2022-11-29 | 2022-11-29 | 基于遥感技术区域生态环境监测和森林密度估测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116879176A true CN116879176A (zh) | 2023-10-13 |
Family
ID=88270390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211514231.5A Pending CN116879176A (zh) | 2022-11-29 | 2022-11-29 | 基于遥感技术区域生态环境监测和森林密度估测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116879176A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118037320A (zh) * | 2024-04-15 | 2024-05-14 | 南京大学 | 基于多源遥感数据的陆地生态系统碳密度估算方法 |
-
2022
- 2022-11-29 CN CN202211514231.5A patent/CN116879176A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118037320A (zh) * | 2024-04-15 | 2024-05-14 | 南京大学 | 基于多源遥感数据的陆地生态系统碳密度估算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108921885B (zh) | 一种综合三类数据源联合反演森林地上生物量的方法 | |
Sinha et al. | Estimation of leaf area index using PROSAIL based LUT inversion, MLRA-GPR and empirical models: Case study of tropical deciduous forest plantation, North India | |
CN114037911B (zh) | 一种顾及生态分区的大尺度森林高度遥感反演方法 | |
CN109212505B (zh) | 一种基于无人机多光谱高重叠度影像的森林林分特征反演方法 | |
Ford et al. | Global marine biogeochemical reanalyses assimilating two different sets of merged ocean colour products | |
Ali et al. | Machine learning methods’ performance in radiative transfer model inversion to retrieve plant traits from Sentinel-2 data of a mixed mountain forest | |
CN108876917A (zh) | 一种森林地上生物量遥感估测通用模型构建方法 | |
CN110378926B (zh) | 一种基于机载LiDAR和Sentinel-2A数据的地上植被生态水估算方法 | |
Li et al. | Estimating grassland aboveground biomass using multitemporal MODIS data in the West Songnen Plain, China | |
CN114460013B (zh) | 滨海湿地植被地上生物量gan模型自学习遥感反演方法 | |
He et al. | Using LiDAR data to measure the 3D green biomass of Beijing urban forest in China | |
Yu et al. | Forest leaf area index inversion based on landsat OLI data in the Shangri-La City | |
Xu et al. | A 21-year time series of global leaf chlorophyll content maps from MODIS imagery | |
CN115796344A (zh) | 一种区域尺度上森林植被碳储量的估算方法 | |
GB2620469A (en) | Spatial prediction and evaluation method of soil organic matter content based on partition algorithm | |
CN116879176A (zh) | 基于遥感技术区域生态环境监测和森林密度估测方法 | |
Yue et al. | Estimating fractional coverage of crop, crop residue, and bare soil using shortwave infrared angle index and Sentinel-2 MSI | |
CN117035174A (zh) | 一种木麻黄单木地上生物量的估算方法与系统 | |
CN116773516A (zh) | 一种基于遥感数据的土壤碳含量分析系统 | |
CN115830464A (zh) | 基于多源数据的高原山地农业大棚自动提取方法 | |
Gedminas et al. | Soil organic matter mapping using hyperspectral imagery and elevation data | |
Zhang et al. | Improving the retrieval of the biophysical parameters of vegetation canopies using the contribution index | |
Cai | Vegetation Observation in the Big Data Era: Sentinel-2 data for mapping the seasonality of land vegetation | |
Pan et al. | Feature extraction for urban vegetation stress identification using hyperspectral remote sensing | |
Kozoderov et al. | Evaluation of the species composition and the biological productivity of forests based on remote sensing data with high spatial and spectral resolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |