CN113378785A - 森林类型识别方法及装置 - Google Patents

森林类型识别方法及装置 Download PDF

Info

Publication number
CN113378785A
CN113378785A CN202110754983.8A CN202110754983A CN113378785A CN 113378785 A CN113378785 A CN 113378785A CN 202110754983 A CN202110754983 A CN 202110754983A CN 113378785 A CN113378785 A CN 113378785A
Authority
CN
China
Prior art keywords
remote sensing
identified
area
target
sensing data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110754983.8A
Other languages
English (en)
Inventor
李煜
刘俊蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meihang Remote Sensing Information Co ltd
Aerial Photogrammetry and Remote Sensing Co Ltd
Original Assignee
Meihang Remote Sensing Information Co ltd
Aerial Photogrammetry and Remote Sensing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meihang Remote Sensing Information Co ltd, Aerial Photogrammetry and Remote Sensing Co Ltd filed Critical Meihang Remote Sensing Information Co ltd
Priority to CN202110754983.8A priority Critical patent/CN113378785A/zh
Publication of CN113378785A publication Critical patent/CN113378785A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种森林类型识别方法及装置,涉及森林类型分类识别技术领域。该方法包括以下步骤:获取待识别区域的标识以及待识别区域对应的目标时间区间,从云平台获取待识别区域在目标时间区间的目标遥感数据,使用随机森林模型,对目标遥感数据进行分析处理,得到待识别区域的森林类型。通过上述步骤,可以实现通过从云平台获取待识别区域的目标遥感数据,对待识别区域的森林类型进行识别,从而解决现有技术中在采用单机软件应用机器学习算法,利用遥感数据对大区域森林的类型进行识别时,存在大量遥感数据预处理、机器学习算法运行分类速度较慢以及TB级别遥感影像数据存储成本高的问题。

Description

森林类型识别方法及装置
技术领域
本申请涉及森林类型分类识别技术领域,具体而言,涉及一种森林类型识别方法及装置。
背景技术
对森林类型进行分类识别是森林资源管理和监测的重要内容。而遥感技术作为一种先进的对地观测手段,为森林类型的识别提供了一个新思路。遥感数据凭借其覆盖范围广、时效性强、成本低、可重复获取等优势已经被大量应用于林业资源调查。
现有技术中,可以使用单机软件应用机器学习算法,利用遥感数据进行森林类型识别。但是,使用现有技术的方法在进行森林,尤其是大区域森林的类型识别时,存在大量遥感数据预处理、机器学习算法运行分类速度较慢以及太字节(Terabyte,TB)级别遥感影像数据存储成本高等问题。
发明内容
有鉴于此,本申请的目的在于,针对上述现有技术中的不足,提供一种森林类型分类方法及装置,以解决现有技术中在对大区域森林进行类型识别的时候,存在大量遥感数据预处理、机器学习算法运行分类速度较慢以及TB级别遥感影像数据存储成本高的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种森林类型识别方法,包括以下步骤:
获取待识别区域的标识以及所述待识别区域对应的目标时间区间;
从云平台获取所述待识别区域在所述目标时间区间的目标遥感数据;
使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
作为一种可能的实现方式,所述使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型之后,还包括:
使用混淆矩阵,对所述待识别区域的森林类型进行准确度分析,得到所述森林类型的准确度。
作为一种可能的实现方式,所述从云平台获取所述待识别区域在所述目标时间区间的目标遥感数据,包括:
向所述云平台发送所述待识别区域的标识以及所述目标时间区间;
接收所述云平台返回的所述待识别区域在所述目标时间区间的目标遥感数据。
作为一种可能的实现方式,所述待识别区域在所述目标时间区间的目标遥感数据为所述云平台对所述待识别区域在所述目标时间区间的原始遥感数据进行预处理之后的数据。
作为一种可能的实现方式,所述使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型,包括:
构建所述目标遥感数据的特征空间,所述特征空间中包括所述目标遥感数据的至少一种特征因子;
从所述特征空间中筛选出至少一种目标特征因子;
以所述目标特征因子为所述随机森林模型的输入数据,使用所述随机森林模型对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
作为一种可能的实现方式,所述从所述特征空间中筛选出至少一种目标特征因子,包括:
以所述特征空间中的各特征因子作为输入数据,进行随机森林模型运算,得到各特征因子的贡献得分;
根据各特征因子的贡献得分,从所述特征空间中筛选出所述至少一种目标特征因子。
作为一种可能的实现方式,所述以所述目标特征因子为所述随机森林模型的输入数据,使用所述随机森林模型对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型之前,包括:
使用预设的森林区域样本以及各样本对应的特征因子训练得到所述随机森林模型。
第二方面,本申请实施例提供了一种森林类型识别装置,包括:
第一获取模块,用于获取待识别区域的标识以及所述待识别区域对应的目标时间区间;
第二获取模块,用于从云平台获取所述待识别区域在所述目标时间区间的目标遥感数据;
处理模块,用于使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
作为一种可能的实现方式,所述第二获取模块,具体用于:
向所述云平台发送所述待识别区域的标识以及所述目标时间区间;接收所述云平台返回的所述待识别区域在所述目标时间区间的目标遥感数据。
作为一种可能的实现方式,所述处理模块,具体用于:
构建所述目标遥感数据的特征空间,所述特征空间中包括所述目标遥感数据的至少一种特征因子;从所述特征空间中筛选出至少一种目标特征因子;以所述目标特征因子为所述随机森林模型的输入数据,使用所述随机森林模型对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
作为一种可能的实现方式,所述处理模块,具体还用于:
以所述特征空间中的各特征因子作为输入数据,进行随机森林模型运算,得到各特征因子的贡献得分;根据各特征因子的贡献得分,从所述特征空间中筛选出所述至少一种目标特征因子。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如上述第一方面所述的森林类型识别方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面所述的森林类型识别方法的步骤。
本申请的有益效果是:
本申请实施例提供的森林类型识别方法及装置,获取待识别区域的标识以及待识别区域对应的目标时间区间,从云平台获取待识别区域在目标时间区间的目标遥感数据,使用随机森林模型,对该目标遥感数据进行分析处理,即可识别出待识别区域的森林类型。通过上述步骤,可以实现通过从云平台获取待识别区域的目标遥感数据,对待识别区域的森林类型进行识别,从而解决现有技术中在采用单机软件应用机器学习算法,利用遥感数据对大区域森林的类型进行识别时,存在大量遥感数据预处理、机器学习算法运行分类速度较慢以及TB级别遥感影像数据存储成本高的问题,而且,通过该森林类型识别方法,能够快速准确地进行研究区域森林类型的分类识别,为森林资源调查提供了一种快速准确地工作方法,能够节省大量人力物力,提高森林资源空间分布信息调查的效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种电子设备的结构示意图;
图2为本申请实施例提供的一种森林类型识别方法的流程示意图;
图3为本申请实施例提供的又一种森林类型识别方法的流程示意图;
图4为本申请实施例提供的又一种森林类型识别方法的流程示意图;
图5为本申请实施例提供的森林类型识别过程的流程示意图;
图6为采用本申请实施例提供的森林类型识别方法所得到的一种分类结果示意图;
图7为本申请实施例提供的一种森林类型识别装置的模块结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“森林类型识别”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕对在线课堂交互这一场景进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
下面对本申请实施例提供的森林类型识别方法,进行详细的阐述。
请参考图1,是本申请实施例提供的一种电子设备100的结构示意图,包括处理器101、存储器102和总线103。处理器101与存储器102之间通过总线103电性连接,以实现数据的传输或交互。
具体的,处理器101可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等,还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器102中存储有以软件或固件(Firmware)的形式存储于存储器102中的软件功能模块,处理器101通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的森林类型识别方法。
存储器102可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)等。
可以理解的是,图1所示的结构仅为示意,电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参考图2,是本申请实施例提供的一种森林类型识别方法的流程示意图,该方法应用于上述电子设备100,如图2所示,该方法包括:
步骤S201,获取待识别区域的标识以及该待识别区域对应的目标时间区间。
待识别区域指的是需要识别其类型的森林区域,在确定了待识别区域后,需要根据待识别区域的样本数据确定分类类型,示例性的,假设待识别区域为大孤家林场,在大孤家林场收集落叶松、红松、阔叶松、其他针叶、建筑、耕地的样本,根据大孤家林场内典型的地物类型和研究目的进行分类类型的确定,其中,分类类型可以依据实际林地区域的树木生长状况确定,以实际林地区域内中,成片林地中的主要优势树种类型来确定,对整个林地区域内的伴生树种或者面积占比很小的纯林都不做区分。
可以理解的是,待识别区域的标识,可以是待识别区域所在位置的经纬度信息、待识别区域对应的行政范围或者人工划定的空间位置。而待识别区域对应的目标时间区间可以是符合研究需求时间尺度的时间区间,例如,样本类型数据的获取时间为2018年,为保证获取到覆盖大孤家林场区域的遥感数据,并且在时间尺度上覆盖整个树木生长周期,则目标时间区间定为2019年。
步骤S202,从云平台获取该待识别区域在目标时间区间的目标遥感数据。
示例性的,本申请实施例中的云平台可以是谷歌地球引擎(Google EarthEngine,GEE),GEE是由Google开发的新一代基于云的地球科学数据分析平台,主要应用于地球科学数据,尤其是遥感影像的可视化计算和分析。
GEE集合了目前许多的遥感数据,研究人员可以不用再去各种平台搜集遥感数据,直接利用GEE就可以处理想要处理的数据。除了大量的卫星遥感数据,GEE还整合了一个API,该API不仅能支持Javascript,还支持Python,同时支持对遥感数据的处理。GEE可以相当于一个在线运行的服务器,为研究人员提供所需要的资源。
具体的,在本申请的实施例中,从谷歌云平台GEE获取的遥感数据为Sentinel-2卫星影像数据,Sentinel-2卫星影像数据包含13个原始波段数据,空间分辨率分别为10m,20m,60m,其中,空间分辨率是指,遥感影像上能够识别的两个相邻地物的最小距离,空间分辨率是评价传感器性能和遥感信息的重要指标之一,也是识别地物形状大小的重要依据。
优选的,从GEE获取的遥感数据可以为设定的研究时间一年内的所有遥感影像数据,从数据源的时间尺度上,覆盖有物候特征的森林类型的整个生长周期,以提高后续对森林类型识别的准确性。将从GEE平台获取的遥感数据进行相应的预处理操作,即可得到待识别区域的目标遥感数据。
步骤S203,使用随机森林模型,对目标遥感数据进行分析处理,得到待识别区域的森林类型。
随机森林模型指的是利用多棵决策树对样本进行训练并预测的一种分类器,决策就是评价的意思,用一颗大树评价一个事物,这样的大树就叫做决策树。
在机器学习中,随机森林模型可以是一个包含多个决策树的分类器,并且其输出的类别是由个别决策树输出的类别的众数而定,其中,众数是指在统计分布上具有明显集中趋势点的数值,代表数据的一般水平,也是一组数据中出现次数最多的数值。
具体的,本申请实施例中,通过使用待识别森林区域的地物样本以及各样本对应的特征因子,对随机森林模型进行训练,得到训练后的随机森林模型,该训练后的随机森林模型,能够对例如本申请实施例中提到的大孤家林场整个区域的全部遥感影像进行分类,并将大孤家林场所有遥感影像数据包含的地物信息,可以按照模型训练的规则,按照预先设定的类别进行识别分类。
进一步的,将从云平台获取的目标遥感数据,输入上述训练后的随机森林模型进行分析处理,得到目标遥感数据所在区域的森林类型。
综上所述,本申请实施例提供一种森林类型识别方法,获取待识别区域的标识以及待识别区域对应的目标时间区间,从云平台获取待识别区域在目标时间区间的目标遥感数据,使用随机森林模型,对该目标遥感数据进行分析处理,即可识别出待识别区域的森林类型。通过上述步骤,可以实现通过从云平台获取待识别区域的目标遥感数据,对待识别区域的森林类型进行识别,从而解决现有技术中在采用单机软件应用机器学习算法,利用遥感数据对大区域森林的类型进行识别时,存在大量遥感数据预处理、机器学习算法运行分类速度较慢以及TB级别遥感影像数据存储成本高的问题,而且,通过该森林类型识别方法,能够快速准确地进行研究区域森林类型的分类识别,为森林资源调查提供了一种快速准确地工作方法,能够节省大量人力物力,提高森林资源空间分布信息调查的效率。
接下来的实施例,将对从云平台获取待识别区域在目标时间区间的目标遥感数据的具体过程进行详细说明,请参考图3,是本申请实施例提供的又一种森林类型识别方法的流程示意图,如图3所示,上述步骤S202包括:
步骤S301,向云平台发送待识别区域的标识以及目标时间区间。
将需要获取遥感数据的待识别区域的标识以及需要获取的遥感数据所对应的目标时间区间发送给云平台,继续上述大孤家林场的举例,假设待识别区域为大孤家林场,则需要将大孤家林场的位置标识发送给云平台,大孤家林场的位置标识,可以指大孤家林场的经纬度信息、大孤家林场对应的行政范围或者人工划定的空间位置信息等。除了将大孤家林场的位置标识发送给云平台外,还需要将目标时间区间发送给云平台,其中,目标时间区间是需要符合研究需求时间尺度的时间区间。
步骤S302,接收云平台返回的待识别区域在目标时间区间的目标遥感数据。
云平台在接收到待识别区域的标识以及目标时间区间后,将该标识和目标时间区间对应的目标遥感数据返回。示例性的,假设待识别区域为大孤家林场,目标时间区间为2019年,则云平台返回的目标遥感数据为大孤家林场在2019年一整年的遥感影像数据。
需要说明的是,接收由云平台返回的目标遥感数据,为云平台对待识别区域在目标时间区间的原始遥感数据进行预处理操作之后的遥感数据。具体的,对待识别区域的原始遥感数据进行预处理,其中,预处理过程可以包括,图像增强、影像去云、波段组合、裁剪镶嵌等步骤,但不限于此。具体的,图像增强是指,对图像进行对比度、亮度、灰度拉伸等操作,以改变影像显示效果,突出待研究地物,增加图像可读性。影像去云是指,计算云信息波段QA60的Bit10和Bit11的值,设置二者的值均为0得到云掩膜,使用云掩膜去除影像中的云信息,得到无云影像。波段合成是指,遥感影像处理中将多个不同波段叠加成一幅新影像的方法,合成波段可以来自不同时相的影像数据,也可以是光谱波段计算结果。图像镶嵌与裁剪是指,在研究应用中,遥感影像数据的覆盖范围是有限的,尤其是高分辨率遥感影像,所以在进行大区域遥感应用时需要进行影像裁剪镶嵌。在这些预处理过程中,可以通过调取GEE平台库函数,编写遥感数据预处理代码进行处理,本实施例不做具体限制。
可选的,为了解决在数据预处理后,遥感影像数据可能会出现云区域像元缺失的问题,可以将预处理后的数据合成为月均值遥感影像数据。具体的,其操作以及原理,可以是调用GEE平台的接口函数,通过数据计算的方法,将预处理后的影像重合区域的像元值做均值处理,获取整个区域的一张影像,因为参与运算的影像数据为一个月内的数据,所以称为月均值影像数据。
例如,针对单景影像,为了解决在数据预处理后,可能会出现的云区域像元缺失的问题,则可以将预处理后的数据合成为月均值遥感影像数据。
进一步的,在接收到经过云平台预处理操作后的待识别区域的目标遥感数据后,即可根据该目标遥感数据,对待识别区域的森林类型进行识别。
请参考图4,是本申请实施例提供的又一种森林类型识别方法的流程示意图,如图4所示,上述步骤S203包括:
步骤S401,构建目标遥感数据的特征空间。
目标遥感数据的分类特征空间,包括目标遥感数据的至少一种特征因子,包括但不限于目标遥感数据的光谱波段数据、植被指数因子、地形因子等。
如前所说的,本申请实施例中,从GEE平台接收的遥感数据为Sentinel-2卫星影像数据,那么,构建目标遥感数据的特征空间,主要包括如下的步骤:
(1)将接收到的原始遥感数据中的10m,20m波段数据进行提取整合,可以按照波段名称,例如,从本申请中的Sentinel-2卫星影像数据为B5、B6、B7、B8a、B11、B12中,提取地面分辨率为20m的波段,重采样为10m,将重采样后的波段数据与原有10m波段数据进行波段组合得到光谱波段数据。
(2)依据植被指数计算公式,计算每副遥感影像的植被指数。
可选的,植被指数计算公式可以包括归一化植被指数(Normalized DifferenceVegetation Index,NDVI)和增强型植被指数(Enhanced Vegetation Index,EVI)。
NDVI是一个数值指标,用于分析遥感观测所得到的信息,可以对目标地区绿色植被的生长状况进行评估。计算方式是利用红光与近红外光的反射,计算公式如下:
Figure BDA0003147042570000131
其中,ρNIR、ρRED分别代表近红外波段、红色波段的反射率值。
EVI是一个经过优化的植被指数,可以解释大气影响和植被背景信号。它类似于NDVI,但是对于背景和大气噪音不是很敏感,更适用于气溶胶含量较高的天气状况下,以及植被茂盛区。在查看绿色植被非常密集的区域时,颜色也不如NDVI那么深。计算公式如下:
Figure BDA0003147042570000141
其中,ρNIR、ρRED、ρBlue分别代表近红外波段、红色波段和蓝色波段的反射率值。
(3)使用数字高程模型(Digital Elevation Mode,DEM)数据调取函数的方法计算地形因子。
数字高程模型(Digital Elevation Model),简称DEM,是通过有限的地形高程数据,实现对地面地形的数字化模拟(即地形表面形态的数字化表达),它是用一组有序数值阵列形式表示地面高程的一种实体地面模型。
DEM数据同样储存在GEE平台的数据集中,可以通过编码进行调取,继续以待识别区域为大孤家林场为例,通过编码获取了大孤家林场区域的DEM数据和GEE提供地形因子计算相关函数,即可基于DEM数据,计算大孤家林场的坡度、坡向等地形因子。
通过上述步骤(1)、(2)和(3)之后,将计算得到的各特征因子,包括光谱波段数据、植被指数数据以及地形因子进行波段组合,完成目标遥感数据的特征空间构建,用于后续识别分类。
其中,遥感影像以波段记录地物信息,原始影像波段包含光谱信息,将计算的各特征因子数据与原始影像光谱波段进行组合,形成新影像的过程称为波段组合。
步骤S402,从特征空间中筛选出至少一种目标特征因子。
以上述步骤S401中构建的特征空间中的各特征因子,包括光谱波段数据、植被指数数据以及地形因子,作为输入数据,进行随机森林算法模型的运算,将模型的输出作为目标特征因子。
可选的,从特征空间中筛选出至少一种目标特征因子,可以包括:以特征空间中的各特征因子作为输入数据,进行随机森林模型运算,得到各特征因子的贡献得分,并根据各特征因子的贡献得分,从特征空间中筛选出至少一种目标特征因子。示例性的,对各特征因子的贡献得分进行预测是以如下的方式进行的:
具体的,基于基尼系数特征选择方法,对上述构建的各特征因子进行贡献得分的预测。
假设有一组m个训练示例,其中每个训练示例包括一个输入特征向量(x1,...,xp)和一个相应的标签y。假设有n个可能的类标签,即遥感影像数据的光谱波段数据及其他遥感因子,现在需要从这些训练数据中建立一个机器学习(Machine Learning,ML)模型,这样就可以进行预测,对于以前看不见的输入特征向量,预测得到的标签y尽可能准确。
但是,在模型训练中,并不是所有的p特性都对这一目的有着相同的贡献度。因此,要使用特征选择方法进行特征优化,在特征选择的过滤方法中,所有特征首先被分配一个分数,这表明了它们的预测能力,随后将根据重要性得分来筛选保留评分最佳的特征。
基尼系数的选取标准是每个子节点达到最高的纯度,即子节点中的所有观测都属于同一类别,此时基尼系数最小,纯度最高,且不确定性最小。如果第j个特征Fj是一个离散特征,可以假设c取不同的值,那么它诱导的一个分区为S1∪S2∪…∪c,其中Si是具有第j特征的第i值的实例集合。Si的基尼系数被定义为:
Figure BDA0003147042570000161
其中,pc是从属于第c类的Si中随机选择一个实例的概率。特征Fj的基尼分数是Si中基尼系数的加权平均值:基尼系数越大,不确定性越大;基尼系数越小,不确定性越小,数据分割越透彻、越干净。
在遍历每个特征的每个分割点时,当使用特征A=a,将D划分为两部分,即D1(满足A=a的样本集合),D2(不满足A=a的样本集合)。则在特征A=a的条件下D的基尼指数为:
Figure BDA0003147042570000162
Gini(D):表示集合D的不确定性。Gini(A,D):表示经过A=a分割后的集合D的不确定性。
随机森林中的每个决策树,连续遍历树的特征子集的所有可能分割点,找到基尼系数最小的特征的分割点,并将数据集分成两个子集,直到满足停止条件。
具体实现过程是,以构建的特征空间为输入数据,进行随机森林算法模型的运算,模型输出各特征空间因子在随机森林分类模型中的贡献得分,以此贡献得分数据为依据,提取贡献得分高的因子,并依据评分结果,筛选出至少一种目标特征因子,完成特征优选。
通过上述特征优选的过程,得到优化后的各特征因子组成的优化特征空间,进行最终的森林类型识别,可以有效地减少模型计算量以及运算时间。
步骤S403,以目标特征因子为随机森林模型的输入数据,使用随机森林模型对目标遥感数据进行分析处理,得到待识别区域的森林类型。
可选的,以目标特征因子为随机森林模型的输入数据,使用随机森林模型对目标遥感数据进行分析处理,得到待识别区域的森林类型之前,还包括:使用预设的森林区域样本以及各样本对应的特征因子训练得到随机森林模型。
继续以大孤家林场为例,预先设定了六种类型的地物样本,使用各地物样本对应的目标特征因子,对随机森林模型进行训练,得到训练后的随机森林模型,使该训练后的随机森林模型,能够对大孤家林场整个区域的全部影像进行分类,并将大孤家所有影像数据包含的地物信息按照模型训练的规则全部进行设定类别的识别分类。
可选的,在使用随机森林模型,对目标遥感数据进行分析处理,得到待识别区域的森林类型之后,还包括使用混淆矩阵,对待识别区域的森林类型进行准确度分析,得到森林类型识别结果的准确度。
可选的,遥感分类结果的评价方法可以采用混淆矩阵(confusion matrix)来评价。混淆矩阵是精度评定的标准格式,由n行n列的矩阵表示,矩阵的每一列表示遥感分类系统中一个类别的实例预测,每一行表示遥感分类系统中一个类别的实际实例。具体的评价指标包括总体准确度、制图准确度、用户准确度等,这些准确度指标从不同方面反映了图像分类的准确度。在遥感领域,总体精度是一个公认有说服力的精度指标。
图5为本申请实施例提供的森林类型识别过程的流程示意图,如图5所示,本申请实施例提供的森林类型识别过程主要包括:首先确定包含森林类型样本数据的待识别区域,其次,确定遥感数据的获取时间与位置,接着获取待识别区域的遥感数据,对遥感数据进行预处理,接着,进行特征空间构建以及进行特征优选,最后采用随机森林算法进行分类,输出分类结果图与精度评定参数。
值得说明的是,上述图5中的具体实现细节已经在前述实施例中进行了详细说明,此处不再赘述。
图6是采用本申请实施例提供的森林类型识别方法所得到的一种分类结果示意图,从图6中可以很清楚的看出各种森林类型的分布情况。
基于同一发明构思,本申请实施例中还提供了与该森林类型识别方法对应的一种森林类型识别装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述森林类型识别方法相似,因此,装置的实施可以参见方法的实施,重复之处不再赘述。
图7是本申请实施例提供的一种森林类型识别装置的模块结构图,如图7所示,该装置包括:
第一获取模块701,用于获取待识别区域的标识以及待识别区域对应的目标时间区间。
第二获取模块702,用于从云平台获取待识别区域在目标时间区间的目标遥感数据。
处理模块703,用于使用随机森林模型,对目标遥感数据进行分析处理,得到待识别区域的森林类型。
一种可能的实施方式中,第二获取模块702具体用于:
向云平台发送待识别区域的标识以及目标时间区间;接收云平台返回的待识别区域在目标时间区间的目标遥感数据。
一种可能的实施方式中,处理模块703具体用于:
构建目标遥感数据的特征空间,特征空间中包括目标遥感数据的至少一种特征因子;从特征空间中筛选出至少一种目标特征因子;以目标特征因子为随机森林模型的输入数据,使用随机森林模型对目标遥感数据进行分析处理,得到待识别区域的森林类型。
一种可能的实施方式中,处理模块703具体还用于:
以特征空间中的各特征因子作为输入数据,进行随机森林模型运算,得到各特征因子的贡献得分;根据各特征因子的贡献得分,从特征空间中筛选出至少一种目标特征因子。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnalprocessor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述森林类型识别方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述森林类型识别方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:RandomAccess Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种森林类型识别方法,其特征在于,包括以下步骤:
获取待识别区域的标识以及所述待识别区域对应的目标时间区间;
从云平台获取所述待识别区域在所述目标时间区间的目标遥感数据;
使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
2.根据权利要求1所述的方法,其特征在于,所述使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型之后,还包括:
使用混淆矩阵,对所述待识别区域的森林类型进行准确度分析,得到所述森林类型的准确度。
3.根据权利要求1所述的方法,其特征在于,所述从云平台获取所述待识别区域在所述目标时间区间的目标遥感数据,包括:
向所述云平台发送所述待识别区域的标识以及所述目标时间区间;
接收所述云平台返回的所述待识别区域在所述目标时间区间的目标遥感数据。
4.根据权利要求3所述的方法,其特征在于,所述待识别区域在所述目标时间区间的目标遥感数据为所述云平台对所述待识别区域在所述目标时间区间的原始遥感数据进行预处理之后的数据。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型,包括:
构建所述目标遥感数据的特征空间,所述特征空间中包括所述目标遥感数据的至少一种特征因子;
从所述特征空间中筛选出至少一种目标特征因子;
以所述目标特征因子为所述随机森林模型的输入数据,使用所述随机森林模型对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
6.根据权利要求5所述的方法,其特征在于,所述从所述特征空间中筛选出至少一种目标特征因子,包括:
以所述特征空间中的各特征因子作为输入数据,进行随机森林模型运算,得到各特征因子的贡献得分;
根据各特征因子的贡献得分,从所述特征空间中筛选出所述至少一种目标特征因子。
7.根据权利要求6所述的方法,其特征在于,所述以所述目标特征因子为所述随机森林模型的输入数据,使用所述随机森林模型对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型之前,包括:
使用预设的森林区域样本以及各样本对应的特征因子训练得到所述随机森林模型。
8.一种森林类型识别装置,其特征在于,包括:
第一获取模块,用于获取待识别区域的标识以及所述待识别区域对应的目标时间区间;
第二获取模块,用于从云平台获取所述待识别区域在所述目标时间区间的目标遥感数据;
处理模块,用于使用随机森林模型,对所述目标遥感数据进行分析处理,得到所述待识别区域的森林类型。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如权利要求1至7任一所述的森林类型识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的森林类型识别方法的步骤。
CN202110754983.8A 2021-07-05 2021-07-05 森林类型识别方法及装置 Pending CN113378785A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110754983.8A CN113378785A (zh) 2021-07-05 2021-07-05 森林类型识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110754983.8A CN113378785A (zh) 2021-07-05 2021-07-05 森林类型识别方法及装置

Publications (1)

Publication Number Publication Date
CN113378785A true CN113378785A (zh) 2021-09-10

Family

ID=77580800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110754983.8A Pending CN113378785A (zh) 2021-07-05 2021-07-05 森林类型识别方法及装置

Country Status (1)

Country Link
CN (1) CN113378785A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114120143A (zh) * 2021-11-19 2022-03-01 广东省科学院广州地理研究所 基于遥感图像的热点区识别方法、装置以及设备
CN114187532A (zh) * 2022-02-15 2022-03-15 中国测绘科学研究院 一种遥感影像时空样本生成与智能迭代分类方法及系统
CN114494198A (zh) * 2022-01-26 2022-05-13 自然资源部第一航测遥感院(陕西省第五测绘工程院) 一种综合多源信息的玉米干旱损害范围提取方法
CN115546672A (zh) * 2022-11-30 2022-12-30 广州天地林业有限公司 基于图像处理的森林图片处理方法及系统
CN116206215A (zh) * 2023-03-17 2023-06-02 银河航天(北京)网络技术有限公司 一种森林土地状态的监测方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280440A (zh) * 2018-02-09 2018-07-13 三亚中科遥感研究所 一种果林识别方法和系统
CN109522788A (zh) * 2018-09-30 2019-03-26 广州地理研究所 基于随机森林分类算法的城市范围提取方法、装置及电子设备
CN110738187A (zh) * 2019-10-24 2020-01-31 中国科学院城市环境研究所 一种基于Google Earth Engine的湖泊面积动态变化快速遥感估算方法
CN110751094A (zh) * 2019-10-21 2020-02-04 北京师范大学 一种基于gee综合遥感影像和深度学习方法的作物估产技术
CN112232171A (zh) * 2020-10-10 2021-01-15 中煤航测遥感集团有限公司 基于随机森林的遥感影像信息提取方法、装置及存储介质
CN112598881A (zh) * 2020-12-03 2021-04-02 中煤航测遥感集团有限公司 一种地质灾害监测方法、装置及计算机设备
CN112668400A (zh) * 2020-12-08 2021-04-16 深圳先进技术研究院 一种植被识别方法及应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280440A (zh) * 2018-02-09 2018-07-13 三亚中科遥感研究所 一种果林识别方法和系统
CN109522788A (zh) * 2018-09-30 2019-03-26 广州地理研究所 基于随机森林分类算法的城市范围提取方法、装置及电子设备
CN110751094A (zh) * 2019-10-21 2020-02-04 北京师范大学 一种基于gee综合遥感影像和深度学习方法的作物估产技术
CN110738187A (zh) * 2019-10-24 2020-01-31 中国科学院城市环境研究所 一种基于Google Earth Engine的湖泊面积动态变化快速遥感估算方法
CN112232171A (zh) * 2020-10-10 2021-01-15 中煤航测遥感集团有限公司 基于随机森林的遥感影像信息提取方法、装置及存储介质
CN112598881A (zh) * 2020-12-03 2021-04-02 中煤航测遥感集团有限公司 一种地质灾害监测方法、装置及计算机设备
CN112668400A (zh) * 2020-12-08 2021-04-16 深圳先进技术研究院 一种植被识别方法及应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵佩: "基于GEE云平台的喜马拉雅地区森林覆被提取及其变化分析", 《中国优秀硕士学位论文全文数据库》, no. 02, pages 008 - 306 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114120143A (zh) * 2021-11-19 2022-03-01 广东省科学院广州地理研究所 基于遥感图像的热点区识别方法、装置以及设备
CN114494198A (zh) * 2022-01-26 2022-05-13 自然资源部第一航测遥感院(陕西省第五测绘工程院) 一种综合多源信息的玉米干旱损害范围提取方法
CN114187532A (zh) * 2022-02-15 2022-03-15 中国测绘科学研究院 一种遥感影像时空样本生成与智能迭代分类方法及系统
CN115546672A (zh) * 2022-11-30 2022-12-30 广州天地林业有限公司 基于图像处理的森林图片处理方法及系统
CN115546672B (zh) * 2022-11-30 2023-03-24 广州天地林业有限公司 基于图像处理的森林图片处理方法及系统
CN116206215A (zh) * 2023-03-17 2023-06-02 银河航天(北京)网络技术有限公司 一种森林土地状态的监测方法、装置及存储介质
CN116206215B (zh) * 2023-03-17 2023-09-29 银河航天(北京)网络技术有限公司 一种森林土地状态的监测方法、装置及存储介质

Similar Documents

Publication Publication Date Title
Hao et al. Automated tree-crown and height detection in a young forest plantation using mask region-based convolutional neural network (Mask R-CNN)
Lee et al. Detecting industrial oil palm plantations on Landsat images with Google Earth Engine
Rocchini et al. Satellite remote sensing to monitor species diversity: Potential and pitfalls
CN113378785A (zh) 森林类型识别方法及装置
Morton et al. Rapid assessment of annual deforestation in the Brazilian Amazon using MODIS data
Man et al. Pixel-and feature-level fusion of hyperspectral and lidar data for urban land-use classification
US9230168B2 (en) Automatic generation of built-up layers from high resolution satellite image data
Witharana et al. Evaluation of data fusion and image segmentation in earth observation based rapid mapping workflows
WO2008118977A1 (en) Data analysis process
CN116018602A (zh) 植被管理系统和植被管理方法
Nurmasari et al. Oil palm plantation detection in Indonesia using Sentinel-2 and Landsat-8 optical satellite imagery (case study: Rokan Hulu regency, Riau Province)
Illarionova et al. Estimation of the canopy height model from multispectral satellite imagery with convolutional neural networks
Paul et al. Canopy averaged chlorophyll content prediction of pear trees using convolutional autoencoder on hyperspectral data
Ventura et al. Individual tree detection in large-scale urban environments using high-resolution multispectral imagery
Yadav et al. Tree crown segmentation and species classification in a wet eucalypt forest from airborne hyperspectral and LiDAR data
Roffey et al. Evaluation of features derived from high-resolution multispectral imagery and LiDAR data for object-based support vector machine classification of tree species
Drobnjak et al. Testing a new ensemble vegetation classification method based on deep learning and machine learning methods using aerial photogrammetric images
WO2024002930A1 (en) Vegetation management system and vegetation management method
Hubert-Moy et al. Contribution of SPOT-7 multi-temporal imagery for mapping wetland vegetation
CN115062815A (zh) 一种利用热辐射数据测度企业生产经营状况的方法及系统
Ouchra et al. Comparing Unsupervised Land Use Classification of Landsat 8 OLI Data Using K-means and LVQ Algorithms in Google Earth Engine: A Case Study of Casablanca.
Giuliani Time-first approach for land cover mapping using big Earth observation data time-series in a data cube–a case study from the Lake Geneva region (Switzerland)
Saponaro et al. LULC Classification Performance of Supervised and Unsupervised Algorithms on UAV-Orthomosaics
Tang et al. Accuracy test of point-based and object-based urban building feature classification and extraction applying airborne LiDAR data
Owers et al. Remote sensing can locate and assess the changing abundance of hollow-bearing trees for wildlife in Australian native forests

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210910