CN112232171A - 基于随机森林的遥感影像信息提取方法、装置及存储介质 - Google Patents

基于随机森林的遥感影像信息提取方法、装置及存储介质 Download PDF

Info

Publication number
CN112232171A
CN112232171A CN202011081359.8A CN202011081359A CN112232171A CN 112232171 A CN112232171 A CN 112232171A CN 202011081359 A CN202011081359 A CN 202011081359A CN 112232171 A CN112232171 A CN 112232171A
Authority
CN
China
Prior art keywords
remote sensing
sensing image
extracted
spatial
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011081359.8A
Other languages
English (en)
Inventor
陈冰凌
奚砚涛
刘俊荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meihang Remote Sensing Information Co ltd
Aerial Photogrammetry and Remote Sensing Co Ltd
Original Assignee
Meihang Remote Sensing Information Co ltd
Aerial Photogrammetry and Remote Sensing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meihang Remote Sensing Information Co ltd, Aerial Photogrammetry and Remote Sensing Co Ltd filed Critical Meihang Remote Sensing Information Co ltd
Priority to CN202011081359.8A priority Critical patent/CN112232171A/zh
Publication of CN112232171A publication Critical patent/CN112232171A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种基于随机森林的遥感影像信息提取方法、装置及存储介质,涉及遥感技术领域。该遥感影像信息提取方法包括:获取待提取遥感影像及待提取遥感影像中已识别目标地物的空间拓扑关系;根据待提取遥感影像和已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到待提取遥感影像中多种类型地物的空间信息。本发明通过利用简单目标地物的空间拓扑关系,实现对整个待提取遥感影像的多种类型地物的空间关系的提取,保证了地物空间信息提取的准确率。

Description

基于随机森林的遥感影像信息提取方法、装置及存储介质
技术领域
本发明涉及遥感技术领域,具体而言,涉及一种基于随机森林的遥感影像信息提取方法、装置及存储介质。
背景技术
随着世界各国在遥感平台投入的不断增长,特别是我国高分辨率对地观测系统突破了高空间分辨率、多光谱与宽覆盖相结合的光学遥感等关键技术,在地理、测绘、地球系统科学研究等领域发挥重要作用。因而准确和快速的海量遥感信息提取成为一种迫切的需求。
传统遥感信息提取技术包括最大似然法、支持向量机、决策树等,也广泛应用于各个行业实现遥感信息的提取。传统遥感信息提取方法中,可以基于遥感影像的处理分析,尽可实现其中单一预设类型的目标地物的识别。
现有的方案中,只能识别一些空间特征简单、周围地理因素、环境因素较少的目标地物,对于复杂地理环境的地物难以进行识别。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种基于随机森林的遥感影像信息提取方法、装置及存储介质,以便通过已识别目标地物的空间拓扑关系提取遥感影像中多种类型地物的空间信息。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种基于随机森林的遥感影像信息提取方法,所述方法包括:
获取待提取遥感影像及所述待提取遥感影像中已识别目标地物的空间拓扑关系;
根据所述待提取遥感影像和所述已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到所述待提取遥感影像中多种类型地物的空间信息。
可选地,所述随机森林模型采用下述方式进行训练得到:
获取样本遥感影像,所述样本遥感影像中标注有:所述多种类型地物的样本空间特征;
从所述多种类型地物的样本空间特征,重复抽取k次,每次随机抽取 m个样本空间特征;k和m分别为大于或等于2的整数;
根据每次抽取的m个样本空间特征,生成具有n个节点的一个决策树,一个节点对应一类样本空间特征;
根据k个决策树,构建所述随机森林模型。
可选地,所述方法还包括:
根据所述多种类型地物的样本空间特征中,未抽取到的样本空间特征,采用所述随机森林模型进行信息提取;
根据信息提取的结果,确定所述随机森林模型的提取误差。
可选地,所述从所述多种类型地物的样本空间特征,重复抽取k次,包括:
从每种类型地物的样本空间特征进行筛选,确定所述每个类型地物的目标样本空间特征;
从所述多种类型地物的目标样本空间特征中重复抽取k次。
可选地,所述根据k个决策树,构建所述随机森林模型之前,所述方法还包括:
若所述k个决策树中存在目标决策树中的多个节点对应同一样本空间特征,则在所述目标决策树中所述多个节点增加其他类型的空间特征,以对所述目标决策树进行改进;改进后的所述目标决策树中一个节点对应一种类型的空间特征。
可选地,所述在所述目标决策树中所述多个节点增加其他类型的空间特征,包括:
在所述目标决策树中所述多个节点随机增加其他类型的空间特征。
可选地,所述根据每次抽取的m个样本空间特征,生成具有m个节点的一个决策树,包括:
确定所述每次抽取的m个样本空间特征中,不同类型地物的样本空间特征的数量是否平衡;
若不平衡,在采用预设的人工少数类过采样法SMOTE算法,以及预设的聚类方法对所述每次抽取的m个样本空间特征进行预处理;
根据预处理后的样本空间特征,生成具有m个节点的一个决策树。
第二方面,本发明实施例还提供了一种基于随机森林的遥感影像信息提取装置,所述装置包括:
获取模块,用于获取待提取遥感影像及所述待提取遥感影像中已识别目标地物的空间拓扑关系;
信息提取模块,用于根据所述待提取遥感影像和所述已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到所述待提取遥感影像中多种类型地物的空间信息。
第三方面,本发明实施例还提供了一种随机森林模型的训练装置,包括:
样本获取模块,用于获取样本遥感影像,所述样本遥感影像中标注有:所述多种类型地物的样本空间特征;
样本抽取模块,用于从所述多种类型地物的样本空间特征,重复抽取k 次,每次随机抽取m个样本空间特征;k和m分别为大于或等于2的整数;
决策树生成模块,用于根据每次抽取的m个样本空间特征,生成具有 n个节点的一个决策树,一个节点对应一类样本空间特征;
模型构建模块,用于根据k个决策树,构建所述随机森林模型。
进一步的,该随机森林模型的训练装置还包括:误差计算模块,用于根据所述多种类型地物的样本空间特征中,未抽取到的样本空间特征,采用所述随机森林模型进行信息提取;根据信息提取的结果,确定所述随机森林模型的提取误差。
在一种具体实施方式中,样本抽取模块用于从每种类型地物的样本空间特征进行筛选,确定所述每个类型地物的目标样本空间特征;从所述多种类型地物的目标样本空间特征中重复抽取k次。
在一种具体实施方式中,决策树生成模块还用于:若所述k个决策树中存在目标决策树中的多个节点对应同一样本空间特征,则在所述目标决策树中所述多个节点增加其他类型的空间特征,以对所述目标决策树进行改进;改进后的所述目标决策树中一个节点对应一种类型的空间特征。
在一种更具体的实施方式中,决策树生成模块还用于:在所述目标决策树中所述多个节点随机增加其他类型的空间特征。
在一种更具体的实施方式中,决策树生成模块还包括:
判断子模块,用于确定所述每次抽取的m个样本空间特征中,不同类型地物的样本空间特征的数量是否平衡;
预处理子模块,用于若不同类型地物的样本空间特征的数量不平衡,采用预设的人工少数类过采样法SMOTE算法,以及预设的聚类方法对所述每次抽取的m个样本空间特征进行预处理;
决策树生成子模块,根据预处理后的样本空间特征,生成具有n个节点的一个决策树。
第四方面,本发明实施例还提供了一种计算机设备,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述基于随机森林的遥感影像信息提取方法。
第五方面,本发明实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述基于随机森林的遥感影像信息提取方法。
本发明的有益效果是:本发明根据待提取遥感影像中已识别目标地物的空间拓扑,采用预先训练的随机森林模型对待提取遥感影像进行信息提取,得到待提取遥感影像中多种类型地物的空间关系。本发明首先对待提取遥感影像中的一些简单目标地物进行识别,并构建简单目标地物的空间拓扑关系,利用简单目标地物的空间拓扑关系,实现对整个待提取遥感影像的多种类型地物的空间关系的提取,以实现了对空间特征多,地理环境因素复杂的地物的空间信息的提取,便于从遥感影像中获取对应地域的空间信息。同时,基于预先训练的随机森林模型,保证了地物空间信息提取的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种基于随机森林的遥感影像信息提取方法的流程示意图;
图2为本发明实施例提供的一种随机森林模型训练方法的流程示意图;
图3为本发明实施例提供的一种随机森林模型训练方法的流程示意图;
图4为本发明实施例提供的一种随机森林模型训练方法的流程示意图;
图5为本发明实施例提供的一种随机森林模型训练方法的流程示意图;
图6为本发明实施例提供的一种基于随机森林的遥感影像信息提取装置的结构示意图;
图7为本发明实施例提供的一种随机森林模型的训练装置的结构示意图;
图8为本发明实施例提供的计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为实现待提取遥感影像的信息提取,以实现对待提取遥感图像中的目标地物进行空间分析,本发明实施例提供了下述多种可能的实现方式。如下结合附图对进行示例的解释说明。
需要指出的是,本发明所提供的基于随机森林的遥感影像信息提取方法,可由安装并运行有遥感影像信息提取应用的计算机设备实现,该计算机设备可以为服务器,可以为客户端设备,本发明不对此进行限制。
图1为本发明实施例提供的一种基于随机森林的遥感影像信息提取方法的流程示意图;如图1所示,该方法包括:
S1:获取待提取遥感影像及待提取遥感影像中已识别目标地物的空间拓扑关系。
具体的,待提取遥感影像为通过数码航空摄像和高分遥感卫星数据获取技术得到的某一地区或某一区域的遥感影像。该遥感影像中已识别目标地物的空间拓扑关系是基于该遥感影像中的预设类型的目标地物结合其周围的地理因素、环境因素进行判别分析,所获得的目标地物的空间拓扑关系。当遥感影像中预设类型的目标地物所覆盖的区域范围较大即区域范围大于预设范围阈值时,可对多种预设类型的目标地物结合其周围的地理因素、环境因素进行判别分析,建立每种预设类型的目标地物的空间拓扑关系,从而给得到已识别目标地物的空间拓扑关系。
示例的,上述已识别的预设类型的目标地物可以为简单目标地物,如空间特征简单、周围地理因素较少即周围地理因素少于预设阈值等特征条件的目标地物。在信息提取的过程中,预设类型的目标地物的类型可以是由用户选择的,也可以是基于上述预设类型的目标地物的特征条件确定的目标地物的类型。
在本发明实施例中,已识别的预设类型目标地物可以为建筑类型地物、耕地类型地物、林地类型地物及未利用类型地物等。在不同遥感影像源得到的遥感影像中,已识别目标地物的类型也可不相同,具体的类型可根据实际情况进行设定,本发明对此不做限制。
S2:根据待提取遥感影像和已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到待提取遥感影像中多种类型地物的空间信息。
具体的,将待提取遥感影像和已识别目标地物的空间拓扑关系同时输入至预先训练的随机森林模型,由该随机森林模型基于待提取遥感影像和已识别目标地物的空间拓扑关系进行信息提取,该随机森林模型输出的结果即为待提取遥感影像中多种类型地物的空间信息。
在本发明实施例中,预先训练的随机森林(Random Forest)模型是一种机器学习模型,其可以是根据预设的训练样本集,基于预设的分类器进行模型训练,得到的模型,其中,该训练样本集包括:多种类型的样本地物,每个样本地物具有多种空间特征。
本发明实施例通过对待提取遥感影像中的一些简单目标地物进行预设识别,并建立已识别目标地物的空间拓扑关系,将待提取遥感影像和已识别目标地物的空间拓扑关系输入至预先训练的随机森林模型中,利用已识别目标地物的空间拓扑关系,实现对整个待提取遥感影像的多种类型地物的空间关系的提取。本发明实施例提供的基于随机森林的遥感影像信息提取方法,实现了对空间特征多,地理环境因素复杂的地物的空间信息的提取,便于从遥感影像中获取对应地域的空间信息。同时,基于预先训练的随机森林模型,保证了地物空间信息提取的准确率。
在上述图1所示的基于随机森林的遥感影像信息提取方法的基础上,本发明实施例还提供一种随机森林模型训练方法。图2示出了本发明实施例随机森林模型训练方法的流程示意图,如图2所示,随机森林模型采用下述方式进行训练得到:
S10:获取样本遥感影像,样本遥感影像中标注有:多种类型地物的样本空间特征。
具体的,从遥感影像信息库中获取多个样本遥感影像,每个遥感影像中具有多个不同类型的地物,每个地物具有至少一个样本空间特征,用于指示不同类型的地物。
S20:从多种类型地物的样本空间特征,重复抽取k次,每次随机抽取 m个样本空间特征;k和m分别为大于或等于2的整数;
具体的,将所有不同类型地物的样本空间特征放入一个训练样本集中,从该训练样本集中有放回的抽取k次训练样本,每次随机抽取m个样本空间特征,构成训练样本子集,共有k个训练样本子集;k和m分别为大于或等于2的整数,以便形成随机森林。
S30:根据每次抽取的m个样本空间特征,生成具有n个节点的一个决策树,一个节点对应一类样本空间特征。
具体地,每个训练样本子集中具有m个样本空间特征,将m个样本空间特征放入第一节点中,然后以空间特征的类型将第一节点中的m个样本空间特征分为两类,分别放入第二节点和第三节点,然后对第二节点中的样本空间特征,以空间特征的类型再次进行分类,将第二节点分为第四节点和第五节点,对第三节点中的样本空间特征,以空间特征的类型再次进行分类,将第三节点分为第六节点和第七节点,以此类推,直至最终的若干个节点中的样本空间特征无法再进行分类,此时,一共形成了n个节点,这n个节点之间形成一个决策树。无法再进行分类的节点中的样本空间特征与每个节点的母节点中的样本空间特征共同表示某个地物。每次用于分类的空间特征的类型是基于当前节点中的样本空间特征的类型确定的,具体的空间特征的类型根据实际情况确定,再次不做限制。
S40:根据k个决策树,构建随机森林模型。
具体地,按照上述S30中生成决策树的方法,对k个样本训练子集进行同样的操作,生成k个决策树,这k个决策树共同构成随机森林模型。
本发明实施例通过对随机森林模型进行训练,使随机森林模型的结果更为准确,提高对遥感影像信息的提取的精度。另外利用随机森林模型对遥感影像进行信息提取,以使信息提取的速度更快,效率更高。
在上述图2所示的随机森林模型训练方法的基础上,本发明实施例还提供另一种随机森林模型训练方法。图3示出了本发明实施例随机森林模型训练方法的流程示意图,如图3所示,随机森林模型还采用下述方式进行训练得到:
S50:根据多种类型地物的样本空间特征中,未抽取到的样本空间特征,采用随机森林模型进行信息提取。
具体地,对训练样本集进行有放回的随机抽取训练样本,部分训练样本可能无法被抽中,将未抽取到的样本空间特征作为验证样本,送入随机森林模型,对验证样本进行信息提取,确定验证样本中未抽取的样本空间特征有多少样本空间特征无法与地物类型对应。
S60:根据信息提取的结果,确定随机森林模型的提取误差。
具体地,根据验证样本中未抽取的样本空间特征中无法与地物类型对应的样本空间特征数量,计算随机森林模型的提取误差,并对随机森林模型进行优化。当随机森林模型的提取误差小于预设的误差阈值,或未抽取的样本空间数量小于预设的数量阈值时,可认为对随机森林模型的优化完成。
本发明实施例通过将未提取的样本空间特征作为验证样本,送入随机训练模型,确定随机森林模型的提取误差,并根据误差的结果对随机森林模型进行优化,以使随机森林模型达到最优效果,保证随机森林模型在应用过程中对遥感影像的信息提取精度。
在上述图2所示的随机森林模型训练方法的基础上,本发明实施例还提供一种上述S20可能实现的方式。图4示出了本发明实施例随机森林模型训练方法的流程示意图,如图4所示,上述S20包括:
S21:从每种类型地物的样本空间特征进行筛选,确定每个类型地物的目标样本空间特征。
具体地,每种类型地物具有多个样本空间特征,从多个样本空间特征中确定每个类型地物所对应的目标样本空间特征,该目标样本空间特征用于指示唯一对应的地物。
S22:从多种类型地物的目标样本空间特征中重复抽取k次。
具体的,将所有不同类型地物的目标样本空间特征放入一个训练样本集中,从该训练样本集中有放回的抽取k次训练样本,每次随机抽取m个样本空间特征,构成训练样本子集,共有k个训练样本子集;k和m分别为大于或等于2的整数,以便形成随机森林。
在上述图2所示的随机森林模型训练方法的基础上,本发明实施例还提供一种随机森林模型训练方法。在上述S40之前,该随机森林模型训练方法还包括:
若k个决策树中存在目标决策树中的多个节点对应同一样本空间特征,则在目标决策树中多个节点增加其他类型的空间特征,以对目标决策树进行改进;改进后的目标决策树中一个节点对应一种类型的空间特征。
具体地,若某一目标决策树的多个节点对应同一样本空间特征,则多个节点对应的同一样本空间特征无法指示正确的地物类型,因此需要通过对遥感影像中地物的其它的空间特征进行随机组合,对节点增加地物的其他类型的空间特征,以使得样本空间特征与地物一一对应,在生成目标决策树时,一个节点可以对应一种类型的空间特征。
本发明实施例通过对遥感影像中地物的其它的空间特征进行随机组合,提升空间特征的信息量,使空间特征选取的随机性增大,在保证决策树的强度的同时,拓宽了空间特征的选择范围,有效提高了遥感影响的信息提取精度。
进一步的,在上述图2所示的随机森林模型训练方法的基础上,本发明实施例还提供一种随机森林模型训练方法,该随机森林模型训练方法包括:
在目标决策树中多个节点随机增加其他类型的空间特征。
具体地,为提升随机森林模型训练算法的分类精度,在增加其他类型的空间特征时采用随机增加特征的方式,以提升特征的信息量。
本发明实施例提供的随机森林模型训练方法,通过随机增加其他类型的空间特征,使得一个节点可以对应一种类型的空间特征,以提升随机森林模型训练算法的分类精度。
在上述图2所示的随机森林模型训练方法的基础上,本发明实施例还提供一种上述S30可能实现的方式。图5示出了本发明实施例随机森林模型训练方法的流程示意图,如图5所示,上述S30包括:
S31:确定每次抽取的m个样本空间特征中,不同类型地物的样本空间特征的数量是否平衡。
具体地,由于从训练样本集中抽取样本空间特征作为训练样本子集的过程为有放回的随机抽取,因此,可能存在有些类型地物的样本空间特征会被抽取多次,有些类型地物的样本空间特征被抽取的次数较少,导致不同类型地物的样本空间特征的数量不平衡。
S32:若不平衡,在采用预设的人工少数类过采样法SMOTE(Synthetic MinorityOversampling Technique)算法,以及预设的聚类方法对每次抽取的 m个样本空间特征进行预处理。
具体地,如果不同类型地物的样本空间特征的数量不平衡,则采用预设的SMOTE算法,以及预设的聚类算法增加m个样本空间特征中数量较少的样本空间特征,使不同类型的样本空间特征数量达到平衡。
在本发明实施例中,SMOTE算法为对不平衡数据进行处理的算法,其算法具体对不平衡数据的处理步骤为现有技术,在此不做赘述。由于 SMOTE算法存在导致数据边缘模糊的问题,因此需要利用聚类方法结合 SMOTE算法一起对不平衡数据进行处理,本发明所采用的聚类方法可以为 AFCM算法,该算法也是现有技术,在此不做赘述。通过AFCM-SMOTE 算法对不平衡数据进行处理,使不同类型的样本空间特征数量达到平衡,且不会存在数据边缘模糊的问题。
S33:根据预处理后的样本空间特征,生成具有n个节点的一个决策树。
具体的,通过预处理后的样本空间特征,样本训练子集中不同类型的样本空间特征数量达到平衡,对该样本空间特征达到平衡的训练样本子集进行分类,形成具有n个节点的决策树,具体生成决策树的步骤同S30,在此不做赘述。
本发明实施例提供的随机森林模型训练方法,通过AFCM-SMOTE算法处理不同类型的样本空间特征数量不平衡的问题,以使不同类型的样本空间特征数量达到平衡,提升随机森林模型的分类精度。
下述对用以执行的本发明所提供的基于随机森林算法的遥感影像信息提取方法的装置、设备及存储介质等进行说明,其具体的实现过程以及技术效果参见上述,下述不再赘述。
图6示出了本发明实施例提供的一种基于随机森林的遥感影像信息提取装置的结构示意图,如图6所示,该遥感影像信息提取装置包括:
获取模块100,用于获取待提取遥感影像及所述待提取遥感影像中已识别目标地物的空间拓扑关系;
信息提取模块200,用于根据所述待提取遥感影像和所述已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到所述待提取遥感影像中多种类型地物的空间信息。
本发明实施例还提供一种可实现随机森林模型的训练装置。图7示出了本发明实施例提供的一种随机森林模型的训练装置的结构示意图,如图7 所示,该随机森林模型的训练装置包括:
样本获取模块300,用于获取样本遥感影像,样本遥感影像中标注有:多种类型地物的样本空间特征。
样本抽取模块400,用于从多种类型地物的样本空间特征,重复抽取k 次,每次随机抽取m个样本空间特征;k和m分别为大于或等于2的整数。
决策树生成模块500,用于根据每次抽取的m个样本空间特征,生成具有n个节点的一个决策树,一个节点对应一类样本空间特征。
模型构建模块600,用于根据k个决策树,构建随机森林模型。
进一步的,该随机森林模型的训练装置还包括:误差计算模块,用于根据所述多种类型地物的样本空间特征中,未抽取到的样本空间特征,采用所述随机森林模型进行信息提取,根据信息提取的结果,确定所述随机森林模型的提取误差。
在一种具体实施方式中,样本抽取模块400用于从每种类型地物的样本空间特征进行筛选,确定每个类型地物的目标样本空间特征,从多种类型地物的目标样本空间特征中重复抽取k次。
在一种具体实施方式中,决策树生成模块500还用于:若k个决策树中存在目标决策树中的多个节点对应同一样本空间特征,则在目标决策树中多个节点增加其他类型的空间特征,以对目标决策树进行改进;改进后的目标决策树中一个节点对应一种类型的空间特征。
在一种更具体的实施方式中,决策树生成模块500还用于:在目标决策树中所述多个节点随机增加其他类型的空间特征。
在一种更具体的实施方式中,决策树生成模块500还包括:
判断子模块501,用于确定每次抽取的m个样本空间特征中,不同类型地物的样本空间特征的数量是否平衡。
预处理子模块502,用于若不同类型地物的样本空间特征的数量不平衡,采用预设的人工少数类过采样法SMOTE算法,以及预设的聚类方法对每次抽取的m个样本空间特征进行预处理。
决策树生成子模块503,用于根据预处理后的样本空间特征,生成具有 n个节点的一个决策树。
上述遥感影像信息提取装置以及随机森林模型的训练装置可在一个计算机设备上实现,也可在不同的计算机设备上实现。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称 FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图8为本发明实施例提供的计算机设备的结构示意图,该计算机设备 700包括:存储器701、处理器702。存储器701和处理器702通过总线连接。
存储器701用存储有处理器702可执行的计算机程序,处理器702调用存储器701存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种存储介质,存储介质上存储有计算机程序,该程序在被处理器执行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文: Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于随机森林的遥感影像信息提取方法,其特征在于,所述方法包括:
获取待提取遥感影像及所述待提取遥感影像中已识别目标地物的空间拓扑关系;
根据所述待提取遥感影像和所述已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到所述待提取遥感影像中多种类型地物的空间信息。
2.根据权利要求1所述的方法,其特征在于,所述随机森林模型采用下述方式进行训练得到:
获取样本遥感影像,所述样本遥感影像中标注有:所述多种类型地物的样本空间特征;
从所述多种类型地物的样本空间特征,重复抽取k次,每次随机抽取m个样本空间特征;k和m分别为大于或等于2的整数;
根据每次抽取的m个样本空间特征,生成具有n个节点的一个决策树,一个节点对应一类样本空间特征;
根据k个决策树,构建所述随机森林模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述多种类型地物的样本空间特征中,未抽取到的样本空间特征,采用所述随机森林模型进行信息提取;
根据信息提取的结果,确定所述随机森林模型的提取误差。
4.根据权利要求2所述的方法,其特征在于,所述从所述多种类型地物的样本空间特征,重复抽取k次,包括:
从每种类型地物的样本空间特征进行筛选,确定所述每种类型地物的目标样本空间特征;
从所述多种类型地物的目标样本空间特征中重复抽取k次。
5.根据权利要求2所述的方法,其特征在于,所述根据k个决策树,构建所述随机森林模型之前,所述方法还包括:
若所述k个决策树中存在目标决策树中的多个节点对应同一样本空间特征,则在所述目标决策树中所述多个节点增加其他类型的空间特征,以对所述目标决策树进行改进;改进后的所述目标决策树中一个节点对应一种类型的空间特征。
6.根据权利要求5所述的方法,其特征在于,所述在所述目标决策树中所述多个节点增加其他类型的空间特征,包括:
在所述目标决策树中所述多个节点随机增加其他类型的空间特征。
7.根据权利要求2所述的方法,其特征在于,所述根据每次抽取的m个样本空间特征,生成具有n个节点的一个决策树,包括:
确定所述每次抽取的m个样本空间特征中,不同类型地物的样本空间特征的数量是否平衡;
若不平衡,采用预设的人工少数类过采样法SMOTE算法,以及预设的聚类方法对所述每次抽取的m个样本空间特征进行预处理;
根据预处理后的样本空间特征,生成具有n个节点的一个决策树。
8.一种基于随机森林的遥感影像信息提取装置,其特征在于,所述装置包括:
获取模块,用于获取待提取遥感影像及所述待提取遥感影像中已识别目标地物的空间拓扑关系;
信息提取模块,用于根据所述待提取遥感影像和所述已识别目标地物的空间拓扑关系,采用预先训练的随机森林模型进行信息提取,得到所述待提取遥感影像中多种类型地物的空间信息。
9.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求1-7任一项所述的基于随机森林的遥感影像信息提取方法。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述权利要求1-7任一项所述的基于随机森林的遥感影像信息提取方法。
CN202011081359.8A 2020-10-10 2020-10-10 基于随机森林的遥感影像信息提取方法、装置及存储介质 Pending CN112232171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011081359.8A CN112232171A (zh) 2020-10-10 2020-10-10 基于随机森林的遥感影像信息提取方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011081359.8A CN112232171A (zh) 2020-10-10 2020-10-10 基于随机森林的遥感影像信息提取方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN112232171A true CN112232171A (zh) 2021-01-15

Family

ID=74111992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011081359.8A Pending CN112232171A (zh) 2020-10-10 2020-10-10 基于随机森林的遥感影像信息提取方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112232171A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297998A (zh) * 2021-05-31 2021-08-24 中煤航测遥感集团有限公司 国土空间规划问题的识别方法、装置、设备及存储介质
CN113378785A (zh) * 2021-07-05 2021-09-10 中煤航测遥感集团有限公司 森林类型识别方法及装置
CN115965622A (zh) * 2023-02-15 2023-04-14 航天宏图信息技术股份有限公司 一种遥感瓦片数据的变化检测方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500344A (zh) * 2013-09-02 2014-01-08 中国测绘科学研究院 一种遥感影像信息提取与解译方法及其模块
CN104156537A (zh) * 2014-08-19 2014-11-19 中山大学 一种基于随机森林的元胞自动机城市扩展模拟方法
CN107807986A (zh) * 2017-10-31 2018-03-16 中南大学 一种描述地物空间关系语义的遥感影像智能理解的方法
CN108280440A (zh) * 2018-02-09 2018-07-13 三亚中科遥感研究所 一种果林识别方法和系统
CN108537238A (zh) * 2018-04-13 2018-09-14 崔植源 一种遥感影像分类与检索方法
US20180268195A1 (en) * 2016-01-27 2018-09-20 Shenzhen University Gabor cube feature selection-based classification method and system for hyperspectral remote sensing images
CN109697411A (zh) * 2018-12-07 2019-04-30 河北工程大学 一种基于统计标准差的地物信息提取方法
CN111178179A (zh) * 2019-12-16 2020-05-19 广州地理研究所 一种基于像元尺度的城市功能区的识别方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500344A (zh) * 2013-09-02 2014-01-08 中国测绘科学研究院 一种遥感影像信息提取与解译方法及其模块
CN104156537A (zh) * 2014-08-19 2014-11-19 中山大学 一种基于随机森林的元胞自动机城市扩展模拟方法
US20180268195A1 (en) * 2016-01-27 2018-09-20 Shenzhen University Gabor cube feature selection-based classification method and system for hyperspectral remote sensing images
CN107807986A (zh) * 2017-10-31 2018-03-16 中南大学 一种描述地物空间关系语义的遥感影像智能理解的方法
CN108280440A (zh) * 2018-02-09 2018-07-13 三亚中科遥感研究所 一种果林识别方法和系统
CN108537238A (zh) * 2018-04-13 2018-09-14 崔植源 一种遥感影像分类与检索方法
CN109697411A (zh) * 2018-12-07 2019-04-30 河北工程大学 一种基于统计标准差的地物信息提取方法
CN111178179A (zh) * 2019-12-16 2020-05-19 广州地理研究所 一种基于像元尺度的城市功能区的识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
M. SHEYKHMOUSA 等: "Support Vector Machine Versus Random Forest for Remote Sensing Image Classification: A Meta-Analysis and Systematic Review", 《IN IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》, no. 13, 25 September 2020 (2020-09-25), pages 6308 - 6325, XP011816722, DOI: 10.1109/JSTARS.2020.3026724 *
李胤 等: "遥感影像三维可视化在新疆西昆仑区域地质调查中的应用", 《地质学刊》, vol. 39, no. 3, 28 September 2015 (2015-09-28), pages 451 - 455 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297998A (zh) * 2021-05-31 2021-08-24 中煤航测遥感集团有限公司 国土空间规划问题的识别方法、装置、设备及存储介质
CN113297998B (zh) * 2021-05-31 2024-04-26 中煤航测遥感集团有限公司 国土空间规划问题的识别方法、装置、设备及存储介质
CN113378785A (zh) * 2021-07-05 2021-09-10 中煤航测遥感集团有限公司 森林类型识别方法及装置
CN115965622A (zh) * 2023-02-15 2023-04-14 航天宏图信息技术股份有限公司 一种遥感瓦片数据的变化检测方法和装置

Similar Documents

Publication Publication Date Title
CN112232171A (zh) 基于随机森林的遥感影像信息提取方法、装置及存储介质
Rangel et al. Phylogenetic uncertainty revisited: Implications for ecological analyses
CN111723732A (zh) 一种光学遥感图像变化检测方法、存储介质及计算设备
Austin Inconsistencies between theory and methodology: a recurrent problem in ordination studies
CN113254549B (zh) 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN107046586B (zh) 一种基于类自然语言特征的算法生成域名检测方法
CN107832849B (zh) 一种基于知识库的电力线廊道三维信息提取方法及装置
CN111091147B (zh) 一种图像分类方法、装置及设备
CN103559205A (zh) 基于MapReduce的并行特征选择方法
CN110837841A (zh) 一种基于随机森林的kpi劣化根因识别方法和装置
CN111783879A (zh) 基于正交注意力机制的层次化压缩图匹配方法及系统
US8738564B2 (en) Method for pollen-based geolocation
CN109145955B (zh) 一种木材识别方法及系统
CN111091194B (zh) 一种基于cavwnb_kl算法的操作系统识别方法
CN116842416B (zh) 一种适用珊瑚礁砂基础管桩侧摩阻力的计算方法
Rieck et al. Structural analysis of multivariate point clouds using simplicial chains
Dai et al. MDC-Net: A multi-directional constrained and prior assisted neural network for wood and leaf separation from terrestrial laser scanning
CN111581487B (zh) 一种信息处理方法及装置
Ahuja et al. Using machine learning to accelerate data wrangling
CN111091087B (zh) 基于多视图协同典型相关森林遥感影像土地覆盖提取算法
Moore et al. Correlation dimension in empirical networks
Bischoff et al. Evaluating the Effects of Randomness on Missing Data in Archaeological Networks
CN111539490B (zh) 一种业务模型训练方法和装置
CN117172578B (zh) 一种基于微生物识别的土壤生态环境修复方法及系统
CN117806832B (zh) 一种提升模型训练速度的方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination