CN111414863B - 一种增强型集成遥感影像分类方法 - Google Patents

一种增强型集成遥感影像分类方法 Download PDF

Info

Publication number
CN111414863B
CN111414863B CN202010207087.5A CN202010207087A CN111414863B CN 111414863 B CN111414863 B CN 111414863B CN 202010207087 A CN202010207087 A CN 202010207087A CN 111414863 B CN111414863 B CN 111414863B
Authority
CN
China
Prior art keywords
remote sensing
sensing image
training
classifier
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010207087.5A
Other languages
English (en)
Other versions
CN111414863A (zh
Inventor
焦红波
郭丽
窦鹏
张峰
李艳雯
杨晓彤
侯辰
王力彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NATIONAL MARINE DATA AND INFORMATION SERVICE
Original Assignee
NATIONAL MARINE DATA AND INFORMATION SERVICE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NATIONAL MARINE DATA AND INFORMATION SERVICE filed Critical NATIONAL MARINE DATA AND INFORMATION SERVICE
Priority to CN202010207087.5A priority Critical patent/CN111414863B/zh
Publication of CN111414863A publication Critical patent/CN111414863A/zh
Application granted granted Critical
Publication of CN111414863B publication Critical patent/CN111414863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/259Fusion by voting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种增强型集成遥感影像分类方法,分为集成学习模型训练和遥感影像分类两个步骤。(1)模型训练:利用从遥感影像上获取的样本构建样本集,然后分别使用随机森林法、Bagging法和随机子空间法分别训练不同类型的基分类器,构建基分类器集。(2)对于遥感影像中的每一个待分类像素,分别使用基分类器集中的每一个集分类器分类,得到一个分类结果集,然后对所有的分类结果采用多数投票法进行投票,得票最多的类别,视为当前像素最终的判断类别。这样,对整幅影像进行分类,即可得到最接近实际目标的解译结果。该方法在增强基分类器多样性的基础上,实现了RandomForest,Bagging和随机子空间的有效集成,有效提高遥感影像的分类精度。

Description

一种增强型集成遥感影像分类方法
技术领域
本发明属于遥感影像自动化分类技术领域,尤其是涉及一种增强型集成遥感影像分类方法。
背景技术
利用遥感影像能够快速实时地获取大范围的土地利用信息,而如何对遥感影像进行分类,获取地物属性,是土地利用变化监测等领域需要解决的重要问题。机器学习的方法使得遥感信息的提取得到了快速的发展。典型的算法如最决策树法(Decision Tree,DT)、最小距离法(Minimum Distance,MD)、支持向量机(Support Vector Machine,SVM)、朴素贝叶斯(Naive Bayes,NB)、人工神经网(Artificial Neural Network,ANN)等都在遥感影像分类中得到了广泛的应用。
然而,这些方法大都使用一个分类器,对于由样本,算法等问题引起的精度差,容易过拟合的问题很难克服。集成学习有效的解决了该问题。所谓的集成学习就是使用多个分类器对同一个实体进行分类,然后通过一定的集成手段获得最接近实际类别的分类结果。目前一些典型的集成学习方法有随机森林法、Bagging法、随机子空间法和AdaBoost等。这些方法都通过构建具有多样性的基分类器,并通过投票的方法实现多分类器的集成。和使用单个分类器相比,集成学习分类方法的精度更高,鲁棒性更强,因此被越来越广泛的应用到遥感影像的分类中。
然而,现有的这些集成学习方法在生成具有多样性的基分类器方面使用的方法比较单一,使得精度提升的空间受到了一定的限制。为此,使用多种基分类器的生成方法,是增强基分类器多样性,提高集成学习分类精度的重要手段。随机森林、Bagging和随机子空间方法分别具有不同的基分类器生成方法,将三种方法的基分类器生成方法进行有效结合,有望在原始算法的基础上,进一步增强基分类器的多样性,实现样影像分类精度的提升。而目前,尚且还未有发明实现三者的有效结合来提高分类精度。
发明内容
鉴于Bagging、随机子空间和随机森林在生成具有多样性基分类器方面能力的不足,本发明从增强基分类器生成方法入手,将三种算法生成基分类器的方法进行了融合,提出了一种增强型的集成学习遥感影像分类算法,设计合理,克服了传统集成学习分类方法的不足,应用到遥感影像分类中具有良好效果。
本发明的核心思想是:提出一种综合Bagging、随机子空间和随机森林的增强型多分类器集成方法,本方法将Bagging、随机子空间和随机森林三种方法进行有效的结合,生成不同类型的基分类器;对于一个待分类实体,所有的基分类器输出自己的结果,最后通过多数投票,得到更加精确的分类结果。
为达到上述目的,本发明的技术方案是这样实现的:
一种增强型集成遥感影像分类方法,包含如下步骤:
步骤1:在遥感影像上选择样本点,通过样本点提取遥感影像的特征,得到样本集S,特征集F,特征集的个数n,设置空集H={};
步骤2:确定迭代次数K,随机抽样的比例r;
步骤3:设置迭代变量i从0到K进行循环执行下列操作,循环结束转到步骤4:
步骤2-1:根据比例r,计算从S中抽取样本的个数ni
步骤2-2:采用有放回随机抽样的方法,从S中抽取ni个训练样本,得到训练集Si
步骤2-3:使用训练集Si训练CART得到基分类器hi-1
步骤2-3:生成随机数a∈(1,n),并从特征集F中抽取a个特征,生成特征子集Fi;利用Fi和样本集Si构建训练集Si-2,并利用Si-2训练CART得到基分类器hi-2
步骤2-4:使用训练集Si训练随机森林的决策树得到基分类器hi-3
步骤2-5:将基分类器hi-1、hi-2、hi-3构建分类器集合hi={hi-1、hi-2、hi-3},并将hi并入到集合H中;
步骤2-6:令i=i+1,转入下一轮迭代,转到执行步骤2-1;
步骤4:执行完步骤3,得到具有3×K个分类器的分类器集合H;
步骤5:针对遥感影像的每个像素x,其最终的分类结果可以通过如下公式通过多数投票的方法获得:
Figure BDA0002421492190000031
对所有像素分类,即可得到最终的遥感影像分类结果。
进一步的,步骤2-4的具体步骤为:随机从特征集F中抽取m(m≤n)个特征,生成特征子集Fi-3,使用信息增益的方法选择最佳分裂特征,构建C4.5决策树,得到分类器hi-3
进一步的,在遥感影像上使用人工解译的方法选择样本点。
相对于现有技术,本发明具有以下优势:
本发明提出的增强型集成遥感影像分类方法能够生成更具多样性的基分类器,从而集成Bagging、随机子空间、随机森林三种集成学习方法的分类优势,克服传统集成学习方法由于基分器多样性不而高引起的精度低,容易过拟合的缺点,达到高效、高精度样影像分类的目的。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述方法的原理图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
首先介绍本发明所需要的理论基础,Bagging、随机子空间和随机森林。
Bagging的算法:假设训练集S={(x1,y1),(x2,y2),…,(xn,yn)}(xj∈X,yj∈Y),其中,n是样本的总个数,X和Y分别代表样本的特征空间和类别标签,K是迭代的次数。Bagging方法的具体过程为,首先从训练集中采用随机有放回的方式抽取样本,构建大小形同,但内容不同的训练集来生成不同的基分类器;对于一个待分类实体x,每个基分类器都输出各自的分类结果,之后,对所有基分类器的输出结果进行多数投票,将得票数最多的类别作为最终的分类结果。
随机子空间算法:假设训练集S={(x1,y1),(x2,y2),…,(xn,yn)}(xj∈X,yj∈Y),其中,n是样本的总个数,X和Y分别代表样本的特征空间和类别标签,F是训练集S的特征空间。随机子空间的执行过程为:从F中随机选取m个特征,构成随机特征子空间Fi,然后根据Fi从S中获取样本集Si,并利用Si训练一个基分类器。依次类推,迭代K次,就可以构建K个不同的基分类器。对于一个待分类实体x,每个基分类器都输出各自的分类结果,之后,对所有基分类器的输出结果进行多数投票,将得票数最多的类别作为最终的分类结果。
随机森林法:假设训练集S={(x1,y1),(x2,y2),…,(xn,yn)}(xj∈X,yj∈Y),其中,n是样本的总个数,X和Y分别代表样本的特征空间和类别标签,F是训练集S的特征空间。随机森林包括了两个随机过程。首先,使用有放回的随机抽样的方法自助选择从S中选择样本集Si,通过样本集的选择,降低所构建决策树之间的相关性。其次,在构建决策树时,针对每一个分类节点,从样本的原始特征集F中,随机抽取特征子集Fi,然后依据一定的规则选择最优特征作为决策树节点的分裂依据。两种随机过程的有效结合,降低了分类过程中的偏差,消除了决策树构建过程中的过拟合。
基于Bagging、随机子空、和随机森林,如图1所示,本发明具体的实施过程分为模型训练和遥感影像分类两部分:
训练部分:主要训练分类模型,具体步骤如下:
步骤1:在遥感影像上使用人工解译的方法,选择样本点,通过样本点提取遥感影像的特征,得到样本集S,特征集F,特征集的个数n,设置空集H={}。
步骤2:确定迭代次数K,随机抽样的比例r。
步骤3:将i从0到K进行循环执行下列操作:
步骤2-1:根据比例r,计算从S中抽取样本的个数ni
步骤2-2:采用有放回随机抽样的方法,从S中抽取ni个训练样本,得到训练集Si
步骤2-3:使用Si训练CART分类hi-1
步骤2-3:生成随机数a∈(1,n),并从特征集F中抽取a个特征,生成特征子集Fi;利用Fi和样本集Si构建训练集Si-2,并利用Si-2训练CART分类hi-2
步骤2-4:使用Si训练随机森林的决策树分类器hi-3,具体步骤如为:随机从特征集F中抽取m(m≤n)个特征,生成特征子集Fi-3,使用信息增益的方法选择最佳分裂特征,构建C4.5决策树,得到分类器hi-3
步骤2-5:将hi-1、hi-2、hi-3构建分类器集合hi={hi-1、hi-2、hi-3},并将hi并入到集合H中。
步骤2-6:令i=i+1,转入下一轮迭代,执行步骤2-1。
步骤4:执行完步骤3,得到具有3×K个分类器的分类器集合H
分类部分:针对遥感影像的每个像素x,其最终的分类结果可以通过如下公式通过多数投票的方法获得。
Figure BDA0002421492190000061
对所有像素分类,即可得到最终的遥感影像分类结果。
本发明的增强型集成遥感影像分类方法,使用Bagging方法生成基分类器hi-1,使用随机子空间法生成基分类器hi-2,使用随机森林方法构建基分类器hi-3,多次迭代,得到的基分类器集合H同时具备了Bagging,随机子空间和随机森林特性的不同分类器,增强了基分类器的多样性。再对于遥感影像中的单个像素x,基分类器集合H中的每一个分类器输出分类结果,并对所有结果利用公式(1)进行加权投票集成,能够有效克服传统集成分类方法的不足,对遥感影像的分类性能进行有效提升。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种增强型集成遥感影像分类方法,其特征在于,包含如下步骤:
步骤1:在遥感影像上选择样本点,通过样本点提取遥感影像的特征,得到样本集S,特征集F,特征集的个数n,设置空集H={};
步骤2:确定迭代次数K,随机抽样的比例r;
步骤3:设置迭代变量i从0到K进行循环执行下列操作,循环结束转到步骤4:
步骤2-1:根据比例r,计算从S中抽取样本的个数ni
步骤2-2:采用有放回随机抽样的方法,从S中抽取ni个训练样本,得到训练集Si
步骤2-3:使用训练集Si训练CART得到基分类器hi-1
步骤2-3:生成随机数a∈(1,n),并从特征集F中抽取a个特征,生成特征子集Fi;利用Fi和样本集Si构建训练集Si-2,并利用Si-2训练CART得到基分类器hi-2
步骤2-4:使用训练集Si训练随机森林的决策树得到基分类器hi-3
步骤2-5:将基分类器hi-1、hi-2、hi-3构建分类器集合hi={hi-1、hi-2、hi-3},并将hi并入到集合H中;
步骤2-6:令i=i+1,转入下一轮迭代,转到执行步骤2-1;
步骤4:执行完步骤3,得到具有3×K个分类器的分类器集合H;
步骤5:针对遥感影像的每个像素x,其最终的分类结果可以通过如下公式通过多数投票的方法获得:
Figure FDA0003840896420000011
对所有像素分类,即可得到最终的遥感影像分类结果;
步骤2-4的具体步骤为:随机从特征集F中抽取m(m≤n)个特征,生成特征子集Fi-3,使用信息增益的方法选择最佳分裂特征,构建C4.5决策树,得到分类器hi-3
2.根据权利要求1所述的方法,其特征在于:在遥感影像上使用人工解译的方法选择样本点。
3.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1所述方法的步骤。
4.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1所述方法的步骤。
CN202010207087.5A 2020-03-23 2020-03-23 一种增强型集成遥感影像分类方法 Active CN111414863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010207087.5A CN111414863B (zh) 2020-03-23 2020-03-23 一种增强型集成遥感影像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010207087.5A CN111414863B (zh) 2020-03-23 2020-03-23 一种增强型集成遥感影像分类方法

Publications (2)

Publication Number Publication Date
CN111414863A CN111414863A (zh) 2020-07-14
CN111414863B true CN111414863B (zh) 2023-01-17

Family

ID=71493192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010207087.5A Active CN111414863B (zh) 2020-03-23 2020-03-23 一种增强型集成遥感影像分类方法

Country Status (1)

Country Link
CN (1) CN111414863B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308151A (zh) * 2020-11-03 2021-02-02 西安电子科技大学 基于加权的旋转森林高光谱图像分类方法
CN112949738B (zh) * 2021-03-17 2024-03-05 西安电子科技大学 基于eecnn算法的多类不平衡高光谱图像分类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500344A (zh) * 2013-09-02 2014-01-08 中国测绘科学研究院 一种遥感影像信息提取与解译方法及其模块
CN105138913A (zh) * 2015-07-24 2015-12-09 四川大学 一种基于多视集成学习的恶意软件检测方法
CN109886340A (zh) * 2019-02-26 2019-06-14 山东星蓝信息科技有限公司 一种遥感影像分类方法
CN110363403A (zh) * 2019-06-27 2019-10-22 中国铁道科学研究院集团有限公司 铁路钢轨损伤预测方法及装置
CN110751035A (zh) * 2019-09-16 2020-02-04 中国农业大学 一种制种玉米的识别方法及装置
CN110826618A (zh) * 2019-11-01 2020-02-21 南京信息工程大学 一种基于随机森林的个人信用风险评估方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3332708B1 (en) * 2016-12-08 2019-07-31 Agfa Nv Protective bag dispensing system for a mobile x-ray apparatus

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500344A (zh) * 2013-09-02 2014-01-08 中国测绘科学研究院 一种遥感影像信息提取与解译方法及其模块
CN105138913A (zh) * 2015-07-24 2015-12-09 四川大学 一种基于多视集成学习的恶意软件检测方法
CN109886340A (zh) * 2019-02-26 2019-06-14 山东星蓝信息科技有限公司 一种遥感影像分类方法
CN110363403A (zh) * 2019-06-27 2019-10-22 中国铁道科学研究院集团有限公司 铁路钢轨损伤预测方法及装置
CN110751035A (zh) * 2019-09-16 2020-02-04 中国农业大学 一种制种玉米的识别方法及装置
CN110826618A (zh) * 2019-11-01 2020-02-21 南京信息工程大学 一种基于随机森林的个人信用风险评估方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
差异性随机子空间集成;丁毅等;《计算机科学与探索》;20170622;第9卷(第12期);第1433-1438页 *

Also Published As

Publication number Publication date
CN111414863A (zh) 2020-07-14

Similar Documents

Publication Publication Date Title
Liu et al. Progressive neural architecture search
Dong et al. One-shot neural architecture search via self-evaluated template network
CN109241317B (zh) 基于深度学习网络中度量损失的行人哈希检索方法
Zou et al. Deep learning based feature selection for remote sensing scene classification
Donahue et al. Decaf: A deep convolutional activation feature for generic visual recognition
JP5521881B2 (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
WO2019001071A1 (zh) 一种基于邻接矩阵的图特征提取系统、图分类系统和方法
CN109063112B (zh) 一种基于多任务学习深度语义哈希的快速图像检索方法、模型及模型构建方法
CN103425996B (zh) 一种并行分布式的大规模图像识别方法
CN104392250A (zh) 一种基于MapReduce的图像分类方法
Champ et al. A comparative study of fine-grained classification methods in the context of the LifeCLEF plant identification challenge 2015
CN112733866A (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN102314614A (zh) 一种基于类共享多核学习的图像语义分类方法
CN113408605A (zh) 基于小样本学习的高光谱图像半监督分类方法
CN111414863B (zh) 一种增强型集成遥感影像分类方法
CN105320967A (zh) 基于标签相关性的多标签AdaBoost集成方法
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索系统与方法
Ouppaphan Corn disease identification from leaf images using convolutional neural networks
CN112232395B (zh) 一种基于联合训练生成对抗网络的半监督图像分类方法
Li et al. An Image Classification Method Based on Optimized Fuzzy Bag-of-words Model.
Pichel et al. A new approach for sparse matrix classification based on deep learning techniques
Costa et al. Demonstrating the Evolution of GANs through t-SNE
CN108596118B (zh) 一种基于人工蜂群算法的遥感影像分类方法及系统
CN104598898A (zh) 一种基于多任务拓扑学习的航拍图像快速识别系统及其快速识别方法
CN115471856A (zh) 一种发票图像信息识别方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant