CN103984960A - 一种遥感图像样本智能采集方法 - Google Patents

一种遥感图像样本智能采集方法 Download PDF

Info

Publication number
CN103984960A
CN103984960A CN201410235129.0A CN201410235129A CN103984960A CN 103984960 A CN103984960 A CN 103984960A CN 201410235129 A CN201410235129 A CN 201410235129A CN 103984960 A CN103984960 A CN 103984960A
Authority
CN
China
Prior art keywords
sample
classification
probability
pixel
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410235129.0A
Other languages
English (en)
Other versions
CN103984960B (zh
Inventor
霍连志
赵理君
李腾
周增光
胡昌苗
郑柯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Remote Sensing and Digital Earth of CAS
Original Assignee
Institute of Remote Sensing and Digital Earth of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Remote Sensing and Digital Earth of CAS filed Critical Institute of Remote Sensing and Digital Earth of CAS
Priority to CN201410235129.0A priority Critical patent/CN103984960B/zh
Publication of CN103984960A publication Critical patent/CN103984960A/zh
Application granted granted Critical
Publication of CN103984960B publication Critical patent/CN103984960B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种遥感图像样本智能采集方法。该样本采集方法能够有效的选择图像分类所需要的样本集合,降低样本采集的时间和金钱成本。该方法包括以下步骤:对于待分类的遥感图像,首先由用户随机标记少量的样本;用这些少量的样本对图像先进行图像分类;将分类结果转换为各类别的概率;选取图像中最有信息量的一组未标记样本;由用户对这组未标记的样本集合进行类别标记;新标记的样本集合与已有的样本集组成新的样本集;使用新的样本集对图像重新进行训练;迭代进行上述过程;当满足一定的条件时,迭代停止,得到一组样本。

Description

一种遥感图像样本智能采集方法
技术领域
本发明涉及遥感图像处理技术,具体的说,涉及一种遥感图像样本智能采集方法,该样本采集方法能够极大降低图像分类所需要的样本数目,从而降低样本采集的成本。
背景技术
遥感技术在很多领域得到广泛应用,如森林资源规划、农作物估产、环境监测等。遥感图像分类技术是把遥感图像从数据转换为信息的关键步骤。从是否需要训练样本来分,遥感图像分类方法分为监督分类和非监督分类。在遥感图像分类中最常用的是监督分类方法。监督分类方法,需要人工地确定分类体系、各个类别的训练样本等。对监督分类方法而言,在分类器已经确定的情况下,分类效果的好坏很大程度上取决于训练样本的数量与质量。
目前遥感图像分类中样本采集的方法主要包括,随机采样和分层采样。随机采样是指随机地在整幅图像上选取一些点,然后去实地或者通过图像解译确定这些点的类别信息。随机采样的最大优点在于其统计上和参数估计上的简易性。当图像中某些类别占的数量较少时,随机采样往往会丢掉这些类别。为了保证每个类别都能在采样中出现,可以采用分层采样,即分别对每个类别进行随机采样。上述两种样本采集策略的主要缺点是:不能确定获得满意的分类效果需要多少数目的样本;不知道在已有数量样本的情况下能否获得好的分类效果。基本上可以认为,我们只是这样设计了样本采集的原则(可能耗费了很大的时间和金钱成本),但是能获得什么样的分类效果,只能听“天”由命了。并且,这种样本采集策略都是在图像分类之前完成的。
本专利提出了一种新型的遥感图像样本采集方法;针对遥感图像处理领域样本采集费时费力等特点,本专利提出了一种能够在分类过程中通过目前的分类结果预测出类别信息非常模糊的样本,然后由样本采集人员对这些样本点进行类别标记,形成更新后的训练样本集,并进行重新分类的样本采集方法。这种样本采集方法是一种迭代的过程,能够在初始有极少量样本的情况下,始终选择对分类最有效的样本集,避免了过多冗余样本的采集,从而很大程度上减少了样本采集的总量,进而降低样本采集的时间和金钱成本。
发明内容
本发明的目的是提供一种遥感图像样本智能采集方法。
本发明的基本思路为:对于待分类的遥感图像,首先由用户随机标记少量的样本;用这些少量的样本对图像先进行图像分类;依据某种准则,选取图像中分类效果最不准确的一组未标记的样本点;由用户对这组未标记的样本集合进行类别标记;新标记的样本集合与已有的样本集组成新的样本集;使用新的样本集对图像重新进行训练;迭代进行上述过程,得到一组样本。
本发明的技术方案提供的一种遥感图像样本智能采集的方法,其特征在于包括以下实施步骤:
A 对于待分类的遥感图像,首先由用户随机标记少量的样本;
B 使用已有的样本集对图像进行训练,并使用分类器对图像进行分类;
C 对步骤B中每个像素的分类结果转换为各类别的概率;
D 对步骤C中每个像素的类别概率,按照从小到大升序排列;
E 求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和;
F 对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并选择出求和值最小的一组像素,作为未标记的样本;
G 由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合;
H 重复步骤B-步骤G,直到获得足够多的样本集合。
上述实施步骤的特征在于:
步骤A中待分类的遥感图像主要是指光学图像数据;用户首先对待分类的遥感图像,确认好分类体系,确认总共有几个类别,假设为K个类别;对K个类别中的每一个类别首先选定少量(少于10个)样本;样本确认可以通过图像解译的方式或者实地样本采集的方式。
步骤B中所述的选用分类器进行分类,是指选用遥感图像分类中常用分类器,如最大似然分类器、支持向量机分类器等。
步骤C中所述的每个像素的分类结果转换为各类别的概率,是对某像素x,计算出其属于K个类别中各个类别的概率;对于某些分类器,如最大似然分类器,分类结果中就有属于各个类别的概率;而对于另一些分类器,如支持向量机分类器,分类结果并不直接输出各个类别的概率,需要通过一些计算过程把支持向量机输出结果转换为各个类别的概率。
步骤D是指,对于任意像素x,对应K个类别的概率按照从小到大进行排列,记为P(k),k=1,...,K,并且P(1)<P(2)<...<P(K)。
步骤E是指,对任意像素x,计算最小的c个概率的和其中1<c<K/2,c为整数。
步骤F是指对所有的Sx按照从小到大进行排列,并选择出Sx值最小的m个像素,其中m为大于1的整数。
步骤G是指,由用户对步骤F中所选的m个未标记样本进行类别属性的标记,标记过程同步骤A一样,可以通过图像解译的方式,也可以通过实地样本采集进行类别属性的确认的方式。
步骤H是指,重复步骤B-步骤G,直到采集的样本数目足够多迭代停止,输出总的采集的样本。
本发明与现有技术相比有如下特点:该样本采集方法是一个迭代的过程,当分类结果趋于稳定时,我们“确信”不需要采集更多的样本了;另外,通过这种样本采集方法,获得相同的分类精度,所需要的训练样本要远远少于随机样本采集方法,从而大大降低样本采集的时间和金钱的成本。
附图说明:
图1是一种遥感图像样本智能采集方法流程图
具体实施方式:
采用本发明实现一种遥感图像样本智能采集策略的实施例如图1所示,现结合图1对其进行描述。
处理单元100利用现有的样本信息,选用图像的光谱特征,对选定的分类器(如支持向量机分类器)进行分类器的训练,学习得到最佳的分类器参数。假设待分类的图像包括如下地物类型:农田、林地、草地、裸土、水体、建成区,即地物类型数目K=6,各个类别的初始样本数目都为5个。
处理单元101使用处理单元100训练得到的分类器,对图像中所有的像素进行分类,得到各个像素的类别信息。
处理单元102将分类结果转换为各类别的概率。具体的转换过程为:
对于K个类别,需要计算出对应各个类别的概率P(k),k=1,...,K,首先任意两个类别之间的概率rij
r ij = 1 1 + e A f ^ + B
其中A和B是基于已有的样本数据以及支持向量机的预测值通过负对数似然函数进行估计得到;其次,通过下述的最小化问题:
min P Σ i = 1 K Σ j : j ≠ i ( r ij P ( i ) - r ij P ( j ) ) 2
其中, Σ i = 1 K P ( i ) = 1 , P ( i ) ≥ 0 , ∀ i
上述最小化问题可以使用常用的优化算法进行求解。
处理单元103为计算最有信息量的一组未标记的样本,具体流程为:对于任意像素x,在K=6个类别中,计算概率最小的c=2个概率之和Sx;获得所有的Sx后,对Sx按照从小到到进行升序排序;选择出Sx值最小的m=20个未标记样本。通过上述过程,选择出来的这m=20个样本是最有信息量(即对后续分类器的改进最大)的一组未标记样本集合。需要说明的是,m值的选择可以需要自行设置。
处理单元104由用户对处理单元103选择出来的m=20个未标记的样本进行类别的标记,类别标记过程可以通过图像的目视解释(主要是中高分辨率的遥感图像)完成,也可以到实地进行类别的确认。
处理单元105为上述迭代过程的停止条件。停止条件一般有两种方式:迭代次数控制和分类效果控制。迭代次数控制是指当迭代次数达到一定的数目(如10次)时迭代停止;而分类效果控制是指通过观察迭代过程中处理单元101得到的分类结果是否满足应用的需求而决定是否停止迭代。
本发明的一个实例在PC平台上实现,经实验验证,该遥感图像样本采集策略,能够很好的进行样本选择;从而在保证达到一定的分类精度的前提下,进行最少数目的样本的标记,进而降低样本采集的时间和金钱成本。
应当指出,以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明,但不以任何方式限制本发明。因此,本领域技术人员应当理解,仍然可以对本发明进行修改或者等同替换;而一切不脱离本发明的精神和技术实质的技术方案及其改进,其均应涵盖在本发明专利的保护范围当中。

Claims (7)

1.一种遥感图像样本智能采集方法,其特征在于包括以下步骤:
A 对于待分类的遥感图像,首先由用户随机标记少量的样本;
B 使用已有的样本集对图像进行训练,并使用分类器对图像进行分类;
C 对步骤B中每个像素的分类结果转换为分类各类别的概率;
D 对步骤C中每个像素的分类类别概率,按照从小到大升序排列;
E 求取步骤D中计算出的每个像素最小的一组(小于类别数目)概率,并求和;
F 对步骤E中每个像素最小的一组概率分别求和之后,对求和的值进行按照从小到大进行顺序排列;并选择出求和值最小的一组像素,作为未标记的样本;
G 由用户对步骤F中获得的一组未标记样本进行样本标记,与步骤A中的样本组成新的样本集合;
H 重复步骤B-步骤G,直到获得足够多的样本集合。
2.根据权利要求1所述的方法,其特征在于步骤A中每个类别的样本数目少于10个。
3.根据权利要求1所述的方法,其特征在于步骤D中各个像素的类别概率按照从小到大升序排列。
4.根据权利要求1所述的方法,其特征在于步骤E中最小的一组的数目c的取值范围为,1<c<K/2,且为整数,K为分类的类别数目。
5.根据权利要求1所述的方法,其特征在于步骤F中对求取的最小的一组概率进行求和。
6.根据权利要求1所述的方法,其特征在于步骤F中对求取的概率之和最小的一组像素作为未标记的样本。
7.根据权利要求1所述的方法,其特征在于步骤G中用户对步骤F中所选的未标记样本进行类别属性的标记,标记方式为通过图像解译或通过实地样本采集进行类别属性的确认。
CN201410235129.0A 2014-05-30 2014-05-30 一种遥感图像样本智能采集方法 Active CN103984960B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410235129.0A CN103984960B (zh) 2014-05-30 2014-05-30 一种遥感图像样本智能采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410235129.0A CN103984960B (zh) 2014-05-30 2014-05-30 一种遥感图像样本智能采集方法

Publications (2)

Publication Number Publication Date
CN103984960A true CN103984960A (zh) 2014-08-13
CN103984960B CN103984960B (zh) 2017-12-08

Family

ID=51276922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410235129.0A Active CN103984960B (zh) 2014-05-30 2014-05-30 一种遥感图像样本智能采集方法

Country Status (1)

Country Link
CN (1) CN103984960B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203755A (zh) * 2017-05-31 2017-09-26 中国科学院遥感与数字地球研究所 一种用于遥感图像时间序列标记样本自动增新的方法、装置和系统
CN110363798A (zh) * 2019-07-24 2019-10-22 宁波市测绘设计研究院 一种遥感影像解译样本集的生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009086158A2 (en) * 2007-12-20 2009-07-09 Imagetree Corp. Remote sensing and probabilistic sampling based method for determining the carbon dioxide volume of a forest
CN102024153A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 高光谱图像监督分类方法
CN102073867A (zh) * 2010-12-27 2011-05-25 北京师范大学 一种遥感图像分类方法及装置
CN103489005A (zh) * 2013-09-30 2014-01-01 河海大学 一种基于多分类器融合的高分辨率遥感影像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009086158A2 (en) * 2007-12-20 2009-07-09 Imagetree Corp. Remote sensing and probabilistic sampling based method for determining the carbon dioxide volume of a forest
CN102073867A (zh) * 2010-12-27 2011-05-25 北京师范大学 一种遥感图像分类方法及装置
CN102024153A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 高光谱图像监督分类方法
CN103489005A (zh) * 2013-09-30 2014-01-01 河海大学 一种基于多分类器融合的高分辨率遥感影像分类方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203755A (zh) * 2017-05-31 2017-09-26 中国科学院遥感与数字地球研究所 一种用于遥感图像时间序列标记样本自动增新的方法、装置和系统
CN107203755B (zh) * 2017-05-31 2021-08-03 中国科学院遥感与数字地球研究所 一种用于遥感图像时间序列标记样本自动增新的方法、装置和系统
CN110363798A (zh) * 2019-07-24 2019-10-22 宁波市测绘设计研究院 一种遥感影像解译样本集的生成方法

Also Published As

Publication number Publication date
CN103984960B (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
CN109800736B (zh) 一种基于遥感影像和深度学习的道路提取方法
CN107784661A (zh) 基于区域生长法的变电站设备红外图像分类识别方法
CN110827260B (zh) 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法
CN103617429A (zh) 一种主动学习分类方法和系统
CN105825511A (zh) 一种基于深度学习的图片背景清晰度检测方法
CN102323972B (zh) 一种相控阵雷达资源管理方法
CN111723657B (zh) 一种基于YOLOv3与自优化的河道异物检测方法及装置
CN103258214A (zh) 基于图像块主动学习的遥感图像分类方法
CN104866869A (zh) 基于分布差异与增量学习的时序sar图像分类方法
CN103617435A (zh) 一种主动学习图像分类方法和系统
CN110298348B (zh) 遥感影像建筑物样本区域提取方法及系统、存储介质、设备
CN105787501A (zh) 输电线路走廊区域自动选择特征的植被分类方法
CN115862073B (zh) 一种基于机器视觉的变电站危害鸟种目标检测和识别方法
CN107239759A (zh) 一种基于深度特征的高空间分辨率遥感图像迁移学习方法
CN109492700A (zh) 一种基于多维信息融合的复杂背景目标识别方法
CN106228136A (zh) 基于聚合通道特征的全景街景隐私保护方法
CN111461120A (zh) 一种基于区域的卷积神经网络物体表面缺陷检测方法
Mookkaiah et al. Design and development of smart Internet of Things–based solid waste management system using computer vision
CN104408472A (zh) 基于Wishart和SVM的极化SAR图像分类方法
CN117370919B (zh) 污水处理设备远程监控系统
CN103984960A (zh) 一种遥感图像样本智能采集方法
CN106875061A (zh) 一种目标路径确定的方法以及相关装置
CN104700427A (zh) 一种基于sar图像的道路损毁信息提取方法
CN107273914A (zh) 基于信源自适应动态选择的高效融合识别方法
CN111985782A (zh) 基于环境感知的自动驾驶有轨电车运行风险评估方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant