CN110688934A - 一种空间采样主动学习分类方法、电子设备及存储介质 - Google Patents

一种空间采样主动学习分类方法、电子设备及存储介质 Download PDF

Info

Publication number
CN110688934A
CN110688934A CN201910899013.XA CN201910899013A CN110688934A CN 110688934 A CN110688934 A CN 110688934A CN 201910899013 A CN201910899013 A CN 201910899013A CN 110688934 A CN110688934 A CN 110688934A
Authority
CN
China
Prior art keywords
sample
training
candidate
iteration
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910899013.XA
Other languages
English (en)
Other versions
CN110688934B (zh
Inventor
马仪
周仿荣
周兴梅
马御棠
潘浩
黄然
文刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power System Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power System Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power System Ltd filed Critical Electric Power Research Institute of Yunnan Power System Ltd
Priority to CN201910899013.XA priority Critical patent/CN110688934B/zh
Publication of CN110688934A publication Critical patent/CN110688934A/zh
Application granted granted Critical
Publication of CN110688934B publication Critical patent/CN110688934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本申请涉及高维图像处理技术领域,具体而言,涉及一种空间采样主动学习分类方法、电子设备及存储介质。本申请提供一种空间采样主动学习分类方法,包括以下步骤:S1、获取图像数据;S2、获取分割结果;S3、获取初始训练集和初始候选集;S4、设置迭代次数、样本个数;S5、训练分类器;S6、获取候选集样本属于类别的概率;S7、获取候选样本BT值;S8、获取候选样本的选择优先级权重因子;S9、获取SBT值;S10、SBT值最小的n个候选样本加入训练;S11、更新候选集;S12、迭代次数小于预设值,重复步骤S5至S11;S13、迭代次数大于等于预设值,使用最终的训练集训练分类器获取并输出最终分类结果。

Description

一种空间采样主动学习分类方法、电子设备及存储介质
技术领域
本申请涉及高维图像处理技术领域,具体而言,涉及一种空间采样主动学习分类方法、电子设备及存储介质。
背景技术
在传统多波段遥感图像分类中,很多地物由于形状等空间信息相近,光谱信息不足,而难以得到一个较好的分辨率。近年来,随着光学遥感的发展,高光谱遥感技术也日臻成熟。与传统光学遥感相比,高光谱遥感技术可以精细探测地物的光谱信息,获取到地物的连续光谱曲线,获益于丰富的光谱信息,高光谱图像更易分辨地物的材质等内在属性信息,为遥感图像分类的进一步发展提供了极大的可能性。
图像分类是遥感技术的重要应用。其中,无监督分类算法由于缺少先验信息,很难达到较为理想的分类效果,因此监督分类算法应用较为广泛。然而,监督分类算法的效果与训练样本的数量密切相关。并且在一些实现方式中,人工专家样本标记困难重重、费时费力,受制于实际采样条件与采样成本,获取足够数量的训练样本往往难以实现。在一些实现方式中,例如主动学习(Active learning)算法,通过人机交互过程,在每次迭代中指引人工专家去标记那些训练器认为最具训练价值的未标记样本,以期在标记样本数量有限的情况下,最大化提升训练效果。但是,这些算法在采样过程中仅仅考虑了光谱信息差异,并没有考虑到考虑空间信息差异,导致采样效率和精度的不足,影响了图像分类的输出效果。
因此,如何对采集样本加入空间信息差异评估,如何结合光谱信息差异和空间信息差异提高空间采样的样本训练价值成为了一个逞待解决的问题。
发明内容
本申请的目的在于提供一种空间采样主动学习分类方法、电子设备及存储介质,通过对高光谱图像进行超像素分割,对未标记样本的预测不确定性以及对空间均匀采样的促进能力进行估计,利用结合光谱信息差异和空间信息差异对样本的训练价值做一个综合评定,更新的训练集,并输出最终优化的分类结果。进一步可以提高训练样本的价值、降低光谱变异等因素对采样过程的干扰、提高空间采样效率以及提高图像分类准确率。
本申请的实施例是这样实现的:
本申请实施例的第一方面提供一种空间采样主动学习分类方法,包括以下步骤:
S1、获取高光谱图像数据H(m,n,b),其中m、n表示空间像素点位置,b表示所处光谱波段位置;
S2、基于所述高光谱图像数据,获取超像素分割结果S(m,n),其中m、n表示空间像素点位置;
S3、获取初始训练集
Figure BDA0002211225030000021
和初始候选集
S4、设置主动学习目标迭代次数I、每次迭代新增训练样本个数n;
S5、训练多项式逻辑回归分类器;
S6、获取候选集
Figure BDA0002211225030000023
中每个样本属于各个类别的概率
Figure BDA0002211225030000024
其中,k=1,2,…,K为类别编号,j=1,2,…,Nc为候选集内样本的序号;
S7、基于上述类别概率,获取候选样本的BT值BTj
S8、获取候选样本的选择优先级权重因子wj,其中,j=1,2,…,Nc候选集内样本的序号;
S9、基于所述选择优先级权重因子wj,获取SBT值,记为SBTj
S10、获取候选集中SBT值最小的n个候选样本组成新增训练样本集
Figure BDA0002211225030000025
并将其标记,得到相应的标记集
Figure BDA0002211225030000026
然后将
Figure BDA0002211225030000027
Figure BDA0002211225030000028
加入训练集
Figure BDA0002211225030000029
中,得到新的训练集
Figure BDA00022112250300000210
S11、将S10中所述新增训练样本集
Figure BDA00022112250300000211
从候选集
Figure BDA00022112250300000212
中移除,得到候选集
S12、如果迭代次数小于所述主动学习目标迭代次数I,重复步骤S5至S11;
S13、如果迭代次数大于等于所述主动学习目标迭代次数I,使用最终的训练集
Figure BDA00022112250300000214
训练多项式逻辑回归分类器获取并输出最终分类结果。
可选地,所述超像素分割结果S(m,n)利用线性迭代聚类算法SLIC获取,
所述线性迭代聚类算法SLIC对于超像素图像分割方法采用多点局部聚类策略,其中聚类依据的样本间相似性计算准则如下:
d=(1-λ)·dE+λ·dS
其中,dE为两个样本之间的空间欧几里得距离,dS为两个样本之间的光谱信息辐射距离,λ为空间与光谱距离的聚合因子,取值范围为[0,1]。
可选地,所述候选样本的BT值BTj采用如下计算方式:
其中,
Figure BDA0002211225030000032
代表第j个候选样本属于类别k的概率,K表示类别总数,k+表示分类器预测样本最可能属于的类别,其计算公式如下:
Figure BDA0002211225030000033
样本的BT值可以衡量分类器对该样本预测结果的不定性程度,所述样本的BT值越小,该样本的潜在训练价值就越高。
可选地,所述选择优先级权重因子wj采用如下计算方式:
Figure BDA0002211225030000034
其中,
Figure BDA0002211225030000035
表示候选样本j所在的超像素所包含的所有像素点总数,
Figure BDA0002211225030000036
表示候选样本j所在的超像素所包含的所有训练样本总数。
可选地,所述SBT值SBTj采用如下计算方式:
SBTj=wj·BTj
其中,wj表示选择优先级权重因子,wj的值越小,候选样本j所在超像素内训练样本的数量占比越小,即训练样本在该超像素内的分布越稀疏;
BTj表示候选样本j的原始BT值,BTj的值越小,候选样本j对多项式逻辑回归分类器来说不确定性越大,即样本的潜在训练价值越大。
可选地,所述新增训练样本集
Figure BDA0002211225030000037
由候选集
Figure BDA0002211225030000038
中SBT值最小的n个候选样本组成:
利用新增训练样本集
Figure BDA00022112250300000310
对训练集
Figure BDA00022112250300000311
做如下更新:
Figure BDA00022112250300000312
其中,
Figure BDA00022112250300000313
为与新增训练样本集
Figure BDA00022112250300000314
对应的专家标记集,
Figure BDA00022112250300000315
为当前第i次迭代中所用的训练,
Figure BDA00022112250300000316
为下次迭代,即第i+1次迭代中所用的训练集。
可选地,所述候选集采用如下计算方式:
Figure BDA00022112250300000318
其中,
Figure BDA00022112250300000319
为下次迭代,即第i+1次迭代中所用的候选集。
可选地,所述最终分类结果的计算过程如下:
Figure BDA0002211225030000041
其中,为样本j的预测标签,K表示预设类别总数,
Figure BDA0002211225030000043
表示样本j属于类别k的概率。
本申请实施例的第二方面提供一种电子设备,所述设备包括至少一个处理器以及至少一个存储器;
所述至少一个存储器用于存储计算机指令;
所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如本申请实施例第一方面提供的发明内容中任意一项所述的操作。
本申请实施例的第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现如本申请实施例第一方面提供的发明内容中任意一项所述的操作。
本申请实施例的有益效果包括:通过对高光谱图像进行超像素分割,对采集样本加入空间信息差异评估,可以提高训练样本的价值;利用空间信息对采样过程中的光谱信息进行补充,降低光谱变异等因素对采样过程的干扰,进一步提高空间采样效率,提高图像分类准确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了根据本申请的一个实施例基于超像素的高光谱空间均匀采样主动学习分类方法的流程图;
图2是对于AVIRIS Indian Pines图像采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法的分类精度随主动学习迭代次数增长的示意图;
图3是对于AVIRIS Indian Pines图像采用基于打破连结准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图;
图4是对于AVIRIS Indian Pines图像采用基于交互信息准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图;
图5是对于AVIRIS Indian Pines图像采用基于随机采样准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图;
图6(a)是初始训练样本的空间分布,初始训练集共包含48个随机挑选的训练样本,其中图像共有16类,每类包含3个训练样本;
图6(b)是图像所有已知样本标签,共包含10366个真实标记的样本,属于16类;
图7(a)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图;
图7(b)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第20次迭代后所获得的训练样本的空间分布示意图;
图8(a)是采用基于打破连结准则的高光谱主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图;
图8(b)是采用基于打破连结准则的高光谱主动学习分类方在第20次迭代后所获得的训练样本的空间分布示意图;
图9(a)是基于交互信息准则的高光谱主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图;
图9(b)是基于交互信息准则的高光谱主动学习分类方法在第20次迭代后所获得的训练样本的空间分布示意图;
图10(a)是基于随机采样准则的高光谱主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图;
图10(b)是基于随机采样准则的高光谱主动学习分类方法在第20次迭代后所获得的训练样本的空间分布示意图;
图11(a)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS IndianPines图像的分类结果;
图11(b)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS IndianPines图像的分类结果;
图12(a)是采用基于打破连结准则的主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果;
图12(b)是采用基于打破连结准则的主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果;
图13(a)是采用基于交互信息准则的主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果;
图13(b)是采用基于交互信息准则的主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果;
图14(a)是采用基于随机采样准则的主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果;
图14(b)是采用基于随机采样准则的主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果。
具体实施方式
现在将描述某些示例性实施方案,以从整体上理解本文所公开的装置和方法的结构、功能、制造和用途的原理。这些实施方案的一个或多个示例已在附图中示出。本领域的普通技术人员将会理解,在本文中具体描述并示出于附图中的装置和方法为非限制性的示例性实施方案,并且本申请的多个实施方案的范围仅由权利要求书限定。结合一个示例性实施方案示出或描述的特征可与其他实施方案的特征进行组合。这种修改和变型旨在包括在本申请的范围之内。
本说明书通篇提及的“多个实施例”、“一些实施例”、“一个实施例”或“实施例”等,意味着结合该实施例描述的具体特征、结构或特性包括在至少一个实施例中。因此,本说明书通篇出现的短语“在多个实施例中”、“在一些实施例中”、“在至少另一个实施例中”或“在实施例中”等并不一定都指相同的实施例。此外,在一个或多个实施例中,具体特征、结构或特性可以任何合适的方式进行组合。因此,在无限制的情形下,结合一个实施例示出或描述的具体特征、结构或特性可全部或部分地与一个或多个其他实施例的特征、结构或特性进行组合。这种修改和变型旨在包括在本申请的范围之内。
高光谱图像具有丰富的光谱信息,基于像素的高光谱图像分类算法,可以很好地利用高光谱数据的这一特点,将光谱信息的潜能发挥到最大。但是高光谱数据本身还是由一幅幅在不同波段下获取的图像组成,空间信息仍具有不可替代的作用。
图1示出了根据本申请的一个实施例基于超像素的高光谱空间均匀采样主动学习分类方法的流程图。
步骤S1,获取高光谱图像数据H(m,n,b),其中m、n表示空间像素点位置,b表示所处光谱波段位置。
高光谱图像的波段数量大、地物种类多,所以像素的光谱特征具有多样性。另外,低空间分辨率,地物分布异质性,多次散射效应等因素会加重多样性的程度,往往会导致同物异谱现象或同谱异物现象,给图像分类造成了困难。
步骤S2,基于所述高光谱图像数据,获取超像素分割结果S(m,n),其中m、n表示空间像素点位置。所述超像素分割结果可以利用线性迭代聚类算法SLIC对高光谱图像进行超像素分割。
采用固定大小的规则窗口来确定给定像素的邻域范围,是高光谱图像处理领域常用的提取空间信息的方法。但是实际地物,特别是自然地物,很少具有规则的形状和大小。
超像素能够很好地挖掘图像潜在空间结构,产生适应数据特性的不规则边界,使得超像素内部区域具有更高的同质性。使用超像素作为本申请的局部计算单元,可以很好地控制局部同质区域的样本数量,使得采样过程更符合高光谱图像的空间结构信息。
在至少另一实施例中,所述超像素分割结果S(m,n),利用线性迭代聚类算法SLIC获取,所述线性迭代聚类算法SLIC对于超像素图像分割方法采用多点局部聚类策略,其中聚类依据的样本间相似性计算准则如下:
d=(1-λ)·dE+λ·dS
其中,dE为两个样本之间的空间欧几里得距离,dS为两个样本之间的光谱信息辐射距离,λ为空间与光谱距离的聚合因子,取值范围为[0,1]。
步骤S3,获取初始训练集
Figure BDA0002211225030000071
和初始候选集
Figure BDA0002211225030000072
步骤S4,设置主动学习目标迭代次数I、每次迭代新增训练样本个数n,并开始联合采样与训练过程。当训练器的迭代次数达到本申请设置的主动学习目标迭代次数I,则认为模型训练精度已经符合我们的要求,从而进一步的输出最终分类结果。
步骤S5,训练多项式逻辑回归分类器,使用训练集
Figure BDA0002211225030000081
对所述多项式逻辑回归分类器进行训练。
步骤S6,使用多项式逻辑回归分类器获取候选集
Figure BDA0002211225030000082
中每个样本属于各个类别的概率其中,k=1,2,…,K为类别编号,j=1,2,…,Nc为候选集内样本的序号。
步骤S7,对于每个候选样本j,从
Figure BDA0002211225030000084
k=1,2,…,K中取最大和次大的两个类别概率,使用二者的差值作为该候选样本的最大和次大后验概率的差值BT值BTj
在至少另一实施例中,候选样本的BT(最大和次大后验概率的差值)值BTj可以采用如下计算方式获取:
Figure BDA0002211225030000085
其中,
Figure BDA0002211225030000086
代表第j个候选样本属于类别k的概率,K表示类别总数,k+表示分类器预测样本最可能属于的类别,其计算公式如下:
Figure BDA0002211225030000087
样本的BT值可以衡量分类器对该样本预测结果的不定性程度。特别地,样本的BT值越小,对于分类器来说,该样本的不确定性越高,相应地,该样本的潜在训练价值就越高。
步骤S8,获取候选样本的选择优先级权重因子wj,其中,j=1,2,…,Nc为候选集内样本的序号,计算每个超像素所包含的训练样本个数,用于计算候选样本的选择优先级权重因子wj,其中,j=1,2,…,Nc为候选集内样本的序号,选择优先级权重因子可以使主动采样过程更偏向于在没有训练样本或训练样本个数较少的超像素内进行采样。
在至少另一实施例中,第j个候选样本的选择优先级权重因子wj可以采用如下获取计算方式:
Figure BDA0002211225030000088
其中,表示候选样本j所在的超像素所包含的所有像素点总数,
Figure BDA00022112250300000810
表示候选样本j所在的超像素所包含的所有训练样本总数。从上式中可以看出,候选样本j所在的超像素内包含的训练样本数与样本总数的比值越大,其选择优先级权重因子wj的值就越大;候选样本j所在的超像素内包含的训练样本数与样本总数的比值越小,其选择优先级权重因子wj的值就越小。
步骤S9,使用相应的选择优先级权重因子wj对BT值BTj进行优化,得到兼具空间均匀采样特性的BT值,即SBT值,记为SBTj;。
在一些其他实现方式中,采样查询准则均是直接与光谱分类器相关联,在每次迭代中依据光谱分类器的分类结果来指引采样过程,而没有利用图像的空间信息。这就很容易使得新增加的训练样本在光谱变异性较大的局部区域聚集,进而损害采样过程中的样本多样性。
在至少另一实施例中,所述SBTj采用如下计算方式:
SBTj=wj·BTj
其中,wj表示选择优先级权重因子,wj的值越小,说明候选样本j所在超像素内训练样本的数量占比越小,即训练样本在该超像素内的分布越稀疏;BTj表示候选样本j的原始BT值,BTj的值越小,说明候选样本j对分类器来说不确定性越大,即样本的潜在训练价值越大。因此,从上式可以看出,一个较小的SBTj值不仅表明候选样本j具有较大的训练潜力,同时也预示候选样本j很可能落在训练样本较为稀疏的局部空间内。
本申请提供的一种基于超像素的高光谱空间均匀采样主动学习分类方法,通过查询训练样本在各个超像素内的分布情况,来控制训练样本的空间分布,避免在训练样本在局部区域聚集,使得所选训练集不论从光谱还是空间信息的角度,都能够更充分体现高光谱数据特性,利用空间信息对采样过程中的光谱信息进行补充,降低光谱变异等因素对采样过程的干扰。
步骤S10,获取候选集中SBT值最小的n个候选样本组成新增训练样本集
Figure BDA0002211225030000091
并将其标记,得到相应的标记集
Figure BDA0002211225030000092
然后将
Figure BDA0002211225030000094
加入训练集
Figure BDA0002211225030000095
中,得到新的训练集
Figure BDA0002211225030000096
在至少另一实施例中,所述新增训练样本集
Figure BDA0002211225030000097
由候选集
Figure BDA0002211225030000098
中SBT值最小的n个候选样本组成:
Figure BDA0002211225030000099
由专家进行标记,利用新增训练样本集对训练集做如下更新:
其中,为与新增训练样本集
Figure BDA00022112250300000914
对应的专家标记集,
Figure BDA00022112250300000915
为当前第i次迭代中所用的训练,为下次迭代,即第i+1次迭代中所用的训练集。
步骤S11,将S10中所述新增训练样本集
Figure BDA00022112250300000917
对候选集
Figure BDA00022112250300000918
中移除,得到更新的候选集
Figure BDA00022112250300000919
在至少另一些实施例中,所述候选集
Figure BDA0002211225030000101
采用如下计算方式:
Figure BDA0002211225030000102
其中,
Figure BDA0002211225030000103
为下次迭代,即第i+1次迭代中所用的候选集。
步骤S12,检查实时迭代次数,如果实时迭代次数小于在步骤S4中设置的所述主动学习目标迭代次数I,重复步骤S5至S11的高光谱联合采样与训练过程,直至实时迭代次数达到预设值I。
步骤S13,如果实时迭代次数大于等于在步骤S4中设置的所述主动学习目标迭代次数I,使用最终的训练集
Figure BDA0002211225030000104
训练多项式逻辑回归分类器获取并输出最终分类结果。
在至少另一些实施例中,所述最终分类结果的计算过程如下:
其中,
Figure BDA0002211225030000106
为样本j的预测标签,K表示预设类别总数,
Figure BDA0002211225030000107
表示样本j属于类别k的概率
由于光谱变异性,以及同物异谱、同谱异物等现象的存在,小样本情况下,受一些噪声样本的干扰,多项式逻辑回归分类器产生的预测结果很容易产生偏差。这时,仅仅依据分类器的分类结果对样本的训练价值进行估计,就有可能产生比较大的偏差,导致迭代过程中效果提升缓慢。
本申请在主动学习采样过程中加入样本空间分布的考虑,通过空间上的采样多样性来弥补不准确光谱信息给采样过程带来的损害,可以一定程度上避免小样本情况下带来的采样偏差问题。
需要注意的是,以上对于流程图的描述,仅为描述方便,并不能把本申请限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解本申请后,可能在不背离这一原理的情况下,对实施上述方法的应用领域形式和细节上进行各种修正和改变。然而,这些修正和改变仍在以上描述的范围内。
AVIRIS印第安纳数据集是印第安纳州Indian Pines实验区的高光谱图像数据,拍摄于1992年6月,波段数目是224,空间分辨率为20cm,图像尺寸是145×145,波长范围0.4~2.5微米。去除24个噪声波段和水汽吸收波段后,图像剩余波段数目为200个,共包含16种地物。本申请将基于此数据集为实验基础数据对不同方法的图像分类结果进行对比。
图2是对于AVIRIS Indian Pines图像,采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本。
图3是对于AVIRIS Indian Pines图像,采用基于打破连结准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本。
图4是对于AVIRIS Indian Pines图像,采用基于交互信息准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本。
图5是对于AVIRIS Indian Pines图像,采用基于随机采样准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本。
图6(a)是初始训练样本的空间分布,初始训练集共包含48个随机挑选的训练样本,其中图像共有16类,每类包含3个训练样本;
图6(b)是图像所有已知样本标签,共包含10366个真实标记的样本,属于16类。
图7(a)和图7(b)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法,分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本,故第10次和第20次迭代后训练样本总数分别为68个和88个。
图8(a)和图8(b)是采用基于打破连结准则的高光谱主动学习分类方法,分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本,故第10次和第20次迭代后训练样本总数分别为68个和88个。
图9(a)和图9(b)是基于交互信息准则的高光谱主动学习分类方法,分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本,故第10次和第20次迭代后训练样本总数分别为68个和88个。
图10(a)和图10(b)是基于随机采样准则的高光谱主动学习分类方法,分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个,每次迭代向训练集提供2个新的人工标记样本,故第10次和第20次迭代后训练样本总数分别为68个和88个。
图11(a)和图11(b)分别是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果,图像中的像素点被分为16类,两个图中所用训练样本个数分别为68个和88个。
由图11(a)和图11(b)以及图7(a)和图7(b)利用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类,得到的准确率实验数据。其中,待分类的像素来自于16个类。当主动学习迭代次数达到10次时,训练样本总数为68,分类准确率为52.18%;当主动学习迭代次数达到20次时,训练样本总数为88,分类准确率为58.69%。
图12(a)和图12(b)分别是采用基于打破连结准则的主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRISIndian Pines图像的分类结果,图像中的像素点被分为16类,两个图中所用训练样本个数分别为68个和88个。
由图12(a)和图12(b)以及图8(a)-图8(b)利用基于打破连结准则的主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类,得到的准确率实验数据。其中,待分类的像素来自于16个类。当主动学习迭代次数达到10次时,训练样本总数为68,分类准确率为52.28%;当主动学习迭代次数达到20次时,训练样本总数为88,分类准确率为53.05%。
图13(a)和图13(b)分别是采用基于交互信息准则的主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRISIndian Pines图像的分类结果,图像中的像素点被分为16类,两个图中所用训练样本个数分别为68个和88个。
由图13(a)和图13(b)以及图9(a)-图9(b)利用基于交互信息准则的主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类,得到的准确率实验数据。其中,待分类的像素来自于16个类。当主动学习迭代次数达到10次时,训练样本总数为68,分类准确率为49.28%;当主动学习迭代次数达到20次时,训练样本总数为88,分类准确率为50.96%。
图14(a)和图14(b)分别是采用基于随机采样准则的主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRISIndian Pines图像的分类结果,图像中的像素点被分为16类,两个图中所用训练样本个数分别为68个和88个。
由图14(a)和图14(b)以及图10(a)-图10(b)利用基于随机采样准则的主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类,得到的准确率。其中,待分类的像素来自于16个类。当主动学习迭代次数达到10次时,训练样本总数为68,分类准确率为49.69%;当主动学习迭代次数达到20次时,训练样本总数为88,分类准确率为52.40%。
通过对比上述数据,可以发现本申请提供的基于超像素的高光谱空间均匀采样主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类,得到的准确率在迭代次数为10和20的时候,基于相同的训练样本数量,本申请所提供的主动学习分类方法可以提高图像分类准确率。
本申请实施例可能带来的有益效果包括但不限于:通过对高光谱图像进行超像素分割,对采集样本加入空间信息差异评估,可以提高训练样本的价值;利用空间信息对采样过程中的光谱信息进行补充,降低光谱变异等因素对采样过程的干扰,进一步提高空间采样效率,提高图像分类准确率。
应当理解,本申请提供的一种电子设备,所述设备包括至少一个处理器以及至少一个存储器。在一些实施例中,所述电子设备可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的电子设备不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN)、或连接至外部计算机(例如通过因特网)、或在云计算环境中、或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。

Claims (10)

1.一种空间采样主动学习分类方法,其特征在于,包括以下步骤:
S1、获取高光谱图像数据H(m,n,b),其中m、n表示空间像素点位置,b表示所处光谱波段位置;
S2、基于所述高光谱图像数据,获取超像素分割结果S(m,n),其中m、n表示空间像素点位置;
S3、获取初始训练集
Figure FDA0002211225020000011
和初始候选集
Figure FDA0002211225020000012
S4、设置主动学习目标迭代次数I、每次迭代新增训练样本个数n;
S5、训练多项式逻辑回归分类器;
S6、获取候选集
Figure FDA0002211225020000013
中每个样本属于各个类别的概率其中,k=1,2,…,K为类别编号,j=1,2,…,Nc为候选集内样本的序号;
S7、基于上述类别概率,获取候选样本的BT值BTj
S8、获取候选样本的选择优先级权重因子wj,其中,j=1,2,…,Nc候选集内样本的序号;
S9、基于所述选择优先级权重因子wj,获取SBT值,记为SBTj
S10、获取候选集中SBT值最小的n个候选样本组成新增训练样本集
Figure FDA0002211225020000015
并将其标记,得到相应的标记集然后将
Figure FDA0002211225020000017
Figure FDA0002211225020000018
加入训练集中,得到新的训练集
Figure FDA00022112250200000110
S11、将S10中所述新增训练样本集
Figure FDA00022112250200000111
从候选集中移除,得到候选集
Figure FDA00022112250200000113
S12、如果迭代次数小于所述主动学习目标迭代次数I,重复步骤S5至S11;
S13、如果迭代次数大于等于所述主动学习目标迭代次数I,使用最终的训练集训练多项式逻辑回归分类器获取并输出最终分类结果。
2.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述超像素分割结果S(m,n)利用线性迭代聚类算法SLIC获取,
所述线性迭代聚类算法SLIC对于超像素图像分割方法采用多点局部聚类策略,其中聚类依据的样本间相似性计算准则如下:
d=(1-λ)·dE+λ·dS
其中,dE为两个样本之间的空间欧几里得距离,dS为两个样本之间的光谱信息辐射距离,λ为空间与光谱距离的聚合因子,取值范围为[0,1]。
3.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述候选样本的BT值BTj采用如下计算方式:
其中,代表第j个候选样本属于类别k的概率,K表示类别总数,k+表示分类器预测样本最可能属于的类别,其计算公式如下:
样本的BT值可以衡量分类器对该样本预测结果的不定性程度,所述样本的BT值越小,该样本的潜在训练价值就越高。
4.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述选择优先级权重因子wj采用如下计算方式:
Figure FDA0002211225020000024
其中,表示候选样本j所在的超像素所包含的所有像素点总数,表示候选样本j所在的超像素所包含的所有训练样本总数。
5.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述SBT值SBTj采用如下计算方式:
SBTj=wj·BTj
其中,wj表示选择优先级权重因子,wj的值越小,候选样本j所在超像素内训练样本的数量占比越小,即训练样本在该超像素内的分布越稀疏;
BTj表示候选样本j的原始BT值,BTj的值越小,候选样本j对多项式逻辑回归分类器来说不确定性越大,即样本的潜在训练价值越大。
6.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述新增训练样本集由候选集
Figure FDA0002211225020000028
中SBT值最小的n个候选样本组成:
Figure FDA0002211225020000029
利用新增训练样本集
Figure FDA00022112250200000210
对训练集
Figure FDA00022112250200000211
做如下更新:
Figure FDA00022112250200000212
其中,
Figure FDA00022112250200000213
为与新增训练样本集
Figure FDA00022112250200000214
对应的专家标记集,
Figure FDA00022112250200000215
为当前第i次迭代中所用的训练,为下次迭代,即第i+1次迭代中所用的训练集。
7.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述候选集
Figure FDA0002211225020000032
采用如下计算方式:
Figure FDA0002211225020000033
其中,为下次迭代,即第i+1次迭代中所用的候选集。
8.根据权利要求1所述的一种空间采样主动学习分类方法,其特征在于,所述最终分类结果的计算过程如下:
Figure FDA0002211225020000035
其中,
Figure FDA0002211225020000036
为样本j的预测标签,K表示预设类别总数,
Figure FDA0002211225020000037
表示样本j属于类别k的概率。
9.一种电子设备,其特征在于,所述设备包括至少一个处理器以及至少一个存储器;
所述至少一个存储器用于存储计算机指令;
所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如权利要求1~8中任意一项所述的操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现如权利要求1~8中任意一项所述的操作。
CN201910899013.XA 2019-09-23 2019-09-23 一种空间采样主动学习分类方法、电子设备及存储介质 Active CN110688934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910899013.XA CN110688934B (zh) 2019-09-23 2019-09-23 一种空间采样主动学习分类方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910899013.XA CN110688934B (zh) 2019-09-23 2019-09-23 一种空间采样主动学习分类方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110688934A true CN110688934A (zh) 2020-01-14
CN110688934B CN110688934B (zh) 2023-11-21

Family

ID=69109809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910899013.XA Active CN110688934B (zh) 2019-09-23 2019-09-23 一种空间采样主动学习分类方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110688934B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639697A (zh) * 2020-05-27 2020-09-08 西安电子科技大学 基于非重复采样与原型网络的高光谱图像分类方法
CN112215290A (zh) * 2020-10-16 2021-01-12 苏州大学 基于Fisher得分的Q学习辅助数据分析方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125461A1 (en) * 2007-11-09 2009-05-14 Microsoft Corporation Multi-Label Active Learning
US20120095943A1 (en) * 2010-10-15 2012-04-19 Yahoo! Inc. System for training classifiers in multiple categories through active learning
CN106056157A (zh) * 2016-06-01 2016-10-26 西北大学 基于空‑谱信息的高光谱图像半监督分类方法
CN107169001A (zh) * 2017-03-31 2017-09-15 华东师范大学 一种基于众包反馈和主动学习的文本分类模型优化方法
CN108280396A (zh) * 2017-12-25 2018-07-13 西安电子科技大学 基于深度多特征主动迁移网络的高光谱图像分类方法
CN109034190A (zh) * 2018-06-15 2018-12-18 广州深域信息科技有限公司 一种动态选择策略的主动样本挖掘的物体检测系统及方法
CN109145950A (zh) * 2018-07-20 2019-01-04 华南理工大学 一种基于图信号采样的高光谱图像主动学习方法
CN109977994A (zh) * 2019-02-02 2019-07-05 浙江工业大学 一种基于多示例主动学习的代表性图像选取方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090125461A1 (en) * 2007-11-09 2009-05-14 Microsoft Corporation Multi-Label Active Learning
US20120095943A1 (en) * 2010-10-15 2012-04-19 Yahoo! Inc. System for training classifiers in multiple categories through active learning
CN106056157A (zh) * 2016-06-01 2016-10-26 西北大学 基于空‑谱信息的高光谱图像半监督分类方法
CN107169001A (zh) * 2017-03-31 2017-09-15 华东师范大学 一种基于众包反馈和主动学习的文本分类模型优化方法
CN108280396A (zh) * 2017-12-25 2018-07-13 西安电子科技大学 基于深度多特征主动迁移网络的高光谱图像分类方法
CN109034190A (zh) * 2018-06-15 2018-12-18 广州深域信息科技有限公司 一种动态选择策略的主动样本挖掘的物体检测系统及方法
CN109145950A (zh) * 2018-07-20 2019-01-04 华南理工大学 一种基于图信号采样的高光谱图像主动学习方法
CN109977994A (zh) * 2019-02-02 2019-07-05 浙江工业大学 一种基于多示例主动学习的代表性图像选取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EDOARDO PASOLLI等: "SVM Active Learning Approach for Image Classification Using Spatial Information" *
张颖: "基于主动学习的高光谱影像分类" *
李昌利;张琳;樊棠怀;: "基于自适应主动学习与联合双边滤波的高光谱图像分类" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639697A (zh) * 2020-05-27 2020-09-08 西安电子科技大学 基于非重复采样与原型网络的高光谱图像分类方法
CN111639697B (zh) * 2020-05-27 2023-03-24 西安电子科技大学 基于非重复采样与原型网络的高光谱图像分类方法
CN112215290A (zh) * 2020-10-16 2021-01-12 苏州大学 基于Fisher得分的Q学习辅助数据分析方法及系统
CN112215290B (zh) * 2020-10-16 2024-04-09 苏州大学 基于Fisher得分的Q学习辅助数据分析方法及系统

Also Published As

Publication number Publication date
CN110688934B (zh) 2023-11-21

Similar Documents

Publication Publication Date Title
US11568627B2 (en) Utilizing interactive deep learning to select objects in digital visual media
Xiong et al. Identification of cash crop diseases using automatic image segmentation algorithm and deep learning with expanded dataset
US11244196B2 (en) Method of semantically segmenting input image, apparatus for semantically segmenting input image, method of pre-training apparatus for semantically segmenting input image, training apparatus for pre-training apparatus for semantically segmenting input image, and computer-program product
Sameen et al. Classification of very high resolution aerial photos using spectral-spatial convolutional neural networks
Tu et al. Density peak-based noisy label detection for hyperspectral image classification
US20200020102A1 (en) Method and device for semantic segmentation of image
Deng et al. Deep learning-based automatic detection of productive tillers in rice
CN112861722B (zh) 一种半监督深度图卷积的遥感土地利用语义分割方法
CN108447057B (zh) 基于显著性和深度卷积网络的sar图像变化检测方法
CN111914728B (zh) 高光谱遥感影像半监督分类方法、装置及存储介质
Hu et al. Nondestructive 3D image analysis pipeline to extract rice grain traits using X-ray computed tomography
US11875512B2 (en) Attributionally robust training for weakly supervised localization and segmentation
Azadnia et al. Developing an automated monitoring system for fast and accurate prediction of soil texture using an image-based deep learning network and machine vision system
Wang et al. Field rice panicle detection and counting based on deep learning
CN110688934A (zh) 一种空间采样主动学习分类方法、电子设备及存储介质
Tu et al. Hierarchical structure-based noisy labels detection for hyperspectral image classification
Tanwar et al. Deep learning-based hybrid model for severity prediction of leaf smut rice infection
Li et al. Maize leaf disease identification based on WG-MARNet
CN116258978A (zh) 一种自然保护区遥感影像弱标注的目标检测方法
Qiu et al. Automatic detection and counting of wheat spikelet using semi-automatic labeling and deep learning
Gao et al. Classification of hyperspectral images with convolutional neural networks and probabilistic relaxation
US11804029B2 (en) Hierarchical constraint (HC)-based method and system for classifying fine-grained graptolite images
CN110689064B (zh) 一种图像半监督分类方法、装置及计算机可读存储介质
WO2023060053A1 (en) Biomarker reflectance signatures for disease detection and classification
Kutluk et al. Classification of hyperspectral images using mixture of probabilistic PCA models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant