CN110688934A

CN110688934A - 一种空间采样主动学习分类方法、电子设备及存储介质

Info

Publication number: CN110688934A
Application number: CN201910899013.XA
Authority: CN
Inventors: 马仪; 周仿荣; 周兴梅; 马御棠; 潘浩; 黄然; 文刚
Original assignee: Electric Power Research Institute of Yunnan Power System Ltd
Current assignee: Electric Power Research Institute of Yunnan Power System Ltd
Priority date: 2019-09-23
Filing date: 2019-09-23
Publication date: 2020-01-14
Anticipated expiration: 2039-09-23
Also published as: CN110688934B

Abstract

本申请涉及高维图像处理技术领域，具体而言，涉及一种空间采样主动学习分类方法、电子设备及存储介质。本申请提供一种空间采样主动学习分类方法，包括以下步骤：S1、获取图像数据；S2、获取分割结果；S3、获取初始训练集和初始候选集；S4、设置迭代次数、样本个数；S5、训练分类器；S6、获取候选集样本属于类别的概率；S7、获取候选样本BT值；S8、获取候选样本的选择优先级权重因子；S9、获取SBT值；S10、SBT值最小的n个候选样本加入训练；S11、更新候选集；S12、迭代次数小于预设值，重复步骤S5至S11；S13、迭代次数大于等于预设值，使用最终的训练集训练分类器获取并输出最终分类结果。

Description

一种空间采样主动学习分类方法、电子设备及存储介质

技术领域

本申请涉及高维图像处理技术领域，具体而言，涉及一种空间采样主动学习分类方法、电子设备及存储介质。

背景技术

在传统多波段遥感图像分类中，很多地物由于形状等空间信息相近，光谱信息不足，而难以得到一个较好的分辨率。近年来，随着光学遥感的发展，高光谱遥感技术也日臻成熟。与传统光学遥感相比，高光谱遥感技术可以精细探测地物的光谱信息，获取到地物的连续光谱曲线，获益于丰富的光谱信息，高光谱图像更易分辨地物的材质等内在属性信息，为遥感图像分类的进一步发展提供了极大的可能性。

图像分类是遥感技术的重要应用。其中，无监督分类算法由于缺少先验信息，很难达到较为理想的分类效果，因此监督分类算法应用较为广泛。然而，监督分类算法的效果与训练样本的数量密切相关。并且在一些实现方式中，人工专家样本标记困难重重、费时费力，受制于实际采样条件与采样成本，获取足够数量的训练样本往往难以实现。在一些实现方式中，例如主动学习(Active learning)算法，通过人机交互过程，在每次迭代中指引人工专家去标记那些训练器认为最具训练价值的未标记样本，以期在标记样本数量有限的情况下，最大化提升训练效果。但是，这些算法在采样过程中仅仅考虑了光谱信息差异，并没有考虑到考虑空间信息差异，导致采样效率和精度的不足，影响了图像分类的输出效果。

因此，如何对采集样本加入空间信息差异评估，如何结合光谱信息差异和空间信息差异提高空间采样的样本训练价值成为了一个逞待解决的问题。

发明内容

本申请的目的在于提供一种空间采样主动学习分类方法、电子设备及存储介质，通过对高光谱图像进行超像素分割，对未标记样本的预测不确定性以及对空间均匀采样的促进能力进行估计，利用结合光谱信息差异和空间信息差异对样本的训练价值做一个综合评定，更新的训练集，并输出最终优化的分类结果。进一步可以提高训练样本的价值、降低光谱变异等因素对采样过程的干扰、提高空间采样效率以及提高图像分类准确率。

本申请的实施例是这样实现的：

本申请实施例的第一方面提供一种空间采样主动学习分类方法，包括以下步骤：

S1、获取高光谱图像数据H(m,n,b)，其中m、n表示空间像素点位置，b表示所处光谱波段位置；

S2、基于所述高光谱图像数据，获取超像素分割结果S(m,n)，其中m、n表示空间像素点位置；

S3、获取初始训练集

和初始候选集

S4、设置主动学习目标迭代次数I、每次迭代新增训练样本个数n；

S5、训练多项式逻辑回归分类器；

S6、获取候选集

中每个样本属于各个类别的概率

其中，k＝1,2,…,K为类别编号，j＝1,2,…,N_c为候选集内样本的序号；

S7、基于上述类别概率，获取候选样本的BT值BT_j；

S8、获取候选样本的选择优先级权重因子w_j，其中，j＝1,2,…,N_c候选集内样本的序号；

S9、基于所述选择优先级权重因子w_j，获取SBT值，记为SBT_j；

S10、获取候选集中SBT值最小的n个候选样本组成新增训练样本集

并将其标记，得到相应的标记集

然后将

和

加入训练集

中，得到新的训练集

S11、将S10中所述新增训练样本集

从候选集

中移除，得到候选集

S12、如果迭代次数小于所述主动学习目标迭代次数I，重复步骤S5至S11；

S13、如果迭代次数大于等于所述主动学习目标迭代次数I，使用最终的训练集

训练多项式逻辑回归分类器获取并输出最终分类结果。

可选地，所述超像素分割结果S(m,n)利用线性迭代聚类算法SLIC获取，

所述线性迭代聚类算法SLIC对于超像素图像分割方法采用多点局部聚类策略，其中聚类依据的样本间相似性计算准则如下：

d＝(1-λ)·d_E+λ·d_S，

其中，d_E为两个样本之间的空间欧几里得距离，d_S为两个样本之间的光谱信息辐射距离，λ为空间与光谱距离的聚合因子，取值范围为[0,1]。

可选地，所述候选样本的BT值BT_j采用如下计算方式：

其中，

代表第j个候选样本属于类别k的概率，K表示类别总数，k⁺表示分类器预测样本最可能属于的类别,其计算公式如下：

样本的BT值可以衡量分类器对该样本预测结果的不定性程度，所述样本的BT值越小，该样本的潜在训练价值就越高。

可选地，所述选择优先级权重因子w_j采用如下计算方式：

其中，

表示候选样本j所在的超像素所包含的所有像素点总数，

表示候选样本j所在的超像素所包含的所有训练样本总数。

可选地，所述SBT值SBT_j采用如下计算方式：

SBT_j＝w_j·BT_j，

其中，w_j表示选择优先级权重因子，w_j的值越小，候选样本j所在超像素内训练样本的数量占比越小，即训练样本在该超像素内的分布越稀疏；

BT_j表示候选样本j的原始BT值，BT_j的值越小，候选样本j对多项式逻辑回归分类器来说不确定性越大，即样本的潜在训练价值越大。

可选地，所述新增训练样本集

由候选集

中SBT值最小的n个候选样本组成：

利用新增训练样本集

对训练集

做如下更新：

其中，

为与新增训练样本集

对应的专家标记集，

为当前第i次迭代中所用的训练，

为下次迭代，即第i+1次迭代中所用的训练集。

可选地，所述候选集采用如下计算方式：

其中，

为下次迭代，即第i+1次迭代中所用的候选集。

可选地，所述最终分类结果的计算过程如下：

其中，为样本j的预测标签，K表示预设类别总数，

表示样本j属于类别k的概率。

本申请实施例的第二方面提供一种电子设备，所述设备包括至少一个处理器以及至少一个存储器；

所述至少一个存储器用于存储计算机指令；

所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如本申请实施例第一方面提供的发明内容中任意一项所述的操作。

本申请实施例的第三方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令中的至少部分指令被处理器执行时，实现如本申请实施例第一方面提供的发明内容中任意一项所述的操作。

本申请实施例的有益效果包括：通过对高光谱图像进行超像素分割，对采集样本加入空间信息差异评估，可以提高训练样本的价值；利用空间信息对采样过程中的光谱信息进行补充，降低光谱变异等因素对采样过程的干扰，进一步提高空间采样效率，提高图像分类准确率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了根据本申请的一个实施例基于超像素的高光谱空间均匀采样主动学习分类方法的流程图；

图2是对于AVIRIS Indian Pines图像采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法的分类精度随主动学习迭代次数增长的示意图；

图3是对于AVIRIS Indian Pines图像采用基于打破连结准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图；

图4是对于AVIRIS Indian Pines图像采用基于交互信息准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图；

图5是对于AVIRIS Indian Pines图像采用基于随机采样准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图；

图6(a)是初始训练样本的空间分布，初始训练集共包含48个随机挑选的训练样本，其中图像共有16类，每类包含3个训练样本；

图6(b)是图像所有已知样本标签，共包含10366个真实标记的样本，属于16类；

图7(a)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图；

图7(b)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第20次迭代后所获得的训练样本的空间分布示意图；

图8(a)是采用基于打破连结准则的高光谱主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图；

图8(b)是采用基于打破连结准则的高光谱主动学习分类方在第20次迭代后所获得的训练样本的空间分布示意图；

图9(a)是基于交互信息准则的高光谱主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图；

图9(b)是基于交互信息准则的高光谱主动学习分类方法在第20次迭代后所获得的训练样本的空间分布示意图；

图10(a)是基于随机采样准则的高光谱主动学习分类方法在第10次迭代后所获得的训练样本的空间分布示意图；

图10(b)是基于随机采样准则的高光谱主动学习分类方法在第20次迭代后所获得的训练样本的空间分布示意图；

图11(a)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS IndianPines图像的分类结果；

图11(b)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS IndianPines图像的分类结果；

图12(a)是采用基于打破连结准则的主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果；

图12(b)是采用基于打破连结准则的主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果；

图13(a)是采用基于交互信息准则的主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果；

图13(b)是采用基于交互信息准则的主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果；

图14(a)是采用基于随机采样准则的主动学习分类方法在第10次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果；

图14(b)是采用基于随机采样准则的主动学习分类方法在第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果。

具体实施方式

现在将描述某些示例性实施方案，以从整体上理解本文所公开的装置和方法的结构、功能、制造和用途的原理。这些实施方案的一个或多个示例已在附图中示出。本领域的普通技术人员将会理解，在本文中具体描述并示出于附图中的装置和方法为非限制性的示例性实施方案，并且本申请的多个实施方案的范围仅由权利要求书限定。结合一个示例性实施方案示出或描述的特征可与其他实施方案的特征进行组合。这种修改和变型旨在包括在本申请的范围之内。

本说明书通篇提及的“多个实施例”、“一些实施例”、“一个实施例”或“实施例”等，意味着结合该实施例描述的具体特征、结构或特性包括在至少一个实施例中。因此，本说明书通篇出现的短语“在多个实施例中”、“在一些实施例中”、“在至少另一个实施例中”或“在实施例中”等并不一定都指相同的实施例。此外，在一个或多个实施例中，具体特征、结构或特性可以任何合适的方式进行组合。因此，在无限制的情形下，结合一个实施例示出或描述的具体特征、结构或特性可全部或部分地与一个或多个其他实施例的特征、结构或特性进行组合。这种修改和变型旨在包括在本申请的范围之内。

高光谱图像具有丰富的光谱信息，基于像素的高光谱图像分类算法，可以很好地利用高光谱数据的这一特点，将光谱信息的潜能发挥到最大。但是高光谱数据本身还是由一幅幅在不同波段下获取的图像组成，空间信息仍具有不可替代的作用。

图1示出了根据本申请的一个实施例基于超像素的高光谱空间均匀采样主动学习分类方法的流程图。

步骤S1，获取高光谱图像数据H(m,n,b)，其中m、n表示空间像素点位置，b表示所处光谱波段位置。

高光谱图像的波段数量大、地物种类多，所以像素的光谱特征具有多样性。另外，低空间分辨率，地物分布异质性，多次散射效应等因素会加重多样性的程度，往往会导致同物异谱现象或同谱异物现象，给图像分类造成了困难。

步骤S2，基于所述高光谱图像数据，获取超像素分割结果S(m,n)，其中m、n表示空间像素点位置。所述超像素分割结果可以利用线性迭代聚类算法SLIC对高光谱图像进行超像素分割。

采用固定大小的规则窗口来确定给定像素的邻域范围，是高光谱图像处理领域常用的提取空间信息的方法。但是实际地物，特别是自然地物，很少具有规则的形状和大小。

超像素能够很好地挖掘图像潜在空间结构，产生适应数据特性的不规则边界，使得超像素内部区域具有更高的同质性。使用超像素作为本申请的局部计算单元，可以很好地控制局部同质区域的样本数量，使得采样过程更符合高光谱图像的空间结构信息。

在至少另一实施例中，所述超像素分割结果S(m,n)，利用线性迭代聚类算法SLIC获取，所述线性迭代聚类算法SLIC对于超像素图像分割方法采用多点局部聚类策略，其中聚类依据的样本间相似性计算准则如下：

d＝(1-λ)·d_E+λ·d_S

步骤S3，获取初始训练集

和初始候选集

步骤S4，设置主动学习目标迭代次数I、每次迭代新增训练样本个数n，并开始联合采样与训练过程。当训练器的迭代次数达到本申请设置的主动学习目标迭代次数I，则认为模型训练精度已经符合我们的要求，从而进一步的输出最终分类结果。

步骤S5，训练多项式逻辑回归分类器，使用训练集

对所述多项式逻辑回归分类器进行训练。

步骤S6，使用多项式逻辑回归分类器获取候选集

中每个样本属于各个类别的概率其中，k＝1,2,…,K为类别编号，j＝1,2,…,N_c为候选集内样本的序号。

步骤S7，对于每个候选样本j，从

k＝1,2,…,K中取最大和次大的两个类别概率，使用二者的差值作为该候选样本的最大和次大后验概率的差值BT值BT_j。

在至少另一实施例中，候选样本的BT(最大和次大后验概率的差值)值BT_j可以采用如下计算方式获取：

其中，

代表第j个候选样本属于类别k的概率，K表示类别总数，k⁺表示分类器预测样本最可能属于的类别，其计算公式如下：

样本的BT值可以衡量分类器对该样本预测结果的不定性程度。特别地，样本的BT值越小，对于分类器来说，该样本的不确定性越高，相应地，该样本的潜在训练价值就越高。

步骤S8，获取候选样本的选择优先级权重因子w_j，其中，j＝1,2,…,N_c为候选集内样本的序号，计算每个超像素所包含的训练样本个数，用于计算候选样本的选择优先级权重因子w_j，其中，j＝1,2,…,N_c为候选集内样本的序号，选择优先级权重因子可以使主动采样过程更偏向于在没有训练样本或训练样本个数较少的超像素内进行采样。

在至少另一实施例中，第j个候选样本的选择优先级权重因子w_j可以采用如下获取计算方式：

其中，表示候选样本j所在的超像素所包含的所有像素点总数，

表示候选样本j所在的超像素所包含的所有训练样本总数。从上式中可以看出，候选样本j所在的超像素内包含的训练样本数与样本总数的比值越大，其选择优先级权重因子w_j的值就越大；候选样本j所在的超像素内包含的训练样本数与样本总数的比值越小，其选择优先级权重因子w_j的值就越小。

步骤S9，使用相应的选择优先级权重因子w_j对BT值BT_j进行优化，得到兼具空间均匀采样特性的BT值，即SBT值，记为SBT_j；。

在一些其他实现方式中，采样查询准则均是直接与光谱分类器相关联，在每次迭代中依据光谱分类器的分类结果来指引采样过程，而没有利用图像的空间信息。这就很容易使得新增加的训练样本在光谱变异性较大的局部区域聚集，进而损害采样过程中的样本多样性。

在至少另一实施例中，所述SBT_j采用如下计算方式：

SBT_j＝w_j·BT_j，

其中，w_j表示选择优先级权重因子，w_j的值越小，说明候选样本j所在超像素内训练样本的数量占比越小，即训练样本在该超像素内的分布越稀疏；BT_j表示候选样本j的原始BT值，BT_j的值越小，说明候选样本j对分类器来说不确定性越大，即样本的潜在训练价值越大。因此，从上式可以看出，一个较小的SBT_j值不仅表明候选样本j具有较大的训练潜力，同时也预示候选样本j很可能落在训练样本较为稀疏的局部空间内。

本申请提供的一种基于超像素的高光谱空间均匀采样主动学习分类方法，通过查询训练样本在各个超像素内的分布情况，来控制训练样本的空间分布，避免在训练样本在局部区域聚集，使得所选训练集不论从光谱还是空间信息的角度，都能够更充分体现高光谱数据特性，利用空间信息对采样过程中的光谱信息进行补充，降低光谱变异等因素对采样过程的干扰。

步骤S10，获取候选集中SBT值最小的n个候选样本组成新增训练样本集

并将其标记，得到相应的标记集

然后将和

加入训练集

中，得到新的训练集

在至少另一实施例中，所述新增训练样本集

由候选集

中SBT值最小的n个候选样本组成：

由专家进行标记，利用新增训练样本集对训练集做如下更新：

其中，为与新增训练样本集

对应的专家标记集，

为当前第i次迭代中所用的训练，为下次迭代，即第i+1次迭代中所用的训练集。

步骤S11，将S10中所述新增训练样本集

对候选集

中移除，得到更新的候选集

在至少另一些实施例中，所述候选集

采用如下计算方式：

其中，

为下次迭代，即第i+1次迭代中所用的候选集。

步骤S12，检查实时迭代次数，如果实时迭代次数小于在步骤S4中设置的所述主动学习目标迭代次数I，重复步骤S5至S11的高光谱联合采样与训练过程，直至实时迭代次数达到预设值I。

步骤S13，如果实时迭代次数大于等于在步骤S4中设置的所述主动学习目标迭代次数I，使用最终的训练集

训练多项式逻辑回归分类器获取并输出最终分类结果。

在至少另一些实施例中，所述最终分类结果的计算过程如下：

其中，

为样本j的预测标签，K表示预设类别总数，

表示样本j属于类别k的概率

由于光谱变异性，以及同物异谱、同谱异物等现象的存在，小样本情况下，受一些噪声样本的干扰，多项式逻辑回归分类器产生的预测结果很容易产生偏差。这时，仅仅依据分类器的分类结果对样本的训练价值进行估计，就有可能产生比较大的偏差，导致迭代过程中效果提升缓慢。

本申请在主动学习采样过程中加入样本空间分布的考虑，通过空间上的采样多样性来弥补不准确光谱信息给采样过程带来的损害，可以一定程度上避免小样本情况下带来的采样偏差问题。

需要注意的是，以上对于流程图的描述，仅为描述方便，并不能把本申请限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解本申请后，可能在不背离这一原理的情况下，对实施上述方法的应用领域形式和细节上进行各种修正和改变。然而，这些修正和改变仍在以上描述的范围内。

AVIRIS印第安纳数据集是印第安纳州Indian Pines实验区的高光谱图像数据，拍摄于1992年6月，波段数目是224，空间分辨率为20cm，图像尺寸是145×145，波长范围0.4～2.5微米。去除24个噪声波段和水汽吸收波段后，图像剩余波段数目为200个，共包含16种地物。本申请将基于此数据集为实验基础数据对不同方法的图像分类结果进行对比。

图2是对于AVIRIS Indian Pines图像，采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本。

图3是对于AVIRIS Indian Pines图像，采用基于打破连结准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本。

图4是对于AVIRIS Indian Pines图像，采用基于交互信息准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本。

图5是对于AVIRIS Indian Pines图像，采用基于随机采样准则的高光谱主动学习分类方法的分类精度随主动学习迭代次数增长的示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本。

图6(b)是图像所有已知样本标签，共包含10366个真实标记的样本，属于16类。

图7(a)和图7(b)是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法，分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本，故第10次和第20次迭代后训练样本总数分别为68个和88个。

图8(a)和图8(b)是采用基于打破连结准则的高光谱主动学习分类方法，分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本，故第10次和第20次迭代后训练样本总数分别为68个和88个。

图9(a)和图9(b)是基于交互信息准则的高光谱主动学习分类方法，分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本，故第10次和第20次迭代后训练样本总数分别为68个和88个。

图10(a)和图10(b)是基于随机采样准则的高光谱主动学习分类方法，分别在第10次和第20次迭代后所获得的训练样本的空间分布示意图。其中初始训练样本为对图像16类样本每类随机取3个，每次迭代向训练集提供2个新的人工标记样本，故第10次和第20次迭代后训练样本总数分别为68个和88个。

图11(a)和图11(b)分别是采用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRIS Indian Pines图像的分类结果，图像中的像素点被分为16类，两个图中所用训练样本个数分别为68个和88个。

由图11(a)和图11(b)以及图7(a)和图7(b)利用本申请的基于超像素的高光谱空间均匀采样主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类，得到的准确率实验数据。其中，待分类的像素来自于16个类。当主动学习迭代次数达到10次时，训练样本总数为68，分类准确率为52.18％；当主动学习迭代次数达到20次时，训练样本总数为88，分类准确率为58.69％。

图12(a)和图12(b)分别是采用基于打破连结准则的主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRISIndian Pines图像的分类结果，图像中的像素点被分为16类，两个图中所用训练样本个数分别为68个和88个。

由图12(a)和图12(b)以及图8(a)-图8(b)利用基于打破连结准则的主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类，得到的准确率实验数据。其中，待分类的像素来自于16个类。当主动学习迭代次数达到10次时，训练样本总数为68，分类准确率为52.28％；当主动学习迭代次数达到20次时，训练样本总数为88，分类准确率为53.05％。

图13(a)和图13(b)分别是采用基于交互信息准则的主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRISIndian Pines图像的分类结果，图像中的像素点被分为16类，两个图中所用训练样本个数分别为68个和88个。

由图13(a)和图13(b)以及图9(a)-图9(b)利用基于交互信息准则的主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类，得到的准确率实验数据。其中，待分类的像素来自于16个类。当主动学习迭代次数达到10次时，训练样本总数为68，分类准确率为49.28％；当主动学习迭代次数达到20次时，训练样本总数为88，分类准确率为50.96％。

图14(a)和图14(b)分别是采用基于随机采样准则的主动学习分类方法在第10次和第20次迭代获得的全体样本标签在逻辑回归分类器上进行训练后得到的对AVIRISIndian Pines图像的分类结果，图像中的像素点被分为16类，两个图中所用训练样本个数分别为68个和88个。

由图14(a)和图14(b)以及图10(a)-图10(b)利用基于随机采样准则的主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类，得到的准确率。其中，待分类的像素来自于16个类。当主动学习迭代次数达到10次时，训练样本总数为68，分类准确率为49.69％；当主动学习迭代次数达到20次时，训练样本总数为88，分类准确率为52.40％。

通过对比上述数据，可以发现本申请提供的基于超像素的高光谱空间均匀采样主动学习分类方法训练样本对AVIRIS Indian Pines高光谱图像测试样本分类，得到的准确率在迭代次数为10和20的时候，基于相同的训练样本数量，本申请所提供的主动学习分类方法可以提高图像分类准确率。

本申请实施例可能带来的有益效果包括但不限于：通过对高光谱图像进行超像素分割，对采集样本加入空间信息差异评估，可以提高训练样本的价值；利用空间信息对采样过程中的光谱信息进行补充，降低光谱变异等因素对采样过程的干扰，进一步提高空间采样效率，提高图像分类准确率。

应当理解，本申请提供的一种电子设备，所述设备包括至少一个处理器以及至少一个存储器。在一些实施例中，所述电子设备可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的电子设备不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

此外，本领域技术人员可以理解，本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)、或连接至外部计算机(例如通过因特网)、或在云计算环境中、或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的服务器或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本申请披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本申请实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外，对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是，如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方，以本申请的描述、定义和/或术语的使用为准。