CN114627390B

CN114627390B - 一种改进的主动学习遥感样本标记方法

Info

Publication number: CN114627390B
Application number: CN202210512002.3A
Authority: CN
Inventors: 董铱斐; 段红伟; 邹圣兵; 陈婷
Original assignee: Beijing Shuhui Spatiotemporal Information Technology Co ltd
Current assignee: Beijing Shuhui Spatiotemporal Information Technology Co ltd
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2022-08-16
Anticipated expiration: 2042-05-12
Also published as: WO2023216725A1; CN114627390A

Abstract

本发明涉及一种改进的主动学习遥感样本标记方法，属于遥感图像处理技术领域。该方法首先利用改进的价值样本筛选策略筛选出兼具不确定性和多样性的价值样本，然后利用生成对抗网络生成价值生成样本以增加价值样本的数据丰富度，进一步利用价值生成样本训练出第二分类器组，利用训练的第二分类器组完成价值样本集的标记。本发明解决了传统主动学习中通过专家进行价值样本标记导致的人工成本高的问题，利用学习到丰富的价值样本特征的第二分类器组进行价值样本标记，在降低了人工成本的同时，有效增加了标记准确率。

Description

一种改进的主动学习遥感样本标记方法

技术领域

本发明涉及遥感图像处理技术领域，尤其涉及一种改进的主动学习遥感样本标记方法。

背景技术

全球土地覆盖数据是人类认识自然、掌握自然规律必备的信息，也是各种资源管理和地理信息服务所需要的最基本数据。遥感数据的优势在于其包含了丰富的空间信息，有利于研究地物的空间特性。随着我国卫星硬件技术和对地观测技术的不断突破使得遥感数据的空间分辨率、时间分辨率乃至光谱分辨率日益提升，遥感数据量呈井喷式增长，如果全部采用人工标记数据将会导致标记成本过大。在此背景下，主动学习进行样本标记的方法应运而生。

现有基于主动学习样本标记原理是从未标记样本中挑选部分价值量高的未标注样本，经过专家标记后补充到已标记样本集中，再用补充的已标记样本集训练分类器来提高分类器精度，继续利用当前分类器选取价值样本进行专家标记，再次训练当前分类器，直至分类器满足预设的训练停止条件，最后用训练好的分类器对其余未标记样本进行样本标记。主动学习通过主动选择一些价值量高的未标注样本给相关领域的专家进行标注，这样的样本通常蕴含了丰富的信息，并且对模型调优起着很好的作用。

现有的主动学习任务尚存在许多不足之处。具体的，第一，传统的主动学习通过专家知识对价值样本进行标记，但是，在具体实践中，但是由于缺少专业知识，人工标注是一件异常困难且代价很大的事，目前采用机器标注取代人工标注，然而由于价值样本数量较少，导致机器不能很好地学习价值样本的特征，不能保证标记的准确率；第二，现有的主动学习方法通常利用不确定性衡量未标记样本的价值量，而基于不确定性的主动学习方法通常忽略了数据之间的差异性，存在同一类中重复选择不必要的样本的情况。

发明内容

本发明提出一种改进的主动学习遥感样本标记方法，弥补了现有的主动学习依赖专家标记价值样本的导致人工成本较高的缺陷的同时，弥补了现有的机器标记价值样本导致的标记错误率高的缺陷。本发明通过生成对抗网络生成价值生成样本以增加价值样本的数据丰富度，进一步利用价值生成样本训练出能够更好地学习价值样本的特征的第二分类器组，提高了机器标记价值样本的准确率，保证样本标记的准确率的同时大大降低了人工成本。

为实现上述技术目的，本发明的技术方案如下：

一种改进的主动学习遥感样本标记方法，该方法包括以下步骤：

S1获取样本集，所述样本集包括未标记样本集和已标记样本集；

S2通过所述已标记样本集训练得到第一分类器模型；

S3判断是否满足所述第一分类器模型训练终止的条件：

若满足，结束训练，执行步骤S11；

若不满足，执行步骤S4；

S4将未标记样本放入第一分类器模型进行预测，并利用改进的价值样本查询策略筛选未标记样本，得到既有不确定性又具有多样性的价值样本集{b_i}，b_i为价值样本；

S5获取价值样本b_i在所述第一分类器中的预测结果，包括类别标签和类别标签的预测分数，并按照从大到小的顺序对预测分数进行排序，选取预测分数排名前s的类别标签，得到价值样本b_i的候选伪标签集{Lⁱ _n}；

i为价值样本的编号，n为候选伪标签的编号，s为候选伪标签集中的候选伪标签个数，其中s≥2；

S6通过所述价值样本集{b_i}训练生成对抗网络，并通过训练的生成对抗网络获得价值生成样本集{b_ij}；

S7将s个价值样本b_i的候选伪标签Lⁱ _n，分别赋予价值生成样本集{b_ij}，得到s个已标记价值生成样本集{b_ij /Lⁱ _n}；

S8分别对s个已标记价值生成样本集和已标记样本集取并集，得到s个合并已标记样本集；

S9通过已标记样本集训练出第二分类器组，并通过第二分类器组的响应，从s个候选伪标签中筛选出所述价值样本b_i的真实标签Lⁱ _a，完成价值样本b_i的标记，得到已标记价值样本集{(b_i/Lⁱ _a)}；

a为价值样本伪标签的编号；

S10将所述已标记价值样本集{b_i/Lⁱ _a}加入所述已标记样本集，返回至所述步骤S2；

S11通过所述第一分类器模型对未标记样本集进行样本标记。

更进一步地，所述步骤S7包括：

将所述价值样本b_i的s个候选伪标签Lⁱ _n分别赋予所述价值生成样本集{b_ij}，得到s个已标记价值生成样本集{(b_ij /Lⁱ ₁)},{(b_ij /Lⁱ ₂)},...,{(b_ij /Lⁱ _s)}。

更进一步地，所述步骤S8包括：

将已标记样本集分别和s个已标记价值生成样本集取并集，得到s个合并已标记样本集。

更进一步地，所述步骤S9包括：

S91通过s个合并已标记样本集训练出s个第二分类器模型，组成第二分类器组；

S92将所述价值样本b_i分别输入s个第二分类器模型，根据所述价值样本b_i在s个第二分类器模型的响应差异在s个候选伪标签中确定所述价值样本b_i的伪标签。

更进一步地，所述改进的价值样本查询策略包括：

S41根据聚类算法对已标记样本集进行聚类，得到n个聚类中心

；

S42对于每个未标记样本x，经过第一分类器的预测，基于不确定性筛选产生预测概率向量f(x)；

S43基于不确定性筛选计算未标记样本x和所述n个聚类中心

之间的最大距离，产生多样性向量g(x)；

S44通过预测概率向量f(x)和多样性向量g(x)，得到未标记样本的样本价值T；

S45判断是否存在当前动态阈值：若不存在，执行步骤S46，若存在，跳转至S47；

S46设置初始动态阈值初始值作为当前动态阈值，并构建价值样本集，初始价值样本集为空集，执行步骤S47；

S47根据所述价值样本集是否为空集判断当前动态阈值是否进行调整：

若所述价值样本集为空集，则对所述当前动态阈值增加预设数值，获得新的当前动态阈值；

若所述价值样本集不为空集，则保持所述当前动态阈值不变；

S48根据所述样本价值T与当前动态阈值T_THR的关系判断所述未标记样本x是否为价值样本；

若否，则将所述未标记样本x赋予伪标签y₁，并将该样本

合并入已标记样本集；

若是，则将所述未标记样本x记为价值样本b_i，i为价值样本的编号，并加入价值样本集{b_i}。

更进一步地，所述第一分类器模型训练终止的条件包括所述价值样本的数量达到预先设定的上限或所述第一分类器模型训练误差在预先设定的范围内。

更进一步地，所述步骤S6包括：

S61对所述价值样本b_i进行编码，得到价值样本b_i对应的隐变量；

S62初始化所述生成对抗网络的生成器和鉴别器的参数；

S63将所述价值样本b_i对应的隐变量和随机噪声输入所述生成器，得到合成样本，并将所述合成样本和所述价值样本同时输入所述鉴别器以鉴别真伪；

S64所述生成器和所述鉴别器相互博弈直至所述鉴别器将所述合成样本鉴定为真；

S65将所述价值样本对应的隐变量和随机噪声输入训练好的生成器，得到价值生成样本b_ij，所述价值生成样本b_ij与所述价值样本b_i服从相同分布。

本发明的有益效果为：

(1) 本发明通过生成对抗网络得到与价值样本同分布的价值生成样本，从而利用价值生成样本训练出能够更好地学习价值样本的特征的第二分类器组，利用第二分类器组完成对价值样本的标记，相比现有的主动学习方法，本方法增加价值样本的数据丰富度，使分类器更好地学习价值样本的特征，显著提升分类器的标注准确率，同时降低人工标记成本；

(2) 本发明通过改进的价值样本查询策略，考虑了价值样本与已标记样本的差异性，从不确定性和多样性对样本进行价值筛选，得到在不确定性和多样性上均具备训练价值的价值样本，相比现有的主动学习查询策略，本方法在价值样本的选取上避免了样本偏差问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

附图1为本发明提供的一种改进的主动学习遥感样本标记方法流程图；

附图2为本发明一具体实施例中一种改进的主动学习遥感样本标记过程示意图；

附图3为本发明一具体实施例中生成对抗网络的训练过程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

参考图1和图2，理解以下具体实施例。图1为本发明提供的一种改进的主动学习遥感样本标记方法的流程图。该方法包括以下步骤：

S1获取样本集，所述样本集包括未标记样本集和已标记样本集。

S2通过所述已标记样本集训练得到第一分类器模型。

在具体实现中，可选择Resnet50作为网络架构并通过已标记样本集训练得到第一分类器模型C¹。

S3判断是否满足所述第一分类器模型训练终止的条件。

若满足，结束训练，执行步骤S11；

若不满足，执行步骤S4。

在具体实现中，判断当前第一分类器模型C¹的训练误差是否在预先设定的范围内：

若是，停止训练并输出训练好的第一分类器模型C¹，执行步骤S11；

若否，继续训练第一分类器模型C¹，执行步骤S4。

S4将未标记样本放入第一分类器模型进行预测，并利用改进的价值样本查询策略筛选未标记样本，得到既有不确定性又具有多样性的价值样本集{b_i}，b_i为价值样本。

作为一种实现方式，改进的价值样本查询策略包括：

S41根据聚类算法对已标记样本集进行聚类得到n个聚类中心

。

在具体实现中，距离计算使用欧几里得距离，也可以使用其他类型的度量方法，如余弦距离等，根据具体的任务来设定。假设已标记样本x ^L _k(i)表示第i个已标记样本第k个维度，则样本x ^L(i)和x ^L(j)之间的欧几里得距离

(i,j)为：

根据聚类结果，得到n个聚类中心

。

S42将未标记样本放入第一分类器模型进行预测，对于每个未标记样本x，选取最大可能类别标签

和第二可能类别标签

，基于不确定性筛选产生预测概率f(x)：

其中，

和

分别表示对未标记样本x而言，第一分类器预测为最大可能类别标签

和第二可能类别标签

的概率分数。

S43基于不确定性筛选计算未标记样本x和所述聚类中心

之间的最大距离，产生多样性向量g(x)：

其中,对于不同分布的数据集，p将会选取不同值，p=1时，

表示曼哈顿距离，p=2时，

表示欧几里得距离，n为聚类中心的个数，

表示未标记样本和聚类中心样本的维度，

表示未标记样本x的第k个维度，

分别表示第i个聚类中心样本

的第k个维度。

S44通过改进的价值样本查询策略公式进行价值样本查询，得到未标记样本的样本价值T,公式如下：

。

S45判断是否存在当前动态阈值：若不存在，执行步骤S46，若存在，跳转至S47。

S46设置初始动态阈值初始值作为当前动态阈值，并构建价值样本集，初始价值样本集为空集，执行步骤S47。

若所述价值样本集不为空集，则保持所述当前动态阈值不变。

若否，则将所述未标记样本x赋予伪标签y₁，并将该样本

合并入已标记样本；

在现有的价值样本的查询策略中，通常利用样本的不确定性进行价值样本的筛选，但是可能会造成数据偏差，通过样本的多样性改进查询策略，倾向于选择离群点的可能性，避免出现样本偏差，使查询出的价值样本兼具不确定性和多样性。其中，在样本多样性计算中，倾向于选择与已标记样本距离较远的样本，具体做法是对已标记样本聚类中心，

值得说明的是，x来自未标记样本集，

来自已标记样本集，两个样本集中的样本均具有k个维度。

值得说明的是，对于T≥T_THR的未标记样本，其对第一分类器来说是无价值样本，由于T≥T_THR，即最大可能类的概率在一定程度上大于第二可能类，当前第一分类器模型足以能够区分出所述无价值样本的类别，所以不再需要使用所述无价值样本对模型进行微调，即无价值样本对模型的作用相对较小，甚至没有作用，所以不需要用无价值样本再次进行模型训练。

S5获取价值样本b_i在所述第一分类器中的预测结果，包括类别标签和类别标签的预测分数，并按照从大到小的顺序对预测分数进行排序，选取预测分数排名前s的类别标签，得到价值样本b_i的候选伪标签集{Lⁱ _n}。i为价值样本的编号，n为候选伪标签的编号，s为候选伪标签集中的候选伪标签个数，其中s≥2。

在具体实现中，参考图2，以价值样本b₁的候选伪标签集{Lⁱ _n}获取过程为例详细说明步骤S5：

价值样本b₁的在所述第一分类器中类别标签按照预测概率分数从大到小排列表示为L¹ ₁，L¹ ₂，...，其中L¹ ₁是价值样本b₁被第一分类器C¹预测为最大可能的类别标签，L¹ ₂是价值样本b₁被第一分类器C¹预测为第二大可能的类别标签，以此类推，按照预测概率分数从大到小选取前s个类别标签，作为价值样本b₁的候选伪标签，构成价值样本b₁的候选伪标签集{L¹ _n}，说明机器无法确定价值样本b₁的类别标签，需要在s个类别标签L¹ ₁，L¹ ₂，...，L¹ _s中找到价值样本b₁的真实类别标签。

S6通过所述价值样本集{b_i}训练生成对抗网络，并通过训练的生成对抗网络获得价值生成样本集{b_ij}。

作为一种实现方式，上述步骤S6包括：

S62初始化所述生成对抗网络的生成器和鉴别器的参数；

其中，步骤S61-S64是生成对抗网络的训练过程，该训练过程参考图3。在训练过程中，合成样本会被鉴别器认为是“假样本”，而生成器的目的就是“欺骗”鉴别器，生成让鉴别器鉴别为“真样本”的合成样本，整个训练过程就是鉴别器和生成器的博弈过程，博弈的最终结果就是获得令鉴别器分类准确率最大化的参数，以及获得最大化欺骗鉴别器的生成器参数。

S7将s个价值样本b_i的候选伪标签Lⁱ _n，分别赋予价值生成样本集{b_ij}，得到s个已标记价值生成样本集{b_ij /Lⁱ _n}。

作为一种实现方式，上述步骤S7包括：

将所述价值样本b_i的s个候选伪标签Lⁱ _n分别赋予所述价值生成样本b_ij，得到s个已标记价值生成样本集{(b_ij /Lⁱ ₁)},{(b_ij /Lⁱ ₂)},...,{(b_ij /Lⁱ _s)}。

S8分别将s个已标记价值生成样本集与已标记样本集取并集，得到s个合并已标记样本集。

作为一种实现方式，上述步骤S8包括：

分别将s个已标记价值生成样本集{(b_ij /Lⁱ ₁)},{(b_ij /Lⁱ ₂)},...,{(b_ij /Lⁱ _s)}与已标记样本集R取并集，得到s个合并已标记样本集：{(b_ij /Lⁱ ₁)}∪R,{(b_ij /Lⁱ ₂)}∪R,...,{(b_ij /Lⁱ _s)}∪R。

S9通过已标记样本集训练出第二分类器组，并通过第二分类器组的响应，从s个候选伪标签中筛选出所述价值样本b_i的伪标签Lⁱ _a，完成价值样本b_i的标记，得到已标记价值样本集{(b_i/Lⁱ _a)}，a为价值样本伪标签的编号。

在具体实现中，可选择Resnet50作为第二分类器模型的网络架构。

作为一种实现方式，上述步骤S9包括：

将s个预测标签分别赋予生成样本b_ij，得到s个有标记价值生成样本b_ij/Lⁱ _n；

然后，根据有标记价值生成样本集{b_ij/Lⁱ _n}混合有标记样本集训练出s个第二分类器模型C² _in，并根据价值样本b_i在s个第二分类器模型的响应不同，在b_i的预测标签集{Lⁱ _n}中确定价值样本b_i的伪标签Lⁱ _a，完成价值样本b_i的标记，得到已标记价值样本b_i/Lⁱ _a。

在具体实现中，参考图2，以价值样本b₁的标记过程为例详细说明步骤S7-S9：

（1）从步骤S4中获取价值样本b₁在第一分类器模型C¹中预测分数最大值对应的候选伪标签L¹ ₁和预测分数第二大值对应的候选伪标签L¹ ₂；

（2）将所述预测标签L¹ ₁和所述预测标签L¹ ₂分别赋予所述价值生成样本集{b_1j}，得到2个已标记价值生成样本集{(b_1j /L¹ ₁)}和{(b_1j /L¹ ₂)}；

（3）分别将2个已标记价值生成样本集{(b_1j /L¹ ₁)}和{(b_1j /L¹ ₂)}和已标记样本集R取并集，得到2个合并已标记样本集：{(b_ij /Lⁱ ₁)}∪R和{(b_ij /Lⁱ ₂)}∪R；

（4）通过2个合并已标记样本集训练出第二分类器组，包括2个第二分类器模型C² ₁₁和C² ₁₂，具体步骤为：

1）利用合并已标记样本集{(b_1j /L¹ ₁)}∪R训练出第二分类器模型C² ₁₁；

2）利用合并已标记样本集{(b_1j /L¹ ₂)}∪R训练出第二分类器模型C² ₁₂；

（5）将所述价值样本b₁分别输入训练的第二分类器模型C² ₁₁和C² ₁₂得到响应m₁₁和m₁₂，并根据输出的响应m₁₁和m₁₂之间的差异，在第一预测标签L¹ ₁和第二预测标签L¹ ₂中确定所述价值样本b_i的伪标签：

若存在m₁₁＜m₁₂，赋予价值样本b₁标签L¹ ₂，得到已标记价值样本b₁/L¹ ₂；

若存在m₁₁＞m₁₂，赋予价值样本b₁标签L¹ ₁，得到已标记价值样本b₁/L¹ ₁；

若存在m₁₁＝m₁₂，价值样本b₁无法标记，将所述价值样本b₁放回价值样本集{b_i}；

（6）参考步骤（1）-（5）对价值样本集{b_i}中其他的价值样本b_i（i≠1）进行样本标记，得到已标记价值样本集{(b_i/Lⁱ _a)}。

值得说明的是，传统的主动学习通过专家知识对价值样本进行标记，在具体实践中，由于缺少专业知识，人工标注是一件异常困难且代价很大的事，目前采用机器标注取代人工标注，然而由于价值样本数量较少，导致机器不能很好地学习价值样本的特征，不能保证标记的准确率。

针对以上问题，本实例的步骤S7-S9利用对抗生成网络，模拟价值样本的分布，增加价值样本的数据丰富度，得到价值生成样本，进一步利用价值生成样本训练出能够更好地学习价值样本的特征的第二分类器组，利用第二分类器组完成对价值样本的标记。由于本方法增加价值样本的数据丰富度，使分类器更好地学习价值样本的特征，所以本发明可以显著降低人工标记成本的同时，显著提升机器标记的准确率。

S10将所述已标记价值样本集{b_i/Lⁱ _a}加入所述已标记样本集，返回至所述步骤S2。

S11通过所述第一分类器模型对未标记样本集进行样本标记。

本发明的有益效果是：一方面，本发明通过生成对抗网络得到与价值样本同分布的价值生成样本，从而利用价值生成样本训练出能够更好地学习价值样本的特征的第二分类器组，利用第二分类器组完成对价值样本的标记，相比现有的主动学习方法，本方法增加价值样本的数据丰富度，使分类器更好地学习价值样本的特征，显著提升分类器的标注准确率，同时降低人工标记成本；

另一方面，本发明通过改进的价值样本查询策略，考虑了价值样本与已标记样本的差异性，从不确定性和多样性对样本进行价值筛选，得到在不确定性和多样性上均具备训练价值的价值样本，相比现有的主动学习查询策略，本方法在价值样本的选取上避免了样本偏差问题。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种改进的主动学习遥感样本标记方法，其特征在于，该方法包括以下步骤：

S2通过所述已标记样本集训练得到第一分类器模型；

S3判断是否满足所述第一分类器模型训练终止的条件：

若满足，结束训练，执行步骤S11；

若不满足，执行步骤S4；

S4将未标记样本放入第一分类器模型进行预测，并利用改进的价值样本查询策略筛选未标记样本，得到既有不确定性又具有多样性的价值样本集{b_i}，b_i为价值样本，所述改进的价值样本查询策略包括：

S41根据聚类算法对已标记样本集进行聚类，得到n个聚类中心x ^C；

S43基于不确定性筛选计算未标记样本x和所述n个聚类中心x ^C之间的最大距离，产生多样性向量g(x)；

若否，则将所述未标记样本x赋予伪标签y₁，并将该样本

合并入已标记样本集；

若是，则将所述未标记样本x记为价值样本b_i，i为价值样本的编号，并加入价值样本集{b_i}；

S7将s个价值样本b_i的候选伪标签Lⁱ _n，分别赋予价值生成样本集{b_ij}，得到s个已标记价值生成样本集{(b_ij /Lⁱ _n)}；

a为价值样本伪标签的编号；

S10将所述已标记价值样本集{(b_i/Lⁱ _a)}加入所述已标记样本集，返回至所述步骤S2；

S11通过所述第一分类器模型对未标记样本集进行样本标记。

2.根据权利要求1所述方法，其特征在于，所述步骤S7包括：

3.根据权利要求1所述方法，其特征在于，所述步骤S8包括：

4.根据权利要求1所述方法，其特征在于，所述步骤S9包括：

5.根据权利要求1所述方法，其特征在于，所述第一分类器模型训练终止的条件包括所述价值样本的数量达到预先设定的上限或所述第一分类器模型训练误差在预先设定的范围内。

6.根据权利要求1所述方法，其特征在于，所述步骤S6包括：

S62初始化所述生成对抗网络的生成器和鉴别器的参数；