CN111832615A

CN111832615A - 一种基于前景背景特征融合的样本扩充方法及系统

Info

Publication number: CN111832615A
Application number: CN202010502552.8A
Authority: CN
Inventors: 张义; 孙显; 付琨; 张跃; 王辉; 常仲翰; 张腾飞; 李�浩
Original assignee: Aerospace Information Research Institute of CAS
Current assignee: Aerospace Information Research Institute of CAS
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2020-10-27

Abstract

本发明公开了一种基于前景背景特征融合的样本扩充方法及系统，包括基于地物类别将遥感地物分类数据集划分为源数据集、目标数据集；基于源数据集构建小样本源地物分类任务，并基于小样本源分类任务训练特征提取器，混合模型和分类器；基于目标数据集构建小样本目标地物分类任务；基于目标分类任务利用训练好的特征提取器和混合模型进行样本扩充；其中，每个任务均包括：前景特征、背景特征和混合特征，混合特征为前景特征和背景特征利用混合模型合成的特征，本发明基于分类任务训练混合模型，不增加额外的人工标注扩充训练样本，降低了训练成本，利用训练好的特征提取器与混合模型对目标数据集进行扩充，对分类器进行训练，实现了样本扩充的方法。

Description

一种基于前景背景特征融合的样本扩充方法及系统

技术领域

本发明涉及遥感智能识别领域，具体涉及一种基于前景背景特征融合的样本扩充方法及系统。

背景技术

小样本学习是从少量的数据中快速学习到模型。小样本图像识别是人工智能中具有挑战性的新兴领域。传统深度学习方法需要大量的训练数据，当数据量比较小时容易使模型出现过拟合从而降低性能。然后在很多领域都有数据量匮乏的现象，例如珍稀物种的识别，医学诊断图片等，由于难以获取数据，或者不易于标注，导致传统的深度学习技术无法很好的应用在这些领域。

随着航天技术的发展，我国的对地观测系统已经初步形成。我们可以通过遥感卫星获取高分辨率的遥感数据。高分辨的遥感影像在国土调查、城市检测、气象、水利水电、国防安全等领域有着重要的作用。遥感地物分类在挖掘遥感影像数据中有着重要的价值。然而在实际研究中，获取的遥感地物样本通常是大量的无标签数据，需要对数据进行人工标注。而且训练数据不同类别样本的数据量往往不一样，会出现样本数量不均衡的情况。

综上所述，在样本稀少的情况实现小样本遥感地物分类是一个十分具有实际意义的工作。现有的小样本图像分类方法提出有如下几种：

度量学习通过神经网络学习实例之间的相似性，将目标特征输入到关系单元中与训练样本的特征进行比较，通过相似度的衡量来结果的判断。

元学习方法的思想是寻找模型的超参数和参数，使用少量样本通过元学习器学习这个任务的模型，从而解决这个任务，同时通过模型的通用性。

数据增强通过数据生成网络生成虚拟数据扩充样本的多样性，通过端到端的方式训练生成网络和分类算法，并且保证了生成的图像对分类任务有作用。但是它增加了训练成本，需要多个数据集参与训练。

发明内容

为了解决现有技术中通过数据生成网络扩充样本所存在的额外训练成本问题，本发明提供一种基于前景背景特征融合的样本扩充方法，包括：

基于地物类别将遥感地物分类数据集划分为源数据集、目标数据集；

基于所述源数据集构建小样本源地物分类任务，并基于所述小样本源分类任务训练特征提取器，混合模型和分类器；

基于所述目标数据集构建小样本目标地物分类任务；

基于所述目标分类任务利用所述训练好的特征提取器和混合模型进行样本扩充；

其中，所述每个任务均包括：前景特征、背景特征和混合特征，所述混合特征为前景特征和背景特征利用混合模型合成的特征。

优选的所述基于所述源数据集构建小样本源地物分类任务或基于所述目标数据集构建小样本目标地物分类任务，包括：

基于源数据集或目标数据集：

随机选取多个类别；

每类随机选取多个样本组成多个小样本源地物分类任务或目标分类任务。

优选的所述基于源数据集小样本地物分类任务训练特征提取器，混合模型和分类器，包括：

在每个训练任务中，采用显著性预测网络提取每个地物图像的显著性区域掩膜，使用网络的特征提取器作为分类任务的特征提取器，利用所述掩膜获取该样本的前景特征与背景特征；

计算每个任务中不同类别的不同样本的背景相似先验度，并将高于一定阈值的样本的背景与前景特征两两组合，通过混合模型得到合成的特征；

使用合成后的特征进行训练，在交叉熵损失函数下按照反向传播算法，对混合模型和分类器进行优化。

优选的，所述基于小样本源分类任务训练特征提取器，包括：

将所述小样本源分类数据集划分为训练集和测试集使用显著性检测网络利用训练集对特征提取器进行训练；

在训练过程中，将显著性检测网络分为一个显著性学习模块和噪声学习模块利用显著性模块损失函数的预测结果作为监督，其中所述损失函数为交叉熵损失函数；

利用噪声模块对预测结果建模得到预测噪声；

优选的所述显著性模块中损失函数计算式如下：

式中，L₁为显著性模块中损失函数，i为训练图像的索引，j为显著性图的索引，L()为交叉熵损失函数计算，N为训练图片的数量，M为每张图像M个显著性图，

为显著性网络的预测输出，

为使用非监督方法的预测结果；

所述交叉熵损失函数计算式如下：

所述噪声模块中损失函数如下式：

式中，L_z为噪声模块中损失函数，KL()为KL散度计算。

优选的所述采用显著性模块提取每个地物图像的显著性区域掩膜，利用所述掩膜获取该样本的前景特征与背景特征，包括：

采用所述训练好的显著性学习模块提取每个地物图像的显著性区域掩膜；

利用所述地物图像的显著性区域掩膜确定获得图像的前景特征；

所述地物图像特征中的其他部分为背景特征。

优选的所述将每个任务中不同样本的前景、背景特征两两组合，通过混合模型得到合成的特征，包括：

将每个任务中不同样本的前景、背景特征经过混合模型中一半的卷积块进行求和；

再经过剩余一半的卷积块得到融合特征；

其中，所述混合模型，包括多个卷积块构成，每个卷积块均包括：一个卷积层、BatchNorm层、激活函数和池化层。

优选的所述混合模型的卷积块为8个。

优选的所述通过测量选定图像背景与其他背景的相似度，过滤虚假的数据，使用合成后的特征进行训练，在交叉熵损失函数下按照反向传播算法，对混合模型和分类器进行优化，包括：

对于所有类别样本，计算两两样本背景之间的距离；

基于两两样本背景之间的距离计算两两样本背景的相似先验度；

当存在大于一定阈值的两两样本背景的相似先验度时，如果大于一定阈值的两两样本为同类别样本时，实行特征融合，如果所述两两样本为同一类别的时，将其背景与前景的特征进行两两融合；

将特征网络提取的特征与混合后的特征一起送入分类器，计算其交叉熵损失，使用反向传播算法更新神经网络参数。

利用所述训练集和验证集对特征提取器进行优化，使用测试集对分类器进行测试。

优选的所述两两样本背景之间距离的计算公式如下：

式中，d()为b_n，b_n′背景之间距离；b_n，b_n′为样本n和样本n′的背景标签；f()为样本背景的特征表示；

所述相似先验度计算公式：

其中p()为b_n，b_n′相似先验度；a，d为超参数；

所述交叉熵损失函数如下：

式中，L_cls为交叉熵损失函数；y_c为第c类样本标签，c为类别数目；

为预测输出。

优选的所述采用所述混合模型对所述目标数据集中的样本进行扩充，之后还包括：

步骤1)将所述扩充后的样本划分为扩充训练集和测试集，

步骤2)利用所述扩充后的样本对分类器进行扩充训练，得到小样本条件下的遥感地物分类；

步骤3)将所述测试集带入扩充训练后的分类器得到小样本条件下的遥感地物预测分类；

步骤4)基于所述遥感地物预测分类和测试集中的地物分类，采用F-score法对精确率与召唤率进行计算得到F-score指标；

步骤5)再次将所述扩充后的样本划分为扩充训练集和测试集，重复执行所述步骤2)，直到将所述目标数据集重复划分设定次数后，执行步骤6)；

步骤6)计算F-score指标的平均值，并基于所述平均值对分类器进行优化。

优选的，所述精确率计算式如下：

式中，P为精确率；TP表示被正确判定为正样本的数目；FP表示被错误判定为正样本的数目；

所述召唤率(R)计算式如下：

式中：R为召唤率；FN表示被误判为负样本的正样本；

F-score的计算方式如下：

式中，F为指标值。基于同一种发明构思，本发明还提供一种基于前景背景特征融合的样本扩充系统，包括：

划分模块用于，基于地物类别将遥感地物分类数据集划分为源数据集、目标数据集；

训练模块用于，基于所述源数据集构建小样本源地物分类任务，并基于所述小样本源分类任务训练特征提取器，混合模型和分类器；

分类任务模块用于，基于所述目标数据集构建小样本目标地物分类任务；

样本扩充模块用于，基于所述源分类任务利用所述训练好的特征提取器和混合模型进行样本扩充；

与现有技术相比，本发明的有益效果为：

1、本发明提供了一种基于前景背景特征融合的样本扩充方法及系统，包括基于地物类别将遥感地物分类数据集划分为源数据集、目标数据集；基于源数据集构建小样本源地物分类任务，并基于小样本源分类任务训练特征提取器，混合模型和分类器；基于目标数据集构建小样本目标地物分类任务；基于目标分类任务利用训练好的特征提取器和混合模型进行样本扩充；其中，每个任务均包括：前景特征、背景特征和混合特征，混合特征为前景特征和背景特征利用混合模型合成的特征，基于分类任务训练混合模型，不增加额外的人工标注扩充训练样本，降低了训练成本，利用训练好的特征提取器与混合模型对目标数据集进行扩充，对分类器进行训练，实现了样本扩充的方法。

2、本发明提供的一种基于前景背景特征融合的样本扩充方法及系统，通过源数据集对显著性检测网络的训练，完成特征提取器的参数初始化，通过分类任务对混合模型以及分类器进行训练，降低源数据集上的过拟合风险，不需要使用额外的人工标注数据集训练生成模型，降低了训练成本。

3、本发明提出的一种基于前景背景特征融合的样本扩充方法及系统对不同类别的样本使用了过滤虚假样本的策略，基于两两样本背景之间的距离计算两两样本背景的相似先验度，当其大于一定阈值时，将其背景与前景的特征进行融合，可以将不符合真实生活的样本过滤掉，避免虚拟数据对模型产生副作用，有效地扩展出新的目标数据，提高了模型的性能，在公开遥感地物数据集上获得目前最好的效果。

附图说明

图1为本申请实施例提供的一种基于前景背景特征融合的样本自动扩充方法的流程示意图；

图2为本申请实施例提供的小样本遥感地物分类的数据集划分流程示意图；

图3为本申请实施例提供的一种显著性检测网络训练流程图；

图4为本申请实施例提供的小样本地物分类任务构建示意图；

图5为本申请实施例提供的一种基于自动样本扩充的小样本遥感地物分类方法的前景背景特征合成示意图；

图6本申请实施例2提供的小样本遥感地物分类系统总体框图。

具体实施方式

为了更好地理解本发明，下面结合说明书附图和实例对本发明的内容做进一步的说明。

实施例1：

如图1所示，一种基于前景背景特征融合的样本扩充方法，其特征在于，包括：

S1：基于地物类别将遥感地物分类数据集划分为源数据集、目标数据集；

S2：基于所述源数据集构建小样本源地物分类任务，并基于所述小样本源分类任务训练特征提取器，混合模型和分类器；

S3：基于所述目标数据集构建小样本目标地物分类任务；

S4：基于所述目标分类任务利用所述训练好的特征提取器和混合模型进行样本扩充；

S1：基于地物类别将遥感地物分类数据集划分为源数据集、目标数据集，如图2所示，其中具体包括：

将遥感地物分类数据集中地物类别划分为源类别、目标类别，并保证二者不存在地物类别重合。进一步按照源类别、目标类别，将遥感地物分类数据集划分为源数据集、目标数据集，并保证源数据集上每类样本数一般不少于500个；

S2：所述基于源数据集小样本地物分类任务训练特征提取器，混合模型和分类器，首选构建显著性图检测任务，使用源数据集对显著性检测网络进行训练，提取每个地物图像的显著性区域掩膜。然后从源数据集中随机选取N个类别，每类随机选取K个样本组成N-way，K-shot小样本地物分类任务，并从每类剩余样本中随机抽取W个样本作为该任务的测试样本，从源数据集中构建S个这样的任务，示意图如图4所示。使用该网络的特征提取器作为分类任务的特征提取器，获取样本的前景特征与背景特征，通过混合模型得到合成的特征，前景背景特征合成示意图如图5所示，使用合成后的特征进行训练，在交叉熵损失函数下按照反向传播算法，对混合模型和分类器进行优化，包括：

(1)将所述小样本源分类数据集划分为训练集和测试集使用显著性检测网络利用训练集对特征提取器进行训练，训练示意图如图3；

步骤1：深度检测网络预测显著性图，由特征提取器和FCN构成，使用噪声模型预测噪声，将传统显著性检测方法的预测结果看做显著性图加噪声的集合作为网络的监督；

步骤2：损失函数由两部分构成，显著性模块直接使用已有方法的非监督方法的预测结果，与本方法的预测结果使用交叉熵损失函数，噪声模块假设噪声服从高斯分布，使用预测噪声与理想噪声的KL散度作为损失函数，KL散度(Kullback-Leibler divergence)或信息散度(information divergence)，是两个概率分布(probability distribution)间差异的非对称性度量，在本发明中用来训练显著性检测网络中的噪声模块；

显著性模块中损失函数计算式如下：

为显著性网络的预测输出，

为使用非监督方法的预测结果；

交叉熵损失函数计算式如下：

噪声模块中损失函数如下式：

式中，L_z为噪声模块中损失函数，KL()为KL散度计算。

步骤3：待损失函数趋于平稳后终止训练。剔除深度检测网络的FCN，并将剩余部位的参数用于特征提取器的参数初始化。

(2)采用显著性预测网络提取每个地物图像的显著性区域掩膜，利用所述掩膜获取该样本的前景特征与背景特征，计算每个任务中不同类别的不同样本的背景相似先验度，高于一定阈值的样本，将其前景、背景特征通过混合模型得到合成的特征，包括：

步骤1：采用所述训练好的显著性学习模块提取每个地物图像的显著性区域掩膜，利用所述地物图像的显著性区域掩膜确定获得图像的前景特征，所述地物图像特征中的其他部分为背景特征；

步骤2：对于不同类别样本，计算两两样本背景之间的距离，基于两两样本之间的背景距离计算两两样本背景的相似先验度，当存在大于一定阈值的两两样本背景的相似先验度时，实行特征融合，如果所述两两样本同一类别的时，将其背景与前景的特征进行两两融合；

其中，两两样本背景之间距离的计算公式如下：

相似先验度计算公式：

其中p()为b_n，b_n′相似先验度；a，d为超参数；

交叉熵损失函数如下：

为预测输出。

步骤3：混合模型由12个卷积块构成，样本的前景、背景特征各经过4个卷积块之后进行求和，再经过剩余一半的卷积块得到融合特征；其中，所述混合模型，包括多个卷积块构成，每个卷积块均包括：一个卷积层、BatchNorm层、激活函数和池化层。

(3)将特征网络提取的特征与混合后的特征一起送入分类器，计算其交叉熵损失，使用反向传播算法更新神经网络参数，对混合模型和分类器进行优化。

S3：基于所述目标数据集构建小样本目标地物分类任务，然后从目标数据集中随机选取N个类别，每类随机选取K个样本组成N-way，K-shot小样本地物分类任务，并从每类剩余样本中随机抽取W个样本作为该任务的测试样本，从目标数据集中构建S个这样的任务，示意图如图4所示。

S4：给定目标数据集上的小样本地物分类任务。利用显著性检测网络获取训练样本的显著性区域掩膜，利用特征提取器获取样本的特征，通过混合模型对训练样本特征进行融合的扩充后的样本空间，使用合成后特征以及特征网络提取的特征对分类器进行训练，使用训练好的分类器对测试集中样本进行测试，确定测试样本的地物分类；

此外，考虑到目标数据集的训练集中样本数量较少，不具有代表性，为了让本算法的小样本地物分类性能的测试结果更为可靠，一般将目标数据集重复划分M次，然后重复进行模型的训练、测试，最后将M次划分中测试结果的平均值作为最终的测试结果。本算法采用基于F-score的标准差进行判别，其中对于F-score的计算方式如下：

P为精确率，即预测为正且预测正确的样本占所有预测为正的样本的比例；R为召回率，即预测为正且预测正确的样本占所有实际为正的样本的比例。

实施例2

为了实现上述方法，本发明还提供一种基于前景背景特征融合的样本扩充系统，如图6所示，包括：

其中，所述每个任务均包括：前景特征、背景特征和混合特征，所述混合特征为前景特征和背景特征利用混合模型合成的特征。其中，数据集划分模块具体用于：

将遥感地物分类数据集中地物类别划分为源类别、目标类别，且所述源类别和目标类别中的地物类别互斥；

基于所述源类别和目标类别将遥感地物分类数据集划分为源数据集、目标数据集；

本实施例中源数据集上每类地物目标所所对应的样本数应不少于500。

训练模块具体用于：

(1)使用显著性检测网络利用源数据集训练集对特征提取器进行训练，包括：

由特征提取器和FCN进行预测显著性图，使用噪声模型预测噪声，将传统显著性检测方法的预测结果看做显著性图加噪声的集合作为网络的监督；

损失函数由两部分构成，显著性预测模块的损失函数加上噪声模块的损失函数，同时用一个正则化因子进行权衡。

待损失函数趋于平稳后终止训练，使用训练好的特征提取器作为分类器的特征提取器。

(2)使用混合模型对特征进行融合，包括：

采用显著性预测网络提取每个地物图像的显著性区域掩膜，利用所述掩膜获取该样本的前景特征与背景特征，

计算每个任务中不同类别的不同样本的背景相似先验度，高于一定阈值的样本，将其前景、背景特征通过混合模型得到合成的特征，

分类任务模块用于：

基于所述目标数据集构建小样本目标地物分类任务，包括：

基于所述目标数据集构建小样本目标地物分类任务，然后从目标数据集中随机选取N个类别，每类随机选取K个样本组成N-way，K-shot小样本地物分类任务，并从每类剩余样本中随机抽取W个样本作为该任务的测试样本，从目标数据集中构建S个这样的任务；

样本扩充模块用于：

基于所述源分类任务利用所述训练好的特征提取器和混合模型进行样本扩充，具体包括：

利用显著性检测网络提取每个地物图像的显著性区域掩膜，利用特征提取器获取样本的前景特征，背景特征，

通过混合模型对训练样本特征进行融合的扩充后的样本空间，

使用合成后特征以及特征网络提取的特征对分类器进行训练，

使用训练好的分类器对测试集中样本进行测试，确定测试样本的地物分类。

Claims

1.一种基于前景背景特征融合的样本扩充方法，其特征在于，包括：

基于所述目标数据集构建小样本目标地物分类任务；

2.如权利要求1所述的样本扩充方法，其特征在于，所述基于所述源数据集构建小样本源地物分类任务或基于所述目标数据集构建小样本目标地物分类任务，包括：

基于源数据集或目标数据集：

随机选取多个类别；

3.如权利要求1所述的样本扩充方法，其特征在于，所述基于源数据集小样本地物分类任务训练特征提取器，混合模型和分类器，包括：

4.如权利要求1所述的样本扩充方法，其特征在于，所述基于小样本源分类任务训练特征提取器，包括：

在训练过程中，将显著性检测网络分为一个显著性学习模块和噪声学习模块

利用显著性模块损失函数的预测结果作为监督，其中所述损失函数为交叉熵损失函数；

利用噪声模块对预测结果建模得到预测噪声；

优选的，所述显著性模块中损失函数计算式如下：

为显著性网络的预测输出，

为使用非监督方法的预测结果；

所述交叉熵损失函数计算式如下：

所述噪声模块中损失函数如下式：

式中，L₂为噪声模块中损失函数，KL()为KL散度计算；

优选的，所述采用显著性模块提取每个地物图像的显著性区域掩膜，利用所述掩膜获取该样本的前景特征与背景特征，包括：

所述地物图像特征中的其他部分为背景特征。

5.如权利要求3所述的样本扩充方法，其特征在于，所述将每个任务中不同样本的前景、背景特征两两组合，通过混合模型得到合成的特征，包括：

再经过剩余一半的卷积块得到融合特征；

优选的，所述混合模型的卷积块为8个。

6.如权利要求5所述的样本扩充方法，其特征在于，所述通过测量选定图像背景与其他背景的相似度，过滤虚假的数据，使用合成后的特征进行训练，在交叉熵损失函数下按照反向传播算法，对混合模型和分类器进行优化，包括：

对于所有类别样本，计算两两样本背景之间的距离；

7.如权利要求6所述的样本扩充方法，其特征在于，两两样本背景之间距离的计算公式如下：

式中，d()为b_n，b_n′背景之间距离；b_n，b_n′为样本n和样本n^′的背景标签；f()为样本背景的特征表示；

所述相似先验度计算公式：

其中p()为b_n，b_n′相似先验度；a，d为超参数；

所述交叉熵损失函数如下：

为预测输出。

8.如权利要求1所述的样本扩充方法，其特征在于，所述采用所述混合模型对所述目标数据集中的样本进行扩充，之后还包括：

步骤1)将所述扩充后的样本划分为扩充训练集和测试集，

9.如权利要求8所述的测试指标计算方法，其特征在于，所述精确率计算式如下：

所述召唤率(R)计算式如下：

式中：R为召唤率；FN表示被误判为负样本的正样本；

F-score的计算方式如下：

式中，F为指标值。

10.一种基于前景背景特征融合的样本扩充系统，其特征在于，包括：

训练模块用于，基于所述源数据集构建小样本源地物分类任务，并基于所述小样本源分类任务训练特征提取器，混合模型分类器；