CN112200245A

CN112200245A - 一种基于半监督的图像分类方法

Info

Publication number: CN112200245A
Application number: CN202011080376.XA
Authority: CN
Inventors: 文戈; 陈兴委; 刘磊; 周先得; 黄军文; 汤红
Original assignee: Shenzhen Huafu Information Technology Co ltd
Current assignee: Shenzhen Huafu Information Technology Co ltd
Priority date: 2020-10-10
Filing date: 2020-10-10
Publication date: 2021-01-08

Abstract

本发明属于图像处理技术领域，尤其涉及一种基于半监督学习的图像分类方法，包括S1:获取无标签训练图像样本；S2:基于无监督学习对无标签训练图像样本进行训练出特征提取器；S3:特征提取器将无标签训练图像样本提取出图像样本特征；S4:将提取出图像样本特征进行最小限定标注；S5:用少量标注的图像样本特征训练SVM分类器，再用SVM分类器预测其他未标注的图像样本特征，用预测的结果作为这些样本的伪标签；S6：将伪标签经噪声鲁棒学习训练成图像分类模型；S7：基于经噪声鲁棒学习训练成图像分类模型进行图像识别分类。

Description

一种基于半监督的图像分类方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于半监督学习的图像分类方法。

背景技术

图像分类是计算机视觉领域的一个经典任务，由于目前互联网和其他渠道获取的图像资源越来越多，用于训练图像分类模型的数据也日渐增长。虽然更多的数据使得分类算法的训练素材增多，可以帮助其提升准确率；但是，海量的数据使得标注任务变的更加繁重，因此，现有技术中，通常采用半监督图像分类方法解决标注任务繁重的问题，其特点是：使用者不需要标注完所有图像数据，但是在训练时依然可以通过各种方法对未标注图像样本的信息进行利用，最终训练效果会远高于仅利用已标注样本的训练效果。

现有方法之一是先利用有标注的样本进行算法模型预训练，然后用预训练好的模型对未标注样本进行预测，把未标注样本的预测结果作为它的标签(伪标签)，然后再将未标注样本及其伪标签加入训练集训练，训练后得到最终的算法模型。该方法中比较依赖预训练模型的效果，如果已标注样本数量不够，预训练模型对未标注样本的伪标签生成不会准确，而增加已标注样本的数量，同样会使得工作会变的繁重。

现有方法之二是利用一致性正则(Consistency Regularization)原则来对未标注样本进行训练，即模型虽然不知道未标注样本的标签，但同一个未标注样本经过旋转等图像增广手段所生成的多个样本输入模型后理应有尽量一致的输出，以深度学习模型为例，通过对同一未标注样本的增广图片输入模型后产生的输出差异构建网络损失函数，与已标注样本的常规分类损失函数组合到一起对网络进行监督训练，最终得出的结果将优于仅利用标注样本的结果，但该方法并没有挖掘未标注样本的类别信息。

现有方法之三是对现有方法一、二的结合使用，一方面利用预训练模型来生成未标注样本的伪标签，另一方面依然利用一致性正则原则，对训练样本进行增广并监督网络对同一样本的不同增广是否有一致的输出。典型的方法有MixMatch[1]，FixMatch[2]。但此类方法依然需要标注一定数量的样本。

发明内容

为了克服以上的技术问题，本是发明提出一种基于半监督学习的图像分类方法，包括以下步骤：

S1:获取无标签训练图像样本；

S2:基于无监督学习对无标签训练图像样本进行训练出特征提取器；

S3:特征提取器将无标签训练图像样本提取出图像样本特征；

S4:将提取出图像样本特征进行最小限定标注；

S5:用少量标注的图像样本特征训练SVM分类器，再用SVM分类器预测其他未标注的图像样本特征，用预测的结果作为这些样本的伪标签；

S6：将伪标签经噪声鲁棒学习训练成图像分类模型；

S7：基于经噪声鲁棒学习训练成图像分类模型进行图像识别分类。

具体地，在S2中，基于无标签训练图像样本，通过网络输出与无标签训练图像样本之间的差异构建损失函数再反向传播训练出特征提取器。

具体地，在S3中，特征提取器将无标签训练图像样本进行特征提取，再对特征集合进行聚类，之后，进行执行S4。

有益效果：

本发明具有以下优点：

1、标注成本极低：得益于传统分类器对训练样本数量要求并不多的特性，本方法最少仅需每类标注一个样本即可完成整体训练，标注成本极低。

2、整体训练速度快：本发明中伪标签的生成是由传统分类器预测完成的，相对于用神经网络输出来预测伪标签，传统分类器的效率更高，可以在较短时间内生成所有样本的伪标签，整体训练速度快。

3、分类准确度高：本发明使用了业内比较先进的噪声鲁棒学习技术，可以在训练集有一定噪声的情况下仍能训练输出高质量的分类模型，最终模型分类准确度高。

附图说明

图1为本发明图像分类方法的步骤示意图。

具体实施方式

以下结合实施例对本发明作进一步的阐述，所述的实施例仅为本发明一部分的实施例，这些实施例仅用于解释本发明，对本发明的范围并不构成任何限制。

见图1,本发明提供一种基于半监督学习的图像分类方法，包括以下步骤：

S1:获取无标签训练图像样本；

具体地，在S2中，基于无标签训练图像样本，通过网络输出与无标签训练图像样本之间的差异构建损失函数再反向传播训练出特征提取器；

S3:特征提取器将无标签训练图像样本提取出图像样本特征；

具体地，在S3中，特征提取器将无标签训练图像样本进行特征提取，再对特征集合进行聚类，之后，进行执行S4；

本步骤中通过特征提取器提取的不同类别的特征具有区分度。

S4:将提取出图像样本特征进行最小限定标注；

由于在S3中，特征提取器对不同类别图像所提取的特征会有较大的区分度，在特征空间里体现为不同种类的特征之间的距离较远，因此在特征空间里不同种类的特征会明显簇集到一起，但此时仍不知道哪簇特征具体属于哪个物体，因此，在本步骤中需要对提取出图像样本特征进行最小限度的标注工作。

由于在S4中，将提取出图像样本特征进行最小限定标注，由于标注样本非常少，即使用图像增广手段对数据集进行扩充，要使用深度学习技术训练网络最后的分类层也十分困难，因此，本步骤中不使用人工神经网络作为分类器，而是训练传统分类器如SVM(支持向量机)。SVM具有在训练样本较少时也能取得较好效果的特性，以每类仅标注一个样本为例，先对标注的这一样本进行图像增广，然后输入特征提取器抽取特征，利用这些有标签的特征训练SVM分类器。

S6：将伪标签经噪声鲁棒学习训练成图像分类模型；

由于SVM分类器的性能有限，它只用于生成伪标签，不作为最终分类模型，得到无标签样本的伪标签后，再使用深度学习技术对所有样本再进行一次训练，得到最终的分类模型；由于得到在S5中得到伪标签并不一定完全准确，训练集中不可避免的会存在一定量的噪声，影响网络最终的训练结果，为此，本步骤中采用噪声鲁棒学习技术，该技术中，即使数据集含有一定噪声，模型依然可以训练出比较好的结果。

本发明中组合使用了一些最新的深度学习技术和传统机器学习方法，能在仅有极小数量标注样本集的前提下完成图像分类模型的训练，具有以下有点：

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于半监督的图像分类方法，其特征在于：包括以下步骤：

S1:获取无标签训练图像样本；

S3:特征提取器将无标签训练图像样本提取出图像样本特征；

S4:将提取出图像样本特征进行最小限定标注；

S6：将伪标签经噪声鲁棒学习训练成图像分类模型；

2.根据权利要求1所述的图像分类方法，其特征在于：

3.根据权利要求1所述的人脸活体检测方法，其特征在于：