CN117173494B

CN117173494B - 基于类别平衡样本选择的含噪声标签图像识别方法及系统

Info

Publication number: CN117173494B
Application number: CN202311453720.9A
Authority: CN
Inventors: 盛猛猛; 孙泽人; 姚亚洲; 陈涛
Original assignee: Nanjing Ligong Intelligent Manufacturing Technology Co ltd
Current assignee: Nanjing Ligong Intelligent Manufacturing Technology Co ltd
Priority date: 2023-11-03
Filing date: 2023-11-03
Publication date: 2024-01-23
Anticipated expiration: 2043-11-03
Also published as: CN117173494A

Abstract

本发明公开了基于类别平衡样本选择的含噪声标签图像识别方法及系统，首先采集含有噪声标签且样本类别分布不平衡的图像数据集，并进行强和弱两种数据增强变换，再输入深度神经网络，接着由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序；本发明通过采用基于类别平衡的样本选择方式能将图像数据集划分为干净子集和噪声子集，避免了头部类在所选的干净样本中占优，同时保证了尾部类样本被充分学习，还通过采用基于置信度的样本增强方法能最小化尾部类别样本被误分到干净子集所带来的负面影响，再通过使用一致性正则化方法获得了不同的数据增强和历史预测的一致性，提高了模型提取特征的性能，适合被广泛推广和使用。

Description

基于类别平衡样本选择的含噪声标签图像识别方法及系统

技术领域

本发明涉及图像识别技术领域，具体涉及基于类别平衡样本选择的含噪声标签图像识别方法及系统。

背景技术

深度神经网络在近些年的各类任务中取得了令人瞩目的成果，如图像分类、目标检测、自然语言处理等；这些成功归功于大规模和高质量的人工标注数据集。

目前，高质量人工标注的图像数据集通常需要耗费大量的人力财力，为了在有限的预算下获得大规模的标注数据普遍使用众包平台或图像搜索引擎来构建图像数据集，但这种方法不可避免地引入了与噪声标签相关的低质量样本；现实中的场景往往还包含类别不平衡现象，且大多数的数据倾向于头部类别，而其他一些类如尾部类别可能只有少数样本，类别不平衡将再次降低模型的鲁棒性，其中模型将大多数样本预测为头部类，而来自尾部类的样本将被模型拟合不足；因此，需要设计基于类别平衡样本选择的含噪声标签图像识别方法及系统。

发明内容

本发明的目的是克服现有技术的不足，为更好的有效解决图像数据集中含有的噪声标签和样本类别分布不平衡问题，提供了基于类别平衡样本选择的含噪声标签图像识别方法及系统，其通过采用基于类别平衡的样本选择方式能将图像数据集划分为干净子集和噪声子集，避免了头部类在所选的干净样本中占优，同时保证了尾部类样本被充分学习，还通过采用基于置信度的样本增强方法能最小化尾部类别样本被误分到干净子集所带来的负面影响，再通过使用一致性正则化方法获得了不同的数据增强和历史预测的一致性，提高了模型提取特征的性能。

为了达到上述目的，本发明所采用的技术方案是：

基于类别平衡样本选择的含噪声标签图像识别方法及系统，包括以下步骤，

步骤（A），采集含有噪声标签且样本类别分布不平衡的图像数据集，并进行强和弱两种数据增强变换，再输入深度神经网络；

步骤（B），由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序，再选择每个类别的前的小损失样本划入干净子集/>，其他样本划入噪声子集/>，其中/>表示选择的干净样本比例，/>表示类别数目；

步骤（C），对干净子集中的样本进行基于置信度的样本增强，并得到增强子集，再计算增强子集/>得到干净损失/>；

步骤（D），对噪声子集中的样本进行EMA标签校正，并计算得到噪声损失/>；

步骤（E），对干净子集中的样本和噪声子集/>中的样本均进行一致性正则化，并得到一致性损失/>；

步骤（F），将干净损失、噪声损失/>和一致性损失/>进行线性加权，并得到损失函数/>，再反向更新网络权值，完成含噪声标签图像的去噪作业。

前述的基于类别平衡样本选择的含噪声标签图像识别方法，步骤（A）中强数据增强变换的具体步骤为随机裁剪、随机反转、自动增强和归一化，弱数据增强变换的具体步骤为随机裁剪、随机反转和归一化。

前述的基于类别平衡样本选择的含噪声标签图像识别方法，步骤（B）具体步骤如下，

步骤（B1），对每个类别的所有样本按损失值进行排序，其中按损失值进行排序之前要对所有样本的损失进行归一化处理，如公式（1）所示，

其中，表示交叉熵损失，且/>；/>表示深度神经网络，/>表示深度神经网络的权值，/>表示图像数据集/>中的图片，/>表示图片对应的标签，/>表示一个图片对应一个标签，且/>；

步骤（B2），选择每个类别的前的小损失样本划入干净子集/>，其他样本划入噪声子集/>，而干净子集/>和噪声子集/>如公式（2）所示，

（2）

其中，表示所有类别/>取并集，/>表示第/>个类别中根据损失值选取的干净样本，

步骤（B3），若类别的总样本数目低于，则选择全部样本划入干净子集/>中，如公式（3）所示，

其中，表示图像数据集/>中所有样本属于第/>个类别的样本，/>表示中任意/>个样本，/>表示每个类别中划分到干净子集的样本数目，/>表示/>中的第个样本，/>表示第/>个样本对应的标签。

前述的基于类别平衡样本选择的含噪声标签图像识别方法，步骤（C）具体步骤如下，

步骤（C1），对干净子集中的样本进行基于置信度的样本增强，并得到增强子集，其具体是对选出的每个样本/>随机选择另一个样本/>，再对样本和样本/>进行整合，并进行样本增强得到样本/>，接着得到增强子集/>，其中样本/>为增强子集/>中的任意一个样本，且样本/>如公式（4）和公式（5）所示，

其中，表示深度神经网络预测图片属于每个类别的概率，/>表示一个服从Beta分布的数，/>表示/>中最大的一个，且/>，/>与/>服从Beta分布；

步骤（C2），计算增强子集得到干净损失/>，其中干净损失/>如公式（6）所示，

。

前述的基于类别平衡样本选择的含噪声标签图像识别方法，步骤（D）具体步骤如下，

步骤（D1），对噪声子集中的样本进行EMA标签校正，其中具体是采用指数移动平均进行标签校正，如公式（7）所示，

其中，为第/>个迭代过程的校正标签，/>是EMA系数；

步骤（D2），计算得到噪声损失，如公式（8）所示，

。

前述的基于类别平衡样本选择的含噪声标签图像识别方法，步骤（E）中一致性正则化具体是基于交叉熵损失函数，计算强增强样本和弱增强样本之间的预测一致性，而一致性损失如公式（9）和公式（10）所示，

其中，表示对样本进行弱数据增强后得到的视图，/>表示对样本进行强数据增强后得到的视图，/>表示样本/>的标签分布。

前述的基于类别平衡样本选择的含噪声标签图像识别方法，步骤（F）中损失函数如公式（11）所示，

（11）。

基于类别平衡样本选择的含噪声标签图像识别系统，包括采集模块、排序划分模块、第一处理模块、第二处理模块、第三处理模块和线性加权模块，所述采集含有噪声标签且样本类别分布不平衡的图像数据集，并进行强和弱两种数据增强变换，再输入深度神经网络；所述排序划分模块用于由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序，再选择每个类别的前/>的小损失样本划入干净子集/>，其他样本划入噪声子集/>；所述第一处理模块用于对干净子集/>中的样本进行基于置信度的样本增强，并得到增强子集/>，再计算增强子集/>得到干净损失/>；所述第二处理模块用于对噪声子集/>中的样本进行EMA标签校正，并计算得到噪声损失/>；所述第三处理模块用于对干净子集/>中的样本和噪声子集/>中的样本均进行一致性正则化，并得到一致性损失/>；所述线性加权模块用于将干净损失/>、噪声损失/>和一致性损失/>进行线性加权，并得到损失函数/>，再反向更新网络权值，完成含噪声标签图像的去噪作业。

本发明的有益效果是：

（1），本发明通过采用基于类别平衡的样本选择方式能将图像数据集划分为干净子集和噪声子集，有效地避免了头部类在所选的干净样本中占优，同时保证了尾部类样本被充分学习，从而缓解了数据类别分布不平衡导致的学习偏差。

（2），本发明通过采用基于置信度的样本增强方法能最小化尾部类别样本被误分到干净子集所带来的负面影响，再通过基于置信度对选取的干净样本进行融合，保证了干净样本能提供更多有用的语义信息，也保证了输入到模型的样本可靠性，提升了模型的稳定性，有效地利用了选择的噪声样本且避免了数据的浪费，不仅缓解了噪声样本对干净子集的影响，还增强了干净样本在使用过程中的可靠性。

（3），本发明通过使用一致性正则化方法获得了不同的数据增强和历史预测的一致性，最大限度地利用了数据并进一步提高了模型提取特征的性能。

（4），本发明能更好的缓解图像数据集中同时存在的噪声标签和类别不平衡现象，提高了深度神经网络模型的鲁棒性，能更好的应对图像识别场景。

附图说明

图1是本发明的基于类别平衡样本选择的含噪声标签图像识别方法及系统的流程图。

具体实施方式

下面将结合说明书附图，对本发明作进一步的说明。

如图1所示，本发明的基于类别平衡样本选择的含噪声标签图像识别方法及系统，包括以下步骤，

其中，强数据增强变换的具体步骤为随机裁剪、随机反转、自动增强和归一化，弱数据增强变换的具体步骤为随机裁剪、随机反转和归一化；

步骤（B），由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序，再选择每个类别的前的小损失样本划入干净子集/>，其他样本划入噪声子集/>，其中/>表示选择的干净样本比例，/>表示类别数目，具体步骤如下，

通过对所有样本的损失进行归一化处理能缓解不同类别样本之间的损失差距带来的误差。

（2）

步骤（C），对干净子集中的样本进行基于置信度的样本增强，并得到增强子集，再计算增强子集/>得到干净损失/>，具体步骤如下，

其中，对选取的两个样本进行整合时，对预测置信度较高的样本赋予较大的系数，对预测置信度较低的样本赋予较低的系数，并采用最大预测softmax概率来度量预测置信度。

步骤（C1），对干净子集中的样本进行基于置信度的样本增强，并得到增强子集，其具体是对选出的每个样本/>随机选择另一个样本/>，再对样本/>和样本/>进行整合，并进行样本增强得到样本/>，接着得到增强子集/>，其中样本/>为增强子集/>中的任意一个样本，且样本/>如公式（4）和公式（5）所示，

。

步骤（D），对噪声子集中的样本进行EMA标签校正，并计算得到噪声损失/>，具体步骤如下，

其中，为第/>个迭代过程的校正标签，/>是EMA系数；通过引入早期预测缓解误差预测的误导使得校正结果更加稳健；

步骤（D2），计算得到噪声损失，如公式（8）所示，

。

其中，一致性正则化具体是基于交叉熵损失函数，计算强增强样本和弱增强样本之间的预测一致性，而一致性损失如公式（9）和公式（10）所示，

步骤（F），将干净损失、噪声损失/>和一致性损失/>进行线性加权，并得到损失函数/>，再反向更新网络权值，完成含噪声标签图像的去噪作业，

其中，损失函数如公式（11）所示，

。

通过最小化该目标函数，干净损失可以保证在选择的干净样本上，充分拟合样本特征，保证尾部类样本被充分学习；噪声损失/>可以结合标签校正充分的利用噪声标签样本提供的语义信息；一致性损失/>通过促进样本强、弱数据增强之间的一致性，进一步增强模型提取特征的能力。本发明提出的基于类别平衡的样本选择方法可以很好的应对图像数据集，有效缓解了噪声标签和类别不平衡同时存在的负面影响。

基于类别平衡样本选择的含噪声标签图像识别系统，包括采集模块、排序划分模块、第一处理模块、第二处理模块、第三处理模块和线性加权模块，所述采集含有噪声标签且样本类别分布不平衡的图像数据集，并进行强和弱两种数据增强变换，再输入深度神经网络；所述排序划分模块用于由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序，再选择每个类别的前/>的小损失样本划入干净子集/>，其他样本划入噪声子集/>；所述第一处理模块用于对干净子集/>中的样本进行基于置信度的样本增强，并得到增强子集/>，再计算增强子集/>得到干净损失/>；所述第二处理模块用于对噪声子集/>中的样本进行EMA标签校正，并计算得到噪声损失/>；所述第三处理模块用于对干净子集/>中的样本和噪声子集/>中的样本均进行一致性正则化，并得到一致性损失/>；所述线性加权模块用于将干净损失/>、噪声损失/>和一致性损失进行线性加权，并得到损失函数/>，再反向更新网络权值，完成含噪声标签图像的去噪作业。

为更好的阐述本发明的使用效果，下面介绍本发明的一个具体实施例：

首先在类别分布不均衡的人工合成噪声训练数据集CIFAR100上对本发明的性能进行实验验证，数据集中噪声数据含量为40%，并且图片数目最多的和最少的类别图片数目比值为20。传统基线方法仅仅使用交叉熵损失在这个训练集训练模型，并且在相应的干净且分布平衡的测试集上仅仅取得了32.86%的准确率，而本发明取得了46.95%的准确率，实现了14.09%的测试集准确率提升。

并且进一步对本发明的每个组成部分进行实验，使用基于类别平衡的样本选择、基于置信度的样本增强、一致性正则化分别实现35.74%、43.28%、46.95%的测试准确率，可以看到本发明的每个模块都有相应的性能提升，证明了本发明的有效。

综上所述，本发明对于类别不平衡的含噪声标签图像数据集，首先在输入网络后根据类别平衡的样本选择方法划分为干净子集/>和噪声子集/>，接着对于/>中的样本进行基于置信度的样本增强，再对于/>和/>中的所有样本进行一致性正则化，本发明采用基于类别平衡的样本选择，保证相应的尾部类干净样本被划分到干净子集，使得尾部类样本得到充分学习，随后对于样本选择的干净子集，为了进一步缓解极其少量由于尾部类噪声样本的影响，本发明提出使用基于置信度的样本增强，保证干净样本提供更多有用的语义信息，然后为了避免数据的浪费，本发明进一步使用一致性正则化，通过促进训练样本强弱数据增强的预测一致性，提升了模型提取特征的能力。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于类别平衡样本选择的含噪声标签图像识别方法，其特征在于：包括以下步骤，

步骤(A)，采集含有噪声标签且样本类别分布不平衡的图像数据集D_train，并进行强和弱两种数据增强变换，再输入深度神经网络，其中强数据增强变换的具体步骤为随机裁剪、随机反转、自动增强和归一化，弱数据增强变换的具体步骤为随机裁剪、随机反转和归一化；

步骤(B)，由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序，再选择每个类别的前的小损失样本划入干净子集D_c，其他样本划入噪声子集D_n，其中ρ表示选择的干净样本比例，C表示类别数目，具体步骤如下，

步骤(B1)，对每个类别的所有样本按损失值进行排序，其中按损失值进行排序之前要对所有样本的损失进行归一化处理，如公式(1)所示，

其中，l_ce表示交叉熵损失，且表示深度神经网络，θ表示深度神经网络的权值，x表示图像数据集D_train中的图片，y表示图片对应的标签，(x，y)表示一个图片对应一个标签，且(x，y)∈D_train；

步骤(B2)，选择每个类别的前的小损失样本划入干净子集D_c，其他样本划入噪声子集D_n，而干净子集D_c和噪声子集D_n如公式(2)所示，

其中，U_{i∈{1,…,C}}表示所有类别i∈{1,…,C}取并集，表示第i个类别中根据损失值选取的干净样本，

步骤(B3)，若类别的总样本数目低于则选择全部样本划入干净子集D_c中，如公式(3)所示，

其中，表示图像数据集D_train中所有样本属于第i个类别的样本，/>表示/>中任意δ个样本，δ表示每个类别中划分到干净子集的样本数目，x_j表示/>中的第j个样本，y_j表示第j个样本对应的标签；

步骤(C)，对干净子集D_c中的样本进行基于置信度的样本增强，并得到增强子集再计算增强子集/>得到干净损失/>

步骤(D)，对噪声子集D_n中的样本进行EMA标签校正，并计算得到噪声损失

步骤(E)，对干净子集D_c中的样本和噪声子集D_n中的样本均进行一致性正则化，并得到一致性损失

步骤(F)，将干净损失噪声损失/>和一致性损失/>进行线性加权，并得到损失函数/>再反向更新网络权值，完成含噪声标签图像的去噪作业。

2.根据权利要求1所述的基于类别平衡样本选择的含噪声标签图像识别方法，其特征在于：步骤(C)具体步骤如下，

步骤(C1)，对干净子集D_c中的样本进行基于置信度的样本增强，并得到增强子集其具体是对选出的每个样本(x_i,y_i)∈D_c随机选择另一个样本(x_j,y_j)∈D_c，再对样本(x_i,y_i)∈D_c和样本(x_j,y_j)∈D_c进行整合，并进行样本增强得到样本/>接着得到增强子集其中样本/>为增强子集/>中的任意一个样本，且样本/>如公式(4)和公式(5)所示，

其中，p表示深度神经网络预测图片属于每个类别的概率，l′表示一个服从Beta分布的数，l表示(l′,1-l′)中最大的一个，且l＝max(l′,1-l′)，l与l′服从Beta分布；

步骤(C2)，计算增强子集得到干净损失/>其中干净损失/>如公式(6)所示，

3.根据权利要求2所述的基于类别平衡样本选择的含噪声标签图像识别方法，其特征在于：步骤(D)具体步骤如下，

步骤(D1)，对噪声子集D_n中的样本进行EMA标签校正，其中具体是采用指数移动平均进行标签校正，如公式(7)所示，

其中，为第t个迭代过程的校正标签，α是EMA系数；

步骤(D2)，计算得到噪声损失如公式(8)所示，

4.根据权利要求3所述的基于类别平衡样本选择的含噪声标签图像识别方法，其特征在于：步骤(E)中一致性正则化具体是基于交叉熵损失函数，计算强增强样本和弱增强样本之间的预测一致性，而一致性损失如公式(9)和公式(10)所示，

其中，A_W(x_i)表示对样本进行弱数据增强后得到的视图，A_S(x_i)表示对样本进行强数据增强后得到的视图，q_i表示样本x_i的标签分布。

5.根据权利要求4所述的基于类别平衡样本选择的含噪声标签图像识别方法，其特征在于：步骤(F)中损失函数如公式(11)所示，

6.基于类别平衡样本选择的含噪声标签图像识别系统，所述识别系统运行过程采用基于权利要求1-5任一项所述的识别方法，其特征在于：包括采集模块、排序划分模块、第一处理模块、第二处理模块、第三处理模块和线性加权模块，所述采集含有噪声标签且样本类别分布不平衡的图像数据集D_train，并进行强和弱两种数据增强变换，再输入深度神经网络；

所述排序划分模块用于由深度神经网络进行特征提取分类，并对每个类别的所有样本按损失值进行排序，再选择每个类别的前的小损失样本划入干净子集D_c，其他样本划入噪声子集D_n；

所述第一处理模块用于对干净子集D_c中的样本进行基于置信度的样本增强，并得到增强子集再计算增强子集/>得到干净损失/>

所述第二处理模块用于对噪声子集D_n中的样本进行EMA标签校正，并计算得到噪声损失

所述第三处理模块用于对干净子集D_c中的样本和噪声子集D_n中的样本均进行一致性正则化，并得到一致性损失

所述线性加权模块用于将干净损失噪声损失/>和一致性损失/>进行线性加权，并得到损失函数/>再反向更新网络权值，完成含噪声标签图像的去噪作业。