CN117173494B - 基于类别平衡样本选择的含噪声标签图像识别方法及系统 - Google Patents
基于类别平衡样本选择的含噪声标签图像识别方法及系统 Download PDFInfo
- Publication number
- CN117173494B CN117173494B CN202311453720.9A CN202311453720A CN117173494B CN 117173494 B CN117173494 B CN 117173494B CN 202311453720 A CN202311453720 A CN 202311453720A CN 117173494 B CN117173494 B CN 117173494B
- Authority
- CN
- China
- Prior art keywords
- sample
- subset
- samples
- noise
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 19
- 230000009466 transformation Effects 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 14
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了基于类别平衡样本选择的含噪声标签图像识别方法及系统,首先采集含有噪声标签且样本类别分布不平衡的图像数据集,并进行强和弱两种数据增强变换,再输入深度神经网络,接着由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序;本发明通过采用基于类别平衡的样本选择方式能将图像数据集划分为干净子集和噪声子集,避免了头部类在所选的干净样本中占优,同时保证了尾部类样本被充分学习,还通过采用基于置信度的样本增强方法能最小化尾部类别样本被误分到干净子集所带来的负面影响,再通过使用一致性正则化方法获得了不同的数据增强和历史预测的一致性,提高了模型提取特征的性能,适合被广泛推广和使用。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及基于类别平衡样本选择的含噪声标签图像识别方法及系统。
背景技术
深度神经网络在近些年的各类任务中取得了令人瞩目的成果,如图像分类、目标检测、自然语言处理等;这些成功归功于大规模和高质量的人工标注数据集。
目前,高质量人工标注的图像数据集通常需要耗费大量的人力财力,为了在有限的预算下获得大规模的标注数据普遍使用众包平台或图像搜索引擎来构建图像数据集,但这种方法不可避免地引入了与噪声标签相关的低质量样本;现实中的场景往往还包含类别不平衡现象,且大多数的数据倾向于头部类别,而其他一些类如尾部类别可能只有少数样本,类别不平衡将再次降低模型的鲁棒性,其中模型将大多数样本预测为头部类,而来自尾部类的样本将被模型拟合不足;因此,需要设计基于类别平衡样本选择的含噪声标签图像识别方法及系统。
发明内容
本发明的目的是克服现有技术的不足,为更好的有效解决图像数据集中含有的噪声标签和样本类别分布不平衡问题,提供了基于类别平衡样本选择的含噪声标签图像识别方法及系统,其通过采用基于类别平衡的样本选择方式能将图像数据集划分为干净子集和噪声子集,避免了头部类在所选的干净样本中占优,同时保证了尾部类样本被充分学习,还通过采用基于置信度的样本增强方法能最小化尾部类别样本被误分到干净子集所带来的负面影响,再通过使用一致性正则化方法获得了不同的数据增强和历史预测的一致性,提高了模型提取特征的性能。
为了达到上述目的,本发明所采用的技术方案是:
基于类别平衡样本选择的含噪声标签图像识别方法及系统,包括以下步骤,
步骤(A),采集含有噪声标签且样本类别分布不平衡的图像数据集,并进行强和弱两种数据增强变换,再输入深度神经网络;
步骤(B),由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序,再选择每个类别的前的小损失样本划入干净子集/>,其他样本划入噪声子集/>,其中/>表示选择的干净样本比例,/>表示类别数目;
步骤(C),对干净子集中的样本进行基于置信度的样本增强,并得到增强子集,再计算增强子集/>得到干净损失/>;
步骤(D),对噪声子集中的样本进行EMA标签校正,并计算得到噪声损失/>;
步骤(E),对干净子集中的样本和噪声子集/>中的样本均进行一致性正则化,并得到一致性损失/>;
步骤(F),将干净损失、噪声损失/>和一致性损失/>进行线性加权,并得到损失函数/>,再反向更新网络权值,完成含噪声标签图像的去噪作业。
前述的基于类别平衡样本选择的含噪声标签图像识别方法,步骤(A)中强数据增强变换的具体步骤为随机裁剪、随机反转、自动增强和归一化,弱数据增强变换的具体步骤为随机裁剪、随机反转和归一化。
前述的基于类别平衡样本选择的含噪声标签图像识别方法,步骤(B)具体步骤如下,
步骤(B1),对每个类别的所有样本按损失值进行排序,其中按损失值进行排序之前要对所有样本的损失进行归一化处理,如公式(1)所示,
其中,表示交叉熵损失,且/>;/>表示深度神经网络,/>表示深度神经网络的权值,/>表示图像数据集/>中的图片,/>表示图片对应的标签,/>表示一个图片对应一个标签,且/>;
步骤(B2),选择每个类别的前的小损失样本划入干净子集/>,其他样本划入噪声子集/>,而干净子集/>和噪声子集/>如公式(2)所示,
(2)
其中,表示所有类别/>取并集,/>表示第/>个类别中根据损失值选取的干净样本,
步骤(B3),若类别的总样本数目低于,则选择全部样本划入干净子集/>中,如公式(3)所示,
其中,表示图像数据集/>中所有样本属于第/>个类别的样本,/>表示中任意/>个样本,/>表示每个类别中划分到干净子集的样本数目,/>表示/>中的第个样本,/>表示第/>个样本对应的标签。
前述的基于类别平衡样本选择的含噪声标签图像识别方法,步骤(C)具体步骤如下,
步骤(C1),对干净子集中的样本进行基于置信度的样本增强,并得到增强子集,其具体是对选出的每个样本/>随机选择另一个样本/>,再对样本和样本/>进行整合,并进行样本增强得到样本/>,接着得到增强子集/>,其中样本/>为增强子集/>中的任意一个样本,且样本/>如公式(4)和公式(5)所示,
其中,表示深度神经网络预测图片属于每个类别的概率,/>表示一个服从Beta分布的数,/>表示/>中最大的一个,且/>,/>与/>服从Beta分布;
步骤(C2),计算增强子集得到干净损失/>,其中干净损失/>如公式(6)所示,
。
前述的基于类别平衡样本选择的含噪声标签图像识别方法,步骤(D)具体步骤如下,
步骤(D1),对噪声子集中的样本进行EMA标签校正,其中具体是采用指数移动平均进行标签校正,如公式(7)所示,
其中,为第/>个迭代过程的校正标签,/>是EMA系数;
步骤(D2),计算得到噪声损失,如公式(8)所示,
。
前述的基于类别平衡样本选择的含噪声标签图像识别方法,步骤(E)中一致性正则化具体是基于交叉熵损失函数,计算强增强样本和弱增强样本之间的预测一致性,而一致性损失如公式(9)和公式(10)所示,
其中,表示对样本进行弱数据增强后得到的视图,/>表示对样本进行强数据增强后得到的视图,/>表示样本/>的标签分布。
前述的基于类别平衡样本选择的含噪声标签图像识别方法,步骤(F)中损失函数如公式(11)所示,
(11)。
基于类别平衡样本选择的含噪声标签图像识别系统,包括采集模块、排序划分模块、第一处理模块、第二处理模块、第三处理模块和线性加权模块,所述采集含有噪声标签且样本类别分布不平衡的图像数据集,并进行强和弱两种数据增强变换,再输入深度神经网络;所述排序划分模块用于由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序,再选择每个类别的前/>的小损失样本划入干净子集/>,其他样本划入噪声子集/>; 所述第一处理模块用于对干净子集/>中的样本进行基于置信度的样本增强,并得到增强子集/>,再计算增强子集/>得到干净损失/>;所述第二处理模块用于对噪声子集/>中的样本进行EMA标签校正,并计算得到噪声损失/>;所述第三处理模块用于对干净子集/>中的样本和噪声子集/>中的样本均进行一致性正则化,并得到一致性损失/>;所述线性加权模块用于将干净损失/>、噪声损失/>和一致性损失/>进行线性加权,并得到损失函数/>,再反向更新网络权值,完成含噪声标签图像的去噪作业。
本发明的有益效果是:
(1),本发明通过采用基于类别平衡的样本选择方式能将图像数据集划分为干净子集和噪声子集,有效地避免了头部类在所选的干净样本中占优,同时保证了尾部类样本被充分学习,从而缓解了数据类别分布不平衡导致的学习偏差。
(2),本发明通过采用基于置信度的样本增强方法能最小化尾部类别样本被误分到干净子集所带来的负面影响,再通过基于置信度对选取的干净样本进行融合,保证了干净样本能提供更多有用的语义信息,也保证了输入到模型的样本可靠性,提升了模型的稳定性,有效地利用了选择的噪声样本且避免了数据的浪费,不仅缓解了噪声样本对干净子集的影响,还增强了干净样本在使用过程中的可靠性。
(3),本发明通过使用一致性正则化方法获得了不同的数据增强和历史预测的一致性,最大限度地利用了数据并进一步提高了模型提取特征的性能。
(4),本发明能更好的缓解图像数据集中同时存在的噪声标签和类别不平衡现象,提高了深度神经网络模型的鲁棒性,能更好的应对图像识别场景。
附图说明
图1是本发明的基于类别平衡样本选择的含噪声标签图像识别方法及系统的流程图。
具体实施方式
下面将结合说明书附图,对本发明作进一步的说明。
如图1所示,本发明的基于类别平衡样本选择的含噪声标签图像识别方法及系统,包括以下步骤,
步骤(A),采集含有噪声标签且样本类别分布不平衡的图像数据集,并进行强和弱两种数据增强变换,再输入深度神经网络;
其中,强数据增强变换的具体步骤为随机裁剪、随机反转、自动增强和归一化,弱数据增强变换的具体步骤为随机裁剪、随机反转和归一化;
步骤(B),由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序,再选择每个类别的前的小损失样本划入干净子集/>,其他样本划入噪声子集/>,其中/>表示选择的干净样本比例,/>表示类别数目,具体步骤如下,
步骤(B1),对每个类别的所有样本按损失值进行排序,其中按损失值进行排序之前要对所有样本的损失进行归一化处理,如公式(1)所示,
其中,表示交叉熵损失,且/>;/>表示深度神经网络,/>表示深度神经网络的权值,/>表示图像数据集/>中的图片,/>表示图片对应的标签,/>表示一个图片对应一个标签,且/>;
通过对所有样本的损失进行归一化处理能缓解不同类别样本之间的损失差距带来的误差。
步骤(B2),选择每个类别的前的小损失样本划入干净子集/>,其他样本划入噪声子集/>,而干净子集/>和噪声子集/>如公式(2)所示,
(2)
其中,表示所有类别/>取并集,/>表示第/>个类别中根据损失值选取的干净样本,
步骤(B3),若类别的总样本数目低于,则选择全部样本划入干净子集/>中,如公式(3)所示,
其中,表示图像数据集/>中所有样本属于第/>个类别的样本,/>表示中任意/>个样本,/>表示每个类别中划分到干净子集的样本数目,/>表示/>中的第个样本,/>表示第/>个样本对应的标签。
步骤(C),对干净子集中的样本进行基于置信度的样本增强,并得到增强子集,再计算增强子集/>得到干净损失/>,具体步骤如下,
其中,对选取的两个样本进行整合时,对预测置信度较高的样本赋予较大的系数,对预测置信度较低的样本赋予较低的系数,并采用最大预测softmax概率来度量预测置信度。
步骤(C1),对干净子集中的样本进行基于置信度的样本增强,并得到增强子集,其具体是对选出的每个样本/>随机选择另一个样本/>,再对样本/>和样本/>进行整合,并进行样本增强得到样本/>,接着得到增强子集/>,其中样本/>为增强子集/>中的任意一个样本,且样本/>如公式(4)和公式(5)所示,
其中,表示深度神经网络预测图片属于每个类别的概率,/>表示一个服从Beta分布的数,/>表示/>中最大的一个,且/>,/>与/>服从Beta分布;
步骤(C2),计算增强子集得到干净损失/>,其中干净损失/>如公式(6)所示,
。
步骤(D),对噪声子集中的样本进行EMA标签校正,并计算得到噪声损失/>,具体步骤如下,
步骤(D1),对噪声子集中的样本进行EMA标签校正,其中具体是采用指数移动平均进行标签校正,如公式(7)所示,
其中,为第/>个迭代过程的校正标签,/>是EMA系数;通过引入早期预测缓解误差预测的误导使得校正结果更加稳健;
步骤(D2),计算得到噪声损失,如公式(8)所示,
。
步骤(E),对干净子集中的样本和噪声子集/>中的样本均进行一致性正则化,并得到一致性损失/>;
其中,一致性正则化具体是基于交叉熵损失函数,计算强增强样本和弱增强样本之间的预测一致性,而一致性损失如公式(9)和公式(10)所示,
其中,表示对样本进行弱数据增强后得到的视图,/>表示对样本进行强数据增强后得到的视图,/>表示样本/>的标签分布。
步骤(F),将干净损失、噪声损失/>和一致性损失/>进行线性加权,并得到损失函数/>,再反向更新网络权值,完成含噪声标签图像的去噪作业,
其中,损失函数如公式(11)所示,
。
通过最小化该目标函数,干净损失可以保证在选择的干净样本上,充分拟合样本特征,保证尾部类样本被充分学习;噪声损失/>可以结合标签校正充分的利用噪声标签样本提供的语义信息;一致性损失/>通过促进样本强、弱数据增强之间的一致性,进一步增强模型提取特征的能力。本发明提出的基于类别平衡的样本选择方法可以很好的应对图像数据集,有效缓解了噪声标签和类别不平衡同时存在的负面影响。
基于类别平衡样本选择的含噪声标签图像识别系统,包括采集模块、排序划分模块、第一处理模块、第二处理模块、第三处理模块和线性加权模块,所述采集含有噪声标签且样本类别分布不平衡的图像数据集,并进行强和弱两种数据增强变换,再输入深度神经网络;所述排序划分模块用于由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序,再选择每个类别的前/>的小损失样本划入干净子集/>,其他样本划入噪声子集/>; 所述第一处理模块用于对干净子集/>中的样本进行基于置信度的样本增强,并得到增强子集/>,再计算增强子集/>得到干净损失/>;所述第二处理模块用于对噪声子集/>中的样本进行EMA标签校正,并计算得到噪声损失/>;所述第三处理模块用于对干净子集/>中的样本和噪声子集/>中的样本均进行一致性正则化,并得到一致性损失/>;所述线性加权模块用于将干净损失/>、噪声损失/>和一致性损失进行线性加权,并得到损失函数/>,再反向更新网络权值,完成含噪声标签图像的去噪作业。
为更好的阐述本发明的使用效果,下面介绍本发明的一个具体实施例:
首先在类别分布不均衡的人工合成噪声训练数据集CIFAR100上对本发明的性能进行实验验证,数据集中噪声数据含量为40%,并且图片数目最多的和最少的类别图片数目比值为20。传统基线方法仅仅使用交叉熵损失在这个训练集训练模型,并且在相应的干净且分布平衡的测试集上仅仅取得了32.86%的准确率,而本发明取得了46.95%的准确率,实现了14.09%的测试集准确率提升。
并且进一步对本发明的每个组成部分进行实验,使用基于类别平衡的样本选择、基于置信度的样本增强、一致性正则化分别实现35.74%、43.28%、46.95%的测试准确率,可以看到本发明的每个模块都有相应的性能提升,证明了本发明的有效。
综上所述,本发明对于类别不平衡的含噪声标签图像数据集,首先在输入网络后根据类别平衡的样本选择方法划分为干净子集/>和噪声子集/>,接着对于/>中的样本进行基于置信度的样本增强,再对于/>和/>中的所有样本进行一致性正则化,本发明采用基于类别平衡的样本选择,保证相应的尾部类干净样本被划分到干净子集,使得尾部类样本得到充分学习,随后对于样本选择的干净子集,为了进一步缓解极其少量由于尾部类噪声样本的影响,本发明提出使用基于置信度的样本增强,保证干净样本提供更多有用的语义信息,然后为了避免数据的浪费,本发明进一步使用一致性正则化,通过促进训练样本强弱数据增强的预测一致性,提升了模型提取特征的能力。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.基于类别平衡样本选择的含噪声标签图像识别方法,其特征在于:包括以下步骤,
步骤(A),采集含有噪声标签且样本类别分布不平衡的图像数据集Dtrain,并进行强和弱两种数据增强变换,再输入深度神经网络,其中强数据增强变换的具体步骤为随机裁剪、随机反转、自动增强和归一化,弱数据增强变换的具体步骤为随机裁剪、随机反转和归一化;
步骤(B),由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序,再选择每个类别的前的小损失样本划入干净子集Dc,其他样本划入噪声子集Dn,其中ρ表示选择的干净样本比例,C表示类别数目,具体步骤如下,
步骤(B1),对每个类别的所有样本按损失值进行排序,其中按损失值进行排序之前要对所有样本的损失进行归一化处理,如公式(1)所示,
其中,lce表示交叉熵损失,且 表示深度神经网络,θ表示深度神经网络的权值,x表示图像数据集Dtrain中的图片,y表示图片对应的标签,(x,y)表示一个图片对应一个标签,且(x,y)∈Dtrain;
步骤(B2),选择每个类别的前的小损失样本划入干净子集Dc,其他样本划入噪声子集Dn,而干净子集Dc和噪声子集Dn如公式(2)所示,
其中,Ui∈{1,…,C}表示所有类别i∈{1,…,C}取并集,表示第i个类别中根据损失值选取的干净样本,
步骤(B3),若类别的总样本数目低于则选择全部样本划入干净子集Dc中,如公式(3)所示,
其中,表示图像数据集Dtrain中所有样本属于第i个类别的样本,/>表示/>中任意δ个样本,δ表示每个类别中划分到干净子集的样本数目,xj表示/>中的第j个样本,yj表示第j个样本对应的标签;
步骤(C),对干净子集Dc中的样本进行基于置信度的样本增强,并得到增强子集再计算增强子集/>得到干净损失/>
步骤(D),对噪声子集Dn中的样本进行EMA标签校正,并计算得到噪声损失
步骤(E),对干净子集Dc中的样本和噪声子集Dn中的样本均进行一致性正则化,并得到一致性损失
步骤(F),将干净损失噪声损失/>和一致性损失/>进行线性加权,并得到损失函数/>再反向更新网络权值,完成含噪声标签图像的去噪作业。
2.根据权利要求1所述的基于类别平衡样本选择的含噪声标签图像识别方法,其特征在于:步骤(C)具体步骤如下,
步骤(C1),对干净子集Dc中的样本进行基于置信度的样本增强,并得到增强子集其具体是对选出的每个样本(xi,yi)∈Dc随机选择另一个样本(xj,yj)∈Dc,再对样本(xi,yi)∈Dc和样本(xj,yj)∈Dc进行整合,并进行样本增强得到样本/>接着得到增强子集其中样本/>为增强子集/>中的任意一个样本,且样本/>如公式(4)和公式(5)所示,
其中,p表示深度神经网络预测图片属于每个类别的概率,l′表示一个服从Beta分布的数,l表示(l′,1-l′)中最大的一个,且l=max(l′,1-l′),l与l′服从Beta分布;
步骤(C2),计算增强子集得到干净损失/>其中干净损失/>如公式(6)所示,
3.根据权利要求2所述的基于类别平衡样本选择的含噪声标签图像识别方法,其特征在于:步骤(D)具体步骤如下,
步骤(D1),对噪声子集Dn中的样本进行EMA标签校正,其中具体是采用指数移动平均进行标签校正,如公式(7)所示,
其中,为第t个迭代过程的校正标签,α是EMA系数;
步骤(D2),计算得到噪声损失如公式(8)所示,
4.根据权利要求3所述的基于类别平衡样本选择的含噪声标签图像识别方法,其特征在于:步骤(E)中一致性正则化具体是基于交叉熵损失函数,计算强增强样本和弱增强样本之间的预测一致性,而一致性损失如公式(9)和公式(10)所示,
其中,AW(xi)表示对样本进行弱数据增强后得到的视图,AS(xi)表示对样本进行强数据增强后得到的视图,qi表示样本xi的标签分布。
5.根据权利要求4所述的基于类别平衡样本选择的含噪声标签图像识别方法,其特征在于:步骤(F)中损失函数如公式(11)所示,
6.基于类别平衡样本选择的含噪声标签图像识别系统,所述识别系统运行过程采用基于权利要求1-5任一项所述的识别方法,其特征在于:包括采集模块、排序划分模块、第一处理模块、第二处理模块、第三处理模块和线性加权模块,所述采集含有噪声标签且样本类别分布不平衡的图像数据集Dtrain,并进行强和弱两种数据增强变换,再输入深度神经网络;
所述排序划分模块用于由深度神经网络进行特征提取分类,并对每个类别的所有样本按损失值进行排序,再选择每个类别的前的小损失样本划入干净子集Dc,其他样本划入噪声子集Dn;
所述第一处理模块用于对干净子集Dc中的样本进行基于置信度的样本增强,并得到增强子集再计算增强子集/>得到干净损失/>
所述第二处理模块用于对噪声子集Dn中的样本进行EMA标签校正,并计算得到噪声损失
所述第三处理模块用于对干净子集Dc中的样本和噪声子集Dn中的样本均进行一致性正则化,并得到一致性损失
所述线性加权模块用于将干净损失噪声损失/>和一致性损失/>进行线性加权,并得到损失函数/>再反向更新网络权值,完成含噪声标签图像的去噪作业。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311453720.9A CN117173494B (zh) | 2023-11-03 | 2023-11-03 | 基于类别平衡样本选择的含噪声标签图像识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311453720.9A CN117173494B (zh) | 2023-11-03 | 2023-11-03 | 基于类别平衡样本选择的含噪声标签图像识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117173494A CN117173494A (zh) | 2023-12-05 |
CN117173494B true CN117173494B (zh) | 2024-01-23 |
Family
ID=88947326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311453720.9A Active CN117173494B (zh) | 2023-11-03 | 2023-11-03 | 基于类别平衡样本选择的含噪声标签图像识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117173494B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115618236A (zh) * | 2022-11-16 | 2023-01-17 | 南京码极客科技有限公司 | 一种自监督的分布内、外噪声识别算法 |
CN116192500A (zh) * | 2023-02-22 | 2023-05-30 | 电子科技大学 | 一种对抗标签噪声的恶意流量检测装置及方法 |
CN116912568A (zh) * | 2023-07-10 | 2023-10-20 | 南京理工大学 | 基于自适应类别均衡的含噪声标签图像识别方法 |
-
2023
- 2023-11-03 CN CN202311453720.9A patent/CN117173494B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115618236A (zh) * | 2022-11-16 | 2023-01-17 | 南京码极客科技有限公司 | 一种自监督的分布内、外噪声识别算法 |
CN116192500A (zh) * | 2023-02-22 | 2023-05-30 | 电子科技大学 | 一种对抗标签噪声的恶意流量检测装置及方法 |
CN116912568A (zh) * | 2023-07-10 | 2023-10-20 | 南京理工大学 | 基于自适应类别均衡的含噪声标签图像识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117173494A (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126386B (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
CN108073568B (zh) | 关键词提取方法和装置 | |
CN109492026B (zh) | 一种基于改进的主动学习技术的电信欺诈分类检测方法 | |
CN107608999A (zh) | 一种适用于自动问答系统的问句分类方法 | |
CN108694346B (zh) | 一种基于两级cnn的船舶辐射噪声信号识别方法 | |
CN111680706A (zh) | 一种基于编码和解码结构的双通道输出轮廓检测方法 | |
CN112347244A (zh) | 基于混合特征分析的涉黄、涉赌网站检测方法 | |
CN108550054B (zh) | 一种内容质量评估方法、装置、设备和介质 | |
CN111046858B (zh) | 一种基于图像的动物物种细分类方法、系统及介质 | |
CN110472652A (zh) | 基于语义引导的少量样本分类方法 | |
CN115953666B (zh) | 一种基于改进Mask-RCNN的变电站现场进度识别方法 | |
CN114998603A (zh) | 一种基于深度多尺度特征因子融合的水下目标检测方法 | |
CN114863189B (zh) | 一种基于大数据的图像智能识别方法 | |
CN115309860A (zh) | 基于伪孪生网络的虚假新闻检测方法 | |
CN117173494B (zh) | 基于类别平衡样本选择的含噪声标签图像识别方法及系统 | |
CN116935411A (zh) | 一种基于字符分解和重构的部首级古文字识别方法 | |
CN109871889B (zh) | 突发事件下大众心理评估方法 | |
CN114912026B (zh) | 一种网络舆情监测分析处理方法、设备及计算机存储介质 | |
CN115797804A (zh) | 一种基于不平衡时序航空飞行数据的异常检测方法 | |
CN115098681A (zh) | 一种基于有监督对比学习的开放服务意图检测方法 | |
CN115080778A (zh) | 一种基于噪声数据清理的跨模态三维模型检索方法 | |
CN112784774A (zh) | 一种基于数据增强的小样本高光谱分类方法 | |
CN113360633B (zh) | 一种基于深度域适应的跨域测试文档分类方法 | |
CN117421244B (zh) | 多源跨项目软件缺陷预测方法、装置及存储介质 | |
CN111723223B (zh) | 一种基于主体推断的多标签图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |