CN114842267A - 基于标签噪声域自适应的图像分类方法及系统 - Google Patents
基于标签噪声域自适应的图像分类方法及系统 Download PDFInfo
- Publication number
- CN114842267A CN114842267A CN202210567062.5A CN202210567062A CN114842267A CN 114842267 A CN114842267 A CN 114842267A CN 202210567062 A CN202210567062 A CN 202210567062A CN 114842267 A CN114842267 A CN 114842267A
- Authority
- CN
- China
- Prior art keywords
- sample
- domain
- noise
- source domain
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Abstract
本发明提供一种基于标签噪声域自适应的图像分类方法及系统,通过分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,采用阈值法划分源域数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,训练获得鲁棒噪声域适应模型;由所得鲁棒噪声域适应模型,获得目标域的图像分类结果;本发明能够降低标签噪声对源域和目标域任务对齐的影响,有效提高图像分类的准确率。
Description
技术领域
本发明涉及一种基于标签噪声域自适应的图像分类方法及系统,属于图像处理技术领域。
背景技术
域自适应(Domain Adaptation)学习作为迁移学习的一个重要分支,域自适应学习能够更具象的指出迁移的目标:找出同质数据集/任务的关联关系。域自适应学习尝试使用标签丰富的源域来帮助标签稀缺的目标域学习,在许多任务上取得了显著的性能提升。
近年来,SOTA无监督领域自适应方法大致分为三类:基于差异性度量的方法、基于分类器与域判别器博弈对抗的方法以及基于重构生成跨域特征的方法。基于差异性度量的方法,旨在度量域间分布差异,通过缩小分布差异达到源域与目标域在特征空间的对齐。基于分类其与域判别器博弈对抗的方法,通过对抗学习方式提取域不变特征,基于域不变特征训练分类器,使得经源域数据训练分类器对于目标域也有很好的鲁棒性。基于重构生成跨域特征的方法,属于样本层面的对抗方法,基于GAN(Generative Adversarial Network,生成对抗网络)生成与目标域相似度高的样本,能有效生成目标域特征。
然而,目前大多数的域自适应方法仍然假设源域中的丰富标记都是正确的,但是精确的人工标注耗时耗力,通常难以收集,因而限制了域自适应方法在图像分类的现实任务中的应用。
现实任务中,丰富的图像数据更容易从社交媒体和网络中获取,而此类图像的数据集难以满足数据都是正确标注这一条件。图像分类模型训练中会向高损失样本倾斜,即更高置信度的标签噪声样本,因此,传统的领域自适应方法在图像分类处理中不能达到很好的效果。
在图像分类处理中,由于图像数据样本中标签噪声的存在,一方面极大地影响了图像分类模型的学习,另一方面极大地干扰了类别领域特征的学习,从而导致图像分类的准确率相对较低,有待提升分类精度。
上述问题是在图像分类过程中应当予以考虑并解决的问题。
发明内容
本发明的目的是提供一种基于标签噪声域自适应的图像分类方法及系统解决现有技术中存在的域自适应方法在图像分类任务中准确率低,精度不足,有待提高的问题。
本发明的技术解决方案是:
一种基于标签噪声域自适应的图像分类方法,包括以下步骤,
S1、对源域和目标域中的图片数据进行预处理,分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;
S2、构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,直至总模型损失收敛训练获得鲁棒噪声域适应模型;
S3、由步骤S2所得鲁棒噪声域适应模型对目标域的的图像数据样本进行图像分类,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
进一步地,步骤S2中,训练获得鲁棒噪声域适应模型,具体为,
S21、初始化多层感知分类器和元网络,由特征提取器、多层感知分类器和元网络共同构建解决标签噪声场景的图像分类模型;
S22、自适应噪声检测,将源域的图像数据样本输入步骤S21所构建的图像分类模型得到概率输出,根据概率输出的结果计算样本损失,基于干净样本相比于噪声样本拥有更小损失的特性,采用仅含一层隐藏层的神经网络作为元网络,通过元学习行为根据梯度方向自适应的获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集;
S23、自适应噪声校正,对步骤S22所得干净样本集计算原型中心,并用其校正噪声样本集,获得修正后的概率向量;
S24、计算图像数据样本对源域和目标域任务对齐的贡献权重,具体为,将目标域的图像数据样本输入步骤S21所构建的图像分类模型得到伪标签向量;进而对步骤S22所得干净样本集使用基于真实标签的one-hot向量,对步骤S22所得噪声样本集使用步骤S23所得修正后的概率向量,对目标域的图像数据样本使用伪标签向量,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重;
S25、使用步骤S22所得样本权重加权源域图像样本的交叉熵损失;
S26、由步骤S24所得贡献权重,获得基于局部最大均值差异的任务对齐损失;
S27、设置动态平衡参数λ平衡S25所得的源域图像样本的交叉熵损失和S26所得的基于局部最大均值差异的任务对齐损失,计算总模型损失并进行反向传播,更新网络参数;判断总模型损失是否收敛,当总模型损失收敛时,更新流程结束并得到最终分类模型即鲁棒噪声域适应模型;当总模型损失不收敛时,返回步骤S22。
进一步地,步骤S22中,基于干净样本相比于噪声样本拥有更小损失的特性,采用仅含一层隐藏层的神经网络作为元网络,通过元学习行为根据梯度方向自适应的获得样本权重,由所得样本权重采用阈值法划分源域的数据集为噪声样本集和干净样本集,具体为,
其中,V为验证集样本的个数,且V小于源域域总的图像数据样本个数,Hvali(·,·)是计算在验证集上的交叉熵损失,验证集由正确标注的源域样本组成,和分别为验证集中的图像样本和图像标签,为网络更新中受元网络函数参数α影响的分类器参数,表示元网络函数参数α的解空间;
进一步地,步骤S23中,对步骤S22所得干净样本集计算原型中心,并用其校正噪声样本集,获得修正后的概率向量,具体为,
进一步地,步骤S24中,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,即:
进一步地,步骤S25中,使用步骤S22所得样本权重加权源域图像样本的交叉熵损失:
其中,K为类别总数,Xs代表所有源域中的图像数据样本,Xt代表所有目标域中的图像数据样本,Φ2是从特征空间到再生核希尔伯特空间的映射,和分别表示源域和目标域实例在源域和目标域任务对齐中对k类的贡献权重,和分别为源域样本和目标域样本。
进一步地,步骤S27中,设置动态平衡参数λ平衡S25所得的源域图像样本的交叉熵损失和S26所得的基于局部最大均值差异的任务对齐损失,计算总模型损失并进行反向传播,更新网络参数,具体为,
S272、图像分类模型参数由如下公式更新:
S273、样本损失的权重函数由如下公式更新:
其中,ηα为参数α的梯度下降速率,表示α的梯度,Jvali(·,·)是计算在验证集上的交叉熵损失,和分别为验证集中的图像样本和图像标签,为网络更新中受元网络函数参数α影响的分类器参数,为分类模型对样本的预测。
一种采用上述任一项所述的基于标签噪声域自适应的图像分类方法的系统,包括数据预处理模块、模型训练模块和图像分类处理模块,
数据预处理模块:对源域和目标域中的图片数据进行预处理,分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;
模型训练模块:构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,直至总模型损失收敛训练获得鲁棒噪声域适应模型;
图像分类处理模块:由所得鲁棒噪声域适应模型对目标域的的图像数据样本进行图像分类,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
本发明的有益效果是:该种基于标签噪声域自适应的图像分类方法及系统,能够降低标签噪声的影响,有效提高图像分类的准确率。该方法,针对源域的图像数据样本存在标签噪声,通过自适应噪声检测,基于元网络加权样本损失,降低噪声样本对分类器的贡献;通过自适应噪声校正修正噪声样本,使得噪声样本获得更高置信度的标签,重新投入学习,降低噪声样本对源域和目标域任务对齐的影响,使得优化得到的最终的鲁棒噪声域适应模型,能够在这种更接近真实场景的情况下具有更好的泛化性能,从而能够获得更准确的图像分类结果。
附图说明
图1是本发明实施例基于标签噪声域自适应的图像分类方法的流程示意图。
图2是实施例中鲁棒噪声域适应模型的说明示意图。
图3是实施例方法与经典卷积神经网络AlextNet、度量域适应方法DAN、对抗域适应方法DANN和ADDA的性能比较示意图
具体实施方式
下面结合附图详细说明本发明的优选实施例。
实施例
一种基于标签噪声域自适应的图像分类方法,如图1,包括以下步骤,
S1、对源域和目标域中的图片数据进行预处理,分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;
在模型训练前,将图片数据通过改变大小、随机裁剪等预处理方式统一成网络模型输入所要求的格式,同时源域的图像数据样本带有噪声标签,目标域的图像数据样本没有噪声标签。
S2、构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,直至总模型损失收敛训练获得鲁棒噪声域适应模型;如图2;
S21、初始化分类器和元网络,由特征提取器、分类器和元网络共同构建解决标签噪声场景的图像分类模型。首先使用ImageNet预训练的ResNet50作为特征提取器,预训练特征提取器,使得特征提取器具备优秀的特征提取能力,随机初始化分类器和元网络,组成所使用的分类模型。接着进行分类模型的冷启动,进行领域自适应的训练,使得模型初步具备特征提取和分类能力。
S22、自适应噪声检测,将源域的图像数据样本输入步骤S21所构建的图像分类模型得到概率输出,根据概率输出的结果计算样本损失,基于干净样本相比于噪声样本拥有更小损失的特性,采用仅含一层隐藏层的神经网络作为元网络,通过元学习行为根据梯度方向自适应的获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集;
步骤S22中,基于干净样本相比于噪声样本拥有更小损失的特性,采用仅含一层隐藏层的神经网络作为元网络,通过元学习行为根据梯度方向自适应的获得样本权重,由所得样本权重采用阈值法划分源域的数据集为噪声样本集和干净样本集,具体为,
其中,V为验证集样本的个数,且V小于源域域总的图像数据样本个数,Jvali(·,·)是计算在验证集上的交叉熵损失,验证集由正确标注的源域样本组成,和分别为验证集中的图像样本和图像标签,为网络更新中受元网络函数参数α影响的分类器参数,表示元网络函数参数α的解空间;
S23、自适应噪声校正,对步骤S22所得干净样本集计算原型中心,并用其校正噪声样本集,获得修正后的概率向量;
S24、计算图像数据样本对源域和目标域任务对齐的贡献权重,具体为,将目标域的图像数据样本输入步骤S21所构建的图像分类模型得到伪标签向量;进而对步骤S22所得干净样本集使用基于真实标签的one-hot向量,对步骤S22所得噪声样本集使用步骤S23所得修正后的概率向量,对目标域的图像数据样本使用伪标签向量,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重;即:
S25、使用步骤S22所得样本权重加权源域图像样本的交叉熵损失;以减少模型向高损失样本倾斜,即减少高置信度的噪声样本对模型训练的贡献权重;步骤S25中,使用步骤S22所得样本权重加权源域图像样本的交叉熵损失:
S26、由步骤S24所得贡献权重,获得基于局部最大均值差异的任务对齐损失,以加强源域和目标域之前相同类别的特征对齐和不同类别间的特征差异;
其中,K为类别总数,Xs代表所有源域中的图像数据样本,Xt代表所有目标域中的图像数据样本,Φ2是从特征空间到再生核希尔伯特空间的映射,和分别表示源域和目标域实例在源域和目标域任务对齐中对k类的贡献权重,和分别为源域样本和目标域样本。
S27、设置动态平衡参数λ平衡S25所得的源域图像样本的交叉熵损失和S26所得的基于局部最大均值差异的任务对齐损失,计算总模型损失并进行反向传播,更新网络参数;判断总模型损失是否收敛,当总模型损失收敛时,更新流程结束并得到最终分类模型即鲁棒噪声域适应模型;当总模型损失不收敛时,返回步骤S22。
步骤S27中,设置动态平衡参数λ平衡S25所得的源域图像样本的交叉熵损失和S26所得的基于局部最大均值差异的任务对齐损失,计算总模型损失并进行反向传播,更新网络参数,具体为,
S272、图像分类模型参数由如下公式更新:
S273、样本损失的权重函数由如下公式更新:
其中,ηα为参数α的梯度下降速率,(·)表示α的梯度,Jvali(·,·)是计算在验证集上的交叉熵损失,和分别为验证集中的图像样本和图像标签,为网络更新中受元网络函数参数α影响的分类器参数,为分类模型对样本的预测。
S3、由步骤S2所得鲁棒噪声域适应模型对目标域的的图像数据样本进行图像分类,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
该种基于标签噪声域自适应的图像分类方法,能够降低标签噪声的影响,有效提高图像分类的准确率。该方法,针对源域样本存在标签噪声,通过自适应噪声检测,基于元网络加权样本损失,降低噪声样本对分类器的贡献;通过自适应噪声校正修正噪声样本,使得噪声样本获得更高置信度的标签,重新投入学习,降低噪声样本对源域和目标域任务对齐的影响,使得优化得到的最终的鲁棒噪声域适应模型,能够在这种更接近真实场景的情况下具有更好的泛化性能,从而能够获得更准确的图像分类结果。
实施例还提供一种采用上述任一项所述的基于标签噪声域自适应的图像分类方法的系统,包括数据预处理模块、模型训练模块和图像分类处理模块,
数据预处理模块:对源域和目标域中的图片数据进行预处理,分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;
模型训练模块:构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,直至总模型损失收敛训练获得鲁棒噪声域适应模型;
图像分类处理模块:由所得鲁棒噪声域适应模型对目标域的的图像数据样本进行图像分类,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
该种基于标签噪声域自适应的图像分类系统中,如图2,模型训练模块用于训练获得鲁棒噪声域适应模型。在训练模型过程,特征提取器F对输入的图像数据样本提取特征后,将提取的特征输入至多层感知分类器G;多层感知分类器对特征提取器所提取的特征,输出概率向量给元网络M;元网络M仅用于在训练过程中,根据多层感知分类器G输出的概率向量计算得到的样本损失,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集,再由原型分类器P对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由样本权重获得源域图像样本的交叉熵损失,并由所得贡献权重获得基于局部最大均值差异的任务对齐损失,进而由任务对齐损失和交叉熵损失获得总模型损失,进行反向传播,更新网络参数,直至总模型损失收敛,训练获得鲁棒噪声域适应模型。
该种基于标签噪声域自适应的图像分类系统中,图像分类处理模块用于输出目标域的图像数据样本的图像分类结果。模型训练模块获得的鲁棒噪声域适应模型包括特征提取器和多层感知分类器,特征提取器对目标域的图像数据样本提取特征后,将提取的特征输入至多层感知分类器;多层感知分类器,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
该种基于标签噪声域自适应的图像分类方法及系统,将含有标签噪声的源域知识迁移至无标签的目标域,以用于目标域的图像数据样本的分类。通过构建端到端的网络模型,将源域的图像数据样本和目标域的图像数据样本输入到共同的特征提取器和多层感知分类器中。进而在训练生成模型时主要包含两个学习阶段:自适应标签噪声检测、自适应标签噪声矫正;首先通过自适应噪声检测识别噪声样本,基于干净样本相比于噪声样本拥有更小损失的特性,采用元网络(Meta Network)加权实例损失减少噪声样本对分类学习的贡献,同时基于阈值法划分数据集以进一步减少噪声样本对任务拉近的影响。接着通过自适应标签噪声校正修正噪声样本,使得噪声样本获得更为准确的标签,并重新投入学习。经过分类模型的迭代优化,最终将收敛后得到的最终模型进行目标图像分类,获得分类结果。
实施例的该种基于标签噪声域自适应的图像分类方法,以Digits数据集为例,进行实验仿真如下:
为模拟源域存在噪声的领域自适应图像分类任务学习场景,手动污染Digits数据集。以40%噪声标签的Digits数据集为例,由实施例方法处理如下:
S1、数据预处理将源域的图像数据样本和目标域的图像数据样本都转成大小为32*32的、三通道的图片;
S2、构建图像分类模型,对图像数据样本进行自适应噪声检测,自适应噪声校正,基于元网络加权样本损失,降低噪声样本对分类器的贡献,基于阈值法划分数据集以进一步减少噪声样本对任务拉近的影响,训练获得鲁棒噪声域适应模型;
S21、使用LeNet模型作为特征提取器F,在与本任务无关的大型数据集上,基于样本和对应的真实标签预训练特征提取器,并随即初始化多层感知分类器G权重函数w;
S22、将源域样本和噪声标签输入至特征提取器和分类器训练,迭代8次后完成模型的冷启动;计算源域样本的交叉熵损失,将样本损失输入至元网络M的权重函数得到样本权重,即噪声置信度;基于权重设立阈值2/batch_size分离噪声样本和源域样本,其中batch_size为训练中样本块的大小;
S24、计算图像数据样本对源域和目标域任务对齐的贡献权重,具体为,对于源域中的干净样本,使用其真实标签的one-hot向量,对于源域中的噪声样本,使用原型分类器校正的概率向量,对于目标域中的无标签样本,使用分类模型输出的伪标签概率向量,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重。
S25、源域/目标域样本输入分类模型中,得到样本特征,结合步骤S24样本对类别领域的贡献权重,计算局部最大均值差异;通过局部最大均值差异LMMD,计算源域与目标域间的条件分布差异,并缩小域间的分布距离,实现源域知识向目标域的迁移。
S27、整体损失计算梯度,反向传播更新网络参数,每20轮更新一次所有目标域数据的伪标签,每50轮计算一次目标域数据每一类的平均准确率,直至损失收敛。保存最优的目标域模型,作为鲁棒噪声域适应模型。
S3、由所得鲁棒噪声域适应模型,输出对目标域图像数据样本预测的标签,即目标域上的图像分类结果。
图3是实施例方法与经典卷积神经网络AlextNet、深度域适应网络DAN、对抗训练神经网络DANN和对抗判别域适应ADDA,在Digits数据集上三种迁移任务下的性能比较示意图。其中,mnist、svhn、usps表示Digits上三个不同的域,符号→表示一组迁移任务,如mnist→svhn表示从噪声数据集mnist迁移至无标签数据集svhn,AVG表示三个迁移任务的平均性能。图3中,实施例的该种基于标签噪声域自适应的图像分类方法为RoDAC,在Digits数据集下的三个迁移任务中,与传统领域自适应方法相比,实施例方法达到了更高的平均分类准确率,在三个任务的平均性能上达到了最高值。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于标签噪声域自适应的图像分类方法,其特征在于:包括以下步骤,
S1、对源域和目标域中的图片数据进行预处理,分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;
S2、构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,直至总模型损失收敛训练获得鲁棒噪声域适应模型;
S3、由步骤S2所得鲁棒噪声域适应模型对目标域的的图像数据样本进行图像分类,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
2.如权利要求1所述的基于标签噪声域自适应的图像分类方法,其特征在于:步骤S2中,训练获得鲁棒噪声域适应模型,具体为,
S21、初始化多层感知分类器和元网络,由特征提取器、多层感知分类器和元网络共同构建解决标签噪声场景的图像分类模型;
S22、自适应噪声检测,将源域的图像数据样本输入步骤S21所构建的图像分类模型得到概率输出,根据概率输出的结果计算样本损失,基于干净样本相比于噪声样本拥有更小损失的特性,采用仅含一层隐藏层的神经网络作为元网络,通过元学习行为根据梯度方向自适应的获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集;
S23、自适应噪声校正,对步骤S22所得干净样本集计算原型中心,并用其校正噪声样本集,获得修正后的概率向量;
S24、计算图像数据样本对源域和目标域任务对齐的贡献权重,具体为,将目标域的图像数据样本输入步骤S21所构建的图像分类模型得到伪标签向量;进而对步骤S22所得干净样本集使用基于真实标签的one-hot向量,对步骤S22所得噪声样本集使用步骤S23所得修正后的概率向量,对目标域的图像数据样本使用伪标签向量,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重;
S25、使用步骤S22所得样本权重加权源域图像样本的交叉熵损失;
S26、由步骤S24所得贡献权重,获得基于局部最大均值差异的任务对齐损失;
S27、设置动态平衡参数λ平衡S25所得的源域图像样本的交叉熵损失和S26所得的基于局部最大均值差异的任务对齐损失,计算总模型损失并进行反向传播,更新网络参数;判断总模型损失是否收敛,当总模型损失收敛时,更新流程结束并得到最终分类模型即鲁棒噪声域适应模型;当总模型损失不收敛时,返回步骤S22。
3.如权利要求2所述的基于标签噪声域自适应的图像分类方法,其特征在于:步骤S22中,基于干净样本相比于噪声样本拥有更小损失的特性,采用仅含一层隐藏层的神经网络作为元网络,通过元学习行为根据梯度方向自适应的获得样本权重,由所得样本权重采用阈值法划分源域的数据集为噪声样本集和干净样本集,具体为,
其中,V为验证集样本的个数,且V小于源域域总的图像数据样本个数,Jvali(·,·)是计算在验证集上的交叉熵损失,验证集由正确标注的源域样本组成,和分别为验证集中的图像样本和图像标签,为网络更新中受元网络函数参数α影响的分类器参数,表示元网络函数参数α的解空间;
9.如权利要求2-5任一项所述的基于标签噪声域自适应的图像分类方法,其特征在于:步骤S27中,设置动态平衡参数λ平衡S25所得的源域图像样本的交叉熵损失和S26所得的基于局部最大均值差异的任务对齐损失,计算总模型损失并进行反向传播,更新网络参数,具体为,
S272、图像分类模型参数由如下公式更新:
S273、样本损失的权重函数由如下公式更新:
10.一种采用权利要求1-9任一项所述的基于标签噪声域自适应的图像分类方法的系统,其特征在于,包括数据预处理模块、模型训练模块和图像分类处理模块,
数据预处理模块:对源域和目标域中的图片数据进行预处理,分别获得源域的图像数据样本构成的源域数据集、目标域的图像数据样本构成的目标域数据集,且源域的图像数据样本中包含标签噪声;
模型训练模块:构建图像分类模型,对源域的图像数据样本进行自适应噪声检测并获得样本权重,由所得样本权重采用阈值法划分源域数据集为噪声样本集和干净样本集,对干净样本集进行自适应噪声校正后,计算图像数据样本对源域和目标域任务对齐过程中对类别领域的贡献权重,由所得贡献权重与样本权重获得总模型损失,直至总模型损失收敛训练获得鲁棒噪声域适应模型;
图像分类处理模块:由所得鲁棒噪声域适应模型对目标域的的图像数据样本进行图像分类,输出对目标域的图像数据样本预测的标签,即获得目标域的图像分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210567062.5A CN114842267A (zh) | 2022-05-23 | 2022-05-23 | 基于标签噪声域自适应的图像分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210567062.5A CN114842267A (zh) | 2022-05-23 | 2022-05-23 | 基于标签噪声域自适应的图像分类方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114842267A true CN114842267A (zh) | 2022-08-02 |
Family
ID=82571980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210567062.5A Pending CN114842267A (zh) | 2022-05-23 | 2022-05-23 | 基于标签噪声域自适应的图像分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114842267A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114998602A (zh) * | 2022-08-08 | 2022-09-02 | 中国科学技术大学 | 基于低置信度样本对比损失的域适应学习方法及系统 |
CN115331065A (zh) * | 2022-10-13 | 2022-11-11 | 南京航空航天大学 | 基于解码器迭代筛选的鲁棒噪声多标签图像学习方法 |
CN115577797A (zh) * | 2022-10-18 | 2023-01-06 | 东南大学 | 一种基于本地噪声感知的联邦学习优化方法及系统 |
CN116798132A (zh) * | 2023-07-28 | 2023-09-22 | 智慧眼科技股份有限公司 | 一种闪光活体检测模型的构建方法、系统和检测方法 |
CN116863313A (zh) * | 2023-09-05 | 2023-10-10 | 湖北大学 | 基于标签增量精炼和对称评分的目标重识别方法及系统 |
CN117132841A (zh) * | 2023-10-26 | 2023-11-28 | 之江实验室 | 一种保守渐进的领域自适应图像分类方法和装置 |
CN117671673A (zh) * | 2023-11-21 | 2024-03-08 | 江南大学 | 一种基于自适应张量子空间的小样本宫颈细胞分类方法 |
-
2022
- 2022-05-23 CN CN202210567062.5A patent/CN114842267A/zh active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114998602B (zh) * | 2022-08-08 | 2022-12-30 | 中国科学技术大学 | 基于低置信度样本对比损失的域适应学习方法及系统 |
CN114998602A (zh) * | 2022-08-08 | 2022-09-02 | 中国科学技术大学 | 基于低置信度样本对比损失的域适应学习方法及系统 |
CN115331065B (zh) * | 2022-10-13 | 2023-03-24 | 南京航空航天大学 | 基于解码器迭代筛选的鲁棒噪声多标签图像学习方法 |
CN115331065A (zh) * | 2022-10-13 | 2022-11-11 | 南京航空航天大学 | 基于解码器迭代筛选的鲁棒噪声多标签图像学习方法 |
CN115577797B (zh) * | 2022-10-18 | 2023-09-26 | 东南大学 | 一种基于本地噪声感知的联邦学习优化方法及系统 |
CN115577797A (zh) * | 2022-10-18 | 2023-01-06 | 东南大学 | 一种基于本地噪声感知的联邦学习优化方法及系统 |
CN116798132A (zh) * | 2023-07-28 | 2023-09-22 | 智慧眼科技股份有限公司 | 一种闪光活体检测模型的构建方法、系统和检测方法 |
CN116798132B (zh) * | 2023-07-28 | 2024-02-27 | 智慧眼科技股份有限公司 | 一种闪光活体检测模型的构建方法、系统和检测方法 |
CN116863313A (zh) * | 2023-09-05 | 2023-10-10 | 湖北大学 | 基于标签增量精炼和对称评分的目标重识别方法及系统 |
CN116863313B (zh) * | 2023-09-05 | 2024-01-12 | 湖北大学 | 基于标签增量精炼和对称评分的目标重识别方法及系统 |
CN117132841A (zh) * | 2023-10-26 | 2023-11-28 | 之江实验室 | 一种保守渐进的领域自适应图像分类方法和装置 |
CN117132841B (zh) * | 2023-10-26 | 2024-03-29 | 之江实验室 | 一种保守渐进的领域自适应图像分类方法和装置 |
CN117671673A (zh) * | 2023-11-21 | 2024-03-08 | 江南大学 | 一种基于自适应张量子空间的小样本宫颈细胞分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114842267A (zh) | 基于标签噪声域自适应的图像分类方法及系统 | |
US11468262B2 (en) | Deep network embedding with adversarial regularization | |
CN108875807B (zh) | 一种基于多注意力多尺度的图像描述方法 | |
Liu et al. | Connecting image denoising and high-level vision tasks via deep learning | |
CN109583501B (zh) | 图片分类、分类识别模型的生成方法、装置、设备及介质 | |
CN108399428B (zh) | 一种基于迹比准则的三元组损失函数设计方法 | |
CN111753881B (zh) | 一种基于概念敏感性量化识别对抗攻击的防御方法 | |
CN112861945B (zh) | 一种多模态融合谎言检测方法 | |
CN111651762A (zh) | 一种基于卷积神经网络的pe恶意软件检测方法 | |
CN114926680B (zh) | 一种基于AlexNet网络模型的恶意软件分类方法及系统 | |
CN114004333A (zh) | 一种基于多假类生成对抗网络的过采样方法 | |
CN114998602A (zh) | 基于低置信度样本对比损失的域适应学习方法及系统 | |
CN116468938A (zh) | 一种在标签带噪数据上鲁棒的图像分类方法 | |
CN113723070A (zh) | 文本相似度模型训练方法、文本相似度检测方法及装置 | |
CN112926661A (zh) | 一种增强图像分类鲁棒性的方法 | |
CN113987236B (zh) | 基于图卷积网络的视觉检索模型的无监督训练方法和装置 | |
CN116912568A (zh) | 基于自适应类别均衡的含噪声标签图像识别方法 | |
CN115565019A (zh) | 基于深度自监督生成对抗的单通道高分辨sar图像地物分类方法 | |
CN111222583A (zh) | 一种基于对抗训练与关键路径提取的图像隐写分析方法 | |
Ma et al. | Enhancing the security of image steganography via multiple adversarial networks and channel attention modules | |
CN115862015A (zh) | 文字识别系统的训练方法及装置、文字识别方法及装置 | |
Abdollahi et al. | Image steganography based on smooth cycle-consistent adversarial learning | |
CN113705197B (zh) | 一种基于位置增强的细粒度情感分析方法 | |
US11847804B1 (en) | System and method for matching a voice sample to a facial image | |
CN117690178B (zh) | 一种基于计算机视觉的人脸图像识别方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |