CN117456312B - 一种面向无监督图像检索的模拟抗污伪标签增强方法 - Google Patents
一种面向无监督图像检索的模拟抗污伪标签增强方法 Download PDFInfo
- Publication number
- CN117456312B CN117456312B CN202311779473.1A CN202311779473A CN117456312B CN 117456312 B CN117456312 B CN 117456312B CN 202311779473 A CN202311779473 A CN 202311779473A CN 117456312 B CN117456312 B CN 117456312B
- Authority
- CN
- China
- Prior art keywords
- pollution
- image
- random
- posterior
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000003373 anti-fouling effect Effects 0.000 title claims abstract description 12
- 238000004088 simulation Methods 0.000 title abstract description 6
- 239000013598 vector Substances 0.000 claims abstract description 64
- 238000011176 pooling Methods 0.000 claims abstract description 13
- 238000011109 contamination Methods 0.000 claims description 30
- 238000013135 deep learning Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7753—Incorporation of unlabelled data, e.g. multiple instance learning [MIL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种面向无监督图像检索的模拟抗污伪标签增强方法,涉及计算机视觉领域,包括:利用无监督图像检索模型提取图像数据集中所有图像特征,并通过聚类算法为每张图像分配伪标签;采用伯努利随机分布对图像特征向量随机置零以模拟特征污染,获得随机污染特征向量;基于随机污染特征向量计算随机污染后验类别概率,并进行后验类别概率最大池化以获得抗污染后验类别信息;归一化抗污染后验类别信息获得抗污染后验类别概率,将抗污染后验类别概率与聚类产生的伪标签线性组合,以实现伪标签增强,从而改善无监督图像检索准确性,可广泛应用于图像搜索引擎。
Description
技术领域
本发明涉及计算机视觉领域,特别涉及一种面向无监督图像检索的模拟抗污伪标签增强方法。
背景技术
无监督图像检索通过聚类算法产生图像类别伪标签进行模型训练,不依赖浩繁的人工图像类别标签标记工作,具有广泛的应用场景。但是,受限于聚类算法本身的资质、图像噪声、图像数量等因素的影响,聚类算法产生图像类别伪标签容易包含噪声,质量不如人工标记类别标签质量,导致无监督图像检索模型训练效果不佳。
发明内容
为改善伪标签质量以提升无监督图像检索效果,本发明提出一种用于无监督图像检索模拟污染的标签增强方法,本发明采用如下技术方案:
一种面向无监督图像检索的模拟抗污伪标签增强方法,具体包括如下步骤:
S1、伪标签获取步骤,利用基于深度学习的图像检索模型对无标签图像数据集进行图像特征提取,基于所提取图像特征利用聚类算法获得每张图像的伪标签,具体如下:
S1.1、利用基于深度学习的图像检索模型对无标签图像数据集进行图像特征提取,如公式所示:
F=DeepNet(X);
其中,DeepNet表示基于深度学习的图像检索模型;X表示一张无标签图像;表示无标签图像X的无污染特征向量,/>表示无污染特征向量的特征维度为d维。
S1.2、基于无监督图像检索模型所提取的图像特征,采用聚类算法为每张图像分配伪标签,如下公式所示:
y=Cluster(F);
其中,表示无标签图像X的无污染特征向量,/>表示无污染特征向量的特征维度为d维;/>表示无标签图像X由聚类产生的伪标签,C等于类别数量;Cluster表示聚类算法。
S2、特征随机污染步骤,采用伯努利随机分布对图像特征向量随机置零以模拟特征污染,获得随机污染特征向量,具体如下:
通过二项分布得到仅由0和1组成的随机的伯努利污染向量;把图像特征向量与伯努利污染向量进行点乘实现伯努利污染,得到一个随机污染特征;多次进行伯努利污染,得到同一图像的多个随机污染特征向量,如下:
Gi=F⊙Bemoulli(α),i=1,2,3,...,k;
其中,表示无污染特征向量,/>表示无污染特征向量的特征维度为d维;表示一个d维的伯努利随机向量,每个元素bi的取值为0或1;α表示伯努利随机向量中0元素的比例,0>α>1;Gi表示对F进行第i次伯努利污染获得的随机污染特征向量,⊙表示点乘操作,k表示特征随机污染次数。
S3、抗污染后验类别信息计算步骤,基于随机污染特征向量计算随机污染后验类别概率,并进行后验类别概率最大池化以获得抗污染后验类别信息,具体如下:
S3.1、基于随机污染特征计算随机污染后验类别概率,如下:
其中,Gi表示对无污染特征向量F进行第i次伯努利污染获得的随机污染特征向量,k表示特征随机污染次数;FC表示全连接层,它把Gi投影为C维数据,C等于类别数量,随后利用Softmax函数对C维数据进行归一化获得后验类别概率qi,表示后验类别概率qi的维度为C维;
S3.2、基于随机污染后验类别概率计算抗污染后验类别信息,如下:
其中,Cat表示拼接操作,它把k个随机污染后验类别概率拼接为随机污染后验类别概率矩阵Q,表示随机污染后验类别概率矩阵Q的维度为C×k维,C等于类别数量;MaxPool表示最大池化操作,它对随机污染后验类别概率矩阵Q沿k方向进行最大池化,获得抗污染后验类别信息m,/>表示抗污染后验类别信息m的维度为C维。
S4、伪标签增强步骤,归一化抗污染后验类别信息获得抗污染后验类别概率,将抗污染后验类别概率与聚类产生的伪标签线性组合,获得增强伪标签,具体如下:
S4.1、归一化抗污染后验类别信息获得抗污染后验类别概率,如下:
其中,mz表示抗污染后验类别信息m的第z维取值,mj表示抗污染后验类别信息m的第j维取值;pz表示抗污染后验类别概率的第z维取值;C等于类别数量。
S4.2、线性组合抗污染后验类别概率与聚类产生的伪标签,获得增强伪标签,如下:
lz=(1-γ)yz+γpz,z=1,2,3,....,C;
其中,yz表示聚类产生的伪标签y的第z维取值;lz表示增强伪标签的第z维取值;1>γ>0表示加权参数,用于组合抗污染后验类别概率与聚类产生的伪标签。
S5、图像检索模型更新步骤,基于所述增强伪标签构建损失函数,如下:
其中,N表示图像数量,表示第n个图像对应的增强伪标签的第z维取值,/>表示第n个图像基于其无污染特征向量获得预测后验概率qn的第z维取值,FC表示全连接层,它把第n个图像的无污染特征向量Fn投影为C维取值,C等于类别数量,并利用Softmax函数对C维数据进行归一化获得后验概率。采用批量梯度下降法对所述基于深度学习的图像检索模型进行训练,更新图像检索模型。
S6、重复处理步骤,重复步骤1到5,直到最大重复次数,获得最终的无监督图像检索模型。
与现有技术相比,本发明的有益效果如下:
由于在图像伪标签质量对无监督图像检索模型性能起到决定性的影响,本发明通过随机污染图像特征获得随机污染的后验类别信息,模拟伪标签中的噪声因素,随后从随机污染的后验类别信息中利用最大池化寻找对噪声污染最稳定的抗污染后验类别概率,并将之与聚类产生的伪标签线性组合,实现伪标签增强,从而改善无监督图像检索模型性能。
附图说明
图1为本发明实施例的一种面向无监督图像检索的模拟抗污伪标签增强方法的流程图;
图2为本发明实施例的一种面向无监督图像检索的模拟抗污伪标签增强方法的框架图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本实施案例一种面向无监督图像检索的模拟抗污伪标签增强方法,总体流程与总体框架图分别如图1和图2所示。具体包括如下步骤:
S1:伪标签获取步骤,利用基于深度学习的图像检索模型对无标签图像数据集进行图像特征提取,基于所提取图像特征利用聚类算法获得每张图像的伪标签,具体实现如下。
S1.1:图像特征提取步骤,用基于深度学习的图像检索模型对无标签图像数据集进行图像特征提取,如下公式所示:
F=ResNet50(X);
其中,ResNet50是常见的深度学习网络结构,作为图像检索模型;X表示一张无标签图像;表示无标签图像X的无污染特征向量,/>表示无污染特征向量的特征维度为d维。如图2所示,ResNet50包括:茎(Stem)层,4个残差组(Layer1,Layer2,Layer3和Layer4),全局平均池化(Global Average Pooling,GAP)层。进一步地,可以看见,ResNet50对图像进行特征提取,将ResNet50的全局平均池化GAP输出数据作为相应图像特征向量。
S1.2:聚类步骤,基于无监督图像检索模型所提取的图像特征,采用聚类算法为每张图像分配伪标签,如下所示:
y=DBSCAN(F);
其中,表示无标签图像X的无污染特征向量,/>表示无污染特征向量的特征维度为d维;/>表示无标签图像X由聚类产生的伪标签,C等于类别数量;DBSCAN表示常见的聚类算法,具有能发现任意形状的聚类簇的优点。
S2、特征随机污染步骤,采用伯努利随机分布对图像特征向量随机置零以模拟特征污染,获得随机污染特征向量,具体如下:
通过二项分布得到仅由0和1组成的随机的伯努利污染向量;把图像特征向量与伯努利污染向量进行点乘实现伯努利污染,得到一个随机污染特征;多次进行伯努利污染,得到同一图像的多个随机污染特征向量,如下:
Gi=F⊙Bemoulli(α),i=1,2,3,...,k;
其中,表示无污染特征向量,/>表示无污染特征向量的特征维度为d维;表示一个d维的伯努利随机向量,每个元素bi的取值为0或1;α表示伯努利随机向量中0元素的比例,0>α>1;Gi表示对F进行第i次伯努利污染获得的随机污染特征向量,⊙表示点乘操作,k表示特征随机污染次数。
S3、抗污染后验类别信息计算步骤,基于随机污染特征向量计算随机污染后验类别概率,并进行后验类别概率最大池化以获得抗污染后验类别信息,具体如下:
S3.1、基于随机污染特征计算随机污染后验类别概率,如下:
其中,Gi表示对无污染特征向量F进行第i次伯努利污染获得的随机污染特征向量,k表示特征随机污染次数;FC表示全连接层,它把Gi投影为C维数据,C等于类别数量,随后利用Softmax函数对C维数据进行归一化获得后验类别概率qi,表示后验类别概率qi的维度为C维;
S3.2、基于随机污染后验类别概率计算抗污染后验类别信息,如下:
其中,Cat表示拼接操作,它把k个随机污染后验类别概率拼接为随机污染后验类别概率矩阵Q,表示随机污染后验类别概率矩阵Q的维度为C×k维,C等于类别数量;MaxPool表示最大池化操作,它对随机污染后验类别概率矩阵Q沿k方向进行最大池化,获得抗污染后验类别信息m,/>表示抗污染后验类别信息m的维度为C维。
S4、伪标签增强步骤,归一化抗污染后验类别信息获得抗污染后验类别概率,将抗污染后验类别概率与聚类产生的伪标签线性组合,获得增强伪标签,具体如下:
S4.1、归一化抗污染后验类别信息获得抗污染后验类别概率,如下:
其中,mz表示抗污染后验类别信息m的第z维取值,mj表示抗污染后验类别信息m的第j维取值;pz表示抗污染后验类别概率的第z维取值;C等于类别数量。
S4.2、线性组合抗污染后验类别概率与聚类产生的伪标签,获得增强伪标签,如下:
lz=(1-γ)yz+γpz,z=1,2,3,....,C;
其中,yz表示聚类产生的伪标签y的第z维取值;lz表示增强伪标签的第z维取值;1>γ>0表示加权参数,用于组合抗污染后验类别概率与聚类产生的伪标签。
S5、图像检索模型更新步骤,基于所述增强伪标签构建损失函数,如下:
其中,N表示图像数量,表示第n个图像对应的增强伪标签的第z维取值,/>表示第n个图像基于其无污染特征向量获得预测后验概率qn的第z维取值,FC表示全连接层,它把第n个图像的无污染特征向量Fn投影为C维取值,C等于类别数量,并利用Softmax函数对C维数据进行归一化获得后验概率。采用批量梯度下降法对所述基于深度学习的图像检索模型进行训练,更新图像检索模型。
S6、重复处理步骤,重复步骤1到5,直到最大重复次数,获得最终的无监督图像检索模型。
本发明的关键在于,通过随机污染图像特征获得随机污染的后验类别信息,模拟伪标签中的噪声因素,随后从随机污染的后验类别信息中利用最大池化寻找对噪声污染最稳定的抗污染后验类别概率,并将之与聚类产生的伪标签线性组合,实现伪标签增强,从而改善无监督图像检索模型性能。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。系统权利要求中陈述的多个单元或系统也可以由一个单元或系统通过软件或者硬件来实现。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神范围。
Claims (4)
1.一种面向无监督图像检索的模拟抗污伪标签增强方法,其特征在于,包括:
S1伪标签获取步骤,利用基于深度学习的图像检索模型对无标签图像数据集进行图像特征提取,基于所提取图像特征利用聚类算法获得每张图像的伪标签;
S2特征随机污染步骤,采用伯努利随机分布对图像特征向量随机置零以模拟特征污染,获得随机污染特征向量;
S3抗污染后验类别信息计算步骤,基于随机污染特征向量计算随机污染后验类别概率,并进行后验类别概率最大池化以获得抗污染后验类别信息;
S4伪标签增强步骤,归一化抗污染后验类别信息获得抗污染后验类别概率,将抗污染后验类别概率与聚类产生的伪标签线性组合,获得增强伪标签;
S5图像检索模型更新步骤,基于所述增强伪标签构建损失函数,并采用批量梯度下降法对所述基于深度学习的图像检索模型进行训练,更新图像检索模型;
S6重复处理步骤,重复步骤S1到S5,直到最大重复次数,获得最终的无监督图像检索模型;
特征随机污染步骤的具体过程如下所示:
通过二项分布得到仅由0和1组成的随机的伯努利污染向量;把图像特征向量与伯努利污染向量进行点乘实现伯努利污染,得到一个随机污染特征;多次进行伯努利污染,得到同一图像的多个随机污染特征向量,如下:
Gi=F⊙Bernoulli(α),i=1,2,3,...,k;
其中,表示无污染特征向量,/>表示无污染特征向量的特征维度为d维;Bernoulli(α)={bi|bi∈{0,1},/>表示一个d维的伯努利随机向量,每个元素bi的取值为0或1;α表示伯努利随机向量中0元素的比例,0>a>1;Gi表示对F进行第i次伯努利污染获得的随机污染特征向量,⊙表示点乘操作,k表示特征随机污染次数;
抗污染后验类别信息计算步骤的计算过程如下:
S31基于随机污染特征计算随机污染后验类别概率,如下:
其中,Gi表示对无污染特征向量F进行第i次伯努利污染获得的随机污染特征向量,k表示特征随机污染次数;FC表示全连接层,它把Gi投影为C维数据,C等于类别数量,随后利用Softmax函数对C维数据进行归一化获得后验类别概率qi,表示后验类别概率qi的维度为C维;
S32基于随机污染后验类别概率计算抗污染后验类别信息,如下:
其中,Cat表示拼接操作,它把k个随机污染后验类别概率拼接为随机污染后验类别概率矩阵Q,表示随机污染后验类别概率矩阵Q的维度为C×k维,C等于类别数量;
MaxPool表示最大池化操作,它对随机污染后验类别概率矩阵Q沿k方向进行最大池化,获得抗污染后验类别信息m,表示抗污染后验类别信息m的维度为C维。
2.根据权利要求1所述的面向无监督图像检索的模拟抗污伪标签增强方法,其特征在于,伪标签获取步骤的具体过程如下所示:
S11利用基于深度学习的图像检索模型对无标签图像数据集进行图像特征提取,如下公式所示:
F=DeepNet(X);
其中,DeepNet表示基于深度学习的图像检索模型;X表示一张无标签图像;表示无标签图像X的无污染特征向量,/>表示无污染特征向量的特征维度为d维;
S12基于无监督图像检索模型所提取的图像特征,采用聚类算法为每张图像分配伪标签,如下公式所示:
y=Cluster(F);
其中,表示无标签图像X的无污染特征向量,/>表示无污染特征向量的特征维度为d维;/>表示无标签图像X由聚类产生的伪标签,C等于类别数量;Cluster表示聚类算法。
3.根据权利要求1所述的面向无监督图像检索的模拟抗污伪标签增强方法,其特征在于,伪标签增强步骤的计算过程如下:
S41归一化抗污染后验类别信息获得抗污染后验类别概率,如下:
其中,mz表示抗污染后验类别信息m的第z维取值,mj表示抗污染后验类别信息m的第j维取值;pz表示抗污染后验类别概率的第z维取值;C等于类别数量;
S42线性组合抗污染后验类别概率与聚类产生的伪标签,获得增强伪标签,如下:
lz=(1-γ)yz+γpz,z=1,2,3,....,C;
其中,yz表示聚类产生的伪标签y的第z维取值;lz表示增强伪标签的第z维取值;1>γ>0表示加权参数,用于组合抗污染后验类别概率与聚类产生的伪标签。
4.根据权利要求1所述的面向无监督图像检索的模拟抗污伪标签增强方法,其特征在于,图像检索模型更新步骤中基于所述增强伪标签构建损失函数的公式如下:
其中,N表示图像数量,表示第n个图像对应的增强伪标签的第z维取值,/>表示第n个图像基于其无污染特征向量获得预测后验概率qn的第z维取值,FC表示全连接层,它把第n个图像的无污染特征向量Fn投影为C维取值,C等于类别数量,并利用Softmax函数对C维数据进行归一化获得后验概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311779473.1A CN117456312B (zh) | 2023-12-22 | 2023-12-22 | 一种面向无监督图像检索的模拟抗污伪标签增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311779473.1A CN117456312B (zh) | 2023-12-22 | 2023-12-22 | 一种面向无监督图像检索的模拟抗污伪标签增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117456312A CN117456312A (zh) | 2024-01-26 |
CN117456312B true CN117456312B (zh) | 2024-03-12 |
Family
ID=89591436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311779473.1A Active CN117456312B (zh) | 2023-12-22 | 2023-12-22 | 一种面向无监督图像检索的模拟抗污伪标签增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117456312B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114168773A (zh) * | 2021-12-08 | 2022-03-11 | 天津大学 | 一种基于伪标签和重排序的半监督草图图像检索方法 |
CN114492574A (zh) * | 2021-12-22 | 2022-05-13 | 中国矿业大学 | 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法 |
CN115292532A (zh) * | 2022-06-24 | 2022-11-04 | 中南大学 | 基于伪标签一致性学习的遥感图像域适应检索方法 |
CN115908419A (zh) * | 2023-01-09 | 2023-04-04 | 西安交通大学 | 一种利用贝叶斯网络优化伪标签的无监督高光谱图像变化检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814871B (zh) * | 2020-06-13 | 2024-02-09 | 浙江大学 | 一种基于可靠权重最优传输的图像分类方法 |
US20230259762A1 (en) * | 2022-02-14 | 2023-08-17 | Samsung Electronics Co., Ltd. | Machine learning with instance-dependent label noise |
-
2023
- 2023-12-22 CN CN202311779473.1A patent/CN117456312B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114168773A (zh) * | 2021-12-08 | 2022-03-11 | 天津大学 | 一种基于伪标签和重排序的半监督草图图像检索方法 |
CN114492574A (zh) * | 2021-12-22 | 2022-05-13 | 中国矿业大学 | 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法 |
CN115292532A (zh) * | 2022-06-24 | 2022-11-04 | 中南大学 | 基于伪标签一致性学习的遥感图像域适应检索方法 |
CN115908419A (zh) * | 2023-01-09 | 2023-04-04 | 西安交通大学 | 一种利用贝叶斯网络优化伪标签的无监督高光谱图像变化检测方法 |
Non-Patent Citations (2)
Title |
---|
DeflickerCycleGAN: Learning to Detect and Remove Flickers in a Single Image;Xiaodan Lin 等;IEEE TRANSACTIONS ON IMAGE PROCESSING;20230104;第32卷;第709-720页 * |
基于后验概率特征的改进无监督语音样例检测;李勃昊 等;信息工程大学学报;20150831;第16卷(第04期);第449-453页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117456312A (zh) | 2024-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114067160B (zh) | 基于嵌入平滑图神经网络的小样本遥感图像场景分类方法 | |
Song et al. | Auto-encoder based data clustering | |
CN111666406B (zh) | 基于自注意力的单词和标签联合的短文本分类预测方法 | |
CN109871454B (zh) | 一种鲁棒离散监督跨媒体哈希检索方法 | |
CN112949740B (zh) | 一种基于多级度量的小样本图像分类方法 | |
CN110399895A (zh) | 图像识别的方法和装置 | |
CN114913379B (zh) | 基于多任务动态对比学习的遥感图像小样本场景分类方法 | |
CN110728187A (zh) | 一种基于容错性深度学习的遥感影像场景分类方法 | |
CN112199532A (zh) | 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置 | |
CN115482418B (zh) | 基于伪负标签的半监督模型训练方法、系统及应用 | |
CN113821668A (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
CN112131403B (zh) | 一种动态环境下的知识图谱表示学习方法 | |
CN111401156A (zh) | 基于Gabor卷积神经网络的图像识别方法 | |
CN116383422B (zh) | 一种基于锚点的无监督跨模态哈希检索方法 | |
CN110263855A (zh) | 一种利用共基胶囊投影进行图像分类的方法 | |
CN116363423A (zh) | 面向小样本学习的知识蒸馏方法、装置及存储介质 | |
CN114329031A (zh) | 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法 | |
CN114972904B (zh) | 一种基于对抗三元组损失的零样本知识蒸馏方法及系统 | |
CN117649552A (zh) | 一种基于对比学习和主动学习的图像增量学习方法 | |
CN114898136A (zh) | 一种基于特征自适应的小样本图像分类方法 | |
CN105701227B (zh) | 一种基于局部关联图的跨媒体相似性度量方法和检索方法 | |
CN114299326A (zh) | 一种基于转换网络与自监督的小样本分类方法 | |
CN117611838A (zh) | 一种基于自适应超图卷积网络的多标签图像分类方法 | |
CN117456312B (zh) | 一种面向无监督图像检索的模拟抗污伪标签增强方法 | |
CN112529057A (zh) | 一种基于图卷积网络的图相似性计算方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |