CN112668627A - 一种基于对比学习的大规模图像在线聚类系统及方法 - Google Patents
一种基于对比学习的大规模图像在线聚类系统及方法 Download PDFInfo
- Publication number
- CN112668627A CN112668627A CN202011544811.XA CN202011544811A CN112668627A CN 112668627 A CN112668627 A CN 112668627A CN 202011544811 A CN202011544811 A CN 202011544811A CN 112668627 A CN112668627 A CN 112668627A
- Authority
- CN
- China
- Prior art keywords
- image
- subsystem
- feature extraction
- class
- level comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000000605 extraction Methods 0.000 claims abstract description 68
- 230000003416 augmentation Effects 0.000 claims abstract description 49
- 230000006870 function Effects 0.000 claims abstract description 48
- 230000003190 augmentative effect Effects 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000005457 optimization Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 42
- 239000011159 matrix material Substances 0.000 claims description 34
- 238000013528 artificial neural network Methods 0.000 claims description 32
- 239000000126 substance Substances 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013434 data augmentation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- ADHFMENDOUEJRK-UHFFFAOYSA-N 9-[(4-fluorophenyl)methyl]-n-hydroxypyrido[3,4-b]indole-3-carboxamide Chemical compound C1=NC(C(=O)NO)=CC(C2=CC=CC=C22)=C1N2CC1=CC=C(F)C=C1 ADHFMENDOUEJRK-UHFFFAOYSA-N 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241001482237 Pica Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000013107 unsupervised machine learning method Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于对比学习的大规模图像在线聚类系统及方法,其系统包括:增广子系统、特征提取子系统、实例级别对比头子系统和类别级别对比头子系统;其方法包括:S1、对原始图像样本集进行增广操作,得到两组增广图像集;S2、构建总损失函数,将两组增广图像集作为训练集,采用梯度下降优化方法对大规模在线聚类系统进行训练;S3、采用训练完成的大规模在线聚类系统对待处理的图像样本集进行聚类处理,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果;本发明解决了现有方法无法实现大规模在线聚类,以及特征提取和数据聚类这两个阶段联系不紧密,容易出现误差累计的问题。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于对比学习的大规模图像在线聚类系统及方法。
背景技术
聚类是一类基础的无监督机器学习方法,其基本思想是根据数据自身特点及数据间相似性,在不依赖外部标签的前提下,自动的将数据划分为若干个类别,使得每一类的数据具有相同特性,而不同类的数据间具有明显差别。聚类在现实生活中具有广泛的应用:例如,通过对用户消费行为的分析,将用户划分为若干具有不同偏好的群体(如美食、科技爱好者等),帮助商家针对性推荐和营销;通过对大量照片的分析,将无标签图像划分为若干类别(如自然风光、人物特写等),帮助用户进行图像整理和进一步检索。
现有的聚类方法通常分为两个阶段实现,首先通过深度神经网络提取出原始数据的特征,之后通过K-means等经典聚类方法对数据进行聚类。例如,一种现有迭代的方法,每次迭代首先选取两个最相似的数据点进行合并,之后根据当前的合并结果来优化特征提取网络,通过不断交替进行该过程实现数据聚类。另一种聚类方法是利用K-means方法对数据进行聚类,将聚类结果作为伪标签,通过分类任务优化特征提取网络,交替进行该过程,不断提升所提取特征的表征能力,进而提升聚类效果。
现有聚类方法主要存在两个缺陷:一是现有方法无法实现大规模在线聚类,其中大规模指的是数据量大,在线指的是数据以流的形式呈现,即无法在一时间获取全部的数据信息,现有聚类方法依赖于数据的全局相似性信息,而当数据量足够大时,受限于设备内存,无法读取完整的数据集,方法将不再适用;另外,现有方法对原有数据进行聚类后,对于之后新增的数据无法直接聚类,而是需要合并新增数据和原有数据,并重新对整个数据集进行聚类,效率较低。二是现有的两阶段迭代学习范式中,特征提取和数据聚类这两个阶段联系不紧密,容易出现误差累计的问题,具体来说,如果特征提取网络的能力较弱,提取的特征质量较低,那么根据该特征计算得到的聚类结果也较差,也就无法反过来指导特征提取网络进行有效的优化更新,最终大大降低聚类的效果。鉴于实际生活中的数据通常规模较大,而且维度较高,难以从中有效提取特征,因此上述的两个缺陷会严重阻碍现有算法在现实中的应用。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于对比学习的大规模图像在线聚类系统及方法解决了现有方法无法实现大规模在线聚类,以及特征提取和数据聚类这两个阶段联系不紧密,容易出现误差累计的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于对比学习的大规模图像在线聚类系统,包括:增广子系统、特征提取子系统、实例级别对比头子系统和类别级别对比头子系统;
所述增广子系统用于对图像样本集进行增广操作,得到两组增广图像集;所述特征提取子系统包括:第一特征提取深度神经网络和第二特征提取深度神经网络;所述第一特征提取深度神经网络和第二特征提取深度神经网络的权值共享,其中第一特征提取深度神经网络用于对其中一组增广图像集进行特征提取;所述第二特征提取深度神经网络用于对另一组增广图像集进行特征提取;所述实例级别对比头子系统用于对提取的特征进行实例级别的对比学习,并对特征提取子系统进行优化;所述类别级别对比头子系统用于对提取的特征进行类别级别的对比学习,并对特征提取子系统的进行优化,实现在线聚类。
一种基于对比学习的大规模图像在线聚类方法,包括以下步骤:
S1、对原始图像样本集进行增广操作,得到第一组增广图像集和第二组增广图像集;
S2、构建总损失函数,将第一组增广图像集和第二组增广图像集作为训练集,采用梯度下降优化方法对大规模在线聚类系统进行训练,得到训练完成的大规模在线聚类系统;
S3、采用训练完成的大规模在线聚类系统对待处理的图像样本集进行聚类处理,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
进一步地,步骤S1包括以下分步骤:
S11、对原始图像样本集X=[x1,…,xi,…,xN]中每一张图像xi连续两次从裁剪缩放、水平翻转、颜色变换、转灰度图和高斯噪声中随机选择几种方式进行处理,得到每一张图像xi的两组增广策略Ta、Tb,其中,N为原始图像样本集中图像数量;
进一步地,步骤S2中总损失函数为:
进一步地,实例损失函数为:
上述进一步方案的有益效果为:实例级别的对比学习能帮助减小特征空间内同类别样本之间的距离,同时增大不同类别样本间的相似性,在实例级别形成样本的自然聚类。
进一步地,所述类别损失函数为:
其中,为类别损失函数,M为类别数,为软标签矩阵Ya的第i行,为软标签矩阵Yb的第i行,为软标签矩阵Ya的第i列,为软标签矩阵Yb的第i列,为软标签矩阵Ya的第j列,为软标签矩阵Yb的第j列,τC为第二调整系数,gC(·)为类别级别对比头子系统的采用的两层全连接神经网络,为第一特征向量,为第二特征向量,为某种增广下全部样本属于第i个类别的概率和,为某种增广下样本t属于第i个类别的概率,||Yk||1为软标签矩阵Yk的1范数,k表示某种增广,a表示第一种增广,b表示第二种增广,t为矩阵行下标。
上述进一步方案的有益效果为:类别级别的对比学习能帮助进一步拉开特征空间内类别和类别之间的距离,加大不同类别的区分度,在类别级别强化聚类效果。此外,得益于在类别级别对比头中样本的表示对应其软标签,可以直接通过Argmax操作获取其最大概率的预测作为类别信息,不依赖于其他样本,从而实现大规模在线聚类。
进一步地,所述构建软标签矩阵Ya和Yb包括以下分步骤:
A3、通过各个增广图像的概率,构建软标签矩阵Ya和Yb。
进一步地,所述步骤S2包括以下分步骤:
进一步地,所述步骤S3包括以下分步骤:
S31、将待处理的图像样本集输入特征提取子系统进行特征提取,得到第三特征向量;
S32、将第三特征向量输入类别级别对比头子系统,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
综上,本发明的有益效果为:
1、本发明把聚类任务分解为实例级别和类别级别的对比学习,不再像传统方法需要将全部数据读入内存,而是借助批优化的方法,可以处理大规模数据集,具有更广泛的实际应用场景。
2、本发明通过引入“标签即表示”的思想,在类别级别对比头上直接输出样本的软标签,不依赖于其他样本的信息,适用于以流形式出现的数据,可以为新增的样本直接给出类别预测,从而实现在线聚类。
3、本发明根据特征矩阵的行空间和列空间分别对应实例和类别的特征表示这一发现,同时从实例和类别两个粒度来帮助实现聚类。
4、本发明通过“标签即表示”的思想,将聚类任务和表示学习任务二者融合在一起,提出的系统框架可以直接通过“端到端”的方式进行训练,即不需要像传统方法一样迭代进行聚类和特征提取这两个阶段,因此可以有效避免传统方法容易出现的误差累计问题。
附图说明
图1为一种基于对比学习的大规模图像在线聚类系统的系统框图;
图2为一种基于对比学习的大规模图像在线聚类方法的流程图;
图3为一种基于对比学习的大规模图像在线聚类方法的具体方法构建过程。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种基于对比学习的大规模图像在线聚类系统,包括:增广子系统、特征提取子系统、实例级别对比头子系统和类别级别对比头子系统;
所述增广子系统用于对图像样本集进行增广操作,得到两组增广图像集;所述特征提取子系统包括:第一特征提取深度神经网络和第二特征提取深度神经网络;所述第一特征提取深度神经网络和第二特征提取深度神经网络的权值共享,其中第一特征提取深度神经网络用于对其中一组增广图像集进行特征提取;所述第二特征提取深度神经网络用于对另一组增广图像集进行特征提取;所述实例级别对比头子系统用于对提取的特征进行实例级别的对比学习,并对特征提取子系统进行优化;所述类别级别对比头子系统用于对提取的特征进行类别级别的对比学习,并对特征提取子系统的进行优化,实现在线聚类。
如图2~3所示,一种基于对比学习的大规模图像在线聚类方法,包括以下步骤:
S1、对原始图像样本集进行增广操作,得到第一组增广图像集和第二组增广图像集;
步骤S1包括以下分步骤:
S11、对原始图像样本集X=[x1,…,xi,…,xN]中每一张图像xi连续两次从裁剪缩放、水平翻转、颜色变换、转灰度图和高斯噪声中随机选择几种方式进行处理,得到每一张图像xi的两组增广策略Ta、Tb,其中,N为原始图像样本集X中图像数量,其中,颜色变换包括:亮度、对比度、饱和度和色彩;
本发明构建第一组增广图像集和第二组增广图像集的目的还包括,增广图像集的样本之间构成正负样本。
对比学习首先利用先验信息及任务需求定义并构建正负样本对,正样本对通常由具有相似特征的两个样本构成,而负样本对则通常由属于不同类别的样本构成,对比学习的目标是最大化正样本对的相似性,同时最小化负样本对的相似性。在聚类任务中,最理想的正负样本对构造方式是用同类样本组成正样本对,用不同类样本组成负样本对。但作为无监督方法,在没有外部标签的情况下,本发明使用数据增广来构造样本对。数据增广主要用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力,对于不同类型的数据集可以采用不同的增广方式,例如,对于图像数据,可以采用水平翻转、裁剪缩放、颜色变换、高斯噪声等方式,对于文本数据,可以采用同义词替换、随机插入、随机交换、随机删除等方式,对于音频数据,可以采用噪声增强、音高变换、混合背景音、增加白噪声等方式。
增广子系统:对于每一张图像xi,连续两次从裁剪缩放、水平翻转、颜色变换(包括亮度、对比度、饱和度和色彩)、转灰度图、高斯噪声这些增广方式T中随机选择若干种,得到两组增广策略Ta、Tb分别作用于xi,得到两张增广后的图像和
S2、构建总损失函数,将第一组增广图像集和第二组增广图像集作为训练集,采用梯度下降优化方法对大规模在线聚类系统进行训练,得到训练完成的大规模在线聚类系统;
步骤S2包括以下分步骤:
步骤S2中总损失函数为:
实例级别对比头子系统:在增广后得到的2N张图像中,每张图像xi都可与其他2N-1张图像构成样本对,其中定义为正样本对,其余的所有2N-2对均为负样本对,即正样本对由来自同一张原始图像增广得到的两张增广图像构成。对于特征提取子系统提取的特征和实例级对比头进一步采用一个共享的两层全连接神经网络gI(·),将和投影为两个更低维度的特征并在这些特征上进行实例级别的对比学习。
基于实例级别对比头子系统构建实例损失函数为:
类别级别对比头子系统:与实例级别对比头子系统类似,本发明提出类别级别的对比头,用于进行类别级别的对比学习。与实例级别的对比学习不同,由于缺乏标签信息,无法事先确定各个实例的所属类别,类别的特征表示无法直接获得。为此,本发明引入了“标签即表示”的思想,假设目标是将样本聚类为M个类别,类别级别对比头利用一个共享的两层全连接神经网络gC(·),将和投影为两个维度为K的特征这里通过在K维的特征上使用Softmax激活函数,可以将得到的特征视为该样本被分配到各个类别的概率,即样本的软标签。为所有样本计算软标签,可以的到整个批数据对应的软标签矩阵Ya,Yb,其中分别对应Ya,Yb的第i行。当神经网络对样本所属类别的预测足够自信时,样本的软标签趋向于独热编码,即该向量只有其所属类别的位置为1,其余位置均为0。在这个前提下,可以将Ya,Yb矩阵的列视作一种特殊的类别的表示,因为其中趋近于1的元素对应该类别中包含的样本。考虑到每个样本应该只被分配到一个类别,类别级别的对比学习的目标便是降低类别间的相似性,同时增加两种增广下同一类别的相似性,具体地,在两种增广得到的2M个类别的表示中,对于类别定义为正样本对,与其余的2M-2个类别表示组成负样本对。
基于类别级别对比头子系统构建类别损失函数为:
其中,为类别损失函数,M为类别数,为软标签矩阵Ya的第i行,为软标签矩阵Yb的第i行,为软标签矩阵Ya的第i列,为软标签矩阵Yb的第i列,为软标签矩阵Ya的第j列,为软标签矩阵Yb的第j列,τC为第二调整系数,gC(·)为类别级别对比头子系统的采用的两层全连接神经网络,为第一特征向量,为第二特征向量,为某种增广下全部样本属于第i个类别的概率和,为某种增广下样本t属于第i个类别的概率,||Yk||1为软标签矩阵Yk的1范数,k表示某种增广,a表示第一种增广,b表示第二种增广,t为矩阵行下标。
构建软标签矩阵Ya和Yb包括以下分步骤:
A3、通过各个增广图像的概率,构建软标签矩阵Ya、Yb。
S3、采用大规模在线聚类系统对待处理的图像样本集进行聚类处理,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
步骤S3包括以下分步骤:
S31、将待处理的图像样本集输入特征提取子系统进行特征提取,得到第三特征向量;
S32、将第三特征向量输入类别级别对比头子系统,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
图1为整个发明的系统,利用特征提取子系统提取特征,实例级别对比头子系统和类别级别对比头子系统分别在实例级别(对应特征矩阵的行空间)和类别级别(对应特征矩阵的列空间)上进行对比学习,共同优化特征提取子系统和两个对比头子系统,整体的损失函数为系统通过梯度下降优化方法进行训练,在系统训练完成后,由于类别级别对比头子系统的输出为各个样本的软标签,只需要将各个样本归到其预测概率最大的类别便可实现聚类(例如某样本的软标签为[0.1,0.7,0.3],那么将其分到最大概率0.7对应的第2个类别)。
实例级别对比头子系统采用两层全连接网络,假设所提取特征的维度为m,第一层输入维度为m,输入维度为m,激活函数采用ReLU;第二层输入维度为m,输出维度为128,无激活函数。
类别级别对比头子系统采用两层全连接网络,假设所提取特征的维度为m,第一层输入维度为m,输入维度为m,激活函数采用ReLU;第二层输入维度为m,输出维度为聚类个数,激活函数为SoftMax,用于计算软标签。
实验:
本发明对比了目前国际上比较先进的方法,包含K-means聚类方法、谱聚类方法(SC、NMF)、层次聚类方法(AC、JULE)、自编码器方法(AE、DAE、DeCNN、VAE)、生成对抗网络方法(DCGAN)、深度聚类方法(DEC、DAC、DDC、DCCM、PICA)等先进方法,在物体图片数据集CIFAR-10和ImageNet-10上进行实验对比。本发明使用衡量聚类效果常用的指标,即标准化互信息(NMI),作为实验的量化指标,验证算法效果。NMI取值范围0~1,数字越大效果越好,为1时表示算法能完全正确的将数据聚类正确。NMI计算方式如下:
其中Y是算法预测类别信息,C是数据实际类别信息。H(·)代表信息熵,I(Y;C)代表互信息。
实验一:使用数据集CIFAR-10,其包含60000张来自10个物体类别的图片,实验数据类别信息和样本数量分布如下:
表1
飞机 | 轿车 | 鸟 | 猫 | 鹿 | 狗 | 青蛙 | 马 | 船 | 卡车 |
6000 | 6000 | 6000 | 6000 | 6000 | 6000 | 6000 | 6000 | 6000 | 6000 |
实验结果如下:
表2
从表2中可以看到,本发明相比其他聚类方法在标准化互信息这一指标上有比较大的提升,意味着能在实际应用中能很好的将物体图片数据聚类正确,避免了耗费大量人力资源用于图片分类。
实验二:使用数据集ImageNet-10,该数据集是大型图片数据集ImageNet的子集,其包含13000张来自10个物体类别的图片,实验数据类别信息和样本数量分布如下:
表3
企鹅 | 狗 | 豹 | 飞机 | 飞艇 | 船 | 足球 | 轿车 | 卡车 | 橘子 |
1300 | 1300 | 1300 | 1300 | 1300 | 1300 | 1300 | 1300 | 1300 | 1300 |
实验结果如下:
表4
从表4中可以看到,本发明相比其他聚类方法在标准化互信息这一指标上有比较大的提升,意味着能在实际应用中能很好的将物体图片数据聚类正确,避免了耗费大量人力资源用于图片分类。
Claims (9)
1.一种基于对比学习的大规模图像在线聚类系统,其特征在于,包括:增广子系统、特征提取子系统、实例级别对比头子系统和类别级别对比头子系统;
所述增广子系统用于对图像样本集进行增广操作,得到两组增广图像集;所述特征提取子系统包括:第一特征提取深度神经网络和第二特征提取深度神经网络;所述第一特征提取深度神经网络和第二特征提取深度神经网络的权值共享,其中第一特征提取深度神经网络用于对其中一组增广图像集进行特征提取;所述第二特征提取深度神经网络用于对另一组增广图像集进行特征提取;所述实例级别对比头子系统用于对提取的特征进行实例级别的对比学习,并对特征提取子系统进行优化;所述类别级别对比头子系统用于对提取的特征进行类别级别的对比学习,并对特征提取子系统的进行优化,实现在线聚类。
2.一种基于对比学习的大规模图像在线聚类方法,其特征在于,包括以下步骤:
S1、对原始图像样本集进行增广操作,得到第一组增广图像集和第二组增广图像集;
S2、构建总损失函数,将第一组增广图像集和第二组增广图像集作为训练集,采用梯度下降优化方法对大规模在线聚类系统进行训练,得到训练完成的大规模在线聚类系统;
S3、采用训练完成的大规模在线聚类系统对待处理的图像样本集进行聚类处理,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
8.根据权利要求6所述的基于对比学习的大规模图像在线聚类方法,其特征在于,所述步骤S2包括以下分步骤:
9.根据权利要求2所述的基于对比学习的大规模图像在线聚类方法,其特征在于,所述步骤S3包括以下分步骤:
S31、将待处理的图像样本集输入特征提取子系统进行特征提取,得到第三特征向量;
S32、将第三特征向量输入类别级别对比头子系统,将类别级别对比头子系统输出的最大概率对应的类别,作为每一张图像样本的聚类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011544811.XA CN112668627A (zh) | 2020-12-24 | 2020-12-24 | 一种基于对比学习的大规模图像在线聚类系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011544811.XA CN112668627A (zh) | 2020-12-24 | 2020-12-24 | 一种基于对比学习的大规模图像在线聚类系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112668627A true CN112668627A (zh) | 2021-04-16 |
Family
ID=75408162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011544811.XA Pending CN112668627A (zh) | 2020-12-24 | 2020-12-24 | 一种基于对比学习的大规模图像在线聚类系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112668627A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435545A (zh) * | 2021-08-14 | 2021-09-24 | 北京达佳互联信息技术有限公司 | 图像处理模型的训练方法及装置 |
CN113496489A (zh) * | 2021-09-06 | 2021-10-12 | 北京字节跳动网络技术有限公司 | 内窥镜图像分类模型的训练方法、图像分类方法和装置 |
CN113516181A (zh) * | 2021-07-01 | 2021-10-19 | 北京航空航天大学 | 一种数字病理图像的表征学习方法 |
CN113807455A (zh) * | 2021-09-26 | 2021-12-17 | 北京有竹居网络技术有限公司 | 构建聚类模型的方法、设备、介质和程序产品 |
CN113821661A (zh) * | 2021-08-30 | 2021-12-21 | 上海明略人工智能(集团)有限公司 | 图像检索方法、系统、存储介质及电子设备 |
CN113869420A (zh) * | 2021-09-28 | 2021-12-31 | 平安科技(深圳)有限公司 | 基于对比学习的文本推荐方法及相关设备 |
CN114266911A (zh) * | 2021-12-10 | 2022-04-01 | 四川大学 | 基于可微k-均值的嵌入式可解释图像聚类方法 |
CN115062602A (zh) * | 2022-08-17 | 2022-09-16 | 杭州火石数智科技有限公司 | 对比学习的样本构造方法、装置、计算机设备及存储介质 |
WO2023173804A1 (zh) * | 2022-03-16 | 2023-09-21 | 西安电子科技大学 | 一种共享子空间学习的脑机信息融合分类方法及系统 |
CN117934891A (zh) * | 2024-03-25 | 2024-04-26 | 南京信息工程大学 | 一种基于图结构的图像对比聚类方法及系统 |
CN117934891B (zh) * | 2024-03-25 | 2024-06-07 | 南京信息工程大学 | 一种基于图结构的图像对比聚类方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124711A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Universal correspondence network |
US20190130221A1 (en) * | 2017-11-02 | 2019-05-02 | Royal Bank Of Canada | Method and device for generative adversarial network training |
CN110458233A (zh) * | 2019-08-13 | 2019-11-15 | 腾讯云计算(北京)有限责任公司 | 混合粒度物体识别模型训练及识别方法、装置及存储介质 |
CN111783884A (zh) * | 2020-06-30 | 2020-10-16 | 山东女子学院 | 基于深度学习的无监督高光谱图像分类方法 |
CN112070123A (zh) * | 2020-08-14 | 2020-12-11 | 五邑大学 | 小样本sar图像识别方法、装置及存储介质 |
-
2020
- 2020-12-24 CN CN202011544811.XA patent/CN112668627A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124711A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Universal correspondence network |
US20190130221A1 (en) * | 2017-11-02 | 2019-05-02 | Royal Bank Of Canada | Method and device for generative adversarial network training |
CN110458233A (zh) * | 2019-08-13 | 2019-11-15 | 腾讯云计算(北京)有限责任公司 | 混合粒度物体识别模型训练及识别方法、装置及存储介质 |
CN111783884A (zh) * | 2020-06-30 | 2020-10-16 | 山东女子学院 | 基于深度学习的无监督高光谱图像分类方法 |
CN112070123A (zh) * | 2020-08-14 | 2020-12-11 | 五邑大学 | 小样本sar图像识别方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
Y.LI ET.AL: "Contrastive Clustering", 《HTTP://ARXIV.ORG/ABS/2009.09687》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516181B (zh) * | 2021-07-01 | 2024-03-15 | 北京航空航天大学 | 一种数字病理图像的表征学习方法 |
CN113516181A (zh) * | 2021-07-01 | 2021-10-19 | 北京航空航天大学 | 一种数字病理图像的表征学习方法 |
CN113435545A (zh) * | 2021-08-14 | 2021-09-24 | 北京达佳互联信息技术有限公司 | 图像处理模型的训练方法及装置 |
CN113821661A (zh) * | 2021-08-30 | 2021-12-21 | 上海明略人工智能(集团)有限公司 | 图像检索方法、系统、存储介质及电子设备 |
CN113821661B (zh) * | 2021-08-30 | 2024-04-02 | 上海明略人工智能(集团)有限公司 | 图像检索方法、系统、存储介质及电子设备 |
CN113496489B (zh) * | 2021-09-06 | 2021-12-24 | 北京字节跳动网络技术有限公司 | 内窥镜图像分类模型的训练方法、图像分类方法和装置 |
CN113496489A (zh) * | 2021-09-06 | 2021-10-12 | 北京字节跳动网络技术有限公司 | 内窥镜图像分类模型的训练方法、图像分类方法和装置 |
CN113807455A (zh) * | 2021-09-26 | 2021-12-17 | 北京有竹居网络技术有限公司 | 构建聚类模型的方法、设备、介质和程序产品 |
WO2023045925A1 (zh) * | 2021-09-26 | 2023-03-30 | 北京有竹居网络技术有限公司 | 构建聚类模型的方法、设备、介质和程序产品 |
CN113869420A (zh) * | 2021-09-28 | 2021-12-31 | 平安科技(深圳)有限公司 | 基于对比学习的文本推荐方法及相关设备 |
CN114266911A (zh) * | 2021-12-10 | 2022-04-01 | 四川大学 | 基于可微k-均值的嵌入式可解释图像聚类方法 |
WO2023173804A1 (zh) * | 2022-03-16 | 2023-09-21 | 西安电子科技大学 | 一种共享子空间学习的脑机信息融合分类方法及系统 |
CN115062602A (zh) * | 2022-08-17 | 2022-09-16 | 杭州火石数智科技有限公司 | 对比学习的样本构造方法、装置、计算机设备及存储介质 |
CN115062602B (zh) * | 2022-08-17 | 2022-11-11 | 杭州火石数智科技有限公司 | 对比学习的样本构造方法、装置及计算机设备 |
CN117934891A (zh) * | 2024-03-25 | 2024-04-26 | 南京信息工程大学 | 一种基于图结构的图像对比聚类方法及系统 |
CN117934891B (zh) * | 2024-03-25 | 2024-06-07 | 南京信息工程大学 | 一种基于图结构的图像对比聚类方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112668627A (zh) | 一种基于对比学习的大规模图像在线聚类系统及方法 | |
Goldberger et al. | Hierarchical clustering of a mixture model | |
CN105184298B (zh) | 一种快速局部约束低秩编码的图像分类方法 | |
CN112560432B (zh) | 基于图注意力网络的文本情感分析方法 | |
CN111552807A (zh) | 一种短文本多标签分类方法 | |
CN111429340A (zh) | 一种基于自注意力机制的循环图像翻译方法 | |
Guo et al. | An unsupervised hierarchical feature learning framework for one-shot image recognition | |
CN113191385A (zh) | 一种基于预训练标注数据不可知的图像分类自动标注方法 | |
CN110598022B (zh) | 一种基于鲁棒深度哈希网络的图像检索系统与方法 | |
Koo et al. | Partglot: Learning shape part segmentation from language reference games | |
Guan et al. | Self-supervised character-to-character distillation for text recognition | |
CN111488923B (zh) | 增强的锚点图半监督分类方法 | |
CN113408418A (zh) | 一种书法字体与文字内容同步识别方法及系统 | |
Zhang et al. | Improving the generalization performance of deep networks by dual pattern learning with adversarial adaptation | |
CN117150026A (zh) | 文本内容多标签分类方法与装置 | |
CN111259938B (zh) | 基于流形学习和梯度提升模型的图片偏多标签分类方法 | |
CN113392868A (zh) | 一种模型训练的方法、相关装置、设备及存储介质 | |
CN112434757A (zh) | 一种基于用户偏好的商标自动生成方法及系统 | |
CN115797642A (zh) | 基于一致性正则化与半监督领域自适应图像语义分割算法 | |
CN113344069B (zh) | 一种基于多维关系对齐的无监督视觉表征学习的图像分类方法 | |
CN113592045B (zh) | 从印刷体到手写体的模型自适应文本识别方法和系统 | |
CN115862015A (zh) | 文字识别系统的训练方法及装置、文字识别方法及装置 | |
CN114357165A (zh) | 一种基于深度学习网络的短文本分类方法 | |
Corso et al. | Graph-shifts: Natural image labeling by dynamic hierarchical computing | |
CN105279489B (zh) | 一种基于稀疏编码的视频指纹提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210416 |
|
RJ01 | Rejection of invention patent application after publication |