CN110909820B - 基于自监督学习的图像分类方法及系统 - Google Patents

基于自监督学习的图像分类方法及系统 Download PDF

Info

Publication number
CN110909820B
CN110909820B CN201911213999.7A CN201911213999A CN110909820B CN 110909820 B CN110909820 B CN 110909820B CN 201911213999 A CN201911213999 A CN 201911213999A CN 110909820 B CN110909820 B CN 110909820B
Authority
CN
China
Prior art keywords
image
label
unlabeled
classified
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911213999.7A
Other languages
English (en)
Other versions
CN110909820A (zh
Inventor
刘嵩
舒琦慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN201911213999.7A priority Critical patent/CN110909820B/zh
Publication of CN110909820A publication Critical patent/CN110909820A/zh
Application granted granted Critical
Publication of CN110909820B publication Critical patent/CN110909820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Abstract

本公开公开了基于自监督学习的图像分类方法及系统,获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;从所有待分类的无标签图像中划分出一部分作为训练集;对训练集中所有无标签图像的特征进行聚类处理,确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;基于训练集中每一个无标签图像所提取的特征和伪标签,对预训练的神经网络进行再训练;将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签。

Description

基于自监督学习的图像分类方法及系统
技术领域
本公开涉及图像分类技术领域,特别是涉及基于自监督学习的图像分类方法及系统。
背景技术
本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。
随着信息时代的到来,移动互联网、智能手机以及社交网络的发展带来了海量图片信息,不受地域和语言限制的图片逐渐取代了繁琐而微妙的文字,成为传词达意的主要媒介。海量的图片信息逐一浏览比较耗费时间,所以图像识别分类显得尤为重要。
在实现本公开的过程中,发明人发现现有技术中存在以下技术问题:
传统的图像识别分类方法在提取特征方面采用人工提取的方法,效率不高,时间长。深度学习近年来在图像和自然语言处理等方面表现出了良好的性能,比如卷积神经网络。现有的基于深度学习的图像分类算法中,有监督学习的算法需要有标签的图片才能准确的分类,而大多数的图片是没有标签的,人工标注成本高。
发明内容
为了解决现有技术的不足,本公开提供了基于自监督学习的图像分类方法及系统;
第一方面,本公开提供了基于自监督学习的图像分类方法;
基于自监督学习的图像分类方法,包括:
获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
从所有待分类的无标签图像中划分出一部分作为训练集;
对训练集中所有无标签图像的特征进行聚类处理,根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签。
第二方面,本公开还提供了基于自监督学习的图像分类系统;
基于自监督学习的图像分类系统,包括:
预处理模块,其被配置为:获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
特征提取模块,其被配置为:对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
训练集划分模块,其被配置为:从所有待分类的无标签图像中划分出一部分作为训练集;
聚类处理模块,其被配置为:对训练集中所有无标签图像的特征进行聚类处理,根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
训练模块,其被配置为:基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
分类模块,其被配置为:将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签。
第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。
第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。
与现有技术相比,本公开的有益效果是:
针对无标签的图像,自动提取图像特征进行聚类,聚类后打伪标签再利用深度学习的模型进行分类预测其他图像的类别。在不需要人工标注和人工提取特征的情况下,就能够对无标签的图像进行分类。该方法采用深度学习的方法提取特征不需要人工提取特征,能够解决无标签数据的分类识别问题并且能够减少人工成本,实现大多数种类的图像分类问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为第一个实施例的方法流程图;
图2(a)为第一个实施例的原图;
图2(b)为第一个实施例的灰度图;
图2(c)为第一个实施例的分割后的图;
图3为CRBM结构图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一,本实施例提供了基于自监督学习的图像分类方法;
如图1所示,基于自监督学习的图像分类方法,包括:
S1:获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
S2:对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
S3:从所有待分类的无标签图像中划分出一部分作为训练集;
S4:对训练集中所有无标签图像的特征进行聚类处理,根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
S5:基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
S6:将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签。
作为一个或多个实施例,所述S1中,对所有待分类的无标签图像进行预处理;具体步骤包括:采用Otsu阈值分割法对所有待分类的无标签图像进行分割,将每一个待分类的无标签图像分割为背景图像和目标图像。
进一步地,所述采用Otsu阈值分割法对所有待分类的无标签图像进行分割,将每一个待分类的无标签图像分割为背景图像和目标图像;具体步骤包括:
将彩色图像转换为灰度图像;
将灰度图像进行二值化处理,得到分割后的目标图像。
应理解的,所述S1中,为了提高对图像类别的判断,对原始图像进行预处理操作,将感兴趣区域分割出来,本公开中使用的彩色图像,只需要把背景和目标分为两部分,我们选用的是Otsu阈值分割法,Otsu使用的是聚类的思想,先把彩色图像转换为灰度图像,然后把图像的灰度数按灰度级分成2个部分。设原始图像为f(x,y),按照一定的准则在f(x,y)中找到特征值T,将图像分割为两部分分割后的图像为:b0=0,b1=1,即为通常说的图像二值化。原图像、灰度图和分割后的图片如图2(a)、图2(b)和图2(c)所示。
作为一个或多个实施例,所述S2中,对预处理后的每一个无标签图像进行特征提取;是指:对预处理后的每一个无标签图像,利用卷积受限玻尔兹曼机CRBM模型进行特征提取。
作为一个或多个实施例,所述卷积受限玻尔兹曼机CRBM模型,选用三层的卷积受限玻尔兹曼机CRBM(Convolutional Restricted Boltzmann Machine)模型进行特征提取。
进一步地,卷积受限玻尔兹曼机CRBM模型的能量函数为:
Figure BDA0002298976860000061
其中“*”为卷积操作符,wk表示第k个卷积核的权重,
Figure BDA0002298976860000062
表示第k个隐含层中的第i行第j个单元,vij表示可视层中第i行第j个单元,bk为第k个可视层到隐含层单元的偏置,c为隐含层到可视层单元的共享偏置。
基于能量函数的CRBM联合概率分布为:
Figure BDA0002298976860000063
其中,Z为归一化参数。CRBM同样采用层内无连接,层间全连接的方式构建而成,所以可视层与隐含层间的条件概率分布彼此独立。
可视层与隐含层的条件概率分布函数分别为:
Figure BDA0002298976860000064
P(vij=1|h)σ((∑kwk*hk)ij+c)  (4)。
应理解的,CRBM模型中第一个隐含层的卷积层的卷积核为5x5,第二个隐含层的卷积核为7x7,都是使用的是2x2最大池。CRBM由可视层与隐含层两部分构成,结构如图3所示。
作为一个或多个实施例,所述S3中,从所有待分类的无标签图像中划分出一部分作为训练集;例如,从所有待分类的无标签图像中划分出10%作为训练集。
作为一个或多个实施例,所述S4中,对训练集中所有无标签图像的特征进行聚类处理,是指:选用模糊C均值算法FCM,对训练集中所有无标签图像的特征进行聚类处理。
作为一个或多个实施例,所述S4中,所述伪标签,只是一个标签符号,为区分不同类别而设定,没有特殊意义,例如:标签1,标签2,……,标签N。
进一步地,所述对每个类别中的所有特征均打上对应的伪标签,是指:
每一个特征的类别归属于自身隶属度与聚类中心最近的聚类中心所对应的类别。
实验中我们用模糊C均值算法将数据集中提取的特征聚为10类(数据集中一共10种类别)。给数据打上伪标签,根据聚类中心与隶属度的关系,将数据的特征向量分为10类,每一个特征的类别归属于自身隶属度与聚类中心最近的聚类中心所对应的类别,然后为聚类中心打上伪标签。
本算法选用模糊C均值(FCM)算法对提取的特征聚类,根据聚类中心与隶属度的关系确定预训练提取的特征的类别,并对每个类别中的特征打上对应的伪标签。
FCM算法的目标函数表达式为:
Figure BDA0002298976860000071
式(5)中:xj表示第j个样本点,vi表示第i个聚类中心,uij表示第j个样本点相对于第i个聚类中心的隶属度,||xj-vi||2表示第j个样本点与第i个聚类中心之间的距离,γ表示熵的正则化参数,隶属度矩阵U∈RN×C由uij组成,聚类中心矩阵V∈Rd×C由vi组成。
根据拉格朗日法则,求解(5)式得到最优聚类中心V和隶属度U的迭代公式为:
Figure BDA0002298976860000081
Figure BDA0002298976860000082
作为一个或多个实施例,所述S5中,预训练的神经网络,是指预训练的神经网络VGG16。
作为一个或多个实施例,所述S5中,预训练的神经网络的训练步骤包括:将已知图像类别的ImageNet数据集,输入到神经网络VGG16中,对神经网络VGG16进行训练,得到预训练后的神经网络VGG16。
应理解的,利用已经在ImageNet数据集上训练好的VGG16网络结构,能够较快地收敛,将打好伪标签的数据集迁移到VGG16模型上训练时能够更快地分类识别。打好伪标签的数据在输入到已经在ImageNet数据集上训练好的VGG16网络时,伪标签是当真实标签使用的,在训练时同时输入少量有标签的数据微调VGG16网络。
本算法在公开数据集STL-10数据集和CIFAR-10数据集上进行了相关实验。STL-10数据集采用的是无标签的数据,CIFAR-10的像素从32x32调整为64x64,使数据集中的物体更接近于STL-10数据集中的物体,两个数据集都是分成10种类别。对比了本公开的基于自监督学习的OCFC算法模型和其他几个无监督模型在数据集上的准确度。这几个无监督模型主要是用卷积神经网络、卷积深度置信网络等模型对图像分类,与本文的基于自监督学习的OCFC算法模型有一定的可比性。如表1所示:
表1准确度表
Figure BDA0002298976860000091
从表1中可以看出本公开提出的基于自监督学习方法分类的准确率优于其他的无监督模型算法的分类准确率。
对图像做了分割预处理的分类效果优于未做图像预处理的效果,在聚类算法的选择上也做了对比实验,FCM在此数据集上聚类效果优于K-Means的聚类效果。
为了减少人工标注数据的麻烦,提高对未标注的数据的分类准确度,我们提出了一种基于自监督学习的图像分类算法。通过实验对比结果表明经过分割预处理的数据的分类准确度比未经过预处理的准确度高,并且本文提出的基于自监督学习的分类算法的准确度要优于其他无监督算法模型的分类准确度,该算法模型可以任意迁移到浅层模型或深层模型,并且该方法有效地避免了人工提取特征的复杂性,在STL-10数据集上的准确度达到82.7%。
无监督学习算法已经成为从数据中学习表示的有效工具。无监督学习相比于有监督学习,它不需要人工标注的数据就可以对无标签的数据进行处理。自监督学习是一种特殊目的的无监督学习,不同于传统的自编码器等方法,仅仅以重构输入为目的,而是通过学习可区别性的视觉特征得到目标标签。自监督学习将输入和输出当成一个完整的整体,它通过挖掘输入数据本身提供的信息,基于输入数据的某些部分预测其它部分。在达到预测目标的过程中,模型可以学习到数据本身的语义特征表示,这些特征表示可以进一步被用于其他任务当中。
实施例二,本实施例还提供了基于自监督学习的图像分类系统;
基于自监督学习的图像分类系统,包括:
预处理模块,其被配置为:获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
特征提取模块,其被配置为:对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
训练集划分模块,其被配置为:从所有待分类的无标签图像中划分出一部分作为训练集;
聚类处理模块,其被配置为:对训练集中所有无标签图像的特征进行聚类处理,根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
训练模块,其被配置为:基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
分类模块,其被配置为:将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签。
实施例三,本实施例还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一所述方法的步骤。
实施例四,本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述方法的步骤。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (4)

1.基于自监督学习的图像分类方法,其特征是,包括:
获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
对所有待分类的无标签图像进行预处理;具体步骤包括:采用Otsu阈值分割法对所有待分类的无标签图像进行分割,将每一个待分类的无标签图像分割为背景图像和目标图像;
所述采用Otsu阈值分割法对所有待分类的无标签图像进行分割,将每一个待分类的无标签图像分割为背景图像和目标图像;具体步骤包括:将彩色图像转换为灰度图像;将灰度图像进行二值化处理,得到分割后的目标图像;
对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
对预处理后的每一个无标签图像进行特征提取;是指:对预处理后的每一个无标签图像,利用卷积受限玻尔兹曼机CRBM模型进行特征提取;
所述卷积受限玻尔兹曼机CRBM模型,选用三层的卷积受限玻尔兹曼机CRBM模型进行特征提取;
卷积受限玻尔兹曼机CRBM模型的能量函数为:
Figure FDA0004058707790000011
其中,“*”为卷积操作符,wk表示第k个卷积核的权重,
Figure FDA0004058707790000012
表示第k个隐含层中的第i行第j个单元,vij表示可视层中第i行第j个单元,bk为第k个可视层到隐含层单元的偏置,c为隐含层到可视层单元的共享偏置;
基于能量函数的CRBM联合概率分布为:
Figure FDA0004058707790000013
其中,Z为归一化参数,CRBM同样采用层内无连接,层间全连接的方式构建而成,所以可视层与隐含层间的条件概率分布彼此独立;
可视层与隐含层的条件概率分布函数分别为:
Figure FDA0004058707790000021
P(vij=1|h)=σ((∑kwk*hk)ij+c)                   (4);
从所有待分类的无标签图像中划分出一部分作为训练集;
对训练集中所有无标签图像的特征进行聚类处理;对训练集中所有无标签图像的特征进行聚类处理,是指:选用模糊C均值算法FCM,对训练集中所有无标签图像的特征进行聚类处理;
用模糊C均值算法将数据集中提取的特征聚为10类;给数据打上伪标签,根据聚类中心与隶属度的关系,将数据的特征向量分为10类,每一个特征的类别归属于自身隶属度与聚类中心最近的聚类中心所对应的类别,然后为聚类中心打上伪标签;
选用模糊C均值算法对提取的特征聚类,根据聚类中心与隶属度的关系确定预训练提取的特征的类别,并对每个类别中的特征打上对应的伪标签;
模糊C均值算法的目标函数表达式为:
Figure FDA0004058707790000022
uij∈[0,1],
Figure FDA0004058707790000023
i∈[1,C],j∈[1,N]           (5)
式(5)中:xj表示第j个样本点,vi表示第i个聚类中心,uij表示第j个样本点相对于第i个聚类中心的隶属度,‖xj-vi2表示第j个样本点与第i个聚类中心之间的距离,γ表示熵的正则化参数,隶属度矩阵U∈RN×C由uij组成,聚类中心矩阵V∈Rd×C由vi组成;
根据拉格朗日法则,求解(5)式得到最优聚类中心V和隶属度U的迭代公式为:
Figure FDA0004058707790000031
Figure FDA0004058707790000032
根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
所述对每个类别中的所有特征均打上对应的伪标签,是指:每一个特征的类别归属于自身隶属度与聚类中心最近的聚类中心所对应的类别;
基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签;
预训练的神经网络,是指预训练的神经网络VGG16,预训练的神经网络的训练步骤包括:将已知图像类别的ImageNet数据集,输入到神经网络VGG16中,对神经网络VGG16进行训练,得到预训练后的神经网络VGG16。
2.采用如权利要求1所述的基于自监督学习的图像分类方法的基于自监督学习的图像分类系统,其特征是,包括:
预处理模块,其被配置为:获取待分类的无标签图像;对所有待分类的无标签图像进行预处理;
特征提取模块,其被配置为:对预处理后的每一个无标签图像进行特征提取;每一个无标签图像均得到与之对应的特征;
训练集划分模块,其被配置为:从所有待分类的无标签图像中划分出一部分作为训练集;
聚类处理模块,其被配置为:对训练集中所有无标签图像的特征进行聚类处理,根据聚类结果确定每个特征所对应的类别,并对每个类别中的所有特征均打上对应的伪标签;特征的伪标签即为特征所对应无标签图像的伪标签;
训练模块,其被配置为:基于训练集中每一个无标签图像所提取的特征和每一个无标签图像的伪标签,对预训练的神经网络进行再训练;得到再训练后的神经网络;
分类模块,其被配置为:将所有待分类的无标签图像的特征均输入到优化训练后的神经网络中,输出每一个待分类的无标签图像的伪标签;
对预处理后的每一个无标签图像进行特征提取;是指:对预处理后的每一个无标签图像,利用卷积受限玻尔兹曼机CRBM模型进行特征提取;
预训练的神经网络,是指预训练的神经网络VGG16,预训练的神经网络的训练步骤包括:将已知图像类别的ImageNet数据集,输入到神经网络VGG16中,对神经网络VGG16进行训练,得到预训练后的神经网络VGG16。
3.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1所述的方法。
4.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1所述的方法。
CN201911213999.7A 2019-12-02 2019-12-02 基于自监督学习的图像分类方法及系统 Active CN110909820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911213999.7A CN110909820B (zh) 2019-12-02 2019-12-02 基于自监督学习的图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911213999.7A CN110909820B (zh) 2019-12-02 2019-12-02 基于自监督学习的图像分类方法及系统

Publications (2)

Publication Number Publication Date
CN110909820A CN110909820A (zh) 2020-03-24
CN110909820B true CN110909820B (zh) 2023-04-07

Family

ID=69821551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911213999.7A Active CN110909820B (zh) 2019-12-02 2019-12-02 基于自监督学习的图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN110909820B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860596B (zh) * 2020-06-17 2023-11-07 长安大学 基于深度学习的无监督路面裂缝分类方法及模型建立方法
CN111898650A (zh) * 2020-07-08 2020-11-06 国网浙江省电力有限公司杭州供电公司 基于深度学习的营配用数据自动聚类分析设备及方法
CN112016633A (zh) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN112215275A (zh) * 2020-09-30 2021-01-12 佛山科学技术学院 一种适于K-means算法的图像处理系统和方法,及记录介质
CN112200245A (zh) * 2020-10-10 2021-01-08 深圳市华付信息技术有限公司 一种基于半监督的图像分类方法
CN112381116B (zh) * 2020-10-21 2022-10-28 福州大学 基于对比学习的自监督图像分类方法
CN112381831B (zh) * 2020-11-26 2022-08-16 南开大学 基于图像间语义辅助的个性化图像分割方法及系统
CN113191385B (zh) * 2021-03-25 2022-06-03 之江实验室 一种基于预训练标注数据不可知的图像分类自动标注方法
CN113159050B (zh) * 2021-04-23 2023-03-10 广东工业大学 一种冠状动脉ct影像深度聚类和分割方法及系统
CN113177566B (zh) * 2021-05-26 2024-03-12 全球能源互联网研究院有限公司 一种特征提取模型训练方法、装置及计算机设备
CN113222055B (zh) * 2021-05-28 2023-01-10 新疆爱华盈通信息技术有限公司 一种图像分类方法、装置、电子设备及存储介质
CN113360648A (zh) * 2021-06-03 2021-09-07 山东大学 基于相关性图学习的案由分类方法及系统
CN113205163B (zh) * 2021-07-07 2021-11-19 数据堂(北京)科技股份有限公司 数据标注方法及装置
CN115910099B (zh) * 2022-11-08 2023-08-04 中国矿业大学 一种基于深度概率图神经网络的乐器自动识别方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197666A (zh) * 2018-01-30 2018-06-22 咪咕文化科技有限公司 一种图像分类模型的处理方法、装置及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11669724B2 (en) * 2018-05-17 2023-06-06 Raytheon Company Machine learning using informed pseudolabels
CN108805208B (zh) * 2018-06-13 2021-12-31 哈尔滨工业大学 一种基于无标签样本一致性判定的协同训练方法
CN108985334B (zh) * 2018-06-15 2022-04-12 拓元(广州)智慧科技有限公司 基于自监督过程改进主动学习的通用物体检测系统及方法
CN109583297B (zh) * 2018-10-25 2020-10-02 清华大学 视网膜oct体数据识别方法及装置
CN109816030A (zh) * 2019-01-30 2019-05-28 河南科技大学 一种基于受限玻尔兹曼机的图像分类方法及装置
CN109977802A (zh) * 2019-03-08 2019-07-05 武汉大学 强噪音背景下作物分类识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197666A (zh) * 2018-01-30 2018-06-22 咪咕文化科技有限公司 一种图像分类模型的处理方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张娟 等.基于卷积受限玻尔兹曼机的医学图像分类新方法.计算机工程与科学.2017,(第02期),全文. *

Also Published As

Publication number Publication date
CN110909820A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110909820B (zh) 基于自监督学习的图像分类方法及系统
CN110309331B (zh) 一种基于自监督的跨模态深度哈希检索方法
CN109255364B (zh) 一种基于深度卷积生成对抗网络的场景识别方法
US10846566B2 (en) Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks
CN106845510B (zh) 基于深度层级特征融合的中国传统视觉文化符号识别方法
CN107133569B (zh) 基于泛化多标记学习的监控视频多粒度标注方法
CN110321967B (zh) 基于卷积神经网络的图像分类改进方法
CN113408605B (zh) 基于小样本学习的高光谱图像半监督分类方法
CN109711448A (zh) 基于判别关键域和深度学习的植物图像细粒度分类方法
CN110647907B (zh) 利用多层分类和字典学习的多标签图像分类算法
CN109033978B (zh) 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN111476315A (zh) 一种基于统计相关性与图卷积技术的图像多标签识别方法
CN111125406A (zh) 一种基于自适应聚类学习的视觉关系检测方法
CN105279519A (zh) 基于协同训练半监督学习的遥感影像水体提取方法及系统
CN109685065A (zh) 试卷内容自动分类的版面分析方法、系统
CN111931562A (zh) 一种基于软标签回归的无监督特征选择方法和系统
Kim et al. A shape preserving approach for salient object detection using convolutional neural networks
CN115439715A (zh) 基于反标签学习的半监督少样本图像分类学习方法及系统
Liu et al. Iterative deep neighborhood: a deep learning model which involves both input data points and their neighbors
CN105844299B (zh) 一种基于词袋模型的图像分类方法
CN116910571A (zh) 一种基于原型对比学习的开集域适应方法及系统
CN116681961A (zh) 基于半监督方法和噪声处理的弱监督目标检测方法
CN108460406B (zh) 基于最小单纯形融合特征学习的场景图像属性识别方法
CN113516118B (zh) 一种图像与文本联合嵌入的多模态文化资源加工方法
Chu et al. Automatic image annotation combining svms and knn algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant