CN114373097A - 一种基于无监督的图像分类方法、终端设备及存储介质 - Google Patents

一种基于无监督的图像分类方法、终端设备及存储介质 Download PDF

Info

Publication number
CN114373097A
CN114373097A CN202111532343.9A CN202111532343A CN114373097A CN 114373097 A CN114373097 A CN 114373097A CN 202111532343 A CN202111532343 A CN 202111532343A CN 114373097 A CN114373097 A CN 114373097A
Authority
CN
China
Prior art keywords
model
gaussian
classification
sample
unsupervised
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111532343.9A
Other languages
English (en)
Inventor
黄仁裕
高志鹏
赵建强
郭小强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202111532343.9A priority Critical patent/CN114373097A/zh
Publication of CN114373097A publication Critical patent/CN114373097A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于无监督的图像分类方法、终端设备及存储介质,该方法中包括:S1:采集已标注图像组成训练集;S2:构建图像分类模型,通过训练集对图像分类模型进行训练,将训练后的模型作为初始模型;S3:采集未标注图像输入初始模型,并将初始模型输出的类别标注为各未标注图像的伪标签后,添加至训练集内;S4:在基础模型对应的分类网络之后添加高斯混合模型组成错误分类识别模型;S5:通过训练集对错误分类识别模型进行训练,基于训练后的错误分类识别模型中的分类网络构建最终分类模型;S6:通过最终分类模型对图像进行分类。本发明不仅可以得到更加准确的类标,而且提升了在带噪声样本集训练的模型的准确率。

Description

一种基于无监督的图像分类方法、终端设备及存储介质
技术领域
本发明涉及图像处理领域,尤其涉及一种基于无监督的图像分类方法、终端设备及存储介质。
背景技术
随着深度学习所需要的数据量越来越大,人工标注成本越来越高,导致很多数据集无法及时得到清洗。在噪声比例比较大时,模型的表现直线式下滑。针对该问题,主动学习和无监督学习在一定程度上缓解了该问题。主动学习在模型初始阶段也只需要少量的标注样本进行模型训练并得到初始模型,然后使用初始模型推理大量的未标注的数据,然后根据一些机器学习方法获取难以分辨的样本,然后人工对这些较难的样本进行审核,审核完成后的样本加入要原始标注过的样本集中再次模型训练,重复模型学习、人工审核、结合难样本再次模型学习。而在无监督学习中,首先使用人工标注过的样本进行学习教师模型,使用教师生成无标签图像上的伪标签,对学生模型进行真实标签图像与伪标签图像的组合训练,再通过将该学生视为教师来重新标记未标记的数据并培训新学生,从而多次迭代此算法。在处理带噪声训练样本时,主动学习和现有的无监督学习都可以缓解样本的噪声标签问题,提升了在噪声下模型训练的准确性。
主动学习和无监督学习可以很好地应用到图像分类中,但主动学习每次只审核和再训练难拟合的样本,对于容易拟合的样本视而不见,在选择需要人工审核的样本时,一些错误样本在已经训练好的模型下的损失很小,导致很难被人工审核到,而这些很有价值的样本长时间无法进行训练,导致模型难以拟合整个样本分布空间。而现有的噪声标签的无监督学习,在每次生成伪标签后,直接结合人工标注过的样本进行学习,放大了伪标签的权重,在交叉熵损失情况下会把错误的标签拟合的很完美,导致用模型进行重标伪标签时把一些样本打上错误的标签。现有技术中,虽然使用了预测概率的期望作为统计信息,但同样存在模型会过噪声标签过拟合的问题,但噪声标签过拟合后,其概率会大于阈值,无法纠正该情况下的样本。
发明内容
为了解决上述问题,本发明提出了一种基于无监督的图像分类方法、终端设备及存储介质。
具体方案如下:
一种基于无监督的图像分类方法,包括以下步骤:
S1:采集已标注图像组成训练集;
S2:构建图像分类模型,通过训练集对图像分类模型进行训练,将训练后的模型作为初始模型;
S3:采集未标注图像输入初始模型,并将初始模型输出的类别标注为各未标注图像的伪标签后,添加至训练集内;
S4:在基础模型对应的分类网络之后添加高斯混合模型组成错误分类识别模型,以估计样本被错误分类的概率;
S5:通过训练集对错误分类识别模型进行训练,以使损失函数最小,基于训练后的错误分类识别模型中的分类网络构建最终分类模型;
S6:通过最终分类模型对图像进行分类。
进一步的,步骤S1中还包括对训练集中的各图像进行数据增强。
进一步的,数据增强包括翻转、旋转、裁剪、变形、缩放、扭曲、添加噪声、模糊、颜色变换、随机擦除和随机填充中的一种或多种。
进一步的,步骤S2构建的图像分类模型的网络架构采用卷积神经网络,模型的损失函数采用交叉熵损失函数。
进一步的,高斯混合模型表示为:
Figure BDA0003411822390000031
其中,K表示混合模型中包含的高斯模型分量的个数,N(x|μkk)表示样本x经过第k个高斯模型分量的输出结果,p(x)表示样本x经过高斯混合模型的输出结果,μk和Σk分别表示第k个高斯模型分量的均值和协方差,πk表示第k个高斯模型分量的混合系数。
进一步的,高斯混合模型中包含的高斯模型分量的个数大于分类网络输出的标签个数。
进一步的,错误分类识别模型中的分类网络的参数初始化为基础模型对应的参数。
进一步的,步骤S5中通过训练集对错误分类识别模型进行训练的过程包括:
S501:计算每个样本的交叉熵损失;
S502:对计算的交叉熵损失的值进行归一化处理;
S503:计算每个样本经过高斯混合模型中的每个高斯模型分量的后验概率;
第i个样本经过高斯混合模型中的第k个高斯模型分量的后验概率γ(zik)的计算公式为:
Figure BDA0003411822390000041
其中,N(xikk)表示第i个样本xi经过高斯混合模型中的第k个高斯模型分量,μk和Σk分别表示第k个高斯模型分量的均值和协方差,πk表示第k个高斯模型分量的混合系数,K表示高斯混合模型中包含的高斯模型分量的总数,j表示高斯模型分量的序号,μj和Σj分别表示第j个高斯模型分量的均值和协方差,πj表示第k个高斯模型分量的混合系数;
S504:根据计算的后验概率更新高斯混合模型中每个高斯模型分量中的参数值;具体更新公式为:
Figure BDA0003411822390000042
Figure BDA0003411822390000043
Figure BDA0003411822390000044
Figure BDA0003411822390000045
其中,i和n均表示样本的序号,xn表示第n个样本,Nk表示前i个样本经过第k个高斯模型分量的后验概率之和,
Figure BDA0003411822390000046
Figure BDA0003411822390000047
分别表示更新后的第k个高斯模型分量的均值和协方差,
Figure BDA0003411822390000048
表示更新后的第k个高斯模型分量的混合系数,γ(znk)表示第n个样本经过高斯混合模型中的第k个高斯模型分量的后验概率,T表示转置;
S505:计算错误分类识别模型的损失loss;
Figure BDA0003411822390000051
其中,N表示样本总数,hi′表示经过归一化处理后的第i个样本的交叉熵损失,zi表示错误分类识别模型中的分类网络预测的样本的类别,yi表示样本的真实类别标签,wi表示第i个样本被错误分类的概率;
S506:重复步骤S501-S505,直到错误分类识别模型的损失loss最小。
进一步的,步骤S501中第i个样本的交叉熵损失hi的计算公式为:
Figure BDA0003411822390000052
其中,M表示分类类别数;c表示0到M之间的一个类别;yci表示第i个样本属于类别c的置信度,如果样本的真实类别等于c则取1,否则取0;pci表示第i个样本属于类别c的预测值。
进一步的,步骤S502中归一化处理采用阶段函数进行,即:
Figure BDA0003411822390000053
其中,hi表示第i个样本的交叉熵损失。
一种基于无监督的图像分类终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
本发明采用如上技术方案,不仅可以得到更加准确的类标,而且提升了在带噪声样本集训练的模型的准确率。
附图说明
图1所示为本发明实施例一的流程图。
图2所示为该实施例中错误分类识别模型的网络结构示意图。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
现结合附图和具体实施方式对本发明进一步说明。
实施例一:
本发明实施例提供了一种基于无监督的图像分类方法,如图1所示,所述方法包括以下步骤:
S1:采集已标注图像组成训练集。
该实施例中还包括对训练集中的图像进行数据增强,数据增强包括翻转、旋转、裁剪、变形、缩放、扭曲、添加噪声、模糊、颜色变换、随机擦除、随机填充等。通过数据增强可以扩充训练集中样本的数量。
S2:构建图像分类模型,通过训练集对图像分类模型进行训练,将训练后的模型作为初始模型。
该实施例中图像分类模型的网络架构采用卷积神经网络,模型的损失函数采用交叉熵损失函数,训练过程中,设定权重的丢弃率为一较大的值,如0.8。在其他实施例中图像分类模型也可以采用其他网络架构,在此不做限定。
S3:采集未标注图像输入初始模型,并将初始模型输出的类别标注为各未标注图像的伪标签后,添加至训练集内。
经过步骤S3处理后,训练集中既包括具有准确标签的已标注图像,又包括具有伪标签的图像,由于伪标签不一定准确,因此训练集中包含大量的错误标签图像。
S4:在基础模型对应的分类网络之后添加高斯混合模型组成错误分类识别模型(如图2所示),以估计样本被错误分类的概率。
高斯混合模型表示为:
Figure BDA0003411822390000071
其中,K表示混合模型中包含的高斯模型分量的个数,N(x|μkk)表示样本x经过第k个高斯模型分量的输出结果,p(x)表示样本x经过高斯混合模型的输出结果,μk和Σk分别表示第k个高斯模型分量的均值和协方差,πk表示第k个高斯模型分量的混合系数,也就是每个高斯模型分量被选中的概率,满足
Figure BDA0003411822390000072
Figure BDA0003411822390000073
每个高斯模型分量均为一个高斯分布模型,在混合高斯模型中高斯模型分量的个数与前面的分类网络的输出标签个数相关,但一定要保证选取的高斯模型分量个数大于分类网络的输出标签个数。
在初始化过程中,将分类网络的参数初始化为基础模型对应的参数。在对高斯混合模型进行初始化时,首先选定混合模型中包含的高斯模型分量的个数K,然后依次对每个高斯模型分量对应的参数πk、μk、Σk进行初始化。
S5:通过训练集对错误分类识别模型进行训练,以使损失函数最小,基于训练后的错误分类识别模型中的分类网络构建最终分类模型。
该实施例中通过训练集对错误分类识别模型进行训练的过程包括:
S501:计算每个样本的交叉熵损失。
第i个样本的交叉熵损失hi的计算公式为:
Figure BDA0003411822390000081
其中,M表示分类类别数;c表示0到M之间的一个类别;yci表示第i个样本属于类别c的置信度,如果样本的真实类别等于c则取1,否则取0;pci表示第i个样本属于类别c的预测值。
S502:对计算的交叉熵损失的值进行归一化处理。
该实施例中归一化处理采用阶段函数进行,即:
Figure BDA0003411822390000082
其中,hi′表示经过归一化处理后的第i个样本的交叉熵损失。
S503:计算每个样本经过高斯混合模型中的每个高斯模型分量的后验概率;
第i个样本经过高斯混合模型中的第k个高斯模型分量的后验概率γ(zik)的计算公式为:
Figure BDA0003411822390000083
其中,N(xikk)表示第i个样本xi经过高斯混合模型中的第k个高斯模型分量,μk和Σk分别表示第k个高斯模型分量的均值和协方差,πk表示第k个高斯模型分量的混合系数,K表示高斯混合模型中包含的高斯模型分量的总数,j表示高斯模型分量的序号,μj和Σj分别表示第j个高斯模型分量的均值和协方差,πj表示第k个高斯模型分量的混合系数。
S504:根据计算的后验概率更新高斯混合模型中每个高斯模型分量中的参数值;具体更新公式为:
Figure BDA0003411822390000091
Figure BDA0003411822390000092
Figure BDA0003411822390000093
Figure BDA0003411822390000094
其中,i和n均表示样本的序号,xn表示第n个样本,Nk表示前i个样本经过第k个高斯模型分量的后验概率之和,
Figure BDA0003411822390000095
Figure BDA0003411822390000096
分别表示更新后的第k个高斯模型分量的均值和协方差,
Figure BDA0003411822390000097
表示更新后的第k个高斯模型分量的混合系数,γ(znk)表示第n个样本经过高斯混合模型中的第k个高斯模型分量的后验概率,T表示转置。
S505:计算错误分类识别模型的损失loss。
该实施例中设定错误分类识别模型的损失loss为感知损失,其根据标准交叉熵损失和后验概率γ(zik)进行计算,在标准交叉熵损失的基础上添加一个感知项,可以用于纠正训练目标,具体计算公式为:
Figure BDA0003411822390000098
其中,N表示样本总数,hi′表示经过归一化处理后的第i个样本的交叉熵损失,zi表示错误分类识别模型中的分类网络预测的样本的类别,yi表示样本的真实类别标签,wi表示第i个样本被错误分类的概率。
S506:重复步骤S501-S505,直到错误分类识别模型的损失loss最小。
S6:通过最终分类模型对图像进行分类。
试验结果
本实施例中使用了10个类别,共50000张图片作为训练样本,5000张图片作为测试样本,在直接使用交叉熵损失的训练结果与本实施例方法的训练结果在不同程度的标签噪声下的精度对比如表1所示。
表1
方法/标签噪声程度 0% 20% 50% 80%
标准交叉熵损失 93% 81% 55% 25%
本实施例方法方法 93% 83% 68% 55%
本发明实施例在分类网络分类器后的softmax loss输出值基础上,使用高斯混合模型来预测样本标签是否为噪声标签,判断样本的输入标签和分类网络的预测标签是否一致,比直接使用softmax loss输出值来划分阈值更加准确。
本发明实施例使用感知损失来调整输入标签和分类网络的预测标签的权重比例,修正损失值,提高了网络在高噪声标签下的分类精度。
实施例二:
本发明还提供一种基于无监督的图像分类终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
进一步地,作为一个可执行方案,所述基于无监督的图像分类终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述基于无监督的图像分类终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述基于无监督的图像分类终端设备的组成结构仅仅是基于无监督的图像分类终端设备的示例,并不构成对基于无监督的图像分类终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于无监督的图像分类终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于无监督的图像分类终端设备的控制中心,利用各种接口和线路连接整个基于无监督的图像分类终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于无监督的图像分类终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
所述基于无监督的图像分类终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)以及软件分发介质等。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。

Claims (12)

1.一种基于无监督的图像分类方法,其特征在于,包括以下步骤:
S1:采集已标注图像组成训练集;
S2:构建图像分类模型,通过训练集对图像分类模型进行训练,将训练后的模型作为初始模型;
S3:采集未标注图像输入初始模型,并将初始模型输出的类别标注为各未标注图像的伪标签后,添加至训练集内;
S4:在基础模型对应的分类网络之后添加高斯混合模型组成错误分类识别模型,以估计样本被错误分类的概率;
S5:通过训练集对错误分类识别模型进行训练,以使损失函数最小,基于训练后的错误分类识别模型中的分类网络构建最终分类模型;
S6:通过最终分类模型对图像进行分类。
2.根据权利要求1所述的基于无监督的图像分类方法,其特征在于:步骤S1中还包括对训练集中的各图像进行数据增强。
3.根据权利要求2所述的基于无监督的图像分类方法,其特征在于:数据增强包括翻转、旋转、裁剪、变形、缩放、扭曲、添加噪声、模糊、颜色变换、随机擦除和随机填充中的一种或多种。
4.根据权利要求1所述的基于无监督的图像分类方法,其特征在于:步骤S2构建的图像分类模型的网络架构采用卷积神经网络,模型的损失函数采用交叉熵损失函数。
5.根据权利要求1所述的基于无监督的图像分类方法,其特征在于:高斯混合模型表示为:
Figure FDA0003411822380000021
其中,K表示混合模型中包含的高斯模型分量的个数,N(x|μkk)表示样本x经过第k个高斯模型分量的输出结果,p(x)表示样本x经过高斯混合模型的输出结果,μk和Σk分别表示第k个高斯模型分量的均值和协方差,πk表示第k个高斯模型分量的混合系数。
6.根据权利要求5所述的基于无监督的图像分类方法,其特征在于:高斯混合模型中包含的高斯模型分量的个数大于分类网络输出的标签个数。
7.根据权利要求1所述的基于无监督的图像分类方法,其特征在于:错误分类识别模型中的分类网络的参数初始化为基础模型对应的参数。
8.根据权利要求1所述的基于无监督的图像分类方法,其特征在于:步骤S5中通过训练集对错误分类识别模型进行训练的过程包括:
S501:计算每个样本的交叉熵损失;
S502:对计算的交叉熵损失的值进行归一化处理;
S503:计算每个样本经过高斯混合模型中的每个高斯模型分量的后验概率;
第i个样本经过高斯混合模型中的第k个高斯模型分量的后验概率γ(zik)的计算公式为:
Figure FDA0003411822380000022
其中,N(xikk)表示第i个样本xi经过高斯混合模型中的第k个高斯模型分量,μk和Σk分别表示第k个高斯模型分量的均值和协方差,πk表示第k个高斯模型分量的混合系数,K表示高斯混合模型中包含的高斯模型分量的总数,j表示高斯模型分量的序号,μj和Σj分别表示第j个高斯模型分量的均值和协方差,πj表示第k个高斯模型分量的混合系数;
S504:根据计算的后验概率更新高斯混合模型中每个高斯模型分量中的参数值;具体更新公式为:
Figure FDA0003411822380000031
Figure FDA0003411822380000032
Figure FDA0003411822380000033
Figure FDA0003411822380000034
其中,i和n均表示样本的序号,xn表示第n个样本,Nk表示前i个样本经过第k个高斯模型分量的后验概率之和,
Figure FDA0003411822380000035
Figure FDA0003411822380000036
分别表示更新后的第k个高斯模型分量的均值和协方差,
Figure FDA0003411822380000037
表示更新后的第k个高斯模型分量的混合系数,γ(znk)表示第n个样本经过高斯混合模型中的第k个高斯模型分量的后验概率,T表示转置;
S505:计算错误分类识别模型的损失loss;
Figure FDA0003411822380000038
其中,N表示样本总数,hi′表示经过归一化处理后的第i个样本的交叉熵损失,zi表示错误分类识别模型中的分类网络预测的样本的类别,yi表示样本的真实类别标签,wi表示第i个样本被错误分类的概率;
S506:重复步骤S501-S505,直到错误分类识别模型的损失loss最小。
9.根据权利要求8所述的基于无监督的图像分类方法,其特征在于:步骤S501中第i个样本的交叉熵损失hi的计算公式为:
Figure FDA0003411822380000041
其中,M表示分类类别数;c表示0到M之间的一个类别;yci表示第i个样本属于类别c的置信度,如果样本的真实类别等于c则取1,否则取0;pci表示第i个样本属于类别c的预测值。
10.根据权利要求8所述的基于无监督的图像分类方法,其特征在于:步骤S502中归一化处理采用阶段函数进行,即:
Figure FDA0003411822380000042
其中,hi表示第i个样本的交叉熵损失。
11.一种基于无监督的图像分类终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~10中任一所述方法的步骤。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1~10中任一所述方法的步骤。
CN202111532343.9A 2021-12-15 2021-12-15 一种基于无监督的图像分类方法、终端设备及存储介质 Pending CN114373097A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111532343.9A CN114373097A (zh) 2021-12-15 2021-12-15 一种基于无监督的图像分类方法、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111532343.9A CN114373097A (zh) 2021-12-15 2021-12-15 一种基于无监督的图像分类方法、终端设备及存储介质

Publications (1)

Publication Number Publication Date
CN114373097A true CN114373097A (zh) 2022-04-19

Family

ID=81141005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111532343.9A Pending CN114373097A (zh) 2021-12-15 2021-12-15 一种基于无监督的图像分类方法、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN114373097A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117474903A (zh) * 2023-12-26 2024-01-30 浪潮电子信息产业股份有限公司 一种图像侵权检测方法、装置、设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117474903A (zh) * 2023-12-26 2024-01-30 浪潮电子信息产业股份有限公司 一种图像侵权检测方法、装置、设备及可读存储介质
CN117474903B (zh) * 2023-12-26 2024-03-22 浪潮电子信息产业股份有限公司 一种图像侵权检测方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
Greenberg et al. Automatic posterior transformation for likelihood-free inference
Berman et al. The lovász-softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks
CN108416370B (zh) 基于半监督深度学习的图像分类方法、装置和存储介质
CN108764195B (zh) 手写模型训练方法、手写字识别方法、装置、设备及介质
US11562591B2 (en) Computer vision systems and methods for information extraction from text images using evidence grounding techniques
Kuck et al. Learning about individuals from group statistics
CN108537102B (zh) 基于稀疏特征与条件随机场的高分辨sar图像分类方法
US10984272B1 (en) Defense against adversarial attacks on neural networks
CN112116599B (zh) 基于弱监督学习的痰涂片结核杆菌语义分割方法及系统
Shrivastava et al. Learning discriminative dictionaries with partially labeled data
US20170076152A1 (en) Determining a text string based on visual features of a shred
US20210319340A1 (en) Machine learning model confidence score validation
Tao et al. Hierarchical attention-based recurrent highway networks for time series prediction
US20050097068A1 (en) Invariant pattern recognition
CN108133224B (zh) 用于评估分类任务复杂度的方法
CN111223128A (zh) 目标跟踪方法、装置、设备及存储介质
US11625612B2 (en) Systems and methods for domain adaptation
CN115147607A (zh) 一种基于凸优化理论的抗噪声零样本图像分类方法
WO2023088174A1 (zh) 目标检测方法及装置
CN112132257A (zh) 基于金字塔池化及长期记忆结构的神经网络模型训练方法
CN114373097A (zh) 一种基于无监督的图像分类方法、终端设备及存储介质
EP3627403A1 (en) Training of a one-shot learning classifier
US20240152749A1 (en) Continual learning neural network system training for classification type tasks
CN107563287B (zh) 人脸识别方法和装置
Kishan et al. Handwritten character recognition using CNN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination