CN113378853A - 一种图像分类方法、装置、设备及存储介质 - Google Patents
一种图像分类方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113378853A CN113378853A CN202110573578.6A CN202110573578A CN113378853A CN 113378853 A CN113378853 A CN 113378853A CN 202110573578 A CN202110573578 A CN 202110573578A CN 113378853 A CN113378853 A CN 113378853A
- Authority
- CN
- China
- Prior art keywords
- image
- training
- feature
- classification
- sample size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000012549 training Methods 0.000 claims abstract description 292
- 238000013145 classification model Methods 0.000 claims abstract description 94
- 230000006870 function Effects 0.000 claims description 27
- 230000000694 effects Effects 0.000 abstract description 20
- 238000003062 neural network model Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011022 operating instruction Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种图像分类方法、装置、设备及存储介质,方法包括:获取目标图像;将目标图像输入到图像分类模型,得到图像分类模型输出的分类结果,图像分类模型根据包括特征类别标签的多个训练图像训练得到,在训练的过程中,图像分类模型的罗吉特logit参数的调整量与训练图像的分类准确度呈负相关关系,根据分类结果,确定目标图像的特征类别。本申请实施例在图像分类模型训练过程中,对训练图像的分类准确度较低的训练图像对应的类别进行更大的罗吉特logit参数调整,对训练图像的分类准确度较高的训练图像对应的类别进行较小的logit参数调整,使得图像分类模型对训练图像的分类准确度较低的训练图像更加关注,图像分类效果增强。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种图像分类方法、装置、设备及存储介质。
背景技术
随着计算机技术的快速发展,机器学习领域也有了很多的技术进步。在机器学习领域主要是训练神经网络模型来预测或处理某些数据,来代替重复的人工操作,例如训练神经网络模型来实现计算机视觉、语音识别、自然语言处理或图像分类。
在训练神经网络进行图像分类时,存在一个很重要的问题:不同图像类别的数据样本不均衡分布。不同图像类别的数据样本不均衡分布会导致在机器学习过程中,分类结果会比较偏向样本数较多的类别,样本数较少的类别分类准确度较低,分类效果较差。
发明内容
为了解决现有技术由于不同图像类别的数据样本不均衡分布导致分类效果较差的问题,本申请提出了一种图像分类方法、装置、设备及存储介质。
本申请实施例提供一种图像分类方法,所述方法包括:
获取目标图像;
将所述目标图像输入到图像分类模型,得到所述图像分类模型输出的分类结果,所述图像分类模型根据包括特征类别标签的多个训练图像训练得到,所述特征类别标签根据所述训练图像的图像特征确定,且在训练的过程中,所述图像分类模型的罗吉特logit参数的调整量与所述训练图像的分类准确度呈负相关关系,所述logit参数表达所述训练图像属于每个所述特征类别标签对应的特征类别的置信度的相对值;
根据所述分类结果,确定所述目标图像的特征类别。
可选的,所述训练图像的分类准确度表示为所述训练图像的特征向量与所述训练图像的特征类别的中心向量之间的夹角的余弦值。
可选的,所述训练图像的分类准确度表示为所述训练图像属于对应特征类别标签的特征类别的概率。
可选的,所述logit参数的调整量还与所述训练图像的特征类别标签对应的样本量呈负相关关系。
可选的,所述训练图像还包括对应的样本量类别标签,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别标签根据所述特征类别标签对应的样本量确定;
所述图像分类模型的logit参数的调整量根据所述样本量类别标签确定。
可选的,在训练的过程中,所述方法还包括:
根据所述训练图像的特征类别对应的样本量的大小对所述特征类别进行排序;
根据排序结果将多个训练图像划分为多个样本量类别。
可选的,所述图像分类模型的损失函数根据每个训练图像对应的logit参数和所述训练图像对应的权重得到,其中,所述训练图像对应的权重与所述训练图像的特征类别标签对应的样本量呈负相关关系。
本申请实施例还提供一种图像分类装置,所述装置包括:
获取单元,用于获取目标图像;
输入单元,用于将所述目标图像输入到图像分类模型,得到所述图像分类模型输出的分类结果,所述图像分类模型根据包括特征类别标签的多个训练图像训练得到,所述特征类别标签根据所述训练图像的图像特征确定,且在训练的过程中,所述图像分类模型的罗吉特logit参数的调整量与所述训练图像的分类准确度呈负相关关系,所述logit参数表达所述训练图像属于每个所述特征类别标签对应的特征类别的置信度的相对值;
确定单元,用于根据所述分类结果,确定所述目标图像的特征类别。
可选的,所述训练图像的分类准确度表示为所述训练图像的特征向量与所述训练图像的特征类别的中心向量之间的夹角的余弦值。
可选的,所述训练图像的分类准确度表示为所述训练图像属于对应特征类别标签的特征类别的概率。
可选的,所述logit参数的调整量还与所述训练图像的特征类别标签对应的样本量呈负相关关系。
可选的,所述训练图像还包括对应的样本量类别标签,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别标签根据所述特征类别标签对应的样本量确定;
所述图像分类模型的logit参数的调整量根据所述样本量类别标签确定。
可选的,在训练的过程中,所述装置还包括:
排序单元,用于根据所述训练图像的特征类别对应的样本量的大小对所述特征类别进行排序;
划分单元,用于根据排序结果将多个训练图像划分为多个样本量类别。
可选的,所述图像分类模型的损失函数根据每个训练图像对应的logit参数和所述训练图像对应的权重得到,其中,所述训练图像对应的权重与所述训练图像的特征类别标签对应的样本量呈负相关关系。
本申请实施例还提供一种图像分类设备,所述设备包括:处理器和存储器;
所述存储器,用于存储指令;
所述处理器,用于执行所述存储器中的所述指令,执行上述实施例所述的方法。
本申请实施例还提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述实施例所述的方法。在本申请的实施例中,利用图像分类模型对目标图像进行类别识别,图像分类模型在训练过程中,对训练图像的分类准确度较低的训练图像对应的类别进行更大的罗吉特logit参数调整,对训练图像的分类准确度较高的训练图像对应的类别进行较小的logit参数调整,使得图像分类模型对训练图像的分类准确度较低的训练图像更加关注,图像分类效果增强。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种模型训练方法的流程图;
图2为本申请提供的一种图像分类方法的流程图;
图3为本申请提供的一种图像分类装置的结构图;
图4为本申请提供的一种图像分类设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
当前,在机器学习领域包括图像的分类问题,例如可以将某一类图像分类为人物、动物、景物等。图像分类可以分为很多类别,每个类别的样本量不相同,即样本量分布不均衡。在样本量不均衡的情况下,训练得到的神经网络模型往往会偏向样本量大的类别,也就是说,样本量较大的类别分类准确度较高,分类效果较好,而样本量小的类别分类准确度较低,分类效果较差。
现有的对图像分类训练的神经网络模型,通常是将多个类别的全部样本量的训练图像作为神经网络模型的输入,该神经网络模型针对多个类别的全部样本量都采用相同的损失函数进行训练,得到神经网络模型的输出结果。但是由于现有技术中的神经网络模型内部针对其输入的所有类别的训练图像均采用相同的损失函数,即对所有类别的训练图像的罗吉特(logit)参数的调整量相同,所以会出现不同类别的数据样本量不均衡分布导致分类准确度较低,分类效果较差的问题。
经过本申请的发明人研究发现,训练图像的分类准确度较低的类别的logit参数较小,例如虽然梅花这一类别的样本量较大,但是训练得到的训练结果较差,即训练图像的分类准确度较低,其训练过程中梅花类别的logit参数较小。因此,本申请实施例提供了一种图像分类方法,利用图像分类模型对目标图像进行类别识别,图像分类模型在训练过程中,对训练图像的分类准确度较低的训练图像对应的类别进行更大的罗吉特logit参数调整,对训练图像的分类准确度较高的训练图像对应的类别进行较小的logit参数调整,使得图像分类模型对训练图像的分类准确度较低的训练图像更加关注,图像分类效果增强。
为了更好地理解本申请的技术方案和技术效果,以下将结合附图对具体的实施例进行详细的描述。
参见图1,该图为本申请实施例提供的一种模型训练方法的流程图。为了更好地进行图像分类,首先要对神经网络模型进行训练,因此本申请实施例首先介绍模型训练方法。
本实施例提供的模型训练方法包括如下步骤:
S101,获取训练图像集,所述训练图像集包括多个训练图像,所述多个训练图像中的每个训练图像包括对应的特征类别标签,所述特征类别标签根据所述训练图像的图像特征确定。
在本申请的实施例中,训练图像可以是图片,也可以是视频中的某一帧。训练图像集是多个训练图像的集合,训练图像集包括多个训练图像,其中,每个训练图像都包括对应的特征类别标签,特征类别标签是根据训练图像的图像特征确定的,通过特征类别标签可以标识该训练图像的类别,例如,训练图像的类别可以是狗,训练图像的类别还可以是梅花。训练图像集可以包括多种类别的训练图像,每个训练图像都包括对应的特征类别标签,每种特征类别标签可以对应多个训练图像,每种特征类别标签对应的训练图像的样本量可以不同。例如特征类别标签为景物的训练图像样本量可以为1000个,特征类别标签为猫的训练图像样本量可以为5000个。本申请实施例可以利用已经分好类别的训练图像来训练图像分类模型。
S102,将所述训练图像集中的每个训练图像分别输入到图像分类模型中进行训练,在训练的过程中,对所述图像分类模型的罗吉特logit参数进行调整,以使所述图像分类模型对分类准确度较低的训练图像更加关注,所述logit参数表达所述训练图像属于每个所述特征类别标签对应的特征类别的置信度的相对值,所述logit参数的调整量与所述训练图像的分类准确度呈负相关关系,所述图像分类模型用于对目标图像按照所述特征类别标签对应的特征类别进行分类。
在本申请的实施例中,训练图像集包括多个训练图像,每个训练图像包括对应的特征类别标签,将训练图像集中的每个训练图像分别输入到图像分类模型进行训练。
在训练过程中,对图像分类模型的罗吉特logit参数进行调整,以使图像分类模型对分类准确度较低的训练图像更加关注,具体的,logit参数的调整量与训练图像的分类准确度呈负相关关系,即训练图像对应的分类准确度较高,则logit参数的调整量较小,训练图像对应的分类准确度较低,则logit参数的调整量较大。logit参数表达训练图像属于每个特征类别标签对应的特征类别的置信度的相对值。
在本申请的实施例中,图像分类模型是根据损失(loss)函数对训练图像进行训练,通过利用损失函数关注不同分类准确度的训练图像,进而实现图像分类模型关注到不同分类准确度的训练图像。在实际应用中,训练图像分类模型需要设计图像分类模型的损失函数,图像分类模型的损失函数可以用logit参数来进行表示。因此,利用损失函数关注不同分类准确度的训练图像就可以是针对不同分类准确度的训练图像进行不同的logit参数的调整。针对特征类别标签对应的分类准确度较低的训练图像,进行较大的logit参数的值的调整,针对特征类别标签对应的分类准确度较高的训练图像,进行较小的logit参数的值的调整,使得不同分类准确度的训练图像具有不同的logit参数,进而实现图像分类模型的损失函数关注到分类准确度较低的训练图像,提升图像分类模型的分类效果。
训练图像的分类准确度可以有两种表现方式:第一种为训练图像的特征向量与训练图像的特征类别的中心向量之间的夹角的余弦值;第二种为训练图像属于对应特征类别标签的特征类别的概率。
在第一种训练效果的表现方式中,训练图像的分类准确度表示为训练图像的特征向量与训练图像的特征类别的中心向量之间的夹角的余弦值。在本申请的实施例中,可以通过以下步骤来进行根据分类准确度调整logit参数:
图像分类模型的logit参数可以根据训练图像的特征类别标签对应的分类准确度确定logit参数的值的调整量,根据调整量确定logit参数的值,其中,分类准确度与logit的调整量呈负相关关系。也就是说,训练图像的特征向量与训练图像的特征类别的中心向量之间的夹角的余弦值越大,训练图像的特征类别标签对应的分类准确度较高,对应的logit参数的值的调整量越小;训练图像的特征向量与训练图像的特征类别的中心向量之间的夹角的余弦值越小,训练图像的特征类别标签对应的分类准确度较低,对应的logit参数的值的调整量越大,从而使得图像分类模型中关注到分类准确度较低的训练图像进而增强分类准确度较低的特征类别的分类效果。
作为一种示例,损失函数的具体公式可以为
其中,N为图像分类模型的数目,C为特征类别标签的数目,即训练图像的类别数目,yi为第i个训练图像的类别,s是常数,是第i个训练图像的特征向量与该第i个训练图像的特征类别的中心向量之间的夹角的余弦值,cosθij是第i个训练图像的特征向量与第j个特征类别的中心向量之间的夹角的余弦值,logit参数a为调整量。本申请实施例列举的公式不构成对logit参数的限定,本领域技术人员可自行设计logit参数的公式。
由公式(1)可知,可以通过调整a,对logit参数的值进行调整。
作为一种示例,调整量a可以为:
其中,公式(2)中具体参数的解释参考公式(1),在此不再赘述。
由公式(2)可知,当某个训练图像的特征向量与该训练图像的特征类别的中心向量之间的夹角的余弦值越大,即某个特征类别标签对应的分类准确度较高,调整量a值越小。通过对logit参数进行调整,就可以改变图像分类模型针对不同分类准确度的训练图像的损失函数,使得图像分类模型在训练时关注不同分类准确度的训练图像。
在第二种训练效果的表现方式中,训练图像的分类准确度表示为训练图像属于对应特征类别标签的特征类别的概率,其中特征类别指的是训练图像的图像特征对应的类别。例如,训练图像的图像特征为狗,训练图像属于特征类别为狗的概率例如为0.6。
在本申请的实施例中,训练图像属于特征类别的概率可以为P,P是利用相同的损失函数的图像分类模型进行图像分类得到的特征类别的概率,相同的损失函数的图像分类模型就是没有经过调整量a进行调整的图像分类模型。例如相同的损失函数图像分类模型的损失函数可以是:
根据公式(3),可以计算得到训练图像属于特征类别的概率P,即训练图像属于特征类别的概率P可以利用相同的损失函数进行训练获得。
在本申请的实施例中,训练图像属于特征类别的概率P可以表示训练图像的分类准确度,当训练图像属于特征类别的概率P较大,说明训练图像的分类准确度较高,对应的logit参数的调整量较小;当训练图像属于特征类别的概率P较小,说明训练图像的分类准确度较低,对应的logit参数的调整量较大。
在本申请的实施例中,可以根据公式(1)对logit参数进行调整,即可以通过调整a,对logit参数的值进行调整。
作为一种示例,调整量a可以为:
由公式(4)可知,当采用相同的损失函数的图像分类模型得到的训练图像属于特征类别的概率P越小,调整量a值越大,logit参数的调整量越大。
综上,本申请实施例可以根据训练图像的分类准确度的两种不同的表现方式,分别对logit参数进行调整,针对特征类别标签对应的分类准确度较低的训练图像,进行较大的logit参数的值的调整,针对特征类别标签对应的分类准确度较高的训练图像,进行较小的logit参数的值的调整,使得图像分类模型关注到分类准确度较低的训练图像,提升图像分类模型的分类效果。上述两种可能的分类准确度的表现方式并不构成对本申请技术方案的限定,本领域技术人员可以根据实际情况自行设计。
在本申请的实施例中,训练图像的logit参数的调整量还可以与训练图像的特征类别标签对应的样本量呈负相关关系。也就是说,特征类别标签的对应的样本量越大,训练图像的logit参数的调整量越小,特征类别标签的对应的样本量越小,训练图像的logit参数的调整量越大。
作为一种可能的实现方式,根据公式(1),可以通过调整a,对logit参数进行调整。作为一种示例,调整量a可以为:
由此可见,训练图像的特征类别标签对应的样本量越大,调整量a值越小,对应的logit参数的值的调整量越小,训练图像的特征类别标签对应的样本量越小,调整量a值越大,对应的logit参数的值的调整量越大。
在本申请的实施例中,训练图像还包括对应的样本量类别标签,样本量类别标签用于标识训练图像的样本量类别,样本量类别标签可以根据特征类别标签对应的样本量确定。
在实际应用中,样本量类别可以根据特征类别标签对应的样本量区分,例如可以在图像分类模型的训练过程中,根据每种特征类别标签对应的训练图像的样本量的大小对多种特征类别标签进行排序,根据排序结果将多个训练图像划分为多个样本量类别。
在本申请的实施例中,可以对多个样本量类别中的每个样本量类别进行不同的logit参数调整,即每一个样本量类别都对应相应的logit参数调整量,logit参数调整量为预设值,使得图像分类模型的关注到不同的样本量类别。
作为一种示例,多种特征类别标签的数目可以为S种,将前N种特征类别标签的训练图像划分为第一样本量类别,将后M种特征类别标签的训练图像划分为第二样本量类别,将其余的P种特征类别标签的训练图像划分为第三样本量类别,其中,N、M和P均为大于或等于1的整数,且N、M和P之和等于S。可选的,第一样本量类别可以称为头部样本量类别,第二样本量类别可以称为尾部样本量类别,第三样本量类别可以称为中部样本量类别,其中头部样本量类别为样本数量较多的类别,尾部样本量类别为样本数量较少的类别。本申请实施例不限定样本量类别的数量,样本量类别的数量可以是A个,A为大于1的整数。
头部样本量类别对应的logit参数的值的调整量为a1,中部样本量类别对应的logit参数的值的调整量为a2,尾部样本量类别对应的logit参数的值的调整量为a3,作为一种示例,a1<a2<a3。
在实际应用中,头部样本量类别对应的logit参数的值的调整量较小,尾部样本量类别对应的logit参数的值的调整量较大,从而使得图像分类模型更加关注尾部样本量类别对应的特征类别,尾部样本量类别对应的特征类别的预测概率变小,但是梯度的幅度增加,进而增强尾部样本量类别的分类效果。
综上可知,通过对图像分类模型不同样本量的训练图像的logit参数进行不同的调整,使得图像分类模型在训练时关注不同的样本量的训练图像。训练图像的特征类别标签对应的样本量越大,对应的logit参数的值的调整量越小,训练图像的特征类别标签对应的样本量越小,对应的logit参数的值的调整量越大,使得样本量较小的特征类别的logit参数的值变小,从而图像分类模型中样本量较小的特征类别的预测概率也变小,但是梯度幅度增加,进而增强样本量较小的特征类别的分类效果。
在本申请的实施例中,图像分类模型的损失函数还可以根据每个训练图像对应的logit参数和训练图像对应的权重得到,其中,训练图像对应的权重与训练图像的特征类别标签对应的样本量呈负相关关系,也就是图像分类模型的损失函数与训练图像的特征类别标签对应的样本量呈负相关关系,这样特征类别标签对应的样本量较大的损失函数较小,特征类别标签对应的样本量较小的损失函数较大,使得图像分类模型的损失函数关注到不同样本量的训练图像,进一步提高图像分类的分类效果。
作为一种可能的实现方式,损失函数的具体公式可以为
由此可见,训练图像对应的权重与训练图像的特征类别标签对应的样本量呈负相关关系。本申请实施例列举的公式不构成对logit参数的限定,本领域技术人员可自行设计logit参数的公式。
由公式(6)可知,当特征类别标签对应的样本量较小,该特征类别标签对应的权重较大,从而图像分类模型中样本量较小的特征类别的预测概率也变小,但是梯度幅度增加,进而增强样本量较小的特征类别的分类效果。
在本申请的实施例中,图像分类模型在训练过程中,对训练图像的分类准确度较低的训练图像对应的类别进行更大的罗吉特logit参数调整,对训练图像的分类准确度较高的训练图像对应的类别进行较小的logit参数调整,使得图像分类模型对训练图像的分类准确度较低的训练图像更加关注,图像分类效果增强。
基于上述实施例提供的模型训练方法,本申请实施例还提供了一种图像分类方法,所述图像分类方法中利用的模型主要是经过模型训练方法训练后的模型。
参见图2,该图为本申请实施例提供的一种图像分类方法的流程图。
本实施例提供的图像分类方法包括如下步骤:
S201,获取目标图像。
在本申请的实施例中,目标图像可以是待分类的图像,目标图像是没有对应的样本量类别标签和特征类别标签的图像。目标图像可以是图片,也可以是视频中的某一帧。
S202,将所述目标图像输入到图像分类模型,得到所述图像分类模型输出的分类结果。
在本申请的实施例中,可以将目标图像输入到图像分类模型进行分类,得到图像分类模型输出的分类结果。
其中,图像分类模型采用本申请实施例提供的模型训练方法进行训练,具体训练方法参考上述实施例,在此不再赘述。
S203,根据所述分类结果,确定所述目标图像的特征类别。
在本申请的实施例中,将目标图像输入到图像分类模型,得到图像分类模型输出的分类结果后,即可确定目标图像的特征类别。
作为一种示例,可以根据图像分类模型输出的分类结果中概率最大值对应的类别,确定为所述目标图像的特征类别。例如,目标图像的图像特征为狗,图像分类模型输出的分类结果中猫的概率为0.3,老虎的概率为0.4,狗的概率为0.8,概率最大值对应的类别为狗,因此确定目标图像的特征类别为狗。
在本申请的实施例中,利用图像分类模型对目标图像进行类别识别,图像分类模型在训练过程中,对训练图像的分类准确度较低的训练图像对应的类别进行更大的罗吉特logit参数调整,对训练图像的分类准确度较高的训练图像对应的类别进行较小的logit参数调整,使得图像分类模型对训练图像的分类准确度较低的训练图像更加关注,图像分类效果增强。
基于以上实施例提供的一种图像分类方法,本申请实施例还提供了一种图像分类装置,下面结合附图来详细说明其工作原理。
参见图3,该图为本申请实施例提供的一种图像分类装置的结构框图。
本实施例提供的图像分类装置300包括:
获取单元310,用于获取目标图像;
输入单元320,用于将所述目标图像输入到图像分类模型,得到所述图像分类模型输出的分类结果,所述图像分类模型根据包括特征类别标签的多个训练图像训练得到,所述特征类别标签根据所述训练图像的图像特征确定,且在训练的过程中,所述图像分类模型的罗吉特logit参数的调整量与所述训练图像的分类准确度呈负相关关系,所述logit参数表达所述训练图像属于每个所述特征类别标签对应的特征类别的置信度的相对值;
确定单元330,用于根据所述分类结果,确定所述目标图像的特征类别。
可选的,所述训练图像的分类准确度表示为所述训练图像的特征向量与所述训练图像的特征类别的中心向量之间的夹角的余弦值。
可选的,所述训练图像的分类准确度表示为所述训练图像属于对应特征类别标签的特征类别的概率。
可选的,所述logit参数的调整量还与所述训练图像的特征类别标签对应的样本量呈负相关关系。
可选的,所述训练图像还包括对应的样本量类别标签,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别标签根据所述特征类别标签对应的样本量确定;
所述图像分类模型的logit参数的调整量根据所述样本量类别标签确定。
可选的,在训练的过程中,所述装置还包括:
排序单元,用于根据所述训练图像的特征类别对应的样本量的大小对所述特征类别进行排序;
划分单元,用于根据排序结果将多个训练图像划分为多个样本量类别。
可选的,所述图像分类模型的损失函数根据每个训练图像对应的logit参数和所述训练图像对应的权重得到,其中,所述训练图像对应的权重与所述训练图像的特征类别标签对应的样本量呈负相关关系。
基于以上实施例提供的一种图像分类方法,本申请实施例还提供了一种图像分类设备,图像分类设备400包括:
处理器410和存储器420,处理器的数量可以一个或多个。在本申请的一些实施例中,处理器和存储器可通过总线或其它方式连接。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括NVRAM。存储器存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
处理器控制终端设备的操作,处理器还可以称为CPU。
上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例的一种翻译方法中的任意一种实施方式。
当介绍本申请的各种实施例的元件时,冠词“一”、“一个”、“这个”和“所述”都意图表示有一个或多个元件。词语“包括”、“包含”和“具有”都是包括性的并意味着除了列出的元件之外,还可以有其它元件。
需要说明的是,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (16)
1.一种图像分类方法,其特征在于,所述方法包括:
获取目标图像;
将所述目标图像输入到图像分类模型,得到所述图像分类模型输出的分类结果,所述图像分类模型根据包括特征类别标签的多个训练图像训练得到,所述特征类别标签根据所述训练图像的图像特征确定,且在训练的过程中,所述图像分类模型的罗吉特logit参数的调整量与所述训练图像的分类准确度呈负相关关系,所述logit参数表达所述训练图像属于每个所述特征类别标签对应的特征类别的置信度的相对值;
根据所述分类结果,确定所述目标图像的特征类别。
2.根据权利要求1所述的方法,其特征在于,所述训练图像的分类准确度表示为所述训练图像的特征向量与所述训练图像的特征类别的中心向量之间的夹角的余弦值。
3.根据权利要求1所述的方法,其特征在于,所述训练图像的分类准确度表示为所述训练图像属于对应特征类别标签的特征类别的概率。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述logit参数的调整量还与所述训练图像的特征类别标签对应的样本量呈负相关关系。
5.根据权利要求4所述的方法,其特征在于,所述训练图像还包括对应的样本量类别标签,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别标签根据所述特征类别标签对应的样本量确定;
所述图像分类模型的logit参数的调整量根据所述样本量类别标签确定。
6.根据权利要求5所述的方法,其特征在于,在训练的过程中,所述方法还包括:
根据所述训练图像的特征类别对应的样本量的大小对所述特征类别进行排序;
根据排序结果将多个训练图像划分为多个样本量类别。
7.根据权利要求1所述的方法,其特征在于,所述图像分类模型的损失函数根据每个训练图像对应的logit参数和所述训练图像对应的权重得到,其中,所述训练图像对应的权重与所述训练图像的特征类别标签对应的样本量呈负相关关系。
8.一种图像分类装置,其特征在于,所述装置包括:
获取单元,用于获取目标图像;
输入单元,用于将所述目标图像输入到图像分类模型,得到所述图像分类模型输出的分类结果,所述图像分类模型根据包括特征类别标签的多个训练图像训练得到,所述特征类别标签根据所述训练图像的图像特征确定,且在训练的过程中,所述图像分类模型的罗吉特logit参数的调整量与所述训练图像的分类准确度呈负相关关系,所述logit参数表达所述训练图像属于每个所述特征类别标签对应的特征类别的置信度的相对值;
确定单元,用于根据所述分类结果,确定所述目标图像的特征类别。
9.根据权利要求8所述的装置,其特征在于,所述训练图像的分类准确度表示为所述训练图像的特征向量与所述训练图像的特征类别的中心向量之间的夹角的余弦值。
10.根据权利要求8所述的装置,其特征在于,所述训练图像的分类准确度表示为所述训练图像属于对应特征类别标签的特征类别的概率。
11.根据权利要求8-10任一项所述的装置,其特征在于,所述logit参数的调整量还与所述训练图像的特征类别标签对应的样本量呈负相关关系。
12.根据权利要求11所述的装置,其特征在于,所述训练图像还包括对应的样本量类别标签,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别标签根据所述特征类别标签对应的样本量确定;
所述图像分类模型的logit参数的调整量根据所述样本量类别标签确定。
13.根据权利要求12所述的装置,其特征在于,在训练的过程中,所述装置还包括:
排序单元,用于根据所述训练图像的特征类别对应的样本量的大小对所述特征类别进行排序;
划分单元,用于根据排序结果将多个训练图像划分为多个样本量类别。
14.根据权利要求8所述的装置,其特征在于,所述图像分类模型的损失函数根据每个训练图像对应的logit参数和所述训练图像对应的权重得到,其中,所述训练图像对应的权重与所述训练图像的特征类别标签对应的样本量呈负相关关系。
15.一种图像分类设备,其特征在于,所述设备包括:处理器和存储器;
所述存储器,用于存储指令;
所述处理器,用于执行所述存储器中的所述指令,执行如权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110573578.6A CN113378853B (zh) | 2021-05-25 | 2021-05-25 | 一种图像分类方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110573578.6A CN113378853B (zh) | 2021-05-25 | 2021-05-25 | 一种图像分类方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113378853A true CN113378853A (zh) | 2021-09-10 |
CN113378853B CN113378853B (zh) | 2024-02-13 |
Family
ID=77571903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110573578.6A Active CN113378853B (zh) | 2021-05-25 | 2021-05-25 | 一种图像分类方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378853B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875934A (zh) * | 2018-05-28 | 2018-11-23 | 北京旷视科技有限公司 | 一种神经网络的训练方法、装置、系统及存储介质 |
CN109902722A (zh) * | 2019-01-28 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 分类器、神经网络模型训练方法、数据处理设备及介质 |
CN111198937A (zh) * | 2019-12-02 | 2020-05-26 | 泰康保险集团股份有限公司 | 对话生成及装置、计算机可读存储介质、电子设备 |
CN112101542A (zh) * | 2020-07-24 | 2020-12-18 | 北京沃东天骏信息技术有限公司 | 机器学习模型的训练方法、装置、人脸的识别方法和装置 |
-
2021
- 2021-05-25 CN CN202110573578.6A patent/CN113378853B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875934A (zh) * | 2018-05-28 | 2018-11-23 | 北京旷视科技有限公司 | 一种神经网络的训练方法、装置、系统及存储介质 |
CN109902722A (zh) * | 2019-01-28 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 分类器、神经网络模型训练方法、数据处理设备及介质 |
CN111198937A (zh) * | 2019-12-02 | 2020-05-26 | 泰康保险集团股份有限公司 | 对话生成及装置、计算机可读存储介质、电子设备 |
CN112101542A (zh) * | 2020-07-24 | 2020-12-18 | 北京沃东天骏信息技术有限公司 | 机器学习模型的训练方法、装置、人脸的识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113378853B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3779774B1 (en) | Training method for image semantic segmentation model and server | |
CN110378235B (zh) | 一种模糊人脸图像识别方法、装置及终端设备 | |
CN111950723A (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
CN109840883B (zh) | 一种训练物体识别神经网络的方法、装置及计算设备 | |
CN104537359B (zh) | 一种车辆目标检测方法及装置 | |
CN111382782B (zh) | 训练分类器的方法和装置 | |
CN113689436B (zh) | 图像语义分割方法、装置、设备及存储介质 | |
CN113222043B (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN109726285A (zh) | 一种文本分类方法、装置、存储介质及终端设备 | |
CN113435499B (zh) | 标签分类方法、装置、电子设备和存储介质 | |
CN111401343B (zh) | 识别图像中人的属性的方法、识别模型的训练方法和装置 | |
CN116994021A (zh) | 图像检测方法、装置、计算机可读介质及电子设备 | |
CN113962965A (zh) | 图像质量评价方法、装置、设备以及存储介质 | |
CN114419378B (zh) | 图像分类的方法、装置、电子设备及介质 | |
CN111814534A (zh) | 视觉任务的处理方法、装置和电子系统 | |
CN114511083A (zh) | 一种模型的训练方法、装置、存储介质及电子装置 | |
CN112765354B (zh) | 模型训练方法、模型训练装置、计算机设备和存储介质 | |
CN113240032B (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN113378853A (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN110428012A (zh) | 脑网络模型建立方法、脑图像分类方法、装置及电子设备 | |
CN114170481B (zh) | 用于图像处理的方法、设备、存储介质和程序产品 | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN113177603B (zh) | 分类模型的训练方法、视频分类方法及相关设备 | |
CN115690752A (zh) | 一种驾驶员行为检测方法及装置 | |
CN112418098A (zh) | 视频结构化模型的训练方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |