CN113222043A - 一种图像分类方法、装置、设备及存储介质 - Google Patents
一种图像分类方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113222043A CN113222043A CN202110571983.4A CN202110571983A CN113222043A CN 113222043 A CN113222043 A CN 113222043A CN 202110571983 A CN202110571983 A CN 202110571983A CN 113222043 A CN113222043 A CN 113222043A
- Authority
- CN
- China
- Prior art keywords
- logit
- image
- image classification
- training
- sample size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012549 training Methods 0.000 claims abstract description 235
- 238000013145 classification model Methods 0.000 claims abstract description 205
- 239000013598 vector Substances 0.000 claims description 43
- 230000000694 effects Effects 0.000 abstract description 14
- 238000003062 neural network model Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000011022 operating instruction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种图像分类方法、装置、设备及存储介质,方法包括:获取目标图像;将目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,根据每个图像分类模型分别输出的分类结果,确定目标图像的类别。在本申请的实施例中,利用多个图像分类模型对目标图像进行类别识别,多个图像分类模型是利用不同样本量类别进行训练的,样本量类别是根据训练图像的特征类别对应的样本量的大小对特征类别划分得到的,使得多个图像分类模型在进行图像分类训练时侧重训练不同样本量类别的训练图像,图像分类效果增强。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种图像分类方法、装置、设备及存储介质。
背景技术
随着计算机技术的快速发展,机器学习领域也有了很多的技术进步。在机器学习领域主要是训练神经网络模型来预测或处理某些数据,来代替重复的人工操作,例如训练神经网络模型来实现计算机视觉、语音识别、自然语言处理或图像分类。
在训练神经网络进行图像分类时,存在一个很重要的问题:不同图像类别的数据样本不均衡分布。不同图像类别的数据样本不均衡分布会导致在机器学习过程中,分类结果会比较偏向样本数较多的类别,样本数较少的类别分类效果较差。
发明内容
为了解决现有技术由于不同图像类别的数据样本不均衡分布导致分类效果较差的问题,本申请提出了一种图像分类方法、装置、设备及存储介质。
本申请实施例提供了一种图像分类方法,所述方法包括:
获取目标图像;
将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述每个图像分类模型均根据多个训练图像训练得到,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到;
根据所述每个图像分类模型分别输出的分类结果,确定所述目标图像的类别。
可选的,在训练的过程中,所述每个图像分类模型的子罗吉特logit参数分别根据对应子logit参数的调整幅度确定,所述子logit参数的调整幅度根据所述训练图像的样本量类别确定,所述子logit参数包括每个所述特征类别标签对应的特征类别的置信度的相对值;
其中,不同的图像分类模型对应不同的样本量类别集合,所述样本量类别集合包括一种或多种样本量类别;
针对每个图像分类模型而言,样本量类别属于对应样本量类别集合的训练图像对应的子logit参数的调整幅度,大于样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度。
可选的,所述样本量类别属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度,根据所述训练图像的特征类别标签对应的样本量确定。
可选的,所述样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度为0。
可选的,所述方法还包括:
在训练的过程中,根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数;
根据所述总logit参数训练所述多个图像分类模型。
可选的,所述根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数包括:
根据所述每个图像分类模型的子logit参数和所述每个图像分类模型的对应每个特征类别的权重,确定所述多个图像分类模型的总logit参数;所述总logit参数和所述子logit参数均为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,所述总logit参数的第j个数据根据所述子logit参数的第j个数据分别与所述每个图像分类模型对应第j个类别的权重的乘积之和得到。
可选的,所述总logit参数和所述子logit参数为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值;
所述总logit参数的第j个数据为所述每个图像分类模型对应的子logit参数的第j个数据的均值。
本申请实施例还提供一种图像分类装置,所述装置包括:
获取单元,用于获取目标图像;
输入单元,用于将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述每个图像分类模型均根据多个训练图像训练得到,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到;
确定单元,用于根据所述每个图像分类模型分别输出的分类结果,确定所述目标图像的类别。
可选的,在训练的过程中,所述每个图像分类模型的子罗吉特logit参数分别根据对应子logit参数的调整幅度确定,所述子logit参数的调整幅度根据所述训练图像的样本量类别确定,所述子logit参数包括每个所述特征类别标签对应的特征类别的置信度的相对值;
其中,不同的图像分类模型对应不同的样本量类别集合,所述样本量类别集合包括一种或多种样本量类别;
针对每个图像分类模型而言,样本量类别属于对应样本量类别集合的训练图像对应的子logit参数的调整幅度,大于样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度。
可选的,所述样本量类别属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度,根据所述训练图像的特征类别标签对应的样本量确定。
可选的,所述样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度为0。
可选的,所述装置还包括:
第一训练单元,用于在训练的过程中,根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数;
第二训练单元,用于根据所述总logit参数训练所述多个图像分类模型。
可选的,所述第一训练单元根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数包括:
所述第一训练单元根据所述每个图像分类模型的子logit参数和所述每个图像分类模型的对应每个特征类别的权重,确定所述多个图像分类模型的总logit参数;所述总logit参数和所述子logit参数均为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,所述总logit参数的第j个数据根据所述子logit参数的第j个数据分别与所述每个图像分类模型对应第j个类别的权重的乘积之和得到。
可选的,所述总logit参数和所述子logit参数为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值;
所述总logit参数的第j个数据为所述每个图像分类模型对应的子logit参数的第j个数据的均值。
本申请实施例还提供一种图像分类设备,所述设备包括:处理器和存储器;
所述存储器,用于存储指令;
所述处理器,用于执行所述存储器中的所述指令,执行上述实施例所述的方法。
本申请实施例还提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述实施例所述的方法。在本申请的实施例中,利用多个图像分类模型对目标图像进行类别识别,多个图像分类模型是利用不同样本量类别进行训练的,样本量类别是根据训练图像的特征类别对应的样本量的大小对特征类别划分得到的,使得多个图像分类模型在进行图像分类训练时侧重训练不同样本量类别的训练图像,图像分类效果增强。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种模型训练方法的流程图;
图2为本申请实施例提供的一种神经网络模型的示意图;
图3为本申请提供的一种图像分类方法的流程图;
图4为本申请提供的一种图像分类装置的结构图;
图5为本申请提供的一种图像分类设备的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
当前,在机器学习领域包括图像的分类问题,例如可以将某一类图像分类为人物、动物、景物等。图像分类可以分为很多类别,每个类别的样本量不相同,即样本量分布不均衡。在样本量不均衡的情况下,训练得到的神经网络模型往往会偏向样本量大的类别,也就是说,样本量较大的类别分类效果较好,而样本量小的类别分类效果较差。
现有的对图像分类训练的多个神经网络模型,通常是将多个类别的全部样本量作为多个神经网络模型的输入,每个神经网络模型的模型参数不同,因此每个神经网络模型的输出结果也不相同,综合每个神经网络模型的输出结果,得到最终的输出结果。但是由于现有技术中每个神经网络模型针对其输入的所有类别的训练图像均采用相同的损失函数,,所以会出现不同类别的数据样本量不均衡分布导致分类效果较差的问题。
因此,本申请实施例提供了一种图像分类方法,利用多个图像分类模型对目标图像进行类别识别,多个图像分类模型是利用不同样本量类别进行训练的,样本量类别是根据训练图像的特征类别对应的样本量的大小对特征类别划分得到的,使得多个图像分类模型在进行图像分类训练时侧重训练不同样本量类别的训练图像,图像分类效果增强。
为了更好地理解本申请的技术方案和技术效果,以下将结合附图对具体的实施例进行详细的描述。
参见图1,该图为本申请实施例提供的一种模型训练方法的流程图。为了更好地进行图像分类,首先要对神经网络模型进行训练,因此本申请实施例首先介绍模型训练方法。
本实施例提供的模型训练方法包括如下步骤:
S101,获取训练图像集,所述训练图像集包括多个训练图像,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到。
在本申请的实施例中,训练图像可以是图片,也可以是视频中的某一帧。训练图像集是多个训练图像的集合,训练图像集包括多个训练图像,其中,每个训练图像都已经被分好类别,即每个训练图像都包括对应的特征类别标签,特征类别标签是根据训练图像的图像特征确定的,通过特征类别标签可以标识该训练图像的类别,例如,训练图像的类别可以是狗,训练图像的类别还可以是梅花。训练图像集可以包括多种类别的训练图像,即训练图像集可以包括多种特征类别标签。本申请实施例可以利用已经分好类别的训练图像来训练图像分类模型。
在本申请的实施例中,训练图像还包括对应的样本量标签,样本量标签用于标识训练图像的样本量类别,样本量类别标签可以根据特征类别标签对应的样本量确定。每个训练图像都包括对应的特征类别标签,每种特征类别标签可以对应多个训练图像,即每种特征类别标签对应的训练图像的样本量可以不同。例如特征类别标签为景物的训练图像样本量可以为1000个,特征类别标签为猫的训练图像样本量可以为5000个。
在实际应用中,样本量类别可以根据训练图像的特征类别对应的样本量的大小对特征类别划分得到,例如可以根据每种特征类别标签对应的训练图像的样本量的大小对多种特征类别标签进行排序,根据排序结果将多个训练图像划分为多个样本量类别。
作为一种可能的实现方式,多种特征类别标签的数目可以为S种,将前N种特征类别标签的训练图像划分为第一样本量类别,将后M种特征类别标签的训练图像划分为第二样本量类别,将其余的P种特征类别标签的训练图像划分为第三样本量类别,其中,N、M和P均为大于或等于1的整数,且N、M和P之和等于S。具体的,第一样本量类别可以称为头部样本量类别,第二样本量类别可以称为尾部样本量类别,第三样本量类别可以称为中部样本量类别,其中头部样本量类别为样本数量较多的类别,尾部样本量类别为样本数量较少的类别。本申请实施例不限定样本量类别的数量,样本量类别的数量可以是A个,A为大于1的整数。
S102,将所述训练图像集中的每个训练图像分别输入到多个图像分类模型中进行训练,其中,每个图像分类模型均根据多个训练图像训练得到,不同的图像分类模型对应不同的样本量类别集合,所述样本量类别集合包括一个或多个样本量类别。
在本申请的实施例中,训练图像集包括多个训练图像,每个训练图像包括对应的特征类别标签和样本量类别标签,将训练图像集中的每个训练图像分别输入到多个图像分类模型中进行训练。多个样本量类别也可以构成样本量类别集合,样本量类别集合可以包括一个或多个样本量类别。例如,样本量类别集合可以包括头部样本量类别和中部样本量类别,样本量类别集合也可以只包括头部样本量类别。
在训练过程中,不同的图像分类模型对应不同的样本量类别集合,即每个图像分类模型可以侧重学习不同样本量类别集合的训练图像。
例如,图像分类模型1侧重学习头部样本量类别;图像分类模型2侧重学习中部样本量类别;图像分类模型3侧重学习尾部样本量类别。
或者,再例如,图像分类模型1侧重学习头部样本量类别和中部样本量类别;图像分类模型2侧重学习中部样本量类别和尾部样本量类别;图像分类模型3侧重学习尾部样本量类别和头部样本量类别。
通过对不同样本量类别的训练图像进行针对性的训练,能够使得不同的图像分类模型关注到不同的样本量类别,克服由于不同类别的数据样本量不均衡分布导致分类效果较差的问题。
在本申请的实施例中,将训练图像集中的每个训练图像分别输入到多个图像分类模型中,输出为每个图像分类模型的子罗吉特(logit)参数。子logit参数包括每个特征类别标签对应的特征类别的置信度的相对值,在训练过程中,每个图像分类模型的子logit参数分别根据对应子logit参数的调整幅度确定,子logit参数的调整幅度根据训练图像的样本量类别确定,也就是说,通过对不同图像分类模型的子logit参数进行调整,实现图像分类模型侧重学习不同样本量类别集合的训练图像的目的。例如,若某个图像分类模型侧重学习尾部样本量类别的训练图像,则该图像分类模型中尾部样本量类别的子logit参数的调整幅度大于其它样本量类别的子logit参数的调整幅度,使得尾部样本量类别的子logit参数变小,从而图像分类模型中尾部样本量类别对应的特征类别的预测概率也变小,但是梯度的幅度增加,进而增强尾部样本量类别的分类效果。可选的,本申请实施例可以通过降低每个图像分类模型侧重训练的样本量类别对应的子logit参数,来实现每个图像分类模型针对不同样本量类别标签对应的训练图像进行训练,具体的,其他样本量类别对应的子logit参数可以进行降低,也可以不做改变,当其他样本量类别对应的子logit参数进行降低时,其降低的幅度小于图像分类模型侧重训练的样本量类别对应的子logit参数。
图像分类模型的损失函数可以用子logit参数来进行表示,作为一种可能的实现方式,损失函数的具体公式可以为其中,N为图像分类模型的数目,C为特征类别标签的数目,即训练图像的类别数目,yi为第i个训练图像的类别,s是常数,是第i个训练图像的特征向量与该第i个训练图像的类别的中心向量之间的夹角,cosθij是第i个训练图像的特征向量与第j个类别的中心向量之间的夹角,子logit参数a为调整量,a可以是预设值,也可以是nj为第j个特征类别的样本数量,本申请实施例列举的公式不构成对子logit参数的限定,本领域技术人员可自行设计子logit参数的公式。对子logit参数进行调整,可以通过直接对子logit参数本身进行调整,也可以通过调整a,进而调整子logit参数。通过对子logit参数进行调整,就可以改变每个图像分类模型的损失函数,进而改变每个图像分类模型的模型参数,使得每个图像分类模型在训练时关注不同的样本类别。
在实际应用中,可以根据每个图像分类模型的子logit参数确定多个图像分类模型的总logit参数,根据总logit参数训练多个图像分类模型。具体的,每个图像分类模型的输出为C维的子logit向量,根据N个图像分类模型的子logit向量得到总logit向量,根据总logit向量训练N个图像分类模型,例如,可以根据总logit向量计算多个图像分类模型的总概率值,根据总概率值训练多个图像分类模型。
作为一种示例,根据总logit向量计算多个图像分类模型的总概率值的公式(softmax函数)可以如下所示:
其中,C为特征类别标签的数目,即训练图像的类别数目,yi为第i个训练图像的类别,x为总logit参数。
在本申请的实施例中,可以通过以下步骤来获得每个图像分类模型的子logit参数:
可以根据训练图像的特征类别标签确定图像分类模型的子logit参数的调整幅度。具体的,可以分为两种情况进行确定,第一种情况为当样本量类别属于样本量类别集合的训练图像对应的子logit参数的调整幅度。第二种情况为当样本量类别不属于样本量集合的训练图像对应的子logit参数的调整幅度。根据上述情况对每个图像分类模型中的子logit参数的调整幅度确定子logit参数,其中当样本量类别属于样本量类别集合的训练图像对应的子logit参数的调整幅度大于当样本量类别不属于样本量集合的训练图像对应的子logit参数的调整幅度,这样可以使得不同的图像分类模型更加关注不同的样本量类别对应的训练图像。
作为一种示例,某个图像分类模型侧重尾部样本量类别,则对尾部样本量类别对应的子logit参数进行降低,对头部样本量类别和中部样本量类别的子logit参数也进行降低,尾部样本量类别的子logit参数的降低幅度大于头部样本量类别和中部样本量类别的子logit参数的降低幅度。
作为一种可能的实现方式,样本量类别不属于样本量集合的训练图像对应的子logit参数的调整幅度可以为0。例如,当某一个图像分类模型侧重于学习头部样本量标签的训练样本,该图像分类模型中尾部样本量类别和中部样本量类别的训练图像对应的子logit参数进行调整的调整幅度为0。本申请实施例不限定样本量类别不属于样本量集合的训练图像对应的子logit参数的调整幅度的具体数值,只要小于样本量类别属于样本量类别集合的训练图像对应的子logit参数的调整幅度即可。
当样本量类别属于样本量类别集合的训练图像对应的子logit参数的调整幅度,可以根据训练图像的特征类别标签对应的样本量确定。也就是说,当某一个图像分类模型侧重于学习头部样本量标签的训练样本,即该图像分类模型的样本量类别集合中只包括头部样本量类别,中部样本量类别和尾部样本量类别都不属于该图像分类模型的样本量类别集合。对该图像分类模型中头部样本量类别对应的每个特征类别的子logit参数进行调整时,可以根据每个特征类别的训练图像的样本量确定。例如,头部样本量类别对应的特征类别标签的训练图像的样本量越大,子logit参数的调整幅度越小。
在进行调整子logit参数时,也可以通过上文中子Logit参数包括的调整量a进行确定:
当a为预定值时,样本量类别属于样本量类别集合的训练图像对应的a值大于样本量类别不属于样本量集合的训练图像对应的a值,使得样本量类别属于样本量类别集合的训练图像对应的子logit参数的调整幅度大于样本量类别不属于样本量集合的训练图像对应的子logit参数的调整幅度,进而实现不同的图像分类模型更加关注不同的样本量类别对应的训练图像。
作为一种可能的实现方式,样本量类别不属于样本量集合的训练图像对应的a值可以为0。
调整量a值可以根据进行确定,其中nj为第j个特征类别的样本数量。例如,当某一个图像分类模型侧重于学习头部样本量标签的训练样本,头部样本量标签对应的特征类别的样本量,决定了a值,根据公式可知,训练图像的样本量类别标签对应的样本量越大,即nj越大,调整量a值越小,子logit参数的调整幅度越小。作为一种示例,某个图像分类模型侧重尾部样本量类别,则对尾部样本量类别对应的a值进行确定,进而实现对尾部样本量类别对应的子logit参数进行降低,将头部样本量类别和中部样本量类别的a设置为0,即对子logit参数不做调整,根据尾部样本量类别中对应的特征类别的训练图像的样本量确定每个特征类别的a值,即利用公式确定尾部样本量类别对应的每个特征类别的a值,当尾部样本量类别对应的每个特征类别的样本量越小,a值越大,调整量越大,子logit参数的调整幅度越大。
综上可知,通过对每个图像分类模型的子logit参数进行不同的调整,使得每个图像分类模型针对不同样本量类别标签对应的训练图像进行训练,对属于该图像分类模型的样本量类别集合中的训练图像进行较大的logit参数调整,对不属于该图像分类模型的样本量类别集合中的训练图像的logit参数进行较小的调整或不做调整。
在本申请实施例中,在训练图像分类模型时,根据每个图像分类模型的子logit参数确定多个图像分类模型的总logit参数可以有以下两种实现方式:
作为一种可能的实现方式,可以根据每个图像分类模型的子logit参数的平均值确定多个图像分类模型的总logit参数,以总logit参数训练多个图像分类模型,这样能够减少图像分类模型的计算量,节省训练时长。
可选的,总logit参数和子logit参数均为C维向量,C为特征类别的数目,C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,总logit参数的第j个数据为每个图像分类模型对应的子logit参数的第j个数据的平均值。
作为另一种可能的实现方式,可以训练另一个神经网络模型,对每个图像分类模型输出的子logit参数进行优化,得到最终的总logit参数,进一步提升图像分类的分类效果。在本申请实施例中,该用于优化图像分类模型的神经网络模型可以叫做路由网络模型。该路由网络模型用于确定每个图像分类模型中每个特征类别的权重,之后根据每个图像分类模型的子logit参数和每个图像分类模型的对应每个特征类别的权重,确定多个图像分类模型的总logit参数。
可选的,总logit参数和子logit参数均为C维向量,C为特征类别的数目,C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,总logit参数的第j个数据根据子logit参数的第j个数据分别与每个图像分类模型对应第j个类别的权重的乘积之和得到。例如,每个图像分类模型的输出为一个C维的子logit向量,路由网络模型的输出为N×C维的矩阵,其中,N为图像分类模型的数目,每个图像分类模型都有一个权重向量Wi,则Wi,j代表第i个图像分类模型中第j个特征类别对应的权重,总logit参数的第j个数据根据子logit参数的第j个数据分别与每个图像分类模型对应第j个类别的权重的乘积之和得到,则总logit参数logit′可以表示为
参考图2所示,为本申请实施例提供的神经网络模型示意图。本申请实施例中的模型主要包括图像分类模型、路由网络模型和骨干网络模型。骨干网络模型用于将多个训练图像编码为向量,即骨干网络模型的输入为多个训练图像,骨干网络模型的输出为与每个训练图像分别对应的向量。将所有的训练图像对应的向量分别输入多个图像分类模型进行训练,每个图像分类模型的输出结果为一个C维的子logit参数,C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,由于训练过程中每个图像分类模型侧重学习不同样本量类别对应的训练图像,因此每个图像分类模型输出的子logit参数不同。对路由网络模型进行训练,路由网络模型的输出为N×C维的矩阵,即N×C个权重,N为图像分类模型的数目,C为特征类别的数目。每一个图像分类模型对应一个权重向量Wi,权重向量Wi的每一个元素Wi,j为第i个图像分类模型中第j个特征类别对应的权重。利用每个图像分类模型的子logit参数分别与每个图像分类模型权重的乘积之和得到总logit参数,即根据总logit参数对多个图像分类模型进行训练。
本申请实施例提供了一种模型训练方法,多个图像分类模型是利用不同样本量类别进行训练的,样本量类别是根据训练图像的特征类别对应的样本量的大小对特征类别划分得到的,使得多个图像分类模型在进行图像分类训练时侧重训练不同样本量类别的训练图像,图像分类效果增强。
基于上述实施例提供的模型训练方法,本申请实施例还提供了一种图像分类方法,所述图像分类方法中利用的模型主要是经过模型训练方法训练后的模型。
参见图3,该图为本申请实施例提供的一种图像分类方法的流程图。
本实施例提供的图像分类方法包括如下步骤:
S301,获取目标图像。
在本申请的实施例中,目标图像可以是待分类的图像,目标图像是没有对应的样本量类别标签和特征类别标签的图像。目标图像可以是图片,也可以是视频中的某一帧。
S302,将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述每多个图像分类模型均根据多个训练图像训练得到,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到。
在本申请的实施例中,可以将目标图像分别输入到多个图像分类模型进行分类,分别得到每个图像分类模型输出的分类结果。
其中,多个图像分类模型采用本申请实施例提供的模型训练方法进行训练,具体训练方法参考上述实施例,在此不再赘述。
在实际应用中,可以将目标图像输入至骨干网络模型之后,即将目标图像转换为向量之后,再将目标图像对应的向量输入到多个图像分类模型中。
S303,根据所述每个图像分类模型分别输出的分类结果,确定所述目标图像的类别。
在本申请的实施例中,将目标图像输入到多个图像分类模型,得到每个图像分类模型输出的分类结果后,即可确定目标图像的类别。
在实际应用中,若采用路由网络模型对图像分类模型的输出结果进行优化,得到每个图像分类模型中每个特征类别的权重,之后根据每个图像分类模型的子logit参数和每个图像分类模型的对应每个特征类别的权重,确定多个图像分类模型的总logit参数,其中,路由网络模型采用本申请实施例提供的模型训练方法进行训练,具体训练方法参考上述实施例,在此不再赘述。
本申请实施例提供了一种图像分类方法,利用多个图像分类模型对目标图像进行类别识别,多个图像分类模型是利用不同样本量类别进行训练的,样本量类别是根据训练图像的特征类别对应的样本量的大小对特征类别划分得到的,使得多个图像分类模型在进行图像分类训练时侧重训练不同样本量类别的训练图像,图像分类效果增强。
基于以上实施例提供的一种图像分类方法,本申请实施例还提供了一种图像分类装置,下面结合附图来详细说明其工作原理。
参见图4,该图为本申请实施例提供的一种图像分类装置的结构框图。
本实施例提供的图像分类装置400包括:
获取单元410,用于获取目标图像;
输入单元420,用于将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述每个图像分类模型均根据多个训练图像训练得到,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到;
确定单元430,用于根据所述每个图像分类模型分别输出的分类结果,确定所述目标图像的类别。
可选的,在训练的过程中,所述每个图像分类模型的子罗吉特logit参数分别根据对应子logit参数的调整幅度确定,所述子logit参数的调整幅度根据所述训练图像的样本量类别确定,所述子logit参数包括每个所述特征类别标签对应的特征类别的置信度的相对值;
其中,不同的图像分类模型对应不同的样本量类别集合,所述样本量类别集合包括一种或多种样本量类别;
针对每个图像分类模型而言,样本量类别属于对应样本量类别集合的训练图像对应的子logit参数的调整幅度,大于样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度。
可选的,所述样本量类别属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度,根据所述训练图像的特征类别标签对应的样本量确定。
可选的,所述样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度为0。
可选的,所述装置还包括:
第一训练单元,用于在训练的过程中,根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数;
第二训练单元,用于根据所述总logit参数训练所述多个图像分类模型。
可选的,所述第一训练单元根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数包括:
所述第一训练单元根据所述每个图像分类模型的子logit参数和所述每个图像分类模型的对应每个特征类别的权重,确定所述多个图像分类模型的总logit参数;所述总logit参数和所述子logit参数均为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,所述总logit参数的第j个数据根据所述子logit参数的第j个数据分别与所述每个图像分类模型对应第j个类别的权重的乘积之和得到。
可选的,所述总logit参数和所述子logit参数为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值;
所述总logit参数的第j个数据为所述每个图像分类模型对应的子logit参数的第j个数据的均值。
基于以上实施例提供的一种图像分类方法,本申请实施例还提供了一种图像分类设备,图像分类设备500包括:
处理器510和存储器520,处理器的数量可以一个或多个。在本申请的一些实施例中,处理器和存储器可通过总线或其它方式连接。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括NVRAM。存储器存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
处理器控制终端设备的操作,处理器还可以称为CPU。
上述本申请实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例的一种翻译方法中的任意一种实施方式。
当介绍本申请的各种实施例的元件时,冠词“一”、“一个”、“这个”和“所述”都意图表示有一个或多个元件。词语“包括”、“包含”和“具有”都是包括性的并意味着除了列出的元件之外,还可以有其它元件。
需要说明的是,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元及模块可以是或者也可以不是物理上分开的。另外,还可以根据实际的需要选择其中的部分或者全部单元和模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (16)
1.一种图像分类方法,其特征在于,所述方法包括:
获取目标图像;
将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述每个图像分类模型均根据多个训练图像训练得到,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到;
根据所述每个图像分类模型分别输出的分类结果,确定所述目标图像的类别。
2.根据权利要求1所述的方法,其特征在于,
在训练的过程中,所述每个图像分类模型的子罗吉特logit参数分别根据对应子logit参数的调整幅度确定,所述子logit参数的调整幅度根据所述训练图像的样本量类别确定,所述子logit参数包括每个所述特征类别标签对应的特征类别的置信度的相对值;
其中,不同的图像分类模型对应不同的样本量类别集合,所述样本量类别集合包括一种或多种样本量类别;
针对每个图像分类模型而言,样本量类别属于对应样本量类别集合的训练图像对应的子logit参数的调整幅度,大于样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度。
3.根据权利要求2所述的方法,其特征在于,所述样本量类别属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度,根据所述训练图像的特征类别标签对应的样本量确定。
4.根据权利要求2所述的方法,其特征在于,所述样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度为0。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在训练的过程中,根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数;
根据所述总logit参数训练所述多个图像分类模型。
6.根据权利要求5所述的方法,其特征在于,所述根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数包括:
根据所述每个图像分类模型的子logit参数和所述每个图像分类模型的对应每个特征类别的权重,确定所述多个图像分类模型的总logit参数;所述总logit参数和所述子logit参数均为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,所述总logit参数的第j个数据根据所述子logit参数的第j个数据分别与所述每个图像分类模型对应第j个类别的权重的乘积之和得到。
7.根据权利要求5所述的方法,其特征在于,所述总logit参数和所述子logit参数为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值;
所述总logit参数的第j个数据为所述每个图像分类模型对应的子logit参数的第j个数据的均值。
8.一种图像分类装置,其特征在于,所述装置包括:
获取单元,用于获取目标图像;
输入单元,用于将所述目标图像输入到多个图像分类模型,分别得到每个图像分类模型输出的分类结果,所述每个图像分类模型均根据多个训练图像训练得到,所述多个训练图像中的每个训练图像包括对应的特征类别标签和样本量类别标签,所述特征类别标签根据所述训练图像的图像特征确定,所述样本量类别标签用于标识所述训练图像的样本量类别,所述样本量类别根据所述训练图像的特征类别对应的样本量的大小对所述特征类别划分得到;
确定单元,用于根据所述每个图像分类模型分别输出的分类结果,确定所述目标图像的类别。
9.根据权利要求8所述的方法,其特征在于,在训练的过程中,所述每个图像分类模型的子罗吉特logit参数分别根据对应子logit参数的调整幅度确定,所述子logit参数的调整幅度根据所述训练图像的样本量类别确定,所述子logit参数包括每个所述特征类别标签对应的特征类别的置信度的相对值;
其中,不同的图像分类模型对应不同的样本量类别集合,所述样本量类别集合包括一种或多种样本量类别;
针对每个图像分类模型而言,样本量类别属于对应样本量类别集合的训练图像对应的子logit参数的调整幅度,大于样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度。
10.根据权利要求9所述的装置,其特征在于,所述样本量类别属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度,根据所述训练图像的特征类别标签对应的样本量确定。
11.根据权利要求9所述的装置,其特征在于,所述样本量类别不属于所述样本量类别集合的训练图像对应的子logit参数的调整幅度为0。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第一训练单元,用于在训练的过程中,根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数;
第二训练单元,用于根据所述总logit参数训练所述多个图像分类模型。
13.根据权利要求12所述的装置,其特征在于,所述第一训练单元根据所述每个图像分类模型的子logit参数确定所述多个图像分类模型的总logit参数包括:
所述第一训练单元根据所述每个图像分类模型的子logit参数和所述每个图像分类模型的对应每个特征类别的权重,确定所述多个图像分类模型的总logit参数;所述总logit参数和所述子logit参数均为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值,所述总logit参数的第j个数据根据所述子logit参数的第j个数据分别与所述每个图像分类模型对应第j个类别的权重的乘积之和得到。
14.根据权利要求12所述的方法,其特征在于,所述总logit参数和所述子logit参数为C维向量,所述C等于所述特征类别的数目,所述C维向量中第j个数据表示第j个特征类别对应的置信度的相对值;
所述总logit参数的第j个数据为所述每个图像分类模型对应的子logit参数的第j个数据的均值。
15.一种图像分类设备,其特征在于,所述设备包括:处理器和存储器;
所述存储器,用于存储指令;
所述处理器,用于执行所述存储器中的所述指令,执行如权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110571983.4A CN113222043B (zh) | 2021-05-25 | 2021-05-25 | 一种图像分类方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110571983.4A CN113222043B (zh) | 2021-05-25 | 2021-05-25 | 一种图像分类方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113222043A true CN113222043A (zh) | 2021-08-06 |
CN113222043B CN113222043B (zh) | 2024-02-02 |
Family
ID=77098267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110571983.4A Active CN113222043B (zh) | 2021-05-25 | 2021-05-25 | 一种图像分类方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113222043B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627551A (zh) * | 2021-08-17 | 2021-11-09 | 平安普惠企业管理有限公司 | 基于多模型的证件分类方法、装置、设备和存储介质 |
CN113989519A (zh) * | 2021-12-28 | 2022-01-28 | 中科视语(北京)科技有限公司 | 一种长尾目标检测方法及系统 |
CN115130539A (zh) * | 2022-04-21 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 分类模型训练、数据分类方法、装置和计算机设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886335A (zh) * | 2019-02-21 | 2019-06-14 | 厦门美图之家科技有限公司 | 分类模型训练方法及装置 |
CN110442722A (zh) * | 2019-08-13 | 2019-11-12 | 北京金山数字娱乐科技有限公司 | 分类模型训练的方法及装置、数据分类的方法及装置 |
CN111814913A (zh) * | 2020-08-20 | 2020-10-23 | 深圳市欢太科技有限公司 | 图像分类模型的训练方法、装置、电子设备及存储介质 |
CN111860573A (zh) * | 2020-06-04 | 2020-10-30 | 北京迈格威科技有限公司 | 模型训练方法、图像类别检测方法、装置和电子设备 |
CN112348110A (zh) * | 2020-11-18 | 2021-02-09 | 北京市商汤科技开发有限公司 | 模型训练及图像处理方法、装置、电子设备和存储介质 |
WO2021093096A1 (zh) * | 2019-11-11 | 2021-05-20 | 深圳市商汤科技有限公司 | 图像分类模型训练方法、图像处理方法及装置 |
CN112825143A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 深度卷积神经网络压缩方法、装置、存储介质及设备 |
-
2021
- 2021-05-25 CN CN202110571983.4A patent/CN113222043B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886335A (zh) * | 2019-02-21 | 2019-06-14 | 厦门美图之家科技有限公司 | 分类模型训练方法及装置 |
CN110442722A (zh) * | 2019-08-13 | 2019-11-12 | 北京金山数字娱乐科技有限公司 | 分类模型训练的方法及装置、数据分类的方法及装置 |
WO2021093096A1 (zh) * | 2019-11-11 | 2021-05-20 | 深圳市商汤科技有限公司 | 图像分类模型训练方法、图像处理方法及装置 |
CN112825143A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 深度卷积神经网络压缩方法、装置、存储介质及设备 |
CN111860573A (zh) * | 2020-06-04 | 2020-10-30 | 北京迈格威科技有限公司 | 模型训练方法、图像类别检测方法、装置和电子设备 |
CN111814913A (zh) * | 2020-08-20 | 2020-10-23 | 深圳市欢太科技有限公司 | 图像分类模型的训练方法、装置、电子设备及存储介质 |
CN112348110A (zh) * | 2020-11-18 | 2021-02-09 | 北京市商汤科技开发有限公司 | 模型训练及图像处理方法、装置、电子设备和存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113627551A (zh) * | 2021-08-17 | 2021-11-09 | 平安普惠企业管理有限公司 | 基于多模型的证件分类方法、装置、设备和存储介质 |
CN113989519A (zh) * | 2021-12-28 | 2022-01-28 | 中科视语(北京)科技有限公司 | 一种长尾目标检测方法及系统 |
CN113989519B (zh) * | 2021-12-28 | 2022-03-22 | 中科视语(北京)科技有限公司 | 一种长尾目标检测方法及系统 |
CN115130539A (zh) * | 2022-04-21 | 2022-09-30 | 腾讯科技(深圳)有限公司 | 分类模型训练、数据分类方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113222043B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113222043A (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN111950723B (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
CN106570464B (zh) | 一种快速处理人脸遮挡的人脸识别方法及装置 | |
CN111340195B (zh) | 网络模型的训练方法及装置、图像处理方法及存储介质 | |
CN110263819A (zh) | 一种用于贝类图像的目标检测方法及装置 | |
CN109840883B (zh) | 一种训练物体识别神经网络的方法、装置及计算设备 | |
CN104537359B (zh) | 一种车辆目标检测方法及装置 | |
CN110533046B (zh) | 一种图像实例分割方法、装置、计算机可读存储介质及电子设备 | |
CN111401374A (zh) | 基于多任务的模型训练方法、字符识别方法及装置 | |
CN110096617B (zh) | 视频分类方法、装置、电子设备及计算机可读存储介质 | |
CN113689436A (zh) | 图像语义分割方法、装置、设备及存储介质 | |
CN114419378B (zh) | 图像分类的方法、装置、电子设备及介质 | |
CN113240032B (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN110428012A (zh) | 脑网络模型建立方法、脑图像分类方法、装置及电子设备 | |
CN113177603B (zh) | 分类模型的训练方法、视频分类方法及相关设备 | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN112418098B (zh) | 视频结构化模型的训练方法及相关设备 | |
CN112669270B (zh) | 视频质量的预测方法、装置及服务器 | |
CN113378853A (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN113902001A (zh) | 一种模型训练方法、装置、电子设备及存储介质 | |
CN115393914A (zh) | 多任务模型训练方法、装置、设备及存储介质 | |
CN112712550A (zh) | 一种图像质量评价方法及装置 | |
CN113807428B (zh) | 分类模型概率标签的重构方法、系统、装置及存储介质 | |
CN112036293A (zh) | 年龄估计方法、年龄估计模型的训练方法及装置 | |
CN114120053A (zh) | 图像处理方法、网络模型的训练方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |