WO2024016945A1

WO2024016945A1 - 图像分类模型的训练方法、图像分类方法及相关设备

Info

Publication number: WO2024016945A1
Application number: PCT/CN2023/102430
Authority: WO
Inventors: 吕永春; 朱徽; 周迅溢; 蒋宁; 吴海英
Original assignee: 马上消费金融股份有限公司
Priority date: 2022-07-19
Filing date: 2023-06-26
Publication date: 2024-01-25
Also published as: CN117456219A

Abstract

本申请公开了一种图像分类模型的训练方法、图像分类方法及相关设备，所述训练方法包括：获取图像集；通过图像分类模型中的目标图像分类子模型，对有标签图像和无标签图像进行分类识别，得到有标签图像的第一分类参考信息和无标签图像的第一分类参考信息；通过图像分类模型中的非目标图像分类子模型对无标签图像进行分类识别，得到无标签图像的第二分类参考信息；基于有标签图像的第一分类参考信息、有标签图像对应的类别标签以及无标签图像的第二分类参考信息，确定目标图像分类子模型的分类损失；基于第一图像分类子模型的分类损失和第二图像分类子模型的分类损失，调整图像分类模型的模型参数。

Description

图像分类模型的训练方法、图像分类方法及相关设备

交叉引用

本申请要求在2022年07月19日提交中国专利局、申请号为202210872051.8、发明名称为“图像分类模型的训练方法、图像分类方法及相关设备”的中国专利申请的优先权，该申请的全部内容通过引用结合在本发明中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种图像分类模型的训练方法、图像分类方法及相关设备。

背景技术

半监督学习(Semi-Supervised Learning，SSL)是模式识别和机器学习领域研究的重点问题，是监督学习和无监督学习相结合的一种学习方式。近年来，半监督学习在图像分类等领域得到了广泛应用。

发明内容

本申请提供一种图像分类模型的训练方法、图像分类方法及相关设备，用于解决现有的图像分类模型的训练效果不佳的问题而影响最终的图像分类准确性和稳定性的问题。

本申请实施例采用下述技术方案：

一方面，本申请实施例提供一种图像分类模型的训练方法，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述方法包括：获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；通过所述图像分类模型中的目标图像分类子模型，分别对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；所述目标图像分类子模型为所述第一图像分类子模型或所述第二图像分类子模型；基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失；所述无标签图像的第二分类参考信息为通过所述图像分类模型中除所述目标图像分类子模型之外的其他图像分类子模型对所述无标签图像进行分类识别得到；所述目标图像分类子模型的分类损失是指所述第一图像分类子模型的分类损失或所述第二图像分类子模型的分类损失；基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。

一方面，本申请实施例提供一种图像分类方法，包括：通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于第一方面所述的训练方法训练得到；基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。

一方面，本申请实施例提供一种图像分类模型的训练装置，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述训练装置包括：获取单元，用于获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；分类单元，用于通过所述图像分类模型中的目标图像分类子模型，分别对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；所述目标图像分类子模型为所述第一图像分类子模型或所述第二图像分类子模型；确定单元，用于基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失；所述无标签图像的第二分类参考信息为通过所述图像分类模型中除所述目标图像分类子模型之外的其他图像分类子模型对所述无标签图像进行分类识别得到；所述目标图像分类子模型的分类损失是指所述第一图像分类子模型的分类损失或所述第二图像分类子模型的分类损失；调整单元，用于基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。

一方面，本申请实施例提供一种图像分类装置，包括：分类单元，用于通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于上述训练方法训练得到；确定单元，用于基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。

第五方面，本申请实施例提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现上述的方法。

一方面，本申请实施例提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述的方法。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于描述本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请的一个实施例提供的一种图像分类模型的训练方法的流程示意图；

图2为本申请的另一个实施例提供的一种图像分类模型的训练方法的流程示意图；

图3为本申请的一个实施例提供的一种图像分类方法的流程示意图；

图4为本申请的一个实施例提供的一种图像分类模型的训练装置的结构示意图；

图5为本申请的一个实施例提供的一种图像分类装置的结构示意图；

图6为本申请的一个实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本申请实施例中的技术方案，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应理解，这样使用的数据在适当情况下可以互换，以便本申请实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，本说明书和权利要求书中“和/或”表示所两节对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。

现有的图像分类模型的训练方法，由采用预先训练好的教师网络为样本图像生成伪标签，再由学生网络利用带伪标签的样本图像等进行半监督学习，形成最终的图像分类模型。但是，由于伪标签完全是由教师网络从样本图像中学习的信息转换产生，这不利于学生网络对样本图像中包含的信息进行充分挖掘和利用，尤其是在训练前期，教师网络生成的伪标签的置信度不高，导致图像分类模型的训练效果不佳，进而影响最终的图像分类准确性和稳定性。

有鉴于此，本申请实施例提出了一种图像分类模型的训练方法，在半监督学习框架下，将图像分类模型的各图像分类子模型之间单向的师生关系改进为互为师生关系，利用一个图像分类子模型从样本图像中学习的信息，为另一个图像分类子模型提供进行半监督学习的伪标签，使得各个图像分类子模型之间互补学习、教学相长，进而使得样本图像中包含的信息能够得到充分挖掘和利用，从而提高图像分类模型的训练效果，得到更准确、更可靠的图像分类模型。

本申请实施例还提出了一种图像分类方法，利用训练得到的图像分类模型可以准确对图像进行分类识别。

应理解，本申请实施例提供的图像分类模型的训练方法和图像分类方法，均可以电子设备或安装在电子设备中的软件执行。此处所谓的电子设备可以包括终端设备，比如智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端、飞行器等；或者，电子设备还可以包括服务器，比如独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。

以下结合附图，详细说明本申请各实施例提供的技术方案。

请参考图1，为本申请的一个实施例提供的一种图像分类模型的训练方法的流程示意图，该方法可以包括如下步骤：

S102，获取用于对图像分类模型进行训练的图像集。

其中，图像集中包括有标签图像、无标签图像以及有标签图像对应的类别标签。

有标签图像是指具有对应的类别标签的图像，无标签图像是指不具有对应的类别标签的图像。实际应用中，为进一步提高图像分类模型的分类准确性，图像集可以包括多个有标签图像和多个无标签图像，多个有标签图像可以属于不同的类别。

其中，有标签图像的类别标签用于表示有标签图像所属的真实类别，具体可以表示有标签图像呈现的内容所属的真实类别。例如，有标签图像所属的类别可以是人物、动物、风景等类别；又如，有标签图像所属的类别也可以是某个大类别下细分出的子类别，比如对于人物这个大类而言，有标签图像所属的类别可以是情绪低落、高兴、愤怒等，或者，也可以是真实人脸、伪造人脸等；又如，对于动物这个大类而言，有标签图像所属的类别可以是猫、狗、马、骡子等。实际应用中，有标签图像对应的类别标签可以具有任意适当的形式，比如，有标签图像对应的类别标签可以是对有标签图像所属的真实类别进行独热编码(one-hot)编码得到，或者，也可以是对有标签图像所属的真实类别进行词嵌入得到，本申请实施例对类别标签的形式不作限定。

S104，通过图像分类模型中的目标图像分类子模型，分别对有标签图像和无标签图像进行分类识别，得到有标签图像的第一分类参考信息和无标签图像的第一分类参考信息。

为了能够在有标签图像的数量有限的情况下，训练出高准确性和高可靠性的图像分类模型，如图2所示，本申请实施例的图像分类模型可以包括第一图像分类子模型和第二图像分类子模型，第一图像分类子模型和第二图像分类子模型均可以对图像集中的每个图像进行分类识别，得到相应的分类参考信息。在此基础上，采用半监督学习方式对该图像分类模型进行训练，得到最终的图像分类模型。实际应用中，第一图像分类子模型和第二图像分类子模型可以具有相同的网络结构，或者，为了简化模型结构，以实现图像分类模型的压缩与加速，第一图像分类子模型和第二图像分类子模型也可以具有不同的网络结构，比如第二图像分类子模型相较于第一图像分类子模型采用了更精简的结构。

本申请实施例中，目标图像分类子模型为第一图像分类子模型或第二图像分类子模型。也即，可分别将第一图像分类子模型和第二图像分类子模型作为目标图像分类子模型，通过上述S104，识别出有标签图像对应于每个图像分类子模型的分类参考信息以及无标签图像对应于每个图像分类子模型的分类参考信息。

为了便于区分，将有标签图像对应于目标图像分类子模型的分类参考信息称为有标签图像的第一分类参考信息，将有标签图像对应于图像分类模型中除目标图像分类子模型以外的另一图像分类子模型称为有标签图像的第二分类参考信息。同样地，将无标签图像对应于目标图像分类子模型的分类参考信息称为无标签图像的第一分类参考信息，将无标签图像对应于图像分类模型中除目标图像分类子模型以外的另一图像分类子模型称为无标签图像的第二分类参考信息。

有标签图像的分类参考信息可以包括如下信息中的至少一种：有标签图像被识别为属于多个预设类别中每个预设类别的概率、有标签图像所属的类别等；同样地，无标签图像的分类参考信息可以包括如下信息中的至少一种：无标签图像被识别为属于多个预设类别中每个预设类别的概率、无标签图像所属的类别等。示例地，多个预设类别包括猫、狗、马、骡子，每个图像的分类参考信息可以包括每个图像被识别为分别属于猫、狗、马、骡子的概率，每个图像所属的类别可以为这多个预设类别中最大概率对应的类别。

为使图像分类模型中的各个图像分类子模型能够对图像集的图像进行充分理解和学习，以提高图像分类模型的表达能力，图像集中的图像可以是对初始图像进行数据增强处理得到。也即，在上述S102之前，本申请实施例提供的图像分类模型的训练方法还可以包括：对初始图像集中的图像进行数据增强处理，得到用于对图像分类模型进行训练的图像集，从而使得得到的图像集中的图像包含了扰动信息。其中，初始图像集包括初始无标签图像和初始有标签图像。

对于初始无标签图像，可对初始无标签图像进行多种增强程度的数据增强处理，得到无标签图像，其中，无标签图像的数量为多个，每个无标签图像与一种增强强度对应。相应地，在上述S104中，可通过目标图像分类子模型，对有标签图像进行分类识别，得到有标签图像的第一分类参考信息，以及通过目标图像分类子模型，分别对多个无标签图像中的每个无标签图像进行分类识别，得到每个无标签图像的第一分类参考信息。

对初始无标签图像进行多种增强程度的数据增强处理，具体可以实现为：对初始无标签图像进行弱增强(Weakly-augmented)处理，得到第一类无标签图像，以及对初始无标签图像进行强增强图像(Strongly-augmented)处理，得到第二类无标签图像。也即，无标签图像包括第一类无标签图像和第二类无标签图像，第一类无标签图像对应的增强程度小于第二类无标签图像对应的增强程度。

弱增强处理具体可以包括但不限于如下处理方式中的至少一种：平移、翻转等，强增强处理可以包括但不限于如下处理方式中的至少一种：遮挡、颜色变换、随机消除(Random Erase)等。

可以理解的是，由于弱增强处理的增强程度较小，也即向初始无标签图像引入的扰动较小，不至于使得到的第一类无标签图像失真，使得目标图像分类子模型在得到准确的第一分类参考信息的基础上学习到第一类无标签图像中的噪声，有利于提高目标图像分类子模型的学习效果；此外，考虑到仅用弱增强图像可能会导致目标图像分类子模型陷入过拟合状态，无法提取到第一类无标签图像的本质特征，而强增强处理引入的扰动较大，可能带来第一类无标签图像的失真，但仍然能够保留足以辨认类别的特征，通过对初始无标签图像分别进行弱增强处理和强增强处理后，输入目标图像分类子模型，由目标图像分类子模型对不同增强程度的无标签图像进行学习，有利于提高目标图像分类子模型的学习效果，增强目标图像分类子模型的表达能力。

可选地，为进一步提高目标图像分类子模型的表达能力，在上述S104之前，本申请实施例提供的图像分类模型的训练方法还可以包括：对初始图像集中的初始有标签图像进行弱增强处理，得到有标签图像。

S106，基于有标签图像的第一分类参考信息、有标签图像对应的类别标签以及无标签图像的第二分类参考信息，确定目标图像分类子模型的分类损失。

其中，无标签图像的第二分类参考信息通过图像分类模型中除目标图像分类子模型之外的其他图像分类子模型对无标签图像进行分类识别得到。

换句话说，在上述S106中，对于第一图像分类子模型，可基于图像集中的有标签图像对应于第一图像分类子模型的分类参考信息、有标签图像对应的类别标签、以及图像集中的无标签图像对应于第二图像分类子模型的分类参考信息，确定第一图像分类子模型的分类损失；对于第二图像分类子模型，可基于图像集中的有标签图像对应于第二图像分类子模型的分类参考信息、有标签图像对应的类别标签、以及图像集中的无标签图像对应于第一图像分类子模型的分类参考信息，确定第二图像分类子模型的分类损失。

这样，第一图像分类子模型和第二图像分类子模型彼此之间可以利用自身学习的信息为对方提供指导，使得第一图像分类子模型和第二图像分类子模型之间由单向的师生关系变为互为师生关系，有利于各个图像分类子模型之间互补学习、教学相长，使得图像集中的图像包含的信息得到充分挖掘和利用，从而有利于提高图像分类模型的训练效果。

本申请实施例中，对于每个图像分类子模型而言，该图像分类子模型的分类损失用于表示该图像分类子模型针对输入的图像进行分类识别所得到的分类参考信息与输入的图像对应的类别标签所表示的类别之间的差异。

考虑到各个图像分类子模型基于输入的图像集所进行的学习任务是半监督学习任务，其结合了基于有标签图像及其对应的类别标签的有监督学习任务以及基于无标签图像的无监督学习任务，每种学习任务均可能产生一定的分类损失，为此，目标图像分类子模型的分类损失可以包括目标图像分类子模型的有监督损失和无监督损失，其中，目标图像分类子模型的有监督损失用于表示目标图像分类子模型进行有监督学习任务所产生的分类损失，目标图像分类子模型的无监督损失用于表示目标图像分类子模型进行无监督学习任务所产生的分类损失。

在一种可选的实现方案中，目标图像分类子模型的有监督损失可基于图像集中的有标签图像的第一分类参考信息以及有标签图像对应的类别标签确定，目标图像分类子模型的无监督损失可基于图像集中的无标签图像的第一分类参考信息及第二分类参考信息确定。

在另一种可选的实现方式中，为使目标图像分类子模型能够对输入的图像进行充分理解和学习，以提高目标图像分类子模型的表达能力，无标签图像是在对初始无标签图像进行多种增强程度的数据增强处理后才输入到目标图像分类子模型中的，因而得到的无标签图像的第一分类参考信息，包括每个无标签图像的第一分类参考信息。相应地，目标图像分类子模型的有监督损失可基于图像集中的有标签图像的第一分类参考信息以及有标签图像对应的类别标签确定，目标图像分类子模型的无监督损失可基于图像集中的无标签图像的第一分类参考信息确定和第二分类参考信息。

上述无标签图像包括第一类无标签图像和第二类无标签图像，第一类无标签图像对应的增强程度小于第二类无标签图像对应的增强程度，相应地，上述S106具体可以包括如下步骤：

S161，基于第一类无标签图像的第二分类参考信息，生成第一类无标签图像对应的第一伪标签。

由于第一类无标签图像本身不具有对应的类别标签，基于第一类无标签图像的第二分类参考信息，生成第一类无标签图像对应的第一类伪标签，相当于是为第一类无标签图像打上人工标签，以表示第一类无标签图像所属的预测类别，从而为目标图像分类子模型的无监督学习任务提供指导。实际应用中，第一类无标签图像对应的第一伪标签可用于指示第一类无标签图像所属的预测类别。当然，第一类无标签图像对应的第一类伪标签还可用于指示第一类无标签图像中的第一目标对象区域以及第一目标对象区域所属的预测类别，其中，第一目标对象区域是指目标图像分类子模型识别到的第一类无标签图像中的目标对象所在的区域。比如，在人脸分类识别场景下，第一目标对象区域是指第一类无标签图像中的人脸区域。

第一类无标签图像的第一分类参考信息包括第一类无标签图像被识别为属于多个预设类别中每个预设类别的概率，在此情形下，作为一种可选的方案，上述S141具体可实现为：基于第一类无标签图像的第二分类参考信息，从多个预设类别中确定最大概率对应的预设类别；若该预设类别对应的概率大于预设概率阈值，则基于该最大概率对应的预设类别，生成第一类无标签图像的第一类伪标签。

如图2所示，基于第二图像分类子模型针对第一类无标签图像输出的分类参考信息，从多个预设类别中确定最大概率对应的预设类别，若该预设类别对应的概率大于预设概率阈值，则基于该最大概率对应的预设类别，生成第一类无标签图像对应于第一图像分类子模型的伪标签；以及，基于第一图像分类子模型针对第一类无标签图像输出的分类参考信息，从多个预设类别中确定最大概率对应的预设类别，若该预设类别对应的概率大于预设概率阈值，则基于该最大概率对应的预设类别，生成第一类无标签图像对应于第二图像分类子模型的伪标签。

示例地，第一类无标签图像对应于第一图像分类子模型的伪标签可通过如下公式(1)确定，第一类无标签图像对应于第二图像分类子模型的伪标签可通过如下公式(2)确定：

其中，表示图像集中的第ζ个第一类无标签图像对应于第一图像分类子模型的伪标签，ONE_HOT表示独热编码，q₂表示第二图像分类子模型，表示第二图像分类子模型针对第一类无标签图像输出的分类参考信息，表示该分类参考信息中的最大概率，表示该最大概率对应的预设类别，γ表示预设概率阈值；表示第一类无标签图像对应于图像分类子模型的伪标签，q₁表示第一图像分类子模型，表示第一图像分类子模型针对第一类无标签图像输出的分类参考信息，表示该分类参考信息中的最大概率，表示该最大概率对应的预设类别。

由于第一类无标签图像对应的增强程度较小，也即向初始无标签图像引入的扰动较小，使得第一类无标签图像不至于失真，再加上在第一类无标签图像对应的分类参考信息中的最大概率大于预设概率阈值时，才基于该最大概率对应的预设类别生成相应的伪标签，可以极大程度降低在伪标签中引入噪声或错误的可能性，从而确保各个图像分类子模型在得到准确分类识别结果的基础上学习到第一类无标签图像中的噪声，有利于提高各个图像分类子模型的学习效果。

S162，第二类无标签图像的第一分类参考信息和第一类无标签图像对应的第一类伪标签，确定目标图像分类子模型的无监督损失。

可基于第一图像分类子模型针对图像集中的第二类无标签图像输出的分类参考信息以及无标签图像对应于第一图像分类子模型的伪标签，确定第一图像分类子模型的无监督损失；以及，基于第二图像分类子模型针对图像集中的无标签图像对应的第二类无标签图像所输出的分类参考信息、以及无标签图像对应于第二图像分类子模型的伪标签，确定第二图像分类子模型的无监督损失。

在上述S162中，可基于图像集中每个第二类无标签图像的第一分类参考信息、每个无标签图像的第一类伪标签以及预设损失函数，确定目标图像分类子模型的无监督损失。实际应用中，预设损失函数可以根据实际需要进行设置，例如包括但不限于交叉熵损失函数、分类损失函数、边界框回归损失函数中的至少一种。

示例地，可针对图像集中的每个第一类无标签图像，基于第二类无标签图像的第一分类参考信息、第一类无标签图像对应的第一类伪标签以及预设损失函数，确定第一类无标签图像对应的无监督子损失；进一步，将图像集中的每个第一类无标签图像对应的无监督子损失的加权和，确定为目标图像分类子模型的无监督损失。

可选地，考虑到在训练前期生成的伪标签的置信度通常不高，容易导致图像分类模型的训练效果不佳，可基于无标签图像对应的第一伪标签的置信度，为第一类无标签图像设置相应的损失权重，比如对具有高置信度的伪标签的第一类无标签图像赋予较高的损失权重，而对具有低置信度的第一类伪标签的无标签图像赋予较低的损失权重，从而可以一定程度上对第一类伪标签中的噪声进行对抗，有利于提高图像分类模型的训练效果。

在上述S162之前，本申请实施例提供的图像分类模型的训练方法还可以包括：基于第一类无标签图像对应的第一类伪标签和第一类无标签图像对应的第二类伪标签，确定第一类无标签图像对应的损失权重，其中，第一类无标签图像对应的第二类伪标签为基于第一类无标签图像的第一分类参考信息生成的，具体生成方式与基于第一类无标签图像的第一类伪标签的方式类似。相应地，上述S162中，基于第二类无标签图像的第一分类参考信息和第一类无标签图像对应的第一类伪标签，确定第一类无标签图像对应的无监督子损失，以及基于第一类无标签图像对应的损失权重和第一类无标签图像对应的无监督损失，确定目标图像分类子模型的无监督损失。示例地。可基于图像集中每个第一类无标签图像对应的损失权重，对图像集中每个第一类无标签图像对应的无监督子损失进行加权求和，得到目标图像分类子模型的无监督损失。

示例地，同一图像经不同的图像分类子模型预测之后得到的分类参考信息理论上应当相同，进而同一图像对应于不同图像分类子模型的伪标签也应当相同，对此，可将第一类无标签图像对应的第一类伪标签指示的预测类别和第一类无标签图像对应的第二类伪标签指示的预测类别进行比对处理，若两者不一致，则可确定第一类无标签图像的两个伪标签的置信度较低，进而可以为第一类无标签图像赋予较低的损失权重(即第一预设权重)；若两者一致，则可确定第一类无标签图像的两个伪标签的置信度较高，进而可以为第一类无标签图像赋予较高的损失权重(即第二预设权重)。

示例地，第一类无标签图像对应的第一类伪标签可用于指示第一类无标签图像中的第一目标对象区域、以及第一目标对象区域所属的预测类别，第一类无标签图像对应的第二类伪标签可用于指示第一类无标签图像中的第二目标对象区域、以及第二目标对象区域所属的预测类别。为确保为第一类无标签图像赋予的损失权重与第一类无标签图像对应的两个伪标签的置信度更匹配，可确定第一目标对象区域与第二目标对象区域之间的交并比以及，并将第一目标对象区域所属的预测类别与第二目标对象区域所属的预测类别进行比对，得到比对结果；进一步，基于交并比和比对结果，确定第一类无标签图像对应的损失权重。

例如，若交并比小于或等于预设比值或者比对结果表明第一目标对象区域所属的预测类别与第二目标对象区域所属的预测类别不一致，则可确定第一类无标签图像对应的第一类伪标签及第二类伪标签的置信度均较低，进而可以为第一类无标签图像赋予第一预设权重；若交并比大于预设比值、且比对结果表明第一目标对象区域所属的预测类别与第二目标对象区域所属的预测类别一致，则可确定第一类无标签图像对应的第一类伪标签及第二类伪标签的置信度均较低，进而可以为第一类无标签图像赋予第二预设权重，第二预设权重大于第一预设权重。

相应地，在上述S162中，可通过如下公式(3)确定目标图像分类子模型的无监督损失。

其中，表示目标图像分类子模型的无监督损失，N_u表示图像集中第一类无标签图像的数量，B表示图像集，表示图像集中的第b个第一类无标签图像，b∈h表示第b个第一类无标签图像对应的第一类伪标签及第二类伪标签的置信度均较高，b∈B\h表示第b个第一类无标签图像对应的第一类伪标签及第二类伪标签的置信度均较低，表示分类损失函数，表示边界框回归损失函数，表示第一类无标签图像对应对应的第一类伪标签，δ表示具有较高置信度伪标签的第一类无标签图像对应的损失权重。

可以理解的是，由于在训练前期生成的伪标签的置信度通常不高，容易导致图像分类模型的训练效果不佳，且通过不同的图像分类子模型对同一图像进行分类识别后所生成的伪标签理论上应当相同，基于此，基于第一类无标签图像分别对应于各个图像分类子模型的伪标签，即可判断伪标签的置信度，进而为第一类无标签图像设置相应的损失权重，可以在一定程度上对伪标签中的噪声进行对抗，有利于提高图像分类模型的训练效果。

S163，基于有标签图像的第一分类参考信息和有标签图像对应的类别标签，确定目标图像分类子模型的有监督损失。

示例地，可通过如下公式(4)确定目标图像分类子模型的有监督损失：

其中，表示目标图像分类子模型的有监督损失，N_l表示图像集中有标签图像的数量，表示图像集中第l个有标签图像，表示有标签图像对应的类别标签，表示分类损失函数，表示边界框回归损失函数。

S164，基于目标图像分类子模型的无监督损失及有监督损失，确定目标图像分类子模型的分类损失。

示例地，如下述公式(5)确定目标图像分类子模型的分类损失：

其中，表示目标图像分类子模型的分类损失，表示目标图像分类子模型的有监督损失，表示目标图像分类子模型的无监督损失，λ_u表示无监督损失对应的损失权重。

可以理解的是，图像分类模型中每个图像分类子模型基于图像集所进行都是半监督学习任务，其结合了基于有标签图像及其对应的类别标签的有监督学习、以及基于无标签图像及其对应的伪标签的无监督学习，每种学习任务下都可能会产生一定的分类损失。为此，对于每个图像分类子模型而言，基于该图像分类子模型针对有标签图像输出的分类参考信息以及有标签图像对应的类别标签，确定该图像分类子模型的有监督损失，使得有监督损失能够准确反映出该图像分类子模型在进行有监督学习任务时产生的分类损失；利用相同图像经过不同数据增强处理后输入到同一图像分类子模型得到的分类参考信息在理论上相同的规律，基于增强强度较小的第一类无标签图像对应于该图像分类子模型的分类参考信息，为第一类无标签图像生成对应于另一图像分类子模型的伪标签，而后利用第一类无标签图像对应于各个图像分类子模型的伪标签以及增强强度较大的第二类无标签图像对应于各个图像分类子模型的分类参考信息，确定各个图像分类子模型的无监督损失，不仅使得无监督损失能够准确反映出对应的图像分类子模型在进行无监督学习任务时产生的分类损失，还有利于各个图像分类子模型在无监督学习过程中，利用增强强度较小的第一类无标签图像的分类参考信息监督增强强度较大的第二类无标签图像的分类参考信息，从而有利于提高各个图像分类子模型的分类准确率。

本申请实施例在此示出了确定目标图像分类子模型的分类损失的一种具体实现方式。当然，应理解，目标图像分类子模型的分类损失也可以采用其它的方式确定，本申请实施例对此不作限定。

S108，基于第一图像分类子模型的分类损失和第二图像分类子模型的分类损失，调整图像分类模型的模型参数。

在一种可选的实现方式中，如图2所示，上述S108可以包括如下步骤：

S181，对第一图像分类子模型的分类损失和第二图像分类子模型的分类损失进行加权求和，得到图像分类模型的分类损失。

其中，图像分类模型的分类损失用于表示图像分类模型对输入的图像进行分类识别所得到的分类参考信息与输入的图像所属的真实类别之间的差异。示例地，图像分类模型的分类损失可通过如下公式(6)确定：

其中，表示图像分类模型的分类损失，表示第一图像分类子模型的分类损失，表示第二图像分类子模型的分类损失，表示第一图像分类子模型的有监督损失，表示第一图像分类子模型的无监督损失，表示第二图像分类子模型的有监督损失，表示第二图像分类子模型的无监督损失，λ_u表示无监督损失对应的损失权重。

S182，通过反向传播算法，基于图像分类模型的分类损失，调整图像分类模型的模型参数。

其中，图像分类模型的模型参数可以包括第一图像分类子模型的模型参数和第二图像分类子模型的模型参数。对于各个图像分类子模型而言，以神经网络为例，其模型参数可以包括但不限于该图像分类子模型中各网络层的神经元数量、不同网络层中的神经元之间的连接关系以及连接边权重、各网络层中的神经元对应的偏置等。

由于图像分类模型的分类损失能够反映图像分类模型对输入的图像进行分类识别所输出的分类参考信息与输入的图像所属的真实类别之间的差异，为得到高准确率的图像分类模型，可采用反向传播算法，基于图像分类模型的分类损失对第一图像分类子模型和第二图像分类子模型各自的模型参数进行调整。

在采用反向传播算法调整第一图像分类子模型和第二图像分类子模型各自的模型参数时，可基于图像分类模型的分类损失、第一图像分类子模型当前的模型参数和第二图像分类子模型当前的模型参数，采用反向传播算法确定第一图像分类子模型和第二图像分类子模型各自的各网络层引起的预测损失；然后，以使图像分类模型的分类损失下降为目标，逐层调整第一图像分类子模型中各网络层的相关参数以及第二图像分类子模型中各网络层的相关参数。

本申请实施例在此示出了上述S182的一种具体实现方式。当然，应理解，上述S182也可以采用其它的方式实现，本申请实施例对此不作限制。

需要说明的是，上述过程仅为一次模型参数调整过程，实际应用中，可能需要对图像分类模型进行多次模型参数调整，因而可重复执行上述步骤S102至S108多次，直到满足预设训练停止条件，由此得到最终的图像分类模型。其中，预设训练停止条件可以是图像分类模型的分类损失小于预设损失阈值，或者，也可以是调整次数达到预设次数等，本申请实施例对此不作限定。

由于每个图像分类子模型针对输入的图像得到的分类参考信息与输入的图像所属的真实类别之间都可能存在一定的差异，因而各个图像分类子模型产生的分类损失都会影响图像分类模型的分类准确率，为此，通过对各个图像分类子模型的分类损失进行加权求和后的结果作为图像分类模型的分类损失，使得图像分类模型的分类损失能够更准确地反映图像分类模型的分类偏差，进而利用图像分类模型的分类损失对图像分类模型的模型参数进行调整，有利于提高图像分类模型的分类准确率。

本申请实施例提供的图像分类模型的训练方法，在半监督学习框架下，通过图像分类模型中的各个图像分类子模型，分别对图像集中的每个图像进行分类识别，得到每个图像的多个分类参考信息，且一个分类参考信息对应一个图像分类子模型；然后，分别将每个图像分类子模型作为目标图像分类子模型，基于图像集中的有标签图像对应于该目标图像分类子模型的分类参考信息、有标签图像对应的类别标签以及图像集中的无标签图像对应于另一个图像分类子模型的分类参考信息，确定目标图像分类子模型的分类损失，也即利用一个目标图像分类子模型从图像集中学习的信息，为另一个目标图像分类子模型提供指导，使得图像分类模型的各目标图像分类子模型之间由单向的师生关系变为互为师生关系；进一步，基于图像分类模型中每个目标图像分类子模型的分类损失，调整图像分类模型的模型参数，可以充分利用各个目标图像分类子模型之间的相互师生关系，使得各个目标图像分类子模型之间互补学习、教学相长，进而使得图像集中包含的信息得到充分挖掘和利用，从而提高图像分类模型的训练效果，得到更准确、更可靠的图像分类模型。

上述实施例介绍了图像分类模型的训练方法，通过上述训练方法，可训练针对不同应用场景的图像分类模型。针对不同的应用场景，训练图像分类模型所采用的图像集及其中包含的每个图像的标签可根据应用场景进行选择。本申请实施例提供的上述训练方法所适用的应用场景可以例如包括但不限于目标检测、人脸表情分类、自然界动物分类、手写数字识别等场景。以自然界动物分类这一应用场景为例，有标签图像对应的类别标签用于标记有标签图像包含的目标对象以及目标对象所属的类别，比如猫、狗、马等，通过上述本申请实施例提供的训练方法训练得到的图像分类模型能够检测出待处理图像中的目标对象所在的区域，并识别出目标对象所属的类别。

基于本申请上述实施例所示的图像分类模型的训练方法，训练得到的图像分类模型可应用于任意需要对图像进行分类识别的场景。下面对基于图像分类模型的应用过程进行详细说明。

本申请实施例还提供一种图像分类模型的图像分类方法，能够基于上述训练方法训练出的图像分类模型，对待处理图像进行分类识别。

请参考图3，为本申请的一个实施例提供的一种图像分类方法的流程示意图，该方法可以包括如下步骤：

S302，通过图像分类模型对待处理图像进行分类识别，得到待处理图像的分类参考信息集。

其中，待处理图像的分类参考信息集包括待处理图像的第一目标分类参考信息和待处理图像的第二目标分类参考信息。所述图像分类模型包括第一图像分类子模型和第二图像分类子模型。第一图像分类子模型用于对待处理图像进行分类识别，得到待处理图像的第一目标分类参考信息；第二图像分类子模型用于对待处理图像进行分类识别，得到待处理图像的第二目标分类参考信息。

S304，基于待处理图像的分类参考信息集，确定待处理图像所属的类别。

可选地，可以基于待处理图像对应于任一图像分类子模型的分类参考信息，确定待处理图像所属的类别。例如，可将待处理图像的第一目标分类参考信息中最大概率对应的类别，确定为待处理图像所属的类别，或者，也可将待处理图像的第二目标分类参考信息中最大概率对应的类别，确定为待处理图像所属的类别。

可选地，还可综合待处理图像的上述多个分类参考信息，确定待处理图像所属的类别。例如，若待处理图像的第一目标分类参考信息中最大分类概率对应的类别与待处理图像的第二目标分类参考信息中最大分类概率对应的类别一致，则可将该类别确定为待处理图像所属的类别；又如，可基于待处理图像的第一目标分类参考信息中的第一目标类别集与待处理图像的第二目标分类参考信息中的第二目标类别集之间的交集，确定待处理图像所属的类别，其中，第一目标类别集包括第一目标分类参考信息中超过预设概率阈值的概率对应的类别，第二目标类别集包括第二目标分类参考信息中超过预设概率阈值的概率对应的类别，等等。

本申请实施例提供的图像分类方法，由于图像分类模型是在半监督学习方式的基础上，利用各个图像分类子模型之间的相互师生关系，通过各个图像分类子模型之间互补学习、教学相长而训练得到的，因而图像分类模型具有较高的准确性和可靠性；进一步，利用图像分类模型对待处理图像进行分类识别，有助于提高图像分类结果的准确性和可靠性。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

此外，与上述图1所示的图像分类模型的训练方法相对应地，本申请实施例还提供一种图像分类模型的训练装置。请参见图4，为本申请的一个实施例提供的一种图像分类模型的训练装置400的结构示意图，该装置400包括：获取单元410，用于获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；分类单元420，用于通过所述图像分类模型中的目标图像分类子模型，分别对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；所述目标图像分类子模型为所述第一图像分类子模型或所述第二图像分类子模型；确定单元430，用于基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失；通过所述图像分类模型中的非目标图像分类子模型对所述无标签图像进行分类识别，得到所述无标签图像的第二分类参考信息，所述非目标图像分类子模型为所述图像分类模型中除所述目标图像分类子模型之外的其他图像分类子模型；所述目标图像分类子模型的分类损失是指所述第一图像分类子模型的分类损失或所述第二图像分类子模型的分类损失；调整单元440，用于基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。

可选地，所述获取单元，还用于获取初始无标签图像。

所述训练装置400还包括：增强单元，用于对所述初始无标签图像进行多种增强程度的数据增强处理，得到所述无标签图像，所述无标签图像的数量为多个，每个无标签图像与一种增强程度对应。

可选地，所述无标签图像包括第一类无标签图像和第二类无标签图像，第一类无标签图像对应的增强程度小于所述第二类无标签图像的增强程度。

所述确定单元基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失，包括：基于所述第一类无标签图像的第二分类参考信息，生成所述第一类无标签图像对应的第一类伪标签；基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签，确定所述目标图像分类子模型的无监督损失；基于所述有标签图像的第一分类参考信息和所述有标签图像对应的类别标签，确定所述目标图像分类子模型的有监督损失；基于所述目标图像分类子模型的无监督损失和目标图像分类子模型的有监督损失，确定所述目标图像分类子模型的分类损失。

可选地，所述确定单元，还用于在基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签确定所述目标图像分类子模型的无监督损失之前，基于所述第一类无标签图像对应的第一类伪标签和所述第一类无标签图像对应的第二类伪标签，确定所述第一类无标签图像对应的损失权重，其中，所述第一类无标签图像对应的第二类伪标签为基于所述第一类无标签图像的第一分类参考信息生成的。

所述确定单元基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签，确定所述目标图像分类子模型的无监督损失，包括：基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签，确定所述第一类无标签图像对应的无监督子损失；基于所述第一类无标签图像对应的损失权重和所述第一类无标签图像对应的无监督子损失，确定所述目标图像分类子模型的无监督损失。

可选地，所述第一类无标签图像对应的第一类伪标签用于指示所述第一类无标签图像中的第一目标对象区域以及所述第一目标对象区域所属的预测类别，所述第一类无标签图像对应的第二类伪标签用于指示所述第一类无标签图像中的第二目标对象区域以及所述第二目标对象区域所属的预测类别。

所述确定单元基于所述第一类无标签图像对应的第一类伪标签和所述第一类无标签图像对应的第二类伪标签，确定所述第一类无标签图像对应的损失权重，包括：确定所述第一目标对象区域与所述第二目标对象区域之间的交并比，以及将所述第一目标对象区域所属的预测类别与所述第二目标对象区域所属的预测类别进行比对，得到比对结果；基于所述交并比和所述比对结果，确定所述第一类无标签图像对应的损失权重。

可选地，所述确定单元基于所述交并比和所述比对结果，确定所述第一类无标签图像对应的损失权重，包括：若所述交并比小于或等于预设比值或者所述比对结果表明所述第一目标对象区域所属的预测类别与所述第二目标对象区域所属的预测类别不一致，则确定所述第一类无标签图像对应的损失权重为第一预设权重；若所述交并比大于所述预设比值、且所述比对结果表明所述第一目标对象区域所属的预测类别与所述第二目标对象区域所属的预测类别一致，则确定所述第一类无标签图像对应的损失权重为第二预设权重，其中，所述第二预设权重大于所述第一预设权重。

可选地，所述第一类无标签图像的第一分类参考信息和所述第一类无标签图像的第二分类参考信息均包括所述第一类无标签图像被识别为属于多个预设类别中每个预设类别的概率。

所述确定单元基于所述第一类无标签图像的第二分类参考信息，生成所述第一类无标签图像对应的第一类伪标签，包括：基于所述第一类无标签图像的第二分类参考信息，从所述多个预设类别中确定最大概率对应的预设类别；若所述最大概率大于预设概率阈值，则基于所述最大概率对应的预设类别，生成所述第一类无标签图像的第一类伪标签。

可选地，所述调整单元基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数，包括：对所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失进行加权求和，得到所述图像分类模型的分类损失；通过反向传播算法，基于所述图像分类模型的分类损失，调整所述图像分类模型的模型参数。

显然，本申请实施例提供的图像分类模型的训练装置能够作为图1所示的图像分类模型的训练方法的执行主体，例如，图1所示的图像分类模型的训练方法中步骤S102可由图4所示的图像分类模型的训练装置中的获取单元执行，步骤S104可由图像分类模型的训练装置中的分类单元执行，步骤S106可由图像分类模型的训练装置中的确定单元执行，步骤S108可由图像分类模型的训练装置中的调整单元执行。

根据本申请的另一个实施例，图4所示的图像分类模型的训练装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其他实施例中，图像分类模型的训练装置也可以包括其他单元，在实际应用中，这些功能也可以由其他单元协助实现，并且可以由多个单元协作实现。

根据本申请的另一个实施例，可以通过在包括中央处理单元(Central Processing Unit，CPU)、随机存取存储介质(Random Access Memory，RAM)、只读存储介质(Read-Only Memory，ROM)等处理元件和存储元件的例如计算机的通用计算设备上，运行能够执行如图1所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图4中所示的图像分类模型的训练装置，以及来实现本申请实施例的图像分类模型的训练方法。所述计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质转载于电子设备中，并在其中运行。

本申请实施例提供的图像分类模型的训练装置，在半监督学习框架下，通过图像分类模型中的各个图像分类子模型，分别对图像集中的每个图像进行分类识别，得到每个图像的多个分类参考信息，且一个分类参考信息对应一个图像分类子模型；然后，分别将每个图像分类子模型作为目标图像分类子模型，基于图像集中的有标签图像对应于该目标图像分类子模型的分类参考信息、有标签图像对应的类别标签以及图像集中的无标签图像对应于另一个图像分类子模型的分类参考信息，确定目标图像分类子模型的分类损失，也即利用一个目标图像分类子模型从图像集中学习的信息，为另一个目标图像分类子模型提供指导，使得图像分类模型的各目标图像分类子模型之间由单向的师生关系变为互为师生关系；进一步，基于图像分类模型中每个目标图像分类子模型的分类损失，调整图像分类模型的模型参数，可以充分利用各个目标图像分类子模型之间的相互师生关系，使得各个目标图像分类子模型之间互补学习、教学相长，进而使得图像集中包含的信息得到充分挖掘和利用，从而提高图像分类模型的训练效果，得到更准确、更可靠的图像分类模型。

此外，与上述图3所示的图像分类方法相对应地，本申请实施例还提供一种图像分类装置。请参见图5，为本申请的一个实施例提供的一种图像分类装置500的结构示意图，该装置500包括：分类单元510，用于通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于本申请实施例所述的训练方法训练得到；确定单元520，用于基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。

显然，本申请实施例提供的图像分类装置能够作为图3所示的图像分类方法的执行主体，例如，图3所示的图像分类方法中步骤S302可由图5所示的图像分类装置中的分类单元执行，步骤S304可由图像分类装置中的确定单元执行。

根据本申请的另一个实施例，图5所示的图像分类装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其他实施例中，图像分类装置也可以包括其他单元，在实际应用中，这些功能也可以由其他单元协助实现，并且可以由多个单元协作实现。

根据本申请的另一个实施例，可以通过在包括中央处理单元(Central Processing Unit，CPU)、随机存取存储介质(Random Access Memory，RAM)、只读存储介质(Read-Only Memory，ROM)等处理元件和存储元件的例如计算机的通用计算设备上，运行能够执行如图3所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图5中所示的图像分类装置，以及来实现本申请实施例的图像分类方法。所述计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质转载于电子设备中，并在其中运行。

本申请实施例提供的图像分类装置，由于图像分类模型是在半监督学习方式的基础上，利用各个图像分类子模型之间的相互师生关系，通过各个图像分类子模型之间互补学习、教学相长而训练得到的，因而图像分类模型具有较高的准确性和可靠性；进一步，利用图像分类模型对待处理图像进行分类识别，有助于提高图像分类结果的准确性和可靠性。

图6是本申请的一个实施例电子设备的结构示意图。请参考图6，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(Extended Industry Standard Architecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成图像分类模型的训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；通过所述图像分类模型中的目标图像分类子模型，分别对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；所述目标图像分类子模型为所述第一图像分类子模型或所述第二图像分类子模型；基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失；所述无标签图像的第二分类参考信息为通过所述图像分类模型中除所述目标图像分类子模型之外的其他图像分类子模型对所述无标签图像进行分类识别得到；所述目标图像分类子模型的分类损失是指所述第一图像分类子模型的分类损失或所述第二图像分类子模型的分类损失；基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。

或者，处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成图像分类装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于本申请实施例所述的图像分类模型的训练方法训练得到；基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。

上述如本申请图1所示实施例揭示的图像分类模型的训练装置执行的方法或者上述如本申请图3所示实施例揭示的图像分类装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1的方法，并实现图像分类模型的训练装置在图1、图2所示实施例的功能，或者，该电子设备还可执行图3的方法，并实现图像分类装置在图3所示实施例的功能，本申请实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下操作：获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；通过所述图像分类模型中的目标图像分类子模型，分别对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；所述目标图像分类子模型为所述第一图像分类子模型或所述第二图像分类子模型；基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失；所述无标签图像的第二分类参考信息为通过所述图像分类模型中除所述目标图像分类子模型之外的其他图像分类子模型对所述无标签图像进行分类识别得到；所述目标图像分类子模型的分类损失是指所述第一图像分类子模型的分类损失或所述第二图像分类子模型的分类损失；基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。

或者，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图3所示实施例的方法，并具体用于执行以下操作：通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于本申请实施例所述的图像分类模型的训练方法训练得到；基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。

总之，以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

一种图像分类模型的训练方法，所述方法包括：

获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；

通过所述图像分类模型中的目标图像分类子模型，对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；

通过所述图像分类模型中的非目标图像分类子模型对所述无标签图像进行分类识别，得到所述无标签图像的第二分类参考信息；

基于所述有标签图像的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失，所述目标图像分类子模型的分类损失包括所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失；

基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。
根据权利要求1所述的方法，其中，所述方法还包括：

获取初始无标签图像；

对所述初始无标签图像进行多种增强程度的数据增强处理，得到所述无标签图像，所述无标签图像的数量为多个，每个无标签图像与一种增强程度对应。
根据权利要求2所述的方法，其中，所述无标签图像包括第一类无标签图像和第二类无标签图像，第一类无标签图像对应的增强程度小于所述第二类无标签图像的增强程度；

所述基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失，包括：

基于所述第一类无标签图像的第二分类参考信息，生成所述第一类无标签图像对应的第一类伪标签；

基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签，确定所述目标图像分类子模型的无监督损失；

基于所述有标签图像的第一分类参考信息和所述有标签图像对应的类别标签，确定所述目标图像分类子模型的有监督损失；

基于所述目标图像分类子模型的无监督损失和目标图像分类子模型的有监督损失，确定所述目标图像分类子模型的分类损失。
根据权利要求3所述的方法，其中，在基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签确定所述目标图像分类子模型的无监督损失之前，所述方法还包括：

基于所述第一类无标签图像对应的第一类伪标签和所述第一类无标签图像对应的第二类伪标签，确定所述第一类无标签图像对应的损失权重，其中，所述第一类无标签图像对应的第二类伪标签为基于所述第一类无标签图像的第一分类参考信息生成的；

所述基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签，确定所述目标图像分类子模型的无监督损失，包括：

基于所述第二类无标签图像的第一分类参考信息和所述第一类无标签图像对应的第一类伪标签，确定所述第一类无标签图像对应的无监督子损失；

基于所述第一类无标签图像对应的损失权重和所述第一类无标签图像对应的无监督子损失，确定所述目标图像分类子模型的无监督损失。
根据权利要求4所述的方法，其中，所述第一类无标签图像对应的第一类伪标签用于指示所述第一类无标签图像中的第一目标对象区域以及所述第一目标对象区域所属的预测类别，所述第一类无标签图像对应的第二类伪标签用于指示所述第一类无标签图像中的第二目标对象区域以及所述第二目标对象区域所属的预测类别；

所述基于所述第一类无标签图像对应的第一类伪标签和所述第一类无标签图像对应的第二类伪标签，确定所述第一类无标签图像对应的损失权重，包括：

确定所述第一目标对象区域与所述第二目标对象区域之间的交并比，以及将所述第一目标对象区域所属的预测类别与所述第二目标对象区域所属的预测类别进行比对，得到比对结果；

基于所述交并比和所述比对结果，确定所述第一类无标签图像对应的损失权重。
根据权利要求5所述的方法，其中，所述基于所述交并比和所述比对结果，确定所述第一类无标签图像对应的损失权重，包括：

若所述交并比小于或等于预设比值或者所述比对结果表明所述第一目标对象区域所属的预测类别与所述第二目标对象区域所属的预测类别不一致，则确定所述第一类无标签图像对应的损失权重为第一预设权重；

若所述交并比大于所述预设比值、且所述比对结果表明所述第一目标对象区域所属的预测类别与所述第二目标对象区域所属的预测类别一致，则确定所述第一类无标签图像对应的损失权重为第二预设权重，其中，所述第二预设权重大于所述第一预设权重。
根据权利要求3所述的方法，其中，所述第一类无标签图像的第一分类参考信息和所述第一类无标签图像的第二分类参考信息均包括识别所述第一类无标签图像属于预设类别的概率；

基于所述第一类无标签图像的第二分类参考信息，生成所述第一类无标签图像对应的第一类伪标签，包括：

基于所述第一类无标签图像的第二分类参考信息，从所述多个预设类别中确定最大概率对应的预设类别；

若所述最大概率大于预设概率阈值，则基于所述最大概率对应的预设类别，生成所述第一类无标签图像的第一类伪标签。
根据权利要求1至7中任一项所述的方法，其中，所述基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数，包括：

对所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失进行加权求和，得到所述图像分类模型的分类损失；

通过反向传播算法，基于所述图像分类模型的分类损失，调整所述图像分类模型的模型参数。
一种图像分类方法，包括：

通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于权利要求1至8中任一项所述的训练方法训练得到；

基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。
一种图像分类模型的训练装置，所述训练装置包括：

获取单元，用于获取用于对所述图像分类模型进行训练的图像集，所述图像集中包括有标签图像、无标签图像以及所述有标签图像对应的类别标签；

分类单元，用于通过所述图像分类模型中的目标图像分类子模型，对所述有标签图像和所述无标签图像进行分类识别，得到所述有标签图像的第一分类参考信息和所述无标签图像的第一分类参考信息；通过所述图像分类模型中的非目标图像分类子模型对所述无标签图像进行分类识别，得到所述无标签图像的第二分类参考信息；

确定单元，用于基于所述有标签图像对应的第一分类参考信息、所述有标签图像对应的类别标签以及所述无标签图像的第二分类参考信息，确定所述目标图像分类子模型的分类损失，所述目标图像分类子模型的分类损失包括所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失；调整单元，用于基于所述第一图像分类子模型的分类损失和所述第二图像分类子模型的分类损失，调整所述图像分类模型的模型参数。
一种图像分类装置，包括：

分类单元，用于通过图像分类模型对待处理图像进行分类识别，得到所述待处理图像的分类参考信息集；其中，所述分类参考信息集包括第一目标分类参考信息和第二目标分类参考信息，所述图像分类模型包括第一图像分类子模型和第二图像分类子模型，所述第一图像分类子模型用于对所述待处理图像进行分类识别得到所述第一目标分类参考信息，所述第二图像分类子模型用于对所述待处理图像进行分类识别得到所述第二目标分类参考信息，所述图像分类模型为基于权利要求1至8中任一项所述的训练方法训练得到；

确定单元，用于基于所述待处理图像的分类参考信息集，确定所述待处理图像所属的类别。
一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至8中任一项所述的方法；或者，所述处理器被配置为执行所述指令，以实现如权利要求9所述的方法。
一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至8中任一项所述的方法；或者，所述处理器被配置为执行所述指令，以实现如权利要求9所述的方法。