WO2021164306A1

WO2021164306A1 - 图像分类模型的训练方法、装置、计算机设备及存储介质

Info

Publication number: WO2021164306A1
Application number: PCT/CN2020/124324
Authority: WO
Inventors: 曾昱为; 王健宗; 瞿晓阳
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-09-17
Filing date: 2020-10-28
Publication date: 2021-08-26
Also published as: CN111931865A; CN111931865B

Abstract

本申请公开了一种图像分类模型的训练方法，应用于人工智能技术领域，用于解决现有技术无法用较少带标注的样本训练出高精度的图像分类模型的技术问题。本申请提供的方法包括：获取被标注的样本图像和未被标注的样本图像；计算未被标注的样本图像与分类层输出的其中一类图像原型之间的相似熵值；根据第一目标函数和第二目标函数确定目标损失函数；根据计算的相似熵值的大小，对于被标注的样本图像和未被标注的样本图像分别选用第一目标函数和第二目标函数交替对特征提取层的第一参数和分类层的第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数。

Description

图像分类模型的训练方法、装置、计算机设备及存储介质

本申请要求于2020年09月17日提交中国专利局、申请号为202010979940.5，发明名称为“图像分类模型的训练方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种图像分类模型的训练方法、装置、计算机设备及存储介质。

背景技术

随着医学成像技术和计算机技术的不断发展和进步，医学图像分析已成为医学研究、临床疾病诊断和治疗中一个不可或缺的工具和技术手段。近几年来，深度学习，特别是深度卷积神经网络已经迅速发展成为医学图像分析的研究热点，它能够从医学图像大数据中自动特区隐含的疾病诊断特征。医学图像分类可以分为图像筛查和目标或病灶分类。图像筛查是深度学习在医学图像分析领域中的最早应用之一，目标或病灶的分类可以辅助医生对疾病进行诊断，例如分析肺部CT(Computed Tomography，电子计算机断层扫描)图像是否患某种疾病或严重程度分级。

图像分类技术在自然图像领域已经获得了很好的成就，在10分类任务中准确率可以轻松达到94％。然而，发明人意识到达到这种效果的需要大量的标注样本才能发挥作用。由其在医学图像领域，获取标注数据的成本非常大，成像设备获取图像之后，需要专业的医生花费大量的时间对图像进行标注才能获取用于深度学习的样本。

在数据量少的情况下，现有的方法有两种解决方案：

一是数据增强，通过旋转，平移，变形等变化，产生更多的图像。由于产生图像还是由原始图像演变而来，产生的图像与原始图像没有太多实质性的区别导致其并没有起到太多增大有效样本数据的效果。

二是使用迁移学习，其思想是通过在另一种大规模的数据集上面训练，得到的网络参数作为初始值，再在目标数据集上训练对参数进行调优。然而，如果训练出的特征对某个训练数据集或者识别任务具有特异性，用它做迁移学习就未必有好的效果。

发明内容

本申请实施例提供一种图像分类模型的训练方法、装置、计算机设备及存储介质，以解决现有技术无法用较少带标注的样本训练出高精度的图像分类模型的技术问题。

一种图像分类模型的训练方法，该方法包括：

获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像；

计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

获取第一目标函数和第二目标函数，并根据该第一目标函数和该第二目标函数确定目标损失函数；

当计算的该相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练；

当计算的该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练；

交替对该第一参数和该第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数。

一种图像分类模型的训练装置，该装置包括：

样本图像获取模块，用于获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像；

相似熵值计算模块，用于计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

函数获取模块，用于获取第一目标函数和第二目标函数，并根据该第一目标函数和该第二目标函数确定目标损失函数；

第一训练模块，用于当计算的该相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练；

第二训练模块，用于当计算的该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练；

目标参数获取模块，用于交替对该第一参数和该第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

获取第一目标函数和第二目标函数，并根据所述第一目标函数和所述第二目标函数确定目标损失函数；

当计算的所述相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练；

当计算的所述相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练；

交替对所述第一参数和所述第二参数进行训练，直至所述目标损失函数的梯度小于预设值时，将所述第一参数的取值作为所述特征提取层的目标参数，将所述第二参数的取值作为所述分类层的目标参数。

一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

本申请提出的图像分类模型的训练方法、装置、计算机设备及存储介质，通过对抗性的训练学习使得训练出的分类层的分类结果更靠近标准图像原型，使得训练图像分类模型的过程中，在依据较少标注样本的前提下，同时结合了未标注的目标样本图像，提高了有效训练样本的数量，同时使得训练出的图像分类模型具有更好的分类效果。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中图像分类模型的训练方法的一应用环境示意图；

图2是本申请一实施例中图像分类模型的训练方法的一流程图；

图3是本申请一实施例中网络结构与目标损失函数之间的关系；

图4是本申请一实施例中图像分类模型的训练方法的一局部流程图；

图5是本申请实施例图2中步骤S102的进一步流程图；

图6是本申请一实施例中图像分类模型的训练装置的结构示意图；

图7是本申请一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请提供的图像分类模型的训练方法，可应用在如图1所示的应用环境中。其中，该计算机设备包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑等。

在一实施例中，如图2所示，提供一种图像分类模型的训练方法，以该方法应用在图1中的计算机设备为例进行说明，包括如下步骤S101至S106。

S101、获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像。

其中，该被标注的样本数据集包括被标注的公开数据和少量被标注的目标数据，该少量被标注的目标数据例如人体肺部CT图像中被医生确定标记为某种疾病原型的图片，该被标注的公开数据例如被医生标记有相关疾病原型的人体肺部CT图像；该未被标注的样本数据集中包含有若干未标注的目标图像，例如确定为某一类疾病原型但是未标注的CT图像。

进一步地，图4是本申请一实施例中图像分类模型的训练方法的一局部流程图，在该步骤S101的步骤之后，在以下步骤S102的步骤之前，该图像分类模型的训练方法还包括以下步骤S301和S302。

对该被标注的样本图像的灰度值进行非线性操作，使得该被标注的样本图像的输出灰度值与原始灰度值呈指数关系；

对该未被标注的样本图像的灰度值进行非线性操作，使得该未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。

其中，对该被标注的样本图像的灰度值和该未被标注的样本图像的灰度值分别进行非线性操作即对图像进行Gamma变换，Gamma变换是对输入图像灰度值进行的非线性操作，使输出图像灰度值与输入图像灰度值呈指数关系：V _out＝AV _in ^γ，这个指数即为Gamma“γ”。γ的取值范围为0～1，因此需要先进行归一化，然后取指数。

Gamma变换提升了图像的暗部细节，简单来说就是通过非线性变换，让图像从暴光强度的线性响应变得更接近人眼感受的响应，即将漂白或过暗的图片，进行矫正。

S102、计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值。

分类层模块是添加一个K-way线性分类层和一个随机初始化的权重矩阵W，最后一个线性层的权重向量，表示为W＝[w ₁，w ₂，…，w _n]，其中n为总类别数，将W中的每个向量视为每类原型，如w ₁作为第一类疾病原型，w ₂作为第二类疾病原型，w _n作为第n类病灶原型，原型指每类的代表。接着将特征提取层的输出结果送进分类层softmax，可以得到每个样本被分到每一类的概率值。根据公开数据集和目标域数集是否被标注，设计不同的目标函数。

进一步地，该步骤S102进一步包括：

通过该特征提取层对该未被标注的样本图像的第二特征进行提取；

将该第二特征输入至该分类层，得到该样本图像被预测为第k类图像原型的概率；

将该概率带入该第二目标函数，通过该第二目标函数计算该未被标注的样本图像与分类层输出的相似熵值。

作为可选地，所述第二目标函数H ₂为：

其中，n表示所述图像原型的总类数，p(y＝k|x)表示样本图像x被预测为第k类图像原型的概率，E表示训练的数据批大小batch size的平均值。

图5是本申请实施例图2中步骤S102的进一步流程图，进一步地，如图5所示，计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值的步骤包括以下步骤S401至S403：

S401、通过该特征提取层对该未被标注的样本图像的第二特征进行提取；

S402、将该第二特征输入至该分类层，得到该样本图像被预测为第k类图像原型的概率；

S403、将该概率带入该第二目标函数，通过该第二目标函数计算该未被标注的样本图像与分类层输出的相似熵值。

S103、获取第一目标函数和第二目标函数，并根据该第一目标函数和该第二目标函数确定目标损失函数。

其中，该步骤S103进一步包括：

通过以下公式计算所述目标损失函数

H＝-H ₁±H ₂

其中，所述H表示所述目标损失函数，H ₁表示所述第一目标函数，H ₂表示所述第二目标函数，当所述相似熵值大于0时所述H ₂的符号为正，当所述相似熵值小于0时所述H ₂的符号为负。

对于被标注的公开数据和少量被标注的目标数据，使用最大相关熵作为目标函数来训练特征提取层和分类层。其中，该相关熵值用于量化两个随机变量A和B之间的相似性，变量A和B的相关熵如公式(1)所示：

作为可选地，将该相关熵的公式应用于有标签数据的训练中，对于被标注的数据，得到其第一目标函数H ₁为：

其中，p(x _i)表示所述被标注的样本图像x被预测为第i类图像原型的预测结果，σ表示预先设置的值，y _i表示图像x为第i类图像原型的真实值，n表示所述图像原型的总类数。

其中，该p(x)可以通过以下公式(2)得到：

p(x)＝softmax(W ^TF(x)) (2)

其中，F(x)为特征提取层提取的特征，W代表权重向量。

进一步地，获取该被标注的样本图像x被预测为第i类图像原型的预测结果的步骤包括：

通过该图像分类模型的特征提取层对该被标注的样本图像的第一特征进行提取；

将提取的该第一特征输入至该分类层进行分类，得到该被标注的样本图像被预测为第i类图像原型的预测结果。

S104、当计算的该相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练。

作为可选地，该预设值为0。网络结构与第一目标损失函数H ₁之间的关系如图3所示。其中，数据间自适应融合方法模型中的特征提取层，用于对Resnet50网络进行迁移学习、微调网络结构和参数，自动学习提取隐含的多层次的疾病分类特征。作为可选地，移除ResNet50网络的最后一个线性层来构建该特征提取层，该网络引入跳连接，使得梯度的反向传播更加容易，让更深的网络得以有效训练。

使用第一目标损失函数H ₁可以确保特征提取层提取区别性特征。然而，该模型只是在公开数据和一小部分目标数据上进行分类训练的，这并不能学习整个目标数据的区别性特征。因此，对未标注的目标实例需要根据第二目标函数进行以及最大化条件熵对特征提取层的第一参数进行训练。

S105、当计算的该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练。

作为可选地，该预设值为0。

与上述步骤S104相对应地，当该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，未标注的目标实例需要根据第二目标函数进行以及最小化条件熵对分类层进行训练。

其中，网络结构与第二目标损失函数H ₂之间的关系如图3所示。图3中θ表示待训练的参数。

S106、交替对该第一参数和该第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数。

通过最大化条件熵(即相似熵值大于某一预设值时)来训练分类器，最小化条件熵(即相似熵值小于某一预设值时)来训练特征提取器，一方面可以最大程度地减少类原型和未标注目标数据之间的距离，从而提取具有区别性的特征，提高有效训练样本数量。

另一方面，通过根据相似熵值的大小实现对特征提取层和分类层的交替式对抗训练，假设每个类都存在一个域不变的原型，它作为两个域的一个代表点。最后一个线性层权重向量的w _i作为第i类疾病原型，则每一类疾病都对应一疾病原型。由于标注的数据中，公开数据居多，目标数据可能只有几个，因此估计的疾病原型靠近公开数据的分布，通过上述步骤S104、S105和S106可以实现移动目标数据中的未标注数据的特征，以使得训练出的图像分类模型更靠近w _i这个图像原型位置。

本实施例利用被标注的样本数据集和未被标注的样本数据集进行半监督训练，使得未被标注的样本图像实现数据间自适应融合。基于迁移学习的思想，微调在ImageNet数据集上训练的Resnet50深度卷积神经网络，提取肺部CT图像的特征，经过Softmax分类层得到预测概率。根据数据是否被标注，设计不同的目标函数。对于标注过的数据，使用第一目标函数作为损失函数对图像分类模型的特征提取层和分类层进行训练；对于没有标注的数据，使用最大最小化条件熵的方法，使用第二目标函数作为损失函数对图像分类模型的特征提取层和分类层进行训练，交替训练分类器的条件熵最大，并使特征提取器的条件熵最小，最终实现对无标注数据的高精度分类。

由于小样本学习分类发展迅速，面对繁多的分类任务，都可以通过训练一个模型来达到任务要求。元学习的机制是任务的通用性，即面对不同的任务，不需要构建不同的模型，用同样的一套学习算法即可解决多种不同的任务。定义一个模型的可学习参数θ，面对不同的任务，可以通过改变参数θ的值来解决相应的任务。而参数θ的值可以通过元学习器去学习，在面对不同任务的时候，根据损失函数通过梯度下降的方法不断地更新θ值，使这个模型不断向能解决这个任务的模型靠近，当θ值最终收敛时，认为元学习器学习到了一个较好的参数θ，让模型自适应地解决相应任务。本实施例同时建立了不同肺部CT图像样本数据集之间的跨域迁移方法。该方法通过对有标签公开数据与无标签临床数据进行跨域迁移，辅之以极少量带标签临床采集数据，实现了大量无标签临床数据的高精度识别，具有较高的灵敏度与特异度，且域自适应模型具有较好的泛化能力。

本实施例提出的图像分类模型的训练方法通过计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值，并在计算的该相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练，在计算的该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练，交替对该第一参数和该第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数，在相似熵值大于和小于预设值时，分别采用不同的目标函数对特征提取层和分类层进行训练，这种对抗性的训练学习使得训练出的分类层的分类结果更靠近标准图像原型，使得训练图像分类模型的过程中，在依据较少标注样本的前提下，同时结合了未标注的目标样本图像，提高了有效训练样本的数量，同时使得训练出的图像分类模型具有更好的分类效果。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种图像分类模型的训练装置，该图像分类模型的训练装置与上述实施例中图像分类模型的训练方法一一对应。如图6所示，该图像分类模型的训练装置100包括样本图像获取模块11、相似熵值计算模块12、函数获取模块13、第一训练模块14、第二训练模块15和目标参数获取模块16。各功能模块详细说明如下：

样本图像获取模块11，用于获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像。

相似熵值计算模块12，用于计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值。

其中，该相似熵值计算模块12进一步包括：

第二特征提取单元，用于通过该特征提取层对该未被标注的样本图像的第二特征进行提取；

概率预测单元，用于将该第二特征输入至该分类层，得到该样本图像被预测为第k类图像原型的概率；

熵值输出单元，用于将该概率带入该第二目标函数，通过该第二目标函数计算该未被标注的样本图像与分类层输出的相似熵值。

函数获取模块13，用于获取第一目标函数和第二目标函数，并根据该第一目标函数和该第二目标函数确定目标损失函数。

其中，所述第一目标函数为：

进一步地，该第二目标函数为：

进一步地，该函数获取模块13具体包括：

第一特征提取单元，用于通过该图像分类模型的特征提取层对该被标注的样本图像的第一特征进行提取；

结果预测单元，用于将提取的该第一特征输入至该分类层进行分类，得到该被标注的样本图像被预测为第i类图像原型的预测结果。

第一训练模块14，用于当计算的该相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练。

第二训练模块15，用于当计算的该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练。

目标参数获取模块16，用于交替对该第一参数和该第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数。

在其中一个实施例中，函数获取模块13具体用于通过以下公式计算所述目标损失函数：

H＝-H ₁±H ₂

其中，所述H表示所述目标损失函数，H ₁表示所述第一目标函数，H ₂表示所述第二目标函数，当所述相似熵值大于0时所述H ₂的符号为正，当所述相似熵值小于0时所述 H ₂的符号为负。

作为可选地，该图像分类模型的训练装置100还包括：

第一操作单元，用于对该被标注的样本图像的灰度值进行非线性操作，使得该被标注的样本图像的输出灰度值与原始灰度值呈指数关系；

第二操作单元，用于对该未被标注的样本图像的灰度值进行非线性操作，使得该未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。

其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分，并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式。

关于图像分类模型的训练装置的具体限定可以参见上文中对于图像分类模型的训练方法的限定，在此不再赘述。上述图像分类模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机可读指令被处理器执行时以实现一种图像分类模型的训练方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，处理器执行计算机可读指令时实现上述实施例中图像分类模型的训练方法的步骤，例如图2所示的步骤101至步骤106及该方法的其它扩展和相关步骤的延伸。或者，处理器执行计算机可读指令时实现上述实施例中图像分类模型的训练装置的各模块/单元的功能，例如图6所示模块11至模块16的功能。具体地，所述处理器执行所述计算机可读指令时实现如下步骤：

进一步地，所述处理器执行所述计算机可读指令时还实现如下步骤：

通过以下公式计算所述目标损失函数：

H＝-H ₁±H ₂

进一步地，所述第一目标函数为：

通过所述图像分类模型的特征提取层对所述被标注的样本图像的第一特征进行提取；

将提取的所述第一特征输入至所述分类层进行分类，得到所述被标注的样本图像被预测为第i类图像原型的预测结果。

进一步地，所述第二目标函数为：

其中，n表示所述图像原型的总类数，p(y＝k|x)表示样本图像x被预测为第k类图像原型的概率。

通过所述特征提取层对所述未被标注的样本图像的第二特征进行提取；

将所述第二特征输入至所述分类层，得到所述样本图像被预测为第k类图像原型的概率；

将所述概率带入所述第二目标函数，通过所述第二目标函数计算所述未被标注的样本图像与分类层输出的相似熵值。

对所述被标注的样本图像的灰度值进行非线性操作，使得所述被标注的样本图像的输出灰度值与原始灰度值呈指数关系；

对所述未被标注的样本图像的灰度值进行非线性操作，使得所述未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。

所述处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述计算机装置的控制中心，利用各种接口和线路连接整个计算机装置的各个部分。

所述存储器可用于存储所述计算机可读指令和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机可读指令和/或模块，以及调用存储在存储器内的数据，实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。

所述存储器可以集成在所述处理器中，也可以与所述处理器分开设置。

在一个实施例中，一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行上述实施例中图像分类模型的训练方法的步骤，例如图2所示的步骤101至步骤106及该方法的其它扩展和相关步骤的延伸。或者，计算机可读指令被处理器执行时实现上述实施例中图像分类模型的训练装置的各模块/单元的功能，例如图7所示模块11至模块16的功能。具体地，所述计算机可读指令被一个或多个处理器执行时，该一个或多个处理器执行如下步骤：

进一步地，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

通过以下公式计算所述目标损失函数

H＝-H ₁±H ₂

进一步地，所述第一目标函数为：

进一步地，所述第二目标函数为：

本实施例提出的图像分类模型的训练方法、装置、计算机设备及存储介质，通过计算该未被标注的样本图像与分类层输出的其中一类图像原型之间的相似熵值，并在计算的该相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练，在计算的该相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练，交替对该第一参数和该第二参数进行训练，直至该目标损失函数的梯度小于预设值时，将该第一参数的取值作为该特征提取层的目标参数，将该第二参数的取值作为该分类层的目标参数，在相似熵值大于和小于预设值时，分别采用不同的目标函数对特征提取层和分类层进行训练，这种对抗性的训练学习使得训练出的分类层的分类结果更靠近标准图像原型，使得训练图像分类模型的过程中，在依据较少标注样本的前提下，同时结合了未标注的目标样本图像，提高了有效训练样本的数量，同时使得训练出的图像分类模型具有更好的分类效果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种图像分类模型的训练方法，其中，所述方法包括：

获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像；

计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

获取第一目标函数和第二目标函数，并根据所述第一目标函数和所述第二目标函数确定目标损失函数；

当计算的所述相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练；

当计算的所述相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练；

交替对所述第一参数和所述第二参数进行训练，直至所述目标损失函数的梯度小于预设值时，将所述第一参数的取值作为所述特征提取层的目标参数，将所述第二参数的取值作为所述分类层的目标参数。
根据权利要求1所述的图像分类模型的训练方法，其中，所述获取第一目标函数和第二目标函数，并根据所述第一目标函数和所述第二目标函数确定目标损失函数的步骤包括：

通过以下公式计算所述目标损失函数

H＝-H ₁±H ₂

其中，所述H表示所述目标损失函数，H ₁表示所述第一目标函数，H ₂表示所述第二目标函数，当所述相似熵值大于0时所述H ₂的符号为正，当所述相似熵值小于0时所述H ₂的符号为负。
根据权利要求2所述的图像分类模型的训练方法，其中，所述第一目标函数为：

其中，p(x _i)表示所述被标注的样本图像x被预测为第i类图像原型的预测结果，σ表示预先设置的值，y _i表示图像x为第i类图像原型的真实值，n表示所述图像原型的总类数。
根据权利要求3所述的图像分类模型的训练方法，其中，获取所述被标注的样本图像x被预测为第i类图像原型的预测结果的步骤包括：

通过所述图像分类模型的特征提取层对所述被标注的样本图像的第一特征进行提取；

将提取的所述第一特征输入至所述分类层进行分类，得到所述被标注的样本图像被预测为第i类图像原型的预测结果。
根据权利要求2所述的图像分类模型的训练方法，其中，所述第二目标函数为：

其中，n表示所述图像原型的总类数，p(y＝k|x)表示样本图像x被预测为第k类图像原型的概率。
根据权利要求5所述的图像分类模型的训练方法，其中，所述计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值的步骤包括：

通过所述特征提取层对所述未被标注的样本图像的第二特征进行提取；

将所述第二特征输入至所述分类层，得到所述样本图像被预测为第k类图像原型的概率；

将所述概率带入所述第二目标函数，通过所述第二目标函数计算所述未被标注的样本图像与分类层输出的相似熵值。
根据权利要求1所述的图像分类模型的训练方法，其中，在所述计算所述未被标注的样本图像与分类层输出的图像原型之间的相似熵值的步骤之前，所述方法还包括：

对所述被标注的样本图像的灰度值进行非线性操作，使得所述被标注的样本图像的输出灰度值与原始灰度值呈指数关系；

对所述未被标注的样本图像的灰度值进行非线性操作，使得所述未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。
一种图像分类模型的训练装置，其中，所述装置包括：

样本图像获取模块，用于获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像；

相似熵值计算模块，用于计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

函数获取模块，用于获取第一目标函数和第二目标函数，并根据所述第一目标函数和所述第二目标函数确定目标损失函数；

第一训练模块，用于当计算的所述相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练；

第二训练模块，用于当计算的所述相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练；

目标参数获取模块，用于交替对所述第一参数和所述第二参数进行训练，直至所述目标损失函数的梯度小于预设值时，将所述第一参数的取值作为所述特征提取层的目标参数，将所述第二参数的取值作为所述分类层的目标参数。
一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其中，所述处理器执行所述计算机可读指令时实现如下步骤：

获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像；

计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

获取第一目标函数和第二目标函数，并根据所述第一目标函数和所述第二目标函数确定目标损失函数；

当计算的所述相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练；

当计算的所述相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练；

交替对所述第一参数和所述第二参数进行训练，直至所述目标损失函数的梯度小于预设值时，将所述第一参数的取值作为所述特征提取层的目标参数，将所述第二参数的取值作为所述分类层的目标参数。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还实现如下步骤：

通过以下公式计算所述目标损失函数

H＝-H ₁±H ₂

其中，所述H表示所述目标损失函数，H ₁表示所述第一目标函数，H ₂表示所述第二目标函数，当所述相似熵值大于0时所述H ₂的符号为正，当所述相似熵值小于0时所述H ₂的符号为负。
根据权利要求10所述的计算机设备，其中，所述第一目标函数为：

其中，p(x _i)表示所述被标注的样本图像x被预测为第i类图像原型的预测结果，σ表示预先设置的值，y _i表示图像x为第i类图像原型的真实值，n表示所述图像原型的总类数。
根据权利要求11所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还实现如下步骤：

通过所述图像分类模型的特征提取层对所述被标注的样本图像的第一特征进行提取；

将提取的所述第一特征输入至所述分类层进行分类，得到所述被标注的样本图像被预测为第i类图像原型的预测结果。
根据权利要求10所述的计算机设备，其中，所述第二目标函数为：

其中，n表示所述图像原型的总类数，p(y＝k|x)表示样本图像x被预测为第k类图像原型的概率。
根据权利要求13所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还实现如下步骤：

通过所述特征提取层对所述未被标注的样本图像的第二特征进行提取；

将所述第二特征输入至所述分类层，得到所述样本图像被预测为第k类图像原型的概率；

将所述概率带入所述第二目标函数，通过所述第二目标函数计算所述未被标注的样本图像与分类层输出的相似熵值。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还实现如下步骤：

对所述被标注的样本图像的灰度值进行非线性操作，使得所述被标注的样本图像的输出灰度值与原始灰度值呈指数关系；

对所述未被标注的样本图像的灰度值进行非线性操作，使得所述未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。
一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取被标注的样本数据集中被标注的样本图像，获取未被标注的样本数据集中未被标注的样本图像；

计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值；

获取第一目标函数和第二目标函数，并根据所述第一目标函数和所述第二目标函数确定目标损失函数；

当计算的所述相似熵值大于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练；

当计算的所述相似熵值小于预设值时，对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练，对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练；

交替对所述第一参数和所述第二参数进行训练，直至所述目标损失函数的梯度小于预设值时，将所述第一参数的取值作为所述特征提取层的目标参数，将所述第二参数的取值作为所述分类层的目标参数。
根据权利要求16所述的一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

通过以下公式计算所述目标损失函数

H＝-H ₁±H ₂

其中，所述H表示所述目标损失函数，H ₁表示所述第一目标函数，H ₂表示所述第二目标函数，当所述相似熵值大于0时所述H ₂的符号为正，当所述相似熵值小于0时所述H ₂的符号为负。
根据权利要求17所述的一个或多个存储有计算机可读指令的可读存储介质，其中，所述第一目标函数为：

其中，p(x _i)表示所述被标注的样本图像x被预测为第i类图像原型的预测结果，σ表示预先设置的值，y _i表示图像x为第i类图像原型的真实值，n表示所述图像原型的总类数。
根据权利要求18所述的一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

通过所述图像分类模型的特征提取层对所述被标注的样本图像的第一特征进行提取；

将提取的所述第一特征输入至所述分类层进行分类，得到所述被标注的样本图像被预测为第i类图像原型的预测结果。
根据权利要求16所述的一个或多个存储有计算机可读指令的可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

对所述被标注的样本图像的灰度值进行非线性操作，使得所述被标注的样本图像的输出灰度值与原始灰度值呈指数关系；

对所述未被标注的样本图像的灰度值进行非线性操作，使得所述未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。