WO2022028147A1

WO2022028147A1 - 图像分类模型训练方法、装置、计算机设备及存储介质

Info

Publication number: WO2022028147A1
Application number: PCT/CN2021/102530
Authority: WO
Inventors: 卢东焕; 赵俊杰; 马锴; 郑冶枫
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2020-08-06
Filing date: 2021-06-25
Publication date: 2022-02-10
Also published as: US20230035366A1; EP4113376A4; CN111738365A; EP4113376A1; CN111738365B

Abstract

一种图像分类模型训练方法、装置、计算机设备及存储介质，属于图像处理技术领域。通过获取图像分类模型的输出各个图像的分类结果，在图像分类模型输出的分类结果不满足参考条件时，基于该图像分类模型输出的分类结果构造参考分类结果，由于参考分类结果可以指示图像属于各个类别的概率，因此基于各个图像的分类结果与参考分类结果之间的总误差值，来更新图像分类模型的参数，获取训练好的图像分类模型。

Description

图像分类模型训练方法、装置、计算机设备及存储介质

相关申请的交叉引用

本申请基于申请号为202010781930.0、申请日为2020年08月06日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及图像处理技术领域，特别涉及一种图像分类模型训练方法、装置、计算机设备及存储介质。

背景技术

基于人工智能的图像分类技术可以是按照某个特定标准，例如，图像之间的相似度，把一个图像集分割成不同的类或簇，使得同一个簇内的图像的相似性尽可能大，同时不在同一个簇中的图像的差异性也尽可能地大。

在目前的图像分类方法中，通常先由神经网络提取图像特征，再应用分类模块基于图像特征进行图像分类。这种图像分类方法是分布式的，即图像特征提取过程和图像分类过程是相互独立的，计算复杂度高。因此，如何降低计算复杂度，以减少模型的资源消耗，提升分类效率尚无有效解决方案。

发明内容

本申请实施例提供了一种图像分类模型训练方法、装置、计算机设备及存储介质，可以训练出结构简化的图像分类模型。

本申请实施例提供一种图像分类模型训练方法，应用于计算机设备，该方法包括：

分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像；

将该至少两个第一图像以及对应的第二图像输入图像分类模型，由该图像分类模型输出该至少两个第一图像的分类结果以及对应的第二图像的分类结果；

响应于各个分类结果不满足参考条件，基于该各个第一图像对应的至少两个第二图像的分类结果，生成该至少两个第一图像的参考分类结果，该第一图像的参考分类结果用于表征该第一图像以及对应的至少两个第二图像属于各个类别的概率；

基于该至少两个第一图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值、该至少两个第一图像对应的第二图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值，确定总误差值；

基于该总误差值更新该图像分类模型的参数，当更新后的所述图像分类模型得到输出的所述至少两个第一图像的分类结果以及对应的第二图像的分类结果满足所述参考条件时，确定训练完成。

本申请实施例提供了一种图像分类模型训练装置，该装置包括：

图像获取模块，配置为分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像；

分类模块，配置为将该至少两个第一图像以及对应的第二图像输入图像分类模型，由该图像分类模型输出该至少两个第一图像的分类结果以及对应的第二图像的分类结果；

结果获取模块，配置为响应于各个分类结果不满足参考条件基于该各个第一图像对应的至少两个第二图像的分类结果，生成该至少两个第一图像的参考分类结果，该第一图像的参考分类结果用于表征该第一图像以及对应的至少两个第二图像属于各个类别的概率；

误差确定模块，配置为基于该至少两个第一图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值、该至少两个第一图像对应的第二图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值，确定总误差值；

参数更新模块，配置为基于该总误差值更新该图像分类模型的参数，当更新后的所述图像分类模型得到输出的所述至少两个第一图像的分类结果以及对应的第二图像的分类结果满足所述参考条件时，确定训练完成。

本申请实施例提供一种计算机设备，该计算机设备包括一个或多个处理器和一个或多个存储器，该一个或多个存储器中存储有至少一条程序代码，该至少一条程序代码由该一个或多个处理器加载并执行以实现该图像分类模型训练方法所执行的操作。

本申请实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行以实现该图像分类模型训练方法所执行的操作。

本申请实施例提供一种计算机程序产品，该计算机程序产品包括至少一条程序代码，该至少一条程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该至少一条程序代码，处理器执行该至少一条程序代码，使得该计算机设备实现该图像分类模型训练方法所执行的操作。

本申请实施例提供的技术方案，通过获取图像分类模型的输出各个图像的分类结果，在图像分类模型输出的分类结果不满足参考条件时，基于该图像分类模型输出的分类结果构造参考分类结果，由于参考分类结果可以指示图像属于各个类别的概率，因此基于各个图像的分类结果与参考分类结果之间的总误差值，来更新图像分类模型的参数，获取训练好的图像分类模型，该训练好的图像分类模型可以基于输入图像，直接输出准确度较高的图像分类结果，降低图像分类模型的图像分类过程复杂度。

附图说明

图1是本申请实施例提供的一种图像分类模型训练方法的实施环境示意图；

图2是本申请实施例提供的一种图像分类模型的训练方法的流程图；

图3是本申请实施例提供的一种图像分类模型训练方法的流程图；

图4是本申请实施例提供的一种图像分类模型的结构示意图；

图5是本申请实施例提供的一种图像分类模型的训练方法示意图；

图6是本申请实施例提供的一种图像分类模型训练装置的结构示意图；

图7是本申请实施例提供的一种终端的结构示意图；

图8是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。

在本申请中，对基于神经网络构建的图像分类模型进行训练，使图像分类模型可以实现端到端的图像分类，即基于图像之间输出图像分类结果，无需额外应用分类算法进行图像分类。

利用本申请实施例提供的图像分类模型训练方法训练出的图像分类模型，可以用于对电子相册中存储的图像进行分类整理，以便于对电子相册中图像的管理。另外，训练好的图像分类模型还可以对推荐系统或者网络图库中的图片进行自动分类，从而能够在达到推荐时机，或者在用户进行图片搜索时能够根据用户的偏好推荐用户可能感兴趣的图片，从而实现精准推荐；另外，利用本申请实施例提供的图像分类模型训练方法所训练出的图像分类模型还可以用于医疗领域，例如可以进行医疗图像的辅助识别，利用训练好的图像分类模型能够从医疗图像中识别出关注的成像区域，例如目标血管区域、目标器官区域等，从而能够提高诊断效率。

图1是本申请实施例提供的一种图像分类模型训练方法的实施环境示意图。该实施环境包括：终端110和图像分类平台140。

终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端等，但并不局限于此。终端110安装和运行有支持图像分类的应用程序。该应用程序可以是图像识别、图像检索类应用程序等。示例性的，终端110可以是用户侧设备，也可以是开发侧设备，终端110中运行的应用程序内登录有用户账号。终端110可以泛指多个终端中的一个，本申请实施例仅以终端110来举例说明。

图像分类平台140用于为支持图像分类的应用程序提供后台服务。图像分类平台140承担主要图像分类工作，终端110承担次要图像分类工作；或者，图像分类平台140承担次要图像分类工作，终端110承担主要图像分类工作；或者，图像分类平台140或终端110分别可以单独承担图像分类工作。在一些实施例中，图像分类平台140包括：接入服务器、图像分类服务器和数据库。接入服务器用于为终端110提供接入服务。图像分类服务器用于提供图像分类有关的后台服务。图像分类服务器可以是一台或多台。当图像分类服务器是多台时，存在至少两台图像分类服务器用于提供不同的服务，和/或，存在至少两台图像分类服务器用于提供相同的服务，比如以负载均衡方式提供同一种服务，本申请实施例对此不加以限定。图像分类服务器中可以设置有图像分类模型，该图像分类服务器为该模型的训练和应用过程提供支撑。其中，上述服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

上述终端110与图像分类平台140可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例对此不作限定。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。

本申请实施例提供了一种图像分类模型的训练方法，在本方法中，首先对用于进行模型训练的图像进行数据增强，将初始的图像和数据增强后的图像一起输入图像分类模型，由图像分类模型输出图像分类结果，再基于图像分类结果，构造参考分类结果，由于参考分类结果可以用来指示图像属于各个类别的概率，因此获取各个图像的分类结果与参考分类结果之间的总误差值，将该总误差值反向传播至图像分类模型，对图像分类模型中各个运算层的参数进行调整，得到训练好的图像分类模型，使该图像分类模型可以实现端到端的图像分类，也即是，利用该图像分类模型可以直接基于图像输出准确的图像分类结果，从而降低图像分类的复杂度。

图2是本申请实施例提供的一种图像分类模型的训练方法的流程图。该方法可以应用于计算机设备，该计算机设备可以是上述终端或者服务器，在本申请实施例中，以服务器作为执行主体，对图像分类模型的训练方法进行介绍，参见图2，该实施例可以包括以下步骤：

201、服务器分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像。

其中，该第一图像可以为存储在服务器中的图像，也可以为服务器从视频中截取的图像，还可以为具备图像采集功能的设备实施采集的图像，例如，相机将拍摄的图像实时发送至服务器。本申请实施例对采用哪种图像不作限定。该第二图像由第一图像进行数据增强，即图像变换得到，该图像变换方式包括图像裁剪、图像翻转、图像色彩抖动以及图像色彩通道重组，但并不局限于此。

在一种可能实现方式中，服务器响应于终端发送的模型训练指令，获取至少两个第一图像。其中，终端可以为开发人员使用的终端，终端响应于用户操作向服务器发送模型训练指令，本申请实施例对该模型训练指令的触发方式不作限定。服务器获取到至少两个第一图像后，基于至少一种图像变换方式对该至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像。

202、服务器将至少两个第一图像以及对应的第二图像输入图像分类模型，由图像分类模型输出至少两个第一图像的分类结果以及对应的第二图像的分类结果。

其中，该图像分类模型为基于神经网络构建的模型，例如，该神经网络为视觉几何组(Visual Geometry Group，VGG)深度卷积神经网络、残差网络(Residual Network，ResNet)等，本申请实施例对该图像分类模型的结构不作限定。

在一种可能实现方式中，服务器将至少两个第一图像和至少两个第二图像输入图像分类模型后，由图像分类模型中的至少一个运算层对各个图像进行卷积运算，提取各个图像的图像特征，基于图像特征预测各个图像对应的图像分类结果。其中，该图像分类结果可以表示为类别概率向量的形式，一个图像对应的图像分类结果可以用于表征一个图像属于各个类别的概率。需要说明的是，本申请实施例对图像分类模型进行图像分类的过程不作限定。

203、服务器响应于各个分类结果不满足参考条件，基于各个第一图像对应的至少两个第二图像的分类结果，生成该至少两个第一图像的参考分类结果，该第一图像的参考分类结果用于表征该第一图像以及对应的至少两个第二图像属于各个类别的概率。

其中，该参考条件可以由开发人员进行设置，该参考条件可以设置为各个图像与分类结果之间的互信息大于参考阈值等，本申请实施例对此不作限定。其中，互信息可以表示两个变量之间关联性的强弱，关联性越强，互信息数值越大，本申请实施例中，各个图像与分类结果之间的互信息用于表示图像与对应的分类结果之间的关联性。

在本申请实施例中，服务器响应于各个图像分类结果不满足参考条件，基于各个第一图像对应的至少两个第二图像的分类结果，构建参考分类结果，再基于该参考分类结果执行后续的模型参数调整过程。在本申请实施例中，由于参考分类结果是基于第二图像，即数据增强后的图像的分类结果得到的，基于该参考分类结果执行后续的模型训练步骤，可以使图像分类模型的输出结果具备数据增强不变性，即由同一第一图像进行数据增强后得到的至少两个第二图像均属于同一类别。

在一些实施例中，服务器响应于各个分类结果满足参考条件，确定该图像分类模型训练完成。

204、服务器基于该至少两个第一图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值、该至少两个第一图像对应的第二图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值，确定总误差值。

其中，该总误差值用于表征图像分类模型输出结果的准确度，准确度越高，该总误差值越小。在一种可能实现方式中，服务器分别获取各个图像与对应的分类结果之间的误差值，获取第一图像的分类结果与第二图像的分类结果之间的误差值，基于这两类误差值得到该总误差值。需要说明的是，上述对总误差值获取方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法获取总误差值不作限定。

205、服务器基于该总误差值更新该图像分类模型的参数，当更新后的所述图像分类模型得到输出的所述至少两个第一图像的分类结果以及对应的第二图像的分类结果满足所述参考条件时，确定训练完成。

在一种可能实现方式中，服务器获取到总误差值后，将总误差值反向传播至图像分类模型，基于梯度下降算法，求解该图像分类模型中各个运算层的参数，直至利用所述图像分类模型得到的各个分类结果满足所述参考条件，确定所述图像分类模型训练完成。需要说明的是，本申请实施例中，对采用哪种方法更新该图像分类模型的参数不作限定。

图3是本申请实施例提供的一种图像分类模型训练方法的流程图，结合图3，对上述图像分类模型的训练过程进行说明。

301、服务器获取至少两个第一图像，分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像。

其中，该第二图像由该第一图像进行图像变换得到，即第二图像是数据增强后的图像。例如，服务器响应于模型训练指令，获取至少两个第一图像，基于图像裁剪、图像翻转、图像色彩抖动、图像色彩通道重组中至少一项，分别对至少两个第一图像进行图像变换，得到各个第一图像对应的至少两个第二图像。需要说明的是，上述对图像变换方法，即数据增强方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法进行数据增强不作限定。

在本申请实施例中的，对该第一图像、第二图像的数目不作限定。例如，可以将模型训练的批次大小设置为128，服务器在每次模型训练时读取128个第一图像，对任一第一图像进行数据增强后，得到对应的M个第二图像。其中，M为正整数，M的数值可以由开发人员进行设置，例如，可以将M设置为10，本申请实施例对M的数值不作限定。

需要说明的是，在本申请实施例中，该第一图像和第二图像均表示为由像素值组成的数字矩阵，也即是，在下述步骤中，基于表示第一图像、第二图像的数字矩阵进行模型训练。

302、服务器将至少两个第一图像以及对应的第二图像输入图像分类模型，由图像分类模型输出至少两个第一图像的分类结果以及对应的第二图像的分类结果。

其中，该图像分类模型可以对各个第一图像和各个第二图像进行聚类，即根据各个图像所反映的不同特征，将各个图像划分为不同的簇，同一个簇内的至少一个图像属于同一类别。

该图像分类模型为基于卷积神经网络构建的模型，在本申请实施例中，以该图像分类模型是基于VGG深度卷积神经网络构建的模型为例进行说明。图4是本申请实施例提供的一种图像分类模型的结构示意图，如图4所示，该图像分类模型包括5个卷积单元，即卷积单元401、402、403、404以及405，每个卷积单元包括至少一个卷积层，每个卷积单元之后连接有一个池化层；该图像分类模型还包括至少一个全连接层406以及softmax(归一化指数函数)层407。当然，该图像分类模型还可以包括其他单元，例如输入单元、输出单元等，本申请实施例对此不作限定。在本申请实施例中，以图4所示的图像分类模型为例对图像分类过程进行说明，在一种可能实现方式中，服务器将至少两个第一图像和至少两个第二图像输入该图像分类模型，由图像分类模型中的各个卷积单元分别对各个图像进行卷积运算，来提取各个图像的图像特征，通过一个池化层对每个卷积单元提取到的图像特征进行下采样，从而对图像特征进行降维，以降低后续运算过程中的数据处理量。在特征提取完成后，通过至少一个全连接层将各个图像的图像特征映射为向量，最后通过softmax层将最后一个全连接输出的向量中各个元素映射到[0,1]的区间内，得到每个图像对应的分类结果，即类别概率向量，该类别概率向量中的一个元素用于表示图像属于一个类别的概率。

在一种可能实现方式中，该服务器可以将任意尺寸的第一图像、第二图像输入该图像分类模型，也可以将第一图像、第二图像调整为参考尺寸再输入该图像分类模型。例如，该服务器将第一图像、第二图像输入图像分类模型之前，按照实际情况对各个第一图像和各个第二图像进行缩放，以将各个第一图像和各个第二图像调整为参考尺寸。其中，该参考尺寸可以由开发人员进行设置，本申请实施例对此不作限定。

需要说明的是，上述对图像分类方法的说明仅是一种示例性说明，本申请实施例对采用哪种图像分类方法不作限定，本申请实施例对图像分类模型的结构也不作限定。

303、服务器判断各个分类结果是否满足参考条件。

其中，该参考条件用于衡量图像分类模型是否收敛。在一种可能实现方式中，可以基于互信息来判断分类结果是否满足参考条件，确定是否继续对图像分类模型进行训练。其中，该参考条件由开发人员进行设置，本申请实施例对此不作限定。在一种可能实现方式中，服务器确定各个分类结果是否满足参考条件的方式包括下述多种实现方式中的任一种。

实现方式一、在一种可能实现方式中，该参考条件包括对第一互信息、第二互信息的数据限制条件。其中，该第一互信息用于表征各个第一图像与对应的分类结果之间的关联性，关联性越强，该第一互信息的数值越大；该第二互信息用于表征各个第一图像的分类结果与对应的第二图像的分类结果之间的关联性，即数据增强前图像的分类结果与数据增强后图像的分类结果之间的关联性，关联性越强，该第二互信息的数值越大，也即是，在数据增强前和数据增强后的图像，其对应的分类结果应是相同的，即图像分类结果应具备数据增强不变性。在一种可能实现方式中，服务器获取各个第一图像与该各个第一图像的分类结果之间的第一互信息。例如，服务器分别获取各个第一图像与对应的分类结果之间的第一子互信息，对各个第一子互信息之和取平均值，作为该第一互信息。服务器获取各个第一图像的分类结果与对应的第二图像的分类结果之间的第二互信息，例如，服务器分别获取每个第一图像的分类结果与对应的每个第二图像的分类结果之间的第二子互信息，对各个第二子互信息之和取平均值，作为该第二互信息。若第一互信息大于或等于第一阈值且第二互信息大于或等于第二阈值，则确定该第一互信息和第二互信息满足参考条件，即各个分类结果满足参考条件；否则，确定该第一互信息和第二互信息不满足参考条件，即各个分类结果不满足参考条件。其中，该第一阈值、第二阈值可以由开发人员进行设置，本申请实施例对此不作限定。需要说明的是，上述对第一互信息、第二互信息获取方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法获取第一互信息和第二互信息不作限定。

实现方式二、在一种可能实现方式中，该参考条件包括对该第三互信息的数据限制条件。其中，该第三互信息用于表征该图像分类模型的输出结果准确度，该第三互信息的数值与图像分类模型的输出结果的准确度正相关。例如，将第一互信息和第二互信息之和确定为该第三互信息。在一种可能实现方式中，服务器基于该第一互信息以及该第二互信息，确定第三互信息，若该第三互信息大于或等于第三阈值，则确定该第三互信息满足参考条件，即确定各个分类结果满足该参考条件；若该第三互信息小于参考阈值，则确定该第三互信息不满足参考条件，即确定各个分类结果不满足该参考条件。其中，该第三阈值由开发人员进行设置，本申请实施例对此不作限定。在一种可能实现方式中，上述第三互信息的确定方法可以表示为下述公式(1)：

其中，x表示第一图像，y表示第一图像的分类结果，

表示第二图像的分类结果，I(x,y)I(x,y)表示第一互信息，

表示第二互信息，I表示第三互信息。

实现方式三、在一种可能实现方式中，该参考条件包括对第一互信息、第二互信息的第一限制条件以及对模型训练次数的第二限制条件。例如，该参考条件可以设置为，本次模型训练过程中所获得的第一互信息和第二互信息均满足数据限制条件，且模型训练次数大于次数阈值。该参考条件也可以设置为，本次模型训练过程中所获得的第一互信息和第二互信息均满足数据限制条件，且第一互信息和第二互信息均满足数据限制条件的模型训练次数大于次数阈值。该参考条件还可以设置为，本次模型训练过程中所获得的第一互信息和第二互信息均满足数据限制条件，且各次模型训练过程中获取到的第一互信息、第二互信息呈现收敛趋势。当然，该参考条件还可以设置为其他内容，本申请实施例对此不作限定。在一种可能实现方式中，若第一互信息和第二互信息满足该第一限制条件，且模型训练次数满足该第二限制条件，则确定各个分类结果满足该参考条件；否则，确定各个分类结果不满足该参考条件。

需要说明的是，上述对判断各个分类结果是否满足参考条件的说明仅是一种示例性说明，本申请实施例对采用哪种方法判断本次模型训练过程获取的各个分类结果是否满足参考条件不作限定。

在本申请实施例中，若各个分类结果满足参考条件，服务器执行下述步骤304；若各个分类结果不满足参考条件，服务器执行下述步骤305至步骤309。

304、服务器响应于各个分类结果满足参考条件，确定该图像分类模型训练完成。

在一种可能实现方式中，若各个分类结果满足参考条件，即图像分类模型收敛，则服务器确定图像分类模型训练完成，获取训练好的图像分类模型中的各个参数。

需要说明的是，在本申请实施例中，仅以一次训练过程为例进行说明，本申请实施例对图像分类模型的训练次数不作限定。例如，在对图像分类模型进行多次训练时，在一种可能实现方式中，若各个分类结果满足参考条件，且训练次数大于或等于训练次数阈值时，则确定图像分类模型训练完成；若各个分类结果满足参考条件，但训练次数小于训练次数阈值时，则继续读取下一批次的训练数据对图像分类模型进行训练。

305、服务器响应于各个分类结果不满足参考条件，分别对各个第一图像对应的至少两个第二图像的分类结果取平均值，得到各个第一图像对应的第一参考数据。

在一种可能实现方式中，服务器基于数据增强后图像的分类结果的平均值，即第二图像分类结果的平均值，得到各个第一图像对应的第一参考数据，该第一参考数据融合了数据增强后图像的分类结果特征，基于该第一参考数据确定处的数据参考结果也可以融合数据增强后图像的分类结果特征，基于该参考分类结果更新图像分类模型的参数之后，可以使图像分类模型的输出结果具备数据增强不变性，即由同一第一图像进行数据增强后得到的至少两个第二图像均属于同一类别。

在一种可能实现方式中，该第一参考数据可以通过公式(2)确定：

其中，i表示第一图像的序号；q _i表示第i个第一图像对应的第一参考数据；M表示第i个第一图像对应的第二图像的总数目，m表示第二图像的序号；

表示第i个第一图像对应的第m个第二图像；

表示第二图像

对应的分类结果。需要说明的是，上述对第一参考数据获取方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法获取该第一参考数据不作限定。

306、服务器将各个第一图像对应的第一参考数据以及各个第一参考数据对应的评价数据，得到各个第一图像对应的第二参考数据。

其中，一个第一参考数据的评价数据用于表征该一个第一参考数据的准确度。在一种可能实现方式中，该评价数据可以表示为由两个元素组成的向量，一个元素用于表示第一参考数据准确的概率，一个元素用于表示第一参考数据不准确的概率。例如，该评价数据表示为(0，1)，则该评价数据指示该第一参考数据准确的概率为1，即该第一评价数据是准确的；该评价数据也可以表示为(0.3，0.7)，则评价数据指示第一数据不准确的概率为0.3，该第一参考数据准确的概率为0.7。需要说明的是，该评价数据也可以表示为其他形式，本申请实施例对此不作限定。

在一种可能实现方式中，各个第一参考数据对应的评价数据由评价器基于各个第一参考数据生成。其中，该评价器用于确定该第一参考数据的准确度。在一种可能实现方式中，该评价器为由至少一个全连接层构成的深度神经网络，该评价器中全连接层数目可以由开发人员进行设置，本申请实施例对此不作限定。

在本申请实施例中，可以基于各个第一参考数据以及各个第一参考数据的参考分布信息，对评价器进行训练。其中，第一参考数据的参考分布信息用于表征该第一参考数据中各个元素的参考值，该参考分布信息可以从第一参考数据对应的先验分部信息中采样得到，即第i个第一图像的参考分布信息

为从先验分布信息

中采样得到的独热向量，该先验分布信息

可以由开发人员进行设置，本申请实施例对此不作限定，先验分布信息

中每个独热向量被采样的概率相等。在一种可能实现方式中，可以将第一参考数据和第一参考数据的参考分布信息分别输入评价器，应用损失函数确定评价器输出结果的评价误差值，基于该评价误差值更新该评价器中各个全连接层的参数。在一种可能实现方式中，该评价误差值的获取方法可以表示为下述公式(3)：

其中，

表示评价误差值；B表示第一图像的数目，i表示第一图像的序号；q _i表示序号为i的第一图像的第一参考数据，C _w(q _i)表示评价器的输入为q _i时的输出结果，

表示评价器的输入为

时的输出结果；

表示梯度惩罚项，用于使评价器C _w满足Lipschitz(利普希茨)约束条件，λ表示梯度惩罚项系数；

为q _i和

连线上采样的向量。在一种可能实现方式中，每次图像分类模型训练过程中，可以对评价器进行多次训练，获取最后一次训练过程得到的评价器，作为训练好的评价器，将各个第一参考数据q _i输入该训练好的评价器C _w，得到各个第一参考数据对应的评价数据C _w(q _i)。其中，评价器的训练次数可以由开发人员进行设置，例如，在每次图像分类模型训练过程中，评价器的训练次数设置为5次，本申请实施例对此不作限定。需要说明的是，上述对评价器训练方法的说明，仅是一种示例性说明，本申请实施例对评价器的训练方法不作限定。在本申请实施例中，在训练评价器的过程中，评价误差值

逐渐减小，可以使第一参考数据的概率分布p(q)与先验分布信息

之间的Wasserstein距离逐渐减小，即使第一参考数据的概率分布p(q)逐渐靠近先验分布信息

在一种可能实现方式中，服务器获取到各个第一参考数据对应的评价数据后，可以对该各个第一参考数据对应的评价数据取平均值，得到平均评价数据；再基于该平均评价数据的梯度分别对该各个第一参考数据进行调整，得到该各个第一图像对应的第二参考数据。上述第二参考数据的获取方法可以表示为下述公式(4)和公式(5)：

其中，B表示第一图像的数目，i表示第一图像的序号，q _i表示序号为i的第一图像的第一参考数据；C _w(q _i)表示第一参考数据q _i的评价数据；

表示平均评价数据；

表示序号为i的第一图像的第二参考数据；Normalize()表示归一化处理，本申请实施例对归一化处理的方法不作限定；α为超参数，用来控制梯度大小，其数值由开发人员进行设置，例如可以设置为0.04，本申请实施例对此不作限定；

表示

的梯度。

需要说明的是，上述对获取第二参考数据的方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法获取该第二参考数据不作限定。例如，还可以采用标签锐化(label sharpen)的方法，来基于第一参考数据得到第二参考数据，该方法可以表示为下述公式(6)：

q _i＝Normalize(q _i ^1/T) (6)；

其中，q _i表示序号为i的第一图像的第一参考数据，序号为i的第一图像的

表示第二参考数据，T为超参数，取值范围是(0,1)，其数值由开发人员进行设置，Normalize()表示归一化处理。

在本申请实施例中，由于第一参考数据的参考分布信息表示为独热向量的形式，在模型训练过程中，应用该参考分布信息训练评价器，再基于训练好的评价器来训练图像分类模型，可以使第一参考数据逐渐接近独热向量的形式，也即是，使图像分类结果更接近独热向量的形式，增强图像分类结果的明确性，使每个图像分类结果可以对应于一个明确的类别，也即是，使图像分类模型在执行聚类任务时，所输出的每个图像的聚类类别是确信的。

307、服务器基于第二图像的分类结果的边缘分布信息、参考边缘分布信息以及各个第一图像对应的第二参考数据，生成各个第一图像对应的该参考分类结果。

其中，分类结果的边缘分布信息用于表征分类结果中的类别分布情况；参考边缘分布信息可以由开发人员进行设置，本申请实施例对此不作限定，在本申请实施例中，为确保分类结果的类别平衡性，即每个图像被分配到各个类别的概率是相等的，可以将参考边缘分布信息中的各个元素设置为相同值，即参考边缘分布信息为由相同数值构成的向量。

在一种可能实现方式中，服务器基于该第二图像的分类结果的边缘分布信息以及该参考边缘分布信息，确定权重向量；将该各个第一图像对应的第二参考数据与该权重向量中对应相同位置的元素相乘，得到调整后的第二参考数据；对该调整后的第二参考数据进行归一化处理，生成该参考分类结果。上述参考分类结果的确定方法可以表示为下述公式(7)：

其中，

表示序号为i的第一图像的参考分类结果；

表示序号为i的第一图像的第二参考数据；

表示图像分类模型所输出图像分类结果的边缘分布信息；

表示参考边缘分布信息；

表示分类结果的边缘分布信息与参考边缘分布信息相除得到权重向量；Normalize()表示归一化处理。

在一种可能实现方式中，上述第二图像的分类结果的边缘分布信息基于各个第二图像的分类结果确定。在图像分类模型进行第一次训练时，可以基于参考边缘分布信息和各个第二图像的分类结果，确定该第二图像的分类结果的边缘分布信息，可以表示为下述公式(8)：

其中，

表示在本次模型训练过程中获取到的第二图像的分类结果的边缘分布信息，

表示参考边缘分布信息；i表示第一图像的序号，m表示第二图像的序号；B表示第一图像的数目，M表示每个第一图像对应的第二图像的数目，

表示第i个第一图像对应的第m个第二图像；γ表示动量系数，其数值可以由开发人员进行设置，本申请实施例对此不作限定。

在本申请实施例中，在除第一次以外的模型训练过程中，可以基于前一次模型训练过程所获取的第二图像的分类结果的边缘分布信息，来确定本次模型训练过程中所应用的第二图像的分类结果的边缘分布信息，可以表示为下述公式(9)：

其中，

表示在前一次模型训练过程中所获取的第二图像的分类结果的边缘分布信息；B表示第一图像的数目，M表示每个第一图像对应的第二图像的数目；i表示第一图像的序号，m表示第二图像的序号；

表示第i个第一图像对应的第m个第二图像；γ表示动量系数，其数值可以由开发人员进行设置，例如，γ可以设置为0.8，本申请实施例对此不作限定。在本申请实施例中，当预测为第k类的图像数较少时，第k类的边缘分布信息

将小于先验概率

即参考边缘分布信息，从而图像属于第k类的概率q _ik会提升。通过最小化

即图像分类模型的损失函数值，会有更多的图片被预测为第k类。当第k类的图像数较多时，该方法也会相应地减少该类图片。这样，聚类结果中包含了类别平衡性。

需要说明的是，上述步骤304至步骤307，是响应于各个分类结果满足参考条件，确定该图像分类模型训练完成，否则，基于各个第一图像对应的至少两个第二图像的分类结果，生成该至少两个第一图像的参考分类结果，一个第一图像的参考分类结果用于表征该一个第一图像以及对应的至少两个第二图像属于各个类别的概率的步骤。在上述获取参考分类结果的过程中，在确定第一参考数据时，融合了数据增强后图像的图像特征，具备数据增强不变性；第二参考数据接近于独热向量，具备明确性；再基于第一参考数据、第二参考数据以及参考边缘分布信息，确定该参考分类结果，且参考分类结果具备类别平衡性，则确定出的参考分类结果可以融合数据增强不变性、明确性和类别平衡性，基于该参考分类结果执行后续的模型参数调整步骤，可以获取到表现效果更好的图像分类模型。

308、服务器基于至少两个第一图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值、该至少两个第一图像对应的第二图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值，确定总误差值。

在一种可能实现方式中，服务器基于KL损失函数获取图像分类结果与参考分类结果之间的误差值。例如，对于任一第一图像，服务器获取该任一第一图像的参考分类结果与该任一第一图像的分类结果的相对熵，作为该任一第一图像对应的第一误差值；对于任一第一图像，获取该任一第一图像的参考分类结果与该任一第一图像对应的各个第二图像的分类结果的相对熵之和，作为该任一第一图像的第二误差值；对至少两个第一误差值以及至少两个第二误差值之和取平均，得到该总误差值。在一种可能实现方式中，该总误差值的获取方法可以表示为下述公式(10)：

其中，KL(a||b)表示获取a和b之间的相对熵；p _θ(y|x＝x _i)表示输入为x _i时图像分类模型的输出结果，

表示输入为

时图像分类模型的输出结果；

表示总误差值。需要说明的是，上述对获取总误差值的方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法获取该总误差值不作限定。

309、服务器基于总误差值更新图像分类模型的参数。

在一种可能实现方式中，可以应用反向传播法(back propagation)来更新图像分类模型的参数。例如，服务器基于Adam(Adaptove moment estimation，适应性矩估计)算法的梯度下降法求解该图像分割模型中的各个参数，直至利用该图像分类模型得到的各个分类结果满足参考条件，确定该图像分类模型训练完成。在一些实施例中，该图像分类模型的初始学习率设置为0.0005，Adam算法中的参数设置为0.5和0.9。需要说明的是，本申请实施例对图像分类模型参数更新的方法不作限定。

在一种可能实现方式中，服务器对图像分类模型的参数更新完成后，若训练次数达到次数阈值，则服务器获取该图像分类模型作为训练好的图像分类模型，若训练次数未达到次数阈值，则服务器可以继续从训练数据集中读取下一批次的训练数据，重新执行上述步骤301至步骤309，再次对该图像分类模型进行训练，直到获取到训练好的图像分类模型。

图5是本申请实施例提供的一种图像分类模型的训练方法示意图，结合图5，对上述图像分类模型训练过程进行说明。以一个第一图像为例，首先，服务器对第一图像501进行数据增强，得到至少两个第二图像502，将第一图像501和至少两个第二图像502输入图像分类模型503，得到各个图像对应的分类结果；然后，基于各个第二图像对应的图像分类结果，构造第一参考数据504，即执行上述步骤305；基于第一参考数据504和评价数据505，得到第二参考数据506，即执行上述步骤306；再基于第二参考数据506、第二图像的分类结果的边缘分布信息507、参考边缘分布信息508，得到参考分类结果509，即执行上述步骤307；最后，应用KL损失函数获取各个图像的分类结果与参考分类结果509之间的总误差值，基于该总误差值更新图像分类模型503的参数。在本申请实施例中，通过构造一个融合了数据增强不变性、明确性和类别平衡性的参考分类结果，来优化图像分类模型，使图像分类模型的输出趋于该参考分类结果，也即是，使图像分类模型在执行图像聚类任务时，直接输出图像的聚类类别，而无需额外的聚类过程，提高模型的聚类表现。且本申请实施例提供的图像分类模型训练方法所使用的训练数据无需标注，可以有效节省标注成本，可以广泛应用于对未知数据进行前期分析。

需要说明的是，在本申请实施例中，仅以图像分类模型进行训练为例进行说明，本申请实施例提供的技术方案，也可以应用于其他模型的训练，例如，视频分类模型、文本识别模型、语音分类模型等，即可以引用于基于循环神经网络(Recurrent Neural Network，RNN)、长短时记忆网络(Long Short-Term Memory，LSTM)、转换器的双向编码表示模型(Bidirectional Encoder Representations from Transformers，BERT)等神经网络构建的模型，本申请实施例对此不作限定。

上述实施例介绍了对图像分类模型进行训练的方法，应用上述图像分类模型训练方法所训练得到的图像分类模型，可以应用于多种类型的应用程序中，与多种应用场景相结合。例如，可以应用于电子相册应用程序或者云端电子相册的图片分类整理。利用本申请实施例提供的图像分类模型训练方法所训练出的图像分类模型，可以从大量图像中归纳出少量类别，例如可以将电子相册中的图像归纳为风景、人物、美食等类别，并且可以获取每个类别的代表图像，将每个类别的代表图像作为各个类别的封面图像，用户可以通过这些代表图像快速了解这一类图像的信息，并且能够在需要搜索图像时基于类别实现快速查找，提高图像查找效率。该图像分类模型还可以应用于图像收集类应用程序中，可以调用该图像分类模型对用户收集的图像进行整理，将图像分为多个类别，无需人工进行图像分类。在本申请实施例中，以该图像分类模型应用于图像收集类应用程序中为例进行说明，在一种可能实现方式中，应用该图像分类模型进行图像分类可以包括以下步骤。

步骤一、终端响应于图像分类操作，向服务器发送图像分类指令。

其中，该终端为用户使用的终端，该终端安装和运行有用于提供图像收集功能的目标应用程序，例如，电子相册等。该服务器为该目标应用程序的后台服务器，该服务器搭载有训练好的图像分类模型，该图像分类模型应用上述图像分类模型训练方法训练得到。

在一种可能实现方式中，终端所运行的目标应用程序中显示有图像分类控件，用户从已收集的图像中选择至少两个图像，作为待分类的目标图像。以电子相册应用程序为例，例如，用户可以选择某一时间段内拍摄的至少两个图像作为该目标图像，也可以选择在同一地点拍摄的至少两个图像作为该目标图像，还可以随机选择至少两个图像作为该目标图像，本申请实施例对此不作限定。用户选择完目标图像后，再触发该图像分类控件，终端响应于用户对该图像分类控件的触发操作，获取各个目标图像的图像标识，生成图像分类指令，将该图像分类指令发送至该服务器。其中，一个图像标识用于唯一的指示一个图像，该图像分类指令包括各个目标图像的图像标识。需要说明的是，上述对图像分类指令生成方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法生成图像分类指令不作限定。

步骤二、服务器响应于该图像分类指令，调用图像分类模型，对该图像分类指令所指示的目标图像进行分类，得到各个目标图像的图像分类结果。

在一种可能实现方式中，服务器中同步存储有用户收集的各个图像，服务器接收到图像分类指令后，基于该图像分类指令中的至少两个图像标识，获取该至少两个图像标识所指示的至少两个目标图像，将该至少两个目标图像输入图像分类模型。

在本申请实施例中，以该图像分类模型为基于VGG深度卷积神经网络构建的模型为例，对一个目标图像的图像分类结果获取过程进行说明。在一种可能实现方式中，服务器将目标图像输入图像分类模型后，通过图像分类模型中的多个级联的卷积单元对目标图像进行特征提取。例如，对于每个卷积单元，获取前一个卷积单元输出的特征图，通过至少一个卷积层对该特征图进行卷积运算，得到一个新的特征图，将该新的特征图输入下一个卷积单元。在一种可能实现方式中，每个卷积单元之后可以连接有一个池化层，用于对卷积单元输出的特征图进行降维处理。也即是，一个卷积单元将得到的新的特征图先输入池化层，由池化层对该新的特征图进行降维处理后，再输入下一个卷积单元。服务器获取最后一个卷积单元输出的特征图，通过该图像分类模型中的至少一个全连接层，将该特征图映射为向量，再通过softmax层将该向量中各个元素映射到[0,1]的区间内，得到类别概率向量，即目标图像的图像分类结果，该类别概率向量中的各个元素用于表征目标图像属于各个类别的概率。

步骤三、服务器将图像分类结果发送至终端，由终端基于该图像分类结果进行图像显示。

在一种可能实现方式中，终端基于该图像分类结果，可以将属于相同类别的图像确定为一个图像集，在图像分类结果查看页面显示至少一个图像集查看入口，在该图像集查看入口可以呈现有该类图像的标识，例如可以呈现有人物、风景、美食等字样，还可以在该图像集查看入口呈现有该类图像中的代表图像，用户可以点击各个图像集查看入口，查看图像集中所包括的至少一个目标图像。在用户需要给好友发送某一些图像时，例如发送旅游过程中拍摄的图像时，可以基于分类好的图像集。从风景这一图像集中快速确定出需要发送的图像；或者用户想要上传美食照片到社交平台时，可以从美食这一图像集中查找要分享上传的照片，从而提高查找、分享效率。需要说明的是，上述对图像显示方法的说明，仅是一种示例性说明，本申请实施例对采用哪种方法进行图像显示不作限定。

上述所有技术方案，可以采用任意结合形成本申请的实施例。

图6是本申请实施例提供的一种图像分类模型训练装置的结构示意图，参见图6，该装置包括：图像获取模块601，用于分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像；分类模块602，配置为将该至少两个第一图像以及对应的第二图像输入图像分类模型，由该图像分类模型输出该至少两个第一图像的分类结果以及对应的第二图像的分类结果；结果获取模块603，配置为响应于各个分类结果不满足参考条件基于该各个第一图像对应的至少两个第二图像的分类结果，生成该至少两个第一图像的参考分类结果，该第一图像的参考分类结果用于表征该第一图像以及对应的至少两个第二图像属于各个类别的概率；误差确定模块604，配置为基于该至少两个第一图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值、该至少两个第一图像对应的第二图像的分类结果与该至少两个第一图像的参考分类结果之间的误差值，确定总误差值；参数更新模块605，配置为基于该总误差值更新该图像分类模型的参数。

在一种可能实现方式中，该结果获取模块603包括：第一获取子模块，配置为分别对该各个第一图像对应的至少两个第二图像的分类结果取平均值，得到该各个第一图像对应的第一参考数据；第二获取子模块，配置为将该各个第一图像对应的第一参考数据以及各个第一参考数据对应的评价数据，得到该各个第一图像对应的第二参考数据，该评价数据用于表征该第一参考数据的准确度；第三获取子模块，配置为基于该第二图像的分类结果的边缘分布信息、参考边缘分布信息以及该各个第一图像对应的第二参考数据，生成该各个第一图像对应的该参考分类结果。

在一种可能实现方式中，该第二获取子模块配置为：对该各个第一参考数据对应的评价数据取平均值，得到平均评价数据；基于该平均评价数据的梯度分别对该各个第一参考数据进行调整，得到该各个第一图像对应的第二参考数据。

在一种可能实现方式中，该各个第一参考数据对应的评价数据由评价器基于该各个第一参考数据生成，该评价器用于确定该第一参考数据的准确度；该装置还包括：训练模块，配置为基于该各个第一参考数据以及该各个第一参考数据的参考分布信息，对该评价器进行训练，该第一参考数据的参考分布信息用于表征该第一参考数据中各个元素的参考值。

在一种可能实现方式中，该第三获取子模块配置为：基于该第二图像的分类结果的边缘分布信息以及该参考边缘分布信息，确定权重向量；将该各个第一图像对应的第二参考数据与该权重向量中对应相同位置的元素相乘，得到调整后的第二参考数据；对该调整后的第二参考数据进行归一化处理，生成该参考分类结果。

在一种可能实现方式中，该误差确定模块604配置为：对于任一第一图像，获取该任一第一图像的参考分类结果与该任一第一图像的分类结果的相对熵，作为该任一第一图像对应的第一误差值；对于任一第一图像，获取该任一第一图像的参考分类结果与该任一第一图像对应的各个第二图像的分类结果的相对熵之和，作为该任一第一图像的第二误差值；对至少两个第一误差值以及至少两个第二误差值之和取平均，得到该总误差值。

在一种可能实现方式中，该装置还包括：互信息获取模块，配置为获取该各个第一图像与该各个第一图像的分类结果之间的第一互信息；获取该各个第一图像的分类结果与对应的第二图像的分类结果之间的第二互信息；响应于该第一互信息和第二互信息满足参考条件，确定所述各个分类结果满足所述参考条件；响应于所述第一互信息和第二互信息不满足参考条件，确定所述各个分类结果不满足所述参考条件。

在一种可能实现方式中，该图像获取模块601配置为：获取该至少两个第一图像；基于图像裁剪、图像翻转、图像色彩抖动、图像色彩通道重组中至少一项，分别对该至少两个第一图像进行图像变换，得到各个第一图像对应的至少两个第二图像。

本申请实施例提供的装置，通过获取图像分类模型的输出各个图像的分类结果，在图像分类模型输出的分类结果不满足参考条件时，基于该图像分类模型输出的分类结果构造参考分类结果，由于参考分类结果可以指示图像属于各个类别的概率，因此基于各个图像的分类结果与参考分类结果之间的总误差值，来更新图像分类模型的参数，获取训练好的图像分类模型，该训练好的图像分类模型可以基于输入图像，直接输出准确度较高的图像分类结果，降低图像分类模型的图像分类过程复杂度。

需要说明的是：上述实施例提供的图像分类模型训练装置在图像分类模型训练时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的图像分类模型训练装置与图像分类模型训练方法实施例属于同一构思，其实现过程可参考方法实施例。

上述技术方案所提供的计算机设备可以实现为终端或服务器，例如，图7是本申请实施例提供的一种终端的结构示意图。该终端700可以是：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端700包括有：一个或多个处理器701和一个或多个存储器702。

处理器701可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器701可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器701还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器702可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器702中的非暂态的计算机可读存储介质用于存储至少一条程序代码，该至少一条程序代码用于被处理器701所执行以实现本申请中方法实施例提供的图像分类模型训练方法。

在一些实施例中，终端700还可以包括有：外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。在一些实施例中，外围设备包括：射频电路704、显示屏705、摄像头组件706、音频电路707、定位组件708和电源709中的至少一种。

在一些实施例中，终端700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于：加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。

本领域技术人员可以理解，图7中示出的结构并不构成对终端700的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图8是本申请实施例提供的一种服务器的结构示意图，该服务器800可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器(Central Processing Units，CPU)801和一个或多个的存储器802，其中，该一个或多个存储器802中存储有至少一条程序代码，该至少一条程序代码由该一个或多个处理器801加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器800还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器800还可以包括其他用于实现设备功能的部件。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括至少一条程序代码的存储器，上述至少一条程序代码可由处理器执行以完成上述实施例中的图像分类模型训练方法。例如，该计算机可读存储介质可以是只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory，RAM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，该计算机程序产品包括至少一条程序代码，该至少一条程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该至少一条程序代码，处理器执行该至少一条程序代码，使得该计算机设备实现该图像分类模型训练方法所执行的操作。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来至少一条程序代码相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

上述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种图像分类模型的训练方法，应用于计算机设备，所述方法包括：

分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像；

将所述至少两个第一图像以及对应的第二图像输入图像分类模型，由所述图像分类模型输出所述至少两个第一图像的分类结果以及对应的第二图像的分类结果；

响应于各个分类结果不满足参考条件，基于所述各个第一图像对应的至少两个第二图像的分类结果，生成所述至少两个第一图像的参考分类结果，所述第一图像的参考分类结果用于表征所述第一图像以及对应的至少两个第二图像属于各个类别的概率；

基于所述至少两个第一图像的分类结果与所述至少两个第一图像的参考分类结果之间的误差值、所述至少两个第一图像对应的第二图像的分类结果与所述至少两个第一图像的参考分类结果之间的误差值，确定总误差值；

基于所述总误差值更新所述图像分类模型的参数，当更新后的所述图像分类模型得到输出的所述至少两个第一图像的分类结果以及对应的第二图像的分类结果满足所述参考条件时，确定训练完成。
根据权利要求1所述的方法，其中，所述基于所述各个第一图像对应的至少两个第二图像的分类结果，生成所述至少两个第一图像的参考分类结果，包括：

分别对所述各个第一图像对应的至少两个第二图像的分类结果取平均值，得到所述各个第一图像对应的第一参考数据；

基于所述各个第一图像对应的第一参考数据和各个第一参考数据对应的评价数据，确定所述各个第一图像对应的第二参考数据，所述评价数据用于表征所述第一参考数据的准确度；

基于所述第二图像的分类结果的边缘分布信息、参考边缘分布信息和所述各个第一图像对应的第二参考数据，生成所述各个第一图像对应的所述参考分类结果。
根据权利要求2所述的方法，其中，所述基于所述各个第一图像对应的第一参考数据和各个第一参考数据对应的评价数据，确定所述各个第一图像对应的第二参考数据，包括：

对所述各个第一参考数据对应的评价数据取平均值，得到平均评价数据；

基于所述平均评价数据的梯度分别对所述各个第一参考数据进行调整，得到所述各个第一图像对应的第二参考数据。
根据权利要求3所述的方法，其中，所述各个第一参考数据对应的评价数据由评价器基于所述各个第一参考数据生成，所述评价器用于确定所述第一参考数据的准确度；

所述对所述各个第一参考数据对应的评价数据取平均值，得到平均评价数据之前，所述方法还包括：

基于所述各个第一参考数据和所述各个第一参考数据的参考分布信息，对所述评价器进行训练，所述第一参考数据的参考分布信息用于表征所述第一参考数据中各个元素的参考值。
根据权利要求2所述的方法，其中，所述基于所述第二图像的分类结果的边缘分布信息、参考边缘分布信息和所述各个第一图像对应的第二参考数据，生成所述各个第一图像对应的所述参考分类结果，包括：

基于所述第二图像的分类结果的边缘分布信息和所述参考边缘分布信息，确定权重向量；

将所述各个第一图像对应的第二参考数据与所述权重向量中对应相同位置的元素相乘，得到调整后的第二参考数据；

对所述调整后的第二参考数据进行归一化处理，生成所述参考分类结果。
根据权利要求1所述的方法，其中，所述基于所述至少两个第一图像的分类结果与所述至少两个第一图像的参考分类结果之间的误差值、所述至少两个第一图像对应的第二图像的分类结果与所述至少两个第一图像的参考分类结果之间的误差值，确定总误差值，包括：

对于任一第一图像，获取所述任一第一图像的参考分类结果与所述任一第一图像的分类结果的相对熵，作为所述任一第一图像对应的第一误差值；

对于任一第一图像，获取所述任一第一图像的参考分类结果与所述任一第一图像对应的各个第二图像的分类结果的相对熵之和，作为所述任一第一图像的第二误差值；

对至少两个第一误差值以及至少两个第二误差值之和取平均，得到所述总误差值。
根据权利要求1所述的方法，其中，所述将所述至少两个第一图像以及对应的第二图像输入图像分类模型，由所述图像分类模型输出所述至少两个第一图像的分类结果以及对应的第二图像的分类结果之后，所述方法还包括：

获取所述各个第一图像与所述各个第一图像的分类结果之间的第一互信息；

获取所述各个第一图像的分类结果与对应的第二图像的分类结果之间的第二互信息；

响应于所述第一互信息和第二互信息满足参考条件，确定所述各个分类结果满足所述参考条件；

响应于所述第一互信息和第二互信息不满足参考条件，确定所述各个分类结果不满足所述参考条件。
根据权利要求1所述的方法，其中，所述分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像，包括：

基于图像裁剪、图像翻转、图像色彩抖动、图像色彩通道重组中至少一项，分别对所述至少两个第一图像进行图像变换，得到各个第一图像对应的至少两个第二图像。
一种图像分类模型训练装置，所述装置包括：

图像获取模块，配置为分别对至少两个第一图像进行图像变换，得到每个第一图像对应的至少两个第二图像；

分类模块，配置为将所述至少两个第一图像以及对应的第二图像输入图像分类模型，由所述图像分类模型输出所述至少两个第一图像的分类结果以及对应的第二图像的分类结果；

结果获取模块，配置为响应于各个分类结果不满足参考条件基于所述各个第一图像对应的至少两个第二图像的分类结果，生成所述至少两个第一图像的参考分类结果，所述第一图像的参考分类结果用于表征所述第一图像以及对应的至少两个第二图像属于各个类别的概率；

误差确定模块，配置为基于所述至少两个第一图像的分类结果与所述至少两个第一图像的参考分类结果之间的误差值、所述至少两个第一图像对应的第二图像的分类结果与所述至少两个第一图像的参考分类结果之间的误差值，确定总误差值；

参数更新模块，配置为基于所述总误差值更新所述图像分类模型的参数，当更新后的所述图像分类模型得到输出的所述至少两个第一图像的分类结果以及对应的第二图像的分类结果满足所述参考条件时，确定训练完成。
根据权利要求9所述的装置，其中，所述结果获取模块包括：

第一获取子模块，配置为分别对所述各个第一图像对应的至少两个第二图像的分类结果取平均值，得到所述各个第一图像对应的第一参考数据；

第二获取子模块，配置为将所述各个第一图像对应的第一参考数据以及各个第一参考数据对应的评价数据，得到所述各个第一图像对应的第二参考数据，所述评价数据用于表征所述第一参考数据的准确度；

第三获取子模块，配置为基于所述第二图像的分类结果的边缘分布信息、参考边缘分布信息以及所述各个第一图像对应的第二参考数据，生成所述各个第一图像对应的所述参考分类结果。
根据权利要求10所述的装置，其中，所述第二获取子模块配置为：

对所述各个第一参考数据对应的评价数据取平均值，得到平均评价数据；

基于所述平均评价数据的梯度分别对所述各个第一参考数据进行调整，得到所述各个第一图像对应的第二参考数据。
根据权利要求11所述的装置，其中，所述各个第一参考数据对应的评价数据由评价器基于所述各个第一参考数据生成，所述评价器用于确定所述第一参考数据的准确度；

所述装置还包括：

训练模块，配置为基于所述各个第一参考数据以及所述各个第一参考数据的参考分布信息，对所述评价器进行训练，所述第一参考数据的参考分布信息用于表征所述第一参考数据中各个元素的参考值。
根据权利要求10所述的装置，其中，所述第三获取子模块配置为：

基于所述第二图像的分类结果的边缘分布信息以及所述参考边缘分布信息，确定权重向量；

将所述各个第一图像对应的第二参考数据与所述权重向量中对应相同位置的元素相乘，得到调整后的第二参考数据；

对所述调整后的第二参考数据进行归一化处理，生成所述参考分类结果。
一种计算机设备，所述计算机设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求8任一项所述的图像分类模型训练方法。
一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如权利要求1至权利要求8任一项所述的图像分类模型训练方法。