CN113569894B

CN113569894B - 图像分类模型的训练方法、图像分类方法、装置及设备

Info

Publication number: CN113569894B
Application number: CN202110181970.6A
Authority: CN
Inventors: 余双; 边成; 马锴; 郑冶枫; 刘含若; 王宁利; 初春燕
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2023-11-21
Anticipated expiration: 2041-02-09
Also published as: CN113569894A

Abstract

本申请提供了一种图像分类模型的训练方法、图像分类方法、装置及设备，属于机器学习领域。所述方法包括：基于样本图像集中多个样本图像的多个分类结果，获取多个难度信息；基于该多个难度信息和该多个分类结果，训练该至少两个第一图像分类模型，得到至少两个第二图像分类模型；对该至少两个第二图像分类模型进行融合，得到目标图像分类模型；基于该目标图像分类模型对待分类图像进行分类。上述技术方案，增强了训练得到的第二图像分类模型对分类难度较高的图像的识别效果，提高了分类的精确度，通过对至少两个第二图像分类模型进行融合，使得目标图像分类模型能够进一步的提高对分类难度较高的待分类图像的分类精确度。

Description

图像分类模型的训练方法、图像分类方法、装置及设备

技术领域

本申请涉及机器学习领域，特别涉及一种图像分类模型的训练方法、图像分类方法、装置及设备。

背景技术

随着机器学习的进步，基于训练得到的图像分类模型，能够根据图像中的内容对图像进行分类。而对图像进行分类的精确度通常与图像分类模型的训练程度相关。

目前，在训练图像分类模型时，通常是将样本图像输入待训练的图像分类模型进行训练，训练得到的图像分类模型能够实现对图像分类。

由于样本图像包括的内容多种多样，有的分类难度低，有的分类难度高，导致通过上述方式训练得到的图像分类模型仅适用于分类难度不高的图像，对分类难度较高的图像进行分类时的分类精确度不高。

发明内容

本申请实施例提供了一种图像分类模型的训练方法、图像分类方法、装置及设备，增强了训练得到的第二图像分类模型对分类难度较高的图像的识别效果，提高了分类的精确度，最后通过对至少两个第二图像分类模型进行融合，使得目标图像分类模型能够进一步的提高对分类难度较高的图像的分类精确度。所述技术方案如下：

一方面，提供了一种图像分类模型的训练方法，所述方法包括：

基于样本图像集中多个样本图像的多个分类结果，获取多个难度信息，所述难度信息用于指示对应的样本图像的分类难度，所述多个分类结果由至少两个第一图像分类模型对所述多个样本图像分类得到，表征样本图像被分类为目标图像类型的概率；

基于所述多个难度信息和所述多个分类结果，训练所述至少两个第一图像分类模型，得到至少两个第二图像分类模型，所述至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类；

对所述至少两个第二图像分类模型进行融合，得到目标图像分类模型；

基于所述目标图像分类模型对待分类图像进行分类。

在一种可选的实现方式中，所述至少两个第一图像分类模型包括基于翻转后的样本图像的局部区域训练得到的第三模型；

所述第三模型的训练步骤包括：

从翻转处理后的第三样本图像中提取目标区域，得到第二目标区域图像；

基于所述第三模型的特征提取层对所述第二目标区域图像进行特征提取；

基于所述第三模型中的分类处理层对提取到的特征进行处理，得到对所述第三样本图像的分类结果；

基于所述第三样本图像的分类结果对所述第三模型进行训练。

另一方面，提供了一种图像分类方法，所述方法包括：

获取待分类图像；

基于目标图像分类模型对所述待分类图像进行分类，得到所述待分类图像的目标分类结果，所述目标图像分类模型由上述图像分类模型的训练方法训练得到，所述目标分类结果包括所述目标图像分类模型中至少两个第二图像分类模型输出的分类结果；

基于所述目标分类结果，确定所述待分类图像所属的图像类型。

另一方面，提供了一种图像分类模型的训练装置，所述装置包括：

第一获取模块，用于基于样本图像集中多个样本图像的多个分类结果，获取多个难度信息，所述难度信息用于指示对应的样本图像的分类难度，所述多个分类结果由至少两个第一图像分类模型对所述多个样本图像分类得到，表征样本图像被分类为目标图像类型的概率；

训练模块，用于基于所述多个难度信息和所述多个分类结果，训练所述至少两个第一图像分类模型，得到至少两个第二图像分类模型，所述至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类；

融合模块，用于对所述至少两个第二图像分类模型进行融合，得到目标图像分类模型；

第一分类模块，用于基于所述目标图像分类模型对待分类图像进行分类。

在一种可选的实现方式中，所述第一获取模块，用于对于所述样本图像集中的任一样本图像，基于所述至少两个第一图像分类模型对所述样本图像进行分类，得到所述样本图像的至少两个分类结果；将所述至少两个分类结果的标准差，确定为所述样本图像的难度信息。

在一种可选的实现方式中，所述训练模块，用于对于任一第一图像分类模型，基于所述多个难度信息和所述第一图像分类模型对所述多个样本图像进行分类得到的多个分类结果，确定所述第一图像分类模型对应的目标损失函数；基于所述目标损失函数，训练所述第一图像分类模型，得到对应的第二图像分类模型。

在一种可选的实现方式中，所述装置还包括：

第二获取模块，用于获取所述至少两个第一图像分类模型，所述至少两个第一图像分类模型已训练至收敛。

在一种可选的实现方式中，所述至少两个第一图像分类模型包括基于样本图像的全图区域训练得到的第一模型；

所述第一模型的训练步骤包括：

基于所述第一模型的特征提取层对输入的第一样本图像进行特征提取；

基于所述第一模型的分类处理层对提取到的特征进行处理，得到对所述第一样本图像的分类结果；

基于所述第一样本图像的分类结果对所述第一模型进行训练。

在一种可选的实现方式中，所述至少两个第一图像分类模型包括基于样本图像的局部区域训练得到的第二模型；

所述第二模型的训练步骤包括：

从第二样本图像中提取目标区域，得到第一目标区域图像；

基于所述第二模型的特征提取层对所述目标区域图像进行特征提取；

基于所述第二模型的分类处理层对提取到的特征进行处理，得到对所述第二样本图像的分类结果；

基于所述第二样本图像的分类结果对所述第二模型进行训练。

所述第三模型的训练步骤包括：

另一方面，提供了一种图像分类装置，所述装置包括：

第二获取模块，用于获取待分类图像；

第二分类模块，用于基于目标图像分类模型对所述待分类图像进行分类，得到所述待分类图像的目标分类结果，所述目标图像分类模型由上述图像分类模型的训练方法训练得到，所述目标分类结果包括所述目标图像分类模型中至少两个第二图像分类模型输出的分类结果；

类型确定模块，用于基于所述目标分类结果，确定所述待分类图像所属的图像类型。

在一种可选的实现方式中，所述类型确定模块，用于响应于所述目标分类结果中任一第二图像分类模型输出的分类结果为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型。

在一种可选的实现方式中，所述类型确定模块，用于响应于所述目标分类结果中各第二图像分类模型输出的分类结果均为是目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型。

在一种可选的实现方式中，所述目标分类结果包括所述目标图像分类模型中第一模型、第二模型以及第三模型输出的分类结果；

所述类型确定模块，用于响应于所述目标分类结果中第一模型输出的分类结果为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型，所述第一模型为基于样本图像的全图区域训练得到的图像分类模型；或者，响应于所述目标分类结果中第二模型和第三模型输出的分类结果均为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型，所述第二模型为基于样本图像的目标区域训练得到的图像分类模型，所述第三模型为基于翻转后的样本图像的目标区域训练得到的图像分类模型。

在一种可选的实现方式中，所述装置还包括：

分类难度确定模块，用于响应于所述目标分类结果中所述至少两个第二图像分类模型输出的分类结果不完全一致，确定所述待分类图像为难分类图像。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的图像分类模型的训练方法中所执行的操作，或者加载并执行以实现本申请实施例中的图像分类方法中所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一段计算机程序，所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中的图像分类模型的训练方法中所执行的操作，或者加载并执行以实现本申请实施例中的图像分类方法中所执行的操作。

另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各方面或者各方面的各种可选实现方式中提供的图像分类模型的训练方法或者图像分类方法。

本申请实施例提供的技术方案带来的有益效果是：

在本申请实施例中，通过基于至少两个第一图像分类模型对样本图像进行分类得到的多个分类结果，获取各样本图像的分类难度，再根据各样本图像的分类难度和多个样本图像，再次训练第一图像分类模型，增强了训练得到的第二图像分类模型对分类难度较高的图像的识别效果，提高了分类的精确度，最后通过对至少两个第二图像分类模型进行融合，使得目标图像分类模型能够进一步的提高对分类难度较高的待分类图像的分类精确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的一种图像分类模型的训练方法的实施环境示意图；

图2是根据本申请实施例提供的一种图像分类模型的训练方法的流程图；

图3是根据本申请实施例提供的另一种图像分类模型的训练方法的流程图；

图4是根据本申请实施例提供的一种图像分类方法的流程图；

图5是根据本申请实施例提供的另一种图像分类方法的流程图；

图6是根据本申请实施例提供的一种图像分类模型的训练装置的框图；

图7是根据本申请实施例提供的一种图像分类装置的框图；

图8是根据本申请实施例提供的一种终端的结构框图；

图9是根据本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

下面简单介绍一下本申请实施例用到的技术：

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(Computer Vision,CV)是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容识别、三维物体重建、3D技术、虚拟现实、增强现实与地图构建等技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

本申请实施例提供了一种图像分类方法，可以基于人工智能技术实现。该方法可以应用于对图像分类的场景中。例如，对建筑物图像分类、对动植物图像分类、对人体进行分类以及对细胞进行分类等。通过将待分类的图像输入目标图像分类模型中，即可得到多个图像分类模型输出的分类结果，再根据输出的分类结果综合确定待分类图像所属的图像类型。其中，该目标图像分类模型由多个图像分类模型融合得到，该多个图像分类模型基于样本图像的不同图像区域训练得到。

下面介绍一下本申请实施例提供的图像分类模型的训练方法的实施环境，图1是根据本申请实施例提供的一种图像分类模型的训练方法的实施环境示意图。参见图1，该实施环境包括终端101和服务器102。

终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

可选地，终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端101安装和运行有支持图像分类的应用程序。可选地，该应用程序是相册类应用程序、社交类应用程序以及图像检索类应用程序等。示意性的，终端101是用户使用的终端，终端101中运行的应用程序内登录有用户账号。

可选地，服务器102是独立的物理服务器，也能够是多个物理服务器构成的服务器集群或者分布式系统，还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器，该服务器可为区块链网络上的一节点服务器。服务器102用于为支持图像分类的应用程序提供后台服务。可选地，服务器102承担主要分类工作，终端101承担次要分类工作；或者，服务器102承担次要分类工作，终端101承担主要分类工作；或者，服务器102和终端101二者之间采用分布式计算架构进行协同计算。

可选地，服务器102由接入服务器、分类服务器和数据库服务器构成。接入服务器用于提供终端101提供接入服务。分类服务器用于提供图像分类服务。分类服务器可以是一台或多台。当分类服务器是多台时，存在至少两台分类服务器用于提供不同的服务，和/或，存在至少两台分类服务器用于提供相同的服务，比如以负载均衡方式提供同一种服务，本申请实施例对此不加以限定。可选地，分类服务器中设置有图像分类模型。

终端101可以泛指多个终端中的一个，本实施例仅以终端101来举例说明。本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量，此时上述图像分类模型的训练方法的实施例中还包括其他终端。本申请实施例对终端的数量和设备类型不加以限定。

可选地，上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也能够是任何网络，包括但不限于局域网(Local Area Network，LAN)、城域网(Metropolitan Area Network，MAN)、广域网(Wide Area Network，WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一种可选的实现方式中，使用包括超文本标记语言(Hyper Text Mark-up Language，HTML)、可扩展标记语言(Extensible MarkupLanguage，XML)等的技术和/或格式来代表通过网络交换的数据。此外还能够使用诸如安全套接字层(Secure Socket Layer，SSL)、传输层安全(Transport Layer Security，TLS)、虚拟专用网络(Virtual Private Network，VPN)、网际协议安全(Internet ProtocolSecurity，IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中，还能够使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

在一种可选的实现方式中，本申请实施例提供的图像分类模型的训练方法，训练得到的目标图像分类模型，能够用于对人体器官图像进行分类的场景，分类结果用于指示人体器官产生病变的概率，下面以将目标图像分类模型用于对眼睛图像进行分类，以确定是否属于青光眼的场景进行介绍：

在本申请实施例中，服务器在训练目标图像分类模型时，基于预训练至收敛的至少两个第一图像分类模型，对青光眼图像集中的各青光眼图像和非青光眼图像进行分类，根据得到的分类结果来确定各青光眼图像的难度信息。然后，按照本申请实施例提供的图像分类模型的训练方法，基于各样本图像的难度信息对上述至少两个第一图像分类模型进行再次训练，得到至少两个第二图像分类模型，以提高模型对分类难度大的青光眼图像的识别效果。最后，通过对训练得到的至少两个第二图像分类模型进行融合，从而得到目标图像分类模型。终端采集并上传青光眼眼底图像，目标图像分类模型中的至少两个第二图像分类模型分别对该青光眼眼底图像进行分类，根据各第二图像分类模型输出的分类结果，最终确定是否属于青光眼。

在一种可选的实现方式中，本申请实施例提供的图像分类模型的训练方法，训练得到的目标图像分类模型，还能够用于对细胞图像进行分类的场景，分类结果用于指示细胞产生病变的概率，下面以将目标图像分类模型用于对宫颈基液涂片图像进行分类，以确定是否是包括宫颈癌细胞的场景进行介绍：

待分类图像为通过电子显微镜采集的宫颈基液涂片的显微图像，该显微图像包括宫颈癌细胞，通过数据传输接口将该包括宫颈癌细胞的显微图像发送至服务器。在本申请实施例中，服务器在训练图像分类模型时，基于预训练至收敛的至少两个第一图像分类模型，对细胞图像集中的各宫颈癌细胞图像和非宫颈癌细胞图像进行分类，根据得到的分类结果来确定各细胞图像的难度信息。然后，按照本申请实施例提供的图像分类模型的训练方法，基于各样本图像的难度信息对上述至少两个第一图像分类模型进行再次训练，得到至少两个第二图像分类模型，以提高模型对分类难度大的宫颈癌细胞图像的识别效果。最后，通过对训练得到的至少两个第二图像分类模型进行融合，从而得到目标图像分类模型。终端上传宫颈基液涂片的显微图像，目标图像分类模型中的至少两个第二图像分类模型分别对该宫颈基液涂片的显微图像进行分类，根据各第二图像分类模型输出的分类结果，最终确定是否包括宫颈癌细胞。

在一种可选的实现方式中，本申请实施例提供的图像分类模型的训练方法，训练得到的目标图像分类模型，还能够用于对动物进行分类的场景，分类结果用于指示图中的动物为不同种类的概率，下面以对猫和狗进行分类的场景进行介绍：

服务器在训练目标图像分类模型时，能够获取大量包括猫以及包括狗的动物图像组成动物图像集。服务器基于预训练至收敛的至少两个第一图像分类模型，对动物图像集中的猫图像和狗图像进行分类，根据得到的分类结果来确定各动物图像的难度信息。然后，按照本申请实施例提供的图像分类模型的训练方法，基于各样本图像的难度信息对上述至少两个第一图像分类模型进行再次训练，得到至少两个第二图像分类模型，以提高模型对分类难度大的猫图像或者狗图像的识别效果。最后，通过对训练得到的至少两个第二图像分类模型进行融合，从而得到目标图像分类模型。终端上传动物图像，目标图像分类模型中的至少两个第二图像分类模型分别对该动物图像进行分类，根据各第二图像分类模型输出的分类结果，最终确定是属于包括猫的图像还是属于包括狗的图像。

在本申请实施例中，由服务器或终端作为执行主体来实施本申请实施例提供的技术方案，或者通过终端和服务器之间的交互来实施本申请提供的技术方法，本申请实施例对此不作限定。图2是根据本申请实施例提供的一种图像分类模型的训练方法的流程图，如图2所示，该实施例以执行主体为服务器为例进行说明，该方法包括以下步骤：

201、服务器基于样本图像集中多个样本图像的多个分类结果，获取多个难度信息，该难度信息用于指示对应的样本图像的分类难度，所述多个分类结果由至少两个第一图像分类模型对所述多个样本图像分类得到，表征样本图像被分类为目标图像类型的概率。

在本申请实施例中，服务器能够获取已训练至收敛的至少两个第一图像分类模型，基于该至少两个第一图像分类模型，对样本图像集中的多个样本图像进行分类，得到多个分类结果。其中，样本图像集中包括分类难度不同的样本图像，部分样本图像特征明显，分类难度较低，相应的分类准确度高；另一部分样本图像特征不够明显或者容易混淆，分类难度较高，相应的分类准确度不高。服务器能够上述多个分类结果，确定该多个样本图像的难度信息，或者，服务器还能够获取已存储的难度信息。

202、服务器基于多个难度信息和多个分类结果，训练至少两个第一图像分类模型，得到至少两个第二图像分类模型，该至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类。

在本申请实施例中，服务器在获取到多个样本图像的多个难度信息之后，能够基于该多个难度信息以及各样本图像的分类结果，对已训练至收敛的至少两个第一图像分类模型，进行进一步的训练，以提高训练得到的至少两个第二图像分类模型对分类难度大的图像的分类精确度。

203、服务器对该至少两个第二图像分类模型进行融合，得到目标图像分类模型。

在本申请实施例中，服务器能够对训练得到的至少两个第二图像分类模型进行融合。可选地，融合的方式包括平均、加权平均、敏感度优先、敏感度平衡以及低敏感度等。其中，敏感度越高，表示服务器越容易将待分类图像分类为目标图像类型。如在敏感度优先的融合方式下，任一第二图像分类模型输出的分类结果指示待分类图像属于目标图像类型，则服务器确定该待分类图像属于目标图像类型。

204、服务器基于该目标图像分类模型对待分类图像进行分类。

在本申请实施例中，服务器在接收到待分类图像时，能够将该待分类图像输入目标图像分类模型，由该目标图像分类模型中的至少两个图像分类模型分别对该待分类图像进行分类，得到该待分类图像的目标分类结果。

上述图2是本申请实施例提供的图像分类模型的训练方法的主要流程，下面基于一种应用场景，对该图像分类模型的训练方法进行进一步描述。如图3所示，图3是根据本申请实施例提供的另一种图像分类模型的训练方法的流程图，参见图3，在本申请实施例中以应用于服务器为例进行说明。该图像分类模型的训练方法包括以下步骤：

301、服务器获取至少两个第一图像分类模型，该至少两个第一图像分类模型已训练至收敛，该至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类。

在本申请实施例中，服务器能够获取基于样本图像的不同图像区域进行训练得到的至少两个第一图像分类模型，该至少两个第一图像分类模型已基于样本图像训练至收敛。其中，服务器能够直接获取已训练至收敛的至少两个第一图像分类模型，也能够基于样本图像集训练得到至少两个第一图像分类模型。也即对于任一第一图像分类模型，服务器能够基于样本图像集中的各样本图像，对未训练完毕的第一图像分类模型进行训练，从而得到训练完毕的该第一图像分类模型。

在一种可选的实现方式中，上述至少两个第一图像分类模型中包括第一模型，该第一模型基于样本图像的全图区域训练得到。相应的，该第一模型的训练步骤包括：服务器基于第一模型的特征提取层对输入的第一样本图像进行特征提取。然后基于该第一模型的分类处理层对提取到的特征进行处理，得到对该第一样本图像的分类结果。服务器基于第一样本图像的分类结果对该第一模型进行训练，直至该第一模型收敛。其中，该第一模型基于深度学习分类模型框架构建，分类处理层包括全局平均池化层和全连接层，如Inception模型，DenseNet模型，ResNet模型，VGG(Visual Geometry Group Network)模型，EfficientNet模型或者其他广泛使用的深度学习分类框架。需要说明的是，该第一模型用于基于图像的全图区域进行分类。

例如，该第一模型为基于青光眼眼底图像的全图区域训练得到的模型。在训练该第一模型时，服务器将青光眼的眼底彩照全图送入深度学习模型中进行特征提取，然后服务器将提取到的特征送入全局平均池化层(GAP，Global Average Pooling)和全连接层(FC，Fully connected layer)进行青光眼概率的预测，最后服务器根据预测结果来调整该深度学习模型的参数，得到该第一模型。

在一种可选的实现方式中，上述至少两个第一图像分类模型中包括第二模型，该第二模型基于样本图像的局部区域训练得到。相应的，该第二模型的训练步骤包括：服务器从第二样本图像中提取目标区域，得到第一目标区域图像。然后服务器基于该第二模型的特征提取层，对该第一目标区域图像进行特征提取。然后服务器基于该第二模型的分类处理层对提取到的特征进行处理，得到对该第二样本图像的分类结果。服务器基于该第二样本图像的分类结果对该第二模型进行训练，直至该第二模型收敛。可选地，该第二模型的框架与上述第一模型相同，或者与上述第一模型不同，本申请实施例对此不进行限制。需要说明的是，该目标区域为样本图像中主要内容所在区域，如将青光眼眼底图像中以视盘为中心的图像区域作为感兴趣区域进行提取，如3倍视盘直径的区域或者5倍视盘直径的区域等，本申请实施例对此不进行限制。

例如，该第二模型为基于青光眼眼底图像的视盘周边局部区域训练得到的模型。在训练该第二模型时，对于青光眼的眼底彩照全图，服务器以视盘为中心，将三个视盘直径区域内的图像作为感兴趣区域(ROI，Region Of Interest)进行提取，得到ROI区域图像，也即第一目标区域图像。服务器将该ROI区域图像送入深度学习模型中进行视盘区局部区域的特征提取，然后服务器将提取到的特征送入全局平均池化层和全连接层进行青光眼概率的预测，最后服务器根据预测结果来调整该深度学习模型的参数，得到该第一模型。需要说明的是，ROI区域的大小不固定，可以是上述三个视盘直径区域，也可以是围绕着视盘及周边的其他大小。

在一种可选的实现方式中，上述至少两个第一图像分类模型中包括第三模型，该第三模型基于翻转处理后的样本图像的局部区域训练得到。相应的，该第三模型的训练步骤包括：对第三样本图像进行翻转处理，从翻转处理后的第三样本图像中提取目标区域，得到第二目标区域图像；服务器基于第三模型的特征提取层对该第二目标区域图像进行特征提取。服务器基于第三模型中的分类处理层对提取到的特征进行处理，得到对该第三样本图像的分类结果。服务器基于该第三样本图像的分类结果对该第三模型进行训练，直至该第三模型收敛。可选地，该第三模型的框架与上述第一模型相同，或者与上述第一模型不同，本申请实施例对此不进行限制。

例如，该第三模型与第二模型相同，服务器将上述ROI区域图像左右翻转后，输入该第三模型进行青光眼概率的预测。在此不再赘述。

需要说明的是，上述至少两个第一图像分类模型还包括其他模型，如基于左右翻转后的青光眼眼底图像的全图区域训练得到的第四模型等。或者基于其他方式变化后的图像训练得到的模型，本申请实施例对此不进行限制。

302、服务器获取样本图像集中多个样本图像的多个分类结果，获取多个难度信息，该难度信息用于指示对应的样本图像的分类难度，该多个分类结果由至少两个第一图像分类模型对该多个样本图像分类得到，表征样本图像被分类为目标图像类型的概率。

在本申请实施例中，服务器在获取到至少两个第一图像分类模型之后，能够将样本图像集中的多个样本图像分别输入到上述至少两个第一图像分类模型中，每个第一图像分类模型分别对每个样本图像进行分类，得到每个样本图像的至少两个分类结果。服务器能够基于该多个样本图像的多个分类结果，获取该多个样本图像的多个难度信息。

例如，以样本图像为青光眼图像为例。对于简单案例，也即分类难度较低的青光眼图像，不同模型输出的青光眼概率，也即分类结果，一般较为接近；而对于困难案例，也即分类难度较高的青光眼图像，不同模型输出的青光眼概率可能存在较大差异。因此，不同模型之间输出的青光眼概率的一致性或者差异，能够间接反映样本图像为简单案例或者困难案例的可能性。因此，基于每个样本图像的至少两个分类结果，能够得到每个样本图像的难度信息。

下面以获取一个样本图像的难度信息为例进行说明。对于样本图像集中的任一样本图像，服务器基于上述至少两个第一图像分类模型对该样本图像进行分类，得到该样本图像的至少两个分类结果，其中一个第一图像分类模型输出一个分类结果。服务器将该至少两个分类结果的标准差，确定为该样本图像的难度信息。

需要说明的是，服务器还能够对样本图像进行各种变换后，如翻转、对称、放大、缩小、模糊或者平滑等，再输入上述至少两个第一图像分类模型。这种情况下，对于一个样本图像，一个第一图像分类模型能够输出多个分类结果。

针对不同情况，服务器能够基于下述公式(1)来计算得到样本图像的难度系数，将该难度系数确定为该样本图像的难度信息。

其中，N表示样本图像对应的分类结果的数量，p_i表示第i个分类结果。

需要说明的是，上述样本图像集与训练上述至少两个第一图像分类模型所用的样本图像集可以相同，也可以不同。

303、服务器基于该多个难度信息和多个分类结果，训练该至少两个第一图像分类模型，得到至少两个第二图像分类模型。

在本申请实施例中，各第一图像分类模型的训练方式相同，服务器能够采用并行训练的方式对该至少两个第一图像分类模型进行再次训练。

相应的，对于任一第一图像分类模型，服务器能够基于该多个难度信息和该第一图像分类模型对多个样本图像进行分类得到多个分类结果，确定该第一图像分类模型对应的目标损失函数。服务器基于该目标损失函数，训练该第一图像分类模型，得到对应的第二图像分类模型。也即，服务器能够基于个样本图像的难度信息，对各样本图像进行加权，提高难度较高的样本图像在损失的反向传递(back propagation)过程中的权重，从而难度较高的样本就会更加影响模型的参数更新。

其中，目标损失函数的计算方式参见公式(2)所示。

其中，L表示目标损失函数，y表示样本图像的实际标签，y′表示样本图像的分类结果，H_j表示第j个样本图像的难度信息。

304、服务器对该至少两个第二图像分类模型进行融合，得到目标图像分类模型。

在本申请实施例中，服务器能够采用多种方式对训练得到的至少两个第二图像分类模型进行融合，从而得到目标图像分类模型。可选地，融合的方式包括平均、加权平均、敏感度优先、敏感度平衡以及低敏感度等。其中，敏感度越高，表示服务器越容易将待分类图像分类为目标图像类型。

305、服务器基于该目标图像分类模型对待分类图像进行分类。

在本申请实施例中，服务器接收待分类图像，然后将该待分类图像输入目标图像分类模型，得到该待分类图像的目标分类结果，基于该目标分类结果，确定该待分类图像所属的图像类型。

图4是根据本申请实施例提供的一种图像分类方法的流程图，如图4所示，该实施例中以执行主体为终端为例进行说明，该方法包括以下步骤：

401、终端获取待分类图像。

在本申请实施例中，该待分类图像为终端实时采集的图像或者根据选择操作从相册应用选取的图像。

402、终端基于目标图像分类模型对该待分类图像进行分类，得到该待分类图像的目标分类结果，该目标图像分类模型由上述图像分类模型的训练方法训练得到，该目标分类结果包括该目标图像分类模型中至少两个第二图像分类模型输出的分类结果。

在本申请实施例中，终端将该待分类图像输入目标图像分类模型，得到目标分类结果。

403、终端基于该目标分类结果，确定该待分类图像所属的图像类型。

在本申请实施例中，通过目标图像分类模型对待分类图像进行分类，使得得到的目标分类结果为对至少两个第二图像分类模型进行融合后得到的分类结果，能够提高对分类难度较高的待分类图像的分类精确度。

上述图4是本申请实施例提供的图像分类方法的主要流程，下面基于一种应用场景，对该图像分类方法进行进一步描述。图5是根据本申请实施例提供的另一种图像分类方法的流程图，如图5所示，该实施例中以执行主体为终端为例进行说明，该方法包括以下步骤：

501、终端获取待分类图像。

在本申请实施例中，该待分类图像为终端实时采集的图像或者根据选择操作从相册应用选取的图像。可选地，该待分类图像为青光眼眼底图像、细胞显微图像或者动植物图像。

502、终端基于目标图像分类模型对该待分类图像进行分类，得到该待分类图像的目标分类结果，该目标图像分类模型由上述图像分类模型的训练方法训练得到，该目标分类结果包括该目标图像分类模型中至少两个第二图像分类模型输出的分类结果。

例如，以待分类图像为青光眼眼底图像，目标图像分类模型包括基于青光眼眼底图像的全图区域训练得到的第一模型、青光眼眼底图像的视盘区域训练得到的第二模型以及左右翻转后的青光眼眼底图像的视盘区域训练得到的第三模型为例。终端将青光眼眼底图像输入该目标图像分类模型，由上述第一模型、第二模型以及第三模型分别输出分类结果，得到目标分类结果。第一模型输出的分类结果，也即对全图青光眼的预测概率表示为Prob_full；第二模型输出的分类结果，也即视盘区青光眼的预测概率表示为Prob_disc；第三模型输出的分类结果，也即视盘区左右翻转的预测概率表示为Prob_flipdisc。

503、终端基于该目标分类结果，确定该待分类图像所属的图像类型。

目标图像分类模型由至少两个第二图像分类模型采用不同方式融合得到，如敏感度较高的融合方式、敏感度与特异度平衡的融合方式以及特异度较高的融合方式等。其中，敏感度越高，表示服务器越容易将待分类图像分类为目标图像类型。特异度越高，表示服务器越不容易将待分类图像分类为目标图像类型。通过设置不同的融合方式，能够满足不同应用场景对于不同敏感度特异度的需求。

在一种可选的实现方式中，当目标图像分类模型采用敏感度较高的融合方式，对至少两个第二图像分类模型融合得到时，终端响应于目标分类结果中任一第二图像分类模型输出的分类结果为目标图像类型，确定该待分类图像所属的图像类型为目标图像类型。

例如，继续以502的举例进行说明。敏感度较高的融合方式将三个概率预测中取青光眼概率最高的预测作为最终系统预测值，也即目标分类结果Prob1＝MAX([Prob_full,Prob_disc,Prob_flipdisc])。而对于待分类图像是否为青光眼类型，则待分类图像所属的图像类型表示为Pred1＝(Prob_full>＝0.5)OR(Prob_disc>＝0.5)OR(Prob_flipdisc>＝0.5)，也即任意一个模型预测该图为青光眼，即认为待分类图像为青光眼，此时模型有高敏感度。

在一种可选的实现方式中，当目标图像分类模型采用敏感度与特异度平衡的融合方式，对至少两个第二图像分类模型融合得到时，以目标分类结果包括目标图像分类模型中第一模型、第二模型以及第三模型输出的分类结果为例，终端响应于该目标分类结果中第一模型输出的分类结果为目标图像类型，确定该待分类图像所属的图像类型为该目标图像类型，该第一模型为基于样本图像的全图区域训练得到的图像分类模型；或者，响应于该目标分类结果中第二模型和第三模型输出的分类结果均为目标图像类型，确定该待分类图像所属的图像类型为该目标图像类型，该第二模型为基于样本图像的目标区域训练得到的图像分类模型，该第三模型为基于翻转后的样本图像的目标区域训练得到的图像分类模型。

例如，继续以502的举例进行说明。敏感度与特异度平衡的融合方式对于视盘区和视盘区翻转图像的预测概率取二者的最小值，用此最小值和全图的预测概率取其中较大值，也即目标分类结果Prob2＝MAX(Prob_full,MIN(Prob_disc，Prob_flipdisc))。而对于待分类图像是否为青光眼类型，则待分类图像所属的图像类型表示为Pred2＝(Prob_full>＝0.5)OR((Prob_disc>＝0.5)AND(Prob_flipdisc>＝0.5))，也即需要视盘区和视盘区翻转的概率二者均预测为青光眼，或者全图模型预测为青光眼，才会确定的待分类图像为青光眼。

在一种可选的实现方式中，当目标图像分类模型采用特异度较高的融合方式，对至少两个第二图像分类模型融合得到时，终端响应于目标分类结果中各第二图像分类模型输出的分类结果均为是目标图像类型，确定待分类图像所属的图像类型为目标图像类型。

例如，继续以502的举例进行说明。特异度较高的融合方式将三个概率预测中取青光眼概率最低的预测作为最终系统预测值，也即目标分类结果Prob3＝MIN([Prob_full,Prob_disc,Prob_flipdisc])。而对于待分类图像是否为青光眼类型，则待分类图像所属的图像类型表示为Pred3＝(Prob_full>＝0.5)AND(Prob_disc>＝0.5)AND(Prob_flipdisc>＝0.5)，也即只有所有的概率均预测该图为青光眼时，才会确定待分类图像为青光眼，此时具有低敏感度，高特异度。

504、响应于目标分类结果中至少两个第二图像分类模型输出的分类结果不完全一致，终端确定待分类图像为难分类图像。

在本申请实施例中，终端根据目标分类结果，还能够确定待分类图像是分类难度较低的易分类图像，还是分类难度较高的难分类图像。

例如，以待分类图像为眼底图像为例，对于青光眼或者非青光眼，如果是处于晚期的青光眼，则以上3个输出(Prob_full，Prob_disc,Prob_flipdisc)有很大概率均会预测为青光眼；而对于视盘区无症状的正常眼睛来说，以上三个输出会有很大概率均预测为非青光眼，也即模型间的一致率较高，此时确定该待分类图像为易分类图像，属于临床简单案例。而对于极早期的青光眼，或者视盘区有症状但不是典型的青光眼症状时，此时3个输出有极大可能是给出不同的预测结果，即有的模型给出青光眼判定，而其他模型给出非青光眼的判定，也即模型间输出的分类结果不完全一致，此时确定该待分类图像为难分类图像。

再如，终端还能够利用不同敏感度特异度配置下确定的图像类型，来判断待分类图像是否为青光眼难例。若不论采用哪种融合方式，终端确定的图像类型均无变化，即Pred1≡Pred3，则终端确定该待分类图像为易分类图像；若采用不同融合方式，终端确定的图像类型不同，即Pred1≠Pred3，则终端确定该待分类图像为难分类图像。

可选地，对于难分类图像，终端能够将该图像发送至专业技术人员的设备，提示专业技术人员进行进一步的确认，或者进行提示。

例如，对于青光眼检测场景，对于困难案例，终端将眼底图像发送至临床医生的终端，由临床医生进行进一步的专业诊断，或者提示病人接受进一步的检查，以最终确认是否为青光眼图像。

图6是根据本申请实施例提供的一种图像分类模型的训练装置的框图。该装置用于执行上述图像分类模型的训练方法执行时的步骤，参见图6，装置包括：第一获取模块601、训练模块602、融合模块603以及第一分类模块604。

第一获取模块601，用于基于样本图像集中多个样本图像的多个分类结果，获取多个难度信息，该难度信息用于指示对应的样本图像的分类难度，该多个分类结果由至少两个第一图像分类模型对该多个样本图像分类得到，表征样本图像被分类为目标图像类型的概率；

训练模块602，用于基于该多个难度信息和该多个分类结果，训练该至少两个第一图像分类模型，得到至少两个第二图像分类模型，该至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类；

融合模块603，用于对该至少两个第二图像分类模型进行融合，得到目标图像分类模型；

第一分类模块604，用于基于该目标图像分类模型对待分类图像进行分类。

在一种可选的实现方式中，该第一获取模块，用于对于该样本图像集中的任一样本图像，基于该至少两个第一图像分类模型对该样本图像进行分类，得到该样本图像的至少两个分类结果；将该至少两个分类结果的标准差，确定为该样本图像的难度信息。

在一种可选的实现方式中，该训练模块602，用于对于任一第一图像分类模型，基于该多个难度信息和该第一图像分类模型对该多个样本图像进行分类得到的多个分类结果，确定该第一图像分类模型对应的目标损失函数；基于该目标损失函数，训练该第一图像分类模型，得到对应的第二图像分类模型。

在一种可选的实现方式中，该装置还包括：

第二获取模块，用于获取该至少两个第一图像分类模型，该至少两个第一图像分类模型已训练至收敛。

在一种可选的实现方式中，该至少两个第一图像分类模型包括基于样本图像的全图区域训练得到的第一模型；

该第一模型的训练步骤包括：

基于该第一模型的特征提取层对输入的第一样本图像进行特征提取；

基于该第一模型的分类处理层对提取到的特征进行处理，得到对该第一样本图像的分类结果；

基于该第一样本图像的分类结果对该第一模型进行训练。

在一种可选的实现方式中，该至少两个第一图像分类模型包括基于样本图像的局部区域训练得到的第二模型；

该第二模型的训练步骤包括：

从第二样本图像中提取目标区域，得到第一目标区域图像；

基于该第二模型的特征提取层对该目标区域图像进行特征提取；

基于该第二模型的分类处理层对提取到的特征进行处理，得到对该第二样本图像的分类结果；

基于该第二样本图像的分类结果对该第二模型进行训练。

在一种可选的实现方式中，该至少两个第一图像分类模型包括基于翻转后的样本图像的局部区域训练得到的第三模型；

该第三模型的训练步骤包括：

基于该第三模型的特征提取层对该第二目标区域图像进行特征提取；

基于该第三模型中的分类处理层对提取到的特征进行处理，得到对该第三样本图像的分类结果；

基于该第三样本图像的分类结果对该第三模型进行训练。

图7是根据本申请实施例提供的一种图像分类装置的框图。该图像分类装置用于执行上述图像分类方法执行时的步骤，参见图7，装置包括：第二获取模块701、第二分类模块702以及类型确定模块703。

第二获取模块701，用于获取待分类图像；

第二分类模块702，用于基于目标图像分类模型对该待分类图像进行分类，得到该待分类图像的目标分类结果，该目标图像分类模型由上述图像分类模型的训练方法训练得到，该目标分类结果包括该目标图像分类模型中至少两个第二图像分类模型输出的分类结果；

类型确定模块703，用于基于该目标分类结果，确定该待分类图像所属的图像类型。

在一种可选的实现方式中，该类型确定模块703，用于响应于该目标分类结果中任一第二图像分类模型输出的分类结果为目标图像类型，确定该待分类图像所属的图像类型为该目标图像类型。

在一种可选的实现方式中，该类型确定模块703，用于响应于该目标分类结果中各第二图像分类模型输出的分类结果均为是目标图像类型，确定该待分类图像所属的图像类型为该目标图像类型。

在一种可选的实现方式中，该目标分类结果包括该目标图像分类模型中第一模型、第二模型以及第三模型输出的分类结果；

该类型确定模块703，用于响应于该目标分类结果中第一模型输出的分类结果为目标图像类型，确定该待分类图像所属的图像类型为该目标图像类型，该第一模型为基于样本图像的全图区域训练得到的图像分类模型；或者，响应于该目标分类结果中第二模型和第三模型输出的分类结果均为目标图像类型，确定该待分类图像所属的图像类型为该目标图像类型，该第二模型为基于样本图像的目标区域训练得到的图像分类模型，该第三模型为基于翻转后的样本图像的目标区域训练得到的图像分类模型。

在一种可选的实现方式中，该装置还包括：

分类难度确定模块，用于响应于该目标分类结果中该至少两个第二图像分类模型输出的分类结果不完全一致，确定该待分类图像为难分类图像。

需要说明的是：上述实施例提供的图像分类模型的训练装置在训练图像分类模型时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的图像分类模型的训练装置与图像分类模型的训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

需要说明的是：上述实施例提供的图像分类装置在进行图像分类时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的图像分类装置与图像分类方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在本申请实施例中，计算机设备能够被配置为终端或者服务器，当计算机设备被配置为终端时，可以由终端作为执行主体来实施本申请实施例提供的技术方案，当计算机设备被配置为服务器时，可以由服务器作为执行主体来实施本申请实施例提供的技术方案，也可以通过终端和服务器之间的交互来实施本申请提供的技术方案，本申请实施例对此不作限定。

图8是根据本申请实施例提供的一种终端800的结构框图。该终端800可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving Picture Experts GroupAudio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端800包括有：处理器801和存储器802。

处理器801可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一种可选的实现方式中，处理器801可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器801还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一种可选的实现方式中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个计算机程序，该至少一个计算机程序用于被处理器801所执行以实现本申请中方法实施例提供的图像分类方法。

在一种可选的实现方式中，终端800还可选包括有：外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地，外围设备包括：射频电路804、显示屏805、摄像头组件806、音频电路807和电源809中的至少一种。

外围设备接口803可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一种可选的实现方式中，处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上；在一些其他实施例中，处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路804用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路804包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一种可选的实现方式中，射频电路804还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏805用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时，显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时，显示屏805还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一种可选的实现方式中，显示屏805可以为一个，设置在终端800的前面板；在另一些实施例中，显示屏805可以为至少两个，分别设置在终端800的不同表面或呈折叠设计；在另一些实施例中，显示屏805可以是柔性显示屏，设置在终端800的弯曲表面上或折叠面上。甚至，显示屏805还可以设置成非矩形的不规则图形，也即异形屏。显示屏805可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件806用于采集图像或视频。可选地，摄像头组件806包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一种可选的实现方式中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一种可选的实现方式中，摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器801进行处理，或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一种可选的实现方式中，音频电路807还可以包括耳机插孔。

电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一种可选的实现方式中，终端800还包括有一个或多个传感器810。该一个或多个传感器810包括但不限于：加速度传感器811、陀螺仪传感器812、压力传感器813、光学传感器815以及接近传感器816。

加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号，控制显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器812可以检测终端800的机体方向及转动角度，陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器813可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器813设置在终端800的侧边框时，可以检测用户对终端800的握持信号，由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在显示屏805的下层时，由处理器801根据用户对显示屏805的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

光学传感器815用于采集环境光强度。在一个实施例中，处理器801可以根据光学传感器815采集的环境光强度，控制显示屏805的显示亮度。具体地，当环境光强度较高时，调高显示屏805的显示亮度；当环境光强度较低时，调低显示屏805的显示亮度。在另一个实施例中，处理器801还可以根据光学传感器815采集的环境光强度，动态调整摄像头组件806的拍摄参数。

接近传感器816，也称距离传感器，通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中，当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时，由处理器801控制显示屏805从亮屏状态切换为息屏状态；当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时，由处理器801控制显示屏805从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图8中示出的结构并不构成对终端800的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图9是根据本申请实施例提供的一种服务器的结构示意图，该服务器900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central ProcessingUnits，CPU)901和一个或一个以上的存储器902，其中，该存储器902中存储有至少一条计算机程序，该至少一条计算机程序由该处理器901加载并执行以实现上述各个方法实施例提供的图像分类模型的训练方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质应用于计算机设备，该计算机可读存储介质中存储有至少一段计算机程序，该至少一段计算机程序由处理器加载并执行以实现上述实施例的图像分类模型的训练方法或者图像分类方法中计算机设备所执行的操作。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各种可选实现方式中提供的图像分类模型的训练方法或者图像分类方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种图像分类模型的训练方法，其特征在于，所述方法包括：

对于样本图像集中的任一样本图像，基于至少两个第一图像分类模型对所述样本图像进行分类，得到所述样本图像的至少两个分类结果，所述至少两个分类结果用于表征样本图像被分类为目标图像类型的概率；

将所述至少两个分类结果的标准差，确定为所述样本图像的难度信息，所述难度信息用于指示对应的样本图像的分类难度；

基于所述样本图像集中多个样本图像的多个难度信息和所述多个样本图像的多个分类结果，训练所述至少两个第一图像分类模型，得到至少两个第二图像分类模型，所述至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类；

基于所述目标图像分类模型对待分类图像进行分类。

2.根据权利要求1所述的方法，其特征在于，所述基于所述样本图像集中多个样本图像的多个难度信息和所述多个样本图像的多个分类结果，训练所述至少两个第一图像分类模型，得到至少两个第二图像分类模型，包括：

对于任一第一图像分类模型，基于所述样本图像集中多个样本图像的多个难度信息和所述第一图像分类模型对所述多个样本图像进行分类得到的多个分类结果，确定所述第一图像分类模型对应的目标损失函数；

基于所述目标损失函数，训练所述第一图像分类模型，得到对应的第二图像分类模型。

3.根据权利要求1或2任一项所述的方法，其特征在于，所述方法还包括：

获取所述至少两个第一图像分类模型，所述至少两个第一图像分类模型已训练至收敛。

4.根据权利要求3所述的方法，其特征在于，所述至少两个第一图像分类模型包括基于样本图像的全图区域训练得到的第一模型；

所述第一模型的训练步骤包括：

5.根据权利要求3所述的方法，其特征在于，所述至少两个第一图像分类模型包括基于样本图像的局部区域训练得到的第二模型；

所述第二模型的训练步骤包括：

从第二样本图像中提取目标区域，得到第一目标区域图像；

6.一种图像分类方法，其特征在于，所述方法包括：

获取待分类图像；

基于目标图像分类模型对所述待分类图像进行分类，得到所述待分类图像的目标分类结果，所述目标图像分类模型由所述权利要求1至5任一项训练得到，所述目标分类结果包括所述目标图像分类模型中至少两个第二图像分类模型输出的分类结果；

7.根据权利要求6所述的方法，其特征在于，所述基于所述目标分类结果，确定所述待分类图像所属的图像类型，包括：

响应于所述目标分类结果中任一第二图像分类模型输出的分类结果为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型。

8.根据权利要求6所述的方法，其特征在于，所述基于所述目标分类结果，确定所述待分类图像所属的图像类型，包括：

响应于所述目标分类结果中各第二图像分类模型输出的分类结果均为是目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型。

9.根据权利要求6所述的方法，其特征在于，所述目标分类结果包括所述目标图像分类模型中第一模型、第二模型以及第三模型输出的分类结果；

所述基于所述目标分类结果，确定所述待分类图像所属的图像类型，包括：

响应于所述目标分类结果中第一模型输出的分类结果为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型，所述第一模型为基于样本图像的全图区域训练得到的图像分类模型；或者，

响应于所述目标分类结果中第二模型和第三模型输出的分类结果均为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型，所述第二模型为基于样本图像的目标区域训练得到的图像分类模型，所述第三模型为基于翻转后的样本图像的目标区域训练得到的图像分类模型。

10.根据权利要求8所述的方法，其特征在于，所述方法还包括：

响应于所述目标分类结果中所述至少两个第二图像分类模型输出的分类结果不完全一致，确定所述待分类图像为难分类图像。

11.一种图像分类模型的训练装置，其特征在于，所述装置包括：

第一获取模块，用于对于样本图像集中的任一样本图像，基于至少两个第一图像分类模型对所述样本图像进行分类，得到所述样本图像的至少两个分类结果，所述至少两个分类结果用于表征样本图像被分类为目标图像类型的概率；将所述至少两个分类结果的标准差，确定为所述样本图像的难度信息，所述难度信息用于指示对应的样本图像的分类难度；

训练模块，用于基于所述样本图像集中多个样本图像的多个难度信息和所述多个样本图像的多个分类结果，训练所述至少两个第一图像分类模型，得到至少两个第二图像分类模型，所述至少两个第一图像分类模型分别用于基于样本图像的不同图像区域进行分类；

12.根据权利要求11所述的装置，其特征在于，所述训练模块，用于对于任一第一图像分类模型，基于所述多个难度信息和所述第一图像分类模型对所述多个样本图像进行分类得到的多个分类结果，确定所述第一图像分类模型对应的目标损失函数；

13.根据权利要求11或12任一项所述的装置，其特征在于，所述装置还包括：

14.根据权利要求13所述的装置，其特征在于，所述至少两个第一图像分类模型包括基于样本图像的全图区域训练得到的第一模型；

所述第一模型的训练步骤包括：

15.根据权利要求13所述的装置，其特征在于，所述至少两个第一图像分类模型包括基于样本图像的局部区域训练得到的第二模型；

所述第二模型的训练步骤包括：

从第二样本图像中提取目标区域，得到第一目标区域图像；

16.一种图像分类装置，其特征在于，所述装置包括：

第二获取模块，用于获取待分类图像；

第二分类模块，用于基于目标图像分类模型对所述待分类图像进行分类，得到所述待分类图像的目标分类结果，所述目标图像分类模型由所述权利要求1至5任一项训练得到，所述目标分类结果包括所述目标图像分类模型中至少两个第二图像分类模型输出的分类结果；

17.根据权利要求16所述的装置，其特征在于，所述类型确定模块，用于响应于所述目标分类结果中任一第二图像分类模型输出的分类结果为目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型。

18.根据权利要求16所述的装置，其特征在于，所述类型确定模块，用于响应于所述目标分类结果中各第二图像分类模型输出的分类结果均为是目标图像类型，确定所述待分类图像所属的图像类型为所述目标图像类型。

19.根据权利要求16所述的装置，其特征在于，所述目标分类结果包括所述目标图像分类模型中第一模型、第二模型以及第三模型输出的分类结果；

20.根据权利要求18所述的装置，其特征在于，所述装置还包括：

21.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行权利要求1至5任一项所述的图像分类模型的训练方法，或者执行权利要求6至10任一项所述的图像分类方法。

22.一种存储介质，其特征在于，所述存储介质用于存储至少一段计算机程序，所述至少一段计算机程序用于执行权利要求1至5任一项所述的图像分类模型的训练方法，或者执行权利要求6至10任一项所述的图像分类方法。