CN116958626A

CN116958626A - 一种图像分类模型训练、图像分类方法、装置及电子设备

Info

Publication number: CN116958626A
Application number: CN202310118758.4A
Authority: CN
Inventors: 吴秉哲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-01-31
Filing date: 2023-01-31
Publication date: 2023-10-27

Abstract

本申请公开了一种图像分类模型训练、图像分类方法、装置及电子设备，具体的，该方法包括：将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到中间层特征信息和预测类别指示信息；基于样本病理分块图像的标注类别指示信息和预测类别指示信息，训练待训练病理图像分类模型；基于与中间层特征信息匹配的参考类别特征信息对应的预设病理类别标签，对标注类别指示信息进行校准处理；基于校准后的标注类别指示信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件。利用本申请的技术方案，可以提升病理图像分类模型的图像分类性能。

Description

一种图像分类模型训练、图像分类方法、装置及电子设备

技术领域

本申请涉及计算机视觉技术领域，尤其涉及一种图像分类模型训练、图像分类方法、装置及电子设备。

背景技术

随着数字化技术的进步，全切片数字化图像(whole slides image，WSI)大大提升了现有病理切片技术的质量。由于病理切片图像的分辨率较高，在使用病理切片图像进行机器学习时需要将其分割成为不同的Patch(分块图像)，并通过机器学习算法对成千上万的分块图像进行病理类别分类。

在生成分块级的病理图像分类模型的训练数据时，如果人为精细化地标注每一个分块图像的病理类别标签会带来极大的工作量，因此，现有技术中通常将标注为正样本的病理切片图像中的所有分块图像均标注为正样本，以及将标注为负样本的病理切片图像中的所有分块图像均标注为负样本。然而，病理切片图像通常包含大量冗余信息，即一张病理切片图像中只有少量分块图像会存在异常病理表现，其余大部分的分块图像均是正常组织，这一做法会引入大量的标签噪声从而降低了整体模型的图像分类性能。

发明内容

本申请提供了一种图像分类模型训练、图像分类方法、装置及电子设备，可以在病理图像分类模型的训练过程中，将样本病理分块图像的原始的粗粒度标注信息慢慢过度到精细化标注信息，有效减小标注信息的噪声，提升模型训练效果，从而提升病理图像分类模型的图像分类性能，本申请技术方案如下：

一方面，提供了一种图像分类模型训练方法，所述方法包括：

获取包含有标注类别指示信息的样本病理分块图像和至少一个预设病理类别标签各自对应的参考类别特征信息，所述标注类别指示信息表征所述样本病理分块图像分别属于所述至少一个预设病理类别标签的标注概率；

将所述样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到所述样本病理分块图像对应的中间层特征信息和所述样本病理分块图像对应的预测类别指示信息；

基于所述标注类别指示信息和所述预测类别指示信息，训练所述待训练病理图像分类模型，得到训练后的病理图像分类模型；

基于第一病理类别标签，对所述标注类别指示信息进行校准处理，得到校准后的标注类别指示信息，所述第一病理类别标签为与所述中间层特征信息匹配的参考类别特征信息对应的预设病理类别标签；

基于所述校准后的标注类别指示信息和所述训练后的病理图像分类模型，跳转至所述将所述样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件；

将当前的病理图像分类模型，作为目标病理图像分类模型。

另一方面，提供了一种图像分类方法，所述方法包括：

获取待分类病理分块图像；

将所述待分类病理分块图像输入目标病理图像分类模型进行病理类别分类，得到所述待分类病理分块图像对应的目标类别指示信息，所述目标类别指示信息表征所述待分类病理分块图像分别属于至少一个预设病理类别标签的预测概率；

其中，所述目标病理图像分类模型是基于如上述的图像分类模型训练方法训练后得到的。

另一方面，提供了一种病理图像分类模型训练装置，所述装置包括：

样本病理分块图像获取模块，用于获取包含有标注类别指示信息的样本病理分块图像和至少一个预设病理类别标签各自对应的参考类别特征信息，所述标注类别指示信息表征所述样本病理分块图像分别属于所述至少一个预设病理类别标签的标注概率；

病理类别预测模块，用于将所述样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到所述样本病理分块图像对应的中间层特征信息和所述样本病理分块图像对应的预测类别指示信息；

模型训练模块，用于基于所述标注类别指示信息和所述预测类别指示信息，训练所述待训练病理图像分类模型，得到训练后的病理图像分类模型；

校准处理模块，用于基于第一病理类别标签，对所述标注类别指示信息进行校准处理，得到校准后的标注类别指示信息，所述第一病理类别标签为与所述中间层特征信息匹配的参考类别特征信息对应的预设病理类别标签；

第一迭代训练模块，用于基于所述校准后的标注类别指示信息和所述训练后的病理图像分类模型，跳转至所述将所述样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件；

目标病理图像分类模型模块，用于将当前的病理图像分类模型，作为目标病理图像分类模型。

另一方面，提供了一种图像分类装置，所述装置包括：

待分类病理分块图像获取模块，用于获取待分类病理分块图像；

病理类别分类模块，用于将所述待分类病理分块图像输入目标病理图像分类模型进行病理类别分类，得到所述待分类病理分块图像对应的目标类别指示信息，所述目标类别指示信息表征所述待分类病理分块图像分别属于至少一个预设病理类别标签的预测概率；

其中，所述目标病理图像分类模型是基于如上述的病理图像分类模型训练装置训练后得到的。

另一方面，提供了一种电子设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的图像分类模型训练方法或图像分类方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的图像分类模型训练方法或图像分类方法。

另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如上述的图像分类模型训练方法或图像分类方法。

本申请提供的一种图像分类模型训练、图像分类方法、装置及电子设备，具有如下技术效果：

本申请在训练分块级病理图像分类模型的应用场景中，对样本病理分块图像进行预标注得到粗粒度的标注类别指示信息，该标注类别指示信息可以表征样本病理分块图像分别属于至少一个预设病理类别标签的标注概率，相比现有技术中的分块级标注方案，可以有效减小原始标注信息的噪声，此外，在模型迭代训练的过程中，通过确定与样本病理分块图像的中间层特征信息匹配的第一病理类别标签，并基于第一病理类别标签对标注类别指示信息进行校准处理，将原始的粗粒度标注信息慢慢过度到精细化标注信息，可以进一步提升标注信息的精准性，提升模型训练效果，从而提升病理图像分类模型的图像分类性能。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本申请实施例提供的一种应用环境的示意图；

图2是本申请实施例提供的一种图像分类模型训练方法的流程示意图；

图3是本申请实施例提供的一种样本病理分块图像的示意图；

图4是本申请实施例提供的一种标注类别指示信息的获取方法的流程示意图；

图5是本申请实施例提供的一种第一病理类别标签确定方法的流程示意图；

图6是本申请实施例提供的一种标注类别指示信息校准处理的流程示意图；

图7是本申请实施例提供的另一种图像分类模型训练方法的流程示意图；

图8是本申请实施例提供的一种图像分类方法的流程示意图；

图9是本申请实施例提供的一种病理图像分类模型训练装置的组成框图；

图10是本申请实施例提供的一种图像分类装置的组成框图；

图11是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

可以理解的是，在本申请的具体实施方式中，涉及到用户信息等相关的数据，当本申请以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

为便于对本申请实施例的理解，下面先对几个概念进行简单介绍：

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

深度学习是一种通过人工神经网络为架构，对数据进行表征学习的方法。与传统的基于先验知识，基于构建规则的方法不同，它是一种数据驱动下的算法，通过对海量数据的学习，自动挖掘深层鲁邦特征，从而形成从输入到输出的自动计算过程，不需要人工参与。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

请参阅图1，图1是本申请实施例提供的一种应用环境的示意图，该应用环境中可以包括客户端10和服务器端20，客户端10和服务器端20可以通过无线通信方式进行间接地连接。客户端10向服务器端20发送病理图像分类模型训练指令，服务器端20响应于病理图像分类模型训练指令，获取包含有标注类别指示信息的样本病理分块图像和至少一个预设病理类别标签各自对应的参考类别特征信息，该标注类别指示信息可以表征样本病理分块图像分别属于至少一个预设病理类别标签的标注概率，然后将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到样本病理分块图像对应的中间层特征信息和样本病理分块图像对应的预测类别指示信息，接着基于标注类别指示信息和预测类别指示信息，训练待训练病理图像分类模型，得到训练后的病理图像分类模型，再基于与中间层特征信息匹配的参考类别特征信息对应的预设病理类别标签，对标注类别指示信息进行校准处理，得到校准后的标注类别指示信息，基于校准后的标注类别指示信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件，并将当前的病理图像分类模型作为目标病理图像分类模型下发至客户端10。需要说明的是，图1仅仅是一种示例。

客户端可以是智能手机、电脑(如台式电脑、平板电脑、笔记本电脑)、数字助理、智能语音交互设备(如智能音箱)、智能可穿戴设备、车载终端等类型的实体设备，也可以是运行于实体设备中的软体，比如计算机程序。第一客户端所对应的操作系统可以是安卓系统(Android系统)、iOS系统(是由苹果公司开发的移动操作系统)、Linux系统(一种操作系统)、Microsoft Windows系统(微软视窗操作系统)等。

服务器端可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。其中服务器可以包括有网络通信单元、处理器和存储器等等。服务器端可以为对应的客户端提供后台服务。

上述客户端10和服务器端20可以用于构建一个有关病理图像分类模型训练的系统，该系统可以是分布式系统。以分布式系统为区块链系统为例，由多个节点(接入网络中的任意形式的计算设备，如服务器、用户终端)和客户端形成，节点之间形成组成的点对点(P2P，Peer To Peer)网络，P2P协议是一个运行在传输控制协议(TCP，TransmissionControl Protocol)协议之上的应用层协议。在分布式系统中，任何机器如服务器、终端都可以加入而成为节点，节点包括硬件层、中间层、操作系统层和应用层。

上述区块链系统中各节点的功能，涉及的功能包括：

1)路由，节点具有的基本功能，用于支持节点之间的通信。

节点除具有路由功能外，还可以具有以下功能：

2)应用，用于部署在区块链中，根据实际业务需求而实现特定业务，记录实现功能相关的数据形成记录数据，在记录数据中携带数字签名以表示任务数据的来源，将记录数据发送到区块链系统中的其他节点，供其他节点在验证记录数据来源以及完整性成功时，将记录数据添加到临时区块中。

3)区块链，包括一系列按照产生的先后时间顺序相互接续的区块(Block)，新区块一旦加入到区块链中就不会再被移除，区块中记录了区块链系统中节点提交的记录数据。

需要说明的是，本申请提供的图像分类模型训练方法既可以应用在客户端，也可以应用在服务器端，并不以上述应用环境的实施例为限。

以下介绍本申请提供的一种图像分类模型训练方法的具体实施例，图2是本申请实施例提供的一种图像分类模型训练方法的流程示意图，本申请提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的，如图2所示，所述方法可以包括：

S201，获取包含有标注类别指示信息的样本病理分块图像和至少一个预设病理类别标签各自对应的参考类别特征信息，标注类别指示信息表征样本病理分块图像分别属于至少一个预设病理类别标签的标注概率。

在本说明书实施例中，标注类别指示信息可以表征样本病理分块图像分别属于至少一个预设病理类别标签的标注概率。具体的，标注类别指示信息的表现形式可以为标注类别指示向量，标注类别指示向量的每一维元素分别表示对应预设病理类别标签的标注概率。

具体的，预设病理类别标签可以为目标场景图像中的病理表现对应的病灶类别标签，例如，在目标场景图像为眼底分块图像的情况下，预设病理类别标签可以包括但不限于：硬性渗出、微动脉瘤、出血和软性渗出等病灶类别标签。

在本说明书实施例中，样本病理分块图像可以为对样本病理切片图像进行分割处理后得到的子图像。如图3所示，一个样本病理切片图像可以包含有大量的样本病理分块图像，而训练集中的多个样本病理分块图像通常来自多张不同的样本病理切片图像，因此，训练集中的任一样本病理分块图像可以表示为：其中x表示样本病理分块图像，g表示样本病理分块图像对应的样本病理切片图像的标识信息，表示样本病理分块图像对应的样本病理切片图像的目标病理类别标签，例如，训练集可以分别来自L张样本病理切片图像。

在本说明书实施例中，任一预设病理类别标签对应的参考类别特征信息可以表征属于对应预设病理类别标签的分块级的病理图像的图像特征。

在一些实施例中，可以对来自某一预设病理类别标签的多个样本病理分块图像进行图像特征提取，得到多个分块图像特征向量，然后对该多个分块图像特征向量进行均值处理，得到均值特征向量，将该均值特征向量作为参考类别特征信息。

在一个具体的实施例中，如图4所示，上述标注类别指示信息的获取方法可以包括：

S401，确定样本病理分块图像归属的样本病理切片图像；

S402，获取样本病理切片图像对应的目标病理类别标签；

S403，基于目标病理类别标签，对样本病理分块图像进行标注处理，得到标注类别指示信息。

具体的，目标病理类别标签可以为对样本病理切片图像进行切片级的病理类别分类后得到的病理类别标签。

在实际应用中，样本病理切片图像通常包含大量冗余信息，即在某一样本病理切片图像的病理类别标签指示该样本病理切片图像存在病变的情况下，该样本病理切片图像中的大部分样本病理分块图像可能并不存在病变，只有少量样本病理分块图像中含有某种病变，因而，样本病理切片图像对应的目标病理类别标签会存在大量标签噪声。

在一些实施例中，上述基于目标病理类别标签，对样本病理分块图像进行标注处理，得到标注类别指示信息可以包括：

1)建立样本病理分块图像对应的初始类别指示信息。

具体的，初始类别指示信息可以基于预设病理类别标签的数量进行设置。例如，在预设病理类别标签的分类数量为N类的情况下，初始类别指示信息可以为一个初始N维向量，其中，初始N维向量中的第j个元素表示该样本病理分块图像属于第j个预设病理类别标签的初始概率，可选的，初始N维向量中每个元素的大小可以为1/N。

2)基于目标病理类别标签和第一概率调节参数，对初始类别指示信息进行概率调节，得到标注类别指示信息。

具体的，第一概率调节参数可以用于调节初始类别指示信息中每个预设病理类别标签的初始概率。这里的第一概率调节参数可以结合实际应用中的概率调节精度需求进行预先设置。可选的，这里的第一概率调节参数p的取值可以为0～1/N。

以预设病理类别标签的分类数量为2类(类别1和类别2)为例，初始类别指示信息可以为初始2维向量在目标病理类别标签为类别2的情况下，基于第一概率调节参数p，对初始类别指示信息进行概率调节，得到标注类别指示信息为/>将对应整体切片的标注位置的概率增大，即若该切片包含病变，则将病变的概率增大。

由以上实施例可见，建立样本病理分块图像对应的初始类别指示信息，基于对应样本病理切片图像的目标病理类别标签和第一概率调节参数，对初始类别指示信息进行概率调节，得到标注类别指示信息，可以有效减少标注信息中的噪声。

S202，将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到样本病理分块图像对应的中间层特征信息和样本病理分块图像对应的预测类别指示信息。

在本说明书实施例中，中间层特征信息可以为待训练病理图像分类模型的中间层提取的图像特征信息，具体的，中间层特征信息的表现形式可以为中间层特征向量。

在本说明书实施例中，预测类别指示信息可以表征样本病理分块图像分别属于至少一个预设病理类别标签的预测概率。具体的，预测类别指示信息的表现形式可以为预测类别指示向量，预测类别指示向量的每一维元素分别表示对应预设病理类别标签的预测概率。

在一个具体的实施例中，待训练病理图像分类模型可以包括：病理图像特征提取层和病理类别预测层，中间层特征信息可以为病理图像特征提取层输出的病理图像特征信息，预测类别指示信息可以为病理类别预测层输出的病理类别预测结果，相应的，上述将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到样本病理分块图像对应的中间层特征信息和样本病理分块图像对应的预测类别指示信息可以包括：

1)将样本病理分块图像输入病理图像特征提取层进行病理图像特征提取，得到中间层特征信息；

2)将中间层特征信息输入病理类别预测层进行病理类别预测，得到预测类别指示信息。

具体的，这里的待训练病理图像分类模型可以包括但不限于：卷积神经网络模型、深度卷积神经网络模型等，本申请对此不作任何限制。

S203，基于标注类别指示信息和预测类别指示信息，训练待训练病理图像分类模型，得到训练后的病理图像分类模型。

在一个具体的实施例中，上述基于标注类别指示信息和预测类别指示信息，训练待训练病理图像分类模型，得到训练后的病理图像分类模型可以包括：

S2031，基于标注类别指示信息和预测类别指示信息，确定类别损失信息；

S2032，基于类别损失信息，训练待训练病理图像分类模型，得到训练后的病理图像分类模型。

在一个具体的实施例中，上述基于标注类别指示信息和预测类别指示信息，确定类别损失信息可以包括基于预设损失函数，确定标注类别指示信息和预测类别指示信息间的类别损失信息。

在一个具体的实施例中，类别损失信息可以表征标注类别指示信息和预测类别指示信息间的差异。在一个具体的实施例中，预设损失函数可以包括但不限于交叉熵损失函数、逻辑损失函数、指数损失函数等。

在一个可选的实施例中，基于类别损失信息，训练待训练病理图像分类模型，得到训练后的病理图像分类模型可以包括：

S2033，基于类别损失信息，更新待训练病理图像分类模型的模型参数；

S2034，基于更新后的待训练病理图像分类模型，重复执行包括步骤S202、S2031、S2032和S2033的病理图像分类模型训练迭代操作，直至达到病理图像分类模型训练收敛条件；

S2035，将达到病理图像分类模型训练收敛条件的情况下得到的待训练病理图像分类模型，作为训练后的病理图像分类模型。

在一个可选的实施例中，上述达到病理图像分类模型训练收敛条件可以为训练迭代操作的次数达到预设训练次数。可选的，达到病理图像分类模型训练收敛条件也可以为当前类别损失信息小于指定阈值。本说明书实施例中，预设训练次数和指定阈值可以结合实际应用中对网络的训练速度和精准度预先设置。

在一个示例中，对于任意样本病理分块图像，待训练病理图像分类模型的计算分为两个主要步骤：(1)病理图像特征提取，具体的，可以表示为：q_i＝f(x_i；θ)，其中，x_i表示样本病理分块图像，θ表示病理图像特征提取层的模型参数，f()表示病理图像特征提取层的运算函数，q_i表示中间层特征信息；(2)病理类别预测，具体的，可以表示为：pred＝g(q_i；w)，其中，w表示病理类别预测层的模型参数，g()表示病理类别预测层的运算函数，pred表示预测类别指示信息。相应的，在完成前向计算过后，利用样本病理分块图像的标注类别指示信息，计算类别损失信息：其中，N表示预设病理类别标签的分类数量，pred_j表示预测类别指示信息中第j个预设病理类别标签对应的预测概率，/>表示标注类别指示信息sⁱ中第j个预设病理类别标签对应的标注概率，l(x_i；w,θ)表示类别损失信息；并基于类别损失信息更新模型参数：其中，θ′表示更新后的病理图像特征提取层的模型参数，w′表示更新后的病理类别预测层的模型参数，α为预设学习率。可选的，预设学习率可以结合实际应用中对网络的训练速度和精准度预先设置。

S204，基于第一病理类别标签，对标注类别指示信息进行校准处理，得到校准后的标注类别指示信息，第一病理类别标签为与中间层特征信息匹配的参考类别特征信息对应的预设病理类别标签。

在一个具体的实施例中，如图5所示，在上述基于第一病理类别标签，对标注类别指示信息进行校准处理，得到校准后的标注类别指示信息之前，上述方法还可以包括：

S501，将至少一个预设病理类别标签中每一预设病理类别标签对应的参考类别特征信息分别与中间层特征信息进行特征匹配处理，得到特征匹配信息。

在一个具体的实施例中，特征匹配信息可以表征每一预设病理类别标签对应的参考类别特征信息和中间层特征信息间的匹配程度。可选的，可以通过确定参考类别特征信息和中间层特征信息间的距离，将该距离作为特征匹配信息。

在一个具体的实施例中，参考类别特征信息和中间层特征信息间的距离可以包括但不限于余弦距离、欧式距离和曼哈顿距离等。

S502，根据特征匹配信息，从至少一个预设病理类别标签对应的参考类别特征信息中确定出与中间层特征信息匹配的参考类别特征信息。

在一个可选的实施例中，匹配的参考类别特征信息可以为一个信息，相应的，可以将与中间层特征信息间的特征匹配信息对应数值最大的参考类别特征信息作为与中间层特征信息匹配的参考类别特征信息。

S503，将匹配的参考类别特征信息对应的预设病理类别标签，作为第一病理类别标签。

在一个具体的实施例中，上述标注类别指示信息可以包括至少一个预设病理类别标签各自对应的标注概率信息，如图6所示，上述基于第一病理类别标签，对标注类别指示信息进行校准处理，得到校准后的标注类别指示信息可以包括：

S601，增大第一病理类别标签对应的标注概率信息，得到第一校准概率信息；

S602，减小第三病理类别标签对应的标注概率信息，得到第二校准概率信息，第三病理类别标签为至少一个预设病理类别标签中除第一病理类别标签之外其他的预设病理类别标签；

S603，基于第一校准概率信息和第二校准概率信息，生成校准后的标注类别指示信息。

具体的，第二概率调节参数可以用于校准标注类别指示信息中每个预设病理类别标签的标注概率。这里的第二概率调节参数可以结合实际应用中的概率校准精度需求进行预先设置。可选的，这里的第二概率调节参数φ的取值可以为0～0.5。

以第一病理类别标签为N个预设病理类别标签中的第j个预设病理类别标签为例，增大标注类别指示信息中第j个位置的标注概率信息s_j，得到第一校准概率信息s′_j＝φs_j+(1-φ)；并减小标注类别指示信息中其他位置的标注概率信息s_l，得到第二校准概率信息再对第一校准概率信息和第二校准概率信息进行组合后得到校准后的标注类别指示信息。

由以上实施例可见，首先利用待训练病理图像分类模型提取的中间层特征信息与至少一个预设病理类别标签对应的参考类别特征信息进行匹配，得到与中间层特征信息最接近的参考类别特征信息，从而可以得到与中间层特征信息最匹配的第一病理类别标签，并基于第一病理类别标签，对标注类别指示信息进行校准处理，可以提升标注类别指示信息的准确性。

S205，基于校准后的标注类别指示信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件。

在一个可选的实施例中，上述达到预设病理类别分类训练结束条件可以为训练迭代操作的次数达到预设训练次数。可选的，达到预设病理类别分类训练结束条件也可以为当前模型的损失信息小于指定阈值。本说明书实施例中，预设训练次数和指定阈值可以结合实际应用中对网络的训练速度和精准度预先设置。

S206，将当前的病理图像分类模型，作为目标病理图像分类模型。

由以上实施例可见，在模型迭代训练的过程中，通过确定与样本病理分块图像当前的中间层特征信息匹配的第一病理类别标签，并基于第一病理类别标签对标注类别指示信息进行校准处理，将原始的粗粒度标注信息慢慢过度到精细化标注信息，可以进一步提升标注信息的精准性，提升模型训练效果，从而提升病理图像分类模型的图像分类性能。

在一个可选的实施例中，如图7所示，在上述基于第一病理类别标签，对标注类别指示信息进行校准处理，得到校准后的标注类别指示信息之后，上述方法还可以包括：

S207，从至少一个预设病理类别标签中，确定校准后的标注类别指示信息对应的第二病理类别标签。

具体的，第二病理类别标签可以为校准后的标注类别指示信息中标注概率的最大值对应的预设病理类别标签。

S208，基于中间层特征信息，对第二病理类别标签对应的参考类别特征信息进行更新处理，得到更新后的参考类别特征信息。

在一些实施例中，上述第二病理类别标签对应的参考类别特征信息的更新处理过程可以通过如下公式表示：μ′_c＝Norm(γμ_c+(1-γ)q_i)，其中，Norm()表示正则化操作，γ为预设的特征更新参数，μ_c表示第二病理类别标签对应的参考类别特征信息，q_i表示中间层特征信息，μ′_c表示第二病理类别标签对应的更新后的参考类别特征信息。可选的，γ可以结合实际应用中的特征更新精度需求进行预先设置。

相应的，上述基于校准后的标注类别指示信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类可以包括：

S2051，基于校准后的标注类别指示信息、更新后的参考类别特征信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件。

由以上实施例可见，在模型迭代的过程中不断更新参考类别特征信息，从而可以提升参考类别特征信息对类别信息表征的精准性，使得其越来越准确地刻画类别信息，进而可以提升标注类别指示信息校准的精准性，提升模型训练效果。

由以上本申请实施例提供的技术方案可见，在训练分块级病理图像分类模型的应用场景中，对样本病理分块图像进行预标注得到粗粒度的标注类别指示信息，该标注类别指示信息可以表征样本病理分块图像分别属于至少一个预设病理类别标签的标注概率，相比现有技术中的分块级标注方案，可以有效减小原始标注信息的噪声，此外，在模型迭代训练的过程中，通过确定与样本病理分块图像的中间层特征信息匹配的第一病理类别标签，并基于第一病理类别标签对标注类别指示信息进行校准处理，将原始的粗粒度标注信息慢慢过度到精细化标注信息，可以进一步提升标注信息的精准性，提升模型训练效果，从而提升病理图像分类模型的图像分类性能。

本申请实施例还提供了一种图像分类方法，如图8所示，该图像分类方法可以包括：

S801，获取待分类病理分块图像；

S802，将待分类病理分块图像输入目标病理图像分类模型进行病理类别分类，得到待分类病理分块图像对应的目标类别指示信息，目标类别指示信息表征待分类病理分块图像分别属于至少一个预设病理类别标签的预测概率；

其中，上述目标病理图像分类模型是基于如上述的病理图像分类模型训练方法训练后得到的。

在本说明书实施例中，上述待分类病理分块图像可以为对待分类病理切片图像进行分割处理后得到的子图像。

由以上实施例可见，基于如上述的病理图像分类模型训练方法训练后得到的目标病理图像分类模型进行病理类别分类，可以提升目标类别指示信息的准确性，进而提升病理类别分类的精准性。

本申请实施例还提供了一种病理图像分类模型训练装置，如图9所示，该病理图像分类模型训练装置可以包括：

样本病理分块图像获取模块910，用于获取包含有标注类别指示信息的样本病理分块图像和至少一个预设病理类别标签各自对应的参考类别特征信息，标注类别指示信息表征样本病理分块图像分别属于至少一个预设病理类别标签的标注概率；

病理类别预测模块920，用于将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，得到样本病理分块图像对应的中间层特征信息和样本病理分块图像对应的预测类别指示信息；

模型训练模块930，用于基于标注类别指示信息和预测类别指示信息，训练待训练病理图像分类模型，得到训练后的病理图像分类模型；

校准处理模块940，用于基于第一病理类别标签，对标注类别指示信息进行校准处理，得到校准后的标注类别指示信息，第一病理类别标签为与中间层特征信息匹配的参考类别特征信息对应的预设病理类别标签；

第一迭代训练模块950，用于基于校准后的标注类别指示信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件；

目标病理图像分类模型模块960，用于将当前的病理图像分类模型，作为目标病理图像分类模型。

在一个具体的实施例中，上述样本病理分块图像获取模块910可以包括：

样本病理切片图像确定单元，用于确定样本病理分块图像归属的样本病理切片图像；

目标病理类别标签获取单元，用于获取样本病理切片图像对应的目标病理类别标签；

标注处理单元，用于基于目标病理类别标签，对样本病理分块图像进行标注处理，得到标注类别指示信息。

在一个具体的实施例中，上述标注类别指示信息可以包括所述至少一个预设病理类别标签各自对应的标注概率信息，上述校准处理模块940可以包括：

第一校准单元，用于增大第一病理类别标签对应的标注概率信息，得到第一校准概率信息；

第二校准单元，用于减小第三病理类别标签对应的标注概率信息，得到第二校准概率信息，第三病理类别标签为至少一个预设病理类别标签中除第一病理类别标签之外其他的预设病理类别标签；

第三校准单元，用于基于第一校准概率信息和第二校准概率信息，生成校准后的标注类别指示信息。

在一个具体的实施例中，上述装置还可以包括：

特征匹配模块，用于将至少一个预设病理类别标签中每一预设病理类别标签对应的参考类别特征信息分别与中间层特征信息进行特征匹配处理，得到特征匹配信息；

匹配参考类别特征信息确定模块，用于根据特征匹配信息，从至少一个预设病理类别标签对应的参考类别特征信息中确定出与中间层特征信息匹配的参考类别特征信息；

第一病理类别标签模块，用于将匹配的参考类别特征信息对应的预设病理类别标签，作为第一病理类别标签。

在一个可选的实施例中，上述装置还可以包括：

第二病理类别标签模块，用于从至少一个预设病理类别标签中，确定校准后的标注类别指示信息对应的第二病理类别标签；

参考类别特征信息更新模块，用于基于中间层特征信息，对第二病理类别标签对应的参考类别特征信息进行更新处理，得到更新后的参考类别特征信息。

相应的，上述第一迭代训练模块950可以包括：

第二迭代训练模块，用于基于校准后的标注类别指示信息、更新后的参考类别特征信息和训练后的病理图像分类模型，跳转至将样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到预设病理类别分类训练结束条件。

需要说明的是，所述装置实施例中的装置与方法实施例基于同样的发明构思。

本申请实施例还提供了一种图像分类装置，如图10所示，该图像分类装置可以包括：

待分类病理分块图像获取模块1010，用于获取待分类病理分块图像；

病理类别分类模块1020，用于将待分类病理分块图像输入目标病理图像分类模型进行病理类别分类，得到待分类病理分块图像对应的目标类别指示信息，目标类别指示信息表征待分类病理分块图像分别属于至少一个预设病理类别标签的预测概率；

其中，上述目标病理图像分类模型是基于如上述的病理图像分类模型训练装置训练后得到的。

本申请实施例提供了一种电子设备，该设备包括处理器和存储器，该存储器中存储有至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的图像分类模型训练方法或图像分类方法。

进一步地，图11示出了一种用于实现本申请实施例所提供的图像分类模型训练方法或图像分类方法的电子设备的硬件结构示意图，所述电子设备可以参与构成或包含本申请实施例所提供的病理图像分类模型训练装置或图像分类装置。如图11所示，病理图像分类模型训练设备110可以包括一个或多个(图中采用1102a、1102b，……，1102n来示出)处理器1102(处理器1102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1104、以及用于通信功能的传输装置1106。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图11所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，电子设备110还可包括比图11中所示更多或者更少的组件，或者具有与图11所示不同的配置。

应当注意到的是上述一个或多个处理器1102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到电子设备110(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器1104可用于存储应用软件的软件程序以及模块，如本申请实施例中所述的图像分类模型训练方法对应的程序指令/数据存储装置或所述的图像分类方法对应的程序指令/数据存储装置，处理器1102通过运行存储在存储器1104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的一种图像分类模型训练方法或图像分类方法。存储器1104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器1104可进一步包括相对于处理器1102远程设置的存储器，这些远程存储器可以通过网络连接至电子设备110。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备110的通信供应商提供的无线网络。在一个实例中，传输装置1106包括一个网络适配器(NetworkInterfaceController，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实施例中，传输装置1106可以为射频(RadioFrequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与电子设备110(或移动设备)的用户界面进行交互。

本申请的实施例还提供了一种计算机可读存储介质，所述存储介质可设置于电子设备之中以保存用于实现至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的图像分类模型训练方法或图像分类方法。

可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本申请的实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如方法实施例提供的图像分类模型训练方法或图像分类方法。

需要说明的是：上述本申请实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置和设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种图像分类模型训练方法，其特征在于，所述方法包括：

将当前的病理图像分类模型，作为目标病理图像分类模型。

2.根据权利要求1所述的方法，其特征在于，在所述基于第一病理类别标签，对所述标注类别指示信息进行校准处理，得到校准后的标注类别指示信息之后，所述方法还包括：

从所述至少一个预设病理类别标签中，确定所述校准后的标注类别指示信息对应的第二病理类别标签；

基于所述中间层特征信息，对所述第二病理类别标签对应的参考类别特征信息进行更新处理，得到更新后的参考类别特征信息。

3.根据权利要求2所述的方法，其特征在于，所述基于所述校准后的标注类别指示信息和所述训练后的病理图像分类模型，跳转至所述将所述样本病理分块图像输入待训练病理图像分类模型进行病理类别分类包括：

基于所述校准后的标注类别指示信息、所述更新后的参考类别特征信息和所述训练后的病理图像分类模型，跳转至所述将所述样本病理分块图像输入待训练病理图像分类模型进行病理类别分类，直至达到所述预设病理类别分类训练结束条件。

4.根据权利要求1所述的方法，其特征在于，所述标注类别指示信息包括所述至少一个预设病理类别标签各自对应的标注概率信息，所述基于第一病理类别标签，对所述标注类别指示信息进行校准处理，得到校准后的标注类别指示信息包括：

增大所述第一病理类别标签对应的标注概率信息，得到第一校准概率信息；

减小第三病理类别标签对应的标注概率信息，得到第二校准概率信息，所述第三病理类别标签为所述至少一个预设病理类别标签中除所述第一病理类别标签之外其他的预设病理类别标签；

基于所述第一校准概率信息和所述第二校准概率信息，生成所述校准后的标注类别指示信息。

5.根据权利要求1所述的方法，其特征在于，在所述基于第一病理类别标签，对所述标注类别指示信息进行校准处理，得到校准后的标注类别指示信息之前，所述方法还包括：

将所述至少一个预设病理类别标签中每一预设病理类别标签对应的参考类别特征信息分别与所述中间层特征信息进行特征匹配处理，得到特征匹配信息；

根据所述特征匹配信息，从所述至少一个预设病理类别标签对应的参考类别特征信息中确定出与所述中间层特征信息匹配的参考类别特征信息；

将所述匹配的参考类别特征信息对应的预设病理类别标签，作为所述第一病理类别标签。

6.根据权利要求1所述的方法，其特征在于，所述标注类别指示信息的获取方法包括：

确定所述样本病理分块图像归属的样本病理切片图像；

获取所述样本病理切片图像对应的目标病理类别标签；

基于所述目标病理类别标签，对所述样本病理分块图像进行标注处理，得到所述标注类别指示信息。

7.一种图像分类方法，其特征在于，所述方法包括：

获取待分类病理分块图像；

其中，所述目标病理图像分类模型是基于权利要求1至6任一所述的图像分类模型训练方法训练后得到的。

8.一种病理图像分类模型训练装置，其特征在于，所述装置包括：

9.一种图像分类装置，其特征在于，所述装置包括：

其中，所述目标病理图像分类模型是基于权利要求8所述的病理图像分类模型训练装置训练后得到的。

10.一种电子设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1至6任一所述的图像分类模型训练方法或如权利要求7所述的图像分类方法。

11.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至6任一所述的图像分类模型训练方法或如权利要求7所述的图像分类方法。

12.一种计算机程序产品，其特征在于，所述计算机程序产品包括至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1至6任一所述的图像分类模型训练方法或如权利要求7所述的图像分类方法。