WO2023000872A1

WO2023000872A1 - 图像特征的监督学习方法、装置、设备及存储介质

Info

Publication number: WO2023000872A1
Application number: PCT/CN2022/098805
Authority: WO
Inventors: 文庆福; 杜悦熙; 杨森; 杨鹏; 张军; 韩骁
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2021-07-22
Filing date: 2022-06-15
Publication date: 2023-01-26
Also published as: US20230237771A1; EP4375857A1; CN113822325A

Abstract

一种图像特征的监督学习方法、装置、设备及存储介质，涉及人工智能领域。方法包括：对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，第一增强图像和第二增强图像互为正样本(401)；通过特征提取模型对第一增强图像和第二增强图像进行特征提取，得到第一增强图像的第一图像特征以及第二增强图像的第二图像特征(402)；基于第一图像特征、第二图像特征以及负样本图像特征，确定特征提取模型的模型损失，负样本图像特征为其他原始医学图像对应的图像特征(403)；基于模型损失，训练特征提取模型(404)。采用自监督学习方式使特征提取模型学习到医学图像的图像特征，无需人工进行图像标注，提高了模型训练效率。

Description

图像特征的监督学习方法、装置、设备及存储介质

本申请要求于2021年07月22日提交的申请号为202110831737.8、发明名称为“图像特征的监督学习方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及人工智能领域，特别涉及一种图像特征的监督学习方法、装置、设备及存储介质。

背景技术

计算机视觉(Computer Vision，CV)技术作为人工智能领域的一个重要分支，被广泛应用于医学图像识别(识别医学图像中组织器官的类别)、医学图像检索(从数据库中检索详细医学图像)、医学图像分割(对医学图像中的组织结构进行分割)等医学图像处理场景。

图像特征提取作为图像处理过程中的重要环节，直接影响到最终的图像处理结果。相关技术中，通过训练特征提取模型对医学图像进行特征提取，进而基于提取到的图像特征执行后续图像处理流程。在一种模型训练方式中，当采用监督学习方式进行模型训练时，通常利用样本医学图像的标注信息作为监督进行模型训练。

然而，由于模型训练过程中需要使用到大量样本，而对样本医学图像进行人工标注需要花费大量时间，导致模型训练效率较低。

发明内容

本申请实施例提供了一种图像特征的监督学习方法、装置、设备及存储介质，在无需人工标注的情况下能够实现图像特征的自监督学习，从而提高模型训练效率。所述技术方案如下：

一方面，本申请实施例提供了一种图像特征的监督学习方法，所述方法由计算机设备执行，所述方法包括：

对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，所述第一增强图像和所述第二增强图像互为正样本；

通过特征提取模型对所述第一增强图像和所述第二增强图像进行特征提取，得到所述第一增强图像的第一图像特征，以及所述第二增强图像的第二图像特征；

基于所述第一图像特征、所述第二图像特征以及负样本图像特征，确定所述特征提取模型的模型损失，所述负样本图像特征为其他原始医学图像对应的图像特征；

基于所述模型损失，训练所述特征提取模型。

另一方面，本申请实施例提供了一种图像特征的监督学习装置，所述装置包括：

数据增强模块，用于对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，所述第一增强图像和所述第二增强图像互为正样本；

特征提取模块，用于通过特征提取模型对所述第一增强图像和所述第二增强图像进行特征提取，得到所述第一增强图像的第一图像特征，以及所述第二增强图像的第二图像特征；

损失确定模块，用于基于所述第一图像特征、所述第二图像特征以及负样本图像特征，确定所述特征提取模型的模型损失，所述负样本图像特征为其他原始医学图像对应的图像特征；

第一训练模块，用于基于所述模型损失，训练所述特征提取模型。

另一方面，本申请实施例提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上述方面所述的图像特征的监督学习方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，所述可读存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如上述方面所述的图像特征的监督学习方法。

另一方面，本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面提供的图像特征的监督学习方法。

本申请实施例中，通过对原始医学图像进行数据增强，得到互为正样本的第一增强图像和第二增强图像，并通过特征提取模型进行特征提取，得到第一图像特征和第二图像特征，进而将不同于该原始医学图像的其他原始医学图像作为负样本，并基于第一图像特征、第二图像特征以及负样本图像特征确定特征提取模型的模型损失，最终利用模型损失训练特征提取模型；整个过程中，采用自监督学习方式使特征提取模型学习到医学图像的图像特征，无需人工进行医学图像标注，降低了模型训练过程中的人工标注成本，提高了特征提取模型的训练效率。

附图说明

图1是本申请一个示例性实施例示出的图像特征的监督学习方法的原理图；

图2是本申请一个示例性实施例示出的医学图像分类场景的实施示意图；

图3是本申请一个示例性实施例示出的医学图像检索场景的实施示意图；

图4是本申请一个示例性实施例提供的图像特征的监督学习方法的流程图；

图5是一个示例性实施例示出的互为正样本的医学图像；

图6是本申请另一个示例性实施例提供的图像特征的监督学习方法的流程图；

图7是本申请一个示例性实施例示出的图像特征自监督学习过程的实施示意图；

图8是本申请一个示例性实施例示出的多全局描述子网络的示意图；

图9是本申请一个示例性实施例示出的模型损失确定过程的流程图；

图10是本申请另一个示例性实施例提供的图像特征的监督学习方法的流程图；

图11是本申请一个示例性实施例示出的有效样本和无效样本的示意图；

图12是本申请一个示例性实施例示出的多图像特征加权求和过程的实施示意图；

图13是本申请一个示例性实施例提供的计算机设备的结构示意图；

图14是本申请一个示例性实施例提供的图像特征的监督学习装置的结构框图。

具体实施方式

计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(Optical Character Recognition，OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

图像特征提取作为实现具体功能的重要环节，其提取到的图像特征的质量将直接影响到功能的实现质量。比如，当进行图像识别时，提取到的高质量图像特征有助于提高后续图像识别的准确性；当进行图像检索时，提取到的高质量图像特征有助于提高检索结果的全面性，并降低检索到无关结果的概率。

相关技术中，通常采用有监督的模型训练方法训练特征提取模型，从而利用训练得到的特征提取模型进行图像特征提取，而在进行有监督的模型训练前，需要预先准备大量包含标注信息的样本图像，以便后续以标注信息为监督进行模型训练。比如，当特征提取模型与分类模型组合实现图像分类功能时，用于模型训练的样本图像需要包含类型标签；当特征提取模型与分割模型组合实现图像分割功能时，用于模型训练的样本图像需要包含对象分割信息。然而，对样本图像进行人工标注需要花费大量时间，且标注成本较高，导致特征提取模型的训练效率较低。

为了在保证特征提取质量的前提下，降低对人工标注的依赖程度，从而提高模型训练效率，本申请实施例提供了一种图像特征的监督学习方法，如图1所示，计算机设备采用数据增强技术，基于原始医学图像11得到互为正样本的第一增强图像12和第二增强图像13，并将不同于原始医学图像11的其他原始医学图像14作为负样本，从而基于第一增强图像12、第二增强图像13以及负样本的图像特征(包括第一图像特征15、第二图像特征16以及负样本图像特征17)确定模型损失18，进而利用模型损失18对特征提取模型19进行训练。整个模型训练过程中，在不借助人工标注的情况下，计算机设备只需要借助原始医学图像即可实现自监督的特征学习，有助于降低模型训练前期的样本准备成本，提高模型训练效率。

采用本申请实施例提供的方案训练得到特征提取模型，可以用于提取医学图像的图像特征，而提取到的图像特征可以用于医学图像分类、相似医学图像检索等任务。

在一种可能的应用场景下，如图2所示，将待分类医学图像21输入预训练的特征提取模型22后，即可得到待分类医学图像21的图像特征23，将图像特征23输入预训练的分类器24，分类器24即根据图像特征23进行图像分类，最终输出待分类医学图像21对应的分类标签25。

在另一种可能的应用场景下，如图3所示，离线数据处理阶段，计算机设备首先对全视野数字切片(Whole Slide Image，WSI)301进行划分，得到小尺寸的医学图像302，并利用预训练的特征提取模型303对各张医学图像302进行特征提取，得到各张医学图像302的图像特征304，并基于图像特征304构建医学图像特征数据库。在线检索阶段，用户对待检索WSI 305进行检索区域选择，得到待检索医学图像306，并利用预训练的特征提取模型303对待检索医学图像306进行特征提取，得到待检索图像特征307，从而将待检索图像特征307与医学图像特征数据库中的图像特征304进行特征匹配，进而将特征匹配度高于阈值的医学图像302确定为相似图像308。

需要说明的是，上述应用场景仅为示例性说明，采用本申请实施例提供方案训练得到的特征提取模型还可以用于其他利用到图像特征的场景，比如医学图像中的异常组织区域划分等等，本申请实施例对此并不构成限定。

此外，本申请实施例提供的图像特征的监督学习方法可以用于进行特征提取模型训练的计算机设备，该计算机设备可以是个人计算机、工作站、物理服务器或者云服务器等等，为了方便表述，下述各个实施例以方法由计算机设备执行为例进行说明。

图4示出了本申请一个示例性实施例提供的图像特征的监督学习方法的流程图。本实施例以该方法由计算机设备执行为例进行说明，该方法包括如下步骤。

步骤401，对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，第一增强图像和第二增强图像互为正样本。

采用自监督学习方式进行特征提取模型训练的目标是减小相似医学图像在特征编码空间的距离，并增加不相似图像在特征编码空间的距离，使模型具备辨别图像相似性的能力，因此在模型训练过程中如何判定输入图像之间的相似性，并基于模型正确的指引成为了自监督学习的关键。本申请实施例中，通过对原始医学图像进行不同程度或方式的数据增强，得到相似但不完全相同的第一增强图像和第二增强图像，相应的，第一增强图像和第二增强图像的图像特征具有高度相似性，但是并不完全一致。

在一种可能的实施方式中，结合医学图像的图像特点，计算机设备可以从色彩(因为医学图像是经过染色的显微组织切片样本，因此染色程度可能存在差异)和方向(因为组织切片在显微镜下可能是任何方向角度，因此医学图像对显示方向并不敏感)两方面对数据增强。其中，色彩增强用于改变图像的明暗度，以此增强图像在色彩域上的鲁棒性。方向增强用于改变图像的角度或朝向，以此降低对图像显示方向的敏感度。

在一些实施例中，计算机设备对图像进行色彩增强的方法可以描述为：I _c←a _c·I _c+b _c,where

其中，I _c表示原始医学图像中各个像素点的明度，a _c和b _c均为调节系数，

为调节系数的数值范围。

计算机设备对图像进行方向增强时，可以对原始医学图像进行随机角度旋转、随机翻转镜像等处理，本实施例对此不作限定。

在一些实施例中，计算机设备基于第一增强参数对原始医学图像进行色彩增强和方向增强，得到第一增强图像，并通过第二增强参数对原始医学图像进行色彩增强和方向增强，得到第二增强图像，第一增强参数和第二增强参数不同。

比如，第一增强参数中a _c＝0.9，b _c＝-5，旋转角度为+25°，第二增强参数中，a _c＝1.05，b _c＝+5，旋转角度为-25°。

当然，除了从上述维度对图像进行数据增强外，计算机设备还可以从其他维度对图像进行数据增强，本申请实施例并不对此构成限定。

此外，考虑到医学图像在物理尺度上具有较强的距离相关性，即物理距离相近的医学图像具有相似性，因此在其他可能的实施方式中，计算机设备确定相距距离小于距离阈值的两张医学图像互为正样本，进一步增加正样本数量。其中，该距离阈值与医学图像的分辨率相关，比如，在10倍放大倍率下，该距离阈值为100像素。

示意性的，如图5所示，计算机设备确定同一WSI中，第一区域的第一医学图像51和第二区域的第二医学图像52互为正样本。

步骤402，通过特征提取模型对第一增强图像和第二增强图像进行特征提取，得到第一增强图像的第一图像特征，以及第二增强图像的第二图像特征。

进一步的，计算机设备分别将第一增强图像和第二增强图像输入特征提取模型，由特征提取模型进行特征提取，得到第一图像特征以及第二图像特征。其中，第一图像特征和第二图像特征采用特征图(featuremap)表示，且特征提取模型可以是以残差网络(ResNet)、ResNeXt、视觉变换器(Vision Transformer，ViT)为骨干网络的模型，本申请实施例并不对特征提取模型所采用的骨干网络进行限定。

步骤403，基于第一图像特征、第二图像特征以及负样本图像特征，确定特征提取模型的模型损失，负样本图像特征为其他原始医学图像对应的图像特征。

模型训练过程中，除了需要利用到互为正样本的第一增强图像和第二增强图像外，计算机设备还需要引入与第一增强图像和第二增强图像不相似的负样本，使特征提取模型能够学习到不相似图像之间图像特征的差异性。

在一种可能的实施方式中，计算机设备将不同于当前原始医学图像的其他原始医学图像作为当前原始医学图像的负样本，进而将其他原始医学图像或该其他原始医学图像对应的增强图像作为第一增加图像以及第二增强图像的负样本。

在一些实施例中，如果将其他原始医学图像作为第一增加图像以及第二增强图像的负样本，那么负样本图像特征为从其他原始医学图像中提取的图像特征。如果将其他原始医学图像对应的增强图像作为第一增加图像以及第二增强图像的负样本，那么负样本图像特征为从其他原始医学图像对应的增强图像中提取的图像特征。另外，其他原始医学图像对应的增强图像的生成方式，同样可以采用上文介绍的色彩增强、方向增强等方式，本申请对此不作限定。

在一些实施例中，当前原始医学图像和其他原始医学图像为属于同一训练批次的不同图像，且其他原始医学图像在当前原始医学图像之前经过数据增强以及特征提取。

在一些实施例中，计算机设备基于第一图像特征与第二图像特征之间的特征差异，以及第一图像特征(或第二图像特征)与负样本图像特征之间的特征差异，确定特征提取模型的损失。其中，图像特征之间的特征差异可以采用特征距离表示，该特征距离可以为欧氏距离、曼哈顿距离、余弦距离等等，本实施例对此不作限定。

步骤404，基于模型损失，训练特征提取模型。

进一步的，计算机设备以最小化模型损失为训练目标，即缩小第一图像特征与第二图像特征之间的特征差异，扩大第一图像特征(或第二图像特征)与负样本图像特征之间的特征差异，对特征提取模型进行训练，直至满足训练完成条件时结束训练。其中，该训练完成条件包括损失收敛或达到训练轮数中的至少一种。

综上所述，本申请实施例中，通过对原始医学图像进行数据增强，得到互为正样本的第一增强图像和第二增强图像，并通过特征提取模型进行特征提取，得到第一图像特征和第二图像特征，进而将不同于该原始医学图像的其他原始医学图像作为负样本，并基于第一图像特征、第二图像特征以及负样本图像特征确定特征提取模型的模型损失，最终利用模型损失训练特征提取模型；整个过程中，采用自监督学习方式使特征提取模型学习到医学图像的图像特征，无需人工进行医学图像标注，降低了模型训练过程中的人工标注成本，提高了特征提取模型的训练效率。

在一种可能的实施方式中，为了避免使用相同特征提取网络对第一增强图像和第二增强图像进行特征提取，输出相同特征提取结果进而导致坍缩解，本申请实施例中的特征提取模型包括两条特征提取分支，从而利用不同的特征提取分支对不同增强图像进行特征提取，其中，不同特征提取分支采用不同参数的特征提取网络(即特征提取网络的权值不共享)。下面采用示例性的实施例进行说明。

图6示出了本申请另一个示例性实施例提供的图像特征的监督学习方法的流程图。本实施例以该方法由计算机设备执行为例进行说明，该方法包括如下步骤。

步骤601，对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，第一增强图像和第二增强图像互为正样本。

本步骤的实施方式可以参考上述步骤401，本实施例在此不再赘述。

示意性的，如图7所示，计算机设备对原始图像701进行数据增强后，分别得到第一增强图像702和第二增强图像703。

步骤602，通过第一特征提取分支对第一增强图像进行特征提取，得到第一图像特征，第一特征提取分支包括第一特征提取网络。

在一种可能的实施方式中，输入第一特征提取分支的第一增强图像，通过该第一特征提取分支的第一特征提取网络进行特征提取，得到第一图像特征。

通常情况下，对增强图像进行特征提取后，为了降低特征维度以降低后续推理过程中的计算量，计算机设备会对提取到的图像特征进行池化(pooling)处理，常见的池化方式包括最大池化、平均池化等等。然而，由于不同池化方式下的关注点不同，比如，最大池化关注池化区域内的最大值，平均池化则关注池化区域内的平均值，因此为了提高图像特征的特征表达，在一种可能的实施方式中，特征提取网络后还连接有多全局描述子(Multiple Global Descriptor，MGD)网络，该多全局描述子网络用于对不同描述子下的图像特征(对应不同的池化方式)进行聚合并输出。本步骤可以包括如下步骤：

一、通过第一特征提取网络对第一增强图像进行特征提取，得到第一中间图像特征。

计算机设备将第一增强图像输入第一特征提取网络，得到网络输出的第一中间图像特征。

示意性的，如图7所示，计算机设备将第一增强图像702输入第一特征提取分支，由其中的第一特征提取网络704进行特征提取，得到第一中间图像特征。

二、通过多全局描述子网络对第一中间图像特征进行至少两种池化处理，得到至少两种第一全局描述子。

在一些实施例中，多全局描述子网络由至少两个池化层构成，且不同池化层对应不同的池化处理方式。完成特征提取后，计算机设备通过至少两个池化层分别对第一中间图像特征进行池化处理，得到至少两种第一全局描述子。

在一些实施例中，池化层可以包括全局平局池化(Global Average Pooling，GAP)层、全局最大池化(Global Maximum Pooling，GMP)层和通用平均池化(General Average Pooling，GeAP)层中的至少两种。当然，计算机设备还可以采用其他池化方式对中间图像特征进行池化处理，本实施例对此不作限定。

示意性的，如图8所示，多全局描述子网络中设置有GAP层801、GMP层802以及GeAP层803，特征提取网络输出的中间图像特征804分别输入GAP层801、GMP层802和GeAP层803，得到不同池化处理后的三种全局描述子805。其中，中间图像特征的维度为(N，C，H，W)，全局描述子的维度为(N，C，1，1)，N为增强图像的数量，C为通道数，H为特征图高度，W为特征图宽度。

三、通过多全局描述子网络对至少两种第一全局描述子进行级联处理，并基于级联后的第一全局描述子生成第一图像特征。

在一些实施例中，各个池化层后连接有一个多层感知机(Multilayer Perceptron，MLP)，计算机设备通过MLP对池化处理后得到的第一全局描述子进行进一步处理，并对处理后的至少两种第一全局描述子进行级联处理，最终将级联后的第一全局描述子输入MLP，得到第一增强图像的第一图像特征。

示意性的，如图8所示，计算机设备将全局描述子805输入MLP 806，并对各个MLP 806的输出结果进行级联处理，得到级联全局描述子807，最终通过MLP 808对级联全局描述子807进行处理，得到第一图像特征809。

步骤603，通过第二特征提取分支对第二增强图像进行特征提取，得到第二图像特征，第二特征提取分支包括第二特征提取网络。

与第一特征提取分支类似的，第二特征提取分支包括第二特征提取网络以及多全局描述子网络，其中，第二特征提取网络与第一特征提取网络的权值不共享，而两条特征提取分支中的多全局描述子网络一致。在一种可能的实施方式中，本步骤可以包括如下步骤：

一、通过第二特征提取网络对第二增强图像进行特征提取，得到第二中间图像特征。

计算机设备将第二增强图像输入第二特征提取网络，得到网络输出的第二中间图像特征。

二、通过多全局描述子网络对第二中间图像特征进行至少两种池化处理，得到至少两种全局描述子。

完成特征提取后，计算机设备通过至少两个池化层分别对第二中间图像特征进行池化处理，得到至少两种第二全局描述子。

三、通过多全局描述子网络对至少两种第二全局描述子进行级联处理，并基于级联后的第二全局描述子生成第二图像特征。

计算机设备通过MLP对池化处理后得到的第二全局描述子进行进一步处理，并对处理后的至少两种第二全局描述子进行级联处理，最终将级联后的第二全局描述子输入MLP，得到第二增强图像的第二图像特征。

其中，利用第二特征提取分支进行特征提取的过程可以参考步骤602，本实施例在此不再赘述。

示意性的，如图7所示，计算机设备通过第一特征提取分支中的第一特征提取网络704以及多全局描述子网络705对第一增强图像702进行特征提取，得到第一图像特征；通过第二特征提取分支中的第二特征提取网络706以及多全局描述子网络705对第二增强图像703 进行特征提取，得到第二图像特征。

步骤604，基于第一图像特征、第二图像特征以及负样本图像特征，确定特征提取模型的模型损失。

由于特征提取模型的特征提取目标是缩小相似图像之间的特征距离，扩大不相似图像之间的特征距离，因此本实施例中，特征提取模型的模型损失包括距离损失，而该距离损失则由正样本特征距离与负样本特征距离确定得到。其中，正样本特征距离为第一图像特征与第二图像特征之间的特征距离，负样本特征距离为第一图像特征(或第二图像特征)与负样本图像特征之间的特征距离，且正样本特征距离与距离损失呈正相关关系，负样本特征距离与距离损失呈负相关关系。

虽然基于包含距离损失的模型损失进行模型训练能够缩小相似图像之间的特征距离，扩大不相似图像之间的特征距离，但是存在正样本数量过少的问题，即每一张原始医学图像被视作为一个独立的类，基于距离损失进行模型训练拉大了所有类之间的距离。然而，仅拉大样本与样本之间的距离反而会造成学习困难，甚至带来假阴性样本的问题。为了避免出现上述问题，本申请实施例中，特征提取模型的模型损失除了包括距离损失外，还包括聚类损失，以此产生更好的相似图像内聚性。

在一种确定聚类损失的方式中，计算机设备对当前训练批次中各张原始医学图像对应的第一图像特征进行聚类，得到k个第一类簇质心，k为大于等于2的整数；对当前训练批次中各张原始医学图像对应的第二图像特征进行聚类，得到k个第二类簇质心；基于第一图像特征与k个第二类簇质心之间的距离，以及第二图像特征与k个第一类簇质心之间的距离，确定聚类损失。

其中，计算机设备可以采用K均值(K-Means)聚类、均值漂移聚类等聚类算法确定类簇质心，且类簇质心可以采用同一类簇各个图像特征的平均特征表示，本实施例对此不作限定。

然而，由于距离损失和聚类损失之间存在一定的对抗关系，因此直接利用第一图像特征和第二图像特征进行聚类，可能会造成后续训练过程中的学习困难。为了避免上述问题，在另一种可能的实施方式中，计算机设备基于第一图像特征生成原始医学图像对应的第一目标特征和第二目标特征，基于第二图像特征生成原始医学图像对应的第三目标特征和第四目标特征，从而利用不同的目标特征确定距离损失以及聚类损失。

在一些实施例中，各条特征提取分支中还包括第一MLP和第二MLP。计算机设备将第一图像特征分别输入第一MLP和第二MLP，得到第一目标特征和第二目标特征；将第二图像特征分别输入第一MLP和第二MLP，得到第三目标特征和第四目标特征。

示意性的，如图7所示，计算机设备通过第一MLP 707对第一图像特征进行处理，输出第一目标特征709，通过第二MLP 708对第一图像特征进行处理，输出第二目标特征710。计算机设备通过第一MLP 707对第二图像特征进行处理，输出第三目标特征711，通过第二MLP 708对第二图像特征进行处理，输出第四目标特征712。

在一种可能的实施方式中，如图9所示，确定模型损失的过程可以包括如下子步骤。

步骤604A，基于第一图像特征与第二图像特征之间的特征距离，以及第一图像特征与负样本图像特征之间的特征距离，确定距离损失。

在一种可能的实施方式中，计算机设备采用同一MLP输出的目标特征确定距离损失。在一些实施例中，计算机设备基于第一目标特征与第三目标特征之间的特征距离，以及第一目标特征(或第二目标特征)与负样本图像特征之间的特征距离，确定距离损失。

在一些实施例中，计算机设备设置有负样本图像特征队列，该队列中包含最近输入的l张原始图像的图像特征，该负样本图像特征队列可以表示为M＝{m ₀,m ₁,…,m _l-1}。由于每一张原始图像在每一轮训练中仅出现一次，因此负样本图像特征队列中的图像特征都是来自不同输入图像的数据增强。

在一些实施例中，计算机设备通过infoNCE计算得到距离损失，该距离损失可以表示为：

其中，l为负样本图像特征的数量，f(x ₁)表示第一目标特征，f(x ₂)表示第三目标特征，m _i第i个负样本图像特征，t为控制损失函数平滑度的超参数。

示意性的，如图7所示，计算机设备基于第一目标特征709、第三目标特征711以及负样本图像特征713，计算得到距离损失714。

步骤604B，分别对当前训练批次中各张原始医学图像对应的第一图像特征和第二图像特征进行聚类，并基于聚类结果确定聚类损失。

为了避免学习困难，计算机设备对图像特征进行特征聚类时，对另一MLP输出的目标特征进行聚类，基于聚类结果确定聚类损失。在一种可能的实施方式中，确定聚类损失可以包括如下步骤：

1、对当前训练批次中各张原始医学图像对应的第二目标特征进行聚类，得到k个第三类簇质心。

在一些实施例中，计算机设备对当前训练批次中各张原始医学图像对应的第二目标特征进行聚类，得到k个类簇，并基于各个类簇中的第二目标特征确定第三类簇质心。

示意性的，如图7所示，计算机设备对N张原始医学图像对应的第二目标特征710进行聚类，得到k个第三类簇质心715。

2、对当前训练批次中各张原始医学图像对应的第四目标特征进行聚类，得到k个第四类簇质心。

在一些实施例中，计算机设备对当前训练批次中各张原始医学图像对应的第四目标特征进行聚类，得到k个类簇，并基于各个类簇中的第四目标特征确定第四类簇质心。

示意性的，如图7所示，计算机设备对N张原始医学图像对应的第四目标特征712进行聚类，得到k个第四类簇质心716。

3、基于第一目标特征与k个第四类簇质心之间的距离，以及第三目标特征与k个第三类簇质心之间的距离，确定聚类损失。

在一些实施例中，聚类损失包括第一增强图像对应的类簇质心与第二增强图像对应的目标特征之间的infoNCE，以及第二增强图像对应的类簇质心与第一增强图像对应的目标特征之间的infoNCE(即对称损失)。其中，计算机设备将目标特征所属类簇的类簇质心作为正样本，将其他类簇的类簇质心作为负样本，确定目标特征与类簇质心之间的距离，进而得到聚类损失。

示意性的，该聚类损失可以表示为：

where f(x ₁)∈C(x ₂) _j

其中，k为第四类簇质心的数量，f(x ₁)表示第一目标特征，C(x ₂)表示第四类簇质心，f(x ₁)∈C(x ₂) _j表示第一目标特征属于第j个第四类簇质心对应的类簇，t为控制损失函数平滑度的超参数。

示意性的，如图7所示，计算机设备基于第一目标特征709、第三目标特征711、第三类簇质心715以及第四类簇质心716计算得到聚类损失717。

步骤604C，根据距离损失和聚类损失，确定模型损失。

示意性的，如图7所示，计算机设备将距离损失714与聚类损失717之和确定为模型损失718。在一些实施例中，还可以对距离损失与聚类损失进行加权求和，得到模型损失，从而灵活调节距离损失与聚类损失各自的权重占比。

需要说明的是，完成上述训练流程后，计算机设备基于第一图像特征和第二图像特征更新负样本图像特征，保证负样本图像特征队列中包含最近输入的l张原始图像的图像特征。示意性的，如图7所示，计算机设备基于第一目标特征709和第三目标特征711更新负样本图像特征713。

步骤605，基于模型损失，通过反向传播算法训练第一特征提取网络。

在一种可能的实施方式中，模型训练过程中，第一特征提取网络的网络参数参与梯度回传，第二特征提取网络的网络参数则不参与梯度回传，而是由第一特征提取网络的网络参数更新得到。因此，基于模型损失进行模型训练时，计算机设备通过反向传播算法，调整第一特征提取网络的网络参数，完成一轮对特征提取网络的训练。

示意性的，如图7所示，计算机设备基于模型损失718，对第一特征提取网络704进行参数更新。

步骤606，基于训练后第一特征提取网络的网络参数，更新第二特征提取网络的网络参数。

完成对第一特征提取网络的训练后，计算机设备进一步根据训练后第一特征提取网络的网络参数，对第二特征提取网络的网络参数进行更新。在一种可能的实施方式中，计算机设备可以采用滑动平均方式，基于第一特征提取网络的网络参数更新第二特征提取网络的网络参数，其中，滑动平均过程可以表示为：

θ _B←mθ _B+(1-m)θ _A

其中，θ _B为第二特征提取网络的网络参数，θ _A为第一特征提取网络的网络参数，m为控制参数。

示意性的，如图7所示，计算机设备基于更新后第一特征提取网络704的网络参数，通过滑动平均更新第二特征提取网络706的网络参数。

本实施例中，计算机设备基于正样本图像特征之间的特征距离，以及正样本图像特征与负样本图像特征之间的特征距离确定距离损失，使特征提取网络在训练过程中能够学习到相似图像之间特征的相似性，以及不相似图像之间特征的差异性；同时，通过对图像特征进行聚类，并基于图像特征与聚类后各个类簇质心之间的距离确定聚类损失，有助于提高相似图像之间的内聚性，进而提高训练得到的特征提取网络的特征提取质量。

此外，本实施例中，通过设置多全局描述子网络，从而利用多全局描述子网络对多个全局描述子进行聚合表示，提高了图像特征的特征表达，有助于提高后续训练质量。

并且，本实施例中，利用两个MLP对图像特征进行处理，得到针对同一增强图像的两个目标特征，进而利用目标特征聚类并确定聚类损失，避免直接利用图像特征确定聚类损失时，因聚类损失与距离损失之间存在对抗性，造成训练困难的问题。

不同显微镜放大倍率下，同一医学图像往往包含不同的语义信息，进而导致截然不同的相似性。因此在训练特征提取模型时，计算机设备需要基于相同放大倍率下的医学图像进行模型训练，相应的，训练得到特征提取模型用于对目标放大倍率下的图像进行特征提取。在一种可能的实施方式中，在图4的基础上，如图10所示，对原始医学图像进行数据增强之前，该方法还包括如下步骤：

步骤4001，对目标放大倍率下的WSI进行切分，得到切分图像。

通常情况下，医学图像通常以WSI格式出现，其中包含了同一张图片在不同分辨率下的图像。由于WSI的数据量过大，因此首先需要在不同显微镜放大倍率下(比如10倍，20倍，40倍)，对WSI进行切分，得到若干切分图像。其中，各个切分图像的图像尺寸相同，且符合特征提取模型的图像输出尺寸。

在一些实施例中，当需要训练目标放大倍率对应的特征提取模型时，计算机设备即对目标放大倍率下的WSI进行切分，得到切分图像。

步骤4002，基于图像信息量对切分图像进行筛选，得到原始医学图像。

对于位于边缘的切分图像，由于此类图像中所包含的图像信息量较小，不利于后续模型训练，因此完成切分后，计算机设备还需要根据图像信息量，对切分图像进行筛选，过滤图像数据量较低的切分图像，最终得到原始医学图像。

示意性的，如图11所示，第一切分图像1101即为需要过滤的无效样本，而第二切分图像1102则是需要保留的有效样本。

此外，在实际应用过程中，若无法知悉医学图像的放大倍率，计算机设备利用训练完成的特征提取网络对医学图像进行特征提取时，提取出的图像特征可能不准确。为了提高这种情况下的特征提取质量，在一种可能的实施方式中，计算机设备基于不同放大倍率的原始医学图像训练倍率预测模型，该倍率预测模型用于预测输入图像的放大倍率。

在一些实施例中，计算机设备以原始医学图像对应的放大倍数为监督，训练倍率预测模型，且训练得到的倍率预测模型用于输出各种放大倍率的概率。比如，当医学图像的放大倍率包括10倍、20倍和40倍时，若倍率预测模型输出的结果0.01，0.95，0.04，表示输入医学图像的放大倍率为10倍的概率为0.01，放大倍率为20倍的概率为0.95，放大倍率为40倍的概率为0.04。

应用过程中，倍率预测模型的预测结果用于对不同特征提取模型提取的图像特征进行特征融合。在一种可能的实施方式中，计算机设备通过倍率预测模型得到医学图像的放大倍率的概率后，通过不同放大倍率对应的特征提取模型对医学图像进行特征提取，进而基于预测出的概率对不同特征提取模型提取的图像特征进行特征融合(比如特征加权求和)，以便基于融合得到的图像特征进行后续处理。

示意性的，如图12所示，计算机设备分别通过第一特征提取模型1202、第二特征提取模型1203、第三特征提取模型1204(对应不同放大倍率)对医学图像1201进行特征提取，并通过倍率预测模型1205对医学图像1201进行放大倍率预测，从而基于放大倍率预测结果对三个特征提取模型输出的图像特征进行加权求和，得到目标图像特征1206。

请参考图13，其示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体来讲：所述计算机设备1300包括中央处理单元(Central Processing Unit，CPU)1301、包括随机存取存储器1302和只读存储器1303的系统存储器1304，以及连接系统存储器1304和中央处理单元1301的系统总线1305。所述计算机设备1300还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(Input/Output，I/O系统)1306，和用于存储操作系统1313、应用程序1314和其他程序模块1315的大容量存储设备1307。

所述基本输入/输出系统1306包括有用于显示信息的显示器1308和用于用户输入信息的诸如鼠标、键盘之类的输入设备1309。其中所述显示器1308和输入设备1309都通过连接到系统总线1305的输入输出控制器1310连接到中央处理单元1301。所述基本输入/输出系统1306还可以包括输入输出控制器1310以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1310还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备1307通过连接到系统总线1305的大容量存储控制器(未示出)连接到中央处理单元1301。所述大容量存储设备1307及其相关联的计算机可读介质为计算机设备1300提供非易失性存储。也就是说，所述大容量存储设备1307可以包括诸如硬盘或者驱动器之类的计算机可读介质(未示出)。

不失一般性，所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括随机存取记忆体(RAM，Random Access Memory)、只读存储器(ROM，Read Only Memory)、闪存或其他固态存储其技术，只读光盘(Compact Disc Read-Only Memory，CD-ROM)、数字通用光盘(Digital Versatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1304和大容量存储设备1307可以统称为存储器。

存储器存储有一个或多个程序，一个或多个程序被配置成由一个或多个中央处理单元1301执行，一个或多个程序包含用于实现上述方法的指令，中央处理单元1301执行该一个或多个程序实现上述各个方法实施例提供的方法。

根据本申请的各种实施例，所述计算机设备1300还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1300可以通过连接在所述系统总线1305上的网络接口单元1311连接到网络1312，或者说，也可以使用网络接口单元1311来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由计算机设备所执行的步骤。

图14是本申请一个示例性实施例提供的图像特征的监督学习装置的结构框图，该装置包括：

数据增强模块1401，用于对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，所述第一增强图像和所述第二增强图像互为正样本；

特征提取模块1402，用于通过特征提取模型对所述第一增强图像和所述第二增强图像进行特征提取，得到所述第一增强图像的第一图像特征，以及所述第二增强图像的第二图像特征；

损失确定模块1403，用于基于所述第一图像特征、所述第二图像特征以及负样本图像特征，确定所述特征提取模型的模型损失，所述负样本图像特征为其他原始医学图像对应的图像特征；

第一训练模块1404，用于基于所述模型损失，训练所述特征提取模型。

在一些实施例中，所述特征提取模型包括第一特征提取分支和第二特征提取分支，所述第一特征提取分支和所述第二特征提取分支采用不同参数的特征提取网络；

所述特征提取模块1402，包括：

第一提取单元，用于通过所述第一特征提取分支对所述第一增强图像进行特征提取，得到所述第一图像特征；

第二提取单元，用于通过所述第二特征提取分支对所述第二增强图像进行特征提取，得到所述第二图像特征。

在一些实施例中，所述第一特征提取分支包括第一特征提取网络和多全局描述子网络，所述第二特征提取分支包括第二特征提取网络和所述多全局描述子网络，所述多全局描述子网络用于对不同描述子下的图像特征进行聚合并输出；

所述第一提取单元，具体用于：

通过所述第一特征提取网络对所述第一增强图像进行特征提取，得到第一中间图像特征；

通过所述多全局描述子网络对所述第一中间图像特征进行至少两种池化处理，得到至少两种第一全局描述子；

通过所述多全局描述子网络对至少两种所述第一全局描述子进行级联处理，并基于级联后的所述第一全局描述子生成所述第一图像特征；

所述第二提取单元，具体用于：

通过所述第二特征提取网络对所述第二增强图像进行特征提取，得到第二中间图像特征；

通过所述多全局描述子网络对所述第二中间图像特征进行至少两种池化处理，得到至少两种全局描述子；

通过所述多全局描述子网络对至少两种所述第二全局描述子进行级联处理，并基于级联后的所述第二全局描述子生成所述第二图像特征。

在一些实施例中，所述第一训练模块1404，包括：

第一训练单元，用于基于所述模型损失，通过反向传播算法训练所述第一特征提取网络；

第二训练单元，用于基于训练后所述第一特征提取网络的网络参数，更新所述第二特征提取网络的网络参数。

在一些实施例中，所述损失确定模块1403，包括：

第一损失确定单元，用于基于所述第一图像特征与所述第二图像特征之间的特征距离，以及所述第一图像特征与所述负样本图像特征之间的特征距离，确定距离损失；

第二损失确定单元，用于分别对当前训练批次中各张所述原始医学图像对应的所述第一图像特征和所述第二图像特征进行聚类，并基于聚类结果确定聚类损失；

总损失确定单元，用于根据所述距离损失和所述聚类损失，确定所述模型损失。

在一些实施例中，所述第二损失确定单元，用于：

对当前训练批次中各张所述原始医学图像对应的所述第一图像特征进行聚类，得到k个第一类簇质心，k为大于等于2的整数；

对当前训练批次中各张所述原始医学图像对应的所述第二图像特征进行聚类，得到k个第二类簇质心；

基于所述第一图像特征与k个所述第二类簇质心之间的距离，以及所述第二图像特征与k个所述第一类簇质心之间的距离，确定所述聚类损失。

在一些实施例中，所述装置还包括：

第一生成模块，用于基于所述第一图像特征生成所述原始医学图像对应的第一目标特征和第二目标特征；

第二生成模块，用于基于所述第二图像特征生成所述原始医学图像对应的第三目标特征和第四目标特征；

所述第一损失确定单元，具体用于：

基于所述第一目标特征与所述第三目标特征之间的特征距离，以及所述第一目标特征与所述负样本图像特征之间的特征距离，确定所述距离损失；

所述第二损失确定单元，具体用于：

对当前训练批次中各张所述原始医学图像对应的第二目标特征进行聚类，得到k个第三类簇质心；

对当前训练批次中各张所述原始医学图像对应的第四目标特征进行聚类，得到k个第四类簇质心；

基于所述第一目标特征与k个所述第四类簇质心之间的距离，以及所述第三目标特征与k个所述第三类簇质心之间的距离，确定所述聚类损失。

在一些实施例中，所述第一生成模块，用于：

将所述第一图像特征分别输入第一多层感知机MLP和第二MLP，得到所述第一目标特征和所述第二目标特征；

在一些实施例中，所述第二生成模块，用于：

将所述第二图像特征分别输入第一MLP和第二MLP，得到所述第三目标特征和所述第四目标特征。

在一些实施例中，所述数据增强模块1401，包括：

第一增强单元，用于基于第一增强参数对所述原始医学图像进行色彩增强和方向增强，得到所述第一增强图像；

第二增强单元，用于通过第二增强参数对所述原始医学图像进行色彩增强和方向增强，得到所述第二增强图像，所述第一增强参数和所述第二增强参数不同。

在一些实施例中，所述装置方法还包括：

更新模块，用于基于所述第一图像特征和所述第二图像特征更新所述负样本图像特征。

在一些实施例中，所述特征提取模型用于对目标放大倍率下的图像进行特征提取；

所述装置包括：

切分模块，用于对所述目标放大倍率下的全视野数字切片WSI进行切分，得到切分图像；

筛选模块，用于基于图像信息量对所述切分图像进行筛选，得到所述原始医学图像。

在一些实施例中，所述装置还包括：

第二训练模块，用于基于不同放大倍率的原始医学图像训练倍率预测模型，所述倍率预测模型用于预测输入图像的放大倍率，且所述倍率预测模型的预测结果用于对不同特征提取模型提取的图像特征进行特征融合。

需要说明的是：上述实施例提供的装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其实现过程详见方法实施例，这里不再赘述。

本申请实施例还提供一种计算机可读存储介质，该可读存储介质中存储有至少一条指令，至少一条指令由处理器加载并执行以实现上述任一实施例所述的图像特征的监督学习方法。

示例性的，该计算机可读存储介质可以包括：ROM、RAM、固态硬盘(SSD，Solid State Drives)或光盘等。其中，RAM可以包括电阻式随机存取记忆体(ReRAM,Resistance Random Access Memory)和动态随机存取存储器(DRAM，Dynamic Random Access Memory)。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例所述的图像特征的监督学习方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种图像特征的监督学习方法，所述方法由计算机设备执行，所述方法包括：

对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，所述第一增强图像和所述第二增强图像互为正样本；

通过特征提取模型对所述第一增强图像和所述第二增强图像进行特征提取，得到所述第一增强图像的第一图像特征，以及所述第二增强图像的第二图像特征；

基于所述第一图像特征、所述第二图像特征以及负样本图像特征，确定所述特征提取模型的模型损失，所述负样本图像特征为其他原始医学图像对应的图像特征；

基于所述模型损失，训练所述特征提取模型。
根据权利要求1所述的方法，其中，所述特征提取模型包括第一特征提取分支和第二特征提取分支，所述第一特征提取分支和所述第二特征提取分支采用不同参数的特征提取网络；

所述通过特征提取模型对所述第一增强图像和所述第二增强图像进行特征提取，得到所述第一增强图像的第一图像特征，以及所述第二增强图像的第二图像特征，包括：

通过所述第一特征提取分支对所述第一增强图像进行特征提取，得到所述第一图像特征；

通过所述第二特征提取分支对所述第二增强图像进行特征提取，得到所述第二图像特征。
根据权利要求2所述的方法，其中，所述第一特征提取分支包括第一特征提取网络和多全局描述子网络，所述第二特征提取分支包括第二特征提取网络和所述多全局描述子网络，所述多全局描述子网络用于对不同描述子下的图像特征进行聚合并输出；

所述通过所述第一特征提取分支对所述第一增强图像进行特征提取，得到所述第一图像特征，包括：

通过所述第一特征提取网络对所述第一增强图像进行特征提取，得到第一中间图像特征；

通过所述多全局描述子网络对所述第一中间图像特征进行至少两种池化处理，得到至少两种第一全局描述子；

通过所述多全局描述子网络对至少两种所述第一全局描述子进行级联处理，并基于级联后的所述第一全局描述子生成所述第一图像特征；

所述通过所述第二特征提取分支对所述第二增强图像进行特征提取，得到所述第二图像特征，包括：

通过所述第二特征提取网络对所述第二增强图像进行特征提取，得到第二中间图像特征；

通过所述多全局描述子网络对所述第二中间图像特征进行至少两种池化处理，得到至少两种全局描述子；

通过所述多全局描述子网络对至少两种所述第二全局描述子进行级联处理，并基于级联后的所述第二全局描述子生成所述第二图像特征。
根据权利要求3所述的方法，其中，所述基于所述模型损失训练所述特征提取模型，包括：

基于所述模型损失，通过反向传播算法训练所述第一特征提取网络；

基于训练后所述第一特征提取网络的网络参数，更新所述第二特征提取网络的网络参数。
根据权利要求1至4任一所述的方法，其中，所述基于所述第一图像特征、所述第二图像特征以及负样本图像特征，确定所述特征提取模型的模型损失，包括：

基于所述第一图像特征与所述第二图像特征之间的特征距离，以及所述第一图像特征与所述负样本图像特征之间的特征距离，确定距离损失；

分别对当前训练批次中各张所述原始医学图像对应的所述第一图像特征和所述第二图像特征进行聚类，并基于聚类结果确定聚类损失；

根据所述距离损失和所述聚类损失，确定所述模型损失。
根据权利要求5所述的方法，其中，所述分别对当前训练批次中各张所述原始医学图像对应的所述第一图像特征和所述第二图像特征进行聚类，并基于聚类结果确定聚类损失，包括：

对当前训练批次中各张所述原始医学图像对应的所述第一图像特征进行聚类，得到k个第一类簇质心，k为大于等于2的整数；

对当前训练批次中各张所述原始医学图像对应的所述第二图像特征进行聚类，得到k个第二类簇质心；

基于所述第一图像特征与k个所述第二类簇质心之间的距离，以及所述第二图像特征与k个所述第一类簇质心之间的距离，确定所述聚类损失。
根据权利要求5所述的方法，其中，所述方法还包括：

基于所述第一图像特征生成所述原始医学图像对应的第一目标特征和第二目标特征；

基于所述第二图像特征生成所述原始医学图像对应的第三目标特征和第四目标特征；

所述基于所述第一图像特征与所述第二图像特征之间的特征距离，以及所述第一图像特征与所述负样本图像特征之间的特征距离，确定距离损失，包括：

基于所述第一目标特征与所述第三目标特征之间的特征距离，以及所述第一目标特征与所述负样本图像特征之间的特征距离，确定所述距离损失；

所述分别对当前训练批次中各张所述原始医学图像对应的所述第一图像特征和所述第二图像特征进行聚类，并基于聚类结果确定聚类损失，包括：

对当前训练批次中各张所述原始医学图像对应的第二目标特征进行聚类，得到k个第三类簇质心；

对当前训练批次中各张所述原始医学图像对应的第四目标特征进行聚类，得到k个第四类簇质心；

基于所述第一目标特征与k个所述第四类簇质心之间的距离，以及所述第三目标特征与k个所述第三类簇质心之间的距离，确定所述聚类损失。
根据权利要求7所述的方法，其中，所述基于所述第一图像特征生成所述原始医学图像对应的第一目标特征和第二目标特征，包括：

将所述第一图像特征分别输入第一多层感知机MLP和第二MLP，得到所述第一目标特征和所述第二目标特征；

所述基于所述第二图像特征生成所述原始医学图像对应的第三目标特征和第四目标特征，包括：

将所述第二图像特征分别输入第一MLP和第二MLP，得到所述第三目标特征和所述第四目标特征。
根据权利要求1至4任一所述的方法，其中，所述对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，包括：

基于第一增强参数对所述原始医学图像进行色彩增强和方向增强，得到所述第一增强图像；

通过第二增强参数对所述原始医学图像进行色彩增强和方向增强，得到所述第二增强图像，所述第一增强参数和所述第二增强参数不同。
根据权利要求1至4任一所述的方法，其中，所述基于所述模型损失训练所述特征提取模型之后，所述方法还包括：

基于所述第一图像特征和所述第二图像特征更新所述负样本图像特征。
根据权利要求1至4任一所述的方法，其中，所述特征提取模型用于对目标放大倍率下的图像进行特征提取；

所述对原始医学图像进行数据增强，得到第一增强图像和第二增强图像之前，所述方法包括：

对所述目标放大倍率下的全视野数字切片WSI进行切分，得到切分图像；

基于图像信息量对所述切分图像进行筛选，得到所述原始医学图像。
根据权利要求11所述的方法，其中，所述方法还包括：

基于不同放大倍率的原始医学图像训练倍率预测模型，所述倍率预测模型用于预测输入图像的放大倍率，且所述倍率预测模型的预测结果用于对不同特征提取模型提取的图像特征进行特征融合。
一种图像特征的监督学习装置，所述装置包括：

数据增强模块，用于对原始医学图像进行数据增强，得到第一增强图像和第二增强图像，所述第一增强图像和所述第二增强图像互为正样本；

特征提取模块，用于通过特征提取模型对所述第一增强图像和所述第二增强图像进行特征提取，得到所述第一增强图像的第一图像特征，以及所述第二增强图像的第二图像特征；

损失确定模块，用于基于所述第一图像特征、所述第二图像特征以及负样本图像特征，确定所述特征提取模型的模型损失，所述负样本图像特征为其他原始医学图像对应的图像特征；

第一训练模块，用于基于所述模型损失，训练所述特征提取模型。
一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如权利要求1至12任一所述的图像特征的监督学习方法。
一种计算机可读存储介质，所述可读存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如权利要求1至12任一所述的图像特征的监督学习方法。
一种计算机程序产品，所述计算机程序产品包括计算机指令，所述计算机指令存储在计算机可读存储介质中，处理器从所述计算机可读存储介质读取并执行所述计算机指令，以实现如权利要求1至12任一所述的图像特征的监督学习方法。