CN114332530A

CN114332530A - 图像分类方法、装置、计算机设备及存储介质

Info

Publication number: CN114332530A
Application number: CN202111583275.9A
Authority: CN
Inventors: 赵宇; 林震宇; 姚建华
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-12-22
Filing date: 2021-12-22
Publication date: 2022-04-12
Also published as: WO2023116231A1; US20230290120A1

Abstract

本申请实施例公开了一种图像分类方法、装置、计算机设备及存储介质，属于计算机技术领域。该方法包括：获取待分类的病理图像的图像特征；对于多个尺度中的每个尺度，从图像特征中提取尺度对应的至少一个局部特征，将尺度对应的至少一个局部特征进行聚合，得到聚合特征；将得到的多个聚合特征进行拼接，得到拼接图像特征；对拼接图像特征进行分类，得到病理图像所属的类别。本申请实施例提供的方法，不同尺度对应的局部特征所包含的信息不同，使得多个聚合特征包含不同尺度对应的特征信息，将多个聚合特征拼接成拼接图像特征后，丰富了拼接图像特征的特征信息，基于该拼接图像特征来确定病理图像所属的类别，以保证该类别的准确性。

Description

图像分类方法、装置、计算机设备及存储介质

技术领域

本申请实施例涉及计算机技术领域，特别涉及一种图像分类方法、装置、计算机设备及存储介质。

背景技术

随着计算机技术的发展，图像分类技术应用越来越广泛，可以应用于多种场景下，如在人脸识别场景或医学图像分类场景等。相关技术中，对待分类的图像进行特征提取，得到图像的图像特征，直接对该图像的图像特征进行分类，得到该图像所属的类别。由于上述方法中直接以提取到的图像特征进行分类，图像特征中的信息量少，导致分类准确性差。

发明内容

本申请实施例提供了一种图像分类方法、装置、计算机设备及存储介质，能够提升分类准确性。所述技术方案如下：

一方面，提供了一种图像分类方法，所述方法包括：

获取待分类的病理图像的图像特征；

对于多个尺度中的每个尺度，从所述图像特征中提取所述尺度对应的至少一个局部特征，将所述尺度对应的至少一个局部特征进行聚合，得到聚合特征；

将得到的多个聚合特征进行拼接，得到拼接图像特征；

对所述拼接图像特征进行分类，得到所述病理图像所属的类别。

在一种可能实现方式中，所述获取待分类的病理图像的图像特征，包括：

对所述病理图像进行分割，得到多个子图像；

分别对每个子图像进行特征提取，得到所述每个子图像的图像特征；

基于所述多个子图像在所述病理图像中的位置，将所述多个子图像的图像特征进行拼接，得到所述病理图像的图像特征。

另一方面，提供了一种图像分类装置，所述装置包括：

获取模块，用于获取待分类的病理图像的图像特征；

聚合模块，用于对于多个尺度中的每个尺度，从所述图像特征中提取所述尺度对应的至少一个局部特征，将所述尺度对应的至少一个局部特征进行聚合，得到聚合特征；

拼接模块，用于将得到的多个聚合特征进行拼接，得到拼接图像特征；

分类模块，用于对所述拼接图像特征进行分类，得到所述病理图像所属的类别。

在一种可能实现方式中，所述拼接图像特征包括位于多个位置上的第一子特征；所述分类模块，包括：

更新单元，用于基于多个第一子特征，分别对每个第一子特征进行更新，得到所述每个第一子特征对应的第一更新特征；

构成单元，用于基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第一更新特征构成更新后的拼接图像特征；

分类单元，用于对所述更新后的拼接图像特征进行分类，得到所述病理图像所属的类别。

在另一种可能实现方式中，所述更新单元，用于对于所述多个第一子特征中的目标子特征，获取所述多个第一子特征的权重，所述权重指示对应的第一子特征与所述目标子特征之间的关联程度；基于所述多个第一子特征的权重，对所述多个第一子特征进行加权融合，得到所述目标子特征对应的第一更新特征。

在另一种可能实现方式中，所述更新单元，用于对于所述多个第一子特征中的目标子特征，获取所述每个第一子特征与所述目标子特征之间的距离特征，所述距离特征指示在所述拼接图像特征中所述第一子特征与所述目标子特征所处的位置之间的距离；基于所述每个第一子特征与所述目标子特征之间的相似度及所述距离特征，获取所述每个第一子特征的权重。

在另一种可能实现方式中，所述更新单元，用于基于所述每个第一子特征及所述目标子特征在所述拼接图像特征中的位置，确定所述每个第一子特征对应的目标距离，所述目标距离表示所述第一子特征与所述目标子特征所处的位置之间的距离；分别对所述每个第一子特征对应的目标距离进行映射处理，得到所述每个第一子特征与所述目标子特征之间的距离特征。

在另一种可能实现方式中，所述第一更新特征为向量；所述构成单元，用于基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第一更新特征构成三维特征矩阵，将所述三维特征矩阵确定为所述更新后的拼接图像特征。

在另一种可能实现方式中，所述拼接图像特征包括位于多个位置上的第一子特征；所述装置还包括：

融合模块，用于将每个第一子特征与对应的位置特征进行融合，得到所述每个第一子特征对应的第二更新特征，所述位置特征指示对应的第一子特征在所述拼接图像特征中所处的位置；

构成模块，用于基于多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。

在另一种可能实现方式中，所述第二更新特征为向量；所述构成模块，用于基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第二更新特征构成三维特征矩阵，将所述三维特征矩阵确定为所述更新后的拼接图像特征。

在另一种可能实现方式中，所述局部特征包括位于至少一个位置上的至少一个第二子特征；所述聚合模块，用于分别将提取到的每个局部特征中的第二子特征进行拼接，得到所述每个局部特征对应的第一特征向量；基于多个局部特征对应的第一特征向量，分别对每个第一特征向量进行更新，得到所述每个第一特征向量对应的第二特征向量；基于所述多个局部特征在所述图像特征中的位置，将多个第二特征向量构成三维特征矩阵，将所述三维特征矩阵确定为所述聚合特征。

在另一种可能实现方式中，所述获取模块，用于对所述病理图像进行分割，得到多个子图像；分别对每个子图像进行特征提取，得到所述每个子图像的图像特征；基于所述多个子图像在所述病理图像中的位置，将所述多个子图像的图像特征进行拼接，得到所述病理图像的图像特征。

在另一种可能实现方式中，所述多个聚合特征的特征尺寸相同；所述拼接模块，用于将多个聚合特征中处于相同位置的特征进行拼接，得到多个位置对应的特征向量；将所述多个位置对应的特征向量构成的三维特征矩阵，确定为所述拼接图像特征。

在另一种可能实现方式中，所述获取待分类的病理图像的图像特征；对于多个尺度中的每个尺度，从所述图像特征中提取所述尺度对应的至少一个局部特征，将所述尺度对应的至少一个局部特征进行聚合，得到聚合特征；将得到的多个聚合特征进行拼接，得到拼接图像特征；对所述拼接图像特征进行分类，得到所述病理图像所属的类别的步骤是基于分类模型实现的。

在另一种可能实现方式中，所述分类模型包括特征提取子模型及分类子模型；所述装置还包括：

所述获取模块，还用于获取样本病理图像及样本标签，所述样本标签指示所述样本病理图像所属的类别；

所述获取模块，还用于基于所述特征提取子模型，获取所述样本病理图像的样本图像特征；

预测模块，用于基于所述分类子模型，对于所述多个尺度中的每个尺度，从所述样本图像特征中提取所述尺度对应的至少一个样本局部特征，将所述尺度对应的至少一个样本局部特征进行聚合，得到样本聚合特征；将得到的多个样本聚合图像特征进行拼接，得到样本拼接图像特征；对所述样本拼接图像特征进行分类，得到所述样本病理图像所属的预测标签，所述预测标签指示预测到所述样本病理图像所属的类别；

训练模块，用于基于所述预测标签及所述样本标签，对所述分类模型进行训练。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的图像分类方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的图像分类方法所执行的操作。

再一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述方面所述的图像分类方法所执行的操作。

本申请实施例提供的方法、装置、计算机设备及存储介质，在获取到病理图像的图像特征后，按照多个尺度，分别对病理图像的图像特征进行处理，得到多个尺度对应的聚合特征，再将多个尺度对应的聚合特征拼接成一个拼接图像特征，对该拼接图像特征进行分类，得到病理图像的类别。由于不同尺度对应的聚合特征是通过不同尺度的局部特征聚合得到的，不同尺度对应的局部特征所包含的信息不同，使得多个聚合特征包含不同尺度对应的特征信息，将多个聚合特征拼接成拼接图像特征后，使得拼接图像特征包含了不同尺度对应的特征信息，丰富了拼接图像特征的特征信息，基于该拼接图像特征来确定病理图像所属的类别，以保证该类别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种实施环境的结构示意图；

图2是本申请实施例提供的一种图像分类方法的流程图；

图3是本申请实施例提供的一种图像分类方法的流程图；

图4是本申请实施例提供的一种提取局部特征的示意图；

图5是本申请实施例提供的一种基于获取任一聚合特征的流程图；

图6是本申请实施例提供的一种获取目标子特征对应的第一更新特征的流程图；

图7是本申请实施例提供的一种基于分类模型进行图像分类的流程图；

图8是本申请实施例提供的一种图像分类装置的结构示意图；

图9是本申请实施例提供的一种图像分类装置的结构示意图；

图10是本申请实施例提供的一种终端的结构示意图；

图11是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念，但除非特别说明，这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说，在不脱离本申请的范围的情况下，能够将第一特征向量称为第二特征向量，且类似地，可将第二特征向量称为第一特征向量。

本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”，至少一个包括一个、两个或两个以上，多个包括两个或两个以上，而每个是指对应的多个中的每一个，任一是指多个中的任意一个。举例来说，多个尺度包括3个尺度，而每个是指这3个尺度中的每一个尺度，任一是指这3个尺度中的任意一个，能够是第一个，或者，是第二个，或者，是第三个。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

本申请实施例提供的方案，基于人工智能的机器学习技术，训练分类模型，利用训练后的分类模型，实现对病理图像的分类。

本申请实施例提供的图像分类方法，由计算机设备执行。可选地，该计算机设备为终端或服务器。可选地，该服务器是独立的物理服务器，或者，是多个物理服务器构成的服务器集群或者分布式系统，或者，是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地，该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等，但并不局限于此。

在一些实施例中，本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链系统。

图1是本申请实施例提供的一种实施环境的示意图。参见图1，该实施环境包括终端101和服务器102。终端101和服务器102之间通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

终端101用于获取病理图像，向服务器102发送该病理图像。服务器102用于对终端101发送的病理图像进行分类，得到该病理图像所属的类别。

在一些实施例中，终端101上安装由服务器102提供服务的目标应用，终端101能够通过该目标应用实现例如数据传输、消息交互等功能。可选地，目标应用为终端101操作系统中的目标应用，或者为第三方提供的目标应用。例如，目标应用为图像分类应用，该图像分类应用具有图像分类的功能，当然，该图像分类应用还能够具有其他功能，例如，点评功能、导航功能等。

终端101用于获取病理图像，基于用户标识登录目标应用，通过目标应用向服务器102发送该病理图像，服务器102用于接收终端101发送的病理图像，对该终端101发送该病理图像进行分类，得到该病理图像所属的类别。可选地，服务器102向终端101发送分类结果，该分类结果指示该病理图像所属的类别，终端101接收服务器102发送的分类结果并显示。

图2是本申请实施例提供的一种图像分类方法的流程图，由计算机设备执行，如图2所示，该方法包括：

201、计算机设备获取待分类的病理图像的图像特征。

其中，病理图像用于呈现机体器官、组织或细胞的病理形态的图像，例如，该病理图像为WSI(Whole Slide Image，数字化病理图像)。病理图像的图像特征用于表征该病理图像，该病理图像的图像特征为二维特征或三维特征，该图像特征能够以任意的形式表示。例如，该图像特征以特征矩阵的形式表示或者以特征向量的形式表示。再例如，该图像特征以三维特征矩阵或二维特征矩阵的形式表示。

202、计算机设备对于多个尺度中的每个尺度，从该图像特征中提取该尺度对应的至少一个局部特征，将该尺度对应的至少一个局部特征进行聚合，得到聚合特征。

其中，该尺度用于从该图像特征中提取的局部特征的特征尺寸大小，多个尺度的大小不同，例如，多个尺度均为二维尺度，如该多个尺度分别为3×3，或者为5×5，或者为7×7。每个局部特征为图像特征中的部分特征，任一尺度对应的任一局部特征表示该局部特征的特征尺寸与该尺度相匹配，即该局部特征是基于该尺度从图像特征中提取的。对于多个尺度中的任一尺度，从该图像特征中提取该尺度对应的至少一个局部特征，并将该至少一个局部特征进行聚合，得到一个聚合特征，按照上述方式，能够基于多个尺度中的每个尺度获取一个聚合特征，即可得到多个聚合特征。

203、计算机设备将得到的多个聚合特征进行拼接，得到拼接图像特征。

其中，多个聚合特征是分别基于多个尺度得到的，不同的聚合特征包含了不同尺度对应的特征信息，将该多个聚合特征进行拼接，即可保证该拼接图像特征包含多个尺度对应的特征信息。

204、计算机设备对该拼接图像特征进行分类，得到该病理图像所属的类别。

本申请实施例提供的方法，在获取到病理图像的图像特征后，按照多个尺度，分别对病理图像的图像特征进行处理，得到多个尺度对应的聚合特征，再将多个尺度对应的聚合特征拼接成一个拼接图像特征，对该拼接图像特征进行分类，得到病理图像的类别。由于不同尺度对应的聚合特征是通过不同尺度的局部特征聚合得到的，不同尺度对应的局部特征所包含的信息不同，使得多个聚合特征包含不同尺度对应的特征信息，将多个聚合特征拼接成拼接图像特征后，使得拼接图像特征包含了不同尺度对应的特征信息，丰富了拼接图像特征的特征信息，基于该拼接图像特征来确定病理图像所属的类别，以保证该类别的准确性。

在图2所示实施例的基础上，还能够采取先分割再拼接的方式来获取病理图像的图像特征；采取自注意力机制，获取多个聚合特征，并对获取到的拼接图像特征进行更新，之后基于更新后的拼接图像特征来获取病理图像所属的类别，具体过程详见下述实施例。

图3是本申请实施例提供的一种图像分类方法的流程图，由计算机设备执行，如图3所示，该方法包括：

301、计算机设备对待分类的病理图像进行分割，得到多个子图像。

其中，每个子图像为该病理图像中的部分图像，多个子图像能够组成该病理图像。可选地，该多个子图像的图像尺寸相同。例如，病理图像的图像尺寸为40000×40000，每个子图像的尺寸为4000×4000，在对该病理图像进行分割后，得到100个子图像。

在一种可能实现方式中，该步骤301包括：基于目标尺寸，对该病理图像进行分割，得到多个子图像。其中，每个子图像的尺寸与该目标尺寸相同。例如，该目标尺寸为1120×1120，则分割到的每个子图像的尺寸大小均为1120×1120。

可选地，对病理图像进行分割的过程，包括：基于第一移动步长，将第一滑动窗口在该病理图像上移动，将每次移动后的第一滑动窗口内的部分病理图像确定为一个子图像。

其中，第一滑动窗口的尺寸与该目标尺寸相同，第一移动步长表示每次移动第一滑动窗口的移动距离，例如，第一移动步长表示移动第一滑动窗口时每次移动的像素点数目。可选地，该目标尺寸包括第一尺寸和第二尺寸，第一尺寸和第二尺寸分别表示第一滑动窗口的长和宽，第一移动步长与第一尺寸和第二尺寸相同。例如，目标尺寸为1120×1120，第一移动步长为1120，按照此第一移动步长和目标尺寸得到该病理图像中的多个子图像，每个子图像的尺寸为1120×1120。

可选地，病理图像以三维特征矩阵的形式表示，分割得到的每个子图像也以三维特征矩阵的形式表示，该多个子图像能够拼接成该病理图像，则该病理图像及该多个子图像，满足以下关系：

B＝{p^0，0，p^r，c，…，p^H′，W'}

B∈R^H×W×3

其中，B表示病理图像，B∈R^H×W×3指示该病理图像的图像尺寸为H×W×3，H、W表示病理图像的长度和宽度，H、W为任意的正整数；p^0，0、p^r，c、p^H′，W′均表示多个子图像中的一个子图像，p^0，0、p^r，c、

指示每个子图像的图像尺寸为τ_h×τ_ω×3，τ_h、τ_ω表示每个子图像的长度和宽度，τ_h、τ_ω均为任意的正整数，且τ_h小于H，τ_ω小于W；r，c表示多个子图像的序号，r为大于0不大H′的整数，c为大于0不大于W′的正整数；H′为按照子图像的图像尺寸τ_h在病理图像的图像尺寸H上分割出的数量，W′为按照子图像的图像尺寸τ_ω在病理图像的图像尺寸W上分割出的数量，H′×W′即表示从病理图像中分割出的子图像的总数目。

302、计算机设备分别对每个子图像进行特征提取，得到每个子图像的图像特征。

其中，每个子图像的图像特征用于表征对应的子图像，该子图像的图像特征为二维特征或三维特征，该图像特征能够以任意的形式表示。例如，子图像的图像特征以特征向量的形式表示，或者，以特征矩阵的形式表示。再例如，该子图像的图像特征以二维特征矩阵的形式表示，或者，以三维特征矩阵的形式表示。

在一种可能实现方式中，每个子图像及对应的图像特征，满足以下关系：

e^r，c＝f_E(p^r，c)∈R^D

其中，e^r，c表示多个子图像中的任一子图像，r，c表示多个子图像的序号，p^r，c表示多个子图像中第r，c个子图像；f_E(·)表示特征提取函数，基于该特征提取函数f_E(·)，能够分别对每个子图像进行特征提取，得到每个子图像的图像特征；e^r，c∈R^D表示图像特征e^r，c为D维的特征向量。

303、计算机设备基于该多个子图像在该病理图像中的位置，将该多个子图像的图像特征进行拼接，得到该病理图像的图像特征。

其中，病理图像的图像特征用于表征该病理图像，该病理图像的图像特征能够以任意的形式表示。例如，多个子图像的图像特征均为二维特征矩阵，则该病理图像的图像特征也为二维特征矩阵；多个子图像的图像特征均为三维特征矩阵，则该病理图像的图像特征也为三维特征矩阵。

由于不同的子图像在该病理图像中的位置不同，基于每个子图像在病理图像中的位置，将多个子图像的图像特征进行拼接，得到该病理图像的图像特征，使得病理图像的图像特征与该病理图像相对应，该病理图像的图像特征中保留了各个子图像的位置信息，从而保证该图像特征的准确性。并且，通过先将病理图像分割成多个小尺寸的子图像，在获取到每个子图像的图像特征后，再采取拼接的方式，将多个子图像的图像特征拼接成病理图像的图像特征，无需直接对大尺寸的病理图像进行特征提取，从而降低了对设备性能的需要，降低了对用于图像分类的设备的要求，以保证此种特征提取方式的通用性。

可选地，在多个子图像的图像特征均为二维特征矩阵的情况下，该病理图像的图像特征的特征尺寸为该多个子图像的图像特征的特征尺寸之和。例如，病理图像包括4个子图像，每个子图像的图像特征的特征尺寸为2×2，则该病理图像的图像特征的特征尺寸为8×8。

可选地，在多个子图像的图像特征均为三维特征矩阵的情况下，子图像的图像特征的特征尺寸包括第一尺寸、第二尺寸及第三尺寸，该病理图像的图像特征的特征尺寸包括第四尺寸、第五尺寸及第六尺寸，该第四尺寸为多个子图像对应的第一尺寸之和，该第五尺寸为多个子图像对应的第二尺寸之和，该第六尺寸与该第三尺寸相同。例如，病理图像包括4个子图像，每个子图像的图像特征的特征尺寸为2×2×10，则该病理图像的图像特征的特征尺寸为8×8×10。

可选地，多个子图像的图像特征与病理图像的图像特征，满足以下关系：

E＝(e^0，0,e^r,c,…,e^H′，W′)∈R^{W′×H′×D}

其中，E表示病理图像的图像特征，e^0，0、e^r，c、e^H′，W′均表示多个子图像中的一个子图像的图像特征；r，c表示多个子图像的序号，r为大于0不大于H′的整数，c为大于0不大于W′的正整数；H′为按照子图像的特征尺寸τ_h在病理图像的H维度上分割出的数量，W′为按照子图像的特征尺寸τ_ω在病理图像的W维度上分割出的数量，H′×W′即表示从病理图像中分割出的子图像的总数目；D表示在每个子图像的图像特征为向量的情况下，每个子图像的图像特征的向量维度。

需要说明的是，本申请实施例是以先分割再拼接的方式，将病理图像分割成多个子图像，基于多个子图像来获取病理图像的图像特征的，而在另一实施例中，无需执行步骤301-303，能够采取其他方式，获取待分类的病理图像的图像特征。

304、计算机设备对于多个尺度中的每个尺度，从该病理图像的图像特征中提取该尺度对应的多个局部特征，分别将提取到的每个局部特征中的第二子特征进行拼接，得到每个局部特征对应的第一特征向量。

在本申请实施例中，病理图像的图像特征包括位于多个位置上的第二子特征，该第二子特征为一维特征或二维特征，例如，第二子特征包括一个特征值，或者，该第二子特征是由多个特征值构成的特征向量。在该病理图像的图像特征为二维特征的情况下，该第二子特征包括一个特征值；在该病理图像的图像特征为三维特征的情况下，该第二子特征包括多个特征值，即该第二子特征是由多个特征值构成的特征向量。例如，该病理图像的图像特征的特征尺寸为3×3×10，该图像特征包括9个位置上的第二子特征，每个第二子特征是由10个特征值构成的特征向量。

对于多个尺度中的任一尺度，基于该尺度从该病理图像的图像特征中提取到至少一个局部特征，每个局部特征包括位于至少一个位置上的第二子特征。可选地，任一尺度对应有多个局部特征，每个局部特征包括位于多个位置上的第二子特征，不同的局部特征可能包括相同的第二子特征。病理图像的图像特征包括位于3×3个位置上的第二子特征，如图4所示，每个方框相当于一个位置；尺度为2×2，基于该尺度从该病理图像的图像特征401中提取到4个局部特征402，每个局部特征402包括位于4个位置上的第二子特征，即病理图像的图像特征中，左上角4个位置上的第二子特征构成一个局部特征402，右上角四个位置上的第二子特征构成一个局部特征402，左下角四个位置上的第二子特征构成一个局部特征402，右下角四个位置上的第二子特征构成一个局部特征402，左上角的局部特征402与右上角的局部特征402包括两个相同的第二子特征。

对于任一局部特征，将该局部特征中的第二子特征拼接成一个第一特征向量，该第一特征向量的特征尺寸为局部特征中至少一个第二子特征的特征尺寸之和。例如，任一局部特征包括4个第二子特征，每个第二子特征的特征尺寸为为1×3，将4个第二子特征拼接成一个第一特征向量，该局部特征对应的第一特征向量的尺寸为1×12。

在一种可能实现方式中，对于任一尺度，提取该尺度对应的局部特征的过程，包括：基于第二移动步长，将该尺度对应的第二滑动窗口在该病理图像的图像特征上移动，将每次移动后的第二滑动窗口内的至少一个位置上的第二子特征构成一个局部特征。

其中，该尺度对应的第二滑动窗口的尺寸与该尺度相同。可选地，该尺度为第二滑动窗口的边长。例如，该尺度为一维尺度，则该第二滑动窗口的长度和宽度均与该尺度相同；如该尺度为3，该第二滑动窗口的尺寸为3×3。再例如，该尺度为二维尺度，该二维尺度包括长度和宽度，该尺度对应的第二滑动窗口的长度和宽度，分别与二维尺度包括的长度和宽度相等。第二移动步长表示每次移动第二滑动窗口的距离，例如，第二移动步长表示移动第二滑动窗口时每次移动的位置数，如该第二移动步长为1，即每次移动第二滑动窗口时，移动一个位置即可。如图4所示，第二滑动窗口的尺寸为2×2，第二移动步长为1，提取到的每个局部特征402包括位于4个位置上的第二子特征。

可选地，提取任一尺度对应的局部特征的过程包括：确定该尺度对应的扩充参数，基于该扩充参数对该病理图像的图像特征进行扩充，得到扩充后的图像特征，基于第二移动步长，将尺度对应的第二滑动窗口在该病理图像的图像特征上移动，将每次移动后的第二滑动窗口内的至少一个位置上的第二子特征构成一个局部特征。

其中，扩充参数指示扩充病理图像的图像特征中的位置数目，例如，扩充参数为Padding。对于任一尺度对应的扩充参数，将病理图像的图像特征周围扩充出该扩充参数指示的位置数目，以使扩充后的图像特征的特征尺寸变大。例如，在病理图像的图像特征进行扩充后，扩充后的图像特征的特征尺寸中的长度和宽度均增大2倍的扩充参数指示的位置数目。例如，病理图像的图像特征为3×3的特征矩阵，任一尺度对应的扩充参数为1，则扩充后的图像特征为5×5的特征矩阵；任一尺度对应的扩充参数为2，则扩充后的图像特征为7×7的特征矩阵。

可选地，任一尺度为一维尺度，确定该尺度对应的扩充参数的过程包括：确定该尺度与第一数值的差值，将该差值与第二数值的比值确定为该尺度对应的扩充参数。

其中，第一数值和第二数值均为任意的数值，例如，第一数值为1，第二数值为2。

可选地，任一尺度及该尺度对应的扩充参数，满足以下关系：

其中，κ表示尺度，β表示尺度k对应的扩充参数，在本申请实施例中，第一数值为1，第二数值为2。

例如，病理图像的图像特征的特征尺寸为4×4，第一尺度为3，即第一尺度对应的第二滑动窗口的尺寸为3×3，第一尺度对应的第一扩充参数为1，即基于第一扩充参数扩充后的图像特征的特征尺寸为6×6，基于第一尺度对应的第二滑动窗口，能够从中提取到16个特征尺寸为3×3的局部特征；第二尺度为5，即第二尺度对应的第二滑动窗口的尺寸为5×5，第二尺度对应的第二扩充参数为2，即基于第二扩充参数扩充后的图像特征的特征尺寸为8×8，基于第二尺度对应的第二滑动窗口，能够从中提取到16个特征尺寸为5×5的局部特征，即基于第一尺度和第二尺度提取到的局部特征均为16个。

在基于每个尺度从病理图像的图像特征中提取局部特征时，先基于每个尺度对应的扩充参数对病理图像的图像特征进行扩充，以保证基于每个尺度提取到的局部特征的数目相同，以便后续基于多个尺度获取到的特征融合。

在一种可能实现方式中，对于多个尺度中的任一尺度，在得到该尺度对应的每个局部特征所对应的第一特征向量的情况下，将该多个第一特征向量构成该尺度对应的第一特征矩阵。

可选地，对于多个尺度中的任一尺度，该尺度对应的第一特征矩阵及该病理图像的图像特征，满足以下关系：

T＝SoftSplit(E)＝Concat(Unfold(E))

其中，T表示该尺度对应的第一特征矩阵；E表示病理图像的图像特征，SoftSplit(·)表示特征重构函数，用于将病理图像的图像特征E构成该第一特征矩阵；Concat(·)表示拼接函数，用于将多个第一特征向量构成该尺度对应的第一特征矩阵；Unfold(·)表示展开函数，用于将该尺度对应的局部特征中的第二子特征进行拼接成一个第一特征向量；

表示该尺度对应的第一特征矩阵的尺寸为H″W″×k²D，K表示该尺度，K为正整数；该尺度κ对应的每个局部特征的特征尺寸为κ×κ；病理图像的图像特征的特征尺寸为W′×H′×D，W′、H′表示病理图像的图像特征的长度和宽度，D表示病理图像的图像特征中每个第二子特征的维度，W′×H′×D均为任意的正整数；H″表示按照尺度κ从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的H′维度分成的数量；W″表示按照尺度κ从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的W′维度分成的数量；D表示每个第二子特征的向量维度；κ²D表示每个第一特征向量的向量维度；H″W″表示尺度κ对应的多个局部特征的数目，也表示尺度κ对应的多个第一特征向量的数目；β表示尺度κ对应的扩充参数；α表示第二移动步长。

305、计算机设备基于多个局部特征对应的第一特征向量，分别对每个第一特征向量进行更新，得到每个第一特征向量对应的第二特征向量。

在本申请实施例中，对于多个尺度中的任一尺度，该尺度对应有多个局部特征，考虑到不同的局部特征之间具有关联性，在获取到多个局部特征对应的第一特征向量后，通过多个局部特征对应的第一特征向量，对每个第一特征向量进行更新，使得更新得到的第二特征向量中融入了其他局部特征对应的第一特征向量，从而保证第二特征向量的准确性。

在一种可能实现方式中，该步骤305包括：对于多个第一特征向量的目标特征向量，获取每个第一特征向量与该目标特征向量之间的相似度，基于每个第一特征向量对应的相似度，对该多个第一特征向量进行加权融合，得到该目标特征向量对应的第二特征向量。

其中，目标特征向量为多个第一特征向量中的任一第一特征向量。任一第一特征向量与该目标特征向量之间的相似度，表示该第一特征向量与该目标特征向量之间的相似程度，该相似度能够采用余弦相似度或者其他相似度的获取方式来获取。由于每个第一特征向量对应的相似度能够表示该第一特征向量与该目标特征向量之间的相似程度，采取自注意力机制，基于多个第一特征向量与目标特征向量之间的相似度，对该第一特征向量进行加权融合，得到目标特征向量对应的第二特征向量，使得第二特征向量中按照各个第一特征向量对应的相似度融入了多个第一特征向量，以保证得到的第二特征向量的准确性。按照上述获取目标特征向量对应的第二特征向量的方式，即可获取到每个第一特征向量对应的第二特征向量。

可选地，获取目标特征向量对应的第二特征向量的过程包括：对于多个第一特征向量的目标特征向量，获取每个第一特征向量与该目标特征向量之间的相似度，基于每个第一特征向量对应的相似度，对该多个第一特征向量进行加权融合，得到第三特征向量，对该第三特征向量进行特征变换，得到该目标特征向量对应的第二特征向量。

在本申请实施例中，每个第一特征向量与对应的第二特征向量的特征维度不同。对于多个尺度中的每个尺度，不同尺度对应的第二特征向量的特征维度相同。在对每个尺度对应的多个第一特征向量进行更新的过程中，将特征向量转换为相同特征维度的特征向量，以保证后续基于每个尺度得到的聚合特征的特征尺寸相同。

可选地，对第三特征向量进行特征变换的过程包括：将第三特征向量与特征变换矩阵的乘积，确定为该目标特征向量对应的第二特征向量。

其中，特征变换矩阵用于对第三特征向量进行转换，该特征变换矩阵为任意的常数矩阵。

在一种可能实现方式中，对于多个尺度中的任一尺度，该尺度对应的每个局部特征所对应的第一特征向量构成了该尺度对应的第一特征矩阵，则该步骤305包括：基于该第一特征矩阵中的多个第一特征向量，分别对该第一特征矩阵中每个第一特征向量进行更新，得到每个第一特征向量对应的第二特征向量，将多个第二特征向量构成第二特征矩阵。

可选地，对于多个尺度中的任一尺度，该尺度对应的第一特征矩阵及第二特征矩阵，满足以下关系：

MSA(T)＝Concat(H₁,...,H_ω,...,H_Ω)W^O

其中，T′表示该尺度对应的第二特征矩阵；MLP(·)表示多层感知函数，用于对特征进行全连接变换；MSA(·)表示多头自注意力函数；T表示该尺度对应的第一特征矩阵；病理图像的图像特征的特征尺寸为W′×H′×D，W′、H′表示病理图像的图像特征的长度和宽度，D表示病理图像的图像特征中每个第二子特征的维度，W′、H′、D均为任意的正整数；H″表示按照该尺度从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的H维度分成的数量；W″表示按照该尺度从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的W′维度分成的数量；H″W″表示尺度κ对应的多个局部特征的数目，也即是多个第二特征向量的数目；d_z表示每个第二特征向量的向量维度；Concat(·)表示连接函数；Ω表示多头自注意力函数中的头数，Ω为大于1的正整数；H_ω表示多头自注意力函数中任一头输出的特征，ω表示多头自注意力函数中的每个头自注意力的序号，ω为大于0且不大于Ω的正整数；W^O表示映射矩阵，也是常数矩阵；

均为第ω个头自注意力函数中的常数矩阵；A(·)表示多头自注意力函数中第ω个头自注意力函数；k²D表示该尺度对应的第一特征矩阵中每个第一特征向量的向量维度。

306、计算机设备基于该多个局部特征在该病理图像的图像特征中的位置，将多个第二特征向量构成三维特征矩阵，将该三维特征矩阵确定为聚合特征。

其中，不同的局部特征在病理图像的图像特征中的位置不同。任一局部特征对应的第二特征向量为该局部特征在病理图像中对应的位置的像素点的特征，可选地，任一局部特征对应的第二特征向量是该局部特征在病理图像中对应的一个或多个像素点的特征。例如，该病理图像中的图像特征用于表征该病理图像，该病理图像中的任一局部特征是该病理图像中的部分区域中的像素点的特征，该病理图像中的部分区域中的像素点包括一个或多个，则该局部特征对应的第二特征向量是该病理图像中的部分区域中的一个或多个像素点的特征。

按照多个局部特征在病理图像的图像特征中的位置，将多个局部特征对应的第二特征向量构成一个三维特征矩阵，该三维特征矩阵即为一个聚合特征。例如，任一尺度对应的多个局部特征的个数为4，每个局部特征对应的第二特征向量的维度为10，基于该多个局部特征对应的第二特征向量构成的聚合特征的特征尺寸为2×2×10。按照上述步骤304-306的方式，基于多个尺度分别对病理图像的图像特征进行处理，得到多个聚合特征。

在基于每个尺度对病理图像的图像特征进行处理的过程中，将每个局部特征中的第二子特征拼接成一个特征向量，考虑到不同的局部特征之间具有关联性，通过多个局部特征对应的第一特征向量，对每个第一特征向量进行更新，使得更新得到的第二特征向量中融入了其他局部特征对应的第一特征向量，从而保证第二特征向量的准确性，并按照多个局部特征在病理图像的图像特征中的位置，将多个局部特征对应的特征向量构成的三维特征矩阵确定为聚合特征，使得聚合特征中保留个原来的病理图像的图像特征中的位置信息，以保证聚合特征的准确性。

在一种可能实现方式中，不同尺度对应的多个局部特征的数目相同，不同尺度对应的第二特征向量的特征维度相同，则基于不同尺度获取到的聚合特征的特征尺寸相同。

在一种可能实现方式中，对于多个尺度中的任一尺度，该尺度对应的多个第二特征向量构成第二特征矩阵，则步骤306包括：基于该多个局部特征在该病理图像的图像特征中的位置，将第二特征矩阵中多个第二特征向量构成三维特征矩阵，将该三维特征矩阵确定为聚合特征。

可选地，该第二特征矩阵与该聚合特征，满足以下关系：

其中，E′表示基于该尺度得到的聚合特征；Reshape(·)表示重塑函数，用于对第二特征矩阵进行重塑，恢复空间位置信息，得到新的特征图；

表示聚合特征E′的特征尺寸；病理图像的图像特征的特征尺寸为W′×H′×D，W′、H′表示病理图像的图像特征的长度和宽度，D表示病理图像的图像特征中每个第二子特征的维度，W′、H′、D均为任意的正整数；H″表示按照该尺度从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的H′维度分成的数量；W″表示按照该尺度从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的W′维度分成的数量；d_z表示每个第二特征向量的向量维度。

在基于任一尺度获取聚合特征的过程，如图5所示，以病理图像的图像特征为4×4的矩阵为例，任一尺度为3，从病理图像的图像特征中提取4个局部特征501，将每个局部特征501融合成一个第一特征向量502，采取多头注意力机制及多层感知器，按照上述步骤305-306，对每个第一特征向量进行更新，将将多个第二特征向量构成聚合特征503。

需要说明的是，本申请实施例是每个尺度对应有多个局部特征为例进行说明的，而在另一实施例中，任一尺度对应有一个局部特征，则将该尺度对应的局部特征中的子特征进行拼接，得到该局部特征对应的第一特征向量，将该第一特征向量确定为聚合特征。

需要说明的是，本申请实施例是以局部特征包括至少一个位置上的至少一个第二子特征为例，基于多个尺度中的每个尺度及病理图像的图像特征，获取多个聚合特征的，而在另一实施例中，无需执行上述步骤304-306，能够采取其他方式，对于多个尺度中的每个尺度，从该图像特征中提取该尺度对应的至少一个局部特征，将该尺度对应的至少一个局部特征进行聚合，得到聚合特征。

307、计算机设备将得到的多个聚合特征进行拼接，得到拼接图像特征。

在本申请实施例中，基于多个尺度对病理图像的图像特征进行处理，得到多个聚合特征，不同的聚合特征包含了不同尺度对应的特征信息，将该多个聚合特征进行拼接，使得该拼接图像特征包含多个尺度对应的特征信息。

在一种可能实现方式中，该步骤307包括：将该多个聚合特征中处于相同位置的特征进行拼接，得到多个位置对应的特征向量；将该多个位置对应的特征向量构成的三维特征矩阵，确定为该拼接图像特征。

在本申请实施例中，该多个聚合特征的特征尺寸相同，每个聚合特征包括位于多个位置上的特征，每个位置上的特征为一个第二特征向量。对于不同的聚合特征，相同位置上的特征是病理图像中相同位置上的像素点的特征，因此，将多个聚合特征中处于相同位置的特征进行拼接，得到多个位置对应的特征向量。基于多个位置，将多个位置对应的特征向量构成一个三维特征矩阵，将该三维特征矩阵确定为拼接图像特征。

例如，多个尺度包括3个，每个聚合特征的特征尺寸为4×4×10，3个聚合特征拼接得到的拼接图像特征的特征尺寸为4×4×30。

可选地，基于多个聚合特征得到的拼接图像特征满足以下关系：

E″＝Concat(E′₁，E′₂，…，E′_γ)

E″∈R^{H″×W″×C}

C＝γd_z

其中，E″表示拼接图像特征；Concat(·)表示拼接函数；E′₁、E′₂、E′_γ表示基于不同尺度得到的聚合特征，γ表示多个尺度的数目；E″∈R^{H″×W″×C}表示拼接图像特征的特征尺寸为H″×W″×C；病理图像的图像特征的特征尺寸为W′×H′×D，W′、H′表示病理图像的图像特征的长度和宽度，D表示病理图像的图像特征中每个第二子特征的维度，W′、H′、D均为任意的正整数；H″表示按照每个尺度从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的H′维度分成的数量；W″表示按照每个尺度从病理图像的图像特征中提取局部特征时，将病理图像的图像特征的W′维度分成的数量；C表示拼接图像特征中每个第一子特征的特征尺寸；d_z表示每个第二特征向量的向量维度。

308、计算机设备基于拼接图像特征中的多个第一子特征，分别对每个第一子特征进行更新，得到每个第一子特征对应的第一更新特征。

其中，拼接图像特征包括位于多个位置上的第一子特征，即该拼接图像特征包括多个第一子特征，每个第一子特征包含了不同尺度对应的特征信息。在本申请实施例中，不同位置上的第一子特征之间具有关联性，采取自注意力机制，通过多个第一子特征，对每个第一子特征进行更新，使得更新得到的第一更新特征中融入了其他第一子特征，从而保证第一更新特征的准确性。

在一种可能实现方式中，该步骤308：对于该多个第一子特征中的目标子特征，获取该多个第一子特征的权重；基于该多个第一子特征的权重，对该多个第一子特征进行加权融合，得该目标子特征对应的第一更新特征。

其中，任一第一子特征的权重指示该第一子特征与目标子特征之间的关联程度，权重越大，表示该第一子特征与该目标子特征越相关；该权重越小，表示该第一子特征与该目标子特征越不相关。由于每个第一子特征的权重表示该第一子特征与目标子特征之间的关联程度，即按照多个第一子特征与该目标子特征之间的关联程度，将多个第一子特征加权融合为第一更新特征，以保证得到的第一更新特征的准确性。按照上述获取目标子特征对应的第一更新特征的方式，能够获取到每个第一子特征对应的第一更新特征。

可选地，获取每个第一子特征的权重的过程，包括：对于该多个第一子特征中的目标子特征，获取每个第一子特征与该目标子特征之间的距离特征；基于每个第一子特征与该目标子特征之间的相似度及距离特征，获取每个第一子特征的权重。

其中，任一第一子特征与该目标子特征之间的距离特征，指示在拼接图像特征中该第一子特征与该目标子特征所处的位置之间的距离；任一第一子特征与该目标子特征之间的相似度表示该第一子特征与该目标子特征之间的相似程度。

在本申请实施例中，病理图像中不同位置的特征之间可能存在关联。对于任一第一子特征，由于该第一子特征与目标子特征之间的相似度，能够表示该第一子特征与目标子特征之间的相似程度；而该第一子特征与目标子特征之间的距离特征，能够指示该第一子特征与该目标子特征在拼接图像特征中的分布情况，基于该第一子特征与目标子特征之间的相似度及距离特征，获取该第一子特征的权重，不仅考虑到第一子特征与目标在特征之间的相似程度，也考虑到了第一子特征与目标在特征之间的相对位置关系，即充分考虑到了第一子特征与目标在特征之间的关联性，以保证获取到的权重的准确性。

可选地，获取距离特征的过程包括：基于每个第一子特征及目标子特征在该拼接图像特征中的位置，确定每个第一子特征对应的目标距离；分别对每个第一子特征对应的目标距离进行映射处理，得到每个第一子特征与目标子特征之间的距离特征。

其中，任一第一子特征对应的目标距离表示该第一子特征与目标子特征所处的位置之间的距离。每个第一子特征在拼接图像特征中的位置能够以任意的形式表示，例如，每个第一子特征在拼接图像特征中的位置以二维坐标的形式表示。对于任一第一子特征，基于该第一子特征对应的位置及该目标子特征对应的位置，即可确定出两个位置之间的距离，即为该第一子特征对应的目标距离。将该第一子特征对应的目标距离映射为距离特征，以便后续能够基于该距离特征来获取该第一子特征的权重。

可选地，基于每个第一子特征与该目标子特征之间的相似度及距离特征，获取每个第一子特征的权重的过程，包括：对于多个第一子特征中的每个第一子特征，将该第一子特征与该目标子特征之间的相似度及距离特征进行融合，得到该第一子特征对应的第一匹配度；确定多个第一子特征对应的第一匹配度的和值；将每个第一子特征对应的第一匹配度与该和值的比值，分别确定为每个第一子特征的权重。

其中，任一第一子特征对应的第一匹配度指示该第一子特征与目标子特征之间的匹配程度。在获取任一子特征的权重时，先获取每个第一子特征与该目标子特征之间的第一匹配度，并考虑到多个第一子特征与该目标子特征之间的匹配程度，将每个第一子特征对应的第一匹配度与该和值的比值，分别确定为每个第一子特征的权重，以保证与目标子特征越匹配的第一子特征的权重越大，从而保证权重的准确性。

可选地，获取任一第一子特征与该目标子特征之间的第一匹配度的过程包括：将该第一子特征与该目标子特征之间的相似度与距离特征进行融合，得到第二匹配度；对该第二匹配度进行特征变换，得到该第一子特征对应的第一匹配度。

通过先获取第二匹配度，再对第二匹配度进行特征变换，以保证每个第一子特征对应的第一匹配度属于相同的区间内，以便后续对多个第一子特征对应的第一匹配度进行对比。

可选地，对于该多个第一子特征中的目标子特征，任一第一子特征的权重，满足以下关系：

其中，在多个第一子特征中，目标子特征e″_i为多个第一子特征中的第i个第一子特征；任一第一子特征为多个第一子特征中的第j个第一子特征e″_j；a_ij(X，W^Q，W^K)表示第一子特征e″_j的权重；X表示多个第一子特征构成的特征矩阵，W^Q、W^K为常数矩阵；exp(η″_ij)表示第一子特征e″_j对应的第一匹配度；exp(·)表示自然常数e为底的指数函数；η″_ij表示第一子特征e″_j与目标子特征e″_i之间的第二匹配度；

表示多个第一子特征对应的第一匹配度的和值；N表示多个第一子特征的总数目；η″_ij表示多个第一子特征中第k个第一子特征与目标子特征e″_i之间的第二匹配度；

表示第一子特征e″_j与目标子特征e″_i之间的相似度；d″_z为任意的常数；T表示对矩阵的转置；

表示第一子特征e″_j与目标子特征e″_i之间的距离特征；θ(·)表示映射函数，用于将距离映射为距离特征；μ(ρ_i，ρ_j)表示第一子特征e″_j对应的目标距离；ρ_i表示目标子特征e″_i在拼接图像特征中的位置，(r″_i，c″_i)表示目标子特征e″_i在拼接图像特征中的位置的二维坐标；ρ_j表示第一子特征ρ″_j在拼接图像特征中的位置；(r″_j，c″_j)表示第一子特征e″_j在拼接图像特征中的位置的二维坐标。

可选地，目标子特征对应的第一更新特征，满足以下关系：

其中，z_i表示目标子特征对应的第一更新特征；E″表示拼接图像特征；W^Q、W^K、W^V均为常数矩阵；N表示多个第一子特征的总数目；e″_j表示多个第一子特征中的第j个第一子特征；a_ij(X，W^Q，W^K)表示第一子特征e″_j的权重；

表示基于该多个第一子特征的权重，对该多个第一子特征进行加权融合；

表示目标子特征对应的第一更新特征z_i为d_z维度的特征向量，dz为任意的正整数；W^Q，W^K，

表示常数矩阵W^Q、W^K、W^V的尺寸为C×d_z，C、d_z均为任意的正整数。基于拼接图像特征中的多个第一子特征，获取目标子特征对应的第一更新特征的过程，如图6所示。

309、计算机设备基于该多个第一子特征在该拼接图像特征中所处的位置，将该多个第一子特征对应的第一更新特征构成三维特征矩阵，将该三维特征矩阵确定为更新后的拼接图像特征。

其中，第一更新特征为向量，即每个第一子特征对应的第一更新特征为一个向量。通过按照多个第一子特征在拼接图像特征中的位置，将多个第一更新特征构成一个三维特征矩阵，该三维特征矩阵即为更新后的拼接图像特征，使得该更新后的拼接图像特征中保留了不同特征之间的位置信息，以保证更新后的拼接图像特征的准确性。

例如，更新前的拼接图像特征的特征尺寸为3×3×10，每个第一子特征是一个维度为10的特征向量，即更新前的拼接图像特征包括9个位置；每个第一子特征对应的第一更新特征是一个维度为8的特征向量，即多个第一更新特征构成的更新后的拼接图像特征的特征尺寸为3×3×8。

在一种可能实现方式中，更新后的拼接图像特征满足以下关系：

Z＝(z₁，z₂，...，z_N)

其中，Z表示更新后的拼接图像特征，z₁、z₂、z_N分别表示更新后的拼接图像特征中的第一个第一更新特征、第二个第一更新特征及第N个第一更新特征，N表示多个第一更新特征的总数目，N为大于1的正整数。

在一种可能实现方式中，按照上述步骤308-309，基于该拼接图像特征，获取更新后的拼接图像特征的过程，满足以下关系：

SETL(E″)＝MLP(MSA^SET(LN(E″)))

E″＝(e″₁，e″₂，…，e″_H″W″)

其中，SETL(E″)表示更新后的拼接图像特征；E″表示拼接图像特征；LN(·)表示线性变换函数；MSA^SET(·)表示多头自注意力函数，用于按照上述步骤308获取每个第一子特征对应的第一更新特征；MLP(·)表示多层感知函数，用于对特征进行全连接变换；e″₁、e″₂、e″_H″W″表示拼接图像特征中的第一子特征；H″W″表示拼接图像特征中多个第一子特征的总数目。

需要说明的是，本申请实施例是以第一更新特征为向量为例来说明的，而在另一实施例中，第一更新特征不是向量，则无需执行步骤309，能够采取其他方式，基于该多个第一子特征在拼接图像特征中所处的位置，将该多个第一子特征对应的第一更新特征构成更新后的拼接图像特征。例如，第一更新特征包括一个特征元素，则基于该多个第一子特征在拼接图像特征中所处的位置，将该多个第一子特征对应的第一更新特征构成一个二维特征矩阵，将该二维特征矩阵确定为更新后的拼接图像特征。

310、计算机设备对该更新后的拼接图像特征进行分类，得到该病理图像所属的类别。

由于该更新的拼接图像特征中的每个第一更新特征，不仅融入了不同尺度的局部特征中的特征，还按照整个拼接图像特征中各个位置上的第一子特征之间的关联程度，融合了整个拼接图像特征中各个位置上的第一子特征，丰富了更新后的拼接图像特征，从而保证了更新后的拼接图像特征的准确性，通过对该更新后的拼接特征进行分类，保证了确定的类别的准确性。

在一种可能实现方式中，该病理图像所属的类别指示病理图像中的目标区域所处的状态。

在一种可能实现方式中，该步骤310包括：对该更新后的拼接图像特征进行分类，得到分类特征向量，将分类特征向量中最大概率对应的类别，确定为该病理图像所属的类别。

在本申请实施例中，分类特征向量包括多个维度的概率，每个维度的概率指示该病理图像属于该维度对应的类别的可能性。通过对更新后的拼接图像特征进行分类，得到分类特征向量，以指示该病理图像属于多种类别的可能性，将分类特征向量中最大概率对应的类别，确定为病理图像所属的类别，以保证确定的类别的准确性。

在一种可能实现方式中，该更新后的拼接图像特征及该病理图像所属的类别，满足以下关系：

Y＝Φ(SETL(E″))

其中，Y表示该病理图像所属的类别；SETL(E″)表示更新后的拼接图像特征；E″表示拼接图像特征；Φ(·)表示分类函数。

需要说明的是，本申请实施例在获取到拼接图像特征后，按照上述步骤308-309对拼接图像特征进行更新，直接对更新后的图像特征进行分类，得到病理图像所属的类别的，而在另一实施例中，在步骤309之后，还能够按照上述步骤308-309对更新后的拼接图像再次进行更新，能够重复执行多次，在最后一次得到更新后的拼接图像特征后，对最后一次得到的更新后的拼接图像特征进行分类，得到该病理图像所属的类别。在得到拼接图像特征后，考虑到不同位置上的特征之间的关联性，通过对拼接图像特征进行多次更新，以使拼接图像特征中不同位置上的特征能够得到充分融合，使得最终得到的更新后的拼接图像特征不同特征之间的位置信息，以保证更新后的拼接图像特征的准确性。

在一种可能实现方式中，在得到拼接图像特征后，对拼接图像特征进行多次更新，对最后一次得到的更新后的拼接图像特征进行分类，得到该病理图像所属的类别的过程，满足以下关系：

其中，Y表示该病理图像所属的类别；SETL(E″)表示对拼接后的图像特征进行一次更新后，得到的更新后的拼接图像特征；E″表示拼接图像特征；M表示对拼接图像特征进行更新的次数，M为任意的正整数，例如，M为6；Φ(·)表示分类函数。

需要说明的是，本申请实施例提供的方法，能够适用于多种类型的病理图像的分类任务，如癌症分类，淋巴结转移和基因突变预测等。如对于任一种癌症类型对应的病理图像，基于本申请实施例提供的方法，能够确定病理图像对应的癌变区域对应的状态。

并且，通过先将病理图像分割成多个小尺寸的子图像，在获取到每个子图像的图像特征后，再采取拼接的方式，将多个子图像的图像特征拼接成病理图像的图像特征，无需直接对大尺寸的病理图像进行特征提取，从而降低了对设备性能的需要，能够在多种设备上实现，以保证此种特征提取方式的通用性。

并且，在基于每个尺度对病理图像的图像特征进行处理的过程中，将每个局部特征中的第二子特征拼接成一个特征向量，考虑到不同的局部特征之间具有关联性，通过多个局部特征对应的第一特征向量，对每个第一特征向量进行更新，使得更新得到的第二特征向量中融入了其他局部特征对应的第一特征向量，从而保证第二特征向量的准确性，并按照多个局部特征在病理图像的图像特征中的位置，将多个局部特征对应的特征向量构成的三维特征矩阵确定为聚合特征，使得聚合特征中保留了原来的病理图像的图像特征中的位置信息，以保证聚合特征的准确性。

并且，由于该更新的拼接图像特征中的每个第一更新特征，不仅融入了不同尺度的局部特征中的特征，还按照整个拼接图像特征中各个位置上的第一子特征之间的关联程度，融合了整个拼接图像特征中各个位置上的第一子特征，丰富了更新后的拼接图像特征，从而保证了更新后的拼接图像特征的准确性，通过对该更新后的拼接特征进行分类，保证了确定的类别的准确性。

需要说明的是，上述图3所示的实施例是在得到拼接图像特征后，先基于拼接图像特征中位于多个位置上的第一子特征对每个第一子特征进行更新，得到更新后的拼接图像特征，再对更新后的拼接图像特征进行分类的，而在另一实施例中，无需执行步骤308-310，在得到拼接图像特征后，能够采取其他方式，对该拼接图像特征进行分类，得到该病理图像所属的类别。

在一种可能实现方式中，在获取到拼接图像特征之后，基于该拼接图像特征获取病理图像所属的类别的过程，包括以下步骤1-步骤3：

步骤1、计算机设备将该拼接图像特征中每个第一子特征与对应的位置特征进行融合，得到每个第一子特征对应的第二更新特征。

在本申请实施例中，拼接图像特征包括位于多个位置上的第一子特征；任一第一子特征对应的位置特征指示该第一子特征在拼接图像特征中所处的位置，该位置特征能够以任意的形式表示，例如，该位置特征以向量的形式表示，或者，该位置特征以坐标的形式表示。

每个第二更新特征是由对应的第一子特征与对应的位置特征融合得到的，以增强拼接图像特征中各个第一子特征之间得空间信息，增强不同的第一子特征之间的区别，以提升得到的第二更新特征的准确性。

步骤2、计算机设备基于多个第一子特征在该拼接图像特征中所处的位置，将该多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。

在对每个第一子特征进行更新后，每个第二更新特征中融入了对应的第一子特征的位置特征，以增强不同的第一子特征之间的区别，按照多个第一子特征在拼接图像特征中所处的位置，将多个第二更新特征按照多个第一子特征之间的位置排布，构成更新后的拼接图像特征，更新后的拼接图像特征包括位于多个位置上的第二更新特征。由于更新后的拼接图像特征中各个第二更新特征中融入了各自的位置特征，增强不同的第一子特征之间的区别，从而提升更新后的拼接图像特征的准确性。

在一种可能实现方式中，第二更新特征为向量；该步骤2包括：基于多个第一子特征在拼接图像特征中所处的位置，将该多个第一子特征对应的第二更新特征构成三维特征矩阵，将该三维特征矩阵确定为更新后的拼接图像特征。

在本申请实施例中，第一子特征为向量，将每个第一子特征与对应的位置特征融合后，得到的第二更新特征也为向量。其中，任一第一子特征与对应的第二更新特征的维度可能相同，也可能不同。例如，拼接图像特征的特征尺寸为3×3×10，即该拼接图像特征包括9个第一子特征，每个第一子特征是一个10维的特征向量；在每个第一子特征与对应的第二更新特征的维度相同的情况下，将9个第二更新特征拼接得到的更新后的拼接图像特征的特征尺寸为3×3×10；在每个第一子特征与对应的第二更新特征的维度不同的情况下，每个第二更新特征的维度为20，将9个第二更新特征拼接得到的更新后的拼接图像特征的特征尺寸为3×3×20。

步骤3、计算机设备对该更新后的拼接图像特征进行分类，得到该病理图像所属的类别。

其中，该步骤3与上述步骤310同理，在此不再赘述。

本申请实施例提供的方法，在得到拼接图像特征后，通过将拼接图像特征中每个第一子特征与对应的位置特征进行融合，得到每个第一子特征对应的第二更新特征，以增强不同的第一子特征之间的区别，使得到的更新后的拼接图像特征中各个第二更新特征中融入了各自的位置特征，增强不同的第一子特征之间的区别，从而提升更新后的拼接图像特征的准确性，基于该更新后的拼接图像特征进行分类，以保证确定的类别的准确性。

需要说明的是，上述对拼接图像特征进行更新，获取更新后的拼接图像特征的多种方式能够任意结合，在一种可能实现方式中，在获取到拼接图像特征之后，基于拼接图像特征，获取病理图像所属的类别的过程，包括以下步骤4-步骤8：

步骤4、计算机设备将拼接图像特征中每个第一子特征与对应的位置特征进行融合，得到每个第一子特征对应的第二更新特征。

该步骤4与上述步骤1同理，在此不再赘述。

步骤5、计算机设备基于多个第一子特征在拼接图像特征中所处的位置，将多个第一子特征对应的第二更新特征构成第一拼接图像特征。

其中，第一拼接图像特征相当于上述步骤2中得到的更新后的拼接图像特征，该步骤5与上述步骤2同理，在此不再赘述。

步骤6、计算机设备基于多个第二更新特征，分别对每个第二更新特征进行更新，得到所述每个第二更新特征对应的第三更新特征。

其中，该步骤6与上述步骤308同理，在此不再赘述。

步骤7、计算机设备基于多个第二更新特征在第一拼接图像特征中所处的位置，将多个第三更新特征构成第二拼接图像特征。

在本申请实施例中，每个第三更新特征可能包括一个特征元素，也可能是向量。在每个第三更新特征包括一个特征元素的情况下，多个第二更新特征在第一拼接图像特征中所处的位置，将多个第三更新特征构成一个二维特征矩阵，将该二维特征矩阵确定为第二拼接图像特征；在每个第三更新特征为向量的情况下，该步骤7与上述步骤309同理，在此不再赘述。

步骤8、计算机设备对第二拼接图像特征进行分类，得到病理图像所属的类别。

其中，该步骤与上述步骤310同理，在此不再赘述。

本申请实施例提供的方法，在对拼接图像特征进行更新的过程中，对于拼接图像特征中每个位置上的特征，不仅融入了对应的位置信息，还融入了各个位置上的第一子特征之间的关联程度，在每个位置上的特征中融入了各个位置上的特征，即不仅考虑到拼接图像特征中各个位置上的特征的绝对位置信息，还考虑到了不同位置之间的相对位置关系，能够兼顾病理图像中的局部信息和全局信息捕捉的从而提升了第二拼接图像特征的准确性，通过对该更新后的拼接特征进行分类，保证了确定的类别的准确性。

需要说明的是，在上述图2和图3所示的实施例的基础上，还能够基于分类模型对病理图像进行分类，得到该病理图像所属的类别。

在一种可能实现方式中，分类模型包括特征提取子模型及分类子模型，该分类子模型包括绝对位置编码层、至少一个空间编码器及线性层。基于分类模型对病理图像进行分类的流程如图7所示，基于特征提取子模型，按照上述步骤301-303，将待分类的病理图像分割成多个子图像，之后分别提取每个子图像的图像特征，在将多个子图像的图像特征拼接成病理图像的图像特征。

基于分类子模型，按照上述步骤304-306，利用多个尺度，获取多个聚合特征；之后，按照上述步骤307，将多个聚合特征进行拼接，得到拼接图像特征。

基于该绝对位置编码层将拼接图像特征中每个第一子特征与对应的位置特征进行融合，得到每个第一子特征对应的第二更新特征，基于多个第一子特征在拼接图像特征中所处的位置，将拼接图像特征中多个第一子特征对应的第二更新特征构成第一拼接图像特征。

基于第一个空间编码器，按照上述步骤308-309，基于第一拼接图像特征中的多个第二更新特征，分别对每个第二更新特征进行更新，得到每个第二更新特征对应的第三更新特征；基于多个第二更新特征在第一拼接图像特征中所处的位置，将多个第三更新特征构成第二拼接图像特征。

基于第q个空间编码器，按照上述步骤308-309，对第q-1个空间编码器输出的拼接图像特征再次进行更新，直至最后一个空间编码器输出更新后的拼接图像特征，其中，q为大于1的整数。

基于分类子模型中的线性层，对最后一个空间编码器输出的更新后的拼接图像特征进行分类，得到该病理图像所属的类别。

可选地，每个空间编码器包括规范化层、多头注意力层、融合层及多层感知器。

以第一个空间编码器为例，基于规范化层，对第一拼接图像特征进行特征变换，得到变换后的第一拼接图像特征；基于多头自注意力层，按照上述步骤308-309，变换后的第一拼接图像特征进行处理，得到更新后的第一拼接图像特征；基于第一个融合层，将第一拼接图像特征与更新后的第一拼接图像特征进行融合，得到融合图像特征，以增强融合图像特征的准确性，基于第二个规范化层，对融合图像特征进行特征变换，得到变换后的融合图像特征；基于多层感知器，对变换后的融合图像特征进行映射，得到映射特征，将映射特征与变换后的融合图像特征进行融合，得到第二拼接图像特征。

需要说明的是，在上述基于分类模型对病理图像进行分类之前，还需要对分类模型进行训练，以分类模型包括特征提取子模型及分类子模型为例，训练分类模型的过程，包括以下步骤1-4：

步骤1、获取样本病理图像及样本标签，该样本标签指示样本病理图像所属的类别。

其中，该样本病理图像用于呈现机体器官、组织或细胞的病理形态的病理图像，该样本标签指示的类别即为该样本病理图像所属的类别。

步骤2、基于特征提取子模型，获取该样本病理图像的样本图像特征。

其中，该步骤2与上述步骤301-303同理，在此不再赘述。

步骤3、基于该分类子模型，对于多个尺度中的每个尺度，从该样本图像特征中提取该尺度对应的至少一个样本局部特征，将该尺度对应的至少一个样本局部特征进行聚合，得到样本聚合特征；将得到的多个样本聚合图像特征进行拼接，得到样本拼接图像特征；对该样本拼接图像特征进行分类，得到该样本病理图像所属的预测标签，该预测标签指示预测到该样本病理图像所属的类别。

其中，该步骤3与上述步骤304-310同理，在此不再赘述。

步骤4、基于该预测标签及该样本标签，对该分类模型进行训练。

由于该预测标签指示基于分类模型预测到的该样本病理图像所属的类别，该样本标签指示该样本病理图像所属的类别，该预测标签与该样本标签进行对比，能够反映出分类模型的准确率，基于该预测标签及该样本标签，对该分类模型进行训练，以提升分类模型的准确性。

在一种可能实现方式中，该步骤4包括：基于该预测标签及该样本标签确定损失值，基于该损失值对该分类模型进行训练。

其中，该损失值表示该预测标签与该样本标签之间的差异程度。基于该损失值对该分类模型进行训练，以提升分类模型的准确性。

在一种可能实现方式中，基于多个样本病理图像及对应的样本标签，按照上述步骤1-4，对分类模型进行多轮迭代训练，在当前迭代中得到的损失值小于损失值阈值的情况下，停止训练分类模型；或者，在迭代次数达到目标次数的情况下，停止训练分类模型。

通过设置训练分类模型的损失值阈值或目标次数，以使训练的分类模型尽可能准确，保证了训练得到的分类模型的准确性。

需要说明的是，在上述对分类模型训练的过程中，该特征提取子模型能够是已经预训练的任意的图像特征提取模型，例如，该特征提取子模型为ResNet(Residual NeuralNetwork，残差神经网络)、DenseNet(Densely Connected Convolutional Networks，密接卷积网络)或Inception Networks(初始网络)等。在该特征提取子模型的基础上，将该特征提取子模型及分类子模型构成分类模型，按照上述步骤1-4对分类模型进行训练，以节省训练所需时长，也能保证分类模型的准确性。

基于本申请实施例提供的分类模型，与相关技术中多种分类模型进行对比。相关技术中的分类模型包括RNN-MIL(Recurrent Neural Network-Multiple InstanceLearning，循环神经网络-多示例学习)、CNN-MIL(Convolution Neural Network-MultipleInstance Learning，卷积神经网络-多示例学习)ViT-MIL(Vision Transformer-MultipleInstance Learning，视觉转换器-多示例学习)。如表1所示，在多种不同的数据集中，基于多种不同的分类任务，将本申请实施例提供的分类模型，与相关技术中多种分类模型进行对比。本申请实施例提供的分类模型，在前两种数据集上能够达到90％以上的AUC(AreaUnder Curve，特征曲线下与坐标轴围成的面积)，在肺腺癌-基因突变数据集上，能够达到90％以上的AUC。基于表1能够获知，本申请提供的分类模型比相关技术中的分类模型性能更好。

表1

本申请实施例提供的分类模型包括位置编码层、基于编码器的金字塔多尺度融合和空间编码器。例如，基于编码器的金字塔多尺度融合为TPMF(Transformer-basedPyramid Multi-Scale Fusion)；空间编码器为SET(Spatial Encoding Transformer)为了基于本申请提供的分类模型来进行图像分类时，分类模型中各个部分的重要程度，在4种不同的数据集上对分类模型进行测试，如表2所示，基于表2中的数据可知，本申请提供的分类模型中各个部分均重要，基于各个部分组成的分类模型具有更高的分类性能。

表2

在本申请实施例提供的方法中，通过多种不同的位置编码策略，对分类模型的性能进行评估。在4种不同的数据集上对分类模型进行测试时，设置了两种位置编码策略配置：一种是绝对位置编码，另一种是相对位置编码。基于表3可知，同时使用绝对位置编码和相对位置编码机制能够提升图像分类的准确性。

表3

图8是本申请实施例提供的一种图像分类装置的结构示意图，如图8所示，该装置包括：

获取模块801，用于获取待分类的病理图像的图像特征；

聚合模块802，用于对于多个尺度中的每个尺度，从图像特征中提取尺度对应的至少一个局部特征，将尺度对应的至少一个局部特征进行聚合，得到聚合特征；

拼接模块803，用于将得到的多个聚合特征进行拼接，得到拼接图像特征；

分类模块804，用于对拼接图像特征进行分类，得到病理图像所属的类别。

在一种可能实现方式中，拼接图像特征包括位于多个位置上的第一子特征；如图9所示，分类模块804，包括：

更新单元8041，用于基于多个第一子特征，分别对每个第一子特征进行更新，得到每个第一子特征对应的第一更新特征；

构成单元8042，用于基于多个第一子特征在拼接图像特征中所处的位置，将多个第一子特征对应的第一更新特征构成更新后的拼接图像特征；

分类单元8043，用于对更新后的拼接图像特征进行分类，得到病理图像所属的类别。

在另一种可能实现方式中，更新单元8041，用于对于多个第一子特征中的目标子特征，获取多个第一子特征的权重，权重指示对应的第一子特征与目标子特征之间的关联程度；基于多个第一子特征的权重，对多个第一子特征进行加权融合，得到目标子特征对应的第一更新特征。

在另一种可能实现方式中，更新单元8041，用于对于多个第一子特征中的目标子特征，获取每个第一子特征与目标子特征之间的距离特征，距离特征指示在拼接图像特征中第一子特征与目标子特征所处的位置之间的距离；基于每个第一子特征与目标子特征之间的相似度及距离特征，获取每个第一子特征的权重。

在另一种可能实现方式中，更新单元8041，用于基于每个第一子特征及目标子特征在拼接图像特征中的位置，确定每个第一子特征对应的目标距离，目标距离表示第一子特征与目标子特征所处的位置之间的距离；分别对每个第一子特征对应的目标距离进行映射处理，得到每个第一子特征与目标子特征之间的距离特征。

在另一种可能实现方式中，第一更新特征为向量；构成单元8042，用于基于多个第一子特征在拼接图像特征中所处的位置，将多个第一子特征对应的第一更新特征构成三维特征矩阵，将三维特征矩阵确定为更新后的拼接图像特征。

在另一种可能实现方式中，拼接图像特征包括位于多个位置上的第一子特征；如图9所示，装置还包括：

融合模块805，用于将每个第一子特征与对应的位置特征进行融合，得到每个第一子特征对应的第二更新特征，位置特征指示对应的第一子特征在拼接图像特征中所处的位置；

构成模块806，用于基于多个第一子特征在拼接图像特征中所处的位置，将多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。

在另一种可能实现方式中，第二更新特征为向量；构成模块806，用于基于多个第一子特征在拼接图像特征中所处的位置，将多个第一子特征对应的第二更新特征构成三维特征矩阵，将三维特征矩阵确定为更新后的拼接图像特征。

在另一种可能实现方式中，局部特征包括位于至少一个位置上的至少一个第二子特征；聚合模块802，用于分别将提取到的每个局部特征中的第二子特征进行拼接，得到每个局部特征对应的第一特征向量；基于多个局部特征对应的第一特征向量，分别对每个第一特征向量进行更新，得到每个第一特征向量对应的第二特征向量；基于多个局部特征在图像特征中的位置，将多个第二特征向量构成三维特征矩阵，将三维特征矩阵确定为聚合特征。

在另一种可能实现方式中，获取模块801，用于对病理图像进行分割，得到多个子图像；分别对每个子图像进行特征提取，得到每个子图像的图像特征；基于多个子图像在病理图像中的位置，将多个子图像的图像特征进行拼接，得到病理图像的图像特征。

在另一种可能实现方式中，多个聚合特征的特征尺寸相同；拼接模块803，用于将多个聚合特征中处于相同位置的特征进行拼接，得到多个位置对应的特征向量；将多个位置对应的特征向量构成的三维特征矩阵，确定为拼接图像特征。

在另一种可能实现方式中，获取待分类的病理图像的图像特征；对于多个尺度中的每个尺度，从图像特征中提取尺度对应的至少一个局部特征，将尺度对应的至少一个局部特征进行聚合，得到聚合特征；将得到的多个聚合特征进行拼接，得到拼接图像特征；对拼接图像特征进行分类，得到病理图像所属的类别的步骤是基于分类模型实现的。

在另一种可能实现方式中，分类模型包括特征提取子模型及分类子模型；如图9所示，装置还包括：

获取模块801，还用于获取样本病理图像及样本标签，样本标签指示样本病理图像所属的类别；

获取模块801，还用于基于特征提取子模型，获取样本病理图像的样本图像特征；

预测模块807，用于基于分类子模型，对于多个尺度中的每个尺度，从样本图像特征中提取尺度对应的至少一个样本局部特征，将尺度对应的至少一个样本局部特征进行聚合，得到样本聚合特征；将得到的多个样本聚合图像特征进行拼接，得到样本拼接图像特征；对样本拼接图像特征进行分类，得到样本病理图像所属的预测标签，预测标签指示预测到样本病理图像所属的类别；

训练模块808，用于基于预测标签及样本标签，对分类模型进行训练。

需要说明的是：上述实施例提供的图像分类装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将计算机设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的图像分类装置与图像分类方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本申请实施例还提供了一种计算机设备，该计算机设备包括处理器和存储器，存储器中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行以实现上述实施例的图像分类方法所执行的操作。

可选地，计算机设备提供为终端。图10示出了本申请一个示例性实施例提供的终端1000的结构框图。该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等。

终端1000包括有：处理器1001和存储器1002。

处理器1001可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field-Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1001可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1001还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1002可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1002中的非暂态的计算机可读存储介质用于存储至少一个计算机程序，该至少一个计算机程序用于被处理器1001所执行以实现本申请中方法实施例提供的图像分类方法。

在一些实施例中，终端1000还可选包括有：外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地，外围设备包括：射频电路1004、显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。

外围设备接口1003可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中，处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上；在一些其他实施例中，处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1004用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1004包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1004还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1005用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时，显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时，显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1005可以为一个，设置在终端1000的前面板；在另一些实施例中，显示屏1005可以为至少两个，分别设置在终端1000的不同表面或呈折叠设计；在另一些实施例中，显示屏1005可以是柔性显示屏，设置在终端1000的弯曲表面上或折叠面上。甚至，显示屏1005还可以设置成非矩形的不规则图形，也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-EmittingDiode，有机发光二极管)等材质制备。

摄像头组件1006用于采集图像或视频。可选地，摄像头组件1006包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1001进行处理，或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1007还可以包括耳机插孔。

定位组件1008用于定位终端1000的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件1008可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源1009用于为终端1000中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1000还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于：加速度传感器1011、陀螺仪传感器1012、压力传感器1010、光学传感器1014以及接近传感器1015。

加速度传感器1011可以检测以终端1000建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号，控制显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1012可以检测终端1000的机体方向及转动角度，陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端1000的3D动作。处理器1001根据陀螺仪传感器1012采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1010可以设置在终端1000的侧边框和/或显示屏1005的下层。当压力传感器1010设置在终端1000的侧边框时，可以检测用户对终端1000的握持信号，由处理器1001根据压力传感器1010采集的握持信号进行左右手识别或快捷操作。当压力传感器1010设置在显示屏1005的下层时，由处理器1001根据用户对显示屏1005的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

光学传感器1014用于采集环境光强度。在一个实施例中，处理器1001可以根据光学传感器1014采集的环境光强度，控制显示屏1005的显示亮度。具体地，当环境光强度较高时，调高显示屏1005的显示亮度；当环境光强度较低时，调低显示屏1005的显示亮度。在另一个实施例中，处理器1001还可以根据光学传感器1014采集的环境光强度，动态调整摄像头组件1006的拍摄参数。

接近传感器1015，也称距离传感器，设置在终端1000的前面板。接近传感器1015用于采集用户与终端1000的正面之间的距离。在一个实施例中，当接近传感器1015检测到用户与终端1000的正面之间的距离逐渐变小时，由处理器1001控制显示屏1005从亮屏状态切换为息屏状态；当接近传感器1015检测到用户与终端1000的正面之间的距离逐渐变大时，由处理器1001控制显示屏1005从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图10中示出的结构并不构成对终端1000的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

可选地，计算机设备提供为服务器。图11是本申请实施例提供的一种服务器的结构示意图，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)1101和一个或一个以上的存储器1102，其中，存储器1102中存储有至少一条计算机程序，至少一条计算机程序由处理器1101加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行以实现上述实施例的图像分类方法所执行的操作。

本申请实施例还提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述方面所述的图像分类方法所执行的操作。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请实施例的可选实施例，并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种图像分类方法，其特征在于，所述方法包括：

获取待分类的病理图像的图像特征；

将得到的多个聚合特征进行拼接，得到拼接图像特征；

2.根据权利要求1所述的方法，其特征在于，所述拼接图像特征包括位于多个位置上的第一子特征；所述对所述拼接图像特征进行分类，得到所述病理图像所属的类别，包括：

基于多个第一子特征，分别对每个第一子特征进行更新，得到所述每个第一子特征对应的第一更新特征；

基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第一更新特征构成更新后的拼接图像特征；

对所述更新后的拼接图像特征进行分类，得到所述病理图像所属的类别。

3.根据权利要求2所述的方法，其特征在于，所述基于多个第一子特征，分别对每个第一子特征进行更新，得到所述每个第一子特征对应的第一更新特征，包括：

对于所述多个第一子特征中的目标子特征，获取所述多个第一子特征的权重，所述权重指示对应的第一子特征与所述目标子特征之间的关联程度；

基于所述多个第一子特征的权重，对所述多个第一子特征进行加权融合，得到所述目标子特征对应的第一更新特征。

4.根据权利要求3所述的方法，其特征在于，所述对于所述多个第一子特征中的目标子特征，获取所述多个第一子特征的权重，包括：

对于所述多个第一子特征中的目标子特征，获取所述每个第一子特征与所述目标子特征之间的距离特征，所述距离特征指示在所述拼接图像特征中所述第一子特征与所述目标子特征所处的位置之间的距离；

基于所述每个第一子特征与所述目标子特征之间的相似度及所述距离特征，获取所述每个第一子特征的权重。

5.根据权利要求4所述的方法，其特征在于，所述对于所述多个第一子特征中的目标子特征，获取所述每个第一子特征与所述目标子特征之间的距离特征，包括：

基于所述每个第一子特征及所述目标子特征在所述拼接图像特征中的位置，确定所述每个第一子特征对应的目标距离，所述目标距离表示所述第一子特征与所述目标子特征所处的位置之间的距离；

分别对所述每个第一子特征对应的目标距离进行映射处理，得到所述每个第一子特征与所述目标子特征之间的距离特征。

6.根据权利要求2所述的方法，其特征在于，所述第一更新特征为向量；所述基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第一更新特征构成更新后的拼接图像特征，包括：

基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第一更新特征构成三维特征矩阵，将所述三维特征矩阵确定为所述更新后的拼接图像特征。

7.根据权利要求1所述的方法，其特征在于，所述拼接图像特征包括位于多个位置上的第一子特征；所述对所述拼接图像特征进行分类，得到所述病理图像所属的类别之前，所述方法还包括：

将每个第一子特征与对应的位置特征进行融合，得到所述每个第一子特征对应的第二更新特征，所述位置特征指示对应的第一子特征在所述拼接图像特征中所处的位置；

基于多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第二更新特征构成更新后的拼接图像特征。

8.根据权利要求7所述的方法，其特征在于，所述第二更新特征为向量；所述基于多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第二更新特征构成更新后的拼接图像特征，包括：

基于所述多个第一子特征在所述拼接图像特征中所处的位置，将所述多个第一子特征对应的第二更新特征构成三维特征矩阵，将所述三维特征矩阵确定为所述更新后的拼接图像特征。

9.根据权利要求1所述的方法，其特征在于，所述局部特征包括位于至少一个位置上的至少一个第二子特征；所述将所述尺度对应的至少一个局部特征进行聚合，得到聚合特征，包括：

分别将提取到的每个局部特征中的第二子特征进行拼接，得到所述每个局部特征对应的第一特征向量；

基于多个局部特征对应的第一特征向量，分别对每个第一特征向量进行更新，得到所述每个第一特征向量对应的第二特征向量；

基于所述多个局部特征在所述图像特征中的位置，将多个第二特征向量构成三维特征矩阵，将所述三维特征矩阵确定为所述聚合特征。

10.根据权利要求1所述的方法，其特征在于，所述多个聚合特征的特征尺寸相同；所述将得到的多个聚合特征进行拼接，得到拼接图像特征，包括：

将多个聚合特征中处于相同位置的特征进行拼接，得到多个位置对应的特征向量；

将所述多个位置对应的特征向量构成的三维特征矩阵，确定为所述拼接图像特征。

11.根据权利要求1-10任一所述的方法，其特征在于，所述获取待分类的病理图像的图像特征；对于多个尺度中的每个尺度，从所述图像特征中提取所述尺度对应的至少一个局部特征，将所述尺度对应的至少一个局部特征进行聚合，得到聚合特征；将得到的多个聚合特征进行拼接，得到拼接图像特征；对所述拼接图像特征进行分类，得到所述病理图像所属的类别的步骤是基于分类模型实现的。

12.根据权利要求11所述的方法，其特征在于，所述分类模型包括特征提取子模型及分类子模型；所述方法还包括：

获取样本病理图像及样本标签，所述样本标签指示所述样本病理图像所属的类别；

基于所述特征提取子模型，获取所述样本病理图像的样本图像特征；

基于所述分类子模型，对于所述多个尺度中的每个尺度，从所述样本图像特征中提取所述尺度对应的至少一个样本局部特征，将所述尺度对应的至少一个样本局部特征进行聚合，得到样本聚合特征；将得到的多个样本聚合图像特征进行拼接，得到样本拼接图像特征；对所述样本拼接图像特征进行分类，得到所述样本病理图像所属的预测标签，所述预测标签指示预测到所述样本病理图像所属的类别；

基于所述预测标签及所述样本标签，对所述分类模型进行训练。

13.一种图像分类装置，其特征在于，所述装置包括：

获取模块，用于获取待分类的病理图像的图像特征；

14.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至12任一权利要求所述的图像分类方法所执行的操作。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至12任一权利要求所述的图像分类方法所执行的操作。

16.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至12任一权利要求所述的图像分类方法所执行的操作。