CN117422911B

CN117422911B - 一种协同学习驱动的多类别全切片数字病理图像分类系统

Info

Publication number: CN117422911B
Application number: CN202311366788.3A
Authority: CN
Inventors: 王宽全; 孙鹏重; 骆功宁; 王玮; 李向宇; 董素宇; 李钦策; 袁永峰
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2023-10-20
Filing date: 2023-10-20
Publication date: 2024-04-30
Anticipated expiration: 2043-10-20
Also published as: CN117422911A

Abstract

一种协同学习驱动的多类别全切片数字病理图像分类系统，它属于医学图像分析技术领域。本发明解决了现有方法仅关注二分类且无法捕捉类相关语义信息的问题。本发明首先获取待分类的全切片数字病理图像，再对图像进行预处理，获取前景组织区域图像并将前景组织区域图像分割为子图像补丁；对子图像补丁进行编码，根据编码结果得到补丁特征令牌；设置分类令牌，根据补丁特征令牌和分类令牌进行计算，再根据计算结果生成类激活图，并根据类激活图得到类别的热力图。本发明可以应用于数字病理图像分类。

Description

一种协同学习驱动的多类别全切片数字病理图像分类系统

技术领域

本发明属于医学图像分析技术领域，具体涉及一种协同学习驱动的多类别全切片数字病理图像分类系统。

背景技术

全切片数字病理图像分析在现代医学诊断中起着至关重要的作用。全切片数字病理图像分析技术不仅改变了传统显微镜下病理诊断的局限性，还为大规模数据分析和自动化诊断提供了新的可能性。全切片图像(Whole Slide Images,WSIs)通常包含大量的信息和细节，这些信息对于准确诊断和疾病分期至关重要。例如，全切片图像能够展示肿瘤细胞的形态、大小、数量以及与周围组织的相互作用，这些都是传统病理学无法或难以捕捉的。

近年来，基于深度学习的全切片数字病理图像分析方法取得了快速的进展，在各种应用场景中表现出色。然而当前的方法存在以下两方面问题：

(1)通常只关注阴性/阳性、是否含有肿瘤等二分类任务，然而多分类任务广泛存在，如前列腺癌分级(ISUP评级从0到5)、乳腺癌分型(正常、病理性良性、常见导管增生、扁平上皮异型性、非典型导管增生、导管原位癌和浸润性癌)等；

(2)目前基于自注意力机制及其变体的方法通常只使用一个与类别无关的分类令牌来捕捉不同类别的信息，可能无法学习多个不同类别的语义信息。

综上所述，现有方法存在着仅关注二分类问题，且无法捕捉类相关语义信息的不足，提出一种新的全切片数字病理图像分析方法是十分必要的。

发明内容

本发明的目的是为解决现有方法仅关注二分类且无法捕捉类相关语义信息的问题，而提出了一种协同学习驱动的多类别全切片数字病理图像分类系统。

本发明为解决上述技术问题所采取的技术方案是：一种协同学习驱动的多类别全切片数字病理图像分类系统，所述系统包括全切片数字病理图像获取模块、图像预处理模块、特征提取模块和协同学习模型，其中：

所述全切片数字病理图像获取模块用于获取待分类的全切片数字病理图像；

所述图像预处理模块用于对待分类的全切片数字病理图像进行预处理，获得全切片数字病理图像中的前景组织区域，并通过格栅化方法将前景组织区域图像分割为子图像补丁；

所述特征提取模块用于对子图像补丁进行编码，根据编码结果得到补丁特征令牌X_p，其中，/>为实数，N×D为补丁特征令牌的维度；

所述协同学习模型包括类特定分类令牌、协同学习子模块、类引导定位子模块；

所述类特定分类令牌用于为分类任务的每一个类别分别设置一个的分类令牌，对于一个包含C个类别的分类任务，将全部C个类别的分类令牌组成的矩阵记为

所述协同学习子模块用于根据X_p和X_c进行计算；

所述类引导定位子模块用于根据协同学习子模块的计算结果生成类激活图并根据类激活图得到类别的热力图；

所述生成类激活图的具体过程为：

步骤1、将从二维映射为三维矩阵/>N＝n×n；

步骤2、将与/>进行矩阵乘法，获得/>

步骤3、对进行1×1卷积，获得/>

进一步地，所述特征提取模块的工作过程为：

分别对每个子图像补丁进行编码，即利用预训练模型将每个子图像补丁编码为特征向量，再将全部子图像补丁对应的特征向量进行拼接，得到全切片数字病理图像的补丁特征令牌

进一步地，所述前景组织区域采用Otsu方法获得。

进一步地，所述预训练模型是通过ImageNet或病理图像预训练的模型。

进一步地，所述协同学习子模块的工作过程为：

步骤一、将X_p初始化为将X_c初始化为/>并初始化l＝0；

步骤二、通过线性层将映射为/>和/> 是/>映射到Value空间的特征，/>是/>映射到Key或Query空间的特征；

通过线性层将映射为/>和/> 是/>映射到Value空间的特征，/>是/>映射到Query或Key空间的特征；

步骤三、计算和/>之间的点乘注意力，获得协同图/>

其中，上角标T代表转置，协同图d_inner为中间层特征维度；

步骤四、在协同图的维度1上计算Softmax，获得补丁对类注意力图/>对协同图/>进行转置后，在维度1上计算Softmax获得类对补丁注意力图/>

步骤五、与/>进行矩阵乘法后，将相乘结果经过线性层获得/>

其中，FFN为线性层；

步骤六、与/>进行矩阵乘法后，将相乘结果经过线性层获得/>

步骤七、根据获得/>根据/>获得/>

步骤八、判断l是否等于L-1，L为协同学习子模块的层数；

若l＝L-1，则结束；

否则，令l＝l+1，再返回执行步骤二。

进一步地，所述步骤七的实现方法为下列的(1)或(2)：

(1)：直接将作为/>将/>作为/>

(2)：将和/>的加和作为/>将/>和/>的加和作为/>

进一步地，所述根据类激活图得到类别的热力图的具体过程为：

步骤①、将映射回N×C维度，将映射结果记为/>

步骤②、若特征提取模块进行过填充，则去除填充补丁后得到若特征提取模块未进行过填充，则/>直接为/>

步骤③、将中的所有分数映射到0～1的区间，将映射结果记为/>

步骤④、将映射到对应的补丁坐标上，得到类别的热力图。

进一步地，所述协同学习模型的训练过程为：

获取全切片数字病理图像数据集，并对每个全切片数字病理图像的类别进行标注，再将标注后的全切片数字病理图像划分为训练集、验证集和测试集三部分；

对每个全切片数字病理图像进行预处理，分别获得每个全切片数字病理图像中的前景组织区域，并通过格栅化方法将前景组织区域图像分割为子图像补丁；

对于任意一个全切片数字病理图像，将该图像对应的子图像补丁进行编码，得到补丁特征令牌

利用协同学习模型的类特定分类令牌为分类任务中的每个类别分别设置一个的分类令牌，对于一个包含C个类别的分类任务，将全部C个类别的分类令牌组成的矩阵记为

将X_p和X_c作为协同学习子模块的输入，将协同学习子模块的输出作为类引导定位子模块的输入，根据协同学习子模块和类引导定位子模块的输出计算损失函数，直至达到训练停止条件时获得训练好的协同学习模型。

进一步地，所述损失函数为：

L_total＝w_clsL_cls+w_conL_con+w_synL_syn

其中，L_cls是分类损失，L_con是补丁-类一致性损失，L_syn是类-补丁协同损失，w_cls、w_con和w_syn为权重；

分类损失L_cls的计算方法为：

对进行池化获得/>y_cls与标注的标签y计算交叉熵损失，获得分类损失L_cls：

其中，y_i是标签y中第i个分类类别，p_i是y_cls中第i个分类类别的概率；

补丁-类一致性损失L_con的计算方法为：

对进行卷积获得/>再对/>进行池化获得/>y_con与多分类标签y计算交叉熵损失，获得补丁-类一致性损失L_con：

其中，y_i是标签y中第i个分类类别，p′_i是y_con中第i个分类类别的概率；

所述类-补丁协同损失L_syn的计算方法为：

对进行池化获得/>y_syn与多分类标签y计算交叉熵损失，获得类-补丁协同损失L_syn：

其中，y_i是标签y中第i个分类类别，p″_i是y_syn中第i个分类类别的概率。

更进一步地，所述权重w_cls、w_con和w_syn的计算方式为：

步骤1)、将L_cls、L_con和L_syn分别简记为L₁、L₂和L₃，计算L_i的损失梯度并进行L2正则化：

其中，i＝1，2，3；θ_k是协同学习模型的第k个参数；

步骤2)、对g_i进行指数变换：

其中，α是超参数，w_i ^′是指数变换结果，e是自然对数的底数；

步骤3)、将权重w_cks、w_con和w_syn分别简记为w_i、w₂和w₃，对w_i ^′归一化：

本发明的有益效果是：

本发明通过引入多个特定于类别的令牌，极大地提高了处理多类别全切片病理图像分类任务的能力。这种设计不仅能有效地学习与各个类别相关的复杂信息，还能提高模型在多类别诊断场景下的准确性和鲁棒性。通过类别令牌和补丁令牌之间的协同学习，能够有效且协同地计算这两种令牌之间的相关性。大大减少了计算量需求，使得本发明方法即使在处理大规模、高分辨率的全切片图像时也能保持高效运行。

同时，本发明构建多损失来协同优化，能够和谐地管理多个损失函数，避免了它们之间的冲突和干扰，确保了模型能够学习到更多具有类别区分性的特征，从而提高了模型在复杂医学图像分析任务中的性能。由于本发明方法能够更有效地捕捉到与各个类别相关的特征，因此能够提高对病理图像的诊断准确性，这对于临床应用和研究具有重要意义。

附图说明

图1为本发明系统的结构示意图；

图2为本发明系统的计算流程图；

图3为类别-补丁协同学习子模块的计算流程图；

图4为不同类别分类令牌对不同类别切片的类激活图。

具体实施方式

具体实施方式一、结合图1、图2和图3说明本实施方式。本实施方式所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，所述系统包括全切片数字病理图像获取模块、图像预处理模块、特征提取模块和协同学习模型，其中：

若子图像补丁的总数量是平方数(根据实际情况，可知子图像补丁总数量一定是整数)，则直接将各个子图像补丁对应的编码结果进行拼接得到补丁特征令牌，此时N为子图像补丁数量，D为特征维度；若子图像补丁的总数量不是平方数，则将各个子图像补丁对应的编码结果进行拼接后，利用拼接结果末尾的元素对拼接结果进行填充，填充后得到补丁特征令牌X_p，N是大于子图像补丁数的最小平方数；

所述协同学习子模块用于根据X_p和X_c进行计算，使它们能够相互增强和提炼特征信息，获得更丰富的表征；

所述生成类激活图的具体过程为：

步骤1、将从二维映射为三维矩阵/>N＝n×n；

步骤2、将与/>进行矩阵乘法，获得/>

步骤3、对进行1×1卷积，获得/>

类别-补丁协同学习模块通过协同式地使类特定分类令牌与补丁特征令牌之间进行知识传播，使得每个分类令牌学习各个类别相关的信息，并使每个补丁特征令牌隐式地对学习相关关系。类引导定位模块显式地使用类特定分类令牌引导补丁特征图生成类相关激活图。

具体实施方式二：本实施方式与具体实施方式一不同的是，所述特征提取模块的工作过程为：

分别对每个子图像补丁进行编码，即利用预训练模型将每个子图像补丁编码为高维特征向量，再将全部子图像补丁对应的特征向量进行拼接，得到全切片数字病理图像的补丁特征令牌

其它步骤及参数与具体实施方式一相同。

本实施方式通过格栅化方法，以一定步长、尺寸将切片中的前景组织区域划分为小的子图像补丁。

具体实施方式三：本实施方式与具体实施方式一或二不同的是，所述前景组织区域采用Otsu方法获得。

其它步骤及参数与具体实施方式一或二相同。

具体实施方式四：本实施方式与具体实施方式一至三之一不同的是，所述预训练模型是通过ImageNet或病理图像预训练的模型。

其它步骤及参数与具体实施方式一至三之一相同。

预训练的模型包括但不限于ResNet、ViT模型。

具体实施方式五：结合图3说明本实施方式。本实施方式与具体实施方式一至四之一不同的是，所述协同学习子模块的工作过程为：

步骤一、将X_p初始化为将X_c初始化为/>并初始化l＝0；

需要说明的是，当是/>映射到Key空间的特征时，/>应为/>映射到Query空间的特征，当/>是/>映射到Query空间的特征时，/>应为/>映射到Key空间的特征；

步骤三、计算和/>之间的点乘注意力，获得协同图/>

其中，上角标T代表转置，协同图d_inner为中间层特征维度；

步骤四、在协同图的维度1(即N所在的维度)上计算Softmax，获得补丁对类注意力图/>对协同图/>进行转置后，在维度1(即C所在的维度)上计算Softmax获得类对补丁注意力图/>

步骤五、与/>进行矩阵乘法后，将相乘结果经过线性层获得/>

其中，FFN为线性层；

步骤六、与/>进行矩阵乘法后，将相乘结果经过线性层获得/>

步骤七、根据获得/>根据/>获得/>

步骤八、判断l是否等于L-1，L为协同学习子模块的层数；

若l＝L-1，则结束；

否则，令l＝l+1，再返回执行步骤二。

其它步骤及参数与具体实施方式一至四之一相同。

具体实施方式六：本实施方式与具体实施方式一至五之一不同的是，所述步骤七的实现方法为下列的(1)或(2)：

(1)：直接将作为/>将/>作为/>

(2)：将和/>的加和作为/>将/>和/>的加和作为/>

其它步骤及参数与具体实施方式一至五之一相同。

具体实施方式七：本实施方式与具体实施方式一至六之一不同的是，所述根据类激活图得到类别的热力图的具体过程为：

步骤①、将映射回N×C维度，将映射结果记为/>

步骤④、将映射到对应的补丁坐标上，得到类别的热力图。

其它步骤及参数与具体实施方式一至六之一相同。

具体实施方式八：本实施方式与具体实施方式一至七之一不同的是，所述协同学习模型的训练过程为：

其中，N为一个可开平方根的整数，不满足可开平方根时将进行填充，记

其它步骤及参数与具体实施方式一至七之一相同。

本发明中的训练停止条件为：

(1)采用EarlyStopping策略，如果验证集损失在指定epoch内不再下降；

(2)达到预设最大epoch。

具体实施方式九：本实施方式与具体实施方式一至八之一不同的是，所述损失函数为：

L_total＝w_clsL_cls+w_conL_con+w_synL_syn

分类损失L_cls的计算方法为：

对进行池化获得/>y_cls与GroundTruth标注的标签y计算交叉熵损失，获得分类损失L_cls：

补丁-类一致性损失L_con的计算方法为：

对进行卷积获得/>再对/>进行池化获得/>y_con与GroundTruth多分类标签y计算交叉熵损失，获得补丁-类一致性损失L_con：

所述类-补丁协同损失L_syn的计算方法为：

对进行池化获得/>y_syn与GroundTruth多分类标签y计算交叉熵损失，获得类-补丁协同损失L_syn：

其它步骤及参数与具体实施方式一至八之一相同。

本实施方式中的卷积指的是进行输入通道为D、输出通道为C的任意大小卷积核的卷积。池化方法采用平均池化或全局加权排名池化等方式。

具体实施方式十：本实施方式与具体实施方式一至九之一不同的是，所述权重w_cls、w_con和w_syn的计算方式为：

其中，i＝1，2，3；θ_k是协同学习模型的第k个参数；

步骤2)、为了保证可调节性，对g_i进行指数变换：

其中，α是决定权重对梯度幅度敏感性的超参数，w_i ^′是指数变换结果，e是自然对数的底数；

步骤3)、将权重w_cls、w_con和w_syn分别简记为w_i、w₂和w₃，对w_i ^′归一化：

其它步骤及参数与具体实施方式一至九之一相同。

实施例

基于本发明所述的一种协同学习驱动的多类别全切片数字病理图像分类系统的分类方法，包括以下步骤：

步骤S1、获得一系列多类别全切片数字病理图像及多类别标注，并将所有数据按0.7:0.15:0.15划分为训练集、验证集和测试集；

步骤S2、对步骤S1中每张切片进行预处理，获得前景组织区域，并通过格栅化方法以256像素的步长和大小，分割为256×256的子图像补丁；

步骤S3、将每个子图像补丁调整为224×224大小，并通过ImageNet预训练的ResNet50模型将步骤S2中获得的每个子图像补丁编码为高维特征向量，同时将每张切片对应的所有子图像补丁特征拼接成单个补丁特征令牌其中R为补丁数量，每个切片的补丁数量不同，特征维度D为1024。同时如果N开根号不为整数，则将使用X_p末尾的元素进行填充。

步骤S4、构建协同学习模型，如图1和图2所示，该模型包含以下部分：

类特定分类令牌：为每个类别分别设置一个单独的分类令牌，对于7个类别的分类任务，该令牌为

类别-补丁协同学习模块：该模块通过协同式地使类特定分类令牌与补丁特征令牌之间进行知识传播，使得每个分类令牌学习各个类别相关的信息，并使每个补丁特征令牌隐式地对学习相关关系，该模块结构图如图3所示。

类引导定位模块：该部分显式地使用类特定分类令牌引导补丁特征图生成类相关激活图；

多损失协同优化模块：该模块包括分类损失、补丁-类一致性损失和类-补丁协同损失的相关计算，并通过梯度信息动态调整各个损失的权重。

构建类特定分类令牌X_c后，将X_c与X_p输入第1层类别-补丁协同学习模块，模块计算流程如下：

步骤S41、通过线性层将映射为/>和/>

步骤S42、通过线性层将映射为/>和/>

步骤S43、计算和/>之间的点乘注意力，获得协同图/>其中d_inner为中间层特征维度；

步骤S44、在协同图的维度1上计算Softmax获得补丁对类注意力图/>

步骤S45、对协同图进行转置并在维度1上计算Softmax获得类对补丁注意力图/>

步骤S46、与/>进行矩阵乘法，并经过线性层获得/>

步骤S47、与/>进行矩阵乘法，并经过线性层获得/>

模型共包含3层类别-补丁协同学习模块，重复进行3次步骤S41-S47，然后进行如下计算：

步骤S48、将从二维N×D映射为三维矩阵n×n×D，其中N＝n×n；

步骤S49、与/>进行矩阵乘法获得/>

步骤S410、对进行1×1卷积，获得/>

步骤S411、对进行最大池化获得/>与GroundTruth多分类标签y计算交叉熵损失，获得分类损失L_cls；

其中y_i是y第i个分类类别，p_i是y_cls中第i个分类类别的概率。

步骤S412、对进行卷积获得/>再进行最大池化获得与GroundTruth多分类标签y计算交叉熵损失，获得补丁-类一致性损失L_con；

其中y_i是y第i个分类类别，p_i是y_con中第i个分类类别的概率。

步骤S413、对进行最大池化获得/>与GroundTruth多分类标签y计算交叉熵损失，获得类-补丁协同损失L_syn；

/>

其中y_i是y第i个分类类别，p_i是y_syn中第i个分类类别的概率。

步骤S414、对三个损失函数进行加权平均，获得总的损失L_total。

步骤S415、分别简记L_cls、L_con和L_syn为L₁、L₂和L₃，计算以上损失梯度，并进行L2正则化：其中i为1，2，3。

步骤S416、为了保证可调节性，对g_i进行指数变换：其中α是决定权重对梯度幅度敏感性的超参数，α的值可根据任务设置，此处为0.01；

步骤S417、对所有w′_i归一化：

步骤S418、进行加权求和：L_total＝w_clsL_cls+w_conL_con+w_synL_syn

需要说明的是，步骤S411、S412和S413的池化方法采用平均池化或全局加权排名池化等方式。

步骤S5、使用步骤S1中划分的训练数据对协同学习模型进行训练，直至步骤S1中的验证集的loss连续10个epoch不再下降，后者达到100个epoch；

步骤S6、使用步骤S2中划分的测试数据对步骤S2获得的协同学习模型进行切片分类测试，同时从其类引导定位模块获得每个分类类别的类激活图。

步骤S61、获得将其映射回N×7，记为/>

步骤S62、如果进行了填充，去除填充补丁，仍记为

步骤S63、将中的所有分数映射到0～1的区间，仍记为/>

步骤S64、将映射到对应补丁坐标上，进行可视化。如图4为不同分类令牌对不同类别切片的热力图。

本发明的上述算例仅为详细地说明本发明的计算模型和计算流程，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims

1.一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述系统包括全切片数字病理图像获取模块、图像预处理模块、特征提取模块和协同学习模型，其中：

所述协同学习子模块用于根据X_p和X_c进行计算；

所述协同学习子模块的工作过程为：

步骤一、将X_p初始化为将X_c初始化为/>并初始化l＝0；

步骤三、计算和/>之间的点乘注意力，获得协同图/>

其中，上角标T代表转置，协同图d_inner为中间层特征维度；

步骤四、在协同图的维度1上计算Softmax，获得补丁对类注意力图/>对协同图进行转置后，在维度1上计算Softmax获得类对补丁注意力图/>

步骤五、与/>进行矩阵乘法后，将相乘结果经过线性层获得/>

其中，FFN为线性层；

步骤六、与/>进行矩阵乘法后，将相乘结果经过线性层获得/>

步骤七、根据获得/>根据/>获得/>

步骤八、判断l是否等于L-1，L为协同学习子模块的层数；

若l＝L-1，则结束；

否则，令l＝l+1，再返回执行步骤二；

所述生成类激活图的具体过程为：

步骤1、将从二维映射为三维矩阵/>

步骤2、将与/>进行矩阵乘法，获得/>

步骤3、对进行1×1卷积，获得/>

2.根据权利要求1所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述特征提取模块的工作过程为：

3.根据权利要求2所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述前景组织区域采用Otsu方法获得。

4.根据权利要求3所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述预训练模型是通过ImageNet或病理图像预训练的模型。

5.根据权利要求4所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述步骤七的实现方法为下列的(1)或(2)：

(1)：直接将作为/>将/>作为/>

(2)：将和/>的加和作为/>将/>和/>的加和作为/>

6.根据权利要求5所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述根据类激活图得到类别的热力图的具体过程为：

步骤①、将映射回N×C维度，将映射结果记为/>

步骤④、将映射到对应的补丁坐标上，得到类别的热力图。

7.根据权利要求6所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述协同学习模型的训练过程为：

8.根据权利要求7所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述损失函数为：

L_total＝W_clsL_cls+W_conL_con+W_synL_syn

分类损失L_cls的计算方法为：

补丁-类一致性损失L_con的计算方法为：

所述类-补丁协同损失L_syn的计算方法为：

9.根据权利要求8所述的一种协同学习驱动的多类别全切片数字病理图像分类系统，其特征在于，所述权重w_cls、w_con和w_syn的计算方式为：

其中，i＝1，2，3；θ_k是协同学习模型的第k个参数；

步骤2)、对g_i进行指数变换：

其中，α是超参数，w_i′是指数变换结果，e是自然对数的底数；

步骤3)、将权重w_cls、w_con和w_syn分别简记为w_i、w₂和w₃，对w_i′归一化：