CN113706544B

CN113706544B - 一种基于完备注意力卷积神经网络的医学图像分割方法

Info

Publication number: CN113706544B
Application number: CN202110955798.5A
Authority: CN
Inventors: 张重; 吕仕杰; 刘爽
Original assignee: Tianjin Normal University
Current assignee: Tianjin Normal University
Priority date: 2021-08-19
Filing date: 2021-08-19
Publication date: 2023-08-29
Anticipated expiration: 2041-08-19
Also published as: CN113706544A

Abstract

本发明实施例公开了一种基于完备注意力卷积神经网络的医学图像分割方法，该方法包括：将训练医学图像输入利用深度学习框架构建的特征编码器模块，得到不同通道数和尺寸的卷积激活图；将不同通道数和尺寸的卷积激活图分别输入至多个通道注意力模块，得到经通道加权后不同通道数和尺寸的卷积激活图，输入至像素注意力模块，学习得到像素注意力系数，为卷积激活图分配不同的像素注意力系数，得到训练医学图像最终的分割图；基于交叉熵损失函数进行训练，得到最优的医学图像分割模型；确定测试医学图像，输入至所述最优的医学图像分割模型中，得到测试医学图像的最终分割图。

Description

一种基于完备注意力卷积神经网络的医学图像分割方法

技术领域

本发明属于计算机视觉、模式识别、人工智能领域，具体涉及一种基于完备注意力卷积神经网络的医学图像分割方法。

背景技术

核磁共振成像是检测多种疾病的一种重要技术，这种技术依据所释放的能量物质在内部不同结构环境中不同的衰减，通过外加梯度磁场检测所发射出的电磁波，即可得知构成这一物体原子核的位置和种类，据此可以绘制成物体内部的结构图像。例如脑瘤、心血管病变、脊柱畸形等疾病都需要核磁共振图像进行诊断。这种技术由于其非入侵和多模态特性而被广泛使用。核磁共振图像分割作为医学图像技术的基础，具有丰富的研究价值和实际应用，可以在临床诊断、外科指导等方面协助医生做出诊断。

随着深度学习的发展，卷积神经网络在核磁共振图像分割领域大展拳脚。Ben-Cohen等人使用全卷积网络对肝脏图像进行分割，这种网络将最后的全连接层改为卷积层，融合池化层和最后一层卷积层的特征得到最终对每个像素的分类。然而，这种全卷积网络没有充分利用学习到的等级信息。因此Ronneberger等人设计了U型结构的网络(U-Net)用于生物图像分割，这种网络利用对称的收缩和放大路径，并使用跳跃连接得到最终的分割图。由于U-Net的突出表现，很多U-Net的变体：3D-UNet、Mdu-net、DRU-Net等被设计出来用于医学图像分割领域。

最近，注意力机制开始被引入到医学图像分割领域，这种机制更加关注一张图像的部分区域而不是整张图像。注意力机制和卷积神经网络的结合在核磁共振医学图像领域实现了很好的分割效果。Pei等人在单一尺度提出了位置注意力模块和通道注意力模块，使得网络能够注意到大肠肿瘤的位置。Lei等人提出了CS²-Net，他们使用自注意力机制去学习等级特征，在医学图像分割上取得了较好的效果。然而，这些方法只从单一的尺度学习注意力系数，从而导致不完备的注意力学习。

发明内容

本发明的目的是利用完备的注意力机制来提高医学图像分割的准确率，为此，本发明提供一种基于完备注意力卷积神经网络的医学图像分割方法。

为了实现上述目的，本发明提出一种基于完备注意力卷积神经网络的医学图像分割方法，所述方法包括以下步骤：

步骤S1，利用深度学习框架构建特征编码器模块，将训练医学图像输入所述特征编码器模块，得到所述训练医学图像不同通道数和尺寸的卷积激活图；

步骤S2，确定多个通道注意力模块，将所述训练医学图像不同通道数和尺寸的卷积激活图分别输入至所述多个通道注意力模块，得到所述训练医学图像经通道加权后不同通道数和尺寸的卷积激活图；

步骤S3，确定像素注意力模块，以经通道加权后不同通道数和尺寸的卷积激活图作为输入，利用所述像素注意力模块对输入卷积激活图进行融合并学习得到每个像素的注意力系数，为融合后的卷积激活图分配不同的像素注意力系数，得到所述训练医学图像最终的分割图；

步骤S4，基于交叉熵损失函数进行训练，得到最优的医学图像分割模型，其中，所述医学图像分割模型包括所述特征编码器模块、通道注意力模块和像素注意力模块；

步骤S5，确定测试医学图像，将所述测试医学图像输入至所述最优的医学图像分割模型中，得到所述测试医学图像的最终分割图。

可选地，所述步骤S1包括以下步骤：

步骤S11，利用深度学习框架构建得到特征编码器模块，其中，所述特征编码器模块包括四个级联特征编码块和一个附加特征编码块；

步骤S12，对所述训练医学图像进行预处理；

步骤S13，将预处理后得到的训练医学图像输入至所述特征编码器模块中，得到所述训练医学图像不同通道数和尺寸的卷积激活图。

可选地，四个级联特征编码块中的每个均包含两个卷积层和一个池化层，附加特征编码块中仅包含两个卷积层。

可选地，对所述训练医学图像进行的预处理包括：将所述训练医学图像中的每个像素值减去所述训练医学图像的像素平均值，再除以所述训练医学图像的像素方差。

可选地，所述步骤S2包括以下步骤：

步骤S21，确定与所述特征编码器模块中级联特征编码块数量一致的通道注意力模块，将所述训练医学图像不同通道数和尺寸的卷积激活图分别输入至所述通道注意力模块中；

步骤S22，利用所述通道注意力模块学习得到与所述特征编码器模块中每个级联特征编码块每个通道对应的通道注意力系数；

步骤S23，利用学习到的通道注意力系数，对于所述特征编码器模块中级联特征编码块输出的不同通道数和尺寸的卷积激活图进行通道加权，得到所述训练医学图像通道加权后不同通道数和尺寸的卷积激活图。

可选地，第一通道注意力模块的输入为附加特征编码块输出图像的上采样图像，以及与该上采样图像具有相同大小的级联特征编码块的输出图像；第二至第四通道注意力模块的输入为上一通道注意力模块输出图像的上采样图像，以及与该上采样图像具有相同大小的级联特征编码块的输出图像。

可选地，学习得到的通道注意力系数矩阵表示为：

W＝softmax(θ(A×[H‖Q])),

其中，‖表示级联操作，A是一个可学习的变换矩阵，×表示矩阵相乘，H和Q表示对于输入卷积激活图I和T进行池化后得到的矩阵，θ表示非线性变换，softmax函数为归一化函数。

可选地，对于所述特征编码器模块中级联特征编码块输出的不同通道数和尺寸的卷积激活图进行通道加权后得到的不同通道数和尺寸的卷积激活图可表示为：

其中，表示每通道相乘操作，I表示所述特征编码器模块中级联特征编码块输出的不同通道数和尺寸的卷积激活图，W为学习得到的包括每个通道的注意力系数的通道注意力系数矩阵。

可选地，所述步骤S3包括以下步骤：

步骤S31，将所述特征编码器模块中附加特征编码块输出的卷积激活图和第一通道注意力模块至第三通道注意力模块输出的通道加权卷积激活图分别进行上采样操作，得到对应的、具有相同目标通道数和尺寸的卷积激活图；

步骤S32，对具有目标通道数和尺寸的卷积激活图以不同的权重进行卷积融合，得到卷积融合后的卷积激活图d_f；

步骤S33，对第四通道注意力模块输出的卷积激活图进行两次卷积操作，得到卷积激活图d_s；

步骤S34，对卷积激活图d_f与卷积激活图d_s进行融合学习得到对应每个像素的像素注意力系数矩阵C；

步骤S35，利用学习到的每个像素的注意力系数，为卷积激活图d_f分配不同的注意力系数，得到所述训练医学图像最终的分割图F。

可选地，所述训练医学图像最终的分割图表示为：

F＝C⊙d_f，

其中，⊙表示对应像素相乘，F∈R^N×240×240，N表示最终分割的类别数量，即最终分割得到的图像数量。

本发明的有益效果为：本发明通过完备注意力卷积神经网络学习完备的注意力系数，从而提高了医学图像分割的准确率。

需要说明的是，本发明得到了国家自然科学基金项目No.62171321，天津市自然科学基金重点项目No.20JCZDJC00180和No.19JCZDJC31500和模式识别国家重点实验室开放课题基金No.202000002的资助。

附图说明

图1是根据本发明一实施例的一种基于完备注意力卷积神经网络的医学图像分割方法的流程图；

图2是根据本发明一实施例构建的基于完备注意力卷积神经网络的结构框图；

图3是根据本发明一实施例的通道注意力模块结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

图1是根据本发明一实施例的一种基于完备注意力卷积神经网络的医学图像分割方法的流程图，图2是根据本发明一实施例的基于完备注意力卷积神经网络的结构框图，下面以图1和图2为例来说明本发明的一些具体实现流程，如图1和图2所示，所述基于完备注意力卷积神经网络的医学图像分割方法包括以下步骤：

进一步地，所述步骤S1包括以下步骤：

在本发明一实施例中，利用深度学习框架构建得到的特征编码器模块为U-Net，整个特征编码器模块包括四个级联特征编码块和一个附加特征编码块，四个级联特征编码块中的每个均包含两个卷积层和一个池化层，附加特征编码块中仅包含两个卷积层。其中，所述卷积层卷积核的大小为3×3，步长为1；所述池化层的步长为2。

步骤S12，对所述训练医学图像进行预处理；

在本发明一实施例中，对所述训练医学图像进行的预处理包括：将所述训练医学图像中的每个像素值减去所述训练医学图像的像素平均值，再除以所述训练医学图像的像素方差。

在本发明一实施例中，基于上述包括五个特征编码块的特征编码器模块能够得到所述训练医学图像的五个不同通道数和尺寸的卷积激活图。如图2所示，位于图2左上角的为第一级联特征编码块，右下依次为第二级联特征编码块、第三级联特征编码块、第四级联特征编码块和附加特征编码块。假设输入至第一级联特征编码块的训练医学图像的大小为3×240×240，经过两个卷积层后得到的图像大小为16×240×240，对于该图像进行最大值池化，得到的图像大小为16×120×120，该图像作为第二级联特征编码块的输入，经过两个卷积层后得到的图像大小为32×120×120，对于该图像进行最大值池化，得到的图像大小为32×60×60，该图像作为第三级联特征编码块的输入，经过两个卷积层后得到的图像大小为64×60×60，对于该图像进行最大值池化，得到的图像大小为64×30×30，该图像作为第四级联特征编码块的输入，经过两个卷积层后得到的图像大小为128×30×30，对于该图像进行最大值池化，得到的图像大小为128×15×15，该图像作为附加特征编码块的输入，经过两个卷积层后得到的图像大小为256×15×15，因此，所述特征编码器模块中四个级联特征编码块输出图像的大小分别为：16×240×240、32×120×120、64×60×60和128×30×30，附加特征编码块输出图像的大小为256×15×15，其中，第一个位置的数字代表卷积激活图的通道数，第二个位置的数字代表卷积激活图的高度，第三个位置的数字代表卷积激活图的宽度。

进一步地，所述步骤S2包括以下步骤：

在本发明一实施例中，如图2所示，本发明设计了四个通道注意力模块对应所述四个级联特征编码块。其中，第一个通道注意力模块，即第一通道注意力模块，的输入为附加特征编码块输出图像的上采样图像，以及与该上采样图像具有相同大小的级联特征编码块的输出图像；其余通道注意力模块，即第二至第四通道注意力模块，的输入为上一通道注意力模块输出图像的上采样图像，以及与该上采样图像具有相同大小的级联特征编码块的输出图像。具体地，第一通道注意力模块，即图2中通道注意力模块1的两个输入分别为附加特征编码块输出图像(大小为256×15×15)经上采样后得到的图像，大小为128×30×30，以及与该上采样图像具有相同大小的第四级联特征编码块的输出图像；第二通道注意力模块，即图2中通道注意力模块2的两个输入分别为通道注意力模块1输出图像(大小为128×30×30)经上采样后得到的图像，大小为64×60×60，以及与该上采样图像具有相同大小的第三级联特征编码块的输出图像；第三通道注意力模块，即图2中通道注意力模块3的两个输入分别为通道注意力模块2输出图像(大小为64×60×60)经上采样后得到的图像，大小为32×120×120，以及与该上采样图像具有相同大小的第二级联特征编码块的输出图像；第四通道注意力模块，即图2中通道注意力模块4的两个输入分别为通道注意力模块2输出图像(大小为32×120×120)经上采样后得到的图像，大小为16×240×240，以及与该上采样图像具有相同大小的第一级联特征编码块的输出图像。

在本发明一实施例中，学习得到的通道注意力系数矩阵可表示为：

W＝softmax(θ(A×[H‖Q])),

其中，‖表示级联操作，A是一个可学习的变换矩阵，×表示矩阵相乘，H和Q表示对于输入卷积激活图I和T进行池化后得到的矩阵，θ表示非线性变换，比如可以为LeakReLU激活函数，softmax函数为归一化函数。

图3是根据本发明一实施例的通道注意力模块结构框图，如图3所示，以通道注意力模块1为例，所述通道注意力模块1的两个输入分别为附加特征编码块输出图像(大小为256×15×15)经上采样后得到的图像T，大小为128×30×30，以及与该上采样图像具有相同大小的第四级联特征编码块的输出图像I，大小亦为128×30×30；然后对于输入图像I和T分别进行池化后得到大小为128×1×1的矩阵H和Q；对矩阵H和Q进行级联后与变换矩阵A相乘，之后进行θ非线性变换和softmax函数处理，得到与输入图像的通道数对应的、大小为128×1×1的通道注意力系数矩阵W。

类似地，所述通道注意力模块2对应得到的通道注意力系数矩阵W的大小为64×1×1，所述通道注意力模块3对应得到的通道注意力系数矩阵W的大小为32×1×1，所述通道注意力模块4对应得到的通道注意力系数矩阵W的大小为16×1×1。

在本发明一实施例中，对于所述特征编码器模块中级联特征编码块输出的不同通道数和尺寸的卷积激活图进行通道加权后得到的不同通道数和尺寸的卷积激活图可表示为：

其中，表示每通道相乘操作，I表示所述特征编码器模块中级联特征编码块输出的不同通道数和尺寸的卷积激活图，W为所述步骤S22学习得到的包括每个通道的注意力系数的通道注意力系数矩阵。

进一步地，所述步骤S3包括以下步骤：

步骤S31，将附加特征编码块输出的卷积激活图和第一通道注意力模块至第三通道注意力模块输出的通道加权卷积激活图分别进行上采样操作，得到对应的、具有相同目标通道数和尺寸的卷积激活图；

在本发明一实施例中，所述目标通道数和尺寸可设置为与所述训练医学图像相同，即目标通道数可设为4，这样，对所述附加特征编码块输出的卷积激活图和第一通道注意力模块至第三通道注意力模块输出的通道加权卷积激活图分别进行上采样操作后，得到的卷积激活图的大小均为4×240×240。

步骤S32，对步骤S31得到的具有目标通道数和尺寸的卷积激活图以不同的权重进行卷积融合，得到卷积融合后的卷积激活图d_f；

在本发明一实施例中，卷积融合后的卷积激活图可表示为：

其中，表示卷积操作，d₁、d₂、d₃、d₄分别表示所述附加特征编码块输出的卷积激活图和第一通道注意力模块至第三通道注意力模块输出的卷积激活图经上采样操作得到的具有相同目标通道数和尺寸的卷积激活图，4、3、2、1分别表示卷积激活图d₁、d₂、d₃、d₄对应的权重。

如图2所示，所述第四通道注意力模块输出的卷积激活图d₅的大小为16×240×240，经过一次卷积操作后得到的卷积激活图的大小为4×240×240，再经过一次卷积操作后得到卷积激活图d_s，其大小亦为4×240×240。

在本发明一实施例中，所述像素注意力系数矩阵C可表示为：

其中，Ψ表示Sigmoid函数，表示卷积操作，ReLU是一种非线性变换。

如图2所示，当卷积激活图d_f和卷积激活图d_s的大小均为4×240×240时，所述像素注意力系数矩阵C的大小亦为4×240×240。

在本发明一实施例中，所述训练医学图像最终的分割图可表示为：

F＝C⊙d_f，

在本发明一实施例中，所述交叉熵损失函数L可表示为：

其中，p_i表示预测每个像素属于第i类的概率值；y_i是该像素真实属于第i类的概率，当某一像素真实属于第i类别时y_i＝1，否则y_i＝0；N是分割类别的总数量。在实际操作中，可借助随机梯度下降法进行迭代计算，来优化所述医学图像分割模型的参数，以使得所述总损失函数L最小，最终得到最优的医学图像分割模型。

后续可通过计算最终分割图与真实分割图之间的像素准确率和DICE得分，来得到医学图像分割评价结果。

在本发明一实施例中，所述像素准确率表示正确分类的像素数与像素总数之间的比率；DICE得分反映了预测结果和事实结果之间的重叠。其中，像素准确率和DICE得分可分别表示为：

ACC＝(TN+TP)/(TP+TN+FP+FN)，

Dice＝2×TP/(FP+2×TP+FN)，

其中，TP表示真的正样本，TN表示真的负样本，FP表示假的正样本，FN表示假的负样本。

以网上公开的大规模医学图像分割数据库作为测试对象，比如在HVSMR数据库上测试时，本发明图像分割的像素正确率和DICE得分分别达到94.76％和88.83％。因此，本发明医学图像分割的方法有效地利用完备注意力卷积神经网络，学习完备的注意力系数，利用多个等级融合的卷积激活图，可以学习到具有显著区分力的分割图，很大程度上提高了核磁共振医学图像分割的准确率，由此可见本发明方法的有效性。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种基于完备注意力卷积神经网络的医学图像分割方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述步骤S1包括以下步骤：

步骤S12，对所述训练医学图像进行预处理；

3.根据权利要求2所述的方法，其特征在于，四个级联特征编码块中的每个均包含两个卷积层和一个池化层，附加特征编码块中仅包含两个卷积层。

4.根据权利要求2或3所述的方法，其特征在于，对所述训练医学图像进行的预处理包括：将所述训练医学图像中的每个像素值减去所述训练医学图像的像素平均值，再除以所述训练医学图像的像素方差。

5.根据权利要求2或3所述的方法，其特征在于，所述步骤S2包括以下步骤：

6.根据权利要求5所述的方法，其特征在于，第一通道注意力模块的输入为附加特征编码块输出图像的上采样图像，以及与该上采样图像具有相同大小的级联特征编码块的输出图像；第二至第四通道注意力模块的输入为上一通道注意力模块输出图像的上采样图像，以及与该上采样图像具有相同大小的级联特征编码块的输出图像。

7.根据权利要求5或6所述的方法，其特征在于，学习得到的通道注意力系数矩阵表示

W＝softmax(θ(A×[H‖Q])),

8.根据权利要求5-7任一所述的方法，其特征在于，对于所述特征编码器模块中级联特征编码块输出的不同通道数和尺寸的卷积激活图进行通道加权后得到的不同通道数和尺寸的卷积激活图可表示为：

9.根据权利要求6-8任一所述的方法，其特征在于，所述步骤S3包括以下步骤：

10.根据权利要求9所述的方法，其特征在于，所述训练医学图像最终的分割图表示为：

F＝C⊙d_f，