CN114972248A

CN114972248A - 基于注意力机制改进的U-net肝肿瘤分割方法

Info

Publication number: CN114972248A
Application number: CN202210569847.6A
Authority: CN
Inventors: 潘诗杰; 阿卜杜杰力力·阿卜杜热合曼; 麦明香; 李冬; 陈祖林
Original assignee: Guangzhou Huaease Electronic Technology Co ltd
Current assignee: Guangzhou Huaease Electronic Technology Co ltd
Priority date: 2022-05-24
Filing date: 2022-05-24
Publication date: 2022-08-30

Abstract

本发明公开了一种基于注意力机制改进的U‑net肝肿瘤分割方法，具体包括以下步骤：S1.数据集获取和基本分割模型的选取；S2.数据预处理；S3.确定损失函数；S4.确定评价肝肿瘤分割性能的指标；S5.分割模型搭建；S6.进行肝肿瘤图像分割。本发明改进了传统的通道注意力机制和空间注意力机制，并对如何集成到网络架构中进行了分析，与经典的分割方法相比，尽管数据分布有较大差异，但本发明方法均能表现出最佳的效果，具有良好的抗噪性和鲁棒性，采用本发明的分割方法，用于分割肝肿瘤图像效果更佳，精度更高。

Description

基于注意力机制改进的U-net肝肿瘤分割方法

技术领域

本发明涉及于医学影像处理技术领域，特别是一种肝肿瘤的分割方法。

背景技术

肝脏是人体结构中的重要器官之一，主要有激素代谢、解毒、分泌和排泄胆汁等功能；肝癌是在肝脏部位发生的恶性肿瘤。根据世界卫生组织(World Health Organization,WHO)等相关机构发布的数据显示，2020年全球有超过八十万人死于肝癌，死亡人数接近新确诊人数，严重威胁着人类的身心健康。若能对其进行早期诊断——精准的分割出病灶区域，然后根据个体差异施以合适的治疗方法，能够有效的提升存活率。

常见诊断肝肿瘤的方法主要是依靠经验丰富的医生根据计算机断层扫描(Computer Tomography,CT)结果来进行手工分割。随着患者人数的增加，为了减小医生诊断的负担，辅助诊断的方法走入了大众视野。传统的图像分割方法主要有阈值法(Threshold)、区域生长(Region Growing)、水平集(Level Set)等方法。在机器学习方面主要用聚类算法、支持向量机(Support Vector)、AdaBoost等方法进行分割研究。不过，无论是传统方法，还是基于一般的机器学习图像分割方法，并不是一个端到端的分割模型，提取特征都需要人工的干预，此过程很容易受到主观意识的影响，效率低下，且性能不高。

随着对数据和算力的充分利用，2012年AlexNet在ILSVRC挑战赛上的巨大成功引领了新一轮深度学习的浪潮，出现了VGG、ResNet等一系列经典的卷积神经网络，因此部分学者也开始考虑将它们移植到医学图像分割上。2015年，名为UNet的医学分割网络架构，在ISBI细胞跟踪比赛中取得了良好的性能。随后大量学者对其进行改进，引入了三维卷积、金字塔结构、残差连接、注意力机制等思想。其中3DUNet和VNet利用3×3×3的卷积核来提取图像特征，相比2D卷积准确率有了一定的提高，但是也引入了大量的参数。ResUNet、UNet++、DenseUNet等采用跳跃连接和密集连接的思想，增强了网络结构的表征能力，解决一定的梯度消失和退化问题，但是整个过程中并没对特征进行挑选，没有消除噪音对网络带来的干扰。

近几年，注意力机制的引入对网络性能有了明显的提升，通道注意力SENet大放异彩，效果优异，但是其丢失了空间信息，混合注意力Residual attention生成3D注意力特征图，过程简单，但引入了大量参数。BAM和CBAM虽然将通道和空间信息都考虑了在内，性能有所提升，但是其通道和空间分支在低维映射时都存在信息丢失问题。此外，在图像分割方面Attention-UNet在上采样的跳跃连接处采用AG门控机制来聚焦目标区域，致力消除使用额外的目标定位模块来分割图像，但是其所使用的网络提取特征能力并不强。

总的来说，尽管上述基于深度学习的分割方法比传统方法步骤更简单、效率更高、分割效果更好，但是由于标准数据资源稀少、模型表征能力有限、图像复杂度较高等问题的限制，当前的网络仍然不能达到临床所需的效果。

发明内容

本发明提供一种基于注意力机制改进的U-net肝肿瘤分割方法，以提高分割精度为目标，主要用来解决卷积神经网络的特征提取针对性能力不强和肝脏分割性能不高的难点。

为解决上述技术问题，本发明所采取的技术方案如下。

基于注意力机制改进的U-net肝肿瘤分割方法，具体包括以下步骤：

S1.数据集获取和基本分割模型的选取；

S2.数据预处理；

S3.确定损失函数；

S4.确定评价肝肿瘤分割性能的指标；

S5.分割模型搭建；

S6.进行肝肿瘤图像分割。

上述基于注意力机制改进的U-net肝肿瘤分割方法，步骤S1中所述基本分割模型采用Attention-UNet作为基础模型。

上述基于注意力机制改进的U-net肝肿瘤分割方法，步骤S2中预处理后的数据集后分为训练集、验证集和测试集。

上述基于注意力机制改进的U-net肝肿瘤分割方法，步骤S4中所述的评价肝肿瘤分割性能的指标包括Dice相似系数、相对体积差和体积误差重叠。

上述基于注意力机制改进的U-net肝肿瘤分割方法，步骤S5中所述分割模型的搭建方法为：

S51.构造通道注意力模块，使用多个大小不同的1D卷积核执行卷积；

S52.构造空间注意力模块，采用并联空洞卷积的方法引入到空间注意力模块中，获取上下文的语义信息；

S53.将通道注意力模块和空间注意力模块进行混合，生成混合注意力模块；

S54.将混合注意力模块集成到基础模型中。

上述基于注意力机制改进的U-net肝肿瘤分割方法，步骤S6进行肝肿瘤图像分割的方法如下。

S61.训练阶段，利用预处理好的数据集对步骤S5生成的分割模型进行训练，选取整个训练周期内损失值最小时所对应的轮数参数作为最终权重；

S62.把训练阶段得到的最终权重加载进入分割模型中，并将划分到测试集中的图像送进模型中进行测试，最终得到预测的肝肿瘤分割图和对应的指标参数。

由于采用了以上技术方案，本发明所取得技术进步如下。

本发明改进了传统的通道注意力机制和空间注意力机制，并对如何集成到网络架构中进行了分析，与经典的分割方法相比，尽管数据分布有较大差异，但本发明方法均能表现出最佳的效果，具有良好的抗噪性和鲁棒性，采用本发明的分割方法，用于分割肝肿瘤图像效果更佳，精度更高。

本发明的优势具体体现在以下几个方面。

1)在通道注意力机制上，不仅没有损失SENet所提出的注意力模块Excitation中的跨通道交互能力，不打乱通道和注意力特征之间的直接映射关系，同时又能节省了参数，使得网络性能得到明显提升。

2)在空间注意力机制方面，本发明引入了扩大感受野的新方法，有助于CNN得到全局信息，进而拥有掌握整体的能力，更能充分的利用上下文信息，有效的提升后续分割性能，使网络拥有更强的全局能力。

3)引入残差结构，通过残差结构有效防止了随着网络深度的加深梯度退化问题的出现。尽管网络层数增加，退化现象对网络的影响也是很小的，不会影响反向传播和网络的更新。

4)整体模型结构上，本发明不仅参考了UNet编码和解码架构，改进的注意力模块既可以紧跟在编码器中的每一个卷积块中，也可以只存在每一个下采样前的卷积块后；本发明还在整体结构上引入了AG门控机制，在之前基础上可以充分利用局部与整体信息，对上采样前的特征进行二重筛选，过滤掉噪音特征，进而增强模型的表征能力，使得信息流更加通畅。

附图说明

图1为本发明的流程图；

图2为本实施例中数据预处理前后的对比图；

图3为本发明所述的通道注意力模块的模型图；

图4为本发明所述的空间注意力模块的模型图；

图5为本发明所述的混合注意力模块的模型图；

图6为本发明所述分割模型的架构图；

图7为采用不同方法对肝肿瘤进行分割后的指标对比图。

具体实施方式

下面将结合附图和具体实施方式对本发明进行进一步详细说明。

一种基于注意力机制改进的U-net肝肿瘤分割方法，其整体流程如图1所示，具体包括以下步骤。

S1.数据集获取和基本分割模型的选取。

本实施例所有实验使用的都是MICCAI2017和ISBI2017联合举办的肝脏肿瘤分割挑战赛(Liver Tumor segmentation challenge,LiTS)所公开的数据集。LiTS数据集数量相对较多、质量相对较高、目前使用的比较广泛。

LiTS数据集共包括两个部分，第一部分为131例CT扫描训练集，第二部分为70例CT扫描测试集，其中第二部分的70例测试集不带人工标注，只能将结果进行提交，因此本实施例只使用其第一部分。

Net网络可谓是经典的医学图像分割网络，其结构简单，在训练样本少的情况下仍能得到高精度的分割优势，且整个过程不需要人工提取特征，达到了端到端的训练效果，现在已被广泛的应用到了肝肿瘤、脑肿瘤、皮肤病、视网膜，细胞边缘等医学图像分割中。

在原始的Net网络体系结构中，主要由编码器、解码器、瓶颈层和跳跃连接组成。其中编码器的主要功能是使用堆叠的卷积块来提取特征；对于得到的特征图，解码器使用转置卷积实现上采样，将特征通过四个阶段逐步恢复到原图像大小，进而实现端到端的预测。

Net网络体系结构中的一个重要组件是跳跃连接，使用按照通道维度拼接的方式将深层和浅层特征进行融合，弥补特征提取过程中丢失的信息，充分利用图像的局部和全局信息，然后辅助实现更好的上采样过程。

Attention-UNet在上采样的跳跃连接处采用AG门控机制来聚焦目标区域，致力消除使用额外的目标定位模块来分割图像，因此本发明在消融实验部分使用UNet来探究模块的组合有效性，而在最终方法中使用Attention-UNet作为基础模型。

S2.数据预处理。数据的预处理主要分为分类和处理两个步骤。

本实施例中，对LiTS数据集的第一部分131例CT扫描图像进行提取，变为二维图像，共得到5000张图片，分辨率都为512×512，按照7:2:1的比例划分为训练集、验证集和测试集。其中训练集用于模型训练使用，验证集用于验证模型的训练效果，用来寻找使网络泛化能力更强的一组参数，测试集用于测试模型的分割效果。

在数据处理过程中，对数据利用直方图均衡化处理和弹性形变等进行处理。预处理前后的图片效果如图2所示，从图中可以看出，处理后的图片明亮、各部分边界清晰。

S3.确定损失函数。

肝肿瘤图像分割问题其实是一个像素级的分类问题，一般采用交叉熵损失函数。但是比起非肝部像素数目，肝部像素数目较少，存在着样本不均衡问题，如果不妥善处理，会削减模型的学习能力。本发明采用带权重的交叉熵损失函数改善上述情况。

交叉熵损失函数公式如下。

Loss(p，y)＝-aylogp-(1-a)(1-y)log(1-p)

式中，a是超参数用来平衡样本不均衡的问题，p代表模型预测出来的值，y代表像素点的标签值。

S4.确定评价肝肿瘤分割性能的指标。

为了更好的评估所改进的肿瘤图像分割方法的有效性，本发明将使用以下3个比较常用的相关性能指标进行评估：Dice相似系数(Dice)、相对体积差(RVD)和体积误差重叠(VOE)。

Dice相似系数(Dice)，表示的是预测结果和真实标签间交叉部分所占全部面积的比值，取值范围属于0～1。其值越大，代表预测的结果越接近真实标签，即分割效果越好。

相对体积差(RVD)，表示的是预测结果和真实标签之间的体积相对差异，取值可以为正，也可以为负。当此系数小于0时代表欠分割，大于0时代表过度分割。

体积误差重叠(VOE)，其刻画的是体积重叠误差，同Dice系数类似，取值范围属于0～1。不过其值越大，代表预测结果和真实标签的重合部分越小，即分割性能越差。

本步骤中三个公式中的P代表的是模型预测出的分割结果，T代表的是真实的分割结果。

S5.分割模型搭建，搭建方法如下。

S51.构造通道注意力模块，使用多个大小不同的1D卷积核执行卷积。

通道中包含着特征的抽象表达，通常用来表示图像“是什么”。要想准确的获取区分类间的信息特征，建立通道间的内部关系是十分必要的。SENet在Excitation中为了节省参数，在bottleneck中所使用维度削减的步骤打乱了通道和注意力特征之间的直接映射关系。而使用带状矩阵的全连接层或者1D卷积代替原来的全矩阵的全连接层只能取得局部最优解，并不能很好的把跨通道交互能力给展示出来。

为了不损失SENet所提出的注意力模块Excitation中的跨通道交互，又要节省参数，本发明使用多个大小不同的1D卷积核执行卷积代替ECANet中所提出的使用单独卷积核操作。本实施例中构建的通道注意力模块的模型图如图3所示，数据经过该模块时首先经过全局平均池化处理，得到一个一维向量，该一维向量可以看做是原始数据每个空间上的映射；然后用不同维度的卷积核对该向量进行卷积，将得到向量的结果进行相加，再经过激活函数即可得到代表每个通道上空间信息重要程度的注意力向量，最后用该向量对原始数据进行调整即可。

S52.构造空间注意力模块。

和通道不同的是，空间中包含着特征的位置信息，通常用来表示图像“在哪里”。建立特征空间位置之间的联系有利于得到物体间的具体轮廓特征信息，进而能得到更加精准的检测、分割等下游结果。感受野是指CNN结构中某个特征所对应到原输入特征图中的区域大小，大的感受野有助于CNN得到全局信息，进而拥有掌握整体的能力。

本发明采用并联空洞卷积的方法引入到空间注意力模块中，代替BAM网络结构中连续使用两个3×3的空洞卷积来扩大感受野，获取上下文的语义信息。本实施例中构建的空间注意力模块的模型图如图4所示，数据经过该模块时首先1×1的卷积进行降维，将得到的降维后的特征图用拥有着不同空洞系数的卷积核进行卷积，将得到的几个特征图对应位置取最大操作，从而得到最终的特征图，然后再对特征图进行1×1卷积实现通道维度压缩，再经过激活函数得到了空间信息注意力向量，最后用该向量对原始数据进行调整即可。

S53.将通道注意力模块和空间注意力模块进行混合，生成混合注意力模块。

对于一张图像数据而言，其本身不仅仅有类别信息，也存在着位置信息，所以在特征提取时候应该使用不同维度的视角，充分的提取其内在重要信息。相比于单独的通道或者空间注意力机制，混合注意力机制能把来自空间和通道的信息进行综合整理，获取到的信息会更加丰富和全面，让相关区域更加突出，进而能表现出更为优秀的效果。

本发明实施时，让同一个特征图分别经过通道注意力模块和空间注意力模块，将二者得到的对应注意力特征图进行相加融合，并对新获得的特征图进行调整，最后再与原来未调整的特征图相加，便可获得混合注意力模块，如图5所示，数据经过该模块时会分别经过前面的通道注意力模块和空间注意力模块，分别得到对应的通道注意力向量和空间注意力向量，将两个向量进行相加(纬度不同，需要进行广播操作)得到的混合注意力向量特征图，用该向量对原始数据进行调整，并且将调整后的特征图在和原始的未经过任何模块处理的数据利用残差机制进行相加(如图5所示的最下边一条分支)，得到最终的特征图送入后续操作中。

通过混合通道注意力模块和空间注意力模块得到了最终的混合注意力模块(CSA)，该CSA模块可以很容易的集成到现有的经典卷积神经网络结构中。

S54.将混合注意力模块集成到基础模型中。

参考UNet编码和解码架构，本发明的混合注意力模块既可以紧跟在编码器中的每一个卷积块中，也可以只存在每一个下采样前的卷积块后，通过实验，本发明将混合注意力模块放置在每一个下采样钱的卷积块后，形成分割模型。

此外，通过对UNet的分析，可知在上采样中Skip Connect是重要的一环，通过此操作可以充分利用局部与整体信息，使得信息流更加通畅。为了更好的体现此过程，本发明引入Attention UNet中的门控机制模块AG，通过门控机制模块AG能对上采样前的特征进行二重筛选，过滤掉噪音特征，进而增强模型的表征能力。

S6.进行肝肿瘤图像分割。

步骤S6进行肝肿瘤图像分割的方法如下。

S61.训练阶段，利用预处理好的数据集对步骤S5生成的分割模型进行训练，选取整个训练周期内损失值最小时所对应的轮数参数作为最终权重。

利用预处理好的训练集对本发明的分割模型进行训练。训练集中，每一张图片都有对应的标签值，在训练过程中模型会预测出来一个结果，利用步骤S3确定的损失函数对该结果和标签值进行损失计算，然后进行梯度反传，反复迭代，直至收敛。

在训练过程中本发明还使用了数据增强技术来扩充数据量，此方法可以增强模型的泛化能力。本发明采用的数据增强包括水平翻转、竖直翻转、随机调整图像对比度等操作。

实验是在配有2块NVIDIA GeForce GTX 2080Ti的服务器上进行的，操作系统环境为Ubuntu18.04；采用的深度学习框架是pytorch，采用Adam优化器，权重衰减参数weightdecay设为0.0001，初始学习率lr为0.001，训练周期设置为100个epoch，批数据大小batchsize设置为4。

采用验证集数据对训练完成后的分割模型进行验证。验证过程中，使用ReduceLROnPlateau动态学习率调整方案，如果在4个epoch内验证集上的损失值都没有减小，则将学习率变为原来的25％。此外，本发明所采用的是带权重的交叉熵损失函数。

实验结束后，最终选取整个训练周期内损失值最小时，所对应的轮数参数作为最终权重。

S62.把训练阶段得到的最终权重加载进入分割模型中，并将划分到测试集中的图像送进分割模型中进行测试，最终得到预测的肝肿瘤分割图和对应的指标参数。

采用本发明所述的方法对肝肿瘤图像进行分割，同时采用UNet、Atten-UNet、UNet++、Res-UNet和Deeplabv3+方法对本发明所述的测试集中的图像进行处理，处理结果如图7所示。

从图表中可以看到，各种处理方法所处理后图像的三个评价指标。通过对比发现，采用本发明的方法所得到图像的Dice相似系数优于其他方法，且更接近于1；相对体积差(RVD)处于欠分割状态，且最接近于0；体积误差重叠(VOE)小于其他方法，且更接近于0。由此可以得出，采用本发明的分割方法，用于分割肝肿瘤图像效果更佳。

Claims

1.基于注意力机制改进的U-net肝肿瘤分割方法，其特征在于，具体包括以下步骤：

S1.数据集获取和基本分割模型的选取；

S2.数据预处理；

S3.确定损失函数；

S4.确定评价肝肿瘤分割性能的指标；

S5.分割模型搭建；

S6.进行肝肿瘤图像分割。

2.根据权利要求1所述的基于注意力机制改进的U-net肝肿瘤分割方法，其特征在于，步骤S1中所述基的本分割模型采用Attention-UNet作为基础模型。

3.根据权利要求2所述的基于注意力机制改进的U-net肝肿瘤分割方法，其特征在于，步骤S2中预处理后的数据集分为训练集、验证集和测试集。

4.根据权利要求3所述的基于注意力机制改进的U-net肝肿瘤分割方法，其特征在于，步骤S4中所述的评价肝肿瘤分割性能的指标包括Dice相似系数、相对体积差和体积误差重叠。

5.根据权利要求4所述的基于注意力机制改进的U-net肝肿瘤分割方法，其特征在于，步骤S5中所述分割模型的搭建方法为：

S54.将混合注意力模块集成到基础模型中。

6.根据权利要求5所述的基于注意力机制改进的U-net肝肿瘤分割方法，其特征在于，步骤S6进行肝肿瘤图像分割的方法如下