CN115375711A

CN115375711A - 基于多尺度融合的全局上下文关注网络的图像分割方法

Info

Publication number: CN115375711A
Application number: CN202211135634.9A
Authority: CN
Inventors: 朱玉情; 黎青
Original assignee: Anhui University
Current assignee: Anhui University
Priority date: 2022-09-19
Filing date: 2022-09-19
Publication date: 2022-11-22

Abstract

本发明提出基于多尺度融合的全局上下文关注网络的图像分割方法,包括数据预处理及分类、构建全局上下文关注网络模型、全局上下文关注网络模型训练及图像分割四个步骤，通过对待分割的医学图像进行预处理，并将其划分为不同的数据集，再构建基于多尺度融合的全局上下文关注网络，并将数据集输入全局上下文关注网络进行训练，再利用训练好的网络模型进行图像分割，得到分割后的图像，本发明通过将同一层不同尺度特征进行融合，将更多的空间信息保留下来，提高分割精度，利用全局上下文建模，有效地捕获全局信息，同时将通道注意力机制置于跳跃连接处，融合不同的特征并且有效地提高模型的表征能力，来满足任务中对处理速度和分割精度较高的要求。

Description

基于多尺度融合的全局上下文关注网络的图像分割方法

技术领域

本发明涉及医学图像分割技术领域，尤其涉及基于多尺度融合的全局上下文关注网络的图像分割方法。

背景技术

医学图像分割的目标是从给定的医学图像中分割出目标所在区域，帮助外科医生在临床上对疾病的诊断和后续治疗做出帮助。因此，医学图像分割成为计算机视觉领域的一个重要应用。由于医学图像的特殊属性，如对比度低使得组织边界模糊不清，机器造成伪影，各组织相似度高，分割的目标形态上差异较大等问题，导致医学图像分割存在一些难点，实现高精度和鲁棒性的分割结果仍然是一项挑战；

近些年来，深度学习逐渐成为计算机视觉各个领域的主流算法，尤其在医学图像分割领域中。目前针对医学图像准确分割的研究主要集中于：集成注意力机制，加入密集连接或者融合残差思想的卷积神经网络。相比于传统的方法，由于卷积神经网络具有很强的表征能力，在各个领域发展迅速。而编码器-解码器网络结构在医学图像领域取得了卓越的表现。随着注意力机制的提出，集成注意力机制的编码器-解码器网络逐渐被应用于医学图像分割，这种网络能够关注到重要的空间和通道信息，抑制不必要的噪声和背景信息，使得分割结果更加准确。此外，密集连接集成不同层的信息，更有利于提取浅层的空间信息和深层的语义信息。而引入残差思想使网络映射对输出的变化更敏感，很好地解决了深度神经网络的退化问题。但多层的卷积操作使得空间细节信息丢失，简单的跳跃连接不能满足恢复丢失的信息，而且卷积神经网络采用的卷积操作是局部的，通常忽略了全局上下文信息，而全局上下文信息能够有效提高分割精度。

为解决上述基于深度学习的医学图像分割算法不能有效捕获全局信息的问题，提出了基于Transformer和卷积相结合的方法。相关研究人员首次将传统的卷积神经网络与Transformer相结合，应用于医学图像分割。一部分研究者将Transformer作为编码器用来提取全局上下文信息，而卷积操作通过恢复局部信息来增强细节。而另外一部分研究者将Transformer和卷积分别作为提取全局和局部信息的两个编码器，再将提取的特征相结合，作为解码器的输入。

这些方法解决了卷积的局限性问题，但仍有一些不足，例如其没有考虑到信息在上采样和下采样的过程中逐渐丢失，简单的跳跃连接已经不能满足分割要求；其二，Transformer用于视觉任务，需要大量数据进行训练，而提出的模块中的自注意力模块是二次复杂度，这使得训练难度大大增加，因此本发明提出基于多尺度融合的全局上下文关注网络的图像分割方法以解决现有技术中存在的问题。

发明内容

针对上述问题，本发明的目的在于提出基于多尺度融合的全局上下文关注网络的图像分割方法，该基于多尺度融合的全局上下文关注网络的图像分割方法具有更好的分割效果的优点，解决现有技术中存在的问题。

为实现本发明的目的，本发明通过以下技术方案实现：基于多尺度融合的全局上下文关注网络的图像分割方法，包括以下步骤：

步骤一、数据预处理及分类

获得待分割的医学图像数据，并对该医学图像数据进行预处理，再对经过预处理后的医学图像数据进行划分，将其划分为训练集数据、验证集数据和测试集数据；

步骤二、构建全局上下文关注网络模型

构建基于多尺度融合的全局上下文关注网络，其包括特征图收缩网络、四个多尺度融合模块、四个全局上下文建模模块、四个通道注意力模块和特征图扩张网络；

步骤三、全局上下文关注网络模型训练

将步骤一中划分的训练集数据输入多尺度融合的全局上下文关注网络内进行训练，并使用交叉熵损失和Dice损失相结合，计算真值与预测值之间的损失，得到学习后的网络模型；

步骤四、图像分割

将步骤一中划分的测试集数据输入步骤三中训练好的网络模型内，进行图像分割，继而得到分割后的图像，并得出评价指标。

进一步改进在于：所述步骤一中预处理包括对医学图像数据分别进行降噪、去除冗余背景、统一尺寸以及标签标注。

进一步改进在于：所述步骤一中对训练集数据和验证集数据进行数据增强，以防止过拟合。

进一步改进在于：所述步骤二中特征图收缩网络与特征图扩张网络之间设有跳跃连接，所述多尺度融合模块、全局上下文建模模块和通道注意力模块设于跳跃连接处。

进一步改进在于：所述步骤二中特征图收缩网络包括自上而下分层设置的五层卷积块和四层最大池化操作，用于对原始图像的特征提取。

进一步改进在于：所述步骤二中多尺度融合模块是利用多个不同卷积核的卷积操作，提取不同的特征，最后将这些特征相加。

进一步改进在于：所述步骤二中全局上下文建模模块用于聚合全局信息，避免因局部信息的局限性影响分割精度。

进一步改进在于：所述步骤二中通道注意力模块的两个输入分别来自上层卷积块的输出和全局上下文建模模块的输出，且通道注意力模块用于关注重要的特征信息，过滤背景和噪声。

进一步改进在于：所述步骤二中特征图扩张网络包括自下而上分层设置的四层卷积块和四层最大池化操作，且特征图扩张网络用于在特征图收缩网络和跳跃连接提供的图像特征信息的基础上，预测出与原始图像尺寸大小相同的分割图像。

进一步改进在于：所述步骤三中，训练的具体步骤为：

S1：将训练集数据分为n批，并初始化权重；

S2：分批次将训练集数据输入构建好的模型内，计算真值与预测值之间的损失；

S3：再将验证集数据输入构建好的模型内，计算真值与预测值之间的损失；

S4：比较验证过程的损失与训练过程的最小损失，若验证过程的损失小于训练过程的最小损失，则保存当前训练的模型并更新网络参数，若大于则继续下一步骤；

S5：判断迭代次数是否为设置的epoch值，若未达到则继续输入训练集训练，若达到设置的epoch值则训练完成，得到学习后的网络模型。

本发明的有益效果为：该基于多尺度融合的全局上下文关注网络的图像分割方法采用了设计的跳跃连接，弥补多次下采样和上采样导致的信息丢失，以解决现有技术中因多次上采样和下采样导致空间细节信息的丢失的问题，同时跳跃连接中包括多尺度特征融合模块，全局上下文建模模块和通道注意力模块，通过将这三个模块连接，从而达到融合不同细节的特征图，并用于全局建模，最后关注和融合重点特征信息，以及过滤背景和噪音，从而取得更好的分割效果。

附图说明

图1是本发明的步骤流程示意图。

图2是本发明的结构示意图。

图3是本发明的多尺度融合模块结构示意图。

图4是本发明的通道注意力模块结构示意图。

具体实施方式

为了加深对本发明的理解，下面将结合实施例对本发明做进一步详述，本实施例仅用于解释本发明，并不构成对本发明保护范围的限定。

根据图1-图4所示，本实施例提出了基于多尺度融合的全局上下文关注网络的图像分割方法，包括以下步骤：

步骤一、数据预处理及分类

获得待分割的医学图像数据，并对该医学图像数据进行预处理，其中，预处理包括对医学图像数据分别进行降噪、去除冗余背景、统一尺寸以及标签标注，再对经过预处理后的医学图像数据进行划分，将其划分为训练集数据、验证集数据和测试集数据，同时对训练集数据和验证集数据进行数据增强，其包括变形缩放、随机翻转、裁剪、添加噪声、旋转、颜色扰动，以防止过拟合；

步骤二、构建全局上下文关注网络模型

构建基于多尺度融合的全局上下文关注网络，如图2所示，其包括特征图收缩网络、四个多尺度融合模块、四个全局上下文建模模块、四个通道注意力模块和特征图扩张网络，其中特征图收缩网络与特征图扩张网络之间设有跳跃连接，所述多尺度融合模块、全局上下文建模模块和通道注意力模块设于跳跃连接处，即跳跃连接间网络是包括多尺度特征融合模块、全局上下文建模模块和通道注意力模块，具体的，其用于补偿上采样和下采样过程中丢失的语义信息；

特征图收缩网络包括自上而下分层设置的五层卷积块和四层最大池化操作，用于对原始图像的特征提取，即用于提取图像的语义特征，其中卷积块是由连续两次卷积核为3×3的卷积、批量归一化、激活函数ReLu组成，其中第一层卷积块只有一个卷积核为3×3的卷积，而最大池化操作的卷积核为3×3，用于进一步提取特征，减少网络参数；

多尺度融合模块是利用多个不同卷积核的卷积操作，提取不同的特征，最后将这些特征相加，如图3所示，多尺度特征融合模块的输入是特征图收缩网络每层卷积块的输出X_i∈R^H×W×C(i＝1,2,3,4)，其中，i是第i层卷积块，为了保存不同尺度的特征信息，利用四个相同的步长和不同卷积核的卷积操作生成四个补丁，然后将这些补丁重塑成通道维度分别为D/2、D/4、D/8和D/8，最后将这些序列合并成一个通常的嵌入层T_i作为下一个全局上下文建模模块的输入，在第一层跳跃连接中，这四个卷积核的大小分别是4×4、8×8、16×16和32×32，卷积步长都为4，其数学表达如下公式所示：

其中

表明卷积核为k×k步长为s×s的卷积操作，对于其他三层，利用卷积核分别为4×4和8×8，步长都为4×4的两个卷积操作来减小计算量。其中为了保持补丁大小相同，设置了一定的填充；

全局上下文建模模块用于聚合全局信息，避免因局部信息的局限性影响分割精度，其中，全局上下文建模模块是由Transformer或者Transformer的变体组成，如图2所示，Transformer是由多头自注意力(Multi-Head Self-Attention，MHSA)，多层感知机(Multi-Layer Perceptron，MLP)等组成，可以获取全局上下文的信息，但是多头自注意力是二次复杂度，对于长序列来说，会造成很大的计算量，给训练带来难度，而平均池化(GlobalAverage Pooling)操作是线性的，没有可学习的参数，在跳跃连接部分层中使用池化操作代替原始的多头自注意力，可以很好地提取长序列特征，并且减小计算量，部分层跳跃连接中使用传统的Transformer，Transformer包含两个残差块，第一个残差块包含一个层归一化(Layer Normalization)和多头自注意力，输入T_i通过直接连接shortcut直接将来自输入T_i与主输出相加，得到输出Y_i，保留了信息的完整性，同时也增强了网络的表达能力。第二个残差块包含一个层归一化和多层感知机，与第一个残差块相同，输入Y_i通过直接连接shortcut(捷径)直接将来自输入Y_i与主输出相加，得到输出Q_i，修改过的低复杂度的Transformer将第一个卷积块中的多头自注意力换成了平均池化操作，使得二次复杂度变成了线性复杂度；

通道注意力模块的两个输入分别来自上层卷积块的输出和全局上下文建模模块的输出，且通道注意力模块用于关注重要的特征信息，过滤背景和噪声，如图3所示，将全局上下文建模模块的输出Q_i经过上采样和3×3的卷积操作，得到W_i与上层卷积块的输出D_i一样的大小，W_i和D_i分别经过平均池化(Global Average Pooling，P_avg)和最大池化(GlobalMaximum Pooling，P_max)操作，输出结果分别经过线性操作，分别得到的特征图相加后再把相加后的两个特征图相加，经过Sigmoid激活函数，最后将结果与特征图W_i相乘经过ReLu操作，得到输出特征；

特征图扩张网络包括自下而上分层设置的四层卷积块和四层最大池化操作，其中卷积块同样是由连续两次卷积核为3×3的卷积、批量归一化Batch Normal(BN)、激活函数ReLu组成，而最大池化操作的卷积核为3×3，用于进一步提取特征，减少网络参数，每层卷积块的输入是上一层最大池化造作的输出特征和通道注意力模块的输出特征合并得到的特征，最后一个1×1的卷积操作和Sigmoid激活函数得到最终的预测图，即特征图扩张网络用于在特征图收缩网络和跳跃连接提供的图像特征信息的基础上，预测出与原始图像尺寸大小相同的分割图像；

步骤三、全局上下文关注网络模型训练

将步骤一中划分的训练集数据输入多尺度融合的全局上下文关注网络内进行训练，并使用交叉熵损失和Dice损失相结合，计算真值与预测值之间的损失，得到学习后的网络模型，其中训练的具体步骤为：

S1：将训练集数据分为n批，并初始化权重；

S5：判断迭代次数是否为设置的epoch值，若未达到则继续输入训练集训练，若达到设置的epoch值则训练完成，得到学习后的网络模型；

步骤四、图像分割

在本实施例中，将多尺度融合模块，全局上下文建模模块，注意力机制与U型网络融合，并通过融合不同细节的特征图，获取丰富的空间信息，继而通过在部分层使用池化操作替代高复杂度的自注意力模块，处理输入的长序列，部分层仍然延用传统的Transformer，获取全局上下文特征信息，由此通过这种分层设计，可以在不同层发挥不同的特点，来获取有效的特征图。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：包括以下步骤：

步骤一、数据预处理及分类

步骤二、构建全局上下文关注网络模型

步骤三、全局上下文关注网络模型训练

步骤四、图像分割

2.根据权利要求1所述的基于多尺度融合的局上下文关注网络的图像分割方法，其特征在于：所述步骤一中预处理包括对医学图像数据分别进行降噪、去除冗余背景、统一尺寸以及标签标注。

3.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤一中对训练集数据和验证集数据进行数据增强，以防止过拟合。

4.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤二中特征图收缩网络与特征图扩张网络之间设有跳跃连接，所述多尺度融合模块、全局上下文建模模块和通道注意力模块设于跳跃连接处。

5.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤二中特征图收缩网络包括自上而下分层设置的五层卷积块和四层最大池化操作，用于对原始图像的特征提取。

6.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤二中多尺度融合模块是利用多个不同卷积核的卷积操作，提取不同的特征，最后将这些特征相加。

7.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤二中全局上下文建模模块用于聚合全局信息，避免因局部信息的局限性影响分割精度。

8.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤二中通道注意力模块的两个输入分别来自上层卷积块的输出和全局上下文建模模块的输出，且通道注意力模块用于关注重要的特征信息，并过滤背景和噪声。

9.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤二中特征图扩张网络包括自下而上分层设置的四层卷积块和四层最大池化操作，且特征图扩张网络用于在特征图收缩网络和跳跃连接提供的图像特征信息的基础上，预测出与原始图像尺寸大小相同的分割图像。

10.根据权利要求1所述的基于多尺度融合的全局上下文关注网络的图像分割方法，其特征在于：所述步骤三中，训练的具体步骤为：

S1：将训练集数据分为n批，并初始化权重；