CN116188340A

CN116188340A - 一种基于图像融合的肠道内窥镜图像增强方法

Info

Publication number: CN116188340A
Application number: CN202211649623.2A
Authority: CN
Inventors: 刘金华; 黄东晋; 周舒华; 石永生
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2022-12-21
Filing date: 2022-12-21
Publication date: 2023-05-30

Abstract

本发明涉及一种基于图像融合的肠道内窥镜图像增强方法，该方法针对内窥镜图像照度不均、对比度偏低、纹理细节信息缺失设计了一种增强方法，它包括四个步骤：(1)创建数据集；(2)将图像输入编码器‑解码器多注意力U‑Net网络，进行深度网络模型训练以获取全局增强图像；(3)将图像输入分割网络HarDNet‑MSEG，进行深度网络模型训练以获取息肉分割mask图像；(4)判断是否含有息肉，若含有，进行图像融合，否则输出全局增强图像；(5)将编码器‑解码器多注意U‑Net网络获取的全局增强图像和HarDNet‑MSEG获取的mask图像融合输出最终局部增强图像。本发明提出的基于图像融合的肠道内窥镜图像增强方法相对其他图像增强算法更能引起人们对病变区域的关注，具有可应用于临床诊断的医学价值。

Description

一种基于图像融合的肠道内窥镜图像增强方法

技术领域

本发明涉及医学图像增强及计算机网络技术领域，特别涉及一种基于图像融合的肠道内窥镜图像增强方法。

背景技术

肠息肉是导致癌症的主要原因之一。内窥镜检查是一种标准的用于检测结肠息肉的目视诊断程序。然而，由内窥镜直接获得的肠道图像容易出现照明不均匀。对比度低和纹理细节缺失等问题，导致人工检查的准确率下降。从而影响医生对疾病分析和诊断的准确度。肠道图像增强可以为临床分析提供详细的边缘和纹理信息。因此，肠道图像增强的研究对帮助结肠镜医师降低误诊率和漏诊率十分重要。

研究人员已经提出了一些经典的图像增强方法，将它们应用于低对比度非均匀照明的肠道内窥镜图像容易出现局部背景区域过度增强、病变区域增强不足等问题。近年来，深度学习的方法在自然图像增强领域表现很好。然而，由于没有公开的肠道图像增强配对数据集，影响了深度学习在肠道内窥镜图像增强上的发展。无监督神经网络框架应用于肠道内窥镜图像增强任务上通常难以得到高质量的图像增强结果。另外，基于深度学习图像增强方法旨在实现全局增强，由于体内环境的特殊性，自然图像的增强算法并不完全适用于肠道内窥镜图像。

发明内容

本发明的目的在于针对数据集的缺失，构集首个可用于图像增强和图像分割的数据集，针对已有技术的不足，提供一种基于图像融合的肠道内窥镜图像增强方法，是一种基于Python语言和Pytorch框架的用于对肠道图像进行增强的方法，该方法可实现全局增强和局部增强两个不同的任务。提出的EDMAU可为非息肉图像保留更多的图像细节并调整全局图像照度。将基于深度学习的息肉分割技术和图像增强技术结合可以大幅度的提高图像信息有效率，使得息肉图像中的病变区域细节信息更丰富。

为达到上述目的，本发明采用如下的技术方案：

一种基于图像融合的肠道内窥镜图像增强方法，其步骤如下：

步骤1：创建可用于肠道内窥镜增强和息肉分割的数据集；

步骤2：将数据集中的低质/高质图像对输入编码器-解码器多注意U-Net网络，进行深度网络模型训练和预测以获取全局增强图像；

步骤3：将数据集中的低质/mask图像对输入分割网络HarDNet-MSEG，进行深度网络模型训练和预测以获取息肉分割mask图像；

步骤4：判断是否含有息肉，若含有，进行图像融合，否则输出全局增强图像；

步骤5：将编码器-解码器多注意U-Net网络获取的全局增强图像和HarDNet-MSEG获取的mask图像融合输出最终局部增强图像。

优选地，所述步骤1的数据集创建包括如下操作：

1-1：从一些公开的胃肠道息肉相关的医学影像开源数据集收集真实肠道图像和这些图像对应的息肉分割mask；

1-2：调整收集的图像的分辨率为256×256像素；

1-3：使用Adobe Lightroom来调整真实肠道图像以获取低质图像和高质量的参考图像；

1-4：邀请志愿者对1-3获取的图像进行主观评价，以获取最佳图像输出。

1-5：将得到的数据集按2:1的比例划分训练集和测试集。

优选地，所述步骤2的编码器-解码器多注意U-Net网络模型训练和预测包括如下操作：

2-1：编码器-解码器多注意U-Net网络(EDMAU)是一种图像增强网络，它由三个部分组成，分别是输入、编码注意力、解码注意力和输出；多注意力指的是细节注意力图和亮度注意力图；将数据集中的低质图像和高质量的参考图像输入EDMAU进行训练；

2-2：目标函数采用绝对误差损失、均方误差损失、结构相似度损失以及感知损失四个损失函数组合；

2-3：网络模型采用学习率为0.0002的优化算法，总共训练200个epochs，经过训练后，得到对应的全局增强网络模型训练参数。

2-4：将测试集输入训练好的全局增强网络模型，得到模型预测的全局增强图像I_eg。

优选地，所述步骤3的HarDNet-MSEG网络模型训练和预测包括如下操作：

3-1：分割网络HarDNet-MSEG是一种肠道息肉分割网络，将数据集中的低质图像和相对应的息肉分割的mask输入EDMAU进行训练；

3-2：网络模型采用学习率为0.0001的优化算法，总共训练100个epochs，经过训练后，得到对应的息肉分割网络模型训练参数。

3-3：将测试集输入训练好的HarDNet-MSEG网络模型，得到模型预测的息肉位置精确分割mask图I_mask。

优选地，所述步骤4的判断是否含有息肉是根据mask图像判断图像中有无息肉，来区分图像进行全局增强还是进一步的局部增强；若图像中不含有息肉，最终得到全局增强图I_eg，若含有息肉，则执行步骤5将I_mask和I_eg融合获取最终的局部增强图像I_el。

所述步骤5的图像融合包括如下操作：

5-1：对于I_mask提取的I_eg的病变区域保留EDMAU增强效果；

5-2：对于I_mask提取的I_eg的非病变区域使用伽马校正处理以实现息肉图像的局部增强效果I_el。

本发明与现有技术相比较，具有如下显而易见的突出实质性特点和显著优点：

1.构建了第一个合成的成对低光/正常光和低光/对应mask肠道内窥镜图像数据集。

2.提出了一种新颖的端到端全局图像增强网络架构EDMAU来解决低光非均匀照明图像增强问题。其中，提出了一种细节注意图，将其添加到网络的解码器中以突出纹理细节特征，并将亮度注意图引入到网络的编码器中以改善全局图像照明。

3.提出一种新的图像融合策略，通过弱化背景区域，来突出感兴趣区域的细节信息。

4.与多个现有方法相比，本发明取得了先进的结果，EDMAU可有效消除非均匀照明效果、提高图像纹理细节信息。局部增强图像可以帮助医生快速清晰地观察区域纹理细节信息，具有一定的临床实用性。

附图说明

图1为本发明方法的程序框图。

图2为本发明方法的整体流程图。

图3为本发明全局图像增强网络EDMAU架构。

图4为本发明方法训练的EDMAU网络模型对构建数据集的预测得到增强结果图与多个现有方法的结果对比图。

图5为本发明方法经过提出的融合方法所得到的最终局部增强图像与未增强的原始输入图像显著性的改变对比图。

具体实施方式

以下结合附图对本发明的优选实施例进行详细的说明。

实施例一：

参见图1，一种基于图像融合的肠道内窥镜图像增强方法，包含以下操作步骤：

步骤1：创建可用于肠道内窥镜图像增强和息肉分割的数据集；

步骤2：将数据集中的低质图像和高质量的参考图像对输入编码器-解码器多注意U-Net网络，进行深度网络模型训练和预测以获取全局增强图像；

步骤3：将数据集中的低质图像和相对应的息肉分割的mask图像对输入分割网络HarDNet-MSEG，进行深度网络模型训练和预测以获取息肉分割mask图像。

本实施例方法能利用构建的数据集进行网络模型的训练和测试，准确增强医生所感兴趣区域细节信息。

实施例二：

本实施例与实施例一基本相同，特别之处如下：

所述步骤1的数据集创建包括如下操作：

1-1：从一些公开的胃肠道息肉相关的医学影像开源数据集Kvasir-SEG dataset，ETIS-Larib Polyp DB以及CVC-EndoSceneStill收集2108幅真实肠道图像和这些图像对应的息肉分割mask；

1-2：调整收集的图像的分辨率为256×256像素；

1-3：将部分照明良好的图像通过Lightroom降低原始图像的质量获得低照度非均匀照明的低质图像。对全部收集的图像通过Lightroom进行手工润色来调整真实肠道内窥镜图像以获取高质量的参考图像；

1-4：邀请志愿者对1-3获取的图像进行主观评价以产生满意输出，对于没有产生满意输出的序列将要求重新修饰图像来为每个序列选择最佳输出。

1-5：将得到的数据集按2:1的比例划分训练集和测试集。

所述步骤2的多注意力图的获取和编码器-解码器多注意U-Net网络模型训练和预测包括如下操作：

2-1：多注意力图分别指的是细节注意力图和亮度注意力图，本发明提出一种新的细节注意力图并加入到U-Net网络的解编码阶段，以突出细节特征从而减少图像增强过程中部分信息的丢失。其次，在U-Net网络的编码阶段引入亮度注意力图来改善全局图像的照度。

所述细节注意力图的计算公式如下：

其中，I_low表示原始低质量图像。f_canny表示使用Canny算子处理图像。f_Mp表示对边缘图像使用Max-pooling。D₁，…，D₈构成细节注意力图。

所述亮度注意力图是我们将原始RGB颜色空间的低质量图像I_low转换为单通道灰度图像I_g，将其规格化为[0,1]。然后计算1-I_g作为我们的亮度注意力图。

2-2：编码器-解码器多注意U-Net网络(EDMAU)是一种图像增强网络，它由三个部分组成，分别是输入、编码注意力、解码注意力和输出。将构建的数据集的训练集中的低质图像和高质量的参考图像输入EDMAU进行训练，得到全局增强图像I_eg，完整的网络结构如图3；

下面根据图3进行详细的解释：

本发明提出的EDMAU网络模型采用U-Net网络作为特征提取的基础网络，主要由输入、编码注意力、解码注意力和输出4部分组成。

输入模块输入的是将3通道的RGB低质量彩色图像及单通道的亮度注意力图进行拼接得到的通道数为4、大小为256×256的特征图。

编码注意力模块包含了8个下采样层，在编码阶段，8个下采样卷积层使用4×4的卷积核和Leaky LeRU激活函数对输入图像进行多尺度特征提取。输出层数分别为64、128、256、512、512、512、512和512。亮度注意力图与下采样过程中的特征图输出相乘，对亮度注意力图使用Max-pooling，以改变亮度注意力图尺寸与相应卷积层特征图尺寸一致。

解码注意力模块包含了8个上采样层，在解码阶段，前7个上采样卷积层使用4×4的卷积核和Leaky LeRU激活函数。最后一次反卷积层使用Tanh激活函数以产生最终得到细节保存更完整的全局增强图像。输出层数分别为512、512、512、512、512、256、128、64和3。细节注意力图与上采样过程中的特征图输出相拼接，对细节注意力图使用Max-pooling，以改变细节注意力图尺寸与相应卷积层特征图尺寸一致。

2-3：目标函数采用绝对误差损失、均方误差损失、结构相似度损失以及感知损失四个损失函数组合，总损失函数可表示为：

式中，L₁表示绝对误差损失，L₂表示均方误差损失、L_Structure表示结构相似度损失，L_Perceptual代表感知损失。λ₁、λ₂、λ₃、λ₄表示常数，设置为1，1000，1，1。I_eg和I_gt分别是EDMAU输出的增强图像和对应的GroundTruth。l为亮度信息，c为对比度信息，s为结构相似性，i为像素坐标，m为像素总数，α、β、θ为调整三个分量l、c和s重要性的参数。C,W,H分别为特征图的通道、高度和宽度。Φ(x)为VGG-16生成的特征图。

2-4：网络模型采用学习率为0.0002的优化算法，总共训练200个epochs，经过200个epochs的训练后，得到对应的全局增强网络模型训练参数。

2-5：将构建数据集的测试集输入训练好的全局增强网络模型，得到模型预测的全局增强图I_eg。

所述步骤3的分割网络HarDNet-MSEG模型训练和预测包括如下操作：

3-1：分割网络HarDNet-MSEG是一种肠道息肉分割网络，将构建数据集的训练集中的低质图像和相对应的息肉分割的mask输入EDMAU进行训练；

3-2：网络模型采用学习率为0.0001的优化算法，总共训练100个epochs，经过100个epochs的训练后，得到对应的息肉分割网络模型训练参数。

3-3：将构建数据集的测试集输入训练好的HarDNet-MSEG网络模型，得到模型预测的息肉位置精确分割mask图I_mask。

所述步骤4的判断是否含有息肉是根据mask图像判断图像中有无息肉，若mask图像无白色区域说明图像不含有息肉，最终得到全局增强图I_eg，若mask图像含有白色区域说明图像含有息肉，则执行步骤5将I_mask和I_eg融合获取最终的局部增强图像I_el。

所述步骤5的图像融合包括如下操作：

5-1：对于I_mask提取的I_eg的病变区域保留EDMAU增强效果；

图像融合策略的具体表达式为：

式中，f_gamma(I_eg)为对I_eg进行伽马校正生成的图像。

本实施例方法从本发明构建的肠息肉图像数据集LHI进行定性和定量分析，本发明方法可同时实现两个不同的任务：全局细节增强和局部细节增强。

采用本发明方法EDMAU对肠道内窥镜图像进行全局增强处理，并与限制对比度自适应直方图均衡(CLAHE)、基于Rubost Retinex分解模型的Structure-revealing弱光增强方法(RRM)、自适应伽马校正加权分布(AGCWD)、Wang等人提出的一种内窥镜图像增强方法(EndpIMLE)这4种传统图像增强方法以及RetinexNet、KinD、DeepUPE、Zero-DCE++这4种基于深度学习的图像增强方法进行增强效果对比。图4是本发明方法EDMAU和现有方法的预测结果的细节图比较。由图4对比结果可以看出，本发明方法处理肠道内窥镜图像可以成功地从黑暗部分去除阴影，对原始图像中较亮的部分仍然保持了较为丰富的纹理细节，对比度也得到了提高，更加贴合于图像中所表现物体的原有色彩。

采用本发明方法对肠道息肉图像使用融合策略进行局部增强处理，并与未增强的原始输入图像进行显著性对比。图5是未增强的原始输入图像和使用本发明方法所得到的最终局部增强图像后图像显著性的改变比较。由图5对比结果可以看出，肠息肉图像经过我们提出的融合策略局部增强之后，人们把目光更加聚焦在病变区域上了。因此，本文所提出的图像增强方法有望辅助医生做精准诊断。

上面对本发明实施例结合附图进行了说明，但本发明不限于上述实施例，还可以根据本发明的发明创造的目的做出多种变化，凡依据本发明技术方案的精神实质和原理下做的改变、修饰、替代、组合或简化，均应为等效的置换方式，只要符合本发明的发明目的，只要不背离本发明的技术原理和发明构思，都属于本发明的保护范围。

Claims

1.一种基于图像融合的肠道内窥镜图像增强方法，其特征在于，操作步骤如下：

步骤1：创建数据集；

步骤2：将数据集中的图像输入编码器-解码器多注意U-Net网络，进行深度网络模型训练和预测以获取全局增强图像；

步骤3：将数据集中的图像输入分割网络HarDNet-MSEG，进行深度网络模型训练和预测以获取息肉分割mask图像；

2.根据权利要求1所述的一种基于图像融合的肠道内窥镜图像增强方法，其特征在于，所述步骤1的创建数据集包括如下具体操作步骤：

1-1：从一些公开的胃肠道相关的医学影像开源数据集收集真实肠道图像和对应的息肉分割mask；

1-2：调整收集的图像的分辨率为256×256像素；

1-3：使用Adobe Lightroom来调整真实肠息肉图像以获取低质图像和高质量的参考图像；

1-4：邀请志愿者对1-3获取的图像进行主观评价以获取最佳图像输出。

1-5：将得到的数据集按2:1的比例划分训练集和测试集。

3.根据权利要求1所述的一种基于图像融合的肠道内窥镜图像增强方法，其特征在于，所述步骤2的编码器-解码器多注意U-Net网络模型训练和预测包括如下具体操作步骤：

2-1：编码器-解码器多注意U-Net网络EDMAU是一种图像增强网络，它由三个部分组成，分别是输入、编码注意力、解码注意力和输出；多注意力指的是细节注意力图和亮度注意力图；将训练集中的低质图像和高质量的参考图像输入EDMAU进行训练；

2-3：网络模型采用学习率为0.0002的优化算法，总共训练200个epochs；

2-4：将测试集输入训练好的EDMAU网络模型，得到模型预测的全局增强图像。

4.根据权利要求1所述的一种基于图像融合的肠道内窥镜图像增强方法，其特征在于，所述步骤3的分割网络HarDNet-MSEG包括如下具体操作步骤：

3-1：分割网络HarDNet-MSEG是一种肠道息肉分割网络，将训练集中的低质图像和相对应的息肉分割的mask输入EDMAU进行训练；

3-2：网络模型采用学习率为0.0001的优化算法，总共训练100个epochs；

3-3：将测试集输入训练好的HarDNet-MSEG网络模型，得到模型预测的mask图像。

5.根据权利要求1所述的一种基于图像融合的肠道内窥镜图像增强方法，其特征在于，所述步骤4的判断是否含有息肉是根据HarDNet-MSEG预测的mask图像来区分图像进行全局增强还是进一步的局部增强；图像中有无息肉，若不含有息肉，得到最终的全局增强图，若含有息肉，则执行步骤5。

6.根据权利要求1所述的一种基于图像融合的肠道内窥镜图像增强方法，其特征在于，所述步骤5的图像融合包括如下具体操作步骤：

5-1：对于mask图像提取的EDMAU图像的病变区域保留EDMAU增强效果；

5-2：对于mask图像提取的EDMAU图像的非病变区域使用伽马校正处理以弱化背景实现息肉图像的局部增强效果。