CN114972272A

CN114972272A - 一种基于Grad-CAM的新冠肺炎病灶分割方法

Info

Publication number: CN114972272A
Application number: CN202210617466.0A
Authority: CN
Inventors: 赵云龙; 黄永明
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-06-01
Filing date: 2022-06-01
Publication date: 2022-08-30

Abstract

本发明公开了一种基于Grad‑CAM的新冠肺炎病灶分割方法，该方法主要内容是：首先对CT图像进行图像常规预处理，再使用以OSTU为核心的图像二值化预处理方法增强肺部病灶和健康区域的对比度，并突出病灶边缘信息；将预处理好的CT图像输入分类卷积神经网络进行训练；在训练好的分类卷积神经网络中调用Grad‑CAM生成用以进行CT图像分类的特征区域定位热力图。最后在热力图中设定分割阈值，并根据阈值得到肺部病灶分割结果。通过本发明可以实现在只有类别标签，没有分割标签的情况下对新冠肺炎病灶的自动分割，从而节省人力，并保证分割结果的客观性。

Description

一种基于Grad-CAM的新冠肺炎病灶分割方法

技术领域

本发明属于新冠肺炎病灶分割领域，尤其涉及一种基于Grad-CAM的新冠肺炎病灶分割方法。

背景技术

由于RT-PCR存在假阴性率较高等缺陷，会延误对疑似病例的准确诊断。作为RT-PCR的重要补充，CT由于具有高空间分辨率，可以发现小的病灶，是一种有效筛查新冠肺炎的放射成像技术。但手工标注肺部病灶繁琐耗时，且具有高度主观性，通常存在个人偏差并受临床经验影响，以及病灶边界呈弥散性的特征，从而导致手工标注的误差较大。利用深度学习的方法在CT图像中自动检测新冠肺炎并分割病灶，可以帮助量化新冠肺炎的严重程度，从而辅助医生更快诊断和治疗。

由于新冠病毒变异较快，不同毒株造成的病理特征和肺部影像学改变有所差异，很难在短时间内快速定位病灶并收集足够的带有标注的数据来训练深度模型；同时当前大多公共新冠肺炎图像数据集只用于病例诊断，极少数提供了分割标签。此外，由于肺部病灶存在阴影和毛玻璃状的特点，导致边界不清晰，因此很难标记弥散性病变；以及手动标注大量数据容易引入噪声标签，影响深度学习的训练效果。但目前大多数基于深度学习的病灶分割算法在训练过程中都须提供一定数量带有分割标签的数据，当新冠病毒发生变异时，无法快速定位病灶，实现辅助医生诊断治疗的效果。

发明内容

针对现有技术存在的以上问题，本发明旨在提供一种基于Grad-CAM的新冠肺炎病灶分割方法，通过对二维CT图像进行去噪等图像常规预处理去除图像中的噪声并只保留肺部区域，通过进行以OSTU为核心的图像二值化预处理增强肺部病灶和健康区域的对比度，并突出病灶边缘信息，通过构建和训练一种基于Grad-CAM的新冠肺炎病灶分割模型，实现在只需类别标签，不需分割标签的情况下对新冠肺炎胸部CT病灶的分割。

为实现本发明的目的，本发明所采用的技术方案如下：

一种基于Grad-CAM的新冠肺炎病灶分割方法，所述方法包括以下步骤：

步骤1：对CT图像进行图像常规预处理；

步骤1.1：使用中值滤波对CT图像进行去噪；

步骤1.2：对CT图像进行裁剪以保留ROI；

步骤1.3：统一CT图像方向与人体方向对应关系；

步骤1.4：统一CT图像尺寸大小；

步骤2：使用以OSTU为核心的图像二值化预处理方法增强肺部病灶和健康区域的对比度，并突出病灶边缘信息；

步骤2.1：对CT图像进行亮度调整；

步骤2.2：使用自适应直方图均衡化对CT图像进行对比度调整；

步骤2.3：使用OSTU确定CT图像的二值化阈值，并进行二值化处理；

步骤2.4：通过对二值图进行并运算，保留肺部完整轮廓；

步骤2.5：对二值化处理结果取反；

步骤2.6：使用填洞和膨胀等提取肺部轮廓边缘信息；

步骤2.7：使用本发明设计算法去除图像边缘区域的无效信息；

步骤3：将预处理好的CT图像输入分类卷积神经网络进行训练；

步骤4：在训练好的分类卷积神经网络中调用Grad-CAM生成用以进行CT图像分类的特征区域定位热力图；

步骤5：在热力图中设定分割阈值，并根据阈值得到肺部病灶分割结果。

作为本发明的一种改进，所述步骤1中，对CT图像进行图像常规预处理的方法为：

所述步骤1.1中，由于部分CT图像中存在噪声，首先通过中值滤波的方法进行图像去噪。所述步骤1.2中，对于来源于不同设备扫描所得的CT图像而言，肺部区域在整个图像中的占比及空间分布有所差异，同时大多数CT图像也存在着肺部区域空间占比较小的问题，因此对所有CT图像进行裁剪，以尽可能地只保留感兴趣区域(Region of Interest，ROI)，去除图像中非肺部区域。所述步骤1.3中，由于来源于不同设备扫描所得的CT图像的方向也有所不同，所以将所有CT图像的方向统一调整为CT图像上方对应人体前方的关系。最后所述步骤1.4中，将所有CT图像的尺寸统一调整为512×512。

作为本发明的一种改进，所述步骤2中，使用以OSTU为核心的图像二值化预处理方法增强肺部病灶和健康区域的对比度，并突出病灶边缘信息。

所述步骤2.1中，本发明首先对经图像常规预处理后的CT图像进行亮度调整，将原来由于过暗而可能在二值化过程中被误判为背景的病灶在CT图像中突出，所述步骤2.2中，对 CT图像进行对比度调整，通过自适应直方图均衡化处理，增强肺部病灶与肺部健康区域之间的对比度，提高病灶的边缘清晰度。所述步骤2.3中，之后本发明通过最大类间方差法确定每张CT图像进行二值化处理的最佳阈值，阈值计算方法如下：

在CT图像I中，假设有L(L≥1)个灰度级，灰度级为i(1≤i≤L)的像素点数为s_i，图像I的像素点总数为S，则所有灰度级为i的像素点数出现的概率P_i为

将图像像素集合分为目标像素集合C_t和背景像素集合C_b，假设最佳阈值为k，灰度级i在 [1,k]的像素点被分入C_t，灰度级i在[k+1,L]的像素点被分入C_b。则目标像素集合C_t和背景像素集合C_b内的像素点在图像I所有的像素点中的占比ω_t和ω_b分别为

由上述两式可得目标像素均值μ_t和背景像素均值μ_b分别为

类间方差σ_t和σ_b分别为

二者总灰度均值μ为

类间总方差σ²为

σ²＝ω_tσ_t ²+ω_bσ_b ²

最佳阈值Th为

上式表示取类间总方差σ²最大值时的k作为最佳阈值。

根据该阈值对图像中的每个像素点赋值0或1，从而完成CT图像的二值化处理。但此时的二值化处理结果仍存在一定问题，如肺部轮廓处理过拟合、肺部边缘信息丢失和图像边缘区域存在无效信息等，所以仍需对此时的二值化处理结果做进一步优化处理。

所述步骤2.4中，为解决肺部轮廓处理过拟合的问题，本发明对经图像常规预处理后的 CT图像进行二值化处理，并将该二值化处理结果和上述二值化处理结果中的对应像素点进行并运算，从而在突出细节信息的情况下保留了完整了肺部轮廓。所述步骤2.5中，对经过并运算后的二值化处理结果进行取反，使得肺部主体表现为白色区域，从而便于后续优化处理。

所述步骤2.6中，为完善肺部边缘信息，本发明在经图像常规预处理后的CT图像中提取轮廓信息，并在进行轮廓提取之前，进行了填洞和膨胀操作，从而最终得到了完整了肺部轮廓信息。将提取到的肺部轮廓信息与上述取反后的二值化处理结果进行并运算，得到带有轮廓信息的二值化处理结果。

所述步骤2.7中，为去除图像边缘区域的无效信息，本发明设计了一种算法，可以在无人工干预的情况下自动去除二值图像中边缘白色无效信息，并在其中加入了防误判算法。最后在完善了肺部边缘信息的二值化处理结果中调用上述算法，生成最终经图像常规预处理和图像二值化预处理的CT图像。

作为本发明的一种改进，所述步骤3中，由于Grad-CAM是一种在分类过程中识别与特定类别相关性最高的特征区域的技术，因此我们可以利用患者CT与健康人CT的主要差异是有无病灶这一特点，在对其进行分类的过程中使用Grad-CAM来识别区分二者的特征区域，即病灶，从而实现在没有像素级别的分割标签的情况下胸部病灶的分割。因此在使用Grad-CAM前，本发明使用分类卷积神经网络对患者CT和健康人CT进行二分类。

作为本发明的一种改进，所述步骤4中，由于Grad-CAM可以应用于任何基于CNN的架构，所以可以在网络结构不变的情况下，在任意分类神经网络中直接使用Grad-CAM，生成热力图并进行病灶分割。本发明使用训练好的分类卷积神经网络对CT图像进行分类，在分类预测结果为患者CT的CT图像上使用Grad-CAM识别特征区域，并依据概率大小生成特征区域定位热力图，即在分类预测结果为患者CT的CT图像中得到病灶概率分布热力图。具体计算方法为：

为了获得任意类别c的类别判别定位图

Grad-CAM首先进行正向传播，计算类别c在softmax层之前的得分梯度y^c，其中y^c与卷积层的特征映射A^k(k代表特征层A中的第k个通道)有关；上述计算得到的梯度进行反向传播，并进行全局平均池化，以得到神经元重要性权重

其中，Z为特征层的宽度与高度之积，

为特征层A在通道k中，坐标为ij位置处的数据。权重

代表特征映射A下游深层网络的部分线性化，并获得目标类别c的特征映射k的重要性；之后Grad-CAM对前向激活映射进行加权组合，通过ReLU得到类别c的类别判别定位图

最后通过

产生与卷积特征映射大小相同的热力图，实现病灶区域定位。

(5)在热力图中设定分割阈值，并根据阈值得到肺部病灶分割结果。

作为本发明的一种改进，所述步骤5中，本发明对生成的病灶概率分布热力图进行处理，以确定最终病灶分割结果。本发明在大量新冠肺炎胸部CT公开数据集上调用Grad-CAM以生成病灶概率分布热力图，并在生成的热力图中通过二分法设置不同阈值，并评价在该阈值下病灶分割效果，以不断逼近最佳分割阈值。最后在病灶概率分布热力图中保留高于最佳分割阈值的区域作为最终病灶分割结果。

与现有技术相比，本发明的技术方案具有以下的有益技术效果：针对新冠肺炎病灶分割问题，本发明提出了一种新型的只依赖于类别标签，而不依赖于分割标签的基于深度学习的病灶分割方法。相较于其他依赖分割标签的深度学习算法，本发明不仅可以大大减少手动标注所耗费的人力和时间，也可以避免因手动标注引入的噪声标签，从而保证了分割结果的客观性和准确性。本发明可以自动对CT图像进行分类，并对分类预测结果为患者CT的图像进行病灶分割，而其他大多数深度学习算法仍需人工进行分类后才可以进行病灶分割。同时本发明具有较强的泛化能力，可以在缺乏病灶分割标签的情况下快速定位病灶所处区域，并通过热力图的形式提供该区域为病灶的概率信息，进一步辅助医生查找病因。此外，本研究技术路线实现并不复杂，所需计算成本较小，对硬件条件要求不高。

附图说明

图1是本发明一种基于Grad-CAM的新冠肺炎病灶分割方法流程图；

图2是本发明采用的图像常规预处理方法流程图；

图3是本发明采用的图像二值化预处理方法流程图；

图4是本发明采用的图像二值化预处理方法中边缘区域无效信息去除算法流程图。

具体实施方式

下面结合附图和实施例对本发明的技术方案作进一步的说明。

实施例1：如图1所示，本发明提出了一种基于Grad-CAM的新冠肺炎病灶分割方法，该方法的详细步骤为：

(1)对CT图像进行图像常规预处理；

图像常规预处理方法一般包括图像去噪、图像增强、对比度调整、亮度调整和尺寸调整等。本发明根据CT图像中较为常见的问题，对其进行了如图2所示的常规预处理。

由于部分CT图像中存在噪声，首先通过中值滤波的方法进行图像去噪。对于来源于不同设备扫描所得的CT图像而言，肺部区域在整个图像中的占比及空间分布有所差异，同时大多数CT图像也存在着肺部区域空间占比较小的问题，因此对所有CT图像进行裁剪，以尽可能地只保留感兴趣区域(Region of Interest，ROI)，去除图像中非肺部区域。此外，来源于不同设备扫描所得的CT图像的方向也有所不同，所以将所有CT图像的方向统一调整为CT 图像上方对应人体前方的关系。最后将所有CT图像的尺寸统一调整为512×512。

(2)使用以OSTU为核心的图像二值化预处理方法增强肺部病灶和健康区域的对比度，并突出病灶边缘信息；

虽然经图像常规预处理后的CT图像中已尽可能地去除非肺部区域，只保留ROI，并且图像质量有所提升，但在CT图像中，由于新冠肺炎病灶对比度不明显和边缘不清晰等特点，以及CT图像是以灰度图的形式展现的，所以在经图像常规预处理后的CT图像中仍无法较为准确和明显地区分出肺部病灶和肺部健康区域，因此有必要通过进一步图像预处理解决上述问题。

本发明在图像常规预处理方法的基础上，给出了基于OSTU的CT图像二值化预处理方法，即通过以最大类间方差法为核心和主要特点的二值化处理方法来增强肺部病灶和肺部健康区域的对比度，提供更加有效的信息，从而更有利于新冠肺炎胸部CT分类和病灶分割的深度学习算法的训练，提高分类和病灶分割准确率。其方法流程见图3。

为提高图像二值化处理效果、尽可能保留更多的细节信息，本发明首先对经图像常规预处理后的CT图像进行亮度调整，通过将其亮度调整为原来的2倍，将原来由于过暗而可能在二值化过程中被误判为背景的病灶在CT图像中突出，从而尽可能保证了病灶的完整性。之后本发明继续对CT图像进行对比度调整，通过自适应直方图均衡化处理，增强肺部病灶与肺部健康区域之间的对比度，提高病灶的边缘清晰度，从而可以在二值化处理的过程中尽可能准确完整地保留病灶的边缘与轮廓信息。

在完成亮度调整和对比度调整等准备工作后，本发明通过最大类间方差法确定每张CT图像进行二值化处理的最佳阈值，阈值计算方法如下：

由上述两式可得目标像素均值μ_t和背景像素均值μ_b分别为

类间方差σ_t和σ_b分别为

二者总灰度均值μ为

类间总方差σ²为

σ²＝ω_tσ_t ²+ω_bσ_b ²

最佳阈值Th为

上式表示取类间总方差σ²最大值时的k作为最佳阈值。

为解决肺部轮廓处理过拟合的问题，本发明对亮度调整和对比度调整之前的CT图像进行二值化处理，所用方法仍为最大类间方差法；之后将该二值化处理结果和经过亮度调整和对比度调整后生成的二值化处理结果中的对应像素点进行并运算，从而在突出细节信息的情况下保留了完整了肺部轮廓。之后对经过并运算后的二值化处理结果进行取反，使得肺部主体表现为白色区域，从而便于后续优化处理。

为完善肺部边缘信息，本发明通过bwperim算法在亮度调整和对比度调整之前的CT图像中提取轮廓信息，但由于肺部内部有较多的纹理，在提取肺部轮廓的同时也将其内部的各种孔洞纹理提取了出来，所以在进行轮廓提取之前，须进行填洞和膨胀操作，从而最终得到了完整了肺部轮廓信息。将提取到的肺部轮廓信息与上述取反后的二值化处理结果进行并运算，得到带有轮廓信息的二值化处理结果。

为去除图像边缘区域的无效信息，本发明设计了一种算法，可以在无人工干预的情况下自动去除二值图像中边缘白色无效信息。算法流程见图4。

该算法首先对图像中的每一个像素点进行分类，判断其在二值图像中位于白色区域还是黑色区域。由于二值图像中白色区域也存在少量黑色像素点，所以当以某像素点为中心的九宫格中的9个相关像素点中有任意1个像素点为白色时，则判断该像素点位于白色区域，分类矩阵WorB相应位置取1；否则判断该像素点位于黑色区域，分类矩阵WorB相应位置取0。

之后判断上述分类出的白色像素点是否位于边缘区域。算法依次对分类矩阵WorB中的每一行从左到右遍历左半部分，从右到左遍历右半部分；对每一列从上到下遍历上半部分，从下到上遍历下半部分，判断所有白色像素点是否位于边缘区域。最后对四个方向的判断结果进行并运算，得到边缘判断矩阵EorN。以从左到右这一方向为例对判断方法进行具体说明。对于分类矩阵WorB中的某一行而言，从最左边的元素开始遍历，当连续遍历到n个0(即黑色像素点)时，该连续序列中的首个0左边的所有元素在边缘判断矩阵EorN中的对应位置赋值1，右边所有元素及其自身的对应位置赋值0。

但在部分CT图像中也存在肺部区域位于边缘的情况，所以需要加入防误判算法以避免将肺部区域误判为边缘无效信息，从而误去除掉。因此，在上述遍历判断是否位于边缘区域的基础上，加入防误判算法，即当在某个方向进行遍历时，如已遍历m个点，但仍未连续遍历到n个0，则判断该边缘区域为有效信息，该行(列)停止遍历，该行(列)所有元素赋值0。

最后在完善了肺部边缘信息的二值化处理结果中调用上述算法，生成最终经图像常规预处理和图像二值化预处理的CT图像。

(3)将预处理好的CT图像输入分类卷积神经网络进行训练；

由于Grad-CAM是一种在分类过程中识别与特定类别相关性最高的特征区域的技术，因此我们可以利用患者CT与健康人CT的主要差异是有无病灶这一特点，在对其进行分类的过程中使用Grad-CAM来识别区分二者的特征区域，即病灶，从而实现在没有像素级别的分割标签的情况下胸部病灶的分割。因此在使用Grad-CAM前，本发明需要对患者CT和健康人 CT进行二分类。

具体来说，本发明在PyTorch中调用预训练的SqueezeNet1.1作为本发明所用分类神经网络，并将其最后一层卷积层的out_channels的值修改为2。载入经过图像常规预处理和二值化预处理方法处理后的数据集，并设置好模型训练参数，其中epochs＝100，之后开始训练。经过训练，得到具有较高分类准确率的SqueezeNet1.1模型。

(4)在训练好的分类卷积神经网络中调用Grad-CAM生成用以进行CT图像分类的特征区域定位热力图；

由于Grad-CAM可以应用于任何基于CNN的架构，所以可以在网络结构不变的情况下，在任意分类神经网络中直接使用Grad-CAM，生成热力图并进行病灶分割。本发明使用训练好的SqueezeNet1.1对CT图像进行分类，在分类预测结果为患者CT的CT图像上使用Grad-CAM识别特征区域，并依据概率大小生成特征区域定位热力图，即在分类预测结果为患者CT的CT图像中得到病灶概率分布热力图。具体计算方法为：

为了获得任意类别c的类别判别定位图

其中，Z为特征层的宽度与高度之积，

为特征层A在通道k中，坐标为ij位置处的数据。权重

最后通过

由于Grad-CAM识别的病灶是通过生成热力图的方式展现的，所以本发明需要对生成的原始热力图进行处理，以确定最终病灶分割结果。本发明在大量新冠肺炎胸部CT公开数据集上调用Grad-CAM以生成病灶概率分布热力图，并在生成的热力图中通过二分法设置不同阈值，并评价在该阈值下病灶分割效果，以不断逼近最佳分割阈值。通过对大量数据的分析，本发明设定最佳分割阈值为0.32，并在病灶概率分布热力图中保留高于最佳分割阈值的区域作为最终病灶分割结果。

需要说明的是上述实施例仅仅是本发明的较佳实施例，并没有用来限定本发明的保护范围，在上述技术方案的基础上做出的等同替换或者替代均属于本发明的保护范围。

Claims

1.一种基于Grad-CAM的新冠肺炎病灶分割方法，其特征在于，所述方法包括以下步骤：

步骤1：对CT图像进行图像常规预处理；

2.根据权利要求1所述的一种基于Grad-CAM的新冠肺炎病灶分割方法，其特征在于：所述步骤1中，对CT图像进行图像常规预处理的方法为：

步骤1.1：使用中值滤波对CT图像进行去噪；

步骤1.2：对CT图像进行裁剪以保留ROI；

步骤1.3：统一CT图像方向与人体方向对应关系；

步骤1.4：统一CT图像尺寸大小。

3.根据权利要求1所述的一种基于Grad-CAM的新冠肺炎病灶分割方法，其特征在于：所述步骤2中，包括以下步骤：

步骤2.1：对CT图像进行亮度调整；

步骤2.4：通过对二值图进行并运算，保留肺部完整轮廓；

步骤2.5：对二值化处理结果取反；

步骤2.6：使用填洞和膨胀等提取肺部轮廓边缘信息；

步骤2.7：使用本发明设计算法去除图像边缘区域的无效信息。

4.根据权利要求3所述的一种基于Grad-CAM的新冠肺炎病灶分割方法，其特征在于：所述步骤2中，

所述步骤2.3中，通过最大类间方差法确定每张CT图像进行二值化处理的最佳阈值，阈值计算方法如下：

将图像像素集合分为目标像素集合C_t和背景像素集合C_b，假设最佳阈值为k，灰度级i在[1,k]的像素点被分入C_t，灰度级i在[k+1,L]的像素点被分入C_b；则目标像素集合C_t和背景像素集合C_b内的像素点在图像I所有的像素点中的占比ω_t和ω_b分别为

由上述两式可得目标像素均值μ_t和背景像素均值μ_b分别为

类间方差σ_t和σ_b分别为

二者总灰度均值μ为

类间总方差σ²为

σ²＝ω_tσ_t ²+ω_bσ_b ²

最佳阈值Th为

上式表示取类间总方差σ²最大值时的k作为最佳阈值；根据该阈值对图像中的每个像素点赋值0或1，从而完成CT图像的二值化处理。

5.根据权利要求1所述的一种基于Grad-CAM的新冠肺炎病灶分割方法，其特征在于：所述步骤3中，在使用Grad-CAM前，使用分类卷积神经网络对患者CT和健康人CT进行二分类。

6.根据权利要求1所述的一种基于Grad-CAM的新冠肺炎病灶分割方法，其特征在于：所述步骤4中，使用训练好的分类卷积神经网络对CT图像进行分类，在分类预测结果为患者CT的CT图像上使用Grad-CAM识别特征区域，并依据概率大小生成特征区域定位热力图，即在分类预测结果为患者CT的CT图像中得到病灶概率分布热力图；具体计算方法为：

为了获得任意类别c的类别判别定位图

其中，Z为特征层的宽度与高度之积，

为特征层A在通道k中，坐标为ij位置处的数据，权重

最后通过