CN112598613A

CN112598613A - 一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法

Info

Publication number: CN112598613A
Application number: CN201910869861.6A
Authority: CN
Inventors: 周文生; 高为雄; 汪明啸
Original assignee: Suzhou Suyou Data Technology Co ltd
Current assignee: Suzhou Suyou Data Technology Co ltd
Priority date: 2019-09-16
Filing date: 2019-09-16
Publication date: 2021-04-02

Abstract

本发明涉及医疗技术领域，具体涉及一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，步骤一，结节训练数据集：以天池医疗AI竞赛中提供了肺部CT图像的标记结节的位置，使用天池医疗AI数据集来产生适当的训练集；步骤二，肺部区域和结节图像的生成：利用图像分割算法生成肺部区域的mask图像，然后根据mask图像生成肺区域图像；步骤三，利用U‑Net通过分割检测来发现疑似肺结节；步骤四：ResNet‑50肺癌结节概率预测；它能够快速判定，极大地提高了诊断效率，也节约了医疗资源，利于当下的医疗体系，以及能够实现早发现早治疗的愿景。

Description

一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法

【技术领域】

本发明涉及医疗技术领域，具体涉及一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法。

【背景技术】

肺癌是所有癌症中致死率最高的一种，比一年内死于乳腺癌、前列腺癌和结肠癌的人数还多。医学图像分割是图像处理和图像分析领域中的一个复杂问题。尽管在一些研究中已经解决了胸部X光图像中肺组织分割的问题，但在很多情况下完全自动提取肺区域的结果仍然令人不满意。

肺癌最好的生存机会来自早期发现和治疗，这可能通过改进的自动化恶性结节检测方法来帮助。肺的放射科医生通常检测肺结节在片内考虑肋骨的形状和圆形物体的亮度。肺结节是胸腔内小而圆的组织生长。结节一般被认为是小于30mm的尺寸，较大的肿瘤被推定为恶性。结节间5-30MM可能是良性或恶性，随着规模的增大，恶性肿瘤的可能性。有迹象显示，钙化结节良性而更光滑分叶状或结节边缘毛刺可能提示恶性肿瘤。肺的放射科医生通常检测肺结节在片内考虑肋骨的形状和圆形物体的亮度。

计算机辅助检测(CAD)技术的研究使肺结节的识别更加快速、准确。结节检测算法已被设计为使用传统的图像处理技术，以确定区域的胸部照片，可能包含一个明亮的对象的预期大小，形状和纹理的肺结节。

但是在医院里，放射科医生从CT扫描图像工作，希望尽早诊断患者。但是在当医疗资源紧张的当下，意昧着放射科医生需要每天检查数百张图像，上述检查对照料比对判定工作，其工作量大，工作繁琐，易使放射科医生产生工作疲劳，从而易导致错误或误诊，最终影响诊断效果。

【发明内容】

本发明的目的在于针对现有技术的缺陷和不足，提供一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，它能够快速判定，极大地提高了诊断效率，也节约了医疗资源，利于当下的医疗体系，以及能够实现早发现早治疗的愿景。

本发明所述的一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，采用如下步骤：

步骤一，结节训练数据集：以天池医疗AI竞赛中提供了肺部CT图像的标记结节的位置，使用天池医疗AI数据集来产生适当的训练集；

步骤二，肺部区域和结节图像的生成：利用图像分割算法生成肺部区域的 mask图像，然后根据mask图像生成肺区域图像；

其采用如下步骤：

(1)在病患的CT肺部扫描图像中找到最大的肺结节，使用 annotations.csv给出的肺部结节位置，针对肺部CT图像切三层，只选在最大的结节为中心的切片图像；

(2)使用pandas中称为df_node的数据帧记录肺部CT图像数和节点信息，节点坐标信息(x，y，z)在MHD文件中定义；

(3)提取CT图像中的肺部区域，步骤如下：

B.导入skimage图像处理模块；

B.从天池医疗AI数据集提取的一个512×512切片，标准化像素值，检查强度分布；

C.利用腐蚀和膨胀填写侵入肺部区域的不透明组织，选择基于轮廓大小的每个区域，对每个肺部CT图像的ROI的mask图像进行裁剪，然后调整图像到512×512，形成结节标记信息的结节mask图像；

步骤三，利用U-Net通过分割检测来发现疑似肺结节，根据肺结节卷积网络分割结果，对分割图像进行二值化分割，提取连接块处理，提取疑似肺结节，采用如下步骤：

(1)利用Keras框架来构建U-Net卷积神经网络架构；

(2)步骤(1)中的U-Net卷积神经网络架构，由一个收缩路径和一个膨胀路径组成；

(3)步骤(2)中的收缩路径遵循卷积网络的典型体系结构，由两个3×3 卷积、纠正线性单元和2×2卷积运行下采样的最大池构成；

(4)每个采样步骤增加了特征频道的数量，在在步骤(2)中的膨胀路径的每一步，一是特征图的采样；二是2×2卷积，2×2卷积为了上卷积，将特征通道的数量减半，并将相应的裁剪特征映射与收缩路径连接起来；三是两个 3×3卷积；

(5)在步骤(3)中的纠正线性单元中，由于每个卷积中边界像素的丢失，故需要裁剪，最后一层1×1卷积用于映射各64组特征向量所需数量的类；形成疑似肺结节图像；

(6)输入疑似肺结节图像和相应的分割映射，是使用Caffe的随机梯度下降实现来训练卷积神经网络，实现深度学习训练；

(7)利用大量先前见过的训练样本，决定当前优化步骤中的更新，在最终特征映射上结合交叉熵损失函数，利用像素级soft-max计算能量函数；然后，交叉熵从1开始惩罚p_l(x)(x)在每个位置的偏差；使用形态学运算计算分离边界，然后计算权重映射；

(8)根据步骤(2)中的U-Net网络架构，其交替的卷积层和ReLU层，可以从一个高斯分布标准差

的初始权值来实现，其中N表示一个神经元的输入节点数；

步骤四：ResNet-50肺癌结节概率预测，采用如下步骤：

(1)根据步骤三中的形成的疑似肺结节图像，利用卷积神经网络，用于疑似肺结节的分类，并确定疑似肺结节是否为真正的肺结节；

(2)使用一个50层的剩余网络学习迁移模型，剩余网络学习迁移模型为 ResNet模型；通过固定预训练的权重的ResNet，特征是从五个不同的层中提取；

(3)步骤(2)中的特征从ResNet层的pool1，res2c，res3d，res4f，和pool5中提取出来；

pool1层经过一个单一的卷积层，其次是batchnorm和ReLu层和最大池化层；

res2c层在三层ResNet之后，res3d在七层之后，res4f在十三层之后；

pool5层在十六层后，并且是最后一个平均池层，pool5层在全连接层产生的预测分类的50层ResNet的最后一层；

提取的特征保存到磁盘以加快计算速度；由于ResNet卷积层冻结，故没有必要在深度训练中反向传播；

(3)提取的特征被输入到最终的完全连接层，并且有三个输出；通过解释输出三类肺部结节的非标准概率和最小化这些标记和正确的图像标记之间的交叉熵损失，最后一层被训练为Softmax分类器；其中：三类肺部结节分别为：非肺结节，良性肺结节，恶性肺结节；

单一图像的交叉熵损失的公式如下：

其中，s_j是的输出向量，并且j^th是正确图像的标记；

(4)深度卷积神经网络的总损失是图像损失的平均值和L2范数正则化项有利于小权重和避免过度拟合训练数据的总和，它的完全损失的公式如下：

其中：λ是一个调节常数，W是权重矩阵；

上述算法试图找到最小化这种损失函数的权重，而这种最小化是通过动量的小批量梯度下降完成的；在每次迭代中，使用如下的动量更新方程更新权重：

W←W+v

其中：α是学习速率，μ是动量参数，并且损失的梯度

是在一批训练数据上计算的；

(5)特征提取的最后pool5层与良性或恶性结节也被送入一个单独的回归头结节定位图像；这个完全连接层有四个输出，代表网络对结节周围坐标的预测；通过最小化预测坐标和真正的结节轮廓坐标之间的欧几里德距离来训练这一层的权重；总损失函数是图像的欧氏距离和正则化项的平均值之和，公式如下所示：

其中：s_j是j^th的输出向量，并且b_j是j^th的真正轮廓坐标矢量。

本发明有益效果为：本发明所述的一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，它利用深卷积神经网络，通过采样部分还有大量特征的通道，使网络传播语境信息到高分辨率层，从而只需要很少的训练图像数据集，就可获得更精确的分割，既而实现精准测定，形成完全卷积网络；

它使用图像分割算法生成肺部区域的mask图，然后找到疑似结节后，使用常见的图像分类算法对疑似结节进行分类，将肺部图像中的疑似结节分为二类，然后假设天池数据集中的肺结节是真正的肺结节，而U-Net图像分割预测生成的肺结节得出疑似肺结节，然后再将测试数据集中预测的肺部疑似结节的图像输入到caffe深度模型训练中，统计预测出的肺部疑似结节是真正结节的概率，进行比较是否为真正肺结节的概率；

它具有减少放射科医生查看图片的数量，极大地减少了工作量，能够缓解当下医疗资源紧张的现状，利于快速实现诊断，也减少了人为诊断错误和误诊。

【附图说明】

此处所说明的附图是用来提供对本发明的进一步理解，构成本申请的一部分，但并不构成对本发明的不当限定，在附图中：

图1是本发明中的U-Net体系结构图；

图2是本发明中的任意大图像无缝分割的重叠平铺策略的示意图；

图3是本发明中的用于结节分类和定位的50层残留网络的拓扑图；

图4是本发明中的天池数据集val set的肺部区域图像、肺结节的mask 图像和U-Net深度训练预测生成的测试数据集的肺疑似结节mask的分割图像；

图5是本发明中的是肺部测试CT图像的疑似结节中心坐标(x，y，z)和 diameter_mm的预测误差曲线图；

图6是本发明中的U-Net深度训练生成的肺部测试CT图像疑似结节切片图像。

【具体实施方式】

下面将结合附图以及具体实施例来详细说明本发明，其中的示意性实施例以及说明仅用来解释本发明，但并不作为对本发明的限定。

本具体实施方式所述的一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，采用如下步骤：

本发明中的训练数据集，用来训练用于图像分割的有监督学习的卷积神经网络；

其采用如下步骤：

(4)在病患的CT肺部扫描图像中找到最大的肺结节，使用 annotations.csv给出的肺部结节位置，针对肺部CT图像切三层，只选在最大的结节为中心的切片图像；

(5)使用pandas中称为df_node的数据帧记录肺部CT图像数和节点信息，节点坐标信息(x，y，z)在MHD文件中定义；

本发明中，结节位置以毫米为单位，与CT扫描图像所定义的坐标系统相对应。图像数据给出了不同长度的堆栈的512×512阵；为了把肺结节的图像坐标转换为世界坐标，需要知道[0，0，0]体素在现实世界中的位置和在毫米上的像素间距；

由于结节的位置是球形的，结节形状不规则，球状边缘附近的切片可能没有根瘤组织；使用这种切片会污染训练集的假阳性；对于这个分割项目，可能有一个通过结节的最佳的切片数目；本发明中，针对肺部CT图像切3层，只选在最大的结节为中心的切片图像；

(3)提取CT图像中的肺部区域，步骤如下：

C.导入skimage图像处理模块；

本发明中，提取CT图像中的肺部区域。需要导入skimage图像处理模块，一般的策略是使用阈值图像以提取图像中的区域，然后识别哪些区域是肺；肺部有一个与周围组织的高对比度，所以阈值相当简单。本发明利用腐蚀和膨胀填写侵入肺部区域的不透明组织，选择基于轮廓大小的每个区域，对每个肺部 CT图像的ROI的mask图像进行裁剪，然后调整图像到512×512，来消除图像中不适用于所有数据集的非肺部区域；生成结节标记信息的结节mask图像；

步骤三，利用U-Net通过分割检测来发现疑似肺结节，采用如下步骤：

根据肺结节卷积网络分割结果，对分割图像进行二值化分割，提取连接块处理，提取疑似肺结节。由于CT的图像是一个扫描序列，参与者可能需要对多帧的结果进行融合；

(1)利用Keras框架来构建U-Net卷积神经网络架构；

本发明中，利用肺部分割生成肺部区域图像、加上结节标记信息生成结节 mask图像，然后基于卷积神经网络训练肺结节分割器。根据肺结节卷积网络分割结果，对分割图像进行二值化分割，提取连接块处理，提取疑似肺结节。由于CT的图像是一个扫描序列，参与者可能需要对多帧的结果进行融合；

本发明中，损失函数是预测和实际肺结节mask图像比较的dice_coef系数；本发明中，U-Net网络架构如图1所示。U-Net网络架构由一个收缩路径 (左侧)和一个膨胀路径(右侧)组成。

如图1所示，U-Net体系结构中，每个蓝色框(实心框)对应一个多通道特征映射图；通道的数目表示在盒子的顶部，x-y-size在盒子的左下边缘设置，白盒(空心框)表示复制的特征映射，箭头表示不同的操作。

本发明中，收缩路径遵循卷积网络的典型体系结构，由两个3×3卷积、纠正线性单元(ReLU)和2×2运行下采样的最大池构成；

在每个采样步骤增加了特征频道的数量，在膨胀的路径的每一步，包括特征图的采样，其次是2×2卷积(“上卷积”)，将特征通道的数量减半，并将相应的裁剪特征映射与收缩路径连接起来，和两个3×3卷积；

其次是ReLU(纠正线性单元)，由于每个卷积中边界像素的丢失，所以裁剪是必要的；最后一层1×1卷积用于映射各64组特征向量所需数量的类；

本发明中，U-Net网络有23个卷积层，允许一个无缝拼接的输出分割图 (如图2所示)，选择输入图像的大小，2×2最大池操作应用于一个连接x- y-size的层；

如图2所示，任意大图像无缝分割的重叠平铺策略。预测黄色区域(A区域)的分割，需要蓝色区域(B区域)内的图像数据作为输入，缺少的输入数据是通过镜像来推断的。

(8)在有许多卷积层和通过网络的不同路径的深度卷积神经网络中，初始权值应该进行调整，使得网络中的每个特征映射具有近似的单位方差；根据步骤(2)中的U-Net网络架构，其交替的卷积层和ReLU层，可以从一个高斯分布标准差

的初始权值来实现，其中N表示一个神经元的输入节点数；

本发明中，当只有很少的训练样本可用时，数据增强是训练网络所需的不变性和鲁棒性的必要条件；在显微镜图像的情况下，我们主要需要平移和旋转不变性以及对变形和灰度值变化的鲁棒性。特别是训练样本的随机弹性变形似乎是训练具有很少标记图像的分割网络的关键概念；在粗糙的3×3网格上用随机位移矢量生成光滑变形。位移由10个标准偏差的高斯分布采样。每像素位移，然后利用双三次插值计算。收缩路径结束时的层执行进一步的隐式数据增强；

步骤四：ResNet-50肺癌结节概率预测，采用如下步骤：

(2)使用一个50层的剩余网络学习迁移模型，剩余网络学习迁移模型为 ResNet模型；ResNet模型是深度卷积神经网络，通过网络反向传播的梯度，从而改进训练；通过固定预训练的权重的ResNet，特征是从五个不同的层中提取；

(3)步骤(2)中的特征从ResNet层的pool1，res2c，res3d，res4f，和pool5中提取出来(如图6所示)；

(6)提取的特征被输入到最终的完全连接层，并且有三个输出；通过解释输出三类肺部结节的非标准概率和最小化这些标记和正确的图像标记之间的交叉熵损失，最后一层被训练为Softmax分类器；其中：三类肺部结节分别为：非肺结节，良性肺结节，恶性肺结节；

单一图像的交叉熵损失的公式如下：

其中，s_j是的输出向量，并且j^th是正确图像的标记；

其中：λ是一个调节常数，W是权重矩阵；

W←W+v

其中：α是学习速率，μ是动量参数，并且损失的梯度

是在一批训练数据上计算的；

本发明中，图1U-Net体系结构。每个蓝色框对应一个多通道特征映射图。通道的数目表示在盒子的顶部，x-y-size在盒子的左下边缘设置。白盒表示复制的特征映射。箭头表示不同的操作。

图2任意大图像无缝分割的重叠平铺策略。预测黄色区域的分割，需要蓝色区域内的图像数据作为输入。缺少的输入数据是通过镜像来推断的。

图3是本发明中的用于结节分类和定位的50层残留网络的拓扑图。

本发明中，通过实验来进一步说明本发明的方法步骤。首先是使用图像分割算法生成肺部区域的mask图，然后根据mask图生成肺部区域图像；

如图4所示是天池数据集val set的肺部区域图像、肺结节(Ground Truth)的mask图像和U-Net深度训练(CNN)预测(Prediction)生成的测试数据集的肺疑似结节mask的分割(Segmentation)图像。

利用肺部分割生成的肺部区域图像，加上结节标注信息生成的结节mask 图像，训练基于卷积神经网络的肺结节分割器。基于卷积网络的肺结节分割结果，对分割结果图像进行二值化，提取连通块等处理，提取出疑似肺结节。由于CT图像是一个扫描序列，参赛者可能需要对多帧的结果进行融合。

测试数据集中的CT图像通过U-Net深度计算生成的模型unet.hdf5，预测该肺部测试图像的疑似结节mask图像中心图像坐标，程序将图像坐标转换为世界坐标。

如下表所示，是预测的该肺部测试图像的疑似结节mask图像中心的世界坐标与切割肺部图像对应的立方体的世界坐标的匹配结果，它包括了 seriesuid，coordX，coordY，coordZ，diameter_mm这4列。

表一：U-Net深度训练(天池)肺部测试CT图像的疑似结节图像分割的 dice和IoU；

表二：预测的(天池)肺部测试CT图像的疑似结节中心坐标(x，y，z)和 diameter_mm(单位：mm)

实验分析，通过训练基于卷积神经网络的肺结节分割器，提取出的疑似肺结节的坐标和diameter_mm与真实值还是比较近似的。如图5所示，是肺部测试CT图像的疑似结节中心坐标(x，y，z)和diameter_mm的预测误差曲线图，坐标轴的单位是：mm。

表三：肺部测试CT图像疑似结节中心坐标(x，y，z)和diameter_mm的预测误差均值；

然后，使用预测得出的测试数据集的疑似肺部结节坐标，对肺部CT图像切片，生成测试数据集预测的肺部结节的切片JPEG图像，如图6所示，图6 是U-Net深度训练生成的肺部测试CT图像疑似结节切片图像。

最后，预测疑似结节是肺癌结节的概率。找到疑似结节后，可以使用常见的图像分类算法对疑似结节进行分类，得出疑似肺结节是否为真正肺结节的概率。

首先，对天池数据集的train set和val set进行CT图像预处理，根据annotations.csv中肺部结节的坐标和diameter_mm，对肺部CT图像切片，导出train set和val set中肺部结节的切片JPEG图像。

其次，将肺部图像中的疑似结节分为2类，假设天池数据集中的肺结节是真正的肺结节，而U-Net图像分割预测生成的肺结节，如果肺部结节coordX， coordY，coordZ和diameter_mm的ground truth与预测值误差，相对于 diameter_mm的比值较小(比如，小于0.1)，那么label就是1(真结节)，否则label是0(假结节)。

表四：肺部疑似结节Caffe深度模型训练的accuracy结果(中间过程)

最后，将测试数据集中预测的肺部疑似结节的.npy图像输入到 caffemodel中，统计预测出的肺部疑似结节是真正结节的概率。

本发明中，构建了一个更优雅的体系结构，即“完全卷积网络”。我们修改和扩展了这种架构，使得它只需要很少的训练图像数据集，就可获得更精确的分割，如图1所示。

其主要思想是通过连续层补充网络，通过上采样算子替代采样运算。因此，这些层增加了输出的分辨率。为了实现高分辨率的特点，从收缩路径结合上采样输出。一个连续的卷积层可以学习根据这个信息来组装更精确的输出。

本文要求使用CT图像数据(MHD)来训练模型，并给出CT图像中肺结节的中心位置，该测试数据与是否是真实肺结节无关。一般来说，分类器可以给出概率。通过训练和观察结节的特征，并在给定的结节图像中发现这些疑似肺结节。其中的困难之一是容易混淆的结节和其他血管图像。

本发明中，通过两阶段的深度图像分割和识别算法实现肺癌结节智能诊断，该算法可以自动检测和诊断组织图像，如肺扫描的CT结节到癌或非癌结节。在第一阶段，对输入图像进行预处理，对癌结节区域进行分割。

第二阶段是基于结节区域和灰度级的模糊系统对肺结节进行诊断。拟议工作的目的是减少假阳性分类，同时保持高度的阳性诊断。

以上所述仅是本发明的较佳实施方式，故凡依本发明专利申请范围所述特征及原理所做的等效变化或修饰，均包括于本发明专利申请范围内。

Claims

1.一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，其特征在于：采用如下步骤：

步骤二，肺部区域和结节图像的生成：利用图像分割算法生成肺部区域的mask图像，然后根据mask图像生成肺区域图像；

步骤三，利用U-Net通过分割检测来发现疑似肺结节，根据肺结节卷积网络分割结果，对分割图像进行二值化分割，提取连接块处理，提取疑似肺结节，

步骤四：ResNet-50肺癌结节概率预测，采用如下步骤：

(2)使用一个50层的剩余网络学习迁移模型，剩余网络学习迁移模型为ResNet模型；通过固定预训练的权重的ResNet，特征是从五个不同的层中提取；

(1)提取的特征被输入到最终的完全连接层，并且有三个输出；通过解释输出三类肺部结节的非标准概率和最小化这些标记和正确的图像标记之间的交叉熵损失，最后一层被训练为Softmax分类器；其中：三类肺部结节分别为：非肺结节，良性肺结节，恶性肺结节；

单一图像的交叉熵损失的公式如下：

其中，s_j是的输出向量，并且j^th是正确图像的标记；

其中：λ是一个调节常数，W是权重矩阵；

W←W+v

其中：α是学习速率，μ是动量参数，并且损失的梯度

是在一批训练数据上计算的；

2.根据权利要求1所述的一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，其特征在于：步骤二中肺部区域和结节图像的生成，采用如下步骤：

(1)在病患的CT肺部扫描图像中找到最大的肺结节，使用annotations.csv给出的肺部结节位置，针对肺部CT图像切三层，只选在最大的结节为中心的切片图像；

(3)提取CT图像中的肺部区域。

3.根据权利要求2所述的一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，其特征在于：步骤二中的步骤(3)中，提取CT图像中的肺部区域，采用如下步骤：

A.导入skimage图像处理模块；

C.利用腐蚀和膨胀填写侵入肺部区域的不透明组织，选择基于轮廓大小的每个区域，对每个肺部CT图像的ROI的mask图像进行裁剪，然后调整图像到512×512，形成结节标记信息的结节mask图像。

4.根据权利要求1所述的一种用于肺癌智能诊断的基于深度图像分割和识别的测定方法，其特征在于：步骤二中的提取疑似肺结节，采用如下步骤：

(1)利用Keras框架来构建U-Net卷积神经网络架构；

(3)步骤(2)中的收缩路径遵循卷积网络的典型体系结构，由两个3×3卷积、纠正线性单元和2×2卷积运行下采样的最大池构成；

(4)每个采样步骤增加了特征频道的数量，在在步骤(2)中的膨胀路径的每一步，一是特征图的采样；二是2×2卷积，2×2卷积为了上卷积，将特征通道的数量减半，并将相应的裁剪特征映射与收缩路径连接起来；三是两个3×3卷积；

的初始权值来实现，其中N表示一个神经元的输入节点数。