CN111414956B

CN111414956B - 一种肺部ct图像中模糊模式的多示例学习识别方法

Info

Publication number: CN111414956B
Application number: CN202010189494.8A
Authority: CN
Inventors: 齐守良; 徐偲文; 马贺; 钱唯
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2020-03-18
Filing date: 2020-03-18
Publication date: 2024-01-30
Anticipated expiration: 2040-03-18
Also published as: CN111414956A

Abstract

本发明公开一种肺部CT图像中模糊模式的多示例学习识别方法，属于CT图像处理技术领域。该方法首先对不同模式下的肺部CT图像进行随机抽样并进行预处理，其次对预处理后的样本采用迁移学习的方法进行特征提取，并采用主成分分析法对特征进行降维，最后采用优化后的多示例学习的方案对不同模式的肺部CT图像进行分类。本发明把卷积神经网络和多示例学习相结合，能够在数据量不足且存在未知的示例标签的情况下利用CNN提取样本特征，采用网格搜索优化多示例学习的参数，有效提高了分类准确率。

Description

一种肺部CT图像中模糊模式的多示例学习识别方法

技术领域

本发明涉及CT图像处理技术领域，尤其涉及一种肺部CT图像中模糊模式的多示例学习识别方法。

背景技术

对于不同模糊模式的多层CT序列图像的分类问题，传统的机器学习方法是利用局部二进制模式、定向梯度直方图、ORB、SURF和SIFT等手工提取的特征，需要该领域的专门知识。而卷积神经网络可以作为一个自动的特征提取器，利用浅层来提取每一层CT图像中类似于边缘、轮廓、色调、阴影和纹理等较为低级的特征；利用靠近输出的层提取更加抽象和复杂的特征。

但从零开始训练需要大量的有标注的数据。值得注意的是，标注每一层切片图像不仅耗时耗力，而且需要高成本的、特定专业的知识和技能。而迁移学习可以降低对上述的要求。

此外，卷积神经网络与传统的机器学习相结合的方法得到越来越多的重视，在很多情况下这种混合方法比单独利用卷积神经网络对图像进行分类所得到的准确率更高。当处理多层CT序列图像时，存在部分切片图像标签未知的情况。此时多示例学习，例如引用-k最近邻(Citation-KNN)，更加适合。具体来说，为识别两种模式的肺部CT图像，可将扫描自同一肺部的切片图像看做一个包中的示例，然后基于这些包进行后续分类。

综上，对CT序列图像进行分类的传统方法的问题主要包括数据量缺乏，标签和特征不易获取。因此，本专利提出了一种肺部CT图像中模糊模式的多示例学习识别方法，准确且高效，避免了对切片图像进行标签标注的问题，同时弱化了大量数据对于特征的自动提取器的必要性。

发明内容

针对上述现有技术的不足，提供一种肺部CT图像中模糊模式的多示例学习识别方法。

为解决上述技术问题，本发明所采取的技术方案是：一种肺部CT图像中模糊模式的多示例学习识别方法，其流程如图1所示，包括如下步骤：

步骤1：采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集，并进行预处理；

步骤1.1：在人体冠状面方向，分别去掉肺部上下两部分含有较小肺区的切片；

也可以从其他各个方向抽样，如矢状切面、其他斜切面等。

步骤1.2：将其余的肺部平均分成n份，n∈Z，从每份中随机抽取一张切片作为一个示例；

步骤1.3：对抽取的示例进行像素值标准化和灰度变换；

步骤1.4：将从同一个肺部CT序列图像中获取的n个样本特征视为一个包。

步骤2：对预处理后的样本采用迁移学习的方法进行特征提取，并采用主成分分析法对特征进行降维；

步骤2.1：用已知的自然图像数据集预训练卷积神经网络CNN；

步骤2.2：输入步骤1预处理后的样本利用卷积层进行特征提取；

所述利用卷积层进行特征提取的方法为：利用浅层即靠近输入层的卷积层的输出作为特征，分别按不同卷积层输出的特征进行分类，比较各个卷积层输出特征的分类准确率，选择准确率最高的一个卷积层的输出特征作为最终提取的特征。

步骤2.3：采用主成分分析法对提取后的样本特征进行降维。

步骤3：基于提取后的特征采用多示例学习的方案对模式A和模式B进行分类；

步骤3.1：对降维后的样本包按一定比例划分为训练集和测试集；

步骤3.2：将训练集和测试集的样本包输入多示例学习模型中；

多示例学习模型包括：引用-k最近邻模型Citation-KNN，多示例支持向量机模型MI-SVM以及期望最大化-多样性密度模型EM-DD，选择其中的一种即可。

步骤3.3：采用网格搜索的方法确定多示例学习模型的最优参数；

其中采用网格搜索的方法确定引用-k最近邻模型的最优参数包括：最近邻的个数k和确定引用者时的参数C。

步骤3.4：对数据集进行十折交叉验证，保证结果的准确性。

采用上述技术方案所产生的有益效果在于：

(1)能够在数据量不足且存在未知的示例标签的情况下利用CNN提取样本特征；

(2)降低人工成本以及对专业知识的依赖；

(3)利用自然图像预训练的卷积层能较好的表现出肺部CT图像的特点，例如灰度和形态等特征，从而得到较高的分类准确率。

附图说明

图1为本发明一种肺部CT图像中模糊模式的多示例学习识别方法的一般流程图；

图2为本发明实施例中从每个CT序列图像中随机抽取的8个轴向切片图像以图像组合方式表示两种模式下包中的8个示例；

(a)模式A一个包中的示例图；

(b)模式B一个包中的示例图；

图3为本发明实施例中基于迁移学习进行特征提取的示意图；

图4为本发明实施例中基于不同参数设置下的模型性能；

(a)不同的神经层的深度下的模型准确率；

(b)不同的特征维度下模型的准确率。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本实施例中的数据均来自于同一家医院，由此减小了由于设备不同可能产生的误差。本实施例中分别采集190例模式A的肺部CT图像和90例模式B的肺部CT图像，如图1所示，本实施例的方法如下所述：

步骤1：采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集，并进行预处理；本实施例中模式A为含有COPD病灶特征的数据，模式B为健康人数据，利用pulmonary_toolkit将所获得的DICOM文件转换为NIFT文件，从而方便利用MATLAB处理上述图像矩阵；

也可以从其他各个方向抽样，如矢状切面、其他斜切面等。

步骤1.2：将其余的肺部平均分成8份，从每份中随机抽取一张切片作为一个示例，即共有280×8张CT轴向切片图像；

步骤1.3：对抽取的示例进行像素值标准化，统一标定在0到1范围内；同时，根据图像的直方图信息进行灰度变换，减少亮度差异对分类结果造成的影响；控制图像尺寸大小和分辨率一致，保存为.png格式；

步骤1.4：将从同一个肺部CT序列图像中获取的8个样本特征视为一个包。

如图2所示，(a)为模式A中的一个包中的8个示例；(b)为模式B中的一个包中的8个示例。

步骤2.1：用已知的自然图像数据集预训练卷积神经网络CNN；

本实施例利用预训练的CNN的第四层卷积层提取特征，并以一维大小输出，即每一个示例用大小为1×64896的特征向量表示；

图3列出了上述卷积神经网络的主要结构以及从每一个卷积层提取出的特征映射。主要结构包括5个卷积层(Conv1,Conv2,Conv3,Conv4和Conv5)，三个最大池化层(Maxpooling1,Max pooling2和Max pooling3)和三个全连接层(Fc6,Fc7和Fc8)。其中，输入图像大小为227×227×3，第一个到第五个卷积层的过滤器尺寸分别为55×55，27×27，13×13,13×13和13×13，所对应的卷积核的个数分别为96，256，384，384和256。

步骤2.3：采用主成分分析法对提取后的样本特征进行降维，此时每一个示例用大小为1×100的特征向量表示。如图4(a)所示，利用第四层卷积层提取特征，得到的准确率最高；如图4(b)所示，特征维数为20和100时得到的准确率最高。

步骤3.1：对降维后的样本包按9:1的比例划分为训练集和测试集；

多示例学习模型包括：引用-k最近邻模型Citation-KNN，多示例支持向量机模型MI-SVM以及期望最大化-多样性密度模型EM-DD，本实施例选择Citation-KNN模型进行分类。

对于引用-k最近邻(Citation-KNN)方法，有两个关键参数需要确定：(1)最近邻的个数k；(2)确定引用者时的参数C。确定引用者的具体方法是，定义测试集中的一个包U_k与训练集中一个包T_i之间的距离E_k,i，定义训练集中T_i与训练集中第C个最近邻(包)之间的距离等于D_i,C-th；如果E_k,i<D_i,C-th，则T_i被认定为引用者。

这两个关键参数是网格搜索方法确定的，即在一定k和C范围内，逐个配对测试模型性能，取得最高准确率的k和C值被认为是最终的最优设置。在本发明的实施例中，k和C的搜索范围经验性地设置为[1,5]，间隔是1，k＝2和C＝5是最优设置。

步骤3.4：对数据集进行十折交叉验证，保证结果的准确性，即把训练集和测试集循环使用，其最终把所有准确率取平均值。本实施例测试结果准确率达到99.29％。

Claims

1.一种肺部CT图像中模糊模式的多示例学习COPD识别方法，其特征在于，包括如下步骤：

步骤1：采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集，并进行预处理；其中，所述模式A为含有COPD病灶特征的数据，所述模式B为健康人数据；其中，所述步骤1的过程，包括：

步骤1.3：对抽取的示例进行像素值标准化和灰度变换；

步骤1.4：将从同一个肺部CT序列图像中获取的n个样本特征视为一个包；

步骤2：对预处理后的样本采用迁移学习的方法进行特征提取，并采用主成分分析法对特征进行降维；其中，所述步骤2的过程，包括：

步骤2.1：用已知的自然图像数据集预训练卷积神经网络CNN；其中，所述卷积神经网络CNN，包括：5个卷积层、3个池化层及依次相连的3个全连接层；

步骤2.2：输入步骤1预处理后的样本利用卷积层进行特征提取；其中，所述利用卷积层进行特征提取的方法，包括：利用靠近输入层的卷积层的输出作为特征，分别按不同卷积层输出的特征进行分类，比较各个卷积层输出特征的分类准确率，选择准确率最高的一个卷积层的输出特征作为最终提取的特征；其中，准确率最高的一个卷积层配置为第四层卷积层，利用预训练卷积神经网络CNN的第四层卷积层提取特征，每一个示例用大小为1×64896的特征向量表示；

步骤2.3：采用主成分分析法对提取后的样本特征进行降维，此时每一个示例用大小为1×100或1×20的特征向量表示，得到准确率最高对应的特征向量；

步骤3：基于提取后的特征采用多示例学习的方案对模式A和模式B进行分类；其中，步骤3的过程，包括：

步骤3.3：采用网格搜索的方法确定多示例学习模型的最优参数；其中，所述多示例学习模型，包括：引用-k最近邻模型Citation-KNN；其中，所述采用网格搜索的方法确定多示例学习模型的最优参数的方法，包括：在一定最近邻的个数k和确定引用者时的参数C范围内，逐个配对测试的引用-k最近邻模型性能，取得最高准确率的k值和C值被认为是最终的最优参数；其中，确定引用者的方法，包括：定义测试集中的一个包U_k与训练集中一个包T_i之间的距离E_k,i，定义训练集中T_i与训练集中第C个最近邻包之间的距离等于D_i,C-th；如果E_k,i<D_i,C-th，则T_i被认定为引用者；其中，k＝2和C＝5是最优参数设置。

2.根据权利要求1所述的一种肺部CT图像中模糊模式的多示例学习COPD识别方法，其特征在于：用矢状切面方向或斜切面方向代替步骤1.1中的冠状面方向。

3.根据权利要求1所述的一种肺部CT图像中模糊模式的多示例学习COPD识别方法，其特征在于：步骤3的过程，还包括：

步骤3.4：对数据集进行十折交叉验证，保证结果的准确性。