CN111461232A

CN111461232A - 一种基于多策略批量式主动学习的核磁共振图像分类方法

Info

Publication number: CN111461232A
Application number: CN202010255463.8A
Authority: CN
Inventors: 王琳; 韩森
Original assignee: Dalian Maritime University
Current assignee: Dalian Maritime University
Priority date: 2020-04-02
Filing date: 2020-04-02
Publication date: 2020-07-28

Abstract

本发明公开了一种基于多策略批量式主动学习的核磁共振图像分类方法，属于智能医疗诊断领域，该方法包括以下步骤:获取受试者的核磁共振图像作为原始数据集，在未标注样本集中随机选取K个样本，进行标注，构建卷积神经网络模型和卷积自编码器模型，利用验证集对再次训练后的卷积神经网络模型进行验证，得到训练完成的卷积神经网络模型，将未标注的测试集输入训练完成的卷积神经网络模型，得到认知正常、轻度认知障碍和阿尔茨海默病三类受试者核磁共振图像的最终分类结果，该方法缓解了筛选出的样本之间的冗余信息，获得了高质量的标注样本；在确保分类准确率较高的前提下，降低了核磁共振图像的标注成本，高效的辅助医生对阿尔茨海默病进行诊断。

Description

一种基于多策略批量式主动学习的核磁共振图像分类方法

技术领域

本发明涉及智能医疗诊断领域，尤其涉及一种基于多策略批量式主动学习的核磁共振图像分类方法。

背景技术

阿尔茨海默病(Alzheimer’s disease，AD)，又称老年痴呆症，是一种不可逆的大脑神经退行性疾病，AD高发于老年人群，患者通常伴有记忆力衰退和认知障碍等症状。通常，阿尔茨海默病的诊断可以看作一个分类问题，即判断一个受试者是属于认知正常、轻度认知障碍和阿尔茨海默病中的哪一类。

目前，核磁共振成像(MagneticResonanceImaging，MRI)已被广泛应用于阿尔茨海默病的临床诊断中。MRI是由一系列2D切片图像组成的3D图像，它具有高分辨率、高对比度及软组织分辨能力强等特点，为阿尔茨海默病的诊断提供了有力的帮助。

随着大数据的出现和计算机运算能力的不断突破，深度学习在很多领域取得了显著的成绩，其中就包括在医学图像处理方面的应用。目前，虽然基于深度学习的阿尔茨海默病诊断方法取得了较好的效果，但是以监督学习为主的深度学习方法需要大量的带标注样本指导模型进行训练，从而不断提升模型的性能。而医学图像标注通常需要较高人工成本和时间成本，因为其通常需要具备专业知识的医生进行标注，并且标注时间长。因此，需要考虑如何以更少的标注代价来获得较优秀的分类性能。批量式主动学习是主动学习方法中的一种，它作为缓解标注样本不足的方法，取得了显著的成绩。但是传统的批量式主动学习方法在筛选样本时，仅使用单一的不确定性策略或者多样性策略进行筛选，导致筛选出的样本存在大量冗余信息，造成了额外的标注代价。

发明内容

根据现有技术存在的问题，本发明公开了一种基于多策略批量式主动学习的核磁共振图像分类方法，包括以下步骤:

S1:获取受试者的核磁共振图像作为原始数据集，对原始数据集进行预处理，得到未标注样本集、未标注的验证集和未标注的测试集；

S2:在未标注样本集中随机选取K个样本，对这K个样本进行标注，形成标注样本集，并将这K个样本从未标注样本集中移除,得到移除后的未标注样本集；对未标注的验证集进行标注，得到标注后的验证集；

S3:构建卷积神经网络模型和卷积自编码器模型，利用标注样本集中的样本对卷积神经网络模型进行训练，得到训练后的卷积神经网络模型；使用标注样本集和未标注样本集中的样本对卷积自编码器模型进行训练，得到训练后的卷积自编码器模型；

S4:利用训练后的卷积神经网络模型对未标注样本集进行预测，得到移除后未标注样本集中的每个样本的概率预测值；

S5:采用三个不同阶段的筛选策略从移除后未标注样本集中选择具有不确定性、代表性和多样性的未标注样本，进行再标注，加入标注样本集，形成新的标注样本集,将再标注的样本从未标注样本集中移除；

S6:利用再标注样本对卷积神经网络模型再次进行训练,得到再次训练后的卷积神经网络模型；

S7:利用验证集对再次训练后的卷积神经网络模型进行验证，得到当前卷积神经网络模型的分类准确率,当分类准确率小于阈值，返回S4；当分类准确率大于或等于阈值时或者未标注样本集为空集的时，得到训练完成的卷积神经网络模型；

S8:将未标注的测试集输入训练完成的卷积神经网络模型，得到核磁共振图像对应的受试者的最终分类结果。

进一步地：对原始数据集进行预处理包括以下步骤：

S1-1:将核磁共振图像进行头部校正、配准和分割操作，得到脑灰质、脑白质和脑脊液三种图像；

S1-2:对脑灰质图像进行空间标准化和高斯平滑操作，得到处理后的脑灰质图像；

S1-3:调整处理后的脑灰质图像的大小，得到脑灰质图像数据集；

S1-4:对脑灰质图像数据集进行划分，得到未标注样本集、未标注验证集和未标注测试集；

S1-5:分别对未标注样本集、未标注验证集和未标注测试集进行数据扩充，得到扩充后的未标注样本集、未标注验证集和未标注测试集。

进一步地：所述三个不同阶段的筛选策略选择具有不确定性、代表性和多样性的未标注样本进行标注的过程如下：

S5-1:第一阶段，利用不确定性策略进行筛选,根据未标注样本的概率预测值，计算未标注样本的熵值，将未标注样本的熵值从大到小进行排序，选择前n*K个未标注样本；

S5-2:第二阶段，利用代表性策略进行筛选,将前n*K个未标注样本采用训练好的卷积自编码器；提取n*K个未标注样本的特征，利用聚类算法对n*K个未标注样本的特征进行聚类，得到K个未标注样本簇；

S5-3:第三阶段，利用多样性策略进行筛选,计算每个未标注样本簇中所有未标注样本到标注样本集的距离，从每个未标注样本簇中选择一个满足到标注样本集距离最大的未标注样本，进行标注。

进一步地：所述卷积神经网络模型以DenseNet-121网络为基础，扩展至3D-DenseNet-121网络，再减少3D-DenseNet-121网络中的密集块的数量及减少剩余的密集块中的卷积层数量,在相邻密集块之间加入空洞卷积和卷积长短时记忆网络，形成卷积神经网络模型。

进一步地：所述卷积自编码器模型包括编码器、隐藏层和解码器，所述编码器由卷积层组成；所述隐藏层由全连接层组成；所述解码器由反卷积层组成。

进一步地：所述未标注样本簇中所有未标注样本到标注样本集的距离采用如下公式进行计算：

其中，L是标注样本集，l是标注样本集中的标注样本，u_j是当前未标注样本簇中的未标注样本，d(u_j,l)是u_j到l的欧氏距离，

是未标注样本u_j到标注样本集L的距离。

进一步地：所述从每个未标注样本簇中选择一个满足到标注样本集距离最大的未标注样本采用如下公式进行计算：

其中，U_i是第i个未标注样本簇，i＝1，2，…，K；

是未标注样本簇U_i中所有未标注样本到标注样本集L的距离的集合；u是最后筛选出来的样本。

由于采用了上述技术方案，本发明提出了一种基于多策略批量式主动学习的核磁共振图像分类方法，针对标注样本较少的阿尔茨海默病核磁共振图像数据集，利用不确定性、代表性和多样性三种筛选策略，对未标注样本进行多重筛选，选择最具不确定性、代表性和多样性的样本进行标注，在一定程度上缓解了筛选出的样本之间的冗余信息，获得了高质量的标注样本；利用高质量标注样本对卷积神经网络模型进行训练，提升卷积神经网络模型的分类准确率。本方法在确保分类准确率较高的前提下，降低了核磁共振图像的标注成本，可以更高效的辅助医生对阿尔茨海默病进行诊断。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图。

图2为本发明卷积神经网络模型结构图。

图3为本发明卷积神经网络模型中的密集块结构图。

图4为本发明卷积神经网络模型中的MDCLSTM结构图。

图5为本发明卷积自编码器结构图。

具体实施方式

为使本发明的技术方案和优点更加清楚，下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚完整的描述：

图1为本发明的方法流程图，一种基于多策略批量式主动学习的核磁共振图像分类方法，包括以下步骤:

S8:将未标注的测试集输入训练完成的卷积神经网络模型，得到认知正常、轻度认知障碍和阿尔茨海默病三类受试者核磁共振图像的最终分类结果。

进一步地，所述对核磁共振图像进行预处理的过程如下：

S1-1:将NIFTI格式核磁共振图像进行头部校正、配准和分割操作，得到脑灰质、脑白质和脑脊液三种图像；

进一步地，所述构建卷积神经网络模型和卷积自编码器模型的过程如下：

S3-1:以DenseNet-121网络为基础，将DenseNet-121网络扩展至3D-DenseNet-121网络，减少所述3D-DenseNet-121网络的密集块数量，减少剩余的密集块中的卷积层数量，将第三个密集块的输出连接到全局池化层，将全局池化层的输出连接到输出层，得到三维轻量密集卷积网络；

S3-2:在所述三维轻量密集卷积网络的相邻密集块之间加入空洞卷积和卷积长短时记忆网络，组成所述卷积神经网络模型。

S3-3:以4层卷积层堆叠组成编码器，全连接层组成隐藏层，4层反卷积层组成解码器，将编码器的输出连接至隐藏层，将隐藏层的输出连接至解码器，得到所述卷积自编码器模型。

进一步地，所述三个不同阶段的筛选策略选择具有不确定性、代表性和多样性的未标注样本进行标注的过程如下：

S5-1:第一阶段，利用不确定性策略进行筛选,根据未标注样本的概率预测值，计算未标注样本的熵值，熵值越大则不确定性越高，将未标注样本的熵值从大到小进行排序，选择前4*K个未标注样本；

熵的计算公式为：

E(p)＝-p log(p)-(1-p)log(1-p) (1)

其中，p为未标注样本的概率预测值。

S5-2:第二阶段，利用代表性策略进行筛选,将前4*K个未标注样本采用训练好的卷积自编码器；提取4*K个未标注样本的特征，利用聚类算法对4*K个未标注样本的特征进行聚类，得到K个未标注样本簇；

其中，定义未标注样本簇中每个未标注样本到标注样本集的距离为：未标注样本与标注样本集中各个样本距离的最小值。

是未标注样本u_j到标注样本集L的距离。

从每个未标注样本簇中选择一个满足到标注样本集距离最大的未标注样本。

其中，U_i是第i个未标注样本簇，i＝1，2，…，K；

是未标注样本簇U_i中所有未标注样本到标注样本集L的距离的集合；u是最后筛选出来的未标注样本。

实施例1，一种基于多策略批量式主动学习的核磁共振图像分类方法，包括以下步骤:

S1:获取认知正常、轻度认知障碍和阿尔茨海默病三类受试者的脑部核磁共振图像作为原始数据集，数据集选取571个被试者数据，其中阿尔茨海默病受试者192个，轻度认知障碍受试者171个，认知正常受试者208个，对原始数据集进行预处理，得到未标注样本集、未标注的验证集和未标注的测试集；

其中：对原始数据集进行预处理包括以下步骤：

S1-1:利用SPM12对获取的核磁共振图像进行预处理，将NIFTI格式核磁共振图像进行头部校正、配准和分割操作，得到脑灰质、脑白质和脑脊液三种图像；

S1-2:对大小为256*166*256的脑灰质图像进行空间标准化和3*3*3高斯平滑操作，得到大小为121*145*121的脑灰质图像；

S1-3:调整121*145*121的脑灰质图像的大小，得到大小为112*112*112的脑灰质图像数据集；

S1-4:对脑灰质图像数据集以8:1:1的比例进行划分，得到未标注样本集、未标注验证集和未标注测试集；

S1-5:分别对未标注样本集、未标注验证集和未标注测试集进行数据扩充，得到扩充后的未标注样本集、未标注验证集和未标注测试集，扩充之后的三个集合包括5710个图像。

其中，所述构建卷积神经网络模型和卷积自编码器模型的过程如下：

S3-1:以DenseNet-121网络为基础，将DenseNet-121网络扩展至3D-DenseNet-121网络，去掉3D-DenseNet-121网络中的任意一个密集块，对于剩余的三个密集块，将每个密集块中的1*1*1和3*3*3的卷积层数目统一减少为4层，将第三个密集块的输出连接到全局池化层，将全局池化层的输出连接到输出层，得到三维轻量密集卷积网络；

S3-2:在三维轻量密集卷积网络的第一个和第二个密集块之间以及第二个和第三个密集块之间加入空洞卷积和卷积长短时记忆网络，组成所述卷积神经网络模型。

图2为卷积神经网络模型图,所述卷积神经网络模型的第一层为具有32个卷积核的卷积层，卷积核的大小为7*7*7，将第一层的输出连接到第二层；第二层为池化层，池化核的大小为2*2*2，将第二层的输出连接到第一个密集块；将第一个密集块的输出连接到第一个MDCLSTM；将第一个MDCLSTM的输出连接到第二个密集块；将第二个密集块的输出连接到第二个MDCLSTM；将第二个MDCLSTM的输出连接到第三个密集块；将第三个密集块的输出连接到倒数第二层；倒数第二层为全局池化层，池化核大小为7*7*7，将全局池化层的输出连接到网络输出层，输出层的激活函数为Softmax。

图3为卷积神经网络模型中的密集块结构图,所述卷积神经网络模型的三个密集块的内部结构一样，每个密集块均由4组卷积运算操作组成，每组操作是由批归一化层(Batch Normalization，BN)、线性修正单元(Rectified Linear Unit，ReLU)、卷积核大小为1*1*1的卷积层和3*3*3的卷积层堆叠而成。其中，BN层和ReLU用来防止梯度弥散并保持网络非线性；1*1*1的卷积层也被称为瓶颈层，它可以降低输出特征图的数量，达到降维和减少计算量的目的；而3*3*3的卷积层则是为了提取核磁共振图像的单张切片特征和切片之间的连续变化信息；同时在每个1*1*1卷积层和3*3*3卷积层之后加入dropout层，防止网络模型过拟合，提高模型的泛化能力，并且密集块内部使用密集连接，即当前层的输入来自于前面所有层的输出，这种连接方式不仅加强了特征的传递，从而更有效的利用了各层特征，还减轻了深度神经网络的梯度消失问题，有助于深层网络训练。

图4为卷积神经网络模型中的MDCLSTM结构图,所述卷积神经网络模型的两个MDCLSTM的内部结构一样，每个MDCLSTM模块由多尺度空洞卷积、卷积核大小为1*1*1的卷积层、卷积长短时记忆网络和平均池化层组成；其中，多尺度空洞卷积包含3个不同扩张率的空洞卷积层(Dilated Convolution)，这三个空洞卷积层以并行的方式对前一个密集块的输出进行特征提取，通过设置不同大小的扩张率，达到扩张网络感受野的目的，进而在不同大小的感受野下对图像进行特征提取，得到多尺度特征图；将三个空洞卷积层的输出和前一个密集块的输出进行连接，输入到卷积核大小为1*1*1的卷积层中，得到特征融合后的特征图；将1*1*1卷积层的输出连接到卷积长短时记忆网络，学习切片间的连续变化信息；将卷积长短时记忆网络的输出连接到平均池化层，池化核大小为2*2*2，用来降低特征图的分辨率；将平均池化层的输出连接到下一个密集块进行后续卷积操作。

图5为卷积自编码器模型，所述卷积自编码器模型分别由编码器、隐藏层和解码器组成。其中，编码器由具有32、64、128和256个卷积核的卷积层堆叠组成，卷积核大小为3*3*3，步长为2；隐藏层由全连接层组成；解码器由具有128、64、32和1个卷积核的卷积层堆叠组成，卷积核大小为3*3*3，步长为2。

所述卷积神经网络模型的训练过程如下：基于TensorFlow深度学习框架，优化函数为Adam，基础学习率设置为0.0005，衰减率为1e-4，采用GPU进行加速训练。将标注样本输入到卷积神经网络模型，经过一系列卷积运算操作，通过Softmax激活函数得到认知正常和阿尔茨海默病两类受试者的分类结果，将分类结果和标签代入交叉熵损失函数，计算本次训练的损失值，并根据损失值进行反向传播，更新卷积神经网络模型中的权重参数。

所述卷积自编码器模型的训练过程如下：基于TensorFlow深度学习框架，优化函数为Adam，基础学习率设置为0.0004，衰减率为1e-4，采用GPU进行加速训练。将标注样本和未标注样本输入到卷积自编码器模型，经过编码和解码操作，得到解码器输出结果，将输入样本与输出结果代入均方误差损失函数，计算本次训练的损失值，并根据损失值进行反向传播，更新卷积自编码器模型中的权重参数。

其中：所述三个不同阶段的筛选策略选择具有不确定性、代表性和多样性的未标注样本进行标注的过程如下：

熵的计算公式为：

E(p)＝-p log(p)-(1-p)log(1-p) (1)

其中，p为未标注样本的概率预测值。

S5-2:第二阶段，利用代表性策略进行筛选,将前4*K个未标注样本采用训练好的卷积自编码器；提取4*K个未标注样本的特征，利用聚类算法对4*K个未标注样本的特征进行聚类，得到K个未标注样本簇；该步骤用来衡量未标注样本之间的代表性。其中，卷积自编码器可以以较少的参数量提取图像较完备的特征，聚类算法通过无监督的训练方式将相似度较高的未标注样本聚成同一个簇，相似度较低的未标注样本分布在不同的簇。这样，每个簇中的一个未标注样本可以代表该簇的其他未标注样本，降低了标注代价。

该步骤用来保证新加入的样本与标注样本集中的样本具有多样性，其中，定义未标注样本簇中每个未标注样本到标注样本集的距离为：未标注样本与标注样本集中各个样本距离的最小值。

是未标注样本u_j到标注样本集L的距离。

其中，U_i是第i个未标注样本簇，i＝1，2，…，K；

所述卷积神经网络模型的再训练过程如下：基于TensorFlow深度学习框架，优化函数为Adam，基础学习率设置为0.0005，衰减率为1e-4，采用GPU进行加速训练。将再标注样本输入到卷积神经网络模型，经过一系列卷积运算操作，通过Softmax激活函数得到认知正常和阿尔茨海默病两类受试者的分类结果，将分类结果和标签代入交叉熵损失函数，计算本次训练的损失值，并根据损失值进行反向传播，更新卷积神经网络模型中的权重参数。

S7:利用验证集对再次训练后的卷积神经网络模型进行验证，得到当前卷积神经网络模型的分类准确率,当分类准确率小于阈值，设定阈值为95％，返回S4；当分类准确率大于或等于阈值时或者未标注样本集为空集的时，得到训练完成的卷积神经网络模型；

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征在于,包括以下步骤:

S7:利用验证集对再次训练后的卷积神经网络模型进行验证，得到核磁共振图像的分类准确率,当分类准确率小于阈值，返回S4；当分类准确率大于或等于阈值时或者未标注样本集为空集的时，得到训练完成的卷积神经网络模型；

S8:将未标注的测试集输入训练完成的卷积神经网络模型，得到核磁共振图像的最终分类结果。

2.根据权利要求1所述的一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征还在于：对原始数据集进行预处理包括以下步骤：

3.根据权利要求1所述的一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征还在于：所述三个不同阶段的筛选策略选择具有不确定性、代表性和多样性的未标注样本进行标注的过程如下：

4.根据权利要求1所述的一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征在于：所述卷积神经网络模型以DenseNet-121网络为基础，扩展至3D-DenseNet-121网络，再减少3D-DenseNet-121网络中的密集块的数量及减少剩余的密集块中的卷积层数量,在相邻密集块之间加入空洞卷积和卷积长短时记忆网络，形成卷积神经网络模型。

5.根据权利要求1所述的一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征在于：所述卷积自编码器模型包括编码器、隐藏层和解码器，所述编码器由卷积层组成；所述隐藏层由全连接层组成；所述解码器由反卷积层组成。

6.根据权利要求2所述的一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征在于：所述未标注样本簇中所有未标注样本到标注样本集的距离采用如下公式进行计算：

是未标注样本u_j到标注样本集L的距离。

7.根据权利要求2所述的一种基于多策略批量式主动学习的核磁共振图像分类方法，其特征在于：所述从每个未标注样本簇中选择一个满足到标注样本集距离最大的未标注样本采用如下公式进行计算：

其中，U_i是第i个未标注样本簇，i＝1，2，…，K；