一种基于卷积神经网络的MRI肿瘤体素检测方法
技术领域
本发明设计机器视觉技术和模式识别技术,具体涉及一种对MRI肿瘤体素中病变区域的检测分类方法。
背景技术
随着医疗影像技术和深度学习的发展,利用深度学习技术对MRI肿瘤图像进行分类与检测,已经越来越受到国内外学者的关注(Pereira S,Pinto A,Alves V,et al.Braintumor segmentation using convolutional neural networks in MRI images[J].IEEEtransactions on medical imaging,2016,35(5):1240-1251.)。核磁共振成像(MRI)无需注射造影剂,没有电离辐射损伤,生成原生三维断面立体成像,分辨率高,无骨伪影干扰。但MRI图像数据量巨大,人工注释分析需要以专业为导向的技能,同时带有医师的主观判断,耗时且重复性低。相对于传统的机器学习方法,深度学习适合处理数据量大、特征复杂的样本,且模型精度高。深度学习中的卷及网络(CNN)模型,由于其独特的网络架构,在图像分类、图像检测上潜力巨大,可以用于MRI图片中病灶区域特征的提取。
目前广泛使用的方法是对MRI体素进行切片,对2D数据进行处理,如2016年荷兰奈梅亨大学Setio等人(Setio A A A,Ciompi F,Litjens G,et al.Pulmonary noduledetection in CT images:false positive reduction using multi-viewconvolutional networks[J].IEEE transactions on medical imaging,2016,35(5):1160-1169.)以肺结节为中心进行9个方向的切片,来快速获取特征,但丢失各病灶区域切片的相关性;采用3D MRI体素相对于2D MRI会保留更多的特征,但同时也带来了巨大的计算量(Dou Q,Chen H,Yu L,et al.Automatic detection of cerebral microbleeds fromMR images via 3Dconvolutional neural networks[J].IEEE transactions on medicalimaging,2016,35(5):1182-1195.)。现在难度最大而又关键的问题是如何高准确率地分类MRI肿瘤图像中的阴性与阳新样本,同时减小训练时间。
因此,采用3D CNN精确提取MRI肿瘤图特征的同时严格控制训练时间具有很高的研究价值。
发明内容
本发明的目的是对3D MRI肿瘤体素进行检测分类,为此提出一种深度学习中卷及网络模型架构的MRI肿瘤体素检测方法。
本发明采用的技术方案是:基于卷积神经网络的MRI肿瘤体素检测方法包括以下步骤:
步骤1:以AlexNet模型为基础,建立双路径3D CNN模型基本框架,上下路径分别采用大、小卷积核;步骤2:在第二个卷积层之前加入1×1×1卷积核来减少参数和计算量;步骤3:采用3D CNN模型在数据集上训练,通过分类对比得到假阳性和假阴性样本加入原数据集;步骤4:将3D CNN模型全连接层换成卷积层,即将3D CNN模型变成3D FCN模型,用此模型在扩充过的数据上训练,得到最终MRI肿瘤体素分类模型。
进一步,所述步骤1具体包括:
首先以AlexNet为基本模型架构,删减部分层数,架构主体由2个卷积层、2个全连接层、1个输出层组成。每个卷积层后依次连接ReLU激活函数、最大池化层和LRN规范化层,2个全连接层依次相连,第2个全连接层后依次连接Dropout层和目标函数层。模型接收3DMRI图片作为输出,此模型的上路径采用21×21×11的大卷积核提取特征,可以充分提取病灶区域和周边正常组织的特征;下路径采用7×7×3的小卷积核提取特征,准确提取病灶区域自身特征的同时减少了信息的冗余。
进一步,所述步骤2的具体过程为:
在第二个卷积层之前添加一个卷积层,卷积核大小为1×1×1,通道数利用经验设定,同时减少第二个卷积层的通道数,以上步骤将会显著降低参数和计算量。
进一步,所述步骤3的具体过程为:
步骤3.1:将原始3D MRI体素图像作为经步骤1和步骤2改良模型的输入,随后进行前向传播时随机初始化模型参数,随机参数服从标准正态分布。利用Softmax函数做为目标函数得到输出结果,Softmax函数如下:
其中类y表示病灶种类,即阳性还是阴性,x代表输入的3D MRI体素值,θ代表模型中的参数,Softmax函数分类器的优点在于对于每一个类别值,都会输出一个对应的概率值,即P(y=j|x),同时所有类别概率值之和为1。
步骤3.2:得到输出结果与真实标记进行比对,利用Softmax回归损失函数计算输出结果与真实标记之间的损失,Softmax回归损失函数如下:
其中m表示样本个数,k表示样本种类,Ι{·}表示指示函数,J(θ)表示系统损失值。
步骤3.3:进行反向传播,利用随机梯度下降法进行参数更新:
即通过对损失函数求其偏导数,将结果作为梯度值来更新参数:
其中α表示每次参数更新的步长。
步骤3.4:设定一个阈值,每次参数变化量Δθ小于此阈值,停止更新参数,否则跳转步骤3.1。
步骤3.5:将模型输出结果与真实标记比对,得到假阴性和假阳性样本,并加入原数据集,得到经过扩充的数据集,同时得到经过预训练的3D CNN模型。
进一步,所述步骤4的具体过程为:
步骤4.1:将步骤3所得到预训练3D CNN模型的最后两个全连接层,换成卷积层,其中参数随机初始化,并服从标准正态分布,此时3D CNN模型变成3D FCN模型。
步骤4.2:在经过步骤3.5扩充过的数据集上,用此步骤4.1得到的模型进行训练,训练步骤参考步骤3,最终得到MRI肿瘤体素分类模型。
本发明的有益效果是:
传统人工分析注释MRI图像,需要以专业为导向的技能,同时带有医师的主观判断,耗时且重复性低。对MRI图像进行计算机2D切片分析,会丢失大量病灶间的相关性;对MRI图像进行3D分析,相对于2D来说可以更多保留病灶特征,但计算量巨大。本发明提出了一种基于卷积神经网络的MRI肿瘤体素检测分类方法,主要网络架构基于双卷积核双路径融合的架构设计,使用双路径,采用不同大小的卷积核,进行数据融合,优化模型分类效果,可以更精确提取样本特征并减小信息冗余。在利用3D卷积核提取特征之前,加入1×1×1卷积核降低参数和维度,减少计算量和训练时间。将3D CNN模型最后全连接层变成卷积层,能够接收任意大小的体素图片作为输出,加快收敛速度。网络训练流程基于样本扩充和模型微调的方法,在扩充的数据集上利用3D FCN模型进行训练,可以提高模型的泛化能力。这种基于机器视觉和深度学习技术对MRI肿瘤图像进行检测,即减少了人工检测分析的繁琐流程,也提高了检测肿瘤图像的准确率,对未来医学图像自动化和智能化处理提供了技术支撑。
附图说明
下面结合附图和具体实施方式对本发明做进一步的详细说明:
图1是模型架构示意图
图2是模型优化示意图
图3是模型训练流程图
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清除、完整的描述。
图1为模型架构示意图,基于双卷积核双路径融合的架构设计;降维和减少训练时间基于1×1×1卷积核和FCN网络;提高模型泛化能力主要采用数据样本的扩充和模型的微调;最终实现基于卷积神经网络的MRI肿瘤体素监测分析。
步骤1:搭建双卷积核双路径的网络架构模型,设计卷积核尺寸,主要是用来提取病灶特征与病灶区域检测。
(1)搭建双路径网络模型架构
以AlexNet网络模型为基础,删减部分层数,减小网络模型深度,建立双路径3DCNN网络模型基本框架,模型由2个卷积层、2个激活函数层、2个池化层、2个规范化层、2个全连接层、1个Dropout层和1个目标函数层依次构成。其中激活函数采用ReLU;池化层采用最大池化,可以提取特征图中最显著的特征;规范化采用LRN规范化,参数设置如下,k=2为超参数由原型中偏置决定,n=5为求和区间的边长,α=10-4为缩放因子,β=0.75为指数项,皆为局部响应规范化操作的超参数;Dropout随机随机失活层参数设置为δ=0.5。
(2)设定双路径卷积核尺寸
考虑一般MRI体素大小为512×512×150,所以上路径采用大卷积核提取病灶区域的大小、形状等特征,保留更多与周围正常组织的联系性,卷积核大小设定为21×21×11。下路径采用小卷积核提取病灶自身的特征,如纹理、色泽等特征,可以减少信息的冗余,卷积核大小设定为7×7×3。
步骤2:在第二个卷积层之前加入1×1×1卷积核来减少参数和计算量。
考虑到第一个LRN规范化层后输出多个3D特征图,且第二个3D卷积层也是多通道,进行卷积操作将产生大量的参数与计算量。所以在第一个LRN规范化层和第二个3D卷积层卷积层之间加入一个新的卷积层,卷积核大小为1×1×1,增加此层的通道数,减少第二个卷积层的通道数,以达到精确提取特征的同时减少计算量。
步骤3:在原始数据集上,对步骤2所改进的3D CNN模型进行预训练,通过分类对比得到假阳性和假阴性样本加入原数据集。
(1)基于Xavier参数初始化方法
网络参数进行随机初始化,随机参数服从均值为0,方差为1的标准高斯分布。这可使得开始训练时网络参数的期望与训练完毕后网络稳定的期望一致,为保持数据分布的方差不随输入神经元的个数改变,采用基于Xavier参数初始化,假设s为未经非线性变化的该层网络输出结果,具体分析如下:
其中ω为该层参数,x为该层输入数据。
(2)前向传播
将原始3D MRI体素图像作为经步骤1和步骤2改良模型的输入,随后进行前向传播。利用Softmax函数做为目标函数得到输出结果,Softmax函数如下:
其中类y表示病灶种类,即阳性还是阴性,x代表输入的3D MRI体素值,θ代表模型中的参数,Softmax函数分类器的优点在于对于每一个类别值,都会输出一个对应的概率值,即P(y=j|x),同时所有类别概率值之和为1。
(3)计算损失函数
得到输出结果与真实标记进行比对,利用Softmax回归损失函数计算输出结果与真实标记之间的损失,Softmax回归损失函数如下:
其中m表示样本个数,k表示样本种类,Ι{·}表示指示函数,J(θ)表示系统损失值。
(4)反向传播
利用随机梯度下降法进行参数更新:
即通过对损失函数求其偏导数,将结果作为梯度值来更新参数:
其中α表示每次参数更新的步长。
(5)迭代训练
设定一个阈值,每次参数变化量Δθ小于此阈值,停止更新参数,否则
再次进行前向传播。
(6)数据扩充
将模型输出结果与真实标记比对,得到假阴性和假阳性样本,并加入原数据集,得到经过扩充的数据集,同时得到经过预训练的3D CNN模型。
步骤4:在经过扩充的数据上对模型进行微调,得到最终3D MRI肿瘤体素分类模型。
(1)模型架构更改
将步骤3所得到预训练3D CNN模型的最后两个全连接层,换成卷积层,其中参数随机初始化,并服从标准正态分布,此时3D CNN模型变成3D FCN模型。
(2)模型微调
在经过步骤3.6扩充过的数据集上,用此步骤4.1得到的模型进行训练,训练步骤参考步骤3,最终得到MRI肿瘤体素分类模型。
优选实施例:
本发明的一个最优具体实施方式:建立双路径双卷积核3D CNN网络模型框架,模型由2个卷积层、2个激活函数层、2个池化层、2个规范化层、2个全连接层、1个Dropout层和1个目标函数层依次构成,上路径采用大卷积核,大小设定为21×21×11,下路径采用小卷积,大小设定为7×7×3。在第二个卷积层之前加入1×1×1卷积核来减少参数和计算量。训练网络时网络的参数基于Xavier参数初始化方法,进行前向传播,分类目标函数基于Softmax函数方法,反向传播传播更新参数基于随机梯度下降法。模型损失不在改变时,将分类结果中的假阴性和假阳性样本加入原数据集,得到经过扩充的数据集。再改变模型全连接层为卷积层,使其变成FCN,随后在扩充后的数据集上对预训练的FCN模型进行训练,最终得到3D MRI肿瘤体素分类模型。
综上所述,本发明的一种利用深度学习和机器视觉技术对MRI肿瘤体素进行识别的方法,首先以AlexNet模型为基础,建立双路径双卷积核3D CNN模型框架,上路径采用小卷积核提取病灶区域本身的纹理、大小等特征,下路径采用大卷积核提取病灶区域与周边组织的相关性等特征。在框架的卷积层之前加入1×1×1卷积核进行特征降维,并基于所构建的模型进行训练,将结果中的假阳性和假阴性样加入原数据集进行样本扩充。随后将模型中全连接层换成卷积层,即将CNN模型变成FCN模型,在扩充过的数据上对已经预训练的3D FCN模型微调,得到最终MRI肿瘤体素分类模型。该项研究减少了人工检测分析医学图像的繁琐流程,提高了检测肿瘤图像的准确率,对未来医学图像自动化和智能化处理提供了技术支撑。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。