CN111738363A - 基于改进的3d cnn网络的阿尔茨海默病分类方法 - Google Patents

基于改进的3d cnn网络的阿尔茨海默病分类方法 Download PDF

Info

Publication number
CN111738363A
CN111738363A CN202010772776.0A CN202010772776A CN111738363A CN 111738363 A CN111738363 A CN 111738363A CN 202010772776 A CN202010772776 A CN 202010772776A CN 111738363 A CN111738363 A CN 111738363A
Authority
CN
China
Prior art keywords
model
layer
cnn
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010772776.0A
Other languages
English (en)
Other versions
CN111738363B (zh
Inventor
胡众义
吴奇
肖磊
胡明哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Publication of CN111738363A publication Critical patent/CN111738363A/zh
Application granted granted Critical
Publication of CN111738363B publication Critical patent/CN111738363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/055Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves  involving electronic [EMR] or nuclear [NMR] magnetic resonance, e.g. magnetic resonance imaging
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Neurology (AREA)
  • Veterinary Medicine (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Physiology (AREA)
  • High Energy & Nuclear Physics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Hospice & Palliative Care (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Psychology (AREA)
  • Neurosurgery (AREA)
  • Computational Linguistics (AREA)

Abstract

本发明公开了一种基于改进的3D CNN网络的阿尔茨海默病分类方法,该方法基于3D核磁共振数据进行训练,实现精确的脑疾病分类。该方法主要包括如下步骤:1)使用3D CNN建模:使用3D CNN替换VGG网络中的2D CNN部分;2)优化模型结构:先在模型中添加批量归一化层,再引入跳跃连接;3)实验数据处理:预处理实验数据,并划分训练集和验证集;4)模型训练:将数据输入模型,训练网络参数,并保留最优模型;5)模型测试与评估:在测试集上测试,并评估分类性能。本发明首次提出了在3D VGG模型中引入多个跳跃连接用于阿尔兹海默症诊断,性能优于现有方法,具有通用性强、鲁棒性高等优点。

Description

基于改进的3D CNN网络的阿尔茨海默病分类方法
技术领域
本发明涉及计算机医学图像分析领域,尤其涉及一种基于改进的3D CNN网络的阿尔茨海默病分类方法。
背景技术
阿尔兹海默症(AD)是一种暂时无法治愈的神经退行性疾病,是老年痴呆症最常见的病例,其前期状态为轻度认知障碍(MCI),病情的不断恶化,直接影响到人的记忆和认知等能力。轻度认知障碍(MCI)是介于正常衰老和痴呆之间的一种中间状态,是一种认知障碍症候群。早在2011年的AD诊断标准和指南中,MCI病例被认为是AD的早期阶段。近年来,神经影像作为AD诊断的重要生物标志物被广泛应用。其中,磁共振成像是一种非侵入式、低成本的成像技术,可以清晰的描述人脑的三维解剖结构。因此,利用神经影像数据的特征,来区分正常被试(NC)、MCI和AD也成为热点话题。
随着卷积神经网络(CNN)在计算机视觉领域的地位越来越重要,将其应用于医学影像的识别、分割等领域得到迅速发展。为了对全脑MRI进行全面分析,3D CNN具有良好的空间特征提取能力,可以更好的提取MRI的三维结构特征,学习通道之间的映射关系。因此,Hosseini-Asl等人(Hosseini-Asl E, Keynton R, El-Baz A. Alzheimer's diseasediagnostics by adaptation of 3D convolutional network[C]//2016 IEEEInternational Conference on Image Processing (ICIP). IEEE, 2016: 126-130.)结合3D CNN和卷积自编码器进行AD诊断,使用3D CAE(Convolutional AutoEncoder)进行预训练,然后使用3D CNN进行细化训练。虽然在一个每个类包含70个subject的小数据集上,AD/NC分类获得了良好的结果,但是这种方式的训练过程较为繁琐。Tang H等人(Tang H,Yao E, Tan G, et al. A Fast and Accurate 3D Fine-Tuning Convolutional NeuralNetwork for Alzheimer’s Disease Diagnosis[C]//International CCF Conference onArtificial Intelligence. Springer, Singapore, 2018: 115-126.)则对深层次的VGG结构进行改进,增加两个跳跃连接结构来结合浅层和深层的特征,缓解梯度消失的问题,并在AD/MCI/NC三分类和二分类任务上均取得较优的效果。Bakkouri I等人(Bakkouri I,Afdel K, Benois-Pineau J, et al. Recognition of Alzheimer's Disease on sMRIbased on 3D Multi-Scale CNN Features and a Gated Recurrent Fusion Unit[C]//2019 International Conference on Content-Based Multimedia Indexing (CBMI).IEEE, 2019: 1-6.)则利用3D CNN提取的多尺度特征输入门控循环单元(GRU),进行AD/MCI/NC的二分类任务,并在ADNI数据集上进行大量实验。虽然验证了这种方式可以有效避免类之间的高度相似性和过度拟合问题,但其仍然受到3D CNN提取的特征尺度大小的影响。为了防止深度卷积神经网络产生模型退化的问题,Karasawa H等人(Karasawa H, LiuC L, Ohwada H. Deep 3d convolutional neural network architectures foralzheimer’s disease diagnosis[C]//Asian Conference on Intelligent Informationand Database Systems. Springer, Cham, 2018: 287-296.)设计了类似ResNet结构的3DCNN框架用于阿尔兹海默症分类,其中卷积层有35层之多,这样可能导致模型较难训练,从而影响模型精度。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于改进的3D CNN网络的阿尔茨海默病分类方法。
本发明的目的是通过以下技术方案来实现的:
一种基于改进的3D CNN网络的阿尔茨海默病分类方法,包括如下步骤:
(1)使用3D CNN建模:首先构建包含六个模块的2D的VGG网络模型,再将其中的2D CNN部分替换为3D CNN,形成 3D VGG网络模型;
(2)优化模型结构:在3D VGG网络模型的前五个模块的3D CNN层之后先添加批量归一化层,然后再添加跳跃连接,将前一个模块提取的数据特征经过1×1×1的卷积处理,并进行批量归一化后,与当前模块提取的数据特征相加,作为下一个模块的输入;
(3)从阿尔兹海默症神经成像计划数据集选取核磁共振数据,并对数据进行预处理,再划分成训练集和测试集;
(4)模型训练:将步骤(3)处理得到的训练集数据输入步骤(2)得到的模型,进行迭代,每次迭代后计算模型分类的准确率,并保留到当前迭代为止准确率最高的模型参数;达到设定的迭代次数后,输出模型参数;
(5)将待分类的测试集数据输入步骤(4)保存的最优网络模型中,得到对应的分类结果。
进一步地, 所述的步骤(1)中,首先将2D CNN层替换为3D CNN层,再将2DMaxpooling层替换为3D Maxpooling层;最后,修改第六个模块,即分类层,添加3个维度分别为2048、1024、3的全连接层。
进一步地,所述的步骤(1)中,3D CNN层对输入的核磁共振数据作如下处理,得到特征图x l
Figure 961086DEST_PATH_IMAGE001
其中,x l (a,b,c)为第l层卷积的输出特征图的像素点,(a,b,c)为点坐标,(d,e,f)表示特征图尺寸,K表示卷积核,其尺寸为Size K =k×k×k
进一步地,所述的步骤(2)具体为:
(2.1)在每个模块的每个卷积层后添加批量归一化层,即为输入激活函数的特征x l 进行如下公式的归一化
Figure 143806DEST_PATH_IMAGE002
其中x l 表示第l层卷积的输出特征图,μ为输入特征图沿着通道方向计算的平均数,σ为输入特征图沿着通道方向计算的方差;公式中的ε是一个为了归一化后的数值稳定而设置的常量,加入的缩放变量γ和平移变量β为BN层可训练的参数;
将得到的归一化后的特征图经过ReLU激活函数,得到非线性映射,作为下一层卷积的输入;
(2.2)将来自第i-1个模块的输出特征图x i-1输入第i个模块,经过步骤(2.1)处理得到第i个模块的输出特征图x i ,再将x i-1输入到跳跃连接进行处理,则得到分支特征r i ,对输出特征图x i 和分支特征r i 进行如下公式的叠加,得到输出特征H(x i ):
Figure 454702DEST_PATH_IMAGE003
H(x i )输入第i个模块的最后一个3D Maxpooling层,得到该模块的输出特征,即第i+1个模块的输入特征。
本发明的有益效果如下:
本发明通过构建3D VGG神经网络结构,利用层间上下文的信息,提取相邻切片间的空间特征,学习切片间的映射关系。这不仅有效地继承了2D CNN的优势,同时能够更好的捕捉数据的空间结构特征,而2D CNN仅限于局部切片的特征学习。因此,将三维的MRI数据用于3D网络训练,让模型提取更加丰富有效的特征,更不容易丢失感兴趣的区域,进行全脑结构的分析,能够有效提高疾病分类的准确性。同时在模型中使用跳跃连接和批量归一化操作,选用适当深度的网络,能够使得模型更容易训练,解决深度带来的模型退化问题。
附图说明
图1是本方法的基础二维VGG神经网络模型示意图;
图2是使用3D CNN操作对VGG重新建模的示意图;
图3是本方法使用的跳跃连接的示意图;
图4是本方法使用的模型整体结构和参数示意图;
图5是本方法与背景技术中提高的方法的准确率的对比结果图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的基于改进的3D CNN网络的阿尔茨海默病分类方法,包括以下步骤:
(1)使用3D CNN建模:首先构建包含六个模块的2D的VGG网络模型,再将其中的2D CNN部分替换为3D CNN,形成 3D VGG网络模型;具体包括以下步骤:
(1.1)构建VGG网络模型,如图1所示。模型将由Maxpooling层划分为6个模块,每个模块的卷积核大小均为3×3。其中,第一个模块和第二个模块由2个卷积层组成,每组卷积输出通道大小分别为64和128,第三、四、五个模块主要由三个卷积层组成,每组卷积输出通道大小分别为256、512和512。以上五个模块每经过一个,由于Maxpooling层的降维功能,输入尺寸将会缩小0.5倍,例如输入224×224的三通道核磁共振切片,经过模块特征提取后,最终形成7×7大小,输出共512个通道的特征张量,并输入最后一个模块,主要由全连接层组成,将数据降维到标签空间。将网络提取的最终特征向量利用SoftMax函数进行类别的概率计算,实现最终分类。其中,概率计算的公式如下:
Figure 646649DEST_PATH_IMAGE004
其中,函数的输入是全连接层输出的M个不同的特征值,W为网络模型计算的不同特征的权重系数,P为特征向量x属于第c个分类的概率,输入图片所属的类别为P值最大的类别c
(1.2)将步骤(1.1)构建的模型中的2D CNN部分替换为3D CNN,其操作如图2所示。其中,卷积得到特征图x l 的操作如下公式所示。
Figure 992179DEST_PATH_IMAGE001
其中,x l (a,b,c)为第l层卷积的输出特征图的像素点,(a,b,c)为点坐标,(d,e,f)表示特征图尺寸,K表示卷积核,其尺寸为Size K =k×k×k。卷结核类似滤波器,依次遍历整个图像,与特征图进行点乘再求和,移动的步长为S。为了保证输出的特征图保持原图大小,最常见的是对图像边缘进行零填充,张量单方向填充的大小为P,因此,输出特征图大小Size output 可以通过如下计算得到。在卷积过程中,卷积核不变,这体现了权值共享的思想。
Figure 844335DEST_PATH_IMAGE005
其中Size I 表示输入卷积层的图像尺寸,Size K 表示卷积核尺寸大小,
Figure 642527DEST_PATH_IMAGE006
表示将计算结果向下取整,公式计算得到输出尺寸为Size output ,即经过卷积层得到的特征图尺寸。
(1.3)添加ReLU激活函数,如下公式,将步骤(1.2)中的输出进行非线性的特征映射。
Figure 575848DEST_PATH_IMAGE007
其中,M j 表示输入特征图的数目,f表示激活函数,
Figure 775885DEST_PATH_IMAGE008
表示卷积操作,l表示卷积层数,
Figure 300408DEST_PATH_IMAGE009
表示上一卷积层输出的第i个特征图,w为卷积操作的权重项,b为偏置项。一般紧随其后的是池化层,将2D Maxpooling替换为3D Maxpooling操作,对输出进行降维,主要作用是为了减少参数和计算量的同时保留主要的特征,防止过拟合,提高模型泛化能力。
(1.4)由步骤(1.2)和(1.3)组成一个卷积层,经过第l层卷积层得到的所有特征图结合得到数据特征定义为x l 。为了完成分类任务,最后利用神经网络全连接层(FullConnection)构建分类模块,添加3个维度分别为2048、1024、3的全连接层来设计,将第五个模块的输出数据特征平铺为一维张量,然后降维到标签空间L,实现阿尔兹海默症的诊断分类。
(2)为了进一步优化模型,在3D VGG网络模型的前五个模块中添加跳跃连接和批量归一化层,将前一个模块提取的数据特征经过1×1×1的卷积处理后,与当前模块提取的数据特征相加,作为下一个模块的输入。如图3所示,防止模型层数过多导致的模型退化的问题,优化模型训练;包括以下步骤:
(2.1)由于3D模型参数较多,为了更好的进行训练,在卷积操作之后添加三维的批量归一化操作(BN层),即3D Batch Normalization。将特征图M放入批量归一化层,对输入激活函数的特征x l 进行如下公式的归一化,这样解决了输入数据发生偏移和尺度变化的影响。
Figure 585895DEST_PATH_IMAGE010
其中x l 表示第l层卷积的输出特征图,μ为输入特征图沿着通道方向计算的平均数,σ为输入特征图数据沿着通道方向计算的方差。公式中的ε是一个为了数值稳定,加到小批量数据方差上的常量。加入的缩放变量γ和平移变量β为BN层可训练的参数,主要作用是为了增强归一化的表达能力。
(2.2)基于步骤(1.1)的划分,在前5个模块中添加如图3的跳跃连接。将来自第i-1个模块的输出特征图x i-1输入第i个VGG模块,经过步骤(1.2)~(1.3)处理得到的输出特征图x i ,再将x i-1输入到跳跃连接,经过1×1×1的卷积过渡处理则得到分支特征r i ,在输入到3DMaxpooling层之前,先对特征图x i 和分支特征r i 进行如下公式的叠加,得到输出特征H(x i ):
Figure 854066DEST_PATH_IMAGE003
H(x i )输入第i个模块的最后一个3D Maxpooling层,得到该模块的输出特征,即第i+1个模块的输入特征;
(3)实验数据处理:利用阿尔兹海默症神经成像计划数据集(ADNI)采集数据,并对实验数据进行预处理,并划分训练集和验证集;包括以下步骤:
(3.1)从ADNI数据库中采集了共2292例T1加权的结构MRI扫描,分别来自133位AD患者,311位MCI患者,以及195位正常对象,其中给定被试的磁共振图像数据集,数据集包含磁共振图像和被试的标签,磁共振图像数据集记为D={(d i ,c j ) | i∈[1,R], jL},式中,d表示磁共振图像,c表示被试的对应标签,R表示样本数量,i表示样本下标,j表示标签下标,L=[1,3]表示标签空间,分别表示NC、MCI、AD三个类别;
(3.2)对步骤(3.1)获取的磁共振图像全集D首先进行归一化到一个标准模版空间中,然后将数据分割为灰质(GM)、白质(WM)和脑脊液(CSF);
(3.3)基于(3.2)步骤分割得到的数据中,选取脑信息丰富的灰质数据,然后对其进行平滑(FMWH=4mm)以得到更高的信噪比;
(3.4)基于(3.3)步骤得到灰质影像定义为I,其输出维度Size I 为121×145×121,将预处理后数据集按照7:3的比例分别划分为训练集D train ={(d i ,c j ) | i∈[1,M], j∈[1,3]}和测试集D test ={(d i ,c j ) | i∈[1,N], j∈[1,3]},其中M为训练集数据总数,N为测试集数据总数。
(4)模型训练:将步骤(3)处理得到的数据输入如图4的模型中,经过120次迭代训练网络与反向传播调整模型参数;包括以下步骤:
(4.1)经过步骤(3.1)和(3.2)优化过的模型进行反向传播的训练,使用SGD优化器优化模型训练过程。
(4.2)训练使用分类交叉熵损失函数计算训练损失Loss,如果Loss越小,说明训练得到的模型提取的特征区分度越大,模型在训练数据上的分类性能越佳。
Figure 908609DEST_PATH_IMAGE011
其中num表示类别数量,c表示类别标签,y表示类别变量(0或1),如果该类别和样本的类别相同就是1,否则是0。p表示由Softmax计算样本属于类别c的预测概率。
(5)模型测试与评估:在测试集上测试步骤(4)中每次迭代训练得到的模型,并保留训练准确率最高的模型参数,输出最优模型的分类和评估结果。包括以下步骤:
(5.1)每个迭代过程使用步骤(4.1)和(4.2)中的方式训练,将得到最优模型在测试集上进行测试,实现对测试集的分类任务。使用分别如下的准确性(ACC)、精度(PRE)、敏感性(SEN)、F1-Score以及ROC曲线对模型进行评估,其中ROC曲线使用其线下面积(AUC)进行对比。
Figure 135191DEST_PATH_IMAGE012
其中TP、TN、FP、FN分别表示模型对给定一组数据分类的真阳性、真阴性、假阳性、假阴性的数目。准确率又叫查准率,表示模型预测正确的概率;精度又叫正预测值(PPV),是预测出阳性病例数目与实际阳性病例数目的比例;敏感性又叫召回率(Recall),是预测的阳性病例中被正确预测概率,反应模型对不同类别特征的敏感程度;三个指标都是值越大,模型性能越佳。
(1)本发明利用3D CNN搭建的VGG网络结构,可以提取相邻切片间的空间特征和三维MRI数据的空间结构特征,进而学习切片间的映射关系和大脑整体的解剖学结构变化;
(2)本发明利用跳跃连接和批量归一化操作优化网络模型,在VGG的多个模块中使用跳跃连接,即当前VGG模块的输出与前一层模块的输出之和为下一个模块的输入,模块由最大池化层分割。同时,还在卷积层之后中添加批量归一化操作,从而有效改善模型退化、过拟合等问题。
(3)本发明的方法使用预处理后的数据训练模型,数据预处理用于去除数据中的噪声和伪影,从而提高图像的质量,通过预处理通道的数据不仅保存了大脑必要的结构特征,也剔除了不必要的个体差异,让实验模型提取和学习更为重要的特征。
实施例
构建的模型结构和参数如表1所示,除了第一个模块,其他主干结构保持VGG的原始结构,即卷积核大小采用3×3×3,步长为1,边缘进行零填充操作以保持输出尺寸不变。分割VGG为6个模块(Block)的MaxPooling层,其核尺寸设置为2×2×2,步长为2,实现下采样操作。当数值过大或者过小时,Sigmoid、Tanh等激活函数的导数接近于0,而ReLU为非饱和激活函数,不存在这种现象,并且其求导更好计算,使得网络训练更快,所以非线性激活层采用ReLU激活函数。由Max-Pooling分割的六个VGG模块的详细参数如表1所示,其中3DConvolution包含Conv3d层、BatchNorm3d层、ReLU层,Skip Connection包含Conv3d层和BatchNorm3d层,Full Connection包含Linear层、ReLU层和Dropout层,Dropout率均为0.5。K表示卷积核大小,S表示卷积步长,P为1表示填充,为0表示不填充输入张量的边缘。
在模型训练中,初始化学习率为0.0001。在SGD优化器中,采用动量法优化训练迭代,Gamma参数初始值为0.1,Momentum参数为0.9,权重衰减系数为0.0001。模型利用Pytorch实现,在Intel i7 9700K CPU和NVIDIA 2080Ti GPU平台上训练与验证,并在120个迭代训练中保存最佳模型。
训练保存的最佳模型,应用在测试集上的分类结果来看,三分类最佳准确率为94.81%,AD与NC分类准确率为99.62%,AD与MCI的分类准确率为96.79%,MCI与NC的分类准确率为96.30%。模型在测试集上的详细分类性能参数如表2所示,可以看出,整体性能达到了令人满意的效果,并且对疾病的敏感度较高,这使得辅助诊断的可靠性更高。因为3D CNN在继承2D CNN特点的同时,能够更好的捕捉MRI数据的空间信息,对大脑结构的变化能够做到整体的分析,这在医学影像分析中具有非常重要的意义。从综合评估标准F1-Score可以看出,虽然模型在三个二分类任务中性能表现优异,但是随着分类任务的难度增加,不同任务之间的结果有一定的差异。
Figure 418984DEST_PATH_IMAGE014
基于3D CNN的方法在AD与NC、AD与MCI、MCI与NC的二分类工作,以及AD/MCI/NC的三分类任务中,实验模型的精度优于其他方法。如图5所示,与现有的方法对比,多个分类任务结果的标准偏差分别为3.38、3.29、1.51和2.87,而本发明的方法的标准偏差为1.79。因此,本发明的模型比现有的大多数阿尔兹海默症的分类工作具有更好的稳定性。同时可以看出,随着分类任务难度的增加,模型的性能略有下降,但本发明提出的模型仍然保持了良好的效果,这不仅进一步证明了实验模型的分类的鲁棒性,而且证明了该模型对疾病诊断的可靠性。
ROC曲线将灵敏度与特异性以图示方法结合在一起,可准确反映某分析方法特异性和敏感性的关系,是试验准确性的综合代表。而其线下面积AUC作为可以直观的评价分类器的好坏的数值,值越大越好,AUC大于0.5一般被认为具有较强的识别能力,而小于0.5则被认为没有识别能力。实验计算AUC,如表3所示。
从表3可以看出,其中AD相对于其他类数据的AUC为0.992,MCI为0.983,由此可以看出,模型三分类性能优异,具有较高的鲁棒性。微平均ROC曲线线下面积为0.988,宏平均为0.991,表明了模型分类的综合性能表现良好,这对于AD的辅助诊断,以及对疾病前期发展的干预,具有很大的帮助。实验模型用于三个二分类任务的训练,并将得到的最佳模型在测试集进行分类,分类结果表明模型具有良好的泛化性。通过下表比较三个二分类模型的AUC值可以看出,本实验模型在二分类任务上依然具有优秀的效果。
Figure 593614DEST_PATH_IMAGE015
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims (4)

1.一种基于改进的3D CNN网络的阿尔茨海默病分类方法,其特征在于,包括如下步骤:
(1)使用3D CNN建模:首先构建包含六个模块的2D的VGG网络模型,再将其中的2D CNN部分替换为3D CNN,形成 3D VGG网络模型;
(2)优化模型结构:在3D VGG网络模型的前五个模块的3D CNN层之后先添加批量归一化层,然后再添加跳跃连接,将前一个模块提取的数据特征经过1×1×1的卷积处理,并进行批量归一化后,与当前模块提取的数据特征相加,作为下一个模块的输入;
(3)从阿尔兹海默症神经成像计划数据集选取核磁共振数据,并对数据进行预处理,再划分成训练集和测试集;
(4)模型训练:将步骤(3)处理得到的训练集数据输入步骤(2)得到的模型,进行迭代,每次迭代后计算模型分类的准确率,并保留到当前迭代为止准确率最高的模型参数;达到设定的迭代次数后,输出模型参数;
(5)将待分类的测试集数据输入步骤(4)保存的最优网络模型中,得到对应的分类结果。
2.根据权利要求1所述的基于改进的3D CNN网络的阿尔茨海默病分类方法,其特征在于, 所述的步骤(1)中,首先将2D CNN层替换为3D CNN层,再将2D Maxpooling层替换为3DMaxpooling层;最后,修改第六个模块,即分类层,添加3个维度分别为2048、1024、3的全连接层。
3.根据权利要求2所述的基于改进的3D CNN网络的阿尔茨海默病分类方法,其特征在于,所述的步骤(1)中,3D CNN层对输入的核磁共振数据作如下处理,得到特征图x l
Figure 651604DEST_PATH_IMAGE001
其中,x l (a,b,c)为第l层卷积的输出特征图的像素点,(a,b,c)为点坐标,(d,e,f)表示特征图尺寸,K表示卷积核,其尺寸为Size K =k×k×k
4.根据权利要求3所述的基于改进的3D CNN网络的阿尔茨海默病分类方法,其特征在于,所述的步骤(2)具体为:
(2.1)在每个模块的每个卷积层后添加批量归一化层,即为输入激活函数的特征x l 进行如下公式的归一化
Figure 911684DEST_PATH_IMAGE002
其中x l 表示第l层卷积的输出特征图,μ为输入特征图沿着通道方向计算的平均数,σ为输入特征图沿着通道方向计算的方差;公式中的ε是一个为了归一化后的数值稳定而设置的常量,加入的缩放变量γ和平移变量β为BN层可训练的参数;
将得到的归一化后的特征图经过ReLU激活函数,得到非线性映射,作为下一层卷积的输入;
(2.2)将来自第i-1个模块的输出特征图x i-1输入第i个模块,经过步骤(2.1)处理得到第i个模块的输出特征图x i ,再将x i-1输入到跳跃连接进行处理,则得到分支特征r i ,对输出特征图x i 和分支特征r i 进行如下公式的叠加,得到输出特征H(x i ):
Figure 521657DEST_PATH_IMAGE003
H(x i )输入第i个模块的最后一个3D Maxpooling层,得到该模块的输出特征,即第i+1个模块的输入特征。
CN202010772776.0A 2020-07-24 2020-08-04 基于改进的3d cnn网络的阿尔茨海默病分类方法 Active CN111738363B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020107244021 2020-07-24
CN202010724402 2020-07-24

Publications (2)

Publication Number Publication Date
CN111738363A true CN111738363A (zh) 2020-10-02
CN111738363B CN111738363B (zh) 2020-12-25

Family

ID=72657096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010772776.0A Active CN111738363B (zh) 2020-07-24 2020-08-04 基于改进的3d cnn网络的阿尔茨海默病分类方法

Country Status (1)

Country Link
CN (1) CN111738363B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112674720A (zh) * 2020-12-24 2021-04-20 四川大学 基于3d卷积神经网络的阿尔茨海默症的预诊断方法
CN112767341A (zh) * 2021-01-14 2021-05-07 广州中医药大学第一附属医院 一种基于深度学习的2型糖尿病患者脑结构认知障碍分类方法
CN113538333A (zh) * 2021-06-08 2021-10-22 中南民族大学 基于脑部块特征加权表达的阿尔茨海默症诊断方法
CN113989551A (zh) * 2021-10-25 2022-01-28 哈尔滨理工大学 一种基于改进ResNet网络的阿尔茨海默病分类方法
CN114512236A (zh) * 2022-04-18 2022-05-17 山东师范大学 一种阿尔兹海默症智能辅助诊断系统
CN114821146A (zh) * 2021-01-27 2022-07-29 四川大学 一种基于增强的弱监督细粒度阿尔兹海默症分类方法
CN115063419A (zh) * 2022-08-16 2022-09-16 广东工业大学 基于可解释集成3dcnn的神经影像学生物标志物的提取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110838108A (zh) * 2019-10-30 2020-02-25 腾讯科技(深圳)有限公司 基于医疗图像的预测模型构建方法、预测方法及装置
CN111340828A (zh) * 2020-01-10 2020-06-26 南京航空航天大学 基于级联卷积神经网络的脑部胶质瘤分割

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110838108A (zh) * 2019-10-30 2020-02-25 腾讯科技(深圳)有限公司 基于医疗图像的预测模型构建方法、预测方法及装置
CN111340828A (zh) * 2020-01-10 2020-06-26 南京航空航天大学 基于级联卷积神经网络的脑部胶质瘤分割

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郁松 等: "基于3D-ResNet的阿尔兹海默症分类算法研究", 《计算机工程与科学》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112674720A (zh) * 2020-12-24 2021-04-20 四川大学 基于3d卷积神经网络的阿尔茨海默症的预诊断方法
CN112674720B (zh) * 2020-12-24 2022-03-22 四川大学 基于3d卷积神经网络的阿尔茨海默症的预判断方法
CN112767341A (zh) * 2021-01-14 2021-05-07 广州中医药大学第一附属医院 一种基于深度学习的2型糖尿病患者脑结构认知障碍分类方法
CN114821146A (zh) * 2021-01-27 2022-07-29 四川大学 一种基于增强的弱监督细粒度阿尔兹海默症分类方法
CN113538333A (zh) * 2021-06-08 2021-10-22 中南民族大学 基于脑部块特征加权表达的阿尔茨海默症诊断方法
CN113989551A (zh) * 2021-10-25 2022-01-28 哈尔滨理工大学 一种基于改进ResNet网络的阿尔茨海默病分类方法
CN113989551B (zh) * 2021-10-25 2024-05-03 哈尔滨理工大学 一种基于改进ResNet网络的阿尔茨海默病分类方法
CN114512236A (zh) * 2022-04-18 2022-05-17 山东师范大学 一种阿尔兹海默症智能辅助诊断系统
CN115063419A (zh) * 2022-08-16 2022-09-16 广东工业大学 基于可解释集成3dcnn的神经影像学生物标志物的提取方法

Also Published As

Publication number Publication date
CN111738363B (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN111738363B (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
CN113191215B (zh) 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN112446891B (zh) 基于U-Net网络脑胶质瘤的医学图像分割方法
CN110503630B (zh) 一种基于三维深度学习模型的脑出血分类、定位与预测方法
CN113221641B (zh) 基于生成对抗网络和注意力机制的视频行人重识别方法
CN109389171B (zh) 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法
CN111090764B (zh) 基于多任务学习和图卷积神经网络的影像分类方法及装置
CN110930378B (zh) 基于低数据需求的肺气肿影像处理方法及系统
Gu et al. Blind image quality assessment via vector regression and object oriented pooling
CN112529886B (zh) 一种基于Attention DenseUNet的MRI神经胶质瘤分割方法
CN111242233A (zh) 一种基于融合网络的阿尔兹海默病分类方法
CN115496720A (zh) 基于ViT机制模型的胃肠癌病理图像分割方法及相关设备
CN116579975A (zh) 一种卷积神经网络的脑龄预测方法及系统
CN115457057A (zh) 一种采用深监督策略的多尺度特征融合腺体分割方法
CN114821299A (zh) 一种遥感图像变化检测方法
CN112329662B (zh) 基于无监督学习的多视角显著性估计方法
CN117593243A (zh) 可靠伪标签引导的压缩机外观自适应检测方法
CN117392450A (zh) 一种基于进化多尺度特征学习的钢铁材料质量解析方法
CN117611830A (zh) 一种基于少样本标注的任意类别目标定位与计数方法
CN112863650A (zh) 一种基于卷积与长短期记忆神经网络的心肌病识别系统
CN112329716A (zh) 一种基于步态特征的行人年龄段识别方法
CN111160346A (zh) 基于三维卷积的缺血性脑卒中分割系统
WO2022127500A1 (zh) 基于多个神经网络的mri图像分割方法、装置及设备
CN113450313B (zh) 一种基于区域对比学习的图像显著性可视化方法
CN113435321A (zh) 一种主轴轴承状态评估方法、系统、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant