CN114937171A - 基于深度学习的阿尔茨海默分类系统 - Google Patents

基于深度学习的阿尔茨海默分类系统 Download PDF

Info

Publication number
CN114937171A
CN114937171A CN202210513470.2A CN202210513470A CN114937171A CN 114937171 A CN114937171 A CN 114937171A CN 202210513470 A CN202210513470 A CN 202210513470A CN 114937171 A CN114937171 A CN 114937171A
Authority
CN
China
Prior art keywords
module
feature
mam
characteristic diagram
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210513470.2A
Other languages
English (en)
Other versions
CN114937171B (zh
Inventor
耿道颖
周锟
于泽宽
朴思蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou
Fudan University
Original Assignee
Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou, Fudan University filed Critical Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou
Priority to CN202210513470.2A priority Critical patent/CN114937171B/zh
Publication of CN114937171A publication Critical patent/CN114937171A/zh
Application granted granted Critical
Publication of CN114937171B publication Critical patent/CN114937171B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10104Positron emission tomography [PET]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Abstract

本发明提供了一种基于深度学习的阿尔茨海默分类系统,包括:模块M1:获取AD多模态数据并进行预处理,得到预处理后的AD多模态数据;模块M2:将预处理后的AD多模态数据按照预设比例分为训练集及测试集;模块M3:构建联合网络模型,包括MAM U‑net分割网络和T‑DenseNet分类网络;模块M4:利用训练集训练联合模型直至损失函数收敛,得到训练后的联合模型;模块M5:利用测试集通过训练后的联合模型进行预测,并根据预测结果和预设标注信息计算准确率,如果准确率未达到预设要求,则重复触发模块M4至模块M5直至准确率达到预设要求。

Description

基于深度学习的阿尔茨海默分类系统
技术领域
本发明涉及多模态图像智能识别技术领域,具体地,涉及基于深度学习的阿尔茨海默分类系统。
背景技术
阿尔茨海默症(Alzheimer's disease,AD)是最常见的进行性神经退行性疾病之一。据报道,AD已成为2019年第六大死因。AD通常起病隐匿,并逐渐发展,只有在患者出现不可逆转的行为和认知障碍后才能确诊。在疾病发展的初期阶段对AD进行准确的诊断可以及时有效的缓解病情。轻度认知障碍(Mild cognitive impairment,MCI)被认为是正常衰老和AD之间的过渡阶段,研究表明海马体是AD最早受影响的脑区之一,对于延缓AD的发病和治疗非常重要。因此对于海马体区域的精准分割将有助于提高AD的诊断。最终达到提高患者生存率和存活时间的目标。
随着计算机技术的快速发展,医学成像技术得到了前所未有的进步。越来越多具有不同模式的医学图像被应用于计算机辅助诊断。不同模态的医学图像可以提供不同类型的特征信息来识别AD和MCI或正常对照组(Normal control,NC)。磁共振成像(Magneticresonance imaging,MRI)是一种非侵入性成像技术,可以生成大脑等内部身体结构的解剖图像,检测和测量AD患者的脑萎缩模式有助于了解与AD相关的大脑解剖和功能变化。正电子发射断层扫描(Positron Emission Computed Tomography,PET)可以捕捉大脑代谢的激活,揭示生物标记物的生理模式,例如通过脑脊液测量的病理性淀粉样沉积来辅助诊断AD。许多研究表明,利用多模态图像中的特异性特征有助于改善AD的诊断。
如今,以深度学习为代表的机器学习在图像分割及分类领域中发挥着重要的作用。2015年U-net网络的提出使人们开始利用计算机强大的计算能力对医学图像进行处理和分析,大大促进了机器学习在医疗辅助诊断中的发展。
当前对于AD的研究大多集中于单个任务,所提取的特征都独立于分类模型可能会导致次优解,针对特定任务采用的网络模型鲁棒性和泛化性较差。此外,由于海马体病灶区域占整个脑部图像比例较小,目标区域和图像整体体素数量失衡会导致模型优化方向偏移。
专利文献CN113989551A(申请号:202111237755.X)公开了一种基于改进的ResNet网络的阿尔茨海默病的分类方法,主要解决现有分类检测算法过程中数据不均衡及池化中特征丢失的问题。其方案是:(1)对ResNet网络进行改进加入有效通道注意力ECA模块,搭建针对阿尔茨海默病的ResNet分类检测网络;(2)为减少池化操作过程中的信息丢失,将最大池化Maxpool修改为softpool;(3)使用焦点损失函数替换交叉熵损失函数来解决数据不均衡,以及模型难学习困难样本的问题;(4)选取每一个MRI 3D数据在Axial-横截、Sagittal-矢状、Coronal-冠状三个轴向位置的2D形式切片;(5)对改进后ResNet网络进行训练和测试。
专利文献CN110236543A(申请号:201910435384.2)公开了一种基于深度学习的阿尔茨海默病多分类诊断系统,包括:图像特征提取模块,用于根据神经网络模型对大脑三正交平面MRI图像的特征向量进行提取;指标特征选择模块,用于根据医学相关文献选择检查指标组成指标特征向量;向量线性融合模块,用于采用基于典型相关分析的多元数据线性融合方法将图像的特征向量和指标特征向量进行融合;疾病分类诊断模块,用于将融合后的向量输入多分类分类器来区分阿尔茨海默病的三个阶段。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于深度学习的阿尔茨海默分类系统。
根据本发明提供的一种基于深度学习的阿尔茨海默分类系统,包括:
模块M1:获取AD多模态数据并进行预处理,得到预处理后的AD多模态数据;
模块M2:将预处理后的AD多模态数据按照预设比例分为训练集及测试集;
模块M3:构建联合网络模型,包括MAM U-net分割网络和T-DenseNet分类网络;
模块M4:利用训练集训练联合模型直至损失函数收敛,得到训练后的联合模型;
模块M5:利用测试集通过训练后的联合模型进行预测,并根据预测结果和预设标注信息计算准确率,如果准确率未达到预设要求,则重复触发模块M4至模块M5直至准确率达到预设要求;
所述MAM U-net分割网络是基于MAM注意力机制模块完成海马体区域分割任务;
所述T-DenseNet分类网络是基于Dense模块完成高级别语义特征提取任务;
所述联合模型是基于MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层,根据将预处理后的AD多模态数据对阿尔兹海默进行分类。
优选地,所述模块M1采用:对获取的AD多模态数据进行预处理,得到统一标准AD多模态数据集;对得到的统一标准AD多模态数据集标注海马体区域。
优选地,所述MAM U-net分割网络包括:压缩特征图模块和将压缩特征图解压缩模块;
所述压缩特征图模块包括卷积层、MAM模块、下采样、MAM模块、下采样以及ResNet模块;将T1WI和PET图像构成的双通道三维特征图I0经过卷积层得到弱语义特征I1;弱语义特征I1输入至MAM模块得到包含通道和空间信息的特征图I2;将特征图I2经过下采样处理得到特征图I3;将特征图I3输入至MAM模块得到特征图I4;将特征图I4经过下采样处理得到特征图I5;最后将特征图I5输入至ResNet模块中得到较高级别的语义特征I6
所述将压缩特征图解压模块包括ResNet模块、上采样、MAM模块、上采样、MAM模块以及卷积层;将较高级别的语义特征I6输入到ResNet模块中得到特征图I7,特征图I7经过上采样操作得到特征图I8,特征图I8与特征图I4进行矩阵相加操作后输入到MAM模块中得到特征图I9,将特征图I9经过上采样处理得到特征图I10,特征图I10与特征图I2再次进行矩阵相加操作后输入到MAM模块得到特征图I11,最后将特征图I11经过卷积操作获得分割结果ResultSeg
优选地,所述MAM模块包括空间注意力机制以及通道注意力机制;
所述空间注意力机制为通过两个池化操作聚合特征映射的通道信息生成两个二维映射:
Figure BDA0003638696740000031
Figure BDA0003638696740000032
分别表示通道中的平均池特征和最大池特征;然后通过卷积层将它们连接并卷积,生成空间特征图;其中,
Figure BDA0003638696740000033
表示矩阵,矩阵的大小为C/r×1×1;C表示通道的数量;r表示缩减率;W和H分别表示特征图的宽和高;
所述通道注意力机制将输入的特征图经过最大池化和平均池化操作分别生成最大池特征和平均池特征,接着将最大池特征和平均池特征输入共享网络生成通道特征图;
所述共享网络包括多层感知机MLP和隐藏层,对输入的最大池特征和平均池特征进行融合,得到一个相同大小的通道特征图;
将得到的通道特征图和空间特征图经过权重计算得到MAM模块输出的特征图;
Figure BDA0003638696740000041
其中,
Figure BDA0003638696740000042
ω表示权重。
优选地,所述空间特征图采用:
Figure BDA0003638696740000043
其中,σ表示sigmoid激活函数;f7×7表示大小为7×7的卷积运算;F表示输入的特征图;AvgPool和MaxPool分别表示平均池化操作和最大池化操作。
优选地,所述通道特征图采用:
Figure BDA0003638696740000044
其中,
Figure BDA0003638696740000045
优选地,所述T-DenseNet分类网络包括:卷积层、密集模块以及过渡层;
所述密集模块通过短连接获取上一层密集模块的特征图;每两个密集模块之间插入一个过渡层缩减特征图的数量;所述过渡层包括批处理标准化操作、卷积操作以及Dropout操作;
将分割结果ResultSeg通过卷积层提取高分辨率的弱语义特征f0,并将获得的弱语义特征f0依次通过密集模块和过渡层提取高级语义特征f1,将高级语义特征f1输入到密集模块-过渡层中获得语义特征f2,最后将语义特征f2再输入到密集模块-过渡层中获得较高级别的语义特征FeatureCla
优选地,所述联合模型包括:MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层;
预处理后的AD多模态数据通过MAM U-net分割网络得到特征图FeatureSeg和分割结果ResultSeq;FeatureSeg通过T-DenseNet分类网络得到较高级别的语义特征FeatureCla;将特征图FeatureSeg和较高级别的语义特征FeatureCla依次通过concate层以及全连接层进行分类得到一维向量Fres={r1,r2,…rt},t=(0,1,2,…N),其中N表示训练集的切片数量;rt的值为0或1;其中,1表示患有AD,0表示健康;
所述特征图FeatureSeg是将每次上采样输出的特征图进行concate操作获得的。
优选地,所述损失函数采用:
所述MAM U-net分割网络采用Dice损失函数:
Figure BDA0003638696740000051
其中,N表示ResultSeg的像素值总数;pi表示像素i对应于ResultSeg的分割概率;qi表示像素i对应于maskHC的类别;ε表示非0常数;
所述T-DenseNet分类网络采用focal损失函数:
Figure BDA0003638696740000052
其中,y′表示像素点对应于ResultSeg的分割概率;α和γ表示超参数;y=1表示像素点所属的原图为患有AD,y=0表示像素点所属的原图为健康对照组;
所述损失函数采用:
LDC=β*Ls+(1-β)*Lf
其中,β表示权重,用于调整训练中海马分割和疾病分类的损失。
优选地,所述模块M4采用:在训练联合模型的过程中,权重β的数值是不断变化的;在初始阶段的预设时间内,β设置为1以强调分割任务;预设时间后,β设置为0.5,用于分割和分类的多任务训练;在最后阶段的预设时间内,β设置为0,使联合模型更加关注分类任务。
与现有技术相比,本发明具有如下的有益效果:
1、本发明结合提出的MAM U-net和T-DenseNet,对阿尔茨海默症多模态影像进行病灶分割和疾病分类;通过设计不同损失函数平衡多任务模型训练,来解决现有模型优化只能达到次优的问题;
2、本发明与其它阿尔茨海默症诊断模型相比,分割与分类准确率都有10%以上的提升;
3、本发明所提出的阿尔茨海默分类方法集分割与分类为一体,全程智能化,无需人工经验识别,即在模型实现分割和分类,可以免去人工寻找的过程,而用深度学习的方式寻找到全面且有效的特征。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为基于深度学习的阿尔茨海默分类方法流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1
根据本发明提供的一种基于深度学习的阿尔茨海默分类系统,包括:
模块M1:获取AD多模态数据并进行预处理,得到预处理后的AD多模态数据;
模块M2:将预处理后的AD多模态数据按照预设比例分为训练集及测试集;
模块M3:构建联合网络模型,包括MAM U-net分割网络和T-DenseNet分类网络;
模块M4:利用训练集训练联合模型直至损失函数收敛,得到训练后的联合模型;
模块M5:利用测试集通过训练后的联合模型进行预测,并根据预测结果和预设标注信息计算准确率,如果准确率未达到预设要求,则重复触发模块M4至模块M5直至准确率达到预设要求;
所述MAM U-net分割网络是基于MAM注意力机制模块完成海马体区域分割任务;
所述T-DenseNet分类网络是基于Dense模块完成高级别语义特征提取任务;
所述联合模型是基于MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层,根据将预处理后的AD多模态数据对阿尔兹海默进行分类。
优选地,所述模块M1采用:对获取的AD多模态数据进行预处理,得到统一标准AD多模态数据集;对得到的统一标准AD多模态数据集标注海马体区域。
优选地,所述MAM U-net分割网络包括:压缩特征图模块和将压缩特征图解压缩模块;
所述压缩特征图模块包括卷积层、MAM模块、下采样、MAM模块、下采样以及ResNet模块;将T1WI和PET图像构成的双通道三维特征图I0经过卷积层得到弱语义特征I1;弱语义特征I1输入至MAM模块得到包含通道和空间信息的特征图I2;将特征图I2经过下采样处理得到特征图I3;将特征图I3输入至MAM模块得到特征图I4;将特征图I4经过下采样处理得到特征图I5;最后将特征图I5输入至ResNet模块中得到较高级别的语义特征I6
所述将压缩特征图解压模块包括ResNet模块、上采样、MAM模块、上采样、MAM模块以及卷积层;将较高级别的语义特征I6输入到ResNet模块中得到特征图I7,特征图I7经过上采样操作得到特征图I8,特征图I8与特征图I4进行矩阵相加操作后输入到MAM模块中得到特征图I9,将特征图I9经过上采样处理得到特征图I10,特征图I10与特征图I2再次进行矩阵相加操作后输入到MAM模块得到特征图I11,最后将特征图I11经过卷积操作获得分割结果ResultSeg
优选地,所述MAM模块包括空间注意力机制以及通道注意力机制;
所述空间注意力机制为通过两个池化操作聚合特征映射的通道信息生成两个二维映射:
Figure BDA0003638696740000071
Figure BDA0003638696740000072
分别表示通道中的平均池特征和最大池特征;然后通过卷积层将它们连接并卷积,生成空间特征图;其中,
Figure BDA0003638696740000078
表示矩阵,矩阵的大小为C/r×1×1;C表示通道的数量;r表示缩减率;W和H分别表示特征图的宽和高;
所述通道注意力机制将输入的特征图经过最大池化和平均池化操作分别生成最大池特征和平均池特征,接着将最大池特征和平均池特征输入共享网络生成通道特征图;
所述共享网络包括多层感知机MLP和隐藏层,对输入的最大池特征和平均池特征进行融合,得到一个相同大小的通道特征图;
将得到的通道特征图和空间特征图经过权重计算得到MAM模块输出的特征图;
Figure BDA0003638696740000073
其中,
Figure BDA0003638696740000074
ω表示权重。
优选地,所述空间特征图采用:
Figure BDA0003638696740000075
其中,σ表示sigmoid激活函数;f7×7表示大小为7×7的卷积运算;F表示输入的特征图;AvgPool和MaxPool分别表示平均池化操作和最大池化操作。
优选地,所述通道特征图采用:
Figure BDA0003638696740000076
其中,
Figure BDA0003638696740000077
优选地,所述T-DenseNet分类网络包括:卷积层、密集模块以及过渡层;
所述密集模块通过短连接获取上一层密集模块的特征图;每两个密集模块之间插入一个过渡层缩减特征图的数量;所述过渡层包括批处理标准化操作、卷积操作以及Dropout操作;
将分割结果ResultSeg通过卷积层提取高分辨率的弱语义特征f0,并将获得的弱语义特征f0依次通过密集模块和过渡层提取高级语义特征f1,将高级语义特征f1输入到密集模块-过渡层中获得语义特征f2,最后将语义特征f2再输入到密集模块-过渡层中获得较高级别的语义特征FeatureCla
优选地,所述联合模型包括:MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层;
预处理后的AD多模态数据通过MAM U-net分割网络得到特征图FeatureSeg和分割结果ResultSeg;FeatureSeg通过T-DenseNet分类网络得到较高级别的语义特征FeatureCla;将特征图FeatureSeg和较高级别的语义特征FeatureCla依次通过concate层以及全连接层进行分类得到一维向量Fres={r1,r2,…rt},t=(0,1,2,…N),其中N表示训练集的切片数量;rt的值为0或1;其中,1表示患有AD,0表示健康;
所述特征图FeatureSeg是将每次上采样输出的特征图进行concate操作获得的。
优选地,所述损失函数采用:
所述MAM U-net分割网络采用Dice损失函数:
Figure BDA0003638696740000081
其中,N表示ResultSeg的像素值总数;pi表示像素i对应于ResultSeg的分割概率;qi表示像素i对应于maskHC的类别;ε表示非0常数;
所述T-DenseNet分类网络采用focal损失函数:
Figure BDA0003638696740000082
其中,y′表示像素点对应于ResultSeg的分割概率;α和γ表示超参数;y=1表示像素点所属的原图为患有AD,y=0表示像素点所属的原图为健康对照组;
所述损失函数采用:
LDC=β*Ls+(1-β)*Lf
其中,β表示权重,用于调整训练中海马分割和疾病分类的损失。
优选地,所述模块M4采用:在训练联合模型的过程中,权重β的数值是不断变化的;在初始阶段的预设时间内,β设置为1以强调分割任务;预设时间后,β设置为0.5,用于分割和分类的多任务训练;在最后阶段的预设时间内,β设置为0,使联合模型更加关注分类任务。
本发明提供的基于深度学习的阿尔茨海默分类系统,可以通过本发明提供的基于深度学习的阿尔茨海默分类方法中的步骤流程实现。本领域技术人员,可以将所述基于深度学习的阿尔茨海默分类方法理解为基于深度学习的阿尔茨海默分类系统的一个优选例。
实施例2
实施例2是实施例1的优选例
一种基于深度学习的阿尔茨海默分类方法,如图1所示,包括:
步骤S1:获取AD多模态数据并对多模态数据进行预处理,得到统一标准AD多模态数据集Dall,包含:T1WI,PET,分别记作IT1W1和IPET;此外,每个病例还包括医生标注的海马体区域,记作maskHC;将每种模态的图像格式设置为nii.gz,数据大小配准为256×256×32。将数据集Dall按照8∶2的比例分为训练集Dtrain和测试集Dtest
步骤S2:构建MAM U-net分割网络,构造MAM注意力机制模块完成海马体区域分割任务。多模态图像IT1W1,IPET和标签maskHC被送入MAM U-net分割网络获得特征图FeatureSeg和分割结果ResultSeg
步骤S3:构建T-DenseNet分类网络将步骤S2得到的ResultSeg进行特征提取得到较高级别的语义特征FeatureCla
步骤S4:设置分割网络和分类网络的损失函数为Dice损失函数以及Focal损失函数。两者加权构造得到联合网络的损失函数IossDC,通过损失函数lossDC平衡分割与分类网络之间以及海马体区域和全脑区域之间的重要性;
步骤S5:将步骤S2和S3得到的特征图FeatureSeg和FeatureCla经由concate,全连接层进行分类,直至IossDC趋于稳定保存最终的联合模型。
所述的一种基于深度学习的阿尔茨海默分类方法,包括:多模态图像分割网络MAMU-net,分类网络T-DenseNet,基于Dice和Focal loss的联合损失函数;完成多模态阿尔茨海默症图像的分割分类;
具体地,所述步骤S1采用:
S11:获取AD的T1WI和PET图像,对获取的多模态图像进行数据脱敏并剔除不规范的图像,将每幅图像重采样为256×256×32大小来提高数据的一致性;
S12:通过临床医生对图像的手动标注得到海马体区域maskHC得到统一标准AD多模态数据库Dall
具体地,所述步骤S2采用:
S21:构建MAM模块,MAM模块包含空间注意力机制,通道注意力机制和共享网络。通道注意力机制将输入的特征图经过最大池化和平均池化操作生成两个描述符
Figure BDA0003638696740000106
Figure BDA0003638696740000107
分别表示平均池特征和最大池特征。接着将这两个描述符送入到一个共享网络,以生成通道特征图
Figure BDA0003638696740000108
共享网络由多层感知机(MLP)和一个隐藏层组成。为了减少参数开销,将隐藏的激活大小设置为
Figure BDA0003638696740000109
其中C为通道的数量,r为缩减率,公式描述如下:
Figure BDA0003638696740000101
其中,σ表示sigmoid激活函数,
Figure BDA0003638696740000102
AvgPool和MaxPool分别表示平均池化操作和最大池化操作,F表示输入的特征图。
空间注意力机制使用两个池操作来聚合特征映射的通道信息,生成两个二维映射:
Figure BDA0003638696740000103
Figure BDA0003638696740000104
分别表示通道中的平均池特征和最大池特征。然后通过标准的卷积层将它们连接并卷积,生成我们的空间特征图。公式描述如下:
Figure BDA0003638696740000105
其中,σ表示sigmoid激活函数,f7×7表示大小为7×7的卷积运算。
将得到的通道特征图和空间特征图经过权重计算得到最终MAM模块输出的特征图,公式如下:
FMAM=φ*Mc(F)+ω*Ms(F)
其中,
MAM模块所输出的特征图可以得到通道和空间维度上的注意力权重,提高各个特征在通道和空间上的联系,更有利于提取目标的有效特征。
S22:构建MAM U-net网络。MAM U-net为U型结构,由两部分组成:左侧是压缩特征图的过程,右侧是将特征图解压缩到其原始切片大小的过程。左侧压缩部分包括两个MAM模块和一个ResNet模块,然后对每个模块进行下采样操作,而右侧解压缩部分包括两个MAM模块和一个ResNet模块,然后对每个模块进行上采样操作。其中,下采样和上采样操作都由一个2×2×2,步长为2的卷积核和反向传播层组成。
S23:MAM U-net网络输入数据为T1WI和PET图像构成的双通道三维特征图I0,特征图大小为W×H×C,其中W和H表示特征图的宽和高。C表示通道数。压缩模块的具体操作为:将I0经过卷积层得到16个大小为256×256×32的弱语义特征I1,将I1输入到MAM模块得到包含通道和空间信息的特征图I2,将I2经过下采样处理得到I3,将I3输入到MAM模块得到特征图I4,将I4经过下采样处理得到I5,最后将I5输入到ResNet模块中得到较高级别的语义特征I6。每经过一次下采样特征图数量翻一倍,大小变为原来的一半,在减少图像尺寸的同时扩大特征的感受野范围。
S24:解压缩过程不断扩展特征图大小,具体操作为:将I6输入到ResNet模块中得到特征图I7,I7经过上采样操作得到I8,I8与I4进行矩阵相加操作后输入到MAM模块中得到I9,将I9经过上采样处理得到I10,I10与I2再次进行矩阵相加操作后输入到MAM模块得到I11,最后将I11经过卷积操作获得分割结果ResultSeg,大小为256×256×32,将每次上采样输出的特征图进行concate操作获得FeatureSeg
具体地,所述步骤S3:
S31:构建分类网络T-DenseNet网络,T-DenseNet由一个卷积层、4个密集模块和3个过渡层组成。其中,每一个密集模块都可以通过短连接获取上一层密集模块的特征图;每两个密集模块之间插入一个过渡层缩减特征图的数量,过渡层包含批处理标准化操作,大小为1×1×1的卷积操作以及Dropout操作。
S32:首先将ResultSeg送到卷积层,以提取高分辨率的弱语义特征f0,并将获得的f0送到密集模块-过渡层中以提取高级特征f1。将f1输入到密集模块-过渡层中获得语义特征f2,最后将f2再输入到密集模块-过渡层中获得较高级别的语义特征FeatureCla
具体地,所述步骤S4包括:
S41:MAM U-net模型采用Dice损失函数,公式定义如下:
Figure BDA0003638696740000111
其中,N表示ResultSeg的像素值总数,pi表示像素i对应于ResultSeg的分割概率,qi表示像素i对应于maskHC的类别,ε为一个较小的非0常数,用于防止分母为零。
S42:T-DenseNet模型采用focal损失函数,公式定义如下:
Figure BDA0003638696740000112
其中,y′表示该像素点对应于ResultSeg的分割概率,y=1表示该像素点所属的原图为患有AD,y=0表示该像素点所属的原图为健康对照组。α和γ为超参数,都是为了提高负样本的权重,改变网络的优化方向,分别设置为d=0.25,γ=0.5。
S43:联合网络的损失函数分别对S41和S42提出的损失函数进行加权,公式定义如下:
LDC=β*Ls+(1-β)*Lf
其中,β∈[0,1]是一个权重,用于调整训练中海马分割和疾病分类的损失。
具体地,所述步骤S5包括:
S51:对步骤S2和S3构造的MAM U-net和T-DenseNet进行联合,具体步骤为将特征图FeatureSeg和Featurecla经由concate,全连接层进行分类得到一维向量Fres={r1,r2,…rt},t=(0,1,2,…N),其中N表示训练集的切片数量,rt的值为0或1(1表示患有AD,0表示健康)。
其中,在联合网络训练过程中,β的数值是不断变化的。在初始阶段,β设置为1以强调分割任务。然后它变为0.5用于分割+分类的多任务训练。在最后阶段,β设置为0,使联合模型更加关注分类任务。训练T-DenseNet时,整个网络的初始权值是一致的,采用Adam优化器,学习率为10-4,经过120个迭代之后网络趋于稳定,保存此时的联合模型。
S52:将测试集载入训练好的联合网络模型进行预测得到分割和分类结果ResultSeg和Fres,根据标签计算Dice系数和分类准确率,本专利所提出的基于深度学习的阿尔茨海默分类方法准确率不劣于专业医生的判断结果。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种基于深度学习的阿尔茨海默分类系统,其特征在于,包括:
模块M1:获取AD多模态数据并进行预处理,得到预处理后的AD多模态数据;
模块M2:将预处理后的AD多模态数据按照预设比例分为训练集及测试集;
模块M3:构建联合网络模型,包括MAM U-net分割网络和T-DenseNet分类网络;
模块M4:利用训练集训练联合模型直至损失函数收敛,得到训练后的联合模型;
模块M5:利用测试集通过训练后的联合模型进行预测,并根据预测结果和预设标注信息计算准确率,如果准确率未达到预设要求,则重复触发模块M4至模块M5直至准确率达到预设要求;
所述MAM U-net分割网络是基于MAM注意力机制模块完成海马体区域分割任务;
所述T-DenseNet分类网络是基于Dense模块完成高级别语义特征提取任务;
所述联合模型是基于MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层,根据将预处理后的AD多模态数据对阿尔兹海默进行分类。
2.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述模块M1采用:对获取的AD多模态数据进行预处理,得到统一标准AD多模态数据集;对得到的统一标准AD多模态数据集标注海马体区域。
3.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述MAMU-net分割网络包括:压缩特征图模块和将压缩特征图解压缩模块;
所述压缩特征图模块包括卷积层、MAM模块、下采样、MAM模块、下采样以及ResNet模块;将T1WI和PET图像构成的双通道三维特征图I0经过卷积层得到弱语义特征I1;弱语义特征I1输入至MAM模块得到包含通道和空间信息的特征图I2;将特征图I2经过下采样处理得到特征图I3;将特征图I3输入至MAM模块得到特征图I4;将特征图I4经过下采样处理得到特征图I5;最后将特征图I5输入至ResNet模块中得到较高级别的语义特征I6
所述将压缩特征图解压模块包括ResNet模块、上采样、MAM模块、上采样、MAM模块以及卷积层;将较高级别的语义特征I6输入到ResNet模块中得到特征图I7,特征图I7经过上采样操作得到特征图I8,特征图I8与特征图I4进行矩阵相加操作后输入到MAM模块中得到特征图I9,将特征图I9经过上采样处理得到特征图I10,特征图I10与特征图I2再次进行矩阵相加操作后输入到MAM模块得到特征图I11,最后将特征图I11经过卷积操作获得分割结果ResultSeg
4.根据权利要求3所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述MAM模块包括空间注意力机制以及通道注意力机制;
所述空间注意力机制为通过两个池化操作聚合特征映射的通道信息生成两个二维映射:
Figure FDA0003638696730000021
Figure FDA0003638696730000022
分别表示通道中的平均池特征和最大池特征;然后通过卷积层将它们连接并卷积,生成空间特征图;其中,
Figure FDA0003638696730000023
表示矩阵,矩阵的大小为C/r×1×1;C表示通道的数量;r表示缩减率;W和H分别表示特征图的宽和高;
所述通道注意力机制将输入的特征图经过最大池化和平均池化操作分别生成最大池特征和平均池特征,接着将最大池特征和平均池特征输入共享网络生成通道特征图;
所述共享网络包括多层感知机MLP和隐藏层,对输入的最大池特征和平均池特征进行融合,得到一个相同大小的通道特征图;
将得到的通道特征图和空间特征图经过权重计算得到MAM模块输出的特征图;
Figure FDA0003638696730000024
其中,
Figure FDA0003638696730000025
ω表示权重。
5.根据权利要求4所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述空间特征图采用:
Figure FDA0003638696730000026
其中,σ表示sigmoid激活函数;f7×7表示大小为7×7的卷积运算;F表示输入的特征图;AvgPool和MaxPool分别表示平均池化操作和最大池化操作。
6.根据权利要求4所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述通道特征图采用:
Figure FDA0003638696730000027
其中,
Figure FDA0003638696730000028
7.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述T-DenseNet分类网络包括:卷积层、密集模块以及过渡层;
所述密集模块通过短连接获取上一层密集模块的特征图;每两个密集模块之间插入一个过渡层缩减特征图的数量;所述过渡层包括批处理标准化操作、卷积操作以及Dropout操作;
将分割结果ResultSeg通过卷积层提取高分辨率的弱语义特征f0,并将获得的弱语义特征f0依次通过密集模块和过渡层提取高级语义特征f1,将高级语义特征f1输入到密集模块-过渡层中获得语义特征f2,最后将语义特征f2再输入到密集模块-过渡层中获得较高级别的语义特征FeatureCla
8.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述联合模型包括:MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层;
预处理后的AD多模态数据通过MAM U-net分割网络得到特征图FeatureSeg和分割结果ResultSeg;FeatureSeg通过T-DenseNet分类网络得到较高级别的语义特征FeatureCla;将特征图FeatureSeg和较高级别的语义特征FeatureCla依次通过concate层以及全连接层进行分类得到一维向量Fres={r1,r2,…rt},t=(0,1,2,…N),其中N表示训练集的切片数量;rt的值为0或1;其中,1表示患有AD,0表示健康;
所述特征图FeatureSeg是将每次上采样输出的特征图进行concate操作获得的。
9.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述损失函数采用:
所述MAM U-net分割网络采用Dice损失函数:
Figure FDA0003638696730000031
其中,N表示ResultSeg的像素值总数;pi表示像素i对应于ResultSeg的分割概率;qi表示像素i对应于maskHC的类别;ε表示非0常数;
所述T-DenseNet分类网络采用focal损失函数:
Figure FDA0003638696730000032
其中,y'表示像素点对应于ResultSeg的分割概率;α和γ表示超参数;y=1表示像素点所属的原图为患有AD,y=0表示像素点所属的原图为健康对照组;
所述损失函数采用:
LDC=β*Ls+(1-β)*Lf
其中,β表示权重,用于调整训练中海马分割和疾病分类的损失。
10.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统,其特征在于,所述模块M4采用:在训练联合模型的过程中,权重β的数值是不断变化的;在初始阶段的预设时间内,β设置为1以强调分割任务;预设时间后,β设置为0.5,用于分割和分类的多任务训练;在最后阶段的预设时间内,β设置为0,使联合模型更加关注分类任务。
CN202210513470.2A 2022-05-11 2022-05-11 基于深度学习的阿尔茨海默分类系统 Active CN114937171B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210513470.2A CN114937171B (zh) 2022-05-11 2022-05-11 基于深度学习的阿尔茨海默分类系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210513470.2A CN114937171B (zh) 2022-05-11 2022-05-11 基于深度学习的阿尔茨海默分类系统

Publications (2)

Publication Number Publication Date
CN114937171A true CN114937171A (zh) 2022-08-23
CN114937171B CN114937171B (zh) 2023-06-09

Family

ID=82865070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210513470.2A Active CN114937171B (zh) 2022-05-11 2022-05-11 基于深度学习的阿尔茨海默分类系统

Country Status (1)

Country Link
CN (1) CN114937171B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110428432A (zh) * 2019-08-08 2019-11-08 梅礼晔 结肠腺体图像自动分割的深度神经网络算法
CN110458249A (zh) * 2019-10-10 2019-11-15 点内(上海)生物科技有限公司 一种基于深度学习与概率影像组学的病灶分类系统
CN110838108A (zh) * 2019-10-30 2020-02-25 腾讯科技(深圳)有限公司 基于医疗图像的预测模型构建方法、预测方法及装置
CN111259983A (zh) * 2020-02-13 2020-06-09 电子科技大学 基于深度学习的图像语义分割方法及存储介质
US20200357143A1 (en) * 2019-05-09 2020-11-12 Sri International Semantically-aware image-based visual localization
CN113256561A (zh) * 2021-04-21 2021-08-13 浙江工业大学 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法
WO2021184817A1 (zh) * 2020-03-16 2021-09-23 苏州科技大学 一种医学图像中肝脏及其病灶分割的方法
CN113706486A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于密集连接网络迁移学习的胰腺肿瘤图像分割方法
CN113989551A (zh) * 2021-10-25 2022-01-28 哈尔滨理工大学 一种基于改进ResNet网络的阿尔茨海默病分类方法
CN114170244A (zh) * 2021-11-24 2022-03-11 北京航空航天大学 一种基于级联神经网络结构的脑胶质瘤分割方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200357143A1 (en) * 2019-05-09 2020-11-12 Sri International Semantically-aware image-based visual localization
CN110428432A (zh) * 2019-08-08 2019-11-08 梅礼晔 结肠腺体图像自动分割的深度神经网络算法
CN110458249A (zh) * 2019-10-10 2019-11-15 点内(上海)生物科技有限公司 一种基于深度学习与概率影像组学的病灶分类系统
CN110838108A (zh) * 2019-10-30 2020-02-25 腾讯科技(深圳)有限公司 基于医疗图像的预测模型构建方法、预测方法及装置
CN111259983A (zh) * 2020-02-13 2020-06-09 电子科技大学 基于深度学习的图像语义分割方法及存储介质
WO2021184817A1 (zh) * 2020-03-16 2021-09-23 苏州科技大学 一种医学图像中肝脏及其病灶分割的方法
CN113256561A (zh) * 2021-04-21 2021-08-13 浙江工业大学 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法
CN113706486A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于密集连接网络迁移学习的胰腺肿瘤图像分割方法
CN113989551A (zh) * 2021-10-25 2022-01-28 哈尔滨理工大学 一种基于改进ResNet网络的阿尔茨海默病分类方法
CN114170244A (zh) * 2021-11-24 2022-03-11 北京航空航天大学 一种基于级联神经网络结构的脑胶质瘤分割方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ERIC Z. CHEN ET AL.: ""LESION ATTRIBUTES SEGMENTATION FOR MELANOMA DETECTION WITH MULTI-TASK U-NET"", 《2019 IEEE 16TH INTERNATIONAL SYMPOSIUM ON BIOMEDICAL IMAGING (ISBI 2019)》, pages 485 - 488 *
FEI HE ET AL.: "\"Multi-scale Attention Module U-Net liver tumour segmentation method\"", 《JOURNAL OF PHYSICS: CONFERENCE SERIES》, pages 1 - 8 *
刘文轩 等: "\"基于多任务联合稀疏和低秩表示的 高分辨率遥感图像分类\"", 《武汉大学学报· 信息科学版》, vol. 43, no. 2, pages 297 - 303 *
肖小娇 等: "联合多模态特征的无造影剂MRI 图像中肝肿瘤的分割和检测""", 《太原理工大学学报》, vol. 52, no. 3, pages 411 - 416 *

Also Published As

Publication number Publication date
CN114937171B (zh) 2023-06-09

Similar Documents

Publication Publication Date Title
Helaly et al. Deep learning approach for early detection of Alzheimer’s disease
AbdulAzeem et al. A CNN based framework for classification of Alzheimer’s disease
Li et al. Alzheimer's disease classification based on combination of multi-model convolutional networks
CN110236543B (zh) 基于深度学习的阿尔茨海默病多分类诊断系统
WO2023077603A1 (zh) 一种异常脑连接预测系统、方法、装置及可读存储介质
CN111738363B (zh) 基于改进的3d cnn网络的阿尔茨海默病分类方法
Wang et al. Ensemble of 3D densely connected convolutional network for diagnosis of mild cognitive impairment and Alzheimer’s disease
CN110838108A (zh) 基于医疗图像的预测模型构建方法、预测方法及装置
WO2021097675A1 (zh) 一种基于医学图像的智能辅助诊断方法及终端
CN112215291A (zh) 级联神经网络下医学图像特征提取和分类方法
CN113962930B (zh) 阿尔茨海默病风险评估模型建立方法和电子设备
CN115272295A (zh) 基于时域-空域联合状态的动态脑功能网络分析方法及系统
Shankar et al. A novel discriminant feature selection–based mutual information extraction from MR brain images for Alzheimer's stages detection and prediction
CN112036298A (zh) 一种基于双段区块卷积神经网络的细胞检测方法
CN109215035B (zh) 一种基于深度学习的脑部mri海马体三维分割方法
CN112686899B (zh) 医学图像分析方法和装置、计算机设备及存储介质
Zaina et al. An exemplar pyramid feature extraction based Alzheimer disease classification method
Saha Classification of Parkinson’s disease using MRI data and deep learning convolution neural networks
CN112420170A (zh) 一种提高计算机辅助诊断系统图片分类准确度的方法
Deepika Nair et al. A study on various deep learning algorithms to diagnose Alzheimer’s disease
Quy et al. Multi-view digital mammography mass classification: A convolutional neural network model approach
Abdikerimova et al. Detection of chest pathologies using autocorrelation functions
CN114937171B (zh) 基于深度学习的阿尔茨海默分类系统
CN114581459A (zh) 一种基于改进性3D U-Net模型的学前儿童肺部影像感兴趣区域分割方法
Mandloi et al. An automatic cell nuclei segmentation based on deep learning strategies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant