CN114937171A

CN114937171A - 基于深度学习的阿尔茨海默分类系统

Info

Publication number: CN114937171A
Application number: CN202210513470.2A
Authority: CN
Inventors: 耿道颖; 周锟; 于泽宽; 朴思蓉
Original assignee: Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou; Fudan University
Current assignee: Guangdong Hong Kong Macao Dawan District Institute Of Precision Medicine Guangzhou; Fudan University
Priority date: 2022-05-11
Filing date: 2022-05-11
Publication date: 2022-08-23
Anticipated expiration: 2042-05-11
Also published as: CN114937171B

Abstract

本发明提供了一种基于深度学习的阿尔茨海默分类系统，包括：模块M1：获取AD多模态数据并进行预处理，得到预处理后的AD多模态数据；模块M2：将预处理后的AD多模态数据按照预设比例分为训练集及测试集；模块M3：构建联合网络模型，包括MAM U‑net分割网络和T‑DenseNet分类网络；模块M4：利用训练集训练联合模型直至损失函数收敛，得到训练后的联合模型；模块M5：利用测试集通过训练后的联合模型进行预测，并根据预测结果和预设标注信息计算准确率，如果准确率未达到预设要求，则重复触发模块M4至模块M5直至准确率达到预设要求。

Description

基于深度学习的阿尔茨海默分类系统

技术领域

本发明涉及多模态图像智能识别技术领域，具体地，涉及基于深度学习的阿尔茨海默分类系统。

背景技术

阿尔茨海默症(Alzheimer's disease,AD)是最常见的进行性神经退行性疾病之一。据报道，AD已成为2019年第六大死因。AD通常起病隐匿，并逐渐发展，只有在患者出现不可逆转的行为和认知障碍后才能确诊。在疾病发展的初期阶段对AD进行准确的诊断可以及时有效的缓解病情。轻度认知障碍(Mild cognitive impairment，MCI)被认为是正常衰老和AD之间的过渡阶段，研究表明海马体是AD最早受影响的脑区之一，对于延缓AD的发病和治疗非常重要。因此对于海马体区域的精准分割将有助于提高AD的诊断。最终达到提高患者生存率和存活时间的目标。

随着计算机技术的快速发展，医学成像技术得到了前所未有的进步。越来越多具有不同模式的医学图像被应用于计算机辅助诊断。不同模态的医学图像可以提供不同类型的特征信息来识别AD和MCI或正常对照组(Normal control,NC)。磁共振成像(Magneticresonance imaging,MRI)是一种非侵入性成像技术，可以生成大脑等内部身体结构的解剖图像，检测和测量AD患者的脑萎缩模式有助于了解与AD相关的大脑解剖和功能变化。正电子发射断层扫描(Positron Emission Computed Tomography，PET)可以捕捉大脑代谢的激活，揭示生物标记物的生理模式，例如通过脑脊液测量的病理性淀粉样沉积来辅助诊断AD。许多研究表明，利用多模态图像中的特异性特征有助于改善AD的诊断。

如今，以深度学习为代表的机器学习在图像分割及分类领域中发挥着重要的作用。2015年U-net网络的提出使人们开始利用计算机强大的计算能力对医学图像进行处理和分析，大大促进了机器学习在医疗辅助诊断中的发展。

当前对于AD的研究大多集中于单个任务，所提取的特征都独立于分类模型可能会导致次优解，针对特定任务采用的网络模型鲁棒性和泛化性较差。此外，由于海马体病灶区域占整个脑部图像比例较小，目标区域和图像整体体素数量失衡会导致模型优化方向偏移。

专利文献CN113989551A(申请号：202111237755.X)公开了一种基于改进的ResNet网络的阿尔茨海默病的分类方法，主要解决现有分类检测算法过程中数据不均衡及池化中特征丢失的问题。其方案是：(1)对ResNet网络进行改进加入有效通道注意力ECA模块，搭建针对阿尔茨海默病的ResNet分类检测网络；(2)为减少池化操作过程中的信息丢失，将最大池化Maxpool修改为softpool；(3)使用焦点损失函数替换交叉熵损失函数来解决数据不均衡，以及模型难学习困难样本的问题；(4)选取每一个MRI 3D数据在Axial-横截、Sagittal-矢状、Coronal-冠状三个轴向位置的2D形式切片；(5)对改进后ResNet网络进行训练和测试。

专利文献CN110236543A(申请号：201910435384.2)公开了一种基于深度学习的阿尔茨海默病多分类诊断系统，包括：图像特征提取模块，用于根据神经网络模型对大脑三正交平面MRI图像的特征向量进行提取；指标特征选择模块，用于根据医学相关文献选择检查指标组成指标特征向量；向量线性融合模块，用于采用基于典型相关分析的多元数据线性融合方法将图像的特征向量和指标特征向量进行融合；疾病分类诊断模块，用于将融合后的向量输入多分类分类器来区分阿尔茨海默病的三个阶段。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于深度学习的阿尔茨海默分类系统。

根据本发明提供的一种基于深度学习的阿尔茨海默分类系统，包括：

模块M1：获取AD多模态数据并进行预处理，得到预处理后的AD多模态数据；

模块M2：将预处理后的AD多模态数据按照预设比例分为训练集及测试集；

模块M3：构建联合网络模型，包括MAM U-net分割网络和T-DenseNet分类网络；

模块M4：利用训练集训练联合模型直至损失函数收敛，得到训练后的联合模型；

模块M5：利用测试集通过训练后的联合模型进行预测，并根据预测结果和预设标注信息计算准确率，如果准确率未达到预设要求，则重复触发模块M4至模块M5直至准确率达到预设要求；

所述MAM U-net分割网络是基于MAM注意力机制模块完成海马体区域分割任务；

所述T-DenseNet分类网络是基于Dense模块完成高级别语义特征提取任务；

所述联合模型是基于MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层，根据将预处理后的AD多模态数据对阿尔兹海默进行分类。

优选地，所述模块M1采用：对获取的AD多模态数据进行预处理，得到统一标准AD多模态数据集；对得到的统一标准AD多模态数据集标注海马体区域。

优选地，所述MAM U-net分割网络包括：压缩特征图模块和将压缩特征图解压缩模块；

所述压缩特征图模块包括卷积层、MAM模块、下采样、MAM模块、下采样以及ResNet模块；将T1WI和PET图像构成的双通道三维特征图I₀经过卷积层得到弱语义特征I₁；弱语义特征I₁输入至MAM模块得到包含通道和空间信息的特征图I₂；将特征图I₂经过下采样处理得到特征图I₃；将特征图I₃输入至MAM模块得到特征图I₄；将特征图I₄经过下采样处理得到特征图I₅；最后将特征图I₅输入至ResNet模块中得到较高级别的语义特征I₆；

所述将压缩特征图解压模块包括ResNet模块、上采样、MAM模块、上采样、MAM模块以及卷积层；将较高级别的语义特征I₆输入到ResNet模块中得到特征图I₇，特征图I₇经过上采样操作得到特征图I₈，特征图I₈与特征图I₄进行矩阵相加操作后输入到MAM模块中得到特征图I₉，将特征图I₉经过上采样处理得到特征图I₁₀，特征图I₁₀与特征图I₂再次进行矩阵相加操作后输入到MAM模块得到特征图I₁₁，最后将特征图I₁₁经过卷积操作获得分割结果Result_Seg。

优选地，所述MAM模块包括空间注意力机制以及通道注意力机制；

所述空间注意力机制为通过两个池化操作聚合特征映射的通道信息生成两个二维映射：

和

分别表示通道中的平均池特征和最大池特征；然后通过卷积层将它们连接并卷积，生成空间特征图；其中，

表示矩阵，矩阵的大小为C/r×1×1；C表示通道的数量；r表示缩减率；W和H分别表示特征图的宽和高；

所述通道注意力机制将输入的特征图经过最大池化和平均池化操作分别生成最大池特征和平均池特征，接着将最大池特征和平均池特征输入共享网络生成通道特征图；

所述共享网络包括多层感知机MLP和隐藏层，对输入的最大池特征和平均池特征进行融合，得到一个相同大小的通道特征图；

将得到的通道特征图和空间特征图经过权重计算得到MAM模块输出的特征图；

其中，

ω表示权重。

优选地，所述空间特征图采用：

其中，σ表示sigmoid激活函数；f^7×7表示大小为7×7的卷积运算；F表示输入的特征图；AvgPool和MaxPool分别表示平均池化操作和最大池化操作。

优选地，所述通道特征图采用：

其中，

优选地，所述T-DenseNet分类网络包括：卷积层、密集模块以及过渡层；

所述密集模块通过短连接获取上一层密集模块的特征图；每两个密集模块之间插入一个过渡层缩减特征图的数量；所述过渡层包括批处理标准化操作、卷积操作以及Dropout操作；

将分割结果Result_Seg通过卷积层提取高分辨率的弱语义特征f₀，并将获得的弱语义特征f₀依次通过密集模块和过渡层提取高级语义特征f₁，将高级语义特征f₁输入到密集模块-过渡层中获得语义特征f₂，最后将语义特征f₂再输入到密集模块-过渡层中获得较高级别的语义特征Feature_Cla。

优选地，所述联合模型包括：MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层；

预处理后的AD多模态数据通过MAM U-net分割网络得到特征图Feature_Seg和分割结果Result_Seq；Feature_Seg通过T-DenseNet分类网络得到较高级别的语义特征Feature_Cla；将特征图Feature_Seg和较高级别的语义特征Feature_Cla依次通过concate层以及全连接层进行分类得到一维向量F_res＝{r₁，r₂，…r_t}，t＝(0，1，2，…N)，其中N表示训练集的切片数量；r_t的值为0或1；其中，1表示患有AD，0表示健康；

所述特征图Feature_Seg是将每次上采样输出的特征图进行concate操作获得的。

优选地，所述损失函数采用：

所述MAM U-net分割网络采用Dice损失函数：

其中，N表示Result_Seg的像素值总数；p_i表示像素i对应于Result_Seg的分割概率；q_i表示像素i对应于mask_HC的类别；ε表示非0常数；

所述T-DenseNet分类网络采用focal损失函数：

其中，y′表示像素点对应于Result_Seg的分割概率；α和γ表示超参数；y＝1表示像素点所属的原图为患有AD，y＝0表示像素点所属的原图为健康对照组；

所述损失函数采用：

L_DC＝β*L_s+(1-β)*L_f

其中，β表示权重，用于调整训练中海马分割和疾病分类的损失。

优选地，所述模块M4采用：在训练联合模型的过程中，权重β的数值是不断变化的；在初始阶段的预设时间内，β设置为1以强调分割任务；预设时间后，β设置为0.5，用于分割和分类的多任务训练；在最后阶段的预设时间内，β设置为0，使联合模型更加关注分类任务。

与现有技术相比，本发明具有如下的有益效果：

1、本发明结合提出的MAM U-net和T-DenseNet，对阿尔茨海默症多模态影像进行病灶分割和疾病分类；通过设计不同损失函数平衡多任务模型训练，来解决现有模型优化只能达到次优的问题；

2、本发明与其它阿尔茨海默症诊断模型相比，分割与分类准确率都有10％以上的提升；

3、本发明所提出的阿尔茨海默分类方法集分割与分类为一体，全程智能化，无需人工经验识别，即在模型实现分割和分类，可以免去人工寻找的过程，而用深度学习的方式寻找到全面且有效的特征。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为基于深度学习的阿尔茨海默分类方法流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例1

和

其中，

ω表示权重。

优选地，所述空间特征图采用：

优选地，所述通道特征图采用：

其中，

预处理后的AD多模态数据通过MAM U-net分割网络得到特征图Feature_Seg和分割结果Result_Seg；Feature_Seg通过T-DenseNet分类网络得到较高级别的语义特征Feature_Cla；将特征图Feature_Seg和较高级别的语义特征Feature_Cla依次通过concate层以及全连接层进行分类得到一维向量F_res＝{r₁，r₂，…r_t}，t＝(0，1，2，…N)，其中N表示训练集的切片数量；r_t的值为0或1；其中，1表示患有AD，0表示健康；

优选地，所述损失函数采用：

所述MAM U-net分割网络采用Dice损失函数：

所述T-DenseNet分类网络采用focal损失函数：

所述损失函数采用：

L_DC＝β*L_s+(1-β)*L_f

本发明提供的基于深度学习的阿尔茨海默分类系统，可以通过本发明提供的基于深度学习的阿尔茨海默分类方法中的步骤流程实现。本领域技术人员，可以将所述基于深度学习的阿尔茨海默分类方法理解为基于深度学习的阿尔茨海默分类系统的一个优选例。

实施例2

实施例2是实施例1的优选例

一种基于深度学习的阿尔茨海默分类方法，如图1所示，包括：

步骤S1：获取AD多模态数据并对多模态数据进行预处理，得到统一标准AD多模态数据集D_all，包含：T1WI，PET，分别记作I_T1W1和I_PET；此外，每个病例还包括医生标注的海马体区域，记作mask_HC；将每种模态的图像格式设置为nii.gz，数据大小配准为256×256×32。将数据集D_all按照8∶2的比例分为训练集D_train和测试集D_test；

步骤S2：构建MAM U-net分割网络，构造MAM注意力机制模块完成海马体区域分割任务。多模态图像I_T1W1，I_PET和标签mask_HC被送入MAM U-net分割网络获得特征图Feature_Seg和分割结果Result_Seg；

步骤S3：构建T-DenseNet分类网络将步骤S2得到的Result_Seg进行特征提取得到较高级别的语义特征Feature_Cla；

步骤S4：设置分割网络和分类网络的损失函数为Dice损失函数以及Focal损失函数。两者加权构造得到联合网络的损失函数Ioss_DC，通过损失函数loss_DC平衡分割与分类网络之间以及海马体区域和全脑区域之间的重要性；

步骤S5：将步骤S2和S3得到的特征图Feature_Seg和Feature_Cla经由concate，全连接层进行分类，直至Ioss_DC趋于稳定保存最终的联合模型。

所述的一种基于深度学习的阿尔茨海默分类方法，包括：多模态图像分割网络MAMU-net，分类网络T-DenseNet，基于Dice和Focal loss的联合损失函数；完成多模态阿尔茨海默症图像的分割分类；

具体地，所述步骤S1采用：

S11：获取AD的T1WI和PET图像，对获取的多模态图像进行数据脱敏并剔除不规范的图像，将每幅图像重采样为256×256×32大小来提高数据的一致性；

S12：通过临床医生对图像的手动标注得到海马体区域mask_HC得到统一标准AD多模态数据库D_all；

具体地，所述步骤S2采用：

S21：构建MAM模块，MAM模块包含空间注意力机制，通道注意力机制和共享网络。通道注意力机制将输入的特征图经过最大池化和平均池化操作生成两个描述符

和

分别表示平均池特征和最大池特征。接着将这两个描述符送入到一个共享网络，以生成通道特征图

共享网络由多层感知机(MLP)和一个隐藏层组成。为了减少参数开销，将隐藏的激活大小设置为

其中C为通道的数量，r为缩减率，公式描述如下：

其中，σ表示sigmoid激活函数，

AvgPool和MaxPool分别表示平均池化操作和最大池化操作，F表示输入的特征图。

空间注意力机制使用两个池操作来聚合特征映射的通道信息，生成两个二维映射：

和

分别表示通道中的平均池特征和最大池特征。然后通过标准的卷积层将它们连接并卷积，生成我们的空间特征图。公式描述如下：

其中，σ表示sigmoid激活函数，f^7×7表示大小为7×7的卷积运算。

将得到的通道特征图和空间特征图经过权重计算得到最终MAM模块输出的特征图，公式如下：

F_MAM＝φ*M_c(F)+ω*M_s(F)

其中，

MAM模块所输出的特征图可以得到通道和空间维度上的注意力权重，提高各个特征在通道和空间上的联系，更有利于提取目标的有效特征。

S22：构建MAM U-net网络。MAM U-net为U型结构，由两部分组成：左侧是压缩特征图的过程，右侧是将特征图解压缩到其原始切片大小的过程。左侧压缩部分包括两个MAM模块和一个ResNet模块，然后对每个模块进行下采样操作，而右侧解压缩部分包括两个MAM模块和一个ResNet模块，然后对每个模块进行上采样操作。其中，下采样和上采样操作都由一个2×2×2，步长为2的卷积核和反向传播层组成。

S23：MAM U-net网络输入数据为T1WI和PET图像构成的双通道三维特征图I₀，特征图大小为W×H×C，其中W和H表示特征图的宽和高。C表示通道数。压缩模块的具体操作为：将I₀经过卷积层得到16个大小为256×256×32的弱语义特征I₁，将I₁输入到MAM模块得到包含通道和空间信息的特征图I₂，将I₂经过下采样处理得到I₃，将I₃输入到MAM模块得到特征图I₄，将I₄经过下采样处理得到I₅，最后将I₅输入到ResNet模块中得到较高级别的语义特征I₆。每经过一次下采样特征图数量翻一倍，大小变为原来的一半，在减少图像尺寸的同时扩大特征的感受野范围。

S24：解压缩过程不断扩展特征图大小，具体操作为：将I₆输入到ResNet模块中得到特征图I₇，I₇经过上采样操作得到I₈，I₈与I₄进行矩阵相加操作后输入到MAM模块中得到I₉，将I₉经过上采样处理得到I₁₀，I₁₀与I₂再次进行矩阵相加操作后输入到MAM模块得到I₁₁，最后将I₁₁经过卷积操作获得分割结果Result_Seg，大小为256×256×32，将每次上采样输出的特征图进行concate操作获得Feature_Seg。

具体地，所述步骤S3：

S31：构建分类网络T-DenseNet网络，T-DenseNet由一个卷积层、4个密集模块和3个过渡层组成。其中，每一个密集模块都可以通过短连接获取上一层密集模块的特征图；每两个密集模块之间插入一个过渡层缩减特征图的数量，过渡层包含批处理标准化操作，大小为1×1×1的卷积操作以及Dropout操作。

S32：首先将Result_Seg送到卷积层，以提取高分辨率的弱语义特征f₀，并将获得的f₀送到密集模块-过渡层中以提取高级特征f₁。将f₁输入到密集模块-过渡层中获得语义特征f₂，最后将f₂再输入到密集模块-过渡层中获得较高级别的语义特征Feature_Cla；

具体地，所述步骤S4包括：

S41：MAM U-net模型采用Dice损失函数，公式定义如下：

其中，N表示Result_Seg的像素值总数，p_i表示像素i对应于Result_Seg的分割概率，q_i表示像素i对应于mask_HC的类别，ε为一个较小的非0常数，用于防止分母为零。

S42：T-DenseNet模型采用focal损失函数，公式定义如下：

其中，y′表示该像素点对应于Result_Seg的分割概率，y＝1表示该像素点所属的原图为患有AD，y＝0表示该像素点所属的原图为健康对照组。α和γ为超参数，都是为了提高负样本的权重，改变网络的优化方向，分别设置为d＝0.25，γ＝0.5。

S43：联合网络的损失函数分别对S41和S42提出的损失函数进行加权，公式定义如下：

L_DC＝β*L_s+(1-β)*L_f

其中，β∈[0，1]是一个权重，用于调整训练中海马分割和疾病分类的损失。

具体地，所述步骤S5包括：

S51：对步骤S2和S3构造的MAM U-net和T-DenseNet进行联合，具体步骤为将特征图Feature_Seg和Feature_cla经由concate，全连接层进行分类得到一维向量F_res＝{r₁，r₂，…r_t}，t＝(0，1，2，…N)，其中N表示训练集的切片数量，r_t的值为0或1(1表示患有AD，0表示健康)。

其中，在联合网络训练过程中，β的数值是不断变化的。在初始阶段，β设置为1以强调分割任务。然后它变为0.5用于分割+分类的多任务训练。在最后阶段，β设置为0，使联合模型更加关注分类任务。训练T-DenseNet时，整个网络的初始权值是一致的，采用Adam优化器，学习率为10^-4，经过120个迭代之后网络趋于稳定，保存此时的联合模型。

S52：将测试集载入训练好的联合网络模型进行预测得到分割和分类结果Result_Seg和F_res，根据标签计算Dice系数和分类准确率，本专利所提出的基于深度学习的阿尔茨海默分类方法准确率不劣于专业医生的判断结果。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种基于深度学习的阿尔茨海默分类系统，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述模块M1采用：对获取的AD多模态数据进行预处理，得到统一标准AD多模态数据集；对得到的统一标准AD多模态数据集标注海马体区域。

3.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述MAMU-net分割网络包括：压缩特征图模块和将压缩特征图解压缩模块；

4.根据权利要求3所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述MAM模块包括空间注意力机制以及通道注意力机制；

和

其中，

ω表示权重。

5.根据权利要求4所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述空间特征图采用：

6.根据权利要求4所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述通道特征图采用：

其中，

7.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述T-DenseNet分类网络包括：卷积层、密集模块以及过渡层；

8.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述联合模型包括：MAM U-net分割网络、T-DenseNet分类网络、concate层以及全连接层；

预处理后的AD多模态数据通过MAM U-net分割网络得到特征图Feature_Seg和分割结果Result_Seg；Feature_Seg通过T-DenseNet分类网络得到较高级别的语义特征Feature_Cla；将特征图Feature_Seg和较高级别的语义特征Feature_Cla依次通过concate层以及全连接层进行分类得到一维向量F_res＝{r₁,r₂,…r_t},t＝(0,1,2,…N)，其中N表示训练集的切片数量；r_t的值为0或1；其中，1表示患有AD，0表示健康；

9.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述损失函数采用：

所述MAM U-net分割网络采用Dice损失函数：

所述T-DenseNet分类网络采用focal损失函数：

其中，y'表示像素点对应于Result_Seg的分割概率；α和γ表示超参数；y＝1表示像素点所属的原图为患有AD，y＝0表示像素点所属的原图为健康对照组；

所述损失函数采用：

L_DC＝β*L_s+(1-β)*L_f

10.根据权利要求1所述的基于深度学习的阿尔茨海默分类系统，其特征在于，所述模块M4采用：在训练联合模型的过程中，权重β的数值是不断变化的；在初始阶段的预设时间内，β设置为1以强调分割任务；预设时间后，β设置为0.5，用于分割和分类的多任务训练；在最后阶段的预设时间内，β设置为0，使联合模型更加关注分类任务。