CN116863221A

CN116863221A - 一种基于cnn与注意力机制的阿尔兹海默症分类方法

Info

Publication number: CN116863221A
Application number: CN202310818922.2A
Authority: CN
Inventors: 胡振涛; 李艳阳; 陈鸿宇; 王凯歌; 蒋涛; 杨浩然; 程聪聪; 刘先省; 吴振辉; 王正
Original assignee: Henan University
Current assignee: Henan University
Priority date: 2023-07-05
Filing date: 2023-07-05
Publication date: 2023-10-10

Abstract

本发明涉及医学图像处理技术领域，具体涉及一种基于CNN与注意力机制的阿尔兹海默症分类方法。该方法获取待分类的脑部核磁共振图像和对应三个切面的切片图像；获取待分类的脑部核磁共振图像的局部细粒度特征；通过通道注意力机制增加输入特征图的通道特征；添加每个切片的位置信息；通过多头注意力机制捕获切片间的长距离依赖关系；使用一维卷积增强相邻两个切片间特征的局部连续性，将融合后的特征向量全局平均后送入分类器得到待分类的脑部核磁共振图像的分类结果。本发明能够结合卷积神经网络与注意力机制的优势，充分利用局部病变特征与全局信息交互，提高分类准确率。

Description

一种基于CNN与注意力机制的阿尔兹海默症分类方法

技术领域

本发明涉及医学图像处理技术领域，具体涉及一种基于CNN与注意力机制的阿尔兹海默症分类方法。

背景技术

阿尔茨海默症(Alzheimer’s Disease,AD)是一种不可逆转的神经退行性疾病。同时也是最常见的导致老年人产生记忆障碍与丧失身体活动能力疾病之一。阿尔茨海默症的主要表现是认知功能、思维，记忆和推理以及行为能力的丧失，其程度会干扰一个人的日常生活和活动。神经细胞死亡和功能障碍是这种神经疾病的主要原因。

按照发病阶段情况，可将阿尔茨海默症的发展进程分为：正常对照组(ControlsNormal,CN)、轻度认知功能障碍(Mild Cognitive Impairment,MCI)和阿尔茨海默症对照组。随着老年人口的增长，痴呆症的患病人数也在逐年增加。2018年约有5000万人患有痴呆症，60％至70％的人口患有阿尔兹海默症。根据国际阿尔茨海默病协会(Alzheimer'sDisease International,ADI)发布的一项调查，预计到2050年，痴呆症患者人数将增至1.52亿。目前对阿尔茨海默症患者还不存在十分有效的药物可以完全治愈。日益增长的患病人数与昂贵的医疗成本给阿尔兹海默症的临床与治疗带来了巨大挑战。

目前，核磁共振成像(Magnetic Resonance Imaging，MRI)是与阿尔茨海默症的最重要的技术之一。MRI对脑萎缩引起的形态学改变敏感，能直观地反映患者的病理变化，是目前公认的非侵入性的成像技术。基于MRI图像的阿尔茨海默症早期诊断，通过早期干预策略延缓疾病或改变疾病进程，以及病人后续的及时治疗甚至预防疾病都至关重要。基于深度学习的影像分析可以对MRI图像进行分类。许多传统基于MRI图像的分类算法进行开发出来，但大多数分类算法只关注MRI图像局部区域特征，这样会丢失不同切片之间的相关性信息，导致泛化能力不足，使得基于MRI图像进行分类的算法的泛化能力不足，且在医学领域很难获得具有准确标签和清晰特征的大量数据，这都会使得深度学习方法的性能降低。

发明内容

为了解决传统基于MRI图像的阿尔兹海默症分类算法对全局信息提取不充分，导致分类的准确率较低的技术问题，本发明的目的在于提供一种基于CNN与注意力机制的阿尔兹海默症分类方法，所采用的技术方案具体如下：

获取待分类的脑部核磁共振图像；将待分类的脑部核磁共振图像进行切片操作，得到三个切面的脑部结构和对应的切片图像；

通过卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征；

通过通道注意力机制增强输入特征图的通道特征；

通过位置编码器添加每个切片的位置信息；

通过多头注意力机制捕获切片间的长距离依赖关系；

使用一维卷积增强相邻两个切片间特征的局部连续性，将融合后的特征向量全局平均后送入分类器得到待分类的脑部核磁共振图像的分类结果。

优选的，所述获取待分类的脑部核磁共振图像，包括：

获取原始的脑部核磁共振图像，利用SPM12工具(Statistical ParametricMapping)，对原始的脑部核磁共振图像进行AC-PC基准线矫正；

使用FSL工具(FMRIB Software Library)对AC-PC基准线矫正后的脑部核磁共振图像进行归一化，使所有AC-PC基准线矫正后的脑部核磁共振图像经过拉伸、旋转、平移后被归一化到MNI标准空间(Montreal Neurological Institute)，处理后的脑部核磁共振图像的图像尺寸、分辨率与模板相同；

使用FSL工具对处理后的脑部核磁共振图像进行颅骨剥离，提取脑组织结构；

使用配准ANTs工具(Advanced Normalization Tools)对处理后的脑部核磁共振图像不均匀的部分进行统一的偏置场矫正，将偏置场矫正后的脑部核磁共振图像作为待分类的脑部核磁共振图像。

优选的，所述将待分类的脑部核磁共振图像进行切片操作，得到三个切面的脑部结构和对应的切片图像，包括：

对待分类的脑部核磁共振图像从三个不同角度进行切片操作，每张脑部核磁共振图像得到三个不同切面的脑部结构，分别为轴状切面、矢状切面、冠状切面；

其中，轴状切面为将待分类的脑部核磁共振图像横切后形成上下两部分的切面；矢状切面为沿人体长轴将人体纵切为左右两部分的切面；冠状切面为将待分类的脑部核磁共振图像沿人体长轴切为前后两部分的切面。

优选的，所述通过卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征，包括：

使用一层卷积作为通道扩充，使用卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征。

优选的，所述通过通道注意力机制增强输入特征图的通道特征，包括：

将通道注意力机制引入卷积神经网络中，强化输入特征图的通道特征，得到通道特征增强后的特征图，并将通道特征增强后的特征图映射到高层次特征中表示。

优选的，所述通过位置编码器添加每个切片的位置信息，包括：

采用可训练的参数进行位置编码以添加每个特征向量的位置信息，标记出待分类的脑部核磁共振图像中每个二维切片对应的每个特征向量的位置。

优选的，所述通过多头注意力机制捕获切片间的长距离依赖关系，包括：

输入特征向量经过线性变换后得到查询矩阵、键值矩阵和值矩阵；

将输入的特征向量对应的查询矩阵和键值矩阵的转置矩阵相乘得到关系权重值；

将关系权重值和键值矩阵的矩阵维度的开平方的比值作为归一化比值；

将经过softmax之后的归一化比值和值矩阵相乘，得到自注意力分数，通过自注意力分数来保持序列中相关切片的权重；

通过多组查询矩阵、键值矩阵和值矩阵提取不同的特征向量，将提取到的特征向量拼接起来，通过全连接层乘上降维矩阵，得到最终的输出。

优选的，所述将融合后的特征向量全局平均后送入分类器得到待分类的脑部核磁共振图像的分类结果，包括：

设计三个特征融合模块，进行逐级特征融合，在相邻的两个特征融合模块之间使用一维卷积来进行相邻两个切片之间的信息融合，将融合后的特征向量进行平均池化后，送入分类器中进行最终分类。

优选的，卷积神经网络的训练样本，包括：

正常人、轻度认知障碍患者、阿尔兹海默症患者三种类别人群的脑部核磁共振图像。

本发明实施例至少具有如下有益效果：

本发明通过获取待分类的脑部核磁共振图像的三个切面的脑部结构和对应的切片图像，能够三个不同角度对脑部核磁共振图像进行建模，获得不同切面的脑部结构，确定更好的观察视角，避免了单一视角分析的局限性。同时，本发明能够结合卷积神经网络与注意力机制的优势，充分获取脑部核磁共振图像的局部细粒度特征与全局信息，提高分类准确率。另外，将通道注意力机制引入卷积神经网络中，强化输入特征图的通道特征。且本发明与其他深度学习相比，所提出的模型包括带有一维卷积的融合模块，该融合模块考虑了大脑相邻切片间信息的关联性。本发明能够结合卷积神经网络与注意力机制的优势，充分利用局部病变特征与全局信息交互，提高分类准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为本发明一个实施例所提供的一种基于CNN与注意力机制的阿尔兹海默症分类方法的方法流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

本发明实施例提供了一种基于CNN与注意力机制的阿尔兹海默症分类方法的具体实施方法，该方法适用于阿尔兹海默症MRI的分类场景。为了解决传统基于MRI图像的阿尔兹海默症分类算法对全局信息提取不充分，导致分类的准确率较低的技术问题。本发明能够结合卷积神经网络与注意力机制的优势，充分利用局部病变特征与全局信息交互，提高分类准确率。

下面结合附图具体的说明本发明所提供的一种基于CNN与注意力机制的阿尔兹海默症分类方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种基于CNN与注意力机制的阿尔兹海默症分类方法的步骤流程图，该方法包括以下步骤：

步骤S100，获取待分类的脑部核磁共振图像；将待分类的脑部核磁共振图像进行切片操作，得到三个切面的脑部结构和对应的切片图像。

首先获取原始的脑部核磁共振图像，利用SPM12工具(Statistical ParametricMapping)，对原始的脑部核磁共振图像进行AC-PC基准线矫正。

使用FSL工具(FMRIB Software Library)对AC-PC基准线矫正后的脑部核磁共振图像进行归一化，使所有AC-PC基准线矫正后的脑部核磁共振图像经过拉伸、旋转、平移后被归一化到MNI标准空间(Montreal Neurological Institute)，图像尺寸、分辨率与模板相同。其中，AC-PC基准线为前联合(anterior commissure,AC)后缘重点至后联合(posterior commissure,PC)前缘中点的连线，又称AC-PC线。

使用FSL工具(FMRIB Software Library)对AC-PC基准线矫正后的脑部核磁共振图像进行归一化，使所有AC-PC基准线矫正后的脑部核磁共振图像经过拉伸、旋转、平移后被归一化到MNI标准空间(Montreal Neurological Institute)，其处理后的脑部核磁共振图像尺寸、分辨率与模板相同。

使用FSL工具对处理后的脑部核磁共振图像进行颅骨剥离，提取脑组织结构。

其中，将待分类的脑部核磁共振图像进行切片操作，得到三个切面的脑部结构和对应的切面图像的步骤，具体的：对待分类的脑部核磁共振图像从三个不同角度进行切片操作，每张脑部核磁共振图像得到三个不同切面的脑部结构，分别为轴状切面、矢状切面、冠状切面，进而得到轴状切片图像、矢状切片图像和冠状切片图像；其中，轴状切面为将待分类的脑部核磁共振图像横切后形成上下两部分的切面；矢状切面为沿人体长轴将人体纵切为左右两部分的切面；冠状切面为将待分类的脑部核磁共振图像沿人体长轴切为前后两部分的切面。

步骤S200，通过卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征。

在本发明实施例中卷积神经网络的训练样本包括：正常人、轻度认知障碍患者、阿尔兹海默症患者三种类别人群的脑部核磁共振图像；该卷积神经网络使用的数据集为ADNI临床数据集，该数据集创建于2003年，是到目前为止较为成功也是应用最多的针对AD的综合研究数据集。实验共使用2890个实验样本，包括287名正常老人、410名轻度认知障碍患者和263名阿尔兹海默症患者。

通过卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征，具体的：

(1)使用一层卷积作为通道扩充，卷积层的设置为：输入维度为1，输出维度为3，卷积核大小为3。三个切片经过通道扩充后尺寸由原来的112×112×1变为112×112×3。其中，112×112表示图像的高度和宽度，1与3表示通道大小。

(2)利用卷积神经网络来获取待分类的脑部核磁共振图像的局部细粒度特征，卷积神经网络设置为共5个阶段。前两个阶段分别由两个卷积层、两个ReLU激活函数与一个池化层构成。后三个阶段分别由三个卷积层、三个激活函数与一个池化层构成。经过卷积神经网络的5个阶段后，待分析的脑部核磁共振图形的2D切片被变为大小为3×3×512的输出特征图。

步骤S300，通过通道注意力机制增强输入特征图的通道特征。

(1)将输入特征图经过全局平均池化，特征图从[H,W,C]的矩阵变成[1,1,C]的向量，其中H、W和C是高度、宽度和通道维度。

(2)根据特征图的通道数计算得到自适应的一维卷积核大小；给定通道维度C，卷积核大小k可以由计算公式自适应地确定，卷积核大小的计算公式为：

其中，k为卷积核大小；|t|_odd表示t的最近技术；C为通道维度；log₂为以2为底数的对数函数；γ的取值为2；b的取值为1。

(3)将卷积核大小用于一维卷积中，得到对于特征图的每个通道的权重。

(4)将归一化权重和原输入特征图逐通道相乘，生成加权后的特征图，该加权后的特征图即为通道特征增强后的特征图，提升模型的泛化能力。最后将通道特征增强后的特征图映射到高层次特征中表示。

步骤S400，通过位置编码器添加每个切片的位置信息。

采用可训练的参数进行位置编码以添加每个特征向量的位置信息。标记出待分类的脑部核磁共振图像中二维切片对应的每个特征向量的位置。

步骤S500，通过多头注意力机制捕获切片间的长距离依赖关系。

(1)输入特征向量经过线性变换后得到查询矩阵Q(Query)、键值矩阵K(Key)和值矩阵V(Value)。

(2)通过输入的向量的查询矩阵Q和键值矩阵K的转置矩阵相乘计算出一个关系权重，也即为将输入的特征向量对应的查询矩阵和键值矩阵的转置相乘得到关系权重值。

(3)同上一步(2)得到的关系权重除以d_k的开方，其中这里的d_k为键值矩阵的矩阵维度；也即为将关系权重值和键值矩阵的矩阵维度的开平方的比值作为归一化比值。这一步是为了防止内积过大，保持梯度稳定。

(4)将经过softmax之后的分数与对应的V相乘，得到自注意力分数；也即为将经过softmax之后的归一化比值和值矩阵相乘，得到自注意力分数；通过自注意力分数值来保持序列中相关切片的权重，同时降低不相关切片的权重，自注意力机制计算公式如下：

其中，Attention(Q,K,V)为自注意力分数；Q为查询矩阵；K为键值矩阵；V为值矩阵；d_k为键值矩阵的矩阵维度；K^T为键值矩阵的转置矩阵；softmax函数为归一化指数函数。

(5)通过多组查询矩阵、键值矩阵和值矩阵来提取不同的特征向量，之后再将提取到的特征向量拼接起来，通过一个全连接层乘上降维矩阵得到最终的输出。

多头注意力机制计算公式如下：

head_i＝Attention(QW_i ^Q,KW_i ^K,VW_i ^V)

MultiHead(Q,K,V)＝Concat(head₁,...,head_h)W^O

其中，W_i ^Q，W_i ^K，W_i ^V，W^O矩阵是随机初始化，再通过模型学习不断优化的可训练参数；h为MSA层中的heads数量。需要说明的是，多头注意力机制的计算公式为本领域技术人员的公知技术，在此不再进行赘述。

步骤S600，使用一维卷积增强相邻两个切片间特征的局部连续性，将融合后的特征向量全局平均后送入分类器得到待分类的脑部核磁共振图像的分类结果。

设计三个特征融合模块，进行逐级特征融合，在相邻的两个特征融合模块之间使用一维卷积来进行相邻两个切片之间的信息融合。达到在减少计算量的同时，也能够增强相邻2个切片特征的局部连续性的目的，使用的三个一维卷积的设置分别为：输入维度为128，输出维度为256，卷积核大小为2；输入维度为256，输出维度为512，卷积核大小为2。

在经过3个特征融合后，特征向量数量会变为原来的1/4。然后将融合后的特征向量进行平均池化后，送入分类器中进行最终分类。

在本发明实施所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，将受试者按照一定比例划分成3个数据集：训练集、验证集和测试集。训练集为受试者总数的65％，验证集为受试者总数的20％，测试集为受试者总数的15％。为了避免偏差，训练集、验证集和测试集不同时拥有来自同一受试者的脑部核磁共振图像。其中每一个受试者共有96张MRI切片，每张切片图像的大小我们设置为112×112。为了避免冗余数据的干扰，加快收敛速度，选用随机梯度下降法(Stochastic Gradient Descent,SGD)作为优化器。本发明所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法在AD与CN、MCI与AD、MCI与CN三个分类任务上的准确率分别达到了92.7％，83％，79.07％，具有更高的准确性。

本发明通过获取正常人、轻度认知障碍患者、阿尔兹海默症患者三种类别脑部核磁共振图像作为训练样本；对预处理后的核磁共振图像从三个不同角度进行切片操作，每张核磁共振图像得到三个不同切面的脑部结构，分别为轴状切面、矢状切面、冠状切面；使用卷积神经网络获取输入图像的局部细粒度特征；通过通道注意力机制对输入特征图的通道特征进行增强；使用位置编码器添加每个切片的位置信息；利用多头注意力机制捕获切片间的长距离依赖关系并使用一维卷积增强相邻两个切片间特征的局部连续性；最后将融合后的特征向量全局平均后送入分类器得到分类结果。本发明能够结合卷积神经网络与注意力机制的优势，充分利用局部病变特征与全局信息交互，提高分类准确率。

综上所述，本发明获取待分类的脑部核磁共振图像；将待分类的脑部核磁共振图像进行切片操作，得到三个切面的脑部结构和对应的切片图像；通过卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征；通过通道注意力机制增强输入特征图的通道特征；通过位置编码器添加每个切片的位置信息；通过多头注意力机制捕获切片间的长距离依赖关系；使用一维卷积增强相邻两个切片间特征的局部连续性，将融合后的特征向量全局平均后送入分类器得到待分类的脑部核磁共振图像的分类结果。本发明能够结合卷积神经网络与注意力机制的优势，充分利用局部病变特征与全局信息交互，提高分类准确率。

需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

Claims

1.一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，该方法包括以下步骤：

通过通道注意力机制增强输入特征图的通道特征；

通过位置编码器添加每个切片的位置信息；

通过多头注意力机制捕获切片间的长距离依赖关系；

2.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述获取待分类的脑部核磁共振图像，包括：

获取原始的脑部核磁共振图像，利用SPM12工具(Statistical Parametric Mapping)，对原始的脑部核磁共振图像进行AC-PC基准线矫正；

3.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述将待分类的脑部核磁共振图像进行切片操作，得到三个切面的脑部结构和对应的切片图像，包括：

4.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述通过卷积神经网络获取待分类的脑部核磁共振图像的局部细粒度特征，包括：

5.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述通过通道注意力机制增强输入特征图的通道特征，包括：

6.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述通过位置编码器添加每个切片的位置信息，包括：

7.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述通过多头注意力机制捕获切片间的长距离依赖关系，包括：

8.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，所述将融合后的特征向量全局平均后送入分类器得到待分类的脑部核磁共振图像的分类结果，包括：

9.根据权利要求1所述的一种基于CNN与注意力机制的阿尔兹海默症分类方法，其特征在于，卷积神经网络的训练样本，包括：