CN113951830A

CN113951830A - 一种基于3d注意力卷积与自监督学习的脑疾病分类方法

Info

Publication number: CN113951830A
Application number: CN202111346214.0A
Authority: CN
Inventors: 冀俊忠; 于乐; 雷名龙
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2021-11-15
Filing date: 2021-11-15
Publication date: 2022-01-21
Anticipated expiration: 2041-11-15
Also published as: CN113951830B

Abstract

本发明公开了一种基于3D注意力卷积与自监督学习的脑疾病分类方法，属于脑科学研究领域。具体包括以下步骤：获取静息态fMRI数据并预处理；构建基于fMRI全脑体素的功能连接数据；数据集划分；基于注意力卷积与自监督学习的脑疾病分类。本发明所述方法利用注意力机制的3DCNN从fMRI数据中提取全脑体素的空间特征,同时利用自监督学习使3DCNN挖掘到更有意义的表征.最后对分类任务和自监督辅助任务进行联合训练来优化参数。本发明所述方法可以更好的探索大脑的空间信息与挖掘数据隐含的特征，从而提升分类效果，且该方法合理可靠。

Description

一种基于3D注意力卷积与自监督学习的脑疾病分类方法

技术领域

本发明属于脑科学研究领域，具体地说，本发明涉及一种基于3D注意力卷积与自监督学习的脑疾病分类方法。

背景技术

人脑是人体一个高度复杂的系统，包含了大量的神经元细胞。通过多个神经元、神经元集群或者多个脑区之间的相互作用，人脑能够完成各种复杂的任务。人脑的结构和功能非常复杂，远远超出我们当前的认知能力。因此，探索并理解人类大脑的工作机制，揭开大脑之谜，无疑是非常有意义的事情。基于fMRI数据的脑疾病分类是脑科学领域中重要的研究方向，分析fMRI数据有助于理解自闭症谱系障碍(Autism spectrum disorder,ASD)、注意缺陷多动障碍(Attention deficit hyperactivity disorder,ADHD)和阿尔兹海默症(Alzheimer's disease,AD)等脑疾病的发病机理，具有十分重要的现实意义。

目前脑疾病分类方法主要分为两种：基于脑区划分的方法和基于体素分类的方法。基于脑区划分的方法大多通过对大脑进行分区来构建功能连接，这种方法虽然可以降低fMRI数据的维度，但是却忽略了原始fMRI数据中每个体素点的信息和体素之间的空间位置。基于体素分类的方法可以保留所有体素的信息以及它们之间的空间关系，表现出较好的效果。

基于体素的分类方法主要包括全连接神经网络(Fully connected neuralnetwork,FCNN)和三维卷积神经网络(3-Dimensional convolutional neural network,3DCNN)。其中，FCNN方法需要将体素数据转化为一维，从而进行特征学习与分类。但是，一维数据不能体现出体素数据的空间关系，而3DCNN可以处理具有空间性的数据。但是，人脑数据存在样本量小，特征维数高等特点，3DCNN不能考虑到每个体素的重要性，难以从高维数据中挖掘出内在的信息，基于3DCNN来对体素数据分类有待进一步提升。

发明内容

本发明针对上述现有方法存在的问题，提出一种基于3D注意力卷积与自监督学习的脑疾病分类方法(Brain Disease Classification Method Based on 3D AttentionConvolutional Neural Network and Self-Supervised Learning,3D-SACNN)。本发明所述方法构建全脑体素的功能连接数据，利用具有注意力机制的3DCNN来提取fMRI数据的特征，并且利用自监督学习使3DCNN学习到更多的隐含信息。最后对分类任务和自监督辅助任务进行联合训练来优化参数。

为实现上述目的，本发明采用的技术方案为一种基于注意力卷积与自监督学习的脑疾病分类方法。

步骤(1)获取静息态fMRI数据并预处理：

步骤(1.1)静息态fMRI数据获取；

步骤(1.2)数据预处理：包括层间时间校正、头动校正、全局平均强度归一化、干扰信号回归、带通滤波和空间配准步骤；

步骤(1.3)构建全脑体素的功能连接数据：

步骤(1.3.1)初始的三维fMRI数据表示为R，

其中

代表全体实数集合，T代表时间序列长度，D₁、D₂、D₃分别代表fMRI数据的三个维度，体素总数为D；使用CC200脑图谱对fMRI数据按脑区进行划分，从而将大脑分为M个区域；由划分后的数据计算每个脑区的平均时间序列为

每个体素的时间序列为

最后，给定时间序列u＝[u₁,u₁,...,u_T]，v＝[v₁,v₁,...,v_T]，u与v之间的皮尔森相关系数(Pearsoncorrelation coefficients,PCC)表示为：

其中,

为u的平均值，

为v的平均值；由此,通过每个体素的时间序列

与每个脑区中的平均时间序列

得到每个脑区与每个体素之间的相关系数

接下来将相关系数P还原为M个立方体，此处的M与前面的M个区域为相同的数值，每个立方体的维度为D，立方体中的每个元素代表当前体素与脑区之间的相关性，可将其表示为

包含N个样本的fMRI数据集表示为{(G⁽¹⁾,y⁽¹⁾),……,(G^(N),y^(N))}；其中，y⁽ⁿ⁾∈{0，1}，0表示对照组受试者，1表示ASD组受试者，G^(N)表示第N个样本的fMRI数据；

步骤(2)数据集划分：将ABIDE-I和ABIDE-II数据集按照8：1：1的比例划分为训练集、验证集和测试集；其中，训练集用于学习神经网络的参数；验证集用于确定网络结构和超参数；测试集用于验证神经网络分类效果；

步骤(3)基于注意力卷积与自监督学习的脑疾病分类：

步骤(3.1)将ABIDE-I和ABIDE-II数据集或对应的训练集、验证集作为神经网络的输入；

步骤(3.2)构建一个包含3D注意力卷积模块、分类模块与基于3D空间信息的自监督学习模块的神经网络；3D注意力卷积模块包含三个卷积层，卷积核大小为3×3×3，步长为1，计算空间注意力的3D卷积采用一个卷积层，卷积核大小为5×5×5，步长为1；其中，分类模块输入全脑体素功能连接特征，而自监督学习模块输入掩蔽后的全脑体素功能连接特征，分类模块与自监督学习模块都经过3D注意力卷积模块来得到隐层特征，再输入到两个模块中获得最终的结果；在训练过程中，分类任务与自监督辅助任务采用联合训练的方式进行参数优化；

步骤(3.2.1)输入层:

为全脑体素功能连接特征，除此之外，需要将全脑体素功能连接特征

进行随机掩蔽；首先根据掩蔽的比率α∈[0,1]确定每个体素是否被掩蔽；然后，生成一个掩码

来随机遮挡内容；最后，依靠掩码来生成掩蔽后的体素功能连接数据

该过程表示为原始数据X与掩码I之间的运算：

其中,⊙表示元素乘积；

步骤(3.2.2)3D注意力卷积模块：

步骤(3.2.2.1)以步骤(3.2.1)输出的特征图X作为3D注意力卷积模块中三维卷积的输入，设

表示第l层的输入数据，M^(l)表示第l层的通道数,

分别表示第l层fMRI数据的三个维度，可见，H⁽⁰⁾＝X；根据式(3)完成三维卷积的计算，使其提取到三维数据的空间特征；

其中，

表示第l层三维卷积的卷积核，t表示单个卷积核的大小,每个卷积核为一个立方体，

表示K^(l)的输入通道，

表示K^(l)的输出通道，B^(l)表示相应的偏置，

表示第l+1层所有通道的输出数据，σ(·)表示非线性激活函数；

步骤(3.2.2.2)根据式(4)完成空间注意力系数的计算，使其关注到空间中含有关键信息的位置；

A^(l)＝Conv_3d([avgpool(H^(l))||maxpool(H^(l))]) (4)

其中，||表示拼接，Conv_3d表示三维卷积，avgpool(·)表示平均池化，maxpool(·)表示最大池化，

表示第l层的空间注意力系数；

步骤(3.2.2.3)根据式(5)完成带有残差结构的3D注意力卷积层；

H^(l+1)＝Conv_3d(H^(l))+Conv_3d(H^(l))⊙A^(l) (5)

其中，

表示每层的输入特征，H^(l+1)表示输出特征，⊙表示元素乘积；

步骤(3.2.2.4)步骤(3.2.2.4)为了方便表示，把L个步骤(3.2.2.3)中的3D注意力卷积层的3D注意力卷积模块用F_f(·)表示；以X，

分别作为所述3D注意力卷积模块的输入，根据式(6)(7)完成带有残差结构的3D注意力卷积操作，提取出三维fMRI数据中的空间特征；

Z＝F_f(X) (6)

其中，Z为输入数据X经过3D注意力卷积模块的输出，

为输入数据

经过3D注意力卷积模块的输出；

步骤(3.2.3)分类模块：

步骤(3.2.3.1)分类模块由全连接层组成，从而进行特征的线性组合，最后一层使用Softmax函数将输出结果转换为概率表示；将分类模块用函数F_c(·)来表示，将步骤(3.2.2.4)输出的Z展平拼接成一维向量作为输入，得到整个分类任务最后的输出为：

Y′＝F_c(Z) (8)

整个分类任务的损失函数定义为：

其中，N代表训练集的样本数，C代表类别标签的个数，i代表第几个训练样本，j代表第几个类别标签，Y_i,j和Y′_i,j分别代表样本的标签与相应的预测值；

步骤(3.2.4)基于3D空间信息的自监督学习模块：

步骤(3.2.4.1)该模块由反卷积层组成，并且反卷积的卷积核大小与正向卷积相同；反卷积的具体操作为：首先对中间层特征的每个维度进行填充(padding)，填充长度为t-1，其中，t是三维卷积核的大小；然后在新的特征上进行普通的三维卷积，不断地重复上述过程即可实现多层反卷积操作；

步骤(3.2.4.2)把自监督学习模块定义为F_s(·)，那么整个自监督任务的输出为：

令

则自监督辅助任务的损失函数定义为：

上式为均方误差,表示原始数据与预测输出之间的差异；

步骤(3.2.5)将脑疾病分类任务与自监督辅助任务同时优化，构建多任务的学习框架，总的损失函数如式(12)所示：

其中，λ是控制损失权重的系数，用于调整自监督辅助任务对分类任务的影响，为了使得

与

为相同数量级，这里λ设置为100；

步骤(3.3)针对步骤(3.1)中的训练集，利用Adam梯度下降算法最小化步骤(3.2.5)中所述损失函数，并根据模型在验证集上的分类准确率确定神经网络的超参数，其中，掩蔽比率α在0.1-0.5的范围内，以0.1为步长取值，3D注意力卷积层层数L在1-5的范围内，以1为步长取值，不同掩蔽比率α与3D注意力卷积层层数L下，每种超参数组合采用十折交叉验证法从而得到验证集的准确率，当验证集上的准确率最高时，α与L的值即为最优的神经网络超参数；

步骤(3.4)首先，将步骤(3.1)中的训练集和测试集输入到由步骤(3.2)确定的模型中；然后，利用10次十折交叉验证法，得到分类准确率。

与现有方法相比，本发明具有以下明显的优势和有益效果：

本发明提出一种基于3D注意力卷积与自监督学习的脑疾病分类方法。本方法具有以下两个优势：1)相较于传统的三维卷积方法，本发明所述方法提出的具有残差结构的3D注意力卷积网络，能够提取到fMRI数据中的空间特征,并且关注到不同体素的重要程度；2)本发明所述方法可以通过自监督学习到数据的隐含信息,从而进一步提升分类模型的性能。

本发明基于三维卷积神经网络，使用注意力机制可以更好地使3DCNN从fMRI数据中提取空间特征,同时利用自监督学习使3DCNN学习到更有意义的表征，在ABIDE-I和ABIDE-II真实fMRI数据集上均取得最好的结果，且所述方法合理可靠。

附图说明

图1：一种基于3D注意力卷积与自监督学习的脑疾病分类方法流程图。

图2：一种基于3D注意力卷积与自监督学习的脑疾病分类方法的结构图。

图3：基于全脑体素的功能连接构建过程示意图。

具体实施方式

下面以真实fMRI数据集为例，说明本发明的具体实施步骤：

步骤(1)获取静息态fMRI数据并预处理：

步骤(1.1)静息态fMRI数据获取：从ABIDE(Autism Brain Imaging DataExchange，http://fcon_1000.projects.nitrc.org/indi/abide/)获取自闭症(Autismspectrum disorder，ASD)数据进行分析；ABIDE-I包含来自17个不同站点的1112名被试的rs-fMRI(Resting-state functional magnetic resonance imaging)数据；根据三位人类专家的视觉检查结果，对这些数据进行质量评估，通过不完整的大脑覆盖范围、高运动峰值、重影和其他扫描仪伪影从最初的1112个被试样本中产生871个被试，其中正常的对照组468人，ASD组403人；ABIDE-II收集了17个不同站点的1114个被试的数据，选取518个被试作为实验数据，其中正常的对照组265人，ASD组253人；

步骤(1.2)数据预处理：对于ABIDE-I数据集，为了能够轻松复现和扩展所述方法，所有预处理数据均从Preprocessed Connectomes Project(PCP，http://preprocessed-connectomes-project.org/abide/)获得；PCP项目公开发布和共享了由四个不同预处理流程对ABIDE-I中各个站点数据进行预处理后的数据；本发明所用数据采用PCP(Preprocessed connectomes project)提供的CPAC(Configurable pipeline for theanalysis of connectomes)预处理流程,包括层间时间校正、头动校正、全局平均强度归一化、干扰信号回归、带通滤波和空间配准等；对于ABIDE-II数据集,预处理由静息态fMRI数据处理助手(DPARSF)软件按照相同的步骤完成；

步骤(1.3)构建基于fMRI全脑体素的功能连接数据：

步骤(1.3.1)初始的三维fMRI数据表示为R，

其中

每个体素的时间序列为

其中,

为u的平均值，

为v的平均值；由此,通过每个体素的时间序列

与每个脑区中的平均时间序列

得到每个脑区与每个体素之间的相关系数

在具体实施方案中，D₁＝30，D₂＝36，D₃＝30，D＝30×36×30，M＝200，

步骤(3)基于注意力卷积与自监督学习的脑疾病分类：

步骤(3.1)将ABIDE-I与ABIDE-II数据集或对应的训练集、验证集作为神经网络的输入；

步骤(3.2.1)输入层:

该过程表示为原始数据X与掩码I之间的运算：

其中,⊙表示元素乘积；在具体实施方案中，

α在0.1-0.5的范围内，以0.1为步长取值，候选值分别为0.1、0.2、0.3、0.4和0.5；

步骤(3.2.2)3D注意力卷积模块：

表示第l层的输入数据，M^(l)表示第l层的通道数,

其中，

表示K^(l)的输入通道，

表示K^(l)的输出通道，B^(l)表示相应的偏置，

表示第l+1层所有通道的输出数据，σ(·)表示非线性激活函数；在具体实施方案中，t＝5，此处使用ELU作为卷积层的激活函数；

A^(l)＝Conv_3d([avgpool(H^(l))||maxpool(H^(l))]) (4)

表示第l层的空间注意力系数；在具体实施方案中，为生成有实际意义的注意力系数，此处的三维卷积采用Sigmoid作为激活函数，卷积核大小t＝5；

步骤(3.2.2.3)根据式(5)完成带有残差结构的3D注意力卷积层；

H^(l+1)＝Conv_3d(H^(l))+Conv_3d(H^(l))⊙A^(l) (5)

其中，

步骤(3.2.2.4)为了方便表示，把L个步骤(3.2.2.3)中的3D注意力卷积层的3D注意力卷积模块用F_f(·)表示；以X，

Z＝F_f(X) (6)

其中，Z为输入数据X经过3D注意力卷积模块的输出，

为输入数据

经过3D注意力卷积模块的输出；在具体实施方案中，L在1-5的范围内，以1为步长取值，候选值分别为1、2、3、4和5；

步骤(3.2.3)分类模块：

Y′＝F_c(Z) (8)

整个分类任务的损失函数定义为：

其中，N代表训练集的样本数，C代表类别标签的个数，i代表第几个训练样本，j代表第几个类别标签，Y_i,j和Y′_i,j分别代表样本的标签与相应的预测值；在具体实施方案中，C＝2；

步骤(3.2.4)基于3D空间信息的自监督学习模块：

步骤(3.2.4.1)该模块由反卷积层组成，并且反卷积的卷积核大小与正向卷积相同；反卷积的具体操作为：首先对中间层特征的每个维度进行填充(padding)，填充长度为t-1，其中，t是三维卷积核的大小；然后在新的特征上进行普通的三维卷积，不断地重复上述过程即可实现多层反卷积操作；在具体实施方案中，t＝3，步长为1。

令

则自监督辅助任务的损失函数定义为：

上式为均方误差,表示原始数据与预测输出之间的差异；

与

为相同数量级，这里λ设置为100；

步骤(3.3)针对步骤(3.1)中的训练集，利用Adam梯度下降算法最小化步骤(3.2.5)中所述损失函数，在训练过程中，批大小为24，学习率为1×10^-4；并根据模型在验证集上的分类准确率确定神经网络的超参数，其中，掩蔽比率α在0.1-0.5的范围内，以0.1为步长取值，3D注意力卷积层层数L在1-5的范围内，以1为步长取值，不同掩蔽比率α与3D注意力卷积层层数L下，每种超参数组合采用十折交叉验证法从而得到验证集的准确率，当验证集上的准确率最高时，确定L＝3，α＝0.3为最优的神经网络超参数；

为了说明本发明所述方法的有益效果，在具体实施过程中，我们分别从传统的机器学习方法和深度学习方法中选取了八种经典算法在ABIDE-I和ABIDE-II数据集上进行了对比实验。其中基于传统机器学习的方法包括LASSO、Ridge和SVM。基于深度学习的方法包括SSAE、BrainNetCNN、CKEW和3DCNN。其中，BrainNetCNN、SAE和CKEW是将脑区的功能连接作为输入。其他方法都是将体素数据作为输入。对于SAE方法，除了输入和输出层之外，还包含三个堆栈自编码器层，隐层节点数量分别为1000、128、96；BrainNetCNN和CKEW包括一个具有128个通道的边到点层，一个具有256个通道的点到图层和两个全连接层；3DCNN包含两层卷积层和一层池化层，卷积核的大小为3。3D-ACNN代表本发明所述的方法。

表1 8种算法在ABIDE-I数据集上的分类性能

Methods	ACC	SEN	SPE	PPV	NPV	F1
							SAE	0.6652	0.6817	0.6301	0.6817	0.6404	0.6866
BrainNetCNN	0.6674	0.6902	0.6505	0.7071	0.6545	0.6844
							CKEW	0.6788	0.7347	0.6175	0.6913	0.6689	0.7082
LASSO	0.6459	0.7319	0.5430	0.6529	0.6291	0.6874
							Ridge	0.6754	0.7367	0.6032	0.6839	0.6653	0.7084
SVM	0.6811	0.7427	0.6052	0.6884	0.6733	0.7147
							3DCNN	0.6865	0.7627	0.5981	0.6925	0.6929	0.7211
3D-SACNN	0.7036	0.7403	0.6621	0.7147	0.6851	0.7521

表2 8种算法在ABIDE-II数据集上的分类性能

Methods	ACC	SEN	SPE	PPV	NPV	F1
							SAE	0.6561	0.6732	0.6449	0.6731	0.6331	0.6661
BrainNetCNN	0.6447	0.6209	0.6561	0.6379	0.6406	0.6278
							CKEW	0.6581	0.6092	0.7027	0.6772	0.6899	0.6188
LASSO	0.6416	0.6009	0.7038	0.6582	0.6421	0.6228
							Ridge	0.6233	0.6047	0.6529	0.6363	0.6183	0.6135
SVM	0.6165	0.5738	0.6593	0.6051	0.6310	0.5818
							3DCNN	0.6636	0.6312	0.6887	0.6590	0.6711	0.6457
3D-SACNN	0.6719	0.6948	0.6437	0.6624	0.6982	0.6684

本发明基于三维卷积神经网络，使用注意力机制使3DCNN更好地从fMRI数据中提取全脑体素的空间特征,同时利用自监督学习使3DCNN挖掘到更有意义的表征，如表1和表2所示，本发明所述方法更好的挖掘大脑的空间信息与数据隐含的特征，从而提升分类效果，在ABIDE-I据集和ABIDE-II数据集上大多数指标上均取得最好的结果。因此，本发明所述方法合理可靠。