CN109165667B

CN109165667B - 基于自注意力机制的脑疾病分类系统

Info

Publication number: CN109165667B
Application number: CN201810739141.3A
Authority: CN
Inventors: 刘勇; 金丹; 蒋田仔; 刘冰
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2018-07-06
Filing date: 2018-07-06
Publication date: 2022-02-22
Anticipated expiration: 2038-07-06
Also published as: CN109165667A

Abstract

本发明涉及图像处理技术领域，并提出了一种基于自注意力机制的脑疾病分类系统，旨在解决脑疾病分类诊断中需要对磁共振影像进行预处理、特征提取和特征选择的复杂过程及其所导致的分类准确率不高的技术问题。为此目的，本发明中的基于自注意力机制的脑疾病分类系统包括：对获取脑疾病病人的人脑磁共振影像进行预处理，得到人脑的灰质密度图；利用预先构建的脑疾病分类模型对所述灰质密度图进行脑疾病分类，得到所述脑疾病病人的脑疾病类别；其中，所述预先构建的脑疾病分类模型是基于自注意力机制构建的三维卷积神经网络模型。本发明实施例所示的系统可以快速、准确的分类脑疾病的类别。

Description

基于自注意力机制的脑疾病分类系统

技术领域

本发明涉及医学图像处理技术领域，特别是基于深度学习的图像处理处理领域，具体涉及一种基于自注意力机制的脑疾病分类系统。

背景技术

阿尔兹海默病(Alzheimer’s Disease,AD)作为一种老年痴呆的主要类型，严重威胁了老年人的健康。阿尔兹海默病患者的认知能力逐渐受损，生活能力逐渐丧失，给社会和家人带来了极大的负担。因此，对阿尔兹海默病患者的早期检测和诊断非常重要。

非侵入性神经影像技术的迅速发展极大促进了对正常和异常脑结构与脑功能的研究。磁共振成像(Magnetic Resonance Imaging，MRI)作为一种高空间分辨率、非侵入式的医学成像技术，在脑疾病的发病机理和生物学差异的研究中得到了广泛的应用。

随着深度学习在各大领域取得了优秀的成果，越来越多的医学图像的研究也开始引入深度学习的方法。卷积神经网络是一种多层神经网络，擅长处理图像的相关机器学习问题。在脑疾病分类研究中，相较与常用的支持向量机(Support Vector Machine，SVM)等其他分类方法，基于卷积神经网络的分类方法不需要复杂的预处理过程就可以达到很好的分类正确率。但是目前对于脑疾病的分类中，需要进行图像的预处理、特征提取和特征选择的复杂过程，导致脑疾病分类准确率低的问题，并且无法识别出与脑疾病密切相关的异常脑区。

发明内容

为了解决现有技术中的上述技术问题，即为了解决在传统的脑疾病分类中需要进行预处理、特征提取和特征选择的复杂过程及其所导致的分类准确率不高的技术问题，为此目的，本发明提供了一种基于自注意力机制的脑疾病分类系统，以解决上述问题。

本发明提供的基于自注意力机制的脑疾病分类系统包括：数据获取模块，配置为获取脑疾病病人的人脑磁共振影像对应的灰质密度图像；脑疾病分类模型，配置为根据上述灰质密度图像和多个预设的脑疾病类别进行脑疾病分类，得到上述脑疾病病人的脑疾病类别；其中，上述脑疾病分类模型是基于自注意力机制构建的三维卷积神经网络模型。

进一步地，本发明提供的一个优选技术方案中，上述数据获取模块处理装置进一步配置为执行下列操作：

对上述人脑磁共振影像进行数据格式转换；对格式转换后的上述人脑磁共振影像进行灰度不均匀性校正；将校正后的人脑磁共振影像，配准到标准的MNI空间并分割灰质密度图像。

进一步地，本发明提供的一个优选技术方案中，上述脑疾病分类模型包括输入层、隐含层、自注意力机制模块、全连接层和分类器；其中：

上述输入层配置为获取上述数据获取模块所获取的灰质密度图像；上述隐含层配置为获取上述灰质密度图像对应的第一特征图；上述自注意力机制模块配置为上述隐含层所获取的第一特征图进行自注意力机制处理得到第二特征图；上述全连接层配置为对上述第一特征图和第二特征图进行全连接操作，得到特征向量；上述分类器配置为根据上述特征向量和多个上述脑疾病类别，获取每个上述脑疾病类别对应的概率；相应地，上述脑疾病分类模型进一步配置为选取最大概率对应的脑疾病类别作为上述脑疾病病人的脑疾病类别。

进一步地，本发明提供的一个优选技术方案中，上述脑疾病分类模型还包括两个残差池化网络，上述残差池化网络包括多个顺次连接的残差池化单元，上述残差池化单元包括顺次连接的池化层和残差网络模块；上述隐含层、第一个残差池化网络、自注意力机制模块、第二个残差池化网络、全连接层和分类器顺次连接；相应地，上述全连接层进一步配置为对上述第一特征图和第二特征图以及每个池化层输出的特征图和每个残差网络模块输出的特征图进行全连接操作，得到特征向量。

进一步地，本发明提供的一个优选技术方案中，上述自注意力机制模块包括卷积层、激活函数层和乘法器；上述卷积层的输入侧与上述自注意力机制模块的输入端连接，上述卷积层的输出侧与激活函数层的输入侧连接；上述激活函数层的输出侧与上述乘法器的一个输入侧连接；上述乘法器的另一个输入侧与上述自注意力机制模块的输入端连接，上述乘法器的输出侧与上述自注意力机制模块的输出端连接。

进一步地，本发明提供的一个优选技术方案中，基于自注意力机制的脑疾病分类系统还包括模型训练模块，上述模型训练模块配置为根据预设的交叉熵代价函数并利用机器学习算法对上述脑疾病分类模型进行模型训练；上述交叉熵代价函数如下式所示：

z_i＝∑_jw_ijx_j

其中，E表示交叉熵代价函数，z_i表示全连接层对应类别i的输出，x_j表示全连接层的输入，w_ij全连接层的权重，s_i表示经过softmax函数后输入样本属于第i类的概率，η表示学习率，y表示样本脑疾病类别,x表示样本，n表示样本的总数，i代表全连接层输出的第i个节点，对应类别数，j表示全连接层输入的第j个节点。

进一步地，本发明提供的一个优选技术方案中，上述模型训练模块进一步配置为利用自适应时刻估计方法并按照下式所示的方法优化所述学习率η：

其中，

其中，m_t，n_t分别是对梯度的一阶矩估计和二阶矩估计，

是对m_t，n_t的校正；β₁和β₂分别是一阶和二阶矩估计的指数衰减率∈为一个非零的极小数，以保证分母非零，θ_t+1表示更新后网络权重，θ_t表示更新前的网络权重，t表示当前的训练轮数。

与最接近的现有技术相比，上述技术方案至少具有如下有益效果：

本发明提供的基于自注意力机制的脑疾病分类系统，通过有监督的方式自主进行特征提取和特征选择以及参数调节，提高了脑疾病的分类效果；避免了当前的脑疾病分类中所涉及的预处理、特征提取和特征选择等繁琐过程。同时，自注意力机制的引入使得该系统可以自主学习对预测疾病有重要作用的脑区，使重要的脑区权重增大、不重要的脑区权重减小，从而识别出与脑疾病密切相关的异常脑区；为理解特定脑疾病的结构和功能异常与发病机理提供有价值的参考。

附图说明

图1是本发明实施例中一种基于自注意力机制的脑疾病分类系统的主要结构示意图；

图2是本发明实施例中脑疾病分类模型的基本框架示意图；

图3是本发明实施例中一个优选的技术方案中的脑疾病分类模型框架示意图；

图4是本发明实施例中脑疾病分类模型的残差池化网络的结构示意图；

图5是本发明实施例中残差网络模块的结构示意图；

图6是本发明实施例中脑疾病分类模型的自注意力机制模块的结构原理示意图；

图7是本发明实施例中脑区重要性的矢状面示意图。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

参阅附图1，附图1示例性示出了本发明实施例中一种基于自注意力机制的脑疾病分类系统的主要结构。如图1所示，本实施例中基于自注意力机制的脑疾病分类系统，包括数据获取模块和脑疾病分类模型，其中：

数据获取模块，配置为获取脑疾病病人的人脑磁共振影像对应的灰质密度图像。

脑疾病分类模型，配置为根据上述灰质密度图像和多个预设的脑疾病类别进行脑疾病分类，得到上述脑疾病病人的脑疾病类别；其中，上述脑疾病分类模型是基于自注意力机制构建的三维卷积神经网络模型。

在本实施例中，基于自注意力机制的脑疾病分类系统，可以是以具有图像处理能力服务器或应用平台为核心组成的系统。上述服务器或应用平台可以与核磁共振设备通信连接，获得病患的磁共振影像；并且与显示装置通信连接，将分类结果通过显示装置显示。上述数据获取模块和脑疾病分类模型设置于上述服务器或应用平台中，上述数据获取模块可以从与其通信连接的核磁共振设备或数据库或其他网络设备中获得脑疾病病人的人脑磁共振影像。其中，人脑磁共振影像是基于磁共振成像原理所获得的一种非侵入式的人脑医学影像。这里，上述人脑磁共振影像可以是待进行脑疾病检测的人脑磁共振影像，或者，用于测试的人脑磁共振影像。

由于人脑磁共振影像成像过程中受到射频场不均匀性、核磁共振设备本身以及人脑组织容积效应的影响，导致图像的灰度均匀性变差，使得图像中同一组织的像素灰度沿空间呈缓慢平滑的变化。因此，需要对上述人脑磁共振影像进行预处理，得到适宜医学处理的人脑的灰质密度图。

进一步地，本实施例提供的一个优选技术方案中，上述数据获取模块进一步配置为执行下列操作：对上述人脑磁共振影像进行数据格式转换；对格式转换后的人脑磁共振影像进行灰度不均匀性校正；将校正后的人脑磁共振影像配准到MNI空间并分割灰质密度图像。

可以使用脑功能成像软件(Statistical Parametric Mapping，SPM)将上述人脑磁共振影像从DICOM影像数据格式转换成标准的NIfTI数据格式，并使用SPM软件对转换为标准格式后的人脑磁共振影像进行灰度不均匀性校正，然后配准到标准的MNI空间，并分割出该人脑磁共振影像的大脑灰质密度图。对上述人脑磁共振影像进行灰度不均匀性校正可以是使用基于EM算法的偏移场校正，还可以是采用模糊均值模型的偏移校正。

在原始空间中图像的维度、原点、voxel size等都是不同的。不同图像之间不具有可比性，计算出的任何特征都不能进行统计分析，或是用于机器学习。使用MNI标准模板，将图像进行配准，标准化到同一个模板上，即在一个标准的MNI空间，使得图像的维度、原点、voxelsize统一。

在本实施例中，上述脑疾病分类模型根据上述数据获取模块所获得的人脑磁共振影像的灰质密度图和预先设置的多个脑疾病类别对上述灰质密度图进行分类处理，得到病患的脑疾病类别。可以是将待检测的人脑磁共振影像的灰质密度图输入到上述脑疾病分类模型中，得到该人脑磁共振影像疾病属性的预测值。1表示该人脑磁共振影像被判断为AD患者，0表示该人脑磁共振影像被判断为健康对照(normal control)。

进一步地，本实施例提供的一个优选技术方案中，参考附图2，附图2示出了脑疾病分类模型的基本框架结构，如图2所示上述脑疾病分类模型包括：输入层、隐含层、自注意力机制模块、全连接层和分类器。其中，上述输入层配置为获取上述数据获取模块所获取的灰质密度图像；上述隐含层配置为获取上述灰质密度图像对应的第一特征图；上述自注意力机制模块配置为上述隐含层所获取的第一特征图进行自注意力机制处理得到第二特征图；上述全连接层配置为对上述第一特征图和第二特征图进行全连接操作，得到特征向量；上述分类器配置为根据上述特征向量和多个上述脑疾病类别，获取每个上述脑疾病类别对应的概率；相应地，上述脑疾病分类模型进一步配置为选取最大概率对应的脑疾病类别作为上述脑疾病病人的脑疾病类别。

进一步地，本实施例提供的一个优选技术方案中，参考附图3，附图3示出了在本实施例的一个优选的技术方案中，脑疾病分类模型的框架结构图，如图3所示，上述脑疾病分类模型还包括两个残差池化网络。参考附图4，附图4示出了残差池化网络的结构图，如图4所示，上述残差池化网络包括多个顺次连接的残差池化单元，上述残差池化单元包括顺次连接的池化层和残差网络模块；如图3所示，上述隐含层、第一个残差池化网络、自注意力机制模块、第二个残差池化网络、全连接层和分类器顺次连接。

相应地，上述全连接层进一步配置为对上述第一特征图和第二特征图以及每个池化层输出的特征图和每个残差网络模块输出的特征图进行全连接操作，得到特征向量。

具体地，参考附图5，附图5示出了残差网络模块的结构图，如图5所示，残差网络模块包两个顺次连接的残差单元。每个上述残差单元包括顺次连接的两个子单元，每个子单元由卷积网络、批规范化(Batch Normalization)和ReLU激活函数组成。每个上述残差单元的输入与该残差单元中的第二个子单元的批规范化输出的值相加，其运算结果经该残差单元的第二个子单元中ReLU激活函数激活后输出。其中，第一个残差单元的输出作为第二个残差单元的输入。

进一步地，本实施例提供的一个优选技术方案中，参考附图6，附图6示出了自注意力机制模块的主要结构示意图，如图6所示，上述自注意力机制模块包括卷积层、激活函数层和乘法器；上述卷积层的输入侧与上述自注意力机制模块的输入端连接，上述卷积层的输出侧与激活函数层的输入侧连接；上述激活函数层的输出侧与上述乘法器的一个输入侧连接；上述乘法器的另一个输入侧与上述自注意力机制模块的输入端连接，上述乘法器的输出侧与上述自注意力机制模块的输出端连接。

进一步地，本实施例提供的一个优选技术方案中，上述基于自注意力机制的脑疾病分类系统还包括模型训练模块，上述模型训练模块配置为根据预设的交叉熵代价函数并利用机器学习算法对上述脑疾病分类模型进行模型训练。上述交叉熵代价函数如下式所示：

z_i＝∑_jw_ijx_j (3)

其中，E表示交叉熵代价函数，z_i表示全连接层对应类别i的输出，x_j表示全连接层的输入，w_ij全连接层的权重，s_i表示经过softmax函数后输入样本属于第i类的概率，η表示学习率，y表示样本脑疾病类别,x表示样本，n表示样本的总数，i代表全连接层输出的第i个节点，对应类别数，j表示全连接层输入的第j个节点，对应全连接层节点的数目，在本实施例的优选方式中，j的取值范围为1,2,…,256。

进一步地，本实施例提供的一个优选技术方案中，上述模型训练模块进一步配置为利用自适应时刻估计方法并按照下式所示的方法优化所述学习率η：

其中，

其中，m_t，n_t分别是对梯度的一阶矩估计和二阶矩估计，

是对m_t，n_t的校正；β₁和β₂分别是一阶和二阶矩估计的指数衰减率，这里，默认其取值为β₁＝0.9，β₂＝0.999。∈为一个非零的极小数，以保证分母非零，θ_t+1表示更新后网络权重，θ_t表示更新前的网络权重，t表示当前的训练轮数。

作为示例，参考上述附图3-6。根据脑疾病分类模型的结构，说明利用样本数据对上述脑疾病分类模型进行训练的过程。

样本数据为AD患者和正常对照组的磁共振图像数据。对样本数据进行处理，得到标准MNI空间的灰质密度图的图像，其中，图像大小为91×109×91，并将图像存储为神经网络可输入的数据格式。

S0：设置脑疾病分类模型的参数，批处理数量Batch Size＝8，即每次将8个训练样本输入脑疾病分类模型。

S1：将样本数据通过输入层输入到预先搭建的脑疾病分类模型进行训练。

S2：隐含层包括三层，分别为实例正则化处理层、卷积层和批规范化(BatchNormalization，BN)和ReLU激活函数处理层。

实例正则化处理层对图像大小为91×109×91的输入样本进行实例正则化处理，上述实例正则化处理为对每一个输入样本去除均值和方差。

卷积层中用32个大小为3×3×3的3维卷积核对图像进行卷积。其中，参数设置stride＝1，padding＝1，得到32个大小为91×109×91的特征图。

BN和ReLU激活函数处理层对所得到的32个特征图进行批规范化处理和ReLU函数激活处理。

S3：第一个残差池化网络中，包括两个顺次连接的残差池化单元，每个残差池化单元包括顺次连接的池化层和残差网络模块。

第一个池化层将经过批规范化和ReLU激活函数处理后的32个特征图，在池化层进行平均值池化(average pooling)操作，得到32个大小为46×55×46的特征图。其中，池化单元为3×3×3，stride＝2。

第一个残差网络模块(ResNet模块)，将第一池化层的输出作为ResNet模块的输入，得到32个大小为46×55×46的特征图。其中，每个ResNet模块包含2个单元(blocks)，每个blocks包含2个卷积层，卷积核数量为32，大小为3×3×3的3维卷积核，stride＝1，以及2次批规范化和ReLU激活。在每一个blocks中先经过一个卷积层、批规范化和ReLU激活，再经过一个卷积层和批规范化，之后将得到的特征图和block的输入相加，最后在经过ReLU函数激活得到block的输出。

第二池化层对上一层得到的32个特征图进行平均值池化，得到32个大小为23×28×23的特征图。其中，池化单元为3×3×3，stride＝2。

第二个ResNet模块将第二池化层的输出作为输入，得到64个大小为23×28×23的特征图。在第二个ResNet模块，卷积核数量为64。

S4：自注意力机制模块中，上述自注意力机制模块将上述残差池化网络层所输出的特征图作为输入得到64个大小为23×28×23特征图。上述自注意力机制模块中，先用3×3×3大小的卷积核对所输入的特征图进行卷积，将卷积结果与自注意力机制模块的输入相乘，将乘积结果进行ReLU函数激活，得到64个大小为23×28×23的特征图。

S5：第二个残差池化网络层，包括两个顺次连接的残差池化单元，残差池化单元包括顺次连接的池化层和残差网络模块。

第一个池化层对所输入的特征图进行平均值池化，得到64个大小为12×14×12的特征图。其中，池化单元为3×3×3，stride＝2。

第一个ResNet模块根据输入的特征图，得到128个大小为12×14×12的特征图，在该ResNet模块中卷积核数量为128。

第二池化层对输入的特征图进行平均值池化，得到128个大小为6×7×6的特征图。其中，池化单元为3×3×3，stride＝2。

第二个ResNet模块卷积核数量为256，根据输入的特征图得到256个大小为6×7×6的特征图。

S6：全连接层将得到的256个6×7×6的特征图分别求平均值后聚合成256维的特征向量。并将上述256维的特征向量输入全连接层，输出对应类别数。

S7：分类器层中，将全连接层的输出，作为softmax分类器的输入，上述softmax分类器输出一个0到1的浮点数，表示输入样本图像是脑疾病患者的概率。

通过反向传播(BP)算法对每一层的权重参数进行调整，使脑疾病分类模型的预测标签和训练标签的交叉熵代价函数E最小。其中，网络权重的增量Δw_ij如下式所示。当误差满足收敛条件时，迭代结束，得到训练好的脑疾病分类模型。其中，

其中，η为学习学习率，E表示交叉熵代价函数。

进一步地，可以使用自适应时刻估计方法(Adaptive Moment Estimation，Adam)来优化网络学习率参数，利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。该算法优点主要在于经过偏置校正后，每一次迭代学习率都有个确定范围，使得参数比较平稳。其参数更新如公式4所示。

在一些示例中，采用了多家医院收集的AD患者和正常对照组的磁共振图像数据，共6个数据集。其中，正常对照组共231人；阿尔茨海默患者共262人。详细信息见表1：

	Dataset1	Dataset2	Dataset3	Dataset4	Dataset5	Dataset6
							被试数	60	71	83	106	113	60

将上述样本数据分为训练集和测试集。使用上述训练集训练上述脑疾病分类模型，利用上述测试集测试上述脑疾病分类模型的参数。将上述测试集的样本数据输入到训练好的网络模型中，得到该测试样本疾病属性的预测值。1表示该样本被判断为AD患者，0表示该样本被判断为健康对照。

我们依次将每个中心的样本作为测试集，其他5个中心的样本作为训练集，依次计算得到每个中心的分类准确率。结果见下表2：

测试集	Dataset 1	Dataset2	Dataset3	Dataset4	Dataset5	Dataset6
							正确率	93.3	88.7	90.4	82.1	91.2	96.6

由表2可知，基于自注意力机制的脑疾病分类系统对AD的平均分类准确率高达90.4％，能够更加准确地定位与AD发病机制密切相关的异常脑区，实现精准医疗的目标。

进一步地，同时，通过训练好的脑疾病分类模型的注意力机制模块，可以通过上采样的方式得到大脑中每个体素点对于疾病分类的权重，即大脑的每个区域对疾病预测的重要性，每个体素权重越大，分类过程中也就越重要。附图7示例性示出脑区重要性的矢状面示意图，如图7所示，与AD密切相关的脑区主要是颞叶，前额叶，海马和旁海马，基底神经节和小脑部分区域。上述区域是在AD患者中发生显著变化的区域，可作为辅助医疗诊断的生物标志。

本发明上述实施例所提供的系统利用脑疾病分类模型对待检测的人脑磁共振影像进行分类，确定出病患的脑疾病类别。其中，脑疾病分类模型中融入自注意力机制，解决了传统的脑疾病分类中需要进行预处理、特征提取和特征选择的复杂过程及其所导致的分类准确率不高的问题，同时，所融入的自注意力机制能够识别出与脑疾病密切相关的异常脑区，为理解特定脑疾病的结构和功能异常与发病机理提供参考信息。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征和数据分辨率作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。