CN115908923A - 基于注意力引导3d神经网络的脑部磁共振图像分类系统 - Google Patents

基于注意力引导3d神经网络的脑部磁共振图像分类系统 Download PDF

Info

Publication number
CN115908923A
CN115908923A CN202211471897.7A CN202211471897A CN115908923A CN 115908923 A CN115908923 A CN 115908923A CN 202211471897 A CN202211471897 A CN 202211471897A CN 115908923 A CN115908923 A CN 115908923A
Authority
CN
China
Prior art keywords
model
image
classification
spatial
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211471897.7A
Other languages
English (en)
Inventor
刘钊
覃智威
朱平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202211471897.7A priority Critical patent/CN115908923A/zh
Publication of CN115908923A publication Critical patent/CN115908923A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

一种基于注意力引导3D神经网络的脑部磁共振图像分类系统,通过数据预处理模块对采集到的脑部3D MR图像进行格式转换、分割剪裁并生成训练样本集、验证样本集与测试样本集;通过图像特征提取与处理模块从收到的训练样本集、验证样本集或测试样本集的图像中提取出特征向量;通过分类输出模块基于全连接层的Softmax激活函数根据特征向量生成分类结果;通过系统评估模块根据由训练集数据建立的3D MR图像分类模型应用于测试集中,获取测试集各MR图像的类别标签,并与样本的真实类别标签进行比较求取分类预测的准确率、敏感性、特异性和精确度。本发明使模型在训练时根据空间注意力权重随机删除特征图中大于权重阈值的区域,缓解模型过拟合现象,提升系统最终的图像分类精度。

Description

基于注意力引导3D神经网络的脑部磁共振图像分类系统
技术领域
本发明涉及的是一种图像处理领域的技术,具体是一种基于注意力引导3D卷积神经网络的阿尔茨海默病脑部磁共振图像分类系统。
背景技术
现有脑磁共振图像处理依赖于医学专家的手工特征提取与分析,这部分工作耗时耗力且依赖于专家的个人知识和经验。因此计算机辅助诊断技术(ComputerAidedDiagnosis,CAD)得到广泛的关注,而在基于计算机辅助诊断的脑部磁共振图像分类的研究领域中,最常采用卷积神经网络(Convolutional Neural Network,CNN)进行图像的特征提取与分类。相比于传统方法,CNN具有自动特征提取与处理以及模型端到端训练的明显优势。但在将CNN应用于AD脑部MR图像分类时,由于脑部MRI是3D成像,经典的CNN方法处理的是2D自然图像,因此需要针对性地扩展到3D;另一方面,此类深度学习方法需要较大规模的数据进行模型训练,而针对AD的脑部MR图像数据规模较小,一些经典的CNN框架在使用这部分数据训练时常出现过拟合现象,导致测试集的精度不高。针对上述问题,如何面向AD的脑部3D MR图像构建基于CNN的高效与准确的图像分类系统,是将深度学习方法应用于AD计算机辅助诊断、为医生提供决策支持的一大关键。
发明内容
本发明针对现有CNN框架应用于2D自然图像而无法将3D MR图像的空间结构信息同时处理的问题,以及较大的CNN框架在应用于小规模图像数据集时出现的过拟合从而测试精度低的问题,提出一种基于注意力引导3D神经网络的脑部磁共振图像分类系统,通过三维残差网络(3D Residual Network,3D ResNet)作为基础图像分类模型以及基于空间注意力机制的丢弃层(Spatial Attention-Based Dropout Layer),将基于空间注意力的丢弃层应用于3D ResNet模型之中,使模型在训练时根据空间注意力权重随机删除特征图中大于权重阈值的区域,缓解模型过拟合现象,提升系统最终的图像分类精度。
本发明是通过以下技术方案实现的:
本发明涉及一种基于注意力引导3D神经网络的脑部磁共振图像分类系统,包括:数据预处理模块、图像特征提取与处理模块、分类输出模块和系统评估模块,其中:数据预处理模块对采集到的脑部3D MR图像进行格式转换、分割剪裁并生成训练样本集、验证样本集与测试样本集;图像特征提取与处理模块从收到的训练样本集、验证样本集或测试样本集的图像中提取出特征向量;分类输出模块基于全连接层的Softmax激活函数根据特征向量生成分类结果;系统评估模块根据由训练集数据建立的3D MR图像分类模型应用于测试集中,获取测试集各MR图像的类别标签,并与样本的真实类别标签进行比较求取分类预测的准确率、敏感性、特异性和精确度。
所述的格式转换是指:将原始NifTI(.nii)格式的脑部3D MR图像转换为张量(Tensor)形式,并将张量矩阵的数值X缩放至较小的区间里:
Figure BDA0003958816630000021
其中:Xnorm为标准化后的张量矩阵,X为初始张量矩阵,μX为所有张量矩阵的平均值,σX为所有张量矩阵的标准差。
所述的分割剪裁,即去除图像中的颅骨部分、脂肪层部分和背景部分并剪裁至图像特征提取与处理模块设定的尺寸大小。
所述的特征向量,通过设置于图像特征提取与处理模块中的融合基于空间注意力机制的丢弃层(SpatialAttention-Based DropoutLayer)的3D ResNet特征提取网络得到,该特征提取网络利用空间注意力机制将卷积层输出的3D特征图转化为空间注意力权值矩阵,利用Sigmoid激活函数生成空间重要性掩模(Mask)以及求取空间注意力权值矩阵的最大值,再乘以系数γ获得阈值,从而生成基于空间注意力分配的丢弃掩模;最后依概率随机获取空间重要性掩模或丢弃掩模,并通过空间乘法应用到输入的特征图中并输出经过处理的特征图。
所述的空间注意力机制是指:在深度学习模型中,通过模拟人眼观察物体时的扫视过程,在网络中加入类似的注意力机制,有利于突出图像中感兴趣区域的重要信息。其中空间注意力机制具体为:关注于卷积层输出的每个特征图内各区域的注意力权重分配。
所述的3D空间注意力权值矩阵Aspatial=Conv3D([AvgPool(Fin);MaxPool(Fin)]),其中:AvgPool和MaxPool分别指通道平均池化与最大池化,[;]表示3D特征图的拼接,Conv3D指3D卷积层。
所述的空间重要性掩模Mimp=σ(Aspatial),其中:σ为Sigmoid激活函数。
所述的基于空间注意力分配的丢弃掩模
Figure BDA0003958816630000022
即空间注意力权值矩阵中大于阈值γ的置为0,其他置为1。
所述的训练样本集与测试样本集之比优选为:8:2;训练样本集中,训练样本与验证样本之比为:9:1。
所述的Softmax激活函数是指:在二分类任务中,最终的全连接层所包含的激活函数,把神经元输出值映射到(0,1),输出值的总和为1。从概率角度看,对于每个样本的输出,选择值最大的(概率最大)作为样本的类别预测值,具体为:
Figure BDA0003958816630000023
其中:ei为第i个神经元的输出值,其值是e的i次方,∑jej为全连接层所有神经元的输出总和,Si为全连接层第i个神经元输出的类别预测概率值。
技术效果
本发明较好解决了大型CNN框架在应用于小规模图像数据集时出现过拟合从而导致测试精度低的问题。与现有技术相比,本发明面向3DMR图像分类,构建了3DResNet分类模型,引入基于空间注意力机制的丢弃准则,在训练过程中依照空间注意力权重矩阵随机删除特征图中的最具鉴别性区域或分配空间注意力,能有效利用面向AD的小规模3DMR图像数据,建立泛化能力强的深度学习图像分类系统,有效解决了CNN模型应用于小规模数据集上的过拟合问题。
附图说明
图1为本发明系统结构示意图;
图2为基于注意力引导3D卷积神经网络的AD脑部MR图像分类流程图;
图3为实施例中3DResNet特征提取模型结构示意图;
图4为实施例中基于空间注意力的丢弃层结构示意图;
图5为实施例中不同参数设置对图像分类结果的影响示意图;
图6为不同方法在3DMR图像分类上的效果实例比较图。
具体实施方式
如图1所示,为本实施例涉及一种基于注意力引导3D卷积神经网络的AD脑部MR图像分类系统,包括:数据预处理模块、图像特征提取与处理模块、分类输出模块和系统评估模块,其中:图像特征提取与处理模块接收3D图像数据输入并进行特征提取与处理,图像特征提取与处理模块中的3DResNet网络有效表征和提取3D MR图像特征,但相比于特征提取网络的规模,所获得的图像数据集规模较小,因此网络在训练过程中会出现过拟合现象。为此本发明设计了基于空间注意力机制的丢弃层以解决网络的过拟合问题,提升模型在测试集上的泛化能力。
所述的图像特征提取与处理模块包括:3DResNet特征提取网络与基于空间注意力机制的丢弃层,其中:3DResNet特征提取网络基于残差学习,将具有50层网络(包括49层卷积层和全连接层)的残差网络扩展到三维,构建3DResNet图像分类模型;再利用该模型对输入的脑部3DMR图像进行特征提取与加工,由浅层特征逐级抽象获取利于分类决策的抽象特征;如图4所示,基于空间注意力机制的丢弃层利用空间注意力机制将卷积层输出的3D特征图转化为空间注意力权值矩阵A,利用Sigmoid激活函数生成空间重要性掩模(Mask),以及求取空间注意力权值矩阵的最大值,最大值乘以系数γ获得阈值,空间注意力权值矩阵中大于该阈值的置为0,小于该阈值的置为1,从而生成基于空间注意力分配的丢弃掩模。最后依概率β随机获取空间重要性掩模或丢弃掩模,并通过空间乘法应用到输入的特征图中,向下一层网络输出经过处理的特征图。
所述的空间注意力机制是指:在深度学习模型中,通过模拟人眼观察物体时的扫视过程,在网络中加入类似的注意力机制,有利于突出图像中感兴趣区域的重要信息。其中空间注意力机制具体为:关注于卷积层输出的每个特征图内各区域的注意力权重分配。
所述的全连接层将卷积层学到的分布式特征表示映射到类别空间,起到分类器的作用。
所述的Softmax激活函数是指:在二分类任务中,最终的全连接层所包含的激活函数,把神经元输出值映射到(0,1),输出值的总和为1。从概率角度看,对于每个样本的输出,选择值最大的(概率最大)作为样本的类别预测值,具体为:
Figure BDA0003958816630000041
其中:ei为第i个神经元的输出值,其值是e的i次方,∑jej为全连接层所有神经元的输出总和,Si为全连接层第i个神经元输出的类别预测概率值。
本实施例涉及上述系统的脑部磁共振图像分类方法,以包含阿尔茨海默病(AD)和正常对照组(NC)两种类型的3DMR图像分类为例进行说明,具体包括如下步骤:
步骤1、3DMR图像数据整理与预处理,其中图像数据包含AD样本98例,NC样本114例,具体包括:
1.1)基于Python将原NifTI(.nii)格式的图像数据转换为张量(Tensor)形式,利用Python的deepbrain与skimage库对数据进行颅骨剥离、背景剪裁以及尺寸缩放,获得64×64×64的3D图像数据。
1.2)处理后的数据80%的比例随机划分为训练样本集用于训练分类预测模型,其中又划分出10%的比例用于训练过程中模型的验证;余下20%的比例为测试集用于模型最终的测试与结果对比。
1.3)分别对训练集和测试集的数据进行标准化,采用方法:
Figure BDA0003958816630000042
其中:对于训练集或测试集来说,Xnorm为标准化后的张量矩阵,X为初始张量矩阵,μX为所有张量矩阵的平均值,σX为所有张量矩阵的标准差。
步骤2、将残差网络扩展为三维结构,构建如图3所示的3D ResNet特征提取模型,具体包括:
2.1)选取具有50层网络(其中49层为卷积层)的ResNet50作为基础网络架构,将ResNet的输入层扩充至接收3D图像数据,即(Height,Width,Depth)三个通道。将原ResNet50中的2D卷积层拓展至3D卷积层,即卷积层中的卷积核也具有(Height,Width,Depth)三个维度。在网络模型的最后加入3D全局平均池化层将卷积层输出的3D特征图压缩成1D特征向量。
所述的3D全局平均池化是指:针对卷积层提取的3D特征进行平均池化操作,其通过取每个特征图的平均值将3D特征图压缩为一个特征值,将不同特征值组合成1D特征向量,作为分类输出模块的输入。
步骤3、在3DResNet卷积层之后增加如图4所示的基于空间注意力的丢弃层,该丢弃层先计算输出特征图的空间注意力权重,并分别产生重要性掩模与丢弃掩模。在训练的每次迭代依概率β选择将重要性掩模与输入特征图相乘获得空间注意力权重增强的新特征图,或是将丢弃掩模与输入特征图相乘获得重要性区域特征值为0的新特征图,以解决模型训练时的过拟合问题。
所述的空间注意力是指:如图4所示,通过平均池化层与最大池化层分别获取通道维度上的平均池化特征图与最大池化特征图,并将两类特征图叠加以输入至单卷积核且大小为7×7×7的3D卷积层中,最终输出空间注意力权值矩阵
Aspatial=Conv3D([AvgPool(Fin);MaxPool(Fin)]),其中:AvgPool和MaxPool分别指通道平均池化与最大池化,[;]表示3D特征图的拼接,Conv3D指3D卷积层。
所述的重要性掩模是指:将Sigmoid激活函数作用于空间注意力权值矩阵A以生成空间重要性掩模(ImportanceMask),具体为:Mimp=σ(Aspatial),其中:σ为Sigmoid激活函数。
所述的丢弃掩模是指:求取空间注意力权值矩阵A的最大值,最大值乘以系数γ(本例取γ=0.1)获得阈值,空间注意力权值矩阵中大于该阈值的置为0,小于该阈值的置为1,从而生成丢弃掩模(Drop Mask),具体为:
Figure BDA0003958816630000051
步骤4、将经由3D ResNet全局平均池化层输出的特征向量输入至分类输出模块的全连接层,利用Softmax激活函数将特征向量映射至本案例的2种图像类别空间,输出3D MR图像最终的分类结果与相应的概率。
步骤5、利用系统评估模块中设置的准确率(Accuracy)、敏感性(Sensitivity)、特异性(Specificity)和精确度(Precision)指标对训练好的图像分类模型在测试集上的分类结果进行评估,输出各指标的评价结果。
所述的准确率是指:根据样本的真实类别标签,所有预测正确的样本数量占全体样本数量的比值,准确率具体为:
Figure BDA0003958816630000061
其中:TP为实际是正类别,模型正确预测为正类别的数量;TN为实际是负类别,模型正确预测为负类别的数量;FP为实际是负类别,模型错误预测为正类别的数量;FN为实际是正类别,模型错误预测为负类别的数量。
所述的敏感性是指:在所有实际正类别中,被模型正确预测为正类别的比例为敏感性,也称作真阳性率。该敏感性具体为:
Figure BDA0003958816630000062
其中:TP为实际为正类别,模型正确预测为正类别的数量;FN为实际为正类别,模型错误预测为负类别的数量。
所述的特异性是指:在所有实际负类别中,被模型正确预测为负类别的比例为特异性,也称作真阴性率。该特异性具体为:
Figure BDA0003958816630000063
其中:TN为实际为负类别,模型正确预测为负类别的数量;FP为实际为负类别,模型错误预测为正类别的数量。
所述的精确度是指:在模型预测的所有正类别中,真正属于正类别的比例为精确度。该精确度具体为:
Figure BDA0003958816630000064
其中:TP为实际为正类别,模型正确预测为正类别的数量;FP为实际为负类别,模型错误预测为正类别的数量。
本实施例按照上述步骤,构建基于空间注意力引导的3D卷积神经网络对脑部3DMR图像进行特征提取与处理,输出分类结果与模型评估结果。
基于本实施例中AD相关的脑部3D MR图像,将所设计的3D图像分类模型在训练集上进行训练,并使用测试集对模型分类性能进行验证。因为本发明系统涉及依概率β选择重要性掩模或者丢弃掩模对特征图进行处理,故概率β的大小会对图像分类精度产生影响。本实施案例首先开展概率β的选值研究,筛选出较优的取值范围,获得更好的图像分类精度。所述概率β具体为:训练过程中每次迭代选择重要性掩模的概率β,则相应选择丢弃掩模的概率为1-β。结果如表1与图5所示。
表1不同掩模的选择概率对图像分类结果的影响
Figure BDA0003958816630000065
Figure BDA0003958816630000071
表1结果显示,丢弃掩模的选择概率很小(25%)或不选择(0%)时,分类模型发生了严重的过拟合,在测试集上的分类准确率小于50%。其各项评价指标中,敏感性显著高于其它指标,这说明,模型倾向于把所有输入的图像样本预测为正类别(本例为AD类别)。这种强烈的预测偏好将导致实际使用时产生严重的误诊。当丢弃掩模的选择概率变大时,模型精度开始明显变好,表明了所设计的这种特征处理方式能极大改善模型的过拟合情况。综合来看,当重要性掩模和丢弃掩模的选择概率分别为25%和75%时,分类模型的泛化能力最强。
为进一步展示本方法在AD相关的脑部3D MR图像分类任务上带来的性能提升,以及基于空间注意力机制的丢弃层的效果,使用原3D ResNet以及包含不同丢弃概率的经典丢弃层(Dropout)在同样的数据集上进行训练与测试,对比不同方法的分类结果,如表2与图6所示。
所述的经典丢弃层(Dropout)是指:一种防止模型过拟合的方法,神经网络训练过程中以一定的概率p使网络的神经元输出置为0,停止更新其参数。
表2AD相关的脑部3D MR图像分类结果比较
Figure BDA0003958816630000072
从表2的结果可知,3D ResNet在本案例数据集上的泛化能力很差(严重过拟合):模型有严重的预测偏向性(偏向预测AD类),导致没有正确预测的负类(NC类),特异性为0。即便加入经典丢弃层,在概率分别为0.25和0.50时,整体情况仍旧没有太大改善;而当概率更大时(0.75),模型的预测偏向性发生调换(偏向预测NC类),导致没有正确预测的正类(AD类),敏感性与精确度为0。相比之下,本方法在3D ResNet基础上,引入基于注意力机制的丢弃层,极大增强了模型的泛化能力,使得分类的准确率提高了43.90%,特异性提高了90.91%,精确度提高了43.89%。
经过具体实际实验,在Python编程语言与TensorFlow/Keras深度学习框架的具体环境下,以初始学习率Learning Rate=0.0001、训练数据集迭代次数Epoch=30、每次训练的样本量Batchsize=2、重要性掩模选择概率β=25%参数启动/运行上述装置/方法,得到的实验数据是:AD/NC类别的脑部3D MR图像分类准确率为87.80%,敏感性为84.21%,特异性为90.91%,精确度为88.89%。
与现有技术相比,本方法极大缓解3D ResNet在面向AD的3D MR图像分类上的过拟合问题,使得方法在测试集中的泛化性能更优,准确率提高了43.90%,特异性提高了90.91%,精确度提高了43.89%。具体为:通过建立3D ResNet特征提取模型对脑部3D MR图像进行特征提取,针对深度学习模型在小规模数据集上产生严重过拟合导致泛化能力差的问题,在3D ResNet模型基础之上增加了基于空间注意力的丢弃层。该丢弃层引入空间注意力机制,通过计算空间注意力权重获取特征图中重要的特征分布区域,并根据设置概率随机地选择删除这些区域的特征(置为0)或是给特征图分配空间注意力权重。本方法应用于深度学习模型中取得了优良的效果,相比原3D ResNet模型,本发明在AD/NC脑部3D MR图像上的分类准确率提高了43.90%,特异性提高了90.91%,精确度提高了43.89%;相比于3DResNet模型与经典丢弃层(丢弃概率p=50%)的组合,分类准确率提高了34.14%,特异性提高了77.27%,精确度提高了38.89%。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

Claims (8)

1.一种基于注意力引导3D神经网络的脑部磁共振图像分类系统,其特征在于,包括:数据预处理模块、图像特征提取与处理模块、分类输出模块和系统评估模块,其中:数据预处理模块对采集到的脑部3D MR图像进行格式转换、分割剪裁并生成训练样本集、验证样本集与测试样本集;图像特征提取与处理模块从收到的训练样本集、验证样本集或测试样本集的图像中提取出特征向量;分类输出模块基于全连接层的Softmax激活函数根据特征向量生成分类结果;系统评估模块根据由训练集数据建立的3D MR图像分类模型应用于测试集中,获取测试集各MR图像的类别标签,并与样本的真实类别标签进行比较求取分类预测的准确率、敏感性、特异性和精确度。
2.根据权利要求1所述的基于注意力引导3D神经网络的脑部磁共振图像分类系统,其特征是,所述的格式转换是指:将原始NifTI格式的脑部3D MR图像转换为张量形式,并将张量矩阵的数值X缩放至较小的区间里:
Figure FDA0003958816620000011
其中:Xnorm为标准化后的张量矩阵,X为初始张量矩阵,μX为所有张量矩阵的平均值,σX为所有张量矩阵的标准差。
3.根据权利要求1所述的基于注意力引导3D神经网络的脑部磁共振图像分类系统,其特征是,所述的特征向量,通过设置于图像特征提取与处理模块中的卷积层和融合基于空间注意力机制的丢弃层的3D ResNet特征提取网络得到,该特征提取网络利用空间注意力机制将卷积层输出的3D特征图转化为空间注意力权值矩阵,利用Sigmoid激活函数生成空间重要性掩模以及求取空间注意力权值矩阵的最大值,再乘以系数γ获得阈值,从而生成基于空间注意力分配的丢弃掩模;最后依概率随机获取空间重要性掩模或丢弃掩模,并通过空间乘法应用到输入的特征图中并输出经过处理的特征图。
4.根据权利要求3所述的基于注意力引导3D神经网络的脑部磁共振图像分类系统,其特征是,所述的空间注意力机制是指:在深度学习模型中加入类似人眼扫视物体时的注意力机制,其中空间注意力机制具体为:关注于卷积层输出的每个特征图内各区域的注意力权重分配,即通过平均池化层与最大池化层分别获取通道维度上的平均池化特征图与最大池化特征图,并将两类特征图叠加以输入至单卷积核且大小为7×7×7的3D卷积层中,最终输出3D空间注意力权值矩阵。
5.根据权利要求3所述的基于注意力引导3D神经网络的脑部磁共振图像分类系统,其特征是,所述的3D空间注意力权值矩阵Aspatial=Conv3D([AvgPool(Fin);MaxPool(Fin)]),其中:AvgPool和MaxPool分别指通道平均池化与最大池化,[;]表示3D特征图的拼接,Conv3D指3D卷积层。
6.根据权利要求1所述的基于注意力引导3D神经网络的脑部磁共振图像分类系统,其特征是,所述的空间重要性掩模Mimp=σ(Aspatial),其中:σ为Sigmoid激活函数;
所述的基于空间注意力分配的丢弃掩模
Figure FDA0003958816620000021
即空间注意力权值矩阵中大于阈值γ的置为0,其他置为1。
7.一种根据权利要求1-6中任一所述系统的脑部磁共振图像分类方法,其特征在于,包括:
步骤1、3D MR图像数据整理与预处理,其中图像数据包含AD样本98例,NC样本114例,具体包括:
1.1)基于Python将原NifTI格式的图像数据转换为张量形式,利用Python的deepbrain与skimage库对数据进行颅骨剥离、背景剪裁以及尺寸缩放,获得64×64×64的3D图像数据;
1.2)处理后的数据80%的比例随机划分为训练样本集用于训练分类预测模型,其中又划分出10%的比例用于训练过程中模型的验证;余下20%的比例为测试集用于模型最终的测试与结果对比;
1.3)分别对训练集和测试集的数据进行标准化,采用方法:
Figure FDA0003958816620000022
其中:对于训练集或测试集来说,Xnorm为标准化后的张量矩阵,X为初始张量矩阵,μX为所有张量矩阵的平均值,σX为所有张量矩阵的标准差;
步骤2、将残差网络扩展为三维结构,构建3D ResNet特征提取模型,具体包括:
2.1)选取ResNet50作为基础网络架构,将ResNet的输入层扩充至接收3D图像数据,即(Height,Width,Depth)三个通道;将原ResNet50中的2D卷积层拓展至3D卷积层,即卷积层中的卷积核也具有(Height,Width,Depth)三个维度;在网络模型的最后加入3D全局平均池化层将卷积层输出的3D特征图压缩成1D特征向量;
所述的3D全局平均池化是指:针对卷积层提取的3D特征进行平均池化操作,其通过取每个特征图的平均值将3D特征图压缩为一个特征值,将不同特征值组合成1D特征向量,作为分类输出模块的输入;
步骤3、在3D ResNet卷积层之后增加基于空间注意力的丢弃层,该丢弃层先计算输出特征图的空间注意力权重,并分别产生重要性掩模与丢弃掩模;在训练的每次迭代依概率β选择将重要性掩模与输入特征图相乘获得空间注意力权重增强的新特征图,或是将丢弃掩模与输入特征图相乘获得重要性区域特征值为0的新特征图,以解决模型训练时的过拟合问题;
步骤4、将经由3D ResNet全局平均池化层输出的特征向量输入至分类输出模块的全连接层,利用Softmax激活函数将特征向量映射至图像类别空间,输出3D MR图像最终的分类结果与相应的概率;
步骤5、利用系统评估模块中设置的准确率、敏感性、特异性和精确度指标对训练好的图像分类模型在测试集上的分类结果进行评估,输出各指标的评价结果。
8.根据权利要求7所述的脑部磁共振图像分类方法,其特征是,所述的准确率是指:根据样本的真实类别标签,所有预测正确的样本数量占全体样本数量的比值,准确率具体为:
Figure FDA0003958816620000031
其中:TP为实际是正类别,模型正确预测为正类别的数量;TN为实际是负类别,模型正确预测为负类别的数量;FP为实际是负类别,模型错误预测为正类别的数量;FN为实际是正类别,模型错误预测为负类别的数量;
所述的敏感性是指:在所有实际正类别中,被模型正确预测为正类别的比例为敏感性,也称作真阳性率;该敏感性具体为:
Figure FDA0003958816620000032
其中:TP为实际为正类别,模型正确预测为正类别的数量;FN为实际为正类别,模型错误预测为负类别的数量;
所述的特异性是指:在所有实际负类别中,被模型正确预测为负类别的比例为特异性,也称作真阴性率;该特异性具体为:
Figure FDA0003958816620000033
其中:TN为实际为负类别,模型正确预测为负类别的数量;FP为实际为负类别,模型错误预测为正类别的数量;
所述的精确度是指:在模型预测的所有正类别中,真正属于正类别的比例为精确度;该精确度具体为:
Figure FDA0003958816620000034
其中:TP为实际为正类别,模型正确预测为正类别的数量;FP为实际为负类别,模型错误预测为正类别的数量。
CN202211471897.7A 2022-11-23 2022-11-23 基于注意力引导3d神经网络的脑部磁共振图像分类系统 Pending CN115908923A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211471897.7A CN115908923A (zh) 2022-11-23 2022-11-23 基于注意力引导3d神经网络的脑部磁共振图像分类系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211471897.7A CN115908923A (zh) 2022-11-23 2022-11-23 基于注意力引导3d神经网络的脑部磁共振图像分类系统

Publications (1)

Publication Number Publication Date
CN115908923A true CN115908923A (zh) 2023-04-04

Family

ID=86485612

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211471897.7A Pending CN115908923A (zh) 2022-11-23 2022-11-23 基于注意力引导3d神经网络的脑部磁共振图像分类系统

Country Status (1)

Country Link
CN (1) CN115908923A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078996A (zh) * 2023-06-26 2023-11-17 江南大学 基于渐进式混合特征图识别直肠癌的系统、介质、设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078996A (zh) * 2023-06-26 2023-11-17 江南大学 基于渐进式混合特征图识别直肠癌的系统、介质、设备

Similar Documents

Publication Publication Date Title
CN108765383B (zh) 基于深度迁移学习的视频描述方法
CN114201592B (zh) 面向医学图像诊断的视觉问答方法
CN111242948B (zh) 图像处理、模型训练方法、装置、设备和存储介质
CN111428818A (zh) 基于神经通路激活状态的深度学习模型测试方法与装置
CN113239869B (zh) 基于关键帧序列和行为信息的两阶段行为识别方法及系统
CN109919252B (zh) 利用少数标注图像生成分类器的方法
CN110889450B (zh) 超参数调优、模型构建方法和装置
CN113314205A (zh) 一种高效的医学影像标注与学习系统
CN113111968A (zh) 图像识别模型训练方法、装置、电子设备和可读存储介质
CN115270752A (zh) 一种基于多层次对比学习的模板句评估方法
CN116807447B (zh) 动态脑网络的脑龄预测建模方法、认知提升方法及系统
CN115587985A (zh) 组织病理图像细胞核分割以及染色风格规范化方法
CN110097096A (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
CN117688974B (zh) 基于知识图谱的生成式大模型建模方法、系统及设备
US20150242676A1 (en) Method for the Supervised Classification of Cells Included in Microscopy Images
CN109508640A (zh) 一种人群情感分析方法、装置和存储介质
CN115908923A (zh) 基于注意力引导3d神经网络的脑部磁共振图像分类系统
JP4143234B2 (ja) 文書分類装置、文書分類方法及び記憶媒体
CN113486202A (zh) 小样本图像分类的方法
CN109859244B (zh) 一种基于卷积稀疏滤波的视觉跟踪方法
CN117689754A (zh) 一种基于人脑功能磁共振成像的潜在模型图像重建方法、系统、设备及介质
CN117371511A (zh) 图像分类模型的训练方法、装置、设备及存储介质
CN111062484A (zh) 基于多任务学习的数据集选取方法及装置
Bhattacharjya et al. A genetic algorithm for intelligent imaging from quantum-limited data
CN115690872A (zh) 基于特征融合的表情识别模型的训练方法及识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination