CN110910366B - 基于3d cam的大脑核磁共振异常图像的可视化方法 - Google Patents
基于3d cam的大脑核磁共振异常图像的可视化方法 Download PDFInfo
- Publication number
- CN110910366B CN110910366B CN201911130121.7A CN201911130121A CN110910366B CN 110910366 B CN110910366 B CN 110910366B CN 201911130121 A CN201911130121 A CN 201911130121A CN 110910366 B CN110910366 B CN 110910366B
- Authority
- CN
- China
- Prior art keywords
- layer
- convolution
- feature map
- pooling
- pool
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005481 NMR spectroscopy Methods 0.000 title claims abstract description 34
- 210000004556 brain Anatomy 0.000 title claims abstract description 34
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 30
- 238000007794 visualization technique Methods 0.000 title claims abstract description 8
- 239000013598 vector Substances 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 238000012800 visualization Methods 0.000 claims abstract description 7
- 230000000007 visual effect Effects 0.000 claims abstract description 3
- 238000011176 pooling Methods 0.000 claims description 66
- 210000002569 neuron Anatomy 0.000 claims description 53
- 238000000034 method Methods 0.000 claims description 30
- 238000010586 diagram Methods 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 230000005284 excitation Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 230000001351 cycling effect Effects 0.000 claims description 2
- 238000004445 quantitative analysis Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 abstract description 2
- 238000011160 research Methods 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 191
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000971 hippocampal effect Effects 0.000 description 2
- 210000001320 hippocampus Anatomy 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101000831205 Danio rerio Dynein axonemal assembly factor 11 Proteins 0.000 description 1
- 102100024282 Dynein axonemal assembly factor 11 Human genes 0.000 description 1
- 241001559542 Hippocampus hippocampus Species 0.000 description 1
- 101000831210 Homo sapiens Dynein axonemal assembly factor 11 Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30016—Brain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于3D CAM的大脑核磁共振异常图像的可视化方法,采集患者的脑核磁共振异常图像作为训练样本‑利用训练样本对3D CAM模型进行训练,得到训练后的网络参数即系数矩阵W和偏倚向量b值‑根据不同的磁共振图像创建可视化热度图。在传统CAM模型的基础上对患者的大脑核磁共振异常图像进行处理,实现自动识别检测且可视化效果良好的,便于辅助医学研究者定量分析和研究。
Description
技术领域
本发明属于核磁共振图像病症可视化技术领域,具体涉及一种基于3D CAM的大脑核磁共振异常图像的可视化方法。
背景技术
从2006年Hinton等人在Science上提出了深度学习以来,深度学习就广泛被人们所接受和研究。这篇文章最关键的创新点来自于将神经网络的层数提高,以及数据量的极大增多,以此发挥了神经网络对于大数据处理的能力和提取图像特征的能力。另外,神经网络的成功也离不开计算机硬件的高速发展,GPU的出现使得训练多层隐藏层和大批量数据成为可能,从而使得神经网络逐渐在计算机视觉、音视频处理、自然语言处理、精确导航等各个领域取得了巨大的成就。
学术界一直在研究神经网络到底在学习到了什么东西,也就是所谓的特征,比如采用反卷积(Deconvolution)和导向反向传播(Guided-back-propagation)。虽然能在这些反向传播的图像上看到一定的图像类别的轮廓,但是基本看不到模型学到了什么东西。CAM是class activation map的缩写,类激活映射网络CAM模型通常与卷积神经网络结合在一起使用,它将神经网络经过多次卷积和池化之后的特征图,进行了综合,以单个神经元的形式进行配比,以热度图的形式显示相应感兴趣的区域。CAM模型通常被应用于二维日常图片上,从识别区域的准确性和意义来看,定量分析准确。
发明内容
本发明的目的就是针对上述技术的不足,提供一种自动识别检测且可视化效果良好的基于3D CAM的大脑核磁共振异常图像的可视化方法。
为实现上述目的,本发明所设计的基于3D CAM的大脑核磁共振异常图像的可视化方法,具体如下:
1)采集患者的脑核磁共振异常图像作为训练样本;
2)利用训练样本对3D CAM模型进行训练,得到训练后的网络参数即系数矩阵W和偏倚向量b值;
21)构建3D CAM模型,并随机初始化网络参数
构建3D CAM模型,该3D CAM模型包括输入层、卷积层、池化层、全局平均池化层、全连接层及输出层,并对3D CAM模型初始化,即初始化所有隐藏层与输出层所对应的系数矩阵W和偏倚向量b值,使系数矩阵W和偏倚向量b值为一个初始的随机值;
22)3D CAM网络第一次正向迭代;
23)3D CAM网络第一次反向迭代;
24)循环步骤22)和步骤23)进行多次迭代,不断更新神经网络的参数,直至所有权重Wl,偏置bl的变化值都小于停止迭代阈值ε时停止迭代,即确定了最终各隐藏层与输出层的权重Wl和偏置bl;
25)采用全连接层连接步骤227)每一张池化后特征图所对应的数据值形成一个特征向量,将特征向量分类输送至输出层并输出多个类别;
3)根据不同的磁共振图像创建可视化热度图
31)提取训练后3D CAM模型中步骤25)全连接层的所有权重w;
32)将步骤227)全局平均池化后特征图中乘以其相应的权重wj;
33)将得到多张热力图进行热力图归一化,展开成所需患者的原大脑核磁共振异常图像的大小,将特征图相加,然后按某一维度进行图像二维显示,实现了基于3D CAM的大脑核磁共振异常图像的可视化。
进一步地,所述步骤22)中,具体过程如下
221)大脑核磁共振异常图像作为输入层
n张患者的大脑核磁共振异常图像依次堆叠形成一个3D MRI图像,该3D MRI图像作为3D CAM模型的输入层,输入层采用的是分辨率大小为H×L×D的3D MRI图像,H代表的是3D MRI图像的高度,L代表的是3D MRI图像的宽度,D代表的是3D MRI图像的深度;将MRI图像的像素点进行顺序排列,用来作为输入层神经元的值,假设神经网络的输入层神经元输入为向量向量/>中的每个元素xi的值即对应着输入层对应的每个神经元i,神经元的输出值ai,1也是输入向量/>本身;
222)卷积层Conv 1a层采用N个大小F0为H0×L0×D0的三维卷积核对步骤1)患者的大脑核磁共振异常图像进行三维卷积,获取Conv 1a层三维卷积后特征图,其中H0远小于H、L0远小于L、D0远小于D
卷积层Conv 1a层的三维卷积核的个数为N个、尺寸大小F0为H0×L0×D0,步长stride记为SC1,特征图填充圈数为padding-F1,3D MRI图像作为3D CAM网络的输入层,采用N个三维卷积核对步骤221)中3D MRI图像进行三维卷积,有多少个卷积核,可以得到多少个特征图像,因此得到了数量为N的Conv 1a层三维卷积后特征图,分辨率大小为Hc1×Lc1×Dc1,即:
Hc1=(H-F0+2×Padding-F1)/SC1+1
Lc1=(L-F0+2×Padding-F1)/SC1+1
Dc1=(D-F0+2×Padding-F1)/SC1+1
由于整个神经网络也是全连接网络,每个隐藏层的每个神经元都有连接到上一层神经元的权重和偏置bl,其中/>代表从l-1层的第i个神经元到l层第j个神经元之间的连接权重,也可记为Wl,bl代表从l-1层到l层的偏置;因此Conv 1a层在采用N个三维卷积核对步骤221)中3D MRI图像进行三维卷积时,可以得到该卷积层的神经元连接到输入层神经元的的权重为Wl(W2),一个偏置为bl(b2),Conv 1a层的输出为ai,2=σ(zi,2)=σ(W2ai,1+b2),其中σ为激励函数Relu,ai,l代表第l层的第i个神经元输出值;
223)池化层的Pool 1层对Conv 1a层三维卷积后特征图进行池化
池化层的Pool 1层采用池化核尺寸大小为p0,步长Stride记为SP1,特征图填充圈数为padding-P1,对Conv 1a层所得到的每一张三维卷积后特征图进行降维采样,得到Pool1层池化后特征图,即N张分辨率大小Hp1×Lp1×Sp1的图像:
Hp1=(Hc1-p0+2×Padding-P1)/SP1+1
Lp1=(Lc1-p0+2×Padding-P1)/SP1+1
Dp1=(Dc1-p0+2×Padding-P1)/SP1+1
Pool 1层在池化Conv 1a层三维卷积后所得到的特征图过程中,没有涉及参数W及b,而是按照池化区域大小和最大池化标准将输入张量a缩小的过程,即所得到的输出张量为ai,3=pool(ai,2);
224)卷积层Conv 2a层对Pool 1层池化后特征图进行二次三维卷积
卷积层Conv 2a层的三维卷积核的个数为2N个、尺寸大小F0为H0×L0×D0,步长stride记为SC2,特征图填充圈数为padding-F2,对Pool 1层每一张池化后特征图进行二次三维卷积得到2N个Conv 2a层三维卷积后特征图,分辨率大小为Hc2×Lc2×Sc2,即:
Hc2=(Hc1-F0+2×Padding-F2)/SC2+1
Lc2=(Lc1-F0+2×Padding-F2)/SC2+1
Dc2=(Dc1-F0+2×Padding-F2)/SC2+1
Conv 2a层采用2N个三维卷积核对Pool 1后每一张池化后特征图卷积时,得到的该卷积层的神经元连接到Pool 1层神经元的权重Wl(W2),以及一个偏置bl(b2),Conv 2a层的输出为ai,4=σ(zi,4)=σ(W4*ai,3+b4);
225)池化层的Pool 2层对Conv 2a层三维卷积后特征图进行池化
池化层的Pool 2层采用池化核尺寸大小为p0,步长stride记为SP2,特征图填充圈数为padding-P2,对Conv 2a层所得到的每一张三维卷积后特征图进行降维采样得到Pool2层池化后特征图,即2N张分辨率大小Hp2×Lp2×Sp2的图像:
Hp2=(Hc2-p0+2×Padding-P2)/SP2+1
Lp2=(Lc2-p0+2×Padding-P2)/SP2+1
Dp2=(Dc2-p0+2×Padding-P2)/SP2+1
在Pool 2层池化Conv 2a层三维卷积后所得到的特征图过程中,没有W、b参数,而是按照池化区域大小和最大池化标准将输入张量a缩小的过程,即所得到的输出张量为ai,5=pool(ai,4);
226)至少重复一次步骤224)和重复一次步骤225)(即可以卷积一次后池化一次,也可以卷积多次后池化一次)且循环多次直至完成预设的卷积、池化层数后,停止卷积和池化;
227)对步骤226)中最后一层池化后特征图进行全局平均池化操作
对最后一层池化后特征图中的每一张池化后特征图计算所有像素点的均值,输出每一张池化后特征图的数据值。
进一步地,所述步骤23)中,具体过程如下:
神经网络反向传播过程中,在计算每个神经元的误差项δ时,首先需要计算该层每个神经元与其相连的下一层神经元的之间的误差项δ,即当前层的误差用下一层的误差来表示;
反向传播计算误差项必须先从输出层开始,全连接层其误差为δi,l=(Wl+1)T*δi,l+1⊙σ'(zi,l),然后依次反向计算每个隐藏层的误差,全局平均池化层根据全连接层其误差反向计算误差δi,l=upsample(δi,l+1)⊙σ'(zi,l),下一个池化层反向也是根据全局平均池化层的误差计算,卷积层根据上一个池化层的误差计算δi,l=δi,l+1*rot180(Wl+1)⊙σ'(zi,l),反向池化—卷积—...—池化—卷积误差计算,直至与输入层相连的Conv 1a层;
当所有神经元的反向传播误差项计算完毕后,就更新从l=2层到输出层的L层的所有的权重Wl和偏置bl项:更新每一卷积层网络参数时都有:更新到全连接层网络参数时有:/>α为学习速率,是一个常数。
进一步地,所述步骤31)中,具体过程如下:
对任一个类别C,每一个特征图k的数据值都有一个对应的权重w,记为b对分类基本没影响,置为0,则一个类别C对应一套全连接层权重为/>多个类别对应多套全连接层权重,然后提取出训练后3D CAM模型中所有类别的全连接层所有权重w。
进一步地,所述步骤32)中,具体过程如下:
输出层分类的结果可以看成是全局平均池化后特征图与相应权重的乘积即:
其中,代表对C这个类别,每一个特征图k的数据值所对应一个权重;Tk代表特征图k对应的层;
权重就代表了每个特征图对于海马这个类别结果的贡献程度,的值相对较大对结果影响大,值相对较小对结果影响小;
所以多个类别所对应的所有权重与全局平均池化后对应的特征图相乘,最后就得到多个类别热力图。
与现有技术相比,本发明具有以下优点:本发明基于3D CAM的大脑核磁共振异常图像的可视化方法,在传统CAM模型的基础上对患者的大脑核磁共振异常图像进行处理,实现自动识别检测且可视化效果良好的,便于辅助医学研究者定量分析和研究。
附图说明
图1是本发明中3D CAM模型示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的详细说明。
一种基于3D CAM的大脑核磁共振异常图像的可视化方法,具体方法如下:
1)采集患者的脑核磁共振异常图像作为训练样本;
2)利用训练样本对3D CAM模型进行训练,得到训练后的网络参数即系数矩阵W和偏倚向量b值
21)构建3D CAM模型,并随机初始化网络参数
构建3D CAM模型,如图1所示该3D CAM模型包括输入层(input layer)、卷积层(convolution layer)、池化层(pooling layer)、全局平均池化层(global averagepooling layer)、全连接层(fully connected layer)及输出层(output layer),并对3DCAM模型初始化,即初始化所有隐藏层与输出层所对应的系数矩阵W和偏倚向量b值,使系数矩阵W和偏倚向量b值为一个初始的随机值;
22)3D CAM第一次正向迭代
221)大脑核磁共振异常图像作为输入层
n张患者的大脑核磁共振异常图像依次堆叠形成一个3D MRI图像,该3D MRI图像作为3D CAM模型的输入层,输入层采用的是分辨率大小为H×L×D(如32×32×32)的3DMRI图像,H代表的是3D MRI图像的高度,L代表的是3D MRI图像的宽度,D代表的是3D MRI图像的深度;将MRI图像的像素点进行顺序排列,用来作为输入层(l=1)神经元的值,假设神经网络的输入层神经元输入为向量向量/>中的每个元素xi的值即对应着输入层对应的每个神经元i,神经元的输出值ai,1也是输入向量/>本身;
222)卷积层Conv 1a层采用N(如20)个大小F0为H0×L0×D0(如5×5×5)的三维卷积核对步骤1)的大脑核磁共振异常图像进行三维卷积,获取Conv 1a层三维卷积后特征图,其中H0远小于H、L0远小于L、D0远小于D
卷积层作为整个3D CAM的核心层,最重要的特点就是在整个3D MRI图像中卷积核共享权值,这样大大减少了参数和计算量;卷积层Conv 1a层的三维卷积核的个数为N(如20)个、尺寸大小F0为H0×L0×D0(如5×5×5),步长stride记为SC1(如1),为了保持卷积后输出的三维特征图大小与输入层的图像大小保持不变,也保持了图像边界信息,特征图填充圈数为padding-F1(如2),3D MRI图像作为3D CAM网络的输入层,采用N(如20)个三维卷积核对步骤221)中3D MRI图像进行三维卷积,有多少个卷积核,可以得到多少个特征图像,因此得到了数量为N(如20)的Conv 1a层三维卷积后特征图,分辨率大小为Hc1×Lc1×Dc1(如32×32×32),即:
Hc1=(H-F0+2×Padding-F1)/SC1+1
Lc1=(L-F0+2×Padding-F1)/SC1+1
Dc1=(D-F0+2×Padding-F1)/SC1+1
由于整个神经网络也是全连接网络,每个隐藏层的每个神经元都有连接到上一层神经元的权重和偏置bl,其中/>代表从l-1层的第i个神经元到l层第j个神经元之间的连接权重,也可记为Wl,bl代表从l-1层到l层的偏置;因此Conv 1a层在采用N(如20)个三维卷积核对步骤221)中3D MRI图像进行三维卷积时,可以得到该卷积层的神经元连接到输入层神经元的的权重为Wl(W2),一个偏置为bl(b2),Conv 1a(l=2)层的输出为ai,2=σ(zi,2)=σ(W2ai,1+b2),其中σ为激励函数Relu,ai,l代表第l层的第i个神经元输出值;
223)池化层的Pool 1层对Conv 1a层三维卷积后特征图进行池化
池化层的Pool 1层采用池化核尺寸大小为p0(如3×3×3),步长Stride记为SP1(如1),特征图填充圈数为padding-P1(如1),对Conv1a层所得到的每一张三维卷积后特征图进行降维采样得到Pool 1层池化后特征图,即N张分辨率大小Hp1×Lp1×Sp1(如32×32×32)的图像:
Hp1=(Hc1-p0+2×Padding-P1)/SP1+1
Lp1=(Lc1-p0+2×Padding-P1)/SP1+1
Dp1=(Dc1-p0+2×Padding-P1)/SP1+1
Pool 1(l=3)层在池化Conv 1a层三维卷积后所得到的特征图过程中,没有涉及参数W及b,而是按照池化区域大小和最大池化标准将输入张量a缩小的过程,即所得到的输出张量为ai,3=pool(ai,2);
224)卷积层Conv 2a层对Pool 1层池化后特征图进行二次三维卷积
卷积层Conv 2a层的三维卷积核的个数为2N(如40)个、尺寸大小F0为H0×L0×D0(如5×5×5),步长stride记为SC2(如1),特征图填充圈数为padding-F2(如2),对Pool 1层每一张池化后特征图进行二次三维卷积得到2N(如40)个Conv 2a层三维卷积后特征图,分辨率大小为Hc2×Lc2×Sc2(如32×32×32),即:
Hc2=(Hc1-F0+2×Padding-F2)/SC2+1
Lc2=(Lc1-F0+2×Padding-F2)/SC2+1
Dc2=(Dc1-F0+2×Padding-F2)/SC2+1
Conv 2a(l=4)层采用N(如20)个三维卷积核对Pool 1后每一张池化后特征图卷积时,得到的该卷积层的神经元连接到Pool 1层神经元的权重Wl(W2),以及一个偏置bl(b2),Conv 2a(l=4)层的输出为ai,4=σ(zi,4)=σ(W4*ai,3+b4);
225)池化层的Pool 2层对Conv 2a层三维卷积后特征图进行池化
池化层的Pool 2层采用池化核尺寸大小为p0(如3×3×3),步长Stride记为SP2(如2),特征图填充圈数为padding-P2(如0),对Conv 2a层所得到的每一张三维卷积后特征图进行降维采样得到Pool 2层池化后特征图,即2N(如40)张分辨率大小Hp2×Lp2×Sp2(如16×16×16)的图像:
Hp2=(Hc2-p0+2×Padding-P2)/SP2+1
Lp2=(Lc2-p0+2×Padding-P2)/SP2+1
Dp2=(Dc2-p0+2×Padding-P2)/SP2+1
在Pool 2(l=5)层池化Conv 2a层三维卷积后所得到的特征图过程中,没有W、b参数,而是按照池化区域大小和最大池化标准将输入张量a缩小的过程,即所得到的输出张量为ai,5=pool(ai,4);
226)至少重复一次步骤224)和重复一次步骤225)(即可以卷积一次后池化一次,也可以卷积几次后池化一次)且循环多次直至完成提前设定的卷积、池化层数后,停止卷积和池化,本次操作采用7次卷积和5次池化,如下:
227)对步骤226)中最后一层池化后特征图进行全局平均池化操作
对最后一层池化后特征图中的每一张池化后特征图计算所有像素点的均值,输出每一张池化后特征图的数据值;
23)3D CAM网络第一次反向迭代
神经网络反向传播过程中,在计算每个神经元的误差项δ时,首先需要计算该层每个神经元与其相连的下一层神经元的之间的误差项δ,即当前层的误差用下一层的误差来表示;
反向传播计算误差项必须先从输出层开始,全连接层其误差为δi,l=(Wl+1)T*δi,l+1⊙σ'(zi,l),然后依次反向计算每个隐藏层的误差,全局平均池化层根据全连接层其误差反向计算误差δi,l=upsample(δi,l+1)⊙σ'(zi,l),下一个池化层反向也是根据全局平均池化层的误差计算,卷积层根据上一个池化层的误差计算δi,l=δi,l+1*rot180(Wl+1)⊙σ'(zi,l),反向池化—卷积—...—池化—卷积误差计算,直至与输入层相连的Conv 1a层;
当所有神经元的反向传播误差项计算完毕后,就更新从l=2层到输出层的L层的所有的权重Wl和偏置bl项:更新每一卷积层网络参数时都有:
更新到全连接层网络参数时有:α为学习速率,是一个常数;
24)循环步骤22)和步骤23)进行多次迭代,不断更新神经网络的参数,直至所有权重Wl,偏置bl的变化值都小于停止迭代阈值ε时停止迭代,即确定了最终各隐藏层与输出层的权重Wl和偏置bl;
25)采用全连接层连接步骤227)每一张池化后特征图所对应的数据值形成一个特征向量,将特征向量分类输送至输出层并输出多个类别;
步骤3)根据不同的磁共振图像创建可视化热度图
31)提取训练后3D CAM模型中步骤25)全连接层的所有权重w
对任一个类别C,每一个特征图k的数据值都有一个对应的权重w,记为b对分类基本没影响,置为0,则一个类别C对应一套全连接层权重为/>多个类别对应多套全连接层权重,然后提取出训练后3D CAM模型中所有类别的全连接层所有权重w;
32)将步骤227)全局平均池化后特征图中乘以其相应的权重wj
输出层分类的结果可以看成是全局平均池化后特征图与相应权重的乘积即:
其中,代表对C这个类别,每一个特征图k的数据值所对应一个权重;Tk代表特征图k对应的层;
如:假设其中一个分类的结果是大脑MRI图像的海马区域,将海马这个类别所对应的所有权重提取出来,与全局平均池化后对应的特征图相乘,最后就得到海马这个类的热力图,如下:
权重就代表了每个特征图对于海马这个类别结果的贡献程度,的值相对较大对结果影响大,值相对较小对结果影响小;
所以多个类别所对应的所有权重与全局平均池化后对应的特征图相乘,最后就得到多个类别热力图;
33)将得到多张热力图进行热力图归一化,展开成所需的患者的原大脑核磁共振异常图像的大小,将特征图相加,然后按某一维度进行图像二维显示,实现了基于3D CAM的大脑核磁共振异常图像的可视化。
Claims (4)
1.一种基于3D CAM的大脑核磁共振异常图像的可视化方法,其特征在于:所述可视化方法具体如下:
1)采集患者的脑核磁共振异常图像作为训练样本;
2)利用训练样本对3D CAM模型进行训练,得到训练后的网络参数即系数矩阵W和偏移向量b值
21)构建3D CAM模型,并随机初始化网络参数
构建3D CAM模型,该3D CAM模型包括输入层、卷积层、池化层、全局平均池化层、全连接层及输出层,并对3D CAM模型初始化,即初始化所有隐藏层与输出层所对应的系数矩阵W和偏移向量b值,使系数矩阵W和偏移向量b值为一个初始的随机值;
22)3D CAM网络第一次正向迭代;
所述步骤22)中,具体过程如下:
221)大脑核磁共振异常图像作为输入层
n张患者的大脑核磁共振异常图像依次堆叠形成一个3D MRI图像,该3D MRI图像作为3D CAM模型的输入层,输入层采用的是分辨率大小为H×L×D的3D MRI图像,H代表的是3DMRI图像的高度,L代表的是3D MRI图像的宽度,D代表的是3D MRI图像的深度;将MRI图像的像素点进行顺序排列,用来作为输入层神经元的值,假设神经网络的输入层神经元输入为向量向量/>中的每个元素xi的值即对应着输入层对应的每个神经元i,神经元的输出值ai,1也是输入向量/>本身;
222)卷积层Conv 1a层采用N个分辨率大小F0为H0×L0×D0的三维卷积核对步骤1)的大脑核磁共振异常图像进行三维卷积,获取Conv 1a层三维卷积后特征图,其中H0远小于H、L0远小于L、D0远小于D
卷积层Conv 1a层的三维卷积核的个数为N个、尺寸大小F0为H0×L0×D0,步长stride记为SC1,特征图填充圈数为padding-F1,3DMRI图像作为3D CAM网络的输入层,采用N个三维卷积核对步骤221)中3D MRI图像进行三维卷积,有多少个卷积核,可以得到多少个特征图像,因此得到了数量为N的Conv 1a层三维卷积后特征图,分辨率大小为Hc1×Lc1×Dc1,即:
Hc1=(H-F0+2×Padding-F1)/SC1+1
Lc1=(L-F0+2×Padding-F1)/SC1+1
Dc1=(D-F0+2×Padding-F1)/SC1+1
由于整个神经网络也是全连接网络,每个隐藏层的每个神经元都有连接到上一层神经元的权重和偏置bl,其中/>代表从l-1层的第i个神经元到l层第j个神经元之间的连接权重,也可记为Wl,bl代表从l-1层到l层的偏置;因此Conv 1a层在采用N个三维卷积核对步骤221)中3D MRI图像进行三维卷积时,可以得到该卷积层的神经元连接到输入层神经元的的权重为Wl(W2),一个偏置为bl(b2),Conv 1a层的输出为ai,2=σ(zi,2)=σ(W2ai,1+b2),其中σ为激励函数Relu,ai,l代表第l层的第i个神经元输出值;
223)池化层的Pool 1层对Conv 1a层三维卷积后特征图进行池化
池化层的Pool 1层采用池化核尺寸大小为p0,步长Stride记为SP1,特征图填充圈数为padding-P1,对Conv 1a层所得到的每一张三维卷积后特征图进行降维采样得到Pool 1层池化后特征图,即N张分辨率大小Hp1×Lp1×Dp1的图像:
Hp1=(Hc1-p0+2×Padding-P1)/SP1+1
Lp1=(Lc1-p0+2×Padding-P1)/SP1+1
Dp1=(Dc1-p0+2×Padding-P1)/SP1+1
Pool 1层在池化Conv 1a层三维卷积后所得到的特征图过程中,没有涉及参数W及b,而是按照池化区域大小和最大池化标准将输入张量a缩小的过程,即所得到的输出张量为ai,3=pool(ai,2);
224)卷积层Conv 2a层对Pool 1层池化后特征图进行二次三维卷积
卷积层Conv 2a层的三维卷积核的个数为2N个、尺寸大小F0为H0×L0×D0,步长stride记为SC2,特征图填充圈数为padding-F2,对Pool 1层每一张池化后特征图进行二次三维卷积得到2N个Conv2a层三维卷积后特征图,分辨率大小为Hc2×Lc2×Dc2,即:
Hc2=(Hc1-F0+2×Padding-F2)/SC2+1
Lc2=(Lc1-F0+2×Padding-F2)/SC2+1
Dc2=(Dc1-F0+2×Padding-F2)/SC2+1
Conv 2a层采用2N个三维卷积核对Pool 1后每一张池化后特征图卷积时,得到的该卷积层的神经元连接到Pool 1层神经元的权重Wl(W2),以及一个偏置bl(b2),Conv 2a层的输出为ai,4=σ(zi,4)=σ(W4*ai,3+b4);
225)池化层的Pool 2层对Conv 2a层三维卷积后特征图进行池化
池化层的Pool 2层采用池化核尺寸大小为p0,步长stride记为SP2,特征图填充圈数为padding-P2,对Conv 2a层所得到的每一张三维卷积后特征图进行降维采样得到Pool 2层池化后特征图,即2N张分辨率大小Hp2×Lp2×Dp2的图像:
Hp2=(Hc2-p0+2×Padding-P2)/SP2+1
Lp2=(Lc2-p0+2×Padding-P2)/SP2+1
Dp2=(Dc2-p0+2×Padding-P2)/SP2+1
在Pool 2层池化Conv 2a层三维卷积后所得到的特征图过程中,没有W、b参数,而是按照池化区域大小和最大池化标准将输入张量a缩小的过程,即所得到的输出张量为ai,5=pool(ai,4);
226)至少重复一次步骤224)和重复一次步骤225)且循环多次直至完成预设的卷积、池化层数后,停止卷积和池化;
227)对步骤226)中最后一层池化后特征图进行全局平均池化操作
对最后一层池化后特征图中的每一张池化后特征图计算所有像素点的均值,输出每一张池化后特征图的数据值;
23)3D CAM网络第一次反向迭代;
24)循环步骤22)和步骤23)进行多次迭代,不断更新神经网络的参数,直至所有权重Wl,偏置bl的变化值都小于停止迭代阈值ε时停止迭代,即确定了最终各隐藏层与输出层的权重Wl和偏置bl;
25)采用全连接层连接步骤227)每一张池化后特征图所对应的数据值形成一个特征向量,将特征向量分类输送至输出层并输出多个类别;
步骤3)根据不同的磁共振图像创建可视化热度图
31)提取训练后3D CAM模型中步骤25)全连接层的所有权重w;
32)将步骤227)全局平均池化后特征图中乘以其相应的权重wj;
33)将得到多张热力图进行热力图归一化,展开成所需的患者的原大脑核磁共振异常图像的大小,将特征图相加,然后按某一维度进行图像二维显示,实现了基于3D CAM的大脑核磁共振异常图像的可视化。
2.根据权利要求1所述基于3D CAM的大脑核磁共振异常图像的可视化方法,其特征在于:所述步骤23)中,具体过程如下:
神经网络反向传播过程中,在计算每个神经元的误差项δ时,首先需要计算当前层每个神经元与其相连的下一层神经元的之间的误差项δ,即当前层的误差用下一层的误差来表示;
反向传播计算误差项必须先从输出层开始,全连接层其误差为δi,l=(Wl+1)T*δi,l+1⊙σ'(zi,l),然后依次反向计算每个隐藏层的误差,全局平均池化层根据全连接层其误差反向计算误差δi,l=upsample(δi,l+1)⊙σ'(zi,l),下一个池化层反向也是根据全局平均池化层的误差计算,卷积层根据上一个池化层的误差计算δi,l=δi,l+1*rot180(Wl+1)⊙σ'(zi,l),反向池化—卷积—...—池化—卷积误差计算,直至与输入层相连的Conv 1a层;
当所有神经元的反向传播误差项计算完毕后,就更新从l=2层到输出层的L层的所有的权重Wl和偏置bl项:更新每一卷积层网络参数时都有:更新到全连接层网络参数时有:/>α为学习速率,是一个常数。
3.根据权利要求1所述基于3D CAM的大脑核磁共振异常图像的可视化方法,其特征在于:所述步骤31)中,具体过程如下:
对任一个类别C,每一个特征图k的数据值都有一个对应的权重w,记为b对分类基本没影响,置为0,则一个类别C对应一套全连接层权重为W1 c、/>......、/>多个类别对应多套全连接层权重,然后提取出训练后3D CAM模型中所有类别的全连接层所有权重w。
4.根据权利要求1所述基于3D CAM的大脑核磁共振异常图像的可视化方法,其特征在于:所述步骤32)中,具体过程如下:
输出层分类的结果可以看成是全局平均池化后特征图与相应权重的乘积即:
其中,代表对C这个类别,每一个特征图k的数据值所对应一个权重;Tk代表特征图k对应的层;
权重就代表了每个特征图对于这个类别结果的贡献程度,的值相对较大对结果影响大,值相对较小对结果影响小;
所以多个类别所对应的所有权重与全局平均池化后对应的特征图相乘,最后就得到多个类别热力图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911130121.7A CN110910366B (zh) | 2019-11-18 | 2019-11-18 | 基于3d cam的大脑核磁共振异常图像的可视化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911130121.7A CN110910366B (zh) | 2019-11-18 | 2019-11-18 | 基于3d cam的大脑核磁共振异常图像的可视化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110910366A CN110910366A (zh) | 2020-03-24 |
CN110910366B true CN110910366B (zh) | 2023-10-24 |
Family
ID=69817789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911130121.7A Active CN110910366B (zh) | 2019-11-18 | 2019-11-18 | 基于3d cam的大脑核磁共振异常图像的可视化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110910366B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111709958A (zh) * | 2020-06-22 | 2020-09-25 | 天水市第一人民医院 | 基于3d cam的大脑核磁共振异常图像的可视化方法 |
CN112420174A (zh) * | 2020-11-04 | 2021-02-26 | 湖北工业大学 | 基于3D Grad-CAM的自闭症大脑磁共振图像可视化方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108594321A (zh) * | 2018-05-02 | 2018-09-28 | 深圳市唯特视科技有限公司 | 一种基于数据增强的弱监督目标定位方法 |
CN109615574A (zh) * | 2018-12-13 | 2019-04-12 | 济南大学 | 基于gpu和双尺度图像特征比对的中药识别方法及系统 |
CN110009679A (zh) * | 2019-02-28 | 2019-07-12 | 江南大学 | 一种基于多尺度特征卷积神经网络的目标定位方法 |
CN110322509A (zh) * | 2019-06-26 | 2019-10-11 | 重庆邮电大学 | 基于层级类激活图的目标定位方法、系统及计算机设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9289153B2 (en) * | 1998-09-14 | 2016-03-22 | The Board Of Trustees Of The Leland Stanford Junior University | Joint and cartilage diagnosis, assessment and modeling |
-
2019
- 2019-11-18 CN CN201911130121.7A patent/CN110910366B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108594321A (zh) * | 2018-05-02 | 2018-09-28 | 深圳市唯特视科技有限公司 | 一种基于数据增强的弱监督目标定位方法 |
CN109615574A (zh) * | 2018-12-13 | 2019-04-12 | 济南大学 | 基于gpu和双尺度图像特征比对的中药识别方法及系统 |
CN110009679A (zh) * | 2019-02-28 | 2019-07-12 | 江南大学 | 一种基于多尺度特征卷积神经网络的目标定位方法 |
CN110322509A (zh) * | 2019-06-26 | 2019-10-11 | 重庆邮电大学 | 基于层级类激活图的目标定位方法、系统及计算机设备 |
Non-Patent Citations (2)
Title |
---|
Min Lin.et al."Network In Network".《arXiv:1312.4400v3》.2014,全文. * |
毛雷."基于深度卷积网络的MRI图像脑肿瘤自动分割研究".《中国优秀硕士学位论文全文数据库 信息科技辑》.2018,(第12期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN110910366A (zh) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113077471B (zh) | 一种基于u型网络的医学图像分割方法 | |
CN111612754B (zh) | 基于多模态图像融合的mri肿瘤优化分割方法及系统 | |
US10733788B2 (en) | Deep reinforcement learning for recursive segmentation | |
CN111932529B (zh) | 一种图像分类分割方法、装置及系统 | |
JP2019526863A (ja) | ニューラルネットワーク法を用いた画像セグメンテーション | |
CN110619638A (zh) | 一种基于卷积块注意模块的多模态融合显著性检测方法 | |
CN113744275B (zh) | 一种基于特征变换的三维cbct牙齿图像的分割方法 | |
CN109410195B (zh) | 一种磁共振成像脑分区方法及系统 | |
Yang et al. | A deep learning segmentation approach in free‐breathing real‐time cardiac magnetic resonance imaging | |
CN115170582A (zh) | 基于多尺度特征融合和网格注意力机制的肝脏影像分割方法 | |
CN110910366B (zh) | 基于3d cam的大脑核磁共振异常图像的可视化方法 | |
CN115578404A (zh) | 一种基于深度学习的肝脏肿瘤图像增强和分割的方法 | |
CN117649400B (zh) | 一种异常检测框架下的影像组学分析方法及系统 | |
CN116579975A (zh) | 一种卷积神经网络的脑龄预测方法及系统 | |
CN112420174A (zh) | 基于3D Grad-CAM的自闭症大脑磁共振图像可视化方法 | |
CN115393601A (zh) | 一种基于点云数据的三维目标检测方法 | |
CN117523350A (zh) | 基于多模态特征的口腔影像识别方法、系统及电子设备 | |
CN114581459A (zh) | 一种基于改进性3D U-Net模型的学前儿童肺部影像感兴趣区域分割方法 | |
CN116862930B (zh) | 适用于多模态的脑血管分割方法、装置、设备和存储介质 | |
CN117953208A (zh) | 一种基于图的边缘注意力门医学影像分割方法及装置 | |
CN117635625A (zh) | 基于自动数据增强策略和多注意力辅助UNet的胰腺肿瘤分割方法 | |
CN116740081A (zh) | Ct图像中肺血管分割方法、装置、终端设备及介质 | |
CN116486233A (zh) | 一种多光谱双流网络的目标检测方法 | |
CN110992316B (zh) | 基于2d cam的大脑核磁共振异常图像的可视化方法 | |
CN110147715A (zh) | 一种视网膜OCT图像Bruch膜开角自动检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |