CN113256561A - 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法 - Google Patents
一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法 Download PDFInfo
- Publication number
- CN113256561A CN113256561A CN202110429423.5A CN202110429423A CN113256561A CN 113256561 A CN113256561 A CN 113256561A CN 202110429423 A CN202110429423 A CN 202110429423A CN 113256561 A CN113256561 A CN 113256561A
- Authority
- CN
- China
- Prior art keywords
- attention
- map
- branch
- feature
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000007246 mechanism Effects 0.000 title claims abstract description 22
- 210000001035 gastrointestinal tract Anatomy 0.000 title claims abstract description 16
- 238000003745 diagnosis Methods 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 39
- 230000006870 function Effects 0.000 claims abstract description 28
- 230000003902 lesion Effects 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 230000000694 effects Effects 0.000 claims abstract description 6
- 230000035945 sensitivity Effects 0.000 claims abstract description 6
- 238000010586 diagram Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 11
- 108091006146 Channels Proteins 0.000 claims description 9
- 230000000968 intestinal effect Effects 0.000 claims description 9
- 208000037062 Polyps Diseases 0.000 claims description 8
- 208000025865 Ulcer Diseases 0.000 claims description 8
- 231100000397 ulcer Toxicity 0.000 claims description 8
- 230000000007 visual effect Effects 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 abstract description 6
- 238000012795 verification Methods 0.000 abstract description 3
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000001839 endoscopy Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000003903 intestinal lesions Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 1
- 208000032177 Intestinal Polyps Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 208000028774 intestinal disease Diseases 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法,首先将原始肠道数据集随机划分为训练集、验证集和测试集,并进行预处理;然后将训练集直接输入到网络中,此网络主要由三个部分组成:特征提取器、注意力分支和感知分支;结合注意力分支和感知分支两个分支的损失函数之和对网络进行端到端方式的训练,生成最优模型;再输入测试集图像对最优模型进行检验,使用准确率Accuracy,敏感度Sensitivity,特异度Specificity三个指标来评估最优模型的性能。本发明相对于经典的ResNet网络具有更优的效果,很好地提升了分类的性能,能够更好地应用在肠道病灶的辅助诊断上,具有更好的实际工程应用价值。
Description
技术领域
本发明涉及医学图像处理技术领域,利用肠道内窥镜检查图像进行肠道病灶的辅助诊断。具体涉及一种基于无归一化深度残差与注意力机制的肠道图像处理方法。
背景技术
肠道息肉、溃疡等是引发早期肠道癌变的主要危险因素。肠道癌前病变筛查对于早期肠癌预防很重要。肠道内窥镜检查是筛查和预防癌变的主要方法。临床上,肠道内窥镜检查的准确性与医生的经验很相关,操作难度较大,且容易造成误诊或漏诊。为了提高肠道内窥镜检查的准确性和有效性,国内外研究人员提出了很多用于肠道病灶辅助诊断的方法,主要包括:利用图像分割提取分割区域的几何特征,结合支持向量机等分类方法实现病变识别;通过提取图像的颜色和纹理特征,实现息肉的识别;或者结合尺度不变特征变换法和K均值聚类、显著图和直方图等方法,获得图像的综合特征,实现图像分类等。基于以上方法得到的辅助诊断模型,其准确性、敏感度和特异度能达到80%以上,但这些方法依赖于手动特征的提取,算法复杂耗时且精度不高,难以达到临床的需求。深度学习算法识别效率高,速度快,可以应对多种复杂的诊断场景。卷积神经网络(Convolutional NeuralNetworks,CNN)利用网络结构自动提取图像特征并分类,所学习到的特征对数据的内在信息更具代表性,特征提取和分类同时进行、全局优化训练参数少、泛化能力强等优点。虽然已经提出了很多深层CNN用于图像识别任务,并获得了较好的性能,但这些方法大多使用整个图片来训练模型,对局部病变区域的细微特征提取不到位,而结直肠疾病的病灶边缘与正常组织壁十分类似,颜色纹理特征也不足够明显,病灶大小形状差异大,病灶类间相似性大。因此,结直肠疾病图案的识别分类仍然是一项非常具有挑战性的任务。
发明内容
为了克服现有CNN对局部病变区域的细微特征提取不到位,类内病灶大小形状差异大,病灶边缘与正常组织壁边界模糊,多种良性病灶类间相似性大的问题,本发明提出一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法。
本发明解决其技术问题所采用的技术方案是:
一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法,所述方法包括以下步骤:
步骤1:输入图像数据集X={x1,x2,...,xn},其中,X矩阵表示数据集,n表示总样本数量,xi∈R224×224×3表示输入图像三个通道像素值构成的特征向量,(xi,yi)表示样本i,yi表示样本类别标签,其值为0表示正常,其值为1表示息肉,其值为2表示溃疡,当训练出一个分类模型后,以图像的特征向量xi为输入,预测输出的结果标签是0,1还是2,从而可以判断图片中是否正常、有息肉或者有溃疡;
步骤2:采用无归一化的ResNet基线模型的前四层作为特征提取器,从输入图像提取特征,输出特征图,特征提取器的后三层由多个引入Scaled Weight Standardization的无归一化Bottleneck残差块串联而成;
利用的主干网络在初始化的时候抑制残差分支,并使用Scaled WeightStandardization来消除均值偏移现象,确保残差分支保持方差,消除Batch维度内训练样本之间的相关性,这确保了网络具有ReLU激活函数的同时每通道激活函数不会随网络深度的增长而丢失信号,使网络训练和推理阶段偏差较小;Scaled Weight Standardization与中心权重标准化密切相关,其重新参数化卷积层,如下:
其中的均值μ和方差σ是通过卷积滤波器的扇入范围计算的。用高斯权值初始化底层参数W,而γ是一个固定常数,在整个训练过程中,将这种约束作为网络前向传播中的可微操作;
步骤3:注意力分支结构和作用以及注意力图的生成过程如下:
3.1由于肠道图像中病灶边缘与正常组织壁边界模糊,构建一个注意力分支来聚焦病灶区域,其卷积层Convolution Layers是用无归一化Bottleneck残差块来构建的,无归一化Bottleneck残差块的第一个3×3卷积层的步幅设置为1,以保持特征图的分辨率;为了可以在前向传播过程中可视化注意力图,引入基于响应的视觉解释模型来应用注意力,构建一个注意力分支结构,生成注意力图,注意力图中的高亮位置就是聚焦病灶区域的位置,通过引入此注意力分支,网络在聚焦于图像重要位置的同时被训练,并提高了其分类性能;
3.2为了生成注意力图,注意力分支基于类激活映射(Class ActivationMapping,CAM)构建顶层,该顶层由卷积层和全局平均池化(global average pooling,GAP)组成,CAM是一个代表性的基于响应的视觉解释,可以使用卷积层的响应获得每个类别的注意力图,然而,CAM在训练过程中不能生成注意力图,因为注意力图是在训练后通过将K×H×W特征图的加权和与最后一个全连接层的权重相乘生成的;提出利用一个K×1×1卷积层来代替全连接层,经过K×1×1卷积层后,再利用GAP和Softmax函数输出类概率分数Prob.score,同时,注意力分支用K×H×W特征图生成注意力图,为了聚集K个特征图,将这些特征图用1×1×1卷积层卷积,生成1×H×W特征图,再用Sigmoid函数对1×H×W特征图进行归一化,生成注意力图;
步骤4:注意力机制将注意力图应用于特征提取器输出的K个特征图,并输出K个特征图g'(xi)。g(xi)是特征提取器输出的特征图,M(xi)是注意力分支输出的注意力图,g'(xi)是注意力机制输出的特征图,输入到感知分支;注意力机制在特定通道C上将注意力图M(xi)和特征图g(xi)作点积,再将点积结果与特征图g(xi)求和,得到g'(xi),这可以在注意力图的峰值处突出显示特征图,同时防止注意力图的较低值区域降为零,g'(xi)表示为式(2),感知分支接收从注意力机制输出的特征图g'(xi),输入到分类器Classifier的卷积层,再利用Softmax激活函数输出最终类概率分数Prob.score;
g'(xi)=(1+M(xi))·g(xi) (2)
步骤5:使用注意力分支和感知分支两个分支的损失之和L(xi),作为训练损失,通过Softmax函数和交叉熵的结合来计算每个分支的训练损失,用Latt(xi)表示输入样本为xi时的注意力分支损失,Lper(xi)表示输入样本为xi时的感知分支损失,总损失函数L(xi)表示为式(3),训练时,将224×224的肠道图像输入到特征提取器,使用Adam优化器优化参数,StepLR机制调整学习率,结合损失函数对网络进行端到端的训练,得到最优的模型,再输入测试集图像对最优模型进行检验,使用准确率Accuracy,敏感度Sensitivity,特异度Specificity三个指标来评估最优模型的性能,三个指标分别表示为式(4),式(5),式(6);
L(xi)=Latt(xi)+Lper(xi) (3)
其中,TP、TN、FP、FN分别表示真阳性、真阴性、假阳性、假阴性的数量。
本发明的网络由三个模块组成:特征提取器、注意力分支和感知分支。特征提取器包含多个卷积层,从输入图像中提取特征输出特征图。注意力分支通过引入基于响应的视觉解释模型来生成注意力图,从而定位病灶部位。注意力机制对特征提取器输出的特征图和注意力图进行处理,感知分支通过接收从注意力机制输出的特征图来输出每个类的概率。本发明的主干网络基于一个无归一化的ResNet基线模型,其前四层用于细微特征提取,克服类内病灶大小形状差异大的问题。接着从第五层划分为注意力分支和感知分支。引入的注意力分支结构用来聚焦病灶区域,克服病灶边缘与正常组织壁边界模糊的问题。针对多种良性病灶类间相似性大的问题,此网络利用注意力分支和感知分支两个分支的损失函数之和进行端到端方式的训练,进一步地提高了肠道病灶的分类性能。
本发明从HyperKvasir公开数据集上选取部分图片来制作肠道疾病分类的数据集,此数据集包含正常、息肉、溃疡三类图像各1000张。按照3:1:1的比例将每一类别图像随机划分为训练集、验证集和测试集,得到1800张图像的训练集,600张图像的验证集和600张图像的测试集。图像大小被调整到256×256像素,为了增强模型的鲁棒性和稳定性,将训练集的图像随机裁剪成分辨率为224×224的图像,并进行随机水平翻转操作,将验证集和测试集的图像中心裁剪成分辨率为224×224的图像。
本发明的有益效果主要表现在:(1)本发明方法的主干网络利用一个无归一化的ResNet基线模型的前四层用于细微特征提取,克服类内病灶大小形状差异大的问题。(2)使用注意力分支结构,通过引入基于响应的视觉解释模型来生成注意力图,用来聚焦病灶区域。(3)利用注意力分支和感知分支两个分支的损失函数之和对网络进行端到端方式的训练,进一步地提高了肠道病灶的分类性能。
附图说明
图1是本发明的整体流程框图。
图2是特征提取器中无归一化Bottleneck残差块的结构图。
图3是注意力分支中卷积层的结构图。
图4是注意力分支生成的注意力图。
图5是感知分支中分类器的结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图5,一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法,包括以下步骤:
步骤1:输入图像数据集X={x1,x2,...,xn},其中,X矩阵表示数据集,n表示总样本数量,xi∈R224×224×3表示输入图像三个通道像素值构成的特征向量,(xi,yi)表示样本i,yi表示样本类别标签,其值为0表示正常,其值为1表示息肉,其值为2表示溃疡,当训练出一个分类模型后,以图像的特征向量xi为输入,预测输出的结果标签是0,1还是2,从而可以判断图片中是否正常、有息肉或者有溃疡;
步骤2:由于肠道数据集中局部病变区域的类内病灶大小、形状变化差异大,现有CNN对局部病变区域的细微特征提取不到位,采用无归一化的ResNet基线模型的前四层作为特征提取器,从输入图像提取特征,输出特征图。特征提取器的后三层由多个引入ScaledWeight Standardization的无归一化Bottleneck残差块串联而成,见图1的特征提取器部分,其中无归一化Bottleneck残差块的结构如图2;
批量归一化(Batch Normalization,BN)带来了不少额外的计算开销,会造成模型训练和推理阶段的行为差异,打破了Mini-batch处理中训练样本之间的独立性,强依赖于Batch_size的大小,不同硬件上进行分布式训练较难实现,一些研究表明,ReLU激活函数会带来均值偏移现象,这导致不同样本的隐藏激活值会随着网络的深度增加越来越相关;利用的主干网络在初始化的时候抑制残差分支,并使用Scaled Weight Standardization来消除均值偏移现象,确保残差分支保持方差,消除Batch维度内训练样本之间的相关性,这确保了网络具有ReLU激活函数的同时每通道激活函数不会随网络深度的增长而丢失信号,使网络训练和推理阶段偏差较小,Scaled Weight Standardization与中心权重标准化密切相关,其重新参数化卷积层,如下:
其中的均值μ和方差σ是通过卷积滤波器的扇入范围计算的,用高斯权值初始化底层参数W,而γ是一个固定常数。在整个训练过程中,将这种约束作为网络前向传播中的可微操作;
步骤3:注意力分支结构和作用以及注意力图的生成过程如下:
3.1由于肠道图像中病灶边缘与正常组织壁边界模糊,构建一个注意力分支来聚焦病灶区域,其卷积层Convolution Layers是用无归一化Bottleneck残差块来构建的,无归一化Bottleneck残差块的第一个3×3卷积层(3×3Conv)的步幅设置为1,以保持特征图的分辨率,如图3;为了可以在前向传播过程中可视化注意力图,引入基于响应的视觉解释模型来应用注意力,构建一个注意力分支结构,生成注意力图,注意力图中的高亮位置就是聚焦病灶区域的位置,通过引入此注意力分支,网络在聚焦于图像重要位置的同时被训练,并提高了其分类性能;
3.2为了生成注意力图,注意力分支基于类激活映射(Class ActivationMapping,CAM)构建顶层,该顶层由卷积层和全局平均池化(global average pooling,GAP)组成,CAM是一个代表性的基于响应的视觉解释,可以使用卷积层的响应获得每个类别的注意力图,然而,CAM在训练过程中不能生成注意力图,因为注意力图是在训练后通过将K×H×W特征图的加权和与最后一个全连接层的权重相乘生成的,为了解决这个问题,提出利用一个K×1×1卷积层来代替全连接层,经过K×1×1卷积层后,再利用GAP和Softmax函数输出类概率分数Prob.score,同时,注意力分支用K×H×W特征图生成注意力图,为了聚集K个特征图,将这些特征图用1×1×1卷积层卷积,生成1×H×W特征图,再用Sigmoid函数对1×H×W特征图进行归一化,生成注意力图,如图4;
步骤4:注意力机制将注意力图应用于特征提取器输出的K个特征图,并输出K个特征图g'(xi),g(xi)是特征提取器输出的特征图,M(xi)是注意力分支输出的注意力图,g'(xi)是注意力机制输出的特征图,输入到感知分支,注意力机制在特定通道C上将注意力图M(xi)和特征图g(xi)作点积,再将点积结果与特征图g(xi)求和,得到g'(xi),这可以在注意力图的峰值处突出显示特征图,同时防止注意力图的较低值区域降为零,g'(xi)表示为式(2)。如图5,感知分支接收从注意力机制输出的特征图g'(xi),输入到分类器Classifier的卷积层,再利用Softmax激活函数输出最终类概率分数Prob.score;
g'(xi)=(1+M(xi))·g(xi) (2)
步骤5:使用注意力分支和感知分支两个分支的损失之和L(xi),作为训练损失,如图1;通过Softmax函数和交叉熵的结合来计算每个分支的训练损失,用Latt(xi)表示输入样本为xi时的注意力分支损失,Lper(xi)表示输入样本为xi时的感知分支损失,总损失函数L(xi)表示为式(3),训练时,将224×224的肠道图像输入到特征提取器,使用Adam优化器优化参数,StepLR机制调整学习率,结合损失函数对网络进行端到端的训练,得到最优的模型,再输入测试集图像对最优模型进行检验,使用准确率Accuracy,敏感度Sensitivity,特异度Specificity三个指标来评估最优模型的性能,三个指标分别表示为式(4),式(5),式(6):
L(xi)=Latt(xi)+Lper(xi) (3)
其中,TP、TN、FP、FN分别表示真阳性、真阴性、假阳性、假阴性的数量。
本发明的效果可通过以下仿真实验进一步说明。
(1)仿真条件
实验采用一台配置Intel(R)Xeon(R)Silver 4210R CPU@2.40GHz 2.39GHz(2处理器),64GB内存,Windows10操作系统和3块NVIDIA GeForce RTX 2080 SUPER显卡的工作站,Cuda版本为10.0,模型基于PyTorch深度学习框架实现,PyTorch版本为1.6.0+cu101,Python版本为3.7。训练过程的Batch-size设为32,使用Adam算法来优化总体参数,学习率设置为0.0001,并使用StepLR机制调整学习率,训练100epoch后模型收敛。
(2)仿真结果
本发明将提出的方法与经典的ResNet网络在相同的数据集上进行了对比实验。使用图像分类中常用的准确率Accuracy,敏感度Sensitivity,特异度Specificity指标来对模型进行评估。
表1
从表1中可以看出,本发明方法相对于ResNet具有更优的效果,很好地提升了分类的性能,能够更好地应用在肠道病灶的辅助诊断上,具有更好的实际工程应用价值。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。
Claims (1)
1.一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法,其特征在于,所述方法包括以下步骤:
步骤1:输入图像数据集X={x1,x2,...,xn},其中,X矩阵表示数据集,n表示总样本数量,xi∈R224×224×3表示输入图像三个通道像素值构成的特征向量,(xi,yi)表示样本i,yi表示样本类别标签,其值为0表示正常,其值为1表示息肉,其值为2表示溃疡,当训练出一个分类模型后,以图像的特征向量xi为输入,预测输出的结果标签是0,1还是2,从而可以判断图片中是否正常、有息肉或者有溃疡;
步骤2:采用无归一化的ResNet基线模型的前四层作为特征提取器,从输入图像提取特征,输出特征图,特征提取器的后三层由多个引入Scaled Weight Standardization的残差块串联而成;
利用的主干网络在初始化的时候抑制残差分支,并使用Scaled WeightStandardization来消除均值偏移现象,确保残差分支保持方差,消除Batch维度内训练样本之间的相关性,这确保了网络具有ReLU激活函数的同时每通道激活函数不会随网络深度的增长而丢失信号,使网络训练和推理阶段偏差较小;Scaled Weight Standardization与中心权重标准化密切相关,其重新参数化卷积层,如下:
其中的均值μ和方差σ是通过卷积滤波器的扇入范围计算的。用高斯权值初始化底层参数W,而γ是一个固定常数,在整个训练过程中,将这种约束作为网络前向传播中的可微操作;
步骤3:注意力分支结构和作用以及注意力图的生成过程如下:
3.1由于肠道图像中病灶边缘与正常组织壁边界模糊,构建一个注意力分支来聚焦病灶区域,其卷积层Convolution Layers是用残差块来构建的,残差块的第一个3×3卷积层的步幅设置为1,以保持特征图的分辨率;为了可以在前向传播过程中可视化注意力图,通过引入基于响应的视觉解释模型来应用注意力,构建一个注意力分支结构,生成注意力图,注意力图中的高亮位置就是聚焦病灶区域的位置,通过引入此注意力分支,网络在聚焦于图像重要位置的同时被训练,并提高了其分类性能;
3.2为了生成注意力图,注意力分支基于类激活映射(Class Activation Mapping,CAM)构建顶层,该顶层由卷积层和全局平均池化(global average pooling,GAP)组成,CAM是一个代表性的基于响应的视觉解释,可以使用卷积层的响应获得每个类别的注意力图,然而,CAM在训练过程中不能生成注意力图,因为注意力图是在训练后通过将K×H×W特征图的加权和与最后一个全连接层的权重相乘生成的;提出利用一个K×1×1卷积层来代替全连接层,经过K×1×1卷积层后,再利用GAP和Softmax函数输出类概率分数Prob.score,同时,注意力分支用K×H×W特征图生成注意力图,为了聚集K个特征图,将这些特征图用1×1×1卷积层卷积,生成1×H×W特征图,再用Sigmoid函数对1×H×W特征图进行归一化,生成注意力图;
步骤4:注意力机制将注意力图应用于特征提取器输出的K个特征图,并输出K个特征图g'(xi)。g(xi)是特征提取器输出的特征图,M(xi)是注意力分支输出的注意力图,g'(xi)是注意力机制输出的特征图,输入到感知分支;注意力机制在特定通道C上将注意力图M(xi)和特征图g(xi)作点积,再将点积结果与特征图g(xi)求和,得到g'(xi),这可以在注意力图的峰值处突出显示特征图,同时防止注意力图的较低值区域降为零,g'(xi)表示为式(2),感知分支接收从注意力机制输出的特征图g'(xi),输入到分类器Classifier的卷积层,再利用Softmax激活函数输出最终类概率分数Prob.score;
g'(xi)=(1+M(xi))·g(xi) (2)
步骤5:使用注意力分支和感知分支两个分支的损失之和L(xi),作为训练损失,通过Softmax函数和交叉熵的结合来计算每个分支的训练损失,用Latt(xi)表示输入样本为xi时的注意力分支损失,Lper(xi)表示感知分支损失,总损失函数L(xi)表示为式(3),训练时,将224×224的肠道图像输入到特征提取器,使用Adam优化器优化参数,StepLR机制调整学习率,结合损失函数对网络进行端到端的训练,得到最优的模型,再输入测试集图像对最优模型进行检验,使用准确率Accuracy,敏感度Sensitivity,特异度Specificity三个指标来评估最优模型的性能,三个指标分别表示为式(4),式(5),式(6);
L(xi)=Latt(xi)+Lper(xi) (3)
其中,TP、TN、FP、FN分别表示真阳性、真阴性、假阳性、假阴性的数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110429423.5A CN113256561B (zh) | 2021-04-21 | 2021-04-21 | 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110429423.5A CN113256561B (zh) | 2021-04-21 | 2021-04-21 | 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113256561A true CN113256561A (zh) | 2021-08-13 |
CN113256561B CN113256561B (zh) | 2024-03-22 |
Family
ID=77221198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110429423.5A Active CN113256561B (zh) | 2021-04-21 | 2021-04-21 | 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113256561B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114596266A (zh) * | 2022-02-25 | 2022-06-07 | 烟台大学 | 一种基于ConcreteCrackSegNet模型的混凝土裂缝检测方法 |
CN114937171A (zh) * | 2022-05-11 | 2022-08-23 | 复旦大学 | 基于深度学习的阿尔茨海默分类系统 |
CN115456981A (zh) * | 2022-09-02 | 2022-12-09 | 南通大学 | 一种基于深度残差收缩网络的眼病诊断方法 |
CN117058467A (zh) * | 2023-10-10 | 2023-11-14 | 湖北大学 | 一种胃肠道病变类型识别方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200012838A1 (en) * | 2018-07-06 | 2020-01-09 | Tata Consultancy Services Limited | Method and system for automatic chromosome classification |
CN112465766A (zh) * | 2020-11-25 | 2021-03-09 | 武汉楚精灵医疗科技有限公司 | 扁平、微小息肉图像识别方法 |
-
2021
- 2021-04-21 CN CN202110429423.5A patent/CN113256561B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200012838A1 (en) * | 2018-07-06 | 2020-01-09 | Tata Consultancy Services Limited | Method and system for automatic chromosome classification |
CN112465766A (zh) * | 2020-11-25 | 2021-03-09 | 武汉楚精灵医疗科技有限公司 | 扁平、微小息肉图像识别方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114596266A (zh) * | 2022-02-25 | 2022-06-07 | 烟台大学 | 一种基于ConcreteCrackSegNet模型的混凝土裂缝检测方法 |
CN114937171A (zh) * | 2022-05-11 | 2022-08-23 | 复旦大学 | 基于深度学习的阿尔茨海默分类系统 |
CN114937171B (zh) * | 2022-05-11 | 2023-06-09 | 复旦大学 | 基于深度学习的阿尔茨海默分类系统 |
CN115456981A (zh) * | 2022-09-02 | 2022-12-09 | 南通大学 | 一种基于深度残差收缩网络的眼病诊断方法 |
CN117058467A (zh) * | 2023-10-10 | 2023-11-14 | 湖北大学 | 一种胃肠道病变类型识别方法及系统 |
CN117058467B (zh) * | 2023-10-10 | 2023-12-22 | 湖北大学 | 一种胃肠道病变类型识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113256561B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Adegun et al. | Deep learning techniques for skin lesion analysis and melanoma cancer detection: a survey of state-of-the-art | |
Ribeiro et al. | Colonic polyp classification with convolutional neural networks | |
CN109493308B (zh) | 基于条件多判别生成对抗网络的医疗图像合成与分类方法 | |
CN113256561B (zh) | 一种基于无归一化深度残差与注意力机制的肠道病灶辅助诊断方法 | |
Ashok et al. | Comparison of Feature selection methods for diagnosis of cervical cancer using SVM classifier | |
CN109977955B (zh) | 一种基于深度学习的宫颈癌前病变识别的方法 | |
Ahmad et al. | Endoscopic image classification and retrieval using clustered convolutional features | |
Ma et al. | HT-Net: hierarchical context-attention transformer network for medical ct image segmentation | |
Villaruz | Deep convolutional neural network feature extraction for berry trees classification | |
CN114266786A (zh) | 基于生成对抗网络的胃病变分割方法及系统 | |
Rahman et al. | Developing a retrieval based diagnostic aid for automated melanoma recognition of dermoscopic images | |
Murugappan et al. | Texture based medical image classification by using multi-scale Gabor rotation-invariant local binary pattern (MGRLBP) | |
Paithane et al. | LMNS-Net: Lightweight Multiscale Novel Semantic-Net deep learning approach used for automatic pancreas image segmentation in CT scan images | |
Freitas et al. | Detection of bladder cancer with feature fusion, transfer learning and CapsNets | |
Mondal et al. | Improved skin disease classification using generative adversarial network | |
Fadil et al. | Classification of microcalcifications in mammograms using 2D discrete wavelet transform and random forest | |
Saber et al. | Multi-center, multi-vendor, and multi-disease cardiac image segmentation using scale-independent multi-gate UNET | |
Pavithra et al. | An Overview of Convolutional Neural Network Architecture and Its Variants in Medical Diagnostics of Cancer and Covid-19 | |
Naeem et al. | DVFNet: A deep feature fusion-based model for the multiclassification of skin cancer utilizing dermoscopy images | |
Wang et al. | Optic disc detection based on fully convolutional neural network and structured matrix decomposition | |
Khoulqi et al. | Cervical Cancer Detection and Classification Using MRIs | |
Perumal et al. | Microaneurysms detection in fundus images using local fourier transform and neighbourhood analysis | |
CN114049357A (zh) | 一种基于特征集关联度的乳腺超声分割方法 | |
Liu et al. | The research of feature extraction method of liver pathological image based on multispatial mapping and statistical properties | |
Manjunath et al. | Robust segmentation of optic disc and cup from fundus images using deep neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |