CN112489061A - 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 - Google Patents
一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 Download PDFInfo
- Publication number
- CN112489061A CN112489061A CN202011427253.9A CN202011427253A CN112489061A CN 112489061 A CN112489061 A CN 112489061A CN 202011427253 A CN202011427253 A CN 202011427253A CN 112489061 A CN112489061 A CN 112489061A
- Authority
- CN
- China
- Prior art keywords
- features
- feature
- module
- polyp
- deep
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000011218 segmentation Effects 0.000 title claims abstract description 22
- 230000007246 mechanism Effects 0.000 title claims abstract description 13
- 208000032177 Intestinal Polyps Diseases 0.000 title claims abstract description 12
- 238000013135 deep learning Methods 0.000 title claims abstract description 10
- 208000037062 Polyps Diseases 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000005284 excitation Effects 0.000 claims abstract description 12
- 230000004044 response Effects 0.000 claims abstract description 7
- 238000011176 pooling Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 9
- 230000006835 compression Effects 0.000 claims description 7
- 238000007906 compression Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000003213 activating effect Effects 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 claims 1
- 239000011800 void material Substances 0.000 claims 1
- 210000001035 gastrointestinal tract Anatomy 0.000 abstract description 6
- 238000004904 shortening Methods 0.000 abstract description 3
- 239000000284 extract Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 206010009944 Colon cancer Diseases 0.000 description 3
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 3
- 238000002052 colonoscopy Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 208000018522 Gastrointestinal disease Diseases 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000002758 colorectal adenoma Diseases 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000001855 preneoplastic effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
- G06T2207/30032—Colon polyp
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法,在编码时本发明通过建立分支的方式从更细粒度上提取特征,并通过改进后的压缩激励模块以重新校准特征响应,然后在空洞空间金字塔池化的基础上通过建立分支之间的联系进一步提取并融合特征,能够更精确地提取肠道与息肉的多尺度特征并将其区分来开,很好地解决了分割时常常会将肠道壁褶皱误判为息肉区域的问题;在解码时则抛弃了浅层特征细化了深层特征,并利用注意力机制进一步建立边界关系,能够在缩短训练时间的基础上更精确地分割出息肉边界。
Description
技术领域
本发明涉及深度学习图像分割领域,具体涉及一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法。
背景技术
胃肠道疾病是最常见的人类疾病,严重影响着人类的生命健康。据统计,胃肠道疾病中,结直肠癌是世界上仅次于肺癌与乳腺癌的第三大癌症,而肠道息肉作为一种高危的癌前疾病,就是结直肠癌的前身。因此,通过检测和清除肿瘤前病变息肉来预防结直肠癌至关重要,这也是世界范围内公共卫生的重点。当前,结肠镜检查是诊断大肠腺瘤和癌症的“金标准”技术。在我国,每年的消化道内镜检查需求在1亿人次以上,临床应用广泛。
但是结肠镜检查诊断的准确性与医生的学识、经验、手术时的状态等有着直接的关系,操作难度不小。此外,肠道息肉通常表现出各种形状,质地和大小特征,即使训练有素的临床医生也可能会产生不同的诊断结果。因此,非常需要开发一种计算机辅助诊断方法来协助医生诊断疾病。计算机辅助系统(CAD)可以通过异常检测算法来协助医生进行息肉的诊断并提供其癌变的风险提示,进而大大提高结肠镜检查的效率。
常见的异常检测方法仅能识别图像中是否存在息肉,但临床中还需要CAD系统能够有具有像素级分割的功能,即将异常区域在图中直观地标注出来。但是息肉分割是一项艰巨的任务,首先,息肉即使是同一类型,其大小、颜色和质地等外观也经常变化;其次,结肠镜检查图像中,息肉及其周围的粘膜之间的边界通常较为模糊,多数息肉的边缘和颜色特征与肠壁非常接近。这些问题导致息肉分割准确度不够高,甚至可能会漏检息肉。
发明内容
为了克服肠道息肉分割精度不足的问题,本发明提出了一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法。在编码时本发明通过建立分支的方式从更细粒度上提取特征,并通过改进后的压缩激励模块以重新校准特征响应,然后在空洞空间金字塔池化的基础上通过建立分支之间的联系进一步提取并融合特征,能够更精确地提取肠道与息肉的多尺度特征并将其区分来开,很好地解决了分割时常常会将肠道壁褶皱误判为息肉区域的问题;在解码时则抛弃了浅层特征细化了深层特征,并利用注意力机制进一步建立边界关系,能够在缩短训练时间的基础上更精确地分割出息肉边界。
本发明采用如下的技术方案:
一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法,包括以下步骤:
步骤1:获取待分割图片:实验数据集是来自公开的息肉数据集CVC-ClinicDB,包含各种类型、形状和颜色的息肉图片。
步骤2:利用Res2Net深度卷积神经网络模块与二重压缩激励模块(DoubleSqueeze and Excited,DSE)作为编码器提取图像的特征;
在进行特征编码时,通过建立4个分支并且建立分支间的联系以细化通道特征,并再此基础上并通过改进后的压缩激励操作进一步模拟通道间的相互依赖关系来重新校准特征响应,这样一来能更好地利用多尺度信息以达到更好的特征提取效果,进行编码后最终得到五个层次的特征{fi,i=1,2,…,5},其中{fi,i=1,2}表示为浅层特征,{fi,i=3,4,5}表示为深层特征;
步骤3:在解码前通过多尺度空洞空间金字塔池化(Multi-Atrous SpatialPyramidal Pooling,MASPP)模块进一步利用多尺度特征来捕获上下文信息;
以空洞卷积为基础,采用扩张率rate分别为6、12、18的三个并行空洞卷积核对输入特征图进行空洞卷积操作,每个扩张率提取的特征将在各自的分支中建立分支间的相互联系,并通过激活函数与批归一化的方式进一步处理,最终对三个特征进行堆叠融合,这种方式能进一步利用多尺度特征来捕获上下文信息,实现了对单个尺度提取的卷积特征进行重采样,可以对任意尺度的区域进行更加准确有效的分类;
步骤4:通过PD模块进行解码,生成全局特征图Sg;
在解码部分采用了部分解码器(Partial Decoder,PD)pd(·),它在skip-connection部分仅聚合了深层特征而舍弃了浅层特征,部分解码器的特征可按PD=pd(f3,f4,f5)来计算,解码器输出获得全局特征图Sg;
步骤5:通过反转注意力模块(Reverse Attention,RA)建立区域与边界线索之间的关系,获取完整的预测结果;
使用了三个RA模块,第一个RA模块的输入为深层特征f5与经过降采样后的全局特征图Sg,并用上述方式分别获取到检测图S5,接下来用相同的方式获取到S4、S3,其中特征图S3通过一个Sigmoid函数获得最终预测结果;
步骤6:网络模型的训练策略过程如下:
6.1首先获取并划分数据集;
6.2考虑到显存利用率,图片在输入网络前会通过降采样或升采样,在保持图片长宽比例不变的情况下将图片长度调整为256;
6.3训练过程中的梯度下降算法选用了Adam算法;
6.4选用的损失函数结合了加权交并比(Intersection Over Union,IoU)损失与二进制交叉熵(Binary Cross Entropy,BCE)损失,表示为:
在训练过程中,对于步骤4中获取的全局特征图Sg以及步骤5中获取的三个局部特征图S5、S4、S3均上采样到与真实Mask相同尺寸大小,计算总体损失:
并进行反向传播以更新网络参数。
本发明的有益效果表现在:本发明提出了一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法,在编码时通过建立分支的方式从更细粒度上提取特征,并通过改进的压缩激励操作以重新校准特征响应,然后在空洞空间金字塔池化的基础上通过建立分支之间的联系进一步提取并融合特征,能够更精确地提取肠道与息肉的多尺度特征并将其区分来开,很好地解决了分割时常常会将肠道壁褶皱误判为息肉区域的问题。在解码时的并行连接抛弃了浅层特征细化了深层特征,并利用注意力机制进一步建立边界关系,能够在缩短训练时间的基础上更精确地分割出息肉边界。
附图说明
图1是Res模块与Res2Net模块的结构对比图,其中(a)为残差模块结构,(b)为Res2Net模块结构;
图2是DSE模块的原理图,(a)为SE实现原理,(b)为DSE结构图
图3是MASPP模块的实现原理图;
图4是PD模块解码的流程图;
图5是RA模块的内部结构图;
图6是本发明网络的整体架构图;
图7是训练过程中在测试集上的Dice指标变化;
图8是本发明与不同网络的分割结果对比。
具体实施方式
为了阐明本发明的目的、技术方案和优点,以下结合具体实施例及附图,对本发明做进一步详细说明。
参照图1~图8,一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法,包括以下步骤:
步骤1:获取待分割图片:本发明的实验数据集是来自公开的息肉数据集CVC-ClinicDB,包含各种类型、形状和颜色的息肉图片;
步骤2:利用Res2Net深度卷积神经网络模块与二重压缩激励模块(DoubleSqueeze and Excited,DSE)作为编码器提取图像的特征;
残差模块是许多现代主干CNN架构中的基本模块,如图1(a)所示。本发明使用的Res2Net在残差模块的基础上进行改进,如图1(b)所示,经过1×1的卷积后,Res2Net将特征图均匀地分为s个特征子集,以xi表示,其中i∈{1,2,…,s}。与输入特征图相比,每个特征子集xi具有相同的空间大小,但通道数为1/s。除了x1外,每个xi都有一个对应的3×3卷积核,用Ki()表示,yi表示Ki的输出。特征子集xi与Ki-1()输出相加,然后馈入Ki(),因此yi可以表示为:
本发明使用的DSE模块能够通过显示地模拟通道间的相互依赖关系,自适应地重新校准各通道间的特征响应。DSE模块的基本结构如图2(b)所示,对于任何给定的变换(如一个卷积或一组卷积),可以通过构造一个DSE模块来执行特征重新校准。特征U首先通过压缩操作,该操作将空间维度为H×W上的特征图聚合在一起以生成通道描述符s1。该通道描述符嵌入了通道方式特征响应的全局分布,使来自网络全局接收域的信息能够被其下层利用。接下来是激励操作,通过基于通道依赖的自门控机制对每个通道学习的特定样本激活,控制每个通道的激励,最终特征图U重新加权产生f1,压缩激励操作的原理如图2(a)所示。接下来对f1再次执行压缩操作得到s2,对s1+s2执行激励操作以更精确地校准特征得到f2,最终则以f1+f2以表示DSE块的输出,输出可以直接馈入后续层,如图2(b)所示。
本发明一共使用4个Res2Net模块来提取输入图片特征,Res2Net模块之间用DSE模块连接。具体来说,对于输入大小为h×w的息肉图像I,用标准卷积层以及4个以DSE模块连接的Res2Net模块提取大小为[h/2k-1,w/2k-1]的5个层次的特征{fi,i=1,2,…,5},其中{fi,i=1,2}表示为浅层特征,{fi,i=3,4,5}表示为深层特征。
步骤3:在解码前通过多尺度空洞空间金字塔池化(Multi-Atrous SpatialPyramidal Pooling,MASPP)模块进一步利用多尺度特征来捕获上下文信息;
空洞卷积(Atrous Convolution)已经广泛应用于语义分割和目标检测等任务中,空洞卷积对于传统卷积的优势在于可以在不降低分辨率的情况下扩大感受野,并且可以通过设置不同的扩张率rate来获取多尺度信息。
本发明使用的MASPP以空洞卷积为基础,能进一步利用多尺度特征来捕获上下文信息。具体来说,为了对图3中的橙色像素进行分类,MASPP模块采用扩张率rate分别为6、12、18的三个并行卷积核分成三个分支对输入特征图进行空洞卷积操作,其中三个卷积核的有效视野用三个不同的颜色表示,如图3所示。其中rate为6的分支的输出为x1,x1与rate为12的分支输出相乘得到x2,x2再与rate为18的分支输出相乘得到x3,以此建立了分支之间的联系,最后则对于最终的输出{xi,i=1,2,3}进行堆叠融合。这种方式实现了对单个尺度提取的卷积特征进行重采样,可以对任意尺度的区域进行准确有效的分类。
步骤4:通过PD模块进行解码,生成全局特征图Sg;
步骤2中提取到了5个层次的特征{fi,i=1,2,…,5},其中{fi,i=1,2}表示为浅层特征,{fi,i=3,4,5}表示为深层特征。与深层特征相比,浅层特征含有较多的噪声信息且由于其较大的空间分辨率会占用更多的计算资源,并对性能的贡献效果较小。因此本发明在解码部分采用了部分解码器(Partial Decoder,PD)pd(·),它在skip-connection部分仅聚合了深层特征而舍弃了浅层特征,其结构如图4所示。部分解码器的特征可按PD=pd(f3,f4,f5)来计算,解码器输出获得全局特征图Sg。PD模块抛弃了浅层特征后,不仅能大大加快训练速度,并且能更好地细化深层特征来获得精确的显著性图。
步骤5:通过反转注意力模块(Reverse Attention,RA)建立区域与边界线索之间的关系,获取完整的预测结果;
从步骤4中提取到的全局特征图Sg只捕获了相对粗糙的位置,而没有轮廓的结构细节。为了获取到更精细的边缘轮廓,本发明使用了一组反转注意力模块,通过擦除前景物体的方式来从粗略的估计中逐步挖掘判别息肉的边界,一步步细化为准确而完整的预测图,其结构如图5所示。具体来说,RA模块通过深层特征{fi,i=3,4,5}与反转注意力权重Ai相乘来获得反转注意力特征的输出Ri:
Ri=fi⊙Ai (2)
反转注意力权重Ai可以表示为:
本发明使用了三个RA模块,第一个RA模块的输入为深层特征f5与经过降采样后的全局特征图Sg,并用上述方式分别获取到检测图S5。接下来用相同的方式获取到S4、S3,其中特征图S3通过一个Sigmoid函数获得最终预测结果,如图6中的整个网络架构所示。
步骤6:网络模型的训练策略的过程如下:
6.1首先划分数据集,从原始数据集中随机抽取一定数量图片作为最终的测试集,剩余的数据集按9:1划分为训练集与验证集;
6.2考虑到显存利用率,图片在输入网络前会通过降采样或升采样,在保持图片长宽比例不变的情况下将图片调整到长为256;
6.3训练过程中的梯度下降算法选用了Adam算法。其优点在于计算效率高、所需内存少、可以解决包含很高噪声或稀疏梯度的问题,并且超参数可以直观地得到解释而只需极少量地调参;
6.4本发明选用的损失函数结合了加权交并比(Intersection Over Union,IoU)损失与二进制交叉熵(Binary Cross Entropy,BCE)损失,表示为:
在训练过程中,对于步骤4中获取的全局特征图Sg以及步骤5中获取的三个局部特征图S5、S4、S3均上采样到与真实Mask相同尺寸大小,计算总体损失:
并进行反向传播以更新网络参数。
本发明的下效果可通过以下实验进一步说明。
1)实验条件
本发明所有架构均用PyTorch框架作为后端实现。实验所用操作系统为Ubuntu18.04.4 LTS,软件PyCharm(2020.2.3),处理器为Intel(R)Xeon(R)Silver 4210 CPU@2.20GHz,内存64GB,安装了最新的Cuda 10.2.89,训练过程由NVIDIA RTX 2080 Super GPU加速。本发明选用的Adam优化算法初始学习率设置为1e-3,batch size设为4,所有输入均在保持原图比例的情况下调整到长为256像素,本发明采用多尺度训练策略{0.75,1,1,25}以代替数据增强。整个网络以端到端的方式训练,训练中最终的预测结果Sp由S3经过一个Sigmoid函数得出。
2)实验结果
Dice指标是语义分割中最常见的评价指标之一,它本质上是两个样本的重叠的度量,此度量值范围是0到1,1表示两个样本完全重叠,对于A与B两个样本,该指标可以表示为本发明算法与U-Net,U-Net++,Attention U-Net以及PraNet在内的4个SOTA模型在CVC-ClinicDB数据集上的设置了对比实验。所有模型训练过程中在测试集上的Dice指标变化如图7所示,图中的曲线为经过了0.6的smooth之后的结果。结合表1可以看到,本发明的模型相比于其他SOTA模型在CVC-ClinicDB数据集上进行息肉分割有着更优的效果。
表1
图8显示了各个模型对于CVC-ClinicDB数据集的分割结果,从中可以看到本发明有着更加优秀的分割结果,也进一步说明了本发明模型相对于其他基准模型的优越性。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也基于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。
Claims (1)
1.一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法,其特征在于,所述方法包括以下步骤:
步骤1:获取待分割图片:实验数据集是来自公开的息肉数据集CVC-ClinicDB,包含各种类型、形状和颜色的息肉图片;
步骤2:利用Res2Net深度卷积神经网络模块与二重压缩激励模块作为编码器提取图像的特征;
在进行特征编码时,通过建立4个分支并且建立分支间的联系以细化通道特征,并再此基础上并通过改进后的压缩激励操作进一步模拟通道间的相互依赖关系来重新校准特征响应,这样一来能更好地利用多尺度信息以达到更好的特征提取效果;进行编码后最终得到五个层次的特征{fi,i=1,2,…,5},其中{fi,i=1,2}表示为浅层特征,{fi,i=3,4,5}表示为深层特征;
步骤3:在解码前通过多尺度空洞空间金字塔池化模块进一步利用多尺度特征来捕获上下文信息;
以空洞卷积为基础,采用扩张率rate分别为6、12、18的三个并行空洞卷积核对输入特征图进行空洞卷积操作,每个扩张率提取的特征将在各自的分支中建立分支间的相互联系,并通过激活函数与批归一化的方式进一步处理,最终对三个特征进行堆叠融合;
步骤4:通过PD模块进行解码,生成全局特征图Sg;
在解码部分采用了部分解码器pd(·),它在skip-connection部分仅聚合了深层特征而舍弃了浅层特征,部分解码器的特征按PD=pd(f3,f4,f5)来计算,解码器输出获得全局特征图Sg;
步骤5:通过反转注意力模块建立区域与边界线索之间的关系,获取完整的预测结果;
使用了三个RA模块,第一个RA模块的输入为深层特征f5与经过降采样后的全局特征图Sg,并用上述方式分别获取到检测图S5,接下来用相同的方式获取到S4、S3,其中特征图S3通过一个Sigmoid函数获得最终预测结果;
步骤6:网络模型的训练策略的过程如下:
6.1首先获取并划分数据集;
6.2考虑到显存利用率,图片在输入网络前会通过降采样或升采样,在保持图片长宽比例不变的情况下将图片长度调整为256;
6.3训练过程中的梯度下降算法选用了Adam算法;
6.4选用的损失函数结合了加权交并比损失与二进制交叉熵损失,表示为:
在训练过程中,对于步骤4中获取的全局特征图Sg以及步骤5中获取的三个局部特征图S5、S4、S3均上采样到与真实Mask相同尺寸大小,计算总体损失:
并进行反向传播以更新网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011427253.9A CN112489061B (zh) | 2020-12-09 | 2020-12-09 | 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011427253.9A CN112489061B (zh) | 2020-12-09 | 2020-12-09 | 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112489061A true CN112489061A (zh) | 2021-03-12 |
CN112489061B CN112489061B (zh) | 2024-04-16 |
Family
ID=74940697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011427253.9A Active CN112489061B (zh) | 2020-12-09 | 2020-12-09 | 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112489061B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496228A (zh) * | 2021-07-30 | 2021-10-12 | 大连海事大学 | 一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法 |
CN113538313A (zh) * | 2021-07-22 | 2021-10-22 | 深圳大学 | 一种息肉分割方法、装置、计算机设备及存储介质 |
CN113537375A (zh) * | 2021-07-26 | 2021-10-22 | 深圳大学 | 一种基于多尺度级联的糖尿病视网膜病变分级方法 |
CN113554668A (zh) * | 2021-07-27 | 2021-10-26 | 深圳大学 | 一种皮肤镜图像黑色素瘤分割方法、装置及相关组件 |
CN113658201A (zh) * | 2021-08-02 | 2021-11-16 | 天津大学 | 基于增强型多尺度特征的深度学习结直肠癌息肉分割装置 |
CN113724276A (zh) * | 2021-08-04 | 2021-11-30 | 香港中文大学(深圳) | 一种息肉图像的分割方法和装置 |
CN113781489A (zh) * | 2021-08-25 | 2021-12-10 | 浙江工业大学 | 一种息肉影像语义分割方法及装置 |
CN114842029A (zh) * | 2022-05-09 | 2022-08-02 | 江苏科技大学 | 一种融合通道和空间注意力的卷积神经网络息肉分割方法 |
CN114972155A (zh) * | 2021-12-30 | 2022-08-30 | 昆明理工大学 | 一种基于上下文信息和反向注意力的息肉图像分割方法 |
WO2022271129A1 (en) * | 2021-06-24 | 2022-12-29 | T.C. Erciyes Universitesi | Deep learning-based decision support system for real-time automatic polyp detection |
CN116188501A (zh) * | 2023-03-02 | 2023-05-30 | 江南大学 | 基于多尺度交叉注意力的医学图像分割方法 |
CN116958535A (zh) * | 2023-04-14 | 2023-10-27 | 三峡大学 | 一种基于多尺度残差推理的息肉分割系统及方法 |
CN117036714A (zh) * | 2023-10-09 | 2023-11-10 | 安徽大学 | 融合混合注意力机制的肠息肉分割方法、系统及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107146229A (zh) * | 2017-04-05 | 2017-09-08 | 西安电子科技大学 | 基于元胞自动机模型的结肠息肉图像分割方法 |
CN110263833A (zh) * | 2019-06-03 | 2019-09-20 | 韩慧慧 | 基于编码-解码结构的图像语义分割方法 |
CN111784628A (zh) * | 2020-05-11 | 2020-10-16 | 北京工业大学 | 基于有效学习的端到端的结直肠息肉图像分割方法 |
CN112017198A (zh) * | 2020-10-16 | 2020-12-01 | 湖南师范大学 | 基于自注意力机制多尺度特征的右心室分割方法及装置 |
-
2020
- 2020-12-09 CN CN202011427253.9A patent/CN112489061B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107146229A (zh) * | 2017-04-05 | 2017-09-08 | 西安电子科技大学 | 基于元胞自动机模型的结肠息肉图像分割方法 |
CN110263833A (zh) * | 2019-06-03 | 2019-09-20 | 韩慧慧 | 基于编码-解码结构的图像语义分割方法 |
CN111784628A (zh) * | 2020-05-11 | 2020-10-16 | 北京工业大学 | 基于有效学习的端到端的结直肠息肉图像分割方法 |
CN112017198A (zh) * | 2020-10-16 | 2020-12-01 | 湖南师范大学 | 基于自注意力机制多尺度特征的右心室分割方法及装置 |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022271129A1 (en) * | 2021-06-24 | 2022-12-29 | T.C. Erciyes Universitesi | Deep learning-based decision support system for real-time automatic polyp detection |
CN113538313A (zh) * | 2021-07-22 | 2021-10-22 | 深圳大学 | 一种息肉分割方法、装置、计算机设备及存储介质 |
CN113538313B (zh) * | 2021-07-22 | 2022-03-25 | 深圳大学 | 一种息肉分割方法、装置、计算机设备及存储介质 |
CN113537375A (zh) * | 2021-07-26 | 2021-10-22 | 深圳大学 | 一种基于多尺度级联的糖尿病视网膜病变分级方法 |
CN113537375B (zh) * | 2021-07-26 | 2022-04-05 | 深圳大学 | 一种基于多尺度级联的糖尿病视网膜病变分级方法 |
CN113554668A (zh) * | 2021-07-27 | 2021-10-26 | 深圳大学 | 一种皮肤镜图像黑色素瘤分割方法、装置及相关组件 |
CN113554668B (zh) * | 2021-07-27 | 2022-02-22 | 深圳大学 | 一种皮肤镜图像黑色素瘤分割方法、装置及相关组件 |
CN113496228A (zh) * | 2021-07-30 | 2021-10-12 | 大连海事大学 | 一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法 |
CN113496228B (zh) * | 2021-07-30 | 2024-03-26 | 大连海事大学 | 一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法 |
CN113658201A (zh) * | 2021-08-02 | 2021-11-16 | 天津大学 | 基于增强型多尺度特征的深度学习结直肠癌息肉分割装置 |
CN113658201B (zh) * | 2021-08-02 | 2022-07-29 | 天津大学 | 基于增强型多尺度特征的深度学习结直肠癌息肉分割装置 |
CN113724276A (zh) * | 2021-08-04 | 2021-11-30 | 香港中文大学(深圳) | 一种息肉图像的分割方法和装置 |
CN113781489A (zh) * | 2021-08-25 | 2021-12-10 | 浙江工业大学 | 一种息肉影像语义分割方法及装置 |
CN113781489B (zh) * | 2021-08-25 | 2024-03-29 | 浙江工业大学 | 一种息肉影像语义分割方法及装置 |
CN114972155A (zh) * | 2021-12-30 | 2022-08-30 | 昆明理工大学 | 一种基于上下文信息和反向注意力的息肉图像分割方法 |
CN114972155B (zh) * | 2021-12-30 | 2023-04-07 | 昆明理工大学 | 一种基于上下文信息和反向注意力的息肉图像分割方法 |
CN114842029A (zh) * | 2022-05-09 | 2022-08-02 | 江苏科技大学 | 一种融合通道和空间注意力的卷积神经网络息肉分割方法 |
CN116188501A (zh) * | 2023-03-02 | 2023-05-30 | 江南大学 | 基于多尺度交叉注意力的医学图像分割方法 |
CN116188501B (zh) * | 2023-03-02 | 2024-02-13 | 江南大学 | 基于多尺度交叉注意力的医学图像分割方法 |
CN116958535A (zh) * | 2023-04-14 | 2023-10-27 | 三峡大学 | 一种基于多尺度残差推理的息肉分割系统及方法 |
CN116958535B (zh) * | 2023-04-14 | 2024-04-16 | 三峡大学 | 一种基于多尺度残差推理的息肉分割系统及方法 |
CN117036714A (zh) * | 2023-10-09 | 2023-11-10 | 安徽大学 | 融合混合注意力机制的肠息肉分割方法、系统及介质 |
CN117036714B (zh) * | 2023-10-09 | 2024-02-09 | 安徽大学 | 融合混合注意力机制的肠息肉分割方法、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112489061B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112489061B (zh) | 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 | |
Mahmud et al. | PolypSegNet: A modified encoder-decoder architecture for automated polyp segmentation from colonoscopy images | |
CN110189308B (zh) | 一种基于bm3d和稠密卷积网络融合的肿瘤检测方法和装置 | |
CN113674253B (zh) | 基于U-Transformer的直肠癌CT影像自动分割方法 | |
CN107492071A (zh) | 医学图像处理方法及设备 | |
CN113177943B (zh) | 一种脑卒中ct影像分割方法 | |
JP7312510B1 (ja) | 腫瘍微小環境を考慮した全スライド病理画像分類システム及び構築方法 | |
CN112884788B (zh) | 基于丰富上下文网络的视杯视盘分割方法及成像方法 | |
CN115018824A (zh) | 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法 | |
Yamanakkanavar et al. | MF2-Net: A multipath feature fusion network for medical image segmentation | |
CN111260639A (zh) | 多视角信息协作的乳腺良恶性肿瘤分类方法 | |
CN115375711A (zh) | 基于多尺度融合的全局上下文关注网络的图像分割方法 | |
CN113781489B (zh) | 一种息肉影像语义分割方法及装置 | |
CN117152433A (zh) | 一种基于多尺度跨层注意力融合网络的医学图像分割方法 | |
CN111091575B (zh) | 一种基于强化学习方法的医学图像分割方法 | |
CN114943721A (zh) | 一种建立基于改进U-Net网络的颈部超声图像分割方法 | |
CN113838047A (zh) | 基于内窥镜图像的大肠息肉分割方法、系统及相关组件 | |
CN114140437A (zh) | 一种基于深度学习的眼底硬渗出物分割方法 | |
CN117152179A (zh) | 基于U-Net和SENet实现直肠癌CT图像的分割与分类方法 | |
Yang et al. | Lesion classification of wireless capsule endoscopy images | |
AlSumairi et al. | X-ray image based pneumonia classification using convolutional neural networks | |
CN117036288A (zh) | 一种面向全切片病理图像的肿瘤亚型诊断方法 | |
CN116468887A (zh) | 一种具有普适性的结肠息肉分割方法 | |
CN116188352A (zh) | 一种基于增强边缘特征的肺结节分割方法 | |
CN115170584A (zh) | 基于多尺度Transformer的医学图像分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |