CN116958535B - 一种基于多尺度残差推理的息肉分割系统及方法 - Google Patents
一种基于多尺度残差推理的息肉分割系统及方法 Download PDFInfo
- Publication number
- CN116958535B CN116958535B CN202310398182.1A CN202310398182A CN116958535B CN 116958535 B CN116958535 B CN 116958535B CN 202310398182 A CN202310398182 A CN 202310398182A CN 116958535 B CN116958535 B CN 116958535B
- Authority
- CN
- China
- Prior art keywords
- polyp
- polyp segmentation
- module
- scale
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000037062 Polyps Diseases 0.000 title claims abstract description 115
- 230000011218 segmentation Effects 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000001514 detection method Methods 0.000 claims description 13
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 9
- 230000000903 blocking effect Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 238000007634 remodeling Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 230000003628 erosive effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 230000000694 effects Effects 0.000 description 3
- 210000004877 mucosa Anatomy 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000002052 colonoscopy Methods 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000035984 Colonic Polyps Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000010426 hand crafting Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 208000014081 polyp of colon Diseases 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
- G06T2207/30032—Colon polyp
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于多尺度残差推理的息肉分割系统及方法,包括:数据获取模块,用于获取息肉分割数据,基于所述息肉分割数据构建息肉分割数据集,并对所述息肉分割数据集进行处理;模型构建模块,用于结合多尺度残差推理构建息肉分割网络模型,并基于所述息肉分割数据集对所述息肉分割网络模型进行训练和测试;预测模块,用于基于训练和测试后的所述息肉分割网络模型获取息肉分割的预测结果。本发明针对息肉与其周围环境对比度低以及大小形状不一的情况,提高了息肉分割性能,以及预测结果的准确性。
Description
技术领域
本发明涉及医学图像分割技术领域,特别是涉及一种基于多尺度残差推理的息肉分割系统及方法。
背景技术
结肠息肉是第三大常见的癌症,它被认为是死亡率第二高的癌症,占癌症总死亡人数的9.4%。患结直肠癌的绝大多数原因都是生长在结肠或直肠内壁的息肉。早期发现可以避免癌症的发生,从而降低癌症死亡率。并且还可以通过限制癌症向其他器官扩散。目前结肠镜检查是筛查癌症的主要检查方式。然而由于息肉的形状、大小、光照和质地等不可预测因素,会造成结肠息肉的漏检和误检。此外,息肉检查的结果还取决于一些人为因素,比如医生的医学经验和疲劳程度。因此需要一个自动的计算机辅助息肉分割系统来在医生进行手术过程中帮助医生检测息肉,从而提高息肉检测率。
息肉的病变严重程度和大小会影响漏检率,在常规的息肉检查时彩色的冰晶也可能会导致某些息肉漏检。准确的息肉分割是一项非常具有挑战的任务,主要原因时同一类型的息肉具有不同的大小、颜色和纹理,息肉与其周围粘膜之间的边界不明显,很难分割出完整且准确的息肉目标。因此采用计算机视觉方法来辅助医生进行临床诊断具有很大的社会价值。
目前已经开发了很多用于息肉分割任务的各种技术,主要分为两类:1)手工制作的基于特征的方法和2)基于深度学习的方法。在神经网络盛行之前,息肉分割任务主要依赖于手工制作其特征,如大小、颜色、纹理和形状。然而由于手工制作的息肉特征表示能力低,这些方法速度慢,漏检错检率高。在基于一些深度学习的模型取得巨大成功之后,研究人员开始使用神经网络进行息肉检测和分割。受早期工作的影响,其中FCN与预先训练的模型一起用于分割息肉。U-Net网络是一种主要的方法,但由于息肉与其周围环境边界不明显且结构复杂,U-Net网络的分割效果不是很好。U-Net变体U-Net++、ResUNet、ResUNet++和ACSNet通过使用U型编码器-解码器在息肉分割上取得了令人满意的结果。虽然上述模型都用采用池化的方法来增强多尺度语义特征,但是也导致空间信息的丢失。对于与其周围粘膜对比度比较低的息肉来说,识别/分割出目标还是是十分困难的。SFANet考虑了区域边界约束以及额外的边缘监管,它取得了良好的效果但是缺乏能力。PraNet应用区域和边界线索反向关注息肉边界区域。网络中的高级特征聚合和边界关注块有助于校准一些未对齐的预测,并提高分割精度。然而这增加了模型的复杂性,可能会对测试样本的泛化能力产生不利的影响。
发明内容
本发明的目的是针对临床上结肠镜检测过程很难发现形状很小的息肉,存在漏检问题,提出一种基于多尺度残差推理的息肉分割系统及方法,提高了分割性能,以及预测结果的准确性。
为实现上述目的,本发明提供了如下方案:
一种基于多尺度残差推理的息肉分割系统,包括:
数据获取模块,用于获取息肉分割数据,基于所述息肉分割数据构建息肉分割数据集,并对所述息肉分割数据集进行处理;
模型构建模块,用于结合多尺度残差推理构建息肉分割网络模型,并基于所述息肉分割数据集对所述息肉分割网络模型进行训练和测试;
预测模块,用于基于训练和测试后的所述息肉分割网络模型获取息肉分割的预测结果。
进一步地,对所述息肉分割数据集进行处理包括:
对所述息肉分割数据集进行数据增强处理,所述数据增强处理包括随机翻转、随机缩放、添加随机膨胀和侵蚀。
进一步地,构建所述息肉分割网络模型包括:
基于主干网络对图像进行特征提取,对所提取的特征进行处理,将处理后的特征输入通道注意力模块和空间注意力模块,获取目标息肉的定位,利用聚焦模块对所述目标息肉生成初始预测图;
将所述初始预测图细化处理后输入感受野阻滞模块,用于进一步特征提取,将进一步提取的特征输入多尺度残差推理模块,获取息肉分割的检测结果。
进一步地,所述主干网络采用Res2Net-50,所述主干网络用于提取多层次特征,所述多层次特征包括低级特征和高级特征。
进一步地,所述通道注意力模块的工作过程包括:将所提取的特征作为第一输入特征,基于所述通道注意力模块对所述第一输入特征进行变换、转置、矩阵乘法、特征重塑、识别映射处理,获取第一输出特征;
所述空间注意力模块的工作过程包括:将所述第一输出特征输入所述空间注意力模块,基于所述空间注意力模块对所述第一输出特征进行卷积重塑、矩阵乘法、特征重塑处理,获取第二输出特征。
进一步地,所述聚焦模块的工作过程包括:
将所述第一输入特征和所述第二输出特征作为输入,对输入的所述第二输出特征进行上采样和归一化处理,生成前景关注特征和背景关注特征,将所述前景关注特征和背景关注特征输入并行上下文探索模块进行上下文推理,获取假阳性干扰;
对输入的所述第一输入特征进行卷积、归一化、ReLU和上采样处理,生成第三输出特征,对所述假阳性干扰和所述第三输出特征进行处理,获取细化特征。
进一步地,所述并行上下文探索模块包括若干上下文探索单元,每个上下文探索单元包括若干卷积层,每个卷积之后连接批归一化层和ReLU非线性操作,基于感受野阻滞模块对每个上下文探索单元的输出进行处理,并对处理后的结果进行卷积拼接、函数激活,获取所述假阳性干扰。
进一步地,所述多尺度残差推理模块包括卷积层和多尺度残余块,所述多尺度残差推理模块用于检测局部和多尺度特征,实现旁路之间地信息彼此共享。
进一步地,所述多尺度残余块包括多尺度特征融合单元和局部残差学习单元,所述多尺度残余块用于对所述多尺度特征融合单元和局部残差学习单元的输出进行拼接、X级联操作后输入卷积层,获取融合的多尺度特征,基于所述融合的多尺度特征生成息肉分割的检测结果。
为进一步优化技术方案,本发明还提供了一种基于多尺度残差推理的息肉分割方法,包括:
构建息肉分割数据集,对所述数据集进行处理;
结合多尺度残差推理构建息肉分割网络模型,基于所述数据集对所述息肉分割网络模型进行训练和测试;
利用训练和测试后的息肉分割网络模型完成息肉分割的预测。
本发明的有益效果为:
本发明受生物视觉启发,设计一种“识别-聚焦”以及多特征融合推理的模型算法框架,将主干网络得到的最高层特征利用一个通道注意力模块和一个空间注意力模块来粗略“识别”息肉目标位置,然后利用聚焦模块来对模糊区域逐步细化粗略预测;将粗略预测的结果充当注意力图引导细化浅层特征,然后通过一个多尺度残差推理预测模块获得融合的多尺度信息得到最终的预测结果;针对息肉与其周围环境对比度低以及大小形状不一的情况,提高了息肉分割性能,以及预测结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的息肉分割算法模型的网络结构图;
图2为本发明实施例的通道注意力CA模块结构图;
图3为本发明实施例的空间注意力SA模块结构图;
图4为本发明实施例的聚焦FM模块结构图;
图5为本发明实施例的上下文探索CE模块结构图;
图6为本发明实施例的感受野阻滞FBR模块结构图;
图7为本发明实施例的多尺度残差推理MSFR模块结构图;
图8为本发明实施例的多尺度残差块MRBs的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本实施例提供了一种基于多尺度残差推理的息肉分割系统,包括:
数据获取模块,用于获取息肉分割数据,基于息肉分割数据构建息肉分割数据集,并对息肉分割数据集进行处理;
模型构建模块,用于结合多尺度残差推理构建息肉分割网络模型,并基于息肉分割数据集对息肉分割网络模型进行训练和测试;
预测模块,用于基于训练和测试后的息肉分割网络模型获取息肉分割的预测结果。
为进一步优化技术方案,本实施例还提供了一种基于多尺度残差推理的息肉分割方法,包括:
S1.数据集的构建与整理
整理基于Kvasir,CVC-ClinicDB,ETIS,CVC-ColonDB和CVC-300的五个息肉分割数据集如表1所示,进行训练集和测试集的划分如表2所示。
表1
表2
S2.对数据集进行数据增强
对数据集进行数据增强,在水平轴和垂直轴上的随机翻转,从0.75到1.25的随机图像缩放;进行0-359度的随机翻转,因为结肠镜检查图像可能会在检查期间发生旋转;对真值图像标签添加额外的随机膨胀和侵蚀,以增强其泛化能力。
S3.息肉分割网络模型的设计
息肉分割网络模型的设计主要包括两个部分:
(1)受生物视觉的启发,模拟其发现目标的过程,首先识别目标,以全局角度定位目标对象,然后聚焦模糊区域来逐步细化粗略预测。在高级特征上应用定位模块来定位潜在的目标,然后利用两个聚焦模块逐步发现并消除真错误目标和假正确目标,以准确识别目标息肉,生成初步粗略的预测图fD。
(2)将初步预测到的结果fD作为注意力图送入到底层特征用来引导其特征融合,然后经过设计出的新的MSFR模块,利用融合后的多层特征信息预测出最终的分割结果。
息肉分割算法模型的网络结构如图1所示,采用Res2Net-50作为骨干网络来提取特征,表示为fi,i=1,2,...,5,在本模型中,提取的特征分为两组,即低级特征Ql={f1,f2,f3}和高级特征Qh={f3,f4,f5}。给定单个RGB图像,首先将其输入到ResNet主干中,以提取多层次特征。然后将高级特征进一步输入到三个卷积层中以减少信道。然后再f5层特征上利用通道注意力CA模块和空间注意力SA模块来定位潜在的目标对象,然后利用两个聚焦FM模块逐步得到粗略的初始预测图。将其输出的粗略的初始预测图充当注意力图fD来细化低水平特征,然后将融合后的特征经过感受野阻滞RFB模块扩大感受野,获得更为丰富的特征信息以减少计算。然后将丰富后的特征级联馈送到多尺度残差推理MSFR模块来生成最终的检测结果,该模块可以通过多尺度策略利用低级别特征,从而获得最终的分割结果。
如图2、图3所示,说明了通道注意力CA模块和空间注意力SA模块的详细结构。
给定输入特征F∈RC×H×W,其中C,H和W分别表示信道数、高度和宽度,将F变换得到Q,K和V,其中{Q,K,V}∈RC×N,N=H×W是像素数,在Q和K的转置之间执行矩阵乘法,并应用softmax层来计算信道注意力图X∈RC×C:
其中,Qi:表示矩阵Q的第i行,xij表示第j个信道对第i个信道的影响。
在X和V之间执行矩阵乘法,并将聚集的注意力特征重塑为RC×H×W。为了增强容错能力,将结果乘以科学习的尺度参数γ,并执行识别映射操作以获得最终输出F′∈RC×H×W
其中,γ从初值1逐渐学习权重。最终特征F′对特征图通道之间的长距离语义依赖性进行建模,因此输入特征更具有辨别力。
将通道注意力CA模块的输出特征作为输入馈入到空间注意力SA模块中:首先在输入特征F′上使用三个1×1卷积,并重塑卷积结果以分别生成三个新的特征图Q′,K′和V′,其中和C1=C/8,V′∈RC×N。然后,在Q′和K′的转置之间执行矩阵乘法,并使用softmax归一化来生成空间注意力X′∈RN×N:
其中,Q′:i表示矩阵Q′的第i列,X′ij表示第j个位置对第i个位置的影响。同时,在V′和X′的转置之间进行矩阵乘法,并将结果重塑为RC×H×W。类似于信道关注块,将结果乘以科学习的尺度参数γ′,并添加一个F′,以获得最终的输出F″∈RC×H×W:
其中,γ′也初始化为1。在F′的基础上,F″进一步获得了所有位置之间的语义相关性,从而增强了特征的语义表示。最后,可以通过在F″上应用填充为3的7×7卷积来获得目标的初始位置图。
F″和初始位置图将通过以下聚焦FM模块逐步得出,由于息肉于其周围粘膜对比度比较低,因此在分割的过程中会出现假阳性和假阴性预测。聚焦FM模块被设计为首先发现然后去除这些错误预测,它将从主干的高层特征f3和f4以及更高级别的预测作为输入,从而输出细化的特征和更准确的预测。
如图4所示,聚焦FM模块首先对更高级别的预测进行上采样,并使用S型层对其进行归一化。然后使用该归一化映射及其反向版本来乘以当前级别特征Fc,以分别生成前景关注特征Ffa和背景关注特征Fba。最后将这两种类型的特征输入到两个并行上下文探索CE模块中,以执行上下文推理,分别发现假阳性干扰Ffpd和假阳性干扰Ffnd。
高水平特征Fh经过CBR(Conv+BN+ReLU)后再经过上采样得到Fup。
将Fup与Ffpd乘以α的积做逐元素减法运算,将得到的值送入到BR(BN+ReLU),用来抑制模糊背景得到Fr。将Fr与Ffnd乘以β的积做逐元素加法运算,将得到的值进行BR操作后得到细化后的特征F′r。
Fup=U(CBR(Fh)), (5)
Fr=BR(Fup-αFfpd), (6)
F′r=BR(Fr+βFfnd), (7)
其中,Fh和F′r分别表示高级特征和输出细化特征;CBR是卷积、批处理归一化(BN)和ReLU的组合;U是双线性上采样;α和β是初始化为1的可学习尺度参数。
如图5所示,上下文探索CE模块由四个上下文探索分支组成,每个分支包括用于信道缩减的3×3卷积、用于局部特征提取的ki×ki卷积和用于上下文感知的扩张率为ri的3×2扩展卷积。将ki,i∈{1,2,3,4}设置为1,3,5,7,并将ri,i∈{1,2,3,4}为1,2,4,8。每个卷积之后是批归一化层和ReLU非线性操作。第i,i∈{1,2,3}个上下文探索CE模块分支的输出将被馈送到第(i+1)个分支,以在更大的感受野阻滞RFB模块中进一步处理。然后通过3×3卷积将所有四个分支的输出级联并融合。通过这样的上下文探索CE模块获得了在广泛范围内感知丰富上下文的能力,因此可以用于上下文推理。
如图6所示,感受野阻滞RFB模块结构为:
分支1:输入→1×1卷积;
分支2:输入→1×1卷积→1×3卷积→3×1卷积→3×3卷积(dilation=3);
分支3:输入→1×1卷积→1×5卷积→5×1卷积→3×3卷积(dilation=5);
分支4:输入→1×1卷积→1×7卷积→7×1卷积→3×3卷积(dilation=7);
上述四个分支的输出拼接,然后做3×3卷积,与输入x的1×1卷积结果拼接后再送入激活函数得到输出结果。
如图7所示,多尺度残差推理MSFR模块结构为:
输入→1×1卷积→多尺度残余块MRBs→1×1卷积→多尺度残余块MRBs→1×1卷积。
在MSFR模块中,为了充分利用多尺度信息,加入多尺度残差块MRBs来检测局部和多尺度特征。具体来说就是构建一个双流网络,每个流使用不同卷积核,旁路之间地信息彼此共享。
本实施例提出了一个新的旁路信息共享多尺度残差块MRBs,主要通过引入不同大小的卷积核来自适应地检测不同尺度地图像特征,同时让这些特征相互作用以获得最有效地图像信息。
如图8所示,本实施例提出的新的旁路信息共享多尺度残差块MRBs主要包括两个部分:多尺度特征融合和局部残差学习。旁路信息共享多尺度残差块MRBs在多尺度残差块MRB的基础上将旁路之间地信息彼此共享,从而能检测不同尺度地图像特征。模块利用了残差学习,使得网络更加高效,计算复杂度大大降低。具体结构如下:
分支1:输入特征X→3×3卷积→正则归一化→ReLU激活函数→X1;
分支2:输入特征X→5×5卷积→正则归一化→ReLU激活函数→X2;
X1与X2执行拼接操作→3×3反卷积→正则归一化→ReLU激活函数→F1;
X1与X2执行拼接操作→5×5反卷积→正则归一化→ReLU激活函数→F2;
将上述两个分支的输出F1与F2进行拼接操作,然后与输入特征X级联后馈送到3×3卷积中去,以获得融合的多尺度特征表示。
S4.网络模型的训练、测试和评估
使用Kvasir-SEG和CVC-ClinicDB两个数据集的训练集对模型进行训练得到训练权重。
使用五个数据集对训练好的模型进行测试,首先在Kvasir-SEG和CVC-ClinicDB数据集的测试集上进行测试,来评估模型的性能;然后在ETIS,CVC-ColonDB和CVC-300三个未知的数据集上进行测试,来评估模型的泛化性。
本发明受生物视觉启发,设计一种“识别-聚焦”以及多特征融合推理的模型算法框架,将主干网络得到的最高层特征利用一个通道注意力模块和一个空间注意力模块来粗略“识别”息肉目标位置,然后利用聚焦模块来对模糊区域逐步细化粗略预测;将粗略预测的结果充当注意力图引导细化浅层特征,然后通过一个多尺度残差推理预测模块获得融合的多尺度信息得到最终的预测结果;针对息肉与其周围环境对比度低以及大小形状不一的情况,提高了息肉分割性能,以及预测结果的准确性。
以上所述的实施例仅是对本发明优选方式进行的描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (8)
1.一种基于多尺度残差推理的息肉分割系统,其特征在于,包括:
数据获取模块,用于获取息肉分割数据,基于所述息肉分割数据构建息肉分割数据集,并对所述息肉分割数据集进行处理;
对所述息肉分割数据集进行处理包括:
对所述息肉分割数据集进行数据增强处理,所述数据增强处理包括随机翻转、随机缩放、添加随机膨胀和侵蚀;
模型构建模块,用于结合多尺度残差推理构建息肉分割网络模型,并基于所述息肉分割数据集对所述息肉分割网络模型进行训练和测试;
构建所述息肉分割网络模型包括:
基于主干网络对图像进行特征提取,对所提取的特征进行处理,将处理后的特征输入通道注意力模块和空间注意力模块,获取目标息肉的定位,利用聚焦模块对所述目标息肉生成初始预测图;
将所述初始预测图细化处理后输入感受野阻滞模块,用于进一步特征提取,将进一步提取的特征输入多尺度残差推理模块,获取息肉分割的检测结果;
预测模块,用于基于训练和测试后的所述息肉分割网络模型获取息肉分割的预测结果。
2.根据权利要求1所述的基于多尺度残差推理的息肉分割系统,其特征在于,所述主干网络采用Res2Net-50,所述主干网络用于提取多层次特征,所述多层次特征包括低级特征和高级特征。
3.根据权利要求1所述的基于多尺度残差推理的息肉分割系统,其特征在于,所述通道注意力模块的工作过程包括:将所提取的特征作为第一输入特征,基于所述通道注意力模块对所述第一输入特征进行变换、转置、矩阵乘法、特征重塑、识别映射处理,获取第一输出特征;
所述空间注意力模块的工作过程包括:将所述第一输出特征输入所述空间注意力模块,基于所述空间注意力模块对所述第一输出特征进行卷积重塑、矩阵乘法、特征重塑处理,获取第二输出特征。
4.根据权利要求3所述的基于多尺度残差推理的息肉分割系统,其特征在于,所述聚焦模块的工作过程包括:
将所述第一输入特征和所述第二输出特征作为输入,对输入的所述第二输出特征进行上采样和归一化处理,生成前景关注特征和背景关注特征,将所述前景关注特征和背景关注特征输入并行上下文探索模块进行上下文推理,获取假阳性干扰;
对输入的所述第一输入特征进行卷积、归一化、ReLU和上采样处理,生成第三输出特征,对所述假阳性干扰和所述第三输出特征进行处理,获取细化特征。
5.根据权利要求4所述的基于多尺度残差推理的息肉分割系统,其特征在于,所述并行上下文探索模块包括若干上下文探索单元,每个上下文探索单元包括若干卷积层,每个卷积之后连接批归一化层和ReLU非线性操作,基于感受野阻滞模块对每个上下文探索单元的输出进行处理,并对处理后的结果进行卷积拼接、函数激活,获取所述假阳性干扰。
6.根据权利要求5所述的基于多尺度残差推理的息肉分割系统,其特征在于,所述多尺度残差推理模块包括卷积层和多尺度残余块,所述多尺度残差推理模块用于检测局部和多尺度特征,实现旁路之间地信息彼此共享。
7.根据权利要求6所述的基于多尺度残差推理的息肉分割系统,其特征在于,所述多尺度残余块包括多尺度特征融合单元和局部残差学习单元,所述多尺度残余块用于对所述多尺度特征融合单元和局部残差学习单元的输出进行拼接、级联操作后输入卷积层,获取融合的多尺度特征,基于所述融合的多尺度特征生成息肉分割的检测结果。
8.一种根据权利要求1-7任一项所述的基于多尺度残差推理的息肉分割系统的分割方法,其特征在于,包括:
构建息肉分割数据集,对所述数据集进行处理;
结合多尺度残差推理构建息肉分割网络模型,基于所述数据集对所述息肉分割网络模型进行训练和测试;
利用训练和测试后的息肉分割网络模型完成息肉分割的预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310398182.1A CN116958535B (zh) | 2023-04-14 | 2023-04-14 | 一种基于多尺度残差推理的息肉分割系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310398182.1A CN116958535B (zh) | 2023-04-14 | 2023-04-14 | 一种基于多尺度残差推理的息肉分割系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116958535A CN116958535A (zh) | 2023-10-27 |
CN116958535B true CN116958535B (zh) | 2024-04-16 |
Family
ID=88457140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310398182.1A Active CN116958535B (zh) | 2023-04-14 | 2023-04-14 | 一种基于多尺度残差推理的息肉分割系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116958535B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117830226A (zh) * | 2023-12-05 | 2024-04-05 | 广州恒沙云科技有限公司 | 一种基于边界约束的息肉分割方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10426442B1 (en) * | 2019-06-14 | 2019-10-01 | Cycle Clarity, LLC | Adaptive image processing in assisted reproductive imaging modalities |
CN112001960A (zh) * | 2020-08-25 | 2020-11-27 | 中国人民解放军91550部队 | 基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法 |
CN112489061A (zh) * | 2020-12-09 | 2021-03-12 | 浙江工业大学 | 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 |
CN112712528A (zh) * | 2020-12-24 | 2021-04-27 | 浙江工业大学 | 一种多尺度u型残差编码器与整体反向注意机制结合的肠道病灶分割方法 |
CN112750140A (zh) * | 2021-01-21 | 2021-05-04 | 大连理工大学 | 基于信息挖掘的伪装目标图像分割方法 |
CN113592878A (zh) * | 2021-06-29 | 2021-11-02 | 中国人民解放军陆军工程大学 | 一种紧致的多尺度视频前景分割方法 |
CN113658201A (zh) * | 2021-08-02 | 2021-11-16 | 天津大学 | 基于增强型多尺度特征的深度学习结直肠癌息肉分割装置 |
CN114241218A (zh) * | 2021-12-15 | 2022-03-25 | 杭州电子科技大学 | 一种基于逐级注意力机制的目标显著性检测方法 |
CN114820635A (zh) * | 2022-04-21 | 2022-07-29 | 重庆理工大学 | 联合注意力u形网络和多尺度特征融合的息肉分割方法 |
CN114842029A (zh) * | 2022-05-09 | 2022-08-02 | 江苏科技大学 | 一种融合通道和空间注意力的卷积神经网络息肉分割方法 |
CN115601330A (zh) * | 2022-10-20 | 2023-01-13 | 湖北工业大学(Cn) | 一种基于多尺度空间反向注意力机制的结肠息肉分割方法 |
-
2023
- 2023-04-14 CN CN202310398182.1A patent/CN116958535B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10426442B1 (en) * | 2019-06-14 | 2019-10-01 | Cycle Clarity, LLC | Adaptive image processing in assisted reproductive imaging modalities |
CN112001960A (zh) * | 2020-08-25 | 2020-11-27 | 中国人民解放军91550部队 | 基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法 |
CN112489061A (zh) * | 2020-12-09 | 2021-03-12 | 浙江工业大学 | 一种基于多尺度信息与并行注意力机制的深度学习肠道息肉分割方法 |
CN112712528A (zh) * | 2020-12-24 | 2021-04-27 | 浙江工业大学 | 一种多尺度u型残差编码器与整体反向注意机制结合的肠道病灶分割方法 |
CN112750140A (zh) * | 2021-01-21 | 2021-05-04 | 大连理工大学 | 基于信息挖掘的伪装目标图像分割方法 |
CN113592878A (zh) * | 2021-06-29 | 2021-11-02 | 中国人民解放军陆军工程大学 | 一种紧致的多尺度视频前景分割方法 |
CN113658201A (zh) * | 2021-08-02 | 2021-11-16 | 天津大学 | 基于增强型多尺度特征的深度学习结直肠癌息肉分割装置 |
CN114241218A (zh) * | 2021-12-15 | 2022-03-25 | 杭州电子科技大学 | 一种基于逐级注意力机制的目标显著性检测方法 |
CN114820635A (zh) * | 2022-04-21 | 2022-07-29 | 重庆理工大学 | 联合注意力u形网络和多尺度特征融合的息肉分割方法 |
CN114842029A (zh) * | 2022-05-09 | 2022-08-02 | 江苏科技大学 | 一种融合通道和空间注意力的卷积神经网络息肉分割方法 |
CN115601330A (zh) * | 2022-10-20 | 2023-01-13 | 湖北工业大学(Cn) | 一种基于多尺度空间反向注意力机制的结肠息肉分割方法 |
Non-Patent Citations (2)
Title |
---|
基于多尺度特征融合和反向注意力机制的肠道息肉分割技术研究;宋鑫磊;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20230115(第1期);E072-1069 * |
基于深度学习的医学图像自动分割算法研究;仇广杰;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20220315(第3期);E060-30 * |
Also Published As
Publication number | Publication date |
---|---|
CN116958535A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Toğaçar et al. | A deep feature learning model for pneumonia detection applying a combination of mRMR feature selection and machine learning models | |
Afshar et al. | Covid-caps: A capsule network-based framework for identification of covid-19 cases from x-ray images | |
CN110378381B (zh) | 物体检测方法、装置和计算机存储介质 | |
JP2021513435A (ja) | 胃腸腫瘍を診断するシステム及び方法 | |
Tang et al. | A multi-stage framework with context information fusion structure for skin lesion segmentation | |
Aatresh et al. | LiverNet: efficient and robust deep learning model for automatic diagnosis of sub-types of liver hepatocellular carcinoma cancer from H&E stained liver histopathology images | |
CN113191390B (zh) | 一种图像分类模型的构建方法、图像分类方法及存储介质 | |
Sivaramakrishnan et al. | Visualizing abnormalities in chest radiographs through salient network activations in deep learning | |
Zhang et al. | Urine sediment recognition method based on multi-view deep residual learning in microscopic image | |
Yan et al. | Monocular depth estimation with guidance of surface normal map | |
CN116958535B (zh) | 一种基于多尺度残差推理的息肉分割系统及方法 | |
CN113129293A (zh) | 医学图像分类方法、装置、计算机设备和存储介质 | |
Song et al. | OAU-net: Outlined Attention U-net for biomedical image segmentation | |
CN113610118A (zh) | 一种基于多任务课程式学习的眼底图像分类方法、装置、设备及介质 | |
EP4293628A1 (en) | Image processing method and related apparatus | |
Li et al. | Application of semi-supervised learning in image classification: Research on fusion of labeled and unlabeled data | |
Yue et al. | Boundary uncertainty aware network for automated polyp segmentation | |
Yang et al. | NAUNet: lightweight retinal vessel segmentation network with nested connections and efficient attention | |
Peng et al. | Cov-TransNet: Dual branch fusion network with transformer for COVID-19 infection segmentation | |
Lafraxo et al. | Computer-aided system for bleeding detection in wce images based on cnn-gru network | |
Shamrat et al. | An advanced deep neural network for fundus image analysis and enhancing diabetic retinopathy detection | |
CN111598844B (zh) | 一种图像分割方法、装置、电子设备和可读存储介质 | |
Liu et al. | Polyp segmentation with distraction separation | |
Hossain et al. | Non-invasive covid-19 screening using deep learning-based multilevel fusion model with an attention mechanism | |
Li et al. | TSRL-Net: Target-aware supervision residual learning for stroke segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |