CN115439470B - 息肉图像分割方法、计算机可读存储介质及计算机设备 - Google Patents
息肉图像分割方法、计算机可读存储介质及计算机设备 Download PDFInfo
- Publication number
- CN115439470B CN115439470B CN202211261125.0A CN202211261125A CN115439470B CN 115439470 B CN115439470 B CN 115439470B CN 202211261125 A CN202211261125 A CN 202211261125A CN 115439470 B CN115439470 B CN 115439470B
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- channel
- polyp
- semantic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000037062 Polyps Diseases 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000003709 image segmentation Methods 0.000 title claims abstract description 24
- 230000004927 fusion Effects 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 230000002776 aggregation Effects 0.000 claims abstract description 15
- 238000004220 aggregation Methods 0.000 claims abstract description 15
- 230000008447 perception Effects 0.000 claims abstract description 10
- 230000007246 mechanism Effects 0.000 claims description 38
- 230000004913 activation Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 3
- 230000011218 segmentation Effects 0.000 abstract description 3
- 238000001839 endoscopy Methods 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 208000023445 Congenital pulmonary airway malformation Diseases 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种息肉图像分割方法、计算机可读存储介质及计算机设备,包括:将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图。可以适应息肉变化实现精准息肉分割。
Description
技术领域
本申请属于图像分割领域,尤其涉及一种息肉图像分割方法、计算机可读存储介质及计算机设备。
背景技术
结直肠癌是在最早期主要表现形式是肠道内所形成的息肉(肠胃通道内隆起的肿块)经过长时间以及诸多原因发展导致结直肠癌,如果能够在早期进行干预发现和切除息肉,直肠癌是可以被预防的,那么最为有效的筛查和诊断结直肠癌的方法是结直肠内窥镜检查也是目前最为主流诊断准确率最高的方法。
然而,当前的诊断方式虽然先进和准确依旧存在一些问题,根据一些专业的研究报道,在内窥镜检查的过程中每四个息肉就会遗漏掉一个导致切除不干净留下隐患,另外息肉的形状大小不一且多变,难以通过肉眼进行每一个精细地判断,尤其在一些息肉与肠胃通道背景差异不大的情况下,最后就是不能够进行快速识别纯靠人为是需要大量的时间精力和判断在当前医疗系统之下需要增加消化科医生大量的工作量进行。
发明内容
本申请的目的在于提供一种息肉图像分割方法、计算机可读存储介质及计算机设备,旨在解决内窥镜检查息肉会遗漏掉导致切除不干净留下隐患的问题。
第一方面,本申请提供了一种息肉图像分割方法,包括:
获取待分割的息肉图像;
将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;所述多尺度语义融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始特征图,将初始特征图分成4个通道数量相等的特征图,选择其中3个特征图经由卷积和批量正则化算法后与剩余的一个特征图依次以通道维度进行拼接,经由残差连接拼接后得到的特征图再与待分割的息肉图像进行融合,得到语义信息图像;
将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图;
所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,将四个特征图降维后再依次进行上采样,得到与高维的语义信息图像尺寸相同的上采样后的特征图,将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图;将拼接后的特征图采用卷积进行通道维度的降维,再利用Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,得到基于空间注意力机制的特征图;将拼接后的特征图进行特征提取后输入到通道注意力机制中,得到通道权重,得到基于通道注意力机制的特征图;将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图。
进一步地,所述多尺度语义融合模型的具体流程为:
定义待分割的息肉图像X为:X∈RC×H×W,将待分割的息肉图像通过W1(·)进行特征提取,得到一个与待分割的息肉图像尺寸相同的初始特征图X′为:X′∈RC×H×W;
所述W1(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数;
将其中3个特征图X1,X2,X3经由W2(·)进行转变,将转变后的特征图W2(X1),W2(X2),W2(X3)与剩余的一个特征图X0依次以通道维度进行拼接,得到与待分割的息肉图像通道数量一致的拼接后的特征图XCat,即:
XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0);
所述W2(·)包括3×3卷积和批量正则化算法;
由残差连接拼接后的特征图,再与待分割的息肉图像进行融合,输出语义信息图像XOut,即:
其中,R代表三维数组图像,C,H和W分别表示图像的通道数,长度和宽度;表示像素级别的加法求和运算,CONCAT表示通道维度上的拼接;W3(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数。
进一步地,所述上下文感知金字塔聚合模型包括上下文感知融合模型和注意力校正模型。
进一步地,所述上下文感知融合模型的具体操作流程为:
定义输入的高维的语义信息图像D为D∈RC×H×W,使用多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,分别为:D0∈RC×6×6,D1∈RC×3×3,D2∈RC×2×2和D3∈RC×1×1;
将四个特征图经过1×1的卷积、批量正则化算法和ReLU非线性激活函数分别进行降维,将通道数压缩至四分之一,即:
再将降维后的特征图进行上采样,得到与高维的语义信息图像D尺寸相同的上采样后的特征图D″i,即:
D″i=(Up(D′i,βi));
将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图DCat,即:
DCat=CONCAT(D″0,D″1,D″2,D″3);
进一步地,所述注意力校正模型的具体操作流程为:
将拼接后的特征图采用1×1卷积进行通道维度的降维,再经过Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,建模空间注意力机制,得到基于空间注意力机制的特征图DSpatial,即:
将拼接后的特征图进行特征提取得到提取后的特征图,将提取后的特征图输入到通道注意力机制中,得到通道权重,和基于通道注意力机制的特征图,即:
其中,FAdaptive(i)能采用不同的卷积核大小局部地实现跨通道信息交互,G(i)表示全局平均池化H′,W′指的是像素空间坐标,Dchannel代表通道维度注意力机制,i,j代表自然数,θ是G(i)的相关系数;
将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图DOut,即:
第二方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的息肉图像分割方法的步骤。
第三方面,本申请提供了一种计算机设备,包括:一个或多个处理器、存储器以及一个或多个计算机程序,所述处理器和所述存储器通过总线连接,其中所述一个或多个计算机程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述处理器执行所述计算机程序时实现所述的息肉图像分割方法的步骤。
在本申请中,设计了多尺度语义融合模型,通过多种滤波器去收集不同尺度的语义信息图像来提升表征能力,从而适应息肉尺寸变化,尤其是对较小的息肉,内部采用了更细粒度级别,通过使用不同尺度的卷积核来进行特征提取从而实现增大网络的感受野;设计了上下文感知金字塔聚合模型,引导不同区域的特征信息进行融合,内部包含双重注意力机制,进一步强化重要特征,高效的抑制非重要区域的特征,实现精准息肉分割并兼顾实时性。
附图说明
图1是本申请一实施例提供的一种息肉图像分割方法的流程图。
图2是本申请一实施例提供的另一种息肉图像分割方法的流程图。
图3是本申请一实施例提供的多尺度语义融合模型的流程图。
图4是本申请一实施例提供的上下文感知融合模型的流程图。
图5是本申请一实施例提供的注意力校正模型的流程图。
图6是本申请一实施例提供的与当前先进的息肉图像分割方法对比的数据分析表格。
图7是本申请一实施例提供的计算机设备的具体结构框图。
具体实施方式
为了使本申请的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
请参阅图1,本申请一实施例提供的息肉图像分割方法包括以下步骤:需注意的是,若有实质上相同的结果,本申请的息肉图像分割方法并不以图1所示的流程顺序为限。
S101、获取待分割的息肉图像;
S102、将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;所述多尺度语义融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始特征图,将初始特征图分成4个通道数量相等的特征图,选择其中3个特征图经由卷积和批量正则化算法后与剩余的一个特征图依次以通道维度进行拼接,经由残差连接拼接后得到的特征图再与待分割的息肉图像进行融合,得到语义信息图像;
S103、将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图;
S104、所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,将四个特征图降维后再依次进行上采样,得到与高维的语义信息图像尺寸相同的上采样后的特征图,将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图;将拼接后的特征图采用卷积进行通道维度的降维,再利用Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,得到基于空间注意力机制的特征图;将拼接后的特征图进行特征提取后输入到通道注意力机制中,得到通道权重,得到基于通道注意力机制的特征图;将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图。
参阅图2,001代表多尺度语义融合模型,002代表下采样,003代表上下文感知金字塔聚合模型,004代表上采样;CAF代表上下文感知融合模型,APO代表注意力校正模型;005代表卷积特征提取;左右两边对称,左边区域为编码区,右边为解码区,折线箭头代表跳跃连接操作。
请参阅图3,在本申请一实施例中,所述多尺度语义融合模型(即MSFM)的具体流程为:
定义待分割的息肉图像X为:X∈RC×H×W,将待分割的息肉图像通过W1(i)进行特征提取,得到一个与待分割的息肉图像尺寸相同的初始特征图X′为:X′∈RC×H×W;
所述W1(i)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数;
将其中3个特征图X1,X2,X3经由W2(·)进行转变,将转变后的特征图W2(X1),W2(X2),W2(X3)与剩余的一个特征图X0依次以通道维度进行拼接,得到与待分割的息肉图像通道数量一致的拼接后的特征图XCat,即:
XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0);
所述W2(·)包括3×3卷积和批量正则化算法;
由残差连接拼接后的特征图,再与待分割的息肉图像进行融合,输出语义信息图像XOut,即:
其中,R代表三维数组图像,C,H和W分别表示图像的通道数,长度和宽度;表示像素级别的加法求和运算,CONCAT表示通道维度上的拼接;W3(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数。
在本申请一实施例中,所述上下文感知金字塔聚合模型(即CPAM)包括上下文感知融合模型和注意力校正模型。
在本申请一实施例中,所述上下文感知融合模型的具体操作流程为:
定义输入的高维的语义信息图像D为D∈RC×H×W,使用多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,分别为:D0∈RC×6×6,D1∈RC×3×3,D2∈RC×2×2和D3∈RC×1×1;
将四个特征图经过1×1的卷积、批量正则化算法和ReLU非线性激活函数分别进行降维,将通道数压缩至四分之一,即:
再将降维后的特征图进行上采样,得到与高维的语义信息图像D尺寸相同的上采样后的特征图D″i,即:
D″i=(Up(D′i,βi));
将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图DCat,即:
DCat=CONCAT(D″0,D″1,D″2,D″3);
请参阅图4,图中CBR代表1×1的卷积、批量正则化算法和ReLU非线性激活函数。
在本申请一实施例中,请参阅图5,所述注意力校正模型的具体操作流程为:
将拼接后的特征图采用1×1卷积进行通道维度的降维,再经过Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,建模空间注意力机制,得到基于空间注意力机制的特征图DSpatial,即:
将拼接后的特征图进行特征提取得到提取后的特征图,将提取后的特征图输入到通道注意力机制中,得到通道权重,和基于通道注意力机制的特征图,即:
其中,FAdaptive(·)能采用不同的卷积核大小局部地实现跨通道信息交互,G(·)表示全局平均池化H′,W′指的是像素空间坐标,Dchannel代表通道维度注意力机制,i,j代表自然数,θ是G(·)的相关系数;
将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图DOut,即:
图6是本申请一实施例提供的与当前先进的息肉图像分割方法的对比的数据分析表格,可以更直观的展示各类性能指标。
本申请一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请一实施例提供的息肉图像分割方法的步骤。
图7示出了本申请一实施例提供的计算机设备的具体结构框图,一种计算机设备100包括:一个或多个处理器101、存储器102、以及一个或多个计算机程序,其中所述处理器101和所述存储器102通过总线连接,所述一个或多个计算机程序被存储在所述存储器102中,并且被配置成由所述一个或多个处理器101执行,所述处理器101执行所述计算机程序时实现如本申请一实施例提供的息肉图像分割方法的步骤。
计算机设备包括服务器和终端等。该计算机设备可以是台式计算机、移动终端或车载设备,移动终端包括手机、平板电脑、个人数字助理或可穿戴设备等中的至少一种。
在本申请实施例中,设计了多尺度语义融合模型,通过多种滤波器去收集不同尺度的语义信息图像来提升表征能力,从而适应息肉尺寸变化,尤其是对较小的息肉,内部采用了更细粒度级别,通过使用不同尺度的卷积核来进行特征提取从而实现增大网络的感受野;设计了上下文感知金字塔聚合模型,引导不同区域的特征信息进行融合,内部包含双重注意力机制,进一步强化重要特征,高效的抑制非重要区域的特征,实现精准息肉分割并兼顾实时性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。
Claims (7)
1.一种息肉图像分割方法,其特征在于,包括:
获取待分割的息肉图像;
将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;所述多尺度语义融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始特征图,将初始特征图分成4个通道数量相等的特征图,选择其中3个特征图经由卷积和批量正则化算法后与剩余的一个特征图依次以通道维度进行拼接,经由残差连接拼接后得到的特征图再与待分割的息肉图像进行融合,得到语义信息图像;
将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图;
所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,将四个特征图降维后再依次进行上采样,得到与高维的语义信息图像尺寸相同的上采样后的特征图,将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图;将拼接后的特征图采用卷积进行通道维度的降维,再利用Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,得到基于空间注意力机制的特征图;将拼接后的特征图进行特征提取后输入到通道注意力机制中,得到通道权重,得到基于通道注意力机制的特征图;将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图。
2.如权利要求1所述的息肉图像分割方法,其特征在于,所述多尺度语义融合模型的具体流程为:
定义待分割的息肉图像X为:X∈RC×H×W,将待分割的息肉图像通过W1(·)进行特征提取,得到一个与待分割的息肉图像尺寸相同的初始特征图X′为:X′∈RC×H×W;
所述W1(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数;
将其中3个特征图X1,X2,X3经由W2(·)进行转变,将转变后的特征图W2(X1),W2(X2),W2(X3)与剩余的一个特征图X0依次以通道维度进行拼接,得到与待分割的息肉图像通道数量一致的拼接后的特征图XCat,即:
XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0);
所述W2(·)包括3×3卷积和批量正则化算法;
由残差连接拼接后的特征图,再与待分割的息肉图像进行融合,输出语义信息图像XOut,即:
3.如权利要求1所述的息肉图像分割方法,其特征在于,所述上下文感知金字塔聚合模型包括上下文感知融合模型和注意力校正模型。
4.如权利要求3所述的息肉图像分割方法,其特征在于,所述上下文感知融合模型的具体操作流程为:
定义输入的高维的语义信息图像D为D∈RC×H×W,使用多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,分别为:D0∈RC×6×6,D1∈RC×3×3,D2∈RC×2×2和D3∈RC ×1×1;
将四个特征图经过1×1的卷积、批量正则化算法和ReLU非线性激活函数分别进行降维,将通道数压缩至四分之一,即:
再将降维后的特征图进行上采样,得到与高维的语义信息图像D尺寸相同的上采样后的特征图D″i,即:
D″i=(Up(Di′,βi));
将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图DCat,即:
DCat=CONCAT(D″0,D″1,D″2,D″3);
5.如权利要求4所述的息肉图像分割方法,其特征在于,所述注意力校正模型的具体操作流程为:
将拼接后的特征图采用1×1卷积进行通道维度的降维,再经过Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,建模空间注意力机制,得到基于空间注意力机制的特征图DSpatial,即:
将拼接后的特征图进行特征提取得到提取后的特征图,将提取后的特征图输入到通道注意力机制中,得到通道权重,和基于通道注意力机制的特征图,即:
其中,FAdaptive(·)能采用不同的卷积核大小局部地实现跨通道信息交互,G(·)表示全局平均池化H′,W′指的是像素空间坐标,Dchannel代表通道维度注意力机制,i,j代表自然数,θ是G(·)的相关系数;
将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图DOut,即:
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的息肉图像分割方法的步骤。
7.一种计算机设备,包括:
一个或多个处理器;
存储器;以及一个或多个计算机程序,所述处理器和所述存储器通过总线连接,其中所述一个或多个计算机程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的息肉图像分割方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211261125.0A CN115439470B (zh) | 2022-10-14 | 2022-10-14 | 息肉图像分割方法、计算机可读存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211261125.0A CN115439470B (zh) | 2022-10-14 | 2022-10-14 | 息肉图像分割方法、计算机可读存储介质及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115439470A CN115439470A (zh) | 2022-12-06 |
CN115439470B true CN115439470B (zh) | 2023-05-26 |
Family
ID=84250185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211261125.0A Active CN115439470B (zh) | 2022-10-14 | 2022-10-14 | 息肉图像分割方法、计算机可读存储介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115439470B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116486230B (zh) * | 2023-04-21 | 2024-02-02 | 哈尔滨工业大学(威海) | 基于半递归特征金字塔结构的图像检测方法及存储介质 |
CN116935051B (zh) * | 2023-07-20 | 2024-06-14 | 深圳大学 | 一种息肉分割网络方法、系统、电子设备及存储介质 |
CN117994273B (zh) * | 2023-12-11 | 2024-09-20 | 重庆理工大学 | 基于重参数化与卷积注意力的息肉分割算法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465827A (zh) * | 2020-12-09 | 2021-03-09 | 北京航空航天大学 | 一种基于逐类卷积操作的轮廓感知多器官分割网络构建方法 |
CN113506300A (zh) * | 2021-06-25 | 2021-10-15 | 江苏大学 | 一种基于雨天复杂道路场景下的图片语义分割方法及系统 |
CN113538313A (zh) * | 2021-07-22 | 2021-10-22 | 深圳大学 | 一种息肉分割方法、装置、计算机设备及存储介质 |
CN114170167A (zh) * | 2021-11-29 | 2022-03-11 | 深圳职业技术学院 | 基于注意力引导上下文校正的息肉分割方法和计算机设备 |
CN114581662A (zh) * | 2022-02-17 | 2022-06-03 | 华南理工大学 | 一种脑肿瘤图像的分割方法、系统、装置及存储介质 |
CN115018824A (zh) * | 2022-07-21 | 2022-09-06 | 湘潭大学 | 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法 |
-
2022
- 2022-10-14 CN CN202211261125.0A patent/CN115439470B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465827A (zh) * | 2020-12-09 | 2021-03-09 | 北京航空航天大学 | 一种基于逐类卷积操作的轮廓感知多器官分割网络构建方法 |
CN113506300A (zh) * | 2021-06-25 | 2021-10-15 | 江苏大学 | 一种基于雨天复杂道路场景下的图片语义分割方法及系统 |
CN113538313A (zh) * | 2021-07-22 | 2021-10-22 | 深圳大学 | 一种息肉分割方法、装置、计算机设备及存储介质 |
CN114170167A (zh) * | 2021-11-29 | 2022-03-11 | 深圳职业技术学院 | 基于注意力引导上下文校正的息肉分割方法和计算机设备 |
CN114581662A (zh) * | 2022-02-17 | 2022-06-03 | 华南理工大学 | 一种脑肿瘤图像的分割方法、系统、装置及存储介质 |
CN115018824A (zh) * | 2022-07-21 | 2022-09-06 | 湘潭大学 | 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法 |
Non-Patent Citations (2)
Title |
---|
"FRCNet: Feature Refining and Context-Guided Network for Efficient Polyp Segmentation";Liantao Shi;《Frontiers in Bioengineering and Biotechnology》;第1-15页 * |
"基于多尺度注意力机制的道路场景语义分割模型";范润泽 等;《计算机工程》;第49卷(第2期);第288-295页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115439470A (zh) | 2022-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115439470B (zh) | 息肉图像分割方法、计算机可读存储介质及计算机设备 | |
CN111369440B (zh) | 模型训练、图像超分辨处理方法、装置、终端及存储介质 | |
CN111311629B (zh) | 图像处理方法、图像处理装置及设备 | |
EP3923233A1 (en) | Image denoising method and apparatus | |
WO2023070447A1 (zh) | 模型训练方法、图像处理方法、计算处理设备及非瞬态计算机可读介质 | |
CN110246084B (zh) | 一种超分辨率图像重构方法及其系统、装置、存储介质 | |
CN111476719B (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN114170167B (zh) | 基于注意力引导上下文校正的息肉分割方法和计算机设备 | |
CN114399510B (zh) | 结合图像和临床元数据的皮肤病灶分割和分类方法及系统 | |
US12026857B2 (en) | Automatically removing moving objects from video streams | |
CN111369564B (zh) | 一种图像处理的方法、模型训练的方法及装置 | |
CN113837941B (zh) | 图像超分模型的训练方法、装置及计算机可读存储介质 | |
CN113012140A (zh) | 基于深度学习的消化内镜视频帧有效信息区域提取方法 | |
CN116935044B (zh) | 一种多尺度引导和多层次监督的内镜息肉分割方法 | |
Liu et al. | Research on super-resolution reconstruction of remote sensing images: A comprehensive review | |
JP2023502653A (ja) | 人工知能ニューラルネットワークの推論または訓練に対する、故意に歪みを制御する撮像装置の利用 | |
Wang et al. | A review of GAN-based super-resolution reconstruction for optical remote sensing images | |
CN113838067A (zh) | 肺结节的分割方法和装置、计算设备、可存储介质 | |
CN115761258A (zh) | 一种基于多尺度融合与注意力机制的图像方向预测方法 | |
Nie et al. | Recent advances in diagnosis of skin lesions using dermoscopic images based on deep learning | |
EP4318497A1 (en) | Training method for training artificial neural network for determining breast cancer lesion area, and computing system performing same | |
CN117252890A (zh) | 颈动脉斑块分割方法、装置、设备及介质 | |
CN117522896A (zh) | 基于自注意力的图像分割方法及计算机设备 | |
TW202240531A (zh) | 影像生成、三維人臉模型生成的方法、裝置、電子設備及儲存媒體 | |
CN114332574A (zh) | 图像处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |