CN115439470B - 息肉图像分割方法、计算机可读存储介质及计算机设备 - Google Patents

息肉图像分割方法、计算机可读存储介质及计算机设备 Download PDF

Info

Publication number
CN115439470B
CN115439470B CN202211261125.0A CN202211261125A CN115439470B CN 115439470 B CN115439470 B CN 115439470B CN 202211261125 A CN202211261125 A CN 202211261125A CN 115439470 B CN115439470 B CN 115439470B
Authority
CN
China
Prior art keywords
image
feature
channel
polyp
semantic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211261125.0A
Other languages
English (en)
Other versions
CN115439470A (zh
Inventor
施连焘
李正国
王玉峰
李建阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Polytechnic
Original Assignee
Shenzhen Polytechnic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Polytechnic filed Critical Shenzhen Polytechnic
Priority to CN202211261125.0A priority Critical patent/CN115439470B/zh
Publication of CN115439470A publication Critical patent/CN115439470A/zh
Application granted granted Critical
Publication of CN115439470B publication Critical patent/CN115439470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种息肉图像分割方法、计算机可读存储介质及计算机设备,包括:将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图。可以适应息肉变化实现精准息肉分割。

Description

息肉图像分割方法、计算机可读存储介质及计算机设备
技术领域
本申请属于图像分割领域,尤其涉及一种息肉图像分割方法、计算机可读存储介质及计算机设备。
背景技术
结直肠癌是在最早期主要表现形式是肠道内所形成的息肉(肠胃通道内隆起的肿块)经过长时间以及诸多原因发展导致结直肠癌,如果能够在早期进行干预发现和切除息肉,直肠癌是可以被预防的,那么最为有效的筛查和诊断结直肠癌的方法是结直肠内窥镜检查也是目前最为主流诊断准确率最高的方法。
然而,当前的诊断方式虽然先进和准确依旧存在一些问题,根据一些专业的研究报道,在内窥镜检查的过程中每四个息肉就会遗漏掉一个导致切除不干净留下隐患,另外息肉的形状大小不一且多变,难以通过肉眼进行每一个精细地判断,尤其在一些息肉与肠胃通道背景差异不大的情况下,最后就是不能够进行快速识别纯靠人为是需要大量的时间精力和判断在当前医疗系统之下需要增加消化科医生大量的工作量进行。
发明内容
本申请的目的在于提供一种息肉图像分割方法、计算机可读存储介质及计算机设备,旨在解决内窥镜检查息肉会遗漏掉导致切除不干净留下隐患的问题。
第一方面,本申请提供了一种息肉图像分割方法,包括:
获取待分割的息肉图像;
将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;所述多尺度语义融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始特征图,将初始特征图分成4个通道数量相等的特征图,选择其中3个特征图经由卷积和批量正则化算法后与剩余的一个特征图依次以通道维度进行拼接,经由残差连接拼接后得到的特征图再与待分割的息肉图像进行融合,得到语义信息图像;
将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图;
所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,将四个特征图降维后再依次进行上采样,得到与高维的语义信息图像尺寸相同的上采样后的特征图,将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图;将拼接后的特征图采用卷积进行通道维度的降维,再利用Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,得到基于空间注意力机制的特征图;将拼接后的特征图进行特征提取后输入到通道注意力机制中,得到通道权重,得到基于通道注意力机制的特征图;将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图。
进一步地,所述多尺度语义融合模型的具体流程为:
定义待分割的息肉图像X为:X∈RC×H×W,将待分割的息肉图像通过W1(·)进行特征提取,得到一个与待分割的息肉图像尺寸相同的初始特征图X′为:X′∈RC×H×W
所述W1(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数;
根据通道维度将初始特征图X′∈RC×H×W分成4个通道数量相同的特征图
Figure BDA0003891592050000031
将其中3个特征图X1,X2,X3经由W2(·)进行转变,将转变后的特征图W2(X1),W2(X2),W2(X3)与剩余的一个特征图X0依次以通道维度进行拼接,得到与待分割的息肉图像通道数量一致的拼接后的特征图XCat,即:
XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0);
所述W2(·)包括3×3卷积和批量正则化算法;
由残差连接拼接后的特征图,再与待分割的息肉图像进行融合,输出语义信息图像XOut,即:
Figure BDA0003891592050000032
其中,R代表三维数组图像,C,H和W分别表示图像的通道数,长度和宽度;
Figure BDA0003891592050000033
表示像素级别的加法求和运算,CONCAT表示通道维度上的拼接;W3(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数。
进一步地,所述上下文感知金字塔聚合模型包括上下文感知融合模型和注意力校正模型。
进一步地,所述上下文感知融合模型的具体操作流程为:
定义输入的高维的语义信息图像D为D∈RC×H×W,使用多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,分别为:D0∈RC×6×6,D1∈RC×3×3,D2∈RC×2×2和D3∈RC×1×1
将四个特征图经过1×1的卷积、批量正则化算法和ReLU非线性激活函数分别进行降维,将通道数压缩至四分之一,即:
Figure BDA0003891592050000034
Figure BDA0003891592050000035
再将降维后的特征图进行上采样,得到与高维的语义信息图像D尺寸相同的上采样后的特征图D″i,即:
D″i=(Up(D′ii));
将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图DCat,即:
DCat=CONCAT(D″0,D″1,D″2,D″3);
其中,
Figure BDA0003891592050000041
i代表自然数,βi表示相关系数,Up为常规的双线性插值上采样,CONCAT为通道维度上的拼接。
进一步地,所述注意力校正模型的具体操作流程为:
将拼接后的特征图采用1×1卷积进行通道维度的降维,再经过Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,建模空间注意力机制,得到基于空间注意力机制的特征图DSpatial,即:
Figure BDA0003891592050000042
其中,
Figure BDA0003891592050000043
表示注意力矩阵的乘法运算,σ(·)是Sigmiod激活函数,S0代表1×1卷积操作,α是与S0相关的系数;
将拼接后的特征图进行特征提取得到提取后的特征图,将提取后的特征图输入到通道注意力机制中,得到通道权重,和基于通道注意力机制的特征图,即:
Figure BDA0003891592050000044
其中,FAdaptive(i)能采用不同的卷积核大小局部地实现跨通道信息交互,G(i)表示全局平均池化
Figure BDA0003891592050000045
H′,W′指的是像素空间坐标,Dchannel代表通道维度注意力机制,i,j代表自然数,θ是G(i)的相关系数;
将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图DOut,即:
Figure BDA0003891592050000046
第二方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的息肉图像分割方法的步骤。
第三方面,本申请提供了一种计算机设备,包括:一个或多个处理器、存储器以及一个或多个计算机程序,所述处理器和所述存储器通过总线连接,其中所述一个或多个计算机程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述处理器执行所述计算机程序时实现所述的息肉图像分割方法的步骤。
在本申请中,设计了多尺度语义融合模型,通过多种滤波器去收集不同尺度的语义信息图像来提升表征能力,从而适应息肉尺寸变化,尤其是对较小的息肉,内部采用了更细粒度级别,通过使用不同尺度的卷积核来进行特征提取从而实现增大网络的感受野;设计了上下文感知金字塔聚合模型,引导不同区域的特征信息进行融合,内部包含双重注意力机制,进一步强化重要特征,高效的抑制非重要区域的特征,实现精准息肉分割并兼顾实时性。
附图说明
图1是本申请一实施例提供的一种息肉图像分割方法的流程图。
图2是本申请一实施例提供的另一种息肉图像分割方法的流程图。
图3是本申请一实施例提供的多尺度语义融合模型的流程图。
图4是本申请一实施例提供的上下文感知融合模型的流程图。
图5是本申请一实施例提供的注意力校正模型的流程图。
图6是本申请一实施例提供的与当前先进的息肉图像分割方法对比的数据分析表格。
图7是本申请一实施例提供的计算机设备的具体结构框图。
具体实施方式
为了使本申请的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
请参阅图1,本申请一实施例提供的息肉图像分割方法包括以下步骤:需注意的是,若有实质上相同的结果,本申请的息肉图像分割方法并不以图1所示的流程顺序为限。
S101、获取待分割的息肉图像;
S102、将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;所述多尺度语义融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始特征图,将初始特征图分成4个通道数量相等的特征图,选择其中3个特征图经由卷积和批量正则化算法后与剩余的一个特征图依次以通道维度进行拼接,经由残差连接拼接后得到的特征图再与待分割的息肉图像进行融合,得到语义信息图像;
S103、将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图;
S104、所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,将四个特征图降维后再依次进行上采样,得到与高维的语义信息图像尺寸相同的上采样后的特征图,将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图;将拼接后的特征图采用卷积进行通道维度的降维,再利用Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,得到基于空间注意力机制的特征图;将拼接后的特征图进行特征提取后输入到通道注意力机制中,得到通道权重,得到基于通道注意力机制的特征图;将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图。
参阅图2,001代表多尺度语义融合模型,002代表下采样,003代表上下文感知金字塔聚合模型,004代表上采样;CAF代表上下文感知融合模型,APO代表注意力校正模型;005代表卷积特征提取;左右两边对称,左边区域为编码区,右边为解码区,折线箭头代表跳跃连接操作。
请参阅图3,在本申请一实施例中,所述多尺度语义融合模型(即MSFM)的具体流程为:
定义待分割的息肉图像X为:X∈RC×H×W,将待分割的息肉图像通过W1(i)进行特征提取,得到一个与待分割的息肉图像尺寸相同的初始特征图X′为:X′∈RC×H×W
所述W1(i)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数;
根据通道维度将初始特征图X′∈RC×H×W分成4个通道数量相同的特征图
Figure BDA0003891592050000071
将其中3个特征图X1,X2,X3经由W2(·)进行转变,将转变后的特征图W2(X1),W2(X2),W2(X3)与剩余的一个特征图X0依次以通道维度进行拼接,得到与待分割的息肉图像通道数量一致的拼接后的特征图XCat,即:
XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0);
所述W2(·)包括3×3卷积和批量正则化算法;
由残差连接拼接后的特征图,再与待分割的息肉图像进行融合,输出语义信息图像XOut,即:
Figure BDA0003891592050000072
其中,R代表三维数组图像,C,H和W分别表示图像的通道数,长度和宽度;
Figure BDA0003891592050000073
表示像素级别的加法求和运算,CONCAT表示通道维度上的拼接;W3(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数。
在本申请一实施例中,所述上下文感知金字塔聚合模型(即CPAM)包括上下文感知融合模型和注意力校正模型。
在本申请一实施例中,所述上下文感知融合模型的具体操作流程为:
定义输入的高维的语义信息图像D为D∈RC×H×W,使用多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,分别为:D0∈RC×6×6,D1∈RC×3×3,D2∈RC×2×2和D3∈RC×1×1
将四个特征图经过1×1的卷积、批量正则化算法和ReLU非线性激活函数分别进行降维,将通道数压缩至四分之一,即:
Figure BDA0003891592050000081
Figure BDA0003891592050000082
再将降维后的特征图进行上采样,得到与高维的语义信息图像D尺寸相同的上采样后的特征图D″i,即:
D″i=(Up(D′ii));
将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图DCat,即:
DCat=CONCAT(D″0,D″1,D″2,D″3);
其中,
Figure BDA0003891592050000083
i代表自然数,βi表示相关系数,Up为常规的双线性插值上采样,CONCAT为通道维度上的拼接。
请参阅图4,图中CBR代表1×1的卷积、批量正则化算法和ReLU非线性激活函数。
在本申请一实施例中,请参阅图5,所述注意力校正模型的具体操作流程为:
将拼接后的特征图采用1×1卷积进行通道维度的降维,再经过Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,建模空间注意力机制,得到基于空间注意力机制的特征图DSpatial,即:
Figure BDA0003891592050000084
其中,
Figure BDA0003891592050000091
表示注意力矩阵的乘法运算,σ(·)是Sigmiod激活函数,S0代表1×1卷积操作,α是与S0相关的系数;
将拼接后的特征图进行特征提取得到提取后的特征图,将提取后的特征图输入到通道注意力机制中,得到通道权重,和基于通道注意力机制的特征图,即:
Figure BDA0003891592050000092
其中,FAdaptive(·)能采用不同的卷积核大小局部地实现跨通道信息交互,G(·)表示全局平均池化
Figure BDA0003891592050000093
H′,W′指的是像素空间坐标,Dchannel代表通道维度注意力机制,i,j代表自然数,θ是G(·)的相关系数;
将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图DOut,即:
Figure BDA0003891592050000094
图6是本申请一实施例提供的与当前先进的息肉图像分割方法的对比的数据分析表格,可以更直观的展示各类性能指标。
本申请一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请一实施例提供的息肉图像分割方法的步骤。
图7示出了本申请一实施例提供的计算机设备的具体结构框图,一种计算机设备100包括:一个或多个处理器101、存储器102、以及一个或多个计算机程序,其中所述处理器101和所述存储器102通过总线连接,所述一个或多个计算机程序被存储在所述存储器102中,并且被配置成由所述一个或多个处理器101执行,所述处理器101执行所述计算机程序时实现如本申请一实施例提供的息肉图像分割方法的步骤。
计算机设备包括服务器和终端等。该计算机设备可以是台式计算机、移动终端或车载设备,移动终端包括手机、平板电脑、个人数字助理或可穿戴设备等中的至少一种。
在本申请实施例中,设计了多尺度语义融合模型,通过多种滤波器去收集不同尺度的语义信息图像来提升表征能力,从而适应息肉尺寸变化,尤其是对较小的息肉,内部采用了更细粒度级别,通过使用不同尺度的卷积核来进行特征提取从而实现增大网络的感受野;设计了上下文感知金字塔聚合模型,引导不同区域的特征信息进行融合,内部包含双重注意力机制,进一步强化重要特征,高效的抑制非重要区域的特征,实现精准息肉分割并兼顾实时性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种息肉图像分割方法,其特征在于,包括:
获取待分割的息肉图像;
将待分割的息肉图像输入到多尺度语义融合模型,得到语义信息图像,再将语义信息图像经过下采样得到下采样后的语义信息图像,重新将下采样后的语义信息图像输入到多尺度语义融合模型后再进行下采样,多次重复,获得高维的语义信息图像;所述多尺度语义融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始特征图,将初始特征图分成4个通道数量相等的特征图,选择其中3个特征图经由卷积和批量正则化算法后与剩余的一个特征图依次以通道维度进行拼接,经由残差连接拼接后得到的特征图再与待分割的息肉图像进行融合,得到语义信息图像;
将高维的语义信息图像输入到上下文感知金字塔聚合模型,输出融合后的特征图,将融合后的特征图进行上采样后再通过卷积提取特征,重新将特征提取后的特征图进行上采样后再通过卷积提取特征,多次重复,直到获得与所述待分割的息肉图像通道尺寸相同的最终的特征图;
所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,将四个特征图降维后再依次进行上采样,得到与高维的语义信息图像尺寸相同的上采样后的特征图,将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图;将拼接后的特征图采用卷积进行通道维度的降维,再利用Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,得到基于空间注意力机制的特征图;将拼接后的特征图进行特征提取后输入到通道注意力机制中,得到通道权重,得到基于通道注意力机制的特征图;将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图。
2.如权利要求1所述的息肉图像分割方法,其特征在于,所述多尺度语义融合模型的具体流程为:
定义待分割的息肉图像X为:X∈RC×H×W,将待分割的息肉图像通过W1(·)进行特征提取,得到一个与待分割的息肉图像尺寸相同的初始特征图X′为:X′∈RC×H×W
所述W1(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数;
根据通道维度将初始特征图X′∈RC×H×W分成4个通道数量相同的特征图
Figure FDA0003891592040000021
将其中3个特征图X1,X2,X3经由W2(·)进行转变,将转变后的特征图W2(X1),W2(X2),W2(X3)与剩余的一个特征图X0依次以通道维度进行拼接,得到与待分割的息肉图像通道数量一致的拼接后的特征图XCat,即:
XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0);
所述W2(·)包括3×3卷积和批量正则化算法;
由残差连接拼接后的特征图,再与待分割的息肉图像进行融合,输出语义信息图像XOut,即:
Figure FDA0003891592040000022
其中,R代表三维数组图像,C,H和W分别表示图像的通道数,长度和宽度;
Figure FDA0003891592040000023
表示像素级别的加法求和运算,CONCAT表示通道维度上的拼接;W3(·)包括1×1的卷积、批量正则化算法和ReLU非线性激活函数。
3.如权利要求1所述的息肉图像分割方法,其特征在于,所述上下文感知金字塔聚合模型包括上下文感知融合模型和注意力校正模型。
4.如权利要求3所述的息肉图像分割方法,其特征在于,所述上下文感知融合模型的具体操作流程为:
定义输入的高维的语义信息图像D为D∈RC×H×W,使用多个不同尺度的池化操作,提取四个通道数不变、分辨率不同的特征图,分别为:D0∈RC×6×6,D1∈RC×3×3,D2∈RC×2×2和D3∈RC ×1×1
将四个特征图经过1×1的卷积、批量正则化算法和ReLU非线性激活函数分别进行降维,将通道数压缩至四分之一,即:
Figure FDA0003891592040000031
Figure FDA0003891592040000032
再将降维后的特征图进行上采样,得到与高维的语义信息图像D尺寸相同的上采样后的特征图D″i,即:
D″i=(Up(Di′,βi));
将上采样后的特征图以通道维度进行拼接,得到拼接后的特征图DCat,即:
DCat=CONCAT(D″0,D″1,D″2,D″3);
其中,
Figure FDA0003891592040000033
i代表自然数,βi表示相关系数,Up为常规的双线性插值上采样,CONCAT为通道维度上的拼接。
5.如权利要求4所述的息肉图像分割方法,其特征在于,所述注意力校正模型的具体操作流程为:
将拼接后的特征图采用1×1卷积进行通道维度的降维,再经过Sigmoid激活函数得到注意力权重图,将注意力权重图进行注意力矩阵乘法运算,重塑拼接后的特征图的权值,建模空间注意力机制,得到基于空间注意力机制的特征图DSpatial,即:
Figure FDA0003891592040000041
其中,
Figure FDA0003891592040000042
表示注意力矩阵的乘法运算,σ(·)是Sigmiod激活函数,S0代表1×1卷积操作,α是与S0相关的系数;
将拼接后的特征图进行特征提取得到提取后的特征图,将提取后的特征图输入到通道注意力机制中,得到通道权重,和基于通道注意力机制的特征图,即:
Figure FDA0003891592040000043
其中,FAdaptive(·)能采用不同的卷积核大小局部地实现跨通道信息交互,G(·)表示全局平均池化
Figure FDA0003891592040000044
H′,W′指的是像素空间坐标,Dchannel代表通道维度注意力机制,i,j代表自然数,θ是G(·)的相关系数;
将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合,得到融合后的特征图DOut,即:
Figure FDA0003891592040000045
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的息肉图像分割方法的步骤。
7.一种计算机设备,包括:
一个或多个处理器;
存储器;以及一个或多个计算机程序,所述处理器和所述存储器通过总线连接,其中所述一个或多个计算机程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的息肉图像分割方法的步骤。
CN202211261125.0A 2022-10-14 2022-10-14 息肉图像分割方法、计算机可读存储介质及计算机设备 Active CN115439470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211261125.0A CN115439470B (zh) 2022-10-14 2022-10-14 息肉图像分割方法、计算机可读存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211261125.0A CN115439470B (zh) 2022-10-14 2022-10-14 息肉图像分割方法、计算机可读存储介质及计算机设备

Publications (2)

Publication Number Publication Date
CN115439470A CN115439470A (zh) 2022-12-06
CN115439470B true CN115439470B (zh) 2023-05-26

Family

ID=84250185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211261125.0A Active CN115439470B (zh) 2022-10-14 2022-10-14 息肉图像分割方法、计算机可读存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN115439470B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116486230B (zh) * 2023-04-21 2024-02-02 哈尔滨工业大学(威海) 基于半递归特征金字塔结构的图像检测方法及存储介质
CN116935051B (zh) * 2023-07-20 2024-06-14 深圳大学 一种息肉分割网络方法、系统、电子设备及存储介质
CN117994273B (zh) * 2023-12-11 2024-09-20 重庆理工大学 基于重参数化与卷积注意力的息肉分割算法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465827A (zh) * 2020-12-09 2021-03-09 北京航空航天大学 一种基于逐类卷积操作的轮廓感知多器官分割网络构建方法
CN113506300A (zh) * 2021-06-25 2021-10-15 江苏大学 一种基于雨天复杂道路场景下的图片语义分割方法及系统
CN113538313A (zh) * 2021-07-22 2021-10-22 深圳大学 一种息肉分割方法、装置、计算机设备及存储介质
CN114170167A (zh) * 2021-11-29 2022-03-11 深圳职业技术学院 基于注意力引导上下文校正的息肉分割方法和计算机设备
CN114581662A (zh) * 2022-02-17 2022-06-03 华南理工大学 一种脑肿瘤图像的分割方法、系统、装置及存储介质
CN115018824A (zh) * 2022-07-21 2022-09-06 湘潭大学 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465827A (zh) * 2020-12-09 2021-03-09 北京航空航天大学 一种基于逐类卷积操作的轮廓感知多器官分割网络构建方法
CN113506300A (zh) * 2021-06-25 2021-10-15 江苏大学 一种基于雨天复杂道路场景下的图片语义分割方法及系统
CN113538313A (zh) * 2021-07-22 2021-10-22 深圳大学 一种息肉分割方法、装置、计算机设备及存储介质
CN114170167A (zh) * 2021-11-29 2022-03-11 深圳职业技术学院 基于注意力引导上下文校正的息肉分割方法和计算机设备
CN114581662A (zh) * 2022-02-17 2022-06-03 华南理工大学 一种脑肿瘤图像的分割方法、系统、装置及存储介质
CN115018824A (zh) * 2022-07-21 2022-09-06 湘潭大学 一种基于CNN和Transformer融合的结肠镜息肉图像分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"FRCNet: Feature Refining and Context-Guided Network for Efficient Polyp Segmentation";Liantao Shi;《Frontiers in Bioengineering and Biotechnology》;第1-15页 *
"基于多尺度注意力机制的道路场景语义分割模型";范润泽 等;《计算机工程》;第49卷(第2期);第288-295页 *

Also Published As

Publication number Publication date
CN115439470A (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
CN115439470B (zh) 息肉图像分割方法、计算机可读存储介质及计算机设备
CN111369440B (zh) 模型训练、图像超分辨处理方法、装置、终端及存储介质
CN111311629B (zh) 图像处理方法、图像处理装置及设备
EP3923233A1 (en) Image denoising method and apparatus
WO2023070447A1 (zh) 模型训练方法、图像处理方法、计算处理设备及非瞬态计算机可读介质
CN110246084B (zh) 一种超分辨率图像重构方法及其系统、装置、存储介质
CN111476719B (zh) 图像处理方法、装置、计算机设备及存储介质
CN114170167B (zh) 基于注意力引导上下文校正的息肉分割方法和计算机设备
CN114399510B (zh) 结合图像和临床元数据的皮肤病灶分割和分类方法及系统
US12026857B2 (en) Automatically removing moving objects from video streams
CN111369564B (zh) 一种图像处理的方法、模型训练的方法及装置
CN113837941B (zh) 图像超分模型的训练方法、装置及计算机可读存储介质
CN113012140A (zh) 基于深度学习的消化内镜视频帧有效信息区域提取方法
CN116935044B (zh) 一种多尺度引导和多层次监督的内镜息肉分割方法
Liu et al. Research on super-resolution reconstruction of remote sensing images: A comprehensive review
JP2023502653A (ja) 人工知能ニューラルネットワークの推論または訓練に対する、故意に歪みを制御する撮像装置の利用
Wang et al. A review of GAN-based super-resolution reconstruction for optical remote sensing images
CN113838067A (zh) 肺结节的分割方法和装置、计算设备、可存储介质
CN115761258A (zh) 一种基于多尺度融合与注意力机制的图像方向预测方法
Nie et al. Recent advances in diagnosis of skin lesions using dermoscopic images based on deep learning
EP4318497A1 (en) Training method for training artificial neural network for determining breast cancer lesion area, and computing system performing same
CN117252890A (zh) 颈动脉斑块分割方法、装置、设备及介质
CN117522896A (zh) 基于自注意力的图像分割方法及计算机设备
TW202240531A (zh) 影像生成、三維人臉模型生成的方法、裝置、電子設備及儲存媒體
CN114332574A (zh) 图像处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant