CN110458849B - 一种基于特征修正的图像分割方法 - Google Patents

一种基于特征修正的图像分割方法 Download PDF

Info

Publication number
CN110458849B
CN110458849B CN201910684402.0A CN201910684402A CN110458849B CN 110458849 B CN110458849 B CN 110458849B CN 201910684402 A CN201910684402 A CN 201910684402A CN 110458849 B CN110458849 B CN 110458849B
Authority
CN
China
Prior art keywords
feature
output
data
layer
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910684402.0A
Other languages
English (en)
Other versions
CN110458849A (zh
Inventor
刘琚
林枫茗
吴强
石伟
庞恩帅
杜若画
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201910684402.0A priority Critical patent/CN110458849B/zh
Publication of CN110458849A publication Critical patent/CN110458849A/zh
Application granted granted Critical
Publication of CN110458849B publication Critical patent/CN110458849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于特征修正的图像分割方法。传统深度学习分割算法往往包含编码器和解码器两个部分,注重特征的融合,特征金字塔等方法将来自不同层次的空间与细节等信息全部融合,这使得对分割结果有利和不利的信息都被融合了进来,因此,需要在分割过程中将特征朝有利于分割结果的方向修正。本发明采用了编码器、特征修正解码器与特征金字塔的组合结构,在BraTS2017数据集上进行了算法验证,本发明的方法优于传统的方法,具有更好的分割结果。

Description

一种基于特征修正的图像分割方法
技术领域
本发明属于图像处理与分析技术领域,具体涉及一种基于特征修正的图像分割方法。
背景技术
图像的语义分割,就是对图像中每个像素进行分类,将相同语义的类别分割出来。近年来,自动驾驶、无人机、图片美化、智能家居、智能医疗等行业中图像分割的应用日渐增多,越来越多的产品、装置需要更好的图像分割技术作为支撑。
传统的图像自动分割算法包括阈值法、边缘检测法、区域增长法、分水岭算法、基于模型的方法(水平集)和综合使用多种方法。上述传统算法运算效率较高,但是准确度仍不能达到应用要求,而且在分割过程中需要人为干预。随着计算机科学与人工智能的发展,计算机的运行速度不断加快,在面对很多实际应用问题时,越来越多地使用深度学习方法。基于深度学习的图像分割算法在准确率性能上优于以上传统算法,但是在性能上仍存在可改进的空间。传统深度学习算法往往包含编码器和解码器两个部分,将包含编码器和解码器的信息融合输出分割结果。目前分割方法注重特征的融合,例如特征金字塔等,这些方法将来自不同层次的空间与细节等信息全部融合,对分割结果有利和不利的信息都被融合了进来,因此,需要在分割过程中将特征朝有利于分割结果的方向修正。
发明内容
针对现有深度学习方法存在的问题,本发明提出了一种基于特征修正的图像分割方法,可以在分割过程中将特征朝有利于分割结果的方向修正,提高分割的精度。
本发明采用的技术方案如下:
一种基于特征修正的图像分割方法,该方法使用特征修正结构,在分割过程中将特征朝有利于分割结果的方向修正,具体步骤包括:
(一)数据预处理:对数据集进行归一化处理,并进行数据多通道融合,再进行数据清洗,将没有标签的图像去除,最后进行数据增强,得到最终的特征数据集;
(二)经过编码器对数据进行下采样处理:编码器部分由多个下采样区域组成,下采样区域数量可自由设置,每个下采样区域包含两层卷积与一层池化,每个下采样区域使用残差网络结构,并在卷积层后采用了局部响应归一化以防止梯度弥散,特征经过多次下采样区域后尺度变小,同时通道数变大,最后经过一个没有池化层的下采样区域得到最终编码器输出;
(三)经过特征修正解码器对数据进行上采样处理:解码器部分由多个上采样区域组成,上采样区域数量可自由设置,最终需要上采样到原图尺度,每个上采样区域包括一个上采样层、特征修正部分和两个卷积层,每个上采样区域使用残差网络结构,并在卷积层后采用了局部响应归一化以防止梯度弥散,所述特征修正部分包括两个特征相乘层与一个连接层,第一个特征相乘层将来自编码器与来自解码器上采样后的两个尺度相同的特征相乘,第二个特征相乘层将来自解码器上采样后的特征进行自乘运算,最后连接层将两个特征相乘层的输出连接,得到特征修正部分的输出,过程如下所示:
Figure BDA0002145831900000021
E(xi)是编码器的输出,D(xi)是特征修正解码器的输出,
Figure BDA0002145831900000022
为特征连接操作;
(四)经过特征金字塔将特征融合输出分割结果:将特征修正解码器中每个上采样区域的输出分别上采样到原图尺度,并且通道数相同,然后进行特征相加,过程如下所示:
Figure BDA0002145831900000023
P(x)是特征金字塔的输出,最后经过一个卷积层,使用激活函数,得到最终的分割结果,过程如下所示:
Figure BDA0002145831900000024
Output是网络最终的输出结果;
(五)结果预测:将训练好的模型保存,输入测试集,得到最终的分割结果。
在模型训练的数据预处理过程中,将数据随机打乱顺序,将数据集分为n份,选取其中n-1份作为训练集,选取剩余的1份作为验证集合,得到最终分割结果。本发明与传统的方法相对比,分割精度更高,具有更好的泛化能力。
附图说明
图1是基于特征修正的图像分割方法示意框图。
图2是本发明使用的分割模型示意框图。
图3是本发明的图像处理装置示意框图。
具体实施方式
下面通过附图对本发明技术方案进行详细说明。
如图1所示,本发明基于特征修正的图像分割方法如下文所示:
步骤一:训练阶段:使用有标注的数据集进行训练。将数据集送入网络中参与训练,将交叉熵函数作为损失函数,使用Adam优化器更新特征修正网络的参数,训练迭代70次,每次迭代都保存模型,保存模型之后使用数据集中的验证集部分进行验证,最终将验证正确率最高的模型保存。
步骤二:测试阶段:将数据进行预处理,对多个模态的数据进行裁剪然后进行减均值除以方差的标准化操作,然后送入训练阶段得到的效果最优的模型中,经过模型计算,得到分割结果图并显示出来。
如图2所示,特征修正的网络结构与具体方法如下文所示:
(一)数据预处理:
对数据集进行归一化处理,
Figure BDA0002145831900000031
X为输入数据,μ为输入数据的均值,σ为输入数据的方差,X′为归一化处理后的数据。如有多模态数据,将其融合,形成多通道数据,如数据为单模态,直接进行后续处理。将数据读取进来,得到的数据大小为b×w×h×c,其中b为图像数目,w为图像宽度,h为图像高度,c为通道数。然后进行数据清洗,打乱数据顺序,将没有标签的图像去除。最后进行数据增强,将原数据集的前半部分向左旋转90度,后半部分向右旋转90度,增强为原来的两倍,得到最终数据集。将全部数据集分为n份分别保存为数组形式,读取其中的n-1份作为训练集,剩余的1份作为测试集;
(二)编码器:
编码器部分由五个下采样区域组成。其中四个包含两层卷积与一层池化,最后一个只包含两层卷积。每个下采样区域都使用残差网络结构,并在卷积层后采用了局部响应归一化以防止梯度弥散。卷积层中卷积核的大小为3,步长为1,激活函数为ReLU,池化层采用最大池化。下采样区域的卷积核个数成2倍递增。训练数据经过下采样区域时,宽与高变为原来的1/2,最终下采样的输出的通道数为512,输出的宽与高为原图1/16;
(三)特征修正解码器:
在经历下采样之后,图像尺度变小,采用上采样的方式将图像恢复到原尺度。解码器部分由四个上采样区域组成。其中上采样区域包括一个上采样层,特征修正部分和两个卷积层,每个区域使用残差网络结构,并在卷积层后采用了局部响应归一化以防止梯度弥散。其中特征修正部分用于对来自下采样部分与上采样部分的特征进行修正,使经过编码器和解码器的特征更趋向于分割结果。特征修正部分包括两个特征相乘层与一个连接层,第一个特征相乘层将来自编码器与解码器上采样后的两个尺度相同的特征相乘,第二个特征相乘层将来自解码器上采样后的特征进行自乘运算,最后连接层将两个特征相乘层的输出连接,得到特征修正部分的输出。在特征修正部分中,特征经过两个相乘层之后形状不变,只有特征值改变,在经过连接层之后通道数增多,过程如下所示:
Figure BDA0002145831900000041
E(xi)是编码器的输出,D(xi)是特征修正解码器的输出,
Figure BDA0002145831900000042
为特征连接操作;
(四)特征金字塔:
将特征修正解码器区域的输出特征图进行融合后输出最终分割结果。针对特征修正编码器区域的四个输出,分别上采样到原图尺度,然后进行像素值相加,再经过一个卷积层。上采样过程包含一个卷积层与一个上采样层,卷积层的通道数为32,卷积核大小为1,目的是为了改变特征图的通道数,否则通道数较多的特征图上采样后占用存储空间较大不利于训练,上采样层采用插值法。过程如下所示:
Figure BDA0002145831900000043
P(xi)是特征金字塔的输出,D(x)是特征修正解码器的输出。最后经过一个卷积层,经过激活函数,得到最终的分割结果,过程如下所示:
Figure BDA0002145831900000044
Output是网络最终的输出结果;
(五)结果预测:将训练好的模型保存,输入测试集,得到最终分割结果。
在模型训练的数据预处理过程中,将数据随机打乱顺序,将数据集分为n份,选取其中n-1份作为训练集,选取剩余的1份作为验证集合,得到最终分割结果。
本发明与传统的方法相对比,分割精度更高,具有更好的泛化能力。
本发明的效果可以通过分割结果进一步说明:
为验证本发明的性能,采用数据集BraTS2017,包含285个患者的多模态数据。将标准数据集分为训练集与验证集,将特征修正的图像分割方法与其他不使用特征修正的方法进行对比。分别对比了水肿、坏死、增强部分的dice系数、查全率、查准率。
表1为本发明在BraTS2017数据集上的分割结果。其中VGG、DUNet、FCNN为深度学习图像分割领域中的经典方法,FPUNet为基于金字塔融合学习的图像分割方法,FCUNet为编码器、特征修正解码器、特征金字塔的组合,是本发明提出的方法。表中黑体数字为该列最大值,代表了最优效果。综上所述,本发明比经典方法的分割效果更好。
表1
Figure BDA0002145831900000051

Claims (1)

1.一种基于特征修正的图像分割方法,该方法使用特征修正结构,在分割过程中将特征朝有利于分割结果的方向修正,具体步骤包括:
(一)数据预处理:对数据集进行归一化处理,并进行数据多通道融合,再进行数据清洗,将没有标签的图像去除,最后进行数据增强,得到最终的特征数据集;
(二)经过编码器对数据进行下采样处理:编码器部分由多个下采样区域组成,下采样区域数量可自由设置,每个下采样区域包含两层卷积与一层池化,每个下采样区域使用残差网络结构,并在卷积层后采用了局部响应归一化以防止梯度弥散,特征经过多次下采样区域后尺度变小,同时通道数变大,最后经过一个没有池化层的下采样区域得到最终编码器输出;
(三)经过特征修正解码器对数据进行上采样处理:解码器部分由多个上采样区域组成,上采样区域数量可自由设置,最终需要上采样到原图尺度,每个上采样区域包括一个上采样层、特征修正部分和两个卷积层,每个上采样区域使用残差网络结构,并在卷积层后采用了局部响应归一化以防止梯度弥散,所述特征修正部分包括两个特征相乘层与一个连接层,第一个特征相乘层将来自编码器与来自解码器上采样后的两个尺度相同的特征相乘,第二个特征相乘层将来自解码器上采样后的特征进行自乘运算,最后连接层将两个特征相乘层的输出连接,得到特征修正部分的输出,过程如下所示:
Figure FDA0002145831890000011
E(xi)是编码器的输出,D(xi)是特征修正解码器的输出,
Figure FDA0002145831890000012
为特征连接操作;
(四)经过特征金字塔将特征融合输出分割结果:将特征修正解码器中每个上采样区域的输出分别上采样到原图尺度,并且通道数相同,然后进行特征相加,过程如下所示:
Figure FDA0002145831890000013
P(x)是特征金字塔的输出,最后经过一个卷积层,使用激活函数,得到最终的分割结果,过程如下所示:
Figure FDA0002145831890000014
Output是网络最终的输出结果;
(五)结果预测:将训练好的模型保存,输入测试集,得到最终的分割结果。
CN201910684402.0A 2019-07-26 2019-07-26 一种基于特征修正的图像分割方法 Active CN110458849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910684402.0A CN110458849B (zh) 2019-07-26 2019-07-26 一种基于特征修正的图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910684402.0A CN110458849B (zh) 2019-07-26 2019-07-26 一种基于特征修正的图像分割方法

Publications (2)

Publication Number Publication Date
CN110458849A CN110458849A (zh) 2019-11-15
CN110458849B true CN110458849B (zh) 2023-04-25

Family

ID=68483750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910684402.0A Active CN110458849B (zh) 2019-07-26 2019-07-26 一种基于特征修正的图像分割方法

Country Status (1)

Country Link
CN (1) CN110458849B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967272B (zh) * 2021-03-25 2023-08-22 郑州大学 基于改进U-net的焊接缺陷检测方法、装置及终端设备
CN113658188B (zh) * 2021-08-18 2022-04-01 北京石油化工学院 一种基于改进Unet模型的溶液结晶过程图像语义分割方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408562A (zh) * 2016-09-22 2017-02-15 华南理工大学 基于深度学习的眼底图像视网膜血管分割方法及系统
CN108921850A (zh) * 2018-04-16 2018-11-30 博云视觉(北京)科技有限公司 一种基于图像分割技术的图像局部特征的提取方法
CN109063710A (zh) * 2018-08-09 2018-12-21 成都信息工程大学 基于多尺度特征金字塔的3d cnn鼻咽癌分割方法
CN109447994A (zh) * 2018-11-05 2019-03-08 陕西师范大学 结合完全残差与特征融合的遥感图像分割方法
CN109727249A (zh) * 2018-12-10 2019-05-07 南京邮电大学 卷积神经网络中的一种语义图像分割方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408562A (zh) * 2016-09-22 2017-02-15 华南理工大学 基于深度学习的眼底图像视网膜血管分割方法及系统
CN108921850A (zh) * 2018-04-16 2018-11-30 博云视觉(北京)科技有限公司 一种基于图像分割技术的图像局部特征的提取方法
CN109063710A (zh) * 2018-08-09 2018-12-21 成都信息工程大学 基于多尺度特征金字塔的3d cnn鼻咽癌分割方法
CN109447994A (zh) * 2018-11-05 2019-03-08 陕西师范大学 结合完全残差与特征融合的遥感图像分割方法
CN109727249A (zh) * 2018-12-10 2019-05-07 南京邮电大学 卷积神经网络中的一种语义图像分割方法

Also Published As

Publication number Publication date
CN110458849A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
CN110223304B (zh) 一种基于多路径聚合的图像分割方法、装置和计算机可读存储介质
CN111681252A (zh) 一种基于多路径注意力融合的医学图像自动分割方法
CN110889853B (zh) 基于残差-注意力深度神经网络的肿瘤分割方法
CN110909801B (zh) 基于卷积神经网络的数据分类方法、系统、介质及设备
CN111340814A (zh) 一种基于多模态自适应卷积的rgb-d图像语义分割方法
CN110599495B (zh) 一种基于语义信息挖掘的图像分割方法
CN111860528B (zh) 基于改进U-Net网络的图像分割模型及训练方法
CN110458849B (zh) 一种基于特征修正的图像分割方法
CN113870335A (zh) 一种基于多尺度特征融合的单目深度估计方法
CN116309648A (zh) 一种基于多注意力融合的医学图像分割模型构建方法
CN112488923A (zh) 图像超分辨率重建方法、装置、存储介质及电子设备
CN113052755A (zh) 一种基于深度学习的高分辨率图像智能化抠图方法
CN110738660A (zh) 基于改进U-net的脊椎CT图像分割方法及装置
CN111612789A (zh) 一种基于改进的U-net网络的缺陷检测方法
CN115019143A (zh) 一种基于CNN和Transformer混合模型的文本检测方法
CN115147606B (zh) 医学图像的分割方法、装置、计算机设备和存储介质
CN115375711A (zh) 基于多尺度融合的全局上下文关注网络的图像分割方法
CN116363149A (zh) 一种基于U-Net改进的医学图像分割方法
CN114821058A (zh) 一种图像语义分割方法、装置、电子设备及存储介质
KR102128789B1 (ko) 심층 합성곱 뉴럴 네트워크를 위한 효율적인 팽창 합성곱 기법을 제공하는 방법 및 장치
CN113807340A (zh) 一种基于注意力机制的不规则自然场景文本识别方法
CN113066089A (zh) 一种基于注意力引导机制的实时图像语义分割网络
Uddin et al. A perceptually inspired new blind image denoising method using $ L_ {1} $ and perceptual loss
CN112270366A (zh) 基于自适应多特征融合的微小目标检测方法
CN116168197A (zh) 一种基于Transformer分割网络和正则化训练的图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant