CN110599495B - 一种基于语义信息挖掘的图像分割方法 - Google Patents
一种基于语义信息挖掘的图像分割方法 Download PDFInfo
- Publication number
- CN110599495B CN110599495B CN201910684367.2A CN201910684367A CN110599495B CN 110599495 B CN110599495 B CN 110599495B CN 201910684367 A CN201910684367 A CN 201910684367A CN 110599495 B CN110599495 B CN 110599495B
- Authority
- CN
- China
- Prior art keywords
- layer
- output
- encoder
- semantic information
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于语义信息挖掘的图像分割方法。传统深度学习算法往往包含编码器和解码器两个部分,其中编码器用于提取细节信息,解码器会将这些细节信息融合,进行上采样,得到最终的分割结果。目前大多分割方法在编码器部分只使用一条通路,基于残差网络的分割方法又在编码器的每个下采样区域中增加了一条残差通路,用于补充信息,但是补充的信息来自于之前的卷积层,提取的细节信息不足,因此,需要在分割过程中进行语义信息挖掘。本发明采用了语义信息挖掘编码器、解码器与特征金字塔的组合结构,在BraTS2017数据集上进行了算法验证,我们的方法优于传统的方法,具有更好的分割结果。
Description
技术领域
本发明属于图像处理与分析领域,具体涉及一种基于语义信息挖掘的图像分割方法。
背景技术
图像的语义分割,就是对图像中每个像素进行分类,将相同语义的类别分割出来。近年来,自动驾驶、无人机、图片美化、智能家居、智能医疗等行业中图像分割的应用日渐增多,越来越多的产品、装置需要更好的图像分割技术作为支撑。
传统的图像自动分割算法包括阈值法、边缘检测法、区域增长法、分水岭算法、基于模型的方法(水平集)和综合使用多种方法。上述传统算法运算效率较高,但是准确度仍不能达到应用要求,而且在分割过程中需要人为干预。随着计算机科学与人工智能的发展,计算机的运行速度不断加快,在面对很多实际应用问题时,深度学习方法得到越来越多的使用。基于深度学习的图像分割算法在准确率性能上优于以上传统算法,但是在性能上仍存在可改进的空间。传统深度学习算法往往包含编码器和解码器两个部分,其中编码器用于提取细节信息,解码器会将这些细节信息融合,进行上采样,得到最终的分割结果。目前大多分割方法在编码器部分只使用一条通路,基于残差网络的分割方法又在编码器的每个下采样区域中增加了一条残差通路,用于补充信息,但是补充的信息来自于之前的卷积层,提取的细节信息不足,因此,需要在分割过程中进行语义信息挖掘。
发明内容
传统的基于卷积神经网络的图像分割方法采用单通路编码器进行特征提取,对细节信息的提取不足。针对这一问题,本发明提出了一种基于语义信息挖掘的图像分割方法,在编码器的每个下采样区域中增加了语义信息挖掘支路,融合了更丰富的细节信息,提高分割的精度。
本发明采用的技术方案如下:
一种基于语义信息挖掘的图像分割方法,该方法使用语义信息挖掘支路结构,在分割过程中提取更丰富的细节信息,并将其逐次拼接到编码器的各个下采样区域中,再经过解码器和特征金字塔,得到分割结果,具体步骤包括:
(一)数据预处理:对数据集进行归一化处理,并进行数据多通道融合,再进行数据清洗,将没有标签的图像去除,最后进行数据增强,得到最终数据集;
(二)经过语义信息挖掘编码器对数据进行下采样处理:编码器部分由多个下采样区域组成,数量可自由设置,每个下采样区域包含三条支路:第一条为特征提取支路,包含两个卷积层,每个卷积层后添加了局部响应归一化层与激活层;第二条为残差支路,包含一个卷积层、一个局部响应归一化层和一个激活层,然后与特征提取支路的输出进行特征相加;第三条为语义信息挖掘支路,由两个残差单元组成,即四个卷积层,其中每两个卷积层添加一个残差支路,每个卷积层后添加了局部响应归一化层与激活层,然后与特征提取支路进行特征拼接,下采样区域三条支路结束后为一个池化层,改变图像尺度,池化层的输出特征为下一个下采样区域的输入特征,特征经过多个下采样区域后尺度变小,同时通道数变大,最后经过一个没有池化层的下采样区域得到最终的编码器输出。过程如下所示:
(三)经过解码器对数据进行上采样处理:解码器部分由多个上采样区域组成,数量可自由设置,最终需要上采样到原图尺度,下采样区域包括一个上采样层、一个连接层和两个卷积层,其中每个卷积层后增加一个局部响应归一化层和一个激活层,其中上采样层将来自上一级解码器的特征进行上采样,连接层将上采样后的特征与来自语义信息挖掘编码器的同级特征连接,最后经过卷积等操作得到下采样区域的输出,过程如下所示:
D(xi)是解码器中第i个上采样区域的输出;
(四)经过特征金字塔输出分割结果:将解码器各上采样区域的输出上采样到原图尺度,且通道相同,然后将这些特征相加,过程如下所示:
P(x)是特征金字塔的输出,最后经过一个卷积层并激活,得到最终的分割结果,过程如下所示:
Output是网络最终的输出结果;
(五)结果预测:将训练好的模型保存,输入测试集,得到最终的分割结果。
在模型训练的数据预处理过程中,将数据随机打乱顺序,将数据集分为n份,选取其中n-1份作为训练集,选取剩余的1份作为验证集合,得到最终分割结果。本发明与传统的方法相对比,分割精度更高,具有更好的泛化能力。
附图说明
图1是基于语义信息挖掘的图像分割方法示意框图。
图2是本发明使用的语义信息挖掘结构示意框图。
图3是本发明的图像处理装置示意框图。
具体实施方式
下面通过附图对本发明技术方案进行详细说明。
如图1所示,本发明基于语义信息挖掘的图像分割方法如下文所示:
步骤一:训练阶段:使用有标注的数据集进行训练。将数据集送入网络中参与训练,将交叉熵函数作为损失函数,使用Adam优化器更新语义信息挖掘网络的参数,训练迭代70次,每次迭代都保存模型,保存模型之后使用数据集中的验证集部分进行验证,将最后一个模型作为该方法生成的模型。
步骤二:测试阶段:将数据进行预处理,对多个模态的数据进行裁剪然后进行减均值除以方差的标准化操作,然后送入训练阶段得到的效果最优的模型中,经过模型计算,得到分割结果图并显示出来。
如图2所示,语义信息挖掘的网络结构与具体方法如下文所示:
(一)数据预处理:
对数据集进行归一化处理,
X为输入数据,μ为输入数据的均值,σ为输入数据的方差,X′为归一化处理后的数据。如有多模态数据,将其融合,形成多通道数据,如数据为单模态,直接进行后续处理。将数据读取进来,得到的数据大小为b×w×h×c,其中b为图像数目,w为图像宽度,h为图像高度,c为通道数。然后进行数据清洗,打乱数据顺序,将没有标签的图像去除。最后进行数据增强,将原数据集的前半部分向左旋转90度,后半部分向右旋转90度,增强为原来的两倍,得到最终数据集。将全部数据集分为n份分别保存为数组形式,读取其中的n-1份作为训练集,剩余的1份作为测试集;
(二)语义信息挖掘编码器:
语义信息挖掘编码器部分由多个下采样区域组成。其中四个包含池化层,最后一个不包含池化层。每个下采样区域包含三条支路:第一条为特征提取支路,包含两个卷积层,每个卷积层后添加了局部响应归一化层与激活层;第二条为残差支路,包含一个卷积层、一个局部响应归一化层和一个激活层,然后与特征提取支路的输出进行特征相加;第三条为语义信息挖掘支路,由两个残差单元组成,即四个卷积层,其中每两个卷积层添加一个残差支路,每个卷积层后添加了局部响应归一化层与激活层,然后与特征提取支路进行特征拼接。下采样区域三条支路结束后为一个池化层,改变图像尺度,池化层的输出特征为下一个下采样区域的输入特征。特征经过多个下采样区域后尺度变小,同时通道数变大,最后经过一个没有池化层的下采样区域得到最终的编码器输出,过程如下所示:
(三)解码器:
经过解码器对数据进行上采样处理。在经历下采样之后,图像尺度变小,采用上采样的方式将图像恢复到原尺度。解码器部分由多个上采样区域组成,数量为4,最终上采样到原图尺度。下采样区域包括一个上采样层、一个连接层和两个卷积层,其中每个卷积层后增加一个局部响应归一化层和一个激活层,其中上采样层将来自上一级解码器的特征进行上采样,连接层将上采样后的特征与来自语义信息挖掘编码器的同级特征连接,最后经过卷积等操作得到下采样区域的输出,过程如下所示:
D(xi)是解码器中第i个上采样区域的输出;
(四)特征金字塔:
将解码器区域不同尺度的输出全送入特征金字塔计算分割结果。将解码器各上采样区域的输出上采样到原图尺度,采用双线性插值法,通道数都变成32,卷积核大小为1,然后将这些特征相加,过程如下所示:
P(x)是特征金字塔的输出,最后经过一个卷积层并激活,得到最终的分割结果,过程如下所示:
Output是网络最终的输出结果;
(五)结果预测:将训练好的模型保存,输入测试集,得到最终分割结果。
在模型训练的数据预处理过程中,将数据随机打乱顺序,将数据集分为n份,选取其中n-1份作为训练集,选取剩余的1份作为验证集合,得到最终分割结果。
本发明与传统的方法相对比,分割精度更高,具有更好的泛化能力。
本发明的效果可以通过分割结果进一步说明:
为验证本发明的性能,采用数据集BraTS2017,包含285个患者的多模态数据。将标准数据集分为训练集与验证集,将语义信息挖掘的图像分割方法与其他不使用语义信息挖掘的方法进行对比。分别对比了水肿、坏死、增强部分的dice系数、查全率、查准率。
表1为本发明在BraTS2017数据集上的分割结果。其中VGG、DUNet、FCNN为深度学习图像分割领域中的经典方法,FPUNet为基于金字塔融合学习的图像分割方法,SIMNet为语义信息挖掘编码器、解码器、特征金字塔的组合,是本发明提出的方法。表中黑体数字为该列最大值,代表了最优效果。综上所述,本发明比经典方法的分割效果更好。
表1
Claims (1)
1.一种基于语义信息挖掘的图像分割方法,该方法使用语义信息挖掘支路结构,在分割过程中提取更丰富的细节信息,并将其逐次拼接到编码器的各个下采样区域中,再经过解码器和特征金字塔,得到分割结果,具体步骤包括:
(一)数据预处理:对数据集进行归一化处理,并进行数据多通道融合,再进行数据清洗,将没有标签的图像去除,最后进行数据增强,得到最终数据集;
(二)经过语义信息挖掘编码器对数据进行下采样处理:编码器部分由多个下采样区域组成,数量可自由设置,每个下采样区域包含三条支路:第一条为特征提取支路,包含两个卷积层,每个卷积层后添加了局部响应归一化层与激活层;第二条为残差支路,包含一个卷积层、一个局部响应归一化层和一个激活层,然后与特征提取支路的输出进行特征相加;第三条为语义信息挖掘支路,由两个残差单元组成,即四个卷积层,其中每两个卷积层添加一个残差支路,每个卷积层后添加了局部响应归一化层与激活层,然后与特征提取支路进行特征拼接,下采样区域三条支路结束后为一个池化层,改变图像尺度,池化层的输出特征为下一个下采样区域的输入特征,特征经过多个下采样区域后尺度变小,同时通道数变大,最后经过一个没有池化层的下采样区域得到最终的编码器输出,过程如下所示:
(三)经过解码器对数据进行上采样处理:解码器部分由多个上采样区域组成,数量可自由设置,最终需要上采样到原图尺度,上采样区域包括一个上采样层、一个连接层和两个卷积层,其中每个卷积层后增加一个局部响应归一化层和一个激活层,其中上采样层将来自上一级解码器的特征进行上采样,连接层将上采样后的特征与来自语义信息挖掘编码器的同级特征连接,最后经过卷积操作得到下采样区域的输出,过程如下所示:
D(xi)是解码器中第i个上采样区域的输出;
(四)经过特征金字塔输出分割结果:将解码器各上采样区域的输出上采样到原图尺度,且通道相同,然后将这些特征相加,过程如下所示:
P(x)是特征金字塔的输出,最后经过一个卷积层并激活,得到最终的分割结果,过程如下所示:
Output是网络最终的输出结果,n为模型层数是大于等于二的整数;
(五)结果预测:将训练好的模型保存,输入测试集,得到最终的分割结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910684367.2A CN110599495B (zh) | 2019-07-26 | 2019-07-26 | 一种基于语义信息挖掘的图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910684367.2A CN110599495B (zh) | 2019-07-26 | 2019-07-26 | 一种基于语义信息挖掘的图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110599495A CN110599495A (zh) | 2019-12-20 |
CN110599495B true CN110599495B (zh) | 2022-08-16 |
Family
ID=68853213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910684367.2A Active CN110599495B (zh) | 2019-07-26 | 2019-07-26 | 一种基于语义信息挖掘的图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110599495B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488884A (zh) * | 2020-04-28 | 2020-08-04 | 东南大学 | 低计算量及高度特征融合的实时语义分割方法 |
CN111915612B (zh) * | 2020-07-24 | 2022-10-14 | 山东大学 | 一种基于多编码器卷积神经网络的图像分割方法和系统 |
CN113393476B (zh) * | 2021-07-07 | 2022-03-11 | 山东大学 | 一种轻量化多路径网状图像分割方法、系统和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447994A (zh) * | 2018-11-05 | 2019-03-08 | 陕西师范大学 | 结合完全残差与特征融合的遥感图像分割方法 |
CN109584246A (zh) * | 2018-11-16 | 2019-04-05 | 成都信息工程大学 | 基于多尺度特征金字塔的dcm心肌诊疗放射影像分割方法 |
CN109636802A (zh) * | 2019-01-18 | 2019-04-16 | 天津工业大学 | 基于深度卷积神经网络的肺实质经ct图像分割方法 |
-
2019
- 2019-07-26 CN CN201910684367.2A patent/CN110599495B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447994A (zh) * | 2018-11-05 | 2019-03-08 | 陕西师范大学 | 结合完全残差与特征融合的遥感图像分割方法 |
CN109584246A (zh) * | 2018-11-16 | 2019-04-05 | 成都信息工程大学 | 基于多尺度特征金字塔的dcm心肌诊疗放射影像分割方法 |
CN109636802A (zh) * | 2019-01-18 | 2019-04-16 | 天津工业大学 | 基于深度卷积神经网络的肺实质经ct图像分割方法 |
Non-Patent Citations (2)
Title |
---|
Weakly-Supervised Semantic Segmentation by Iteratively Mining Common Object Features;Xiang Wang et al.;《CVF》;20181231;第1354-1362页 * |
基于全卷积神经网络的多尺度视网膜血管分割;郑婷月等;《光学学报》;20190228;第1-3节 * |
Also Published As
Publication number | Publication date |
---|---|
CN110599495A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111681252B (zh) | 一种基于多路径注意力融合的医学图像自动分割方法 | |
CN109509192B (zh) | 融合多尺度特征空间与语义空间的语义分割网络 | |
CN110223304B (zh) | 一种基于多路径聚合的图像分割方法、装置和计算机可读存储介质 | |
CN113159051B (zh) | 一种基于边缘解耦的遥感图像轻量化语义分割方法 | |
CN111325751A (zh) | 基于注意力卷积神经网络的ct图像分割系统 | |
CN112541503A (zh) | 基于上下文注意力机制和信息融合的实时语义分割方法 | |
CN111242288B (zh) | 一种用于病变图像分割的多尺度并行深度神经网络模型构建方法 | |
CN110599495B (zh) | 一种基于语义信息挖掘的图像分割方法 | |
CN111340814A (zh) | 一种基于多模态自适应卷积的rgb-d图像语义分割方法 | |
CN112258526B (zh) | 一种基于对偶注意力机制的ct肾脏区域级联分割方法 | |
CN111523546A (zh) | 图像语义分割方法、系统及计算机存储介质 | |
CN110866938B (zh) | 一种全自动视频运动目标分割方法 | |
CN111369567B (zh) | 三维图像中目标对象的分割方法、装置及电子设备 | |
CN111915612B (zh) | 一种基于多编码器卷积神经网络的图像分割方法和系统 | |
CN112700460B (zh) | 图像分割方法及系统 | |
CN116309648A (zh) | 一种基于多注意力融合的医学图像分割模型构建方法 | |
CN111062432B (zh) | 一种语义上多模态图像生成的方法 | |
CN113052775B (zh) | 一种图像去阴影方法及装置 | |
CN110738660A (zh) | 基于改进U-net的脊椎CT图像分割方法及装置 | |
CN112348830B (zh) | 基于改进3D U-Net的多器官分割方法 | |
CN112270366B (zh) | 基于自适应多特征融合的微小目标检测方法 | |
CN114821058A (zh) | 一种图像语义分割方法、装置、电子设备及存储介质 | |
CN114359297A (zh) | 基于注意力金字塔的多分辨率语义分割方法及装置 | |
CN114821050A (zh) | 一种基于transformer的指称图像分割方法 | |
CN110580726B (zh) | 基于动态卷积网络的自然场景下人脸素描生成模型及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |