CN111080723A - 基于Unet网络的图像元素分割方法 - Google Patents
基于Unet网络的图像元素分割方法 Download PDFInfo
- Publication number
- CN111080723A CN111080723A CN201911297392.1A CN201911297392A CN111080723A CN 111080723 A CN111080723 A CN 111080723A CN 201911297392 A CN201911297392 A CN 201911297392A CN 111080723 A CN111080723 A CN 111080723A
- Authority
- CN
- China
- Prior art keywords
- image
- network
- unet network
- unet
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000005070 sampling Methods 0.000 claims abstract description 8
- 230000000877 morphologic effect Effects 0.000 claims abstract description 6
- 238000009499 grossing Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 238000003708 edge detection Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Abstract
基于Unet网络的图像元素分割方法,包括以下步骤:1)图像输入到Unet网络后,经过卷积层下采样和上采样以及特征融合操作,恢复到输入图像相同大小的尺寸;2)把Unet网络作为Gan对抗网络的图片生成器G,用分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低二维熵loss;3)引入二维熵loss函数,分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练;4)形态学处理。本发明相比于其他分割的方法,对更大尺寸的图像能够进行有效的分割;提升了图像中细小文字与图标区域的分割效果;分割后的图像边缘更加圆滑,分割结果与真实结果匹配度更高。
Description
技术领域
本发明涉及图像处理技术领域。
背景技术
针对不同场景的图像元素分割,例如手机APP图像,网页图像,仪表盘图像等等,现阶段的图像元素分割方法包括:
1)基于边缘检测的分割方法,通过边缘检测算法,检测出图像灰度级或者梯度突变的区域,利用此特征进行图像分割;
2)通过大津法对图像进行二值化处理,根据二值化之后的颜色信息进行元素分割。
以上方案简单易行,缺点也是显而易见的。单个元素内部灰度级变化明显,基于边缘检测的方法会造成同一个元素被分割成多个,部分元素的边缘与背景灰度级相差不大,会造成元素丢失;通过大津法对图像进行二值化,会导致原有图像中部分信息的丢失,直接影响就是分割后元素的丢失;最关键的是这两种方法只是进行元素的分割,无法对分割后的元素进行分类,难以满足要求。
发明内容
为了解决现有图像元素分割方法存在的上述问题,本发明提供了一种基于Unet网络的图像元素分割方法。
本发明为实现上述目的所采用的技术方案是:基于Unet网络的图像元素分割方法,包括以下步骤:
1)图像输入到Unet网络后,经过卷积层下采样操作,得到区域特征F,之后对区域特征F 进行反卷积层的上采样操作,通过特征融合最终恢复到输入图像相同大小的尺寸;
2)把Unet网络作为Gan对抗网络的图片生成器G,用分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低二维熵loss;
3)在图片生成器G原有的loss函数的基础上,引入二维熵loss函数,定义二元组特征F 出现的频率公式如下:
其中i表示像素的灰度值,j表示邻域内的灰度均值,f(i,j)表示特征二元组出现的次数,N 表示图像的尺度,计算二维熵的公式如下:
通过上述公式分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练;
4)形态学处理,包括以下步骤:
(3)输入图像经过Unet网络得到输出图像,将图像RGB三通道分离,提取图标图像和文字图像,分别对R与G进行反色处理,得到新的R、G图像;
(4)对处理后的图像R、G进行阈值分割,得到二值图像,再对二值图像进行开运算处理,消除分割后残留的细小区域,对较大的区域进行边缘平滑。
所述步骤2)中,用CNN分类网络作为Gan对抗网络的图片鉴别器D。
所述步骤4)-(2)中,对处理后的图像R、G进行大津法阈值分割。
本发明的基于Unet网络的图像元素分割方法,相比于其他分割的方法,对更大尺寸的图像能够进行有效的分割;提升了图像中细小文字与图标区域的分割效果;分割后的图像边缘更加圆滑,分割结果与真实结果匹配度更高。
附图说明
图1是Unet网络分割后结果示意图。
图2是形态学处理后的图像示意图。
图3是Unet网络结构图。
具体实施方式
本发明是基于Unet网络的图像元素分割技术,对输入图像进行卷积操作提取局部区域特征,对最后一个卷积层进行一系列上采样操作,恢复到输入图像相同大小的尺寸,可以对每一个像素进行预测,同时能够保留图像的空间信息。再对Unet网络的输出图像进行形态学处理,得到边缘更加圆滑,分割细节更加完美的图像。本方法主要包含Unet分割网络、Gan对抗网络、二维熵loss函数的引入与形态学后处理四个步骤:
1)Unet分割网络:
输入图像输入到Unet网络后,经过9个卷积层的下采样操作,每次卷积操作后图像长宽缩小一半,通道数增加一倍,最终得到包含512个通道的区域特征F。之后对F进行9 个反卷积层的上采样操作,每次反卷积操作后图像长宽增加一倍,最终恢复到输入图像相同大小的尺寸。反卷积过程中,为了避免下采样操作中图像特征过多丢失,反卷积操作后的图像特征与同尺寸的卷积层图像特征进行通道叠加,增加了特征的厚度,融合了更多原始图像的特征。因为处理图像尺寸较大,本方法在原本Unet网络的基础上添加了卷积层与反卷积层的个数,得到的特征尺寸更小,能够分割出更小的图标与文字区域,如图1所示。
2)Gan对抗网络:
把Unet网络作为Gan对抗网络的图片生成器G,用CNN分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低loss,最终实现图1的效果。
3)二维熵loss函数的引入:
本方法在生成器G原有的loss函数(针对G的L1正则loss函数与针对D的MSEloss函数的权重相加)的基础上,引入了二维熵loss函数。图像二维熵不仅能够反映图像像素位置的灰度信息,还能够反映像素邻域内灰度分布的空间特征。通过引入二维熵loss函数,降低局部区域的离散度,提升分割区域的规律性。对图像进行R,G,B三通道分离,分别对R,G通道进行处理。定义二元组特征F出现的频率公式如下:
其中i表示像素的灰度值,j表示邻域内的灰度均值,f(i,j)表示特征二元组出现的次数,N 表示图像的尺度,计算二维熵的公式如下:
通过上述公式分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练。
4)形态学处理:
(1)输入图像经过Unet网络得到输出图像,Unet网络结构如图3所示,图像的背景为白色,图标为红色,文字为绿色,如图1右侧所示。将图像RGB三通道分离,提取红色通道 R作为图标图像,提取绿色通道G作为文字图像,分别对R与G进行反色处理,得到新的 R、G图像;
(2)对处理后的图像R、G进行大津法阈值分割,得到二值图像。再对二值图像进行开运算处理,消除分割后残留的细小区域,对较大的区域进行边缘平滑,得到的图像如图2所示,左侧是文字图像,右侧是图标图像,图标与文字已经得到完美的分割。
本方法的主要作用是针对多种类型图像,准确的进行元素分割,并且把分割的元素标记类别,目前标记为文字与图标两类。相比于其他分割的方法,本方法应对多种复杂的图像,都能够进行有效的元素分割,而且只需要进行图像数据集的迭代就能够提升分割精度。面对多种类型数据集无需修改代码即可完成图像分割。
本发明是通过实施例进行描述的,本领域技术人员知悉,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明的保护范围。
Claims (3)
1.基于Unet网络的图像元素分割方法,其特征在于:包括以下步骤:
1)图像输入到Unet网络后,经过卷积层下采样操作,得到区域特征F,之后对区域特征F进行反卷积层的上采样操作,最终恢复到输入图像相同大小的尺寸;
2)把Unet网络作为Gan对抗网络的图片生成器G,用分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低二维熵loss;
3)在图片生成器G原有的loss函数的基础上,引入二维熵loss函数,定义二元组特征F出现的频率公式如下:
其中i表示像素的灰度值,j表示邻域内的灰度均值,f(i,j)表示特征二元组出现的次数,N表示图像的尺度,计算二维熵的公式如下:
通过上述公式分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练;
4)形态学处理,包括以下步骤:
(1)输入图像经过Unet网络得到输出图像,将图像RGB三通道分离,提取图标图像和文字图像,分别对R与G进行反色处理,得到新的R、G图像;
(2)对处理后的图像R、G进行阈值分割,得到二值图像,再对二值图像进行开运算处理,消除分割后残留的细小区域,对较大的区域进行边缘平滑。
2.根据权利要求1所述的基于Unet网络的图像元素分割方法,其特征在于:所述步骤2)中,用CNN分类网络作为Gan对抗网络的图片鉴别器D。
3.根据权利要求1所述的基于Unet网络的图像元素分割方法,其特征在于:所述步骤4)-(2)中,对处理后的图像R、G进行大津法阈值分割。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911297392.1A CN111080723B (zh) | 2019-12-17 | 2019-12-17 | 基于Unet网络的图像元素分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911297392.1A CN111080723B (zh) | 2019-12-17 | 2019-12-17 | 基于Unet网络的图像元素分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111080723A true CN111080723A (zh) | 2020-04-28 |
CN111080723B CN111080723B (zh) | 2023-12-01 |
Family
ID=70314871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911297392.1A Active CN111080723B (zh) | 2019-12-17 | 2019-12-17 | 基于Unet网络的图像元素分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111080723B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733756A (zh) * | 2021-01-15 | 2021-04-30 | 成都大学 | 一种基于w散度对抗网络的遥感图像语义分割方法 |
CN112801911A (zh) * | 2021-02-08 | 2021-05-14 | 苏州长嘴鱼软件有限公司 | 一种去除自然图像中文字类噪声的方法及装置、存储介质 |
CN113762120A (zh) * | 2021-08-27 | 2021-12-07 | 南京南瑞信息通信科技有限公司 | 绝缘子图像分割方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460764A (zh) * | 2018-03-31 | 2018-08-28 | 华南理工大学 | 基于自动上下文和数据增强的超声图像智能分割方法 |
CN108830864A (zh) * | 2018-05-03 | 2018-11-16 | 上海电机学院 | 图像分割方法 |
CN110084818A (zh) * | 2019-04-29 | 2019-08-02 | 清华大学深圳研究生院 | 动态下采样图像分割方法 |
US20190261945A1 (en) * | 2018-02-26 | 2019-08-29 | Siemens Medical Solutions Usa, Inc. | Three-Dimensional Segmentation from Two-Dimensional Intracardiac Echocardiography Imaging |
-
2019
- 2019-12-17 CN CN201911297392.1A patent/CN111080723B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190261945A1 (en) * | 2018-02-26 | 2019-08-29 | Siemens Medical Solutions Usa, Inc. | Three-Dimensional Segmentation from Two-Dimensional Intracardiac Echocardiography Imaging |
CN108460764A (zh) * | 2018-03-31 | 2018-08-28 | 华南理工大学 | 基于自动上下文和数据增强的超声图像智能分割方法 |
CN108830864A (zh) * | 2018-05-03 | 2018-11-16 | 上海电机学院 | 图像分割方法 |
CN110084818A (zh) * | 2019-04-29 | 2019-08-02 | 清华大学深圳研究生院 | 动态下采样图像分割方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733756A (zh) * | 2021-01-15 | 2021-04-30 | 成都大学 | 一种基于w散度对抗网络的遥感图像语义分割方法 |
CN112733756B (zh) * | 2021-01-15 | 2023-01-20 | 成都大学 | 一种基于w散度对抗网络的遥感图像语义分割方法 |
CN112801911A (zh) * | 2021-02-08 | 2021-05-14 | 苏州长嘴鱼软件有限公司 | 一种去除自然图像中文字类噪声的方法及装置、存储介质 |
CN112801911B (zh) * | 2021-02-08 | 2024-03-26 | 苏州长嘴鱼软件有限公司 | 一种去除自然图像中文字类噪声的方法及装置、存储介质 |
CN113762120A (zh) * | 2021-08-27 | 2021-12-07 | 南京南瑞信息通信科技有限公司 | 绝缘子图像分割方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111080723B (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
US8995780B2 (en) | Compression of digital images of scanned documents | |
Chudasama et al. | Image segmentation using morphological operations | |
CN111080723B (zh) | 基于Unet网络的图像元素分割方法 | |
CN107045634B (zh) | 一种基于最大稳定极值区域与笔画宽度的文本定位方法 | |
CN104504669B (zh) | 一种基于局部二值模式的中值滤波检测方法 | |
WO2012074361A1 (en) | Method of image segmentation using intensity and depth information | |
EP2863362B1 (en) | Method and apparatus for scene segmentation from focal stack images | |
WO2014123584A1 (en) | Image processor with edge-preserving noise suppression functionality | |
CN109241973B (zh) | 一种纹理背景下的字符全自动软分割方法 | |
CN108197644A (zh) | 一种图像识别方法和装置 | |
EP2645332B1 (en) | Image processing device that separates image into plural regions | |
Khodadadi et al. | Text localization, extraction and inpainting in color images | |
Singh et al. | Adaptive binarization of severely degraded and non-uniformly illuminated documents | |
CN108335268B (zh) | 一种基于盲解卷积的彩色图像去模糊的方法 | |
CN107341459A (zh) | 一种基于分数阶微积分的人脸检测图像预处理方法 | |
Shi et al. | Image enhancement for degraded binary document images | |
Jwaid et al. | Study and analysis of copy-move & splicing image forgery detection techniques | |
CN111161299B (zh) | 影像分割方法、存储介质及电子装置 | |
KR20060007901A (ko) | 영상으로부터의 중요 객체 추출 장치 및 방법 | |
Sreedevi et al. | Ngfica based digitization of historic inscription images | |
Nasiri et al. | A new binarization method for high accuracy handwritten digit recognition of slabs in steel companies | |
Pote et al. | An improved technique to detect text from scene videos | |
Soumya et al. | Enhancement and segmentation of historical records | |
US20170147895A1 (en) | Method and device for digit separation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |