CN111080723A - 基于Unet网络的图像元素分割方法 - Google Patents

基于Unet网络的图像元素分割方法 Download PDF

Info

Publication number
CN111080723A
CN111080723A CN201911297392.1A CN201911297392A CN111080723A CN 111080723 A CN111080723 A CN 111080723A CN 201911297392 A CN201911297392 A CN 201911297392A CN 111080723 A CN111080723 A CN 111080723A
Authority
CN
China
Prior art keywords
image
network
unet network
unet
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911297392.1A
Other languages
English (en)
Other versions
CN111080723B (zh
Inventor
廖志梁
陶亮
王道宁
张亚东
常晓辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yicheng Gaoke Dalian Technology Co ltd
Original Assignee
Yicheng Gaoke Dalian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yicheng Gaoke Dalian Technology Co ltd filed Critical Yicheng Gaoke Dalian Technology Co ltd
Priority to CN201911297392.1A priority Critical patent/CN111080723B/zh
Publication of CN111080723A publication Critical patent/CN111080723A/zh
Application granted granted Critical
Publication of CN111080723B publication Critical patent/CN111080723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Abstract

基于Unet网络的图像元素分割方法,包括以下步骤:1)图像输入到Unet网络后,经过卷积层下采样和上采样以及特征融合操作,恢复到输入图像相同大小的尺寸;2)把Unet网络作为Gan对抗网络的图片生成器G,用分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低二维熵loss;3)引入二维熵loss函数,分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练;4)形态学处理。本发明相比于其他分割的方法,对更大尺寸的图像能够进行有效的分割;提升了图像中细小文字与图标区域的分割效果;分割后的图像边缘更加圆滑,分割结果与真实结果匹配度更高。

Description

基于Unet网络的图像元素分割方法
技术领域
本发明涉及图像处理技术领域。
背景技术
针对不同场景的图像元素分割,例如手机APP图像,网页图像,仪表盘图像等等,现阶段的图像元素分割方法包括:
1)基于边缘检测的分割方法,通过边缘检测算法,检测出图像灰度级或者梯度突变的区域,利用此特征进行图像分割;
2)通过大津法对图像进行二值化处理,根据二值化之后的颜色信息进行元素分割。
以上方案简单易行,缺点也是显而易见的。单个元素内部灰度级变化明显,基于边缘检测的方法会造成同一个元素被分割成多个,部分元素的边缘与背景灰度级相差不大,会造成元素丢失;通过大津法对图像进行二值化,会导致原有图像中部分信息的丢失,直接影响就是分割后元素的丢失;最关键的是这两种方法只是进行元素的分割,无法对分割后的元素进行分类,难以满足要求。
发明内容
为了解决现有图像元素分割方法存在的上述问题,本发明提供了一种基于Unet网络的图像元素分割方法。
本发明为实现上述目的所采用的技术方案是:基于Unet网络的图像元素分割方法,包括以下步骤:
1)图像输入到Unet网络后,经过卷积层下采样操作,得到区域特征F,之后对区域特征F 进行反卷积层的上采样操作,通过特征融合最终恢复到输入图像相同大小的尺寸;
2)把Unet网络作为Gan对抗网络的图片生成器G,用分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低二维熵loss;
3)在图片生成器G原有的loss函数的基础上,引入二维熵loss函数,定义二元组特征F 出现的频率公式如下:
Figure BDA0002320908440000011
其中i表示像素的灰度值,j表示邻域内的灰度均值,f(i,j)表示特征二元组出现的次数,N 表示图像的尺度,计算二维熵的公式如下:
Figure BDA0002320908440000021
通过上述公式分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练;
4)形态学处理,包括以下步骤:
(3)输入图像经过Unet网络得到输出图像,将图像RGB三通道分离,提取图标图像和文字图像,分别对R与G进行反色处理,得到新的R、G图像;
(4)对处理后的图像R、G进行阈值分割,得到二值图像,再对二值图像进行开运算处理,消除分割后残留的细小区域,对较大的区域进行边缘平滑。
所述步骤2)中,用CNN分类网络作为Gan对抗网络的图片鉴别器D。
所述步骤4)-(2)中,对处理后的图像R、G进行大津法阈值分割。
本发明的基于Unet网络的图像元素分割方法,相比于其他分割的方法,对更大尺寸的图像能够进行有效的分割;提升了图像中细小文字与图标区域的分割效果;分割后的图像边缘更加圆滑,分割结果与真实结果匹配度更高。
附图说明
图1是Unet网络分割后结果示意图。
图2是形态学处理后的图像示意图。
图3是Unet网络结构图。
具体实施方式
本发明是基于Unet网络的图像元素分割技术,对输入图像进行卷积操作提取局部区域特征,对最后一个卷积层进行一系列上采样操作,恢复到输入图像相同大小的尺寸,可以对每一个像素进行预测,同时能够保留图像的空间信息。再对Unet网络的输出图像进行形态学处理,得到边缘更加圆滑,分割细节更加完美的图像。本方法主要包含Unet分割网络、Gan对抗网络、二维熵loss函数的引入与形态学后处理四个步骤:
1)Unet分割网络:
输入图像输入到Unet网络后,经过9个卷积层的下采样操作,每次卷积操作后图像长宽缩小一半,通道数增加一倍,最终得到包含512个通道的区域特征F。之后对F进行9 个反卷积层的上采样操作,每次反卷积操作后图像长宽增加一倍,最终恢复到输入图像相同大小的尺寸。反卷积过程中,为了避免下采样操作中图像特征过多丢失,反卷积操作后的图像特征与同尺寸的卷积层图像特征进行通道叠加,增加了特征的厚度,融合了更多原始图像的特征。因为处理图像尺寸较大,本方法在原本Unet网络的基础上添加了卷积层与反卷积层的个数,得到的特征尺寸更小,能够分割出更小的图标与文字区域,如图1所示。
2)Gan对抗网络:
把Unet网络作为Gan对抗网络的图片生成器G,用CNN分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低loss,最终实现图1的效果。
3)二维熵loss函数的引入:
本方法在生成器G原有的loss函数(针对G的L1正则loss函数与针对D的MSEloss函数的权重相加)的基础上,引入了二维熵loss函数。图像二维熵不仅能够反映图像像素位置的灰度信息,还能够反映像素邻域内灰度分布的空间特征。通过引入二维熵loss函数,降低局部区域的离散度,提升分割区域的规律性。对图像进行R,G,B三通道分离,分别对R,G通道进行处理。定义二元组特征F出现的频率公式如下:
Figure BDA0002320908440000031
其中i表示像素的灰度值,j表示邻域内的灰度均值,f(i,j)表示特征二元组出现的次数,N 表示图像的尺度,计算二维熵的公式如下:
Figure BDA0002320908440000032
通过上述公式分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练。
4)形态学处理:
(1)输入图像经过Unet网络得到输出图像,Unet网络结构如图3所示,图像的背景为白色,图标为红色,文字为绿色,如图1右侧所示。将图像RGB三通道分离,提取红色通道 R作为图标图像,提取绿色通道G作为文字图像,分别对R与G进行反色处理,得到新的 R、G图像;
(2)对处理后的图像R、G进行大津法阈值分割,得到二值图像。再对二值图像进行开运算处理,消除分割后残留的细小区域,对较大的区域进行边缘平滑,得到的图像如图2所示,左侧是文字图像,右侧是图标图像,图标与文字已经得到完美的分割。
本方法的主要作用是针对多种类型图像,准确的进行元素分割,并且把分割的元素标记类别,目前标记为文字与图标两类。相比于其他分割的方法,本方法应对多种复杂的图像,都能够进行有效的元素分割,而且只需要进行图像数据集的迭代就能够提升分割精度。面对多种类型数据集无需修改代码即可完成图像分割。
本发明是通过实施例进行描述的,本领域技术人员知悉,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明的保护范围。

Claims (3)

1.基于Unet网络的图像元素分割方法,其特征在于:包括以下步骤:
1)图像输入到Unet网络后,经过卷积层下采样操作,得到区域特征F,之后对区域特征F进行反卷积层的上采样操作,最终恢复到输入图像相同大小的尺寸;
2)把Unet网络作为Gan对抗网络的图片生成器G,用分类网络作为Gan对抗网络的图片鉴别器D,把Unet网络生成的图片传入鉴别器D进行真假判断,通过鉴别器D来不断促进Unet网络权重更新,降低二维熵loss;
3)在图片生成器G原有的loss函数的基础上,引入二维熵loss函数,定义二元组特征F出现的频率公式如下:
Figure FDA0002320908430000011
其中i表示像素的灰度值,j表示邻域内的灰度均值,f(i,j)表示特征二元组出现的次数,N表示图像的尺度,计算二维熵的公式如下:
Figure FDA0002320908430000012
通过上述公式分别计算R通道与B通道的图像熵,并与原有的loss进行权重相加,作为最终的loss函数进行训练;
4)形态学处理,包括以下步骤:
(1)输入图像经过Unet网络得到输出图像,将图像RGB三通道分离,提取图标图像和文字图像,分别对R与G进行反色处理,得到新的R、G图像;
(2)对处理后的图像R、G进行阈值分割,得到二值图像,再对二值图像进行开运算处理,消除分割后残留的细小区域,对较大的区域进行边缘平滑。
2.根据权利要求1所述的基于Unet网络的图像元素分割方法,其特征在于:所述步骤2)中,用CNN分类网络作为Gan对抗网络的图片鉴别器D。
3.根据权利要求1所述的基于Unet网络的图像元素分割方法,其特征在于:所述步骤4)-(2)中,对处理后的图像R、G进行大津法阈值分割。
CN201911297392.1A 2019-12-17 2019-12-17 基于Unet网络的图像元素分割方法 Active CN111080723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911297392.1A CN111080723B (zh) 2019-12-17 2019-12-17 基于Unet网络的图像元素分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911297392.1A CN111080723B (zh) 2019-12-17 2019-12-17 基于Unet网络的图像元素分割方法

Publications (2)

Publication Number Publication Date
CN111080723A true CN111080723A (zh) 2020-04-28
CN111080723B CN111080723B (zh) 2023-12-01

Family

ID=70314871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911297392.1A Active CN111080723B (zh) 2019-12-17 2019-12-17 基于Unet网络的图像元素分割方法

Country Status (1)

Country Link
CN (1) CN111080723B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733756A (zh) * 2021-01-15 2021-04-30 成都大学 一种基于w散度对抗网络的遥感图像语义分割方法
CN112801911A (zh) * 2021-02-08 2021-05-14 苏州长嘴鱼软件有限公司 一种去除自然图像中文字类噪声的方法及装置、存储介质
CN113762120A (zh) * 2021-08-27 2021-12-07 南京南瑞信息通信科技有限公司 绝缘子图像分割方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460764A (zh) * 2018-03-31 2018-08-28 华南理工大学 基于自动上下文和数据增强的超声图像智能分割方法
CN108830864A (zh) * 2018-05-03 2018-11-16 上海电机学院 图像分割方法
CN110084818A (zh) * 2019-04-29 2019-08-02 清华大学深圳研究生院 动态下采样图像分割方法
US20190261945A1 (en) * 2018-02-26 2019-08-29 Siemens Medical Solutions Usa, Inc. Three-Dimensional Segmentation from Two-Dimensional Intracardiac Echocardiography Imaging

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190261945A1 (en) * 2018-02-26 2019-08-29 Siemens Medical Solutions Usa, Inc. Three-Dimensional Segmentation from Two-Dimensional Intracardiac Echocardiography Imaging
CN108460764A (zh) * 2018-03-31 2018-08-28 华南理工大学 基于自动上下文和数据增强的超声图像智能分割方法
CN108830864A (zh) * 2018-05-03 2018-11-16 上海电机学院 图像分割方法
CN110084818A (zh) * 2019-04-29 2019-08-02 清华大学深圳研究生院 动态下采样图像分割方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733756A (zh) * 2021-01-15 2021-04-30 成都大学 一种基于w散度对抗网络的遥感图像语义分割方法
CN112733756B (zh) * 2021-01-15 2023-01-20 成都大学 一种基于w散度对抗网络的遥感图像语义分割方法
CN112801911A (zh) * 2021-02-08 2021-05-14 苏州长嘴鱼软件有限公司 一种去除自然图像中文字类噪声的方法及装置、存储介质
CN112801911B (zh) * 2021-02-08 2024-03-26 苏州长嘴鱼软件有限公司 一种去除自然图像中文字类噪声的方法及装置、存储介质
CN113762120A (zh) * 2021-08-27 2021-12-07 南京南瑞信息通信科技有限公司 绝缘子图像分割方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111080723B (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
US8995780B2 (en) Compression of digital images of scanned documents
Chudasama et al. Image segmentation using morphological operations
CN111080723B (zh) 基于Unet网络的图像元素分割方法
CN107045634B (zh) 一种基于最大稳定极值区域与笔画宽度的文本定位方法
CN104504669B (zh) 一种基于局部二值模式的中值滤波检测方法
WO2012074361A1 (en) Method of image segmentation using intensity and depth information
EP2863362B1 (en) Method and apparatus for scene segmentation from focal stack images
WO2014123584A1 (en) Image processor with edge-preserving noise suppression functionality
CN109241973B (zh) 一种纹理背景下的字符全自动软分割方法
CN108197644A (zh) 一种图像识别方法和装置
EP2645332B1 (en) Image processing device that separates image into plural regions
Khodadadi et al. Text localization, extraction and inpainting in color images
Singh et al. Adaptive binarization of severely degraded and non-uniformly illuminated documents
CN108335268B (zh) 一种基于盲解卷积的彩色图像去模糊的方法
CN107341459A (zh) 一种基于分数阶微积分的人脸检测图像预处理方法
Shi et al. Image enhancement for degraded binary document images
Jwaid et al. Study and analysis of copy-move & splicing image forgery detection techniques
CN111161299B (zh) 影像分割方法、存储介质及电子装置
KR20060007901A (ko) 영상으로부터의 중요 객체 추출 장치 및 방법
Sreedevi et al. Ngfica based digitization of historic inscription images
Nasiri et al. A new binarization method for high accuracy handwritten digit recognition of slabs in steel companies
Pote et al. An improved technique to detect text from scene videos
Soumya et al. Enhancement and segmentation of historical records
US20170147895A1 (en) Method and device for digit separation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant