CN101599172A - 非均匀光照的文本图像的亮度补偿分割方法 - Google Patents
非均匀光照的文本图像的亮度补偿分割方法 Download PDFInfo
- Publication number
- CN101599172A CN101599172A CNA200810109000XA CN200810109000A CN101599172A CN 101599172 A CN101599172 A CN 101599172A CN A200810109000X A CNA200810109000X A CN A200810109000XA CN 200810109000 A CN200810109000 A CN 200810109000A CN 101599172 A CN101599172 A CN 101599172A
- Authority
- CN
- China
- Prior art keywords
- image
- illumination
- subimage
- gray
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明涉及一种对非均匀光照文本图像进行分割的照度补偿算法,属于计算机图像处理技术领域。文本分割是文本图像自动识别的一个基本的预处理技术,分割质量的好坏对文字识别的效果具有显著的影响。数码照相机的出现实现了以自然光为光源的图像摄入技术,极大地方便了图像的获取,但是生成的非均匀光照图像,很难进行分割。本发明提出了一种用于处理非均匀光照文本图像的分割技术。我们采用照度补偿的方法把非均匀光照文本图像转换成等效的均匀光照图像,然后用全域自动阈值方法对生成的均匀光照图像进行分割,可以克服非均匀光照引起的困难。实验结果表明由照度补偿方法生成的二值文本图像质量优于包括自适应子窗口等传统的图像分割方法。
Description
技术领域
本发明涉及一种对非均匀光照文本图像进行分割的亮度补偿算法,属于计算机图像处理技术领域。
背景技术
图像分割的目的是把图像中的物体从背景中区分出来,对于文本图像就是使灰度图像或彩色图像中的字符和线条从背景中分离出来。图像分割是文本图像自动识别的一个基本的预处理技术,分割质量的好坏直接决定了后续的图像或文字识别的效果。
数码照相机、数码摄像机和带摄像功能的手机等电子设备的出现,实现了以自然光为光源的图像摄入技术,大大方便了图像的获取。但是这些设备获得的是非均匀光照图像,对于图像分割则带来了负面的影响。对于均匀光照的文本图像,几乎所有的整体阈值方法都能对文本图像进行自动的分割,并得到清晰的文本二值图[1-9]。非均匀光照的文本图像,情况则完全不同。二十多年来作为文本图像的分析和识别的一个基本问题,已经从多个方面对之进行了研究,提出了分区分割,自适应窗口分割,基于边界点的分割曲面等方法[10-13]。但是目前非均匀光照文本图像的分割技术生成的二值图像基本上不能满足光学字符识别的需要。对于非均匀光照的文本图像,全局阈值会使低照度的区域大片变黑,或使高照度的区域大片变白。基于窗口的分割技术的一个主要缺陷则是会把较大的背景区域错分为前景区域,产生所谓的“幽灵斑点”[13]。
发明内容
本发明提出了一种用于处理非均匀光照文本图像的分割技术。我们采用照度补偿的方法把非均匀光照文本图像转换成等效的均匀光照图像,然后用全域自动阈值方法(如大津展之方法[2],Kapur方法[5],Kittler方法[7]等)对生成的均匀光照图像进行分割,可以克服非均匀光照引起的困难,获得可供后续的文本分析和光学字符识别利用的二值图像。
1、图像灰度值与照度
光照补偿方法的基础是Stockhan[14-15]的物体照度理论。Stockhan[14]的理论认为,图像中物体的亮度(由对应于物体的位置处的像素灰度值表示)由该物体表面的照度(illumination)及其反射率(reflectance)共同作用的结果。以和分别表示点处的照度和反射率,则图像上与该点对应的像素灰度值为:
我们可以根据Stockhan的照度理论,来推算在均匀照度i0的作用下,由文本生成的文本图像的灰度函数:
运用公式(1),有:
因此如果能获得生成图像时的照度分布函数,我们就可以得到均匀光照下文本的灰度图像。
2、照度分布函数的估算
设原图是宽为lw,高为lh的灰度图像(以像素为长度单位)。如原图像是彩色图像,可以用通常的平均法把彩色图像转换为灰度图。我们把原图像分成边长为ls的正方形子图像,每个子图像有Ns□ls 2个像素。如lw和lh能整除ls,那么可以把原图分为sw□sh个子图像,并以记子图像的位置。其中符号表示a除以b的整数部分。。
3、光度补偿的插值方法
很容易得到插值函数中的系数的计算公式:
4、均匀照度下文本的灰度图像
公式(3)中的i0表示均匀照度,是个待设定的量。由于数值图像中的灰度值的取值范围在0~255之间,对于灰度值大于255的像素,只能以255作为近似,于是会引起信息损失。新图像的灰度值正比于i0。于是如则就可能大于255。选择可以避免把高亮度像素强制设定为255灰度引起的信息损失,但是新图像的灰度值将之间,其中于是使有效灰度区间缩小,也会导致分割质量下降。根据以上的分析,我们把均匀照度i0设定为
于是用公式
生成的灰度图像就是文本在均匀光照下生成的灰度图像。
5、全局阈值方法
由节3得到的是一均匀光照的文本图像,可以运用全局阈值分割方法进行二值化。我们的试验表明对于均匀光照的文本图像,现有的全局阈值分割方法都能应用[1-9],而且分割质量没有本质的区别,因此我们采用大津展之方法,原因是最为节省计算时间,而且质量也好。以下是我们采用的大津展之全局阈值方法[2]。
计算图像的直方图。设该图像中灰度值为j的像素数目为nj,图像像素总数为N□lw□lh。于是得到各个灰度值的几率分布:
计算前景和背景像素的灰度平均值:
其中,
分别计算图像的类间方差:
选择使图像的类间方差为最大的灰度值作为分割阈值,即最优阈值k0*为:
6、图像边界区域的处理
对于左右边沿的子图像,即i□1,i□sw的子图像,我们取和对于上下边沿的子图像,即j□1,j□sh的子图像,则取和对图像边界区域的子图像作了这样的处理后,就可以直接利用节3中给出的插值公式作照度计算。
如原图像的宽(lw)或高(lh)不能为ls整除。我们还是处理sw□sh个子图像。对于剩余的像素,我们用与之相邻的子图像的亮度插值公式进行计算。
7、照度函数的迭代与逼近
如果各个子图像中前景像素和背景像素之比相等,那么就是子图像的平均相对照度。但是实际上各个子图像中前景像素和背景像素之比不会相等,于是由节3得到的照度估计将偏离实际的照度分布。利用节4中得到的二值图像,我们可以修正这种偏离。根据二值图我们可以区分前景像素和背景像素,并用前景像素的平均灰度值作为子图像的照度估计。现在可以用以下公式计算平均照度
进行照度补偿,并用全局阈值方法对图像进行分割,得到新的二值图像基于分割图像进行照度补偿,由于考虑了子图像中前景和背景像素的分布,获得的照度分布函数会更逼近于实际的照度分布,因此在此基础上得到的二值图像的分割质量将得到提高。二值图像的质量要优于
中对前景像素和背景像素定位的准确度优于因此利用和作同样的处理,可以获得更好的照度分布函数依此能得到更好的二值图像而且一般地可以由二值图像改进对光照函数的估计,得到并得到质量改进的分割图像代价是计算时间。实际上最初的迭代计算对于分割质量的改进效果最为显著,因此我们建议可以只计算或
8、后续处理
利用全局阈值的优点是能节省时间,但是单个阈值通常不能使得每个字符都能分割得很理想。尤其当图像中存在大面积的背景区域时,这一缺憾显得尤为突出。用子窗口对图像进行分割可以提高字符的分割质量,但是问题是会出现“幽灵图斑”[13]。通过节1到7的处理已经给出了一个均匀光照的图像,利用我们设计的后续处理就可以既保证不出现“幽灵图斑”,又提高字符细节的分割质量。
3.用大津展之方法计算准图像的阈值,得到kB *。
9、实验结果
我们用C++语言实现了以上的算法,并进行了实验比较。图1是用数码相机在自然光下摄入的一页文献。图2是用本专利提出的算法分割后得到的二值文本图像。图2中的二值文本图像中,字符轮廓清晰,线条图光滑连续,可供文本分析和字符识别用。图3是用全局阈值(大津展之方法[2])分割得到的文本图像。由于非均匀光照的缘故,低照度的部分(图像的上部)全部变黑。图4也是用全局阈值(Kapur方法[5])分割得到的文本图像。用Kapur方法算出的阈值小于大津展之方法算得的阈值,消除了图3中的大片变黑,但是光照高的部分变德模糊不清,线条图则变得断断续续。图5是用Huang,Q.等人的自适应子窗口方法得到的二值图。采用自适应子窗口方法的目的就是为了消除分区阈值方法带来的“幽灵图斑”的负面影响。但是从图5(右上方的黑色图斑)可见自适应方法也无法根绝“幽灵图斑”,在线条图的大片背景上,由于信息量低,还是有一些“幽灵图斑”。
参考文献:
[1]Sezgin,M.,Sankur,B.,2004.Survey over image thresholding techniques and quantitativeperformance evaluation.J.Electr.Imag.13(1),146-167.
[2]Otsu,N.,1979.A threshold selection method from gray level histograms.IEEE Trans.SystemsMan Cybernet.9,62-66.
[3]Ridler,T.W.,Calvard,S.,1978.Picture thresholding using an iterative selection method.IEEETrans.System Man Cybernet.SMC-8,630-632.
[4]Pun,T.,1980.A new method for gray-level picture threshold using the entropy of the histogramSignal Process.2(3),223-237.
[5]Kapur,J.N.,Sahoo,P.K.,Wong,A.K.C.,1985.A new method for gray-level picturethresholding using the entropy of the histogram.Graphical Models Image Process.29,273-285.
[6]Tsai,W.H.,1985.Moment-preserving thresholding:A new approach.Graphical Models ImageProcess.19,377-393.
[7]Kittler,J.,Illingworth,J.,1986.Minimum error thresholding.Pattern Recognition 19,41-47.
[8]Li,C.H.,Lee,C.K.,1993.Minimum cross-entropy thresholding.Pattern Recognition 26,617-625.
[9]Abutaleb,A.S.,1989.Automatic thresholding of gray-level pictures using two-dimensionalentropy.Comput.Vision Graphics Image Process.47,22-32.
[10]Niblack,W.,1986.An Introduction to Image Processing.Prentice-Hall,pp.115-116.
[11]Gorman,L.O’.,1994.Binarization and multi-thresholding of document images usingconnectivity.Graphical Models Image Process.56,494-506.
[12]Trier,O.D.,Taxt,T.,1995.Evaluation of binarization methods for document images.IEEETrans.Pattern Anal.Machine Intell.PAMI,312-315.
[13]Huang,Q.,Gai,W.,Cai,W.,2005.Thresholding technique with adaptive window selection foruneven lighting image.Pattern Recognition Lett.26,801-808.
[14]T.G Dtockham,Image processing in the context of a visual model,Proc.IEEE,vol.to,pp.828-842,1972.
[15]Arnulfo Perez,an Rafael C.Gonzalez,An iterative thresholding algorithm for imagesegmentation,IEEE PAMI-9(1987)742-751
Claims (8)
1.非均匀光照文本图像的照度补偿分割算法。具体步骤为:
(4)图像边界区域的处理:对于左右边沿的子图像,即i□1,i□sw的子图像,取和对于上下边沿的子图像,即j□1,j□sh的子图像,则取和如原图像的宽(lw)或高(lh)不能为ls整除。我们还是处理有sw□sh个子图像,对于剩余的像素,用相邻子图像的照度插值公式进行计算。
4.权利要求1采用的插值方法,包括1(3)中的二次近邻插值方法,也包括高次多项插值方法和样条函数插值方法。
5.权利要求1的边界区域处理方法,也包括其他的边界处理方法,如使用零边界条件或周期边界条件。
6.权利要求1中的全局阈值方法中最简单的是大津展之方法,也包括其他整体阈值方法。
7.权利要求2是提高照度计算准确性的迭代运算,根据精度要求和实际的计算资源可以取舍和选择迭代次数。
8.权利要求3是后续处理方法,可以根据精度要求和实际的计算资源作取舍。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810109000XA CN101599172A (zh) | 2008-06-06 | 2008-06-06 | 非均匀光照的文本图像的亮度补偿分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810109000XA CN101599172A (zh) | 2008-06-06 | 2008-06-06 | 非均匀光照的文本图像的亮度补偿分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101599172A true CN101599172A (zh) | 2009-12-09 |
Family
ID=41420605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200810109000XA Pending CN101599172A (zh) | 2008-06-06 | 2008-06-06 | 非均匀光照的文本图像的亮度补偿分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101599172A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102509077A (zh) * | 2011-10-28 | 2012-06-20 | 江苏物联网研究发展中心 | 基于光照自动评估的目标识别方法 |
CN102509095A (zh) * | 2011-11-02 | 2012-06-20 | 青岛海信网络科技股份有限公司 | 一种车牌图像的预处理方法 |
CN105702231A (zh) * | 2016-04-20 | 2016-06-22 | 西安交通大学 | 一种获取像素亮度补偿目标的方法 |
CN106204563A (zh) * | 2016-07-04 | 2016-12-07 | 傲讯全通科技(深圳)有限公司 | 一种图像转换方法 |
CN106952241A (zh) * | 2017-04-27 | 2017-07-14 | 北京航空航天大学 | 一种基于形态学方法及Meanshift算法的电磁图像分块方法 |
CN109544581A (zh) * | 2018-11-15 | 2019-03-29 | 湖南自兴智慧医疗科技有限公司 | 一种早孕子宫图像的自动分割处理方法 |
CN110008954A (zh) * | 2019-03-29 | 2019-07-12 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN111915527A (zh) * | 2020-08-05 | 2020-11-10 | 成都圭目机器人有限公司 | 基于多模板的自适应光照补偿方法 |
-
2008
- 2008-06-06 CN CNA200810109000XA patent/CN101599172A/zh active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102509077A (zh) * | 2011-10-28 | 2012-06-20 | 江苏物联网研究发展中心 | 基于光照自动评估的目标识别方法 |
CN102509095A (zh) * | 2011-11-02 | 2012-06-20 | 青岛海信网络科技股份有限公司 | 一种车牌图像的预处理方法 |
CN105702231A (zh) * | 2016-04-20 | 2016-06-22 | 西安交通大学 | 一种获取像素亮度补偿目标的方法 |
CN105702231B (zh) * | 2016-04-20 | 2018-06-26 | 西安交通大学 | 一种获取像素亮度补偿目标的方法 |
CN106204563B (zh) * | 2016-07-04 | 2019-11-15 | 傲讯全通科技(深圳)有限公司 | 一种图像转换方法 |
CN106204563A (zh) * | 2016-07-04 | 2016-12-07 | 傲讯全通科技(深圳)有限公司 | 一种图像转换方法 |
CN106952241B (zh) * | 2017-04-27 | 2020-03-10 | 北京航空航天大学 | 一种基于形态学方法及Meanshift算法的电磁图像分块方法 |
CN106952241A (zh) * | 2017-04-27 | 2017-07-14 | 北京航空航天大学 | 一种基于形态学方法及Meanshift算法的电磁图像分块方法 |
CN109544581A (zh) * | 2018-11-15 | 2019-03-29 | 湖南自兴智慧医疗科技有限公司 | 一种早孕子宫图像的自动分割处理方法 |
CN110008954A (zh) * | 2019-03-29 | 2019-07-12 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN110008954B (zh) * | 2019-03-29 | 2021-03-19 | 重庆大学 | 一种基于多阈值融合的复杂背景文本图像提取方法及系统 |
CN111915527A (zh) * | 2020-08-05 | 2020-11-10 | 成都圭目机器人有限公司 | 基于多模板的自适应光照补偿方法 |
CN111915527B (zh) * | 2020-08-05 | 2023-04-07 | 成都圭目机器人有限公司 | 基于多模板的自适应光照补偿方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101599172A (zh) | 非均匀光照的文本图像的亮度补偿分割方法 | |
CN108765371B (zh) | 一种病理切片中非常规细胞的分割方法 | |
CN109002824B (zh) | 一种基于OpenCV的建筑图纸标签信息检测方法 | |
Parker et al. | An approach to license plate recognition | |
CN104361312B (zh) | 一种对图像进行字符识别的方法和装置 | |
CN110598609A (zh) | 一种基于显著性引导的弱监督目标检测方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
KR102177880B1 (ko) | 자율주행용 클래스 레이블링 장치 | |
CN110610509B (zh) | 可指定类别的优化抠图方法及系统 | |
CN106537416B (zh) | 图像处理装置、文字识别装置、图像处理方法及存储介质 | |
CN105184763A (zh) | 图像处理方法和装置 | |
CN106096610A (zh) | 一种基于支持向量机的文档图像二值化方法 | |
CN109409376B (zh) | 针对固废对象的图像分割方法、计算机终端及存储介质 | |
CN103530590A (zh) | Dpm二维码识别系统 | |
CN103439348A (zh) | 基于差影法的遥控器按键缺陷检测方法 | |
CN112819840B (zh) | 一种融合深度学习与传统处理的高精度图像实例分割方法 | |
CN111414916A (zh) | 图像中文本内容提取生成方法、装置及可读存储介质 | |
CN110598708B (zh) | 一种街景文本目标识别检测方法 | |
US10586125B2 (en) | Line removal method, apparatus, and computer-readable medium | |
CN112686872B (zh) | 基于深度学习的木材计数方法 | |
CN117496518A (zh) | 基于文本检测和表格检测的电子卷宗图像智能矫正方法 | |
CN113537037A (zh) | 路面病害识别方法、系统、电子设备及存储介质 | |
CN103093241B (zh) | 基于同质化处理的光学遥感图像非匀质云层判别方法 | |
JP2021196451A (ja) | 画像変換装置、画像変換方法及び画像変換用コンピュータプログラム | |
Salunkhe et al. | Recognition of multilingual text from signage boards |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20091209 |