CN100369049C - 灰度字符的精确分割装置及方法 - Google Patents

灰度字符的精确分割装置及方法 Download PDF

Info

Publication number
CN100369049C
CN100369049C CNB2005100085123A CN200510008512A CN100369049C CN 100369049 C CN100369049 C CN 100369049C CN B2005100085123 A CNB2005100085123 A CN B2005100085123A CN 200510008512 A CN200510008512 A CN 200510008512A CN 100369049 C CN100369049 C CN 100369049C
Authority
CN
China
Prior art keywords
character
coupling assembling
picture
character picture
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005100085123A
Other languages
English (en)
Other versions
CN1822027A (zh
Inventor
孙俊
堀田悦伸
胜山裕
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CNB2005100085123A priority Critical patent/CN100369049C/zh
Priority to JP2006041625A priority patent/JP4761996B2/ja
Priority to US11/356,449 priority patent/US7715628B2/en
Publication of CN1822027A publication Critical patent/CN1822027A/zh
Application granted granted Critical
Publication of CN100369049C publication Critical patent/CN100369049C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

灰度字符精确分割装置及方法。灰度字符精确分割装置包括:调整分割单元,用于对输入的经粗略分割的低分辨率文本行图像进行调整分割,从而产生经调整的字符图像;字符图像二值化单元,用于根据输入于其中的字符图像生成二值字符图像;消噪单元,用于消除所述二值化单元生成的二值字符图像中的噪声信息;最终字符图像分割单元,用于从被消除了噪声的所述二值字符图像中产生精确分割的字符图像。

Description

灰度字符的精确分割装置及方法
技术领域
本发明涉及一种灰度字符的分割装置及方法,具体地,涉及在经过粗略分割的低分辨率灰度文本行图像中对单个字符进行精确分割的方法和装置。
背景技术
字符分割是字符识别的在先步骤之一,现在已有许多与该技术相关的论文和专利。比如:
Y.Lu,“Machine Printed Character Segmentation-An Overview”.Pattern Recognition,Vol.28,no.1,pp.67-80,Jan,1995;
S.W.Lee,D.J.Lee,H.S.Park,“A New Methodology for Gray-ScaleCharacter Segmentation and Recognition”.IEEE transaction on patternanalysis and machine intelligence,Vol.18,no.10,pp.1045-1050,Oct,1996;Kamitani的美国专利No.6,327,385:“Character segmentation deviceand character segmentation system”;
Hanson的美国专利No.5,692,069:“Apparatus for performingcharacter segmentation using slant histograms”;以及Tan的美国专利No.5,172,422:“Fast character segmentation ofskewed text lines for optical character recognition”等。
以上论文和专利讲的都是如何处理互相接触的字符,其中许多方法都应用二值的字符图像,这些方法应用在低分辨率图像中会引起很多分割误差。目前,没有一篇论文或一项专利涉及低分辨率灰度字符的分割。
低分辨率字符的识别相当困难,而灰度特征法是可能的解决方法之一。但是如果字符未经过精确分割,那么从图像中提取的特征的效果会很差。所以,对低分辨率字符进行精确分割是成功提取灰度特征的必要步骤。
低分辨率字符的图像尺寸一般小于20*20象素,且字符的真实边界往往位于一个象素点以内。因此,对真实字符的边界进行精确定位对于之后的特征提取模块至关重要。很显然,需要一种能够对低分辨率的灰度字符图像进行精确分割的方法和装置。
发明内容
本发明鉴于现有技术的上述缺点产生,目的是提供一种灰度字符的精确分割装置及方法。
根据本发明的一个方面,本发明提供了一种灰度字符精确分割装置,包括:调整分割单元,用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割,从而产生经调整分割的字符图像;字符图像二值化单元,用于根据输入的所述经调整分割的字符图像生成二值字符图像;消噪单元,用于消除所述字符图像二值化单元生成的二值字符图像中的噪声信息;最终字符图像分割单元,用于从被消除了噪声信息的所述二值字符图像中分割出字符图像,其中,所述调整分割单元包括:文本行方向检测单元,用于检测所述文本行图像中文本行的方向;字符图像大小计算单元,用于计算字符图像的大小;字符图像调整单元,根据所述文本行方向检测单元的检测结果和所述字符图像大小计算单元的计算结果,对字符图像进行调整,使字符图像包括字符的全部笔画。
优选地,还包括放大单元,设置在所述调整分割单元和所述字符图像二值化单元之间,用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前,放大所述经调整分割的字符图像。
优选地,还包括字符图像增强单元,设置在所述调整分割单元和所述字符图像二值化单元之间,用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前,对所述经调整分割的字符图像进行字符图像增强,使所述字符图像中的字符的笔画更加清晰。
优选地,还包括字符图像增强单元,设置在所述放大单元和所述字符图像二值化单元之间,用于在被所述放大单元放大了的所述经调整分割的字符图像输入所述字符图像二值化单元之前,对被放大了的所述经调整分割的字符图像进行字符图像增强,使所述字符图像中的字符的笔画更加清晰。
优选地,所述字符图像增强单元包括:背景象素值估算单元,用于估算所述字符图像的背景象素值;背景消除单元,用于根据所述背景象素值估算单元的估算结果消除所述字符图像的背景;象素值增强单元,用于增强消除背景之后的字符图像的象素值。
优选地,所述背景象素值估算单元使用直方图法估算背景象素值。
优选地,所述象素值增强单元使用S型函数增强消除背景之后的字符图像的象素值。
优选地,所述消噪单元包括:连接组件分析单元,用于对所述二值字符图像中的连接组件进行分析,找出每个连接组件包含的象素点,计算所述二值字符图像中的连接组件的个数;噪声连接组件判断单元,用于判断一连接组件是否为噪声连接组件;噪声连接组件消除单元,用于消除所述二值字符图像中的被所述噪声连接组件判断单元判断为噪声连接组件的连接组件。
优选地,所述噪声连接组件判断单元根据以下条件判断一连接组件是否为噪声连接组件:连接组件的尺寸<所述二值字符图像的尺寸/比例尺度;连接组件的边界距所述二值字符图像边界的距离<阈值;如果所述连接组件同时满足这两个条件,则判断该连接组件是噪声连接组件。
优选地,所述比例尺度为3或4。
根据本发明的另一方面,还提供了一种对经粗略分割的文本行图像中的单个灰度字符进行精确分割的方法,包括以下步骤:调整分割步骤,用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割,从而产生经调整分割的字符图像;字符图像二值化步骤,用于对所述调整分割步骤处理过的字符图像进行二值化;消噪步骤,用于消除经所述二值化步骤生成的二值字符图像中的噪声信息;最终字符图像分割步骤,用于从被消除了噪声信息的所述二值字符图像中分割出字符图像,其中,所述调整分割步骤包括:文本行方向检测步骤,用于检测文本行的方向;字符图像大小计算步骤,用于计算字符图像的大小;字符图像调整步骤,根据所述文本行方向检测步骤的检测结果和所述字符图像大小计算步骤的计算结果,对字符图像进行调整,使字符图像包括字符的全部笔画。
优选地,包括放大步骤,用于放大所述分割调整步骤产生的经调整分割的字符图像。
优选地,包括字符图像增强步骤,用于对经所述放大步骤放大了的所述经调整的字符图像进行字符图像增强,使所述字符图像中的字符的笔画更加清晰。
其中,所述字符图像增强步骤包括:背景象素值估算步骤,用于估算字符图像的背景象素值;背景消除步骤,用于根据所述背景象素值估算步骤的估算结果消除所述字符图像的背景;象素值增强步骤,用于增强消除背景之后的字符图像的象素值。
其中,在所述背景象素值估算步骤中使用直方图法估算背景象素值。
其中,在所述象素值增强步骤中使用S型函数来增强消除背景之后的字符图像的象素值。
其中,所述消噪步骤包括:连接组件分析步骤,用于对所述二值字符图像中的连接组件进行分析,找出每个连接组件包含的象素点,计算所述二值字符图像中的连接组件中的个数;噪声连接组件判断步骤,用于判断一连接组件是否为噪声连接组件;消除步骤,消除所述二值字符图像中被所述噪声连接组件判断步骤判断为噪声连接组件的连接组件。
其中,在所述噪声连接组件判断步骤中根据以下条件判断一连接组件是否为噪声连接组件:连接组件的尺寸<所述二值字符图像的尺寸/比例尺度;连接组件的边界距所述二值字符图像边界的距离<阈值;如果所述连接组件同时满足这两个条件,则判断该连接组件是噪声连接组件。
本发明能够精确得到低分辨率字符图像中字符的边界,从而可以有效地进行字符图像的分割,为有效进行字符识别的后续步骤(例如字符特征提取)提供保证。
附图说明
图1是本发明的灰度字符精确分割装置的示意方框图;
图2是图1中的调整分割放大单元的工作流程图;
图3是图1中的字符图像增强及二值化单元的工作流程图;
图4是图1中的消噪单元的详细工作流程图;
图5是最终字符图像分割单元的详细工作流程图;
图6-1示出了所输入的粗略分割的字符图像;
图6-2是粗略分割调整的结果;
图6-3是消除背景象素的结果;
图6-4是二值化的结果;
图6-5是消噪后的结果;
图6-6是最终经过分割的字符图像结果。
具体实施方式
下面结合附图详细说明本发明的原理和优选实施例。
本发明用于在已知一幅低分辨率的文本行图像以及该文本行图像中各个字符的粗略分割结果后,对各个字符进行精确的分割。经过这样分割的字符可以用于字符识别中的特征提取。粗略分割可以由手工大致框定字符的边界来完成,也可以利用图像的二值化结果来自动得到。这个框定的边界有可能包含很多背景区域,也可能把一个字符的部分边界分割开来。精确分割就是精确找到一个字符的上下左右边界。
图1是本发明的灰度字符精确分割装置的示意方框图。如图1所示,根据本发明的灰度字符精确分割装置包括调整分割放大单元102、字符图像增强及二值化单元103、消噪单元104、最终字符图像分割单元105。其输入为经粗略分割的低分辨率灰度文本行图像101,其输出为经过精确分割的字符图像106。应该注意到,上述的单元只是示例性的,不是对本发明的限制,调整分割放大单元102可进一步细分为调整分割单元以及放大单元,而字符图像增强及二值化单元103也可进一步细分为字符图像增强单元和字符图像二值化单元,并且,字符图像增强单元还可进一步细分为背景象素值估算单元、背景象素值消除单元和象素值增强单元。另外,调整分割放大单元可由文本行方向检测单元、字符大小计算单元、字符图像调整单元等构成。消噪单元可进一步分成连接组件分析单元、噪声连接组件判断单元和噪声连接组件消除单元。
如上所述,字符图像的粗略分割可以通过手工或者利用现有技术通过对二值化后的图像自动分割得到。随后调整分割放大单元102对所输入的低分辨率文本行图像的粗略分割的结果进行调整,然后由字符图像增强及二值化单元103进行字符图像增强及二值化,并由消噪单元104进行消噪,以生成无噪声的二值字符图像。最后,由最终字符图像分割单元105进行最终字符图像分割,找出在消噪单元104中生成的二值字符图像的字符的边界,在放大的灰度图像中显示出真正的字符边界,并进行提取。最终字符图像分割单元105的输出结果即是经过精确分割的字符图像106。
下面结合图2到图5详细说明上述各单元102-105中的操作。
在调整分割放大单元102中,首先利用所输入的文本行图像中各个字符的前后字符的粗略分割结果(参见图6-1),对该字符的边界范围进行调整,然后对经过调整的图像内容进行提取(分割)和放大,从而真实字符的图像全部落在输出的已放大的灰度字符图像中。
图2示出了图1中的调整分割放大单元102的具体工作流程。该调整分割放大单元的输入是经粗略分割的低分辨率灰度文本行图像101。具体地,包括:经粗略分割的当前字符图像之前的字符图像S201、当前字符图像S202和当前字符图像S202之后的字符图像S203。由于一个字符图像的边界调整涉及到其前一个字符图像和后一个字符图像的边界,因而首先由调整放大单元102的文本行方向检测单元(未示出)进行文本行方向检测(步骤S204)。如果是横向的文本行,在调整字符图像的左右边界时,调整以后的边界不应该过多超过其左右字符图像的边界范围。如果是纵向的文本行,在调整上下边界时,调整以后的边界不应该过多超过上下字符图像的边界范围。文本行方向检测的检测方法为:
1)利用所述文本行(例如上述三个字符)的粗略分割结果确定该文本行的边界框。上述的粗略分割的结果就是各字符图像的边界框(可参见图6-1),由一个矩形的框来代表,宽度就是矩形的宽度,高度就是矩形的高度。可以利用现有的技术,通过找出这些字符(例如该三个字符)的边界框的最左、最右、最上、最下的坐标,而限定新的边界框。该边界框就是文本行边界框。
2)计算文本行边界框的宽度和高度。
3)如果宽度>高度,则该文本行为水平文本行,反之为垂直文本行。
在判断出文本行图像中的文本行的方向之后,在优选实施例中,随即确定文本行的调整顺序。如果文本行方向为水平方向,即输入的是水平文本行,则先进行左右顺序的字符边界调整,然后进行上下顺序的字符调整。如果文本行方向不是水平方向,即输入的是垂直文本行,则先进行上下顺序的字符边界调整,再进行左右顺序的字符调整。应该注意到,上述的调整顺序是可以改变的。
接着由调整分割放大单元的字符图像大小计算单元(未示出)计算字符图像的大小。设当前字符图像之前的字符图像经粗略分割的左、右、上、下边界为xs_p,xe_p,ys_p,ye_p,当前字符图像经粗略分割的左、右、上、下边界为xs_c,xe_c,ys_c,ye_c,当前字符图像之后的字符图像经粗略分割的左、右、上、下边界为xs_n,xe_n,ys_n,ye_n.;当前字符图像经粗略分割的宽和高分别为width_c,height_c,当前字符的尺寸为size_c(即imagesize)。则:
如果width_c>height_c
则size_c=width_c
否则
size_c=height_c
随后由调整分割放大单元102的字符图像调整单元对字符图像的边界进行调整。此处再假定当前字符图像经过边界调整的左、右、上、下边界为xs_c1,xe_c1,ys_c1,ye_c1。
调整的原则是:对于水平文本行,将一个字符图像的左边界和右边界进行扩大,但不能过多包括其左右两侧的字符。上下边界的范围也要放宽一定程度以防止粗略分割把一个字符切成了2部分。放宽的程度根据字符尺寸size_c的一定比例决定。对于垂直文本行,将一个字符图像的上下边界进行扩大,但也不要过多包括其上下两侧的字符图像,并且其左右边界的范围也要放宽一定程度以防止粗略分割把一个字符切成了2部分。最后要求的效果是,即使粗略分割把一个字符的一部分误分在粗分割的范围之外,经过调整以后的分割结果也能够完整地包含该字符的所有部分。
如果文本行经检测为水平文本行,则进行字符左边界调整(步骤S206)、字符右边界调整(步骤S207)、字符上边界调整(步骤S208)和下字符边界调整(步骤S209)对当前字符的左、右、上、下边界进行调整。在下面的描述中,假设图像的左上角是坐标的原点,y的方向是沿坐标原点向下的方向,x的方向是沿坐标原点向右的方向。
步骤S206的字符图像左边界的调整规则为:
如果xe_p<=xs_c
则xs_c1=xe_p
否则
xs_c1=xs_c
步骤S207的字符图像右边界的调整规则为:
如果xe_c<xs_n
则xe_c1=xs_n
否则
xe_c1=xe_c
步骤S208的字符图像上边界的调整规则为:
如果ys_c-r*size_c>=0
则ys_c1=ys_c-r*size_c
否则
ys_c1=0
S209单元的字符图像下边界的调整规则为:
如果ye_c+r*size_c<=文本行的高度
则ye_c1=ye_c+r*size_c
否则
ye_c1=文本行的高度
在S208和S209单元中,r是控制调整的参数。比如r可以取值为0.2。
类似地,如果文本行经检测为竖直文本行,则进行字符上边界调整(步骤S210)、字符下边界调整(步骤S211)、字符左边界调整单元(步骤S212)和字符右边界调整(步骤S213)对当前字符的上、下、左、右边界进行调整。
步骤S210的调整规则为:
如果ye_p<ys_c
则ys_c1=ye_p
否则
ys_c1=ys_c
步骤S211的调整规则为:
如果ye_c<ys_n
则ye_c1=ys_n
否则
ye_c1=ye_c
步骤S212的调整规则为:
如果xs_c-r*size_c>0
则xs_c1=xs_c-r*size_c
否则
xs_c1=0
步骤S213的调整规则为:
如果xe_c+r*size_c<文本行宽度
则xe_c1=xe_c+r*size_c
否则
xe_c1=文本行宽度
在步骤S212和S213中,r是控制调整的参数。比如r可以取值为0.2。
经过调整之后,由xs_c1,xe_c1,ys_c1和ye_c1所界定的字符图像的图像内容被从文本行中切割出来(步骤S214)。这4个值确定了一个矩形的左右上下边界,文本图像中用这个矩形定义的边界就是所需要的部分,把这个部分的内容拷贝下来就是切割的过程。然后切割出来的字符图像将被放大到原尺寸的N倍(步骤S215)。图像放大算法可以参见:冈萨雷斯,《数字图像处理(第二版)》,阮秋琦,阮宇智等译。电子工业出版社,2003年3月第一版,第50页。例如,N可以取值为4。调整分割放大的输出就是经过放大的灰度字符图像S216(可参见图6-3)。
应该注意上述的调整方法只是示例性的,也可以采用本领域技术人员所知的其它调整方法,只要这些方法可以使字符的真正边界全部落入调整以后的字符边界框内部。
图3是图1中的字符图像增强及二值化单元的工作流程图。字符图像增强的目的是为了让字符图像中的低分辨率下模糊的字符笔画变得清晰,如果不进行字符图像增强,后续的识别效果不好。如图3所示,在字符图像增强和二值化单元中,首先由背景象素值估算单元来估算背景象素值(S301)。这可以使用经过放大的字符图像S216的灰度直方图来获得。图像中灰度直方图的计算方法可以参照:章毓晋编著,“图像处理和分析”,清华大学出版社,1991年3月。该直方图中的最大值对应的象素值就作为背景象素值。然后在步骤S302中由背景消除单元来消除背景。如果假设字符象素点的理想象素值是255的话,消除背景就是找出所有的背景象素点,并把背景象素点的象素值设置成0。具体地,假设该背景象素值为Vbk,例如在背景色较亮的情况下,检查输入的图像中的所有的象素点,如果一个象素点的灰度值大于Vbk,那么把该象素点的灰度值设置为Vbk,如果一个象素点的灰度值小于Vbk,那么该点的灰度值不变。前面假设的情况是字符的象素值低于背景的象素值,如果背景象素点的象素值低于字符象素点的象素值,即在背景色较暗的情况下,也可采用类似的处理,将灰度值小于Vbk的象素点的灰度值设置为Vbk,而保留灰度值大于Vbk的象素点,从而消除背景(S302)(参见图6-3)。之后,通过一个S型函数来增强消除了背景的灰度图像的象素值(S303),增强的算法如下:
1、假设一个象素点的灰度值是g,首先对一幅图像中的每一个象素点的灰度进行如下的变换:
f(g)=(exp((g-off)/t)-1)/(exp((g-off)/t)+1);
其中off和t是变换的参数,比如可以取off=0,t=96。
由于这个函数的形状是S形,因此又叫作S型函数。
2、找出经过变换以后的函数值的最大值和最小值max,min。
3、对每一个点的函数值进行如下操作:
g1=(f(g)-min)*255/(max-min);
然后取g1的整数值,这个整数值就是经过图像增强以后的新的图像中该点的灰度值。
在字符增强之后,根据一个给定的阈值Th,将被增强的灰度图像二值化(步骤S304)。首先产生一幅新的图像,该图像的大小和原灰度图像是一致的,新图像象素点的取值由如下规则决定:
对经过增强以后的图像中的每一个象素点的灰度值进行判断,如果灰度值大于Th,把新图像中对应点的灰度值设置为255,反之设置为0。由于新图像象素点的取值只可能有2种选择:0或者255,因此这个过程叫做二值化。二值化的结果是得出一幅二值字符图像S305(参见图6-4)。
通常,二值字符图像在字符边界附近会存在一些噪声部分,它们可能是背景象素,或者是因不精确的前后字符粗略分割而误划进来的字符笔画。本发明的方法要进行消噪处理,将这些噪声消除。也就是说,经过分割调整以后,虽然字符本身完全被包含在了调整的边界以内,但是这个边界内可能还包含相邻字符的部分笔画。这些笔画是噪声信息,因此需要消去噪声。
图4是图1中消噪单元104的消噪处理的详细流程图。如图4所示,首先由消噪单元的连接组件分析单元对输入的二值字符图像(S305)的连接组件(CC)进行分析。找出每个连接组件包含的象素点,得到连接组件的总数(S401)。连接组件就是一幅二值图像中彼此相连的象素的集合,比如“二”字里面有2个连接组件。图像中连接组件分析算法可以参见:冈萨雷斯,《数字图像处理(第二版)》,第435页,阮秋琦,阮宇智等译。电子工业出版社,2003年3月第一版。
随后由噪声连接组件判断单元对各连接组件是否为噪声连接组件进行判断。在进行是否为噪声连接组件的判断时,首先要计算连接组件的尺寸及其与字符边界的距离。具体地,首先设置i=0(S402),其中i表示图像中连接组件的索引号,i=0代表从第1个连接组件开始。然后从该第一个连接组件开始,获得各个连接组件的外边界框。连接组件中所有象素点的上下左右边界就是连接组件的外边界框。然后估计连接组件的尺寸Size,即取该连接组件的外边界框的宽度值和高度值中的较大者(S403)。并得到第i个连接组件(ith CC)的外边界框与字符图像边界(即xs_c1,xe_c1,ys_c1和ye_c1)之间的距离,将其规定为Distance(S404)。另外,假定字符图像的大小为imagesize,即上文的字符图像的尺寸,也就是字符图像的宽度值和高度值中的较大者。然后对该连接组件进行是否为噪声连接组件的判断(S405),并在被判断为噪声连接组件的情况下,消除该连接组件(S406)。即如果一个连接组件满足了如下两个条件,那么该连接组件就被认为是一个噪声连接组件,将被从二值字符图像中消除。
两个条件如下:
1、Size<imagesize/N1
2、Distance<N2
其中,N1是一个比例尺度,比如N1=3,N2是距离的一个阈值。即如果一个连接组件尺度很小(例如小于字符图像尺寸的1/3),本身距离字符边界的距离小于一定的阈值,那么这个组件就是噪声连接组件。
由噪声连接组件消除单元来消除噪声连接组件,消除噪声连接组件的方法如下:
1、创建一个新的和原来二值图像一样大小的图像,把新图像中所有象素点的值都设置为0。
2、对于原来二值图像中的非噪声连接组件(包括尚未判断的连接组件)中的每一个象素点,把新的图像中对应象素点的灰度值设置为255。
新的图像就是消除了该噪声连接组件的字符图像。
二值字符图像中所有的连接组件都要进行上述的尺寸计算、距离估算、噪声连接组件判断并在被判断为噪声连接组件时进行消除等步骤,最终输出二值化的无噪声字符图像S409(参见图6-5)。
具体地,噪声连接组件的判断和噪声连接组件的消除的步骤为:在步骤S403中估算连接组件的尺寸,在步骤S404中估算该连接组件与边界的距离,然后在步骤S405中对连接组件是否满足上述两个条件进行判断,如果不满足这两个条件,则过程进入步骤S407,通过将i值加1来指定下一连接组件,并进入步骤S408。如果满足了这两个条件,则判断这个连接组件为噪声连接组件,并在步骤S406中将其消除,随后再进入步骤S407,指定下一连接组件,并进入步骤S408。在步骤S408中,判断是否已分析完所有的连接组件(图中的nCC表示组件总数),如果未分析完,则进入步骤S403,从步骤S403开始进行所指定的连接组件的分析,如果分析完了所有的连接组件,则输出经过消噪的二值字符图像(S409)。
图5示出了最终字符图像分割单元105的详细工作流程图。首先输入经过消噪的二值字符图像(S409),并设置i=0(S501),其中i表示图像中连接组件的索引号,i=0代表从第1个连接组件开始。然后求出该连接组件的外边界框(S502),即找出该连接组件的所有象素点的最上,最左,最右和最下边界。随后判断i是否等于0(步骤S503),如果等于0(步骤S503中的是),则将该连接组件的外边界框设置为暂定字符边界框(步骤S504)。否则(步骤S503中的否),在步骤S505中将该连接组件的边界框与暂定字符边界框进行合并。也就是说,最初始的暂定字符边界框就是第一个连接组件的外边界框,从第二个连接组件开始,进行的操作是合并2个边界框,一个是当前的所有组件的外边界框(从第一个到当前连接组件的前一个的组合,即暂定字符边界框),一个是当前连接组件的外边界框,从而得到新的暂定字符边界框。合并步骤是找到2个边界框的最上,最下,最左,和最右边界。就是合并以后的外边界框。然后在步骤S506中,通过将i值加1来指定下一连接组件,并在步骤S507中,判断是否已处理完所有的连接组件,如为处理完,则过程返回步骤S502,重复以上步骤,直至处理完所有的连接组件,这时得到的暂定字符边界框即所需的字符边界框。然后,在已放大的灰度字符图像S216中,提取出由该字符边界框所框定的灰度内容(S508),即用该字符边界框定义的范围从放大灰度图像中把框定的图像拷贝出来。即经过精确分割的字符图像,这就是本发明的最终输出(参见图6-6)。
图6-1~6-6显示出以上各单元的输出结果:图6-1示出了所输入的粗略分割;图6-2是调整分割放大之后的结果;图6-3是消除背景象素之后的结果;图6-4是二值化之后的结果;图6-5消噪之后的结果;图6-6是最终经过分割的字符图像。
本发明能够精确得到低分辨率图像中字符的边界,从而有效进行字符的分割,为字符识别的后续步骤,比如字符特征提取的有效性提供保证。
本领域的技术人员应明白,在不脱离本发明的精神和范围的情况下,可以对本发明进行各种修改和变化。因而本发明覆盖了落入所附的权利要求及其等同范围内的对本发明的所有修改和变化。

Claims (9)

1.一种灰度字符精确分割装置,其特征在于,包括:
调整分割单元,用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割,从而产生经调整分割的字符图像;
字符图像二值化单元,用于根据输入的所述经调整分割的字符图像生成二值字符图像;
消噪单元,用于消除所述字符图像二值化单元生成的二值字符图像中的噪声信息;
最终字符图像分割单元,用于从被消除了噪声信息的所述二值字符图像中分割出字符图像;
其中,所述调整分割单元包括:
文本行方向检测单元,用于检测所述文本行图像中文本行的方向;
字符图像大小计算单元,用于计算字符图像的大小;
字符图像调整单元,根据所述文本行方向检测单元的检测结果和所述字符图像大小计算单元的计算结果,对字符图像进行调整,使所述经调整分割的字符图像中包括字符的全部笔画。
2.根据权利要求1所述的灰度字符精确分割装置,其中,还包括放大单元,设置在所述调整分割单元和所述字符图像二值化单元之间,用于在所述调整分割单元产生的经调整分割的字符图像输入所述字符图像二值化单元之前,放大所述经调整分割的字符图像。
3.根据权利要求1或2所述的灰度字符精确分割装置,其中,所述消噪单元包括:
连接组件分析单元,用于对所述二值字符图像中的连接组件进行分析,找出每个连接组件包含的象素点,计算所述二值字符图像中的连接组件的个数;
噪声连接组件判断单元,用于判断一连接组件是否为噪声连接组件;
噪声连接组件消除单元,用于消除所述二值字符图像中被所述噪声连接组件判断单元判断为噪声连接组件的连接组件。
4.根据权利要求3所述的灰度字符精确分割装置,其中,所述噪声连接组件判断单元根据以下条件判断一连接组件是否为噪声连接组件:
连接组件的尺寸<所述二值字符图像的尺寸/比例尺度
连接组件的边界距所述二值字符图像边界的距离<阈值
如果所述连接组件同时满足这两个条件,则判断该连接组件是噪声连接组件。
5.根据权利要求4所述的灰度字符精确分割装置,其中,所述比例尺度为3或4。
6.一种对经粗略分割的文本行图像中的单个灰度字符进行精确分割的方法,包括以下步骤:
调整分割步骤,用于对输入的经粗略分割的低分辨率灰度文本行图像中的单个字符图像进行调整分割,从而产生经调整分割的字符图像;
字符图像二值化步骤,用于对所述调整分割步骤处理过的字符图像进行二值化;
消噪步骤,用于消除经所述二值化步骤生成的二值字符图像中的噪声信息;
最终字符图像分割步骤,用于从被消除了噪声信息的所述二值字符图像中分割出字符图像;
其中,所述调整分割的步骤包括:
文本行方向检测步骤,用于检测文本行的方向;
字符图像大小计算步骤,用于计算字符图像的大小;
字符图像调整步骤,根据所述文本行方向检测步骤的判断结果和所述字符图像大小计算步骤的计算结果,对字符图像进行调整,使字符图像包括字符的全部笔画。
7.根据权利要求6所述的方法,还包括:
放大步骤,用于在所述调整分割步骤产生的经调整分割的字符图像进行所述字符图像二值化步骤之前,放大所述经调整分割的字符图像。
8.根据权利要求6或7所述的方法,其中,所述消噪的步骤包括:
连接组件分析步骤,用于对所述二值字符图像中的连接组件进行分析,找出每个连接组件包含的象素点,计算所述二值字符图像中的连接组件的个数;
噪声连接组件判断步骤,用于判断一连接组件是否为噪声连接组件;
噪声连接组件消除步骤,用于消除所述二值字符图像中被所述噪声连接组件判断步骤判断为噪声连接组件的连接组件。
9.根据权利要求8所述的方法,其中,在所述噪声连接组件判断步骤中根据以下条件判断一连接组件是否为噪声连接组件:
连接组件的尺寸<所述二值字符图像的尺寸/比例尺度
连接组件的边界距所述二值字符图像边界的距离<阈值
如果所述连接组件同时满足这两个条件,则判断该连接组件是噪声连接组件。
CNB2005100085123A 2005-02-18 2005-02-18 灰度字符的精确分割装置及方法 Expired - Fee Related CN100369049C (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CNB2005100085123A CN100369049C (zh) 2005-02-18 2005-02-18 灰度字符的精确分割装置及方法
JP2006041625A JP4761996B2 (ja) 2005-02-18 2006-02-17 文字分割プログラム、文字分割装置および文字分割方法
US11/356,449 US7715628B2 (en) 2005-02-18 2006-02-17 Precise grayscale character segmentation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100085123A CN100369049C (zh) 2005-02-18 2005-02-18 灰度字符的精确分割装置及方法

Publications (2)

Publication Number Publication Date
CN1822027A CN1822027A (zh) 2006-08-23
CN100369049C true CN100369049C (zh) 2008-02-13

Family

ID=36923381

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100085123A Expired - Fee Related CN100369049C (zh) 2005-02-18 2005-02-18 灰度字符的精确分割装置及方法

Country Status (3)

Country Link
US (1) US7715628B2 (zh)
JP (1) JP4761996B2 (zh)
CN (1) CN100369049C (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8782551B1 (en) * 2006-10-04 2014-07-15 Google Inc. Adjusting margins in book page images
CN101354746B (zh) * 2007-07-23 2011-08-31 夏普株式会社 文字图像抽出装置及文字图像抽出方法
US8155442B2 (en) * 2008-02-04 2012-04-10 The Neat Company, Inc. Method and apparatus for modifying the histogram of an image
US8023770B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
US8144986B2 (en) * 2008-09-05 2012-03-27 The Neat Company, Inc. Method and apparatus for binarization threshold calculation
US9563811B2 (en) * 2012-07-31 2017-02-07 Lg Cns Co., Ltd. Character recognition method, character recognition apparatus and financial apparatus
WO2014102876A1 (ja) * 2012-12-27 2014-07-03 パナソニック株式会社 画像処理装置、および、画像処理方法
CN103531176B (zh) * 2013-05-10 2016-08-17 Tcl集团股份有限公司 一种Android终端的字体显示优化方法及系统
CN104700362A (zh) * 2013-12-06 2015-06-10 富士通株式会社 文档图像处理装置和方法
US9251614B1 (en) * 2014-08-29 2016-02-02 Konica Minolta Laboratory U.S.A., Inc. Background removal for document images
CN107590447B (zh) * 2017-08-29 2021-01-08 北京奇艺世纪科技有限公司 一种文字标题识别方法及装置
CN109378279B (zh) * 2018-11-12 2020-12-18 武汉新芯集成电路制造有限公司 晶圆检测方法及晶圆检测系统
CN110210316B (zh) * 2019-05-07 2022-08-12 南京理工大学 基于灰度图像的交通信号灯数字识别方法
CN110659645B (zh) * 2019-08-05 2023-01-31 沈阳工业大学 一种数字仪表字符识别方法
CN114677683B (zh) * 2022-04-06 2023-04-25 电子科技大学 应用于光通信激光器芯片显微字符识别的背景预处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5272422A (en) * 1991-02-12 1993-12-21 Intertechnique Head equipment with articulated arm
US6327385B1 (en) * 1997-11-10 2001-12-04 Nec Corporation Character segmentation device and character segmentation system
CN1448831A (zh) * 2002-04-03 2003-10-15 摩托罗拉公司 用于手写字符的方向确定及其识别

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4092631A (en) * 1974-04-30 1978-05-30 Sharp Kabushiki Kaisha Pattern recognition systems
JPH0256688A (ja) * 1988-08-23 1990-02-26 Toyota Central Res & Dev Lab Inc 文字切出し装置
JPH0394393A (ja) * 1989-09-07 1991-04-19 Canon Inc 文字認識装置
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
JPH07105312A (ja) * 1993-10-07 1995-04-21 Fujitsu Ltd 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置
ZA959491B (en) * 1994-12-21 1996-06-29 Eastman Kodak Co Method for compressing and decompressing standardized portait images
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
US5689585A (en) * 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
JP2861860B2 (ja) * 1995-04-28 1999-02-24 日本電気株式会社 宛名行抽出装置
DE19917725B4 (de) * 1999-04-20 2005-02-24 Sms Demag Ag Kühlverfahren für Walzgut und Kühlbett
JP4392907B2 (ja) * 1999-07-30 2010-01-06 株式会社東芝 文字切出し方法
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
US7010488B2 (en) * 2002-05-09 2006-03-07 Oregon Health & Science University System and method for compressing concatenative acoustic inventories for speech synthesis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5272422A (en) * 1991-02-12 1993-12-21 Intertechnique Head equipment with articulated arm
US6327385B1 (en) * 1997-11-10 2001-12-04 Nec Corporation Character segmentation device and character segmentation system
CN1448831A (zh) * 2002-04-03 2003-10-15 摩托罗拉公司 用于手写字符的方向确定及其识别

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
手写字符样本自动采集研究. 张凯兵,宋俊典,邓立国.四川工业学院学报,第23卷. 2004 *

Also Published As

Publication number Publication date
US7715628B2 (en) 2010-05-11
US20060245650A1 (en) 2006-11-02
CN1822027A (zh) 2006-08-23
JP2006228232A (ja) 2006-08-31
JP4761996B2 (ja) 2011-08-31

Similar Documents

Publication Publication Date Title
CN100369049C (zh) 灰度字符的精确分割装置及方法
US7054485B2 (en) Image processing method, apparatus and system
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
KR100472887B1 (ko) 자기 적응형 2치화를 이용한 이미지 처리 방법 및 장치
CN102013008B (zh) 一种基于支持向量机的烟雾检测方法及装置
JP6366024B2 (ja) 画像化された文書からテキストを抽出する方法及び装置
US20070253040A1 (en) Color scanning to enhance bitonal image
US20080199082A1 (en) Method and apparatus for recognizing boundary line in an image information
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
KR100923935B1 (ko) Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템
US9684984B2 (en) Nearsighted camera object detection
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
CN109614923B (zh) Ocr文档识别方法及其装置
JP6377214B2 (ja) テキスト検出方法および装置
JP2010250387A (ja) 画像認識装置、及びプログラム
CN111161247B (zh) 用于可变码识读字符质量验证的检测方法
KR100850173B1 (ko) 영상 이진화 장치 및 방법
JPH06195511A (ja) 2値化しきい値決定装置
JP2960468B2 (ja) 濃淡画像の2値化方法及び装置
CN110807456A (zh) 一种银行卡卡号的定位方法及装置
JP3220226B2 (ja) 文字列方向判別方法
JP2000040122A (ja) 文字切り出し方法
JP2001291056A (ja) 文書画像認識装置及び記録媒体
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080213

Termination date: 20210218

CF01 Termination of patent right due to non-payment of annual fee