CN1144587A - 对像素数据进行二进制化的方法和装置 - Google Patents

对像素数据进行二进制化的方法和装置 Download PDF

Info

Publication number
CN1144587A
CN1144587A CN95192294A CN95192294A CN1144587A CN 1144587 A CN1144587 A CN 1144587A CN 95192294 A CN95192294 A CN 95192294A CN 95192294 A CN95192294 A CN 95192294A CN 1144587 A CN1144587 A CN 1144587A
Authority
CN
China
Prior art keywords
image
binary
value
binarization
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95192294A
Other languages
English (en)
Inventor
沃尔夫冈·韦伯
埃伯哈德·罗哈姆
安杰斯·巴豪泽
沃尔特·黑塞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Licentia Patent Verwaltungs GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Licentia Patent Verwaltungs GmbH filed Critical Licentia Patent Verwaltungs GmbH
Publication of CN1144587A publication Critical patent/CN1144587A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种像素数据二进制化的方法和装置,从像素灰度值数据记录中分别应用不同灵敏度的二进制化特性构成多个黑—白二进制图像。对每一个这样的二进制图像计算数值S=FS/,其中FS为图像中黑点的数目,表示黑白过渡点的数目。最大的S值所对应的图像即为最优二进制化的图像。

Description

对像素数据进行二进制化的方法和装置
本发明涉及对像素数据进行二进制化的方法和装置。
本发明涉及自动字符识别系统的图像准备领域。字符识别系统大致分为两个子系统,其中第一个子系统的任务是图像的准备,而第二个子系统的任务是真正的识别。在图像准备时,使用测量技术获得识别的文件,即所谓的原件。为形成原件的一个图像,准备出文字段落、行及单个字符,并清除由明显可见的干扰所引起的字符图像。被识别的字符首先置于有光区域,并必须转换以利于进一步的处理。这将通过一扫描器(目前最好是集成的半导体扫描器)来进行。为了进一步的处理,连续测得的原件的灰度一般在扫描后直接转换为黑-白判断(schwarz-weiβ-Entscheidung)。由扫描器提供的模拟信号最好首先通过一个A/D转换器转换为分立的信号,接着产生一个为字符识别能足以重现原图像内容的灰度图像原件的二进制图像。字符区域的背景亮度和灰度可能会有很大的起伏。在原件的子区域中人们可以得到较小的背景亮度的起伏,但字符区域的灰度却经常随不同的字符甚至在一个字符之内发生变化。因此,背景亮度的区别可以对一个较大的图像段落采用相同的规则来处理,而字符灰度的不同则采用只在局部起作用的规则来平衡。
按照二进制化特性的黑白判断的局部控制是采用差分运算(differenzierende Operation),为确定一像素的灰度,该运算不仅考虑该点的灰度值,而且也考虑其周围的灰度值。这里周围区域大小的选取必须与需辨认的符号的大小相符。最简单的方法是:首先确定周围区域的中间灰度值,如果一个像素比该中间灰度值黑则被认为是黑色,否则,被认为是白色。此外,为降低背景区域和符号黑色区域的噪声,可应用二进制化特性曲线,在中间灰度值较低的区域提高阈值Q,而在中间灰度值较高的区域降低该阈值。在符号对比度变化较大的情况下这样是有益的:按照在一个较大周围区域观察到的对比度控制二进制化特性曲线,并且对印刷较深的符号应用与对印刷较浅的符号不同的二进制化特性曲线。
在上述的图像准备的二进制化阶段为所有后续处理步骤产生有效信息。因此,在该阶段损失的信息将影响所有的进一步的处理步骤,并限制了整个系统的效率。
二进制化时遇到的一个问题是:对于灵敏的二进制化的图像,图像的处理采用按印刷较浅的字符设置的二进制化特性,这样对比度较小的字符能很好地被辨认,但是干扰结构和图案也能清晰地显现出。与此相反,对于非灵敏的二进制化图像,对比度较高的字符能被很好地辨认,而干扰信息和背景噪声被抑制。在对地址区域字符的识别中这一问题变得尤其突出;地址区域通常有一个背景结构,在这种情况下从对灰色图像的周围的局部观察很难判断某一灰度值究竟涉及书写的字迹还是干扰的背景图案。
本发明的任务是,提供一种这样的方法和装置,从用不同的二进制化特性构成的多个二进制图像中选择一个最优二进制化的图像。
本发明的任务这样来完成,从像素灰度值数据的记录中分别应用不同灵敏度的二进制化特性构成多个黑白二进制图像。对每一个这样的二进制图像计算数据 S = FS U . . , 其中FS为图像中黑点的数目,表示黑白过渡点的数目。最大的S值所对应的图像即为最优二进制化的图像。
下面结合附图详细解释本发明。
图1表示按照本发明的装置框图。
图2表示提供几个黑白二进制图像的二进制数据源的框图。
图3表示二进制化判断图。
图4为一动态噪声阈值图。
图5表示一封信中识别区(ROI)的一个例子。
图6表示确定黑白过渡点的计数方向。
图7为一分析曲线。
图8为一系列不同的二进制化的图像。
图9表示另一个按照本发明的装置的框图。
图1所示的按照本发明的装置的框图包括一个二进制数据源1和一个ROI探测器模块2,用以提供二进制图像点的给定部分,即识别区(ROI-region of interest)。如图2所示,在二进制数据源1中,并行地产生n个(典型取为4至6)二进制图像。二进制数据源1由图中未详细表示出的灰度-像素数据源,即从图像输入装置3(例如扫描仪),获取灰度图像的像素值。从原理上讲,在按照本发明的装置中也可以顺序地产生n个二进制图像。
这n个二进制图像分别具有不同的二进制化特性。如已知的那样,为对灰度图像二进制化,在每一像素的周围局部区域进行中间值计算4。周围局部区域的选取是可随参数变化的。从经验可知,对信件的地址区域中的字体,合适的周围局部区域的大小为1mm2。中间值最好由周围局部区域中典型点的算术平均灰度值来构成,这里,需进行二进制化的图像点位于该周围局部区域的中点。
最好在相对于需二进制化的图象点对称的一个扩大的周围环境区域内计算出最大值、最小值和对比度5,作为进行二进制化的其他测量值。这里,扩展的周围环境区域中最黑的灰度值被赋予最小值MIN。而最大值MAXabs最好为扩展周围环境区域中的绝对最亮的灰度值。对比度最好由次最大值的最小值MAXk来计算(例如在3×3扩展周围区域中由三列次最大值计算)。
对比度由下式决定 K = MAX k - MIN MAX k 通过MAXk来定义K的方法使得图像的最大灰度值对对比度,从而对二进制化结果的影响不是很灵敏。否则,灰度图像中的非正常亮点,以及过渡边缘区域(如标记或信封上的透明窗口)将导致较大的对比度改变。对比度的明显改变只有通过字迹本身引起。
灰度图像的每一个像点暂时存储在像素存储器6中,直至计算出相对于每一像点的中间值,最小值,MAXk和对比度。
测量值中间值、最小值、最大值和对比度最好由n个图像一起计算。在这一情况下,二进制图像的区别只在于下面将要说明的判断图3中的其他参量。
在判断图中,横座标为每一需二进制化的像素Pi的实际中间值,纵座标为实际的像素值。图3中划出了三条不同的特性曲线,二进制化的灵敏度随着这些特性曲线直线部分斜率的增加而增大。若一个由给定中间值和给定像素所确定的点位于特性曲线之上则被赋予值“白”,相反,若在其下则被赋予值“黑”。通常情况下,当对比度较小时选择灵敏度较高的特性曲线,而当对比度较大时选取灵敏度较低的特性曲线。
为降低噪声在图3中引入了不同的阈值:
白色阈值WS根据MAXk给出,白色阈值的典型大小范围为MAXk的70-85%。若实际像素值Pi大于该阈值,则被赋予白色,与特性曲线无关。
绝对黑色阈值SSW的作用是:当像素值Pi小于该绝对阈值时被置为黑色。
因为在通常情况下,黑的地址区域比白的地址区域更容易引起较强的白色噪声,所以最好引入一个与像素最大值MAXk有关的动态的白色噪声阈WS=f(MAXk),它较强或较弱地降低白色噪声。图4给出了这种动态白色阈值的一个例子,其中灰度值的值域取为8位。
按照本发明,为实现二进制化,应用n个不同的,最好按灵敏度排列的特性曲线,来完成n个不同的二进制化的二进制图像。这n个图像被存入图像存储器7中,识别区ROI的数据供分析装置8使用,而整个图像则供剪辑装置(Montierwerk)9使用。
图5表示含有一地址块12的识别区11的原样的一个例子。从原理上讲,可用不同探测器获得识别区的信息,例如,窗口探测器,在带有透明窗口的信件上,从光泽图像中确定座标,这个图像是用一个专用扫描器获得的;探测地址标签的标签探测器;使用一定的算法寻找行结构并将典型的地址结构标志为识别子区的地址块探测器;通过颜色分析确定识别子区的颜色信息探测器;或通过预定的座标确定识别子区的固定区域探测器。
在分析装置8中,对1至n的每一个二进制图像分别计算出相对于由ROI探测器模块2确定的识别区的数值S1,S2,…,Sn。
为计算数值S必须计算黑像点的数目FS和黑-白或白-黑过渡点的数目。
过渡像点数目可以在列方向,或行方向,或在两个方向上逐个像素地数出。图6表示了确定过渡像点列方向、行方向和列方向与行方向的计数方向。
数值S与二进制化的二进制图像的关系如图7的曲线所示,图像是按二进制化特性灵敏度逐渐降低的顺序排列。当使用灵敏度很高的二进制化特性时,S的值很大。它对应的二进制图像实际上很黑,只有相对较少的黑-白过渡像点。随着灵敏度的降低,黑-白过渡像点急剧增加,从而导致S的下降。二进制化特性的灵敏灵进一步减小,S值再次增加,在这种情况下,字迹信息清晰。随着二进制化特性的灵敏度的进一步减小,二进制化图像中的符号继续分解(zerfallen),使得数值S再次下降。结果得到一个S曲线,其相对最大值对应于最优识别的图像。
图8表示了一地址区域的分别以不同的灵敏度形成的四个不同的图像及其相应的数值S。图中表明,具有最大S值(S=1.87)的图像(C)是最清晰的。
由分析装置8提供的数值S1至Sn在评估装置10中进一步被处理,即由数值S1至Sn中确定相对最大值,并这样来控制剪辑装置9,即在识别的子区域中输出具有最大S的二进制图像,并对该图像其余部分输出标准图像。n个二进制图像中的与等候的原样表面相适应的一个图像用作为标准图像。也可以舍弃剪辑装置9中的剪辑步骤,在这种情况下可以用导致S取最大值的二进制化特性进行整个二进制图像的输出,这对专业人员来说是显而易见的。但是应该对原样进行划分和剪辑,因为识别子区通常与整个原样表面具有不同的光学特性。
对于具有数个识别子区ROI的原样,如具有数个透明窗口的信或带有标记的平面,可以运用本发明的一个扩展。当有K个识别子区时最好使用K个分析装置,图9表示了具有K个分析装置8的本发明的一个实施例,从它们的每一个输出以上述方式计算出的n个S1至Sn的数值。然后对每一个识别子区在其所属的分析装置中进行独立的分析。这样,对每一个识别子区找到一个最优识别的二进制图像,并被输出剪辑。图9表示,数据由ROI探测器模块2,传送给控制装置10’,传送给分析装置8’进行分析。剪辑装置9’由控制装置10’控制。由不同的ROI探测器探测到的子区的重叠,通过不同ROI探测器的优化被消除,这样对于分析装置和剪辑只存在明确、单一的子区。

Claims (8)

1.像素数据二进制化的方法,其特征在于,从像素灰度值数据的记录中分别应用不同灵敏度的二进制化特性构成多个黑白二进制图像。对每一个这样的二进制图像计算数值 S = FS U . . , 其中FS为图像中黑点的数目,表示黑白过渡点的数目。最大的S值所对应的图像即为最优二进制化的图像。
2.根据权利要求1的方法,其特征在于,数值S的计算和对每一图像的相应选择只对二进制择图像点的一个或数个预定的部分(ROI)进行。
3.根据权利要求2的方法,其特征在于,按照不同的标准给出数个预定部分(ROI)。
4.根据权利要求2或3的方法,其特征在于,按照一预定的标准二进制化特性将上述预定部分(ROI)剪辑,和相应的剩余图像组合成一个整图像。
5.根据权利要求1至4之一的方法,其特征在于,作为参数的量化特性值有:中间值,最小值,最大值,对比度,以及用于降低像素灰度值数据的噪声的预定的噪声阈值。
6.带有一个二进制数据源(1)的对像素数据二进制化的装置,其特征在于,二进制数据源(1)由像素灰度值的记录中分别以不同的灵敏度的量化特性提供数个黑白二进制图像;安置一分析装置(8),用以对n个二进制数据图像中的每一个计算数值 S = FS U . . , 其中FS表示黑二进制像点的数目,而表示黑-白过渡点的数目;安置一评估装置(10),用于从大量二进制数据图像中选出具有最大S值的那幅图像。
7.根据权利要求6的装置,其特征在于,安置一图像存储器(7),用于暂时存储n个二进制数据,这些数据由该存储器传送至分析装置(8)。
8.按照权利要求6或7的装置,其特征在于,安置有探测器模块(2),用于二进制数据像点的预定部分(ROI)的选择。
CN95192294A 1994-03-31 1995-03-31 对像素数据进行二进制化的方法和装置 Pending CN1144587A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE4411248A DE4411248C1 (de) 1994-03-31 1994-03-31 Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten
DEP4411248.3 1994-03-31

Publications (1)

Publication Number Publication Date
CN1144587A true CN1144587A (zh) 1997-03-05

Family

ID=6514354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95192294A Pending CN1144587A (zh) 1994-03-31 1995-03-31 对像素数据进行二进制化的方法和装置

Country Status (8)

Country Link
US (1) US5915037A (zh)
EP (1) EP0753231B1 (zh)
JP (1) JPH09511598A (zh)
CN (1) CN1144587A (zh)
AT (1) ATE171029T1 (zh)
CA (1) CA2186754A1 (zh)
DE (2) DE4411248C1 (zh)
WO (1) WO1995027364A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110607B2 (en) 2001-03-14 2006-09-19 Fujitsu Limited Image processing apparatus
CN1311394C (zh) * 2003-01-30 2007-04-18 三星电子株式会社 用于二进制化图像的设备和方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19536170A1 (de) * 1995-09-29 1997-04-03 Ibm Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
US6580433B2 (en) * 2001-03-06 2003-06-17 Mitsubishi Heavy Industries, Ltd. Automatic reverse method for reversing the black-and-white monochrome image, and printer unit using the same
US6970606B2 (en) * 2002-01-16 2005-11-29 Eastman Kodak Company Automatic image quality evaluation and correction technique for digitized and thresholded document images
EP1389493A1 (de) * 2002-08-12 2004-02-18 MIT Management intelligenter Technologien GmbH Verfahren und Vorrichtungen zur automatischen Adressblockmarkierung
CN104866850B (zh) * 2015-05-13 2018-11-02 湘潭大学 一种文本图像二值化的优化方法
CN111464699B (zh) * 2020-04-02 2022-10-04 北京小米移动软件有限公司 通话背景显示方法、装置及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632072B2 (ja) * 1984-02-09 1994-04-27 日本電気株式会社 多値パタ−ン信号のスライス回路
US4916744A (en) * 1985-12-10 1990-04-10 Fuji Photo Film Co., Ltd. Image signal processing method
JPS62214481A (ja) * 1986-03-17 1987-09-21 Nec Corp 画質判定装置
JP2659198B2 (ja) * 1986-11-12 1997-09-30 日本電気株式会社 画像2値化装置
US5097520A (en) * 1989-01-20 1992-03-17 Ricoh Company, Ltd. Method of obtaining optimum threshold values
JP3005262B2 (ja) * 1990-08-28 2000-01-31 株式会社リコー 画像2値化回路
US5226094A (en) * 1990-10-19 1993-07-06 Xerox Corporation Method for making image conversions with error diffusion

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110607B2 (en) 2001-03-14 2006-09-19 Fujitsu Limited Image processing apparatus
CN1311394C (zh) * 2003-01-30 2007-04-18 三星电子株式会社 用于二进制化图像的设备和方法

Also Published As

Publication number Publication date
WO1995027364A1 (de) 1995-10-12
DE59503526D1 (de) 1998-10-15
CA2186754A1 (en) 1995-10-12
EP0753231A1 (de) 1997-01-15
US5915037A (en) 1999-06-22
EP0753231B1 (de) 1998-09-09
ATE171029T1 (de) 1998-09-15
DE4411248C1 (de) 1995-10-26
JPH09511598A (ja) 1997-11-18

Similar Documents

Publication Publication Date Title
US5583659A (en) Multi-windowing technique for thresholding an image using local image properties
EP0358815B1 (en) System and method for automatic segmentation
EP0803842B1 (en) Binary image forming device
US5568571A (en) Image enhancement system
EP1051025A1 (en) Image processing device and image processing method
EP1430444B1 (en) Concealed object recognition
JPS63262778A (ja) 濃淡画像からのパタ−ン認識方法及び装置
JPH10506733A (ja) テキスト包含イメージにおける背景からの前景の分離方法及び装置
JP2009535899A (ja) 走査されたカラー画像からの複調画像の生成
EP0771102A2 (en) Macrodetector based image conversion
US6782129B1 (en) Image segmentation apparatus and method
CN1144587A (zh) 对像素数据进行二进制化的方法和装置
US5790694A (en) Image processing method for inspecting with analysis of binarized high and low pass information in wavelet transformed image data
EP0568697B1 (en) Method of correcting shading
US7088857B2 (en) Dynamic bilevel thresholding of digital images
EP0768000B1 (en) Automatic determination of blank pages and bounding boxes for binary images
Ramesh et al. Digital image processing of photoelastic fringes—a new approach
US6999621B2 (en) Text discrimination method and related apparatus
US6807313B1 (en) Method of adaptively enhancing a digital image
US20010016073A1 (en) Image segmentation apparatus and method
JP2514309B2 (ja) バイレベル画像表現を生成する方法及び装置
US6741751B1 (en) Logic based tagging for hyperacuity rendering of an input image with a 5×5 context
JP3107071B2 (ja) 電子部品の外観検査方法、外観検査装置及び外観検査処理をコンピュータに実現させるためのプログラムを記録した記録媒体
US5408540A (en) Character slant recognition in a word image
JPH0531791B2 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: LICENTIA PATENT MANAQEMENT LTD. TO: SIEMENS AG

CP03 Change of name, title or address

Address after: Mu Nihei

Applicant after: Siemens AG

Address before: Frankfurt

Applicant before: Licentia patent Manaqement Ltd.

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication