CN1195284C - 图像处理设备 - Google Patents

图像处理设备 Download PDF

Info

Publication number
CN1195284C
CN1195284C CNB01143306XA CN01143306A CN1195284C CN 1195284 C CN1195284 C CN 1195284C CN B01143306X A CNB01143306X A CN B01143306XA CN 01143306 A CN01143306 A CN 01143306A CN 1195284 C CN1195284 C CN 1195284C
Authority
CN
China
Prior art keywords
image
line graph
bianry image
shape
interference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB01143306XA
Other languages
English (en)
Other versions
CN1374623A (zh
Inventor
藤本克仁
小原敦子
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1374623A publication Critical patent/CN1374623A/zh
Application granted granted Critical
Publication of CN1195284C publication Critical patent/CN1195284C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Image Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

由彩色或黑白图像转换成的多层图像被输入,并且稍显模糊的二值图像生成单元生成包括稍显模糊的线图形和不包括背景干扰的稍显模糊的二值图像。而且,形状被保留的二值图像生成单元生成保留了线图形的形状并且包括背景干扰的二值图像。对于每个像素,这些图像被施以“与”操作,使得保留了该线图形的形状并且不包括背景干扰的二值图像被生成。

Description

图像处理设备
技术领域
本发明涉及一个图像处理设备。
背景技术
近年来,使用非接触型图像输入设备(OHR:间接读取器)的文件表格与文献识别技术已经受到广泛关注。
图1示出了一个OHR的外形图。
图1中所示的非接触型图像输入设备(OHR)是一个立式图像输入设备,使用一个线型或面型的CCD作为图像拾取装置。与接触型图像输入设备如传统的图像扫描器相比,使用OHR能够使用户能自如地在诸如输入图像的同时输入文件表格或文献、在查看文件表格或文献的同时输入图像等。
然而,与通过扫描器获取的图像(扫描器图像)相比,通过OHR获取的图像(OHR图像)在图像质量上出现下降,如密度不均匀、有阴影、图像失真等。
图2示出了一个灰度标度扫描器图像的状态,而图3示出了一个灰度标度OHR图像的状态。从图3所示的OHR图像可知,虽然不存在阴影,但密度不均的程度稍高,且字符线更模糊。
图4示出了带有阴影的OHR图像的状态。如该图所示,该OHR图像有阴影。因此,对于使用OHR而言,能够克服密度不均、阴影等问题的二值化(binarization)技术是必不可少的。
为实现对一个OHR图像的高精度的识别处理,由于阴影/密度不均,就需要用于获得一个稳定的线图形(line pattern)的二值化方法。使用预定阈值的二值化是不够的,必须采用局部二值化,如Niblack二值化等。欲了解Niblack二值化,可参见下面的文献。
关于图形分析与机器智能的IEEE学报,1995年第12期,第17卷1191-1201页上的,φ.D.Trier,A.K Jain的:“二值化方法的面向目标的评估”(“Goal-Directed Evaluation of Binarization Methods”)。
Niblack局部二值化是一种通过把每个象素的门槛定义为T=E+Kσ(E和σ分别为在一个目标象素周围的密度平均值和标准误差,而K是一个约为-0.4至0.4的常数),对每个象素执行二值化的方法。在一个目标象素的周围使用一个以该目标象素为中心的N×N象素的方形区域(经常使用N约等于7)。
还有,如果使用的Niblack局部二值化是不变的,由于一个目标象素周围所有的象素具有均匀的密度这一现象,在背景区就会出现点状的黑-白干扰。图5举例说明了一个OHR图像,而图6示出了通过对图5所示的OHR图像执行Niblack局部二值化所获得的一个二值图像。
正如从图6所知,在背景区中出现了点状的黑-白干扰(如果N=7,并且K=0.1)。
因此,通过确定二值图像的黑色像素的4连部分是背景干扰,该4连部分具有等于或小于一个预定值的轮廓象素的平均边缘亮度的背景干扰,并且通过消除该连接部分,就可消除点状的黑-白背景干扰。黑色象素的该4连部分是一个最大黑色象素集,是通过连续衔接邻近的左右上下的黑色象素获得的。此外,还有一个含有该4连部分的8连部分。这是通过连续衔接包括左右上下的四个对角线方向的邻近的黑色象素获得的一个最大黑色象素值。这里,该8连部分也可以使用。如果后面出现简单术语“连接部分”,则是指一个4连或8连部分。一个连接部分的轮廓象素是包含于该连接部分中的黑色象素。而作为背景的白色象素存在于每个黑色象素的上与下或左与右的任何一侧中。轮廓象素的平均边缘亮度是该轮廓象素的边缘亮度的平均值。一个轮廓象素的边缘亮度是利用一个Sobel边缘滤波器等获得的一个边缘亮度。
图7A与图7B对Niblack局部二值化进行了解释。
例如,如图7A中所示,以从一个彩色或黑白图像获得的灰度标度图像的每个象素为中心的一个7×7象素的方形区域被作为一个处理目标来识别。假定该方形区域中的黑色象素的密度平均值为E,而该方形区域中的象素的密度平均值E的标准误差是σ。用于判定将被二值化的一个象素是黑色的还是白色的阈值T是通过公式T=E+Kσ获得的。再假定将被二值化的该象素的密度是g。如果g≤T则这一个象素被定为黑色,如果g>T则该象素被定为白色。根据该判断结果,通过提供在被二值化之后作为目标象素的密度数据的黑色或白色数据,就能连续获得二值图像(图7B)。
图8是表示Niblack局部二值化处理流程的流程图。首先,在步骤S1,选择一个将被处理的象素。在步骤S2,获得以所选的该象素为中心的一个方形区域内的象素的密度。在步S3,计算该方形区域内的象素的密度平均值E,以及标准误差σ。在步骤S4,通过公式T=E+Kσ(K通常是一个-0.4至0.4之间的一个值)获得阈值T。然后,在步骤S5,判断所选的该象素的密度是否等于或大于阈值T。如果在步骤S5中所作的判断的结果为“是”,则所选的该象素被定为黑色(步骤S6)。如果在步骤S5中所作的判断的结果是“否”,所选的该象素被定为白色(步骤S7)。在步骤S8,判断将被二值化的图像的所有象素是否均被处理。如果留有尚待处理的象素,该处理返回步骤S1并且后续的操作被重复。如果断定所有的象素均已被处理,则该处理结束。
图9对一个Sobel边缘滤波器与边缘亮度进行解释。
如果图9(1)中所示的连接部分存在,则一个阴影部分与轮廓象素对应。将这些轮廓象素,采用3×3象素的方形区域,该区域如在(4)中所示以一个将被处理的象素为中心,并对该方形区域与在图9的(2)与(3)中所示的滤波器内的象素的密度作乘法与加法。假定由(2)中的滤波器生成的一个分矢量是Sx,而由(3)中的滤波器生成的一个分矢量是Sy。在这种病号上,可获得如在(4)中所示的方形区域的中心象素的矢量S=(Sx,Sy)。该矢量的长度,即
Figure C0114330600061
即为该目标象的Sobel边缘亮度。
平均边缘亮度是通过获取(1)中的连接部分的所有轮廓象素的这种边缘亮度,并通过对所获得的边缘亮度进行平均而得到的一个亮度。
图10示出了通过去掉平均边缘亮度等于或小于4的4连部分来消除背景干扰的效果。
如上所述,利用传统的技术能够从图5中所示的具有较高对比度的图像获得一个较高质量的二值图像。
对于具有良好对比度的一个字符而言,惯用技术所用的背景干扰消除法能稳定而正常地工作,然而对于在背景与字符间具有较差对比度的图像,即包括一个如图11所示的非常模糊的字符的图像而言则不能。
图12中示出了对图11的灰度级图像执行Niblack局部二值化(K=0.1)的效果。
如果在平均边缘亮度为4或者更小些的情况下以与在图10中的情况相似的方式执行背景干扰消除,虽然背景干扰能被消除,但是非常模糊的字符串也会一起被去掉。
如果在消除背景干扰时将平均边缘亮度置为2或更小以便保护非常模糊的字符串的线图形,则将导致背景干扰不能从二值图像中完全消除。
如上所述,利用采用局部二值化和平均边缘亮度的消除背景干扰的惯用技术存在一个问题,不能令人满意地将非常模糊的字符串分离出来,而不包括背景干扰。
发明内容
本发明的一个目的是提供一个图像处理设备,从具有较差对比度的输入图像检测出线图形,并执行二值化处理。
根据本发明的一个图像处理设备是这样的一种图像处理设备,包括一个线图形如一个字符、一条划线、一个图形等的一个图像输入到该设备中,该设备则输出一个相应的二值图像。该设备包括:一个稍显模糊的二值图像生成单元,用于生成虽然形态模糊但包括一个几乎完整的线图形的第一图像;一个形态保护二值图像生成单元,用于生成包括几乎完整的线图形并且在背景区域中而不是在该线图形周围干扰的第二图像;和一个图像组合单元,用于每个象素组合的第一与第二图像,并生成一个包括几乎完整的线图形同时保护其形状并且不包括背景区域中的干扰的令人满意的二值图像。
本发明能够提供一个图像处理设备,在消除背景区域中的干扰的同时,能够通过组合具有不同特点的图像(第一与第二图像。特别是,这些图像为二值图像)来为每个象素可靠地捕获一个线图形的形态(特别是,对每个象素的“与”组合)。利用惯用技术,如果试图可靠地捕获一个线图形的形态,它就会变得稍显模糊,或者是,如果试图使一个线图形的形态清楚,就会在背景区域中出现点状的黑-白干扰。这里,具体讲,第一图像是一个线图形的形态稍显模糊的二值图像,而第二图像是一个线图形的形态不模糊但在背景区域中出现点状的黑-白干扰的二值图像。
根据本发明的一个优选实施例,在第一与第二图像的背景区域被检测,并且执行了背景干扰消除之后,再对第一与第二图像进行组合。结果,通过组合图像而获得的图像变得质量上乘。
根据本发明的另一个优选实施例,对组合第一与第二图像的结果进行后处理,借以改进最终图像的质量。
附图说明
图1是一个OHR的外观图;
图2给出了一个灰度级扫描图像的状态;
图3给出了一个灰度级OHR图像的状态;
图4给出了带有一个阴影的一个OHR图像的状态;
图5举例说明了一个OHR图像;
图6给出了通过对一个OHR图像进行Niblack局部二值化所获得的一个二值图像;
图7A与7B对Niblack局部二值化的基本概念进行了解释;
图8表示Niblack局部二值化处理流程的一个流程图;
图9对Sobel边缘滤波器与边缘亮度进行了解释;
图10显示了通过去掉平均边缘亮度等于或小于4的四连部分来消除背景干扰的一个结果;
图11举例说明了包括一个非常模糊的字符串的灰度级的图像;
图12显示了在不进行干扰消除的情况下执行Niblack局部二值化的状态;
图13显示了对图11的图像进行Niblack局部二值化,借以把平均边缘亮度等于或小于4.0的象素去掉所获得的一个二值图像;
图14显示了对图11的图像进行Niblack局部二值化,借以把平均边缘亮度等于或小于2.0的象素去掉所获得的一个二值图像;
图15举例说明了根据本发明的一个优选实施例的图像处理设备的第一配置;
图16示出了从图11中所示的并且包括非常模糊的字符串的灰度级图像获得的一个稍显模糊的二值图像;
图17示出了从图11中所示灰度级图像获得的并且包括图11中所示的非常模糊的字符串的一个形态受到保护的二值图像;
图18示出了通过对于每个象素对稍显模糊的二值图像与形态受到保护的二值图像进行“与”操作所获得的一个经过组合的二值图像;
图19举例说明了根据本发明的一个优选实施例的图像处理设备的第二配置;
图20示出了一个带有背景干扰的稍显模糊的二值图像,该图像是从图11中所示的并且包括非常模糊的字符串的灰度级图像获得的;
图21示出了从图11中所示的并且包括非常模糊的字符串的灰度级图像获得的一个稍显模糊的二值图像;
图22示出了一个带有周围干扰的形态受到保护的二值图像,该图像是从图11中所示的并且包括非常模糊的字符串的灰度级图像获得的;
图23示出了从图11中所示的并且包括非常模糊的字符串的灰度级图像获得的一个形状被保留的二值图像;
图24示出了通过对于每个像素对稍显模糊的二值图像与形状被保留的二值图像进行“与”操作而获得的一个组合二值图像;
图25A与25B表示一个线图形的黑色像素数量对平均边缘亮度的图;
图26说明了根据本发明的优选实施例的一个更为具体的例子;
图27示出了一个带有背影干扰的稍显模糊的二值图像,该图像是从示于图11中的并且包括非常模糊的字符串的灰度级图像获得的;
图28表示一个具有背景干扰的稍显模糊的二值图像的4连部分的特征值,即连接部分的黑色像素的数量对平均边缘亮度的分布;
图29示出了一个从在图11中所示的并包括非常模糊的字符串的灰度级图像获得的一个稍显模糊的二值图像;
图30示出了一个具有周围干扰的形状被保留的二值图像,该图像是从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的;
图31表示一个具有周围干扰的形状被保留的二值图像的4连部分的特性值,即连接部分的黑色像素的数量对平均边缘亮度的分布;
图32示出了从在图11中所示的并包括非常模糊的字符串的灰度级图像获得的一个形状被保留的二值图像;
图33示出了通过对每一个像素对稍显模糊的二值图像与形状被保留的二值图像进行“与”操作而获得的一个组合二值图像;
图34是表示一个背景干扰消除处理的流程图;
图35显示了当由一个程序来实现本发明的优选实施例时所需要的一个信息处理设备的配置;
图36对程序数据的使用方式进行了解释。
具体实施方式
根据本发明的优选实施例,利用这样一个特性,即一个线图形的连接部分的黑色像素的数量对平均边缘亮度的分布(当以连接部分的黑色像素的数量与平均边缘亮度为轴绘制图时连接部分的一个分布),以及关于保留了诸如字符、划线、图形等之类的线图形的形状并且是由局部二值化产生的一个二值图像的背景干扰重叠的连接部分的分布,生成一个虽然形状模糊却几乎包括一个完整图形的稍显模糊的二值图像,以及一个包括该线图形同时保留了其形状并且还包括背景干扰而不是该线图形的周围干扰的形状被保留的二值图像。而这些分布对于线图形的稍显模糊并且是由局部二值化产生的一个二值图像而言是独立的,并且这些二值化图像被进行“与”操作,于是生成一个令人满意的图像,该图像几乎包括该完整的线图形并保留了其形状而且不包括背景区域中的干扰。
图15举例说明了根据本发明的一个优选实施例的一个图像处理设备的第一配置。
具有该举例说明的配置的,包括诸如字符、划线、图形等之类的线图形的一个单色多层图像(包括由彩色图像变换成的一个图像)输入其中的该图像处理设备包括稍显模糊的二值图像生成单元、形状被保留的二值图像生成单元11和二值图像组合单元12。当通过从一个线图形提取黑色像素所获得的一个二值图像被输出时,稍显模糊的二值图像生成单元10生成一个稍显模糊的二值图像,虽然其形状是模糊的,但是该二值图像几乎包括该完整的线图形,并且不包含背景区中的干扰;形状被保留的二值图像生成单元11生成一个形状被保留的二值图像,该图像在保留了其形状的同时几乎包括该完整的线图形,并且还包括背景区域中的而不是该线图形周围的干扰,并且二值图像组合单元12对稍显模糊的二值图像与形状被保留的二值图像进行组合。结果,几乎包括该完整的线图形同时保留了其形状的,并且不包括背景中的干扰的一个令人满意的二值图像被生成并输出。
图16示出了从在图11中所示并且包括非常模糊的字符串的灰度级图像获得的一个稍显模糊的二值图像。
虽然其形状是模糊的,但该二值图像几乎包括该完整的线图形,并且不包括背景区域中的干扰。
图17示出了从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的一个形状被保留的二值图像。
该二值图像在保留了其形状的同时几乎包括该完整的线图形,并且还包括背景区域中的而不是该线图形的周围的干扰。
图18示出了对于每个像素通过对稍显模糊的二值图像与形状被保留的二值图像进行“与”操作所获得的一个组合二值图像。该二值图像是一个令人满意的二值图像,在保留了其形状的同时几乎包括该完整的线图形,并且不包括背景区中的干扰。从该优选实施例可以证明,一个非常模糊的字符串能够被令人满意地提取出来。
在上面描述的以及下面的优选实施例中,在Niblack局部二值化处理中,通过把σ的值置成一个大的正数值可以获得一个稍显模糊的二值图像,而通过把σ的配置成一个负的或者一个较小的值可以获得一个形状被保留的二值图像。
因此,在图15中所示的,由稍显模糊的二值图像生成单元10与形状被保留的二值图像生成单元11执行的处理的算法是相同的,均为Niblack局部二值化处理,仅有的差别在于这些算法的二值化阈值。
图19举例说明了根据本发明的一个优选实施例的图像处理设备的第二配置。
具有该举例说明的配置的,包括诸如字符、划线、图形等之类的线图形的一个多层图像被输入其中的该图像处理设备包括一个稍显模糊的二值图像生成单元10a、一个形状被保留的二值图像生成单元11a和一个二值图像组合单元12。当通过从一个线图形提取黑色像素所获得的一个二值图像被输出时,稍显模糊的二值图像生成单元10a生成一个稍显模糊的二值图像,虽然其形状是模糊的,但是该二值图像几乎包括该完整的线图形,并且不包含背景区域中的干扰;形状被保留的二值图像生成单元11a生成一个图像,在保留了其形状的同时该图像几乎包括该完整的线图形,并且还包括背景区域中的而不是该线图形的周围的干扰;而二值图像组合单元12对稍显模糊的二值图像与形状被保留的二值图像进行组合。结果,在保留了其形状的同时几乎包括该完整的线图形,并且不包括背景区域中的干扰的一个令人满意的二值图像被生成并输出。
稍显模糊的二值图像生成单元10a包括一个稍显模糊的二值化单元13和一个背景干扰消除单元15。稍显模糊的二值化单元13从一个输入的多层图像生成一个具有背景干扰的稍显模糊的二值图像,虽然其形状是模糊的并且还包括背景区中的干扰,但是该二值图像几乎包括一个完整的线图形;而背景干扰消除单元15从具有背景干扰的稍显模糊的二值图像生成一个不包括背景干扰的稍显模糊的二值图像。形状被保留的二值图像生成单元11a包括一个形状被保留的二值化单元14,和一个背景干扰消除单元15。形状被保留的二值化单元14从一个输入的多层图像生成一个带有周围干扰的形状被保留的二值图像,该二值图像在保留了其形状的同时几乎包括一个完整的线图形并且还包括在含有该线图形的周围的背景区中的干扰。背景干扰消除单元15通过从具有周围干扰的形状被保留的二值图像消除背景干扰生成一个形状被保留的二值图像,该二值图像在保留了其形状的同时几乎包括该完整的线图形并且还包括在含有该线图形的周围的背景区中的干扰。
注意,背景干扰消除单元15的同一算法能够用于稍显模糊的二值图像生成单元10a和形状被保留的二值图像生成单元。一个具体的背景干扰消除方法将在稍后描述。
图20示出了从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的具有背景干扰的一个稍显模糊的二值图像。
虽然其形状模糊,但该二值图像几乎包括完整的线图形,并且还包括背景区中的干扰。
图21示出了从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的一个稍显模糊的二值图像。
该二值图像具有一个特性,即虽然其形状是模糊的,但几乎包括该完整的光谱图像,并且不包括背景区中的干扰。为何能生成这样的一个二值图像,原因在于包括具有背景干扰的一个稍显模糊的二值图像的线图形的黑色像素连接部分的黑色像素的数量对平均边缘亮度的分布与只包括该图像的背景干扰的连接部分的分布是分开的。
图22示出了一个具有周围干扰的形状被保留的二值图像,该图像是从在图11中所示的并包括非常模糊的字符串的灰度级图像获得的。
该二值图像在保留了其形状的同时几乎包括完整的线图形,并且还包括含有该线图形的周围的背景中的干扰。
图23示出了从在图11中所示的并包括非常模糊的字符串的灰度级图像获得的一个形状被保留的二值图像。
该二值图像具有一个特性,即在保留了其形状的同时几乎包括完整的线图形,并且包括背景区中的而不是该线图形的周围干扰。为何还包括背景区中的干扰,其原因在于包括具有周围干扰的形状被保留的二值图像的线图形的黑色像素连接部分的黑色像素的数量对平均边缘亮度的分布与只包括背景干扰的连接部分的分布不是分开的。结果,当在消除背景干扰而防止线图形被错误消除的同时,在分布重叠的区域中的背景干扰不可能被消除。
图24示出了通过对于每个像素,对稍显模糊的二值图像与形状被保留的二值图像进行组合操作所获得的一个组合二值图像。
该二值图像是一个令人满意的二值图像,在保留了其形状的同时几乎包括该完整的线图形,并且不包括背景区中的干扰。从该优选实施例可以证明,一个非常模糊的字符串能被令人满意地提取出来。
对于通过局部二值化产生的一个二值图像而言,如果通过改变该二值化的阈值,在形状被保留的二值图像的分布(图25A)与稍显模糊的二值图像的分布(图25B)之间作一比较,即可得知,上述配置中的任何一个配置均使用了这样一个特性,即包括线图形的连接部分的黑色像素的数量对平均边缘亮度的分布背景干扰的连接部分的那一个分布是分开的,如图25A和25B所示的表示线图形的黑色像素对平均边缘亮度的图示。虽然其形状模糊但却包括几乎完整的线图形并且包括背景区干扰的一个稍显模糊的二值图像,和一个在保留了其形状的同时包括几乎完整的线图形并且也包括背景区中的而不是线图形的周围的干扰的形状被保留的二值图像被生成,并且所生成的二值图像被施以“与”操作,由此,在保留了其形状的同时包括几乎完整的线图形并且在背景区不包括干扰的一个令人满意的二值图像被生成。
如在图18或24中所示,通过有效地利用在图25A与图25B中所示的连接部分的特性分布中的变化,该优选实施例能使一个非常模糊的字符串在不包括背景干扰的情况下被令人满意的提取出来,这是利用传统的技术所不能完成的,并且能够克服由传统的技术引起的问题。
图26举例说明了根据本发明的优选实施例的一个更为具体的配置。
图26所示的,包括一个线图形如一个字符,一条划线,一个图形等的一个多层图像输入其中的图像处理设备包括一个稍显模糊的二值图像生成单元10a、一个形状被保留的二值图像生成单元11a和一个二值图像组合单元12。该设备输出一个通过从一个线图形提取黑色像素所获得的二值图像。稍显模糊的二值图像生成单元10a生成一个稍显模糊的二值图像,虽然其形状模糊但包括几乎完整的线图形,并且不包括在背景区中的干扰;形状被保留的二值图像生成单元11a生成一个形状被保留的二值图像,在保留了其形状的同时包括该几乎完整的光谱图,并且还包括背景区中的而不是该线图形的周围的干扰;而且二值图像组合单元12对稍显模糊的二值图像与形状被保留的二值图像进行组合。结果,在保留了其形状的同时包括几乎完整的该线图形并且不包括背景区中的干扰的一个令人满意的二值图像被生成与输出。
稍显模糊的二值图像生成单元10a包括一个稍显模糊的二值化单元13和一个背景干扰消除单元15。稍显模糊的二值化单元13利用Niblack局部二值化,通过把以一个目标像素为中心的7×7像素的区域中的像素的密度平均值定义为E,把标准误差定义为σ,并且通过把T=E+0.3σ定为每个像素的一个二值化阈值的方式获得一个二值图像。如果在等式T=E+Kσ中K的值是一个约为0.3的大值,就能够从一个输入的多层图像中生成一个具有背景干扰的稍显模糊的二值图像,虽然其形状模糊但包括一个几乎完整的线图形并且还包括背景区中的干扰。
形状被保留的二值图像生成单元11a包括一个形状被保留的二值化单元14和一个背景干扰消除单元15。形状被保留的二值化单元14利用Niblack局部二值化,通过把以目标像素为中心的7×7像素的区域中的像素的平均密度定义为E,把标准误差定义为σ,并且通过把T=E+0.1σ定为每个像素的一个二值化阈值的方式获得一个二值图像。如果在等式T=E+Kσ中K的值是一个约为0.1的小值,就能够从一个输入的多层图像生成一个具有周围干扰的形状被保留的二值图像,在保留了其形状的同时该图像包括一个几乎完整的线图形并且还包括背景区中的而不是在该线图形的周围的干扰。
背景干扰消除单元15通过消除背景干扰从具有背景干扰的稍显模糊的二值图像以及具有周围干扰的形状被保留的二值图像生成一个二值图像。
在该优选实施例中,背景干扰消除单元通过下面的用图解释的方法实现。
图27示出了一个具有背景干扰的稍显模糊的二值图像,该图像是从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的。
虽然其形状模糊,但是该二值图像包括了几乎完整的线图形并且还包括背景区中的干扰。
图28是表示一个具有背景干扰的稍显模糊的二值图像的4连部分的一个特性值,即连接部分的黑色像素的数量对轮廓像素的平均边缘亮度的分布图。背景干扰的连接部分的分布与包括线图形的连接部分的分布显然是分开的。原因在于,由于该图像模糊,线图形周围的背景干扰与该线图形连接。于是,背景干扰消除单元把属于区域A的连接部分去掉,因此只有包括该线图形的连接部分能被提取。在该优选实施例中属于区域A的条件是黑色像素的数量等于或小于13,或者平均边缘亮度等于或小于2.2,或者该平均边缘亮度等于或小于(3.2-(黑色像素的数量-15)/65)。
背景干扰消除单元通过利用满足属于区域A的条件从具有背景干扰的稍显模糊的二值图像消除背景干扰,因此,就能够生成虽然其形状模糊但包括几乎完整的线图形并且在背景区中不包括干扰的稍显模糊的二值图像。
图29示出了从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的稍显模糊的一个二值图像。
该二值图像具有一个特性,即虽然其形状模糊,便却包括几乎完整的线图形,并且不包括在背景区中的干扰。能够生成这样的一个二值图像,原因在于包括具有背景干扰的一个稍显模糊的二值图像的线图形的连接部分的黑色像素的数量对黑色像素的平均边缘亮度的一个特性值与只包括背景干扰的连接部分的黑色像素的数量对平均边缘亮度的一个分布是分开的。
形状被保留的二值图像生成单元包括一个形状被保留的二值化单元,和一个背景干扰消除单元。形状被保留的二值化单元利用Niblack局部二值化,通过把以一个目标像素为中心的7×7像素的一个区域内的像素的密度平均值定义为E,并把标准误差定义为σ,并通过把T=E+0.1σ定为每个像素的二值化阈值的方式获得一个二值化图像。如果在等式T=E+Kσ中K的值是一个约为0.1的小值,就能从一个输入的多层图像生成一个具有周围干扰的形状被保留的二值图像,该图像在保留了其形状的同时包括一个几乎完整的线图形,并且还包括含有该线图形的周围的一个背景区域中的干扰。
图30示出了一个具有周围干扰的形状被保留的二值图像,该图像是从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的。
该二值图像在保留了其形状的同时还包括几乎完整的线图形,并且还包括背景区中的而不是该线图形的周围的干扰。
图31是表示具有周围干扰的一个形状被保留的二值图像的4连部分的一个特性值,即连接部分的黑色像素的数量对周围像素的平均边缘亮度的一个分布图。
背景干扰的连接部分的一个分布与包括该线图形的连接部分的一个分布存在部分重叠。原因是,由于该图像并不模糊,因此该线图形的周围的背景干扰不与该线图形连接。于是,背景干扰消除单元去掉属于一个区域B的连接部分,因此能够生成一个形状被保留的二值图像,该图像在保留了其形状的同时包括该几乎完整的线图形,并且还包括背景区中的而不是该线图形的周围的干扰。在该优选实施例中属于区域B的一个条件是黑色像素的数量等于或小于12并且平均边缘亮度等于或小于4,或者是黑色像素的数量等于或小于60并且平均边缘亮度等于或小于2.8。
背景干扰消除单元通过利用满足属于区域B的上述条件从具有周围干扰的形状被保留的二值图像消除背景干扰,因此能够生成一个形状被保留的二值图像,该图像在保留了其形状的同时包括几乎完整的线图形,并且还包括背景区中的而不是该线图形的周围的干扰。
图32示出了从在图11中所示的并且包括非常模糊的字符串的灰度级图像获得的一个形状被保留的二值图像。
该二值图像具有一个特性,在保留了其形状的同时,该二值图像包括几乎完整的线图形,并且还包括背景区中的而不是该光谱图像的周围的干扰。在包括背景区中的干扰的原因在于,当从具有周围干扰的形状被保留的二值图像中去掉背景干扰的连接部分时,在包括线图形的连接部分的黑色像素的数目对平均边缘亮度的分布的区域中的背景干扰以及背景干扰的部分重叠不可能被消除。
图33示出了对于每个像素通过对稍显模糊的二值图像与形状被保留的二值图像进行“与”操作所获得的一个组合二值图像。
该二值图像是一个令人满意的二值图像,在保留了其形状的同时该二值图像包括几乎完整的线图形并且在不包括背景区中的干扰。从该优选实施例可以证明,一个非常模糊的字符串能够被令人满意地提取。
通过利用下述这样一个特性,生成了一个稍显模糊的二值图像,虽然其形状模糊但该二值图像包括几乎完整的线图形并且在不包括背景区中的干扰,和一个形状被保留的二值图像,在保留了其形状的同时该二值图像包括几乎完整的线图形并且还包括背景区中的而不是该线图形的连接部分的黑色像素的数量对平均边缘亮度的一个分布,以及有关通过局部二值化产生的一个二值图像的背景干扰部分重叠的连接部分的那个分布,其中,线图形的形状被保留,而包括线图形的连接部分的黑色像素的数量对平均边缘亮度的分布与有关从局部二值化产生的一个二值图像的背景干扰的连接部分的分布是分开的,其中,线图形的形状是模糊的。对于每个像素,对所生成的二值图像进行“与”操作,于是生成一个令人满意的二值图像,在保留了其形状的同时该二值图像包括几乎完整的线图形并且不包括在背景区中的干扰。
图34是显示上述的背景干扰消除处理的一个流程图。
首先,在步骤10,获得每个连接部分的黑色像素的数量与平均边缘亮度。然后,在步骤11,一个连接部分的黑色像素的数量与平均边缘亮度被选为将被处理的连接部分。在步骤12,判断黑色像素的数量是否在一个预定的范围内。如果判断结果是“否”,处理转至步骤15。如果判断结果为“是”,还要在步骤13中判断平均边缘亮度是否在一个预定的范围内。如果步骤13中的判断结果为“否”,处理转至步骤15。如果步骤13中的判断结果为“是”,在步骤14中把将处理的连接部分去掉。然后处理转至步骤15。在步骤15,判断是否所有的连接部分均已被处理。如果还有将被处理的连接部分,则处理返回步骤11。如果断定所有的连接部分均已被处理,则处理结束。
上述的这个例子指的是由根据本发明的该优选实施例为消除背景干扰而引入的方法。但是其他方法,如Yanowitz与Bruckstein的方法等,也是可用的。或者,例如,由在本申请的先前申请的日本专利申请No.11-335495叙述的方法就可以使用。该申请叙述了一个背景消除法,利用这种方法,如果目标像素周围区域内的像素密度的标准误差σ小于阈值σmin,该目标像素即被判定为背景,或者当定义平均密度差Δg={一个周围区域内的白色像素的平均密度-该周围区域内的黑色像素的平均密度}时,如果平均密度差Δg小于预定阈值Δgmin,该目标像素被判定为背景。利用这一方法,一个被判断定为背景的像素被修正为白色,于是,点状的黑-白干扰被消除。这里,平均密度差是在用一个目标像素的二值化阈值对该目标像素的周围像素进行初步二值化的情况下白色像素集的平均密度与黑色像素集的平均密度之间的差。
此外,如在上述的优选实施例中,还可以对一个图像进行后处理,以降低在对一个稍显模糊的二值图像和一个形状被保留的二值图像进行“与”操作后的干扰。即,图26中所示的背景干扰消除单元15,如在图28与31中所示,通过判断一个连接部分是否在由黑色像素的数量与一个平均边缘亮度所确定的一个预定范围之内,来确定该连接部分是否为将被消除的背景干扰。然而,对于所有的情况而言,这是不够的。也就是说,即使在“与”处理之后,也不能还留有背景干扰。
因此,如上所述,由日本专利No.11-225495叙述的方法,或者是也可以用作背景干扰消除单元的Yanowitz和Bruckstein的后处理,被用于经过“与”操作之后一个二值图像。尤其是Yanowitz和Bruckstein的后处理作为后处理步骤在上面的文件中进行了描述。
如上所述,通过使用前面的申请的方法,或者是Yanowitz和Bruckstein的处理与由本优选实施例的“与”处理实现的一个二值图像的质量改进相结合,可以获得一个高质量的二值图像。
图35示出了通过一个程序来实现根据本发明的任何一个优选实施例时所需要的一个信息处理设备的配置。
在该信息处理设备中,CPU 21通过诸如硬盘之类的外部存储设备25、或者从便携式存储介质29(如CD-ROM、软盘、DVD等)读取信息的介质驱动设备26把一个程序拷贝到内存储器22中,CPU21用一条总线28连接,并执行该程序。
输入设备23配置了键盘、鼠标器、书写板、OHR等,供该信息处理设备的用户用于向CPU 21发出命令、或者采集一个图像。例如,也可以在Niblack二值化处理中设置σ的值,或者是在背景干扰消除处理中规定黑色像素的数量或平均边缘亮度的范围。输出设备24配置了显示器、打印机等,用于向用户提供处理结果,或者打印二值图像。
同时配置了一个网络连接设备27用于通过网络交换数据,并可用于除了从该信息处理设备之外从OHR读取图像,或者下载一个程序以执行这些优选实施例的处理。
图36对程序数据的使用方式进行了解释。
根据本优选实施例的一个程序被存储于信息处理设备31的存储器35中,诸如RAM、硬盘等,并被使用。但是,存储在CD-ROM、软盘32等上的程序也可以加载并使用。反之,可以通过连线33从程序提供器30下载程序数据,并在信息处理设备31中使用。或者,程序提供器30拥有的程序可以在网络环境下运行而无需下载。
如上所述,根据本发明,连接部分的特性分布中的变化被有效地利用,由此,多层图像中的非常模糊的字符串能够被提取出来而不包括背景干扰。

Claims (5)

1.一种图像处理设备,对该设备输入包括诸如字符、划线、图形等的线图形的图像,输出一个相应的二值图像,该设备包括:
稍显模糊的二值图像生成单元,用于生成第一图像,虽然形态模糊,但该图像包括一个线图形的完整的形态;
形状被保留的二值图像生成单元,用于生成第二图像,该图像包括该线图形的完整的形态并且还包括在背景区的、而不是在该线图形周围的干扰;
一个图像组合单元,对于每个象素,组合所述第一与第二图像,并生成一个二值图像,在保留了该形状的同时,该二值图像包括该线图形的完整形状,并且不包括背景区中的干扰。
2.根据权利要求1的图像处理设备,还包括:
一个背景干扰消除单元,用于从第一和第二图像中消除背景区中的干扰。
3.根据权利要求2的图像处理设备,其中:
所述背景干扰消除单元通过根据作为输入的第一或第二图像的一个二值图像的黑色象素的数目对该黑色象素的4连部分的平均边缘亮度的分布,把连接部分分为包括一个线图形的连接部分和是背景干扰的连接部分,并通过去掉被确定为背景干扰的连接部分,消除背景干扰。
4.根据权利要求2的信息处理设备,其中:
如果输入的第一或第二图像的某一象素的周围象素的密度的标准误差或平均密度差在预定范围之内,则所述的背景干扰消除单元则判定这一象素为一个背景象素。
5.一种图像处理方法,用于输入包括诸如字符、划线、图形等的线图形的图像,并输出一个相应的二值图像,该方法包括:
生成第一图像,该图像虽然形状模糊,但包括一个线图形的完整的形态;
生成第二图像,该图像包括该线图形的完整形状并且还包括背景区中的、而不是在该线图形周围的干扰;
对于每个象素,组合所述第一与第二图像,并生成一个二值图像,在保留了该形状的同时,该二值图像包括该线图形的完整形状,并且不包括背景区中的干扰。
CNB01143306XA 2001-03-14 2001-12-18 图像处理设备 Expired - Fee Related CN1195284C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP071869/2001 2001-03-14
JP2001071869A JP2002271611A (ja) 2001-03-14 2001-03-14 画像処理装置

Publications (2)

Publication Number Publication Date
CN1374623A CN1374623A (zh) 2002-10-16
CN1195284C true CN1195284C (zh) 2005-03-30

Family

ID=18929536

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB01143306XA Expired - Fee Related CN1195284C (zh) 2001-03-14 2001-12-18 图像处理设备

Country Status (3)

Country Link
US (1) US7110607B2 (zh)
JP (1) JP2002271611A (zh)
CN (1) CN1195284C (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4047192B2 (ja) * 2003-02-24 2008-02-13 キヤノン株式会社 画像圧縮装置及び方法、画像伸張装置及び方法、プログラム
JP4408779B2 (ja) * 2004-09-15 2010-02-03 キヤノン株式会社 画像処理装置
JP4619112B2 (ja) * 2004-12-27 2011-01-26 花王株式会社 毛形状の測定方法
TWI314301B (en) * 2006-06-30 2009-09-01 Primax Electronics Ltd Adaptive image sharpening method
CN101520845B (zh) * 2008-02-29 2011-11-30 富士通株式会社 彩色文档图像的分层方法和装置
FI121901B (fi) * 2008-10-17 2011-05-31 Visidon Oy Objektien ilmaiseminen ja seuraaminen digitaalisissa kuvissa
US8442348B2 (en) * 2008-11-06 2013-05-14 Seiko Epson Corporation Image noise reduction for digital images using Gaussian blurring
CN101789081B (zh) * 2009-01-22 2013-03-27 佳能株式会社 模糊文档图像的二值化方法及其设备
JP5397468B2 (ja) * 2009-05-19 2014-01-22 日本電気株式会社 パタンノイズ除去装置、パタンノイズ除去方法、パタンノイズ除去プログラム
US8406554B1 (en) * 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
JP5725276B2 (ja) * 2010-08-03 2015-05-27 富士ゼロックス株式会社 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
US8571307B2 (en) 2010-11-16 2013-10-29 Hand Held Products, Inc. Method and system operative to process monochrome image data
US8600158B2 (en) 2010-11-16 2013-12-03 Hand Held Products, Inc. Method and system operative to process color image data
US9275467B2 (en) * 2012-03-29 2016-03-01 Analog Devices, Inc. Incremental contour-extraction scheme for binary image segments
US9262816B2 (en) * 2012-10-10 2016-02-16 Siemens Medical Solutions Usa, Inc. Dynamic waveform region enhancement
JP6171727B2 (ja) * 2013-08-23 2017-08-02 ブラザー工業株式会社 画像処理装置、シート、コンピュータプログラム
JP6834417B2 (ja) * 2016-11-30 2021-02-24 ブラザー工業株式会社 画像処理装置及びプログラム
JP7341758B2 (ja) * 2019-07-08 2023-09-11 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN113362319A (zh) * 2021-06-30 2021-09-07 深圳市创想三维科技股份有限公司 基于图像处理的激光打印方法和装置、激光打印机、计算机可读存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL70214A (en) * 1983-11-13 1987-10-20 Elscint Ltd Image contrast enhancement arrangement
US5054101A (en) 1989-02-28 1991-10-01 E. I. Du Pont De Nemours And Company Thresholding of gray level images using fractal dimensions
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5701500A (en) * 1992-06-02 1997-12-23 Fuji Xerox Co., Ltd. Document processor
US5848184A (en) * 1993-03-15 1998-12-08 Unisys Corporation Document page analyzer and method
DE4411248C1 (de) 1994-03-31 1995-10-26 Licentia Gmbh Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten
ES2140825T3 (es) 1995-01-31 2000-03-01 United Parcel Service Inc Procedimiento y aparato para separar el primer plano del fondo en imagenes que contienen texto.
EP0979398B1 (en) * 1996-06-04 2012-01-04 KLA-Tencor Corporation Optical scanning system for surface inspection
DE69822608T2 (de) * 1998-05-28 2005-01-05 International Business Machines Corp. Binarisierungsverfahren in einem Zeichenerkennungssystem
US6301386B1 (en) * 1998-12-09 2001-10-09 Ncr Corporation Methods and apparatus for gray image based text identification
FR2795205B1 (fr) 1999-06-15 2001-07-27 Mannesmann Dematic Postal Automation Sa Procede pour binariser des images numeriques a plusieurs niveaux de gris
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6738517B2 (en) * 2000-12-19 2004-05-18 Xerox Corporation Document image segmentation using loose gray scale template matching

Also Published As

Publication number Publication date
US20020131646A1 (en) 2002-09-19
CN1374623A (zh) 2002-10-16
JP2002271611A (ja) 2002-09-20
US7110607B2 (en) 2006-09-19

Similar Documents

Publication Publication Date Title
CN1195284C (zh) 图像处理设备
CN1275190C (zh) 用于校正图像中的对象歪斜的方法和装置
CN1203657C (zh) 图像处理方法和装置
CN1991865A (zh) 从复杂背景文档图像提取文本的装置、方法、程序及介质
EP2288135A2 (en) Deblurring and Supervised Adaptive Thresholding for Print-and-Scan Document Image Evaluation
CN1711559A (zh) 特征区域提取装置、特征区域提取方法和特征区域提取程序
CN1239014C (zh) 提高数字图像质量的方法和装置
CN1697478A (zh) 图像修正装置
CN1512450A (zh) 图像处理设备、图像处理方法及其程序
CN1933541A (zh) 图像处理装置、图像处理方法及程序
CN1655583A (zh) 生成具有多个前景平面的高压缩图像数据文件的系统和方法
CN1655582A (zh) 连续具有相似特性的图像数据的区域的系统和方法
CN1691063A (zh) 白眼修正方法及实施该方法的装置
CN1475969A (zh) 用于增强人像图像的方法和系统
CN1741039A (zh) 面部器官位置检测设备、方法及程序
CN1910613A (zh) 图像中的人物候选区域抽取方法及人物候选区域抽取系统、人物候选区域抽取程序、以及人物像的上下判定方法、上下判定系统、上下判定程序
CN1822027A (zh) 灰度字符的精确分割装置及方法
CN1519770A (zh) 用于二进制化图像的设备和方法
CN1863269A (zh) 图像处理装置、图像形成装置、以及图像处理方法
CN1230788C (zh) 图像处理设备和方法
CN1622589A (zh) 图像处理方法以及图像处理装置
CN101052091A (zh) 图像处理装置、误差扩散处理方法和记录介质
CN1578381A (zh) 使用x-标记保持图像平滑度和锐度的自适应半色调方案
US20030202696A1 (en) Activity detector
CN1207673C (zh) 半色调点消除方法及其系统

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee