CN1519770A - 用于二进制化图像的设备和方法 - Google Patents
用于二进制化图像的设备和方法 Download PDFInfo
- Publication number
- CN1519770A CN1519770A CNA2004100025645A CN200410002564A CN1519770A CN 1519770 A CN1519770 A CN 1519770A CN A2004100025645 A CNA2004100025645 A CN A2004100025645A CN 200410002564 A CN200410002564 A CN 200410002564A CN 1519770 A CN1519770 A CN 1519770A
- Authority
- CN
- China
- Prior art keywords
- character
- block
- piece
- pixel
- character block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/409—Edge or detail enhancement; Noise or error suppression
- H04N1/4092—Edge or detail enhancement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/403—Discrimination between the two tones in the picture signal of a two-tone original
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20052—Discrete cosine transform [DCT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
公开了用于二进制化图像的设备,该设备包括用于接收图像的输入部件;用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;边缘增强部件,用于使用由该块分类部件分类的字符块中相邻像素间的关系,增强该字符块的边缘,以及生成用于区分该字符块的字符像素和背景像素的阈值;以及二进制部件,用于通过将该字符块的像素与该阈值进行比较,将从该边缘增强部件输出的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从该块分类部件输出的背景块的像素二进制化为该第二亮度值。
Description
技术领域
本发明通常涉及用于二进制化图像的设备和方法,以及更具体地说,涉及用于在识别输入图像中的字符之前,将输入图像预处理为二进制信号的设备和方法。
背景技术
通常,执行预处理操作以便识别图像字符。“预处理操作”是在识别图像中的字符之前,处理图像的操作。图像预处理操作能包括确定输入图像是否适合于字符识别的操作、校正输入图像中的歪斜目标的操作,以及二进制化输入图像以便能识别输入图像中的字符的操作。
图1是示例说明用于二进制化图像的传统的二进制设备的结构的框图。图1所示的二进制设备使用二次滤波器(quadratic filter)。在由by P.Fontanot and G.Ramponi et al.、Proc.1993 IEEE WinterWorkshop on Nonlinear Digital Signal Processing,Tampere,Finland,Jan.1993,pp.2.1-2.6,名为“A polynomial filter for the preprocessing of mailaddress images”的参考文献中公开了该二次滤波器,其内容在此引入,以供参考。
现在将描述二次滤波器的操作。第一阈值选择部件11计算用于将图像的像素分类成字符像素和背景像素的第一阈值Th1。平均值计算部件13根据第一阈值Th1,将图像的像素分类成字符像素和背景像素,并计算它们的平均值。规格化部件15,用于使用从平均值计算部件13输出的字符像素和背景像素的平均值,将输入图像的像素转换成接近于“1”或“0”的值。在此假定规格化部件15将字符像素转换成接近于“1”的值以及将背景像素转换成接近于“0”的值。二次操作部件17使用指定中心像素及其附近像素间的关系,相对于每个像素,执行规格化像素的增强边缘的操作。反向规格化部件(denormalization)19在它们的初始像素值的范围内,执行反向规格化从二次操作部件17输出的边缘分量增强像素的操作。第二阈值选择部件21计算用于将反向规格化的像素分类成字符像素和背景像素的第二阈值Th2。
简单二进制部件30根据第二阈值Th2,将从反向规格化部件19输出的像素转换成二个特定亮度值。
然而,当在不规则灯光情形中拍摄的整个图像上执行这种二进制时,由于投在其上的阴影,不期望地恶化其二进制性能。
发明内容
因此,本发明的目的是提供用于在二进制前,将图像分类成字符块和背景块的设备和方法。
本发明的另一目的是提供用于在二进制前,将图像分类成字符块和背景块,使所分类的字符块增长以便重新分类字符块的设备和方法。
本发明的另一目的是提供用于在二进制化前,将图像分类成字符块和背景块,使所分类的字符块与和它们相邻的块形成一组以便增强边缘分量,并将字符块与成组块分开的设备和方法。
本发明的另一目的是提供用于在二进制前,将图像分类成字符块和背景块,使所分类的字符块增长以便重新分类字符块,使所分类的字符块与和它们的相邻块形成一组以便增强边缘分量,并将字符块与成组块分开的设备和方法。
本发明的另一目的是提供用于将图像分类成字符块和背景块,使用二次滤波器,增强字符块的边缘分量,然后二进制化字符块和背景块的像素的设备和方法。
本发明的另一目的是提供用于将图像分类成字符块和背景块,使用改进的二次滤波器,增强字符块的边缘分量,然后二进制化字符块和背景块的像素的设备和方法。
根据本发明的一个方面,提供用于二进制图像的设备,包括用于接收图像的输入部件;用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;边缘增强部件,用于使用由该块分类部件分类的字符块中相邻像素间的关系,增强该字符块的边缘,以及生成用于区分该字符块的字符像素和背景像素的阈值;以及二进制部件,用于通过将该字符块的像素与该阈值进行比较,将从该边缘增强部件输出的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从该块分类部件输出的背景块的像素二进制化为该第二亮度值。
根据本发明的另一方面,提供一种用于二进制化图像的设备,包括用于接收图像的输入部件;用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;块增长部件,用于使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;边缘增强部件,用于使用从该块增长部件输出的该字符块中的相邻像素间的关系,增强字符块的边缘,并生成用于区分该字符块的字符像素和背景像素的阈值;该用于二进制化图象的设备还包括:二进制部件,用于通过将该字符块的像素与该阈值进行比较,将从该边缘增强部件输出的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从该块增长部件输出的背景块的像素二进制化为该第二亮度值。
根据本发明的另一方面,提供一种用于二进制化图像的设备,包括用于接收图像的输入部件;用于将所接收的图像划分成块、以及将所划分的块分类成字符块和背景块的块分类部件;块成组部件,用于将由该块分类部件划分的字符块与其相邻的块形成一组,从而生成成组块;边缘增强部件,用于使用成组块中的相邻像素间的关系,增强该字符块的边缘,并生成用于区分字符块的字符像素和背景像素的阈值;该用于二进制化图象的设备还包括:块分裂部件,用于将该字符块与从该边缘增强部件输出的成组块分开;以及二进制部件,用于通过将所分开的字符块的像素与该阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从该块分类部件输出的该背景块的像素二进制化成该第二亮度值。
根据本发明的另一方面,提供一种用于二进制化图像的设备,包括用于接收图像的输入部件;用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;块增长部件,用于使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;块成组部件,用于将从该块增长部件输出的字符块与其相邻的块形成一组,从而生成成组块;该用于二进制化图象的设备还包括:边缘增强部件,用于使用成组块中像素间的关系,增强该字符块的边缘,并生成用于区分该字符块的字符像素和背景像素的阈值;块分裂部件,用于将该字符块与从该边缘增强部件输出的成组块分开;以及二进制部件,用于通过将分开的字符块的像素与该阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从该块增长部件输出的背景块的像素二进制化为该第二亮度值。
根据本发明的另一方面,提供一种用于二进制化图像的方法,包括接收图像;将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块;使用该字符块中相邻像素间的关系,增强该字符块的边缘,以及生成用于区分该字符块的字符像素和背景像素的阈值;以及通过将该字符块的像素与该阈值进行比较,将边缘增强的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将所分类的背景块的像素二进制化为该第二亮度值的步骤。
根据本发明的另一方面,提供一种用于二进制化图像的方法,包括接收图像;将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块;使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;使用该字符块中的相邻像素间的关系,增强字符块的边缘,并生成用于区分该字符块的字符像素和背景像素的阈值;通过将该字符块的像素与该阈值进行比较,将边缘增强的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将该背景块的像素二进制化为该第二亮度值的步骤。
根据本发明的另一方面,提供一种用于二进制化图像的方法,接收图像;将所接收的图像划分成块、以及将所划分的块分类成字符块和背景块;将所分类的字符块与其相邻的块形成一组,从而生成成组块;使用成组块中的相邻像素间的关系,增强该字符块的边缘,并生成用于区分字符块的字符像素和背景像素的阈值;将该字符块与所边缘增强成组块分开;以及通过将所分开的字符块的像素与该阈值进行比较,该用于将图像二进制化的方法还包括将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将该背景块的像素二进制化成该第二亮度值的步骤。
根据本发明的另一方面,提供一种用于二进制化图像的方法,包括接收图像;将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块;使所分类的字符块增长,以及将分类成背景块、包含字符像素的块成字符块;将该字符块与其相邻的块形成一组,从而生成成组块;使用成组块中像素间的关系,增强该字符块的边缘,并生成用于区分该字符块的字符像素和背景像素的阈值;该用于将图像二进制化的方法还包括将该字符块与从该成组块分开;以及通过将分开的字符块的像素与该阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将该背景块的像素二进制化为该第二亮度值的步骤。
附图说明
从下述结合附图的详细描述,本发明的上述和其他目的、特征和优点将变得更显而易见,其中:
图1是示例说明传统的图像二进制设备的结构的框图;
图2是示例说明根据本发明的第一实施例的图像二进制设备的结构的框图;
图3是示例说明根据本发明的第二实施例的图像二进制设备的结构的框图;
图4是示例说明根据本发明的第三实施例的图像二进制设备的结构的框图;
图5是示例说明根据本发明的第四实施例的图像二进制设备的结构的框图;
图6是示例说明根据本发明的实施例的图2至5的块分类部件的详细结构的框图;
图7A是说明字符块和背景块的DCT系数的能量分布的比较的图;
图7B是说明字符块的DCT系数的能量分布的比较的图;
图7C是说明在快分类过程中使用的主要DCT系数的图;
图8是示例说明根据本发明的实施例,图3至6的边缘增强部件的例子的框图;
图9是示例说明根据本发明的实施例,二次操作过程处理的中心像素及其周围像素;
图10是示例说明根据本发明的实施例,图3至6的边缘增强部件的另一例子的框图;
图11A至11C是示例说明二次滤波器和根据本发明的实施例的二进制设备中改进的二次滤波器间的输出特性的比较的图;
图12是示例说明根据本发明的第一实施例,图像二进制方法的流程图;
图13是示例说明根据本发明的第二实施例,图像二进制方法的流程图;
图14是示例说明根据本发明的第三实施例,图像二进制方法的流程图;
图15是示例说明根据本发明的第一实施例,图像二进制方法的流程图;
图16是示例说明根据本发明的实施例,图12至15的块分类处理的流程图;
图17是示例说明根据本发明的实施例,图12至15的二进制处理的流程图;
图18是示例说明根据本发明的实施例,当使用二次滤波器的情况下,图像二进制方法的例子的流程图;
图19A到19I是示例说明在图18的二进制过程的每个步骤中生成的图像的图;
图20是示例说明根据本发明的实施例,在使用改进的二次滤波器的情况下,图像二进制方法的例子的流程图;
图21A至21G是示例说明在图20的二进制过程的每个步骤中生成的图像的图。
具体实施方式
在下述描述中,为更好地理解本发明,提供特定的细节,诸如图像的大小和字符和背景块大小。对本领域的技术人员来说,在没有这些特定细节的情况下,或通过修改这些细节,能很容易实现本发明是显而易见的。
在本发明的实施例中,假定输入图像具有640×480像素的大小。术语“块”是指字符和背景块,以及在此假定每个块具有8×8像素大小。另外,术语“成组块”是指通过将二进制化的字符块与其8个相邻的块形成一组生成的块,以及在此假定成组块具有24×24像素的大小。
现在,将参考附图,详细地描述本发明的优选实施例。
图2是示例说明根据本发明的第一实施例的二进制设备的结构的框图。参考图2,输入部件110具有接收输入图像的功能。在这里,照相机、扫描仪、包括调制解调器和网络的通信接口、以及计算机能充当输入部件110。在此假定输入图像由640(列)×480(行)像素组成。
块分类部件120将从输入部件110接收的输入图像划分成具有预定块大小的块,以及通过分析包括在所划分的块中的像素,将所划分的块分类成字符块和背景块。块分类部件120将所划分的块分类成字符块和背景块以便在包括字符的区域上可选地执行二进制。在此假定每个块具有8×8像素的大小。
边缘增强部件130使用由块分类部件120分类的字符块中字符像素和它们的相邻像素间的关系,增强字符块的边缘,并生成降低噪声分量的像素。另外,边缘增强部件130计算用于二进制像素的阈值Th2。边缘增强部件130能包括二次滤波器或改进的二次滤波器。
二进制部件140将从边缘增强部件130输出的字符块的像素与阈值Th2进行比较,并将字符像素和背景像素分别二进制化为第一亮度值和第二亮度值。另外,二进制部件140将从块分类部件120输出的背景像素的像素二进制化第二亮度值。二进制部件140能包括在将二进制化图像发送到识别部件150前,压缩该二进制化图像的压缩器,以便能提高存储空间的效率。
识别部件150识别从二进制部件140输出的二进制化信号。
图3是示例说明根据本发明的第二实施例的二进制设备的框图。参考图3,输入部件110具有接收输入图像的功能。在这里,照相机、扫描仪,包括调制解调器和网络的通信接口,以及计算机能充当输入部件110。在此假定输入图像由640(列)×480(行)像素组成。
块分类部件120将从输入部件110接收的输入图像划分成具有预定块大小的块,并通过分析包括在划分块中的像素,将所划分的块分类成字符块和背景块。块分类部件120将所划分的块分类成字符块和背景块以便在包括字符的区域上可选地执行二进制。在此假定每个块具有8×8像素的大小。
块增长部件160扩充通过块分类部件120分类的字符块。在块分类过程中,由于字符像素间的背景的影响,会将包含字符像素的块错误地划分成背景块。块增长部件160增长字符块以便在错误划分成背景块的字符块中扩充像素。
边缘增强部件130使用从块增长部件160输出的字符块中的字符像素及它们的相邻像素间的关系,增强字符块的边缘,并生成降低噪声分量的像素。另外,边缘增强部件130计算用于二进制像素的阈值Th2。边缘增强部件130能包括二次滤波器和改进的二次滤波器。
二进制部件140将从边缘增强部件130输出的字符块的像素与阈值Th2进行比较,并将字符像素和背景像素分别二进制化第一亮度值和第二亮度值。另外,二进制部件140将从块增长部件160输出的背景像素的像素二进制化第二亮度值。二进制部件140能包括在将二进制化图像发送到识别部件150前,压缩该二进制化图像的压缩器,以便能提高存储空间的效率。
识别部件150识别从二进制部件140输出的二进制化信号。
图4是示例说明根据本发明的第三实施例的二进制设备的结构的框图。参考图4,输入部件140具有接收输入图像的功能。在这里,照相机、扫描仪、包括调制解调器和网络的通信接口、以及计算机充当输入部件110。在此假定输入图像由640(列)×480(行)像素组成。
块分类部件120将从输入部件110接收的输入图像划分成具有预定块大小的块,并通过分析包括在划分块中的像素,将所划分的块分类成字符块和背景块。块分类部件120将所划分的块分类成字符块和背景块以便在包括字符的区域上可选地执行二进制。在此假定每个块具有8×8像素的大小。
块成组部件170将从块分类部件120输出的每个字符块与其8个相邻块形成一组,从而生成成组块。如果确定阈值以便对二进制过程仅使用一个字符块区分背景和字符像素,由于确定的阈值和相邻字符块的阈值间的差异非常大,因此会出现二进制化图像块间的不连续性。块成组部件170执行成组功能以便扩展字符块区域并增强用于字符块的二进制的可靠性。
边缘增强部件130使用从块成组部件170输出的成组字符块中的字符像素和它们的相邻像素间的关系,增强字符块的边缘,并生成降低噪声分量的像素。此外,边缘增强部件130计算用于二进制化像素的阈值Th2。边缘增强部件130能包括二次滤波器或改进的二次滤波器。
块分裂部件180从边缘增强部件130接收成组块,并将字符块与成组块分开。换句话说,块分裂部件180执行仅将用于二进制的字符块与由块成组部件170成组的块分开的功能。
二进制部件140将由块分裂部件180分开的字符块的像素与阈值Th2比较,并分别将字符像素和背景像素二进制化为第一亮度值和第二亮度值。另外,二进制部件140将从块分类部件120输出的背景像素的像素二进制化第二亮度值。二进制部件140能包括在将二进制化图像发送到识别部件150前,压缩该二进制化图像的压缩器,以便能提高存储空间的效率。
识别部件150识别从二进制部件140输出的二进制化信号。
图5是示例说明根据本发明的第四实施例的二进制设备的结构的框图。参考图5,输入部件110具有接收输入图像的功能。在这里,照相机、扫描仪、包括调制解调器和网络的通信接口、以及计算机能充当输入部件110。在此假定输入图像由640(列)×480(行)像素组成。
块分类部件120将从输入部件110接收的输入图像划分成具有预定大小的块,并通过分析包括在所划分块中的像素,将所划分的块分类成字符块和背景块。块分类部件120将所划分的块分类成字符块和背景块,以便在包括字符的区域上可选地执行二进制。在此假定每个块具有8×8像素的大小。
块增长部件160扩展由块分类部件120分类的字符块。在块分类过程中,由于字符像素间的背景的影响,包含字符像素的块会错误地划分成背景块。块增长部件160增长字符块以便扩展在错误地分类成背景块的字符块中的像素。
块成组部件170将从块增长部件160输出的每个字符块与其8个相邻块形成一组,从而生成成组块。如果确定阈值以便对二进制过程仅使用一个字符块(由8×8像素组成)区分背景和字符像素,由于非常小的一个字符块的确定阈值和相邻字符块的阈值间的差异非常大,因此会出现二进制化图像块间的不连续性。块成组部件170执行成组功能以便扩展字符块区域并增强用于字符块的二进制的可靠性。
边缘增强部件130使用从块成组部件170输出的成组字符块中的字符像素和它们的相邻像素间的关系,增强字符块的边缘,并生成降低噪声分量的像素。此外,边缘增强部件130计算用于二进制化像素的阈值Th2。边缘增强部件130能包括二次滤波器或改进的二次滤波器。
块分裂部件180从边缘增强部件130接收成组块,并将字符块与成组块分开。换句话说,块分裂部件180执行仅将用于二进制的字符块与由块成组部件170成组的块分开的功能。
二进制部件140将由块分裂部件180分开的字符块的像素与阈值Th2比较,并分别将字符像素和背景像素二进制化为第一亮度值和第二亮度值。另外,二进制部件140将从块分类部件120输出的背景像素的像素二进制化第二亮度值。二进制部件140能包括在将二进制化图像发送到识别部件150前,压缩该二进制化图像的压缩器,以便能提高存储空间的效率。
识别部件150识别从二进制部件140输出的二进制化信号。
如上所述,根据本发明的第一实施例的二进制设备将输入图像分类成块,然后,将所划分的块分类成字符块和背景块。二进制设备将输入图像分类成字符块和背景块,以便在字符块的像素上执行边缘增强和二进制操作以及在二进制过程中,将背景块中的像素固定到特定的亮度值。
与根据第一实施例的二进制设备相比,根据第二实施例的二进制设备在边缘增强前,增长由块分类部件120划分的字符块,以便在块分类过程中防止字符像素包括在背景块中。即,第二实施例,增长所分类的字符块,此后,如果字符像素包括在错误分类成背景块的块中,校正该块。
与根据第一实施例的二进制设备相比,根据第三实施例的二进制设备在边缘增强前,使由块分类部件120分类的字符块与它们的相邻块形成一组,增强成组块的边缘,将原始的字符块与边缘增强组分开,然后在单独的字符块上执行二进制。用于在字符块上执行块成组的理由如下。即,由于字符块由非常少的像素组成,字符块与其相邻块形成一组以便扩展其块区域,以致增强成组块的边缘。
最后,与根据第一实施例的二进制设备相比,根据第四实施例的二进制设备包括块增长部件160和块成组部件170。在此,将参考第四实施例,给出本发明的详细描述。另外,将假定在此使用的图像是名片的图像。
输入部件110接收具有N×M像素大小的输入图像。如上所述,在此假定图像具有640(N)×480(M)像素大小。输入图像能是彩色图像或不具有彩色信息的灰度级图像。在本发明的实施例中,假定图像是灰度级图像。将输入图像划分成块,然后由块分类部件120分类成字符块和背景块。
图6是示例说明根据本发明的实施例,块分类部件120的详细结构的框图。块分类部件120执行将输入图像划分成具有预定大小的块的操作,以及将所划分的块分类成字符块和背景块。块分类部件120将所划分的块分类成字符块和背景块以便在包括字符的区域上可选地执行二进制。
参考图6,图像划分部件211将图像划分成具有预定大小的块。在这里,图像由640×480像素组成,以及每个块由8×8像素组成。在这种情况下,图像划分部件211将图像划分成4800块。
从图像划分部件211输出的块被施加到离散余弦变换(DCT)转换部件213上,以及DCT转换部件213在这些块上执行DCT转换。能量计算部件215计算DCT转换的块内主要DCT系数的绝对值的总和。在这种情况下,字符块内DCT系数的能量分布值大于背景块内DCT系数的能量分布值。图7A是示例说明用于字符块和背景块的DCT系数的能量分布的比较的图。在图7A中,Y轴表示以对数标度的绝对总和的平均值,以及X轴表示DCT系数的折线扫描次序(zigzag scanorder)。如图7A所示,能注意到字符块的DCT系数在它们的平均值方面大于背景块的DCT系数。图7B是示例说明用于字符块的DCT系数的能量分布特性的图。在图7B中,Y轴表示以长的标准标度的绝对总和的平均值,以及X轴表示DCT系数的折线扫描次序。如图7B所示,能注意到用于字符块的一些DCT系数的绝对总和的平均值相对较大。因此,在本发明的第四实施例中,假定用在块分类过程中的主要DCT系数是图7C所示的D1~D9。因此,能由下述计算在kth块中主要DCT系数的绝对值的总和
在方程式(1)中,|Di k|表示第k块的第i个主要DCT系数,以及Sk表示第k块中主要DCT系数的绝对值的总和。因此,在本发明的各个实施例中,计算主要DCT系数D1~D9的总和。
能量计算部件215在所有块(在k=0,1,2,....,4799)上执行方程式(1)的计算。逐块计算的能量值Sk(k=0,1,2,...,4799)被施加到阈值计算部件217。
阈值计算部件217合计逐块计算的能量值Sk(k=0,1,2,...4799),并通过将合计的能量值除以块的总数TBN。根据下面的方程式(2)产生平均值<Sk>。平均值<Sk>变为用于将块确定为字符块或背景块的阈值Cth。
在方程式(2)中,TBN表示块的总数。
分类部件219在逐块基础上,顺序地接收从能量计算部件215输出的能量值(对应于用于块的主要DCT系数的绝对值的总和)。分类部件219通过将所接收的块能量值与阈值Cth进行比较,将相应的块分类成字符块或背景块。此时,如果Sk≥Cth,分类部件219将第k块分类成字符块,以及如果Sk<Cth,则将第k块分类成背景块,如下述方程式(3)所示。
IF Sk≥Cth 那么CB ........(3)
否则BB
由分类部件120分类的字符块中的像素能具有0至255间的灰度级。从块分类部件120输出的字符块能被输入到边缘增强部件120(本发明第一实施例)、块增长部件(本发明第二和第四实施例),以及块成组部件(本发明第三实施例)。在此,假定将字符块输入到块增长部件160。
块增长部件160使所划分的字符块的区域增长。在块分类处理中,由于字符像素间的背景的影响,包含字符像素的块会被错误地划分为背景块。块增长部件160使字符块增长以便通过扩展字符块,将包含字符像素的背景块改变成字符块。
使用形态滤波器,能实现块增长部件160。形态滤波器通过在称为封闭(close)操作的用于字符块的膨胀(dilate)操作后的腐蚀(erode)操作,使字符块增长。封闭操作用来填充区域的内孔。在封闭操作中,字符块首先通过膨胀操作来扩展,将在字符块间隔离的背景块转换成字符块,以及随后根据封闭操作,通过腐蚀,恢复原始块大小。在由R.C.Gonzalez,R.Woods,et al.,2nd ed.,Prentice Hall,pp.5 19-560,2002、名为“Digital Image Processing”的参考文献中公开了形态滤波器,其整个内容在此引入以供参考。块增长部件160在块增长处理中,将包含字符像素的背景块改变成字符块。
从块增长部件160输出的字符块能被输入到块增长部件170(本发明第四实施例)或边缘增强部件130(本发明第二或第三实施例)。在此,将假定将字符块输入到块增长部件170。
块增长部件170将从块分类部件120或块增长部件160输出的字符块的每一个连同其8个相邻块形成一组,从而组成其中每个由24×24像素组成的成组块。字符块由8×8像素。如果对二进制处理,仅使用一个字符块,确定阈值以便区分背景和字符像素,由于很小的一个字符块的确定阈值和相邻字符块的阈值间的差值非常大,会发生二进制图像的块间的不连续性。因此,当扩展区域以便生成和二进制成组块时,能增强二进制的可靠性。
包含从块成组部件170输出的字符块的成组块被施加到边缘增强部件130。边缘增强部件130能接收从块分类部件120、块增长部件160,或块成组部件170输出的字符块。在这里,从块分类部件120和块增长部件160输出的字符块为具有8×8像素的大小,当块成组部件170输出成组块时(通过将二进制化的字符块与它们的8个相邻块形成一组生成的块),成组块具有24×24像素的大小。
边缘增强部件130能包括二次滤波器(QF)或改进的二次滤波器(IQF)。如图8所示,二次滤波器规格化字符块,增强规格化的字符块的边缘,反向规格化边缘增强的字符块以便在规格化前,在亮度值的范围内转换字符块,并由反向规格化的字符块生成用于二进制化字符块的像素的阈值BTH。如图10所示,改进的二次滤波器规格化字符块,增强规格化字符块的边缘,规格化由字符块计算的阈值,并生成用于二进制字符块中的像素的阈值BTHN。
现在,将参考图8,描述使用二次滤波器,增强字符块的边缘的操作。
参考图8,第一阈值选择部件311计算用于将字符块的像素分类成字符像素和背景像素的第一阈值Th1。第一阈值选择部件311计算用于区分字符和背景像素并规格化两种类型的区分像素的第一阈值Th1。将第一阈值Th1选择为对应于两种类型的区分像素间的最大类间方差(between-class variance)的灰度值。能使用Otsu的方法或Kapur的方法,计算第一阈值Th1。用于计算第一阈值Th1的Otsu的方法是基于下述方程式(4)。由N.Otsu获得的方法在IEEE Trans.Systems,Manand Cybernetics,Vol.SMC-9,No.1,pp.62-66,Jan.1979,名为“AThreshold Selection Method from Gray-Level Histograms”的论文中公开,其整个内容在此引入以供参考。
σB 2(T):类间方差
T:灰度值
μ:总像素的平均值
μi(T):由T定义的每个类的平均值
Pi(T):每个类的相对频率
平均值计算部件313在第一阈值Th1的基础上,将字符块的像素划分成字符和背景像素,以及计算用于字符块的字符和背景像素的平均亮度值。在用于两个类的平均值计算的处理中,根据下述方程式(5),在第一阈值Th1的基础上,将字符块x(m,n)的像素分类成字符像素(CPs)和背景像素(BPs),然后根据下述方程式(6),计算用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1。
If x(m,n)≥Th1 那么CP
否则BP ………(5)
在方程式(5)中,x(m,n)表示字符块,以及Th1表示用于将字符块的像素分类成字符和背景像素的阈值。
在方程式(6)中,Sc表示用于字符像素的亮度值的总和,Nc表示字符像素的数量,Sb表示用于背景像素的亮度值的总和,以及Nb表示背景像素的数量。
规格化部件315使用来自平均值计算部件313的用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1,规格化字符块的像素x(m,n)以便字符像素的值接近“1”,而背景像素的值接近“0”。规格化部件315通过根据下述方程式(7),规格化字符块x(m,n),执行降低用于输入的字符块像素的亮度值的动态范围的功能。
在方程式(7)中,xN(m,n)表示规格化字符块,μ0表示用于字符像素的平均亮度值,以及μ1表示用于背景像素的平均亮度值。
规格化字符块xN(m,n)在二次操作部件317中经受二次操作,以便增强字符块的边缘以及降低它们的噪声分量。二次操作部件317使用规格化像素和它们的周围像素间的关系,执行增强边缘的功能,并降低噪声分量。图9表示由二次操作部件317处理的中心像素和它的周围像素。下面的方程式(8)具有当二次操作部件317执行二次操作时,能增强边缘和降低噪声分量的功能特性。二次操作部件317在大的灰度级差异基础上,“暗”中处理字符像素以及“明”处理背景像素,以便明显地处理字符边缘同时消除它们的噪声分量。
其中i*=(i+1)mod 4 and i**=(i+3)mod 4
将二次操作部件317的输出输入到反向规格化部件319中,以及反向规格化部件319通过反向规格化二次处理过的字符块yN(m,n),生成输出y(m,n)。反向规格化部件319执行在规格化前,在亮度值的范围内,转换规格化字符块的像素的功能。反向规格化部件319根据下面的方程式,执行反向规格化操作
y(m,n)=yN(m,n)(μ0-μ1)+μ1 .........(9)
将从反向规格化块319输出的字符块y(m,n)施加到二进制部件140和第二阈值选择部件321。第二阈值选择部件321计算当二进制部件140将字符块的像素二进制化为字符像素和背景像素时使用的第二阈值Th2。第二阈值Th2对应于二进制部件140的阈值BTH。使用第二阈值选择部件321,因为反向规格化部件319将规格化块反向规格化回具有其原始亮度的字符块。第二阈值选择部件321使用Otsu的方法或Kapur的方法,能计算阈值BTH(或第二阈值Th2)。当使用Otsu的方法时,第二阈值选择部件321通过根据方程式(4),计算反向规格化的字符块的像素,计算阈值BTH。
图8所示的边缘增强部件130通过规格化字符块(或包含字符块的成组块)内的字符和背景像素,降低在明和暗像素间的动态范围,在规格化像素上执行二次操作以便增强字符块(或包含字符块的成组块)的边缘,以及反向规格化像素的原始灰度级范围内的规格化字符块(或包含字符块的成组块)的规格化像素。由反向规格化字符块的像素,边缘增强部件130再次计算用于二进制化字符块的像素的阈值。
同样,可以使用图10所示的改进的二次滤波器、图8的二次滤波器的改进,增强字符块(或包含字符块的成组块)的边缘。图10是示例说明使用改进的二次滤波器的边缘增强部件130的框图。
参考图10,第一阈值选择部件311计算用于将字符块的像素划分成字符像素和背景像素的第一阈值Th1。第一阈值选择部件311与图8的第一阈值选择部件311在操作方面是相同的。
平均值计算部件313在第一阈值Th1的基础上,将字符块的像素分类成字符和背景像素,并计算用于字符块的字符和背景的平均亮度值。平均值计算部件313与图8的平均值计算部件313在操作方面是相同的。
规格化部件315使用来自平均值计算部件313的用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1,规格化字符块的像素x(m,n)以便字符像素的值接近于“1”而背景像素的值接近“0”。规格化部件315与图8的规格化部件315在操作方面是相同的。
二次操作部件317使用规格化像素与它们的周围像素间的关系,执行增强边缘的功能,并降低噪声分量。图9表示由二次操作部件317处理的中心像素及它的周围像素。方程式(8)具有当二次操作部件317执行二次操作时,增强边缘和降低噪声分量的功能特性。二次操作部件317与图8的二次操作部件317在操作方面是相同的。
输出从二次操作部件317输出的规格化字符块(或包含字符块的成组块),而不经历反向规格化。因此,为生成在二进制字符块的像素中由二进制部件140使用的阈值BTHN,改进的二次滤波器中的阈值规格化部件331通过规格化由第一阈值选择部件311计算的第一阈值Th1,生成第二阈值Th2。第二阈值Th2用作用于由二进制部件140,用于字符块像素的二进制操作的阈值BTHN。
阈值规格化部件331使用等于规格化部件315的规格化方法的方法,规格化第一阈值Th1。阈值规格化部件331根据下面的方程式(10),规格化第一阈值Th1,以便产生第二阈值Th2(或阈值BTHN)。
在方程式(10)中,Th2表示用于允许二进制部件140区分字符和背景像素的规格化阈值BTHN,μ0表示用于字符像素的亮度值,μ1表示用于背景像素的平均亮度值。
图10所示的边缘增强部件130通过规格化字符块(或包含字符块的成组块)内的字符或背景像素,降低动态范围,并在规格化的像素上执行二次操作以便增强字符块(或包含字符块的成组块(CB))的边缘。由于从二次操作部件317输出的字符块(或包含CB的成组块)为规格化块,因此,通过规格化第一阈值Th1,生成用于二进制字符块像素的阈值BTHN。
如上所述,在本发明的第一至第五实施例中,使用图8的二次滤波器或图10的改进的二次滤波器,能实现边缘增强部件130。使用改进的二次滤波器的边缘增强部件130执行增强边缘的功能同时解决在二进制化字符块(或包含字符块的成组块)后,出现在二进制化图像的字符的周围的黑块的缺陷。当使用改进的二次滤波器时,不执行用在二次滤波器中的反向规格化操作。因此,当使用二次滤波器时,边缘增强部件130反向规格化二次处理后的字符块(或包含字符块的成组块),同时,由反向规格化字符块(或包含字符块的成组块)计算阈值BTH。然而,当使用改进的二次滤波器时,但是,边缘增强部件130使用完整的二次处理过的规格化字符块(或包含字符块的成组块),并通过规格化第一阈值Th1,计算阈值BTHN。图11A至11C是用于执行二次滤波器(QF)和改进的二次滤波器(IQF)间的输出特性的比较的图。特别地,图11A示例说明滤波器的图像输入,图11B示例说明二次滤波后的图像,以及图11C示例说明改进的二次滤波后的图像。
当从边缘增强部件130输出字符块后,将字符块施加到二进制部件140上,以及当从边缘增强部件130输出包含字符块的成组块,将成组块施加到块分裂部件180上。接收包含字符块的成组块的块分离部件180将字符块与成组块分开。执行从分组的块中分离出字符块是用于在通过块成组部件170将与字符块有关的周围块形成一组后的图像恢复。即,块分离部件180将8×8中心块与24×24成组块分开。
将来自块分离部件180或边缘增强部件130输出的字符块输入到二进制部件140。二进制部件140从边缘增强部件130输出的阈值以便二进制字符块中的像素。输入到二进制部件140中的字符块是y(m,n)(对应于从图8的二次滤波器输出的字符块)或yN(m,n)(对应于从图10的改进的二次滤波器输出的字符块)。因此,阈值变为BTH或BTHN。
二进制部件140通过使用阈值,将所接收的字符块像素分类成字符和背景像素,执行二进制操作,并将所分类的字符和背景像素转换成两个亮度值。换句话说,二进制部件140将对应于输入字符块的阈值与字符块像素的值进行比较,如果作为比较结果,字符块像素的值等于或大于阈值,则将像素分类成字符像素,以及如果字符块像素的值小于阈值,将像素分类成背景像素。二进制部件140通过将字符像素转换成亮度值“α”执行二进制操作,以及根据分类结果,将背景像素转换成亮度值“β”。用于通过二进制部件140二进制字符块像素的方法定义如下
在等式(11)中,y(m,n)和BTH分别表示从二次滤波器输出的字符块和阈值,yN(m,n)和BTHN分别表示从改进的二次滤波器输出的字符块和阈值,以及yB(m,n)表示二进制化的字符块的像素。
二进制部件140从块分类部件120或块增长部件160接收背景块,并一起将背景块像素转换成亮度值“β”。
图12至15分别是示例说明根据本发明的第一至第四实施例的二进制过程的流程图。
现在将参考图12描述根据本发明的第一实施例的二进制操作。在步骤411确定是否接收图像。如果接收到图像(来自确定步骤411的“是”通路),过程进入步骤413,在步骤413,将所接收的图像划分成具有预定大小的块,以及将所划分的块分类成字符块和背景块。
图16是根据本发明的实施例,示例说明将输入图像划分成块以及将所划分的块分类成字符块和背景块的过程的流程图。图16示出了在图12-15的部分413中执行的操作。参考图16,在步骤611,图像划分部件211将输入图像划分成具有预定大小的块。图像由640×480像素组成,以及每个块由8×8像素组成。在这种情况下,输入图像被划分成4800块。
此后,在步骤613,将块号BN设置为0,以及在步骤615,存取具有块号BN的块。在步骤617,DCT转换部件213DCT转换所存取的块。在步骤619,能量计算部件215在DCT转换的块内计算主要DCT系数的绝对值的总和Sk,然后存储所计算的总和Sk。在这种情况下,字符块内的DCT系数的能量分布值大于背景块内的DCT系数的能量分布值。用于字符块和背景块的DCT系数的能量分布显示出图7A中所示的特性。另外,用于字符块的DCT系数的能量分布特性显示出图7B中所示的特性。因此,根据方程式(1),能计算第k块中DCT系数的绝对值的总和Sk。在这里,“k”是与BN相同的参数,并表示块号。在步骤619计算Sk后,在步骤621确定是否计算了最后一块的Sk。如果还未计算最后一块的Sk(来自确定步骤621的“否”通路),在步骤623,过程使块号增加1,然后返回到步骤615,以便重复上述操作(步骤615到621)。
通过重复步骤615至623,DCT转换部件213DCT转换各个块以及能量计算部件215在所有块上(在k=0,1,2,...,4799)执行方程式(1)的计算。在步骤625(来自确定步骤621的“是”通路),将块能量值Sk(k=0,1,2,...4799)施加到阈值计算部件217,以及阈值计算部件217总和能量值Sk(k=0,1,2,...,4799),并通过将总和的能量值除以块的总数TBN,计算平均值<Sk>。根据方程式(2),产生平均值<Sk>。平均值<Sk>变为用于将块确定为字符块或背景块的阈值Cth。
在计算阈值Cth后,执行将块分类成字符块和背景块的操作。为此目的,在步骤627,使块号BN初始化为“0”,以及在步骤629,存取具有块号BN的Sk。此后,在步骤631,分类部件219通过将块的Sk与阈值Cth进行比较,将相应的块分类成字符块或背景块。此时,如果Sk≥Cth(来自确定步骤631的“是”通路),块分类部件219在步骤633将第k块分类成字符块(CB),以及如果Sk<Cth,如等式(3)(来自确定步骤631的“否”通路),则在步骤635将第k块分类成背景块。此后,在步骤637确定所分类的块是否为最后一块。如果块#BN不是最后一块(来自确定步骤631的“否”通路),过程在步骤639使块号加1,然后返回步骤629以便重复上述操作。当全部执行上述操作时,输出块分类结果。在将图像划分成块后,将所划分的块分类成字符块和背景块。
参照图12,完成块分类之后,在步骤415,使块号BN初始化为“0”,以及在步骤417,存取块#BN。此后,在步骤419确定所存取的块#BN是否为字符块。如果存取块为背景块(来自确定步骤419的“是”通路),过程进入步骤423,其中背景块的像素共同二进制化为亮度值β。在步骤425,存储二进制化结果。此后,在步骤427确定当前二进制化的块是否为图像的最后一块。如果二进制化块不是最后一块(来自确定步骤427的“否”通路),在步骤429,过程使块号BN加1,然后返回步骤417以便重复上述操作(步骤417-427)。
然而,如果在步骤419确定存取块为字符块(来自确定步骤419的“否”通路),过程进入步骤421,其中执行用于降低字符块的噪声和增强字符块的边缘的二次滤波操作。通过图8的二次滤波器或图10的改进的二次滤波器,执行用于降低字符块的噪声和增强字符块的边缘。
现在,将描述使用图8的二次滤波器,增强字符块的边缘的操作。
首先,计算用于将字符块的像素分类成字符像素和背景像素的第一阈值Th1。第一阈值Th1用于在下一步骤中区分字符和背景像素以及规格化两种类型的区分像素。根据方程式(4),将第一阈值Th1选择为对应于两种类型的区分像素间的最大类间方差的灰度值。
其次,在第一阈值Th1的基础上,将字符块的像素分类成字符和背景像素,以及计算用于字符块的字符和背景像素的平均亮度值。在用于两个类的平均值计算的过程中,根据方程式(5),在第一阈值Th1的基础上,将字符块x(m,n)的像素划分成字符像素和背景像素,然后,根据方程式(6),计算用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1。
第三,使用来自平均值计算部件313的用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1,规格化字符块x(m,n)的像素以便字符像素的值接近于“1”而背景像素的值接近于“0”。字符块规格化方法根据方程式(7),规格化字符块x(m,n)的像素。
第四,使规格化字符块xN(m,n)经受二次操作,以便增强字符块的边缘以及降低它们的噪声分量。在二次操作过程中,在大的灰度差的基础上,“暗”处理字符像素以及“明”处理背景像素,以便清楚地处理字符边缘并同时消除它们的噪声分量。根据方程式(8),执行这一操作。
第五,通过反规格化二次处理过的字符块yN(m,n),生成输出y(m,n)。反向规格化处理在规格化前,在亮度值的范围内执行转换规格化字符块的像素的功能。根据方程式(9),执行反向规格化操作。
第六,使用在反向规格化处理中生成的字符块y(m,n),计算第二阈值Th2。第二阈值Th2对应于用于将字符块的像素二进制化为字符像素和背景像素的阈值BTH。使用Otsu的方法或Kapur的方法,能计算第二阈值Th2。当使用Otsu的方法时,通过根据下述等式(4),计算反向规格化字符块的像素,确定第二阈值Th2(或阈值BTH)。
现在,将使用图10的改进的二次滤波器,增强字符块的边缘的操作。
首先,计算用于将字符块的像素划分成字符像素和背景像素的第一阈值Th1。第一阈值计算方法与图8的第一阈值计算方法相同。
其次,在第一阈值Th1的基础上,将字符块的像素划分成字符和背景像素,然后,计算用于字符块的字符和背景像素的平均亮度值。平均亮度值计算方法与图8的平均亮度值计算方法相同。
第三,使用用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1,规格化字符块x(m,n)的像素,以便字符像素的值接近于“1”,而背景像素的值接近于“0”。规格化方法也与图8的规格化方法相同。
第四,通过使用规格化像素与它们的周围像素间的关系,执行二次操作,增强字符块的边缘以及降低字符块的噪声分量。二次操作也与图8的二次操作相同。
第五,通过规格化第一阈值Th1,计算第二阈值Th2。这是因为将规格化字符块输送到二进制部件而没有反向规格化二次处理过的字符块。如果使用图10的改进二次滤波,根据方程式(10),通过规格化第一阈值Th1,计算第二阈值Th2。
如上所述,在本发明的实施例中,能使用图8的二次滤波器或图10的改进的二次滤波器以便增强字符块的边缘。改进的二次滤波器执行增强边缘的功能同时解决在使用该二次滤波器,二进制化字符块后,出现在二进制化图像的字符的周围的黑块的缺陷。当使用改进的二次滤波器时,不执行用在该二次滤波器中的反向规格化操作。因此,当使用该二次滤波器时,反向规格化二次处理后的字符块,同时,由反向规格化的字符块,计算阈值BTH。然而,当使用改进的二次滤波器时,使用完整的二次处理后的规格化字符块,以及通过规格化第一阈值Th1,计算阈值BTHN。
在步骤421中,使用二次滤波器或改进的二次滤波器,降低字符块的噪声和增强字符块的边缘后,通过将字符块的像素与阈值BTH或BTHN比较,在步骤423执行二进制操作。在二进制处理中,如果像素值小于阈值BTH或BTHN,将相应的像素转换成用于背景像素的亮度值β,并且如果像素值大于阈值BTH或BTHN,将相应的像素转换成用于字符像素的亮度值α。即,将字符块像素的亮度值与阈值BTH进行比较,二进制化为字符像素的亮度值或背景块的像素值。在步骤425中,存储二进制化结果。然而,如果在步骤419中确定存取块为背景块,(来自确定步骤419的“否”通路)不执行边缘增强操作,以及在步骤423,将背景块的像素全部二进制化为用于背景像素的亮度值。
图17是示例说明二进制操作的流程图413,用于图12-15。参考图17,在步骤711中,二进制部件140确定所接收的块为字符块还是背景块。如果所接收的块为字符块(来自确定步骤711的“否”通路),在步骤713,二进制部件140使像素号PN初始化为“0”,然后,在步骤715,存取像素#PN。在这里,字符块的像素是由图8的二次滤波器或图10的改进的二次滤波器二次处理后的像素。此后,在步骤717,根据方程式(11),二进制部件140将所存取的像素的值与阈值进行比较。如果所存取的像素的亮度值大于或等于阈值(来自确定步骤717的“是”通路),在步骤721,将相应的像素转换成用于字符像素的亮度值α,以及如果所存取的像素的亮度值小于阈值(来自确定步骤717的“否”通路),在步骤719,将相应的像素转换成用于背景像素的亮度值β。此后,二进制部件140在步骤723确定对相应的字符块的所有像素,是否已经完成二进制处理。如果还未完成二进制处理(来自确定步骤723的“否”通路),在步骤729,二进制部件140使像素号PN加1,然后返回步骤715以便重复上述二进制操作。经过这一二进制处理,将字符块的所有像素二进制化为亮度值α或亮度值β。然而,如果在步骤711确定所接收的块为背景块(来自确定步骤711的“是”通路),二进制部件140执行步骤731至739,其中将背景块的所有像素全部转换成用于背景像素的亮度值β。
参照图12,在执行二进制操作后,在步骤427确定当前二进制化的块是否为图像的最后一块。如果当前块不是最后一块(来自确定步骤427的“否”通路),在步骤429,过程使块号BN加1,然后返回步骤417以便重复上述操作。通过重复上述操作(步骤417到427),二进制化图像的字符块和背景块。同时,如果在步骤427确定完成有关图像的最后一块的二进制,在步骤431,将图像的二进制化结果提供到二进制部件140。
现在将参考图13描述根据本发明的第二实施例的二进制操作。在第二实施例中,在步骤413,将输入图像的块分类成字符块和背景块,然后在步骤511,使字符块增长。参照图16如上所述执行块分类处理。在块分类处理中,由于字符像素间的背景的影响,会将包含字符像素的块错误地分类成背景块。因此,在步骤511的块增长处理中,增长字符块以便能将字符像素包括在字符块中。
块增长用于通过扩展字符块,使包含字符像素的背景块改变成字符块。能使用形态滤波器,实现块增长。形态滤波器使用在称为封闭操作的用于字符块的膨胀操作后的腐蚀操作,使字符块增长。封闭操作用于填充区域的内孔。通过膨胀操作,使字符块增长,将在字符块间隔离的背景块将转换成字符块,以及根据封闭操作,通过腐蚀,恢复原始块大小。其他操作与图12的第一实施例中的操作相同。
现在,将参考图14描述根据本发明的实施例的二进制操作。如果在步骤411确定接收到图像(来自确定步骤411的“是”通路),将所接收的图像划分成具有预定大小的块,然后在步骤413,分类成字符块和背景块。在参照图16的如上所述的过程中,执行块分类处理。在字符块上的二进制处理包括图8或10的边缘增强处理,以及图17的二进制处理。
如果对二进制处理,仅使用一个字符块(由8×8像素组成),确定阈值以区分背景和字符像素,由于很小的一个字符块的确定阈值与相邻字符块的阈值间的差异非常大,会发生二进制化图像的块间的不连续性。因此,在步骤521中,将所分类的字符块的每一个与其相邻的8个块形成一组,从而生成具有24×24大小的成组块。在块成组处理中,将二进制化的字符块与它们的相邻的块形成一组后,在步骤421,使扩展块的像素经受二次过滤。此后,在步骤523,使具有8×8像素大小的中心字符块与二次滤波或改进的二次滤波的成组块分开。在步骤423至429中,基于阈值BTH或BTHN,二进制化分开的字符块。其他操作与图12的第一实施例中操作相同。
现在,将参考图15,描述根据本发明的第四实施例的二进制操作。在第四实施例中,在步骤413中,将输入图像的块分类成字符块和背景块。然后在步骤511中,使字符块增长。在块分类处理中,由于字符像素间的背景的影响,会将包含字符像素的块错误地分类成背景块。因此,在步骤511的块增长处理中,使字符块增长以便能将字符像素包括在字符块中。
此后,根据块分类结果,在字符块和背景块上执行二进制处理。如果所存取的块为字符块,在步骤521中,将该字符块与其相邻的8块形成一组,从而生成具有24×24像素大小的成组块。即,如果仅使用一个字符块(由8×8像素组成),执行二进制,那么由于该字符块中的噪声,会影响二进制,因为其尺寸太小。因此,将二进制化的字符块与其相邻的8个块形成一组以便在块成组过程中,使其区域扩展,然后,在步骤421中,使在扩展的块中的像素经受二次滤波或改进的二次滤波。此后,在步骤523中,使具有8×8像素大小的中心字符块与二次滤波或改进的二次滤波成组块分开。在步骤423至429中,基于阈值BTH或BTHN,使所分开的字符块的像素二进制化。其他操作与图12的第一实施例中的操作相同。
图18是示例说明二进制方法的例子的流程图,其中,根据本发明的实施例,使用二次滤波器,实现边缘增强部件130。图18表示根据本发明的第四实施例的二进制方法,其中使用二次滤波器。图19A至19I是示例说明当在图18的过程中执行二进制时生成的图像的图。
参考图18,在步骤611中,输入部件110接收输入图像,如图19A所示。假定图像由640(列)×480(行)像素组成。在步骤613中,块分类部件120将从输入部件110接收的图19A的输入图像划分成块,分析所划分的块的像素,并将所划分的块分类成字符块和背景块。在这里,将输入图像划分成8×8像素块,然后分类成字符块和背景块,如图19B所示。在图19B中,灰色部分表示划分成字符块的区域,而黑色部分表示划分成背景块的区域。
在步骤615中,块增长部件160扩展由块分类部件120所分类的字符块,如图19C所示。在块分类处理中,由于字符像素间的背景的影响,包含字符像素的块能被错误地划分为背景块。块增长部件160使字符块增长以便扩展在错误地分类成背景块的字符块中的像素。然后,在步骤617,块增长部件160顺序地将图19C的增长的字符块输出到块成组部件170。此时,输出到块成组部件170的图像对应于图19D所示的字符块。在步骤619中,块成组部件170接收从块增长部件160输出的图19D的字符块,并将每个字符块与其相邻的8个块形成一组,生成图19E的成组块。
将图19E的成组块图像输入到边缘增强部件130中。在这里,边缘增强部件130是二次滤波器。在步骤621中,二次滤波器计算用于将每个字符块的像素分类成字符或背景像素的第一阈值Th1。使用方程式(4),能计算第一阈值Th1。在步骤623中,在第一阈值Th1的基础上,平均值计算部件313将字符块的像素分类成字符和背景像素,并根据方程式(5)和方程式(6),计算用于字符块的字符和背景像素的平均亮度值。在步骤625中,使用从平均值计算部件313输出的用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1,规格化字符块x(m,n)的像素以便字符像素的值接近于“1”,而背景像素的值接近于“0”。规格化部件315根据方程式(7),规格化字符块x(m,n)的像素。
在步骤627中,在二次操作部件317中,使规格化字符块xN(m,n)经受二次操作,以便使字符块的边缘增强,以及降低它们的噪声分量。二次操作部件317执行方程式(8)的计算。在步骤629中,反向规格化部件319反向规格化二次处理后的字符块yN(m,n),并生成输出块y(m,n)。反向规格化部件319根据方程式(9),执行在规格化前,在亮度值的范围内,转换由规格化部件315规格化的字符块的像素的功能。从反向规格化部件319输出的图像如图19F所示;以及将字符块y(m,n)施加到块分裂部件180和第二阈值选择部件321。在步骤631中,第二阈值选择部件321生成用于在二进制部件140中,将字符块的像素二进制化字符像素和背景像素的第二阈值Th2,以及第二阈值Th2变为二进制部件140的阈值BTH。
在步骤633中,块分裂部件180接收从二次滤波器输出的图19F的边缘增强的成组块,并将图19G的字符块与成组块分开。即,块分裂部件180执行仅将位于成组块的中心的字符块与成组块分开的功能。在步骤635中,二进制部件140将图19G的分开的字符块的像素与阈值BTHN进行比较,并将像素二进制化为具有第一和第二亮度值的字符和背景像素,如图19H所示。将从块分类部件120或块增长部件160输出的背景块的像素二进制化为第二亮度值。
通过重复上述操作,二进制化字符块和背景块,以及在步骤637确定对图像的所有块,是否完成二进制,在步骤639输出图19I的二进制化图像(来自确定步骤637的“是”通路)。
图20是示例说明根据本发明的实施例,二进制方法的例子的流程图,其中,使用改进的二次滤波器,实现边缘增强部件130。图20表示根据第四实施例的二进制方法,其中使用改进的二次滤波器。图21A至21G是示例说明当在图20的过程中执行二进制时生成的图像的图。
参考图20,在步骤611中,输入部件110接收如图21A所示的输入图像。假定图像由640(列)×480(行)像素组成。在步骤613中,块分类部件120将从输入部件110接收的图21A的输入图像划分成块,分析所划分的块的像素,并将所划分的块分类成字符块和背景块。在这里,将输入图像划分成8×8像素块,然后分类成字符块和背景块,如图21B所示。在图21B中,灰色部分表示划分成字符块的区域,而黑色部分表示划分成背景块的区域。
在步骤615中,块增长部件160扩展由块分类部件120划分的字符块,如图21C所示。在块分类处理中,由于字符像素间的背景的影响,会将包含字符像素的块错误地分类成背景块。块增长部件160使字符块增长以便扩展在错误地分类成背景块的字符块中的像素。然后,在步骤617中,块增长部件160顺序地将图21C的增长的字符块输出到块增长部件170。此时,输出到块成组部件170的图像对应于图21D所示的字符块。在步骤619中,块成组部件170接收从块增长部件160输出的图21D的字符块,并将字符块的每一个与其相邻的8个块形成一组,生成图21E的成组块。
图21E的成组块被输入到边缘增强部件130中。在这里,边缘增强部件130是改进的二次滤波器。在步骤621中,改进的二次滤波器计算用于将字符块的每个像素分类成字符或背景像素的第一阈值Th1。能使用方程式(4)计算第一阈值Th1。在步骤623中,平均值计算部件313在第一阈值Th1的基础上,将字符块的像素划分成字符和背景像素,并根据方程式(5)和方程式(6),计算用于字符块的字符和背景像素的平均亮度值。在步骤625中,规格化部件315使用从平均值计算部件313输出的用于字符像素的平均亮度值μ0和用于背景像素的平均亮度值μ1,规格化字符块x(m,n)的像素,以便字符像素的值接近于“1”,而背景像素的值接近于“0”。规格化部件315根据方程式(7),规格化字符块x(m,n)的像素。
在步骤627中,在二次操作部件317中,使规格化字符块xN(m,n)经受二次操作,以便增强字符块的边缘并降低它们的噪声分量。二次操作部件317执行方程式(8)的计算。在步骤711中,阈值规格化部件331使用与规格化部件315的规格化方法相同的方法,规格化第一阈值Th1。阈值规格化部件331根据方程式(10),使第一阈值Th1规格化,以便生成第二阈值Th2(或阈值BTHN)。
在步骤633中,块分裂部件180接收从二次滤波器输出的成组块,并将字符块与成组块分开。即,块分裂部件180执行仅将位于成组块的中心的字符块与成组块分开的功能。在步骤635中,二进制部件140将由块分裂部件180分开的字符块的像素与阈值BTHN比较,并将像素二进制化成具有第一和第二亮度值的字符和背景像素,如图21F所示。将从块分类部件120或块增长部件160输出的背景块的像素二进制化成第二亮度值。
通过重复上述操作,二进制化字符块和背景块,以及在步骤637确定是否完成用于图像的所有块的二进制,在步骤639中输出图21G的二进制化图像。
如上所述,用于从图像识别特性的新的预处理操作包括将图像划分成块,将所划分的块分类成字符块和背景块,仅在字符块上执行二次操作,将二次处理过的字符块二进制化成字符像素和背景像素,并将背景块的所有像素共同二进制化成背景像素。因此,即使当在不规则灯光情况下拍摄的图像上执行二进制时,通过投在其上的阴影,能提高其二进制性能。另外,将包含错误分类成背景块的字符块的块重新分类成字符块,提高块分类的可靠性。此外,可以通过将字符块与其相邻的块形成一组,提高字符块上二进制的可靠性,在成组块上执行二次操作,并在二进制处理中,将字符块与成组块分开。
尽管参考某些优选实施例,示出和描述了本发明,本领域的普通技术人员将理解到在不背离由附加权利要求书定义的本发明的精神和范围的情况下,可以在形式和细节方面做出各种改进。
Claims (20)
1.一种用于二进制化图像的设备,包括:
用于接收图像的输入部件;
用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;
边缘增强部件,用于使用由所述块分类部件分类的字符块中相邻像素间的关系,增强所述字符块的边缘,以及生成用于区分所述字符块的字符像素和背景像素的阈值;以及
二进制部件,用于通过将所述字符块的像素与所述阈值进行比较,将从所述边缘增强部件输出的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从所述块分类部件输出的背景块的像素二进制化为所述第二亮度值。
2.如权利要求1所述的设备,其中,所述边缘增强部件包括:
第一阈值选择部件,用于计算用于将所述字符块的每个像素分类成字符像素或背景像素的第一阈值;
平均值计算部件,用于在所述第一阈值的基础上,将所述字符块的像素分类成字符像素和背景像素,以及计算用于所述字符块的字符像素和背景像素的平均亮度值;
规格化部件,用于使用从所述平均值计算部件输出的所述用于字符像素的平均亮度值和所述用于背景像素的平均亮度值,规格化所述字符块的像素,以便所述字符像素具有接近于“1”的值,而所述背景像素具有接近于“0”的值;
二次操作部件,用于在所规格化的字符块上执行二次操作以便增强所述字符块的边缘和降低所述字符块的噪声;
反向规格化部件,用于反向规格化二次处理的字符块并将所反向规格化的字符块提供给所述二进制部件;以及
第二阈值选择部件,用于计算用于将所反向规格化的字符块的每个像素分类成字符像素或背景像素的第二阈值,并将所述第二阈值输出为用于所述二进制部件的阈值。
3.如权利要求2所述的设备,其中,所述边缘增强部件为二次滤波器。
4.如权利要求1所述的设备,其中,所述块分类部件包括:
图像划分部件,用于将所接收的图像划分成具有预定大小的块;
离散余弦变换(DCT)转换部件,用于DCT转换从所述图像划分部件输出的块;
能量计算部件,用于计算DCT转换的块的每一个内的主要DCT系数的绝对值的和,并将所计算的和输出为相应块的能量值;
阈值计算部件,用于合计通过所述能量计算部件计算的、用于每个块的能量值,并通过将合计的能量值除以块的总数,生成阈值;以及
分类部件,用于从所述能量计算部件顺序地接收用于各个块的能量值,以及通过将所接收的能量值与所述阈值进行比较,将相应块分类成字符块或背景块。
5.如权利要求4所述的设备,其中,每个块具有8×8像素的大小,以及由下述等式计算每个块的能量值
其中,|Di k|表示第k块的第i个主要DCT系数,以及Sk表示第k块中主要DCT系数的绝对值的总和。
6.如权利要求1所述的设备,其中,所述边缘增强部件包括:
第一阈值选择部件,用于计算用于将所述字符块的每个像素分类成字符像素或背景像素的第一阈值;
平均值计算部件,用于在所述第一阈值的基础上,将所述字符块的像素分类成字符像素和背景像素,以及计算用于所述字符块的字符像素和背景像素的平均亮度值;
规格化部件,用于使用从所述平均值计算部件输出的所述用于字符像素的平均亮度值和所述用于背景像素的平均亮度值,规格化所述字符块的像素,以便所述字符像素具有接近于“1”的值,而所述背景像素具有接近于“0”的值;
二次操作部件,用于在所规格化的字符块上执行二次操作以便增强所述字符块的边缘和降低所述字符块的噪声;以及
第二阈值选择部件,用于通过规格化所述第一阈值,计算用于将像素分类成字符像素和背景像素的第二阈值,以及将作为用于所述二进制部件的所述阈值的所述第二阈值输出。
7.一种用于二进制化图像的设备,包括:
用于接收图像的输入部件;
用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;
块增长部件,用于使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;
边缘增强部件,用于使用从所述块增长部件输出的所述字符块中的相邻像素间的关系,增强字符块的边缘,并生成用于区分所述字符块的字符像素和背景像素的阈值;
二进制部件,用于通过将所述字符块的像素与所述阈值进行比较,将从所述边缘增强部件输出的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从所述块增长部件输出的背景块的像素二进制化为所述第二亮度值。
8.如权利要求7所述的设备,其中,所述块增长部件包括:
膨胀部件,用于增长字符块和将划分成背景块的、包含字符像素的块改变成字符块;以及
封闭部件,用于腐蚀所膨胀的字符块以及减除所连接的块。
9.一种用于二进制化图像的设备,包括:
用于接收图像的输入部件;
用于将所接收的图像划分成块、以及将所划分的块分类成字符块和背景块的块分类部件;
块成组部件,用于将由所述块分类部件划分的字符块与其相邻的块形成一组,从而生成成组块;
边缘增强部件,用于使用成组块中的相邻像素间的关系,增强所述字符块的边缘,并生成用于区分字符块的字符像素和背景像素的阈值;
块分裂部件,用于将所述字符块与从所述边缘增强部件输出的成组块分开;以及
二进制部件,用于通过将所分开的字符块的像素与所述阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从所述块分类部件输出的所述背景块的像素二进制化成所述第二亮度值。
10.一种用于二进制化图像的设备,包括:
用于接收图像的输入部件;
用于将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块的块分类部件;
块增长部件,用于使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;
块成组部件,用于将从所述块增长部件输出的字符块与其相邻的块形成一组,从而生成成组块;
边缘增强部件,用于使用成组块中像素间的关系,增强所述字符块的边缘,并生成用于区分所述字符块的字符像素和背景像素的阈值;
块分裂部件,用于将所述字符块与从所述边缘增强部件输出的成组块分开;以及
二进制部件,用于通过将分开的字符块的像素与所述阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将从所述块增长部件输出的背景块的像素二进制化为所述第二亮度值。
11.一种用于二进制化图像的方法,包括步骤:
接收图像;
将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块;
使用所述字符块中相邻像素间的关系,增强所述字符块的边缘,以及生成用于区分所述字符块的字符像素和背景像素的阈值;以及
通过将所述字符块的像素与所述阈值进行比较,将边缘增强的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将所分类的背景块的像素二进制化为所述第二亮度值。
12.如权利要求11所述的方法,其中,所述边缘增强步骤包括步骤:
计算用于将所述字符块的每个像素分类成字符像素或背景像素的第一阈值;
在所述第一阈值的基础上,将所述字符块的像素分类成字符像素和背景像素,以及计算用于所述字符块的字符像素和背景像素的平均亮度值;
使用所述用于字符像素的平均亮度值和所述用于背景像素的平均亮度值,规格化所述字符块的像素,以便所述字符像素具有接近于“1”的值,而所述背景像素具有接近于“0”的值;
在所规格化的字符块上执行二次操作以便增强所述字符块的边缘和降低所述字符块的噪声;
反向规格化二次处理的字符块以便在二进制步骤中,能处理所反向规格化的字符块;以及
计算用于将所反向规格化的字符块的每个像素分类成字符像素或背景像素的第二阈值,并将所述第二阈值输出为用于所述二进制步骤的阈值。
13.如权利要求12所述的方法,其中,所述边缘增强由二次滤波器执行。
14.如权利要求11所述的方法,其中,所述块分类步骤包括步骤:
将所接收的图像划分成具有预定大小的块;
离散余弦变换(DCT)转换所划分的块;
计算DCT转换的块的每一个内的主要DCT系数的绝对值的和,并将所计算的和输出为相应块的能量值;
合计为每个块计算的所述能量值,并通过将合计的能量值除以块的总数,生成阈值;以及
顺序地接收用于各个块的能量值,以及通过将所接收的能量值与所述阈值进行比较,将相应块分类成字符块或背景块。
15.如权利要求14所述的方法,其中,每个块具有8×8像素的大小,以及由下述等式计算每个块的能量值
其中,|Di k|表示第k块的第i个主要DCT系数,以及Sk表示第k块中主要DCT系数的绝对值的总和。
16.如权利要求11所述的方法,其中,所述边缘增强步骤包括步骤:
计算用于将所述字符块的每个像素分类成字符像素或背景像素的第一阈值;
在所述第一阈值的基础上,将所述字符块的像素分类成字符像素和背景像素,以及计算用于所述字符块的字符像素和背景像素的平均亮度值;
使用所述用于字符像素的平均亮度值和所述用于背景像素的平均亮度值,规格化所述字符块的像素,以便所述字符像素具有接近于“1”的值,而所述背景像素具有接近于“0”的值;
在所规格化的字符块上执行二次操作以便增强所述字符块的边缘和降低所述字符块的噪声;以及
通过规格化所述第一阈值,计算用于将像素分类成字符像素和背景像素的第二阈值,以及将所述第二阈值输出为用于所述二进制步骤的所述第二阈值。
17.一种用于二进制化图像的方法,包括步骤:
接收图像;
将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块;
使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;
使用所述字符块中的相邻像素间的关系,增强字符块的边缘,并生成用于区分所述字符块的字符像素和背景像素的阈值;
通过将所述字符块的像素与所述阈值进行比较,将边缘增强的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将所述背景块的像素二进制化为所述第二亮度值。
18.如权利要求17所述的方法,其中,所述块增长步骤包括步骤:
增长字符块和将划分成背景块的、包含字符像素的块改变成字符块;以及
腐蚀所膨胀的字符块以及减除所连接的块。
19.一种用于二进制化图像的方法,包括步骤:
接收图像;
将所接收的图像划分成块、以及将所划分的块分类成字符块和背景块;
将所分类的字符块和与其相邻的块形成一组,从而生成成组块;
使用成组块中的相邻像素间的关系,增强所述字符块的边缘,并生成用于区分字符块的字符像素和背景像素的阈值;
将所述字符块与所述边缘增强成组块分开;以及
通过将所分开的字符块的像素与所述阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将所述背景块的像素二进制化成所述第二亮度值。
20.一种用于二进制化图像的方法,包括步骤:
接收图像;
将所接收的图像划分成块,以及将所划分的块分类成字符块和背景块;
使所分类的字符块增长,以及将分类成背景块、包含字符像素的块恢复成字符块;
将所述字符块与其相邻的块形成一组,从而生成成组块;
使用成组块中像素间的关系,增强所述字符块的边缘,并生成用于区分所述字符块的字符像素和背景像素的阈值;
将所述字符块与从所述成组块分开;以及
通过将分开的字符块的像素与所述阈值进行比较,将所分开的字符块的像素二进制化为用于字符像素的第一亮度值和用于背景像素的第二亮度值,以及将所述背景块的像素二进制化为所述第二亮度值。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR6420/2003 | 2003-01-30 | ||
KR1020030006420A KR100703284B1 (ko) | 2003-01-30 | 2003-01-30 | 영상신호의 이진화 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1519770A true CN1519770A (zh) | 2004-08-11 |
CN1311394C CN1311394C (zh) | 2007-04-18 |
Family
ID=32822627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100025645A Expired - Fee Related CN1311394C (zh) | 2003-01-30 | 2004-01-30 | 用于二进制化图像的设备和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7567709B2 (zh) |
EP (1) | EP1455299A3 (zh) |
KR (1) | KR100703284B1 (zh) |
CN (1) | CN1311394C (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100418348C (zh) * | 2005-07-22 | 2008-09-10 | 株式会社东芝 | 图像处理装置和图像处理方法 |
CN101098387B (zh) * | 2006-06-29 | 2011-03-30 | 佳能株式会社 | 图像处理设备和图像处理方法 |
CN102542270A (zh) * | 2010-11-16 | 2012-07-04 | 手持产品公司 | 操作地处理彩色图像数据的方法和系统 |
CN102722881A (zh) * | 2010-11-16 | 2012-10-10 | 手持产品公司 | 可操作地处理单色图像数据的方法和系统 |
CN105335935A (zh) * | 2014-06-11 | 2016-02-17 | 富士通株式会社 | 图像处理装置和方法 |
CN102542270B (zh) * | 2010-11-16 | 2016-12-14 | 手持产品公司 | 操作地处理彩色图像数据的方法和系统 |
CN108969347A (zh) * | 2017-11-22 | 2018-12-11 | 吴庆芹 | 压力球按压压力参考系统 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4600775B2 (ja) * | 2006-04-03 | 2010-12-15 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
US7787693B2 (en) * | 2006-11-20 | 2010-08-31 | Microsoft Corporation | Text detection on mobile communications devices |
US20080187194A1 (en) * | 2007-02-05 | 2008-08-07 | Zhang Daoxian H | Cad image normalization |
JP4872860B2 (ja) * | 2007-09-13 | 2012-02-08 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置及び画像処理方法 |
JP4582200B2 (ja) * | 2008-06-03 | 2010-11-17 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像変換方法、およびコンピュータプログラム |
KR101015663B1 (ko) * | 2008-06-24 | 2011-02-22 | 삼성전자주식회사 | 문자인식장치에서의 문자인식방법 및 그 장치 |
JP5206503B2 (ja) * | 2009-03-03 | 2013-06-12 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
KR101103176B1 (ko) * | 2010-09-07 | 2012-01-04 | 영남대학교 산학협력단 | 발광 모듈의 제어 방법 및 시스템 |
JP5828649B2 (ja) * | 2011-03-09 | 2015-12-09 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びコンピュータプログラム |
CN102156868B (zh) * | 2011-03-31 | 2013-03-13 | 汉王科技股份有限公司 | 图像二值化方法和装置 |
US11055334B2 (en) * | 2011-09-23 | 2021-07-06 | Avaya Inc. | System and method for aligning messages to an event based on semantic similarity |
KR20140012391A (ko) * | 2012-07-20 | 2014-02-03 | 주식회사바텍 | X선 영상장치의 노이즈 저감화 방법 및 시스템 |
US9171204B2 (en) * | 2012-12-12 | 2015-10-27 | Qualcomm Incorporated | Method of perspective correction for devanagari text |
US9520102B2 (en) | 2013-04-29 | 2016-12-13 | International Business Machines Corporation | Text extraction from graphical user interface content |
US20150228045A1 (en) * | 2013-09-23 | 2015-08-13 | Infosys Limited | Methods for embedding and extracting a watermark in a text document and devices thereof |
JP6599672B2 (ja) * | 2015-07-17 | 2019-10-30 | 日本電産サンキョー株式会社 | 文字切り出し装置、文字認識装置、および文字切り出し方法 |
US11087448B2 (en) * | 2019-05-30 | 2021-08-10 | Kyocera Document Solutions Inc. | Apparatus, method, and non-transitory recording medium for a document fold determination based on the change point block detection |
CN111311573B (zh) * | 2020-02-12 | 2024-01-30 | 贵州理工学院 | 枝条确定方法、装置及电子设备 |
CN112699962A (zh) * | 2021-01-13 | 2021-04-23 | 福州大学 | 一种在边缘节点上部署二值化分类网络的方法 |
US20230094787A1 (en) * | 2021-09-30 | 2023-03-30 | Adobe Inc. | Utilizing machine-learning based object detection to improve optical character recognition |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4783838A (en) * | 1984-12-26 | 1988-11-08 | Konishiroku Photo Industry Co., Ltd. | Image processing method and apparatus therefor |
JPH04320160A (ja) * | 1991-04-19 | 1992-11-10 | Matsushita Electric Ind Co Ltd | 画像信号圧縮伸長装置および領域識別処理装置 |
US5212741A (en) * | 1992-01-21 | 1993-05-18 | Eastman Kodak Company | Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition |
EP0581971B1 (en) * | 1992-02-25 | 1999-08-25 | Pfu Limited | Image scanner |
JP3127676B2 (ja) * | 1993-08-24 | 2001-01-29 | 松下電器産業株式会社 | 画像処理装置及び画像処理方法 |
DE4411248C1 (de) * | 1994-03-31 | 1995-10-26 | Licentia Gmbh | Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten |
AUPN727295A0 (en) * | 1995-12-21 | 1996-01-18 | Canon Kabushiki Kaisha | Zone segmentation for image display |
JPH1056569A (ja) * | 1996-08-07 | 1998-02-24 | Riso Kagaku Corp | 画像処理方法および装置 |
FR2795205B1 (fr) * | 1999-06-15 | 2001-07-27 | Mannesmann Dematic Postal Automation Sa | Procede pour binariser des images numeriques a plusieurs niveaux de gris |
EP1117072A1 (en) | 2000-01-17 | 2001-07-18 | Koninklijke Philips Electronics N.V. | Text improvement |
JP4409713B2 (ja) | 2000-04-05 | 2010-02-03 | 富士通株式会社 | 文書画像認識装置及び記録媒体 |
JP2001291058A (ja) * | 2000-04-07 | 2001-10-19 | Fujitsu Ltd | 文字認識装置及び記録媒体 |
JP2002016800A (ja) | 2000-06-28 | 2002-01-18 | Sony Corp | 画像処理装置および方法、並びに記録媒体 |
JP4391704B2 (ja) * | 2001-01-11 | 2009-12-24 | 富士通株式会社 | 多値画像から二値画像を生成する画像処理装置および方法 |
JP2002314806A (ja) | 2001-04-11 | 2002-10-25 | Canon Inc | 画像処理方法及びその装置 |
-
2003
- 2003-01-30 KR KR1020030006420A patent/KR100703284B1/ko not_active IP Right Cessation
-
2004
- 2004-01-30 EP EP04002061A patent/EP1455299A3/en not_active Ceased
- 2004-01-30 US US10/767,061 patent/US7567709B2/en not_active Expired - Fee Related
- 2004-01-30 CN CNB2004100025645A patent/CN1311394C/zh not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100418348C (zh) * | 2005-07-22 | 2008-09-10 | 株式会社东芝 | 图像处理装置和图像处理方法 |
CN101098387B (zh) * | 2006-06-29 | 2011-03-30 | 佳能株式会社 | 图像处理设备和图像处理方法 |
CN102542270A (zh) * | 2010-11-16 | 2012-07-04 | 手持产品公司 | 操作地处理彩色图像数据的方法和系统 |
CN102722881A (zh) * | 2010-11-16 | 2012-10-10 | 手持产品公司 | 可操作地处理单色图像数据的方法和系统 |
CN102722881B (zh) * | 2010-11-16 | 2016-11-23 | 手持产品公司 | 可操作地处理单色图像数据的方法和系统 |
CN102542270B (zh) * | 2010-11-16 | 2016-12-14 | 手持产品公司 | 操作地处理彩色图像数据的方法和系统 |
CN105335935A (zh) * | 2014-06-11 | 2016-02-17 | 富士通株式会社 | 图像处理装置和方法 |
CN105335935B (zh) * | 2014-06-11 | 2018-03-16 | 富士通株式会社 | 图像处理装置和方法 |
CN108969347A (zh) * | 2017-11-22 | 2018-12-11 | 吴庆芹 | 压力球按压压力参考系统 |
Also Published As
Publication number | Publication date |
---|---|
KR20040069867A (ko) | 2004-08-06 |
EP1455299A2 (en) | 2004-09-08 |
US7567709B2 (en) | 2009-07-28 |
US20050008250A1 (en) | 2005-01-13 |
CN1311394C (zh) | 2007-04-18 |
KR100703284B1 (ko) | 2007-04-03 |
EP1455299A3 (en) | 2006-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1311394C (zh) | 用于二进制化图像的设备和方法 | |
CN1253010C (zh) | 图像压缩方法及装置、图像编码装置及图像编码方法 | |
CN1184796C (zh) | 图象处理方法和设备以及图象处理系统 | |
CN1210942C (zh) | 低成本数字彩色复印机的本底噪声消除 | |
CN1415103A (zh) | 多分辨率标签定位器 | |
CN100348014C (zh) | 图像处理装置、图像处理方法 | |
CN1214340C (zh) | 多个神经网络的成像设备和方法 | |
CN1275190C (zh) | 用于校正图像中的对象歪斜的方法和装置 | |
CN1818927A (zh) | 指纹识别方法与系统 | |
CN100345160C (zh) | 一种控制平均亮度的直方图均衡方法 | |
CN101030257A (zh) | 基于汉字特征的文档图像分割方法 | |
CN101060583A (zh) | 图像的处理装置、方法和程序、图像形成装置和记录介质 | |
CN1536526A (zh) | 用于识别图象字符的预处理设备和方法 | |
CN1658227A (zh) | 检测视频文本的方法和装置 | |
CN101032159A (zh) | 图像处理设备及其方法,图像处理程序 | |
CN1617567A (zh) | 彩色图像压缩方法和装置 | |
CN1735907A (zh) | 图像分析 | |
CN1917578A (zh) | 数据处理设备、数据处理方法及程序 | |
CN1684492A (zh) | 图像词典作成装置、编码装置、图像词典作成方法 | |
CN1874418A (zh) | 图像处理设备、图像处理方法以及图像处理程序 | |
CN1180627C (zh) | 图像编码/解码方法,图像编码装置和图像解码装置 | |
CN1195284C (zh) | 图像处理设备 | |
CN1773501A (zh) | 图像检索和形成装置、方法及程序、以及记录介质 | |
CN1588431A (zh) | 基于游程邻接图的复杂背景彩色图像中字符提取方法 | |
CN1227612C (zh) | 颜色量化方法和使用该方法的多媒体搜索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070418 Termination date: 20100130 |