CN101042735B - 图像二值化方法和装置 - Google Patents

图像二值化方法和装置 Download PDF

Info

Publication number
CN101042735B
CN101042735B CN2006100680119A CN200610068011A CN101042735B CN 101042735 B CN101042735 B CN 101042735B CN 2006100680119 A CN2006100680119 A CN 2006100680119A CN 200610068011 A CN200610068011 A CN 200610068011A CN 101042735 B CN101042735 B CN 101042735B
Authority
CN
China
Prior art keywords
image data
pixel
binaryzation
image
gray level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006100680119A
Other languages
English (en)
Other versions
CN101042735A (zh
Inventor
郝英
李滔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Study on Ricoh software (Beijing) Co., Ltd.
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to CN2006100680119A priority Critical patent/CN101042735B/zh
Publication of CN101042735A publication Critical patent/CN101042735A/zh
Application granted granted Critical
Publication of CN101042735B publication Critical patent/CN101042735B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种用于对文档图像进行二值化的图像二值化方法和装置。该图像二值化方法包括以下步骤:a)针对所述文档图像的灰度图像数据,计算所述文档图像的图像复杂度,并且根据算出的图像复杂度,将所述文档图像分为简单类别或复杂类别;以及b)当所述文档图像为简单类别时,通过全局分割方法二值化所述灰度图像数据,而当所述文档图像为复杂类别时,通过复合分割方法二值化所述灰度图像数据,从而生成二值化图像数据。通过该图像二值化方法,可以达到更好的图像二值化结果。

Description

图像二值化方法和装置
技术领域
本发明涉及图像处理领域,具体来说涉及一种对文档图像进行二值化的图像二值化方法和装置。
背景技术
文档是当前社会的主要信息载体。文档图像一般由文本、表格、线条以及图片构成,并且由于文档图像的信息本质上是二值信息,因此理想条件下,可以将其用单一的前景和背景来表示,比如用白色表示背景,黑色表示有用信息,即前景。然而,实际应用中,由于打印过程、不均匀的反光、文档本身内容的多样化以及各种丰富的艺术效果,图像通常前景和背景都是变化的。文档图像二值化的目的就是从无用信息中将有用信息分离出来,并将结果表示为一幅二值图像。
图像二值化在诸如文档图像处理、文档管理以及文档的分析和识别等很多应用中是必要的步骤,并且在现有技术中已经提出了各种图像二值化方法。例如,美国专利5,452,107提出了一种根据原始图像局部区域的密度,包括目标像素和周围像素的平均值,来确定二值化阈值的方法。该方法的缺陷是局部只能提供有限的信息。
另外,美国专利6,587,576提出了一种图像分割方法,根据图像的二维直方图对输入文档图像的灰度进行量化。该方法假定图像的背景灰度在直方图中可聚类为一个类别。然而,该假定并不对所有的文档图像都成立。
美国专利6,738,496提出了一种结合局部背景的分割和拉普拉斯边缘增强的二值化方法。只有当当前像素超过两个阈值的时候才将该像素设为“on”。这种方法在大字符、低对比度和反色字的情况下将会失效。
美国专利6,842,541利用颜色信息来辅助二值化过程。不同颜色通道内的多个分割结果最终被结合为一个全局的更好的二值化结果。
另外,请参阅以下文献,以获得相关图像二值化技术的信息:
N.Otsu.“A threshold selection method from grey-level histograms,”IEEETrans.Syst.,Man,Cybern.,vol.SMC-1,pp.62-66,Jan.1979;和
J.Sauvola,M.,“Adaptive document image binarization”,PatternRecognition,Vol.33,pp.225-236,2000。
发明内容
本发明的目的在于针对图像,特别是文档图像的二值化进行改进。
为了实现上述目的,根据本发明的一个方面,提供了一种对文档图像进行二值化的图像二值化方法,其包括以下步骤:a)针对所述文档图像的灰度图像数据,计算所述文档图像的图像复杂度,并且根据算出的图像复杂度,将所述文档图像分为简单类别或复杂类别;以及b)当所述文档图像为简单类别时,通过全局分割方法二值化所述灰度图像数据,而当所述文档图像为复杂类别时,通过复合分割方法二值化所述灰度图像数据,从而生成二值化图像数据。
根据本发明的另一方面,提供了一种用于对文档图像进行二值化的图像二值化装置,包括:图像分类单元,用于针对所述文档图像的灰度图像数据,计算所述文档图像的图像复杂度,并且根据算出的图像复杂度,将所述文档图像分为简单类别或复杂类别;全局分割单元,用于当所述文档图像为简单类别时,通过全局分割方法二值化所述灰度图像数据,从而生成二值化图像数据;以及复合分割单元,用于当所述文档图像为复杂类别时,通过复合分割方法二值化所述灰度图像数据,从而生成所述二值化图像数据。
其中通过复合分割方法二值化所述灰度图像数据包括以下步骤:通过全局分割方法,将所述灰度图像数据中的每个像素分为3类:黑色、白色和未确定;通过局部自适应分割方法,为每个属于未确定类别的像素计算最优分割阈值,从而二值化所述像素。
在本发明中,首先利用图像的复杂度度量将输入图像分为简单和复杂两种类别。对于简单图像,使用全局化的方法进行分割;对于复杂图像,则结合全局以及局部信息、使用复合分割方法为每个像素确定各自的分割阈值,从而达到更好的图像二值化结果。
附图说明
通过结合附图对本发明的优选实施例进行详细描述,本发明的上述和其它目的、特性、优点将会变得更加清楚,其中:
图1示出了根据本发明的图像二值化方法的流程图;
图2示出了图1中的预处理步骤的示例性流程图;
图3示出了图1中的复合分割步骤的示例性流程图;
图4示出了一个文档图像直方图以及对应的全局分割阈值A、A’、B、C和C’;
图5描述了在图1的复合分割步骤中使用的局部自适应分割方法的示例性流程图;
图6示出了图1中的后处理单元的示例性流程图;
图7给出了一个文档图像的例子以及分别使用全局分割方法和局部自适应分割方法的二值化结果;
图8描述了整个图像二值化系统的结构;以及
图9示意性地示出了根据本发明的图像二值化装置的方框图。
具体实施方式
在本文中,全局分割方法是指利用相同的阈值分割整幅图像,而局部自适应分割方法是指对图像中的每个像素确定单独的分割阈值。如果整个图像中的文字以及其他有用信息的灰度都是一致的,则可以使用全局分割方法对整个图像进行分割。然而,由于许多图像中存在不同区域之间的不一致性,单一的分割阈值难以取得好的分割结果。在这种情况下需要使用局部自适应分割方法对不同的像素确定不同的分割阈值。
下面参考附图来详细描述根据本发明的图像二值化方法和图像二值化装置。
参考图1,本发明提出的图像二值化方法的流程图以原始文档10为输入,并且以最终的二值图像16为输出。首先,在可选的预处理步骤11中,完成二值化处理所需的数据准备工作,例如在需要的情况下对文档10进行数字化,如果文档图像为彩色图像,还需将其转换为灰度图像,以及对灰度图像数据进行低通滤波、背景的去除。然后,在图像分类步骤12中,针对灰度图像数据,计算文档图像的图像复杂度例如Otsu判据(OC)和Fisher判据(d’)等,并且根据算出的图像复杂度,将文档图像分为“简单”和“复杂”两种类别,其中“简单”意味着图像基本是由黑色的文字和白色背景构成,否则图像被认为是复杂的。每一类图像使用不同的二值化方法来处理。对于简单图像,在全局分割步骤13中采用全局分割方法(例如,Otsu方法,Kittler方法,基于熵的分割方法,以及任何其它基于直方图的分割方法)进行二值化;另一方面,对于复杂图像,则在复合分割步骤14中使用一种更精细的方法即组合全局分割方法和局部自适应方法的复合分割方法进行处理。最后,在可选的后处理步骤15中,对在步骤13或14中输出的二值图像进行噪声的去除。通常来说有三种噪声:相邻字符(笔画)的相连、字符(笔画)的断裂以及单独的噪声点。通过后处理可以去除大量的此类噪声。经过这些处理,文档10中的基本信息被保存在二值图像16中。此二值图像可以用于多种应用,例如字符的颜色检测、文档版面分析,光学字符识别等。具体每个步骤处理的细节将在下文中进行详细的介绍。
参考图2,预处理步骤11完成对文档图像的一系列图像处理操作。由于原始文档10可以是一个电子文档或者是一个物理的纸质文档。对于后一种情况需要使用光学扫描设备,例如扫描仪、传真机,或者是数码相机将物理文档转换为电子文档图像(步骤111)。根据具体使用的扫描设备不同,数字化后的图像可能是彩色的也可能是灰度的。对于彩色图像,需要在步骤112中将其转换为灰度图像以便后续处理。该灰度信息可能是自原始彩色图像的亮度,也可以是某个指定的颜色通道。此外,根据具体的应用环境不同,有时需要在步骤113中使用低通滤波来去除图像中的噪声,以便提高输入图像的质量,然后在步骤114中将输入图像分为固定大小的方块,根据每个方块内图像灰度的变化判断其是否为背景。例如,如果方块内像素的最大和最小灰度值之差小于一个很小的阈值,这意味着该块内的像素灰度非常均匀,则将该块认为是背景并从输入图像中去除。剩下的区域构成的子图像成为二值化操作的目标区域。此方法保证了对分割阈值的更准确估计。这一步中,也可以根据方块内的方差作为背景的判据。显然地,在预处理步骤11中,步骤111、112、113均为可选的。
在图像分类步骤12中,针对文档图像的灰度图像数据,计算文档图像的图像复杂度,其中优选地采用以下两种图像复杂度度量:一个是Otsu判据(OC),另一个是Fisher判据(d’)。下面详细描述计算这两种度量的具体过程。
首先,根据图像的灰度分布确定分割阈值T,其中阈值T优选地由Otsu算法计算得到。但是原则上,它可以用任何全局分割算法获得。
然后,根据阈值T按下面公式(1)和(2)计算Otsu判据和Fisher判据:
OC = arg max T P ( T ) [ 1 - P ( T ) ] [ m b ( T ) - m f ( T ) ] P ( T ) σ b 2 ( T ) + [ 1 - P ( T ) ] σ f 2 ( T ) - - - ( 1 )
d ′ = m b ( T ) - m f ( T ) σ 2 b ( T ) + σ 2 f ( T ) - - - ( 2 )
其中将图像中灰度小于或等于T的像素子集标记为SetA,将灰度高于T的像素子集标记为SetB,P(T)为给定一个像素属于SetA的概率,mf(T)为SetA中像素的灰度均值,mb(T)为SetB中像素的灰度均值,σf(T)为SetA中像素的标准差,σb(T)为SetB中像素的标准差。
接下来,如果OC大于预设阈值TOC或者d’大于预设阈值Td’,则图像被认为是简单的,否则被认为是复杂的。
如果输入图像被认为是简单图像,在全局分割步骤13中采用全局分割方法对文档图像的灰度图像数据进行二值化,从而得到一个较快的分割速度。这里,步骤13中使用的优选地是步骤12中给出的Otsu分割阈值T,但是根据具体应用可以换为任何其他的全局分割方法。
如果输入图像被认为是复杂图像,则在复合分割步骤14中采用组合全局分割方法和局部自适应分割方法的复合分割方法进行分割,具体地说,首先,采用全局分割方法,将像素分为三种类别:黑色(0)、白色(255)和未确定。通常图像中的大部分像素将被划入黑色和白色两种类别,剩下的未确定的像素将用局部自适应分割方法进行分割。由于通常局部自适应分割方法的计算量远大于全局分割方法,因此这种复合分割策略在保证分割质量的同时将大大提高二值化的速度。下面将结合图3的流程图详细描述复合分割步骤14的处理的一个优选实施例。
首先,在步骤140中,从文档图像的灰度图像数据当中选择一个位于图像最大和最小灰度之间的阈值B,然后在最小灰度和B之间选择一个小于B的阈值A,同时在B和最大灰度之间选择一个大于B的阈值C。根据本发明的一个可能实现是重复使用基于直方图的方法如Otsu方法选择A,B,C,其中A≤B≤C。
由于文档图像处理系统常常需要处理扫描的打印文档,此类文档通常会有半调效果。我们注意到半调效果在直方图上通常表现出一种类似高斯的分布。受此启发,在步骤141中调整阈值A和C,确保其落在直方图中相邻的波谷中。图4给出了最后的全局分割阈值的示例,其中调整后的阈值A和C用A’和C’表示。显然地,在复合分割步骤14中,步骤141是优选的,而不是必需的。
在步骤142中,所有灰度小于A’的像素均被标记为黑色(0),同样灰度大于C’的像素均被标记为白色(255)。
需要指出的是,这里我们并不区分前景和背景(前景指图像中承载信息的部分,例如字符、表格等,背景指用户并不关心其内容的部分)。这提供了我们的方法处理反色字符或表格区域的能力。
所有灰度位于阈值A’和C’之间的像素被认为是未确定像素。由于难以通过分析图像的直方图来确定此类像素的类别属性,因此这里使用了一种局部自适应分割方法。在局部自适应分割步骤143中,通过提取局部信息并结合相邻像素的历史分割阈值信息确定该像素的最优分割阈值。在本发明中,历史分割阈值信息是非常重要的,使用该信息可使二值化的效果得到大幅的提升。
通常说来,根据前景和背景的灰度分布可将文字区域分割正常文字和反色字。在理想情况下,对于正常文字,分割阈值应该大于文字笔画的最高灰度,同时小于背景像素的最小灰度;同样地,对于反色字的最优分割阈值应该小于文字笔画的最低灰度同时高于背景的最大灰度。然而在低对比度同时有噪声出现的情况下上面的规则一般不成立。因此,在自适应分割过程中,以当前像素为中心确定一个局部窗口,局部窗口被分为三种情况:正常文字、反色字和低对比度区域,对三种情况采用不同的方法计算阈值作为当前像素的分割阈值。在图5中给出了局部自适应分割处理的流程。首先,在步骤1430中,使用与步骤140相同的方法作用于当前窗口获得三个阈值A1,B1和C1,并且在步骤1431中,计算局部窗口内的均值m和标准差std。然后,在步骤1432中,根据算出的均值m、标准差std和所获得的A1,B1和C1,将该窗口分为上述的三种类别,具体地说,若均值m小于B1,则是反色字;若标准差std小于一个阈值,且当前局部窗口内小于A1和大于C1的像素数目大于另一个阈值,则属于低对比度;其他情况,属于正常文字。最后,在步骤1433中,使用下面的公式计算像素(x,y)的分割阈值T(x,y):
T(x,y)=m*[1-(k1*std+k2*T(x-1,y))/R](3)
这里的k1、k2和R根据类别的不同而选用不同的参数。
阈值化过程从全局分割步骤142的结果开始,依次确定每个像素的分割阈值。当前处理的像素成为目标像素。如果目标像素已经是二值的,即已经被前面的步骤给出了标记0或255,则继续处理下面的像素。否则利用公式(3)计算目标像素的阈值。此外,如果当前像素为该行的第一个像素且并非二值的,由于这里并没有历史阈值信息,此时令k2=0。
在公式(3)中,目标像素的阈值由局部灰度信息以及上一个像素的阈值共同确定,并且其中的参数可以针对具体的应用进行优化。例如,如果二值图像用于OCR应用场合,则参数需要选择来使OCR的字符识别率达到最高。阈值选定后,如果目标像素的灰度值高于阈值,则标记为255,否则标记为0。
然后,下一个像素被选为目标像素并重复上述的过程,直至所有像素均被二值化。
图6给出了可选的后处理步骤15的示例性流程,其中的处理包含若干个循环。是否要继续循环取决于当前循环的结果。该后处理方法可以有效地消除噪声。后处理单元从全局分割步骤13或复合分割步骤14得到的二值化图像开始。在每次循环中,统计在以当前像素为中心的局部窗口内与该像素标记(0或255)相同的像素个数N(步骤151,152),这里局部窗口大小可以由图像的分辨率决定。如果N小于一个设定的阈值TN,则改变当前像素类别(0变为255或255变为0)(步骤153,154),其中阈值TN也可以由图像的分辨率决定,另外,阈值TN可以随每次循环而变化。如果在当前循环中改变类别的像素数目足够小,即小于一个设定的阈值TC,这意味着图像中已经没有明显的噪声点,这时循环停止。或者,如果循环的次数超过了指定的数值,同样要将该循环停止以阻止过度的平滑(步骤155)。作为一种可能变形,后处理步骤15中的循环次数也可以是固定的,而与在当前循环中改变类别的像素数目无关。
图7给出了通过复合分割方法进行二值化的一个例子,其中A是原始图像,B是经过步骤142后的结果,其中灰色像素代表未确定类别的像素,而C是后处理后的最终输出的二值化图像。
图8示出了整个二值化系统的结构。单元1是根据本发明的图像二值化模块;单元2是编辑模块,其用于在不同的应用情况下编辑二值化的处理流程和参数;处理器用于完成二值化的计算工作;内存用于存储图像数据和处理的中间数据。
下面参考附图描述根据本发明的图像二值化装置。
图9示意性地示出了根据本发明的图像二值化装置的方框图。如图9所示,根据本发明的图像二值化装置可以包括:预处理单元91(可选)、图像分类单元92、全局分割单元93、复合分割单元94、以及后处理单元95(可选)。预处理单元91用于完成二值化处理所需的数据准备工作,例如在需要的情况下对文档90进行数字化,如果文档图像为彩色图像,则需将其转换为灰度图像,以及对灰度图像数据进行低通滤波、背景的去除。图像分类单元92用于针对灰度图像数据,计算文档图像的图像复杂度例如Otsu判据(OC)和Fisher判据(d′)等,并且根据算出的图像复杂度,将文档图像分为“简单”和“复杂”两种类别。全局分割单元93用于当文档图像为简单类别时,通过全局分割方法二值化文档图像的灰度图像数据。复合分割单元94用于当文档图像为复杂类别时,通过复合分割方法二值化文档图像的灰度图像数据。后处理单元95用于对由全局分割单元93或复合分割单元94输出的二值图像进行噪声的去除,以生成最终的二值图像96。
本领域的技术人员知道,本发明的图像二值化装置和方法可以通过仅软件、仅硬件和/或软件与硬件相结合的方式来实现,因此,其实现方式不对本发明的技术范围构成限制。
另外,本发明的方法不限于按照说明书中所描述的时间顺序来执行,也可以按照其它的时间循序,或并行或独立地执行,因此,本发明中描述的方法的执行顺序不对本发明的技术范围构成限制。
尽管以上参照具体实施例对本发明进行了详细的描述,但是本领域的技术人员知道,在不脱离本发明的精神和范围的情况下,可以对本发明的实施例做出各种修改、替换和变更。

Claims (22)

1.一种对文档图像进行二值化的图像二值化方法,包括以下步骤:
a)针对所述文档图像的灰度图像数据,计算所述文档图像的图像复杂度,并且根据算出的图像复杂度,将所述文档图像分为简单类别或复杂类别;
b)当所述文档图像为简单类别时,通过全局分割方法二值化所述灰度图像数据,而当所述文档图像为复杂类别时,通过复合分割方法二值化所述灰度图像数据,从而生成二值化图像数据,
其中通过复合分割方法二值化所述灰度图像数据包括以下步骤:
通过全局分割方法,将所述灰度图像数据中的每个像素分为3类:黑色、白色和未确定;
通过局部自适应分割方法,为每个属于未确定类别的像素计算最优分割阈值,从而二值化所述像素。
2.根据权利要求1所述的图像二值化方法,其中在步骤a)之前还包括以下步骤:
对物理文档进行数字化,以获得所述文档图像。
3.根据权利要求1所述的图像二值化方法,其中在步骤a)之前还包括以下步骤:
如果所述文档图像为彩色图像,则将其转换为灰度图像,以获得所述灰度图像数据。
4.根据权利要求1所述的图像二值化方法,其中在步骤a)之前还包括以下步骤:
对所述灰度图像数据进行低通滤波,以去除其中的图像噪声。
5.根据权利要求1所述的图像二值化方法,其中在步骤a)之前还包括以下步骤:
通过将所述灰度图像数据分为固定大小的方块,并且根据每个方块内的图像灰度变化判断其是否为背景,然后对所述灰度图像数据进行图像背景去除。
6.根据权利要求1所述的图像二值化方法,其中步骤a)包括以下步骤:
根据所述灰度图像数据的灰度分布,确定分割阈值T;
根据所述分割阈值T,计算Otsu判据和Fisher判据;
如果算出的Otsu判据值大于预设阈值TO,或者算出的Fisher判据值大于预设阈值TD,则所述文档图像被认为属于简单类别,否则认为属于复杂类别。
7.根据权利要求6所述的图像二值化方法,其中所述分割阈值T由基于直方图的全局分割方法得到。
8.根据权利要求1所述的图像二值化方法,其中所述全局分割方法为基于直方图的全局分割方法。
9.根据权利要求1所述的图像二值化方法,其中通过全局分割方法将所述灰度图像数据中的每个像素分为3类包括以下步骤:
通过基于直方图的方法,在所述灰度图像数据中的最小灰度值和最大灰度值之间确定分割阈值B;
通过基于直方图的方法,在所述最小灰度值和所述分割阈值B之间确定分割阈值A;
通过基于直方图的方法,在所述分割阈值B和所述最大灰度值之间确定分割阈值C;以及
将灰度小于等于所述分割阈值A的像素标记为黑色,将灰度大于所述分割阈值C的像素标记为白色,将灰度位于所述分割阈值A和所述分割阈值C之间的像素标记为未确定。
10.根据权利要求9所述的图像二值化方法,其中在所述灰度图像数据的直方图中,分别在所述分割阈值A和所述分割阈值C的附近寻找波谷,并且将所述分割阈值A和所述分割阈值C分别调整为所述波谷对应的灰度值。
11.根据权利要求1所述的图像二值化方法,其中通过局部自适应分割方法为每个属于未确定类别的像素计算最优分割阈值包括以下步骤:
根据所述像素的局部特征,将所述像素所属的局部区域进一步分为正常文字、反色字和低对比度区域三类;
根据所述局部区域的分类结果、以及所述像素所在行的前一像素的已确定的阈值,计算所述像素的分割阈值。
12.根据权利要求1所述的图像二值化方法,其中通过局部自适应方法为每个属于未确定类别的像素计算最优分割阈值还基于具体应用而不同。
13.根据权利要求1所述的图像二值化方法,其中在步骤b)之后还包括以下步骤:
c)对所述二值化图像数据进行后处理,以去除其中的噪声。
14.根据权利要求13所述的图像二值化方法,其中对所述二值化图像数据进行后处理包括以下步骤:
d1)针对所述二值化图像数据中的每个像素,统计所述像素的局部窗口内具有相同标记的像素数目N,如果该数目N小于设定阈值TN,则将所述像素的标记取反,否则不变;
d2)重复执行步骤d1),直至循环次数达到指定的数值或者在当前循环中其标记被改变的像素数小于设定阈值TC
15.根据权利要求13所述的图像二值化方法,其中对所述二值化图像数据进行后处理包括以下步骤:
d1)针对所述二值化图像数据中的每个像素,统计所述像素的局部窗口内具有相同标记的像素数目N,如果该数目N小于设定阈值TN,则将所述像素的标记取反,否则不变;
d2)重复执行步骤d1),直至循环次数达到固定的数值。
16.根据权利要求14或15所述的图像二值化方法,其中所述局部窗口和所述设定阈值TN由所述二值化图像数据的图像分辨率决定。
17.一种用于对文档图像进行二值化的图像二值化装置,包括:
图像分类单元,用于针对所述文档图像的灰度图像数据,计算所述文档图像的图像复杂度,并且根据算出的图像复杂度,将所述文档图像分为简单类别或复杂类别;
全局分割单元,用于当所述文档图像为简单类别时,通过全局分割方法二值化所述灰度图像数据,从而生成二值化图像数据;以及
复合分割单元,用于当所述文档图像为复杂类别时,通过复合分割方法二值化所述灰度图像数据,从而生成所述二值化图像数据,
其中通过复合分割方法二值化所述灰度图像数据包括以下步骤:
通过全局分割方法,将所述灰度图像数据中的每个像素分为3类:黑色、白色和未确定;
通过局部自适应分割方法,为每个属于未确定类别的像素计算最优分割阈值,从而二值化所述像素。
18.根据权利要求17所述的图像二值化装置,还包括:
预处理单元,用于对物理文档进行数字化,以获得所述文档图像。
19.根据权利要求17所述的图像二值化装置,还包括:
预处理单元,用于如果所述文档图像为彩色图像,则将其转换为灰度图像,以获得所述灰度图像数据。
20.根据权利要求17所述的图像二值化装置,还包括:
预处理单元,用于对所述灰度图像数据进行低通滤波,以去除其中的图像噪声。
21.根据权利要求17所述的图像二值化装置,还包括:
预处理单元,用于通过将所述灰度图像数据分为固定大小的方块,并且根据每个方块内的图像灰度变化判断其是否为背景,然后对所述灰度图像数据进行图像背景去除。
22.根据权利要求17所述的图像二值化装置,还包括:
后处理单元,用于对所述二值化图像数据进行后处理,以去除其中的噪声。
CN2006100680119A 2006-03-23 2006-03-23 图像二值化方法和装置 Expired - Fee Related CN101042735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100680119A CN101042735B (zh) 2006-03-23 2006-03-23 图像二值化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100680119A CN101042735B (zh) 2006-03-23 2006-03-23 图像二值化方法和装置

Publications (2)

Publication Number Publication Date
CN101042735A CN101042735A (zh) 2007-09-26
CN101042735B true CN101042735B (zh) 2010-11-17

Family

ID=38808236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100680119A Expired - Fee Related CN101042735B (zh) 2006-03-23 2006-03-23 图像二值化方法和装置

Country Status (1)

Country Link
CN (1) CN101042735B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008384B (zh) * 2013-02-26 2017-11-14 山东新北洋信息技术股份有限公司 字符识别方法和字符识别装置
CN104417490B (zh) * 2013-08-29 2017-12-26 同观科技(深圳)有限公司 一种汽车安全带检测方法及装置
CN105447491A (zh) * 2014-07-25 2016-03-30 北京大学深圳研究生院 标识牌图像二值化方法及其装置
CN104200462B (zh) * 2014-08-04 2017-05-17 深圳市新良田科技股份有限公司 去除图文并茂文档中底色的方法
CN106157250B (zh) * 2015-03-26 2019-03-01 富士通株式会社 去除文档图像中的印记的方法和设备
JP2017073764A (ja) * 2015-10-08 2017-04-13 株式会社リコー 画像処理装置、画像処理方法、及び、プログラム
CN105335967B (zh) * 2015-10-16 2018-07-03 中国人民解放军国防科学技术大学 基于局部最大类间方差和数学形态学的手背静脉纹路提取方法
CN105678773B (zh) * 2016-01-12 2018-10-26 西北工业大学 一种低对比度图像分割方法
CN106127765A (zh) * 2016-06-23 2016-11-16 成都神州数码索贝科技有限公司 基于自适应窗口和平滑阈值法的图像二值化系统
CN106127763A (zh) * 2016-06-23 2016-11-16 成都神州数码索贝科技有限公司 一种具有广泛适应性的图像二值化方法
CN106384114B (zh) * 2016-09-22 2019-09-27 哈尔滨理工大学 一种基于支持向量机的自适应图像二值化方法
CN106529543B (zh) * 2016-11-02 2018-09-11 徐庆 一种动态计算多色级二值化自适应阈值的方法及其系统
CN106651860B (zh) * 2016-11-02 2019-07-09 帝麦克斯(苏州)医疗科技有限公司 一种图像分割方法及装置
CN107194385A (zh) * 2017-07-17 2017-09-22 陈剑桃 一种智能车牌识别系统
CN107610132B (zh) * 2017-08-28 2021-12-31 西北民族大学 一种古籍文档图像污渍去除方法
CN107816948B (zh) * 2017-09-27 2018-11-16 江苏亿鑫齿轮制造有限公司 冰层厚度检测触发系统
CN107945200B (zh) * 2017-12-14 2021-08-03 中南大学 图像二值化分割方法
CN111882574A (zh) * 2018-04-17 2020-11-03 芜湖岭上信息科技有限公司 一种视频监控设备获得图像的前景分割方法和装置
CN109410215A (zh) * 2018-08-02 2019-03-01 北京三快在线科技有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN111325199B (zh) * 2018-12-14 2023-10-27 中移(杭州)信息技术有限公司 一种文字倾斜角度检测方法及装置
CN110008954B (zh) * 2019-03-29 2021-03-19 重庆大学 一种基于多阈值融合的复杂背景文本图像提取方法及系统
CN111162897A (zh) * 2019-12-25 2020-05-15 杭州安司源科技有限公司 一种基于摄像头的移动端真随机数快速生成方法
CN111583157B (zh) * 2020-05-13 2023-06-02 杭州睿琪软件有限公司 图像处理方法、系统及计算机可读存储介质
CN112653885B (zh) * 2020-12-10 2023-10-03 上海连尚网络科技有限公司 视频重复度获取方法、电子设备及存储介质
CN115205246B (zh) * 2022-07-14 2024-04-09 中国南方电网有限责任公司超高压输电公司广州局 换流阀电晕放电紫外图像特征提取方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1420472A (zh) * 2001-11-21 2003-05-28 松下电器产业株式会社 彩色文献图像的自适应二值化方法和设备
JP2004180000A (ja) * 2002-11-27 2004-06-24 Kansai Tlo Kk 画像の2値化装置および方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1420472A (zh) * 2001-11-21 2003-05-28 松下电器产业株式会社 彩色文献图像的自适应二值化方法和设备
JP2004180000A (ja) * 2002-11-27 2004-06-24 Kansai Tlo Kk 画像の2値化装置および方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JP特开2004180000A 2004.06.24
庄军,李弼程,陈刚.一种有效的文本图像二值化方法.微计算机信息21 8.2005,21(8),56,57,124.
庄军,李弼程,陈刚.一种有效的文本图像二值化方法.微计算机信息21 8.2005,21(8),56,57,124. *

Also Published As

Publication number Publication date
CN101042735A (zh) 2007-09-26

Similar Documents

Publication Publication Date Title
CN101042735B (zh) 图像二值化方法和装置
CN109977943B (zh) 一种基于yolo的图像目标识别方法、系统和存储介质
RU2708422C1 (ru) Способ и система управления банкоматами
CN106096610B (zh) 一种基于支持向量机的文档图像二值化方法
US7570816B2 (en) Systems and methods for detecting text
CN104766076B (zh) 一种视频图像文字的检测方法和装置
CN107038416B (zh) 一种基于二值图像改进型hog特征的行人检测方法
CN108121966A (zh) 一种基于ocr技术的表单自动录入方法、电子设备和存储介质
CN106846011A (zh) 营业执照识别方法和装置
CN104915972A (zh) 图像处理装置、图像处理方法以及程序
US10803116B2 (en) Logo detection system for automatic image search engines
JP6649174B2 (ja) 分類器の分類結果を改善する方法
US20140286527A1 (en) Systems and methods for accelerated face detection
CN109886335A (zh) 分类模型训练方法及装置
CN104008384A (zh) 字符识别方法和字符识别装置
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
Ayatollahi et al. Persian heritage image binarization competition (PHIBC 2012)
CN106529543A (zh) 一种动态计算多色级二值化自适应阈值的方法及其系统
CN100479484C (zh) 文档图像二值化方法
Biswas et al. A global-to-local approach to binarization of degraded document images
CN115082776A (zh) 一种基于图像识别的电能表自动检测系统及方法
CN115033721A (zh) 基于大数据的图像检索方法
CN104834926A (zh) 一种字符区域提取方法及系统
CN111199228B (zh) 一种车牌定位的方法及装置
CN116958113A (zh) 一种产品检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: RICOH SOFTWARE RESEARCH INSTITUTE (BEIJING) CO., L

Effective date: 20120118

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120118

Address after: Tokyo, Japan, Japan

Co-patentee after: Study on Ricoh software (Beijing) Co., Ltd.

Patentee after: Ricoh Co., Ltd.

Address before: Tokyo, Japan, Japan

Patentee before: Ricoh Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101117

Termination date: 20160323