CN100442308C - 文档图像的二值化方法和设备 - Google Patents

文档图像的二值化方法和设备 Download PDF

Info

Publication number
CN100442308C
CN100442308C CNB2005101287974A CN200510128797A CN100442308C CN 100442308 C CN100442308 C CN 100442308C CN B2005101287974 A CNB2005101287974 A CN B2005101287974A CN 200510128797 A CN200510128797 A CN 200510128797A CN 100442308 C CN100442308 C CN 100442308C
Authority
CN
China
Prior art keywords
pixel
edge
file
picture
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005101287974A
Other languages
English (en)
Other versions
CN1979526A (zh
Inventor
马小勇
胥立丰
游亚平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CNB2005101287974A priority Critical patent/CN100442308C/zh
Publication of CN1979526A publication Critical patent/CN1979526A/zh
Application granted granted Critical
Publication of CN100442308C publication Critical patent/CN100442308C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)

Abstract

本发明公开了一种文档图像的二值化方法和装置。根据本发明的二值化方法包括步骤:将文档图像的图像像素分类为在边缘附近的前景像素和除前景像素之外的其它像素;将前景像素设置为黑色;以及将除前景像素之外的其它像素分类为黑色和白色。

Description

文档图像的二值化方法和设备
技术领域
本发明通常涉及图像处理。特别地,本发明涉及文档图像的二值化方法、文档图像的二值化装置、及其计算机程序和存储介质。
背景技术
文档的二值化通常是大多数文档分析系统进行的第一步。例如,现有的光学字符识别(OCR)系统要求在文本被处理前必须将其二值化。二值信息的使用降低了计算负载并且使得运用与灰度等级或色彩图像信息相比更简化的分析方法的使用成为可能。
已经提出了许多用于二值化文档图像的全局或局部阈值方法。全局阈值使用单个的阈值来二值化整个图像,但是这在很多情况,例如,对于具有复杂布局或亮度不均匀的文档都受到限制。局部阈值方法将原始图像分割为固定尺寸的小窗口(重叠的或不重叠的),并对每个窗口使用局部特征来计算阈值。应用阈值平滑技术来消除窗口边界之间可能存在的不平滑。
例如,日本专利申请公开文本No.JP-A-2000-20714公开了一种图像处理方法、及其装置和存储图像处理功能的记录介质。
图8示出了上述日本专利申请所公开的图像处理方法的流程图。为了获得即使在背景图像上也不具有影响识别的噪音的二值图像,将要进行阈值处理的原始图像的灰度图像在步骤S81中输入,并在步骤S82中存储。而后,在步骤S83中,关注特定的像素,并且判断所述像素是否是一个字符的边缘或者是否是格线。此后,在步骤S84,确定并存储被判断为边缘的像素在二值图像上的像素值。在步骤S85对原始图像上的所有像素重复这些操作并且在步骤S86找到非边缘的像素的所有连接分量。而后,在步骤S87,关注与某一连接分量的外围接触的并且已经具有确定的像素值的像素,并且分别计算黑色像素的数量和白色像素的数量。在步骤S88中互相比较黑色和白色像素的数量,并且当黑色像素的数量更大,则在步骤S90登记整个连接分量为黑色像素。在另一种情况下,则在S89登记整个连接分量为白色像素。在步骤S91,为所有连接分量重复上述操作,并且最后在步骤S92生成二值图像,并在步骤S93输出该二值图像。
然而,对于高速扫描仪,必须简化阈值方法,并且必须提供高质量的二值图像。但是传统的全局和局部阈值方法不能满足高速扫描仪的这些需要。另外,对于阈值方法为用户提供用户接口来调节参数,从而获得用户期望的二值图像也是很重要的。
发明内容
因此,本发明的目的在于提供一种用于文档图像的新的简单二值化方法和设备,它可以提供用于调节参数的用户接口。
为了实现上述目的,根据本发明的一个方面,提供一种文档图像的二值化方法,包括:为文档图像的每个像素计算梯度的梯度计算步骤;基于所计算的梯度为文档图像计算边缘阈值的边缘阈值计算步骤;计算文档图像的全局二值化阈值的全局二值化阈值计算步骤,该全局二值化阈值用于将文档图像的像素分类为黑色和白色;基于为每个像素所计算的梯度和所计算的边缘阈值确定文档图像的每个像素是否是边缘像素的边缘确定步骤;基于每个边缘像素的N个相邻像素的灰度值为所确定的边缘像素中的每一个计算局部二值化阈值的局部二值化阈值计算步骤;基于为每个边缘像素的N个相邻像素计算的局部二值化阈值将该N个相邻像素中的像素分类为前景像素和背景像素的第一分类步骤;将前景像素设置为黑色的设置步骤;以及基于全局二值化阈值将除前景像素之外的其它像素分类为黑色和白色的第二分类步骤。
为了实现上述目的,根据本发明的另一方面,提供一种文档图像的二值化设备,包括:梯度计算装置,用于为文档图像的每个像素计算梯度;边缘阈值计算装置,用于基于所计算的梯度为文档图像计算边缘阈值;全局二值化阈值计算装置,用于计算文档图像的全局二值化阈值,该全局二值化阈值用于将文档图像的像素分类为黑色和白色;边缘确定装置,用于基于为每个像素所计算的梯度和所计算的边缘阈值确定文档图像的每个像素是否是边缘像素;局部二值化阈值计算装置,用于基于每个边缘像素的N个相邻像素的灰度值为每个所确定的边缘像素计算局部二值化阈值;第一分类装置,用于基于为每个边缘像素的N个相邻像素计算的局部二值化阈值将该N个相邻像素中的像素分类为前景像素和背景像素;设置装置,用于将前景像素设置为黑色;以及第二分类装置,用于基于所计算的全局二值化阈值将除前景像素之外的其它像素分类为黑色和白色。
本发明的其它目的、特征和优点将通过结合附图和下面的描述变得更加清楚,在本发明的整个附图中,相似的附图标记表示相同或类似的部分。
附图说明
包含在本说明书中并作为本说明书的组成部分的附图示出了本发明的实施例,并且结合下面的描述阐述了本发明的原理。其中:
图1是可以用于本发明的计算机系统的方框图;
图2是示出本发明的文档图像的二值化方法的流程图;
图3是示出根据本发明的实施例的每个边缘像素具有不同相邻像素数的二值图像;
图4示出了根据本发明的实施例的用于调节边缘阈值和全局二值化阈值的用户接口;
图5示出了根据本发明的二值化结果和现有技术之间的比较;
图6示出了根据本发明的二值化结果和现有技术之间的另一个比较;
图7示出了根据本发明的实施例的文档图像的二值化装置的方框图;以及
图8示出了现有技术中所公开的文档图像的二值化方法的流程图。
具体实施方式
为了更加透彻地理解本发明,下面的具体描述将给出本发明的许多具体细节。然而,本领域的普通技术人员应该知道本发明并不局限于所给出的具体细节。
计算机系统的实例
本发明的方法可以用于任何图像处理设备,例如,个人计算机(PC)、笔记本或嵌入照相机、摄像机、扫描仪等中的单片微型计算机(SCM)。对于本领域的普通技术人员而言,可以通过软件、硬件和/或固件很容易地实现本发明的方法。应该特别注意的是,为了实现本方法的任意步骤或步骤的组合,或任何组件的组合,本领域的普通技术人员应该知道使用I/O设备、存储设备、如CPU的微处理器等等可能是必须的。虽然实际上使用了这些设备,然而本发明的方法和下面的描述将不必然的提到它们。
如上面提到的信息处理设备,图1所示的方框图示出了可以用于本发明的典型的计算机系统的一个实例。应该注意,虽然图1示出了计算机系统的各种组件,但这并不意在代表任何特定结构或组件之间的互连方式。应该知道,具有更少组件亦或更多组件的网络计算机和其它数据处理系统也可以用于本发明。
如图1所示,作为数据处理系统的一种形式的计算机系统包括总线101,耦合到微处理器102、ROM 104、易失性RAM 105和非易失性存储器106之上。微处理器102,可以是Intel公司的Pentium微处理器,如图1的实例所示它耦合到高速缓存103。总线101将这些组件互连在一起,而且还将这些组件103、104、105和106互连到显示控制器和显示设备107,并互连到诸如输入/输出(I/O)设备的外设,例如鼠标、键盘、调制解调器、网络接口、打印机和本领域公知的其它设备。典型地,输入/输出设备109通过输入/输出控制器108耦合到系统上。易失性RAM 105典型地实现为动态RAM(DRAM),它需要持续地供电以刷新或保留存储器中的数据。非易失性存储器106典型地是一个磁硬盘驱动器,或者磁光盘驱动器,或者光盘驱动器,或者DVD RAM,或者其它类型的存储系统,其在系统供电被撤除之后仍然保存数据。典型地,非易失性存储器也可以是随机访问存储器,虽然这并不是必须的。虽然图1示出的非易失性存储器是一个直接耦合到数据处理系统中的其它组件的本地设备,但是应该知道本发明可以使用对于系统的远程非易失性存储器,例如通过诸如调制解调器或以太网接口的网络接口耦合到数据处理系统的网络存储设备。如本领域所公知的,总线101可以包括一个或多个通过各种桥、控制器和/或适配器而互相连接的总线。在一个实施例中,I/O控制器108包括USB(通用串行总线)适配器来控制USB外设。
文档图像的二值化方法和装置
下面,将参考附图说明根据本发明的文档图像的二值化方法的实施例。图2是示出本发明的文档图像的二值化方法的流程图。
如图2所示,在处理的开始,输入文档图像的灰度图像。而后,在步骤1,为该灰度图像的每个像素计算梯度。在本发明的一个实施例中,使用Sobel算子计算每个像素的梯度。本发明的普通技术人员都应该知道,任何其它类型的算子,例如Robert交叉算子和Prewitt算子等都可以用于计算梯度。
在步骤1为文档图像的每个像素计算梯度之后,处理过程前进到步骤2,在此为当前正在处理的文档图像计算缺省边缘阈值。
在步骤2中,首先计算为每个像素计算的上述梯度的直方图。而后,通过使用Otsu方法,计算缺省边缘阈值。
此外,在步骤3为当前正在处理的文档图像计算缺省全局二值化阈值。与步骤2类似,首先计算正在处理的文档图像的输入灰度图像的直方图。而后,通过使用Otsu方法,为正在处理的文档图像计算缺省全局二值化阈值。
在为正在处理的图像计算缺省边缘阈值和缺省全局二值化阈值之后,处理过程前进到步骤4来确定正在处理的文档图像中所包含的边缘。
在步骤4,对每个像素,如果确定该像素的梯度大于边缘阈值,则它是边缘。否则,它不是边缘。首先,该边缘阈值被设置为在步骤2中计算的缺省值,如果二值图像不能被接受,这一边缘阈值可以由用户调节,这将在下面具体描述。
此后,在步骤5,使用每个像素的N个相邻像素来计算每个边缘像素的局部二值化阈值,这将用于将每个边缘像素的N个相邻像素中的像素分类为前景像素和背景像素。
对于每个边缘像素,在它的N个相邻像素中,计算局部二值化阈值,并且基于为每个边缘像素所计算的局部二值化阈值,将这些N个相邻像素分类为前景像素和背景像素。对于N,如果它太小,那么,如图3的左图所示,正在处理的文档图像的输入灰度图像的文本将会被破坏;但是如果N太大,那么将花费很长的时间进行计算。N可以从9、13、16、21、25、29、36、37等组中选出。N个相邻像素的数量和组成是预先确定的。例如,组成为5×5的矩形(N =25),5×5的菱形(N =13)等等。根据本发明的文档图像的二值化方法的优选实施例,N等于25(5×5的矩形)。
设N个相邻的这些像素中的最大灰度值是nMax并且N个相邻的这些像素中的最小灰度值是nMin,则用于特定边缘像素的局部二值化阈值是nMax和nMin的平均值。然而本领域的普通技术人员可以容易地使用其它方法来计算每个边缘像素的局部二值化阈值。
在确定正在处理的文档图像的输入灰度图像的边缘像素并为每个确定的边缘像素计算局部二值化阈值之后,在步骤6将每个确定的边缘像素的N个相邻像素中的像素分类为前景像素和背景像素。
如果在步骤5得到N个相邻像素中的一个像素的灰度值小于局部二值化阈值,该像素是前景像素,否则它是背景像素。
而后,在步骤7,在步骤6确定的这些前景像素被设置为黑色。
此后,处理过程前进到步骤8,以便用全局二值化阈值二值化其余像素。
根据本发明的文档图像的二值化方法,文档图像的图像像素首先被分为两类:在步骤6中获得的前景像素,以及其它像素。对于前景像素,它们被设置为黑色,对于其它像素,它们由全局二值化阈值被进一步分类为黑色像素和白色像素。首先,全局二值化阈值被设置为在步骤3中计算的缺省值,如果二值化图像不能够被接受,那么该全局二值化阈值将在步骤9由用户进行调节,这将在下面进行描述。
可以看出,JP-A-2000-20714公开的方法和本发明的方法当中都基于在N个相邻像素(或局部窗口)中的像素值为每个边缘像素计算阈值,然而,“确定局部窗口中的阈值”的技术不是新的而且也是现有技术公知的。
但是,在JP-A-2000-20714中,仅确定了边缘像素是黑色的还是白色的,而且黑色和白色像素均在二值图像中登记。然而,在本发明中,在边缘像素的N个相邻像素内的所有像素都被考虑,但是,仅仅在二值图像上登记黑色像素。在下面的步骤中,将由全局二值化阈值再次二值化除登记像素之外的像素。
此外,N个相邻像素(或局部窗口尺寸)是本发明的一个重要参数。窗口尺寸必须大于字符的笔划宽度。否则,在笔划中就会出现“空洞”。
现在,将描述用户对边缘阈值和对全局二值化阈值的调节。
如果二值化图像不能被接受,例如,噪音非常大并且文本有丢失,用户就可以调节边缘阈值参数和全局二值化阈值的参数来获得更好的二值化图像(步骤9)。用户接口如图4所示。
在图4中,边缘阈值参数是对比度,全局二值化阈值参数是亮度。首先,将这两个参数分别设置为在步骤2和步骤3中计算的缺省值,然后正在处理的文档图像的输入灰度图像由这两个缺省值进行二值化。如果二值化图像不能被接受,在步骤9,用户可以调节这两个参数获得更好的二值图像。
对比度与文本有关、亮度与背景有关。对比度越高文本越清晰,对比度越低文本越不易读出。亮度越高背景清除得越干净,亮度越低背景变得越暗。
通过使用上述文档图像的二值化方法,用户可以在高速扫描仪中获得高质量的二值图像。图5和6示出了根据本发明的二值化结果和现有技术之间的比较。
从图5所示的二值化结果中可以看出,对于其它二值化方法,如果一些文本在高亮度背景的后面,那么在二值图像中这些文本将消失,而且一些高亮度背景将会变暗。但是对于本发明的二值化方法,这些文本能够显露出来,并且这些高亮度背景被清除干净。
此外,从图6所示的二值结果可以看出,对于其它二值化方法,如果一些文本很细微,在二值化图像中这些文本会消失。但是在本发明的二值化方法中,这些文本能够显露出来。
因此,根据本发明,首先本发明允许友好的用户界面。通过调节全局阈值,用户可以非常容易地使二值图像看起来更亮或更暗。这是本发明一个非常引人关注的特征。因为仅仅通过使用固定的设置进行二值化可能对一些图像是不好的,因此非常希望允许用户进行调节。
此外,二值图像也将更加平滑。或者,换句话说,视觉效果更好。正如所公知的那样,对于OCR而言,局部阈值方法(JP-A-2000-20714属于这类方法)比全局阈值方法更好。但是二值图像可能并不平滑。相反,全局阈值能够获得平滑的效果,但是不能解决复杂的文档,例如暗的和轻的文本和线条以及暗的和轻的背景面的组合出现在一页上。本发明的方法成功地结合了局部阈值(用于边缘的N个相邻中的像素)和全局阈值(用于没有在局部阈值中登记的像素)。因此它能够实现OCR和视觉效果之间更好的折衷。
接下来,将参考附图描述本发明的文档图像的二值化装置。图7示出了根据本发明的实施例的文档图像的二值化装置的方框图。
如图7所示,文档图像的二值化装置,包括:梯度计算单元701,被安排为文档图像的每个像素计算梯度;边缘阈值计算单元702,被安排基于所计算的梯度计算文档图像的边缘阈值;全局二值化阈值计算单元703,被安排用于计算文档图像的全局二值化阈值,来将文档图像的像素分类为黑色和白色;边缘确定单元704,被安排用于确定文档图像的一个像素是否是边缘;局部二值化阈值计算单元705,被安排用于为每个由边缘确定单元704确定为边缘的每个像素计算局部二值化阈值;分类单元706,被安排用于将在边缘的N个相邻像素中的像素分类为前景像素和背景像素;设置单元707,被安排用于将前景像素设置为黑色;二值化单元708,被安排用于基于所计算的全局二值化阈值,将除前景像素之外的其余像素二值化为黑色或白色;以及用户接口709,被安排用于调节边缘阈值和全局二值化阈值。
此外,本领域的普通技术人员应该理解,文档图像的二值化装置还应该包括:输入单元,用于输入文档图像的灰度图像;以及输出单元,用于在利用根据本发明的上述方法和装置进行二值化之后,输出二值图像。
显然,本领域的普通技术人员也应当理解,根据本发明的文档图像的二值化装置可以进一步实现为包括:用于将文档图像的图像像素分类为边缘附近的前景像素和除前景像素之外的其它像素的装置;用于将前景像素设置为黑色的装置;以及用于将前景像素之外的其它像素分类为黑色和白色的装置。
用于将文档图像的图像像素分类为边缘附近的前景像素和除前景像素之外的其它像素的装置可以进一步包括:用于计算边缘阈值的装置;用于基于计算的边缘阈值确定文档像素的图像像素是否是边缘的装置;用于对每个确定为边缘的像素计算局部二值化阈值的装置;用于基于对被确定为边缘的像素所计算的局部二值化阈值,将文档图像中的被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素的装置。
在本发明的优选实施例中,用于对每个确定为边缘的像素计算局部二值化阈值的装置包括:用于计算nMax和nMin的平均值作为局部二值化阈值的装置,所述nMax是被确定为边缘的像素的N个相邻像素中的图像像素的最大灰度值,并且所述nMin是被确定为边缘的像素的N个相邻像素中的图像像素的最小灰度值;以及用于将文档图像的被确定为边缘的像素附近的图像像素分类为前景像素和除前景像素之外的其它像素的装置,如果被确定为边缘的像素的N个相邻像素中的一个像素的灰度值小于局部二值化阈值,则确定该像素为前景像素,否则它就是属于除前景像素之外的其它像素的背景像素。优选的,N为25。
在上述实施例中,预先确定N个相邻像素的数量(例如N =25),但是,本发明并与局限于上述实施例。例如,此外N个相邻像素的数量和组成可以在步骤9由用户来调节。
在本发明的另一实施例中,用于计算边缘阈值的装置包括:用于计算文档图像的每个像素的梯度的装置;计算为文档图像的所有像素计算的梯度的直方图的装置;以及使用Otsu方法计算边缘阈值的装置。优选的,使用Sobel算子计算文档图像的每个像素的梯度。
根据本发明的优选实施例,用于将除前景像素之外的其它像素分类为黑色和白色的装置包括:用于对所有除前景像素之外的其它像素计算全局二进制阈值的装置;以及如果在除前景像素之外的其它像素中的一个像素的灰度值大于全局二值化阈值,则将该像素确定为黑色,否则将该像素确定为白色的装置。
作为选择,边缘阈值和全局二值化阈值可以由用户接口进行外部调节。
除上述本发明的方法和装置的具体实施例之外,本发明的目的还可以通过如上所述的在任何信息处理设备上运行的程序或程序组来实现,它可以通过任何语音检测和任何后续处理装置来进行交互。所述信息处理设备、语音检测和后续处理装置可以是公知的通用设备。
因此,应该重点强调的,本发明包括了通过直接或远程地将执行上述实施例功能的软件程序(对应于所述实施例中的流程图的程序)提供给系统或装置,并由该系统或装置的计算机读出并执行所提供程序的代码来实现本发明的情况。这样,只要提供了程序功能,本发明的形式就不会仅局限于程序。
因此,安装在用来执行本发明的功能过程的计算机中的由该计算机执行的程序代码本身实现了本发明。即,本发明包括用于执行本发明的功能过程的计算机程序本身。
这样,程序形式不应该被特别限制,并且目标代码、由解释器执行的程序、提供给OS的脚本数据等等都可以使用,只要它们具有程序功能。
作为提供程序的记录介质,例如,软盘、硬盘、光盘、磁光盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失性存储卡、ROM、DVD(DVD-ROM、DVD-R)等等都可以使用。
作为另一种程序提供方法,可以使用在客户端计算机上的浏览器建立到因特网上给定主页的连接,并且可以从该主页将本发明的、被压缩并包括自动安装功能的计算机程序本身或文件下载到例如硬盘等的记录介质上,由此提供程序。而且,构成本发明的程序的程序代码可以分割为多个文件,并且这些文件可以从不同的主页下载。也就是说,本发明还包括WNW服务器,它使得多个用户下载程序文件来由计算机执行本发明的功能过程。
此外,存储有本发明的加密程序的例如CD-ROM等的存储介质可以交付用户,被验证具有预定条件的用户被允许通过因特网从主页上下载密钥信息来解密该程序,并且该加密程序可以使用该密钥信息被执行来安装在计算机上,从而实现本发明。
上述实施例的功能不但可以通过由计算机执行所读出的程序代码来实现,也可以通过基于该程序的指令的、运行在计算机上的OS等执行的一些或全部实际处理操作来实现。
此外,上述实施例的功能可以通过由安排在功能扩展板或功能扩展单元中的CPU等执行的一些或全部实际处理来实现,将所述从记录介质中读出的程序写入扩展板或单元的存储器后,插入或连接所述功能扩展板或功能扩展单元到计算机。
在此描述的仅仅是本发明原理的应用。例如,上面描述的作为操作本发明的最佳模式而实现的功能仅仅用于解释的目的。作为特定的实例,例如,其它设计也可以用来获得和分析波形数据来确定语音。此外,本发明也可以用于除检测语音之外的其它目的。因此,在不背离本发明的范围和精髓的情况下,本领域的普通技术人员也可以实施其它的方案和方法。

Claims (16)

1.一种文档图像的二值化方法,包括:
为文档图像的每个像素计算梯度的梯度计算步骤;
基于所计算的梯度为文档图像计算边缘阈值的边缘阈值计算步骤;
计算文档图像的全局二值化阈值的全局二值化阈值计算步骤,该全局二值化阈值用于将文档图像的像素分类为黑色和白色;
基于为每个像素所计算的梯度和所计算的边缘阈值确定文档图像的每个像素是否是边缘像素的边缘确定步骤;
基于每个边缘像素的N个相邻像素的灰度值为所确定的边缘像素中的每一个计算局部二值化阈值的局部二值化阈值计算步骤;
基于为每个边缘像素的N个相邻像素计算的局部二值化阈值将该N个相邻像素中的像素分类为前景像素和背景像素的第一分类步骤;
将前景像素设置为黑色的设置步骤;以及
基于全局二值化阈值将除前景像素之外的其它像素分类为黑色和白色的第二分类步骤。
2.根据权利要求1所述的文档图像的二值化方法,所述方法进一步包括根据用户指令调节边缘阈值的步骤,
其中,在根据用户指令调节边缘阈值后,在所述边缘确定步骤中基于为每个像素所计算的梯度和调节后的边缘阈值重新确定每个像素。
3.根据权利要求1所述的文档图像的二值化方法,
其中,在局部二值化阈值计算步骤中,将nMax和nMin的平均值计算为局部二值化阈值,所述nMax是边缘像素的N个相邻像素的最大灰度值,所述nMin是边缘像素的N个相邻像素的最小灰度值;以及
其中,在第一分类步骤中,如果边缘像素的N个相邻像素中的一个像素的灰度值小于局部二值化阈值,则该像素被分类为前景像素,否则它被分类为背景像素。
4.根据权利要求1所述的文档图像的二值化方法,其中N值在9到37之间。
5.根据权利要求1所述的文档图像的二值化方法,其中,在所述边缘阈值计算步骤中,计算为文档图像的所有像素所计算的梯度的直方图,并且,使用Otsu方法基于该直方图计算边缘阈值。
6.根据权利要求1所述的文档图像的二值化方法,其中使用Sobel算子计算文档图像的每个像素的梯度。
7.根据权利要求3所述的文档图像的二值化方法,其中,在所述第二分类步骤中,如果除前景像素之外的其它像素中的一个像素的灰度值小于全局二值化阈值,则该像素被分类为黑色,否则该像素被分类为白色。
8.根据权利要求1所述的文档图像的二值化方法,所述方法进一步包括根据用户指令调节全局二值化阈值的步骤,其中在根据用户指令调节全局二值化阈值后,基于调整后的全局二值化阈值重新执行所述第二分类步骤。
9.一种文档图像的二值化设备,包括:
梯度计算装置,用于为文档图像的每个像素计算梯度;
边缘阈值计算装置,用于基于所计算的梯度为文档图像计算边缘阈值;
全局二值化阈值计算装置,用于计算文档图像的全局二值化阈值,该全局二值化阈值用于将文档图像的像素分类为黑色和白色;
边缘确定装置,用于基于为每个像素所计算的梯度和所计算的边缘阈值确定文档图像的每个像素是否是边缘像素;
局部二值化阈值计算装置,用于基于每个边缘像素的N个相邻像素的灰度值为每个所确定的边缘像素计算局部二值化阈值;
第一分类装置,用于基于为每个边缘像素的N个相邻像素计算的局部二值化阈值将该N个相邻像素中的像素分类为前景像素和背景像素;
设置装置,用于将前景像素设置为黑色;以及
第二分类装置,用于基于所计算的全局二值化阈值将除前景像素之外的其它像素分类为黑色和白色。
10.根据权利要求9所述的文档图像的二值化设备,所述装置还包括:调节装置,用于根据用户指令调节边缘阈值,
其中在根据用户指令调节边缘阈值后,所述边缘确定装置基于为每个像素所计算的梯度和调节后的边缘阈值重新确定文档图像的每个像素是否是边缘像素。
11.根据权利要求9所述的文档图像的二值化设备,
其中所述局部二值化阈值计算装置计算nMax和nMin的平均值作为局部二值化阈值,所述nMax是边缘像素的N个相邻像素的最大灰度值,并且所述nMin是边缘像素的N个相邻像素的最小灰度值;并且
其中,如果边缘像素的N个相邻像素中的一个像素的灰度值小于局部二值化阈值,则所述第一分类装置将该像素分类为前景像素,否则所述第一分类装置将该像素分类为背景像素。
12.根据权利要求9所述的文档图像的二值化设备,其中所述N值在9到37之间。
13.根据权利要求9所述的文档图像的二值化设备,
其中,所述边缘计算装置计算为文档图像的所有像素所计算的梯度的直方图,并且使用Otsu方法基于该直方图计算边缘阈值。
14.根据权利要求9所述的文档图像的二值化设备,其中使用Sobel算子计算文档图像的每个像素的梯度。
15.根据权利要求11所述的文档图像的二值化设备,其中,如果除前景像素之外的其它像素中的一个像素的灰度值小于全局二值化阈值,所述第二分类装置将该像素分类为黑色,否则所述第二分类装置将该像素分类为白色。
16.根据权利要求9所述的文档图像的二值化设备,所述装置进一步包括:根据用户指令调节全局二值化阈值的装置,其中在根据用户指令调节全局二值化阈值后,所述第二分类装置基于调整后的全局二值化阈值重新执行。
CNB2005101287974A 2005-12-02 2005-12-02 文档图像的二值化方法和设备 Expired - Fee Related CN100442308C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005101287974A CN100442308C (zh) 2005-12-02 2005-12-02 文档图像的二值化方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005101287974A CN100442308C (zh) 2005-12-02 2005-12-02 文档图像的二值化方法和设备

Publications (2)

Publication Number Publication Date
CN1979526A CN1979526A (zh) 2007-06-13
CN100442308C true CN100442308C (zh) 2008-12-10

Family

ID=38130681

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101287974A Expired - Fee Related CN100442308C (zh) 2005-12-02 2005-12-02 文档图像的二值化方法和设备

Country Status (1)

Country Link
CN (1) CN100442308C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101727582B (zh) * 2008-10-22 2014-02-19 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
JP5725276B2 (ja) * 2010-08-03 2015-05-27 富士ゼロックス株式会社 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
CN105528784B (zh) * 2015-12-02 2019-01-25 沈阳东软医疗系统有限公司 一种前景背景分割的方法和装置
CN106295648B (zh) * 2016-07-29 2019-03-19 湖北工业大学 一种基于多光谱成像技术的低质量文档图像二值化方法
CN110008954B (zh) * 2019-03-29 2021-03-19 重庆大学 一种基于多阈值融合的复杂背景文本图像提取方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5992971A (en) * 1993-10-28 1999-11-30 Canon Kabushiki Kaisha Ink jet recording method and apparatus
CN1400807A (zh) * 2001-07-26 2003-03-05 佳能株式会社 图象处理方法和设备,图象处理系统以及存储介质
JP2005198157A (ja) * 2004-01-09 2005-07-21 Canon Inc 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5992971A (en) * 1993-10-28 1999-11-30 Canon Kabushiki Kaisha Ink jet recording method and apparatus
CN1400807A (zh) * 2001-07-26 2003-03-05 佳能株式会社 图象处理方法和设备,图象处理系统以及存储介质
JP2005198157A (ja) * 2004-01-09 2005-07-21 Canon Inc 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム

Also Published As

Publication number Publication date
CN1979526A (zh) 2007-06-13

Similar Documents

Publication Publication Date Title
CN100517374C (zh) 从复杂背景文档图像提取文本的装置、方法
Yuan et al. A robust and efficient approach to license plate detection
CN100442308C (zh) 文档图像的二值化方法和设备
CN101689300B (zh) 图像分割和增强
CA2598686C (en) Intelligent importation of information from foreign application user interface using artificial intelligence
CN100585621C (zh) 图像处理装置和图像处理方法
US20150161465A1 (en) Text recognition for textually sparse images
US10026004B2 (en) Shadow detection and removal in license plate images
US9092668B2 (en) Identifying picture areas based on gradient image analysis
Deepthi et al. Implementation of mobile platform using Qt and OpenCV for image processing applications
Chen et al. Adaptive page segmentation for color technical journals' cover images
CN112365533A (zh) 基于图像分割的煤流量监测方法、装置和电子装置
WO2012040700A2 (en) A brightness enhancement method, system and apparatus for low power architectures
US9076225B2 (en) Image processing device, an image processing method and a program to be used to implement the image processing
CN100416597C (zh) 用于文档的自适应二值化的方法和设备
CN115620039A (zh) 一种图像标注方法、装置、设备、介质和程序产品
US9648208B2 (en) Method and apparatus and using an enlargement operation to reduce visually detected defects in an image
CN100382097C (zh) 文件倾斜角度的估算方法及其装置
Salagar et al. Analysis of PCA usage to detect and correct skew in document images
US10475189B2 (en) Content aware, spatially adaptive automated thresholding of images
JPH10232926A (ja) 画像処理装置及びその方法
JP4253265B2 (ja) 影検出装置、影検出方法及び影検出プログラム、影検出装置を用いた画像処理装置、影検出方法を用いた画像処理方法及び影検出プログラムを用いた画像処理プログラム
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
US7149354B2 (en) Extraction of a scene structure based on gradient runs analysis
JP2001291058A (ja) 文字認識装置及び記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081210

Termination date: 20161202

CF01 Termination of patent right due to non-payment of annual fee