CN101727583B - 用于文档图像的自适应二值化方法和设备 - Google Patents

用于文档图像的自适应二值化方法和设备 Download PDF

Info

Publication number
CN101727583B
CN101727583B CN200810171184.2A CN200810171184A CN101727583B CN 101727583 B CN101727583 B CN 101727583B CN 200810171184 A CN200810171184 A CN 200810171184A CN 101727583 B CN101727583 B CN 101727583B
Authority
CN
China
Prior art keywords
pixel
picture
file
self
gray level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200810171184.2A
Other languages
English (en)
Other versions
CN101727583A (zh
Inventor
郑大念
孙俊
直井聪
堀田悦伸
皆川明洋
藤本克仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN200810171184.2A priority Critical patent/CN101727583B/zh
Publication of CN101727583A publication Critical patent/CN101727583A/zh
Application granted granted Critical
Publication of CN101727583B publication Critical patent/CN101727583B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

用于文档图像的自适应二值化方法和设备。自适应二值化设备包含:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。因而,能够去除文档图像中的水平竖直方向上的线条,以利于提高字符识别率。

Description

用于文档图像的自适应二值化方法和设备
技术领域
本发明涉及图像二值化技术,尤其涉及用于文档图像的自适应二值化方法和设备。
背景技术
近年来,随着图像处理技术的迅速发展,文档图像光学字符识别(OCR)正得到广泛的应用。作为一种图像预处理技术,文档图像二值化处理经常在OCR系统中被用到。二值化处理是将彩色或灰度级图像转换成黑白图像的过程,其中黑白图像只具有黑、白两个灰度级。
有许多种用于文档图像的全局或自适应的二值化方法。二值化方法的例子包括Otsu方法,用于根据灰度直方图计算阈值(参见"A ThresholdSelection Method from Gray-Level Histograms",IEEE Trans.On systems,Man,30 and cybernetics,Vol.SMC-9,No.1,pp.62-66,January 1979),Niblack方法,用于基于图像的局部均值和标准差计算阈值(参见"AnIntroduction to Digitall Image Processing",Prentice-Hall,EnglewoodCliffs,NJ(1986))和Sauvola方法,其是对Niblack方法的改进并且尝试抑制噪声区(参见J.Sauvola和M.Pietikainen,"Adaptive document imagebinarization,"Pattern Recognition 33(2),pp.225-236,2000。
例如Otsu方法的全局二值化方法对于退化的弱笔划字符和光线变化的背景效果不佳。例如Niblack方法和Sauvola方法的自适应二值化方法虽然能够应对上述情况,但经常在背景图像中产生大量噪声。作为对Niblack方法的改进的Sauvola方法对于纹理背景图像效果较好,但可能会丢失弱笔划。此外,目前的二值化方法都不适合处理带表格线的字符串图像。
发明内容
本发明的目的是提供一种用于文档图像的自适应二值化方法和设备,以至少克服现有技术的部分不足。
在本发明的一个实施例中,用于文档图像的自适应二值化设备包含:估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
在一个可选实施例中,估计器还根据在行和列中的另一个方向上文档图像的每一组像素,估计该组的每个像素的第二背景灰度级,以获得文档图像的第二背景图像,计算器还针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素到第二背景图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第二阈值,并且提取器还根据第二阈值从文档图像中提取出第二二值化图像,其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定尺寸,其中,所述自适应二值化设备还包括:图像合并器,获得第一和第二二值化图像间的逻辑与图像。
在一个可选实施例中,在计算第一和第二阈值时,d=k×r,0<k<2。
在一个可选实施例中,在计算第一和第二阈值时,d=k×(rn+|r-rn|),0<k<2,rn为文档图像的估计噪声。
在一个可选实施例中,估计器通过平均值或迭代多项式回归来进行估计。
在本发明的一个实施例中,用于文档图像的自适应二值化方法,包括:根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1是示出根据本发明实施例的用于文档图像的自适应二值化设备的框图。
图2是示出根据本发明实施例的用于文档图像的自适应二值化方法的流程图。
图3A示意性示出了计算器计算阈值的原理,图3B示出了在应用阈值时估计噪声所产生的作用。
图4示意性示出了由原始文档图像中一行像素估计背景图像中该行像素的过程
图5示意性示出了图1的自适应二值化设备处理文档图像的具体示例。
图6是示出根据本发明优选实施例的用于文档图像的自适应二值化设备的框图。
图7是示出根据本发明优选实施例的用于文档图像的自适应二值化方法的流程图。
图8示意性示出了图6的自适应二值化设备处理文档图像的具体示例。
图9是示出其中实现本发明的计算机的示例性结构的框图。
具体实施方式
下面参照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
图1是示出根据本发明实施例的用于文档图像的自适应二值化设备100的框图。
如图1所示,自适应二值化设备100包括估计器101、计算器102和提取器103。在图1所示的实施例中,假定在文档图像中分布有沿行方向延伸的线条,并且沿行方向存在手写或打印的文字。此外,假定文档图像的灰度级为0到255。灰度级255代表纯白,灰度级0代表纯黑,并且文档图像具有浅灰度(即高灰度级)背景,深灰度(即低灰度级)文字。
估计器101以文档图像的每一行的像素为一组,逐行处理文档图像。在处理中,估计器101根据行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的背景图像。
可以将文档图像认为是背景图像与文字图像的叠加,并且线条也被认为是背景图像的一部分。由于文字与线条相交的部分往往具有比文字和线条更深的灰度,因此当线条被提取为背景图像的一部分时,自然能够将线条与文字分离。
由于根据每一行的像素来估计背景图像,因此能够更加适应地将沿行方向延伸的线条估计为背景图像的一部分。
可以利用各种方法来进行估计。例如,可以通过平均值来估计背景图像,其中对于每一组像素中的每一个像素,针对以该像素为中心的像素区间内的所有像素求灰度级平均值,并且将灰度级平均值作为当前像素的背景灰度级。这样,所有像素的背景灰度级构成文档图像的背景图像。为了足够区分背景和文字,可以将像素区间的尺寸(即宽度)设置为大于某个值,使得区间内至少包含背景像素。例如,可以将像素区间的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区间的尺寸设置为大于文字沿线条方向(在本实施例中为行方向)的平均或最大笔划宽度。在一个实施例中,像素区间的尺寸为11个像素。
对于接近图像边界的像素,以其为中心的像素区间可能包含边界以外的部分。对于这样的情况,可以只针对像素区间内的实际像素求平均值。
也可以采用迭代多项式回归来拟合估计背景图像。适合使用的多项式拟合函数可采用p次多项式,如p=7。拟合函数的形式为
f(x)=a0+a1x+a2x2+a3x3+a4x4+a5x5+a6x6+a7x7
其中p越大,函数的拟合能力越强,但容易过拟合;p越小,拟合能力越差,但容易欠拟合。
给定一行像素(x1,y1),…,(xn,yn), x i = i n 代表像素归一化的列坐标, y i = g i 255 代表像素(设灰度级gi在0至255之间)归一化后的灰度级,n是一行的像素数目。
将输入x1,…,xn的0至p次幂依次安排放置于一个矩阵X
Figure G2008101711842D00051
,以定义多项式滤波矩阵
Hn×n=X(XTX+εI)-1XT
其中I是单位矩阵,ε是一个小正常数,例如取ε=0.0001n。对于给定的图像,宽度n是一个常量,故滤波矩阵是一个常量矩阵。
设多项式回归函数拟合输出y1,…,yn的结果为f1,…,fn,记输出行的列向量y=(y1,…,yn)T,拟合行的列向量为f=(f1,…,fn)T,则它们满足f=Hy。
经过多次迭代的使用多项式回归,可以估计出输入图像的背景图像(假定文档背景为白色,文档字符笔划为黑色)。
针对一行像素,估计文档图像该行背景的过程如下:
(1)设置初始迭代次数t=0,初始输出 y 1 ( 0 ) = y 1 , &CenterDot; &CenterDot; &CenterDot; , y n ( 0 ) = y n ;
(2)对于图像的一行数据
Figure G2008101711842D00053
经过第t次多项式拟合,我们得到了输出(其中若 f i ( t ) > 1 , 则裁减为 f i ( t ) = 1 );
(3)如果迭代次数满足t>T,则终止迭代并输出
Figure G2008101711842D00057
作为该行背景;
(4)按照如下规则计算
Figure G2008101711842D00058
f i ( t ) > y i ( t ) + &Delta; ( t ) , y i ( t + 1 ) = f i ( t ) , 否则 y i ( t + 1 ) = y i ( t ) , 其中Δ(t)是一个噪声阈值。
(5)增加迭代次数t←t+1,返回步骤(2),开始新一轮迭代。
在第(4)步中,有一个噪声阈值Δ(t),它可以如下设置:设初始噪声为Δ(0)=0.2,结束噪声为Δ(T)=0,则第t次迭代噪声 &Delta; ( t ) = T - t T &Delta; ( 0 ) .
上述的迭代过程是逐渐把笔划处的像素值以背景多项式行插值来替代的过程,最终输出收敛于背景行曲线。
图4示意性示出了由原始文档图像中一行像素估计背景图像中该行像素的过程,其中点线为实线为
Figure G2008101711842D000514
自上而下迭代次数t=0,…,6。
图5示意性示出了图1的自适应二值化设备处理文档图像的具体示例。原始文档图像如图5中的(A)所示,并且逐行估计背景得到的背景图像如图5中的(B)所示。
当然,也可以采用现有技术已知的其它方法来逐行估计背景图像。
回到图1,根据估计器101获得的背景图像和文档图像,计算器102确定像素的二值化所需的比较阈值。具体地,计算器102针对文档图像的每个像素,计算以该像素为中心的像素区域中所有像素到背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的阈值。阈值t可以表示为t=B-f(r),其中d=f(r)是与平均距离r正相关的量,B为估计的背景图像中相应像素的灰度级。所述平均距离r可以是像素区域中所有像素与估计的背景图像中对应像素的灰度级之差的平均值,但也可以是其它距离的平均值。
像素区域可以具有任意形状,例如圆形、多边形等等。优选地,像素区域可以是(2w+1)×(2w+1)的正方形。可以将像素区域的尺寸(例如宽度、长度、直径等)设置为大于某个值,使得区域内至少包含背景像素。例如,可以将像素区域的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区域沿线条方向(在本实施例中为行方向)的尺寸设置为大于平均或最大笔划宽度。在一个实施例中,像素区域的尺寸为11个像素。
对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。
图3A示意性示出了计算器计算阈值的原理。如图3A所示,强笔划的像素与弱笔划的像素与背景图像的距离存在差别。对于每个像素,阈值的可能范围为背景图像的相应像素的灰度级到该像素的灰度级的区间之内。相应地,根据文档图像中每个像素的灰度级确定相适应的阈值,使得能够实现自适应的二值化处理。
可以指定各种函数f(r),只要其能够反映正相关关系。优选地,可以指定函数d=f(r)=k×r,0<k<2。在一个实施例中,k可以取值1。
进一步地,可以在确定阈值时考虑到噪声(如图3A所示)。例如,可以指定函数d=f(r)=k×(rn+|r-rn|),0<k<2,rn为文档图像的估计噪声。在一个实施例中,k可以取值1。
k越小,二值化后的笔划越粗,k越大,二值化后的笔划越细。
可以采用现有技术的方法来估计文档图像的噪声。图3B示出了在应用阈值时估计噪声所产生的作用。如图3B所示,在平均距离r小于估计噪声rn的区间,会导致将像素视为背景,而在平均距离r大于估计噪声rn的区间,会导致将像素视为文字。在一个实施例中,可将噪声rn假定为20或25,或20至25之间的值。
回到图1,提取器103根据计算器102确定的阈值,从文档图像中提取出二值化图像。例如,提取器103可以将文档图像的每个像素的灰度级与其相应阈值进行比较,将灰度级小于阈值的像素处理为文字像素,而将灰度级大于或等于阈值的像素处理为背景像素。提取器103提取的二值化图像如图5中的(C)所示。
作为一个具体例子,设文档图像为I,估计得到的背景图像为B,I中某像素点处的灰度级为gij(0到255之间),B中该点的灰度级为bij(0到255之间),以该点为中心的正方形窗大小为(2w+1)×(2w+1),则计算该点处的阈值计算方法为
tij=bij-k(rn+|rij-rn|)
其中rn为文档图像中的噪声大小(rn设得越大,二值图像中的噪声越少,但弱笔划的丢失越大),rij为背景图像与文档图像邻域的差均值
r ij = 1 ( 2 w + 1 ) 2 &Sigma; u = i - w i + w &Sigma; v = j - w j + w ( b ij - g ij ) .
得到该点处的阈值之后,比较gij和tij,若gij<tij,则该点为笔划点(纯黑色0),否则它为背景点(纯白色255)。
图2是示出根据本发明实施例的用于文档图像的自适应二值化方法的流程图。
如图2所示,方法从步骤200开始。在步骤202,根据在行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的背景图像。在步骤204,针对文档图像的一个像素,计算以该像素为中心的像素区域中所有像素到背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的阈值。在步骤206,确定是否有未计算阈值的像素。如果有,则返回步骤204继续计算。如果没有,则前进到步骤208,根据阈值从文档图像中提取出二值化图像。像素区域可以具有任意形状,例如圆形、多边形等等。优选地,像素区域可以是(2w+1)×(2w+1)的正方形。可以将像素区域的尺寸(例如宽度、长度、直径等)设置为大于某个值,使得区域内至少包含背景像素。例如,可以将像素区域的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区域沿线条方向(在本实施例中为行方向)的尺寸设置为大于平均或最大笔划宽度。在一个实施例中,像素区域的尺寸为11个像素。对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。
对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。
所属技术领域的普通技术人员明白,本发明的实施例也适用于在文档图像中分布有沿列方向延伸的线条,并且沿列方向存在手写或打印的文字。在这样的情况下,可以以每列的像素为单位来进行背景图像估计。
此外,本发明的实施例也适用于其它文档图像灰度级范围。并且,本发明的实施例也适用于其它文档图像灰度级表示,例如灰度级255代表纯黑,灰度级0代表纯白。在这种情况下,只需要例如将灰度级表示转换成与图1的实施例一致即可。
图6是示出根据本发明优选实施例的用于文档图像的自适应二值化设备600的框图。在图6的实施例中,文档图像中包含行、列两个方向的线条背景。假定文档图像的灰度级为0到255。灰度级255代表纯白,灰度级0代表纯黑,并且文档图像具有浅灰度(即高灰度级)背景,深灰度(即低灰度级)文字。
如图6所示,自适应二值化设备600包括估计器601、计算器602、提取器603和图像合并器604。
估计器601以文档图像的每一行的像素为一组,逐行处理文档图像。在处理中,估计器601根据行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第一背景图像。具体估计方法与前面参照估计器101描述的相同。
图8示意性示出了图6的自适应二值化设备处理文档图像的具体示例。原始文档图像如图8中的(A)所示,并且逐行估计背景得到的第一背景图像如图8中的(B)所示。
回到图6,根据估计器601获得的第一背景图像和文档图像,计算器602确定像素的二值化所需的第一比较阈值。具体计算方法与前面参照计算器102描述的相同。
提取器603根据计算器602确定的第一阈值,从文档图像中提取出第一二值化图像。具体提取方法与前面参照提取器103描述的相同。第一二值化图像如图8中的(D)所示。
此外,估计器601还以文档图像的每一列的像素为一组,逐列处理文档图像。在处理中,估计器601根据列方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第二背景图像。具体估计方法与前面参照估计器101描述的相同。原始文档图像如图8中的(A)所示,并且逐列估计背景得到的第二背景图像如图8中的(C)所示。
回到图6,根据估计器601获得的第二背景图像和文档图像,计算器602还确定像素的二值化所需的第二比较阈值。具体计算方法与前面参照计算器102描述的相同。
提取器603还根据计算器602确定的第二阈值,从文档图像中提取出第二二值化图像。具体提取方法与前面参照提取器103描述的相同。第二二值化图像如图8中的(E)所示。
图像合并器604获得第一和第二二值化图像间的逻辑与图像,即,通过将第一和第二二值化图像中相应像素的0或1的像素值进行逻辑与运算,得到的结果作为最终二值化图像中相应像素的像素值。最终的二值化图像如图8中的(F)所示。
图7是示出根据本发明优选实施例的用于文档图像的自适应二值化方法的流程图。
如图7所示,方法从步骤700开始。在步骤702,根据在行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第一背景图像。在步骤704,针对文档图像的一个像素,计算以该像素为中心的像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的第一阈值。在步骤706,确定是否有未计算第一阈值的像素。如果有,则返回步骤704继续计算。如果没有,则前进到步骤708,根据第一阈值从文档图像中提取出第一二值化图像。在步骤710,根据在列方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第二背景图像。在步骤712,针对文档图像的一个像素,计算以该像素为中心的像素区域中所有像素到第二背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的第二阈值。在步骤714,确定是否有未计算第二阈值的像素。如果有,则返回步骤712继续计算。如果没有,则前进到步骤716,根据第二阈值从文档图像中提取出第二二值化图像。在步骤718,获得第一和第二二值化图像间的逻辑与图像。像素区域可以具有任意形状,例如圆形、多边形等等。优选地,像素区域可以是(2w+1)×(2w+1)的正方形。可以将像素区域的尺寸(例如宽度、长度、直径等)设置为大于某个值,使得区域内至少包含背景像素。例如,可以将像素区域的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区域沿线条方向(在本实施例中为行方向)的尺寸设置为大于平均或最大笔划宽度。在一个实施例中,像素区域的尺寸为11个像素。对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。
对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。
虽然在图6和图7的实施例中先处理行方向再处理列方向,然而也可以先处理列方向再处理行方向。
根据本发明的实施例,能够将例如表格线的线条作为背景从文档图像中过滤掉。此外,根据本发明的实施例,能够处理退化的弱笔划,并使强笔划和弱笔划在最终的二值化图像中具有近似相等的宽度。此外,根据本发明的实施例,在二值化图像的空白区域中噪声较低。此外,根据本发明的实施例,能够处理光照亮度变化的背景,以得到平滑的背景图像,从而能够应对光线变化背景的情况。
本发明的设备和方法实现环境如图9所示。
在图9中,中央处理单元(CPU)901根据只读映射数据(ROM)902中存储的程序或从存储部分908加载到随机存取映射数据(RAM)903的程序执行各种处理。在RAM903中,也根据需要存储当CPU901执行各种处理等等时所需的数据。
CPU901、ROM902和RAM903经由总线904彼此连接。输入/输出接口905也连接到总线904。
下述部件连接到输入/输出接口905:输入部分906,包括键盘、鼠标等等;输出部分907,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器等等;存储部分908,包括硬盘等等;和通信部分909,包括网络接口卡比如LAN卡、调制解调器等等。通信部分909经由网络比如因特网执行通信处理。
根据需要,驱动器910也连接到输入/输出接口905。可拆卸介质911比如磁盘、光盘、磁光盘、半导体映射数据等等根据需要被安装在驱动器910上,使得从中读出的计算机程序根据需要被安装到存储部分908中。
在通过软件实现上述步骤和处理的情况下,从网络比如因特网或存储介质比如可拆卸介质911安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程序、与方法相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子包含磁盘、光盘(包含光盘只读映射数据(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)和半导体映射数据。或者,存储介质可以是ROM902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的方法一起被分发给用户。
在前面的说明书中参照特定实施例描述了本发明。然而本领域的普通技术人员理解,在不偏离如权利要求书限定的本发明的范围的前提下可以进行各种修改和改变。

Claims (14)

1.一种用于文档图像的自适应二值化设备,包括:
估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;
计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和
提取器,根据第一阈值从文档图像中提取出第一二值化图像,
其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
2.如权利要求1所述的自适应二值化设备,其中,
估计器还根据在行和列中的另一个方向上文档图像的每一组像素,估计该组的每个像素的第二背景灰度级,以获得文档图像的第二背景图像,
计算器还针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素到第二背景图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第二阈值,并且
提取器还根据第二阈值从文档图像中提取出第二二值化图像,
其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定尺寸,
其中,所述自适应二值化设备还包括:
图像合并器,获得第一和第二二值化图像间的逻辑与图像。
3.如权利要求2所述的自适应二值化设备,其中,在计算第一和第二阈值时,d=k×r,0<k<2。
4.如权利要求1所述的自适应二值化设备,其中,在计算第一阈值时,d=k×r,0<k<2。
5.如权利要求2所述的自适应二值化设备,其中,在计算第一和第二阈值时,d=k×(rn+|r-rn|),0<k<2,rn为文档图像的估计噪声。
6.如权利要求1所述的自适应二值化设备,其中,在计算第一阈值时,d=k×(rn+|r-rn|),0<k<2,rn为文档图像的估计噪声。
7.如权利要求1或2所述的自适应二值化设备,其中,所述估计器通过平均值或迭代多项式回归来进行估计。
8.一种用于文档图像的自适应二值化方法,包括:
根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;
针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和
根据第一阈值从文档图像中提取出第一二值化图像,
其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
9.如权利要求8所述的自适应二值化方法,还包括:
根据在行和列中的另一个方向上文档图像的每一组像素,估计该组的每个像素的第二背景灰度级,以获得文档图像的第二背景图像;
针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素到第二背景图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第二阈值;
根据第二阈值从文档图像中提取出第二二值化图像;和
获得第一和第二二值化图像间的逻辑与图像,
其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定尺寸。
10.如权利要求9所述的自适应二值化方法,其中,在计算第一和第二阈值时,d=k×r,0<k<2。
11.如权利要求8所述的自适应二值化方法,其中,在计算第一阈值时,d=k×r,0<k<2。
12.如权利要求9所述的自适应二值化方法,其中,在计算第一和第二阈值时,d=k×(rn+|r-rn|),0<k<2,rn为文档图像的估计噪声。
13.如权利要求8所述的自适应二值化方法,其中,在计算第一阈值时,d=k×(rn+|r-rn|),0<k<2,rn为文档图像的估计噪声。
14.如权利要求8或9所述的自适应二值化方法,其中,通过平均值或迭代多项式回归来进行估计。
CN200810171184.2A 2008-10-22 2008-10-22 用于文档图像的自适应二值化方法和设备 Expired - Fee Related CN101727583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810171184.2A CN101727583B (zh) 2008-10-22 2008-10-22 用于文档图像的自适应二值化方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810171184.2A CN101727583B (zh) 2008-10-22 2008-10-22 用于文档图像的自适应二值化方法和设备

Publications (2)

Publication Number Publication Date
CN101727583A CN101727583A (zh) 2010-06-09
CN101727583B true CN101727583B (zh) 2013-03-20

Family

ID=42448456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810171184.2A Expired - Fee Related CN101727583B (zh) 2008-10-22 2008-10-22 用于文档图像的自适应二值化方法和设备

Country Status (1)

Country Link
CN (1) CN101727583B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103383732B (zh) * 2012-05-04 2016-12-14 富士通株式会社 图像处理方法和装置
CN103902995B (zh) * 2014-03-17 2017-11-07 西安汇龙科技股份有限公司 表格内容自动录入方法和装置
CN105069452B (zh) * 2015-08-07 2016-09-14 武汉理工大学 基于局部结构分析的直线移除方法
JP2018006981A (ja) 2016-06-30 2018-01-11 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
CN106384114B (zh) * 2016-09-22 2019-09-27 哈尔滨理工大学 一种基于支持向量机的自适应图像二值化方法
CN109164754B (zh) * 2018-08-06 2021-01-15 大族激光科技产业集团股份有限公司 一种伺服驱动器位置命令的平滑方法及其控制装置
CN110880002A (zh) * 2018-09-06 2020-03-13 深圳怡化电脑股份有限公司 账号污损去除方法、设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6044179A (en) * 1997-11-26 2000-03-28 Eastman Kodak Company Document image thresholding using foreground and background clustering
US6055336A (en) * 1996-11-18 2000-04-25 Canon Kabushiki Kaisha Image processing system which converts multi-value image data into binary image data
US6122407A (en) * 1997-12-19 2000-09-19 Electronics For Imaging, Inc. Method and apparatus for producing threshold arrays using variance minimization and sparse image calculations
CN1420472A (zh) * 2001-11-21 2003-05-28 松下电器产业株式会社 彩色文献图像的自适应二值化方法和设备
CN1536526A (zh) * 2003-03-15 2004-10-13 ���ǵ�����ʽ���� 用于识别图象字符的预处理设备和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055336A (en) * 1996-11-18 2000-04-25 Canon Kabushiki Kaisha Image processing system which converts multi-value image data into binary image data
US6044179A (en) * 1997-11-26 2000-03-28 Eastman Kodak Company Document image thresholding using foreground and background clustering
US6122407A (en) * 1997-12-19 2000-09-19 Electronics For Imaging, Inc. Method and apparatus for producing threshold arrays using variance minimization and sparse image calculations
CN1420472A (zh) * 2001-11-21 2003-05-28 松下电器产业株式会社 彩色文献图像的自适应二值化方法和设备
CN1536526A (zh) * 2003-03-15 2004-10-13 ���ǵ�����ʽ���� 用于识别图象字符的预处理设备和方法

Also Published As

Publication number Publication date
CN101727583A (zh) 2010-06-09

Similar Documents

Publication Publication Date Title
CN101727583B (zh) 用于文档图像的自适应二值化方法和设备
Huang et al. Thresholding technique with adaptive window selection for uneven lighting image
Bataineh et al. An adaptive local binarization method for document images based on a novel thresholding method and dynamic windows
Trier et al. Evaluation of binarization methods for document images
US9675247B2 (en) Alpha-matting based retinal vessel extraction
US11295417B2 (en) Enhancing the legibility of images using monochromatic light sources
KR101402442B1 (ko) 이미지 처리 디바이스 및 방법
CN109544561A (zh) 细胞标注方法、系统和装置
CN111767920A (zh) 感兴趣区域的提取方法、装置、电子设备及存储介质
CN114219732A (zh) 基于天空区域分割和透射率细化的图像去雾方法及系统
Shi et al. Rcrn: Real-world character image restoration network via skeleton extraction
US7130085B2 (en) Half-tone dot elimination method and system thereof
Abdullah et al. Novel Adaptive Binarization Method for Degraded Document Images.
Zemouri et al. Restoration based Contourlet Transform for historical document image binarization
Sultana et al. Design and development of fpga based adaptive thresholder for image processing applications
CN112364871A (zh) 基于改进投影算法的零件喷码字符分割方法
CN111476226A (zh) 一种文本定位方法、装置及模型训练方法
CN111179289A (zh) 一种适用于网页长图宽图的图像分割方法
US9269126B2 (en) System and method for enhancing the legibility of images
CN114882582A (zh) 基于联邦学习模式的步态识别模型训练方法与系统
Csóka et al. Recognition of sign language from high resolution images using adaptive feature extraction and classification
Wu et al. Recursive algorithms for image segmentation based on a discriminant criterion
CN111815658B (zh) 一种图像识别方法及装置
Zagoris et al. Bio-inspired modeling for the enhancement of historical handwritten documents
Subramani et al. A novel binarization method for degraded tamil palm leaf images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130320

Termination date: 20211022

CF01 Termination of patent right due to non-payment of annual fee