CN102867180A - 灰度字符图像归一化装置和灰度字符图像归一化方法 - Google Patents
灰度字符图像归一化装置和灰度字符图像归一化方法 Download PDFInfo
- Publication number
- CN102867180A CN102867180A CN2011101911817A CN201110191181A CN102867180A CN 102867180 A CN102867180 A CN 102867180A CN 2011101911817 A CN2011101911817 A CN 2011101911817A CN 201110191181 A CN201110191181 A CN 201110191181A CN 102867180 A CN102867180 A CN 102867180A
- Authority
- CN
- China
- Prior art keywords
- character image
- gray
- grayscale character
- grayscale
- background colour
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明提供了一种灰度字符图像归一化装置和一种灰度字符图像归一化方法。所述灰度字符图像归一化包括:灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
Description
技术领域
本发明涉及字符识别技术,尤其涉及灰度字符识别技术。
背景技术
传统的OCR(Optical Character Recognition-光学字符识别)技术专注于扫描文档中的文字识别。一般情况下,在前景和背景容易区分的情况下,传统的基于二值图像的字符识别可获得较高的识别精度。近年来,越来越多的字符识别需求来自于基于照相机的文档图像、web图像和自然场景图像。在这些图像中,文字往往不够清晰,背景也不够干净。进一步而言,低分辨率、模糊、畸变、光照变化和复杂背景等诸多会使图像质量降低的因素容易在这些图像中出现。所有这些因素使得自然场景图像中的文字识别非常困难,极具挑战性。很难准确地将文字从这些图像中分割出来,由此,传统的二值字符识别方法不能发挥出原有的功效。
另外,在字符识别引擎中,通常只接受固定大小的字符图像,多数字符图像不能直接满足这一要求。因此,在进行字符识别前,需要归一化到引擎所要求的图像尺寸。在常规的二值字符识别中,需要假定字符图像的背景是干净的、从而易于分割,但自然场景图像往往不能满足这个假设。若要在尺寸归一化中保持字符纵横比(即保形变换),则会在字符周围产生白条,这会对灰度字符识别产生很大的负面影响。
发明内容
本发明鉴于现有技术的上述情况提出,用以克服或缓解因现有技术的缺陷而造成的一种或更多种缺点,至少提供一种有益的选择。
根据本发明的一个方面,提供了一种灰度字符图像归一化方法,所述方法包括:灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
根据本发明的另一个方面,提供了一种灰度字符图像归一化装置,所述装置包括:灰度分布参数获得单元,获得待识别灰度字符图像的灰度分布参数;灰度分布参数归一化单元,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
根据本发明的再一方面,提供了一种逻辑部件可读程序以及存储该逻辑部件可读程序的逻辑部件可读有形存储介质,当所述逻辑部件可读程序被逻辑部件执行时,能够使所述逻辑部件用作本文所述的灰度字符图像归一化装置或使所述逻辑部件实现本文所述的灰度字符图像归一化方法。
应该注意,术语“包括/包含/具有”在本文使用时指特征、要件、步骤或组件的存在,但并不排除一个或更多个其它特征、要件、步骤或组件的存在或附加。
以上的一般说明和以下结合附图的详细说明都是示意性的,不是对本发明的保护范围的限制。
附图说明
从以下参照附图对本发明的详细描述中,将更清楚地理解本发明的以上和其它目的、特征和优点。在附图中,相同或类似的标号指示相同或类似的元素。
图1示出了依据本发明一种实施方式的灰度字符图像灰度分布归一化方法的流程图。
图2是以灰度直方图的方式示出了图1的步骤S103的技术效果的示意图。
图3示出了将待识别的灰度字符图像统一变换为黑底白字的灰度字符图像的情况下,依据本发明实施方式的字符图像保形归一化的流程图。
图4示出了将待识别的灰度字符图像统一变换为白底黑字的灰度字符图像的情况下,依据本发明实施方式的字符图像保形归一化的流程图。
图5示出了本发明的保形归一化方法与常规灰度字符归一化方法的比较。
图6示出了依据本发明一种实施方式的灰度字符图像灰度分布归一化装置的方框图。
图7示出了依据本发明一种实施方式的灰度字符图像尺寸归一化装置。
图8示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框图。
具体实施方式
下面参照附图对本发明的实施方式进行详细的说明。
依据本发明的实施方式,在进行自然场景字符识别时,一般需要进行如下的步骤:
(1)将彩色字符图像灰度化,得到灰度字符图像;
(2)灰度字符图像归一化;
(3)进行灰度字符识别。
本领域已经知道了很多种将彩色图像灰度化的方法,例如常用的彩色图像灰度化方法使用以下公式将RGB值转化为灰度值Gray。
Gray=(R+G+B)/3
Gray=0.301R+0.586G+0.113B
其他的方法也是本领域技术人员所知的,本文不予详述。对灰度字符进行识别,也可以采用本领域所知的各种方法,例如可以采用基于CNN(Convolutional NeuralNetwork,卷积神经网络)分类器的自然场景文字识别方法。
灰度字符图像归一化可以包括灰度字符图像尺寸的归一化和灰度字符图像的灰度分布的归一化这两者或者这两者中的一个。
当灰度字符图像归一化可以包括灰度字符图像尺寸的归一化和灰度字符图像的灰度分布的归一化这两者时,灰度字符图像尺寸的归一化和灰度字符图像的灰度分布的归一化可以按照任意的顺序进行。
下面介绍依据本发明一种实施方式的进行字符图像归一化的方法。
图1示出了依据本发明一种实施方式的灰度字符图像灰度分布归一化的方法的流程图。
如图1所示,依据本发明的一种实施方式的灰度字符图像分布归一化方法,首先,在步骤S101,获得待识别灰度字符图像的灰度分布参数。所述的灰度分布参数例如为该待识别灰度字符图像的灰度级数目(灰度级的数目)以及该待识别灰度字符图像的灰度均值。然后,在步骤S102,利用预先保存的、根据训练字符图像样本(样本图像)所获得的灰度分布参数和所获得的该待识别灰度字符图像的灰度分布参数,对待识别灰度字符图像的各像素的灰度值进行变换,使得所述待识别灰度字符图像的灰度分布参数与训练样本灰度字符图像的灰度分布参数相接近,从而实现所述灰度字符图像灰度分布的归一化。该步骤也称灰度分布校准步骤。
具体地,在一种实施例中,利用以下的公式对该待识别灰度字符图像的各像素的灰度进行变换。
a(x)=s*(x-c)+C
s为灰度范围尺度因子,c为待识别灰度字符图像的灰度均值,C为根据训练样本灰度字符图像所预先获得的灰度均值。x表示待识别灰度字符图像的像素的灰度值,a(x)为转换后的待识别灰度字符图像的像素的灰度值。
在一种实施方式中,s=L/l,其中L为训练样本的灰度字符图像的灰度级的数目,l为所述待识别灰度字符图像的灰度级的数目。
在另一种实施方式中,可以采用以下的公式计算s:
其中参数γ在本领域也称为平滑系数,例如可以取值为2.0,当然根据应用的具体情况和经验,也可以取其他的值。
本发明通过灰度分布归一化,提高了训练样本和测试样本间的一致性,可以提高字符识别系统的性能。
回到图1,依据本发明的一种实施方式,本发明的灰度字符图像灰度分布归一化方法还包括增加经灰度分布校准的所述待识别灰度字符图像的前景色和背景色之间的距离(步骤S103)。
优选地,在增加经灰度分布校准的所述待识别灰度字符图像的前景色和背景色之间的距离的同时,使该经灰度分布校准的待识别灰度字符图像的灰度级数目不变。
在一种实施方式中,可以使用以下的函数来实现所述待识别灰度字符图像的前景色和背景色之间的距离的增大:
其中,l为待识别灰度字符图像的灰度级数目,α为控制增强强度的因子。α可以预先确定。x表示待识别灰度字符图像的像素的灰度值,f(x)为待识别灰度字符图像的像素的转换后的灰度值。
在另一种实施方式中,可以使用以下的函数来实现所述待识别灰度字符图像的前景色和背景色之间的距离的增大:
其中,当前字符图像的灰度范围为[lmin,lmax,l为当前字符图像的灰度级的数目,c为灰度范围中心,α为控制增强强度的因子,x表示待识别灰度字符图像的像素的灰度值,f(x)为待测灰度字符像素的转换后的灰度值。
在另一种实施方式中,可以使用以下的函数来实现所述待识别灰度字符图像的前景色和背景色之间的距离的增大:
其中,l为当前字符图像的灰度级数,c为灰度范围中心,α为控制增强强度的因子,x表示待识别灰度字符图像的像素的灰度值,f(x)为待测灰度字符像素的转换后的灰度值。
应该注意,步骤S103是可选的步骤,也可以省略。由于文字图像本质上是由前景和背景两部分构成的,因而该方法中的步骤S103采用了提高前景(文字)和背景之间的可分性,可以增强灰度文字图像中文字识别信息的可用性。图2是以灰度直方图的方式示出了步骤S103的技术效果的示意图。如图2所示,两个峰分别表示待识别图像的背景灰度和前景灰度,即这两个峰分别为背景峰和前景峰。依据本发明的实施方式,采用步骤S103,可以增加背景峰和前景峰之间的距离,提高系统的性能。
图3示出了将待识别灰度字符图像统一变换为黑底白字的字符图像的情况下,依据本发明一种实施方式的灰度字符图像尺寸保形归一化的方法的流程图。术语黑底白字在本文中是指灰度字符图像的前景色的灰度高于背景色的灰度的情况。类似地,后文中出现的术语白底黑字在本文中是指字符图像的前景色的灰度低于背景色的情况。
如图3所示,依据本发明的一种实施方式的灰度字符图像尺寸归一化方法,首先,在步骤S301,计算灰度字符图像边沿的像素的灰度的均值(均值1)。然后,在步骤S302,计算整个灰度字符图像的全部像素的灰度的均值(均值2)。接着在步骤S303,判断是否是反色的情况,即所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是否与期望的灰度字符图像的前景色与背景色的灰度关系相反。因为在本附图所例示的实施方式中,期望的灰度字符图像是黑底白字的字符图像,即期望的灰度字符图像的前景色的灰度高于背景色的灰度。因而在步骤S303,判断该待识别的灰度字符图像是否为白底黑字的灰度字符图像。在一种实施方式中,比较在步骤S301得到的字符图像的边沿的像素的灰度的均值(均值1)与步骤S302得到的整个灰度字符图像的全部像素的灰度的均值(均值2),如果均值1大于均值2(步骤S303,是),即图像边沿的灰度值较高,则说明其与整体图像相比更白些(例如,在灰度值为(0-255)这256个值时,白像素的灰度为255,而黑像素的灰度为0),该字符图像为反色图像。在这种情况下,处理进行到步骤S304,进行颜色逆转(也可称为灰度逆转)。可以通过将各像素的灰度值改变为最大灰度(例如255)减去该像素的灰度值来得到该像素的新的灰度值,从而实现颜色逆转。另一方面,如果均值1小于均值2(步骤S303,否),即图像边沿的像素与整个图像的整体的像素相比,更黑一些,则说明其不是反色图像,处理直接进行到步骤S305。在步骤S305,估计所述灰度字符图像的背景色。接着,在步骤S306,对该灰度字符图像进行保形归一化,即进行保持字符图像的纵横比的归一化变换。接着在步骤S307,将经保形归一化的所述灰度字符图像的空白区的颜色设定为步骤S305估计出的所述图像区的背景色。在图中所示的实施方式中,在进行背景估计的步骤S305中,将边沿像素的最小灰度值作为背景灰度值。在另一种实施方式中,将所述灰度字符图像的边沿像素的平均灰度确定为所述背景灰度值。
在上面的步骤S301-S304中,将字符图像统一设置成了黑底白字的图像。但本发明也适用于白底黑字的图像。图4示出了将待识别的灰度字符图像统一变换为白底黑字的灰度字符图像的情况下,依据本发明实施方式的字符图像保形归一化的流程图。如图4所示,在要统一变换为白底黑字的图像的字符图像的情况下,在步骤S303的判断为是时,进入步骤S305′的处理,而在步骤S303的判断为否时,进行步骤S304的颜色逆转的处理。另外,在白底黑字的情况下,在步骤S305′中,将边沿像素的最大灰度值作为背景灰度值。同样,在该实施方式中,也可以将所述灰度字符图像的边沿像素的平均灰度确定为所述背景灰度值。
应该注意,在可以预先知道所处理的字符图像是白底黑字字符图像还是黑底白字字符图像的情况下,或者对于该方法的应用的范围有所限制的情况下(例如只想应用于白底黑字字符图像或只想应用于黑底白字字符图像)可以省略步骤S301-S304的操作。
图5示出了本发明的保形归一化方法与常规灰度字符归一化方法的比较。图5a示出了未进行灰度字符归一化的灰度字符图像(即原图),图5b示出了对图5a所示的灰度字符图像采用常规非保形归一化方法后的结果;图5c示出了对图5a所示的灰度字符图像采用常规的保形归一化方法后的结果;图5d示出了使用了依据本发明的灰度字符保形归一化方法所得到的结果。
如图5b所示,未进行保形变换时,字符图像的纵横比出现了较大的变化。如图5c所示,采用常规的保形归一化方法,保形归一化后的图像出现了白条现象。图5d所示的根据本发明的方法得到的归一化后的图像没有以上的问题。
因而,可以看出,利用背景估计和背景填充,本发明很好地解决了常规技术中的白条现象。
图6示出了依据本发明一种实施方式的灰度字符图像灰度分布归一化装置的方框图。如图6所示,依据本发明的一种实施方式的灰度字符图像灰度分布归一化装置包括灰度分布参数确定单元601、灰度分布校准单元602、以及双峰增强单元603。灰度分布参数确定单元601用于确定待识别灰度字符图像的灰度分布参数,例如灰度级数目和灰度平均值。
灰度分布校准单元602根据灰度分布参数确定单元601所确定的灰度分布参数和根据训练图像(训练样本)预先确定的灰度分布参数,对待识别灰度字符图像的各像素的灰度值进行变换,使得所述待识别灰度字符图像的灰度分布与训练样本灰度字符图像的灰度分布接近,从而实现所述灰度字符图像灰度分布的归一化。
双峰增强单元603用于增加经灰度分布校准的所述待识别灰度字符图像的前景色和背景色之间的距离。优选地,在增加经灰度分布校准的所述待识别灰度字符图像的前景色和背景色之间的距离的同时,使该经直方图对准的待识别灰度字符图像的灰度级数目不变。
例如在一种实施方式中,可以使用以下的函数来实现所述待识别灰度字符图像的前景色和背景色之间的距离的增大:
其中,l为当前字符图像的灰度级的数目,α为控制增强强度的因子。α可以预先确定。
图7示出了依据本发明一种实施方式的灰度字符图像尺寸归一化装置。如图7所示,依据本发明的一种实施方式,尺寸归一化装置包括:反色判断单元701、反色纠正单元702、背景估计单元703、保形变换单元704和背景填充单元705。
反色判断单元701计算字符图像边沿的像素的灰度的均值(均值1),并计算整个灰度字符图像的全部像素的灰度的均值(均值2),然后判断是否是反色的情况。例如如果期望的字符图像是白底黑字的图像,则比较该灰度字符图像的边沿的像素的灰度的均值(均值1)与整个灰度字符图像的全部像素的灰度的均值(均值2),如果均值1小于均值2,即图像边沿的灰度值较低,则说明边沿像素的黑度与整体图像的黑度相比更黑些,因而判断出该字符图像为反色图像。另一方面,如果均值1大于均值2,即图像边沿的像素与整个图像的整体的像素相比,更白一些,则说明其不是反色图像。
另一方面,如果期望的字符图像是黑底白字的图像,则比较该灰度字符图像的边沿的像素的灰度的均值(均值1)与整个灰度字符图像的全部像素的灰度的均值(均值2),如果均值1大于均值2,即图像边沿的灰度值较高,则说明边沿像素的黑度与整体图像的黑度相比更白些,因而判断出该字符图像是反色图像。另一方面,如果均值1小于均值2,即图像边沿的像素与整个图像的整体的像素相比,更黑一些,则说明其不是反色图像。
反色纠正单元702将反色图像纠正为期望的图像。例如在期望的灰度字符图像为白底黑字的图像时,将反色图像纠正为白底黑字的图像。这例如可以针对该灰度字符图像的各像素,通过用最大灰度值减去该像素的灰度值作为该像素的新的灰度值而进行所述的纠正。
同样地,在可以预先知道所处理的字符图像是白底黑字字符图像还是黑底白字字符图像的情况下,或者对于该装置的应用的范围有所限制的情况下(例如只想应用于白底黑字字符图像或只想应用于黑底白字字符图像)可以省略该反色判断单元701和该反色纠正单元702。
背景估计单元703估计所述灰度字符图像的背景色。在一种实施方式中,例如在期望的灰度字符图像为白底黑字的图像时,将边沿像素的最大灰度值作为背景灰度值。在期望的灰度字符图像为黑底白字的图像时,将边沿像素的最小灰度值作为背景灰度值。在另一种实施方式中,将所述灰度字符图像的边沿像素的平均灰度确定为所述背景灰度值。
保形归一化单元704,对该灰度字符图像进行保形归一化,即保持字符图像的纵横比的归一化。
背景色填充单元705将所述灰度字符图像的空白区的颜色填充背景估计单元703估计出的所述图像区的背景色。
灰度字符图像灰度分布归一化装置和灰度字符图像尺寸归一化装置可以集成在一起构成灰度字符图像归一化装置。
对装置的描述和对方法的描述可以相互参照、相互理解。在一种实施方式中出现的特征可以以相同或类似的方式应用到另一实施方式,取代该另一实施方式中的特征或与该另一实施方式中的特征一起使用。
本发明首先提出了基于灰度分布校准的灰度分布归一化方法,提高了训练样本和待识别样本间的数据一致性,有助于改善分类精度。通过学习训练样本集上的灰度分布,并以此为基础对待测样本进行灰度分布归一化,使得待测样本具有和训练样本集相似的灰度分布,从而能够提高灰度字符识别的性能。
进一步,由于文字图像本质上是由前景和背景两部分构成的,因而本发明的实施方式的方法中还采用了双峰直方图增强技术来提高前景(文字)和背景之间的可分性,增强了灰度文字图像中文字识别信息的可用性。
另外,在本发明实施方式提出的归一化方法中,通过背景估计和在保形尺寸归一化中的白条部分进行背景填充,避免了白条部分对字符识别的影响。
本发明以上的装置和方法可以由硬件实现,也可以由硬件、固件结合软件实现。例如以上的本发明涉及这样的逻辑部件可读程序,当该程序被逻辑部件所执行(直接执行或解释、编译等后执行)时,能够使该逻辑部件实现上文所述的装置或构成部件,或使该逻辑部件实现上文所述的各种方法或步骤。逻辑部件例如现场可编程逻辑部件、ASIC(应用专用集成电路)、DSP(数字信号处理器)、微处理器、计算机中使用的处理器等。本发明还涉及用于存储以上程序的存储介质,如硬盘、磁盘、光盘、DVD、flash、磁光盘、存储卡、存储棒等等。
图8示出了可用于实施根据本发明实施例的方法和装置的计算机的示意性框图。
在图8中,中央处理单元(CPU)801根据只读存储器(ROM)802中存储的程序或从存储部分808加载到随机存取存储器(RAM)803的程序执行各种处理。在RAM 803中,还根据需要存储当CPU 801执行各种处理等等时所需的数据。CPU 801、ROM 802和RAM 803经由总线804彼此连接。输入/输出接口805也连接到总线804。
下述部件连接到输入/输出接口805:输入部分806(包括键盘、鼠标等等)、输出部分807(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分808(包括硬盘等)、通信部分809(包括网络接口卡比如LAN卡、调制解调器等)。通信部分809经由网络比如因特网执行通信处理。根据需要,驱动器810也可连接到输入/输出接口805。可拆卸介质811比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器810上,使得从中读出的计算机程序根据需要被安装到存储部分808中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质811安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图8所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质811。可拆卸介质811的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 802、存储部分808中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
总之,本发明的实施方式至少提供了以下附记中的技术方案。
附记1、一种灰度字符图像归一化方法,所述方法包括:
灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;
灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
附记2、根据权利要求1所述的方法,其中所述待识别灰度字符图像的灰度分布参数为所述待识别灰度字符图像的灰度级数目以及所述待识别灰度字符图像的灰度均值。
附记3、根据附记2所述的方法,其中利用公式a(x)=s*(x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近,
其中x表示待识别灰度字符图像的像素的灰度值,a(x)为待识别灰度字符图像的像素的转换后的灰度值,s=L/l,L为根据训练样本灰度字符图像获得的灰度级数目,C为根据训练样本灰度字符图像获得的灰度均值,l为所述待识别灰度字符图像的灰度级数目以及c为所述待识别灰度字符图像的灰度均值。
附记4、根据附记2所述的方法,其中利用公式a(x)=s*(x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近,
其中x表示待识别灰度字符图像的像素的灰度值,a(x)为待测灰度字符像素的转换后的灰度值,
其中,γ是平滑系数,L为根据训练样本灰度字符图像获得的灰度级数目,C为根据训练样本灰度字符图像获得的灰度均值,l为所述待识别灰度字符图像的灰度级数目以及c为所述待识别灰度字符图像的灰度均值。
附记5、根据附记1所述的方法,其中所述方法还包括:
双峰增强处理,加大灰度分布参数归一化处理后的所述待识别灰度字符图像的前景色与背景色之间的距离。
附记6、根据附记5所述的方法,其中在所述双峰增强处理中,保持灰度分布参数归一化处理后的所述待识别灰度字符图像的灰度级数目不变。
附记7、根据附记6所述的方法,其中所述双峰增强处理使用以下函数加大灰度分布参数归一化处理后的所述待识别灰度字符图像的前景色与背景色之间的距离:
其中,l为待测字符灰度图像的灰度级数目,α为预先确定的控制增强强度的因子。
附记8、根据附记1所述的灰度字符图像归一化方法,所述方法还包括保形归一化处理,所述保形归一化处理包括以下处理:
估计要进行保形归一化处理的灰度字符图像的图像区的背景色;
对所述要进行保形归一化的灰度字符图像进行保形变换,
将经过所述保形变换的灰度字符图像的空白区的颜色设定为所述图像区的背景色。
附记9、根据附记8所述的方法,其中,所述保形归一化处理还包括:
反色判断步骤,判断所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是否是与期望的灰度字符图像的前景色与背景色的灰度关系相反;
反色纠正步骤,在所述的要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是与期望的灰度字符图像的前景色与背景色的灰度关系相反时,对所述要进行保形归一化的灰度字符图像进行灰度逆转,从而使所述要进行保形归一化的灰度字符图像的前景色与背景色之间的灰度关系与期望的灰度字符图像的前景色与背景色之间的灰度关系相同。
附记10、根据附记9所述的方法,其中,
在所述反色判断步骤中,将所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值与所述要进行保形归一化的灰度字符图像的所有区域的灰度平均值进行比较,
当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度大于背景色的灰度时,则如果所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值大于所述灰度字符图像的所有区域的灰度平均值,判断出所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系与期望的灰度字符图像的前景色与背景色的灰度关系相反,
当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度小于背景色的灰度时,则如果所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值小于所述要进行保形归一化的灰度字符图像的所有像素的灰度平均值,则判断出所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系与期望的灰度字符图像的前景色与背景色的灰度关系相反。
附记11、根据附记8所述的方法,其中在估计所述要进行保形归一化的灰度字符图像的图像区的背景色的处理中,当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度小于背景色的灰度时,在将所述图像区的边沿像素的最大灰度确定为所述背景色,当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度大于背景色的灰度时,在将所述图像区的边沿像素的最小灰度确定为所述背景色。
附记12、根据附记8所述的方法,其中在估计所述要进行保形归一化的灰度字符图像的图像区的背景色的处理中,其中将所述图像区的边沿像素的平均灰度确定为所述背景色。
附记13、一种灰度字符图像归一化装置,所述装置包括:
灰度分布参数获得单元,获得待识别灰度字符图像的灰度分布参数;
灰度分布参数归一化单元,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
附记14、根据附记13所述的装置,其中所述待识别灰度字符图像的灰度分布参数为所述待识别灰度字符图像的灰度级数目以及所述待识别灰度字符图像的灰度均值。
附记15、根据附记14所述的装置,其中利用公式a(x)=s*(x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近,
其中x表示待识别灰度字符图像的像素的灰度值,a(x)为待识别灰度字符图像的像素的转换后的灰度值,s=L/l,L为根据训练样本灰度字符图像获得的灰度级数目,C为根据训练样本灰度字符图像获得的灰度均值,l为所述待识别灰度字符图像的灰度级数目以及c为所述待识别灰度字符图像的灰度均值。
附记16、根据附记14所述的装置,其中利用公式a(x)=s*(x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近,
其中x表示待识别灰度字符图像的像素的灰度值,a(x)为待测灰度字符像素的转换后的灰度值,
其中,γ是平滑系数,L为根据训练样本灰度字符图像获得的灰度级数目,C为根据训练样本灰度字符图像获得的灰度均值,l为所述待识别灰度字符图像的灰度级数目以及c为所述待识别灰度字符图像的灰度均值。
附记17、根据附记13所述的装置,其中所述装置还包括:
双峰增强单元,加大灰度分布参数归一化单元后的所述待识别灰度字符图像的前景色与背景色之间的距离。
附记18、根据附记17所述的装置,其中所述双峰增强单元使保持经所述灰度分布参数归一化单元处理后的所述待识别灰度字符图像的灰度级数目不变。
附记19、根据附记18所述的装置,其中所述双峰增强单元使用以下函数加大经所述灰度分布参数归一化单元处理后的所述待识别灰度字符图像的前景色与背景色之间的距离:
其中,l为待测字符灰度图像的灰度级数目,α为预先确定的控制增强强度的因子。
附记20、根据附记13所述的灰度字符图像归一化装置,所述装置还包括保形归一化单元,所述保形归一化单元包括:
背景色估计单元,估计要进行保形归一化处理的灰度字符图像的图像区的背景色;
保形变换单元,对所述要进行保形归一化的灰度字符图像进行保形变换,
背景色填充单元,将经过所述保形变换的灰度字符图像的空白区的颜色设定为所述图像区的背景色。
附记21、根据附记20所述的装置,其中,所述保形归一化单元还包括:
反色判断单元,判断所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是否是与期望的灰度字符图像的前景色与背景色的灰度关系相反;
反色纠正单元,在所述的要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是与期望的灰度字符图像的前景色与背景色的灰度关系相反时,对所述要进行保形归一化的灰度字符图像进行灰度逆转,从而使所述要进行保形归一化的灰度字符图像的前景色与背景色之间的灰度关系与期望的灰度字符图像的前景色与背景色之间的灰度关系相同。
附记22、根据附记21所述的装置,其中,
所述反色判断单元将所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值与所述要进行保形归一化的灰度字符图像的所有区域的灰度平均值进行比较,
当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度大于背景色的灰度时,则如果所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值大于所述灰度字符图像的所有区域的灰度平均值,判断出所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系与期望的灰度字符图像的前景色与背景色的灰度关系相反,
当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度小于背景色的灰度时,则如果所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值小于所述要进行保形归一化的灰度字符图像的所有像素的灰度平均值,则判断出所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系与期望的灰度字符图像的前景色与背景色的灰度关系相反。
附记23、根据附记20所述的装置,其中当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度小于背景色的灰度时,所述背景色估计单元将所述图像区的边沿像素的最大灰度确定为所述背景色,当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度大于背景色的灰度时,所述背景色估计单元将所述图像区的边沿像素的最小灰度确定为所述背景色。
附记24、根据附记20所述的装置,其中,所述背景色估计单元将所述图像区的边沿像素的平均灰度确定为所述背景色。
附记25、一种字符识别方法,所述方法包括以上附记1到附记12中任一项所述的方法。
附记26、根据附记25所述的字符识别方法,所述方法还包括利用CNN(卷积神经网络)分类器对经灰度分布归一化和保形归一化的灰度字符图像进行字符识别。
附记27、一种逻辑部件可读程序,所述程序在被所述逻辑部件执行时,使所述逻辑部件用作附记13-24中任一项所述的灰度字符图像归一化装置或使所述逻辑部件能够实现权利要求1-12中任一项所述的方法。
附记28、一种有形存储介质,用于存储附记27所述的逻辑部件可读程序。
以上结合具体的实施方式对本发明进行了描述,但本领域技术人员应该清楚,这些描述都是示例性的,并不是对本发明保护范围的限制。本领域技术人员可以根据本发明的精神和原理对本发明做出各种变型和修改,这些变型和修改也在本发明的范围内。
Claims (10)
1.一种灰度字符图像归一化方法,所述方法包括:
灰度分布参数获得处理,获得待识别灰度字符图像的灰度分布参数;
灰度分布参数归一化处理,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
2.根据权利要求1所述的方法,其中利用公式a(x)=s*(x-c)+C使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近,
其中x表示待识别灰度字符图像的像素的灰度值,a(x)为待识别灰度字符图像的像素的转换后的灰度值,s=L/l,L为根据训练样本灰度字符图像获得的灰度级数目,C为根据训练样本灰度字符图像获得的灰度均值,l为所述待识别灰度字符图像的灰度级数目以及c为所述待识别灰度字符图像的灰度均值。
4.根据权利要求1所述的方法,其中所述方法还包括:
双峰增强处理,加大灰度分布参数归一化处理后的所述待识别灰度字符图像的前景色与背景色之间的距离。
5.根据权利要求1所述的灰度字符图像归一化方法,所述方法还包括保形归一化处理,所述保形归一化处理包括以下处理:
估计要进行保形归一化处理的灰度字符图像的图像区的背景色;
对所述要进行保形归一化的灰度字符图像进行保形变换,
将经过所述保形变换的灰度字符图像的空白区的颜色设定为所述图像区的背景色。
6.根据权利要求5所述的方法,其中,所述保形归一化处理还包括:
反色判断步骤,判断所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是否是与期望的灰度字符图像的前景色与背景色的灰度关系相反;
反色纠正步骤,在所述的要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系是与期望的灰度字符图像的前景色与背景色的灰度关系相反时,对所述要进行保形归一化的灰度字符图像进行灰度逆转,从而使所述要进行保形归一化的灰度字符图像的前景色与背景色之间的灰度关系与期望的灰度字符图像的前景色与背景色之间的灰度关系相同。
7.根据权利要求6所述的方法,其中,
在所述反色判断步骤中,将所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值与所述要进行保形归一化的灰度字符图像的所有区域的灰度平均值进行比较,
当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度大于背景色的灰度时,则如果所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值大于所述灰度字符图像的所有区域的灰度平均值,判断出所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系与期望的灰度字符图像的前景色与背景色的灰度关系相反,
当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度小于背景色的灰度时,则如果所述要进行保形归一化的灰度字符图像的图像区的边界像素的灰度平均值小于所述要进行保形归一化的灰度字符图像的所有像素的灰度平均值,则判断出所述要进行保形归一化的灰度字符图像的前景色与背景色的灰度关系与期望的灰度字符图像的前景色与背景色的灰度关系相反。
8.根据权利要求5所述的方法,其中在估计所述要进行保形归一化的灰度字符图像的图像区的背景色的处理中,当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度小于背景色的灰度时,将所述图像区的边沿像素的最大灰度确定为所述背景色,当期望的灰度字符图像的前景色与背景色之间的灰度关系为前景色的灰度大于背景色的灰度时,在将所述图像区的边沿像素的最小灰度确定为所述背景色。
9.根据权利要求5所述的方法,其中在估计所述要进行保形归一化的灰度字符图像的图像区的背景色的处理中,其中将所述图像区的边沿像素的平均灰度确定为所述背景色。
10.一种灰度字符图像归一化装置,所述装置包括:
灰度分布参数获得单元,获得待识别灰度字符图像的灰度分布参数;
灰度分布参数归一化单元,使所述待识别灰度字符图像的灰度分布参数与根据训练样本灰度字符图像所得的灰度分布参数相接近。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101911817A CN102867180A (zh) | 2011-07-08 | 2011-07-08 | 灰度字符图像归一化装置和灰度字符图像归一化方法 |
JP2012152525A JP2013020617A (ja) | 2011-07-08 | 2012-07-06 | グレースケール文字画像正規化装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101911817A CN102867180A (zh) | 2011-07-08 | 2011-07-08 | 灰度字符图像归一化装置和灰度字符图像归一化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102867180A true CN102867180A (zh) | 2013-01-09 |
Family
ID=47446044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101911817A Pending CN102867180A (zh) | 2011-07-08 | 2011-07-08 | 灰度字符图像归一化装置和灰度字符图像归一化方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2013020617A (zh) |
CN (1) | CN102867180A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025452A (zh) * | 2016-01-29 | 2017-08-08 | 富士通株式会社 | 图像识别方法和图像识别设备 |
CN107403176A (zh) * | 2017-03-29 | 2017-11-28 | 北京粉笔未来科技有限公司 | 文本图片中文字背景反色的检测方法和装置 |
CN108229463A (zh) * | 2018-02-07 | 2018-06-29 | 众安信息技术服务有限公司 | 基于图像的文字识别方法 |
CN108288064A (zh) * | 2017-01-09 | 2018-07-17 | 北京京东尚科信息技术有限公司 | 用于生成图片的方法和装置 |
CN109784342A (zh) * | 2019-01-24 | 2019-05-21 | 厦门商集网络科技有限责任公司 | 一种基于深度学习模型的ocr识别方法及终端 |
CN111161247A (zh) * | 2019-12-30 | 2020-05-15 | 凌云光技术集团有限责任公司 | 用于可变码识读字符质量验证的检测方法 |
WO2020253119A1 (zh) * | 2019-06-18 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 图形验证码识别方法、装置、可读存储介质及终端设备 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112021005549A2 (pt) | 2018-10-24 | 2021-06-29 | Fujitsu Frontech Limited | dispositivo de inspeção de notas, método de fiscalização de notas e programa de inspeção de notas |
CN111583247B (zh) * | 2020-05-12 | 2023-11-03 | 中南大学 | 一种图像二值化处理方法及装置 |
CN113111921A (zh) * | 2021-03-19 | 2021-07-13 | 中建科技集团有限公司 | 物体识别方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050046882A1 (en) * | 2003-07-31 | 2005-03-03 | Seiko Epson Corporation | Image forming apparatus, image processing method, program, and image processing apparatus |
CN1914902A (zh) * | 2004-02-03 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 改变屏幕上要显示的图像的宽高比 |
-
2011
- 2011-07-08 CN CN2011101911817A patent/CN102867180A/zh active Pending
-
2012
- 2012-07-06 JP JP2012152525A patent/JP2013020617A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050046882A1 (en) * | 2003-07-31 | 2005-03-03 | Seiko Epson Corporation | Image forming apparatus, image processing method, program, and image processing apparatus |
CN1914902A (zh) * | 2004-02-03 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 改变屏幕上要显示的图像的宽高比 |
Non-Patent Citations (2)
Title |
---|
倪桂博: "印刷体文字识别的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 November 2008 (2008-11-15) * |
张洁玮: "车牌识别系统中定位算法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 January 2008 (2008-01-15), pages 138 - 332 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107025452A (zh) * | 2016-01-29 | 2017-08-08 | 富士通株式会社 | 图像识别方法和图像识别设备 |
CN108288064A (zh) * | 2017-01-09 | 2018-07-17 | 北京京东尚科信息技术有限公司 | 用于生成图片的方法和装置 |
CN107403176A (zh) * | 2017-03-29 | 2017-11-28 | 北京粉笔未来科技有限公司 | 文本图片中文字背景反色的检测方法和装置 |
CN107403176B (zh) * | 2017-03-29 | 2020-02-28 | 北京猿力未来科技有限公司 | 文本图片中文字背景反色的检测方法和装置 |
CN108229463A (zh) * | 2018-02-07 | 2018-06-29 | 众安信息技术服务有限公司 | 基于图像的文字识别方法 |
CN109784342A (zh) * | 2019-01-24 | 2019-05-21 | 厦门商集网络科技有限责任公司 | 一种基于深度学习模型的ocr识别方法及终端 |
WO2020253119A1 (zh) * | 2019-06-18 | 2020-12-24 | 深圳壹账通智能科技有限公司 | 图形验证码识别方法、装置、可读存储介质及终端设备 |
CN111161247A (zh) * | 2019-12-30 | 2020-05-15 | 凌云光技术集团有限责任公司 | 用于可变码识读字符质量验证的检测方法 |
CN111161247B (zh) * | 2019-12-30 | 2023-10-20 | 凌云光技术股份有限公司 | 用于可变码识读字符质量验证的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2013020617A (ja) | 2013-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102867180A (zh) | 灰度字符图像归一化装置和灰度字符图像归一化方法 | |
CN101408973B (zh) | 图像处理方法及其装置 | |
US8035871B2 (en) | Determining target luminance value of an image using predicted noise amount | |
CN106096610B (zh) | 一种基于支持向量机的文档图像二值化方法 | |
EP0712094A2 (en) | A multi-windowing technique for threshholding an image using local image properties | |
JP5810628B2 (ja) | 画像処理装置及び画像処理プログラム | |
US7539351B2 (en) | Model-based line width control | |
US7119924B2 (en) | Detection and segmentation of sweeps in color graphics images | |
CN110490204B (zh) | 图像处理方法、图像处理装置及终端 | |
CN105447491A (zh) | 标识牌图像二值化方法及其装置 | |
CN108288064B (zh) | 用于生成图片的方法和装置 | |
CN113888536B (zh) | 一种基于计算机视觉的印刷品重影检测方法及系统 | |
EP3407589B1 (en) | Image processing apparatus, image processing method, and storage medium | |
CN114240925A (zh) | 一种文档图像清晰度的检测方法及其系统 | |
CN106815814B (zh) | 一种应用于阅卷系统的图像污染处理方法 | |
CN103514595B (zh) | 图像显著区域检测方法 | |
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
CN103530625A (zh) | 一种基于数字图像处理的光学字符识别方法 | |
KR102547864B1 (ko) | 콘크리트 결함 평가 방법 및 이를 수행하는 컴퓨팅 장치 | |
US8086065B2 (en) | Apparatus and method for contrast enhancement | |
KR20190058753A (ko) | 영상 처리 방법 및 이를 수행하는 영상 처리 장치 | |
CN113408517B (zh) | 一种图像显示方法及装置、电子设备 | |
JP2001222683A (ja) | 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体 | |
CN114724145A (zh) | 一种字符图像识别方法、装置、设备及介质 | |
Zhou et al. | An improved algorithm using weighted guided coefficient and union self‐adaptive image enhancement for single image haze removal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130109 |