CN1365483A

CN1365483A - 图像二值化的方法

Info

Publication number: CN1365483A
Application number: CN00808969A
Authority: CN
Inventors: 贝尔卡塞姆·本尤; 席切姆·埃尔本诺斯
Original assignee: SOLISTEC
Current assignee: SOLISTEC
Priority date: 1999-06-15
Filing date: 2000-06-14
Publication date: 2002-08-21
Anticipated expiration: 2020-06-14
Also published as: JP4447194B2; PT1190371E; IL146485A0; WO2000077718A1; US7057595B1; IL146485A; ES2204616T3; CN1158625C; CA2376757A1; DE60005189T2; ATE249653T1; EP1190371A1; NO20016133D0; FR2795205B1; CA2376757C; DE60005189D1; DK1190371T3; FR2795205A1; NO20016133L; AU5221000A

Abstract

本方法用以将具有几个灰度级的数字图像(A)转变成为二进制图像(F),该图像中的每个像素以1比特进行编码。在具有几个灰度级的数字图像的每个当前图像(P)执行几种不同的并行的二值化处理(T1、T2、T3),每种处理对这个当前的像素都传送出一个二进制值为其输出。再将具有几个灰度级的数字图像的每个当前像素执行各种二值化处理而传送的二进制值进行组合,以获得一个最终结果的二进制值,来构成二进制图像的相应像素。

Description

图像二值化的方法

技术领域：

本发明涉及一种用以将具有若干灰度级的数字图像转变为二值图像的方法，二值图像的每个像素以1比特被编码。这种方法尤其适用于自动邮件处理机。在邮件的自动处理过程中，通常要提供一个摄像机，设置在提取单元与分类单元之间，提取单元用于从堆架上提取各项邮件，分类单元用于分类这些邮件。摄像机对每项邮件的外表面上印写着该邮件的目的地地址产生一个数据图像，该图像具有若干灰度级。这个具有若干灰度级的数字图像用于执行自动识别地址字符，随后自动读出该地址，以便于下游的分类单元操作。

背景技术：

采用自动字符识别处理可使图像二值化，也即，使图像中的每个像素以单一比特被编码。在具有若干灰度级的数字图像中，每个像素通常以1个字节也即以8比特被编码。

迄今为止，为了将具有若干灰度级的数字图像转换成二进制图像，邮件处理部门对于具有若干灰度级的数字图像的每个像素，业已应用借助于计算该像素的某个相邻区内的本地对比度过程中所构成的动态阈值来进行处理，该对比度可使得计算一个本地的阈值成为可能，将该像素的灰度级与这个本地的阈值相比较，以对该二进制图像中相应的像素进行编码。例如，如果当前像素的灰度级小于或等于该像素的本地对比度，则该二进制图像的相应像素为白色。在相反的情况下，它为黑色。为此，该二进制图像只包括黑像素或白像素。对于具有若干灰度级的数字图像的二值化来说，还有其它的处理方法，例如静态阈值处理方法，这种处理方法是将待二值化的图像中的每个像素的灰度级与一个固定的阈值相比较；还可利用算子进行处理，例如梯度、拉普拉斯算子和标准偏差等。

在邮政邮件部门内，各项邮件上面所打印的字符会呈现很大的差异性，其原因是各国在邮件项目上所打印的地址和使用不同的打印配套的承受物方面各有各的具体实践。为此，对很宽范围的邮件项目都采用同一种二值化处理时，对该二进制图像的质量也会呈现很大的差异性，这就使得具有若干灰度级的图像总是不能保持原有的几何结构或字符的连贯性；总是不能考虑到在该二进制图像中字符非常密集时这些字符之间的连续性和在异常粗浓时笔迹的间断点。类似的情况是，对于二进制图像中构成字符形成的基元特性而言，在对比度微弱时往往不能复原，并且在该二进制图像内的字符打印配套的承受物上的污点可能会呈现出来。

发明内容：

本发明的目的是提出一种能够克服上述缺点的、用以将具有若干灰度级的数字图像转变成为二进制图像的方法。

为此目的，本发明的主题就是一种用以将具有若干灰度级的数字图像转变成为二进制图像的方法，在该二进制图像中的每个像素以1比特被编码，在应用中对于具有若干灰度级的数字图像的每个当前像素而言，这种结构包括几个不同的而且并行的二值化处理，每个处理对当前像素都传送出一个二进制值作为输出，组合对具有若干灰度级的数字图像的每个当前像素所执行的各种二值化处理时所传送出来的二进制值，以获得一个最终结果的二进制值，它构成该二进制图像中相应的像素。

这种多项处理方法最佳地考虑到邮件项目中具有若干灰度级的数字图像内的字符打印的差异性。组合二值化处理所输出的二进制值可使得该适合于将明确编码的二进制图像内的像素作为待处理的邮件项目的具体特性的一个函数成为可能。

二值化处理可以包括：动态或静态阈值型的带通处理，借助于微分型(梯度、拉普拉斯算子)计算算子的高通处理，和借助于积分器型计算算子的低通处理。

根据本发明的方法的特点，这些二值化处理可利用一个神经分类器来部分地被实现。对于待二值化处理的数字图像的每个像素而言，该神经分类器与代表该图像内这个像素的环境特征的一个数值的矢量一起提供，神经分类器在这个矢量特征值的基础上为该像素产生一个二进制值。应用神经分类器特别有利于在同一台机器上处理不同种类的邮件项目。这是因为它足以执行多个学习阶段，针对已展现出邮件不同种类的具体特性的各批邮件项目，训练神经分类器以便为神经分类器建立多个神经原加权组，将这些不同的神经原加权组保存在自动邮件处理机中的存储器内。能够通过装入最佳地适合于邮件项目类型的神经原加权组，方便地使二值化程序自适应于一定种类型式的邮件项目。

附图说明：

下文将结合以下附图详细地描述根据本发明的方法及其实施例。

图1示出根据本发明的方法的原理图。

图2示出具有若干灰度级的数字图像的9×9像素的窗口。

具体实施方式：

根据本发明的用以将具有若干灰度级的数字图像转变成为二进制图像的方法具体在自动邮件处理机中实施。

下文将一个具有若干灰度级的数字图像看作是由像素方形栅格构成的图像，该像素方形栅格的每毫米具有具体的像素密度，例如，在两个方向内均为每毫米8个像素。该图像中的每个像素例如8比特来编码，则总的动态范围为256个灰度级。

图1示出根据本发明的方法借助于对图像A以流水线方式并行地应用几种不同的二值化处理，例如T1、T2、T3处理实现的、将具有若干灰度级的数字图像A转变成为二进制图像F。每个二值化处理都传送出一个二进制的中间图像作为输出，由T1、T2和T3处理分别产生的二进制图像B、E、D的像素在判决处理T4中进行组合，以得出一个最终结果的二进制图像F，图像F的像素不是白的就是黑的。

一个附加的形态滤波处理T5有利于作用于图像F，以产生一个质量优于图像F的图像G。具体地说，该处理T5可使白像素或黑像素从图像F的背景内和轮廓内以及该图像中白和黑两类像素的边界处消除掉。

每个二值处理诸如T1、T2和T3通常都是迭代处理，作用到图像A中的所有像素上；我们将二值化处理的迭代的过程被处理的图像A的当前像素标志为P。

能够并行的二值化处理包括带通型、高通型或低通型处理。图1所示的二值化处理是静态阈值处理例如T3或动态阈值的本地对比度处理例如T2，它们是两种带通型处理。在静态阈值处理中，当前像素的灰度级简单地与一个固定的阈值相比较，以便指配数值0或1，它们分别对应于例如二进制图像D中白像素或黑像素或相应的像素。动态阈值的原理已在上文说明了。

根据本发明的方法的原理是获得对图像A的每个像素作许多不同的二值化处理而并行地产生二进制值1或0，也就是说，它们是图像B、E、D中相对应的像素；再组合这些二进制值1或0，以将二进制图像F的相应像素编码为1或0。可以理解，组合二进制值可使这个或那个二值化处理作为待处理的邮件项目类型的一个函数成为可能，以便获得最终结果的二进制图像F。这种组合还可以根据择多判决原理。

根据本发明的方法将某些并行的二值化处理可以由一个神经分类器来执行。具体地说，正如在图1中所见到的，处理T1的输出是神经分类器的输出。为了简化随后的描述起见，图像A中当前像素P的相邻区表达为像素所构成的一个方形的矩阵，当前像素P位于矩阵的中心。图2示出像素P的相邻区是由一个9×9像素的方形矩阵构成的，例如像素个数为1到8。

神经分类器可以是具有一个或多个隐匿层的MLP(多层视感控制)型的。这种神经分类器的工作原理是将代表图像A的当前像素P的环境特性的数据的矢量转译成为一个二进制值。例如，该神经分类器可以具有10个神经原的一个输入层，将当前像素P的10个数据特性作用在这个输入层之上，这些数据特性是通过计算基元P0至P9来抽取的，下文详细描述这个非限制性例子。

基元P0简单地抽取出当前像素P的灰度级。该数据对应于256个灰度级之一，并且按照1个字节进行编码。

基元P1、P2和P3分别计算图像A中像素P的不同相邻区，典型地是在3×3像素的矩阵、7×7像素的矩阵和13×13像素的矩阵中的平均灰度级。

基元P4和P5分别计算图像A中像素P的不同相邻区内典型地是7×7像素的矩阵和13×13像素矩阵中像素的灰度级的最大偏差。

基元P6和P7分别计算像素P的不同相邻区内典型地是7×7像素的方矩阵和13×13像素方矩阵的像素的灰度级的标准偏差。

基元P8计算像素P的相邻区内典型地是13×13像素矩阵中的局域对比度值。在这里这个基元部分地对应于二值化处理T2。

最后，基元P9在像素P的相邻区内典型的是在3×3像素矩阵内在四个方向上抽取梯度。

神经分类器的神经原加权值是根据本方法和根据背向传播，学习合成的二进制图像而获得的。将这些图像合成，以在把神经原网络定向在需要的方向上，例如，为了避免粗浓字符变浅，人们应用表示粗浓字符的高比例的合成图像；在标定的情况下这些图像是按比例地表示实际邮件。其优点是执行几个学习阶段以对神经分类器的各神经原建立几组加权值，而每组加权值更具体地适应于某种类型的待处理邮件项目。并行的处理T1、T2和T3可以在ASIC电路内实施并且都可参数化。在应用于邮件处理机的阶段内，处理T2和T3的各种界定阈值的参数、基元P0至P9中的各种计算的参数和处理T1的神经分类器的神经原的各种加权组都可以保存在自动邮件处理机的存储器中，因而可以想像，在对一批特定的邮件项目开始执行一个二值化过程之前，能够有选择性地找出它们，来使ASIC集成电路参数化。

Claims

1.一种用以将具有若干灰度级的数字图像(A)转变成一个二进制图像(F)的方法，在所述图像中的每个像素以1比特进行编码，在具有若干灰度级的数字图像的每个当前像素(P)上进行几种不同的而且并行的二值化处理(T1、T2、T3)，每种处理为这个当前像素都传送出一个二进制值为其输出，对于具有若干灰度级的数字图像的每个当前像素进行各种二值化处理而传送的二进制值进行组合(T4)，以获得一个最终结果的二进制值，用以构成二进制图像中相应的像素。

2.根据权利要求1所述的方法，其特征在于，所述的二值化处理之一(T1)的输出是神经分类器的输出。

3.一种神经分类器在自动邮件处理机内的应用，所述的神经分类器用于将具有若干灰度级的数字图像转变成为二进制图像。

4.根据权利要求3所述的神经分类器的应用，其特征在于，所述的神经分类器利用背向传播而经历几个学习阶段，以便对神经分类器的神经原建立许多不同的加权组，这些各种不同的加权组保存在所述的自动邮件处理机的存储器中，这些加权组可以有选择性地找出来，以便对于一批特定的邮件项目的数字图像进行二值化处理。