CN1365483A - 图像二值化的方法 - Google Patents

图像二值化的方法 Download PDF

Info

Publication number
CN1365483A
CN1365483A CN00808969A CN00808969A CN1365483A CN 1365483 A CN1365483 A CN 1365483A CN 00808969 A CN00808969 A CN 00808969A CN 00808969 A CN00808969 A CN 00808969A CN 1365483 A CN1365483 A CN 1365483A
Authority
CN
China
Prior art keywords
binary
pixel
picture
gray levels
conversion treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN00808969A
Other languages
English (en)
Other versions
CN1158625C (zh
Inventor
贝尔卡塞姆·本尤
席切姆·埃尔本诺斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SOLISTEC
Original Assignee
SOLISTEC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SOLISTEC filed Critical SOLISTEC
Publication of CN1365483A publication Critical patent/CN1365483A/zh
Application granted granted Critical
Publication of CN1158625C publication Critical patent/CN1158625C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

本方法用以将具有几个灰度级的数字图像(A)转变成为二进制图像(F),该图像中的每个像素以1比特进行编码。在具有几个灰度级的数字图像的每个当前图像(P)执行几种不同的并行的二值化处理(T1、T2、T3),每种处理对这个当前的像素都传送出一个二进制值为其输出。再将具有几个灰度级的数字图像的每个当前像素执行各种二值化处理而传送的二进制值进行组合,以获得一个最终结果的二进制值,来构成二进制图像的相应像素。

Description

图像二值化的方法
技术领域:
本发明涉及一种用以将具有若干灰度级的数字图像转变为二值图像的方法,二值图像的每个像素以1比特被编码。这种方法尤其适用于自动邮件处理机。在邮件的自动处理过程中,通常要提供一个摄像机,设置在提取单元与分类单元之间,提取单元用于从堆架上提取各项邮件,分类单元用于分类这些邮件。摄像机对每项邮件的外表面上印写着该邮件的目的地地址产生一个数据图像,该图像具有若干灰度级。这个具有若干灰度级的数字图像用于执行自动识别地址字符,随后自动读出该地址,以便于下游的分类单元操作。
背景技术:
采用自动字符识别处理可使图像二值化,也即,使图像中的每个像素以单一比特被编码。在具有若干灰度级的数字图像中,每个像素通常以1个字节也即以8比特被编码。
迄今为止,为了将具有若干灰度级的数字图像转换成二进制图像,邮件处理部门对于具有若干灰度级的数字图像的每个像素,业已应用借助于计算该像素的某个相邻区内的本地对比度过程中所构成的动态阈值来进行处理,该对比度可使得计算一个本地的阈值成为可能,将该像素的灰度级与这个本地的阈值相比较,以对该二进制图像中相应的像素进行编码。例如,如果当前像素的灰度级小于或等于该像素的本地对比度,则该二进制图像的相应像素为白色。在相反的情况下,它为黑色。为此,该二进制图像只包括黑像素或白像素。对于具有若干灰度级的数字图像的二值化来说,还有其它的处理方法,例如静态阈值处理方法,这种处理方法是将待二值化的图像中的每个像素的灰度级与一个固定的阈值相比较;还可利用算子进行处理,例如梯度、拉普拉斯算子和标准偏差等。
在邮政邮件部门内,各项邮件上面所打印的字符会呈现很大的差异性,其原因是各国在邮件项目上所打印的地址和使用不同的打印配套的承受物方面各有各的具体实践。为此,对很宽范围的邮件项目都采用同一种二值化处理时,对该二进制图像的质量也会呈现很大的差异性,这就使得具有若干灰度级的图像总是不能保持原有的几何结构或字符的连贯性;总是不能考虑到在该二进制图像中字符非常密集时这些字符之间的连续性和在异常粗浓时笔迹的间断点。类似的情况是,对于二进制图像中构成字符形成的基元特性而言,在对比度微弱时往往不能复原,并且在该二进制图像内的字符打印配套的承受物上的污点可能会呈现出来。
发明内容:
本发明的目的是提出一种能够克服上述缺点的、用以将具有若干灰度级的数字图像转变成为二进制图像的方法。
为此目的,本发明的主题就是一种用以将具有若干灰度级的数字图像转变成为二进制图像的方法,在该二进制图像中的每个像素以1比特被编码,在应用中对于具有若干灰度级的数字图像的每个当前像素而言,这种结构包括几个不同的而且并行的二值化处理,每个处理对当前像素都传送出一个二进制值作为输出,组合对具有若干灰度级的数字图像的每个当前像素所执行的各种二值化处理时所传送出来的二进制值,以获得一个最终结果的二进制值,它构成该二进制图像中相应的像素。
这种多项处理方法最佳地考虑到邮件项目中具有若干灰度级的数字图像内的字符打印的差异性。组合二值化处理所输出的二进制值可使得该适合于将明确编码的二进制图像内的像素作为待处理的邮件项目的具体特性的一个函数成为可能。
二值化处理可以包括:动态或静态阈值型的带通处理,借助于微分型(梯度、拉普拉斯算子)计算算子的高通处理,和借助于积分器型计算算子的低通处理。
根据本发明的方法的特点,这些二值化处理可利用一个神经分类器来部分地被实现。对于待二值化处理的数字图像的每个像素而言,该神经分类器与代表该图像内这个像素的环境特征的一个数值的矢量一起提供,神经分类器在这个矢量特征值的基础上为该像素产生一个二进制值。应用神经分类器特别有利于在同一台机器上处理不同种类的邮件项目。这是因为它足以执行多个学习阶段,针对已展现出邮件不同种类的具体特性的各批邮件项目,训练神经分类器以便为神经分类器建立多个神经原加权组,将这些不同的神经原加权组保存在自动邮件处理机中的存储器内。能够通过装入最佳地适合于邮件项目类型的神经原加权组,方便地使二值化程序自适应于一定种类型式的邮件项目。
附图说明:
下文将结合以下附图详细地描述根据本发明的方法及其实施例。
图1示出根据本发明的方法的原理图。
图2示出具有若干灰度级的数字图像的9×9像素的窗口。
具体实施方式:
根据本发明的用以将具有若干灰度级的数字图像转变成为二进制图像的方法具体在自动邮件处理机中实施。
下文将一个具有若干灰度级的数字图像看作是由像素方形栅格构成的图像,该像素方形栅格的每毫米具有具体的像素密度,例如,在两个方向内均为每毫米8个像素。该图像中的每个像素例如8比特来编码,则总的动态范围为256个灰度级。
图1示出根据本发明的方法借助于对图像A以流水线方式并行地应用几种不同的二值化处理,例如T1、T2、T3处理实现的、将具有若干灰度级的数字图像A转变成为二进制图像F。每个二值化处理都传送出一个二进制的中间图像作为输出,由T1、T2和T3处理分别产生的二进制图像B、E、D的像素在判决处理T4中进行组合,以得出一个最终结果的二进制图像F,图像F的像素不是白的就是黑的。
一个附加的形态滤波处理T5有利于作用于图像F,以产生一个质量优于图像F的图像G。具体地说,该处理T5可使白像素或黑像素从图像F的背景内和轮廓内以及该图像中白和黑两类像素的边界处消除掉。
每个二值处理诸如T1、T2和T3通常都是迭代处理,作用到图像A中的所有像素上;我们将二值化处理的迭代的过程被处理的图像A的当前像素标志为P。
能够并行的二值化处理包括带通型、高通型或低通型处理。图1所示的二值化处理是静态阈值处理例如T3或动态阈值的本地对比度处理例如T2,它们是两种带通型处理。在静态阈值处理中,当前像素的灰度级简单地与一个固定的阈值相比较,以便指配数值0或1,它们分别对应于例如二进制图像D中白像素或黑像素或相应的像素。动态阈值的原理已在上文说明了。
根据本发明的方法的原理是获得对图像A的每个像素作许多不同的二值化处理而并行地产生二进制值1或0,也就是说,它们是图像B、E、D中相对应的像素;再组合这些二进制值1或0,以将二进制图像F的相应像素编码为1或0。可以理解,组合二进制值可使这个或那个二值化处理作为待处理的邮件项目类型的一个函数成为可能,以便获得最终结果的二进制图像F。这种组合还可以根据择多判决原理。
根据本发明的方法将某些并行的二值化处理可以由一个神经分类器来执行。具体地说,正如在图1中所见到的,处理T1的输出是神经分类器的输出。为了简化随后的描述起见,图像A中当前像素P的相邻区表达为像素所构成的一个方形的矩阵,当前像素P位于矩阵的中心。图2示出像素P的相邻区是由一个9×9像素的方形矩阵构成的,例如像素个数为1到8。
神经分类器可以是具有一个或多个隐匿层的MLP(多层视感控制)型的。这种神经分类器的工作原理是将代表图像A的当前像素P的环境特性的数据的矢量转译成为一个二进制值。例如,该神经分类器可以具有10个神经原的一个输入层,将当前像素P的10个数据特性作用在这个输入层之上,这些数据特性是通过计算基元P0至P9来抽取的,下文详细描述这个非限制性例子。
基元P0简单地抽取出当前像素P的灰度级。该数据对应于256个灰度级之一,并且按照1个字节进行编码。
基元P1、P2和P3分别计算图像A中像素P的不同相邻区,典型地是在3×3像素的矩阵、7×7像素的矩阵和13×13像素的矩阵中的平均灰度级。
基元P4和P5分别计算图像A中像素P的不同相邻区内典型地是7×7像素的矩阵和13×13像素矩阵中像素的灰度级的最大偏差。
基元P6和P7分别计算像素P的不同相邻区内典型地是7×7像素的方矩阵和13×13像素方矩阵的像素的灰度级的标准偏差。
基元P8计算像素P的相邻区内典型地是13×13像素矩阵中的局域对比度值。在这里这个基元部分地对应于二值化处理T2。
最后,基元P9在像素P的相邻区内典型的是在3×3像素矩阵内在四个方向上抽取梯度。
神经分类器的神经原加权值是根据本方法和根据背向传播,学习合成的二进制图像而获得的。将这些图像合成,以在把神经原网络定向在需要的方向上,例如,为了避免粗浓字符变浅,人们应用表示粗浓字符的高比例的合成图像;在标定的情况下这些图像是按比例地表示实际邮件。其优点是执行几个学习阶段以对神经分类器的各神经原建立几组加权值,而每组加权值更具体地适应于某种类型的待处理邮件项目。并行的处理T1、T2和T3可以在ASIC电路内实施并且都可参数化。在应用于邮件处理机的阶段内,处理T2和T3的各种界定阈值的参数、基元P0至P9中的各种计算的参数和处理T1的神经分类器的神经原的各种加权组都可以保存在自动邮件处理机的存储器中,因而可以想像,在对一批特定的邮件项目开始执行一个二值化过程之前,能够有选择性地找出它们,来使ASIC集成电路参数化。

Claims (4)

1.一种用以将具有若干灰度级的数字图像(A)转变成一个二进制图像(F)的方法,在所述图像中的每个像素以1比特进行编码,在具有若干灰度级的数字图像的每个当前像素(P)上进行几种不同的而且并行的二值化处理(T1、T2、T3),每种处理为这个当前像素都传送出一个二进制值为其输出,对于具有若干灰度级的数字图像的每个当前像素进行各种二值化处理而传送的二进制值进行组合(T4),以获得一个最终结果的二进制值,用以构成二进制图像中相应的像素。
2.根据权利要求1所述的方法,其特征在于,所述的二值化处理之一(T1)的输出是神经分类器的输出。
3.一种神经分类器在自动邮件处理机内的应用,所述的神经分类器用于将具有若干灰度级的数字图像转变成为二进制图像。
4.根据权利要求3所述的神经分类器的应用,其特征在于,所述的神经分类器利用背向传播而经历几个学习阶段,以便对神经分类器的神经原建立许多不同的加权组,这些各种不同的加权组保存在所述的自动邮件处理机的存储器中,这些加权组可以有选择性地找出来,以便对于一批特定的邮件项目的数字图像进行二值化处理。
CNB008089698A 1999-06-15 2000-06-14 图像二值化的方法 Expired - Fee Related CN1158625C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR99/07545 1999-06-15
FR9907545A FR2795205B1 (fr) 1999-06-15 1999-06-15 Procede pour binariser des images numeriques a plusieurs niveaux de gris

Publications (2)

Publication Number Publication Date
CN1365483A true CN1365483A (zh) 2002-08-21
CN1158625C CN1158625C (zh) 2004-07-21

Family

ID=9546796

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008089698A Expired - Fee Related CN1158625C (zh) 1999-06-15 2000-06-14 图像二值化的方法

Country Status (16)

Country Link
US (1) US7057595B1 (zh)
EP (1) EP1190371B1 (zh)
JP (1) JP4447194B2 (zh)
CN (1) CN1158625C (zh)
AT (1) ATE249653T1 (zh)
AU (1) AU5221000A (zh)
BR (1) BR0011652A (zh)
CA (1) CA2376757C (zh)
DE (1) DE60005189T2 (zh)
DK (1) DK1190371T3 (zh)
ES (1) ES2204616T3 (zh)
FR (1) FR2795205B1 (zh)
IL (1) IL146485A (zh)
NO (1) NO20016133L (zh)
PT (1) PT1190371E (zh)
WO (1) WO2000077718A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311394C (zh) * 2003-01-30 2007-04-18 三星电子株式会社 用于二进制化图像的设备和方法
CN100409250C (zh) * 2003-10-20 2008-08-06 武汉矽感科技有限公司 自适应被扫描图像底色的二值化电路及其方法
CN102542270A (zh) * 2010-11-16 2012-07-04 手持产品公司 操作地处理彩色图像数据的方法和系统
CN102722881A (zh) * 2010-11-16 2012-10-10 手持产品公司 可操作地处理单色图像数据的方法和系统
CN102542270B (zh) * 2010-11-16 2016-12-14 手持产品公司 操作地处理彩色图像数据的方法和系统
CN114827625A (zh) * 2022-04-27 2022-07-29 武汉大学 一种基于灰度图压缩算法的高速图像云传输方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002271611A (ja) 2001-03-14 2002-09-20 Fujitsu Ltd 画像処理装置
JP2003298799A (ja) * 2002-04-01 2003-10-17 Pfu Ltd 画像処理装置
FR2851357B1 (fr) * 2003-02-19 2005-04-22 Solystic Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images
US7496237B1 (en) * 2004-01-02 2009-02-24 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image processing for binarization enhancement via fuzzy reasoning
US8787690B2 (en) 2008-11-12 2014-07-22 Abbyy Development Llc Binarizing an image
US8098945B2 (en) * 2008-11-12 2012-01-17 Abbyy Software Ltd. Method and system for binarizing an image
US8594446B2 (en) 2012-01-12 2013-11-26 Eastman Kodak Company Method for enhancing a digitized document
EP2645305A3 (en) * 2012-03-26 2014-05-14 Tata Consultancy Services Limited A system and method for processing image for identifying alphanumeric characters present in a series
KR102516366B1 (ko) 2018-05-30 2023-03-31 삼성전자주식회사 특징 데이터 획득 방법 및 장치
DE112020001041T5 (de) * 2019-03-29 2022-01-27 Rohm Co., Ltd. Halbleiterbauelement, fahrzeug-anzeigesystem mit halbleiterbauelement und elektronisches gerät

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5091965A (en) * 1990-07-16 1992-02-25 Sony Corporation Video image processing apparatus
FR2709361B1 (fr) * 1993-08-26 1995-09-22 Thepaut Andre Reconnaissance de forme par réseau de neurones.
JPH07271907A (ja) * 1994-03-31 1995-10-20 Suzuki Motor Corp アナログ画像の二値化装置
JPH0830728A (ja) * 1994-07-12 1996-02-02 Suzuki Motor Corp 画像の二値化装置
JPH096957A (ja) * 1995-06-23 1997-01-10 Toshiba Corp 濃度画像の2値化方法および画像2値化装置
KR19990014752A (ko) * 1996-03-13 1999-02-25 요트.게.아.롤페즈 필터링 방법 및 대응 필터링 시스템
US5815606A (en) * 1996-12-23 1998-09-29 Pitney Bowes Inc. Method for thresholding a gray scale matrix
US6269353B1 (en) * 1997-11-26 2001-07-31 Ishwar K. Sethi System for constructing decision tree classifiers using structure-driven induction
TW384612B (en) * 1998-08-19 2000-03-11 Acer Peripherals Inc Image processing system and method capable of converting gray-level images into binary images

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1311394C (zh) * 2003-01-30 2007-04-18 三星电子株式会社 用于二进制化图像的设备和方法
CN100409250C (zh) * 2003-10-20 2008-08-06 武汉矽感科技有限公司 自适应被扫描图像底色的二值化电路及其方法
CN102542270A (zh) * 2010-11-16 2012-07-04 手持产品公司 操作地处理彩色图像数据的方法和系统
CN102722881A (zh) * 2010-11-16 2012-10-10 手持产品公司 可操作地处理单色图像数据的方法和系统
CN102722881B (zh) * 2010-11-16 2016-11-23 手持产品公司 可操作地处理单色图像数据的方法和系统
CN102542270B (zh) * 2010-11-16 2016-12-14 手持产品公司 操作地处理彩色图像数据的方法和系统
CN114827625A (zh) * 2022-04-27 2022-07-29 武汉大学 一种基于灰度图压缩算法的高速图像云传输方法

Also Published As

Publication number Publication date
ES2204616T3 (es) 2004-05-01
IL146485A0 (en) 2002-07-25
NO20016133D0 (no) 2001-12-14
CA2376757C (en) 2010-08-10
CN1158625C (zh) 2004-07-21
CA2376757A1 (en) 2000-12-21
AU5221000A (en) 2001-01-02
WO2000077718A1 (en) 2000-12-21
IL146485A (en) 2005-07-25
EP1190371B1 (en) 2003-09-10
FR2795205A1 (fr) 2000-12-22
PT1190371E (pt) 2004-01-30
NO20016133L (no) 2002-02-15
FR2795205B1 (fr) 2001-07-27
DE60005189T2 (de) 2004-07-15
DK1190371T3 (da) 2003-12-01
ATE249653T1 (de) 2003-09-15
EP1190371A1 (en) 2002-03-27
BR0011652A (pt) 2002-03-26
JP4447194B2 (ja) 2010-04-07
DE60005189D1 (de) 2003-10-16
JP2003502739A (ja) 2003-01-21
US7057595B1 (en) 2006-06-06

Similar Documents

Publication Publication Date Title
US10872271B2 (en) Training image-processing neural networks by synthetic photorealistic indicia-bearing images
CN1158625C (zh) 图像二值化的方法
US8995780B2 (en) Compression of digital images of scanned documents
CN111223034B (zh) 基于深度学习的大容量抗打印/拍摄盲水印系统及方法
JP2007158510A5 (zh)
DE60219918T2 (de) Klassifikation von bildblöcken basierend auf der entropie von pixeldifferenzen
CN114022383A (zh) 一种文字图像的摩尔纹祛除方法、装置及电子设备
Abd-Elhafiez et al. An efficient color image compression technique
CN114519788A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
CN1723466A (zh) 处理皮肤印迹图像的方法
CN114066861A (zh) 一种基于交叉算法边缘检测理论和视觉特征的煤矸识别方法
Zhu et al. Chip surface character recognition based on improved LeNet-5 convolutional neural network
Etemad et al. Document page segmentation by integrating distributed soft decisions
JP5457853B2 (ja) 画像符号化装置、画像符号化方法、プログラム及び記憶媒体
Cemil et al. Signature recognition and verification with ANN
Korde et al. Splicing Detection Technique Based on the Key-Point
CN116129463A (zh) 面向端到端神经网络的动物检测方法、装置、设备及介质
Shamgholi et al. Document Image Dewarping Based on Text Line Detection and Surface Modeling
CN115439675A (zh) 一种基于机器视觉的复杂特征目标的识别与分类方法
CN118172290A (zh) 一种基于多级自适应CNN与混合Transformer的唐卡图像修复方法、系统及存储介质
Polat et al. 3-D Object recognition using 2-D Poses Processed by CNNs and a GRNN
CA2201557A1 (en) Degraded character image restoration
Pinho et al. Some results on edge enhancement with neural networks
JPH02254574A (ja) ノイズ除去方式

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040721

Termination date: 20140614

EXPY Termination of patent right or utility model