JPH11120333A - 文書画像2値化装置 - Google Patents

文書画像2値化装置

Info

Publication number
JPH11120333A
JPH11120333A JP9294850A JP29485097A JPH11120333A JP H11120333 A JPH11120333 A JP H11120333A JP 9294850 A JP9294850 A JP 9294850A JP 29485097 A JP29485097 A JP 29485097A JP H11120333 A JPH11120333 A JP H11120333A
Authority
JP
Japan
Prior art keywords
value
background
threshold
image
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9294850A
Other languages
English (en)
Inventor
Yoshihiro Shima
好博 嶋
Masashi Koga
昌史 古賀
Tatsuhiko Kagehiro
達彦 影広
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9294850A priority Critical patent/JPH11120333A/ja
Publication of JPH11120333A publication Critical patent/JPH11120333A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 文書の中で、特に、郵便物表面の画像を2値
化するのに好適な2値化装置を提供することにある。 【解決手段】 画像を走査して得られる濃淡画像に対し
て、注目画素の周辺に最大値フィルタ301を設定し、
該最大値フィルタを画像の走査と同期して移動させ、注
目画素に対応する最大値フィルタの出力を背景値として
検出し、背景値と該背景値に対応する閾値とからなる閾
値テーブル302を設けておき、注目画素に対応する背
景値により閾値テーブル302を参照して閾値を求め、
求められた閾値と注目画素の注目画素値とを比較して
(303)、該注目画素値を2値化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、濃淡画像から白黒
の2値画像を生成する2値化処理に係り、特に、多様な
文書の文字読み取りにおいて、文書の背景濃度の変動に
対して安定した2値画像を得る文書画像2値化装置に関
する。
【0002】
【従来の技術】従来の帳票OCRでは、読み取り対象の
帳票が限定されており、通常、JIS 規格で背景と文字と
の光学特性が規定されたOCR専用用紙を推奨してい
る。また、市販の帳票やプリンタ出力帳票の読み取りで
は紙面が白く、文字とのコントラストが鮮明な帳票に限
定している。多様な紙(色付き封筒など)が使用される
郵便物に帳票OCRの2値化手法を直接適用することは
できない。また、帳票OCRでは、使用する筆記具が鉛
筆、ボールペンに限定されている。従来の帳票OCRの
2値化手法は、文字の線幅に影響を受け、線幅の狭い、
鉛筆、ボールペンに適した2値化手法となっている。こ
のため、郵便物に記載されるような文字の線幅が太い毛
筆やサインペンの文字画像に、帳票OCRの2値化手法
を直接適用することはできない。
【0003】文書画像の2値化手法は、2つの観点から
分類できる。一つ目の観点は、しきい値を決定するため
の処理対象範囲の大きさの観点であり、(a)画像の全領
域(画像全面領域)、(b)画像をメッシュ状に分割した
領域や、一本または複数本の走査線の領域(短冊状領
域)、(c)注目する画素を中心とする隣接微小領域(局
所領域)、のそれぞれの領域を処理する手法に大別され
る。また、二つ目の観点は、しきい値を決定するための
画像の特徴量の観点であり、 画像濃淡値の頻度分布(頻度分布)、 画像濃淡値の平均値、中央値、最大値、最小値(順位
値)、 画像濃淡値の1次微分や2次微分など濃淡の変化値
(微分値)、のそれぞれの特徴量を処理する手法に区別
される。
【0004】従来提案されている各種の2値化手法は、
これら処理範囲並びに特徴量の組み合わせにより分類す
ることができる。代表的な2値化手法として、N.Otsu,
“A Threshold Selection Method from Graylevel Imag
es,”IEEE Trans. System, Man, and Cybernetics, vo
l.9, No.1,pp.62-66, 1979.に記載されている手法で、
(a)とを組み合わせ、画像全面領域において頻度分布
を生成し、頻度分布の山や谷からしきい値を決定する手
法がある。この手法は、白地に黒色の文字が記載されて
いる文書のように頻度分布の谷が明確に分かれている文
書に適用できるもので、郵便物表面の広告の絵のように
濃淡が段階的に変化する画像に直接適用することはでき
ない。
【0005】また、須田正人、岡沢好高、小島秀隆、
“郵便機械における画像処理技術、”東芝レビュー,19
93,Vol.48, No.7,pp.545-547.に記載の手法で、(b)と
を組み合わせ、抽出した領域(文字行)内の画像濃淡ヒ
ストグラムから2値化しきい値を算出する手法がある。
この手法では、予め領域を抽出するために、別手法で画
像を2値化しておく必要があり、処理が煩雑になるとい
う問題がある。
【0006】J.M.White and G.D.Rohrer,“Image thres
holding for character image extraction and other a
pplications requiring character image extractio
n,”IBM Journal of research and Development, Vol 2
7, No.4, pp.400-411, July, 1983.に記載の手法で、
(b)とを組み合わせた手法として、1走査線ごとに求
めた濃淡の平均値をもとにしきい値を決定する手法があ
る。この手法では、1走査線内の濃淡の変化が大きい画
像に対して安全な2値画像を得ることはできない。
【0007】さらに、 John Bernsen,“Dynamic Thresh
olding of Grey-level Images,”Proc. of 8th ICPR‘8
6, October 27-31, 1986, Paris, pp.1251-1255.に記載
の手法で、(c)とを組み合わせ、局所領域において濃
淡の最大値と最小値の平均値を基にしきい値を設定する
手法がある。また、同じく、 E.Giuliano, O.Paitra an
d L.Stringa,“Electronic character reading syste
m,”US Patent No.4,047,152 dated Sept 6, 1977.に記
載の手法で、(c)とを組み合わせ、局所領域の中央付
近と周辺付近のそれぞれの平均値を求めこれらの平均値
を比較してしきい値を決定する手法がある。同じく、
P.W.Palumbo, Sargur M. Srihari, Jung Soh,Ramalinga
m Sridhar,and Victor Demjanenko(State University o
f New York at Buffalo),“PostalAddress Block Locat
ion in Real Time,”Computer,July 1992, pp.34-42.に
記載の手法で、(c)とを組み合わせ、マスク8x8の
空間フィルタリングの出力値をルックアップテーブルを
用いて2値化する手法がある。さらに、 D.Marr and E.
Hildreth,“The detection of intensity changes byco
mputer and biological vision systems,”Computer Vi
sion Graphics and Image Processing, 22, pp.1-27,19
83.に記載の手法で、(c)とを組み合わせ、画像の広域
成分を強調して2値化する手法がある。
【0008】
【発明が解決しようとする課題】2値化手法の内、画像
の全領域(画像全面領域)に対してしきい値を設定する
上述の(a)手法は、郵便物の下地が均一でなく、タック
シールが貼り付いていたり、広告の絵があったりするた
め、直接(a)手法を適用することはできない。また、(b)
の短冊状領域にしきい値を決定する手法は、予め、短冊
状領域として宛名領域や文字行領域を抽出しなければな
らず、このため別の2値化手法を併用する必要がある。
このため、処理が煩雑になるという問題がある。一方、
(c)の注目する画素を中心とする隣接微小領域(局所領
域)においてしきい値を設定する手法は、郵便物の下地
の変動に対応でき、また処理が単純であるという利点が
ある。また、画像濃淡値の頻度分布は、局所領域にお
いて画像濃淡値の頻度分布を生成することは、回路規模
が複数になるという問題がある。また、濃度の変化値
(微分値)は、下地のわずかな汚れやしわ等紙質の変化
に敏感であり、安定な2値画像を得るための調整が複雑
になる恐れがある。
【0009】したがって、本発明の目的は、文書の中
で、特に、郵便物表面の画像を2値化するのに好適な2
値化装置を提供することにあり、特に、上記(c)との
手法に基づき、与えられた画素(注目画素)に対して2
値化(黒と白)を決定するためのしきい値を注目画素の
周囲の画素を参照して設定する2値化装置を提供するこ
とにある。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、文書の表面画像を濃淡画像として入力
し、白黒2値画像を出力する文書画像2値化装置におい
て、注目画素の周辺に最大値フィルタを設定し、該最大
値フィルタを画像の走査と同期して移動させ、注目画素
に対応する最大値フィルタの出力を背景値として検出す
る背景値検出手段と、前記背景値と該背景値に対応する
閾値とからなる閾値テーブルと、前記背景値検出手段か
ら出力された注目画素に対応する背景値により前記閾値
テーブルを参照して閾値を出力するテーブル参照手段
と、該テーブル参照手段から出力された閾値と前記注目
画素の注目画素値とを比較して該注目画素値を2値化す
る2値化手段を備えるようにしている。
【0011】また、文書の表面画像を濃淡画像として入
力し、白黒2値画像を出力する文書画像2値化装置にお
いて、注目画素の周辺にサイズの異なる複数の最大値フ
ィルタを設定し、該各最大値フィルタを画像の走査と同
期して移動させ、注目画素に対応する各最大値フィルタ
の出力を各背景値として検出する背景値検出手段と、前
記各背景値対応に設けられた、前記背景値と該背景値に
対応する閾値とからなる複数の閾値テーブルと、前記各
背景値対応に設けられた、前記背景値検出手段から出力
された注目画素に対応する背景値により前記閾値テーブ
ルを参照して閾値を出力する複数のテーブル参照手段
と、前記各背景値対応に設けられた、該テーブル参照手
段から出力された閾値と前記注目画素の注目画素値を比
較して該注目画素値を2値化する複数の2値化手段と、
前記複数の2値化手段の出力から1つの2値化値を選択
する選択手段を備えるようにしている。
【0012】また、前記閾値テーブルは、背景値に対応
する注目画素値を白色とする白色領域と黒色とする黒色
領域の境界を示すデータを背景値に対応する閾値とする
ようにしている。
【0013】また、前記選択手段は、前記各背景値の内
の予め決められた背景値と所定値を比較し、該比較結果
に基づき前記複数の2値化手段の出力から1つの2値化
値を選択するようにしている。
【0014】
【発明の実施の形態】最初に、郵便物認識システムにつ
いて概略の説明をする。郵便物認識システムの構成は、
図1に示すように、郵便物表面の濃淡値をCCD一次元
センサで獲得し、画像入力部100にて濃淡画像を2値
画像に変換する。そして、宛名領域抽出部および郵便番
号枠抽出部101において、この2値画像に対して宛名
領域および郵便番号枠を抽出する。次いで、文字行抽出
部102にて文字行を抽出し、宛名行識別部ならびに郵
便番号枠行識別部103にて、宛名行や郵便番号枠行を
選択する。文字行単位に、文字切出し104、文字識別
105を行い、識別結果に対して住所辞書を用いた知識
処理106を行い、郵便番号コードや宛名コードを出力
する。一方、2値画像に対して、郵便物表面のカスタマ
バーコードの行を抽出し、バーコードを読み取る。
【0015】本認識システムの内、画像入力部は、図2
に示すように、A/D変換部200、シェーディング補
正部201、ガンマ補正部202、適応2値化部20
3、微小ノイズ除去部204からなる。これらの内、シ
ェーディング補正部201では、照明光学系ならびに撮
像光学系に起因する濃淡の変化、例えば、視野内の中央
部が明るく周辺部が暗い等の明るさのむらを除去する。
ガンマ補正部202では、コントラストの悪い画像を良
くするよう濃度変換を行う。ここでは、入力対出力画像
の変換テーブルを使用する。適応2値化部203では、
局所領域の周辺部分における濃度の最大値と局所領域に
おける中央付近の濃淡値を基にテーブルルックアップに
よりしきい値を設定する。
【0016】図3は、本発明の適応2値化装置の一実施
例の基本構成を示す。注目画素の周囲に文字サイズ程度
の微小領域(周囲領域)を設定し、その周囲領域の複数
の画素の濃淡値と注目画素の濃淡値を比較する。濃淡値
は、暗い方が値が小さく、明るくなるに従って値が大き
くなる。もし、周囲領域の濃淡値と比較して、注目画素
の濃淡値が小さく、十分暗ければ、その注目画素を黒色
とする。周囲領域には複数個の画素が存在しており、本
装置では、これら複数個の画素の濃淡値の最大値を文字
の周囲の紙面の明るさに相当する背景値として抽出し、
この背景値に対応するしきい値と注目画素の濃淡値とを
比較する。なお、背景値として、周囲領域において、隣
接する画素値の平均値を求め、この平均値の周囲領域に
おける最大値を検出してもよい。
【0017】濃淡画像は横方向、次いで縦方向に順次走
査(ラスタ走査)される。この走査と同期して、横方向
N画素、縦方向N画素の窓領域において濃淡値の最大値
を検出する最大値フィルタ301を走査する。この最大
値フィルタ301の出力値を紙面の明るさに相当する背
景値とする。しきい値テーブル302と呼ぶルックアッ
プテーブルを具備しており、しきい値テーブルを参照す
ることによって、背景値から2値化のためのしきい値を
決定する。そして、2値化部303において、注目する
画素値としきい値とを比較し、白黒2値画像を得る。
【0018】図4の401に示すように、注目画素値が
背景値で決まるしきい値(t(背景値)、tはテーブルを
意味する。)より十分小さければ、注目画素を黒色とす
る。一方、402に示すように、背景値で決まるt(背
景値)より注目画素値が大きければ、注目画素を白色と
する。なお、403に示すように、注目画素値が所定値
(しきい値 p0)より小さい場合、背景値の大きさに拘わ
らず、注目画素を黒色とする。この理由は、線幅が太く
最大値フィルタの窓領域全面が文字線部となる場合、最
大値フィルタの出力である背景値は、紙面の明るさを反
映せず、文字線部の明るさとなり、単純にこの背景値を
用いて2値化を決定すると、太い線の中央付近の濃さが
多少薄く、明るくなっている場合には、太い線の中央付
近に白色の穴が発生するという問題が起こるためであ
る。
【0019】しきい値テーブルは、背景値を参照してし
きい値を読み出すルックアップテーブルである。図5
は、背景値としきい値の関係、および、しきい値による
注目画素値の2値化を説明するための図である。図にお
いて、横軸501は背景値Bであり、縦軸502は注目
画素値Pであり、503はしきい値p0を示し、504
〜505はしきい値(t(背景値))を示す折線であり、
505はしきい値(t(背景値))がしきい値p0である
ことを表し、504はt(背景値)を表す。背景値Bが0
〜qまでは、しきい値(t(背景値))はしきい値p0を
取り、背景値Bがq以上のときは、しきい値は折曲り点
(q,p)を始点とする傾きaの直線で表されるt(背景
値)を取る。ここで、pとp0は同じ値である。図5に示
すように、注目画素値が、その背景値の値においてしき
い値を示す折線の上側の領域510に属するときは、注
目画素は白色と判定され、折線の下側の領域511に属
するときは、注目画素は黒色と判定される。このしきい
値を表わす線分は予備実験により試行錯誤的に設定す
る。しきい値テーブルは、図5に示す背景値としきい値
の関係をテーブルで表したものである。
【0020】本発明の適応2値化装置における処理の手
順は、図6に示すように、濃淡画像に対して、ステップ
601、602において、縦方向および横方向に走査し
ながら、注目画素が白色か黒色かを決定する。先ず、ス
テップ603にて注目画素の位置を基に最大値フィルタ
の位置座標を設定する。そして、ステップ604にてフ
ィルタ窓内の画素値よりその最大値を検出し、背景値と
する。また、ステップ605にて濃淡値である注目画素
値を設定する。次いで、ステップ606にて、しきい値
テーブルを参照して背景値からしきい値を設定する。ス
テップ607にて、もし、注目画素値がしきい値より大
きい場合、ステップ608にて注目画素を白色とする。
一方、注目画素値がしきい値より小さい場合、ステップ
609にて注目画素を黒色とする。以上の処理を、縦方
向および横方向に走査しながら画像全域に対して行う。
【0021】図7に、画像の座標系を示す。注目画素の
位置712を(x,y)で表わす。図中太線で囲った部分は
3×3最大値フィルタを示している。図8は、同じく画
像の座標系を示し、注目画素の位置812を(x,y)で表
わし、太線で囲った部分は9×9最大値フィルタを示し
ている。ここで、画像710の横方向をx軸701、縦
方向702をy軸とする。入力する濃淡画像f(x,y)に
おいて、一定間隔で画素を取り出す。その標本化の間隔
を横方向ζ703、縦方向η704で表わす。標本化後
の画像の座標(x',y')は、 x=ζ・x' y=η・y' で表わされる。最大値フィルタのサイズを横方向N,縦
方向Nとし、注目画素に対する最大値フィルタの出力値
である背景値b(x,y)によりしきい値テーブルを参照し
て、しきい値(t(b(x,y)))を求める。求められたし
きい値を用いて、注目画素の白黒判定をし、2値化画像
g(x,y)を求める。 g(x,y)= 0 if f(x,y) < t(b(x,y)) = 1 if f(x,y) >= t(b(x,y)) となる。ここで、'0'は黒を表し、'1'は白を表す。
【0022】次に、最大値フィルタのサイズが異なる3
つの適応2値化装置の実施例を説明する。 〈I法〉 9x9最大値フィルタに基く適応2値化装置 最大値フィルタのサイズを横方向N=9,縦方向N=9とす
る。入力画像の精細さが8ドット/mmであり、フィルタ
のサイズが縦横それぞれ9ドットとすると、フィルタの
窓の寸法は縦横、約1.1mmとなる。筆記具としてボール
ペンを用いて記載した文字は細字であり、フィルタの窓
内に明るい下地の背景が含まれる。従って、フィルタの
窓内の最大値を求めることにより背景の濃淡値を検出す
ることが容易である。それに対して、毛筆のように太字
の場合、フィルタの窓内全域が暗い文字線部となり、単
純に背景値を検出することはできない。そこで、前述し
たように注目画素値がしきい値p0より小さい場合、背
景値の大きさに拘わらず、注目画素を黒色としている。
ただし、毛筆文字の濃さが淡い場合、文字部分の注目画
素値が明るくなり、太い線の中央付近に白色の穴が発生
するという問題は依然として残る。
【0023】一方、ここで用いるしきい値p0を大きい
値(明るい値)に設定し、注目画素値がしきい値p0よ
り小さい場合、背景値の大きさに拘わらず、注目画素を
黒色とする論理をより多くはたらかせた場合、緑色や青
色の封筒では下地の濃淡値が低く、文字だけでなく下地
も黒くなるという問題がある。特に、入力画像として
は、郵便番号枠を落とすため、赤色成分画像を使用して
おり、緑色や青色の封筒の下地が黒くなり文字と背景の
分離が困難となる郵便物がある。従って、本装置は、年
賀状のように太い毛筆で記載された郵便物の2値化には
適しておらず、細字であるボールペン記載、印刷活字の
郵便物やバーコードには有効である。9x9最大値フィ
ルタの回路規模は後述の27x27最大値フィルタと比べて
小さい点が、実装上の利点である。
【0024】〈II法〉 27x27最大値フィルタに基く適
応2値化装置 最大値フィルタのサイズを、横方向801 N=27,縦方
向802 N=27とする。入力画像の精細さが8ドット/mm
である場合、フィルタのサイズ27x27ドットでは、フィ
ルタの窓は縦横、約3.4mmとなる。筆記具がボールペン
のように細字の場合、フィルタの窓内に明るい下地の背
景が含まれ、背景値を検出できる。また、毛筆のように
太字の場合であっても、フィルタの窓内に明るい背景が
含まれる割合が高く、正しい背景値を検出することがで
きる。ただし、フィルタの窓サイズ以上に太い文字があ
る場合、前述の9x9最大値フィルタと同じく、極めて太
い線の中央付近に白色の穴が発生するという問題は依然
として残る。ただし、大部分の毛筆郵便物の文字太さは
27x27最大値フィルタのサイズより小さく、実用上は問
題がないと考える。
【0025】本装置ではフィルタの窓内での明るさの最
大値を背景値としており、最大値フィルタのサイズが9x
9と比較して、27x27の最大値フィルタの方が窓が大き
く、背景値が明るい方に移行する。特に、背景の変動が
大きい場合、背景値がより明るい方に移行し、このた
め、背景の濃淡の変化部分において、暗い部分が黒色の
ノイズとなることがある。従って、しきい値テーブルに
格納するしきい値を精密に決定する必要がある。27x27
最大値フィルタの回路規模は前述の9x9最大値フィルタ
と比べて大きくなる点が、実装上不利である。
【0026】〈III法〉 最大値フィルタサイズ動的切
換え型適応2値化装置 サイズの異なる2つの最大値フィルタを備え、これら2
つの最大値フィルタでそれぞれ画像を走査し、注目画素
に対する2値化画像g(x,y)をそれぞれの最大値フィル
タ毎に求め、得られた2つの2値化画像の内の一方を選
択することにより2値化画像を得るものである。
【0027】図9に最大値フィルタサイズ動的切換え型
適応2値化装置を説明するブロック図を示す。ここで、
サイズの異なる2つの最大値フィルタの内、一方の最大
値フィルタ900のサイズをN1xN1、標本化間隔ζ,ηと
し、注目画素に対する背景値をb1(x,y)とし、この背景
値b1(x,y)により、しきい値テーブル901を参照し
て、しきい値であるt1(背景値)を得る。この時、2値
化画像g1(x,y)は、2値化部902において、 g1(x,y)=0 if f(x,y) < t1(b1(x,y)) =1 if f(x,y) >= t1(b1(x,y)) として得られる。
【0028】次に、他方の最大値フィルタ910のサイ
ズをN2xN2、標本化間隔ζ,ηとし、注目画素に対する背
景値をb2(x,y)とし、この背景値b1(x,y)により、しき
い値テーブル911を参照して、しきい値であるt2(背
景値)を得る。ただし、N1<N2とする。この時、2値化画
像g2(x,y)は、2値化部912において、 g2(x,y)=0 if f(x,y) < t2(b2(x,y)) =1 if f(x,y) >= t2(b2(x,y)) として得られる。
【0029】本適用2値化装置の出力g3(x,y)は、N1xN
1最大値フィルタから得られた背景値を903に設定
し、所定値thと比較し、2値化画像g1(x,y),g2(x,y)
を選択部920にて切換える。つまり、 とする。
【0030】本装置では、大部分の毛筆の郵便物の文字
の太さは27x27最大値フィルタのサイズより小さく、こ
のため、白色の穴が発生せず、実用上は問題がない。ま
た、本装置ではフィルタサイズを動的に切換えるため、
背景の濃淡の変化部分において、黒色のノイズが発生す
る頻度が、27x27最大値フィルタと比較して少ない。従
って、安定した2値画像が得られる。
【0031】図10は、図9に示した構成に対応する回
路構成を示す。ラインメモリ1000を3本具備してお
り、まず、3x3画素の濃淡画素1001(各四角(□)は
1画素を示す)から、最大値検出部(1)1002にて3x3
画素に対する最大値検出を行う。さらに、3本の水平線
ごとに遅延させるラインメモリ1003を具備し、10
04で示す最大値検出部(1)で得られた3x3画素に対する
最大値検出値9個(ここで、各四角(□)は3x3画素に対
する最大値検出値を示す)について、最大値検出部(2)
1005にて最大値検出を行う。これにより9x9最大値
フィルタによる最大値検出出力、すなわち背景値が得ら
れる。この背景値により、背景閾値テーブル(しきい値
テーブル)1006を参照して、しきい値を設定し、2
値化部1008にて2値化画像1020(g1(x,y))を
得る。さらに、1009で示したラインメモリを具備し
ており、最大値検出部(2)1005で得られた最大値検
出値9個(それぞれ1010で示す)について、最大値
検出部(3)1011にて最大値検出を行う。これにより
最大値検出部(3)1011にて27x27画素の範囲の背景値
を検出し、この背景値により、背景閾値テーブル(しき
い値テーブル)1012を用い、しきい値を設定し、2
値化部1013にて2値画像1021(g2(x,y))を得
る。大小比較部1015にて、最大値検出部(2)で得ら
れた背景値と所定値に基づき、得られた二つの2値化画
像1020、1021を選択するための情報を得て、選
択部1016にて出力の2値化画像1022を得る。
【0032】
【発明の効果】本発明の2値化装置では、背景の明るさ
が均一でなく、また、文字の濃淡値がまちまちであるよ
うな変動の大きい画像に対する安定した2値化画像を得
られる。また、様々な筆記用具、特に、サインペンや毛
筆などで記載した太字の文字認識に適した2値化画像が
得られる。さらに、バーコードと文字の両方に適してい
る。
【図面の簡単な説明】
【図1】郵便物認識システムの構成を示す図である。
【図2】画像入力部の構成を示す図である。
【図3】本発明の適応2値化装置の一実施例の基本構成
を示す図である。
【図4】適応2値化を説明するための図である。
【図5】しきい値テーブルを説明するための図である。
【図6】適応2値化処理の処理手順を示す図である。
【図7】画像の座標系と3x3画素の最大値フィルタを説
明するための図である。
【図8】画像の座標系と9x9画素の最大値フィルタを説
明するための図である。
【図9】最大値フィルタサイズ動的切換え型適応2値化
装置を説明するためのブロック図である。
【図10】図9に示した構成に対応する回路構成を示す
図である。
【符号の説明】
301 最大値フィルタ 302 閾値テーブル 900、910 最大値フィルタ 901、911 閾値テーブル 902、912 2値化部 903 選択設定部 920 2値化画像選択部

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文書の表面画像を濃淡画像として入力
    し、白黒2値画像を出力する文書画像2値化装置におい
    て、 注目画素の周辺に最大値フィルタを設定し、該最大値フ
    ィルタを画像の走査と同期して移動させ、注目画素に対
    応する最大値フィルタの出力を背景値として検出する背
    景値検出手段と、 前記背景値と該背景値に対応する閾値とからなる閾値テ
    ーブルと、 前記背景値検出手段から出力された注目画素に対応する
    背景値により前記閾値テーブルを参照して閾値を出力す
    るテーブル参照手段と、 該テーブル参照手段から出力された閾値と前記注目画素
    の注目画素値とを比較して該注目画素値を2値化する2
    値化手段を備えることを特徴とする文書画像2値化装
    置。
  2. 【請求項2】 文書の表面画像を濃淡画像として入力
    し、白黒2値画像を出力する文書画像2値化装置におい
    て、 注目画素の周辺にサイズの異なる複数の最大値フィルタ
    を設定し、該各最大値フィルタを画像の走査と同期して
    移動させ、注目画素に対応する各最大値フィルタの出力
    を各背景値として検出する背景値検出手段と、 前記各背景値対応に設けられた、前記背景値と該背景値
    に対応する閾値とからなる複数の閾値テーブルと、 前記各背景値対応に設けられた、前記背景値検出手段か
    ら出力された注目画素に対応する背景値により前記閾値
    テーブルを参照して閾値を出力する複数のテーブル参照
    手段と、 前記各背景値対応に設けられた、該テーブル参照手段か
    ら出力された閾値と前記注目画素の注目画素値を比較し
    て該注目画素値を2値化する複数の2値化手段と、 前記複数の2値化手段の出力から1つの2値化値を選択
    する選択手段を備えることを特徴とする文書画像2値化
    装置。
  3. 【請求項3】 請求項1または請求項2記載の文書画像
    2値化装置において、 前記閾値テーブルは、背景値に対応する注目画素値を白
    色とする白色領域と黒色とする黒色領域の境界を示すデ
    ータを背景値に対応する閾値とすることを特徴とする文
    書画像2値化装置。
  4. 【請求項4】 請求項2記載の文書画像2値化装置にお
    いて、 前記選択手段は、前記各背景値の内の予め決められた背
    景値と所定値を比較し、該比較結果に基づき前記複数の
    2値化手段の出力から1つの2値化値を選択することを
    特徴とする文書画像2値化装置。
JP9294850A 1997-10-13 1997-10-13 文書画像2値化装置 Pending JPH11120333A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9294850A JPH11120333A (ja) 1997-10-13 1997-10-13 文書画像2値化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9294850A JPH11120333A (ja) 1997-10-13 1997-10-13 文書画像2値化装置

Publications (1)

Publication Number Publication Date
JPH11120333A true JPH11120333A (ja) 1999-04-30

Family

ID=17813070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9294850A Pending JPH11120333A (ja) 1997-10-13 1997-10-13 文書画像2値化装置

Country Status (1)

Country Link
JP (1) JPH11120333A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7805000B2 (en) 2000-05-01 2010-09-28 Minolta Co., Ltd. Image processing for binarization of image data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7805000B2 (en) 2000-05-01 2010-09-28 Minolta Co., Ltd. Image processing for binarization of image data

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4323328B2 (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
US5647027A (en) Method of image enhancement using convolution kernels
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
CN101599125A (zh) 复杂背景下图像处理的二值化方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
JP2000184202A (ja) 走査により生成した画像上における垂直方向に並んだパタ―ンを除去するための画像処理システム
JP5870745B2 (ja) 画像処理装置、二値化閾値算出方法及びコンピュータプログラム
US9076225B2 (en) Image processing device, an image processing method and a program to be used to implement the image processing
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2000182115A (ja) 紙葉類の状態識別装置と紙葉類の汚れ具合識別装置と紙葉類の印刷状態識別装置と紙葉類の表裏識別装置
JPH11120333A (ja) 文書画像2値化装置
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JPH09511598A (ja) ピクセル・データをバイナリー化するための方法と装置
JP2861860B2 (ja) 宛名行抽出装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP3268542B2 (ja) 微細文字画像の拡大方法
JPH09238256A (ja) 画像処理方法及び画像処理装置
JP3949954B2 (ja) ドロップアウトカラー識別処理プログラム、方法、および装置
JP2613211B2 (ja) 画像入力装置
JP3281786B2 (ja) 点字複写装置
Cracknell et al. A colour classification approach to form dropout
JP2000331118A (ja) 画像処理装置及び記録媒体