JP2003525560A

JP2003525560A - イメージ２値化の改良された方法

Info

Publication number: JP2003525560A
Application number: JP2001564084A
Authority: JP
Inventors: ズロトニク、アヴィアド
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2000-03-02
Filing date: 2001-02-21
Publication date: 2003-08-26
Anticipated expiration: 2021-02-21
Also published as: EP1269394A2; MXPA02008296A; AU2001235931A1; ATE383625T1; DE60132315D1; WO2001065465A2; BR0108856A; BRPI0108856B8; EP1269394A4; DE60132315T2; IL151545A; BRPI0108856B1; CA2397805C; CA2397805A1; US6351566B1; JP3953817B2; EP1269394B1; IL151545A0; WO2001065465A3

Abstract

(57)【要約】【課題】それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメージ（２０）を２値化する方法。【解決手段】下閾値と上閾値を判定する。第１の２進値を、上閾値を超えるグレイレベル値を有する、グレイレベル・イメージの画素に割り当て、第２の２進値を、下閾値未満のグレイレベル値を有する、グレイレベル・イメージの画素に割り当てる。下閾値と上閾値の間のグレイレベル値を有する中間グループの画素は、中間グループの画素の第１および第２の２進値への最適の割当てを判定するために処理される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

本発明は、概してイメージ処理の方法および装置に関し、詳細には、グレイレ
ベル・イメージの２値化の方法に関する。

【０００２】

【従来の技術】

イメージ２値化の方法は当技術分野で周知である。一般的に言って、これらの
方法は、各画素が対応する複数ビット・グレイレベル値を有するグレイレベル・
イメージをとり、各画素が黒（前景）または白（背景）の２進値を有するバイナ
リ・イメージに変換する。２値化は、文書に印刷されるか書き込まれた情報を処
理し、保管するために、特に文書イメージを単純化するのに使用される。

【０００３】最も高速で最も単純な２値化方法は、単純に閾値を固定し、その閾値を超える
グレイレベル値を有するすべての画素が白であり、閾値未満の画素が黒であると
判定することである。しかし、この方法は、グレイレベル・イメージに含まれる
情報の消失または混乱をもたらすことがしばしばである。この情報は、主にイメ
ージ内に現れるエッジで実施され、近傍に対する相対輝度ほどに画素の絶対輝度
に依存しない。したがって、閾値の選択に依存して、エッジの両側の画素が同一
の値に２値化される場合に、グレイレベル・イメージの意味のあるエッジが、バ
イナリ・イメージで消えることになる。その一方で、非常に近いグレイレベル値
を有する画素が、選択された閾値の両側に分かれる時に、エッジの外見に伴うバ
イナリ・イメージ内のアーチファクトが、グレイレベル・イメージの連続的な推
移の区域に現れる可能性がある。

【０００４】これらの問題を、下の表によって例示する。表１は、５×５イメージの画素値
を表し、より高い値が、より明るい画素を表す。

【０００５】

【表１】

【０００６】このイメージが、８５の閾値を使用して２値化される場合に、その結果は、表２
に示されたものになる。

【０００７】

【表２】

【０００８】右下の画素を囲む大きいギャップが、２値化されたイメージに表されているが、
他のギャップのすべてが失われている（用語「ギャップ」は、本明細書の文脈お
よび請求項において、隣接する画素の対の間のグレイ・レベルの絶対的な差を示
すのに使用される）。

【０００９】その一方で、閾値を１５にセットした場合には、結果のバイナリ・イメージは
、表３に示されたものになる。

【００１０】

【表３】

【００１１】行２と３の間のサイズ６のギャップは、おそらくはイメージ内の実際のエッジに
対応するが、バイナリ・イメージで表されている。しかし、右下の大きいギャッ
プが失われている。それと同時に、行４と５の間の小さいギャップ（サイズ２）
は、ノイズに起因する可能性があるが、バイナリ・イメージで表されている。し
たがって、グレイレベル・イメージの重要なエッジが失われると同時に、重要で
ないギャップが、アーチファクトを生成することを許容されている。

【００１２】これらの表によって例示される理由から、実用的な２値化アルゴリズムでは、
２値化閾値を変更できるようになっている。これらのアルゴリズムは、一般に、
イメージ全体またはイメージの特定の区域で使用するのに最適の閾値を判定する
際に、イメージ内容に関する前提を設ける。この前提は、イメージ内の物体のサ
イズ、ヒストグラム特性、ノイズ・レベル、または他のイメージ特性に関連する
ものとすることができる。このような前提に依存するので、２値化アルゴリズム
は、それが設計された特定のタイプのイメージまたはオブジェクトに対して良好
に動作するが、それ以外については失敗する傾向を有する。たとえば、テキスト
指向２値化アルゴリズムは、単調な背景の上のテキストを含む文書イメージに対
して良好に動作する可能性があるが、背景がテクスチャ付きである時には失敗す
る可能性がある。さらに、文書イメージには、記号、線、および箱などの単純な
テキスト以外の特徴が含まれることがしばしばであり、これらの特徴は、バイナ
リ・イメージに保存することが重要だが、テキスト指向２値化が使用される時に
失われる。

【００１３】イメージ「３値化」が、文書イメージ処理に関してではないが、グレイレベル
・イメージの処理の方法として提案された。通常、「グレイ」画素値の範囲が、
黒の範囲の低い値と白の範囲の高い値の中間で定義される。結果の３値イメージ
は、複数のイメージ認識およびイメージ相関の応用例で有用であることがわかっ
ている。

【００１４】たとえば、その開示が参照によって本明細書に組み込まれる米国特許第５０６
７１６２号に、通常は指紋分析に基づく、イメージ相関を使用して身元を検証す
る方法および装置が記載されている。指紋イメージのエッジ判定の不確実性およ
び変化性を除去するために、３値化技法を使用して、すべての画素を、黒、灰色
、または白の３つのレベルに分類する。グレイスケール・イメージのグレイ値の
ヒストグラムを判定し、黒と灰色の閾値および灰色と白の閾値を、均等１／３分
布に従って確立する。黒と灰色の閾値より暗いグレイ値を有するすべての画素が
、黒画素に変換され、灰色と白の閾値より明るいグレイ値を有するすべての画素
が、白画素に変換され、それ以外のすべての画素が、後続の相関計算で無視され
る。したがって、黒画素と白画素が、指紋イメージの山と谷の領域を高い信頼性
で表し、灰色画素が、山と谷の間の推移領域を表す。

【００１５】もう１つの例として、その開示が参照によって本明細書に組み込まれる米国特
許第５７１５３２５号に、ビデオ・イメージ内の顔を検出する装置および方法が
記載されている。顔のイメージを処理して、微細な詳細を除去し、強いコントラ
ストを与え、ほとんど２値化されている（暗いブロックと明るいブロックを有す
る）が、まだ明瞭に分類できないブロックがいくつか含まれるイメージをもたら
す。処理の単純さを促進するために、イメージが、３値イメージとして扱われ、
暗い領域が、負の１（−１）を用いて識別され、明るい領域が、１を用いて識別
され、定義不能領域が、０を用いて識別される。３値イメージを、異なる顔テン
プレートと比較して、最適一致を見つける。

【００１６】

【発明が解決しようとする課題】

本発明の目的は、イメージ処理、特に文書イメージの処理の改良された方法お
よび装置を提供することである。

【００１７】本発明のいくつかの態様のもう１つの目的は、イメージ２値化の改良された方
法を提供することである。

【００１８】本発明のいくつかの態様のもう１つの目的は、イメージの３値化の方法を提供
することである。

【００１９】

【課題を解決するための手段】

本発明の好ましい実施形態では、グレイレベル入力イメージが、一般に、バイ
ナリ出力イメージ生成の準備ステップとして、３値化される。入力イメージは、
まず、隣接する画素の値の間のギャップなど、イメージ内の画素のグレイレベル
値の間の変動の特徴を表すために、分析される。この変動に基づいて、上下の２
値化閾値を決定し、上閾値を超えるグレイレベル値を有する画素が、白として分
類され、下閾値未満の画素が、黒として分類されるようにする。上閾値と下閾値
の間のグレイレベル値を有する画素を、以下では中間画素またはグレイ画素と称
するが、これらの画素は、これらの画素の黒または白としての最適分類を判定す
るために処理されることが好ましい。

【００２０】上下の２値化閾値が、出力バイナリ・イメージで保存される入力イメージ内の
重要なエッジの数を増やしながら、発生するアーチファクト・エッジの数を減ら
すように設計される形で選択されることが好ましい。この形でバイナリ・イメー
ジを生成することによって、実質的にイメージ内容のタイプに依存せずに、入力
イメージの特徴が明瞭に伝えられる。異なる閾値の範囲を、画素間のグレイレベ
ル変動に対して評価して、最適の上閾値および下閾値を選択する。評価は、画素
間のグレイレベル・ギャップの統計的分析に基づくことが好ましい。その代わり
にまたは追加して、エッジ検出アルゴリズムによって見つけられた実際のエッジ
など、他の統計的分析および情報の手がかりを、閾値の選択に使用することがで
きる。

【００２１】本発明のいくつかの好ましい実施形態では、中間画素が、他の隣接画素に対す
る関係に基づいて分類される。隣接画素の平均値よりかなり明るい画素は、白と
して分類され、平均値よりかなり暗い画素は、黒として分類されることが好まし
い。この分類は、選択された上下の閾値に依存する必要がない。隣接画素の平均
値から大きく異ならない画素は、通常は、上下の閾値の平均などの閾値を使用し
て分類される。

【００２２】その代わりに、他の方法を適用して、中間画素を分類または他の形で処理する
ことができる。１つの好ましい実施形態では、テキスト指向２値化アルゴリズム
を、グレイレベル・イメージに適用し、中間画素を、このアルゴリズムの結果を
使用して分類する。もう１つの好ましい実施形態では、中間画素のグレイレベル
値を、他の画素の２進値と共に保管する。この形でのイメージの保管は、完全な
グレイレベル・イメージよりはるかに少ないメモリを必要とするが、イメージ内
の重要な情報のほとんどすべてが、イメージが後に人間のオペレータによる処理
または表示のために再呼出しされる時の使用のために保存される。

【００２３】したがって、本発明の好ましい実施形態によれば、イメージ２値化の方法であ
って、それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
ジを受け取ることと、下閾値と、選択された差だけ前記下閾値より大きい上閾値とを判定することと
、前記上閾値より大きいグレイレベル値を有する前記グレイレベル・イメージの
前記画素に第１の２進値を割り当て、前記下閾値未満のグレイレベル値を有する
前記グレイレベル・イメージの前記画素に第２の２進値を割り当てることと、前記下閾値と前記上閾値との間のグレイレベル値を有する中間グループの前記
画素の前記第１の２進値および前記第２の２進値への最適の割当てを判定するた
めに、前記中間グループの前記画素を処理することとを含む方法が提供される。

【００２４】前記下閾値および前記上閾値を判定することが、前記入力イメージの前記画素
の前記グレイレベル値の間の変動を分析することと、前記分析された変動に応答
して前記閾値を判定することとを含むことが好ましい。前記グレイレベル値の間
の前記変動を分析することが、前記入力イメージのエッジを見つけることを含み
、前記閾値を判定することが、前記割り当てられる２進値からなる出力イメージ
で前記エッジを保存するために前記閾値を選択することが、最も好ましい。

【００２５】追加してまたはその代わりに、前記グレイレベル・イメージの間の前記変動を
分析することが、隣接する画素の前記グレイレベル値の間のギャップを見つける
ことを含み、前記閾値を判定することが、前記割り当てられる２進値からなる出
力イメージで、重要でないギャップよりも重要なギャップを優先して保存するよ
うに前記閾値を選択することを含む。前記閾値を選択することが、その絶対的な
大きさが前記上閾値と前記下閾値との間の前記選択された差より大きいものとし
て、意味のある前記ギャップを定義することを含むことが好ましい。前記閾値を
選択することが、上閾値および下閾値の複数の異なる対について計算されるメリ
ット・スコアを最大にするように前記上閾値および前記下閾値を選択することを
含み、前記スコアが、前記選択された閾値によって前記出力イメージで保存され
る意味のあるギャップの数に正に相関し、前記選択された閾値によって前記出力
イメージで、保存される意味のないギャップの数および保存されない意味のある
ギャップの数に負に相関することが、最も好ましい。

【００２６】前記閾値を判定することが、前記割り当てられる２進値からなる出力イメージ
でエッジ情報を保存するように前記閾値を選択することを含むことが好ましい。
前記閾値を選択することが、前記情報が属するイメージ特徴のタイプに実質的に
依存しない閾値を選択することを含むことが、最も好ましい。追加してまたはそ
の代わりに、前記閾値を選択することが、前記上閾値および前記下閾値の最適平
均値を見つけることと、前記閾値の間の前記選択された差の最適値を見つけるこ
ととを含む。

【００２７】前記中間グループの前記画素を処理することが、前記入力イメージの前記画素
の前記グレイレベル値の間の変動を分析することと、前記分析された変動に応答
して前記画素の前記第１の２進値および前記第２の２進値への割り当てを判定す
ることとを含むことが、さらに好ましい。前記分析された変更に応答して前記割
り当てを判定することが、前記画素の１つの前記グレイレベル値とその近傍の他
の画素の前記グレイレベル値との間の意味のある差を見つけることと、前記差に
応答して前記画素に前記第１の２進値または前記第２の２進値を割り当てること
とを含むことが、最も好ましい。

【００２８】好ましい実施形態では、前記中間グループの前記画素を処理することが、前記
中間グループの前記画素の前記最適の割当てを判定するために、テキストについ
て最適化された２値化方法を適用することを含む。

【００２９】前記方法が、前記画素の前記割り当てられた２進値からなるバイナリ・イメー
ジを出力することを含むことが、好ましい。

【００３０】本発明の好ましい実施形態によれば、それぞれのグレイレベル値を有する複数
の画素を含むグレイレベル入力イメージを処理する方法であって、前記入力イメージの前記画素の前記グレイレベル値の間の変動を分析すること
と、前記分析された変動に応答して、下閾値と、選択されたギャップ・サイズだけ
前記下閾値より大きい上閾値とを判定することと、前記上閾値を超えるグレイレベル値を有する前記グレイレベル・イメージの画
素に第１の２進値を割り当て、前記下閾値未満のグレイレベル値を有する前記グ
レイレベル・イメージの画素に第２の２進値を割り当てることと、前記第１の２進値および前記第２の２進値を割り当てられた画素が、そのそれ
ぞれの２進値によって表され、前記下閾値と前記上閾値との間のグレイレベル値
を有する中間グループの画素が、それぞれのグレイレベル値によって表される、
３値出力イメージを生成することとを含む方法も提供される。

【００３１】好ましい実施形態では、前記３値出力イメージを生成することが、前記出力イ
メージを表示することを含む。もう１つの好ましい実施形態では、前記３値出力
イメージを生成することが、前記出力イメージをメモリに保管することを含む。

【００３２】本発明の好ましい実施形態によれば、イメージ２値化の装置であって、イメー
ジ・プロセッサを含み、前記イメージ・プロセッサが、それぞれのグレイレベル
値を有する複数の画素を含むグレイレベル入力イメージを受け取るように結合さ
れ、前記イメージ・プロセッサが、下閾値と、選択された差だけ前記下閾値より
大きい上閾値とを判定し、前記上閾値より大きいグレイレベル値を有する前記グ
レイレベル・イメージの前記画素に第１の２進値を割り当て、前記下閾値未満の
グレイレベル値を有する前記グレイレベル・イメージの前記画素に第２の２進値
を割り当て、前記下閾値と前記上閾値との間のグレイレベル値を有する中間グル
ープの前記画素の前記第１の２進値および前記第２の２進値への最適の割当てを
判定するために、前記中間グループの前記画素を処理するように適合される、装
置が、さらに提供される。

【００３３】本発明の好ましい実施形態によれば、それぞれのグレイレベル値を有する複数
の画素を含むグレイレベル入力イメージを処理する装置であって、前記装置が、
イメージ・プロセッサを含み、前記イメージ・プロセッサが、前記入力イメージ
の前記画素の前記グレイレベル値の間の変動を分析し、前記分析された変動に応
答して、下閾値と、選択されたギャップ・サイズだけ前記下閾値より大きい上閾
値とを判定し、前記上閾値を超えるグレイレベル値を有する前記グレイレベル・
イメージの画素に第１の２進値を割り当て、前記下閾値未満のグレイレベル値を
有する前記グレイレベル・イメージの画素に第２の２進値を割り当て、したがっ
て、前記第１の２進値および前記第２の２進値を割り当てられた画素が、そのそ
れぞれの２進値によって表され、前記下閾値と前記上閾値との間のグレイレベル
値を有する中間グループの画素が、それぞれのグレイレベル値によって表される
、３値出力イメージを生成するように適合される、装置が、さらに提供される。

【００３４】好ましい実施形態では、前記装置が、ディスプレイを含み、前記ディスプレイ
が、前記３値出力イメージを受け取り、表示するために前記プロセッサに結合さ
れる。もう１つの好ましい実施形態では、前記装置が、ストレージ・メモリを含
み、前記ストレージ・メモリが、前記３値出力イメージを受け取り、保管するた
めに前記プロセッサに結合される。

【００３５】本発明の好ましい実施形態によれば、入力イメージを処理するコンピュータ・
ソフトウェア製品であって、プログラム命令をその中に保管されたコンピュータ
可読媒体を含み、前記命令が、コンピュータによって読み取られた時に、前記コ
ンピュータに、それぞれのグレイレベル値を有する複数の画素を含むグレイレベ
ル入力イメージを受け取らせ、下閾値と、選択された差だけ前記下閾値より大き
い上閾値とを判定させ、前記上閾値より大きいグレイレベル値を有する前記グレ
イレベル・イメージの前記画素に第１の２進値を割り当てさせ、前記下閾値未満
のグレイレベル値を有する前記グレイレベル・イメージの前記画素に第２の２進
値を割り当てさせ、前記下閾値と前記上閾値との間のグレイレベル値を有する中
間グループの前記画素の前記第１の２進値および前記第２の２進値への最適の割
当てを判定するために、前記中間グループの前記画素を処理させる、コンピュー
タ・ソフトウェア製品が、さらに提供される。

【００３６】本発明の好ましい実施形態によれば、それぞれのグレイレベル値を有する複数
の画素を含むグレイレベル入力イメージを処理するコンピュータ・ソフトウェア
製品であって、前記製品が、プログラム命令をその中に保管されたコンピュータ
可読媒体を含み、前記命令が、コンピュータによって読み取られた時に、前記コ
ンピュータに、前記入力イメージの前記画素の前記グレイレベル値の間の変動を
分析させ、前記分析された変動に応答して、下閾値と、選択されたギャップ・サ
イズだけ前記下閾値より大きい上閾値とを判定させ、前記上閾値を超えるグレイ
レベル値を有する前記グレイレベル・イメージの画素に第１の２進値を割り当て
させ、前記下閾値未満のグレイレベル値を有する前記グレイレベル・イメージの
画素に第２の２進値を割り当てさせ、前記第１の２進値および前記第２の２進値
を割り当てられた画素が、そのそれぞれの２進値によって表され、前記下閾値と
前記上閾値との間のグレイレベル値を有する中間グループの画素が、それぞれの
グレイレベル値によって表される、３値出力イメージを生成させる、コンピュー
タ・ソフトウェア製品が、さらに提供される。

【００３７】本発明は、その好ましい実施形態の下記の詳細な説明を図面と共に考慮するこ
とから、より完全に理解される。

【００３８】

【発明の実施の形態】

図１から３は、イメージ２値化の異なる方法を比較するために提示された、小
切手２０のイメージの概略複写である。図１は、文書スキャナによって取り込ま
れた、小切手のグレイレベル・イメージである。この小切手には、テクスチャ付
きの背景２４の上に印刷された文字２２が、線２６およびロゴ２８などの他の特
徴と共に含まれる。このような小切手は、納税者によって、所得申告書と一緒に
提出される場合がある。書類のすべてがスキャンされ、そのイメージが、後の参
照のために税務当局によって保管される。イメージは、保管されるデータの量を
減らすために、通常は保管の前に２値化される。線、ロゴ、および他の識別詳細
が、イメージに保存され、その結果、小切手（または他の文書）が、ストレージ
から再呼出しされた時に明瞭に識別できるようになることが、一般に重要である
。

【００３９】図２に、全般的に文書イメージに対して良好に働くアルゴリズムを使用した２
値化の後の小切手のイメージ３０を示す。このアルゴリズムは、単調な背景を有
する文書用に設計され、小切手のテクスチャ付きの背景では失敗する。

【００４０】図３に、特にテキスト用に「調整」されたアルゴリズムを使用した２値化の後
の小切手のイメージ３５を示す。このアルゴリズムは、米国特許出願第０９／３
１０２８７号に記載されている。この場合では、文字は明瞭であるが、線２６お
よびロゴ２８の一部が失われている。図２および３によって示される問題は、本
発明の好ましい実施形態によって克服される。

【００４１】図４を参照するが、この図は、本発明の好ましい実施形態によるイメージ処理
装置４０の概略の絵図である。この装置には、小切手２０（図１）などの文書を
受け取り、スキャンする、スキャナ４２、または当技術分野で既知の他の適当な
タイプのイメージ取込装置が含まれる。スキャナは、文書のグレイスケール・イ
メージを取り込み、対応するイメージ・データをイメージ・プロセッサ４４に伝
え、プロセッサ４４には、通常は、適当な汎用コンピュータが含まれる。その代
わりに、イメージを、別のソースからプロセッサに入力することができる。プロ
セッサ４４は、下で説明する方法を使用して、グレイスケール・イメージを処理
して、文書の３値イメージを生成し、その後、さらに３値イメージを処理して２
値イメージを生成する。３値または２値のイメージは、通常は、モニタ４６に表
示されるか、後の再呼び出しのために大容量記憶装置４８に保管される。イメー
ジを、印刷するかネットワークを介して送信することもでき、また、たとえば当
技術分野で既知の光学文字認識（ＯＣＲ）の方法を使用して、さらに処理するこ
ともできる。

【００４２】プロセッサ４４のイメージ処理機能は、下で詳細に示すように、本発明の実施
形態を実施する、プロセッサ上で稼動するソフトウェアを使用して実行されるこ
とが好ましい。ソフトウェアを、ディスケットまたはＣＤ−ＲＯＭなどの有形の
媒体で供給し、プロセッサにロードすることができる。その代わりに、ソフトウ
ェアを、ネットワーク接続または他の電子リンクを介してプロセッサにダウンロ
ードすることができる。さらに、その代わりに、プロセッサ４４に、イメージ処
理ステップの一部またはすべてを実行するための、専用のハードワイヤド要素ま
たはディジタル信号プロセッサを含めることができる。

【００４３】図５は、本発明の好ましい実施形態による、グレイレベル・イメージを２値化
する方法を概略的に示す流れ図である。イメージ入力ステップ５０で、図１のイ
メージなどのグレイレベル・イメージが、プロセッサ４４に入力される。最適化
ステップ５２で、画素のグレイレベル値と、特に隣接する画素の値の間のギャッ
プを分析して、最適の中央閾値Ｔおよび差値Ｄを見つける。ＴおよびＤによって
、Ｔ＋Ｄ／２によって与えられる上閾値と、Ｔ−Ｄ／２によって与えられる下閾
値が定義される。３値化ステップ５４で、入力イメージ内のすべての画素を、３
つのグループに分類し、下閾値未満のグレイレベル値を有する画素を、黒（また
は前景、通常はバイナリ１）としてマークし、上閾値を越える画素を、白（また
は背景、バイナリ０）としてマークし、上下の閾値の間の画素を、灰色としてマ
ークする。その結果が、３値イメージであり、これを、モニタ４６に表示するか
、メモリ４８に保管することができる。

【００４４】ステップ５２で、ＴおよびＤの値は、出力バイナリ・イメージに保存される入
力イメージの重要なエッジの数を増やすと同時に、発生するアーチファクト・エ
ッジの数が減るように選択される。このために、２つの隣接する画素の間の「意
味のあるギャップ」を、その絶対サイズがＤより大きいギャップと定義する。Ｔ
を２値化閾値として使用して生成される出力バイナリ・イメージＩ（Ｔ）内で、
ギャップの両側の画素がＩ（Ｔ）内で異なる２進値を有する場合に、ギャップが
「表される」と言う。言い換えると、ギャップは、入力イメージ内の画素の一方
が、Ｔより大きいグレイレベル値を有し、他方がＴより小さい場合に、表される
。ＴおよびＤの最適の値は、下記の判断基準を満たすように選択されたＴおよび
Ｄのメリット関数を最大化することによって見つけられることが好ましい。１．Ｉ（Ｔ）で表される入力イメージ内の意味のあるギャップの数に正に相関
する２．Ｉ（Ｔ）で表される入力イメージ内の意味のないギャップの数に負に相関
する３．Ｉ（Ｔ）で表されない入力イメージ内の意味のあるギャップの数に負に相
関する

【００４５】そのようなメリット関数を計算するために、Ｎ（Ｔ、Ｄ）が、Ｉ（Ｔ）で表さ
れる入力イメージ内の意味のないギャップの加重カウントであるものとする。重
みづけは、Ｉ（Ｔ）で表されるギャップが小さいほど、その重みが大きくなるも
のであることが好ましい。言い換えると、Ｎ（Ｔ、Ｄ）でカウントされるギャッ
プのそれぞれが、Ｔを超えるグレイレベル値を有する一方の画素と、Ｔ未満のグ
レイレベル値を有する他方の画素を有し、グレイレベル値の間の差の絶対値が、
Ｄを超えない。ＭＡＸが、イメージ内の最大のグレイレベル値を表し、その結果
、Ｎ（Ｔ、ＭＡＸ）が、Ｉ（Ｔ）で表されるギャップのすべての加重カウントに
なるものとする。Ｇ（Ｄ）が、イメージ内の意味のあるギャップすなわち、画素
のグレイレベル値の間にＤを超える差の絶対値を有するギャップの数の加重カウ
ントであるものとする。下記のメトリックを定義する。１．ｇｏｏｄ（Ｔ、Ｄ）＝Ｎ（Ｔ、ＭＡＸ）−Ｎ（Ｔ、Ｄ）、Ｉ（Ｔ）内で表
される意味のあるギャップの加重カウント２．ａｒｔｉｆａｃｔｓ（Ｔ、Ｄ）＝Ｎ（Ｔ、Ｄ）、Ｉ（Ｔ）内で表される意
味のないギャップ３．ｍｉｓｓｅｄ（Ｔ、Ｄ）＝Ｇ（Ｄ）−ｇｏｏｄ（Ｔ、Ｄ）、Ｉ（Ｔ）内で
失われている意味のあるギャップこれらのメトリックは、上にリストした３つの判断基準に対応する。対（Ｔ、Ｄ
）のメリット・スコアは、次式によって与えられる。Ｓｃｏｒｅ（Ｔ、Ｄ）＝ｇｏｏｄ（Ｔ、Ｄ）−ａｒｔｉｆａｃｔｓ（Ｔ、Ｄ）
−ｍｉｓｓｅｄ（Ｔ、Ｄ）最高のスコアを与える対（Ｔ、Ｄ）が、ステップ５４での使用のために選択され
る。

【００４６】このメリット・スコアと、ＴおよびＤを選択する方法は、上で、例として説明
したものであり、他のスコアおよび方法を使用して、ＴおよびＤを最適化するこ
ともできる。たとえば、ギャップに割り当てる重みを変更することができる。ま
た、「ギャップ」は、本明細書では隣接する画素を参照するものとして定義され
たが、画素が、直接に隣接する必要はなく、短い距離だけ離れるものとすること
ができる。さらに、イメージ内のすべてのギャップを評価する必要はなく、代表
的なサンプルを取り上げることができる。さらに、ギャップの評価の目的は、主
に、バイナリ・イメージ内で真のエッジを保存するＴおよびＤの値を選択するこ
となので、Ｓｏｂｅｌ変換などのエッジ演算子を使用して、グレイスケール・イ
メージ内のエッジを識別することができる。その後、ＴおよびＤを、これらのエ
ッジに対応する画素ギャップについて最適化することができる。Ｖ形輝度プロフ
ァイル（「ルーフ・エッジ」、細い線およびテキスト形状でよく見られる）など
のグレイスケール・イメージ内の他の情報の手がかりを、同様にこの目的に使用
することができる。上下の閾値を選択するための他の方法は、当業者には明白で
あり、本発明の範囲内とみなされる。

【００４７】図５に戻って、灰色画素処理ステップ５６で、中間画素を、別に処理し、好ま
しくは２進値を割り当てる。中間画素の２値化の好ましい方法は、下で図６に関
して説明する。代替実施形態では、図３のイメージ３５を生成するのに使用され
たものなどのテキスト指向２値化アルゴリズムを、グレイレベル入力イメージに
適用する。ステップ５４からの中間（灰色）画素と、任意選択の白の画素に、テ
キスト指向２値化アルゴリズムによって生成された２進値を割り当てる。中間画
素を処理する他の方法は、当業者に明白であり、本発明の範囲内とみなされる。
代替案では、中間画素を２値化せず、そのグレイ・レベル値を、他の画素の２進
値と共に保管し、表示する。

【００４８】画素のすべてを２値化した後に、出力ステップ５８で、バイナリ・イメージを
、表示、保管、またはさらなる処理のために出力する。任意選択として、３値イ
メージも出力する。

【００４９】図６は、本発明の好ましい実施形態による、灰色画素処理ステップ５６の詳細
を概略的に示す流れ図である。図６の方法の本質は、近傍よりかなり明るいか暗
いものとして目立つ画素を、それぞれ白または黒としてマークすることである。
したがって、中間画素のそれぞれについて、平均ステップ６０で、その近傍の画
素のグレイレベル値のローカル平均を判定する。黒画素ステップ６２で、グレイ
レベル値が、Ｄより大きい差でローカル平均より小さい画素に、２進黒を割り当
てる。白画素ステップ６４で、グレイレベル値が、Ｄより大きい差でローカル平
均より大きい画素に、２進白をを割り当てる。代替案では、ステップ６２および
６４で、Ｄの代わりに別の適当な差の値を使用することができる。さらに、その
代わりにまたは追加して、エッジ演算子などの他の尺度および演算子を使用して
、中間画素の中から目立つ画素を見つけることができる。

【００５０】ステップ６２または６４で分類されなかった残りの画素は、閾値化ステップ６
６で処理される。これらの画素は、単純に閾値Ｔに関して２値化され、その結果
、Ｔを超えるグレイレベル値を有する画素が、２進白に割り当てられ、他の画素
が２進黒に割り当てられることが好ましい。その代わりに、閾値化の別の方法を
使用することができる。

【００５１】図７は、本発明の好ましい実施形態による、図５および６の方法を使用して生
成された、小切手２０のバイナリ・イメージ７０の概略表現である。文字２２が
、図３ほど明瞭ではないが、線２６およびロゴ２８は、正確に再生されている。

【００５２】好ましい実施形態を、文書イメージ処理に関して上で説明したが、本発明の原
理を、他のイメージ処理アプリケーションに同様に使用することができることを
理解されたい。たとえば、本明細書に記載の方法を、イメージ内の所与の比較的
均一な強さを有するエッジを検出し、イメージ内の、実際に特徴を表すエッジと
、アーチファクトに起因して生ずるか他の形で重要でないエッジを区別するよう
に適合させることができる。本発明の方法は、必要な変更を加えて、カラー・イ
メージおよび３次元物体のイメージに適用することもできる。

【００５３】したがって、上で説明した好ましい実施形態が、例として記載され、本発明が
、特に図示され上で説明されたものに制限されないことを諒解されたい。そうで
はなく、本発明の範囲は、上で説明したさまざまな特徴の組合せおよび部分的組
合せの両方、ならびに前述の説明を読む時に当業者が思い浮かべる、従来技術で
開示されていない変形形態および修正形態を含む。

【図面の簡単な説明】

【図１】当技術分野で既知の、スキャナによって取り込まれたグレイレベル・イメージ
の概略複写である。

【図２】２値化の既知の方法を使用して図１のグレイレベル・イメージを処理すること
によって生成されたバイナリ・イメージの概略複写である。

【図３】２値化の既知の方法を使用して図１のグレイレベル・イメージを処理すること
によって生成されたバイナリ・イメージの概略複写である。

【図４】本発明の好ましい実施形態による、イメージ処理装置の概略の絵図である。

【図５】本発明の好ましい実施形態による、イメージ２値化の方法を概略的に示す流れ
図である。

【図６】本発明の好ましい実施形態による、図５の方法の詳細を概略的に示す流れ図で
ある。

【図７】図５および６の方法を使用して図１のグレイレベル・イメージを処理すること
によって生成されたバイナリ・イメージの概略複写である。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ，ＴＲ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＭＺ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＧ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＢＺ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＤＺ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＭＺ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷＦターム(参考） 5C077 LL19 MP01 PP46 PQ12 PQ18 PQ20 RR04 RR06 RR16 SS01 TT06

Claims

【特許請求の範囲】

【請求項１】イメージ２値化の方法であって、それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
ジを受け取るステップと、下閾値と、選択された差だけ前記下閾値より大きい上閾値とを判定するステッ
プと、前記上閾値より大きいグレイレベル値を有する前記グレイレベル・イメージの
前記画素に第１の２進値を割り当て、前記下閾値未満のグレイレベル値を有する
前記グレイレベル・イメージの前記画素に第２の２進値を割り当てるステップと
、前記下閾値と前記上閾値との間のグレイレベル値を有する中間グループの前記
画素の前記第１の２進値および前記第２の２進値への最適の割当てを判定するた
めに、前記中間グループの前記画素を処理するステップとを含む方法。
【請求項２】前記下閾値および前記上閾値を判定するステップが、前記入力イメージの前記
画素の前記グレイレベル値の間の変動を分析するステップと、前記分析された変
動に応答して前記閾値を判定するステップとを含む、請求項１に記載の方法。
【請求項３】前記グレイレベル値の間の前記変動を分析するステップが、前記入力イメージ
のエッジを見つけるステップを含み、前記閾値を判定するステップが、前記割り
当てられる２進値からなる出力イメージで前記エッジを保存するために前記閾値
を選択するステップを含む、請求項２に記載の方法。
【請求項４】前記グレイレベル・イメージの間の前記変動を分析するステップが、隣接する
画素の前記グレイレベル値の間のギャップを見つけるステップを含み、前記閾値
を判定するステップが、前記割り当てられる２進値からなる出力イメージで、重
要でないギャップよりも重要なギャップを優先して保存するように前記閾値を選
択するステップを含む、請求項２に記載の方法。
【請求項５】前記閾値を選択するステップが、その絶対的な大きさが前記上閾値と前記下閾
値との間の前記選択された差より大きいものとして、意味のある前記ギャップを
定義するステップを含む、請求項４に記載の方法。
【請求項６】前記閾値を選択するステップが、上閾値および下閾値の複数の異なる対につい
て計算されるメリット・スコアを最大にするように前記上閾値および前記下閾値
を選択するステップを含み、前記スコアが、前記選択された閾値によって前記出
力イメージで保存される意味のあるギャップの数に正に相関し、前記選択された
閾値によって前記出力イメージで、保存される意味のないギャップの数および保
存されない意味のあるギャップの数に負に相関する、請求項５に記載の方法。
【請求項７】前記閾値を判定するステップが、前記割り当てられる２進値からなる出力イメ
ージでエッジ情報を保存するように前記閾値を選択するステップを含む、請求項
１ないし６のいずれかに記載の方法。
【請求項８】前記閾値を選択するステップが、前記情報が属するイメージ特徴のタイプに実
質的に依存しない閾値を選択するステップを含む、請求項７に記載の方法。
【請求項９】前記閾値を選択するステップが、前記上閾値および前記下閾値の最適平均値を
見つけるステップと、前記閾値の間の前記選択された差の最適値を見つけるステ
ップとを含む、請求項７に記載の方法。
【請求項１０】前記中間グループの前記画素を処理するステップが、前記入力イメージの前記
画素の前記グレイレベル値の間の変動を分析するステップと、前記分析された変
動に応答して前記画素の前記第１の２進値および前記第２の２進値への割り当て
を判定するステップとを含む、請求項１ないし６のいずれかに記載の方法。
【請求項１１】前記分析された変動に応答して前記割り当てを判定するステップが、前記画素
の１つの前記グレイレベル値とその近傍の他の画素の前記グレイレベル値との間
の意味のある差を見つけるステップと、前記差に応答して前記画素に前記第１の
２進値または前記第２の２進値を割り当てるステップとを含む、請求項１０に記
載の方法。
【請求項１２】前記中間グループの前記画素を処理するステップが、前記中間グループの前記
画素の前記最適の割当てを判定するために、テキストについて最適化された２値
化方法を適用するステップを含む、請求項１ないし６のいずれかに記載の方法。
【請求項１３】前記画素の前記割り当てられた２進値からなるバイナリ・イメージを出力する
ステップを含む、請求項１ないし６のいずれかに記載の方法。
【請求項１４】それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
ジを処理する方法であって、前記入力イメージの前記画素の前記グレイレベル値の間の変動を分析するステ
ップと、前記分析された変動に応答して、下閾値と、選択されたギャップ・サイズだけ
前記下閾値より大きい上閾値とを判定するステップと、前記上閾値を超えるグレイレベル値を有する前記グレイレベル・イメージの画
素に第１の２進値を割り当て、前記下閾値未満のグレイレベル値を有する前記グ
レイレベル・イメージの画素に第２の２進値を割り当てるステップと、前記第１の２進値および前記第２の２進値を割り当てられた画素が、そのそれ
ぞれの２進値によって表され、前記下閾値と前記上閾値との間のグレイレベル値
を有する中間グループの画素が、それぞれのグレイレベル値によって表される、
３値出力イメージを生成するステップとを含む方法。
【請求項１５】前記閾値を判定するステップが、前記出力イメージにエッジ情報を保存するよ
うに前記閾値を選択するステップを含む、請求項１４に記載の方法。
【請求項１６】前記３値出力イメージを生成するステップが、前記出力イメージを表示するス
テップを含む、請求項１４または１５に記載の方法。
【請求項１７】前記３値出力イメージを生成するステップが、前記出力イメージをメモリに保
管するステップを含む、請求項１４または１５に記載の方法。
【請求項１８】イメージ２値化の装置であって、イメージ・プロセッサを含み、前記イメージ
・プロセッサが、それぞれのグレイレベル値を有する複数の画素を含むグレイレ
ベル入力イメージを受け取るように結合され、前記イメージ・プロセッサが、下
閾値と、選択された差だけ前記下閾値より大きい上閾値とを判定し、前記上閾値
より大きいグレイレベル値を有する前記グレイレベル・イメージの前記画素に第
１の２進値を割り当て、前記下閾値未満のグレイレベル値を有する前記グレイレ
ベル・イメージの前記画素に第２の２進値を割り当て、前記下閾値と前記上閾値
との間のグレイレベル値を有する中間グループの前記画素の前記第１の２進値お
よび前記第２の２進値への最適の割当てを判定するために、前記中間グループの
前記画素を処理するように適合される、装置。
【請求項１９】前記プロセッサが、前記入力イメージの前記画素の前記グレイレベル値の間の
変動を分析し、前記分析された変動に応答して前記閾値を判定するように適合さ
れる、請求項１８に記載の装置。
【請求項２０】前記プロセッサが、前記分析された変動に応答して、前記第１の２進値および
前記第２の２進値への前記中間グループの画素の割当てを判定するように適合さ
れる、請求項１９に記載の装置。
【請求項２１】前記プロセッサが、エッジ情報が属するイメージ特徴のタイプに実質的に依存
せずに、前記割り当てられる２進値からなる出力イメージで前記エッジ情報を保
存するように前記閾値を選択するように適合される、請求項１８ないし２０のい
ずれかに記載の装置。
【請求項２２】前記プロセッサが、前記中間グループの前記画素の前記最適の割当てを判定す
るために、テキストについて最適化された２値化方法を適用するように適合され
る、請求項１８ないし２０のいずれかに記載の装置。
【請求項２３】前記プロセッサが、前記画素の前記割り当てられた２進値からなるバイナリ・
イメージを出力するように適合される、請求項１８ないし２０のいずれかに記載
の装置。
【請求項２４】それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
ジを処理する装置であって、前記装置が、イメージ・プロセッサを含み、前記イ
メージ・プロセッサが、前記入力イメージの前記画素の前記グレイレベル値の間
の変動を分析し、前記分析された変動に応答して、下閾値と、選択されたギャッ
プ・サイズだけ前記下閾値より大きい上閾値とを判定し、前記上閾値を超えるグ
レイレベル値を有する前記グレイレベル・イメージの画素に第１の２進値を割り
当て、前記下閾値未満のグレイレベル値を有する前記グレイレベル・イメージの
画素に第２の２進値を割り当て、したがって、前記第１の２進値および前記第２
の２進値を割り当てられた画素が、そのそれぞれの２進値によって表され、前記
下閾値と前記上閾値との間のグレイレベル値を有する中間グループの画素が、そ
れぞれのグレイレベル値によって表される、３値出力イメージを生成するように
適合される、装置。
【請求項２５】ディスプレイを含み、前記ディスプレイが、前記３値出力イメージを受け取り
、表示するために前記プロセッサに結合される、請求項２４に記載の装置。
【請求項２６】ストレージ・メモリを含み、前記ストレージ・メモリが、前記３値出力イメー
ジを受け取り、保管するために前記プロセッサに結合される、請求項２４または
２５に記載の装置。
【請求項２７】請求項１ないし１７のいずれかに記載の方法をコンピュータに実行させるプロ
グラム。