JP2003525560A - イメージ2値化の改良された方法 - Google Patents

イメージ2値化の改良された方法

Info

Publication number
JP2003525560A
JP2003525560A JP2001564084A JP2001564084A JP2003525560A JP 2003525560 A JP2003525560 A JP 2003525560A JP 2001564084 A JP2001564084 A JP 2001564084A JP 2001564084 A JP2001564084 A JP 2001564084A JP 2003525560 A JP2003525560 A JP 2003525560A
Authority
JP
Japan
Prior art keywords
gray level
image
pixels
threshold
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001564084A
Other languages
English (en)
Other versions
JP3953817B2 (ja
Inventor
ズロトニク、アヴィアド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2003525560A publication Critical patent/JP2003525560A/ja
Application granted granted Critical
Publication of JP3953817B2 publication Critical patent/JP3953817B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Image Input (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Optical Fibers, Optical Fiber Cores, And Optical Fiber Bundles (AREA)

Abstract

(57)【要約】 【課題】 それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメージ(20)を2値化する方法。 【解決手段】 下閾値と上閾値を判定する。第1の2進値を、上閾値を超えるグレイレベル値を有する、グレイレベル・イメージの画素に割り当て、第2の2進値を、下閾値未満のグレイレベル値を有する、グレイレベル・イメージの画素に割り当てる。下閾値と上閾値の間のグレイレベル値を有する中間グループの画素は、中間グループの画素の第1および第2の2進値への最適の割当てを判定するために処理される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、概してイメージ処理の方法および装置に関し、詳細には、グレイレ
ベル・イメージの2値化の方法に関する。
【0002】
【従来の技術】
イメージ2値化の方法は当技術分野で周知である。一般的に言って、これらの
方法は、各画素が対応する複数ビット・グレイレベル値を有するグレイレベル・
イメージをとり、各画素が黒(前景)または白(背景)の2進値を有するバイナ
リ・イメージに変換する。2値化は、文書に印刷されるか書き込まれた情報を処
理し、保管するために、特に文書イメージを単純化するのに使用される。
【0003】 最も高速で最も単純な2値化方法は、単純に閾値を固定し、その閾値を超える
グレイレベル値を有するすべての画素が白であり、閾値未満の画素が黒であると
判定することである。しかし、この方法は、グレイレベル・イメージに含まれる
情報の消失または混乱をもたらすことがしばしばである。この情報は、主にイメ
ージ内に現れるエッジで実施され、近傍に対する相対輝度ほどに画素の絶対輝度
に依存しない。したがって、閾値の選択に依存して、エッジの両側の画素が同一
の値に2値化される場合に、グレイレベル・イメージの意味のあるエッジが、バ
イナリ・イメージで消えることになる。その一方で、非常に近いグレイレベル値
を有する画素が、選択された閾値の両側に分かれる時に、エッジの外見に伴うバ
イナリ・イメージ内のアーチファクトが、グレイレベル・イメージの連続的な推
移の区域に現れる可能性がある。
【0004】 これらの問題を、下の表によって例示する。表1は、5×5イメージの画素値
を表し、より高い値が、より明るい画素を表す。
【0005】
【表1】
【0006】 このイメージが、85の閾値を使用して2値化される場合に、その結果は、表2
に示されたものになる。
【0007】
【表2】
【0008】 右下の画素を囲む大きいギャップが、2値化されたイメージに表されているが、
他のギャップのすべてが失われている(用語「ギャップ」は、本明細書の文脈お
よび請求項において、隣接する画素の対の間のグレイ・レベルの絶対的な差を示
すのに使用される)。
【0009】 その一方で、閾値を15にセットした場合には、結果のバイナリ・イメージは
、表3に示されたものになる。
【0010】
【表3】
【0011】 行2と3の間のサイズ6のギャップは、おそらくはイメージ内の実際のエッジに
対応するが、バイナリ・イメージで表されている。しかし、右下の大きいギャッ
プが失われている。それと同時に、行4と5の間の小さいギャップ(サイズ2)
は、ノイズに起因する可能性があるが、バイナリ・イメージで表されている。し
たがって、グレイレベル・イメージの重要なエッジが失われると同時に、重要で
ないギャップが、アーチファクトを生成することを許容されている。
【0012】 これらの表によって例示される理由から、実用的な2値化アルゴリズムでは、
2値化閾値を変更できるようになっている。これらのアルゴリズムは、一般に、
イメージ全体またはイメージの特定の区域で使用するのに最適の閾値を判定する
際に、イメージ内容に関する前提を設ける。この前提は、イメージ内の物体のサ
イズ、ヒストグラム特性、ノイズ・レベル、または他のイメージ特性に関連する
ものとすることができる。このような前提に依存するので、2値化アルゴリズム
は、それが設計された特定のタイプのイメージまたはオブジェクトに対して良好
に動作するが、それ以外については失敗する傾向を有する。たとえば、テキスト
指向2値化アルゴリズムは、単調な背景の上のテキストを含む文書イメージに対
して良好に動作する可能性があるが、背景がテクスチャ付きである時には失敗す
る可能性がある。さらに、文書イメージには、記号、線、および箱などの単純な
テキスト以外の特徴が含まれることがしばしばであり、これらの特徴は、バイナ
リ・イメージに保存することが重要だが、テキスト指向2値化が使用される時に
失われる。
【0013】 イメージ「3値化」が、文書イメージ処理に関してではないが、グレイレベル
・イメージの処理の方法として提案された。通常、「グレイ」画素値の範囲が、
黒の範囲の低い値と白の範囲の高い値の中間で定義される。結果の3値イメージ
は、複数のイメージ認識およびイメージ相関の応用例で有用であることがわかっ
ている。
【0014】 たとえば、その開示が参照によって本明細書に組み込まれる米国特許第506
7162号に、通常は指紋分析に基づく、イメージ相関を使用して身元を検証す
る方法および装置が記載されている。指紋イメージのエッジ判定の不確実性およ
び変化性を除去するために、3値化技法を使用して、すべての画素を、黒、灰色
、または白の3つのレベルに分類する。グレイスケール・イメージのグレイ値の
ヒストグラムを判定し、黒と灰色の閾値および灰色と白の閾値を、均等1/3分
布に従って確立する。黒と灰色の閾値より暗いグレイ値を有するすべての画素が
、黒画素に変換され、灰色と白の閾値より明るいグレイ値を有するすべての画素
が、白画素に変換され、それ以外のすべての画素が、後続の相関計算で無視され
る。したがって、黒画素と白画素が、指紋イメージの山と谷の領域を高い信頼性
で表し、灰色画素が、山と谷の間の推移領域を表す。
【0015】 もう1つの例として、その開示が参照によって本明細書に組み込まれる米国特
許第5715325号に、ビデオ・イメージ内の顔を検出する装置および方法が
記載されている。顔のイメージを処理して、微細な詳細を除去し、強いコントラ
ストを与え、ほとんど2値化されている(暗いブロックと明るいブロックを有す
る)が、まだ明瞭に分類できないブロックがいくつか含まれるイメージをもたら
す。処理の単純さを促進するために、イメージが、3値イメージとして扱われ、
暗い領域が、負の1(−1)を用いて識別され、明るい領域が、1を用いて識別
され、定義不能領域が、0を用いて識別される。3値イメージを、異なる顔テン
プレートと比較して、最適一致を見つける。
【0016】
【発明が解決しようとする課題】
本発明の目的は、イメージ処理、特に文書イメージの処理の改良された方法お
よび装置を提供することである。
【0017】 本発明のいくつかの態様のもう1つの目的は、イメージ2値化の改良された方
法を提供することである。
【0018】 本発明のいくつかの態様のもう1つの目的は、イメージの3値化の方法を提供
することである。
【0019】
【課題を解決するための手段】
本発明の好ましい実施形態では、グレイレベル入力イメージが、一般に、バイ
ナリ出力イメージ生成の準備ステップとして、3値化される。入力イメージは、
まず、隣接する画素の値の間のギャップなど、イメージ内の画素のグレイレベル
値の間の変動の特徴を表すために、分析される。この変動に基づいて、上下の2
値化閾値を決定し、上閾値を超えるグレイレベル値を有する画素が、白として分
類され、下閾値未満の画素が、黒として分類されるようにする。上閾値と下閾値
の間のグレイレベル値を有する画素を、以下では中間画素またはグレイ画素と称
するが、これらの画素は、これらの画素の黒または白としての最適分類を判定す
るために処理されることが好ましい。
【0020】 上下の2値化閾値が、出力バイナリ・イメージで保存される入力イメージ内の
重要なエッジの数を増やしながら、発生するアーチファクト・エッジの数を減ら
すように設計される形で選択されることが好ましい。この形でバイナリ・イメー
ジを生成することによって、実質的にイメージ内容のタイプに依存せずに、入力
イメージの特徴が明瞭に伝えられる。異なる閾値の範囲を、画素間のグレイレベ
ル変動に対して評価して、最適の上閾値および下閾値を選択する。評価は、画素
間のグレイレベル・ギャップの統計的分析に基づくことが好ましい。その代わり
にまたは追加して、エッジ検出アルゴリズムによって見つけられた実際のエッジ
など、他の統計的分析および情報の手がかりを、閾値の選択に使用することがで
きる。
【0021】 本発明のいくつかの好ましい実施形態では、中間画素が、他の隣接画素に対す
る関係に基づいて分類される。隣接画素の平均値よりかなり明るい画素は、白と
して分類され、平均値よりかなり暗い画素は、黒として分類されることが好まし
い。この分類は、選択された上下の閾値に依存する必要がない。隣接画素の平均
値から大きく異ならない画素は、通常は、上下の閾値の平均などの閾値を使用し
て分類される。
【0022】 その代わりに、他の方法を適用して、中間画素を分類または他の形で処理する
ことができる。1つの好ましい実施形態では、テキスト指向2値化アルゴリズム
を、グレイレベル・イメージに適用し、中間画素を、このアルゴリズムの結果を
使用して分類する。もう1つの好ましい実施形態では、中間画素のグレイレベル
値を、他の画素の2進値と共に保管する。この形でのイメージの保管は、完全な
グレイレベル・イメージよりはるかに少ないメモリを必要とするが、イメージ内
の重要な情報のほとんどすべてが、イメージが後に人間のオペレータによる処理
または表示のために再呼出しされる時の使用のために保存される。
【0023】 したがって、本発明の好ましい実施形態によれば、イメージ2値化の方法であ
って、 それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
ジを受け取ることと、 下閾値と、選択された差だけ前記下閾値より大きい上閾値とを判定することと
、 前記上閾値より大きいグレイレベル値を有する前記グレイレベル・イメージの
前記画素に第1の2進値を割り当て、前記下閾値未満のグレイレベル値を有する
前記グレイレベル・イメージの前記画素に第2の2進値を割り当てることと、 前記下閾値と前記上閾値との間のグレイレベル値を有する中間グループの前記
画素の前記第1の2進値および前記第2の2進値への最適の割当てを判定するた
めに、前記中間グループの前記画素を処理することと を含む方法が提供される。
【0024】 前記下閾値および前記上閾値を判定することが、前記入力イメージの前記画素
の前記グレイレベル値の間の変動を分析することと、前記分析された変動に応答
して前記閾値を判定することとを含むことが好ましい。前記グレイレベル値の間
の前記変動を分析することが、前記入力イメージのエッジを見つけることを含み
、前記閾値を判定することが、前記割り当てられる2進値からなる出力イメージ
で前記エッジを保存するために前記閾値を選択することが、最も好ましい。
【0025】 追加してまたはその代わりに、前記グレイレベル・イメージの間の前記変動を
分析することが、隣接する画素の前記グレイレベル値の間のギャップを見つける
ことを含み、前記閾値を判定することが、前記割り当てられる2進値からなる出
力イメージで、重要でないギャップよりも重要なギャップを優先して保存するよ
うに前記閾値を選択することを含む。前記閾値を選択することが、その絶対的な
大きさが前記上閾値と前記下閾値との間の前記選択された差より大きいものとし
て、意味のある前記ギャップを定義することを含むことが好ましい。前記閾値を
選択することが、上閾値および下閾値の複数の異なる対について計算されるメリ
ット・スコアを最大にするように前記上閾値および前記下閾値を選択することを
含み、前記スコアが、前記選択された閾値によって前記出力イメージで保存され
る意味のあるギャップの数に正に相関し、前記選択された閾値によって前記出力
イメージで、保存される意味のないギャップの数および保存されない意味のある
ギャップの数に負に相関することが、最も好ましい。
【0026】 前記閾値を判定することが、前記割り当てられる2進値からなる出力イメージ
でエッジ情報を保存するように前記閾値を選択することを含むことが好ましい。
前記閾値を選択することが、前記情報が属するイメージ特徴のタイプに実質的に
依存しない閾値を選択することを含むことが、最も好ましい。追加してまたはそ
の代わりに、前記閾値を選択することが、前記上閾値および前記下閾値の最適平
均値を見つけることと、前記閾値の間の前記選択された差の最適値を見つけるこ
ととを含む。
【0027】 前記中間グループの前記画素を処理することが、前記入力イメージの前記画素
の前記グレイレベル値の間の変動を分析することと、前記分析された変動に応答
して前記画素の前記第1の2進値および前記第2の2進値への割り当てを判定す
ることとを含むことが、さらに好ましい。前記分析された変更に応答して前記割
り当てを判定することが、前記画素の1つの前記グレイレベル値とその近傍の他
の画素の前記グレイレベル値との間の意味のある差を見つけることと、前記差に
応答して前記画素に前記第1の2進値または前記第2の2進値を割り当てること
とを含むことが、最も好ましい。
【0028】 好ましい実施形態では、前記中間グループの前記画素を処理することが、前記
中間グループの前記画素の前記最適の割当てを判定するために、テキストについ
て最適化された2値化方法を適用することを含む。
【0029】 前記方法が、前記画素の前記割り当てられた2進値からなるバイナリ・イメー
ジを出力することを含むことが、好ましい。
【0030】 本発明の好ましい実施形態によれば、それぞれのグレイレベル値を有する複数
の画素を含むグレイレベル入力イメージを処理する方法であって、 前記入力イメージの前記画素の前記グレイレベル値の間の変動を分析すること
と、 前記分析された変動に応答して、下閾値と、選択されたギャップ・サイズだけ
前記下閾値より大きい上閾値とを判定することと、 前記上閾値を超えるグレイレベル値を有する前記グレイレベル・イメージの画
素に第1の2進値を割り当て、前記下閾値未満のグレイレベル値を有する前記グ
レイレベル・イメージの画素に第2の2進値を割り当てることと、 前記第1の2進値および前記第2の2進値を割り当てられた画素が、そのそれ
ぞれの2進値によって表され、前記下閾値と前記上閾値との間のグレイレベル値
を有する中間グループの画素が、それぞれのグレイレベル値によって表される、
3値出力イメージを生成することと を含む方法も提供される。
【0031】 好ましい実施形態では、前記3値出力イメージを生成することが、前記出力イ
メージを表示することを含む。もう1つの好ましい実施形態では、前記3値出力
イメージを生成することが、前記出力イメージをメモリに保管することを含む。
【0032】 本発明の好ましい実施形態によれば、イメージ2値化の装置であって、イメー
ジ・プロセッサを含み、前記イメージ・プロセッサが、それぞれのグレイレベル
値を有する複数の画素を含むグレイレベル入力イメージを受け取るように結合さ
れ、前記イメージ・プロセッサが、下閾値と、選択された差だけ前記下閾値より
大きい上閾値とを判定し、前記上閾値より大きいグレイレベル値を有する前記グ
レイレベル・イメージの前記画素に第1の2進値を割り当て、前記下閾値未満の
グレイレベル値を有する前記グレイレベル・イメージの前記画素に第2の2進値
を割り当て、前記下閾値と前記上閾値との間のグレイレベル値を有する中間グル
ープの前記画素の前記第1の2進値および前記第2の2進値への最適の割当てを
判定するために、前記中間グループの前記画素を処理するように適合される、装
置が、さらに提供される。
【0033】 本発明の好ましい実施形態によれば、それぞれのグレイレベル値を有する複数
の画素を含むグレイレベル入力イメージを処理する装置であって、前記装置が、
イメージ・プロセッサを含み、前記イメージ・プロセッサが、前記入力イメージ
の前記画素の前記グレイレベル値の間の変動を分析し、前記分析された変動に応
答して、下閾値と、選択されたギャップ・サイズだけ前記下閾値より大きい上閾
値とを判定し、前記上閾値を超えるグレイレベル値を有する前記グレイレベル・
イメージの画素に第1の2進値を割り当て、前記下閾値未満のグレイレベル値を
有する前記グレイレベル・イメージの画素に第2の2進値を割り当て、したがっ
て、前記第1の2進値および前記第2の2進値を割り当てられた画素が、そのそ
れぞれの2進値によって表され、前記下閾値と前記上閾値との間のグレイレベル
値を有する中間グループの画素が、それぞれのグレイレベル値によって表される
、3値出力イメージを生成するように適合される、装置が、さらに提供される。
【0034】 好ましい実施形態では、前記装置が、ディスプレイを含み、前記ディスプレイ
が、前記3値出力イメージを受け取り、表示するために前記プロセッサに結合さ
れる。もう1つの好ましい実施形態では、前記装置が、ストレージ・メモリを含
み、前記ストレージ・メモリが、前記3値出力イメージを受け取り、保管するた
めに前記プロセッサに結合される。
【0035】 本発明の好ましい実施形態によれば、入力イメージを処理するコンピュータ・
ソフトウェア製品であって、プログラム命令をその中に保管されたコンピュータ
可読媒体を含み、前記命令が、コンピュータによって読み取られた時に、前記コ
ンピュータに、それぞれのグレイレベル値を有する複数の画素を含むグレイレベ
ル入力イメージを受け取らせ、下閾値と、選択された差だけ前記下閾値より大き
い上閾値とを判定させ、前記上閾値より大きいグレイレベル値を有する前記グレ
イレベル・イメージの前記画素に第1の2進値を割り当てさせ、前記下閾値未満
のグレイレベル値を有する前記グレイレベル・イメージの前記画素に第2の2進
値を割り当てさせ、前記下閾値と前記上閾値との間のグレイレベル値を有する中
間グループの前記画素の前記第1の2進値および前記第2の2進値への最適の割
当てを判定するために、前記中間グループの前記画素を処理させる、コンピュー
タ・ソフトウェア製品が、さらに提供される。
【0036】 本発明の好ましい実施形態によれば、それぞれのグレイレベル値を有する複数
の画素を含むグレイレベル入力イメージを処理するコンピュータ・ソフトウェア
製品であって、前記製品が、プログラム命令をその中に保管されたコンピュータ
可読媒体を含み、前記命令が、コンピュータによって読み取られた時に、前記コ
ンピュータに、前記入力イメージの前記画素の前記グレイレベル値の間の変動を
分析させ、前記分析された変動に応答して、下閾値と、選択されたギャップ・サ
イズだけ前記下閾値より大きい上閾値とを判定させ、前記上閾値を超えるグレイ
レベル値を有する前記グレイレベル・イメージの画素に第1の2進値を割り当て
させ、前記下閾値未満のグレイレベル値を有する前記グレイレベル・イメージの
画素に第2の2進値を割り当てさせ、前記第1の2進値および前記第2の2進値
を割り当てられた画素が、そのそれぞれの2進値によって表され、前記下閾値と
前記上閾値との間のグレイレベル値を有する中間グループの画素が、それぞれの
グレイレベル値によって表される、3値出力イメージを生成させる、コンピュー
タ・ソフトウェア製品が、さらに提供される。
【0037】 本発明は、その好ましい実施形態の下記の詳細な説明を図面と共に考慮するこ
とから、より完全に理解される。
【0038】
【発明の実施の形態】
図1から3は、イメージ2値化の異なる方法を比較するために提示された、小
切手20のイメージの概略複写である。図1は、文書スキャナによって取り込ま
れた、小切手のグレイレベル・イメージである。この小切手には、テクスチャ付
きの背景24の上に印刷された文字22が、線26およびロゴ28などの他の特
徴と共に含まれる。このような小切手は、納税者によって、所得申告書と一緒に
提出される場合がある。書類のすべてがスキャンされ、そのイメージが、後の参
照のために税務当局によって保管される。イメージは、保管されるデータの量を
減らすために、通常は保管の前に2値化される。線、ロゴ、および他の識別詳細
が、イメージに保存され、その結果、小切手(または他の文書)が、ストレージ
から再呼出しされた時に明瞭に識別できるようになることが、一般に重要である
【0039】 図2に、全般的に文書イメージに対して良好に働くアルゴリズムを使用した2
値化の後の小切手のイメージ30を示す。このアルゴリズムは、単調な背景を有
する文書用に設計され、小切手のテクスチャ付きの背景では失敗する。
【0040】 図3に、特にテキスト用に「調整」されたアルゴリズムを使用した2値化の後
の小切手のイメージ35を示す。このアルゴリズムは、米国特許出願第09/3
10287号に記載されている。この場合では、文字は明瞭であるが、線26お
よびロゴ28の一部が失われている。図2および3によって示される問題は、本
発明の好ましい実施形態によって克服される。
【0041】 図4を参照するが、この図は、本発明の好ましい実施形態によるイメージ処理
装置40の概略の絵図である。この装置には、小切手20(図1)などの文書を
受け取り、スキャンする、スキャナ42、または当技術分野で既知の他の適当な
タイプのイメージ取込装置が含まれる。スキャナは、文書のグレイスケール・イ
メージを取り込み、対応するイメージ・データをイメージ・プロセッサ44に伝
え、プロセッサ44には、通常は、適当な汎用コンピュータが含まれる。その代
わりに、イメージを、別のソースからプロセッサに入力することができる。プロ
セッサ44は、下で説明する方法を使用して、グレイスケール・イメージを処理
して、文書の3値イメージを生成し、その後、さらに3値イメージを処理して2
値イメージを生成する。3値または2値のイメージは、通常は、モニタ46に表
示されるか、後の再呼び出しのために大容量記憶装置48に保管される。イメー
ジを、印刷するかネットワークを介して送信することもでき、また、たとえば当
技術分野で既知の光学文字認識(OCR)の方法を使用して、さらに処理するこ
ともできる。
【0042】 プロセッサ44のイメージ処理機能は、下で詳細に示すように、本発明の実施
形態を実施する、プロセッサ上で稼動するソフトウェアを使用して実行されるこ
とが好ましい。ソフトウェアを、ディスケットまたはCD−ROMなどの有形の
媒体で供給し、プロセッサにロードすることができる。その代わりに、ソフトウ
ェアを、ネットワーク接続または他の電子リンクを介してプロセッサにダウンロ
ードすることができる。さらに、その代わりに、プロセッサ44に、イメージ処
理ステップの一部またはすべてを実行するための、専用のハードワイヤド要素ま
たはディジタル信号プロセッサを含めることができる。
【0043】 図5は、本発明の好ましい実施形態による、グレイレベル・イメージを2値化
する方法を概略的に示す流れ図である。イメージ入力ステップ50で、図1のイ
メージなどのグレイレベル・イメージが、プロセッサ44に入力される。最適化
ステップ52で、画素のグレイレベル値と、特に隣接する画素の値の間のギャッ
プを分析して、最適の中央閾値Tおよび差値Dを見つける。TおよびDによって
、T+D/2によって与えられる上閾値と、T−D/2によって与えられる下閾
値が定義される。3値化ステップ54で、入力イメージ内のすべての画素を、3
つのグループに分類し、下閾値未満のグレイレベル値を有する画素を、黒(また
は前景、通常はバイナリ1)としてマークし、上閾値を越える画素を、白(また
は背景、バイナリ0)としてマークし、上下の閾値の間の画素を、灰色としてマ
ークする。その結果が、3値イメージであり、これを、モニタ46に表示するか
、メモリ48に保管することができる。
【0044】 ステップ52で、TおよびDの値は、出力バイナリ・イメージに保存される入
力イメージの重要なエッジの数を増やすと同時に、発生するアーチファクト・エ
ッジの数が減るように選択される。このために、2つの隣接する画素の間の「意
味のあるギャップ」を、その絶対サイズがDより大きいギャップと定義する。T
を2値化閾値として使用して生成される出力バイナリ・イメージI(T)内で、
ギャップの両側の画素がI(T)内で異なる2進値を有する場合に、ギャップが
「表される」と言う。言い換えると、ギャップは、入力イメージ内の画素の一方
が、Tより大きいグレイレベル値を有し、他方がTより小さい場合に、表される
。TおよびDの最適の値は、下記の判断基準を満たすように選択されたTおよび
Dのメリット関数を最大化することによって見つけられることが好ましい。 1.I(T)で表される入力イメージ内の意味のあるギャップの数に正に相関
する 2.I(T)で表される入力イメージ内の意味のないギャップの数に負に相関
する 3.I(T)で表されない入力イメージ内の意味のあるギャップの数に負に相
関する
【0045】 そのようなメリット関数を計算するために、N(T、D)が、I(T)で表さ
れる入力イメージ内の意味のないギャップの加重カウントであるものとする。重
みづけは、I(T)で表されるギャップが小さいほど、その重みが大きくなるも
のであることが好ましい。言い換えると、N(T、D)でカウントされるギャッ
プのそれぞれが、Tを超えるグレイレベル値を有する一方の画素と、T未満のグ
レイレベル値を有する他方の画素を有し、グレイレベル値の間の差の絶対値が、
Dを超えない。MAXが、イメージ内の最大のグレイレベル値を表し、その結果
、N(T、MAX)が、I(T)で表されるギャップのすべての加重カウントに
なるものとする。G(D)が、イメージ内の意味のあるギャップすなわち、画素
のグレイレベル値の間にDを超える差の絶対値を有するギャップの数の加重カウ
ントであるものとする。下記のメトリックを定義する。 1.good(T、D)=N(T、MAX)−N(T、D)、I(T)内で表
される意味のあるギャップの加重カウント 2.artifacts(T、D)=N(T、D)、I(T)内で表される意
味のないギャップ 3.missed(T、D)=G(D)−good(T、D)、I(T)内で
失われている意味のあるギャップ これらのメトリックは、上にリストした3つの判断基準に対応する。対(T、D
)のメリット・スコアは、次式によって与えられる。 Score(T、D)=good(T、D)−artifacts(T、D)
−missed(T、D) 最高のスコアを与える対(T、D)が、ステップ54での使用のために選択され
る。
【0046】 このメリット・スコアと、TおよびDを選択する方法は、上で、例として説明
したものであり、他のスコアおよび方法を使用して、TおよびDを最適化するこ
ともできる。たとえば、ギャップに割り当てる重みを変更することができる。ま
た、「ギャップ」は、本明細書では隣接する画素を参照するものとして定義され
たが、画素が、直接に隣接する必要はなく、短い距離だけ離れるものとすること
ができる。さらに、イメージ内のすべてのギャップを評価する必要はなく、代表
的なサンプルを取り上げることができる。さらに、ギャップの評価の目的は、主
に、バイナリ・イメージ内で真のエッジを保存するTおよびDの値を選択するこ
となので、Sobel変換などのエッジ演算子を使用して、グレイスケール・イ
メージ内のエッジを識別することができる。その後、TおよびDを、これらのエ
ッジに対応する画素ギャップについて最適化することができる。V形輝度プロフ
ァイル(「ルーフ・エッジ」、細い線およびテキスト形状でよく見られる)など
のグレイスケール・イメージ内の他の情報の手がかりを、同様にこの目的に使用
することができる。上下の閾値を選択するための他の方法は、当業者には明白で
あり、本発明の範囲内とみなされる。
【0047】 図5に戻って、灰色画素処理ステップ56で、中間画素を、別に処理し、好ま
しくは2進値を割り当てる。中間画素の2値化の好ましい方法は、下で図6に関
して説明する。代替実施形態では、図3のイメージ35を生成するのに使用され
たものなどのテキスト指向2値化アルゴリズムを、グレイレベル入力イメージに
適用する。ステップ54からの中間(灰色)画素と、任意選択の白の画素に、テ
キスト指向2値化アルゴリズムによって生成された2進値を割り当てる。中間画
素を処理する他の方法は、当業者に明白であり、本発明の範囲内とみなされる。
代替案では、中間画素を2値化せず、そのグレイ・レベル値を、他の画素の2進
値と共に保管し、表示する。
【0048】 画素のすべてを2値化した後に、出力ステップ58で、バイナリ・イメージを
、表示、保管、またはさらなる処理のために出力する。任意選択として、3値イ
メージも出力する。
【0049】 図6は、本発明の好ましい実施形態による、灰色画素処理ステップ56の詳細
を概略的に示す流れ図である。図6の方法の本質は、近傍よりかなり明るいか暗
いものとして目立つ画素を、それぞれ白または黒としてマークすることである。
したがって、中間画素のそれぞれについて、平均ステップ60で、その近傍の画
素のグレイレベル値のローカル平均を判定する。黒画素ステップ62で、グレイ
レベル値が、Dより大きい差でローカル平均より小さい画素に、2進黒を割り当
てる。白画素ステップ64で、グレイレベル値が、Dより大きい差でローカル平
均より大きい画素に、2進白をを割り当てる。代替案では、ステップ62および
64で、Dの代わりに別の適当な差の値を使用することができる。さらに、その
代わりにまたは追加して、エッジ演算子などの他の尺度および演算子を使用して
、中間画素の中から目立つ画素を見つけることができる。
【0050】 ステップ62または64で分類されなかった残りの画素は、閾値化ステップ6
6で処理される。これらの画素は、単純に閾値Tに関して2値化され、その結果
、Tを超えるグレイレベル値を有する画素が、2進白に割り当てられ、他の画素
が2進黒に割り当てられることが好ましい。その代わりに、閾値化の別の方法を
使用することができる。
【0051】 図7は、本発明の好ましい実施形態による、図5および6の方法を使用して生
成された、小切手20のバイナリ・イメージ70の概略表現である。文字22が
、図3ほど明瞭ではないが、線26およびロゴ28は、正確に再生されている。
【0052】 好ましい実施形態を、文書イメージ処理に関して上で説明したが、本発明の原
理を、他のイメージ処理アプリケーションに同様に使用することができることを
理解されたい。たとえば、本明細書に記載の方法を、イメージ内の所与の比較的
均一な強さを有するエッジを検出し、イメージ内の、実際に特徴を表すエッジと
、アーチファクトに起因して生ずるか他の形で重要でないエッジを区別するよう
に適合させることができる。本発明の方法は、必要な変更を加えて、カラー・イ
メージおよび3次元物体のイメージに適用することもできる。
【0053】 したがって、上で説明した好ましい実施形態が、例として記載され、本発明が
、特に図示され上で説明されたものに制限されないことを諒解されたい。そうで
はなく、本発明の範囲は、上で説明したさまざまな特徴の組合せおよび部分的組
合せの両方、ならびに前述の説明を読む時に当業者が思い浮かべる、従来技術で
開示されていない変形形態および修正形態を含む。
【図面の簡単な説明】
【図1】 当技術分野で既知の、スキャナによって取り込まれたグレイレベル・イメージ
の概略複写である。
【図2】 2値化の既知の方法を使用して図1のグレイレベル・イメージを処理すること
によって生成されたバイナリ・イメージの概略複写である。
【図3】 2値化の既知の方法を使用して図1のグレイレベル・イメージを処理すること
によって生成されたバイナリ・イメージの概略複写である。
【図4】 本発明の好ましい実施形態による、イメージ処理装置の概略の絵図である。
【図5】 本発明の好ましい実施形態による、イメージ2値化の方法を概略的に示す流れ
図である。
【図6】 本発明の好ましい実施形態による、図5の方法の詳細を概略的に示す流れ図で
ある。
【図7】 図5および6の方法を使用して図1のグレイレベル・イメージを処理すること
によって生成されたバイナリ・イメージの概略複写である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CR,CU,CZ,DE,DK ,DM,DZ,EE,ES,FI,GB,GD,GE, GH,GM,HR,HU,ID,IL,IN,IS,J P,KE,KG,KP,KR,KZ,LC,LK,LR ,LS,LT,LU,LV,MA,MD,MG,MK, MN,MW,MX,MZ,NO,NZ,PL,PT,R O,RU,SD,SE,SG,SI,SK,SL,TJ ,TM,TR,TT,TZ,UA,UG,US,UZ, VN,YU,ZA,ZW Fターム(参考) 5C077 LL19 MP01 PP46 PQ12 PQ18 PQ20 RR04 RR06 RR16 SS01 TT06

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 イメージ2値化の方法であって、 それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
    ジを受け取るステップと、 下閾値と、選択された差だけ前記下閾値より大きい上閾値とを判定するステッ
    プと、 前記上閾値より大きいグレイレベル値を有する前記グレイレベル・イメージの
    前記画素に第1の2進値を割り当て、前記下閾値未満のグレイレベル値を有する
    前記グレイレベル・イメージの前記画素に第2の2進値を割り当てるステップと
    、 前記下閾値と前記上閾値との間のグレイレベル値を有する中間グループの前記
    画素の前記第1の2進値および前記第2の2進値への最適の割当てを判定するた
    めに、前記中間グループの前記画素を処理するステップと を含む方法。
  2. 【請求項2】 前記下閾値および前記上閾値を判定するステップが、前記入力イメージの前記
    画素の前記グレイレベル値の間の変動を分析するステップと、前記分析された変
    動に応答して前記閾値を判定するステップとを含む、請求項1に記載の方法。
  3. 【請求項3】 前記グレイレベル値の間の前記変動を分析するステップが、前記入力イメージ
    のエッジを見つけるステップを含み、前記閾値を判定するステップが、前記割り
    当てられる2進値からなる出力イメージで前記エッジを保存するために前記閾値
    を選択するステップを含む、請求項2に記載の方法。
  4. 【請求項4】 前記グレイレベル・イメージの間の前記変動を分析するステップが、隣接する
    画素の前記グレイレベル値の間のギャップを見つけるステップを含み、前記閾値
    を判定するステップが、前記割り当てられる2進値からなる出力イメージで、重
    要でないギャップよりも重要なギャップを優先して保存するように前記閾値を選
    択するステップを含む、請求項2に記載の方法。
  5. 【請求項5】 前記閾値を選択するステップが、その絶対的な大きさが前記上閾値と前記下閾
    値との間の前記選択された差より大きいものとして、意味のある前記ギャップを
    定義するステップを含む、請求項4に記載の方法。
  6. 【請求項6】 前記閾値を選択するステップが、上閾値および下閾値の複数の異なる対につい
    て計算されるメリット・スコアを最大にするように前記上閾値および前記下閾値
    を選択するステップを含み、前記スコアが、前記選択された閾値によって前記出
    力イメージで保存される意味のあるギャップの数に正に相関し、前記選択された
    閾値によって前記出力イメージで、保存される意味のないギャップの数および保
    存されない意味のあるギャップの数に負に相関する、請求項5に記載の方法。
  7. 【請求項7】 前記閾値を判定するステップが、前記割り当てられる2進値からなる出力イメ
    ージでエッジ情報を保存するように前記閾値を選択するステップを含む、請求項
    1ないし6のいずれかに記載の方法。
  8. 【請求項8】 前記閾値を選択するステップが、前記情報が属するイメージ特徴のタイプに実
    質的に依存しない閾値を選択するステップを含む、請求項7に記載の方法。
  9. 【請求項9】 前記閾値を選択するステップが、前記上閾値および前記下閾値の最適平均値を
    見つけるステップと、前記閾値の間の前記選択された差の最適値を見つけるステ
    ップとを含む、請求項7に記載の方法。
  10. 【請求項10】 前記中間グループの前記画素を処理するステップが、前記入力イメージの前記
    画素の前記グレイレベル値の間の変動を分析するステップと、前記分析された変
    動に応答して前記画素の前記第1の2進値および前記第2の2進値への割り当て
    を判定するステップとを含む、請求項1ないし6のいずれかに記載の方法。
  11. 【請求項11】 前記分析された変動に応答して前記割り当てを判定するステップが、前記画素
    の1つの前記グレイレベル値とその近傍の他の画素の前記グレイレベル値との間
    の意味のある差を見つけるステップと、前記差に応答して前記画素に前記第1の
    2進値または前記第2の2進値を割り当てるステップとを含む、請求項10に記
    載の方法。
  12. 【請求項12】 前記中間グループの前記画素を処理するステップが、前記中間グループの前記
    画素の前記最適の割当てを判定するために、テキストについて最適化された2値
    化方法を適用するステップを含む、請求項1ないし6のいずれかに記載の方法。
  13. 【請求項13】 前記画素の前記割り当てられた2進値からなるバイナリ・イメージを出力する
    ステップを含む、請求項1ないし6のいずれかに記載の方法。
  14. 【請求項14】 それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
    ジを処理する方法であって、 前記入力イメージの前記画素の前記グレイレベル値の間の変動を分析するステ
    ップと、 前記分析された変動に応答して、下閾値と、選択されたギャップ・サイズだけ
    前記下閾値より大きい上閾値とを判定するステップと、 前記上閾値を超えるグレイレベル値を有する前記グレイレベル・イメージの画
    素に第1の2進値を割り当て、前記下閾値未満のグレイレベル値を有する前記グ
    レイレベル・イメージの画素に第2の2進値を割り当てるステップと、 前記第1の2進値および前記第2の2進値を割り当てられた画素が、そのそれ
    ぞれの2進値によって表され、前記下閾値と前記上閾値との間のグレイレベル値
    を有する中間グループの画素が、それぞれのグレイレベル値によって表される、
    3値出力イメージを生成するステップと を含む方法。
  15. 【請求項15】 前記閾値を判定するステップが、前記出力イメージにエッジ情報を保存するよ
    うに前記閾値を選択するステップを含む、請求項14に記載の方法。
  16. 【請求項16】 前記3値出力イメージを生成するステップが、前記出力イメージを表示するス
    テップを含む、請求項14または15に記載の方法。
  17. 【請求項17】 前記3値出力イメージを生成するステップが、前記出力イメージをメモリに保
    管するステップを含む、請求項14または15に記載の方法。
  18. 【請求項18】 イメージ2値化の装置であって、イメージ・プロセッサを含み、前記イメージ
    ・プロセッサが、それぞれのグレイレベル値を有する複数の画素を含むグレイレ
    ベル入力イメージを受け取るように結合され、前記イメージ・プロセッサが、下
    閾値と、選択された差だけ前記下閾値より大きい上閾値とを判定し、前記上閾値
    より大きいグレイレベル値を有する前記グレイレベル・イメージの前記画素に第
    1の2進値を割り当て、前記下閾値未満のグレイレベル値を有する前記グレイレ
    ベル・イメージの前記画素に第2の2進値を割り当て、前記下閾値と前記上閾値
    との間のグレイレベル値を有する中間グループの前記画素の前記第1の2進値お
    よび前記第2の2進値への最適の割当てを判定するために、前記中間グループの
    前記画素を処理するように適合される、装置。
  19. 【請求項19】 前記プロセッサが、前記入力イメージの前記画素の前記グレイレベル値の間の
    変動を分析し、前記分析された変動に応答して前記閾値を判定するように適合さ
    れる、請求項18に記載の装置。
  20. 【請求項20】 前記プロセッサが、前記分析された変動に応答して、前記第1の2進値および
    前記第2の2進値への前記中間グループの画素の割当てを判定するように適合さ
    れる、請求項19に記載の装置。
  21. 【請求項21】 前記プロセッサが、エッジ情報が属するイメージ特徴のタイプに実質的に依存
    せずに、前記割り当てられる2進値からなる出力イメージで前記エッジ情報を保
    存するように前記閾値を選択するように適合される、請求項18ないし20のい
    ずれかに記載の装置。
  22. 【請求項22】 前記プロセッサが、前記中間グループの前記画素の前記最適の割当てを判定す
    るために、テキストについて最適化された2値化方法を適用するように適合され
    る、請求項18ないし20のいずれかに記載の装置。
  23. 【請求項23】 前記プロセッサが、前記画素の前記割り当てられた2進値からなるバイナリ・
    イメージを出力するように適合される、請求項18ないし20のいずれかに記載
    の装置。
  24. 【請求項24】 それぞれのグレイレベル値を有する複数の画素を含むグレイレベル入力イメー
    ジを処理する装置であって、前記装置が、イメージ・プロセッサを含み、前記イ
    メージ・プロセッサが、前記入力イメージの前記画素の前記グレイレベル値の間
    の変動を分析し、前記分析された変動に応答して、下閾値と、選択されたギャッ
    プ・サイズだけ前記下閾値より大きい上閾値とを判定し、前記上閾値を超えるグ
    レイレベル値を有する前記グレイレベル・イメージの画素に第1の2進値を割り
    当て、前記下閾値未満のグレイレベル値を有する前記グレイレベル・イメージの
    画素に第2の2進値を割り当て、したがって、前記第1の2進値および前記第2
    の2進値を割り当てられた画素が、そのそれぞれの2進値によって表され、前記
    下閾値と前記上閾値との間のグレイレベル値を有する中間グループの画素が、そ
    れぞれのグレイレベル値によって表される、3値出力イメージを生成するように
    適合される、装置。
  25. 【請求項25】 ディスプレイを含み、前記ディスプレイが、前記3値出力イメージを受け取り
    、表示するために前記プロセッサに結合される、請求項24に記載の装置。
  26. 【請求項26】 ストレージ・メモリを含み、前記ストレージ・メモリが、前記3値出力イメー
    ジを受け取り、保管するために前記プロセッサに結合される、請求項24または
    25に記載の装置。
  27. 【請求項27】 請求項1ないし17のいずれかに記載の方法をコンピュータに実行させるプロ
    グラム。
JP2001564084A 2000-03-02 2001-02-21 イメージ2値化の改良された方法 Expired - Lifetime JP3953817B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/519,446 2000-03-02
US09/519,446 US6351566B1 (en) 2000-03-02 2000-03-02 Method for image binarization
PCT/IL2001/000163 WO2001065465A2 (en) 2000-03-02 2001-02-21 Improved method for image binarization

Publications (2)

Publication Number Publication Date
JP2003525560A true JP2003525560A (ja) 2003-08-26
JP3953817B2 JP3953817B2 (ja) 2007-08-08

Family

ID=24068340

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001564084A Expired - Lifetime JP3953817B2 (ja) 2000-03-02 2001-02-21 イメージ2値化の改良された方法

Country Status (11)

Country Link
US (1) US6351566B1 (ja)
EP (1) EP1269394B1 (ja)
JP (1) JP3953817B2 (ja)
AT (1) ATE383625T1 (ja)
AU (1) AU2001235931A1 (ja)
BR (2) BRPI0108856B8 (ja)
CA (1) CA2397805C (ja)
DE (1) DE60132315T2 (ja)
IL (2) IL151545A0 (ja)
MX (1) MXPA02008296A (ja)
WO (1) WO2001065465A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012039189A (ja) * 2010-08-03 2012-02-23 Fuji Xerox Co Ltd 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
JP2013219671A (ja) * 2012-04-11 2013-10-24 Konica Minolta Inc 画像処理装置、画像処理方法、およびコンピュータプログラム

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
US6587585B1 (en) * 2000-05-23 2003-07-01 Ncr Corporation Method of parameterizing a threshold curve for a binarization program and an apparatus therefor
US7417771B2 (en) * 2001-06-26 2008-08-26 Sharp Laboratories Of America, Inc. Error diffusion halftoning system
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US7136515B2 (en) * 2001-09-13 2006-11-14 Intel Corporation Method and apparatus for providing a binary fingerprint image
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
KR100484141B1 (ko) * 2002-06-05 2005-04-18 삼성전자주식회사 영상 이진화 장치 및 방법
KR100532275B1 (ko) * 2002-12-11 2005-11-29 삼성전자주식회사 이미지 압축방법
US7315398B2 (en) * 2003-12-19 2008-01-01 Xerox Corporation Multi-level error diffusion with color image data
US7295347B2 (en) * 2003-12-19 2007-11-13 Xerox Corporation Image processing method for generating multi-level data
JP2006309650A (ja) * 2005-05-02 2006-11-09 Calsonic Kansei Corp ナンバー認識装置及方法
US7724955B2 (en) * 2005-05-31 2010-05-25 Xerox Corporation Apparatus and method for auto windowing using multiple white thresholds
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
US20080005684A1 (en) * 2006-06-29 2008-01-03 Xerox Corporation Graphical user interface, system and method for independent control of different image types
US20080101703A1 (en) * 2006-10-30 2008-05-01 Lockheed Martin Corporation Systems and methods for recognizing shapes in an image
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8117134B2 (en) * 2008-10-16 2012-02-14 Xerox Corporation Neutral pixel correction for proper marked color printing
CN101727582B (zh) * 2008-10-22 2014-02-19 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
TWI463415B (zh) * 2009-03-06 2014-12-01 Omnivision Tech Inc 以物件為基礎之光學字元辨識之預處理演算法
US8406554B1 (en) * 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
KR100977558B1 (ko) * 2009-12-22 2010-08-23 전자부품연구원 적외선 스크린 방식의 공간 터치 장치
US8594446B2 (en) 2012-01-12 2013-11-26 Eastman Kodak Company Method for enhancing a digitized document
US8937749B2 (en) 2012-03-09 2015-01-20 Xerox Corporation Integrated color detection and color pixel counting for billing
CN104346599B (zh) * 2013-07-23 2019-09-17 深圳市腾讯计算机系统有限公司 一种色彩边缘的检测方法及图像处理设备
KR102208893B1 (ko) 2013-12-30 2021-01-28 삼성전자주식회사 디스플레이 장치 및 디스플레이 장치의 채널 맵 관리 방법
US9704057B1 (en) * 2014-03-03 2017-07-11 Accusoft Corporation Methods and apparatus relating to image binarization
US10127672B2 (en) * 2015-10-12 2018-11-13 International Business Machines Corporation Separation of foreground and background in medical images
US10416681B2 (en) * 2017-07-12 2019-09-17 Mitsubishi Electric Research Laboratories, Inc. Barcode: global binary patterns for fast visual inference
US10878596B2 (en) 2018-11-29 2020-12-29 International Business Machines Corporation Object oriented image normalization

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4520505A (en) * 1981-12-23 1985-05-28 Mitsubishi Denki Kabushiki Kaisha Character reading device
US5067162A (en) 1986-06-30 1991-11-19 Identix Incorporated Method and apparatus for verifying identity using image correlation
US4832447A (en) 1987-12-04 1989-05-23 Board Of Trustees Operating Michigan State University Joint transform image correlation using a nonlinear spatial light modulator at the fourier plane
IL91220A (en) 1989-08-04 1995-03-30 Ibm Israel Compression of information
JPH07104921B2 (ja) * 1989-11-17 1995-11-13 松下電器産業株式会社 画像閾値決定方法
US5191525A (en) 1990-01-16 1993-03-02 Digital Image Systems, Corporation System and method for extraction of data from documents for subsequent processing
US5793887A (en) 1993-11-16 1998-08-11 International Business Machines Corporation Method and apparatus for alignment of images for template elimination
US5715325A (en) 1995-08-30 1998-02-03 Siemens Corporate Research, Inc. Apparatus and method for detecting a face in a video image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012039189A (ja) * 2010-08-03 2012-02-23 Fuji Xerox Co Ltd 二値化処理装置、画像処理装置、二値化処理プログラム、画像処理プログラム
JP2013219671A (ja) * 2012-04-11 2013-10-24 Konica Minolta Inc 画像処理装置、画像処理方法、およびコンピュータプログラム

Also Published As

Publication number Publication date
EP1269394A2 (en) 2003-01-02
MXPA02008296A (es) 2002-12-09
AU2001235931A1 (en) 2001-09-12
ATE383625T1 (de) 2008-01-15
DE60132315D1 (de) 2008-02-21
WO2001065465A2 (en) 2001-09-07
BR0108856A (pt) 2005-01-11
BRPI0108856B8 (pt) 2018-08-14
EP1269394A4 (en) 2006-11-22
DE60132315T2 (de) 2009-01-02
IL151545A (en) 2007-12-03
BRPI0108856B1 (pt) 2018-02-27
CA2397805C (en) 2007-05-01
CA2397805A1 (en) 2001-09-07
US6351566B1 (en) 2002-02-26
JP3953817B2 (ja) 2007-08-08
EP1269394B1 (en) 2008-01-09
IL151545A0 (en) 2003-04-10
WO2001065465A3 (en) 2002-01-17

Similar Documents

Publication Publication Date Title
JP3953817B2 (ja) イメージ2値化の改良された方法
CN114937055B (zh) 基于人工智能的图像自适应分割方法与系统
JPH0737103A (ja) 傾き角度検出装置
CN109740572A (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN111461131B (zh) 身份证号码信息识别方法、装置、设备及存储介质
CN114863493B (zh) 一种低质量指纹图像和非指纹图像的检测方法及检测装置
CN101447023A (zh) 人头检测方法和系统
CN114240925A (zh) 一种文档图像清晰度的检测方法及其系统
Zhao et al. An adaptive thresholding method for binarization of blueprint images
JPH0565911B2 (ja)
JP3906221B2 (ja) 画像処理方法及び画像処理装置
Chang et al. An efficient thresholding algorithm for degraded document images based on intelligent block detection
Li et al. A modified histogram equalization approach for image contrast enhancement
CN114913099A (zh) 视频文件处理的方法和系统
Liu et al. Document image binarization based on texture analysis
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
CN111382741A (zh) 一种自然场景图片中文本检测方法、系统及设备
JP3949954B2 (ja) ドロップアウトカラー識別処理プログラム、方法、および装置
CN115690132A (zh) 一种图像处理方法和系统
JP3759349B2 (ja) 画像解析装置と画像解析方法
Goto et al. Character pattern extraction from documents with complex backgrounds
Yaghmaee et al. Introducing a new method for estimation image complexity according to calculate watermark capacity
CN111027460A (zh) 一种基于EmguCV的智能服务机器人人脸识别方法
TW503377B (en) Image processing method and system with multiple modes
CN114612918A (zh) 基于动态阈值的单元格高速检测方法及系统

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050907

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20051205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060831

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070424

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070425

R150 Certificate of patent or registration of utility model

Ref document number: 3953817

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140511

Year of fee payment: 7

EXPY Cancellation because of completion of term