JPH10506733A - テキスト包含イメージにおける背景からの前景の分離方法及び装置 - Google Patents

テキスト包含イメージにおける背景からの前景の分離方法及び装置

Info

Publication number
JPH10506733A
JPH10506733A JP8523637A JP52363796A JPH10506733A JP H10506733 A JPH10506733 A JP H10506733A JP 8523637 A JP8523637 A JP 8523637A JP 52363796 A JP52363796 A JP 52363796A JP H10506733 A JPH10506733 A JP H10506733A
Authority
JP
Japan
Prior art keywords
image
value
contrast
bin
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8523637A
Other languages
English (en)
Other versions
JP3264932B2 (ja
Inventor
モウド,マイケル,シー
ゴーリアン,イズレイル,エス.
Original Assignee
ユナイテッド パーセル サービス オブ アメリカ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユナイテッド パーセル サービス オブ アメリカ,インコーポレイテッド filed Critical ユナイテッド パーセル サービス オブ アメリカ,インコーポレイテッド
Publication of JPH10506733A publication Critical patent/JPH10506733A/ja
Application granted granted Critical
Publication of JP3264932B2 publication Critical patent/JP3264932B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 前景としてのテキストと、背景としての汚れ、色、ノイズ、同様のものと、を包含する階調画像をスレショルドするための方法及び装置。本方法は、適応が高い。本方法は、複数のスレショルド化バイナリ・イメージ候補を生成するするためのコントラストに基づくヒストグラム評価におけるスレショルド・プロセス・パラメータの複数のセットを使う。本方法は、自動的に最高品質のバイナリ・イメージ、すなわち、複数の候補者バイナリ・イメージの中から最良にテキスト前景内に表示するバイナリ・イメージ、を選択する。本装置は、最高速度で、本方法をインプリメントするための、パイプライン・プロセッサである。

Description

【発明の詳細な説明】 テキスト包含イメージにおける背景からの前景の分離方法及び装置 発明の分野 本発明は、概ね、オリジナルの階調イメージの前景/背景に相当するバイナリ の白黒イメージを生成するために、階調イメージをパラメータ表示でスレショル ドする方法及び装置に関し、さらに、前景としてテキスト文字を包含する階調イ メージに特に関している。本発明は、複数のバイナリ・イメージをつくるために パラメータの複数のセットが使用されるインスタンスとして、最上質のバイナリ ・イメージを決定・選択する方法と装置を含んでいる。 発明の背景 多くのアプリケーションにおいて、自動手段によってテキスト情報をイメージ から抜き取ることが、望まれている。例えば、機械を使うことは、手作業なしで アドレス・ラベルを読み取る機械を使用することは、労力とコストを削減する1 つのテクニックである。自動ラベル・アドレス読み取りの1つのテクニックは、 アドレス・ラベル・エリアのイメージを捕捉するために電荷結合デバイス(「C CD」)カメラを使用する。 CCDカメラにより提供されるnxmイメージは、階調イメージと呼ばれてい るが、それは、イメージ内のnxmピクセルの各々が、ゼロと最大値の間のグレ イ値を想定し、これによりゼロが黒、最大値が白、そして、中間値が灰色とする ことができるからである。典型的には、この最大値は、255又は1023であ る。大部分のアドレス・ラベル読み取りアプリケーションにとっては、階調イメ ージは、ピクセルが黒が0及び白が1という2つの値のうちの一方を取るバイナ リ・イメージに変換される必要がある。 バイナリ・イメージにおいては、黒いピクセルは、通常テキストである前景に 相当し、一方、白いピクセルは背景に相当する。階調イメージをバイナリ・イメ ージに変換するプロセスは、スレショルディングと呼ばれている。そのイメージ がスレショルドされた後、ラベルは、光学文字認識(「OCR」)プロセス を利用して、自動的に読み取られる。 あいにく、多くの一般的なスレショルド法は、ラベルの多様さゆえに、アドル ス・ラベルの上で背景から前景を分離する際に甚大な困難を伴う。ラベルは、異 なる色の背景、異なる色のテキスト印刷、ぼやけ、しみ、帯状の不良部分、テー プ効果、低いコントラストのテキスト、グラフィックス、及び塑性ウィンドウを 持つ可能性がある。ラベルの上のテキストは、ドット・マトリクスか、レーザー プリンタで印刷されたか、タイプライターで打たれたか、あるいは、手書きか、 であろうし、また、多数のフォントのいずれかであろう。ラベルの変化は、多く のスレショルド・プロセスが、前景テキストを背景から適切に切り離すことを困 難にし、多くの誤った前景/背景割り当てを生起させるであろう。背景ピクセル が値0(黒い)を割り当てられるか、前景テキストピクセルが値1(白い)を割 り当てられるとき、誤った割り当てが、発生する。もし前者の場合、ノイズが、 成果物であるバイナリイメージにもたらされる、そして、このことは必然的に、 OCRを使っでラベル読み取りする際の困難に帰結するであろう。後者の場合、 グレイ・レベル・イメージ内に存在したテキストは削除され、そして、やはりO CRプロセスは、失敗するであろう。 正確である必要に加え、自動スレショルド技術は、迅速で、コスト削減技術と して有効なために効率的で、なければならない。多くのアプリケーションにおい ては、自動ラベルリーダは、自動システムが時間当たり最高3600の割合で小 包を運搬しているようなような、封書/小包配達サービスによって使用されてい る。この割合では、次のラベル上の処理が始まる前に完了される必要のために、 ラベルは1秒未満にイメージ化され、処理されるはずである。それゆえ、スレシ ョルド技術がリアル・タイムに利用されるためには、スレショルド化テキスト・ イメージを処理するOCR技術時間を提供するため、1秒よりかなり短い間に、 階調イメージをスレショルドするという要請がある。 このように、前景/背景の誤った割り当ての数を最小化する1つの方法で、背 景から前景テキストを分離する高速なアルゴリズムのセットを利用するスレショ ルドの方法と装置の要求がある。 また、順応性のあり、それゆえ、多種多様な文字フォント及びテキスト表示に おける他の相違に調整可能である、スレショルド法と装置の要求もある。 発明の概要 本発明は、階調イメージから高品質のスレショルド済のバイナリイメージを生成 する方法と装置である。好適な実施例のにおいては、この方法は、2つの段階か ら成る。第1の段階において、多くのバイナリ・ラベル・イメージ候補が、オリ ジナルの階調イメージから生成される。各イメージ候補は、スレショルド・プロ セス・パラメータの異なるセットを中間的なイメージ(コントラスト・イメージ )に適用することによって、生成される。そしてそれは、ローカル及びグローバ ルなコントラスト情報を使用して、オリジナルの階調ラベル・イメージから生成 される。第2の段階において、バイナリ・イメージ候補は比較され、そして、最 も上質のバイナリ・イメージが選択される。本発明はラベル適応スレショルド( 「LAT」)と呼ばれるが、なぜならば、それがラベル上で、多くの異なる種類 のラベルとキャラクタに適応するのからである。 階調イメージに相当する中間的なコントラスト・イメージを生成する方法は、 コントラスト・イメージ内で(i,j)ポジションを選択する以下のステップを 含むんでおり、ここでは、iはコントラスト・イメージ内の行を示し、jは列を 示している、すなわち;階調イメージ内で対応する行列位置で心出しされた矩形 のウィンドウ内の全ての階調イメージピクセルの、最低の階調値、MINijを 探し; 同一の矩形のウィンドウ内の全ての階調イメージピクセルの、最大階調 値MAXijを探すステップと; 公式 LCij=C(1−(MINij +p)/(MAXij+p)) (Cは予選択済最大コントラスト値、pはCと比較してより小さい予選択済正の 数)、 によって階調イメージの、ローカル・コントラストLCijを計算し; そし て、LCijに等しい階調値を、コントラスト・イメージの(i,j)ポジショ ンに割り当て; 及び、スレショルドされるべき階調イメージの部分に相当する 各位置毎に上記ステップ群を繰り返す、ステップである。 スレショルド化バイナリ・イメージ候補を生成するプロセスの一部として、許 容最低コントラスト値が、選択される。この値を選択する方法は、コントラスト ・イメージ内の全てのポシブルなコントラスト値に対し、コントラスト・ヒスト グラムを生成する以下のステップを含んでいる、すなわち; コントラスト・ヒ ストグラム内で、予選択済ピーク・フロア・レベル値より大きく、かつ、予選択 済名目的ピーク幅値で、どんなに高いピークからも分離された、全てのピークを 検索し; 予選択済最低コントラスト値より大きく、最低コントラスト値で出現 するピークの位置捕捉をすることによって、検索したピークの中から最低テキス ト・ピークを選択し; そして、最低テキスト・ピークのコントラスト値から、 予選択済名目的テキスト・ピーク幅値を減ずることによって、許容最低コントラ スト値を獲得す、ステップである。 ピーク・フロア・レベル値のために予選択済値、名目的ピーク幅値、最低コン トラスト値、及び名目的テキスト・ピーク幅値は、後述する2つのカットオフ値 とともに、一組のスレショルド・プロセス・パラメータを含んでいる。 最終的に、背景内の各ピクセルにつき1、また、前景内の各ピクセルにつき0 を割り当てることによって、バイナリ・イメージ候補が生成される。 階調イメージのピクセルは、以下のステップから成る方法によって、背景クラ スと前景クラスに分けられるが、それは、該ピクセルで心出しされた矩形のウィ ンドウ内の全ピクセルの最低の階調値、MINij、を探し; 矩形のウィンド ウ内の全てのピクセルの、最大階調値、MAXij、を探すステップと; 公式 LCij=C(I−(MINij+p)/(MAXij +p))(C は予選択済最大のコントラスト値、pはCと比較してより小さい予選択済正の数 )、 によって、ローカル・コントラストLCijを計算し; 及び、もしLCij が予選択済許容最低コントラスト値より少ない場合、ピクセルを背景クラスに割 り当てる、ステップである。 前のステップは、コントラスト・イメージを計算するのに要求されるステップ と同じものであり;もし、コントラスト・イメージが生成されたならば、そのス テップは、繰り返される必要はない。 許容最低コントラスト値とローカル・コントラストの比較による背景クラスへ の割り当てがされなかったピクセルにつき、MAXijとMINijとの差が計 算され、もし予選択済最低コントラスト・スケール値より最大最低差が少ない場 合、ピクセルは背景クラスに割り当てられる。もしピクセルが、尚、背景クラス に割り当てられない場合、MAXijと該ピクセルの階調値との差は計算され、 予選択済名目的コントラスト超過値より最大値とピクセル値との差が少ない場合 、該ピクセルは背景クラスに割り当てられる。ピクセルが上述のステップ群によ って背景クラスに割り当てられない場合、該ピクセルは、前景クラスに割り当て られる。 本発明は、2又それ以上のセットのスレショルド・プロセス・パラメータ、2 又はそれ以上のバイナリ・イメージ候補を生むこと、を期待している。オリジナ ルの階調イメージのいかなる2つのスレショルド化バイナリ・イメージ候補間か らでも選択するために、本発明は、前景に対応するバイナリ・イメージの各部分 を、ラン長エンコード(RLE)イメージに変換する以下のステップを含む方法 を使用するが、そのステップとは; 部分抽出を使用するRLEイメージの部分 の番号とサイズ(すなわち、ピースサイズ分布)を決定し; RLEイメージの ピースサイズ分布からヒストグラムを生成し; 及び、2つのバイナリ・イメー ジのうつの1つを選択するために、統計又はニューラルネットワーク解析として 、ヒストグラムを使用する、ステップである。 もし2つ以上のバイナリ・イメージがあるならば、全てのバイナリ・イメージ のセーブ1が除去されるまで、この方法はペアで適用される。RLEイメージの 使用は、オプションであるが、それらの使用が、位置の表示におけるバイナリ・ イメージからピースサイズ分布を決定する手法における処理時間を大いに削減す る。 バイナリ・イメージのピースサイズ分布は、バイナリ・イメージの2つの値の一 方かもう一方を有する前記バイナリ・イメージの各々のピースに関するピースの サイズ的な数の規格である。このピースサイズ分布は、品質選択を考慮する必要 のない場面では、2つのバイナリ・イメージの単純な比較のために使用され得る 。 このように、速く階調イメージをスレショルドするための方法と装置を提供する ことが、本発明の目的である イメージ内でテキストを明確に確認するために、ある階調イメージ内のローカ ル・コントラスト情報を使用する方法と装置を提供することは、本発明の更なる 目的である 本発明の更なる目的は、前景内のテキストと背景内の非テキストを、テキスト 包含のオリジナルの階調イメージからスレショルドされた、2又はそれ以上のバ イナリ・イメージ候補の中から最善に表示するバイナリ・イメージを選択する方 法と装置を提供することである。 本発明の更なる目的は、OCR入力のための高品質のバイナリ・イメージを生 成するために、読み取り困難なラベルを自動的に処理することである。 本発明は、後述する実施例の詳細な説明で明らかになるように、これらの目的 に合致し、先行技術の欠点を克服するものである。 図面の簡単な説明 図1は、本発明の方法の実施例の主なステップとデータ・フローを示す。 図2は、本発明の方法の実施例のスレショルド技術に関する主なステップとデ ータ・フローを示す。 図3は、階調イメージのピクセル値のサンプルセットを示し、かつ、イメージ の生成を図示する。 図4は、階調イメージのピクセル値のサンプルセットを示し、かつ、MAXイ メージの生成を図示する。 図5は、MINとMAXのイメージから、コントラスト・イメージの生成を示 す。 図6は、典型的なコントラスト・ヒストグラムを示し、本発明の方法の実施例 に関する様々なスレショルド・プロセス・パラメータを示す 図7は、バイナリ・イメージを示し、バイナリ・イメージをラン長エンコード (RLE)フォーマットに変換することで表示されるデータにおける減衰を示す 。 図8は、見本ラベルの階調イメージを示す。 図9は、図8中の、スレショルド化階調イメージのバイナリ・イメージを、ス レショルド・パラメータの1つのセットを使用して示す。 図10は、図8中の階調イメージのスレショルド化バイナリ・イメージを、ス レショルド・パラメータの2番目のセットを使用して、示す。 図11は、図8中の階調イメージのスレショルド化バイナリ・イメージを、ス レショルド・パラメータの3番目のセットを使用して、示す。 図12は、本発明の装置の好適な実施例の主な構成要素のブロック図である。 好適な実施例の詳細な説明 図1は、本発明の実施例の全般的プロセスとデータ・フローのブロック図であ る。図2は、本発明の実施例の第1段階における主なステップとデータ・フロー のブロック図である。図1のブロック1において、階調イメージを表示するディ ジタル・データが獲得されるときに本プロセスの第1段階が、開始する。階調イ メージは、ピクセルのn行とm桁を表示するn×mピクセルを有し、各々は、1 から、イメージを生成する装置で提供される最大値への階調値を有している。好 適には、この装置はCCDカメラであり、このピクセルグレイ値は0(黒)から 255(白)まで変化する。また、図1のブロック1において、3つの別々のn ×mピクセル・イメージは、その階調イメージから生成されるが:それは、MI Nイメージ;MAXイメージ;及び、コントラスト・イメージである。MINイ メージ内の行iと桁jでのピクセルは、小さい領域、階調イメージの行iと桁j のまわりの好ましくは矩形のボックス、内の最低階調値を包含する。また、この 規格においては、あるイメージの行iと桁jは、イメージの(i,j)ポジショ ンと呼ばれるだろう。MAXイメージは、最低値の代わりに最大値を使って、同 様に生成される。コントラスト・イメージの(i,j)ポジションにおけるピク セルは、MINとMAXイメージ内での(i,j)ポジションにおける値から、 代数的に計算される。それに加えて、コントラスト・イメージ内の値のヒストグ ラムが、計算される。これらのステップは、図2のブロック1スルー4内でより 大幅に詳しく示されている。図1のブロック2と図2のブロック6に示すように 、1セットのスレショルド・パラメータを利用したピーク分析が、コントラスト ・ヒストグラム上で実行される。ピーク分析の成果は、最低のコントラストを選 択するために利用され、それにより、図2のブロック7に示すように、コントラ スト・イメージのスレショルドが可能になる。図2のブロック8に示すように、 スレショルド化コントラスト・イメージは、バ イナリ・イメージを生成するために、オリジナルの階調イメージ、MINイメー ジ、MAXイメージ及びコントラスト・イメージ自体と連携して使用される。 図2もまた、MIN、MAXそしてコントラスト・イメージ、及びコントラス ト・ヒストグラムのような方法のいろいろな中間的生成の、生成と使用に関連す るデータ・フローを示している。本方法のあるステップで生成したデータは、必 要に応じて、ある方法ステップから次の方法ステップまでの実行に附随し得る。 例えば、MIN、MAX、そしてコントラスト・イメージの生成は、コントラ スト・ヒストグラムを生成し、本発明によるヒストグラム・ピーク分析を実施す るのに、必要である しかし、一端これらの3つのイメージが生成されると、そ れらは、再びピーク分析の最終的なステップ内や、オリジナルの階調イメージの スレショルドにおいて利用され得る。図2の太線は、オリジナルの階調、MIN 、MAX、そして、コントラスト・イメージのデータが、その方法における後の ステップによる使用に対し、どのようにして有効になるかを示している。これら の中間的なイメージと、中間的なイメージを、それらを再生成するよりもむしろ 、再利用するスレショルド法の設計とを、2つとも利用する認識は、本発明によ って達成される時間節約と速度に関わる重要な部分である。 本発明の第2段階は、第1段階内で生産されたバイナリ・イメージと共に始ま る。図1は、スレショルド・プロセス・パラメータの3つのセットが、スレショ ルド化バイナリ・イメージを生成するのに利用される操作の好適なモードを示す 。もし、プロセス・パラメータの追加のセットを使用する要請があるのならば、 図1のブロック2スルー5によって表示されるステップは、プロセス・パラメー タの各セットのために繰り返されるだろう。 図1のブロック3、7、及び11において、各バイナリ・イメージは、ラン長 エンコードされた(RLE)フォームに変換される。次に、ブロック1、8、及 び、12において、関係のある構成要素の数とサイズを決定するために、部分抽 出が実行される。ブロック5、9、及び、13において、ピースサイズ分布のヒ ストグラムは、各イメージのために生成される。ブロック14において、ピース サイズ・ヒストグラムとRLEイメージは、最高品質のバイナリ・イメージを選 択するために、使用される。図1中の太線は、1つの方法ステップから その次までの通常のデータ・フローに加えて、各バイナリ・イメージをブロック 14の最終ステップにRLEデータを直接供給することに関するデータ・フロー を示す。 本発明の方法は、パイプライン・プロセッサの上で最高速度で実行され得る。 パイプライン・プロセッサは、イメージング テクノロジー インク製の15 0/40処理モジュールの選択採用するのが好ましい。150/40モジュール は、図12に示すように、VMEバスに相互接続可能である。また、ヒューリコ ン コーポレーションから販売されているNitro60プロセッサのような、 1又はそれ以上の一般的なプロセッサ21、22、及び23も、VMEバスに接 続可能であろう。 イメージング テクノロジー インク販売のIMA 150/40モジュールの ようなイメージ・マネージャー31、そして、やはりイメージング テクノロジ ー インク販売のCMC 150/40モジュールのような、計算モジュール・ コントローラ41も、また、VMEバスに接続可能であろう。本発明の方法は、 C言語においてコード化され、かつ、Nitro60プロセッサ21、22、及 び23、そして、VMEバス上の他の処理モジュールへのインストール用にクロ スコンパイルされ得る。1個のNitro60プロセッサ21は、システムに対 するオペレーター制御を提供するために、マウス制御線25とRS232ポート 26を有しているであろう。また、1個のNitro60プロセッサ21は、S CSI−2ポート28とイーサネットポート29のようなデータ・ポートを有し ているであろう。IMA 150/40モジュール31は、好ましくは4メガバ イトのメモリを最高4つの1024の×1024のイメージを蓄積するために提 供して、パイプライン・ハードウェアに全般的タイミング制御を提供する。IM A 150/40モジュール31は、また、後に述べる最高3つのドーターボー ド32、33、及び34の搭載が可能である。CMC 150/40モジュール 41は、パイプライン切替えモジュールとして作用し、最高3つのドーターボー ド42、43、及び44とを搭載可能であり、いかなるドーターボードへも、そ して、からでもイメージを通信するものである。IMA 150/40モジュー ル31とCMC 150/40モジュール41は、ピクセル・バ ス71経由で別々に接続されている。 3つのドーターボードが、IMA 150/40モジュール31の上にマウン トされる。AMDIGドーターボード34は、CCDカメラ、好ましくはコダッ クTM Megaplus 1.4型カメラ、から階調イメージ・データを受け 取り、そのイメージ・データを、IMA 150/40モジュール31内のメモ リの適切なエリア送信する。また、AMDIGドーターボード34は、希望する 場合、入力イメージ・データを縮尺することができる。DMPCドーターボード 32は、RGB高解像度モニター61を通して、いかなるイメージの表示でも提 供することができる。MMPドーターボード33は、階調イメージと矩形ボック スサイズを備えるとき自動的にMAXとMINイメージを提供する形態上のプロ セッサである。3つの追加のドーターボードは、CMC 150/40モジュー ル41上にマウントされる。HFドーターボード43は、ヒストグラムと、それ がバイナリ・イメージを備えているときに自動的にビン256のヒストグラムを 提供する特徴エクストラクタである。また、特徴エクストラクタは、自動的にR LEイメージを生成することに使用可能である。CLUドーターボード44は、 自動的にコントラスト・イメージを提供するコンボルバーと論理的なプロセッサ である。PAドーターボード42は、非同期的にそのパイプライン処理に並行し てコプロセッサとして作用する分離型のディジタル・シグナル・プロセッサであ る。このドーターボードは、品質評価法を提供するために利用されるが、それは :複数のRLEイメージ受け取ったり、最高のRLEイメージを選択したり、及 び、OCR処理用のNitro60プロセッサ21、22、及び、23のうちの 1つまでに、最高のRLEイメージのためにデータを提供したり、することであ る。全般的ハードウェア構成図12は、1秒当り40メガピクセルの速度で作用 し、そしてそれは、1つのメガバイト・イメージ(1024の× 1024のピ クセル)は、処理のためにおよそ28ミリ秒を必要とすることを意味する。この 速度、0.5秒未満が、一つの1024の× 1024の階調イメージから、3 つのパラメーター表示スレショルドを実行し、かつ、OCR処理のために最上質 のバイナリのスレショルド済イメージを選択すること、に要求される。 本発明の方法は、また、オリジナルの階調イメージ、中間処理イメージ(MI N。MAX、そして、コントラスト・イメージ)、及び、少くとも2つのバイナ リ・スレショルド・イメージに適応させるために十分なメモリを有するいかなる ディジタル・コンピュータの上ででも実行され得る。ディジタル・コンピュータ の上の方法のプログラミングは、C言語又は類似するいずれかの処理言語内で実 行され得る。 ここで、この概要を基に、我々は詳細に全体的方法を説明する。階調ラベル・ イメージ内の与えられた(i,j)ポジションで、ローカル・コントラストは、 以下の手続きによって取得される:すなわち、 ステップ1. (i,j)で心出しされたk×kウィンドウ内で、最低のグレ イ・レベル値(MINij)を探す。 ステップ2. 同じウィンドウ内で最大グレイ・レベル値(MAXij)を探 す。 ステップ3.(i,j)におけるローカル・コントラストLCが以下のように 計算される: LCij=C ×(I−(MINij+p)/(MAXij+p)) 値Cは、要求された最大ローカル・コントラスト値に基いて選択される。高いコ ントラスト階調イメージのために、Cのより小さい値は、前景と背景を区別する のに、十分であろう。低いコントラスト階調イメージのために、より多くのコン トラスト的な差別化は、前景と背景間で選択するのに必要であろう。Cの値とし ては、255が好ましい。この値は、大部分の階調イメージのために作用して、 コントラスト・イメージの値が8ビットバイトにつき1蓄積されるのを許容する 。値pは、正で、Cに比較して小さくなるように選択される。その主な役割は、 ゼロで除算されることから保護することであり、そしてそれは、ローカル・コン トラスト値の迅速な計算を容易化するために選択されなければならない。pの好 適な値は、1である。 ローカル・コントラストのため上記公式は、k×kウィンドウ内の最小限と最 大ピクセルの間に、グレイ・レベルで大差があるとき、大きなローカル・コント ラストLCijを導く。ローカル・コントラスト値は、0からCへ変化するこ とができるが、このとき、0は最低のコントラストであり、Cは最大コントラス トである。最大コントラスト値は、オリジナルの階調イメージ内の最大のポシブ ル・ピクセル値と同じである必要はない。しかし、好適な最大コントラスト値は 、255であり、この値については詳細な説明の残りで触れることとする。 コントラスト・イメージと呼ばれ、ローカル・コントラスト情報を含む新しい イメージが生成される。オリジナル・ラベル・イメージ内の(i,j)での各階 調ピクセルのために、コントラスト・イメージ内の対応するピクセルは、値にお いてLCijに及ぶように設定される。 コントラスト・イメージ内の各ピクセルは、それにより、ゼロと最大コントラ ストの間の値を割り当てられる。同様に、他の2つの新しいイメージ、MINイ メージとMAXイメージ、が生成される。MINイメージの(i,j)ポジショ ンでのピクセルは、値MINijを有し、MAXイメージ内の対応するポジショ ンでのピクセルは、値MAXijを有している。ウィンドウ・サイズ・パラメー タ、kは、テキスト・キャラクタのための許容最大ストローク幅を探すことによ って、決定される。例えば、250ドット/インチで、8ポイントのフォント・ キャラクタは、およそ3ピクセルのストローク幅を有する。同じ手法で、18ポ イントのフォント・キャラクタは、およそ14ピクセルのストローク幅を有する 。それから、値kはこの許容最大幅よりわずかに大きく設定される。例えば、1 8ポイントのフォントのラベルのために高いテキスト・コントラスト値を有する ために、ウィンドウの寸法kは、14ピクセル以上でなければならない。該寸法 がこの見積りより少ない場合、非常に低いコントラスト値は、キャラクタ・スト ロークの中央にあるピクセルに取得されるだろうが、なぜならば、心出しされた k x kウィンドウ内の全ての階調値は、ほとんど等しいからである。いくつ かのアプリケーションや文字フォントのために、サイズk x jの矩形のウィ ンドウ、これはkとjが異なる値を有しているが、を使うことが、好適である。 好適なウィンドウ・サイズは、15ピクセル×15ピクセルの正方形である。こ のウィンドウ・サイズは、18ポイントのフォント・サイズまでのいかなる回転 のオリエンテーションにおいても、キャラクタ処理を許す。 MIN、MAX、及びコントラスト・イメージのピクセル値の由来を示してい る例が、図3、4、及び、5に示されている。3つのケース全てにおいて、正方 形のウィンドウ・サイズが使用され、kが3の値を持つように選択される。図3 において、オリジナルの階調イメージピクセル値は、左上隅の図の最高の箇所に 示されており、(2,2)位置の周りの3×3正方形「3」の最低のピクセル値 は、「3」の値を持つようにMINイメージの(2,2)位置を決定する。 同様に、MINイメージの(6,6)位置は、「195.」であるように決定 される。該階調イメージのエッジにおいて、該ウィンドウは、階調イメージから 離れた領域を包含する。オリジナルのイメージから離れたエリアのピクセル値は 、ゼロとみなされる。 図4において、(2,2)位置のMAXイメージが、値「39」を有している のが分かり、一方、(6,6)位置は、「231」の値を有している。図5は、 MINとMAXイメージの由来が、代数の計算を通して、コントラスト・イメー ジを、如何に直接導くかを示している。 コントラスト・ヒストグラムを生成するために、256個のビンのセットが、 生成され、各々はコントラスト・レベル(0−255)のうちの1つに対応して いる。コントラスト・イメージ内の各ピクセルは、順番に調べられ、ピクセル値 に対応するビンは、1ずつに増やされる。このことは、コントラスト・ヒストグ ラムを作り上げ、そしてそれが、各グレイ・レベルでピクセル値を有するイメー ジ内のピクセルの数の計数となっている。コントラスト・ヒストグラムの例は、 図6に提示される。 コントラスト・ヒストグラム中のピーク群は、類似したコントラストを有する 階調ラベル・イメージの部品に対応する。一般に、これらの部品やコントラスト ・セグメントは、類似した種類のテキスト、グラフィックス、またはノイズであ る。ピーク分析は、どのピークが、テキストであるコントラスト・セグメントに 相当するかと、どのピークが、背景又はノイズであるコントラスト・セグメント に相当するか、を判定するプロセスである。ピーク分析の成果は、テキスト・ピ クセルのための0(黒い)と、背景かノイズピクセルのための1(白い)と、の 適切な割り当てを支援するだろう。 ピーク分析プロセス内の根本的な条件は、与えられたラベルのために、背景ピ クセルとノイズピクセルに対応するコントラスト・セグメントについてのコント ラスト値は、前景/テキスト・ピクセルについての値より平均して低い。しかし ながら、ラベルの多様性ために起こる多くの困難が存在する。これら困難は、以 下のように列挙される: 1.コントラスト・セグメントの数は、変化する。したがって、コントラスト・ ヒストグラム内のコントラストピークの数が、変化する。このことは、また、い くつかのテキスト・ピークと同様に、いくつかの背景やノイズピークがあるかも しれないということを意味している。 2.コントラスト・セグメントの平均のコントラスト値は、変化する。したがっ て、コントラスト・ヒストグラム内のコントラストピークの位置が、変化する。 3.コントラスト・セグメント内のピクセルの数は、変化する。したがって、コ ントラスト・ヒストグラム内のコントラストピークの高さが、変化する。 4.平均的コントラスト値周辺のコントラスト・セグメントのコントラスト値の 分布は、変化する。したがって、コントラスト・ヒストグラム内のコントラスト ピーク幅が、変化する。 いろいろな高さ、幅、そして、位置のいくつかのピークでコントラスト・ヒス トグラムを与えられ、ピーク分析の目標は、許容最低コントラストと呼ばれるコ ントラスト値を探すことであり、この値の下でコントラスト値を有するなんらか のピクセルは、自動的に1(背景又はノイズ)の値を割り当てられる。 この作業を達成するために、1組のスレショルド・プロセス・パラメータがコ ントラスト・ヒストグラムを分析するため使用される。これらのパラメータは、 以下の通りである:(1)ピーク・フロア・レベル、(2) 最低コントラスト 値、(3) 名目的ピーク幅、そして、(4)名目的テキスト・ピーク幅。これ らのパラメータは、図6に示されている。 ピーク・フロア・レベルは、あるコントラスト・ヒストグラム・ピークが持ち うる最低の高さである。ピーク・フロア・レベルを下回るいかなるコントラスト ・ヒストグラム・ピークでも、ポシブルテキスト・コントラスト・セグメントに 一致するようには、考慮されていない。典型的には、ピーク・フロア・レベ ルは、800から1200まで変化し、サイズとしては1024×1024ピク セルであるイメージにとって好ましく1100に調整される。 最低コントラスト値は、コントラスト・ピクセルが持ち得る最低値であり、さ らに、テキスト・コントラスト・セグメントの部品とみなされる。好適には、C が255の値を有するとき、それは25〜75の値を有する。 名目的ピーク幅は、名目的コントラスト・ヒストグラム・ピークにあると期待 される、異なるコントラスト値の数である。好適には、Cが255の値を有して いるとき、それは50〜75の値を有している 名目的テキスト・ピーク幅は、テキスト・コントラスト・セグメントに相当す る名目的コントラスト・ヒストグラム・ピークにあると期待される、異なるコン トラスト値の数である。好適には、Cが255の値を有しているとき、それは2 5〜75の値を有する。 コントラスト・ヒストグラムのためのピーク分析プロセスは、許容最低コント ラストを決定することによって、コントラスト・イメージ内でスレショルドする ことを可能にするプロセスである。このプロセスは、以下の通りである:すなわ ち、 ステップ1.ピークを検索:コントラスト・ヒストグラム・コントラスト値を 、ピクセルの最も大きい数を基に検索する。これは、最も大きい流れのピークで ある。 ステップ2.ピークを評価:ピークの高さがピーク・フロア・レベルより大き くない場合、ステップ6へ飛ぶ。そのピークはあまりに短いので拒絶される。 ステップ3.ピークを記憶:ピークのコントラスト値を記憶。 ステップ4.ピークを抑制:このピーク、及び、全ての前のピークの名目的ピ ーク幅の範囲内でピークの検索を拒絶する。 ステップ5.ステップ1へ行く: ステップ6.ピークを選択:最低コントラスト値より大きい最小コントラスト 値で位置捕捉される蓄積されたピークを検索する。これは、最低テキスト・ピー クと呼ばれる。 ステップ7.閾値決定:名目的テキスト・ピーク幅を最低テキスト・ピークの コントラスト値から減じる。これは、許容最低コントラストである。 図6に示されたコントラスト・ヒストグラムへのピーク分析プロセスの適用は 、3つのテキスト・ピークの識別になる:すなわち、ピーク2、ピーク3とピー ク4である。ピーク3は、最低テキスト・ピークである。ピーク3の識別は、図 6に示すように、許容最低コントラストの決定を許す。 許容最低コントラストが決定されると、オリジナルの階調イメージは、スレシ ョルドされることができる。オリジナル・イメージ、そのMINij、MAXi j、及びLCij値、内の(i,j)のピクセルが与えられ、以下のステップは 、該ピクセルが前景(テキスト)か背景であるかどうか決定するために実行され る:すなわち、 ステップ1. LCijは、許容最低コントラストより大きいか? もしそう でなければ、(i,j)のピクセルは、背景に分類される。 ステップ2. MAXij−MINijは、十分に大きいか? もしそうでな ければ。(i,j)のピクセルは背景に分類される。このテストを実行するため に、MAXij−MINij間の差は、最低コントラスト・スケールと呼ばれる 第1のカットオフ値と比較される。この差が少ない場合、ピクセルは、背景と分 類される。好適には、Cが255の値を有しているとき、最低コントラスト・ス ケール値が20と32の間にある ステップ3. (i,j)のピクセルは、MINijに非常に近いか、または 、MAXijに近いか? もし、十分にMAXijにより近いならば、(i,j )のピクセルは、背景に分類される。このテストを実行するために、MAXij −((i,j)のピクセルの値)の差は、名目的コントラスト超過値と呼ばれる 第2カットオフ値と比較される。もし、この差がより少ないならば、そのピクセ ルは、背景と分類される。好適には、名目的コントラスト超過値は、MINij とMAXijの間の中間、すなわち(MINij+MAXij)/2である。 ステップ4. もし(i,j)のピクセルが、上記3つのテストのいずれでも 背景と分類されなかったならば、そのピクセルは、前景(テキスト)と分類され る。 パラメータの特定のセットで、階調イメージをスレショルドすることで、処理 の第1段階が完了する。第1段階の成果は、スレショルド・プロセス・パラメー タの適切なセットの選択に依存している。上述のパラメータのセットは、多種多 様なラベルを満足させる結果を生みだす。しかし、与えられるどんな環境内でで も遭遇するであろう多種多様なラベルを満足させる結果を生みだすパラメータの 1セットを探すことは、困難である。しかし、プロセス・パラメータの複数のセ ットのどれかを選択する方法で、ほぼすべての可能性をカバーするパラメータの 2つか3つのセットを探すことは、可能である。以下で述べるように、プロセス ・パラメータの3つのセットは、表1に示されており、、例1と連携して使用さ れる。 与えられた階調イメージを、1組のプロセス・パラメータでスレショルドする ために、使用されるべきパラメータ値を予選択することは、好ましい。スレショ ルドのステップに関する上記の記述からも分かるように、用語「予選択済の」は 、一定の値の予選択だけでなく、当該の値を決定するために利用するかもしれな い公式の予選択も意味する。 LAT方法と装置によって、ラベル・イメージが数度処理される場合、プロセ ス・パラメータの異なるセットを伴う度ごとに、1組のスレショルド化ラベル・ イメージが、その成果となるだろう。それから、そのセットのスレショルド化イ メージが最善で、すなわちOCR処理のための最高品質か、どうかを自動的に判 断する必要が生じてくる。本発明の第2段階、品質分析、は、上述の第1段階の 処理を補足し、最もスレショルド化イメージを選択する必要な判断を提供する。 上質の分析プロセスは、以下の主なステップを有する:すなわち、 ステップ1. nセットのプロセス・パラメータを使っているnスレショルド 化イメージを生成。 ステップ2. 各バイナリ・イメージをラン長エンコード(RLE)イメージ に変換。 ステップ3. 各RLEイメージに亘って部分抽出を実行して、そのイメージ 内の連結成分の数とサイズを判定。 ステップ4. 統計の情報を利用して、2つのイメージのどちらがより上質か を、2つのイメージの各々のピースサイズの分配に基づいて、ペアで判定。 ステップ5. ステップ4で選択されたイメージを、まだ比較されていない他 の何らかのイメージと共に、使って、ステップ4を繰り返す。全てのイメージが 比較されるまで、最高品質でスレショルド化イメージを選択することを続行。 ステップ1において、LAT方法の第1段階は、異なるセットのプロセス・パ ラメータをもつ各々伴って、nイメージを生産するするためにn回実行される。 こうして生産された各バイナリ・イメージは、ラン長エンコードされている。 ラン長エンコード(RLE)は、バイナリ・ピクセル・イメージを他の表示に 変換するプロセスである。この表示において、黒いピクセルの水平に関連する各 グループは、ランと呼ばれるが、そのラン及びランの長さのためにスタート・ピ クセル位置だけを保持することで、RLEフォーマットに変換される。全てのラ ンは、このように変形する。RLEは、標準の画像処理技術である。 RLE変換は、バイナリ・イメージの品質を減らすことなくかなりイメージの サイズを減らす傾向がある。例えば、図7中のイメージは、100×100のバ イナリ・イメージであって、通常10,000ビットの記憶媒体を必要とする。 しかし、それが(高さ100ピクセル、幅3ピクセルの)垂直な棒だけを含むだ けなので、各々が(値3の)1バイト長である100開始バイトでRLEフォー マットで、表示可能になる。 したがって、このイメージは、RLEフォーマット内で200バイトの記憶媒 体を必要とするだけである。このフォーマットの性質のために、より小さい表示 と同じくらい少ない実行時間を必要とするいくつかのアルゴリズムを、示してき た。 次に、各RLEイメージは、部分抽出を受ける。部分抽出は、イメージの異な る線に接触するラン検索のための標準の画像処理技術である。接触するランは、 連結成分と呼ばれる。関係のあるランのグループを集めることによって、ピース が、作り上げられる。例えば、あるピースは、タイプライターで打った文字又は ノイズの大きなしみのはずである。 こうして集められた統計的情報があれば、最高の品質をもつイメージが選択さ れ得る。品質評価は、LATプロセスと、スレショルドは、一群のイメージ内 の最善であるかどうかを判断することの成果を検査するための方法である。本プ ロセスは、品質を評価するためのピース抽出アルゴリズムにより生成されたピー スのサイズ(すなわち、ピース内のピクセルの数)を利用する。 ピースサイズは、それがラベルのようなテキスト・ベースのイメージの品質の よい表示を提供するので、非常に役に立つ特徴である。根本的な条件は、ピース サイズ分布は、ノイズと、スレショルド化イメージ内で検索される、テキストの 量に関する情報を提供する。多くの小さいピースを有するイメージは、ノイズが 多い傾向がある。多くの大きい部分をもつイメージは、高品質テキストを有する 傾向がある。しばしば、イメージは、多くの異なるサイズの部分のいくつかのメ ジャーを有している。 本発明は、品質評価に都合のよい特徴として、ピースサイズのヒストグラムを 使用する。ピースサイズの範囲は、bビンに分割される。各ビンは、ビンのサイ ズ範囲の中で、イメージ内のピースの数を含む。意思決定プロセスが、イメージ が他のスレショルド化イメージの何かよりよい品質内であるかどうかを判定する ヒストグラムを調べるために、使用される。2つの異なる決定プロセスが、この 検査を実行するために開発された:すなわち、 1.第1の決定プロセスは、2つのビンのヒストグラムを使用する。ビン1( ノイズ)は、大きさにおいて0との10ピクセルの間の小さいピースを含んでい る。ビン2(大きい)は、サイズ100を超えるピクセルである大きいピースを 含んでいる。より大きいピースをもつイメージが、番号1、すなわち、Big( 1) > Big(2)、とラベルをつけられるように、イメージにラベルをつ ける。以下の比較/選択は、2つのスレショルド化イメージ、Image(1) 及びイメージ(2)のために対になっている: ステップ1. Big(2) < 30 ならば、Image(1)を選べ 一方、Image(2)を選べ 値Qは、以下の値を有するよう選択される: もし 150 < Big(2)、Q = 1 2つ以上のイメージのために、適当な選択がされるまで、アルゴリズムは、ペ アで適用される 2.第2の決定プロセスは、以下のように4つのビンのピースサイズ・ヒスト グラムを使用する: ビン1:0-10. ビン2:11-40. ビン3:41-100. ビン4:100以上 ビン1は小さいピース(イメージノイズ)に対応し、ビン4はイメージの大き いピースに対応する。ビン3は、ドット・マトリクス・プリンターで生成したテ キストのイメージ内で遭遇され得る関連のない大きいピースに対応する。 これらのビンの値は、4次元ベクトルの構成要素とみなすことができる。それ から、品質分析は、2つのイメージ、Image(1)とImage(2)、の 上で、フィードフォワードで8つ入力を伴うニューラルネットワークで実行され 得る。8つの入力は、順番に、Image(1)からの4つのビンの値と、Im age(2)からの4つのビンの値と、である。8つの入力は、ネットワークは 、出力として0−255の間の値を生成する。そのネットワークは、バック・プ ロパゲーション・アルゴリズムを使っているイメージ学習の大きなセットに基づ いて学習される。 ネットワークを学習させるために、イメージ学習の大きなセットが、ペアで検 査され、各ペアのよりよいイメージは、外観検査により選択される。ニューラル ネットワークは、よりよいイメージのためのベクトル値が8−コンポーネント入 力ベクトルにおいて最初に出現し、そしてその該入力内の2つの4−コンポーネ ントベクトルを逆にして、ニューラルネットワーク出力0を指定する、とき、2 55の出力を指定することによって学習する。このトレーニング・プロセスは、 トレーニング・イメージの多数のペアのために繰り返される。 学習の後、以下のようなネットワーク機能が続く:すなわち、イメージの与え られた入力ペア、Image(1)とImage(2)、のために、ピースサイ ズ・ヒストグラムからの2つの4−コンポーネントベクトルは、ニューラルネッ トワークへの入力と提供される。そのネットワークの出力値が128を超えるで あるならば、Image(1)はImage(2)よりよい。一方で、Imag e(2)は、よりよい。2つ以上のイメージのために、適当な選択がされるまで 、アルゴリズムはペアで適用される。 品質を評価するための他のメカニズムも、ピースサイズ・ヒストグラムを使っ て、使用することができる。例えば、そのようなメカニズムのあるものは、テキ ストとノイズピース・セグメントは検索するLATプロセスの第1段階において 、それに似ているピーク検出アルゴリズムを使用する。別の例として、ニューラ ルネットワークは、入力として使用されていたピースサイズ・ヒストグラムの選 択されたビンだけで使用されることができる。 図8−11は、本発明の使用をサンプル・ラベルを伴って示している。図8は 、見本ラベルのオリジナルの階調イメージを示している。図9は、スレショルド された、図8中のイメージのバイナリ・イメージを、表1の桁1でのパラメータ を使用して、示している。全ての背景が白に調整される間、テキストのいくつか 取りが欠けてしまうことを、注意。図10は、スレショルドされた図8中の階調 イメージのバイナリ・イメージを、表1の桁2内でそのパラメータを使用して、 示している ここでは、存在する全テキストが、いくらかは背景であり、ラベル のしわに相当しているが、前景の黒に調整されている。図11は、スレショルド された、図8中の階調イメージのバイナリ・イメージを、表1の桁3内でそのパ ラメータを使用して、示している。ここでは、全テキストが存在し、背景の全て は、白に調整されている。この最後のバイナリ・イメージは、外観から分かると おり、図9、10及び11に示す3つのバイナリ・イメージのうちで最高の品質 イメージである。これらの3つのバイナリ・イメージが品質分析の第1の方法を 受けたとき、最後のイメージ、図11に対応する、が選択された。 最後のイメージの選択、図11に対応する、最高品質のスレショルド化バイナ リ・イメージは、表2の参照で示されることができ、それは、ピースサイズ・ヒ ストグラムのノイズビンと大きいビンの値を含んでいる。 上質の分析プロセスは、最初にイメージAとBを比較する。イメージBがより 大きいピースを有しているので、それは、イメージ1と分類され、イメージAは 、2に分類される。この例の値Qは、 よりよい品質のイメージに対するテストは、 これは、Noise(1)/Noise(2)-1884/95よりより大きくない、従って、イメージ2( イメージ)は選択される。 次に、イメージAがイメージC.と比較される。この場合、イメージCは、ラ ベル・イメージ1である。値Qは、再び3と計算される。したがって、よりよい 品質のイメージに対するテストは、これは、Noise(1)/Noise(2 )−109/95より大きい。それゆえに、図11に対応する、イメージ1(イ メージC)が3つのうちで最高のイメージとして選択される。 本発明を、特に好適な実施例を参照して、詳細に述べてきたが、ここで記述さ れたように、そして、添付のクレーム内で定義されるように、本発明の精神及び 範囲から逸脱せずに、これら実施例に対し多様化及び変更が可能なことは、理解 されよう。
【手続補正書】特許法第184条の8第1項 【提出日】1997年1月17日 【補正内容】 請求の範囲 1.異なるスレショルドの階調イメージに対応する2つのバイナリ・イメージの うちの1つを選択する方法であって、前記バイナリ・イメージの各々は、前記バ イナリ・イメージの部分の2つの値の第1のものと前記バイナリ・イメージの残 り部分の2つの値の第2のものとを有しており、文字認識プロセスを前記イメー ジに適用することに先立ち、 前記バイナリ・イメージの各々のうちで連結成分を置くステップ; 前記連結成分の各々のエリアを決定するステップであって、前記エリアは、前 記連結成分の各々のうちでピクセルの数に対応している値を有しているステップ と; 前記バイナリ・イメージのためにエリア分布を決定するステップであって、各 エリア分布は、2つの値の前記第1のものを有する各前記バイナリ・イメージの 連結成分のサイズ毎に連結成分の数を有しているステップと; 前記エリア分布間を比較するステップと;そして、 エリア分布の前記比較に基づいて前記イメージのうちの1つを選択するステップ と; を含む方法。 2.前記バイナリ・イメージのためにエリア分布を決定するステップは、 ラン長エンコード(RLE)されたイメージに2つの値の前記第1のものを有 する前記バイナリ・イメージの各々の部分を変換するステップと;及び、 部分抽出を使用する前記RLEイメージの各々の連結成分のエリア分布のエリ ア分布を決定するステップと; を含む請求項1の方法。 3. 前記エリア分布を比較するステップは、 前記エリア分布の各々から多くのビン・ヒストグラムを生成するステップと; そして、 前記マルチ・ビン・ヒストグラムの被選択のビンの価値を比較するステップと ; を含む請求項1の方法、 4.前記マルチ・ビン・ヒストグラムの被選択のビンの値間を比較するステップ は:前記マルチ・ビン・ヒストグラムの各々の第1ビンの値の比率を、前記マル チ・ビン・ヒストグラムの各々の第2ビンの値の比率と比較するステップを含む 請求項3の方法であって; 前記イメージのうちの1つ選択するステップは: 前回のステップ中の比較に基づいて、前記2つのバイナリ・イメージのうちの 1つを選択するステップを含む 方法、 5.前記エリア分布を比較するステップは、前記ピースサイズ分布の各々からマ ルチ・ビン・ヒストグラムを生成するステップと;そして、 前記マルチ・ビン・ヒストグラムの各々の被選択のビンからの値を、学習済ニ ューラルネットワークに、入力値として、供給するステップと; を含む請求項1の方法であって:そして、 前記イメージのうちの1つを選択するステップは: 前回のステップ中の比較に基づいて、前記2つのバイナリ・イメージのうちの 1つを選択するステップを含む 方法。 6.前記ヒストグラムは、前記バイナリ・イメージ内の連結成分に対応する第1 ビンと、前記バイナリ・イメージ内の大きい連結成分に対応する第2ビンと、に 関するマルチ・ビン・ヒストグラムであり、前記マルチ・ビン・ヒストグラムの 被選択のビン内の値間を比較する前記ステップは、 第1の前記2つのバイナリ・イメージについての前記ヒストグラムの前記第1 ビンの値を、第2の前記2つのバイナリ・イメージについての前記ヒストグラム の前記第1ビンの値で、除算して第1の商を計算するステップと; 第1の前記2つのバイナリ・イメージについての前記ヒストグラムの前記第2 ビンの値を、第2の前記2つのバイナリ・イメージについての前記ヒストグラム の前記第2ビンの値で、除算して第2の商を計算するステップと; を含む請求項5の方法であって、 前記イメージのうちの1つを選択するステップは、前記第1の商が、ある品質 値を乗ぜられた前記第2の商より少ない場合に、前記第1のバイナリ・イメージ を選択するステップを含む 方法。 7.前記品質値が予選択済定数である請求項6の方法。 8.前記品質値は、予選択済定数と、前記第1の2つのバイナリ・イメージにつ いての前記ヒストグラムの前記第2ビンの前記値と、を使用する予選択済公式か ら計算される請求項6の方法、 9.前記品質値は、予選択済定数と、前記第2の2つのバイナリ・イメージにつ いての前記ヒストグラムの前記第2ビンの前記値と、を使用する予選択済公式か ら計算される請求項6の方法、 10.前記マルチ・ビン・ヒストグラムの前記第1ビンは、0からおよそ10の ピクセルを有する前記バイナリ・イメージの連結成分のカウントを含む請求項6 の方法、 11.前記マルチ・ビン・ヒストグラムの前記第2ビンは、およそ100以上の ピクセルを有する前記バイナリ・イメージのピースのカウントを含む請求項6の 方法、 12.階調イメージをスレショルドする方法であって、 前記階調イメージに対応するコントラスト・イメージを生成し、前記コントラ スト・イメージの各ピクセルが値LCijを 公式 LCij=C(1−(MINij+p)/(MAXij+p)) ((i,j)は前記コントラストイメージ内の前記ピクセルの位置、pはCと 比較してより小さい予選択済正の値、MINijは前記階調イメージ内の対応す る位置で心出しされた矩形のウィンドウ内の全てのピクセルの最低の階調値、及 び、MAXijは前記矩形のウィンドウ内の全てのピクセルの最大階調値) によって与えられる、ステップと; ピーク・フロア・レベル値、名目的ピーク幅値、最低コントラスト値、名目的 テキスト・ピーク幅値、最低コントラスト・スケール値、そして、名目的コント ラスト超過値、であるスレショルド・パラメータのセットの予選択済数を選択す るステップと; スレショルド・パラメータの各々のセットとしては、前記コントラスト・イメ ージ内の全てのポシブルなコントラスト値に亘って、前記コントラスト・イメー ジのコントラスト・ヒストグラムを生成することによって、バイナリ・イメージ 候補を得て; 前記予選択済ピーク・フロア・レベル値より大きく、前記予選択 済nominal−peak−width値ずついくらか高いピークから分離し ている、前記コントラスト・ヒストグラム内の全てのピークを探し; 前記予選 択済最低コントラスト値より大きい最低コントラスト値に出現するピークの位置 を捕捉することによって前記発見済ピーク中から最低テキスト・ピークを選択し ; 名目的テキスト・ピーク幅値を前記最低テキスト・ピークのコントラスト値 から減ずることによって、許容最低コントラスト値を得て; LCijが予選択 済許容最低コントラスト値より少ない場合に前記バイナリ・イメージ候補の背景 クラスに、前記階調イメージの(i,j)ポジションのピクセルを割り当て;前 記階調イメージの前記ピクセルが未だ前記背景クラスに割り当てられていない場 合にMAXijとMINijとの差を計算し、かつ、前記予選択済最低コントラ スト・スケール値より前記最大最低差がより少ない場合に前記ピクセルを前記 背景に割り当て; 前記階調イメージの前記ピクセルが未だ前記背景クラスに割 り当てられていない場合にMAXijと前記ピクセルの階調値との差を計算し、 かつ、前記最大値とピクセル値との差が前記予選択済名目的コントラスト超過値 より少ない場合に前記ピクセルを前記背景に割り当て; そして、前記階調イメ ージの前記ピクセルが未だ前記背景クラスに割り当てられていない場合に前記ピ クセルを前景クラスに割り当てるステップと; 前記バイナリ・イメージ候補の第1のものを選択し; 2つの値の第1のもの を有する前記第1に被選択のバイナリ・イメージ候補の部分を、第1のラン長エ ンコード(RLE)イメージに変換し; ピース抽出を使用する前記第1のRL Eイメージのピースの第1のエリア分布を決定し; 前記第1のエリア分布の第 1のマルチ・ビン・ヒストグラムを生成する、ステップと; 文字認識プロセスを前記第1のRLEイメージに適用することに先立ち、前記 バイナリ・イメージの各々のうちで連結成分を前記第1のRLEイメージ内に置 くき、前記連結成分の各々のエリアを決定するステップであって、前記エリアは 、前記連結成分の各々のうちでピクセルの数に対応している値を有しているステ ップと; 前記第1のRLEイメージの連結成分の第1のエリア分布を決定し;前記第1 のエリア分布の第1のマルチ・ビン・ヒストグラムを生成するステップと; 前回被選択済ではない前記バイナリ・イメージ候補の中から前記バイナリ・イ メージ候補の第2のものを選択し; 2つの値の第1のものを有する前記第2被 選択のバイナリ・イメージ候補の部分を、第2のラン長エンコード(RLE)イ メージに変換し; 文字認識プロセスを前記第2RLEイメージに適用することに先立ち、前記バ イナリ・イメージの各々のうちで連結成分を前記第2のRLEイメージ内に置き 、前記連結成分の各々のエリアを決定するステップであって、前記エリアは、前 記連結成分の各々のうちでピクセルの数に対応している値を有しているステップ と; 前記第2のRLEイメージの連結成分の第2のエリア分布を決定し; 前記第 2のエリア分布の第2のマルチ・ビン・ヒストグラムを生成するステップと; 前記第1と第2のマルチ・ビン・ヒストグラムの評価に基づいて、第1被選択 のバイナリ・イメージ候補と第2被選択のされたバイナリ・イメージ候補のうち の1つをピックアップするステップと;そして、 全ての前記バイナリ・イメージ候補が選択されるまで、前記第1被選択のバイ ナリ・イメージ候補に置き換わる前記ピックアップされたバイナリ・イメージ候 補について、前回ののステップを繰り返すステップと; を含む方法。 13.前記第1被選択のバイナリ・イメージ候補と、前記第2被選択のバイナリ ・イメージ候補とのうちの1つを、前記第1及び第2マルチ・ビン・ヒストグラ ムの評価に基づいて、ピックアップするステップは、 前記第1マルチ・ビン・ヒストグラムの第1ビン内の値と前記第2マルチ・ビ ン・ヒストグラムの第1ビン内の値との比率と、前記第1マルチ・ビン・ヒスト グラムの第2ビン内の値と前記第2マルチ・ビン・ヒストグラムの第2ビン内の 値との比率とを、比較するステップと; 前記比率間の比較に基づいて、前記第1被選択のバイナリ・イメージ候補と、 前記第2被選択のバイナリ・イメージ候補とのうちの1つをピックアップするス テップと; を含む請求項12の方法 14.前記第1及び第2のマルチ・ビン・ヒストグラムの評価に基づいて、前記 第1被選択のバイナリ・イメージ候補と前記第2被選択のバイナリ・イメージ候 補のうちの1つをピックアップするステップは、 前記マルチ・ビン・ヒストグラムの各々の被選択のビンから、入力値として、 学習済ニューラルネットワークに値を供給するステップと;そして、 前記第1被選択バイナリ・イメージ候補と第2被選択のバイナリ・イメージ候 補を、前記学習済ニューラルネットワークの出力の値に基づいて、ピックアップ するステップと; を含む請求項13の方法 15.階調イメージをスレショルドする装置であって、 前記階調イメージに対応するコントラスト・イメージを生成し、前記コントラ スト・イメージの各ピクセルが値LCijを 公式 LCij=C(1−(MINij+p)/(MAXij+p)) ((i,j)は前記コントラストイメージ内の前記ピクセルの位置、pはCと 比較してより小さい予選択済正の値、MINijは前記階調イメージ内の対応す る位置で心出しされた矩形のウィンドウ内の全てのピクセルの最低の階調値、及 び、MAXijは前記矩形のウィンドウ内の全てのピクセルの最大階調値) によって与えられる、手段と; ピーク・フロア・レベル値、名目的ピーク幅値、最低コントラスト値、名目的 テキスト・ピーク幅値、最低コントラスト・スケール値、そして、名目的コント ラスト超過値、であるスレショルド・パラメータのセットの予選択済数を選択す る手段と; スレショルド・パラメータの各々のセットとしては、前記コントラスト・イメ ージ内の全てのポシブルなコントラスト値に亘って、前記コントラスト・イメー ジのコントラスト・ヒストグラムを生成することによって、バイナリ・イメージ 候補を得て; 前記予選択済ピーク・フロア・レベル値より大きく、前記予選択 済nominal−peak−width値ずついくらか高いピークから分離し ている、前記コントラスト・ヒストグラム内の全てのピークを探し; 前記予選 択済最低コントラスト値より大きい最低コントラスト値に出現するピークの位置 を捕捉することによって前記発見済ピーク中から最低テキスト・ピークを選択し ; 前記予選択済名目的テキスト・ピーク幅値を前記最低テキスト・ピークのコ ントラスト値から減ずることによって、許容最低コントラスト値を得て; LC ijが前記許容最低コントラスト値より少ない場合に前記バイナリ・イメージ候 補の背景クラスに、前記階調イメージの(i,j)ポジションのピクセルを割り 当て; 前記階調イメージの前記ピクセルが未だ前記背景クラスに割り当てられ ていない場合にMAXijとMINijとの差を計算し、かつ、前記予選択済最 低コントラスト・スケール値より前記最大最低差がより少ない場合に前記ピクセ ルを前記背景に割り当て; 前記階調イメージの前記ピクセルが未だ前記背景ク ラスに割り当てられていない場合にMAXijとMINijとの差を計算し、か つ、前記最大最低差が前記予選択済名目的コントラスト超過値より少ない場合に 前記ピクセルを前記背景に割り当て; そして、前記階調イメージの前記ピクセ ルが未だ前記背景クラスに割り当てられていない場合に前記ピクセルを前景クラ スに割り当てる、手段と; 前記バイナリ・イメージ候補の第1のものを選択し; 2つの値の第1のもの を有する前記第1に被選択のバイナリ・イメージ候補の部分を、第1のラン長エ ンコード(RLE)イメージに変換し; 文字認識プロセスを前記第1のRLE イメージに適用することに先立つことに利用可能で、前記第1のRLEイメージ に連結成分を置き、前記連結成分の各々のエリアを決定するために、前記エリア は、前記連結成分の各々のうちでピクセルの数に対応している値を有する手段で あり; 前記第1のRLEイメージのピースの第1のエリア分布を決定し; 前 記第1のエリア分布の第1のマルチ・ビン・ヒストグラムを生成する、手段と; 前回被選択済ではない前記バイナリ・イメージ候補の中から前記バイナリ・イ メージ候補の第2のものを選択し; 2つの値の第1のものを有する前記第2被 選択のバイナリ・イメージ候補の部分を、第2のラン長エンコード(RLE)イ メージに変換し; 文字認識プロセスを前記第2のRLEイメージに適用することに先立つことに 利用可能で、前記第2のRLEイメージに連結成分を置き、前記連結成分の各々 のエリアを決定するために、前記エリアは、前記連結成分の各々のうちでピクセ ルの数に対応している値を有する手段であり; ピース抽出を使用する前記第2 のRLEイメージのピースの第2のエリア分布を決定し; 前記第2のエリア分 布の第2のマルチ・ビン・ヒストグラムを生成し; 前記第1と第2のマルチ・ ビン・ヒストグラムの評価に基づいて、第1被選択のバイナリ・イメージ候補と 第2被選択のされたバイナリ・イメージ候補のうちの1つをピックアップする手 段と;そして、 全ての前記バイナリ・イメージ候補が選択されるまで、前記第1被選択のバイ ナリ・イメージ候補に置き換わる前記ピックアップされたバイナリ・イメージ候 補について、直前の機能を繰り返す手段と; を含む方法。 16.前記第1と第2のマルチ・ビン・ヒストグラムの評価に基づいて、前記第 1被選択のバイナリ・イメージ候補と前記第2被選択のバイナリ・イメージ候補 とのうちの1つをピックアップする機能は、 前記第1マルチ・ビン・ヒストグラムの第1ビン内の値と前記第2マルチ・ビ ン・ヒストグラムの第1ビン内の値との比率と、前記第1マルチ・ビン・ヒスト グラムの第2ビン内の値と前記第2マルチ・ビン・ヒストグラムの第2ビン内の 値との比率とを、比較する手段と; 前記比率の比較に基づいて、前記第1被選択のバイナリ・イメージ候補と第2 被選択のバイナリ・イメージ候補のうちの1つをピックアップする手段と; を含む請求項15の装置、 17.前記第1と第2のマルチ・ビン・ヒストグラムの評価に基づいて、前記第 1被選択のバイナリ・イメージ候補と前記第2被選択のバイナリ・イメージ候補 とのうちの1つをピックアップする機能は、 前記マルチ・ビン・ヒストグラムの各々の被選択のビンから、入力値として、 学習済ニューラルネットワークに値を供給する手段と;そして、 前記学習済ニューラルネットワークの出力の値に基づいて、前記第1被選択の バイナリ・イメージ候補と第2被選択のバイナリ・イメージ候補のうちの1つを ピックアップする手段と; を含む請求項15の装置、 18.異なるスレショルドの階調イメージに対応する2つのバイナリ・イメージ のうちの1つを選択するための装置であって、前記バイナリ・イメージの各々は 、前記バイナリ・イメージの一部のための2つの値の第1のものと、前記バイナ リ・イメージの残りの部分のための2つの値の第2のものと、を有しており、 文字認識プロセスを前記第2のRLEイメージに適用することに先立つことに 利用可能で、前記第2のRLEイメージに連結成分を置く手段と; 前記連結成分の各々のエリアを決定するために、前記エリアは、前記連結成分 の各々のうちでピクセルの数に対応している値を有する手段と; 前記バイナリ・イメージのためにエリア分布を決定する手段と; 各エリア分布は、2つの値の前記第1のものを有する各前記バイナリ・イメー ジの連結成分のサイズ毎に連結成分の数を有している手段と;そして、 前記エリア分布を比較する手段と;そして、 エリア分布の前記比較に基づいて前記イメージのうちの1つを選択するための 手段と; を含む装置。 19. 異なるスレショルドの階調イメージに対応している2つのバイナリ・イ メージのうちの1つを選択するための実行可能な命令を有する計算装置であって 、前記バイナリ・イメージの各々は、前記バイナリ・イメージの一部のための2 つの値の第1のものと、前記バイナリ・イメージの残りの部分のための2つの値 の第2のものと、を有しており、文字認識プロセスを前記第2のRLEイメージ に適用することに先立ち、、 前記第2のRLEイメージに連結成分を置くステップと; 前記連結成分の各々のエリアを決定するために、前記エリアは、前記連結成分 の各々のうちでピクセルの数に対応している値を有するステップと; 前記バイナリ・イメージのためにエリア分布を決定するステップと; 各エリア分布は、2つの値の前記第1のものを有する各前記バイナリ・イメー ジの連結成分のサイズ毎に連結成分の数を有しているステップと;そして、 前記エリア分布を比較するステップと;そして、 エリア分布の前記比較に基づいて前記イメージのうちの1つを選択するための ステップと; を含み、による装置。 【手続補正書】 【提出日】1997年11月21日 【補正内容】 (1)明細書第2頁第14行目に記載の「OCRを使っでラベル読み取りする際 の困難に帰結するであろう。」を「OCRを使っラベル読み取りする際の困難 に帰結するであろう。」と補正する。 (2)明細書第10頁第20行目に記載の「それは:複数のRLEイメージ受け 取ったり、」を「それは:複数のRLEイメージ受け取ったり、」と補正する 。

Claims (1)

  1. 【特許請求の範囲】 1.階調イメージのピクセルを背景クラスに割り当てる方法であって、 前記ピクセルで心出しされた矩形のウィンドウ内の全ての階調イメージピクセ ルの、最低の階調値、MINijを探すステップと; 前記矩形のウィンドウ内の全てのピクセルの、最大階調値MAXijを探すス テップと; 公式 LCij=C(1−(MINij +p)/(MAXij+p)) (Cは予選択済最大コントラスト値、pはCと比較してより小さい予選択済正の 値)によって、ローカル・コントラストLCijを計算するステップと; LCijが予選択済許容最低コントラスト値より少ない場合に、前記ピクセル を背景クラスに割り当てるステップと; を含む方法。 2. 前記ピクセルが未だ前記背景クラスに割り当てられてない場合に、MAX ijとMINijとの差を計算するステップと; 予選択済最低コントラスト・スケール値より前記最大最低差が少ない場合に、 前記ピクセルを背景クラスに割り当てるステップと; をさらに含む請求項1の方法。 3.前記ピクセルが未だ前記背景クラスに割り当てられていない場合に、MAX ijと前記ピクセルの階調値との差を計算するステップと; 予選択済名目的コントラスト超過値より、最大値とピクセル値との差が少ない 場合に、該ピクセルを背景クラスに割り当てるステップと; をさらに含む請求項2の方法。 4.前記ピクセルが未だ前記背景クラスに割り当てられていない場合に、前記ピ クセルを前景クラスに割り当てるステップをさらに含む請求項3の方法。 5.階調イメージをスレショルドする際に使用するために、許容最低コントラス ト値を選択する方法であって、 前記階調イメージに対応するコントラスト・イメージを生成するステップと; 前記コントラスト・イメージ内の全てのポシブルなコントラスト値に対し、コ ントラスト・ヒストグラムを生成するステップと; 前記コントラスト・ヒストグラムにおいて、予選択済ピーク・フロア・レベル 値より大きく、かつ、予選択済名目的ピーク幅値で、どんなに高いピークからも 分離された、全てのピークを検索するステップと; 予選択済最低コントラスト値より大きく、最低コントラスト値で出現するピー クの位置捕捉をすることによって、検索した前記ピークの中から、最低テキスト ・ピーク選択するステップと;及び、 前記最低テキスト・ピークのコントラスト値から、予選択済名目的テキスト・ ピーク幅値を減ずることによって、許容最低コントラスト値を獲得するステップ と; を含む方法。 6.階調イメージに対応しているコントラスト・イメージを生成する方法であっ て、 コントラスト・イメージ内で(i,j)ポジションを選択するステップと; 前記階調イメージ内での対応部分で心出しされた矩形のウィンドウ内の全ての 階調イメージピクセルの、最低の階調値、MINijを探すステップと; 前記矩形のウィンドウ内の全てのピクセルの、最大階調値MAXijを探すス テップと; 公式 LCij=C(1−(MINij+p)/(MAXij+p)) (Cは予選択済最大コントラスト値、pはCと比較してより小さい予選択済 正の値)によって、前記階調イメージの、ローカル・コントラストLCijを計 算するステップと; 前記コントラストイメージの前記(i,j)ポジションに、LCijに等しい 階調値を割り当てるステップと;及び、 前記コントラストイメージ内で期待される各位置毎に上記ステップ群を繰り返 すステップと; を含む方法。 7.階調イメージの異なるスレショルドに対応する2つのバイナリ・イメージを 比較する方法であって、前記バイナリ・イメージの各々は、前記バイナリ・イメ ージの部分の2つの値の第1のものと前記バイナリ・イメージの残り部分の2つ の値の第2のものとを有しており、 前記バイナリ・イメージについてのピースサイズ分布を決定するステップであ って、各ピースサイズ分布は、2つの値の前記第1のものを有する各前記バイナ リ・イメージのピースのサイズ毎にピースの数を有している、ステップと;そし て、 前記ピースサイズ分布間を比較するステップと; を含む方法。 8.前記バイナリ・イメージのためにピースサイズ分布を決定するステップは、 ラン長エンコード(RLE)されたイメージに2つの値の前記第1のものを有 する前記バイナリ・イメージの各々の部分を変換するステップと;及び、 部分抽出を使用する前記RLEイメージの各々のピースのピースサイズ分布を 決定するステップと; を含む請求項7の方法。 9.前記ピースサイズ分布を比較するステップは、 前記ピースサイズ分布の各々からマルチ・ビン・ヒストグラムを生成するステ ップと;及び、 前記マルチ・ビン・ヒストグラムの被選択のビンの値間を比較するステップと ; を含む請求項7の方法。 10.前記マルチ・ビン・ヒストグラムの被選択のビン内の値間を比較するステ ップは、前記マルチ・ビン・ヒストグラムの各々の第1ビンの値の比率を、前記 マルチ・ビン・ヒストグラムの各々の第2ビンの値の比率と比較するステップを 含み;そして、 さらに、前回のステップ中の比較に基づいて、前記2つのバイナリ・イメージ のうちの1つを選択するステップを含む 請求項9の方法。 11.前記ピースサイズ分布を比較するステップは、 前記ピースサイズ分布の各々からマルチ・ビン・ヒストグラムを生成するステ ップと;そして、 前記マルチ・ビン・ヒストグラムの各々の被選択のビンからの値を、学習済ニ ューラルネットワークに、入力値として、供給するステップと;そして、 さらに、前記学習済ニューラルネットワークの出力の値に基づいて、前記2つ のバイナリ・イメージのうちの1つを選択するステップを含むステップと; を含む請求項7の方法。 12.前記ヒストグラムは、前記バイナリ・イメージ内の小さいピースサイズに 対応する第1ビンと、前記バイナリ・イメージ内の大きいピースサイズに対応す る第2ビンと、に関するマルチ・ビン・ヒストグラムであり、前記マルチ・ビン ・ヒストグラムの被選択のビン内の値間を比較する前記ステップは、 第1の前記2つのバイナリ・イメージについての前記ヒストグラムの前記第1 ビンの値を、第2の前記2つのバイナリ・イメージについての前記ヒストグラム の前記第1ビンの値で、除算して第1の商を計算するステップと; 第1の前記2つのバイナリ・イメージについての前記ヒストグラムの前記第2 ビンの値を、第2の前記2つのバイナリ・イメージについての前記ヒストグラム の前記第2ビンの値で、除算して第2の商を計算するステップと;そして、 さらに、前記第1の商が、ある品質値を乗ぜられた前記第2の商より少ない場 合に、前記第1のバイナリ・イメージを選択するステップを含むステップと; を含む請求項9の方法 13.前記品質値が予選択済定数である請求項12の方法。 14.前記品質値は、予選択済定数と、前記第1の2つのバイナリ・イメージに ついての前記ヒストグラムの前記第2ビンの前記値と、を使用する予選択済公式 から計算される請求項12の方法 15.前記品質値は、予選択済定数と、前記第2の2つのバイナリ・イメージに ついての前記ヒストグラムの前記第2ビンの前記値と、を使用する予選択済公式 から計算される請求項12の方法 16.前記マルチ・ビン・ヒストグラムの前記第1ビンは、0からおよそ10の ピクセルを有する前記バイナリ・イメージのピースのカウントを含む請求項12 の方法。 17.前記マルチ・ビン・ヒストグラムの前記第2ビンは、およそ100以上の ピクセルを有する前記バイナリ・イメージのピースのカウントを含む請求項12 の方法。 18.階調イメージをスレショルドする方法であって、 前記階調イメージに対応するコントラスト・イメージを生成し、前記コントラ スト・イメージの各ピクセルが値LCijを 公式 LCij=C(1−(MINij+p)/(MAXij+p)) ((i,j)は前記コントラストイメージ内の前記ピクセルの位置、pはCと 比較してより小さい予選択済正の値、MINijは前記階調イメージ内の対応す る位置で心出しされた矩形のウィンドウ内の全てのピクセルの最低の階調値、及 び、MAXijは前記矩形のウィンドウ内の全てのピクセルの最大階調値) によって与えられる、ステップと; ピーク・フロア・レベル値、名目的ピーク幅値、最低コントラスト値、名目的 テキスト・ピーク幅値、最低コントラスト・スケール値、そして、名目的コント ラスト超過値、であるスレショルド・パラメータのセットの予選択済数を選択す るステップと; スレショルド・パラメータの各々のセットとしては、前記コントラスト・イメ ージ内の全てのポシブルなコントラスト値に亘って、前記コントラスト・イメー ジのコントラスト・ヒストグラムを生成することによって、バイナリ・イメージ 候補を得て; 前記予選択済ピーク・フロア・レベル値より大きく、前記予選択 済nominal−peak−width値ずついくらか高いピークから分離し ている、前記コントラスト・ヒストグラム内の全てのピークを探し; 前記予選 択済最低コントラスト値より大きい最低コントラスト値に出現するピークの位置 を捕捉することによって前記発見済ピーク中から最低テキスト・ピークを選択し ; 前記予選択済名目的テキスト・ピーク幅値を最低テキスト・ピークのコント ラスト値から減ずることによって、許容最低コントラスト値を得て; LCij が予選択済許容最低コントラスト値より少ない場合に前記バイナリ・イメージ候 補の背景クラスに、前記階調イメージの(i,j)ポジションのピクセルを割り 当て; 前記階調イメージの前記ピクセルが未だ前記背景クラスに割り当てられ ていない場合にMAXijとMINijとの差を計算し、かつ、前記予選択済最 低コントラスト・スケール値より前記最大最低差がより少ない場合に前記ピクセ ルを前記背景に割り当て; 前記階調イメージの前記ピクセルが未だ前記背景ク ラスに割り当てられていない場合にMAXijと前記ピクセルの階調値との差を 計算し、かつ、前記最大値とピクセル値との差が前記予選択済名目的コントラス ト超過値より少ない場合に前記ピクセルを前記背景に割り当て; そして、前記 階調イメージの前記ピクセルが未だ前記背景クラスに割り当てられていない場合 に前記ピクセルを前景クラスに割り当てるステップと; 前記バイナリ・イメージ候補の第1のものを選択し; 2つの値の第1のもの を有する前記第1に被選択のバイナリ・イメージ候補の部分を、第1のラン長エ ンコード(RLE)イメージに変換し; ピース抽出を使用する前記第1のRL Eイメージのピースの第1のピースサイズ分布を決定し; 前記第1のピースサ イズ分布の第1のマルチ・ビン・ヒストグラムを生成する、ステップと; 前回被選択済ではない前記バイナリ・イメージ候補の中から前記バイナリ・イ メージ候補の第2のものを選択し; 2つの値の第1のものを有する前記第2被 選択のバイナリ・イメージ候補の部分を、第2のラン長エンコード(RLE)イ メージに変換し; ピース抽出を使用する前記第2のRLEイメージのピースの 第2のピースサイズ分布を決定し; 前記第2のピースサイズ分布の第2のマル チ・ビン・ヒストグラムを生成し; 前記第1と第2のマルチ・ビン・ヒストグ ラムの評価に基づいて、第1被選択のバイナリ・イメージ候補と第2被選択のさ れたバイナリ・イメージ候補のうちの1つをピックアップするステップと;そし て、 全ての前記バイナリ・イメージ候補が選択されるまで、前記第1被選択のバイナ リ・イメージ候補に置き換わる前記ピックアップされたバイナリ・イメージ候補 について、前回ののステップを繰り返すステップと; を含む方法。 19.前記第1被選択のバイナリ・イメージ候補と、前記第2被選択のバイナリ ・イメージ候補とのうちの1つを、前記第1及び第2マルチ・ビン・ヒストグラ ムの評価に基づいて、ピックアップするステップは、 前記第1マルチ・ビン・ヒストグラムの第1ビン内の値と前記第2マルチ・ビ ン・ヒストグラムの第1ビン内の値との比率と、前記第1マルチ・ビン・ヒスト グラムの第2ビン内の値と前記第2マルチ・ビン・ヒストグラムの第2ビン内の 値との比率とを、比較するステップと; 前記比率間の比較に基づいて、前記第1被選択のバイナリ・イメージ候補と、 前記第2被選択のバイナリ・イメージ候補とのうちの1つをピックアップするス テップと; を含む請求項18の方法。 20.前記第1及び第2のマルチ・ビン・ヒストグラムの評価に基づいて、前記 第1被選択のバイナリ・イメージ候補と前記第2被選択のバイナリ・イメージ候 補のうちの1つをピックアップするステップは、 前記マルチ・ビン・ヒストグラムの各々の被選択のビンから、入力値として、 学習済ニューラルネットワークに値を供給するステップと;そして、 前記第1被選択バイナリ・イメージ候補と第2被選択のバイナリ・イメージ候 補を、前記学習済ニューラルネットワークの出力の値に基づいて、ピックアップ するステップと; を含む請求項19の方法。 21.階調イメージをスレショルドする装置であって、 前記階調イメージに対応するコントラスト・イメージを生成し、前記コントラ スト・イメージの各ピクセルが値LCijを 公式 LCij=C(1−(MINij+p)/(MAXij+p)) ((i,j)は前記コントラストイメージ内の前記ピクセルの位置、pはCと 比較してより小さい予選択済正の値、MINijは前記階調イメージ内の対応す る位置で心出しされた矩形のウィンドウ内の全てのピクセルの最低の階調値、及 び、MAXijは前記矩形のウィンドウ内の全てのピクセルの最大階調値) によって与えられる、手段と; ピーク・フロア・レベル値、名目的ピーク幅値、最低コントラスト値、名目的 テキスト・ピーク幅値、最低コントラスト・スケール値、そして、名目的コント ラスト超過値、であるスレショルド・パラメータのセットの予選択済数を選択す る手段と; スレショルド・パラメータの各々のセットとしては、前記コントラスト・イメ ージ内の全てのポシブルなコントラスト値に亘って、前記コントラスト・イメー ジのコントラスト・ヒストグラムを生成することによって、バイナリ・イメージ 候補を得て; 前記予選択済ピーク・フロア・レベル値より大きく、前記予選択 済nominal−peak−width値ずついくらか高いピークから分離し ている、前記コントラスト・ヒストグラム内の全てのピークを探し; 前記予選 択済最低コントラスト値より大きい最低コントラスト値に出現するピークの位置 を捕捉することによって前記発見済ピーク中から最低テキスト・ピークを選択し ; 前記予選択済名目的テキスト・ピーク幅値を前記最低テキスト・ピークのコ ントラスト値から減ずることによって、許容最低コントラスト値を得て; LC ijが前記許容最低コントラスト値より少ない場合に前記バイナリ・イメージ候 補の背景クラスに、前記階調イメージの(i,j)ポジションのピクセルを割り 当て; 前記階調イメージの前記ピクセルが未だ前記背景クラスに割り当てられ ていない場合にMAXijとMINijとの差を計算し、かつ、前記予選択済最 低コントラスト・スケール値より前記最大最低差がより少ない場合に前記ピクセ ルを前記背景に割り当て; 前記階調イメージの前記ピクセルが未だ前記背景ク ラスに割り当てられていない場合にMAXijとMINijとの差を計算し、か つ、前記最大最低差が前記予選択済名目的コントラスト超過値より少ない場合に 前記ピクセルを前記背景に割り当て; そして、前記階調イメージの前記ピクセ ルが未だ前記背景クラスに割り当てられていない場合に前記ピクセルを前景クラ スに割り当てる、手段と; 前記バイナリ・イメージ候補の第1のものを選択し; 2つの値の第1のもの を有する前記第1に被選択のバイナリ・イメージ候補の部分を、第1のラン長エ ンコード(RLE)イメージに変換し; ピース抽出を使用する前記第1のRL Eイメージのピースの第1のピースサイズ分布を決定し; 前記第1のピースサ イズ分布の第1のマルチ・ビン・ヒストグラムを生成する、手段と; 前回被選択済ではない前記バイナリ・イメージ候補の中から前記バイナリ・イ メージ候補の第2のものを選択し; 2つの値の第1のものを有する前記第2被 選択のバイナリ・イメージ候補の部分を、第2のラン長エンコード(RLE)イ メージに変換し; ピース抽出を使用する前記第2のRLEイメージのピースの 第2のピースサイズ分布を決定し; 前記第2のピースサイズ分布の第2のマル チ・ビン・ヒストグラムを生成し; 前記第1と第2のマルチ・ビン・ヒストグ ラムの評価に基づいて、第1被選択のバイナリ・イメージ候補と第2被選択のさ れたバイナリ・イメージ候補のうちの1つをピックアップする手段と;そして、 全ての前記バイナリ・イメージ候補が選択されるまで、前記第1被選択のバイナ リ・イメージ候補に置き換わる前記ピックアップされたバイナリ・イメージ候補 について、直前の機能を繰り返す手段と; を含む方法。 22.前記第1と第2のマルチ・ビン・ヒストグラムの評価に基づいて、前記第 1被選択のバイナリ・イメージ候補と前記第2被選択のバイナリ・イメージ候補 とのうちの1つをピックアップする機能は、 前記第1マルチ・ビン・ヒストグラムの第1ビン内の値と前記第2マルチ・ビ ン・ヒストグラムの第1ビン内の値との比率と、前記第1マルチ・ビン・ヒスト グラムの第2ビン内の値と前記第2マルチ・ビン・ヒストグラムの第2ビン内の 値との比率とを、比較する手段と; 前記比率の比較に基づいて、前記第1被選択のバイナリ・イメージ候補と第2 被選択のバイナリ・イメージ候補のうちの1つをピックアップする手段と; を含む請求項21の装置。 23.前記第1と第2のマルチ・ビン・ヒストグラムの評価に基づいて、前記第 1被選択のバイナリ・イメージ候補と前記第2被選択のバイナリ・イメージ候補 とのうちの1つをピックアップする機能は、 前記マルチ・ビン・ヒストグラムの各々の被選択のビンから、入力値として、 学習済ニューラルネットワークに値を供給する手段と;そして、 前記学習済ニューラルネットワークの出力の値に基づいて、前記第1被選択の バイナリ・イメージ候補と第2被選択のバイナリ・イメージ候補のうちの1つを ピックアップする手段と; を含む請求項21の装置。
JP52363796A 1995-01-31 1996-01-25 テキストを含む画像における背景から前景を分離する方法及び装置 Expired - Fee Related JP3264932B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US38073295A 1995-01-31 1995-01-31
US380,732 1995-01-31
US08/380,732 1995-01-31
PCT/US1996/001060 WO1996024114A2 (en) 1995-01-31 1996-01-25 Method and apparatus for separating foreground from background in images containing text

Publications (2)

Publication Number Publication Date
JPH10506733A true JPH10506733A (ja) 1998-06-30
JP3264932B2 JP3264932B2 (ja) 2002-03-11

Family

ID=23502251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52363796A Expired - Fee Related JP3264932B2 (ja) 1995-01-31 1996-01-25 テキストを含む画像における背景から前景を分離する方法及び装置

Country Status (10)

Country Link
US (1) US5889885A (ja)
EP (1) EP0807297B1 (ja)
JP (1) JP3264932B2 (ja)
AT (1) ATE185211T1 (ja)
CA (1) CA2211258C (ja)
DE (1) DE69604481T2 (ja)
DK (1) DK0807297T3 (ja)
ES (1) ES2140825T3 (ja)
GR (1) GR3031478T3 (ja)
WO (1) WO1996024114A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016224914A (ja) * 2015-05-29 2016-12-28 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 文書画像の二値化方法

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2211258C (en) * 1995-01-31 2000-12-26 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
JP3380831B2 (ja) * 1996-03-08 2003-02-24 シャープ株式会社 画像形成装置
FR2769733B1 (fr) * 1997-10-15 2000-01-07 Jeffrey Horace Johnson Procede d'extraction automatique d'inscriptions imprimees ou manuscrites sur un fond, dans une image numerique multiniveaux
US6411737B2 (en) * 1997-12-19 2002-06-25 Ncr Corporation Method of selecting one of a plurality of binarization programs
US6411741B1 (en) * 1998-01-14 2002-06-25 Kabushiki Kaisha Toshiba Image processing apparatus
US6507670B1 (en) * 1998-03-05 2003-01-14 Ncr Corporation System and process for removing a background pattern from a binary image
EP0961218B1 (en) * 1998-05-28 2004-03-24 International Business Machines Corporation Method of binarization in an optical character recognition system
US6222642B1 (en) * 1998-08-10 2001-04-24 Xerox Corporation System and method for eliminating background pixels from a scanned image
TW429348B (en) * 1999-02-12 2001-04-11 Inst Information Industry The method of dividing an image
WO2001009736A1 (en) * 1999-07-30 2001-02-08 Microsoft Corporation Adjusting character dimensions to compensate for low contrast character features
US6738526B1 (en) * 1999-07-30 2004-05-18 Microsoft Corporation Method and apparatus for filtering and caching data representing images
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
DE19958553A1 (de) 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
ATE509330T1 (de) * 1999-12-04 2011-05-15 Luratech Imaging Gmbh Verfahren zur kompression von gescannten farb- und/oder graustufendokumenten
US6652489B2 (en) * 2000-02-07 2003-11-25 Medrad, Inc. Front-loading medical injector and syringes, syringe interfaces, syringe adapters and syringe plungers for use therewith
JP2001251507A (ja) * 2000-03-03 2001-09-14 Fujitsu Ltd 画像処理装置
US6473522B1 (en) * 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US6674900B1 (en) * 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US6771804B1 (en) * 2000-05-16 2004-08-03 Siemens Aktiengesellschaft Method and apparatus for signal segmentation
KR100430273B1 (ko) * 2000-07-21 2004-05-04 엘지전자 주식회사 비정규적인 빈값 양자화된 칼라 히스토그램을 이용한멀티미디어 검색방법
WO2002047390A1 (en) * 2000-12-04 2002-06-13 Isurftv E-mail, telephone number or url within tv frame
JP2002271611A (ja) * 2001-03-14 2002-09-20 Fujitsu Ltd 画像処理装置
JP4140048B2 (ja) * 2001-08-20 2008-08-27 富士フイルム株式会社 画像管理装置、画像管理プログラム並びに画像管理方法
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
KR100425324B1 (ko) * 2002-02-09 2004-03-30 삼성전자주식회사 영상 신호의 콘트라스트 처리 방법
RU2251737C2 (ru) * 2002-10-18 2005-05-10 Аби Софтвер Лтд. Способ автоматического определения языка распознаваемого текста при многоязычном распознавании
US7079686B2 (en) * 2002-08-20 2006-07-18 Lexmark International, Inc. Systems and methods for content-based document image enhancement
KR100484170B1 (ko) * 2002-10-25 2005-04-19 삼성전자주식회사 디지털 화질 개선방법 및 장치
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
DE10326035B4 (de) * 2003-06-10 2005-12-22 Hema Electronic Gmbh Verfahren zur adaptiven Fehlererkennung auf einer strukturierten Oberfläche
DE10326033B4 (de) * 2003-06-10 2005-12-22 Hema Electronic Gmbh Verfahren zur adaptiven Fehlererkennung auf einer inhomogenen Oberfläche
DE10326032B4 (de) * 2003-06-10 2006-08-31 Hema Electronic Gmbh Verfahren zum Selbsttest eines Bildverarbeitungssystems
DE10326031B4 (de) * 2003-06-10 2005-12-22 Hema Electronic Gmbh Verfahren zur adaptiven Kantenerkennung
JP4259949B2 (ja) * 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体
US7921159B1 (en) * 2003-10-14 2011-04-05 Symantec Corporation Countering spam that uses disguised characters
US7313275B2 (en) * 2005-02-15 2007-12-25 Primax Electronics Ltd. Method of separating text and graphs in digital image data
US7492957B1 (en) * 2005-08-29 2009-02-17 Symantec Corporation Using run length encoding to detect target images
JP4215038B2 (ja) * 2005-09-16 2009-01-28 セイコーエプソン株式会社 画像処理装置、画像処理方法、およびプログラム
US7668394B2 (en) * 2005-12-21 2010-02-23 Lexmark International, Inc. Background intensity correction of a scan of a document
DE102006001075A1 (de) * 2006-01-09 2007-07-12 Carl Zeiss Ag Elektronische Sehhilfe und elektronisches Sehhilfeverfahren
US20070201743A1 (en) * 2006-02-28 2007-08-30 Sharp Laboratories Of America, Inc. Methods and systems for identifying characteristics in a digital image
US7813547B1 (en) 2006-04-05 2010-10-12 Unisys Corporation Apparatus and method for detection and analysis of imagery
US8306336B2 (en) * 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
DE602006002879D1 (de) * 2006-05-19 2008-11-06 Datasensor Spa Bildsensor für Sicherheitssystem und dazugehöriges Betriebsverfahren
WO2008030104A1 (en) * 2006-09-07 2008-03-13 Lumex As Relative threshold and use of edges in optical character recognition process
RU2445699C1 (ru) * 2007-11-28 2012-03-20 Люмэкс Ас Способ обработки данных оптического распознавания символов (ocr), где выходные данные включают в себя изображения символов с нарушенной видимостью
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8170291B2 (en) 2008-05-09 2012-05-01 The United States Postal Service Methods and systems for analyzing the quality of digital signature confirmation images
TWI386030B (zh) * 2008-06-11 2013-02-11 Vatics Inc 一種混合式連結元件標籤演算法
US8442348B2 (en) * 2008-11-06 2013-05-14 Seiko Epson Corporation Image noise reduction for digital images using Gaussian blurring
US8675060B2 (en) 2009-08-28 2014-03-18 Indian Institute Of Science Machine vision based obstacle avoidance system
US20110149753A1 (en) * 2009-12-21 2011-06-23 Qualcomm Incorporated Switching between media broadcast streams having varying levels of quality
US8693743B1 (en) 2010-02-19 2014-04-08 Olive Tree Media, LLC Analysis and display of multiple biomarker co-expression in cells and tissues
CN101807253B (zh) * 2010-03-22 2012-07-25 南京工程学院 面向输电线路基于区域宽度信息的图像骨架提取方法
US8977629B2 (en) * 2011-05-24 2015-03-10 Ebay Inc. Image-based popularity prediction
GB2522365B (en) * 2012-11-08 2019-07-17 Total Sa Method for processing an image
JP5939154B2 (ja) * 2012-12-27 2016-06-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
CN104036498B (zh) * 2014-05-28 2017-01-11 杭州电子科技大学 一种基于逐层分级的oct图像质量快速评价方法
JP6642970B2 (ja) * 2015-03-05 2020-02-12 キヤノン株式会社 注目領域検出装置、注目領域検出方法及びプログラム
US9710911B2 (en) * 2015-11-30 2017-07-18 Raytheon Company System and method for generating a background reference image from a series of images to facilitate moving object identification
DE102016004549A1 (de) * 2016-04-15 2017-11-02 Noventi Gmbh Verfahren zu Erkennung von gedruckten Texten auf Dokumenten
CN106775548B (zh) * 2016-11-25 2018-02-23 北京小米移动软件有限公司 页面处理方法及装置
US10242449B2 (en) * 2017-01-04 2019-03-26 Cisco Technology, Inc. Automated generation of pre-labeled training data
CN111368837B (zh) * 2018-12-25 2023-12-05 中移(杭州)信息技术有限公司 一种图像质量评价方法、装置、电子设备及存储介质

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3715724A (en) * 1969-12-24 1973-02-06 Olivetti & Co Spa Apparatus for recognizing graphic symbols
US4003999A (en) * 1972-10-25 1977-01-18 A. H. Robins Company, Incorporated Aspirin-tea coprecipitates for treating inflammation
US4119947A (en) * 1977-07-20 1978-10-10 Howard Noyes Leighton Optical signal processor
DE3107521A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
GB2103449B (en) * 1981-06-29 1985-05-30 Nippon Telegraph & Telephone Method and apparatus for gray level signal processing
JPS5960690A (ja) * 1982-09-30 1984-04-06 Toshiba Corp 2値化装置
JPS60146378A (ja) * 1984-01-11 1985-08-02 Matsushita Electric Ind Co Ltd 画像認識装置
JPS6158087A (ja) * 1984-08-29 1986-03-25 Nec Corp 画像領域分割装置
CA1250050A (en) * 1985-04-17 1989-02-14 Miyahiko Orita Image processing apparatus
JPS61276080A (ja) * 1985-05-31 1986-12-06 Toshiba Corp 上下判定装置
US4837450A (en) * 1985-07-01 1989-06-06 Canon Kabushiki Kaisha Apparatus for reading a film image with controllable illumination and threshold value
US4742556A (en) * 1985-09-16 1988-05-03 Davis Jr Ray E Character recognition method
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4809308A (en) * 1986-02-20 1989-02-28 Irt Corporation Method and apparatus for performing automated circuit board solder quality inspections
CA1268547A (en) * 1986-03-31 1990-05-01 Ahmed Mostafa El-Sherbini Thresholding algorithm selection apparatus
US4794239A (en) * 1987-10-13 1988-12-27 Intermec Corporation Multitrack bar code and associated decoding method
US4924078A (en) * 1987-11-25 1990-05-08 Sant Anselmo Carl Identification symbol, system and method
JPH01137385A (ja) * 1987-11-25 1989-05-30 Matsushita Electric Ind Co Ltd 文字認識装置
US4929979A (en) * 1988-01-29 1990-05-29 Konica Corporation Method and apparatus for processing image
JP2727549B2 (ja) * 1988-01-29 1998-03-11 日本電気株式会社 最適画質選択装置
JPH0746979B2 (ja) * 1988-05-26 1995-05-24 不二製油株式会社 特殊栄養食品
DE3881392T2 (de) * 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
JPH02100575A (ja) * 1988-10-07 1990-04-12 Toshiba Corp 画像処理装置
JPH02196565A (ja) * 1989-01-25 1990-08-03 Eastman Kodatsuku Japan Kk 画像二値化方式
JPH087785B2 (ja) * 1989-05-16 1996-01-29 松下電器産業株式会社 2値化処理装置
US5048096A (en) * 1989-12-01 1991-09-10 Eastman Kodak Company Bi-tonal image non-text matter removal with run length and connected component analysis
JP2935863B2 (ja) * 1989-12-27 1999-08-16 本田技研工業株式会社 ハフ変換装置および方法
JP2768786B2 (ja) * 1990-02-20 1998-06-25 キヤノン株式会社 画像読み取り装置
US5081690A (en) * 1990-05-08 1992-01-14 Eastman Kodak Company Row-by-row segmentation and thresholding for optical character recognition
US5121224A (en) * 1990-06-01 1992-06-09 Eastman Kodak Company Reproduction apparatus with selective screening and continuous-tone discrimination
US5091965A (en) * 1990-07-16 1992-02-25 Sony Corporation Video image processing apparatus
US5086485A (en) * 1990-10-19 1992-02-04 Xerox Corporation Method and apparatus for dynamically setting a background level
JPH04268989A (ja) * 1991-02-25 1992-09-24 Nippon Steel Corp 文字認識方法及び装置
JPH04268987A (ja) * 1991-02-25 1992-09-24 Nippon Steel Corp 文字認識装置
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US5268967A (en) * 1992-06-29 1993-12-07 Eastman Kodak Company Method for automatic foreground and background detection in digital radiographic images
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
US5444797A (en) * 1993-04-19 1995-08-22 Xerox Corporation Method and apparatus for automatic character script determination
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
US5452367A (en) * 1993-11-29 1995-09-19 Arch Development Corporation Automated method and system for the segmentation of medical images
US5630037A (en) * 1994-05-18 1997-05-13 Schindler Imaging, Inc. Method and apparatus for extracting and treating digital images for seamless compositing
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
CA2211258C (en) * 1995-01-31 2000-12-26 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016224914A (ja) * 2015-05-29 2016-12-28 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 文書画像の二値化方法

Also Published As

Publication number Publication date
GR3031478T3 (en) 2000-01-31
ATE185211T1 (de) 1999-10-15
WO1996024114A2 (en) 1996-08-08
DE69604481T2 (de) 2000-03-30
CA2211258C (en) 2000-12-26
JP3264932B2 (ja) 2002-03-11
WO1996024114A3 (en) 1996-11-28
CA2211258A1 (en) 1996-08-08
EP0807297B1 (en) 1999-09-29
ES2140825T3 (es) 2000-03-01
EP0807297A2 (en) 1997-11-19
US5889885A (en) 1999-03-30
DE69604481D1 (de) 1999-11-04
DK0807297T3 (da) 2000-04-10

Similar Documents

Publication Publication Date Title
JPH10506733A (ja) テキスト包含イメージにおける背景からの前景の分離方法及び装置
EP0358815B1 (en) System and method for automatic segmentation
US4941192A (en) Method and apparatus for recognizing pattern of gray level image
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US5029226A (en) Method and apparatus for effecting spot/void filtering of image data
US9965695B1 (en) Document image binarization method based on content type separation
MXPA02008296A (es) Metodo mejorado para binarizacion de imagen.
JP2003219184A (ja) 明確で判読可能な二値画像を作成する画像化プロセス
US5093871A (en) Method and apparatus for effecting background suppression of image data
CN113688838B (zh) 红色笔迹提取方法、系统、可读存储介质及计算机设备
US5305398A (en) Method and apparatus for scaling image data
US5150425A (en) Character recognition method using correlation search
US5140444A (en) Image data processor
EP0499875B1 (en) Method of and apparatus for obtaining binary image
EP0632404B1 (en) Pattern recognition by generating and using zonal features and anti-features
KR100503724B1 (ko) 화상에서의 객체 탐색 방법
JPH06113139A (ja) 画像2値化装置
KR100229810B1 (ko) 영상 데이터베이스 검색방법
US5020124A (en) Method and apparatus for detecting document size in an imaging system
CN110807456A (zh) 一种银行卡卡号的定位方法及装置
EP0447541B1 (en) Image data processor system and method
JP2001291056A (ja) 文書画像認識装置及び記録媒体
Jorgensen et al. Shape recognition system for automatic disassembly of TV-sets
JPH08185477A (ja) 画像分類装置
CN118265904A (en) Display device inspection method and information processing device

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071228

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081228

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091228

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees