JP3554033B2 - Ocr方法およびocrシステム - Google Patents
Ocr方法およびocrシステム Download PDFInfo
- Publication number
- JP3554033B2 JP3554033B2 JP20174694A JP20174694A JP3554033B2 JP 3554033 B2 JP3554033 B2 JP 3554033B2 JP 20174694 A JP20174694 A JP 20174694A JP 20174694 A JP20174694 A JP 20174694A JP 3554033 B2 JP3554033 B2 JP 3554033B2
- Authority
- JP
- Japan
- Prior art keywords
- foreground
- background
- level
- image
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 74
- 230000007704 transition Effects 0.000 claims description 71
- 230000008569 process Effects 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 5
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 60
- 230000000694 effects Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000002310 reflectometry Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 230000031700 light absorption Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000000049 pigment Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000002845 discoloration Methods 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
【産業上の利用分野】
本発明はテンプレート画像のライブラリを参照した入力画像のOCR分類に関し、より詳しくは、バックグラウンドデータ、フォアグラウンドデータ(2値信号)と共に、遷移グラウンドデータ(グレイスケール信号)を用いて行なうOCR分類に関する。
【0002】
【従来の技術】
従来、未分類の入力画像や分類済みのテンプレート画像は、その下部にあるデータのグレイスケール情報を除去するためにディジタル化されてきた。その結果ディジタル化された2値の入力及びテンプレート画像は、処理すべきデータ量の少ない「簡潔な」画像となる。一般にこうした先行技術のシステムは、メモリ容量が限定されているため今日の基準にすると処理速度が遅く、また、グレイスケールは信号ではなく、ノイズとして扱われていた。
【0003】
画像のディジタル化により、グレイスケール信号(遷移グラウンドデータ)と共にグレイスケールノイズが除去される。遷移グラウンドデータは、バックグラウンド領域とフォアグラウンド領域の間の画像内のエッジに沿ってコントラストが変化する細い領域である。遷移グラウンド信号レベルはバックグラウンドレベルからフォアグラウンドレベルへと前進的に変化する。遷移グラウンドは、グレイスケールノイズのように、画像の非2値情報部分を形成するものであるが、ディジタル化の間に失われる。
【0004】
グレイスケールノイズを除去することにより、分類処理はより高度な相関係数を提供することができるようになった。グレイスケールノイズは、一般に、同一文字に関して分類が反復して行なわれると再現不能であり、入力シンボルがテンプレートと適切に一致するのを妨げるものであった。不都合なことに、こうした従来の2値システムの分類結果は、遷移グラウンド信号が消失するがために「扱いにくい」ものとなった。相関係数は、入力シンボルとそれと一致するテンプレートとの例えば「ハミング」距離のような適切な距離基準に基づいていた。距離と、結果として得られた相関係数は、同一の印刷画像に対し分類を繰り返すと均一なものとはならなくなってしまう。
【0005】
【発明が解決しようとする課題】
従って、本発明は、バックグラウンドとフォアグラウンドの2値データ並びに遷移グラウンドのグレイスケールデータとを用いるOCR分類方法を提供することを目的とする。
さらに本発明は、同一入力シンボルを分類する場合において相関係数の変動がより少ない「安定した」分類結果が得られるOCR分類方法を提供することを他の目的とする。
【0006】
さらに本発明は、画像信号の損失を減少させるOCR分類方法を提供することを他の目的とする。
さらに本発明は、バックグラウンドレベル(またはフォアグラウンドレベル)を越えるグレイスケールノイズをバックグラウンドレベル(またはフォアグラウンドレベル)に「クランプする」OCR分類方法を提供することを他の目的とする。
【0007】
さらに本発明は、バックグラウンドレベル(またはフォアグラウンドレベル)に近いグレイスケールノイズをバックグラウンドレベル(またはフォアグラウンドレベル)に「クランプする」OCR分類方法を提供することを他の目的とする。
さらに本発明は、バックグラウンドレベル(またはフォアグラウンドレベル)が、バックグラウンドコントラストレベル(またはフォアグラウンドコントラストレベル)の限界レベルから所定のレベルだけ変化するようなOCR分類方法を提供することを他の目的とする。
【0008】
【課題を解決するための手段】
要約すると、本発明のこれらの目的及びさらに他の目的は、分類済みの文字のT個のテンプレート画像ベクトルのライブラリに対して未分類のシンボルの入力画像ベクトルを分類するOCR方法を提供することにより達成される。
各テンプレートベクトルは、エレメントのシーケンスの形を取っており、各エレメントはそのテンプレートベクトルにより定義される分類済みの文字内のエレメントの画像コントラストレベルを表す数値を有している。テンプレートエレメントはバックグラウンド領域、フォアグラウンド領域、または画像内におけるバックグラウンドコントラストレベルからフォアグラウンドレベルへの前進的な変化により生じる、バックグラウンド及びフォアグラウンドの間の遷移グラウンド領域からのものである。入力ベクトルも未分類シンボルの画像内のシンボルを規定する画像コントラストレベル信号成分を表す数値を有している。
【0009】
さらに、入力ベクトルはグレイスケールノイズ成分である。入力エレメントもまた、文字画像のバックグラウンドまたはフォアグラウンド、あるいはバックグラウンド及びフォアグラウンドの間の画像遷移グラウンドからのものである。入力ベクトルと、T個のテンプレートベクトルの少なくとも1つが分類装置に入力される。すると、入力ベクトルのバックグラウンド、フォアグラウンド、遷移グラウンドを、入力されたT個のベクトルのバックグラウンド、フォアグラウンド、遷移グラウンドと比較することにより、入力ベクトルが、入力されたテンプレートベクトルに対して分類される。さらに、入力ベクトルのエレメントは、所定のバックグラウンド・クランピング処理範囲内の数値を有するエレメントとして識別してもよい。その場合識別された各エレメントの数値は所定のバックグラウンド・クランピング処理数値へクランピング処理される。
【0010】
【実施例】
〈一般の実施例(図1、2)〉
分類済みの文字のT個のテンプレート画像ベクトルのライブラリを用いて未分類シンボルの入力画像ベクトルを分類するためのOCRシステム10を図1に示す。画像ベクトルは、一般にビットマップメモリ(図3A〜図3Dを参照)に格納される画素画像の数学的形式を取る。ベクトルの各エレメントはビットマップの画素の画像強度(コントラストレベル)を表している。根底的な分類方法の基本的なステップが図2にリスト表記される通りであり、下記に詳細に説明する。
【0011】
ステップS1
T個のテンプレート画像ベクトルのライブラリを提供するステップである。
テンプレートベクトルは、イメージスキャナ12Sによって対応する文字の画像のセットをスキャンすることにより生成して画素画像をテンプレートメモリ14T に形成する。各テンプレートベクトルは多量な(恐らく数千の)基本的な文字サンプルの統計学的な合成物である。サンプル個体群のベースはある範囲の基本的な文字のフォントを含んでいる。または、各テンプレートベクトルを、手入力や選択した座標位置でディジタルデータを削除してモデルテンプレートを作成することによって、画素画像としてテンプレートメモリに直接作成することができる。各テンプレートベクトルはエレメントのシーケンスの形を取り、各エレメントはそのテンプレートベクトルによって定義された分類済みの文字内の画素の画像コントラストレベルを表す数値を有している。各エレメントは、
a:文字画像の大部分を形成する画像バックグラウンド領域、または、
b:文字画像の中間量部分を形成する画像フォアグラウンド領域、または、
c:文字画像の小量部分を形成する、バックグラウンドとフォアグラウンドの間の画像遷移グラウンド領域、
のいずれかの部分である。
遷移グラウンドは、スキャンの間に画像内の各立ち上がりエッジが遭遇する(遷移グラウンドの項参照)ときの、バックグラウンドコントラストレベルからフォアグラウンドコントラストレベルへの前進的な変化の結果である。遷移グラウンドは、各立ち下がりエッジにそってバックグラウンドコントラストレベルからフォアグラウンドコントラストレベルへ漸進的に変化する。
【0012】
ステップS2
未分類シンボルの入力画像ベクトルを提供するステップである。
入力ベクトルは、入力文書10D上の未分類の入力文字10Cの印刷画像をイメージスキャナ12Sによりスキャンして生成しメモリ14Iへ格納することができる。入力ベクトルは、テンプレートベクトルと同様に、エレメントのシーケンスの形を取っており、各エレメントは数値を有している。しかし、入力ベクトルにおいては、数値は、未分類シンボルの画像内においてそのシンボルを定める画像コントラストレベル信号成分と、グレイスケールノイズ成分とを表している。各エレメントは、
a:文字画像の大部分を形成する画像バックグラウンド領域、
b:文字画像の中間量部分を形成する画像フォアグラウンド領域、
c:文字画像の小量部分を形成する、バックグラウンドとフォアグラウンドの間の画像遷移グラウンド領域、
のいずれかの部分である。
【0013】
ステップS9
入力メモリから上記の入力ベクトルを、そしてテンプレートメモリからT個のテンプレートベクトルの少なくとも1つを、分類装置18へ入力するステップである。
ステップS10
入力ベクトルのバックグラウンド、フォアグラウンド、遷移グラウンドを、入力された上記のテンプレートベクトルのバックグラウンド、フォアグラウンド、遷移グラウンドと比較することにより、入力ベクトルを入力されたテンプレートベクトルに従って分類する。入力ベクトルとテンプレートベクトルとに遷移グラウンドが存在することにより、同一の入力シンボルを反復して分類しても、それらの相関係数がより均一な安定した分類ものとなる結果が得られる。尚、分類装置18は、入力ベクトルと入力された各テンプレートベクトルとをエレメント単位で比較する距離関数分類装置でもよい。あるいは、分類装置は、入力されたテンプレートベクトルに応じて学習データベースを発展させて入力ベクトルの分類を行なうようなニューラルネットワークを用いた分類装置でもよい。
【0014】
〈遷移グラウンド(図3A、3B、3C、3D)〉
従来の白/黒印刷の文字画像では、バックグラウンド領域は文字周辺の白紙部分に当たり、フォアグラウンド領域は文字を形成している堆積したインク部分に当たっている。遷移グラウンド領域はバックグラウンドとフォアグラウンドの間の文字のエッジ境界である。遷移グラウンドは、2値画像を生成するために印刷画像のディジタル化を行なう間に失われてしまう。2値ビットマップ30A(図3Aの文字「I」参照)の2値画素画像32Aにおいては、遷移グラウンドが存在せずに、バックグラウンド領域とフォアグラウンド領域の間でコントラストの顕著な変化が見られる。
【0015】
印刷画像のグレイスケール画素画像では、遷移グラウンドは、フォアグラウンドの周りのコントラストが変化する画素からなる光輪である。遷移グラウンドの信号レベルはバックグラウンドレベルからフォアグラウンドレベルへと前進的に変化する。遷移グラウンドは2値画像においてはグレイスケールエッジ効果である。各テンプレートのフォアグラウンド周囲の遷移グラウンドは、グレイスケールノイズが存在しないためにノイズが無く明確である。ビットマップ30B(図3Bの文字「I」参照)のテンプレート画素画像32Bは、フォアグラウンド全体の周囲に1画素幅の縦方向の遷移グラウンド34Bと横方向の遷移グラウンド36Bとを有している。遷移グラウンドの各画素は隣接するバックグラウンドレベルとフォアグラウンドレベルの間のコントラストレベルを有している。
【0016】
バックグラウンドコントラストレベルが0.00(白)で、フォアグラウンドコントラストレベルが1.00(黒)であるビットマップの実施例では、遷移グラウンドのコントラストレベルは好ましくは0.50である。入力印刷画像のライブラリは列毎にスキャンされて、テンプレートビットマップのライブラリにおける対応する画素画像が提供される。コントラストレベルは、各文字ストロークの立ち上がりエッジを越えて、白(バックグラウンド)から黒(フォアグラウンド)へ増加し、立ち下がりエッジを越えて、黒から白へ減少する。遷移グラウンドは一般に同一画像を反復してスキャンしても再現可能であり、グレイスケール信号の形を取るデータを表している。
【0017】
印刷画像における遷移グラウンドは印刷画像をスキャンする間に拡がり、より広い遷移グラウンド比率の画素画像が生成される。画像の量子化の効果により、その画像の各エッジに沿って1画素幅の遷移グラウンドが形成される。量子化効果は、無限解像度の連続する印刷画像を特定の解像度の画素画像へ変換する際に生じる誤差の「丸め」に関係している。スキャナのフォトセンサ列(またはマトリックス)は特定のフォトダイオードのサイズと間隔とを有しており、同様に用紙に対する特定のスキャンラスタ率を有している。縦方向の遷移グラウンドは用紙送り(またはスキャナヘッドの送り)方向に対して垂直であり、ダイオードのサイズ及び間隔による量子化効果により、スキャンの間に拡張される。横方向の遷移グラウンドは用紙送り方向に沿っており、ララスタ率の量子化効果によりスキャンの間に拡張される。
【0018】
スキャンされた印刷画像を光学的に操作することによっても同様に遷移グラウンドを拡張する。各ダイオードセンサはごく小さい集光レンズを有しているが、レンズは印刷画像と相対的に合焦点から僅かにずれて位置しているため、得られる光学画像は合焦の質が低いものとなっている。印刷画像の細い遷移グラウンドはビットマップではより広い複数画素の遷移グラウンドとなる。印刷画像の僅かなぼけは光学的ローパスフィルタとして機能し、光学画像の低空間周波数成分により形成される大規模な画像構造のみを保存する。より高い空間周波数成分により形成される光学画像のより繊細な部分はぼけ部分に紛れる。好ましくは、光学合焦の質が損失しても、画素画像の上記ビットマップにおけるモアレパターンや不都合な「エリアジング」効果を防ぐことに十分である。
【0019】
非対象なレンズアレーを用いて多様な幅を持つ遷移グラウンドを供給することもできる。ビットマップ30C(図3Cの文字「I」参照)のテンプレート画素画像32Cは、3画素幅の縦方向の遷移グラウンド34Cと、2画素(列)幅の横方向の遷移グラウンド36Cとを有している。縦方向の遷移グラウンドの3画素のコントラストレベルは段階別に分かれている。例えば、白バックグラウンド=0.00で、黒フォアグラウンド=1.00の実施例では、各段階は0.00〜0.25〜0.50〜0.75〜1.00である。つまり、バックグラウンドに隣接する縦方向の遷移グラウンド画素は0.25のコントラストレベルを有し、フォアグラウンドに隣接する縦方向の遷移グラウンド画素は0.75のコントラストレベルを有している。中間の縦方向の遷移グラウンド画素は0.50のコントラストレベルを有している。同様に、横方向の遷移グラウンドの2画素のコントラストレベルも段階別になっている。バックグラウンド域領域に隣接する横方向の遷移グラウンド画素は0.33のコントラストレベルを有し、フォアグラウンド領域に隣接する横方向の遷移グラウンド画素は0.66のコントラストレベルを有している。
【0020】
入力メモリに格納された未分類シンボルのビットマップは遷移グラウンド画素にランダムなコントラストレベルを導入させるグレイスケールノイズを含んでいる。ビットマップ30D(図3Dの文字「I」参照)は不均一な縦方向の遷移グラウンド34Dと横方向の遷移グラウンド36Dとを有している。
〈グレイスケールノイズ〉
初期のグレイスケールのノイズ源は、文書上でテキスト領域内に混じっている異物(汚れ、しみ、糸くず等)によるグレイスケールである。用紙グレイスケールはパルプ粒子やその他の紙の不揃いな要素により生じる。トナーグレイスケール(黒ノイズ)は個々のトナー粒子の面やその他の表面効果により生じる。インクが散逸すると画像に隣接する白バックグラウンド領域において「トナーはね」や胡椒状のノイズとなる。インクが過剰だとトナーはねを起こす。インクが不足していると、インク欠乏により黒フォアグラウンド領域において「トナー抜け」即ち白抜けとなる。
【0021】
グレイスケールノイズの他の主原因は、スキャナの動作ノイズや不均一な用紙送りなど機械的動作に起因する。電子的グレイスケールは熱電子ノイズや暗電流により生じる。これらの、及びその他の効果による生じるグレイスケールは信号ではなくノイズである。グレイスケールノイズの低減あるいは除去により分類プロセスが強化される。
【0022】
〈バックグラウンドのクランピング処理の実施例(図4)〉
バックグラウンド・クランピング(clamping)処理(とフォアグラウンド・クランピング処理、尚、フォアグラウンド・クランピング処理の項参照)では、入力文字とマッチングテンプレート間の相関係数を増やす(距離を減らす)ために、あるタイプのグレイスケールノイズをグレイスケール画素画像(またはグレイスケールベクトル)のバックグラウンド領域から除去する処理を行なう。グレイスケールノイズの除去により、マッチング入力とテンプレートとの比較が促進される。しかし、不一致状態においてはランダム効果が起こる。バックグラウンド・クランピング処理(及びフォアグラウンド・クランピング処理)は、特に、スキャナから直接読み取ったままの「ノイズ的」データにより形成されている入力ベクトルに有効である。テンプレートベクトルは「簡潔な」処理済みデータにより形成され、含まれるグレイスケールノイズの量は遙に少ない。データが手動入力されるようなモデルテンプレートは理想的な条件で作成され、グレイスケールはゼロである。バックグラウンド・クランピング処理を行なうためには、分類ステップの前に実行されるべき付加的なステップが必要である。バックグラウンド・クランピング処理の各ステップは図2に一般分類ステップと共にリスト表記されており、下記に説明する。
【0023】
ステップS5
所定の範囲のバックグラウンド・クランピング処理の数値を有する入力ベクトル(またはテンプレートベクトル)を識別するステップである。入力文字(またはテンプレート文字)を定める各エレメントは、その文字の画素画像内の画素を表している。
【0024】
ステップS6
識別された各バックグラウンドエレメントの数値をバックグラウンド・クランピング処理のための所定の数値レベルへクランプするステップである。好ましくは、クランピング処理のためのこの所定レベルは上述の所定範囲内のレベルである。尚、バックグラウンド・クランピング処理のこのレベルは、入力ベクトルのバックグラウンドエレメントの数値のコントラストレベル信号成分により決定される一般バックグラウンド信号レベルとしてもよい。
【0025】
ハイパー・バックグラウンド・クランピング処理
その一般バックグラウンド信号レベルを越えた各バックグラウンドエレメントの数値部分は、そのバックグラウンドエレメントのグレイスケールノイズ成分のハイパー・バックグラウンドノイズ副成分を定める。薄い地色の紙や年月が経って色が褪せた紙などの低減された反射率を持つ用紙は、100%(完全な白を0.00と、完全な黒を1.00とした場合)に近い反射率を持つ用紙より僅かに高いバックグラウンド信号レベルを生じる。光を反射する糸くず、油じみ、透かし模様(watermarks)等は紙より反射率が高く、より低い信号レベルを生じて、ハイパー・グレイスケールノイズを生むことになる。ハイパー・クランピング処理の実施例では、バックグラウンド・クランピング処理の上記の範囲は上記のハイパー・バックグラウンドノイズ副成分により決定される数値の範囲である。ハイパー・バックグラウンド範囲に亘ってクランピング処理を行なって、その全体範囲を上記一般バックグラウンド信号レベルにクランプすることにより、ハイパー・バックグラウンドノイズを除去する。
【0026】
ハイパー・バックグラウンドノイズが存在することとハイパー・クランピング処理の効果とが、スキャンされて得た入力画素画像を分類したグラフ40に示されている(図4参照)。各画素(X軸)は、ディジタルのコントラストレベル(Y軸)により分類されて、左へ向かって白バックグラウンド領域42Bを形成する最低レベルと、右へ向かって黒フォアグラウンド領域42Fを形成する最高レベルを有する。バックグラウンドとフォアグラウンド間の遷移グラウンド領域42Tはグラフの中央で急激に上昇する領域である。遷移グラウンドはスキャンにより拡張されたものであり(遷移グラウンドの項参照)、縦方向及び横方向のグレイスケール遷移画素を有している。
【0027】
一般バックグラウンドレベル(Gbgで示す)は破線で示す部分である。対応する一般フォアグラウンドレベル(Gfgで示す)も同様に破線で示される、一般フォアグラウンドレベルについてはフォアグラウンドの項で詳細に説明する。バックグラウンド領域とフォアグラウンド領域が左から右へ向かって緩やかに上昇するのは、光を反射しているバックグラウンドにおける不均一な反射率と暗いフォアグラウンドにおける不均一な光の吸収率のせいである。さらに他の上昇の原因は、画素画像におけるコントラストレベルを定めるために、画像強度で表された印刷画像のグレイスケールを量子化することにより生じる画素丸め誤差である。尚、説明の便宜上、図4における上昇ステップの高さは誇張されたものとなっている。図4の実施例ではハイパー・バックグラウンドの範囲は(Hbgで示す)一般バックグラウンドレベルから最高反射率(0.00)レベルにまで亘っている。紙よりも反射率の高い印刷画像中領域からのバックグラウンド画素の全てに一般バックグラウンドコントラストレベルが割り当てられる。
【0028】
〈近接バックグラウンド・クランピング処理〉
一般バックグラウンド信号レベルに近い各エレメントの数値部分は、そのエレメントのグレイスケールノイズ成分の近接バックグラウンドノイズ副成分を定める。バックグラウンドの反射率の僅かな変化は、紙の粒子、スキャン照射における歪み、丸め誤差により生じたものである。薄い色の付いた埃やしみ等小量の光を吸収する異物は、バックグラウンドよりも少しだけ少ない量の光しか反射しない。これらのバックグラウンドからの僅かな変動がグレイスケールノイズである。近接クランピング処理の実施例では、バックグラウンド・クランピング処理範囲は上記の近接バックグラウンドノイズ副成分により決定される数値の範囲である。その近接範囲全体を一般バックグラウンド信号レベルにクランプすることにより近接バックグラウンド範囲のクランピング処理を行なうことが、近接バックグラウンドノイズを除去することができる。図4の実施例における近接バックグラウンド範囲(Nbgで示す)は一般バックグラウンドレベルの両側に渡っている。用紙よりも僅かに反射率が高いまたは低い領域からのバックグラウンド画素の全てが一般バックグラウンドコントラストレベルを割り当てられる。画素画像のグレイスケールノイズを減らすために、バックグラウンド・クランピング処理範囲はハイパー・バックグラウンド・クランピング処理範囲Hbgと、近接バックグラウンド・クランピング処理範囲Nbgの両方を含んでいる。
【0029】
〈フォアグラウンド・クランピング処理の実施例(図4)〉
フォアグラウンド・クランピング処理は、相関係数を向上させるために行なわれるもので、グレイスケール画素画像(またはグレイスケールベクトル)のフォアグラウンド領域からあるタイプのグレイスケールノイズを除去することであり、バックグラウンド・クランピング処理と大変よく似ている。フォアグラウンド・クランピング処理ステップ画、図2に、一般の分類ステップとバックグラウンド・クランピング処理ステップと共に示されている通りであり、下記に詳細に説明する。
【0030】
ステップS7
所定のフォアグラウンド・クランピング処理範囲の数値を有する入力ベクトル(またはテンプレートベクトル)のフォアグラウンドエレメントを識別するためのステップである。入力文字(またはテンプレート文字)を規定するベクトルの各エレメントは、その文字の画素画像内の画素を表す。
【0031】
ステップS8
識別された各フォアグラウンドエレメントの数値を、バックグラウンド・クランピング処理用の所定の数値レベルにクランプするステップである。
尚、このフォアグラウンド・クランピングレベルは入力ベクトルのフォアグラウンドエレメントの数値のコントラスト信号成分により決定される一般フォアグラウンド信号レベルでもよい。
【0032】
ハイパー・フォアグラウンド・クランピング処理
一般フォアグラウンド信号レベルを越える各フォアグラウンドエレメントの数値部分は、そのエレメントのグレイスケールノイズ成分のハイパー・フォアグラウンドノイズの副成分を定める。トナーより吸収率の高い暗色の粒子やしみは、より高い信号レベルを生じて、ハイパー・グレイスケールノイズとなる。ハイパー・クランピング処理の実施例では、フォアグラウンド・クランピング処理のための範囲はハイパー・フォアグラウンドノイズの上記の副成分により決定される数値の範囲である。ハイパー・フォアグラウンドの全範囲を一般フォアグラウンド信号レベルにクランプすることによりハイパー・フォアグラウンド範囲のクランピング処理を行なうことが、ハイパー・フォアグラウンドノイズを除去することができる。
【0033】
一般フォアグラウンドレベル(Gfgで示す)は破線で示される通りである。図4の実施例におけるハイパー・フォアグラウンド範囲(Hfgで示す)は、一般フォアグラウンドレベルから最小反射率(=最高吸収率−1.00)のレベルに渡っている。印刷画像におけるトナーより高い吸収率を持つ領域の画素の全てが一般フォアグラウンドコントラストレベルを割り当てられる。
【0034】
近接フォアグラウンド・クランピング処理
一般バックグラウンド信号レベルに近い各エレメントの数値部分は近接フォアグラウンドノイズの副成分を定める。フォアグラウンドの反射率の僅かな変化はスキャンされた文書上のトナー(またはインク)状態の不均一性から来るものである。100%に近い光の吸収率を持つトナー粒子は、薄い色のトナーや年月が経って色褪せたトナー等吸収率が低なったトナーより僅かに高いフォアグラウンド信号レベルを生じる。新しいトナーや極く黒いトナーは、古いトナーに対し近接一般フォアグラウンドノイズとなる。オフィスのコピー機やインクジェットプリンタが故障すると不均一なトナー濃度を産み出す。インパクトプリンタのリボンが経年変化すると、正しくリボン送りがされなかったりして、タイプが薄くなったり濃くなったりする。
【0035】
近接クランピング処理の実施例では、フォアグラウンド・クランピング処理の範囲は近接フォアグラウンドノイズ副成分により決定される数値の範囲である。その近接フォアグラウンド範囲のクランピング処理を行なって、全近接範囲を一般フォアグラウンド信号レベルにクランプすることにより、近接フォアグラウンドノイズを除去することができる。図4の実施例における近接フォアグラウンド範囲は(Nfgで示す)一般フォアグラウンドレベルの両側に渡っている。用紙よりも僅かに高いまたは僅かに低い光りの反射率を持つ領域からのフォアグラウンド画素の全てが一般フォアグラウンドコントラストレベルを割り当てられる。
【0036】
画素画像におけるグレイスケールノイズをさらに減らすために、フォアグラウンド・クランピング処理の範囲はハイパー・フォアグラウンド・クランピング処理範囲Hfgと近接フォアグラウンド・クランピング処理範囲Nfgの両方を含んでいてもよい。さらに、クランピング処理方法はバックグラウンド・クランピング処理(ハイパー・及び/または近接)とフォアグラウンド・クランピング処理(ハイパー・及び/または近接)の両方を同一の画素画像に対して行なうものでもよい。
【0037】
〈クランピングパラメータ〉
バックグラウンド及びフォアグラウンドのクランピングレベルは、クランピング比較器16B、16F等の適切なクランピング処理装置のバックグラウンドレベルポートVbgとフォアグラウンドレベルポートVfgに入力される。バックグラウンド及びフォアグラウンド・クランピング処理の範囲はバックグラウンド範囲ポートRbgとフォアグラウンド範囲ポートRfgに入力される。画素画像の各画素のコトラストレベルは上記クランピング処理範囲と比較される。いずれかのクランピング処理範囲内にあるコントラストレベルは適当なクランピングレベルにセットされる。
【0038】
クランピングレベルは入力画像(またはテンプレート画像)の一般レベルでも、あるいは必要に応じてその他のレベルにしてもよい。バックグラウンド及びフォアグラウンドの夫々の一般レベルは画素濃度対コントラストレベルのグレイスケール分析により決定することができる。画像画素の分布は、白バックグラウンド一般レベルを規定する低い方のピークと黒フォアグラウンド一般レベルを規定する高い方のピークを有する2モード状である。あるいは、クランピングレベルは所定のレベルにセットしてもよい。例えば、単純な256レベルの実施例では、白バックグラウンドレベルを最低強度の上の50のコントラストレベルにセットし、黒フォアグラウンドレベルを最高強度の下の50のコントラストレベルにセットしてもよい。
【0039】
バックグラウンドのクランピングレベルをゼロにセットすることにより、特定のクランピングレベルより高速な分類サイクルを達成できる。もし乗算の乗数または被乗数がゼロならば、その積はゼロである。従って、ゼロにクランプされたバックグラウンド画素を含む分類関数により得られる積の全てを、実際にその乗算を行なわずにゼロにセットすることができる。各乗算を省略することによって、数マイクロ秒処理時間を節約することができる。大部分の分類関数は各画素に対して2つか3つの乗算を含んでいる。用いられる画素数は画素画像の解像度に依存している。一般に使用される最低の解像度は2400画素(60×40画素)で、クランピング処理ステップを通じてゼロになるバックグラウンド画素の大半の画素に当たる。より高い解像度は数十万画素である。これらのバックグラウンドの乗算を省くことにより分類処理の速度を上げることができる。フォアグラウンド・クランピングレベルを整数値にセットすると、同様に速度の向上が達成できる。積の乗数が1なら、積は被乗数とおなじ値である。従って、1にセットされたフォアグラウンド画素を含む積の全てを、実際に乗算を行なわずに1にセットすることができる。
【0040】
クランピング処理範囲の幅を、遷移グラウンド(グレイスケール信号)の損失を最小にしながらグレイスケールノイズを最大限に除去するために望ましいように選択することができる。残念ながら、近接バックグラウンド・クランピング処理範囲が幅広くなって、一般バックグラウンドレベルのちょうど上にある最低グレイスケール信号をいくつか含むことがある。同様に、近接フォアグラウンド・クランピング処理範囲が広くなって、一般フォアグラウンドレベルのちょうど下にある最上グレイスケール信号を含むことがある。より狭い幅のクランピング処理幅では含まれるグレイスケール信号はそれほど多くはない。しかし、それほど多くのグレイスケールノイズを除去することはできない。クランピング処理範囲を選択する際に考慮される点としてはクランピング処理後の画素画像の信号対ノイズ比がある。クランピング処理後に残った画素画像はクランピング処理前よりも高い信号/ノイズ比を持つべきである。クランピング処理において排除された画素情報のセグメントは主にノイズを含み、クランピング処理前より低い信号/ノイズ比を持っている。
【0041】
画像バックグラウンドは大抵、画像フォアグラウンドよりも多くのグレイスケールノイズを含んでいる。従ってバックグラウンド・クランピング処理はフォアグラウンド・クランピング処理よりも効果的に入力テンプレートマッチングを促進する。バックグラウンドの領域は、通常フォアグラウンドの数倍である。つまり、印刷ページは大部分が白く間隔をあけて黒い文字が配置されている。従ってバックグラウンド・クランピング処理は画素画像においてより多くの画素に影響する。さらに、ノイズの原因の大半は少なくともいくらか光を吸収する顔料や色等の異物を含んでいる。ほこりやしみが「真白」であることはまず有り得ない。この顔料の優勢が、黒フォアグラウンドよりも大きく白バックグラウンドに影響する。
【0042】
〈関連するクランピング処理のステップ〉
この画素分類のフローチャートでは、入力ベクトルのコトラストレベル信号成分の各エレメントの数値は最小限度値と最大限度値の間の値である。バックグラウンドエレメントの数値はいずれか一方の限度値に近い値であり、フォアグラウンドエレメントの数値は他の一方の限度値に近い値である。図4の実施例では、最小限度値は0.00で最大限度値は1.00である。バックグラウンドは白として示され最小限度値により近くなっている。しかし、様々な標準化や修正手順により、他の限度値も使用することができる。そして、バックグラウンドは明色や暗色や、限度値のいずれかに近い色にすることができる。バックグラウンドレベルはいずれかの限度値にすることができる。
【0043】
好ましくは、入力画素画像のバックグラウンド一般レベルとフォアグラウンド一般レベルはテンプレート画像の一般レベルと同一である。一般レベルは、入力画素一般レベルをテンプレート画素一般レベルと同一のコントラストレベルに設定するためのスキャナゲインコントロール12Gを調整する等、適切な修正ステップにより標準化できる。一般レベルを標準化することにより、分類結果の分析を向上させる相関係数も標準化できる。分類方法は関連の次のステップ(ステップS3を含んでもよい。
【0044】
ステップS3
入力ベクトル及び入力されたテンプレートベクトルの一般バックグラウンドレベルを同一の一般バックグラウンドレベルにセットし、入力ベクトル及び入力されたテンプレートベクトルの一般フォアグラウンドレベルを同一の一般フォアグラウンドレベルにセットするステップである。
【0045】
いずれの入力一般レベルもテンプレート一般レベルと同一のレベルにセットすることができる。あるいは、テンプレート一般レベルは入力一般レベルと同一のレベルにセットしてもよい。好ましくは、入力画像の一般レベルはテンプレート画像と同一のレベルに調整される。入力画像の一般バックグラウンドレベルをセットするためのスキャナゲインを調整することにより、スキャナ光源の照度変化や印刷画像の用紙の色落ち等の効果を無効にできる。同様に、入力画像の一般フォアグラウンドレベルを調整することにより、色褪せしたトナーや色が変化したトナーによる影響を無効にできる。
【0046】
分類方法は、クランピングステップの支援となるように、コントラストレベルの順に入力文字(及びテンプレート文字)の画素を分類する次の関連ステップを含んでいる。
ステップS4
分類ステップの前に入力ベクトル(及びテンプレートベクトル)のエレメントを数値の順に区分けするステップである。
【0047】
テンプレート画像の区分けフローチャートではノイズと丸め誤差がより少なくなる。区分けされたシーケンスにおいて同一のコントラストレベルを有する画素の全てが隣接し、距離関数の計算において一般の乗数を持つグループを形成する。乗算ステップは各グループに対し同一の乗数を持ち、新しい乗数を入力することなくグループ全体の処理を行なう。
【0048】
ベクトルとテンプレートベクトルの両方共、グレイスケールを除去して相関係数を増強するためにクランピング処理される。好ましくは、入力クランピング処理範囲及びクランピングレベルはテンプレートクランピング処理範囲及びクランピングレベルと同一である。つまり、所定のテンプレートクランピング処理範囲は所定の入力クランピング処理範囲に一致し、所定のテンプレートクランピングレベルは所定の入力クランピングレベルに一致している。
【0049】
説明された構成及び実施例において、発明の概念から逸脱しない程度で様々な変形が可能である。さらに、様々な図に示した実施例の特徴は他の図示による実施例を用いても利用が可能である。
従って、本発明の範囲は下記の請求項の語句及びその法的適用範囲により規定される。
【0050】
尚、本発明は、複数の機器から構成されるシステムに適用しても良いし、1つの機器から成る装置に適用しても良い。また、本発明は、システム或は装置にプログラムを供給することによって達成される場合にも適用できることはいうまでもない。
【0051】
【発明の効果】
以上述べた様に本発明によれば、バックグラウンド及びフォアグラウンド2値データ、遷移グラウンドグレイスケールデータを用いるOCR分類方法を提供することによって本発明の目的が達成されることは当業者には明らかである。OCR方法は同一の入力シンボルの分類間の相関係数における変化がより少なく、画像信号の損失が最少程度の、「安定した」分類結果を出すことができる。バックグラウンドレベル(またはフォアグラウンドレベル)を越えるグレイスケールノイズはバックグラウンドレベル(またはフォアグラウンドレベル)に「クランプ」され、ノイズを減少させる。さらに、バックグラウンドレベル(またはフォアグラウンドレベル)に近いグレイスケールノイズはバックグラウンドレベル(またはフォアグラウンドレベル)に「クランピング処理」される。
【図面の簡単な説明】
【図1】分類方法の各ステップに必要な装置を示す、OCR分類システムのブロック図である。
【図2】分類方法の基本的なステップを示すフローチャートである。
【図3A】テンプレート文字「I」の2値のテンプレート画素画像を示す図である。
【図3B】1画素幅の単純な遷移グラウンドによるテンプレート文字「I」のグレイスケールのテンプレート画素画像を示す図である。
【図3C】多様な幅を持つ複合遷移グラウンドによるテンプレート文字「I」のグレイスケールのテンプレート画素画像を示す図である。
【図3D】ノイズの遷移グラウンドによる入力文字「I」のグレイスケールの入力画素画像を示す図である。
【図4】コントラストレベルにより分類された画素画像における画素を示し、クランピングレベル及びクランピング処理範囲を示す分類チャートである。
【符号の説明】
上記の図中、各参照番号の最初の数字はその要素が図示される図面の番号を示している。2番目の数字は関連する構成要素を示している。最後の文字は要素のサブ部分を示している。
Claims (14)
- 分類済みの複数のテンプレート画像で構成されるライブラリを用いて、未分類の入力画像を分類する分類工程を有するOCR方法であって、
前記ライブラリを構成する前記テンプレート画像のエレメントは、各エレメントのコントラストレベルに基づいて、バックグラウンドか、フォアグラウンドか、前記バックグラウンドと前記フォアグラウンドとの間の遷移グラウンドかのいずれかに属するエレメントとして構成され、
前記入力画像のエレメントのコントラストレベルに基づいて、バックグラウンド信号レベルと、フォアグラウンド信号レベルとを決定し、
前記入力画像のエレメントを、各エレメントのコントラストレベルと前記決定されたバックグラウンド信号レベルとフォアグラウンド信号レベルとに基づいて、バックグラウンドか、フォアグラウンドか、前記バックグラウンドと前記フォアグラウンドとの間の遷移グラウンドかのいずれかに属するエレメントとして識別し、
前記分類工程では、前記入力画像のバックグラウンドエレメントとフォアグラウンドエレメントと遷移グラウンドエレメントとを、前記ライブラリのテンプレート画像のバックグラウンドエレメントとフォアグラウンドエレメントと遷移グラウンドエレメントと比較することにより、前記入力画像が前記分類済みのテンプレート画像のいずれに属するか分類することを特徴とするOCR方法。 - 前記入力画像と前記テンプレート画像とを比較して分類する際、前記入力画像と前記テンプレート画像とをエレメント単位で比較し、そのエレメント比較を合計して前記入力画像を分類する距離関数分類を用いることを特徴とする請求項1に記載のOCR方法。
- 新たに入力されたテンプレート画像に応じて学習データベースとして発展させた前記ライブラリを用いて、前記入力画像を分類するニューラルネットワーク分類を用いることを特徴とする請求項1に記載のOCR方法。
- 前記入力画像のエレメントを、バックグラウンドか、フォアグラウンドか、前記バックグラウンドと前記フォアグラウンドとの間の遷移グラウンドかのいずれかに属するエレメントとして識別する処理は、当該決定されたバックグラウンド信号レベルとフォアグラウンド信号レベルとに基づいて、バックグラウンド・クランピング処理範囲とフォアグラウンド・クランピング処理範囲とを定め、各エレメントのコントラストレベルと当該定めたバックグラウンド・クランピング処理範囲とフォアグラウンド・クランピング処理範囲とに基づいて、実行されることを特徴とする請求項1に記載のOCR方法。
- 前記バックグラウンド・クランピング処理範囲は、前記バックグラウンド信号レベルより高い反射率を有するコントラストレベル値を含むことを特徴とする請求項4に記載のOCR方法。
- 前記バックグラウンド・クランピング処理範囲は、前記バックグラウンド信号レベルから所定の近接範囲内のコントラストレベル値を含むことを特徴とする請求項4に記載のOCR方法。
- 前記バックグラウンド・クランピング処理範囲内のコントラストレベル値を有する前記入力画像のエレメントを、前記バックグラウンド信号レベルの値にクランプすることにより、バックグラウンドノイズを除去することを特徴とする請求項4に記載のOCR方法。
- 前記入力画像を構成する各エレメントのコントラストレベル数値は、最小限度値と最大限度値の間の値であり、前記バックグラウンド信号レベルは前記限度値の一方に近い数値であって、前記フォアグラウンド信号レベルは前記限度値の他の一方に近い数値であることを特徴とする請求項1に記載のOCR方法。
- 前記フォアグラウンド・クランピング処理範囲は、前記フォアグラウンド信号レベルより高い吸収率を有するコントラストレベル値を含むことを特徴とする請求項4に記載のOCR方法。
- 前記フォアグラウンド・クランピング処理範囲は、前記フォアグラウンド信号レベルから所定の近接範囲内のコントラストレベル値を含むことを特徴とする請求項4に記載のOCR方法。
- 前記フォアグラウンド・クランピング処理範囲内のコントラストレベル値を有する前記入力画像のエレメントを、前記フォアグラウンド信号レベルの値にクランプすることにより、フォアグラウンドノイズを除去することを特徴とする請求項4に記載のOCR方法。
- 前記分類工程の前に、前記入力画像のエレメントをコントラストレベル数値の順序に従って区分けする工程をさらに備えることを特徴とする請求項1に記載のOCR方法。
- 前記分類工程の前に、前記テンプレート画像のエレメントをコントラストレベル数値の順序に従って区分けする工程をさらに備えることを特徴とする請求項1に記載のOCR方法。
- 分類済みの複数のテンプレート画像で構成されるライブラリを用いて、未分類の入力画像を分類する分類手段を有するOCRシステムであって、
前記ライブラリを構成する前記テンプレート画像のエレメントは、各エレメントのコントラストレベルに基づいて、バックグラウンドか、フォアグラウンドか、前記バックグラウンドと前記フォアグラウンドとの間の遷移グラウンドかのいずれかに属するエレメントとして構成され、
前記入力画像のエレメントのコントラストレベルに基づいて、バックグラウンド信号レベルと、フォアグラウンド信号レベルとを決定し、
前記入力画像のエレメントを、各エレメントのコントラストレベルと前記決定したバックグラウンド信号レベルとフォアグラウンド信号レベルとに基づいて、バックグラウンドか、フォアグラウンドか、前記バックグラウンドと前記フォアグラウンドとの間の遷移グラウンドかのいずれかに属するエレメントとして識別し、
前記分類手段は、前記入力画像のバックグラウンドエレメントとフォアグラウンドエレメントと遷移グラウンドエレメントとを、前記ライブラリのテンプレート画像のバックグラウンドエレメントとフォアグラウンドエレメントと遷移グラウンドエレメントとを比較することにより、前記入力画像が前記分類済みのテンプレート画像のいずれに属するか分類することを特徴とするOCRシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11213393A | 1993-08-26 | 1993-08-26 | |
US08/112133 | 1993-08-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07192092A JPH07192092A (ja) | 1995-07-28 |
JP3554033B2 true JP3554033B2 (ja) | 2004-08-11 |
Family
ID=22342278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20174694A Expired - Fee Related JP3554033B2 (ja) | 1993-08-26 | 1994-08-26 | Ocr方法およびocrシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US5781659A (ja) |
EP (1) | EP0640934B1 (ja) |
JP (1) | JP3554033B2 (ja) |
DE (1) | DE69410191T2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69635101T2 (de) | 1995-11-01 | 2006-06-01 | Canon K.K. | Verfahren zur Extraktion von Gegenständen und dieses Verfahren verwendendes Bildaufnahmegerät |
EP0777375A3 (en) * | 1995-12-05 | 1998-10-14 | Canon Kabushiki Kaisha | Method of and apparatus for network distribution of record data using transmittal symbols hand entered on a transmittal sheet |
US5719960A (en) * | 1996-06-26 | 1998-02-17 | Canon Kabushiki Kaisha | System for dispatching task orders into a user network and method |
US6081621A (en) * | 1996-10-01 | 2000-06-27 | Canon Kabushiki Kaisha | Positioning templates in optical character recognition systems |
US6738526B1 (en) * | 1999-07-30 | 2004-05-18 | Microsoft Corporation | Method and apparatus for filtering and caching data representing images |
WO2001009736A1 (en) * | 1999-07-30 | 2001-02-08 | Microsoft Corporation | Adjusting character dimensions to compensate for low contrast character features |
US6750986B1 (en) | 2000-03-27 | 2004-06-15 | Destiny Technology Corporation | Color image processing method with thin-line detection and enhancement |
US6778296B1 (en) | 2000-03-27 | 2004-08-17 | Destiny Technology Corporation | Color imaging processing method with boundary detection and enhancement |
IL162878A0 (en) * | 2004-07-06 | 2005-11-20 | Hi Tech Solutions Ltd | Multi-level neural network based characters identification method and system |
CN100354876C (zh) * | 2005-04-13 | 2007-12-12 | 佳能株式会社 | 增强字符行图像的方法和设备 |
KR20150003573A (ko) * | 2013-07-01 | 2015-01-09 | 한국전자통신연구원 | 영상 패턴 검출 방법 및 그 장치 |
US11800056B2 (en) | 2021-02-11 | 2023-10-24 | Logitech Europe S.A. | Smart webcam system |
US11800048B2 (en) | 2021-02-24 | 2023-10-24 | Logitech Europe S.A. | Image generating system with background replacement or modification capabilities |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55157799A (en) * | 1979-05-29 | 1980-12-08 | Nippon Electric Co | High efficiency pattern matching unit |
JPS59790A (ja) * | 1982-06-28 | 1984-01-05 | Fuji Electric Co Ltd | パタ−ン識別装置 |
US4672678A (en) * | 1984-06-25 | 1987-06-09 | Fujitsu Limited | Pattern recognition apparatus |
GB2173026B (en) * | 1985-03-25 | 1988-07-13 | Mcdonald Richard Albert | Real time video pattern recognition |
JPH0821065B2 (ja) * | 1989-03-13 | 1996-03-04 | シャープ株式会社 | 文字認識装置 |
JP2940933B2 (ja) * | 1989-05-20 | 1999-08-25 | 株式会社リコー | パターン認識方式 |
EP0463242B1 (en) * | 1990-06-29 | 1996-09-04 | Koninklijke Philips Electronics N.V. | Method of processing pattern data on the basis of ranked amplitude values, apparatus for performing the method |
US5212741A (en) * | 1992-01-21 | 1993-05-18 | Eastman Kodak Company | Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition |
-
1994
- 1994-08-25 EP EP94306281A patent/EP0640934B1/en not_active Expired - Lifetime
- 1994-08-25 DE DE69410191T patent/DE69410191T2/de not_active Expired - Lifetime
- 1994-08-26 JP JP20174694A patent/JP3554033B2/ja not_active Expired - Fee Related
-
1997
- 1997-02-04 US US08/794,964 patent/US5781659A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0640934B1 (en) | 1998-05-13 |
DE69410191T2 (de) | 1998-09-24 |
US5781659A (en) | 1998-07-14 |
JPH07192092A (ja) | 1995-07-28 |
DE69410191D1 (de) | 1998-06-18 |
EP0640934A2 (en) | 1995-03-01 |
EP0640934A3 (en) | 1995-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69308905T2 (de) | Verarbeiten von mit Punktmatrix- oder Tintenstrahlkopf gedrucktem Text für optische Zeichenerkennung | |
US6160913A (en) | Method and apparatus for digital halftone dots detection and removal in business documents | |
EP1668886B1 (en) | Statistical self-calibrating detection and removal of blemishes in digital images | |
JP3554033B2 (ja) | Ocr方法およびocrシステム | |
JPH09503329A (ja) | 文書中の前景情報を背景情報から分離する方法 | |
US7411699B2 (en) | Method and apparatus to enhance digital image quality | |
JP4471062B2 (ja) | 適合画像強調フィルター及び強調画像データの生成方法 | |
US11233921B2 (en) | Image processing apparatus that specifies edge pixel in target image using single-component image data | |
EP1014691B1 (en) | An image processing system for reducing vertically disposed patterns on images produced by scanning | |
US4850029A (en) | Adaptive threshold circuit for image processing | |
EP0500174B1 (en) | Image processing method and scan/print system for performing the method | |
EP1382004A2 (en) | Method and apparatus for text detection | |
US4575768A (en) | Conversion to a two-valued video signal | |
US5768414A (en) | Separation of touching characters in optical character recognition | |
EP0660257B1 (en) | Automatic threshold determination for a digital scanner | |
DE69933808T2 (de) | Bildverarbeitungsvorrichtung, -verfahren und Speichermedium | |
EP0403226B1 (en) | Method and apparatus for generating a binary representation of an image | |
JP3073837B2 (ja) | 画像領域分離装置及び画像領域分離方法 | |
US7280253B2 (en) | System for identifying low-frequency halftone screens in image data | |
JP2004201303A (ja) | セグメンテーション・ベースのハーフトーニング | |
Solihin et al. | Noise and background removal from handwriting images | |
EP0468730A2 (en) | A method of performing binary quantization of an image | |
JPS62147860A (ja) | 中間調フアクシミリ信号処理方式 | |
NL8901555A (nl) | Werkwijze en inrichting voor beeldsegmentatie. | |
KR100467565B1 (ko) | 화상 시스템의 국부 이치화 방법. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040506 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090514 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100514 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100514 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110514 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120514 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120514 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |