JPH07192092A - Ocr分類方法 - Google Patents
Ocr分類方法Info
- Publication number
- JPH07192092A JPH07192092A JP6201746A JP20174694A JPH07192092A JP H07192092 A JPH07192092 A JP H07192092A JP 6201746 A JP6201746 A JP 6201746A JP 20174694 A JP20174694 A JP 20174694A JP H07192092 A JPH07192092 A JP H07192092A
- Authority
- JP
- Japan
- Prior art keywords
- foreground
- background
- clamping
- range
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 239000013598 vector Substances 0.000 claims abstract description 116
- 230000007704 transition Effects 0.000 claims abstract description 69
- 230000008569 process Effects 0.000 claims description 46
- 230000008859 change Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 5
- 230000000750 progressive effect Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000005520 cutting process Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 description 10
- 230000003287 optical effect Effects 0.000 description 6
- 239000002245 particle Substances 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000000049 pigment Substances 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
データ並びに遷移グラウンドのグレイスケールデータと
を用いるOCR分類方法を提供する。 【構成】 各テンプレートエレメントは画像のバックグ
ラウンド16B、フォアグラウンド16F、あるいはそ
の中間の遷移グラウンドの一部である。入力ベクトル
は、テンプレートベクトルと同様に、エレメントのシー
ケンスの形を取っている。しかし、入力ベクトルでは、
エレメントは未分類記号の画像内の記号を限定する画像
コントラストレベル信号成分とグレイスケールノイズ成
分を表している。各入力エレメントもバックグラウン
ド、フォアグラウンド、遷移グラウンドの一部である。
入力ベクトルとT個のテンプレートベクトルの少なくと
も1つは分類装置18に入力される。入力ベクトルは、
バックグラウンド、フォアグラウンド、遷移グラウンド
に基づいて分類される。
Description
ブラリを参照した入力画像のOCR分類に関し、より詳
しくは、バックグラウンドデータ、フォアグラウンドデ
ータ(2値信号)と共に、遷移グラウンドデータ(グレ
イスケール信号)を用いて行なうOCR分類に関する。
ンプレート画像は、その下部にあるデータのグレイスケ
ール情報を除去するためにディジタル化されてきた。そ
の結果ディジタル化された2値の入力及びテンプレート
画像は、処理すべきデータ量の少ない「簡潔な」画像と
なる。一般にこうした先行技術のシステムは、メモリ容
量が限定されているため今日の基準にすると処理速度が
遅く、また、グレイスケールは信号ではなく、ノイズと
して扱われていた。
ル信号(遷移グラウンドデータ)と共にグレイスケール
ノイズが除去される。遷移グラウンドデータは、バック
グラウンド領域とフォアグラウンド領域の間の画像内の
エッジに沿ってコントラストが変化する細い領域であ
る。遷移グラウンド信号レベルはバックグラウンドレベ
ルからフォアグラウンドレベルへと前進的に変化する。
遷移グラウンドは、グレイスケールノイズのように、画
像の非2値情報部分を形成するものであるが、ディジタ
ル化の間に失われる。
り、分類処理はより高度な相関係数を提供することがで
きるようになった。グレイスケールノイズは、一般に、
同一文字に関して分類が反復して行なわれると再現不能
であり、入力シンボルがテンプレートと適切に一致する
のを妨げるものであった。不都合なことに、こうした従
来の2値システムの分類結果は、遷移グラウンド信号が
消失するがために「扱いにくい」ものとなった。相関係
数は、入力シンボルとそれと一致するテンプレートとの
例えば「ハミング」距離のような適切な距離基準に基づ
いていた。距離と、結果として得られた相関係数は、同
一の印刷画像に対し分類を繰り返すと均一なものとはな
らなくなってしまう。
ックグラウンドとフォアグラウンドの2値データ並びに
遷移グラウンドのグレイスケールデータとを用いるOC
R分類方法を提供することを目的とする。さらに本発明
は、同一入力シンボルを分類する場合において相関係数
の変動がより少ない「安定した」分類結果が得られるO
CR分類方法を提供することを他の目的とする。
せるOCR分類方法を提供することを他の目的とする。
さらに本発明は、バックグラウンドレベル(またはフォ
アグラウンドレベル)を越えるグレイスケールノイズを
バックグラウンドレベル(またはフォアグラウンドレベ
ル)に「クランプする」OCR分類方法を提供すること
を他の目的とする。
(またはフォアグラウンドレベル)に近いグレイスケー
ルノイズをバックグラウンドレベル(またはフォアグラ
ウンドレベル)に「クランプする」OCR分類方法を提
供することを他の目的とする。さらに本発明は、バック
グラウンドレベル(またはフォアグラウンドレベル)
が、バックグラウンドコントラストレベル(またはフォ
アグラウンドコントラストレベル)の限界レベルから所
定のレベルだけ変化するようなOCR分類方法を提供す
ることを他の目的とする。
れらの目的及びさらに他の目的は、分類済みの文字のT
個のテンプレート画像ベクトルのライブラリに対して未
分類のシンボルの入力画像ベクトルを分類するOCR方
法を提供することにより達成される。各テンプレートベ
クトルは、エレメントのシーケンスの形を取っており、
各エレメントはそのテンプレートベクトルにより定義さ
れる分類済みの文字内のエレメントの画像コントラスト
レベルを表す数値を有している。テンプレートエレメン
トはバックグラウンド領域、フォアグラウンド領域、ま
たは画像内におけるバックグラウンドコントラストレベ
ルからフォアグラウンドレベルへの前進的な変化により
生じる、バックグラウンド及びフォアグラウンドの間の
遷移グラウンド領域からのものである。入力ベクトルも
未分類シンボルの画像内のシンボルを規定する画像コン
トラストレベル信号成分を表す数値を有している。
イズ成分である。入力エレメントもまた、文字画像のバ
ックグラウンドまたはフォアグラウンド、あるいはバッ
クグラウンド及びフォアグラウンドの間の画像遷移グラ
ウンドからのものである。入力ベクトルと、T個のテン
プレートベクトルの少なくとも1つが分類装置に入力さ
れる。すると、入力ベクトルのバックグラウンド、フォ
アグラウンド、遷移グラウンドを、入力されたT個のベ
クトルのバックグラウンド、フォアグラウンド、遷移グ
ラウンドと比較することにより、入力ベクトルが、入力
されたテンプレートベクトルに対して分類される。さら
に、入力ベクトルのエレメントは、所定のバックグラウ
ンド・クランピング処理範囲内の数値を有するエレメン
トとして識別してもよい。その場合識別された各エレメ
ントの数値は所定のバックグラウンド・クランピング処
理数値へクランピング処理される。
テンプレート画像ベクトルのライブラリを用いて未分類
シンボルの入力画像ベクトルを分類するためのOCRシ
ステム10を図1に示す。画像ベクトルは、一般にビッ
トマップメモリ(図3A〜図3Dを参照)に格納される
画素画像の数学的形式を取る。ベクトルの各エレメント
はビットマップの画素の画像強度(コントラストレベ
ル)を表している。根底的な分類方法の基本的なステッ
プが図2にリスト表記される通りであり、下記に詳細に
説明する。
るステップである。テンプレートベクトルは、イメージ
スキャナ12Sによって対応する文字の画像のセットを
スキャンすることにより生成して画素画像をテンプレー
トメモリ14T に形成する。各テンプレートベクトル
は多量な(恐らく数千の)基本的な文字サンプルの統計
学的な合成物である。サンプル個体群のベースはある範
囲の基本的な文字のフォントを含んでいる。または、各
テンプレートベクトルを、手入力や選択した座標位置で
ディジタルデータを削除してモデルテンプレートを作成
することによって、画素画像としてテンプレートメモリ
に直接作成することができる。各テンプレートベクトル
はエレメントのシーケンスの形を取り、各エレメントは
そのテンプレートベクトルによって定義された分類済み
の文字内の画素の画像コントラストレベルを表す数値を
有している。各エレメントは、 a:文字画像の大部分を形成する画像バックグラウンド
領域、または、 b:文字画像の中間量部分を形成する画像フォアグラウ
ンド領域、または、 c:文字画像の小量部分を形成する、バックグラウンド
とフォアグラウンドの間の画像遷移グラウンド領域、の
いずれかの部分である。遷移グラウンドは、スキャンの
間に画像内の各立ち上がりエッジが遭遇する(遷移グラ
ウンドの項参照)ときの、バックグラウンドコントラス
トレベルからフォアグラウンドコントラストレベルへの
前進的な変化の結果である。遷移グラウンドは、各立ち
下がりエッジにそってバックグラウンドコントラストレ
ベルからフォアグラウンドコントラストレベルへ漸進的
に変化する。
である。入力ベクトルは、入力文書10D上の未分類の
入力文字10Cの印刷画像をイメージスキャナ12Sに
よりスキャンして生成しメモリ14Iへ格納することが
できる。入力ベクトルは、テンプレートベクトルと同様
に、エレメントのシーケンスの形を取っており、各エレ
メントは数値を有している。しかし、入力ベクトルにお
いては、数値は、未分類シンボルの画像内においてその
シンボルを定める画像コントラストレベル信号成分と、
グレイスケールノイズ成分とを表している。各エレメン
トは、 a:文字画像の大部分を形成する画像バックグラウンド
領域、 b:文字画像の中間量部分を形成する画像フォアグラウ
ンド領域、 c:文字画像の小量部分を形成する、バックグラウンド
とフォアグラウンドの間の画像遷移グラウンド領域、の
いずれかの部分である。
ートメモリからT個のテンプレートベクトルの少なくと
も1つを、分類装置18へ入力するステップである。ス
テップS10 入力ベクトルのバックグラウンド、フォアグラウンド、
遷移グラウンドを、入力された上記のテンプレートベク
トルのバックグラウンド、フォアグラウンド、遷移グラ
ウンドと比較することにより、入力ベクトルを入力され
たテンプレートベクトルに従って分類する。入力ベクト
ルとテンプレートベクトルとに遷移グラウンドが存在す
ることにより、同一の入力シンボルを反復して分類して
も、それらの相関係数がより均一な安定した分類ものと
なる結果が得られる。尚、分類装置18は、入力ベクト
ルと入力された各テンプレートベクトルとをエレメント
単位で比較する距離関数分類装置でもよい。あるいは、
分類装置は、入力されたテンプレートベクトルに応じて
学習データベースを発展させて入力ベクトルの分類を行
なうようなニューラルネットワークを用いた分類装置で
もよい。
3D)〉従来の白/黒印刷の文字画像では、バックグラ
ウンド領域は文字周辺の白紙部分に当たり、フォアグラ
ウンド領域は文字を形成している堆積したインク部分に
当たっている。遷移グラウンド領域はバックグラウンド
とフォアグラウンドの間の文字のエッジ境界である。遷
移グラウンドは、2値画像を生成するために印刷画像の
ディジタル化を行なう間に失われてしまう。2値ビット
マップ30A(図3Aの文字「I」参照)の2値画素画
像32Aにおいては、遷移グラウンドが存在せずに、バ
ックグラウンド領域とフォアグラウンド領域の間でコン
トラストの顕著な変化が見られる。
遷移グラウンドは、フォアグラウンドの周りのコントラ
ストが変化する画素からなる光輪である。遷移グラウン
ドの信号レベルはバックグラウンドレベルからフォアグ
ラウンドレベルへと前進的に変化する。遷移グラウンド
は2値画像においてはグレイスケールエッジ効果であ
る。各テンプレートのフォアグラウンド周囲の遷移グラ
ウンドは、グレイスケールノイズが存在しないためにノ
イズが無く明確である。ビットマップ30B(図3Bの
文字「I」参照)のテンプレート画素画像32Bは、フ
ォアグラウンド全体の周囲に1画素幅の縦方向の遷移グ
ラウンド34Bと横方向の遷移グラウンド36Bとを有
している。遷移グラウンドの各画素は隣接するバックグ
ラウンドレベルとフォアグラウンドレベルの間のコント
ラストレベルを有している。
00(白)で、フォアグラウンドコントラストレベルが1.
00(黒)であるビットマップの実施例では、遷移グラウ
ンドのコントラストレベルは好ましくは0.50である。入
力印刷画像のライブラリは列毎にスキャンされて、テン
プレートビットマップのライブラリにおける対応する画
素画像が提供される。コントラストレベルは、各文字ス
トロークの立ち上がりエッジを越えて、白(バックグラ
ウンド)から黒(フォアグラウンド)へ増加し、立ち下
がりエッジを越えて、黒から白へ減少する。遷移グラウ
ンドは一般に同一画像を反復してスキャンしても再現可
能であり、グレイスケール信号の形を取るデータを表し
ている。
像をスキャンする間に拡がり、より広い遷移グラウンド
比率の画素画像が生成される。画像の量子化の効果によ
り、その画像の各エッジに沿って1画素幅の遷移グラウ
ンドが形成される。量子化効果は、無限解像度の連続す
る印刷画像を特定の解像度の画素画像へ変換する際に生
じる誤差の「丸め」に関係している。スキャナのフォト
センサ列(またはマトリックス)は特定のフォトダイオ
ードのサイズと間隔とを有しており、同様に用紙に対す
る特定のスキャンラスタ率を有している。縦方向の遷移
グラウンドは用紙送り(またはスキャナヘッドの送り)
方向に対して垂直であり、ダイオードのサイズ及び間隔
による量子化効果により、スキャンの間に拡張される。
横方向の遷移グラウンドは用紙送り方向に沿っており、
ララスタ率の量子化効果によりスキャンの間に拡張され
る。
ることによっても同様に遷移グラウンドを拡張する。各
ダイオードセンサはごく小さい集光レンズを有している
が、レンズは印刷画像と相対的に合焦点から僅かにずれ
て位置しているため、得られる光学画像は合焦の質が低
いものとなっている。印刷画像の細い遷移グラウンドは
ビットマップではより広い複数画素の遷移グラウンドと
なる。印刷画像の僅かなぼけは光学的ローパスフィルタ
として機能し、光学画像の低空間周波数成分により形成
される大規模な画像構造のみを保存する。より高い空間
周波数成分により形成される光学画像のより繊細な部分
はぼけ部分に紛れる。好ましくは、光学合焦の質が損失
しても、画素画像の上記ビットマップにおけるモアレパ
ターンや不都合な「エリアジング」効果を防ぐことに十
分である。
持つ遷移グラウンドを供給することもできる。ビットマ
ップ30C(図3Cの文字「I」参照)のテンプレート
画素画像32Cは、3画素幅の縦方向の遷移グラウンド
34Cと、2画素(列)幅の横方向の遷移グラウンド3
6Cとを有している。縦方向の遷移グラウンドの3画素
のコントラストレベルは段階別に分かれている。例え
ば、白バックグラウンド=0.00で、黒フォアグラウンド
=1.00の実施例では、各段階は0.00〜0.25〜0.50〜0.75
〜1.00である。つまり、バックグラウンドに隣接する縦
方向の遷移グラウンド画素は0.25のコントラストレベル
を有し、フォアグラウンドに隣接する縦方向の遷移グラ
ウンド画素は0.75のコントラストレベルを有している。
中間の縦方向の遷移グラウンド画素は0.50のコントラス
トレベルを有している。同様に、横方向の遷移グラウン
ドの2画素のコントラストレベルも段階別になってい
る。バックグラウンド域領域に隣接する横方向の遷移グ
ラウンド画素は0.33のコントラストレベルを有し、フォ
アグラウンド領域に隣接する横方向の遷移グラウンド画
素は0.66のコントラストレベルを有している。
ビットマップは遷移グラウンド画素にランダムなコント
ラストレベルを導入させるグレイスケールノイズを含ん
でいる。ビットマップ30D(図3Dの文字「I」参
照)は不均一な縦方向の遷移グラウンド34Dと横方向
の遷移グラウンド36Dとを有している。 〈グレイスケールノイズ〉初期のグレイスケールのノイ
ズ源は、文書上でテキスト領域内に混じっている異物
(汚れ、しみ、糸くず等)によるグレイスケールであ
る。用紙グレイスケールはパルプ粒子やその他の紙の不
揃いな要素により生じる。トナーグレイスケール(黒ノ
イズ)は個々のトナー粒子の面やその他の表面効果によ
り生じる。インクが散逸すると画像に隣接する白バック
グラウンド領域において「トナーはね」や胡椒状のノイ
ズとなる。インクが過剰だとトナーはねを起こす。イン
クが不足していると、インク欠乏により黒フォアグラウ
ンド領域において「トナー抜け」即ち白抜けとなる。
キャナの動作ノイズや不均一な用紙送りなど機械的動作
に起因する。電子的グレイスケールは熱電子ノイズや暗
電流により生じる。これらの、及びその他の効果による
生じるグレイスケールは信号ではなくノイズである。グ
レイスケールノイズの低減あるいは除去により分類プロ
セスが強化される。
実施例(図4)〉バックグラウンド・クランピング(cla
mping)処理(とフォアグラウンド・クランピング処理、
尚、フォアグラウンド・クランピング処理の項参照)で
は、入力文字とマッチングテンプレート間の相関係数を
増やす(距離を減らす)ために、あるタイプのグレイス
ケールノイズをグレイスケール画素画像(またはグレイ
スケールベクトル)のバックグラウンド領域から除去す
る処理を行なう。グレイスケールノイズの除去により、
マッチング入力とテンプレートとの比較が促進される。
しかし、不一致状態においてはランダム効果が起こる。
バックグラウンド・クランピング処理(及びフォアグラ
ウンド・クランピング処理)は、特に、スキャナから直
接読み取ったままの「ノイズ的」データにより形成され
ている入力ベクトルに有効である。テンプレートベクト
ルは「簡潔な」処理済みデータにより形成され、含まれ
るグレイスケールノイズの量は遙に少ない。データが手
動入力されるようなモデルテンプレートは理想的な条件
で作成され、グレイスケールはゼロである。バックグラ
ウンド・クランピング処理を行なうためには、分類ステ
ップの前に実行されるべき付加的なステップが必要であ
る。バックグラウンド・クランピング処理の各ステップ
は図2に一般分類ステップと共にリスト表記されてお
り、下記に説明する。
値を有する入力ベクトル(またはテンプレートベクト
ル)を識別するステップである。入力文字(またはテン
プレート文字)を定める各エレメントは、その文字の画
素画像内の画素を表している。
クグラウンド・クランピング処理のための所定の数値レ
ベルへクランプするステップである。好ましくは、クラ
ンピング処理のためのこの所定レベルは上述の所定範囲
内のレベルである。尚、バックグラウンド・クランピン
グ処理のこのレベルは、入力ベクトルのバックグラウン
ドエレメントの数値のコントラストレベル信号成分によ
り決定される一般バックグラウンド信号レベルとしても
よい。
グ処理 その一般バックグラウンド信号レベルを越えた各バック
グラウンドエレメントの数値部分は、そのバックグラウ
ンドエレメントのグレイスケールノイズ成分のハイパー
・バックグラウンドノイズ副成分を定める。薄い地色の
紙や年月が経って色が褪せた紙などの低減された反射率
を持つ用紙は、100%(完全な白を0.00と、完全な黒
を1.00とした場合)に近い反射率を持つ用紙より僅かに
高いバックグラウンド信号レベルを生じる。光を反射す
る糸くず、油じみ、透かし模様(watermarks)等は紙より
反射率が高く、より低い信号レベルを生じて、ハイパー
・グレイスケールノイズを生むことになる。ハイパー・
クランピング処理の実施例では、バックグラウンド・ク
ランピング処理の上記の範囲は上記のハイパー・バック
グラウンドノイズ副成分により決定される数値の範囲で
ある。ハイパー・バックグラウンド範囲に亘ってクラン
ピング処理を行なって、その全体範囲を上記一般バック
グラウンド信号レベルにクランプすることにより、ハイ
パー・バックグラウンドノイズを除去する。
することとハイパー・クランピング処理の効果とが、ス
キャンされて得た入力画素画像を分類したグラフ40に
示されている(図4参照)。各画素(X軸)は、ディジ
タルのコントラストレベル(Y軸)により分類されて、
左へ向かって白バックグラウンド領域42Bを形成する
最低レベルと、右へ向かって黒フォアグラウンド領域4
2Fを形成する最高レベルを有する。バックグラウンド
とフォアグラウンド間の遷移グラウンド領域42Tはグ
ラフの中央で急激に上昇する領域である。遷移グラウン
ドはスキャンにより拡張されたものであり(遷移グラウ
ンドの項参照)、縦方向及び横方向のグレイスケール遷
移画素を有している。
す)は破線で示す部分である。対応する一般フォアグラ
ウンドレベル(Gfgで示す)も同様に破線で示される、
一般フォアグラウンドレベルについてはフォアグラウン
ドの項で詳細に説明する。バックグラウンド領域とフォ
アグラウンド領域が左から右へ向かって緩やかに上昇す
るのは、光を反射しているバックグラウンドにおける不
均一な反射率と暗いフォアグラウンドにおける不均一な
光の吸収率のせいである。さらに他の上昇の原因は、画
素画像におけるコントラストレベルを定めるために、画
像強度で表された印刷画像のグレイスケールを量子化す
ることにより生じる画素丸め誤差である。尚、説明の便
宜上、図4における上昇ステップの高さは誇張されたも
のとなっている。図4の実施例ではハイパー・バックグ
ラウンドの範囲は(Hbgで示す)一般バックグラウンド
レベルから最高反射率(0.00)レベルにまで亘ってい
る。紙よりも反射率の高い印刷画像中領域からのバック
グラウンド画素の全てに一般バックグラウンドコントラ
ストレベルが割り当てられる。
理〉一般バックグラウンド信号レベルに近い各エレメン
トの数値部分は、そのエレメントのグレイスケールノイ
ズ成分の近接バックグラウンドノイズ副成分を定める。
バックグラウンドの反射率の僅かな変化は、紙の粒子、
スキャン照射における歪み、丸め誤差により生じたもの
である。薄い色の付いた埃やしみ等小量の光を吸収する
異物は、バックグラウンドよりも少しだけ少ない量の光
しか反射しない。これらのバックグラウンドからの僅か
な変動がグレイスケールノイズである。近接クランピン
グ処理の実施例では、バックグラウンド・クランピング
処理範囲は上記の近接バックグラウンドノイズ副成分に
より決定される数値の範囲である。その近接範囲全体を
一般バックグラウンド信号レベルにクランプすることに
より近接バックグラウンド範囲のクランピング処理を行
なうことが、近接バックグラウンドノイズを除去するこ
とができる。図4の実施例における近接バックグラウン
ド範囲(Nbgで示す)は一般バックグラウンドレベルの
両側に渡っている。用紙よりも僅かに反射率が高いまた
は低い領域からのバックグラウンド画素の全てが一般バ
ックグラウンドコントラストレベルを割り当てられる。
画素画像のグレイスケールノイズを減らすために、バッ
クグラウンド・クランピング処理範囲はハイパー・バッ
クグラウンド・クランピング処理範囲Hbgと、近接バッ
クグラウンド・クランピング処理範囲Nbgの両方を含ん
でいる。
実施例(図4)〉フォアグラウンド・クランピング処理
は、相関係数を向上させるために行なわれるもので、グ
レイスケール画素画像(またはグレイスケールベクト
ル)のフォアグラウンド領域からあるタイプのグレイス
ケールノイズを除去することであり、バックグラウンド
・クランピング処理と大変よく似ている。フォアグラウ
ンド・クランピング処理ステップ画、図2に、一般の分
類ステップとバックグラウンド・クランピング処理ステ
ップと共に示されている通りであり、下記に詳細に説明
する。
を有する入力ベクトル(またはテンプレートベクトル)
のフォアグラウンドエレメントを識別するためのステッ
プである。入力文字(またはテンプレート文字)を規定
するベクトルの各エレメントは、その文字の画素画像内
の画素を表す。
ックグラウンド・クランピング処理用の所定の数値レベ
ルにクランプするステップである。尚、このフォアグラ
ウンド・クランピングレベルは入力ベクトルのフォアグ
ラウンドエレメントの数値のコントラスト信号成分によ
り決定される一般フォアグラウンド信号レベルでもよ
い。
グ処理 一般フォアグラウンド信号レベルを越える各フォアグラ
ウンドエレメントの数値部分は、そのエレメントのグレ
イスケールノイズ成分のハイパー・フォアグラウンドノ
イズの副成分を定める。トナーより吸収率の高い暗色の
粒子やしみは、より高い信号レベルを生じて、ハイパー
・グレイスケールノイズとなる。ハイパー・クランピン
グ処理の実施例では、フォアグラウンド・クランピング
処理のための範囲はハイパー・フォアグラウンドノイズ
の上記の副成分により決定される数値の範囲である。ハ
イパー・フォアグラウンドの全範囲を一般フォアグラウ
ンド信号レベルにクランプすることによりハイパー・フ
ォアグラウンド範囲のクランピング処理を行なうこと
が、ハイパー・フォアグラウンドノイズを除去すること
ができる。
す)は破線で示される通りである。図4の実施例におけ
るハイパー・フォアグラウンド範囲(Hfgで示す)は、
一般フォアグラウンドレベルから最小反射率(=最高吸
収率−1.00)のレベルに渡っている。印刷画像における
トナーより高い吸収率を持つ領域の画素の全てが一般フ
ォアグラウンドコントラストレベルを割り当てられる。
数値部分は近接フォアグラウンドノイズの副成分を定め
る。フォアグラウンドの反射率の僅かな変化はスキャン
された文書上のトナー(またはインク)状態の不均一性
から来るものである。100%に近い光の吸収率を持つ
トナー粒子は、薄い色のトナーや年月が経って色褪せた
トナー等吸収率が低なったトナーより僅かに高いフォア
グラウンド信号レベルを生じる。新しいトナーや極く黒
いトナーは、古いトナーに対し近接一般フォアグラウン
ドノイズとなる。オフィスのコピー機やインクジェット
プリンタが故障すると不均一なトナー濃度を産み出す。
インパクトプリンタのリボンが経年変化すると、正しく
リボン送りがされなかったりして、タイプが薄くなった
り濃くなったりする。
アグラウンド・クランピング処理の範囲は近接フォアグ
ラウンドノイズ副成分により決定される数値の範囲であ
る。その近接フォアグラウンド範囲のクランピング処理
を行なって、全近接範囲を一般フォアグラウンド信号レ
ベルにクランプすることにより、近接フォアグラウンド
ノイズを除去することができる。図4の実施例における
近接フォアグラウンド範囲は(Nfgで示す)一般フォア
グラウンドレベルの両側に渡っている。用紙よりも僅か
に高いまたは僅かに低い光りの反射率を持つ領域からの
フォアグラウンド画素の全てが一般フォアグラウンドコ
ントラストレベルを割り当てられる。
さらに減らすために、フォアグラウンド・クランピング
処理の範囲はハイパー・フォアグラウンド・クランピン
グ処理範囲Hfgと近接フォアグラウンド・クランピング
処理範囲Nfgの両方を含んでいてもよい。さらに、クラ
ンピング処理方法はバックグラウンド・クランピング処
理(ハイパー・及び/または近接)とフォアグラウンド
・クランピング処理(ハイパー・及び/または近接)の
両方を同一の画素画像に対して行なうものでもよい。
ンド及びフォアグラウンドのクランピングレベルは、ク
ランピング比較器16B、16F等の適切なクランピン
グ処理装置のバックグラウンドレベルポートVbgとフォ
アグラウンドレベルポートVfgに入力される。バックグ
ラウンド及びフォアグラウンド・クランピング処理の範
囲はバックグラウンド範囲ポートRbgとフォアグラウン
ド範囲ポートRfgに入力される。画素画像の各画素のコ
トラストレベルは上記クランピング処理範囲と比較され
る。いずれかのクランピング処理範囲内にあるコントラ
ストレベルは適当なクランピングレベルにセットされ
る。
ンプレート画像)の一般レベルでも、あるいは必要に応
じてその他のレベルにしてもよい。バックグラウンド及
びフォアグラウンドの夫々の一般レベルは画素濃度対コ
ントラストレベルのグレイスケール分析により決定する
ことができる。画像画素の分布は、白バックグラウンド
一般レベルを規定する低い方のピークと黒フォアグラウ
ンド一般レベルを規定する高い方のピークを有する2モ
ード状である。あるいは、クランピングレベルは所定の
レベルにセットしてもよい。例えば、単純な256レベ
ルの実施例では、白バックグラウンドレベルを最低強度
の上の50のコントラストレベルにセットし、黒フォア
グラウンドレベルを最高強度の下の50のコントラスト
レベルにセットしてもよい。
ゼロにセットすることにより、特定のクランピングレベ
ルより高速な分類サイクルを達成できる。もし乗算の乗
数または被乗数がゼロならば、その積はゼロである。従
って、ゼロにクランプされたバックグラウンド画素を含
む分類関数により得られる積の全てを、実際にその乗算
を行なわずにゼロにセットすることができる。各乗算を
省略することによって、数マイクロ秒処理時間を節約す
ることができる。大部分の分類関数は各画素に対して2
つか3つの乗算を含んでいる。用いられる画素数は画素
画像の解像度に依存している。一般に使用される最低の
解像度は2400画素(60×40画素)で、クランピ
ング処理ステップを通じてゼロになるバックグラウンド
画素の大半の画素に当たる。より高い解像度は数十万画
素である。これらのバックグラウンドの乗算を省くこと
により分類処理の速度を上げることができる。フォアグ
ラウンド・クランピングレベルを整数値にセットする
と、同様に速度の向上が達成できる。積の乗数が1な
ら、積は被乗数とおなじ値である。従って、1にセット
されたフォアグラウンド画素を含む積の全てを、実際に
乗算を行なわずに1にセットすることができる。
ンド(グレイスケール信号)の損失を最小にしながらグ
レイスケールノイズを最大限に除去するために望ましい
ように選択することができる。残念ながら、近接バック
グラウンド・クランピング処理範囲が幅広くなって、一
般バックグラウンドレベルのちょうど上にある最低グレ
イスケール信号をいくつか含むことがある。同様に、近
接フォアグラウンド・クランピング処理範囲が広くなっ
て、一般フォアグラウンドレベルのちょうど下にある最
上グレイスケール信号を含むことがある。より狭い幅の
クランピング処理幅では含まれるグレイスケール信号は
それほど多くはない。しかし、それほど多くのグレイス
ケールノイズを除去することはできない。クランピング
処理範囲を選択する際に考慮される点としてはクランピ
ング処理後の画素画像の信号対ノイズ比がある。クラン
ピング処理後に残った画素画像はクランピング処理前よ
りも高い信号/ノイズ比を持つべきである。クランピン
グ処理において排除された画素情報のセグメントは主に
ノイズを含み、クランピング処理前より低い信号/ノイ
ズ比を持っている。
グラウンドよりも多くのグレイスケールノイズを含んで
いる。従ってバックグラウンド・クランピング処理はフ
ォアグラウンド・クランピング処理よりも効果的に入力
テンプレートマッチングを促進する。バックグラウンド
の領域は、通常フォアグラウンドの数倍である。つま
り、印刷ページは大部分が白く間隔をあけて黒い文字が
配置されている。従ってバックグラウンド・クランピン
グ処理は画素画像においてより多くの画素に影響する。
さらに、ノイズの原因の大半は少なくともいくらか光を
吸収する顔料や色等の異物を含んでいる。ほこりやしみ
が「真白」であることはまず有り得ない。この顔料の優
勢が、黒フォアグラウンドよりも大きく白バックグラウ
ンドに影響する。
この画素分類のフローチャートでは、入力ベクトルのコ
トラストレベル信号成分の各エレメントの数値は最小限
度値と最大限度値の間の値である。バックグラウンドエ
レメントの数値はいずれか一方の限度値に近い値であ
り、フォアグラウンドエレメントの数値は他の一方の限
度値に近い値である。図4の実施例では、最小限度値は
0.00で最大限度値は1.00である。バックグラウンドは白
として示され最小限度値により近くなっている。しか
し、様々な標準化や修正手順により、他の限度値も使用
することができる。そして、バックグラウンドは明色や
暗色や、限度値のいずれかに近い色にすることができ
る。バックグラウンドレベルはいずれかの限度値にする
ことができる。
ンド一般レベルとフォアグラウンド一般レベルはテンプ
レート画像の一般レベルと同一である。一般レベルは、
入力画素一般レベルをテンプレート画素一般レベルと同
一のコントラストレベルに設定するためのスキャナゲイ
ンコントロール12Gを調整する等、適切な修正ステッ
プにより標準化できる。一般レベルを標準化することに
より、分類結果の分析を向上させる相関係数も標準化で
きる。分類方法は関連の次のステップ(ステップS3を
含んでもよい。
般バックグラウンドレベルを同一の一般バックグラウン
ドレベルにセットし、入力ベクトル及び入力されたテン
プレートベクトルの一般フォアグラウンドレベルを同一
の一般フォアグラウンドレベルにセットするステップで
ある。
般レベルと同一のレベルにセットすることができる。あ
るいは、テンプレート一般レベルは入力一般レベルと同
一のレベルにセットしてもよい。好ましくは、入力画像
の一般レベルはテンプレート画像と同一のレベルに調整
される。入力画像の一般バックグラウンドレベルをセッ
トするためのスキャナゲインを調整することにより、ス
キャナ光源の照度変化や印刷画像の用紙の色落ち等の効
果を無効にできる。同様に、入力画像の一般フォアグラ
ウンドレベルを調整することにより、色褪せしたトナー
や色が変化したトナーによる影響を無効にできる。
となるように、コントラストレベルの順に入力文字(及
びテンプレート文字)の画素を分類する次の関連ステッ
プを含んでいる。ステップS4 分類ステップの前に入力ベクトル(及びテンプレートベ
クトル)のエレメントを数値の順に区分けするステップ
である。
ではノイズと丸め誤差がより少なくなる。区分けされた
シーケンスにおいて同一のコントラストレベルを有する
画素の全てが隣接し、距離関数の計算において一般の乗
数を持つグループを形成する。乗算ステップは各グルー
プに対し同一の乗数を持ち、新しい乗数を入力すること
なくグループ全体の処理を行なう。
共、グレイスケールを除去して相関係数を増強するため
にクランピング処理される。好ましくは、入力クランピ
ング処理範囲及びクランピングレベルはテンプレートク
ランピング処理範囲及びクランピングレベルと同一であ
る。つまり、所定のテンプレートクランピング処理範囲
は所定の入力クランピング処理範囲に一致し、所定のテ
ンプレートクランピングレベルは所定の入力クランピン
グレベルに一致している。
の概念から逸脱しない程度で様々な変形が可能である。
さらに、様々な図に示した実施例の特徴は他の図示によ
る実施例を用いても利用が可能である。従って、本発明
の範囲は下記の請求項の語句及びその法的適用範囲によ
り規定される。
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明は、システム或は装置
にプログラムを供給することによって達成される場合に
も適用できることはいうまでもない。
グラウンド及びフォアグラウンド2値データ、遷移グラ
ウンドグレイスケールデータを用いるOCR分類方法を
提供することによって本発明の目的が達成されることは
当業者には明らかである。OCR方法は同一の入力シン
ボルの分類間の相関係数における変化がより少なく、画
像信号の損失が最少程度の、「安定した」分類結果を出
すことができる。バックグラウンドレベル(またはフォ
アグラウンドレベル)を越えるグレイスケールノイズは
バックグラウンドレベル(またはフォアグラウンドレベ
ル)に「クランプ」され、ノイズを減少させる。さら
に、バックグラウンドレベル(またはフォアグラウンド
レベル)に近いグレイスケールノイズはバックグラウン
ドレベル(またはフォアグラウンドレベル)に「クラン
ピング処理」される。
CR分類システムのブロック図である。
ートである。
ト画素画像を示す図である。
プレート文字「I」のグレイスケールのテンプレート画
素画像を示す図である。
ンプレート文字「I」のグレイスケールのテンプレート
画素画像を示す図である。
「I」のグレイスケールの入力画素画像を示す図であ
る。
における画素を示し、クランピングレベル及びクランピ
ング処理範囲を示す分類チャートである。
される図面の番号を示している。2番目の数字は関連す
る構成要素を示している。最後の文字は要素のサブ部分
を示している。
Claims (34)
- 【請求項1】 分類済み文字のT個のテンプレート画像
ベクトルのライブラリを用いて未分類シンボルの入力画
像ベクトルを分類するOCR方法であって、 各々がエレメントのシーケンスの形を取る未分類文字の
T個のテンプレート画像ベクトルであって、各エレメン
トは前記テンプレートベクトルにより規定される分類済
み文字内のエレメントの画像コントラストレベルを表す
数値を有しており、また各エレメントは文字画像の大部
分を形成する画像バックグラウンドか、その文字画像の
中間量部分を形成する画像フォアグラウンドか、あるい
はバックグラウンドコントラストレベルからフォアグラ
ウンドコントラストレベルへの前進的な変化により生じ
る、バックグラウンドとフォアグラウンドの間の、その
文字画像の小量部分を形成する遷移グラウンドのいずれ
かよりのエレメントであるような、未分類文字の前記T
個のテンプレート画像ベクトルのライブラリを提供し、 エレメントのシーケンスの形を取る未分類シンボルであ
って、各エレメントは前記未分類シンボルの画像内で前
記シンボルを規定する画像コントラストレベル信号成分
とグレイスケールノイズ成分とを表す数値を有してお
り、また各エレメントは文字画像の大部分を形成する画
像バックグラウンドからか、その文字画像の中間量部分
を形成する画像フォアグラウンドからか、あるいはバッ
クグラウンドコントラストレベルからフォアグラウンド
コントラストレベルへの前進的な変化により生じる、バ
ックグラウンドとフォアグラウンドの間の、その文字画
像の小量部分を形成する遷移グラウンドからのいずれか
であるような、前記未分類シンボルの入力画像ベクトル
を提供し、 前記入力ベクトルと、前記T個のテンプレートベクトル
の少なくとも1つとを分類手段へ入力し、 前記入力ベクトルのバックグラウンドとフォアグラウン
ドと遷移グラウンドとを、前記入力されたテンプレート
ベクトルのバックグラウンドとフォアグラウンドと遷移
グラウンドと比較することにより、前記入力されたT個
のテンプレートベクトルを基準にして前記入力ベクトル
を分類することを特徴とするOCR分類方法。 - 【請求項2】 前記分類手段は、前記入力されたテンプ
レートベクトルの各々と前記入力ベクトルとをエレメン
ト単位で比較し、そのエレメント比較を合計して前記入
力ベクトルを分類するところの距離関数分類装置である
ことを特徴とする請求項1に記載のOCR分類方法。 - 【請求項3】 前記分類手段は、前記入力されたテンプ
レートベクトルに応じて学習データベースを発展させて
前記入力ベクトルを分類するところのニューラルネット
ワーク分類装置であることを特徴とする請求項2に記載
のOCR分類方法。 - 【請求項4】 前記分類工程の前において、さらに所定
のバックグラウンド・クランピング処理範囲内の数値を
有する前記入力ベクトルのエレメントを識別し、 識別された各エレメントの数値を所定のバックグラウン
ド・クランピング数値にクランプすることを特徴とする
請求項1に記載のOCR分類方法。 - 【請求項5】 前記所定のクランピングレベルは前記所
定のクランピング処理範囲内にあることを特徴とする請
求項4に記載のOCR分類方法。 - 【請求項6】 前記バックグラウンド・クランピングレ
ベルは、入力ベクトルのバックグラウンドエレメントの
数値のコトラストレベル信号成分により決定される一般
バックグラウンド信号レベルであり、前記一般バックグ
ラウンド信号レベルを越える各バックグラウンドエレメ
ントの数値の一部は、そのエレメントのグレイスケール
ノイズ成分のハイパー・バックグラウンドノイズの副成
分を規定しており、前記バックグラウンド・クランピン
グ処理範囲は前記ハイパー・バックグラウンドノイズ副
成分により決定されるハイパー・バックグラウンド・ク
ランピング処理範囲であって、前記ハイパー・バックグ
ラウンド範囲のクランピング処理を行ない、前記ハイパ
ー・バックグラウンド範囲を前記一般バックグラウンド
信号レベルにクランプすることにより前記ハイパー・バ
ックグラウンドノイズを除去することを特徴とする請求
項4に記載のOCR分類方法。 - 【請求項7】 前記一般バックグラウンド信号レベルに
近い各エレメントの数値の一部はそのエレメントのグレ
イスケールノイズ成分の近接バックグラウンドノイズ副
成分を規定しており、前記バックグラウンド・クランピ
ング処理範囲は前記ハイパー・バックグラウンド・クラ
ンピング処理範囲に、前記近接バックグラウンドノイズ
副成分により決定される近接バックグラウンド・クラン
ピング処理範囲を付加した範囲であって、前記近接バッ
クグラウンド範囲と共に前記ハイパー・バックグラウン
ド範囲のクランピング処理を行ない、前記ハイパー・バ
ックグラウンド範囲と前記近接バックグラウンド範囲を
前記一般バックグラウンド信号レベルにクランプするこ
とによって、ハイパー・バックグラウンドノイズと前記
近接バックグラウンドノイズを除去することを特徴とす
る請求項6に記載のOCR分類方法。 - 【請求項8】 前記バックグラウンド・クランピングレ
ベルは、前記入力ベクトルのバックグラウンドエレメン
トの数値の前記コントラストレベル信号成分により決定
される一般バックグラウンド信号レベルであり、前記一
般バックグラウンド信号レベルに近い各エレメントの数
値の一部はそのエレメントのグレイスケールノイズ成分
の近接バックグラウンドノイズ副成分を規定しており、
前記バックグラウンド・クランピング処理範囲は、前記
近接バックグラウンドノイズ副成分により決定される近
接バックグラウンド・クランピング処理範囲であって、
前記近接バックグラウンド範囲のクランピング処理を行
ない、前記近接バックグラウンド範囲を一般バックグラ
ウンド信号レベルにクランプすることにより、前記近接
バックグラウンドノイズを除去することを特徴とする請
求項4に記載のOCR分類方法。 - 【請求項9】 前記入力ベクトルのコントラストレベル
信号成分の各エレメントの数値は、最小限度値と最大限
度値の間の値であり、前記バックグラウンドエレメント
の数値は前記限度値の一方により近い数値であって、前
記フォアグラウンドエレメントの数値は前記限度値の他
の一方により近い数値であることを特徴とする請求項4
に記載のOCR分類方法。 - 【請求項10】 前記バックグラウンド・クランピング
レベルは前記最小限度値に近いことを特徴とする請求項
9に記載のOCR分類方法。 - 【請求項11】 前記バックグラウンド・クランピング
レベルは0.00であることを特徴とする請求項9に記載の
OCR分類方法。 - 【請求項12】 前記バックグラウンド・クランピング
レベルは前記限度値に遠い所定の数のコントラストレベ
ルであることを特徴とする請求項9に記載のOCR分類
方法。 - 【請求項13】 前記分類ステップの前において、さら
に所定のバックグラウンド・クランピング処理範囲内の
数値を有する前記入力ベクトルのエレメントを識別し、 識別された各エレメントの数値を所定のバックグラウン
ド・クランピング処理数値にクランプすることを特徴と
する請求項1に記載のOCR分類方法。 - 【請求項14】 前記フォアグラウンド・クランピング
レベルは、前記入力ベクトルのフォアグラウンドエレメ
ントの数値のコントラストレベル信号成分により決定さ
れる一般フォアグラウンド信号レベルであって、前記一
般フォアグラウンド信号レベルを越える各フォアグラウ
ンドエレメントの数値の一部はそのエレメントのグレイ
スケールノイズ成分のハイパー・フォアグラウンドノイ
ズ副成分を規定しており、前記フォアグラウンド・クラ
ンピング処理範囲は、前記ハイパー・フォアグラウンド
ノイズ副成分により決定されるハイパー・フォアグラウ
ンド・クランピング処理範囲であって、前記ハイパー・
フォアグラウンド範囲のクランピング処理を行ない、前
記ハイパー・フォアグラウンド範囲を前記一般フォアグ
ラウンド信号レベルにクランプすることにより、前記ハ
イパー・フォアグラウンドノイズを除去することを特徴
とする請求項13に記載のOCR分類方法。 - 【請求項15】 前記前記一般フォアグラウンド信号レ
ベルに近い各エレメントの数値の一部はそのエレメント
のグレイスケールノイズ成分の近接フォアグラウンドノ
イズ副成分を規定しており、前記フォアグラウンド・ク
ランピング処理範囲は前記ハイパー・フォアグラウンド
・クランピング処理範囲に、前記近接フォアグラウンド
ノイズ副成分により決定される近接フォアグラウンド・
クランピング処理範囲を付加した範囲であって、前記近
接フォアグラウンド範囲と共に前記ハイパー・フォアグ
ラウンド範囲のクランピング処理を行ない、前記ハイパ
ー・フォアグラウンド範囲と前記近接フォアグラウンド
範囲を前記一般フォアグラウンド信号レベルにクランプ
することによって、ハイパー・フォアグラウンドノイズ
と前記近接フォアグラウンドノイズを除去することを特
徴とする請求項14に記載のOCR分類方法。 - 【請求項16】 前記フォアグラウンド・クランピング
レベルは、前記入力ベクトルのフォアグラウンドエレメ
ントの数値の前記コントラストレベル信号成分により決
定される一般フォアグラウンド信号レベルであり、前記
一般フォアグラウンド信号レベルに近い各エレメントの
数値の一部はそのエレメントのグレイスケールノイズ成
分の近接フォアグラウンドノイズ副成分を規定してお
り、前記フォアグラウンド・クランピング処理範囲は、
前記近接フォアグラウンドノイズ副成分により決定され
る近接フォアグラウンド・クランピング処理範囲であっ
て、前記近接フォアグラウンド範囲のクランピング処理
を行ない、前記近接フォアグラウンド範囲を一般フォア
グラウンド信号レベルにクランプすることにより、前記
近接フォアグラウンドノイズを除去することを特徴とす
る請求項13に記載のOCR分類方法。 - 【請求項17】 前記入力ベクトルのコントラストレベ
ル信号成分の各エレメントの数値は、最小限度値と最大
限度値の間の値であり、前記バックグラウンドエレメン
トの数値は前記限度値の一方により近い数値であって、
前記フォアグラウンドエレメントの数値は前記限度値の
他の一方により近い数値であることを特徴とする請求項
13に記載のOCR分類方法。 - 【請求項18】 前記フォアグラウンド・クランピング
レベルは前記最小限度値に近いことを特徴とする請求項
17に記載のOCR分類方法。 - 【請求項19】 前記フォアグラウンド・クランピング
レベルは0.00であることを特徴とする請求項17に記載
のOCR分類方法。 - 【請求項20】 前記フォアグラウンド・クランピング
レベルは前記限度値に遠い所定の数のコントラストレベ
ルであることを特徴とする請求項17に記載のOCR分
類方法。 - 【請求項21】 前記分類ステップの前において、さら
に、 所定のバックグラウンド・クランピング処理範囲内の数
値を有する前記入力ベクトルのエレメントを識別し、 識別された各エレメントの数値を前記所定のバックグラ
ウンド・クランピング処理範囲内の所定のバックグラウ
ンド・クランピング処理数値にクランプし、 所定のフォアグラウンド・クランピング処理範囲内の数
値を有する前記入力ベクトルのエレメントを識別し、 識別された各エレメントの数値を前記所定のフォアグラ
ウンド・クランピング処理範囲内の所定のフォアグラウ
ンド・クランピング処理数値にクランプすることを特徴
とする請求項1に記載のOCR分類方法。 - 【請求項22】 前記バックグラウンド・クランピング
レベルは、入力ベクトルのバックグラウンドエレメント
の数値のコトラストレベル信号成分により決定される一
般のバックグラウンド信号レベルであり、前記一般バッ
クグラウンド信号レベルを越える各バックグラウンドエ
レメントの数値部分は、そのエレメントのグレイスケー
ルノイズ成分のハイパー・バックグラウンドノイズの副
成分を規定しており、前記バックグラウンド・クランピ
ング処理範囲は前記ハイパー・バックグラウンドノイズ
副成分により決定されるハイパー・バックグラウンド・
クランピング処理範囲であって、前記ハイパー・バック
グラウンド範囲のクランピング処理を行ない、前記ハイ
パー・バックグラウンド範囲を前記一般バックグラウン
ド信号レベルにクランプすることにより前記ハイパー・
バックグラウンドノイズを除去することを特徴とする請
求項21に記載のOCR分類方法。 - 【請求項23】 前記一般バックグラウンド信号レベル
に近い各エレメントの数値の一部はそのエレメントのグ
レイスケールノイズ成分の近接バックグラウンドノイズ
副成分を規定しており、前記バックグラウンド・クラン
ピング処理範囲は前記ハイパー・バックグラウンド・ク
ランピング処理範囲に、前記近接バックグラウンドノイ
ズ副成分により決定される近接バックグラウンド・クラ
ンピング処理範囲を付加した範囲であって、前記近接バ
ックグラウンド範囲と共に前記ハイパー・バックグラウ
ンド範囲のクランピング処理を行ない、前記ハイパー・
バックグラウンド範囲と前記近接バックグラウンド範囲
を前記一般バックグラウンド信号レベルにクランプする
ことによって、ハイパー・バックグラウンドノイズと前
記近接バックグラウンドノイズを除去することを特徴と
する請求項22に記載のOCR分類方法。 - 【請求項24】 前記バックグラウンド・クランピング
レベルは、前記入力ベクトルのバックグラウンドエレメ
ントの数値の前記コントラストレベル信号成分により決
定される一般バックグラウンド信号レベルであり、前記
一般バックグラウンド信号レベルに近い各エレメントの
数値の一部はそのエレメントのグレイスケールノイズ成
分の近接バックグラウンドノイズ副成分を規定してお
り、前記バックグラウンド・クランピング処理範囲は、
前記近接バックグラウンドノイズ副成分により決定され
る近接バックグラウンド・クランピング処理範囲であっ
て、前記近接バックグラウンド範囲のクランピング処理
を行ない、前記近接バックグラウンド範囲を一般バック
グラウンド信号レベルにクランプすることにより、前記
近接バックグラウンドノイズを除去することを特徴とす
る請求項21に記載のOCR分類方法。 - 【請求項25】 前記フォアグラウンド・クランピング
レベルは、前記入力ベクトルのフォアグラウンドエレメ
ントの数値のコントラストレベル信号成分により決定さ
れる一般フォアグラウンド信号レベルであって、前記一
般フォアグラウンド信号レベルを越える各フォアグラウ
ンドエレメントの数値の一部はそのエレメントのグレイ
スケールノイズ成分のハイパー・フォアグラウンドノイ
ズ副成分を規定しており、前記フォアグラウンド・クラ
ンピング処理範囲は、前記ハイパー・フォアグラウンド
ノイズ副成分により決定されるハイパー・フォアグラウ
ンド・クランピング処理範囲であって、前記ハイパー・
フォアグラウンド範囲のクランピング処理を行ない、前
記ハイパー・フォアグラウンド範囲を前記一般フォアグ
ラウンド信号レベルにクランプすることにより、前記ハ
イパー・フォアグラウンドノイズを除去することを特徴
とする請求項21に記載のOCR分類方法。 - 【請求項26】 前記前記一般フォアグラウンド信号レ
ベルに近い各エレメントの数値の一部はそのエレメント
のグレイスケールノイズ成分の近接フォアグラウンドノ
イズ副成分を規定しており、前記フォアグラウンド・ク
ランピング処理範囲は前記ハイパー・フォアグラウンド
・クランピング処理範囲に、前記近接フォアグラウンド
ノイズ副成分により決定される近接フォアグラウンド・
クランピング処理範囲を付加した範囲であって、前記近
接フォアグラウンド範囲と共に前記ハイパー・フォアグ
ラウンド範囲のクランピング処理を行ない、前記ハイパ
ー・フォアグラウンド範囲と前記近接フォアグラウンド
範囲を前記一般フォアグラウンド信号レベルにクランプ
することによって、ハイパー・フォアグラウンドノイズ
と前記近接フォアグラウンドノイズを除去することを特
徴とする請求項25に記載のOCR分類方法。 - 【請求項27】 前記フォアグラウンド・クランピング
レベルは、前記入力ベクトルのフォアグラウンドエレメ
ントの数値の前記コントラストレベル信号成分により決
定される一般フォアグラウンド信号レベルであり、前記
一般フォアグラウンド信号レベルに近い各エレメントの
数値の一部はそのエレメントのグレイスケールノイズ成
分の近接フォアグラウンドノイズ副成分を規定してお
り、前記フォアグラウンド・クランピング処理範囲は、
前記近接フォアグラウンドノイズ副成分により決定され
る近接フォアグラウンド・クランピング処理範囲であっ
て、前記近接フォアグラウンド範囲のクランピング処理
を行ない、前記近接フォアグラウンド範囲を一般フォア
グラウンド信号レベルにクランプすることにより、前記
近接フォアグラウンドノイズを除去することを特徴とす
る請求項21に記載のOCR分類方法。 - 【請求項28】 前記分類ステップの前において、さら
に、 所定の入力クランピング処理範囲内の数値を有する前記
入力ベクトルのエレメントを識別し、 識別された入力エレメントの各数値を所定の入力クラン
ピング処理数値にクランプし、 所定のテンプレートクランピング処理範囲内の数値を有
する前記テンプレートベクトルのエレメントを識別し、 識別された各テンプレートエレメントの数値を前記所定
のテンプレートクランピング処理数値にクランプするこ
とを特徴とする請求項1に記載のOCR分類方法。 - 【請求項29】 前記所定のテンプレートクランピング
処理範囲は、前記所定の入力クランピング処理範囲に一
致しており、前記所定のテンプレートクランピングレベ
ルは前記所定の入力クランピングレベルに一致している
ことを特徴とする請求項28に記載のOCR分類方法。 - 【請求項30】 前記分類ステップの前に、前記入力ベ
クトルを数値の順序に従って区分けするステップをさら
に備えることを特徴とする請求項1に記載のOCR分類
方法。 - 【請求項31】 前記入力ベクトル区分けステップの後
に、前記テンプレートベクトルを数値の順序に従って区
分けするステップをさらに備えることを特徴とする請求
項30に記載のOCR分類方法。 - 【請求項32】 前記入力ベクトルのバックグラウンド
エレメントの数値は一般バックグラウンド入力信号レベ
ルを限定し、前記入力ベクトルのフォアグラウンドエレ
メントの数値は一般フォアグラウンド入力信号レベルを
限定し、前記入力されたテンプレートベクトルのバック
グラウンドエレメントの数値は一般バックグラウンドテ
ンプレート信号レベルを限定し、前記入力されたテンプ
レートベクトルのフォアグラウンドエレメントの数値は
一般フォアグラウンドテンプレート信号レベルを規定す
ることを特徴とする請求項1に記載のOCR分類方法。 - 【請求項33】 前記分類ステップの前において、さら
に、 前記入力ベクトルと前記入力されたテンプレートベクト
ルの一般バックグラウンド信号レベルを同一の一般バッ
クグラウンド信号レベルに設定し、 前記入力ベクトルと前記入力されたテンプレートベクト
ルの一般フォアグラウンド信号レベルを同一の一般フォ
アグラウンド信号レベルに設定することを特徴とする請
求項32に記載のOCR分類方法。 - 【請求項34】 前記分類ステップの前において、さら
に、 前記入力ベクトルの一般バックグラウンド信号レベルを
前記入力されたテンプレートベクトルの一般バックグラ
ウンド信号レベルに設定し、 前記入力ベクトルの一般フォアグラウンド信号レベルを
前記入力されたテンプレートベクトルの一般バックグラ
ウンド信号レベルに設定することを特徴とする請求項3
2に記載のOCR分類方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11213393A | 1993-08-26 | 1993-08-26 | |
US08/112133 | 1993-08-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07192092A true JPH07192092A (ja) | 1995-07-28 |
JP3554033B2 JP3554033B2 (ja) | 2004-08-11 |
Family
ID=22342278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20174694A Expired - Fee Related JP3554033B2 (ja) | 1993-08-26 | 1994-08-26 | Ocr方法およびocrシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US5781659A (ja) |
EP (1) | EP0640934B1 (ja) |
JP (1) | JP3554033B2 (ja) |
DE (1) | DE69410191T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100354876C (zh) * | 2005-04-13 | 2007-12-12 | 佳能株式会社 | 增强字符行图像的方法和设备 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69635101T2 (de) | 1995-11-01 | 2006-06-01 | Canon K.K. | Verfahren zur Extraktion von Gegenständen und dieses Verfahren verwendendes Bildaufnahmegerät |
EP0777375A3 (en) * | 1995-12-05 | 1998-10-14 | Canon Kabushiki Kaisha | Method of and apparatus for network distribution of record data using transmittal symbols hand entered on a transmittal sheet |
US5719960A (en) * | 1996-06-26 | 1998-02-17 | Canon Kabushiki Kaisha | System for dispatching task orders into a user network and method |
US6081621A (en) * | 1996-10-01 | 2000-06-27 | Canon Kabushiki Kaisha | Positioning templates in optical character recognition systems |
US6738526B1 (en) * | 1999-07-30 | 2004-05-18 | Microsoft Corporation | Method and apparatus for filtering and caching data representing images |
WO2001009736A1 (en) * | 1999-07-30 | 2001-02-08 | Microsoft Corporation | Adjusting character dimensions to compensate for low contrast character features |
US6750986B1 (en) | 2000-03-27 | 2004-06-15 | Destiny Technology Corporation | Color image processing method with thin-line detection and enhancement |
US6778296B1 (en) | 2000-03-27 | 2004-08-17 | Destiny Technology Corporation | Color imaging processing method with boundary detection and enhancement |
IL162878A0 (en) * | 2004-07-06 | 2005-11-20 | Hi Tech Solutions Ltd | Multi-level neural network based characters identification method and system |
KR20150003573A (ko) * | 2013-07-01 | 2015-01-09 | 한국전자통신연구원 | 영상 패턴 검출 방법 및 그 장치 |
US11800056B2 (en) | 2021-02-11 | 2023-10-24 | Logitech Europe S.A. | Smart webcam system |
US11800048B2 (en) | 2021-02-24 | 2023-10-24 | Logitech Europe S.A. | Image generating system with background replacement or modification capabilities |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55157799A (en) * | 1979-05-29 | 1980-12-08 | Nippon Electric Co | High efficiency pattern matching unit |
JPS59790A (ja) * | 1982-06-28 | 1984-01-05 | Fuji Electric Co Ltd | パタ−ン識別装置 |
US4672678A (en) * | 1984-06-25 | 1987-06-09 | Fujitsu Limited | Pattern recognition apparatus |
GB2173026B (en) * | 1985-03-25 | 1988-07-13 | Mcdonald Richard Albert | Real time video pattern recognition |
JPH0821065B2 (ja) * | 1989-03-13 | 1996-03-04 | シャープ株式会社 | 文字認識装置 |
JP2940933B2 (ja) * | 1989-05-20 | 1999-08-25 | 株式会社リコー | パターン認識方式 |
EP0463242B1 (en) * | 1990-06-29 | 1996-09-04 | Koninklijke Philips Electronics N.V. | Method of processing pattern data on the basis of ranked amplitude values, apparatus for performing the method |
US5212741A (en) * | 1992-01-21 | 1993-05-18 | Eastman Kodak Company | Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition |
-
1994
- 1994-08-25 EP EP94306281A patent/EP0640934B1/en not_active Expired - Lifetime
- 1994-08-25 DE DE69410191T patent/DE69410191T2/de not_active Expired - Lifetime
- 1994-08-26 JP JP20174694A patent/JP3554033B2/ja not_active Expired - Fee Related
-
1997
- 1997-02-04 US US08/794,964 patent/US5781659A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100354876C (zh) * | 2005-04-13 | 2007-12-12 | 佳能株式会社 | 增强字符行图像的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
EP0640934B1 (en) | 1998-05-13 |
DE69410191T2 (de) | 1998-09-24 |
JP3554033B2 (ja) | 2004-08-11 |
US5781659A (en) | 1998-07-14 |
DE69410191D1 (de) | 1998-06-18 |
EP0640934A2 (en) | 1995-03-01 |
EP0640934A3 (en) | 1995-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69308905T2 (de) | Verarbeiten von mit Punktmatrix- oder Tintenstrahlkopf gedrucktem Text für optische Zeichenerkennung | |
US6064762A (en) | System and method for separating foreground information from background information on a document | |
US6522791B2 (en) | Dynamic user interface with scanned image improvement assist | |
US7411699B2 (en) | Method and apparatus to enhance digital image quality | |
DE69026159T2 (de) | Bildverarbeitungsgerät | |
US6606420B1 (en) | Method and apparatus for digital image darkness control in saturated image structures | |
JP4471062B2 (ja) | 適合画像強調フィルター及び強調画像データの生成方法 | |
JP3554033B2 (ja) | Ocr方法およびocrシステム | |
EP0500174B1 (en) | Image processing method and scan/print system for performing the method | |
EP1382004A2 (en) | Method and apparatus for text detection | |
US6775031B1 (en) | Apparatus and method for processing images, image reading and image forming apparatuses equipped with the apparatus, and storage medium carrying programmed-data for processing images | |
US5768414A (en) | Separation of touching characters in optical character recognition | |
DE69425850T2 (de) | Bildverarbeitungseinrichtung | |
US5805723A (en) | Image processing apparatus with means for adjusting image data for divided areas | |
DE69933808T2 (de) | Bildverarbeitungsvorrichtung, -verfahren und Speichermedium | |
JP4446332B2 (ja) | セグメンテーション・ベースのハーフトーニング | |
EP0403226B1 (en) | Method and apparatus for generating a binary representation of an image | |
US7280253B2 (en) | System for identifying low-frequency halftone screens in image data | |
Ventzas et al. | Digital restoration by denoising and binarization of historical manuscripts images | |
Solihin et al. | Noise and background removal from handwriting images | |
JPS62147860A (ja) | 中間調フアクシミリ信号処理方式 | |
KR100467565B1 (ko) | 화상 시스템의 국부 이치화 방법. | |
NL8901555A (nl) | Werkwijze en inrichting voor beeldsegmentatie. | |
US6310697B1 (en) | Text enhancement system | |
JP3358133B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040506 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090514 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100514 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100514 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110514 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120514 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120514 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |