JPH0562021A - 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム - Google Patents

標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム

Info

Publication number
JPH0562021A
JPH0562021A JP4020774A JP2077492A JPH0562021A JP H0562021 A JPH0562021 A JP H0562021A JP 4020774 A JP4020774 A JP 4020774A JP 2077492 A JP2077492 A JP 2077492A JP H0562021 A JPH0562021 A JP H0562021A
Authority
JP
Japan
Prior art keywords
character
pixel
template
bit
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4020774A
Other languages
English (en)
Inventor
Dennis W Golem
ダブリユー.ゴーレム デニス
Raymond L Higgins
エル.ヒギンズ レイモンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR Voyix Corp
Original Assignee
NCR Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR Corp filed Critical NCR Corp
Publication of JPH0562021A publication Critical patent/JPH0562021A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 標準フォントに加えて、規格外フォント及び
利用者指定のカスタムフォントをも認識可能とすること
で、一連の光学的認識操作を可能にする。 【構成】 スキャナーにより各文書が光学的に読み取ら
れ、複数個のグレーピクセル値が生成され、マイクロプ
ロセッサーによる制御の基でRAMに記憶される。マイ
クロプロセッサーにより記憶ピクセル値が処理され、文
書上の各文字の位置決め(位置探し)と区分けが有効に
行われる。所定のテンプレートデータに応じて、マイク
ロプロセッサーは位置決めされ、区分けされた文字が既
に定義されているものであれば認識し、未定義のもので
あればその文字を拒絶する。拒絶された文字は表示装置
上に表示され、利用者による文字の確認と識別(同定)
処理を受ける。キーボードを介して利用者により入力さ
れた(指定された)同定文字に応じて、システムはカス
タムテンプレートもしくはその拒絶文字を表す(定義し
た)パターンを生成し、カスタムプレートを将来におけ
るその文字の認識のためにメモリに記憶する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書の光学的読取及び
英数字フォントの認識システムに関し、特に利用者指定
カスタムフォントと規格外(認識許容外)文字の認識シ
ステムに関する。
【0002】
【従来の技術】現存する多くの光学式文字認識システム
では、広く使用されている馴染みのあるフォントを光学
的に読取り、認識する。これらのフォントは例えばアメ
リカンバンカーズアソシーション等の財界で標準フォン
トとして予め定義され、利用されている。
【0003】
【発明が解決しようとする課題】このようなシステムに
は、非標準フォントを認識したり規格外フォントの印刷
をどうするかを抱えた状態でとりあえず文字認識を行う
機構は設けられていない。印刷された文字が幾分規格外
フォントを含んでいる場合、一般的には文字認識は失敗
し、文字は拒絶され、従って文字認識操作は中断するこ
とになり、結果的に貴重な時間と労力の無駄になる。
【0004】また、標準文字の認識の他に、非標準(カ
スタム)文字の光学的な文字認識を可能にするシステム
は現在のところ存在していない。以上のことから、規格
外文字並びにカスタム文字を認識するための有効的で単
純な手法が要求されている。
【0005】本発明は、上述した問題点を解決するため
になされたもので、利用者により指定された規格外文字
とカスタムフォントとを認識することが可能な光学式文
字認識システムを提供することを目的とする。
【0006】
【課題を解決するための手段】上述の目的を達成するた
めに、本発明の光学式文字認識システムは、文書中に印
刷された予め定義されている文字を認識し、かつ次回の
認識操作のためにカスタムフォント、規格外文字等の未
定義文字をも定義するものであって、文書を光学的に読
取り、文字に対応する複数個のグレースケールピクセル
値を生成する手段と、予め処理プログラムと所定のデー
タとを記憶した、生成されたピクセル値を記憶するため
の記憶手段と、読取手段と記憶手段とに結合し、記憶さ
れたピクセル値を用いて文字の位置決め(位置探し)と
区分化を行い、区分け文字が予め定義された文字である
場合はその文字を認識し、未定義文字である場合はその
文字を拒絶する処理手段と、処理手段に結合し、拒絶文
字を明暗のピクセルのパターンからなる画像として表示
する表示手段と、処理手段に結合し、拒絶文字を識別
(同定)するためのデータを入力する入力手段とからな
り、処理手段は、入力されたデータに応じて、利用者に
よる指定定義文字に類似するものとして認識された読取
文字(各認識された文字は複数のピクセル位置上で明暗
どちらか一方のピクセルを有する)の数を表す文字カウ
ント値を生成する手段を有しており、さらに、各ピクセ
ル位置での文字のピクセルが暗ピクセルであった回数を
表すピクセルカウント値を各ピクセル位置で生成する手
段と、拒絶文字を定義する明暗ピクセルからなるテンプ
レートを生成し、テンプレートの各ピクセル位置は文字
カウント値に対する対応するピクセルカウント値の大き
さに依存して、明暗ピクセルのどちらか一方を有する手
段とを有したことを特徴とする。
【0007】
【作用】本発明の光学式文字認識システムでは、銀行為
替手形や銀行小切手等の文書上に記録されたE13B,
OCRA, OCRB,ファーリントン7B型フォント
等の標準フォントに加えて、規格外フォントとカスタム
フォントの認識が可能になる。標準フォントとは予め定
義された文字であり、カスタムフォント及び規格外フォ
ントとは未定義フォントのことを言う。
【0008】本発明の一実施例としてのシステムは、光
学スキャナー、マイクロプロセッサー、読みだし専用メ
モリ(ROM)、記憶プログラムと所定のテンプレート
データを有するランダムアクセスメモリ(RAM)及び
キーボードと表示装置を有する端末器からなる。
【0009】以上のように構成された本発明の光学式文
字認識システムでは、スキャナーにより各文書が光学的
に読み取られ、複数個のグレーピクセル値が生成され、
マイクロプロセッサーによる制御の下でRAMに記憶さ
れる。マイクロプロセッサーにより記憶ピクセル値が処
理され、文書上の各文字の位置決め(位置探し)と区分
けが有効に行われる。所定のテンプレートデータに応じ
て、マイクロプロセッサーは位置決めされ、区分けされ
た文字が既に定義されているものであれば認識し、未定
義のものであればその文字を拒絶する。拒絶された文字
は表示装置上に表示され、利用者による文字の確認と識
別(同定)処理を受ける。キーボードを介して利用者に
より入力された(指定された)同定文字に応じて、シス
テムはカスタムテンプレートもしくはその拒絶文字を表
す(定義した)パターンを生成し、カスタムプレートを
将来におけるその文字の認識のためにメモリに記憶す
る。
【0010】
【実施例】図1は本発明の光学式文字認識システムを示
すものである。本発明の光学式文字認識システム11
は、文書19を読み取るための光学読取装置もしくはス
キャナー13と、スキャナー13により読み取られたデ
ータを処理するためのコンピュータシステム(装置)2
1とからなる。スキャナーはCCD(電荷結合素子)1
5を内蔵したカメラと制御器17とからなり、例えば東
芝の販売するモデルTCD132Dのリニアイメージセ
ンサーシステムであってもよい。また、文書19は数字
もしくはアルファベット文字情報を記録した銀行為替手
形もしくは銀行小切手であってもよい。コンピュータシ
ステム21はマイクロプロセッサー23、読取装置とマ
イクロプロセッサーからのデータを記憶し、さらに予め
定義されたデータを記憶する、ブートプログラムを記憶
したROM(読みだし専用メモリ)25とRAM(プロ
グラムを記憶したランダムアクセスメモリ)27と、キ
ーボード28とCRT表示器30とを有する端末器29
と、前回読み取られた文書の画像ファイルのデータベー
スを有する、ディスクドライブ等の補助記憶装置31と
からなる。例えば、E13B型の文字に対して以下で詳
細に述べるような、標準文字フォントに対する様々な読
取り、処理操作機能に加え、”光学式文字認識のための
カスタムフォントの生成”で以下詳細に述べるように、
本発明のシステムでは、光学式文字認識のための利用者
指定カスタムフォントをも生成し、処理することが可能
な機能が得られている。
【0011】標準フォントの読取と認識
【0012】読取操作は文書19の右下の角から開始さ
れ、左上の角で終了する。スキャナー13による文書1
9の読取動作は、まず最初に矢印37で示されているよ
うに文書の右端の仮想走査線39に沿って下から上へ垂
直方向に行われ、続いて右端から2番目の仮想走査線4
1に沿って下から上へ垂直方向に行われ、走査が左上の
角に達するまで繰り返される。仮想走査線は互いに平行
になるように設定されている。文書19は矢印43で示
されているように連続的に左から右へ移動され、一方ス
キャナーは連続した走査線に沿って掃引されている。各
走査線の間隔はピクセルの直径に対応して(約0.01
27cmもしくは0.005インチに)設定されてい
る。
【0013】図3に文書の読取線上の文字群の例が示さ
れている。文書が走査されたとき、記録された文字を含
む文書自体を表す、スキャナーによって得られるピクセ
ル値はメモリ27に記憶される(図1参照)。各読取線
の文字は、例えば、代表的には読取線の高さに相当する
100個の行と文書の長さに相当する1200個の列
(1200個は単位インチ当り200ピクセルの6イン
チ文書に対して典型的な列数である)からなるピクセル
データアレイ(マトリックス)という形態で記憶され
る。このデータアレイ構造により、一文字(以下述べる
ような、位置決めされ、区分けされた文字)は行ピクセ
ル(例えば、文字の高さに相当する21個の行ピクセ
ル)と列ピクセル(例えば、文字の幅に対応する14個
の列ピクセル)からなるピクセルのマトリックスにより
表される。例えば図2で示される文字”3”は図4で示
されるピクセルアレイ構造により表される。各ピクセル
49は文書の一部を構成し、各々には0及至255の不
透明度もしくはグレースケール値が付与されている。暗
ピクセルは一般的に高いグレースケール値(255に近
い値)を有しており、また明ピクセルは一般的に低いグ
レースケール値(0に近い値)を有している。文書中の
文字は、一般的に明るい色の背景に比べて暗い色を用い
て通常印刷されているので、文字と背景との不透明度の
相違は容易に見分けることができる。
【0014】前述したように、これらのグレースケール
値のデータは文書の走査段階でスキャナーにより生成さ
れる。生成されたデータはシステム21による処理のた
めにメモリ27に記憶される(図1参照)。記憶プログ
ラムによる制御のもとで、システムにより記憶データ値
が調べられ、最初の文字が位置決めされ、次に第一のフ
ィールドの引き続く文字が、さらにその後他のフィール
ドの引き続く文字の位置決めが行われる。文字の位置決
めを行うに際し、システムにより文字の枠設定もしくは
境界設定(例えば、文字の分離、区分け)が行われる。
【0015】最右端の走査線39に沿って下から上へ文
書を走査し(図1及び2参照)、しかる後に右端から2
番目の走査線41に沿って下から上へ走査し、以下左上
の角に到達するまで繰り返すことで得られ記憶されたグ
レースケールデータから、以下のように各々の文字の位
置決めと枠設定(区分け)が行われる。最初に、明ピク
セルから暗ピクセルへの変化を表すグレースケール値の
立ち上がりを見つけるために記憶データを走査線に沿っ
て下から上へ垂直方向に検索する。もし例えば40(4
0という特定の値はフォントに依存している)以上の立
ち上がり差が走査方向37上の2つの近接ピクセルのグ
レースケール値間で見つかったならば、暗ピクセルが見
つかったものと見なせる。暗ピクセルに近接する(文書
の)領域は文字が発見されそうな領域と見なすことがで
きる。暗ピクセルが発見されれば、システムはこの文字
領域を調べ(例えば、暗ピクセル値に近接する記憶デー
タを調べ)暗ピクセルが文字の一部を構成するものであ
るかどうかを決定する。さらに、文書中の文字を有効に
枠設定するために十分な大きさの区分け窓(セグメント
化ウィンド)を、暗ピクセルが窓の中心に位置するよう
に設定し、文字の有無を調べる。
【0016】図5では、区分け窓53が左右端の縁
(列)55、57と最上下端の縁(行)59、61を有
するように描かれている。左右端の縁は列(左+1)6
3と(右−1)により縁取りされており、最上下端の縁
は行(最上端+1)67と(最下端−1)69により縁
取りされている。
【0017】図5及び6を参照して以下述べるように、
窓内のすべてのグレースケールピクセル値の総和(S
w)が最大になったときに文字の枠設定と位置決めがな
されたものと見なされる。窓を移動したときに総和(S
w)が増加したかどうかを確かめるために、左右端の列
55、57の各々のピクセル値の総和とそれらと境を接
する列63、65の各々のピクセル値の総和が計算され
る。同様に、最上下端59、61の各々のピクセル値の
総和とそれらと境を接する行67、69の各々のピクセ
ル値の総和が計算される。もし、例えば列63における
ピクセル値の総和が列57におけるピクセル値の総和よ
りも大きくなる場合、すなわち窓53が左方向へ一ピク
セル分移動することで列63を含み、列57を除外した
ときに窓内の総和(Sw)が増加する場合、窓は左方向
へ移動する。同様に、もし窓を一ピクセル分上方向へ移
動し、行67を窓内へ含ませ、行61を窓内から除外す
ることで窓内の総和(Sw)が増加するのならば、窓は
上方向へ移動することになる。従って、窓の縁の各行と
列のピクセル値の総和に対する、窓に隣接する(窓と境
をなす)各行と列のピクセル値の総和(蓄積カウント
値)の増減から、窓内のピクセル値の総和(Sw)を増
加するような窓の移動方向が決定される。
【0018】図6で示されているように、以下のカウン
ト値に基づいて、窓内のカウント値(総和)は左方向へ
の移動に対しては100まで増加し、また上方向への移
動に対しては170まで増加する。 (右端−1)列カウント値 = 0 右端列カウント値 = 0 左端列カウント値 = 100 (左端+1)列カウント値 = 100 (下端−1)行カウント値 = 0 下端行カウント値 = 0 上端行カウント値 = 170 (上端+1)行カウント値 = 170 従って窓は左上方向に移動することになる。窓は総和S
wを増加する方向への移動を繰り返し、4方向(左、
右、上、下)への如何なる移動でも総和Swが増加しな
い状態になったとき窓の移動操作は停止される。この段
階で、文字を窓の中心とした窓による文字の枠設定(境
界設定、区分け化)が完了したものと見なされる。以上
のことから、実質的に文字を表したピクセル値からなる
マトリックスの窓による選択(枠設定)処理が完了す
る。枠設定された文字を表すために十分な情報(暗ピク
セルのグレースケール値)が窓内にあるかどうかを確認
するために、所定の確認用しきい値(例えばグレースケ
ール値が100)を越える窓内のピクセルの総数を求
め、もし総数が例えば60(E13B型フォントに対し
て)以上となれば、文字が窓内に存在すると確認され
る。そうでなければ、窓により枠設定された対象はノイ
ズとして解釈され、次の文字の検索動作に移る。
【0019】区分け処理の後、区分けされた(枠設定)
された文字は識別(認識)操作のための準備としてスケ
ーリング処理される。認識処理段階では16−ビットワ
ードが使用されている(テンプレートの幅が16ピクセ
ル)。文字の多くは(19ピクセルの幅を有するE13
B型文字を含む)16ピクセルより幅広いので、区分け
処理の後にこれらの文字は16ビットに変換される。こ
の変換は所定の列、例えばE13B型の文字では列4、
9及び14を除去(間引き)することで行われている。
(OCRA及びOCRBフォントは単位インチ当り20
0ピクセルの割合で走査された場合は16のピクセル幅
となり、列の間引きは不要となる)。
【0020】以上は、処理操作のための準備として文字
の位置決め方法、例えば後の処理操作のために文字の文
書中の有効な位置づけと枠設定(区分化)方法について
述べたが、次に枠設定された文字の2進符号への変換
(2値化)と、文字の識別(分類/認識)を目的とする
テンプレートを用いた照合方法について述べる。
【0021】変換(2値化)処理では、枠設定された文
字の各ピクセル行上の記憶されたグレースケールピクセ
ル値が2進符号に変換される。最初に、(前述したよう
な)枠設定された文字の暗ピクセルの算術平均を求め、
基準しきい値とする。次に、グレースケールピクセル値
を基準しきい値を基準として2進符号に変換する。例え
ば、もし求められた基準しきい値が100であった場
合、以下に示される2進等値スケールを用いて、グレー
スケール値が80、120、130、90、85、7
0、110、135からなる行は、図7の8−ビットワ
ード71で示されるようなビットパターン011000
11の2進データに変換されることになる。 グレースケールピクセル値 2進等値 ≧100 1(黒) <100 0(白)
【0022】文字のこの(枠設定された文字のピクセル
行もしくはスライスを表す)2進データと他の行の2進
データが、各々が一文字に対応する複数個のテンプレー
トの各々と比較(照合)される。各テンプレートは所定
パターンの2進データを表し、異なる3つの層からなる
(ビット構造)。図7で示される3つの8−ビットワー
ド73、75、77は各層中のある8−ビット行を表し
ている。第一の層(パターンワード73に対応するビッ
トパターン層)は文字の実際の黒/白(0/1)ビット
パターンを表すものである。第二の層(ビット有効ワー
ド(BIT-SIGNIFICANCEWORD)75に対応するビット有効
層)は文字の有意並びに非有意なビット位置を識別する
ために利用される。”1”ビットは文字の大きさと形状
での多少の変化にかかわらず文字のビットパターンが不
変なものとして見なすことができる有意なビット位置を
示すものであり、また”0”ビットは文字の異なる大き
さもしくは形状に対して同一でない非有意ビット位置を
識別するために利用される。第三の層(重み付けワード
77に対応するビット重み付け層)は、どのビットが重
要なものであるか、すなわちどのビットが大きな重みを
有しているかを同定し、類似(実質的に類似した)文字
同志の識別を行うために利用されている。この第三の層
により、”1”ビットは重み付けされたビットとして、
また”0”ビットは重み付けされていないビットして指
定されることになる。 例えば、文字”O”と”U”に
対するテンプレートの第三層の最上端行の”1”ビット
は2つの文字を区別するために利用されるものであり、
また文字”Q”と”O”に対するテンプレートの第三層
の最下端行の”1”ビットは”Q”と”O”とを区別す
るために利用されている。
【0023】図7で示されるように、文字識別のために
プロセッサー23(図1)によって様々な論理操作が行
われている。(論理操作は実際上16−ビット操作によ
り行われている。しかし、簡単のために8−ビット操作
が示されている)。最初に、枠設定された文字のある行
の2進データ71とビットパターン層の対応ワード73
とで”排他的論理和”が行われ、2進データ71と所定
の補正パターン73とのミスマッチ(ずれ)パターン7
4が生成される。このミスマッチパターン74とビット
有効層の対応ワード75との論理積をとり、文字の大き
さと形状に無関係なミスマッチの程度を表したミスマッ
チワード76を生成する。しかる後に、ミスマッチワー
ド76と重み付け、例えばビット重み付け層の対応ワー
ド77との論理積をとり、重み付けされたミスマッチイ
ンジケータ78を生成する。(もし重み付けワード77
が”1”ビットを含まなかった場合は、重み付けもしく
は論理積操作が完了されていないことになる(結果がゼ
ロとなるので処理時間を節約するために)。そしてシス
テムは次の2進データの処理に移る)。
【0024】重み付け操作に引続き、2進データ71の
行に対してミスマッチカウント値(MCR)が求められ
る。この演算はプロセッサー23(図1参照)により以
下のように行われる。 MCR = MCW + (WOC X WF) ...(1) ここで、MCWはミスマッチワードに対するミスマッチ
カウント値(例えばミスマッチワード76で見つけられ
たミスマッチの数)、WOCはミスマッチインジケータ
もしくは重み付け出力カウント値(例えば、ミスマッチ
インジケータワード78で見つけられたミスマッチの
数)、並びにWFは所定の重み付け因子(例えば、E1
3B型文字に対しては整数2)を各々表している。従っ
て、図7のワード76及び78で示されるミスマッチビ
ットパターンに対しては、MCW=2、WOC=1、W
F=2となる。これにより、2進データ71の行に対し
て計算されたミスマッチカウント値(MCR)は4(例
えば、式(1)に従って計算すると2+(1X2))に
等しくなる。
【0025】1つの行に対してミスマッチカウント値を
求めた後に、上述したように、システムは文字の残りの
全ての行に対するミスマッチカウント値を演算する。そ
の後文字の全ての行に対するミスマッチカウント値の和
をとり、テンプレートミスマッチカウント値(例えば、
枠設定された文字に与えられたテンプレートに対するミ
スマッチカウント値)を生成する。処理中のフォントに
対して設定された他の全てのテンプレートに対しても同
様のことが行われ、枠設定された文字に対する各テンプ
レートのミスマッチカウント値が生成される。様々なテ
ンプレートが処理されるにつれて、2つの最低のテンプ
レートミスマッチカウント値とそれらに関連したテンプ
レート番号がメモリ内に記憶される。文字を識別するた
めの判定基準は、もし最低のミスマッチカウント値を持
つテンプレートがあるしきい値(E13B型フォントに
対しては40の拒絶しきい値)以下であり、かつ次に低
いカウント値を持つテンプレートよりも所定量低い(E
13B型フォントに対しては差が5)ならば、文字を識
別したことになる。。
【0026】前述したように、テンプレートによる文字
認識は図8に示されるように合計9つの照合位置で行わ
れている。これは画像中のノイズ等の因子に起因して完
全には枠設定ができない文字をも識別するために行われ
るものである。図8の例では、テンプレートと入力(2
進データ)パターンの各サイズは23行(高さ)X16
列(幅)である。テンプレートの3つの層(パターン
層、ビット有意(有効)層ならびに重み付け層)はすべ
て同一量だけ同一方向に移動される。以下で述べる移動
照合位置についての記載では、テンプレート行はビット
パターン行、ビット有効行並びにビット重み付け行を意
味するものとする。
【0027】中央照合位置87では、テンプレート96
は入力パターン98上に直接重ねられ、行2及至22の
みが照合操作(マッチング)に利用される。従って、テ
ンプレート行2はパターン行2と比較され、テンプレー
ト行3はパターン行3と比較され、その他のテンプレー
ト行も同様に対応するパターン行と比較される。水平中
央照合位置81、87、93では全ての列(1及至1
6)が利用される。上部中央照合位置81では、1及至
22のテンプレート行が入力パターンの2及至23の行
と比較される。これはテンプレートパターンを一行分垂
直上方向へ移動した場合と同じである。この場合、テン
プレート行1は入力パターン行2と、またテンプレート
行2は入力パターン行3と比較され、他のものも同様に
比較される。テンプレートと入力パターンの全ての列は
この状況下(水平中央照合位置)で比較される。同様
に、下部中央照合位置93では、テンプレートは一行分
下に移動されており、従ってテンプレート行2及至23
と入力パターン行1及至22の照合操作が行われる。水
平移動照合位置はテンプレート96を左もしくは右に入
力パターン上を移動させる操作に対応している。中央左
照合位置85では、テンプレート列1及至15と入力パ
ターン列2及至16とが利用されている。(この位置は
垂直方向には中央位置にあるので、入力パターンとテン
プレート共に2及至22の行が利用されている。)従っ
て、テンプレートワードビット1はパターンワードビッ
ト2と比較され、テンプレートワードビット3はパター
ンワードビット4と比較され、以下同様な比較がなされ
る。 例えば、テンプレートパターン層のワードが00
11111100001111で入力文字パターンワー
ドが0010111100011110であれば、テン
プレートは一ビット(列)左へ移動し00111111
00001111となり、さらに排他論理和操作の結果
は0101000100000000となる。左移動操
作を行うときは最右端ビット(最少桁ビット、LSB)
が0であることを注意すべきである。従って、ビット有
効ワードのLSBも0となり(全ての3つの層が同一方
向に同一量だけ移動するので)、ミスマッチワード76
の(ビット有効ワード76を用いた論理積操作の後の)
LSBは常に0となる。同様に、右方向への移動は最左
端のビット(最上桁ビット、MSB)を0ビットにし、
(論理積後の)ミスマッチワード76のMSBは常に0
ビットとなる。
【0028】右(照合位置89)方向への水平移動は単
なる反対方向への移動であり、左方向への移動と類似し
たものであるので、テンプレートワードのビット2は入
力パターンワードのビット1に沿って一列に並べられる
(比較される)。
【0029】角の照合位置(位置95、91、83、7
9)は一行の垂直移動と一列の水平移動の組み合せに対
応するものである。一例として、左上の照合位置79で
は、テンプレートの行1は一ビット分左へ移動されて、
パターンワード2と比較されている。また、テンプレー
トの行2は一ビット分左へ移動されてパターンワード3
と比較され、以下同様の移動と比較がなされる。
【0030】この方法を用いた文字認識には、1個のテ
ンプレート当り9個のパス(照合位置)と文字集合体の
認識に必要とされるテンプレートの数との積数のパスが
必要となる。例えば、49文字を用いて設定されるアル
ファベット文字では、合計441(9X49)の照合操
作が必要となるが、これは時間の無駄である。文字の識
別を迅速にするためには、最初は各テンプレートの中央
照合位置のみを入力パターンと比較する。各テンプレー
トの処理が行われるにつれて、最低の2つのミスマッチ
カウント値とそれらの対応するテンプレート番号がメモ
リ27に記憶されていく。最初の照合位置(中央照合位
置)での照合操作の終了段階で、これらの2つのテンプ
レートのみの他の8つの照合位置に対する照合処理が行
われ、入力パターンに対する最も可能性の高い(例えば
最低の)全ミスマッチを見つけ出す。この手法による
と、65(1X49+2X8)だけの照合操作が通常必
要とされるだけである(例えば、必要とされていた44
1個の照合操作のうちの15%に対応する)。
【0031】次に文字の受理並びに拒絶の判定基準につ
いて以下述べる。
【0032】最低のテンプレートミスマッチカウント値
とそのテンプレートが表す文字に対する所定の拒絶しき
い値とが比較される。もしこの文字に対するテンプレー
トのミスマッチカウント値がこのしきい値よりも小さ
く、かつ2つの最低のテンプレートミスマッチカウント
値の差(二番目の最低ミスマッチカウント値−最低ミス
マッチカウント値)が所定値(例えば10)以上であれ
ば、最低のテンプレートミスマッチを与えるテンプレー
トが枠設定された文字を表す(識別する)ことがわか
る。2つのミスマッチカウント値が近すぎるかどうかを
調べる理由は、非常によく似た文字(例えば、QとO)
とを区別するためである。もし互いのミスマッチが類似
したものである場合は、識別ミス(誤読取)という危険
を冒すよりはむしろ文字を拒絶した方がよい。上述した
拒絶しきい値以下のミスマッチカウント値を有するテン
プレートがない場合、または2つのテンプレートによる
ミスマッチカウント値が余りにも近い場合は、(以下で
述べる)後処理操作が行われる。後処理操作の後に依然
文字が拒絶される場合は、その画像がより強化され、
(以下で述べる)2進符号に変換され、(上述した)認
識処理が再び行われる。
【0033】中央の照合位置でのみ認識処理を施すこと
は、その位置で得られた2つのミスマッチカウント値に
よる文字よりも、他の照合位置で得られたミスマッチカ
ウント値による文字が真の文字に近い場合が有り得るこ
とを無視することになる。後処理操作はこのような状況
を考えて行われるものである。もし選択された2つの最
低ミスマッチカウント値を有する2つの文字が各々の文
字に対する所定拒絶しきい値の両方とも越えるものであ
るか、もしくは(二番目の最低ミスマッチ文字と最低の
ミスマッチ文字間の)文字間距離が余りに短い場合は、
よりよい照合を与えるための試みとして、他の多数のテ
ンプレートに対しても他の8つの照合位置による照合処
理が行われてもよい。どのテンプレートを処理操作のた
めに選択するかは、例えばそれらのテンプレートに対す
る最も親密な文字の類似性に基づいて行われる。例え
ば、(両方とも最低ミスマッチカウント値を有してい
る)互いに最も親密な文字、例えば文字DとOが選ばれ
たとき、これらは各々に拒絶しきい値以上のミスマッチ
カウント値を有している。後処理操作では、DとOに類
似した所定の文字群、例えば0(ゼロ)、Q,C、Uが
処理を受ける。この操作の後の2つの近接文字のミスマ
ッチカウント値が調べられ(最初に最低のミスマッチカ
ウント値を有する文字が調べられる)、それらが拒絶判
定基準並びに文字間距離の判定基準を満たすかどうかが
調べられる。少なくとも一つの文字が判定基準を満たす
とき、その文字が処理結果として認識処理に戻され、次
の文字に対する処理が行われる。
【0034】両文字とも判定基準を満たさないか、また
は文字間距離が余りにも短い場合は、枠設定された文字
は拒絶される。この場合、(以下で述べるように)画像
が強化され、文字は再度2進符号に変換され、上述した
認識処理が再度繰り返される。もし文字が認識されれ
ば、それは認識処理操作へ戻される。そうでなければ、
拒絶文字コードが結果として処理操作へ戻され、文書上
の次の文字の(位置決め並びに枠設定)処理が行われ
る。
【0035】上述した拒絶しきい値に加えて、出力しき
い値(例えば値10)が以下で述べる文字識別において
使用されてもよい。処理速度を高めるために引き続くテ
ンプレートミスマッチカウント値が出力しきい値と比較
され、出力しきい値以下のテンプレートミスマッチカウ
ント値を有する最初のテンプレートを用いて文字が識別
される。どちらの場合においても、残りのテンプレート
は(処理速度を高めるために)処理されない。
【0036】さらに、文字識別処理を迅速にするため
に、テンプレートの個々の行を処理しながら、現在のテ
ンプレート(現在処理されているテンプレート)のミス
マッチカウント値がこれまで得られた二番目の最低のカ
ウント値よりも大きいことが分かった場合に、この現在
のテンプレートの最低のテンプレートミスマッチカウン
ト値を有した2つのテンプレートのうちの一つでないこ
とが明かとなるので、現在のテンプレートの処理を中断
してもよい。さらに認識速度を高めるために、テンプレ
ートはそれらがもっとも頻繁に発生する順番に(使用頻
度順に)(例えば英数字フォントの中の子音が続く母音
の前の数字)予め配置しておくとよい。もしミスマッチ
カウント値が(上述した)出力しきい値以下であれば、
残りのテンプレートを調べる必要はない。以上述べたよ
うに使用頻度の高い文字を最初に調べるべきである。さ
らに文字識別を迅速にするためには、テンプレートによ
り中央の照合位置のみについて照合を行い、しかるの後
に、もし最低ミスマッチカウント値が出力しきい値より
も高ければ、出力しきい値に最近接の2つのテンプレー
トの各々の残り8つの照合位置についても処理を行い、
最低のテンプレートミスマッチカウント値を有するテン
プレートをその文字を表すものとして選択する。さらに
識別処理を速めるために、残り8つの照合位置(図8)
について79、81、83、85、89、91、93、
95の順に処理を行うとよい。これは文字が最も頻繁に
位置する順序である。
【0037】枠設定された文字を識別した後、区分け窓
を前回枠設定された文字の左に選択された数のピクセル
分(例えば3ピクセル分)移動することで、システムは
次の文字の処理(例えば、枠設定された文字に近接する
文書上の領域を表す次のピクセル値群の処理)に移行す
る。次に、この近接領域中の文字は枠設定(区分け)さ
れ、上述したように識別処理を受ける。残りの全ての文
字(記憶された残りのピクセルデータ)が、最終のフィ
ールドが検出されるまで(例えば、位置決めすべき文字
がなくなるか、または最終フィールドの文字が位置決め
されたとき)上述のように処理される。
【0038】文字識別処理で文字が拒絶されれば、その
文字画像は強調され(前述したように)、識別処理が促
進される。文字画像の強調は、例えば、一定のストロー
ク幅(文字の各垂直もしくは水平ストロークの幅に亘る
一定数の暗ピクセル)を有する文字画像を作成すること
で行われる。これは以下のようにして行われている。最
初に、文字を表すグレースケールピクセル値(例えば、
6−ビット、8−ビット、もしくは16−ビット)をそ
れよりも低いレンジのビット値へ(例えば、より処理速
度を高めるために、3−ビットグレースケールピクセル
値へ)変換する。しかる後に、文字画像の各々のピクセ
ルが調べられ、そのストロークの中で最も暗い2つもし
くは3つのピクセルが黒とされ、他のピクセルは白とさ
れる。これにより、例えば米国特許番号4、625、3
30により開示された一定ストロークを有した2進符号
化された画像が生成される。
【0039】文字識別処理を高める手助けとして、各文
字の縁を以下の様に処理してもよい。すなわち、上述し
たように、文字識別処理で使用される各テンプレートは
選択された文字群(例えば、E13B型文字群)のどれ
か一つの文字に対応している。また、図2、4で示され
ているように、各文字は14個のピクセル幅と21個の
ピクセル高さを有している。1つの余分な列を、文字の
左と右に各々付加し、さらに1つの余分な行を文字の上
端と下端に各々付加する。この結果、文字サイズは16
X23となる。各文字に対応して、各テンプレートは1
6個のピクセル幅と23個のピクセル高さになる。各テ
ンプレートは、14個の列と21個の行からなる文字の
各側部(左右端)に余分の列と、各上下端に余分の行を
有することになる。各余分の行は16個の白ピクセルか
らなり、各余分の列は23個の白ピクセルからなってい
る。余分の行と列は14X21の画像領域を白ピクセル
により縁取ることで、以下述べる様に文字縁部を良好に
識別処理することが可能となる。例えば、文字”E”が
14X21の”F”テンプレートと照合され、テンプレ
ートが上へ一ピクセル分移動したとき、”E”の最下端
のピクセル値が失われ、このピクセル値はテンプレート
ミスマッチカウント値を生成することに利用されなくな
る。この結果、ミスマッチカウント値が低いので”E”
が”F”として誤同定されることになる。16X23の
テンプレートを用いた場合、”E”の最下端のピクセル
値は失われず、従って、”F”テンプレートの最下端の
白列に対するミスマッチカウント値に実質的に寄与する
ことができるので、”E”を”F”と誤同定することが
なくなる。また同様なことは、16X23のテンプレー
トを用いた場合の左右の列位置についても成り立つ。す
なわち、”B”を誤って”3”と同定する誤同定が回避
されることになる。
【0040】図9で示されるように、各16X23のテ
ンプレートはRAM27の69個のの16−ビットワー
ド(単位インチ当り200ピクセルの走査に対応)によ
って表すことができる。69個のワードのうち、23個
のワードにより第一の層のビットパターンワードが、ま
た23個のワードにより第二の層のビット有効ワード
が、さらに残りの23個のワードにより第三の層のビッ
ト重み付けワードが各々表されている。各組の23個の
ワードは文字の高さに対応しており、各16−ビットワ
ードは文字の幅に対応している。(図7では、簡単のた
めに16−ビットではなく8−ビットを用いて論理演算
が描かれている。)
【0041】光学的文字認識のためのカスタムフォント
の生成
【0042】これまでは標準文字フォント(例えばE1
3B型フォント)の認識方法について述べてきたが、以
下では利用者指定のカスタムフォントの認識方法につい
て述べる。特に、利用者指定のカスタムフォントを定義
する(表わす)ためのシステムによるテンプレートの生
成について述べる。
【0043】前述したような文書の読取操作と画像の読
取データ(グレースケールピクセル値)のメモリへの記
憶操作に引続き、記憶プログラムの中の所定の選択され
たルーチンが以下で述べるような方法で記憶データの処
理前に初期設定される。このルーチンにより利用者指定
フォントの生成と処理(区分化と認識操作)とが可能と
なる。ルーチンはキーボート(もしくはマウス等の入力
装置)を介して以下の命令を行うことで初期設定され
る。 AUTOFONT OCRB D2001.GRY ここで、AUTOFONTとは実行すべきプログラムの
名前であり、OCRBとは生成すべきフォントに与えら
れた基本名であり、D2001.GRYとは処理すべき
画像ファイル名を表している。メモリ27に記憶されて
いるプログラムAUTOFONTによりディスクドライ
ブ31のアクセスとファイルOCRB.FNTがオープ
ンされる。ファイルがディスク上に記憶されているのな
らば、その内容(テンプレートデータ)がメモリ27へ
入力され(読み込まれ)、既に述べたように読取文字の
区分け化と認識操作に利用される。ファイルになけれ
ば、利用者は処理段階でシステムにより処理される文字
の大きさを指定(入力)しなければならない。利用者に
所定文字サイズの指定を行わせるために、次の内容が端
末器により表示される。 1. OCRAもしくはOCRB文字サイズ 2. E13B文字サイズ 3. 7B文字サイズ 4. 10文字/インチ−6ライン/インチ サイズ 5. ピッチサイズの登録 6. 実際の文字ピクセルサイズの登録 この表示に対して、利用者は1及至6の番号のどれかを
入力すればよい。1及至4の番号のどれかを入力する
と、特定フォント(文字の型/スタイル)に適した所定
の文字サイズがシステムにより選ばれる。例えば、番号
2が入力されると、前述したように、17x24のピク
セルからなる文字サイズ(例えば、16x26の縮小さ
れたテンプレートサイズに対応する、17ピクセル幅x
24ピクセル高さの文字サイズ)がE13B型の文字に
対して利用されることになる。メニュー画面により選択
された文字サイズに対しては、200ピクセル/インチ
の分解能が与えられている。
【0044】所望の文字サイズがメニュー画面の1及至
4で表される標準の文字サイズでない場合、利用者は所
望のカスタムフォントのピッチ(例えば8文字/イン
チ)を指定することでカスタムサイズを指定することが
できる。これは以下の情報を以下の順番に従って利用者
が入力することで達成される。 1. 利用者は番号”5”を入力する。これにより”ピ
ッチを入力せよ”が表示される。 2. 利用者は番号”8”を入力する。
【0045】他方、利用者は以下の情報を以下の順番で
入力することで文字の実際のピクセルサイズ(例えば1
2ピクセル幅X20ピクセル高さ)を指定することがで
きる。 1. 利用者は番号”6”を入力する。これにより”文
字高さを入力せよ”が表示される。 2. 利用者は番号”20”を入力する。これにより”
文字幅を入力せよ”が表示される。 3. 利用者は”20”を入力する。
【0046】利用者による文字のサイズ情報の入力が完
了すると、数字(0及至9)とそれらに与えられたテン
プレートからなる初期文字群が生成される。(最初は文
字が検出されていないので、これらのテンプレートのビ
ットパターン層の各ビットは黒(”1”)に、ビット有
効層のビットはすべて”1”に、さらに重み付け層のビ
ットはゼロに設定されている)。これはほとんどのフォ
ントには数字が含まれているからである。
【0047】しかる後、上述の定義された文字の各々に
対して統計ファイル(Statsファイル)が作成され
る。統計ファイルは以下のものからなる: (1) その文字が認識される回数のカウント値を表す
(文字−頻度ワードである)16−ビットワード (こ
のワードは統計ファイルが作成されたときはゼロに初期
設定されている)と、(2) 文字のピクセル幅と高さ
の値を保持する2つの8−ビットワード(これらのワー
ドは上述したように利用者により入力された値に初期設
定されている)と、(3) 各々が文字の各ピクセル位
置に対して与えられた16−ビットワード(ビット−頻
度ワード)のアレイ。例えば、26個のピクセルの高さ
と16個のピクセルの幅からなる文字では26X16
個、すなわち416個のビット−頻度ワードが用いられ
ている。(認識処理において、幅は常に最大16ピクセ
ルまでスケーリング処理を受けることができることに注
目すべきである。)これらのワードは統計ファイルの作
成時にはゼロに初期設定されている。
【0048】次に、画像(メモリに記憶されたピクセル
データ)に基づいて画像の区分けと2値化処理が行わ
れ、認識処理(例えば、前述したように2値化文字を認
識ルーチンに通す)が行われる。文字が認識された場
合、統計ファイルとテンプレートとが以下の様に更新さ
れる。一方、文字が認識されなかったならば(例えば、
拒絶されたならば)2値化された文字画像が利用者にそ
の文字が何であるかを考えさせるために”文字入力せ
よ”とのメッセージとともに端末器29の表示器30
(図1参照)に表示される。利用者はこれに応えてキー
ボード28を介して文字(例えば”3”)を入力する。
そしてこの入力された文字が文字群の構成文字であるか
どうかを調べ、もしそうでなければその文字を文字群に
加え、対応するテンプレートと統計ファイルを作成す
る。
【0049】この段階では、区分けされたパターンが利
用者自信により入力されたか、または予め定義されてい
る文字の場合は認識ルーチンにより認識されているの
で、その区分けされたパターンがどの文字を表すものか
が(例えば”3”)システムにより理解されている。次
に、その文字に対する統計ファイルが以下の様に更新さ
れる。まず、文字−頻度ワードがインクリメントされ、
文字パターン中の各ピクセル位置が調べられる。もしピ
クセルが黒(2進数の”1”で表されている)であれ
ば、アレイ中の対応するビット−頻度ワードがインクリ
メントされる。一方、もしピクセルが白(2進数の”
0”で表されている)であれば、ビット−頻度ワードは
更新されない。例えば、行12、列15のピクセルが黒
であれば、その位置を表すビット−頻度ワードがインク
リメントされる。
【0050】文字用統計ファイルの更新が完了したと
き、その文字に対するテンプレート(前述したようにビ
ットパターン層、ビット有効層及びビット重み付け層か
らなる)も更新される。統計ファイルの内容に基づいて
ビットパターン層とビット有効層とが作成される。ピク
セルが黒であった回数のカウント値(ビット−頻度ワー
ド)が検出されたパターンの数(文字−頻度ワード)と
比較される。
【0051】ビット−頻度値が文字−頻度値の例えば9
0%以上であった場合は、作成中のビットパターン層の
対応ビットが”1”(黒)に設定され、さらに作成中の
ビット有効層の対応ビットが”1”に設定される。ま
た、ビット−頻度値が例えば文字−頻度値の例えば10
%以下であった場合、作成中のビット−パターン層の対
応ビットが”0”(白)に設定され、さらにビット有効
層の対応ビットが”1”に設定される。さらに、ビット
−頻度値が文字−頻度値の10及至90%の範囲にあっ
たならば、作成中のビット−パターン層の対応ビット
が”0”に設定され、かつビット有効層の対応ビット
が”0”に設定される。同様に、表示文字の残りの各ピ
クセルに対しても、作成(生成)中のビット−パターン
層とビット有効層の対応ビットがこれらの2つの層の作
成が完了するまでに”1”か”0”に設定される。
【0052】初期段階では、生成中の各ビット重み付け
層の全てのビット(ピクセル)は”0”(非重み付け)
に設定されている。文書の処理が完了したとき(例え
ば、読み込み線上の全ての文字が処理された後)、各テ
ンプレートの重み付け層は以下の様に更新される。
【0053】重み付けが必要かどうかを決定するため
に、各テンプレートは以下の方法で他のテンプレートの
各々と順番に比較される。例えば、テンプレート1を第
一のテンプレートとし、残りのテンプレートを第二のテ
ンプレートとする。最初に、第一のテンプレートの重み
付け層を”0”に設定し、第二のテンプレートを”1”
に設定する。選択された第二のテンプレートのビットパ
ターンワードと第一のテンプレートのビットパターン層
との排他的論理和操作(図7で示される操作と類似した
操作)が行われる。この処理結果と第一のテンプレート
のビット有効ワードとの論理積処理が行われ、(前述し
た通常認識処理で行われたような)ミスマッチカウント
値が得られる。この処理はテンプレートにおける全ての
ワードに対して行われる。もし2つのテンプレートに対
する全ミスマッチが文字間しきい値(例えば10)以下
であれば、OとQの様な類似文字に対するミスマッチカ
ウント値を分離(区別)する試みとして重み付けがなさ
れる。もしミスマッチカウント値が後処理しきい値(例
えば40)以下であれば、認識処理に関して前述したよ
うに、第二のテンプレートが表す文字が後処理に対する
リストに加えられることになる。さらに、全ての第二の
テンプレートが処理を受ける(展開される)まで次々に
第二のテンプレートが上述のように処理を受けていく。
その後、新しい第一のテンプレートが選ばれ、(上述し
た)同様の処理が各テンプレートが全ての他のテンプレ
ートと比較されるまで行われる。
【0054】2つのテンプレートの全ミスマッチが上述
した文字間しきい値よりも小さい場合、以下のように重
み付けが行われる。すなわち、第一のテンプレートのパ
ターンワードと第二のパターンワードとの排他的倫理和
をとり、その結果と第二のテンプレートのビット有効ワ
ードとの論理積をとる。さらに論理積の結果と第一のテ
ンプレートのビット有効ワードとの論理積をとり、第三
の結果を得る。この第三の結果における”1”ビットは
2つのテンプレート間で異なり、かつ重要なものであ
る。従って、これらのビットの重み付けはこれらの2つ
のテンプレート間のミスマッチカウント値を増加するこ
とになる。従って第一のテンプレートの重み付けワード
とこの最終結果との論理和がとられる。同じ操作がテン
プレート中の残りのワードに対しても行われる。
【0055】各文字に対するビットパターン層、ビット
有効層並びにビット重み付け層の生成が完了すること
で、システムは完成された一群のテンプレートを有する
ことになる。システムはこの新たに生成したテンプレー
ト群を後の使用のためにディスク上に記憶し、次の読取
認識操作による文字認識に利用する。
【0056】上述した論理処理操作等の処理を行うため
に記憶されたプログラムの擬似コードリストを以下に示
す。 PROCEDURE: MAIN IF (fongt file exists) { LOAD FONT FILE } else { MAKE NEW FONT } While (NOT END OF DOCUMENT) { if (FIND FIRST CHARACTER) finds a character { RECOGNIZE FIELD } else { END OF DOCUMENT } } UPDATE POST PROC UPDATE TEMPLATE WEIGHTS SAVE FONT PROCEDURE: MAKE NEW FONT GET CHARACTER SIZE INITIALIZE CHARACTER SET INITIALIZE TEMPLATES INITIALIZE STATS FILES PROCEDURE: FIND FIRST CHARACTER do { SCAN IMAGE FOR WHITE TO BLACK TRANSITION } until(FOUND CHARACTER or END OF DOCUMENT) PROCEDURE: RECOGNIZE FIELD do { RECOGNIZE CHARACTER if (reject) { GET CHARACTER FROM KEYBOARD } if (character i="?") { if (character NOT in character set) { UPDATE STATS FILE UPSATE TEMPLATE FILE UPDATA FONT TABLE } MOVE TO NEXT CHARACTER POSITION } WHILE (FOUND CHARACTER) PROCEDURE: RECOGNIZE CHARACTER BINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER if (character is rejected) { ENHANCE AND REBINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER }
【0057】
【発明の効果】本発明の光学式文字認識システムによる
と、利用者により未定義フォントの登録が可能となり、
銀行為替手形や銀行小切手等の文書上に記録されたE1
3B,OCRA, OCRB,ファーリントン7B型フ
ォント等の標準フォントに加えて、規格外フォントとカ
スタムフォントの光学式文字認識が可能となる。
【図面の簡単な説明】
【図1】利用者端末器と共に示した、本発明の光学式文
字認識システムの概略図である。
【図2】図1のシステムにより読み取られ、識別される
べき文字の外観を示した図である。
【図3】様々な文字を記録した文書の一部を示す図であ
る。
【図4】異なる不透明度(グレースケール値)のピクセ
ルマトリックスからなる読取文字を示す図である。
【図5】文字の枠設定に利用される窓(ウィンド)を示
す図である。
【図6】図4で示される文字を枠設定するために用いる
図5の窓を示す図である。
【図7】読取文字を表す2値化データに対する様々な論
理演算処理の結果を示す図である。
【図8】枠設定文字に対する様々な照合位置を表すマト
リックス概略図である。
【図9】図1のシステムで利用されるテンプレートとそ
れに関連した2進符号値の概略図並びに表である。
【符号の説明】
13 光学スキャナー 15 CCD 17 制御器 19 文書 21 コンピュータシステム 23 マイクロプロセッサー 25 ROM 27 RAM 29 端末器 31 補助記憶装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 レイモンド エル.ヒギンズ カナダ エヌ2エヌ 2エム1、オンタリ オ、キツチナー、イエロー バーチ ドラ イブ 25

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文書上の文字を読取り、認識するための光
    学式文字認識装置を用いて、未認識の文字を認識可能と
    することで一連の文字認識操作を可能とする方法であっ
    て、 該未認識文字を、明暗ピクセルのパターンからなる画像
    として表示する過程と、 該未認識文字を識別するための利用者指定文字を入力す
    る過程と、 利用者による指定定義文字に類似するものとして認識さ
    れた文字(各認識された文字は複数のピクセル位置上で
    明暗どちらか一方のピクセルを有する)の読取数を表す
    文字カウント値を生成する過程と、 利用者指定の文字に類似した該認識文字の各ピクセル位
    置での文字のピクセルが暗ピクセルであった回数を表す
    ピクセルカウント値を各ピクセル位置で生成する過程
    と、 文字カウント値に対する対応ピクセルカウント値の大き
    さに依存して各ピクセル位置が明暗どちらか一方のピク
    セルを有した、未認識文字を表すテンプレートを生成す
    る過程とからなることを特徴とする光学式文字認識方
    法。
  2. 【請求項2】 文書上の文字を読取り、認識し、未認識
    文字を拒絶するための光学式文字認識システムにおい
    て、未認識文字を認識可能とすることで一連の文字認識
    操作を可能とする光学式文字認識装置であって、 該未認識文字を、明暗ピクセルのパターンからなる画像
    として表示する手段と、 該未認識文字を識別するための利用者指定文字を表すデ
    ータを入力する入力手段と、 入力データに応じ、利用者による指定定義文字に類似す
    るものとして認識された文字(各認識された文字は複数
    のピクセル位置上で明暗どちらか一方のピクセルを有す
    る)の読取数を表す文字カウント値を生成する手段と、 利用者指定の文字に類似した該認識文字の各ピクセル位
    置での文字のピクセルが暗ピクセルであった回数を表す
    ピクセルカウント値を各ピクセル位置で生成する手段
    と、 文字カウント値に対する対応ピクセルカウント値の大き
    さに依存して各ピクセル位置が明暗どちらか一方のピク
    セルを有した、未認識文字を表すテンプレートを生成す
    る手段とからなることを特徴とする光学式文字認識装
    置。
JP4020774A 1991-01-14 1992-01-10 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム Pending JPH0562021A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US64061591A 1991-01-14 1991-01-14
US640615 2000-08-17

Publications (1)

Publication Number Publication Date
JPH0562021A true JPH0562021A (ja) 1993-03-12

Family

ID=24568979

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4020774A Pending JPH0562021A (ja) 1991-01-14 1992-01-10 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム

Country Status (4)

Country Link
EP (1) EP0495607B1 (ja)
JP (1) JPH0562021A (ja)
CA (1) CA2052450C (ja)
DE (1) DE69227708T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162686A (ja) * 2001-11-26 2003-06-06 Fujitsu Frontech Ltd 媒体読み取り装置、搬送媒体の読み取り方法
WO2022247925A1 (zh) * 2021-05-27 2022-12-01 海尔卡奥斯物联生态科技有限公司 智能仓储出库控制方法、装置、电子设备、及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7225548B2 (ja) * 2018-03-22 2023-02-21 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0634180B2 (ja) * 1984-10-23 1994-05-02 日本電気株式会社 パタン認識装置
JPS63298488A (ja) * 1987-05-28 1988-12-06 Matsushita Electric Works Ltd テンプレ−トマッチング方式
US5014327A (en) * 1987-06-15 1991-05-07 Digital Equipment Corporation Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns
US5091968A (en) * 1990-12-28 1992-02-25 Ncr Corporation Optical character recognition system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003162686A (ja) * 2001-11-26 2003-06-06 Fujitsu Frontech Ltd 媒体読み取り装置、搬送媒体の読み取り方法
WO2022247925A1 (zh) * 2021-05-27 2022-12-01 海尔卡奥斯物联生态科技有限公司 智能仓储出库控制方法、装置、电子设备、及存储介质

Also Published As

Publication number Publication date
EP0495607B1 (en) 1998-12-02
CA2052450C (en) 1998-08-18
EP0495607A3 (en) 1993-11-24
DE69227708T2 (de) 1999-06-24
EP0495607A2 (en) 1992-07-22
CA2052450A1 (en) 1992-07-15
DE69227708D1 (de) 1999-01-14

Similar Documents

Publication Publication Date Title
CA2049758C (en) Optical character recognition system and method
Kanai et al. Automated evaluation of OCR zoning
US6687401B2 (en) Pattern recognizing apparatus and method
US6970601B1 (en) Form search apparatus and method
US5325447A (en) Handwritten digit normalization method
JPH05250515A (ja) テンプレートを使用してバーコード文字を光学的に認識する方法および装置
US5272766A (en) OCR system for recognizing user-specified custom fonts in addition to standard fonts using three-layer templates
Van Phan et al. Collecting handwritten nom character patterns from historical document pages
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
Ullmann Picture analysis in character recognition
JPH04111085A (ja) パターン認識装置
Ting et al. A syntactic business form classifier
Abuhaiba EFFICIENT OCR USING SIMPLE FEATURES AND DECISION TREES WITH BACKTRACKING.
JP2766205B2 (ja) 文字認識装置
Bagga et al. CHARACTER SEGMENTATION MACHINE-TYPED DOCUMENTS USING KNN ALGORITHM
JP2953162B2 (ja) 文字認識装置
Parker et al. Vector templates for symbol recognition
JPS63269267A (ja) 文字認識方法
JP3301467B2 (ja) 画像パターン同定・認識方法
JP3657565B2 (ja) 画像パターン同定・認識方法
KR100248384B1 (ko) 다국어 문서 인식에서 개별 문자 추출 방법 및 그 인식 시스템
JP2000207491A (ja) 文字列読取方法及び装置
JP2972443B2 (ja) 文字認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2578768B2 (ja) 画像処理方法