JPH0562021A

JPH0562021A - 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識（ｏｃｒ）システム

Info

Publication number: JPH0562021A
Application number: JP4020774A
Authority: JP
Inventors: Dennis W Golem; ダブリユー．ゴーレムデニス; Raymond L Higgins; エル．ヒギンズレイモンド
Original assignee: NCR Corp
Current assignee: NCR Voyix Corp
Priority date: 1991-01-14
Filing date: 1992-01-10
Publication date: 1993-03-12
Also published as: EP0495607B1; CA2052450C; EP0495607A3; DE69227708T2; EP0495607A2; CA2052450A1; DE69227708D1

Abstract

(57)【要約】【目的】標準フォントに加えて、規格外フォント及び
利用者指定のカスタムフォントをも認識可能とすること
で、一連の光学的認識操作を可能にする。【構成】スキャナーにより各文書が光学的に読み取ら
れ、複数個のグレーピクセル値が生成され、マイクロプ
ロセッサーによる制御の基でＲＡＭに記憶される。マイ
クロプロセッサーにより記憶ピクセル値が処理され、文
書上の各文字の位置決め（位置探し）と区分けが有効に
行われる。所定のテンプレートデータに応じて、マイク
ロプロセッサーは位置決めされ、区分けされた文字が既
に定義されているものであれば認識し、未定義のもので
あればその文字を拒絶する。拒絶された文字は表示装置
上に表示され、利用者による文字の確認と識別（同定）
処理を受ける。キーボードを介して利用者により入力さ
れた（指定された）同定文字に応じて、システムはカス
タムテンプレートもしくはその拒絶文字を表す（定義し
た）パターンを生成し、カスタムプレートを将来におけ
るその文字の認識のためにメモリに記憶する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文書の光学的読取及び
英数字フォントの認識システムに関し、特に利用者指定
カスタムフォントと規格外（認識許容外）文字の認識シ
ステムに関する。

【０００２】

【従来の技術】現存する多くの光学式文字認識システム
では、広く使用されている馴染みのあるフォントを光学
的に読取り、認識する。これらのフォントは例えばアメ
リカンバンカーズアソシーション等の財界で標準フォン
トとして予め定義され、利用されている。

【０００３】

【発明が解決しようとする課題】このようなシステムに
は、非標準フォントを認識したり規格外フォントの印刷
をどうするかを抱えた状態でとりあえず文字認識を行う
機構は設けられていない。印刷された文字が幾分規格外
フォントを含んでいる場合、一般的には文字認識は失敗
し、文字は拒絶され、従って文字認識操作は中断するこ
とになり、結果的に貴重な時間と労力の無駄になる。

【０００４】また、標準文字の認識の他に、非標準（カ
スタム）文字の光学的な文字認識を可能にするシステム
は現在のところ存在していない。以上のことから、規格
外文字並びにカスタム文字を認識するための有効的で単
純な手法が要求されている。

【０００５】本発明は、上述した問題点を解決するため
になされたもので、利用者により指定された規格外文字
とカスタムフォントとを認識することが可能な光学式文
字認識システムを提供することを目的とする。

【０００６】

【課題を解決するための手段】上述の目的を達成するた
めに、本発明の光学式文字認識システムは、文書中に印
刷された予め定義されている文字を認識し、かつ次回の
認識操作のためにカスタムフォント、規格外文字等の未
定義文字をも定義するものであって、文書を光学的に読
取り、文字に対応する複数個のグレースケールピクセル
値を生成する手段と、予め処理プログラムと所定のデー
タとを記憶した、生成されたピクセル値を記憶するため
の記憶手段と、読取手段と記憶手段とに結合し、記憶さ
れたピクセル値を用いて文字の位置決め（位置探し）と
区分化を行い、区分け文字が予め定義された文字である
場合はその文字を認識し、未定義文字である場合はその
文字を拒絶する処理手段と、処理手段に結合し、拒絶文
字を明暗のピクセルのパターンからなる画像として表示
する表示手段と、処理手段に結合し、拒絶文字を識別
（同定）するためのデータを入力する入力手段とからな
り、処理手段は、入力されたデータに応じて、利用者に
よる指定定義文字に類似するものとして認識された読取
文字（各認識された文字は複数のピクセル位置上で明暗
どちらか一方のピクセルを有する）の数を表す文字カウ
ント値を生成する手段を有しており、さらに、各ピクセ
ル位置での文字のピクセルが暗ピクセルであった回数を
表すピクセルカウント値を各ピクセル位置で生成する手
段と、拒絶文字を定義する明暗ピクセルからなるテンプ
レートを生成し、テンプレートの各ピクセル位置は文字
カウント値に対する対応するピクセルカウント値の大き
さに依存して、明暗ピクセルのどちらか一方を有する手
段とを有したことを特徴とする。

【０００７】

【作用】本発明の光学式文字認識システムでは、銀行為
替手形や銀行小切手等の文書上に記録されたＥ１３Ｂ，
ＯＣＲＡ，ＯＣＲＢ，ファーリントン７Ｂ型フォント
等の標準フォントに加えて、規格外フォントとカスタム
フォントの認識が可能になる。標準フォントとは予め定
義された文字であり、カスタムフォント及び規格外フォ
ントとは未定義フォントのことを言う。

【０００８】本発明の一実施例としてのシステムは、光
学スキャナー、マイクロプロセッサー、読みだし専用メ
モリ（ＲＯＭ）、記憶プログラムと所定のテンプレート
データを有するランダムアクセスメモリ（ＲＡＭ）及び
キーボードと表示装置を有する端末器からなる。

【０００９】以上のように構成された本発明の光学式文
字認識システムでは、スキャナーにより各文書が光学的
に読み取られ、複数個のグレーピクセル値が生成され、
マイクロプロセッサーによる制御の下でＲＡＭに記憶さ
れる。マイクロプロセッサーにより記憶ピクセル値が処
理され、文書上の各文字の位置決め（位置探し）と区分
けが有効に行われる。所定のテンプレートデータに応じ
て、マイクロプロセッサーは位置決めされ、区分けされ
た文字が既に定義されているものであれば認識し、未定
義のものであればその文字を拒絶する。拒絶された文字
は表示装置上に表示され、利用者による文字の確認と識
別（同定）処理を受ける。キーボードを介して利用者に
より入力された（指定された）同定文字に応じて、シス
テムはカスタムテンプレートもしくはその拒絶文字を表
す（定義した）パターンを生成し、カスタムプレートを
将来におけるその文字の認識のためにメモリに記憶す
る。

【００１０】

【実施例】図１は本発明の光学式文字認識システムを示
すものである。本発明の光学式文字認識システム１１
は、文書１９を読み取るための光学読取装置もしくはス
キャナー１３と、スキャナー１３により読み取られたデ
ータを処理するためのコンピュータシステム（装置）２
１とからなる。スキャナーはＣＣＤ（電荷結合素子）１
５を内蔵したカメラと制御器１７とからなり、例えば東
芝の販売するモデルＴＣＤ１３２Ｄのリニアイメージセ
ンサーシステムであってもよい。また、文書１９は数字
もしくはアルファベット文字情報を記録した銀行為替手
形もしくは銀行小切手であってもよい。コンピュータシ
ステム２１はマイクロプロセッサー２３、読取装置とマ
イクロプロセッサーからのデータを記憶し、さらに予め
定義されたデータを記憶する、ブートプログラムを記憶
したＲＯＭ（読みだし専用メモリ）２５とＲＡＭ（プロ
グラムを記憶したランダムアクセスメモリ）２７と、キ
ーボード２８とＣＲＴ表示器３０とを有する端末器２９
と、前回読み取られた文書の画像ファイルのデータベー
スを有する、ディスクドライブ等の補助記憶装置３１と
からなる。例えば、Ｅ１３Ｂ型の文字に対して以下で詳
細に述べるような、標準文字フォントに対する様々な読
取り、処理操作機能に加え、”光学式文字認識のための
カスタムフォントの生成”で以下詳細に述べるように、
本発明のシステムでは、光学式文字認識のための利用者
指定カスタムフォントをも生成し、処理することが可能
な機能が得られている。

【００１１】標準フォントの読取と認識

【００１２】読取操作は文書１９の右下の角から開始さ
れ、左上の角で終了する。スキャナー１３による文書１
９の読取動作は、まず最初に矢印３７で示されているよ
うに文書の右端の仮想走査線３９に沿って下から上へ垂
直方向に行われ、続いて右端から２番目の仮想走査線４
１に沿って下から上へ垂直方向に行われ、走査が左上の
角に達するまで繰り返される。仮想走査線は互いに平行
になるように設定されている。文書１９は矢印４３で示
されているように連続的に左から右へ移動され、一方ス
キャナーは連続した走査線に沿って掃引されている。各
走査線の間隔はピクセルの直径に対応して（約０．０１
２７ｃｍもしくは０．００５インチに）設定されてい
る。

【００１３】図３に文書の読取線上の文字群の例が示さ
れている。文書が走査されたとき、記録された文字を含
む文書自体を表す、スキャナーによって得られるピクセ
ル値はメモリ２７に記憶される（図１参照）。各読取線
の文字は、例えば、代表的には読取線の高さに相当する
１００個の行と文書の長さに相当する１２００個の列
（１２００個は単位インチ当り２００ピクセルの６イン
チ文書に対して典型的な列数である）からなるピクセル
データアレイ（マトリックス）という形態で記憶され
る。このデータアレイ構造により、一文字（以下述べる
ような、位置決めされ、区分けされた文字）は行ピクセ
ル（例えば、文字の高さに相当する２１個の行ピクセ
ル）と列ピクセル（例えば、文字の幅に対応する１４個
の列ピクセル）からなるピクセルのマトリックスにより
表される。例えば図２で示される文字”３”は図４で示
されるピクセルアレイ構造により表される。各ピクセル
４９は文書の一部を構成し、各々には０及至２５５の不
透明度もしくはグレースケール値が付与されている。暗
ピクセルは一般的に高いグレースケール値（２５５に近
い値）を有しており、また明ピクセルは一般的に低いグ
レースケール値（０に近い値）を有している。文書中の
文字は、一般的に明るい色の背景に比べて暗い色を用い
て通常印刷されているので、文字と背景との不透明度の
相違は容易に見分けることができる。

【００１４】前述したように、これらのグレースケール
値のデータは文書の走査段階でスキャナーにより生成さ
れる。生成されたデータはシステム２１による処理のた
めにメモリ２７に記憶される（図１参照）。記憶プログ
ラムによる制御のもとで、システムにより記憶データ値
が調べられ、最初の文字が位置決めされ、次に第一のフ
ィールドの引き続く文字が、さらにその後他のフィール
ドの引き続く文字の位置決めが行われる。文字の位置決
めを行うに際し、システムにより文字の枠設定もしくは
境界設定（例えば、文字の分離、区分け）が行われる。

【００１５】最右端の走査線３９に沿って下から上へ文
書を走査し（図１及び２参照）、しかる後に右端から２
番目の走査線４１に沿って下から上へ走査し、以下左上
の角に到達するまで繰り返すことで得られ記憶されたグ
レースケールデータから、以下のように各々の文字の位
置決めと枠設定（区分け）が行われる。最初に、明ピク
セルから暗ピクセルへの変化を表すグレースケール値の
立ち上がりを見つけるために記憶データを走査線に沿っ
て下から上へ垂直方向に検索する。もし例えば４０（４
０という特定の値はフォントに依存している）以上の立
ち上がり差が走査方向３７上の２つの近接ピクセルのグ
レースケール値間で見つかったならば、暗ピクセルが見
つかったものと見なせる。暗ピクセルに近接する（文書
の）領域は文字が発見されそうな領域と見なすことがで
きる。暗ピクセルが発見されれば、システムはこの文字
領域を調べ（例えば、暗ピクセル値に近接する記憶デー
タを調べ）暗ピクセルが文字の一部を構成するものであ
るかどうかを決定する。さらに、文書中の文字を有効に
枠設定するために十分な大きさの区分け窓（セグメント
化ウィンド）を、暗ピクセルが窓の中心に位置するよう
に設定し、文字の有無を調べる。

【００１６】図５では、区分け窓５３が左右端の縁
（列）５５、５７と最上下端の縁（行）５９、６１を有
するように描かれている。左右端の縁は列（左＋１）６
３と（右−１）により縁取りされており、最上下端の縁
は行（最上端＋１）６７と（最下端−１）６９により縁
取りされている。

【００１７】図５及び６を参照して以下述べるように、
窓内のすべてのグレースケールピクセル値の総和（Ｓ
ｗ）が最大になったときに文字の枠設定と位置決めがな
されたものと見なされる。窓を移動したときに総和（Ｓ
ｗ）が増加したかどうかを確かめるために、左右端の列
５５、５７の各々のピクセル値の総和とそれらと境を接
する列６３、６５の各々のピクセル値の総和が計算され
る。同様に、最上下端５９、６１の各々のピクセル値の
総和とそれらと境を接する行６７、６９の各々のピクセ
ル値の総和が計算される。もし、例えば列６３における
ピクセル値の総和が列５７におけるピクセル値の総和よ
りも大きくなる場合、すなわち窓５３が左方向へ一ピク
セル分移動することで列６３を含み、列５７を除外した
ときに窓内の総和（Ｓｗ）が増加する場合、窓は左方向
へ移動する。同様に、もし窓を一ピクセル分上方向へ移
動し、行６７を窓内へ含ませ、行６１を窓内から除外す
ることで窓内の総和（Ｓｗ）が増加するのならば、窓は
上方向へ移動することになる。従って、窓の縁の各行と
列のピクセル値の総和に対する、窓に隣接する（窓と境
をなす）各行と列のピクセル値の総和（蓄積カウント
値）の増減から、窓内のピクセル値の総和（Ｓｗ）を増
加するような窓の移動方向が決定される。

【００１８】図６で示されているように、以下のカウン
ト値に基づいて、窓内のカウント値（総和）は左方向へ
の移動に対しては１００まで増加し、また上方向への移
動に対しては１７０まで増加する。（右端−１）列カウント値＝０右端列カウント値＝０左端列カウント値＝１００（左端＋１）列カウント値＝１００（下端−１）行カウント値＝０下端行カウント値＝０上端行カウント値＝１７０（上端＋１）行カウント値＝１７０従って窓は左上方向に移動することになる。窓は総和Ｓ
ｗを増加する方向への移動を繰り返し、４方向（左、
右、上、下）への如何なる移動でも総和Ｓｗが増加しな
い状態になったとき窓の移動操作は停止される。この段
階で、文字を窓の中心とした窓による文字の枠設定（境
界設定、区分け化）が完了したものと見なされる。以上
のことから、実質的に文字を表したピクセル値からなる
マトリックスの窓による選択（枠設定）処理が完了す
る。枠設定された文字を表すために十分な情報（暗ピク
セルのグレースケール値）が窓内にあるかどうかを確認
するために、所定の確認用しきい値（例えばグレースケ
ール値が１００）を越える窓内のピクセルの総数を求
め、もし総数が例えば６０（Ｅ１３Ｂ型フォントに対し
て）以上となれば、文字が窓内に存在すると確認され
る。そうでなければ、窓により枠設定された対象はノイ
ズとして解釈され、次の文字の検索動作に移る。

【００１９】区分け処理の後、区分けされた（枠設定）
された文字は識別（認識）操作のための準備としてスケ
ーリング処理される。認識処理段階では１６−ビットワ
ードが使用されている（テンプレートの幅が１６ピクセ
ル）。文字の多くは（１９ピクセルの幅を有するＥ１３
Ｂ型文字を含む）１６ピクセルより幅広いので、区分け
処理の後にこれらの文字は１６ビットに変換される。こ
の変換は所定の列、例えばＥ１３Ｂ型の文字では列４、
９及び１４を除去（間引き）することで行われている。
（ＯＣＲＡ及びＯＣＲＢフォントは単位インチ当り２０
０ピクセルの割合で走査された場合は１６のピクセル幅
となり、列の間引きは不要となる）。

【００２０】以上は、処理操作のための準備として文字
の位置決め方法、例えば後の処理操作のために文字の文
書中の有効な位置づけと枠設定（区分化）方法について
述べたが、次に枠設定された文字の２進符号への変換
（２値化）と、文字の識別（分類／認識）を目的とする
テンプレートを用いた照合方法について述べる。

【００２１】変換（２値化）処理では、枠設定された文
字の各ピクセル行上の記憶されたグレースケールピクセ
ル値が２進符号に変換される。最初に、（前述したよう
な）枠設定された文字の暗ピクセルの算術平均を求め、
基準しきい値とする。次に、グレースケールピクセル値
を基準しきい値を基準として２進符号に変換する。例え
ば、もし求められた基準しきい値が１００であった場
合、以下に示される２進等値スケールを用いて、グレー
スケール値が８０、１２０、１３０、９０、８５、７
０、１１０、１３５からなる行は、図７の８−ビットワ
ード７１で示されるようなビットパターン０１１０００
１１の２進データに変換されることになる。グレースケールピクセル値２進等値 ≧１００１（黒）＜１０００（白）

【００２２】文字のこの（枠設定された文字のピクセル
行もしくはスライスを表す）２進データと他の行の２進
データが、各々が一文字に対応する複数個のテンプレー
トの各々と比較（照合）される。各テンプレートは所定
パターンの２進データを表し、異なる３つの層からなる
（ビット構造）。図７で示される３つの８−ビットワー
ド７３、７５、７７は各層中のある８−ビット行を表し
ている。第一の層（パターンワード７３に対応するビッ
トパターン層）は文字の実際の黒／白（０／１）ビット
パターンを表すものである。第二の層（ビット有効ワー
ド（BIT-SIGNIFICANCEWORD）７５に対応するビット有効
層）は文字の有意並びに非有意なビット位置を識別する
ために利用される。”１”ビットは文字の大きさと形状
での多少の変化にかかわらず文字のビットパターンが不
変なものとして見なすことができる有意なビット位置を
示すものであり、また”０”ビットは文字の異なる大き
さもしくは形状に対して同一でない非有意ビット位置を
識別するために利用される。第三の層（重み付けワード
７７に対応するビット重み付け層）は、どのビットが重
要なものであるか、すなわちどのビットが大きな重みを
有しているかを同定し、類似（実質的に類似した）文字
同志の識別を行うために利用されている。この第三の層
により、”１”ビットは重み付けされたビットとして、
また”０”ビットは重み付けされていないビットして指
定されることになる。例えば、文字”Ｏ”と”Ｕ”に
対するテンプレートの第三層の最上端行の”１”ビット
は２つの文字を区別するために利用されるものであり、
また文字”Ｑ”と”Ｏ”に対するテンプレートの第三層
の最下端行の”１”ビットは”Ｑ”と”Ｏ”とを区別す
るために利用されている。

【００２３】図７で示されるように、文字識別のために
プロセッサー２３（図１）によって様々な論理操作が行
われている。（論理操作は実際上１６−ビット操作によ
り行われている。しかし、簡単のために８−ビット操作
が示されている）。最初に、枠設定された文字のある行
の２進データ７１とビットパターン層の対応ワード７３
とで”排他的論理和”が行われ、２進データ７１と所定
の補正パターン７３とのミスマッチ（ずれ）パターン７
４が生成される。このミスマッチパターン７４とビット
有効層の対応ワード７５との論理積をとり、文字の大き
さと形状に無関係なミスマッチの程度を表したミスマッ
チワード７６を生成する。しかる後に、ミスマッチワー
ド７６と重み付け、例えばビット重み付け層の対応ワー
ド７７との論理積をとり、重み付けされたミスマッチイ
ンジケータ７８を生成する。（もし重み付けワード７７
が”１”ビットを含まなかった場合は、重み付けもしく
は論理積操作が完了されていないことになる（結果がゼ
ロとなるので処理時間を節約するために）。そしてシス
テムは次の２進データの処理に移る）。

【００２４】重み付け操作に引続き、２進データ７１の
行に対してミスマッチカウント値（ＭＣＲ）が求められ
る。この演算はプロセッサー２３（図１参照）により以
下のように行われる。ＭＣR ＝ＭＣW ＋（ＷＯＣＸＷＦ）．．．（１）ここで、ＭＣWはミスマッチワードに対するミスマッチ
カウント値（例えばミスマッチワード７６で見つけられ
たミスマッチの数）、ＷＯＣはミスマッチインジケータ
もしくは重み付け出力カウント値（例えば、ミスマッチ
インジケータワード７８で見つけられたミスマッチの
数）、並びにＷＦは所定の重み付け因子（例えば、Ｅ１
３Ｂ型文字に対しては整数２）を各々表している。従っ
て、図７のワード７６及び７８で示されるミスマッチビ
ットパターンに対しては、ＭＣW＝２、ＷＯＣ＝１、Ｗ
Ｆ＝２となる。これにより、２進データ７１の行に対し
て計算されたミスマッチカウント値（ＭＣR）は４（例
えば、式（１）に従って計算すると２＋（１Ｘ２））に
等しくなる。

【００２５】１つの行に対してミスマッチカウント値を
求めた後に、上述したように、システムは文字の残りの
全ての行に対するミスマッチカウント値を演算する。そ
の後文字の全ての行に対するミスマッチカウント値の和
をとり、テンプレートミスマッチカウント値（例えば、
枠設定された文字に与えられたテンプレートに対するミ
スマッチカウント値）を生成する。処理中のフォントに
対して設定された他の全てのテンプレートに対しても同
様のことが行われ、枠設定された文字に対する各テンプ
レートのミスマッチカウント値が生成される。様々なテ
ンプレートが処理されるにつれて、２つの最低のテンプ
レートミスマッチカウント値とそれらに関連したテンプ
レート番号がメモリ内に記憶される。文字を識別するた
めの判定基準は、もし最低のミスマッチカウント値を持
つテンプレートがあるしきい値（Ｅ１３Ｂ型フォントに
対しては４０の拒絶しきい値）以下であり、かつ次に低
いカウント値を持つテンプレートよりも所定量低い（Ｅ
１３Ｂ型フォントに対しては差が５）ならば、文字を識
別したことになる。。

【００２６】前述したように、テンプレートによる文字
認識は図８に示されるように合計９つの照合位置で行わ
れている。これは画像中のノイズ等の因子に起因して完
全には枠設定ができない文字をも識別するために行われ
るものである。図８の例では、テンプレートと入力（２
進データ）パターンの各サイズは２３行（高さ）Ｘ１６
列（幅）である。テンプレートの３つの層（パターン
層、ビット有意（有効）層ならびに重み付け層）はすべ
て同一量だけ同一方向に移動される。以下で述べる移動
照合位置についての記載では、テンプレート行はビット
パターン行、ビット有効行並びにビット重み付け行を意
味するものとする。

【００２７】中央照合位置８７では、テンプレート９６
は入力パターン９８上に直接重ねられ、行２及至２２の
みが照合操作（マッチング）に利用される。従って、テ
ンプレート行２はパターン行２と比較され、テンプレー
ト行３はパターン行３と比較され、その他のテンプレー
ト行も同様に対応するパターン行と比較される。水平中
央照合位置８１、８７、９３では全ての列（１及至１
６）が利用される。上部中央照合位置８１では、１及至
２２のテンプレート行が入力パターンの２及至２３の行
と比較される。これはテンプレートパターンを一行分垂
直上方向へ移動した場合と同じである。この場合、テン
プレート行１は入力パターン行２と、またテンプレート
行２は入力パターン行３と比較され、他のものも同様に
比較される。テンプレートと入力パターンの全ての列は
この状況下（水平中央照合位置）で比較される。同様
に、下部中央照合位置９３では、テンプレートは一行分
下に移動されており、従ってテンプレート行２及至２３
と入力パターン行１及至２２の照合操作が行われる。水
平移動照合位置はテンプレート９６を左もしくは右に入
力パターン上を移動させる操作に対応している。中央左
照合位置８５では、テンプレート列１及至１５と入力パ
ターン列２及至１６とが利用されている。（この位置は
垂直方向には中央位置にあるので、入力パターンとテン
プレート共に２及至２２の行が利用されている。）従っ
て、テンプレートワードビット１はパターンワードビッ
ト２と比較され、テンプレートワードビット３はパター
ンワードビット４と比較され、以下同様な比較がなされ
る。例えば、テンプレートパターン層のワードが００
１１１１１１００００１１１１で入力文字パターンワー
ドが００１０１１１１０００１１１１０であれば、テン
プレートは一ビット（列）左へ移動し００１１１１１１
００００１１１１となり、さらに排他論理和操作の結果
は０１０１０００１００００００００となる。左移動操
作を行うときは最右端ビット（最少桁ビット、ＬＳＢ）
が０であることを注意すべきである。従って、ビット有
効ワードのＬＳＢも０となり（全ての３つの層が同一方
向に同一量だけ移動するので）、ミスマッチワード７６
の（ビット有効ワード７６を用いた論理積操作の後の）
ＬＳＢは常に０となる。同様に、右方向への移動は最左
端のビット（最上桁ビット、ＭＳＢ）を０ビットにし、
（論理積後の）ミスマッチワード７６のＭＳＢは常に０
ビットとなる。

【００２８】右（照合位置８９）方向への水平移動は単
なる反対方向への移動であり、左方向への移動と類似し
たものであるので、テンプレートワードのビット２は入
力パターンワードのビット１に沿って一列に並べられる
（比較される）。

【００２９】角の照合位置（位置９５、９１、８３、７
９）は一行の垂直移動と一列の水平移動の組み合せに対
応するものである。一例として、左上の照合位置７９で
は、テンプレートの行１は一ビット分左へ移動されて、
パターンワード２と比較されている。また、テンプレー
トの行２は一ビット分左へ移動されてパターンワード３
と比較され、以下同様の移動と比較がなされる。

【００３０】この方法を用いた文字認識には、１個のテ
ンプレート当り９個のパス（照合位置）と文字集合体の
認識に必要とされるテンプレートの数との積数のパスが
必要となる。例えば、４９文字を用いて設定されるアル
ファベット文字では、合計４４１（９Ｘ４９）の照合操
作が必要となるが、これは時間の無駄である。文字の識
別を迅速にするためには、最初は各テンプレートの中央
照合位置のみを入力パターンと比較する。各テンプレー
トの処理が行われるにつれて、最低の２つのミスマッチ
カウント値とそれらの対応するテンプレート番号がメモ
リ２７に記憶されていく。最初の照合位置（中央照合位
置）での照合操作の終了段階で、これらの２つのテンプ
レートのみの他の８つの照合位置に対する照合処理が行
われ、入力パターンに対する最も可能性の高い（例えば
最低の）全ミスマッチを見つけ出す。この手法による
と、６５（１Ｘ４９＋２Ｘ８）だけの照合操作が通常必
要とされるだけである（例えば、必要とされていた４４
１個の照合操作のうちの１５％に対応する）。

【００３１】次に文字の受理並びに拒絶の判定基準につ
いて以下述べる。

【００３２】最低のテンプレートミスマッチカウント値
とそのテンプレートが表す文字に対する所定の拒絶しき
い値とが比較される。もしこの文字に対するテンプレー
トのミスマッチカウント値がこのしきい値よりも小さ
く、かつ２つの最低のテンプレートミスマッチカウント
値の差（二番目の最低ミスマッチカウント値−最低ミス
マッチカウント値）が所定値（例えば１０）以上であれ
ば、最低のテンプレートミスマッチを与えるテンプレー
トが枠設定された文字を表す（識別する）ことがわか
る。２つのミスマッチカウント値が近すぎるかどうかを
調べる理由は、非常によく似た文字（例えば、ＱとＯ）
とを区別するためである。もし互いのミスマッチが類似
したものである場合は、識別ミス（誤読取）という危険
を冒すよりはむしろ文字を拒絶した方がよい。上述した
拒絶しきい値以下のミスマッチカウント値を有するテン
プレートがない場合、または２つのテンプレートによる
ミスマッチカウント値が余りにも近い場合は、（以下で
述べる）後処理操作が行われる。後処理操作の後に依然
文字が拒絶される場合は、その画像がより強化され、
（以下で述べる）２進符号に変換され、（上述した）認
識処理が再び行われる。

【００３３】中央の照合位置でのみ認識処理を施すこと
は、その位置で得られた２つのミスマッチカウント値に
よる文字よりも、他の照合位置で得られたミスマッチカ
ウント値による文字が真の文字に近い場合が有り得るこ
とを無視することになる。後処理操作はこのような状況
を考えて行われるものである。もし選択された２つの最
低ミスマッチカウント値を有する２つの文字が各々の文
字に対する所定拒絶しきい値の両方とも越えるものであ
るか、もしくは（二番目の最低ミスマッチ文字と最低の
ミスマッチ文字間の）文字間距離が余りに短い場合は、
よりよい照合を与えるための試みとして、他の多数のテ
ンプレートに対しても他の８つの照合位置による照合処
理が行われてもよい。どのテンプレートを処理操作のた
めに選択するかは、例えばそれらのテンプレートに対す
る最も親密な文字の類似性に基づいて行われる。例え
ば、（両方とも最低ミスマッチカウント値を有してい
る）互いに最も親密な文字、例えば文字ＤとＯが選ばれ
たとき、これらは各々に拒絶しきい値以上のミスマッチ
カウント値を有している。後処理操作では、ＤとＯに類
似した所定の文字群、例えば０（ゼロ）、Ｑ，Ｃ、Ｕが
処理を受ける。この操作の後の２つの近接文字のミスマ
ッチカウント値が調べられ（最初に最低のミスマッチカ
ウント値を有する文字が調べられる）、それらが拒絶判
定基準並びに文字間距離の判定基準を満たすかどうかが
調べられる。少なくとも一つの文字が判定基準を満たす
とき、その文字が処理結果として認識処理に戻され、次
の文字に対する処理が行われる。

【００３４】両文字とも判定基準を満たさないか、また
は文字間距離が余りにも短い場合は、枠設定された文字
は拒絶される。この場合、（以下で述べるように）画像
が強化され、文字は再度２進符号に変換され、上述した
認識処理が再度繰り返される。もし文字が認識されれ
ば、それは認識処理操作へ戻される。そうでなければ、
拒絶文字コードが結果として処理操作へ戻され、文書上
の次の文字の（位置決め並びに枠設定）処理が行われ
る。

【００３５】上述した拒絶しきい値に加えて、出力しき
い値（例えば値１０）が以下で述べる文字識別において
使用されてもよい。処理速度を高めるために引き続くテ
ンプレートミスマッチカウント値が出力しきい値と比較
され、出力しきい値以下のテンプレートミスマッチカウ
ント値を有する最初のテンプレートを用いて文字が識別
される。どちらの場合においても、残りのテンプレート
は（処理速度を高めるために）処理されない。

【００３６】さらに、文字識別処理を迅速にするため
に、テンプレートの個々の行を処理しながら、現在のテ
ンプレート（現在処理されているテンプレート）のミス
マッチカウント値がこれまで得られた二番目の最低のカ
ウント値よりも大きいことが分かった場合に、この現在
のテンプレートの最低のテンプレートミスマッチカウン
ト値を有した２つのテンプレートのうちの一つでないこ
とが明かとなるので、現在のテンプレートの処理を中断
してもよい。さらに認識速度を高めるために、テンプレ
ートはそれらがもっとも頻繁に発生する順番に（使用頻
度順に）（例えば英数字フォントの中の子音が続く母音
の前の数字）予め配置しておくとよい。もしミスマッチ
カウント値が（上述した）出力しきい値以下であれば、
残りのテンプレートを調べる必要はない。以上述べたよ
うに使用頻度の高い文字を最初に調べるべきである。さ
らに文字識別を迅速にするためには、テンプレートによ
り中央の照合位置のみについて照合を行い、しかるの後
に、もし最低ミスマッチカウント値が出力しきい値より
も高ければ、出力しきい値に最近接の２つのテンプレー
トの各々の残り８つの照合位置についても処理を行い、
最低のテンプレートミスマッチカウント値を有するテン
プレートをその文字を表すものとして選択する。さらに
識別処理を速めるために、残り８つの照合位置（図８）
について７９、８１、８３、８５、８９、９１、９３、
９５の順に処理を行うとよい。これは文字が最も頻繁に
位置する順序である。

【００３７】枠設定された文字を識別した後、区分け窓
を前回枠設定された文字の左に選択された数のピクセル
分（例えば３ピクセル分）移動することで、システムは
次の文字の処理（例えば、枠設定された文字に近接する
文書上の領域を表す次のピクセル値群の処理）に移行す
る。次に、この近接領域中の文字は枠設定（区分け）さ
れ、上述したように識別処理を受ける。残りの全ての文
字（記憶された残りのピクセルデータ）が、最終のフィ
ールドが検出されるまで（例えば、位置決めすべき文字
がなくなるか、または最終フィールドの文字が位置決め
されたとき）上述のように処理される。

【００３８】文字識別処理で文字が拒絶されれば、その
文字画像は強調され（前述したように）、識別処理が促
進される。文字画像の強調は、例えば、一定のストロー
ク幅（文字の各垂直もしくは水平ストロークの幅に亘る
一定数の暗ピクセル）を有する文字画像を作成すること
で行われる。これは以下のようにして行われている。最
初に、文字を表すグレースケールピクセル値（例えば、
６−ビット、８−ビット、もしくは１６−ビット）をそ
れよりも低いレンジのビット値へ（例えば、より処理速
度を高めるために、３−ビットグレースケールピクセル
値へ）変換する。しかる後に、文字画像の各々のピクセ
ルが調べられ、そのストロークの中で最も暗い２つもし
くは３つのピクセルが黒とされ、他のピクセルは白とさ
れる。これにより、例えば米国特許番号４、６２５、３
３０により開示された一定ストロークを有した２進符号
化された画像が生成される。

【００３９】文字識別処理を高める手助けとして、各文
字の縁を以下の様に処理してもよい。すなわち、上述し
たように、文字識別処理で使用される各テンプレートは
選択された文字群（例えば、Ｅ１３Ｂ型文字群）のどれ
か一つの文字に対応している。また、図２、４で示され
ているように、各文字は１４個のピクセル幅と２１個の
ピクセル高さを有している。１つの余分な列を、文字の
左と右に各々付加し、さらに１つの余分な行を文字の上
端と下端に各々付加する。この結果、文字サイズは１６
Ｘ２３となる。各文字に対応して、各テンプレートは１
６個のピクセル幅と２３個のピクセル高さになる。各テ
ンプレートは、１４個の列と２１個の行からなる文字の
各側部（左右端）に余分の列と、各上下端に余分の行を
有することになる。各余分の行は１６個の白ピクセルか
らなり、各余分の列は２３個の白ピクセルからなってい
る。余分の行と列は１４Ｘ２１の画像領域を白ピクセル
により縁取ることで、以下述べる様に文字縁部を良好に
識別処理することが可能となる。例えば、文字”Ｅ”が
１４Ｘ２１の”Ｆ”テンプレートと照合され、テンプレ
ートが上へ一ピクセル分移動したとき、”Ｅ”の最下端
のピクセル値が失われ、このピクセル値はテンプレート
ミスマッチカウント値を生成することに利用されなくな
る。この結果、ミスマッチカウント値が低いので”Ｅ”
が”Ｆ”として誤同定されることになる。１６Ｘ２３の
テンプレートを用いた場合、”Ｅ”の最下端のピクセル
値は失われず、従って、”Ｆ”テンプレートの最下端の
白列に対するミスマッチカウント値に実質的に寄与する
ことができるので、”Ｅ”を”Ｆ”と誤同定することが
なくなる。また同様なことは、１６Ｘ２３のテンプレー
トを用いた場合の左右の列位置についても成り立つ。す
なわち、”Ｂ”を誤って”３”と同定する誤同定が回避
されることになる。

【００４０】図９で示されるように、各１６Ｘ２３のテ
ンプレートはＲＡＭ２７の６９個のの１６−ビットワー
ド（単位インチ当り２００ピクセルの走査に対応）によ
って表すことができる。６９個のワードのうち、２３個
のワードにより第一の層のビットパターンワードが、ま
た２３個のワードにより第二の層のビット有効ワード
が、さらに残りの２３個のワードにより第三の層のビッ
ト重み付けワードが各々表されている。各組の２３個の
ワードは文字の高さに対応しており、各１６−ビットワ
ードは文字の幅に対応している。（図７では、簡単のた
めに１６−ビットではなく８−ビットを用いて論理演算
が描かれている。）

【００４１】光学的文字認識のためのカスタムフォント
の生成

【００４２】これまでは標準文字フォント（例えばＥ１
３Ｂ型フォント）の認識方法について述べてきたが、以
下では利用者指定のカスタムフォントの認識方法につい
て述べる。特に、利用者指定のカスタムフォントを定義
する（表わす）ためのシステムによるテンプレートの生
成について述べる。

【００４３】前述したような文書の読取操作と画像の読
取データ（グレースケールピクセル値）のメモリへの記
憶操作に引続き、記憶プログラムの中の所定の選択され
たルーチンが以下で述べるような方法で記憶データの処
理前に初期設定される。このルーチンにより利用者指定
フォントの生成と処理（区分化と認識操作）とが可能と
なる。ルーチンはキーボート（もしくはマウス等の入力
装置）を介して以下の命令を行うことで初期設定され
る。ＡＵＴＯＦＯＮＴＯＣＲＢＤ２００１．ＧＲＹここで、ＡＵＴＯＦＯＮＴとは実行すべきプログラムの
名前であり、ＯＣＲＢとは生成すべきフォントに与えら
れた基本名であり、Ｄ２００１．ＧＲＹとは処理すべき
画像ファイル名を表している。メモリ２７に記憶されて
いるプログラムＡＵＴＯＦＯＮＴによりディスクドライ
ブ３１のアクセスとファイルＯＣＲＢ．ＦＮＴがオープ
ンされる。ファイルがディスク上に記憶されているのな
らば、その内容（テンプレートデータ）がメモリ２７へ
入力され（読み込まれ）、既に述べたように読取文字の
区分け化と認識操作に利用される。ファイルになけれ
ば、利用者は処理段階でシステムにより処理される文字
の大きさを指定（入力）しなければならない。利用者に
所定文字サイズの指定を行わせるために、次の内容が端
末器により表示される。１．ＯＣＲＡもしくはＯＣＲＢ文字サイズ２．Ｅ１３Ｂ文字サイズ３．７Ｂ文字サイズ４．１０文字／インチ−６ライン／インチサイズ５．ピッチサイズの登録６．実際の文字ピクセルサイズの登録この表示に対して、利用者は１及至６の番号のどれかを
入力すればよい。１及至４の番号のどれかを入力する
と、特定フォント（文字の型／スタイル）に適した所定
の文字サイズがシステムにより選ばれる。例えば、番号
２が入力されると、前述したように、１７ｘ２４のピク
セルからなる文字サイズ（例えば、１６ｘ２６の縮小さ
れたテンプレートサイズに対応する、１７ピクセル幅ｘ
２４ピクセル高さの文字サイズ）がＥ１３Ｂ型の文字に
対して利用されることになる。メニュー画面により選択
された文字サイズに対しては、２００ピクセル／インチ
の分解能が与えられている。

【００４４】所望の文字サイズがメニュー画面の１及至
４で表される標準の文字サイズでない場合、利用者は所
望のカスタムフォントのピッチ（例えば８文字／イン
チ）を指定することでカスタムサイズを指定することが
できる。これは以下の情報を以下の順番に従って利用者
が入力することで達成される。１．利用者は番号”５”を入力する。これにより”ピ
ッチを入力せよ”が表示される。２．利用者は番号”８”を入力する。

【００４５】他方、利用者は以下の情報を以下の順番で
入力することで文字の実際のピクセルサイズ（例えば１
２ピクセル幅Ｘ２０ピクセル高さ）を指定することがで
きる。１．利用者は番号”６”を入力する。これにより”文
字高さを入力せよ”が表示される。２．利用者は番号”２０”を入力する。これにより”
文字幅を入力せよ”が表示される。３．利用者は”２０”を入力する。

【００４６】利用者による文字のサイズ情報の入力が完
了すると、数字（０及至９）とそれらに与えられたテン
プレートからなる初期文字群が生成される。（最初は文
字が検出されていないので、これらのテンプレートのビ
ットパターン層の各ビットは黒（”１”）に、ビット有
効層のビットはすべて”１”に、さらに重み付け層のビ
ットはゼロに設定されている）。これはほとんどのフォ
ントには数字が含まれているからである。

【００４７】しかる後、上述の定義された文字の各々に
対して統計ファイル（Ｓｔａｔｓファイル）が作成され
る。統計ファイルは以下のものからなる：（１）その文字が認識される回数のカウント値を表す
（文字−頻度ワードである）１６−ビットワード（こ
のワードは統計ファイルが作成されたときはゼロに初期
設定されている）と、（２）文字のピクセル幅と高さ
の値を保持する２つの８−ビットワード（これらのワー
ドは上述したように利用者により入力された値に初期設
定されている）と、（３）各々が文字の各ピクセル位
置に対して与えられた１６−ビットワード（ビット−頻
度ワード）のアレイ。例えば、２６個のピクセルの高さ
と１６個のピクセルの幅からなる文字では２６Ｘ１６
個、すなわち４１６個のビット−頻度ワードが用いられ
ている。（認識処理において、幅は常に最大１６ピクセ
ルまでスケーリング処理を受けることができることに注
目すべきである。）これらのワードは統計ファイルの作
成時にはゼロに初期設定されている。

【００４８】次に、画像（メモリに記憶されたピクセル
データ）に基づいて画像の区分けと２値化処理が行わ
れ、認識処理（例えば、前述したように２値化文字を認
識ルーチンに通す）が行われる。文字が認識された場
合、統計ファイルとテンプレートとが以下の様に更新さ
れる。一方、文字が認識されなかったならば（例えば、
拒絶されたならば）２値化された文字画像が利用者にそ
の文字が何であるかを考えさせるために”文字入力せ
よ”とのメッセージとともに端末器２９の表示器３０
（図１参照）に表示される。利用者はこれに応えてキー
ボード２８を介して文字（例えば”３”）を入力する。
そしてこの入力された文字が文字群の構成文字であるか
どうかを調べ、もしそうでなければその文字を文字群に
加え、対応するテンプレートと統計ファイルを作成す
る。

【００４９】この段階では、区分けされたパターンが利
用者自信により入力されたか、または予め定義されてい
る文字の場合は認識ルーチンにより認識されているの
で、その区分けされたパターンがどの文字を表すものか
が（例えば”３”）システムにより理解されている。次
に、その文字に対する統計ファイルが以下の様に更新さ
れる。まず、文字−頻度ワードがインクリメントされ、
文字パターン中の各ピクセル位置が調べられる。もしピ
クセルが黒（２進数の”１”で表されている）であれ
ば、アレイ中の対応するビット−頻度ワードがインクリ
メントされる。一方、もしピクセルが白（２進数の”
０”で表されている）であれば、ビット−頻度ワードは
更新されない。例えば、行１２、列１５のピクセルが黒
であれば、その位置を表すビット−頻度ワードがインク
リメントされる。

【００５０】文字用統計ファイルの更新が完了したと
き、その文字に対するテンプレート（前述したようにビ
ットパターン層、ビット有効層及びビット重み付け層か
らなる）も更新される。統計ファイルの内容に基づいて
ビットパターン層とビット有効層とが作成される。ピク
セルが黒であった回数のカウント値（ビット−頻度ワー
ド）が検出されたパターンの数（文字−頻度ワード）と
比較される。

【００５１】ビット−頻度値が文字−頻度値の例えば９
０％以上であった場合は、作成中のビットパターン層の
対応ビットが”１”（黒）に設定され、さらに作成中の
ビット有効層の対応ビットが”１”に設定される。ま
た、ビット−頻度値が例えば文字−頻度値の例えば１０
％以下であった場合、作成中のビット−パターン層の対
応ビットが”０”（白）に設定され、さらにビット有効
層の対応ビットが”１”に設定される。さらに、ビット
−頻度値が文字−頻度値の１０及至９０％の範囲にあっ
たならば、作成中のビット−パターン層の対応ビット
が”０”に設定され、かつビット有効層の対応ビット
が”０”に設定される。同様に、表示文字の残りの各ピ
クセルに対しても、作成（生成）中のビット−パターン
層とビット有効層の対応ビットがこれらの２つの層の作
成が完了するまでに”１”か”０”に設定される。

【００５２】初期段階では、生成中の各ビット重み付け
層の全てのビット（ピクセル）は”０”（非重み付け）
に設定されている。文書の処理が完了したとき（例え
ば、読み込み線上の全ての文字が処理された後）、各テ
ンプレートの重み付け層は以下の様に更新される。

【００５３】重み付けが必要かどうかを決定するため
に、各テンプレートは以下の方法で他のテンプレートの
各々と順番に比較される。例えば、テンプレート１を第
一のテンプレートとし、残りのテンプレートを第二のテ
ンプレートとする。最初に、第一のテンプレートの重み
付け層を”０”に設定し、第二のテンプレートを”１”
に設定する。選択された第二のテンプレートのビットパ
ターンワードと第一のテンプレートのビットパターン層
との排他的論理和操作（図７で示される操作と類似した
操作）が行われる。この処理結果と第一のテンプレート
のビット有効ワードとの論理積処理が行われ、（前述し
た通常認識処理で行われたような）ミスマッチカウント
値が得られる。この処理はテンプレートにおける全ての
ワードに対して行われる。もし２つのテンプレートに対
する全ミスマッチが文字間しきい値（例えば１０）以下
であれば、ＯとＱの様な類似文字に対するミスマッチカ
ウント値を分離（区別）する試みとして重み付けがなさ
れる。もしミスマッチカウント値が後処理しきい値（例
えば４０）以下であれば、認識処理に関して前述したよ
うに、第二のテンプレートが表す文字が後処理に対する
リストに加えられることになる。さらに、全ての第二の
テンプレートが処理を受ける（展開される）まで次々に
第二のテンプレートが上述のように処理を受けていく。
その後、新しい第一のテンプレートが選ばれ、（上述し
た）同様の処理が各テンプレートが全ての他のテンプレ
ートと比較されるまで行われる。

【００５４】２つのテンプレートの全ミスマッチが上述
した文字間しきい値よりも小さい場合、以下のように重
み付けが行われる。すなわち、第一のテンプレートのパ
ターンワードと第二のパターンワードとの排他的倫理和
をとり、その結果と第二のテンプレートのビット有効ワ
ードとの論理積をとる。さらに論理積の結果と第一のテ
ンプレートのビット有効ワードとの論理積をとり、第三
の結果を得る。この第三の結果における”１”ビットは
２つのテンプレート間で異なり、かつ重要なものであ
る。従って、これらのビットの重み付けはこれらの２つ
のテンプレート間のミスマッチカウント値を増加するこ
とになる。従って第一のテンプレートの重み付けワード
とこの最終結果との論理和がとられる。同じ操作がテン
プレート中の残りのワードに対しても行われる。

【００５５】各文字に対するビットパターン層、ビット
有効層並びにビット重み付け層の生成が完了すること
で、システムは完成された一群のテンプレートを有する
ことになる。システムはこの新たに生成したテンプレー
ト群を後の使用のためにディスク上に記憶し、次の読取
認識操作による文字認識に利用する。

【００５６】上述した論理処理操作等の処理を行うため
に記憶されたプログラムの擬似コードリストを以下に示
す。 PROCEDURE: MAIN IF (fongt file exists) { LOAD FONT FILE } else { MAKE NEW FONT } While (NOT END OF DOCUMENT) { if (FIND FIRST CHARACTER) finds a character { RECOGNIZE FIELD } else { END OF DOCUMENT } } UPDATE POST PROC UPDATE TEMPLATE WEIGHTS SAVE FONT PROCEDURE: MAKE NEW FONT GET CHARACTER SIZE INITIALIZE CHARACTER SET INITIALIZE TEMPLATES INITIALIZE STATS FILES PROCEDURE: FIND FIRST CHARACTER do { SCAN IMAGE FOR WHITE TO BLACK TRANSITION } until(FOUND CHARACTER or END OF DOCUMENT) PROCEDURE: RECOGNIZE FIELD do { RECOGNIZE CHARACTER if (reject) { GET CHARACTER FROM KEYBOARD } if (character i="?") { if (character NOT in character set) { UPDATE STATS FILE UPSATE TEMPLATE FILE UPDATA FONT TABLE } MOVE TO NEXT CHARACTER POSITION } WHILE (FOUND CHARACTER) PROCEDURE: RECOGNIZE CHARACTER BINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER if (character is rejected) { ENHANCE AND REBINARIZE CHARACTER IMAGE TEMPLATE RECOGNITION OF CHARACTER }

【００５７】

【発明の効果】本発明の光学式文字認識システムによる
と、利用者により未定義フォントの登録が可能となり、
銀行為替手形や銀行小切手等の文書上に記録されたＥ１
３Ｂ，ＯＣＲＡ，ＯＣＲＢ，ファーリントン７Ｂ型フ
ォント等の標準フォントに加えて、規格外フォントとカ
スタムフォントの光学式文字認識が可能となる。

【図面の簡単な説明】

【図１】利用者端末器と共に示した、本発明の光学式文
字認識システムの概略図である。

【図２】図１のシステムにより読み取られ、識別される
べき文字の外観を示した図である。

【図３】様々な文字を記録した文書の一部を示す図であ
る。

【図４】異なる不透明度（グレースケール値）のピクセ
ルマトリックスからなる読取文字を示す図である。

【図５】文字の枠設定に利用される窓（ウィンド）を示
す図である。

【図６】図４で示される文字を枠設定するために用いる
図５の窓を示す図である。

【図７】読取文字を表す２値化データに対する様々な論
理演算処理の結果を示す図である。

【図８】枠設定文字に対する様々な照合位置を表すマト
リックス概略図である。

【図９】図１のシステムで利用されるテンプレートとそ
れに関連した２進符号値の概略図並びに表である。

【符号の説明】

１３光学スキャナー１５ＣＣＤ１７制御器１９文書２１コンピュータシステム２３マイクロプロセッサー２５ＲＯＭ２７ＲＡＭ２９端末器３１補助記憶装置

───────────────────────────────────────────────────── フロントページの続き (72)発明者レイモンドエル．ヒギンズカナダエヌ２エヌ２エム１、オンタリオ、キツチナー、イエローバーチドライブ 25

Claims

【特許請求の範囲】

【請求項１】文書上の文字を読取り、認識するための光
学式文字認識装置を用いて、未認識の文字を認識可能と
することで一連の文字認識操作を可能とする方法であっ
て、該未認識文字を、明暗ピクセルのパターンからなる画像
として表示する過程と、該未認識文字を識別するための利用者指定文字を入力す
る過程と、利用者による指定定義文字に類似するものとして認識さ
れた文字（各認識された文字は複数のピクセル位置上で
明暗どちらか一方のピクセルを有する）の読取数を表す
文字カウント値を生成する過程と、利用者指定の文字に類似した該認識文字の各ピクセル位
置での文字のピクセルが暗ピクセルであった回数を表す
ピクセルカウント値を各ピクセル位置で生成する過程
と、文字カウント値に対する対応ピクセルカウント値の大き
さに依存して各ピクセル位置が明暗どちらか一方のピク
セルを有した、未認識文字を表すテンプレートを生成す
る過程とからなることを特徴とする光学式文字認識方
法。
【請求項２】文書上の文字を読取り、認識し、未認識
文字を拒絶するための光学式文字認識システムにおい
て、未認識文字を認識可能とすることで一連の文字認識
操作を可能とする光学式文字認識装置であって、該未認識文字を、明暗ピクセルのパターンからなる画像
として表示する手段と、該未認識文字を識別するための利用者指定文字を表すデ
ータを入力する入力手段と、入力データに応じ、利用者による指定定義文字に類似す
るものとして認識された文字（各認識された文字は複数
のピクセル位置上で明暗どちらか一方のピクセルを有す
る）の読取数を表す文字カウント値を生成する手段と、利用者指定の文字に類似した該認識文字の各ピクセル位
置での文字のピクセルが暗ピクセルであった回数を表す
ピクセルカウント値を各ピクセル位置で生成する手段
と、文字カウント値に対する対応ピクセルカウント値の大き
さに依存して各ピクセル位置が明暗どちらか一方のピク
セルを有した、未認識文字を表すテンプレートを生成す
る手段とからなることを特徴とする光学式文字認識装
置。