JPH04361391A - 光学的文字認識システムおよび方法 - Google Patents

光学的文字認識システムおよび方法

Info

Publication number
JPH04361391A
JPH04361391A JP3356742A JP35674291A JPH04361391A JP H04361391 A JPH04361391 A JP H04361391A JP 3356742 A JP3356742 A JP 3356742A JP 35674291 A JP35674291 A JP 35674291A JP H04361391 A JPH04361391 A JP H04361391A
Authority
JP
Japan
Prior art keywords
character
document
template
characters
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3356742A
Other languages
English (en)
Inventor
Raymond L Higgins
レイモンド エル.ヒギンズ
Dennis W Golem
デニス ダブリュー.ゴーレム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR Voyix Corp
Original Assignee
NCR Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR Corp filed Critical NCR Corp
Publication of JPH04361391A publication Critical patent/JPH04361391A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文書の走査および一般的
に英数字の認識に関し、特にE13B、OCRA、OC
RB、およびファリントン7B型フォント等の英数字の
光学的走査および認識に関する。
【0002】
【従来の技術】E13B、OCRA、OCRB、および
ファリントン7B型フォントは米国および他の外国で経
理上受け入れられ、使用されている。一般的に、これら
の文字は銀行為替、小切手その他の経理文書上に記録さ
れる。例えばE13B型のフォントは一般に磁気スキャ
ナで走査できるようにするため、MICR(磁気インク
文字記録)形式で記録される。
【0003】保存記録および証拠として、文書の走査お
よびそのイメージを記録するためにしばしばビデコンカ
メラシステムが使用される。その一方別のオペレーショ
ンで磁気インク文字(例えばE13B文字)を読むため
、磁気走査システムが使用される。別個のオペレーショ
ンを行うために二つの別個の走査システムを必要とする
ことは経費が嵩み、また時間がかかる。さらにE13B
、OCRA、OCRB、およびファリントン7B型フォ
ントの処理を行うハードウェアはしばしば複雑で経費が
高く、文字認識を行なうのに不等に時間が掛かる。また
そのようなハードはしばしばイメージ全体を二進化する
際、二進化イメージにノイズを導入し、その結果データ
イメージの損失を来たし、認識プロセスを一層困難にす
る。
【0004】二つのシステムと二つのオペレーションを
必要とするようなイメージ走査および文字認識を与え、
かつ著しくノイズとイメージ処理時間を低減する方法が
必要であり、また有用である。
【0005】
【発明が解決しようとする課題】したがって本発明は別
個の磁気走査システムおよび別個の磁気走査オペレーシ
ョンの必要をなくし、イメージデータの損失を来たさず
にノイズおよびイメージ処理時間を低減する光学的文字
認識のシステムおよび方法を与えることを課題とする。
【0006】
【課題を解決するための手段】本発明は第一の局面から
見ると、光学的文字認識システム(装置)であって、(
a)文字および文書がいろいろの不透明さを有し、その
不透明さに対応する複数のグレースケールピクセル値を
発生し、文書上の英数字を光学的に走査するCCDスキ
ャナと、(b)該グレースケールピクセル値、プログラ
ム、および複数の予定の二進法パターンを格納すべく配
置されたメモリにして該パターンの一つが該文字を表す
ようにされたメモリと、(c)該走査装置および該メモ
リ装置とに結合されたプロセッサであり、該プログラム
の制御の下に動作し、該グレースケールピクセル値から
文字を表すマトリックス値(値のマトリックス)を選択
することにより該文書上の文字位置を定め、該マトリッ
クス値を二進データに変換し、該複数の予定二進パター
ンの中から該変換された二進データに一致するパターン
を選択し、該一致したパターンから該文字を同定するよ
うにされたプロセッサとを含む光学的文字認識システム
である。
【0007】このCCDスキャナは制御論理回路を含み
、プロセッサはマイクロプロセッサを含み、メモリはブ
ートルーチンを備えたROM(読み取り専用メモリ)と
、プログラム、ピクセル値、および二進パターンを備え
たRAM(随時アクセスメモリ)とを含む。
【0008】本発明の第二の局面は、文書と文字が異な
る不透明さを有し、該文字が複数の予定の二進法パター
ンの一つで表される該文書上の英数字を光学的に同定す
る方法であって、(a)文書上に記録された文字を光学
的に文書を走査すると共に、該不透明さに対応した複数
のグレースケールピクセル値を発生するステップと、(
b)該グレースケールピクセル値から文字を表すマトリ
ックス値を選択することにより該文書上の文字位置を定
めるステップと、(c)該マトリックス値を二進データ
に変換するステップと、(d)該複数の予定二進パター
ンの中から該変換された二進データに一致するパターン
を選択し、該一致したパターンから該文字を同定するス
テップとを含む光学的文字同定方法である。
【0009】文字(すなわち文字を表すグレースケール
ピクセル値)を位置定めるにあたり、本システムは当該
文字に属する選択したピクセル値の上に窓(ウインドウ
)を配置する(以下これを、文字を枠入れする、とも言
う)。この枠入れはこのウィンドウ内の選択ピクセル値
の和が最大となるように行う。これは当該選択ピクセル
値(予定しきい値より高いピクセル値を表すもの)のう
ち選択したものの算術平均を決定することにより行う。 予定しきい値は文字のバックグラウンドレベル(文字の
予備走査で決定される)より大きな値を表す。システム
は次いでこの選択ピクセル値を、前記平均値に相対的な
二進データに変換する(すなわち各選択したピクセル値
が平均値より小さいか、または平均値以上であるかに応
じて1または0に変換する)。この二進データは次いで
当該文字を最も良く同定する一致パターンが見つかるま
で予定の二進パターン各々と論理比較される。これら予
定二進パターンは二進テンプレートを表し、各パターン
(テンプレート)は3ビットのコンフィギュレーション
(レベル)を有し、最初のビットコンフィギュレーショ
ンは当該文字の現実のビットパターンを表し、第二ビッ
トコンフィギュレーションは実際のビットパターンのビ
ットの有意性を表し、第三ビットコンフィギュレーショ
ンは実際のビットパターンのビットに対する重み値を表
す。変換された二進データが各予定ビットパターンの3
ビットパターンコンフィギュレーション各々と比較的上
論理的に一致する程度はミスマッチワードとして表現さ
れ、これからミスマッチカウントが計算される。このミ
スマッチカウントは次いで少なくとも一つの予定しきい
値と比較され、しきい値以下の最低のミスマッチカウン
トが当該文字を表すとして選択される。
【0010】上述したように、本システムはグレイスケ
ールイメージから文字の断片化を行い、断片化した文字
をその後の認識に対して二進化する。先行技術システム
がするように文字認識のためにイメージ全体を二進化す
ることはしない。また先行技術によるそのようなイメー
ジ全体のイメージ化は走査データ中に不当なエラー(ノ
イズ)を導入するが、本発明の方法は文字断片化プロセ
スにおいてグレイスケール値を使用することにより、そ
のようなエラーを低減する。さらに本システムは単にフ
ォントのテンプレート表を格納するだけでいろいろのフ
ォント(すなわちいろいろの解像度のいろいろの文字)
を認識することができる。
【0011】
【実施例】図1を参照すると、本発明のシステム(装置
)11が示されている。このシステムは文書19を走査
するための光学的読取り機またはスキャナ13、および
スキャナ13から受信したデータを処理するコンピュー
ターシステム21を含む。このスキャナはCCD(電荷
結合デバイス)15および制御器17を備えたカメラで
よい。文書19は銀行為替または上に数字または英数字
20を印刷された小切手等である。コンピューターシス
テム21はマイクロプロセッサ23、ブートプログラム
を備えたROM(読み取り専用メモリ)25、および走
査デバイスとマイクロプロセッサからのデータを格納し
、また予め定義されたデータを格納するためのプログラ
ム付きRAM(随時アクセス可能メモリ)27を含む。
【0012】走査オペレーションは文書19の右底部隅
33から始まり、頂部左隅35で終わる。スキャナ13
は文書19を鉛直方向に、底部から頂部に、図に矢印3
7で示すように最初は最右の走査線39から走査し、次
いで再び底部から頂部へ、次の最右の走査線41に沿っ
て走査し、以下同様にして文書の頂部の左隅に達するま
で、走査する。走査線は平行に配列されている。文書1
9は連続的に、矢印43で示すように左から右へ移動さ
れる。スキャナは連続的走査線に沿って走査する。各走
査線の幅はピクセルの直径(約0.0127cmまたは
0.005インチ)に相当する。
【0013】文書の読み取り線の例を図3に示す。文書
が走査されるとき、文書および文書上の文字を表すため
スキャナにより発生されるピクセル値がメモリ27(図
1)に格納される。典型的場合、文字はそれぞれ、例え
ば読み取り線の高さに相当する100行と、文書の長さ
に相当する1200列とを有するデータ配列(マトリッ
クス)として格納される。(1200列は200ピクセ
ル/インチで6インチの文書を走査するときの典型的な
例である)。このデータ配列内で一文字は(後述するよ
うに配置され、断片化されたとき)行(例えば文字の高
さに相当する21行)および列(例えば文字の幅に相当
する14列)のマトリックスで表される。例えば図2に
示す文字「3」は、図4に表すような形態のピクセル配
列で表すことができる。各ピクセル49は文書の一部を
表し、0−255の範囲の不透明指標またはグレイスケ
ール値を有する。暗ピクセルは一般に大きなグレイスケ
ール値(255に近い)を有し、明ピクセルは一般にも
っと小さなグレイスケール値(0に近い)を有する。文
字は通常、文書の明るい地色に比較して暗い色で印刷さ
れているので、文字と文書地色との間の不透明性は容易
に判定できる。
【0014】上述したように、これらのグレイスケール
データ値は文書の走査によりスキャナによって発生され
る。発生されたデータは次いでシステム21で処理する
ためメモリ27(図1)内に格納され、次いでこのシス
テムは格納されたプログラムの制御の下に格納されたデ
ータ値を調べ、最初の文字の位置定めに進み、次いで最
初のフィールドの後続文字に進み、次いで後続フィール
ドの他の文字に進む。文字の位置定めが終わると、シス
テムは当該文字を枠入れまたは区画する(すなわち他の
文字から当該文字を分離または断片化する)。底部から
頂部へ、かつ最右のスキャナ走査線39(図1、2)か
ら開始し、次いで底部から頂部へ、次の最右走査線41
に、以下同様に行った文書走査から得た格納グレイスケ
ールデータ値から、システムは以下に述べるように文字
各々を位置定めし枠入れ(断片化)する。これは最初の
格納されたデータを捜索して明ピクセルから暗ピクセル
への遷移を表すグレイスケール値の上昇を探知すること
により行う。もしも例えば40(40というこの特定の
値はフォントに依存する)より大きい上昇が走査方向3
7に隣接するピクセルの二つのグレイスケールデータ値
間に発見されると、暗ピクセルが発見されていると考え
られる。この暗ピクセルに近接する(文書の)領域は、
文字が発見される確率が高い領域であると見做される。 暗ピクセルが発見されると、システムはこの文字領域を
検査(すなわち暗ピクセル値に近い格納済みデータを検
査)し、この暗ピクセルが文字の一部であるかいなかを
決定する。システムは文書上の文字を効果的に枠入れす
るに足りる大きさの断片化ウィンドウを確立することに
より文字の存在を検査する。暗ピクセルの位置はウィン
ドウの中心に相当する。左縁および右縁(列)55、5
7および頂部縁および底部縁(行)59、61を有する
断片化ウィンドウ53が図5に示されている。左縁およ
び右縁の境界をなしているのは列(左+1)63および
列(右−1)65で、頂部縁および底部縁の境界をなし
ているのは行(最上+1)67、および(底部−1)で
ある。
【0015】図5、6を参照して以下に説明するように
、文字はウィンドウ内のすべてのグレイスケールピクセ
ル値の和が最大となったときにウィンドウに枠入れされ
、ウィンドウの中心に配置されたと考えられる。ウィン
ドウが移動されるときに和(Sw)が増大するかいなか
を決定するため、左右列55、57各々の中のピクセル
値とそれらの境界列63、65各々の中のピクセル値と
の和が計算される。同様に、頂列59および底部列61
各々の中のピクセル値と境界列67、69各々の中のピ
クセル値との和が計算される。もしも例えば列63内の
和が列57内の和よりも大きいことが発見されると、ま
た列63を含め列57を排除するようにウィンドウ53
を一ピクセルだけ左へ移動するときにウィンドウ内の和
(Sw)が増大することとなるときは、ウィンドウは左
へ移動される。同様に、もしも行67を含め、行61を
排除するようにウィンドウを一ピクセルだけ上に移動す
るとウィンドウ内の和(Sw)が増大するなら、ウィン
ドウは上に移動される。このようにしてウィンドウの縁
にある行および列のピクセル値の和に相対的な和である
、ウィンドウに隣接する行、列(境界をなす行、列)の
ピクセル値の和(累積的カウント)から、ウィンドウ内
のピクセル値の和(Sw)を増大させるようにウィンド
ウを移動できる方向が決定できる。図6に示すように、
以下のカウントにしたがって左への移動に伴ってウィン
ドウカウントが100だけ増大され、上への移動に伴っ
て170増大される。 右−1列カウント=0 右列カウント=0 左列カウント=100 左+1列カウント=100 底部−1行カウント=0 底部行カウント=0 頂部行カウント=170 頂部+1行カウント=170 したがってウィンドウは左および上へ移動される。この
ようにしてウィンドウはSwの増大する方向に移動され
、このオペレーションはウィンドウを四つの任意の方向
(左、右、上、下)に移動してもSwを増大させなくな
るまで反復される。このときウィンドウは文字を枠入れ
した(区画した/断片化した)と考えられ、当該文字は
ウィンドウの中心に配置されていると考えられる。この
ようにしてこのウィンドウによって、文字を最もよく表
すピクセル値のマトリックスが選択される(枠入れされ
る)。
【0016】枠入れされた文字を表す情報(暗ピクセル
グレイスケール値)が十分にウィンドウ内にあるか否か
を決定する検査として、予定の確認しきい値(例えばし
きいグレイスケール値100)を超えるウィンドウ内ピ
クセルの全数が入手される。もしもこの全数が例えば6
0(E13Bフォントについて)以上であると、ウィン
ドウ内に文字が見つかったことが確認される。そうでな
いときはウィンドウ内に枠入れされた対象物はノイズと
解釈され、システムは新しい文字を発見する手続きに進
む。
【0017】枠入れの後、断片化(枠入れ)された文字
は同定に備えて縮尺(scale)を変えられる。認識
プロセスでは16ビットワードが使用される(すなわち
、テンプレートの幅が16ピクセルである)。多くの文
字(19ピクセルのE13B文字を含む)が16ピクセ
ルより幅が広いので、それらは枠入れ後に16ビットに
変換される。これは予定の列、例えばE13Bフォント
の場合、列4、9、および14が除去される。(OCR
AおよびOCRBフォントは、200ピクセル/インチ
のとき、幅が16ピクセルであり、列の除去は必要でな
い。)
【0018】前節までの説明はどのようにして文字が処
理の準備として文書上で位置定めされれたか、すなわち
後の処理のためどのように文書上で位置定めされ効率よ
く枠入れ(断片化)されるかを説明するものである。以
下の説明は枠入れされた文字が当該文字の同定(分類/
認識)のために二進形に変換され、次いでテンプレート
(予定の二進パターン)と比較されるかを述べる。
【0019】この変換オペレーションでは枠入れされた
各行の文字について格納されたグレイスケールピクセル
値は二進形に変換される。最初に、枠入れされた文字の
暗ピクセルの算術平均として基準しきい値が(前述した
ように)計算される。次いでこの基準しきい値に相対的
に、グレイスケールピクセル値が二進形に変換される。 例えばもしも計算された基準しきい値が100であると
、以下に示す二進等価スケールを用いて、グレイスケー
ル値80、120、130、90、85、70、110
、135は図7の8ビットワード71に示すビットパタ
ーン01100011を有する二進データに変換するこ
とができる。 グレイスケールピクセル値          二進形
等価値≧100                  
    1(黒)<100             
         0(白)
【0020】次いでこの二
進データ(これは枠入れされた文字の行または薄片を表
す)および他の行の文字を表す変換済み二進データが複
数のテンプレートと比較される。各テンプレートは一文
字に対応する。各テンプレートは二進データの予定パタ
ーンを表し、三つの異なるレイヤー(ビットコンフィギ
ュレーション)を含む。図7に示すこれら三つの8ビッ
トワード73、75、77は三つの各レイヤーにおける
8ビット行を表す。第一レイヤー(ビットパターンレイ
ヤーで、パターンワード73に対応する)は文字の実際
の黒/白(0/1)パターンを表す。第二レイヤー(ビ
ット有意レイヤー(bit−significance
word)で、ビット有意ワード75に相当する)は有
意の文字のビット位置および有意でない文字の位置を同
定する。1−ビットは文字のビットパターンが文字の大
きさおよび形状に拘わらず不変に留まると予想される有
意ビット位置を同定する。0−ビットは文字の大きさま
たは形状を異ならすときにビットパターンが同一とは限
らない非有意ビット位置を同定する。第三レイヤー(ビ
ット重みレイヤーで、主にワード77に対応する)は類
似の(実質的に類似の)文字を識別するときにいずれの
ビットが重要であるか、またそれゆえにいずれのビット
が他のビットより大きな重みを有するかを同定する。こ
の第三レイヤーでは、1−ビットは重みのあるビットに
指定され、0−ビットは重みなしのビットに指定される
。例えば文字「O」と「U」に対するテンプレートの第
三レイヤーの頂部行における1−ビットは、これら二つ
の文字を識別するのに有用である。また文字「Q」と「
O」に対するテンプレートの第三レイヤーの底部行内の
1−ビットは、「Q」と「O」とを識別するのに有用で
ある。
【0021】図7に示すように、文字の同定のため、二
進データ71にいろいろの論理オペレーションがマイク
ロプロセッサ23(図1)により行われる。(これら論
理オペレーションは実際には16ビットオペレーション
として行われる。しかし、簡単のため8ビットオペレー
ションが図示されている)。第一に、二進データはビッ
トパターンレイヤーの対応ワード73と排他的OR演算
され、二進データ71と予定の正しいパターン73との
間のミスマッチパターン74を発生する。このミスマッ
チパターン74は次いでミスマッチワード76を発生さ
せるため、ビット有意レイヤーのワード75と論理的A
ND演算される。ミスマッチワード76は文字の大き差
および形状に独立なミスマッチ(不一致)の程度を表す
。このミスマッチワード76は次いで重みを付けられる
。すなわち重み付きミスマッチインジケーター78を発
生させるため、ビット重みレイヤー内の対応するワード
77と論理的AND演算される。(もしも重み付けワー
ド77が全く1−ビットを含まないならば、(その結果
は0なので処理時間を節約するため)重み付けまたはA
ND演算はなされないでシステムは二進データの次行の
処理に進む)。
【0022】重み付けオペレーションに続いて、二進デ
ータ71の行に対してミスマッチカウント(MCR)が
計算される。この計算はマイクロプロセッサ23(図1
)により次の式 MCR  =  MCW    +    (WOC 
 ×  WF)で求められる。ここで MCW    はミスマッチワードに対するミスマッチ
カウント(すなわちミスマッチワード76に発見された
1の数)を表す、 WOC  はミスマッチインジケーターまたは重み出力
カウント(すなわちミスマッチインジケーターワード7
8に見いだされた1の数)、 MW  は予定の重み因子(例えばE13B型文字では
整数2)を表す。
【0023】このようにして、図7のミスマッチワード
76、78に示すミスマッチビットパターンについては
、MCW=2、WOC=1、WF=2であることが了解
できる。それゆえ、二進データ71の行について計算し
たミスマッチカウント(MCR)は上式から4(すなわ
ち2+(1×2))となる。
【0024】一行についてミスマッチカウントを計算し
た後、システムは上記のように文字の残りの行すべてに
ついてのミスマッチカウントの計算に進む。次に文字の
すべての行に対するミスマッチカウントが加算されてテ
ンプレートミスマッチカウント(すなわち枠入れされた
文字に適用したテンプレートに対するミスマッチカウン
ト)を発生する。同様の方法で処理中のフォントについ
て文字テンプレートに対し、枠入れした文字に相対的な
ミスマッチカウントがテンプレート毎に発生される。い
ろいろのテンプレートが処理されるに伴い、二つの最低
テンプレートミスマッチカウントとそれらに関連したテ
ンプレート数とがメモリ内に格納される。文字を同定す
る前提条件は:もしもこれら最低カウントを持つテンプ
レートがしきい値未満(E13Bフォントでは拒絶しき
い値40)未満であり、次に低いテンプレートよりも予
定量(E13Bフォントではしきい値差5)だけ小さけ
れば、システムはこの文字を同定する。
【0025】前述したテンプレート認識は図8に示すよ
うに全部で9箇所で行うことができる。これはイメージ
内のノイズ等の因子により完全には枠入れされない文字
を同定するために行われる。図8に示す例では、テンプ
レートおよび入力(二進データ)パターンの大きさは2
3行(高さ)×16列(幅)である。テンプレートの三
つのレイヤー(パターンレイヤー、ビット有意レイヤー
および重み付けレイヤー)はすべて同一方向に同一量移
動される。後述する移動位置の説明においては、テンプ
レート行とはビットパターン行、ビット有意行、および
ビット重み付け行を指す。
【0026】中央位置87ではテンプレート96は入力
パターン98の直接上方に配置されている。  行2な
いし22のみがこの比較に使用される。従って、テンプ
レート行1はパターン行1と比較され、テンプレート行
2はパターン行2と比較され、・・・以下同様である。 すべての列(1ないし16)が中央水平位置81、87
、93、で使用される。上方中央位置81では、テンプ
レートの行1ないし22が入力パターンの行2ないし2
3と比較される。これはテンプレートパターンを鉛直方
向上に一行だけ移動することと同一である。この場合、
テンプレート行1は入力パターン行2と比較され、テン
プレート行2は入力パターン行3と比較される、等々で
ある。この状況(水平方向の中央位置)ではテンプレー
トと入力パターンのすべての列が比較される。同様にし
て、下端中央位置93ではテンプレートは下方に一行だ
け移動されており、従ってテンプレート行2ないし23
が入力パターン行1ないし22と比較される。
【0027】水平移動した位置はテンプレート96を入
力パターン98の上で左または右へ移動することに対応
する。中央左位置85ではテンプレート列1ないし15
および入力パターン列2ないし16が使用される。(こ
れは鉛直方向に中央位置なので行2ないし22が入力パ
ターンおよびテンプレートの両方に使用される。)従っ
てテンプレートワードビット1はパターンワードビット
2と比較され、テンプレートワードビット3はパターン
ワードビット4と比較される、等々である。例えばもし
もテンプレートパターンレイヤーワードが001111
1100001111 であり、入力文字パターンワードが 0010111100011110 であると、テンプレートが左へ1ビット(列)移動され
る。 0011111100001111 排他的OR演算した結果は 0101000100000000 となろう。左への移動演算が行われると、最右のビット
(最下位ビット、LSB)は0であることに注意された
い。従ってビット有意ワードのLSBもまた0である(
なぜならば三つのレイヤーすべてが同一方向に同一量移
動されるからである。)それゆえ、ミスマッチワード7
6のLSBは(ビット有意ワードとのAND演算の後)
常に0となる。同様に、右への移動は最左ビット(最高
位ビット、MSB)は0であり、従ってミスマッチワー
ド76のMSBは(AND演算の後)常に0となる。
【0028】右向き水平移動(位置89)は左向き移動
と同様で、方向が反対なだけである。従ってテンプレー
トワードのビット2は入力パターンワードのビット1と
整列する(比較される)。
【0029】隅位置(位置95、91、83、79)は
一行を鉛直移動することと一列を水平移動することとの
組み合わせを表す。例として、左上位置79ではテンプ
レート行1は左へ一ビット位置だけ移動され、パターン
ワード2と比較され、テンプレート行2は左へ一ビット
移動されてパターンワード3と比較される、等々である
【0030】この方法を使用して文字を認識するために
は一テンプレートあたりのパス数(推移数)である9に
文字セット中のテンプレート数を乗じた数のパス数が必
要である。例えば49文字を持つ英数字セットは全部で
441(9×49)個の比較を必要とする。これは時間
を消耗する。一層速い文字同定を促進するには入力パタ
ーンに対して当初は各テンプレートの中央位置のみを比
較する。いろいろのテンプレートが処理されるにつれて
、最低の二つのミスマッチカウントおよびそれらに対応
するテンプレート数がRAM27内に格納される。この
最初のパスの終わりに、入力されたパターンに対して最
善の(すなわち最低の)全ミスマッチを発見するため、
ただ二つのテンプレートの他の8個の位置が処理される
。従って通常、たった65個(1×49+2×8)の比
較が必要である(すなわち、必要な441この比較のう
ちの約15%である)。
【0031】文字の受け入れまたは拒否の前提条件を以
下に述べる。
【0032】前記最低テンプレートミスマッチカウント
が、当該テンプレートが表す文字に対する予定の拒否し
きい値と比較される。もしもこの文字ついてテンプレー
トミスマッチカウントがこのしきい値未満であり、かつ
二つの最低テンプレートについてのテンプレートミスマ
ッチの差(最低ミスマッチを次に最低のミスマッチから
減じた値)が予定の量(例えば10)より大きいと、最
低のテンプレートミスマッチを持つテンプレートが枠入
れされた文字を同定する。ミスマッチカウントが近すぎ
るかいなかを検査する理由は非常に似通った文字(例え
ばQとO)を区別するためである。もしもミスマッチが
近いと、文字は誤同定を犯す危険を避けて拒否される。 もしも上記の拒否しきい値未満のテンプレートミスマッ
チがないか、または二つのテンプレートミスマッチカウ
ント近すぎると、下に述べる後処理オペレーションが行
われる。もしも後処理オペレーションの後、枠入れされ
た文字が依然拒否されるなら、そのイメージは強化され
、二進化形に変換される(これについては後述する)。 次にこの認識プロセス(上記)が再び行われる。 もしも文字が同定される(上記前提条件を満足する)と
、次にシステムは次の文字について上記処理(位置定め
および枠入れ)を行う。
【0033】中央位置のみを検査すると、最近接文字で
ない中央位置以外の位置にある文字が近接カウントを有
する正しい選択文字である、という可能性を見逃すかも
知れない。後処理はそのような状況を修復することがで
きる。もしも最低の二つの選択文字が共にその個別文字
についての予定拒否しきい値を超えており、あるいは文
字間距離(第二最低ミスマッチと最低ミスマッチとの差
)が小さすぎるときは、一層良好な一致が得られること
を期待して他の8位置において多数の他のテンプレート
が検査される。いずれのテンプレートを処理するかの選
択が、例えば当該テンプレートに対する最近接文字類似
性に基づいて、決定される。例えば最近接の二つの選択
文字(最低のミスマッチカウントを有するもの)、文字
DとOは共にそれらの拒否しきい値以上のミスマッチカ
ウントを有する。後処理オペレーションではDおよびO
に類似する予定の組の文字が次いで処理される。これに
は文字0(ゼロ)、Q、C及びUが含まれることがあり
うる。このオペレーションの後で最近接の二つの文字の
ミスマッチカウントが検査され(最低のミスマッチカウ
ントが最初に検査される)、それらが拒否条件および文
字間距離条件に合うか否かが観察される。もしも少なく
とも一文字が条件に合うと、その文字が結果として返さ
れ、イメージ中の次の文字の処理(位置定めおよび枠入
れ)が進められる。
【0034】もしも上記文字のいずれも拒否条件に適合
しないか、あるいは文字間距離が小さすぎると、枠入れ
された文字は拒否される。この場合、そのイメージが強
化される(後述の通り)、その文字は再度二進化され、
第二回目の上記認識プロセスが反復される。そうでない
ときは結果として拒否文字コードが返され、文書上の次
の文字の処理(位置定めおよび枠入れ)が続く。
【0035】上記の拒否しきい値に加えて出口しきい値
(esit threshold)(例えば値10)も
後述する文字同定プロセスに使用することができる。処
理速度を強化するため、後続テンプレートミスマッチカ
ウントが出口しきい値に比較され、出口しきい値未満と
なるテンプレートミスマッチカウントを持つ最初のテン
プレートが当該文字を同定する。この場合、残りのテン
プレートは処理されない(これは処理速度を強化する)
【0036】さらに文字同定プロセスの速度を高めるた
め、テンプレートの各行が処理されているときにもしも
現在のテンプレートのミスマッチカウント(すなわち現
在処理中のテンプレート)がそれまでに得られた下から
二番目の最低カウントよりも大きいことが発見されると
、進行中の処理は中止される。なぜならばこの進行中の
テンプレートはもはや最低ミスマッチカウントを持った
二つのうちの一つでありえないからである。認識速度を
さらに高めるため、テンプレートはそれらが最も起生す
る確率の高い順序(例えば英数字フォントでは母音の前
に数字が来て、後ろに子音が続く)に予め順序づけして
おくこともできる。もしもミスマッチカウントが出口し
きい値より低いと(上述したように)残りのテンプレー
トは調べる必要がない。このように、最も頻繁に起こる
これら文字が最初に調べられるべきである。またより速
い文字同定を促進するためにはテンプレートにより中央
位置のみ検査し、その後、もしも最低テンプレートミス
マッチカウントが出口しきい値を超えれば、残りの8位
置を出口しきい値に最近接する二つのテンプレート各々
について処理するようにでき、最低のテンプレートミス
マッチカウントを持つテンプレートをもって当該文字を
表すものとすることができる。さらに同定を速くするた
め残りの8位置(図8)は次の順序79、81、83、
89、91、93、95で処理することができる。 これは文字が最も配置されやすい順序である。
【0037】枠入れされた文字を同定した後、システム
は前に枠入れした文字の左へ、選択したピクセル数(例
えば3)だけ分離ウィンドウを移動することにより、次
の文字の処理に進む(すなわち次のグループの格納済み
ピクセル値を処理する。このピクセル値は当該枠入れさ
れた文字に近接する文書上の領域を表す)。この近接領
域における文字が次いで枠入れ(断片化)され、上述し
たように同定される。エンド−オブ−フィールドが検出
される(すなわちもはや文字がないかまたはエンド−オ
ブ−フィールド文字がある)まで、残りの文字(残りの
格納済みピクセルデータ)すべてがこのように処理され
る。
【0038】もしも文字同定プロセスにおいて文字が拒
否されると、同定を容易にするため、そのイメージが強
化される。このイメージは例えば一定のストローク幅(
すなわち文字の各鉛直ストロークまたは水平ストローク
の幅にまたがる一定の暗ピクセル数)を有する文字イメ
ージを発生することにより強化できる。これは以下に述
べるようにして達成できる。第一に、文字を表すグレイ
スケールピクセル値(例えば6−ビット、8−ビット、
または16−ビット値)がもっと小さな範囲の値(例え
ば高速処理のための3−ビットグレイスケールピクセル
値)に変換される。次いで当該文字イメージの個別ピク
セル値が検査され、ストロークのピクセル値のうち最も
暗い二つまたは三つの値のみが黒に変えられ、他は白に
変えられる。このことにより、例えば米国特許第4,6
25,330号に説明されているような一定ストローク
幅の二進イメージが発生する。
【0039】文字同定を改善する助けとして、各文字の
縁を以下のように処理できる。上述したように、文字同
定プロセスで使用した各テンプレートは選択された文字
セット(例えばE13B文字セット)の一文字に対応し
、図2および図4に示すように、各文字は幅14ピクセ
ル、高さ21ピクセルである。文字の左および右に余分
の一列が付加される。また文字の頂部および底部に余分
の一行が付加される。これによって文字の大きさは16
×23となる。各文字に対応して、各テンプレートは幅
16ピクセル、高さ23ピクセルである。各テンプレー
トは14列文字の両側(右側および左側)に余分の列を
有し、また21行文字の頂部および底部に余分の一行を
有する。各余分の行は16個の白のピクセルを含み、各
余分の列は、23個の白いピクセルを含む。これら余分
の行および列はある種の文字の縁部分の同定を一層よく
するための白ピクセル境界で、14×21文字領域を囲
む役割をする。これについて以下に述べる。例えばもし
も文字「E」が12×21「F」テンプレートと比較さ
れ、このテンプレートが上方に一ピクセル位置だけ移動
されると、「E」の底部におけるピクセル値は失われる
。なぜならばこの底部はテンプレートミスマッチカウン
トの発生に使用できないからである。これはEをFと誤
って同定する結果を来たしうる。なぜならばミスマッチ
カウントが低いからである。16×23テンプレートで
は、Eの底部は失われず、Fテンプレートの底部の白行
に比較されるミスマッチカウントに実質的に寄与するこ
とにより、EをFと誤同定することを回避できよう。 同様の説明は16×23テンプレートの右および左列に
関しても成り立ち、これらの列は「B」と「3」のよう
な文字間の誤同定を低減する働きをする。
【0040】図9に示すように、各16×23テンプレ
ートはRAM27の69個の16ビットワードによって
表すことができる(一インチ当たり200ピクセルの走
査に相応する)。69ワードのうち、23ワードは第一
レイヤービットパターンワードを表し、23ワードは第
二レイヤービット有意ワードを表し、23ワードが第三
レイヤービット重みワードを表す。各23ワードの組の
各々が文字の高さに相応し、各16ビットワードが文字
の幅に相応する。(図7では論理的オペレーションを表
すのに、簡単のため、16ビットではなく8ビットが使
用された。)
【0041】本システムが上記論理的オペレーションそ
の他の処理オペレーションを行うことができるための格
納プログラムの疑似コードのリストを下に掲げる。                          
       疑似コードPROCEDURE:   
  MAIN               文書イメ
ージからコードラインを認識する。                while  (NO
T END OF DOCUMENT)       
            {            
       if (FIND FIRST CHA
RACTER finds a character)
                      the
n                        
   RECOGNIZE FIELD       
               else      
                     END 
OF DOCUMENT              
     }PROCEDURE:     FIND
 FIRST CHARACTER         
      do                    {     
              SCAN IMAGE 
FOR WHITE TO BLACK TRANSI
TION                   } 
                  until (
FOUND CHARACTER  or  END 
OF DOCUMENT)PROCEDURE:   
  RECOGNIZE FIELD        
           do            
             {           
                 RECOGNIZ
E CHARACTER              
               move to ne
xt position              
           }             
       while  (FOUND CHAR
ACTER)PROCEDURE:     RECO
GNIZE CHARACTER          
         {               
    BINARIZE CHARACTER IM
AGE                   TEM
PLATE RECOGNITION OF CHAR
ACTER                    
  if REJECTED            
              then       
                        E
NHANCED BINARIZE CHARACTE
R IMAGE                  
             TEMPLATE REC
OGNITION OF CHARACTER    
               }
【0042】本発明
はいろいろの形態に実施できるが、図面および明細書に
は好ましい実施例を示した。しかし本開示は本発明の説
明のためであり、本実施例に特定するものではない。例
えば本システムにより行われるいろいろの計算は設計変
更して上に議論したE13B(またOCRAおよびOC
RB)以外のいろいろの大きさの文字および任意の解像
度のイメージについても本システムで読み取ることがで
きるようにすることは容易である。
【図面の簡単な説明】
【図1】本発明のシステムのブロック線図である。
【図2】図1のシステムにより走査可能かつ同定可能な
文字の外見を例示する図解である。
【図3】上にいろいろの文字を記録された文書の一部の
図解である。
【図4】いろいろの不透明さ(グレイスケール値)のピ
クセルのマトリックスを有する走査した文字の図解であ
る。
【図5】文字の枠入れのために使用されるウィンドウの
図解である。
【図6】図4の文字の枠入れに使用される図5のウィン
ドウの図解である。
【図7】走査した文字を表す二進データにいろいろの論
理オペレーションを行った結果を示すブロック線図であ
る。
【図8】枠入れされた文字のイメージのいろいろの部分
を表すマトリックスのブロック線図である。
【図9】図1のシステムで使用するテンプレートおよび
関連の二進値の図解および表である。
【符号の説明】
11    本発明のシステム(装置)      1
3    光学的読取り機(スキャナ) 15    CCD                
        17    制御器 19    文書                 
         20    数字または英数字 21    コンピューターシステム        
23    マイクロプロセッサ 25    ROM                
        27    RAM 41    走査線

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】光学的文字認識システムであって、文書上
    に記録された文字を光学的に走査する走査装置にして該
    文字および文書が異なる不透明さを有し、その不透明さ
    に応じた複数のグレースケール値を発生し、該グレース
    ケール値が明ピクセルおよび暗ピクセルを表す、走査装
    置と該グレースケール値を格納すべく配置されたメモリ
    装置にして該メモリ装置が格納されたプログラムと複数
    の予定の二進法パターンを含む予定のデータとを含み、
    該予定二進法パターンの一つが該文字を表すようにされ
    たメモリ装置と、該走査装置および該メモリ装置とに結
    合され、該格納されたプログラムの制御の下に動作し、
    該グレースケール値から文字を表す値のマトリックスを
    選択することにより該文書上の文字位置を定め、該マト
    リックス値を二進データに変換し、該複数の予定二進パ
    ターンの中から該変換された二進データに一致するパタ
    ーンを選択し、該一致するパターンにより該文字を同定
    するようにされた処理装置とを含む光学的文字認識シス
    テム。
  2. 【請求項2】文書とその上の文字が異なる不透明さを有
    し、該文字が複数の予定の二進法パターンの一つで表さ
    れる該文書上の文字を光学的に同定する方法であって、
    光学的に該文書を走査すると共に該不透明さに応じた複
    数の、明ピクセルおよび暗ピクセルを表すグレースケー
    ル値を発生するステップと、該グレースケール値から文
    字を表すマトリックス値を選択することにより該文書上
    の文字位置を定めるステップと、該マトリックス値を二
    進データに変換するステップと、該複数の予定二進パタ
    ーンの中から該変換された二進データに一致するパター
    ンを選択し、該一致したパターンから該文字を同定する
    ステップとを含む光学的文字同定方法。
JP3356742A 1990-12-28 1991-12-26 光学的文字認識システムおよび方法 Pending JPH04361391A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US635899 1990-12-28
US07/635,899 US5091968A (en) 1990-12-28 1990-12-28 Optical character recognition system and method

Publications (1)

Publication Number Publication Date
JPH04361391A true JPH04361391A (ja) 1992-12-14

Family

ID=24549574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3356742A Pending JPH04361391A (ja) 1990-12-28 1991-12-26 光学的文字認識システムおよび方法

Country Status (5)

Country Link
US (1) US5091968A (ja)
EP (1) EP0492979B1 (ja)
JP (1) JPH04361391A (ja)
CA (1) CA2049758C (ja)
DE (1) DE69131006T2 (ja)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6067379A (en) * 1988-12-09 2000-05-23 Cognex Corporation Method and apparatus for locating patterns in an optical image
CA2049866C (en) * 1990-12-28 1998-06-30 Raymond L. Higgins System and method for optical recognition of bar-coded characters
CA2052450C (en) * 1991-01-14 1998-08-18 Raymond L. Higgins Ocr system for recognizing user-specified custom fonts in addition to standard fonts
US5272766A (en) * 1991-01-14 1993-12-21 Ncr Corporation OCR system for recognizing user-specified custom fonts in addition to standard fonts using three-layer templates
US5299269A (en) * 1991-12-20 1994-03-29 Eastman Kodak Company Character segmentation using an associative memory for optical character recognition
US5859923A (en) * 1992-12-29 1999-01-12 Cognex Corporation Mark quality inspection apparatus and method
EP0677811A1 (en) * 1994-04-15 1995-10-18 Canon Kabushiki Kaisha Image processing system with on-the-fly JPEG compression
US5802204A (en) * 1995-06-07 1998-09-01 Microchip Technology Incorporated Handwritten character translator using fuzzy logic
US6026176A (en) * 1995-07-25 2000-02-15 Cognex Corporation Machine vision methods and articles of manufacture for ball grid array inspection
AU717222B2 (en) * 1995-08-07 2000-03-23 Mikoh Technology Limited Optical image authenticator
AUPN462995A0 (en) * 1995-08-07 1995-08-31 Mikoh Technology Limited Optical memory data detector and authenticator
US5729621A (en) * 1995-08-31 1998-03-17 Ncr Corporation Method and apparatus for magnetic ink character recognition using a magneto-resistive read head
US5872870A (en) * 1996-02-16 1999-02-16 Cognex Corporation Machine vision methods for identifying extrema of objects in rotated reference frames
US5909504A (en) * 1996-03-15 1999-06-01 Cognex Corporation Method of testing a machine vision inspection system
US6259827B1 (en) 1996-03-21 2001-07-10 Cognex Corporation Machine vision methods for enhancing the contrast between an object and its background using multiple on-axis images
US6298149B1 (en) 1996-03-21 2001-10-02 Cognex Corporation Semiconductor device image inspection with contrast enhancement
US5978502A (en) * 1996-04-01 1999-11-02 Cognex Corporation Machine vision methods for determining characteristics of three-dimensional objects
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
US6137893A (en) * 1996-10-07 2000-10-24 Cognex Corporation Machine vision calibration targets and methods of determining their location and orientation in an image
US7207478B1 (en) 1999-11-30 2007-04-24 Diebold, Incorporated Check accepting and cash dispensing automated banking machine system and method
US5960125A (en) * 1996-11-21 1999-09-28 Cognex Corporation Nonfeedback-based machine vision method for determining a calibration relationship between a camera and a moveable object
US5953130A (en) * 1997-01-06 1999-09-14 Cognex Corporation Machine vision methods and apparatus for machine vision illumination of an object
US6075881A (en) * 1997-03-18 2000-06-13 Cognex Corporation Machine vision methods for identifying collinear sets of points from an image
US5974169A (en) * 1997-03-20 1999-10-26 Cognex Corporation Machine vision methods for determining characteristics of an object using boundary points and bounding regions
US6141033A (en) * 1997-05-15 2000-10-31 Cognex Corporation Bandwidth reduction of multichannel images for machine vision
US6608647B1 (en) 1997-06-24 2003-08-19 Cognex Corporation Methods and apparatus for charge coupled device image acquisition with independent integration and readout
US8024269B1 (en) 1997-08-27 2011-09-20 Datatreasury Corporation Remote image capture with centralized processing and storage
US5910988A (en) * 1997-08-27 1999-06-08 Csp Holdings, Inc. Remote image capture with centralized processing and storage
US7519558B2 (en) 1997-08-27 2009-04-14 Ballard Claudio R Biometrically enabled private secure information repository
US5978080A (en) * 1997-09-25 1999-11-02 Cognex Corporation Machine vision methods using feedback to determine an orientation, pixel width and pixel height of a field of view
US6025854A (en) * 1997-12-31 2000-02-15 Cognex Corporation Method and apparatus for high speed image acquisition
US6236769B1 (en) 1998-01-28 2001-05-22 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with zero or other uniform offsets
US6282328B1 (en) 1998-01-28 2001-08-28 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with non-uniform offsets
US6381375B1 (en) 1998-02-20 2002-04-30 Cognex Corporation Methods and apparatus for generating a projection of an image
US6215915B1 (en) 1998-02-20 2001-04-10 Cognex Corporation Image processing methods and apparatus for separable, general affine transformation of an image
JP4338155B2 (ja) * 1998-06-12 2009-10-07 キヤノン株式会社 画像処理装置及びその方法、コンピュータ可読メモリ
US6687402B1 (en) 1998-12-18 2004-02-03 Cognex Corporation Machine vision methods and systems for boundary feature comparison of patterns and images
US6381366B1 (en) 1998-12-18 2002-04-30 Cognex Corporation Machine vision methods and system for boundary point-based comparison of patterns and images
US7611048B1 (en) 1999-11-30 2009-11-03 Diebold, Incorporated Check accepting and cash dispensing automated banking machine system and method
US6684402B1 (en) 1999-12-01 2004-01-27 Cognex Technology And Investment Corporation Control methods and apparatus for coupling multiple image acquisition devices to a digital data processor
US6748104B1 (en) 2000-03-24 2004-06-08 Cognex Corporation Methods and apparatus for machine vision inspection using single and multiple templates or patterns
US7216106B1 (en) 2000-04-28 2007-05-08 Netdeposit, Inc. Method and system for processing financial instrument deposits physically remote from a financial institution
US7181430B1 (en) * 2000-04-28 2007-02-20 Netdeposit, Inc. Method and system for processing financial instrument deposits physically remote from a financial institution
US7475040B2 (en) * 2000-04-28 2009-01-06 Netdeposit, Inc. Return item early notification and return
US7386511B2 (en) * 2000-04-28 2008-06-10 Netdeposit Inc. Methods and systems for processing financial instrument deposits
US7006669B1 (en) 2000-12-31 2006-02-28 Cognex Corporation Machine vision method and apparatus for thresholding images of non-uniform materials
US10453151B2 (en) 2001-02-01 2019-10-22 Kris Engineering, Inc. Receipts scanner and financial organizer
US7746510B2 (en) 2001-02-01 2010-06-29 Pandipati Radha K C Receipts scanner and financial organizer
US20030059099A1 (en) * 2001-09-27 2003-03-27 Longford Equipment International Limited Optical character recognition system
US6873715B2 (en) * 2002-01-31 2005-03-29 You-Ti Kuo System of central signature verifications and electronic receipt transmissions
US7295694B2 (en) * 2002-02-22 2007-11-13 International Business Machines Corporation MICR-based optical character recognition system and method
WO2003091849A2 (en) 2002-04-23 2003-11-06 The Clearing House Service Company L.L.C. Payment identification code system
KR100489550B1 (ko) * 2002-08-19 2005-05-16 (주)신우아이티 일련번호 추출기능을 가진 유가증권 계수 장치 및 그방법
CN103714481A (zh) * 2002-10-21 2014-04-09 瑞菲尔·斯贝茹 收集、储存和处理收据和有关数据的系统和方法
US20040243489A1 (en) * 2003-05-27 2004-12-02 International Business Machines Corporation Expense accounting data management based on electronic expense document
US7280684B2 (en) * 2003-07-30 2007-10-09 International Business Machines Corporation Method and system for ongoing performance monitoring of a character recognition system
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
US8725607B2 (en) 2004-01-30 2014-05-13 The Clearing House Payments Company LLC Electronic payment clearing and check image exchange systems and methods
US7386160B2 (en) * 2004-12-02 2008-06-10 International Business Machines Corporation System and method for determining image resolution using MICR characters
US7639861B2 (en) 2005-09-14 2009-12-29 Cognex Technology And Investment Corporation Method and apparatus for backlighting a wafer during alignment
US8111904B2 (en) * 2005-10-07 2012-02-07 Cognex Technology And Investment Corp. Methods and apparatus for practical 3D vision system
US8162584B2 (en) * 2006-08-23 2012-04-24 Cognex Corporation Method and apparatus for semiconductor wafer alignment
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US10380559B1 (en) 2007-03-15 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for check representment prevention
US20080310721A1 (en) 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US20090198486A1 (en) * 2008-02-05 2009-08-06 National Tsing Hua University Handheld electronic apparatus with translation function and translation method using the same
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
JP2009199102A (ja) * 2008-02-19 2009-09-03 Fujitsu Ltd 文字認識プログラム、文字認識装置及び文字認識方法
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
DE102008042080A1 (de) * 2008-09-15 2010-03-25 Bundesdruckerei Gmbh Verfahren zur automatischen optischen Zeichenerfassung, Computerprogrammprodukt, Datenverarbeitungssystem und Scanner
US8452689B1 (en) 2009-02-18 2013-05-28 United Services Automobile Association (Usaa) Systems and methods of check detection
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8977571B1 (en) 2009-08-21 2015-03-10 United Services Automobile Association (Usaa) Systems and methods for image monitoring of check during mobile deposit
US8699779B1 (en) 2009-08-28 2014-04-15 United Services Automobile Association (Usaa) Systems and methods for alignment of check during mobile deposit
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
US8488886B2 (en) * 2010-08-02 2013-07-16 Celartem, Inc. Font matching
AU2012202173B2 (en) 2011-04-18 2013-09-05 Castle Bookkeeping Wizard Pty Ltd System and method for processing a transaction document including one or more financial transaction entries
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
US10552810B1 (en) 2012-12-19 2020-02-04 United Services Automobile Association (Usaa) System and method for remote deposit of financial instruments
SG11201510309PA (en) * 2013-05-24 2016-01-28 Life Technologies Corp Methods and systems for detection of a consumable in a system
US11138578B1 (en) 2013-09-09 2021-10-05 United Services Automobile Association (Usaa) Systems and methods for remote deposit of currency
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
US11295308B1 (en) 2014-10-29 2022-04-05 The Clearing House Payments Company, L.L.C. Secure payment processing
US10402790B1 (en) 2015-05-28 2019-09-03 United Services Automobile Association (Usaa) Composing a focused document image from multiple image captures or portions of multiple image captures
US11694168B2 (en) 2015-07-01 2023-07-04 The Clearing House Payments Company L.L.C. Real-time payment system, method, apparatus, and computer program
US11042882B2 (en) 2015-07-01 2021-06-22 The Clearing House Payments Company, L.L.C. Real-time payment system, method, apparatus, and computer program
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11436577B2 (en) 2018-05-03 2022-09-06 The Clearing House Payments Company L.L.C. Bill pay service with federated directory model support
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE422714B (sv) * 1979-01-16 1982-03-22 Ibm Svenska Ab Anordning med styrdator for optisk teckenlosning, vilken styrdator bl a bereknar startpunkter for identifiering av ett tecken
US4308523A (en) * 1980-02-04 1981-12-29 Compuscan, Incorporated Apparatus and method for character recognition
NL183790C (nl) * 1980-11-21 1989-01-16 Nederlanden Staat Werkwijze voor karaktersegmentatie.
GB2103449B (en) * 1981-06-29 1985-05-30 Nippon Telegraph & Telephone Method and apparatus for gray level signal processing
US4783829A (en) * 1983-02-23 1988-11-08 Hitachi, Ltd. Pattern recognition apparatus
JPS59226981A (ja) * 1983-06-08 1984-12-20 Fujitsu Ltd パタ−ンマツチング方法および装置
US4471046A (en) * 1983-08-04 1984-09-11 Eastman Kodak Company 4-Hydroxyalkyl-substituted 3-pyrazolidinone electron transfer agents
US4625330A (en) * 1983-12-19 1986-11-25 Ncr Corporation Video enhancement system
ATE56549T1 (de) * 1984-04-10 1990-09-15 British Telecomm Mustererkennungseinrichtung.
US4742556A (en) * 1985-09-16 1988-05-03 Davis Jr Ray E Character recognition method
US5014327A (en) * 1987-06-15 1991-05-07 Digital Equipment Corporation Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns
US4856075A (en) * 1987-10-05 1989-08-08 Eastman Kodak Company Image discrimination
US4850026A (en) * 1987-10-13 1989-07-18 Telecommunications Laboratories Dir. Gen'l Of Telecom. Ministry Of Communications Chinese multifont recognition system based on accumulable stroke features
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition

Also Published As

Publication number Publication date
CA2049758A1 (en) 1992-06-29
EP0492979A3 (ja) 1994-02-23
CA2049758C (en) 1998-05-19
US5091968A (en) 1992-02-25
DE69131006T2 (de) 1999-10-07
EP0492979B1 (en) 1999-03-17
DE69131006D1 (de) 1999-04-22
EP0492979A2 (en) 1992-07-01

Similar Documents

Publication Publication Date Title
JPH04361391A (ja) 光学的文字認識システムおよび方法
US5367578A (en) System and method for optical recognition of bar-coded characters using template matching
US4903312A (en) Character recognition with variable subdivisions of a character region
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US4926492A (en) Optical character reading apparatus and method
US5410611A (en) Method for identifying word bounding boxes in text
EP0063454B1 (en) Method for recognizing machine encoded characters
US5640466A (en) Method of deriving wordshapes for subsequent comparison
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
US20140219561A1 (en) Character segmentation device and character segmentation method
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
US5781658A (en) Method of thresholding document images
US5563958A (en) System and method for optical character recognition bar-coded characters
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
JP2700131B2 (ja) パターン認識方法
EP0495607B1 (en) A method and apparatus for representing an unrecognised character in optical character recognition means for subsequent recognition
JPH0291789A (ja) 文字認識方法
JP2871590B2 (ja) 画像抽出方式
JPH08212303A (ja) 文字識別装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP3277977B2 (ja) 文字認識方法
JPS6089290A (ja) パタ−ン認識方法
JPH10233930A (ja) 画像処理装置
Suman et al. OPTICAL CHARACTER RECOGNITION USING ANDROID