JP3078318B2 - 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 - Google Patents

文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置

Info

Publication number
JP3078318B2
JP3078318B2 JP03517202A JP51720291A JP3078318B2 JP 3078318 B2 JP3078318 B2 JP 3078318B2 JP 03517202 A JP03517202 A JP 03517202A JP 51720291 A JP51720291 A JP 51720291A JP 3078318 B2 JP3078318 B2 JP 3078318B2
Authority
JP
Japan
Prior art keywords
image
document
image display
pixels
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03517202A
Other languages
English (en)
Other versions
JPH06501801A (ja
Inventor
ビュストマン,ゲルハルト・カー
Original Assignee
ユニシス・コーポレイション
ツェー・ゲー・カー・コンピュータ・ゲゼルシャフト・コンスタンツ・ミット・ベシュレンクテル・ハフツング
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニシス・コーポレイション, ツェー・ゲー・カー・コンピュータ・ゲゼルシャフト・コンスタンツ・ミット・ベシュレンクテル・ハフツング filed Critical ユニシス・コーポレイション
Publication of JPH06501801A publication Critical patent/JPH06501801A/ja
Application granted granted Critical
Publication of JP3078318B2 publication Critical patent/JP3078318B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 発明の背景 この発明は、一般的には文書上のデータを自動的に認
識するための改良された手段および方法に関し、より特
定的には、小切手、送状および送金文書のような財務文
書上の金額情報を自動的に認識するための改良された手
段および方法に関する。
今日の金融サービス業は膨大な量の文書を効率的に処
理するという大きな問題に直面している。文書支払方式
が衰えるだろうという予測は実現していない。実際、文
書支払方式は世界的に成長し、増大し続けると予期され
ている。したがってそのような文書を処理するための改
良された方法を考案する不可欠な必要性がある。
文書処理に対する支援として画像化技術を使用するこ
とは、たとえば米国特許第4,205,780号、第4,264,808
号、第4,672,186号、および第4,888,812号に開示される
ように、文書処理を有意に改良する1方法として認識さ
れてきた。一般的に、画像化は文書を光学的に走査し、
電子的に処理されかつ後の検索および表示のために(磁
気ディスクドライブおよび/または光学メモリのよう
な)大容量記憶媒体に格納される電子画像をつくり出す
ことを含む。文書画像化は文書の取扱いおよび移動を減
ずる機会を提供するということは明らかである、なぜな
らこれらの電子画像は実際の文書に代わって使用され得
るからである。たとえば、文書画像は記憶装置から検索
され、ワークステーションに表示され、そこではオペレ
ータは文書を直接的に検視することなく、観察された画
像に基づいて金額データおよび他の情報を入力すること
ができる。
文書処理システムにおいて画像化を利用することは有
意な改良を提供し得るが、文書からのデータをオペレー
タが検視しかつ入力する必要性は、達成できる文書処理
速度および効率を限定し続ける。
発明の概要および目的 この発明に従って、文書処理の速度および効率のさら
なる増大は、文書上のデータを自動的に位置決定し、抽
出しかつ認識する改良された方法、より特定的には、小
切手、送状および送金文書のような財務文書処理システ
ムにおける使用に必要とされる高速で有利に動作し得る
改良された方法を提供することによって可能にされる。
米国特許第4,449,239号、第4,201,978号、第4,468,80
8号、第4,918,740号、第4,523,330号、第4,685,141号、
第3,832,682号および欧州特許第EP−0,111,930号は当該
技術分野において公知である種々の自動データ認識手法
を開示する。
目的、特徴、利点および使用のみならずこの発明の特
定的性質は、添付の図面に加えて以下の詳細な説明から
明白になるであろう。
図面の簡単な説明 図1は、米国において広く使用されている型の典型的
な小切手を例示する。
図2は、一般的にこの発明が組み入れられてもよい文
書処理システムを例示する。
図3は、この発明に従った自動額面金額(courtesy a
moount)読取機によって実行される種々の操作ステップ
を一般的に例示するフローチャートである。
図4は、図3の「$位置決定」ステップ102を達成す
るための好ましい態様を例示するフローチャートであ
る。
図5は、図2のイメージモジュール14によって提供さ
れる典型的なグレーレベル画像である。
図6は、図5に表わされるグレーレベル画像からのシ
ードおよびマスク2値画像の並列発生および記憶のため
の装置を例示するブロック図である。
図7は、図4のステップ102Bによって確立される典型
的な「$」シードサーチエリア$SAを例示する。
図8は、図4のステップ102Bによって確立される典型
的な「$」マスクサーチエリア$MAを例示する。
図9は、図3の「額面金額抽出」ステップ104を達成
するための好ましい態様を例示するフローチャートであ
る。
図10は、図9のステップ104Bによって確立される典型
的な額面金額シードサーチエリアC.A.SAを例示する。
図11は、図9のステップ104Bによって確立される典型
的な額面金額マスクサーチエリアC.A.MAを例示する。
図12は、図3の「¢部分を分離かつ類別」ステップ11
0を達成するための好ましい態様を例示するフローチャ
ートである。
図13は、(図9のステップ104Jにおいて明瞭化の前
の)異質な連結構成要素群62および63を含む典型的な抽
出された額面金額を例示する。
図14−16は、図9のステップ104Jにおける明瞭化の後
の典型的な抽出された額面金額を例示する。
図17−18は、いかに「¢」文字が下線を引かれた2桁
の数字からなる「¢」フィールドから抽出されるかを例
示する。
図19−21は、いかにして「¢」文字が分数からなる
「¢」フィールドから抽出されるかを例示する。
詳細な説明 同様な数字および文字は全図面にわたって同様なエレ
メントを参照する。
この詳細な説明の目的のために、この発明は財務文書
を処理するための文書処理システムにおいて小切手上の
ドル金額(具体的に「額面金額」と称される)を自動的
に認識するのに適用されるように例示されるであろう。
しかしながら、この発明は財務上およびその他のデータ
認識応用の別の型のみならず文書の別の型にもまた適用
可能であるということが理解されるべきである。
最近に図1を参照すると、そこでは米国において広く
使用される型の小切手10が例示される。小切手10は
「$」通貨記号10aおよび関連の金額10bを有し、それは
金融業界では「額面金額」と典型的には称される。この
額面金額を認識する読取機は典型的には額面金額読取機
(CAR)と称される。額面金額10bは機械印刷されるかま
たは図1に示されるように手書きされてもよい。
図1に示される典型的な小切手10は、小切手の左下に
符号化された機械読取り可能なデータ10cをもまた含
み、それは小切手が振り出される銀行の識別、顧客の預
金口座番号、および小切手番号のような識別情報を提供
するのに役立つ。典型的にはこの符号化された機械読取
り可能なデータ10cは磁性インクで与えられ、それは頭
字語で「MICR」(磁気インク文字認識)と呼ばれる。
図2はこの発明が組み込まれてもよい文書処理システ
ムを一般的に例示する。処理されるべき文書は典型的に
は財務文書であり、図1に例示される型の小切手を含
む。図2に示されるように、これらの財務文書10は文書
プロセッサ12に与えられ、従来の態様で、その機械は文
書から符号化されたデータを読取り、文書の画像を取込
みかつ処理し、その文書をポケット(図示されていな
い)に区分けする。
図2における文書プロセッサ12は文書の画像を取込
み、取込まれた文書画像を処理しかつ圧縮し、それから
圧縮された文書画像をディスクドライブのような記憶装
置16に伝送するイメージングモジュール14を含む。ワー
クステーション19はワークステーションオペレータによ
るデータの表示および入力のために、検視された画像か
らの額面金額のような文書画像を記憶装置16から受け取
る。演算処理装置(CPU)20はシステムの全体の制御
と、(記憶装置16を経て)文書プロセッサ12およびワー
クステーション19によってそこへ伝送された文書情報の
ためのデータベースの維持とをまた与える。
図2の文書プロセッサ12はさらに、図1に例示される
ように小切手上の額面金額を自動的に認識するためのイ
メージングモジュール14に結合される額面金額読取機18
を含む。図1の文書処理システムにおいてそのような額
面金額読取機18を提供することの重要な利点は、金額が
うまく読取られた小切手は、ワークステーション18で画
像を検視することによってそれらの額面金額を読取られ
かつ入力される必要がないということである。
額面金額読取機(CAR)18はこの発明に従って額面金
額の自動認識を提供するために、イメージモジュール14
からそこへ与えられた文書画像を演算処理するために適
当なプログラミングに加えて、複数のマイクロプロセッ
サ、RAM、ROMおよび別の関連の回路を典型的に含む。CA
R18にそういったものを設ける態様はここでの開示によ
って明白となるであろう。
図3は、小切手上の額面金額を認識する際に図2のCA
R18によって実行される種々の操作ステップを一般的に
例示するフローチャートである。このフローチャートは
例として与えられるのであって、発明の範囲を限定する
ものとして考えられるべきではないということが理解さ
れるべきである。たとえば、ここに示されるあるステッ
プが省略されてもよく、別のステップが加えられてもよ
く、かつ/またはステップの配列が変更されてもよい。
ステップ100によって示されるように、CAR18は図2の
イメージングモジュール14から小切手のグレーレベル画
像を受け取る。CARは図1における「$」10aを位置決定
し(ステップ102)、それから関連の額面金額10bを抽出
する(ステップ104)。抽出された額面金額が機械印刷
されているかまたは手書きかという判断がそれからなさ
れる(ステップ106)。もし機械印刷であるならば、比
較的単純な額面金額認識が実行され(ステップ108)、
結果が出力される(ステップ118)。
もし抽出された額面金額が手書きであると判断される
と(ステップ106)、より複雑な分析が要求される。そ
のような場合、「¢」部分10b−1(図1)はまず分離
されかつ類別され(ステップ110)、「¢」文字がそれ
から類別に基づいて抽出される(ステップ112)。結果
として抽出された「¢」文字はそれから認識される(ス
テップ114)。
「¢」文字がうまく認識された後(ステップ114)、
ドル文字が認識される(ステップ116)。CAR18(図2)
はそれから認識された額面金額または拒絶信号を出力す
る(ステップ118)。図2のシステムにおいて、このCAR
出力はCPU20に送られる。もし図3のステップのいずれ
かの間に拒絶状態が検出されると、拒絶出力が即座に与
えられ残りのステップは停止される。図3に示されるよ
うに、額面金額の「¢」部分の抽出および認識はドル部
分より先に実行される、なぜならそれは拒絶を生み出し
がちであるからである。CARによって与えられた認識さ
れた額面金額出力は、認識プロセスの間に生み出された
信頼指示に基づく信頼値を伴ってもよいということが理
解されるであろう。図3における認識ステップ106、10
8、114および116は、前述の特許において開示されたよ
うな公知の認識技術を使用して提供され得るということ
もまた理解されるであろう。
図3に例示されるステップの各々の説明が以下に述べ
られる。
ステップ100(図3) このステップの間、図2におけるイメージングモジュ
ール14は、CAR18に少なくとも「$」文字10aおよび関連
の額面金額10bを含む小切手の部分のグレースケール画
像(図5に例示されるような)を提供する。図5に例示
されるサイズは例としてのみであるということが理解さ
れるべきである。
ステップ102(図3) このステップの間、「$」文字10a(5)が位置決定
される。明らかに、アスタリスク「*」または別の適切
な記号のような「$」以外の通貨文字も位置決定文字と
して使用され得る。
ステップ104(図3) このステップの間、額面金額10b(図5)は先に位置
決定された「$」文字10aを位置決定ガイドとして使用
して抽出される。
ステップ106(図3) このステップの間、抽出された額面金額が機械印刷さ
れたものかまたは手書きされたものかということに関す
る判断がなされる。もしそれが機械印刷されたものであ
るならば、動作はステップ108に進む。もしそれが手書
きであるならば、動作はステップ110に進む。
ステップ108(図3) もし額面金額が機械印刷されたものと判断されると、
比較的単純な認識が認識された機械印刷の型に基づいて
なされる。
ステップ110(図3) もし額面金額が手書きであると判断されるならば、よ
り複雑な分析が要求され、それは「¢」部分10b−1
(図5)の、ドル部分10b−2からの分離で始まる。分
離された「¢」部分はそれから類別される。
ステップ112(図3) このステップの間、「¢」文字は、ステップ110でな
された類別に基づいて抽出される。
ステップ114 このステップの間、抽出された「¢」文字は認識され
る。
ステップ116(図3) このステップの間、額面金額の「$」文字10b−2
(図5)が認識され、額面金額の認識を完了する。
ステップ118(図3) このステップの間、CAR18は(図2のCPU20に)認識さ
れた額面金額または拒絶信号を出力する。拒絶信号は、
もし拒絶状態が先のステップのいずれかの間に検出され
るならば、CARによって提供され、そのような場合、そ
れ以後のステップは停止される。認識された額面金額は
また信頼値を伴ってもよい。
図3に示された種々のステップはここで詳細に考察さ
れるであろう。
ステップ102の詳細な説明 図3においてステップ102を達成するための好ましい
態様は、この発明に従って、図4におけるステップ102A
からステップ102Hを参照して次に考察されるであろう。
ステップ102の目的は図5における小切手10上の「$」
文字を位置決定することであるということが念頭におか
れるであろう。
ステップ102A(図4) このステップの間、しきい値処理は図2のイメージモ
ジュール14によって与えられる(図5の)グレーレベル
画像から、複数の2値画像を得るのに使用される。これ
らの2値画像の導出は、グレーレベル画像は各ピクセル
が複数のグレーレベル値の1つを有するピクセル(画
素)のX−Yマトリックスとして電気的に典型的に表わ
されるということに注目することによって理解されるで
あろう。たとえば、各ピクセルは15が黒であり0が白で
ある2値番号0ないし15に対応する4ビットで表わされ
る16のグレーレベル値を備え得る。得られた2値画像の
各々はこれらのグレーレベル値の異なった1つを、グレ
ーレベル画像を2値画像に変換する際、しきい値として
使うことによって生み出される。たとえば、もし8のし
きい値が特定の2値画像を生み出すのに使われるなら
ば、その2値画像はそのグレーレベル値が8またはそれ
よりも大きいピクセルを黒ピクセルとして有し、2値画
像の他のピクセルはすべて白である。
ここで考察されるこの発明の特定の実施例のために、
3つの2値画像が、3つの異なったしきい値高、中およ
び低を使用してグレーレベル画像(図5)から得られ
る。高しきい値2値画像は「$」シード画像と称され、
中2値画像は額面金額シード画像と称され、低しきい値
2値画像はマスク画像と称されるであろう。以下に説明
されるように、「$」シード画像は「$」文字10a(図
5)を位置決定するために使用され、額面金額2値画像
は、額面金額10bを抽出するために使用され、かつマス
ク画像は両方の目的のために使用される。
図6に例示されるように、認識速度を増大するため
に、グレーレベル画像が図2のイメージモジュール14か
ら受け取られると、シードおよびマスク画像がコンバー
タ34、36および38各々によって同時に発生され得、結果
としての2値画像はそれぞれのランダムアクセスメモリ
(RAM)44、46および48に検索可能に格納される。
ステップ102B(図4) このステップの間、「$」シードおよびマスク画像上
のサーチエリアは「$」文字を位置決定する際に使用す
るために確立される。図7はシード画像のための「$」
シード画像サーチエリア$SAの例を示し、図8はマスク
画像のための「$」マスクサーチエリア$MAの例を示
す。図7および図8はシードおよびマスク画像を得るた
めの異なったしきい値を使用することによって生み出さ
れた効果もまた例示する。この点では、図8の「$」マ
スクサーチエリア$MAは(使用された低しきい値のた
め)図7の「$」シードサーチエリア$SAよりも多い異
質な黒ピクセル(ノイズ)を含むということに注目され
たい。
考察される特定の実施例の目的のために、図7の所望
された「$」シードサーチエリア$SAは公知であると仮
定されるであろう。たとえばその位置はCPU20(図2)
において先に格納することもでき、または小切手10(図
1)上の機械読取り可能線10cを読取ることからも得ら
れるであろう。代わりに、「$」文字が位置決定される
まで全体画像のサーチをすることもできる。
ステップ102C、102Dおよび102E(図4) ステップ102Cの間、図7における「$」シードサーチ
エリア$SAは「新しい」黒ピクセルのために走査され
る。以下に説明されるように、「新しい」黒ピクセルは
シードサーチエリア$SAにおいてまだ考慮されて(acco
unted for)いないものである。典型的には、垂直方向
の列単位の走査が使用される、なぜならそれは金額文字
よりも前に遭遇される「$」文字を位置決定する際に、
有利であるためである。もし、走査の間、新しい黒ピク
セルが発見されなければ(ステップ102D)、図5の
「$」シードサーチエリア$SAの最後の垂直方向列が走
査されたかどうかの判断がなされる(ステップ102E)。
そのような場合、拒絶が発生される。拒絶は、もし認識
プロセスに割り当てられた最大時間が終了するとまた発
生し得るということが、また理解されるべきである。こ
れはいずれか1つの小切手のための認識プロセスが、小
切手処理速度の要求と相反する、時間を超過するという
ことを防ぐためになされる。
もしステップ102Eの間に、垂直方向走査が完了されて
いないと判断されるならば、動作はステップ102Cに戻
り、「$」シードサーチエリア$SAの走査方向において
新しい黒ピクセルをサーチし続ける。
ステップ102F、102Gおよび102H(図4) もし新しい黒ピクセルがステップ102Dの間に発見され
るならば、動作はステップ102Fに進む。ステップ102Fの
間に、「$」シードサーチエリア$SA(図7)において
発見されたシード黒ピクセル(ステップ102D)は、
「$」マスクサーチエリア$MA(図8)を使用して成長
させられ、ピクセルの連結群を発生し、それは以下に記
号CCと称されるであろう。CCが発生される態様が次に説
明されるであろう。
図7の「$」シードサーチエリア$SAがまず参照され
る。「$」文字10aはおおよそ完全であるように見える
であろうが、10′aで示されるように種々の切れ目を伴
い、一方で隣接の額面金額10bの数字「8」はより大き
く広い切れ目10′bを有する。これは、「$」文字は普
通額面金額文字よりも有意に高度なコントラストを有
し、より高品質の印刷プロセスを使用してつくり出され
るため予期されることである。(先に説明されたよう
に、)比較的高いしきい値が「$」シード画像を得るた
めに使用されるため、図7における「$」シードサーチ
エリア$SAは32sのようなほんの少しの、広く間隔をあ
けられた異質の黒ピクセルを含むということにもまた注
目されたい。
次に図8における「$」マスクサーチエリア$MAを参
照すると、(前に説明されたように)それはより低いし
きい値を使用して得られる。より低いしきい値処理のた
め、「$」文字10aは完全であるが、一方で隣接の額面
金額10bの「8」はまだ幾らかの切れ目10″bを含むと
いうことが見られるであろう。また、図8の「$」マス
クサーチエリア$MAにおいて32mのような、図7の
「$」シードサーチエリア$SAにおいてよりも有意に多
い異質な黒ピクセルがある。加えて、「$」マスクサー
チエリア$MAは額面金額枠33による黒ピクセルを含む。
図4におけるステップ102Dおよび102Fは、「$」文字
を位置決定しかつ認識するのに(それぞれ図7および8
の)「$」シードおよびマスクサーチエリア$SAおよび
$MAの両方を利用する。より特定的には、新しい黒ピク
セルが図7の「$」シードサーチエリア$SAにおいて発
見されると(ステップ102D)、図8の「$」マスクサー
チエリア$MAにおける対応する位置を有するピクセルが
位置決定される。たとえば、もし図7における34sが
「$」シードサーチエリア$SAにおいて発見された新し
い黒ピクセルであるならば(ステップ102D)、図8の
「$」マスクサーチエリア$MAにおける対応して位置決
定される黒ピクセル34mが位置決定される。これは図6
のそれぞれ「$」シードおよびマスクRAM44および48に
おいて格納されたシードおよびマスク画像を使用して実
現され得、それはたとえば、対応するシードおよびマス
クピクセルが対応するアドレスを有するように構成され
てもよい。
ステップ102Fの実行において行なわれる次の動作は、
「$」マスクサーチエリア$MAにおける黒ピクセル34m
(図8)を成長させ、34mに連結されたすべての黒ピク
セルからなるCCを発生することである。これはたとえ
ば、図6のマスクRAM48を使用して達成されてもよい。
黒ピクセル34m(図8)から始まって、黒ピクセル34m
(図8)にすぐ隣接するピクセル位置に対応するアドレ
スでの黒ピクセルがあるかどうかに関する判断がなされ
る。同様の判断が、新規に判断された黒ピクセルの各々
についてなされ、CCを形成するすべての連結黒ピクセル
が識別されるまで再度繰返される。これらの識別された
黒ピクセルのアドレスは、黒ピクセル34mから発生され
たCCを構成する。図6におけるマスクRAM46は、たとえ
ばCCを形成する識別された黒ピクセルのアドレスを格納
するのに使用されてもよい。
さらに図7および図8を参照すると、もし図7の
「$」シードサーチエリア$SAにおいて発見された新し
いピクセル(ステップ102D)が「$」文字10aの黒ピク
セル34sであるならば、図8の「$」マスクサーチエリ
ア$MAにおける対応する黒ピクセル34mの成長によって
つくり出された結果としてのCC(ステップ102F)はCC−
1であり、それは「$」文字10aである。これは図8の
「$」マスクサーチエリア$MAにおける「$」文字のす
べてのピクセルが連結されるためである。
他方、もし「$」文字が存在せず、「$」シードサー
チエリア$SA(図7)において発見された新しい黒ピク
セルが数字「8」のピクセル36sであったと仮定する
と、図8の対応する黒ピクセル36mの成長はCC−2を発
生し、それは切れ目10″bのために「8」の上部の部分
にすぎないと思われるであろう。
ステップ102FのCCの発生に従って、動作はステップ10
2Gに進み、そこでは発生されたCCのサイズ、幾何学的形
状および位置が、「$」文字の適当な候補かどうか、ま
たは拒絶されるべきかどうかという比較的早い判断をな
すために使用され、それによって比較的により時間を消
費する認識プロセスを避ける。
CCが「$」候補であると判断されるときのみ(ステッ
プ102G)、動作はステップ102Hに進み、そこでは従来の
文字認識が、CCが「$」文字であるかどうかを判断する
ために実行される。たとえば前述の米国特許第4,449,23
9号において説明された分類器手法は認識のために使用
されてもよい。もしCCがステップ102Gにおいて適当な
「$」の候補であると判断されない場合、またはもしCC
がステップ102Hにおいて「$」であると認識されない場
合、動作はステップ102Cに戻り、図7の「$」シードサ
ーチエリア$SAにおいて新しい黒ピクセルを走査し続け
る。しかしながらもし、CCがステップ102Hにおいて
「$」文字と認識されるならば、「$」文字は位置決定
される。そのような場合、さらなる走査は行なわれず、
動作は図3のステップ104に進み、額面金額を抽出す
る。
ステップ102Eと関連して先に述べたように、走査の終
わりに達するときに、もし「$」文字の認識がなされな
ければ、拒絶が発生する。もし追加的サーチエリアが
「$」文字のために走査されることが所望されるなら
ば、走査の終わりに拒絶を生み出す代わりに、動作は図
4のステップ102Bまで戻り、新しいシードおよびマスク
サーチエリアを確立する。追加的サーチエリアのこの走
査は所望されるだけの回数、または中断が発生するまで
続けられてもよい。
ステップ102Fの前述の説明から、ステップ102Cで参照
された「新しい」黒ピクセルは、ステップ102Fの間に
「$」マスクサーチエリアにおいての成長の結果として
先に発見されなかったものである、なぜなら先に識別さ
れた黒ピクセルを成長させる必要はないからである。そ
のような先に識別されたシードピクセルが、「$」マス
クサーチエリアにおいて成長されることを防ぐ種々の可
能な方法がある。説明されている実施例において、図4
のステップ102Fにおけるマスク成長の間「$」マスクサ
ーチエリア$MAにおける対応するピクセルを識別する
と、(図6の「$」シード画像RAM44に格納された)
「$」シード画像からシードピクセルを削除することに
よってこの目的を達成することが有利であるということ
がわかった。したがって、ステップ102Fにおける先の成
長の間識別された黒ピクセルは、ステップ102Cの走査の
間見られず、ゆえに「$」文字を位置決定するのに必要
な時間を減ずる。この節約は、シード画像が、その導出
に使用される高しきい値の結果としての比較的僅かな
「ノイズ」黒ピクセルを含むために節約された時間にさ
らに加えられるものである。そのような高しきい値の使
用は可能である。
CCを発生するための上に説明されたシード/マスク成
長手法は小切手10(図1)上の「$」文字10aを位置決
定するのにさらに利点となることが理解されるであろ
う、なぜなら「$」文字は普通高品質および高いコント
ラストを備えて印刷され、「$」マスクサーチエリア$
MA(図8)における切れ目をつくるようには思われない
からである。このように、上に説明されたように(ステ
ップ102Gおよび102H)、認識のために発生されたCCの各
々を提供することは、他の印または(先に考察された数
字「8」のような)文字と比べて「$」文字が認識され
る可能性をかなり高くする。
CCを発生するためのシード/マスク成長手法はこの発
明の範囲内において多くの変形を受けるということがさ
らに理解されるべきである。たとえばCCを発生するため
に使われる「連結性」(connectivity)の定義は、異な
った環境下で特定の型の文字の認識に対処するのに種々
の様式で変化され得る。たとえば、「連結性」の定義は
(垂直、水平および/または特定の対角線のような)1
つまたは2つ以上の特定の方向に制限されるように変更
され得る。連結性の定義における別のあり得る変化は、
特定の環境において「連結された」ピクセル間に発生す
る1つ(または2つ以上)のピクセル切れ目を許容し得
る。
ステップ104の詳細な説明 図3におけるステップ104を達成するための好ましい
態様は図9のステップ104Aから104Jを参照して次に考察
されるであろう。ステップ104の目的は図1に示される
額面金額10bを抽出することであるということが念頭に
おかれるであろう。
ステップ104A(図9) このステップの間、動作は額面金額10b(図5)を抽
出することに切り替わり、額面金額の位置はステップ10
2(図3および図4)における「$」文字10aをうまく位
置決定することに基づいて決定されてきた。ステップ10
4の説明が進行するに従って、ステップ102において
「$」を位置決定するために説明された基本的なシード
/マスク手法は額面金額抽出にも使用されるが、いくら
か異なった態様で使用されるということが明白になるで
あろう。
ステップ104B(図9) このステップの間、シードおよびマスクサーチエリア
は図3のステップ102において「$」文字の位置を決定
したことに基づいて額面金額の抽出のために確立され
る。図10は額面金額シードサーチエリアC.A.SAの例を示
し、一方で図11はいくらかのより大きい額面金額マスク
サーチエリアC.A.MAの例を示す。図11のC.A.MAは額面金
額枠33より下に突き出すかもしれない額面金額部分を含
むのに十分なサイズであるということに注目されたい。
またこの点において、額面金額の「7」は図10の額面金
額サーチエリアC.A.SAに全部は含まれないけれども、
「7」は図11のより大きい額面金額マスクサーチエリア
C.A.MAにおけるシード/マスク成長の結果として全部抽
出されるであろうということにも注目されたい。
ここに説明される好ましい実施例において、「$」の
位置決定のために使用されたのと同じ(図6のRAM48に
格納された)マスク画像が金額抽出のために使用される
が、(図6のRAM46に格納された)額面金額シード画像
は「$」文字を位置決定するために使用された(RAM44
における)「$」シード画像の代わりに金額抽出のため
に使用される。これは、「$」シード画像しきい値が先
に説明されたように、高度なコントラスト「$」文字を
利用するために高く選択され、それはより大きいコント
ラスト変化の範囲を有する額面金額文字にとってふさわ
しくないため、行なわれる。図10は額面金額シードサー
チエリアC.A.SAのためのしいき値の可能な選択の例を示
し、そこでは枠33(図5)は低コントラストの異質なピ
クセル(ノイズ)と同様、現われない。この点で、額面
金額のすべての部分が図10の額面金額サーチエリアC.A.
SAに含まれる必要はないということが理解されるべきで
ある。図11のC.A.MAにおけるシード/マスク成長の結果
としての額面金額の適切な抽出を提供するために、額面
金額の十分な部分が図10のC.A.SAに含まれることのみが
要求される。
ステップ104C、104D、104Eおよび104F(図9) これらのステップは通常の額面金額に関して、走査の
終わりの後(ステップ102E)拒絶がないこと、動作は代
わりにステップ106(図3)に進むことを除いて、図4
のそれぞれのステップ102C、102D、102E、および102Fの
ために先に説明されたものと一般的に同じであってもよ
い。ステップ104C、104D、104Eおよび104Fはゆえに詳細
には考察されないであろう。額面金額シードサーチエリ
アC.A.SA(図10)の走査の間に「新しい」黒ピクセルが
発見されるたびに、額面金額マスクサーチエリアC.A.MA
(図11)における成長は(先に規定されたように)CCを
つくり出す。
ステップ104G(図9) 図4のステップ102Gと同様に、このステップはステッ
プ104Fで発生されたCCが、CCのサイズ、幾何学的形状お
よび位置に基づいて適当であるかどうかをテストする。
額面金額抽出の目的のために、ステップ104Gにおけるこ
のテストは発生されたCCが額面金額の一部であるらしい
かどうかを判断する。たとえば、発生されたCCが額面金
額の部分であるらしいかどうかを判断するための役に立
つ根拠は、たとえば図11の線55のように額面金額マスク
サーチエリアC.A.MAの枠52(図11)まで延在するかどう
かを判断することである。そのような発生されたCCが額
面金額の一部であることはほとんどない。
ステップ104H(図9) もし発生されたCCがステップ104Gにおいて額面金額の
一部ではないらしいと判断されるならば、動作はステッ
プ104Hに進み、発生されたCCを廃棄し、動作はステップ
104Cに戻り、図10の額面金額シードサーチエリアC.A.SA
における新しい黒ピクセルを走査し続ける。
ステップ104I(図9) もし発生されたCCがステップ104Gにおいて額面金額の
一部であるらしいと判断されるならば、動作はステップ
104Iに進み、そこで発生されたCCを(たとえば図6にお
けるRAMメモリ46内に)後の使用のために格納する。動
作はそれからステップ104Cに戻り、図10の額面金額シー
ドサーチエリアC.A.SAにおける新しい黒ピクセルを走査
し続ける。
ステップ104Iを離れる前に、発生されたCCが「$」文
字を位置決定するのに使用される方法(図3および図4
のステップ102)と額面金額抽出および認識のために使
用される方法との間の違いに注目することは役に立つで
あろう。「$」文字を位置決定するために、発生された
CCの各々は認識目的のためのものと考えられるというこ
とが念頭におかれるであろう、なぜなら「$」文字は高
品質の印刷で提供され普通高度なコントラストを有し切
れ目を有さないからである。しかしながら、額面金額抽
出のために発生されたCCは文字の断片的な部分にすぎな
いかもしれない、なぜなら額面金額文字は、特に手書き
されるとき、幾つかの切れ目を有するかもしれないから
である。このように、額面金額文字は複数の発生された
CCからなるかもしれない。したがって、額面金額を抽出
かつ認識する際に、(図4のステップ102Hにおいて)
「$」文字を位置決定するときになされるようには、発
生されたCCを認識するという試みはなされない。代わり
に、額面金額の一部であるらしいと判断された各CCは、
全体の額面金額エリアが走査されるまでストアされ(ス
テップ104I)、その時点では額面金額の一部であるらし
いすべての発生されたCCが格納されていることになるで
あろう。これらの格納されたCCは抽出された額面金額を
構成する。図13は上に説明されるように抽出されたその
ような格納された額面金額の例である。このように、額
面金額に関して、CCを発生するためのシード/マスク成
長手法は主に認識のための額面金額抽出および格納の特
に有利な方法として役に立つ。
ステップ104J(図9) 典型的にステップ104Jは(走査の終わりをテストす
る)ステップ104Eを介して、額面金額、シードサーチエ
リアC.A.SA(図10)の走査が完了され、額面金額の一部
であるらしいすべての発生されたCCが格納された後に到
達される。ステップ104Jの目的は、この格納された抽出
された額面金額(図13)を62および63で例示されるよう
な異質なCCを除去することによって明瞭にすることであ
る。使用される1つの手法は、62のような異質なCCがも
し額面金額領域の上と下との予め定められた量だけ間隔
をあけられている場合には、それらを削除することであ
る。これはたとえば上部および下部境界線を有する領域
を規定するために全体金額フィールドを水平に投彩する
ことによって達成されてもよい。これらの境界線の上ま
たは下の、図13における62のようなCCはそれから削除さ
れる。もし投彩が複数の領域を生み出すならば、適切な
上部および下部境界線は「$」文字を含む領域に対応す
るものである。
額面金額の右に位置する図3における63のような異質
のCCの除去はより複雑な問題を引き起こす、なぜならそ
れらは額面金額の一部であるかもしれないからである。
これらのCCが異質かどうかを判断するための特に有利な
方法は、最も右のCCとCCの左の最も近い黒ピクセルとの
間の水平間隔がCCの水平幅より予め定められた量だけ大
きいという条件に基づく。もしこの条件に合致するなら
ば、CCは異質なものと考えられ、削除される。いかにこ
の条件が実現され得るかという例は図13に関して説明さ
れるであろう。この例のために、額面金額領域は左から
右に番号付けられた列に分割され、各列は1ピクセルに
等しい幅を有すると考えられる。最初に、以下の列の位
置決定は抽出された額面金額から判断される、 C1=黒ピクセルを有する最も右の列。
C2=C1の左の最小幅Wを備える白列の隣りのエリアの
最も右の列。
C3=黒ピクセルを有する、C2の左隣りの列。
もし以下の条件に合致するならば、 (C2−C3)>K(C1−C2) C1およびC3の間に置かれたすべての黒ピクセル素子63
は削除される。典型的に、Wは3つの列の幅に対応する
幅を有してもよく、Wは単一の文字の部分によっては上
の条件が満たされないように選択される。Kは典型的に
は1.5の値を有してもよい。WおよびKのこれらの値は
額面金額が異質なCCと間違えられないことを保証するよ
うに選択される。上のことは、条件が合致し続ける限り
反復的に繰返される。条件が合致し損ねたとき、テスト
は終了し動作は図3の次のステップ106に進む。
ステップ110の詳細な説明(図12) ステップ110はもしステップ104の間に抽出された額面
金額が手書きであると判断されたならば到達されるとい
うことが図3から理解されるであろう。ステップ110の
目的は「¢」部分10b−1(図1)を額面金額10bのドル
部分10b−2から分離することである。ステップ110を、
この発明に従って達成するための好ましい態様は、図12
のステップ110Aから110Hを参照して次に考察されるであ
ろう。額面金額の「$」部分および「¢」部分は以下に
「$」フィールドおよび「¢」フィールドとそれぞれ称
されるであろう。
ステップ110A(図12) ステップ110Aの間、抽出された額面金額はピリオドま
たは小数点(「.」)の存在をサーチされる。そのよう
なピリオドまたは小数点は、もちろん額面金額の「$」
および「¢」フィールドの間の分離を示し、その検出は
したがってこれらのフィールドを分離するための根拠と
して使用される。
ピリオドの存在を検出するための好ましい方法は図14
に関して説明されるであろう。この目的のために、抽出
された額面金額は、図6のRAMメモリ46に格納された抽
出された額面金額の画像の列単位の走査を使用する等に
より左から右に調査される。
もし図13におけるPCのような潜在的なピリオド候補が
発見されると、上部線ULおよび下部線LL(図14)が(図
14の数字「9」のような)PCのすぐ左の額面金額部分の
ために決定される。線は上から下へと番号付けられる。
潜在的ピリオド候補PCは、もし以下の条件が満たされれ
ば、実際のピリオド候補と考えられる。
(1) 潜在的ピリオド候補PCの高さは1/2(UL−LL)
よりも大きくない。
(2) 潜在的ピリオド候補PCは所定の量よりも少ない
幅Wを有する。
(3) 潜在的ピリオド候補PCの平均の線数は1/2(UL
+LL)よりも少ない。
典型的には、3つまでのピリオド候補が上の測定に基
づき識別されることが可能である。動作はそれから図12
のステップ110Bに進む。
ステップ110B(図12) ステップ110Bの間、ステップ110Aにおいて決定された
3つまでのピリオド候補を、たとえば前述の特許におい
て開示されたような公知の統計学的分類技術を使用して
調査される。もし1以上のピリオド候補が受け入れ可能
であるとわかったら、最も右の1つが「$」および
「¢」フィールドを分離するものであるとして選ばれ、
動作は図12のステップ110Gに進む。
しかしながらもし1つのピリオドも識別されなけれ
ば、動作はステップ110Cに進み別の根拠で「$」および
「¢」フィールドを分離しようとする。
ステップ110C(図12) ステップ110Cの間、図5に示されるように、額面金額
の「¢」フィールドの添字(subscripting)は額面金額
の「$」および「¢」フィールドの分離に関する根拠と
して調査される。この目的のために、抽出された額面金
額は再び左から右へと調査され、(たとえば図14におけ
る数字「5」のような)上付きに書かれた文字SCの開始
を検出する。
潜在的ピリオド候補のサーチを説明するステップ110B
と同様に、上部線ULおよび下部線LL(図15)は(図15の
数字「7」のように)候補の上付きに書かれた文字SCの
すぐ左の額面金額部分のために決定される。再び線は上
から下へと番号付けられる。候補の上付きに書かれた文
字SCはもし以下の条件が満たされると実際の上付きに書
かれた文字と考えられる。
(1) 候補の上付きに書かれた額面金額文字の底の線
番号は1/3(2LL+UL)より大きくない。
(2) 候補の上付きに書かれた文字SCの高さは少なく
とも1/3(LL−UL)である。
(3) 候補の上付きに書かれた文字SCは(図15の数字
「7」のような)すぐ左の額面金額部分から少なくとも
1白列だけ分離される。白列は黒ピクセルを有さない列
である。
(4) 候補の上付きに書かれた額面金額文字SCのすぐ
右の額面金額部分SC′(図14の数字「0」)はSCの下部
線番号プラスその高さの半分よりも大きくない下部線番
号を有する。
上記の条件を満たす第1の候補は、上付きに書かれた
「¢」フィールドの開始であると考えられる。
動作はそれから図12のステップ110Dに進む。
ステップ110D(図12) ステップ110Dはステップ110Cで実行された上付きに書
かれた「¢」フィールドのサーチの結果を受け取る。も
し上付きに書かれた文字が見つけられたら、「$」およ
び「¢」フィールドの分離のための根拠が決定され、動
作はステップ110Gに進む。
しかしながらもし上付きに書かれた「¢」フィールド
が見つけられなければ、動作は図12のステップ110Eに進
み、「$」および「¢」フィールドの分離のための別の
根拠を見つける。
ステップ110E(図12) ステップ110Eの間、図16および図17に示されるよう
に、複合「¢」フィールドの存在は「$」および「¢」
フィールドの分離のための根拠として調査される。図16
は下線を有する2つの上付きに書かれた数字からなる複
合「¢」フィールドの第1の型を示すということが見ら
れるであろう。図17は「¢」金額が分数として与えられ
る複合「¢」フィールドの第2の型を示す。
複合「¢」フィールドが存在するかどうかを判断する
ために、抽出された額面金額は、先に説明されたステッ
プ110Aおよび110Cのように右から左へと再度調査され
る。複合「¢」フィールドのサーチに際し、以下のこと
が決定される(図16および図17を参照)。
(1) 抽出された額面金額の最後に占められた列C1。
(2) 最後に占められた列C1の左の第1の白列C2。
(3) 白列C2の右に位置する額面金額部分によって占
められる第1の線L1。
図16および図17に示されるように、C1、C2およびL1の
値はそれが複合「¢」フィールドの適切な候補であるか
どうかについてのテストのために抽出された額面金額の
特定の部分の枠を決める。テストは種々の可能な「¢」
フィールド型および、特に、図16および図17に示される
複合「¢」フィールド型を認識するように特定的に設計
される統計学的分類技術を使用して達成される。そのよ
うな統計学的分類技術が実現される態様は上記の特許か
ら明白であろう。
もし、図16および図17に示されるように複合「¢」フ
ィールドが認識されるならば、列C2は「$」および
「¢」フィールドの間の分離列であると考えられる。C2
は最後に占められた列C1の左の第1の白列であるという
ことが念頭におかれるであろう。
ステップ110Eにおける動作の結果はそれから図12のス
テップ110Fに送られる。
ステップ110F(図12) ステップ110Fはステップ110Eにおいて実行される複合
「¢」フィールドのサーチの結果を受け取る。もし複合
「¢」フィールドが発見されたら、列C2は「$」および
「¢」フィールドの分離の根拠として役に立ち、動作は
図12のステップ110Gへ進む。
しかしながら、もし複合「¢」フィールドが見つけら
れなければ、拒絶が発生する、なぜなら額面金額の
「$」および「¢」フィールドを分離するための根拠が
見つけられずかつ分離のためのさらなる根拠がないから
である。この点において、分離を提供するためのさらな
る根拠がまた与えられてもよいということが理解される
べきである。
ステップ110G(図12) 図12の上の説明から、ピリオドを見つけるか(ステッ
プ110Aおよび110B)、上付きに書かれた「¢」フィール
ドを見つけるか(ステップ110Cおよび110D)、または複
合「¢」フィールドを発見するか(ステップ110Eおよび
110F)のいずれかに基づいて、額面金額の「¢」および
「$」フィールドを分離するための根拠を発見した結果
として動作はステップ110Gに進むということが理解され
るであろう。
したがってステップ110Gは分離のために見つけられた
特定の根拠(ピリオド、上付きに書かれることまたは複
合「¢」フィールド)を使用して「¢」フィールドを分
離する。
またステップ110Gの間、分離された「¢」フィールド
は前述の特許において開示されたような統計学的分類技
術を使用して幾つかの型の1つとして類別される。説明
されている好ましい実施例のためにステップ110Gによっ
て与えられ得る類別は2つの0、2桁の数字、下線付き
2桁の数字および分数である。別の類別も与えられ得
る。
もし許容可能な類別がステップ110Gにおいて決定され
るならば、動作は図12におけるステップ112に進み、さ
もなければ拒絶が発生する。
ステップ112(図3)の詳細な説明 この発明に従ってステップ112を達成するための好ま
しい態様が次に考察されるであろう。ステップ112の目
的は「¢」フィールドのために決定された類別に基づい
て「¢」文字を抽出することであることが念頭におかれ
る。
説明されている好ましい実施例において与えられた種
々の類別のためのステップ112における動作は以下に説
明される。
2つの0 この類別に関して、「¢」フィールドの値は0である
ということが即座に知られ、したがって動作はさらなる
処理を伴わず図3のステップ116に進む。典型的には、
この類別は分離の根拠がピリオドまたは上付きに書かれ
た「¢」フィールドの検出であるところでのみ使用され
る。
2桁の数字 この類別に関しては、「¢」フィールドの数字は直接
利用可能であり、ゆえに動作はさらなる処理を伴わず認
識のための図3におけるステップ114に進む。「2つの
0」類別と同じく、この類別は典型的には分離のための
根拠がピリオドまたは上付きに書かれた「¢」フィール
ドの検出であるところでのみ使用される。
下線を引かれた2桁の数字 この類別に関しては、「¢」フィールドが下線を引か
れた「36」からなる図18および図19に例示されるように
「¢」文字のみが残るように動作は下線を除去すること
に向けられる。この目的を達成するための好ましい具体
例は以下に説明される。
まず下線の勾配が以下のように決定される。「¢」フ
ィールドの各列に関して、第1の黒ピクセルに対する白
ピクセルの数が下部端縁からカウントされる。もし2つ
の連続する列のこれらの個数の差が量に関して4より大
きければ、不連続の部分が存在する。「¢」フィールド
における不連続のすべての部分および2つの不連続の部
分の間の最も大きい列範囲が決定される。この最も大き
い列範囲において、下線がまた予期される。2つの画像
の座標点(x1,y1)および(x2,y2)は以下のように規定
される。
x1=列範囲の開始列。
y1=列x1における下部端縁から第1の黒ピクセルまで
の白ピクセルの数。
x2=列範囲の終わりの列。
y2=列x2における下部端縁から第1の黒ピクセルまで
の白ピクセルの数。
下線の勾配SLは以下の方程式によって定められる。
SL=(y2−y1)/(x2−x1) 発見された下線を削除するために、勾配SLのn直線の
集合および1の垂直間隔が形成される。直線の数nは下
線の勾配に依存し、以下のように確立される。
0 |su|<0.5の時 n=11 0.5|su|<1の時 n=14 1 |su|<2の時 n=25 その他の時 n=32 さらに、開始点がこれらの直線の上に、これらの直線
に沿って走査ステップ幅1で右からおよび左から「¢」
フィールドを走査するために確立される。
左からの走査の場合、 x1(i)=「¢」フィールドの第1の列(すべての直
線に関して)y1(i)=y_開始+i−1(i番目の直線
に関しては) この場合、y_開始は(x1 y1)が第1の直線の走査点
で発生するように確立される。
右からの走査の場合、 xr(i)=「¢」フィールドの最後の列(すべての直
線に関して) yr(i)=y_開始+i−1(i番目の直線に関して) この場合、y_開始は(x2,y2)が第1の直線の走査点
で発生するように確立される。
「¢」フィールドはこれらの直線に沿って走査され、
その目的は可能な限りにおいてその直線より下には完全
な下線は生じるが役に立つ情報は生じないような直線を
決定するためである。この目的のために、走査点の個数
は、「¢」フィールドの第1の黒ピクセルを備える走査
点に関する限りは、右からおよび左からの走査において
すべての走査直線に関してカウントされる。それから、
右からの走査コースにおけるおよび左からの走査コース
におけるカウントされた走査点の最大個数を備えた直線
が決定される。直線のこの範囲から、一番低いものが選
択される。この最も低い直線以下の抽出された「¢」フ
ィールドのすべての部分は削除され、図19に示される結
果を生み出す。上の手順は「¢」文字が下線を遮断する
ような状況をも取り扱う。
下線の除去の後(図19)残った「¢」フィールド構成
要素(図19の「36」)は再び統計学的分類技術を使って
確かめられ、2つの0または2桁の数字類別のどちらに
入るか決定される。もし類別が2桁の0ならば、動作は
ステップ116に進む、なぜなら「¢」フィールドの値は
0であることが既知であるからである。もし類別が2桁
の数字ならば、動作は2桁の数字を認識するためにステ
ップ114に進む。もしいずれの類別も発見されなけれ
ば、拒絶が発生する。
分数 この類別に関しては、動作は図20、21および22に示さ
れるようにまず分母を除去し、それから分数点を除去す
る、なぜなら「¢」フィールドは分子「80」および分母
「100」を有する分数からなるからである。この目的を
達成するための好ましい具体例は以下に説明される。
第1に、フィールドは分数線が予期される列範囲まで
調査される。これは、たとえば、最も大きい幅を有する
連結構成要素群CCを決定することによって達成されても
よい。一旦分数線が発見されると、その勾配は座標x1、
y1、x2、y2を発見することおよび下線を引かれた複合
「¢」フィールドに関して先に説明されたのと同じ態様
で勾配を計算することによって決定される。
可能な限り分子および分数線のみが位置する、分割直
線がここで確立される。この分割直線は勾配および以下
を備える座標「x1、y1+オフセット」で決定される。
0 |sb|<0.5の時 オフセット=2 0.5|sb|<1の時 オフセット=3 1 |sb|<2の時 オフセット=7 その他の時 オフセット=10 このように分割直線を確立して、この分割線の下の
「¢」フィールド構成要素は削除され、図19に示された
分数の例に関しては、分母「100」が削除される結果と
なるであろう。このように、残りの「¢」フィールド構
成要素は、図21に示される下線を引かれた「80」となる
であろう。
したがって、図21に例示されるように、分数動作はこ
こまでは下線を引かれた2つの0または2桁の数字とい
う結果になるはずであり、残りの「¢」フィールド構成
要素は統計学的分類技術を使って確かめられ、これらの
残りの構成部分が実際この下線を引かれた2つの0また
は下線を引かれた2桁の数字に対応するかどうかを決定
する。もしそうならば、動作は、下線を引かれた複合
「¢」フィールド類別に関して上に先に説明されたよう
に継続し、「¢」文字を抽出し(図22)、もしそうでな
ければ、拒絶が発生する。
この発明はここに特定の好ましい実施例について説明
されてきたが、具体例、配列および使用において多くの
修正および変形がこの発明の範囲内で可能であるという
ことが理解されるべきである。たとえば分類類別の型お
よび個数のみならず使用されるシードおよびマスク画像
ならびにサーチエリアの個数および型も変化してもよ
い。さらに、シードおよびマスク画像は2値(2レベ
ル)画像に限定される必要はない。額面金額抽出、
「¢」フィールド分離および/または認識のために役に
立つ追加的な情報を提供するために、たとえば、マスク
画像それ自体がグレーレベル(多レベル)画像であって
もよい。さらに処理ステップも追加的な特徴を与えるた
めに追加されてもよく、または説明されたステップも除
去されまたは再配列されてもよい。加えて、この発明は
ここに説明されたもの以外に多種多様な適応に適合され
得る。したがって、以下の請求の範囲はそこに規定され
た範囲内でのすべての可能な修正および変形を含むもの
であると考えられるべきである。
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 601,142 (32)優先日 平成2年10月19日(1990.10.19) (33)優先権主張国 米国(US) (73)特許権者 999999999 ツェー・ゲー・カー・コンピュータ・ゲ ゼルシャフト・コンスタンツ・ミット・ ベシュレンクテル・ハフツング ドイツ連邦共和国、デー・7750 コンス タンツ、マックス・シュトロメイエル・ シュトラーセ、116 (72)発明者 ビュストマン,ゲルハルト・カー ドイツ連邦共和国、デー・7753 アレン スバッハ/カルトブルン、オームトビー ゼンベーク、3 (56)参考文献 特開 平4−25990(JP,A) 特開 平4−25989(JP,A) 米国特許4685141(US,A) 米国特許4205780(US,A) 米国特許4201978(US,A) 欧州特許出願公開344742(EP,A 2) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 G06K 9/34 G06K 9/38

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】文書からデータを抽出するための電子的に
    実現される方法において、 前記文書の少なくとも一部分のグレーレベル画像表示を
    生成するステップと、 前記グレーレベル画像表示を、第1の画像表示が第1の
    コントラスト値を越えるグレーレベル画像構成要素のみ
    を含み、第2の画像表示は第2のコントラスト値を越え
    るグレーレベル画像構成要素のみを含むように、前記第
    1と第2の画像表示に変換するステップとを含み、前記
    第1のコントラスト値は前記第2のコントラスト値より
    も高く、前記第1の画像表示における各画像構成要素は
    前記第2の画像表示において対応する構成要素を有し、
    前記変換するステップは第3のコントラスト値を越える
    グレーレベル画像構成要素のみを含む第3の画像表示を
    また生成し、前記第3のコントラスト値は前記第1およ
    び第2のコントラスト値の中間であり、前記第3の画像
    表示における各画像構成要素は前記第2の画像表示にお
    いて対応する構成要素を有し、さらに 画像構成要素の位置決定のために前記第1の画像表示の
    所定のエリアを走査するステップと、 前記走査時に前記第1の画像表示の前記所定のエリアに
    おいて見出された画像構成要素に従って、前記第2の画
    像表示の第1の所定エリアにおける対応する画像構成要
    素を成長させ、前記対応の画像構成要素と、前記第2の
    画像表示における前記第1の所定のエリアにおいて前記
    対応の画像構成要素と、所定の連結関係を有する画像構
    成要素とからなる連結構成要素群を発生するステップ
    と、 発生された連結構成要素群が特定の記号に対応するかど
    うか判断するステップとを含み、 前記走査、発生および判断のステップは前記特定の記号
    に対応すると判断される発生された構成要素群がつくり
    出されるまで、または前記第1の画像表示の前記所定の
    画像エリアの走査が完了するまで続けられ、さらに 連結構成要素群が前記特定の記号に対応すると判断され
    たことに応答して、画像構成要素を求めるため前記第3
    の画像表示の所定のエリアを走査するステップを含み、
    前記第3の画像表示の前記所定のエリアは前記特定の記
    号の位置に基づいて選択され、さらに 前記走査が前記第3の画像表示の前記所定のエリアにお
    ける画像構成要素を見つけたことに応答して、前記第2
    の画像表示の所定の第2のエリアにおける対応する画像
    構成要素を成長させ、前記所定の第2のエリアにおいて
    前記対応する画像構成要素と前記所定の第2のエリアに
    おいて前記対応する画像構成要素と所定の連結関係を有
    する前記所定の第2の画像エリアにおける画像構成要素
    とからなる連結構成要素群を発生するステップを備え、
    前記所定の第2のエリアもまた前記特定の記号の位置に
    基づいて選択され、さらに 前記所定の第2のエリアに発生された連結構成要素群が
    前記文書から抽出されるべき特定のデータに対応する所
    定の特性に合致するかどうか判断し、一致するならば発
    生された連結構成要素群を格納するステップと、 前記格納するステップの後前記第3の画像表示の前記所
    定のエリアの前記走査を再開するステップとを含み、 前記第3および第2の画像表示に関する前記走査、発
    生、判断および格納するステップは前記第3の画像表示
    の前記所定のエリアの走査が完了するまで続けられる、
    方法。
  2. 【請求項2】前記走査するステップの間、先に発生され
    連結構成要素群に含まれる画像構成要素に対応する走査
    領域における画像構成要素を無視するステップを含む、
    請求項1に記載の方法。
  3. 【請求項3】前記文書は財務文書であり、抽出されるべ
    きデータはそこに隣接する関連の記号を有する金額であ
    り、前記関連の記号は前記特定の記号である、請求項1
    に記載の方法。
  4. 【請求項4】前記文書上の前記特定の記号の印刷の品質
    は、前記特定の記号のために発生される連結構成要素群
    が前記特定の記号としてたやすく認識可能であるよう
    に、前記第1および第2のコントラスト値に関係して選
    択される、請求項3に記載の方法。
  5. 【請求項5】前記変換するステップによってつくり出さ
    れた各画像表示は、ピクセルからなるディジタル表示で
    あり、各ピクセルはそれぞれの画像構成要素に対応し、
    各ピクセルは前記グレーレベル画像表示において対応す
    る位置のコントラスト値を示すディジタル値を有する、
    請求項1に記載の方法。
  6. 【請求項6】前記ディジタル表示は2値表示である、請
    求項5に記載の方法。
  7. 【請求項7】前記変換するステップは前記グレーレベル
    画像表示を結果として生じる画像表示上に含まれるべき
    グレーレベル値に基づいて選択されたしきい値で処理す
    ることによって各画像表示をつくり出す、請求項6に記
    載の方法。
  8. 【請求項8】前記変換するステップは前記画像表示を同
    時につくり出す、請求項5に記載の方法。
  9. 【請求項9】前記第3の画像表示の前記所定のエリアの
    前記走査が完了した後、前記第2の画像表示の前記走査
    の結果得られて格納された連結構成要素群を、前記文書
    上の前記データを認識するための自動データ認識装置に
    与えるステップを含む、請求項1、2、3、4または5
    に記載の方法。
  10. 【請求項10】前記与えるステップより先に、抽出され
    るべきデータを含むと判断された領域の外に位置する前
    記格納された連結構成要素群のいかなるものも除去する
    ステップを含む、請求項9に記載の方法。
  11. 【請求項11】文書から金額は文書に印刷された認識文
    字に隣接して位置する複数の文字からなる、金額を自動
    的に読取るためのシステムにおける、電子的に実現され
    る方法であって、 前記識別文字を含む前記文書の少なくとも一部のグレー
    レベル画像を生成するステップと、 前記グレーレベル画像から、3つの対応する2値ピクセ
    ル画像を、3つの異なったコントラスト値を使用して導
    出するステップとを含み、前記2値ピクセル画像は第1
    および第2のシード画像およびマスク画像を含み、前記
    第1のシード画像は前記第2のシード画像に使用される
    ものよりも大きいしきい値を使用して得られ、前記第2
    のシード画像は前記第3の画像に使用されるものより大
    きいしきい値を使用して得られ、さらに 前記識別文字を検出するステップを含み、該検出ステッ
    プは (a)前記第1のシード画像を走査して、データを含む
    ピクセルを検出するステップと、 (b)前記マスク画像において、前記第1のシード画像
    において検出されたピクセルに対応するピクセルを成長
    させるステップとを含み、前記成長させるステップは、
    連結されたピクセルの群をつくり出すために前記マスク
    画像においてのピクセル連結性に基づいて実行され、さ
    らに (c)各つくり出された連結されたピクセルの群をテス
    トし、それが前記識別文字に対応するかどうかを判断す
    るステップと、 (d)連結されたピクセルの群が前記識別文字に対応す
    るという判断に応答して前記識別文字を検出するステッ
    プを含み、 前記第2のシード画像の特定のエリアを走査し、データ
    を含むピクセルを検出するステップを含み、前記特定の
    エリアは検出された識別文字の位置に基づいて決定さ
    れ、さらに 前記マスク画像において、前記第2のシード画像におい
    て検出されたピクセルに対応する各ピクセルを成長させ
    るステップを含み、前記成長させるステップは前記マス
    ク画像においてピクセル連結性に基づいて実行され、前
    記第2のシード画像において検出された各ピクセルに応
    答するピクセルの連結された群をつくり出し、さらに 前記第2のシード画像の走査によってつくり出された各
    連結されたピクセルの群が前記金額の文字の少なくとも
    一部分に対応するかどうか判断し、もしそうであるなら
    ば連結されたピクセルの群の表示を格納するステップ
    と、 前記第2のシード画像の走査ステップが完了した後、前
    記金額を認識するための自動文字認識装置に、結果とし
    て得られた格納された表示を与えるステップとを含む、
    方法。
  12. 【請求項12】シード画像の走査の間、データを含むピ
    クセルは、もしそれが先につくり出された連結されたピ
    クセルの群において含まれるピクセルに対応するなら
    ば、無視される、請求項11に記載の方法。
  13. 【請求項13】前記与えるステップの前に、前記金額を
    含むと判断された領域の外に位置する、格納された表示
    のうち異質なものを除去するステップを含む、請求項11
    または12に記載の方法。
  14. 【請求項14】前記識別文字は「$」である、請求項11
    または12に記載の方法。
  15. 【請求項15】前記識別文字の印刷の品質は、前記識別
    文字が前記識別文字としてたやすく認識可能である連結
    されたピクセルの群をつくり出すように前記しきい値と
    関連して選択される、請求項11または12に記載の方法。
JP03517202A 1990-09-28 1991-09-26 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 Expired - Fee Related JP3078318B2 (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
AT90/01639 1990-09-28
EP9001639 1990-09-28
DE4030799 1990-09-28
DE4030799.9 1990-09-28
US90/01639 1990-10-19
US601,142 1990-10-19
US4030799.9 1990-10-19
US07/601,142 US5864629A (en) 1990-09-28 1990-10-19 Character recognition methods and apparatus for locating and extracting predetermined data from a document
PCT/US1991/007120 WO1992006449A1 (en) 1990-09-28 1991-09-26 Character recognition methods and apparatus for locating and extracting predetermined data from a document

Publications (2)

Publication Number Publication Date
JPH06501801A JPH06501801A (ja) 1994-02-24
JP3078318B2 true JP3078318B2 (ja) 2000-08-21

Family

ID=27201730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03517202A Expired - Fee Related JP3078318B2 (ja) 1990-09-28 1991-09-26 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置

Country Status (9)

Country Link
US (1) US5864629A (ja)
EP (1) EP0551403B1 (ja)
JP (1) JP3078318B2 (ja)
AT (1) ATE173846T1 (ja)
AU (1) AU658839B2 (ja)
CA (1) CA2091997C (ja)
DE (1) DE69130535T2 (ja)
WO (1) WO1992006449A1 (ja)
ZA (1) ZA917532B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7836932B2 (en) 2007-09-14 2010-11-23 3M Innovative Properties Company Taping head

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0677817B1 (en) * 1994-04-15 2000-11-08 Canon Kabushiki Kaisha Page segmentation and character recognition system
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
US7411593B2 (en) 2001-03-28 2008-08-12 International Business Machines Corporation Image rotation with substantially no aliasing error
US20040193520A1 (en) * 2003-03-27 2004-09-30 Lacomb Christina Automated understanding and decomposition of table-structured electronic documents
US20040194009A1 (en) * 2003-03-27 2004-09-30 Lacomb Christina Automated understanding, extraction and structured reformatting of information in electronic files
US7653871B2 (en) * 2003-03-27 2010-01-26 General Electric Company Mathematical decomposition of table-structured electronic documents
US20050094861A1 (en) * 2003-10-31 2005-05-05 International Business Machines Corporation Positional synchronization in a multivoting character recognition environment
US7793989B2 (en) * 2004-07-14 2010-09-14 Pinckney Jr Robert Locking connector with depressions
US7653233B2 (en) * 2005-09-12 2010-01-26 Pitney Bowes Inc. Confirming cancellation of truncated checks
RU2006101908A (ru) * 2006-01-25 2010-04-27 Аби Софтвер Лтд. (Cy) Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты)
US8571262B2 (en) * 2006-01-25 2013-10-29 Abbyy Development Llc Methods of object search and recognition
US20070253615A1 (en) * 2006-04-26 2007-11-01 Yuan-Hsiang Chang Method and system for banknote recognition
US8136721B2 (en) * 2006-05-12 2012-03-20 International Business Machines Corporation Enhanced check code line image capture for improved OCR
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
US10650265B1 (en) 2019-05-29 2020-05-12 Capital One Services, Llc Systems and methods for enhancing real-time image recognition

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1311486A (en) * 1969-03-31 1973-03-28 Dunlop Holdings Ltd Floor structures for inflatable boats
EP0082236B1 (en) * 1981-12-23 1986-03-12 International Business Machines Corporation Method of recognizing characters in an optical document reader
US4590606A (en) * 1982-12-13 1986-05-20 International Business Machines Corporation Multi-function image processing system
JPS59186079A (ja) * 1983-04-06 1984-10-22 グローリー工業株式会社 紙幣識別装置
US4685141A (en) * 1983-12-19 1987-08-04 Ncr Canada Ltd - Ncr Canada Ltee Method and system for finding image data associated with the monetary amount on financial documents
GB2164442A (en) * 1984-09-11 1986-03-19 De La Rue Syst Sensing the condition of a document
US4628194A (en) * 1984-10-10 1986-12-09 Mars, Inc. Method and apparatus for currency validation
US4764972A (en) * 1985-05-23 1988-08-16 Nec Corporation Continuous characters recognition system
US4813077A (en) * 1986-07-30 1989-03-14 Scan-Optics, Inc. Sales transaction record processing system and method
US4888812A (en) * 1987-12-18 1989-12-19 International Business Machines Corporation Document image processing system
US5040226A (en) * 1988-05-31 1991-08-13 Trw Financial Systems, Inc. Courtesy amount read and transaction balancing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7836932B2 (en) 2007-09-14 2010-11-23 3M Innovative Properties Company Taping head

Also Published As

Publication number Publication date
DE69130535D1 (de) 1999-01-07
CA2091997C (en) 2001-12-11
US5864629A (en) 1999-01-26
AU658839B2 (en) 1995-05-04
EP0551403B1 (en) 1998-11-25
JPH06501801A (ja) 1994-02-24
DE69130535T2 (de) 1999-07-15
WO1992006449A1 (en) 1992-04-16
CA2091997A1 (en) 1992-03-29
AU8746691A (en) 1992-04-28
ZA917532B (en) 1992-06-24
EP0551403A1 (en) 1993-07-21
ATE173846T1 (de) 1998-12-15

Similar Documents

Publication Publication Date Title
US10943105B2 (en) Document field detection and parsing
US5040226A (en) Courtesy amount read and transaction balancing system
JP3078318B2 (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
CN105528604B (zh) 一种基于ocr的票据自动识别与处理系统
US7295694B2 (en) MICR-based optical character recognition system and method
JPH0587871B2 (ja)
US11132576B2 (en) Text recognition method and apparatus, electronic device, and storage medium
KR19980018029A (ko) 문자 인식 장치
WO2020071558A1 (ja) 帳票レイアウト解析装置、その解析プログラムおよびその解析方法
JPS5947641A (ja) 名刺デ−タベ−ス作成装置
US5721790A (en) Methods and apparatus for separating integer and fractional portions of a financial amount
Almuhajri et al. A Complete Framework for Shop Signboards Detection and Classification
JPH06501803A (ja) 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法
JP3673616B2 (ja) 商品券識別方法及び装置
CN118155211A (zh) 一种票据文本检测方法及装置
CN118823640A (zh) 一种从视频文件中快速提取账单信息的检测方法
JPH01201789A (ja) 文字読取装置
Lin et al. Location of specific items in a document, without using character recognition techniques
JPH06251193A (ja) 文字列抽出装置
Lim et al. Structure analysis of low resolution fax cover pages
JP2000029986A (ja) 帳票データ読取方法、記録媒体、及び、帳票データ読取装置
JP2002269491A (ja) バーコード認識方法および装置並びにプログラム
JPH07302303A (ja) 文字認識装置
JPH0789364B2 (ja) パタ−ン認識装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees