JPH06501801A

JPH06501801A - 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置

Info

Publication number: JPH06501801A
Application number: JP3517202A
Authority: JP
Inventors: ビュストマン，ゲルハルト・カー
Original assignee: ユニシス・コーポレイション; ツェー・ゲー・カー・コンピュータ・ゲゼルシャフト・コンスタンツ・ミット・ベシュレンクテル・ハフツング
Priority date: 1990-09-28
Filing date: 1991-09-26
Publication date: 1994-02-24
Anticipated expiration: 2015-08-21
Also published as: CA2091997A1; ATE173846T1; ZA917532B; WO1992006449A1; DE69130535T2; AU658839B2; US5864629A; JP3078318B2; DE69130535D1; EP0551403B1; CA2091997C; EP0551403A1; AU8746691A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置発明の背景この発明は、一般的には文書上のデータを自動的に認識するための改良された手段および方法に関し、より特定的には、小切手、送状および送金文書のような財務文書上の金額情報を自動的に認識するための改良された手段および方法に関する。

今日の金融サービス業は膨大な量の文書を効率的に処理するという大きな問題に直面している。文書支払方式が衰えるだろうという予測は実現していない。実際、文書支払方式は世界的に成長し、増大し続けると予期されている。

したかってそのような文書を処理するための改良された方法を考案する不可欠な必要性かある。

文書処理に対する支援として画像化技術を使用することは、たとえば米国特許第４，２０５．７８０号、第４，２６４．８０８号、第４．６７２，１８６号、および第４゜８８８．８１２号に開示されるように、文書処理を有意に改良する１方法として認識されてきた。一般的に、画像化は文書を光学的に走査し、電子的に処理されかつ後の検索および表示のために（磁気ディスクドライブおよび／または光学メモリのような）大容量記憶媒体に格納される電子画像をつくり出すことを含む。文書画像化は文書の取扱いおよび移動を減する機会を提供するということは明らかてある、なぜならこれらの電子画像は実際の文書に代わって使用され得るからである。たとえば、文書画像は記憶装置から検索され、ワークステーションに表示され、そこではオペレータは文書を直接的に検視することなく、観察された画像に基づいて金額データおよび他の情報を入力することかできる。

文書処理システムにおいて画像化を利用することは育意な改良を提供し得るか、文書からのデータをオペレータか検視しかつ入力する必要性は、達成できる文書処理速度および効率を限定し続ける。

発明の概要および目的この発明に従って、文書処理の速度および効率のさらなる増大は、文書上のデータを自動的に位置決定し、抽出しかつ認識する改良された方法、より特定的には、小切手、送状および送金文書のような財務文書処理システムにおける使用に必要とされる高速で有利に動作し得る改良された方法を提供することによって可能にされる。

米国特許第４，４４９，２３９号、第４．　２０１．　９７８号、第４，４６８．Ｆ２Ｏ３号、第４，９１８，７４０号、第、４，５２３．３３０号、第４，６８５，１４１号、第３゜８３２．６８２号および欧州特許第ＥＰ−０．１１１，９３０号は当該技術分野において公知である種々の自動データ認識手法を開示する。

目的、特徴、利点および使用のみならずこの発明の特定的性質は、添付の図面に加えて以下の詳細な説明から明白になるであろう。

図面の簡単な説明図１は、米国において広く使用されている型の典型的な小切手を例示する。

図２は、一般的にこの発明か組み入れられてもよい文書処理システムを例示する。

図３は、この発明に従った自動額面金額（ｃｏｕｒｔｅｓｙ　ａｍ。

ｕｎｔ）読取機によって実行される種々の操作ステップを一般的に例示するフローチャートである。

図４は、図３の「＄位置決定」ステップ１０２を達成するための好ましい態様を例示するフローチャートである。

図５は、図２のイメージモジュール１４によって提供される典型的なグレーレベル画像である。

図６は、図５に表わされるグレーレベル画像からのシートおよびマスク２値画像の並列発生および記憶のための装置を例示するブロック図である。

図７は、図４のステップ１０２Ｂによって確立される典型的な「＄」　シードサーチエリア＄ＳＡを例示する。

図８は、図４のステップ１０２Ｂによって確立される典型的な「＄Ｊマスクサーチエリア＄ＭＡを例示する。

図９は、図３の「額面金額抽出」ステップ１０４を達成するための好ましい態様を例示するフローチャー１・である。

図１０は、図９のステップ１０４Ｂによって確立される典型的な額面金額シードサーチエリアＣ，Ａ、ＳＡを例示する。

図１１は、図９のステップ１０４Ｂによって確立される典型的な額面金額マスクサーチエリアＣ，Ａ、　ＮｉＡを例示する。

図１２は、図３の「φ部分を分離かつ類別Ｊステップ１１０を達成するための好ましい態様を例示するフローチャートである。

図１３は、（図９のステップ１０４Ｊにおいて明瞭化の前の）異質な連結構成要素群６２および６３を含む典型的な抽出された額面金額を例示する。

図１４−１６は、図９のステップ１０４Ｊにおける明瞭化の後の典型的な抽出された額面金額を例示する。

ＵＺ　Ｉ　７−１８は、いかに「φノ文字か下線を引かれた２桁の数字からなる「φ」フィールドから抽出されるかを例示する。

図１９−２１は、いかにして「φ」文字か分数からなる「φＪフィールドから抽出されるかを例示する。

詳細な説明同様な数字および文字は全図面にわたって同様なエレメントを参照する。

この詳細な説明の目的のために、この発明は財務文書を処理するための文書処理システムにおいて小切手上のトル金額（具体的に「額面金額Ｊと称される）を自動的に認識するのに適用されるように例示されるであろう。しかしなから、この発明は財務上およびその他のデータ認識応用の別の型のみならず文書の別の型にもまた適用可能であるということか理解されるへきである。

最近に図１を参照すると、そこては米国において広く使用される型の小切手１０か例示される。小切手１０は「＄」通貨記号１０ａおよび関連の金額１０ｂを有し、誉れは金融業界ては「額面金額」と典型的には称される。この額面金額を認識する読取機は典型的には額面金額読取機（ＣＡＲ）と称される。額面金額１０ｂは機械印刷されるかまたは図１に示されるように手書きされてもよい。

図１に示される典型的な小切手１０は、小゛切手の左下に符号化された機械読取り可能なデータ１０ｃをもまた含み、それは小切手か振り出される銀行の識別、顧客の頂金０座番号、および小切手番号のような識別情報を提供するのに役立つ。典型的にはこの符号化された機械読取り可能なデータ１０ｃは磁性インクで与えられ、それは頭字語で「ＭＩＣＲＪ　（磁気インク文字認識）と呼ばれる。

図２はこの発明か組み込まれてもよい文書処理システムを一般的に例示する。処理されるべき文書は典型的には財務文書てあり、図１に例示される型の小切手を含む。図２に示されるように、これらの財務文書１０は文書プロセッサ１２に与えられ、従来の態様で、その機械は文書から符号化されたデータを読取り、文書の画像を取込みかつ処理し、その文書をポケット（図示されていない）に区分けする。

図２における文書プロセッサ１２は文書の画像を取込み、取込まれた文書画像を処理しかつ圧縮し、それから圧縮された文書画像をディスクドライブのような記憶装置１６に伝送するイメージングモジュール１４を含む。ワークステーション１９はワークステーソヨンオペレータによるデータの表示および入力のために、検視された画像からの額面金額のような文書画像を記憶装置１６から受け取る。

演算処理装置（ＣＰＵ）２０はシステムの全体の制御と、（記憶装置１６を経て）文書プロセッサ１２およびワークステーショ〉１９によってそこへ伝送された文書情報のためのデータヘースの維持とをまた与える。

図２の文書プロセッサ１２はさらに、図１に例示されるように小切手」二の額面金額を自動的に認識するためのイメージングモジュール１４に結合される額面金額読取機１８を含む。図１の文書処理システムにおいてそのような額面金額読取機１８を提供することの重要な利点は、金額かうまく読取られた小切手は、ワークステーション１８で画像を検視することによってそれらの額面金額を読取られかつ入力される必要かないということである。

額面金額読取機（ＣＡＲ）１８はこの発明に従って額面金額の自動認識を提供するために、イメーンモシュール１４からそ二・＼与えられた文書画像を演算処理するために適当なプログラミングに加えて、複数のマイクロブロセ、、す、ＲＡＭ、ＲＯＭおよび別の関連の回路を典型的に含む。ＣＡＲ１８にそういったものを設ける態様はここでの開示によって明白となるであろう。

図３は、小切手上の額面金額を認識する際に図２のＣＡＲ１８によって実行される種々の操作ステップを一般的に例示するフローチャートである。このフローチャートは例として与えられるのであって、発明の範囲を限定するものとして考えられるへきてはないということか理解されるへきである。たとえば、ここに示されるあるステップが省略されてもよく、別のステップが加えられてもよく、かつ／またはステップの配列か変更されてもよい。

ステップ１００によって示されるように、ＣＡＲ１８は図２のイメージングモジュール１４から小切手のグレーレベル画像を受け取る。ＣＡＲは図１におけるｒ＄Ｊ　１０ａを位置決定しくステップ１０２）　、それから関連の額面金額１０ｂを抽出する（ステップ１０４）。抽出された額面金額か機械印刷されているかまたは手書きかという判断かそれからなされる（ステップ１０６）。もし機械印刷であるならば、比較的単純な額面金額認識か実行され（ステップ１０８）、結果か出力される（ステップ１１８）。

もし抽出された額面金額か手書きであると判断されるとぐステップ１０６）、より複雑な分析か要求される。そのような場合、「ψ」部分１０ｂ−１（図１）はまず分離されかつ類別され（ステップ１１Ｏ）、「φ」文字かそれから類別に基づいて抽出される（ステップ１１２）。結果として抽出された「φ」文字はそれから認識される（ステップ１１４）。

「ψｊ文字かうまく認識された後（ステップ１１４）、ドル文字か認識される（ステップ＋１６）。ＣＡＲ１８（図２）はそれから認識された額面金額または拒絶信号を出力する（ステップ１１８）。図２のシステムにおいて、このＣＡＲ出力はＣＰＵ２０に送られる。もし図３のステップのいずれかの間に拒絶状態か検出されると、拒絶出力か即庫に与えられ残りのステップは停止される。図３に示されるように、額面金額の「φ」部分の抽出および認識は　、トル部分より先に実行される、なぜならそれは拒絶を生み出しかちであるからである。ＣＡＲによって与えられた認識された額面金額出力は、認識プロセスの間に生み出された信頼指示に基つく信頼値を伴ってもよいということか理解されるであろう。図３における認識ステップ１０６．１０８．１１４および１１６は、前述の特許において開示されたような公知の認識技術を使用して提供され得るということもまた理解されるであろう。

図３に例示されるステップの各々の説明か以下に述へられる。

ステップ＋００（Ｕ４３）このステップの間、図２におけるイメージングモジュール１４は、ＣＡＲＩ　８に少なくとも「＄」文字１０ａおよび関連の額面金額１０ｂを含む小切手の部分のグレースケール画像（図５に例示されるような）を提供する。図５に例示されるサイズは例としてのみであるということか理解されるへきである。

ステップ１０２（図３）このステップの間、「＄」文字１０ａ（図５）か位置決定される。明らかに、アスタリスク「＊」または別の適切な記号のような「＄」以外の通貨文字も位置決定文字として使用され得る。

ステップ１０４（図３）このステップの間、額面金額１０ｂ（図５）は先に位置決定された「＄」文字１０ａを位置決定ガイドとして使用して抽出される。

ステップ１０６（図３）このステップの間、抽出された額面金額が機械印刷されたものかまたは手書きされたものかということに関する判断かなされる。もしそれか機械印刷されたものであるならば、動作はステップ１０８に進む。もしそれか手書きであるならば、動作はステップ１１０に進む。

ステップ１０８　（図３）もし額面金額が機械印刷されたものと判断されると、比較的単純な認識が認識された機械印刷の型に基づいてなされる。

ステップ１１０（図３）もし額面金額か手書きであると判断されるならは、より複雑な分析か要求され、それは「φ」部分１０ｂ−１（図５）の、トル部分１０ｂ−２からの分離で始まる。分離された「ψ」部分はそれから類別される。

ステップ１１２（図３）このステップの間、「φ」文字は、ステップ１１０てなされた類別に基づいて抽出される。

ステップ＋１４このステップの間、抽出された「φ」文字は認識される。

ステップ１１６（図３）このステップの間、額面金額の「＄」文字１０ｂ−２（図５）か認識され、額面金額の認識を完了する。

ステップ１１８（図３）このステップの間、ＣＡＲ１８は（図２のＣＰＵ２０に）認識された額面金額または拒絶信号を出力する。拒絶信号は、もし拒絶状態か先のステップのいずれかの間に検出されるならば、ＣＡＲによって提供され、そのような場合、それ以後のステップは停止される。認識された額面金額はまた信幀値を伴ってもよい。

図３に示された種々のステップはここで詳細に考察され図３においてステップ１０２を達成するための好ましい態様は、この発明に従って、図４におけるステップ１０２Ａからステップ１０２Ｈを参照して次に考察されるであろう。ステップ１０２の目的は図５における小切手ｌＯ上の「＄ｊ文字を位置決定することであるということか念頭におかれるであろう。

ステップ１０２Ａ（図４）このステップの間、しきい値処理は図２のイメージモジュール１４によって与えられる（図５の）グレーレベル画像から、複数の２値画像を得るのに使用される。これらの２値画像の導出は、グレーレベル画像は各ピクセルか複数のグレーレベル値の１つを有するピクセル（画素）のＸ−Ｙマトリックスとして電気的に典型的に表わされるということに注目することによって理解されるであろう。たとえば、各ピクセルは１５か黒でありＯか白である２値番号０ないし１５に対応する４ヒツトで表わされる１６のグレーレベル値を備え得る。得られた２値画像の各々はこれらのグレールベル値の異なった１つを、グレーレベル画像を２値画像に変換する際、しきい値として使うことによって生み出される。たとえば、もし８のしきい値か特定の２値画像を生み出すのに使われるならば、その２値画像はそのグレールベル値か８またはそれよりも大きいピクセルを黒ビクセルとして有し、２値画像の他のピクセルはすへて白である。

ここで考察されるこの発明の特定の実施例のために、３つの２値画像か、３つの異なったしきい値高、中および低を使用してグレーレベル画像（図５）から得られる。高しきい値２値画像は「＄」　シート画像と称され、中２値画像は額面金額シート画像と称され、低しきい値２値画像はマスク画像と称されるであろう。

以下に説明されるように、「＄」　シート画像は「＄」文字１０ａ（図５）を位置決定するために使用され、額面金額２値画像は、額面金額ｌＯｂを抽出するために使用され、かつマスク画像は両方の目的のために使用される。

図６に例示されるように、認識速度を増大するために、グレーレベル画像か図２のイメージモノニール１４から受け取られると、シートおよびマスク画像かコンバータ３４．３６および３８各々によって同時に発生され得、結果としての２値画像はそれぞれのランダムアクセスメモリ（ＲＡＭ）４４．４６および４８に検索可能に格納される。

ステップ１０２Ｂ（図４）このステップの間、「＄」　シートおよびマスク画像上のサーチエリアは「＄」文字を位置決定する際に使用するために確立される。図７はシード画像のための「＄」シード画像サーチエリア＄ＳＡの例を示し、図８はマスク画像のための［＄ｊマスクサーチエリア＄ＭＡの例を示す。図７および図８はシードおよびマスク画像を得るための異なったしきい値を使用することによって生み出された効果もまた例示する。この点ては、図８の「＄Ｊマスクサーチエリア＄ＭＡは（使用された低しきい値のため）図７の「＄」シートサーチエリア＄ＳＡよりも多い異質な黒ピクセル（ノイズ）を含むということに注目されたい。

考察される特定の実施例の目的のために、図７の所望された「＄Ｊシートサーチエリア＄ＳＡは公知であると仮定されるてあろう。たとえばその位置はＣＰＵ２０　（図２）において先に格納することもてき、または小切手１０（図１）上の機械読取り可能線１０ｃを読取ることからも得られるであろう。代わりに、「＄Ｊ文字か位置決定されるまで全体画像のサーチをすることもてきる。

ステップ１０２Ｃ１１０２Ｄおよび１０２Ｅ（図４）ステップ１０２Ｃの間、図７における［＄Ｊシードサーチエリア＄ＳＡは「新しい」黒ビクセルのために走査される。以下に説明されるように、「新しい」黒ビクセルはシートサーチエリア＄ＳＡにおいてまだ考慮されて（ａｃｃｏｕｎｔｅｄ　ｆｏｒ）いないものである。典型的には、垂直方向の列単位の走査か使用される、なぜならそれは金額文字よりも前に遭遇される「＄ｊ文字を位置決定する際に、有利であるためである。もし、走査の間、新しい黒ビクセルか発見されなければ（ステップｌ０２Ｄ）、図５の「＄」シードサーチエリア＄ＳＡの最後の垂直方向列か走査されたかとうかの判断かなされる（ステップ１０２Ｅ）。そのような場合、拒絶か発生される。拒絶は、もし認識プロセスに割り当てられた最大時間か終了するとまた発生し得るということか、また理解されるへきである。これはいずれか１つの小切手のための認識プロセスか、小切手処理速度の要求と相反する、時間を超過するということを防ぐためになされる。

もしステップ１０２Ｈの間に、垂直方向走査か完了されていないと判断されるならば、動作はステップ１０２ｃに戻り、「＄ｊンシーサーチエリア＄ＳＡの走査方向において新しい黒ビクセルをサーチし続ける。

ステップ１０２Ｆ、１０２Ｇおよび１０２Ｈ（図４）もし新しい黒ビクセルかステップ１０２Ｄの間に発見されるならば、動作はステップ１０２Ｆに進む。ステップ１０２Ｆの間に、ｒｓＪシートサーチエリア＄ＳＡ　（図７）において発見されたシード黒ビクセル（ステップ＋０２Ｄ）は、「＄」マスクサーチエリアＳＭＡＣ図８）を使用して成長させられ、ピクセルの連結群を発生し、それは以下に記号ＣＣと称されるであろう。ＣＣか発生される態様か次に説明されるであろう。

図７の「＄」ノートサーチエリア＄ＳＡかまず参照される。「＄」文字１０ａはおおよそ完全であるように見えるであろうか、１０’ａで示されるように種々の切れ目を伴い、一方で隣接の額面金額１０ｂの数字「８」はより大きく広い切れ口１０’ｂを有する。これは、「＄」文字は普通額面金額文字よりも有意に高度なコントラストを有し、より高品質の印刷プロセスを使用してつ（：り出されるため予期されることである。（先に説明されたように、）比較的高いしきい値か「＄」　シート画像を得るために使用されるため、図７における「＄」　シートサーチエリア＄ＳＡは３２ｓのようなほんの少しの、広く間隔をあけられた異質の黒ピクセルを含むということにもまた注目されたい。

次に図８における「＄」マスクサーチエリア＄ＭＡを参照すると、（前に説明されたように）それはより低いしきい値を使用して得られる。より低いしきい値処理のため、「＄」文字１０ａは完全であるか、一方で隣接の額面金額１０ｂの「８ノはまだ幾らかの切れ目１０’ｂを含むということか見られるであろう。また、図８の「＄Ｊマスクサーチエリア＄ＭＡにおいて３２ｍのような、図７の「＄」シードサーチエリア＄ＳＡにおいてよりも存意に多い異質な黒ピクセルかある。加えて、「＄」マスクサーチエリア＄ＭＡは額面金額枠３３による黒ピクセルを含む。

図４におけるステップ１０２Ｄおよび１０２Ｆは、「＄ｊ文字を位置決定しかつ認識するのに（それぞれ図７および８の）「＄ｊ　シードおよびマスクサーチエリア＄ＳＡおよび＄ＭＡの両方を利用する。より特定的には、新しい黒ビクセルか図７の「＄」　シートサーチエリア＄ＳＡにおいて発見されると（ステ、ブ１０２Ｄ）、図８の「＄」マスクサーチエリア＄ＭＡにおける対応する位置を存するピクセルか位置決定される。たとえば、もし図７における３４ｓか「＄Ｊシートサーチエリア＄ＳＡにおいて発見された新しい黒ビクセルであるならば（ステップ１０２Ｄ）、図８の「＄」マスクサーチエリア＄ＭＡにおける対応して位置決定される黒ピクセル３４ｍか位置決定される。これは図６のそれぞれ「＄」　シートおよびマスクＲＡＭ４４および４８において格納されたシードおよびマスク画像を使用して実現され得、それはたとえば、対応するシードおよびマスクピクセルか対応するアドレスを有するように構成されてもよい。

ステップｌ０２Ｆの実行において行なわれる次の動作は、「＄」マスクサーチエリア＄〜ｉＡにおける黒ピクセル３４ｍ（図８）を成長させ、３４ｍに連結されだすへての黒ピクセルからなるＣＣを発生することである。これはたとえば、図６のマスクＲＡＭ４８を使用して達成されてもよい。

黒ビクセル３４ｍ（図８）から始まって、黒ピクセル３４ｍ（図８）にすぐ隣接するピクセル位置に対応するアドレスでの黒ビクセルかあるかとうかに関する判断かなされる。

同様の判断か、新規に判断された黒ピクセルの各々についてなされ、ＣＣを形成するすべての連結黒ピクセルか識別されるまで再度繰返される。これらの識別された黒ピクセルのアドレスは、黒ビクセル３４ｍから発生されたＣＣを構成する。図６におけるマスクＲＡＭ４６は、たとえばＣＣを形成する識別された黒ピクセルのアドレスを格納するのに使用されてもよい。

さらに図７および図８を参照すると、もし図７の「＄」シートサーチエリア＄ＳＡにおいて発見された新しいピクセル（ステップ１０２Ｄ）か「＄」文字１０ａの黒ビクセル３４ｓであるならば、図８の「＄」マスクサーチエリアｉｉＡにおける対応する黒ピクセル３４ｍの成長によってつくり出された結果としてのＣＣ（ステップ１０２Ｆ）はＣＣ−１であり、それは「＄」文字１０ａである。これは図８の「＄」マスクサーチエリア＄ＭＡにおける「＄」文字のすへてのピクセルか連結されるためである。

他方、もしｖ＄Ｊ文字が存在せず、ｒｓＪシードサーチエリア＄ＳＡ（図７）において発見された新しい黒ピクセルか数字「８」のピクセル３６ｓであったと仮定すると、図８の対応する黒ビクセル３６ｍの成長はＣＣ−２を発生し、それは切れ目ＩＯ“ｂのために「８」の上部の部分にすぎないと思われるであろう。

ステップ１０２ＦのＣＣの発生に従って、動作はステップ１０２Ｇに進み、そこでは発生されたＣＣのサイズ、幾何学的形状および位置か、「＄ｊ文字の適当な候補かどうか、または拒絶されるへきかとうかという比較的早い判断をなすために使用され、それによって比較的により時間を消費する認識プロセスを避ける。

ＣＣがｒ＄Ｊ候補であると判断されるときのみ（ステップｌ０２Ｇ）、動作はステップｌ０２Ｈに進み、そこでは従来の文字認識が、ＣＣが「＄」文字であるかとうかを判断するために実行される。たとえば前述の米国特許第４゜４４９．２３９号において説明された分類語手法は認識のために使用されてもよい。もしＣＣかステップ１０２Ｇにおいて適当な「＄」の候補であると判断されない場合、またはもしＣＣかステップ１０２Ｈにおいて「＄」であると認識されない場合、動作はステップ１０２Ｃに戻り、図７の「＄」　シードサーチエリア＄ＳＡにおいて新しい黒ピクセルを走査し続ける。しかしながらもし、ＣＣかステ、ブ１０２Ｈにおいて「＄」文字と認識されるならば、「＄」文字は位置決定される。そのような場合、さらなる走査は行なわれず、動作は図３のステップ１０４に進み、額面金額を抽出する。

ステップ１０２Ｅと関連して先に述べたように、走査の終わりに達するときに、もし「＄」文字の認識かなされなければ、拒絶か発生する。もし追加的サーチエリアか「＄」文字のために走査されることか所望されるならば、走査の終わりに拒絶を生み出す代わりに、動作は図４のステップ１０２Ｂまで戻り、新しいシートおよびマスクサーチエリアを確立する。追加的サーチエリアのこの走査は所望されるだけの回数、または中断か発生するまで続けられてもよい。

ステップ１０２Ｆの前述の説明から、ステップｌ０２Ｃで参照された「新しい」黒ビクセルは、ステップ１０２Ｆの間に「＄」マスクサーチエリアにおいての成長の結果として先に発見されなかったものである、なぜなら先に識別された黒ビクセルを成長させる必要はないからである。そのような先に識別されたシードピクセルか、「＄」マスクサーチエリアにおいて成長されることを防ぐ種々の可能な方法かある。説明されている実施例において、図４のステップ１０２Ｆにおけるマスク成長の間「＄」マスクサーチエリア＄ＭＡにおける対応するピクセルを識別すると、（図６の「＄」シード画像ＲＡＭ４４に格納された）「＄」シード画像からシードピクセルを削除することによってこの目的を達成することか有利であるということかわかった。したかって、ステップ１０２Ｆにおける先の成長の間識別された黒ピクセルは、ステップ１０２Ｃの走査の閲見られず、ゆえに「＄」文字を位置決定するのに必要な時間を減する。この節約は、シート画像か、その導出に使用される高しきい値の結果としての比較的僅かな「ノイズ」黒ビクセルを含むために節約された時間にさらに加えられるものである。そのような高しきい値の使用は可能である。

ＣＣを発生するための上に説明されたシート／マスク成長手法は小切手１０（図１）上の「＄」文字１０ａを位置決定するのにさらに利点となることか理解されるであろう、なぜなら「＄ｊ文字は普通高品質および高いコントラストを備えて印刷され、「＄」マスクサーチエリア＄ＭＡ（図８）における切れ目をつくるようには思われないからである。このように、上に説明されたように（ステップ１０２Ｇおよびｌ０２Ｈ）、認識のために発生されたＣＣの各々を提出することは、池の印または（先に考察された数字「８」のような）文字と比へて「＄Ｊ文字か認識される可能性をかなり高くする。

ＣＣを発生するためのシート／マスク成長手法はこの発明の範囲内において多くの変形を受けるということかさらに理解されるへきである。たとえばＣＣを発生するために使われる「連結性Ｊ　（ｃｏｎｎｅｃｔｉｖｉｔｙ）の定義は、異なった環境下で特定の型の文字の認識に対処するのに種々の様式で変化され得る。

たとえば、「連結性ノの定義は（垂直、水平および／′または特定の対角線のような）１つまたは２つ以上の特定の方向に制限されるように変更され得る。連結性の定義における別のあり得る変化は、特定の環境において「連結された」ピクセル間に発生する１つ（または２つ以上）のピクセル切れ目を許容し得る。

ステップ１０４の詳細な説明図３におけるステップ＋０４を達成するための好ましい態様は図９のステップ１０４Ａから１０４Ｊを参照して次に考察されるであろう。ステップ１０４の目的は図１に示される額面金額１０ｂを抽出することであるということが念頭におかれるであろう。

ステ！プｌ０４Ａ（図９）このステップの間、動作は額面金額１０ｂ（図５）を抽出することに切り替わり、額面金額の位置はステニ・プ１０２（図３および図４）における「＄ｊ文字１０ａをうまく位置決定することに基ついて決定されてきた。ステップ１０４の説明か進行するに従って、ステップ１０２において「＄」を位置決定するために説明された基本的なソート／マス２手法は額面金額抽出にも使用されるか、いくらか異なった態様で使用されるということか明白になるであろう。

ステップｌ０４Ｂ　（図９）このステップの間、シートおよびマスクサーチエリアは図３のステップ１０２において「＄」文字の位置を決定したことに基ついて額面金額の抽出のために確立される。図１０は額面金額シートサーチエリアＣ，Ａ、ＳＡの例を示し、一方で図１１はいくらかのより大きい額面金額マスクサーチエリアＣ，Ａ、ＭＡの例を示す。図１’ｌのＣ，Ａ。

ＭＡは額面金額枠３３より下に突き出すかもしれない額面金額部分を含むのに十分なサイズであるということに注目されたい。またこの点において、額面金額の「７Ｊは図１Ｏの額面金額サーチエリアＣ，Ａ、ＳＡに全部は含まれないけれとも、「７」は図１１のより大きい額面金額マスクサーチエリアＣ，Ａ、ＭＡにおけるシート／マスク成長の結果として全部抽出されるであろうということにも注目されたい。

ここに説明される好ましい実施例において、「＄Ｊの位置決定のために使用されたのと同じ（図６のＲＡＭ４ｇに格納された）マスク画像か金額抽出のために使用されるか、（図６のＲＡＭ４６に格納された）額面金額ソート画像は「＄」文字を位置決定するために使用された（ＲＡＭ４４における）「＄」　シード画像の代わりに金額抽出のために使用される。これは、「＄」　シード画像しきい値か先に説明されたように、高度なコントラスト　「＄」文字を利用するために高く選択され、それはより大きいコントラスト変化の範囲を有する額面金額文字にとってふされしくないため、行なわれる。図１０は額面金額シードサーチエリアＣ，Ａ、ＳＡのためのしきい値の可能な選択の例を示し、そこでは枠３３（図５）は低コントラストの異質なビクセル（ノイズ）と同様、現われない。この点で、額面金額のすへての部分か図１０の額面金額サーチエリアＣ，Ａ、ＳＡに含まれる必要はないということか理解されるへきである。図１１のＣ，Ａ、ＭＡにおけるシード／マスク成長の結果としての額面金額の適切な抽出を提供するために、額面金額の十分な部分か図１ＯのＣ，Ａ、ＳＡに含まれることのみか要求される。

ステップ１０４ｃ、１０４Ｄ、１０４Ｅおよび１０４Ｆ（図９）これらのステップは通常の額面金額に関して、走査の終わりの後（ステップ１０２Ｅ）拒絶かないこと、動作は代わりにステップ１０６（図３）に進むことを除いて、図４のそれぞれのステップｌ０２Ｃ，１０２Ｄ、１０２Ｅ、および１０２Ｆのために先に説明されたものと一般的に同してあってもよい。ステップ１０４Ｃ１１０４Ｄ、１０４Ｅおよび１０４Ｆはゆえに詳細には考察されないであろう。

額面金額シートサーチエリアＣ，Ａ、　ＳＡ　（図１０）の走査の間に「新しい」黒ビクセルか発見されるたびに、額面金額マスクサーチエリアＣ，Ａ、ＭＡ　（図１１）における成長は（先に規定されたように）ＣＣをつくり出す。

ステップ１０４Ｇ（図９）図４のステップ１０２Ｇと同様に、このステップはステップ１０４Ｆで発生されたＣＣか、ＣＣのサイズ、幾何学的形状および位置に基づいて適当であるかどうかをテストする。額面金額抽出の目的のために、ステップ１０４Ｇにおけるこのテストは発生されたＣＣが額面金額の一部であるらしいかどうかを判断する。たとえば、発生されたＣＣか額面金額の部分であるらしいかどうかを判断するための役に立つ根拠は、たとえば図１１の線５５のように額面金額マスクサーチエリアＣ，Ａ、ＭＡの枠５２（図１１）まで延在するかどうかを判断することである。そのような発生されたＣＣが額面金額の一部であることはほとんとない。

ステップ＋０４８（図９）もし発生されたＣＣがステップ１０４Ｇにおいて額面金額の一部てはないらしいと判断されるならば、動作はステップ１０４Ｈに進み、発生されたＣＣを廃棄し、動作はステップ１０４Ｃに戻り、図１Ｏの額面金額シートサーチエリアＣ，Ａ、ＳＡにおける新しい黒ビクセルを走査し続はステップ１０４＋（図９）もし発生されたＣＣかステップ１０４Ｇにおいて額面金額の一部であるらしいと判断されるならば、動作はステップ１０４１に進み、そこで発生されたＣＣを（たとえば図６におけるＲ　Ａ　Ｍメモリ４６内に）後の使用のために格納する。

動作はそれからステップ１０４Ｃに戻り、図１０の額面金額シートサーチエリアＣ，Ａ、ＳＡにおける新しい黒ビクセルを走査し続ける。

ステップ１０４■を離れる前に、発生されたＣＣか「＄ｊ文字を位置決定するのに使用される方法（図３および図４のステップ１０２）と額面金額抽出および認識のために使用される方法との間の違いに注目することは役に立ってあろう。「＄Ｊ文字を位置決定するために、発生されたＣＣの各々は認識目的のためのものと考えられるということか念頭におかれるてあろう、なぜなら「＄」文字は高品質の印刷で提供され普通高度なコントラストを有し切れ目を有さないからである。しかしながら、額面金額抽出のために発生されたＣＣは文字の断片的な部分にすぎないかもしれない、なぜなら額面金額文字は、特に手書きされるとき、幾つかの切れ目を有するかもしれないからである。このように、額面金額文字は複数の発生されたＣＣからなるかもしれなし・。したかって、額面金額を抽出かつ認識する際に、（図４のステップ１０２Ｈにおいて）「＄ｊ文字を位置決定するときになされるようには、発生されたＣＣを認識するという試みはなされない。代わりに、額面金額の一部であるらしいと判断された各ＣＣは、全体の額面金額エリアか走査されるまでストアされ（ステップ１０４１）、その時点ては額面金額の一部であるらしいすへての発生されたＣＣか格納されていることになるであろう。これらの格納されたＣＣは抽出された額面金額を構成する。図１３は上に説明されるように抽出されたそのような格納された額面金額の例である。このように、額面金額に関して、ＣＣを発生するためのシード／マスク成長手法は主に認識のための額面金額抽出および格納の特にを利な方法として投薬型的にステップ１０４Ｊは（走査の終わりをテストする）ステップ＋０４Ｅを介して、額面金額、シードサーチエリアＣ，Ａ、ＳＡ　（図１０）の走査か完了され、額面金額の一部であるらしいすへての発生されたＣＣか格納された後に到達される。ステップ１０４Ｊの目的は、この格納された抽出された額面金額（図１３）を６２および６３て例示されるような異質なＣＣを除去することによって明瞭にすることである。使用される１つの手法は、６２のような異質なＣＣかもし額面金額領域の上と下との予め定められた量だけ間隔をあけられている場合には、それらを削除することである。これはたとえば上部および下部境界線を存する領域を規定するために全体金額フィールドを水平に投影することによって達成されてもよい。これらの境界線の上または下の、図１３における６２のようなＣＣはそれから削除される。もし投影か複数の領域を生み出すならば、適切な上部および下部境界線は「＄ｊ文字を含む領域に対応するものである。

額面金額の右に位置する図３における６３のような異質のＣＣの除去はより複雑な問題を引き起こす、なぜならそれらは額面金額の一部であるかもしれないからである。これらのＣＣか異質かとうかを判断するための特に有利な方法は、最も右のＣＣとＣＣの左の最も近い黒ピクセルとの間の水平間隔かＣＣの水平幅より予め定められた量だけ大きいという条件に基づく。もしこの条件に合致するならば、ＣＣは異質なものと考えられ、削除される。いかにこの条件か実現され得るかという例は［Ｎ１３に関して説明されるであろう。この例のために、額面金額領域は左から右に番号付けられた列に分割され、各列は１ビクセルに等しい幅を有すると考えられる。最初に、以下の列の位置決定は抽出された額面金額から判断される、ＣＩ＝黒ピクセルを有する最も右の列。

Ｃ２＝Ｃ１の左の最小幅Ｗを備える白列の隣りのエリアの最も右の列。

Ｃ３＝黒ビクセルを育する、Ｃ２の左隣りの列。

もし以下の条件に合致するならば、（Ｃ２−Ｃ３）＞Ｋ　（Ｃｌ−Ｃ２）ＣＩおよびＣ３の間に置かれだすへての黒ピクセル素子６３は削除される。典型的に、Ｗは３つの列の幅に対応する幅を有してもよく、Ｗは単一の文字の部分によっては上の条件か満たされないように選択される。Ｋは典型的には１．５の値を育してもよい。ＷおよびＫのこれらの値は額面金額か異質なＣＣと間違えられないことを保証するように選択される。上のことは、条件か合致し続ける限り反復的に繰返される。条件か合致し損ねたとき、テストは終了し動作は図３の次のステップ１０６に進む。

ステップ１１０の詳細な説明（図１２）ステップ＋１０はもしステップ１０４の間に抽出された額面金額か手書きであると判断されたならば到達されるということか図３から理解されるであろう。ステップ１１０の目的は「φ」部分１０ｂ− １（図１）を額面金額１０ｂのドル部分１０ｂ−２から分離することである。ステップ１１０を、この発明に従って達成するための好ましい態様は、図１２のステップｌｌ０ＡからｌｌＯＨを参照して次に考察されるてあろう。額面金額の「＄」部分および「φ」部分は以下に「＄」フィールドおよび「φ」フィールドとそれぞれ称されるであろう。

ステップｌｌ０Ａ（図１２）ステップｌｌ０Ａの間、抽出された額面金額はピリオドまたは小数点（ｒ、　Ｊ　）の存在をサーチされる。そのようなピリオドまたは小数点は、もちろん額面金額の「＄」および「ψ」フィールドの間の分離を示し、その検出はしたかってこれらのフィールドを分離するための根拠として使用される。

ビリ第１・の存在を検出するための好ましい方法は図１４に関して説明されるであろう。この目的のために、抽出された額面金額は、図６のＲＡＭメモリ４６に格納された抽出された額面金額の画像の列単位の走査を使用する等により左から右に調査される。

もし図１３におけるＰＣのような潜在的なピリオド候補か発見されると、上ｆｆｆｌｌｌＡＵＬおよび下部線ＬＬ（図１４）が（図１４の数字「９Ｊのような）ＰＣのすぐ左の額面金額部分のために決定される。線は上から下へと番号付けられる。潜在的ピリオド候補ＰＣは、もし以下の条件か満たされれば、実際のピリオド候補と考えられる。

（１）　ａ性的ピリオド候補ＰＣの高さは１／２　（ＵＬ−ＬＬ）よりも大きくない。

（２）　潜在的ピリオド候補ＰＣは所定の量よりも少ない輻Ｗを育する。

（３）　潜在的ピリオド候補ＰＣの平均の線数はｌ／２（ＵＬＬＬＬ）よりも少ない。

典型的には、３つまでのピリオド候補か上の測定に基づき識別されることか可能である。動作はそれから図１２のステップｌｌ０Ｂに進む。

ステップｌｌ０Ｂの間、ステップｌｌ０Ａにおいて決定された３つまてのピリオド候補は、たとえば前述の特許において開示されたような公知の統計学的分類技術を使用して調査される。もし１以上のピリオド候補か受け入れ可能であるとわかったら、最も右の１つか「＄」および「φ」フィールドを分離するものであるとして選ばれ、動作は図１２のステップｌｌ０Ｇに進む。

しかしながらもし１つのピリオドも識別されなければ、動作はステップｌｌ０Ｃに進み別の根拠で「＄」および「ψ」フィールドを分離しようとする。

ステップｌｌ０Ｃ（図１２）ステップｌｌ０ｃの間、図５に示されるように、額面金額の「φ」フィールドの添字（ｓｕｂｓｃｒｉｐｔｉｎｇ）は額面金額の「＄」および　「φ」フィールドの分離に関する根拠として調査される。この目的のために、抽出された額面金額は再び左から右へと調査され、（たとえば図１４における数字「５」のような）上付きに書かれた文字ＳＣの開始を検Ｂと同様に、上部線ＵＬおよび下部線ＬＬ（図１５）は（図１５の数字ｒ７Ｊのように）候補の上付きに書かれた文字ＳＣのすぐ左の額面金額部分のために決定される。再び線は上から下へと番号付けられる。候補の上付きに書かれた文字ＳＣはもし以下の条件か満たされると実際の上付きに書かれた文字と考えられる。

（１）　候補の上付きに書かれた額面金額文字の底の線番号は１／３　（２ＬＬ＋ＵＬ）より大きくなし）。

（２）　候補の上付きに書かれた文字ＳＣの高さは少なくともＩ／３　（ＬＬ− ＵＬ）である。

（３）　候補の上付きに書かれた文字ＳＣは（図１５の数字「７」のような）すぐ左の額面金額部分から少なくとも１白列だけ分離される。内列は黒ピクセルを有さない列である。

（４）　候補の上付きに書かれた額面金額文字ＳＣのすぐ右の額面金額部分ｓｃ ’　＜図１４の数字「０」）はＳＣの下部線番号プラスその高さの半分よりも大きくない下部線番号を有する。

上記の条件を満たす第１の候補は、上付きに書かれた「φ」フィールドの開始であると考えられる。

動作はそれから図１２のステップｌｌ０Ｄに進む。

ステップｌｌ０Ｄ（図１２）ステップｌｌ０Ｄはステップｌｌ０ｃで実行された上付きに書かれた「ψ」フィールドのサーチの結果を受け取る。

もし上付きに書かれた文字か見つけられたら、「＄」および「φ」フィールドの分離のための根拠か決定され、動作はステップｌｌ０Ｇに進む。

しかしながらもし上付きに書かれた「φ」フィールドか見つけられなけれは、動作は図１２のステップｌｌ０Ｅに進み、「＄」および「φ」フィールドの分離のための別の根拠を見つける。

ステップｌｌ０Ｅ（図１２）ステップｌｌ０Ｅの間、図１６およびｌＮ１７に示されるように、複合「φ」フィールドの存在は「＄」および「φ」フィールドの分離のための根拠として調査される。図１６は下線を有する２つの上付きに書かれた数字からなる複合「φ」フィールドの第１の型を示すということか見られるであろう。図１７は「φ」金額が分数として与えられる複合「φ」フィールドの第２の型を示す。

複合「φ」フィールドが存在するかどうかを判断するために、抽出された額面金額は、先に説明されたステ・、ブ１１０Ａおよびｌｌ０Ｃのように右から左へと再度調査される。複合「φ」フィールドのサーチに際し、以下のことか決定される（図１６および図１７を参照）。

（１）　抽出された額面金額の最後に占められた列ＣＩ。

（２）　最後に占められた列Ｃ１の左の第１の内列Ｃ２゜（３）　内列Ｃ２の右に位置する額面金額部分によって占められる第１の線Ｌｌ。

図１６および図１７に示されるように、ＣＬＣ２およびＬｌの値はそれが複合「 φ」フィールドの適切な候補であるかどうかについてのテストのために抽出された額面金額の特定の部分の枠を決める。テストは種々の可能な「φ」フィールド型および、特に、図１６および図１７に示される複合「ψ」フィールド型を認識するように特定的に設計される統計学的分類技術を使用して達成される。そのような統計学的分類技術か実現される態様は上記の特許から明白であろう。

もし、図１６および図１７に示されるように複合「ψＪフィールドか認識されるならは、列Ｃ２は「＄」および「φ」フィールドの間の分離列であると考えられる。Ｃ２は最後に占められた列ＣＩの左の第１の内列であるということか念頭におかれるであろう。

ステップｌｌ０Ｅにおける動作の結果はそれから図１２のステップｌｌ０Ｆに送られる。

ステップｌｌ０Ｆ（図１２）ステップｌｌ０Ｆはステップ１１０Ｅにおいて実行される複合「Ｃ」フィールドのサーチの結果を受け取る。もし複合「ψ」フィールドか発見されたら、列Ｃ２は「＄」および「φ」フィールドの分離の根拠として役に立ち、動作は図１２のステップ１１０Ｇへ進む。

しかしながら、もし複合「φ」フィールドか見つけられなければ、拒絶か発生する、なぜなら額面金額の「＄」および「φ」フィールドを分離するための根拠か見つけられずかつ分離のためのさらなる根拠かないからである。この点において、分離を提供するためのさらなる根拠かまた与えられてもよいということか理解されるへきである。

図１２の上の説明から、ピリオドを見つけるか（ステップ１１０Ａおよびｌｌ０Ｂ）、上付きに書かれた「φ」フィールドを見つけるか（ステップｌｌ０ｃおよび１１０Ｄ）、または複合「φ」フィールドを発見するか（ステップｌｌ０Ｅおよびｌｌ０Ｆ）のいずれかに基ついて、額面金額の「φ」および「＄」　フィールドを分離するだめの根拠を発見した結果として動作はステップｌｌ０Ｇに進むということか理解されるであろう。

したかってステップｌｌ０Ｇは分離のために見つけられた特定の根拠（ピリオド、上付きに書かれることまたは複合「φ」フィールド）を使用して「φ」フィールドを分離する。

またステップｌｌ０Ｇの間、分離された「ψ」フィールドは前述の特許において開示されたような統計学的分類技術を使用して幾つかの梨の１つとして類別される。説明さて与えられ得る類別は２つの０．２桁の数字、下線付き２桁の数字および分数である。別の類別も与えられ得る。

もし許容可能な類別かステップｌｌ０Ｇにおいて決定されるならば、動作は図１２におけるステップ１１２に進み、さもなければ拒絶が発生する。

ステップ１１２（図面の簡単な説明この発明に従ってステップ１１２を達成するための好ましい懸様か次に考察されるであろう。ステップ１１２の目的は「φｊフィールドのために決定された類別に基ついて「ψ」文字を抽出することであることか念頭におかれる。

説明されている好ましい実施例において与えられた種々の類別のためのステップ１１２における動作は以下に説明この類別に関して、「φ」フィールドの値は０であるということか即座に知られ、したかって動作はさらなる処理を伴わず図３のステップ＋１６に進む。典型的には、この類別は分離の根拠かピリオドまたは上付きに書かれた「φ」フィールドの検出であるところでのみ使用される。

２桁の数字この類別に関しては、「Ｌｔ」フィールドの数字は直接利用可能であり、ゆえに動作はさらなる処理を伴わず認識のための図３におけるステップ１１４に進む。

「２つの０」類別と同じく、この類別は典型的には分離のための根拠がピリオドまたは上付きに書かれた「φ」フィールドの検出であるところでのみ使用される。

下線を引かれた２桁の数字この類別に関しては、「φ」フィールドが下線を引かれた「３６ｊからなる図１８および図１９に例示されるように「φ」文字のみか残るように動作は下線を除去することに向けられる。この目的を達成するための好ましい具体例は以下に説明される。

まず下線の勾配か以下のように決定される。「ψノフィールトの各列に関して、第１の黒ピクセルに対する白ピクセルの数か下部端縁からカウントされる。もし２つの連続する列のこれらの個数の差が量に関して４より大きければ、不連続の部分か存在する。「φ」フィールドにおける不連続のすべての部分および２つの不連続の部分の間の最も大きい列範囲か決定される。この最も大きい列範囲において、下線かまた予期される。２つの画像の座標点（ｘｌ、ｙｌ）および（ｘ　２．　Ｙ　２）は以下のように規定される。

ｘｌ＝ｌ箱列の開始列。

ｙｌ＝列ｘ１における下部端縁から第１の黒ピクセルまでの白ピクセルの数。

ｘ２＝列範囲の終わりの列。

ｙ２＝列ｘ２における下部端縁から第１の黒ピクセルまでの白ピクセルの数。

下線の勾配ＳＬは以下の方程式によって定められる。

ＳＬ＝　（ｙ２−ｙ　ｌ）／　（Ｘ２−Ｘ　１）発見された下線を削除するために、勾配ＳＬのｎ直線の集合およびｌの垂直間隔が形成される。直線の数ｎは下線の勾配に依存し、以下のように確立される。

その他の時　ｎ＝３２さらに、開始点かこれらの直線の上に、これらの直線に沿って走査ステップ幅ｌで右からおよび左から「φ」フィールドを走査するために確立される。

左からの走査の場合、ｘｌ（ｉ）＝ｒψ」フィールドの第１の列（すへての直線に関して）ｙｌ　（ｉ）＝ｙ−開始＋１−１（ｉ番目の直線に関しては）この場合、ｙ−開始は（ｘｉ　ｙｌ）が第１の直線の走査点て発生するように確立される。

右からの走査の場合、Ｘｒ　（ｉ）＝　ｒφＪフィールドの最後の列（すべての直線に関して）ｙｒ　（ｉ）＝ｙ−開始＋１−１（ｉ番目の直線に関して）この場合、ｙ−開始は（ｘ　２．　ｙ　２）が第１の直線の走査点て発生するように確立される。

「φ」フィールドはこれらの直線に沿って走査され、その目的は可能な限りにおいてその直線より下には完全な下線は生じるか役に立つ情報は生じないような直線を決定するためである。この目的のために、走査点の個数は、［φノフィールドの第１の黒ビクセルを備える走査点に関する限りは、右からおよび左からの走査においてすへての走査直線に関してカウントされる。それから、右からの走査コースにおけるおよび左からの走査コースにおけるカウントされた走査点の最大個数を備えた直線か決定される。直線のこの範囲から、一番低いものが選択される。この最も低い直線以下の抽出された「φ」フィールドのすへて）部分は削除され、図１９に示される結果を生み出す。上の手順は「ψ」文字か下線を遮断するような状況をも取り扱う。

下線の除去の後（図１９）残った「φ」フィールド構成要素（図１９のｒ３６Ｊ）は再び統計学的分類技術を使って確かめられ、２つの０または２桁の数字類別のどちらに入るか決定される。もし類別が２桁のＯならば、動作はステップ１１６に進む、なぜならＦψＪフィールドの値はＯであることか既知であるからである。もし類別が２桁の数字ならば、動作は２桁の数字を認識するためにステ、ツブ１１４に進む。もしいずれの類別も発見されなければ、拒絶か発生する。

分数この類別に関しては、動作は図２０．２１および２２に示されるようにまず分母を除去し、それから分数点を除去する、なぜなら「φ」フィールドは分子「８０」および分母ｒ１００Ｊを有する分数からな名からである。この目的を達成するための好ましい具体例は以下に説明される。

第１に、フィールドは分数線か予期される列範囲まで調査される。これは、たとえば、最も大きい幅を育する連結構成要素群ＣＣを決定することによって達成されてもよい。

一旦分数線か発見されると、その勾配は座標ｘｉ、ｙｌ、Ｘ２、ｙ２を発見することおよび下線を引かれた複合「φ」フィールドに関して先に説明されたのと同じ態様で勾配を計算することによって決定される。

可能な限り分子および分数線のみが位置する、分割直線がここで確立される。この分割直線は勾配および以下を備える座標ｒｘＬｙｌ＋オフセット」で決定される。

その他の時　オフセット＝ＩＯこのように分割直線を確立して、この分割線の下の「φ」フィールド構成要素は削除され、図１９に示された分数の例に関しては、分母「１００」が削除される結果となるであろう。このように、残りの「φ」フィールド構成要素は、図２１に示される下線を引かれた「８０」となるであろう。

したかって、図２１に例示されるように、分数動作はここまでは下線を引かれた２つの０または２桁の数字という結果になるはずであり、残りの「φ」フィールド構成要素は統計学的分類技術を使って確かめられ、これらの残りの構成部分か実際この下線を引かれた２つの０または下線を引かれた２桁の数字に対応するかどうかを決定する。もしそうならば、動作は、下線を引かれた複合「ψ」フィールド類別に関して上に先に説明されたように継続し、「φ」文字を抽出しく図２２）、もしそうでなければ、拒絶か発生する。

この発明はここに特定の好ましい実施例について説明されてきたか、具体例、配列および使用において多くの修正および変形がこの発明の範囲内で可能であるということが理解されるべきである。たとえば分類類別の型および個数のみならず使用されるシードおよびマスク画像ならびにサーチエリアの個数および型も変化してもよい。さらに、シードおよびマスク画像は２値（２レベル）画像に限定される必要はない。額面金額抽出、「ψ」フィールド分離および／または認識のために役に立つ追加的な情報を提供するために、たとえば、マスク画像それ自体がグレーレベル（多レベル）画像であってもよい。さらに処理ステップも追加的な特徴を与えるために追加されてもよく、または説明されたステップも除去されまたは再配列されてもよい。

加えて、この発明はここに説明されたちの以外に多種多様な適応に適合され得る。したがって、以下の請求の範囲はそこに規定された範囲内てのすべての可能な修正および変形を含むものであると考えられるべきである。

ＦＩＧ、１　ｒ。

ワークヌテーカン１つステ、ア１ｏｏ（図うコｐ１うステ・、ア１０２グラストア１０ｂ、？’うＦＩＧ、＋３ＦＩＧ、１７ＦＩＧ、２０　ＦＩＧ、２１　ＦＩＧ、２２国際調査報告

Claims

【特許請求の範囲】

１．文書からデータを抽出するための電子的に実現される方法において、前記文書の少なくとも一部分のグレーレベル面像表示を生成するステップと、前記グレーレベル画像表示を、第１の画像表示が第１のコントラスト値を越えるグレーレベル画像構成要素のみを含み、第２の画像表示は第２のコントラスト値を越えるグレーレベル画像構成要素のみを含むように、前記第１と第２の画像表示に変換するステップとを含み、前記第１のコントラスト値は前記第２のコントラスト値よりも高く、前記第１の画像表示における各画像構成要素は前記第２の画像表示において対応する構成要素を有し、前記変換するステップは第３のコントラスト値を越えるグレーレベル画像構成要素のみを含む第３の画像表示をまた生成し、前記第３のコントラスト値は前記第１および第２のコントラスト値の中間であり、前記第３の画像表示における各面像構成要素は前記第２の画像表示において対応する構成要素を有し、さらに画像構成要素の位置決定のために前記第１の画像表示の所定のエリアを走査するステップと、前記走査時に前記第１の画像表示の前記所定のエリアにおいて見出された画像構成要素に従って、前記第２の画像表示の第１の所定のエリアにおける対応する画像構成要素を成長させ、前記対応の画像構成要素と、前記第２の画像表示における前記第１の所定のエリアにおいて前記対応の画像構成要素と、所定の連結関係を有する画像構成要素とからなる連結構成要素群を発生するステップと、発生された連結構成要素群が特定の記号に対応するかどうか判断するステップとを含み、前記走査、発生および判断のステップは前記特定の記号に対応すると判断される発生された構成要素群がっくり出されるまで、または前記第１の画像表示の前記所定の画像エリアの走査が完了するまで続けられ、さらに連結構成要素群が前記特定の記号に対応すると判断されたことに応答して、画像構成要素を求めるため前記第３の画像表示の所定のエリアを走査するステップを含み、前記第３の画像表示の前記所定のエリアは前記特定の記号の位置に基づいて選択され、さらに前記走査が前記第３の画像表示の前記所定のエリアにおける画像構成要素を見つけたことに応答して、前記第２の画像表示の所定の第２のエリアにおける対応する画像構成要素を成長させ、前記所定の第２のエリアにおいて前記対応する画像構成要素と前記所定の第２のエリアにおいて前記対応する画像構成要素と所定の連結関係を有する前記所定の第２の画像エリアにおける画像構成要素とからなる連結構成要素群を発生するステップを備え、前記所定の第２のエリアもまた前記特定の記号の位置に基づいて選択され、さらに前記所定の第２のエリアに発生された連結構成要素群が前記文書から抽出されるべき特定のデータに対応する所定の特性に合致するかどうか判断し、一致するならば発生された連結構成要素群を格納するステップと、前記格納するステップの後前記第３の画像表示の前記所定のエリアの前記走査を再開するステップとを含み、前記第３および第２の画像表示に関する前記走査、発生、判断および格納するステップは前記第３の画像表示の前記所定のエリアの走査が完了するまで続けられる、方法。
２．前記走査するステップの間、先に発生され連結構成要素群に含まれる画像構成要素に対応する走査領域における画像構成要素を無視するステップを含む、請求項１に記載の方法。
３．前記文書は財務文書であり、抽出されるべきデータはそこに隣接する関連の記号を有する金額であり、前記関連の記号は前記特定の記号である、請求項１に記載の方法。
４．前記文書上の前記特定の記号の印刷の品質は、前記特定の記号のために発生される連結構成要素群が前記特定の記号としてたやすく認識可能であるように、前記第１および第２のコントラスト値に関係して選択される、請求項３に記載の方法。
５．前記変換するステップによってつくり出された各画像表示は、ピクセルからなるディジタル表示であり、各ピクセルはそれぞれの画像構成要素に対応し、各ピクセルは前記グレーレベル画像表示において対応する位置のコントラスト値を示すディジタル値を有する、請求項１に記載の方法。
６．前記ディジタル表示は２値表示である、請求項５に記載の方法。
７．前記変換するステップは前記グレーレベル画像表示を結果として生じる画像表示上に含まれるべきグレーレベル値に基づいて選択されたしきい値で処理することによって各画像表示をつくり出す、請求項６に記載の方法。
８．前記変換するステップは前記画像表示を同時につくり出す、請求項５に記載の方法。
９．前記第３の画像表示の前記所定のエリアの前記走査が完了した後、前記第２の画像表示の前記走査の結果得られて格納された連結構成要素群を、前記文書上の前記データを認識するための自動データ認識装置に与えるステップを含む、請求項１、２、３、４または５に記載の方法。
１０．前記与えるステップより先に、抽出されるべきデータを含むと判断された領域の外に位置する前記格納された連結構成要素群のいかなるものも除去するステップを含む、請求項９に記載の方法。
１１．文書から金額は文書に印刷された識別文字に隣接して位置する複数の文字からなる、金額を自動的に読取るためのシステムにおける、電子的に実現される方法であって、前記識別文字を含む前記文書の少なくとも一部のグレーレベル面像を生成するステップと、前記グレーレベル画像から、３つの対応する２値ピクセル画像を、３つの異なったコントラスト値を使用して導出するステップとを含み、前記２値ピクセル画像は第１および第２のシード画像およびマスク画像を含み、前記第１のシード画像は前記第２のシード画像に使用されるものよりも大きいしきい値を使用して得られ、前記第２のシード画像は前記第３の画像に使用されるものより大きいしきい値を使用して得られ、さらに前記識別文字を検出するステップを含み、該検出ステップは（ａ）前記第１のシード画像を走査して、データを含むピクセルを検出するステップと、（ｂ）前記マスク画像において、前記第１のシード画像において検出されたピクセルに対応するピクセルを成長させるステップとを含み、前記成長させるステップは、連結されたピクセルの群をつくり出すために前記マスク画像においてのピクセル連結性に基づいて実行され、さらに（ｃ）各つくり出された連結されたピクセルの群をテストし、それが前記識別文字に対応するかどうかを判断するステップと、（ｄ）連結されたピクセルの群が前記識別文字に対応するという判断に応答して前記識別文字を検出するステップを含み、前記第２のシード画像の特定のエリアを走査し、データを含むピクセルを検出するステップを含み、前記特定のエリアは検出された識別文字の位置に基づいて決定され、さりに前記マスク画像において、前記第２のシード画像において検出されたピクセルに対応する各ピクセルを成長させるステップを含み、前記成長させるステップは前記マスク画像においてピクセル連結性に基づいて実行され、前記第２のシード画像において検出された各ピクセルに応答するピクセルの連結された群をつくり出し、さらに前記第２のシード画像の走査によってつくり出された各連結されたピクセルの群が前記金額の文字の少なくとも一部分に対応するかどうか判断し、もしそうであるならば連結されたピクセルの群の表示を格納するステップと、前記第２のシード画像の走査ステップが完了した後、前記金額を認識するための自動文字認識装置に、結果として得られた格納された表示を与えるステップとを含む、方法。
１２．シード画像の走査の間、データを含むピクセルは、もしそれが先につくり出された連結されたピクセルの群において含まれるピクセルに対応するならば、無視される、請求項１１に記載の方法。
１３．前記与えるステップの前に、前記金額を含むと判断された領域の外に位置する、格納された表示のうち異質なものを除去するステップを含む、請求項１１または１２に記載の方法。
１４．前記識別文字は「＄」である、請求項１１または１２に記載の方法。
１５．前記識別文字の印刷の品質は、前記識別文字が前記識別文字としてたやすく認識可能である連結されたピクセルの群をつくり出すように前記しきい値と関連して選択される、請求項１１または１２に記載の方法。