JP2001506383A

JP2001506383A - ピクセルマトリクス上で文字認識を実行する方法

Info

Publication number: JP2001506383A
Application number: JP51290998A
Authority: JP
Inventors: エル．トンプソン，アーチー; サウン，リチャードエイ．ヴァン
Original assignee: ファックストリーブ，インコーポレイテッド
Priority date: 1996-09-05
Filing date: 1997-09-05
Publication date: 2001-05-15
Also published as: WO1998010369A1; DE69736134D1; EP1010128B1; EP1010128A1; ATE330290T1; US5825923A; EP1010128A4; CA2263734C; CA2263734A1

Abstract

(57)【要約】文字認識は、３つの特徴組を用いる独自の記述によって暗号を分類する事によって成立される。本発明のプロセスにおいて、暗号の元のイメージを低密度空間のピクセルマトリクスに収まるように拡大または縮小する事によってラインを位置づけする。イメージはラインを規定するように間引きされるが（３２）暗号の独自性を与えるラインを消さないようにする。暗号が一旦間引きされると、直交座標システムで各ラインの座標組を規定するようにファジー論理が用いられる。全てのラインが位置づけられたあと、各ラインの終点が位置づけられ、交差点が位置づけられる（４４）。これら３つの特徴組は符号化され、６４ビット整数などの３つの値が得られる（５０）。これら３つの整数は、知られている文字の整数組を含むリレーショナルデータベースを照会する検索キーとして用いられる（５３）。

Description

【発明の詳細な説明】ピクセルマトリクス上で文字認識を実行する方法発明の背景本発明は、パターンおよび暗号の認識に関し、特に手書きの文字がデジタル化され、低密度空間のピクセルマトリクスの形状で示される場合のオフライン技術による、線に基づいた文字の認識に特に関する。低密度マトリクスとは、占有されたまたはノン−ヌル(non-null)のセルが比較的少ないマトリクスを意味する。公知のシステムは、高い正確さで任意の言語の手書き文字を読むことを請求しているが、実際に使用するとこのような製品がより低い正確さしか達成しないことを示す。正確さを改善する試みが成されているが、これにはコンピュータによる認識を単純化するために書き手が不自然な方法で書くことが必要である（例えば、標準的アルファベットが変更されているドットをつなぐ仕組みおよび方法）。公知の仕組みの別の問題は、文字がオフラインで読まれるとき、インチ毎に２００ドットの最小解像度を有する要件である。文字がオンラインで読まれる場合、アルゴリズムは文字が所定のストローク順序によって形成されていることを期待する。公知の方法は、典型的に文字セットに敏感である。例えば、英語のアルファベットの文字を認識するように設計された方法は、アジアの観念形態の文字を読む場合に正確さが低くなる。最後に、処理後辞書において単語を一致させることに依存して認識の正確度を改善する公知の方法がある。しかし、文字が単語を形成しない分野である場合（例えば、注文書のシリアル番号または一部が番号である場合）、辞書方法は無用になる。発明の要旨本発明によると、パターン認識、特に文字認識は３つの特徴組を用いる独特の記述(description)によって暗号を分類することによって成立する。この特徴組は、暗号を形成するラインの種類および位置、ラインそれぞれの終点の位置、およびラインの交差位置を確認する。本発明によるプロセスにおいて、ラインは暗号の元のイメージを拡大するか収縮することによって低密度空間ピクセルマトリクスに合致するために位置づけされる。次いで、イメージはラインを規定するために暗号に独自性を与えるラインを消滅させないように細められる。暗号が一旦細められると、ファジー論理が用いられ、各ラインをｘ−ｙ座標のシステムに関して「位置づけする」、すなわち、各ラインに対して座標の組を規定する。（各ラインが位置づけされると、残りのラインを位置づけするのを容易にするために各ラインはマトリクスイメージから除去される。）全てのラインが位置づけされた後、各ラインの終点が位置づけされ、交差点が位置づけされる。これらの３つの特徴組は符号化され、６４ビット整数などの３つの値になる。その後、これら３つの整数は、検索キーとして用いられ、知られている文字に対する整数組を含むリレーショナルデータベースを照会する。直接一致が見つからない場合、マッチングアルゴリズムは部分的一致を用いて正確な文字を推定する。マトリクスが低密度なので、正確な文字を識別する可能性は高まる。本発明は、添付の図面と共に以下の詳細な説明を参照することによってより良く理解される。図面の簡単な説明図１は、本発明によるプロセスのフローチャートをである。図２Ａ、２Ｂ、２Ｃは共に、間引きアルゴリズム(thinning algorithm)のフローチャートである。図３Ａ、３Ｂ、３Ｃは共に、特徴を発見するアルゴリズムのフローチャートである。図４Ａ、４Ｂ、４Ｃ、４Ｄは共に、ライン区画を得るアルゴリズムのフローチャートである。図５Ａ、５Ｂ、５Ｃ、５Ｄは共に、ラインタイプを得るアルゴリズムのフローチャートである。図６は、交差点を発見するアルゴリズムのフローチャートである。図７は、終点を発見するアルゴリズムのフローチャートである。図８は、有効なラインを発見するアルゴリズムのフローチャートである。図９Ａ、９Ｂ、９Ｃは共に、量子化アルゴリズムのフローチャートである。図１０は、８個の最近接ピクセルの規定を示す図である。図１１は、４８個の最近接ピクセルの規定を示す図である。図１２は、下から６個の最近接ピクセルの規定を示す図である。図１３は、上から６個の最近接ピクセルの規定を示す図である。図１４は、１２個の最近接ピクセルの規定を示す図である。図１５は、オフにされるピクセルを示す図である。図１６は、上部ギャップ閉鎖のピクセルを示す図である。図１７は、異質性の上行を示す図である。図１８は、骨格ピクセルを位置づけするためのパターンの一致を示す図である。図１９は、ラインセグメント偏差を示す図である。図２０は、ギャップの埋め込みを示す図である。図２１Ａ、２１Ｂ、２１Ｃは、３つのファジー論理表である。具体的な実施形態の詳細な説明本発明のプロセスは、図１から始まるフローチャートを参照して最も良好に説明される。プロセスには５つの入力パラメータがあり、それぞれプロセスの工程で示している。第１のパラメータは、情報のブロックのアレイであり、これは、典型的にバイトでイメージ１０のデジタル表示である。ここで、各バイトは８ビット長である。第２の入力パラメータは、文字イメージ１２のピクセルを示すビットの数である。イメージが元来白黒である場合、ビットのピクセルに対する比（ｂｐｒ）は１になる。第３の入力パラメータは文字イメージ１４の行に含まれるピクセルの数である。第４の入力パラメータは、文字イメージ１６に含まれる行の数である。第５のパラメータは、行がバイト境界１８上で始まるかどうかを示す。行がバイト境界で始まる場合、第５のパラメータは１に設定され、それ以外はパラメータがゼロに設定される。認識プロセスにおける第１の工程は、入力アレイをアンパックするので１つのバイトなどの１つのブロックが１つのピクセル２０を以下のように表示する：ｂｐｒが１に等しいとき、入力アレイの各ビットは別々に検査される。ビットが１に等しいとき、第２のアレイ（Ａ２）の対応バイトは１に設定され、それ以外では対応バイトはゼロに設定される。ｂｐｒが１を上回るとき、ビットはｂｐｒに等しい分類で検査される。分類内のビットは共に論理的ＯＲされる。このＯＲの結果が１に等しいとき、Ａ２内の対応バイトは１に設定される；それ以外は、それはゼロに設定される。その後、イメージは３８×１８のマトリクスに合うように縮小される。イメージが最初から３８×１８より小さな場合は、イメージの縮小は必要ではない。イメージの縮小は、まず、走査プロセス２２中に接触し、得たギャップを削除することによってイメージを平滑化(smoothing)する。ピクセルを表示する各バイトは、個別に検査される。バイトが１に等しい場合、対応ピクセルは「オン」であるとみなされ、次のバイトが検査される。バイトがゼロに等しい場合、対応ピクセルは「オフ」であると見なされる。値Ａ２（ｘｎ，ｙｍ）が問題のピクセルを表示し、Ａ２（ｘｎ，ｙｍ）＝０である場合、次のピクセルが検査される（図１０に示すように８個の最近接ピクセル）：Ａ２（ｘｎ−１、ｙｍ−１）Ａ２（ｘｎ、ｙｍ−１）Ａ２（ｘｎ＋１、ｙｍ−１）Ａ２（ｘｎ−１）ｙｍ）Ａ２（ｘｎ＋１、ｙｍ）Ａ２（ｘｎ−１、ｙｍ＋１）Ａ２（ｘｎ、ｙｍ＋１）Ａ２（ｘｎ＋１、ｙｍ＋１）これらのピクセルのいずれかがオフである場合、Ａ２（ｘｎ，ｙｍ）＝０は有効であるとみなされる。これらのピクセルの全てがオンである場合、４８個の最近接ピクセルが検査される（図１１を参照）すなわち、以下のピクセルが検査される：Ａ２（ｘｎ−３、ｙｍ−３）Ａ２（ｘｎ＋３、ｙｍ＋１）Ａ２（ｘｎ−２、ｙｍ−３）Ａ２（ｘｎ−３、ｙｍ＋２）Ａ２（ｘｎ−１、ｙｍ−３）Ａ２（ｘｎ−２、ｙｍ＋２）Ａ２（ｘｎ、ｙｍ−３）Ａ２（ｘｎ−１、ｙｍ＋２）Ａ２（ｘｎ＋１、ｙｍ−３）Ａ２（ｘｎ、ｙｍ＋２）Ａ２（ｘｎ＋２、ｙｍ−３）Ａ２（ｘｎ＋１、ｙｍ＋２）Ａ２（ｘｎ＋３、ｙｍ−３）Ａ２（ｘｎ＋２、ｙｍ＋２）Ａ２（ｘｎ−３、ｙｍ−２）Ａ２（ｘｎ＋３、ｙｍ＋２）Ａ２（ｘｎ−２、ｙｍ−２）Ａ２（ｘｎ−３、ｙｍ＋３）Ａ２（ｘｎ−１、ｙｍ−２）Ａ２（ｘｎ−２、ｙｍ＋３）Ａ２（ｘｎ、ｙｍ−２）Ａ２（ｘｎ−１、ｙｍ＋３）Ａ２（ｘｎ＋１、ｙｍ−２）Ａ２（ｘｎ、ｙｍ＋３）Ａ２（ｘｎ＋２、ｙｍ−２）Ａ２（ｘｎ＋１、ｙｍ＋３）Ａ２（ｘｎ＋３、ｙｍ−２）Ａ２（ｘｎ＋２、ｙｍ＋３）Ａ２（ｘｎ−３、ｙｍ−１）Ａ２（ｘｎ＋３、ｙｍ＋３）Ａ２（ｘｎ−２、ｙｍ−１）Ａ２（ｘｎ＋２、ｙｍ−１）Ａ２（ｘｎ＋３、ｙｍ−１）Ａ２（ｘｎ−３、ｙｍ）Ａ２（ｘｎ−２、ｙｍ）Ａ２（ｘｎ＋２、ｙｍ）Ａ２（ｘｎ＋３、ｙｍ）Ａ２（ｘｎ−３、ｙｍ＋１）Ａ２（ｘｎ−２、ｙｍ＋１）Ａ２（ｘｎ＋２、ｙｍ＋１）上述のピクセルの１つがオフである場合、Ａ２（ｘｎ、ｙｍ）＝０は無効であるとみなされ、Ａ２（ｘｎ、ｙｍ）が１に等しく設定される。上述のピクセルの全てがオンである場合、Ａ２（ｘｎ、ｙｍ）＝０は有効であるとみなされる。イメージが平滑化された後、各「包囲物(enclosure)」の位置が２４で見られる。「包囲物」は、オンである連続したピクセルの組によって完全に包囲されている、オフである連続したピクセルの組として規定される。すなわち、包囲物は境界を規定する。各包囲物の境界ピクセルの位置は、アレイに保存される。包囲物が一旦確認されると、イメージは２６でサイジングされる。イメージの水平方向の長さ（＾ｘ）およびイメージの垂直方向の長さ（＾ｙ）が演算される。ｘ方向の約数（ｘ＿ｄｉｖ）が＾ｘ／３７に等しく、ｙ方向の約数（ｙ＿ｄｉｖ）が＾ｙ／１７に等しくなるように次の約数が計算される。次いで、アレイＡ２の（ｘ、ｙ）にあるピクセルが減少アレイ（Ａ３）において（ｘ’、ｙ’）にあり、ここでｘ’＝ｘ／ｘ＿ｄｉｖでありｙ’＝ｙ／ｙ＿ｄｉｖであるように、対応が確立される。Ａ２（ｘ１、ｙ１）、Ａ２（ｘ２、ｙ２）、・・・、Ａ２（ｘｎ，ｙｎ）＝＝＞Ａ３（ｘ’，ｙ’）などの条件が生じた場合、Ａ３（ｘ’、ｙ’）の値は論理または［Ａ２（ｘ１，ｙ１）、Ａ２（ｘ２，ｙ２）、・・・、Ａ２（ｘｎ，ｙｎ）］に設定される。次に、各包囲物の境界が再検査される。各包囲物の境界は、Ａ３において点に変換される。包囲物の点の全てがＡ３でオンである場合、変換された包囲物の中心が演算され、ゼロに設定される。よって、減少によって消去された包囲物はいずれも２８で復元される。イメージは、規格化プロセス３０を通過する準備ができている。規格化プロセスでは散在するマーク（mark）に属するピクセルを消去する。規格化プロセスは、意図的な標準が１ピクセルより大きな幅（＞．１ｍｍ）を有するという仮定に基づく。規格化プロセス中は、確立された規則に従う。１．イメージの上行にあるピクセルがオンであり、下部の６個の近接ピクセルが全てオフである場合、ピクセルはオフにされる。（図１２を参照）２．イメージの上行にあるピクセルがオフであり、両側のピクセルがオンである場合、ピクセルはオンにされる。３．ピクセルはオンであるが、イメージの上行または下行になく、上部の６個の近接ピクセルがオフである場合、ピクセルはオフにされる（図１３を参照）。４．イメージの下行にあるピクセルがオンであり、上部の６個の近接ピクセルが全てオフである場合、ピクセルはオフにされる。５．イメージの下行にあるピクセルがオフであり、両側のピクセルがオンである場合、ピクセルはオンにされる。６．ピクセルがオンであるが、上行または下行になく、最初または最後の列にもなく、上部の６個の近接ピクセルまたは下部の６個の近接ピクセルが全てオフである場合、ピクセルはオフにされる。７．ピクセルがオフであるが、包囲物の一部ではなく、１２個の最近接ピクセルがオンである場合、ピクセルはオンにされる。（図１４を参照）８．ピクセルがオンであり、８個の最近接ピクセルの内２つ未満がオンである場合、ピクセルはオフにされる（図１５を参照）。９．行がすぐ上または下の空白行によってイメージから分離されている場合、行は削除される。１０．オンである同一の行中の連続したピクセルの組として行セグメントを規定する。オフである同一の行中の連続したピクセルの組として行ギャップを規定する。イメージの最初の３つの行のそれぞれがギャップを１つだけ含み、各ギャップが次の行のギャップの直ぐ上になり、各ギャップは次のギャップより長さが短く、上行のギャップが５ピクセル長未満である場合、上ギャップにあるピクセルはオンにされる（図１６を参照）。１１．上行の行セグメントが５ピクセル長未満であり、それが次の行の行セグメントに隣接しており、行セグメントの開始列が隣接した行セグメントの開始列の右にあり、行セグメントの終了列が隣接した行セグメントの終了列の左にある場合、行セグメントは削除される（図１７を参照）。１２．下部行の行セグメントが５ピクセル長未満であり、前の行の行セグメントに隣接しており、行セグメントの開始列が隣接した行セグメントの開始列の右にあり、行セグメントの終了列が隣接した行セグメントの終了列の左にある場合、行セグメントは削除される。イメージが一旦規格化されると、イメージ全体は左に移動するので、イメージの第１の非空白列がゼロ列から開始する。イメージは３２で間引かれる。間引きは、無関係なピクセルをイメージから除去するので基本的な骨格イメージのみが残る。骨格イメージで認識を行うことによって、様々なストロークの幅およびサイズによる認識の誤りが排除される。間引きアルゴリズムは、Theo Pavlidisの研究に基づく。図２Ａ、２Ｂ、２Ｃは、本明細書中で用いられるアルゴリズムの詳細なフローチャートであり、これは自明である。Pavlidisによって与えられるアルゴリズムは、場合によっては英数文字の重要な特徴が失われる原因になる。特徴の損失を回避するために、本明細書中に開示されるように、大きな改変がアルゴリズムに成された。改変アルゴリズムの重要な局面および工程は以下に示す通りである：１．イメージは、削除するピクセルについて一度に１エッジずつ検査される。ピクセルは、右側から開始して上、左側、および下と順番に続いて検査される。２．各検査中、ピクセルは、ピクセルおよびその８個の最近接ピクセルを所定のパターン組と比較することによって骨格ピクセルであるか判定される（３６）。ピクセルおよびその近接ピクセルがパターンのいずれかに一致する場合、ピクセルは骨格であると言える。ピクセルおよびその近接ピクセルを比較する対象となる１２のパターンがある（図１８を参照）。３．１つの行のピクセルが検査された後、それらは再検査され、行内の行セグメントのいずれかが骨格であるかどうか判定する。行セグメントが３ピクセルより長く（４０）、行中で行セグメントのすぐ上および下にあるピクセルがオフである場合（３８）、行セグメント中のすべてのピクセルは骨格であるとみなされる（４２）。４．各エッジの処理の最後で、垂直ラインが検査され、垂直ラインが誤って削除されないように保証する。ラインが２行分より長く、２ピクセルの幅を上回らない場合、ラインは骨格であるとみなされる。５．各エッジの処理が完了した後、検査されたエッジ上のピクセルであって、骨格でないものはゼロに設定される。６．処理全体はイメージが骨格ピクセルのみを含むようになるまで繰り返される。７．骨格イメージのエッジがライン約数、すなわち、行セグメントまたはラインセグメントから出た１つのピクセルによって移動されたピクセルについて検査される（図１９を参照）。このようなピクセルは、列またはラインセグメントとの配列に戻される。８．骨格イメージは、行セグメントについて走査される。この行セグメントは、単一の行セグメントを形成するためにに前または後の行のいずれかの中で２つの行セグメントの間のギャップに移動され得る。上述の基準を満たすことに加えて、行セグメントが移動されるには、行セグメントは対角線の一部であってはならず、行セグメントの動きは空白ラインがイメージの最上または底にない限り、空白ラインを形成できない（図１２を参照）。９．イメージは、移動され、縮小／拡大されるので、低密度空間（２０ ×１２）マトリクスに正確に合致する。間引きの後、イメージは特徴について検査される（４４）（図３Ａ、３Ｂ、３Ｃを参照）。検査される最初の特徴は水平ラインである。水平ラインはイメージ中の行セグメントのすべての平均長と同じ長さ、またはそれより長い行セグメントとして規定される。プロセスは、各行を行セグメントについて走査することで開始される。行セグメントが発見された場合、セグメントの長さ、行、開始列、および終了列が表に記録される（４６）。全ての行が走査された後、表は長さの降順で格納される（４８）。各行セグメントの長さは加算されて合計を出す。最長の長さと最短の長さを合計から減算する。次いで、合計は行セグメントの合計数から２を引いた数によって除算され、平均長を決定する（５１）。平均長が４ピクセル長未満である場合（５２）、平均長は３の値を割り当てられる（５４）。平均長を３に強いることによって、何も存在しない所で水平ラインを発見する可能性が排除される。格納された水平表が次に処理される。各入力項目の長さが平均長に対して点検される（５６）。入力項目の長さが平均長以上である場合、入力項目は接続性に対して検査される。行セグメントが平均以上の長さのより小さな行セグメントに隣接する（上または下）場合、第２の行セグメントは第１のセグメントの一部であると言われる。この行セグメントの連鎖は、隣接した行セグメントがなくなるまで、または１つ以上の隣接した行セグメントがあるまで、または行セグメントの開始列が前の行セグメントの開始列と順序が狂うまで続けられる。Ｓ０，Ｓ１，Ｓ２，およびＳ３が行セグメントゼロ、行セグメント１、行セグメント２、行セグメント３それぞれの開始列を示すとする。Ｓ０＞＝Ｓ１＞＝Ｓ２およびＳ２＜Ｓ３であるか、またはＳ０＜＝Ｓ１＜＝Ｓ２およびＳ２＞＝Ｓ３である場合、Ｓ３は順序が狂っていると言える。連鎖における行セグメントの数が３を上回る場合、連鎖は垂直／対角として処理される。連鎖における行セグメントの数が３以下である場合、連鎖は平行として処理される。平行処理を終了させるために、連鎖の開始および終了行ならびに連鎖の開始および終了列は「発見された特徴」の表に記録される。間引きされたイメージが保存された後、連鎖はイメージから消去される、すなわち、連鎖におけるピクセルの全てはゼロに設定される。次に、部分的に消去されたイメージが垂直／対角ラインについて検索される。行セグメントの連鎖は上述と同一の方法で発見される。垂直の長さが３行以上である連鎖のみが用いられる。有効な連鎖が一旦発見されると、連鎖が垂直であるか、または対角であるのかについて判定されなくてはならない。この判定は、ファジー論理を用いて成される（図４および５を参照）。ラインタイプを決定するために連鎖の３つの構成要素が検査される。３つの構成要素とは、ラインの傾斜と、２つの行の間での水平方向の最大変化（最大デルタｘ）と、水平方向に変化のない連続行の最大数を垂直方向の合計変化で除算した数（ゼロ傾斜）とである。演算された値に基づいて、各構成要素は０．１から１．０の間の値に割り当てられる。図２１、２１Ｂ、および２１Ｃにおける表は、構成要素の実際の値と割り当てられた値の相関関係を示す。値が一旦割り当てられると、各構成要素値は関連因数によって乗算される。傾斜およびゼロ傾斜に対して、関連因数は０．４である。最大デルタｘに対して、関連因数は０．２である。構成要素値が因数分解された後、それらは共に加算される。（切り上げられた(as rounded)）合計が、０．５未満である場合、ラインは垂直であるとみなされる。合計が０．５以上である場合、ラインは対角であるとみなされる。対角線に対して、開始列が次の行のそれぞれで増加する場合、対角は左対角である。それ以外では、対角は右対角である。垂直および対角の位置およびタイプが「発見された特徴」の表に記録され、ラインがイメージから消去される。残りの行セグメントは接続ラインであるとみなされる。行セグメントの位置は、「発見された特徴」の表に記録される。全てのラインが登録された後、交差点の検索が行われる（４７）（図６を参照）。交差点はラインセグメントの終点であり、別のラインセグメントの点に隣接する。各終点の位置は「発見された特徴」の表に記録されているので、表を検索してどの終点が他のラインセグメントと交差しているかを見つけるのは容易である。各交差点が発見されると、交差表に位置が記録される（図６を参照）。全ての交差点が一旦発見されると、他のラインセグメントと交差しない終点の位置が終点表に記録される（４９）（図７を参照）。どれが誤ったストロークであり得るかに過度の重点を置くことを回避するために、接続ラインの終点は交差点としてマーク（mark）され得る。しかし、接続ラインの終点は終点表には記入されない。プロセスのこの時点で、文字を確認するのに必要な情報が収集された。しかし、この情報は、効率的なデータベース検索を可能にするために量子化されなければならない（５０、図１）。量子化は特徴、交差点、および終点に数値を割り当てる事によって成される（５０）（図９Ａ、９Ｂ、９Ｃを参照）。特徴に対して、水平ラインがイメージの上４行にある場合、１の値を割り当てられる。それが中間の４つの行にある場合、１６の値が割り当てられる。水平ラインが下の４つの行にある場合、２５６の値を割り当てられる。垂直ラインが左の６列にある場合、４０９６の値が割り当てられる。これが中間の８列にある場合、６５５３６が割り当てられる。垂直ラインが右の６列にある場合、１０４８５７６の値が割り当てられる。左対角は１６７７７２１６の値が割り当てられ、右対角には２６８４３５４５６の値が割り当てられる。接続ラインはヌル値を割り当てられる。特徴に対する値は加算され、合計が特徴値（ＦＶ）として保存される。終点（ＥＶ）および交差点に対す値は同一の方法で計算される。次に、対角ラインの位置は、更に量子化され、１つ以上の同−ＦＶ、ＥＶ、ＩＶの値が割り当てられたときに文字選択を援助する。まず、各対角は、水平および垂直位置に基づく８進数を割り当てられる。左対角の全てに対する値は、６４ビット整数に置かれる（ＬＶ）。右対角の全てに対する値は、第２の６４ビット整数に置かれる（ＲＶ）。各値が正確な整数へと加算される前に、整数は６４で乗算され、新しい値に対して場所を与えるために、整数を効率的に５ビット分移動する。方法は、１２個の右対角および１２個の左対角を考慮する。ほとんどの場合では、いかなる文字の組における記号も１２個を超える任意の１種類の対角を有さない。このような場合が生じた場合、第２の整数の組がオーバーフローを適応させるために用いられる。プロセスの次の工程は動作モードのタイプに依存する。トレーニングモードで動作しているとき、ＦＶ、ＥＶ、ＩＶ、ＬＶおよびＲＶの値とともにリレーショナルデータベースに文字が追加される。文字認識のこの方法はコンテクストに敏感でないので、１以上の言語からの文字が同一のデータベースにロードされ得、同一のデータベースから１つ以上の言語が認識されることを可能にする。データベースはまた、タイプされたフォントなどの視覚文字認識を可能にするように構築される。なぜなら、本発明の根底にある原理は手書き文字の認識に限定されないからである。文字認識モードで動作しているとき、データベース検査を行い、イメージを確認する（５３）。データベースはＦＶ、ＥＶ、およびＩＶの値をキーとして用いて照会される。全ての３つのキーに対応する独特の文字がある場合、文字は未知のイメージの解釈として戻される。１つ以上の文字が３つのキーの全てに対応することが分かった場合、ＬＶおよびＲＶの値をキーリストに追加して第２の照会が成される。５つのキー全てに対応する独特の文字がある場合、文字は戻される。独特の文字がみつからない場合、記号（通常「？」であるが、いかなる文字であってもよい）がユーザに戻され、文字が未知であることが示される。最初の３つのキーの照会に応答して、文字が発見されなかった場合、「高確率」解答を決定するために一連の照会が成され得る。照会の数はユーザによって決定される。より多くの照会が成されると、文字が見つかる確率が高まる。しかし、より多くの照会を行うことによって、間違った文字が選択される確率も高まる。最初の照会の組は、ＦＶおよびＥＶをキーとして成される照会である。これらの照会のそれぞれに対して、ＦＶは、垂直ラインの１つが実際は対角である場合の値または対角ラインの１つが実際は垂直である場合の値を反映するように変更される。これらの置換は、文字の傾斜が書き手によって変動するという事実に基づく。よって、完璧に形成された文字において垂直のラインが実際には対角に見えたり、その逆であったりする。この照会の間、特定の文字が検索キーに一致した回数のカウントが保たれる。一連の照会の最後で、文字カウントが他の文字カウントの全てより少なくとも２つ上回る場合、文字が戻される。それ以外では次の一連の照会が実行される。次の一連はＦＶのみをキーとして用いる照会で開始する。この照会から１文字のみが戻された場合、その文字がユーザに戻される。１つ以上の文字が戻された場合、各文字は表に入力される。照会から文字が全く戻されない場合、表は空で残される。次の照会はＥＶのみを検索キーとして用いる。表が空の場合、見つけられた文字が表に入力される。表が空でない場合、表中の文字が照会から戻された文字と比較される。表中の文字が照会結果にない場合、文字は表から消去される、すなわち、論理的「ＡＮＤ」が表中の文字および照会から戻された文字を用いて遂行される。処理の終わりで表中に独特の文字が残る場合、その文字は戻される。表中に文字が残らない場合、「未知文字」の記号が戻される。表中に１つ以上の文字が残るか、照会の返答が空である場合、次の照会が実行される。その後、次の照会は検索キーとしてＩＶのみを使用する。その後、前のプロセスがこの照会の結果に対して繰り返される。独特の文字が発見されない場合、プロセスは以下のキーの組合せを用いて繰り返される：１．ＦＶおよびＩＶ２．ＥＶおよびＩＶ３．ＦＶおよびＥＶこの時点で、独特の文字が発見されない場合、ＦＶおよび各表の入力項目を検索キーとして用いて照会が成される。表からの各文字の回数は、所与のＦＶ値と共にデータベースにあり、それは照会の結果である。文字に対するカウントが他の文字より５上回る場合、文字は戻される。本発明を具体的な実施形態を参照にして説明した。他の実施形態は、当業者には明らかである。例えば、本発明は文字認識、特に手書き文字のコンテクストで開示されたが、本発明の技術はピクセルに減少され、キーが指示され得る情報を含む他のパターンの認識にも応用を見い出してもよい。よって、本発明は添付の請求の範囲に示される以外で限定されることは意図されない。

Claims

【特許請求の範囲】１．暗号を認識する方法であって、該方法が暗号のデジタル表示を、該デジタル表示のビットに対するピクセルの比と、該デジタル表示の行毎のピクセルの数と、該デジタル表示中の行の数と、および該デジタル表示のブロック境界条件を示すインジケータと共に入力する工程と、該デジタル表示を変換することによってイメージ情報の各個別ピクセルがアドレス可能なデータブロックによって示される工程と、該変換を平滑化する工程と、該平滑化された変換内の包囲物を位置づけする工程であって、該包囲物が空間的な境界を規定している工程と、該平滑化された変換をサイジングして、選択されて消去された包囲物を得る工程と、該サイジングされた変換内の該消去された包囲物のすべてを復元する工程と、該復元された包囲物変換を規格化することによって散在するマークが消去され、規格化されたイメージが形成される工程と、該規格化されたイメージを間引きする工程と、低密度空間マトリクス内に該間引きしたイメージを格納する工程と、該間引きしたイメージに重要な特徴を位置づける工程と、該重要な特徴の位置を量子化する工程と、該量子化された値を検索キーとして用いてデータベース検索を行い、該検索キーに関連する暗号を確認する工程と、を含む方法。２．暗号を認識する方法であって、該方法が暗号のデジタル表示を、該デジタル表示のビットに対するピクセルの比と、該デジタル表示の行毎のピクセルの数と、該デジタル表示中の行の数と、および該デジタル表示のブロック境界条件を示すインジケータと共に入力する工程と、該デジタル表示を変換することによってイメージ情報の１つのピクセルがブロックによって示される工程と、該変換を平滑化する工程であって、該平滑化する工程が各「オフ」ピクセルの最近接の８個のピクセルをテストする工程と、該最近接の８個の近接ピクセルが全て「オン」である場合、該「オフ」ピクセルの最近接の４８個のピクセルをテストする工程と、該最近接の４８個のピクセルのいずれかが「オフ」である場合、該ピクセルをオンにする工程と、を含む工程と、該平滑化された変換内に包囲物を位置づけし、該包囲物が空間的な境界を規定する工程と、該平滑化された変換をサイジングして選択されて消去された包囲物を得る工程と、該サイジングされた変換内の該消去された包囲物の全てを復元する工程と、該復元された包囲物変換を規格化することによって散在するマークが消去され、規格化されたイメージが形成される工程と、該規格化されたイメージを間引きする工程と、低密度空間マトリクス内に該間引きしたイメージを格納する工程と、該間引きしたイメージに重要な特徴を位置づける工程と、該重要な特徴の位置を量子化する工程と、該量子化された値を検索キーとして用いてデータベース検索を行い、該検索キーに関連する暗号を確認する工程と、を含む方法。３．前記包囲物を位置づけする工程が、オフである近接するピクセルの少なくとも１対の組を位置づける工程と、該オフピクセルを包囲し、オンである、ピクセルの組をテストする工程と、該オフピクセルの位置を記録する工程と、を含む、請求項１に記載の方法。４．前記サイジング工程が、水平因数を計算する工程と、垂直因数を計算する工程と、前記平滑化された変換内の各ピクセルに対して該水平因数と該垂直因数に基づいて新しい水平および垂直位置を計算する工程と、を含む、請求項１に記載の方法。５．前記復元する工程が、復元されたイメージ内の包囲物の好ましい位置を計算する工程と、該好ましい位置をテストして、該包囲物が該好ましい位置にあるかどうかを決定する工程と、該包囲物が存在しない場合、該包囲物を復元する工程と、を含む、請求項１に記載の方法。６．前記規格化する工程が、前記復元されたイメージの最上行にある対象ピクセルがオンであるかどうかテストする工程と、該対象ピクセルがオンである場合、最近接の６個の下部のピクセルをテストする工程と、該下部の６個の近接ピクセルのすべてがオフである場合、該最上行の該対象ピクセルをオンにする工程と、を含む、請求項１に記載の方法。７．前記規格化する工程が、前記復元されたイメージの最上行にある対象ピクセルがオフであるかどうかテストする工程と、該対象ピクセルがオフである場合、該対象ピクセルの両側に隣接する該ピクセルをテストする工程と、該両側のピクセルがオンである場合、該対象ピクセルをオンにする工程と、を更に含む、請求項１に記載の方法。８．前記規格化する工程が、前記復元されたイメージの最上行以外の行のいずれかにある対象ピクセルがオンであるかどうかテストする工程と、該対象ピクセルがオンである場合、最近接の上部６個のピクセルをテストする工程と、該最近接の上部６個のピクセルがオフである場合、該対象ピクセルをオフにする工程と、を更に含む、請求項１に記載の方法。９．前記規格化する工程が、前記復元されたイメージの底部行にある対象ピクセルがオフであるかどうかテストする工程と、該対象ピクセルがオフである場合、該対象ピクセルに隣接する側面ピクセルをテストする工程と、該両側のピクセルがオンである場合に該対象ピクセルをオンにする工程と、を更に含む、請求項１に記載の方法。１０．前記規格化する工程が、前記復元されたイメージの最上または底部行以外の行いずれかにある対象ピクセルがオンであり、該復元されたイメージの最初または最後の列にないかどうかをテストする工程と、該対象ピクセルがオンである場合、上部６個の最近接ピクセルと底部６個の最近接ピクセルとをテストする工程と、該上部６個の近接ピクセルまたは該底部６個の近接ピクセルが全てオフである場合に該対象ピクセルをオフにする工程と、を更に含む、請求項１に記載の方法。１１．前記規格化する工程が、対象ピクセルが包囲物の一部であるかテストする工程と、該ピクセルが包囲物の一部でない場合に該対象ピクセルがオフであるかどうかテストする工程と、該ピクセルがオフである場合、前記１２個の最近接ピクセルをテストする工程と、該１２個の最近接ピクセルが全てオンである場合、該対象ピクセルをオンにする工程と、を更に含む、請求項１に記載の方法。１２．前記規格化する工程が、前記対象ピクセルがオンであるかどうかテストする工程と、該対象ピクセルがオンである場合、最近接の８個のピクセルをテストする工程と、該最近接の８個のピクセルのうち２個未満がオンである場合、該対象ピクセルをオフにする工程と、を更に含む、請求項１に記載の方法。１３．前記規格化する工程が、空白条件に対してテストする工程であって、該空白条件は前記復元されたイメージ内の空白でない行が２つの空白行の間にある工程と、該空白条件があてはまる場合、該空白でない行および該２つの空白行を削除する工程と、を更に含む、請求項１に記載の方法。１４．前記規格化する工程が、前記復元されたイメージの第１行、第２行、および第３行内のギャップをテストする工程と、該ギャップが存在し、行毎に１つのみのギャップがある場合、該各ギャップの長さを演算する工程と、該ギャップが次のギャップのすぐ上にあり、該長さが上から下に向かって増加していき、最上ギャップの長さが５ピクセル未満である場合、第１行内にあるギャップを埋める工程と、を更に含む、請求項１に記載の方法。１５．前記規格化する工程が、最上行の最上行セグメントの最上行セグメントの長さをテストする工程と、該最上行セグメントの長さが５未満である場合、該最上行の該最上行セグメントの直ぐ下にある次の行セグメントの該次の行セグメントの長さをテストする工程と、該最上行セグメントの長さが５を上回り、該次の行セグメントが該最上行セグメントの完全に下になっている場合、該最上行セグメントを削除する工程と、を更に含む、請求項１に記載の方法。１６．前記規格化する工程が、底部行にある底部行セグメントの底部行セグメントの長さをテストする工程と、該底部行セグメントの長さが５未満である場合、該底部行にある該底部行セグメントのすぐ上にある前の行セグメントの該前の行セグメントの長さをテストする工程と、該底部行セグメントの長さが５を上回り、該前の行セグメントが該底部行セグメントの完全に上にある場合、該底部行セグメントを削除する工程と、を更に含む、請求項１に記載の方法。１７．前記間引き工程が、骨格ピクセルのために前記イメージのエッジを一度に１つのエッジずつ検査する工程と、その後、骨格でないピクセルを削除する工程と、該骨格ピクセルのみが残るまでプロセスを繰り返す工程と、単一のサイズのマトリクスに収まるように、最後の骨格イメージを縮小する工程と、を含む、請求項１に記載の方法。１８．前記検査する工程が、各エッジピクセルとその８個の最近接ピクセルとを比較して、１２のパターンに設定する工程と、該エッジピクセルおよび該８個の最近接ピクセルが該パターンのいずれかに一致した場合、各該エッジピクセルを骨格としてマークする工程と、を含む、請求項１７に記載の方法。１９．前記検査する工程が、３ピクセルより長い行セグメントを捜すために各行を検索する工程と、３ピクセルの行セグメントが存在する場合、該３ピクセル行セグメントの直ぐ上または下のピクセルを検査する工程と、３ピクセルの行セグメントの位置が空白である場合、該３ピクセルの行セグメントの位置にある全てのピクセルを骨格としてマークする工程と、を更に含む、請求項１７に記載の方法。２０．前記検査する工程が、垂直ラインを検査する工程と、該垂直ラインが２行分より長く、３ピクセルの幅未満である場合、該垂直ラインを骨格としてマークする工程と、を更に含む、請求項１７に記載の方法。２１．前記位置づける工程が、前記イメージ中の全ての行セグメントに渡って平均の長さを演算する工程と、該平均の長さより長さが大きい行セグメントを走査する工程と、平均より大きい長さの該行セグメントを行セグメント連鎖について走査する工程と、該行セグメント連鎖の位置および長さを記録する工程と、ファジー論理を用いて該行セグメント連鎖が示すラインのタイプを決定する工程と、該イメージから該行セグメント連鎖を削除する工程と、残りのイメージを垂直ラインに対して検査する工程と、ファジー論理を用いて該垂直ラインが垂直であるか対角であるかを判定する工程と、該ラインの位置、長さ、およびタイプを記録する工程と、該イメージから該ラインを消去する工程と、残りの行セグメントを位置づける工程と、該行セグメントの位置を記録する工程と、全ての交差点の位置を演算する工程と、該点を記録する工程と、全ての終点の位置を演算する工程と、該点を記録する工程と、を含む、請求項１に記載の方法。２２．前記量子化する工程が、各特徴のｘ−ｙ座標位置に基づいて、該各特徴に数値を割り当てる工程と、ラインタイプについての該数値を合計する工程と、終点についての該数値を合計する工程と、交差点についての該数値を合計する工程と右対角についての該数値を合計する工程と、左対角についての該数値を合計する工程と、を含む、請求項１に記載の方法。２３．リレーショナルデータベースに知られている暗号およびその量子化された値を追加する工程を更に含む、請求項１に記載の方法。２４．暗号を認識する方法であって、該方法が暗号のデジタル表示を、該デジタル表示のビットに対するピクセルの比と、該デジタル表示の行毎のピクセルの数と、該デジタル表示中の行の数と、および該デジタル表示のブロック境界条件を示すインジケータと共に入力する工程と、該デジタル表示を変換することによってイメージ情報の１つのピクセルがブロックによって示される工程と、該変換を平滑化する工程であって、該平滑化する工程が各「オフ」ピクセルの隣接する近接ピクセルをテストする工程と、該隣接する近接ピクセルが全て「オン」である場合、該「オフ」ピクセルの次の最近接ピクセルをテストする工程と、該次の最近接ピクセルのいずれかが「オフ」である場合、該ピクセルをオンにする工程と、を含む工程と、該平滑化された変換内に包囲物を位置づけし、該包囲物が空間的な境界を規定する工程と、該平滑化された変換をサイジングして選択されて消去された包囲物を得る工程と、該サイジングされた変換内の該消去された包囲物の全てを復元する工程と、該復元された包囲物変換を規格化することによって散在するマークが消去され、規格化されたイメージが形成される工程と、該規格化されたイメージを間引きする工程と、低密度空間マトリクス内に該間引きしたイメージを格納する工程と、該間引きしたイメージに重要な特徴を位置づける工程と、該重要な特徴の位置を量子化する工程と、該量子化された値を検索キーとして用いてデータベース検索を行い、該検索キーに関連する暗号を確認する工程と、を含む方法。