JP2001506383A - ピクセルマトリクス上で文字認識を実行する方法 - Google Patents

ピクセルマトリクス上で文字認識を実行する方法

Info

Publication number
JP2001506383A
JP2001506383A JP51290998A JP51290998A JP2001506383A JP 2001506383 A JP2001506383 A JP 2001506383A JP 51290998 A JP51290998 A JP 51290998A JP 51290998 A JP51290998 A JP 51290998A JP 2001506383 A JP2001506383 A JP 2001506383A
Authority
JP
Japan
Prior art keywords
pixels
pixel
image
row
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP51290998A
Other languages
English (en)
Inventor
エル. トンプソン,アーチー
サウン,リチャード エイ. ヴァン
Original Assignee
ファックストリーブ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファックストリーブ,インコーポレイテッド filed Critical ファックストリーブ,インコーポレイテッド
Publication of JP2001506383A publication Critical patent/JP2001506383A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Holo Graphy (AREA)

Abstract

(57)【要約】 文字認識は、3つの特徴組を用いる独自の記述によって暗号を分類する事によって成立される。本発明のプロセスにおいて、暗号の元のイメージを低密度空間のピクセルマトリクスに収まるように拡大または縮小する事によってラインを位置づけする。イメージはラインを規定するように間引きされるが(32)暗号の独自性を与えるラインを消さないようにする。暗号が一旦間引きされると、直交座標システムで各ラインの座標組を規定するようにファジー論理が用いられる。全てのラインが位置づけられたあと、各ラインの終点が位置づけられ、交差点が位置づけられる(44)。これら3つの特徴組は符号化され、64ビット整数などの3つの値が得られる(50)。これら3つの整数は、知られている文字の整数組を含むリレーショナルデータベースを照会する検索キーとして用いられる(53)。

Description

【発明の詳細な説明】 ピクセルマトリクス上で文字認識を実行する方法 発明の背景 本発明は、パターンおよび暗号の認識に関し、特に手書きの文字がデジタル化 され、低密度空間のピクセルマトリクスの形状で示される場合のオフライン技術 による、線に基づいた文字の認識に特に関する。低密度マトリクスとは、占有さ れたまたはノン−ヌル(non-null)のセルが比較的少ないマトリクスを意味する。 公知のシステムは、高い正確さで任意の言語の手書き文字を読むことを請求し ているが、実際に使用するとこのような製品がより低い正確さしか達成しないこ とを示す。正確さを改善する試みが成されているが、これにはコンピュータによ る認識を単純化するために書き手が不自然な方法で書くことが必要である(例え ば、標準的アルファベットが変更されているドットをつなぐ仕組みおよび方法) 。 公知の仕組みの別の問題は、文字がオフラインで読まれるとき、インチ毎に2 00ドットの最小解像度を有する要件である。文字がオンラインで読まれる場合 、アルゴリズムは文字が所定のストローク順序によって形成されていることを期 待する。公知の方法は、典型的に文字セットに敏感である。例えば、英語のアル ファベットの文字を認識するように設計された方法は、アジアの観念形態の文字 を読む場合に正確さが低くなる。最後に、処理後辞書において単語を一致させる ことに依存して認識の正確度を改善する公知の方法がある。しかし、文字が単語 を形成しない分野である場合(例えば、注文書のシリアル番号または一部が番号 である場合)、辞書方法は無用になる。 発明の要旨 本発明によると、パターン認識、特に文字認識は3つの特徴組を用いる独特の 記述(description)によって暗号を分類することによって成立する。この特徴組 は、暗号を形成するラインの種類および位置、ラインそれぞれの終点の位置、お よびラインの交差位置を確認する。本発明によるプロセスにおいて、ラインは暗 号の元のイメージを拡大するか収縮することによって低密度空間ピクセルマトリ クスに合致するために位置づけされる。次いで、イメージはラインを規定するた めに暗号に独自性を与えるラインを消滅させないように細められる。 暗号が一旦細められると、ファジー論理が用いられ、各ラインをx−y座標の システムに関して「位置づけする」、すなわち、各ラインに対して座標の組を規 定する。(各ラインが位置づけされると、残りのラインを位置づけするのを容易 にするために各ラインはマトリクスイメージから除去される。)全てのラインが 位置づけされた後、各ラインの終点が位置づけされ、交差点が位置づけされる。 これらの3つの特徴組は符号化され、64ビット整数などの3つの値になる。そ の後、これら3つの整数は、検索キーとして用いられ、知られている文字に対す る整数組を含むリレーショナルデータベースを照会する。直接一致が見つからな い場合、マッチングアルゴリズムは部分的一致を用いて正確な文字を推定する。 マトリクスが低密度なので、正確な文字を識別する可能性は高まる。 本発明は、添付の図面と共に以下の詳細な説明を参照することによってより良 く理解される。 図面の簡単な説明 図1は、本発明によるプロセスのフローチャートをである。 図2A、2B、2Cは共に、間引きアルゴリズム(thinning algorithm)のフロ ーチャートである。 図3A、3B、3Cは共に、特徴を発見するアルゴリズムのフローチャートで ある。 図4A、4B、4C、4Dは共に、ライン区画を得るアルゴリズムのフローチ ャートである。 図5A、5B、5C、5Dは共に、ラインタイプを得るアルゴリズムのフロー チャートである。 図6は、交差点を発見するアルゴリズムのフローチャートである。 図7は、終点を発見するアルゴリズムのフローチャートである。 図8は、有効なラインを発見するアルゴリズムのフローチャートである。 図9A、9B、9Cは共に、量子化アルゴリズムのフローチャートである。 図10は、8個の最近接ピクセルの規定を示す図である。 図11は、48個の最近接ピクセルの規定を示す図である。 図12は、下から6個の最近接ピクセルの規定を示す図である。 図13は、上から6個の最近接ピクセルの規定を示す図である。 図14は、12個の最近接ピクセルの規定を示す図である。 図15は、オフにされるピクセルを示す図である。 図16は、上部ギャップ閉鎖のピクセルを示す図である。 図17は、異質性の上行を示す図である。 図18は、骨格ピクセルを位置づけするためのパターンの一致を示す図である 。 図19は、ラインセグメント偏差を示す図である。 図20は、ギャップの埋め込みを示す図である。 図21A、21B、21Cは、3つのファジー論理表である。 具体的な実施形態の詳細な説明 本発明のプロセスは、図1から始まるフローチャートを参照して最も良好に説 明される。プロセスには5つの入力パラメータがあり、それぞれプロセスの工程 で示している。第1のパラメータは、情報のブロックのアレイであり、これは、 典型的にバイトでイメージ10のデジタル表示である。ここで、各バイトは8ビ ット長である。第2の入力パラメータは、文字イメージ12のピクセルを示すビ ットの数である。イメージが元来白黒である場合、ビットのピクセルに対する比 (bpr)は1になる。第3の入力パラメータは文字イメージ14の行に含まれ るピクセルの数である。第4の入力パラメータは、文字イメージ16に含まれる 行の数である。第5のパラメータは、行がバイト境界18上で始まるかどうかを 示す。行がバイト境界で始まる場合、第5のパラメータは1に設定され、それ以 外はパラメータがゼロに設定される。 認識プロセスにおける第1の工程は、入力アレイをアンパックするので1つの バイトなどの1つのブロックが1つのピクセル20を以下のように表示する:b prが1に等しいとき、入力アレイの各ビットは別々に検査される。ビットが1 に等しいとき、第2のアレイ(A2)の対応バイトは1に設定され、それ以外で は対応バイトはゼロに設定される。bprが1を上回るとき、ビットはbprに 等しい分類で検査される。分類内のビットは共に論理的ORされる。このORの 結果が1に等しいとき、A2内の対応バイトは1に設定される;それ以外は、そ れはゼロに設定される。 その後、イメージは38×18のマトリクスに合うように縮小される。イメー ジが最初から38×18より小さな場合は、イメージの縮小は必要ではない。イ メージの縮小は、まず、走査プロセス22中に接触し、得たギャップを削除する ことによってイメージを平滑化(smoothing)する。ピクセルを表示する各バイト は、個別に検査される。バイトが1に等しい場合、対応ピクセルは「オン」であ るとみなされ、次のバイトが検査される。バイトがゼロに等しい場合、対応ピク セルは「オフ」であると見なされる。値A2(xn,ym)が問題のピクセルを 表示し、A2(xn,ym)=0である場合、次のピクセルが検査される(図1 0に示すように8個の最近接ピクセル): A2(xn−1、ym−1) A2(xn、ym−1) A2(xn+1、ym−1) A2(xn−1)ym) A2(xn+1、ym) A2(xn−1、ym+1) A2(xn、ym+1) A2(xn+1、ym+1) これらのピクセルのいずれかがオフである場合、A2(xn,ym)=0は有 効であるとみなされる。これらのピクセルの全てがオンである場合、48個の最 近接ピクセルが検査される(図11を参照)すなわち、以下のピクセルが検査さ れる: A2(xn−3、ym−3) A2(xn+3、ym+1) A2(xn−2、ym−3) A2(xn−3、ym+2) A2(xn−1、ym−3) A2(xn−2、ym+2) A2(xn、ym−3) A2(xn−1、ym+2) A2(xn+1、ym−3) A2(xn、ym+2) A2(xn+2、ym−3) A2(xn+1、ym+2) A2(xn+3、ym−3) A2(xn+2、ym+2) A2(xn−3、ym−2) A2(xn+3、ym+2) A2(xn−2、ym−2) A2(xn−3、ym+3) A2(xn−1、ym−2) A2(xn−2、ym+3) A2(xn、ym−2) A2(xn−1、ym+3) A2(xn+1、ym−2) A2(xn、ym+3) A2(xn+2、ym−2) A2(xn+1、ym+3) A2(xn+3、ym−2) A2(xn+2、ym+3) A2(xn−3、ym−1) A2(xn+3、ym+3) A2(xn−2、ym−1) A2(xn+2、ym−1) A2(xn+3、ym−1) A2(xn−3、ym) A2(xn−2、ym) A2(xn+2、ym) A2(xn+3、ym) A2(xn−3、ym+1) A2(xn−2、ym+1) A2(xn+2、ym+1) 上述のピクセルの1つがオフである場合、A2(xn、ym)=0は無効であ るとみなされ、A2(xn、ym)が1に等しく設定される。上述のピクセルの 全てがオンである場合、A2(xn、ym)=0は有効であるとみなされる。 イメージが平滑化された後、各「包囲物(enclosure)」の位置が24で見られ る。「包囲物」は、オンである連続したピクセルの組によって完全に包囲されて いる、オフである連続したピクセルの組として規定される。すなわち、包囲物は 境界を規定する。各包囲物の境界ピクセルの位置は、アレイに保存される。 包囲物が一旦確認されると、イメージは26でサイジングされる。イメージの 水平方向の長さ(^x)およびイメージの垂直方向の長さ(^y)が演算される 。x方向の約数(x_div)が^x/37に等しく、y方向の約数(y_di v)が^y/17に等しくなるように次の約数が計算される。次いで、アレイA 2の(x、y)にあるピクセルが減少アレイ(A3)において(x’、y’)に あり、ここでx’=x/x_divでありy’=y/y_divであるように、 対応が確立される。A2(x1、y1)、A2(x2、y2)、・・・、A2( xn,yn)==>A3(x’,y’)などの条件が生じた場合、A3(x’、 y’)の値は論理または[A2(x1,y1)、A2(x2,y2)、・・・、 A2(xn,yn)]に設定される。 次に、各包囲物の境界が再検査される。各包囲物の境界は、A3において点に 変換される。包囲物の点の全てがA3でオンである場合、変換された包囲物の中 心が演算され、ゼロに設定される。よって、減少によって消去された包囲物はい ずれも28で復元される。 イメージは、規格化プロセス30を通過する準備ができている。規格化プロセ スでは散在するマーク(mark)に属するピクセルを消去する。規格化プロセスは 、意図的な標準が1ピクセルより大きな幅(>.1mm)を有するという仮定に 基づく。規格化プロセス中は、確立された規則に従う。 1.イメージの上行にあるピクセルがオンであり、下部の6個の近接ピ クセルが全てオフである場合、ピクセルはオフにされる。(図12を参照) 2.イメージの上行にあるピクセルがオフであり、両側のピクセルがオ ンである場合、ピクセルはオンにされる。 3.ピクセルはオンであるが、イメージの上行または下行になく、上部 の6個の近接ピクセルがオフである場合、ピクセルはオフにされる(図13を参 照)。 4.イメージの下行にあるピクセルがオンであり、上部の6個の近接ピ クセルが全てオフである場合、ピクセルはオフにされる。 5.イメージの下行にあるピクセルがオフであり、両側のピクセルがオ ンである場合、ピクセルはオンにされる。 6.ピクセルがオンであるが、上行または下行になく、最初または最後 の列にもなく、上部の6個の近接ピクセルまたは下部の6個の近接ピクセルが全 てオフである場合、ピクセルはオフにされる。 7.ピクセルがオフであるが、包囲物の一部ではなく、12個の最近接 ピクセルがオンである場合、ピクセルはオンにされる。(図14を参照) 8.ピクセルがオンであり、8個の最近接ピクセルの内2つ未満がオン である場合、ピクセルはオフにされる(図15を参照)。 9.行がすぐ上または下の空白行によってイメージから分離されている 場合、行は削除される。 10.オンである同一の行中の連続したピクセルの組として行セグメン トを規定する。オフである同一の行中の連続したピクセルの組として行ギャップ を規定する。イメージの最初の3つの行のそれぞれがギャップを1つだけ含み、 各ギャップが次の行のギャップの直ぐ上になり、各ギャップは次のギャップより 長さが短く、上行のギャップが5ピクセル長未満である場合、上ギャップにある ピクセルはオンにされる(図16を参照)。 11.上行の行セグメントが5ピクセル長未満であり、それが次の行の 行セグメントに隣接しており、行セグメントの開始列が隣接した行セグメントの 開始列の右にあり、行セグメントの終了列が隣接した行セグメントの終了列の左 にある場合、行セグメントは削除される(図17を参照)。 12.下部行の行セグメントが5ピクセル長未満であり、前の行の行セ グメントに隣接しており、行セグメントの開始列が隣接した行セグメントの開始 列の右にあり、行セグメントの終了列が隣接した行セグメントの終了列の左にあ る場合、行セグメントは削除される。 イメージが一旦規格化されると、イメージ全体は左に移動するので、イメージ の第1の非空白列がゼロ列から開始する。イメージは32で間引かれる。間引き は、無関係なピクセルをイメージから除去するので基本的な骨格イメージのみが 残る。骨格イメージで認識を行うことによって、様々なストロークの幅およびサ イズによる認識の誤りが排除される。間引きアルゴリズムは、Theo Pavlidisの 研究に基づく。図2A、2B、2Cは、本明細書中で用いられるアルゴリズムの 詳細なフローチャートであり、これは自明である。Pavlidisによって与えられる アルゴリズムは、場合によっては英数文字の重要な特徴が失われる原因になる。 特徴の損失を回避するために、本明細書中に開示されるように、大きな改変がア ルゴリズムに成された。改変アルゴリズムの重要な局面および工程は以下に示す 通りである: 1.イメージは、削除するピクセルについて一度に1エッジずつ検査さ れる。ピクセルは、右側から開始して上、左側、および下と順番に続いて検査さ れる。 2.各検査中、ピクセルは、ピクセルおよびその8個の最近接ピクセル を所定のパターン組と比較することによって骨格ピクセルであるか判定される( 36)。ピクセルおよびその近接ピクセルがパターンのいずれかに一致する場合 、ピクセルは骨格であると言える。ピクセルおよびその近接ピクセルを比較する 対象となる12のパターンがある(図18を参照)。 3.1つの行のピクセルが検査された後、それらは再検査され、行内の 行セグメントのいずれかが骨格であるかどうか判定する。行セグメントが3ピク セルより長く(40)、行中で行セグメントのすぐ上および下にあるピクセルが オフである場合(38)、行セグメント中のすべてのピクセルは骨格であるとみ なされる(42)。 4.各エッジの処理の最後で、垂直ラインが検査され、垂直ラインが誤 って削除されないように保証する。ラインが2行分より長く、2ピクセルの幅を 上回らない場合、ラインは骨格であるとみなされる。 5.各エッジの処理が完了した後、検査されたエッジ上のピクセルであ って、骨格でないものはゼロに設定される。 6.処理全体はイメージが骨格ピクセルのみを含むようになるまで繰り 返される。 7.骨格イメージのエッジがライン約数、すなわち、行セグメントまた はラインセグメントから出た1つのピクセルによって移動されたピクセルについ て検査される(図19を参照)。このようなピクセルは、列またはラインセグメ ントとの配列に戻される。 8.骨格イメージは、行セグメントについて走査される。この行セグメ ントは、単一の行セグメントを形成するためにに前または後の行のいずれかの中 で2つの行セグメントの間のギャップに移動され得る。上述の基準を満たすこと に加えて、行セグメントが移動されるには、行セグメントは対角線の一部であっ てはならず、行セグメントの動きは空白ラインがイメージの最上または底にない 限り、空白ラインを形成できない(図12を参照)。 9.イメージは、移動され、縮小/拡大されるので、低密度空間(20 ×12)マトリクスに正確に合致する。 間引きの後、イメージは特徴について検査される(44)(図3A、3B、3 Cを参照)。検査される最初の特徴は水平ラインである。水平ラインはイメージ 中の行セグメントのすべての平均長と同じ長さ、またはそれより長い行セグメン トとして規定される。プロセスは、各行を行セグメントについて走査することで 開始される。行セグメントが発見された場合、セグメントの長さ、行、開始列、 および終了列が表に記録される(46)。全ての行が走査された後、表は長さの 降順で格納される(48)。各行セグメントの長さは加算されて合計を出す。最 長の長さと最短の長さを合計から減算する。次いで、合計は行セグメントの合計 数から2を引いた数によって除算され、平均長を決定する(51)。平均長が4 ピクセル長未満である場合(52)、平均長は3の値を割り当てられる(54) 。平均長を3に強いることによって、何も存在しない所で水平ラインを発見する 可能性が排除される。 格納された水平表が次に処理される。各入力項目の長さが平均長に対して点検 される(56)。入力項目の長さが平均長以上である場合、入力項目は接続性に 対して検査される。行セグメントが平均以上の長さのより小さな行セグメントに 隣接する(上または下)場合、第2の行セグメントは第1のセグメントの一部で あると言われる。この行セグメントの連鎖は、隣接した行セグメントがなくなる まで、または1つ以上の隣接した行セグメントがあるまで、または行セグメント の開始列が前の行セグメントの開始列と順序が狂うまで続けられる。 S0,S1,S2,およびS3が行セグメントゼロ、行セグメント1、行セグ メント2、行セグメント3それぞれの開始列を示すとする。S0>=S1>=S 2およびS2<S3であるか、またはS0<=S1<=S2およびS2>=S3 である場合、S3は順序が狂っていると言える。連鎖における行セグメントの数 が3を上回る場合、連鎖は垂直/対角として処理される。連鎖における行セグメ ントの数が3以下である場合、連鎖は平行として処理される。平行処理を終了さ せるために、連鎖の開始および終了行ならびに連鎖の開始および終了列は「発見 された特徴」の表に記録される。間引きされたイメージが保存された後、連鎖は イメージから消去される、すなわち、連鎖におけるピクセルの全てはゼロに設定 される。 次に、部分的に消去されたイメージが垂直/対角ラインについて検索される。 行セグメントの連鎖は上述と同一の方法で発見される。垂直の長さが3行以上で ある連鎖のみが用いられる。有効な連鎖が一旦発見されると、連鎖が垂直である か、または対角であるのかについて判定されなくてはならない。この判定は、フ ァジー論理を用いて成される(図4および5を参照)。ラインタイプを決定する ために連鎖の3つの構成要素が検査される。3つの構成要素とは、ラインの傾斜 と、2つの行の間での水平方向の最大変化(最大デルタx)と、水平方向に変化 のない連続行の最大数を垂直方向の合計変化で除算した数(ゼロ傾斜)とである 。演算された値に基づいて、各構成要素は0.1から1.0の間の値に割り当て られる。図21、21B、および21Cにおける表は、構成要素の実際の値と割 り当てられた値の相関関係を示す。値が一旦割り当てられると、各構成要素値は 関連因数によって乗算される。傾斜およびゼロ傾斜に対して、関連因数は0.4 である。最大デルタxに対して、関連因数は0.2である。構成要素値が因数分 解された後、それらは共に加算される。(切り上げられた(as rounded))合計が 、0.5未満である場合、ラインは垂直であるとみなされる。合計が0.5以上 である場合、ラインは対角であるとみなされる。対角線に対して、開始列が次の 行のそれぞれで増加する場合、対角は左対角である。それ以外では、対角は右対 角である。垂直および対角の位置およびタイプが「発見された特徴」の表に記録 され、ラインがイメージから消去される。残りの行セグメントは接続ラインであ るとみなされる。行セグメントの位置は、「発見された特徴」の表に記録される 。 全てのラインが登録された後、交差点の検索が行われる(47)(図6を参 照)。交差点はラインセグメントの終点であり、別のラインセグメントの点に隣 接する。各終点の位置は「発見された特徴」の表に記録されているので、表を検 索してどの終点が他のラインセグメントと交差しているかを見つけるのは容易で ある。各交差点が発見されると、交差表に位置が記録される(図6を参照)。全 ての交差点が一旦発見されると、他のラインセグメントと交差しない終点の位置 が終点表に記録される(49)(図7を参照)。どれが誤ったストロークであり 得るかに過度の重点を置くことを回避するために、接続ラインの終点は交差点と してマーク(mark)され得る。しかし、接続ラインの終点は終点表には記入され ない。 プロセスのこの時点で、文字を確認するのに必要な情報が収集された。しかし 、この情報は、効率的なデータベース検索を可能にするために量子化されなけれ ばならない(50、図1)。量子化は特徴、交差点、および終点に数値を割り当 てる事によって成される(50)(図9A、9B、9Cを参照)。特徴に対して 、水平ラインがイメージの上4行にある場合、1の値を割り当てられる。それが 中間の4つの行にある場合、16の値が割り当てられる。水平ラインが下の4つ の行にある場合、256の値を割り当てられる。垂直ラインが左の6列にある場 合、4096の値が割り当てられる。これが中間の8列にある場合、65536 が割り当てられる。垂直ラインが右の6列にある場合、1048576の値が割 り当てられる。左対角は16777216の値が割り当てられ、右対角には26 8435456の値が割り当てられる。接続ラインはヌル値を割り当てられる。 特徴に対する値は加算され、合計が特徴値(FV)として保存される。終点(E V)および交差点に対す値は同一の方法で計算される。 次に、対角ラインの位置は、更に量子化され、1つ以上の同−FV、EV、I Vの値が割り当てられたときに文字選択を援助する。まず、各対角は、水平およ び垂直位置に基づく8進数を割り当てられる。左対角の全てに対する値は、64 ビット整数に置かれる(LV)。右対角の全てに対する値は、第2の64ビット 整数に置かれる(RV)。各値が正確な整数へと加算される前に、整数は64で 乗算され、新しい値に対して場所を与えるために、整数を効率的に5ビット分移 動する。方法は、12個の右対角および12個の左対角を考慮する。ほとんどの 場合では、いかなる文字の組における記号も12個を超える任意の1種類の対角 を有さない。このような場合が生じた場合、第2の整数の組がオーバーフローを 適応させるために用いられる。 プロセスの次の工程は動作モードのタイプに依存する。トレーニングモードで 動作しているとき、FV、EV、IV、LVおよびRVの値とともにリレーショ ナルデータベースに文字が追加される。文字認識のこの方法はコンテクストに敏 感でないので、1以上の言語からの文字が同一のデータベースにロードされ得、 同一のデータベースから1つ以上の言語が認識されることを可能にする。データ ベースはまた、タイプされたフォントなどの視覚文字認識を可能にするように構 築される。なぜなら、本発明の根底にある原理は手書き文字の認識に限定されな いからである。 文字認識モードで動作しているとき、データベース検査を行い、イメージを確 認する(53)。データベースはFV、EV、およびIVの値をキーとして用い て照会される。全ての3つのキーに対応する独特の文字がある場合、文字は未知 のイメージの解釈として戻される。1つ以上の文字が3つのキーの全てに対応す ることが分かった場合、LVおよびRVの値をキーリストに追加して第2の照会 が成される。5つのキー全てに対応する独特の文字がある場合、文字は戻される 。独特の文字がみつからない場合、記号(通常「?」であるが、いかなる文字で あってもよい)がユーザに戻され、文字が未知であることが示される。 最初の3つのキーの照会に応答して、文字が発見されなかった場合、「高確率 」解答を決定するために一連の照会が成され得る。照会の数はユーザによって決 定される。より多くの照会が成されると、文字が見つかる確率が高まる。しかし 、より多くの照会を行うことによって、間違った文字が選択される確率も高まる 。最初の照会の組は、FVおよびEVをキーとして成される照会である。これら の照会のそれぞれに対して、FVは、垂直ラインの1つが実際は対角である場合 の値または対角ラインの1つが実際は垂直である場合の値を反映するように変更 される。これらの置換は、文字の傾斜が書き手によって変動するという事実に基 づく。よって、完璧に形成された文字において垂直のラインが実際には対角に見 えたり、その逆であったりする。この照会の間、特定の文字が検索キーに一致 した回数のカウントが保たれる。一連の照会の最後で、文字カウントが他の文字 カウントの全てより少なくとも2つ上回る場合、文字が戻される。それ以外では 次の一連の照会が実行される。 次の一連はFVのみをキーとして用いる照会で開始する。この照会から1文字 のみが戻された場合、その文字がユーザに戻される。1つ以上の文字が戻された 場合、各文字は表に入力される。照会から文字が全く戻されない場合、表は空で 残される。次の照会はEVのみを検索キーとして用いる。表が空の場合、見つけ られた文字が表に入力される。表が空でない場合、表中の文字が照会から戻され た文字と比較される。表中の文字が照会結果にない場合、文字は表から消去され る、すなわち、論理的「AND」が表中の文字および照会から戻された文字を用 いて遂行される。処理の終わりで表中に独特の文字が残る場合、その文字は戻さ れる。 表中に文字が残らない場合、「未知文字」の記号が戻される。表中に1つ以上 の文字が残るか、照会の返答が空である場合、次の照会が実行される。その後、 次の照会は検索キーとしてIVのみを使用する。その後、前のプロセスがこの照 会の結果に対して繰り返される。独特の文字が発見されない場合、プロセスは以 下のキーの組合せを用いて繰り返される: 1.FVおよびIV 2.EVおよびIV 3.FVおよびEV この時点で、独特の文字が発見されない場合、FVおよび各表の入力項目を検 索キーとして用いて照会が成される。表からの各文字の回数は、所与のFV値と 共にデータベースにあり、それは照会の結果である。文字に対するカウントが他 の文字より5上回る場合、文字は戻される。 本発明を具体的な実施形態を参照にして説明した。他の実施形態は、当業者に は明らかである。例えば、本発明は文字認識、特に手書き文字のコンテクストで 開示されたが、本発明の技術はピクセルに減少され、キーが指示され得る情報を 含む他のパターンの認識にも応用を見い出してもよい。よって、本発明は添付の 請求の範囲に示される以外で限定されることは意図されない。

Claims (1)

  1. 【特許請求の範囲】 1.暗号を認識する方法であって、該方法が 暗号のデジタル表示を、該デジタル表示のビットに対するピクセルの比と、該 デジタル表示の行毎のピクセルの数と、該デジタル表示中の行の数と、および該 デジタル表示のブロック境界条件を示すインジケータと共に入力する工程と、 該デジタル表示を変換することによってイメージ情報の各個別ピクセルがアド レス可能なデータブロックによって示される工程と、 該変換を平滑化する工程と、 該平滑化された変換内の包囲物を位置づけする工程であって、該包囲物が空間 的な境界を規定している工程と、 該平滑化された変換をサイジングして、選択されて消去された包囲物を得る工 程と、 該サイジングされた変換内の該消去された包囲物のすべてを復元する工程と、 該復元された包囲物変換を規格化することによって散在するマークが消去され 、規格化されたイメージが形成される工程と、 該規格化されたイメージを間引きする工程と、 低密度空間マトリクス内に該間引きしたイメージを格納する工程と、 該間引きしたイメージに重要な特徴を位置づける工程と、 該重要な特徴の位置を量子化する工程と、 該量子化された値を検索キーとして用いてデータベース検索を行い、該検索キ ーに関連する暗号を確認する工程と、を含む方法。 2.暗号を認識する方法であって、該方法が 暗号のデジタル表示を、該デジタル表示のビットに対するピクセルの比と、該 デジタル表示の行毎のピクセルの数と、該デジタル表示中の行の数と、および該 デジタル表示のブロック境界条件を示すインジケータと共に入力する工程と、 該デジタル表示を変換することによってイメージ情報の1つのピクセルがブロ ックによって示される工程と、 該変換を平滑化する工程であって、該平滑化する工程が 各「オフ」ピクセルの最近接の8個のピクセルをテストする工程と、 該最近接の8個の近接ピクセルが全て「オン」である場合、該「オフ」ピクセ ルの最近接の48個のピクセルをテストする工程と、 該最近接の48個のピクセルのいずれかが「オフ」である場合、該ピクセルを オンにする工程と、を含む工程と、 該平滑化された変換内に包囲物を位置づけし、該包囲物が空間的な境界を規定 する工程と、 該平滑化された変換をサイジングして選択されて消去された包囲物を得る工程 と、 該サイジングされた変換内の該消去された包囲物の全てを復元する工程と、 該復元された包囲物変換を規格化することによって散在するマークが消去され 、規格化されたイメージが形成される工程と、 該規格化されたイメージを間引きする工程と、 低密度空間マトリクス内に該間引きしたイメージを格納する工程と、 該間引きしたイメージに重要な特徴を位置づける工程と、 該重要な特徴の位置を量子化する工程と、 該量子化された値を検索キーとして用いてデータベース検索を行い、該検索キ ーに関連する暗号を確認する工程と、を含む方法。 3.前記包囲物を位置づけする工程が、 オフである近接するピクセルの少なくとも1対の組を位置づける工程と、 該オフピクセルを包囲し、オンである、ピクセルの組をテストする工程と、 該オフピクセルの位置を記録する工程と、を含む、請求項1に記載の方法。 4.前記サイジング工程が、 水平因数を計算する工程と、 垂直因数を計算する工程と、 前記平滑化された変換内の各ピクセルに対して該水平因数と該垂直因数に基づ いて新しい水平および垂直位置を計算する工程と、を含む、請求項1に記載の方 法。 5.前記復元する工程が、 復元されたイメージ内の包囲物の好ましい位置を計算する工程と、 該好ましい位置をテストして、該包囲物が該好ましい位置にあるかどうかを決 定する工程と、 該包囲物が存在しない場合、該包囲物を復元する工程と、を含む、請求項1に 記載の方法。 6.前記規格化する工程が、 前記復元されたイメージの最上行にある対象ピクセルがオンであるかどうかテ ストする工程と、 該対象ピクセルがオンである場合、最近接の6個の下部のピクセルをテストす る工程と、 該下部の6個の近接ピクセルのすべてがオフである場合、該最上行の該対象ピ クセルをオンにする工程と、を含む、請求項1に記載の方法。 7.前記規格化する工程が、 前記復元されたイメージの最上行にある対象ピクセルがオフであるかどうかテ ストする工程と、 該対象ピクセルがオフである場合、該対象ピクセルの両側に隣接する該ピクセ ルをテストする工程と、 該両側のピクセルがオンである場合、該対象ピクセルをオンにする工程と、を 更に含む、請求項1に記載の方法。 8.前記規格化する工程が、 前記復元されたイメージの最上行以外の行のいずれかにある対象ピクセルがオ ンであるかどうかテストする工程と、 該対象ピクセルがオンである場合、最近接の上部6個のピクセルをテストする 工程と、 該最近接の上部6個のピクセルがオフである場合、該対象ピクセルをオフにす る工程と、を更に含む、請求項1に記載の方法。 9.前記規格化する工程が、 前記復元されたイメージの底部行にある対象ピクセルがオフであるかどうかテ ストする工程と、 該対象ピクセルがオフである場合、該対象ピクセルに隣接する側面ピクセルを テストする工程と、 該両側のピクセルがオンである場合に該対象ピクセルをオンにする工程と、を 更に含む、請求項1に記載の方法。 10.前記規格化する工程が、 前記復元されたイメージの最上または底部行以外の行いずれかにある対象ピク セルがオンであり、該復元されたイメージの最初または最後の列にないかどうか をテストする工程と、 該対象ピクセルがオンである場合、上部6個の最近接ピクセルと底部6個の最 近接ピクセルとをテストする工程と、 該上部6個の近接ピクセルまたは該底部6個の近接ピクセルが全てオフである 場合に該対象ピクセルをオフにする工程と、を更に含む、請求項1に記載の方法 。 11.前記規格化する工程が、 対象ピクセルが包囲物の一部であるかテストする工程と、 該ピクセルが包囲物の一部でない場合に該対象ピクセルがオフであるかどうか テストする工程と、 該ピクセルがオフである場合、前記12個の最近接ピクセルをテストする工程 と、 該12個の最近接ピクセルが全てオンである場合、該対象ピクセルをオンにす る工程と、を更に含む、請求項1に記載の方法。 12.前記規格化する工程が、 前記対象ピクセルがオンであるかどうかテストする工程と、 該対象ピクセルがオンである場合、最近接の8個のピクセルをテストする工程 と、 該最近接の8個のピクセルのうち2個未満がオンである場合、該対象ピクセル をオフにする工程と、を更に含む、請求項1に記載の方法。 13.前記規格化する工程が、 空白条件に対してテストする工程であって、該空白条件は前記復元されたイメ ージ内の空白でない行が2つの空白行の間にある工程と、 該空白条件があてはまる場合、該空白でない行および該2つの空白行を削除す る工程と、を更に含む、請求項1に記載の方法。 14.前記規格化する工程が、 前記復元されたイメージの第1行、第2行、および第3行内のギャップをテス トする工程と、 該ギャップが存在し、行毎に1つのみのギャップがある場合、該各ギャップの 長さを演算する工程と、 該ギャップが次のギャップのすぐ上にあり、該長さが上から下に向かって増加 していき、最上ギャップの長さが5ピクセル未満である場合、第1行内にあるギ ャップを埋める工程と、を更に含む、請求項1に記載の方法。 15.前記規格化する工程が、 最上行の最上行セグメントの最上行セグメントの長さをテストする工程と、 該最上行セグメントの長さが5未満である場合、該最上行の該最上行セグメン トの直ぐ下にある次の行セグメントの該次の行セグメントの長さをテストする工 程と、 該最上行セグメントの長さが5を上回り、該次の行セグメントが該最上行セグ メントの完全に下になっている場合、該最上行セグメントを削除する工程と、を 更に含む、請求項1に記載の方法。 16.前記規格化する工程が、 底部行にある底部行セグメントの底部行セグメントの長さをテストする工程と 、 該底部行セグメントの長さが5未満である場合、該底部行にある該底部行セグ メントのすぐ上にある前の行セグメントの該前の行セグメントの長さをテストす る工程と、 該底部行セグメントの長さが5を上回り、該前の行セグメントが該底部行セグ メントの完全に上にある場合、該底部行セグメントを削除する工程と、を更に含 む、請求項1に記載の方法。 17.前記間引き工程が、 骨格ピクセルのために前記イメージのエッジを一度に1つのエッジずつ検査す る工程と、 その後、 骨格でないピクセルを削除する工程と、 該骨格ピクセルのみが残るまでプロセスを繰り返す工程と、 単一のサイズのマトリクスに収まるように、最後の骨格イメージを縮小する工 程と、を含む、請求項1に記載の方法。 18.前記検査する工程が、 各エッジピクセルとその8個の最近接ピクセルとを比較して、12のパターン に設定する工程と、 該エッジピクセルおよび該8個の最近接ピクセルが該パターンのいずれかに一 致した場合、各該エッジピクセルを骨格としてマークする工程と、を含む、請求 項17に記載の方法。 19.前記検査する工程が、 3ピクセルより長い行セグメントを捜すために各行を検索する工程と、 3ピクセルの行セグメントが存在する場合、該3ピクセル行セグメントの直ぐ 上または下のピクセルを検査する工程と、 3ピクセルの行セグメントの位置が空白である場合、該3ピクセルの行セグメ ントの位置にある全てのピクセルを骨格としてマークする工程と、を更に含む、 請求項17に記載の方法。 20.前記検査する工程が、 垂直ラインを検査する工程と、 該垂直ラインが2行分より長く、3ピクセルの幅未満である場合、該垂直ライ ンを骨格としてマークする工程と、を更に含む、請求項17に記載の方法。 21.前記位置づける工程が、 前記イメージ中の全ての行セグメントに渡って平均の長さを演算する工程と、 該平均の長さより長さが大きい行セグメントを走査する工程と、 平均より大きい長さの該行セグメントを行セグメント連鎖について走査する工 程と、 該行セグメント連鎖の位置および長さを記録する工程と、 ファジー論理を用いて該行セグメント連鎖が示すラインのタイプを決定する工 程と、 該イメージから該行セグメント連鎖を削除する工程と、 残りのイメージを垂直ラインに対して検査する工程と、 ファジー論理を用いて該垂直ラインが垂直であるか対角であるかを判定する工 程と、 該ラインの位置、長さ、およびタイプを記録する工程と、 該イメージから該ラインを消去する工程と、 残りの行セグメントを位置づける工程と、 該行セグメントの位置を記録する工程と、 全ての交差点の位置を演算する工程と、 該点を記録する工程と、 全ての終点の位置を演算する工程と、 該点を記録する工程と、を含む、請求項1に記載の方法。 22.前記量子化する工程が、 各特徴のx−y座標位置に基づいて、該各特徴に数値を割り当てる工程と、 ラインタイプについての該数値を合計する工程と、 終点についての該数値を合計する工程と、 交差点についての該数値を合計する工程と 右対角についての該数値を合計する工程と、 左対角についての該数値を合計する工程と、を含む、請求項1に記載の方法。 23.リレーショナルデータベースに知られている暗号およびその量子化された 値を追加する工程を更に含む、請求項1に記載の方法。 24.暗号を認識する方法であって、該方法が 暗号のデジタル表示を、該デジタル表示のビットに対するピクセルの比と、該 デジタル表示の行毎のピクセルの数と、該デジタル表示中の行の数と、および該 デジタル表示のブロック境界条件を示すインジケータと共に入力する工程と、 該デジタル表示を変換することによってイメージ情報の1つのピクセルがブロ ックによって示される工程と、 該変換を平滑化する工程であって、該平滑化する工程が 各「オフ」ピクセルの隣接する近接ピクセルをテストする工程と、 該隣接する近接ピクセルが全て「オン」である場合、該「オフ」ピクセルの次 の最近接ピクセルをテストする工程と、 該次の最近接ピクセルのいずれかが「オフ」である場合、該ピクセルをオンに する工程と、を含む工程と、 該平滑化された変換内に包囲物を位置づけし、該包囲物が空間的な境界を規定 する工程と、 該平滑化された変換をサイジングして選択されて消去された包囲物を得る工程 と、 該サイジングされた変換内の該消去された包囲物の全てを復元する工程と、 該復元された包囲物変換を規格化することによって散在するマークが消去され 、規格化されたイメージが形成される工程と、 該規格化されたイメージを間引きする工程と、 低密度空間マトリクス内に該間引きしたイメージを格納する工程と、 該間引きしたイメージに重要な特徴を位置づける工程と、 該重要な特徴の位置を量子化する工程と、 該量子化された値を検索キーとして用いてデータベース検索を行い、該検索キ ーに関連する暗号を確認する工程と、を含む方法。
JP51290998A 1996-09-05 1997-09-05 ピクセルマトリクス上で文字認識を実行する方法 Pending JP2001506383A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/706,577 US5825923A (en) 1996-09-05 1996-09-05 Method for performing character recognition on a pixel matrix
US08/706,577 1996-09-05
PCT/US1997/015597 WO1998010369A1 (en) 1996-09-05 1997-09-05 Method for performing character recognition on a pixel matrix

Publications (1)

Publication Number Publication Date
JP2001506383A true JP2001506383A (ja) 2001-05-15

Family

ID=24838195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51290998A Pending JP2001506383A (ja) 1996-09-05 1997-09-05 ピクセルマトリクス上で文字認識を実行する方法

Country Status (7)

Country Link
US (1) US5825923A (ja)
EP (1) EP1010128B1 (ja)
JP (1) JP2001506383A (ja)
AT (1) ATE330290T1 (ja)
CA (1) CA2263734C (ja)
DE (1) DE69736134D1 (ja)
WO (1) WO1998010369A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6094484A (en) * 1996-10-16 2000-07-25 Convey Corporation Isomorphic pattern recognition
US6678681B1 (en) 1999-03-10 2004-01-13 Google Inc. Information extraction from a database
US7197174B1 (en) 1999-09-15 2007-03-27 Intel Corporation Magnetic ink encoding pen
US10063727B2 (en) * 2015-12-29 2018-08-28 Kabushiki Kaisha Toshiba Marking apparatus and decoloring apparatus
US10878271B2 (en) * 2019-03-19 2020-12-29 Capital One Services, Llc Systems and methods for separating ligature characters in digitized document images

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4132976A (en) * 1975-09-08 1979-01-02 Siegal Richard G Operator readable and machine readable character recognition systems
US4048615A (en) * 1976-06-04 1977-09-13 Recognition Equipment Incorporated Automated character recognition system
US4491960A (en) * 1982-04-05 1985-01-01 The United States Of America As Represented By The Secretary Of The Navy Handprinted symbol recognition system
US4891750A (en) * 1986-10-29 1990-01-02 Pitney Bowes Inc. Optical character recognition by forming and detecting matrices of geo features
FR2608295B1 (fr) * 1986-12-12 1989-03-31 France Etat Procede et dispositif de reconnaissance de caracteres
JP3017740B2 (ja) * 1988-08-23 2000-03-13 ソニー株式会社 オンライン文字認識装置およびオンライン文字認識方法
US4987603A (en) * 1988-09-22 1991-01-22 Glory Kogyo Kabushiki Kaisha Recognition method for letter patterns
US5235650A (en) * 1989-02-02 1993-08-10 Samsung Electronics Co. Ltd. Pattern classifier for character recognition
JPH03218589A (ja) * 1990-01-24 1991-09-26 Syst Yamato:Kk ファクシミリを利用したコンピュータ入力システム
CA2036974C (en) * 1990-02-26 1996-06-11 Masayuki Kimura Pattern recognition data processing device using an associative matching method
CA2037173C (en) * 1990-03-30 1996-01-09 Hirofumi Kameyama Character recognizing system
US5459796A (en) * 1990-10-22 1995-10-17 The Watt Stopper System for entering handwritten data into computer generated forms
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
US5307424A (en) * 1990-12-12 1994-04-26 Eberhard Kuehl Character recognition system
EP0508845B1 (en) * 1991-03-11 2001-11-07 Nippon Telegraph And Telephone Corporation Method and apparatus for image processing
US5313527A (en) * 1991-06-07 1994-05-17 Paragraph International Method and apparatus for recognizing cursive writing from sequential input information
US5267332A (en) * 1991-06-19 1993-11-30 Technibuild Inc. Image recognition system
US5325447A (en) * 1991-10-02 1994-06-28 Environmental Research Institute Of Michigan Handwritten digit normalization method
US5479533A (en) * 1992-02-28 1995-12-26 Yamatake-Honeywell Co., Ltd. Pattern recognition apparatus and method using fuzzy logic
US5319721A (en) * 1992-04-14 1994-06-07 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set
CA2097095A1 (en) * 1992-07-29 1994-01-30 Frank William Sinden Method of normalizing handwritten symbols
US5515455A (en) * 1992-09-02 1996-05-07 The Research Foundation Of State University Of New York At Buffalo System for recognizing handwritten words of cursive script
WO1994027251A1 (en) * 1993-05-18 1994-11-24 Massachusetts Institute Of Technology Automated reading system and method
US5454046A (en) * 1993-09-17 1995-09-26 Penkey Corporation Universal symbolic handwriting recognition system
US5438631A (en) * 1993-10-12 1995-08-01 Dai; Xiao-Wei Handwriting and character recognition system

Also Published As

Publication number Publication date
WO1998010369A1 (en) 1998-03-12
DE69736134D1 (de) 2006-07-27
EP1010128B1 (en) 2006-06-14
EP1010128A1 (en) 2000-06-21
ATE330290T1 (de) 2006-07-15
US5825923A (en) 1998-10-20
EP1010128A4 (en) 2000-06-21
CA2263734C (en) 2003-04-08
CA2263734A1 (en) 1998-03-12

Similar Documents

Publication Publication Date Title
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
US4408342A (en) Method for recognizing a machine encoded character
Kovalevsky Image pattern recognition
US4903312A (en) Character recognition with variable subdivisions of a character region
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
JP2694101B2 (ja) パターン認識と妥当性検査の方法及び装置
US5359671A (en) Character-recognition systems and methods with means to measure endpoint features in character bit-maps
JPH0778817B2 (ja) セルフクロッキング記号形状コードのビットマップ画像空間表現を復号する方法
US6185338B1 (en) Character recognition using candidate frames to determine character location
EP0810542A2 (en) Bitmap comparison apparatus and method
US5926564A (en) Character recognition method and apparatus based on 0-1 pattern representation of histogram of character image
US5825925A (en) Image classifier utilizing class distribution maps for character recognition
Wang et al. Chinese document image retrieval system based on proportion of black pixel area in a character image
JP2001506383A (ja) ピクセルマトリクス上で文字認識を実行する方法
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP3233803B2 (ja) 難読漢字検索装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2697790B2 (ja) 文字タイプ決定方法
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
Juan et al. Font recognition by invariant moments of global textures
EP0606519A2 (en) Apparatus for character segmentation and apparatus for character recognition using the same
CN115114471A (zh) 两种数据格式的核磁共振氢谱图检索方法
JPH0816725A (ja) 文字認識装置及び方法