JPH06510387A - 文字認識システムで用いる文字位置確認装置および方法 - Google Patents

文字認識システムで用いる文字位置確認装置および方法

Info

Publication number
JPH06510387A
JPH06510387A JP5505375A JP50537593A JPH06510387A JP H06510387 A JPH06510387 A JP H06510387A JP 5505375 A JP5505375 A JP 5505375A JP 50537593 A JP50537593 A JP 50537593A JP H06510387 A JPH06510387 A JP H06510387A
Authority
JP
Japan
Prior art keywords
character
smear
frame
circuit
directions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5505375A
Other languages
English (en)
Other versions
JP3209746B2 (ja
Inventor
バロン,ポール・エス
ベントレイ,ウェイン・エイチ
カリー,ジョン・エフ
レブス,スティーブ・アール
リドル,ロジャー・イー
Original Assignee
ユニシス・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニシス・コーポレイション filed Critical ユニシス・コーポレイション
Publication of JPH06510387A publication Critical patent/JPH06510387A/ja
Application granted granted Critical
Publication of JP3209746B2 publication Critical patent/JP3209746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 名称 文字認識のための文字位置確認 発明の背景 この発明は、一般に文字認識のシステムおよび方法に関し、より特定的には文書 上の文字の位置を確認するための改良された手段および方法に関するものであっ て、これは位置確認された文字に文字認識技術を適用するのに先立つものである 。
多くの文字認識システムでは、文字認識技術を用いて自動的に読み取られるべき 文字の位置を確認することが重大な課題となっている。この課題は、特に形のく ずれた文字や紙のノイズがあったりするような、品質の悪い印刷にかかわる場合 、特に厳しいものとなる。
発明の概要 したがって、この発明の目的は、広くは、文字認識システムで文字の位置を確認 するための改良された手段および方法を提供することである。
この発明のさらに特定的な目的は、品質の悪い印刷がかかわる場合に文字の位置 を確認するための改良された手段および方法を提供することである。
上述の目的に従う、この発明の他の目的は、比較的単純かつ経済的な態様で文字 の位置確認を実現させることである。
この発明の特定的な好ましい実施例では、文字の位置確認は、潜在的な文字要素 を含む画像が上下左右の方向にスミアを生じるようにされる、新規なアプローチ を用いて行なわれる。結果としてもたらされたスミアの生じた画像は次に、文字 のサイズにどの程度よく対応するかに基づいて評価される、候補となる文字フレ ームを生成するために用いられる。これらの候補となる文字フレームは、次にそ れらか文字認識の対象となるへき特定の文字フレームを選択するという目的にと って適切な位置にあるかどうかに基づいて、さらに評価される。
この発明の特定的な性質ならびに他の目的、特徴、用途および利点は、以下に述 べる詳細な説明を添付の図面と関連させなから読めば明らかになるであろう。
図面の簡単な説明 図1は、この発明を取り入れた文字認識システムの全体的なブロック図である。
図2は、図1に示した文字位置確認装置12の好ましい実施例を表わすブロック 図である。
図3は、文書」二の文字の行、およびこれらの文字を走査するために典型的に用 いられるスキャンバンドを示す概略図である。
図4は、この発明に従い、文字「6」を含むビクセル画像か典型的にはとのよう に上および左の方向にスミアを生じさせられ得るかを示す図である。
図5は、図4と関連の凡例である。
図6は、図2のフレーマ26の好ましい実施例を示すブロック図である。
図7は、図6で示したフレーマによって対が作られるのに応用できる、典型的な 水平の座標を示す表である。
図8は、図6のフレーマ出力制御48のための好ましい状態図である。
図9は、図8で用いられるさまざまな略号の意味を記した表である。
図1Oは、有効な長い縦方向マーカ(LVM)を含む画像を示す。
図11は、無効な長い縦方向マーカ(LVM)を含む画像を示す。
図12は、図2の出力決定回路50の好ましい実施例を示すブロック図である。
図13は、図12の出力決定回路50により行なわれる適切な典型的フィールド 外機能を包括的に示すフローチャートである。
図14は、図12の出力決定回路50により行なわれる適切な典型的フィールド 内機能を包括的に示すフローチャートである。
詳細な説明 図面では、同様な番号は一貫して同様な要素にあてはまる。
、=こて説明される装置および方法は、そうでない旨示されている場合を除き、 一般的に現在当該技術において知られているように構成され、動作するものとし て理解される。
まず図1を参照して、画像キャプチャモジュールIOが、文書に含まれる文字の 行の走査に対応するビデオ画像lOaを提供する。これらのビデオ画像10aは 、文字位置確認装ft12に与えられる。文字位置確認装置12の基本的な動作 は、与えられたビデオ画像10aにおいて文字の位置を確認すること、および文 字認識回路14に信号12aを送って位置確認された文字を認識させることであ る。画像キャプチャモジュール10はまた、文字位置確認装置12に信号10) 〕を与えて、文書か存在することと、コントラストなどのさまざまな画像特性と を示す。画像ギヤプチャモシュール10と認識回路14とは、従来のものでよく 、したかってここでこれ以上説明されることはないということは、理解されるで あろう。
文字認識回路14によって認識された文字は、典型的には図1に示されるように コンピュータ処理装置(CPU)15に与えられる。このCPU15は、典型的 には文字位置確認装置12に初期化および他の信号15bを与え、これらは文字 のサイズ、フォントの種類などである。文字位置確認装置12はまた、特殊な文 字の位置特性を示す出力イS号!2bをCPU15に与える。
画像キャプチャモジュールIOにより与えられたビデオ画像10aは、典型的に は1回分の走査につき128個の「活性」ビクセルと、少なくとも14個の「不 活性」ビクセルとを含む。1つのビクセルは、典型的には高さ4,6875ミル て幅4.26ミルの画像エリアを表わす。
図2は、図1で示した文字位置確認装a12の好ましい実施例を示す。図2から は、図1の画像キャプチャモジュール10からのビデオ画像10aかダイナミッ クスキャンパント回路16に与えられるという、二とが見て取れ、このダイナミ ックスキャンハンド回路16は典型的には128個のビクセルからなる高さ0. 6インチのスキャンバンドを縦方向に提供する。よく知られているように、ダイ ナミックスキャンハンド回路16はスキャンバンドの高さくスキャナの視野)を 制御するものであって、これは典型的にはスキャンバンドの外辺近くのいかなる 黒いマークが位置検出に影響することをも阻止するために選択されるものである 。これは典型的には、対象となる予め定められた領域の外側にあるすべてのビク セルを消去することによって行なわれる。スキャンバンドの高さは、CPU出力 16a(図1)または後に説明する出力決定回路50からの出力50bによって 制御できる。
図2のスキャンバッファ18は、ダイナミックスキャンパント回路16から受け 取られた36回分の走査を連続的にストアかつ更新し、1回分の走査は縦(列) 方向に128個のビクセルを含む。図3は、スキャンバッファ18によってもた らされる、文書11に対する典型的な右から左への列走査を示すものである。各 ピクセル時間ごとに、ストアされた36回分の走査の各々からのピクセル1つず つを表わすスキャンバッファ18の1打金体が、バッファ出力18aとして利用 可能になる。
スキャンバッファ出力18aはスミア回路20に与えられ、このスミア回路20 は画像の中の黒いピクセル(潜在的な文字要素)に上下左右の4方向ヘスミアを 生じさせるよう動作する。好ましくは、スミア回路20によって提供されるスミ アは、典型的にはほぼ上下に1文字分の高さと左右に1文字分の幅とで延びる。
図4は、文字「6」を構成するピクセルに対し上方向および左方向にスミアの生 じる様を表わす。図4では示されていないが、下方向および右方向にもスミアは 類似の態様で生じる。図4から明らかとなるように、スミアの発生は黒いピクセ ルからスミアの生じる方向に続くm個の連続したピクセルを黒くするように設定 することによって成し遂げられる。この場合のmはスミアの長さである。図5は 図4に適用できる凡例である。
結果としてもたらされた、図2のスミア回路20によって生成された4方向にス ミアの生じた画像20aは、角検出回路22に与えられ、文字の上端、下端、左 端および右端が検出される。これは、上下のスミアを用いて左右の端を生成し、 左右のスミアを用いて上下の端を生成することによって成し遂げられる。たとえ ば、図4は文字「6」の上および左へのスミアに対し左端および上端がどのよう に決定されるかを示す。上にスミアを生じた画像の各行に対し、黒いピクセルを 含む最も左の列に縦線24が位置づけられる。その場合、スミア画像の左端は、 最も左にある縦線24′となる。左にスミアを生じた画像の各列に対しては、黒 いピクセルを含む最も上の行に水平な線26が位置付けられる。この場合、上端 は一番上の水平な線26′となる。
角検出回路22はスミアを生じた文字ピクセルの端の交差に基づいて角を検出す る。たとえば、これは図4では、左端24′と上端26′との交差により形成さ れる左上の角28によって示される。他の3つの角も類似の態様でめられるとい うことは理解されるであろう。
より特定的には、角検出回路22によって、以下に示す態様で端の交差から角を 検出できるようになる。
左上の角(TLC)は、左側のスミアからめられた上端と上方のスミアからめら れた左端との交差である。
右上の角(TRC)は、右側のスミアからめられた上端と上方のスミアからめら れた右端との交差である。
左下の角(BLC)は、左側のスミアからめられた下端と下方のスミアからめら れた左端との交差である。
右下の角(BRC)は、右側のスミアからめられた下端と下方のスミアからめら れた右端との交差である。
これより、角をめるためのプール関数を示すが、ここにおいて記号は以下の意味 を持つ。
m =ビクセルの行の位置 n =ピクセルの列の位置 U =上スミア画像 D =下スミア画像 R=右スミア画像 L =左スミア画像 HR=半幅右スミア画像 HRE=半幅右スミアイネーブル HL =半幅左スミア画像 HLE=半幅左スミアイネーブル ′ =ピクセル値の補数 左上の角: 右下の角: 図2の文字位置確認装置12の好ましい実施例の説明を続けると、角検出回路2 2の出力22aはスキャンバッファ出力18aとともにコーナフィルタ25に与 えられ、コーナフィルタ25は検出された角の少なくとも1つについて濃度チェ ックを行ない、その角が有効であるかどうかを判断する。これは典型的には、( 文字の存在を示す)しきい値数のピクセルか角によって境界を定められる四角形 の領域内に含まれるかどぅがを判断して文字のサイズを概算することによって成 し遂げられ、それによりスプリアスノイズによって有効な角の検出がもたらされ てしまうことが阻止される。たとえば図4を参照して、このしきい値(濃度)測 定に用いられる典型的な四角形の領域は、18×24個のピクセル(はぼ文字の サイズ)からなり、左端24′と上端26′との交差により形成される検出され た角によって境界を定められるものであってよい。
図2で示されるように、フレーマ26がコーナフィルタ25から出力25aを受 取り、角検出回路22がら出力22aを受取る。コーナフィルタ25による濃度 チェックで不合格だったものは、捨てられる。フレーマ26の目的は、角検出回 路24によって検出された有効な角を用いて有効なフレームを生成することであ って、この有効なフレームは文字サイズに基づいて評価された後、評価された候 補文字フレームとしてフレーマ出力26aを介して出力決定回路50へ送られる 。またフレーマ出力26aは、スキャンセパ【/−夕の形で位置および状態の情 報(文書の存在および)A−ントの種類など)を含む。フレーマ26の好ましい 実施例は、図6で示される。
図6で示されるフレーマ26の好ましい実施例を参照して、左上の角(TLC) および右下の角(BRC)の情報かフレーマ入力制m40に与えられる。そこか ら、BRCの座標およびセパレータが右下角FIFO42に書込まれ、対応する 可能性のあるTLC座標が左上角FTFO#1(44)と左上角FIFOt$2  (46)とに同時に書込まれる。ずへての座標の水平成分か含む必要があるの は、文III 1 (図3)の右端を基準とした走査の絶対番号の6ビツトのみ である。また、フレーム出力制御40は図6で示されるようにFIFO42,4 4,および46に適切なリセット信号および書込信号を与える。
フレーマ出力制御48は、BRCFIFO42からBRCおよびセパレータを読 出す。セパレータは出力決定回路50(図2)へ直接送られる。各BRCは、適 切なTLCFTFO44または46に含まれる、あらゆるTLCと個別に対にさ れる。典型的な水平座標は、図7で示される。
図7では、最初の32回分の走査(16進法で走査OOからIF)におけるBR Cが、TLCF IFO# l (TLl)に含まれるすべてのTRCと組合わ されており、その一方て次の32回分の走査(16進法で走査20から3F)か らのBRCはTLCFIFO#2(TL2)に含まれるすべてのTRCと組合わ されているということに注目されたい。所与のBRC/TLC対が特定のフォン トのために適切な高さおよび幅のフレームを形成する場合、かつ反対の角BLC およびTRCが存在する場合、その対は有効なフレームを作り出す。さらに図7 との関連で、TLlおよびTL2は16進法で走査40回ごとに角をクリアされ るということ、すなわぢTLIは16進法の走査0゜40などでリセットされ、 TL2は16進法の走査20゜60なとてリセットされるということ(こ注目さ れたい。
要約すると、図6のフレーマ出力制@48の働きは、(1)スキャンセパレータ を図2の出力決定回路50に送ること、(2)各右下の角(BRC)を選択され たFIF044または46からのそれぞれの左上の角(TLC)と対にすること 、(3)TLCおよびBRCの角の対から、選択されたフォントのために受入可 能な幅と高さの、有効である可能性があるフレームを決定すること、(4)これ らの有効である可能性のあるフレームから、フレームの他の2つの角BLCおよ びTRCの存在に基づいて有効なフレームを選択すること、(5)これらの有効 なフレームがとの程度文字サイズに対応するかに基づいてこれらを評価すること 、および(6)これらの評価された有効なフレームを、候補となる文字フレーム として出力決定回路50(図2)へ送ることである。図6に示されるように、フ レーマ出力制御48は適切な続出信号および再送信号をFMFO42,44およ び46に与えて、それらに対するTLC,BR(:、およびスキャンセパレータ 信号のフィードを制御し、その一方で同じく図6で示されるように、FIF04 2.44および4Gは適切なデータ存在信号をフレーム出力制御48に与えてデ ータか存在するときを示し、フレーム出力制御40は選択信号40aをフレーマ 出力制御48に与えて、それはフレーマ出力制御48によって、適切な左上FI FO44または46を選択するのに用いられる。
図6のフレーマ出力制御48のための好ましい状態図は図8で表される。図9は 図8で用いられるさまざまな略号の意味を記した表である。有効なフレームの評 価は、典型的には以下に示す方程式に従ってめられる。
評価=100− [2*abs (フォント幅−フレーム幅)+31cabs( フォント高さ一フレーム高さ)コ図2に戻って、すぐ前で説明したフレーマ26 の出力26aは出力決定回路50に与えられるということか見て取れるだろう。
出力決定回路50には、リジェクトフラグ回路52、ストローク幅検知器54、 および長い縦方向マーク検出器56からの出力も与えられる。これらの構成要素 52.54および56は、フレーマ26によって提供される評価された候補とな る文字フレームとともに、どの文字フレームか最終的に文字認識回路14(図1 )に送られるのかということと、CPU15(図1)に送られるべき特定の信号 とを決定するにあたり、出力決定回路5oによって用いられるために提供される 。
図2のリジェク1へフラグ回路52は、スキャンバッファ出力18aとスミア回 路出力20bとに応答して動作し、予想される文字サイズよりずっと大きく、し たがって上述のスミアによるアプローチを用いて有効な文字フレームを生成しな いかもしれないマークにフラグを立てる。これらのマークを検出するため、フラ グ回路52はlビクセル幅で読取り不能最小高さく文字セットにおける最も小さ い文字の高さ)の寸法のウィンドウを用いる。このlビクセル幅のウィンドウは 右方向にスミアを生じた画像(スミア回路出力20bによって提供される)にお ける各列を上に送られる。ウィンドウかしきい値数の黒いビクセルでずっと満た されるよってあれば、その列にはフラグが立てられる。
また、フラグを立てられた各列について、ウィンドウがしきい値数の黒いビクセ ルを含む最初および最後のときのウィンドウの一番上の行がストアされる。フラ グ回路出力52aは、これらの動作の結果を出力決定回路50に与えて、これは 文字認識回路14(図1)に送られるべき文字フレームを決定するのに用いられ る。
図2のストローク幅検知器54は、紙のノイズ(不必要なマーク)が過剰に存在 するために有効なフレームが認識されないかもしれない場合、またはいくつかの 文字が一緒につながっている場合、または署名なとの予想されないマークが文字 のフィールド内まで延びている場合などの状況に対処するために提供される。ス トローク幅検知器54の基本的な目的は、フレーマ26によって発見されていな くても文字が存在するかどうかを判断することである。ストローク幅検知器54 は、文字が存在することを示すストローク幅を有するマークがフレーム内にある かどうかを判断することによって、文字が存在し得るかどうかを判断する。
そのようなストローク幅の存在を判断するやり方の一例は、各スキャンごとに上 に動かされる、2ビクセル高さと1ビクセル幅の寸法のウィンドウを提供するこ とである。2つの連続する黒いピクセル(最小の文字ストローク幅)によりウィ ンドウか満たされると、カウントがリセットされ、ウィンドウの頂部に対応する ピクセル位置のためにOかストアされる。ウィンドウに2つの黒いピクセルが含 まれない場合、カウンタは増分し、その値がストアされる。その場合、ストアさ れた各ビクセル位置には走査の中で最も近いストローク幅のサイズのマーク(黒 い点)から上方への距離か含まれる。これらのストアされた値により、文字が存 在するかどうかの判断が下せるようになる。ストローク幅検知器出力54aは、 これらの動作の結果を出力決定回路50に与え、出力決定回路50はこの結果を 用いて、文字のピッチおよび前の文字の情報に基づき、対応する文字フレームを 文字認識回路14(図1)に送る。
図2の長い縦方向マーク検出器56は1.スキャンバッファ18からのスミアを 生じさせられていないスキャンバッファ出力18aで動作して、その幾何学的形 状のために、上述のスミアによるアプローチを用いて有効なフレームを示す角を 提供することのないかもしれない長い縦方向マーク(LVM)を検出する。LV Mは、典型的には(1)2個から9個の連続する黒い列を含み、かつ(2)少な くとも1つの白い列をその右端に隣接する4つの列の中および左端に隣接する4 つの列の中に有するものとして、規定されるだろう。たとえば、黒い列は32ビ クセルウインドウ内に30個の黒いピクセルを含む黒い領域を有するものである 。白い列は、たとえば黒い列の中の黒い領域の最も高いところと最も低いところ との間に、2つの連続する黒いピクセルを有していないものである。図10は有 効であるLVMの一例を示し、図11は無効であるLVMを示す。
長い縦方向マーク検出器56は、検出されたLVMを示す出力56aを出力決定 回路50に与える。
ここで、図2の出力決定回路50についてより詳細に考察する。出力決定回路5 0の主要な目的は、フレーマ26によってもたらされる評価された候補となる文 字フレーム、ならびにリジェクトフラグ回路52、ストローク幅検知器54およ び長い縦方向マーク検出器56のそれぞれの出力52a、54aおよび56aに 応答して文字認識回路14(図1)に送られるべき文字フレームを最終的に決定 することである。次に、出力決定回路50の好ましい実施例を図12に示される ブロック概略図を参照して説明する。
出力決定回路50は、動作の基本的なモードを2つ有しており、これらはすなわ ち(1)フィールド外モード、および(2)フィールド内モードである。フィー ルド外モードは有効な文字フレームがまだ全く見つかっていない状況に対応する 。フィールド内モードは有効な文字フレームが少なくとも1つ見つかっている状 況に対応する。これらのモードに関連しての出力決定回路50の動作は、デジタ ルシグナルプロセッサ(DSP)60によって制御される。
決定出力回路50はまた、デュアルポートSRAM66、位置確認FIF○68 、フレーマデータ存在ボー)70、プログラムメモリ72、データメモリ74、 コマンド/応答レジスタ76、ダイナミックスキャンパントボート78、および 文字認識回路ボート80を含む。各モードにおける、図12に示した出力決定回 路50の好ましい実施例の動作を、これより詳細に考察する。
フレーム情報26aに与えられるデータ存在信号の最上位ビットがモニタされる 。その値が1に等しければ、DSP60はフレーマFIFOボート62からワー ドを1つ読出す。このワードのビット15は、残りのビットが現在の走査に関す るステータス情報を含むのか(WT=1)、それとも現在の走査に見出されたフ レームに関する情報を含む(WT=O)のかを示す。前者の場合、ビット12は どのフォントパラメータが走査に適用されるのか(最初のフォントならF=O1 2番目のフォントならF=1)を示し、ビット13は現在の走査が文書内にある かどうかを示す(DP=1)。後者の場合には、ビットOないし6は現在の走査 で見出されるフレームの右下の角におけるy座標を与え、ビットフないし13は このフレームの基本となる評価を含む。ステータス情報を含むワードは、あらゆ る走査の初めで一度生じ、フレーム情報を含むワードはフレーマによって現在の 走査の中で見つかる新しいフレームのあらゆるものについて一度に生じる。
フレーマFIFOボート64は、ボート61の中に見つかる各フレーム情報ワー ドにつき1つの付加的なワードを含む。このワードのビットOないし6はフレー ムの左上の角のy座標を含み、ビット7ないし12は右上の角と左上の角との間 の水平な距離を含む。フレーム情報ワードがボート62から読出されるたびに、 フレーマポート64が読出されてこれらのワードの間にl対処の対応関係を保つ 。
現在の走査において候補となる文字フレームが見つかると、最適なフレームをめ て次の10回分の走査かサーチされ、フィールド内モード(後の部分で説明)に 入る。基本となる評価の最も高いフレームか、中央に置かれ、図2で示されるよ うに、出力50aを介して、対応するスキャンバッフ了出力18aとともに文字 認識回路14に送られる。
候補となる文字フレームか全く見つからなかった場合、長い縦方向マーク(L  V M)か検出されたかどうかを判断するためにチェックが行なわれる。これは 、チェックSRAM66によって成し遂げられる。SRAM66は、前の64回 分の走査における、長い縦方向マーク検出器56(図2)によるLVMの検出を 示す情報をス1〜アする。各走査により、128バイトの情報か生成される。1 回の走査における最初のバイトのビット7は、その走査が文字程度のサイズのデ ータであるかどうかを示すフラグ(R)を含む(すなわち、次のスミア幅の数の 走査のうちのどこかに、現在の)オン1−のための最小高さの文字と同しくらい の高さのものかあれば、R=1である)。残りの7ビツI・は、しきい値(リジ ェクトノイズマージン)数の黒いビクセルで満たされた最初のときのりジエクト 最小高さのウィンドウの頂部の縦方向の位置を与える。この値は、リジェクト領 域のおおよその底部を見い出すのに用いられる。走査における2番目のバイトは 、ビット0ないし6においてリジェクト領域の絶対高さを含み、ビット7は走査 がL vMの一部であるときにいつもセラI・されるフラグ(L )を含む。バ イI−2ないし127は、その列にお1ノる最も近い2つの連続する黒いビクセ ルの上方の縦方向の距離を示す値を、その下位7ビツ1−に含む。最」−位ビッ トは実際のビクセル値を含み、アドレスビット7ないし12は走査番号を示し、 ピッ1−0ないし6は走査中のバイト番号を示す。
対象となる走査においてLVMフラグが見つかると、LVMコードか出力50c (図2)を介してCPU15(図1)に送られる。潜在的なフレームのサーチは 、その場合1、VMの左端でフィールド外モードで続けられる。
潜在的フレームもLVMも見つからなかった場合、DSP60かSRAM66を サーチして、リジェクトフラグ回路52(図2)によってリジェクトにフラグか 立てられたかとうかを判断し、その結果は出力12aを介してCPU15(図1 )に送られる。その後潜在的フレームのサーチか、次の列で続けられる。
図13は出力決定回路50によって行なわれる適切かつ典型的なフィールド外機 能を包括的に示すフローチャート前の文字の終わりから次の文字の予想される中 央を通り過ぎてすぐのところまでの列で始まる、すべての候補となる文字フレー ムは、最も評価の高いものをめて検査される。πfの文字との関係でのフレーム の位置に応して、評価にはボーナス点か加えられる。候補となる文字フレームの 最終的な評価は、したがって文字サイズに基づいてフレーマ26によって与えら れた評価に、そのフレームが予想される位置にあるかどうかに基づき(たとえば 文字ピッチに基づき)、出力決定回路50によって与えらねたボーナス評価を加 えたものの和となる。
その結果得られる最も評価の高い候補となる文字フレームか次に選択され、前の 文字の情報を用いてその高さまたは幅に対する必要な調整かあれば行なわれる。
フレームは文字認識回路14のための適切なボックス内の中央に位置付けられる 。ホックスのサイズは、典型的には4つの方向すべてに向けてテンブレー1・の サイズよりも2ピクセル分人きくなっているので、認識回路14は文字を上下左 右にビクセル2つ分シフ1−できる。
■、VMは、文字認識回路14からは独立して認識される。
最も評価の高いフレームかLVMの寸法に一致する場合、そのフレームはLVM として認識される。フレームが見出され、ぞのτ1法かLVMの寸法と一致しな い場合、前の文字の左端と現在の文字の右端との間のエリアか、LVMフラグを めてチェックされる。フレームか全く見つからない場合、LVMフラグの存在を めて、サーチエリア全体かチェックされる。L V Mか検出されるこれらのす べての場合において、それを知らされるのはCPU15(図1)のみである。
フレームもLVMも見つからなかった場合、ピッチ、ならびに前のフレームの頂 部および底部の情報を用いて潜在的フレームが形成される。この場合、ス1−ロ ーク幅検知器54(図2)によって提供され、SRAM66にストアされる黒い 点のカウントが、この領域にストローク幅のサイズマークかあるかどうかを判断 するのに用いられる。マークかあれば、フレームは認識回路14に送られる。な ければ、フィールド内モードから出ることになる。
図14は、出力決定回路5oによって行なわわる適切かつ典型的なフィールド内 機能を包括的に示すフローチャートである。
ここで説明されたこの発明の好ましい実施例は、単に例示的なものであって、発 明の精神から逸脱することなく、この発明には構成、配列および用途において多 くの修正および変形か可能であるということは理解されるであろう。
したがって、この発明は後に記載する請求の範囲によって規定される発明の範囲 の中に入るものとして、ずへての修正および変形を含むものであると考えられる べきである。
FIG、1 FIG、4

Claims (24)

    【特許請求の範囲】
  1. 1.文字認識システムで用いるための文字位置確認装置であって、 潜在的な文字要素を含む画像を提供する手段と、少なくとも第1および第2の方 向の各々に、文字のサイズに関して予め定められた長さだけ前記要素にスミアを 生じさせるための、スミア回路と、 前記スミア回路に応答して、前記第1および第2の方向にスミアを生じさせられ た要素の端の交差に基づいて角を検出するための角検出回路と、 前記角検出回路に応答して、検出された角から候補となる文字フレームを生成す るためのフレームと、前記フレームに応答して、候補となる文字フレームのいず れが文字認識の対象となるべきかを判断する、決定回路とを含む、文字位置確認 装置。
  2. 2.前記第1および第2の方向は、互いに垂直である、請求項1に記載の装置。
  3. 3.前記文字は行に配列され、前記第1の方向は前記行に平行であり、前記第2 の方向は前記行に垂直である、請求項1に記載の装置。
  4. 4.前記スミア回路は前記第1および第2の方向とは異なる第3および第4の方 向にもスミアを生じさせ、前記角検出回路は前記第3および第4の方向にスミア の生じた文字要素の端の交差に基づく角をも検出し、前記フレームは前記第1お よび第2の方向に生じたスミアに応答して検出された角を前記第3および第4の 方向に生じたスミアに応答して検出された角と組合わせることによって候補とな る文字フレームを生成する、請求項1に記載の装置。
  5. 5.文字は行に配列され、前記第1および第3の方向は前記行に垂直でありかつ 互いに逆であり、前記第2および第4の方向は前記行に平行でありかつ互いに逆 である、請求項4に記載の装置。
  6. 6.前記スミアはほぼ上下に1文字分の高さで左右に2文字分の幅である、請求 項5に記載の方法。
  7. 7.前記フレームは候補となる文字フレームを文字サイズとの関係に基づいて評 価して、前記評価を前記決定回路に与え、前記決定回路は前記評価を用いてどの 文字フレームが文字認識の対象となるべきであるかを判断する、請求項4に記載 の装置。
  8. 8.前記出力決定回路は候補となる文字フレームに対してそれが予想される位置 にあるかどうかに基づきボーナス評価を加え、その結果得られた最も評価の高い 候補となる文字フレームが文字認識の対象となる、請求項7に記載の装置。
  9. 9.前記角検出回路に結合され、前記角検出回路によって検出された角について 濃度チェックを行なってその角が有効であるかどうかを判断するためのコーナフ ィルタを含み、前記コーナフィルタの出力は無効である角を捨てるために前記フ レームに与えられる、請求項5に記載の装置。
  10. 10.前記決定回路は、有効な文字フレームが全く見つからない状況に対応する 第1の動作モードと、少なくとも1つの有効なフレームが見つかった状況に対応 する第2の動作モードとを有する、請求項7に記載の装置。
  11. 11.文字の行を認識するための文字認識システムで用いる文字位置確認装置で あって、 文字の行の走査に対応する画像を提供する画像キャブチャ手段を含み、前記画像 の1または2以上には文字要素が含まれ、さらに 前記画像キャブチャ手段によって生成された画像を連続的にストアするためのス キャンバッファと、前記スキャンバッファに結合され、画像中の文字要素に対し 第1および第2の方向ヘスミアを生じさせるためのスミア回路とを含み、前記第 1の方向は前記行に平行であり、前記第2の方向は前記行に垂直であり、さらに 前記スミア回路に結合され、前記第1および第2の方向にスミアを生じさせられ た文字要素の端の交差に基づいて角を検出するための角検出回路と、 前記角検出回路に結合され、前記角検出回路によって検出された角に応答して候 補となる文字フレームを生成するためのフレームと、 前記フレームに結合され、前記候補となる文字フレームのいずれが文字認識の対 象となるべきであるかを判断するための決定回路とを含む、装置。
  12. 12.前記スミア回路は第3および第4の方向にもスミアを生じさせ、前記第3 の方向は前記第1の方向に平行かつ逆であり、前記第4の方向は前記第2の方向 に平行かつ逆であり、前記角検出回路は前記第3および第4の方向にスミアが生 じた文字要素の端の交差に基づいて角を検出し、前記フレームは前記第1および 第2の方向に生じたスミアに応答して検出された角を前記第3および第4の方向 に生じたスミアに応答して検出された角と組合わせることによって候補となる文 字フレームを生成する、請求項11に記載の装置。
  13. 13.前記フレームは候補となる文字フレームを文字サイズとの関係に基づいて 評価して、前記評価を前記決定回路に与え、前記決定回路は前記評価を用いてど の文字フレームが文字認識の対象となるべきかを判断する、請求項12に記載の 装置。
  14. 14.前記出力決定回路は候補となる文字フレームに対しそれが予想される位置 にあるかどうかに基づいてボーナス評価を加え、その結果得られた最も評価の高 い候補となる文字フレームが文字認識の対象となる、請求項13に記載の装置。
  15. 15.前記角検出回路に結合され、前記角検出回路によって検出された角につい て濃度チェックを行ない、その角が有効かどうかを判断するためのコーナフィル タを含み、前記コーナフィルタの出力は無効である角を捨てるために前記フレー ムに与えられる、請求項11に記載の装置。
  16. 16.前記スキャンバッファに結合され、文字の存在することを示すストローク 幅を有するマークを画像が含むかどうかの判断に基づいて、あるかもしれない文 字の存在を判断するためのストローク幅検知器を含み、前記ストローク幅検知器 の出力は前記決定回路に与えられる、請求項12に記載の装置。
  17. 17.前記スキャンバッファに結合され、長い縦方向マークを検出するための長 い縦方向マーク検出器を含み、前記縦方向マーク検出器の出力は前記決定回路に 与えられる、請求項12に記載の装置。
  18. 18.前記スミア回路に結合され、予想される文字サイズよりもずっと大きいマ ークにフラグを立てるためのリジェクトフラグ回路を含み、前記リジェクトフラ グ回路の出力は前記決定回路に与えられる、請求項12に記載の装置。
  19. 19.文字認識システムにおいて文字の位置を確認するための電子的に実現され た方法であって、文字要素を含む画像を提供するステップと、前記文字要素に対 し少なくとも第1および第2の異なる方向にスミアを生じさせるステップと、前 記第1および第2の方向にスミアを生じた文字要素の端の交差に基づいて角を検 出するステップと、検出された角に応答して候補となる文字フレームを生成する ステップと、 どの文字フレームが文字認識の対象となるべきであるかを、文字フレームが文字 を含む可能性に基づいて判断するステップとを含む、方法。
  20. 20.前記スミアを生じさせるステップは、前記文字要素に対し前記第1および 第2の方向とは異なる第3および第4の方向にもスミアを生じさせる、請求項1 9に記載の方法。
  21. 21.前記文字は行に配列され、前記第1および第3の方向は前記行に平行かつ 互いに逆であり、前記第3および第4の方向は前記行に垂直かつ互いに逆であり 、前記検出するステップは前記第3および第4の方向にスミアの生じた文字要素 の端の交差に基づく角をも検出し、前記生成するステップは前記第1および第2 の方向に生じたスミアに応答して検出された角を前記第3および第4の方向に生 じたスミアに応答して検出された角と組合わせるステップを含む、請求項20に 記載の方法。
  22. 22.前記スミアはほぼ前記第2および第4の方向に1文字分の高さであり、前 記第1および第3の方向に1文字分の幅である、請求項21に記載の方法。
  23. 23.前記生成するステップは、文字サイズに基づいて候補となる文字フレーム を評価するステップを含み、前記判断するステップは前記評価に基づいて文字認 識の対象となる文字フレームを選択する、請求項21に記載の方法。
  24. 24.前記判断するステップは、候補となる文字フレームに対しそれが予想され る位置にあるかどうかに基づいてボーナス評価を加えるステップを含む、請求項 23に記載の方法。
JP50537593A 1991-09-06 1992-09-01 文字認識システムで用いる文字位置確認装置および方法 Expired - Fee Related JP3209746B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US07/755,722 US5267325A (en) 1991-09-06 1991-09-06 Locating characters for character recognition
US755,722 1991-09-06
PCT/US1992/007405 WO1993005607A1 (en) 1991-09-06 1992-09-01 Locating characters for character recognition

Publications (2)

Publication Number Publication Date
JPH06510387A true JPH06510387A (ja) 1994-11-17
JP3209746B2 JP3209746B2 (ja) 2001-09-17

Family

ID=25040369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50537593A Expired - Fee Related JP3209746B2 (ja) 1991-09-06 1992-09-01 文字認識システムで用いる文字位置確認装置および方法

Country Status (5)

Country Link
US (1) US5267325A (ja)
EP (1) EP0602180B1 (ja)
JP (1) JP3209746B2 (ja)
DE (1) DE69219346T2 (ja)
WO (1) WO1993005607A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0609474A1 (en) * 1993-02-03 1994-08-10 International Business Machines Corporation Method and apparatus for transforming an image for classification or pattern recognition
JP3237975B2 (ja) * 1993-09-20 2001-12-10 富士通株式会社 画像処理装置
EP0667533A3 (en) * 1994-02-14 1996-06-12 Hewlett Packard Co Signal loss detector.
US5638459A (en) * 1994-09-20 1997-06-10 Neopath, Inc. Method and apparatus for detecting a microscope slide coverslip
CN1842821A (zh) * 2003-08-25 2006-10-04 皇家飞利浦电子股份有限公司 图像增强
KR100657915B1 (ko) * 2004-11-26 2006-12-14 삼성전자주식회사 코너 검출 방법 및 코너 검출 장치
US20070071324A1 (en) * 2005-09-27 2007-03-29 Lexmark International, Inc. Method for determining corners of an object represented by image data
KR100833346B1 (ko) 2007-01-03 2008-05-28 (주)폴리다임 디스플레이 장치에 표시된 문자 이미지의 픽셀 단위 가로폭 측정 방법
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
US11010768B2 (en) * 2015-04-30 2021-05-18 Oracle International Corporation Character-based attribute value extraction system
CN111563512B (zh) * 2020-04-30 2024-03-08 广东小天才科技有限公司 一种答案自动涂抹的方法、装置、电子设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4517607A (en) * 1981-11-09 1985-05-14 Ricoh Company, Ltd. Method of and apparatus for compensating image in image reproduction system
US4897806A (en) * 1985-06-19 1990-01-30 Pixar Pseudo-random point sampling techniques in computer graphics
US4748507A (en) * 1986-10-17 1988-05-31 Kenneth Gural Solid state imaging device having means to shift the image between scans and associated circuitry to improve the scanned image
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPH01168163A (ja) * 1987-12-23 1989-07-03 Fuji Xerox Co Ltd 画像処理装置
JPH06101049B2 (ja) * 1988-03-25 1994-12-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 文字列検出方法
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5142273A (en) * 1990-09-20 1992-08-25 Ampex Corporation System for generating color blended video signal

Also Published As

Publication number Publication date
DE69219346D1 (de) 1997-05-28
WO1993005607A1 (en) 1993-03-18
DE69219346T2 (de) 1997-11-20
EP0602180B1 (en) 1997-04-23
US5267325A (en) 1993-11-30
JP3209746B2 (ja) 2001-09-17
EP0602180A1 (en) 1994-06-22

Similar Documents

Publication Publication Date Title
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
KR920003477B1 (ko) 화상처리장치
JPH08242358A (ja) 画像処理装置
JPH06510387A (ja) 文字認識システムで用いる文字位置確認装置および方法
JPH0424781A (ja) 文書処理装置
JP3184979B2 (ja) デジタル活字面の輪郭を形成する方法およびその装置
JPH03214378A (ja) 文字認識装置
JP3186246B2 (ja) 文書読取装置
JP2020071619A (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP3186712B2 (ja) 文書読取装置
JPH11161738A (ja) 楽譜認識方法及びその装置並びに楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3521606B2 (ja) 文字読取り装置
JPH117493A (ja) 文字認識処理装置
JP3269889B2 (ja) 光学式文字読取システム
JPS6343788B2 (ja)
JP3197464B2 (ja) 文字認識方法および文字認識装置
JPH0214392A (ja) 文書領域解析装置
CN114140391A (zh) 基于机器视觉实现板载显示屏模块快速检测的方法
JP2962525B2 (ja) テキストブロック認識方法
JP2762476B2 (ja) 清書装置
JPS63204486A (ja) 文字入力装置
JPS61196382A (ja) 文字切出し方式
JPS6054708B2 (ja) 手書文字/図形認識装置
JP2002262093A (ja) 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体
JPH0721309A (ja) 文書認識装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070713

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080713

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080713

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090713

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees