JP3209746B2 - 文字認識システムで用いる文字位置確認装置および方法 - Google Patents

文字認識システムで用いる文字位置確認装置および方法

Info

Publication number
JP3209746B2
JP3209746B2 JP50537593A JP50537593A JP3209746B2 JP 3209746 B2 JP3209746 B2 JP 3209746B2 JP 50537593 A JP50537593 A JP 50537593A JP 50537593 A JP50537593 A JP 50537593A JP 3209746 B2 JP3209746 B2 JP 3209746B2
Authority
JP
Japan
Prior art keywords
character
corner
directions
circuit
smear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP50537593A
Other languages
English (en)
Other versions
JPH06510387A (ja
Inventor
バロン,ポール・エス
ベントレイ,ウェイン・エイチ
カリー,ジョン・エフ
レブス,スティーブ・アール
リドル,ロジャー・イー
Original Assignee
ユニシス・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニシス・コーポレイション filed Critical ユニシス・コーポレイション
Publication of JPH06510387A publication Critical patent/JPH06510387A/ja
Application granted granted Critical
Publication of JP3209746B2 publication Critical patent/JP3209746B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】 発明の背景 この発明は、一般に文字認識のシステムおよび方向に
関し、より特定的には文書上の文字の位置を確認するた
めの改良された手段および方法に関するものであって、
これは位置確認された文字に文字認識技術を適用するの
に先立つものである。
多くの文字認識システムでは、文字認識技術を用いて
自動的に読み取られるべき文字の位置を確認することが
重大な課題となっている。この課題は、特に形のくずれ
た文字や紙のノイズがあったりするような、品質の悪い
印刷にかかわる場合、特に厳しいものとなる。
発明の概要 したがって、この発明の目的は、広くは、文字認識シ
ステムで文字の位置を確認するための改良された手段お
よび方法を提供することである。
この発明のさらに特定的な目的は、品質の悪い印刷が
かかわる場合に文字の位置を確認するための改良された
手段および方法を提供することである。
上述の目的に従う、この発明の他の目的は、比較的単
純かつ経済的な態様で文字の位置確認を実現させること
である。
この発明の特定的な好ましい実施例では、文字の位置
確認は、文字要素である可能性のある部分を含む画像が
上下左右の方向にスミアを生じるようにされる、新規な
アプローチを用いて行なわれる。その後、その結果得ら
れたスミアの生じた画像を用いて文字フレームの候補を
生成し、それら文字フレームの候補は文字のサイズにど
の程度よく対応しているかに基づいて評価される。これ
らの候補となる文字フレームは、次にそれらが文字認識
の対象となるべき特定の文字フレームを選択するという
目的にとって適切な位置にあるかどうかに基づいて、さ
らに評価される。
この発明の特定的な性質ならびに他の目的、特徴、用
途および利点は、以下に述べる詳細な説明を添付の図面
と関連させながら読めば明らかになるであろう。
図面の簡単な説明 図1は、この発明を取り入れた文字認識システムの全
体的なブロック図である。
図2は、図1に示した文字位置確認装置12の好ましい
実施例を表わすブロック図である。
図3は、文書上の文字の行、およびこれらの文字を走
査するために典型的に用いられるスキャンバンドを示す
概略図である。
図4は、この発明に従い、文字「6」を含むピクセル
画像が典型的にはどのように上および左の方向にスミア
を生じせられ得るかを示す図である。
図5は、図4と関連の凡例である。
図6は、図2のフレーマ26の好ましい実施例を示すブ
ロック図である。
図7は、図6で示したフレーマによって対が作られる
のに応用できる、典型的な水平の座標を示す表である。
図8は、図6のフレーマ出力制御48のための好ましい
状態図である。
図9は、図8で用いられるさまざまな略号の意味を記
した表である。
図10は、有効な長い縦方向マーカ(LVM)を含む画像
を示す。
図11は、無効な長い縦方向マーカ(LVM)を含む画像
を示す。
図12は、図2の出力決定回路50の好ましい実施例を示
すブロック図である。
図13は、図12の出力決定回路50により行なわれる適切
な典型的フィールド外機能を包括的に示すフローチャー
トである。
図14は、図12の出力決定回路50により行なわれる適切
な典型的フィールド内機能を包括的に示すフローチャー
トである。
詳細な説明 図面では、同様な番号は一貫して同様な要素にあては
まる。
ここで説明される装置および方法は、そうでない旨示
されている場合を除き、一般的に現在当該技術において
知られているように構成され、動作するものとして理解
される。
まず図1を参照して、画像キャプチャモジュール10
が、文書に含まるる文字の行の走査に対応するビデオ画
像10aを提供する。これらのビデオ画像10aは、文字位置
確認装置12に与えられる。文字位置確認装置12の基本的
な動作は、与えられたビデオ画像10aにおいて文字の位
置を確認すること、および文字認識回路14に信号12aを
送って位置確認された文字を認識させることである。画
像キャプチャモジュール10はまた、文字位置確認装置12
に信号10bを与えて、文書が存在することと、コントラ
ストなどのさまざまな画像特性とを示す。画像キャプチ
ャモジュール10と認識回路14とは、従来のものでよく、
したがってここでこれ以上説明されることはないという
ことは、理解されるであろう。
文字認識回路14によって認識された文字は、典型的に
は図1に示されるようにコンピュータ処理装置(CPU)1
5に与えられる。このCPU15は、典型的には文字位置確認
装置12に初期化および他の信号15bを与え、これらは文
字のサイズ、フォントの種類などである。文字位置確認
装置12はまた、特殊な文字の位置特性を示す出力12bをC
PU15に与える。
画像キャプチャモジュール10により与えられたビデオ
画像10aは、典型的には1回分の走査につき128個の「活
性」ピクセルと、少なくとも14個の「不活性」ピクセル
とを含む。1つのピクセルは、典型的には高さ4.6875ミ
ルで幅4.26ミルの画像エリアを表わす。
図2は、図1で示した文字位置確認装置12の好ましい
実施例を示す。図2からは、図1の画像キャプチャモジ
ュール10からのビデオ画像10aがダイナミックスキャン
バンド回路16に与えられるということが見て取れ、この
ダイナミックスキャンバンド回路16は典型的には128個
のピクセルからなる高さ0.6インチのスキャンバンドを
縦方向に提供する。よく知られているように、ダイナミ
ックスキャンバンド回路16はスキャンバンドの高さ(ス
キャナの視野)を制御するものであって、これは典型的
にはスキャンバンドの外辺近くのいかなる黒いマークが
位置検出に影響することをも阻止するために選択される
ものである。これは典型的には、対象となる予め定めら
れた領域の外側にあるすべてのピクセルを消去すること
によって行なわれる。スキャンバンドの高さは、CPU出
力16a(図1)または後に説明する出力決定回路50から
の出力50bによって制御できる。
図2のスキャンバッファ18は、ダイナミックスキャン
バンド回路16から受け取られた36回分の走査を連続的に
ストアかつ更新し、1回分の走査は縦(列)方向に128
個のピクセルを含む。図3は、スキャンバッファ18によ
ってもたらされる。文書11に対する典型的な右から左へ
の列走査を示すものである。各ピクセル時間ごとに、ス
トアされた36回分の走査の各々からのピクセル1つずつ
を表わすスキャンバッファ18の1行全体が、バッファ出
力18aとして利用可能になる。
スキャンバッファ出力18aはスミア回路20に与えら
れ、このスミア回路20は画像の中の黒いピクセル(潜在
的な文字要素)に上下左右の4方向へスミアを生じさせ
るよう動作する、好ましくは、スミア回路20によって提
供されるスミアは、典型的にはほぼ上下に1文字分の高
さと左右に1文字分の幅とで延びる。
図4は、文字「6」を構成するピクセルに対し上方向
および左方向にスミアの生じる様を表わす。図4では示
されていないが、下方向および右方向にもスミアは類似
の態様で生じる。図4から明らかとなるように、スミア
の発生は黒いピクセルからスミアの生じる方向に続くm
個の連続したピクセルを黒くするように設定することに
よって成し遂げられる。この場合のmはストアの長さで
ある。図5は図4に適用できる凡例である。
結果としてもたらされた、図2のスミア回路20によっ
て生成された4方向にスミアの生じた画像20aは、角検
出回路22に与えられ、文字の上端、下端、左端および右
端が検出される。これは、上下のスミアを用いて左右の
端を生成し、左右のスミアを用いて上下の端を生成する
ことによって成し遂げられる。たとえば、図4は文字
「6」の上および左へのスミアに対し左端および上端が
どのように決定されるかを示す。上および左へのスミア
のうち、上方向に生成されたスミア画像の各行に対し、
黒いピクセルを含む最も左の列に縦線24が位置づけられ
る。その場合、スミア画像の左端は、最も左にある縦線
24′となる。上および左へのスミアのうち、左方向に生
成されたスミア画像の各列に対しては、黒いピクセルを
含む最も上の行に水平な線26が位置付けられる。この場
合、上端は一番上の水平な線26′となる。
角検出回路22はスミアを生じた文字ピクセルの端の交
差に基づいて角を検出する。たとえば、これは図4で
は、左端24′と上端26′との交差により形成される左上
の角28によって示される。他の3つの角も類似の態様で
求められるということは理解されるであろう。
より特定的には、角検出回路22によって、以下に示す
態様で端の交差から角を検出できるようになる。
左上の角(TLC)は、左側のスミアから求められた上
端と上方のスミアから求められた左端との交差である。
右上の角(TRC)は、右側のスミアから求められた上
端と上方のスミアから求められた右端との交差である。
左下の角(BLC)は、左側のスミアから求められた下
端と下方のスミアから求められた左端との交差である。
右下の角(BRC)は、右側のスミアから求められた下
端と下方のスミアから求められた右端との交差である。
これより、角を求めるためのブール関数を示すが、こ
こにおいて記号は以下の意味を持つ。
m =ピクセルの行の位置 n =ピクセルの列の位置 U =上スミア画像 D =下スミア画像 R =右スミア画像 L =左スミア画像 HR =半幅右スミア画像 HRE=半幅右スミアイネーブル HL =半幅左スミア画像 HLE=半幅左スミアイネーブル ′ =ピクセル値の補数 右上の角: TRCmn=(UmnU′m(n+1))(RmnR′(m+1)n+HRmnHR′(m+1)nHRE) =UmnU′m(n+1)RmnR′(m+1)n+UmnU′m(n+1)HRmnHR′(m+1)nHRE 左上の角: TLCmn=(UmnU′m(n-1))(LmnL′(m+1)n+HLmnHL′(m+1)nHLE) =UmnU′m(n-1)LmnL′(m+1)n+UmnU′m(n-1)HLmnHL′(m+1)nHLE 右下の角: BRCmn=(DmnD′m(n+1))(RmnR′(m-1)n+HRmnHR′(m-1)nHRE) =DmnD′m(n+1)RmnR′(m-1)n+DmnD′m(n+1)HRmnHR′(m-1)nHRE 左下の角: BLCmn=(DmnD′m(n-1))(LmnL′(m-1)n+HLmnHL′(m-1)nHLE) =DmnD′m(n-1)LmnL′(m-1)n+DmnD′m(n-1)HLmnHL′(m-1)nHLE 図2の文字位置確認装置12の好ましい実施例の説明を
続けると、角検出回路22の出力22aはスキャンバッファ
出力18aとともにコーナフィルタ25に与えられ、コーナ
フィルタ25は検出された角の少なくとも1つについて濃
度チェックを行ない、その角が有効であるかどうかを判
断する。これは典型的には、その角によって境界が定め
られ、かつ文字の大きさに近い大きさの四角形の中に
(文字の存在を示す)しきい値の数だけのピクセルが存
在するか否かを判断することによって行なわれ、その結
果、スプリアスノイズによって誤って有効な角が検出さ
れてしまうことが防がれる。たとえば図4を参照して、
このしきい値(濃度)測定に用いられる典型的な四角形
の領域は、18×24個のピクセル(ほぼ文字のサイズ)か
らなり、左端24′と上端26′との交差により形成される
検出された角によって境界を定められるものであってよ
い。
図2で示されるように、フレーマ26がコーナフィルタ
25から出力25aを受取り、角検出回路22から出力22aを受
取る。コーナフィルタ25による濃度チェックで不合格だ
ったものは、捨てられる。フレーマ26の目的は、角検出
回路24によって検出された有効な角を用いて有効なフレ
ームを生成することであって、この有効なフレームは文
字サイズに基づいて評価された後、評価された候補文字
フレームとしてフレーマ出力26aを介して出力決定回路5
0へ送られる。またフレーマ出力26aは、スキャンセパレ
ータの形で位置および状態の情報(文書の存在およびフ
ォントの種類など)を含む。フレーマ26の好ましい実施
例は、図6で示される。
図6で示されるフレーマ26の好ましい実施例を参照し
て、左上の角(TLC)および右下の角(BRC)の情報がフ
レーマ入力制御40に与えられる。そこから、BRCの座標
およびセパレータが右下角FIFO42に書込まれ、対応する
可能性のあるTLC座標が左上角FIFO#1(44)と左上角F
IFO#2(46)とに同時に書込まれる。すべての座標の
水平成分が含む必要があるのは、文書11(図3)の右端
を基準とした走査の絶対番号の6ビットのみである。ま
た、フレーマ入力制御40は図6で示されるようにFIFO4
2,44,および46に適切なリセット信号および書込信号を
与える。
フレーマ出力制御48は、BRC FIFO42からBRCおよびセ
パレータを読出す。セパレータは出力決定回路50(図
2)へ直接送られる。各BRCは、適切なTLC FIFO44また
は46に含まれる、あらゆるTLCと個別に対にされる。典
型的な水平座標は、図7で示される。
図7では、最初の32回分の走査(16進法で走査00から
1F)におけるBRCが、TLC FIFO#1(TL1)に含まれる
すべてのTRCと組合わされており、その一方で次の32回
分の走査(16進法で走査20から3F)からのBRCはTLC FI
FO#2(TL2)に含まれるすべてのTRCと組合わされてい
るということに注目されたい。所与のBRC/TLC対が特定
のフォントのために適切な高さおよび幅のフレームを形
成する場合、かつ反対の角BLCおよびTRCが存在する場
合、その対は有効なフレームを作り出す。さらに図7と
の関連で、TL1およびTL2は16進法で走査40回ごとに角を
クリアされるということ、すなわちTL1は16進法の走査
0,40などでリセットされ、TL2は16進法の走査20,60など
でリセットされるということに注目されたい。
要約すると、図6のフレーマ出力制御48の働きは、
(1)スキャンセパレータを図2の出力決定回路50に送
ること、(2)各右下の角(BRC)を選択されたFIFO44
または46からのそれぞれの左上の角(TLC)と対にする
こと、(3)TLCおよびBRCの角の対から、選択されたフ
ォントのために受入可能な幅と高さの、有効である可能
性があるフレームを決定すること、(4)これらの有効
である可能性のあるフレームから、フレームの他の2つ
の角BLCおよびTRCの存在に基づいて有効なフレームを選
択すること、(5)これらの有効なフレームがどの程度
文字サイズに対応するかに基づいてこれらを評価するこ
と、および(6)これらの評価された有効なフレーム
を、候補となる文字フレームとして出力決定回路50(図
2)へ送ることである。図6に示されるように、フレー
マ出力制御48は適切な読出信号および再送信号をFIFO4
2,44および46に与えて、それらに対するTLC、BRC、およ
びスキャンセパレータ信号のフィードを制御し、その一
方で同じく図6で示されるように、FIFO42,44および46
は適切なデータ存在信号をフレーム出力制御48に与えて
データが存在するときを示し、フレーマ入力制御40は選
択信号40aをフレーマ出力制御48に与えて、それはフレ
ーマ出力制御48によって、適切な左上FIFO44または46を
選択するのに用いられる。
図6のフレーマ出力制御48のための好ましい状態図は
図8で表される。図9は図8で用いられるさまざまな略
号の意味を記した表である。有効なフレームの評価は、
典型的には以下に示す方程式に従って求められる。
評価=100−[2*abs(フォント幅−フレーム幅) +3*abs(フォント高さ−フレーム高さ)] 図2に戻って、すぐ前で説明したフレーマ26の出力26
aは出力決定回路50に与えられるということが見て取れ
るだろう。出力決定回路50には、リジェクトフラグ回路
52、ストローク幅検知器54、および長い縦方向マーク検
出器56からの出力も与えられる。これらの構成要素52,5
4および56は、フレーマ26によって提供される評価され
た候補となる文字フレームとともに、どの文字フレーム
が最終的に文字認識回路14(図1)に送られるのかとい
うことと、CPU15(図1)に送られるべき特定の信号と
を決定するにあたり、出力決定回路50によって用いられ
るために提供される。
図2のリジェクトフラグ回路52は、スキャンバッファ
出力18aとスミア回路出力20bとに応答して動作し、予想
される文字サイズよりずっと大きく、したがって上述の
スミアによるアプローチを用いて有効な文字フレームを
生成しないかもしれないマークにフラグを立てる。これ
らのマークを検出するため、フラグ回路52は1ピクセル
幅で読取り不能最小高さ(文字セットにおける最も小さ
い文字の高さ)の寸法のウィンドウを用いる。この1ピ
クセル幅のウィンドウを、(スミア回路出力20bによっ
て提供される)右方向へのスミア画像の各列ごとに、上
方向に移動させる。ウィンドウが一度でもしきい値数の
黒いピクセルで満たされることがあれば、その列にフラ
グが立てられる。また、フラグを立てられた各列につい
て、ウィンドウがしきい値数の黒いピクセルを含む最初
および最後のときのウィンドウの一番上の行がストアさ
れる。フラグ回路出力52aは、これらの動作の結果を出
力決定回路50に与えて、これは文字認識回路14(図1)
に送られるべき文字フレームを決定するのに用いられ
る。
図2のストローク幅検知器54は、紙のノイズ(不必要
なマーク)が過剰に存在するために有効なフレームが認
識されないかもしれない場合、またはいくつかの文字が
一緒につながっている場合、または署名などの予測され
ないマークが文字のフィールド内まで延びている場合な
どの状況に対処するために提案される。ストローク幅検
知器54の基本的な目的は、フレーマ26によって発見され
ていなくても文字が存在するかどうかを判断することで
ある。ストローク幅検知器54は、文字が存在することを
示すストローク幅を有するマークがフレーム内にあるか
どうかを判断することによって、文字が存在し得るかど
うかを判断する。そのようなストローク幅の存在を判断
するやり方の一例は、各スキャンごとに上に動かされ
る、2ピクセル高さと1ピクセル幅の寸法のウィンドウ
を提供することである。2つの連続する黒いピクセル
(最小の文字ストローク幅)によりウィンドウが満たさ
れると、カウントがリセットされ、ウィンドウの頂部に
対応するピクセルに位置に対応して確保されたメモリ内
の記憶領域に0がストアされる。ウィンドウに2つの黒
いピクセルが含まれない場合、カウンタは加算され、そ
のときのウィンドウの頂部に対応するピクセル位置に対
応して確保されたメモリ位置にカウンタの値がストアさ
れる。その場合、各ピクセル位置に対応したメモリ位置
には、走査された中で最も近くにあった、ストローク幅
のサイズを持つマークからの距離がストアされている。
これらのストアされた値により、文字が存在するかどう
かの判断が下せるようになる。ストローク幅検知器出力
54aは、これらの動作の結果を出力決定回路50に与え、
出力決定回路50はこの結果を用いて、文字のピッチおよ
び前の文字の情報に基づき、対応する文字フレームを文
字認識回路14(図1)に送る。
図2の長い縦方向マーク検出器56は、スキャンバッフ
ァ18からのスミアを生じさせられていないスキャンバッ
ファ出力18aで動作して、その幾何学的形状のために、
上述のスミアによるアプローチを用いて有効なフレーム
を示す角を提供することのないかもしれない長い縦方向
マーク(LVM)を検出する。LVMは、典型的には(1)2
個から9個の連続する黒い列を含み、かつ(2)少なく
とも1つの白い列をその右端に隣接する4つの列の中お
よび左端に隣接する4つの列の中に有するものとして、
規定されるだろう。たとえば、黒い列は32ピクセルウィ
ンドウ内に30個の黒いピクセルを含む黒い領域を有する
ものである。白い列は、たとえば黒い列の中の黒い領域
の最も高いところと最も低いところとの間に、2つの連
続する黒いピクセルを有していないものである。図10は
有効であるLVMの一例を示し、図11は無効であるLVMを示
す。長い縦方向マーク検出器56は、検出されたLVMを示
す出力56aを出力決定回路50に与える。
ここで、図2の出力決定回路50についてより詳細に考
察する。出力決定回路50の主要な目的は、フレーマ26に
よってもたらされる評価された候補となる文字フレー
ム、ならびにリジェクトフラグ回路52、ストローク幅検
知器54および長い縦方向マーク検出器56のそれぞれの出
力52a,54aおよび56aに応答して文字認識回路14(図1)
に送られるべき文字フレームを最終的に決定することで
ある。次に、出力決定回路50の好ましい実施例を図12に
示されるブロック概略図を参照して説明する。
出力決定回路50は、動作の基本的なモードを2つ有し
ており、これらはすなわち(1)フィールド外モード、
および(2)フィールド内モードである。フィールド外
モードは有効な文字フレームがまだ全く見つかっていな
い状況に対応する。フィールド内モードは有効な文字フ
レームが少なくとも1つ見つかっている状況に対応す
る。これらのモードに関連しての出力決定回路50の動作
は、デジタルシグナルプロセッサ(DSP)60によって制
御される。決定出力回路50はまた、デュアルポートSRAM
66、位置認識FIFO68、フレーマデータ存在ポート70、プ
ログラムメモリ72、データメモリ74、コマンド/応答レ
ジスタ76、ダイナミックスキャンバンドポート78、およ
び文字認識回路ポート80を含む。各モードにおける、図
12に示した出力決定回路50の好ましい実施例の動作を、
これより詳細に考察する。
フィールド外モード フレーマ出力26aに与えられるデータ存在信号の最上
位ビットがモニタされる。その値が1に等しければ、DS
P60はフレーマFIFOポート62からワードを1つ読出す。
このワードのビット15は、残りのビットが現在の走査に
関するステータス情報を含むのか(WT=1)、それとも
現在の走査に見出されたフレームに関する情報を含む
(WT=0)のかを示す。前者の場合、ビット12はどのフ
ォントパラメータが走査に適用されるのか(最初のフォ
ントならF=0、2番目のフォントならF=1)を示
し、ビット13は現在の走査が文書内にあるかどうかを示
す(DP=1)。後者の場合には、ビット0ないし6は現
在の走査で見出されるフレームの右下の角におけるy座
標を与え、ビット7ないし13はこのフレームの基本とな
る評価を含む。ステータス情報を含むワードは、あらゆ
る走査の初めで一度生じ、フレーム情報を含むワードは
フレーマによって現在の走査の中で見つかる新しいフレ
ームのあらゆるものについて一度に生じる。
フレーマFIFOポート64は、ポート61の中に見つかる各
フレーム情報ワードにつき1つの付加的なワードを含
む。このワードのビット0ないし6はフレームの左上の
角のy座標を含み、ビット7ないし12は右上の角と左上
の角との間の水平な距離を含む。フレーム情報ワードが
ポート62から読出されるたびに、フレーマポート64が読
出されてこれらのワードの間に1対1の対応関係を保
つ。
現在の走査において候補となる文字フレームが見つか
ると、最適なフレームを求めて次の10回分の走査がサー
チされ、フィールド内モード(後の部分で説明)に入
る。基本となる評価の最も高いフレームが、中央に置か
れ、図2で示されるように、出力50aを介して、対応す
るスキャンバッファ出力18aとともに文字認識回路14に
送られる。
候補となる文字フレームが全く見つからなかった場
合、長い縦方向マーク(LVM)が検出されたかどうかを
判断するためにチェックが行なわれる。これは、チェッ
クSRAM66によって成し遂げられる。SRAM66は、前の64回
分の走査における、長い縦方向マーク検出器56(図2)
によるLVMの検出を示す情報をストアする。各走査によ
り、128バイトの情報が生成される。1回の走査におけ
る最初のバイトのビット7は、その走査が文字程度のサ
イズのデータであるかどうかを示すフラグ(R)を含む
(すなわち、次のスミア幅の数の走査のうちのどこか
に、現在のフォントのための最小高さの文字と同じくら
いの高さのものがあれば、R=1である)。残りの7ビ
ットは、しきい値(リジェクトノイズマージン)数の黒
いピクセルで満たされた最初のときのリジェクト最小高
さのウィンドウの頂部の縦方向の位置を与える。この値
は、リジェクト領域のおおよその底部を見い出すのに用
いられる。走査における2番目のバイトは、ビット0な
いし6においてリジェクト領域の絶対高さを含み、ビッ
ト7は走査がLVMの一部であるときにいつもセットされ
るフラグ(L)を含む。バイト2ないし127は、その列
における最も近い2つの連続する黒いピクセルの上方の
縦方向の距離を示す値を、その下位7ビットに含む。最
上位ビットは実際のピクセル値を含み、アドレスビット
7ないし12は走査番号を示し、ビット0ないし6は走査
中のバイト番号を示す。
対象となる走査においてLVMフラグが見つかると、LVM
コードが出力50c(図2)を介してCPU15(図1)に送ら
れる。潜在的なフレームのサーチは、その場合LVMの左
端でフィールド外モードで続けられる。
潜在的フレームもLVMも見つからなかった場合、DSP60
がSRAM66をサーチし、リジェクトフラグ回路52(図2)
によってリジェクトにフラグが立てられたかどうかを判
断し、その結果は出力12aを介してCPU15(図1)に送ら
れる。その後潜在的フレームのサーチが、次の列で続け
られる。
図13は出力決定回路50によって行なわれる適切かつ典
型的なフィールド外機能を包括的に示すフローチャート
である。
フィールド内モード 前の文字の終わりから次の文字の予想される中央を通
り過ぎてすぐのところまでの列で始まる、すべての候補
となる文字フレームは、最も評価の高いものを求めて検
査される。前の文字との関係でのフレームの位置に応じ
て、評価にはボーナス点が加えられる。候補となる文字
フレームの最終的な評価は、したがって文字サイズに基
づいてフレーマ26によって与えられた評価に、そのフレ
ームが予想される位置にあるかどうかに基づき(たとえ
ば文字ピッチに基づき)、出力決定回路50によって与え
られたボーナス評価を加えたものの和となる。
その結果得られる最も評価の高い候補となる文字フレ
ームが次に選択され、前の文字の情報を用いてその高さ
または幅に対する必要な調製があれば行なわれる。フレ
ームは文字認識回路14のための適切なボックス内の中央
に位置付けられる。ボックスのサイズは、典型的には4
つの方向すべてに向けてテンプレートのサイズよりも2
ピクセル分大きくなっているので、認識回路14は文字を
上下左右にピクセル2つ分シフトできる。
LVMは、文字認識回路14からは独立して認識される。
最も評価の高いフレームがLVMの寸法に一致する場合、
そのフレームはLVMとして認識される。フレームが見出
され、その寸法がLVMの寸法と一致しない場合、前の文
字の左端と現在の文字の右端との間のエリアが、LVMフ
ラグを求めてチェックされる。フレームが全く見つから
ない場合、LVMフラグの存在を求めて、サーチエリア全
体がチェックされる。LVMが検出されるこれらのすべて
の場合には、それを知らされるのはCPU15(図1)のみ
である。
フレームもLVMも見つからなかった場合、ピッチ、な
らびに前記のフレームの頂部および底部の情報を用いて
潜在的フレームが形成される。この場合、ストローク幅
検知値54(図2)によって提供され、SRAM66にストアさ
れる黒い点のカウントが、この領域にストローク幅のサ
イズマークがあるかどうかを判断するのに用いられる。
マークがあれば、フレームは認識回路14に送られる。な
ければ、フィールド内モードから出ることになる。
図14は、出力決定回路50によって行なわれる適切かつ
典型的なフィールド内機能を包括的に示すフローチャー
トである。
ここで説明されたこの発明の好ましい実施例は、単に
例示的なものであって、発明の精神から逸脱することな
く、この発明には構成、配列および用途において多くの
修正および変形が可能であるということは理解されるで
あろう。したがって、この発明は後に記載する請求の範
囲によって規定される発明の範囲の中に入るものとし
て、すべての修正および変形を含むものであると考えら
れるべきである。
フロントページの続き (72)発明者 ベントレイ,ウェイン・エイチ アメリカ合衆国、48170 ミシガン州、 プリマス、ブランシェ・アパートメン ト・4、301 (72)発明者 カリー,ジョン・エフ アメリカ合衆国、48331 ミシガン州、 ファーミントン・ヒルズ、グロウスタ ー・サークル、34083 (72)発明者 レブス,スティーブ・アール アメリカ合衆国、48197 ミシガン州、 イプシランティ、ハーバー・コーブ、 9607 (72)発明者 リドル,ロジャー・イー アメリカ合衆国、48187 ミシガン州、 キャントン、ハンフォード、45719 (58)調査した分野(Int.Cl.7,DB名) G06K 9/34

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】文字の行を認識するための文字認識システ
    ムで用いる文字位置確認装置であって、 文字の行の走査に対応する画像を提供する画像キャプチ
    ャ手段を含み、前記画像の1または2以上には文字要素
    が含まれ、さらに 前記画像キャプチャ手段によって生成された画像を連続
    的にストアするためのスキャンバッファと、 前記スキャンバッファに結合され、画像中の文字要素に
    対し第1および第2の方向へスミアを生じさせるための
    スミア回路とを含み、前記第1の方向は前記行に平行で
    あり、前記第2の方向は前記行に垂直であり、さらに 前記スミア回路に結合され、前記第1および第2の方向
    にスミアを生じさせられた文字要素の端の交差に基づい
    て角を検出するための角検出回路と、 前記角検出回路に結合され、前記角検出回路によって検
    出された角について濃度チェックを行ない、その角が有
    効であるかどうかを判断するためのコーナーフィルタ
    と、 前記角検出回路に結合され、前記角検出回路によって検
    出された角に応答して候補となる文字フレームを生成す
    るためのフレーマと、 前記フレーマに結合され、前記候補となる文字フレーム
    のいずれが文字認識の対象となるべきであるかを判断す
    るための決定回路とを含む、装置。
  2. 【請求項2】前記スミア回路は第3および第4の方向に
    もスミアを生じさせ、前記第3の方向は前記第1の方向
    に平行かつ逆であり、前記第4の方向は前記第2の方向
    に平行かつ逆であり、前記角検出回路は前記第3および
    第4の方向にスミアの生じた文字要素の端の交差に基づ
    いて角を検出し、前記フレーマは前記第1および第2の
    方向に生じたスミアに応答して検出された角を前記第3
    および第4の方向に生じたスミアに応答して検出された
    角と組合わせることによって候補となる文字フレームを
    生成する、請求項1に記載の装置。
  3. 【請求項3】前記フレーマは候補となる文字フレームを
    文字サイズとの関係に基づいて評価して、前記評価を前
    記決定回路に与え、前記決定回路は前記評価を用いてど
    の文字フレームが文字認識の対象となるべきであるかを
    判断する、請求項2に記載の装置。
  4. 【請求項4】前記出力決定回路は候補となる文字フレー
    ムに対してそれが予想される位置にあるかどうかに基づ
    きボーナス評価を加え、その結果得られた最も評価の高
    い候補となる文字フレームが文字認識の対象となる、請
    求項3に記載の装置。
  5. 【請求項5】前記スキャンバッファに結合され、文字の
    存在することを示すストローク幅を有するマークを画像
    が含むかどうかの判断に基づいて、あるかもしれない文
    字の存在を判断するためのストローク幅検知器を含み、
    前記ストローク幅検知器の出力は前記決定回路に与えら
    れる、請求項2に記載の装置。
  6. 【請求項6】前記スキャンバッファに結合され、長い縦
    方向マークを検出するための長い縦方向マーク検出器を
    含み、前記縦方向マーク検出器の出力は前記決定回路に
    与えられる、請求項2に記載の装置。
  7. 【請求項7】前記スミア回路に結合され、予想される文
    字サイズよりもずっと大きいマークにフラグを立てるた
    めのリジェクトフラグ回路を含み、前記リジェクトフラ
    グ回路の出力は前記決定回路に与えられる、請求項2に
    記載の装置。
  8. 【請求項8】文字認識システムにおいて文字の行内の文
    字位置を確認するための電子的に実現された方法であっ
    て、 前記行を走査して文字要素が含まれる画像を提供するス
    テップと、 前記文字要素をストアするステップと、 ストアされた文字要素に少なくとも第1および第2の異
    なる方向へスミアを生じさせるステップとを含み、前記
    第1の方向は前記行に平行であり、前記第2の方向は前
    記行に垂直であり、さらに 前記第1および第2の方向にスミアを生じた文字要素の
    端の交差に基づいて文字の角を検出するステップと、 検出された角について濃度チェックを行ない、その角が
    有効かどうかを判断することによって検出された角をフ
    ィルタリングするステップと、 有効な検出された角に応答して候補となる文字フレーム
    を生成するステップと、 どの文字フレームが文字認識の対象となるべきであるか
    を、文字フレームが文字を含む可能性に基づいて判断す
    るステップとを含む、方法。
  9. 【請求項9】前記スミアを生じさせるステップは、前記
    文字要素に対し前記第1および第2の方向とは異なる第
    3および第4の方向にもスミアを生じさせる、請求項8
    に記載の方法。
  10. 【請求項10】前記文字は行に配列され、前記第1およ
    び第3の方向は前記行に平行かつ互いに逆であり、前記
    第2および第4の方向は前記行に垂直かつ互いに逆であ
    り、前記検出するステップは前記第3および第4の方向
    にスミアの生じた文字要素の端の交差に基づく角をも検
    出し、前記生成するステップは前記第1および第2の方
    向に生じたスミアに応じて検出された角を前記第3およ
    び第4の方向に生じたスミアに応答して検出された角と
    組合わせるステップを含む、請求項9に記載の方法。
  11. 【請求項11】前記スミアはほぼ前記第2および第4の
    方向に1文字分の高さであり、前記第1および第3の方
    向に1文字分の幅である、請求項10に記載の方法。
  12. 【請求項12】前記生成するステップは、文字サイズに
    基づいて候補となる文字フレームを評価するステップを
    含み、前記判断するステップは前記評価に基づいて文字
    認識の対象となる文字フレームを選択する、請求項10に
    記載の方法。
  13. 【請求項13】前記判断するステップは、候補となる文
    字フレームに対しそれが予想される位置にあるかどうか
    に基づいてボーナス評価を加えるステップを含む、請求
    項12に記載の方法。
JP50537593A 1991-09-06 1992-09-01 文字認識システムで用いる文字位置確認装置および方法 Expired - Fee Related JP3209746B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US755,722 1991-09-06
US07/755,722 US5267325A (en) 1991-09-06 1991-09-06 Locating characters for character recognition
PCT/US1992/007405 WO1993005607A1 (en) 1991-09-06 1992-09-01 Locating characters for character recognition

Publications (2)

Publication Number Publication Date
JPH06510387A JPH06510387A (ja) 1994-11-17
JP3209746B2 true JP3209746B2 (ja) 2001-09-17

Family

ID=25040369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50537593A Expired - Fee Related JP3209746B2 (ja) 1991-09-06 1992-09-01 文字認識システムで用いる文字位置確認装置および方法

Country Status (5)

Country Link
US (1) US5267325A (ja)
EP (1) EP0602180B1 (ja)
JP (1) JP3209746B2 (ja)
DE (1) DE69219346T2 (ja)
WO (1) WO1993005607A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0609474A1 (en) * 1993-02-03 1994-08-10 International Business Machines Corporation Method and apparatus for transforming an image for classification or pattern recognition
JP3237975B2 (ja) * 1993-09-20 2001-12-10 富士通株式会社 画像処理装置
EP0667533A3 (en) * 1994-02-14 1996-06-12 Hewlett Packard Co Signal loss detector.
US5638459A (en) * 1994-09-20 1997-06-10 Neopath, Inc. Method and apparatus for detecting a microscope slide coverslip
JP2007503641A (ja) * 2003-08-25 2007-02-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像強調
KR100657915B1 (ko) * 2004-11-26 2006-12-14 삼성전자주식회사 코너 검출 방법 및 코너 검출 장치
US20070071324A1 (en) * 2005-09-27 2007-03-29 Lexmark International, Inc. Method for determining corners of an object represented by image data
KR100833346B1 (ko) 2007-01-03 2008-05-28 (주)폴리다임 디스플레이 장치에 표시된 문자 이미지의 픽셀 단위 가로폭 측정 방법
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
US11010768B2 (en) * 2015-04-30 2021-05-18 Oracle International Corporation Character-based attribute value extraction system
CN111563512B (zh) * 2020-04-30 2024-03-08 广东小天才科技有限公司 一种答案自动涂抹的方法、装置、电子设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4517607A (en) * 1981-11-09 1985-05-14 Ricoh Company, Ltd. Method of and apparatus for compensating image in image reproduction system
US4897806A (en) * 1985-06-19 1990-01-30 Pixar Pseudo-random point sampling techniques in computer graphics
US4748507A (en) * 1986-10-17 1988-05-31 Kenneth Gural Solid state imaging device having means to shift the image between scans and associated circuitry to improve the scanned image
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPH01168163A (ja) * 1987-12-23 1989-07-03 Fuji Xerox Co Ltd 画像処理装置
JPH06101049B2 (ja) * 1988-03-25 1994-12-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 文字列検出方法
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5142273A (en) * 1990-09-20 1992-08-25 Ampex Corporation System for generating color blended video signal

Also Published As

Publication number Publication date
WO1993005607A1 (en) 1993-03-18
DE69219346D1 (de) 1997-05-28
JPH06510387A (ja) 1994-11-17
DE69219346T2 (de) 1997-11-20
EP0602180A1 (en) 1994-06-22
US5267325A (en) 1993-11-30
EP0602180B1 (en) 1997-04-23

Similar Documents

Publication Publication Date Title
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
US5016118A (en) Image determining method and apparatus
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
US7689004B2 (en) Method and apparatus for evaluating the quality of document images
US20020150279A1 (en) Method of determining usability of a document image and an apparatus therefor
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP3209746B2 (ja) 文字認識システムで用いる文字位置確認装置および方法
US7003159B2 (en) Document frame recognition system and method
JP3238504B2 (ja) 書類分類方法
US5467410A (en) Identification of a blank page in an image processing system
US5995661A (en) Image boundary detection for a scanned image
US4901365A (en) Method of searching binary images to find search regions in which straight lines may be found
US6175423B1 (en) Image forming system for arranging plurality of images on a disk play medium
CA2189434A1 (en) Automatic determination of blank pages and bounding boxes for binary images
US4242734A (en) Image corner detector using Haar coefficients
JP3132771B2 (ja) 画像蓄積装置及びこれを具える画像処理装置
JPS6343788B2 (ja)
JPH0822507A (ja) 文書認識装置
JP2639165B2 (ja) 文字切出装置
JPH0214392A (ja) 文書領域解析装置
JPH04225474A (ja) イメージスキャナによる図面自動作製システム
JP3036559B2 (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JP3302060B2 (ja) 領域判別方法及び装置
JPH05266250A (ja) 文字列検出装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070713

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080713

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080713

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090713

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees