JP3586911B2 - 枠線認識装置 - Google Patents

枠線認識装置 Download PDF

Info

Publication number
JP3586911B2
JP3586911B2 JP01686295A JP1686295A JP3586911B2 JP 3586911 B2 JP3586911 B2 JP 3586911B2 JP 01686295 A JP01686295 A JP 01686295A JP 1686295 A JP1686295 A JP 1686295A JP 3586911 B2 JP3586911 B2 JP 3586911B2
Authority
JP
Japan
Prior art keywords
component
frame
frame line
joint
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01686295A
Other languages
English (en)
Other versions
JPH08212292A (ja
Inventor
豊樹 川原
淳晴 山本
祐二 丸山
秀彦 川上
龍次 山崎
幹男 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP01686295A priority Critical patent/JP3586911B2/ja
Publication of JPH08212292A publication Critical patent/JPH08212292A/ja
Application granted granted Critical
Publication of JP3586911B2 publication Critical patent/JP3586911B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、帳票のような枠線と文字を含む画像の枠線の構造を自動的に認識し、帳票内に記入されている文字領域を切り出し、文字を自動認識するための前処理装置である枠線認識装置に関するものである。
【0002】
【従来の技術】
近年、文書情報の電子化に伴い、OCR(Optical Character Reader)を初めとする文字認識技術や文書画像処理に対する要望が高まっており、帳票の枠線構造の認識もそのひとつである。
【0003】
帳票の枠線認識として、枠線のラン長で線分を検出する方法が良く知られており例えば特開平01−217583号公報であり、その実施例を第22図を基に説明する。画像入力部1001は認識対象罫線を含む画像を走査し2値信号で画像メモリ1002に格納する。縦方向ラン抽出部1003は画像メモリ1002に格納されている画像を縦方向に走査して縦方向ランを抽出する。抽出された縦方向のランの連結性が縦方向線分抽出部1004で調べられ縦方向線分が抽出される。同様の処理により横方向ラン抽出部1005で横方向ランが抽出され、横方向線分抽出部1006で横方向線が分抽出される。文字領域抽出部1007は縦方向線分抽出部1004で抽出された縦方向線分と横方向線分抽出部1006で抽出された横方向線分を用いて文字領域および文字記入領域を抽出する。
【0004】
また、切り出された文字認識については、各種方式が提案されており例えば、ニューラルネットを用いた文字認識法(森:”PDPモデルによる手書き漢字認識”、電子情報通信学会論文誌、Vol.J73−D−II, No.8 pp.1268−1274 1990)があり、認識率も実用的なところまできているが、今回は帳票の枠線認識装置ということで文字認識の前処理に限定しているので文字認識に関しては省略するものとする。
【0005】
【発明が解決しようとする課題】
しかしながら前記の従来の構成では、枠線(罫線を以後枠線と呼ぶ)が細い場合や帳票が傾いて画像として読み取られた場合は、ラン長で枠線を認識することが難しく、検出するラン長を短く設定すると枠線以外の線分が抽出され誤検出するという課題がある。
【0006】
本願発明は、前記従来技術の課題を解決するもので、特に枠線が細い場合や帳票が傾いて読み取られた場合に対して正確で信頼性の高い枠線認識装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
この目的を達成するために本発明は、例えば帳票から自動的に枠線を認識し文字領域を切り出す際に、帳票を読み取り2値画像を出力するイメージスキャナーと、前記イメージスキャナーからの2値画像(文字、枠線を”0”、その他を”1”)から帳票の枠線のエッジに方向コードを付与し、その方向コードの変化する点を画像のコーナーとし、その特徴コードと座標をコーナー特徴点として抽出するコーナー検出手段と、近傍の前記コーナー特徴点の組合せから(T字、十字およびL字等の)枠線の構成要素を抽出する構成要素抽出手段と、前記構成要素抽出手段からの構成要素をもとに、注目構成要素を基準に右回り(あるいは左)に周辺の構成要素を検索し相手となる構成要素を連結し元に戻るまで繰り返し最小矩形を認識し矩形情報を出力する最小矩形認識手段と、前記最小矩形認識手段からの矩形情報の任意の角を基準とした連結する最小矩形を認識する構造認識手段と、前記構造認識手段からの枠線の構造から文字領域を切り出す文字切り出し手段とを設けたものである。
【0008】
【作用】
本発明は前記構成によって、帳票の2値画像から枠のコーナー点を抽出し、コーナー点から枠線の構成要素を抽出し、相互に連結された構成要素から帳票の最小矩形を認識することにより、帳票の枠線が細い場合や帳票が傾いて読み取られた場合においても信頼性の高い枠線認識装置を実現できる。
【0009】
【実施例】
以下、本発明の一実施例について、図面を参照しながら説明する。
【0010】
図1は本発明の一実施例における枠線認識装置のブロック構成図である。101は帳票を読み取り2値画像を出力するイメージスキャナー、102は枠線の輪郭に方向コードを付与しその変化点をコーナー特徴点として出力するコーナー検出手段、103は注目コーナー特徴点とその周辺コーナー特徴点から枠線の構成要素を抽出する構成要素抽出手段、104は枠線の構成要素から最小矩形を構成するように構成要素を連結して最小矩形を認識する最小矩形認識手段、105は各最小矩形から木構造を生成し枠線の構造を認識する構造認識手段、106は枠線の構造から文字領域を切り出す文字切り出し手段である。
【0011】
以上のように構成された枠線認識装置について、その動作を説明する。
イメージスキャナー101により、帳票を読み取り2値画像に変換し、その2値画像からコーナー検出手段102により、帳票の枠線の輪郭に方向コードを付与してその変化点をコーナー特徴点として出力し、構成要素抽出手段103により、注目コーナー特徴点とその周辺コーナー特徴点から枠線の構成要素を抽出し、その構成要素から最小矩形認識手段104により、最小矩形を認識して出力し、各最小矩形から構造認識手段105により、連結する矩形の木構造を生成して枠線の構造を認識し、その枠線の構造から文字切り出し手段106により、文字領域を切り出して、枠線を認識するものである。
【0012】
次に各構成要素の動作を詳細に説明する。帳票を読み取り2値画像を出力するイメージスキャナー101は、線密度を約400dpi程度とし、原稿である帳票にLED(発光ダイオード)等で照明しその反射光を一次元のCCDカメラで読み取り、任意の閾値で2値化して2値画像を出力するものである。また、照明は原稿である帳票の枠線や記入された文字の色によって異なるが、例えば青・黒および赤等の枠線に対して、黒や青等で数字や記号および文字が記入された場合、緑あるいは黄緑の波長(550〜570nm付近)のLEDを用いることが多い。2値化処理においては、固定閾値法や浮動閾値法(森、大津:”認識問題としての二値化と各種方法の検討”、情報処理学会、イメージプロセッシング15−1, Nov. 1977)が良く知られている2値化処理法であり、原稿に合わせて任意の2値化処理法を選択すればよい。
【0013】
次に、コーナー検出手段102について説明する。コーナー検出手段102は、枠線の輪郭に方向コードを付与しその変化点をコーナー特徴点として出力するもので、図2に詳細ブロック図を示し説明する。
【0014】
図2において、201はスキャナー101からの2値画像110に8方向の方向コードを付与する方向コード付与手段、202は方向コードの変化する特徴点を検出し、方向コードの変化を表すコードおよび特徴点の座標をコーナー特徴点として抽出する特徴抽出手段を示す。本実施例においては、コーナー特徴点の検出方法として帳票の枠線の輪郭画素に方向コードを付与しその方向コードの変化点を検出することで、帳票の枠線のコーナーを検出するものである。方向コードを付与する方式は、フリーマンのチェインコード(H.Freeman:”Onthe encoding of arbitrary geometricconfigurations”、IRE Trans.Electron.Comput.EC−10、1961、pp260−268)がよく知られている。
【0015】
まず、方向コード付与手段201について、図3を用いて説明する。図3(a)は、方向コード付与手段201の回路構成図である。図3(a)において、211はラインメモリ、212は3×3の走査窓、213は走査窓212のビットパターンによって4ビットの方向コード画像214を出力するLUT(ルック・アップ・テーブル)を示す。方向コードは、図3(b)に示す様に、注目画素203から周辺の輪郭画素に向かう8方向を、方向コードとしてそれぞれ”1”〜”8”の値で表すものである。方向コード付与手段201は、2値画像101に対し3×3走査窓212で走査し、走査窓内からのビットパターンでLUT213を用いて4ビットの方向コードを出力する。またここでは、方向コードは、”1”から”8”としたが、”0”から”7”の値でもかまわない。
【0016】
LUT213は、予め計算によってデータを作成しておくもので、条件(数1)を満たすパターンに対して条件(数2)を満たす方向コードiを算出するもので、本実施例では右回り方向に方向コードを付与するものとする。ただし、条件(数3)を満たす例えば一画素幅の特殊なパターンに対しては値”a”を付与し、文字領域内部には値”f”、枠線部には値”0”をそれぞれ割り当てるものとする。
【0017】
【数1】
Figure 0003586911
【0018】
【数2】
Figure 0003586911
【0019】
【数3】
Figure 0003586911
【0020】
ここで、走査窓内の画素d1〜d8は、図3(a)の定義に従うものとする。なお、Nc(8)は8連結数、Nc(4)は4連結数と呼ばれ、パターンの連結性を示すパラメータとしてよく知られている。前記処理によって得られる方向コード画像の例を図4に示す。図4において、枠線215は”0”が割り当てられ、文字領域218のエッジに対して右回りに方向コード216が付与される。同様に、中央の文字217にも方向コードが付与される。
【0021】
次に、特徴抽出手段202について図5を用いて説明する。図5は、特徴抽出手段の回路構成図である。図5において、220はラインメモリ、221は多値の3×3走査窓、222は走査窓221からのD0信号231に従って、D1〜D8の信号230の出力を選択するMPX(マルチプレクサ)、223はMPX222からの出力228およびD0信号231を参照し、帳票の枠線を示すためのコーナー特徴点を出力するLUTを示す。本実施例においては、方向コードの変化する点を特徴点として抽出し、コーナーの形状を表す特徴コードとその座標をコーナー特徴点として通知するものである。以下に、特徴抽出手段202の動作について説明する。
【0022】
まず、方向コード付与手段201からの方向コード画像214を、走査窓221に入力し一画素づつ走査する。
【0023】
特徴抽出手段202は、走査窓221からのD1〜D8の方向コード信号230をそれぞれMPX222に入力し、注目画素位置D0の方向コード231が示す周辺の画素位置D1〜D8が選択される。注目画素D0の方向コード231と選択された周辺画素の方向コード228から、LUT223により特徴コードCfと同期信号227からXY座標発生器225で発生したXY座標とからなるコーナー特徴点229が出力される。また、特殊コード判定部224では、周辺画素の方向コード228の値が特殊コードである”a”が付与されているかを判定し、判定された結果はLUT223に通知し特徴コードCfとして値”a”を通知するものとする。特徴コードCfは、予め(数4)で演算した結果をLUT223に登録しておくものである。
【0024】
【数4】
Figure 0003586911
【0025】
ただし、Diは、方向コードD0が示す方向に隣接している画素の方向コードである。図6に特徴コードの例を示す。図6(a)は特徴コード値が”31”の例、同図(b)は特徴コード値が”17”の例、同図(c)は特徴コード値が”75”の例、同図(d)は特徴コード値が”53”の例、同図(e)は特徴コード値が”56”の例、同図(f)は特徴コード値が”61”の例をそれぞれ示すものである。なお本実施例では、右回り方向に方向コードを付与したが、左回りに付与してもよい。
【0026】
次に、構成要素抽出手段103、最小矩形認識手段104、構造認識手段105および文字切り出し手段106について説明するが、これらの具体的な処理は基本的にはソフトウエア処理が主体となるために共通な回路構成を図7に示し以下に説明する。図7において、111はコーナー検出手段102からのコーナー特徴点を入力するFIFO(ファースト・イン・ファースト・アウト)メモリ、112および113は各ソフトウエア処理を行うためのCPUとワークメモリ、107はスキャナー101からのデータを記憶するイメージメモリ、114はFIFO111及びイメージメモリ107のデータをCPU112とワークメモリ113に送るI/F回路である。115および116は今回は詳しくは触れないが文字部を切り出した後に文字認識部にデータを送るI/F回路および文字認識装置を示す。
まず、コーナー検出手段102で検出されたコーナー特徴点はFIFOメモリ111に入力され、逐次CPU112に読み込まれ一旦ワークメモリ113に記憶される。また、イメージメモリ107に記憶されたデータは、最後に文字の切り出し位置が確定した時点で文字領域が切り出されI/F115を介して今回は説明を省略した文字認識装置に送られ文字の認識が行われる。
【0027】
次に、構成要素抽出手段103について説明する。構成要素抽出手段103の処理の概念図を図8に示し説明する。図8において、245〜246はコーナー検出手段102からコーナー特徴点をFIFOメモリ111を介して得られたコーナー特徴点、244はコーナー特徴点の探索領域、241〜243は得られた構成要素を示す。まず発生順に得られたコーナー特徴点245を注目特徴点とした場合、コーナー特徴点245を中心に探索領域244内に対応するコーナー特徴点があるかどうかを探索する。例えば、L字の構成要素は図9(a)〜(d)に示す4種類、T字の構成要素は図9(e)〜(h)の4種類、十字の構成要素は1種類の組み合わせが存在する。このように枠線は、L字・T字および十字が組合わさって構成されており構成要素と構成要素とを接続することで枠線の骨格が構成できる。
構成要素抽出手段103の具体的な処理手順を図10に参照しながら説明する。
(1)コーナー特徴点をワークメモリ113から入力する。
(2)対象のコーナー特徴点が90゜のコーナー特徴点かどうかをチェックし、90゜コーナー特徴点ならそのまま(4)のステップへ、それ以外なら(3)のステップに進む。
(3)注目のコーナー特徴点の上位桁を始点として、任意の連結許容範囲Sr内で、かつ、図11(a)に示す探索範囲内に存在して、さらにコーナー特徴点が図11(b)に示す終点コーナー特徴点であれば、その特徴点を終点として連結して90゜コーナー特徴点とする。
(4)連結した90゜コーナー特徴点を図11(b)に示す参照コードに変換してワークメモリに記憶する。
(5)ワークメモリの全てのコーナー特徴点について、前記の処理が終了すれば(6)に進み、そうでない場合は(1)に進む。
(6)ワークメモリの中の90゜コーナー特徴点を対象点とする。対象点の参照コードCrを入力する。
(7)(数5)の式を満たす参照コードCpを持つ相手が、(数6)で表現される探索範囲に存在すれば、対象点はL字構成要素にグルーピングされるものとして(10)に進み、存在しなければ(8)に進む。ここで、例として、対象点255の参照コードCr=2の場合の探索範囲256を図12(a)に示す。
【0028】
【数5】
Figure 0003586911
【0029】
【数6】
Figure 0003586911
【0030】
ただし、グルーピング許容範囲:Gr、対象点座標:xr,yr、相手座標:xp,yp、対象点の参照コードCrとする。
(8)図12(b)のように、対象点257を中心にして水平または垂直方向に伸びたGr×2wの長方形探索領域258の中に存在する相手の参照コードが、(数7)また(数8)の条件を満たすかどうか調べる。
【0031】
【数7】
Figure 0003586911
【0032】
ただし、対象点の参照コードCr=4のときは、相手の参照コードCp=1とする。
【0033】
【数8】
Figure 0003586911
【0034】
ただし、対象点の参照コードCr=1のときは、相手の参照コードCp=4とする。
(9)(数7)かまたは(数8)のどちらかを満たす場合には、T字構成要素と判断し、また、(数7)と(数8)のどちらをも満たす場合には、十字構成要素と判断して(10)に進む。何れの条件も満たさない場合は(11)に進む。
(10)L字、T字および十字構成要素として認識された参照コードをグルーピングし図12(c)に示す要素コードデータに変換すると共に参照コードとグルーピングされた相手との平均座標を演算しワークメモリに記憶する。ただし、図12(c)における、E方向、N方向、W方向及びS方向はそれぞれ図12(d)に示す方向を表す。
(11)(9)の処理で何れの条件にも満たない参照コードは消去する。
(12)コーナー特徴点が全てグルーピングされた場合は処理を終了し、そうでない場合は(6)に進む。
以上の処理を行うことにより、図13に示す枠線のL、T、十字の各構成要素が抽出される。ただし、図13は、抽出された各構成要素(要素コード+平均座標データ)を枠線上に展開したものを示している。
【0035】
次に最小矩形認識手段104について説明する。最小矩形認識手段104は、枠線の構成要素を連結して最小矩形を認識するするもので、処理の概念を図14を用いて説明する。図14(a)は、最小矩形認識手段104の処理の概念を示すもので、各構成要素同士の手を連結させリンク線264(破線で示す)を仮想的に張り、最小矩形の始点265を矩形の左上として右回りにリンク線264をたどって元の始点に戻れば最小矩形267と認識したものとする。
最小矩形認識手段104の処理を、図15および図16に示した処理フローに従って詳細に説明する。最小矩形認識手段104の処理は大きく2つの処理から構成されており、各構成要素を連結する処理と連結したリンク線をたどって矩形を認識する処理である。図15に各構成要素を連結する処理フローを示し以下に説明する。
(1)構成要素データをワークメモリに読み込む。
(2)構成要素データの中から連結されていない対象点を順次選択する。
(3)対象点にまだ連結していない”手”がある場合、その手の伸びている方向を探索範囲として、図14(b)に示すような帳票の読み取り時の傾きと位置ずれを考慮した三角形探索領域269内で連結する相手を探す。この時、図14(c)に示すように対象点271の手273に対して逆方向の手274を持つ最短距離の相手272を探索する。
(4)前記条件を満たす相手が存在するかどうか判定し、ある場合は(5)へ進み、ない場合は(2)へ進む。
(5)対象点の手と相手の手を仮想的に連結し、記憶する。
(6)構成要素データに未連結の構成要素の有無をチェックし、Yの場合は(2) へNの場合は(7)に進む。
(7)次の矩形認識処理に進む。
図16に矩形認識処理の処理フローを示し、以下に説明する。基本的には、始点からE→S→W→Nと右回りにリンク線をたどり、行き止まりになれば前の要素に戻り新しい候補を選択して探索を繰り返し、最後に始点に戻ることのできる構成要素の集まりを最小矩形と認識するものである。
(8)連結された構成要素からE方向とS方向の手を持つ構成要素を探索し始点とする。まずその始点を対象点とする。
(9)対象点のE方向にリンク線で構成要素が連結しているがどうか調べ、Nなら(8)へYなら(10)に進む。
(10)連結しているE方向の構成要素を対象点にする。
(11)対象点のS方向にリンク線で構成要素が連結しているがどうか調べ、Nなら(9)へYなら(12)に進む。
(12)連結しているS方向の構成要素を対象点にする。
(13)対象点のW方向にリンク線で構成要素が連結しているがどうか調べ、Nなら(11)へYなら(14)に進む。
(14)連結しているW方向の構成要素を対象点にする。
(15)対象点のN方向にリンク線で構成要素が連結しているがどうか調べ、Nなら(13)へYなら(16)に進む。
(16)連結しているN方向の構成要素を対象点にする。
(17)この対象点が始点であるかどうか調べ、Nなら(15)へYなら(18)に進む。
(18)最小矩形として認識し、4角の座標を登録する。
(19)始点となる構成要素があれば(8)に戻り、なければ処理を終了する。
以上が矩形認識処理の処理フローである。
【0036】
次に、矩形認識処理を図17(a)(b)を用いて具体的に説明する。
まず、図17(a)において、EおよびS方向の手を持つ構成要素を始点280とする。始点280からみて右回りにリンク線284をたどり一周して始点280に戻れば最小矩形として認識する。始点280のE方向の手からリンク線284をたどり候補点a281を探索する。この時、候補点a281の手の方向をチェックすればS方向の手を持っていることがわかるので連結し、候補点a281を新たな対象点としてS方向にリンク線をたどり候補点b282を探索し、持っている手の方向をチェックする。この候補点b282は、W方向の手を持っていないので次に進むことができない。そこで、対象点(現在は候補点a)がE方向の手を持っているので、更にE方向を探索し候補点c283を探索し、手の方向をチェックする。候補点c283は、S方向の手を持っているので候補点c283を新たな対象点とする。次に、対象点(候補点c283)のS方向に連結している候補点d285がW方向の手を持っている事が分かり、さらに候補点d285のW方向に連結している候補点e286がN方向の手を持っているかどうかをチェックする。ここで、N方向に連結している候補点f287が始点かどうかをチェックするが、始点ではない。そこで、さらにN方向にリンク線をたどれば始点280に戻る事ができる。これで図17(b)のように、始点280、候補点c283、候補点d285および候補点e286の4点がリンクした最小矩形288を認識することができた。最後に、この4点の座標を通知する。
【0037】
次に、構造認識手段105について説明する。構造認識手段105は、矩形情報から枠の木構造を生成し、その枠の木構造と予め記憶しておいた基準の木構造とを比較して枠構造を認識するもので、処理の概念を図18を用いて説明する。
【0038】
図18は、構造認識手段105の処理の枠の木構造の概念を示すもので、矩形290の任意の角を矩形の頂点289として、各矩形の頂点を水平・垂直方向に仮想的なリンク線291で連結したものである。この図では、矩形と矩形の間が離れているが、実際にはリンク線で連結されている矩形同士は接しているものとする。
【0039】
このような木構造を(表1)のようなフォーマットで記述する。ここで、”番号”はその矩形のレコード番号、”水平方向連結ポインタ”はこの矩形の水平方向に連結している矩形のレコード番号、同じように”垂直方向連結ポインタ”は垂直方向に連結している矩形のレコード番号を示す。また、”欄フラグ”は文字切りだし手段に通知するべき欄かそうでないかを判別するためにある。そして、この矩形の物理情報として、幅と高さをそれぞれ”矩形幅”と”矩形高さ”に記述する。
【0040】
入力された木構造データと予め用意された基準の木構造データとの連結関係と物理情報を比較して、全ての矩形が基準の木構造データと対応している木構造データを帳票の枠構造として認識する。帳票の枠を木構造として認識する手法は、例えば(成瀬ら:”帳票における枠罫線構造の記述と認識”、PRU90−150)があり、よく知られている手法である。
【0041】
【表1】
Figure 0003586911
【0042】
構造認識手段105の処理を、図19および図20に示した処理フローに従って詳細に説明する。構造認識手段105の処理は大きく分けて2つの処理から構成されおり、木構造を生成する処理とその木構造を基準のデータと比較する処理である。図19に木構造を生成する処理フローを示し以下に説明する。
(1)矩形データをワークメモリに読み込む。
(2)前記の最小矩形認識手段において認識された矩形の左上の点を探索して矩形の頂点としてフラグを立てる。
(3)(表1)のフォーマットで”番号”、”矩形幅”と”矩形高さ”をワークメモリに書き込む。
(4)全ての矩形データに対して(1)から繰り返す。
(5)フラグの立っているデータを頂点として読み込む。
(6)ある頂点の水平・垂直方向にリンク線で別の矩形の頂点が連結しているかどうか調べる。
(7)連結している場合には、”垂直”または”水平方向連結ポインタ”に連結している矩形のレコード番号を書き込む。
(8)ワークメモリに頂点データがあれば、(5)に戻って繰り返す。
【0043】
図20に木構造データを比較する処理フローを示し、以下に説明する。
(9)基準フォーマットに記述されている最初のデータを”基準の始点”として取り出す。
(10)矩形データテーブルから矩形を選択して候補とする。
(11)基準の始点の幅と候補の幅との”差”が許容範囲内であるかどうか調べる。
(12)範囲外の場合には、(10)に戻り、範囲内の場合には(13)に進む。
(13)基準の始点の高さと候補の高さとの”差”が許容範囲内であるか調べる。
(14)範囲外の場合には、(10)に戻り、範囲内の場合には(15)に進む。
(15)”基準”に連結している枠と、”候補”に連結している枠が対応するかどうか調べる。
(16)対応すれば、連結しているデータを新しい”基準”と”候補”として(15)に戻って繰り返す。
(17)対応しなければ(9)に戻る。
(18)基準フォーマットが終われば、対応のついた矩形の4角の点の座標の内で”欄フラグ”の立っているデータだけをデータテーブルに登録して終了する。
以上が構造認識処理の処理フローである。(表2)と(表3)に木構造データの一例を示し処理について具体的に説明する。
【0044】
(表2)が基準データを、(表3)が実際の入力データをそれぞれ(表1)のフォーマットで木構造で記述したものである。まず、(表2)の番号”1”のデータが基準の始点となるので、これに対応する矩形を(表3)から探す。ここで、(表3)の番号”2”の矩形の幅と高さが許容範囲内であるが、”2”に連結している矩形が水平方向だけなので対応しない。しかし、(表3)の番号”3”から”7”までの矩形に関しては、(表2)の基準フォーマットと完全に対応している。そして、対応する矩形の欄フラグの立っている矩形の4角の点をワークメモリに記憶する。
【0045】
【表2】
Figure 0003586911
【0046】
【表3】
Figure 0003586911
【0047】
次に、文字切り出し手段106について説明する。文字切り出し手段106は、イメージメモリから実際の文字の2値イメージを切り出して文字認識装置114に送るもので、その処理について図21を用いて詳細に説明する。
【0048】
図21は、ある帳票の枠の中に文字が描かれている2値イメージの一部を示す。ここで、301〜304は構造認識手段から通知された枠の4角の点、305は枠の4角の点301〜304で構成される領域a、306は領域a305よりも枠線の幅分小さくした領域b、307は枠内に描かれている文字、308は文字枠である。
【0049】
文字切り出しの処理の時には、領域a305で2値イメージを切り出した場合、文字枠308の一部分まで切り出してしまい、余分なイメージを含んでいるために文字認識率が低下する事がある。それを防ぐために、領域a305よりも枠線の幅分小さくした領域b306で2値イメージから切り出すことによって、文字枠308を除いたイメージを後の文字認識装置に転送し、高い精度で文字307を認識する事ができる。
【0050】
以上ように、本実施例によればイメージスキャナーからの帳票の2値画像に対して、帳票の枠線部分を矩形の連結した木構造として取り扱う事によって枠線を認識するものである。
【0051】
【発明の効果】
以上のように一本発明の効果は、帳票の2値画像から枠のコーナー点を抽出し、コーナー点から枠線の構成要素を抽出し、相互に連結された構成要素から帳票の最小矩形を認識することにより、帳票の枠線が細い場合や帳票が傾いて読み取られた場合においても信頼性の高い枠線認識装置を実現できる。
【図面の簡単な説明】
【図1】本発明の実施例における枠線認識装置のブロック結線図
【図2】同実施例の枠線認識装置におけるコーナー検出手段についての詳細ブロック結線図
【図3】同実施例の枠線認識装置における方向コード付与手段についての詳細ブロック結線及びその概念図
【図4】同実施例の枠線認識装置における方向コード付与手段の処理例を示す概念図
【図5】同実施例の枠線認識装置における特徴抽出手段についての詳細ブロック結線図
【図6】同実施例の枠線認識装置における特徴抽出手段についての方向コードの変化点の検出例を示す概念図
【図7】同実施例の枠線認識装置における構成要素抽出手段、最小矩形認識手段、構造認識手段および文字切りだし手段についてのソフトウェア処理の詳細ブロック結線図
【図8】同実施例の枠線認識装置における構成要素抽出手段の処理の概念図
【図9】同実施例の枠線認識装置における構成要素抽出手段からの構成要素の種類を示す概念図
【図10】同実施例の枠線認識装置における構成要素抽出手段の具体的な処理の手順を示すフローチャート
【図11】同実施例の枠線認識装置における構成要素抽出手段でのコーナー特徴点を連結する探索範囲およびそのコーナー形状を示す概念図
【図12】同実施例の枠線認識装置における構成要素抽出手段での構成要素生成を示す図
【図13】同実施例の枠線認識装置における構成要素抽出手段から生成された構成要素を示す概念図
【図14】同実施例の枠線認識装置における最小矩形認識手段の処理の概念図
【図15】同実施例の枠線認識装置における最小矩形認識手段の構成要素を連結する処理の手順を示すフローチャート
【図16】同実施例の枠線認識装置における最小矩形認識手段の矩形認識処理の処理手順を示すフローチャート
【図17】同実施例の枠線認識装置における最小矩形認識手段の矩形認識処理の具体的な例を示す概念図
【図18】同実施例の枠線認識装置における構造認識手段の処理の概念図
【図19】同実施例の枠線認識装置における構造認識手段の木構造を生成する処理の手順を示すフローチャート
【図20】同実施例の枠線認識装置における構造認識手段の木構造データを比較する処理の手順を示すフローチャート
【図21】同実施例の枠線認識装置における文字切り出し手段の処理を示す図
【図22】従来の枠線認識装置のブロック結線図
【符号の説明】
101 イメージスキャナー
102 コーナー検出手段
103 構成要素抽出手段
104 最小矩形認識手段
105 構造認識手段
106 文字切り出し手段
107 イメージメモリ
110 2値画像
111 FIFOメモリ
112 CPU
113 ワークメモリ
114 I/F回路
115 I/F回路
116 文字認識装置
201 方向コード付与手段
202 特徴抽出手段
203 注目画素
211 ラインメモリ
212 3×3の走査窓
213 LUT
214 方向コード画像
216 方向コード
217 文字217
218 文字領域
220 ラインメモリ
221 多値の3×3走査窓
222 MPX
231 D0信号
230 D1〜D8の信号
223 LUT
224 特殊コード判定部
225 XY座標発生器
227 同期信号
228 MPXからの出力
229 コーナー特徴点
241〜243 構成要素
244 コーナー特徴点の探索領域
245〜246 コーナー特徴点、
255 対象点
256 探索範囲
257 対象点
258 長方形探索領域
264 リンク線
265 最小矩形の始点
267 最小矩形
269 三角形探索領域
271 対象点
272 相手
273 手
274 逆方向の手
280 始点
281 候補点a
282 候補点b
283 候補点c
284 リンク線
285 候補点d
286 候補点e
287 候補点f
288 最小矩形
289 矩形の頂点
290 矩形
291 リンク線
301〜304 枠の4角の点
305 領域a
306 領域b
307 文字
308 文字枠

Claims (18)

  1. 枠線を含む2値画像を入力する入力手段と、前記2値画像のエッジに方向コードを付与し、方向コードが変化する点を枠線のコーナーとして方向コードの変化を示す特徴コードとその座標をコーナー特徴点として抽出するコーナー検出手段と、近傍の前記コーナー特徴点の組合せから枠の構成要素を抽出する構成要素抽出手段と、前記構成要素を連結し最小矩形の矩形情報を出力する最小矩形認識手段と、前記最小矩形認識手段からの矩形情報に基づいて枠線の構造を認識する構造認識手段と、前記構造認識手段からの枠線の構造から文字領域を切り出す文字切り出し手段とを具備する枠線認識装置。
  2. コーナー検出手段のコーナー特徴点は、前記方向コードの変化を示す特徴コードを組み合わせて8種類のコーナー形状に分類することを特徴とする請求項1記載の枠線認識装置。
  3. 前記構成要素は、L字、T字または十字の構成要素であることを特徴とする請求項1記載の枠線認識装置。
  4. 前記構成要素抽出手段は、前記コーナー特徴点の座標を中心として、コーナー特徴点の特徴コードに対応した領域を探索することを特徴とする請求項3記載の枠線認識装置。
  5. 前記最小矩形認識手段は、前記抽出された構成要素の内任意の構成要素を始点として、始点の構成要素の接手の方向に仮のリンク線をたどり、時計回りまたは反時計回りに連結する接手を持つ構成要素の探索を繰り返し、一巡する事によって連結された構成要素の組合せを最小矩形とすることを特徴とする請求項1記載の枠線認識装置。
  6. 前記最小矩形認識手段は、前記構成要素を始点として、前記構成要素の接手の方向を任意の範囲で検索し、連結する接手を持つ構成要素を検出すれば、最小矩形を構成する構成要素として登録し、その構成要素を基準にして 90 度毎に接手の方向を時計回りまたは反時計回りに探索することを繰り返し、始点に戻ることによって、最小矩形を構成すること特徴とする請求項5記載の枠線認識装置。
  7. 前記最小矩形認識手段は、基準とした構成要素において 90 度方向の回転した接手の有無を検査して、接手が存在すれば、その接手の方向を任意の範囲で検索して、次に基準となる構成要素を検出する処理を始点の構成要素に戻るまで繰り返すことを特徴とする請求項5記載の枠線認識装置。
  8. 前記最小矩形認識手段は、基準とした構成要素において 90 度方向の回転
    した接手の有無を検査して、接手が存在しないか、あるいは、その接手の方向を任意の範囲で検索しても、連結する接手を持つ構成要素が検出できない場合には、前記構成要素の90度逆方向の接手の有無を検査し、前記90度逆方向の接手が存在すれば、その接手の方向で任意の範囲に構成要素を探索し、存在しない場合には前記構成要素を最小矩形と登録しないことを特徴とする請求項5記載の枠線認識装置。
  9. 前記最小矩形認識手段は、構成要素の接手の方向を任意の範囲で検索した場合、連結する接手を持つ構成要素が検出できなく、かつ前記構成要素が反時計回りまたは時計回りの方向に接手を持っていない場合には、それらの構成要素を最小矩形として登録しないこと特徴とする請求項5記載の枠線認識装置。
  10. 前記最小矩形認識手段は、探索領域として構成要素の接手の方向に予め設定した傾きと長さを持つ三角形領域であることを特徴とする請求項5乃至8のいずれかに記載の枠線認識装置。
  11. 構造認識手段は、前記最小矩形認識手段からの矩形情報に基づいて、予め帳票の矩形情報を登録した基準フォーマットと照合し、枠線の構造を認識することを特徴とする請求項1記載の枠線認識装置。
  12. 前記文字切り出し手段は、枠線の角の4点で囲まれた長方形領域から一定のオフセット分内側の領域を文字領域として切り出すことを特徴とする請求項1記載の枠線認識装置。
  13. 枠線を含む2値画像を入力し、前記2値画像のエッジに方向コードを付与し、方向コードが変化する点を枠線のコーナーとして方向コードの変化を示す特徴コ ードとその座標をコーナー特徴点として抽出し、近傍の前記コーナー特徴点の組合せから枠の構成要素を抽出して、前記構成要素から最小矩形を認識して矩形情報を出力し、前記矩形情報から文字領域を切り出す文字切り出すことを特徴とする枠線認識方法。
  14. コーナー特徴点の検出は、前記方向コードの変化を示す特徴コードを組み合わせて8種類のコーナー形状に分類することを特徴とすることを特徴とする請求項13記載の枠線認識方法。
  15. 前記構成要素は、L字、T字または十字の構成要素であることを特徴とする請求項13記載の枠線認識方法。
  16. 前記最小矩形の認識は、前記抽出された構成要素の内任意の構成要素を始点として、始点の構成要素の接手の方向に仮のリンク線をたどり、時計回りまたは反時計回りに連結する接手を持つ構成要素の探索を繰り返し、一巡する事によって連結された構成要素の組合せを最小矩形とすることを特徴とする請求項13乃至15のいずれかに記載の枠線認識方法。
  17. 構造認識は、前記矩形情報に基づいて、予め帳票の矩形情報を登録した基準フォーマットと照合し、枠線の構造を認識することを特徴とする請求項13記載の枠線認識方法。
  18. 前記文字切り出しは、枠線の角の4点で囲まれた長方形領域から一定のオフセット分内側の領域を文字領域として切り出すことを特徴とする請求項13記載の枠線認識方法。
JP01686295A 1995-02-03 1995-02-03 枠線認識装置 Expired - Fee Related JP3586911B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01686295A JP3586911B2 (ja) 1995-02-03 1995-02-03 枠線認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01686295A JP3586911B2 (ja) 1995-02-03 1995-02-03 枠線認識装置

Publications (2)

Publication Number Publication Date
JPH08212292A JPH08212292A (ja) 1996-08-20
JP3586911B2 true JP3586911B2 (ja) 2004-11-10

Family

ID=11928037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01686295A Expired - Fee Related JP3586911B2 (ja) 1995-02-03 1995-02-03 枠線認識装置

Country Status (1)

Country Link
JP (1) JP3586911B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548250B2 (en) 2007-11-09 2013-10-01 Ricoh Company, Ltd. Information processing apparatus and information processing method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3574584B2 (ja) 1998-12-16 2004-10-06 富士通株式会社 表画像処理装置及びそのプログラム記憶媒体
JP5679229B2 (ja) * 2012-08-24 2015-03-04 楽天株式会社 画像処理装置、画像処理方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548250B2 (en) 2007-11-09 2013-10-01 Ricoh Company, Ltd. Information processing apparatus and information processing method

Also Published As

Publication number Publication date
JPH08212292A (ja) 1996-08-20

Similar Documents

Publication Publication Date Title
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
CA2401065C (en) Document matching and annotation lifting
JP2005316755A (ja) 2次元矩形コードシンボル読み取り装置及び2次元矩形コードシンボル読み取り方法
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP3586911B2 (ja) 枠線認識装置
JP3586949B2 (ja) 帳票認識装置
JP2008028716A (ja) 画像処理方法及び装置
JP2007094584A (ja) 二次元コードの検出方法、検出装置、及び検出プログラム
JP3622347B2 (ja) 帳票認識装置
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JPH07182459A (ja) 表構造抽出装置
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000020693A (ja) 指紋画像処理装置、指紋画像処理方法、および記録媒体
JP2789622B2 (ja) 文字/図形領域判定装置
JP3379327B2 (ja) 文字認識装置
JPH09147105A (ja) 図面閉領域の抽出方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH06131446A (ja) 指紋照合装置及び指紋照合方法
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPH0142029B2 (ja)
JP2022184331A (ja) 帳票の特定フィールド認識方法および特定フィールド読取り装置
JPH06103366A (ja) 指紋照合装置及び指紋照合方法
JPH08115428A (ja) 領域判別装置
JPH04112276A (ja) 2値画像輪郭線チェイン符号化装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040720

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees