JPH08212292A - 枠線認識装置 - Google Patents

枠線認識装置

Info

Publication number
JPH08212292A
JPH08212292A JP7016862A JP1686295A JPH08212292A JP H08212292 A JPH08212292 A JP H08212292A JP 7016862 A JP7016862 A JP 7016862A JP 1686295 A JP1686295 A JP 1686295A JP H08212292 A JPH08212292 A JP H08212292A
Authority
JP
Japan
Prior art keywords
frame line
corner
frame
rectangle
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7016862A
Other languages
English (en)
Other versions
JP3586911B2 (ja
Inventor
Toyoki Kawahara
豊樹 川原
Atsuharu Yamamoto
淳晴 山本
Yuji Maruyama
祐二 丸山
Hidehiko Kawakami
秀彦 川上
Ryuji Yamazaki
龍次 山崎
Mikio Fujita
幹男 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP01686295A priority Critical patent/JP3586911B2/ja
Publication of JPH08212292A publication Critical patent/JPH08212292A/ja
Application granted granted Critical
Publication of JP3586911B2 publication Critical patent/JP3586911B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 帳票のような枠線と文字を含む画像に記入さ
れている文字の自動認識において、文字の存在する領域
を切り出すために帳票の枠線を認識する前処理装置に関
するもので、枠線が細い場合や帳票の傾いている場合に
も信頼性が高い枠線認識装置を提供する。 【構成】 イメージスキャナー101により2値化され
た帳票画像からコーナー検出手段102によって帳票枠
線のコーナー特徴点を抽出し、構成要素抽出手段103
によって注目コーナー特徴点とその周辺のコーナー特徴
点から、(T字、十字およびL字等の)枠線の構成要素
を抽出し、最小矩形認識手段104によって構成要素の
連結から最小矩形を認識し矩形情報を出力して、構造認
識手段105において連結する矩形の木構造を生成し、
この木構造に基づいて枠線の構造を認識し文字領域を切
り出す文字切り出し手段106に通知する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票のような枠線と文
字を含む画像の枠線の構造を自動的に認識し、帳票内に
記入されている文字領域を切り出し、文字を自動認識す
るための前処理装置である枠線認識装置に関するもので
ある。
【0002】
【従来の技術】近年、文書情報の電子化に伴い、OCR
(Optical Character Reader)を初めとする文字認識技
術や文書画像処理に対する要望が高まっており、帳票の
枠線構造の認識もそのひとつである。
【0003】帳票の枠線認識として、枠線のラン長で線
分を検出する方法が良く知られており例えば特開平01
−217583号公報であり、その実施例を第22図を
基に説明する。画像入力部1001は認識対象罫線を含
む画像を走査し2値信号で画像メモリ1002に格納す
る。縦方向ラン抽出部1003は画像メモリ1002に
格納されている画像を縦方向に走査して縦方向ランを抽
出する。抽出された縦方向のランの連結性が縦方向線分
抽出部1004で調べられ縦方向線分が抽出される。同
様の処理により横方向ラン抽出部1005で横方向ラン
が抽出され、横方向線分抽出部1006で横方向線が分
抽出される。文字領域抽出部1007は縦方向線分抽出
部1004で抽出された縦方向線分と横方向線分抽出部
1006で抽出された横方向線分を用いて文字領域およ
び文字記入領域を抽出する。
【0004】また、切り出された文字認識については、
各種方式が提案されており例えば、ニューラルネットを
用いた文字認識法(森:”PDPモデルによる手書き漢
字認識”、電子情報通信学会論文誌、Vol.J73-D-II, N
o.8 pp.1268-1274 1990)があり、認識率も実用的なと
ころまできているが、今回は帳票の枠線認識装置という
ことで文字認識の前処理に限定しているので文字認識に
関しては省略するものとする。
【0005】
【発明が解決しようとする課題】しかしながら前記の従
来の構成では、枠線(罫線を以後枠線と呼ぶ)が細い場
合や帳票が傾いて画像として読み取られた場合は、ラン
長で枠線を認識することが難しく、検出するラン長を短
く設定すると枠線以外の線分が抽出され誤検出するとい
う課題がある。
【0006】本願発明は、前記従来技術の課題を解決す
るもので、特に枠線が細い場合や帳票が傾いて読み取ら
れた場合に対して正確で信頼性の高い枠線認識装置を提
供することを目的とする。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明は、例えば帳票から自動的に枠線を認識し文字
領域を切り出す際に、帳票を読み取り2値画像を出力す
るイメージスキャナーと、前記イメージスキャナーから
の2値画像(文字、枠線を”0”、その他を”1”)か
ら帳票の枠線のエッジに方向コードを付与し、その方向
コードの変化する点を画像のコーナーとし、その特徴コ
ードと座標をコーナー特徴点として抽出するコーナー検
出手段と、前記コーナー検出手段からのコーナー特徴点
から、注目コーナー特徴点とその周辺のコーナー特徴点
から、(T字、十字およびL字等の)枠線の構成要素を
抽出する構成要素抽出手段と、前記構成要素抽出手段か
らの構成要素をもとに、注目構成要素を基準に右回り
(あるいは左)に周辺の構成要素を検索し相手となる構
成要素を連結し元に戻るまで繰り返し最小矩形を認識し
矩形情報を出力する最小矩形認識手段と、前記最小矩形
認識手段からの矩形情報の任意の角を基準とした連結す
る矩形の木構造に生成し、この木構造に基づいて枠線の
構造を認識する構造認識手段と、前記構造認識手段から
の枠線の構造から文字領域を切り出す文字切り出し手段
とを設けたものである。
【0008】
【作用】本発明は前記構成によって、帳票の2値画像か
ら枠のコーナー点を抽出し、コーナー点から枠線の構成
要素を抽出し、相互に連結された構成要素から帳票の最
小矩形を認識することにより、帳票の枠線が細い場合や
帳票が傾いて読み取られた場合においても信頼性の高い
枠線認識装置を実現できる。
【0009】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。
【0010】図1は本発明の一実施例における枠線認識
装置のブロック構成図である。101は帳票を読み取り
2値画像を出力するイメージスキャナー、102は枠線
の輪郭に方向コードを付与しその変化点をコーナー特徴
点として出力するコーナー検出手段、103は注目コー
ナー特徴点とその周辺コーナー特徴点から枠線の構成要
素を抽出する構成要素抽出手段、104は枠線の構成要
素から最小矩形を構成するように構成要素を連結して最
小矩形を認識する最小矩形認識手段、105は各最小矩
形から木構造を生成し枠線の構造を認識する構造認識手
段、106は枠線の構造から文字領域を切り出す文字切
り出し手段である。
【0011】以上のように構成された枠線認識装置につ
いて、その動作を説明する。イメージスキャナー101
により、帳票を読み取り2値画像に変換し、その2値画
像からコーナー検出手段102により、帳票の枠線の輪
郭に方向コードを付与してその変化点をコーナー特徴点
として出力し、構成要素抽出手段103により、注目コ
ーナー特徴点とその周辺コーナー特徴点から枠線の構成
要素を抽出し、その構成要素から最小矩形認識手段10
4により、最小矩形を認識して出力し、各最小矩形から
構造認識手段105により、連結する矩形の木構造を生
成して枠線の構造を認識し、その枠線の構造から文字切
り出し手段106により、文字領域を切り出して、枠線
を認識するものである。
【0012】次に各構成要素の動作を詳細に説明する。
帳票を読み取り2値画像を出力するイメージスキャナー
101は、線密度を約400dpi程度とし、原稿であ
る帳票にLED(発光ダイオード)等で照明しその反射
光を一次元のCCDカメラで読み取り、任意の閾値で2
値化して2値画像を出力するものである。また、照明は
原稿である帳票の枠線や記入された文字の色によって異
なるが、例えば青・黒および赤等の枠線に対して、黒や
青等で数字や記号および文字が記入された場合、緑ある
いは黄緑の波長(550〜570nm付近)のLEDを
用いることが多い。2値化処理においては、固定閾値法
や浮動閾値法(森、大津:”認識問題としての二値化と
各種方法の検討”、情報処理学会、イメージプロセッシ
ング15-1, Nov. 1977)が良く知られている2値化処理
法であり、原稿に合わせて任意の2値化処理法を選択す
ればよい。
【0013】次に、コーナー検出手段102について説
明する。コーナー検出手段102は、枠線の輪郭に方向
コードを付与しその変化点をコーナー特徴点として出力
するもので、図2に詳細ブロック図を示し説明する。
【0014】図2において、201はスキャナー101
からの2値画像110に8方向の方向コードを付与する
方向コード付与手段、202は方向コードの変化する特
徴点を検出し、方向コードの変化を表すコードおよび特
徴点の座標をコーナー特徴点として抽出する特徴抽出手
段を示す。本実施例においては、コーナー特徴点の検出
方法として帳票の枠線の輪郭画素に方向コードを付与し
その方向コードの変化点を検出することで、帳票の枠線
のコーナーを検出するものである。方向コードを付与す
る方式は、フリーマンのチェインコード(H.Free
man:”Onthe encoding of ar
bitrary geometricconfigur
ations”、IRE Trans.Electro
n.Comput.EC−10、1961、pp260
−268)がよく知られている。
【0015】まず、方向コード付与手段201につい
て、図3を用いて説明する。図3(a)は、方向コード
付与手段201の回路構成図である。図3(a)におい
て、211はラインメモリ、212は3×3の走査窓、
213は走査窓212のビットパターンによって4ビッ
トの方向コード画像214を出力するLUT(ルック・
アップ・テーブル)を示す。方向コードは、図3(b)
に示す様に、注目画素203から周辺の輪郭画素に向か
う8方向を、方向コードとしてそれぞれ”1”〜”8”
の値で表すものである。方向コード付与手段201は、
2値画像101に対し3×3走査窓212で走査し、走
査窓内からのビットパターンでLUT213を用いて4
ビットの方向コードを出力する。またここでは、方向コ
ードは、”1”から”8”としたが、”0”から”7”
の値でもかまわない。
【0016】LUT213は、予め計算によってデータ
を作成しておくもので、条件(数1)を満たすパターン
に対して条件(数2)を満たす方向コードiを算出する
もので、本実施例では右回り方向に方向コードを付与す
るものとする。ただし、条件(数3)を満たす例えば一
画素幅の特殊なパターンに対しては値”a”を付与し、
文字領域内部には値”f”、枠線部には値”0”をそれ
ぞれ割り当てるものとする。
【0017】
【数1】
【0018】
【数2】
【0019】
【数3】
【0020】ここで、走査窓内の画素d1〜d8は、図
3(a)の定義に従うものとする。なお、Nc(8)は8
連結数、Nc(4)は4連結数と呼ばれ、パターンの連結
性を示すパラメータとしてよく知られている。前記処理
によって得られる方向コード画像の例を図4に示す。図
4において、枠線215は”0”が割り当てられ、文字
領域218のエッジに対して右回りに方向コード216
が付与される。同様に、中央の文字217にも方向コー
ドが付与される。
【0021】次に、特徴抽出手段202について図5を
用いて説明する。図5は、特徴抽出手段の回路構成図で
ある。図5において、220はラインメモリ、221は
多値の3×3走査窓、222は走査窓221からのD0
信号231に従って、D1〜D8の信号230の出力を
選択するMPX(マルチプレクサ)、223はMPX2
22からの出力228およびD0信号231を参照し、
帳票の枠線を示すためのコーナー特徴点を出力するLU
Tを示す。本実施例においては、方向コードの変化する
点を特徴点として抽出し、コーナーの形状を表す特徴コ
ードとその座標をコーナー特徴点として通知するもので
ある。以下に、特徴抽出手段202の動作について説明
する。
【0022】まず、方向コード付与手段201からの方
向コード画像214を、走査窓221に入力し一画素づ
つ走査する。
【0023】特徴抽出手段202は、走査窓221から
のD1〜D8の方向コード信号230をそれぞれMPX
222に入力し、注目画素位置D0の方向コード231
が示す周辺の画素位置D1〜D8が選択される。注目画
素D0の方向コード231と選択された周辺画素の方向
コード228から、LUT223により特徴コードCf
と同期信号227からXY座標発生器225で発生した
XY座標とからなるコーナー特徴点229が出力され
る。また、特殊コード判定部224では、周辺画素の方
向コード228の値が特殊コードである”a”が付与さ
れているかを判定し、判定された結果はLUT223に
通知し特徴コードCfとして値”a”を通知するものと
する。特徴コードCfは、予め(数4)で演算した結果
をLUT223に登録しておくものである。
【0024】
【数4】
【0025】ただし、Diは、方向コードD0が示す方
向に隣接している画素の方向コードである。図6に特徴
コードの例を示す。図6(a)は特徴コード値が”3
1”の例、同図(b)は特徴コード値が”17”の例、
同図(c)は特徴コード値が”75”の例、同図(d)
は特徴コード値が”53”の例、同図(e)は特徴コー
ド値が”56”の例、同図(f)は特徴コード値が”6
1”の例をそれぞれ示すものである。なお本実施例で
は、右回り方向に方向コードを付与したが、左回りに付
与してもよい。
【0026】次に、構成要素抽出手段103、最小矩形
認識手段104、構造認識手段105および文字切り出
し手段106について説明するが、これらの具体的な処
理は基本的にはソフトウエア処理が主体となるために共
通な回路構成を図7に示し以下に説明する。図7におい
て、111はコーナー検出手段102からのコーナー特
徴点を入力するFIFO(ファースト・イン・ファース
ト・アウト)メモリ、112および113は各ソフトウ
エア処理を行うためのCPUとワークメモリ、107は
スキャナー101からのデータを記憶するイメージメモ
リ、114はFIFO111及びイメージメモリ107
のデータをCPU112とワークメモリ113に送るI
/F回路である。115および116は今回は詳しくは
触れないが文字部を切り出した後に文字認識部にデータ
を送るI/F回路および文字認識装置を示す。まず、コ
ーナー検出手段102で検出されたコーナー特徴点はF
IFOメモリ111に入力され、逐次CPU112に読
み込まれ一旦ワークメモリ113に記憶される。また、
イメージメモリ107に記憶されたデータは、最後に文
字の切り出し位置が確定した時点で文字領域が切り出さ
れI/F115を介して今回は説明を省略した文字認識
装置に送られ文字の認識が行われる。
【0027】次に、構成要素抽出手段103について説
明する。構成要素抽出手段103の処理の概念図を図8
に示し説明する。図8において、245〜246はコー
ナー検出手段102からコーナー特徴点をFIFOメモ
リ111を介して得られたコーナー特徴点、244はコ
ーナー特徴点の探索領域、241〜243は得られた構
成要素を示す。まず発生順に得られたコーナー特徴点2
45を注目特徴点とした場合、コーナー特徴点245を
中心に探索領域244内に対応するコーナー特徴点があ
るかどうかを探索する。例えば、L字の構成要素は図9
(a)〜(d)に示す4種類、T字の構成要素は図9
(e)〜(h)の4種類、十字の構成要素は1種類の組
み合わせが存在する。このように枠線は、L字・T字お
よび十字が組合わさって構成されており構成要素と構成
要素とを接続することで枠線の骨格が構成できる。構成
要素抽出手段103の具体的な処理手順を図10に参照
しながら説明する。 (1)コーナー特徴点をワークメモリ113から入力す
る。 (2)対象のコーナー特徴点が90゜のコーナー特徴点
かどうかをチェックし、90゜コーナー特徴点ならその
まま(4)のステップへ、それ以外なら(3)のステッ
プに進む。 (3)注目のコーナー特徴点の上位桁を始点として、任
意の連結許容範囲Sr内で、かつ、図11(a)に示す
探索範囲内に存在して、さらにコーナー特徴点が図11
(b)に示す終点コーナー特徴点であれば、その特徴点
を終点として連結して90゜コーナー特徴点とする。 (4)連結した90゜コーナー特徴点を図11(b)に
示す参照コードに変換してワークメモリに記憶する。 (5)ワークメモリの全てのコーナー特徴点について、
前記の処理が終了すれば(6)に進み、そうでない場合
は(1)に進む。 (6)ワークメモリの中の90゜コーナー特徴点を対象
点とする。対象点の参照コードCrを入力する。 (7)(数5)の式を満たす参照コードCpを持つ相手
が、(数6)で表現される探索範囲に存在すれば、対象
点はL字構成要素にグルーピングされるものとして(1
0)に進み、存在しなければ(8)に進む。ここで、例
として、対象点255の参照コードCr=2の場合の探
索範囲256を図12(a)に示す。
【0028】
【数5】
【0029】
【数6】
【0030】ただし、グルーピング許容範囲:Gr、対
象点座標:xr,yr、相手座標:xp,yp、対象点
の参照コードCrとする。 (8)図12(b)のように、対象点257を中心にし
て水平または垂直方向に伸びたGr×2wの長方形探索
領域258の中に存在する相手の参照コードが、(数
7)また(数8)の条件を満たすかどうか調べる。
【0031】
【数7】
【0032】ただし、対象点の参照コードCr=4のと
きは、相手の参照コードCp=1とする。
【0033】
【数8】
【0034】ただし、対象点の参照コードCr=1のと
きは、相手の参照コードCp=4とする。 (9)(数7)かまたは(数8)のどちらかを満たす場
合には、T字構成要素と判断し、また、(数7)と(数
8)のどちらをも満たす場合には、十字構成要素と判断
して(10)に進む。何れの条件も満たさない場合は
(11)に進む。 (10)L字、T字および十字構成要素として認識され
た参照コードをグルーピングし図12(c)に示す要素
コードデータに変換すると共に参照コードとグルーピン
グされた相手との平均座標を演算しワークメモリに記憶
する。ただし、図12(c)における、E方向、N方
向、W方向及びS方向はそれぞれ図12(d)に示す方
向を表す。 (11)(9)の処理で何れの条件にも満たない参照コ
ードは消去する。 (12)コーナー特徴点が全てグルーピングされた場合
は処理を終了し、そうでない場合は(6)に進む。 以上の処理を行うことにより、図13に示す枠線のL、
T、十字の各構成要素が抽出される。ただし、図13
は、抽出された各構成要素(要素コード+平均座標デー
タ)を枠線上に展開したものを示している。
【0035】次に最小矩形認識手段104について説明
する。最小矩形認識手段104は、枠線の構成要素を連
結して最小矩形を認識するするもので、処理の概念を図
14を用いて説明する。図14(a)は、最小矩形認識
手段104の処理の概念を示すもので、各構成要素同士
の手を連結させリンク線264(破線で示す)を仮想的
に張り、最小矩形の始点265を矩形の左上として右回
りにリンク線264をたどって元の始点に戻れば最小矩
形267と認識したものとする。最小矩形認識手段10
4の処理を、図15および図16に示した処理フローに
従って詳細に説明する。最小矩形認識手段104の処理
は大きく2つの処理から構成されており、各構成要素を
連結する処理と連結したリンク線をたどって矩形を認識
する処理である。図15に各構成要素を連結する処理フ
ローを示し以下に説明する。 (1)構成要素データをワークメモリに読み込む。 (2)構成要素データの中から連結されていない対象点
を順次選択する。 (3)対象点にまだ連結していない”手”がある場合、
その手の伸びている方向を探索範囲として、図14
(b)に示すような帳票の読み取り時の傾きと位置ずれ
を考慮した三角形探索領域269内で連結する相手を探
す。この時、図14(c)に示すように対象点271の
手273に対して逆方向の手274を持つ最短距離の相
手272を探索する。 (4)前記条件を満たす相手が存在するかどうか判定
し、ある場合は(5)へ進み、ない場合は(2)へ進
む。 (5)対象点の手と相手の手を仮想的に連結し、記憶す
る。 (6)構成要素データに未連結の構成要素の有無をチェ
ックし、Yの場合は(2) へNの場合は(7)に
進む。 (7)次の矩形認識処理に進む。図16に矩形認識処理
の処理フローを示し、以下に説明する。基本的には、始
点からE→S→W→Nと右回りにリンク線をたどり、行
き止まりになれば前の要素に戻り新しい候補を選択して
探索を繰り返し、最後に始点に戻ることのできる構成要
素の集まりを最小矩形と認識するものである。 (8)連結された構成要素からE方向とS方向の手を持
つ構成要素を探索し始点とする。まずその始点を対象点
とする。 (9)対象点のE方向にリンク線で構成要素が連結して
いるがどうか調べ、Nなら(8)へYなら(10)に進
む。 (10)連結しているE方向の構成要素を対象点にす
る。 (11)対象点のS方向にリンク線で構成要素が連結し
ているがどうか調べ、Nなら(9)へYなら(12)に
進む。 (12)連結しているS方向の構成要素を対象点にす
る。 (13)対象点のW方向にリンク線で構成要素が連結し
ているがどうか調べ、Nなら(11)へYなら(14)
に進む。 (14)連結しているW方向の構成要素を対象点にす
る。 (15)対象点のN方向にリンク線で構成要素が連結し
ているがどうか調べ、Nなら(13)へYなら(16)
に進む。 (16)連結しているN方向の構成要素を対象点にす
る。 (17)この対象点が始点であるかどうか調べ、Nなら
(15)へYなら(18)に進む。 (18)最小矩形として認識し、4角の座標を登録す
る。 (19)始点となる構成要素があれば(8)に戻り、な
ければ処理を終了する。以上が矩形認識処理の処理フロ
ーである。
【0036】次に、矩形認識処理を図17(a)(b)
を用いて具体的に説明する。まず、図17(a)におい
て、EおよびS方向の手を持つ構成要素を始点280と
する。始点280からみて右回りにリンク線284をた
どり一周して始点280に戻れば最小矩形として認識す
る。始点280のE方向の手からリンク線284をたど
り候補点a281を探索する。この時、候補点a281
の手の方向をチェックすればS方向の手を持っているこ
とがわかるので連結し、候補点a281を新たな対象点
としてS方向にリンク線をたどり候補点b282を探索
し、持っている手の方向をチェックする。この候補点b
282は、W方向の手を持っていないので次に進むこと
ができない。そこで、対象点(現在は候補点a)がE方
向の手を持っているので、更にE方向を探索し候補点c
283を探索し、手の方向をチェックする。候補点c2
83は、S方向の手を持っているので候補点c283を
新たな対象点とする。次に、対象点(候補点c283)
のS方向に連結している候補点d285がW方向の手を
持っている事が分かり、さらに候補点d285のW方向
に連結している候補点e286がN方向の手を持ってい
るかどうかをチェックする。ここで、N方向に連結して
いる候補点f287が始点かどうかをチェックするが、
始点ではない。そこで、さらにN方向にリンク線をたど
れば始点280に戻る事ができる。これで図17(b)
のように、始点280、候補点c283、候補点d28
5および候補点e286の4点がリンクした最小矩形2
88を認識することができた。最後に、この4点の座標
を通知する。
【0037】次に、構造認識手段105について説明す
る。構造認識手段105は、矩形情報から枠の木構造を
生成し、その枠の木構造と予め記憶しておいた基準の木
構造とを比較して枠構造を認識するもので、処理の概念
を図18を用いて説明する。
【0038】図18は、構造認識手段105の処理の枠
の木構造の概念を示すもので、矩形290の任意の角を
矩形の頂点289として、各矩形の頂点を水平・垂直方
向に仮想的なリンク線291で連結したものである。こ
の図では、矩形と矩形の間が離れているが、実際にはリ
ンク線で連結されている矩形同士は接しているものとす
る。
【0039】このような木構造を(表1)のようなフォ
ーマットで記述する。ここで、”番号”はその矩形のレ
コード番号、”水平方向連結ポインタ”はこの矩形の水
平方向に連結している矩形のレコード番号、同じよう
に”垂直方向連結ポインタ”は垂直方向に連結している
矩形のレコード番号を示す。また、”欄フラグ”は文字
切りだし手段に通知するべき欄かそうでないかを判別す
るためにある。そして、この矩形の物理情報として、幅
と高さをそれぞれ”矩形幅”と”矩形高さ”に記述す
る。
【0040】入力された木構造データと予め用意された
基準の木構造データとの連結関係と物理情報を比較し
て、全ての矩形が基準の木構造データと対応している木
構造データを帳票の枠構造として認識する。帳票の枠を
木構造として認識する手法は、例えば(成瀬ら:”帳票
における枠罫線構造の記述と認識”、PRU90−15
0)があり、よく知られている手法である。
【0041】
【表1】
【0042】構造認識手段105の処理を、図19およ
び図20に示した処理フローに従って詳細に説明する。
構造認識手段105の処理は大きく分けて2つの処理か
ら構成されおり、木構造を生成する処理とその木構造を
基準のデータと比較する処理である。図19に木構造を
生成する処理フローを示し以下に説明する。 (1)矩形データをワークメモリに読み込む。 (2)前記の最小矩形認識手段において認識された矩形
の左上の点を探索して矩形の頂点としてフラグを立て
る。 (3)(表1)のフォーマットで”番号”、”矩形幅”
と”矩形高さ”をワークメモリに書き込む。 (4)全ての矩形データに対して(1)から繰り返す。 (5)フラグの立っているデータを頂点として読み込
む。 (6)ある頂点の水平・垂直方向にリンク線で別の矩形
の頂点が連結しているかどうか調べる。 (7)連結している場合には、”垂直”または”水平方
向連結ポインタ”に連結している矩形のレコード番号を
書き込む。 (8)ワークメモリに頂点データがあれば、(5)に戻
って繰り返す。
【0043】図20に木構造データを比較する処理フロ
ーを示し、以下に説明する。 (9)基準フォーマットに記述されている最初のデータ
を”基準の始点”として取り出す。 (10)矩形データテーブルから矩形を選択して候補と
する。 (11)基準の始点の幅と候補の幅との”差”が許容範
囲内であるかどうか調べる。 (12)範囲外の場合には、(10)に戻り、範囲内の
場合には(13)に進む。 (13)基準の始点の高さと候補の高さとの”差”が許
容範囲内であるか調べる。 (14)範囲外の場合には、(10)に戻り、範囲内の
場合には(15)に進む。 (15)”基準”に連結している枠と、”候補”に連結
している枠が対応するかどうか調べる。 (16)対応すれば、連結しているデータを新しい”基
準”と”候補”として(15)に戻って繰り返す。 (17)対応しなければ(9)に戻る。 (18)基準フォーマットが終われば、対応のついた矩
形の4角の点の座標の内で”欄フラグ”の立っているデ
ータだけをデータテーブルに登録して終了する。以上が
構造認識処理の処理フローである。(表2)と(表3)
に木構造データの一例を示し処理について具体的に説明
する。
【0044】(表2)が基準データを、(表3)が実際
の入力データをそれぞれ(表1)のフォーマットで木構
造で記述したものである。まず、(表2)の番号”1”
のデータが基準の始点となるので、これに対応する矩形
を(表3)から探す。ここで、(表3)の番号”2”の
矩形の幅と高さが許容範囲内であるが、”2”に連結し
ている矩形が水平方向だけなので対応しない。しかし、
(表3)の番号”3”から”7”までの矩形に関して
は、(表2)の基準フォーマットと完全に対応してい
る。そして、対応する矩形の欄フラグの立っている矩形
の4角の点をワークメモリに記憶する。
【0045】
【表2】
【0046】
【表3】
【0047】次に、文字切り出し手段106について説
明する。文字切り出し手段106は、イメージメモリか
ら実際の文字の2値イメージを切り出して文字認識装置
114に送るもので、その処理について図21を用いて
詳細に説明する。
【0048】図21は、ある帳票の枠の中に文字が描か
れている2値イメージの一部を示す。ここで、301〜
304は構造認識手段から通知された枠の4角の点、3
05は枠の4角の点301〜304で構成される領域
a、306は領域a305よりも枠線の幅分小さくした
領域b、307は枠内に描かれている文字、308は文
字枠である。
【0049】文字切り出しの処理の時には、領域a30
5で2値イメージを切り出した場合、文字枠308の一
部分まで切り出してしまい、余分なイメージを含んでい
るために文字認識率が低下する事がある。それを防ぐた
めに、領域a305よりも枠線の幅分小さくした領域b
306で2値イメージから切り出すことによって、文字
枠308を除いたイメージを後の文字認識装置に転送
し、高い精度で文字307を認識する事ができる。
【0050】以上ように、本実施例によればイメージス
キャナーからの帳票の2値画像に対して、帳票の枠線部
分を矩形の連結した木構造として取り扱う事によって枠
線を認識するものである。
【0051】
【発明の効果】以上のように一本発明の効果は、帳票の
2値画像から枠のコーナー点を抽出し、コーナー点から
枠線の構成要素を抽出し、相互に連結された構成要素か
ら帳票の最小矩形を認識することにより、帳票の枠線が
細い場合や帳票が傾いて読み取られた場合においても信
頼性の高い枠線認識装置を実現できる。
【図面の簡単な説明】
【図1】本発明の実施例における枠線認識装置のブロッ
ク結線図
【図2】同実施例の枠線認識装置におけるコーナー検出
手段についての詳細ブロック結線図
【図3】同実施例の枠線認識装置における方向コード付
与手段についての詳細ブロック結線及びその概念図
【図4】同実施例の枠線認識装置における方向コード付
与手段の処理例を示す概念図
【図5】同実施例の枠線認識装置における特徴抽出手段
についての詳細ブロック結線図
【図6】同実施例の枠線認識装置における特徴抽出手段
についての方向コードの変化点の検出例を示す概念図
【図7】同実施例の枠線認識装置における構成要素抽出
手段、最小矩形認識手段、構造認識手段および文字切り
だし手段についてのソフトウェア処理の詳細ブロック結
線図
【図8】同実施例の枠線認識装置における構成要素抽出
手段の処理の概念図
【図9】同実施例の枠線認識装置における構成要素抽出
手段からの構成要素の種類を示す概念図
【図10】同実施例の枠線認識装置における構成要素抽
出手段の具体的な処理の手順を示すフローチャート
【図11】同実施例の枠線認識装置における構成要素抽
出手段でのコーナー特徴点を連結する探索範囲およびそ
のコーナー形状を示す概念図
【図12】同実施例の枠線認識装置における構成要素抽
出手段での構成要素生成を示す図
【図13】同実施例の枠線認識装置における構成要素抽
出手段から生成された構成要素を示す概念図
【図14】同実施例の枠線認識装置における最小矩形認
識手段の処理の概念図
【図15】同実施例の枠線認識装置における最小矩形認
識手段の構成要素を連結する処理の手順を示すフローチ
ャート
【図16】同実施例の枠線認識装置における最小矩形認
識手段の矩形認識処理の処理手順を示すフローチャート
【図17】同実施例の枠線認識装置における最小矩形認
識手段の矩形認識処理の具体的な例を示す概念図
【図18】同実施例の枠線認識装置における構造認識手
段の処理の概念図
【図19】同実施例の枠線認識装置における構造認識手
段の木構造を生成する処理の手順を示すフローチャート
【図20】同実施例の枠線認識装置における構造認識手
段の木構造データを比較する処理の手順を示すフローチ
ャート
【図21】同実施例の枠線認識装置における文字切り出
し手段の処理を示す図
【図22】従来の枠線認識装置のブロック結線図
【符号の説明】
101 イメージスキャナー 102 コーナー検出手段 103 構成要素抽出手段 104 最小矩形認識手段 105 構造認識手段 106 文字切り出し手段 107 イメージメモリ 110 2値画像 111 FIFOメモリ 112 CPU 113 ワークメモリ 114 I/F回路 115 I/F回路 116 文字認識装置 201 方向コード付与手段 202 特徴抽出手段 203 注目画素 211 ラインメモリ 212 3×3の走査窓 213 LUT 214 方向コード画像 216 方向コード 217 文字217 218 文字領域 220 ラインメモリ 221 多値の3×3走査窓 222 MPX 231 D0信号 230 D1〜D8の信号 223 LUT 224 特殊コード判定部 225 XY座標発生器 227 同期信号 228 MPXからの出力 229 コーナー特徴点 241〜243 構成要素 244 コーナー特徴点の探索領域 245〜246 コーナー特徴点、 255 対象点 256 探索範囲 257 対象点 258 長方形探索領域 264 リンク線 265 最小矩形の始点 267 最小矩形 269 三角形探索領域 271 対象点 272 相手 273 手 274 逆方向の手 280 始点 281 候補点a 282 候補点b 283 候補点c 284 リンク線 285 候補点d 286 候補点e 287 候補点f 288 最小矩形 289 矩形の頂点 290 矩形 291 リンク線 301〜304 枠の4角の点 305 領域a 306 領域b 307 文字 308 文字枠
───────────────────────────────────────────────────── フロントページの続き (72)発明者 川上 秀彦 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 (72)発明者 山崎 龍次 神奈川県横浜市港北区綱島東4丁目3番1 号 (72)発明者 藤田 幹男 神奈川県横浜市港北区綱島東4丁目3番1 号

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 枠線と文字を含む画像を読み取り2値画
    像を出力するイメージスキャナーと、前記2値画像の枠
    線の方向を示す方向コードが変化する点を画像のコーナ
    ーとし、前記コーナーにおける前記方向コードの変化を
    示す特徴コードおよび前記コーナーの座標をコーナー特
    徴点として抽出するコーナー検出手段と、前記コーナー
    特徴点から枠線の構成要素を抽出する構成要素抽出手段
    と、前記構成要素から最小矩形を認識して矩形情報を出
    力する最小矩形認識手段と、前記最小矩形認識手段から
    の矩形情報の任意の角を基準とした連結する矩形の木構
    造を生成し、前記木構造に基づいて枠線の構造を認識す
    る構造認識手段と、前記構造認識手段からの枠線の構造
    から文字領域を切り出す文字切り出し手段を具備する枠
    線認識装置。
JP01686295A 1995-02-03 1995-02-03 枠線認識装置 Expired - Fee Related JP3586911B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01686295A JP3586911B2 (ja) 1995-02-03 1995-02-03 枠線認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01686295A JP3586911B2 (ja) 1995-02-03 1995-02-03 枠線認識装置

Publications (2)

Publication Number Publication Date
JPH08212292A true JPH08212292A (ja) 1996-08-20
JP3586911B2 JP3586911B2 (ja) 2004-11-10

Family

ID=11928037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01686295A Expired - Fee Related JP3586911B2 (ja) 1995-02-03 1995-02-03 枠線認識装置

Country Status (1)

Country Link
JP (1) JP3586911B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133558B1 (en) 1998-12-16 2006-11-07 Fujitsu Limited Device processing a table image, a memory medium storing a processing program, and a table management processing method
WO2014030406A1 (ja) * 2012-08-24 2014-02-27 楽天株式会社 画像処理装置、画像処理方法、プログラム、及び情報記憶媒体

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4739309B2 (ja) 2007-11-09 2011-08-03 株式会社リコー 情報処理装置、及び情報処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133558B1 (en) 1998-12-16 2006-11-07 Fujitsu Limited Device processing a table image, a memory medium storing a processing program, and a table management processing method
WO2014030406A1 (ja) * 2012-08-24 2014-02-27 楽天株式会社 画像処理装置、画像処理方法、プログラム、及び情報記憶媒体
JP2014044470A (ja) * 2012-08-24 2014-03-13 Rakuten Inc 画像処理装置、画像処理方法、及びプログラム

Also Published As

Publication number Publication date
JP3586911B2 (ja) 2004-11-10

Similar Documents

Publication Publication Date Title
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
CA2401065C (en) Document matching and annotation lifting
US6947596B2 (en) Character recognition method, program and recording medium
JP3936436B2 (ja) 表認識方法
JP3586949B2 (ja) 帳票認識装置
JPH08212292A (ja) 枠線認識装置
JPH0981740A (ja) 線図形入力装置
JPH1040333A (ja) 帳票認識装置
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JPH07182459A (ja) 表構造抽出装置
CN111027521A (zh) 文本处理方法及系统、数据处理设备及存储介质
JP2796561B2 (ja) 表形式文書認識方式
JP2917427B2 (ja) 図面読取装置
JP2789622B2 (ja) 文字/図形領域判定装置
JPH10198761A (ja) 文字認識方法および文字認識装置
JPH09147105A (ja) 図面閉領域の抽出方法
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPH0728934A (ja) 文書画像処理装置
JPH0696274A (ja) 文字等の認識方法
JPS63208181A (ja) パターン認識方法及び情報処理装置
JPH0929179A (ja) 宛名読取装置
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
JP2002123794A (ja) フォーマットパラメータ作成装置及び文字認識装置
JPH08115428A (ja) 領域判別装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040720

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040802

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees