JPH1040333A - 帳票認識装置 - Google Patents

帳票認識装置

Info

Publication number
JPH1040333A
JPH1040333A JP8198716A JP19871696A JPH1040333A JP H1040333 A JPH1040333 A JP H1040333A JP 8198716 A JP8198716 A JP 8198716A JP 19871696 A JP19871696 A JP 19871696A JP H1040333 A JPH1040333 A JP H1040333A
Authority
JP
Japan
Prior art keywords
frame
line
ruled line
corner
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8198716A
Other languages
English (en)
Other versions
JP3622347B2 (ja
Inventor
Toyoki Kawahara
豊樹 川原
Atsuharu Yamamoto
淳晴 山本
Chihiro Ueki
千尋 植木
Mikio Fujita
幹男 藤田
Yoshiyuki Matsuyama
好幸 松山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP19871696A priority Critical patent/JP3622347B2/ja
Publication of JPH1040333A publication Critical patent/JPH1040333A/ja
Application granted granted Critical
Publication of JP3622347B2 publication Critical patent/JP3622347B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 帳票認識装置において、帳票の傾きや破線の
罫線が存在しても、信頼性の高い認識装置を提供するこ
とを目的とする。 【解決手段】 画像入力手段1により帳票を読取り、2
値画像に変換し画像メモリ2に記憶し、第1の罫線抽出
手段3により2値画像を水平及び垂直方向の実線の罫線
を抽出後、罫線のコーナーを検出し、構成要素検出手段
5によりコーナー形状の組合わせから罫線の構成要素を
検出し、矩形検出手段6により構成要素同士を連結し枠
構造情報を生成し、第2の罫線抽出手段7により破線を
繋ぎの同様に罫線を抽出後、罫線のコーナーを検出し、
枠構造照合手段10により枠構造情報とフォーマット情
報とを照合し帳票の種別を判別し、第2のコーナー検出
手段8からのコーナー点情報を基に実線と破線との交点
を検出し、帳票内の文字読取り対象枠を検出し、その座
標に基づき文字領域を切出し、文字を認識する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票のような枠罫
線と文字を含む文書画像において枠罫線の構造を認識
し、帳票内の特定の文字領域を切り出し文字を認識する
ための帳票認識装置に関する。
【0002】
【従来の技術】近年、文書情報の電子化に伴い、OCR
(Optical Character Reader)を初めとする文字認識技
術や文書画像処理に対する要望が高まっており、帳票な
ど表形式文書の表構造認識技術もそのひとつである。
【0003】従来、帳票の枠罫線認識として、枠線のラ
ン長で線分を検出する方法が良く知られており例えば特
開平01−217583号公報があり、その罫線認識装
置のブロック結線図を図31に示し説明する。図31に
おいて、1001は画像入力部、1002は画像メモ
リ、1003は縦方向ランを抽出する縦方向ラン抽出
部、1004は縦方向線分を抽出する縦方向線分抽出
部、1005は横方向ランを抽出する横方向ラン抽出
部、1006は横方向線分を抽出する横方向線分抽出
部、1007は抽出された縦方向線分と横方向線分を用
いて文字領域を抽出する文字領域抽出部であり、その動
作を以下に説明する。
【0004】画像入力部1001は、認識対象罫線を含
む画像を走査し2値信号で画像メモリ1002に格納す
る。縦方向ラン抽出部1003は、画像メモリ1002
に格納されている画像を縦方向に走査して縦方向ランを
抽出する。縦方向線分抽出部1004は、抽出された縦
方向のランの連結性を調べ縦方向線分を抽出する。同様
の処理により、横方向ラン抽出部1005で横方向ラン
を抽出し、横方向線分抽出部1006で横方向線分を抽
出する。
【0005】文字領域抽出部1007は、縦方向線分抽
出部1004で抽出された縦方向線分と横方向線分抽出
部1006で抽出された横方向線分を用いて文字領域お
よび文字記入領域を抽出するものである。
【0006】また、切り出された文字の認識方法につい
ては、各種方式が提案されており、例えばニューラルネ
ットを用いた文字認識法(”PDPモデルによる手書き
漢字認識”、電子情報通信学会論文誌、Vol.J73-D-II,
No.8 pp.1268-1274 1990)があり、認識率も実用的なと
ころまできているが、今回は帳票認識装置ということで
帳票の指定枠の認識処理を中心としているので文字認識
に関しては上記文献を提示し説明は省略するものとす
る。
【0007】
【発明が解決しようとする課題】しかしながら上記の従
来の構成では、第1の課題として、帳票が画像として傾
いて読み取られた場合はラン長で枠罫線を認識すること
が難しく、また枠罫線が破線の場合は文字枠として検出
する事ができないという問題があった。
【0008】さらに、第2の課題として、枠罫線が汚れ
等により断線したりあるいはコーナが直角ではなく丸み
を持ったコーナの場合、ラン長による枠罫線の認識がで
きないという問題があった。
【0009】本発明は、前記従来技術の課題を解決する
もので、帳票画像が傾いて入力された場合や、帳票に破
線の枠罫線や断線あるいは丸みを持ったコーナが存在し
ても、文字枠を正確に検出することのできる信頼性の高
い帳票認識装置を提供することを目的とする。
【0010】
【課題を解決するための手段】この第1の課題を解決す
るために本発明は、帳票を読み取り2値画像を得る画像
入力手段と、2値画像を記憶する画像メモリと、2値画
像の水平、垂直方向の実線の罫線を抽出する第1の罫線
抽出手段と、2値画像の水平、垂直方向の実線及び破線
の罫線を抽出する第1の罫線抽出手段と、2値図形のコ
ーナーを検出する第1及び第2のコーナー検出手段と、
コーナー形状の組み合わせから罫線の屈曲や交差による
L字要素、T字要素、十字要素を検出する構成要素検出
手段と、構成要素同士を連結し連結形態を枠構造情報と
して出力する矩形検出手段と、複数の帳票のフォーマッ
ト情報を記憶するフォーマット情報記憶手段と、帳票内
の矩形構造と前記フォーマット情報を照合し帳票の種別
を判別し、前記第2のコーナー検出手段からのコーナー
点情報をもとに実線と破線からなる罫線同士の交点を検
出し、帳票内の文字読み取り対象枠を検出する枠構造照
合手段と、前記文字読み取り対象枠の文字領域を切り出
す文字切り出し手段と、切り出された文字を認識する文
字認識手段とを設けたものである。
【0011】また、第2の課題を解決するために本発明
は、構成要素検出手段として、第1のコーナー検出手段
からのコーナーの組み合わせから罫線の屈曲や交差に罫
線の断線を加えI字要素を検出し、さらに断線同士の構
成要素あるいは断線と他の構成要素(L字要素、T字要
素)とのグルーピングにより、L字要素、T字要素及び
十字要素の構成要素に更新するようにしたものである。
【0012】これにより、帳票が画像として傾いて入力
されたり、帳票内に破線の罫線や断線あるいは丸みを持
ったコーナが存在しても、文字枠を正確に検出でき、信
頼性の高い帳票認識装置が実現できる。
【0013】
【発明の実施の形態】本発明の請求項1記載の発明は、
枠罫線と文字を含む帳票文書を読み取り2値画像を出力
する画像入力手段と、前記2値画像を記憶する画像メモ
リと、前記2値画像において水平、垂直方向の実線の罫
線を抽出する第1の罫線抽出手段と、実線の罫線からな
るパターンのコーナーを検出する第1のコーナー検出手
段と、前記2値画像において水平、垂直方向の実線及び
破線の罫線を抽出する第2の罫線抽出手段と、枠罫線か
らなるパターンのコーナーを検出する第2のコーナー検
出手段と、コーナー形状の組み合わせから罫線の屈曲や
交差によるL字要素、T字要素、及び十字要素を検出す
る構成要素検出手段と、構成要素同士を連結し連結形態
を枠構造情報として出力する矩形検出手段と、予め読み
取り対象となる複数の帳票のフォーマット情報を記憶す
るフォーマット情報記憶手段と、前記枠構造情報と前記
フォーマット情報とを順次照合し実線枠を検出すると共
に、照合結果から帳票の種別を判別し、前記第2のコー
ナー検出手段からのコーナーと前記フォーマット情報と
から実線枠で指定された対象枠と破線との交点である破
線交点を検出し、対象枠の座標を出力する枠構造照合手
段と、前記対象枠の座標に基づき前記画像メモリから文
字領域を切り出す文字切り出し手段と、切り出された文
字を認識する文字認識手段とを具備する帳票認識装置と
したものであり、帳票の2値画像から実線及び破線の罫
線を抽出し、その罫線からなるパターンのコーナー点を
抽出し、コーナー点から枠罫線交点である構成要素を抽
出し、相互に連結された構成要素から矩形構造を検出
し、フォーマット情報と比較照合することにより、帳票
が傾いて読み取られた場合や、帳票に破線の罫線が存在
していても、読み取り対象の文字枠を正確に検出できる
という作用を有する。
【0014】本発明の請求項3記載の発明は、構成要素
検出手段として、第1のコーナ検出手段からのコーナー
の組み合わせから罫線の断線としてI字要素を新たに検
出し、I字要素同士のグルーピング、あるいはI字要素
とL字要素、及びT字要素とのグルーピングにより、L
字要素、T字要素あるいは十字要素の構成要素を更新す
ることを特徴とし、枠罫線の断線や帳票枠の角部分が緩
やかな曲率を持っている場合にも、構成要素を正確に検
出できるという作用を有する。
【0015】以下、本発明の実施の形態について、図1
から図30を用いて説明する。 (実施の形態1)図1は、本発明の実施の形態1の帳票
認識装置のブロック構成図を示し、1は帳票文書を読み
取り2値画像を得る画像入力手段、2は前記2値画像を
記憶する画像メモリ、3は2値画像の水平、垂直方向の
実線の罫線を抽出する第1の罫線抽出手段、4は実線の
罫線のコーナーを検出する第1のコーナー検出手段、5
は前記コーナーの組み合わせから罫線の屈曲や交差によ
るL字要素、T字要素、及び十字要素を検出する構成要
素検出手段、6は構成要素同士を連結し枠構造情報とし
て出力する矩形検出手段と、7は前記2値画像において
水平、垂直方向の実線及び破線の罫線を抽出する第2の
罫線抽出手段、8は前記実線及び破線の枠罫線のコーナ
ーを検出する第2のコーナー検出手段、9は予め読み取
り対象となる複数の帳票のフォーマット情報を記憶する
フォーマット情報記憶手段、10は前記枠構造情報と前
記フォーマット情報とを順次照合し実線枠を検出すると
共に、照合結果から帳票の種別を判別し、前記第2のコ
ーナー検出手段からのコーナーと前記フォーマット情報
とから実線枠で指定された対象枠と破線との交点である
破線交点を検出し、対象枠の座標を出力する枠構造照合
手段、11は文字読み取り対象枠の文字領域を切り出す
文字切り出し手段、12は切り出された文字を認識する
文字認識手段である。
【0016】以上のように構成された帳票認識装置につ
いて、その動作の概要を説明する。画像入力手段1によ
り帳票を読み取り、文字部及び枠罫線部が値1、背景が
値0をもつ2値画像に変換し画像メモリ2に記憶する。
第1の罫線抽出手段3は、画像メモリ2からの2値画像
を水平及び垂直方向に走査し所定長以上の値”1”が連
続する線を抽出し、第1のコーナー検出手段4により水
平及び垂直の罫線からのコーナーを検出する。構成要素
検出手段5は、第1のコーナー検出手段4からのコーナ
ーの組み合わせから罫線の屈曲部や交差部のL字要素、
T字要素、及び十字要素の構成要素を検出する。矩形検
出手段6は、構成要素検出手段5からの構成要素同士を
相互に連結し枠構造情報を得る。
【0017】第2の罫線抽出手段7は、前記2値画像の
水平、垂直方向の実線及び破線の罫線を抽出し、第2の
コーナー検出手段8により実線及び破線の枠罫線からコ
ーナーを検出する。
【0018】フォーマット情報記憶手段9は、予め読み
取り対象となる複数の帳票のフォーマット情報を記憶す
る。枠構造照合手段10は、構成要素検出手段5からの
枠構造情報と前記フォーマット情報を照合し帳票の種別
を判別し、枠構造情報から実線枠を検出すると共に、第
2のコーナー検出手段8からのコーナーと前記実線枠お
よび前記フォーマット情報から実線と破線との交点を検
出し、実線枠とその実線枠と破線との交点から帳票内の
対象枠を検出する。文字切り出し手段11は、読み取り
対象枠の4頂点の座標に基づき文字領域を切り出し、文
字認識手段12により切り出された領域から文字を認識
するものである。
【0019】次に図1に基づいて、各構成要素の動作を
詳細に説明する。画像入力手段1は、帳票を読み取り2
値画像を出力するもので、本発明の実施の形態1では読
み取り線密度を約400dpi程度とし、原稿である帳
票にLED(発光ダイオード)等で照明しその反射光を
一次元のCCDカメラで読み取り、任意の閾値で2値化
して文字部を値1、背景を値0の2値画像を出力する。
【0020】また、照明は、原稿である帳票の枠線や記
入された文字の色によって異なるが、例えば青・黒およ
び赤等の枠線に対して、黒や青等で数字や記号および文
字が記入された場合、緑あるいは黄緑の波長(550〜
570nm付近)のLEDを用いることが多い。2値化
処理においては、固定閾値法や浮動閾値法(”認識問題
としての二値化と各種方法の検討”、情報処理学会、イ
メージプロセッシング15-1, Nov. 1977)が良く知られ
ており、本発明の実施の形態1では2値化処理法につい
ては特に言及するものではないので、原稿に合わせて任
意の2値化処理法を選択すればよい。このように2値化
された画像データは画像メモリ2に格納され、各処理で
必要に応じて読み出される。
【0021】次に第1の罫線抽出手段3について図2を
用いて説明する。図2は、第1の罫線抽出手段3におけ
る画像処理のブロック構成図を示し、20は画像メモリ
2からの2値画像、21は水平方向にパターンを縮める
水平方向収縮手段、22は水平方向にパターンを延長す
る水平方向延長手段、23は垂直方向にパターンを縮め
る垂直方向収縮手段、24は垂直方向にパターンを延長
する垂直方向延長手段、25は水平方向延長手段22と
垂直方向延長手段24の出力のNOR演算を行うNOR
回路である。
【0022】水平方向収縮手段21は、画像メモリ2か
らの2値画像20に対し、水平方向にh画素縮めること
により、水平方向にh画素以下の幅の線や文字を消滅さ
せるものである。続く水平方向延長手段22は、水平方
向にh画素延長することによりh画素より長い水平線分
のみを抽出する。
【0023】同様に、垂直方向収縮手段23は、垂直方
向にv画素縮めることにより、垂直方向にv画素以下の
幅の線や文字が消滅させるものである。続く垂直方向延
長手段24は、垂直方向にv画素延長することによりv
画素より長い垂直線分を抽出する。NOR回路25は、
水平方向延長手段22と垂直方向延長手段24からの出
力をNOR演算を行い、文字部が消去され枠罫線のみが
残り、枠罫線及び背景がそれぞれ”0”及び”1”の値
をもつ2値画像が得られる。
【0024】次に、水平及び垂直方向の収縮及び延長処
理について図3及び図4を用いてさらに詳細に説明す
る。
【0025】図3は、水平及び垂直方向収縮手段21及
び23の処理手順を示すフロー図で、2値画像を水平方
向または垂直方向に1ラインずつ順次走査し終了ライン
まで処理を行い、各ライン毎にn画素の収縮処理を行う
とき、ランレングスのカウント値をCとし、ステップ毎
に説明する。
【0026】ステップ31は、各ラインの走査開始時に
カウント値Cに0を設定する。ステップ32は、1画素
データを読み込む。ステップ33は、画素の値が0
(白)か1(黒)かを判定し、0のときステップ34
へ、1のときステップ36に進む。ステップ36は、カ
ウント値Cに0を設定する。ステップ35は、黒ランで
はないので値0を出力する。ステップ36は、カウント
値Cがn以上かどうかの判定を行い、n未満のときステ
ップ37へ、n以上のときステップ38に進む。ステッ
プ37は、カウント値Cをインクリメントしステップ3
5に進む。ステップ38は、n画素以上のランレングス
をもつ黒ランが存在するので値1を出力する。
【0027】以上の処理を1ラインの終了まで行うこと
により、そのライン上の黒ランがn画素縮められる。次
のラインを処理するときは再びステップ31から同様の
処理を繰り返す。このようにして全画面の走査が終了す
ると、水平または垂直方向にn画素以上のランレングス
を有する線分が抽出される。
【0028】同様に図4は、水平及び垂直方向延長手段
22及び24の処理手順を示すフロー図で、2値画像を
水平方向または垂直方向に1ラインずつ順次走査し終了
ラインまで処理し、各ライン毎にn画素の延長処理をお
こなうとき、ランレングスのカウント値をCとし、各ス
テップ毎に説明する。
【0029】ステップ41は、各ラインの走査開始時に
カウント値Cに0を設定する。ステップ42は、1画素
データを読み込む。ステップ43は、画素の値が0
(白)か1(黒)かを判定し、1のときステップ44
へ、0のときはステップ46に進む。ステップ44は、
カウント値Cにnを設定する。ステップ45は、黒ラン
上にあるので値1を出力する。
【0030】ステップ46は、カウント値Cが0以下か
どうかの判定を行い、0より大きい場合ステップ47
へ、0以下のときステップ48へ進む。ステップ47
は、カウント値Cをデクリメントし、さらにステップ4
5へ進む。ステップ48は、その走査位置は黒ランから
n画素より大きく離れているので値0を出力する。
【0031】以上の処理を1ラインの終了まで行うこと
により、そのライン上の黒ランがn画素延長される。次
のラインを処理するときは再びステップ41から同様の
処理を繰り返す。このようにして全画面の走査が終了す
ると、水平または垂直方向にランレングスがn画素分だ
け延長される。
【0032】次に第1のコーナー検出手段4、構成要素
検出手段5、及び矩形検出手段6における一連の処理に
ついて説明するが、これらの内容は同一出願人により特
願平7−016862号に記載されており詳細な説明は
省略し、その動作を簡単に説明する。
【0033】まず第1のコーナー検出手段4について図
5から図7を用いて説明する。図5は、コーナーを検出
するための前処理として、第1の罫線抽出手段で抽出さ
れた2値画像の実線の罫線の輪郭に方向コードを付与し
た方向コード化画像に変換した結果を示す。図6は、方
向コード1〜8と実際の方向の対応関係を示す図であ
り、図7は検出するコーナーの具体例を示す図である。
【0034】図5において、51は枠罫線の画素、52
は背景の画素、数字は輪郭点に付与された方向コードを
それぞれ示しており、この場合背景パターンを右回りの
方向に輪郭を追跡しながら図6に示す方向コード1〜8
を割り当てている。
【0035】なお、背景画素に方向コードを付与したが
枠罫線の輪郭画素に付与しても良く、また背景パターン
を右回りの方向に輪郭を追跡しているが、左回りに追跡
しても良い。
【0036】コーナーの検出は、このように方向コード
化画像から方向コードの変化点、すなわちコーナーを検
出する。このために3×3近傍において、注目位置(中
央画素)コードが指示する方向に、中央画素と同一の方
向コードでない方向コードを持つ画素を検出する。図5
において、丸で囲まれた位置は方向コードの変化点を示
している。例えば53の位置では、図7(a)に示す画
素配置となっており、注目画素の指示する方向”3”の
示す位置にある画素の方向コードは”1”となってお
り、輪郭の方向が”3”から”1”へ変化することを意
味するので方向コードの変化点であるコーナーとして検
出する。
【0037】また、方向コードの変化点は、”31”と
いうコード(以下方向変化コードと呼ぶ)で表記し、x
座標、y座標と方向変化コードを1組の特徴情報として
検出する。同様に画素位置54、55、56は図7の
(b)、(c)、(d)に対応しており、それぞれ”1
7”、”75”、”53”という方向変化コードが与え
られ、これらのコーナー点の持つx座標、y座標、方向
変化コードを1組の特徴情報として構成要素検出手段5
へ通知する。
【0038】次に構成要素検出手段5について図8と図
9を用いて説明する。図8は、コーナー点の組み合わせ
から構成要素を検出するための判定条件を示す図で、図
9は構成要素の記述形式を示す図である。図8におい
て、(a)(b)(c)(d)はL字要素の検出例、
(e)(f)(g)(h)はT字要素の検出例、(i)
は十字要素の検出例を示している。
【0039】構成要素検出手段5は、コーナー検出手段
4からのコーナーの特徴情報を用いて、x座標、y座標
が所定の距離以内にある複数のコーナー点を一つのグル
ープにまとめる処理(以下グループ化と呼ぶ)を行い、
グループのメンバーであるコーナー点の方向変化コード
の組み合わせから、構成要素の種類が対応付けられる。
【0040】このようにして検出された構成要素は、図
9に示すように4ビットのコード(以下形状コードとよ
ぶ)で記述され、各ビットは上位からS、W、N、Eの
いずれの方向に腕が存在するかを示している。例えば図
8(a)に示すL字要素はS方向とE方向に腕を有して
いるので、”1001”のビットパターンで記述され
る。構成要素のx座標及びy座標には、グループのメン
バーであるコーナー点のx座標及びy座標の平均値を与
えるものとし、構成要素検出手段5は前記構成要素のx
座標、y座標、及び形状コードを特徴情報として、矩形
検出手段6に通知する。
【0041】次に矩形検出手段6について図10及び図
11を用いて説明する。図10は、構成要素同士の連結
関係を示す図であり、図11は前記の連結関係から生成
された最小矩形の認識を示す図である。矩形検出手段6
は、矩形情報としてこれら構成要素の連結関係を記述し
た連結テーブル(図10(b))、および構成要素の連
結関係から構成される最小矩形の位置情報を記述した矩
形情報テーブル(図11(b))を生成出力するもので
ある。
【0042】図10(a)は、構成要素検出手段5にお
いて検出されたL字要素、T字要素、十字要素とその位
置関係の一例を示すものである。まず、各構成要素に対
し識別ラベルe1からe20を付与し、次に構成要素検出手
段5からの特徴情報(x座標、y座標、形状コード)に
基づき、形状コードの示す腕の各方向についてx方向と
y方向とをそれぞれ探索し、連結可能な腕をもつ構成要
素のうち最短距離にあるものを検出し、連結テーブル
(図10(b))を生成する。図10(b)は、構成要素
の連結関係を示す連結テーブルを示すもので、各構成要
素がどの要素と連結するかをN、S、E、Wの各方向に
ついて記述している。例えば、L字要素e1の場合は、腕
S及びEに対応する構成要素としてe14及びe2が存在
し、T字要素e2の場合は腕S、W、及びEに対応する構
成要素としてe8、e1、及びe3が存在することになる。
【0043】さらに生成した連結テーブル(図10
(b))を用いて、最小矩形を認識して矩形情報テーブル
を生成する。図11(a)は、最小矩形の認識の概念図
を示すもので、ある構成要素を始点としてE方向、S方
向、W方向、N方向の順に連結をたどっていき、始点に
戻ることができれば、その4点で構成される矩形を最小
矩形と呼び、図11(b)に示す最小矩形の位置、サイ
ズ等を記述した矩形情報テーブルに登録する。例えば、
要素e1を始点とし時計方向回りに探索した場合は、E方
向に連結する要素として要素e2が存在する。次に要素e2
が持つS方向に連結をたどって要素e8を参照し、次に要
素e8からW方向に連結をたどろうとするが、要素e8はW
方向の腕を持っていないので、さらにS方向に連結をた
どると、W方向の腕を持った要素e15が存在する。次に
要素e15からW方向に要素e14をたどり、要素e14からN
方向にたどると始点の要素e1に戻り最小矩形として認識
することができる。そして、E,S,W,Nと方向を変
えながら連結している4つの要素e1、e2、e15、e14を最
小矩形の角の4点として、図11(b)の矩形情報テー
ブルの矩形識別ラベルr1の項目に登録し、すべての最
小矩形を認識し矩形情報テーブルを生成する。
【0044】なお、要素e1を始点として設定したが、
限定するものではなくどの位置を始点にしても良く、ま
た右回りに連結したが左回りに連結しても良い。
【0045】このようにして生成された連結テーブル及
び矩形情報テーブルを枠構造照合手段10に通知する。
【0046】次に、第2の罫線抽出手段7について図1
2を用いて説明する。図12は、第2の罫線抽出手段7
における画像処理のブロック構成図を示し、20は画像
メモリ2からの2値画像、201は水平方向にパターン
を延長する第1の水平方向延長手段、202は水平方向
にパターンを縮める水平方向収縮手段、203は水平方
向にパターンを延長する第2の水平方向延長手段、20
4は垂直方向にパターンを延長する第1の垂直方向延長
手段、205は垂直方向にパターンを縮める垂直方向収
縮手段、206は垂直方向にパターンを延長する第2の
垂直方向延長手段、207は第2の水平方向延長手段2
03と第2の垂直方向延長手段206の出力のNOR演
算を行うNOR回路である。
【0047】第1の水平方向延長手段201は、画像メ
モリ2からの2値画像20に対し、水平方向にhd画素
延長することによりhd画素より間隔の短い破線部分を
連結する。水平方向収縮手段202は、水平方向に(h
+hd)画素縮めることにより、水平方向に(h+h
d)画素以下の幅の線や文字を消滅させ、続く第2の水
平方向延長手段203において水平方向にh画素延長す
ることにより、hd画素以下の間隔で、かつh画素より
長い水平線分を抽出する。
【0048】同様に第1の垂直方向延長手段204は、
画像メモリ2からの2値画像20に対し、垂直方向にv
d画素延長することによりvd画素より間隔の短い破線
部分を連結する。垂直方向収縮手段205は、垂直方向
に(v+vd)画素縮めることにより、垂直方向に(v
+vd)画素以下の幅の線や文字を消滅させ、続く第2
の垂直方向延長手段206において垂直方向にv画素延
長することにより、vd画素以下の間隔でかつv画素よ
り長い垂直線分を抽出する。
【0049】NOR回路207は、第2の水平方向延長
手段203と第2の垂直方向延長手段206の出力のN
OR演算を行い、文字が消去され破線部分が実線になっ
た枠罫線のみが残り、枠罫線及び背景がそれぞれ”0”
及び”1”の値をもつ2値画像208が得られる。
【0050】また、第1及び第2のの水平及び垂直方向
延長手段201、203、204、206は、第1の罫
線抽出手段3の水平及び垂直方向延長手段22及び24
と同じ処理をするものであり、水平及び垂直方向収縮手
段202及び205は、第1の罫線抽出手段3の水平及
び垂直方向収縮手段21及び23と同じ処理をするもの
であり詳細な説明は省略する。
【0051】第2のコーナー検出手段8の処理は、第1
のコーナー検出手段4と同じであり、前記第2の罫線抽
出手段からの実線と破線部分のコーナー点情報を出力す
るもであるので説明は省略する。
【0052】次にフォーマット情報記憶手段9について
図13及び図14を用いて説明する。図13(a)は入
力された帳票500の画像、図13(b)は第1の罫線
抽出手段3の出力画像、図13(c)は第2の罫線抽出
手段7の出力画像を各々示している。フォーマット情報
記憶手段9には図13(b)に示す実線の枠構造情報、
及び破線で区切られた枠構造情報が格納されており、例
えば図13に示す帳票に対しては図14に示すフォーマ
ットが対応する。
【0053】図14において、ID番号1は枠501、
ID番号2は枠502というように各実線枠と1対1に
対応しており、各実線枠内に破線枠が存在するときは、
破線フラグが”1”になっており、当該実線枠の桁数が
設定されている。また、対象枠フラグが”1”の場合に
は、該実線枠および破線枠を対象枠として文字切り出し
手段に通知する対象枠である。図13(b)の帳票50
0においては、枠502に5桁、枠504に3桁、枠5
05に3桁破線枠が存在し、対応する図14にはID番
号2、4、及び5の位置に桁数として5、3、及び3が
設定されている。図14において、x、y座標は、各実
線枠の左上、右上、右下、左下の順に登録されており、
さらに各実線枠の幅と高さが登録されている。また図1
4における許容値は、枠構造を照合する際の枠の幅と高
さの誤差許容範囲を示すものである。
【0054】また、フォーマット情報記憶手段9には、
複数の帳票の枠構造情報が登録されており、それぞれ帳
票はレコード番号で識別される。
【0055】次に枠構造照合手段10について図15を
用いて説明する。枠構造照合手段10は、まず図14に
示したフォーマット情報を参照して入力された帳票の実
線枠構造を認識し、対象フラグが”1”の場合に、前記
実線枠と図13(c)の○印で示す位置のコーナー点情
報とを基に、破線の交点位置を確定して、実線枠および
破線枠の4角の点の座標を文字切り出し手段11に通知
するものである。
【0056】図15は、枠構造照合手段10における処
理手順を示すフロー図であり、各ステップ毎に説明す
る。
【0057】まずステップ511は、矩形検出手段6か
ら枠構造情報である連結テーブル及び矩形情報テーブル
を読み込む。ステップ512は、読み込んだ連結テーブ
ルから連結している構成要素の傾きの平均値を画像の傾
き値gradとして(数1)によって算出する。
【0058】
【数1】
【0059】ここでは、水平方向に連結している構成要
素の傾きの平均値を画像の傾き値として用いたが、画像
の傾きがわかるのであれば、他の手法でもかまわない。
【0060】次に513〜518のステップは、フォー
マット情報記憶手段9に登録されている複数の帳票の中
から、矩形検出手段6からの枠構造情報と最も類似して
いる帳票を判別する処理である。まず、ステップ513
でフォーマット情報記憶手段9からレコード番号(i)
の枠構造情報を取り出す。
【0061】次に、ステップ514で枠構造情報(i)
と連結テーブル及び矩形情報テーブルとの実線枠照合及
び“累積枠相違度”の算出を行う。ここで、“累積枠相
違度”とは、枠毎に求めた“枠相違度”を累積加算し帳
票全体の相違度を表したものである。“枠相違度”と
は、枠構造情報の枠と読み取られた帳票の枠同士を対応
づけた時の枠形状の“違い”を表すもので、互いの枠の
形状の差が大きほど“枠相違度”が大きくなるように定
義する。すなわち、枠構造情報と読み取られた帳票のフ
ォーマットの差が大きいほど“累積枠相違度”も大きく
なる。
【0062】なお、ここで、枠構造の照合に枠形状の
“違い”を表す枠相違度および累積枠相違度を用いた
が、枠形状の“一致”を表す枠一致度および累積枠一致
度を用いても良い。
【0063】ステップ515は、ステップ514で算出
された累積枠相違度を、今までに算出されている累積枠
相違度の中で最小の値(以下、最小累積枠相違度と呼
ぶ)と比較し、小さい場合はステップ516に進み、大
きい場合は、ステップ513に戻る。ステップ516
で、現在の累積枠相違度を最小累積枠相違度とし、基準
フォーマットのレコード番号(i)、認識枠テーブルを
記録更新する。ステップ517は、レコード番号iとフ
ォーマット情報に登録されている帳票の数nとを比較
し、i≧nならステップ518に、i<nならi=i+
1しステップ513に戻る。
【0064】ステップ518は、最小累積枠相違度が予
め設定したしきい値よりも小さければ認識枠テーブルを
そのまま出力し、大きければ基準フォーマットの中に対
応する帳票がなかったとして出力する。ステップ519
は、認識した実線枠の中で対応するフォーマット情報の
テーブル対象枠フラグが”1”となっている実線枠の4
点の座標を基に、フォーマット情報から推定した破線の
交点の位置の近傍領域から第2のコーナー検出手段から
の実在のコーナー点を探索し破線交点を検出する。
【0065】次に、ステップ520は、帳票内の対象枠
の検出処理で、実線枠の4角の座標と破線交点の位置か
ら、実線と破線で構成されている枠の4角の座標を算出
し対象枠として文字切り出し手段11に通知する。例え
ば、図23(b)の実線枠720は4本の破線によって
5つの枠721〜枠725で構成されている。実線枠7
20の座標をそれぞれ左上点、右上点、右下点、左下点
の順に(x1、y1)、(x2、y2)、(x3、y
3)、(x4、y4)として、破線交点の上側の座標を
左から順に(XU0、YU0)〜(XU3、YU3)、
下側の座標を(XL0、XL0)〜(XL3、YL3)
とすると、通知する5つの対象枠の4角の座標は、枠7
21が、左上点、右上点、右下点、左下点の順に(x
1、y1)、(XU0、YU0)、(XL0、YL
0)、(x4、y4)となり、枠722が(XU0、Y
U0)、(XU1、YU1)、(XL1、YL1)、
(XL0、YL0)となり、その他の枠も図23(c)
の表のごとく通知される。
【0066】次に、ステップ514の実線枠照合及び
“累積枠相違度”の算出及びステップ519の破線交点
の検出について詳細に説明する。
【0067】ステップ514の実線枠照合及び“累積枠
相違度”の算出について、図16から図19を用いて詳
細に説明する。図16は、フォーマット情報記憶手段9
に登録されている枠構造情報と矩形検出手段6からの連
結テーブル及び矩形情報テーブルとを照合し、“累積枠
相違度”を算出する手順を示すフロー図である。図17
(a)は、基準になる帳票の実画像(以下、基準帳票と
呼ぶ)を示し、図17(b)は、その枠構造情報を示
す。図18(a)は、読み取られた帳票の実画像(以
下、検査帳票と呼ぶ)を示し、図18(b)は、検査帳
票の連結テーブル、図18(c)は、矩形情報テーブル
を示す。図19は探索範囲を示す。また、図20は実際
の処理の結果を示す。
【0068】図16に示す実線枠の照合および累積枠相
違度を求める処理フローに従って、ステップ毎に説明す
る。
【0069】まず、ステップ521は、フォーマット情
報の枠座標を(数2)により、傾き値gradだけ回転
させ傾きを補正する。
【0070】
【数2】
【0071】ステップ522は、フォーマット情報から
位置あわせの始点とする“始点枠”を取り出し、取り出
す始点枠がない場合は終了する。”始点枠”として、例
えば原点に近い枠から順次選択する。
【0072】ステップ523は、フォーマット情報に記
述された許容値の範囲内で高さと幅が“始点枠”と同じ
枠を“始点候補枠”として矩形情報テーブルから探索す
る。ステップ524では、“始点候補枠”が存在するか
どうかの判断を行い、存在しなければステップ525に
進み、存在すればその矩形の4点座標を始点候補枠とし
て記憶し、ステップ526に進む。ステップ525は、
連結テーブルから、図19(a)のように始点枠の4角
の点を中心に所定の探索範囲を設定し、検査帳票の連結
テーブルの全構成要素について探索し、4つの探索範囲
すべてに構成要素が存在する場合に、その4点を始点候
補枠として記憶する。
【0073】ステップ526は、“始点候補枠”が全く
なければ、ステップ521に戻りフォーマット情報の次
の枠を“始点枠”として選択してやり直す。
【0074】例えば、図17と図18の帳票の場合に
は、まず図17(b)をフォーマット情報としてID番
号b1の枠を始点枠として選択する。次に、b1の枠と
同じサイズの矩形を図18(c)の矩形情報テーブルか
ら探索すると、r1、r2の矩形がそれぞれ始点候補枠
として選ばれ、図20(a)に示すように記憶される。
仮にr1、r2の矩形が存在しない場合には、e1,e
2,e3,e4の構成要素の組み合わせと、e5,e
6,e10,e9の組み合わせが“始点候補枠”として
選択されて記憶される。
【0075】次に、“始点候補枠”が存在すれば、次の
527〜539のステップで、そのすべての“始点枠”
と“始点候補枠”とが重なるように位置あわせを行い、
フォーマット情報と矩形情報テーブルの各枠毎に照合し
枠相違度を求め、累積加算したものを累積枠相違度とし
て算出するもので、最終的には“累積枠相違度”が最小
になる組み合わせを選ぶことになる。フォーマット情報
と矩形情報テーブルとの照合について図19(b)を用
いて説明する。
【0076】まず、ステップ527で、“始点枠”b1
の枠原点551と“始点候補枠”r1の枠原点550の
相対距離(rx,ry)を(数3)で算出する。
【0077】
【数3】
【0078】次に、ステップ528は、次の対象枠の探
索範囲を設定する処理で、例えば”基準枠”b2の枠原
点(枠の左上の点)557からの相対距離(rx,r
y)移動したの点556を中心に探索範囲552を設定
する。
【0079】ステップ529は、矩形情報テーブルから
次の対象枠を例えば対象枠r2として、高さと幅が許容
値内であり、探索範囲の中に枠原点562があるかどう
か探索する。ステップ530は、矩形が存在するかどう
かを確認するもので、存在すればその矩形を枠テーブル
に登録しステップ532に進み、存在しなければステッ
プ531に進む。ステップ531は、図19(c)に示
すように基準枠572の4点座標をそれぞれ相対距離
(rx,ry)分移動した枠の4点(574、575、
576、577)を中心に、それぞれ所定の探索範囲5
73を設定して連結テーブルの4点を探索する。
【0080】ステップ532は、探索した構成要素の点
を枠テーブルに登録するが、もし構成要素の点が存在し
ない場合には、基準枠の点の座標をそのまま登録する。
ステップ533で“枠相違度”d frameを(数4)で算
出する。ここで、“枠相違度”とは、基準枠と探索した
枠との相違度を示す数であり、この値が大きいほど基準
枠と探索した枠とが異なっていることを示す。
【0081】
【数4】
【0082】なお、本発明では枠相違度を、探索範囲に
存在しない構成要素の数としているが、他の評価式、例
えば、基準枠の点と探索した枠の点との距離の差(ある
いは差の絶対値)の総和を枠相違度としても構わない。
【0083】ステップ534は、“枠相違度”を“累積
枠相違度”に累積加算する。ステップ535は、フォー
マット情報のテーブルに次の枠があるかを判定し、あれ
ばステップ536に進み、なければ537に進む。ステ
ップ536は、フォーマット情報から次の基準枠を読み
込み、ステップ528に戻る。次に、ステップ537で
“累積枠相違度”が今までに算出されている“累積枠相
違度”より小さいかどうかの判定をし、大きければステ
ップ539に進み、小さければステップ538に進む。
ステップ538は、枠テーブルを認識枠テーブルに登録
更新する。ステップ539は、ほかの“始点候補枠”が
あるかどうか判定し、“始点候補枠”がなくなるまでス
テップ528からステップ539を繰り返す。
【0084】以上の処理をすべての“始点候補枠”につ
いて行えば、最終的に最も違いの少ない認識枠データお
よび累積枠相違度が得られる。
【0085】実線枠の照合および累積枠相違度の処理結
果を図20に示す。始点枠b1の始点候補枠が、図20
(a)に示すr1、r2となっている。そこで、図20
(b)に示すように、r1を始点候補とした場合には、
b2の枠とr2の枠、b3の枠とe7,e8,e11の
構成要素、b4の枠とr3の枠がそれぞれ対応し、b3
の場合だけ枠相違度が1となるので、累積枠相違度は1
となる。一方、r2を始点候補とした場合には、対応す
る枠がほとんどなく、累積枠相違度は10となり、累積
枠相違度が最小になるr1を始点候補とした認識枠デー
タが図20(c)の認識枠テーブルに登録される。
【0086】次に、ステップ519の破線交点の検出に
ついて、図21及び図22を用いて詳細に説明する。図
21、22は、第2のコーナー検出手段からのコーナー
点情報を基に破線交点を検出する手順を示すフロー図で
ある。図21において、Nは読み取り対象とする対象枠
に存在する破線の総数である。
【0087】破線交点を検出する手順を、図21、22
に示すフロー図に基づき、ステップ毎に説明する。
【0088】まず、601から604のステップは、実
線交点間を桁数で等分し破線交点の候補位置を算出す
る。ステップ601は、制御変数jをリセットする。ス
テップ602は、実線枠の頂点間を等分し破線交点候補
の座標を求める。ステップ603は、jをインクリメン
トし、ステップ604においてjがN以上かどうかの判
定をし、N以上であればステップ605へ進み、そうで
なければステップ602に戻る。
【0089】ステップ602における演算内容を、図2
3(a)を用いてさらに詳しく説明する。図23(a)
は、破線交点の候補の位置関係を示すもので、例えば枠
701の頂点間を5等分することにより、上側の破線交
点候補CU(0)からCU(3)、及び下側の破線交点候補CL
(0)からCL(3)の座標が求まる。すなわち実線枠の上側
の2頂点を(x1,y1)、(x2,y2)、破線で区切ら
れた桁数をpとすると、上側の破線交点の候補座標(x
U(j),yU(j))は(数5)に示す内分演算で求められ
る。下側の破線交点の候補座標も実線枠の下側の2頂点
(x3,y3)、(x4,y4)を用いて同様の計算で求め
られる。
【0090】
【数5】
【0091】以上の手続きを枠702及び枠703に関
しても行い、帳票内の全ての破線の候補交点の座標を決
める。
【0092】次の605から611のステップでは、第
2のコーナー検出手段8からのコーナー情報を1点ずつ
読み込み、破線交点の候補座標の近傍に存在するかどう
かを判定し、近傍に存在するコーナー点を各破線交点毎
に一つのグループにまとめる。まず、ステップ605
は、コーナー情報をx座標、y座標、方向変化コードの
形式で1点ずつ読み込む。次にステップ606は、制御
変数jをリセットする。ステップ607は、破線交点の
候補座標を中心として±dを近傍領域として設定し、コ
ーナー点が近傍領域内に存在するかどうかを判定し、近
傍領域内に存在する場合はステップ608に進み、存在
しない場合はステップ609に進む。
【0093】ステップ608は、該当する候補交点のグ
ループに帰属させ、再び605に戻る。このとき枠の上
側の破線交点の候補座標の近傍に存在する場合はグルー
プGU(j)に所属させ、また枠の下側の破線交点の候補座
標の近傍に存在する場合はグループGL(j)に所属させる
ことにより上側のグループと下側のグループを区別す
る。これは、後述するペアコーナー点の成立条件におい
て、ペアとなるコーナー点の方向変化コードが上側の交
点と下側の交点で異なるからである。ステップ609
は、制御変数jをインクリメントする。ステップ610
は、j≧Nを判定しNの場合は607に、Yの場合は6
11に進む。611は、コーナ点の終了かどうかを判断
し、次のステップへ進むかどうかの判定を行う。
【0094】次に、図22における621から627の
ステップは、各候補交点のコーナー点のグループ毎に、
T字要素を構成し得るコーナー点のペアを生成する。
【0095】まず、ステップ621は、制御変数jをリ
セットする。次にステップ622は、各破線交点毎のコ
ーナー点のグループGU(j)またはGL(j)に対しコーナ点
のペアを生成する。ステップ623は、ペアが存在する
かどうかを判定し、ペアが存在する場合はステップ62
4へ進み、ペアが存在しない場合はステップ625へ進
む。ステップ624は、破線交点の座標としてペアコー
ナー点の平均座標から算出する。ステップ625は、破
線交点の座標としてステップ602で求めた実線枠の頂
点間を等分し破線交点候補の座標をで求めた座標を採用
する。次にステップ626においてjをインクリメント
し、ステップ627において次のステップへ進むかどう
かj≧Nで判定を行う。
【0096】以上、図21及び図22に示した手順によ
り、帳票の破線交点の位置が確定する。具体的には、図
24に示すように破線交点の候補位置707、708を
中心として±dの近傍領域705、706を設定する。
枠の上側のグループGU(j)は、方向変化コード”17”
のコーナー点の右側に方向変化コード”31”のコーナ
ー点が存在することからペアとして認められ、その平均
座標を破線交点の座標とする。一方、枠の下側のグルー
プGL(j)は、方向変化コード”75”のコーナー点の右
側に方向変化コード”53”のコーナー点が存在するこ
とからペアと認められ、その平均座標を破線交点の座標
とする。
【0097】次に、文字切り出し手段11について説明
する。文字切り出し手段11は、画像メモリ2から実際
の文字の2値イメージを切り出して文字認識手段12に
送るもので、その処理について図25を用いて詳細に説
明する。
【0098】図25は、ある帳票の枠の中に文字が描か
れている2値イメージの一部を示す。ここで、711〜
714は、枠構造照合手段10から通知された枠の4角
の点、715は枠の4角の点711〜714で構成され
る領域a、716は領域a(715)よりも枠線の幅の
分だけ小さくした領域b、717は枠内に描かれている
文字、718は文字枠である。
【0099】文字切り出しの処理の時には、領域a(7
15)で2値画像を切り出した場合、文字枠718の一
部分まで切り出してしまい、余分な画像を含んでいるた
めに文字認識率が低下する事がある。そこで、領域a
(715)よりも枠線の幅の分小さくした領域b(71
6)で画像メモリ2から切り出すことによって、文字枠
718を除いた文字領域を文字認識手段12に切り出
し、文字717を認識させるために、文字認識率の低下
を防ぐことができる。
【0100】文字認識手段12は、例えば、ニューラル
ネットを用いた文字認識法(”PDPモデルによる手書
き漢字認識”、電子情報通信学会論文誌、Vol.J73-D-I
I, No.8 pp.1268-1274 1990)により実現することがで
きる。詳細な処理に関しては既存の技術であるので上記
文献を提示し省略するものとする。
【0101】このようにして、帳票を識別してその指定
された対象枠内の文字を認識することができる。 (実施の形態2)以下、本発明の実施の形態2につい
て、図26から図30を参照しながら説明する。
【0102】図26は、本発明の実施の形態2の帳票認
識装置のブロック構成図を示し、1は帳票文書を読み取
り2値画像を得る画像入力手段、2は前記2値画像を記
憶する画像メモリ、3は2値画像の水平、垂直方向の実
線の罫線を抽出する第1の罫線抽出手段、4は実線の罫
線からなるパターンのコーナーを検出する第1のコーナ
ー検出手段、800は前記コーナー点の組み合わせから
罫線の屈曲や交差によるL字要素、T字要素、十字要素
及びI字要素の構成要素を検出する第1の構成要素検出
手段、801は構成要素同士をグルーピングさせて新し
い構成要素を生成する第2の構成要素検出手段、6は構
成要素同士を連結し連結形態を枠構造情報として出力す
る矩形検出手段と、9は予め読み取り対象となる複数の
帳票のフォーマット情報を記憶するフォーマット情報記
憶手段、10は前記枠構造情報をもとに帳票内の矩形構
造と前記フォーマット情報を照合し帳票の種別を判別
し、帳票内の文字読み取り対象枠を検出する枠構造照合
手段、11は文字読み取り対象枠の文字領域を切り出す
文字切り出し手段、12は切り出された文字を認識する
文字認識手段である。
【0103】以上のように構成された帳票認識装置にお
いて、その動作を説明するが、本発明の実施の形態1の
帳票認識装置のブロック構成図と異なる第1の構成要素
検出手段800と第2の構成要素検出手段801につい
て詳細に説明する。
【0104】まず、第1の構成要素検出手段801につ
いて説明するが、第1の構成要素検出手段801は、実
施の形態1の構成要素検出手段5と基本的には同じもの
であり、図27(a)〜(d)に示す罫線の断線を意味
するI字要素を検出するための判定条件を付加したもの
である。よって、L字要素、T字要素、十字要素に加え
てI字要素を検出して、802の第2の構成要素検出手
段に通知する。
【0105】次に第2の構成要素検出手段802につい
て図28から図30を用いて説明する。図28は、構成
要素同士のグルーピングの判定条件を示し、図29は第
1の構成要素検出手段からの構成要素をグルーピングす
る手順を示すフロー図を示している。また、図30は、
本発明の実施の形態2の処理結果を示す。
【0106】図28において、図28(a)〜(c)は
I字要素同士をグルーピングしてそれぞれL字要素、T
字要素、十字要素を検出する例を示している。また、図
28(d)は、I字要素とL字要素をグルーピングして
T字要素を検出し、図28(e)はI字要素とT字要素
をグルーピングして十字要素を検出する例を示してい
る。
【0107】次に、第2の構成要素検出手段802の処
理手順について、図29を用いて各ステップ毎に説明す
る。まず、ステップ820は、対象の構成要素がI字要
素であるかどうかを判断し、I字要素であればステップ
821に進み、I字要素でない場合にはステップ828
に進む。ステップ821は、予め設定した探索範囲内で
他の構成要素を探索する。
【0108】ステップ822は、他の構成要素がI字要
素でない場合にはステップ824に進み、I字要素の場
合にはステップ823に進み、図28(a)〜(c)の
配置になる構成要素を選択して、それぞれグルーピング
し、グルーピングした構成要素の座標の平均値および形
状コードの論理和をそれぞれグルーピング構成要素の座
標および形状コードとして更新登録する。
【0109】ステップ824は、他の構成要素がL字要
素であるかの判定をして、L字要素でなければステップ
826に進み、L字要素であれば、ステップ825で図
28(d)のグルーピングを行う。前記と同じように、
グルーピングした構成要素の座標の平均値および形状コ
ードの論理和をとり、それぞれグルーピング構成要素の
座標および形状コードとして更新登録する。
【0110】ステップ826は、他の構成要素がT字要
素の判定を行い、T字要素でなければステップ828に
進み、T字要素であれば、ステップ827で図28
(e)のグルーピングを行い、前記と同じように座標値
と形状コードの更新登録を行う。ステップ828は、次
の構成要素が存在すれば、820に戻り処理を繰り返
し、構成要素が存在しなければ処理を終了する。
【0111】また、図28(a)〜(e)のグルーピン
グの条件を満たさずに単独で存在するI字要素は登録を
行わない。ただし、単独で存在するL字要素、T字要素
および十字要素は、そのまま登録する。
【0112】本発明の実施の形態2の構成要素検出手段
の処理結果について、図30を用いて説明する。図30
(a)は、枠の角部分が緩やかな曲率を持つ帳票の原画
像である。図30(b)は、第1の罫線抽出手段により
所定の長さ以上の線分を抽出し、コーナー点を検出した
結果であり、枠線の角部分が途切れている。図30
(b)の831、832、833は、第1の構成要素検
出手段によって、枠の断線た部分のコーナー点から検出
されたI字要素である。図30(b)の834と835
は、同じく第1の構成要素検出手段によって検出された
L字要素である。図30(c)は、第2の構成要素検出
手段によってグルーピングされた構成要素を示し、L字
要素836は(b)のI字要素831と832がグルー
ピングしたものである。ただし、図30において左側の
み説明および図示したが右側も同様である。また、T字
要素837は、I字要素833とL字要素834がグル
ーピングしたものである。L字要素838は、グルーピ
ングする構成要素がなかったのでそのまま通知されてい
る。このようにして、枠の角部分が緩やかな曲率を持つ
場合でも、枠の交点を正確に認識することができる。
【0113】
【発明の効果】以上のように本発明の効果は、第1に、
2値画像の実線および破線の罫線を抽出し、罫線のコー
ナー形状の組み合わせから構成要素を検出し、構成要素
同士を連結し矩形を検出し、複数の帳票のフォーマット
情報と照合することにより、帳票が画像として傾いて入
力されたり、帳票内に破線の罫線が存在しても、文字枠
を正確に検出し文字認識を行うことができ、信頼性の高
い帳票認識装置が実現できる。
【0114】第2に、枠罫線の抽出処理によって途中で
きれてしまった罫線部分をI字要素として検出し、さら
にI字要素同士またはI字要素と他の要素とをグルーピ
ングして構成要素を検出することによって、枠の断線部
分や角部分が緩やかな曲率を持つ場合でも、枠の交点を
正確に認識できる信頼性の高い帳票認識装置が実現でき
る。
【図面の簡単な説明】
【図1】本発明の実施の形態1における帳票認識装置の
ブロック結線図
【図2】同実施の形態1の帳票認識装置における第1の
罫線抽出手段でのブロック結線図
【図3】同実施の形態1の帳票認識装置における線分収
縮手段の処理手順を示すフロー図
【図4】同実施の形態1の帳票認識装置における線分延
長手段の処理手順を示すフロー図
【図5】同実施の形態1の帳票認識装置における第1の
コーナー検出手段の方向コード化と方向コード変化点検
出について説明する図
【図6】同実施の形態1の帳票認識装置における第1の
コーナー検出手段の方向コードと実際の方向との対応関
係を示す図
【図7】同実施の形態1の帳票認識装置における第1の
コーナー検出手段の方向変化コードの具体例を示す図
【図8】同実施の形態1の帳票認識装置における構成要
素検出手段のコーナー点の組み合わせによる構成要素の
具体例を示す図
【図9】同実施の形態1の帳票認識装置における構成要
素抽出手段での構成要素の形態の記述についての説明図
【図10】同実施の形態1の帳票認識装置における矩形
検出手段の構成要素同士の連結関係を示す概念図
【図11】同実施の形態1の帳票認識装置における矩形
検出手段の矩形検出の具体例を示す図
【図12】同実施の形態1の帳票認識装置における第2
の罫線抽出手段のブロック結線図
【図13】同実施の形態1の帳票認識装置におけるフォ
ーマット情報記憶手段の枠構造情報を説明するための帳
票画像を示す図
【図14】同実施の形態1の帳票認識装置におけるフォ
ーマット情報記憶手段の枠構造情報に登録されるフォー
マットの具体例を示す図
【図15】同実施の形態1の帳票認識装置における枠構
造照合手段の処理手順を示すフロー図
【図16】同実施の形態1の帳票認識装置における枠構
造照合手段の実線枠照合と累積枠相違度の算出の処理手
順を示すフロー図
【図17】同実施の形態1の帳票認識装置における枠構
造照合手段の実線枠照合処理を説明するための基準の帳
票とその枠構造情報を示す図
【図18】同実施の形態1の帳票認識装置における枠構
造照合手段の実線枠照合処理を説明するための入力され
た帳票と要素連結情報と矩形情報を示す図
【図19】同実施の形態の帳票認識装置における枠構造
照合手段の実線枠照合の探索範囲を示す図
【図20】同実施の形態1の帳票認識装置における枠構
造照合手段の実線枠照合の処理結果の具体例を示す図
【図21】同実施の形態1の帳票認識装置における枠構
造照合手段の破線交点を検出する手順を示すフロー図
【図22】同実施の形態1の帳票認識装置における枠構
造照合手段の破線交点を検出する手順を示すフロー図
【図23】同実施の形態1の帳票認識装置における枠構
造照合手段の破線による候補交点の位置関係を示す図
【図24】同実施の形態1の帳票認識装置における枠構
造照合手段の破線の検出処理のペアになるコーナー点の
具体例を示す図
【図25】同実施の形態1の帳票認識装置における文字
きり出し手段の処理を説明する図
【図26】本発明の実施の形態2における帳票認識装置
の構成要素検出手段のブロック結線図
【図27】本発明の実施の形態2における第1の構成要
素検出手段のコーナー点の組み合わせによるI字構成要
素の具体例を示す図
【図28】本発明の実施の形態2における第2の構成要
素検出手段のグルーピングできる構成要素の組み合わせ
を示す図
【図29】本発明の実施の形態2における第2の構成要
素検出手段の処理手順を示すフロー図
【図30】本発明の実施の形態2における構成要素検出
手段の処理結果を示す図
【図31】従来例の罫線認識装置のブロック結線図
【符号の説明】
1 画像入力手段 2 画像メモリ 3 第1の罫線抽出手段 4 第1のコーナー検出手段 5 構成要素検出手段 6 矩形検出手段 7 第2の罫線抽出手段 8 第2のコーナー検出手段 9 フォーマット情報記憶手段 10 枠構造照合手段 11 文字切り出し手段 12 文字認識手段 20 2値画像 21 水平方向収縮手段 22 水平方向延長手段 23 垂直方向収縮手段 24 垂直方向延長手段 25 NOR回路 201 第1の水平方向延長手段 202 水平方向収縮手段 203 第2の水平方向延長手段 204 第1の垂直方向延長手段 205 垂直方向収縮手段 206 第2の垂直方向延長手段 207 NOR回路 801 第1の構成要素検出手段 802 第2の構成要素検出手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 藤田 幹男 神奈川県横浜市港北区綱島東4丁目3番1 号 松下通信工業株式会社内 (72)発明者 松山 好幸 神奈川県横浜市港北区綱島東4丁目3番1 号 松下通信工業株式会社内

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 枠罫線と文字を含む帳票文書を読み取り
    2値画像を出力する画像入力手段と、前記2値画像を記
    憶する画像メモリと、前記画像メモリに記憶された2値
    画像から水平、垂直方向の実線の罫線を抽出する第1の
    罫線抽出手段と、前記第1の罫線抽出手段から実線の罫
    線のコーナーを検出する第1のコーナー検出手段と、前
    記画像メモリに記憶された2値画像から水平、垂直方向
    の実線及び破線の罫線を抽出する第2の罫線抽出手段
    と、前記第2の罫線抽出手段から実線の及び破線の罫線
    のコーナーを検出する第2のコーナー検出手段と、前記
    第1のコーナー検出手段からのコーナーの組み合わせか
    ら罫線の屈曲や交差形状の構成要素を検出する構成要素
    検出手段と、前記構成要素検出手段からの構成要素を相
    互に連結し枠構造情報を出力する矩形検出手段と、予め
    読み取り対象となる複数の帳票のフォーマット情報を記
    憶するフォーマット情報記憶手段と、前記枠構造情報と
    前記フォーマット情報とを順次照合し実線枠を検出する
    と共に、照合結果から帳票の種別を判別し、前記第2の
    コーナー検出手段からのコーナーと前記フォーマット情
    報とから実線枠で指定された対象枠と破線との交点であ
    る破線交点を検出し、対象枠の座標を出力する枠構造照
    合手段と、前記対象枠の座標に基づき前記画像メモリか
    ら文字領域を切り出す文字切り出し手段と、切り出され
    た文字領域から文字を認識する文字認識手段とを具備す
    る帳票認識装置。
  2. 【請求項2】 第2の罫線抽出手段として、前記画像メ
    モリに記憶された2値画像から水平、垂直方向のそれぞ
    れ延長処理を施し破線を繋ぎ実線とすることを特徴とす
    る請求項1記載の帳票認識装置。
  3. 【請求項3】 枠罫線と文字を含む帳票文書を読み取り
    2値画像を出力する画像入力手段と、前記2値画像を記
    憶する画像メモリと、前記画像メモリに記憶された2値
    画像から水平、垂直方向の実線の罫線を抽出する第1の
    罫線抽出手段と、前記第1の罫線抽出手段から実線の罫
    線のコーナーを検出する第1のコーナー検出手段と、前
    記第1のコーナー検出手段からのコーナーの組み合わせ
    から罫線の屈曲や交差および断線形状の構成要素を検出
    し、断線同士の構成要素あるいは断線と他の構成要素と
    のグルーピングにより、構成要素を更新する構成要素検
    出手段と、前記構成要素検出手段からの構成要素を相互
    に連結し枠構造情報を出力する矩形検出手段と、予め読
    み取り対象となる複数の帳票のフォーマット情報を記憶
    するフォーマット情報記憶手段と、前記枠構造情報と前
    記フォーマット情報とを順次照合し実線枠を検出すると
    共に、照合結果から帳票の種別を判別し、前記フォーマ
    ット情報から実線枠で指定された対象枠の座標を出力す
    る枠構造照合手段と、前記対象枠の座標に基づき前記画
    像メモリから文字領域を切り出す文字切り出し手段と、
    切り出された文字領域から文字を認識する文字認識手段
    とを具備する帳票認識装置。
  4. 【請求項4】 コーナーの検出として、検出された罫線
    の輪郭に方向コードを付与し、その方向コードの変化点
    をコーナーとして検出することを特徴とする請求項1、
    2または3記載の帳票認識装置。
  5. 【請求項5】 枠構造情報として、構成要素の相互の連
    結形態等を記述した連結テーブルと連結テーブルから求
    めた各矩形のサイズと位置等を記述した矩形情報テーブ
    ルからなることを特徴とする請求項1または3記載の帳
    票認識装置。
  6. 【請求項6】 構成要素として罫線の屈曲、交差及び断
    線の構成要素として、L字要素、T字要素、十字要素及
    びI字要素を検出することを特徴とする請求項1または
    3記載の帳票認識装置。
  7. 【請求項7】 枠構造照合手段として、前記枠構造情報
    と前記フォーマット情報とを順次照合し枠相違度を求
    め、枠相違度を累積加算し帳票全体の相違度として累積
    枠算出度を算出し、累積枠相違度から帳票の種別を判別
    することを特徴とする請求項1または3記載の帳票認識
    装置。
  8. 【請求項8】 枠構造照合手段として、前記枠構造情報
    と前記フォーマット情報との照合に、探索範囲に存在し
    なかった構成要素の数を枠相違度として順次照合するこ
    とを特徴とする請求項7記載の帳票認識装置。
  9. 【請求項9】 枠構造照合手段として、前記枠構造情報
    と前記フォーマット情報との照合に、対応する構成要素
    の距離の差の総和を枠相違度として順次照合することを
    特徴とする請求項7記載の帳票認識装置。
JP19871696A 1996-07-29 1996-07-29 帳票認識装置 Expired - Fee Related JP3622347B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19871696A JP3622347B2 (ja) 1996-07-29 1996-07-29 帳票認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19871696A JP3622347B2 (ja) 1996-07-29 1996-07-29 帳票認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004239273A Division JP2004334913A (ja) 2004-08-19 2004-08-19 帳票認識装置及び帳票認識方法

Publications (2)

Publication Number Publication Date
JPH1040333A true JPH1040333A (ja) 1998-02-13
JP3622347B2 JP3622347B2 (ja) 2005-02-23

Family

ID=16395827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19871696A Expired - Fee Related JP3622347B2 (ja) 1996-07-29 1996-07-29 帳票認識装置

Country Status (1)

Country Link
JP (1) JP3622347B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049909A (ja) * 2000-08-03 2002-02-15 Namco Ltd パターン認識処理装置、方法および情報記憶媒体
US6567545B1 (en) 1999-05-28 2003-05-20 Fujitsu Limited Format recognition method, apparatus and storage medium
US8582888B2 (en) 2007-02-16 2013-11-12 Fujitsu Limited Method and apparatus for recognizing boundary line in an image information

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6567545B1 (en) 1999-05-28 2003-05-20 Fujitsu Limited Format recognition method, apparatus and storage medium
JP2002049909A (ja) * 2000-08-03 2002-02-15 Namco Ltd パターン認識処理装置、方法および情報記憶媒体
US8582888B2 (en) 2007-02-16 2013-11-12 Fujitsu Limited Method and apparatus for recognizing boundary line in an image information

Also Published As

Publication number Publication date
JP3622347B2 (ja) 2005-02-23

Similar Documents

Publication Publication Date Title
US4562594A (en) Method and apparatus for segmenting character images
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
CA2401065C (en) Document matching and annotation lifting
US6947596B2 (en) Character recognition method, program and recording medium
JP3411472B2 (ja) パターン抽出装置
CN115619656A (zh) 数字化档案纠偏矫正方法及系统
JPH0418351B2 (ja)
JP3936436B2 (ja) 表認識方法
US6175664B1 (en) Optical character reader with tangent detection for detecting tilt of image data
JP3622347B2 (ja) 帳票認識装置
JP3586949B2 (ja) 帳票認識装置
JP2004334913A (ja) 帳票認識装置及び帳票認識方法
JP3586911B2 (ja) 枠線認識装置
JP2005182660A (ja) 文字・図形の認識方法
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2872768B2 (ja) 文字切出し装置
JP4329226B2 (ja) 基準マーク検出方法、基準マーク検出装置及び光学式文字読取装置
JPH04268685A (ja) 帳票類の種類判別方法
JP2963508B2 (ja) 文字切出し装置
JPH09147105A (ja) 図面閉領域の抽出方法
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JP2022184331A (ja) 帳票の特定フィールド認識方法および特定フィールド読取り装置
JPH0929179A (ja) 宛名読取装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040331

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040819

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041115

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071203

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees