JP2940936B2

JP2940936B2 - 表領域識別方法

Info

Publication number: JP2940936B2
Application number: JP1143456A
Authority: JP
Inventors: 道義立川
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1989-06-06
Filing date: 1989-06-06
Publication date: 1999-08-25
Anticipated expiration: 2014-08-25
Also published as: US5048107A; JPH039489A

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、文字認識装置等において、文書等の入力画
像上の表領域を識別する方法に関する。

〔従来の技術及び発明が解決しようとする課題〕

一般の文書は、文字の領域のほかに図、写真、表等の
領域がある。このような文書を文字認識装置において認
識処理する場合、文字領域は文字認識をし、図や写真の
領域は画像のまま保存し、あるいは再度ディザ法を用い
て擬似２値画像で読み取って保存し、表領域は表の罫線
を枠として認識し、その枠の内部の画像についてだけ文
字認識をするというように、領域別に処理内容を変える
必要がある。

このように領域別の処理を行うには、その前提として
領域識別が必要となる。この領域識別の中で、表領域に
ついては、例えば特開昭57−104363号公報に記載の“枠
パターン識別方法”を行うことも可能である。しかし、
縦方向および横方向の長線分（枠線候補）を抽出し、縦
横の長線分による枠の形成の判定を行うには、処理がか
なり複雑になり、高速処理が難しいという問題があっ
た。

よって本発明の目的は、処理が簡便で高速の表領域識
別が可能な表領域識別方法を提供することにある。

〔課題を解決するための手段〕

本発明においては、原稿の画像またはその圧縮画像上
の黒画素のランを抽出し、接しているランを統合して矩
形を生成し、該生成された矩形の中で所定サイズ以上の
矩形を表領域候補と判定し、該表領域候補の矩形につい
て、その内部の一定以上の長さのランを罫線として抽出
し、該抽出した罫線の個数により当該矩形を表領域であ
るか否か最終的に判定する。ここで、表領域の判定に用
いる罫線の個数は、前記抽出した罫線について、連続し
て出現するものは無視し、独立に出現するもののみをカ
ウントして得られるカウント値とすることでもよい。

〔作用〕

このように、本発明は、画像中から接したランに着目
して矩形を抽出・生成し、該矩形のサイズから表領域候
補を見つけ、その枠内の罫線の個数により表領域である
か否かを判定する方法であるため、閉じた枠のパターン
を認識する方法に比べ、処理アルゴリズムが単純で高速
処理が可能である。

〔実施例〕

以下、図面により本発明の幾つかの実施例について説
明する。

第１図は本発明の各実施例に係る装置構成を示す概略
ブロック図である。１はOCRであり、この部分に表領域
識別手段が設けられている。２は処理対象の原稿の画像
を読み取るためのスキャナである。

OCR1において、制御部３からスキャナ２に読取りの命
令を与えて原稿画像の入力を実行させ、その画像データ
（または圧縮画像データ）を画像メモリ４に蓄積させ
る。ラン抽出部５は、画像メモリ４から１ラインずつ画
像データを読出し、黒画素のラン（黒画素の連結）の始
点と終点の座標を検出し、それをラン番号（検出順番）
とともにランメモリ６に書き込む。

矩形統合部７では、抽出されたランの始点及び終点の
座標を比較することにより、矩形メモリ８に登録された
どの矩形に統合すべきか、あるいは新規の矩形に統合す
べきかを判定し、矩形メモリ８のデータを更新する。な
お、矩形メモリ８内の矩形データは、矩形番号と、矩形
の左上角および右下角の座標よりなる。

表領域候補判定部９では、矩形メモリ８に登録された
各矩形のサイズをチェックし、表領域の候補としての矩
形を検出し、その矩形の番号を制御部３へ送る。制御部
３では、表領域候補の矩形番号を表領域判定部10へ送
る。

表領域判定部10では、矩形メモリ８内の指定された番
号の矩形データを参照し、その矩形を構成するランのデ
ータをランメモリ６より得て、矩形内の一定以上の長さ
のランを統合することにより罫線を抽出し、その罫線の
個数から表領域であるか否かを判定し、その結果を制御
部３へ送る。ランデータバッファ11は、罫線統合のため
のランデータの記憶に用いられる。

以上説明した処理のより具体的な内容について、実施
例毎に説明する。

実施例１処理全体の流れは第２図の通りである。処理ブロック
21で原稿の画像データを画像メモリ４に取り込むが、こ
れは制御部３の制御によってスキャナ２によりなされ
る。

処理ブロック22は、入力画像上のランの抽出と、その
矩形統合を行う部分で、これはラン抽出部５および矩形
統合部７の役割である。具体例を第３図および第４図に
よって説明する。

入力画像上に第３図（ａ）に示すようなパターンが存
在する場合、ラン抽出部５は画像の１ラインずつをラス
タースキャンし、黒連結のラン１からラン５を順に抽出
し、それぞれのランの抽出順序に従ったラン番号を付
け、それぞれの始点（左端）と終点（右端）の座標をラ
ンメモリ６に書き込む。第３図（ａ）の例では、ランメ
モリ６の内容は第３図（ｂ）に示す如くになる。

また、矩形統合部７では、抽出されたランの始点およ
び終点の座標とを比較し、接しているランを矩形に統合
する。第３図（ａ）に示すような５個のランが抽出され
た段階では、第４図（ａ）に示すように、ラン１とラン
３は矩形１に統合され、ラン２、ラン４及びラン５は矩
形２に統合される結果、矩形メモリ８には第４図（ｃ）
に示すような矩形データが書き込まれることになる。

より詳しく説明すると、ラン１が抽出されたときには
矩形は一つも登録されていないので、ラン１と始点（左
上角）および終点（右下角）が一致する矩形１が新規に
登録される。次のラン２が抽出されたときは、このラン
２はラン１と接していないので、ラン２と始点および終
点が一致する矩形２が新規に登録される。次のラン３が
抽出されると、これは矩形１を構成するラン１と接する
ので、ラン３は矩形１に統合され、矩形１の始点はその
ままであるが、終点はラン３の終点座標に変更される。
ラン４およびラン５も同様に矩形２に統合され、矩形２
の終点のＹ座標はラン５のＹ座標に変更される。

その後、第４図（ｂ）に示すようにラン６が抽出され
ると、このラン６はこれまでに登録された矩形１に統合
されたランにも矩形２に統合されたランにも接していな
いので、新しい矩形３が登録される。その結果、矩形メ
モリ８のデータは第４図（ｄ）に示す如くに更新され
る。

再び第２図において、処理ブロック23は表領域候補判
定部９の処理部分であり、矩形メモリ８に登録された各
矩形のX,Y方向の大きさを所定の閾値THRx,THRyと比較
し、これら閾値の両方を越える大きさの矩形を表領域の
候補と判定し、その矩形番号を制御部３に通知する。

次の処理ブロック24は表領域判定部９による処理部分
である。まず、制御部３より指定された表領域候補の矩
形内のランより閾値THT以上の長さのランで接したもの
を統合することにより罫線（ここでは横書き文書を想定
しているので、横罫線）の候補を得る。これが“ランデ
ータバッファの作成”である。そして、ランデータバッ
ファ11上に得られた罫線候補の中より、矩形の幅に近い
長さ以上のものを罫線として抽出し、その個数をカウン
トする。これが“罫線のカウント”である。そして、罫
線のカウント値を所定の閾値と比較し、その閾値を越え
る場合に当該矩形を表領域と判定し、その矩形番号を制
御部３へ通知する。これが“表領域の判定”である。

ここで、罫線候補の統合すなわち“ランデータバッフ
ァ（RB）の作成”について説明する。ランデータバッフ
ァRBは、表領域候補矩形の各ラインに１対１に対応した
始点および終点のＸ座標の記憶エリアを持ち、最初は全
エリアがクリアされている。

矩形の第１ラインより、一定以上の長さのランを捜
し、あるライン（現ライン）で一定以上のランが見つか
ると、そのランの始点および終点のＸ座標とランデータ
バッファRBの前ラインのエリアに記憶されているＸ座標
とを比較し、１画素でも接続していればランデータバッ
ファRBの現ラインのエリアに、始点座標として、前ライ
ンと現ラインの始点のＸ座標の小さいほうの座標値を書
込み、また終点座標として、前ラインと現ラインの終点
のＸ座標の大きいほうの座標値を書き込む。このような
処理の繰り返しにより、罫線の候補となり得るようなラ
ン群の最後のランの存在するラインにおいて、罫線候補
の全体の始点と終点のＸ座標がランデータバッファRBの
対応エリアに保存される。

なお、縦罫線のランは横罫線のランに比べ一般に十分
短いので、罫線候補の統合の対象から除外されるため、
ラインデータバッファRBの対応エリアはクリアされたま
まになる。

第５図は、前記処理ブロック23および処理ブロック24
の詳細フローチャートである。この図において、の部
分が処理ブロック23に対応し、，およびの部分が
それぞれ処理ブロック24の“ランデータバッファの作
成”、“罫線のカウント”および“表領域の判定”の各
処理に対応する。

なお、第５図における記号の意味は次の通りである。

i :矩形番号 j :矩形内のラン番号 k :ランデータバッファのデータ番号 IRWi :番号ｉの矩形の幅 ITHi :番号ｉの矩形の高さ THRx :表領域候補判定のための幅の閾値 THRy :表領域候補判定のための高さの閾値 IRijw :矩形ｉ内のランｊの幅 IRijxs:矩形ｉ内のランｊの始点Ｘ座標 IRijxe:矩形ｉ内のランｊの終点Ｘ座標 THT :罫線のランの判定のための閾値 RBsk :ランデータバッファのｋ番目の始点のＸ座標 RBek :ランデータバッファのｋ番目の終点のＸ座標 THL :罫線判定のための閾値 THC :罫線の個数の閾値なお、の処理部分において、各罫線候補として統合
されたライン数をカウントし、そのカウント値をチェッ
クすることにより、一定の高さを越えて統合されたとき
にの処理部へ分岐し、他の領域と判定するようにして
もよい。このようなチェックを追加すれば、写真領域等
を表領域と誤識することがより確実に回避できる。

実施例２前記実施例１とは“罫線のカウント”（第２図）の処
理が異なる。すなわち、本実施例においては、矩形の幅
に近い罫線候補を無条件に罫線としてカウントするので
はなく、矩形の幅に近い罫線候補でも連続して出現する
ものは無視し、独立に出現する罫線候補のみを罫線とし
てカウントし、そのカウント値を“表領域の判定”に用
い表領域の判定精度の向上を図っている。

第６図は本実施例の処理の概略フローチャートであ
り、各記号は第５図中の記号と対応している。この図で
の部分が“罫線のカウント”の処理部分（第６図の
に対応）である。の処理部分において、cnt1は罫線候
補の連続／独立の判定のために導入されたフラグであ
る。

実施例３本実施例の処理の概略フローチャートを第７図に示
す。処理ブロック31,33,34,35は前記各実施例の対応処
理ブロックと同様の処理ブロックである。処理ブロック
32が本実施例で追加された部分である。ここで入力画像
データに圧縮（縮小）処理を施し、その圧縮（縮小）画
像について処理ブロック33以下の処理を実行する。な
お、この圧縮処理の手段は第１図に示されていない。

すなわち本実施例においては、処理すべき画像データ
量を大幅に削減することにより、処理時間の短縮と、ラ
ンメモリ６および矩形メモリ８の容量削減を図ってい
る。

なお、実験によれば、400dpiの画像に対し８分の１程
度のデータ圧縮を行っても、表領域の判定能力は現画像
で処理した場合と殆ど違いがないことが確認されてい
る。

〔発明の効果〕

以上実施例により説明した如く、本発明によれば、文
書等の表領域を高精度に識別することができ、その処理
アルゴリズムも簡便であって高速処理が可能である。

【図面の簡単な説明】第１図は本発明の実施例に係る装置構成の概略ブロック
図、第２図は本発明の一実施例における処理全体の流れ
を示すフローチャート、第３図はラン抽出とランメモリ
のデータの説明のための図、第４図はランの矩形統合と
矩形メモリのデータを説明するための図、第５図は表領
域候補矩形判定および表領域判定の詳細フローチャー
ト、第６図は本発明の他の実施例の処理を示すフローチ
ャート、第７図は本発明のさらに他の実施例の処理を示
すフローチャートである。１……OCR、２……スキャナ、３……制御部、４……画像メモリ、５……ラン抽出部、６……ランメモリ、７……矩形統合部、８……矩形メモリ、９……表領域候補判定部、 10……表領域判定部、 11……ランデータバッファ。

Claims

(57)【特許請求の範囲】

【請求項１】原稿の画像またはその圧縮画像上の黒画素
のランを抽出し、接しているランを統合して矩形を生成
し、該生成された矩形の中で所定サイズ以上の矩形を表
領域候補と判定し、該表領域候補の矩形について、その
内部の一定以上の長さのランを罫線として抽出し、該抽
出した罫線の個数により当該矩形を表領域であるか否か
判定することを特徴とする表領域識別方法。
【請求項２】請求項１記載の表領域識別方法において、
前記抽出した罫線について、連続して出現するものは無
視し、独立に出現するもののみをカウントし、該カウン
ト値により当該矩形を表領域であるか否か判定すること
を特徴とする表領域識別方法。