JPH0737036A - 矩形分類方法 - Google Patents

矩形分類方法

Info

Publication number
JPH0737036A
JPH0737036A JP5155580A JP15558093A JPH0737036A JP H0737036 A JPH0737036 A JP H0737036A JP 5155580 A JP5155580 A JP 5155580A JP 15558093 A JP15558093 A JP 15558093A JP H0737036 A JPH0737036 A JP H0737036A
Authority
JP
Japan
Prior art keywords
rectangle
character
rectangles
area
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5155580A
Other languages
English (en)
Other versions
JP3344774B2 (ja
Inventor
Toshifumi Yamaai
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP15558093A priority Critical patent/JP3344774B2/ja
Publication of JPH0737036A publication Critical patent/JPH0737036A/ja
Application granted granted Critical
Publication of JP3344774B2 publication Critical patent/JP3344774B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 黒画素連結成分の外接矩形の属性分類の精度
を改善する。 【構成】 外接矩形の大きさ、形状より文字、水平罫線
候補、垂直罫線候補、表矩形候補に大雑把に分類する
(100)。文字に分類された矩形以外については、矩
形領域内の水平または垂直方向の長い黒ランからなる架
空罫線を抽出し、その個数、矩形内の相対的位置等の情
報による条件判定(102〜124)によって、文字、
セパレータ、表、囲み枠、図グラフその他に分類する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書等の2値画像上の
黒画素連結成分の外接矩形の領域の属性を分類する方法
に関する。
【0002】
【従来の技術】文字、表、図、グラフ、セパレータ等の
属性の異なる領域が混在した文書の文字認識において
は、一般に前処理段階で文書の領域分割を行なう必要が
ある。同様の領域分割は、文書の伝送、画像データベー
スへの文書入力等の分野でも必要とされる。
【0003】このような領域分割を、文書画像上の黒画
素連結成分の外接矩形を抽出し、それらを統合していく
というボトムアップ的な手法で行なう場合、抽出した矩
形の属性を分類する必要がある。
【0004】従来、この矩形分類の例として、矩形の形
状や面積等から文字領域、文字領域間を区切るためのセ
パレータ、あるいはイメージに分類する方法が知られて
いる(特開平3−126181号)。しかし、このよう
な矩形の外形的特徴のみに基づいた分類方法では、画像
格納用メモリの必要容量を減らすために画像を圧縮する
と文字の矩形間が融合するため、セパレータの矩形と文
字列の矩形の分類を誤る等、分類精度に自ずと限界があ
った。
【0005】
【発明が解決しようとする課題】よって本発明の主たる
目的は、黒画素連結成分の外接矩形の領域の属性を、よ
り高精度に分類する方法を提供することにある。
【0006】
【発明が解決しようとする課題】本発明の骨子は、文書
等の2値画像上の黒画素連結成分に外接する矩形の領域
の属性を分類する方法において、矩形領域の画素情報か
ら水平方向または垂直方向の長い黒ランを抽出し、その
連続性より架空罫線を抽出して、該架空罫線の個数及び
該矩形領域内での相対的位置並びに該矩形領域の外形的
特徴を、該矩形領域の属性分類のための情報として利用
することにある。
【0007】
【作用】本発明によれば、矩形領域の外形的特徴に加え
て、矩形領域内の水平方向及び回直方向の架空罫線の個
数及び矩形領域内の相対的位置の情報を属性分類に利用
するため、文字、表、囲み枠、セパレータ、グラフ、図
等の高精度な分類が可能となる。さらに、これら情報に
よる分類判定の条件の選び方によって、分類の柔軟性・
自由度を確保できる。
【0008】
【実施例】図1に本発明の一実施例に係るシステムの概
略構成を示す。図1において、スキャナ1によって読み
取られた文書画像のデータは、画像入力部2によって画
像メモリ3に格納される。画像メモリ3内の文書画像デ
ータは、領域識別部6の画像圧縮部7に読み出され、こ
こで所定の圧縮率のOR圧縮を施されてから画像メモリ
3に戻される。画像メモリ3内の文書画像データは、画
像表示部4によってディスプレー5に表示させることが
できる。なお、画像入力部7より文書画像データを画像
圧縮部7へ直接入力し、ここで圧縮させた画像データを
画像メモリ3に格納させることも可能である。
【0009】領域識別部6は、前記の画像圧縮部7と、
外接矩形検出部8、矩形分類部9、文字領域統合部10
からなる。外接矩形検出部8は、画像メモリ3内の圧縮
された文書画像データより、黒画素連結成分に外接する
矩形を抽出する部分である。ここで抽出された矩形に
は、文字(1文字または2文字以上の文字列)の矩形の
ほかに罫線、表、図、グラフその他、様々な属性の矩形
が含まれる。矩形分類部9は、このような様々な矩形の
属性を、矩形の形状情報及び内部データから分類するも
ので、本発明の要旨に直接関連する部分である。文字領
域統合部10は、文字矩形と分類された矩形を統合し
て、文字領域を生成する部分である。
【0010】本実施例においては、領域識別部6による
領域識別の結果は、文字認識部11による文字認識処理
に利用される。つまり、領域識別部6は光学的文字認識
の前処理部として利用される。しかし、これは一例に過
ぎない。
【0011】以下、矩形分類部9による矩形分類処理の
内容について、図2乃至図8を用いて詳細に説明する。
【0012】図2に、矩形分類処理の全体的フローを示
す。まず、矩形の大きさ及び形状によって、矩形の種類
を大雑把に分類する(ステップ100)。この分類処理
の情報には、文書の標準文字サイズと矩形の大小関係
や、矩形の縦横比を利用することができる。図6によ
り、本実施例におけるステップ100の分類方法を説明
する。
【0013】図6の(a)に示すように、矩形の高さ
(height)を、標準文字サイズ(size)との
大小関係によってクラス1からクラス3に分ける。ま
た、矩形の幅(width)を、標準文字サイズとの大
小関係によってクラス1からクラス3に分ける。
【0014】ここで標準文字サイズは、予め分かってい
る場合には、その値を用いればよいし、予め分かってい
ない場合には文書画像より抽出された矩形の高さの分布
から適応的に決定するような方法を採用すればよい。こ
のような適応的な標準文字サイズの決定方法は公知であ
るので、ここでは詳細は述べない。
【0015】このようにして得られた矩形高さクラス及
び矩形幅クラスから矩形の種類を大分類する。この大分
類テーブルの例を図6の(b)に示す。このテーブルよ
り、例えば矩形幅がクラス1またはクラス2で、矩形高
さがクラス1またはクラス2ならば、その矩形は文字候
補または大文字候補と分類される。この矩形の場合に
は、この大分類の結果がそのまま矩形分類の最終結果と
なり、その分類処理は完了である。しかし、矩形幅がク
ラス1で、矩形高さがクラス3ならば垂直罫線候補と分
類され、この矩形はステップ110以下の詳細分類の対
象となる。大分類結果が水平罫線候補あるいは表領域候
補となった矩形の場合も、その矩形はステップ102以
下あるいはステップ120以下の詳細分類の対象とな
る。
【0016】まず、表領域候補となった矩形の詳細分類
について説明する。当該矩形の領域内をスキャンして水
平方向の所定閾値以上の長さを有する長い黒ランだけを
抽出し、その接続したものを囲む外接矩形を水平方向の
架空罫線として抽出する(ステップ120)。
【0017】図7は、この水平方向の架空罫線抽出の説
明図である。(a)に示す例では、長い黒ラン201,
202の外接矩形203が水平方向の架空罫線として抽
出される。(b)に示す例では、黒ラン206〜210
は短いので無視され、長い黒ラン204,205だけの
外接矩形211が架空罫線として抽出される。(c)の
例では、長い黒ラン213,214と長い黒ラン21
5,216は、短い黒ラン218〜225を介して接続
しているが、これら短い黒ランは無視されるので、黒ラ
ン213,214の外接矩形226と、黒ラン215,
216の外接矩形227の二つが架空罫線として抽出さ
れる。
【0018】次に、当該矩形の領域内をスキャンして、
垂直方向に長い黒ランだけを抽出し、その接続したもの
を囲む外接矩形を垂直方向の架空罫線として抽出する
(ステップ122)。この抽出方法は、方向が異なる以
外は水平方向の架空罫線の抽出の場合と同様である。
【0019】次に、架空罫線の数、位置、長さに着目し
て、当該矩形を<表>、<囲み枠>または<図、グラフ
その他>に分類する(ステップ124)。このステップ
124の処理の詳細を図3に示す。
【0020】まず、ステップ120,122で抽出され
た架空罫線の中で、縦横比が罫線として不適当なもの
と、当該矩形(架空罫線が抽出された元の矩形)の幅ま
たは高さに対して短か過ぎるものを除外する(ステップ
124a,124b)。
【0021】次に、除外されずに残った架空罫線につい
て、架空罫線の本数、位置の条件、例えば図3の右上部
分に示した4条件の判定を順次行なう(ステップ124
c〜124f)。
【0022】まず条件(1)すなわち「当該矩形領域の
上及び下に水平方向架空罫線がそれぞれ存在し、かつ中
央寄り1本以上の垂直方向架空罫線が存在する」の条件
が成立するが調べる(ステップ124c)。同条件が成
立するとき当該矩形を<表>と分類する。このように分
類される例を図8の(a)に示す。なお、図8に示した
各例の外側の枠線は矩形の境界線を意味し、内部の網掛
けされた長矩形は架空罫線を意味する。
【0023】条件(1)が不成立の場合、条件(2)す
なわち「当該矩形領域に6本以上の水平方向架空罫線が
存在し、かつ当該矩形領域の上及び下に水平方向架空罫
線がそれぞれ存在し、かつ当該矩形領域の左及び右に垂
直方向架空罫線がそれぞれ存在する」の条件が成立する
か調べる(ステップ124d)。この条件が成立すると
きは、当該矩形を<表>と分類する。このように分類さ
れる例を図8の(b)に示す。
【0024】条件(2)が不成立の場合、条件(3)す
なわち「当該矩形領域の上及び下に水平方向の架空罫線
がそれぞれ存在し、かつ当該矩形領域の左及び右に垂直
方向の架空罫線がそれぞれ存在する」の条件の成立を調
べる(ステップ124e)。同条件が成立するとき、当
該矩形を<囲み枠>と分類する。このように分類される
例を図8の(c)に示す。
【0025】条件(3)が不成立の場合、条件(4)す
なわち「当該矩形領域の左及び下に垂直方向及び水平方
向の架空罫線がそれぞれ存在するか、あるいは当該矩形
領域の上及び左に水平方向及び垂直方向の架空罫線がそ
れぞれ存在するか、そのいずれか一方である」の条件の
成立を調べる(ステップ124f)。同条件が成立する
ときは、当該矩形を<グラフ>と分類する。このように
分類される例を図8の(d)に示す。
【0026】他方、条件(4)が不成立の場合、当該矩
形を<図その他>に分類する。その例を図8の(e)及
び(f)に示す。(f)の例では、矩形領域内に長い黒
ランによる架空罫線が全く存在しない場合である。
【0027】次にステップ100で水平罫線候補とされ
た矩形の詳細分類の処理(ステップ102,104)に
ついて説明する。その詳細フローを図4に示す。ここで
の処理で、文字矩形であるか、上下に並んだ文字領域を
区切る水平罫線(水平セパレータ)であるかの識別を行
なう。初めのステップ102は図4に示すように二つの
ステップ102a,102bからなる。ステップ102
aにおいて、当該矩形の幅/高さ比が所定閾値未満であ
るか調べる。本実施例では、この閾値は20に選ばれ
る。幅/高さ比が20未満のときには、当該矩形は最終
的に<文字矩形>に分類される。この判定は、1文字あ
るいは数文字の文字矩形と水平セパレータの矩形との幅
/高さ比の違いに着目したものである。
【0028】ステップ102aで幅/高さ比が20以上
のときには、ステップ102bにおいて、当該矩形領域
をスキャンして水平方向に長い黒ランだけを抽出し、抽
出した長い黒ランの接続したものを囲む外接矩形を水平
方向の架空罫線として抽出する。そしてステップ104
に進む。
【0029】ステップ104は二つのステップ104
a,104bからなる。まずステップ104aでは、当
該矩形領域より抽出された水平方向の架空罫線の数が所
定閾値以上であるか調べる。本実施例では、この閾値と
して6を選んでいる。架空罫線が6本以上のときは当該
矩形を最終的に<文字矩形>に分類する。
【0030】水平方向架空罫線が6本未満である場合、
ステップ104bで、当該矩形領域の略真ん中に、長く
て細い水平方向架空罫線が存在するか調べ、存在すると
きは当該矩形を<水平セパレータ>に分類し、存在しな
いときは<文字矩形>に分類する。この条件判定によっ
て、アンダーライン付文字列の矩形と水平セパレータと
を区別できる。
【0031】次に、ステップ100で<垂直罫線候補>
に分類された矩形についての詳細分類処理(ステップ1
10,112)について説明する。その詳細フローを図
5に示す。ここでの処理で、左右に並んだ文字領域を区
切る垂直罫線(垂直セパレータ)と<図その他>の識別
を行なう。初めのステップ110aは、図5に示すよう
に二つのステップ110a,110bからなる。ステッ
プ110aにおいて、当該矩形の高さ/幅比が所定閾値
未満であるか調べる。本実施例では、この閾値は20に
選ばれる。高さ/幅比が20未満のときには、当該矩形
は最終的に<図その他形>に分類される。この判定は、
垂直セパレータの矩形と、<図その他>の矩形との高さ
/幅比の違いに着目したものである。
【0032】ステップ110aで高さ/幅比が20以上
のときには、ステップ110bにおいて、当該矩形領域
をスキャンして垂直方向に長い黒ランだけを抽出し、抽
出した長い黒ランの接続したものを囲む外接矩形を垂直
方向の架空罫線として抽出する。そしてステップ112
に進む。
【0033】ステップ112は二つのステップ112
a,112bからなる。まずステップ112aでは、当
該矩形領域より抽出された垂直方向の架空罫線の数が所
定閾値以上であるか調べる。本実施例では、この閾値と
して4を選んでいる。架空罫線が4本以上のときは当該
矩形を最終的に<図その他>の矩形に分類する。
【0034】垂直方向架空罫線が4本未満である場合、
ステップ112bで、当該矩形領域に(真ん中である必
要はない)、長くて細い垂直方向架空罫線が存在するか
調べ、存在するときは当該矩形を<垂直セパレータ>に
分類し、存在しないときは<図その他>に分類する。
【0035】
【発明の効果】以上の説明から理解されるように、本発
明によれば、画像上の黒画素連結成分に外接する矩形に
ついて、文字、表、囲み枠、セパレータ、グラフ、図等
の分類を高精度に行なうことが可能となる。さらに、こ
れら情報による分類判定の条件の選び方によって分類内
容を柔軟に変更することが可能であるので、例えば対象
とする文書や表の形式に適応させて分類性能を特化する
ことも容易である。等々の効果を得られる。
【図面の簡単な説明】
【図1】本発明の一実施例に係るシステムの概略構成図
である。
【図2】矩形分類処理の全体的フローを示す。
【図3】大分類により表領域候補となった矩形の詳細分
類処理のフローを示す。
【図4】大分類により水平罫線候補となった矩形の詳細
分類処理のフローを示す。
【図5】大分類により垂直罫線候補となった矩形の詳細
分類処理のフローを示す。
【図6】(a)矩形の高さ及び幅のクラス分けの説明図
である。 (b)矩形の大分類テーブルの説明図である。
【図7】架空罫線の抽出の説明図である。
【図8】(a)表の矩形の例を示す。 (b)表の矩形の例を示す。 (c)囲み枠の矩形の例を示す。 (d)グラフの矩形の例を示す。 (e)図その他の矩形の例を示す。 (f)図その他の矩形の例を示す。
【符号の説明】
1 スキャナ 2 画像入力部 3 画像メモリ 4 画像表示部 5 ディスプレー 6 領域識別部 7 画像圧縮部 8 外接矩形検出部 9 矩形分類部 10 文字領域統合部 11 文字認識部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文書等の2値画像上の黒画素連結成分に
    外接する矩形の領域の属性を分類する方法において、矩
    形領域の画素情報から水平方向または垂直方向の長い黒
    ランを抽出し、その連続性より架空罫線を抽出して、該
    架空罫線の個数及び該矩形領域内での相対的位置並びに
    該矩形領域の外形的特徴を、該矩形領域の属性分類のた
    めの情報として用いることを特徴とする矩形分類方法。
JP15558093A 1993-06-25 1993-06-25 矩形分類方法 Expired - Fee Related JP3344774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15558093A JP3344774B2 (ja) 1993-06-25 1993-06-25 矩形分類方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15558093A JP3344774B2 (ja) 1993-06-25 1993-06-25 矩形分類方法

Publications (2)

Publication Number Publication Date
JPH0737036A true JPH0737036A (ja) 1995-02-07
JP3344774B2 JP3344774B2 (ja) 2002-11-18

Family

ID=15609157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15558093A Expired - Fee Related JP3344774B2 (ja) 1993-06-25 1993-06-25 矩形分類方法

Country Status (1)

Country Link
JP (1) JP3344774B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6289120B1 (en) 1997-01-31 2001-09-11 Ricoh Company, Ltd. Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form
JP2002279434A (ja) * 2001-02-22 2002-09-27 Oce Print Logic Technologies Sa ドキュメントにおける自動的テーブル位置決め
JP2009070242A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 領域分割方法及び装置、並びにプログラム
KR200445992Y1 (ko) * 2009-07-13 2009-09-14 최승권 개선된 수세미
US7995869B2 (en) 2006-05-02 2011-08-09 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information storing medium
US8001466B2 (en) 2005-06-17 2011-08-16 Ricoh Company, Ltd. Document processing apparatus and method
US8260057B2 (en) 2007-07-12 2012-09-04 Ricoh Company, Limited Image processing apparatus that obtains a ruled line from a multi-value image
US9451127B2 (en) 2014-07-25 2016-09-20 Kyocera Document Solutions Inc. Image processing apparatus and non-transitory computer readable recording medium for encoding halftone image

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4951373B2 (ja) 2007-03-13 2012-06-13 株式会社リコー 画像検索装置、画像検索方法、及びコンピュータプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6289120B1 (en) 1997-01-31 2001-09-11 Ricoh Company, Ltd. Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form
JP2002279434A (ja) * 2001-02-22 2002-09-27 Oce Print Logic Technologies Sa ドキュメントにおける自動的テーブル位置決め
US8001466B2 (en) 2005-06-17 2011-08-16 Ricoh Company, Ltd. Document processing apparatus and method
US7995869B2 (en) 2006-05-02 2011-08-09 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information storing medium
US8260057B2 (en) 2007-07-12 2012-09-04 Ricoh Company, Limited Image processing apparatus that obtains a ruled line from a multi-value image
JP2009070242A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 領域分割方法及び装置、並びにプログラム
KR200445992Y1 (ko) * 2009-07-13 2009-09-14 최승권 개선된 수세미
US9451127B2 (en) 2014-07-25 2016-09-20 Kyocera Document Solutions Inc. Image processing apparatus and non-transitory computer readable recording medium for encoding halftone image

Also Published As

Publication number Publication date
JP3344774B2 (ja) 2002-11-18

Similar Documents

Publication Publication Date Title
EP0854433B1 (en) Caption and photo extraction from scanned document images
KR100523898B1 (ko) 이미지 프로세싱 방법 및 장치 및 기록 매체
US6614930B1 (en) Video stream classifiable symbol isolation method and system
US6731788B1 (en) Symbol Classification with shape features applied to neural network
US5774580A (en) Document image processing method and system having function of determining body text region reading order
CN102144236B (zh) 用于图像和视频ocr的文本定位
EP1052593A2 (en) Form search apparatus and method
US7233697B2 (en) Character recognition device and a method therefor
US20080212837A1 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
JPH0620092A (ja) 文書画像の領域識別方法
JP2006338578A (ja) 文字認識装置
JP3606500B2 (ja) 矩形分類方法
JPH0737036A (ja) 矩形分類方法
JPH06501801A (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
EP1073002A2 (en) Character extracting method
Sas et al. Three-stage method of text region extraction from diagram raster images
JP3285686B2 (ja) 領域分割方法
Suen et al. Segmentation of uniform-coloured text from colour graphics background
US5721790A (en) Methods and apparatus for separating integer and fractional portions of a financial amount
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JPH064704A (ja) 罫線識別方法及び領域識別方法
KR100331035B1 (ko) 서식문서영상의자동해석방법
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
KR100310306B1 (ko) 컴퓨터에서의서식문서영상분석방법및이를기록한기록매체

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees