JPH0737036A - 矩形分類方法 - Google Patents
矩形分類方法Info
- Publication number
- JPH0737036A JPH0737036A JP5155580A JP15558093A JPH0737036A JP H0737036 A JPH0737036 A JP H0737036A JP 5155580 A JP5155580 A JP 5155580A JP 15558093 A JP15558093 A JP 15558093A JP H0737036 A JPH0737036 A JP H0737036A
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- character
- rectangles
- area
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
を改善する。 【構成】 外接矩形の大きさ、形状より文字、水平罫線
候補、垂直罫線候補、表矩形候補に大雑把に分類する
(100)。文字に分類された矩形以外については、矩
形領域内の水平または垂直方向の長い黒ランからなる架
空罫線を抽出し、その個数、矩形内の相対的位置等の情
報による条件判定(102〜124)によって、文字、
セパレータ、表、囲み枠、図グラフその他に分類する。
Description
黒画素連結成分の外接矩形の領域の属性を分類する方法
に関する。
属性の異なる領域が混在した文書の文字認識において
は、一般に前処理段階で文書の領域分割を行なう必要が
ある。同様の領域分割は、文書の伝送、画像データベー
スへの文書入力等の分野でも必要とされる。
素連結成分の外接矩形を抽出し、それらを統合していく
というボトムアップ的な手法で行なう場合、抽出した矩
形の属性を分類する必要がある。
状や面積等から文字領域、文字領域間を区切るためのセ
パレータ、あるいはイメージに分類する方法が知られて
いる(特開平3−126181号)。しかし、このよう
な矩形の外形的特徴のみに基づいた分類方法では、画像
格納用メモリの必要容量を減らすために画像を圧縮する
と文字の矩形間が融合するため、セパレータの矩形と文
字列の矩形の分類を誤る等、分類精度に自ずと限界があ
った。
目的は、黒画素連結成分の外接矩形の領域の属性を、よ
り高精度に分類する方法を提供することにある。
等の2値画像上の黒画素連結成分に外接する矩形の領域
の属性を分類する方法において、矩形領域の画素情報か
ら水平方向または垂直方向の長い黒ランを抽出し、その
連続性より架空罫線を抽出して、該架空罫線の個数及び
該矩形領域内での相対的位置並びに該矩形領域の外形的
特徴を、該矩形領域の属性分類のための情報として利用
することにある。
て、矩形領域内の水平方向及び回直方向の架空罫線の個
数及び矩形領域内の相対的位置の情報を属性分類に利用
するため、文字、表、囲み枠、セパレータ、グラフ、図
等の高精度な分類が可能となる。さらに、これら情報に
よる分類判定の条件の選び方によって、分類の柔軟性・
自由度を確保できる。
略構成を示す。図1において、スキャナ1によって読み
取られた文書画像のデータは、画像入力部2によって画
像メモリ3に格納される。画像メモリ3内の文書画像デ
ータは、領域識別部6の画像圧縮部7に読み出され、こ
こで所定の圧縮率のOR圧縮を施されてから画像メモリ
3に戻される。画像メモリ3内の文書画像データは、画
像表示部4によってディスプレー5に表示させることが
できる。なお、画像入力部7より文書画像データを画像
圧縮部7へ直接入力し、ここで圧縮させた画像データを
画像メモリ3に格納させることも可能である。
外接矩形検出部8、矩形分類部9、文字領域統合部10
からなる。外接矩形検出部8は、画像メモリ3内の圧縮
された文書画像データより、黒画素連結成分に外接する
矩形を抽出する部分である。ここで抽出された矩形に
は、文字(1文字または2文字以上の文字列)の矩形の
ほかに罫線、表、図、グラフその他、様々な属性の矩形
が含まれる。矩形分類部9は、このような様々な矩形の
属性を、矩形の形状情報及び内部データから分類するも
ので、本発明の要旨に直接関連する部分である。文字領
域統合部10は、文字矩形と分類された矩形を統合し
て、文字領域を生成する部分である。
領域識別の結果は、文字認識部11による文字認識処理
に利用される。つまり、領域識別部6は光学的文字認識
の前処理部として利用される。しかし、これは一例に過
ぎない。
内容について、図2乃至図8を用いて詳細に説明する。
す。まず、矩形の大きさ及び形状によって、矩形の種類
を大雑把に分類する(ステップ100)。この分類処理
の情報には、文書の標準文字サイズと矩形の大小関係
や、矩形の縦横比を利用することができる。図6によ
り、本実施例におけるステップ100の分類方法を説明
する。
(height)を、標準文字サイズ(size)との
大小関係によってクラス1からクラス3に分ける。ま
た、矩形の幅(width)を、標準文字サイズとの大
小関係によってクラス1からクラス3に分ける。
る場合には、その値を用いればよいし、予め分かってい
ない場合には文書画像より抽出された矩形の高さの分布
から適応的に決定するような方法を採用すればよい。こ
のような適応的な標準文字サイズの決定方法は公知であ
るので、ここでは詳細は述べない。
び矩形幅クラスから矩形の種類を大分類する。この大分
類テーブルの例を図6の(b)に示す。このテーブルよ
り、例えば矩形幅がクラス1またはクラス2で、矩形高
さがクラス1またはクラス2ならば、その矩形は文字候
補または大文字候補と分類される。この矩形の場合に
は、この大分類の結果がそのまま矩形分類の最終結果と
なり、その分類処理は完了である。しかし、矩形幅がク
ラス1で、矩形高さがクラス3ならば垂直罫線候補と分
類され、この矩形はステップ110以下の詳細分類の対
象となる。大分類結果が水平罫線候補あるいは表領域候
補となった矩形の場合も、その矩形はステップ102以
下あるいはステップ120以下の詳細分類の対象とな
る。
について説明する。当該矩形の領域内をスキャンして水
平方向の所定閾値以上の長さを有する長い黒ランだけを
抽出し、その接続したものを囲む外接矩形を水平方向の
架空罫線として抽出する(ステップ120)。
明図である。(a)に示す例では、長い黒ラン201,
202の外接矩形203が水平方向の架空罫線として抽
出される。(b)に示す例では、黒ラン206〜210
は短いので無視され、長い黒ラン204,205だけの
外接矩形211が架空罫線として抽出される。(c)の
例では、長い黒ラン213,214と長い黒ラン21
5,216は、短い黒ラン218〜225を介して接続
しているが、これら短い黒ランは無視されるので、黒ラ
ン213,214の外接矩形226と、黒ラン215,
216の外接矩形227の二つが架空罫線として抽出さ
れる。
垂直方向に長い黒ランだけを抽出し、その接続したもの
を囲む外接矩形を垂直方向の架空罫線として抽出する
(ステップ122)。この抽出方法は、方向が異なる以
外は水平方向の架空罫線の抽出の場合と同様である。
て、当該矩形を<表>、<囲み枠>または<図、グラフ
その他>に分類する(ステップ124)。このステップ
124の処理の詳細を図3に示す。
た架空罫線の中で、縦横比が罫線として不適当なもの
と、当該矩形(架空罫線が抽出された元の矩形)の幅ま
たは高さに対して短か過ぎるものを除外する(ステップ
124a,124b)。
て、架空罫線の本数、位置の条件、例えば図3の右上部
分に示した4条件の判定を順次行なう(ステップ124
c〜124f)。
上及び下に水平方向架空罫線がそれぞれ存在し、かつ中
央寄り1本以上の垂直方向架空罫線が存在する」の条件
が成立するが調べる(ステップ124c)。同条件が成
立するとき当該矩形を<表>と分類する。このように分
類される例を図8の(a)に示す。なお、図8に示した
各例の外側の枠線は矩形の境界線を意味し、内部の網掛
けされた長矩形は架空罫線を意味する。
なわち「当該矩形領域に6本以上の水平方向架空罫線が
存在し、かつ当該矩形領域の上及び下に水平方向架空罫
線がそれぞれ存在し、かつ当該矩形領域の左及び右に垂
直方向架空罫線がそれぞれ存在する」の条件が成立する
か調べる(ステップ124d)。この条件が成立すると
きは、当該矩形を<表>と分類する。このように分類さ
れる例を図8の(b)に示す。
なわち「当該矩形領域の上及び下に水平方向の架空罫線
がそれぞれ存在し、かつ当該矩形領域の左及び右に垂直
方向の架空罫線がそれぞれ存在する」の条件の成立を調
べる(ステップ124e)。同条件が成立するとき、当
該矩形を<囲み枠>と分類する。このように分類される
例を図8の(c)に示す。
なわち「当該矩形領域の左及び下に垂直方向及び水平方
向の架空罫線がそれぞれ存在するか、あるいは当該矩形
領域の上及び左に水平方向及び垂直方向の架空罫線がそ
れぞれ存在するか、そのいずれか一方である」の条件の
成立を調べる(ステップ124f)。同条件が成立する
ときは、当該矩形を<グラフ>と分類する。このように
分類される例を図8の(d)に示す。
形を<図その他>に分類する。その例を図8の(e)及
び(f)に示す。(f)の例では、矩形領域内に長い黒
ランによる架空罫線が全く存在しない場合である。
た矩形の詳細分類の処理(ステップ102,104)に
ついて説明する。その詳細フローを図4に示す。ここで
の処理で、文字矩形であるか、上下に並んだ文字領域を
区切る水平罫線(水平セパレータ)であるかの識別を行
なう。初めのステップ102は図4に示すように二つの
ステップ102a,102bからなる。ステップ102
aにおいて、当該矩形の幅/高さ比が所定閾値未満であ
るか調べる。本実施例では、この閾値は20に選ばれ
る。幅/高さ比が20未満のときには、当該矩形は最終
的に<文字矩形>に分類される。この判定は、1文字あ
るいは数文字の文字矩形と水平セパレータの矩形との幅
/高さ比の違いに着目したものである。
のときには、ステップ102bにおいて、当該矩形領域
をスキャンして水平方向に長い黒ランだけを抽出し、抽
出した長い黒ランの接続したものを囲む外接矩形を水平
方向の架空罫線として抽出する。そしてステップ104
に進む。
a,104bからなる。まずステップ104aでは、当
該矩形領域より抽出された水平方向の架空罫線の数が所
定閾値以上であるか調べる。本実施例では、この閾値と
して6を選んでいる。架空罫線が6本以上のときは当該
矩形を最終的に<文字矩形>に分類する。
ステップ104bで、当該矩形領域の略真ん中に、長く
て細い水平方向架空罫線が存在するか調べ、存在すると
きは当該矩形を<水平セパレータ>に分類し、存在しな
いときは<文字矩形>に分類する。この条件判定によっ
て、アンダーライン付文字列の矩形と水平セパレータと
を区別できる。
に分類された矩形についての詳細分類処理(ステップ1
10,112)について説明する。その詳細フローを図
5に示す。ここでの処理で、左右に並んだ文字領域を区
切る垂直罫線(垂直セパレータ)と<図その他>の識別
を行なう。初めのステップ110aは、図5に示すよう
に二つのステップ110a,110bからなる。ステッ
プ110aにおいて、当該矩形の高さ/幅比が所定閾値
未満であるか調べる。本実施例では、この閾値は20に
選ばれる。高さ/幅比が20未満のときには、当該矩形
は最終的に<図その他形>に分類される。この判定は、
垂直セパレータの矩形と、<図その他>の矩形との高さ
/幅比の違いに着目したものである。
のときには、ステップ110bにおいて、当該矩形領域
をスキャンして垂直方向に長い黒ランだけを抽出し、抽
出した長い黒ランの接続したものを囲む外接矩形を垂直
方向の架空罫線として抽出する。そしてステップ112
に進む。
a,112bからなる。まずステップ112aでは、当
該矩形領域より抽出された垂直方向の架空罫線の数が所
定閾値以上であるか調べる。本実施例では、この閾値と
して4を選んでいる。架空罫線が4本以上のときは当該
矩形を最終的に<図その他>の矩形に分類する。
ステップ112bで、当該矩形領域に(真ん中である必
要はない)、長くて細い垂直方向架空罫線が存在するか
調べ、存在するときは当該矩形を<垂直セパレータ>に
分類し、存在しないときは<図その他>に分類する。
明によれば、画像上の黒画素連結成分に外接する矩形に
ついて、文字、表、囲み枠、セパレータ、グラフ、図等
の分類を高精度に行なうことが可能となる。さらに、こ
れら情報による分類判定の条件の選び方によって分類内
容を柔軟に変更することが可能であるので、例えば対象
とする文書や表の形式に適応させて分類性能を特化する
ことも容易である。等々の効果を得られる。
である。
類処理のフローを示す。
分類処理のフローを示す。
分類処理のフローを示す。
である。 (b)矩形の大分類テーブルの説明図である。
Claims (1)
- 【請求項1】 文書等の2値画像上の黒画素連結成分に
外接する矩形の領域の属性を分類する方法において、矩
形領域の画素情報から水平方向または垂直方向の長い黒
ランを抽出し、その連続性より架空罫線を抽出して、該
架空罫線の個数及び該矩形領域内での相対的位置並びに
該矩形領域の外形的特徴を、該矩形領域の属性分類のた
めの情報として用いることを特徴とする矩形分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15558093A JP3344774B2 (ja) | 1993-06-25 | 1993-06-25 | 矩形分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15558093A JP3344774B2 (ja) | 1993-06-25 | 1993-06-25 | 矩形分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0737036A true JPH0737036A (ja) | 1995-02-07 |
JP3344774B2 JP3344774B2 (ja) | 2002-11-18 |
Family
ID=15609157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15558093A Expired - Fee Related JP3344774B2 (ja) | 1993-06-25 | 1993-06-25 | 矩形分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3344774B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6289120B1 (en) | 1997-01-31 | 2001-09-11 | Ricoh Company, Ltd. | Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form |
JP2002279434A (ja) * | 2001-02-22 | 2002-09-27 | Oce Print Logic Technologies Sa | ドキュメントにおける自動的テーブル位置決め |
JP2009070242A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | 領域分割方法及び装置、並びにプログラム |
KR200445992Y1 (ko) * | 2009-07-13 | 2009-09-14 | 최승권 | 개선된 수세미 |
US7995869B2 (en) | 2006-05-02 | 2011-08-09 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and information storing medium |
US8001466B2 (en) | 2005-06-17 | 2011-08-16 | Ricoh Company, Ltd. | Document processing apparatus and method |
US8260057B2 (en) | 2007-07-12 | 2012-09-04 | Ricoh Company, Limited | Image processing apparatus that obtains a ruled line from a multi-value image |
US9451127B2 (en) | 2014-07-25 | 2016-09-20 | Kyocera Document Solutions Inc. | Image processing apparatus and non-transitory computer readable recording medium for encoding halftone image |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4951373B2 (ja) | 2007-03-13 | 2012-06-13 | 株式会社リコー | 画像検索装置、画像検索方法、及びコンピュータプログラム |
-
1993
- 1993-06-25 JP JP15558093A patent/JP3344774B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6289120B1 (en) | 1997-01-31 | 2001-09-11 | Ricoh Company, Ltd. | Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form |
JP2002279434A (ja) * | 2001-02-22 | 2002-09-27 | Oce Print Logic Technologies Sa | ドキュメントにおける自動的テーブル位置決め |
US8001466B2 (en) | 2005-06-17 | 2011-08-16 | Ricoh Company, Ltd. | Document processing apparatus and method |
US7995869B2 (en) | 2006-05-02 | 2011-08-09 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and information storing medium |
US8260057B2 (en) | 2007-07-12 | 2012-09-04 | Ricoh Company, Limited | Image processing apparatus that obtains a ruled line from a multi-value image |
JP2009070242A (ja) * | 2007-09-14 | 2009-04-02 | Ricoh Co Ltd | 領域分割方法及び装置、並びにプログラム |
KR200445992Y1 (ko) * | 2009-07-13 | 2009-09-14 | 최승권 | 개선된 수세미 |
US9451127B2 (en) | 2014-07-25 | 2016-09-20 | Kyocera Document Solutions Inc. | Image processing apparatus and non-transitory computer readable recording medium for encoding halftone image |
Also Published As
Publication number | Publication date |
---|---|
JP3344774B2 (ja) | 2002-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0854433B1 (en) | Caption and photo extraction from scanned document images | |
KR100523898B1 (ko) | 이미지 프로세싱 방법 및 장치 및 기록 매체 | |
US6614930B1 (en) | Video stream classifiable symbol isolation method and system | |
US6731788B1 (en) | Symbol Classification with shape features applied to neural network | |
US5774580A (en) | Document image processing method and system having function of determining body text region reading order | |
CN102144236B (zh) | 用于图像和视频ocr的文本定位 | |
EP1052593A2 (en) | Form search apparatus and method | |
US7233697B2 (en) | Character recognition device and a method therefor | |
US20080212837A1 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
JPH0620092A (ja) | 文書画像の領域識別方法 | |
JP2006338578A (ja) | 文字認識装置 | |
JP3606500B2 (ja) | 矩形分類方法 | |
JPH0737036A (ja) | 矩形分類方法 | |
JPH06501801A (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
EP1073002A2 (en) | Character extracting method | |
Sas et al. | Three-stage method of text region extraction from diagram raster images | |
JP3285686B2 (ja) | 領域分割方法 | |
Suen et al. | Segmentation of uniform-coloured text from colour graphics background | |
US5721790A (en) | Methods and apparatus for separating integer and fractional portions of a financial amount | |
JP3607753B2 (ja) | 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置 | |
JPH064704A (ja) | 罫線識別方法及び領域識別方法 | |
KR100331035B1 (ko) | 서식문서영상의자동해석방법 | |
JPH11191135A (ja) | 文書画像の日本語英語判定方法、文書認識方法および記録媒体 | |
EP0446630A2 (en) | Method and apparatus for segmenting characters in an amount field on a financial document | |
KR100310306B1 (ko) | 컴퓨터에서의서식문서영상분석방법및이를기록한기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080830 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080830 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090830 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090830 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100830 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100830 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110830 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |