JP3400154B2 - 文書画像の領域抽出方法および装置 - Google Patents

文書画像の領域抽出方法および装置

Info

Publication number
JP3400154B2
JP3400154B2 JP31846294A JP31846294A JP3400154B2 JP 3400154 B2 JP3400154 B2 JP 3400154B2 JP 31846294 A JP31846294 A JP 31846294A JP 31846294 A JP31846294 A JP 31846294A JP 3400154 B2 JP3400154 B2 JP 3400154B2
Authority
JP
Japan
Prior art keywords
vertical
horizontal
row
area
rows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP31846294A
Other languages
English (en)
Other versions
JPH08180132A (ja
Inventor
高志 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP31846294A priority Critical patent/JP3400154B2/ja
Publication of JPH08180132A publication Critical patent/JPH08180132A/ja
Application granted granted Critical
Publication of JP3400154B2 publication Critical patent/JP3400154B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書画像から領域を抽
出する領域抽出方法および装置に関する。
【0002】
【従来の技術】縦書きまたは横書き書式の文書を処理す
るシステムにおいて、従来、文書画像から文字列と文章
領域の抽出を行う場合、まず文書画像から文字列を構成
する微小な候補領域を抽出し、これを統合することによ
って文章領域を抽出する方法が一般的に採用されてい
る。
【0003】このような方法として、例えば本出願人が
先に提案した領域分割方法がある(特開平6−2009
2号公報を参照)。この方法は、個別文字や文字列の一
部などの小領域を統合することによって大きな文字領域
を抽出するものである。他の方法として、周辺への黒画
素の射影ヒストグラムを利用し、黒画素の分布の高い部
分を文字列の範囲とする方法もある(秋田、増田 「周
辺分布、線密度、外接矩形特徴を併用した文書画像の領
域分割」 電子通信学会論文誌、86/8Vol.J69
−D No.3 pp.1187−1196を参照)。
【0004】
【発明が解決しようとする課題】上記した公報に記載の
方法は、行方向に小領域を統合して行を生成しているの
で、行方向が縦方向および横方向に混在した場合に処理
できない。これに対して、上記論文に記載の方法は、基
本行方向が一様であるとし、見出し文字列については基
本行方向でない場合もあるものとする。そして、見出し
文字については、見出し文字列の中心となる矩形(Ke
y矩形)を抽出し、この矩形の最近傍の矩形が縦横何れ
の方向にあるかを調べ、距離の近い近傍矩形が存在する
方向を行方向とすることによって、行方向の縦横混在に
対処している。
【0005】しかしながら、この方法では、見出し文字
など本文と区別できるような部分でしか行方向の縦横混
在に対処できない。つまり、行方向が基本方向と異なる
ケースは、確かに見出し文字など一部であるが、囲み記
事であるとか、見出しであっても文字サイズでは簡単に
は本文と区別できない場合など、「明らかな見出し」に
のみ対応しているので不充分であり、また、Key矩形
の近傍の距離だけで判断しているので精度が悪い。
【0006】本発明の目的は、行方向が異なる行が存在
しても、正しく文字列を抽出し文字領域を抽出する文書
画像の領域抽出方法および装置を提供することにある。
【0007】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、文書画像から小領域を抽
出し、行方向を縦および横とそれぞれ仮定して、前記抽
出された各小領域を、縦の行方向および横の行方向に統
合することによりそれぞれ縦方向の行および横方向の行
を生成し、前記縦方向の行を、その縦方向と垂直方向に
統合して第1の領域を生成し、前記横方向の行を、その
横方向と垂直方向に統合して第2の領域を生成し、前記
生成された第1、第2の領域における小領域の統合の度
合いを基に、前記各小領域毎に行方向が縦または横の何
れであるかを評価し、前記抽出された各小領域を前記評
価された行方向に統合して行を生成し、該生成された行
を統合して領域を抽出することを特徴としている。
【0008】請求項2記載の発明では、文書画像から小
領域を抽出する手段と、行方向を縦および横とそれぞれ
仮定して、前記抽出された各小領域を、縦の行方向およ
び横の行方向に統合することによりそれぞれ縦方向の行
および横方向の行を生成する手段と、前記縦方向の行
を、その縦方向と垂直方向に統合して第1の領域を生成
し、前記横方向の行を、その横方向と垂直方向に統合し
て第2の領域を生成する手段と、前記生成された第1、
第2の領域における小領域の統合の度合いを基に、前記
各小領域毎に行方向が縦または横の何れであるかを評価
する手段と、前記抽出された各小領域を前記評価された
行方向に統合して行を生成し、該生成された行を統合し
て領域を抽出する手段とを備えたことを特徴としてい
る。
【0009】
【作用】入力画像から小領域が抽出され、各小領域を、
縦の行方向、横の行方向に統合する。それら縦、横の行
方向と垂直方向に、行を統合して領域が生成される。小
領域の統合の度合いを評価して、小領域毎の縦横方向が
判別され、判別された行方向について、再度、行を統合
して領域を生成する。
【0010】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1は、本発明の実施例の構成を示す。
図において、101はスキャナなどの画像入力装置、1
02は入力画像から小領域を抽出する小領域抽出部、1
03は小領域を統合して行を抽出する行生成部、104
は行を統合して領域を生成する領域生成部、105は生
成した領域内の行の位置関係および行の形状から行を構
成する各小領域の行方向を評価する生成行評価部、10
6は画像データ、抽出された小領域、行、領域などの各
種データを一時記憶するデータ記憶部、107は各部の
制御を行う制御部、108はデータ通信路である。
【0011】図2は、本発明の処理フローチャートであ
る。以下、図2のフローチャートに従って、本発明の動
作を説明する。まず、画像入力装置101によって画像
を入力する(ステップ201)。次に、小領域抽出部1
02は、入力された画像から小領域を抽出する(ステッ
プ202)。この方法としては、例えば前掲した公報に
記載の方法を用いる。すなわち、入力画像を圧縮し、圧
縮した画像から文字候補としての黒画素連結成分の外接
矩形を抽出する。この圧縮画像の黒画素連結成分が小領
域(矩形)に相当する。圧縮されているので、近接する
文字は統合され、一つの連結成分が通常、文字列に相当
する。ただし、文字間の空白が長いような場合はそこで
統合されずに分離する。図3は、文書画像から抽出され
た小領域301を示す。
【0012】次に、この小領域を使用して基本行方向の
検出を行ってもよい(ステップ203)。この場合は、
後述する。いま、基本行方向を求めない場合について説
明する。
【0013】小領域を、行方向縦または横に一様である
として行に統合し、その行を今度は行方向と垂直方向に
統合して領域を得る(ステップ204、205)。図4
(a)は、小領域を行方向縦として縦方向に統合した行
302を示し、(b)はそれを横方向に統合して得た領
域303を示す。また、図5(a)は、小領域を行方向
横として横方向に統合した行304を示し、(b)はそ
れを縦方向に統合して得た領域305を示す。
【0014】それぞれ小領域の行への統合については、
例えば、本出願人が先に提案した、特開平5−8147
5号公報、および前掲した公報に記載の方法を用いれば
よい。つまり、文字サイズが似ていて統合方向に近接す
るものを統合するものである。図4(a)に示す統合し
た行302は、縦方向への統合であるので、本来縦書き
である下部の小領域は正しく行へと統合される。しか
し、上部の小領域は横書きであるため、偶然、類似した
幅を持つ小領域が上下の行に並んだ場合に、行へと統合
されるにすぎない。従って、場合によっては矩形306
のように、行へと統合されない小領域も出てくる(この
場合、その小領域一つが一つの行に相当することにな
る)。図5(a)の行304においても、下部の小領域
310は、縦長すぎて文字サイズが異常となり、横方向
の行として統合されない場合も生じる。
【0015】また、小領域307と308は、少し離れ
ているが、小領域309と文字サイズが近いために統合
されて一つの行となる。
【0016】次に行を領域へと統合する。すなわち、図
4(a)の行302を横方向に統合すると、(b)の領
域303に示すようになる。この統合の手法としては、
文字サイズの類似した近接する行を統合するが、これも
同様に例えば、前記した特開平5−81475号公報お
よび同6−20092号公報に記載の方法を用いる。こ
れにより、正しい行方向である下部は類似した文字サイ
ズの行が近接しているので、きれいに領域として統合さ
れる。しかし、行311は、その行頭が他の行312と
大きく異なっているので、それぞれ図に太い黒線で示す
ように別領域となっている。
【0017】また、本来、横書きである上部は、縦方向
に処理して一つの領域303としてまとめるには文字サ
イズや行の位置が不揃いである。さらに、本来、縦書き
である下部を横方向に処理した場合(図5(b)の領域
305)も同様である。つまり、上部は、文字サイズや
行間が揃っているためにきれいに領域として統合される
が、下部は縦方向に行を統合しようとしても、縦方向に
は近接する行がほとんどなく、あっても文字サイズが大
きく異なるので、結局、各行がそのまま一つの領域とな
る。
【0018】このように、本来の行方向と異なる方向で
統合されて生じた行は、小領域の統合の度合いが低く、
また領域へと統合する際の整合性が低い。これを生成行
評価部105で評価する(ステップ206)。
【0019】上部の小領域の多くは、横方向に行として
統合した場合に統合の度合いが高く、その行を利用して
統合した領域の整合性もよい。小領域307、308
は、縦へと統合しても行が生成される(小領域311)
が、それを領域へと統合した場合に、他の行と統合でき
ずに孤立した領域となる。
【0020】このように、各領域毎に所属する行、領
域の尤度から縦方向へ統合すべきか横方向へ統合すべき
かの評価を行う。ここで、尤度としては、例えば領域の
サイズ、行頭の揃い具合、行毎の文字サイズの変動など
を用いる。
【0021】小領域314(図3)は左右に小領域がな
く、上下に近接した小領域がある。従って、単純に近接
方向へと統合すると、実際に領域313にまで統合する
ことは可能であるが、これは当然誤りである。本発明の
方法によれば、このような場合でも所属する縦横それぞ
れの行、領域の尤度から横方向として扱う方がよいこと
が判定できる。
【0022】次に、基本行方向を検出する場合について
説明する。この場合は、ステップ203において、基本
となる行方向について検出する。ほとんどの文書におい
ては、縦横の行が半々で現われるようことはなく、何れ
か一方が優勢である。この場合の行方向の検出について
は、本出願人が先に提案した特開平5−314309号
公報に記載された文字列方向判別方法を用いればよい。
【0023】この文字列方向判別方法は、縮小された文
書画像(2値画像)から文字列候補としての黒画素の連
結成分を抽出し、該連結成分の中で縦横比または横縦比
が所定の閾値を超える縦長の連結成分の個数と横長の連
結成分の個数とを比較することによって、文書の文字列
方向を判別する。
【0024】そして、前述したように、ステップ20
4、205で縦方向、横方向で行を生成して、それら生
成された行を統合して領域を生成する。ステップ203
で基本行方向が判明した場合には、生成行評価部105
は基本行方向が優先されるように判定する。
【0025】生成行評価部105は、上記した尤度から
各小領域毎に何れの行方向であるかを判定することにな
るが、明確に判定できない場合もある。そのような場合
には、当該小領域を行方向不明と処理する。そして、ス
テップ207で行を生成する際に、行方向が確定してい
るものから処理(小領域の行への統合)開始することに
よって、最終的には行方向不明な小領域も行へと統合さ
れるように処理する。
【0026】
【発明の効果】以上、説明したように、本発明によれ
ば、以下のような効果が得られる。 (1) 縦方向および横方向について行を生成し、生成さ
れた行を統合して領域を生成し、生成された領域におけ
る小領域の統合の度合いを基に行方向を評価し、評価さ
れた行方向について、小領域を統合して行を生成、統合
して領域を抽出しているので、方向の異なる行が存在し
ても精度良く領域分割を行うことが可能となる。(2) 予め画像全体に優勢な行方向を検出しているの
で、各小領域の行方向の判定誤りを抑えることができ
る。(3) 無理な行方向判別をしていないことから、最終的
に異なる行方向であっても、精度よく領域分割を行うこ
とができる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】本発明の処理フローチャートである。
【図3】文書画像から抽出された小領域を示す。
【図4】(a)は、小領域を行方向縦として縦方向に統
合した行を示し、(b)は統合された行を横方向に統合
して得た領域を示す。
【図5】(a)は、小領域を行方向横として横方向に統
合した行を示し、(b)は統合された行を縦方向に統合
して得た領域を示す。
【符号の説明】
101 画像入力装置 102 小領域抽出部 103 行生成部 104 領域生成部 105 生成行評価部 106 データ記憶部 107 制御部 108 データ通信路

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像から小領域を抽出し、行方向を
    縦および横とそれぞれ仮定して、前記抽出された各小領
    域を、縦の行方向および横の行方向に統合することによ
    りそれぞれ縦方向の行および横方向の行を生成し、前記
    縦方向の行を、その縦方向と垂直方向に統合して第1の
    領域を生成し、前記横方向の行を、その横方向と垂直方
    向に統合して第2の領域を生成し、前記生成された第
    1、第2の領域における小領域の統合の度合いを基に、
    前記各小領域毎に行方向が縦または横の何れであるかを
    評価し、前記抽出された各小領域を前記評価された行方
    向に統合して行を生成し、該生成された行を統合して領
    域を抽出することを特徴とする文書画像の領域抽出方
    法。
  2. 【請求項2】 文書画像から小領域を抽出する手段と、
    行方向を縦および横とそれぞれ仮定して、前記抽出され
    た各小領域を、縦の行方向および横の行方向に統合する
    ことによりそれぞれ縦方向の行および横方向の行を生成
    する手段と、前記縦方向の行を、その縦方向と垂直方向
    に統合して第1の領域を生成し、前記横方向の行を、そ
    の横方向と垂直方向に統合して第2の領域を生成する手
    段と、前記生成された第1、第2の領域における小領域
    の統合の度合いを基に、前記各小領域毎に行方向が縦ま
    たは横の何れであるかを評価する手段と、前記抽出され
    た各小領域を前記評価された行方向に統合して行を生成
    し、該生成された行を統合して領域を抽出する手段とを
    備えたことを特徴とする文書画像の領域抽出装置。
JP31846294A 1994-12-21 1994-12-21 文書画像の領域抽出方法および装置 Expired - Lifetime JP3400154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31846294A JP3400154B2 (ja) 1994-12-21 1994-12-21 文書画像の領域抽出方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31846294A JP3400154B2 (ja) 1994-12-21 1994-12-21 文書画像の領域抽出方法および装置

Publications (2)

Publication Number Publication Date
JPH08180132A JPH08180132A (ja) 1996-07-12
JP3400154B2 true JP3400154B2 (ja) 2003-04-28

Family

ID=18099395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31846294A Expired - Lifetime JP3400154B2 (ja) 1994-12-21 1994-12-21 文書画像の領域抽出方法および装置

Country Status (1)

Country Link
JP (1) JP3400154B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5481988B2 (ja) * 2009-07-21 2014-04-23 株式会社リコー 画像処理装置、制御方法及びプログラム

Also Published As

Publication number Publication date
JPH08180132A (ja) 1996-07-12

Similar Documents

Publication Publication Date Title
US6738154B1 (en) Locating the position and orientation of multiple objects with a smart platen
JP3253356B2 (ja) 文書画像の領域識別方法
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7738734B2 (en) Image processing method
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
US20020006220A1 (en) Method and apparatus for recognizing document image by use of color information
JPH05233873A (ja) 領域分割方法
US7133558B1 (en) Device processing a table image, a memory medium storing a processing program, and a table management processing method
JP3400154B2 (ja) 文書画像の領域抽出方法および装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
EP0975146B1 (en) Locating the position and orientation of multiple objects with a smart platen
JP3443141B2 (ja) 画像傾き検出方法及び表処理方法
JP2868134B2 (ja) 画像処理方法及び装置
JP2000090194A (ja) 画像処理方法および画像処理装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPH0728934A (ja) 文書画像処理装置
EP0974931A1 (en) Method and apparatus for identifying a plurality of sub-images in an input image
JPS63101983A (ja) 文字列抽出方式
JP2003317107A (ja) 罫線抽出方法及び装置
JPH0581475A (ja) 文字領域抽出方法
JP3653156B2 (ja) 文書画像領域抽出方法
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP3618926B2 (ja) 文書画像の傾き検出方法
JPH09114925A (ja) 光学式文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080221

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090221

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100221

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130221

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130221

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140221

Year of fee payment: 11

EXPY Cancellation because of completion of term