JPH05233873A - 領域分割方法 - Google Patents

領域分割方法

Info

Publication number
JPH05233873A
JPH05233873A JP4267313A JP26731392A JPH05233873A JP H05233873 A JPH05233873 A JP H05233873A JP 4267313 A JP4267313 A JP 4267313A JP 26731392 A JP26731392 A JP 26731392A JP H05233873 A JPH05233873 A JP H05233873A
Authority
JP
Japan
Prior art keywords
character
rectangle
line
area
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4267313A
Other languages
English (en)
Other versions
JP3278471B2 (ja
Inventor
Michiyoshi Tachikawa
道義 立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP26731392A priority Critical patent/JP3278471B2/ja
Publication of JPH05233873A publication Critical patent/JPH05233873A/ja
Priority to US08/396,585 priority patent/US5757957A/en
Application granted granted Critical
Publication of JP3278471B2 publication Critical patent/JP3278471B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 文字サイズの違う様々な文書に対して的確な
領域分割を行なう。 【構成】 矩形抽出部5により黒連結成分の外接矩形を
抽出し、ヒストグラム生成部6で矩形の高さのヒストグ
ラムを生成し、これにもとづき標準文字サイズ決定部7
が標準文字サイズを決定する。矩形分類部8は、標準文
字サイズと矩形の大きさを比較し、文字矩形と図表矩形
を分類する。行抽出部9は文字矩形を統合した行を抽出
し、文字領域生成部10は行を統合した文字領域を抽出
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、図表と文字などが混在
した一般文書の画像に対し、文字の領域と、図領域や表
領域等の文字以外の領域(図・表領域)とを識別分類
し、必要な領域分割を行なうための領域分割方法に関す
る。
【0002】
【従来の技術】文書画像を光ディスク等の記憶メディア
にファイリングする場合、ファクシミリで通信する場
合、プリンタに出力する場合等に、文書画像を文字領域
と図・表領域に切り分け、文字領域には文字領域用処理
を、図・表領域には図の処理や表の処理を施したいこと
がある。光学的文字認識装置を用いて文書上の文字をコ
ード化する場合にも、同様の文字領域と図・表領域の切
り分けが必要になる。
【0003】従来、このような領域抽出に関する技術と
して、原稿画像から黒連結成分の外接矩形を抽出し、抽
出した矩形の大きさを予め定めた閾値と比較することに
よって、文字の矩形と線図形の矩形を判定する方法が知
られている(特開昭55−162177号)。
【0004】
【発明が解決しようとする課題】しかし、黒連結成分の
外接矩形の種類判定に予め定められた閾値を用いるの
で、文字サイズが異なる様々な文書の画像が入力された
場合に柔軟に対応できない。
【0005】領域分割の対象となる原稿が書籍や雑誌の
ページである場合、1ページずつ切り取ってスキャナに
セットすることは稀で、書籍や雑誌の目的ページを開
き、見開き原稿としてスキャナにセットし読み取らせる
ことが多い。このような見開き原稿を読み取った画像の
場合、原稿の中折れ部つまりページ間境界部に黒ずん
だ、あるいは黒い領域が生じやすい。また、スキャナの
押さえ板(スキャナの光源の光を反射させ画像の地肌を
白にするためのもの)を閉じることができず、あるい
は、これが浮き上がり、その結果、原稿の周辺部に黒領
域が生じやすい。このような見開き原稿画像の領域分割
を行なう場合、中折れ部や周辺部に観測される黒領域を
ノイズ領域として適切に処理すべきであるが、従来は、
このノイズ処理を考慮していなかった。
【0006】文書画像においては、罫線を間に文字領域
(コラム)が接近していることがあるが、従来は、この
ような文字領域のセパレータとしての罫線に対する考慮
が払われていないため、罫線により区切られた隣接文字
領域が一つの文字領域に統合されてしまったり、表領域
の文字領域やグラフ領域内の文字領域が、それに隣接し
た外部の文字領域と統合されてしまうことがあった。
【0007】本発明は、より高精度に文字領域の分離を
行なうための領域分割方法を提供しようとするものであ
る。より具体的に言えば、本発明の一つの目的は、文字
サイズ等が様々な文書に対して、文字の領域とそれ以外
の領域とを的確に分離し、必要な領域分割を行なう領域
分割方法を提供することである。もう一つの目的は、書
籍のような見開き原稿や厚手の原稿より読み取った文書
画像に対して、中折れ部や周辺部に生じやすいノイズ領
域の影響を排除し、的確な領域分割が可能な領域分割方
法を提供することにある。本発明の他の目的は、罫線に
より区切られた文字領域や、表領域あるいはグラフ領域
の内部の文字領域を、的確に分離することができる領域
分割方法を提供することにある。
【0008】
【課題を解決するための手段】請求項1乃至5の発明に
よれば、文書画像より抽出した黒連結成分に外接した矩
形の高さのヒストグラムより標準文字サイズを決定し、
抽出した矩形を、標準文字サイズとの大小関係に基づい
て、文字の矩形とそれ以外の矩形とに分類し、そのうえ
で文字の矩形のみを統合することによって文字領域を生
成する。
【0009】請求項4または5の発明によれば、文書画
像の処理対象領域の境界からの距離が、予め決められた
閾値または標準文字サイズに応じて決められた閾値以下
の文字以外の矩形をノイズとして除去する。
【0010】請求項6乃至8の発明によれば、文書画像
より文字の矩形を抽出するほかに垂直罫線を抽出し、あ
る注目した矩形より矩形の統合を行なう際に、当該注目
矩形との水平距離が水平方向の統合条件である矩形間距
離の閾値より小さく、かつ、当該注目矩形と垂直方向の
重なりを持つ垂直罫線と遭遇した場合、当該注目領域に
関し、水平方向の統合条件である矩形間距離の閾値を、
当該注目矩形と当該垂直罫線との水平距離に対応した値
に変更する。
【0011】請求項7の発明によれば、文字の矩形の統
合により生成された行の統合を行なうが、注目した行よ
り行を統合する際に、統合しようとする行が、その生成
時に垂直罫線との遭遇により水平統合条件たる矩形間距
離の閾値を変更したものである場合、その行の水平方向
の終点座標より当該注目行の水平方向の終点座標が大き
いときには統合を禁止する。
【0012】請求項8の発明によれば、行の統合により
生成された文字領域について再統合を行なうが、ある注
目した文字領域より文字領域の統合を行なう時に、統合
しようとする文字領域内の行の中に、その生成時に垂直
罫線との遭遇により水平方向の統合条件たる矩形間距離
の閾値を変更した行が含まれている場合、当該統合しよ
うとする文字領域の水平方向の終点座標より当該注目文
字領域の水平方向の終点座標が大きいときには統合を禁
止する。
【0013】請求項9または10の発明によれば、文書
画像より文字の矩形を抽出するほかに垂直罫線を抽出
し、文字の矩形を統合した行について、ある注目した行
より行統合を行なう際に、当該注目行との垂直距離が垂
直方向の統合条件である行間距離の閾値より小さく、か
つ、当該注目行と水平方向の重なりを持つ水平罫線と遭
遇した場合、当該注目行に関し、垂直方向の統合条件で
ある行間距離の閾値を、当該注目行と当該水平罫線との
垂直距離に対応した値に変更する。
【0014】請求項10の発明によれば、行統合により
生成された文字領域について注目した文字領域より再統
合を行なうが、その際に、統合しようとする文字領域内
の行の中に、その生成時に水平罫線との遭遇により垂直
方向の統合条件たる行間距離の閾値を変更した行が含ま
れている場合、当該統合しようとする文字領域の垂直方
向の終点座標より当該注目文字領域の垂直方向の終点座
標が大きいときには統合を禁止する。
【0015】請求項11または12の発明によれば、文
書画像より、文字の矩形を抽出するほかに、文字以外の
大きな図・表矩形を抽出する。請求項11の発明によれ
ば、図・表矩形矩形を水平方向にスキャンして閾値以上
の長い黒ランのみからなる黒連結成分に外接する矩形H
を抽出し、それぞれの文字以外の矩形より抽出された矩
形Hの中で、当該文字以外の矩形の上辺または下辺から
所定距離範囲内で最も上または最も下に位置し、かつ水
平罫線としての形状条件を満足したものを架空水平セパ
レータとして抽出し、この架空水平セパレータを文字領
域を上下に区切る水平セパレータとして扱って、文字の
矩形を統合する。請求項12の発明によれば、図・表矩
形を垂直方向にスキャンして閾値以上の長い黒ランのみ
からなる黒連結成分に外接する矩形Vを抽出し、それぞ
れの文字以外の矩形より抽出された矩形Vの中で、当該
文字以外の矩形の左辺または右辺から所定距離範囲内で
最も左または最も右に位置し、かつ垂直罫線としての形
状条件を満足したものを架空垂直セパレータとして抽出
し、この架空垂直セパレータを文字領域を左右に区切る
垂直セパレータとして扱って、文字の矩形の統合を行な
う。
【0016】
【作用】請求項1乃至5の発明によれば、様々な文字サ
イズの文書の画像に対して、文字の矩形と、それ以外の
矩形(図表矩形)とを正確に分類できるようになるた
め、文字矩形の集合たる文字領域の抽出精度が向上す
る。
【0017】請求項4または5の発明によれば、書籍や
厚手の原稿から読み取られた文書画像に対しても、中折
れ部や周辺部に生じる黒領域の影響を排除し、文字矩
形、行または文字領域を正確に抽出することができる。
特に請求項5の発明によれば、処理しようとする文書の
文字サイズの違いに柔軟に対応したノイズ矩形除去を行
なうことができる。
【0018】請求項6乃至8の発明によれば、垂直セパ
レータで区切られた文字領域(コラム)の誤統合を防止
し、それぞれの文字領域を正しく分離できる。
【0019】請求項9または10の発明によれば、水平
セパレータで区切られた文字領域の誤統合を防止し、そ
れぞれの文字領域を正しく分離できる。
【0020】請求項11または12の発明によれば、表
やグラフの領域と、それに接近した文字領域との誤統合
を防止し、文字領域を正しく抽出できる。
【0021】以下、本発明の特徴と利点をより明確にす
るため、図面を用い様々な実施例について説明する。
【0022】
【実施例】図1は、後記実施例1乃至実施例6を説明す
るためのブロック図である。
【0023】1はスキャナによって読み取られた文書画
像を格納するための文書画像メモリである。この文書画
像の処理の対象となる領域は、文書画像全体としてもよ
いし、あるいは、文書画像をディスプレイ画面に表示し
マウス等を用いて指定した領域としてもよい。
【0024】5は入力された文書画像の黒連結成分に外
接した矩形を抽出する矩形抽出部である。ただし、矩形
抽出部5の前段に画像圧縮手段を設け、入力文書画像を
圧縮した画像(例えば8×8画素を1画素に圧縮した画
像)に対し、矩形抽出を行なってもよい。2は抽出され
た矩形の情報を記憶するための矩形メモリである。
【0025】6は矩形の高さのヒストグラムを生成する
ヒストグラム生成部、3はこのヒストグラムの情報を記
憶するためのヒストグラムメモリ、7は矩形の高さのヒ
ストグラムより標準文字サイズを決定する標準文字サイ
ズ決定部、4は決定した標準文字サイズの情報を記憶す
るための標準文字サイズ保持メモリである。
【0026】8は抽出された矩形を、文字の矩形とそれ
以外の矩形(図表の矩形)に分類する矩形分類部であ
る。9は文字矩形を統合して文字列の行を抽出する行抽
出部、12は抽出された行の情報を記憶するための行メ
モリである。10は行を統合して行の集合である文字領
域を生成する文字領域生成部、13は生成された文字領
域の情報を記憶するための領域メモリである。11は前
記各部の動作を制御する制御部である。
【0027】なお、各処理部及び制御部11は、ハード
ウエアで実現しても、コンピュータシステム上でソフト
ウエアにより実現しても、あるいはハードウエアとソフ
トウエアの組み合わせにより実現してもよい。いずれの
実現形態をとるかは、必要とされる処理速度等を考慮し
て選択すればよい。
【0028】図2は処理概要の説明図である。(a)に
示す原稿画像が入力した場合に、矩形抽出処理によって
(b)に示す矩形データが得られる。(d)は矩形デー
タを拡大して示す。この矩形データに対し、矩形統合と
行統合を行なうことによって(c)に示す行/領域デー
タが得られる。以下、このような処理の内容について実
施例毎に説明する。
【0029】実施例1 図2は矩形抽出から標準文字サイズ決定までの処理フロ
ーを示す。ステップ100は矩形抽出部5の処理で、入
力された文書画像上の黒連結を抽出し、それに外接する
矩形を抽出し、例えば矩形の左上角と右下角の座標と矩
形番号などを矩形情報として矩形メモリ2に格納する。
【0030】ステップ105はヒストグラム生成部6の
処理で、矩形メモリ2内の矩形情報をもとに矩形の高さ
(行に対して垂直方向の矩形サイズである。縦書き文書
の場合、矩形の横方向のサイズである)のヒストグラム
を生成する。このヒストグラムの例を図4に示す。
【0031】ステップ110〜115は、標準文字サイ
ズ決定部7の処理である。本実施例の場合、矩形の高さ
のヒストグラムの総度数(矩形数)をTとし、t=T/
16を算出する(ステップ110)。次に、矩形の高さ
のヒストグラムをもとに、度数がtを超える矩形高さの
中で最大の矩形高さを当該文書の標準文字サイズsiz
eとする(ステップ111〜115)。したがって、図
4の(a)に示すヒストグラムが得られた場合にはsi
ze=4に決定され、(b)に示すヒストグラムが得ら
れた場合にはsize=6に決定される。
【0032】次に、矩形分類部8によって、標準文字サ
イズsizeを基準に用いて矩形分類を行なう。例え
ば、高さ及び幅(行方向のサイズ)のいずれもが標準文
字サイズsizeの5倍を超えない矩形を文字の矩形と
して分類し、それ以上に大きな矩形を文字以外の矩形
(図・表矩形)とする。
【0033】この分類結果が本実施例の出力である。す
なわち、黒連結成分の矩形を単位として文書画像を文字
領域と図・表領域とに分割する。図2で言えば、同図
(b)の矩形データが本実施例の処理結果である。
【0034】実施例2 矩形分類部8による矩形分類までの処理は前記実施例1
と同一であるが、次に行抽出部9によって次のような行
抽出を行なう。
【0035】二つの文字矩形の距離(行方向)を求め、
この距離が標準文字サイズsize以下であれば両文字
矩形を統合する。横書き文書の場合、例えば図5に示す
文字矩形151,152の水平距離sp1を求め、sp
1≦sizeならばそれらを統合する。縦書き文書なら
ば、縦方向の距離により同様の統合を行なう。このよう
な統合処理を全部の文字矩形に対して行ない、統合され
た文字矩形群の外接矩形を文字列の行として切り出す。
図6において、153が切り出された行であり、その内
部の矩形が文字矩形である。
【0036】このように本実施例は、文字矩形を統合
し、文書画像の文字領域を行を単位として抽出するわけ
である。図2で言えば、(b)に示した矩形データに対
し文字矩形の統合により行を抽出した段階のデータが、
処理結果である。
【0037】実施例3 矩形分類の後に文字矩形を統合して行を抽出することは
前記実施例2と同様であるが、文字矩形の統合方法が異
なる。
【0038】すなわち、横書き文書の場合、例えば図6
の文字矩形161,162の重なり量sp2を測定し、
矩形高さh1,h2の小さいほうの値をhとして、sp
2≧h/2ならば文字矩形161,162を統合する。
このようにして統合した文字矩形群の外接矩形を行とし
て抽出する。
【0039】縦書き文書の場合、縦方向についての文字
矩形間の重なり量と、文字矩形の高さ(横方向の大き
さ)を用いて同様の判定を行ない統合して、行を抽出す
る。
【0040】実施例4 行抽出部9で文字矩形の統合による行抽出を行なうが、
この際に、前記実施例2における文字矩形の統合条件
と、前記実施例3における文字矩形の統合条件の両方を
満足した場合に、文字矩形の統合を行なう。
【0041】実施例5 行抽出部9により行が抽出されるまでの処理は前記実施
例2,3または4と同様である。
【0042】次に文字領域生成部10において、次に述
べるような行の統合を行なって文字領域(コラム)を生
成する。まず、pに初期値としてsizeを設定し、統
合しようとする行との距離p2がp以下のときは、その
行の統合を行なうが、p2がpを越えるときは統合を行
なわない。
【0043】行を統合した場合には、統合した行の間の
距離p1(行に対し垂直方向の距離)の1.5倍の値p
を求める(p1が一定値以下、例えば1以下の場合、p
を固定値、例えば3に設定する)。そして、次に統合し
ようとする行との距離p2がp以下のときは、その行を
統合し、pを超えるときは統合しない。
【0044】ただし、p2≦pであっても、統合した最
後の行の高さh1と次に統合しようすとする行の高さh
2の比h2/h1が、ある定数(例えば4/5)以上の
場合は統合しない。
【0045】図8は、1番目の統合条件の説明図であ
る。ただし横書き文書の場合である。行171,172
を統合し、次に行173についてp2≦pであるため、
これを統合する。これによって、文字領域174が得ら
れる。
【0046】図9は、2番目の統合条件の説明図であ
る。行181,182が統合され、次に行183を統合
する際に、h2/h1≧4/5であるため統合しない。
その結果、行181,182の文字領域186が得られ
る。この例は、文字領域186のほかに、行183のみ
の文字領域187と、行184,185を統合した文字
領域188が生成された場合である。
【0047】このように本実施例によれば、文書画像よ
り、行がまとまった文字領域を抽出することができる。
図2で言えば、(c)の行/領域データが得られる。
【0048】実施例6 文字領域生成部10は、前記実施例5と同様の行統合に
よる文字領域生成を行なうが、その統合の完璧を期する
ため、さらに次のような文字領域に対する統合処理を行
なう。
【0049】統合しようとする二つの文字領域の幅が、
両方とも標準文字サイズsizeの5倍以上の場合と、
少なくとも一方の幅が標準文字サイズsizeの5倍よ
り小さい場合とで、統合条件が異なる。
【0050】図10は、前者の場合、つまり大きい領域
同士の統合の場合の説明図である。191,192は実
施例5と同様の統合処理によって生成された文字領域で
ある。文字領域191,192の行方向の重なり量をs
p1、文字領域191の幅をw、文字領域191,19
2の距離をsp2とし、sp1≧4/5wであって、s
p2<sizeの場合、文字領域191,192を一つ
の文字領域193に統合する。
【0051】図11は、後者の小さい領域の統合の場合
の説明図である。195,196は統合しようとする文
字領域である。文字領域195,196の行方向の距離
をsp1、小さいほうの文字領域196の高さをhと
し、文字領域195,196の行に対し垂直方向の重な
り量がh/2以上で、かつsp1≦2×sizeのと
き、一つの文字領域197に統合する。
【0052】実施例7 図12は本実施例及び後記実施例8,9を説明するため
のブロック図である。ノイズ矩形除去部201が追加さ
れていることが、図1と異なる。
【0053】文書画像メモリ1に入力された文書画像の
原稿が、書籍や厚手の原稿であった場合に、原稿の中折
れ部や周辺部に黒領域もしくは黒ずんだ領域が生じるこ
とは前述した。本実施例は、このような黒領域に対応し
た図・表矩形(文字矩形以外の矩形)をノイズとして除
去するもので、そのために設けられた手段がノイズ矩形
除去部201である。
【0054】図13は、ノイズ矩形除去部201の処理
フロー図である。矩形メモリ2を参照し、矩形分類部8
によって分類後の矩形の情報を読み出し、図・表矩形
(文字矩形以外の矩形)であるか調べ(ステップ21
0)、図・表矩形であれば、処理対象領域のいずれかの
境界辺に接しているか否かを調べる(ステップ21
5)。ここで、処理対象領域は、前述のように、文書原
稿の全体または指定された領域である。境界辺に接触し
ている場合、その図・表矩形をノイズ矩形として除去す
る。除去された文字矩形は、次の行抽出の対象矩形から
除外される。
【0055】実施例8 本実施例においてもノイズ矩形除去を行なうことは前記
実施例7と同様であるが、ノイズ矩形の判定方法が多少
異なる。すなわち、図14に示すように、処理対象領域
230の境界の各辺と、図・表矩形との水平または垂直
距離が、予め定められた閾値NOISM以下であった場
合、その矩形をノイズ矩形として除去する。
【0056】図14の例では、図・表矩形231,23
2は除去される。ただし、文字矩形233は除去しな
い。なお、NOISMG=0に設定した場合、本実施例
と前記実施例7のノイズ矩形の判定除去は実質的に同一
となる。
【0057】実施例9 本実施例は前記実施例8と同様のノイズ矩形除去を行な
うが、閾値NOISMGとして、標準文字サイズsiz
eの整数倍の値を用いることが違う。このようにするこ
とで、ノイズ領域の幅を入力文書の文字サイズに応じ適
応的に変化させることができる。
【0058】図15は、後記実施例10乃至14を説明
するためのブロック図である。301は入力された文書
画像データを記憶するための文書画像メモリ、306は
入力文書画像の黒連結成分の外接矩形を抽出する矩形抽
出部、302は抽出された矩形の情報を記憶する矩形メ
モリである。
【0059】矩形抽出の処理は、前記実施例1〜9と同
様でよく、例えば文書画像をスキャンしながら接続した
黒欄の外接矩形を抽出し、これを一定距離内にあるもの
について統合することによって行なう。なお、矩形抽出
部306の前に入力文書画像の例えば8×8画素を1画
素に圧縮(縮小)する手段を設け、圧縮された画像に対
して矩形抽出を行なうようにしてもよい。
【0060】307は矩形を文字矩形と、それ以外の図
・表矩形に分類する矩形分類部である。この矩形分類の
処理は、前記実施例1乃至9と同様に、矩形の幅と高さ
を閾値と比較することによって行なうが、その際の閾値
は前記実施例1乃至9と違って予め与えられる。ただ
し、前記実施例1乃至9と同様に、例えば矩形の高さの
ヒストグラムから標準文字サイズを求め、これに適当な
係数を掛けることによって適応的に閾値を算出してもよ
い。
【0061】308は、垂直罫線(垂直セパレータ)を
識別する垂直罫線識別部である。この垂直罫線識別は、
例えば次のような処理によって行なわれる。矩形分類部
307の処理によって分類された図・表矩形(文字矩形
以外の大きな矩形)の中で、その幅(横方向の大きさ)
が所定の閾値より小さく、かつ、高さ(縦方向の大き
さ)が所定の閾値より大きい矩形を垂直罫線の候補とし
て選ぶ。次に、垂直罫線候補矩形の範囲の文書画像を垂
直方向にスキャンすることにより、所定の閾値より長い
黒ランのみを抽出し、この長い黒ランのみの連結成分の
外接矩形を抽出する。そして、この長い黒ラン連結成分
の外接矩形の長さH1、幅W1と、もとの矩形の高さ
H、幅Wとの間で、H1/H>閾値(例えば0.8)か
つW1/W>閾値(例えば0.8)であれば、長い黒ラ
ン連結成分の外接矩形を垂直罫線であると判定する。
【0062】なお、垂直罫線矩形の判定のための閾値、
及び黒ランの長さの閾値は、矩形分類の閾値と同様に適
応的に決定してもよい。特願平4−160866号の明
細書及び図面に、このような罫線抽出の方法がより詳細
に示されている。
【0063】309は文字矩形を統合して行を生成する
行抽出部であり、303は行生成の際の文字矩形の統合
判定のための閾値を記憶する統合閾値メモリである。3
04は生成された行の情報を記憶する行メモリである。
310は生成された行を統合し文字領域を生成する文字
領域生成部である。305は生成された文字領域の情報
を記憶するための領域メモリである。行統合の処理は、
前記実施例1乃至9と同様に、統合しようとする行の間
の距離と統合閾値とを比較することによって統合可否を
判定し、可能な行間を統合するという方法で行なわれる
が、この統合判定の際に、垂直罫線識別部308により
抽出された垂直罫線の有無と相対的位置関係が参照され
る。311は文字領域生成部310の行統合によって生
成された文字領域に対して、統合し切れなかった領域の
再統合を行ない文字領域を修正する文字領域修正部であ
る。312は前記各部を制御する制御部である。
【0064】以下、実施例10乃至14について個別に
説明する。ただし、文書上の行は横方向であると仮定す
る。
【0065】実施例10 矩形抽出部306での矩形抽出処理、矩形分類部307
による矩形分類処理、垂直罫線識別部308による垂直
罫線抽出に続いて、行抽出部309により行生成が行な
われる。
【0066】図16は行生成処理の概略フローを示す。
行生成の基本的な処理は、文字矩形と判定された矩形に
対し、ある注目した矩形より、他の矩形との間の水平距
離(sp1)及び垂直距離(sp2)と、予め標準文字
サイズ等から定められて統合閾値メモリ303に格納さ
れている水平統合閾値(Th1)及び垂直統合閾値(T
h2)とを比較することで、近接した矩形を統合すると
いうものであるが、図16に見られるように、垂直罫線
との関係に応じて水平統合閾値を変更する。
【0067】まず、新しい文字矩形Aを選択し(ステッ
プ360)、水平統合閾値をTh1とする(ステップ3
62)。注目した文字矩形Aより右方向へ、水平距離が
Th1以内かつ垂直距離が垂直統合閾値Th2以内の範
囲で矩形(文字矩形または垂直罫線矩形)をサーチし、
見つかった矩形が垂直罫線矩形であるか判定する(ステ
ップ364)。その矩形が文字矩形であるならば統合し
(ステップ366)、次の矩形のサーチを行なう。
【0068】文字矩形の統合を目的としているのである
から、サーチされた矩形が垂直罫線矩形である場合に
は、当然にその垂直罫線矩形との統合を行なわない。そ
して、注目している矩形Aと垂直罫線矩形とが垂直方向
で重なりがあるか調べ(ステップ368)、重なりがあ
る場合には、矩形Aと垂直罫線矩形の中心線までの距離
Th1’を水平統合閾値に設定し直し(ステップ37
0)、次の矩形のサーチを行なう。
【0069】矩形Aに関して、水平統合閾値(Th1ま
たはTh1’)以下かつ垂直統合閾値Th2以下の範囲
内に次の矩形が見つからなくなるまで処理を繰り返すと
(ステップ372)、ステップ360より別の注目矩形
に関して処理を開始する。
【0070】文字矩形の統合中に垂直罫線と遭遇する場
合の具体例を、図17により説明する。図17(a)に
おいて、矩形Aに関して、まず矩形Bが統合される。次
に矩形AからTh1以下の水平距離内に垂直罫線矩形3
80が見つかる。この垂直罫線矩形380は矩形Aと重
なりがあるので、水平統合閾値がTh1からTh1’へ
変更され、その結果、水平統合閾値がTh1であれば次
にサーチされ統合されるはずであった矩形Cは矩形Aと
の統合対象から除外される。よって、矩形A,Bからな
る行381と、垂直罫線(垂直セパレータ)により区切
られた矩形Cとが正しく分離される。
【0071】図17(b)において、矩形Aに対して矩
形Bが統合され、次に垂直罫線矩形382がサーチされ
る。しかし、この垂直罫線矩形382は矩形Aとの重な
りがないので、水平統合閾値はTh1のままである。し
たがって、次の矩形Cがサーチされて矩形Aと統合さ
れ、矩形A,B,Cからなる行383が生成される。す
なわち、この垂直罫線矩形382は、少なくとも矩形B
と矩形Cとの間の垂直セパレータではないので、その存
在を無視して文字矩形の統合を行なう。
【0072】実施例11 前記実施例10と同様に、行生成処理において、注目す
る文字矩形と重なりのある垂直罫線矩形が存在した場合
に水平統合閾値を変更するが、その変更する値の決定方
法が異なる。これ以外は前記実施例10と同様である。
【0073】図18は、水平統合閾値の変更値の決定方
法の説明図である。矩形Aの垂直方向の範囲(Ya1か
らYa2)と、垂直罫線矩形384の水平方向の範囲
(xr1からXr2)で決まるスキャン範囲385に対
して、画像を水平方向にスキャンし、あるスキャンライ
ン上の垂直罫線の存在位置(Xr3)を求め、距離(X
r3−Xa2)を変更後の水平統合閾値とする。あるい
は、全スキャンラインについて求めた垂直罫線の位置の
平均値をXr3として、(Xr3−Xra)を変更後の
水平統合閾値としてもよい。
【0074】実施例12 前記実施例10と同様に、行生成処理において、注目す
る文字矩形と重なりのある垂直罫線矩形が存在した場合
に水平統合閾値を変更するが、その変更する値の決定方
法が異なる。これ以外は前記実施例10と同様である。
【0075】図19は、水平統合閾値の変更値の決定方
法の説明図である。図19(a)及び(b)において、
θは予め測定した文書画像のスキュー角度である。この
スキュー角度の測定は、よく知られたハフ変換等の方法
によって求めてもよいし、あるいは同一行に属する文字
矩形の最大高さと行の高さの差より算出する方法などに
よってもよい。
【0076】(a)はθ≧0の場合であり、矩形Aの対
角頂点座標と垂直罫線矩形386の対角頂点座標より、
次式 Th1’={ Yr2-(Ya1+Ya2)/2 }tanθ+Xr1-Xa2 によって水平統合閾値の変更値Th1’を計算する。
【0077】(b)はθ<0の場合であり、矩形Aの対
角頂点座標と垂直罫線矩形387の対角頂点座標より、
次式 Th1’={ (Ya1+Ya2)/2-Yr1 }tanθ+Xr1-Xa2 によって水平統合閾値の変更値Th1’を計算する。
【0078】実施例13 文字矩形の統合による行生成の処理までは前記実施例1
0乃至12と同様であるが、次に文字領域生成部310
により行を統合して文字領域を生成する。この行統合に
よる文字領域生成処理のフローを図20に示す。
【0079】図20の最初のステップ400は、行生成
の段階での処理である。このステップでは、注目矩形A
に対して一定距離範囲内で右側に垂直罫線矩形が存在す
る場合(つまり、前記実施例10乃至12で行生成の際
に水平統合閾値を変更する原因となった垂直罫線が存在
する場合)に、生成した行に「右側に垂直罫線が存在す
る」ということを示すマークRを付加する(ステップ4
00)。例えば図17(a)の行381にマークRが付
けられる。
【0080】ステップ402以降が、行統合による文字
領域生成の処理である。まず、新しい行Aを選択する
(ステップ402)。この注目した行Aとの水平距離及
び垂直距離が一定値以下の行をサーチし、見つかったな
らば、その行がマークR付きの行であるか調べる(ステ
ップ404)。マークR付き行でなければ、行の統合を
行ない(ステップ406)、次の行のサーチを行なうこ
とになる。
【0081】サーチした行がマークR付き行である場
合、この行の水平方向の終点座標(Xr2)と行Aの水
平方向の終点座標(Xa2)とが、Xa2>Xr2の関
係を満たすか判定する(ステップ412)。この関係を
満たさないときは行統合を行なう(ステップ406)
が、関係を満たすときは行統合を行なわず次の行のサー
チに進む。
【0082】ステップ412の条件が満たされるために
行統合が行なわれない例を図21に示す。図21の
(a)において、行413はマークR付きであるので、
注目行A414とは統合されない。このような行41
3,414は、垂直罫線416によって区切られた別々
のコラムに属する行と看做すことができる。
【0083】図21の(b)において、マークR付き行
417と注目行A418とは統合されない。このような
行417,418は、別コラムに属するものでない可能
性もあるが、垂直罫線419との位置関係から判断する
と、統合しないのが自然である。
【0084】実施例14 前記実施例13と同様に行統合による文字領域生成まで
行なうが、統合された行にマークRが付加されている文
字領域にもマークRを付加する。そして、行統合により
生成された文字領域に対して、文字領域修正部311で
行統合と同様な処理により統合を行なうことによって、
行統合では統合しきれなかった領域の再統合を行なう。
この再統合の際、統合しようとする文字領域がマークR
付きであるか調べ、マークR付きの場合は前記実施例1
3の行統合の際と同様に、マークR付き領域の水平方向
の終点座標Xr2と、注目している文字領域の水平方向
の終点座標Xa2とが、Xa2>Xr2の関係にあると
きには統合しない(図21参照)。
【0085】図22は、後記実施例15乃至18を説明
するためのブロック図である。501は入力された文書
画像データを記憶するための文書画像メモリ、506は
入力文書画像の黒連結成分の外接矩形を抽出する矩形抽
出部、502は抽出された矩形の情報を記憶する矩形メ
モリである。矩形抽出の処理は、入力文書画像を圧縮し
た画像に対して行なうようにしてもよい。507は矩形
を文字矩形と、それ以外の図・表矩形に分類する矩形分
類部である。この矩形分類の処理は、前記実施例10乃
至14または前記実施例1乃至9と同様でよい。
【0086】808は、水平罫線(水平セパレータ)を
識別する水平罫線識別部である。この水平罫線識別は、
例えば次のような処理によって行なわれる。矩形分類部
507の処理によって図・表矩形(文字矩形以外の矩
形)と分類された矩形の中で、その高さ(縦方向の大き
さ)が所定の閾値より小さく、かつ、幅(縦方向の大き
さ)が所定の閾値より大きい矩形を水平罫線の候補とし
て選ぶ。次に、水平罫線候補矩形の範囲の文書画像を水
平方向にスキャンすることにより、所定の閾値より長い
黒ランのみを抽出し、この長い黒ランのみの連結成分の
外接矩形を抽出する。そして、この長い黒ラン連結成分
の外接矩形の高さH1、幅W1と、もとの矩形の高さ
H、幅Wとの間で、H1/H>閾値(例えば0.8)か
つW1/W>閾値(例えば0.8)であれば、長い黒ラ
ン連結成分の外接矩形を水平罫線であると判定する。な
お、水平罫線矩形の判定のための閾値、及び黒ランの長
さの閾値は、矩形分類の閾値と同様に適応的に決定して
もよい。
【0087】509は文字矩形の水平及び垂直方向の距
離に関し統合閾値によって統合判定を行ない、統合条件
を満たす文字矩形を統合して行を生成する行抽出部であ
る。ただし、水平罫線識別部508で抽出された水平罫
線の矩形も、架空の行として抽出する。統合閾値は予め
与えられるか、あるいは矩形の高さのヒストグラム等に
基づいて適応的に決定される。503は抽出された行の
情報を記憶する行メモリである。
【0088】510は生成された行を統合し文字領域を
生成する文字領域生成部である。505は生成された文
字領域の情報を記憶するための領域メモリである。行統
合の処理は、統合しようとする行間の距離と統合閾値と
を比較することによって統合可否を判定し、可能な行間
を統合するという方法で行なわれるが、この統合判定の
際に水平罫線識別部508により抽出された水平罫線の
存在に応じて統合閾値が変更される。504は行統合の
ための統合閾値が格納される統合閾値メモリである。5
11は文字領域生成部510の行統合によって生成され
た文字領域に対して、統合し切れなかった領域の再統合
を行ない文字領域を修正する文字領域修正部である。5
12は前記各部を制御する制御部である。
【0089】以下、実施例15乃至18について個別に
説明する。ただし、文書上の行は横方向であると仮定す
る。
【0090】実施例15 矩形抽出部506での矩形抽出、矩形分類部507によ
る矩形分類、水平罫線識別部508による垂直罫線抽
出、行抽出部509による行抽出に続いて、文字領域生
成部510による文字領域生成が行なわれる。
【0091】図23は文字領域生成処理の概略フローを
示す。文字領域生成の基本的な処理は、注目した行と他
の行間の水平距離(p1)及び垂直距離(p2)と、予
め標準文字サイズ等から定められて統合閾値メモリ30
3に格納されている水平統合閾値(Th1)及び垂直統
合閾値(Th2)とを比較し、統合閾値より近接した矩
形を統合するというものであるが、図23に示すよう
に、水平罫線たる架空行に関連して垂直統合閾値の変更
操作が行なわれる。
【0092】すなわち、新しい行Aを選択し(ステップ
520)、垂直統合閾値をTh2とする(ステップ52
2)。注目した行Aより下へ向かって、垂直距離が垂直
統合閾値Th2以内かつ水平距離が水平統合閾値Th1
以内の範囲で、行(水平罫線矩形も架空行として含め
る)をサーチし、見つかった行が水平罫線であるか判定
する(ステップ524)。その行が本来の行である場合
には、注目行Aと統合し(ステップ526)、次の行の
サーチを行なう。
【0093】サーチされた行が水平罫線(架空行)であ
る場合には、当然にその水平罫線との統合を行なわな
い。そして、注目している行Aと水平罫線とが水平方向
に重なりを持っているか調べ(ステップ530)、重な
りがある場合には、注目している行Aから水平罫線の中
心線までの距離Th2’を、垂直統合閾値に設定し直し
(ステップ532)、次の矩形のサーチを行なう。
【0094】行Aに関して、垂直統合閾値(Th1また
はTh1’)以下の垂直距離範囲内に次の行が見つから
なくなるまで処理を繰り返すと(ステップ526)、ス
テップ520より別の注目行に関して処理を開始する。
【0095】水平罫線が存在する場合の具体例を図24
により説明する。図24の(a)において、行Aに関す
る行統合中に水平罫線542と遭遇した場合、この水平
罫線542は行Aと重なりがあるので、垂直統合閾値は
Th2からTh2’へ変更される結果、垂直統合閾値が
Th2であれば次にサーチされ統合されるはずであった
行B543は、行Aと統合されなくなる。よって、行A
を含む文字領域544と、水平罫線(水平セパレータ)
542により区切られた行B543とが正しく分離され
る。
【0096】図24の(b)において、行Aに関して水
平罫線546がサーチされる。しかし、この水平罫線5
46は、水平方向について注目行A540と重なりを持
たないため、垂直統合閾値はTh2のままである。した
がって、次の行B543がサーチされて行A540と統
合され、行A540及び行B543を含む文字領域54
8が生成される。すなわち、この水平罫線546は、少
なくとも行A540と行B543との間の水平セパレー
タではないので、その存在を無視して行統合が行なわれ
る。
【0097】実施例16 前記実施例15と同様に、文字領域生成(行統合)の処
理において、注目する行と重なりのある水平罫線が存在
した場合に垂直統合閾値を変更するが、その変更する値
の決定方法が異なる。これ以外は前記実施例15と同様
である。
【0098】図25は、垂直統合閾値の変更値の決定方
法の説明図である。注目している行A550の水平方向
の範囲(Xa1からXa2)と、水平罫線の矩形551
の垂直方向の範囲(Yr1からYr2)で決まるスキャ
ン範囲552に対して、画像を垂直方向にスキャンし、
あるスキャンライン上の水平罫線の存在位置(Yr3)
を求め、距離(Yr3−Ya2)を変更後の垂直統合閾
値とする。あるいは、全スキャンラインについて求めた
水平罫線の位置の平均値をYr3として、(Yr3−Y
ra)を変更後の垂直統合閾値としてもよい。
【0099】実施例17 前記実施例15と同様に、文字領域成処理において、注
目する行Aと重なりのある水平罫線が存在した場合に垂
直統合閾値を変更するが、その変更する値の決定方法が
異なる。これ以外は前記実施例15と同様である。
【0100】図26は、垂直統合閾値の変更値の決定方
法の説明図である。図26(a)及び(b)において、
θは予め測定した文書画像のスキュー角度である。この
スキュー角度の測定は、前記実施例12において述べた
ような方法で行なえばよい。 (a)はθ≧0の場合であり、注目矩形A553の対角
頂点座標と水平罫線の矩形554の対角頂点座標より、
次式 Th2’={ (Xa1+Xa2)/2-Xr1 }tanθ+Yr1−Ya2 によって垂直統合閾値の変更値Th2’を計算する。
【0101】(b)はθ<0の場合であり、矩形A55
3の対角頂点座標と水平罫線矩形555の対角頂点座標
より、次式 Th2’={ Xr2−(Xa1+Xa2)/2 }t
anθ+Yr1-Ya2 によって垂直統合閾値の変更値Th2’を計算する。
【0102】実施例18 行統合による文字領域生成までの処理は前記実施例15
乃至17と同様であるが、次に文字領域修正部511に
より統合しきれなかった文字領域の再統合の処理を行な
う。この処理の概略フローを図27に示す。
【0103】図27の最初のステップ560は、行統合
の段階での処理である。このステップでは、注目行Aに
対して一定距離範囲内で下側に水平罫線が存在する場
合、生成した文字領域に「下側に水平罫線が存在する」
ということを示すマークRを付加する(ステップ56
2)。例えば図24(a)の文字領域544にマークR
が付けられる。
【0104】ステップ562以降が、文字領域再統合の
処理である。まず、新しい文字領域Aを選択する(ステ
ップ562)。この注目文字領域Aとの水平距離及び垂
直距離が一定値以下の文字領域をサーチし、見つかった
ならば、その文字領域がマークR付きの領域であるか調
べる(ステップ563)。マークR付き行でなければ、
統合を行ない(ステップ564)、次の文字領域のサー
チを行なうことになる。
【0105】サーチした文字領域がマークR付き領域で
ある場合、この文字領域の垂直方向の終点座標(Yr
2)と文字領域Aの垂直方向の終点座標(Ya2)と
が、Ya2>Yr2の関係を満たすか判定する(ステッ
プ567)。この関係を満たさないときは統合を行なう
(ステップ564)が、関係を満たすときは統合を行な
わず次の文字領域のサーチに進む。
【0106】ステップ567の条件が満たされるために
統合が行なわれない例を図28に示す。文字領域569
はマークR付きであるので、注目文字領域A568とは
統合されない。このような文字領域は、水平罫線によっ
て区切られた別々の領域と看做すことができる。
【0107】図32は後記実施例19の説明のための図
である。図32の(a)は入力される文書の例を示す。
この文書において、660は縦横罫線で囲まれた表の領
域、661はグラフの領域、網掛けされた部分は文字領
域(一つ以上の文字あるいは行からなる領域)である。
【0108】従来、この文書の文字領域抽出を行なった
場合、図32(b)に示すように、グラフ領域661や
表領域660と、それに近接した文字領域とが誤って統
合されてしまいやすい。
【0109】後記実施例19によれば、このような文字
領域の誤統合を防止することによって、図32(a)の
文書に対して図32(c)に示すような領域分割が可能
となる。すなわち、後記実施例19によれば、図32
(c)に見られるように、グラフ領域661の最下部の
水平罫線663と表領域660の最上部の水平罫線66
4を、文字領域(コラム)の区切りのための架空の水平
セパレータとして認識することによって、それを境に上
下の文字領域を分離する。
【0110】また、後記実施例20によれば、垂直方向
の架空セパレータを認識することによって、垂直方向に
近接した図・表領域と文字領域との誤統合を防止する。
【0111】図29は、後記実施例19及び20を説明
するためのブロック図である。図29において、601
は入力された文書画像データを記憶するための文書画像
メモリ、606は入力文書画像の黒連結成分の外接矩形
を抽出する矩形抽出部、602は抽出された矩形の情報
を記憶する矩形メモリである。607は抽出した矩形を
文字矩形と、それ以外のグラフや表などの大きな矩形に
分類する矩形分類部である。この分類結果の情報も矩形
メモリ602に記憶される。
【0112】608は、図・表矩形より水平罫線または
垂直罫線を抽出する罫線抽出部である。603は抽出さ
れた罫線の情報を記憶する罫線メモリである。609は
抽出された水平または垂直罫線が水平または垂直の架空
セパレータとして妥当であるか判定する架空セパレータ
検定部であり、604は架空セパレータの情報を記憶す
る架空セパレータメモリである。610は文字領域の生
成を行なう文字領域生成部であり、文字領域生成のため
の領域統合の際に架空セパレータを実際のセパレータと
して利用する。605は生成された文字領域の情報を記
憶する領域メモリである。611は以上の各部を制御す
る制御部である。
【0113】以下、実施例19及び20を個別に説明す
る。
【0114】実施例19 図30は架空セパレータを抽出するための処理の概略フ
ローを示す。矩形抽出部606によって抽出された矩形
の中から、幅(水平方向の大きさ)Wと高さHが、W>
LARGEHTHかつH>LARGEVTHの矩形
(1)を選ぶ(ステップ620,621)。これは矩形
分類部607の処理である。この矩形(1)は、図32
(a)に示した文書の表領域660やグラフ領域661
のような文字以外の大きな領域に相当するものである。
なお、閾値LARGEHTH及びLARGEVTHは、
予め与えられた値であるか、あるいは、矩形の高さのヒ
ストグラム等から適応的に決定した値である。
【0115】次に、矩形(1)に対して罫線抽出部60
8で水平罫線の抽出を行なう(ステップ622)。具体
的には、矩形(1)の占める画像の範囲について水平方
向にスキャンして黒ランを検出し、閾値RUNHTH以
上の長さの黒ランを抽出し、この長い黒ランのみの連結
成分に外接した矩形(2)を水平罫線として抽出する。
この際、矩形(2)の幅W1と高さH1も抽出される。
抽出された矩形(2)の情報は罫線矩形メモリ603に
格納される。前記表領域660のような複数の水平罫線
を含む矩形(1)では、複数の矩形(2)が抽出される
ことになる。閾値RUNHTHは予め与えた値である
か、あるいは矩形の高さのヒストグラム等から適応的に
決定された値である。
【0116】次に、架空セパレータ検定部609におい
て、矩形(1)より抽出された水平罫線矩形(2)につ
いて架空水平セパレータとして妥当であるか検定する
(ステップ623,624)。次のa〜cの条件を全て
満足する矩形(2)は架空水平セパレータであると判定
され、その情報が架空セパレータメモリ604に格納さ
れる。
【0117】a)W1/W>閾値(例えば0.8) (ただし、Wは元の矩形(1)の幅) b)H1>閾値RLHeightTH (RLHeightTHは、予め与えられた値である
か、あるいHから自動的に決定される値) c)矩形(2)がupperまたはlowerである。
【0118】条件c)について、図31により説明す
る。図31(a)は矩形(1)としての表領域の一例を
示す。(b)はupperとlowerの説明図であ
り、630〜632は水平罫線の矩形(2)を示す。矩
形(1)の上辺よりある範囲RangeUTH内で最も
上にある矩形(2)がupperである。つまり、この
例では矩形630がupperである。また、矩形
(1)の下辺よりある範囲RangeLTH内で最も下
にある矩形(2)がlowerである。この例では、矩
形632がlowerである。
【0119】文字領域生成部610においては、以上の
ような処理により抽出された架空水平セパレータを前記
実施例15乃至18における水平罫線(水平セパレー
タ)と同じものとして扱って、前記実施例15乃至18
と同様の処理により文字矩形の統合を行なって文字領域
を生成し、生成した文字領域の情報を領域メモリ605
に格納する。
【0120】実施例20 本実施例では、垂直方向の架空セパレータを抽出する。
すなわち、架空セパレータの抽出処理の全体的フローは
図23のように示されるが、セパレータの方向の違いに
応じてステップ622〜625の内容が変更される。
【0121】すなわち、ステップ622において、文字
以外の大きな矩形(1)の範囲内のの画像を垂直方向に
スキャンして黒ランを検出し、閾値RUNTH以上の長
さの黒ランのみの連結成分に外接する矩形(2)を抽出
する。つまり、垂直罫線の矩形を抽出する。
【0122】ステップ623〜625で、矩形(1)よ
り抽出された全ての垂直罫線たる矩形(2)に対して、
架空垂直セパレータとしての妥当性を検定する。次のd
〜fの全ての条件を満足する矩形(2)を架空垂直セパ
レータと判定する。
【0123】d)H1/H>閾値(例えば0.8) (ただし、Hは元の矩形(1)の高さ) e)W1>閾値RLWidthTH (RLWidthは、予め与えた値であるか、あるいは
適応的に決定される値) f)矩形(2)がleftまたはrithtである。
【0124】条件f)について、図31により説明す
る。図31(c)はleftとrightの説明図であ
り、634〜636は垂直罫線の矩形(2)を示す。矩
形(1)の左辺よりある範囲RangeLTH内で最も
左にある矩形(2)がleftである。この例では矩形
634がleftである。また、矩形(1)の右辺より
ある範囲RangeRTH内で最も右にある矩形(2)
がrightである。この例では、矩形635がrig
htである。
【0125】文字領域生成部610においては、以上の
ような処理により抽出された架空垂直セパレータを前記
実施例10乃至14における垂直罫線(垂直セパレー
タ)と同じものとして扱って、前記実施例10乃至14
と同様の処理により文字矩形の統合を行なって文字領域
を生成し、生成した文字領域の情報を領域メモリ605
に格納する。
【0126】
【発明の効果】請求項1乃至5の発明によれば、様々な
文字サイズの文書の画像に対して、文字の矩形と、それ
以外の矩形(図表矩形)とを正確に分類できるようにな
るため、文字矩形の集合たる文字領域の抽出精度が向上
する。請求項4または5の発明によれば、書籍や厚手の
原稿から読み取られた文書画像に対しても、中折れ部や
周辺部に生じる黒領域の影響を排除し、文字矩形、行ま
たは文字領域を正確に抽出することができる。
【0127】請求項6乃至10の発明によれば、垂直セ
パレータまたは水平セパレータで区切られた文字領域
(コラム)の誤統合を防止し、それぞれの文字領域を正
しく分離できる。また、処理内容も簡便であって処理の
高速化が容易であり、さらに処理のために必要なメモリ
量も少なくて済む。
【0128】請求項11または12の発明によれば、表
やグラフの領域と、それに接近した文字領域との誤統合
を防止し、領域分割の精度を大幅に向上できる。
【図面の簡単な説明】
【図1】実施例1乃至実施例6の説明のためのブロック
図である。
【図2】(a)乃至(d)処理概要の説明のための図で
ある。
【図3】実施例1の矩形抽出から標準文字サイズ決定ま
での処理フロー図である。
【図4】(a)及び(b)矩形の高さのヒストグラムの
例を示す図である。
【図5】実施例2における文字矩形統合の説明図であ
る。
【図6】文字矩形の統合により抽出された行を示す図で
ある。
【図7】実施例3における文字矩形統合による行抽出の
説明図である。
【図8】実施例5における行統合による文字領域抽出の
説明図である。
【図9】実施例5における行統合による文字領域抽出の
説明図である。
【図10】実施例6における大きな文字領域の統合の説
明図である。
【図11】実施例6における小さな文字領域の統合の説
明図である。
【図12】実施例7乃至実施例9の説明のためのブロッ
ク図である。
【図13】実施例7におけるノイズ矩形除去処理のフロ
ー図である。
【図14】実施例8及び実施例9におけるノイズ矩形除
去の説明図である。
【図15】実施例10乃至実施例14の説明のためのブ
ロック図である。
【図16】実施例16における行生成処理のフロー図で
ある。
【図17】(a)及び(b)実施例10における行統合
と垂直罫線との関係の説明図である。
【図18】実施例11における垂直罫線までの距離の求
め方の説明図である。
【図19】(a)及び(b)実施例12における垂直罫
線までの距離の求め方の説明図である。
【図20】実施例13における行統合処理のフロー図で
ある。
【図21】(a)及び(b)実施例13における行統合
の説明図である。
【図22】実施例15乃至実施例18の説明のためのブ
ロック図である。
【図23】実施例15における行統合処理のフロー図で
ある。
【図24】(a)及び(b)実施例15における行統合
と水平罫線との関係の説明図である。
【図25】実施例16における水平罫線までの距離の求
め方の説明図である。
【図26】(a)及び(b)実施例17における水平罫
線までの距離の求め方の説明図である。
【図27】実施例18における文字領域再統合処理のフ
ロー図である。
【図28】実施例18における文字領域再統合の説明図
である。
【図29】実施例19及び実施例20の説明のためのブ
ロック図である。
【図30】実施例19における架空水平セパレータの抽
出処理のフロー図である。
【図31】(a)乃至(c)実施例19及び実施例20
における架空セパレータ抽出の説明図である。
【図32】(a)乃至(c)実施例19による文字領域
の誤統合の防止の説明図である。
【符号の説明】
1,301,501,601 文書画像メモリ 2,302,502,602 矩形メモリ 3 ヒストグラムメモリ 4 標準文字サイズ保持メモリ 5,306,506,606 矩形抽出部 6 ヒストグラム生成部 7 標準文字サイズ決定部 8,307,507,607 矩形分類部 9,309,509 行抽出部 10,310,510 文字領域生成部 11,312,512,611 制御部 12,304,503 行メモリ 13,305,505,605 領域メモリ 201 ノイズ矩形除去部 303,504 統合閾値メモリ 308 垂直罫線識別部 311,211 文字領域修正部 508 水平罫線識別部 603 罫線メモリ 604 架空セパレータメモリ 608 罫線抽出部 609 架空セパレータ検定部 610 文字領域生成部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文書画像より黒連結成分に外接した矩形
    を抽出し、抽出した矩形の高さのヒストグラムより標準
    文字サイズを決定し、抽出した矩形を、その大きさと標
    準文字サイズとの大小関係に基づいて、文字の矩形とそ
    れ以外の矩形とに分類することを特徴とする領域分割方
    法。
  2. 【請求項2】 文書画像より黒連結成分に外接した矩形
    を抽出し、抽出した矩形の高さのヒストグラムより標準
    文字サイズを決定し、抽出した矩形を、その大きさと標
    準文字サイズとの大小関係に基づいて、文字の矩形とそ
    れ以外の矩形とに分類し、文字の矩形を統合し文字列の
    行を抽出することを特徴とする領域分割方法。
  3. 【請求項3】 文書画像より黒連結成分に外接した矩形
    を抽出し、抽出した矩形の高さのヒストグラムより標準
    文字サイズを決定し、抽出した矩形を、その大きさと標
    準文字サイズとの大小関係に基づいて、文字の矩形とそ
    れ以外の矩形とに分類し、文字の矩形を統合し文字列の
    行を抽出し、抽出した行を統合して行の集合である文字
    領域を抽出することを特徴とする領域分割方法。
  4. 【請求項4】 請求項1,2または3記載の領域分割方
    法において、文書画像の処理対象領域の境界からの距離
    がある閾値以下の文字以外の矩形をノイズとして除去す
    ることを特徴とする領域分割方法。
  5. 【請求項5】 請求項4記載の領域分割方法において、
    閾値を標準文字サイズに応じて変化させることを特徴と
    する領域分割方法。
  6. 【請求項6】 文書画像より、文字に対応した黒連結成
    分に外接した矩形を抽出し、抽出した文字の矩形の統合
    により行を生成する領域分割方法において、 文書画像より垂直罫線を抽出し、 ある注目した矩形より矩形の統合を行なう際に、当該注
    目矩形との水平距離が水平方向の統合条件である矩形間
    距離の閾値より小さく、かつ、当該注目矩形と垂直方向
    の重なりを持つ垂直罫線と遭遇した場合、当該注目領域
    に関し、水平方向の統合条件である矩形間距離の閾値
    を、当該注目矩形と当該垂直罫線との水平距離に対応し
    た値に変更することを特徴とする領域分割方法。
  7. 【請求項7】 文書画像より、文字に対応した黒連結成
    分に外接した矩形を抽出し、抽出した文字の矩形の統合
    により行を生成し、生成した行の統合により文字領域を
    生成する領域分割方法において、 文書画像より垂直罫線を抽出し、 ある注目した矩形より矩形の統合を行なう際に、当該注
    目矩形との水平距離が水平方向の統合条件である矩形間
    距離の閾値より小さく、かつ、当該注目矩形と垂直方向
    の重なりを持つ垂直罫線と遭遇した場合、当該注目領域
    に関し、水平方向の統合条件である矩形間距離の閾値
    を、当該注目矩形と当該垂直罫線との水平距離に対応し
    た値に変更し、 ある注目した行より行の統合を行なう際に、統合しよう
    とする行が、その生成時に垂直罫線との遭遇により水平
    統合条件たる矩形間距離の閾値を変更したものである場
    合、当該統合しようとする行の水平方向の終点座標より
    当該注目行の水平方向の終点座標が大きいときには、当
    該統合しようとする行の統合を禁止することを特徴とす
    る領域分割方法。
  8. 【請求項8】 請求項7記載の領域分割方法において、
    行統合により生成された文字領域について注目した文字
    領域より文字領域の再統合を行ない、その際に、統合し
    ようとする文字領域内の行の中に、その生成時に垂直罫
    線との遭遇により水平方向の統合条件たる矩形間距離の
    閾値を変更した行が含まれている場合、当該統合しよう
    とする文字領域の水平方向の終点座標より当該注目文字
    領域の水平方向の終点座標が大きいときには、当該統合
    しようとする文字領域の統合を禁止することを特徴とす
    る領域分割方法。
  9. 【請求項9】 文書画像より、文字に対応した黒連結成
    分に外接した矩形を抽出し、抽出した文字の矩形の統合
    により行を生成し、生成した行の統合により文字領域を
    生成する領域分割方法において、 文書画像より水平罫線を抽出し、 ある注目した行より行の統合を行なう際に、当該注目行
    との垂直距離が垂直方向の統合条件である行間距離の閾
    値より小さく、かつ、当該注目行と水平方向の重なりを
    持つ水平罫線と遭遇した場合、当該注目行に関し、垂直
    方向の統合条件である行間距離の閾値を、当該注目行と
    当該水平罫線との垂直距離に対応した値に変更すること
    を特徴とする領域分割方法。
  10. 【請求項10】 請求項9記載の領域分割方法におい
    て、行統合により生成された文字領域について注目した
    文字領域より文字領域の再統合を行ない、その際に、統
    合しようとする文字領域内の行の中に、その生成時に水
    平罫線との遭遇により垂直方向の統合条件たる行間距離
    の閾値を変更した行が含まれている場合、当該統合しよ
    うとする文字領域の垂直方向の終点座標より当該注目文
    字領域の垂直方向の終点座標が大きいときには、当該統
    合しようとする文字領域の統合を禁止することを特徴と
    する領域分割方法。
  11. 【請求項11】 文書画像より、文字に対応した黒連結
    成分に外接した矩形を抽出し、抽出した文字の矩形の統
    合により文字領域を生成する領域分割方法において、 文書画像より文字以外の大きな黒連結成分に外接した矩
    形を抽出し、 抽出した文字以外の矩形を水平方向にスキャンして閾値
    以上の長い黒ランのみからなる黒連結成分に外接する矩
    形Hを抽出し、 それぞれの文字以外の矩形より抽出された矩形Hの中
    で、当該文字以外の矩形の上辺または下辺から所定距離
    範囲内で最も上または最も下に位置し、かつ水平罫線と
    しての形状条件を満足したものを架空水平セパレータと
    して抽出し、 文字の矩形の統合による文字領域の生成の際に、架空水
    平セパレータを文字領域を上下に区切る水平セパレータ
    として扱うことを特徴とする領域分割方法。
  12. 【請求項12】 文書画像より、文字に対応した黒連結
    成分に外接した矩形を抽出し、抽出した文字の矩形の統
    合により文字領域を生成する領域分割方法において、 文書画像より文字以外の大きな黒連結成分に外接した矩
    形を抽出し、 抽出した文字以外の矩形を垂直方向にスキャンして閾値
    以上の長い黒ランのみからなる黒連結成分に外接する矩
    形Vを抽出し、 それぞれの文字以外の矩形より抽出された矩形Vの中
    で、当該文字以外の矩形の左辺または右辺から所定距離
    範囲内で最も左または最も右に位置し、かつ垂直罫線と
    しての形状条件を満足したものを架空垂直セパレータと
    して抽出し、 文字の矩形の統合による文字領域の生成の際に、架空垂
    直セパレータを文字領域を左右に区切る垂直セパレータ
    として扱うことを特徴とする領域分割方法。
JP26731392A 1991-11-29 1992-10-06 領域分割方法 Expired - Lifetime JP3278471B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP26731392A JP3278471B2 (ja) 1991-11-29 1992-10-06 領域分割方法
US08/396,585 US5757957A (en) 1991-11-29 1995-03-01 Apparatus and method for area separation for image, having improved separation accuracy

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP3-341889 1991-11-29
JP34188991 1991-11-29
JP26731392A JP3278471B2 (ja) 1991-11-29 1992-10-06 領域分割方法

Publications (2)

Publication Number Publication Date
JPH05233873A true JPH05233873A (ja) 1993-09-10
JP3278471B2 JP3278471B2 (ja) 2002-04-30

Family

ID=26547815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26731392A Expired - Lifetime JP3278471B2 (ja) 1991-11-29 1992-10-06 領域分割方法

Country Status (2)

Country Link
US (1) US5757957A (ja)
JP (1) JP3278471B2 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09134406A (ja) * 1995-09-06 1997-05-20 Fujitsu Ltd 文書画像からのタイトル抽出装置および方法
JP2000306041A (ja) * 1999-04-23 2000-11-02 Ricoh Co Ltd 文字サイズ推定方法および記録媒体
US6282314B1 (en) 1994-09-08 2001-08-28 Canon Kabushiki Kaisha Image processing method and apparatus which iteratively divides image data into sub-regions
EP0924639A3 (en) * 1997-12-19 2001-11-28 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
EP0854434B1 (en) * 1996-12-20 2003-07-02 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2008009531A (ja) * 2006-06-27 2008-01-17 Canon Inc 画像処理装置、画像処理方法及びプログラム
EP2001216A1 (en) * 2007-06-08 2008-12-10 Ricoh Company, Ltd. Security encoding unit and image forming apparatus including same
US7508988B2 (en) 2004-03-09 2009-03-24 Ricoh Company, Ltd. Method, program and apparatus for image processing capable of effectively performing image transmission, and a medium storing the program
US7995869B2 (en) 2006-05-02 2011-08-09 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information storing medium
US8027061B2 (en) 2007-05-15 2011-09-27 Ricoh Company, Ltd. Security encoding unit and image forming apparatus including same
US8125683B2 (en) 2005-06-01 2012-02-28 Ricoh Company, Ltd. Image preview processing apparatus, image preview processing method, and image preview computer product
US8391606B2 (en) 2010-05-24 2013-03-05 Fuji Xerox Co., Ltd. Image processing device, image processing method, and computer readable medium
JP2013529818A (ja) * 2010-07-06 2013-07-22 アマラル レゼンデ マルセロ 光学ペンを用いた絶対位置およびその他情報のためのドットコードパターン、ドットコード印刷方法、ドットコード読み取り方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2171432T3 (es) * 1993-12-10 2002-09-16 Ricoh Kk Aparato y metodos para reconocer una imagen especifica a partir de una señal de imagen de entrada.
EP0692767B1 (en) * 1994-07-13 2003-10-08 Canon Kabushiki Kaisha Image processing apparatus and method
US6327387B1 (en) 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images
US6298173B1 (en) 1997-10-03 2001-10-02 Matsushita Electric Corporation Of America Storage management system for document image database
US6327388B1 (en) 1998-08-14 2001-12-04 Matsushita Electric Industrial Co., Ltd. Identification of logos from document images
JP2001016623A (ja) * 1999-06-30 2001-01-19 Agilent Technologies Japan Ltd 撮像素子の試験方法
JP2004164551A (ja) * 2002-06-24 2004-06-10 Ricoh Co Ltd データ記録体、記録媒体読取装置および記録媒体読取方法
JP2005073015A (ja) * 2003-08-26 2005-03-17 Canon Inc 画像処理装置及び画像処理方法及びコンピュータプログラム
US7602995B2 (en) * 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
JP4598426B2 (ja) * 2004-03-30 2010-12-15 富士通株式会社 境界抽出方法、プログラムおよびこれを用いた装置
US8411970B2 (en) 2010-03-16 2013-04-02 Pixia Corp. Method and system for determining statistical data for image pixels having a higher bit depth per band
US8837830B2 (en) * 2012-06-12 2014-09-16 Xerox Corporation Finding text in natural scenes
WO2018003074A1 (ja) * 2016-06-30 2018-01-04 楽天株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
US20230094787A1 (en) * 2021-09-30 2023-03-30 Adobe Inc. Utilizing machine-learning based object detection to improve optical character recognition

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55162177A (en) * 1979-05-31 1980-12-17 Matsushita Electric Ind Co Ltd Picture extraction system
DE3107521A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
EP0358815B1 (en) * 1988-09-12 1993-05-26 Océ-Nederland B.V. System and method for automatic segmentation
JP2939985B2 (ja) * 1989-03-27 1999-08-25 松下電器産業株式会社 画像処理装置
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
JPH03126181A (ja) * 1989-10-11 1991-05-29 Oki Electric Ind Co Ltd 文書画像の領域分割方法
US5050222A (en) * 1990-05-21 1991-09-17 Eastman Kodak Company Polygon-based technique for the automatic classification of text and graphics components from digitized paper-based forms
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282314B1 (en) 1994-09-08 2001-08-28 Canon Kabushiki Kaisha Image processing method and apparatus which iteratively divides image data into sub-regions
JPH09134406A (ja) * 1995-09-06 1997-05-20 Fujitsu Ltd 文書画像からのタイトル抽出装置および方法
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
US6917706B2 (en) 1996-12-20 2005-07-12 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7039235B1 (en) 1996-12-20 2006-05-02 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6975762B2 (en) 1996-12-20 2005-12-13 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6928188B2 (en) 1996-12-20 2005-08-09 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
EP0854434B1 (en) * 1996-12-20 2003-07-02 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6754385B2 (en) 1996-12-20 2004-06-22 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
EP1265188A1 (en) * 1997-12-19 2002-12-11 Fujitsu Limited Pattern extraction apparatus and method
US6563949B1 (en) 1997-12-19 2003-05-13 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
EP0924639A3 (en) * 1997-12-19 2001-11-28 Fujitsu Limited Character string extraction apparatus and pattern extraction apparatus
JP2000306041A (ja) * 1999-04-23 2000-11-02 Ricoh Co Ltd 文字サイズ推定方法および記録媒体
US7508988B2 (en) 2004-03-09 2009-03-24 Ricoh Company, Ltd. Method, program and apparatus for image processing capable of effectively performing image transmission, and a medium storing the program
US8125683B2 (en) 2005-06-01 2012-02-28 Ricoh Company, Ltd. Image preview processing apparatus, image preview processing method, and image preview computer product
US7995869B2 (en) 2006-05-02 2011-08-09 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information storing medium
JP2008009531A (ja) * 2006-06-27 2008-01-17 Canon Inc 画像処理装置、画像処理方法及びプログラム
US8027061B2 (en) 2007-05-15 2011-09-27 Ricoh Company, Ltd. Security encoding unit and image forming apparatus including same
EP2001216A1 (en) * 2007-06-08 2008-12-10 Ricoh Company, Ltd. Security encoding unit and image forming apparatus including same
US8391606B2 (en) 2010-05-24 2013-03-05 Fuji Xerox Co., Ltd. Image processing device, image processing method, and computer readable medium
JP2013529818A (ja) * 2010-07-06 2013-07-22 アマラル レゼンデ マルセロ 光学ペンを用いた絶対位置およびその他情報のためのドットコードパターン、ドットコード印刷方法、ドットコード読み取り方法

Also Published As

Publication number Publication date
US5757957A (en) 1998-05-26
JP3278471B2 (ja) 2002-04-30

Similar Documents

Publication Publication Date Title
JP3278471B2 (ja) 領域分割方法
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
US5410611A (en) Method for identifying word bounding boxes in text
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US5539841A (en) Method for comparing image sections to determine similarity therebetween
Kise et al. Segmentation of page images using the area Voronoi diagram
EP0621554B1 (en) Method and apparatus for automatic determination of text line, word and character cell spatial features
US5465304A (en) Segmentation of text, picture and lines of a document image
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPH0620092A (ja) 文書画像の領域識別方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US20160180163A1 (en) Method for segmenting text words in document images using vertical projections of center zones of characters
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JP3285686B2 (ja) 領域分割方法
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP3187895B2 (ja) 文字領域抽出方法
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3019897B2 (ja) 行切出し方法
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH0916713A (ja) 画像領域分割方法
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH0728934A (ja) 文書画像処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080215

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090215

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100215

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120215

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130215

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130215

Year of fee payment: 11