JPH0773271A - 領域分割方法 - Google Patents
領域分割方法Info
- Publication number
- JPH0773271A JPH0773271A JP5331252A JP33125293A JPH0773271A JP H0773271 A JPH0773271 A JP H0773271A JP 5331252 A JP5331252 A JP 5331252A JP 33125293 A JP33125293 A JP 33125293A JP H0773271 A JPH0773271 A JP H0773271A
- Authority
- JP
- Japan
- Prior art keywords
- rectangle
- character
- line
- rectangles
- lines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
のための閾値の設定を自動化し、かつ、本文領域とフッ
タやヘッダ等の切り分けを可能にする。 【構成】 入力文書画像を画像圧縮部7でOR圧縮した
画像の黒画素連結成分の外接矩形を外接矩形検出部8で
検出し、矩形分類部9で文字矩形と他の矩形に分類す
る。文字領域統合部10で、文字矩形の縦横比または間
隔の分布に基づいて文字間統合のための閾値を自動設定
して、文字矩形の行統合を行なうが、本文行とヘッダま
たはフッタの文字矩形間の統合を禁止し、また句読点で
閾値を増加させることにより句読点の統合失敗を防止す
る。ヘッダやフッタの文字矩形を本文領域と別の文字領
域に統合する。
Description
り文字領域や図表領域等の属性の異なる情報領域を分割
する領域分割技術に関する。
の文字認識をする場合、あるいは、そのような文書等の
画像を光ディスク等の記憶メディア上にファイリングし
たりファクシミリで送信したりする場合等に、属性の異
なる情報領域を分割し、各領域毎に最適な処理方法に切
り替える必要がある。
分布を用いて文字領域とその他領域に切り分ける方法
(特開昭62−71379号)や、周辺分布を利用して
黒画素群の外接矩形を抽出し、その矩形の統合によって
文字領域を構成して他の領域と分割する方法(特開平3
−126181号)が知られている。
の対応が難しく、さらに、対象とする文書毎にパラメー
タを設定しなければならないという問題点がある。後者
の方法は、矩形抽出に周辺分布を利用する関係から画像
のスキューの程度によってはスキュー補正処理が必要と
なるという問題点があり、またさらに、文字領域におい
て矩形の重なりがある場合や、囲み記事の領域が含まれ
るような構造の複雑な文書への対応が困難であるという
問題がある。
13号特許願に添付の明細書及び図面に、文字領域の抽
出に矩形統合を利用する改良された領域分割方法が開示
されている。この方法によれば、スキュー補正を不要に
でき、また、構造が複雑な文書や種々の文字サイズの文
書に対応することができる。しかし、文字矩形の行方向
への統合パラメータ(矩形間距離の閾値)の設定が不適
当であると、統合すべきでない隣合った領域が統合され
てしまったり、ある行方向の文字列から構成される本文
領域と、それに近接した異方向の文字列(本文に対する
タイトル等)が誤って統合される危険があった。
は、領域分割に関する上述の如き問題点あるいは課題を
改善し、構造の複雑な文書類や文字サイズが様々な文書
類に対する領域分割の精度及び安定性の向上を図ること
にある。
の画像を所定倍率で圧縮した画像より黒画素連結成分に
外接した矩形を抽出し、抽出した矩形を文字の矩形とそ
れ以外の矩形に分類し、文字の矩形を行方向へ統合する
領域分割方法の改良方法が提供される。
は、文字の矩形の高さと幅の比をとることにより画像の
圧縮による文字間の融合度合を推定し、この融合度合に
応じて、文字の矩形の該行方向への統合のための矩形間
距離の閾値を設定する。
に近接した文字の矩形間の距離の分布を測定し、該分布
に基づいて、文字の矩形の該行方向への統合のための矩
形間距離の閾値を設定する。
形の高さと幅の比をとることにより画像の圧縮による文
字間の融合度合を推定し、文字の矩形の該行方向への統
合のための矩形間距離の閾値の設定方法として、該融合
度合により設定する方法、または、該行方向に近接した
文字の矩形間の距離の分布により設定する方法を、該融
合度合の大小に応じて選択する。
形の該行方向への統合処理中に、注目した文字の矩形が
句読点またはそれに類する特定の記号の矩形である否か
の判定をし、句読点またはそれに類する特定の記号であ
ると判定したときに、当該注目した矩形と次の文字の矩
形との統合に関する矩形間距離の閾値を、句読点または
それに類する特定記号以外の文字の矩形の統合の場合よ
り増大させる。
字の矩形の該行方向への統合処理中に、統合しようとす
る二つの矩形の一方の矩形と他方の矩形がそれぞれ異方
向の行の文字の矩形であるか否かの判定をして、異方向
の行の文字の矩形であると判定したときには当該二つの
矩形の統合を禁止する。
請求項5記載の方法において、文字の矩形の該行方向へ
の統合によって得られた行の中に、該行方向の長さが短
い行が存在する場合に、該短い行より該行方向に対し垂
直な方向へ短い行を探索し統合する処理を行なう。
定倍率で圧縮した画像より黒画素連結成分に外接した矩
形を抽出し、抽出した矩形を文字の矩形とそれ以外の矩
形に分類し、文字の矩形を本文文字行方向へ統合し、こ
の矩形の統合によって得られた行を統合して文字部領域
を切り出すが、文字の矩形の本文文字行方向への統合に
よって得られた行を本文文字行と本文文字行以外の行と
に分類し、本文文字行以外の行に本文文字行とは別の固
有の属性を持たせることにより、行の文字部領域への統
合の際に本文行以外の行と本文文字行との統合を避け
る。
明の方法において、矩形の分類によって文字、罫線以外
の矩形に分類された矩形の内部または周辺に存在する本
文文字行以外の行の中で、その周辺に本文文字行方向に
対して垂直の方向に統合可能な行がみつかるものと、見
つからないものとに分類し、それぞれに固有の属性を持
たせることを特徴とするものである。
記載の発明の方法において、本文文字行以外の行につい
て、同じ属性を持つ行同士を統合することである。
発明の方法において、本文文字行以外の属性を持つ行を
消去することを特徴とするものである。
発明の方法において、矩形の分類によって文字、罫線以
外の矩形に分類された矩形を、図の矩形と写真の矩形と
に細分類し、写真の矩形の内部にある本文文字行以外の
行を消去し、または写真の属性を持たせることを特徴と
するものである。
書等の画像の圧縮画像上の文字間の融合度合に違いが生
じる。請求項1または3記載の発明は、この文字間の融
合度合を、文字矩形の縦横比より推定することによっ
て、処理対象文書等の文字間隔に適応させて、文字矩形
の行方向への統合のための矩形間距離の閾値を最適化す
ることができる。また、請求項2または3記載の発明
は、文字間の融合度合によっては閾値の精度が悪化しや
すい文字間隔が広い文書等でも、文字矩形間の距離の分
布に基づいて閾値を高精度に最適化することができる。
したがって、請求項1乃至3記載の発明によれば、文字
間隔の異なる多様な文書等に対応可能である。
決定処理の高速化を期待できることがあり、他方、請求
項2記載の発明によれば、より高精度の閾値の最適化を
期待できる。請求項3記載の発明によれば、そのような
二つの閾値決定方法を、処理文書の文字間隔の広狭に応
じて使い分けることができる。
と、後続文字との間隔が、通常の文字の間隔より相当に
広いことがあるため、例えば請求項1乃至3記載の発明
の方法によって適応的に決定した、あるいは手動で設定
した文字矩形統合のための閾値が多少ずれている場合
に、通常の文字と同一行に統合されるべき句読点や特定
記号が統合されずに分離してしまう虞がある。請求項4
記載の発明によれば、句読点等と次の文字との統合のた
めの閾値を増大させることによって、句読点等の分離を
防止することができる。
書きのヘッダやフッタの文字列が接近している場合があ
る。請求項5記載の発明によれば、このようなヘッダや
フッタの文字と本文行の文字との誤統合を防止すること
ができる。また、請求項6記載の発明によれば、ヘッダ
やフッタの文字列を本文文字領域とは別の文字領域
(行)として統合することができる。
線図形で構成される一塊の図等を矩形分類で完全に文字
以外として分類できるほど、矩形分類処理の精度が高く
ない場合が多い。というのも、文字サイズ程度の大きさ
の矩形の中には、文字認識をしないと、文字であるかそ
うでないか分からないものが多く含まれているからであ
る。矩形分類で失敗する割合が多いと、ノイズやハーフ
トーン等で不要な小領域が文字領域として発生する。し
かし、文字認識の結果に基づいて矩形を厳密に分類する
のは、処理速度の点で得策でない。
きさからは文字の矩形か図その他の矩形か判別し難い場
合にも、周囲にある領域の情報から判断を行なうことが
できることに着目し、文字矩形の統合された行について
分類を行なうことにより、本文文字領域に他の領域が統
合されることを防止し、またハーフトーンの写真領域等
で不要な小領域の発生を防止する。
した後で、行を本文文字行とそれ以外の行とに分類す
る。図9の発明では、文字、罫線以外の矩形との位置関
係に着目して、本文文字行以外の行をさらに分類する。
このような分類は、行の大きさや、次の行との行間距
離、他の文字矩形との距離等の情報から判定するので、
その処理自体は高速に行なうことが可能であるととも
に、矩形単独では判定が難しい文字矩形を判別できる割
合が増し、また行方向の異なる文字矩形も判別できる割
合が高くなるため、より的確な本文文字領域の抽出が可
能になる。そして、請求項10または請求項11の発明
によれば、本文文字行以外の行に分類された行を、同じ
属性のもの毎に統合しまたは消去するので、余分な小領
域の発生を防止できる。さらに、請求項12の発明によ
れば、写真領域の内部に文字列があっても、その文字列
によって写真領域がばらばらにならない。
成を示す。図1において、スキャナ1によって読み取ら
れた文書画像のデータは、画像入力部2によって画像メ
モリ3に格納される。画像メモリ3内の文書画像データ
は、領域識別部6の画像圧縮部7に読み出され、ここで
所定の圧縮率のOR圧縮を施されてから画像メモリ3に
戻される。画像メモリ3内の文書画像データは、画像表
示部4によってディスプレー5に表示させることができ
る。なお、画像入力部7より文書画像データを画像圧縮
部7へ直接入力し、ここで圧縮した画像データを画像メ
モリ3に格納することも可能である。
外接矩形検出部8、矩形分類部9、文字領域統合部10
からなる。
縮された文書画像データより、黒画素の繋りを調べて黒
画素連結成分に外接する矩形を抽出する部分である。こ
こで抽出された矩形には、文字(1文字または2文字以
上の文字列)の矩形のほかに罫線、ノイズ、表、グラ
フ、図その他、様々な属性の矩形が含まれる。矩形分類
部9は、このような様々な矩形を、矩形の形状情報及び
内部データから分類する部分である。この矩形分類の処
理方法は様々なものが考えられるが、その一例について
後に詳述する。
字矩形に分類された矩形に対して統合処理を施して文字
領域に統合するもので、これが本発明の要旨に直接関係
する部分である。
領域識別の結果は、文字認識部11による文字認識処理
に利用される。つまり、領域識別部6は光学的文字認識
の前処理部として利用される。しかし、これは一例に過
ぎない。
例を示す。図2において、パラメータ設定部10Aは文
字矩形間統合のための閾値となるパラメータを設定する
部分であり、その処理内容については後に図3乃至図5
を参照して説明する。文字間統合部10Bは、文字矩形
を行方向に統合する処理を行なう部分であり、その処理
内容については後に図6乃至図8を参照して説明する。
領域統合部10Cは、文字間統合部10Bの処理によっ
て統合された行を、行と垂直な方向へ統合する部分であ
り、その処理内容については図9に関連し後述する。
処理の例1 一般的な文書は行方向に文字が詰まっているので、OR
圧縮後の文書画像上では隣合った文字が融合されて行方
向に長い矩形となる。これに対して、ワープロ文書では
文字間が離れていることが多く、OR圧縮後においても
文字間の融合は起きにくい。
像上の文字間距離に依存する関係がある、つまり、OR
圧縮による文字の行方向の融合度合から文字間距離を推
定可能である。したがって、予め実験によって、文字間
融合度合に対応した最適な文字間統合パラメータ(閾
値)を求めておき、これをテーブル形式あるいは一般式
として設定しておくことにより、測定した文字間融合度
合に基づき最適なパラメータを自動的に設定することが
できる。これが本例における処理原理である。
て、本例での処理内容を具体的に説明する。ステップ3
0Aでは、横書き文書の場合として、圧縮画像より抽出
された矩形中の文字矩形に分類された矩形に関して、矩
形高さ(行方向に対して垂直な方向の矩形サイズ)のヒ
ストグラムをとり、最も頻度が大きい矩形高さを標準文
字サイズとする。次に、矩形高さが標準文字サイズ以下
の文字矩形について矩形幅(行方向の矩形サイズ)を調
べる。そして、標準文字サイズ以下の矩形高さを持つ文
字矩形の総数と、矩形幅が標準文字サイズ以下の矩形
(矩形高さは標準文字サイズ以下)の総数との比(文字
矩形の縦横比)を求める。
示している。前述のように新聞等の文字間が詰まった文
書の場合には、この比率はかなり小さな値となるが、ワ
ープロ文書のように文字間が空いている文書では、この
比率は1に近い値となる。
で求められた比率を、前述の最適パラメータ(文字間統
合閾値)のテーブルまたは一般式に当てはめることによ
り、最適パラメータを決定する。
る方法でも、処理対象文書を特化する場合には不都合は
ない。しかし、様々な文書を処理しようとする場合に
は、文書にあわせて最適パラメータを手動で設定し直す
必要があった。本例及び後記各例によれば、そのような
煩わしい手動設定を排除し、様々な文書に対して最適な
パラメータを設定し、適切な文字間統合を行なうことが
可能になる。
処理の例2 図4に示した概略フローチャートに沿って、本例での処
理内容を説明する。ここでは、これまでの説明と同様
に、文書画像上の行方向が水平であるとする。
出された矩形中で文字に分類された矩形に関し、行方向
(水平方向)に隣合った二つの文字矩形について、水平
距離(文字間隔)条件以外に統合するに不都合がないか
調べる。例えば、一方の文字矩形と他方の文字矩形の矩
形高さの差が所定の限度を越えている場合(例えば、縦
書き文書において、一方の文字矩形がある本文行上の文
字で、他方が本文に対するタイトル文字であるような場
合)は、両文字矩形を統合すべきでないと判断し、その
限度を越えない場合には、統合し得ると判断する。これ
を全ての隣合う文字矩形について行なう。
Aで統合し得ると判断された隣合う文字矩形間の水平距
離を測定し、その水平距離のヒストグラムを求める。
意された文字間隔(水平距離)と最適な文字間統合パラ
メータとの関係を表わすテーブルまたは一般式に、前ス
テップ40Bで得られた水平距離ヒストグラムで頻度が
最高の水平距離値をあてはめることによって、最適な文
字間統合パラメータを決定する。
1では最適化が難しい、文字間隔が広いような特殊な場
合に対するパラメータ最適化能力に優れている。
処理の例3 図5に示した概略フローチャートに沿って、本例での処
理内容を説明する。なお、ここでは横書き文書を想定す
る。
と同じ内容の処理を行なうステップである。ステップ5
0Bは、前ステップ50Aで求められた比率(文字間融
合度合)によって次の処理方法を選択する。例えば、比
率が1に近い場合(文字間隔が広く、図3に示した処理
方法よりも図4に示した処理方法が適する場合)に、次
の処理としてステップ50Dを選び、そうでない場合に
ステップ50Cを選択する。ステップ50Cは図3のス
テップ30Bと同内容の処理ステップであり、ステップ
50D〜50Fは図4のステップ40A〜40Cと同内
容の処理ステップである。
処理に標準文字サイズを利用する場合(例えば前記特願
平4−267313号特許出願に係る装置の場合)に
は、図3に関連して説明した処理方法のほうが処理時間
を短縮できることがある。すなわち、本例は、図3の処
理方法で精度面に問題がない場合にはステップ50Cの
処理を選択して処理時間短縮の利益を期待できるように
し、文字間隔が広く精度の面で図4の処理方法が好まし
い場合にはステップ50D以下の処理に切り替えてい
る。
の例1 ある文字矩形と他の文字矩形とを同じ行として統合する
か否かの判定には、行方向の文字矩形間距離、及び、行
(仮想行)に対し垂直方向の文字矩形位置を考慮するの
が一般的である。ここで、行方向の文字矩形間距離に関
する閾値(統合パラメータ)が固定値で最適化されてい
ない場合は勿論のこと、それが前述のように自動的に最
適化される場合でも多少のくるいがあったときに、ワー
プロ文書等では、本来一行に統合されるべき句読点や、
それに類する特定の記号の統合を失敗する虞がある。こ
れは、ワープロ文書等では、句読点あるいは、それに類
する特定の記号(句読点等と総称する)と、その次の文
字との間隔が、普通の文字の間隔に比べ広過ぎることが
あるからである。
敗を回避することができる。以下、図6のフローチャー
トに沿って、本例の処理内容について説明する。
目している文字矩形が句読点等であるか判定する。この
判定には、注目した文字矩形の形状、大きさ、仮想行上
の位置関係等の情報を用いることができる。例えば、注
目した文字矩形が、他の文字矩形に比べ極端に小さい、
あるいは細長いときに、句読点等と判定する。
読点等でないと判定した場合には、パラメータ設定部1
0Aで設定されたパラメータをそのままステップ60D
において行方向の文字矩形間距離の閾値として用いる。
しかし、句読点等であると判定した場合には、ステップ
60Cにおいて、パラメータ設定部10Aで設定された
パラメータを、例えば文字サイズ程度だけ増加させ、こ
れをステップ60Dで当該注目矩形に関する行方向の文
字矩形間距離の閾値として用いる。
文字矩形と、その右隣の(行の左端から右端へ向かって
処理するとして)文字矩形との統合条件を調べる。統合
条件が成立しない場合には、注目した文字矩形と、隣接
の文字矩形との統合をしない(ステップ60F)。統合
条件が成立する場合には、注目した文字矩形と、隣接の
次文字矩形とを統合する(ステップ60E)。
である場合には、行方向の文字矩形間距離の閾値を増加
させるので、ワープロ文書等で句読点等と次文字との距
離が通常の文字の間隔より広過ぎる場合にも、同一行と
して統合することができる。また、パラメータ設定部1
0Aにより設定されるパラメータの多少のくるいを許容
できるという利益も期待できる。
の例2 例えば縦書き文書の場合に、本文の行(本文行)の端
と、横書きのフッタ(ページ数等)やヘッダ(タイトル
等)とが接近していることが少なくない。本例によれ
ば、このような接近した本文行文字とフッタやヘッダの
文字との誤統合を防止できる。以下、図7に示すフロー
チャートに沿って処理内容を説明する。
文字矩形の行方向(本文行方向)の距離に関する統合条
件を満たすか(距離がパラメータ設定部10Aにより設
定された閾値以下であるか)調べる。文字間距離の統合
条件を満たさない場合にはステップ70Fに分岐し、当
該文字矩形を統合せず次の文字矩形の処理に進むことに
なる。
0Bにおいて当該文字矩形のサイズ(例えば矩形高さ)
の差が所定値より小さいか調べる。サイズ差が大きい場
合にはステップ70Fに分岐し統合せずに次の文字矩形
の処理に進む。したがって、例えば図8(a)に示すよ
うに、縦書き文書上の本文行の文字矩形Bに接近して横
書きのページ数の文字列の統合された高さの大きな文字
矩形aが存在した場合に、その誤統合を防止できる。
判定された場合は、ステップ70Cにおいて、注目して
いる二つの文字矩形中の一方に、行(本文行)と垂直な
方向に近接した文字矩形が存在するか調べる。存在する
場合にはステップ70Fに分岐する。このようなチェッ
クによって、例えば図8(b)に示すように、本文行文
字矩形Bに接近して、フッタ(ページ数等)の文字矩形
bがあり、この文字矩形bの上下にフッタの文字矩形
a,cが存在するような場合に、文字矩形Bと文字矩形
bとの誤統合を防止できる。
矩形がないと判定した場合には、ステップ70Dにおい
て、一方の文字矩形の縦横比と通常の文字矩形の縦横比
との差が小さいか調べる。縦横比が普通であると判定さ
れた場合には、ステップ70Eにおいて当該文字矩形の
統合が行なわれ、次の文字矩形の処理に進むことにな
る。
テップ70Fに分岐する。したがって、例えば図8
(c)に示すように、フッタの小さな文字列が統合され
た細長い文字矩形aが本文行文字矩形Bに接近して存在
する場合、文字矩形aと本文行文字矩形Bとの誤統合を
防止できる。
ッダの文字列は、本文行の文字との距離が大きいため
に、本文行に統合されることはない。また、本文行の文
字とフッタ等の文字との距離が小さい場合にも、図7に
示した文字間統合処理方法によれば、その統合が防止さ
れる。したがって、本文行と行方向の異なるフッタやヘ
ッダ等の文字列は、本文行に統合されずに、短い行とし
て残ることなる。
によって得られた行であり、その中でa〜iは本文行、
jとkはフッタ等の短い行である。
って、図9のa〜iのような本文行を文字領域(図9の
破線枠90)に統合するが、この際に行の形状を調べ、
短い行が発生している場合には、その行より本文行と垂
直の方向に短い行を探索することによって、図9のj,
kのような短い行を本文領域とは行方向の異なる別の文
字領域(図9の破線枠91)に統合する。
状によって、矩形の種類を大雑把に分類する。例えば図
10の(a)に示すように、矩形の高さ(heigh
t)を、標準文字サイズ(size)との大小関係によ
ってクラス1からクラス3に分ける。また、矩形の幅
(width)を、標準文字サイズとの大小関係によっ
てクラス1からクラス3に分ける。標準文字サイズは、
予め分かっている場合には、その値を用いればよいし、
予め分かっていない場合には文書画像より抽出された矩
形の高さの分布から適応的に決定するような方法を採用
すればよい。
び矩形幅クラスを、例えば図11の(b)に示す分類テ
ーブルにあてはめて、矩形分類を決定する。矩形幅がク
ラス1またはクラス2で、矩形高さがクラス1またはク
ラス2ならば、その矩形は文字候補または大文字候補に
分類される。矩形幅がクラス1で、矩形高さがクラス3
ならば垂直罫線候補に分類される。
矩形領域内をスキャンして水平方向の所定値より長い黒
ランだけを抽出し、その接続したものを囲む外接矩形を
水平方向の架空罫線として抽出し、同様に垂直方向に長
い黒ランだけを抽出し、その接続したものを囲む外接矩
形を垂直方向の架空罫線として抽出する。そして、架空
罫線の数、位置、長さに着目し、当該矩形を<表>、<
囲み枠>または<図、グラフその他>に分類する。
は、当該矩形領域をスキャンして水平方向に長い黒ラン
だけを抽出し、抽出した長い黒ランの接続したものを囲
む外接矩形を水平方向の架空罫線として抽出し、架空罫
線の数、位置、長さに着目して、当該矩形を<文字矩形
>または文字領域を上下に区切る<水平セパレータ>に
分類する。
は、当該矩形領域をスキャンして垂直方向に長い黒ラン
だけを抽出し、抽出した長い黒ランの接続したものを囲
む外接矩形を垂直方向の架空罫線として抽出し、架空罫
線の数、位置、長さに着目し、当該矩形を<文字矩形
>、文字領域を左右に区切る<垂直セパレータ>、また
は<図、グラフその他>に分類する。
る。本実施例のためのシステム構成は図1に示した前記
実施例のシステム構成と同様でよい。処理内容に関して
も、文字領域統合部10の処理以外は前記実施例と同様
でよい。以下、本実施例における文字領域統合部10の
処理内容について説明する。その処理の概略フローを図
11に示す。
形について、本文行の方向へ距離の小さいものを統合し
て行を抽出する(ステップ101)。統合する行の方向
は予め指定してもよいし、自動的に判別させてもよい。
また、この統合の際の矩形間距離の閾値は、予め指定し
てもよいし、前記実施例に述べた方法によって適応的に
設定してもよい。ここで行として抽出される矩形は、矩
形間距離が小さいものだけであって、特殊な処理を施す
必要はない。むしろ、距離が大きな矩形まで行に統合さ
れると悪影響が生じる心配がある。
に、幅の小さいものが生じることがある。このような行
は、単独の文字であったり、行方向の異なる文字(例え
ば注目している行方向と垂直方向に近接している文字矩
形)であったり、あるいは文字以外の図、写真の一部
(例えば、キャプション、グラフの座標値等の文字等)
である可能性が高い。
統合により得られた行の中で幅の小さい行を、”本文文
字行以外の行”に分類し、他の幅の大きな行つまり”本
文文字行”とは別の属性を持たせる(ステップ10
2)。この分類をより一般的に述べるならば、文字矩形
の本文行方向への統合により得られた行を、その大き
さ、次の行との行間距離、文字以外に分類された矩形と
の距離等の情報から、”本文文字行”と、”本文文字行
以外の行”とに分類するということである。
矩形に分類された矩形(”図その他矩形”と呼ぶ)の周
辺または内部に(つまり重なって)、前ステップで分類
された”本文文字行以外の行”が存在するか調べる(ス
テップ103)。
する”本文文字行以外の行”について、その周辺に、本
文文字行方向に対し垂直の方向に統合し得る行を探索
し、そのような統合できる行が見つかれば、当該”本文
文字行以外の行”を”垂直行”に最終分類し(ステップ
104)、探索した行と統合し、さらに距離の近い”垂
直行”同士を統合する(ステップ105)。
る”本文文字行以外の行”であっても、垂直方向に統合
できる行がみつからないものは、”図の行”に最終分類
し(ステップ104)、距離の近い”図の行”と統合す
るか、あるいは消去する(ステップ105)。
に分類された行の中で、”図その他矩形”の周辺または
内部に存在しないものは、”本文文字行以外の行”に最
終分類され(ステップ104)、接近した同じ属性の行
同士で統合する(ステップ105)。
もの同士を統合して、本文領域を生成する(ステップ1
06)。
分類部9において”図その他矩形”をさらに”図の矩
形”と”写真の矩形”とに細分類する。そして、ステッ
プ105において、”写真の矩形”の内部にある”本文
文字行以外の行”を消去し、あるいは写真の属性に変更
する。ハーフトーンの写真の領域は、線図形に比べて小
矩形の塊に分類されることが多いので、この変形例のよ
うにすれば、ハーフトーンの写真領域がばらばらになる
ことを防ぐうえで有効である。また、線図形領域内の文
字列を消去せず、文字列として抽出できる。
1乃至7の発明によれば、人手を煩わすことなく、文字
間隔の異なる様々な文書等の領域分割を行なうことがで
き、また、ワープロ文書等の句読点やそれに類する特定
記号の行統合の失敗や、縦書き文書のヘッダやフッタの
ような文字列と本文行の文字列との誤統合を防止でき、
さらに、ヘッダやフッタのような文字列を本文領域と別
の文字領域として統合することができる等、多様な文書
等に対する高精度の領域分割が可能になる。また、請求
項8乃至12の発明によれば、本文文字行方向へ文字矩
形を統合した行について分類を行ない、本文文字行とそ
れ以外の行に分類し、本文文字行以外の行をさらに分類
することによって、より正確な本文文字領域の抽出が可
能になり、また、矩形単位の矩形分類の失敗の割合が多
い場合にも、文字認識の結果に基づいて矩形を厳密に分
類し直すような非効率的な処理を行なわずに実質的に矩
形の分類精度を向上させ、不要な文字領域の発生を防止
し、さらに写真領域の無用な分割を防止できる。
示す。
文字矩形の例を示す。
図である。 (b)矩形の高さ及び幅による属性分類のテーブルの説
明図である。
の処理のフローを示す。
Claims (12)
- 【請求項1】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形を文字の矩形とそれ以外の矩形に分類し、文字の矩
形を行方向へ統合する領域分割方法において、 文字の矩形の高さと幅の比をとることにより画像の圧縮
による文字間の融合度合を推定し、この融合度合に応じ
て、文字の矩形の該行方向への統合のための矩形間距離
の閾値を設定することを特徴とする領域分割方法。 - 【請求項2】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形を文字の矩形とそれ以外の矩形に分類し、文字の矩
形を行方向へ統合する領域分割方法において、 該行方向に近接した文字の矩形間の距離の分布を測定
し、該分布に基づいて、文字の矩形の該行方向への統合
のための矩形間距離の閾値を設定することを特徴とする
領域分割方法。 - 【請求項3】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形を文字の矩形とそれ以外の矩形に分類し、文字の矩
形を行方向へ統合する領域分割方法において、 文字の矩形の高さと幅の比をとることにより画像の圧縮
による文字間の融合度合を推定し、文字の矩形の該行方
向への統合のための矩形間距離の閾値の設定方法とし
て、該融合度合により設定する方法、または、該行方向
に近接した文字の矩形間の距離の分布により設定する方
法を、該融合度合の大小に応じて選択することを特徴と
する領域分割方法。 - 【請求項4】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形を文字の矩形とそれ以外の矩形に分類し、文字の矩
形を行方向へ統合する領域分割方法において、 文字の矩形の該行方向への統合処理中に、注目した文字
の矩形が句読点またはそれに類する特定の記号の矩形で
ある否かの判定をし、句読点またはそれに類する特定の
記号であると判定したときには、当該注目した矩形と次
の文字の矩形との統合に関する矩形間距離の閾値を、句
読点またはそれに類する特定の記号以外の文字の矩形の
統合の場合より増大させることを特徴とする領域分割方
法。 - 【請求項5】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形を文字の矩形とそれ以外の矩形に分類し、文字の矩
形を行方向に統合する領域分割方法において、 文字の矩形の該行方向への統合処理中に、統合しようと
する二つの矩形の一方の矩形と他方の矩形がそれぞれ異
方向の行の文字の矩形であるか否かの判定をして、異方
向の行の文字の矩形であると判定したときには当該二つ
の矩形の統合を禁止することを特徴とする領域分割方
法。 - 【請求項6】 文字の矩形の該行方向への統合によって
得られた行の中に、該行方向の長さが短い行が存在する
場合に、該短い行より該行方向に対し垂直な方向へ短い
行を探索し統合する処理を行なうことを特徴とする請求
項5記載の領域分割方法。 - 【請求項7】 請求項5または6記載の領域分割方法に
おいて、文字の矩形の該行方向への統合のための矩形間
距離の閾値を、請求項1、2または3記載の領域分割方
法における矩形間距離の閾値の決定方法によって決定す
ることを特徴とする領域分割方法。 - 【請求項8】 文書等の画像を所定倍率で圧縮した画像
より黒画素連結成分に外接した矩形を抽出し、抽出した
矩形を文字の矩形とそれ以外の矩形に分類し、文字の矩
形を本文文字行方向へ統合し、この矩形の統合によって
得られた行を統合して文字部領域を切り出す領域分割方
法において、 文字の矩形の本文文字行方向への統合によって得られた
行を本文文字行と本文文字行以外の行とに分類し、本文
文字行以外の行に本文文字行とは別の固有の属性を持た
せることにより、行の文字部領域への統合の際に本文行
以外の行と本文文字行との統合を避けることを特徴とす
る領域分割方法。 - 【請求項9】 請求項8記載の領域分割方法において、
矩形の分類によって文字、罫線以外の矩形に分類された
矩形の内部または周辺に存在する本文文字行以外の行の
中で、その周辺に本文文字行方向に対して垂直の方向に
統合可能な行がみつかるものと、見つからないものとに
分類し、それぞれに固有の属性を持たせることを特徴と
する領域分割方法。 - 【請求項10】 請求項9記載の領域分割方法におい
て、本文文字行以外の行について、同じ属性を持つ行同
士を統合することを特徴とする領域分割方法。 - 【請求項11】 請求項9記載の領域分割方法におい
て、本文文字行以外の属性を持つ行を消去することを特
徴とする領域分割方法。 - 【請求項12】 請求項8記載の領域分割方法におい
て、矩形の分類によって文字、罫線以外の矩形に分類さ
れた矩形を、図の矩形と写真の矩形とに分類し、写真の
矩形の内部にある本文文字行以外の行を消去し、または
写真の属性を持たせることを特徴とする領域分割方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP33125293A JP3285686B2 (ja) | 1993-06-29 | 1993-12-27 | 領域分割方法 |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5-159190 | 1993-06-29 | ||
| JP15919093 | 1993-06-29 | ||
| JP33125293A JP3285686B2 (ja) | 1993-06-29 | 1993-12-27 | 領域分割方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0773271A true JPH0773271A (ja) | 1995-03-17 |
| JP3285686B2 JP3285686B2 (ja) | 2002-05-27 |
Family
ID=26486063
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP33125293A Expired - Lifetime JP3285686B2 (ja) | 1993-06-29 | 1993-12-27 | 領域分割方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3285686B2 (ja) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10214309A (ja) * | 1997-01-29 | 1998-08-11 | Ricoh Co Ltd | 文書画像領域抽出方法 |
| JP2005071349A (ja) * | 2003-08-20 | 2005-03-17 | Oce Technol Bv | 指定されたドキュメント・エリアからのメタデータの抽出 |
| JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
| JP2007503032A (ja) * | 2003-08-20 | 2007-02-15 | オセ−テクノロジーズ・ベー・ヴエー | ドキュメントスキャナ |
| JP2007166244A (ja) * | 2005-12-14 | 2007-06-28 | Ricoh Co Ltd | 文書処理装置、文書処理方法、プログラム及び情報記録媒体 |
| JP2011070529A (ja) * | 2009-09-28 | 2011-04-07 | Hitachi Solutions Ltd | 文書処理装置 |
| US7995869B2 (en) | 2006-05-02 | 2011-08-09 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and information storing medium |
| US8001466B2 (en) | 2005-06-17 | 2011-08-16 | Ricoh Company, Ltd. | Document processing apparatus and method |
| JP2017084058A (ja) * | 2015-10-27 | 2017-05-18 | 株式会社東芝 | 画像処理装置、画像処理方法及び画像処理プログラム |
-
1993
- 1993-12-27 JP JP33125293A patent/JP3285686B2/ja not_active Expired - Lifetime
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10214309A (ja) * | 1997-01-29 | 1998-08-11 | Ricoh Co Ltd | 文書画像領域抽出方法 |
| JP2005071349A (ja) * | 2003-08-20 | 2005-03-17 | Oce Technol Bv | 指定されたドキュメント・エリアからのメタデータの抽出 |
| JP2007503032A (ja) * | 2003-08-20 | 2007-02-15 | オセ−テクノロジーズ・ベー・ヴエー | ドキュメントスキャナ |
| US7756332B2 (en) | 2003-08-20 | 2010-07-13 | Oce-Technologies B.V. | Metadata extraction from designated document areas |
| JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
| US8001466B2 (en) | 2005-06-17 | 2011-08-16 | Ricoh Company, Ltd. | Document processing apparatus and method |
| JP2007166244A (ja) * | 2005-12-14 | 2007-06-28 | Ricoh Co Ltd | 文書処理装置、文書処理方法、プログラム及び情報記録媒体 |
| US7995869B2 (en) | 2006-05-02 | 2011-08-09 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and information storing medium |
| JP2011070529A (ja) * | 2009-09-28 | 2011-04-07 | Hitachi Solutions Ltd | 文書処理装置 |
| JP2017084058A (ja) * | 2015-10-27 | 2017-05-18 | 株式会社東芝 | 画像処理装置、画像処理方法及び画像処理プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3285686B2 (ja) | 2002-05-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6574375B1 (en) | Method for detecting inverted text images on a digital scanning device | |
| US5854853A (en) | Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks | |
| US6909805B2 (en) | Detecting and utilizing add-on information from a scanned document image | |
| US5335290A (en) | Segmentation of text, picture and lines of a document image | |
| US7519226B2 (en) | Form search apparatus and method | |
| JPH05233873A (ja) | 領域分割方法 | |
| JP4655335B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
| JPH0773271A (ja) | 領域分割方法 | |
| US20010043742A1 (en) | Communication document detector | |
| JP3215163B2 (ja) | 罫線識別方法及び領域識別方法 | |
| JP3344774B2 (ja) | 矩形分類方法 | |
| JP3787377B2 (ja) | 文書方向判定方法及び装置及び文字認識方法及び装置 | |
| JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
| EP0767941B1 (en) | Automatic determination of landscape scan in binary images | |
| JPH11191135A (ja) | 文書画像の日本語英語判定方法、文書認識方法および記録媒体 | |
| JP3384634B2 (ja) | 文字種識別方法 | |
| JP3402755B2 (ja) | 領域分割方法 | |
| JP3710164B2 (ja) | 画像処理装置及び方法 | |
| JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
| JPH06259597A (ja) | ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置 | |
| EP0446630A2 (en) | Method and apparatus for segmenting characters in an amount field on a financial document | |
| JPH04241074A (ja) | 自動文書清書装置 | |
| JP3190794B2 (ja) | 文字切り出し装置 | |
| JP2003030585A (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
| JPH05135204A (ja) | 文字認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090308 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100308 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110308 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120308 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130308 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140308 Year of fee payment: 12 |
|
| EXPY | Cancellation because of completion of term |