JPH1153467A - 文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法 - Google Patents

文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法

Info

Publication number
JPH1153467A
JPH1153467A JP9227100A JP22710097A JPH1153467A JP H1153467 A JPH1153467 A JP H1153467A JP 9227100 A JP9227100 A JP 9227100A JP 22710097 A JP22710097 A JP 22710097A JP H1153467 A JPH1153467 A JP H1153467A
Authority
JP
Japan
Prior art keywords
document image
area
divided
division
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9227100A
Other languages
English (en)
Inventor
Takumi Takahashi
巧 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP9227100A priority Critical patent/JPH1153467A/ja
Publication of JPH1153467A publication Critical patent/JPH1153467A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文書画像の構成構成に依存せず、領域分
割及び領域属性の指定をする文書画像の領域分割方法及
び文書画像の領域属性の指定方法を提供すること。 【解決手段】 ラン情報作成部11にて、読み取った画
像のラン情報を作成し、ラン情報テーブル41に保存す
る。分割可能判別部12にて、ラン情報の白ライン検出
率から、読み取った画像が分割可能か否かを判別する。
分割不可能と判別した場合、強制分割部13にて、読み
取った画像を強制分割し、分割後の各領域について、分
割処理を行った後、領域統合部17にて、元の文書画像
を再現するように分割した領域を統合する。また、分割
処理は、閾値算出部14にて、ラン情報の白ライン連続
数を統計的に処理して閾値を算出し、領域分割部15に
て、閾値を超える白ライン連続数を有する個所を境界と
して行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書画像領域分割
装置並びにこれを用いた文書画像の領域分割方法及び文
書画像の領域属性の指定方法に関する。
【0002】
【従来の技術】現在、文書の内容の言語的解析なしに、
文書画像を分割する方法として、大きく分けて2つの方
法が用いられている。
【0003】第一の方法は、最初に文書を文字のような
最小単位まで文書画像を分割して、それらを統合するこ
とにより、分割した領域を構築するものである。
【0004】しかし、この方法では、ページにおける文
字列や文字が多く存在する場合や後に文字認識などに利
用しない領域を設定する場合を考慮すると、分割・統合
処理が複雑になり、時間的な損失が大きい。
【0005】そこで、第二の方法として、特開平9−4
4594号公報に開示されている方法が挙げられる。こ
の方法は、章や節などの関連内容毎の領域間の空白帯に
着目して、文書画像を階層的に細分化していく方法であ
る。
【0006】図14は、分割処理の対象となる文書画像
の模式図である。図14において、領域分割を行う文書
画像1401中のマークの列1402は、文字列からな
る文書と仮定する。マークの列1402の間には、空白
帯が存在するため、文書の内容を理解しなくても、これ
らの空白帯を境界とすることにより、文書画像1401
を複数の領域に分割できることが分かる。具体的には、
垂直方向で検出される空白帯のうち、高さwh(2)が
他の空白帯の高さwh(1)やwh(3)などと比較し
て高いので、高さwh(2)の空白帯を境界として分割
でき、同様に水平方向で検出される幅wv(2)が他の
空白帯の幅wv(1)などと比較して広いので、幅wv
(2)の空白帯を境界として分割できる。
【0007】実際には、空白帯の高さや幅を単純に比較
できないので、固定されたパラメータにより、あるいは
空白帯の内、最も幅広い空白帯の高さや幅に対する各々
の空白帯の高さや幅の比率により、境界とする空白帯を
決定し、文書画像の領域分割を行う。
【0008】
【発明が解決しようとする課題】しかし、空白帯の幅ま
たは高さは、当然のことながら文書画像により様々であ
る。したがって、どの空白帯を境界とするかを判別する
際に、閾値として固定されたパラメータを用いると、本
来行間であるはずの空白帯が境界と判別されて分割され
たり、逆に、本来境界であるはずの空白帯が行間と判別
されて分割されなかったりする問題が生じる。
【0009】また、どの空白帯を境界とするかを判断す
る際に、閾値として最も幅広い空白帯の幅に対する空白
帯の幅の比率を用いると、最も幅広い空白帯の幅が他の
空白帯の幅に比べ突出して広い場合に、本来境界として
分割されるはずの空白帯が、前記比率を求めたときに閾
値に達せず、行間と判別され分割されないという問題が
生じる。
【0010】さらに、文書画像の構成が複雑である場合
に、境界とする空白帯を検出できず、文書画像の分割を
進行できないという問題もある。
【0011】本発明は、上述の課題に鑑みて為されたも
ので、文書画像の構成構成に依存せず、領域分割及び領
域属性の指定をする文書画像の領域分割方法及び文書画
像の領域属性の指定方法を提供することを目的とする。
【0012】
【課題を解決するための手段】本発明は、上記課題を解
決するために、以下のような手段を講じた。
【0013】請求項1記載の発明は、文書画像のラン情
報を作成するラン情報作成手段と、前記ラン情報の白ラ
イン連続数を統計的に処理して閾値を算出する閾値算出
手段と、前記閾値を越える白ライン連続数を有する個所
で前記文書画像を分割する領域分割手段とを具備する構
成を採る。
【0014】請求項5記載の発明は、文書画像から求め
られた白ライン連続数を統計的に処理して閾値を算出
し、前記閾値を越える白ライン連続数を有する個所で前
記文書画像を分割する方法を採る。
【0015】ここで、ランとは、文書画像を水平又は垂
直方向に一定幅のラインに区切った場合に、ラインにお
いて同一色(白ランであれば白色)の画素が連続する各
部分であり、位置及び長さで管理される。また、設定領
域の領域幅に近い長さの白ランをもつラインを白ライン
という。また、白ラインが連続する数を白ライン連続数
という。
【0016】この構成により、領域の境界となる閾値を
固定されたパラメータとしたり、長い白ラン連結成分の
内、最も高い成分の高さに対する比率により決定する場
合に比べ、領域の境界の判別精度が高い領域分割が可能
となる。
【0017】また、請求項2記載の発明は、請求項1記
載の発明において、ラン情報の白ライン検出率から文書
画像が分割可能か否かを判別する判別手段と、文書画像
を分割できない場合、文書画像を強制的に分割する強制
分割手段と、強制的に分割した文書画像を元の文書画像
を再現するように統合する領域統合手段とを具備する構
成を採る。
【0018】また、請求項3記載の発明は、請求項2記
載の発明において、閾値算出手段は、強制的に分割され
たすべての文書画像について、請求項1記載の閾値を算
出し、領域分割手段は、前記強制的に分割されたすべて
の文書画像について、請求項1記載の分割をする構成を
採る。
【0019】また、請求項6記載の発明は、請求項5記
載の発明において、文書画像の白ライン検出率を求め、
文書画像が分割可能か否かを判別し、文書画像を分割で
きない場合に強制的に分割し、強制的に分割されたすべ
ての文書画像を分割し、元の文書画像を再現するように
強制的に分割された文書画像を統合する方法を採る。
【0020】ここで、白ライン検出率とは、設定領域の
全ライン数に対する白ライン数の割合をいう。
【0021】この構成により、文書画像の構成が複雑
で、最初に空白帯を検出できない場合でも領域分割を進
行できる。
【0022】また、請求項4記載の発明は、請求項1乃
至請求項3のいずれかに記載の発明において、閾値算出
手段は、閾値の算出を白ライン連続数の平均値を用いる
か、白ライン連続数の標準偏差と分散を用いるかを、ラ
ン情報のサンプル数の量により決定する構成を採る。
【0023】この構成により、文書画像から取得された
白ランのサンプル数によらず、文書画像の領域分割を実
行することができる。
【0024】また、請求項7記載の発明は、文書画像領
域属性指定方法に関するものであり、文書画像の特定の
属性の領域に手書き線を記入し、請求項5又は請求項6
記載の文書画像領域分割方法にて領域を分割し、前記手
書き線の有無及びパターンにより領域の属性を判別し、
前記手書き線が記入された領域を他の領域と区別して処
理する方法を採る。
【0025】この方法により、予めユーザーが記入した
手書き線により、手書き線を記入した領域の属性を判別
できる。また、特定の領域にのみ手書き線を記入して、
その領域に対しては他の領域と区別し、後の処理を行う
ことができる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して詳細に説明する。
【0027】図1は、本発明の一実施形態における文書
画像の領域分割装置の構成を示すブロック図である。
【0028】図1に示すように、文書画像の領域分割装
置は、各部の制御を行う制御ユニット1と、文書画像を
読み取るスキャナ等の画像入力装置2と、読み取った文
書画像及び領域情報を記憶するデータ記憶手段3と、デ
ータ処理の作業領域として使用されるRAM4から主に
構成されている。
【0029】制御ユニット1は、文書画像のラン情報を
作成するラン情報作成部11と、文書画像が分割可能か
否かを判別する分割可能判別部12と、文書画像を強制
的に分割する強制分割部13と、領域の境界となる閾値
を算出する閾値算出部14と、領域の境界を決定し文書
画像を領域に分割する領域分割部15と、分割された各
領域の属性を判別する属性判別部16と、分割された領
域を統合する領域統合部17とを有する。
【0030】データ記憶手段3は、読み取った文書画像
を記憶する文書画像テーブル31と、分割した各領域の
領域情報を記憶する領域情報テーブル32とを有する。
【0031】RAM4は、ラン情報を記憶するラン情報
テーブル41と、各判断の基準となる設定値を記憶する
設定値テーブル42とを有する。
【0032】次に、制御ユニット1内の各部が行う処理
について説明する。
【0033】ラン情報作成部11は、文書画像テーブル
41に記憶された文書画像から、水平方向及び垂直方向
の各白ラン及び黒ランの長さ及び位置、ラインの位置、
ライン連続数並びにライン検出率等のラン情報を作成
し、ラン情報テーブル51に格納する。
【0034】ラン情報の作成について、図2を用いて説
明する。図2は、本実施の形態におけるラン情報作成の
説明図である。
【0035】図2は、文書画像2を幅Aで水平に区切る
場合を示している。図2において、白ラン201及び2
02は、白画素が途切れなく水平方向に連続している。
また、黒ラン203は、黒画素がある回数途切れなく水
平方向に連続している。○印を付したラインは白ライン
であり、水平方向に文書画像幅Wに近い長さの白ランを
持っている。
【0036】領域幅Wに近い長さLは、以下に示す式
(1)で定義される。
【0037】
【数1】 ここで、t1は係数であり0.8から0.9が適当であ
る。
【0038】文書画像の白ライン204、205及び2
06は、垂直方向に連続しているため、白ライン連続数
は3となる。また、文書画像の白ライン検出率は、全ラ
イン12本に対し、白ライン6本であるから50%とな
る。なお、実際の場合、白ライン検出率は、外周の余白
部分を除いて算出される。
【0039】分割可能判別部12は、ラン情報テーブル
に記憶されたラン情報の白ラインの検出率と設定値テー
ブル52に予め記憶された設定値とを比較し、文書画像
の分割処理が可能であるか否かを判別する。そして、白
ラン検出率が設定値より低ければ、分割処理が不可能で
あると判別し、その情報を強制分割部13に知らせ、白
ラン検出率が設定値より高ければ、その情報を分割処理
が可能であると判別し、閾値算出部14に知らせる。
【0040】強制分割部13は、分割可能判別部12に
て、分割処理が不可能であると判別された場合、文書画
像をN個(Nは自然数)の同じサイズの矩形領域に強制
的に分割(以下「強制分割」という)する。そして、強
制分割処理を完了するとラン情報作成部11に知らせ
る。
【0041】閾値算出部14は、ラン情報テーブルに記
憶したラン情報のうち文書画像全体で取得した白ライン
連続数を統計的に処理し、領域の境界となる閾値を算出
し、算出結果を領域分割部15に知らせる。
【0042】統計的処理とは、作成されたラン情報のサ
ンプル数が十分存在しない場合、文書画像全体で取得し
た白ライン連続数の平均値により閾値を決定し、作成さ
れたラン情報のサンプル数が十分存在する場合、文書画
像全体で取得した白ライン連続数の標準偏差と分散によ
り閾値を決定する処理をいう。
【0043】サンプル数nの白ライン連続数w(j)の
平均値mおよび標準偏差sは、以下に示す式(2)で算
出される。
【0044】
【数2】 図3は、検出された白ライン連続数とその検出頻度の相
関を示す図である。図3の横軸は白ライン連続数を表
し、縦軸はその検出頻度を表す。曲線301は、文書だ
けの領域のデータをプロットした場合のカーブであり、
曲線302は、線画が混在している領域のデータをプロ
ットした場合のカーブである。図3に示すように、画像
の属性によりプロットされる波形が異なる。曲線301
の最頻値m1での検出頻度のピークが、曲線302の最
頻値m2での検出頻度のピークと比較して高く、また、
尖度が高い。
【0045】ここで、曲線301、302が正規曲線で
あるとすると、m−sとm+sの間の正規曲線の面積は
全面積の68%であり、m−2sとm+2sの間の正規
曲線の面積は全面積の95%である。
【0046】領域の境界を検出する場合、領域の境界と
判別される閾値を例えばm+sとすれば、分割対象画像
が変化しても、それに対応してこの値をそれぞれの画像
に合わせて自動的に変更するため、従来のように、固定
値を用いる場合と比較して柔軟性を持たせることができ
る。
【0047】領域分割部15は、閾値算出部14で算出
した閾値と文書画像の白ライン連続数を比較し、閾値を
超える白ライン連続数が有る位置を境界候補位置として
文書画像を分割(以下「通常分割」という)する。そし
て、境界で囲まれた矩形部を小領域とし、領域情報テー
ブル42に、各小領域の幅、高さ及び文書画像全体に対
する左上角の位置座標を記憶する。また、通常分割処理
を終了すると、その情報を属性判別部16に知らせる。
通常分割処理の詳細は後述する。
【0048】属性判別部16は、分割された各小領域の
属性を判別し、領域情報テーブル42に属性を記録す
る。属性とは、文書、写真及び図等の領域のタイプをい
う。また、属性判別処理を終了すると、領域統合部17
に知らせる。この領域判別処理の詳細は後述する。
【0049】領域統合部17は、強制分割された文書画
像に対して、隣接する小領域同士を一定条件の下で統合
する統合処理(以下「領域統合処理」という)をおこな
う。そして、統合結果に基づき、領域情報テーブル42
の内容を書き換える。この領域統合処理の詳細は後述す
る。
【0050】以上のように構成された文書画像領域分割
装置において文書画像の領域分割処理の流れについて、
図4を用いて説明する。図4は、本実施の形態における
文書画像の領域分割処理の流れを示すフロー図である。
【0051】まず、分割の対象となる文書画像が画像入
力手段2から入力され、文書画像テーブル31に記録さ
れる(S401)。
【0052】次に、ラン情報作成部11にて、記録され
た文書画像のラン情報が作成され、ラン情報テーブル5
1に記録される(S402)。
【0053】次に、分割可能判別部12にて、記録され
たラン情報の白ランの検出率から、文書画像が分割可能
であるか否かを判別する(S403)。
【0054】白ラン検出率が、設定値テーブル52に予
め設定された値より低ければ、分割不可能であると判別
され、領域分割部15にて、文書画像をN個(Nは自然
数)の同じサイズの矩形領域に強制的に分割する(S4
04)。
【0055】そして、ラン情報作成部11にて、強制分
割された文書画像の各領域について、それぞれラン情報
が作成され(S402)、分割可能判別部12にて記録
されたラン情報の白ランの検出率から、文書画像が分割
可能であるか否かを判別し(S403)、分割不可能で
あると判別されると更に強制分割を繰り返す(S40
4)。
【0056】また、白ラン検出率が予め設定された値よ
り高ければ、文書画像は分割可能と判別され、閾値算出
部14と領域分割部15にて、境界を検出し、通常分割
を実行する(S405)。以下、通常分割により分割さ
れた領域を「小領域」という。
【0057】すべての領域について通常分割を終了する
と、属性判別部16にて、各小領域の属性を判別する
(S406)。
【0058】次に、強制分割がされた場合(S40
7)、小領域の形態を比較し、形態が類似する小領域同
士を統合する(S408)。
【0059】最後に、得られた領域情報が領域情報テー
ブル42に記録され(S409)、全体の処理が終了す
る。
【0060】図5は、本実施の形態における領域情報の
データ構造図である。図5において、データ構造501
は、矩形である文書画像の領域情報であり、領域を識別
するID番号、幅、高さ、全ページに対する左上角の位
置座標及び小領域の数を含む。また、この領域に対する
領域分割より発生した小領域の情報として、その小領域
のID番号、幅、高さ、文書画像全体に対する左上角の
位置座標及び属性も含んでいる。同様に、他の文書画像
についても同様の情報が記録される。
【0061】以上の動作を実行することにより、指定領
域の構成が、領域幅に近い長さの空白帯が存在しない複
雑な場合でも領域分割できる。
【0062】次に、通常分割処理について図面を参照し
て詳細に述べる。
【0063】図6は、本実施の形態における文書画像の
領域分割処理の流れを示すフロー図である。
【0064】まず、閾値算出部14にて、ラン情報テー
ブル52に記録されたラン情報の文書画像全体の白ライ
ン連続数から、境界と判別される白ライン連続数の最低
値である閾値が算出される(S601)。
【0065】次に、領域分割部15にて、閾値を超える
白ライン連続数の有無により、領域の境界が含まれるか
否か判別される(S602)。
【0066】閾値を超える白ライン連続数を有する場
合、境界が含まれると判別され、閾値を超える白ライン
連続数が有る位置を境界候補位置とし(S603)、分
割した領域が生成される(S604)。
【0067】次に、分割された領域それぞれについて、
S601からS603までの処理が実行され、さらに分
割処理が繰り返される。
【0068】領域の分割処理を繰り返すことで、最初に
領域の境界と判別される閾値が的確に設定されず、検出
できない領域の境界が存在しても、次の分割で検出され
ることになる。
【0069】閾値を超える白ライン連続数を有しない場
合、領域の境界が含まれないと判別され、得られた領域
情報を領域情報テーブル42に記録され(S605)、
通常分割処理が終了する。
【0070】次に、領域の属性決定方法について、図面
を参照して詳細に説明する。
【0071】まず、従来の一般的な方法について説明す
る。この方法は、領域内に白ラインの有無に着目し、白
ラインが規定数以上有れば文書領域として判別され、白
ラインが規定数以上無ければ画像領域として判別され
る。
【0072】属性が文書の場合は、領域内の水平及び垂
直の空白帯の数及び幅を検出し、水平方向の空白帯が垂
直方向の空白帯に比べ大きければ、その文書は横書きと
判別され、その逆であれば、その文書は縦書きと判別さ
れる。
【0073】図7は、属性判別の対象となる文書領域の
模式図である。図7において、RHは領域高さ、RWは
領域幅を示す。Whは水平方向の空白帯の幅、Wvは垂
直方向の空白帯の幅を示す。WhがWvに比べ大きいた
め、図7の文書は横書きと判別される。
【0074】属性が画像の場合は、領域内の黒画素密度
を計算し、黒画素密度が高ければ写真の画像領域と判別
され、黒画素密度が低ければ線画の画像領域と判別され
る。
【0075】しかし、上記属性決定方法は、精度があま
り高くないので、本実施形態においては、以下に説明す
る属性決定方法を用いる。
【0076】図8は、本実施の形態における属性指定の
対象となる設定領域の模式図である。
【0077】図8において、文書画像801に対して、
読み取り前に手書き直線804を書き込む。この直線は
厳密に傾き一定の直線でも、多少直線にゆがみがあって
も構わないが、領域中の水平直線あるいは垂直直線と区
別するため、必ず斜線とすることが必要である。傾き角
は特定できないが、±45度にマージンを±20度加え
た角度とする。また、斜線の向きによって属性を別にす
ることも可能である。領域分割後この領域803におい
てその直線が検出された場合、その領域にはそのことを
示す属性が付加されるため、他の領域、例えば802と
の区別が可能になる。
【0078】次に、上記の文書画像の領域の属性判別処
理の動作について、図9を用いて説明する。図9は、本
実施の形態における属性判別処理の流れを示すフロー図
である。なお、読み取り前の文書画像の対象となる領域
には、予め手書き直線が書き込まれている。
【0079】まず、文書画像の読み取り、分割処理を完
了した後、属性判別部16にて、判別処理の対象となる
小領域が指定され(S901)、その小領域は適当な大
きさで同じ幅、高さの領域片に分割される(S90
2)。
【0080】図10は、本実施の形態における属性指定
の対象となる文書画像の模式図である。図10におい
て、1001は分割された小領域、1002は小領域1
001を同じ幅、高さの領域群に分割した場合の一領域
片である。1003、1004及び1005は、ユーザ
ーにより書き込まれた手書き線である。
【0081】次に、各領域片を指定された方向に、一定
の角度で回転させる(S903)。
【0082】一般的に、回転前の文書画像の画素の点の
座標を(x、y)、回転角をθとすると、回転後の文書
画像の画素の点の座標を(X,Y)は、以下に示す式
(3)で表される。
【0083】
【数3】 次に、ラン情報作成部103にて、回転された文書画像
のラン情報が作成され、ラン情報テーブルに記録される
(S904)。
【0084】図11は、本実施の形態における手書き線
を回転した様子を示す概念図である。図11(a)、
(b)、(c)に示すように、手書き直線の傾きθcが
0に近付くほど検出されるの黒ランの長さが長くなる。
そして、手書き直線の傾きθcがある角度θdで、黒ラン
の幅が領域幅Wにほぼ近い長さとなり、黒ラインが検出
され、黒ライン連続数も増加する。
【0085】次に、属性判別部16にて、記録されたラ
ン情報の黒ライン連続数が設定値テーブル52に設定さ
れた規定数以上か否かを判別される(S905)。
【0086】角度θcが角度θd±dθs(0<dθs)
の範囲内における黒ライン連続数が規定数以上である場
合は、手書き線の一部が検出されたと判別してカウント
される(S906)。また、黒ライン連続数が規定数以
上でない場合は、S903からS905までの処理を刻
み角度の合計が設定テーブル52に規定した回転角度を
超えるまで繰り返される(S907)。
【0087】そして、すべての領域片に対して、S90
3からS907までの処理が行われる(S908)。
【0088】すべての領域片に対する処理が終了する
と、領域片の合計数に対する手書き線の一部が検出され
たと判別した領域片の割合から属性が判別される(S9
09)。
【0089】以上のS902からS909までの処理を
すべての小領域に対して行い(S910)、すべての小
領域の属性が判別される。
【0090】この結果、属性判別が確実かつ容易とな
り、特定の属性を持つ領域に対してのみ文字認識を行わ
せるなどの処理が可能となる。
【0091】次に、強制分割された場合の小領域の統合
処理(以下「領域統合処理」という)について、図面を
用いて説明する。図12は、本実施の形態における領域
統合処理の流れを示すフロー図である。
【0092】まず、小領域統合部17にて、強制分割さ
れた隣接する2つの領域を設定する(S1201)。
【0093】次に、一方の領域(以下「比較元領域」と
いう)内の統合の対象となる小領域及び他方の領域(以
下「比較先領域」という)内の各小領域を選定する(S
1202)。そして、選定された小領域に対して、それ
ぞれ統合の判別がされる(S1203)。
【0094】ここで、小領域の類似判断条件について述
べる。対象となる2つの小領域で、以下の条件のすべて
合致すれば類似すると判断される。
【0095】(a)幅または高さの大きさが近い。 (b)矩形のx座標またはy座標が近い位置にある。 (c)属性が同じ。
【0096】次に、2つの小領域が類似されていると判
断された場合で、この2小領域間に別の小領域が存在し
ていない(S1204)と判断された場合は、この2小
領域を統合して1つの小領域とされる(S1205)。
【0097】類似されていないと判断された場合は、次
の比較先領域内の小領域を設定して(S1206)、S
1202からS1203の比較テストを繰り返す(S1
207)。
【0098】比較元領域内の各小領域についてS120
2からS1207までの処理を繰り返し(S120
8)、すべての小領域について比較判別を行い(S12
09)、領域統合処理を完了する。
【0099】図13は、本実施の形態における領域統合
処理前後の模式図である。図13(a)は、領域統合処
理前の状態で、文書画像を1301、1302の2個の
領域に強制分割し、それぞれについて通常分割を実行
し、矩形で示したような小領域に分割された場合を示し
ている。
【0100】領域1301の小領域1303は属性が
「図(写真)」であり隣接する領域1302の小領域1
304が同様に属性が「図(写真)」であり、幅は異な
るが高さと位置が近いので元々同一領域であると判断し
て統合する。同様の判断で、小領域1305と小領域1
306、小領域1307と小領域1308を統合する。
領域統合処理を行った結果、文書画像は、図13(b)
に示す状態となる。
【0101】強制分割及び領域統合処理を実行すること
により、領域幅に近い長さの空白帯が存在しない複雑な
構成を持つ文書画像でも領域分割できる。
【0102】
【発明の効果】以上説明したように本発明によれば、領
域幅に近い長さの空白帯が存在しない複雑な構成を持つ
文書画像でも領域分割が可能で、文書画像に応じて領域
の境界となる閾値を変更することにより高精度の領域分
割が可能で、ユーザーの手書き線を判別することにより
高精度の領域属性判別が可能な文書画像領域分割装置並
びにこれを用いた文書画像の領域分割方法及び文書画像
の領域属性の指定方法を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施の形態における文書画像の領域
分割装置の構成を示すブロック図。
【図2】本実施の形態におけるラン情報作成の説明図。
【図3】検出された白ライン連続数とその検出頻度の相
関を示す図。
【図4】本実施の形態における文書画像の領域分割処理
の流れを示すフロー図。
【図5】本実施の形態における領域情報のデータ構造
図。
【図6】本実施の形態における文書画像の領域分割処理
の流れを示すフロー図。
【図7】属性判別の対象となる文書領域の模式図。
【図8】本実施の形態における属性指定の対象となる設
定領域の模式図。
【図9】本実施の形態における属性判別処理の流れを示
すフロー図。
【図10】本実施の形態における属性指定の対象となる
文書画像の模式図。
【図11】本実施の形態における手書き線を回転した様
子を示す概念図。
【図12】本実施の形態における領域統合処理の流れを
示すフロー図。
【図13】本実施の形態における領域統合処理前後の模
式図。
【図14】分割処理の対象となる文書画像の模式図
【符号の説明】
1 制御ユニット 2 画像入力装置 3 データ記憶手段 4 RAM 11 ラン情報作成部 12 分割可能判別部 13 強制分割部 14 閾値算出部 15 領域分割部 16 属性判別部 17 領域統合部 31 文書画像テーブル 32 領域情報テーブル 41 ラン情報テーブル 42 設定値テーブル

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文書画像のラン情報を作成するラン情報
    作成手段と、前記ラン情報の白ライン連続数を統計的に
    処理して閾値を算出する閾値算出手段と、前記閾値を越
    える白ライン連続数を有する個所で前記文書画像を分割
    する領域分割手段とを具備することを特徴とする文書画
    像領域分割装置。
  2. 【請求項2】 ラン情報の白ライン検出率から文書画像
    が分割可能か否かを判別する判別手段と、文書画像を分
    割できない場合、文書画像を強制的に分割する強制分割
    手段と、強制的に分割した文書画像を元の文書画像を再
    現するように統合する領域統合手段とを具備することを
    特徴とする請求項1記載の文書画像領域分割装置。
  3. 【請求項3】 閾値算出手段は、強制的に分割されたす
    べての文書画像について、請求項1記載の閾値を算出
    し、領域分割手段は、前記強制的に分割されたすべての
    文書画像について、請求項1記載の分割をすることを特
    徴とする請求項2記載の文書画像領域分割装置。
  4. 【請求項4】 閾値算出手段は、閾値の算出を白ライン
    連続数の平均値を用いるか、白ライン連続数の標準偏差
    と分散を用いるかを、ラン情報のサンプル数の量により
    決定することを特徴とする請求項1乃至請求項3のいず
    れかに記載の文書画像領域分割装置。
  5. 【請求項5】 文書画像から求められた白ライン連続数
    を統計的に処理して閾値を算出し、前記閾値を越える白
    ライン連続数を有する個所で前記文書画像を分割するこ
    とを特徴とする文書画像領域分割方法。
  6. 【請求項6】 文書画像の白ライン検出率を求めて、文
    書画像が分割可能か否かを判別し、文書画像を分割でき
    ない場合に強制的に分割し、強制的に分割されたすべて
    の文書画像を分割し、元の文書画像を再現するように強
    制的に分割された文書画像を統合することを特徴とする
    請求項5記載の文書画像領域分割方法。
  7. 【請求項7】 文書画像の特定の属性の領域に手書き線
    を記入し、請求項5又は請求項6記載の文書画像領域分
    割方法にて領域を分割し、前記手書き線の有無及びパタ
    ーンにより領域の属性を判別し、前記手書き線が記入さ
    れた領域を他の領域と区別して処理することを特徴とす
    る文書画像領域属性指定方法。
JP9227100A 1997-08-07 1997-08-07 文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法 Pending JPH1153467A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9227100A JPH1153467A (ja) 1997-08-07 1997-08-07 文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9227100A JPH1153467A (ja) 1997-08-07 1997-08-07 文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法

Publications (1)

Publication Number Publication Date
JPH1153467A true JPH1153467A (ja) 1999-02-26

Family

ID=16855494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9227100A Pending JPH1153467A (ja) 1997-08-07 1997-08-07 文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法

Country Status (1)

Country Link
JP (1) JPH1153467A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052048A (ja) * 2005-08-15 2007-03-01 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム
US7876470B2 (en) 2003-10-31 2011-01-25 Canon Kabushiki Kaisha Printing method, printing control apparatus, printing apparatus, and control method therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7876470B2 (en) 2003-10-31 2011-01-25 Canon Kabushiki Kaisha Printing method, printing control apparatus, printing apparatus, and control method therefor
JP2007052048A (ja) * 2005-08-15 2007-03-01 Fuji Xerox Co Ltd 教材処理装置、教材処理方法および教材処理プログラム

Similar Documents

Publication Publication Date Title
JP3278471B2 (ja) 領域分割方法
JP3576570B2 (ja) 比較方法
JPH09179937A (ja) 文書画像のセンテンスの境界の自動識別方法
JP3285686B2 (ja) 領域分割方法
JPH1153467A (ja) 文書画像領域分割装置並びにこれを用いた文書画像の領域分割方法及び文書画像の領域属性の指定方法
JP3544324B2 (ja) 文字列情報抽出装置及び方法及びその方法を記録した記録媒体
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3947173B2 (ja) 表画像処理装置、プログラム記録媒体、表画像処理方法
JP2669661B2 (ja) 文書画像処理方法
JPH1153539A (ja) 円形パターン判定方法および記録媒体
JP4080157B2 (ja) 画像処理装置、画像処理方法、及び記録媒体
JP3281469B2 (ja) 文書画像の傾き検出方法および装置
JP3095470B2 (ja) 文字認識装置
JP3406942B2 (ja) 画像処理装置及び方法
JP3019897B2 (ja) 行切出し方法
JP3409993B2 (ja) 接触パターンを分離するパターン分離装置および方法
JP3100825B2 (ja) 線認識方法
JPH0822507A (ja) 文書認識装置
JP3190794B2 (ja) 文字切り出し装置
JP3220226B2 (ja) 文字列方向判別方法
JPH10116317A (ja) 文字認識方法および記録媒体
JPH10507014A (ja) 2進イメージにおけるランドスケープ・スキャンの自動決定
JPH11242716A (ja) 画像処理方法および記録媒体
JP3071479B2 (ja) 行間スペース検出方法
JP3381803B2 (ja) 傾き角検出装置