JPH09114923A - 領域分割装置 - Google Patents

領域分割装置

Info

Publication number
JPH09114923A
JPH09114923A JP7274037A JP27403795A JPH09114923A JP H09114923 A JPH09114923 A JP H09114923A JP 7274037 A JP7274037 A JP 7274037A JP 27403795 A JP27403795 A JP 27403795A JP H09114923 A JPH09114923 A JP H09114923A
Authority
JP
Japan
Prior art keywords
area
area dividing
result
image data
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7274037A
Other languages
English (en)
Inventor
Toshifumi Yamaai
敏文 山合
Toshio Miyazawa
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7274037A priority Critical patent/JPH09114923A/ja
Publication of JPH09114923A publication Critical patent/JPH09114923A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 様々な文書に対し正確な領域分割結果を得ら
れる領域分割装置を実現する。 【解決手段】 文書構造簡易判定部106による入力文
書構造の簡易判定の結果に応じて、パラメータ設定部1
08が異なった複数のパラメータセットを設定する。領
域分割部110は、設定された各パラメータセット毎に
入力文書の領域分割を行なって結果データをメモリ11
2に格納する。この結果データは、表示順番決定部11
4により、パラメータの使用頻度順または確信度の高い
順にソートされ、第1位のものから順にディスプレー1
24に表示される。複数の結果データを縮小して同時に
ディスプレー124に表示させることも可能である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の画像データ
より文字領域や図表領域等を切り分ける領域分割(レイ
アウト認識)に関する。
【0002】
【従来の技術】文書の内容をデータ処理し、テキストデ
ータとして再利用する場合、文字で書かれた文章がどこ
に存在するかといったレイアウト情報が重要である。例
えば、文書をイメージスキャナ等で画像データとして読
み込み、文字領域と図形領域等に領域分割を行なってレ
イアウト情報を得る。そして、文字領域に関しては文字
認識処理を行なってテキストデータへ変換する。この場
合、領域分割は文字認識処理の前処理として利用される
ことになる。文書の画像データを光ディスク等にファィ
リングしたりファクシミリで送信したりする場合にも、
文書の画像中の属性の異なる領域の処理方法を最適化す
る等のために、領域分割は重要な技術である。
【0003】領域分割の技術として、射影を利用する方
法(特開平5−266250号)、黒画素の統合による
方法(特開平5−274472号、特願平5−3312
52号)、空白セパレータと射影を利用する方法(特開
平3−126181号)等々、様々な手法が提案されて
いる。しかし、どのような内容の文書に対しても完全な
レイアウト認識が可能な特定の手法は、見当たらない。
【0004】
【発明が解決しようとする課題】したがって、本発明の
目的は、様々な文書等に関し、より精度の高い領域分割
結果をユーザーに提示するための領域分割装置を提供す
ることにある。
【0005】認識技術という点で領域分割と共通する文
字認識において100%の認識率を達成することが困難
であるのと同様、領域分割も特定の手法によって100
%の正解率を期待することは現状では困難と考えられる
ので、領域分割結果の修正をユーザーが行なわなければ
ならない場合が少なくない。その場合、できる限り正解
に近い領域分割結果をユーザーに提示できれば、領域分
割結果の修正のためのユーザーの負担が軽くなる。
【0006】よって本発明のもう一つの目的は、複数の
領域分割結果の中から、最も正解に近い認識結果をユー
ザーが容易に選択できるようにした領域分割装置を提供
することにある。
【0007】
【課題を解決するための手段】上記課題を解決するた
め、請求項1記載の発明により提供される領域分割装置
は、文書の2値画像データに対し領域分割を行なうため
の領域分割手段を持ち、該領域分割手段により異なった
パラメータ設定にて同一の2値画像データに対し領域分
割を2回以上実行し、2以上の領域分割結果を得ること
を特徴とするものである。
【0008】請求項2記載の発明は、請求項1記載の発
明による領域分割装置において、文書の2値画像データ
に対し文書構造の簡易判定を行なう手段と、該文書構造
の簡易判定の手段による判定結果に応じて該領域分割手
段のパラメータを可変設定する手段とをさらに有するこ
とを特徴とするものである。
【0009】請求項3記載の発明により提供される領域
分割装置は、文書の2値画像データに対し、それぞれ異
なったアルゴリズムにより領域分割を行なうための複数
の領域分割手段を有し、該複数の領域分割手段中の少な
くとも2以上の領域分割手段により同一の2値画像デー
タに対し領域分割を行ない、2以上の領域分割結果を得
ることを特徴とするものである。
【0010】請求項4記載の発明は、請求項3記載の発
明のよる領域分割装置において、文書の2値画像データ
に対し文書構造の簡易判定を行ない、その判定結果に応
じて該複数の領域分割手段の中から特定の領域分割手段
を選択する手段をさらに有し、該特定の領域分割手段に
より同一の2値画像データに対し領域分割を実行するこ
とを特徴とするものである。
【0011】請求項5記載の発明は、請求項3記載の発
明による領域分割装置において、文書の2値画像データ
に対し文書構造の簡易判定を行ない、その判定結果に応
じて該複数の領域分割手段の中から特定の領域分割手段
を選択する手段と、該文書構造の簡易判定の手段による
判定結果に応じて該特定の領域分割手段のパラメータを
可変設定する手段とをさらに有し、該特定の領域分割手
段により異なったパラメータ設定で同一の2値画像デー
タに対して領域分割を実行することを特徴とするもので
ある。
【0012】請求項6記載の発明は、請求項1乃至5の
いずれか1項に記載の発明による領域分割装置におい
て、同一の文書に対して複数の異なった2値化閾値また
は2値化手法を適用して複数の2値画像データを入力
し、該複数の2値画像データそれぞれに対し領域分割が
実行されることを特徴とするものである。
【0013】請求項7記載の発明は、請求項1乃至6の
いずれか1項記載の発明による領域分割装置において、
得られた2以上の領域分割結果を順序付けする手段をさ
らに有し、該領域分割結果が順序付けされた順にディス
プレーに表示されることを特徴とするものである。
【0014】請求項8記載の発明は、請求項7記載の発
明による領域分割装置において、複数の領域分割結果を
縮小して同時にディスプレーに表示できることを特徴と
するものである。
【0015】請求項9記載の発明は、請求項7記載の発
明による領域分割装置において、得られた複数の領域分
割結果はそれぞれの確信度の高い順に順序付けされるこ
とを特徴とするものである。
【0016】請求項10記載の発明は、請求項9記載の
発明による領域分割装置において、領域分割結果の確信
度の決定に領域の重なりの具合が用いられることを特徴
とするものである。
【0017】請求項11記載の発明は、請求項9記載の
発明による領域分割装置において、領域分割結果の確信
度の決定に領域内部の空白部分の情報が用いられること
を特徴とするものである。
【0018】請求項12記載の発明は、請求項9記載の
発明による領域分割装置において、領域分割結果の確信
度を、それと一致または類似する他の領域分割結果の数
が多いほど高くすることを特徴とするものである。
【0019】
【発明の実施の形態】本発明の実施の形態を明らかにす
るため、図面を用いて複数の実施例を説明する。なお、
各実施例の説明において、他の実施例と共通する装置構
成に関して図面の援用をすることがある。また、2以上
のブロック図において、対応部または同等部について同
一の参照符号を便宜用いることがある。
【0020】<実施例1>図1は本実施例の装置構成を
示すブロック図であり、図2は本実施例の処理の流れを
示すフローチャートである。
【0021】図1に示した領域分割装置はスキャナ10
0、画像入力部102、画像メモリ104、文書構造簡
易判定部106、パラメータ設定部108、領域分割部
110、結果データセット格納メモリ112、表示順番
決定部114、領域結果表示部116、結果候補変換部
118、指示装置120、画像表示部122、及びディ
スプレー124を含む。上記各部の動作制御等を行なう
機能部もあるが、図示されていない。この領域分割装置
は例えば文字認識装置の前処理に用いることができ、そ
の場合には、この領域分割装置で最終的に確定された領
域分割結果の情報と、画像メモリ104内の画像データ
とを文字認識装置側からアクセスすることができるよう
にされる。
【0022】この領域分割装置の動作の概略は次のとお
りである。スキャナ100は文書をスキャンし、その画
像を多値画像データとして読み取る。画像入力部102
は、スキャナ100より入力される多値画像データを2
値画像データに変換して画像メモリ104に格納する。
画像メモリ104は、この入力文書の2値画像データ以
外のイメージデータの記憶にも利用される。文書構造簡
易判定部106は、画像メモリ104に格納された入力
文書の2値画像データに対し文書構造の簡易判定(詳細
は後述)を行なう。
【0023】パラメータ設定部108は、この文書構造
簡易判定の結果に応じて領域分割部110に対し複数の
パラメータセットを設定する。領域分割部110は、画
像メモリ104に入力された文書画像データ(または、
その縮小画像データ)に対して領域分割を行なうが、こ
の領域分割を、パラメータ設定部108により設定され
たパラメータセットの数だけ実行し、それぞれの領域分
割の結果データのセットを結果データセット格納メモリ
112に格納する。すなわち、本実施例では、領域分割
のパラメータの可変設定を行ない、異なったパラメータ
設定にて同一の2値画像データに対する領域分割を2回
以上実行し、2以上の領域分割結果を得るわけである。
【0024】表示順番決定部114は、結果データセッ
トを、領域分割結果の表示順にソートする。すなわち、
2以上の領域分割結果の順序付けがなされる。
【0025】領域結果表示部116は、ソート後の結果
データセットの先頭の結果データ(第1位の候補)をデ
ィスプレー124に表示させる。画像メモリ104内の
入力文書の2値画像データも画像表示部122によりデ
ィスプレー124へ出力され、領域分割の結果データと
ともに表示される。
【0026】ユーザーは、表示された領域分割の結果を
確認し、他の領域分割の結果を確認したいときには指示
装置120を介して次の領域分割結果の表示を指示す
る。この指示を受けた結果変換部118は、領域結果表
示部116に対して次位の結果データを表示させる。ユ
ーザーは表示された、ある領域分割結果に満足した時に
は、指示装置120を介して、その確定を指示すること
ができ、また領域分割結果の修正も可能である。確定さ
れた領域分割結果は、例えば文字認識装置において文字
認識処理に利用されることになる。
【0027】次に、文書の2値画像データが入力された
後の処理内容について、図2のフローチャートに沿っ
て、より具体的に説明する。
【0028】文書が入力されると、まず文書構造簡易判
定部106で入力文書の構造の簡易判定を行なう(ステ
ップ200)。文書構造判定の内容は、領域分割のため
のパラメータの設定の目安を与える程度でよく、したが
って、領域分割部110で採用される領域分割アルゴリ
ズムと関連することになるが、通常、文字サイズや、マ
ルチコラムかシングルコラム等々の比較的大雑把なもの
で十分である。
【0029】例えば、文書中の罫線(コラム間のセパレ
ータ)の数とその位置を大まかに調べる。領域中にセパ
レータがあればシングルコラムであることはないし、ま
た、罫線が等間隔に存在する場合は新聞である可能性が
ある。
【0030】文書中の空白部分の大きさとその位置を大
雑把に調べる。領域中に帯状の空白部分が存在すれば、
それはセパレータである可能性が高いのでシングルコラ
ムであることはない。帯状の空白部分があっても、その
中に大きなものがなければ、入り組んだマルチコラムで
あると推定される。
【0031】文字らしい矩形の間隔を統計処理し、コラ
ム間距離に相当するピークが出ないときは、シングルコ
ラムであると判定する。ここで文字らしい矩形とは、単
純に矩形の大きさの閾値処理で判断すればよい。また、
文字らいし矩形の大きさの統計処理によって、おおよそ
の文字サイズを推定する。
【0032】新聞は1行の大きさのパターンが本文、概
要等の部分毎に大体決まっているので、そのパターンを
ある幅を持たせて予め決めておく。そして、入力文書の
1行の大きさを調べ、予め決めたパターンに当てはまっ
た場合に新聞らしいと判定する。
【0033】文書構造簡易判定が終了すると、パラメー
タ設定部108において、文書構造簡易判定の結果に応
じて、必要なパラメータを抽出し、可能なパラメータセ
ット(例えばシングルコラム用パラメータセット、雑誌
用パラメータセット、新聞用パラメータセット)を全て
設定する(ステップ201)。通常、2つ以上のパラメ
ータセットが設定される。この際、可能なパラメータは
全て設定する。
【0034】領域分割部110の領域分割のアルゴリズ
ムとして、本実施例では、特願平5−331252号の
明細書及び図面に述べられているような、文書画像の圧
縮画像より黒画素連結成分に外接する矩形を抽出し、そ
の矩形を文字矩形とそれ以外の矩形とに分類し、それぞ
れの矩形の統合により文字領域や図その他の領域を抽出
する方法を想定している。したがって、パラメータとし
ては、例えば、文字間距離のパラメータ、行間距離のパ
ラメータ、文字サイズのパラメータ、文字サイズの違い
を吸収できるような画像圧縮率等が用意される。そし
て、例えば、「シングルコラムらしい」ときには文字間
距離と行間距離を大きめに設定し、「マルチコラムらし
い」ときには文字間距離と行間距離を小さめに設定し、
「新聞らしい」ときには新聞のパターンにあわせて文字
間距離と行間距離をいくつか設定する。また、判定した
文字サイズが例えば8mm程度ならば、6mm程度の文字サ
イズ用パラメータから1cm程度の文字サイズ用パラメー
タまで設定する。なお、他の領域分割アルゴリズムを利
用してもよいが、アルゴリズムによっては用意すべきパ
ラメータを変更しなければならないかもしれない。
【0035】領域分割部110において、パラメータ設
定部108により設定された各パラメータセットを用
い、入力文書の2値画像データに対する領域分割の処理
を行なう(ステップ202)。したがって、設定された
パラメータセットの数と同じ回数、領域分割処理が繰り
返され、同数の結果データが得られることになる。そし
て、領域分割結果データのセットが結果データセット格
納メモリ112に格納される。
【0036】領域分割処理は、その後に適用されること
の多い文字認識処理に比べると非常に高速なものが多
い。したがって、パラメータ設定を変えて高速なアルゴ
リズムを複数回繰り返しても速度上の不利益はあまり問
題とならず、精度の向上を期待できる。そして、パラメ
ータ設定の前段で、上に述べたように「マルチコラムら
しい」「シングルコラムらしい」「新聞らしい」「文字
サイズはどの位」といった文書文書構造簡易判定を行な
い、その結果に応じてパラメータ設定を行なうことによ
り、結果データセット中に正しい領域分割結果データが
含まれている可能性が高くなる。また、領域分割処理を
実行してみるまでもなく不適当なパラメータ設定を排除
することにより、明らかに不適切な領域分割結果の発生
を減らすることができる。
【0037】領域分割処理が終了すると、表示順番決定
部114において、領域分割のパラメータの使用頻度の
順番に結果データセット格納メモリ112内の結果デー
タセットを並べ替える(ステップ203)。並べ替え
(順序付け)後の先頭の結果データが最初に表示される
第1位の結果データであり、以下並び順に表示順位が下
がる。
【0038】領域結果表示部116は、第1位の結果デ
ータ(第1候補)をディスプレー124へ出力し画面に
表示させ、また、画像表示部122は入力文書の2値画
像データをディスプレー124へ出力し画面に表示させ
る(ステップ204)。ユーザーは、表示された領域分
割結果が正しくないと考えるならば、指示装置120を
操作して次位の結果データの表示指示を結果候補変換部
118に指示する(ステップ205)。この指示を受け
た結果候補変換部118は、結果データセット格納メモ
リ112を参照して表示すべき次位の結果データを確認
し、その表示を領域結果表示部116に指示し、領域結
果表示部116は指示された次位の結果データをディス
プレー124へ出力し画面表示させる(ステップ20
6)。以下、ステップ205、206を繰り返し、正し
いと判断した領域分割結果が表示された時に、指示装置
120の結果確定の操作を行なう(ステップ207)。
最後の結果データが表示された後に、さらに次位の結果
データの表示がユーザーより指示された時には、結果候
補変換部118は第1位の結果データの表示を領域結果
表示部116に指示する。
【0039】なお、正解が結果データセット中に含まれ
ている可能性が高いが、現実的には、前述のように完璧
な正解を期待できないことが多く、正解とはいっても部
分的に修正をする必要があるかもしれない。この場合、
ユーザーは正解に最も近い結果データを選び、それに対
して指示装置120を介し必要な修正を施すことができ
る(図2には示されていない)。
【0040】領域分割の結果データは例えば図3に示す
ような形で表示される。図3において、301は最初に
表示される第1位の結果データ(第1候補)、302は
次に表示される結果データ(第2候補)、303はその
次に表示される結果データ(第3候補)である。結果デ
ータ303が最後の結果データであれば、その表示中に
さらに次位の表示が指示されると最初の結果データ30
1が表示され、さらに指示すると結果データ302が表
示される。結果データ301,302,303中の網か
けされた矩形はそれぞれ、領域分割処理によって分割さ
れた個々の領域(文字領域または図その他の領域)を意
味している。なお、領域分割の結果データと、入力文書
の2値画像データ(またはその縮小画像)とを重ねて表
示させてもよい。
【0041】<実施例2>図4は本実施例の装置構成を
示すブロック図であり、図5は本実施例の処理の流れを
示すフローチャートである。
【0042】図4において、図1と同一の符号が付けら
れた部分は同等部分である。本実施例の領域分割装置
は、図1に示した領域分割装置にあったパラメータ設定
部108に相当する部分がない。また、文書構造簡易判
定部400、領域分割部402及び表示順番決定部41
0が、図1に示した領域分割装置の対応部分106,1
10及び114と相違している。これ以外は図1に示し
た領域分割装置と同様である。
【0043】領域分割部402は、領域分割処理アルゴ
リズムの異なる複数の領域分割部402a,402b,
402c,...を含み、2種類以上の異なったアルゴ
リズムによる領域分割処理を並列的に実行可能である。
実行可能な領域分割処理アルゴリズムは、前記特願平5
−331252号や特開平5−274472号の黒画素
統合による方法、特開平5−266250号の射影を用
いる方法、特開平3−126181号の空白セパレータ
と射影を利用する方法等である。これらはあくまで例で
あり、他のアルゴリズムも採用し得る。
【0044】文書構造簡易判定部400は、図1の文書
構造簡易判定部106と同様の文書構造の簡易判定を行
ない、判定した文書構造に応じて必要な領域分割アルゴ
リズムを通常2つ以上選択し、選択したアルゴリズムを
実行する領域分割部(402a,402b,402
c,...)の動作環境を整え処理を開始させる。
【0045】文書構造と、それを得意とする領域分割ア
ルゴリズムとの関係は、例えば「シングルコラムらし
い」文書に対しては、空白セパレータを用いる方法と射
影を用いる方法が得意であると考えられる。「入り組ん
だコラムがある」文書に対しては、黒画素の統合による
方法が得意と考えられる。「新聞らしい」文書に対して
は、射影を用いた方法が得意と考えられる。
【0046】もっとも、以上は一応の目安であって、ア
ルゴリズムの詳細内容や文書の詳細構造によって、得意
とする文書構造が変わる可能性がある。また、得意とい
っても、これはアルゴリズム間で相対的に得意であると
いう意味である。したがって、判定した文書構造には不
適当と考えられるアルゴリズムは選択すべきでないが、
必ずしも格別得意としないアルゴリズムであっても選択
するのが実際的であろう。このようなことから、本実施
例では、判定した文書構造を不得手とするアルゴリズム
以外のアルゴリズムの全部または、いくつかを選択す
る。このようにすれば、選択したアルゴリズムによる領
域分割処理の結果中に、適切な領域分割が含まれる可能
性が高い。
【0047】表示順番決定部410は、結果データセッ
ト格納メモリ112に格納された結果データを、文書構
造簡易判定で判定した文書構造を得意とするアルゴリズ
ムによる結果を優先した順に並べ替える(順序付け
る)。
【0048】図5のフローチャートに沿って、本実施例
の領域分割装置の全体的動作を説明する。スキャナ10
0及び画像入力部102を介して文書の2値画像データ
が画像メモリ104に入力されると、文書構造簡易判定
部400で入力文書の構造簡易判定を行ない(ステップ
500)、判定した文書構造に応じて、領域分割部40
2内の領域分割部402a,402b,402
c,...の中から必要なものを選択し、その動作環境
を整えて処理を開始させる(ステップ501)。
【0049】選択された各領域分割部(402a,40
2b,402c...)は、画像メモリ104に入力さ
れた文書の2値画像データに対して、それぞれのアルゴ
リズムによる領域分割処理を実行し、結果データを結果
データセット格納メモリ112に格納する。このように
して領域分割の結果データセットが得られると、表示順
番決定部116で、結果データセットに対して、入力文
書構造を最も得意とするアルゴリズムによる結果データ
を先頭に、その次に得意とするアルゴリズムの結果デー
タを2番目に、というように並べ替えを行なう(ステッ
プ503)。
【0050】この後の動作は前記実施例1の領域分割装
置と同様である。領域結果表示部116によって先頭の
結果データ(第1候補)がディスプレー124に出力さ
れ、また入力文書の2値画像もディスプレー124に出
力され画面上に表示される(ステップ504)。ユーザ
ーが指示装置120より次位結果表示を指示すると(ス
テップ505)、結果候補変換部118は領域結果表示
部116に次位の結果データを表示せしめる(50
6)。以下同様の繰り返しにより最も正しい結果データ
を表示させ、必要に応じて結果の修正を行なって結果を
確定する(ステップ507)。結果データは例えば図3
に示すような形態で表示される。
【0051】なお、文書構造簡易判定部106を設け
ず、領域分割部402内の全ての領域分割部402a,
402b,402c,...を動作させる構成も可能で
ある。ただし、結果データセット中に明らかに不適切な
ものが含まれる可能性は大きくなる。
【0052】<実施例3>図6は本実施例の装置構成を
示すブロック図であり、図7は本実施例の処理の流れを
示すフローチャートである。
【0053】本実施例の領域分割装置は、前記実施例1
と前記実施例2とを組合せた如き構成のものである。図
6において、図1または図4と同一の符号が付けられた
部分は同等部分である。
【0054】領域分割部604は、図4の領域分割部4
02と同様な領域分割処理アルゴリズムの異なる複数の
領域分割部604a,604b,604c,...を含
み、2種類以上の異なったアルゴリズムによる領域分割
処理を並列的に実行可能である。さらに、各領域分割部
604a,604b,604c,...は、パラメータ
の可変設定が可能である。
【0055】文書構造簡易判定部600は、図4の文書
構造簡易判定部400と同様に、文書構造の簡易判定を
行ない、判定した文書の構造に応じて必要な領域分割ア
ルゴリズムを選択し、選択したアルゴリズムを実行する
領域分割部(604a,604b,604c,...)
の動作環境を整えるが、さらに判定した文書の構造をパ
ラメータ設定部602に通知する。パラメータ設定部6
02は、文書構造簡易判定部600によって選択された
各領域分割部(604a,604b,604
c,...)それぞれに対し、図1のパラメータ設定部
108と同様に文書構造に応じたパラメータセットを複
数設定する。
【0056】つまり、本実施例では、前記実施例2と同
様に複数の領域分割アルゴリズムの中から必要なアルゴ
リズムが選択され、選択された各アルゴリズム毎に前記
実施例1と同様のパラメータ設定が行なわれる。選択さ
れた領域分割部(604a,604b,604
c,...)はそれぞれ、設定された各パラメータセッ
トを用い、設定されたパラメータセットの数に相当する
回数だけ、領域分割処理を繰り返して実行し、それぞれ
の結果データを結果データセット格納メモリ112に格
納する。
【0057】本実施例の領域分割装置の全体的動作を図
7のフローチャートに沿って説明する。スキャナ100
及び画像入力部102を介して文書の2値画像データが
画像メモリ104に入力されると、文書構造簡易判定部
600で入力文書の構造簡易判定を行ない(ステップ7
00)、判定した文書構造に応じて、領域分割部604
内の領域分割部604a,604b,604c,...
の中から必要なものを選択し、その動作環境を整える
(ステップ701)。また、選択された領域分割部(6
04a,604b,604c,...)のそれぞれに対
して、パラメータ設定部602によりパラメータセット
の設定を行なう(ステップ701)。
【0058】選択された各領域分割部(604a,60
4b,604c...)は、画像メモリ104に入力さ
れた文書の2値画像データに対して、設定された各パラ
メータセットを用いた領域分割処理を、設定されたパラ
メータセットの数に等しい回数、順次繰り返して実行
し、結果データを結果データセット格納メモリ112に
格納する(ステップ702)。
【0059】このようにして領域分割の結果データセッ
トが得られると、表示順番決定部116で、前記実施例
2と同様な結果データセットのソートが行なわれる(ス
テップ703)。以下、前記実施例2のステップ504
〜507(図4)と同様な手順で結果データの表示、必
要な修正と結果データの確定が行なわれる(ステップ7
04〜707)。
【0060】本実施例は、必要な複数の領域分割アルゴ
リズムを用いるだけでなく、その各アルゴリズムをパラ
メータセットの設定を変えて複数回実行するため、前記
各実施例に比べ、正解が得られる可能性がさらに高くな
る。なお、正解が複数得られることも期待できる。
【0061】<実施例4>本実施例の装置構成及び全体
的動作は、前記実施例2または前記実施例3と同様であ
る(前記実施例1と同様な装置構成及び全体的動作とす
ることも可能である)。したがって、装置構成のブロッ
ク図と全体的動作のフローチャートは省略する。本実施
例と前記実施例との相違点は、領域分割処理の複数の結
果データの表示順番の決定の仕方にある。
【0062】すなわち、前記実施例2または実施例3の
表示順番決定部410においては、領域分割アルゴリズ
ムが入力文書の構造を得意とする程度によって、領域分
割処理の複数の結果データの表示順番を決定し、その順
番に結果データを並べ変えた。これに対し、本実施例の
領域分割装置の表示順番決定部においては、図8のフロ
ーチャートに示すように、領域分割処理の各結果データ
の確信度(正解らしさの度合)を求める(ステップ80
0)。そして、確信度の大きい順に結果データを並べ替
える(ステップ801)。
【0063】ステップ800における確信度の求め方
は、どのような証拠を利用するか、1種類の証拠を用い
るか、複数種類の証拠を用いるかを含め様々な方法を採
用可能であるが、その一例を図9のフローチャートに沿
って説明する。図9に示す例では、各結果データについ
て3つの方法で確信度を求め、それらを合成して各結果
データの最終的な確信度を得る。
【0064】図9において、ステップ901〜903は
第1の方法により確信度を求める処理部分である。結果
データセットより1つの結果データを選び(ステップ9
01)、その結果データにおける領域の座標値を調べる
ことにより重なりのある領域の数を検出し(ステップ9
01)、領域相互の包含の度合に応じて(経験値によ
る)当該結果データの確信度を決定する(ステップ90
3)。同様の手順を各結果データに対して順次実行し、
全ての結果データの確信度を決定する。領域分割は属性
の同じ領域(例えば文字領域)を切り分ける処理であ
り、分割された領域に過剰な重なりがある場合、特に、
小さな領域の重なりがある場合は、結果に不具合がある
ことが多い。当該確信度決定方法は、かかる点に着目し
たものである。なお、このような領域分割の間違いは、
画素から矩形、矩形から領域へと統合していくボトムア
ップ的な領域分割手法で起こりやすい。
【0065】図9において、ステップ910,911は
第2の方法により確信度を求める処理部分である。結果
データセットより注目する1つの結果データを選び(ス
テップ910)、この注目した結果データにおける領域
の座標値と他の各結果データにおける領域の座標値を比
較し、一致した(十分に類似した)結果データが1つ見
つかるたびに注目結果データの確信度を1だけ増加させ
る(ステップ911)。注目結果データと一致した(十
分に類似した)他の結果データは保存する必要がないの
で、消去する。注目する結果データを順次変更しなが
ら、同様の操作を繰り返すことによって、全ての結果デ
ータの確信度を決める。
【0066】すなわち、この第2の方法は、領域分割処
理によって得られた複数の結果データを比較し、一致数
の多い分割結果ほど確信度を高くするという方法であ
る。言い換えれば、多数決の理論によって確信度を決め
る。けだし、各種の領域分割アルゴリズムはそれぞれに
特徴があるが、殆どの方法は極く一般的な文書に対して
はかなりの精度を期待し得るまで改良が進んでおり、特
殊な文書でない限り、正解に近い結果を期待してよく、
したがって、多数決論理を採用しても的外れな結果にな
ることは少ないと考えられるからである。
【0067】図9において、ステップ922〜927は
第3の方法により確信度を求める処理部分である。ま
ず、入力された文書の2値画像の圧縮画像を生成する
(ステップ922)。圧縮画像は画像メモリ104に保
存する。圧縮画像を生成するのは、当該ステップ以降の
処理量を減らし処理を高速化するためであるので、圧縮
の方法は問わない。なお、領域分割処理の段階で入力画
像の圧縮画像を生成するならば、その圧縮画像を利用し
てよく、この場合はステップ922は不要になる。
【0068】次に、圧縮画像中の一定値以上の長い白ラ
ンを水平、垂直各方向について抽出し、抽出した長い白
ランの連続を統合することにより、水平、垂直各方向の
白ラン矩形を抽出する(ステップ923)。図10に白
ラン矩形の抽出の例を示す。図10において白抜きの矩
形は長い白ラン、網かけの矩形は短い白ランを意味す
る。黒ランは図示されていない。短い白ランは無視され
るので、ここに示す例では長い白ラン1001,100
2を統合した白ラン矩形1003と、長い白ラン100
4,1005を統合した白ラン矩形1006とが抽出さ
れる。
【0069】このようにして抽出した白ラン矩形の中
で、領域の分割線(セパレータ)らしくないと判断され
る白ラン矩形を廃棄する(ステップ924)。この判断
は大雑把でよい(詳細に行なうと、それ自体が領域分割
処理の一部となってしまう)。例えば、前後の文字サイ
ズに比べて大きな白ラン矩形や長い白ラン矩形を領域の
分割線らしいと判断し、それ以外の白ラン矩形を領域の
分割線らしくないと判断する程度でよい。
【0070】次に、領域分割の結果データセットより1
つの結果データを選び(ステップ925)、その結果デ
ータにおける領域の座標値を調べ、領域に包含される領
域分割線らしい白ラン矩形の数(包含数)を計数する
(ステップ926)。そして、この包含数に応じて(経
験値による)当該結果データの確信度を決定する(ステ
ップ927)。同様の手順を、全ての結果データについ
て実行し、それぞれの確信度を決定する。正確な領域分
割がなされれば、領域内に分割線は含まれないはずであ
るから、領域に分割線が多く含まれる場合は、当然、そ
の結果データの確信度は低い。
【0071】以上のいずれか1つの方法により確信度を
求め、それを最終的な確信度として利用することも可能
であるが、ここに示す例では以上の3方法により決定さ
れた確信度を合成することにより最終的な確信度を求め
る(ステップ930)。確信度の合成方法としては、例
えば、3つの方法による確信度の積(アンド)を最終的
な確信度とする方法や、3つの方法の確信度の中央値を
最終的な確信度とする方法等が可能である。第1方法、
第2方法、第3方法による確信度(確からしい確率)が
それぞれ80%、60%、40%であったとすると、積
をとる方法によれば最終的確信度は19.2%=0.8
×0.6×0.4となり、中央値をとる方法によれば最
終的確信度は60%となる。
【0072】<実施例5>図11は、本実施例の全体的
動作の流れを示すフローチャートである。本実施例の全
体的動作は基本的には前記各実施例の全体的動作と同様
である。したがって、図11のフローチャートに沿っ
て、本実施例と前記各実施例との動作上の相違点を中心
に説明する。また、本実施例の装置構成は前記各実施例
と同様でよいので、以下の説明において装置構成に言及
する必要があるときには、前記各実施例のブロック図
(図1、図4または図6)中の符号を用いる。
【0073】文書画像データの入力に関して述べれば、
入力文書が複数の文字種(明朝、ゴシック等)で構成さ
れている場合、1つの2値化閾値または1つの2値化手
法で入力文書画像データの2値化を行なったのでは、最
適な2値画像データを得られないことがある。例えば、
ゴシックフォントは2値化により潰れが生じやすく、他
方、明朝フォントは2値化によりカスレが生じやすい。
同様に、1つの2値化閾値または2値化手法によったの
では、文字・写真・網点等の領域の違いによっても最適
な2値画像データを得られないことがある。2値画像デ
ータが不適切な場合、高精度の領域分割を期待できな
い。
【0074】そこで本実施例においては、画像入力部
(102)で、複数の異なった2値化閾値または複数の
異なった2値化手法を用いて、スキャナ(100)より
入力した文書の多値画像データの2値化を行なうことに
より、1つの入力文書に対して複数の2値画像データを
生成し、それぞれを画像メモリ(104)に格納する
(ステップ1100)。
【0075】このようにして画像メモリ(104)に得
られた複数の2値画像データのそれぞれに対して、前記
各実施例と同様に(文書構造判定部106,400また
は600、パラメータ設定部108または602、領域
分割処理部110,402または604において)文書
構造簡易判定、パラメータ設定及び/又はアルゴリズム
選択、領域分割処理を実行し、各領域分割処理の結果デ
ータを結果データセット格納メモリ112に格納する
(ステップ1101)。このステップにおける各処理の
内容は、複数の2値画像データを対象にすることを除け
ば前記各実施例と同様である。
【0076】そして、各2値画像データに対する結果デ
ータの並べ替え(順序付け)を表示順番決定部(114
または410)において実行する。並べ替えの方法であ
るが、例えば、どの2値画像データに対する結果データ
であるか区別せず、全ての2値画像データの結果データ
を前記各実施例と同様の方法で並べ替える。あるいは、
文書構造簡易判定により判定された文書構造に適した2
値画像データに対する結果データを優先するように2値
画像データ単位で結果データを並べ替え、その後、各2
値画像データの結果データの間で前記各実施例と同様の
方法による並べ替えを行なう。言うまでもなく、他の並
べ替え方法を採用してもよい。
【0077】このような並べ替えを終了すると、領域結
果表示部(116)により、最初の結果データをディス
プレー(124)に表示させる(ステップ1103)。
また、本実施例では、2値画像データが2つ以上あるの
で、表示した結果データがどの2値画像データに対する
分割結果であるか確認できるようにするため、ディスプ
レー(124)に表示させる結果データに対応した2値
画像データが画像表示部(122)によって画像メモリ
(104)よりディスプレー(124)に出力され表示
される(ステップ1103)。この2値画像データと結
果データはディスプレー(124)の画面上に分離した
形で表示されるか、あるいは重ねた形で表示される。
【0078】ユーザーが次候補の表示を指示装置(12
0)を介して結果候補変換部(118)へ指示すると、
次位の結果データと、それに対応する2値画像データが
ディスプレー(124)に表示される(ステップ110
5)。ユーザーは、正解または正解に最も近いと判断さ
れる結果データが表示されるまでステップ1104,1
105と同様の手順を繰り返し、正解または正解に最も
近い結果データをそのまま確定し、あるいは必要な修正
を施してから確定する操作を行なう(ステップ110
6)。
【0079】<実施例6>前記各実施例は、順序付けた
領域分割の結果データを1つずつ順に表示して正解また
は正解に最も近い結果データを見つける構成であった
が、本実施例は複数の結果データを同時に表示させるこ
とができる。これ以外の動作及び装置構成は前記各実施
例と同様である。
【0080】図12は、本実施例における結果データの
表示方法の一例を説明するための図である。領域結果表
示部(116)は、最初は図12の左側に示すように第
1候補の結果データ1201だけをディスプレー画面に
表示させる。ユーザーが次位の結果データの表示を指示
すると、領域結果表示部(116)は、図12の右側に
示すように、第1候補の結果データ1201、第2候補
の結果データ1202、第3候補の結果データ1203
を縮小してディスプレー画面に表示させる。もし、第3
候補が最後の結果データであれば、全部の結果データを
一斉に確認することができる。
【0081】領域分割においては、文書画像上のノイズ
の影響や、ロゴや特殊変形文字等を文字と分類するか図
領域と分類するか(結果の用途によって異なる)等々、
さまざまな要因により結果が違ったものになるため、修
正を全然必要としない完全な正解を期待することは一般
に困難である。したがって、ユーザーは結果データを比
較し、最も正解に近いと考える結果データを選択するこ
とになろう。そのためには、本実施例のように複数の結
果データが同時に表示されると、結果データ相互間の比
較が容易になるので、より効率的な作業が可能になる。
【0082】
【発明の効果】請求項1乃至5の各項記載の発明によれ
ば、1つのパラメータ設定または1つのアルゴリズムで
領域分割を行なう装置に比べ、様々な入力文書に対し
て、正解または正解に近い領域分割結果を得られる可能
性が高くなる。請求項2または4記載の発明によれば、
領域分割のパラメータ設定及び/またはアルゴリズムを
入力文書の構造に適応させることにより、正解または正
解に近い領域分割結果を得られる可能性がさらに高くな
り、また、入力文書に対し明らかに不適切と考えられる
パラメータ設定またはアルゴリズムによる間違った領域
分割結果の発生を減らすことができる。
【0083】請求項6記載の発明によれば、同一の文書
について異なった2値化閾値または2値化手法を適用し
た複数の2値画像データについて領域分割がなされるた
め、文字種や領域属性等が異なる様々な文書に対して、
正解または正解に近い領域分割結果を得られる可能性が
高くなる。
【0084】請求項7乃至12の各項記載の発明によれ
ば、ユーザーは、複数の領域分割結果を順序付けられた
順に1つずつまたは複数同時に確認することにより、正
解または正解に近い結果を容易に見つけることができ
る。特に、請求項9,10,11または12記載の発明
によれば、複数の認識結果が正解である可能性の高いも
のから順にユーザーに提示されるため、正解の確認を効
率よく行なうことができる。また、請求項8記載の発明
によれば、ユーザーは複数の領域分割結果を同時に見て
相互に比較できるため、正解に近い結果が複数得られた
場合に、その中から最も正解に近い結果を容易に選ぶこ
とができる。
【図面の簡単な説明】
【図1】実施例1の装置構成を示すブロック図である。
【図2】実施例1の動作説明のためのフローチャートで
ある。
【図3】領域分割結果のディスプレー表示方法の一例を
示す図である。
【図4】実施例2の装置構成を示すブロック図である。
【図5】実施例2の動作説明のためのフローチャートで
ある。
【図6】実施例3の装置構成を示すブロック図である。
【図7】実施例3の動作説明のためのフローチャートで
ある。
【図8】実施例4の動作説明のためのフローチャートで
ある。
【図9】確信度を求める方法の一例を示すフローチャー
トである。
【図10】領域分割線(セパレータ)としての白ラン矩
形の抽出処理の説明図である。
【図11】実施例5の動作説明のためのフローチャート
である。
【図12】領域分割結果のディスプレー表示方法の他の
例を示す図である。
【符号の説明】
100 スキャナ 102 画像入力部 104 画像メモリ 106 文書構造簡易判定部 108 パラメータ設定部 110 領域分割部 112 結果データセット格納メモリ 114 表示順番決定部 116 領域結果表示部 118 結果候補変換部 120 指示装置 122 画像表示部 124 ディスプレー 400 文書構造簡易判定部 402(402a,402b,...) 領域分割部 410 表示順番決定部 600 文書構造簡易判定部 602 パラメータ設定部 604(604a,604b,...) 領域分割部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文書の2値画像データに対し領域分割を
    行なうための領域分割手段を有し、該領域分割手段によ
    り、異なったパラメータ設定にて同一の2値画像データ
    に対し領域分割を2回以上実行し、2以上の領域分割結
    果を得る領域分割装置。
  2. 【請求項2】 請求項1記載の領域分割装置において、
    文書の2値画像データに対し文書構造の簡易判定を行な
    う手段と、該文書構造の簡易判定の手段による判定結果
    に応じて該領域分割手段のパラメータを可変設定する手
    段とをさらに有する領域分割装置。
  3. 【請求項3】 文書の2値画像データに対し、それぞれ
    異なったアルゴリズムにより領域分割を行なうための複
    数の領域分割手段を有し、該複数の領域分割手段中の少
    なくとも2以上の領域分割手段により同一の2値画像デ
    ータに対し領域分割を行ない、2以上の領域分割結果を
    得る領域分割装置。
  4. 【請求項4】 請求項3記載の領域分割装置において、
    文書の2値画像データに対し文書構造の簡易判定を行な
    い、その判定結果に応じて該複数の領域分割手段の中か
    ら特定の領域分割手段を選択する手段をさらに有し、該
    特定の領域分割手段により同一の2値画像データに対し
    領域分割を実行する領域分割装置。
  5. 【請求項5】 請求項3記載の領域分割装置において、
    文書の2値画像データに対し文書構造の簡易判定を行な
    い、その判定結果に応じて該複数の領域分割手段の中か
    ら特定の領域分割手段を選択する手段と、該文書構造の
    簡易判定の手段による判定結果に応じて該特定の領域分
    割手段のパラメータを可変設定する手段とをさらに有
    し、該特定の領域分割手段により異なったパラメータ設
    定で同一の2値画像データに対して領域分割を実行する
    領域分割装置。
  6. 【請求項6】 請求項1乃至5のいずれか1項に記載の
    領域分割装置において、異なった2値化閾値または2値
    化手法を適用した同一文書の複数の2値画像データを入
    力し、該複数の2値画像データそれぞれに対し領域分割
    が実行される領域分割装置。
  7. 【請求項7】 請求項1乃至6のいずれか1項記載の領
    域分割装置において、得られた2以上の領域分割結果を
    順序付けする手段をさらに有し、該領域分割結果が順序
    付けされた順に該領域分割結果がディスプレーに表示さ
    れる領域分割装置。
  8. 【請求項8】 請求項7記載の領域分割装置において、
    複数の領域分割結果を縮小して同時にディスプレーに表
    示できる領域分割装置。
  9. 【請求項9】 請求項7記載の領域分割装置において、
    得られた複数の領域分割結果はそれぞれの確信度の高い
    順に順序付けされる領域分割装置。
  10. 【請求項10】 請求項9記載の領域分割装置におい
    て、領域分割結果の確信度の決定に領域の重なりの具合
    が用いられる領域分割装置。
  11. 【請求項11】 請求項9記載の領域分割装置におい
    て、領域分割結果の確信度の決定に領域内部の空白部分
    の情報が用いられる領域分割装置。
  12. 【請求項12】 請求項9記載の領域分割装置におい
    て、領域分割結果の確信度を、それと一致または類似す
    る他の領域分割結果の数が多いほど高くする領域分割装
    置。
JP7274037A 1995-10-23 1995-10-23 領域分割装置 Pending JPH09114923A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7274037A JPH09114923A (ja) 1995-10-23 1995-10-23 領域分割装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7274037A JPH09114923A (ja) 1995-10-23 1995-10-23 領域分割装置

Publications (1)

Publication Number Publication Date
JPH09114923A true JPH09114923A (ja) 1997-05-02

Family

ID=17536091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7274037A Pending JPH09114923A (ja) 1995-10-23 1995-10-23 領域分割装置

Country Status (1)

Country Link
JP (1) JPH09114923A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250816A (ja) * 2004-03-04 2005-09-15 Fujitsu Ltd 文書画像レイアウト解析プログラム
JP2007172132A (ja) * 2005-12-20 2007-07-05 Fujitsu Ltd レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
JP2007233592A (ja) * 2006-02-28 2007-09-13 Fuji Xerox Co Ltd プリンタドライバおよびその印刷制御方法、印刷装置
US8400466B2 (en) 2007-03-13 2013-03-19 Ricoh Company, Ltd. Image retrieval apparatus, image retrieving method, and storage medium for performing the image retrieving method in the image retrieval apparatus

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250816A (ja) * 2004-03-04 2005-09-15 Fujitsu Ltd 文書画像レイアウト解析プログラム
JP4480421B2 (ja) * 2004-03-04 2010-06-16 富士通株式会社 文書画像レイアウト解析プログラム
JP2007172132A (ja) * 2005-12-20 2007-07-05 Fujitsu Ltd レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
JP2007233592A (ja) * 2006-02-28 2007-09-13 Fuji Xerox Co Ltd プリンタドライバおよびその印刷制御方法、印刷装置
JP4715550B2 (ja) * 2006-02-28 2011-07-06 富士ゼロックス株式会社 プリンタドライバおよびその印刷制御方法、印刷装置
US8400466B2 (en) 2007-03-13 2013-03-19 Ricoh Company, Ltd. Image retrieval apparatus, image retrieving method, and storage medium for performing the image retrieving method in the image retrieval apparatus

Similar Documents

Publication Publication Date Title
US7519226B2 (en) Form search apparatus and method
EP0621554B1 (en) Method and apparatus for automatic determination of text line, word and character cell spatial features
CN102782702B (zh) 在光学字符识别(ocr)过程中的段落识别
US7269298B2 (en) Image processing device, image processing method, and record medium on which the same is recorded
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
JPH0668301A (ja) 文字認識方法及び装置
US6532302B2 (en) Multiple size reductions for image segmentation
US11915465B2 (en) Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks
US11348331B2 (en) Information processing apparatus and non-transitory computer readable medium
US10586125B2 (en) Line removal method, apparatus, and computer-readable medium
CN110991440B (zh) 一种像素驱动的手机操作界面文本检测方法
JP2018152026A (ja) 文字認識方法及びコンピュータプログラム
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JPH09114923A (ja) 領域分割装置
US10878271B2 (en) Systems and methods for separating ligature characters in digitized document images
JP4409678B2 (ja) 罫線抽出方式
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
JP6082306B2 (ja) 光学式文字認識用に画像を前処理するための方法およびシステム
JP3484274B2 (ja) 類似文書の領域分割方法
JPH11316797A (ja) 文書画像の領域識別方法および装置
JP2003259129A (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP2000207491A (ja) 文字列読取方法及び装置
JPH07192083A (ja) 文書画像レイアウト解析装置