JP2003143393A

JP2003143393A - 画像のセグメント化処理及び画像のセグメント化方法

Info

Publication number: JP2003143393A
Application number: JP2002288207A
Authority: JP
Inventors: Zhigang Fan; ファンジガン; Hui Cheng; チョンホイ
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 2001-10-12
Filing date: 2002-10-01
Publication date: 2003-05-16
Anticipated expiration: 2022-10-01
Also published as: US20030072487A1; BR0204103A; EP1304651B1; US6973213B2; EP1304651A2; JP4017489B2; EP1304651A3

Abstract

(57)【要約】【課題】バックグラウンドベースのセグメント化処理
を用いた画像のセグメント化方法を提供する。【解決手段】ドキュメント画像１０２をローパスフィ
ルタに通し、大幅に間引きする。間引きされた画像を、
低解像度セグメント化１０４段階によって低解像度で処
理する。セグメント化の結果は、メインバックグラウン
ド及び１つ以上のオブジェクトの識別を含む。テキスト
類又はピクチャ類に分類できないオブジェクトを、更に
ローカルバックグラウンド及びより小さなオブジェクト
にセグメント化する。全てのオブジェクトをテキスト類
又はピクチャ類に分類するまで、この処理を繰り返す。
その結果を、オリジナル解像度リファインメント１０６
段階の際に画像１０２にオーバーレイし、セグメント化
をリファインする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は画像処理に関する。
本発明は、特にメインバックグラウンド、ローカルバッ
クグラウンド、テキストオブジェクト、及びピクチャオ
ブジェクトへの画像のセグメント化に関連して用いら
れ、特にこれらに関連して説明される。しかしながら、
本発明を他の同様の用途に用いてもよいことが理解され
よう。

【０００２】

【従来の技術及び発明が解決しようとする課題】ドキュ
メントの画像は一般に複数の領域を含み、各領域は異な
る性質を示す。複数の領域を含むドキュメントの画像を
正確に処理するために、異なるアルゴリズムを各タイプ
の領域に適用すべきである。例えば、テキスト領域は印
刷前に強調する必要がある。しかしながら、ハーフトー
ンのピクチャは、モアレを防ぐためにまずローパスフィ
ルタに通す必要がある。従って、一般にドキュメント画
像をその構成領域にセグメント化する必要があり、その
後で、画像処理技術を最も有効に適用することができ
る。しかしながら、既存のセグメント化アルゴリズムの
殆どは、強調(enhancement)、レンダリング、又は圧縮
など、特定の画像処理の用途のために設計されている。
用途によって、同一画像のセグメント化が大幅に異なり
うる。圧縮の場合、グラフィックの線はテキストのスト
ロークと同じように処理されうる。しかし、編集の場
合、グラフィックは、テキスト領域のようにフォアグラ
ウンド及びバックグラウンドに分割される代わりに、ピ
クチャ領域のように全体として処理されなければならな
い。画像処理システムはたいていこれらの用途を多く含
むため、複数のセグメント化を計算しなければならない
場合がある。従って、全てではないにしても、多くの画
像処理の用途に適したセグメント化アルゴリズムを開発
することが望ましい。

【０００３】なお、従来の技術は上記課題を解決してい
ない（例えば、特許文献１参照）。

【０００４】

【特許文献１】米国特許第５，７６７，９７８号明細書

【０００５】

【課題を解決するための手段】本発明は、バックグラウ
ンドベースの画像セグメント化処理を提供する。本発明
の１つの態様によると、この処理は、画像をメインバッ
クグラウンド、ローカルバックグラウンド、及び第１の
オブジェクトにセグメント化するステップを含み、第１
のオブジェクトはメインバックグラウンド又はローカル
バックグラウンド上にある。

【０００６】本発明の他の態様によると、この処理は、
ａ）メインバックグラウンド、ローカルバックグラウン
ド、及び第１のオブジェクトへの画像の低解像度セグメ
ント化を行うステップであって、第１のオブジェクトが
メインバックグラウンド又はローカルバックグラウンド
上にある、該ステップと、ｂ）メインバックグラウン
ド、ローカルバックグラウンド、及び第１のオブジェク
トのうちのいずれか２つによって共有される境界を、画
像のオリジナルの解像度でリファインするステップと、
を含む。

【０００７】本発明の他の態様に従って、画像をメイン
バックグラウンド、ローカルバックグラウンド、及びオ
ブジェクトにセグメント化する方法が提供される。この
方法は、ａ）画像のメインバックグラウンドを識別する
ステップと、ｂ）メインバックグラウンド上の第１のオ
ブジェクトを識別するステップと、ｃ）第１のオブジェ
クトを、テキストオブジェクト、ピクチャオブジェク
ト、及び複合オブジェクトからなる類のグループのうち
１つの類に分類するステップと、ｄ）第１のオブジェク
トを複合オブジェクトとして識別した場合、第１のオブ
ジェクトのローカルバックグラウンドを識別するステッ
プと、を含む。

【０００８】

【発明の実施の形態】図１を参照すると、本発明に従っ
たバックグラウンドベースのセグメント化処理１００の
フローチャートが提供されている。バックグラウンドベ
ースのセグメント化処理１００は、高解像度のドキュメ
ント画像１０２のセグメント化用に設計されている。し
かしながら、高解像度でのバックグラウンド検出及びセ
グメント化は計算上高価であり、その結果はハーフトー
ンノイズに影響されやすい。計算の複雑さを少なくし、
ハーフトーンノイズを抑えるために、画像１０２は２つ
の異なる解像度（即ち、低解像度及びオリジナル（元
の）解像度）で処理される。バックグラウンドベースの
セグメント化処理１００は、低解像度のドキュメント画
像のセグメント化にも有用である。ドキュメント画像の
オリジナル解像度を低くすると冗長性や不要な処理が生
じうることを、当業者は認識するであろう。

【０００９】処理１００は、セグメント化されるドキュ
メント画像１０２から始まる。次に、画像１０２をロー
パスフィルタに通し、大幅に間引きする(decimate)。
（即ち、解像度を低くする。）そして、画像を低解像度
セグメント化段階１０４によって低解像度で処理する。
セグメント化の結果は、メインバックグラウンド及び１
つ以上のオブジェクトの識別を含む。テキスト類又はピ
クチャ類に分類できないオブジェクトを、更にローカル
バックグラウンド及びより小さなオブジェクトにセグメ
ント化する。全てのオブジェクトをテキスト類又はピク
チャ類に分類するまでこの処理を繰り返す。次に、セグ
メント化の結果をリファインするための処理のオリジナ
ル解像度リファインメント段階１０６の際に、セグメン
ト化段階１０４の結果を画像１０２にオーバーレイす
る。リファインメント段階１０６が完了すると、画像１
０２のセグメント化処理１００は終了１０８に達する。

【００１０】図２を参照すると、図１のバックグラウン
ドベースのセグメント化処理１００から得られた結果の
一例が提供されている。セグメント化処理は、メインバ
ックグラウンド、ローカルバックグラウンド、及びオブ
ジェクトを識別し、更にオブジェクトをテキスト類又は
ピクチャ類に分類する。図２に示される結果は、ドキュ
メント画像１０２がメインバックグラウンド２０４、２
つのローカルバックグラウンド２１４、テキストオブジ
ェクト２０８、及びピクチャオブジェクト２１０にセグ
メント化されたことを示している。この図の階層は、画
像１０２のセグメント化における複数のレベル（即ち、
２２０、２３０、２４０、２５０、２６０、及び２７
０）を反映している。

【００１１】レベル２２０において、メインバックグラ
ウンド２０４及びメインバックグラウンド上のオブジェ
クト２０６が識別されたことを、図は示している。レベ
ル２３０において、メインバックグラウンド上のオブジ
ェクト２０６がテキストオブジェクト２０８、ピクチャ
オブジェクト２１０、及び複合オブジェクト２１２に分
類されたことを、図は示している。複合オブジェクト２
１２は単に、テキストオブジェクト２０８又はピクチャ
オブジェクト２１０としての識別に必要な基準を満たさ
ないオブジェクトである。レベル２４０において、複合
オブジェクト２１２が更にローカルバックグラウンド２
１４及びローカルバックグラウンド上のオブジェクト２
１６にセグメント化されたことを、図は示している。レ
ベル２５０では、レベル２３０のように、ローカルバッ
クグラウンド２１６上のオブジェクトがテキストオブジ
ェクト２０８、ピクチャオブジェクト２１０、及び複合
オブジェクト２１２に分類されたことを、図は示してい
る。レベル２６０では、レベル２４０のように、複合オ
ブジェクト２１２が更にローカルバックグラウンド２１
４及びローカルバックグラウンド上のオブジェクト２１
６にセグメント化されたことを、図は示している。レベ
ル２７０において、ローカルバックグラウンド上のオブ
ジェクト２１６がテキストオブジェクト２０８及びピク
チャオブジェクト２１０に分類されたことを、図は示し
ている。ローカルバックグラウンドの更なる識別が不要
であり、セグメント化処理が完了したため、複合オブジ
ェクトがレベル２７０において残らなかったことに注意
されたい。

【００１２】図３を参照すると、図１のバックグラウン
ドベースのセグメント化処理１００の低解像度セグメン
ト化１０４段階のフローチャートが提供されている。低
解像度セグメント化１０４段階は、ドキュメント画像１
０２をローパスフィルタに通して大幅に間引きし（３０
２）、画像１０２の低解像度表現（即ち、間引きされた
画像）を生成することによって始まる。次に、メインバ
ックグラウンドを識別する（３０４）。メインバックグ
ラウンド上のテキストオブジェクトを識別し、セグメン
ト化し、分類する（３０６）。メインバックグラウンド
上の他のオブジェクトも識別し、セグメント化する（３
０８）。次いで、その他のオブジェクトをピクチャ類に
分類する（３１０）か、又は、複合オブジェクト類に分
類する（３１２）。

【００１３】複合オブジェクトを識別したら、それを更
にセグメント化する。まず、ローカルバックグラウンド
を識別する（３１４）。次に、ステップ３０６のよう
に、ローカルバックグラウンド上のテキストオブジェク
トを識別し、セグメント化し、分類する（３１６）。ロ
ーカルバックグラウンド上の他のオブジェクトも識別
し、セグメント化する（３１８）。そして、その他のオ
ブジェクトをピクチャ類に分類する（３２０）か、又
は、複合オブジェクト類に分類する（３２２）。この時
点で複合オブジェクトが残っている場合は、ステップ３
１４に戻ってセグメント化を続ける。識別する複合オブ
ジェクトがない場合、セグメント化処理１００はオリジ
ナル解像度リファインメント１０６段階に進む。

【００１４】図４を参照すると、図１のバックグラウン
ドベースのセグメント化処理１００のオリジナル解像度
リファインメント１０６段階のフローチャートが提供さ
れている。リファインメント１０６は、低解像度セグメ
ント化１０４段階のセグメント化及び識別の結果をオリ
ジナル画像１０２にオーバーレイすることによって始ま
る。このことは、間引きされた画像から得られたセグメ
ント化及び識別の結果を画像１０２のオリジナル解像度
に補間する（４０２）ことによって達成される。メイン
バックグラウンド、並びに他の隣接するバックグラウン
ド及びオブジェクトに対し、各ローカルバックグラウン
ド及び各ピクチャオブジェクトの境界をオリジナル解像
度でリファインする（４０４及び４０６）。テキストオ
ブジェクトを識別し、セグメント化し、分類する（４０
８）。各テキストオブジェクト毎に、境界と、テキスト
文字のストロークによって取り囲まれる内部領域とをリ
ファインする（４１０）。任意のリファインメントとし
て、各バックグラウンドがスイープ(sweep)であるか否
かを判断する各バックグラウンドの再評価があり、肯定
された場合は、ピクチャオブジェクトとして再分類する
（４１２）。スイープのグラディエント(gradient)特性
の維持が重要である場合は、オプション４１２を含める
べきである。オプション４１２を含めない場合、バック
グラウンドはその領域の平均色を示す。オプション４１
２を実施する場合、スイープとして識別されたバックグ
ラウンドを全てピクチャオブジェクトとして再分類し、
バックグラウンドはそのグラディエント特性を反映し続
ける。全てのリファインメントが行われると、リファイ
ンメント１０６段階は完了し、セグメント化処理１００
は終了１０８に達する（図１）。

【００１５】図５乃至図１０を参照すると、図１のバッ
クグラウンドベースのセグメント化処理１００の詳細な
フローチャートが提供されている。図１と同様に、図５
の処理１００は、セグメント化されるドキュメント画像
１０２で始まる。次に、画像１０２をローパスフィルタ
に通して大幅に間引きし（３０２）、画像の低解像度バ
ージョンを生成する。画像１０２を大幅に間引きした後
は、画像データ及びハーフトーンノイズの量はかなり減
少されている。従って、画像のセグメント化、特にメイ
ンバックグラウンド及びローカルバックグラウンドの識
別に、簡潔で効率的なアルゴリズムを用いることができ
る。

【００１６】まず、Ｎ×Ｎの一様なブロックを識別する
（５０２）ことにより、大幅に間引きされた画像におい
てメインバックグラウンドを識別する（３０４）。３つ
のカラーチャネルのダイナミックレンジが全て所定の閾
値未満である場合、Ｎ×Ｎのブロックを一様なブロック
として定義する。次に、一様なブロックをシードとして
使用し、領域併合(region-growing)アルゴリズムを適用
する（５０４）。領域併合は、隣接ピクセルの色差の評
価に基づいている。第１のピクセルが、ある領域内の第
２のピクセルと隣接しており、これらの２つのピクセル
間の色差が所定の閾値未満である場合、第１ピクセルを
その領域に属するものとして特徴づける。併合される各
領域の平均色を計算し（５０６）、同様の平均色の領域
を結合する（５０８）。最後に、併合された全ての領域
のうち、境界領域(bounding area)が最も大きいものを
メインバックグラウンドとして識別する（５１０）。

【００１７】図６を参照すると、通常、寸法が小さいこ
とと境界線がはっきりしていることがテキストオブジェ
クトの特徴である。とはいえ、この定義は、殆どのテキ
ストと同様に、細い線、アイコン及び小さな構造体を含
む。圧縮などの画像処理の用途では、この扱いは一般に
許容可能である。前述の定義を考えると、メインバック
グラウンド上のテキストは、２つの１次元形態(morphol
ogical)操作（即ち、開口(opening)）によって抽出され
る。１次元形態開口を水平方向に適用し（５１２）、メ
インバックグラウンド上のテキストオブジェクトを識別
する（５１４）。同様に、１次元形態開口を垂直方向に
適用し（５１６）、メインバックグラウンド上の更なる
テキストオブジェクトを識別する（５１８）。構成エレ
メントのサイズは、抽出が必要なテキストのストローク
の最大幅によって決定される。

【００１８】メインバックグラウンド２０４及びメイン
バックグラウンド上のテキストオブジェクト２０８を検
出した後には、更なる分析を必要とする寸法の比較的大
きなオブジェクトが残っている。複数のオブジェクトが
互いに連結し、分類の難しい複雑な複合オブジェクトを
形成している場合があるため、分析の出来るだけ早い段
階で出来るだけ多くのオブジェクトを分離することが望
ましい。個々のオブジェクトは、長いエッジで境界を成
していることが多い。従って、垂直方向及び水平方向双
方のエッジを検出し（５２０）、エッジのピクセルをメ
インバックグラウンドから除去する（５２２）。除去さ
れたエッジを連結する連結コンポーネント分析を用いて
メインバックグラウンド上のオブジェクトを識別する
（５２４）。メインバックグラウンド上で識別されたオ
ブジェクトを、更なる分析のために抽出する（５２
６）。

【００１９】図７を参照すると、テキストオブジェクト
に加え、又はこれとは別に、メインバックグラウンド上
で識別されたオブジェクトは、ピクチャオブジェクト又
は複合オブジェクトである。次に、各オブジェクトを分
析し、分類する。第１のオブジェクトを分析のために選
択する（５２８）。１つの実施の形態では、レヴァンカ
ーら(Revankar et al.)の米国特許第５，７６７，９７
８号のエッジ検出アルゴリズム（以下、このアルゴリズ
ムを「レヴァンカー」と呼ぶ）を用いてエッジ検出を行
う（５３０）。レヴァンカーにおいて、弱いエッジポイ
ントと強いエッジポイントを識別し、弱いエッジポイン
ト対強いエッジポイントの比を決定する（５３２）。こ
の比が所定の閾値よりも大きい場合、オブジェクトをピ
クチャオブジェクトとして分類し（５３４）、分析はス
テップ５４２に進み、そうでない場合、分析はステップ
５３６に続く。ステップ５３６では、再びレヴァンカー
において、弱いエッジポイント対エッジポイントの総数
の比を決定する。同様に、この比が所定の閾値よりも大
きい場合、オブジェクトをピクチャオブジェクトとして
分類し（５３８）、分析はステップ５４２に進み、そう
でない場合、分析はステップ５４０に続く。ステップ５
４０では、オブジェクトを複合オブジェクトとして分類
し、分析はステップ５４２へ続く。

【００２０】ステップ５４２において、処理は、現行の
オブジェクトがメインバックグラウンドから抽出された
オブジェクトのうち最後のものであるか否かを判断す
る。現行のオブジェクトが最後のオブジェクトである場
合、処理は複合オブジェクトの分析に進み、そうでない
場合、次のオブジェクトを選択し（５４４）、最後のオ
ブジェクトを分類するまでエッジ検出処理を繰り返す。

【００２１】図８を参照すると、複合オブジェクトは、
しばしばローカルバックグラウンドと呼ばれる特有のバ
ックグラウンドを有するため、他のタイプのオブジェク
トとは異なる。複合オブジェクトの分析は、画像１０２
全体の分析に類似している。複合オブジェクトの分析
は、（１）ローカルバックグラウンドの識別、（２）テ
キストのセグメント化及び分類、並びに（３）オブジェ
クトのセグメント化及びピクチャオブジェクト類と複合
オブジェクト類への分類、といった３つのステップを含
む。これら３つのステップのうち、テキストのセグメン
ト化及びオブジェクトの分類は、画像１０２全体の分析
に関して前述した処理と同一である。しかしながら、ロ
ーカルバックグラウンドの識別は、メインバックグラウ
ンドの識別とは異なる。

【００２２】次に、各複合オブジェクトを分析し、セグ
メント化し、分類する。第１の複合オブジェクトを分析
のために選択する（５４６）。標準のエッジ検出(detec
tor)を用いてエッジ検出を複合オブジェクトに対して行
い、エッジのピクセルを複合オブジェクトから除去する
（５５０）。次に、除去したエッジの境界外側にある各
ピクセルをシードとして用い、領域併合アルゴリズムを
適用する（５５２）。隣接するピクセルと領域との間の
色差が所定の閾値未満である場合、隣接するピクセルを
その領域に属するものとして特徴づける。併合された最
大領域の寸法が所定の閾値よりも大きい場合、これをロ
ーカルバックグラウンドとして識別し、そうでない場
合、複合オブジェクトをピクチャオブジェクトとして再
分類する（５５４）。複合オブジェクトをピクチャオブ
ジェクト２１０として再分類する場合、分析はステップ
５６０に進み、そうでない場合、複合オブジェクトの分
析はステップ５５６へ続く。

【００２３】ステップ５５６において、ローカルバック
グラウンド上のテキストオブジェクトを識別し、セグメ
ント化し、分類する。これは、メインバックグラウンド
上のテキストオブジェクトの識別、セグメント化、及び
分類と同じ態様で達成される。従って、ステップ５１２
乃至ステップ５１８を複合オブジェクトに対して行う。
ステップ５１８が完了すると、分析はステップ５５８に
戻る。

【００２４】ステップ５５８において、ローカルバック
グラウンド上の他のオブジェクトも識別し、セグメント
化し、ピクチャオブジェクト類又は複合オブジェクト類
に分類する。これは、メインバックグラウンド上の他の
オブジェクトの識別、セグメント化、及び分類と同じ態
様で達成される。従って、ステップ５２０乃至ステップ
５４４を複合オブジェクトに対して行う。ローカルバッ
クグラウンド上に識別される最後のオブジェクトを分類
した後、分析はステップ５６０に戻る。

【００２５】ステップ５６０において、処理は、現行の
複合オブジェクトが、識別される最後の複合オブジェク
トであるか否かを判断する。そうである場合、処理はオ
リジナル解像度リファインメント段階１０６（図１）に
進み、そうでない場合、次の複合オブジェクトを選択し
（５６２）、最後の複合オブジェクトをセグメント化す
るまで複合オブジェクトの分析（即ち、５４８乃至５６
０）を繰り返す。

【００２６】図９を参照すると、高解像度処理とも呼ば
れるオリジナル解像度リファインメント段階１０６の
際、低解像度セグメント化１０４の際に識別した、検出
されたメインバックグラウンド及びローカルバックグラ
ウンドをリファインし、更にテストする。リファインメ
ント１０６は、低解像度セグメント化段階１０４のセグ
メント化及び分類の結果をオリジナル画像１０２にオー
バーレイすることによって始まる。これは、低解像度か
ら得られたセグメント化及び分類の結果を画像のオリジ
ナル解像度に補間する（５６４）ことによって達成され
る。次に、色の類似度に基づき、各ローカルバックグラ
ウンド及び各ピクチャオブジェクトの境界に沿ったピク
セルに領域併合アルゴリズムを適用する（５６６）。領
域併合は、メインバックグラウンド、他の隣接するバッ
クグラウンド及びオブジェクトに対する境界を、オリジ
ナル解像度でリファインする。

【００２７】境界をリファインした後、アルゴリズムを
使用し、テキストオブジェクトの一般的な小さい寸法と
はっきりした境界に基づいてテキストオブジェクトを識
別する。少なくとも１つの寸法が所定の閾値よりも小さ
い構造体は全て、テキストオブジェクトとして識別す
る。１次元形態開口を水平方向に適用し（５６８）、テ
キストオブジェクトを識別する（５７０）。同様に、１
次元形態開口を垂直方向に適用し（５７２）、更なるテ
キストオブジェクトを識別する（５７４）。識別した各
テキストオブジェクトもセグメント化し、テキストオブ
ジェクト２０８として分類する。

【００２８】図１０を参照すると、テキストオブジェク
ト２０８を識別し、セグメント化し、分類した後、各テ
キストオブジェクトの境界に沿ったピクセル及び各テキ
ストオブジェクトの内部領域に領域併合アルゴリズムを
適用する（５７６）。領域併合は、メインバックグラウ
ンド２０４、ローカルバックグラウンド２１４、テキス
トがオーバーレイする他のオブジェクト、及びテキスト
の文字のストロークによって囲まれる識別された内部領
域（例えば、「ｏ」の中央部分）に対する境界を、オリ
ジナル解像度でリファインする。テキストオブジェクト
をリファインした後は、より正確なテキストマスクが存
在する。

【００２９】各バックグラウンドがスイープであるか否
かを判断する各バックグラウンドの再評価４１２は、任
意のリファインメントである。スイープのグラディエン
ト特性の維持が重要である場合、オプション４１２を含
めるべきである。オプション４１２を含めない場合、バ
ックグラウンドはその領域の平均色を示す。オプション
４１２を実施する場合、スイープとして識別されたバッ
クグラウンドを全てピクチャオブジェクトとして再分類
し、バックグラウンドはそのグラディエント特性を反映
し続ける。低リスクのアプローチが好ましい場合は、オ
プション４１２を含めるべきである。

【００３０】オプション４１２を実施する場合、メイン
バックグラウンド及び各ローカルバックグラウンドに対
してバックグラウンド一様性テストを実施する（５７
８）。第１のバックグラウンドを分析のために選択する
（５８０）。有界領域全体に対し、バックグラウンドを
Ｋ×Ｋの構成に基づいた１６のサブ領域に分割する（５
８２）。実験的に、Ｋ＝４を用いた。各サブ領域の平均
色を計算する（５８４）。全てのサブ領域間の最大の色
差を決定する（５８６）。最大の色差が所定の閾値より
も大きい場合、バックグラウンドをピクチャオブジェク
トとして再分類し、そうでない場合、引き続きバックグ
ラウンドセグメントとして識別する（５８８）。次に、
処理は、現行のバックグラウンドが最後のバックグラウ
ンドであるか否かを判断する（５９０）。現行のバック
グラウンドが最後のバックグラウンドである場合、リフ
ァインメント１０６段階は完了し、セグメント化処理１
００は終了に達する（図１）。そうでない場合、次のバ
ックグラウンドを選択し（５９２）、最後のバックグラ
ウンドを再評価するまで一様性テストを繰り返す。

【図面の簡単な説明】

【図１】本発明に従ったバックグラウンドベースのセグ
メント化処理１００のフローチャートである。

【図２】図１のバックグラウンドベースのセグメント化
処理１００から得られたセグメント化の結果の一例の図
である。

【図３】図１のバックグラウンドベースのセグメント化
処理１００の低解像度セグメント化１０４段階のフロー
チャートである。

【図４】図１のバックグラウンドベースのセグメント化
処理１００のオリジナル解像度リファインメント１０６
段階のフローチャートである。

【図５】図１のバックグラウンドベースのセグメント化
処理１００の詳細なフローチャートである。

【図６】図１のバックグラウンドベースのセグメント化
処理１００の詳細なフローチャートである。

【図７】図１のバックグラウンドベースのセグメント化
処理１００の詳細なフローチャートである。

【図８】図１のバックグラウンドベースのセグメント化
処理１００の詳細なフローチャートである。

【図９】図１のバックグラウンドベースのセグメント化
処理１００の詳細なフローチャートである。

【図１０】図１のバックグラウンドベースのセグメント
化処理１００の詳細なフローチャートである。

【符号の説明】

１００セグメント化処理１０２ドキュメント画像１０４低解像度セグメント化１０６オリジナル解像度リファインメント２０４メインバックグラウンド２０６メインバックグラウンド上のオブジェクト２０８テキストオブジェクト２１０ピクチャオブジェクト２１２複合オブジェクト２１４ローカルバックグラウンド２１６ローカルバックグラウンド上のオブジェクト

───────────────────────────────────────────────────── フロントページの続き (72)発明者ホイチョンアメリカ合衆国 08807 ニュージャージー州ブリッジウォーターシールズレーン 80 Ｆターム(参考） 5B050 BA15 BA16 DA02 DA04 EA03 EA06 EA12 EA15 FA03 5C076 AA01 AA22 AA27 AA31 AA36 AA40 BB06 CA10 5L096 AA02 AA06 BA17 EA03 EA06 FA06 FA19 FA32 FA44 FA45 GA55

Claims

【特許請求の範囲】

【請求項１】画像をメインバックグラウンド、ローカ
ルバックグラウンド、及び第１のオブジェクトにセグメ
ント化するステップを含み、前記第１のオブジェクトが
前記メインバックグラウンド又は前記ローカルバックグ
ラウンド上にある、画像のセグメント化処理。
【請求項２】画像のセグメント化処理であって、ａ）メインバックグラウンド、ローカルバックグラウン
ド、及び第１のオブジェクトへの画像の低解像度セグメ
ント化を行うステップであって、前記第１のオブジェク
トが前記メインバックグラウンド又は前記ローカルバッ
クグラウンド上にある、該ステップと、ｂ）前記メインバックグラウンド、前記ローカルバック
グラウンド、及び前記第１のオブジェクトのうちのいず
れか２つによって共有される境界を、前記画像のオリジ
ナルの解像度でリファインするステップと、を含む、前記処理。
【請求項３】画像のセグメント化方法であって、ａ）前記画像のメインバックグラウンドを識別するステ
ップと、ｂ）前記メインバックグラウンド上の第１のオブジェク
トを識別するステップと、ｃ）前記第１のオブジェクトを、テキストオブジェク
ト、ピクチャオブジェクト、及び複合オブジェクトから
なる類のグループのうち１つの類に分類するステップ
と、ｄ）前記第１のオブジェクトを複合オブジェクトとして
識別した場合、前記第１のオブジェクトのローカルバッ
クグラウンドを識別するステップと、を含む、前記方法。