JP4017489B2

JP4017489B2 - セグメント化方法

Info

Publication number: JP4017489B2
Application number: JP2002288207A
Authority: JP
Inventors: ファンジガン; チョンホイ
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 2001-10-12
Filing date: 2002-10-01
Publication date: 2007-12-05
Anticipated expiration: 2022-10-01
Also published as: EP1304651A2; EP1304651B1; US6973213B2; JP2003143393A; BR0204103A; EP1304651A3; US20030072487A1

Description

【０００１】
【発明の属する技術分野】
本発明は画像処理に関する。本発明は、特にメインバックグラウンド、ローカルバックグラウンド、テキストオブジェクト、及びピクチャオブジェクトへの画像のセグメント化に関連して用いられ、特にこれらに関連して説明される。しかしながら、本発明を他の同様の用途に用いてもよいことが理解されよう。
【０００２】
【従来の技術及び発明が解決しようとする課題】
ドキュメントの画像は一般に複数の領域を含み、各領域は異なる性質を示す。複数の領域を含むドキュメントの画像を正確に処理するために、異なるアルゴリズムを各タイプの領域に適用すべきである。例えば、テキスト領域は印刷前に強調する必要がある。しかしながら、ハーフトーンのピクチャは、モアレを防ぐためにまずローパスフィルタに通す必要がある。従って、一般にドキュメント画像をその構成領域にセグメント化する必要があり、その後で、画像処理技術を最も有効に適用することができる。しかしながら、既存のセグメント化アルゴリズムの殆どは、強調(enhancement)、レンダリング、又は圧縮など、特定の画像処理の用途のために設計されている。用途によって、同一画像のセグメント化が大幅に異なりうる。圧縮の場合、グラフィックの線はテキストのストロークと同じように処理されうる。しかし、編集の場合、グラフィックは、テキスト領域のようにフォアグラウンド及びバックグラウンドに分割される代わりに、ピクチャ領域のように全体として処理されなければならない。画像処理システムはたいていこれらの用途を多く含むため、複数のセグメント化を計算しなければならない場合がある。従って、全てではないにしても、多くの画像処理の用途に適したセグメント化アルゴリズムを開発することが望ましい。
【０００３】
なお、従来の技術は上記課題を解決していない（例えば、特許文献１参照）。
【０００４】
【特許文献１】
米国特許第５，７６７，９７８号明細書
【０００５】
【課題を解決するための手段】
本発明は、バックグラウンドベースの画像セグメント化処理を提供する。本発明の１つの態様によると、この処理は、画像をメインバックグラウンド、ローカルバックグラウンド、及び第１のオブジェクトにセグメント化するステップを含み、第１のオブジェクトはメインバックグラウンド又はローカルバックグラウンド上にある。
【０００６】
本発明の他の態様によると、この処理は、ａ）メインバックグラウンド、ローカルバックグラウンド、及び第１のオブジェクトへの画像の低解像度セグメント化を行うステップであって、第１のオブジェクトがメインバックグラウンド又はローカルバックグラウンド上にある、該ステップと、ｂ）メインバックグラウンド、ローカルバックグラウンド、及び第１のオブジェクトのうちのいずれか２つによって共有される境界を、画像のオリジナルの解像度でリファインするステップと、を含む。
【０００７】
本発明の他の態様に従って、画像をメインバックグラウンド、ローカルバックグラウンド、及びオブジェクトにセグメント化する方法が提供される。この方法は、ａ）画像のメインバックグラウンドを識別するステップと、ｂ）メインバックグラウンド上の第１のオブジェクトを識別するステップと、ｃ）第１のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、及び複合オブジェクトからなる類のグループのうち１つの類に分類するステップと、ｄ）第１のオブジェクトを複合オブジェクトとして識別した場合、第１のオブジェクトのローカルバックグラウンドを識別するステップと、を含む。
【０００８】
【発明の実施の形態】
図１を参照すると、本発明に従ったバックグラウンドベースのセグメント化処理１００のフローチャートが提供されている。バックグラウンドベースのセグメント化処理１００は、高解像度のドキュメント画像１０２のセグメント化用に設計されている。しかしながら、高解像度でのバックグラウンド検出及びセグメント化は計算上高価であり、その結果はハーフトーンノイズに影響されやすい。計算の複雑さを少なくし、ハーフトーンノイズを抑えるために、画像１０２は２つの異なる解像度（即ち、低解像度及びオリジナル（元の）解像度）で処理される。バックグラウンドベースのセグメント化処理１００は、低解像度のドキュメント画像のセグメント化にも有用である。ドキュメント画像のオリジナル解像度を低くすると冗長性や不要な処理が生じうることを、当業者は認識するであろう。
【０００９】
処理１００は、セグメント化されるドキュメント画像１０２から始まる。次に、画像１０２をローパスフィルタに通し、大幅に間引きする(decimate)。（即ち、解像度を低くする。）そして、画像を低解像度セグメント化段階１０４によって低解像度で処理する。セグメント化の結果は、メインバックグラウンド及び１つ以上のオブジェクトの識別を含む。テキスト類又はピクチャ類に分類できないオブジェクトを、更にローカルバックグラウンド及びより小さなオブジェクトにセグメント化する。全てのオブジェクトをテキスト類又はピクチャ類に分類するまでこの処理を繰り返す。次に、セグメント化の結果をリファインするための処理のオリジナル解像度リファインメント段階１０６の際に、セグメント化段階１０４の結果を画像１０２にオーバーレイする。リファインメント段階１０６が完了すると、画像１０２のセグメント化処理１００は終了１０８に達する。
【００１０】
図２を参照すると、図１のバックグラウンドベースのセグメント化処理１００から得られた結果の一例が提供されている。セグメント化処理は、メインバックグラウンド、ローカルバックグラウンド、及びオブジェクトを識別し、更にオブジェクトをテキスト類又はピクチャ類に分類する。図２に示される結果は、ドキュメント画像１０２がメインバックグラウンド２０４、２つのローカルバックグラウンド２１４、テキストオブジェクト２０８、及びピクチャオブジェクト２１０にセグメント化されたことを示している。この図の階層は、画像１０２のセグメント化における複数のレベル（即ち、２２０、２３０、２４０、２５０、２６０、及び２７０）を反映している。
【００１１】
レベル２２０において、メインバックグラウンド２０４及びメインバックグラウンド上のオブジェクト２０６が識別されたことを、図は示している。レベル２３０において、メインバックグラウンド上のオブジェクト２０６がテキストオブジェクト２０８、ピクチャオブジェクト２１０、及び複合オブジェクト２１２に分類されたことを、図は示している。複合オブジェクト２１２は単に、テキストオブジェクト２０８又はピクチャオブジェクト２１０としての識別に必要な基準を満たさないオブジェクトである。レベル２４０において、複合オブジェクト２１２が更にローカルバックグラウンド２１４及びローカルバックグラウンド上のオブジェクト２１６にセグメント化されたことを、図は示している。レベル２５０では、レベル２３０のように、ローカルバックグラウンド２１６上のオブジェクトがテキストオブジェクト２０８、ピクチャオブジェクト２１０、及び複合オブジェクト２１２に分類されたことを、図は示している。レベル２６０では、レベル２４０のように、複合オブジェクト２１２が更にローカルバックグラウンド２１４及びローカルバックグラウンド上のオブジェクト２１６にセグメント化されたことを、図は示している。レベル２７０において、ローカルバックグラウンド上のオブジェクト２１６がテキストオブジェクト２０８及びピクチャオブジェクト２１０に分類されたことを、図は示している。ローカルバックグラウンドの更なる識別が不要であり、セグメント化処理が完了したため、複合オブジェクトがレベル２７０において残らなかったことに注意されたい。
【００１２】
図３を参照すると、図１のバックグラウンドベースのセグメント化処理１００の低解像度セグメント化１０４段階のフローチャートが提供されている。低解像度セグメント化１０４段階は、ドキュメント画像１０２をローパスフィルタに通して大幅に間引きし（３０２）、画像１０２の低解像度表現（即ち、間引きされた画像）を生成することによって始まる。次に、メインバックグラウンドを識別する（３０４）。メインバックグラウンド上のテキストオブジェクトを識別し、セグメント化し、分類する（３０６）。メインバックグラウンド上の他のオブジェクトも識別し、セグメント化する（３０８）。次いで、その他のオブジェクトをピクチャ類に分類する（３１０）か、又は、複合オブジェクト類に分類する（３１２）。
【００１３】
複合オブジェクトを識別したら、それを更にセグメント化する。まず、ローカルバックグラウンドを識別する（３１４）。次に、ステップ３０６のように、ローカルバックグラウンド上のテキストオブジェクトを識別し、セグメント化し、分類する（３１６）。ローカルバックグラウンド上の他のオブジェクトも識別し、セグメント化する（３１８）。そして、その他のオブジェクトをピクチャ類に分類する（３２０）か、又は、複合オブジェクト類に分類する（３２２）。この時点で複合オブジェクトが残っている場合は、ステップ３１４に戻ってセグメント化を続ける。識別する複合オブジェクトがない場合、セグメント化処理１００はオリジナル解像度リファインメント１０６段階に進む。
【００１４】
図４を参照すると、図１のバックグラウンドベースのセグメント化処理１００のオリジナル解像度リファインメント１０６段階のフローチャートが提供されている。リファインメント１０６は、低解像度セグメント化１０４段階のセグメント化及び識別の結果をオリジナル画像１０２にオーバーレイすることによって始まる。このことは、間引きされた画像から得られたセグメント化及び識別の結果を画像１０２のオリジナル解像度に補間する（４０２）ことによって達成される。メインバックグラウンド、並びに他の隣接するバックグラウンド及びオブジェクトに対し、各ローカルバックグラウンド及び各ピクチャオブジェクトの境界をオリジナル解像度でリファインする（４０４及び４０６）。テキストオブジェクトを識別し、セグメント化し、分類する（４０８）。各テキストオブジェクト毎に、境界と、テキスト文字のストロークによって取り囲まれる内部領域とをリファインする（４１０）。任意のリファインメントとして、各バックグラウンドがスイープ(sweep)であるか否かを判断する各バックグラウンドの再評価があり、肯定された場合は、ピクチャオブジェクトとして再分類する（４１２）。スイープのグラディエント(gradient)特性の維持が重要である場合は、オプション４１２を含めるべきである。オプション４１２を含めない場合、バックグラウンドはその領域の平均色を示す。オプション４１２を実施する場合、スイープとして識別されたバックグラウンドを全てピクチャオブジェクトとして再分類し、バックグラウンドはそのグラディエント特性を反映し続ける。全てのリファインメントが行われると、リファインメント１０６段階は完了し、セグメント化処理１００は終了１０８に達する（図１）。
【００１５】
図５乃至図１０を参照すると、図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートが提供されている。図１と同様に、図５の処理１００は、セグメント化されるドキュメント画像１０２で始まる。次に、画像１０２をローパスフィルタに通して大幅に間引きし（３０２）、画像の低解像度バージョンを生成する。画像１０２を大幅に間引きした後は、画像データ及びハーフトーンノイズの量はかなり減少されている。従って、画像のセグメント化、特にメインバックグラウンド及びローカルバックグラウンドの識別に、簡潔で効率的なアルゴリズムを用いることができる。
【００１６】
まず、Ｎ×Ｎの一様なブロックを識別する（５０２）ことにより、大幅に間引きされた画像においてメインバックグラウンドを識別する（３０４）。３つのカラーチャネルのダイナミックレンジが全て所定の閾値未満である場合、Ｎ×Ｎのブロックを一様なブロックとして定義する。次に、一様なブロックをシードとして使用し、領域併合(region-growing)アルゴリズムを適用する（５０４）。領域併合は、隣接ピクセルの色差の評価に基づいている。第１のピクセルが、ある領域内の第２のピクセルと隣接しており、これらの２つのピクセル間の色差が所定の閾値未満である場合、第１ピクセルをその領域に属するものとして特徴づける。併合される各領域の平均色を計算し（５０６）、同様の平均色の領域を結合する（５０８）。最後に、併合された全ての領域のうち、境界領域(bounding area)が最も大きいものをメインバックグラウンドとして識別する（５１０）。
【００１７】
図６を参照すると、通常、寸法が小さいことと境界線がはっきりしていることがテキストオブジェクトの特徴である。とはいえ、この定義は、殆どのテキストと同様に、細い線、アイコン及び小さな構造体を含む。圧縮などの画像処理の用途では、この扱いは一般に許容可能である。前述の定義を考えると、メインバックグラウンド上のテキストは、２つの１次元形態(morphological)操作（即ち、開口(opening)）によって抽出される。１次元形態開口を水平方向に適用し（５１２）、メインバックグラウンド上のテキストオブジェクトを識別する（５１４）。同様に、１次元形態開口を垂直方向に適用し（５１６）、メインバックグラウンド上の更なるテキストオブジェクトを識別する（５１８）。構成エレメントのサイズは、抽出が必要なテキストのストロークの最大幅によって決定される。
【００１８】
メインバックグラウンド２０４及びメインバックグラウンド上のテキストオブジェクト２０８を検出した後には、更なる分析を必要とする寸法の比較的大きなオブジェクトが残っている。複数のオブジェクトが互いに連結し、分類の難しい複雑な複合オブジェクトを形成している場合があるため、分析の出来るだけ早い段階で出来るだけ多くのオブジェクトを分離することが望ましい。個々のオブジェクトは、長いエッジで境界を成していることが多い。従って、垂直方向及び水平方向双方のエッジを検出し（５２０）、エッジのピクセルをメインバックグラウンドから除去する（５２２）。除去されたエッジを連結する連結コンポーネント分析を用いてメインバックグラウンド上のオブジェクトを識別する（５２４）。メインバックグラウンド上で識別されたオブジェクトを、更なる分析のために抽出する（５２６）。
【００１９】
図７を参照すると、テキストオブジェクトに加え、又はこれとは別に、メインバックグラウンド上で識別されたオブジェクトは、ピクチャオブジェクト又は複合オブジェクトである。次に、各オブジェクトを分析し、分類する。第１のオブジェクトを分析のために選択する（５２８）。１つの実施の形態では、レヴァンカーら(Revankar et al.)の米国特許第５，７６７，９７８号のエッジ検出アルゴリズム（以下、このアルゴリズムを「レヴァンカー」と呼ぶ）を用いてエッジ検出を行う（５３０）。レヴァンカーにおいて、弱いエッジポイントと強いエッジポイントを識別し、弱いエッジポイント対強いエッジポイントの比を決定する（５３２）。この比が所定の閾値よりも大きい場合、オブジェクトをピクチャオブジェクトとして分類し（５３４）、分析はステップ５４２に進み、そうでない場合、分析はステップ５３６に続く。ステップ５３６では、再びレヴァンカーにおいて、弱いエッジポイント対エッジポイントの総数の比を決定する。同様に、この比が所定の閾値よりも大きい場合、オブジェクトをピクチャオブジェクトとして分類し（５３８）、分析はステップ５４２に進み、そうでない場合、分析はステップ５４０に続く。ステップ５４０では、オブジェクトを複合オブジェクトとして分類し、分析はステップ５４２へ続く。
【００２０】
ステップ５４２において、処理は、現行のオブジェクトがメインバックグラウンドから抽出されたオブジェクトのうち最後のものであるか否かを判断する。現行のオブジェクトが最後のオブジェクトである場合、処理は複合オブジェクトの分析に進み、そうでない場合、次のオブジェクトを選択し（５４４）、最後のオブジェクトを分類するまでエッジ検出処理を繰り返す。
【００２１】
図８を参照すると、複合オブジェクトは、しばしばローカルバックグラウンドと呼ばれる特有のバックグラウンドを有するため、他のタイプのオブジェクトとは異なる。複合オブジェクトの分析は、画像１０２全体の分析に類似している。複合オブジェクトの分析は、（１）ローカルバックグラウンドの識別、（２）テキストのセグメント化及び分類、並びに（３）オブジェクトのセグメント化及びピクチャオブジェクト類と複合オブジェクト類への分類、といった３つのステップを含む。これら３つのステップのうち、テキストのセグメント化及びオブジェクトの分類は、画像１０２全体の分析に関して前述した処理と同一である。しかしながら、ローカルバックグラウンドの識別は、メインバックグラウンドの識別とは異なる。
【００２２】
次に、各複合オブジェクトを分析し、セグメント化し、分類する。第１の複合オブジェクトを分析のために選択する（５４６）。標準のエッジ検出(detector)を用いてエッジ検出を複合オブジェクトに対して行い、エッジのピクセルを複合オブジェクトから除去する（５５０）。次に、除去したエッジの境界外側にある各ピクセルをシードとして用い、領域併合アルゴリズムを適用する（５５２）。隣接するピクセルと領域との間の色差が所定の閾値未満である場合、隣接するピクセルをその領域に属するものとして特徴づける。併合された最大領域の寸法が所定の閾値よりも大きい場合、これをローカルバックグラウンドとして識別し、そうでない場合、複合オブジェクトをピクチャオブジェクトとして再分類する（５５４）。複合オブジェクトをピクチャオブジェクト２１０として再分類する場合、分析はステップ５６０に進み、そうでない場合、複合オブジェクトの分析はステップ５５６へ続く。
【００２３】
ステップ５５６において、ローカルバックグラウンド上のテキストオブジェクトを識別し、セグメント化し、分類する。これは、メインバックグラウンド上のテキストオブジェクトの識別、セグメント化、及び分類と同じ態様で達成される。従って、ステップ５１２乃至ステップ５１８を複合オブジェクトに対して行う。ステップ５１８が完了すると、分析はステップ５５８に戻る。
【００２４】
ステップ５５８において、ローカルバックグラウンド上の他のオブジェクトも識別し、セグメント化し、ピクチャオブジェクト類又は複合オブジェクト類に分類する。これは、メインバックグラウンド上の他のオブジェクトの識別、セグメント化、及び分類と同じ態様で達成される。従って、ステップ５２０乃至ステップ５４４を複合オブジェクトに対して行う。ローカルバックグラウンド上に識別される最後のオブジェクトを分類した後、分析はステップ５６０に戻る。
【００２５】
ステップ５６０において、処理は、現行の複合オブジェクトが、識別される最後の複合オブジェクトであるか否かを判断する。そうである場合、処理はオリジナル解像度リファインメント段階１０６（図１）に進み、そうでない場合、次の複合オブジェクトを選択し（５６２）、最後の複合オブジェクトをセグメント化するまで複合オブジェクトの分析（即ち、５４８乃至５６０）を繰り返す。
【００２６】
図９を参照すると、高解像度処理とも呼ばれるオリジナル解像度リファインメント段階１０６の際、低解像度セグメント化１０４の際に識別した、検出されたメインバックグラウンド及びローカルバックグラウンドをリファインし、更にテストする。リファインメント１０６は、低解像度セグメント化段階１０４のセグメント化及び分類の結果をオリジナル画像１０２にオーバーレイすることによって始まる。これは、低解像度から得られたセグメント化及び分類の結果を画像のオリジナル解像度に補間する（５６４）ことによって達成される。次に、色の類似度に基づき、各ローカルバックグラウンド及び各ピクチャオブジェクトの境界に沿ったピクセルに領域併合アルゴリズムを適用する（５６６）。領域併合は、メインバックグラウンド、他の隣接するバックグラウンド及びオブジェクトに対する境界を、オリジナル解像度でリファインする。
【００２７】
境界をリファインした後、アルゴリズムを使用し、テキストオブジェクトの一般的な小さい寸法とはっきりした境界に基づいてテキストオブジェクトを識別する。少なくとも１つの寸法が所定の閾値よりも小さい構造体は全て、テキストオブジェクトとして識別する。１次元形態開口を水平方向に適用し（５６８）、テキストオブジェクトを識別する（５７０）。同様に、１次元形態開口を垂直方向に適用し（５７２）、更なるテキストオブジェクトを識別する（５７４）。識別した各テキストオブジェクトもセグメント化し、テキストオブジェクト２０８として分類する。
【００２８】
図１０を参照すると、テキストオブジェクト２０８を識別し、セグメント化し、分類した後、各テキストオブジェクトの境界に沿ったピクセル及び各テキストオブジェクトの内部領域に領域併合アルゴリズムを適用する（５７６）。領域併合は、メインバックグラウンド２０４、ローカルバックグラウンド２１４、テキストがオーバーレイする他のオブジェクト、及びテキストの文字のストロークによって囲まれる識別された内部領域（例えば、「ｏ」の中央部分）に対する境界を、オリジナル解像度でリファインする。テキストオブジェクトをリファインした後は、より正確なテキストマスクが存在する。
【００２９】
各バックグラウンドがスイープであるか否かを判断する各バックグラウンドの再評価４１２は、任意のリファインメントである。スイープのグラディエント特性の維持が重要である場合、オプション４１２を含めるべきである。オプション４１２を含めない場合、バックグラウンドはその領域の平均色を示す。オプション４１２を実施する場合、スイープとして識別されたバックグラウンドを全てピクチャオブジェクトとして再分類し、バックグラウンドはそのグラディエント特性を反映し続ける。低リスクのアプローチが好ましい場合は、オプション４１２を含めるべきである。
【００３０】
オプション４１２を実施する場合、メインバックグラウンド及び各ローカルバックグラウンドに対してバックグラウンド一様性テストを実施する（５７８）。第１のバックグラウンドを分析のために選択する（５８０）。有界領域全体に対し、バックグラウンドをＫ×Ｋの構成に基づいた１６のサブ領域に分割する（５８２）。実験的に、Ｋ＝４を用いた。各サブ領域の平均色を計算する（５８４）。全てのサブ領域間の最大の色差を決定する（５８６）。最大の色差が所定の閾値よりも大きい場合、バックグラウンドをピクチャオブジェクトとして再分類し、そうでない場合、引き続きバックグラウンドセグメントとして識別する（５８８）。次に、処理は、現行のバックグラウンドが最後のバックグラウンドであるか否かを判断する（５９０）。現行のバックグラウンドが最後のバックグラウンドである場合、リファインメント１０６段階は完了し、セグメント化処理１００は終了に達する（図１）。そうでない場合、次のバックグラウンドを選択し（５９２）、最後のバックグラウンドを再評価するまで一様性テストを繰り返す。
【図面の簡単な説明】
【図１】本発明に従ったバックグラウンドベースのセグメント化処理１００のフローチャートである。
【図２】図１のバックグラウンドベースのセグメント化処理１００から得られたセグメント化の結果の一例の図である。
【図３】図１のバックグラウンドベースのセグメント化処理１００の低解像度セグメント化１０４段階のフローチャートである。
【図４】図１のバックグラウンドベースのセグメント化処理１００のオリジナル解像度リファインメント１０６段階のフローチャートである。
【図５】図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートである。
【図６】図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートである。
【図７】図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートである。
【図８】図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートである。
【図９】図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートである。
【図１０】図１のバックグラウンドベースのセグメント化処理１００の詳細なフローチャートである。
【符号の説明】
１００セグメント化処理
１０２ドキュメント画像
１０４低解像度セグメント化
１０６オリジナル解像度リファインメント
２０４メインバックグラウンド
２０６メインバックグラウンド上のオブジェクト
２０８テキストオブジェクト
２１０ピクチャオブジェクト
２１２複合オブジェクト
２１４ローカルバックグラウンド
２１６ローカルバックグラウンド上のオブジェクト

Claims

ａ）画像をメインバックグラウンド、ローカルバックグラウンド、及び第１のオブジェクトにセグメント化し、前記第１のオブジェクトが前記メインバックグラウンド又は前記ローカルバックグラウンド上にあり、
ｂ）前記画像のメインバックグラウンドを識別し、
ｃ）前記メインバックグラウンド上の第１のオブジェクトをセグメント化し、
ｄ）前記第１のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、複合オブジェクトからなる類のグループの１つの類に分類し、
ｅ）前記第１のオブジェクトが複合オブジェクトとして分類される場合、該第１のオブジェクトのローカルバックグラウンドを識別し、
ｆ）前記ローカルバックグラウンド上の第２のオブジェクトをセグメント化し、
ｇ）前記第２のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、複合オブジェクトからなる類のグループの１つの類に分類し、
ｈ）前記第２のオブジェクトが複合オブジェクトとして分類される場合、該第２のオブジェクトに対してｅ）〜ｇ）を実行する、
画像のセグメント化方法。
ａ）メインバックグラウンド、ローカルバックグラウンド、及び第１のオブジェクトへの画像の低解像度セグメント化を行い、前記第１のオブジェクトが前記メインバックグラウンド又は前記ローカルバックグラウンド上にあり、
ｂ）前記メインバックグラウンド、前記ローカルバックグラウンド、及び前記第１のオブジェクトのうちのいずれか２つによって共有される境界を、オリジナルの解像度の前記画像で補間する、
画像のセグメント化方法であって、
ａ）は、
ｃ）前記画像の解像度をローパスフィルタでフィルタリングすることにより低減し、
ｄ）前記画像のメインバックグラウンドを識別し、
ｅ）前記メインバックグラウンド上の第１のオブジェクトをセグメント化し、
ｆ）前記第１のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、複合オブジェクトからなる類のグループの１つの類に分類し、
ｇ）前記第１のオブジェクトが複合オブジェクトとして分類される場合、該第１のオブジェクトのローカルバックグラウンドを識別し、
ｈ）前記ローカルバックグラウンド上の第２のオブジェクトをセグメント化し、
ｉ）前記第２のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、複合オブジェクトからなる類のグループの１つの類に分類し、
ｊ）前記第２のオブジェクトが複合オブジェクトとして分類される場合、該第２のオブジェクトに対してｇ）〜ｉ）を実行する、
ことを含む、
セグメント化方法。
ｂ）は、
ｋ）ローカルバックグラウンドがセグメント化され、オブジェクトがピクチャオブジェクトとして分類される場合、該ローカルバックグラウンドおよびピクチャオブジェクトの境界を、オリジナルの解像度の前記画像で補間し、
ｌ）オブジェクトがテキストオブジェクトとして分類される場合、該テキストオブジェクトの境界および内部を、オリジナルの解像度の前記画像で補間する、
ことを含む、
請求項２に記載のセグメント化方法。
ａ）画像のメインバックグラウンドを識別し、
ｂ）前記メインバックグラウンド上の第１のオブジェクトを識別し、
ｃ）前記第１のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、及び複合オブジェクトからなる類のグループのうち１つの類に分類し、
ｄ）前記第１のオブジェクトを複合オブジェクトとして識別した場合、前記第１のオブジェクトのローカルバックグラウンドを識別し、
ｅ）前記第１のオブジェクトが複合オブジェクトとして分類される場合、前記第１のオブジェクトの前記ローカルバックグラウンド上の第２のオブジェクトを識別し、
ｆ）前記第２のオブジェクトを、テキストオブジェクト、ピクチャオブジェクト、複合オブジェクトからなる類のグループの１つの類に分類し、
ｇ）前記第２のオブジェクトが複合オブジェクトとして分類される場合、該第２のオブジェクト上のローカルバックグラウンドを識別する、
画像のセグメント化方法。