JP4573706B2 - ディジタル画像セグメンテーション方法 - Google Patents

ディジタル画像セグメンテーション方法 Download PDF

Info

Publication number
JP4573706B2
JP4573706B2 JP2005170241A JP2005170241A JP4573706B2 JP 4573706 B2 JP4573706 B2 JP 4573706B2 JP 2005170241 A JP2005170241 A JP 2005170241A JP 2005170241 A JP2005170241 A JP 2005170241A JP 4573706 B2 JP4573706 B2 JP 4573706B2
Authority
JP
Japan
Prior art keywords
color
image
objects
cluster
color difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005170241A
Other languages
English (en)
Other versions
JP2006004425A (ja
Inventor
ファン ジガン
ダブリュ.ジェイコブズ ティモシー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2006004425A publication Critical patent/JP2006004425A/ja
Application granted granted Critical
Publication of JP4573706B2 publication Critical patent/JP4573706B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Character Input (AREA)

Description

本発明は、一般に、画像セグメンテーション(線分化)に係り、より詳細には、一貫した前景層を有する混合ラスタコンテンツ(MRC)画像を生成する方法に関する。
本発明は、一貫した前景層を有する混合ラスタコンテンツ(MRC)画像を生成する画像セグメンテーションのための方法に関する。この方法は、詳細情報を持つ均一なテキストと他の均一なカラーオブジェクトを抽出する。この方法は、四つの基本ステップを有する。最初に、画像からオブジェクトが抽出される。次に、これらのオブジェクトのカラーコンシステンシー(一貫性)及び他の特性がテストされ、MRC前景層へコード化するために該オブジェクトを選択すべきかが決定される。次に、選択されたオブジェクトは、カラースペースにおいてクラスタリングされる。画像は、各前景層が、同一カラークラスタからのオブジェクトをコード化するように最終的にセグメント化される。
S.Revankar(レヴァンカール)とZ.Fan(ファン)による、1998年6月16日付で発行された「画像セグメンテーションシステム(IMAGE SEGMENTATION SYSTEM)」と題された特許文献1は、ドキュメント処理システムおいてのデータのストリームを処理する画像レンダリングシステムを開示し、データのストリームは、出力画像をレンダリングするためのセグメンタブル画像形成データを含み、出力画像は、複数の画像クラスに応じて、差動的にレンダリング処理することが可能である。画像レンダリングシステムは、画像データを複数の画像領域に分割するセグメンタと、各画像クラスへこれらの領域を割当てるセレクタと、該セレクタに応答して複数の画像クラスの少なくとも一つに応じて出力画像を差動的にレンダリングするプロセッサと、を含む。
MRC(混合ラスタコンテンツ)とは、再構築された高画質を維持しつつ高圧縮比率を達成する際に役立つ画像表示概念である。また、MRCは、圧縮基準として設定されている。MRC内で、基本的な3層モデル(コントーン前景、コントーン背景、及びバイナリマスク)は最も一般的な表示形式である。このモデルは、背景層、マスク、及び前景層ペアを用いたカラーラスター画像を表す。前景層および背景層は、通常、コントーンビットマップであるが、マスクは、通常、バイナリである。マスク層は、他の二つの層から最終画像をどのようにして再構築するかを記述する。マスク層のピクセル値が1のとき、最終画像への対応画素が前景層から選択されるが、マスク層のピクセル値が0のとき、対応画素は、背景層から選択される。
米国特許第5,767,978号
しかしながら、MRCには、得られたファイルが、PDFでコード化された場合、ある層のポストスクリプト及びPDFプリンタ上ではプリントできない可能性があるという欠点がある。前景層がコントーン形式で表示されなければ、この問題は、回避可能である。結果的に、この問題を処理するために、一貫した前景層を有するMRCが導入された。このモデルは、一つの背景層、N個の前景層、及びN個のマスク層を含む。ここで、Nは、負でない整数を表す。背景層は、コントーンビットマップであるが、前景層は、一貫してカラーに限定される。このモデルを構築することは、演算的に、3層モデルを構築するよりも困難であるが、得られたPDFファイルは、すべてのポストスクリプトプリンタでプリント可能であると思われる。
本発明によれば、一貫した前景を有する混合ラスタコンテンツ形式で表示すべく、ディジタル画像のセグメンテーションを行う方法であって、画像から均一なカラーオブジェクトを抽出するステップと、抽出されたオブジェクトのうちの少なくともいくつかのオブジェクトのカラー一貫性をテストして、該抽出されたオブジェクトが混合ラスタコンテンツ形式で前景層へコード化されるべきかを決定するステップと、該前景層を表示するために選択されたオブジェクトをカラースペース内でクラスタリングし、少なくとも一つの共通のカラークラスタに該オブジェクトを対応付けるステップと、各前景層が該共通のカラークラスタからのオブジェクトを表すように、画像をセグメントするステップと、を有する方法が提供される。
本発明の一つの態様は、従来の3層MRCフォーマットでなく、一貫したまたは共通の前景カラーでのみ画像が識別されるように、MRC画像形式の画像を使用可能であるという発見に基づく。この発見によって、上記フォーマットを処理することができないプリンタで3レベルMRCフォーマッットを用いる際に生じていた問題が解決される。本明細書中に記載されている技術を用いれば、本発明は、より広範囲のプリンタでプリント可能な、改良された(即ち、一貫した前景を有する)フォーマットによる画像の表示を行うことができる。したがって、本発明は、MRCフォーマットの使用を可能とし、しかも、既存のプリンタを使用して画像をレンダリングすることが可能である。本発明に基き使用される技術により、結果的に、MRCフォーマットの画像ファイルをレンダリングするために既存のポストスクリトプト及びPDFプリンタをそのまま使用することができる。
本発明の第1の態様は、一貫した前景を有する混合ラスタコンテンツ形式で表示すべく、ディジタル画像のセグメンテーションを行う方法であって、画像から均一なカラーオブジェクトを抽出するステップと、抽出されたオブジェクトのうちの少なくともいくつかのオブジェクトのカラー一貫性をテストして、抽出されたオブジェクトが混合ラスタコンテンツ形式で前景層へコード化されるべきかを決定するステップと、前景層を表示するために選択されたオブジェクトをカラースペース内でクラスタリングし、少なくとも一つの共通のカラークラスタにオブジェクトを対応付けるステップと、各前景層が該共通のカラークラスタからのオブジェクトを表すように画像をセグメントするステップと、を有する方法である。
本発明の第2の態様は、第1の態様に記載の方法であって、オブジェクトをクラスタリングするステップが、第1の抽出されたオブジェクトが、第2の抽出されたオブジェクトと共にクラスタリングされるべきかを判断するためにオブジェクトの内部のみのカラーをテストするステップを更に有する。
本発明の第3の態様は、第2の態様に記載の方法であって、テストするステップが、抽出されたオブジェクトの位置を、該オブジェクトがクラスタ対象として考慮されている該クラスタ内の他のオブジェクトの位置と比較するステップを更に有する。
「画像」は、物理的な光のパターンである。画像は、文字、単語及びテキストのみならず、図形などの他の特性を含むことができる。テキストは、ドキュメントの頁の画像におけるように、一つ以上の画像のセットに含まれてもよい。「画像セット」は、一つ以上の画像のセットである。画像は、各々がそれ自体画像である「セグメント」へ分割可能である。画像のセグメントは、任意のサイズであってよく、画像全体もしくはその一部であってよい。画像における各ロケーションは、「ピクセル(画素)」と称される。
「画像の特性」または「特性」は、測定可能な画像の属性である。オペレーションは、画像を定義付けるデータを用いて、特性を示すデータを生成することによって、特性を「測定」することができる。測定毎に略同じ結果を容易に生じる可能性が高いように特性が測定された場合に、「画像」の特性が測定される。
「文字」は、言語の書かれた形態すなわち印刷された形態において現れる別個の要素を意味する。従って、英語における文字は、アルファベット要素および数字的要素のみならず、書かれた形態すなわち印刷された形態の英語において使用される句読点、発音区別符号、数学記号、論理記号、及び他の要素を含むことが可能である。より一般的には、文字は、英数字的要素以外に、音声要素、表意文字、または絵画的要素を含むことができる。
「単語」は、言語の意味論的単位として扱われる一つ以上の文字のセットである。
「テキスト」は、文字の一つ以上の行の配列である。テキストの文字は、単語を形成してよい。
「オブジェクト」は、関連画素の集合であり、オブジェクトにおいて、画素は、隣接する境界すなわち枠(ボーダ)内で互いに連結または対応付けられる。オブジェクトは、文字、単語、テキスト、または、コントーン画像、あるいは、これらの組み合わせ又は集合であってもよい。
「画像入力端末」(IIT)は、画像を受け取るとともに画像のバージョンを定義付けるデータのアイテムを提供可能なデバイスである。「スキャナー」は、ドキュメントのスキャニングなどのスキャニング動作によって画像を受け取る、画像入力デバイスである。「ディジタルカメラ」もまた、画像入力デバイスである。
「画像出力端末」(IOT)は、画像を定義付けるデータのアイテムを受け取るとともに該画像を出力として提供可能なデバイスである。「プリンタ」は、画像出力端末である。「ディスプレイ」は、人間が目視可能な形式で出力画像を提供する画像出力端末である。ディスプレイによって提供される可視パターンは、「ディスプレイされた画像」または単なる「画像」である。
本発明の一つの実施の形態に記載の方法は、コンピュータソフトウェア駆動システムとして動作することが意図されている。従って、以下に詳細に説明される一つ以上の処理ステップは、画像データを受け取り、処理し、出力することが可能な、専用ディジタル画像処理システムなどのコンピュータのプラットホーム、プリント・プリプロセッサ、または、任意の好適なコンピュータやワークステーション上で動作することができる。このようなソフトウェアは、対応するIIT、IOT、あるいは、同様のデバイスや周辺デバイスに他の機能性を提供すべく作用する埋め込み式のプロセッサ上で動作する、プログラムデータであってもよいことが理解されよう。
図1を参照すると、(3層MRCフォーマットでなく)一貫した前景レベルを有しながらも混合ラスタコンテンツ形式で画像を表示するのに好適な方法で、ディジタル画像をセグメントするプロセスの、種々のステップを示すデータフロー図が示されている。上記したように、MRCフォーマットにおける一貫した前景への限定によって、MRCファイルの共通のプラットフォームプリントが可能となる。画素の連続的なトーン(コントーン)またはカラービットマップでも画像は提供可能であるが、方法100では、従来の.JPGまたは.TIFフォーマット等におけるカラー画像と同様に、入力ディジタル画像からスタートする。
図示される方法において、所望される出力は、一定した前景層を有するMRCフォーマットされた画像ファイルである。従って、プロセスは、ステップ110で開始され、ステップ112においてシステムは均一なカラーオブジェクトを抽出する。図示されているように、抽出ステップ112は、テキストを抽出するサブステップ114と、詳細な情報を有する他のオブジェクトを抽出するサブステップ116と、を含む。例えば、図2を参照すると、図の例中に、テキストオブジェクト210と、他の要素として、画像オブジェクト212、214及び216を含む、いくつかの「オブジェクト」が示されている。
ステップ112で抽出されると、出力は、ステップ120へパスされ、抽出されたオブジェクトの少なくともいくつかに対してカラー一貫性テストが行われる。ステップ120の目的は、抽出されたオブジェクトを制約された混合ラスタコンテンツ形式で前景層へコード化すべきかを決定することである。前景層へコード化されない場合、抽出されたオブジェクトは、MRCフォーマットのカラー又はコントーン画像成分(例えば、JPEGコントーン)として残される可能性が高い。ステップ120でテストされた後、次に、ステップ124によって反映されるように、オブジェクトは、類似カラーが着色されたオブジェクトにクラスタリングまたはグルーピングされる。特に、ステップ124は、前景層を表示するために選択されたオブジェクトをカラースペースにおいてクラスタリングし、少なくとも一つの共通のカラークラスタにオブジェクトを対応付ける。抽出されたオブジェクトをカラーによってクラスタリングした後、ステップ128によって表されるように、画像をセグメントすることが可能であり、これによって、各前景層は、共通のカラークラスタからオブジェクトを表すことができる。画像がセグメントされると、次に、このセグメントされた画像をMRC互換性フォーマットへ再結合又は翻訳可能であり、この際、セグメントは、指定されたカラーによって前景領域を表すか、あるいは、背景画像領域を表す。
以上、本発明の一般的な性質について説明したが、次に、上述の種々のステップの具体的な詳細に注目されたい。ステップ112のオブジェクトの抽出ステップに関連して、このステップでは、詳細情報を持ったテキスト及び他のオブジェクトが抽出される。3層MRCセグメンタは、それらの結果又は中間結果としてのオブジェクトも生成することが知られている。本発明は、これらのオブジェクトについても、セグメンテーションが、上述のように、または、特許文献1などの他の画像セグメンテーション特許に開示されているように発生する可能性があると仮定する。本発明は、ほとんど、修正せずに、このような出力を直接利用可能である。
テスト後にオブジェクトの選択が行われるステップ120に関して、ステップ112で抽出されたオブジェクトを更に調べる必要がある。これは、3層MRCモデルと本発明の一貫した前景モデルと基本的な違いによるものである。前者は、オブジェクトカラーを制約しないが、後者は、オブジェクトが一貫したカラーでコード化されることを必要とする。画質を確実とするために、このステップのテストは、視覚的に顕著なアーチファクトを導入せずに、一貫したカラーで表すことができるオブジェクトのみを選択する。
このステップを実行するために、例えば、オブジェクトのカラー均一性と幾何学的特性を測定するなどして、オブジェクト毎にいくつかの特徴が演算される。カラー均一性は、多くの既知の方法によって測定可能である。しかしながら、大部分のオブジェクトのサイズが小さく細いストロークで構成されることから(例えば、図2の領域212及び214におけるテキスト)、従来の方法は、このアプリケーションに対して最高の結果を得ることができない。小さく細いオブジェクトは、より多くのエッジ画素を含みがちであり、オブジェクトのエッジ画素はノイズが大きい場合が多く、これらのエッジ画素のカラーは、オブジェクトカラーとオブジェクト背景カラーの混合である場合が多いことが観察できる。結果として、提示されるカラー均一性テストは、オブジェクトの内部画素又はオブジェクトの一部のみを測定しようとし、エッジ画素を無視する傾向がある。さらに、該テストは、サイズが小さくストロークが細いオブジェクト、及びオブジェクトと背景カラーとのコントラストが大きいオブジェクトとに対して、あまり厳密なカラー均一性を要求しない。該テストにおけるこうした調整又は変更は、これらのオブジェクトに対して非均一性があまり見られないという観察結果によるものである。より具体的にいえば、kで表されるオブジェクトに対する均一性の測定値は、各カラー成分に対して演算される分散(variances)の重み付けされた合計として形成される。分散の評価には、オブジェクトの内部のみが関与する。c番目のカラー成分に対する重み付けは、
で表され、ここで、b(k,c)とo(k,c)は、それぞれ、周囲背景カラーと平均オブジェクトカラーである。測定値が、しきい値(サイズが小さくストロークが細いオブジェクトに対しては、より高く設定される)を超えない場合、このオブジェクトは取り去られる。
ステップ124のクラスタリングに関連して、類似カラーを有するオブジェクトをグルーピングして、クラスタを形成する。このステップで基本的な特徴は、1)カラー類似性を測定する方法、2)演算効率を上げながら、クラスタリングする方法である。カラー類似性に関しては、オブジェクト選択に用いられたのと同じ理由付けが当てはまる。即ち、カラー類似性の測定は、大部分のオブジェクトのサイズが小さくストロークが細いことを考慮に入れる必要がある。これによって、オブジェクトのカラーは、その内部の平均カラーによって表される。また、カラー類似性における二つのクラスタk1とk2間の距離(Dis(k1,k2))は、各カラー成分の重み付けされたノルム(基準)である。例えば、
であり、同式においては、カラー成分インデックスcについて和演算がなされる。Wcは、
として付与される重みであり、同式において、関数d()は上記の等式(1)で定義されている。
得られた画像のセグメンテーションは、前景を覆うカラーまたは連続トーン画像のいずれかを用いて、画像セグメントが識別され且つレンダリングされることを可能とする。図2に示されている例が図3にさらに示されており、類似カラーオブジェクトとして、少なくとも以下のセグメント “X”310、テキスト320、324、326、328、330、332、及び334が識別されている。例示的なドキュメントが他のセグメンテーションを含むことができること、例えば、単語“Strategies”の全部が単一セグメント320であってよいことが理解されよう。
一般的なドキュメント画像のオブジェクトの数は、非常に大きくなる可能性がある。テキストで一杯に詰まったページにおいて、オブジェクトの数は容易に数万個に達する。従って、演算効率は非常に重要である。提示された方法は、複雑さがほとんど線形レベルに到達する可能性のある、2段階のクラスタリングアルゴリズムを適用する。多くのオブジェクトがあって多くのクラスタが得られるにもかかわらず、大部分のオブジェクトはほんの一握りの比較的大きなクラスタに属することが観察される。これは、多数のオブジェクトがテキストであるという事実に起因する。これらテキストとしてのオブジェクトの大部分は、黒もしくは限定された数のカラーでプリントされる。この観察に基づいて、2段階の演算上効率的なアルゴリズムの第1の段階が、カラー量子化によってクラスタリングされる。具体的には、オブジェクトのカラーが同一カラーの「箱」に量子化される場合、オブジェクトは、同一の初期クラスタに分類される。第2の段階において、初期クラスタは、等式(3)で与えられた距離測定値を用いて、さらにグルーピングされる。第1の段階は、クラスタリングすべきオブジェクトの数を、保存的量子化の場合でも、数万から一般的に数百に減らす。これによって、2段階のアルゴリズムに対する結合された複雑さは、線形である第1の段階によって主に決定される。クラスタリングにおいて、第1の段階はあまり正確でないが、量子化の「箱」のサイズが十分に小さければ、エラーは制限される。同様に、画像当たりのクラスタ数を削減するための限定を課すべく、クラスタリングの対象として考慮されるカラーの数を所定数に限定することができる。第2段階のクラスタリングに対して特別な条件はなく、多くの既知のアルゴリズムがこの目的のために使用可能である。
オブジェクトをクラスタリングするステップは、第1の抽出されたオブジェクトを第2の抽出されたオブジェクトと共にクラスタリングすべきか否かを決定すべく、オブジェクトの内部のカラーをテストするステップをさらに含むことも理解されよう。注記されたように、これによって、オブジェクトのエッジからの干渉が防止できる。また、テストする上記ステップが、カラー差に用いられ且つオブジェクトのサイズの関数であるしきい値を、大きな方のオブジェクトよりも小さな方のオブジェクトがクラスタに対してより大きなあるいは小さなカラー差受容可能性を有するように、含んでよい。また、カラー差に用いられるしきい値を、対象となるクラスタ間のカラーの差の関数とし、クラスタのカラー差が大きいほど、カラー内の抽出されたオブジェクトに対するカラー差のしきい値が大きくなるようにしてもよい。
クラスタへの包含に関するテストは、抽出されたオブジェクトの位置をクラスタ内の他のオブジェクトと比較することを含むこともある。さらに、オブジェクトとクラスタの位置の比較において、テキスト行内部と他の行上のテキスト文字の関係を考慮に入れ、行内の文字がカラー差に対して第1のしきい値を有し、他の行上の文字が、カラー差に対して、第1のしきい値よりも低い第2のしきい値を有するようにしてもよい。
図1のステップ132が示すように、オブジェクトがクラスタリングされると、MRC マスク層の生成は通常の通り行われる。各マスク層は、クラスタ毎にオブジェクトを含む。クラスタを表すカラーは、該クラスタ内のオブジェクトの平均的なカラー又はオブジェクトの平均的な内部のカラーとなるように選択される。前者は、カラーに対する忠実さに優れており、後者は細部に向上がみられ、見た目にもより美しい。両方を混合することによって最高の折衷がもたらされる。背景層は、3層モデルに用いられるアルゴリズムを用いて生成され得る。
本明細書中に記述されるように、本発明は、更なる処理のための画像のセグメントを識別するために使用可能である。上述の方法は、特定された選択に応じて、画像のセグメントに関して少なくとも一つのカラーを変更することを更に含む。例えば、少なくとも一つのカラーが黒に近いカラーであるなら、他の黒に近い文字は、少なくとも一つのカラーが同様の黒に変更されるように単純に再定義される。セグメントは、テキストセグメントとなり得、セグメント内のすべてのテキストに対するカラーは、黒にセットされる。
本発明に基く方法を示すデータフロー図である。 図1の方法の応用例を示す図である。 図1の方法の応用例を示す図である。

Claims (6)

  1. 少なくとも一つの前景層を有する混合ラスタコンテンツ形式で表示すべく、ディジタル画像のセグメンテーションを行う方法であって、
    画像から、連結された枠内において、互いに関連している画素の集合からなるオブジェクトを抽出するステップと、
    抽出されたオブジェクトのうちの少なくとも一つを選択し、前記選択されたオブジェクトの内部画素の色の分散値に基づいて前記オブジェクトのカラー一貫性を示す値を計算し、前記カラー一貫性を示す値と、前記オブジェクトの特徴の関数である閾値と、を比較することによって、前記オブジェクトを前景層に含めるために選択するか否か決定するステップと、
    選択された複数のオブジェクトにおいて、オブジェクト同士の画素の色差を計算し、前記色差と、前記色差の計算対象であるオブジェクトの特徴の関数である閾値と、を比較することによって、前記複数のオブジェクトを、各オブジェクト少なくとも一つのカラークラスタに対応付けられるよう色空間においてクラスタリングするステップと
    前記前景層の各々共通のカラークラスタに対応付けられたオブジェクトを表すように画像をセグメントするステップと、
    を有する方法。
  2. 前記複数のオブジェクトをクラスタリングするステップが、
    前記色差の計算対象となる第1オブジェクトと、第2オブジェクトと、を共通のカラークラスタに対応付けるか否かを、前記第1のオブジェクトと前記第2のオブジェクトの内部画素のみの色差に基づいて決定する、ことを含む、
    請求項1に記載の方法。
  3. 前記複数のオブジェクトをクラスタリングするステップが、
    クラスタリングの対象となる前記複数のオブジェクトの位置関係に基づいて、前記複数のオブジェクトの各オブジェクトを共通のカラークラスタに対応付けるか否かを決定する、ことを含む、
    請求項1に記載の方法。
  4. 前記色差の計算における前記閾値は、前記色差の計算対象であるオブジェクトのサイズの関数であって、
    サイズの小さなオブジェクトに対しては、サイズの大きなオブジェクトに対してよりも、より大きい色差を許容するように設定されている、
    請求項1に記載の方法。
  5. 前記カラー一貫性を示す値の計算における前記閾値は、前記カラー一貫性を示す値の計算対象であるオブジェクトのサイズの関数であって、
    サイズの小さなオブジェクトに対しては、サイズの大きなオブジェクトに対してよりも、より大きい色の分散値を許容するように設定されている、
    請求項1に記載の方法。
  6. 前記オブジェクトは、文字の画像、単語の画像、テキストの画像、コントーン画像の少なくとも一つを含む、
    請求項1に記載の方法。
JP2005170241A 2004-06-14 2005-06-10 ディジタル画像セグメンテーション方法 Expired - Fee Related JP4573706B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/866,850 US7376272B2 (en) 2004-06-14 2004-06-14 Method for image segmentation to identify regions with constant foreground color

Publications (2)

Publication Number Publication Date
JP2006004425A JP2006004425A (ja) 2006-01-05
JP4573706B2 true JP4573706B2 (ja) 2010-11-04

Family

ID=35460215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005170241A Expired - Fee Related JP4573706B2 (ja) 2004-06-14 2005-06-10 ディジタル画像セグメンテーション方法

Country Status (3)

Country Link
US (1) US7376272B2 (ja)
JP (1) JP4573706B2 (ja)
BR (1) BRPI0502019A (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204306B2 (en) * 2004-06-14 2012-06-19 Xerox Corporation Method for image segmentation based on block clustering for improved processing of touching characters
US7963448B2 (en) 2004-12-22 2011-06-21 Cognex Technology And Investment Corporation Hand held machine vision method and apparatus
US9552506B1 (en) 2004-12-23 2017-01-24 Cognex Technology And Investment Llc Method and apparatus for industrial identification mark verification
US7800779B2 (en) * 2005-12-21 2010-09-21 Xerox Corporation System and method for image based control using inline sensors
US8494280B2 (en) * 2006-04-27 2013-07-23 Xerox Corporation Automated method for extracting highlighted regions in scanned source
US8494281B2 (en) * 2006-04-27 2013-07-23 Xerox Corporation Automated method and system for retrieving documents based on highlighted text from a scanned source
US7773803B2 (en) * 2006-05-11 2010-08-10 Xerox Corporation Effective coding of page boundary for MRC/MECCA segmentation
US8108176B2 (en) 2006-06-29 2012-01-31 Cognex Corporation Method and apparatus for verifying two dimensional mark quality
US8726178B2 (en) * 2006-11-10 2014-05-13 Ricoh Company, Ltd. Device, method, and computer program product for information retrieval
US8169478B2 (en) 2006-12-14 2012-05-01 Cognex Corporation Method and apparatus for calibrating a mark verifier
US8014560B2 (en) * 2007-05-25 2011-09-06 Xerox Corporation Preserving scanner signature using MRC technology
US7907778B2 (en) * 2007-08-13 2011-03-15 Seiko Epson Corporation Segmentation-based image labeling
US8218887B2 (en) * 2007-09-28 2012-07-10 Abbyy Software, Ltd. Enhanced method of multilayer compression of PDF (image) files using OCR systems
US9734376B2 (en) 2007-11-13 2017-08-15 Cognex Corporation System and method for reading patterns using multiple image frames
US8787685B2 (en) 2008-02-21 2014-07-22 France Telecom Encoding and decoding an image or image sequence divided into pixel blocks
CN101520845B (zh) * 2008-02-29 2011-11-30 富士通株式会社 彩色文档图像的分层方法和装置
US8391638B2 (en) 2008-06-04 2013-03-05 Microsoft Corporation Hybrid image format
US8111918B2 (en) * 2008-10-20 2012-02-07 Xerox Corporation Segmentation for three-layer mixed raster content images
US20100124372A1 (en) * 2008-11-12 2010-05-20 Lockheed Martin Corporation Methods and systems for identifying/accessing color related information
US8285035B2 (en) * 2008-12-05 2012-10-09 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof
US8180153B2 (en) * 2008-12-05 2012-05-15 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a black text layer
JP4698743B2 (ja) * 2009-01-22 2011-06-08 シャープ株式会社 画像圧縮方法、画像圧縮装置、画像形成装置、コンピュータプログラム及び記録媒体
US8224073B2 (en) * 2009-07-29 2012-07-17 Xerox Corporation System and method for efficient storage of MRC images for easy classification and retrieval
US8306345B2 (en) * 2009-09-22 2012-11-06 Xerox Corporation 3+N layer mixed raster content (MRC) images and processing thereof
US8565531B2 (en) * 2009-10-09 2013-10-22 Xerox Corporation Edge detection for mixed raster content (MRC) images for improved compression and image quality
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
US8340363B2 (en) 2010-05-27 2012-12-25 Palo Alto Research Center Incorporated System and method for efficient interpretation of images in terms of objects and their parts
US8345998B2 (en) 2010-08-10 2013-01-01 Xerox Corporation Compression scheme selection based on image data type and user selections
US8792682B2 (en) 2011-04-21 2014-07-29 Xerox Corporation Method and system for identifying a license plate
JP5945487B2 (ja) * 2012-09-27 2016-07-05 株式会社沖データ 画像処理装置、プログラム及び方法
CN105608459B (zh) * 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置
US10303498B2 (en) 2015-10-01 2019-05-28 Microsoft Technology Licensing, Llc Performance optimizations for emulators
CN107133622B (zh) 2016-02-29 2022-08-26 阿里巴巴集团控股有限公司 一种单词的分割方法和装置
US11403100B2 (en) 2020-08-31 2022-08-02 Microsoft Technology Licensing, Llc Dual architecture function pointers having consistent reference addresses
US11231918B1 (en) 2020-08-31 2022-01-25 Microsoft Technologly Licensing, LLC Native emulation compatible application binary interface for supporting emulation of foreign code
US11042422B1 (en) 2020-08-31 2021-06-22 Microsoft Technology Licensing, Llc Hybrid binaries supporting code stream folding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11215281A (ja) * 1998-01-27 1999-08-06 Fuji Xerox Co Ltd 画像中継装置、画像中継システム
JPH11261833A (ja) * 1998-03-11 1999-09-24 Fuji Xerox Co Ltd 画像処理装置、画像送信装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
KR100294924B1 (ko) * 1999-06-24 2001-07-12 윤종용 영상분할 장치 및 방법
US6782126B2 (en) * 2001-02-20 2004-08-24 International Business Machines Corporation Method for combining feature distance with spatial distance for segmentation
JP4139571B2 (ja) * 2001-02-28 2008-08-27 大日本スクリーン製造株式会社 カラー画像の領域分割
US7181064B1 (en) * 2001-11-16 2007-02-20 Hewlett-Packard Development Company, L.P. Histogram-based color consistency measure for scene reconstruction

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11215281A (ja) * 1998-01-27 1999-08-06 Fuji Xerox Co Ltd 画像中継装置、画像中継システム
JPH11261833A (ja) * 1998-03-11 1999-09-24 Fuji Xerox Co Ltd 画像処理装置、画像送信装置

Also Published As

Publication number Publication date
BRPI0502019A (pt) 2006-01-24
JP2006004425A (ja) 2006-01-05
US7376272B2 (en) 2008-05-20
US20050275897A1 (en) 2005-12-15

Similar Documents

Publication Publication Date Title
JP4573706B2 (ja) ディジタル画像セグメンテーション方法
JP4667062B2 (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
Zhang et al. Quality assessment of screen content images via convolutional-neural-network-based synthetic/natural segmentation
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
WO2018223994A1 (zh) 中文打印字符图像合成方法及装置
JP4118749B2 (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP4006224B2 (ja) 画像品質判定方法、判定装置、判定プログラム
JP3345350B2 (ja) 文書画像認識装置、その方法、及び記録媒体
US9930218B2 (en) Content aware improvement of captured document images
US20110050723A1 (en) Image processing apparatus and method, and program
CN108470350B (zh) 折线图中的折线分割方法及装置
JP2003523587A (ja) ビジュアルアテンションシステム
JPH02105978A (ja) 自動文書セグメンテーションのためのシステム及び方法
US8582879B2 (en) Image processing device and image processing method that convert color image into monochrome image
US6532302B2 (en) Multiple size reductions for image segmentation
US7454067B1 (en) Symbol classification depending on cluster shapes in difference image
US8842928B2 (en) System and method of document image compression
Caron et al. Use of power law models in detecting region of interest
US8594384B2 (en) Method and system for measuring text-rendering quality
US20230316697A1 (en) Association method, association system, and non-transitory computer-readable storage medium
Triantaphillidou et al. Image quality comparison between JPEG and JPEG2000. II. Scene dependency, scene analysis, and classification
RU2534005C2 (ru) Способ и система преобразования моментального снимка экрана в метафайл
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
Juliet et al. Effective layer-based segmentation of compound images using morphology
Agam et al. Degraded document image enhancement

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100817

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130827

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees