JP2007174654A - 文書画像を示す走査データを処理するための方法 - Google Patents

文書画像を示す走査データを処理するための方法 Download PDF

Info

Publication number
JP2007174654A
JP2007174654A JP2006339320A JP2006339320A JP2007174654A JP 2007174654 A JP2007174654 A JP 2007174654A JP 2006339320 A JP2006339320 A JP 2006339320A JP 2006339320 A JP2006339320 A JP 2006339320A JP 2007174654 A JP2007174654 A JP 2007174654A
Authority
JP
Japan
Prior art keywords
text
data
image
background
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006339320A
Other languages
English (en)
Other versions
JP4994017B2 (ja
Inventor
Zhigang Fan
ファン ジガン
Stuart A Schweid
エー. シュウェイド スチュアート
Martin E Banton
イー. バントン マーティン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2007174654A publication Critical patent/JP2007174654A/ja
Application granted granted Critical
Publication of JP4994017B2 publication Critical patent/JP4994017B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Abstract

【課題】背景をより正確に識別することができる走査画像データ、及びこの走査画像データ内のテキストデータをより好ましくセグメント化する。
【解決手段】文書画像を示す走査データを処理するための方法において、走査データを背景及びフォアグラウンドの各レイヤにセグメント化し、フォアグラウンドレイヤ候補のデータを含む走査データを複数のウインドウに表示し、該複数のウインドウのそれぞれが背景レイヤデータに隣接するように識別され得る選択された領域を含み、テキスト、図形、及び画像のそれぞれのオブジェクトを含むオブジェクトを、これら複数のウインドウから抽出し、オブジェクトがオブジェクト周辺との間に所定のコントラスト・レベルを有することに基づいてオブジェクトを分類し、これにより改良された再生画像品質で高圧縮比を達成するためのデータをセグメント化する。
【選択図】図5

Description

本発明は、画像セグメント化(セグメンテーション)に関し、詳細には、文書画像を示す走査されたデータを処理する方法であって、高い再生画質を得るためにより好適に画像の背景及びテキスト部分を検出する方法に関する。
本発明の例示的な実施の形態は、多数の抽出された一定の色領域(「MECCA」)を備えた混合ラスターコンテント(「MRC」)画像を生成するための画像セグメント化方法を対象とする。MRCモデリングは、高い圧縮比を達成し、一方で良質に構成された画質を維持可能な強力な画像表示方法である。MECCAモデリングは、比較的分解能を必要としないこと、内在するテキスト強調できること、ならびにノイズ低減を特徴とする利点を有する。MECCAモデルは、1つの背景レイヤ(層)、N個のフォアグラウンドレイヤ、及びN個のマスクレイヤ(ここでNは非負整数である)を含んでいる。背景レイヤは連続階調ビットマップであってもよいが、フォアグラウンドレイヤは一定色に制限される。
1つの画像のMRC/MECCA表示を生成するためには、セグメント化が必要である。セグメント化アルゴリズムは一般に、4つのステップ、即ち、オブジェクト抽出、オブジェクト選択、カラー・クラスタリング、及び結果生成から構成される。第1のステップでは、テキスト及び他のオブジェクトが画像から抽出される。次に、抽出されたオブジェクトは、フォアグラウンドレイヤに表示されるべきかどうかを判断するために、色の一定性及びその他の特徴に対して検査される。第3のステップでは、選択されたオブジェクトが、色空間内でクラスタ化される。最終的に画像は、それぞれのフォアグラウンドレイヤが同一色のクラスタからのオブジェクトをコード化するようにセグメント化される。
ウインドウ処理は、文書画像セグメント化における別の概念である。ウインドウ処理は、ページを背景境界によって分離される異なる領域に仕切る。ウインドウ処理は、最初に、異なるテキスト・オブジェクト及びウインドウを分離するページ背景を識別する。ウインドウは、画像及び図形(「合成画像」と称される)のようなものとして分類される。グラフィック・ウインドウは、更に再帰的に処理される。グラフィック・ウインドウの局所背景が検出される。テキスト及び(1つのウインドウ内の)ウインドウは局所背景によって分離される。これら(1つのウインドウ内部の)ウインドウは分類される。すべてのオブジェクトが分離されるまで、このプロセスは繰り返される。
MRC/MECCAセグメント化の一部として適用可能なウインドウ処理が必要である。これは、オブジェクトとしてテキスト及びその他の詳細を抽出し、これらオブジェクトは、フォアグラウンドレイヤにおいてコード化されることになる候補である。
ページ背景検出は一般に、走査済み文書画像セグメント化のための最初のステップである。検出された背景は、さらに、テキスト文字、画像、及び図形を含むページにおいて異なるオブジェクトを分離するために適用されることができる。ページ背景検出は、また、背景強調のような用途に対しても有用である。既存のページ背景検出方法の多くは、全体的(全域的)なしきい値処理に基づく。具体的には、しきい値はまず、画素強度の全体的なヒストグラムから抽出される一部の統計値を使用して決定される。しきい値は、そのページ上のすべての画素に適用される。上記のアプローチは一般に妥当な結果を生成するが、テキスト領域、及び背景が黒っぽい対象と近接するその他の領域で失敗することがある。テキスト(及びより黒っぽい)領域における背景は、空いた白色領域のそれとは異なる統計的分布を有していることが多い。多くの理由で、例えばICE(統合的キャビティ効果)や、JPEG(ジェイペグ)リンギング(ringing)アーチファクト(一部の走査画像は軽くJPEGで圧縮されてファイルサイズ及び/又はバンド幅を低減させ、圧縮が軽いと導入されるリンギングは目に見えないこともあるが、ページ背景検出結果を変化させるのに十分に強いことがある)などの利用で黒っぽくなる傾向がある。背景検出中におけるエラーは、背景強調のような用途に対しては有効である可能性があるが、MRC/MECCAモデルをセグメント化するような他の用途に対しては不適当な結果を導くことがある。しきい値を全体的に低下させて(更なる領域が背景として検出される)問題を回避することができる。しかしながら、画像領域のような明るく背景でない部分を背景として誤って判別する危険がある。局所しきい値処理方法が、テキスト及び背景を分離するために存在する。こうした方法は、しきい値を確立するために局所統計値に依拠する(を用いる)。これらの方法は、テキスト及び他の小さな細部を効果的に抽出することができ、したがってOCRなどの用途に適している。しかしながら、これら方法は、画像用ウインドウなどの大きなオブジェクト見出すことができず、ページ背景検出に対しては一般に不適当である。たとえば、「非ページ背景」として分類すべきところ、一般的には、色背景上のテキストは、「テキスト」及び「背景」として分類する。さらに、局所しきい値処理法は、一般に多くの計算を必要とする。
データを背景又はテキストの一方にセグメント化することが重要であることは、異なる画像の種類に応じて、対応する圧縮アルゴリズムを使用することがはるかに効率的であるという理由からである。たとえば、JPEGが画像のための効率的な圧縮アルゴリズムである一方、他のアルゴリズムは特にテキストなどの二値画像向けに設計される。走査画像データの異なる部分に対して異なる圧縮アルゴリズムを使用することは、再生された高画質のデータに対する高圧縮比という利点を提供する。
したがって、背景をより正確に識別することができる走査画像データ、及びこの走査画像データ内のテキストデータをより好ましくセグメント化する必要がある。
より広範囲にウインドウ表示情報を利用するMRC/MECCAセグメント化方法を提供する。より詳しくは、画像は、背景及び異なる複数のウインドウに分割される。各ウインドウは、画像又は図形のいずれかとして分類される。このようなウインドウ表示分類は、セグメント化方法内での意思決定及びパラメータ選択を最適化する。
本実施の形態に従って、ページ背景検出方法はまた、2つのしきい値構成に基づいて開示される。2つのヒストグラムが作成され、テキスト・ヒストグラムはテキスト(及びより黒っぽい)領域から、白色領域ヒストグラムは非テキスト(及びより明るい)領域から作成される。近傍に黒っぽい画素が存在する画素はテキスト・ヒストグラムに寄与し、そうでない画素は、白色領域ヒストグラムに寄与する。2つのしきい値は、2つのヒストグラムから生成され、テキスト領域及び非テキスト領域に別々に適用される。このような検出方法は、明るい画像領域を犠牲にすることなく、テキスト及び背景をきれいに分離することができる。
したがって、再生画像品質を改良し圧縮比を高めるためのセグメント化データを含む文書画像を表わす走査データを処理するための方法が提供される。この方法は、走査データを背景レイヤ及びフォアグラウンドレイヤにセグメント化することを含む。走査データのフォアグラウンドレイヤは、複数のウインドウで表示され、各ウインドウは背景レイヤデータと隣接するように識別され得る選択領域を有する。オブジェクトは複数のウインドウからオブジェクトが抽出され、ここでオブジェクトはテキスト、図形及び画像オブジェクトから構成され、それぞれが背景レイヤデータに対するコントラストの特殊性によって識別可能である。テキストオブジェクトは、比較的低いレベルのコントラストによって識別され、図形オブジェクトは次のレベルのコントラストで、画像オブジェクトは、比較的高いレベルのコントラストによって識別される。さらに個々のレベルのコントラストは予め選択されたしきい値によって定義される。
背景レイヤのセグメント化は、画素強度を表わす複数のヒストグラムを作成し、該テキスト・ヒストグラムの1つが走査画像の黒っぽい領域におけるテキストを表わし、白色領域ヒストグラムは走査画像の非テキスト(より明るい)領域を表わす。異なるしきい値は、ページ背景レイヤを識別するためのヒストグラムに適用される。
本発明は、改良された高圧縮比及び良好な再構築画像品質を実現するために走査データをセグメント化することに関する。上述のように、異なるタイプの走査データは、異なるタイプの圧縮アルゴリズムに従ってより効率的に圧縮されることができる。画像が緩慢に変化する走査画像データ部分(ピクチャ)は、JPEGのような画像圧縮アルゴリズムによって良好に圧縮される。遷移領域は、バイナリ圧縮器によって良好に圧縮される。したがって、セグメント化プロセスは、基本的には画像を幾つかのレイヤにセグメント化し、緩慢に変化する情報を伝送するレイヤが画像圧縮器で圧縮され、急激な遷移を伝送するレイヤはバイナリ圧縮器によって圧縮される。
本発明は、主として、走査画像データの「ウインドウ処理」、及びページ背景レイヤ検出の識別に対する2つのしきい値処理技法に関する。このウインドウ処理は、ページ背景、一般に用紙の白い部分を使用することに関し、ページ上のオブジェクトを分離することである。オブジェクトによって、一部のテキストや文字、図形表示、又は画像表示が示される。ウインドウ内のオブジェクトデータを識別し、それを背景データからウインドウ内のフォアグラウンド・レイヤデータをより正確な方法で処理することによって、データ・セグメント化はより効率的に実行され、データはより効率的に圧縮されてより正確に再生される。主な目的は、テキスト材料を他のオブジェクトデータから区別しフォアグラウンドレイヤとして正確に分離することである。たとえば、画像データが一部のテキストを含む画像から構成される場合、画像内の非テキストの小さなオブジェクトとテキストは画素の強度により基づくため、テキストと非常に類似して見えるので、混同されないことが重要である。
特に図1を参照すると、画像1は、テキストデータ2、画像データ4、及び図形データ6から構成される。画像のこれらの部分のすべてが白色背景によって隣接されていることが理解できる。図2は、従来の背景検出方法とともに発生する可能性がある問題を示し、ここで、単一のしきい値は、画素データのヒストグラムの全体的しきい値処理に基づいて適用される。この場合、テキスト及び白色ページ背景間の領域の分離は、テキストの領域内の隣接する黒っぽい画素によってあまりきれいではない。その適用されたしきい値が高すぎると、このような部分のページ背景領域をはっきりと区別することはできない。あるいはまた、全体的しきい値処理が低下されてページ背景検出を向上させる場合、画像データのより白い領域8は背景レイヤとして混同される可能性がある。しかしながら、図4の再生された画像を図2及び図3と対照させることは、本件の方法が白色背景レイヤ、及びこれによるクリアで鮮明なテキスト部分をより高品質で再生を行なうことを立証する。
図5を参照すると、本発明は、ウインドウ処理情報をより広範囲に利用するMRC/MECCAセグメント化方法から構成される。図5を参照すると、ウインドウ処理10は、オブジェクト抽出20、オブジェクト選択30、カラー・クラスタリング40、及びコーディング50と組み合わされる。
ウインドウ処理10は、画像を複数のブロックに分けることを含んでいる。上述したように、各ウインドウは、背景によって分離される異なる領域にページを区分することを含む。したがって、画像は、ウインドウを画像及び図形のいずれかとして分類するために、背景ウインドウおよび異なるウインドウに区分される。以下に述べられるように、分類されたウインドウはオブジェクト抽出20、オブジェクト選択30、カラー・クラスタリング40、及び結果生成(コーディング)50のそれぞれにステップにおいて、意思決定及びパラメータ選択プロセスを最適化するために利用することができる。
図6を参照すると、オブジェクト抽出20のステップにおいて、抽出されるオブジェクトに対して、(オブジェクトとその環境との間に)強いコントラストが必要とされる。画像ウインドウには、背景及び図形のそれぞれのウインドウよりも、もっと厳しい条件(より強いコントラスト)が課せられる。これは、ノイズは画像ウインドウ内にある傾向が強いという事実による。より強いコントラスト要件は、これを演繹的知識として示す。したがって、潜在的オブジェクトから成る候補データは、抽出される(60)。オブジェクトが図形データ又は画像データを含むウインドウ内にない場合、テキスト・オブジェクトとして識別のために考慮され、第1のパラメータ・セットE1(64)がそのテキストオブジェクトを背景レイヤデータと区別するために適用される。そのパラメータ・セットE1(64)は、比較的低いレベルのコントラスト表示を含んでいる。そのオブジェクトが図形又は画像ウインドウ62のいずれかにある場合、該オブジェクトが図形ウインドウ66内にあると判断されることになり、第2のパラメータ・セットE2(68)が、背景レイヤデータとは対照的にウインドウ内で図形オブジェクトを識別するために適用される。パラメータ・セットE2(68)は、パラメータ・セットE1よりも高い次のレベル・コントラストによって識別される。オブジェクトが画像ウインドウにある場合、パラメータ・セットE3(70)は比較的高いレベルのコントラストを含むように適用される。パラメータ・セット値E1、E2、E3は、実験的データに基づいて予め定められている。適用されたパラメータ・セットの用途によって抽出され得る(72)オブジェクトは、これらは適切に分類されたオブジェクトリストに送信される(74)。すべてのコントラスト測定値は、特定の対象となるオブジェクトの環境に左右される。「環境」によって、隣接する画素を意味することを意図する。
オブジェクト選択ステップにおいて、オブジェクトは、色均一性に関して検査される。均一なオブジェクトのみがフォアグラウンドレイヤの候補としてさらに考慮される。また一方、異なる評価基準が、テキスト、図形、及び画像データに適用される。選択の基準となるためのしきい値は、画像ウインドウのオブジェクトに対して高く(より困難に)設定される。さらに詳しくは、選択パラメータS1は、ウインドウにないデータ、即ち、候補テキストデータに対して適用され(80)、パラメータ・セットS1が、比較的低いレベルの色均一性を表示する。第2のパラメータ・セットS2の適用は、ウインドウ内の図形オブジェクトに対して行なわれる(82)。第3のパラメータ・セットS3は、画像ウインドウ・データに適用される(84)。色均一性図形パラメータ・セットS3はパラメータ・セットS2より高く、このパラメータセットは低いパラメータ・セットS1よりも高い。さらに、パラメータ・セットは、実験的データに基づいて予め定められている。パラメータ・セットを適用して、候補オブジェクトに色均一性が不足していると決定されると、フォアグラウンドレイヤとしてのオブジェクト選択から削除される(86)。
図8のカラークラスタリング・ステップにおいて、オブジェクトは、各グループ内でオブジェクトが同じ色となるようにグループ化される。このクラスタリングは、最初に同じウインドウ内で実行され、そして同じタイプのウインドウ内で実行される。異なる種類のウインドウからのオブジェクトは、異なるクラスタに残存する。画像ウインドウにおける小さなクラスタ(オブジェクトを有するクラスタ)は、ノイズを表すことがよくあるので(背景として符号化され)廃棄される。より詳しくは、3つの区別可能なクラスタリング・パラメータ・セットはまた、候補オブジェクトに適用される。ウインドウの外側にある候補オブジェクト、即ち、テキスト・オブジェクトでは、第1のクラスタ・パラメータ読み取りセットC1の使用が加えられ(90)、同色のオブジェクトが比較的低いレベルにあることを判断する。図形オブジェクトでは、第2のパラメータ・セットC2が、ウインドウ内の図形オブジェクトを識別するために加えられる92。最後に、第3のパラメータ・セットC3は、候補画像オブジェクトに適用され、色均一性に対するしきい値が高いレベルに設定される。同一色を有するようにクラスタ化可能なオブジェクトは適切にクラスタ化される。
図9及び図10に関して、本実施の形態の別の特徴は、2つのしきい値処理を使用するページ背景検出方法に関して説明される。2つのヒストグラムは、一方がテキスト(及びより黒っぽい)領域から、さらに他方が非テキスト(及びより明るい)領域から作成される。その付近に(即ち、所定の周辺領域内に)黒っぽい画素があると、画素はテキスト・ヒストグラムに寄与する。そうでなければ、白色領域ヒストグラムに寄与する。2つのしきい値は、2つのヒストグラムから生成され、テキスト(より黒っぽい)領域と、非テキスト(より明るい)領域に別個に適用される。ヒストグラムは、それぞれ、背景領域、ブロック、テキスト領域、又はブロックから(100)の統計値を収集するために作成される。その統計値派分析され(102)、ヒストグラムからしきい値を導き出す(104)。
図10に関して、一実施の形態において、本発明の方法は、画像を分離ブロックにセグメント化することを含んでいる。すべての画素強度が所定値より大きい場合、ブロックは「背景」ブロックであると考えられる。そうでなければ、ブロックは、「テキストブロック」として分類される。候補ブロックが識別されると(106)、これらブロックは、黒色画素を含むか否かを判断するために検査される(108)。肯定判断の場合、第1のしきい値はテキスト・ヒストグラムを更新する(110)ために適用されて、テキストしきい値によって識別されるテキストデータを含む。否定判断の場合、ブロックは、第2のしきい値の適用に基づいて背景ヒストグラムを更新する(112)ために使用される。
図1は、セグメント識別、特にページ背景検出のために処理されるべきオリジナル画像の表示を示す図である。 図2は、従来方法の処理結果を示す図である。 図3は、代替的セグメント化方法の結果を示す図である。 図4は、本発明の方法によるページ背景再生のための高品質再生画像結果を示す図である。 図5は、ウインドウ情報に基づく本発明の画像セグメント化のための処理工程を示しているフローチャートである。 図6は、図5のオブジェクト抽出ステップの処理工程をより詳細に示すフローチャートである。 図7は、図5のオブジェクト選択ステップの処理工程をより詳細に示すフローチャートである。 図8は、図5のカラークラスタ化ステップの処理工程をより詳細に示すフローチャートである。 図9は、2つのしきい値処理を使用するページ背景検出方法のための処理工程を一般に示すフローチャートである。 図10は、図9の統計値収集ステップの処理工程をより詳細に示すフローチャートである。

Claims (4)

  1. 改良された再生画像品質で高圧縮比を達成するためにデータをセグメント化することを含む、文書画像を示す走査データを処理するための方法であって、
    走査データを背景及びフォアグラウンドの各レイヤにセグメント化するステップと、
    フォアグラウンドレイヤ候補のデータを含む走査データを複数のウインドウに表示することであって、該複数のウインドウのそれぞれが背景レイヤデータに隣接するように識別され得る選択された領域を含む、前記ウインドウに表示するステップと、
    テキスト、図形、及び画像のそれぞれのオブジェクトを含むオブジェクトを、前記複数のウインドウから抽出するステップと、
    オブジェクトがオブジェクト周辺との間に所定のコントラスト・レベルを有することに基づいてオブジェクトを分類するステップと、
    を含む、文書画像を示す走査データを処理するための方法。
  2. 前記背景レイヤのセグメント化するステップが、画素強度を表す複数のヒストグラムを作成し、これらヒストグラムの1つがテキスト及び走査データの黒っぽい領域を示し、他のヒストグラムが走査データの非テキスト領域及びより明るい領域を示す、請求項1に記載の方法。
  3. 前記分類するステップは、背景レイヤデータに対するコントラスト識別性によってテキスト、図形、及び画像のそれぞれのオブジェクトを識別し、テキスト・オブジェクトが比較的最も低いレベルのコントラストで、図形オブジェクトが次のレベルのコントラストで、画像オブジェクトが比較的最も高いレベルのコントラストでそれぞれ表示され、個々のレベル・コントラストが予め選択されたしきい値によって定義される、請求項1に記載の方法。
  4. 前記オブジェクトを抽出するステップは、背景レイヤに対してテキスト・オブジェクトを識別するための第1のテキスト・セットと、背景レイヤに対して図形オブジェクトを識別するための第2の図形セットと、背景レイヤに対して画像オブジェクトを識別するための第3の画像セットと、を含む、抽出パラメータ・セットに基づく、請求項1に記載の方法。
JP2006339320A 2005-12-21 2006-12-18 文書画像を示す走査データを処理するための方法 Expired - Fee Related JP4994017B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/313980 2005-12-21
US11/313,980 US7379593B2 (en) 2005-12-21 2005-12-21 Method for image segmentation from proved detection of background and text image portions

Publications (2)

Publication Number Publication Date
JP2007174654A true JP2007174654A (ja) 2007-07-05
JP4994017B2 JP4994017B2 (ja) 2012-08-08

Family

ID=38173559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006339320A Expired - Fee Related JP4994017B2 (ja) 2005-12-21 2006-12-18 文書画像を示す走査データを処理するための方法

Country Status (2)

Country Link
US (1) US7379593B2 (ja)
JP (1) JP4994017B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204306B2 (en) * 2004-06-14 2012-06-19 Xerox Corporation Method for image segmentation based on block clustering for improved processing of touching characters
JP4277218B2 (ja) * 2005-02-07 2009-06-10 ソニー株式会社 記録再生装置、その方法及びプログラム
US7664329B2 (en) * 2006-03-02 2010-02-16 Honeywell International Inc. Block-based Gaussian mixture model video motion detection
US7763876B2 (en) * 2007-04-06 2010-07-27 Xerox Corporation Gloss and differential gloss measuring system
US8218887B2 (en) * 2007-09-28 2012-07-10 Abbyy Software, Ltd. Enhanced method of multilayer compression of PDF (image) files using OCR systems
US7764893B2 (en) * 2008-01-31 2010-07-27 Xerox Corporation Use of customer documents for gloss measurements
US8077358B2 (en) * 2008-04-24 2011-12-13 Xerox Corporation Systems and methods for implementing use of customer documents in maintaining image quality (IQ)/image quality consistency (IQC) of printing devices
US8150106B2 (en) 2008-04-30 2012-04-03 Xerox Corporation Printer characterization, monitoring and diagnosis using dynamic test patterns generated by sensing and analyzing customer documents
US8208183B2 (en) * 2008-11-19 2012-06-26 Xerox Corporation Detecting image quality defects by measuring images printed on image bearing surfaces of printing devices
JP2010205067A (ja) * 2009-03-04 2010-09-16 Fujifilm Corp 領域抽出装置、領域抽出方法及び領域抽出プログラム
KR101058726B1 (ko) * 2009-11-11 2011-08-22 삼성전자주식회사 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법
US8340363B2 (en) 2010-05-27 2012-12-25 Palo Alto Research Center Incorporated System and method for efficient interpretation of images in terms of objects and their parts
CN102456219B (zh) * 2010-10-14 2014-09-03 北大方正集团有限公司 光栅化方法和装置
US8306335B2 (en) * 2011-03-30 2012-11-06 Seiko Epson Corporation Method of analyzing digital document images
JP6205221B2 (ja) * 2013-09-20 2017-09-27 理想科学工業株式会社 印刷制御装置、及び、プログラム
US9740995B2 (en) * 2013-10-28 2017-08-22 Morningstar, Inc. Coordinate-based document processing and data entry system and method
CN105608459B (zh) 2014-10-29 2018-09-14 阿里巴巴集团控股有限公司 商品图片的分割方法及其装置
CN108961316B (zh) * 2017-05-23 2022-05-31 华为技术有限公司 图像处理方法、装置及服务器
US11995511B2 (en) 2018-02-08 2024-05-28 Digimarc Corporation Methods and arrangements for localizing machine-readable indicia
US10958807B1 (en) * 2018-02-08 2021-03-23 Digimarc Corporation Methods and arrangements for configuring retail scanning systems
US10880451B2 (en) 2018-06-08 2020-12-29 Digimarc Corporation Aggregating detectability metrics to determine signal robustness

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11261833A (ja) * 1998-03-11 1999-09-24 Fuji Xerox Co Ltd 画像処理装置、画像送信装置
JP2001223903A (ja) * 1999-12-04 2001-08-17 Luratech Ges Fuer Luft & Raumfahrttechnologie & Multimedia Mbh 走査された色付きおよびグレースケールの文書を圧縮する方法
JP2004056790A (ja) * 2002-07-01 2004-02-19 Xerox Corp 画像信号を一組の画像プレーンに分離するセグメント化方法及びシステム
JP2005020227A (ja) * 2003-06-25 2005-01-20 Pfu Ltd 画像圧縮装置
JP2005294877A (ja) * 2003-07-01 2005-10-20 Xerox Corp ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
DE60109278T2 (de) * 2001-06-26 2006-03-30 Nokia Corp. Verfahren und Gerät zur Lokalisierung von Schriftzeichen in Bildern aus einer Digitalkamera

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11261833A (ja) * 1998-03-11 1999-09-24 Fuji Xerox Co Ltd 画像処理装置、画像送信装置
JP2001223903A (ja) * 1999-12-04 2001-08-17 Luratech Ges Fuer Luft & Raumfahrttechnologie & Multimedia Mbh 走査された色付きおよびグレースケールの文書を圧縮する方法
JP2004056790A (ja) * 2002-07-01 2004-02-19 Xerox Corp 画像信号を一組の画像プレーンに分離するセグメント化方法及びシステム
JP2005020227A (ja) * 2003-06-25 2005-01-20 Pfu Ltd 画像圧縮装置
JP2005294877A (ja) * 2003-07-01 2005-10-20 Xerox Corp ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム

Also Published As

Publication number Publication date
JP4994017B2 (ja) 2012-08-08
US20070140571A1 (en) 2007-06-21
US7379593B2 (en) 2008-05-27

Similar Documents

Publication Publication Date Title
JP4994017B2 (ja) 文書画像を示す走査データを処理するための方法
US6973213B2 (en) Background-based image segmentation
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
JP4590470B2 (ja) 背景色を推定する方法およびシステム
US20180020118A1 (en) Image processing apparatus, method, and storage medium
JP4667062B2 (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
JP4745297B2 (ja) デジタル画像における均一な色の領域を特定する方法およびシステム
Gllavata et al. A robust algorithm for text detection in images
US6101274A (en) Method and apparatus for detecting and interpreting textual captions in digital video signals
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
US20080056573A1 (en) Methods and Systems for Identifying Text in Digital Images
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
US9158987B2 (en) Image processing device that separates image into plural regions
CN115330795A (zh) 布匹毛刺缺陷检测方法
US10496894B2 (en) System and method for text localization in images
JP2007306560A (ja) 文書画像データのページ境界の処理方法
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
US20060269132A1 (en) Apparatus and method for detecting white areas within windows and selectively merging the detected white areas into the enclosing window
Vu et al. Automatic extraction of text regions from document images by multilevel thresholding and k-means clustering
Felhi et al. Multiscale stroke-based page segmentation approach
Chang et al. Color-texture segmentation of medical images based on local contrast information
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
WO2002017220A1 (fr) Procede d'extraction de zones de caracteres dans une image
Carel et al. Multiresolution approach based on adaptive superpixels for administrative documents segmentation into color layers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120410

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120508

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees