JP2005228331A - 類似の特徴を有する画像データの領域を互いに接続するシステム及び方法 - Google Patents

類似の特徴を有する画像データの領域を互いに接続するシステム及び方法 Download PDF

Info

Publication number
JP2005228331A
JP2005228331A JP2005035185A JP2005035185A JP2005228331A JP 2005228331 A JP2005228331 A JP 2005228331A JP 2005035185 A JP2005035185 A JP 2005035185A JP 2005035185 A JP2005035185 A JP 2005035185A JP 2005228331 A JP2005228331 A JP 2005228331A
Authority
JP
Japan
Prior art keywords
blob
line
temporary
linked
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005035185A
Other languages
English (en)
Inventor
Donald J Curry
ジェイ.カリー ドナルド
Asghar Nafarieh
ナファリエ アスガー
Doron Kletter
クレター ドロン
Todd W Thayer
ダブリュ.セイヤー トッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2005228331A publication Critical patent/JP2005228331A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/421Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】 本発明は、文書を、複数のバイナリ前景平面を有する複合ラスターコンテンツフォーマットで画像データに変換するシステム及び方法を提供する。
【解決手段】 画像データを線毎に分析して、類似の色及びエッジ特徴を有する画素を特定する。1つの線上にあるこれらの画素と別の線上の画素とは、両者が類似の特徴を共有する場合にはリンクされる。これらのリンクされた画素同士は領域としてグループ化され、この領域の平均色が計算される。画素が属する領域を特定する画像マップが、領域の最終的なテーブルと共に生成される。
【選択図】 図2

Description

本発明は、画像データを類似した色特徴を有する領域に組織化することに関する。
高い解像度で走査された文書には、一般的に、非常に大きな記憶スペースが必要である。そのうえ、大量の画像データには、ローカルエリアネットワークもしくはワイドエリアネットワーク上で、イントラネット、エクストラネットもしくはインターネット上で又は他の分散型ネットワーク上で転送するなど、その操作に実質的に多くの時間と帯域幅とが必要である。
文書は、スキャナ等を用いて走査されると、一般にRGB色空間を用いて、すなわち未加工のRGBフォーマットで定義される。しかしながら文書画像データは、この走査された状態の未加工のRGBフォーマットで記憶されるのではなくて、ある種の形態のデータ圧縮を受けて容量が減少し、これによって、このような走査されたRGB文書画像データを記憶するのに高い費用がかかることが回避される。
Lempel−Ziv(LZ)又はLempel−Ziv−Welch(LZW)などの無損失のランレングス圧縮方式は、走査された画像データ又は、一般的に、階調度及び/又は自然映像データなどの滑らかに変化する低空間周波数を有する画像データに対しては特に良好に機能せず、一方、JPEGなどの損失性の方法は、滑らかに変化する連続的な色調画像データに対してはかなり良好に機能する。しかしながら、損失性の方法は、一般的に、バイナリテキスト及び/又は線画の画像データに対しては、又は一般的に、例えばシャープなエッジや色遷移を含む高空間周波数画像データに対しては特に良好に機能しない。
ある画像中で色及びエッジの連続性の特徴を共有する領域に属する画素を識別することが可能なシステム及び方法を説明する。これらの領域は、最初に画像を上から下に走査し、同じグループに属する各走査線上にある画素を識別することによって、識別される。次に、yリンクフィールドが、1つの線上にある画素のグループを、他の線上にあって、色及びエッジの連続性の特徴が同じである画素のグループとリンクさせる。これらのグループ同士をリンクさせて二次元領域として、1つのグループとして処理することが可能となる。
画像中の領域を識別するこの方法は、ミックスト(複合)ラスターコンテンツ(MRC)フォーマット画像データに応用可能である。MRCは、色及び/又はグレースケールの情報と混合したテキストを有する複合画像の画像データを処理するのに特に適した方法であり、この画像は2つ以上の平面にセグメント化される。これらの平面は、一般に、背景平面と前景平面と呼ばれる。セレクタ平面が生成されて、この複合画像中の各画素に対して、これら画像平面の内いずれが、最終的な出力画像を再構成するために用いるべき実際の画像データを含んでいるかを示す。画像データをこのように平面にセグメント化すると、画像の全体的な圧縮性が向上する傾向があるが、その理由は、データを互いに異なる平面に配置して、平面の各々をオリジナルの画像データより平滑かつ圧縮可能とすることが可能だからである。セグメント化することによって、また、それぞれ異なる平面に対してそれぞれ異なる圧縮方法を適用することが可能となる。このようにして、各平面上にあるデータのタイプに対して最も適切な圧縮技法を適用して、該平面のデータを圧縮することが可能となる。
残念ながら、ポータブル文書フォーマット(PDF)などの一部の画像文書フォーマットでは、このようなオリジナルの文書の3層複合ラスターコンテンツの分解は、完全にはサポートされていない。その結果、このような画像文書フォーマットを用いて圧縮された複合ラスターコンテンツ画像データファイルとして記憶されている文書を印刷したり或いはレンダリングしようとすると、この文書は全くレンダリングできないか、又は、レンダリングすると好ましくないアーティファクトが含まれたりする。
本発明は、文書を、複数のバイナリ前景平面を有する複合ラスターコンテンツフォーマットで画像データに変換するシステム及び方法を提供する。この画像データの中で関連した特徴を1つ以上有する画素を、類似したエッジ連続性値を有する画素を囲む連続した閉曲線境界を有する「ブロブ」と呼ばれる領域に収集するシステム及び方法について説明する。この画像の1つの走査線に発生するブロブを識別する走査テーブルを入力として取り入れて、1つの走査線上に発生するこれらのブロブを前の走査線上で発生したブロブと接続するモジュールについて説明する。このモジュールはページの底部で開始し、頂部へと戻るよう動作するので、ボトムツートップ型モジュールと呼ばれる。次にこのボトムツートップ型モジュールはブロブのグローバルテーブルを生成する。このテーブルでは、画像データのページに存在する全てのブロブが一貫した識別番号で記述される。
ブロブのグローバルテーブルが生成されると下流の処理モジュールに出力され、処理モジュールによって、さまざまなブロブがその空間的関係と色類似性とにしたがって互いにクラスタ化される。これによって、これら領域のクラスタ各々を、前記複数のバイナリ前景平面の内の1つに位置させることが可能となる。特に、所与のバイナリ前景平面中に収集される各領域は、このバイナリ前景平面の色に十分類似した色を有し、出力画像中で条件を満たす色のレンダリングで、高品質画像を再生可能である。
本発明の請求項1に記載の発明は、画像データ中の画素の領域を識別する方法であって、a)色特徴の互いの相違が所定量未満である画像データから成る第1の線上の画素を含むブロブを識別することと、b)前記ブロブを一時的ブロブ識別子と関連付けることと、c)色特徴の互いの相違が所定量未満である前記画像データの隣の線上の画素を含む追加のブロブを識別することと、d)前記追加のブロブが前記ブロブにリンクされると、前記追加のブロブを前記一時的ブロブ識別子と関連付けることと、を含むことを特徴とする。
本発明の請求項2に記載の発明は、画像データ中の画素の領域を識別する方法であって、色特徴の互いの相違が所定量未満である画像データから成る周辺の線上の画素を含むブロブを識別して、該ブロブを一時的ブロブ識別子と関連付けることと、前記周辺の線に隣接している次の隣接線から始めて、色特徴の互いの相違が所定量未満である画素を含む次のブロブを逐次的に識別することと、前記次のブロブが前記ブロブ又は前記ブロブにリンクされている先行の次のブロブのいずれかとリンクしている場合、前記次のブロブを前記一時的ブロブ識別子と、前記次のブロブのリンク情報に基づいて関連付けることと、新しい次の隣接線に隣接している次の隣接線の、色特徴の互いの相違が所定量未満である画素を含む次のブロブを逐次的に識別することを引続き行うことと、前記ブロブにリンクされているブロブを有しない線に到達するまで、次の隣接線の次のブロブを前記一時的ブロブ識別子と関連付けることを引続き行うことと、を含むことを特徴とする。
本発明の請求項3に記載の発明は、画像データ処理装置であって、ブロブプロセッサと、前記ブロブプロセッサに接続されるメモリであって、画像データの2つ以上の線ブロブ同士をリンクさせるリンク情報を記憶する、メモリと、を備え、前記ブロブプロセッサが、ある線の線ブロブと、該線ブロブと互いにリンクされている線ブロブであって、連続して隣接する線の線ブロブとを、1つのブロブにグループ化して、該1つのブロブに固有のブロブIDを割り当てることを特徴とする。
本発明の請求項4に記載の発明は、画像データ中の領域を識別する装置であって、周辺の線上の画素を該画素の色及びエッジの特徴にしたがってあるブロブに対して割り当て、次の隣接線上の画素を次のブロブに割り当て、前記次のブロブを前記ブロブに対してリンクさせるリンク情報を、前記次のブロブ及び前記ブロブの色特徴にしたがって提供して、前記次の隣接線に隣接する新しい次の隣接線上の新しい次のブロブを色特徴にしたがって逐次的に識別する手段と、前記新しい次のブロブが前の次の隣接線上の何れのブロブともリンクされていない場合、次の線上の前記新しい次のブロブを新しい一時的ブロブ識別子に対してリンクさせ、前記次のブロブを前のブロブにリンクさせ、前記前のブロブが前記ブロブにリンクされている場合、前記前のブロブを前記一時的ブロブ識別子に対してリンクさせ、前記次の隣接線上の前記次のブロブを、前記ブロブにリンクされているブロブを有しない線に到達するまで、前記一時的ブロブ識別子と関連付ける手段と、を備えることを特徴とする。
本発明のシステム及び方法の様々な例示の実施形態を、図面を参照して詳細に説明する。
走査された及び/又は印刷されたカラー文書を自動的に処理して、オリジナルの文書コンテンツを正確に取込む高圧縮された小容量画像データファイルを生成するシステム及び方法の様々な例示的実施形態を詳細に説明する。文書中を走査して、所与の走査線上にあるデータを分析して、この画像のうち何れの画素同士を、類似した色及びエッジの特徴を有しているという理由でグループ化することが可能であるかを判定することによって、データファイルが生成される。次にこれらの走査線は、リンクフィールド中の情報にしたがってリンクされて、類似の色を持ち、閉曲線境界で画定された二次元の画素領域を生成する。次に、これらの領域すなわち「ブロブ」同士は、空間的にオーバラップする類似の色のエリアを結合することによって、クラスタ化される。次に、これらの結合されたエリア(クラスタ化された領域)は、複数のバイナリ前景層の内の一前景層中に置かれ、圧縮可能であり、例えば、PDFファイルとして出力される。
図1に、背景の連続した色調又はグレースケールの層(背景層)210とN個のバイナリ前景層とに分解された文書の画像データを示す。この例では、6個(N=6)バイナリ前景層220〜270が存在する。この画像データは、6個の識別可能な色値に分離される低空間周波数の色データを含む。この6個の色値はその各々が、この6個の色の内の1色を含む空間領域220’〜270’を含む複数のバイナリ前景層220〜270の内の特定の1つと関連付けられている。領域220’〜270’の内の1つに含まれないデータは背景層210中に残る。各々がバイナリ前景層となるようにクラスタ化される空間領域220’〜270’を生成するシステムと方法を説明する。
入力画素は、前述の複数の前景平面の内の1つに割り当てるか又は背景平面に残すことができるだけである。したがって、この複数のバイナリ前景層220〜270の内のどの中にある画像データ部分も、その他の複数のバイナリ前景層220〜270の内のどの層中の他の画像データ部分ともオーバラップしない。その結果、バイナリ前景層220〜270はその各々を、順序やシーケンスを考慮することなく背景層210と個々に合成することが可能となる。複数のバイナリ前景層220〜270の全てが背景層210と合成されると、再構成された画像280が得られる。
各バイナリ画像平面に割り当てられることになっている領域220’〜270’にクラスタ化されるブロブを識別するシステムと方法を説明する。
図2に、走査された文書画像からN個のバイナリ前景層を生成する例示のシステムを示す。図2は、文書300がスキャナ400によって走査されて、画像データが、例えばRGB色空間中で生成され、また、この画像データがN層画像データ生成システム1000に入力される様子を示している。このN層画像データ生成システム1000によって生成されたN個の層は、次に、圧縮モジュール800によって圧縮されて、例えば、PDFファイルとして出力される。
N層画像データ生成システム1000中の第1のモジュールは、色変換モジュール500である。この色変換モジュール500は、RGBデータを、例えば、YCC色空間に変換できる。公知なように、YCC色空間は、輝度成分(Y)と2つの彩度成分(CC)とを含んでいる。この彩度成分は、双方向でないまでも少なくとも1つの方向で2:1の比率でサブサンプリングされ得て、このため、彩度成分中には、輝度成分中の半分の数のデータポイントが存在する。ラボ(Lab)などの他の色空間も用いることができる。
次に、YCC色空間中の画像がブロブ識別モジュール600に入力され、この画像中に顕れる領域すなわちブロブのリストが生成される。これらのブロブは、色とエッジとの特徴に基づいて識別される。ブロブとは、類似の色値を有する画素を囲む連続した境界を有する領域のことである。ブロブ識別モジュール600は、ブロブIDを画像中の各画素に割り当てて、(もし存在すればであるが)どのブロブに対して画素が属するかを示す。ブロブに属さない画素は背景層に割り当てられる。各画素位置に対するブロブIDのマップとはブロブ識別(ブロブID)画像であり、ブロブ識別モジュール600によって生成される。
ブロブ識別モジュール600はまた、文書画像280中に見受けられる全てのブロブのリストであるブロブのグローバルテーブル(GTB)を生成する。本書に記載するシステムと方法は、ブロブID画像とGTBを生成するためのものである。ブロブID画像とGTBを、ブロブ識別モジュール600を参照して、例を挙げて以下でさらに説明する。
ブロブIDデータとGTBはブロブクラスタ処理モジュール700に入力される。このブロブクラスタ処理モジュール700は、次に、ブロブをブロブのグローバルテーブル中に組織化して、類似の色を持ち、空間的にオーバラップするブロブを互いに関連付けてクラスタとする。ブロブクラスタ処理モジュール700は、クラスタ化された領域をN個の前景平面の内の1つに対して、合成された領域の色値に基づいて割り当てる。
ブロブクラスタ処理モジュール700は、バイナリ前景層と背景層との各々に対してバイナリデータを圧縮モジュール800に出力する。この圧縮モジュール800は、圧縮されるデータの特定のタイプに適当な圧縮ルーチンを用いてこのバイナリ前景層と背景層の各々を別々に圧縮して、前記バイナリ前景層と背景層とに対する圧縮済み画像データを生成する。次に、圧縮モジュール800は、この圧縮されたバイナリ前景層と背景層を、PDFフォーマットなどの適切なフォーマットで下流のプロセスに出力する。
図3に、例示のブロブ識別モジュール600のさらなる詳細を示す。ブロブ識別モジュールは、トップツーボトム型モジュール610とボトムツートップ型モジュール620とを含む。このトップツーボトム型モジュール610は、走査線上の各画素を、多くのコンテクスト画素(前後画素)と共に検査し、また、目的とする画素がどのブロブに属するかを識別する。次に、トップツーボトム型モジュール610は、各走査線に対し走査テーブルを出力し、これには、画像の特定の走査線の何れかに現れ得る、最大で255個のブロブ識別数又は他の都合の良い識別数が含まれる。トップツーボトムモジュール610によって識別されたブロブは1つの走査線内に含まれるので、この状況下ではこのブロブは一次元の「線形の」ブロブである。トップツーボトム型モジュール610はまたブロブID画像を生成するが、これは、画像中の走査済みの各画素に対して、走査テーブルにリストアップされていて、特定の画素が属するブロブの識別番号を割り当てるものである。トップツーボトム型モジュール610の動作と走査テーブルの生成は、本願と同日に出願され、その全体をここに参照して組み込む同時係属米国特許出願(代理人整理番号117521)に詳細に説明されている。
初期ブロブID画像の例を図5に示す。このブロブID画像は、画像中の各画素に対してブロブ識別子を有している。図5に示すブロブID画像は、おおよそ“A”という文字の形状のブロブを有するが、その範囲とアイデンティティは、本発明のシステムと方法を用いて決定される。
図4に、ボトムツートップ型モジュール620のさらなる詳細を示す。ボトムツートップ型モジュール620は、CPU655と、入/出力ポート660と、メモリ665と、走査テーブルトランスレータ670と、ブロブコンテンツ更新器675と、ブロブジェネレータのグローバルテーブル680とを含む。上記コンポーネント655〜680はバス685を介して互いに結合できる。ボトムツートップモジュール620はバスアーキテクチャ図を用いて図示されているが、特定用途向け集積回路(ASIC)を用いたりする他のタイプのハードウエア構成を用いてこれらコンポーネントの内の1つ以上を実施したり、又は、CPU655中で実行されるコンピュータプログラムを記述して、ボトムツートップ型モジュールの全ての機能を実行したりするようにしてもよい。
ボトムツートップ型モジュール620は、初期ブロブID画像と、現行の走査線に対する現行の走査テーブルと、前の走査線に対する前の走査テーブルとを入/出力ポート660を介してトップツーボトム型モジュール610から入力し、そのデータをメモリ665に記憶する。このボトムツートップ型モジュールは、1つの走査線に対するデータと前の走査線前のデータとを同時に受信することができ、又は、画像全体のデータを受信して、そのデータをメモリ665に記憶することができる。
図5のブロブID画像中の各々の線は走査テーブルと関連しているが、このテーブルは、各走査線上で識別されたブロブに関連する情報を記憶している。「例」と印を付けられた線の走査テーブルを図6に示す。図5で「例」と印付けされた線は、互いに関連付けられている多くの画素を有している。この線の走査テーブルは、ブロブID画像中に特定されているように、ブロブ#4に対して1つ、ブロブ#3に対して1つ、ブロブ#2に対して1つ、ブロブ#1に対して1つで、合計4つの走査テーブルエントリを有している。(“0”とラベル付けされているブロブは、背景層と関連している。)このブロブに属する画素は隣接している必要はなく、実際、例の線では隣接していない。初期ブロブID画像中のブロブIDは、現行の走査テーブル中のブロブIDに関連している。
走査テーブルは、最大で255のエントリ又は他の都合の良い数を保持することが可能であり、ここで、各エントリが、255エントリの走査テーブルに対し、2バイトのメモリを使用している。走査テーブルエントリの例を図7に示す。この走査テーブルエントリは、ブロブID画像中で#4として識別されるブロブに対応している。走査テーブルエントリの有する2バイトには、xリンクフィールドとyリンクフィールドが含まれる。xリンクフィールドは各ブロブを、同じブロブに属する、同じ線上の画素とリンクさせる。このxリンク接続は円形のリストとして維持され、そのため、他のどのブロブとも水平方向には接続されていないブロブは自分自身に接続される、すなわち、このリンクは自分自身を指している。yリンクフィールドは、現行の走査線上で識別されたブロブをその下の走査線上で前に識別されたブロブとリンクさせる。したがって、例の線のブロブ#4に対する走査テーブルエントリは、同じ走査線上のブロブ#4の第2の発生を指すxリンクエントリと、ブロブ#4をその下の走査線上のブロブ#3にリンクするyリンクエントリとを有している。
各走査エントリのサイズは2バイトであり、また、各走査テーブルは最大で255の有効なエントリを含む。したがって、各走査線に対する走査テーブルは、256エントリ*2バイト=512バイトのメモリ容量を必要とする。
ボトムツートップ型モジュール620は走査テーブルエントリを取得して、ブロブに別の一時的IDを与えることによって、ブロブを垂直方向にリンクするが、同時に、このモジュールは、ブロブのコンテンツをアセンブルする。走査テーブルと同様に、一時的IDは、最大で255の一時的ブロブIDを含むテーブルに記憶される。一時的ブロブIDテーブルの例を図6に示す。
一時的ブロブIDエントリの例を図9に示す。走査テーブルIDエントリと比較して、一時的IDエントリは、この一時的IDの二次元態様に関連する追加の情報を含んでいる。特に、一時的IDエントリは、4つの追加フィールド、すなわち、一時的ブロブを取り囲む「境界付けボックス」のx範囲とy範囲であるmin_x735、max_x740、min_y745及びmax_y750を含んでいる。この境界付けボックスは、ブロブに割り当てられた画素の全てを完全に包み込む最小の矩形である。追加の画素がボトムツートップモジュールによって付加されるに連れて、境界付けボックスは連続的に更新されて、この追加の画素が付加された後の新しい境界が反映される。
走査テーブルエントリと同様に、一時的ブロブIDはブロブの色値に関する情報を維持できる。この情報は、例えば、色の和である和Y(sum Y)755、和Cb(sum Cb)760及び和Cr(sum Cr)765を含み得る。最終的には、走査テーブルエントリと同様に、一時的ブロブIDエントリは、画素カウント値770と分散データ775とを記憶する。一時的ブロブIDエントリもまた、ブロブID780を識別して、その後でブロブID780を割り当てて、ブロブを追跡する。
一時的ブロブIDエントリは各々が、次の値で初期化される。
(i) max_xとmax_yは−1に設定される(max位置はなし)。
(ii) min_xは画像の幅+1に設定される(minはなし)。
(iii)min_yは画像の高さ+1に設定される(minはなし)。
カウント値、和Y、和Cb及び和Crはすべてゼロに初期化される。ブロブIDはブロブIDスタックから逐次的順序で割り当てられる。
ボトムツートップモジュールは、最初に新しいブロブに遭遇すると、その新しいブロブに一時的IDを割り当てる。この一時的IDは、使用中の一時的IDのリストを保持しているブロブIDスタックテーブルから取得される。このブロブIDスタックテーブルの構造を図8に示す。このブロブIDスタックテーブルは、最大で256の一時的ブロブIDエントリを保持することが可能である。例えば、第1のエントリなどの1つのエントリが、背景平面用に確保される。ブロブIDスタックテーブルの主要な目的は、一時的ブロブIDを再使用することである。1つのブロブは終了次第すぐに下流のプロセスに出力されて、このブロブと関連する一時的IDは使用可能となり、ブロブIDスタックメカニズムを介して新しいブロブに対して再割り当て可能なものとなる。
ボトムツートップ型モジュール620が、ブロブが完了した、すなわち、連続する境界によって包み込まれ、これ以上追加の画素は付加されないものと判定すると、ボトムツートップ型モジュールは、一時的ブロブIDのコンテンツをブロブのグローバルテーブル(GTB)に出力する。ボトムツートップ型モジュール620はまた、ブロブID画像を増加するように更新して、ローカル走査テーブル中で用いられた識別子ではなく新しいブロブ識別子を参照する。次に、この更新されたブロブID画像とGTBは出力されて、ブロブクラスタ処理モジュール700によってさらに処理される。
ボトムツートップ型モジュール620は、走査テーブルとブロブID入力とに対して実質的に次の4つのステップを実行する。
1)走査テーブルエントリを変換テーブル中の一時的ブロブIDに、下の線にある前の変換テーブルを用いて変換する。
2)1つ以上のエントリが、円状に自分自身を指してはいないターミナルxリンク値を含んでいることが発見されたら、変換テーブルコンテンツ上の第2のパスを実行する。
3)ブロブID画像を一時的ブロブテーブルコンテンツに更新して、これらの一時的ブロブエントリと関連する現行の走査線上の追加の画素を反映する。
4)いずれかの閉じた一時的ブロブIDをGTBにエクスポートして、閉じたブロブに割り当てられていたリソースを開放し(使用可能とし)、必要に応じて新しい一時的ブロブに対して割り当て可能なものとする。
ボトムツートップ型モジュール620内のデータの流れを図10に示す。図10に示すように、現行の線に対する走査テーブルエントリが走査テーブルトランスレータ670に入力される。この走査テーブルトランスレータ670は走査テーブルエントリを一時的ブロブIDに、下の線の前の変換テーブルを用いて変換する。ブロブID画像と画質向上色画像ENHとがブロブコンテンツ更新器675に入力され、ここで、現行の線上の全ての走査テーブルエントリに対する一時的ブロブテーブル情報とブロブBID画像とが更新される。次に、GTBジェネレータ680が、いずれかのブロブを閉じることが可能であるかどうか判定し、もしあると判定されれば、ブロブ情報をGTBに出力することによってそのブロブを閉じる。この閉じられたブロブの情報は現行のGTBに添付され、また、現行の一時的ブロブIDは次の利用可能なGTBエントリと逐次的順序で置き換えられる。これらのステップの各々を以下に詳細に説明する。
現行の走査テーブルをトップツーボトム型モジュール610から受信して、下の線の前の変換テーブルを留保すると、ボトムツートップ型モジュール620は、現行の走査テーブル中の各エントリを1〜255まで評価して、それが有効な(ゼロでない)xリンクフィールドを有しているかどうかチェックする。
この時点でボトムツートップ型モジュール620は、下の線の前の走査テーブルをすでに処理済みであるが、これはモジュールが上方に進行するからである。したがって、前の走査テーブルエントリはすでに一時的ブロブIDに変換済みであり、この同じIDが、垂直方向にリンクされていれば、現行の線に引継がれる。一番初めの走査線(画像の底部の線)には、リンク可能な前の走査線は存在しないため、この第1の走査線に対する全てのyリンク値はゼロであり、また、第1の走査線上の有効なブロブエントリ各々に対して一時的な初期ブロブIDが与えられる。このプロセスによって、底部から上方に一度に一線ずつ処理が進むにつれて、垂直方向のyリンク接続が「解かれて」、1つの線から次の線に対し一致した固有の一時的ブロブIDが再割り当てされる。
ボトムツートップ型モジュール620は、変換テーブルによる一時的ブロブIDの割り当て状況を維持する。ボトムツートップ型モジュール620は2つの変換テーブルを用いるが、一方は現行の線のための変換テーブルであり、他方は下の線からの前の変換テーブルを維持するための変換テーブルある。図14に、この2つの変換テーブルの構造を示す。この2つの変換テーブルは線毎に交代する。現行の線の最後のところで、現行の変換テーブルは次の線に対する前の変換テーブルとなり、その下の線上にある変換テーブルは、もはや不必要であるので、次の線の変換テーブルのデータで上書きして破壊する。
図14は、下の線に対する走査テーブル中の有効なブロブエントリ27の1例を示しているが、このエントリは、現行の線の走査テーブル中の有効なブロブエントリ21に垂直方向にリンクされている。その下の線がボトムツートップ型モジュール620によって処理されるに連れて、走査テーブルエントリ27は変換されて、例えば、一時的ID33に割り当てられた。現行の線のエントリ21はその下の線の27に垂直方向にリンクされているため、一時的ID33はコピーされて、現行の線の変換テーブル中のエントリ21に割り当てられる。これは、この2つの見かけ上は関連していない走査テーブルエントリが同じ一時的ブロブに属しており、したがって、同じ一時的ブロブID33を割り当てられていることを示している。
yリンクフィールドを介して以前の走査線上のブロブに関連する後続の走査線はすべて、この以前の走査線上のブロブからの一時的ブロブIDを共有している。したがって、ボトムツートップ型モジュールの作用は、識別されたブロブ同士間の垂直方向の関連付けを確立して、本質的に一次元のブロブを走査テーブルからブロブの一時的テーブルにリストアップされている2次元ブロブに変換することである。
走査テーブル中の現行のブロブエントリは、xリンクフィールドがゼロでなければ有効であると考えられる。ゼロであれば、すなわち、xリンク=0であれば、現行のブロブが背景平面にリンクされている(id=0)ことを示す。
有効なブロブエントリ毎に、yリンクフィールドを検査する。yリンクがゼロでなければ、現行のブロブは、その下の線の別のブロブに垂直方向にリンクされている。yリンクを辿ってその下の線の前の変換テーブルに至り、一時的ブロブIDコンテンツを取出して、現行の線の変換テーブルブロブエントリにコピーする。
しかしながら、その一方で、現行のブロブが前のどのブロブに対しても垂直方向のリンクを持たない(すなわち、yリンク=0)場合、それは最初に遭遇する新しいブロブである。最初に、現行の走査テーブルエントリが現行の線上の他のいずれかの走査テーブルエントリに水平方向にリンクされているかどうかチェックする。他のどのブロブにも水平方向にリンクされていない有効なブロブは、円状のxリンクリストによって含意されているように自分自身のブロブエントリを振り返って指すxリンク値を有している。現行のブロブが他のブロブに水平方向にリンクされていると判定された場合、それに対応するブロブエントリは変換テーブル中でゼロに設定され、「ターミナルXを有する」フラグがオンされて、この状況が発生したことを示す。その後のステップで、ボトムツートップ型モジュール620は、このような水平方向リンクされた変換テーブルブロブエントリをさらに検査して、それらに対して新しい一時的ブロブIDを割り当てるべきかどうか判定する。
現行のブロブが有効で、ゼロyリンクを有し、また、円状に自分自身を振り返って指すXリンク値を有する場合、それは、新たな有効なブロブに最初に遭遇したものと考えられる。次の利用可能な一時的IDがそれに対してIDスタックから割り当てられて、現行の変換テーブルに挿入されて、現行の走査テーブルエントリがこれで、この新しい一時的IDと関連付けられたことを示す。同時に、IDスタックカウンタが1つだけ減少され、これで、次の利用可能な自由な一時的IDを指すことになる。現行の一時的IDは、以下に説明するように、GTBジェネレータ680によって使用可能とされるまで、使用中のままとされる。ボトムツートップ型モジュール620は、一時的ブロブIDを維持し、また、走査テーブルエントリを一時的ブロブに割り当て続けるに連れて一時的ブロブ情報を更新する。
最終的には、現行のブロブxリンクフィールドがゼロであれば、背景平面にリンクされているものと考えられる。対応する変換テーブルエントリはゼロに設定される。
走査テーブル変換プロセスが第1のパスを走査テーブルエントリを介して完了して初期変換テーブルを作成した後は、「ターミナルXを有する」フラグがオンされて、少なくとも1つのブロブが現行の線上の別のブロブに水平方向にリンクされているものと判定されたことが示されれば、第2のパスが実行される。この第2のパスにおいて、変換テーブル中にあって、前はゼロに設定されていたブロブエントリだけが検査される。現行の変換テーブル中のこのようなブロブエントリの各々に対して、xリンクとyリンクの値が再度現行の走査テーブルから探索される。yリンク=0であり、xリンクがゼロでなければ、上述したようにIDスタックから新しい一時的IDが得られ、また、これが変換テーブル中の現行のエントリに割り当てられる。加えて、xリンクフィールドを辿って次に水平方向にリンクされているブロブエントリ(もしあれば)に至り、このブロブに対応する変換テーブルエントリもまた、同じ新しい一時的ID番号を割り当てられる。このプロセスはすべての水平方向リンクされたブロブにわたって繰り返され、ついには、一番初めの開始ブロブIDを振り返って指す次のxリンク値にまで到達する。このプロセスによって、水平方向にリンクされたブロブの鎖全体に同じ新しい一時的ID番号が一貫して割り当てられることが保証される。
走査テーブルトランスレータ670が線1つ当たり最大で2つのパスでそのタスクを完了すると、現行の走査テーブル中の全ての有効なブロブは、変換テーブルエントリに有効な一時的ブロブID番号を有する。これらの値は一時的ブロブID番号を呼ばれるが、それは、このような値は、ブロブが、GTBジェネレータ680によって閉じられて、GTBにエクスポートされるまでしか用いられないからである。
図5に示す例に戻ると、この図に示す例示の線に対して、第4の走査テーブルエントリが図7に示されている。xリンクフィールドは有効(4.xlink>0)であり、その下の線上のブロブ3に対して垂直方向に接続されている。yリンクフィールドを下方に辿ってその下の線上の走査テーブルに至ると、3.ylink=1、すなわち、ブロブの第1の線(底部)上の一時的ブロブID#1が走査テーブルブロブID#3に垂直方向に接続されていることが分かる。1という新しいyリンク値は走査テーブル中の現行のブロブID#4の現行の変換テーブルエントリにコピーされ、そのため、これで、4.ylink=1(一時的ID)となる。この例での2つの走査テーブルブロブは垂直方向にリンクされるため、その下の線の変換テーブルからの一時的ブロブIDの割り当ては、現行の変換テーブルエントリ中にコピーされる。このプロセスを上方に拡張することによって、(最も底部の走査テーブルブロブに割り当てられた)ブロブを形成するこの画素グループと関連する第1の一時的ブロブIDは、上方に伝播して、垂直方向に接続されたブロブの全てに対して同一なものとなる。
図11に、図5に示す例の場合の変換テーブルの前値と後値を示す。前値と後値を比較すれば分かるように、下の線の変換テーブル中に示されている下の線にあるのリンクと関連している一時的ブロブID(#1)が現行の変換テーブルエントリとして挿入されるという効果がある。このプロセスは、上の線にある垂直方向に接続されている全てのブロブに対して繰り返され、これで、同じ一時的IDをそれらの対応する変換テーブル中のそれらの全てに対して割り当てる。
したがって、ボトムツートップ型モジュール620のタスクは、変換テーブルエントリを用いて垂直方向又は水平方向のどちらかで一次元ブロブをリンクすることによって、トップツーボトム型モジュール610によって生成された本質的に一次元の走査テーブル情報から二次元ブロブを作成することである。この二次元ブロブはその各々が、ボトムツートップ型モジュール620によってアセンブルされる二次元ブロブの一時的リストである一時的ブロブIDによって識別される。まだ垂直方向にはリンクされていない走査線で新しいブロブに遭遇するたびに、この新しいブロブには新しい一時的ブロブIDが与えられる。新しいブロブが現行の線の他のブロブに水平方向にリンクされていれば、同じ新しい一時的ブロブIDが、この水平方向にリンクされているブロブ全てに対して一貫して割り当てられる。このIDは後続の走査線によって参照されるため、新しい画素は同じ一時的ブロブIDと関連付けられる。
ブロブコンテンツ更新器675のプロセスは、走査テーブルトランスレータ670が現行の線の処理を終了した後で開始される。ブロブコンテンツ更新器675は、各一時的ブロブIDに対して複数のフィールドを持つブロブ構造を維持する。各線の最後のところで、ブロブ更新器675は、各々のアクティブな一時的ブロブIDに対してブロブ構造を更新して、開いている各IDと関連している現行の線からの新しい画素の情報を含むようにしている。現行の走査テーブル中の各々の有効なブロブエントリに対して、ブロブコンテンツ更新器675は変換テーブルをルックアップして、対応する一時的ブロブ番号を判定する。次に、ブロブコンテンツ更新器675は、ブロブテーブル中の特定の一時的ブロブIDエントリと関連しているさまざまなフィールドを更新する。
次に、ブロブコンテンツ更新器675は、BID画像を左から右に(ラスター順序で)、現行の走査線に対して一度に1画素ずつ走査する。各画素に対して、初期BID値は、現行の画素と関連するローカル走査テーブルブロブIDを示す。この走査テーブルIDエントリを(現行の走査線の場合は)現行の走査テーブル中でルックアップして、また、現行の変換テーブルエントリをルックアップすることによって、この走査テーブルIDエントリを辿って対応する一時的ブロブIDに至る。
この一時的ブロブIDに対応するブロブ構造エントリを更新して、現行の線のこの一時的ブロブIDと関連するあらゆる新しい画素を含むようにする。具体的には、一時的ブロブテーブルエントリ中のフィールドは次のように更新される。
(i) min_yは、(線番号<min_yであれば)現行の線に設定される。
(ii) max_yは、(線番号>max_yであれば)現行の線に設定される。
(iii)min_xは、(画素<min_xであれば)現行の画素に設定される。
(iv) max_xは、(画素>max_xであれば)現行の画素に設定される。
(v) ローカル走査テーブルブロブ中の画素の数がカウント値に加算される。
(vi) ローカル走査テーブルブロブ中の分散がvarに加算される。
(vii)ローカル走査テーブルブロブ中の色和が和Y、和Cb、和Crにそれぞれ加算される。
これによって、このローカル走査テーブルブロブと関連する画素のコンテンツが、対応する一時的ブロブフィールドに効果的に加算され、また、現行の画素位置に対する一時的ブロブ境界付けボックスが更新される。
一時的ブロブテーブル中の各々の有効な(非背景の)ブロブエントリのYCC和フィールド(和Y、和Cb、和Cr)がオーバフローするのを防止するため、これらのフィールドは、これらのどれか1つでも値が大きくなりすぎると再正規化される。これは、YCC和フィールドを2で除算し、また、画素のカウント値を2で除算して、同じ比率を維持することなどによって遂行することが可能である。
最終的には、ブロブコンテンツ更新器675は、現行の画素のブロブIDを更新して、オリジナルのローカル走査テーブルブロブの代わりに(更新されたばかりの)一時的ブロブを指すようにする。このプロセスにより、BID画像を更新して、オリジナルの走査テーブルブロブセグメントの代わりに一時的ブロブID番号を参照するようになる。図12は図4からのブロブID画像であり、ここで、文字「A」の一部を構成する各走査線に関する一時的ブロブID情報にしたがって、文字「A」を形成するブロブ中の全画素に対するブロブIDが、一時的ブロブIDテーブルからの一時的ブロブID#1で置き換えられる。min_x、max_x、min_y及びmax_yは、図12に示すようにブロブ#1を囲む境界付けボックスの座標である。ここでブロブ#1を閉じることが可能であり、それは、次の上の線にはブロブ#1と関連する画素がこれ以上含まれないからである。
一時的ブロブを「閉じる」ことが可能と判定されるまでは、すなわち、現行の走査線には一時的ブロブと関連する画素はもはや無いと判定されるまでは、一時的ブロブIDは有効とされる。一時的ブロブIDは、(1)ブロブが現行の走査線に届かない(min_y>現行の線)場合と、(2)ブロブが非ゼロカウント値(画素の合計数)を有する場合に、閉じることが可能である。加えて、現行の線が最後の走査線(line=0)である場合、それ以上処理すべき線は無いので、ブロブは閉じられる。ボトムツートップ型モジュール620はページの下から上に向かって作動するため、最後の走査線は画像の最初の線である。
上記の条件を満足するブロブの各々に対して、YCC和をカウント値などで除算することによって、GTBジェネレータ680は一時的ブロブ情報を正規化し得る。ブロブエントリが最終的なGTBにエクスポートされるに連れて、ブロブ情報コンテンツがGTBに添付され、また、一時的ブロブIDが、GTBからの次の利用可能なIDで置き換えられる(最終的なブロブID割り当て)。その後、一時的ブロブエントリと関連情報とが一時的ブロブテーブルから除かれる。このエクスポートプロセスには、次のステップが含まれ得る。
1)3つの一時的ブロブ色和(和Y/Cb/Cr)をブロブ画素カウント値で除算して、その結果を四捨五入して(繰り上げて)整数値にする。この演算によってブロブ色の平均が得られる。時間のかかる演算を回避するため、この除算は、ルックアップテーブルの乗算と右方向桁送り演算を用いて実施され得る。
2)GTB中に更にブロブが入る余地があるかを確かめる。スペースがない場合、2倍の数のブロブを保持可能な新しいGTBを割り当てて、古いテーブルコンテンツを新しいテーブルにコピーして、次に、古いテーブルを削除する。この時点以降はこの新しいGTBを用いる。GTBのサイズがページのコンテンツに基づいて可変であるため、且つ、ブロブの数が前もって分からないため、このステップは必要であり得る。ステップ2によってGTBが作成されると、GTBサイズが(この例では2の累乗で)動的に増大可能である。
3)GTBカウント値を1だけインクリメントすることによって、新しいブロブをGTBに加える。
4)一時的ブロブエントリの全フィールドのコンテンツを、一時的ブロブテーブルから、最新のエントリで、GTBへコピーする。
閉じたブロブがGTBにエクスポートされると、GTB中の新しい連続ブロブID番号が割り当てられる。最大で256のエントリに制限されている一時的ブロブテーブルとは異なって、GTB中のブロブ番号は無制限であり、複雑なページの場合では数千のブロブを包含できる。
現行の一時的ブロブのコンテンツがGTBに入力された後、一時的ブロブは、一時的ブロブテーブルから除去され得る。この除去プロセスは、さまざまなブロブフィールドをデフォルト(初期)値にリセットすることを含み得る。初期化の後は、現行の一時的ブロブIDは一時的ブロブIDスタックへと戻される。これによって、一時的ブロブIDが最後のスタックエントリとして追加され、スタックカウンタは1だけインクリメントされる。その結果ブロブIDが再使用可能となる。新しいブロブが見つかる以前に、更にブロブIDが使用可能とされない場合、ブロブIDが、新しく見つけられたブロブに対して即座に再割り当てされる。
このようにして、関連する一時的ブロブエントリのコンテンツをコピーすることによって、閉じた一時的ブロブがGTBに転送される。GTBは、ブロブ識別モジュール600によって決定されたブロブの最終的なリストを、GTB中の各ブロブに対する関連ブロブ情報と共に記憶する。
次いで、GTB及びブロブID画像BIDはブロブクラスタ処理モジュール700に使用されて、GTB中のブロブが色類似性と空間的オーバラップとに従ってクラスタ化される。次にこれらクラスタはバイナリ前景面に割り当てられ、圧縮モジュール800に出力され、ラッピングされてPDFとなりさらに操作される。
上述ではハードウエア実施例を参照して説明したが、ブロブクラスタ化プロセスは、マイクロプロセッサ上で実行されるソフトウエアとしても実施可能である。この場合本方法の各ステップは、適切にプログラミングされたマイクロプロセッサ又はハードウエア及びソフトウエアの組み合わせによって実行される。
図13は、線走査デバイス中で識別されたブロブ同士をリンクさせる例示の方法を概括するフローチャートである。本方法はステップS100から開始し、最初の又は次の走査線が選択される。ステップS200に進み、走査テーブルが変換される。次にステップS300に進み、「ターミナルXを有する」フラグが1に設定されているかどうか判定される。1に設定されていれば、ステップS400に進み、水平方向にリンクされている全てのブロブに新しいIDが割り当てられる。1に設定されていなければ、ステップS500に進み、Xリンクがゼロより大きいかどうか判定する。ゼロより大きければ、ステップS600に進む。ステップS600では、走査テーブルのyリンクフィールドを読み出して、前の線まで辿る。ステップS700に進み、底部の線との間にある線のyリンクを辿って底部の線まで至り、ここから一時的ブロブIDを読み出す。ステップS800に進み、走査テーブルブロブIDの代わりに、一時的ブロブIDで、ブロブID画像を置き換える。ステップS900に進み、一時的ブロブIDエントリを更新して、現行の走査線からブロブに付加された追加の画素を反映するようにする。ステップ1000で、一時的ブロブテーブルを評価して、いずれかのブロブを閉じることが可能であるかどうかチェックする。可能であれば、ステップS1100で、一時的ブロブIDエントリは、色和を画素カウント値で除算することによって正規化される。続いて、ステップS1200で、一時的ブロブエントリがGTBにコピーされる。ステップS1300で、一時的ブロブIDは初期化されて、一時的ブロブIDテーブルに戻されて、さらに使用される。続いて、ステップS1400で、現在の走査線が最後の走査線であるかどうか判定する。最後の走査線でなければ、ステップS100に戻る。最後の走査線であれば、処理を終了する。
図15は、図13のステップS200のさらなる詳細を概括するフローチャートである。処理はステップS210から始まり、「ターミナルXを有する」フラグがゼロに設定される。次にステップS215に進み、走査テーブル中の次のブロブエントリが選択される。ステップS220で、xリンクがゼロに等しいかどうか判定される。xリンクがゼロであれば、ステップS240に進み、現在の変換テーブルがゼロに設定される。xリンクがゼロでなければ、ステップS225で、yリンクがゼロに等しいかどうか判定される。yリンクがゼロでなければ、その下の線の変換テーブルからの現行のエントリがyリンクフィールド中にコピーされる。ステップS225でyリンクがゼロに等しければ、ステップS230でxリンクが現行のブロブエントリに等しいかどうか判定される。xリンクが現行のブロブエントリでなければ、ステップS250に進み、現行の変換テーブルがゼロに設定されて、「ターミナルXを有する」フラグが1に設定される。ステップS230でxリンクが現行のブロブテーブルエントリに等しければ、ステップS235で新しいIDが割り当てられる。ステップS255に進み、このエントリが走査テーブル中の最後のブロブエントリであるかどうか判定される。最後のブロブエントリでなければ、ステップS215に戻る。最後のブロブエントリであれば、ステップS260で処理が終了する。
図16は、図13のステップS100のさらなる詳細を概括するフローチャートである。処理はステップS110から始まり、次の走査テーブルエントリが選択される。ステップS115に進み、xリンクとyリンクが走査テーブル中でルックアップされる。ステップS120で、xリンクがゼロに等しいかどうか判定される。等しくなければ、ステップS125に進み、yリンクがゼロに等しいかどうか判定される。等しければ、ステップS130に進み、変換テーブルエントリがゼロに等しいかどうか判定される。等しければ、新しいIDがIDスタックから割り当てられる。次に、ステップS140に進み、xリンクを辿って次のブロブエントリに至る。ステップS145で、上記と同じ新しいIDがこのブロブエントリに割り当てられる。ステップS150で、最後のxリンクが評価されたかどうか判定される。最後のxリンクが評価されたのでなければ、ステップS140にジャンプし、xリンクを辿って次のブロブエントリに至る。最後のxリンクが評価されたのであれば、ステップS155に進み、最後の走査テーブルエントリが評価されたかどうか判定する。最後の走査テーブルエントリが評価されたのでなければ、ステップS110にジャンプし、次の走査テーブルエントリが選択される。最後の走査テーブルエントリが評価されていれば、ステップS160で処理は終了する。
本発明をさまざまな例示の実施形態に関連して説明したが、これらの実施形態は制限的なものとみなすべきではなく、説明するためのものとみなすべきである。さまざまな修正例、代替例等が、本発明の精神と範囲内で可能である。
複数のバイナリ前景画像面と背景画像面とに分解された例示の文書画像を示す図である。 ブロブ識別モジュールが動作可能な1つの例示のシステムを示す図である。 ブロブ識別モジュールの例示の実施形態をごく詳細に示す図である。 ボトムツートップ型モジュールの例示の実施形態をごく詳細に示す図である。 例示のブロブID画像を示す図であり、表示された領域が走査テーブルに関連している。 例示の走査テーブル構造を示す画像である。 例示の走査テーブルエントリを示す図である。 例示の一時的ブロブテーブルIDスタック割り当て構造を示す図である。 例示の一時的ブロブテーブルエントリを示す図である。 図5に示すボトムツートップモジュールの例示のデータの流れ図である。 走査テーブルエントリが垂直方向にリンクされる方法を示す図である。 例示のブロブID画像を示す図であり、表示された領域が一時的ブロブIDに関連している。 ブロブのグローバルテーブルとブロブID画像とを生成する1つの例示の方法を概括するフローチャートである。 2つの変換テーブルの構造を示す図である。 図13の走査テーブルを変換するステップのさらなる詳細を概括するフローチャートである。 図13の次の走査テーブルを選択するステップのさらなる詳細を概括するフローチャートである。

Claims (4)

  1. a)色特徴の互いの相違が所定量未満である画像データから成る第1の線上の画素を含むブロブを識別することと、
    b)前記ブロブを一時的ブロブ識別子と関連付けることと、
    c)色特徴の互いの相違が所定量未満である前記画像データの隣の線上の画素を含む追加のブロブを識別することと、
    d)前記追加のブロブが前記ブロブにリンクされると、前記追加のブロブを前記一時的ブロブ識別子と関連付けることと、
    を含む、画像データ中の画素の領域を識別する方法。
  2. 色特徴の互いの相違が所定量未満である画像データから成る周辺の線上の画素を含むブロブを識別して、該ブロブを一時的ブロブ識別子と関連付けることと、
    前記周辺の線に隣接している次の隣接線から始めて、色特徴の互いの相違が所定量未満である画素を含む次のブロブを逐次的に識別することと、
    前記次のブロブが前記ブロブ又は前記ブロブにリンクされている先行の次のブロブのいずれかとリンクしている場合、前記次のブロブを前記一時的ブロブ識別子と、前記次のブロブのリンク情報に基づいて関連付けることと、
    新しい次の隣接線に隣接している次の隣接線の、色特徴の互いの相違が所定量未満である画素を含む次のブロブを逐次的に識別することを引続き行うことと、
    前記ブロブにリンクされているブロブを有しない線に到達するまで、次の隣接線の次のブロブを前記一時的ブロブ識別子と関連付けることを引続き行うことと、
    を含む、画像データ中の画素の領域を識別する方法。
  3. ブロブプロセッサと、
    前記ブロブプロセッサに接続されるメモリであって、画像データの2つ以上の線ブロブ同士をリンクさせるリンク情報を記憶する、メモリと、
    を備え、前記ブロブプロセッサが、ある線の線ブロブと、該線ブロブと互いにリンクされている線ブロブであって、連続して隣接する線の線ブロブとを、1つのブロブにグループ化して、該1つのブロブに固有のブロブIDを割り当てる、画像データ処理装置。
  4. 周辺の線上の画素を該画素の色及びエッジの特徴にしたがってあるブロブに対して割り当て、次の隣接線上の画素を次のブロブに割り当て、前記次のブロブを前記ブロブに対してリンクさせるリンク情報を、前記次のブロブ及び前記ブロブの色特徴にしたがって提供して、前記次の隣接線に隣接する新しい次の隣接線上の新しい次のブロブを色特徴にしたがって逐次的に識別する手段と、
    前記新しい次のブロブが前の次の隣接線上の何れのブロブともリンクされていない場合、次の線上の前記新しい次のブロブを新しい一時的ブロブ識別子に対してリンクさせ、前記次のブロブを前のブロブにリンクさせ、前記前のブロブが前記ブロブにリンクされている場合、前記前のブロブを前記一時的ブロブ識別子に対してリンクさせ、前記次の隣接線上の前記次のブロブを、前記ブロブにリンクされているブロブを有しない線に到達するまで、前記一時的ブロブ識別子と関連付ける手段と、
    を備える、画像データ中の領域を識別する装置。
JP2005035185A 2004-02-12 2005-02-10 類似の特徴を有する画像データの領域を互いに接続するシステム及び方法 Pending JP2005228331A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/776,608 US7386166B2 (en) 2004-02-12 2004-02-12 Systems and methods for connecting regions image data having similar characteristics

Publications (1)

Publication Number Publication Date
JP2005228331A true JP2005228331A (ja) 2005-08-25

Family

ID=34701362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005035185A Pending JP2005228331A (ja) 2004-02-12 2005-02-10 類似の特徴を有する画像データの領域を互いに接続するシステム及び方法

Country Status (6)

Country Link
US (1) US7386166B2 (ja)
EP (1) EP1564683B1 (ja)
JP (1) JP2005228331A (ja)
CN (1) CN100469099C (ja)
DE (1) DE602005005230T2 (ja)
TW (1) TWI364212B (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228341A (ja) * 2004-02-12 2005-08-25 Xerox Corp 画像データを領域へ編成するシステムおよび方法
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
US8483499B2 (en) 2007-10-11 2013-07-09 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP2014107683A (ja) * 2012-11-27 2014-06-09 Kyocera Document Solutions Inc 画像処理装置

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7907309B2 (en) * 2006-10-22 2011-03-15 Hewlett-Packard Development Company, L.P. Image scanning without directly detecting all color channel color space values for each image line
US8707167B2 (en) * 2006-11-15 2014-04-22 Ebay Inc. High precision data extraction
US9514103B2 (en) * 2010-02-05 2016-12-06 Palo Alto Research Center Incorporated Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8113046B2 (en) 2010-03-22 2012-02-14 Honeywell International Inc. Sensor assembly with hydrophobic filter
US8656772B2 (en) 2010-03-22 2014-02-25 Honeywell International Inc. Flow sensor with pressure output signal
US8397586B2 (en) * 2010-03-22 2013-03-19 Honeywell International Inc. Flow sensor assembly with porous insert
US8756990B2 (en) 2010-04-09 2014-06-24 Honeywell International Inc. Molded flow restrictor
US9003877B2 (en) 2010-06-15 2015-04-14 Honeywell International Inc. Flow sensor assembly
US8418549B2 (en) 2011-01-31 2013-04-16 Honeywell International Inc. Flow sensor assembly with integral bypass channel
US8695417B2 (en) 2011-01-31 2014-04-15 Honeywell International Inc. Flow sensor with enhanced flow range capability
JP5970970B2 (ja) * 2012-06-13 2016-08-17 富士通株式会社 画像処理装置、方法及びプログラム
JP5968098B2 (ja) * 2012-06-14 2016-08-10 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US9460497B2 (en) * 2012-09-21 2016-10-04 Htc Corporation Image enhancement methods and systems using the same
JP5945487B2 (ja) * 2012-09-27 2016-07-05 株式会社沖データ 画像処理装置、プログラム及び方法
US9052217B2 (en) 2012-11-09 2015-06-09 Honeywell International Inc. Variable scale sensor
US9292763B2 (en) 2013-07-25 2016-03-22 Analog Devices Global System, method, and medium for image object and contour feature extraction
US20150269207A1 (en) * 2014-03-18 2015-09-24 Cong Deng Simple and efficient method for recycling device identifiers
US9952079B2 (en) 2015-07-15 2018-04-24 Honeywell International Inc. Flow sensor
CN105891140A (zh) * 2016-04-29 2016-08-24 山东玲珑轮胎股份有限公司 一种橡胶中卤化丁基胶与天然胶并用比的测定方法
CN106327499B (zh) * 2016-08-30 2017-09-26 南京鑫和汇通电子科技有限公司 基于边缘点自相似性的油污图像的识别及teds系统
CN108900843B (zh) * 2018-07-31 2021-08-13 高创(苏州)电子有限公司 单色图像压缩方法、装置、介质及电子设备
CN109191473B (zh) * 2018-08-31 2020-10-02 安徽三联学院 一种基于对称分析的车辆粘连分割方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4718090A (en) * 1986-04-14 1988-01-05 Cooper Jr James E Method and apparatus for high-speed processing of video images
JP2001184488A (ja) * 1999-12-27 2001-07-06 Matsushita Electric Ind Co Ltd 人物追跡装置、人物追跡方法及びそのプログラムを記録した記録媒体
WO2002056255A2 (en) * 2000-11-09 2002-07-18 Hewlett Packard Co Methods and apparatus for analyzing an image

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4849914A (en) 1987-09-22 1989-07-18 Opti-Copy, Inc. Method and apparatus for registering color separation film
CA1259082A (en) * 1988-12-02 1989-09-05 David S. Fenton System for replacing feedroll inserts
EP0385009A1 (en) * 1989-03-03 1990-09-05 Hewlett-Packard Limited Apparatus and method for use in image processing
US4972890A (en) * 1989-10-25 1990-11-27 Isley Reggald E Log feed roller mechanism
EP0557959B1 (en) * 1992-02-25 1998-04-22 Sony Corporation Modulation/demodulation apparatus and information processing apparatus
JPH06121588A (ja) * 1992-10-07 1994-04-28 Fanuc Ltd 可変リラクタンス型モータの駆動方式
US5515452A (en) 1992-12-31 1996-05-07 Electroglas, Inc. Optical character recognition illumination method and system
US5583659A (en) 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
US5745596A (en) 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US5900953A (en) 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
US6058214A (en) 1998-01-20 2000-05-02 At&T Corp. Compression of partially masked still images
US6324305B1 (en) 1998-12-22 2001-11-27 Xerox Corporation Method and apparatus for segmenting a composite image into mixed raster content planes
US6400844B1 (en) 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6633670B1 (en) 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US7006244B2 (en) * 2000-12-06 2006-02-28 Xerox Corporation Image rendering method and system using negative signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4718090A (en) * 1986-04-14 1988-01-05 Cooper Jr James E Method and apparatus for high-speed processing of video images
JP2001184488A (ja) * 1999-12-27 2001-07-06 Matsushita Electric Ind Co Ltd 人物追跡装置、人物追跡方法及びそのプログラムを記録した記録媒体
WO2002056255A2 (en) * 2000-11-09 2002-07-18 Hewlett Packard Co Methods and apparatus for analyzing an image

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228341A (ja) * 2004-02-12 2005-08-25 Xerox Corp 画像データを領域へ編成するシステムおよび方法
JP4587832B2 (ja) * 2004-02-12 2010-11-24 ゼロックス コーポレイション 画像データ内で識別された領域を編成する方法及び装置
US8483499B2 (en) 2007-10-11 2013-07-09 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, computer-readable medium and computer data signal
US8213748B2 (en) 2008-02-26 2012-07-03 Fuji Xerox Co., Ltd. Generating an electronic document with reference to allocated font corresponding to character identifier from an image
JP2014107683A (ja) * 2012-11-27 2014-06-09 Kyocera Document Solutions Inc 画像処理装置
US9165205B2 (en) 2012-11-27 2015-10-20 Kyocera Document Solutions Inc. Image processing device generating character image and background image on the basis of connected pixel group

Also Published As

Publication number Publication date
DE602005005230D1 (de) 2008-04-24
TW200536375A (en) 2005-11-01
US20050180649A1 (en) 2005-08-18
TWI364212B (en) 2012-05-11
US7386166B2 (en) 2008-06-10
CN100469099C (zh) 2009-03-11
EP1564683A1 (en) 2005-08-17
DE602005005230T2 (de) 2009-03-12
EP1564683B1 (en) 2008-03-12
CN1655582A (zh) 2005-08-17

Similar Documents

Publication Publication Date Title
JP2005228331A (ja) 類似の特徴を有する画像データの領域を互いに接続するシステム及び方法
US7343046B2 (en) Systems and methods for organizing image data into regions
TWI406180B (zh) 用於產生具有多重前景平面之高度壓縮影像資料檔案的系統及方法
US7379587B2 (en) Systems and methods for identifying regions within an image having similar continuity values
JP4817821B2 (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP3810288B2 (ja) 分解画像のレイヤを生成する方法
US8218908B2 (en) Mixed content image compression with two edge data representations
US6633670B1 (en) Mask generation for multi-layer image decomposition
TWI230516B (en) Segmented layered image system
JPH05303632A (ja) スポットカラーイメージの類似カラー領域同定のための方法と装置
JP2000196895A (ja) デジタル画像デ―タ区分方法
US10332262B2 (en) Removal of background information from digital images
JP5939154B2 (ja) 画像処理装置およびコンピュータプログラム
US11412217B2 (en) Compression of a collection of images using pattern separation and re-organization
US7065254B2 (en) Multilayered image file
JP4355394B2 (ja) 画像処理方法、画像処理装置、およびプログラム記憶媒体
JP2008153948A (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110125