JP2000175051A - デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法 - Google Patents

デジタル画像デ―タの区分方法並びにデ―タブロックの区分方法及び分類方法

Info

Publication number
JP2000175051A
JP2000175051A JP11342678A JP34267899A JP2000175051A JP 2000175051 A JP2000175051 A JP 2000175051A JP 11342678 A JP11342678 A JP 11342678A JP 34267899 A JP34267899 A JP 34267899A JP 2000175051 A JP2000175051 A JP 2000175051A
Authority
JP
Japan
Prior art keywords
block
light intensity
image data
digital image
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11342678A
Other languages
English (en)
Other versions
JP4295882B2 (ja
Inventor
Zhigang Fan
ファン ジガン
Ming Xu
シュイ ミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2000175051A publication Critical patent/JP2000175051A/ja
Application granted granted Critical
Publication of JP4295882B2 publication Critical patent/JP4295882B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 画像データ圧縮の最適化のために、圧縮中の
データタイプを識別する技術を提供する。 【解決手段】 本発明の文書のピクセルマップ表現の区
分方法は、離散的ロケーションの光強度信号で構成され
るデジタル画像データのブロックを取得するステップ
(210)と、そのブロックについて分類を指定し、そ
のブロックのコンテキストに関する表示を与えるステッ
プ(220)と、指定された分類に基づいてそのブロッ
ク内の光強度信号を上位サブセットと下位サブセットと
に区分するステップ(230)と、光強度区分を記録す
る1組のセレクタを生成するステップと、上位及び下位
サブセットに含まれるデジタル画像データを別々に圧縮
するステップ(240)とを含む。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的には画像処
理に関し、より詳細には、文書のデジタル表現の圧縮技
術に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】高解像
度で走査された文書は、非常に多くの記憶スペースを必
要とする。データをそのまま記憶する代わりに、ボリュ
ームを減らすために、データは一般的にある形態のデー
タ圧縮を施され、それによりデータの記憶に関連する高
いコストを避ける。レンペル-ジブ-ウェルチ(Lempel-Zi
v Welch)(LZW)法のような“損失のない(lossles
s)”圧縮方法は、走査されたピクセルマップにはそれほ
どうまく働かない。一方、JPEGのような“損失のあ
る(lossy)”方法は、連続トーンのピクセルマップには
かなりうまく働くが、ページのテキストを含む部分には
それほどうまく働かない。画像データ圧縮を最適化する
ために、圧縮中のデータのタイプを識別できる技術が必
要である。
【0003】
【課題を解決するための手段】1つの実施の形態では、
本発明は、文書のピクセルマップ表現の区分方法を開示
し、その方法は、離散的ロケーションでの光強度信号で
構成されるデジタル画像データのブロックを取得するス
テップと、そのブロックについて分類を指定し、そのブ
ロックのコンテキストに関する表示を与えるステップ
と、指定された分類に基づいてそのブロック内の光強度
信号を上位サブセットと下位サブセットとに区分するス
テップと、光強度区分を記録する1組のセレクタを生成
するステップと、上位及び下位サブセットに含まれるデ
ジタル画像データを別々に圧縮するステップとを含む。
【0004】別の実施の形態では、本発明は、データの
ブロックが離散的ロケーションでの光強度信号から成る
デジタル画像データのブロックを複数の画像データタイ
プのうちの1つに分類する方法を開示し、その方法は、
ブロックを明領域と暗領域とに分けるステップと、その
ブロックのローパスフィルタ処理されたバージョンを明
領域と暗領域とに分けるステップと、明領域、暗領域、
フィルタ処理後の明領域、及びフィルタ処理後の暗領域
のそれぞれについて平均光強度値を計算するステップ
と、明領域と暗領域との間の平均光強度値の差を、フィ
ルタ処理後の明領域とフィルタ処理後の暗領域との間の
平均光強度値の差と比較するステップと、平均光強度の
差とフィルタ処理後の平均光強度の差とがほぼ等しい場
合は、差の値が含まれる値の範囲を求め、その値の範囲
に基づいてブロックを分類するステップと、平均光強度
の差とフィルタ処理後の平均光強度の差とがほぼ等しい
値にならない場合は、フィルタ処理後の差の値が含まれ
る値の範囲を求め、そのフィルタ処理後の値の範囲に基
づいてブロックを分類するステップとを含む。
【0005】
【発明の実施の形態】本発明は、複合画像中に含まれる
様々なタイプのデータを別々に処理するための方法及び
装置に関する。本発明は、混合ラスタコンテント(MR
C:Mixed Raster Content)技術の中で述べられるが、
他の方法及び装置との使用に適合させてもよく、従っ
て、MRCフォーマットには限定されない。本明細書に
述べる技術は、ファクシミリ装置や画像記憶装置等のよ
うな文書の記憶及び送信のために必要な様々な装置での
使用に適しており、カラー画像及び白黒グレースケール
画像の両方の処理が可能である。
【0006】ピクセルマップとは、ページ上の個々の離
散的ロケーションが、色を示す、又はグレースケール文
書の場合にはそのロケーションにおける画像の明るさ又
は暗さを示す値を有する光信号を発する画像要素即ち
“ピクセル”を含むマップである。当業者が認識するよ
うに、ほとんどのピクセルマップは、1組の不連続的な
非負整数からとった値を有する。
【0007】例えば、カラー文書のピクセルマップで
は、個々のセパレーションは、0から255の範囲内のデジ
タル値として表されることが多く、ここで、0は着色剤
が無いことを表すか(即ち、CMYK分解が用いられる
場合)、又は、輝度-色光度分解が用いられる場合には
範囲内の最低値を表し、255は着色剤の最大量か又は範
囲内の最高値を表す。グレースケールピクセルマップで
は、これは典型的に、黒を表す0から可能な限り最も白
いトーンを表す255までの範囲内で変化するピクセル値
のことである。本発明の本明細書における好ましい実施
の形態で問題にするピクセルマップは、“走査された”
画像の表現である。つまり、デジタルスキャナを用い
て、物理的な媒体から反射される光をデジタル化するこ
とによって生成される画像である。ビットマップという
用語は、ピクセルが2つの値1又は0の一方をとり得る二
値ピクセルマップを意味するように用いられる。
【0008】次に、図面に移り、MRCフォーマットに
ついてより詳細に述べる。図1に示されるように、カラ
ー又はグレースケール文書を表すピクセルマップ10
は、好ましくは3プレーンページフォーマットに分解さ
れる。ピクセルマップ10上のピクセルは、より良い画
像処理効率を可能にするために、好ましくはブロック1
8(図2に最もよく示されている)としてグループ化さ
れる。この文書フォーマットは、典型的に、上位プレー
ン12、下位プレーン14、及びセレクタプレーン16
から成る。上位プレーン12及び下位プレーン14は、
元の画像データを記述するピクセルを含み、各ブロック
18内のピクセルは所定の基準に基づいて分けられてい
る。例えば、ある閾値を越える値を有するピクセルは一
方のプレーンに配置され、その閾値以下の値を有するピ
クセルは他方のプレーンに配置される。セレクタプレー
ン16は元のピクセルマップ10内の全てのピクセルご
との記録をとり、全ピクセルを上位プレーン12又は下
位プレーン14のいずれかの上の正確な点にマッピング
する。
【0009】上位プレーン及び下位プレーンは、元のピ
クセルマップ10と同じビット深度及び色数で記憶され
るが、可能であれば解像度を下げて記憶される。セレク
タプレーンはビットマップとして生成及び記憶される。
データが存在するプレーンの説明に“上位”及び“下
位”という用語を用いているが、この用語によって本発
明を任意の特定の配列や構成に限定することは意図しな
いことを認識されたい。
【0010】処理後、3つのプレーンは全て、そこに存
在するデータのタイプに適した方法を用いて圧縮され
る。例えば、上位プレーン12及び下位プレーン14
は、JPEGのような、データ損失を生じる圧縮技術を
用いて圧縮及び記憶されてもよい。一方、セレクタプレ
ーン16はgzipやCCITT‐G4のような損失のない圧縮形
式を用いて圧縮及び記憶される。プレーンを、出力文書
に意図される用途に適した他の形式を用いて圧縮及び記
憶することは、当業者には明白であろう。例えば、カラ
ーファクシミリ分野では、使用される特定の圧縮形式は
ファクシミリデータ送信用に承認された形式(MMR、
MR、MH、JPEG、JBIG等)の1つでなければ
ならないので、セレクタプレーン16には好ましくはグ
ループ4(MMR)が用いられる。
【0011】本発明では、デジタル画像データは、好ま
しくは上述したようなMRC技術を用いて処理される。
ピクセルマップ10は、セパレーションのすみずみま
で、離散的なロケーションに分散された光強度信号で構
成される走査された画像を表す。ここでも、光信号は、
“画像要素”“ピクセル”又は“pel”と呼ばれるこれ
らの離散的ロケーションの各々から、元の画像のそのセ
パレーションに対応するロケーションから反射される光
の強さを示す強度レベルで、発せられる。
【0012】典型的なMRCの方法では、ピクセルマッ
プ10は2つのプレーン12及び14に分割されなけれ
ばならない。図3は、本発明に従ってピクセルマップ1
0を上位プレーン12と下位プレーン14とに区分する
ために用いられる処理全体の概要を示すフロー図であ
る。ブロック18は、ステップ210で示されるように
得られ、ステップ220で示されるように分類される。
本発明の好ましい実施の形態では、ブロック18は、ま
ず、UNIFORM(均一)、SMOOTH(平滑)、WEAK#EDGE(弱
エッジ)、又はEDGE(エッジ)のいずれかに分類され、
そのコンテキストがTEXT(テキスト)又はPICTURE(ピ
クチャー)のいずれかとして与えられる。次に、ブロッ
クは、最初の分類及びコンテキストによって、SMOOTH又
はEDGEのいずれかに再分類される。次に、ステップ23
0で示されるように、ブロック18内のピクセルが区分
される、即ち、そのブロックの分類のされ方に最も適し
た基準に従って上位プレーン12又は下位プレーン14
のいずれかに配置される。この処理は、ピクセルマップ
10全体が処理されるまで、元のピクセルマップ10内
の各ブロック18について繰返される。次に、ステップ
240で示されるように、上位プレーン12、下位プレ
ーン14、及びセレクタプレーン16は、各々に含まれ
るデータのタイプに最も適した技術を用いて、別々に圧
縮される。
【0013】次に図4に移る。一般的に、上述されたス
テップ220におけるブロック18の4つのカテゴリの
1つへの分類は、好ましくは3つのステップで完了す
る。まず、ステップ310で示されるように、ブロック
内のピクセル値のばらつきが決定される。ブロックのば
らつきは、後で図6を参照して詳細を述べる統計的な尺
度を用いることによって最もよく決定される。一貫して
大きなばらつきを有するブロックは、実際には画像のエ
ッジに沿っている場合が最も多く、一方、ばらつきが少
ないブロックは、均一か又は少なくとも平滑な領域にあ
ることが推定される。ステップ320で示されるよう
に、ブロック内のばらつきを測定することによって、そ
のブロックに最初の分類が指定される。次に、ステップ
330で示されるように、各ブロック18内の画像デー
タが詳細に検討され、コンテキスト情報(即ち、その領
域がテキスト内にあるか、又は画像のピクチャー領域で
あるか)が更新され、必要であればブロック再分類が行
われる。UNIFORMブロックはSMOOTHに再分類され、WEAK
EDGEブロックはTEXTのコンテキストにおいてはEDGEにア
ップグレード(格上げ)され、PICTUREのコンテキスト
においてはSMOOTHに再分類される。また、ピクセルマッ
プ10にローパスフィルタを適用することによって、画
像の平滑化バージョン20が与えられる。平滑化画像2
0は、分類中に付加的な情報を与えるとともに、ハーフ
トーン領域についてのスクリーン解除データを与えるた
めに、元の画像データと関係して用いられる。
【0014】図5は、図3のステップ230で与えられ
る、ブロック18が2つのプレーンに区分される方法の
詳細を示す。測定は、まず、ステップ410で、処理中
のブロックがステップ220で最初にEDGEに分類された
か否かを決定することによって開始する。そうである場
合は、ブロック内の個々のピクセル値vpが、まず、輝
度閾値tsと比較され、ts以上の値を有するピクセルは
“明”ピクセルとみなされ、ts未満の値を有するピク
セルは“暗”ピクセルとみなされる。EDGEブロックの区
分は、単純に、ステップ440で示されるように暗ピク
セルを上位プレーン12に配置し、ステップ450で示
されるように明ピクセルを下位プレーン14に配置す
る。ステップ410で、ブロック18がEDGEではないと
決定された場合は、ブロック内の全ピクセルが、1ピク
セルずつではなく、一緒に処理される。SMOOTH(EDGEで
はない)ピクセルの区分は次のように行われる。ブロッ
ク18が、SMOOTHに分類されたブロックのショートラン
の真中にあり、更に、このショートラン中の全てのブロ
ックが暗(vp<ts)である場合は、そのブロック内の
全データが上位プレーン12に配置される。ブロック1
8全体が実質的に平滑である(即ち、ロングラン中に存
在する)か、又は明である(明ピクセルのショートラン
中に存在する)場合は、ブロック18内の全データは下
位プレーン14に配置される。
【0015】次に、図6に移り、ステップ310(図
4)で必要な、ブロックのばらつきの測定を用いた最初
のブロック分類が遂行されてもよい、本発明の1つの実
施の形態の詳細を述べる。まず、ステップ510で示さ
れるように、ブロックを2つの部分に分けるための閾値
sが計算される。本発明の好ましい実施の形態では、
この閾値はブロック内のデータのヒストグラム解析を行
うことによって得られるが、この解析を行うために多く
の標準的な方法を用いることができる。例えば、分離に
用いられる基準間の距離を最大化するか、又はブロック
の2つの部分の間の最大分離を与える値を選択すること
ができる。最良の閾値を選択する他の方法も使用可能で
あり、本発明はこの実施の形態に限定されないことを、
当業者は認識するであろう。次に、ステップ520で示
されるように、ブロック18は、各ピクセルの光強度値
を選択された閾値tsと比較することにより、これらの
2つの部分へと閾値処理される。前述したように、ピク
セル値vpが閾値より小さい場合は、そのピクセルは暗
であるとされる。vpがtsより大きいか又は等しい場合
は、そのピクセルは明である。
【0016】先に述べたように、元の画像データにロー
パスフィルタを適用することによって、その画像の平滑
化バージョン20が得られる。次に、元の画像データ及
び平滑化された画像データの両方の組について、明ピク
セル及び暗ピクセルについての平均値が得られる。まず
明ピクセルをみると、ステップ540で示されるよう
に、元のピクセルマップ10(vp≧ts)内の、ブロッ
ク18にカバーされる領域に位置する全ての明ピクセル
の平均値である1つの値、vBPIXELが計算される。ま
た、ステップ560で示されるように、もう1つの値v
BSMOOTH、即ち、画像の平滑化バージョン20内の、ブ
ロック18にカバーされる領域に位置する全ての明ピク
セルの平均値も得られる。暗値も同様に計算される。つ
まり、ステップ550で示されるように、元のピクセル
マップ10(vp<ts)内の、ブロック18にカバーさ
れる領域に位置する全ての暗ピクセルの平均値であるv
DPIXELが得られ、ステップ570で示されるように、画
像の平滑化バージョン20内の、ブロック18にカバー
される領域に位置する全ての暗ピクセルの平均値である
DSMOOTHが得られる。一旦、これらの平均値が得られ
ると、ステップ580で示されるように、ピクセルマッ
プ10及び平滑化された画像20のそれぞれについての
明るい方の平均と暗い方の平均との間の距離d及びds
が計算される。即ち、d=vBPIXEL−vDPIXEL、及びd
s=vBSMOOTH−vDSMOOTHである。コントーン画像につ
いてはd/dsは典型的にほぼ1に等しいので、d/ds
比率はハーフトーンの検出に用いられてもよい。
【0017】図7は、最初にブロック18を分類するた
めの処理の好ましい実施の形態である図4のステップ3
20の詳細図である。ステップ610で示されるよう
に、ブロックがコントーンデータ(d≒ds)を含むか
ハーフトーンデータを含むかを決定するために、dとd
sとの相対比が得られる。ブロック18は、距離d又は
sの大きさに従って、最初に4つのタイプ、UNIFORM、
SMOOTH、WEAK EDGE、又はEDGEの1つに分類される。距
離dはコントーンブロックを分類するのに用いられ、距
離dsはハーフトーンに用いられる。コントーンデータ
については、ステップ620で示されるように、ピクセ
ルマップ10からの値dが値x0と比較される。
【0018】dが非常に低い(即ちd<x0)場合は、
ブロック内の全てのピクセル値が実質的に同じであるの
で、ブロックはステップ640でUNIFORMに分類され
る。ステップ622で示されるように、x0<d<x1
ようにブロック内のピクセル値に多少の小さな差異があ
る場合は、そのブロックはステップ650でSMOOTHに分
類される。ブロック内のピクセル値にかなり大きな差異
があり、ステップ624でx1<d<x2である場合は、
そのブロックはWEAK EDGEに分類される。ブロック内の
差異が非常に大きく、ステップ624でd≧x2である
場合は、そのブロックはステップ670でEDGEに分類さ
れる。
【0019】d/dsがほぼ1に等しい値にならない場合
は、ステップ630で、dsが閾値y0と比較される。ハ
ーフトーンとコントーンとに2つの異なる組の閾値が適
用されることに注意されたい。従って、ほとんどの場
合、x0≠y0、x1≠y1、及びx2≠y2である。ハーフ
トーンブロックの分類に用いられる処理は、コントーン
データに用いられる処理と似ている。従って、ステップ
630でds<y0である場合は、そのブロックはステッ
プ640でUNIFORMに分類される。ステップ632でy0
<ds<y1である場合は、そのブロックはステップ65
0でSMOOTHに分類される。ステップ634で示されるよ
うにy1<ds<y2である場合は、そのブロックはステ
ップ660でWEAK EDGEに分類される。ステップ634
でds≧y2である場合は、そのブロックはステップ67
0でEDGEに分類される。
【0020】次に、図8及び9を参照し、ブロックのコ
ンテキストを更新するための詳細が与えられる。ブロッ
クのコンテキストは、ブロックの暗領域と明領域との間
の平均差が比較的高い場合に有用である。この場合、ブ
ロックは、そのコンテキストがTEXTである限りにおいて
は、EDGEに分類できる。コンテキストは最初はPICTURE
に設定される。次の2つの規則のうちの1つが満足され
るとコンテキストはTEXTに変更される。即ち、(1)処
理中のブロックが複数のUNIFORMブロックのロングラン
の中にあり、ブロック内の暗ピクセル値の平均が所定の
輝度閾値よりも大きい、又は(2)そのブロックがUNIF
ORM、WEAK EDGE、又はEDGEのいずれかに分類されてお
り、上、左、又は右に隣接するブロックのうちの1つが
TEXTに設定されたコンテキストを有し、その隣接するブ
ロックと現在のブロックとの差が所定の伝搬閾値より小
さい。
【0021】まず図8をみると、ブロックのコンテキス
トが第1規則に従って変更されるべきか否かの決定に
は、ステップ704で示されるように、UNIFORMに分類
されているブロックのランを検出する必要がある。UNIF
ORMブロックのランの検出では、典型的には、ステップ
706で示されるように、連続したUNIFORMブロックの
数とランレングス閾値tLUとの比較を行う。ランレング
ス閾値は、ランが確立されるためにUNIFORMに分類され
なければならない連続ブロックの数を設定する。また、
ステップ706で示されるように、連続ブロックについ
て、暗ピクセルの平均値vDPIXELが、輝度閾値tsと比
較される。高い輝度レベルを有する多数の連続UNIFORM
ブロックは、通常、ブロックが大きな背景ページ領域
(即ち、大きな白い領域)を含むことを示し、それによ
り、テキストの存在を示す。従って、連続UNIFORMブロ
ック数がtluを越えるとともにvDPIXEL>tsである場
合は、ステップ708で示されるように、そのブロック
について、コンテキストがTEXTに変更される。
【0022】識別された連続ブロックの数がランの確立
には少なすぎるか、又はブロックが暗(vDPIXEL
s)であるかのいずれかの場合は、コンテキストはPIC
TUREに設定されたままになる。ステップ710で示され
るように、ブロック内に更にランが存在するか否かが決
定され、そうである場合は図中に示されるように処理が
繰返される。
【0023】次に図9をみると、第2規則の下でブロッ
クのコンテキストをTEXTに変更するには、まず、伝搬閾
値tpを与える必要がある。伝搬閾値は、ブロックが空
白ページ領域をカバーしていることを示す輝度のレベル
を定める。第2規則の下で、ステップ802で示される
ようにブロックがSMOOTHではなく(即ち、UNIFORM及びE
DGE又はWEAK EDGEであり)、ステップ804で示される
ように上、左、又は右隣のいずれかがテキストのコンテ
キストを有し、尚且つステップ806で示されるよう
に、そのブロック内の明ピクセルとコンテキストがテキ
ストである隣接ブロック内の明ピクセルとの平均差異v
BDIFがtpより小さい場合は、ステップ808でコンテ
キストがピクチャーからテキストに変更される。テキス
トを含むブロックはテキストを含む別のブロックの隣に
位置することが推定されるので、隣接するブロックがチ
ェックされる。しかしながら、そうであることを確認す
るためには、そのブロックの輝度の値が隣接ブロックの
輝度の値と比較される。言い換えれば、たとえブロック
がテキストのコンテキストを有するブロックと隣接して
いても、そのブロックと隣接ブロックとの平均輝度の差
異が大きければ、そのブロックが、テキストの存在を示
す大きな空白ページ領域を含まないことを意味する。
【0024】繰返すが、本発明は、まず画像のエッジを
含むブロックを識別し、次に、平滑なデータ及びエッジ
の明るい側を含むブロックが下位プレーンに配置され、
エッジの暗い側が上位プレーンに配置されるようにブロ
ックを分けることによる、データの区分に関する。一
旦、それぞれのプレーンが生成されると、通常のMRC
処理が続く。つまり、各プレーンが適切な圧縮技術を用
いて圧縮される。本明細書における好ましい実施の形態
では、上位プレーン12及び下位プレーン14はJPE
Gを用いて圧縮され、セレクタプレーン16は、CCITT
グループIVか、又は本明細書にその内容を参照として援
用する1998年7月7日発行のデービス(Davis)の米国特許
第5,778,095号に記載されているような走査されたシン
ボルの同等のクラスへの分類方法のような、シンボルベ
ースのパターン照合技術を用いて圧縮される。次に、プ
レーンは共に結合され、ファクシミリ装置や記憶装置の
ような出力装置へと送信される。
【図面の簡単な説明】
【図1】複合画像と、そのような画像が上位プレーン、
下位プレーン、及びセレクタプレーンの3つのMRC画
像プレーンに分解され得る方法の例を示す図である。
【図2】ピクセルマップと、ピクセルがグループ化され
てブロックを形成する方法の詳細を示す図である。
【図3】本発明を実施するために行われるステップを概
括的に示すフロー図である。
【図4】本発明に従ってブロックが分類される方法の詳
細を示すフロー図である。
【図5】本発明に従ってブロックがその分類に基づいて
区分される方法の詳細を示すフロー図である。
【図6】図4に示されている本発明の実施の形態の必要
に応じて、ブロックのばらつきを測定できる方法の1つ
の実施の形態の詳細を示すフロー図である。
【図7】図6で与えられるブロックのばらつきの測定に
基づくブロックの分類を説明する、本発明の実施の形態
の詳細を示すフロー図である。
【図8】図7で与えられるブロックの分類に基づいてコ
ンテキストが更新されてもよい、本発明の実施の形態の
詳細を示すフロー図である。
【図9】図7で与えられるブロックの分類に基づいてコ
ンテキストを更新するための、本発明の別の実施の形態
の詳細を示すフロー図である。
【符号の説明】
10 ピクセルマップ 12 上位プレーン 14 下位プレーン 16 セレクタプレーン 18 ブロック
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ミン シュイ アメリカ合衆国 14618 ニューヨーク州 ロチェスター アッシュボーン ロード 276

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 混合ラスタコンテント処理のためのデジ
    タル画像データ区分方法であって、 a)離散的ロケーションでの光強度信号で構成されるデジ
    タル画像データのブロックを得るステップと、 b)前記ブロックについて分類を指定し、前記ブロックの
    コンテキストに関する表示を与えるステップと、 c)前記指定された分類に基づいて前記ブロック内の前記
    光強度信号を上位サブセットと下位サブセットとに区分
    するステップと、 d)前記光強度区分を記録する1組のセレクタを生成する
    ステップと、 e)前記上位及び下位サブセットに含まれるデジタル画像
    データを別々に圧縮するステップと、 を有する、デジタル画像データ区分方法。
  2. 【請求項2】 離散的ロケーションでの光強度信号で構
    成されるデジタル画像データブロックを上位及び下位サ
    ブセットへと区分する方法であって、 a)ブロックがデジタル画像内のエッジ上に位置するか否
    かを決定するステップと、 b)ブロックがエッジ上にある場合は、ブロック内の個々
    の光強度信号の大きさを輝度閾値と比較し、前記光強度
    の大きさが前記輝度閾値を越える場合は前記信号を上位
    サブセットに配置し、前記光強度の大きさが前記輝度閾
    値より小さい場合は前記信号を下位サブセットに配置す
    るステップと、 c) ブロックがエッジ上に位置しない場合は、前記ブロ
    ックが平滑な暗画像データを示す光強度値を有する一群
    のブロック中に存在するときは前記ブロックを上位サブ
    セット内に配置し、そうでないときは前記ブロックを下
    位サブセットに配置するステップと、 を有する、デジタル画像データブロックの上位及び下位
    サブセットへの区分方法。
  3. 【請求項3】 離散的ロケーションの光強度信号で構成
    されるデジタル画像データブロックを複数の画像データ
    タイプの1つに分類する方法であって、 a)前記ブロックを明領域と暗領域とに分けるステップ
    と、 b)前記ブロックのローパスフィルタ処理されたバージョ
    ンを明領域と暗領域とに分けるステップと、 c)前記明領域、前記暗領域、前記フィルタ処理後の明領
    域、及び前記フィルタ処理後暗領域のそれぞれについて
    平均光強度値を計算するステップと、 d)前記明領域と前記暗領域との間の平均光強度値の差
    を、前記フィルタ処理後の明領域と前記フィルタ処理後
    の暗領域との間の平均光強度値の差と比較するステップ
    と、 e) 前記平均光強度の差と前記フィルタ処理後の平均光
    強度の差とがほぼ等しい場合は、前記差の値が含まれる
    値の範囲を求め、該値の範囲に基づいて前記ブロックを
    分類するステップと、 f) 前記平均光強度の差と前記フィルタ処理後の平均光
    強度の差とがほぼ等しい値にならない場合は、前記フィ
    ルタ処理後の差の値が含まれる値の範囲を求め、該フィ
    ルタ処理後の値の範囲に基づいて前記ブロックを分類す
    るステップと、 を有する、デジタル画像データブロックを複数の画像デ
    ータタイプの1つに分類する方法。
JP34267899A 1998-12-02 1999-12-02 デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法 Expired - Fee Related JP4295882B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/203,870 US6400844B1 (en) 1998-12-02 1998-12-02 Method and apparatus for segmenting data to create mixed raster content planes
US203870 1998-12-02

Publications (2)

Publication Number Publication Date
JP2000175051A true JP2000175051A (ja) 2000-06-23
JP4295882B2 JP4295882B2 (ja) 2009-07-15

Family

ID=22755650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34267899A Expired - Fee Related JP4295882B2 (ja) 1998-12-02 1999-12-02 デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法

Country Status (4)

Country Link
US (1) US6400844B1 (ja)
EP (1) EP1006716B1 (ja)
JP (1) JP4295882B2 (ja)
DE (1) DE69941666D1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141244A (ja) * 2005-11-17 2007-06-07 Xerox Corp 電子ドキュメントのカラー整合評価方法
JP2008004093A (ja) * 2006-06-22 2008-01-10 Xerox Corp 画像データ編集システム及び方法
KR101366030B1 (ko) 2006-07-05 2014-02-25 후지필름 가부시키가이샤 데이터 압축 장치 및 데이터 압축 프로그램 기억 매체

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6603884B2 (en) * 1997-05-08 2003-08-05 Ricoh Company, Ltd. Image processing system for compressing image data including binary image data and continuous tone image data by a sub-band transform method with a high-compression rate
US6873723B1 (en) * 1999-06-30 2005-03-29 Intel Corporation Segmenting three-dimensional video images using stereo
US6650775B1 (en) * 1999-08-23 2003-11-18 Xerox Corporation Method and apparatus for implementing a streaming two-dimensional digital image segmentation
US7672022B1 (en) * 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image
US7218784B1 (en) * 2000-05-01 2007-05-15 Xerox Corporation Method and apparatus for controlling image quality and compression ratios
US6941014B2 (en) * 2000-12-15 2005-09-06 Xerox Corporation Method and apparatus for segmenting an image using a combination of image segmentation techniques
US7145676B2 (en) 2001-01-31 2006-12-05 Hewlett-Packard Development Company, L.P. Compound document image compression using multi-region two layer format
JP3898075B2 (ja) * 2002-03-18 2007-03-28 株式会社リコー 画像処理装置、画像処理方法及び記録媒体
US20060029281A1 (en) * 2002-04-23 2006-02-09 Koninklijke Philips Electronics N.V. Digital image processing method for low-rate applications
US7110137B2 (en) * 2002-04-30 2006-09-19 Microsoft Corporation Mixed raster content files
US7031518B2 (en) * 2002-07-01 2006-04-18 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
US7456982B2 (en) * 2002-07-01 2008-11-25 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7242802B2 (en) * 2002-07-01 2007-07-10 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US6983076B2 (en) * 2002-07-01 2006-01-03 Xerox Corporation Control system for digital de-screening of documents
US7375856B2 (en) * 2002-07-01 2008-05-20 Xerox Corporation Halftone screen frequency and magnitude estimation for digital descreening of documents
US7218418B2 (en) * 2002-07-01 2007-05-15 Xerox Corporation Digital de-screening of documents
US7382489B2 (en) * 2002-07-01 2008-06-03 Xerox Corporation Efficient interpolation technique using programmable node spacing
US7236641B2 (en) * 2002-07-01 2007-06-26 Xerox Corporation Page background detection and neutrality on scanned documents
US7269294B2 (en) * 2002-07-01 2007-09-11 Xerox Corporation Foreground erosion method and system for Multiple Raster Content (MRC) representation of documents
US7233695B2 (en) * 2002-07-01 2007-06-19 Xerox Corporation Scan color conversion method
US7200263B2 (en) * 2002-07-01 2007-04-03 Xerox Corporation Background suppression and color adjustment method
US7356183B2 (en) * 2002-07-01 2008-04-08 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7324120B2 (en) * 2002-07-01 2008-01-29 Xerox Corporation Segmentation method and system for scanned documents
US7227988B2 (en) * 2002-07-01 2007-06-05 Xerox Corporation Prioritized PDL segmentation producing two bit selector
US7433084B2 (en) * 2002-07-01 2008-10-07 Xerox Corporation Digital de-screening technique for scanned documents
US7308136B2 (en) * 2002-07-01 2007-12-11 Xerox Corporation Weak edge repositioning in a MRC segmentor
US20040045240A1 (en) * 2002-09-10 2004-03-11 Mcilvaine Bruce L. Laminate flooring with custom images
US7301674B2 (en) * 2002-10-31 2007-11-27 Hewlett-Packard Development Company, L.P. Translation of an input pixel value to an output pixel value
US7336400B2 (en) * 2002-10-31 2008-02-26 Hewlett-Packard Development Company, L.P. Transforming an input image to produce an output image
US7312898B2 (en) * 2002-10-31 2007-12-25 Hewlett-Packard Development Company, L.P. Transformation of an input image to produce an output image
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
US7139442B2 (en) * 2002-12-16 2006-11-21 Xerox Corporation Template matching applied to selector planes for multiple raster content (MRC) representation of documents
US8184340B2 (en) * 2003-06-17 2012-05-22 Xerox Corporation Method for color rendering using scanned halftone classification
US7532363B2 (en) * 2003-07-01 2009-05-12 Xerox Corporation Apparatus and methods for de-screening scanned documents
TWI366156B (en) * 2003-07-01 2012-06-11 Xerox Corp Method and system for thinning or eroding a gray image of an input image defined by a plurality of pixels
US7433535B2 (en) * 2003-09-30 2008-10-07 Hewlett-Packard Development Company, L.P. Enhancing text-like edges in digital images
US7302107B2 (en) * 2003-12-23 2007-11-27 Lexmark International, Inc. JPEG encoding for document images using pixel classification
US20050157112A1 (en) 2004-01-21 2005-07-21 Silverbrook Research Pty Ltd Inkjet printer cradle with shaped recess for receiving a printer cartridge
US7448734B2 (en) * 2004-01-21 2008-11-11 Silverbrook Research Pty Ltd Inkjet printer cartridge with pagewidth printhead
US7379587B2 (en) * 2004-02-12 2008-05-27 Xerox Corporation Systems and methods for identifying regions within an image having similar continuity values
US7403661B2 (en) * 2004-02-12 2008-07-22 Xerox Corporation Systems and methods for generating high compression image data files having multiple foreground planes
US7343046B2 (en) * 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
US7366357B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Systems and methods for adjusting image data to form highly compressible image planes
US7366746B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Finite impulse response filter method and apparatus
US7302116B2 (en) * 2004-02-12 2007-11-27 Xerox Corporation Method and apparatus for reduced size image
US7365882B2 (en) * 2004-02-12 2008-04-29 Xerox Corporation Halftone screen frequency and magnitude estimation for digital descreening of documents
US7386166B2 (en) * 2004-02-12 2008-06-10 Xerox Corporation Systems and methods for connecting regions image data having similar characteristics
US20050244060A1 (en) * 2004-04-30 2005-11-03 Xerox Corporation Reformatting binary image data to generate smaller compressed image data size
JP2005333393A (ja) * 2004-05-19 2005-12-02 Sharp Corp 画像圧縮装置,画像出力装置,画像伸張装置,印刷装置,画像処理装置,複写機,画像圧縮方法,画像伸張方法,画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US7283674B2 (en) * 2004-06-25 2007-10-16 Xerox Corporation Using graphic objects in MFD scan-to-export function
US8086050B2 (en) 2004-08-25 2011-12-27 Ricoh Co., Ltd. Multi-resolution segmentation and fill
US7574055B2 (en) * 2004-09-07 2009-08-11 Lexmark International, Inc. Encoding documents using pixel classification-based preprocessing and JPEG encoding
KR100643759B1 (ko) * 2004-12-01 2006-11-10 삼성전자주식회사 문서 압축 장치 및 그 방법
US20060239555A1 (en) * 2005-04-25 2006-10-26 Destiny Technology Corporation System and method for differentiating pictures and texts
US20060268365A1 (en) * 2005-05-27 2006-11-30 Lexmark International, Inc. Imaging apparatus configured for scanning a document
US7466873B2 (en) * 2005-06-29 2008-12-16 Xerox Corporation Artifact removal and quality assurance system and method for scanned images
US7551334B2 (en) * 2005-07-20 2009-06-23 Xerox Corporation Background suppression method and apparatus
US8630498B2 (en) * 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US7792359B2 (en) * 2006-03-02 2010-09-07 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US7889932B2 (en) * 2006-03-02 2011-02-15 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US7864365B2 (en) * 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US8437054B2 (en) * 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US7876959B2 (en) * 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
US8488839B2 (en) * 2006-11-20 2013-07-16 Videosurf, Inc. Computer program and apparatus for motion-based object extraction and tracking in video
US7899247B2 (en) 2007-01-24 2011-03-01 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system
JP2008236169A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
US8116581B2 (en) * 2007-06-28 2012-02-14 Microsoft Corporation Efficient image representation by edges and low-resolution signal
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US8014596B2 (en) * 2007-10-30 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for background color extrapolation
WO2010006334A1 (en) 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
US9508011B2 (en) * 2010-05-10 2016-11-29 Videosurf, Inc. Video visual and audio query
US9311708B2 (en) 2014-04-23 2016-04-12 Microsoft Technology Licensing, Llc Collaborative alignment of images
US9413477B2 (en) 2010-05-10 2016-08-09 Microsoft Technology Licensing, Llc Screen detector
JP5939154B2 (ja) * 2012-12-27 2016-06-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
KR20220028698A (ko) 2020-08-31 2022-03-08 삼성전자주식회사 고해상도 디스플레이를 위한 영상 처리 장치, 영상 처리 방법 및 이를 포함하는 어플리케이션 프로세서

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5014124A (en) 1988-02-25 1991-05-07 Ricoh Company, Ltd. Digital image processing apparatus
DE3881392T2 (de) 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
US5060980A (en) 1990-05-30 1991-10-29 Xerox Corporation Form utilizing encoded indications for form field processing
US5251271A (en) 1991-10-21 1993-10-05 R. R. Donnelley & Sons Co. Method for automatic registration of digitized multi-plane images
US5303313A (en) 1991-12-16 1994-04-12 Cartesian Products, Inc. Method and apparatus for compression of images
US5432870A (en) 1993-06-30 1995-07-11 Ricoh Corporation Method and apparatus for compressing and decompressing images of documents
JPH07220091A (ja) 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US6026182A (en) 1995-10-05 2000-02-15 Microsoft Corporation Feature segmentation
US5778092A (en) * 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5767978A (en) * 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141244A (ja) * 2005-11-17 2007-06-07 Xerox Corp 電子ドキュメントのカラー整合評価方法
JP2008004093A (ja) * 2006-06-22 2008-01-10 Xerox Corp 画像データ編集システム及び方法
KR101366030B1 (ko) 2006-07-05 2014-02-25 후지필름 가부시키가이샤 데이터 압축 장치 및 데이터 압축 프로그램 기억 매체

Also Published As

Publication number Publication date
EP1006716B1 (en) 2009-11-25
EP1006716A2 (en) 2000-06-07
DE69941666D1 (de) 2010-01-07
JP4295882B2 (ja) 2009-07-15
US6400844B1 (en) 2002-06-04
EP1006716A3 (en) 2001-09-19

Similar Documents

Publication Publication Date Title
JP4295882B2 (ja) デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法
JP4242532B2 (ja) デジタル画像データ区分方法
US7158669B2 (en) Image compression method and apparatus, and image coding method and apparatus
KR100477656B1 (ko) 디지털 화질 개선 방법 및 장치
US9135722B2 (en) Perceptually lossless color compression
US7221790B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
US7343046B2 (en) Systems and methods for organizing image data into regions
US5778092A (en) Method and apparatus for compressing color or gray scale documents
US6307962B1 (en) Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US20020076103A1 (en) Method and apparatus for segmenting an image using a combination of image segmentation techniques
JP2004173276A (ja) デシジョン面生成方法、画像データ画素区分方法及びカラードキュメント区分方法
US20050013502A1 (en) Method of improving image quality
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
JP4035456B2 (ja) 画像圧縮方法、画像圧縮装置
EP1006717B1 (en) Method and apparatus for segmenting data
KR20040036843A (ko) 디지털 화질 개선방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080924

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080929

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081007

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090113

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090413

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees