JP2000196895A - デジタル画像デ―タ区分方法 - Google Patents

デジタル画像デ―タ区分方法

Info

Publication number
JP2000196895A
JP2000196895A JP11342679A JP34267999A JP2000196895A JP 2000196895 A JP2000196895 A JP 2000196895A JP 11342679 A JP11342679 A JP 11342679A JP 34267999 A JP34267999 A JP 34267999A JP 2000196895 A JP2000196895 A JP 2000196895A
Authority
JP
Japan
Prior art keywords
block
plane
threshold
pixels
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11342679A
Other languages
English (en)
Other versions
JP4242532B2 (ja
Inventor
Queiroz Ricardo L De
エル.デ ケイロズ リカルド
Zhigang Fan
ファン ジガン
Trac D Tran
ディー.トラン トラック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2000196895A publication Critical patent/JP2000196895A/ja
Application granted granted Critical
Publication of JP4242532B2 publication Critical patent/JP4242532B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction

Abstract

(57)【要約】 (修正有) 【課題】 混合ラスタコンテント処理のためのデジタル
画像データ区分方法の提供。 【解決手段】 本発明の方法は、a)離散的ロケーション
での光強度信号で構成されるデジタル画像データのブロ
ックを得るステップと、b)このブロックについて閾値を
計算するステップと、c)どの光強度信号がこの閾値を超
え、どの光強度信号がこの閾値より低いかを示すセレク
タブロックを生成するステップとを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的には画像処
理に関し、より詳細には、文書のデジタル表現の圧縮技
術に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】高解像
度で走査された文書は、非常に多くの記憶スペースを必
要とする。データをそのまま記憶する代わりに、ボリュ
ームを減らすために、データは一般的にある形態のデー
タ圧縮を施され、それによりデータの記憶に関連する高
いコストを避ける。レンペル-ジブ-ウェルチ(Lempel-Zi
v Welch)(LZW)法のような“損失のない(lossles
s)”圧縮方法は、走査されたピクセルマップにはそれほ
どうまく働かない。一方、JPEGのような“損失のあ
る(lossy)”方法は、連続トーンのピクセルマップには
かなりうまく働くが、ページのテキストを含む部分には
それほどうまく働かない。画像データ圧縮を最適化する
ために、圧縮中のデータのタイプを識別できる技術が必
要である。
【0003】本発明は、MRCフォーマットを用いるカ
ラー画像データの区分に関する。エッジとは、一般的
に、2つの一定色の領域、即ち光強度値の大きな部分の
間の鮮鋭な不連続部として定義される。ここで、画像の
エッジは2つの部分に分けられる。前景レイヤーは、一
般的に、(エッジの)より暗い側に関する情報を含み、
背景レイヤーは、画像の平滑な領域及びエッジのより明
るい側に関する情報を含む。画像をストライプに区画し
(各ストライプの高さはブロックのサイズに等しい)、
画像の上から下へとブロックごとに各ストライプを処理
することによって、区分が行われる。
【0004】
【課題を解決するための手段】本発明は、1つの実施の
形態において、混合ラスタコンテント処理のためのデジ
タル画像データの区分方法を開示する。この方法は、離
散的ロケーションでの光強度信号で構成されるデジタル
画像データのブロックを得るステップと、このブロック
について閾値を計算するステップと、どの光強度信号が
閾値を超え、どの光強度信号が閾値より低いかを示すセ
レクタブロックを生成するステップとを含む。
【0005】
【発明の実施の形態】本発明は、複合画像中に含まれる
様々なタイプのデータを別々に処理するための方法及び
装置に関する。より詳細には、本発明は、混合ラスタコ
ンテント(MRC:Mixed Raster Content)画像処理中
に用いられる幾つかのプレーンの1つであるセレクタプ
レーンの生成に関する。本発明は、MRC技術の中で述
べられるが、ビットマップを生成するための他の方法及
び装置との使用に適合させてもよく、従って、MRC処
理には限定されない。本明細書に述べる技術は、ファク
シミリ装置や画像記憶装置等のような文書の記憶及び送
信のために必要な様々な装置での使用に適しており、カ
ラー画像及び白黒グレースケール画像の両方の処理が可
能である。
【0006】ピクセルマップとは、ページ上の個々の離
散的ロケーションが、色を示す、又はグレースケール文
書の場合にはそのロケーションにおける画像の明るさ又
は暗さを示す値を有する光信号を発する画像要素即ち
“ピクセル”を含むマップである。当業者が認識するよ
うに、ほとんどのピクセルマップは、1組の不連続的な
非負整数からとった値を有する。
【0007】例えば、カラー文書のピクセルマップで
は、個々のセパレーションは、0から255の範囲内のデジ
タル値として表されることが多く、ここで、0は着色剤
が無いことを表すか(即ち、CMYK分解が用いられる
場合)、又は、輝度-色光度分解が用いられる場合には
範囲内の最低値を表し、255は着色剤の最大量か又は範
囲内の最高値を表す。グレースケールピクセルマップで
は、これは典型的に、黒を表す0から可能な限り最も白
いトーンを表す255までの範囲内で変化するピクセル値
のことである。本発明の本明細書における好ましい実施
の形態で問題にするピクセルマップは、“走査された”
画像の表現である。つまり、デジタルスキャナを用い
て、物理的な媒体から反射される光をデジタル化するこ
とによって生成される画像である。ビットマップという
用語は、ピクセルが2つの値1又は0の一方をとり得る二
値ピクセルマップを意味するように用いられる。
【0008】次に、図面に移り、MRCフォーマットに
ついてより詳細に述べる。図1に示されるように、カラ
ー又はグレースケール文書を表すピクセルマップ10
は、好ましくは3プレーンページフォーマットに分解さ
れる。ピクセルマップ10上のピクセルは、より良い画
像処理効率を可能にするために、好ましくはブロック1
8(図2に最もよく示されている)としてグループ化さ
れる。この文書フォーマットは、典型的に、上位プレー
ン12、下位プレーン14、及びセレクタプレーン16
から成る。上位プレーン12及び下位プレーン14は、
元の画像データを記述するピクセルを含み、各ブロック
18内のピクセルは所定の基準に基づいて分けられてい
る。例えば、ある閾値を越える値を有するピクセルは一
方のプレーンに配置され、その閾値以下の値を有するピ
クセルは他方のプレーンに配置される。セレクタプレー
ン16は元のピクセルマップ10内の全てのピクセルご
との記録をとり、全ピクセルを上位プレーン12又は下
位プレーン14のいずれかの上の正確な点にマッピング
する。
【0009】上位プレーン及び下位プレーンは、元のピ
クセルマップ10と同じビット深度及び色数で記憶され
るが、可能であれば解像度を下げて記憶される。セレク
タプレーンはビットマップとして生成及び記憶される。
データが存在するプレーンの説明に“上位”及び“下
位”という用語を用いているが、この用語によって本発
明を任意の特定の配列や構成に限定することは意図しな
いことを認識されたい。
【0010】処理後、3つのプレーンは全て、そこに存
在するデータのタイプに適した方法を用いて圧縮され
る。例えば、上位プレーン12及び下位プレーン14
は、JPEGのような、データ損失を生じる圧縮技術を
用いて圧縮及び記憶されてもよい。一方、セレクタプレ
ーン16はgzipやCCITT‐G4のような損失のない圧縮形
式を用いて圧縮及び記憶される。プレーンを、出力文書
に意図される用途に適した他の形式を用いて圧縮及び記
憶することは、当業者には明白であろう。例えば、カラ
ーファクシミリ分野では、使用される特定の圧縮形式は
ファクシミリデータ送信用に承認された形式(MMR、
MR、MH、JPEG、JBIG等)の1つでなければ
ならないので、セレクタプレーン16には好ましくはグ
ループ4(MMR)が用いられる。
【0011】本発明では、デジタル画像データは、好ま
しくは上述したようなMRC技術を用いて処理される。
ピクセルマップ10は、セパレーションのすみずみま
で、離散的なロケーションに分散された光強度信号で構
成される走査された画像を表す。ここでも、光信号は、
“画像要素”“ピクセル”又は“pel”と呼ばれるこれ
らの離散的ロケーションの各々から、元の画像のそのセ
パレーションに対応するロケーションから反射される光
の強さを示す強度レベルで、発せられる。
【0012】典型的なMRCの方法では、ピクセルマッ
プ10は2つのプレーン12及び14に分割されなけれ
ばならない。図3は、本発明に従ってピクセルマップ1
0を上位プレーン12と下位プレーン14とに区分する
ために用いられてもよい1つの処理の概要を示す模式的
線図である。以降、この実施の形態を参照して本発明を
述べるが、本発明は他の方法で実現されてもよいことを
留意されたい。本発明は、ビットマップ、特に原画像と
関連するビットマップの使用を必要とする、任意の画像
処理技術で用いられてよい。
【0013】本明細書で述べる本発明の実施の形態は、
幾つかの基準を用いてデータのブロックを分類し、その
後、データの内容を考慮して分類を更新することによ
り、画像データを区分する方法及び装置である。示され
るように、ブロック18は、ステップ210で示される
ように得られ、ステップ220で示されるように分類さ
れる。本発明の好ましい実施の形態では、ブロック18
は、まず、UNIFORM(均一)、SMOOTH(平滑)、WEAK#ED
GE(弱エッジ)、又はEDGE(エッジ)のいずれかに分類
され、そのコンテキストがTEXT(テキスト)又はPICTUR
E(ピクチャー)のいずれかとして与えられる。次に、
ブロックは、最初の分類及びコンテキストによって、SM
OOTH又はEDGEのいずれかに再分類される。次に、ステッ
プ230で示されるように、ブロック18内のピクセル
が区分される、即ち、そのブロックの分類のされ方に最
も適した基準に従って上位プレーン12又は下位プレー
ン14のいずれかに配置される。この処理は、ピクセル
マップ10全体が処理されるまで、元のピクセルマップ
10内の各ブロック18について繰返される。次に、ス
テップ240で示されるように、上位プレーン12、下
位プレーン14、及びセレクタプレーン16は、各々に
含まれるデータのタイプに最も適した技術を用いて、別
々に圧縮される。
【0014】次に図4に戻り、好ましい実施の形態の説
明を続ける。上述されたステップ220におけるブロッ
ク18の4つのカテゴリの1つへの分類は、好ましくは
3つのステップで完了する。まず、ステップ310で示
されるように、ブロック内のピクセル値のばらつきが決
定される。ブロックのばらつきは、後で図6を参照して
詳細を述べる統計的な尺度を用いることによって最もよ
く決定される。一貫して大きなばらつきを有するブロッ
クは、実際には画像のエッジに沿っている場合が最も多
く、一方、ばらつきが少ないブロックは、均一か又は少
なくとも平滑な領域にあることが推定される。ステップ
320で示されるように、ブロック内のばらつきを測定
することによって、そのブロックに最初の分類が指定さ
れる。次に、ステップ330で示されるように、各ブロ
ック18内の画像データが詳細に検討され、コンテキス
ト情報(即ち、その領域がテキスト内にあるか、又は画
像のピクチャー領域であるか)が更新され、必要であれ
ばブロック再分類が行われる。UNIFORMブロックはSMOOT
Hに再分類され、WEAK EDGEブロックはTEXTのコンテキス
トにおいてはEDGEにアップグレード(格上げ)され、PI
CTUREのコンテキストにおいてはSMOOTHに再分類され
る。また、ピクセルマップ10にローパスフィルタを適
用することによって、画像の平滑化バージョン20が与
えられる。平滑化画像20は、分類中に付加的な情報を
与えるとともに、ハーフトーン領域についてのスクリー
ン解除データを与えるために、元の画像データと関係し
て用いられる。
【0015】図5は、図3のステップ230で与えられ
る、ブロック18が2つのプレーンに区分される方法の
詳細を示す。測定は、まず、ステップ410で、処理中
のブロックがステップ220で最初にEDGEに分類された
か否かを決定することによって開始する。そうである場
合は、ブロック内の個々のピクセル値vpが、まず、輝
度閾値tsと比較され、ts以上の値を有するピクセルは
“明”ピクセルとみなされ、ts未満の値を有するピク
セルは“暗”ピクセルとみなされる。EDGEブロックの区
分は、単純に、ステップ440で示されるように暗ピク
セルを上位プレーン12に配置し、ステップ450で示
されるように明ピクセルを下位プレーン14に配置す
る。ステップ410で、ブロック18がEDGEではないと
決定された場合は、ブロック内の全ピクセルが、1ピク
セルずつではなく、一緒に処理される。SMOOTH(EDGEで
はない)ピクセルの区分は次のように行われる。ブロッ
ク18が、SMOOTHに分類されたブロックのショートラン
の真中にあり、更に、このショートラン中の全てのブロ
ックが暗(vp<ts)である場合は、そのブロック内の
全データが上位プレーン12に配置される。ブロック1
8全体が実質的に平滑である(即ち、ロングラン中に存
在する)か、又は明である(明ピクセルのショートラン
中に存在する)場合は、ブロック18内の全データは下
位プレーン14に配置される。
【0016】前に示したように、セレクタプレーン16
は、指定された分類に基づいてピクセルが上位及び下位
プレーンに配置されるときに、元のデジタル画像データ
セットの各ピクセルがどこに存在するか記録するために
生成される。図10をみると、本発明の好ましい実施の
形態では、セレクタプレーン16は、ブロック分類を行
う必要なしに、生成されてもよい。示されるように、本
発明のこの実施の形態は、閾値処理部902、及びセレ
クタプレーン16以外の生成される各プレーンのための
前処理部を含む。前述したように、本発明は、セレクタ
プレーン16に加えて2つのプレーンを生成するものと
して説明される。従って、2つの前処理部、即ち上位プ
レーン12を生成するための前処理部904、及び下位
プレーン14を生成するための前処理部906が示され
ている。
【0017】セレクタプレーン16に配置され二値エン
トリーを有するブロックは、元のピクセル値と輝度閾値
との比較によって、ブロック18から直接検出される。
図示されるように、ブロック18は閾値処理部902に
入力され、閾値処理部902は、ブロック18に対応す
るセレクタプレーン16の部分についてセレクタブロッ
クを生成する。閾値処理部902は閾値を含む。ブロッ
ク18内の、この閾値より上のピクセル値は全て、一方
のプレーンに配置されるように指定され、この閾値より
下の値は他方のプレーンに配置される。セレクタブロッ
ク内の、ブロック18からのピクセルが一方のプレーン
に配置された位置にあたるロケーションに、ゼロが配置
される。セレクタブロック内の、ピクセルが他方のプレ
ーンに配置された位置にあたるロケーションに、1が配
置される。
【0018】一旦、閾値処理が行われると、前処理部9
04及び906で、セレクタブロック及びブロック18
が一緒に処理される。セレクタブロックによって上位プ
レーン12に配置するように選択されなかったブロック
18内のピクセルは、前処理部904によって除去され
る。従って、前処理部904は、上位プレーン12につ
いて、下位14プレーンに配置されるように指定された
セレクタブロック上の位置に当たるブロック18内の全
てのピクセルを除去することになる。同様に、前処理部
906は、下位プレーン14について、セレクタブロッ
クに従って上位プレーン12と関連づけられたブロック
18内のピクセルを除去する。ピクセルの除去は、一般
的に、これらのピクセルの値を所定の値で置換すること
によって、又はブロック18内に存在するピクセルから
計算された値でこれらのピクセルの値を置換することに
よって、遂行される。引き続き図10を参照すると、本
発明の別の実施の形態に従って、輝度閾値tsの選択
は、既に処理され、上位プレーン12、セレクタプレー
ン16、及び下位プレーン14に配置されたブロックの
内容を解析することによって遂行される。詳細には、こ
の解析は、全体的なビット伝送速度R、及び多重プレー
ン手法を用いるブロックの圧縮によって生じる全体的な
歪みDを集めることを含む。ビット伝送速度Rは、ブロ
ックを全プレーンについて符号化するのに費やされるビ
ット数に関係する。歪みDは、全プレーンを圧縮及び伸
張し、元のブロックの近似を再構成することによって生
じる歪みである。所与のブロックについての全体的な伝
送速度及び歪みは、正確に測定しても、又は上位、下
位、及びセレクタプレーン内の対応するブロックの内容
から単純に概算してもよい。本発明の1つの実施の形態
では、tsは、コスト関数J=R+KDが最小となるよ
うに選択される。Kの値は、所定の値であっても、又は
sによって生成されるR及びDの全ての値から計算さ
れてもよい。当業者は認識するように、全ての点で関数
計算をせずに関数の最小値を求めることを目的とする最
適化及び数学的探索技術を適正に使用するならば、ts
の全ての値についてJを計算する必要はないかもしれな
い。tsが画像ピクセルの範囲の最小値又は最大値をと
る場合は、セレクタプレーン16は均一になることに注
意されたい。言い換えれば、tsを極値(即ち最大値又
は最小値)に設定すると、閾値処理は遂行されない(即
ち、全ピクセルが上位又は下位プレーンの一方と関連づ
けられる)。
【0019】本発明の1つの実施の形態に従い、全体的
なビット伝送速度Rは、3つのプレーンの伝送速度の合
計として定義され、セレクタプレーン16を圧縮するこ
とによって得られるビット伝送速度は、ブロック内で検
出される水平遷移Nt(1から0、及びその逆)の数か
ら概算される。
【0020】本発明の別の実施の形態に従い、ブロック
のピクセル強度の平均値taが計算される。元のブロッ
クの分散Voが、次のコスト関数と比較される。 CF=aVu+bVl+cNt
【0021】式中、a、b、cはこの方法の微調整に用
いられる所定の定数であり、Vu及びVlはそれぞれ上位
及び下位プレーン内の対応するブロック(閾値処理及び
前処理後)の分散である。Vo>CFの場合は、閾値は
s=taに設定される。そうでない場合は、閾値は、例
えばts=0、ts=255のように1つの極値に設定され
るので、セレクタプレーンは均一となり、入力ブロック
内の全ピクセルが下位(上位)プレーンと関連づけられ
る。
【0022】次に、図6に移り、ステップ310(図
4)で必要な、ブロックのばらつきの測定を用いた最初
のブロック分類が遂行されてもよい、本発明の1つの実
施の形態の詳細を述べる。まず、ステップ510で示さ
れるように、ブロックを2つの部分に分けるための閾値
sが計算される。本発明の好ましい実施の形態では、
この閾値はブロック内のデータのヒストグラム解析を行
うことによって得られるが、この解析を行うために多く
の標準的な方法を用いることができる。例えば、分離に
用いられる基準間の距離を最大化するか、又はブロック
の2つの部分の間の最大分離を与える値を選択すること
ができる。最良の閾値を選択する他の方法も使用可能で
あり、本発明はこの実施の形態に限定されないことを、
当業者は認識するであろう。次に、ステップ520で示
されるように、ブロック18は、各ピクセルの光強度値
を選択された閾値tsと比較することにより、これらの
2つの部分へと閾値処理される。前述したように、ピク
セル値vpが閾値より小さい場合は、そのピクセルは暗
であるとされる。vpがtsより大きいか又は等しい場合
は、そのピクセルは明である。
【0023】先に述べたように、元の画像データにロー
パスフィルタを適用することによって、その画像の平滑
化バージョン20が得られる。次に、元の画像データ及
び平滑化された画像データの両方の組について、明ピク
セル及び暗ピクセルについての平均値が得られる。まず
明ピクセルをみると、ステップ540で示されるよう
に、元のピクセルマップ10(vp≧ts)内の、ブロッ
ク18にカバーされる領域に位置する全ての明ピクセル
の平均値である1つの値、vBPIXELが計算される。ま
た、ステップ560で示されるように、もう1つの値v
BSMOOTH、即ち、画像の平滑化バージョン20内の、ブ
ロック18にカバーされる領域に位置する全ての明ピク
セルの平均値も得られる。暗値も同様に計算される。つ
まり、ステップ550で示されるように、元のピクセル
マップ10(vp<ts)内の、ブロック18にカバーさ
れる領域に位置する全ての暗ピクセルの平均値であるv
DPIXELが得られ、ステップ570で示されるように、画
像の平滑化バージョン20内の、ブロック18にカバー
される領域に位置する全ての暗ピクセルの平均値である
DSMOOTHが得られる。一旦、これらの平均値が得られ
ると、ステップ580で示されるように、ピクセルマッ
プ10及び平滑化された画像20のそれぞれについての
明るい方の平均と暗い方の平均との間の距離d及びds
が計算される。即ち、d=vBPIXEL−vDPIXEL、及びd
s=vBSMOOTH−vDSMOOTHである。コントーン画像につ
いてはd/dsは典型的にほぼ1に等しいので、d/ds
比率はハーフトーンの検出に用いられてもよい。
【0024】図7は、最初にブロック18を分類するた
めの処理の好ましい実施の形態である図4のステップ3
20の詳細図である。ステップ610で示されるよう
に、ブロックがコントーンデータ(d≒ds)を含むか
ハーフトーンデータを含むかを決定するために、dとd
sとの相対比が得られる。ブロック18は、距離d又は
sの大きさに従って、最初に4つのタイプ、UNIFORM、
SMOOTH、WEAK EDGE、又はEDGEの1つに分類される。距
離dはコントーンブロックを分類するのに用いられ、距
離dsはハーフトーンに用いられる。コントーンデータ
については、ステップ620で示されるように、ピクセ
ルマップ10からの値dが値x0と比較される。
【0025】dが非常に低い(即ちd<x0)場合は、
ブロック内の全てのピクセル値が実質的に同じであるの
で、ブロックはステップ640でUNIFORMに分類され
る。ステップ622で示されるように、x0<d<x1
ようにブロック内のピクセル値に多少の小さな差異があ
る場合は、そのブロックはステップ650でSMOOTHに分
類される。ブロック内のピクセル値にかなり大きな差異
があり、ステップ624でx1<d<x2である場合は、
そのブロックはWEAK EDGEに分類される。ブロック内の
差異が非常に大きく、ステップ624でd≧x2である
場合は、そのブロックはステップ670でEDGEに分類さ
れる。
【0026】d/dsがほぼ1に等しい値にならない場合
は、ステップ630で、dsが閾値y0と比較される。ハ
ーフトーンとコントーンとに2つの異なる組の閾値が適
用されることに注意されたい。従って、ほとんどの場
合、x0≠y0、x1≠y1、及びx2≠y2である。ハーフ
トーンブロックの分類に用いられる処理は、コントーン
データに用いられる処理と似ている。従って、ステップ
630でds<y0である場合は、そのブロックはステッ
プ640でUNIFORMに分類される。ステップ632でy0
<ds<y1である場合は、そのブロックはステップ65
0でSMOOTHに分類される。ステップ634で示されるよ
うにy1<ds<y2である場合は、そのブロックはステ
ップ660でWEAK EDGEに分類される。ステップ634
でds≧y2である場合は、そのブロックはステップ67
0でEDGEに分類される。
【0027】次に、図8及び9を参照し、ブロックのコ
ンテキストを更新するための詳細が与えられる。ブロッ
クのコンテキストは、ブロックの暗領域と明領域との間
の平均差が比較的高い場合に有用である。この場合、ブ
ロックは、そのコンテキストがTEXTである限りにおいて
は、EDGEに分類できる。コンテキストは最初はPICTURE
に設定される。次の2つの規則のうちの1つが満足され
るとコンテキストはTEXTに変更される。即ち、(1)処
理中のブロックが複数のUNIFORMブロックのロングラン
の中にあり、ブロック内の暗ピクセル値の平均が所定の
輝度閾値よりも大きい、又は(2)そのブロックがUNIF
ORM、WEAK EDGE、又はEDGEのいずれかに分類されてお
り、上、左、又は右に隣接するブロックのうちの1つが
TEXTに設定されたコンテキストを有し、その隣接するブ
ロックと現在のブロックとの差が所定の伝搬閾値より小
さい。
【0028】まず図8をみると、ブロックのコンテキス
トが第1規則に従って変更されるべきか否かの決定に
は、ステップ704で示されるように、UNIFORMに分類
されているブロックのランを検出する必要がある。UNIF
ORMブロックのランの検出では、典型的には、ステップ
706で示されるように、連続したUNIFORMブロックの
数とランレングス閾値tLUとの比較を行う。ランレング
ス閾値は、ランが確立されるためにUNIFORMに分類され
なければならない連続ブロックの数を設定する。また、
ステップ706で示されるように、連続ブロックについ
て、暗ピクセルの平均値vDPIXELが、輝度閾値tsと比
較される。高い輝度レベルを有する多数の連続UNIFORM
ブロックは、通常、ブロックが大きな背景ページ領域
(即ち、大きな白い領域)を含むことを示し、それによ
り、テキストの存在を示す。従って、連続UNIFORMブロ
ック数がtluを越えるとともにvDPIXEL>tsである場
合は、ステップ708で示されるように、そのブロック
について、コンテキストがTEXTに変更される。
【0029】識別された連続ブロックの数がランの確立
には少なすぎるか、又はブロックが暗(vDPIXEL
s)であるかのいずれかの場合は、コンテキストはPIC
TUREに設定されたままになる。ステップ710で示され
るように、ブロック内に更にランが存在するか否かが決
定され、そうである場合は図中に示されるように処理が
繰返される。
【0030】次に図9をみると、第2規則の下でブロッ
クのコンテキストをTEXTに変更するには、まず、伝搬閾
値tpを与える必要がある。伝搬閾値は、ブロックが空
白ページ領域をカバーしていることを示す輝度のレベル
を定める。第2規則の下で、ステップ802で示される
ようにブロックがSMOOTHではなく(即ち、UNIFORM及びE
DGE又はWEAK EDGEであり)、ステップ804で示される
ように上、左、又は右隣のいずれかがテキストのコンテ
キストを有し、尚且つステップ806で示されるよう
に、そのブロック内の明ピクセルとコンテキストがテキ
ストである隣接ブロック内の明ピクセルとの平均差異v
BDIFがtpより小さい場合は、ステップ808でコンテ
キストがピクチャーからテキストに変更される。テキス
トを含むブロックはテキストを含む別のブロックの隣に
位置することが推定されるので、隣接するブロックがチ
ェックされる。しかしながら、そうであることを確認す
るためには、そのブロックの輝度の値が隣接ブロックの
輝度の値と比較される。言い換えれば、たとえブロック
がテキストのコンテキストを有するブロックと隣接して
いても、そのブロックと隣接ブロックとの平均輝度の差
異が大きければ、そのブロックが、テキストの存在を示
す大きな空白ページ領域を含まないことを意味する。
【0031】繰返すが、本発明は、まず画像のエッジを
含むブロックを識別し、次に、平滑なデータ及びエッジ
の明るい側を含むブロックが下位プレーンに配置され、
エッジの暗い側が上位プレーンに配置されるようにブロ
ックを分けることによる、データの区分に関する。一
旦、それぞれのプレーンが生成されると、通常のMRC
処理が続く。つまり、各プレーンが適切な圧縮技術を用
いて圧縮される。本明細書における好ましい実施の形態
では、上位プレーン12及び下位プレーン14はJPE
Gを用いて圧縮され、セレクタプレーン16は、CCITT
グループIVか、又は本明細書にその内容を参照として援
用する1998年7月7日発行のデービス(Davis)の米国特許
第5,778,095号に記載されているような走査されたシン
ボルの同等のクラスへの分類方法のような、シンボルベ
ースのパターン照合技術を用いて圧縮される。次に、プ
レーンは共に結合され、ファクシミリ装置や記憶装置の
ような出力装置へと送信される。
【0032】本発明の好ましい実施の形態では、これら
の任意の又は全ての方法は、機械によって実行され得る
1組の命令を格納する能力があるコンピュータ又は任意
の他の装置で実現されてもよい。プログラム記憶装置
は、添付の図面を参照して上記に詳細を述べた方法で文
書画像を圧縮するための上述のステップを行うためのこ
の1組の命令(ソフトウェアプログラムと呼ばれること
が最も多い)を、目に見える形で具体化するであろう。
【図面の簡単な説明】
【図1】複合画像と、そのような画像が上位プレーン、
下位プレーン、及びセレクタプレーンの3つのMRC画
像プレーンに分解され得る方法の例を示す図である。
【図2】ピクセルマップと、ピクセルがグループ化され
てブロックを形成する方法の詳細を示す図である。
【図3】本発明を実施するために行われるステップを概
括的に示すフロー図である。
【図4】本発明に従ってブロックが分類される方法の詳
細を示すフロー図である。
【図5】本発明に従ってブロックがその分類に基づいて
区分される方法の詳細を示すフロー図である。
【図6】図4に示されている本発明の実施の形態の必要
に応じて、ブロックのばらつきを測定できる方法の1つ
の実施の形態の詳細を示すフロー図である。
【図7】図6で与えられるブロックのばらつきの測定に
基づくブロックの分類を説明する、本発明の実施の形態
の詳細を示すフロー図である。
【図8】図7で与えられるブロックの分類に基づいてコ
ンテキストが更新されてもよい、本発明の実施の形態の
詳細を示すフロー図である。
【図9】図7で与えられるブロックの分類に基づいてコ
ンテキストを更新するための、本発明の別の実施の形態
の詳細を示すフロー図である。
【図10】本発明に従ってセレクタプレーンを生成する
1つの方法の詳細を示す図である。
【符号の説明】
10 ピクセルマップ 12 上位プレーン 14 下位プレーン 16 セレクタプレーン 18 ブロック 902 閾値処理部 904 前処理部 906 前処理部
フロントページの続き (72)発明者 ジガン ファン アメリカ合衆国 14580 ニューヨーク州 ウェブスター ヨークタウン ドライブ 153 (72)発明者 トラック ディー.トラン アメリカ合衆国 21044 メリーランド州 コロンビア リトル パタクセント パ ークウエイ 12225 ナンバーエル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 混合ラスタコンテント処理のためのデジ
    タル画像データ区分方法であって、 a)離散的ロケーションの光強度信号で構成されるデジタ
    ル画像データのブロックを得るステップと、 b)前記ブロックについて閾値を計算するステップと、 c)どの前記光強度信号が前記閾値を超え、どの前記光強
    度信号が前記閾値より低いかを示すセレクタブロックを
    生成するステップと、 を有する、デジタル画像データ区分方法。
JP34267999A 1998-12-21 1999-12-02 デジタル画像データ区分方法 Expired - Fee Related JP4242532B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US217138 1994-03-22
US09/217,138 US6373981B1 (en) 1998-12-21 1998-12-21 Method and apparatus for segmenting data to create mixed raster content planes

Publications (2)

Publication Number Publication Date
JP2000196895A true JP2000196895A (ja) 2000-07-14
JP4242532B2 JP4242532B2 (ja) 2009-03-25

Family

ID=22809807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34267999A Expired - Fee Related JP4242532B2 (ja) 1998-12-21 1999-12-02 デジタル画像データ区分方法

Country Status (2)

Country Link
US (1) US6373981B1 (ja)
JP (1) JP4242532B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003348360A (ja) * 2002-04-25 2003-12-05 Microsoft Corp 文書エンコーディングシステム、文書デコーディングシステムおよびその方法
JP2006311200A (ja) * 2005-04-28 2006-11-09 Ricoh Co Ltd 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
JP2008004093A (ja) * 2006-06-22 2008-01-10 Xerox Corp 画像データ編集システム及び方法
US7706618B2 (en) 2005-11-02 2010-04-27 Sharp Kabushiki Kaisha Image coding apparatus, image coding method, and recording medium, capable of creating highly versatile data
WO2012029398A1 (ja) * 2010-09-03 2012-03-08 株式会社日立製作所 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69830583T2 (de) * 1998-09-22 2006-06-01 Hewlett-Packard Development Co., L.P., Houston Verfahren und Vorrichtung zur Verarbeitung von Bilddaten
US6873723B1 (en) * 1999-06-30 2005-03-29 Intel Corporation Segmenting three-dimensional video images using stereo
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US6731814B2 (en) * 2000-05-01 2004-05-04 Xerox Corporation Method for compressing digital documents with control of image quality and compression rate
US7342609B2 (en) * 2000-05-09 2008-03-11 Eastman Kodak Company Exposure adjustment in an imaging apparatus
US6701012B1 (en) * 2000-07-24 2004-03-02 Sharp Laboratories Of America, Inc. Out-of-layer pixel generation for a decomposed-image layer
US7027647B2 (en) * 2001-12-31 2006-04-11 Hewlett-Packard Development Company, L.P. Coder matched layer separation for compression of compound documents
EP1502443A1 (en) * 2002-04-23 2005-02-02 Koninklijke Philips Electronics N.V. Digital image processing method for low-rate applications
US7110137B2 (en) * 2002-04-30 2006-09-19 Microsoft Corporation Mixed raster content files
US7227988B2 (en) * 2002-07-01 2007-06-05 Xerox Corporation Prioritized PDL segmentation producing two bit selector
US7308136B2 (en) * 2002-07-01 2007-12-11 Xerox Corporation Weak edge repositioning in a MRC segmentor
US7312898B2 (en) * 2002-10-31 2007-12-25 Hewlett-Packard Development Company, L.P. Transformation of an input image to produce an output image
US7336400B2 (en) * 2002-10-31 2008-02-26 Hewlett-Packard Development Company, L.P. Transforming an input image to produce an output image
US7301674B2 (en) * 2002-10-31 2007-11-27 Hewlett-Packard Development Company, L.P. Translation of an input pixel value to an output pixel value
US7715640B2 (en) * 2002-11-05 2010-05-11 Konica Minolta Business Technologies, Inc. Image processing device, image processing method, image processing program and computer-readable recording medium on which the program is recorded
US7283674B2 (en) * 2004-06-25 2007-10-16 Xerox Corporation Using graphic objects in MFD scan-to-export function
US8086050B2 (en) 2004-08-25 2011-12-27 Ricoh Co., Ltd. Multi-resolution segmentation and fill
US7466873B2 (en) * 2005-06-29 2008-12-16 Xerox Corporation Artifact removal and quality assurance system and method for scanned images
US20070046694A1 (en) * 2005-08-24 2007-03-01 Tamar Aizikowitz System and method for image customization
JP4771804B2 (ja) * 2005-12-20 2011-09-14 富士通株式会社 レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
US7889932B2 (en) * 2006-03-02 2011-02-15 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US8630498B2 (en) * 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US7792359B2 (en) * 2006-03-02 2010-09-07 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US7724973B2 (en) * 2006-05-15 2010-05-25 Cisco Technology, Inc. Methods and apparatuses for processing data representing a visual frame
US7801356B2 (en) * 2006-05-15 2010-09-21 Cisco Technology, Inc. Methods and apparatuses for generating compressed data representing a visual frame
US7864365B2 (en) * 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US8437054B2 (en) 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US7876959B2 (en) * 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
US7899247B2 (en) 2007-01-24 2011-03-01 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US8121403B2 (en) * 2007-10-30 2012-02-21 Sharp Laboratories Of America, Inc. Methods and systems for glyph-pixel selection
US10038902B2 (en) * 2009-11-06 2018-07-31 Adobe Systems Incorporated Compression of a collection of images using pattern separation and re-organization
US8144355B2 (en) 2009-12-24 2012-03-27 Xerox Corporation Method and apparatus for improving raster image processing performance for variable information printing having reusable objects
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
JP5742427B2 (ja) * 2011-04-25 2015-07-01 富士ゼロックス株式会社 画像処理装置
US9230161B2 (en) 2013-12-06 2016-01-05 Xerox Corporation Multiple layer block matching method and system for image denoising

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1268547A (en) 1986-03-31 1990-05-01 Ahmed Mostafa El-Sherbini Thresholding algorithm selection apparatus
US5014124A (en) 1988-02-25 1991-05-07 Ricoh Company, Ltd. Digital image processing apparatus
DE3881392T2 (de) 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
US5060980A (en) 1990-05-30 1991-10-29 Xerox Corporation Form utilizing encoded indications for form field processing
US5251271A (en) 1991-10-21 1993-10-05 R. R. Donnelley & Sons Co. Method for automatic registration of digitized multi-plane images
US5303313A (en) 1991-12-16 1994-04-12 Cartesian Products, Inc. Method and apparatus for compression of images
US5432870A (en) 1993-06-30 1995-07-11 Ricoh Corporation Method and apparatus for compressing and decompressing images of documents
JP2720924B2 (ja) 1993-09-21 1998-03-04 富士ゼロックス株式会社 画像信号の符号化装置
JPH07220091A (ja) 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5825929A (en) 1995-10-05 1998-10-20 Microsoft Corporation Transformation block optimization method
US5790269A (en) * 1995-12-12 1998-08-04 Massachusetts Institute Of Technology Method and apparatus for compressing and decompressing a video image
US6072830A (en) * 1996-08-09 2000-06-06 U.S. Robotics Access Corp. Method for generating a compressed video signal
US5778092A (en) 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents
US5767978A (en) 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system
US6006226A (en) * 1997-09-24 1999-12-21 Ricoh Company Limited Method and system for document image feature extraction
US6038346A (en) * 1998-01-29 2000-03-14 Seiko Espoo Corporation Runs of adaptive pixel patterns (RAPP) for lossless image compression

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003348360A (ja) * 2002-04-25 2003-12-05 Microsoft Corp 文書エンコーディングシステム、文書デコーディングシステムおよびその方法
JP2006311200A (ja) * 2005-04-28 2006-11-09 Ricoh Co Ltd 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
JP4618676B2 (ja) * 2005-04-28 2011-01-26 株式会社リコー 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
US7706618B2 (en) 2005-11-02 2010-04-27 Sharp Kabushiki Kaisha Image coding apparatus, image coding method, and recording medium, capable of creating highly versatile data
JP2008004093A (ja) * 2006-06-22 2008-01-10 Xerox Corp 画像データ編集システム及び方法
WO2012029398A1 (ja) * 2010-09-03 2012-03-08 株式会社日立製作所 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置

Also Published As

Publication number Publication date
JP4242532B2 (ja) 2009-03-25
US6373981B1 (en) 2002-04-16

Similar Documents

Publication Publication Date Title
JP4242532B2 (ja) デジタル画像データ区分方法
JP4295882B2 (ja) デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法
EP1173003B1 (en) Image processing method and image processing apparatus
US9135722B2 (en) Perceptually lossless color compression
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
US7343046B2 (en) Systems and methods for organizing image data into regions
US7158669B2 (en) Image compression method and apparatus, and image coding method and apparatus
US5778092A (en) Method and apparatus for compressing color or gray scale documents
US6307962B1 (en) Document data compression system which automatically segments documents and generates compressed smart documents therefrom
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
US8103104B2 (en) Text extraction and its application to compound document image compression
US20040017579A1 (en) Method and apparatus for enhancement of digital image quality
US20070189615A1 (en) Systems and Methods for Generating Background and Foreground Images for Document Compression
JP2004173276A (ja) デシジョン面生成方法、画像データ画素区分方法及びカラードキュメント区分方法
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
JP4035456B2 (ja) 画像圧縮方法、画像圧縮装置
EP1006717B1 (en) Method and apparatus for segmenting data
KR100514734B1 (ko) 디지털 화질 개선방법 및 장치
KR100484170B1 (ko) 디지털 화질 개선방법 및 장치
JPH07104932B2 (ja) 文字画像データの作成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees