JP4347625B2 - 限られたディスプレイ用にディジタル画像ファイルを発生する方法及びシステム - Google Patents

限られたディスプレイ用にディジタル画像ファイルを発生する方法及びシステム Download PDF

Info

Publication number
JP4347625B2
JP4347625B2 JP2003207569A JP2003207569A JP4347625B2 JP 4347625 B2 JP4347625 B2 JP 4347625B2 JP 2003207569 A JP2003207569 A JP 2003207569A JP 2003207569 A JP2003207569 A JP 2003207569A JP 4347625 B2 JP4347625 B2 JP 4347625B2
Authority
JP
Japan
Prior art keywords
image
display
file size
size
error diffusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003207569A
Other languages
English (en)
Other versions
JP2004140792A (ja
Inventor
ルオ ジエボ
ブラウン ガスタヴ
パパン クリストフ
Original Assignee
イーストマン コダック カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーストマン コダック カンパニー filed Critical イーストマン コダック カンパニー
Publication of JP2004140792A publication Critical patent/JP2004140792A/ja
Application granted granted Critical
Publication of JP4347625B2 publication Critical patent/JP4347625B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Color Television Systems (AREA)
  • Processing Of Color Television Signals (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はディジタルイメージングの分野に係り、更に特定的には色値の限られたパレットを用いてディジタルカラー画像を表現するためのディジタルファイルを発生する方法に関する。
【0002】
【従来の技術】
多くのカラー画像出力装置は、入力ディジタル画像中の全ての色が限られたビット深度を有するメモリバッファに格納されねばならないため、入力ディジタル画像中の全ての色を表示することは可能ではない。同様に、画像の送信に必要な帯域幅の量、又は画像を格納するのに必要なメモリの量を減少させるために、より少ないビット深度を用いて画像を表現することが望ましいことがある。例えば、多くのコンピュータは、例えばCRT又はLCD画面といったソフトコピーディスプレイ上に表示されるべき画像を格納するために8ビット又は16ビットの色表現を使用しうる。このような表現は、それぞれ、256又は65536の固有の色値のみを許す。これは、多くのディジタルイメージング適用において従来使用されてきた典型的な24ビットのカラー画像に関連する16777216の可能な色値よりもかなり少ない。
【0003】
より少ない数の色を用いて入力画像を表現することが必要な適用では、より少ない色の組に含まれるべき色の組を決定することが必要である。幾つかの場合、より少ない色の組は、符号化されている特定の画像とは独立に時間的に先行して決定されうる。例えば、3ビットの色情報(8つの異なるレベル)は、画像の赤チャネル及び緑チャネルのために使用されえ、2ビットの色情報(4つの異なるレベル)は画像の青チャネルのために使用されうる。これにより、8ビット表現を用いて入力画像を表現するために使用されうる8×8×4=256の異なる色値の格子が生成される。入力ディジタル画像は、対応するRGBチャネルの夫々の最上位の2ビット又は3ビットをとることにより、8ビット表現へ単純に変換されうる。結果として、多くの状況において画像中に可視の輪郭を生じさせうる量子化誤差を有する画像が発生する。この色パレットは、3−3−2パレットと称され、例えばエリクソンT68携帯型電話機といった多くの無線装置で用いられる。
【0004】
ビット深度が低くされた画像において量子化誤差の可視性を最小限とするための1つの方法は、色値の局所平均を保つためにマルチレベル・ハーフトーニング・アルゴリズムを用いるものである。非特許文献1には、カラー画像の量子化及びマルチレベル・ハーフトーニングのための様々な方法が記載されている。一つの一般的に用いられるマルチレベル・ハーフトーニング方法は、誤差拡散と称されるものである。誤差拡散の詳細については後述する。
【0005】
無線通信では、通常は、空気を通じて伝送され目標とされる無線装置によって受信されるべきファイルのサイズについての制限がある。例えば、現在の無線通信規格は、ファイルサイズが3キロバイトを超えてはならないことが要求される。エリクソンT68携帯電話機の場合に、96×64画素のサイズの画像をカラー画面上に表示させようとする場合について想定する。ディジタルカラー画像が3−3−3カラーパレットによって表現され画素当たり1バイトに縮小された後でも、単純にインデックスをカラーパレットに格納するのに96×64=6144バイトを用いる。一般的には、インデックス値の誤差はインデキシング誤りによる顕著な色歪みを生じさせうるため、インデックスを不可逆的(lossy)に圧縮することは望ましくない。従って、インデックスは通常は、画像構造中の相関によるデータ冗長性を利用することにより、例えばCompuServe GIF又はPortable Network Graphics(PNG)(非特許文献2参照)、又はこれから登場するJPEG2000(非特許文献3参照)と称されるJoint Photographic Network Group推奨形式といった可逆的(lossless)ファイル形式を用いて圧縮される。更に、誤差拡散(非特許文献4参照)といったディザ処理は、視覚的により満足のいく画像を生じさせるために、表示パレットの使用による色量子化効果を軽減するために使用されることが多い。画像は小さいサイズへ縮小されているため、また、更に重要なことには、周波数応答に関しては高域通過特性を有する相関の量は誤差拡散処理によってかなり減少されているため、所望の3キロバイトよりも低いファイルサイズを得るために必要な圧縮を達成することは非常に難しくなる。一方で、帯域幅の制限を満たすために圧縮が必要である。他方で、圧縮(量子化及びリサイズを含む)は、画質を必然的に低下させる。つまり、小さいファイルサイズに対する要件と良い画質に対する要件は競合する制約条件である。
【0006】
従来のシステムは、一般的に、同様の競合する制約条件が与えられているときに良い解決策を与えることができない。2002年2月7日に公開された「異なる装置のための電子メール添付の配送を最適化するシステム及び方法(System and Methodology for Optimizing Delivery of Email Attachments for Disparate Devices)」なる名称のキラニ(Kirani)及びウィッティングトン(Wittington)による特許文献1では、異なる装置のための電子メール添付の配送を最適化するシステム及び方法を開示している。特許文献1では、受信者側クライアント装置の種類の能力に対して添付画像のサイズを比較し、添付物が特定の使用されている受信者側装置には負担が重いか、圧倒的に大きいかと判断されると、これらの添付物の元の形式の配送を阻止する。これらの添付物が受信者側装置の無線帯域及び/又は表示特徴の能力を過度に使用する場合、元の添付物は単にメッセージから取り除かれ、ネットワークメディア共用レポジトリに保存され、このレポジトリはその記憶アドレスを参照するリンク(例えばURL)を介してアクセスされうる。受信者は、自分たちのハンドヘルド型装置の種類を指定し、この種類の添付物の変形物を受信することを選びうる。受信者が以前に多数の種類のクライアント装置を使用し指定していた場合、特許文献1では、これらの一組の多数の装置のうち最も能力の低いものに対応する現在の添付物に対して変形を適用する。明らかに、この処理は厄介であり、最も能力の低い装置が全ての装置についての画質を決定することとなる。
【0007】
【特許文献1】
米国特許出願公開第2002/0016818号明細書
【特許文献2】
米国特許第5,710,833号明細書
【特許文献3】
米国特許第5,901,245号明細書
【非特許文献1】
アール・エス・ジェンタイル(R.S.Gentile)、イー・ワロウィット(E.Walowit)及びジェイ・ピー・アレバック(J.P.Allebach)著、「オリジナルに近い画質のためのカラー画像の量子化及びマルチレベルハーフトーニング(Quantization and multilevel halftoning of color images for near original image quality)」、米国光学会誌(J. Opt. Soc. Am.)、1990年、A7,p.1019−1026
【非特許文献2】
ポータブル・ネットワーク・グラフィックス(Portable Network Graphics)(PNG)、[online]、インターネット<http://www/w3/org/Graphics/PNG>
【非特許文献3】
JPEG2000、[online]、インターネット<http://www/jpeg.org>
【非特許文献4】
ピー・ジー・ロートリング(P.G.Roetling)及びアール・ピー・ロース(R.P.Loce)、「ディジタル画像平滑化及びシグマフィルタ(Digital Image Smoothing and the Sigma Filter)」、イー・ドウアティー(E.Dougherty)編「ディジタル画像処理方法(Digital Image Processing Methods)」、(米国、ニューヨーク)、マーセル・デッカー(Marcel Dekker)出版、1994年
【非特許文献5】
エル・リー(L.Lee)著、「ディジタル画像平滑化及びシグマフィルタ(Digital Image Smoothing and Sigma Filter)」、コンピュータビジョン・グラフィックス・画像処理(Computer Vision, Graphics, Image processing)第24巻、p.189−198,1983年4月
【非特許文献6】
ジェイ・ルオ(J. Luo)、シー・ダブリュ・チェン(C.W.Chen)、ケイ・ジェイ・パーカー(K.J.Parker)及びティー・エス・ファン(T.S.Huan)著、「低ビットレート圧縮画像のアーティファクト除去(Artifacts removal in low bit rate compressed images)」、IEEE画像処理に関する議事録(IEEE Trans. Image Processing)、第5号、1996年、p.1363−1368
【非特許文献7】
ビー・ヘイセル(B.Heisele)、ティー・ポッジオ(T.Poggio)、エム・ポンティル(M.Pontil)著、「静止グレー画像における顔検出(Face Detection in Still Gray Imges)」、MIT 人工知能研究所(MIT Artificial Intelligence Lab)、メモ1687、2000年5月
【発明が解決しようとする課題】
表示パレットを用いる、元の画像解像度よりも低い表示解像度を有する表示装置であって、伝送路もまた最大ファイルサイズに制限を課す表示装置上での表示のために、ディジタル画像を表現及び圧縮する方法を提供することが必要とされている。
【0008】
【課題を解決するための手段】
本発明は、上述の1つ又はそれ以上の問題を解決することを目的とする。概して、本発明の1つの面によれば、本発明は、ディジタル画像の解像度よりも低い表示解像度を有し、ディジタル画像を表現するために表示パレットを用い、最大ファイルサイズに制限を与える伝送路に接続される表示装置上での表示のためにディジタル画像を表現し圧縮する方法に関連する。方法は、(a)ディスプレイのサイズとされたディスプレイサイズ画像を生成するためにディジタル画像を表示解像度にリサイズする段階と、(b)誤差拡散されたディスプレイサイズ画像を生成する、初期誤差拡散率を有する誤差拡散処理により、ディスプレイサイズ画像を表示パレットへ量子化する段階と、(c)特定のファイルサイズを有する圧縮されたディスプレイサイズ画像を生成するために、誤差拡散されたディスプレイサイズ画像を可逆的に圧縮する段階と、(d)特定のファイルサイズを最大ファイルサイズと比較し、ファイルサイズが最大ファイルサイズよりも小さければ、ディスプレイサイズ画像をディスプレイへ送信する段階と、(e)特定のファイルサイズが最大ファイルサイズよりも大きいが最大ファイルサイズよりも大きい他の所定のファイルサイズよりも小さい場合、ファイルサイズを縮小するために誤差拡散率を所定の量だけ低くし、低くされた誤差拡散率でリサイズされた画像に対して段階(a)に続く段階を繰り返す段階と、(f)特定のファイルサイズが最大ファイルサイズと所定のファイルサイズのいずれよりも大きい場合、単純化された画像を生成するために画像細部を減少させることによってリサイズされた画像を単純化し、特定のファイルサイズが最大ファイルサイズよりも小さくなるまで単純化された画像に対して段階(a)に続く段階を繰り返す段階とを含む。
【0009】
本発明の上述の及び他の面、目的、特徴、及び利点については、以下の望ましい実施例の詳細な説明及び請求の範囲を読むこと、及び添付の図面を参照することによって更に明らかに理解され認められるであろう。
【0010】
【発明の実施の形態】
表示装置で使用されるディジタルファイルを発生するアルゴリズムを用いる画像処理システムは周知であるため、本発明による方法及び装置の一部を形成するか又は本発明による方法及び装置とより直接的に協働する特性について説明する。本願で特に図示又は説明しない特性については、従来技術で知られているものから選択されうる。以下の説明では、本発明の望ましい実施例は、通常通りソフトウエアプログラムとして実施されるが、当業者はかかるソフトウエアと等価のものがハードウエア中に構築されうることを容易に認識するであろう。以下に説明する本発明による方法及びシステムが与えられているとき、本発明の実施に有用な本願に特に図示、示唆、若しくは記載されていないソフトウエアは従来通りであり、通常の技術の範囲内にある。
【0011】
本発明がコンピュータプログラムとして実施される場合、プログラムは従来のコンピュータ読み取り可能な記憶媒体に記憶されえ、記憶媒体は例えば、磁気ディスク(例えばフレキシブルディスク又はハードドライブ)又は磁気テープといった磁気記憶媒体;光ディスク、光テープ又は機械読み取り可能なバーコードといった光記憶媒体;ランダムアクセスメモリ(RAM)又は読み取り専用メモリ(ROM)といった固体電子記憶装置;又はコンピュータプログラムを記憶するために使用される任意の他の物理的な装置又は媒体を含みうる。
【0012】
表示装置で使用されるディジタルファイルを発生する1つの公知の技術は、マルチレベル・ハーフトーニングである。マルチレベル・ハーフトーニング・アルゴリズムは、局所的な平均色値が保たれるよう出力ディジタルカラー画像の画素に割り当てられたパレット値を変化させることによりパレットの色の中間である色値の見かけを作成するために使用されうる。使用されうる公知のマルチレベル・ハーフトーニング方法の例は、マルチレベルベクトル誤差拡散である。典型的なマルチレベルベクトル誤差拡散アルゴリズムを示すフローチャートを図3に示す。図3中、入力ディジタルカラー画像15のi番目の列及びj番目の行からの入力画素色値Ii,jは、出力ディジタルカラー画像18の対応する出力画素色値Oi,jを形成するためにパレット色を各画素に割り当てる(ステップ17)ことにより処理する。ステップ17においてパレット色を各画素に割り当てることにより、量子化誤差が生ずる。この誤差は、出力画素値が所定の一組のパレット色16中のパレット色のうちの1つから選択されることによるものである。差分演算30は、入力画素色値Ii,jと出力画素色値Oi,jの間のベクトル差を表わす色誤差Ei,jを計算するために用いられる。重み誤差段階32は、結果として得られる色誤差Ei,jに一連の誤差重みWi,jを適用するために用いられる。
【0013】
図4に、一組の誤差重みWi,jの例を示す。この例では、列と行のアドレスが(i,j)である現在画素40の色値Ei,jは、係数1/4で重み付けされ、列と行のアドレスが(i+1,j)である画像の現在の行の中の右の次の画素に分配される(42)。同様に、色値Ei,jはまた係数1/4で重み付けされ、列と行のアドレスが(i−1,j+1)、(i,j+1)及び(i+1,j+1)である画像の次の行の3つの画素に分配される(44)。このようにして、現在の画素40を処理するときに生ずる量子化誤差は、まだ処理されていない近傍の入力画素へ分配される。その結果、局所的な平均色値が略保たれる。
【0014】
上述のように、誤差拡散が量子化効果と共に適用されると、近傍画素への量子化誤差の再分配により量子化アーティファクトは軽減される。一般的に、100%に近い量子化誤差が再分配されたときに画像は最も良く見える。誤差拡散の率が全ての重みの和を100で乗じたものと定義される場合、望ましい目標は、できるかぎり100%に近い、例えば90%といった高い誤差拡散率を用いることである。他方、誤差拡散は、画像に対して高周波数成分を導入し、従って画像中のデータ相関の量を減少させ、結果として得られる画像を圧縮すること(即ち最大ファイルサイズの要件を満たすこと)をより困難とする。1つのトレードオフは、近傍の画素に対して拡散された誤差の割合を減少させ、それにより導入される高周波数成分の量を減少し、次にファイルサイズ要件を満たすことを可能とするためにデータ相関の量を増加させることである。所与の誤差拡散率Rにおける誤差拡散重みWi,jは、100%の率における重みを現在の誤差拡散率で乗ずることによって容易に決定されうる。しかしながら、経験則的には、量子化誤差の50%未満が分配される場合、誤差拡散の効果は単に量子化された画像にノイズを加えることへと減らされる。従って、誤差拡散率が50%へ減少され、対応するファイルサイズがそれでもなお最大ファイルサイズに対する限界を超えている場合は、データ相関を増加させる他の方法が必要である。
【0015】
画像中のあまり重要でない細部が犠牲とされ目立つ画像構造が保たれる場合は、データ相関は高められ得る。本発明は、この目的を達成するために画像単純化と称される手順を用いる。特に、多少は平坦な領域中は、低マグニチュードの空間的な変化は、それらの周波数内容とは無関係に、知覚的にはあまり重要でないと想定される。従って、例えばシグマフィルタといったエッジを保つ空間平滑化フィルタは、画像単純化に適している。シグマフィルタの詳細については、非特許文献5を参照のこと。従来通り、シグマフィルタは画像中の雑音を除去するために用いられる。シグマフィルタといった非線形フィルタは、線形フィルタと比較すると、ノイズを除去するときに画像の細部をより良く保つという利点を有する。現在画素値のσの差の範囲内の近傍画素値の局所平均は、現在画素値を置き換えるのに用いられる。明らかに、マグニチュードの大きいエッジはこのようにして保たれ、低マグニチュードのノイズは除去される。シグマフィルタは、そのエッジ保存能力により、あまり重要でない画像細部を除去するためにはよい選択肢であるが、有用でありうるエッジ保存フィルタはシグマフィルタだけではない。他のエッジ保存空間平滑化フィルタは、非特許文献6に記載のフーバー・マルコフ・ランダム・フィールド(Huber Markov Random Field)フィルタを含むが、これに限られるものではない。
【0016】
図1に示す本発明の方法を参照するに、入力ディジタル画像15は送信される出力ディジタル画像を作成するために処理される(190)。処理は、入力ディジタル画像15をコンピュータプログラムへロードすること(100)を含む。画像は、前処理された画像を形成するために何らかの所望の処理計画に従って前処理される(110)。この前処理(110)計画は、シーンバランス、コントラスト強調、鮮鋭化、及び回転を含みうるが、これらに限られるものではない。
【0017】
方法中のこの点において、前処理された画像の複製は、リサイズ処理(120)、関心領域(ROI)識別部(260)、及びオープンスペース識別部(270)へ送られる。ROI識別部(260)及びオープンスペース(OS)識別部(270)へ送られた前処理された画像は、後述する処理に従って処理される。これらの2つの識別部は、ROIの更なる保護と画像中の平滑な領域の極端な単純化を与えるために用いられる。これらの2つの識別部、従って本発明は、ディジタル画像理解技術に関連し、この技術は、ディジタル画像をディジタル式に処理することにより人間が理解可能な対象、属性、又は条件を認識し有用な意味を割り当て、ディジタル画像の更なる処理において得られる結果を用いる技術を意味すると理解される。
【0018】
リサイズ演算部(120)は、前処理された画像をリサイズして(元の画像のアスペクト比及び装置の画素比の両方に従って)リサイズされた画像を作成する。一般的に、ディスプレイ解像度は入力画像の解像度よりもかなり低い場合が多いため、リサイズ演算部(120)は画像のサイズを縮小する。リサイズ演算部としての良い選択肢は、従来技術で周知のバイリニア(bi-linear)及びバイキュービック(bi-cubic)補間器を含む。ステップ130を参照するに、誤差拡散(ED)重み(R)は色量子化誤差の100%に近い拡散に対応する所定の初期値に設定される。リサイズされた画像(ステップ120から得られる)、誤差拡散重み(R)、及び表示パレット(P)(ステップ150によって与えられる)は、量子化及び誤差拡散処理(140)へ入力される。リサイズされた画像は、ステップ140において量子化された画像を生成するために、表示パレット(P)へ量子化され、量子化誤差は図3で参照した拡散重み(R)及び処理に従って拡散される。量子化された画像は、圧縮された画像を作成するために圧縮処理を用いて圧縮される(160)。この圧縮処理は、例えばPNG仕様の場合にようなロスレス圧縮器に基づく。次に圧縮されたファイルサイズ(F)が計算される(170)。圧縮されたファイルサイズ(F)は比較段階180において第1の閾値サイズ(S1)、例えば、3キロバイトの閾値サイズ、と比較される。圧縮されたファイルサイズ(F)が第1の閾値サイズ(S1)よりも小さければ、圧縮された画像は表示装置へ送信される(190)。圧縮されたファイルサイズ(F)が(S1)よりも大きければ、圧縮されたファイルサイズ(F)は第2の比較段階200において第2の閾値サイズ(S2)、例えば3.5キロバイト、と比較される。圧縮されたファイルサイズ(F)が第2の閾値サイズ(S2)よりも小さければ、誤差拡散率(R)は一定の割合、例えば10%だけ減少される(210)。
【0019】
次に、誤差拡散率は、最小誤差拡散率閾値T、例えば50%の閾値、と比較される(220)。誤差拡散率(R)がTよりも小さいとき、画像単純化処理(230)が開始される。誤差拡散率(R)がTよりも大きい場合、R0=100%のときの重み値を現在の率Rで乗ずることによって計算される誤差拡散重みWi,jの現在の値を用いて、リサイズされた画像を誤差拡散で量子化する処理が開始され(140)、方法のステップ160乃至200が繰り返される。
【0020】
図7を参照するに、画像単純化処理(230)はその入力として、リサイズされた画像(120)と、関心領域(ROI)マスク(240)及び/又はオープンスペース(OS)マスク(250)を含む、破線によって示される幾つかの任意の入力とを必要とする。画像単純化処理(230)は、多少は平坦な領域に現れ大きいマグニチュードのエッジよりも知覚的に重要でない低マグニチュードの空間的な変化を、それらの周波数成分にかかわらず除去又は平滑化する、例えば上述のシグマフィルタといった画像フィルタをリサイズされた画像に適用することにより単純化された画像(280)を戻す。ROI(240)マスク及びOS(250)マスクは、以下のようにして画像単純化処理において用いられる。ROIマスク(240)は、例えばシグマフィルタリングといった画像フィルタリングからROIマスク中で識別される幾つかの画像領域を遮蔽するために使用され、更に特定的には、マスク中で1に等しい値を有する領域は画像フィルタリングから遮蔽される。OSマスクは、1に等しいマスク値でOSマスク中で識別された画像領域を、例えば領域の平均色値といった単一の色値へ変換するために使用される。
【0021】
比較段階180及び200において、圧縮された画像ファイルサイズFを一組の閾値(S1及びS2)と比較し、低下段階210において誤差拡散率(R)を選択的に低下させることを繰り返す処理は、FがS1よりも小さくなり量子化された画像がディスプレイへ送信される(190)まで、又は、RがまだTよりも大きくFがS2よりも小さくなるまで、繰り返される。
【0022】
やはり図1を参照するに、リサイズされた画像がいったん画像単純化処理(230)へ送られると、誤差拡散率(R)は開始値(R0)にリセットされ、リサイズされ単純化された画像を表示パレットへ量子化する処理(140)が再び開始される。誤差拡散率(R)を低下させ(210)画像を単純化する(230)処理は、FがS1よりも小さくなり量子化された画像が表示装置へ送信される(190)まで繰り返される。
【0023】
図2に、本発明の方法及び効果を示す。人物が木と共に前景に立っており、空、雲、及び芝生がシーンの背景を構成する入力画像20が示されている。固定の装置パレットを用いた場合、量子化は、例えば認識できない顔特徴や空領域中の濃い輪郭といった視覚的に好ましくない量子化アーティファクトを生じさせる。本発明を用いると、空、葉、及び芝生に対応する領域はあまり重要ではない領域22として扱われ、これらの領域中の細部は、例えば人物、地平線、木の輪郭等といったより顕著な画像画像構造を高い画質で表現することを可能とするために単純化される。
【0024】
更に、重要な画像構造のより効果的な保存は、対象検出によって達成されうる。幾つかの場合、例えば人間の顔24といった重要な画像構造は、特に画像が小さいサイズへ縮小されたときは比較的わずかな特徴を有する。
【0025】
再び図1を参照するに、本発明の望ましい実施例では、顔検出器は、画像単純化(230)から保護されるべき関心領域(ROI)を識別する(260)ために使用される。この画像領域は、適当であると認められる或る最大値に等しい誤差拡散率(R)を用いて表示パレットへ量子化される。顔検出器を用いて画成されるROIは、ROIマスク(240)を作成することにより残る画像領域から孤立される。図6を参照するに、図2に示される画像の例から作成されるROIマスクが示されている。このマスクは、顔検出処理により画成されたROI中では1に等しい画素値(白い領域で示される)を有しその他の領域ではゼロに等しい画素値(黒い領域で示される)を有する入力画像と同じ寸法を有する。従って、このマスク(240)は、画像単純化処理(230)により単純化されるべきでない画像領域を識別するために使用され、誤差拡散処理(140)により関心領域に対して100%の又は100%に近い率の誤差拡散を適用するために使用される。
【0026】
図8を参照するに、画像量子化処理(140)は、3つの必要とされる入力、即ち、誤差拡散率(R)、表示パレット(150)、及びリサイズされた画像(120)又は単純化された画像(280)のいずれかを有する。OSマスク(240)とROIマスク(250)は、画像量子化処理に対して任意であり、アルゴリズムの通常の流れで作成された場合にのみ使用される。ROIマスク(240)が存在する場合、量子化及び拡散画像処理(140)において、ROIマスクの中のものに対応するリサイズされた画像(120)中の又は単純化された画像(280)中の領域は、拡散率(R)を適当と認められる最大値に設定して誤差拡散処理を用いて表示パレット(150)へと量子化される。OSマスク(250)が存在する場合、単純化された画像(280)の領域は、例えばゼロといった最小値に設定された誤差拡散率(R)を用いて表示パレットへと量子化される。画像中の残る領域は、方法中で現在使用されている誤差拡散率(R)を用いて表示パレットへと量子化される。
【0027】
人間の顔検出は従来技術で周知である。例えば、ここに参照として組み入れられる非特許文献7又は、モガダム(Moghaddam)及びペントランド(Pentland)による特許文献2("Detection, recognition and coding of complex objects using probablistic eigenspace analysis")を参照のこと。
【0028】
更に、あまり重要でない構造のより効果的な単純化は対象検出によって達成されうる。例えば、平坦な領域、即ち空や床といったオープンスペース領域が設定され、後に誤差拡散を適用することなく単一の色へと量子化されれば、画像圧縮のために非常に効率的である。オープンスペース検出の詳細については、共通に譲渡されたウォーニック(Warnick)外に対して1999年5月4日に発行された
特許文献3に記載されている。
【0029】
図1を参照するに、本発明の望ましい実施例では、オープンスペース検出器は画像中の平滑な領域を識別する(270)ために使用される。これらの領域の夫々は、表示パレットの範囲内の単一の固有の色値へ変換(又は量子化)される。この処理は、例えば誤差拡散に関連する輪郭縞やディザ雑音といった量子化アーティファクトなしにこれらの領域を生成する効果を有する。結果として、所与のオープンスペース特徴に対して、領域は、領域内の色を最もよく表わす共通の色で平滑に表現される。上述の顔検出及び保護処理について記載されたのと同様に、図5を参照して、オープンスペース領域300を画像の残る領域から区別するマスク(250)が発生される。本例では、図2に示される空領域(26)はOS領域300として識別される。従って、図5に示すマスクは、空領域であったところに1を有し、その他の領域にゼロを有する。このマスクは、画像単純化(230)と誤差拡散処理(140)の両方においてオープンスペース領域の特別な処理をさせるために使用される。換言すれば、オープンスペース領域中の画素は最も極端な単純化を受け、即ち単一の色へ設定され、次にオープンスペース領域全体に適用される0%の誤差拡散で単一のパレット色へと量子化される。
【0030】
本発明による処理及び方法の効果の例を図式的に示す再び図2を参照するに、顔領域24は検出され、顔特徴の最善の表現を確実とするために画像単純化から除外される。更に、空領域はオープンスペース領域26として識別され、続いて単一の青色へ量子化され、誤差拡散処理から除外される。
【0031】
上述の手順によりS1よりも小さい画像ファイルを生成することが出来なかった場合、表現された画像は、クロッピングされた画像のファイルサイズがS1よりも小さくなる程度に画像境界においてクロッピングされうる。
【0032】
【発明の効果】
本発明は、固定の装置パレットによる量子化による視覚的な歪みが最小限とされ、顕著な画像構造が保たれる意味で、最大ファイルサイズに最も近いサイズのディジタル画像ファイルによって表現される画像の視覚的な質ができるだけ高く保たれるという利点がある。
【図面の簡単な説明】
【図1】限られたディスプレイ用にディジタル画像ファイルを発生するための本発明の方法を示すフローチャートである。
【図2】本発明の処理及び効果を示すのに役立つ図である。
【図3】公知のマルチレベルベクトル誤差拡散処理を示す図である。
【図4】図3に示すマルチレベルベクトル誤差拡散処理に使用されうる一組の誤差の重みの例を示す図である。
【図5】オープンスペース(OS)マスクの例を示す図である。
【図6】特に顔のための関心領域(ROI)マスクの例を示す図である。
【図7】図1に示す方法で用いられる画像単純化処理の入力及び出力を示す図である。
【図8】図1に示す方法で用いられる量子化及び誤差拡散処理の入力及び出力を示す図である。
【符号の説明】
15 入力ディジタルカラー画像
16 一組のパレット色
17 パレットカラーを次に割り当てる段階
18 出力ディジタルカラー画像
20 入力画像
22 最も単純化を受けるべき画像領域
24 人間の顔領域
26 オープンスペース領域(空)
30 差分演算
32 重み誤差段階
34 加算演算
40 現在画素
42 次の右の画素
44 画像の次の行の画素
100 入力ディジタル画像ロード段階
110 前処理段階
120 リサイズ処理
130 誤差拡散重み設定段階
140 量子化及び誤差拡散段階
150 表示パレット
160 画像圧縮段階
170 圧縮されたファイルサイズ計算処理
180 第1の閾値サイズ比較
190 画像送信段階
200 第2の閾値サイズ比較
210 誤差拡散率低下段階
220 最小誤差拡散率比較
230 画像単純化処理
240 関心領域マスク
250 オープンスペースマスク
260 関心領域識別器
270 オープンスペース識別器
280 単純化された画像
300 オープンスペース領域

Claims (3)

  1. ディジタル画像の解像度よりも低い表示解像度を有し、ディジタル画像を表現するために表示パレットを用い、最大ファイルサイズに制限を与える伝送路に接続される表示装置上での表示のためにディジタル画像を表現し圧縮する方法であって、
    (a)ディスプレイのサイズとされたディスプレイサイズ画像を生成するために前記ディジタル画像を前記表示解像度にリサイズする段階と、
    (b)前記ディスプレイサイズ画像を前記表示パレットへ量子化した後、量子化誤差を所定の誤差拡散率に従って誤差拡散処理することで誤差拡散されたディスプレイサイズ画像を生成する段階と、
    (c)あるファイルサイズを有する圧縮されたディスプレイサイズ画像を生成するために、前記誤差拡散されたディスプレイサイズ画像を可逆的に圧縮する段階と、
    (d)前記ファイルサイズを前記最大ファイルサイズと比較し、前記ファイルサイズが前記最大ファイルサイズよりも小さければ、前記圧縮されたディスプレイサイズ画像を前記ディスプレイへ送信する段階と、
    (e)前記ファイルサイズが前記最大ファイルサイズよりも大きいが前記最大ファイルサイズよりも大きい他の所定のファイルサイズよりも小さい場合、前記ファイルサイズを縮小するために前記誤差拡散率を所定の量だけ低くし、前記低くされた誤差拡散率で前記リサイズされた画像に対して前記段階(a)に続く段階を繰り返す段階と、
    (f)前記ファイルサイズが前記最大ファイルサイズと前記所定のファイルサイズのいずれよりも大きい場合、単純化された画像を生成するために画像細部を減少させることによって前記リサイズされた画像を単純化し、前記ファイルサイズが前記最大ファイルサイズよりも小さくなるまで前記単純化された画像に対して前記段階(a)に続く段階を繰り返す段階とを含む方法。
  2. 前記ディジタル画像中の関心領域を検出する段階と、前記段階(f)において前記関心領域中の顕著な特徴を単純化することを防止する段階とを更に含む、請求項1記載の方法。
  3. 前記関心領域は人間の顔に対応し、前記関心領域を検出する段階は顔検出アルゴリズムを用いる、請求項2記載の方法。
JP2003207569A 2002-09-27 2003-08-14 限られたディスプレイ用にディジタル画像ファイルを発生する方法及びシステム Expired - Fee Related JP4347625B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/259,538 US7130474B2 (en) 2002-09-27 2002-09-27 Method and system for generating digital image files for a limited display

Publications (2)

Publication Number Publication Date
JP2004140792A JP2004140792A (ja) 2004-05-13
JP4347625B2 true JP4347625B2 (ja) 2009-10-21

Family

ID=31977902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003207569A Expired - Fee Related JP4347625B2 (ja) 2002-09-27 2003-08-14 限られたディスプレイ用にディジタル画像ファイルを発生する方法及びシステム

Country Status (4)

Country Link
US (1) US7130474B2 (ja)
EP (1) EP1403823B1 (ja)
JP (1) JP4347625B2 (ja)
DE (1) DE60302311T2 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7391929B2 (en) * 2000-02-11 2008-06-24 Sony Corporation Masking tool
JP3428589B2 (ja) * 2001-03-30 2003-07-22 ミノルタ株式会社 画像処理プログラムが格納された記録媒体、画像処理プログラム、画像処理装置
US7038814B2 (en) * 2002-03-21 2006-05-02 Nokia Corporation Fast digital image dithering method that maintains a substantially constant value of luminance
JP4064196B2 (ja) * 2002-10-03 2008-03-19 株式会社リコー クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法
US8612628B1 (en) * 2003-01-07 2013-12-17 Novell, Inc. Method and system for transferring repetitive images over computer networks
US7895513B1 (en) * 2003-05-28 2011-02-22 Adobe Systems Incorporated Color reduction in complex figures containing text for space/time constrained platforms
US7706448B2 (en) * 2003-07-30 2010-04-27 Microsoft Corporation Reversible diffusion-based compression
JP4444623B2 (ja) * 2003-10-29 2010-03-31 富士フイルム株式会社 動画像変換装置および方法、動画像配信装置、メール中継装置並びにプログラム
JP4420447B2 (ja) * 2004-06-14 2010-02-24 キヤノン株式会社 色処理装置および色処理方法
JP2006065834A (ja) * 2004-07-26 2006-03-09 Murata Mach Ltd 画像処理装置および画像処理方法
US20060023951A1 (en) * 2004-07-27 2006-02-02 Tan Lian C S Method and system for processing an input image and generating an output image having low noise
US7609898B2 (en) * 2004-10-01 2009-10-27 Microsoft Corporation Method and system for progressive image transmission
US7698152B2 (en) * 2005-01-07 2010-04-13 Siemens Medical Solutions Health Services Corporation Medical image viewing management and status system
JP4479662B2 (ja) * 2005-03-10 2010-06-09 パナソニック株式会社 光ディスク装置
US7768673B2 (en) * 2005-09-12 2010-08-03 Kabushiki Kaisha Toshiba Generating multi-bit halftone dither patterns with distinct foreground and background gray scale levels
US20070180482A1 (en) * 2006-01-31 2007-08-02 M2M Research, Inc. Remote imaging system
US7633510B2 (en) * 2006-05-05 2009-12-15 Google Inc. Rollback in a browser
US7631252B2 (en) * 2006-05-05 2009-12-08 Google Inc. Distributed processing when editing an image in a browser
EP1920407A4 (en) * 2006-07-14 2009-05-13 Research In Motion Ltd METHOD AND SYSTEM FOR CONTACT PILOT SELECTION AND ASSIGNMENT FOR A MOBILE DEVICE
US8212805B1 (en) 2007-01-05 2012-07-03 Kenneth Banschick System and method for parametric display of modular aesthetic designs
CN101595734A (zh) * 2007-01-16 2009-12-02 汤姆逊许可证公司 用于减轻图像中的伪影的系统和方法
US7983486B2 (en) * 2007-08-29 2011-07-19 Seiko Epson Corporation Method and apparatus for automatic image categorization using image texture
US20090244633A1 (en) * 2008-03-31 2009-10-01 Konica Minolta Systems Laboratory, Inc. Systems and Methods for Color Data Compression
US20090244601A1 (en) * 2008-03-31 2009-10-01 Konica Minolta Systems Laboratory, Inc. Systems and Methods for Color Data Compression
US8155436B2 (en) * 2008-03-31 2012-04-10 Konica Minolta Laboratory U.S.A., Inc. Systems and methods for color data compression
US8121435B2 (en) * 2008-03-31 2012-02-21 Konica Minolta Laboratory U.S.A., Inc. Systems and methods for resolution switching
US9002120B2 (en) * 2008-10-03 2015-04-07 Intellectual Ventures Fund 83 Llc Interactive image selection method
US8599214B1 (en) 2009-03-20 2013-12-03 Teradici Corporation Image compression method using dynamic color index
JP5355190B2 (ja) * 2009-04-08 2013-11-27 キヤノン株式会社 画像表示装置及び方法並びにプログラム
US20110137947A1 (en) 2009-12-03 2011-06-09 International Business Machines Corporation Dynamic access control for documents in electronic communications within a cloud computing environment
US8472724B2 (en) * 2010-06-30 2013-06-25 Samsung Electronics Co., Ltd. System and method for reducing noise in an image
US9100588B1 (en) 2012-02-28 2015-08-04 Bruce A. Seymour Composite image formatting for real-time image processing
JP5204327B1 (ja) 2012-03-29 2013-06-05 株式会社東芝 画像処理装置、および画像処理方法
JP2013242527A (ja) * 2012-04-27 2013-12-05 Mitsubishi Electric Corp 画像処理装置、画像処理方法及び画像表示装置
US11315321B2 (en) * 2018-09-07 2022-04-26 Intel Corporation View dependent 3D reconstruction mechanism
CN117294853B (zh) * 2023-09-26 2024-06-25 小红书科技有限公司 图像压缩方法、相关方法及相关装置、电子设备和存储介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208871A (en) * 1990-10-19 1993-05-04 Xerox Corporation Pixel quantization with adaptive error diffusion
TW256010B (ja) * 1991-04-18 1995-09-01 Ampex
US5649083A (en) * 1994-04-15 1997-07-15 Hewlett-Packard Company System and method for dithering and quantizing image data to optimize visual quality of a color recovered image
US5486826A (en) * 1994-05-19 1996-01-23 Ps Venture 1 Llc Method and apparatus for iterative compression of digital data
JPH08181840A (ja) * 1994-12-22 1996-07-12 Konica Corp 画像記録装置
US5710833A (en) 1995-04-20 1998-01-20 Massachusetts Institute Of Technology Detection, recognition and coding of complex objects using probabilistic eigenspace analysis
US6094510A (en) * 1996-04-15 2000-07-25 Canon Kabushiki Kaisha Image processing apparatus and method for predicting a compression rate of image data processed to modify an image
US5790131A (en) 1996-05-15 1998-08-04 Iterated Systems, Inc. System and method for lossy compression of data with output file size control
US5901245A (en) 1997-01-23 1999-05-04 Eastman Kodak Company Method and system for detection and characterization of open space in digital images
JPH10336647A (ja) 1997-06-04 1998-12-18 Nikon Corp 画像圧縮装置および画像圧縮処理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6195462B1 (en) 1998-03-30 2001-02-27 Eastman Kodak Company Image compression
JP2000244751A (ja) * 1999-02-22 2000-09-08 Matsushita Electric Ind Co Ltd 多値画像の2値化符号化方法及び多値画像の2値化符号化装置
US20020016818A1 (en) 2000-05-11 2002-02-07 Shekhar Kirani System and methodology for optimizing delivery of email attachments for disparate devices
US7221483B2 (en) * 2000-09-05 2007-05-22 Ricoh Company, Ltd. Image encoding method and apparatus, image decoding method and apparatus, image processing apparatus, image formation apparatus, and computer-executable programs

Also Published As

Publication number Publication date
JP2004140792A (ja) 2004-05-13
DE60302311T2 (de) 2006-09-28
EP1403823B1 (en) 2005-11-16
DE60302311D1 (de) 2005-12-22
EP1403823A1 (en) 2004-03-31
US7130474B2 (en) 2006-10-31
US20040062437A1 (en) 2004-04-01

Similar Documents

Publication Publication Date Title
JP4347625B2 (ja) 限られたディスプレイ用にディジタル画像ファイルを発生する方法及びシステム
JP6255063B2 (ja) Hdr画像のための画像処理
EP1397780B1 (en) Image enhancement methods and apparatus therefor
US9501818B2 (en) Local multiscale tone-mapping operator
US9210439B2 (en) High dynamic range codecs
KR20120112709A (ko) 높은 동적 범위의 이미지 생성 및 렌더링
US20060182364A1 (en) System and method for sharpening vector-valued digital images
CN111429357A (zh) 训练数据确定方法、视频处理方法、装置、设备及介质
CN114554212A (zh) 视频处理装置及方法、计算机存储介质
US10349087B2 (en) Methods, systems, and computer readable media for reconstructing images using blurring and noise-enhanced pixel intensity resampling
JP3835416B2 (ja) 画像圧縮装置、画像圧縮方法及び画像圧縮プログラム
CN118302789A (zh) 具有低动态范围兼容性的高动态范围图像格式
EP4392929A1 (en) High dynamic range image format with low dynamic range compatibility
WO2024096931A1 (en) High dynamic range image format with low dynamic range compatibility
Efremov et al. Design and evaluation of backward compatible high dynamic range video compression
JP2004343400A (ja) 画像処理装置および方法並びにプログラム
Singhal et al. Spatially Adaptive Rendering of Images for Display on Mobile Devices
Dolzhenko et al. Perceptual colour spaces for high dynamic range image compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090317

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090616

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090716

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120724

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130724

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees