JP2003116007A - ディジタル画像から圧縮されたビットストリームを生成するための対象内容分析を使用する方法 - Google Patents

ディジタル画像から圧縮されたビットストリームを生成するための対象内容分析を使用する方法

Info

Publication number
JP2003116007A
JP2003116007A JP2002193791A JP2002193791A JP2003116007A JP 2003116007 A JP2003116007 A JP 2003116007A JP 2002193791 A JP2002193791 A JP 2002193791A JP 2002193791 A JP2002193791 A JP 2002193791A JP 2003116007 A JP2003116007 A JP 2003116007A
Authority
JP
Japan
Prior art keywords
image
digital image
distortion
subband
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002193791A
Other languages
English (en)
Inventor
Rajan L Joshi
エル ジョシ ラジャン
Jiebo Luo
ルオ ジエボ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JP2003116007A publication Critical patent/JP2003116007A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 本発明は、特定のビットレート又は圧縮比を
達成しながら、エンドユーザにより知覚される再構成さ
れた画像品質に重要な、領域の視覚品質を最大化する効
果を有するディジタル画像から圧縮されたビットストリ
ームを生成する方法を提供することを目的とする。 【解決手段】 ディジタル画像から圧縮されたビットス
トリームを生成する方法であって、a)画像内の対象及
び背景領域の重要性に関連する連続の信頼値を含む、主
対象信頼マップを発生するために、ディジタル画像を処
理するステップと、b)変換係数の配列を発生するため
に、ディジタル画像に、空間−周波数変換を実行するス
テップと、c)信頼マップから、各変換係数に対して、
歪み−重みファクターを得るステップと、d)歪み−重
みファクターに応答する画像圧縮システムを使用して、
圧縮されたビットストリームを発生するステップと、を
有する方法により構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、損失のある画像圧
縮システムの空間的な適応量子化のための方法に関連す
る。特に、対象内容分析に基づいて、画像の異なる空間
−周波数領域に対して量子化の範囲を適応させる方法に
関連する。特定のビットレート又は圧縮比を達成しよう
とするときには、これは、エンドユーザに知覚される再
構成された画像品質のために重要でありそうである領域
の視覚品質を最大化する効果を有する。
【0002】
【従来の技術】近年、画像のサブバンド又はウェーブレ
ット圧縮方法が提案されている。1つのそのような方法
は、D.Taubmanによる、IEEE画像処理論文
集9(7)(2000年7月)の第1158−1170
頁の”EBCOTを用いた高性能スケーラブル圧縮(H
igh performance scalablec
ompression with EBCOT)”に記
載されている、EBCOTアルゴリズムである。情報技
術―JPEG2000画像符号化システム、ISO/I
E国際規格15444−1、ITU勧告T.800(I
nformation Technology−JPE
G2000Image CodingSystem、I
SO/IEC International Stan
dard 15444−1、ITU recommen
dation T.800)に記載されている、JPE
G2000画像圧縮規格も、EBCOTアルゴリズムに
基づいている。
【0003】EBCOTアルゴリズムは、ウェーブレッ
ト変換を使用して、画像を分解する。結果のサブバンド
は、更に、小さなコードブロックに分割される。コード
ブロックは、量子化されそして、独立にエントロピー符
号化される。EBCOTアルゴリズムは、異なるコード
ブロックにビットを割当てるのに2つの異なる方法を使
用する。1つの方法では、おそらく重み付けされた、平
均2乗誤差(MSE)が、圧縮されたビットストリーム
は各潜在的な切り捨て点で切り捨てられるとして、評価
される。そして、切捨て点は、レート−歪みのトレード
オフを分析した後に、各コードブロックに対して選択さ
れる。他の方法では、MSEは、人間の視覚系(HV
S)の視覚的マスキング特性に基づいて、特定の空間−
周波数位置で量子化雑音の視覚性を考慮するファクター
により調整される。
【0004】上述の従来技術は、低レベル視覚特性に従
って異なる空間−周波数領域内のレート−歪みのトレー
ドオフに制限される。画像内の物体の語義に関する意味
に基づいて、そのようなトレードオフを実行する必要も
ある。より多くのビットを、比較的高い品質のために、
関心の領域(ROI、regions of inte
rest)又は前景領域に割当て、少ないビットを背景
領域に割り当てるのが望ましい。これは、エンドユーザ
により知覚される再構成される画像の品質に対して重要
でありそうな領域の視覚的品質を最大化する。従来は、
ROIは、C.Christopoulos、J.As
kelof及び、M.Larssonの、”来るべきJ
PEG2000静止画符号化規格の効率的な関心の領域
の符号化技術(Efficient regions
of interest encoding tech
niques in the upcoming JP
EG2000 still image coding
sandard)”、IEEE画像処理国際会議、2
000年9月、カナダ、バンクーバー、に記載されてい
るバイナリーマスクを使用して規定される。バイナリー
ROIマスクを使用する欠点は、結果が、バイナリーマ
スクの正しさと精度に極端に敏感であり、そして、正確
なバイナリーマスクを発生する既知の強い自動化された
方法がないことである。
【0005】
【発明が解決しようとする課題】本発明の目的は、上記
の1つ又はそれ以上の問題点を解決することである。
【0006】
【課題を解決するための手段】簡単に要約すると、本発
明の1つの特徴に従って、ディジタル画像から圧縮され
たビットストリームを生成する方法であって、a)画像
内の対象及び背景領域の重要性に関連する連続の信頼値
を含む、主対象信頼マップを発生するために、ディジタ
ル画像を処理するステップと、b)変換係数の配列を発
生するために、ディジタル画像に、空間−周波数変換を
実行するステップと、c)信頼マップから、各変換係数
に対して、歪み−重みファクターを得るステップと、
d)歪み−重みファクターに応答する画像圧縮システム
を使用して、圧縮されたビットストリームを発生するス
テップとを有する。
【0007】JPEG圧縮、JPEG2000圧縮又
は、ベクトル量子化を含む、種々の画像圧縮システムか
ら特定の画像圧縮システムが選択されても良い。ベクト
ル量子化の場合には、空間−周波数変換は、恒等変換で
ある。ステップa)内の主対象信頼マップの生成は、デ
ィジタル画像から、均一の特性の流域の抽出、少なくと
も1つの構造的な突出特徴及び少なくとも1つの語義的
突出特徴の領域の各々に対する抽出及び、及び、各領域
が主対象である信頼の推定値への、見込みに基づく推論
エンジンを使用する、構造的な突出特徴と語義的突出特
徴の統合を含む。
【0008】ウェーブレット分解のような、サブバンド
分解に関する特定の実行では、この方法は、a)画像内
の対象及び背景領域の重要性に関連する連続の信頼値を
含む、主対象信頼マップを発生するために、ディジタル
画像を処理するステップと、b)サブバンド係数により
重み付けされた対応する合成基礎関数を加算することに
より、ディジタル画像を再構成するのに使用されること
ができる、サブバンド係数の配列を発生するために、分
析フィルタを使用して、ディジタル画像に、サブバンド
分解を実行するステップと、c)各サブバンド係数に対
して、信頼マップから、歪み−重みファクターを得るス
テップと、d)エラー関数を最小化するために、歪み−
重みファクターを使用して、サブバンド係数から目標サ
イズを超えない、圧縮されたビットストリームを発生す
るステップとを有する。
【0009】本発明の優位点は、特定のビットレート又
は圧縮比を達成しながら、エンドユーザにより知覚され
る再構成された画像品質に重要でありそうな、領域の視
覚品質を最大化する効果を有する。
【0010】本発明のこれらのそして他の観点、目的、
特徴、優位点は、添付の図面を参照して、以下の好適な
実施例の詳細な説明と添付の請求項の範囲を見れば更に
明らかに理解されよう。
【0011】
【発明の実施の形態】本発明の好適な実施例は、提案さ
れたJPEG200画像圧縮規格に基づく損失のある画
像符号化器である。提案されたJPEG200画像圧縮
規格は、どのように、復号器が、圧縮されたビットスト
リームを翻訳するかを規定し、JPEG2000符号化
器にある固有の制約がある。例えば、JPEG2000
規格のパートIには、あるウェーブレットフィルタのみ
が使用できる。エントロピー符号化器も固定されてい
る。これらの方法は、情報技術―JPEG2000画像
符号化システム、ISO/IE国際規格15444−
1、ITU勧告T.800(Information
Technology−JPEG2000ImageC
oding System、ISO/IEC Inte
rnationalStandard 15444−
1、ITU recommendationT.80
0)に記載されている。これゆえに,本説明は、本発明
に従ったアルゴリズムの部分を構成する又はともに直接
的に協同して動作する属性に特に向けられている。ここ
で示されていない又は説明されていない属性は、情報技
術―JPEG2000画像符号化システム、ISO/I
E国際規格15444−1、ITU勧告T.800(I
nformation Technology−JPE
G2000Image Coding System、
ISO/IEC International Sta
ndard 15444−1、ITU recomme
ndation T.800)に記載されているものか
ら選択され得る又は、従来技術で既知である。好適な実
施例は、空間−周波数変換がサブバンド分解(特にウェ
ーブレット分解の)JPEG2000圧縮アルゴリズム
を使用するが、本発明は、空間−周波数変換が恒等変換
である、他の空間−周波数分解、ブロックに基づく変
換、及び、ブロックに基づくベクトル量子化のような、
他の空間−周波数変換を使用する、他の損失のある圧縮
システムにも適用できる。
【0012】以下の説明では、本発明の好適な実施例
は、通常は、ソフトウェアプログラムの形式で実行され
るが、当業者は、そのようなソフトウェアと等価のもの
はハードで構成できることは容易く理解され得よう。以
下で説明されるシステムと方法では、本発明の実行に必
要な全てのそのようなソフトウェア実行は、従来のもの
であり、且つそのような技術の、通常の技術の範囲内で
ある。本発明が、コンピュータプログラムとして実行さ
れる場合には、プログラムは、例えば、磁気ディスク
(ハードディスク又は、フレキシブルディスク)又は磁
気テープ、光ディスクのような光蓄積媒体、光テープ、
又は、機械読出し可能なバーコード、ランダムアクセス
メモリ(RAM)又は読出し専用メモリ(ROM)のよ
うな固体電子蓄積装置又は、コンピュータプログラムを
蓄積するのに使用される他の物理的な装置又は、媒体を
含む、従来のコンピュータ読出し可能な媒体に蓄積され
る。
【0013】本発明の現在好適な実施例を詳細に参照
し、存例は添付の図面に示されている。本発明は、好適
な実施例と共に説明するが、その実施例に本発明は、制
限されない。逆に、全ての変形、修正及び、等価物は、
添付の請求の範囲に定義された本発明の意図と範囲内に
含まれる。
【0014】図1は、本発明に従ったJPEG2000
画像符号化器のフローチャートを示す。ディジタル画像
(101)は、サブバンド係数(103)に関して画像
表示を生じるために、分析フィルタによりサブバンド分
解(102)を受ける。画像が(例えば、RGBの)複
数の成分を有する場合には、サブバンド分解ステップ
(102)の前に、YCbCr表示に変換するために輝
度−色差(ルミナンス−クロミナンス)変換が与えられ
る。しかし、この好適な実施例では、全画像よりなる単
一のタイルが使用される。好適な実施例は、サブバンド
分解を使用するが、他の空間−周波数分解も可能であ
る。サブバンド係数(103)は、コードブロック分割
ユニット(104)により、1つ又はそれ以上のコード
ブロック(105)を生成するために、1つ又はそれ以
上の矩形にコードブロックに分割される。各コードブロ
ックは、圧縮されたコードブロックビットストリーム
(107)とバイトカウントテーブル(108)を生成
するために、適切な量子化器ステップサイズを使用し
て、コードブロック圧縮ユニット(106)により、圧
縮される。ディジタル画像(101)は、主対象検出
(MSD)ユニット(110)にも入力される。MSD
ユニットは、信頼マップ(111)を発生するために、
入力ディジタル画像を分析する。歪み−重み計算ユニッ
ト(112)は、レート−制御アルゴリズムにより使用
される、歪み−重み(113)を得るために、信頼マッ
プ(111)を使用する。コードブロック(105)、
圧縮されたコードブロック(107)は、バイトカウン
トテーブル(108)、ビット予算(109)及び、歪
み−重み(113)は、レート−制御ユニット及びJP
EG2000ビットストリームオルガナイザー(11
4)に入力され、それは、符号化されたディジタル画像
(115)を発生する。
【0015】図1のブロックを詳細に説明する。JPE
G2000符号化器はウェーブレット分解を使用し、こ
れは、サブバンド分解(102)の特別な場合である。
図2は、1次元信号に対する、2−バンドフィルタバン
クを示す。入力信号x[n]が最初に、2つの分析フィル
タh[n]とh[n]により、フィルタされる。フィル
タhとhは、典型的には、それぞれ、低域通過フィ
ルタと高域通過フィルタである。フィルタの出力は、サ
ブバンド信号x[n]とx[n]を発生するために、2
でダウンサンプルされる。信号が2でダウンサンプルさ
れると、毎交互のサンプル(奇数サンプル)が捨てられ
る。フィルタリングとダウンサンプリングの動作はとも
に、分析フィルタバンクを構成する。サブバンド信号の
サンプルは、サブバンドサンプルと呼ばれる。サブバン
ド符号化システムでは、サブバンド信号は量子化され
る。しかし、しばらく量子化動作を無視する。合成側で
は、サブバンドサンプルは、2によりアップサンプルさ
れる。これは、サブバンドの毎2サンプルの間にゼロが
挿入されることを意味する。そして、アップサンプルさ
れた信号は、合成フィルタを通して送られ、g[n]と
[n]、そして、出力信号y[n]を発生するために結
合される。フィルタバンクは、量子化がない場合には、
完全な再構成特性を有するといわれ、 y[n]=x[n] である。
【0016】オクターブ分解では、低域通過フィルタリ
ングにより発生されたサブバンド、x[n]、は、再帰
的に分割される。図3は、2レベルオクターブ分解を示
し、サブバンドx[n]、x[n]及び、x[n]を生
成する。この場合には、サブバンドは、最も低い周波数
から最も高い周波数へ番号が付される。分解レベルの番
号は、低域通過サブバンドが分割された回数を示す。ウ
ェーブレット分解は、オクターブ分解であり、分析と合
成フィルタは、G.Strang及びT.Nguye
n、ウェーブレット及びフィルタバンク(Wavele
t and filter banks)、Welle
sley−Cambridge Press(199
7)に記載されたある規則的な特性を満足する。
【0017】1次元信号の上述のフィルタバンクは、簡
単に2次元に拡張できる。これを達成する1つの可能な
方法は、2次元信号の行と列の方向に沿って、連続して
2−バンドフィルタバンクを適用することである。これ
は、分離できる2次元フィルタバンクとして知られてい
る。この場合には1つのレベルのサブバンド分解が、4
サブバンドを発生する。JPEG2000のみが、分離
できる分解を許す。
【0018】完全な再構成フィルタバンクシステムで
は、各サブバンド係数は、合成基礎関数に関連する。同
じバンド内のサブバンド係数に対する基礎関数は、互い
にシフトされたものである。同じ配向を有する異なるサ
ブバンドからの基礎関数は、G.Strang及びT.
Nguyen、ウェーブレット及びフィルタバンク(W
avelet and filter banks)、
Wellesley−Cambridge Press
(1997)に記載されている、空間拡張特性により関
連されれる。入力信号x[n]は、合成基礎関数の線形結
合で表現される。
【0019】
【外1】 を、サブバンドiからのm番目の係数x[m]の基礎関
数を示すとする。
【0020】
【数1】 基礎関数を決定する最も簡単な方法は以下の様である。
係数x[m]の基礎関数を決定するために、係数値が1
に設定され、そして、そのサブバンド他のサブバンドの
からの全ての他の係数は、ゼロに設定される。そして、
サブバンドを合成することにより再構成される画像は、
サブバンド係数x[m]に対応する基礎関数
【0021】
【外2】 である。同じサブバンドからの他の係数に対する基礎関
数は、
【0022】
【外3】 のシフトされたものなので、この計算は各サブバンドに
対して1回のみなされる必要がある。2次元では、元の
画像は、I(u,v)で示され、uとvは、行インデッ
クスと列インデックスをそれぞれ示すものとする。そし
て、
【0023】
【数2】 ここで、x(g,h)は、サブバンドiからのサブバ
ンド係数を参照し、gとhはそれぞれ、その係数の、行
と列インデックスを参照する。
【0024】基礎関数のサポートの領域は、基礎関数が
ゼロでない値を有する全ての画素として定義される。2
次元の分離できるフィルタバンクに対しては、基礎関数
のサポートの領域は、矩形が保証される。このように、
行と列の方向のサポートの領域は、分離して決定され
る。サポートの2つの領域のデカルト積は、2次元基礎
関数に対するサポートの領域である。
【0025】コードブロック分割ユニット(104)は
各サブバンドを1つ又はそれ以上の矩形のコードブロッ
クに分割する。コードブロック圧縮ユニット(106)
は、図4に詳細が示されている。各コードブロックは、
量子化された係数(402)のインデックスの符号−大
きさ表示を発生するために、適切な量子化器ステップサ
イズ(405)を使用して、スカラー量子化器(40
1)により量子化される。われわれは、デッドゾーンを
有する均一のスカラー量子化器を使用する。この量子化
器の判断しきい値と再構成レベルは、それぞれ、ステッ
プサイズΔ及び2Δに対して、図5(a)と図5(b)
に示されている。好適な実施例では、再構成レベルは、
常に、量子化器間隔の中心である。しかし、当業者は、
これは必要ないことは理解されよう。例えば、再構成レ
ベルはゼロに向かってバイアスされても良い。サンプル
ベース量子化器ステップサイズは、所定のサブバンド内
の全てのコードブロックに対して使用される。サブバン
ドiに対するステップサイズをΔとする。サブバンド
分析及び合成フィルタが可逆な場合には(R.Cald
erbank,I.Daubechies,W.Swe
ldens,及び、B.−L.Yeo、”整数を整数に
マップするウェーブレット変換(Wavelet Tr
ansform that Maps Interge
rs to Intergers)”、Applied
and ComputationalHarmoni
c Analysis、Vol.5,No.3、332
−369ページ、1998年)、量子化ステップは、全
体的に欠けている。各コードブロックからの量子化され
たウェーブレット係数は、エントロピー符号化器(40
3)により独立に符号化される。エントロピー符号化器
(403)は、コードブロック係数の符号−大きさ表示
をビット面として符号化する。処理されているコードブ
ロックは、サブバンドiからであるとする。そして、コ
ードブロックからのサンプルは、上述のように、ステッ
プサイズΔを有するデッドゾーンスカラー量子化器で
量子化される。サブバンドiの量子化された係数のイン
デックスの大きさは、Aビットの固定精度により表さ
れる。ビットは,1,2,...A のような、インデ
ックスが付され、ここでインデックス1は最上位ビット
(MSB)に対応しそして、Aは最下位ビット(LS
B)に対応する。コードブロックのk番目のビット面
は、そのコードブロックからの量子化された係数の全て
のインデックスの大きさ表示からのk番目のビットから
成る。エントロピー符号化の目的のために、コードブロ
ックに対するビット面は、どの前のビット面も重要であ
り又はビット面が少なくとも1つのゼロでないビットを
有する場合には、重要であるといわれる。同様に、最上
位ビットから再下位ビットまで進み、量子化された係数
は、第1のゼロでないビットに出くわすときに重要にな
るといわれる。
【0026】エントロピー符号化器は、1つ又はそれ以
上の符号化パスで、コードブロックに対する各ビット面
を符号化する。例えば、最上位ビット面は、クリーンア
ップパスとして知られる、単一の符号化パスを使用し
て、符号化される。コードブロックの残りのビット面
は、シグニフィカンスプロパゲーションパス(sign
ificance propagation pas
s)、マグニチュードリファインメントパス(magi
tude refinment pass)及び、クリ
ンーンアップパス(cleanup pass)の3つ
の符号化パスを使用して、その順序で、符号化される。
コードブロックのk番目のビット面が符号化されるとす
る。そして、各パスで、コードブロックからの幾つかの
量子化された係数のk番目のビットが符号化される。特
定の係数のk番目のビットが符号化される符号化パス
は、その係数の重要性と、隣接の係数の重要性に依存す
る。量子化されたコードブロックの係数の大きさ表示
が、Aビット面を有する場合には、全てのビット面を
符号化するのに必要な符号化パスの合計数は、(3
(A−1)+1)である。テーブル発生ユニット
(404)は、各コードブロックに対してバイトカウン
トテーブル(108)を発生する。テーブル内のp番目
のエントリーは、圧縮されたビットストリーム内のコー
ドブロックからの最初のp符号化パスを含むことが必要
であるバイト数に対応する。
【0027】D.Taubmanによる、IEEE画像
処理論文集(IEEE Transactions o
n Image Processing)9(7)(2
000年7月)の第1158−1170頁の”EBCO
Tを用いた高性能スケーラブル圧縮(High per
formance scalable compres
sion with EBCOT)”に記載されている
ように、EBCOTアルゴリズムにより使用されるレー
ト−制御アルゴリズムは、次のようである。全体の画像
に対する、コードブロックの全数は、Pであるとする。
コードブロックはBで示され、
【0028】
【数3】 である。最初に、各コードブロックは、非常に精密な量
子化器ステップサイズを使用して量子化され、そして、
圧縮されたビットストリームを発生するために、独立に
エントロピー符号化される。コードブロックBに対応
する圧縮されたビットストリームは、Cにより示され
るとする。典型的には、各コードブロックに対して、最
終ビットストリームに含まれている圧縮されたデータ
は、最初の圧縮されたビットストリームの切り捨て版で
ある。圧縮されたビットストリームC に対する潜在的
な切捨て点は、標準的には、符号化パスの境界である。
コードブロックBに対する可能な切捨て点を、T
で示し、ここで、
【0029】
【数4】 であり、Nは、圧縮されたビットストリームCに対
する可能な切捨て点の数を示す。切捨て点T に対応
する切り捨てビットストリームにサイズを、R バイ
トとする。各切捨て点T で、歪みD を関連させ
ることができる。圧縮されたコードブロックがR
イト後に切捨てされる場合には、歪みは、元の画像と再
構成された画像の間の誤差を定量化する。一般的には、
歪み測定が重み付けされた平均2乗誤差(MSE)の場
合には、歪みは
【0030】
【数5】 のように規定され、ここで、総和は、コードブロックB
内の全係数を亘る。元のコードブロック係数は、x
(g,h)で示される。ここで、ブロックBは、サブ
バンドiからであるとする。
【0031】
【外4】 は、圧縮されたビットストリームCの最初のR
イトから再構成されたコードブロック係数を参照する。
【0032】
【外5】 は、サブバンドiからのどの係数にも関連する基礎関数
のLノルムである。単一のサブバンドからの全係数
は、同じLノルムを有することに注意する。
【0033】係数x(g,h)に対する2乗誤差は、
歪み−重みファクターw(g,h)により重み付けさ
れる。歪み−重みファクターは、D.Taubmanに
よる、IEEE画像処理論文集9(7)(2000年7
月)の第1158−1170頁の”EBCOTを用いた
高性能スケーラブル圧縮(High performa
nce scalable compression
with EBCOT)”により記述された、視覚マス
キングによる、その位置での量子化雑音に視覚性を表し
得る。ある家庭の元で、異なるコードブロックからの歪
みは加算的である。このように、Rバイトのビット予
算(109)が与えられると、レート−制御問題は、最
適な切り捨て点t
【0034】
【外6】 を見つけるように規定され、全体の歪みは、
【0035】
【数6】 ここで、コードブロックに対するレートと歪みの両方
が、選択された切捨て点に依存するということを示す表
記を濫用した。異なるコードブロックに対して異なる切
り捨て点を選択することは、空間的に適応量子化の結果
となることに注意する。上述の問題は、良く知られた制
約された最適化問題である。この問題を解決するため
に、各コードブロックに対する動作レート−歪み曲線が
必要である。これは、符号化器は、各コードブロックに
対して、各可能な切捨て点に対応するレート及び、歪み
を追跡するために必要であることを意味する。コードブ
ロックに対する異なる切捨て点に対応する圧縮されたビ
ットストリームのサイズは、すでに、コードブロック圧
縮ユニットにより発生された、バイトカウントテーブル
(108)を介して有効である。上述のレート−制御問
題の解決方法は、Y.Shoham及びA.Gersh
oによる、IEEE音響、音声及び、信号処理処理論文
集(IEEE Transactions on Ac
oustics,Speech、and Signal
Processing)36(9)(1988年9
月)の第1445−1453の”量子化器の任意の組み
に対する効率的なビット割当て(Efficient
bit allocation for an arb
itrary set of quantizer)”
に記載されている。
【0036】本発明の好適な実施例では、各サブバンド
係数に対する歪み−重みファクターは、入力画像の語義
に関する意味を使用して計算される。図6は、主対象検
出(MSD)ユニット(110)のフロー図を示す。M
SDユニット(110)は、信頼値を、画像内の画素に
割当てる。ディジタル画像(101)が、画像分割ユニ
ット(601)に入力される。画像は最初に、各領域の
色又はテクスチャーの分析により、均一な領域に分割さ
れる。特徴抽出ユニット(602)は、有益な特徴を抽
出し、これは、画像の構造的又は語義的な特徴を含む。
信頼計算ユニット(603)は、信頼値を、一部には抽
出された特徴情報に基づいて画素に割当てる。同じ信頼
値が、各領域内の全画素に割当てられる。結果の情報
は、画像に対する信頼マップ(111)内に集められ
る。従って、信頼マップは、領域基準と各領域の位置に
関するデータにより、領域に関する画像内の全画素に対
する信頼値内のデータを含む。
【0037】主対象検出の問題は開発され且つ、本発明
の譲受人の特許出願の主題である。第3者オブザーバー
の視点からの、民生用形式の写真画像内の主対象検出の
システムは、開発され、J.Luo,S.Etz及び、
A.Singhalにより、1998年12月31日に
出願された、” 民生用画像内の自動主対象決定の方法
(Method for Automatic Det
erminationof Main Subject
s in Consumer Images)”の米国
特許出願番号09/223,860に開示されている。
米国特許出願番号09/223,860の内容は参照に
よりここに込みこまれる。
【0038】主対象検出は、画像内で異なる対象に関連
する異なる領域に対する、特徴の測定値又は、相対的な
重要性を提供する。これは、画像内の画素に割当てられ
る前述の連続する信頼値である。どのように人間の観測
者は主対象検出とクロッピングのようなタスクを実行す
るかを反映する、コンピュータビジョンの分野の従来の
知識は、認識された対象に従って、対象認識及びシーン
内容決定を介して、問題解決パスを必要とする。
【0039】本発明と前述の米国特許出願番号09/2
23,860に関して、主対象検出システムは、いつで
も利用できるときに統合された語義に関する情報を伴な
う、最も低レベルの視覚特性で構築される。この主対象
検出システムは、領域のセグメント化、知覚的グルーピ
ング、特徴抽出及び、見込みに基づく推論を含む、幾つ
かのサブタスクを有する。特に、多数の特徴が、広範囲
な視覚の突出特徴を表すために、画像内の各セグメント
化された領域に対して、抽出され、そして、連続の値を
含む信頼マップを発生するために、調整できる、拡張可
能な確立ネットワークに入力される。
【0040】主対象検出を使用し、主対象領域に属する
領域は、一般的には、画像内の背景クラッターから区別
される。このように、主対象の選択的な強調又は背景の
逆強調が、可能である。自動対象強調は、ある程度のシ
ーンの理解無しに均一の背景を含む必要のない、未制約
画像には不可能と考えられる、重要な動作である。内容
駆動対象強調無しでは、従来のシステムは、主対象を外
形化するためにマスクを手動で生成することに頼る。こ
の手動手順は、面倒であり、且つ映画,製作スタジオで
使用されている。しかし、民生用の商用大量現像で、手
動手順を使用することは現実的でない。
【0041】再び、図6を参照すると、入力画像は、色
とテクスチャーのような均一の特性の幾つかの領域にセ
グメント化される。その領域は、構造的特徴と語義的特
徴の、2つの独立したしかし相補的な特徴形式に関す
る、特徴に関して評価される。例えば、人間の肌又は顔
の認識は、語義的であり、一般的にどの部分が目立つか
は、構造的として分類される。構造的な特徴に関して、
低レベル視覚特徴の組と幾何学的特徴の組が抽出され
る。語義的な特徴に関して、写真画像内で頻繁に見られ
るキーの対象事項が検出される。両形式の特徴からの証
明は、主対象の最終信頼マップを生じるために、ベイズ
(Bayes)ネットに基づく推論エンジンを使用して
統合される。ベイズ(Bayes)ネットに関しては、
J.Pearl、Probabilistic Rea
soning in Intelligent Sys
tem、1988年、CA,サンフランシスコ、Mor
ganKaufmannを参照し、内容は参照によりこ
こに組み込まれる。
【0042】1つの構造的な特徴は、中心性である。位
置に関して、主対象は、画像の周辺よりも、中心付近に
配置される傾向にあり、従って、高度の中心性は領域
が、画像の主対象であることを示す。しかし、中心性
は、領域が画像の中心に、直接あることを意味する必要
はない。実際に、職業写真家は、主対象を線に沿って及
び、画像を、いわゆる黄金分割位置又は3の法則と呼ば
れる、3つに分ける線の交点に配置する傾向にある。
【0043】領域の中心のみでは、領域のサイズと形状
の指示無しには、全体画像に関して、領域の位置を示す
のに十分でないことは理解されるべきである。中心性測
定は、所定の領域のエリアをわたり、確立密度関数(P
DF)の積分を計算することにより定義される。PDF
は、主対象領域が、1の値により、手動でアウトライン
化され且つマークされ、そして、背景領域がゼロの値に
よりマークされ、全体のトレーニングセットをわたり、
グランドツルースマップを総和することにより、”検証
(ground truth、グランドツルース)”デ
ータから得られる。本質において、PDFは、位置に関
する、主対象の分布を示す。中心性測定は、正確に中心
でない、所定の領域の各画素が、変化する度合いはその
位置に依存する、領域の中心性(centralit
y)測定値に貢献するように、工夫される。中心性測定
値は、
【0044】
【数7】 に定義され、ここで、(x,y)は、領域R内の画素を
示し、Nは領域R内の画素の番号を示す。
【0045】配向が未知である場合には、垂直と水平の
両方向に画像の中心に関してPDFは対称であり、これ
は、配向−独立な中心性測定値となる。配向が既知であ
る場合には、水平の向に画像の中心に関してPDFは対
称であり、しかし垂直の方向には対称でなく、これは、
配向−従属な中心性測定値となる。
【0046】他の構造的な特徴は、境界状態である。多
くの背景領域は、1つ又はそれ以上の画像境界に接して
いる傾向にある。従って、画像境界上に大きな両の輪郭
を有する領域は、背景にそして主対象に属する可能性が
ある。2つの測定値が、領域の境界状態を特徴化するの
に使用される。それらは、領域が交差する幾つかの画像
境界(以後”境界状態1(borderness1)”
と呼ぶ)及び、画像境界に沿った領域の周囲の割合(以
後”境界状態2(borderness2)”と呼ぶ)
を含む。
【0047】配向が未知の場合には、所定の領域を6つ
のカテゴリーのうちの1つに置くのに、境界状態1が使
用される。これは、番号と領域が接している画像境界の
構成により決定される。領域は、領域内の少なくとも1
つの画素が画像の境界の固定の距離内にあるときに、境
界と接している。距離は、画像の短い寸法の分数として
表現される。境界状態1の6つのカテゴリーは、領域が
接する、なし、1境界、2境界、2の面している境界、
3又は4境界である。境界との接触領域が多くなると、
主対象でない確立が増加する。
【0048】画像配向が既知の場合には、境界状態特徴
は、ボトムの境界に接する領域よりも、トップの境界に
接する領域が背景領域でありそうであるという事実を考
慮して、再度定義される。この結果は、領域が接触して
いる画像境界の数と構成により決定される境界状態1に
対する12のカテゴリーとなる。上述から”接触してい
る”の定義を使用し、画像が、直立するシーン内の物体
に向けられるときに、画像の4つの境界が、それらの位
置に従って、”トップ”、”ボトム”、”左”、”右”
とラベル付けされる。
【0049】第2の境界状態特徴、境界状態2(bor
derness2)は、画像境界上の領域周囲の部分と
して定義される。この部分は、真に、半分を超えること
はできず、そのようにすることは、領域は負のエリアを
有し又は、領域の一部が画像エリアの外側に位置し、こ
れは、任意の画像に対して未知であることを、意味する
ためである。そのような部分は、半分を超えることがで
きないので、以下の定義は、特徴値をゼロから1の範囲
に正規化するのに使用される。
【0050】
【数8】 1つの語義的な特徴は人間の肌である。2000画像を
超える写真画像データベースの検討により、写真画像の
70%以上が、人間が写り、そして約同数の画像が、か
なり大きい顔を有する。
【0051】肌色のトーンは、画像で共通である。確か
に、写真では、人は単一の最も重要な主題である。従っ
て、肌色トーンを効果的に検出できるアルゴリズムは、
画像の主対象を識別するのに有益である。
【0052】本発明では、肌色検出アルゴリズムは、カ
ラー画像セグメンテーションと特定のクロミナンス空間
内の予め定められた肌色分布、P(skin|chro
minance)を使用する。異なる人種間の大きな変
化は輝度方向に沿っっており及び、照明源の影響も主
に、輝度方向に沿っっていることは、当業者には知られ
ている。このように、所定の領域が定義されたクロミナ
ンス空間内に落ちる場合には、輝度のレベルに関わら
ず、確率は肌である。参考のために、Leeの”物理学
及び精神物理学に基づくカラー画像の量子化(Colo
r image quantization base
d on physics and psychoph
ysics)”、Jounal of Society
of Photographic Science
and Technology ofJapan、Vo
l.59、No.1、212−225ページ、1996
年を参照し、参照によりここに組み込まれる。肌色領域
の分類は、所定のクロミナンス空間内にあるかに関し
て、セグメント化された領域の平均色に従った最大の確
率に基づいている。しかしながら、領域が肌であるか否
かに関する判断は、主にバイナリー1である。連続の肌
色信頼値を使用することが、ある程度、肌を識別し且つ
より高信頼値を割当てる目的に、矛盾する。この問題を
防ぐために、肌色確率は、S字状の信頼性関数を介して
信頼出力にマップされ、”ソフト”しきい値化演算子と
して働く。S字状の信頼性関数は、当業者には理解され
る。
【0053】所定の領域が主対象かどうかの決定に関
し、タスクは、事後確率、P(main subjec
t detection|feature)に基づい
て、画像の所定領域が主対象である確率を決定すること
である。
【0054】本発明の例示の実施例では、画像内の各領
域に対して活性化された、1つのベイズ(Bayse)
ネットがある。従って、見込みに基づく推論は、(画像
ごとの代わりに)領域基準で実行される。
【0055】例示の実施例では、主対象検出アルゴリズ
ムの出力は、各々が主対象である確率(又は、信頼)の
降順にランク付けされた、セグメント化された領域のリ
ストである。このリストは、容易く、各領域が配置され
且つ領域の主対象信頼性に比例する信頼値が割当てられ
た、信頼性マップに変換される。従って、このマップ
は、主対象信頼マップと呼ばれる。信頼マップ内に採用
されている連続の信頼値のために、信頼マップは、決定
された主対象の位置を示すのみのバイナリーマップ以上
のものである。関連する確率も、各領域に添付され、そ
れにより、大きな値を有する領域は、主対象の一部であ
る、高信頼性又は信頼を有する領域に対応する。
【0056】異なる観測者は、どれが主対象かに関し
て、異なる観測者は、ある対象に同意せず、一方、他の
対象に同意するので、ある程度、この、信頼マップは、
主対象検出としてのタスクを実行する人間に関する固有
の不確かさを反映する。これは、バイナリー主対象決定
の問題を示す。各観測者の主観的知覚が、主対象検出ア
ルゴリズムに影響する。従って、正しいものが各観測者
の意見のみで保持され、その意見は、各観測者で変わる
ので、主対象を正確に正しく検出することは不可能であ
る。しかしながら、バイナリー判断は、望まれるとき
に、容易く、信頼マップに適切なしきい値を使用するこ
とにより、得られ、しきい値以上の信頼値を有する領域
は、主対象と任意に定義され、そして、しきい値以下の
信頼値を有する領域は、背景領域と任意に定義される。
【0057】本発明の好適な実施例では、主対象強調を
決定するために、連続の信頼値を有する主対象信頼マッ
プが、バイナリーマップの代わりに使用される。バイナ
リーマップが使用される場合には、主対象からの領域
が、背景領域と間違って分類された場合には、非常に少
ないビットを割当て、それにより、大きな歪みを起こ
す。従って、再構成された画像の視覚品質は、主対象検
出プロセスの強さに、非常に依存する。これは、主対象
検出に、完全に自動化され且つ強いシステムを設計する
ことが難しいので、危険である。また、主対象の決定は
観測者毎に変わる。逆に、連続の信頼値を有する主対象
信頼マップを使用するときに、主対象上に置かれた強調
は、即ち、高信頼値を有する領域に比較的大きな数のビ
ットを割当てる処理は、徐徐である。これは、ある観測
者に視覚的に不快な不可逆な判断をすることを避ける優
位点がある。
【0058】画像圧縮の観点から、高信頼値を有する画
素内の再構成された誤差は、低信頼値を有する画素内の
同様な大きさの誤差よりも、更に不快であると仮定する
のが合理的である。これは、高信頼値を有する領域内の
歪みは、更に重く重み付けされるべきであることを暗示
する。これを達成する1つの方法は、式3内の歪み-重
みファクターw(g,h)を、主対象信頼マップに基
づいて、変更することである。1つの明かな難しさは、
歪み-重みファクターw(g,h)はサブバンド領域
内の係数に対して視覚的重みを決定し、一方、主対象信
頼マップは画像領域内にあることである。歪み−重み計
算ユニット(112)は、各サブバンド係数に対する、
歪み-重みファクターw(g,h)を、入力画像に対
する主対象信頼マップから得る。
【0059】前に、特定のサブバンド係数に対応する基
礎関数をどのように計算するかを説明した。基礎関数
は、そのサブバンド係数に対する歪み重みを得るのに使
用できる。前のように、
【0060】
【外7】 は、サブバンドiからの、サブバンド係数x(g,
h)に対応する基礎関数を示す。サブバンド係数は、量
子化され、そして、再構成された値を、
【0061】
【外8】 とする。そして、再構成された値は、元の係数と量子化
誤差e(g,h)の和として表すことができる。
【0062】
【数9】 設計動作は線形であるので、サブバンド係数x(j,
k)内の量子化誤差e (g,h)による、再構成され
た画像内の歪みは、
【0063】
【数10】 である。
【0064】特定の画素位置(u,v)での知覚された
歪みが、その画素位置の主対象信頼値の関数である場合
には、サブバンド係数x(j,k)の量子化による、
再構成された画像内の知覚される歪みは、
【0065】
【数11】 であり、ここで、p(u,v)は、主対象信頼マップ値
を示し、Gは、特定の位置での信頼値であり、そして、
和は、基礎関数
【0066】
【外9】 のサポート領域をわたる。このように、サブバンド係数
(g,h)に対する歪み−重みファクターは、
【0067】
【数12】 である。一旦、各サブバンド係数に対する、歪み−重み
(113)は、計算され、そして、Y.Shoham及
びA.Gershoによる、IEEE音響、音声及び、
信号処理処理論文集36(9)(1988年9月)の第
1445−1453頁の”量子化器の任意の組みに対す
る効率的なビット割当て(Efficient bit
allocation for an arbitr
ary set of quantizer)”に記載
されたレート−歪み最適化アルゴリズムは、各コードブ
ロックに対する切捨て点を決定するのに使用される。入
力画像が、カラー画像(マルチコンポーネント)である
場合にでも、単一の主対象信頼マップが計算されそし
て、各(おそらく変換された)コンポーネント画像の歪
み−重みを計算するのに使用される。
【0068】数式6から、各係数に対して歪み−重みフ
ァクターを計算するために、その係数に対応する基礎関
数のサポートする領域をわたり、総和の項が評価される
必要がある。分解の各レベルに対して、サポートの領域
が、約、合成フィルタの長さだけ広がる。従って、歪み
−重みファクターの計算の複雑さは、非常に速く成長す
る。計算の複雑さを減少させるいくつかの技術は以下の
様である。
【0069】同じサブバンドからの異なる係数に対応す
る基礎関数は、互いにシフトされたものであるので、基
礎関数は、各サブバンドに対して1回のみ正確に計算さ
れる必要がある。更に、基礎関数の2乗
【0070】
【外10】 は、予め計算されそして、蓄積されている。また、基礎
関数は、典型的には、サポートの領域の中心から離れる
と急速に減衰する。これは、
【0071】
【外11】 の小さな値をゼロに設定することにより利用される。こ
れは、大量の計算を節約する。
【0072】本発明の他の実施例では、各サブバンド係
数に対して、その係数に対応する基礎関数のサポートの
領域が識別される。そして、サポートの領域からの全信
頼値の平均が、その係数に対する、主対象信頼値と呼ば
れる。サブバンド係数に対する歪み−重みは、この平均
値の関数である。好適な実施例では、歪み重みは、平均
信頼値の2乗に設定される。当業者は、他の選択も可能
であることは理解される。例えば、3乗関数又は、ルー
ト関数も使用されうる。選択された関数は、主対象領域
上に置かれた強調に作用する。本発明の他の実施例で
は、サブバンド係数に対する主対象信頼値は、その係数
に対応する基礎関数のサポートの領域からの信頼値のメ
ジアン(又は、固定の百分位数)に設定される。上述の
ように、サブバンド係数に対する歪み−重みは、メジア
ン値の関数である。
【0073】他の実施例では、各コードブロックに対し
て、単一の歪み−重みファクターが計算される。これ
は、つぎのように達成される。第1に、各コードブロッ
ク内の各サブバンドに対するサポートの領域が決定され
る。そして、コードブロックに対するサポートの領域
は、これはそのコードブロックに属する全サブバンド係
数のサポートの領域の結合であるように定義され、決定
される。全体のコードブロックに対する主対象信頼値
は、そのコードブロックに対するサポートの領域からの
主対象信頼値の平均に等しいように設定される。コード
ブロックに対する歪み−重みファクターは、主対象信頼
値の関数に設定される。前述のように、平均を計算する
代わりに、メジアン又は、特定の百分位数画計算され得
る。同様に、関数は、そのコードブロックに対する主対
象信頼値の2乗に選択されるが、しかし、ルート又は3
乗のような他の選択も可能である。
【0074】JPEG2000圧縮前に、元の画像にプ
リフィルタリングを適用するのも望ましい。背景領域は
低ビットレートで符号化されるので、背景領域内で見ら
れる典型的な圧縮歪みは、大きなしみである。背景は、
圧縮された画像内で大きな滑らかな背景領域の間に時々
鋭い構造を有し、均一な低い画像品質を有するように
は、見えない。背景領域の劣化を更に優雅にするため
に、画像を予め平滑化することが可能である。好適な実
施例では、これは次のように達成される。元の画像内の
各画素が、空間的に変化する低域通過フィルタでフィル
タされる。低域通過フィルタの遮断周波数は、主対象信
頼値に依存する。信頼値が、1.0である場合には、フ
ィルタはオールパスフィルタであり、一方、信頼値が、
0に近い場合には、大きな空間的範囲を有し、且つ非常
に低遮断周波数である。予め平滑化することの利益は、
背景領域を圧縮するのに使うビットを更に節約し、且
つ、背景を更に均一に見えるようにすることである。
【0075】前述のように、本発明は、他の圧縮システ
ムにも適用できる。例えば、符号化器では、ウェーブレ
ット又はサブバンド分解が、ある程度の空間的なローカ
リティを提供する他の空間−周波数分解で代理される。
また、変換符号化器のようなブロックに基づく符号化器
にも適用できる。図7は、ISO/IEC国際規格10
918−3に記載されたJPEG規格への拡張に基づく
変換符号化器を示し、その内容は、参照によりここに組
み込まれる。符号化器は、空間的な適応量子化のため
に、主対象信頼マップを使用する。JPEG規格への拡
張は各画像成分に対する量子化マトリクスの仕様を、
W.B.Pennebaker及びJoanL.Mit
chellの、JPEG Still Image D
ata Compression Standard
(JPEG静止画データ圧縮規格)、Van Nost
rand Reinhold、ニューヨーク1993
年、に記載のように許す。更に加えて、各8x8ブロッ
クに対し、拡張は、量子化マトリクスをスケーリングす
る乗数の仕様を許す。本発明の他の実施例では、各8x
8ブロックに対する乗算器は、図7に示されたブロック
に対する主対象信頼値の平均に依存して変わる。
【0076】図7を詳細に参照すると、ディジタル画像
(701)は、分割ユニット(702)により、8x8
ブロックに分割される。ディジタル画像は、主対象検出
ユニット(703)にも入力される。MSDユニット
(703)は、その画像に対する、主対象信頼値の信頼
マップ(704)を発生する。信頼マップ(704)
は、乗数計算ユニット(705)に送られ、これは、各
8x8ブロックに対する主対象信頼値の平均を計算し且
つ、その平均値を各8x8ブロックに対する乗数(70
6)を決定するのに使用する。JPEG−拡張は、乗数
値に対して、(線形又は非線形の)2つの予め定められ
たテーブルを許す。好適な実施例では、線形テーブル
が、使用される。線形テーブルに対しては、エントリー
は、(1/16)で増加する、(1/16)から(31
/16)の範囲である。8x8ブロックに対する平均信
頼値は、0と1の間であるので、好適な実施例では、乗
数(multiplier)は、
【0077】
【数13】 のように決定され、ここで、averageは8x8ブ
ロックの平均信頼値を示し、そして、
【0078】
【外12】 は、xより小さいか又は等しい最大の整数を示す。結果
の乗数値は、範囲[1/16,31/16]にクリップさ
れる。予想されるように、低い平均信頼値を有する乗数
は高く、粗い量子化となる。当業者は、より低い平均信
頼値が、より高い乗算ファクターにマップされる限り、
他のマッピングも可能であることは、認識する。DCT
ユニット(707)は、2次元離散コサイン変換(2−
D DCT)を使用して、変換された8x8ブロック
(708)を発生するために、各8x8ブロックを変換
する。量子化ユニット(709)は、量子化された係数
(710)を発生するために、適切な量子化マトリクス
と乗数計算ユニット(705)により供給される乗数
(706)を使用して、DCT係数を量子化する。そし
て、エントロピー符号化及びシンタックス発生ユニット
(711)は、JPEG規格にへの拡張に互換の圧縮さ
れたビットストリーム(712)を発生する。
【0079】前の例では、JPEG拡張に対するビット
ストリームシンタックスは、各8x8ブロックに対する
乗数を変化させるための規定を有する。当業者には、異
なるブロックに基づく符号化器が使用されている場合に
は、主対象信頼マップに基づく、各ブロックに対する量
子化の範囲の変更は、サイド情報の形式で復号器に送ら
れることは、認識される。例えば、各ブロックを符号化
するのにベクトル量子化を使用する、ブロックに基づく
符号化器を考える。ベクトル量子化のコードブックのサ
イズは、そのブロックの主対象信頼値の平均に基づき変
わりうる。この、情報はサイド情報として復号器に送ら
れ、それにより、復号器は適切なサイズを有するコード
ブックを使用して、量子化器インデックスを復号でき
る。
【0080】本発明の主題は、ディジタル画像理解技術
に関連し、これは、人間の理解可能な物体、属性又は状
態を、認識し且つそれにより有益な意味を割当て、そし
て、ディジタル画像の更なる処理内で得られた結果を使
用する、ディジタル画像をディジタル的に処理する技術
を意味する理解される。
【0081】
【発明の効果】上述のように、対象内容分析に基づい
て、画像の異なる空間−周波数領域に対して量子化の範
囲を適応させる方法により、特定のビットレート又は圧
縮比を達成しようとするときには、エンドユーザに知覚
される再構成された画像品質のために重要でありそうで
ある領域の視覚品質を最大化することができる。
【図面の簡単な説明】
【図1】本発明に従ったJPEG2000符号化器のブ
ロック図である。
【図2】1−D信号に対する2−バンドフィルタバンク
を示す図である。
【図3】2−レベルオクターブ分解を示す図である。
【図4】コードブロック圧縮ユニットのブロック図を示
す図である。
【図5a】均一デッドゾーンスカラー量子化器に対す
る、Δと2Δそれぞれのステップサイズに対する、判断
しきい値と再構成レベルのグラフを示す図である。
【図5b】均一デッドゾーンスカラー量子化器に対す
る、Δと2Δそれぞれのステップサイズに対する、判断
しきい値と再構成レベルのグラフを示す図である。
【図6】主対象検出(MSD)ユニットのブロック図を
示す図である。
【図7】主対象信頼マップを使用するJPEG拡張に基
づく符号化器のブロックを示す図である。
【符号の説明】
101 ディジタル画像 102 サブバンド分解 103 サブバンド係数 104 コードブロック分割ユニット 105 コードブロック 106 コードブロック圧縮ユニット 107 圧縮されたコードブロックビットストリーム 108 バイトカウントテーブル 109 ビット予算 110 主対象検出(MSD)ユニット 111 信頼マップ 112 歪み−重み計算ユニット 113 歪み−重み 114 レート−制御ユニット及びJPEG2000ビ
ットストリームオルガナイザー 115 符号化されたディジタル画像 401 スカラー量子化器 402 量子化された係数 403 エントロピー符号化器 404 テーブル発生ユニット 405 量子化器ステップサイズ 601 画像分割ユニット 602 特徴抽出ユニット 603 信頼計算ユニット 701 ディジタル画像 702 分割ユニット 703 主対象検出(MSD)ユニット 704 信頼マップ 705 乗数計算ユニット 706 乗数 707 DCTユニット 708 変換された8x8ブロック 709 量子化ユニット 710 量子化された係数 711 エントロピー符号化及びシンタックス発生ユニ
ット 712 符号化されたディジタル画像
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジエボ ルオ アメリカ合衆国 ニューヨーク 14620 ロチェスター ユニヴァーシティ・パーク 805 Fターム(参考) 5C059 KK02 MA00 MA24 MB06 MC16 PP01 PP29 UA02 UA15 UA39 5C078 BA53 CA21 DA01 5J064 AA01 BA16 BC11 BC15 BC16 BC21 BC28 BD04

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 ディジタル画像から圧縮されたビットス
    トリームを生成する方法であって、 a)画像内の対象及び背景領域の重要性に関連する連続
    の信頼値を含む、主対象信頼マップを発生するために、
    ディジタル画像を処理するステップと、 b)変換係数の配列を発生するために、ディジタル画像
    に、空間−周波数変換を実行するステップと、 c)信頼マップから、各変換係数に対して、歪み−重み
    ファクターを得るステップと、 d)歪み−重みファクターに応答する画像圧縮システム
    を使用して、圧縮されたビットストリームを発生するス
    テップと、を有する方法。
  2. 【請求項2】 ステップd)の画像圧縮システムは、エ
    ラー関数を最小化する歪み−重みファクターを使用し
    て、目標サイズを超えない圧縮されたビットストリーム
    を発生する、請求項1に記載の方法。
  3. 【請求項3】 画像圧縮システムは、JPEG圧縮であ
    る、請求項1に記載の方法。
  4. 【請求項4】 画像圧縮システムは、JPEG2000
    圧縮である、請求項1に記載の方法。
JP2002193791A 2001-07-03 2002-07-02 ディジタル画像から圧縮されたビットストリームを生成するための対象内容分析を使用する方法 Pending JP2003116007A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US898230 2001-07-03
US09/898,230 US6895121B2 (en) 2001-07-03 2001-07-03 Method for utilizing subject content analysis for producing a compressed bit stream from a digital image

Publications (1)

Publication Number Publication Date
JP2003116007A true JP2003116007A (ja) 2003-04-18

Family

ID=25409134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002193791A Pending JP2003116007A (ja) 2001-07-03 2002-07-02 ディジタル画像から圧縮されたビットストリームを生成するための対象内容分析を使用する方法

Country Status (3)

Country Link
US (1) US6895121B2 (ja)
EP (1) EP1274250A3 (ja)
JP (1) JP2003116007A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004030343A1 (ja) * 2002-09-27 2004-04-08 Mitsubishi Denki Kabushiki Kaisha 画像符号化装置、画像符号化方法、および画像処理装置
JP2010524298A (ja) * 2007-03-30 2010-07-15 イーストマン コダック カンパニー 圧縮データ量の制御

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10024374B4 (de) * 2000-05-17 2004-05-06 Micronas Munich Gmbh Verfahren und Vorrichtung zum Messen des in einem Bild enthaltenen Rauschens
US7076108B2 (en) * 2001-12-11 2006-07-11 Gen Dow Huang Apparatus and method for image/video compression using discrete wavelet transform
US9264736B2 (en) * 2003-01-14 2016-02-16 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, and decoding device
US7129954B2 (en) * 2003-03-07 2006-10-31 Kabushiki Kaisha Toshiba Apparatus and method for synthesizing multi-dimensional texture
WO2004109586A1 (en) 2003-06-05 2004-12-16 Aware, Inc. Image quality control techniques
US20060280364A1 (en) * 2003-08-07 2006-12-14 Matsushita Electric Industrial Co., Ltd. Automatic image cropping system and method for use with portable devices equipped with digital cameras
KR100656637B1 (ko) * 2004-12-14 2006-12-11 엘지전자 주식회사 정수 ­정수 컬러 변환 방법을 이용한 휴대폰용 정지 영상압축 방법
KR100724932B1 (ko) * 2005-08-02 2007-06-04 삼성전자주식회사 얼굴 검출 장치 및 방법
GB2435140B (en) 2006-02-13 2011-04-06 Snell & Wilcox Ltd Sport action coding
US20080084924A1 (en) * 2006-10-05 2008-04-10 Donald Martin Monro Matching pursuits basis selection design
WO2008067479A1 (en) * 2006-11-29 2008-06-05 President And Fellows Of Harvard College A framework for wavelet-based analysis and processing of color filter array images with applications to denoising and demosaicing
US8761504B2 (en) * 2006-11-29 2014-06-24 President And Fellows Of Harvard College Spatio-spectral sampling paradigm for imaging and a novel color filter array design
EP2094016A1 (en) 2008-02-19 2009-08-26 Thomson Licensing Method and device for compressing an image and storage medium carrying an image compressed by said method
KR101441175B1 (ko) * 2008-08-08 2014-09-18 톰슨 라이센싱 밴딩 아티팩트 검출을 위한 방법 및 장치
US9473792B2 (en) * 2009-11-06 2016-10-18 Texas Instruments Incorporated Method and system to improve the performance of a video encoder
RU2448370C1 (ru) * 2011-03-22 2012-04-20 Открытое акционерное общество "Концерн радиостроения "Вега" Способ обнаружения модификации электронного изображения
WO2016009421A1 (en) * 2014-07-18 2016-01-21 Artincam Ltd. Automatic image composition
US11107462B1 (en) * 2017-10-30 2021-08-31 Facebook, Inc. Methods and systems for performing end-to-end spoken language analysis
US20220092785A1 (en) * 2018-12-18 2022-03-24 Agfa Nv Method of decomposing a radiographic image into sub-images of different types
US11216742B2 (en) 2019-03-04 2022-01-04 Iocurrents, Inc. Data compression and communication using machine learning
CN110517329B (zh) * 2019-08-12 2021-05-14 北京邮电大学 一种基于语义分析的深度学习图像压缩方法
CN110689623B (zh) * 2019-08-20 2020-12-18 重庆特斯联智慧科技股份有限公司 基于增强现实显示的游客导览系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0472885A (ja) * 1990-07-12 1992-03-06 Sharp Corp 画像符号化伝送装置
WO2000018131A1 (en) * 1998-09-18 2000-03-30 Sarnoff Corporation Intra-frame quantizer selection for video compression
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6282317B1 (en) 1998-12-31 2001-08-28 Eastman Kodak Company Method for automatic determination of main subjects in photographic images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0472885A (ja) * 1990-07-12 1992-03-06 Sharp Corp 画像符号化伝送装置
WO2000018131A1 (en) * 1998-09-18 2000-03-30 Sarnoff Corporation Intra-frame quantizer selection for video compression
JP2001145101A (ja) * 1999-11-12 2001-05-25 Mega Chips Corp 人物画像圧縮装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MARTING BOKIEK, C CHRISTOPULOS, E MAJANI: "JPEG 2000 Part I Final Committee Draft Version 1.0", ISO/IEC JTC 1/SC 29/WG 1 N1646R, JPN7008008470, 16 March 2000 (2000-03-16), US, pages 180 - 184, ISSN: 0001192140 *
MARTING BOKIEK, C CHRISTOPULOS, E MAJANI: "JPEG 2000 Part I Final Committee Draft Version 1.0", ISO/IEC JTC 1/SC 29/WG 1 N1646R, JPNX006037017, 16 March 2000 (2000-03-16), US, pages 180 - 184, ISSN: 0000764358 *
MARTING BOKIEK, C CHRISTOPULOS, E MAJANI: "JPEG 2000 Part I Final Committee Draft Version 1.0", ISO/IEC JTC 1/SC 29/WG 1 N1646R, JPNX007041007, 16 March 2000 (2000-03-16), US, pages 180 - 184, ISSN: 0000879126 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004030343A1 (ja) * 2002-09-27 2004-04-08 Mitsubishi Denki Kabushiki Kaisha 画像符号化装置、画像符号化方法、および画像処理装置
US7333661B2 (en) 2002-09-27 2008-02-19 Mitsubishi Denki Kabushiki Kaisha Image coding device image coding method and image processing device
JP2010524298A (ja) * 2007-03-30 2010-07-15 イーストマン コダック カンパニー 圧縮データ量の制御

Also Published As

Publication number Publication date
US6895121B2 (en) 2005-05-17
US20030044078A1 (en) 2003-03-06
EP1274250A3 (en) 2004-07-07
EP1274250A2 (en) 2003-01-08

Similar Documents

Publication Publication Date Title
JP2003116007A (ja) ディジタル画像から圧縮されたビットストリームを生成するための対象内容分析を使用する方法
Walker et al. Wavelet-based image compression
US8184918B2 (en) Header-based processing of images compressed using multi-scale transforms
US6476805B1 (en) Techniques for spatial displacement estimation and multi-resolution operations on light fields
i Ventura et al. Low-rate and flexible image coding with redundant representations
Egger et al. High-performance compression of visual information-a tutorial review. I. Still pictures
JP4219552B2 (ja) 画像及び信号処理のための装置及び方法
Wang et al. Image representation using block pattern models and its image processing applications
Hussain et al. Developed JPEG Algorithm applied in image compression
Pappas et al. Image analysis and compression: Renewed focus on texture
US7630568B2 (en) System and method for low-resolution signal rendering from a hierarchical transform representation
Kuo et al. Spatial noise shaping based on human visual sensitivity and its application to image coding
Kwon et al. Region adaptive subband image coding
Walker et al. The Transform and Data Compression Handbook
Martens Application of scale space to image coding
Cicconi et al. New trends in image data compression
Xue et al. Directly operable image representation of multiscale primal sketch
Arya Devi et al. Compression of gray scale images using linear prediction on wavelet coefficients
Vrindavanam et al. Wavelet and JPEG based image compression: an experimental analysis
Soni et al. Problem of denoising in digital image processing and its solving techniques
Cafforio et al. Edge enhancement for subband-coded images
Albanesi Thresholding wavelets for image compression
Eryurtlu New approaches in low bit rate image and video coding
Ho Variable-rate image coding with hierarchical multistage vector quantization
Lin Fractal image compression using pyramids.

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040415

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060815

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081202