JP5188356B2 - 復号器において画像を逆トーンマッピングする方法 - Google Patents

復号器において画像を逆トーンマッピングする方法 Download PDF

Info

Publication number
JP5188356B2
JP5188356B2 JP2008268430A JP2008268430A JP5188356B2 JP 5188356 B2 JP5188356 B2 JP 5188356B2 JP 2008268430 A JP2008268430 A JP 2008268430A JP 2008268430 A JP2008268430 A JP 2008268430A JP 5188356 B2 JP5188356 B2 JP 5188356B2
Authority
JP
Japan
Prior art keywords
block
scale factor
rdc
blocks
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008268430A
Other languages
English (en)
Other versions
JP2009207114A (ja
Inventor
シャン・リウ
アンソニー・ヴェトロ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US12/039,007 external-priority patent/US7983496B2/en
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2009207114A publication Critical patent/JP2009207114A/ja
Application granted granted Critical
Publication of JP5188356B2 publication Critical patent/JP5188356B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、包括的には画像の符号化及び復号に関し、より詳細には、スケーラブルビット深度を有する画像シーケンスの符号化及び復号に関する。
コンピュータグラフィクスでは、トーンマッピングが画像のダイナミックレンジを変更する。たとえば、トーンマッピングは、ハイダイナミックレンジ(HDR)画像を、ローダイナミックレンジ(LDR)画像に変更することができ、その逆も可能である。画像において、ダイナミックレンジは、ピクセル強度値を記憶するために割り当てられるビット数(ビット深度)によって求められる。トーンマッピングは、画像の外観を損なわないようにしながら、コントラストがシーンの輝度値からレンダリング可能な範囲に大きく低減されるのを回避しようと試みる。
MPEGシリーズ及びITUシリーズのビデオ符号化標準規格のような従来のビデオ符号化方式は、たとえば8ビット/ピクセル(bpp)の固定ビット深度を有するビデオの圧縮によく適している。VHS及びDVDで利用可能な消費者のビデオ、及びデジタルテレビ放送は、通常、8bppであり、ローダイナミックレンジ(LDR)を有するものとみなされる。たとえば、10bpp〜24bppのより高いビット深度を有するビデオは、通常、プロフェッショナル用途に使用され、ハイダイナミックレンジ(HDR)を有する。
図1は、動き推定器110を有する従来の符号化器100を示す。符号化器に対する入力は、固定ビット深度の画像シーケンス又はビデオ101である。ビデオ内のフレーム(画像)は、たとえば8×8ピクセル又は16×16ピクセルのブロックに分割される。ブロックは、1度に1つずつ処理される。動き推定器110が、符号化される現在のブロックに対して、フレームメモリ11に記憶されている基準フレームの最良にマッチングするブロックを確定する。この最良にマッチングするブロックは、現在のブロックに対する予測フレームとしての役割を果たす。対応する動きベクトル112がエントロピー符号化される(150)。入力ビデオの現在のブロックと予測ブロック121との間の差分信号122が求められ(120)、当該差分信号は、動き補償予測器130によって生成される。次いで、差分信号は、変換/量子化プロセス140を経て、1組の量子化変換係数(テクスチャ)141をもたらす。これらの係数は、エントロピー符号化されて(150)、圧縮された出力ビットストリーム109をもたらす。量子化変換係数141に逆変換/量子化160を実行すると共に、その結果を動き補償予測121に加算する(170)ことによって、再構成基準フレーム161が生成され、当該フレームは、フレームメモリ111に記憶されて、入力ビデオ101の連続するフレームの予測130に使用される。出力符号化ビットストリーム109が、動きベクトル112及びテクスチャ(DC係数)141のエントロピー符号化150に基づいて生成される。
図2は、従来の復号器200を示す。入力符号化ビットストリーム201がエントロピー復号器210にかけられ、当該エントロピー復号器210によって、量子化変換係数211及び対応する動きベクトル212の両方がもたらされる。動きベクトルは、動き補償予測器220によって使用され、予測信号221がもたらされる。量子化変換係数211は、逆変換/量子化されて(230)、予測信号221に加算され(240)、再構成された固定(単一)ビット深度ビデオ209がもたらされる。連続するフレームの復号に使用される再構成されたビデオのフレームは、フレームメモリ250に記憶される。符号化器と復号器との組合せは、コーデックとして既知である。
上記方式は、入力画像が固定ビット深度を有する場合に優れた圧縮効率を達成する。現在、ほとんどの消費者向けディスプレイは、8bppのLDRのビデオしかレンダリングすることができない。したがって、従来の符号化方式を直接適用することができる。
より高いビット深度でビデオを観賞するためには、HDR表示装置が必要である。表示技術の進歩により、消費者は、近い将来、HDRビデオの利益を得ることが可能になろうとしている。LDR表示装置及びHDR表示装置の両方を効率的にサポートするためには、LDRビデオとHDRビデオとの両方又はいずれかの再構成を可能にする、ビデオのスケーラブル表現が必要とされる。
1つの方法は、入力HDRビデオ及びLDRバージョンを2つの別個の経路で、すなわち、それぞれ固定ビット深度HDR符号化器及び固定ビット深度LDR符号化器を使用して圧縮することによってスケーラブル表現を達成する。これは、サイマルキャスト符号化と呼ばれる。しかしながら、その方法の圧縮効率は、HDRバージョン及びLDRバージョンの冗長性に起因して非常に低い。また、計算複雑度が非常に高い。1つのビット深度スケーラブルビデオ圧縮方式が、Winken他によって、「SVC bit-depth scalability」(Joint Video Team of ISO/IEC MPEG & ITU-T VCEG, Doc. JVT-V078, 22nd Meeting, January 2007)に記載されている。
図3は、ビット深度スケーラブル符号化器300を示す。入力HDRビデオ301が、トーンマッピング310を使用してLDRビデオ101にダウンコンバートされる。次いで、LDRビデオ101が圧縮されて基本レイヤ109が生成される。基本レイヤからの現在の再構成フレーム115のそれぞれが、逆トーンマッピング320を使用して入力ビデオ301のビット深度にアップコンバートされ、逆トーンマッピングフレーム321が生成される。逆トーンマッピングされたフレーム321と入力HDRフレーム301との間の差分が求められ(329)、次いで、この差分信号が変換/量子化プロセス330を経て1組の量子化変換係数331をもたらす。これらの係数は、エントロピー符号化されて(340)、上位レイヤ341がもたらされる。上位レイヤビットストリーム341は、基本レイヤビットストリーム109と多重化されて(350)、出力ビット深度スケーラブルビットストリーム309が生成される。
図4は、対応する復号器400を示す。入力符号化ビットストリーム401が、基本レイヤ201と上位レイヤ402とに逆多重化される(410)。基本レイヤは、上述のように復号される。上位レイヤも、エントロピー符号化(210)及び逆変換/量子化されて出力431を生成する。この場合、フレームメモリ250の出力が逆トーンマッピングされ(420)、このマッピングの出力が出力431に加算されて、入力ビデオ101の再構成409が生成される。
従来技術のビット深度スケーラブルビデオコーデックでは、トーンマッピング320のための3つの方法が既知である。これらの方法は、線形スケーリング、線形補間、及びルックアップテーブルマッピングを含む。これらの方法のすべてが、ビデオ全体内のフレームのすべてに同じ逆トーンマッピングを適用するが、これは、LDRビデオが局所的な、すなわち、領域ベースのトーンマッピング310方法によってHDRビデオから生成される場合にはうまく機能しない。
実際には、局所的トーンマッピング方法は、関心領域(ROI)を有する多くの用途において使用されている。さらに、線形スケーリング方法及び線形補間方法は、比較的粗く、大域的にトーンマッピングされたLDRビデオにさえ、劣った逆トーンマッピング品質をもたらす。ルックアップテーブルマッピングは、より良好な逆トーンマッピング結果を達成するが、ビデオシーケンス全体を試験することによってピクセル強度値のマッピングを構築するために、初期トレーニングを必要とする。このプロセスは、非常に複雑であり、結果として、復号及び表示の前に著しい初期遅延が生じるため、多くのリアルタイムの用途には適切ではない。また、この方法は、多くのROI用途でうまく機能しない。
別の逆トーンマッピング方法が、Segall及びSuによって、「System for bit-depth scalable coding」(Joint Video Team of ISO/IEC MPEG & ITU-T VCEG, Doc. JVT-W113, April 2007)に記載されている。この方法では、2つのスケール係数が使用され、一方が輝度成分に使用され、もう一方が色度成分に使用される。これらのスケール係数は、逆トーンマッピングを実施するために各ブロックに割り当てられる。したがって、この方法は、ROI用途により適している。主要な欠点として、これらのスケール係数は、集合{0.5,1,1.5,2,2.5,3,3.5,4,4.5}として予め定められており、このスケール係数の集合は、特定のビット深度における入力ビデオには適している。したがって、この方法は、さまざまなビット深度を有するHDRビデオを圧縮する柔軟性を失う。別の欠点は、同一のスケール係数がすべての色度成分に使用されることである。これによって、逆トーンマッピング品質が劣化し得る。
明らかに、ビット深度スケーラブルビデオ圧縮方式に適合すると共に、従来技術の欠点を克服する逆トーンマッピングを有することが望ましい。具体的には、高い品質をもたらし、広範なトーンマッピング技法に適合すると共に、多大な符号化オーバヘッドを受けない逆トーンマッピング技法が必要とされている。
方法及びシステムは、復号器において画像の逆トーンマッピングを実施する。画像の各カラーチャネルの各ブロックに対して、以下のステップが実施される。
現在の画像のブロックのスケール係数が、現在のブロックの予測スケール係数を、当該予測スケール係数と隣接するブロックのスケール係数との間の差に加算することによって求められる。
現在のブロックのオフセット値が、現在のブロックの予測オフセットを、当該予測オフセット値と隣接するブロックのオフセット値との間の差に加算することによって求められる。
これらのスケール係数及びオフセット値を現在のブロックのピクセル強度値に適用して、マッピングされたブロックを生成し、ここで、当該マッピングされたブロックのビット深度は、現在のブロックのビット深度よりも高い。
本発明は、トーンマッピングを使用して画像及びビデオのビット深度表現間で変換するシステム及び方法を提供する。ビット深度変換は、ローからハイ(LDR→HDR)、又はハイからロー(HDR→LDR)のいずれかとすることができる。画像及びビデオは、共に、1チャネルモノクロ、及び多チャネルカラーとすることができる。ブロックの寸法は、可変とすることができる。本方法は、以下のパラメータ、すなわち、スケール係数、オフセット値及び予測方向を使用する。これらのパラメータは、各カラーチャネルにおける各ブロックに対して求められる。最適なスケール係数を求めるプロセスも説明する。スケール係数の集合を固定又は限定する従来の方法とは対照的に、本発明のスケール係数は、カスタマイズすることができると共に、スケール係数の範囲を、画像内のより大きなダイナミックレンジに適応する程度に、適応的且つ動的に増大させることができる。対応するオフセット値及び予測方向がスケール係数から求められる。
スケール係数及びオフセット値を符号化ビットストリームに効率的に符号化するために、隣接するブロック間に存在する相関を考慮して、各ブロックは、カラーチャネルごとに1つの予測方向と関連付けられる。現在のブロックのスケール係数及びオフセット値が、(予測される)隣接するブロックのスケール係数及びオフセット値から予測される。
本発明の実施の形態を、アップコンバート、すなわち、LDRビデオからHDRビデオへの変換に関して説明する。本発明は、HDRビデオからLDRビデオへのダウンコンバートにも使用することができ、この場合、以下の説明において、用語LDRとHDRとを逆にされたい。
符号化器における逆トーンマッピング
図5は、本発明の1つの実施の形態による逆トーンマッピングプロセスを示す。逆トーンマッピングを、図3の機能ステップ320に置き換えることができる。このトーンマッピングは、変換される各画像の各ブロック及び各カラーチャネルのピクセル強度値501に適用される。
本方法に対する入力は、特定のブロックのピクセル強度値501である。最初に、候補スケール係数の集合の中から最適なスケール係数511が求められる(700)。アップコンバートに関しては、スケール係数は、通常、1以上であり、ダウンコンバートに関しては、スケール係数は、1以下である。しかしながら、変換もスケール係数を考慮するため、所望の変換が達成可能である限り、上記スケール係数範囲に厳密に固執する必要はない。
最適なスケール係数を求めるプロセス700を以下で説明する。オフセット値521は、最適なスケール係数511を使用してアップスケーリングされたLDRピクセル強度値と、現在のブロックのピクセル強度値501との間の差の平均として求められる(520)。
本発明の1つの実施の形態では、スケール係数の予測方向は、オフセット値の予測方向に従う。現在のオフセット値521が、隣接するブロックの基準(LEFT(左)又はABOVE(上))オフセット値522と比較される。LEFT(ブロック)オフセット値が現在のオフセット値521により近い場合、予測方向531は、LEFTとしてセットされ、そうでない場合、予測方向は、ABOVEとしてセットされる。
本発明の別の実施の形態では、オフセット値の予測方向がスケール係数の予測方向に従う。現在のスケール係数が隣接する基準(LEFT又はABOVE)スケール係数と比較される。LEFTスケール係数が現在のスケール係数により近い場合、予測方向531は、LEFTとしてセットされ、そうでない場合、予測方向は、ABOVEとしてセットされる。
予測方向は、隣接するブロック間のスケール係数及びオフセット値の両方の差の関数に基づくこともできる。たとえば、スケーリングとオフセットとの差の重み関数を使用することができる。
予測方向531に基づいて、予測スケール係数512がLEFT又はABOVEのいずれかのスケール係数としてセットされ、予測オフセット値522がLEFT又はABOVEのいずれかのオフセット値としてセットされる。現在のスケール係数511と予測スケール係数512とのスケール係数の差541が求められる(540)。現在のオフセット値521と予測オフセット値522とのオフセット値の差551が求められる(550)。
予測方向531、スケール係数の差541、及びオフセット差551は、エントロピー符号化され(340)(図3参照)、結果として生じる符号化ビットが出力ビットストリーム309に加えられる(350)。
ピクセルごとに、スケール係数511とLDRピクセル強度値を乗算し、オフセット値521を加算することによって、層間予測値321が求められる。
各ブロックに関連するオーバヘッドを低減するために、予測方向を復号器内に存在する情報から導出することもできる。たとえば、予測方向を、現在のブロック及び空間的に隣接するブロックの再構成されたDC係数に従って求めることができる。現在のブロックのDC係数が、隣接するブロックの基準(LEFT又はABOVE)DC係数と比較される。LEFT DC係数が現在のDC係数により近い場合、予測方向531は、LEFTとしてセットされ、そうでない場合、予測方向531は、ABOVEとしてセットされる。予測方向がこのように間接的に求められる場合、出力ビットストリームに明示的に符号化する必要はない。
復号器における逆トーンマッピング
図6は、本発明の1つの実施の形態による逆トーンマッピングを示し、当該逆トーンマッピングは、各カラーチャネルの各ブロックに、且つビット深度スケーラブル復号器400の範囲内で適用される。トーンマッピングは、図4の機能ステップ420に置き換えることができる。上述したように、マッピングは、アップコンバート又はダウンコンバートのいずれのものとすることもできる。
本発明の1つの実施の形態では、各色成分の現在のブロックの予測方向611、スケール係数の差621、及びオフセット値の差631が、それぞれステップ610、620及び630によって、入力ビット深度スケーラブル符号化ビットストリーム601からエントロピー復号される。
本発明の別の実施の形態では、予測方向611は、空間的に隣接するブロックのDC係数から導出される。たとえば、LEFT DC係数が現在のDC係数により近い場合、予測方向611は、LEFTとしてセットされ、そうでない場合、予測方向611は、ABOVEとしてセットされる。
予測方向611に従って、予測スケール係数641及び予測オフセット値651がLEFT隣接ブロック又はABOVE隣接ブロックのいずれかから取得される。現在のブロックのスケール係数645が、スケール係数の差621を予測スケール係数641に加算することによって再構成される(640)。現在のブロックのオフセット値655が、オフセット値の差631を予測オフセット値651に加算することによって再構成される(650)。
層間剰余681がエントロピー復号される(680)。
ビット深度変換670は、各ピクセル強度値とスケール係数645とを乗算し、オフセット値655と層間剰余681とを加算して、トーンマッピングされたHDRブロック609をもたらす。
最適なスケール係数の確定
図7は、本発明の1つの実施の形態による、各カラーチャネルの各ブロックに最適なスケール係数を求めるプロセス700を示す。プロセスのステップは、候補スケール係数の集合の各候補スケール係数に対して繰り返される。ピクセル強度値701が候補スケール係数702と乗算され(710)、スケーリングされたピクセル強度値711がもたらされる。スケーリングされたピクセル強度値711と入力ピクセル強度値712との間の差721がピクセルごとに求められる(720)。現在のブロック内のすべてのピクセル強度値の差分絶対値和(sum of absolute difference:SAD)731が求められる(730)。すべてのスケール係数候補によって生成されたSAD731が比較され(740)、最小SADに関連するスケール係数が、そのブロックに最適なスケール係数として選択される。
上記のプロセスにおいてSADの判断基準を使用する代わりに、平均二乗誤差(MSE)、又は変換差分絶対値和(sum of absolute transformed difference:SATD)のような代替的な測定値を使用することもできる。
別の実施の形態は、最小二乗(LS)フィッティングを使用する。このようにすると、候補スケール係数の数が多い場合に、スケール係数ごとの繰り返しを回避して計算複雑度を低減することができる。
異なるサイズの可変ブロック
これまで、固定ブロックサイズの逆トーンマッピングを説明してきた。ここで、適応的なブロックサイズに適用される逆トーンマッピングを説明する。すなわち、ブロックは、異なるサイズを有し、逆トーンマッピングは、それに従って適用される。
画像又はビデオフレームにおいて、さまざまな領域が、異なる照明条件下で取得され得る。したがって、より高いビット深度を有するHDR(よりビット深度の高い)画像をより低いビット深度を有するLDR画像に変換するときに、異なるトーンマップをこれらの領域に利用することができる。おそらく、これらの領域は、異なるサイズの画像内に分散している。したがって、本発明の逆トーンマッピングを、さまざまな領域に概ね一致する異なるサイズのブロックに適合させる。
逆トーンマッピング、すなわち、LDR画像からHDR画像への層間予測は、より高い符号化効率を達成するために、使用される順方向トーンマップに従って調節可能であるべきである。すなわち、上述した固定ブロックサイズ逆トーンマッピングを、逆トーンマッピングパラメータ、すなわち、スケール係数、オフセット、及び予測モードを含むように拡張すべきであり、これらのパラメータは、異なるサイズを有するさまざまな領域に適応すべきである。
最も正確な層間予測は、各ピクセルが1組のマッピングパラメータ、すなわち、スケール係数、オフセット、及び予測モードを割り当てられるものであろう。しかしながら、これらのマッピングパラメータには過剰なオーバヘッドビットレートが必要とされるため、この結果として、符号化効率は、非常に劣ったものになってしまう。同様に、小さなブロックに関しても、これらのマッピングパラメータは、オーバヘッドを増大させる。より大きなブロックサイズを使用することによって、オーバヘッドを低減することができるが、予測が不正確になる結果として剰余が大きくなり、したがって、ビットレートがより高くなり得る。
したがって、さまざまな領域に適応的なブロックサイズを使用する、すなわち、均一にトーンマッピングされた領域には、より大きなブロックサイズを使用し、不均一にトーンマッピングされた領域には、より小さなブロックサイズを使用することによって、より良好な符号化効率を達成することができる。
適切なブロックサイズを求める多くの方法が存在する。例として、2つの効率的な方法を説明するが、他の方法もこの構想に使用することができる。
レート−歪みコスト(Rate-Distortion Cost:RDC)によるブロックサイズ
一般的に、また図8に示すように、最大ブロックサイズは、M×Nピクセル801であり、たとえば、M=N=16の場合、これは、マクロブロックである。このM×Nブロックに最適なスケール係数及びオフセットを、上記の節で説明したように、たとえば、図7において説明及び図示したように取得することができる。
レート−歪みコスト(RDC)がD+λRとして測定される。ここで、歪みDは、MSEにおいて通常通り測定される。レートRは、スケール係数及びオフセットの符号化のオーバヘッドビットを含む、特定のブロックを符号化するのに使用されるビットの総数である。λは、ラグランジュ乗数である。次いで、M×Nブロックが4つのより小さなサブブロック802に分割され(810)、そのそれぞれのサイズは(M/2)×(N/2)である。これらの4つのより小さなブロックに最適なスケール係数及びオフセットが同様に取得される。
各サブブロックのRDCが独立して求められ、4つのブロックすべてのRDCが合計される。RDC(M,N)として示されるM×Nブロック全体のRDCと、RDC(M/2,N/2)として示される、4つの(M/2)×(N/2)サブブロックの合計されたRDCが比較される。
RDC(M,N)≦RDC(M/2,N/2)である場合、ブロックサイズM×Nが維持される。そうでない場合、各(M/2)×(N/2)サブブロックを、4つの(M/4)×(N/4)のより小さなサブブロックに引き続き分割する。したがって、この時点で各M×Nブロックは、16の(M/4)×(N/4)サブブロックを含む。次いで、上述のように各(M/4)×(N/4)サブブロックのRDCを計算して合計する、すなわち、RDC(M/4,N/4)を求める。RDC(M/2,N/2)≦RDC(M/4,N/4)である場合、ブロックサイズは(M/2)×(N/2)である。そうでない場合、RDC(M/2,N/2)≦RDC(M/2k+1,N/2k+1)となるまで、ブロックサイズを垂直寸法及び水平寸法のそれぞれにおいて半分に低減し続ける。ここで、kは、負でない整数であり、繰り返すごとに1ずつ増分する。
スケール係数によるブロックサイズ
最大ブロックサイズは、M×Nであり、最小ブロックサイズは、m×nである。したがって、各M×Nブロックは、(M/m)×(N/n)サブブロックの合計に分割することができる。この説明を簡潔にするために、(M/m)及び(N/n)の両方を2の累乗とする。
最初に、m×nサブブロックに最適なスケール係数を上述のように求める。次いで、同一のスケール係数を有するサブブロック同士をマージして、1つのサブブロックにする。マージされたサブブロックに関して、スケール係数を計算し直す。相対位置が左と右、及び上と下であるサブブロック同士のみがマージされることに留意されたい。上/左のサブブロックは、「偶数」位置になければならない。すなわち、上/左サブブロックのサブブロックインデックスは、水平寸法及び垂直寸法の両方において、偶数(すなわち、0,2,4・・・)でなければならない。すべての可能なサブブロックをマージするのに数回の繰り返しが必要な場合がある。
従来技術との比較
従来技術のシステムとは対照的に、本発明は、有意な差及び利点を有する。本発明の逆トーンマッピングは、ブロックベースであり、一方、Winken他によって説明されている方法は、汎用的である。したがって、本発明による逆トーンマッピングは、高品質を維持しながらも、ROI用途により適している。
本発明の逆トーンマッピングは、また、様々な領域が異なる照明条件を有する画像に、それらの領域に一致する異なるブロックサイズを使用することによって適用することができる。ブロックサイズは、レート−歪み符号化コスト又はスケール係数に基づくことができる。
また、本発明の逆トーンマッピング技法は、復号及びレンダリングの前に初期遅延を必要としない。結果として、この符号化方式をリアルタイムの用途に適用することができる。
本発明の逆トーンマッピング技法は、また、(LDR)ピクセル強度値を求めるために適用されている(順方向)トーンマッピング技法から独立して適用することができる。これは、実際には、復号器は、符号化中に適用されたトーンマッピングの知識を有しないため、重要である。
Segall及びSuによって説明されている方法と比較して、本発明の逆トーンマッピングパラメータは、各画像の各ブロックの各カラーチャネルの予測方向、スケール係数、及びオフセット値を含む。従来技術は、同じスケール係数及びオフセット値を2つの色度成分に適用する。したがって、本発明の逆トーンマッピング方法は、特に、異なるビット深度が異なるカラーチャネルに使用される場合に、多カラーチャネル用途に対してより普遍的である。本発明の方法は、4つ以上のカラーチャネルが使用される場合にも適用することができることに留意されたい。
本発明の逆トーンマッピングは、隣接するブロックからブロックオフセット値及びスケール係数を予測する。従来技術は、オフセット値を予測しない。代わりに、オフセット値は、周波数領域におけるDC係数として符号化される。オフセット値を予測することによって、本発明の逆トーンマッピングは、最小のオーバヘッドしか必要とせず、符号化効率がより高くなる。
本発明によれば、候補スケール係数の範囲は、用途又は入力画像のビット深度に従って動的に適合することができる。従来技術では、スケール係数の集合は、予め定められている。したがって、本発明は、複数の用途、及びビット深度が異なるより広範囲の画像源に、より普遍的に適用される。
従来技術のビデオ符号化器のブロック図である。 従来技術のビデオ復号器のブロック図である。 ビット深度スケーラビリティを有する従来技術のビデオ符号化器のブロック図である。 ビット深度スケーラビリティを有する従来技術のビデオ復号器のブロック図である。 本発明の一実施形態による、符号化器における逆トーンマッピングのブロック図である。 本発明の一実施形態による、復号器における逆トーンマッピングのブロック図である。 本発明の一実施形態による、逆トーンマッピングに最適なブロックベースのスケール係数を求めるプロセスのブロック図である。 逆トーンマッピングを異なるサイズのブロックに適用するプロセスのブロック図である。

Claims (10)

  1. 復号器において画像を逆トーンマッピングする方法であって、前記画像は、複数のブロックを含み、該方法は、前記画像の各カラーチャネルの各ブロックに対して、
    現在のブロックの予測スケール係数を、該現在のブロックのスケール係数と該予測スケール係数との間の差に加算することによって、前記現在のブロックのスケール係数を求めるステップと、
    前記現在のブロックの予測オフセット値を、該現在のブロックのオフセット値と該予測オフセット値との間の差に加算することによって、前記現在のブロックのオフセット値を求めるステップと、
    マッピングされたブロックのビット深度が前記現在のブロックの該ビット深度よりも高く、均一にトーンマッピングされた領域には、より大きなブロックサイズを使用し、不均一にトーンマッピングされた領域には、より小さなブロックサイズを使用することによって、該ブロックが異なるサイズを有するようにマッピングされたブロックを生成するために、前記スケール係数及び前記オフセット値を前記現在のブロックのピクセル強度値に適用するステップと
    を含む復号器において画像を逆トーンマッピングする方法。
  2. 前記逆トーンマッピングは、前記異なるサイズを有する前記ブロックに適合される請求項1に記載の方法。
  3. 前記画像のさまざまな領域が異なる照明条件を有し、前記ブロックの前記異なるサイズが前記さまざまな領域に適合されるように、前記画像を取得するステップをさらに含む請求項2に記載の方法。
  4. 均一にトーンマッピングされた領域にはより大きなブロックサイズが使用され、不均一にトーンマッピングされた領域にはより小さなブロックサイズが使用される請求項3に記載の方法。
  5. 前記異なるサイズは、前記ブロックの符号化のレート−歪みコスト(RDC)によって決まる請求項1に記載の方法。
  6. 前記RDCは、D+λRであり、ここでDは、MSEにおいて測定される歪みであり、Rは、前記スケール係数及び前記オフセット値の符号化のオーバヘッドビットを含む、特定のブロックを符号化するのに使用されるビットの総数のレートであり、λは、ラグランジュ乗数である請求項5に記載の方法。
  7. M及びNを、前記特定のブロックのピクセルに関する寸法とした場合に、前記特定のブロックの前記RDCをRDC(M×N)として求めるステップと、
    前記特定のブロックをRDC(M/2×N/2)として複数のサブブロックに分割するステップと、
    前記サブブロックの前記RDCの和をRDC(M/2×N/2)として求め、RDC(M,N)≦RDC(M/2,N/2)である場合、前記特定のブロックの前記サイズをM×Nとして維持し、そうでない場合、前記分割すること及び前記和を求めることを、RCD(M/k,N/k)≦RCD(M/k/2,N/k/2)となるまで繰り返す(ただし、kは、負でない整数であり、繰り返すごとに1ずつ増分する)ステップと
    をさらに含む請求項5に記載の方法。
  8. 前記異なるサイズは、前記ブロックの符号化のレート−歪みコスト(RDC)によって決まる請求項1に記載の方法。
  9. 前記異なるサイズは、前記ブロックの前記スケール係数によって決まり、
    最大ブロックサイズは、M×Nであり、最小ブロックサイズは、m×nであり、前記方法は、
    特定のM×Nブロックを複数のm×nサブブロックに分割するステップと、
    各前記サブブロックに最適なスケール係数を求めるステップと、
    同一の最適なスケール係数を有する前記サブブロック同士をマージするステップと
    をさらに含む請求項1に記載の方法。
  10. 前記求めるステップ及び前記適用するステップが画像シーケンスに対して実施される請求項1に記載の方法。
JP2008268430A 2008-02-28 2008-10-17 復号器において画像を逆トーンマッピングする方法 Expired - Fee Related JP5188356B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/039,007 2008-02-28
US12/039,007 US7983496B2 (en) 2007-06-26 2008-02-28 Inverse tone mapping for bit-depth scalable image coding adapted to variable block sizes

Publications (2)

Publication Number Publication Date
JP2009207114A JP2009207114A (ja) 2009-09-10
JP5188356B2 true JP5188356B2 (ja) 2013-04-24

Family

ID=41148891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008268430A Expired - Fee Related JP5188356B2 (ja) 2008-02-28 2008-10-17 復号器において画像を逆トーンマッピングする方法

Country Status (1)

Country Link
JP (1) JP5188356B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5270592B2 (ja) * 2010-02-23 2013-08-21 日本電信電話株式会社 画像符号化装置,画像符号化方法および画像符号化プログラム
EP2613532A1 (en) * 2012-01-06 2013-07-10 Thomson Licensing Method of and device for encoding an HDR video together with an LDR video, method of and device for reconstructing one of an HDR video and an LDR video coded together and non-transitory storage medium
US11146803B2 (en) 2013-03-11 2021-10-12 Dolby Laboratories Licensing Corporation Distribution of multi-format high dynamic range video using layered coding
US9911181B2 (en) * 2013-12-27 2018-03-06 Thomson Licensing Method for inverse tone mapping of an image
JP6532962B2 (ja) * 2015-06-09 2019-06-19 華為技術有限公司Huawei Technologies Co.,Ltd. 画像符号化方法、画像復号方法、符号化デバイス、および復号デバイス
KR102531222B1 (ko) * 2015-08-25 2023-05-10 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 루미넌스 존들에 기초한 역 톤 맵핑
EP3456058A1 (en) * 2016-05-13 2019-03-20 VID SCALE, Inc. Bit depth remapping based on viewing parameters
EP4336850A3 (en) 2016-07-08 2024-04-17 InterDigital Madison Patent Holdings, SAS Systems and methods for region-of-interest tone remapping
EP3583780B1 (en) 2017-02-17 2023-04-05 InterDigital Madison Patent Holdings, SAS Systems and methods for selective object-of-interest zooming in streaming video
KR102628139B1 (ko) 2017-03-07 2024-01-22 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 멀티-디바이스 프리젠테이션을 위한 맞춤형 비디오 스트리밍

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding

Also Published As

Publication number Publication date
JP2009207114A (ja) 2009-09-10

Similar Documents

Publication Publication Date Title
US7983496B2 (en) Inverse tone mapping for bit-depth scalable image coding adapted to variable block sizes
JP5153454B2 (ja) 画像の逆トーンマッピングの方法とシステム、および画像の逆トーンマッピングを実行するコーデック
JP5188356B2 (ja) 復号器において画像を逆トーンマッピングする方法
US9473777B2 (en) Video encoding device and encoding method thereof, video decoding device and decoding method thereof, and directional intra-prediction method to be used thereto
JP5232797B2 (ja) 空間予測及びビット深度予測の適応的予測順序を使用してビデオ・データを符号化し、かつ/又は復号化する方法及び装置
KR100679025B1 (ko) 다 계층 기반의 인트라 예측 방법, 및 그 방법을 이용한비디오 코딩 방법 및 장치
US20080240245A1 (en) Image encoding/decoding method and apparatus
US9736475B2 (en) Method and apparatus for generating a reference frame and method and apparatus for encoding/decoding image using the same
JP2005354686A (ja) ビデオ内のマクロブロック毎に最適な符号化モードを選択するための方法およびシステム
US20070047644A1 (en) Method for enhancing performance of residual prediction and video encoder and decoder using the same
US20060120450A1 (en) Method and apparatus for multi-layered video encoding and decoding
US20070268968A1 (en) Moving-picture coding apparatus, method and program, and moving-picture decoding apparatus, method and program
JP2005507587A (ja) 空間的にスケーラブルな圧縮
JP2004048552A (ja) 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および通信装置
KR20110015002A (ko) 향상 계층 비디오 코딩을 위한 적응 양자화
KR20060085892A (ko) 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치
TW201206203A (en) Image encoding device, image decoding device, image encoding method and image decoding method
KR20090090152A (ko) 영상의 부호화, 복호화 방법 및 장치
KR20150034699A (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR20080041972A (ko) 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
US20110170592A1 (en) Method for efficiently encoding image for h.264 svc
WO2007024106A1 (en) Method for enhancing performance of residual prediction and video encoder and decoder using the same
CN109891888A (zh) 基于内部的局部层间预测方法
KR20110087871A (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
Li et al. Hybrid bit-stream rewriting from scalable video coding to H. 264/AVC

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5188356

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees