JP6382805B2 - 改良されたhdr画像符号化及び復号方法並びに装置 - Google Patents

改良されたhdr画像符号化及び復号方法並びに装置 Download PDF

Info

Publication number
JP6382805B2
JP6382805B2 JP2015521101A JP2015521101A JP6382805B2 JP 6382805 B2 JP6382805 B2 JP 6382805B2 JP 2015521101 A JP2015521101 A JP 2015521101A JP 2015521101 A JP2015521101 A JP 2015521101A JP 6382805 B2 JP6382805 B2 JP 6382805B2
Authority
JP
Japan
Prior art keywords
image
hdr
encoding
dynamic range
luma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015521101A
Other languages
English (en)
Other versions
JP2015531183A5 (ja
JP2015531183A (ja
Inventor
マーク ジョゼフ ウィレム メルテンス
マーク ジョゼフ ウィレム メルテンス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2015531183A publication Critical patent/JP2015531183A/ja
Publication of JP2015531183A5 publication Critical patent/JP2015531183A5/ja
Application granted granted Critical
Publication of JP6382805B2 publication Critical patent/JP6382805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、ローダイナミックレンジ(LDR)画像と呼ばれるレガシー画像と比較して広いダイナミック輝度レンジを有する少なくも1つの画像又は映像の改良された符号化のための装置及び方法、並びに、例えばメモリ内に保存されるデータストレージ結果物又は符号化信号等の結果物に関連する。
近年、撮像、画像表示、そして特に画像符号化は、いわゆるローダイナミックレンジ(LDR)イメージング(PAL又はMPEG2等の古典的なシステム)からいわゆるハイダイナミックレンジイメージング(HDR)に改良された。今日のセンサは高い信号電圧レンジ(飽和する又は少なくとも最大許容画素電圧を与えるシーン輝度と最小レベル又は典型的なノイズレベルとの間)を元々有するか、又は、複数の画像、例えば、異なる感度の空間系からの複数の画像若しくは露出設定が異なる連続画像から画像を構成することでセンサレンジを伸長する技術を有する。LDRカメラによる撮像との違いは、LDRカメラは通常一部の領域をクリップ及び/又はソフトクリップし、例えば外部の明輝度は白色になるが(それらの保存される符号化LDR画像画素のルマYは255である)、一方、HDR撮像システムは適切且つ忠実にシーン内の全輝度を取り込むことが可能な点である。しかし、依然として問題なのは、それらをどう扱うか、すなわち、それらを例えばテレビネットワークシステムを介する送信のために如何に符号化すべきか、また、それらを如何にして例えばLDRディスプレイの典型的なピーク輝度より高いピーク輝度(例えば、100又は500ニットではなく3000ニット)を有するHDRディスプレイ上に(忠実若しくは好適に又は少なくとも許容可能に)レンダリングすべきかである。
レンダリング画像の見かけは多くのパラメータ、特に画像内のコンテンツ、レンダリングディスプレイの種類(ピーク輝度等)、及び視聴環境等に依存するので、通常、取り込まれた生のセンサ画像(オリジナルシーンとは密接に関係し得るが、最終的なレンダリング環境とは全く関係せず、よって人間がこれらの2つのシナリオをどう見るかに関する情報は存在しない)の画素カラーが変換され、これはグレーディングと呼ばれる。典型的には、これは人間のグレーダーによって行われてもよい。例えば、映画製作では、(時間及び費用の制約も加味して)室内を正確に照明することが困難な場合があり、特定のグレイパターンの雷雲を作成することは言うまでもない。この場合、シーン照明クルーは少なくとも「十分な」又は「適量の」光をあらゆる場所に作り出す大まかに正しい照明を目標に定め、実物(例えば、テーブル上のキャンドル(又はそれを模したもの)等の雰囲気照明、ネオンサイン等)を配置し得る。しかし、グレーダーがその後画像処理ソフトウェア内でそれを改良し、例えば、グレーダーはあたかも実際のシーンにおいて日が窓から差し込んでいたかのように日差しを描き込むことができる。
LDR符号化は特徴的な他の特性を有していた。専門知識がない人は、LDRを単に画素毎にルマが8ビットコードワードを有する符号化(又は、当然ながら類似の実施形態)として考え、また、その反対に8ビットがLDRを意味すると考えられる可能性がある。しかし、理論的にはそれらの8ビットコードの画像アレイに何を符号化しても構わないので、少なくとも理論的には非常に複雑なパターンを符号化することができ、よってHDR画像をできないとする理由はない。
問題は、部分的には長い歴史的な慣習の遺産であり、センサ電圧(すなわち、シーン輝度の線形表現)が特定のコードマッピング関数に従って8ビットコードに符号化されていたことであった。これは単純な、過度に非線形ではない単調連続関数、すなわちガンマ2.2であった。アイデアは、かかる直接的な接続システムを介する取り込み、コーディング、及びレンダリングの密接な結びつきが、正確且つほぼ自動的なグレーディングの実行をもたらすということであった。信号はCRTディスプレイのカソードに直接印加され、このCRTの物理的特性のためにガンマ2.2が選択された(付随的に、適度に均等な心理視覚的輝度スケールも与えた)。1種類のディスプレイしか存在しない場合、LDR信号である駆動信号による駆動であり、LDR信号がカメラから真っ直ぐに補正ガンマ、すなわち約1/2.2によって自動的にプリグレーディングされれば、ディスプレイは駆動値を出力輝度に正確にレンダリングする。しかし、製作者側のグレーディングアーティストが画素カラーを微調整又は改良することを望む場合、同じ補正後画像で駆動されたために消費者の家庭用テレビが同じレンダリングを概ね正確に与えるよう(視聴者の周囲効果を除き)、グレーダーは製作者側にて同一のCRT上で信号を見ながら行うであろう。
いずれにせよ、このLDR符号化チェーンは閉じた指定として機能し、レンダリング及び符号化(又はグレーディング)が同じものをもたらす。今日、例えば家庭用LCD、電車で画像コンテンツを見るためのIpad、ホームプロジェクタ、及び最近の非常に高輝度なHDRディスプレイ等、顕著に異なるディスプレイが存在することは、レンダリング又はガマットマッピングが画像符号化とは完全に分離したフェーズであることを要求する。同じ入力画像が与えられた場合、これらのディスプレイの出力の見かけにはかなりのばらつきがあり、それが所望されるもの以上に厳しい可能性があるからである。
しかし、いずれにせよ、LDRシステムでは、コンテンツ製作側、例えばカメラと符号化との間では、この密接なリンクは依然として守られていた。最新の消費者用カメラ(特に最近はHDR機能を備え始めたので)はガンマ2.2よりも高度なコードマッピング関数を使用し得るが、依然として高度に非線形ではない比較的類似な関数を有し、すなわち、それらの数学的挙動の多くの側面を線形解析によって近似できない程度には違わない。
これは特に、例えば車に乗っている人のシーン等、比較的輝度レンジが高いシーンを取り込む場合に見られる。人の顔の露出及びコードマッピング関数(例えば、S字曲線)等のファクタの組み合わせは、典型的には、車内のために十分に露光をした場合、外部がコードガマットの上限付近の淡いカラー、すなわち255付近のルマでしか表すことができないという事態をもたらす。これは、カメラ又はカメラマンが例えば顔のカラーコードを平均グレイ付近に(例えば単純さのために128とする)することを選択するからである。この値付近のマッピング関数が2乗関数であると推定すると、値255は4倍高い外部ルマしか表すことができない。当然ながら、実際の値はカメラシステムが(人間のオペレータによる選択を含む)そのような明領域を如何に賢明に取り扱うかに依存し、コードマッピング内の適切なショルダは依然として、少なくとも、顔の輝度の4倍以上の異なるコード値をシーン輝度に割り当てることができる(但し、実際では、余り準備をせずにロケ撮影をする場合、素早く作成されるコンテンツのかなりの部分は画像の大部分を255にクリップし、これがさほど望ましいのかは疑問である)。
いずれにせよ、大まかな目安として、例えば500:1(又は少なくとも1000:1)以上の輝度比では、LDR符号化には問題が生じると言え、少なくともシーンを正しく符号化したい場合はHDR符号化の技術分野に突入する。よって、これは、物体の反射率は通常1%〜100%の範囲であるので、ハイライト−シャドウが約5〜10−1の照明不均一性を作り出す幾何学的形状係数を有する場合に起こる。このような照明低下は、部屋の中の窓から数メートル離れた位置で容易に起こり得る。
同様に人間の観察者に対して特徴的なカラースキームを明示するハイダイナミックレンジシーンの一例は、夕暮れの都市景観である。光が既にそれ(「光」)以上の輝度レベルにジャンプするので、白色は人間の視覚に薄い灰色として映り、シーン内に白色が欠けているように見える。すなわち、これらをHDRディスプレイ上で光物体として示し、且つ、それらが明確に光として認識され得るような態様でそれらを符号化し得ることが望まれるよう(特に、入力信号を駆動信号として直接適用せず、いくらかのガマットマッピング最適化を行うレンダラーによって)。カメラ撮影、コーディング、及びディスプレイが分離されるので、どのダイナミックレンジが指定されるかを注意深く判別すべきであることに留意されたい(また、常に輝度コントラストであるべきではない)。特定の、例えば100000:1のダイナミックレンジは必ずしもレンダリング時に同じコントラストを要さない可能性があるからであり(例えば、画面上の太陽が実際に視聴者の目を傷つける必要はない)、実際に関連するファクタは、心理視覚的に適切な類似の見かけである。汎用的な高度に非線形な符号化において、これがコーデックのダイナミックレンジに関して何かを言うべきことは当然である。特定のマッピング又はコーディング/レンダリング精度等のファクタはいずれもそれに影響を及ぼし得るからである。画面表示に関しては、ディスプレイシステムがLDRディスプレイ上では忠実にレンダリングすることができない特定の光効果、例えば本物の輝くランプ又はあたかも本物に見える屋外シーンの日光等をレンダリング可能な場合、HDRディスプレイシステムを有していることがわかる。そして特に、他のシーン物体(例えば、室内の家具)の明るさがそれと調和し、すなわち、(人間の視覚に関して)明るい物体及び通常の/暗い物体の両方について良好な見かけが得られるようなルマが与えられる。
HDR画像符号化のために最初に想起された(ネイティブ)ソリューションは、特にコンピュータグラフィックの分野で働く人々によって考えられた。コンピュータではあらゆる種類の信号が作成可能なためである(コンピュータでは撮像レンズの制約がなく、超新星の隣の宇宙空間は実際に0輝度を有することができ、またフォトンノイズが捉えることはない)。一切の従来のテレビ技術制約を完全に破棄できるこの枠組みでは、論理的なソリューションはシーン輝度を単に線形に符号化することであろう。これは、画素ルマのためにより多くのコードビット、例えば16又は32ビットが必要であることを意味するであろう。動画の場合は問題になり得る多量のデータのほか、上記のように、このようなネイティブ符号化は画像処理チェーンの残りの部分、すなわちレンダリングシステムと全くつながりがない(又は、符号化画素画像と共に又は別個にではあるがリンク可能にメタデータとして共符号化され得る埋め込み技術知識、例えば付加的な値、測定値、又は方程式に含まれる知識等が存在しない)。
代替的な第2の符号化の方法は、デュアルLCDパネルディスプレイ等のデュアルディスプレイシステム又は2D可変バックライトを備えるシングルパネルLCDによってインスパイアされ又は少なくともこれらに概念的に関連付けられ得る。これらのシステムでは、最終的な出力は背面層ディスプレイが生成する光パターンと前面のLCDの透過率の積である。ここで問題は、例えば上記のようにネイティブ16ビット(少なくともルマ)HDR符号化と、標準ドライバ電子機器及び例えば8ビットLCDの物理的円光能力とを有するとして、如何に両信号を駆動するかということである(つまり、線形透過ではLCDは自身のフル透過の1/255の黒色を作成することができ、非線形挙動の場合はいくらか異なる値を作成し、更に、例えばバックライトが8線形ビットにより変更可能であることを意味する)。この場合の単純なソリューションは、画素ルマの平方根を取り、この平方根の2倍を2つのドライバに送信することであろう。原則的にはあらゆる乗算分解が(理論的には)使用可能であろう。例えば、LCDが透過率を4つのステップ(2ビット線形)でしか変更できない場合、除算の残りを与える信号でバックライトを駆動すれば、依然として正確なHDRシステムを作成することができる。
Y_backlight=Y_HDR/Y_LCD
ここで、この例ではY_LCDは背後の光を4つの異なる態様でより明るく又は暗く変更する(例えば、背後の光の1/80透過であり得る最大黒色対100%透過と、これらの間の等距離透過率)。
Y_HDRは16ビット信号であり、最大値はディスプレイのバックライトを(局所的に)その最大値に(加熱、老朽化等を考慮して)切り替えることにより近似的にレンダリング可能な非常に明るいシーン輝度を意味する。よって、レンダリングは物理的にそのように働くので、同様に線形コーディングを使用して、バックライトは16ビットの1/4のレンジを作成しなくてはならず(65536線形ステップが作成される)、(同様に線形コーディング及び等間隔駆動が必要だと仮定する場合)これはバックライトが14ビット信号により駆動されることを意味する(そのような精度が必要な場合)。したがって、バックライトは、HDR画像をレンダリングするのに必要な任意のファクタによってローカル値をLCDバルブに変更することができる。実際には、これらのディスプレイは画素よりはるかに少ない数のLEDバックライト素子を含んでいたので、何らかの平均輝度に従ってバックライトを駆動することにより、画像の近似がレンダリングされていた。よって、例えばブリティッシュコロンビア大学のUS7172297の請求項2に示されるように、ローカル画像画素の平均ルマを最初に計算し、これが必要なレンダリングを近似するバックライト値をもたらし、そしてY_HDRとこの近似の商としてLCD画素が設定される。したがって、この乗算の興味深い特性は、これが画像の1つを符号化するための線形ビットの減少に対応することであり、これは数学的に一種のレンジ圧縮又はガマットマッピングと見なすことができる。
したがって、これが更に昇華され、すなわち、このような乗算スキームに基づいて任意のHDR画像を符号化するよう昇華された(必ずしも実際の2層ディスプレイについてだけではなく)。すなわち、何らかの汎用トーンマッピングを実行することにより第1の画像を形成し、このマッピングされた8ビット画像から標準JPEG画像(Y_JPEG)を作成することができる。そしてその後、比画像Y_HDR/Y_JPEGである第2の画像を保存する。したがって、デコーダ側では通常のLDRJPEG画像を使用するか、又は2つのLDR画像を乗算することでHDR画像を再作成することができる(オリジナルが2つの8ビット画像を生成する16ビットであったと仮定し、これは全てとは言えないまでもほとんどのHDRシーン又はシナリオで通常十分である)。この方法の第1の欠点は、任意のHDR画像をそのようにして符号化することが可能であるが(比画像内のJPEG画像に含まれるものを補正することにより、又は、例えば、やはり線形を想定する場合、2つの隣接する画像がJPEGでは1であるように選択されるがHDRでは230及び350であるべき場合に起こり得ることであるが、補正が可能レンジを上回る程にJPEG画像が劣悪に符号化されるときは少なくとも適切な近似に到達することができる)、2つの画像を符号化しなければならないことを代償とする。これらの2つの画像をフォーマットするための周辺セマンティクスが必要であることに加えて、数学的相関による節約がなければ、単一の16ビット画像を保存する場合と同じ量のビットが明らかに必要なように見える(少なくとも空間的サブサンプリング等をしない場合)。第2に、この「盲目的な」分解は実際のレンダラーの物理的特性、又は、レンダリングされるシーン内に存在する物理的若しくは心理視覚的セマンティック法則(例えばどの物体が明るいランプに過ぎない等)とは関連性がなく、むしろ、これは単にJPEGベース画像になるよう選択されたものの乗算補正から生成される。とはいえ、これは画像符号化のための良好な後方互換性戦略である。
第3のコーディングの方法は、予測が付加的な補正画像によって補正される予測−補正スケーラブルコーディングの歴史から辿ることができる。元々は、これは特にSNRスケーラビリティにおいて起こり、第1の画像は画素ルマの丸められた又は量子化されたバージョンを含み得る近似であった。これに更なる精度を加える画像が付加される(他の実施形態では例えば空間的近似を含んでもよく、これも補正信号を加えることで補正可能であり、この場合更に例えば境界における高周波が修復される)。したがって、例えば符号化されるオリジナルの(LDR)信号が空間的に隣接する画素127、144を有していた場合、例えば6ビット及び精度ステップ4の近似で符号化され、画素値128及び144を与える。その後、これは値−1及び0を含むより高精度の画像で補正され得る。近似は既に概ね良好であったため、補正信号のレンジはより低くなるはずであり、ビットの節約につながり得る。
あるレンジとレンジ内の精度は原則的に交換可能なので、HDR画像符号化に関してもこのような技術が使用可能であることが想起され得る。実際には、任意のコーディングレンジ(同様に8ビット符号化)の最大値は任意のシーン輝度に対応するよう定めることができる。しかし、HDRシーンにおける輝度ステップの量を考慮して、これは8ビット以上の符号化の場合にのみ適切であり得ると考えられていた。また、単純なスケーラビリティはトーンマッピングにおける一切の変化も示唆せず、すなわち、定義として、ルマ精度問題のみを取り扱い、特定のLDR符号化が任意のHDR符号化に如何に関連するか、又は任意の符号化画像が任意のディスプレイ上に如何にして最適にレンダリングされなければならないか(例えば、より低いピーク輝度のディスプレイ上に全体的に過度に暗くレンダリングされることなく)については何も述べない。
また、この概念に基づき、WO2007/082562において2層HDR符号化方法が開発された(図1参照)。このようなエンコーダでは、取得、符号化(例えば、ガマットマッピングによって)、又は典型的にはグレーディング(典型的にはコンテンツ製作者のために働くアーティストグレーダーによって)され得るHDRとLDRとの間に関係性があることが認識される。例えば、LDRガマット(例えば400ニットの典型的なLDRディスプレイがレンダリングするであろうものによって定義)は例えば晴れた屋外のような明領域を忠実に保持することができない可能性があるので、そのような領域はルマを下げてLDR空間にマッピングされ得る(場合によっては更に色飽和度を下げて)。オリジナルシーンのこのようなLDR符号化からHDR画像を作成することは、例えば所定の若しくはLDRルマ依存輝度を加え若しくは概して少なくともルマにあるマッピング関数を適用して(Y_HDR=f(Y_LDR))LDRルマをオフセットすることにより、画像の明るい屋外領域の画素ルマ/カラーをより高い輝度にマッピングすることを伴う(又は、言い換えれば、HDRグレーディングされた画像がどのようになるかを予測すること)。少なくともよりHDR的な見かけは得ることができるが、この予測がオリジナルのHDRグレードにどれだけ近いかは、特にマッピング/予測関数の正確さ(及び複雑さ)に強く依存する。画像の高度な複雑性のために(これは、通常、例えばいずれにせよオリジナルのHDR画像を完全に正確には予測しないより複雑なものではなく、各画素ルマをもっぱらルマ値にマッピングし、画像内の画素の空間位置等の他のファクタはマッピングしないより単純な予測、例えばグローバルトーンマッピング等を人々に選択させる)差が生じることになり、これは差画像となる。したがって、2層方法はこの画像も符号化する。LDRグレード(原則的にはHDRグレードに近い又は類似する必要はなく、何でもよい)とHDRグレードとの間の差は信号のXビット精度とX+Yビット精度表現との間の差とは全く異なるので、これらの差画像は制限された値域を有さなくてよい。これらは原則的には何でもよく、例えばHDR画素ルマが例えば65000、65004等である一方、画素ルマが連続する0として予測される程に予測が劣悪な場合、8ビット差画像ではなくオリジナルのHDRと同様な16ビット画像でさえ良い(但し、このような最悪のシナリオはあまりに想定しづらいので、このケースではコーデックに単純にミスを起こすよう制約できる)。いずれにせよ、これらの予測コーデックのいくつかを補正画像によって試験した結果、これらが大量の符号化データを要求し得ることが認められ、また、特にこのデータはHDR体験には実際にはそれほど関連しない画像情報を符号化し得ること、例えばHDRルマを誤った方向にマッピングした予測モデルエラーの補正、又は心理視覚的にそれほど関連しないか若しくは少なくともHDR効果に寄与する最も重要な画像構造ではないノイズ若しくは画像構造を符号化し得ることがわかった(HDR関連性の階層において、例えば、炎が重要であり、その見かけは良く選択された少数のデータワードによって予め符号化され得る)。
したがって、以下に提示される技術の一課題は、シーン内のHDR側面(すなわち、光、特定の画像領域への日射等の物体の照光、ローカルコントラスト等の特定の側面の改良されたレンダリング等)の全てとは言えないまでも少なくとも一部の符号化に関するより優れた管理を与えるHDR符号化技術(すなわち、古典的なLDRよりルマレンジに沿う画像領域の品質が高い任意の符号化技術)を提供することであり、例えば、より低いビットレート、又は少なくとも符号化されたビットの階層においてより重要な情報等の潜在的な利点をもたらす。
課題の問題の一部は、第1の輝度ダイナミックレンジ(R_oLDR)に対応する画像符号化(LDR_CONT)を第2の輝度ダイナミックレンジ(R_oHDR)出力画像(HDR_FIN)に復号する方法であって、画像符号化(LDR_CONT)は、ハイダイナミックレンジシーンのオリジナル画像(HDR_ORIG)の符号化画素であり、
所定のトーンマッピング戦略(FL2H)により、画像符号化(LDR_CONT)内の画素の少なくともルマを、第2の輝度ダイナミックレンジ(R_oHDR)に対応する中間画像(HDR_PRED)内の画素のルマにトーンマッピングするステップと、
中間画像(HDR_PRED)の少なくとも一部の画素のルマに所定の乗算係数を掛けることにより当該ルマを変更し、出力画像(HDR_FIN)を得るステップと
を含む、方法によって処理される。
符号化画素とは、当然ながら、(画素は、選択された表色系において定められる、特定のサンプリング位置のテキスチャカラーサンプリングなので)画素の情報、すなわちそれらが表す画像物体のテキスチャ、すなわち画素のカラー表現(例えばYCrCb又はRGB))を意味する。しかし、LDR_CONTはオリジナルHDR画像のカラー符号化における実際の表現を保持せず(3x8ビット画像として符号化される場合でも)、LDR_CONTは新しい色であるこれらの色の変換を保持するが、新しい色は依然としてオリジナル画像をレンダリングするために必要とされる空間−統計的カラー情報を保持する。したがって、画素は依然として同じ幾何学的画像物体構造を表すが、特定のディスプレイ上でレンダリングされる場合は入力オリジナルHDR画像とは異なる比色的見かけを有する(しかし、情報理論的に、比色的変換が何であれ、オリジナル画像内に存在したものと同じ情報、すなわちHDRシーン内の情報の良好な捕捉が、画像符号化LDR_CONT内に依然としてほぼ全て存在し、少なくとも追加メタデータ、特に本発明の実施形態に係るメタデータを用いることで再取得可能である)。画像に対応する又は関連付けられたダイナミックレンジとは、それが主に特定のダイナミックレンジのディスプレイ、又は類似するダイナミックレンジのディスプレイ上でのレンダリングを対象とすることを意味する(かかる態様での符号化の意味を定義するレンダリングダイナミックレンジと、線形符号化に関してのみ意味をなす、例えば8ビットルマ符号化等のダイナミックレンジとして人々が通常考えるものとの間の正確な違いは後述する)。トーンマッピングとは、例えば単純なグローバルトーンマッピング関数、又は、例えば画像符号化の画素カラーを出力画像の画素カラーに究極的に変化させる任意のアルゴリズムを意味する。
後方互換性の直接使用可能なLDR信号によりそのようなシステムを実現するための非常に興味深い態様は、ハイダイナミックレンジ(入力又はマスター)画像又は映像信号の符号化をハイダイナミックレンジ出力画像又は映像信号に復号する方法であって、方法は、
−所定のトーンマッピング関数により、符号化内の画素の少なくともルマをハイダイナミックレンジ中間画像内のHDR画素のルマにトーンマッピングするステップと、
−中間画像の少なくとも一部のHDR画素のルマに所定の乗算係数を掛けることにより当該ルマを変更するステップとを含む。
符号化とはシーンの画像の任意の表現を意味し、必ずしも圧縮されていないが、特にその表現にてHDRシーンの特性を賢明に使用する(例えば、あるルマサブレンジを平均グレイ物体に割り当て、他のサブレンジを光効果に割り当てる)。物体の明るさの値を規定することは視覚的品質のためにより重要な情報であり、そのまわりのカラーはいくらかより小さい影響力を持つので(例えば、ニュースキャスターのシャツの色はわからないので)、単純さのために、ルマに焦点を当てる。したがって、例えばガマット形状問題のために変形誤差が生じなければならない場合、色彩方向に生じさせる方が良い。当業者は、例えば規定されたルマのまわりのガマットマッピングされた彩度を指定することにより(例えば、何らかの色相及び飽和関数)、又はルマ−彩度色表現の代わりにRGB3軸上で作業等することにより、このルマ軸のまわりの色の色彩的側面も指定できることを知る。これは本発明の核心ではないので、これについては詳述しない。当業者は、ルマチャネル上で実行可能な作業(マッピング及び変更)は他のチャネル、例えば赤色チャネル上でも当然に実行可能なことを理解する。信号については、特に更なるメタデータが追加される場合、画像データが何らかの規格に従って如何にフォーマットされたかが理解され、一方、画像は、本明細書では生の画素カラーのアレイとして理解され得る(しかし、本発明はどちらの説明によっても容易に理解され得る)。
基本的な方法を、HDRシーンを主に8ビットレガシー画像(「HDR_encoded_as_LDR」又は、HDRがLDRの枠組み内に入れられるため「LDRコンテナ」と呼ばれ得る)として符号化する(すなわち、例えばMPEG−AVC符号化によって符号化する)有用なアプリケーションに関して説明する(少なくとも変換関数が共符号化されるが、一部のHDR高輝度領域は補助的な態様で、例えばデコーダ側において空間的に局所的な画素のセットを与えるために、例えば局所的置換画像を用いて符号化され得る)。本例での符号化は、マスターハイダイナミックレンジ入力映像信号の情報、例えば16ビット線形を保持する例えばLDRMPEG又はJPEGである。そのような符号化が多くのシナリオにおいて機能し得る理由は理解され得るであろう。但し、細かいグラデーション又は微細な物体のテキスチャ上のバンディングを回避する最高の品質のためには、今日のディスプレイ輝度及びサイズにおいては8ビット以上さえ望ましい可能性がある。しかし、画像内で素早く動く複雑な物体のテキスチャについては、6ビット近似が既に適当であり得る。したがって、6ビット以上で大きなルマサブレンジを圧縮するマッピングはいずれも良好であり得る。レンジ全体については、LDRとHDR8ビットグレーディングとの間でのマッピングにより8から6ビットに落とすことで、既にファクタ4若しくは2絞り薄暗くなる線形ストレッチ又はガンマが可能になる。特に、バンド幅/メモリ又はビットレートがいくらか重要なアプリケーションでは、より多くのビットを必要とする最大可能品質ではなく、非常に適切な品質でHDR特徴のほとんどを既に許容する符号化を有することが賢明である可能性がある(また場合によっては、多くのいわゆる高品質アプリケーションでは、例えばDCT係数の量子化を不適切に又は致命的に調整すること等により大きなアーティファクトがいずれにせよ発生する)。
LDRレンジ等の特定の輝度レンジのために(例えば、その信号を駆動信号として直接適用することにより使用可能なように)符号化された信号と、それが実際に保持する情報との間の本教示のための重要な違いを理解するよう注意深く考察すべきである(これは一般的に理解される洞察ではない)。符号化とレンダリングとを完全に切り離したため、これを行うことができる。これは、ルマサブレンジ内の情報を、特定のディスプレイ上で正しくレンダリングするために[0,1]又は[min_luma,max_luma]レンジ沿いの適切なレベルにシフトすることにのみ関する。例えば、符号化はLDRディスプレイ上に良好な見かけの画像を与えるよう構築(例えば、人間によってグレーディング)され得る(符号化に対応するレンジをルマではなく輝度で表すことにも留意されたい。輝度は最終的にレンダリングされるときに画像符号化が対応する線形出力結果であり、一方、ルマは実際の符号化であり、理論的には何でもよく、例えば輝度0.1ニットがルマ32によって符号化されてもよいし、輝度200ニットがルマ0によって符号化されてもよい)。これは、低ピーク輝度、例えば100ニットディスプレイ上で、例えばほとんど判別できない黒色で全てを視覚的に混乱させるようにではなく、依然として構造が十分視認できるよう暗い領域をグレーディングすることを意味する。しかし、この画像グレーディングはHDRレンダリングではそれほど有用ではない。例えば、暗い画像領域が正しいシーン雰囲気を伝達するためには明るすぎると考えられる可能性があるからである。しかし、このLDRグレーディングされた画像(正しい暗領域挙動等)は低オリジナルシーンレンジ若しくはサブレンジ又は高い輝度(サブ)レンジの情報(すなわち、画素ルマ空間的多様構造)の両方を含み得ることに留意されたい。例えば、眩しい屋外領域を最大白色(255)にクリップするが、依然として同じ暗い及び中領域ルマ値を有するLDR信号を単純なカメラを使用するだけで得ることができる。又は、眩しい屋外領域のオリジナル捕捉テキスチャの一部を含む知的ガマットマッピングアルゴリズムを使用することができる。これは、LDR画像のローダイナミックレンジ内のものをスクイーズし(通常、より少ないビットへのスクイーズが考えられるが、より重要な問題は、符号化に対応するテント形状のルマ、色相、飽和ガマットの部分領域を如何に割り当てるかということである)、そのようなシーンはLDRディスプレイシステム上で決して忠実にレンダリングされ得ないという点て、いくらかのエラーを引き起こす。しかし、それにも関わらず、丸めエラーとは別に、HDR情報が依然として存在する。すなわち、それはLDR符号化内に直接レンダリング可能な態様で存在する(より暗い室内の平均輝度と多かれ少なかれ同じ淡い屋外領域はどのみちクリッピングよりもはるかに良い)。しかし、HDR情報が符号化内に存在するので、HDRレンダリングのためにも使用可能であるが、この場合、当然ながら、正しい見かけの出力画像を得るための適切なトーンマッピングがまず要求される。しかし、HDRシーンをLDR使用可能信号(すなわち、LDRディスプレイ上に直接適用されたときに正しい見かけを有する)として符号化するこの非常に有用な後方互換性システムに代えて、本発明の同じ技術的教示を反対に使用することもできることに留意されたい。
すなわち、同じように8ビット符号化であるが、今回は例えば3500ニットのHDRディスプレイ上で直接使用するためにグレーディングされる。すなわち、この信号は典型的には例えば暗い輝度領域でより小さいルマを有するよう、異なるようにグレーディングがされる。この場合、LDR信号からHDR信号を(すなわち、HDR輝度レンジレンダラーのために)復元する必要はなく、大部分で反転した特性を有するトーンマッピングを適用することにより(例えば、暗い領域を圧縮するのではなく伸長する)、8ビットHDRグレーディングから、レガシーディスプレイ用のLDR信号が導出される。トーンマッピング関数は同様にメタデータ内に共符号化されるが、大まかに反対の形状でされる(伸長ではなく圧縮)。その後、HDR予測ではなくLDR予測に我々の乗算変更が適用される。当然ながら、方法は、予測がほぼ十分であるが、主要な効果のための少しの追加ビットによるいくらかの補正が、少なくとも一部のシナリオにて、すなわち、一部の画像の一部の部分のために望まれる他のシステムでも機能し得る。例えば、レガシー8ビット符号化制約を落としても、HDRを例えば10ビットコンテナにトーンマッピングすることは依然として分別があり、その後伸長トーンマッピングにより任意の基準ディスプレイ(ピーク輝度)のためのHDRが再取得され、いくらかの乗算微調整が適用される。したがって、本方法が如何にして異なる第1及び第2の輝度レンジの符号化の間のトーンマッピングを有するシステムに対して非常に有用且つ有力な補正として機能するかが明らかになったであろう。
画像信号が何を意味するか、すなわち、典型的には例えば画像アスペクト比等のデータの意味のための記述子等のメタデータ等、及び、画像を変更するため等の符号化画像に関連する有用な情報を保持する更なるメタデータ等を含む画像データをパックするための既存の又は同様の方法のうちの任意のものであることが理解されよう。
最終的なHDR見かけに少ししか又は全く影響を与えない精度及び無駄なビットに高度に焦点を当てる、オリジナルと予測との残存する差(すなわち、依然として符号化されるべきもの)を論理的に符号化する改良方法とは対照的に、出願人は、好ましくは著しいHDR印象の向上を素早く与えるより重要なビットに好ましくは焦点を当てる。例えば、HDR_encoded_as_LDR符号化は、レンジのために精度を犠牲にすることができるので機能し得る。原理的には、さもなければバンディングが見られるリスクがあるため、特に高輝度ディスプレイ上でグレイ値を正確にレンダリングするためには8ビット以上が必要であると考えられるかもしれない。この問題の他の見方は、人間の視覚的体験にとって、そのような論理的誤差が実際にどれほど悪いのかを考察することである。高度にテキスチャリングされた領域では、これらの量子化エラーは通常あまり目立たず、特に動画では目立たない。一部のシーン、例えば背景グラデーションでそれらが発生したとしても、それらは邪魔に見えるかもしれないが、問題は当然ながら、そのようなアーティファクトが他のアーティファクトに対してどれだけ深刻であるかということである。例えば、低容量又はバンド幅媒体では、HDR見かけをレンダリング可能であることが最も重要な視覚的ファクタであり、もしDCTブロック歪み等のアーティファクトが既に存在するならば、いくらかの時々のバンディングは許容され得る。この場合、HDR符号化は精度より、シーン物体のルマ/明るさの正しい割り当て及び対応するトーンマッピング関数等の符号化技術に関連する。実際には、6ビット/チャネルが既にLDRのためには比較的良好な量のデータ精度であると言うことができ、それであれば8ビットはより高い輝度レンジを許容するであろう。実際には、2つの追加のビットは4つの追加のファクタを許容し、これらは精度ではなく追加のルマレンジとして使用され得る(例えば、「暗い影」、「平均グレイ/通常照光」、「明領域(例えば、屋外の日が差す領域)」、及び「非常に明るい」等の様々なシーン領域のために4つの異なるルマレンジを割り当て、様々な物体をそれらに符号化する)。
しかし、より重要には、良好な制御を有することによりトーンマッピング関数を調整することができ、それにより必要な部分領域を最適に割り当てることができる。このようにすることで、全てが6ビット精度等価のサブレンジを有する必要はなく、一部の重要なサブレンジ(例えば、俳優が存在する主要(平均グレイ)レンジ)がより高い精度を必要とする場合、例えばシーン内でたいしたことが起こっていない他のレンジを代償にしてそれを得ることができる(例えば、明るい光を2〜3のコードだけで符号化してもよい)。
これは、HDRグレーディングをLDRグレーディングと同一化する試みに高度な多様性を与える。本説明では、更に優れた機能を奏するシナリオ、すなわちそのHDRからLDRを導出するシナリオを仮定する。したがって、原則的には(完全に又は少なくともほぼ)可逆であるトーンマッピングにより、HDRルマがLDRルマにマッピングされる。そのようにして得られたLDRグレーディングがHDRグレーディングに類似して見えるようにする(LDRディスプレイの低輝度ガマットが許す限り)こと、及び空間的部分領域又は物体に対応する様々な(特に重要な場合)ルマサブレンジのための十分な精度を維持すること等のファクタがトレードオフされ得る。
ここで、このマッピングは逆転することができるので、マスターHDRグレードからその例えばHDR_encoded_as_LDRグレーディングへのグレーディングの逆関数である所定のトーンマッピング関数でトーンマッピングすることにより、LDR符号化からHDR画像を再構築することができる(例えば、標準[0,1]小数点表現内の値を[0,255]LDRルマを得るために再割り当てするためにガンマ0.33関数を使用する場合、HDRを再構築するためにはガンマ3が使用される)。原則的には、HDR信号を完全に復元することができる。しかし、いくつかの問題が存在し得る。LDRグレーディングをレガシーLDRディスプレイ上で良好な見かけのレガシー映像信号として使用できることが望まれ、またそれがHDR信号(例えば、HDRを強調するために一部の領域では非常に高いコントラストを有する可能性があり、又は反対に、低輝度レンジへのマッピング後は、一部の他の領域で低すぎるコントラストを有する可能性がある)から計算されることを考慮すれば、LDRが所望の通りに見えない可能性がある。当然ながら、グレーダーはトレードオフをすることができる。グレーダーは、LDRが適切に見え、また再構築されたHDRが依然として十分な視覚的品質を有するようトーンマッピング関数を更に調整することを試み得る。しかし、グレーダーがこれから著しく外れ、異なるLDRグレードを作成することも考えられる。少なくとも一部の領域において、例えばグレーダーは、顔の画素を任意に再配色し始め得る。そのような場合、LDR信号からHDR信号に戻る予測はオリジナルのマスターHDRグレード(このHDR_encoded_as_LDRグレーディング内に符号化されるはずであった)に適切に近く見えないだけではなく(PSNR等の数学的基準によって決定されるにせよ、心理視覚的に決定されるにせよ)、より深刻には、著しく異なる、異なるHDR見かけを与える若しくはHDR効果を全く有さない、又はHDRレンダリング内に深刻な視覚的歪みが生じる等の可能性がある。したがって、そのような場合にはHDR再構築を更に変更しなければならない。本発明によれば、単に任意の変更を使用するのではなく、強い影響を及ぼし、特に多くの場合でHDR再構築がおそらくはPSNR値に基づいてではなく心理視覚的に既に所望なものに比較的近いことを考慮する変更を使用すべきことを主張する。
補正は少なくとも2つの有用な種類に分類することができる。再構築されたHDR画像のルマが深刻に外れている、例えば、画素ルマがY_HDR_MASTR2048であるべきはずなのにY_HDR_RECONSTR1024である場合か、又は、例えば物体内にいくらか強いコントラスト又はテキスチャを導入するために小さな補正が実行されるべき場合である。小さな変更を加える他に、視覚的重要性の階層に従って変更を実行することができ、特に両方のシナリオを乗算補正によって取り扱うことができる。符号化されるオリジナルHDRのY_HDR_MASTRが2000だったとしても、HDR_encoded_as_LDR画素からトーンマッピングによって再構築されたHDR画素を係数2で乗算することができる。これは依然として48(又は2%)の誤差を含むが、元々の100%の誤差よりは遥かにましである。いずれにせよ、このような小さな誤差は心理視覚的にそれほど重要ではない可能性が高い(例えば光子ノイズ等のために常に画像ノイズが存在することを所与として)。LDR符号化において過度に低いコントラストがあり、これがHDRへのトーンマッピングによっても十分に復元されなかった場合、例えば1.5を掛けることによりそれを高くし、オリジナルと変更されたローカル平均との差(又は、乗算された画素と未変更の最初の画素との差)を補正し、画素450、452、449を675、678及び674に変更し、その後450、453、449に変更する。空間的に連続する又は一連の隣接する画素のための乗算補正を有する前例では、画素毎に乗算補正パターンを指定することもできる。そのシナリオでは、例えば低精度LDR色空間において丸めにより完全に失われたテキスチャを導入することさえ可能である。例えば、平均輝度を変更することなく、所定のルマ980を例えば2.3、4、3.8、1.2等により再び乗算してもよい。
様々な実施形態が、要求される乗算補正を異なる賢明に最適化された態様で符号化する。例えば、精度の低い、最も重要なHDR効果の一見を取ることにより、1.222235等の任意の乗算係数は必要なく、よってこの追加データを符号化するのにわずかな追加ビットしか要さない。具体的には、このビット量はHDR_encoded_as_LDR符号化(既に非常に効率的である)を大きく越えて変更されるべきではない。多くの場合、いくらかの差があるにせよ、グレーダーが改良が必要ないと結論付ける可能性があるため、一部の画像(の部分)については変更は時々にしか必要ないと予測されるからである。しかし、この場合、符号化される部分は典型的には重要なHDR見かけ(例えば、金属物体をより輝くように又は高コントラスト見えるようにする等に)、HDR効果、邪魔であると考えられる符号化歪みの緩和等である。出願人は、乗算が例えばカラーチャネルRGBの変更を介して間接的にルマに作用するシナリオもカバーすることを意図するが、これらの特徴を請求項に加えると非常に読みづらくなる。
本原理のいくつかの興味深い変形例は特に以下の通りである。
所定の乗算係数は、画像符号化(LDR_CONT)に関連付けられたメタデータ内に保存され、復号方法は、メタデータにおいて、当該空間領域のためにメタデータ内に少なくとも1つの乗算係数が符号化されている画像符号化(LDR_CONT)の空間領域を定める情報を読み取るステップを含み、空間領域の幾何学形状がメタデータ内に符号化されている(503、504、505)、画像符号化を復号する方法。
幾何学領域が多様に符号化可能であることが理解され、例えば、中心(x,y)及び2つの軸によって楕円を定めてもよく、第1のトーンマッピング戦略によって予測された中間画像の対応する領域が、例えば単一の乗算係数によって乗算変更されなければならず、又は、例えば10画素毎に異なる乗算係数が使用される部分領域からそれを構成してもよい。
所定の乗算係数は、画素又は画素のグループ毎に乗算係数を備える乗算係数アレイ(506)内に含まれ、アレイは空間領域幾何学形状の符号化に対応して定められる、画像符号化を復号する方法。
例えば、楕円内に含まれる走査線に対応する1Dアレイ内の画素毎に1つの乗算係数を指定してもよく、例えば、第1のラインでは2つの画素、次は6つ等である。しかし、例えば乗算係数が例えば幾何学領域内の2つの連続画素のために使用されるよう関係を定めてもよい。
乗算係数アレイ(506)内の乗算係数は、定義テーブル(520)のインデックスとして符号化され、定義テーブルはインデックスに対する実際の乗算係数を保持する、画像符号化を復号する方法。
これは、最も有用な実際の乗数係数を符号化するために少数のインデックスのみが使用されることを可能にする。このようにすることで、アレイ506は例えば乗算係数毎にわずか4ビットで符号化され得る。
定義テーブル(520)は、定義テーブルと共に例えば特定の画像ショット等どのようなルマ変更の場合に定義テーブルが使用されるべきかを特徴付ける記述子(530)に関連付けられる、画像符号化を復号する方法。
乗算係数に記述子を与えることは、それらが特定の所定のシナリオ時に使用又は再使用されることを可能にする。例えば、映画符号化の最初に、映画のどの時点で出現しようと、暗環境領域の特定のクラスに対して使用されるべき定義テーブル(520)を定めることができる。しかし、他のかかる暗環境領域クラスは異なるテーブルを使用してもよい。更に、それらを条件付きで決定してもよく、例えば、現在のショットでは選択されているテーブルが使用されるべきであるが、例えばHDR_PREDの画素ルマが値Lx未満の場合にのみであり(他の場合では、符号化されていたとしても乗数係数を無視してもよい)、又は、符号化インデックスの一部が無視されてもよく、これはテーブルの再使用を可能にし、この画像ショットの前に例えば「29〜31不使用」等と指定されてもよい。また、これは以前にグレーディング及び符号化された画像信号S_imをトランスコードすることを可能にする。
復号は更にウィンドウタイプ(531)を読み取り、ウィンドウタイプ(531)は、そのウィンドウタイプ(531)に関連付けられた空間領域が、当該ウィンドウタイプ(531)に対応する記述子(530)に関連付けられた定義テーブルによって符号化された乗算係数を有することを示す、画像符号化を復号する方法。これは、定義テーブル又はその部分を画像の部分とより密にリンクするために使用することができる。
中間画像(HDR_PRED)の少なくとも一部の画素のルマを変更するステップは、乗算を、出力画像(HDR_FIN)のローカル平均輝度が中間画像(HDR_PRED)のローカル平均輝度から所定の割合のずれ内に含まれる乗算戦略に制約する態様で実行される、画像符号化を復号する方法。これは、乗算変更戦略の方程式に平均輝度又は同様の値を導入することにより多様に実現され得る。
乗算係数がそのような制約された乗算に関連して定められることを示すタイプ値508が読み取られる、画像符号化を復号する方法。複数の変更戦略のタイプをそのように符号化することができるが、そのうちの2つの興味深いものを説明のために述べる。
乗算係数は、一連の1次元又は2次元位置座標にわたる乗算係数の関数的定義としてメタデータから読み取られる、画像符号化を復号する方法。特にそれらが一定の形状に従い、概してそれらがそれほど正確である必要がないことを前提として、乗算係数を関数的形態として符号化してもよい。例えば、係数1、4、9又は1、5、8を一連の位置にわたって2乗関数として符号化してもよい。しかし、一般的には、乗算係数の数値コード化が好ましい。
ハイダイナミックレンジシーンのオリジナル画像(HDR_ORIG)を第1の輝度ダイナミックレンジ(R_oLDR)に対応する画像符号化(LDR_CONT)として符号化する方法であって、
−所定のトーンマッピング戦略(FL2H)により、画像符号化(LDR_CONT)内の画素の少なくともルマを第2の輝度ダイナミックレンジ(R_oHDR)に対応する中間画像(HDR_PRED、GRAD_1LDR)内の画素のルマにトーンマッピングするステップと、
−中間画像(HDR_PRED、GRAD_1LDR)内の画素カラーと指定された第2の画像(HDR_ORIG又はGRAD_FINLDR)の画素カラーとの間の差を分析することにより、中間画像(HDR_PRED、GRAD_1LDR)の少なくとも一部の画素のルマに掛けるための乗算係数を決定するステップと、
−画像信号(S_im)内に画像符号化(LDR_CONT)、トーンマッピング戦略(FL2H)を指定するデータ、及び乗算係数を指定するデータを符号化するステップと
を含む、方法。
HDR信号S_imがHDRディスプレイに主に適合する場合、これは例えば低ダイナミックレンジ予測の変更を符号化することができる。このシナリオでは、システムは、HDR駆動画像8bit_HDR(又は任意のHDR符号化、例えば、線形輝度HDR表現に対して、何らかの定義トーンマッピング関数を備える10ビット)として使用可能な8ビットの輝度をダウンマッピングすることにより、接続されたLDRディスプレイ用のLDR画像を導出することができる。しかし、典型的には、エンコーダは当然ながらレガシーLDRシステム上で単純に使用可能なLDR_CONTを符号化することができ、その場合、HDR画像が中間として予測され、乗算係数がそれをHDR_ORIGに近づくよう変更する役割を果たす。すなわち、これは、第1の輝度ダイナミックレンジ(R_oLDR)は、典型的には500ニット以下のレンジのピーク輝度に対応するローダイナミックレンジであり、第2の輝度ダイナミックレンジ(R_oHDR)は、少なくとも750ニットのピーク輝度を有するハイダイナミックレンジである、ハイダイナミックレンジシーンのオリジナル画像(HDR_ORIG)を符号化する方法に対応するであろう。
−第1の輝度ダイナミックレンジ(R_oLDR)に対応する画像符号化(LDR_CONT)を取得するためのデコーダ(402)と、
−トーンマッピング戦略の指定を取得して、トーンマッピング戦略(FL2H)を画像符号化(LDR_CONT)に適用することにより、第2の輝度ダイナミックレンジ(R_oHDR)に対応する中間画像(HDR_PRED)を生成するためのトーンマッパー(403)と、
−少なくとも1つの乗算係数を含む乗算係数データ(A_MUL)を取得して、少なくとも1つの乗算係数を中間画像(HDR_PRED)内の少なくとも1つの画素のルマと掛け合わせることにより、出力として出力画像(HDR_FIN)を生成する画素カラー変更部(404)と
を含む、HDR画像復号装置(401)。
−ハイダイナミックレンジシーンのオリジナル符号化(HDR_ORIG)を取得するための入力部と、
−オリジナル符号化(HDR_ORIG)を第1の輝度ダイナミックレンジ(R_oLDR)に対応する画像符号化(LDR_CONT)に変換するための、及び、画像符号化(LDR_CONT)をトーンマッピングデータ(FL2H)内に符号化されたトーンマッピング戦略を用いてトーンマッピングすることにより、第2の輝度ダイナミックレンジ(R_oHDR)に対応する中間画像(HDR_PRED)を決定するためのグレーディングマネージャー(702)と、
−中間画像(HDR_PRED)を指定された第2の画像(HDR_ORIG又はGRAD_FINLDR)と比較し、両画像間の差に基づき、中間画像の少なくとも1つの画素のルマと掛け合せられると、中間画像(HDR_PRED)内の画素のカラーより第2の画像内の対応する画素のカラーに近い出力画像(HDR_FIN)の最終的画素カラーを生成する少なくとも1つの乗算係数を含む乗算係数データ(A_MUL)を導出するためのグレーディング差比較器(704)と、
−画像符号化(LDR_CONT)、トーンマッピングデータ(FL2H)、及び乗算係数データ(A_MUL)を出力画像信号(S_im)内に符号化するための符号化ユニット(710)と
を含む、HDR画像符号化装置(701)。
人間のカラーグレーダーが少なくとも画像符号化(LDR_CONT)及びトーンマッピング戦略を決定することを可能にするためのユーザーインターフェイスユニット(703)を含む、HDR画像符号化装置(701)。
当業者は、本発明の構成要素がソフトウェア、又は、
−第1の輝度ダイナミックレンジ(R_oLDR)に対応する画像符号化(LDR_CONT)と、
−画像符号化(LDR_CONT)を第2の輝度ダイナミックレンジ(R_oHDR)に対応する中間画像(HDR_PRED)にトーンマッピングするために使用されるトーンマッピングデータ(FL2H)と、
−中間画像(HDR_PRED)内の少なくとも1つの画素のルマと掛け合わせるために使用される少なくとも1つの乗算係数を含む乗算係数データ(A_MUL)と
を含む、HDR画像信号等、更に多様に具体例され得ることを認識するであろう。
又は、そのようなHDR画像信号を含むデータを保存可能な、例えばBlu−ray(登録商標)ディスク等のポータブルデータデバイス。
本発明に係る方法及び装置の上記及び他の側面は、以下に説明される実装形態及び実施形態、並びに添付の図面を参照して説明され、明らかになるであろう。図面は単により一般的な概念を例示する非限定的な特定の具体例であり、図中、破線は構成要素がオプションであることを示すために使用され、破線でない構成要素が必ずしも必須であるとは限らない。破線は必須であると説明される要素が物体の内側に隠されていることを示すために、又は例えば物体/領域の選択肢(及びそれらがディスプレイ上に如何にして表され得るか)等無形のものを表すためにも使用され得る。
図1はHDRシーンを概略的に示す。 図2aは、HDRシーン内の物体輝度を概略的に示す。 図2bは、図2bが如何にして図2aに示されるような物体輝度が1つの可能なLDRルマ符号化によりコード化され得るかを、すなわち、LDR画像内のそのようなルマ値のヒストグラムを概略的に示す。 図3aは、HDRシーンの画像の異なる表現の間のマッピングチェーンを概略的に示す。 図3bは、図3aに示されるような2つの異なる表現の間のマッピングのために使用され得るグローバルトーンマッピング関数の一例を示す。 図4は、本発明の原理に係るHDR画像の可能な符号化を取得し、且つHDRディスプレイに接続される受信側の復号装置を概略的に示す。 図5は、画像信号の一部の実施形態内に、一部の実施形態具体例のために必要なデータの一部が如何にして符号化され得るかを概略的に示し、当業者は、このデータの一部が選択的、追加的、オプション等であり得ることを理解する。 図6は、HDR_encoded_as_LDR符号化技術が使用される場合に、第1及び第2の輝度ダイナミックレンジ符号化の間の最適化マッピングの後に乗算変更の適用の一例が如何に機能し得るかをガマット図で概略的に示す。 図7は、本原理に係るHDR画像符号化装置の可能な具体例がどのように見えるかを概略的に示す。 図8は、LDR/レガシーディスプレイのために使用可能なグレードが主要画像テキスチャ画素データとして符号化されるシナリオとは別の本概念を適用する符号化例を概略的に示す。
図1は、コンテンツ製作者がHDRシーンをデザインし得る方法の典型例を概略的に示す(写真用途、映画、現場取材、コンピュータグラフィックス生成等)。テーブル105等の物体を含む平均的に照らされた室内が通常存在し、その輝度を符号化するルマは通常符号化のコードレンジの中央付近のどこかに落ちる(例えば、ルマ128付近)。かなり高い輝度の領域が少なくとも1つ存在し、すなわち、このケースでは窓101のシェード(バー102)を介して見られる日が差す外界103である。シェードのために部屋は相当により暗い可能性がある。屋外には家104等の明るい物体が存在し、これらは通常コードレンジの上部のルマで符号化されるべきである。室内のあまり光が当たらない影領域には、例えばバスケット120等の非常に暗い物体が存在し得る。また、カラーレンダリングに関してHDRディスプレイ及びLDRディスプレイの両方で極めて重要な領域が存在する。この例では人110である。LDRイメージングのためのLDRシーンでは、通常、顔にいくらかの光構造が存在するが、それほどコントラストが高くない(例えば3:1)よう照明を最適化するが、対照的に、この照明シナリオでは顔の上に明るい日差しの縞模様112及び暗い影の縞模様111が存在し得る。
図2aは、輝度ヒストグラムの観点からシーンが比色的にどのように見えるか(nは輝度L_scを有する画素の数)、及び、説明の簡潔さのためにレンジにわたって線形であると仮定するカメラにより如何に捕捉され得るかを示す。実際には、現実のシーンの代わりに、対応する画素に関してシーン輝度がコード化された代理輝度L_sc(例えば、XYZカラー表現)を含み、既に捕捉され且つ典型的にはHDRグレーディングされたオリジナル又はマスターHDR画像を考えることができる(実践的には50000ニットで終わり、10億ニットの太陽はこれにクリッピングされる)。外界の物体の輝度はローブ203によって概括される。バスケットはローブ204に対応する。顔の上の暗い縞模様及び明るい縞模様はそれぞれローブ201及びローブ202に対応する。古典的なLDRカメラ撮像は典型的にはサブレンジR_Grab_LDR−Classを取り、典型的にはガンマ関数Y_LDR=a+b*L_sc^gammaを用いてこれらの輝度を[0,255]内のルマにマッピングする。レンジR_Above内の全ての輝度が255にクリップされる。本発明を説明するこの例示的な実施形態では、8ビット符号化Y_LDR_autからHDR表現をほぼ同一に復元できなければならないので(すなわち、マスターHDR表現に近く)、全ての値をHDRレンジRange_HDR内に符号化しなければならない。これは様々なローブを知的にシフトさせること及び圧縮することを含む。図2bの例では、対象とする視聴条件では暗い領域についてはそれほど高い視覚的再現の品質が要求されないことが予期されるため、暗い領域に対して狭いレンジ284のコードが割り当てられ、例えばY_LDR_aut={0,1,2,3,4,5}のみが可能である。(縞模様を生じたり、誇張されたDCT圧縮歪み等を呈してはならない)家104のレンガの詳細等、日によって照らされた屋外環境の全テキスチャの十分な情報をコード化するには十分なコード値が必要なため、明るい物体のローブ283には相当なサブレンジを割り当てた。顔領域はルマコードローブ281及び282に対応する。低い方のローブの上限ルマY1は依然として明るく照らされた顔の高い方のローブ293の下限Y2からいくらか離れていると仮定する。これはバランスを考慮した選択である。コーディングの観点からは、HDR画像を復元するために当然ながらコードローブが接触していてもよい。この場合、これらを要求されるHDR予測画像レンジに投影するためにはいくらかより伸長させるトーンマッピングが必要になる。しかし、Y_LDR_aut符号化がLDRデコーディング及びレンダリングチェーンを介して直接送信される場合でも、良好な見かけのLDR画像が必要であることに留意されたい(この場合、ルマは典型的にはガンマ2.2マッピングを介して出力ディスプレイ輝度に変換される)。すなわち、制限的なLDRディスプレイ上でもこのHDRシーン照明がいくらか得られるよう、顔を十分に高コントラストに見せるためにこの距離が必要な可能性がある。しかし、一方、LDRレンジがそれほど多くのコード値を含まないという事実のみからしても、この物体内コントラストはそれほど高くあるべきでもない(日が差す屋外のために依然として上方に十分なコード値が必要だからである。よって、所与の制約下で最も適切なレンダリングは、更なるコードの損失なくそれらをY4で開始させることであり、これは、いずれにせよそこではもはや正確なHDRレンダリングが不可能なことを前提とする)。HDRダイナミックレンジ及びLDRダイナミックレンジの2つのガマット等の側面の非線形性により、画素カラーの色座標も関与することに留意されたい。いずれにせよ、この顔が非最適にマッピング/符号化される場合、例えば、明るい部分がバニラのようで暗い茶色の部分がチョコレートのように見えるチョコアイス人間のような何かが見られ得る。このような場合、グレーダーは間違いなくグレーディングを続けて何らかの方法でより良いものを得るべきであり、すなわち、理想的には復元可能なHDRをそれほど変更することなく(マスターHDRを正確に復元可能にするよう、原則的には(ほぼ)完全に可逆であるべきである)、LDRグレード及び対応するマッピング又は一般的な変換が改良されるべきである。
図3aは、HDR_encoded_as_LDR技術の実施形態における符号化及び特定のHDRディスプレイを駆動するのに適したHDR画像のそのような生成を示す可能な処理チェーンを示す。コード0.0と1.0(又は実際には例えば1.00000000)との間の小数点精度レンジ301に沿って符号化されたと仮定するマスターグレーディング後HDR画像HDR_ORIGから開始する。シーン物体の位置及びサイズは、符号化に対応してレンダリングを行うディスプレイ上でシーン物体がカバーするサブレンジを概略的に示す。HDR_ORIGについては線形輝度空間を仮定する。窓(又は少なくとも明るい屋外)はHDRディスプレイが生成可能な最も高い、ピーク輝度ではないかもしれないがそれに近い輝度のどこかに横たわり、よって本物の太陽が輝いているような見かけが得られる。バスケットはピーク輝度の最も低いパーセントの部分にマッピングされるので非常に小さいが、3500ニットの場合、依然としてこれらの暗いテキスチャの可視性は良好である。顔は非常に高コントラストなHDR照光見かけが実際に存在したかのようにグレーディングされ、すなわち、顔は非常に明るいから比較的暗いまでの相当なサブレンジに及ぶ。これは(マスターグレードを作成する際にグレーダーが使用したものであり得る)その3500HDRディスプレイ上では許容できる見かけを有し得るが、他のディスプレイ上では好ましくない見かけを呈し得る。ここで、左方向に示されるように、これらの小数点は常に8ビット表現(レンジ302を有するHDR_8bitであり、これは当然ながら301と同じ輝度レンジに対応するが、マッピング関数に応じたコードレンジを有する)に直接量子化することができる。しかし、この直接適用技術では(線形表示、又は、少なくとも、例えばXYZ画像の1対1線形直接の正確な色再現としてふるまうチェーンの残りの部分での較正を仮定)、実際には物体の輝度をレンジに沿ってシフトするマッピングは必要なく、単なる2進数への丸めが必要なだけである。
右に向かい、HDR_encoded_as_LDR符号化に到達するための可能な方法を示す。適切な見かけのLDRレンダリングを得なければならないので、物体の画素の輝度をシフトするトーンマッピングF_TM1を適用しなければならない。例えば、暗いバスケットを見やすくするために暗いバスケットのレンダリングディスプレイ出力輝度を伸長しなければならず、これはそれをより多くの低ルマ値に割り当てることによって実行される(第1のLDR予測のより大きなサブレンジにわたるより大きなバスケットによって概略的に示される)。窓はLDRレンジの上端のより少ないLDRルマに淡色化される。また、依然としていくらか暗い影の縞模様が見えるよう顔のコントラストを低減しなければならない可能性があるが、これらは平均で明るい縞模様より例えばわずか2倍暗いだけである。このLDR表現LDR_8BIT_AUTOへの最初のトーンマッピングは、例えば画像の全ての(局所的物体)統計を見て、その後、物体サブローブのコード値の数を低減する不利益(例えば、ヒストグラムを更に分析してもよく、2つの値が最大あたりに存在しなくてはならず、ヒストグラム最大の間では、例えば空間勾配指標又はテキスチャ指標、例えば複雑性指標及び量子化における変形を量子化するパラメータ等から計算される整数値に基づいてコード数が決定され得る)対セミグローバルコントラストにおける変更の不利益を評価する数学的処理(例えば、あるサイズにかけて平均を取り、様々な輝度指標を決定する等)を考慮してマッピング関数を決定する自動的アルゴリズムによって実行され得る。これは多くのショットについて、特に実際の比色的(colorimetrical)見かけがそれほど重要ではない場合(例えば、それほど見る必要がない暗い森と、光形状が高ければ何でもよい輝度の単一の値に容易に量子化され得る森の前方の電灯)に適切な結果を与え得る。しかし、他のショットでは、LDRグレード及びHDR/LDR符号化(例えば、Blu−ray(登録商標)ディスクに保存するための)の最終的な責任を負う人間のグレーダーは満足しない可能性がある。その場合、異なるグレーディング及びLDRディスプレイ上での見かけに到達するために、グレーダーは画像グローバルトーンマッピングを微調整し得る。このために、グレーダーは、HDR予測を復元するために可逆である必要があるマッピング関数に変更を加える。2つの部分関数320及び321からなるこのようなトーンマッピングの一例を図3bに示す。当業者は、例えばデジタルであろうと少数であろうと、又は数学的関数であろうとルックアップテーブルであろうと、任意の第1の輝度コード化Y_1(例えば、ガンマ0.45によって定められるルマY=L^0.45)と任意の第2のコード化Y_2との間のこのような関数が如何にして構築され得るかを理解する。この例において、Y_1をHDR_ORIGの小数符号化として、Y_2をLDR_8BIT_AUTO符号化として仮定する。顔が321部分内に存在する場合、グレーダーは例えばその部分の傾きを小さくすることを検討し得る(単調可逆に保ちながら)。より多くのコード値を復元しなければならない場合、これは低い方のマッピング320にも影響を及ぼし得る。図3aでは、グレーダーが、8ビットLDR_8BIT_AUTO符号化を、自身のローカル代表的LDRディスプレイ上で最適な見かけを有する、自身が好む符号化LDR_CONTに変更すると仮定した。しかし、当然ながら、精度をより高めるために、グレーダーは通常、高精度小数点にマッピングを適用する。理想的には、グレーダーはこの問題を画像グローバルマッピング関数を正確に調整することによって解決することができ、これは自動アルゴリズムが定めたもの、及びそれが如何に微調整されたかによって得られる最終的な関数になる。しかし、グレーダーがそのような関数を決定できない又はそれに到達することができない理由が複数存在し得る(例えば、顔を微調整しているとき、グレーダーは画像内の又はそのマッピングは連続する画像のショットに使用する予定であれば他の画像内の他の色に悪影響を及ぼしているからである)。その場合、グレーダーはより複雑な比色的変更、例えば顔に対する局所的作業を適用し得る。グレーダーがLDR_8BIT_AUTO内の画素の一部を変更して、髭が描かれている最終LDR_CONTをもたらすことにより、これを記号的に示した。当然ながら、オリジナルコンテンツ製作者は通常グレーダーが自身のコンテンツにこのような過激なことをすることを許さないが、単純な可逆チェーンHDR_ORIG−>LDR_CONT−>HDR_PREDに単純に従わない何らかの作業が実行可能であることを示すためのものである(作業crrによって示す)。グレーダーは例えば暗がりの中の物体をもう少し知覚できるよう、又は、高品質のLDRレンダリング及び完璧な品質のHDRレンダリングの両方の要件を満たすためのソリューションとして、その物体に対して空間的鮮明化作業を実行してもよい。単純な可逆画像グローバルトーンマッピングの場合、HDR_ORIGからLDR_CONTに到達させるために最終的にマッピングされたものの全ての逆トーンマッピングを適用することにより、予測HDR信号HDR_PREDとしてHDR_ORIGと全く同じ信号を得ることができ、又は少なくとも精度(及び(DCT)動画圧縮)誤差まで可能である。しかし、論点は、HDRレンダリングの主要な品質ファクタは、通常、全ての物体が(大体)正しい輝度レベルに横たわるということであり、いくらかのマイナーな歪み又はアーティファクトはそれほど重要ではないということである。
ともかく、本発明によれば、誤差がLDR_CONTにおける丸め(又は場合によってはクリッピング)であったにせよ、又は上記髭のような非可逆的変更であったにせよ、誤差はHDR_PREDの少なくとも一部の画素、すなわち、典型的には誤差が生じると少なくとも許容できないと考えられる少数の画素(典型的には映画の少数のショットのみにおける非常に重要な物体)に乗算補正multcrrを適用することによって補正され、これは最終的な高品質HDR画像HDR_FINをもたらす。
例えば例示的なHDR_encoded_as_LDR(言い換えれば、HDR表現のLDRコンテナ符号化)に適用される場合に本発明が如何に作用するかをガマットの観点から見ると興味深い。この場合、符号化が、必ずしも画像が実際に表示されるディスプレイと同じ特性を有さなくてもよい何らかの基準ディスプレイに対応することが認識されるであろう。夫々の平行するカラー技術に属する全員がこれに関して同じように考えるわけではないので、これを明示する。当然ながら、どのRGB原色が選択されたかを知っている場合にのみ(例えば、古いCRTのEBU原色、又は一部のLCDのより明るい青色)、RGB符号化はいくらかの明確な意味を有する。しかし、色符号化の究極的な意味に関連し得る更なる特徴が存在する(例えば、白色のピーク輝度、ルマと輝度との間の符号化マッピング関数(これは更に多くの異なる理由のためにそうであり得る)、環境を定めるパラメータなど視聴者の適合状態に関する側面等(更に、場合によっては特定のディスプレイ特性が別個に取得され、符号化に予め導入される))。しかし、全員がこれらのファクタが全ての適用シナリオに等しく関連すると考えているわけではなく、例えば、一部の人々はディスプレイ白色の色度は重要であるが、ピーク輝度についてはそれほど関連性がないと見なして(又は、色は相対比色的態様で適切にレンダリングされ得ると見なして、しばしばその関連性を無視して)必ずしも重要でないと考える可能性がある。例えば、印刷に関して、単一の最適印刷しか実行することができず、紙の白色が相対的最大輝度(100%)のみを与える。しかし、印刷物内の色の実際の輝度(物理量)及び明るさ(心理視覚的な量)は、それが日向で、薄暗い室内で、又は場合によっては暗い夕方の環境内で見られるかに依存する。また、これは印刷された画像物体の彩度に特に影響する。図6aは、(MPEG規格等の古典的なテレビカラー符号化の規定が準拠する)3原色CRTディスプレイのような種類の加色再現システムの典型的なガマットを示す。ほとんどの人が線形RGB又はXYZ色空間におけるRGBカラーキューブに親しみがあるが、これが、そのようなディスプレイに対応するディスプレイガマット、又はそれを完全に及び線形に駆動する符号化の様子である。このテント形状は、底面を(x,y)等の何らかの色平面内の色三角として、「Z軸」として線形輝度L_oを取る場合に生じる。べき関数(例えばガンマ2.2等)又は類似の(比較的単純な)関数であるルマYを使用する場合、いくらか変形された他のテントが得られる(典型的には、下部が伸長されて上部が圧縮されるが、ガンマ又はルマ符号化は実際には通常チャネル毎に作用するため、圧縮はどこでもいくらかは起こる(概略図なので、特定のルマ符号化関数の選択毎にテントをゆがめていないが、原理は同じで、各原色について真っ直ぐな柱を有し、その間で非線形な挙動を有し、これがディスプレイ又は符号化の白色に達するテント地を与えるテントであり、グレイ又は無彩色軸をテントの支柱として考えることができる))。間には、白色(及びルマ/ガンママッピングされたコードにおいて[1,1,0]の色符号化)よりいくらか低い輝度を有する黄色(J)等の色が存在する。図6bは、図6aを符号化技術の観点から示す。(同じテント形状を有する)2つの8ビットコードがあるが、画像物体が異なる方法で符号化されている(特に輝度若しくは実際には符号化に関して論じる場合はルマと呼ばれるグレイ値。すなわち、その場合は、Yが無彩色のルマであり、CrCbが主に色彩情報を有するチャネルであるYCrCbコーディングと同様な用語を使用する)。これは、いくつかの物体の異なるサイズ及び位置によって示される。これは、符号化を(例えば、カメラから出力される)捕捉されたシーンの表現として見る場合、最初は奇妙に見えるかもしれないが、表現をディスプレイ指向性として考える場合、すなわち、特定のディスプレイのために画像物体カラーが最適な割り当てられたディスプレイ駆動(直接駆動されようと、又は最適出力画像レンダリングのための独自の最小の若しくは大幅なカラー処理を伴う駆動であろうと)のために使用される表現として考える場合、より理解可能である。例えば、より明るいディスプレイは明るくレンダリングできる色を多く有するので(LDRディスプレイは少数しか又は全く有さない)、HDR符号化では明るい物体(太陽によって記号化されるが、実際には様々な反射率を有する複雑なテキスチャを備える物体であり得る)のためにより広いコード空間(すなわち、関連するガマット)を確保することが典型的であり得る。したがって、LDR符号化は明るい物体のためにより少ない色を確保し得る。実際には、単なるLDR符号化の場合、一部のテレビ番組で現在起こるように、それらの色は厳しく(ソフト)クリップされ得る。しかし、我々の目的のためには、LDRコンテナ符号化(図6bでは8bLDR)から予測HDR(8bHDR)への逆マッピングのために十分な詳細が保持されるべきであることに留意されたい。典型的には、顔によって示されるように、LDRレンジにて約18%グレイの輝度を有する主要領域は、コードガマットの主要領域によって良好に表される。より暗いディスプレイ上での可視性を向上させるために、暗い物体はLDRコンテナ符号化においてより多くの及び/又はより高いコードに割り当てられ得る(これにより、LDR表示の視覚的品質に関する基準により重きを置く)。(ここでは色方向については詳述しないので、ルマ軸上の)コードレンジのサイズを変更することは、それらが互いにぶつかり、コード伸長物体(最終的なガマットマッピング及びディスプレイ特性にも依存するので、必ずしも色/輝度伸長ではない)の利益のために他の物体のレンジの一部が取り去られることを意味すると理解される。したがって、最小レンジを割り当てることが安全であり、例えば、低Ylルマと高Yuルマとの間に画像内の主要(良好に照らされる)物体に望ましい最小コード量を含む中央レンジMSRを選択し、これに相補的に、光効果のための高レンジHSRを定めることができる(及び、多くの場合は画像内の暗い領域を特別に取り扱うための低レンジLSRも)。
図6cは、少なくとも色空間の一部の領域において他の/ディスプレイガマットGAM_DISではレンダリングされない可能性があるいくつかの色(例えば、純度/飽和度が高い)をレンダリング可能な第1のガマット(GAM_1)からマッピングしたい場合にガマットマッピングが典型的にはどのように見えるかを示す(単純さのために、1つの色相を通過する輝度及び飽和度の平面を示す断面図のみを示す)。このような技術では、通常、両方のガマットの白色を同じ点に固定する(単純さのために、白色点色温度には差がないと仮定する)。この場合、最適化タスクは、ガマット外の入力カラー(例えば、カラーCol_in等)を、オリジナルの色から最小の視覚的色ずれでディスプレイガマット内の出力カラーに割り当てることである(又はその反対)。典型的には、依然として色の間にいくらかの違いが見られることが望ましいので、ディスプレイガマット境界を越える色範囲をディスプレイガマット境界に隣接し及びその内側の領域に移動させるために、何らかの圧縮割り当てプロフィールが使用される(但し、含まれる値を等しくする何らかの物理的又は視覚的量子化は存在し得る)。複数のガマットマッピングの種類が存在し、これらは異なる種類の色エラーをトレードオフする。例えば、GAM_DISの上方に落ちるGAM_1の領域については(特に、GAM_1の境界平行形状部分領域)、輝度軸に向かい、且つ低輝度L_oに、例えば輝度軸上の選択されたグレイレベルに向かう投影が使用され得る。
本発明に係るLDRコンテナLDR_CONT符号化では、図6dに示されるように、複数の異なる考慮事項が存在する。まず、当然ながらLDR_CONT符号化は任意のHDR符号化(このケースでは8ビットHDR予測)とは異なる原色色度によって定められ得るが、これは必須ではないので、ここではこれらの原色が同じであると仮定し、これは符号化に対応する基準ディスプレイガマットの両方が同じガマット底面を有することを意味する。ここでは、(輝度表現において)2つのピーク明るさ、及び原色信号に関して2つの最大輝度を有するディスプレイに対応するHDRガマットを示す。これは例えば、LEDが調光可能であり、フルブースト時、例えばTLバックライトにより基準ピーク輝度(例えば500ニット)に達するLDRと同じLCDパネルに2倍の輝度(例えば、1000ニット)を与える白色2DLEDバックライトを備えるLEDディスプレイによって物理的に実現可能である。例えばバックライトの損失、非均一性、電力消費のための低減された駆動等の問題は、いずれも本発明の教示並びにその実施形態及び変形例から脱線する原理に基づく変更に対応するので、説明の単純さのために全て無視する。通常、ディスプレイは物理的駆動信号への符号化の最終的なマッピングにおいてこれらの全てに対処する。LDRが出力画像内でレンダリングする輝度領域の一部はHDRディスプレイがレンダリングのために使用する輝度と重複するので、HDRレンダリングの物体を点線で示した。
本発明に係るアプリケーションでは、システムが輝度(及び対応するルマ)軸沿いに如何に挙動するかに主に関心を向ける。本アプローチをガマットの絶対輝度比較で表すのはこのためである。輝度又は明るさ/照度見かけを考慮して全ての符号化要素(例えば、グレーダーが使用するツール)を最適化し、これに関連する全てのファクタを包括的に特徴付ける。暗いバスケットは両ディスプレイでほぼ同様にレンダリングされるが、HDRバージョンにおいてやや暗い。依然として同レベルの環境照明下ではあり得るが、HDRレンダリングがLDRレンダリングシステムよりやや暗い物体をレンダリング可能なレンダリングシナリオでHDR符号化が使用されることを仮定するからである。グレーダーが自身のLDRコンテナ画像を定めるために、及び実際にはHDR_PRED画像が如何に解釈されるかを定めるために使用し得るマッピング(符号化規定マッピング)の多様性に基づき、バスケット画素のために要求される輝度に対応するルマはほとんど何でもよい。通常、ルマ符号化において、よってLDR_CONTへの及びからのマッピングにおいても輝度間の順序が維持されると仮定する。しかし、これは、LDRバスケットがより多くの輝度値にわたるからと言って、HDR符号化においてよりも多くのルマ値にわたることは示唆しない。8ビットLDR_CONTでは例えば8ビットHDR_PREDよりも小さいルマコードレンジに広がり得る。その場合、HDR_PREDバスケットはいくらかの欠損又は補間コードを有し得る。しかし、通常、2.2ガンマを介するLDRディスプレイへの直接適用を予期するので、LDR_CONT符号化ではHDR符号化でよりもより多くのルマコードが消費され得る。
良く照らされた顔等の中央領域物体は、LDRガマットの中央レンジあたりのどこかに通常符号化される(コード128、又は18%グレイ、又はより大きい絞り)。HDRディスプレイではそれらが依然として普通に照らされた物体のように見えるよう同様の輝度でレンダリングされることが望ましい可能性がある。しかし、HDRディスプレイの高輝度レンジを主要物体をいくらか明るくするために分配し、いくらかのサブレンジを明るい物体のために残しておくことにより、HDRディスプレイの高輝度レンジを少し使用し得る。これは既に古典的なガマットマッピングとの更なる違いである。マッピングを視覚的類似性に従って、及びLDRレンダリングと似た見かけ等の問題にのみ基づいて最適化したくない可能性がある。反対に、HDR見かけを特定の方法でデザインすることによりマッピングをこれらのソリューションから遠ざけるように調整することが望ましい可能性がある。これは明るい物体に関して一層明確に理解される。その場合、図6cの背後の技術的理由においてのように、LDRレンダリング内の物体にHDRレンダリング/符号化においてと同様な見かけを与えることはできない。更に、HDRはしばしば、物理的輝度記述が心理視覚的記述によって補われることが好ましい表示技術領域に関する(但し、駆動及び符号化技術については当然ながら輝度及びルマで十分であり、心理視覚的次元はスマートな自動アルゴリズムによってでなければ、通常は人間のグレーダーによって取り扱われる)。例えば、それ以上ではランプがLDRでのように白色がかった反射物体(最善で意味認識のために脳内で明るいランプ物体として解されるが、とにかくそれは同じ知覚又は感覚ではない)ではなくHDRレンダリングにおいて実際のランプのように見える特定のディスプレイ輝度が存在する。また、LDRガマット制約、及び好ましいLDR見かけの問題(何らかの理由のためグレーダーはLDRが相当に異なって見えるようにすることを望む可能性がある)に加えて、当然ながらHDR_PREDへの可逆マッピングの付加的ファクタがあり、これは、LDR_CONT符号化においていくつのコードが特定の物体又はHDRディスプレイの輝度/カラーレンジに割り当てられるべきか等の情報符号化に関する考慮事項に基づく更なる最適化制約を与える。
白熱電球は、相当に高い(HDR)明るさを有し、またレンダリング時の物体テキスチャを前提にいくらかの明るさのばらつきを有するような物体を象徴する。全ての制約を前提として、これを顔を含む主要レンジに近いLDR_CONTのサブレンジ上に符号化することが望まれる。LDRモニタ上では同じ見かけを与えない可能性があるが、これはいずれにせよ通常不可能であり、それでも少なくともLDRでも良好な又は適切な見かけを与える方法で符号化される。例えば、その付近から出射する光線等、色の最終的な脳決定をもたらす好適に選択された周囲画素カラーとの組み合わせにより、LDRでも十分にランプのように見える可能性がある。HDRディスプレイガマットでは、そのような様々な明るい物体を顔等の主要物体の輝度レンジの十分上に配置する相当な自由があり、印象的なHDR見かけを与える。そして当然ながら、それらの輝度に対応するのはHDR_PREDのルマである(8ビット符号化であろうと又は好ましくは小数点[0,1]符号化であろうと、単純さのために線形であると仮定し、すなわち、これは、例えば画像処理ICの中間表現においてのように、ディスプレイレンダリング出力輝度に対して、コードの割り当てのために線形定義を有する)。
この明るい物体輝度レンジの上方には、ここでは太陽によって象徴される更に明るい物体が存在し、これは単一の色によってレンダリングされないと仮定する。ここで、LDRディスプレイ上でのLDR_CONT内の全てのより低いルマ物体の好ましいレンダリングを所与として(バスケット及び顔領域を上方に伸長する)、太陽のような少なくとも一部の物体をガマットの端に詰め込まなければならない可能性がある。その場合、逆マッピングは依然として太陽をHDRディスプレイガマットの最も明るい領域に配置するが、LDR_CONTにおけるコーディングのより低い品質のため、逆マッピングはHDRレンダリングで見られることが望まれる輝度/色をもたらさない可能性がある。ここで、太陽のHDR符号化においてより良い符号化、所望のHDRレンダリングにより対応し、特にマスターHDR符号化において符号化された通りの符号化を作成するために、本発明に係る乗算変更multcrrが役に立ち得る。
図5は可能な乗算変更の2つの有用な実施形態を概略的に示す。図5はデータユニットから構成されるように示される画像信号500を概略的に示し、データユニットは通常ストリーミング中に連続して到着し、又はメモリの異なる空間セグメントに保存され得る。典型的には、例えば画像ヘッダー501の後に、又は場合によっては、ショット若しくは比色的再配置に関して同様に処理されるべき一連の連続画像の開始の指標の後に、画像の一部を変更するためのメタデータが存在する。リザーブコードワード502(例えばPOS)は乗算変更を適用する場所の情報を与え、また矩形の始点x,y及びその幅(リザーブコードワード505ではw)等の領域定義パラメータが存在し、それから、乗数テーブル506内の乗算係数のストリングを復号することができる。US61/615490のように、より正確な物体境界決定を可能にするルマ閾値等の他のコーディングが存在してもよいが、矩形アプローチが好まれ、補正の形状を乗算ファクタ又は係数内に定め得る。矩形は開始座標503及び504並びに幅505(すなわち、幅符号化コードワードを含むリザーブされた位置)によって指定され、これらは例えば現在画像の画像ヘッダー501の後に符号化され得る。また、ショットのどの画像で信号が適用されるべきかを示すタイムコード515が存在し(空間コードが既に特定の画像ヘッダーの後に存在し得るので、これは必須ではない)、更に当然ながら物体の追跡及び変形を可能にし得る複数の指定が存在し得る。当業者は、物体が画素精度で区分されることを可能にする閾値ルマg等の代替的なコーディングが存在し得ることを理解するだろうが、どのみちそれほど多くのデータを符号化する必要がない場合又は他の特別な要件が存在しない場合、通常は単純/ロバストな符号化が好まれ得る。当然ながら、例えばコントラスト伸長のために、画素の空間的集合に対して乗算係数が与えられてもよく、例えば物体の左側に1つ、物体の右側に別のものが与えられる(又は、例えば上記顔の明暗の縞模様)等してもよい。
興味深いことに、画像信号は通常更に、信号内でリザーブワードMUL_TPY等によって識別される乗算補正のタイプ指標507、及び少なくとも2つの値を有し得るその値を含む。
例えば、タイプ値508は「M_NORM」(又は「1」等の他の符号化)であり、その場合、乗算は基礎の画素ルマに単純に直接適用される。これは、例えば255にクリップされ、例えばHDRへのマッピング後に1018にされるランプ内の構造を書くために使用され得る。その後、連続ルマ1018、1018、1018は、メタデータ内に符号化される典型的には画素ローカルファクタによって乗算される(例えば、x1.2、x1.4等)。ビットを節約するために、乗算係数が直接ではなく定義テーブル520を介して識別コードによって符号化されることが最適であり、これは他のメタデータ内に、例えばストリーム内に等間隔で又はディスク上のリザーブセクターに保存され得る。これは、何らかのHDR効果の深刻な劣化又は他の品質問題を有し得る予測と比較して画像をいくらか改良可能な場合、それはすでに良好なので最高の復元精度は必要ないため、また、画像に内在するノイズ等のファクタ、画像及びその物体の複雑性、及び人間の視覚の感度のためである。典型的には、人間のグレーダーは補正が行われるべきか否か及びその程度を決定し、典型的には乗算係数定義テーブル(520)に対する所定の識別コードを有するが、それがはるかに優れた改良を与える場合には、例えば所定のものの間のより正確な乗算係数を加える等、自身で微調整又は決定を行ってもよく、その後それらをシステム内にコード化してもよい(メタデータ内に符号化されていない事前合意されたものでなくてもよいが、それほど多くのデータが含まれていないのでどのみち含まれていてもよい)。典型的には、このようなテーブルの実施形態は何も行われないこと、すなわち1による乗算(同値)を意味するコードを1つ有し、そのために識別コード値0がリザーブされ得る。32の可能な最適値が与えられる例えば6ビットコードワードの乗算係数の2次元ウィンドウの例(テーブル506)が与えられる。最も興味深い乗算係数は、当然ながらそれらをカラーオフセットするために使用するか(M_NORM)、又は物体のコントラストを伸長するために使用するか(AVG_C)に依存する。本例では、例えばA1はルマが1.2により乗算されるべきことを示し、A2は1.4を示し、一部のコードは下方向の、すなわち0.9等の除算値を有してもよい。入力として空間的に隣接する画素の乗算結果の一部を取る関数式等、他の作業のために少数のコードがリザーブされていてもよく、値30は第1のそのような関数又はアルゴリズムF1が使用されるべきことを示す。例えば、一部の画素が圧縮歪みを被っており、乗算によって修正する代わりに処理済みの隣接画素からスキップ及び補間されることが考えられる。最後に、セグメント510は例えば任意のMPEG又はJPEC標準規格等に従う例えば8ビット画像符号化のためのデータを従来通りに単に含む。
他の種類の乗算AVG_Cは、局所的平均を変化させない又はほとんど変化させないが、その周辺のテキスチャプロフィールを変化させるものである。これは例えば、比較的厳しい量子化及び/又は局所的グレイ値のためのトーンマッピング曲線の一部に小さい傾斜が存在する場合に有用である。正確な関数形状をコード化するコードの符号化は追加の値をもたらし得るが、LDR_CONT内に符号化されたそれらの値を特定の方法で更に変更することにより、鮮明度及びコントラスト等の視覚的品質の大きな改良が容易に達成され得る。典型的には、移動平均と比較してブーストしてもよいし、又は個別のブースト値がそれほど変化しない場合、一連の画素の最初の画素の最初のルマを代表値として使用してもよい(但し平均の方がより正確である)。
その場合、一連の画素のルマをA+dl1、A+dl2、A+dl3等と書き込むことができる。Aはある領域のローカル平均である。その後dlのみをブーストし、すなわち、Li−Aに一連の乗数miの対応するものを掛け、ここでLiは、HDR_encoded_as_LDR表現LDR_CONTのマッピングから得られたHDR予測の連続画素i毎のルマである。その後、平均値を加えてコントラスト上昇(又は減少)ルマが得られ、すなわち連続出力ルマLo_i=A+mi*(Li−A)が与えられる。
(フィルタベース定義)平均化符号化データ構造511は、上記発明の平均が如何にして符号化され得るかの第1の実施形態の例を与える(当然ながら所定の方法で、例えば、常に11の画素にかけて計算を行うことも可能であり、更なる情報を符号化する必要がないよう、強力な境界を超える、平均化から差し引かれるべき不適切な値を考慮する)。9は、この画素に関して、その列沿いのローカル平均を決定するために9画素のウィンドウが使用されるべきであることを示し、すなわち、自身の画素ルマが前後の4つの画素ルマに加算される。0は、先に計算された平均がそれらの画素ルマの乗算変更に使用されることを示す。11は、ローカル画素位置周辺の11画素の平均化ウィンドウが使用されるべきことを示す。当然ながら、当業者は、例えば0のランレングス符号化等の他のデータ構造によっても符号化が行われ得ることを認識するであろう。
(区分ベース定義)平均化符号化データ構造512は、閾値を使用して、平均が如何にして計算され得るかを指定する他の方法を与える。例えば、現在のライン上で、典型的にはルマの縁部から次の物体に移動したことを示す値g2に行き当たるまで、平均が実行される。g1未満のルマ値は例えばノイズスパイクなので、平均化ウィンドウ沿いのそれらの値は差し引かれる(ある値以上の値を差し引くための同様な閾値が存在してもよい)。2列目の5は、このスキームが5つの連続する列に使用され、その後平均化処理を誘導するために新たなルマ閾値g11及びg12が使用される。しかし、正確な平均を求めることはそれほど重要ではないことに留意されたい。不正確な周辺平均による不適切な明るさ変更等のアーティファクトを導入することなく構造がブーストされる限り、方法は機能する。グレーダーは、乗算パラメータを変更するか(最終的な見かけにも影響を及ぼす)、又は、より正確な符号化を選択する、例えばローカル平均が如何にして計算されるかの変更等のいずれかのオプションを有する。第3の代替的又は補助ローカル平均符号化データ構造は、特定の位置及びそれらの位置以降又はその周囲に使用するための平均値を直接符号化し得る。例えば、乗算変更が実行されるウィンドウ内の位置x1,y1とx2,y2との間では平均A1=450が使用される。補助的な態様で、この符号化は、511内の符号化データよりも(直接位置平均定義)平均化符号化データ構造513内の符号化データを優先するアルゴリズムとして設計され、例えば、11の位置では、そのようなウィンドウにかけて計算をする代わりに、513内のその位置のために符号化された最終的な平均値、例えばA2が使用される。グレーダーのためのユーザーインターフェイスにおいて、これらの乗算変更パラメータ値の大部分が、グレーダーが好むLDRコンテナグレードを所与としたHDR予測とオリジナルHDRとの間の差から自動的に計算される。当然ながら、これは、例えば顔ではより高品質の符号化、又は特定のグレーディングアクション若しくはモード等、異なる方法で取り扱われるべきウィンドウを選択するなど、グレーダーの特定のアクションによって誘導される。しかし、当然ながら、インターフェイスはグレーダーが様々な乗算補正パラメータをより直接的に、例えば大まか且つ容易にアクセス可能な態様で指定又は変更することも可能にする。例えば、グレーダーが不快な明るさ変更、例えば空間変更を確認する場合、グレーダーはその領域を選択して例えばわずかに暗くし、これにより、AVG_Cモードのモジュールが平均を例えばデータ構造513内で直接符号化することによって再定義し、それらを暗くさせる。
符号化の非常に重要な部分の1つは、乗算係数が如何に符号化されるかである。LDRにおいて非常に特殊にグレーディングされた領域を補正したい場合(LUTの特定の関数であり得る現在の例えば単純なトーンマッピングを所与としてオリジナルのHDRの非常に近い近似に可逆的に予測され得ないよう)、要求されるローカルHDR信号の直線的な符号化によりそれを単純に置換できる。例えば、グレーダーは、完全に新しい画素が得られるようLDRコンテナ内の顔を再配色した可能性があり、これは、オリジナルのHDRに対して、HDR予測における異なる顔をもたらす。この場合、例えばオリジナルのLDRコンテナの画素カラー(すなわち、単純且つ容易に可逆なグローバルトーンマッピングによるオリジナルHDRから8ビットLDRへの第1のグレーディング)を部分的な第2の画像内に保存することにより、画像の例えばそれらのローカル部分(顔を含む)を単純に共符号化してもよい。しかし、本発明によれば、オリジナル画像を素早く近似する乗算値のみを保存することが好ましい。例えば、オリジナルHDRが値450、482、390、520をローカルに保持し、HDR予測がこれらの画素に対して440、470、350、500を与える場合、それらを割り算することで容易に乗数を得ることができ、結果は1.023、1.026、1.114、1.04となる。しかし、これらの乗数を直接符号化する必要はない。例えば、全てのローカルファクタが1.02と可変の最後の桁によって変化する場合、あるインデックス、例えばその桁そのものによって最後の桁を符号化してもよい。したがって、この場合、例えば3は3による乗算ではなく1.023による乗算を意味する。したがって、ローカルに最適化を行うことができ、最適テーブルを定めることができる。しかし、予測値はどのみち正確である必要はなく、すなわち450、482ではなく453及び485等でもよく、それでも複雑且つダイナミックな動画にて良好な視覚的品質を与えるので、HDR符号化に関してテーブルのより興味深い最適化が可能である。とはいえ、450に対して3の誤差は、より大きな誤差、例えば10よりましであり、特に、大きな誤差が容易に又は更に不快なほどに視認可能で小さい誤差はそうでない場合はそうである。例えば、変色又は退色を与えるブロック歪みを、全てをオリジナルHDRに又は少なくともより不快でない物体テキスチャに近づけるカウンターパターンで乗算することにより補正することができる(例えば、ブロックテキスチャを1より小さい係数で乗算してローカルコントラストを下げることによってより滑らかな色に)。しかし、更に、グレーダーはマッピングを特殊なHDR効果にさえ調整することができる。例えば、爆発は速い効果であり、炎のテキスチャは正確に再現されなくてもよいが、コントラスト等の一次の特性はそうされる必要がある。このため、グレーダーは、例えばそれらが特定の種類の物体又は特定の指定ウィンドウタイプ531のために使用されるべきことを示すテーブルの記述子530を有する、乗算変更のための1つ以上の最適テーブルを決定することができる。すなわち、ウィンドウの1つが炎タイプの場合、記述子=炎又は=1を有するテーブルが使用される。
したがって、この場合、乗数テーブル506は実際の乗数ではなく、定義テーブル520によって実際の乗数に変換される乗数のインデックスのみを含む。したがって、例えば、近似ファクタ2%(又は1.02)、4%、10%、50%のみによってHDR予測値を補正することが可能であり得る。これは通常、所与の物体領域のために近似的に必要なものに最適化され、すなわち細かい補正及び粗い補正である。マッピングテーブルは、平均予測HDRルマと平均HDRオリジナルルマとの間の中間値を少なくとも1つ保持すべきであり、すなわち、オリジナルが450で予測が440の場合、乗数2%により既に大きく近づくことができる。これは、1.02(又は、反対方向に補正をする必要がある場合は0.98)×440=448.8、すなわち449を与える。定義テーブル内に1%と3%の選択肢を符号化するだけで、乗数テーブル内に好ましい方の選択肢を符号化することを選択でき、すなわち、444より453の方が450に近いので、3%である。通常、定義テーブルは予測されるエラーの種類に応じて最適化される。小さい補正しか必要ない場合、300%又は1000%等の可能な補正は間違いなく定める必要がない。これは、例えば予測HDR及びオリジナルHDRの統計、特にそれらの画素毎のルマの差Y_HDR_orig_i−Y_HDR_PRED_iを見ることによって自動的に実行することができる。ヒストグラムが例えば多くのケースで平均450に対して差が1〜10であり、わずかなケースで差がより大きいことを示す場合、定義テーブル520を0.5%、1%、2%、3%、4%・・・のためのコードによって定めることを決定してもよい(0.5%未満は適度な品質のために必要ない)。
テーブル内の乗算値(1より小さくても大きくてもよいし、又は正/負のパーセントでもよい)の他に、特別なコードが存在してもよい。例えば、HDR_PRED内の現在の画素又は画素のセットが変更されるべきではないことを示すためにコード0が使用されてもよく、これは乗数1を符号化することと等価である。また、ある関数が使用されるべきことを示すコードが存在してもよく、例えば典型的には入力として周囲の乗算された/変更された画素値を取る。例えば、HDR_PRED内の画素ルマ/カラーが要求値から大きく離れている可能性があり(例えば、定義テーブル520内に符号化されている範囲外の乗算を必要とする鋭いアーティファクトのために)、この場合、いくつかの周囲の画素を平均して再構築する方が良い可能性がある。しかし、これは異なるグレーディング、圧縮歪み等、LDR_CONT信号の特異性を許容する。
図4は、画像レンダリングシステムにおけるHDR画像復号装置401の具体例の一例を示す。システムは、ディスプレイ420に接続され、画像処理、この場合は復号を取り扱うことができるボックスから構成されると見なす。当該復号装置は、例えばBDディスクプレイヤーであり、ディスプレイは2DのLEDバックライトLCDテレビであり得る。しかし、当業者は実施形態が多数の同等な変形形態によって実現され得ることを理解し、例えばいくつかを挙げると、復号装置401は他の国のネットワークサーバ上で動作してもよく(HDR_FINは例えば特定の受信ディスプレイのための専用(及び場合よっては暗号化された)コードでもよく、フォーマッティング等は本特許の教示外とする)、ディスプレイはポータブルディスプレイ、又はレンダリング可能な輝度のより低い又はより高い輝度レンジのための別個のプロジェクタを有する投影システム等でもよい。実際には、復号装置401はディスプレイ自体に含まれてもよい。一実施形態では、HDR画像を再構築するための符号化データはBlu−ray(登録商標)ディスク410上に符号化されると仮定し、Blu−ray(登録商標)ディスク410は、例えばMPEG−AVC、VC1、VP8、motionJPEG等によって符号化された、HDR_encoded_as_LDR(LDR_CONT)符号化としての符号化画素画像データのための別個の第1のセクター411を含む。第2のセクター412は、典型的には映画のショット毎等に、そして例えばパラメータ関数、ルックアップテーブル、アルゴリズム指定など様々な態様で符号化され得る複数の参照トーンマッピング関数FL2H(色は自動的に処理されてもよいが、当然ながら、例えばREDチャネル上で色を取り扱う関数が存在してもよい)を典型的には含むメタデータを保持する。HDR_PREDへの1回の復号のみを説明するが、当然ながら、複数の最終信号、例えばHDR_PREDが使用されるディスプレイよりも低いピーク明るさを有するディスプレイのためのMDR_PREDを導出するためのデータが存在してもよい。第3のセクター413は、少なくともHDR_PRED内の画素のルマの乗算変更のための乗算データA_MULを保持する。上述したように、これは多様な態様で符号化され、例えば典型的には単一の又は一連の画素に対して乗数テーブル506が符号化され、乗数テーブル506は、何らかの符号化(例えば、M_enc=f(M_raw)であり、ここでM_rawは生の乗数(例えば1.44)であり、fは、テーブル506内に直接符号化される係数M_encを生成する所定の割り当て関数(例えば平方根)である)に従う乗数を直接保持してもよいし、又は、好ましくは同じ第3のセクター413内の近くに存在する他の定義テーブル520内に保存される係数のためのインデックスを保持してもよい。当然ながら、乗数テーブル506において特別なコードが付与される画素のために使用される第1の関数F1及び第2の関数F2(例えば、(Y_left_neighbour+Y_right_neighbour)/2)等、他のメタデータが符号化されてもよい。このデータは少なくとも1つの入力部405を介して読み取られる。復号装置401は、典型的には、LDR_CONT信号の典型的に画像圧縮されたバージョンを復号するよう構成されるデコーダ402を含み、復号は例えばランレンス復号、IDCT等を含み得る。トーンマッパー403は、トーンマッピング関数FL2Hを使用して要求されるHDR信号の予測HDR_PREDを導出する。その後、画素カラー変更部404は、A_MUL内に符号化される通りに乗算変更を適用することにより、少なくともHDR_PRED内の画素のルマを変更する。これは、出力部を介して例えばディスプレイ(代わりに、これはストレージデバイス、クライアントコンピュータ等でもよい)に出力される最終信号をもたらす。その上、ディスプレイ420は、自身のディスプレイ画素カラー変更部421により、HDR_FIN入力信号に独自の最適トーン/カラーマッピングを適用してもよく、これにより、このケースではLEDバックライト及びLCD(2つのプロジェクタの例では、例えばそのDMDの画素、また、例えばOLED等の単一のパネルソリューションのためには、その画素のための単一の駆動信号)のための駆動信号HDR_DRVの駆動値が最終的に与えられる。装置に第2の出力部406が存在し、例えばモバイルディスプレイ430に無線でLDR出力画像/映像LDR_oを提供してもよい。ディスプレイ420のハイダイナミックレンジ及びLDRディスプレイ430がレンダリング可能なローダイナミックレンジR_oLDRが概略的に示されている。
図7は、HDR画像符号化装置701の例示的な具体例を示す。重要なユニットの1つはグレーディングマネージャー702である。グレーディングマネージャー702は、グレーダーがグレーディングを実行することを可能にする。グレーディングマネージャー702は少なくともオリジナルHDRファイルHDR_ORIGを取得し、これについては既にマスターHDRグレーディングであると仮定し、すなわち、映画ディレクター等のコンテンツ製作者が美術スタッフと共に映画がどのように見えるべきかを決定したものを取得する(例えば、アクション映画の夕方のシーンにおいて、ディレクターは、建物に薄く濁った非常に暗い見かけを与え、通りにぶら下げられる看板の有色TLチューブにはきつい高輝度且つ飽和した見かけを与えることを決定した)。通常、コンテンツ製作者は、当然ながら例えばDVD又はyoutubeのグレーディングはその技術の制約及び特性を満たさなければならないが、全ての導出されたグレーディングが同様に見えることを望む。当然ながら、代替的な具体例は、HDR_ORIGとして生のカメラ信号、例えば異なる露出時間が組み合わせられた2つのカメラ撮像の線形輝度色空間組み合わせを有してもよく、この場合、コンテンツ製作者はグレーディングマネージャー702を使用してマスターグレーディングを作成する。しかし、通常、これはワークフローの異なる時点で実行され得る。例えば、デジタル撮影の場合、(予備)グレーディングの一部は、ディレクターが自身の創作的構想及び実際のシーンがどのように見えたかの新鮮な記憶をまだ有する撮影日に既に移動している。しかし、グレーディングにおける膨大な作業及び多忙な撮影スケジュールのため、少なくともBDグレーディング等の下位のグレーディングに関する作業は、映画の完成後まで後回しにされる可能性がある。当然ながら、HDR画像符号化装置701は、入力として複数のグレーディングを有してもよく、例えば、グレーダーが自身のLDR_CONTグレーディングを多かれ少なかれ詳細に調整すべき第1のLDRグレーディング、又は、異なるレンダリング条件下で若しくは映画の異なる美術バージョンのために使用される他のHDRグレーディングであり得る他の任意のグレーディングGRADING_2等が既に存在してもよい。いずれにせよ、通常、グレーダーは、HDR_ORIGに基づいてLDRグレーディングを導出するためにグレーディングマネージャー702を使用する。したがって、通常、グレーディングマネージャーは、(例えばソフトウェア内で)第1のグレーディングと第2のグレーディングとの間でマッピングを適用することを可能にするユニットを含み、これは通常、任意のx位置にて曲線上の点をクリックして、それらを任意のy位置に移動させることにより任意のトーンマッピング曲線を作成することを含む。また、パラメータトーンマッピング曲線のファミリを循環する手段が存在してもよい。楕円等の領域を選択して(乗算変更を適用するための領域である必要はなく、それは楕円の包囲矩形等であり得る)、その後処理をローカルに行うための手段が存在してもよい。HDR_encoded_as_LDR又はLDRコンテナグレーディングでは、典型的には、これらのマッピングは可逆性が保証されるよう制約が課されてもよい。例えば、グレーダーは、良好な質のHDR_PREDを可能にする十分なデータ精度を残す関数、又は、少なくとも、可逆、すなわち区分的に単調な関数のみを構築してもよい。しかし、典型的には、グレーダーは可逆でないグレーディング作業を行うことが許され得るが、この場合、グレーダーが不可逆なグレーディングの量を制限するよう、それについて警告が発せられ得る。この場合、グレーダーは例えばいくつかの隔離された画素を任意にカラーリングすることにより続けることができる。グレーディングマネージャー702は、画像マッピング及び変更を実行するだけでなく、それに対応する変更データをトラックするよう構成され(例えば、トーンマッピング曲線の定義、変更された画素カラー等)、更なる処理、典型的にはオリジナルHDRに戻ることを可能にし、上記データはLDR_CONTグレーディング/符号化も定める。典型的には、ユーザーインターフェイスユニット703は、グレーダーが自身のユーザー入力USRINPをグレーディングマネージャー702に与えることを可能にする。当業者はこれが何であるかを知るため、これの詳細については述べず、例えば、専用グレーディングコンソールが接続されてもよく、ソフトウェアが例えばユーザーがボタンを押したときにトーンマッピング関数が如何に変化するかをトラックする。美術グレーダーが通常LDRグレードLDR_CONTの作成の全権を有し(但し、半自動的に導かれる可能性もあり、例えば、ショット内の画像のヒストグラム等の情報理論的考察に基づき、様々な画像物体/部分領域を良好に視認可能且つ適切な輝度サブレンジに配置する第1のトーンマッピングをアルゴリズムが既に導出してもよい)、よって輝度的に最適な見かけの画像、すなわち典型的には全ての物体構造が適切に視認可能であり、画像に特定の見かけを与えるよう物体内のコントラストが最適化された画像を作成するが、一方、グレーダーは乗算変更部分によって過度に悩まされることを望まない可能性がある。したがって、一部の実施形態はこの部分においても少なくともいくらかのグレーダー制御を提供し得るが、他の実施形態はこの乗算変更部分を自動的に実行し得る。これは、グレーディング差比較器704によって実行される。グレーディング差比較器704は、例えば、典型的には入力としてLDR_CONTに基づく中間の又は最終的な予測HDR_PRED及びORIG_HDRを取り、両者がどのように異なるかを比較する。この比較アルゴリズムは、グレーダーが注目したローカル領域によって先導されてもよいが、通常は、グレーダーが個別に処理しなかった領域の予測の質も見てもよい。グレーディング差比較器704は、2つのHDRグレーディング(HDR+PREDvsHDR_ORIG)が過度に異なるために乗算変更が必要な複数の領域を選択するよう構成される。ここで、一部の実施形態では、例えば部分的色誤差の視認性の心理視覚的モデルを使用することにより、グレーダー入力が適切なグレーディング差を決定する数学的アルゴリズムを補完してもよい。ユーザーグレーディング変更ユニット706は、グレーディング差比較器704の少なくとも一部のパラメータを適合するよう構成される。例えば、単純な一実施形態では、グレーディング差比較器704は、自身が(A_MUL内に符号化される)乗数アレイによって乗算変更を定める画像領域を例えば4つ決定し得る。グレーダーは、これらの領域のうちの2つがそれほど変化していないと、すなわち、予測HDR_PREDにおいて当初からそれほど悪くなかったと考え得る。このために、ユーザーグレーディング変更ユニット706は、グレーダーが、乗算変更された領域と当該例えば長方形等の符号化形状内のオリジナルHDR_PREDとの間で切り替え、両者を基準HDRディスプレイ上に間欠的にレンダリングするときに視認性を見ることを可能にするソフトウェアモジュールを実装してもよい。グレーダーはその後、変更される領域のリストから2つの領域を消去してもよく、つまり、残りの2つだけが乗算変更データA_MUL内に符号化される。また、グレーダーは例えば、自身が改良変更が実行されるべきだと考える別の例えば長方形の領域を選択してもよい。典型的には、グレーディング差比較器704は乗算変更データA_MULを、特に乗算係数を決定し、データの基礎は乗算知識データベース705内に事前に保存される。これは、例えば1つ以上の定義テーブル520又は乗算係数を定めるための同等なもの、及び、例えばグレーディング差比較器704が差を乗数に変換する方法のためのモデル等を保存し得る。例えば、単純なモデル704は、画素毎のルマ差を見て、それらを乗算変更係数に変換し(例えば、Y_HDR_ORIG−Y_HDR_PRED=m*Y_HDR_PRED;Y_HDR_ORIG=Y_HDR_PRED+m*Y_HDR_PRED)、そしてそれらの乗算係数を、具体的に選択された定義テーブル520において使用可能な最も近いものにマッピングする。具体的な定義テーブル520は、例えばグレーダーによって選択されてもよいし、又は、各テーブルが如何に適切かに依存してグレーディング差比較器704によって自動的に、例えば少なくとも1つの画像又は領域にわたる累積残存誤差指標を計算することにより(これは、例えば物体が顔である又は画像内のより中央に配置される等の重要性を考慮した係数によって重み付けされてもよい)選択されてもよい。より複雑なアルゴリズムは、例えば全物体にわたるカラー符号化又は見かけにおけるセミグローバルな差等を計算してもよい。これにより例えば第1のグローバル乗算係数が導出され、その後画素毎に微調整がされる等してもよい。上述したように、ユーザーは当然ながらそれらのパラメータに影響を及ぼすことができる。例えば、選択された定義テーブルが、乗算変更されたHDR_FIN(典型的には、出力される必要がない704内の又は704に関連する中間データ)のHDR_ORIGに対する類似性の十分な精度をもたらさない場合、ユーザーは新たな定義テーブル520を決定することができる。これは例えば「精度上昇」ボタンを押すことによって半自動的に行われ、この場合、定義テーブルはより高いビット配分を代償に、より多くの可能な乗算係数を保存することになる。又は、ユーザーが、例えば自身が正確にレンダリングされることを望む物体テキスチャの領域をクリックすることにより、独自の値を具体的に定める等してもよい。同じく上述したように、ローカル平均を定める方法を指定し得るオプションの平均化仕様データAVGDATが更に存在してもよく、一部の実施形態では、グレーダーがこのデータに影響を及ぼすオプションも与えられ得る。最後に、符号化ユニット710が全てをまとめて(すなわち、任意に符号化された、例えばMPEG_AVG圧縮されたLDR_CONT画像、トーンマッピング関数FL2H等の画像マッピングデータ、及び任意に符号化された乗算変更データA_MUL)、これを出力画像信号S_imが規定する任意の方法で当該信号内に符号化する。当業者は、この厳密なメタデータフォーマッティングが本発明の重要な要素ではなく、典型的には、画像信号S_imの特定のリザーブ位置、例えばより古いデコーダでは無視されていた部分に入れること、特定のデータ構造フォームを与えること、リザーブされていた名前及び/又はタイプコード等に関連付けることを含み得ることを理解する。この画像はその後例えば図4のBDディスク上に符号化されてもよいし、又はアンテナ711を介して送信される等してもよい。本発明を一般的に説明するためにいくつかの例を使用したが、当業者は同じことを実現する多様な態様が存在することを理解する。
図8は、オリジナルHDRシーン取り込みの8ビット符号化のための他の可能なシナリオを示す。このケースでは、8ビットHDR画像(8ビットHDR)、すなわち、例えば3000ニットのHDRディスプレイ上で直接使用できる画像が作成される。画像は例えば[0,1]〜[0,255]の単純な線形マッピング及び量子化によって生成され得る。ここで、グレーダーはそれから単純なマッピング、例えばグローバルマッピングによって一次8ビットLDRグレード(GRAD_1LDR)をマッピングし、これは異なるレンダリングダイナミックレンジグレーディングを単一の8ビット画像及びトーンマッピングによって関連付けるという原理に従い相当に有用であり、またLDRディスプレイ上にレンダリングされたとき適度な画像を与え得るが、グレーダーは完全に満足しない可能性がある。この場合、グレーダーは少数の重要な領域に乗算変更を適用して、最終8ビットLDRグレーディングGRAD_FINLDRに至ってもよい。この場合、8bit_HDR、下方マッピング単純トーンマッピング戦略(例えばグローバルトーンマッピング関数FH2L)、及び乗算係数データ(この場合はGRAD_FINLDRと8bit_HDR符号化に下方マッピングを適用することによって単純に得ることができるものとの間の差をコード化する)が符号化され得る。
本文書において開示されるアルゴリズム要素は、実践では(完全に又は部分的に)ハードウェア(例えば、特定用途向けICの部分)として、又は特別なデジタル信号プロセッサ又は汎用プロセッサ等の上で動作するソフトウェアとして具体例され得る。これらは、少なくともいくらかのユーザー入力が存在し得る/した(例えば、工場で、又は消費者又は他者による入力)という意味で、半自動的であり得る。
当業者は、我々の提案から、どの要素がオプションの(選択任意の)改良であり、他の要素と組み合わせて実現され得るか、及び、方法の(オプションの)ステップが如何に装置の各手段に対応するか(及びその逆)を理解できるであろう。本発明において、いくつかの要素が特定の関係で(例えば、ある構造において単一の形態で)開示されるからといって、本明細書において特許のために開示された同じ発明的思考に基づく実施形態として他の構成が不可能であるとは限らない。また、実践的な理由から限られた範囲の例しか説明されていないことは、他の変形例が特許請求の範囲に含まれ得ないことを意味しない。実際には、本発明の構成要素は、任意のユースチェーンに沿って、様々な変形形態で実現可能であり、例えば、作成側のあらゆる変形例(例えばエンコーダ)は、分解されたシステムの消費側における対応する装置(例えばデコーダ)と同様又は同一であり、その逆も成立する。実施形態のいくつかの要素は、エンコーダとデコーダとの間の任意の伝送技術において、伝送用、又は協調等の他の用途の信号内に特定の信号データとして符号化され得る。本願において、用語「装置」はその最も広い意味、すなわち、特定の目的の実現を可能にする手段のグループを意味し、よって例えばIC(の小さい一部)、専用器具(ディスプレイを有する器具等)、又はネットワークシステムの一部等であり得る。「構成」又は「システム」も最も広い意味で使用されるよう意図され、よって特に単一の物質的な購入可能な装置、装置の一部、連携する装置の(部分の)集合等を含み得る。
コンピュータプログラム製品という表記は、プロセッサにコマンドを入力するための一連のロードステップ(中間言語、及び最終的なプロセッサ言語への変換等の中間変換ステップを含み得る)の後、汎用又は特定用途向けプロセッサが、発明の特徴的機能のいずれかを実行することを可能にするコマンドの集合のあらゆる物質的具現化を含むと理解されたい。特に、コンピュータプログラム製品は、例えばディスク又はテープ等のキャリア上のデータ、メモリ内に存在するデータ、有線又は無線ネットワーク接続を介して伝送されるデータ、又は紙上のプログラムコードとして実現され得る。プログラムコードの他に、プログラムに必要な特徴的データもコンピュータプログラム製品として具現化されてもよい。かかるデータは(部分的に)任意の方法で供給され得る。
本発明、又はビデオデータ等の本実施形態の任意の哲学に基づいて使用可能なあらゆるデータは、光学ディスク、フラッシュメモリ、リムーバブルハードディスク、無線手段を介して書き込み可能な携帯型デバイス等のリムーバブルメモリであり得るデータキャリア上の信号として具現化されてもよい。
データ入出力ステップ、及び標準的なディスプレイ駆動等の周知の通常組み込まれる処理ステップ等、任意の提案される方法の動作に必要なステップの一部は、(本発明の実施形態の詳細とともに)本明細書で説明されるコンピュータプログラム製品若しくは任意のユニット、装置又は方法において説明される代わりに、本発明のプロセッサ又は任意の装置の実施形態の機能内に既に存在してもよい。また、例えば方法の任意のステップに又は装置の任意のサブ部分に含まれる(関与する)特定の新規の信号、及びかかる信号の新規な使用又は任意の関連する方法等の結果物及び同様の結果に関しても、保護を求める。
上記実施形態は本発明を限定ではなく説明することに留意されたい。当業者は、提案された例の特許請求の範囲の他の分野への転用を容易に認識することができるが、簡潔さのために、それらのオプションの全ては詳細に述べていない。特許請求の範囲において組み合わせられる本発明の要素の組み合わせの他に、要素の他の組み合わせも可能である。任意の要素の組み合わせが、単一の専用要素において実現され得る。
請求項における括弧間のあらゆる参照符号は請求項を限定することを意図せず、図面内の特定の参照符号も同様である。用語「含む(又は有する若しくは備える等)」は請求項内に列挙されていない要素又は特徴の存在を除外しない。要素は複数を除外しない。

Claims (15)

  1. 第1の輝度ダイナミックレンジに対応する画像符号化を第2の輝度ダイナミックレンジ出力画像に復号する方法であって、前記画像符号化は、ハイダイナミックレンジシーンのオリジナル画像の符号化画素であり、前記方法は、
    −所定のトーンマッピング戦略により、前記画像符号化内の画素の少なくともルマを、前記第2の輝度ダイナミックレンジに対応する中間画像内の画素のルマにトーンマッピングするステップと、
    −前記中間画像の少なくとも一部の画素のルマに所定の乗算係数を掛けることにより当該ルマを変更し、前記出力画像を得るステップと
    を含み、
    前記所定の乗算係数は、前記第1の輝度ダイナミックレンジから前記第2の輝度ダイナミックレンジへの前記トーンマッピングの補正を得るための、前記中間画像の前記少なくとも一部の画素のルマに適用されるべき乗算補正を表す、画像符号化を復号する方法。
  2. 前記第1の輝度ダイナミックレンジは、500ニット以下のレンジのピーク輝度に対応するローダイナミックレンジであり、前記第2の輝度ダイナミックレンジは、少なくとも750ニットのピーク輝度を有するハイダイナミックレンジである、請求項1に記載の画像符号化を復号する方法。
  3. 前記所定の乗算係数は、前記画像符号化に関連付けられたメタデータ内に保存され、前記復号する方法は、前記メタデータにおいて、空間領域のために前記メタデータ内に少なくとも1つの乗算係数が符号化されている前記画像符号化の当該空間領域を定める情報を読み取るステップを含み、前記空間領域の幾何学形状が前記メタデータ内に符号化されている、請求項1又は2に記載の画像符号化を復号する方法。
  4. 前記所定の乗算係数は、画素又は画素のグループ毎に乗算係数を備える乗算係数アレイ内に含まれ、前記アレイは前記空間領域幾何学形状の符号化に対応して定められる、請求項3に記載の画像符号化を復号する方法。
  5. 前記乗算係数アレイ内の前記乗算係数は、定義テーブルのインデックスとして符号化され、前記定義テーブルは前記インデックスに対する実際の乗算係数を保持する、請求項4に記載の画像符号化を復号する方法。
  6. 前記定義テーブルは、どのようなルマ変更の場合に前記定義テーブルが使用されるべきかを特徴付ける記述子に関連付けられる、請求項5に記載の画像符号化を復号する方法。
  7. 前記復号は更にウィンドウタイプを読み取り、前記ウィンドウタイプは、そのウィンドウタイプに関連付けられた空間領域が、当該ウィンドウタイプに対応する記述子に関連付けられた定義テーブルによって符号化された乗算係数を有することを示す、請求項6に記載の画像符号化を復号する方法。
  8. 前記中間画像の少なくとも一部の画素のルマを変更する前記ステップは、前記乗算を、前記出力画像のローカル平均輝度が前記中間画像のローカル平均輝度から所定の割合のずれ内に含まれる乗算戦略に制約する態様で実行される、請求項1又は2に記載の画像符号化を復号する方法。
  9. 前記乗算係数がそのような制約された乗算に関連して定められることを示すタイプ値が読み取られる、請求項8に記載の画像符号化を復号する方法。
  10. 前記乗算係数は、一連の1次元又は2次元位置座標にわたる乗算係数の関数的定義として前記メタデータから読み取られる、請求項に記載の画像符号化を復号する方法。
  11. ハイダイナミックレンジシーンのオリジナル画像を第1の輝度ダイナミックレンジに対応する画像符号化として符号化する方法であって、
    −所定のトーンマッピング戦略により、前記画像符号化内の画素の少なくともルマを第2の輝度ダイナミックレンジに対応する中間画像内の画素のルマにトーンマッピングするステップと、
    −前記中間画像内の画素カラーと指定された第2の画像の画素カラーとの間の差を分析することにより、前記中間画像の少なくとも一部の画素のルマに掛けるための乗算係数を決定するステップであって、前記所定の乗算係数は、前記第1の輝度ダイナミックレンジから前記第2の輝度ダイナミックレンジへの前記トーンマッピングの補正を得るための、前記中間画像の前記少なくとも一部の画素のルマに適用されるべき乗算補正を表す、ステップと、
    −画像信号内に前記画像符号化、前記トーンマッピング戦略を指定するデータ、及び前記乗算係数を指定するデータを符号化するステップと
    を含む、ハイダイナミックレンジシーンのオリジナル画像を符号化する方法。
  12. 前記第1の輝度ダイナミックレンジは、500ニット以下のレンジのピーク輝度に対応するローダイナミックレンジであり、前記第2の輝度ダイナミックレンジは、少なくとも750ニットのピーク輝度を有するハイダイナミックレンジである、請求項11に記載のハイダイナミックレンジシーンのオリジナル画像を符号化する方法。
  13. −第1の輝度ダイナミックレンジに対応する画像符号化を取得するためのデコーダと、
    −トーンマッピング戦略の指定を取得して、前記トーンマッピング戦略を前記画像符号化に適用することにより、第2の輝度ダイナミックレンジに対応する中間画像を生成するためのトーンマッパーと、
    −少なくとも1つの乗算係数を含む乗算係数データを取得して、前記少なくとも1つの乗算係数を前記中間画像内の少なくとも1つの画素のルマと掛け合わせることにより、出力として出力画像を生成する画素カラー変更部と
    を含み、
    前記少なくとも1つの乗算係数は、前記第1の輝度ダイナミックレンジから前記第2の輝度ダイナミックレンジへの前記トーンマッピングの補正を得るための、前記中間画像の前記少なくとも1つの画素のルマに適用されるべき乗算補正を表す、HDR画像復号装置。
  14. −ハイダイナミックレンジシーンのオリジナル符号化を取得するための入力部と、
    −前記オリジナル符号化を第1の輝度ダイナミックレンジに対応する画像符号化に変換するための、及び、前記画像符号化をトーンマッピングデータ内に符号化されたトーンマッピング戦略を用いてトーンマッピングすることにより、第2の輝度ダイナミックレンジに対応する中間画像を決定するためのグレーディングマネージャーと、
    −前記中間画像を指定された第2の画像と比較し、両画像間の差に基づき、前記中間画像の少なくとも1つの画素のルマと掛け合せられると、前記中間画像内の画素のカラーより前記第2の画像内の対応する画素のカラーに近い出力画像の最終的画素カラーを生成し、これにより、前記第1の輝度ダイナミックレンジから前記第2の輝度ダイナミックレンジへの前記トーンマッピングの補正を得る、乗算補正を表す少なくとも1つの乗算係数を含む乗算係数データを導出するためのグレーディング差比較器と、
    −前記画像符号化、前記トーンマッピングデータ、及び前記乗算係数データを出力画像信号内に符号化するための符号化ユニットと
    を含む、HDR画像符号化装置。
  15. 人間のカラーグレーダーが少なくとも前記画像符号化及び前記トーンマッピング戦略を決定することを可能にするためのユーザーインターフェイスユニットを含む、請求項14に記載のHDR画像符号化装置。

JP2015521101A 2012-07-13 2013-07-01 改良されたhdr画像符号化及び復号方法並びに装置 Active JP6382805B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261671183P 2012-07-13 2012-07-13
US61/671,183 2012-07-13
PCT/IB2013/055384 WO2014009844A1 (en) 2012-07-13 2013-07-01 Improved hdr image encoding and decoding methods and devices

Publications (3)

Publication Number Publication Date
JP2015531183A JP2015531183A (ja) 2015-10-29
JP2015531183A5 JP2015531183A5 (ja) 2016-08-18
JP6382805B2 true JP6382805B2 (ja) 2018-08-29

Family

ID=48949194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015521101A Active JP6382805B2 (ja) 2012-07-13 2013-07-01 改良されたhdr画像符号化及び復号方法並びに装置

Country Status (7)

Country Link
US (2) US9516351B2 (ja)
EP (1) EP2873237B1 (ja)
JP (1) JP6382805B2 (ja)
CN (1) CN104471939B (ja)
RU (1) RU2652465C2 (ja)
WO (1) WO2014009844A1 (ja)
ZA (1) ZA201501010B (ja)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA201492098A1 (ru) * 2012-05-14 2015-04-30 Лука Россато Кодирование и декодирование на основании смешивания последовательностей выборок с течением времени
US9516351B2 (en) * 2012-07-13 2016-12-06 Koninklijke Philips N.V. HDR image encoding and decoding methods and devices
RU2580093C2 (ru) * 2012-08-08 2016-04-10 Долби Лабораторис Лайсэнзин Корпорейшн Обработка изображений для изображений с расширенным динамическим диапазоном (hdr)
KR102004199B1 (ko) * 2012-11-16 2019-07-26 톰슨 라이센싱 높은 동적 범위 이미지들의 프로세싱
US9129388B2 (en) * 2012-11-21 2015-09-08 Apple Inc. Global approximation to spatially varying tone mapping operators
CN109064433B (zh) * 2013-02-21 2022-09-13 皇家飞利浦有限公司 改进的hdr图像编码和解码方法及设备
US10194162B2 (en) * 2013-07-18 2019-01-29 Koninklijke Philips N.V. Methods and apparatuses for creating code mapping functions for encoding an HDR image, and methods and apparatuses for use of such encoded images
US9275445B2 (en) 2013-08-26 2016-03-01 Disney Enterprises, Inc. High dynamic range and tone mapping imaging techniques
BR112016015256B1 (pt) * 2014-01-07 2023-12-19 Dolby Laboratories Licensing Corporation Método, aparelho e mídia legível por computador para decodificar uma imagem de alta faixa dinâmica - hdr - no formato jpeg, e método, aparelho e mídia legível por computador para codificar uma imagem de alta faixa dinâmica - hdr - no formato jpeg
EP2894857A1 (en) * 2014-01-10 2015-07-15 Thomson Licensing Method and apparatus for encoding image data and method and apparatus for decoding image data
US10812801B2 (en) 2014-02-25 2020-10-20 Apple Inc. Adaptive transfer function for video encoding and decoding
CN106464892B (zh) 2014-05-28 2019-07-02 皇家飞利浦有限公司 用于对hdr图像进行编码的方法和装置以及用于使用这样的编码图像的方法和装置
CN110460743B (zh) * 2014-06-10 2021-10-29 松下知识产权经营株式会社 显示装置、变换装置、显示方法、播放装置、播放方法
CN111901599B (zh) * 2014-06-27 2024-05-14 松下知识产权经营株式会社 再现装置
EP3178231A1 (en) 2014-08-08 2017-06-14 Koninklijke Philips N.V. Methods and apparatuses for encoding hdr images
KR102279842B1 (ko) * 2014-08-08 2021-07-21 코닌클리케 필립스 엔.브이. Hdr 이미지 인코딩 방법 및 장치
JP6619813B2 (ja) * 2014-12-11 2019-12-11 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 特定のディスプレイに対する高ダイナミックレンジ画像の最適化
KR102091072B1 (ko) 2014-12-23 2020-03-19 삼성전자주식회사 컨텐츠 제공 장치, 디스플레이 장치 및 그 제어 방법
EP3251337A1 (en) * 2015-01-29 2017-12-06 Koninklijke Philips N.V. Local dynamic range adjustment color processing
EP4089627A3 (en) * 2015-01-30 2022-12-28 InterDigital VC Holdings, Inc. A method and apparatus of encoding and decoding a color picture
EP3067882A1 (en) 2015-03-10 2016-09-14 Thomson Licensing Adaptive color grade interpolation method and device
JP6463179B2 (ja) * 2015-03-17 2019-01-30 キヤノン株式会社 信号処理装置、信号処理方法および撮像装置
US9942489B2 (en) 2015-06-02 2018-04-10 Samsung Electronics Co., Ltd. Adaptive tone mapping based on local contrast
US10089960B2 (en) * 2015-06-05 2018-10-02 Apple Inc. Rendering and displaying HDR content according to a perceptual model
EP3113496A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
EP3323104B1 (en) 2015-07-16 2021-10-27 InterDigital Madison Patent Holdings, SAS A method and device for tone-mapping a picture by using a parametric tone-adjustment function
US10116938B2 (en) * 2015-07-22 2018-10-30 Arris Enterprises Llc System for coding high dynamic range and wide color gamut sequences
WO2017057926A1 (ko) * 2015-09-30 2017-04-06 삼성전자 주식회사 디스플레이 장치 및 이의 제어 방법
EP3169071B1 (en) * 2015-11-16 2020-01-29 InterDigital VC Holdings, Inc. Backward-compatible encoding of a hdr picture
EP3364654B1 (en) * 2015-12-15 2021-03-03 Huawei Technologies Co., Ltd. High dynamic range image processing method and apparatus
EP3409015B1 (en) 2016-01-28 2019-09-25 Koninklijke Philips N.V. Encoding and decoding hdr videos
US10257394B2 (en) 2016-02-12 2019-04-09 Contrast, Inc. Combined HDR/LDR video streaming
US10264196B2 (en) 2016-02-12 2019-04-16 Contrast, Inc. Systems and methods for HDR video capture with a mobile device
JP6451669B2 (ja) 2016-03-04 2019-01-16 ソニー株式会社 評価装置、評価方法およびカメラシステム
EP3427478B1 (en) * 2016-03-07 2023-08-23 Koninklijke Philips N.V. Encoding and decoding hdr videos
US10699391B2 (en) 2016-04-29 2020-06-30 Disney Enterprises, Inc. Dynamic range expansion highlight information restoration
KR102385726B1 (ko) * 2016-05-04 2022-04-12 인터디지털 브이씨 홀딩스 인코포레이티드 하이 다이내믹 레인지 화상을 코딩된 비트스트림으로 인코딩/디코딩하기 위한 방법 및 장치
EP3482566B1 (en) 2016-07-08 2024-02-28 InterDigital Madison Patent Holdings, SAS Systems and methods for region-of-interest tone remapping
JP7081835B2 (ja) 2016-08-09 2022-06-07 コントラスト, インコーポレイテッド 車両制御のためのリアルタイムhdrビデオ
US9747282B1 (en) 2016-09-27 2017-08-29 Doppler Labs, Inc. Translation with conversational overlap
CA3112712C (en) * 2016-10-05 2023-09-12 Dolby Laboratories Licensing Corporation Source color volume information messaging
US11202050B2 (en) * 2016-10-14 2021-12-14 Lg Electronics Inc. Data processing method and device for adaptive image playing
EP3583780B1 (en) 2017-02-17 2023-04-05 InterDigital Madison Patent Holdings, SAS Systems and methods for selective object-of-interest zooming in streaming video
CN110383848B (zh) 2017-03-07 2022-05-06 交互数字麦迪逊专利控股公司 用于多设备呈现的定制视频流式传输
EP3416363A1 (en) * 2017-06-13 2018-12-19 Koninklijke Philips N.V. Gamut mapping for hdr (de)coding
US11265530B2 (en) 2017-07-10 2022-03-01 Contrast, Inc. Stereoscopic camera
US10609372B2 (en) 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
US10778979B2 (en) * 2018-01-11 2020-09-15 Qualcomm Incorporated Signaling mechanisms for equal ranges and other DRA parameters for video coding
US10546554B2 (en) 2018-03-26 2020-01-28 Dell Products, Lp System and method for adaptive tone mapping for high dynamic ratio digital images
EP3776474A1 (en) 2018-04-09 2021-02-17 Dolby Laboratories Licensing Corporation Hdr image representations using neural network mappings
US10951888B2 (en) 2018-06-04 2021-03-16 Contrast, Inc. Compressed high dynamic range video
CN111202425B (zh) * 2018-11-22 2021-05-25 江苏宏威重工机床制造有限公司 排气阀定时释放机构
US11032576B2 (en) * 2019-06-10 2021-06-08 Microsoft Technology Licensing, Llc Selectively enhancing compressed digital content
CN110266965B (zh) * 2019-06-28 2021-06-01 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
KR20210001762A (ko) 2019-06-28 2021-01-06 삼성전자주식회사 영상을 처리하는 전자 장치 및 그 영상 처리 방법
CN111311524B (zh) * 2020-03-27 2023-04-18 电子科技大学 一种基于msr的高动态范围视频生成方法
US11330196B2 (en) * 2020-10-12 2022-05-10 Microsoft Technology Licensing, Llc Estimating illumination in an environment based on an image of a reference object
CN114519683A (zh) * 2020-11-20 2022-05-20 北京晶视智能科技有限公司 图像处理方法及应用其的图像处理装置
CN112804464B (zh) * 2020-12-30 2023-05-09 北京格视科技有限公司 一种hdr图像生成方法、装置、电子设备及可读存储介质
CN114463207B (zh) * 2022-01-24 2022-07-29 哈尔滨理工大学 基于全局动态范围压缩与局部亮度估计的色阶映射方法
CN116723417B (zh) * 2022-02-28 2024-04-26 荣耀终端有限公司 一种图像处理方法和电子设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2844273T3 (es) * 2001-02-27 2021-07-21 Dolby Laboratories Licensing Corp Método y dispositivo para exponer una imagen
JP2006211152A (ja) * 2005-01-26 2006-08-10 Hokkaido Univ 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化用プログラム、画像復号用プログラム
WO2007082562A2 (en) * 2006-01-23 2007-07-26 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. High dynamic range codecs
US8014445B2 (en) * 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
US8135230B2 (en) * 2007-07-30 2012-03-13 Dolby Laboratories Licensing Corporation Enhancing dynamic ranges of images
US8184693B2 (en) 2008-04-11 2012-05-22 Intel Corporation Adaptive filtering for bit-depth scalable video codec
US8339475B2 (en) * 2008-12-19 2012-12-25 Qualcomm Incorporated High dynamic range image combining
JP5589006B2 (ja) * 2009-03-13 2014-09-10 ドルビー ラボラトリーズ ライセンシング コーポレイション 高ダイナミックレンジ、視覚ダイナミックレンジ及び広色域のビデオの階層化圧縮
WO2011007905A1 (ko) 2009-07-15 2011-01-20 주식회사 한빛티앤아이 이동통신 단말기용 힌지모듈
BR112012021792B1 (pt) 2010-03-03 2021-09-28 Koninklijke Philips N.V. Método de adição de informações de especificação de renderização de exibição a um sinal de imagem de entrada, aparelho de análise de imagem para adicionar informações de definição de imagem às informações de pixel de imagem de um sinal de imagem de entrada, método de processamento de um sinal de imagem de entrada a ser renderizado com base nas informações de definição de imagem relacionadas ao sinal de imagem de entrada, e aparelho para processar um sinal de imagem de entrada a ser exibido com base nas informações de definição de imagem relacionadas ao sinal de imagem de entrada
EP2702766B1 (en) 2011-04-28 2017-06-14 Koninklijke Philips N.V. Apparatuses and methods for hdr image encoding and decoding
JP6262198B2 (ja) 2012-03-26 2018-01-17 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Hdr画像符号化及び復号のための輝度領域ベース装置及び方法
US9516351B2 (en) * 2012-07-13 2016-12-06 Koninklijke Philips N.V. HDR image encoding and decoding methods and devices

Also Published As

Publication number Publication date
RU2015104783A (ru) 2016-08-27
US10027965B2 (en) 2018-07-17
EP2873237B1 (en) 2022-03-30
US20150201222A1 (en) 2015-07-16
ZA201501010B (en) 2017-08-30
JP2015531183A (ja) 2015-10-29
CN104471939A (zh) 2015-03-25
CN104471939B (zh) 2018-04-24
EP2873237A1 (en) 2015-05-20
US20170127069A1 (en) 2017-05-04
RU2652465C2 (ru) 2018-04-26
US9516351B2 (en) 2016-12-06
WO2014009844A1 (en) 2014-01-16

Similar Documents

Publication Publication Date Title
JP6382805B2 (ja) 改良されたhdr画像符号化及び復号方法並びに装置
JP6596125B2 (ja) Hdrイメージの符号化のためのコードマッピング関数を作成するための方法及び装置、並びに、かかる符号化イメージの使用のための方法及び装置
JP6615251B2 (ja) Hdr画像をエンコードするための方法及び装置、並びに、斯様なエンコードされた画像の使用のための方法及び装置
JP6700322B2 (ja) 改善されたhdrイメージ符号化及び復号化方法、装置
US10057600B2 (en) Brightness region-based apparatuses and methods for HDR image encoding and decoding
US9451274B2 (en) Apparatuses and methods for HDR image encoding and decoding
KR20180119684A (ko) Hdr 비디오의 인코딩 및 디코딩

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160629

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180802

R150 Certificate of patent or registration of utility model

Ref document number: 6382805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250