JP2022058724A - Hdr画像をエンコードする方法及び装置 - Google Patents

Hdr画像をエンコードする方法及び装置 Download PDF

Info

Publication number
JP2022058724A
JP2022058724A JP2022008351A JP2022008351A JP2022058724A JP 2022058724 A JP2022058724 A JP 2022058724A JP 2022008351 A JP2022008351 A JP 2022008351A JP 2022008351 A JP2022008351 A JP 2022008351A JP 2022058724 A JP2022058724 A JP 2022058724A
Authority
JP
Japan
Prior art keywords
dynamic range
brightness
high dynamic
video
range video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022008351A
Other languages
English (en)
Other versions
JP7343629B2 (ja
Inventor
マーク ジョゼフ ウィレム マルテンス
Jozef Willem Mertens Mark
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2022058724A publication Critical patent/JP2022058724A/ja
Priority to JP2023141256A priority Critical patent/JP2023162375A/ja
Application granted granted Critical
Publication of JP7343629B2 publication Critical patent/JP7343629B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

【課題】高ダイナミックレンジ(HDR)画像をエンコードする方法及び装置を提供する。【解決手段】グレーディング装置303において、HDRビデオのビデオ伝送を可能にし、該ビデオを種々のダイナミックレンジ又はピーク輝度能力のディスプレイでレンダリングするために、第1最大輝度より低い輝度を伴うピクセルカラーを有する入力HDRビデオ画像セットを、HDR画像である符号化HDRビデオに符号化するエンコーダ301は、符号化定義がピクセル色輝度を第1最大輝度の50%以下である第2最大輝度まで符号化し、コンテンツ作成者に、より低い第2最大輝度の符号化HDRビデオを、HDRビデオのHDRビデオ再生にカラーマッピングするトーンマッピング関数を指定させる再グレーディングユニット320と、ビデオ信号に符号化HDRビデオ及びメタデータとしてトーンマッピング関数を書き込むフォーマッタ330と、を有する。【選択図】図3

Description

本発明は、1つの(即ち、静止の)好ましくはそれ以上の(即ち、ビデオの)高ダイナミックレンジ画像のエンコード、必要な符号化画像情報を受信側に伝送する技術的システム及び方法、及び符号化画像を復号し、最終的に表示可能にするデコーダに関する。
今や低ダイナミックレンジ(LDR)符号化と称する古典的画像/ビデオ符号化技術(NTSCで始まり、MPEG2からMPEG-HEVCで継続している)を多年にわたり使用した後、近年、所謂高ダイナミックレンジ(HDR)シーンのHDR画像を処理することができる次世代のビデオコーデックを決定するための研究及び開発が開始されている。
このことは、一方で、少なくとも11絞り(例えば、ARRIの現在のカメラは約14絞りを得ている)を超える、又は好ましくは16絞りをも超える増加されたダイナミックレンジを捕捉するカメラを必要とする。幾つかのカメラは例えば低速及び高速露光を用い、これらを混合し、他のカメラは異なる感度の2以上のセンサに向けたビーム分割を用いる。
古典的撮像においては、例えば部屋又は自動車の外側等の、多くの情報が破棄される(ハード的にクリップされる)が、現在の撮像システムは斯様な全ての情報をキャプチャすることができ、問題はその場合に該情報を、特に該情報をディスプレイ上にレンダリングする場合に、どう処理するかである。多くの(全てではなくても)HDRシーンをキャプチャするには16絞りで既に十分であろうが、ディスプレイ上では、例えば溶接アークを平均輝度と比較して実際のシーンにおけるように明るくレンダリングすることは必ずしも必要とせず、典型的なディスプレイ上ではそのようにすることもできない。LDRディスプレイの現在典型的な500ニット(又は、グレーディングのためには100ニットの基準モニタ)のピーク輝度(PB)よりも高いピーク輝度を持つ一層高いダイナミックレンジのディスプレイが目下出現しており、例えば800~1000ニットのテレビジョンが出現している一方、SIM2は5000ニットのモニタを作製している。
しかしながら、LDRコーデック仕様は、特に、なかでも種々のICにより処理されねばならない例えば輝度を表すコードワード(ルマと称されるコード等)のビット数でのワード長(少なくとも幾つかのビデオ通信アプリケーションでは、カラー成分当たり例えば10ビットが望まれ得る)等の現在の典型的な制限を考慮に入れる必要もある場合に、受信機に対してHDR画像における細部を十分にエンコードすることができない。特に、短期間で実用的システムを欲する場合、当該分野における既存のテクノロジから大幅に逸脱してはならず、それでいて、LDR画像より大幅に綺麗なHDRの見え方(例えば、一層明るいランプ、リアルな火又は日向でのトカゲのコントラストの強い鱗等)で画像のエンコード、処理及び最終的表示を可能にしなければならない。
HDR画像とは、HDRシーン(非常に明るい及び暗い領域の両方、並びに恐らくは中間の明るさの領域さえも、理想的には正確にレンダリングされることを要する非常に多数のグレイ値も伴って典型的に同時に含み得る)のテクスチャを、該HDRシーンの視覚的に良質なレンダリングを例えば5000ニット等の高ピーク輝度を持つ高品質HDRディスプレイ上で実施することができるという意味で、該シーン内の種々のキャプチャされたオブジェクトのカラーテクスチャの高品質なエンコードのための十分な情報で以ってエンコードする画像である。図1は、例えば平均的照明と比較して強く照明された明るい有色の玩具又は箱が備わった(これら玩具の幾つかは局所ランプに近く、それでいて、他の玩具は遠く離れて陰領域にあるため)夜の玩具店等の典型的なHDR画像を示している。太陽及び空が各点を同様に照明する昼のシーンとは対照的に、夜間は、当該シーンを二次的に減衰する態様で照らす僅かな光源しか存在しない可能性がある。このことは、光源自身の周囲に明るい領域104を、遠く離れた角には暗い領域を形成する。例えば、下水道入口114は殆ど何処からの光も受けず、従って下水道は非常に暗い。即ち、夜のシーンでは、ランプ自体に関する10,000ニットを超える及び暗い領域に関する例えば0.001ニット等のニットの極僅かな割合の画像領域輝度(又は、リニアなカメラでキャプチャされた場合、これら領域におけるピクセル輝度)を同時に有し得、全体のダイナミックレンジを千万対1にさせる。これは、最明対最暗ピクセルに対する理論的範囲であり、見る者に対して2~3の小さなランプ又は下水道入口の背後の小さな暗い斑点は正確に表現する必要はないので有用なダイナミックレンジは勿論もっと小さくすることができるが、典型的なHDRシーンでは重要な通常のオブジェクトの有用なダイナミックレンジは10,000:1(又は14絞り)を優に超えるものでさえあり得る。これらの輝度を2000ニットのピーク輝度のディスプレイに対してレンダリングされるべきオブジェクトピーク輝度の賢い最決定を行わずに闇雲にマッピングすることは、“理論的に”少なくとも0.2ニットの最小(可視)黒色を有すべきことを意味する(この例示的シーンの良好な視覚的品質のレンダリングに関して、対ピーク白色レンダリングが十分であると仮定する)。
HDRビデオ(又は静止画像さえもの)符号化は極最近になって研究され、今までは手強い課題であったが、研究団体の典型的な確信は、シーンオブジェクトのLDR範囲を超える輝度をエンコードする(例えば、シーン輝度を独立にエンコードする符号化)ために大幅に多いビットに向かう必要があるか、又は例えばオブジェクト反射画像に加えて照明ブースト画像が存在するような何らかの2層方法若しくは同様の分解方法が必要であるということである。このような瞬時当たり2画像HDRビデオエンコードシステムの一例は、米国特許第8248486号又は国際特許出願公開第WO2005/1040035に見ることができる。
出願人は、最近、HDR及びLDRの両方の外見画像をエンコードするパラメータ的、機能的態様である非常に簡単な瞬時当たり単一画像法を提案したが、これは、例えば1500ニット等の事前に選択された基準値の周辺にピーク輝度(又は、実際にダイナミックレンジ)を備えるディスプレイに典型的に適した単一のHDR画像(外見(見え方)又はグレーディングとも称する)を単にエンコードすることに加え、枠組み内で、市場における他のダイナミックレンジを持つ他のディスプレイの要求にも応じたいからである。即ち、例えば500又は100ニットの携帯ディスプレイも存在するので、符号化された高ダイナミックレンジ画像を自動変換により何らかの適度に見えるLDR画像に如何に変更するかを盲目的に受信側に任せるよりは、カラー処理機能(及び機能的形状を特徴付けるパラメータ)に、該符号化HDR画像から始まる適切なLDR画像(例えば、コンテンツ創作者が同意し得るLDR画像)に如何に到達するかを同時エンコードする。
“高ダイナミックレンジ(HDR)”によれば、1)キャプチャ側からキャプチャされた画像(又は複数の画像)が旧来のLDR符号化と比較して高い輝度コントラスト比(即ち、10,000:1又はそれ以上のコントラストを当該符号化及びレンダリングまでの画像処理チェーンの全ての構成要素により達成可能である)を有し;及び2)少なくとも1000ニットを超えるキャプチャされたオブジェクトの輝度が符号化可能であるべきであるか、より詳細には、再生環境が与えられたとして、例えば灯ったライト又は日の当たる外部等の何らかの所望の見え方を発生するために1000ニットを超えて再生可能でなければならないことを典型的に意味する。又は、このような画像(又は複数の画像)のレンダリングがHDRである(即ち、これら画像が、高品質のHDRレンダリングのために十分な情報を、好ましくは技術的に使用するのが容易な態様で含むという点で適切でなければならない)とは、該画像(又は複数の画像)が少なくとも1000ニットのピーク輝度を持つディスプレイ上でレンダリングされる若しくはレンダリングされることを目的とすることを意味する(これら画像が、結果的なオブジェクトの輝度が異なるディスプレイのダイナミックレンジ及び恐らくは視聴環境に一層適するように、典型的には種々の画像オブジェクトの輝度を適切なカラーマッピングについて再決定した後に、例えば100ニットのピーク輝度のLDRディスプレイ上でレンダリングすることができないということを意味するものではない)。
新たなHDRコーティングシステムを設計する際には、良い一様な見方が存在しなかった何らかの実用的コーティングシステムの詳細を書き込むことができるまで、多数の事項について続けて研究すると共に解決策に至らなければならない。第1に、シーンオブジェクト輝度を、当該ピクセルに関してレンダリングされるべきものを実際にエンコードする例えば10ビット(又は一層低い品質のシステムのための8ビット、若しくは例えばプロ用品質のための12ビット)のルマにマッピングするどの様なコード割当関数を使用すべきかである。ピクセルの知覚可能な明るさ又はレンダリングされる輝度をエンコードする当該コードはルマ(luma)と呼ぶ(これはLDRの符号化にも付与されている名称であるからである)一方、上記コード割当関数は、この場合、少なくともLDRビデオ符号化のガンマ2.2コード割当関数とは大幅に相違するが、可能性のある代替関数の1つとすることができる。当業者であれば、輝度又は等価的にルマの挙動に関する技術を説明する場合、実際の実施態様では、Y’が事前に定められたコード割当関数により決定されるルマであり、u’及びv’が色度座標であるY’u’v’カラー表現を使用する場合のようにルマ自体に対して、又は等価的に線形若しくは非線形RGB表現に対して処理を実行することができると理解するであろう。コード割当関数の選択は、HDR画像のルマコード又はルマを基準ディスプレイ上でレンダリングされる輝度に変換する理論的な基準ディスプレイモデルがどの様なものであるかを定めるマスタEOTF(電気光学伝達関数)を定義するものとして等価的に定めることができる。LDR変種は、CRT電子銃の物理的挙動から2.2べき法則又は所謂ガンマ関数にむしろ偶然に決定された。該LDR変種は、約100ニットのピーク輝度を持つ種類のディスプレイ上で、とりわけシーンの合理的に均一な照明、正しい露出及び余り重要でない画像領域の省略による対応するLDRキャプチャ理念に従ってキャプチャされた画像に対して偶然に心理視覚的に良好に動作した。
しかしながら、第2に、輝度をコードにコード範囲(例えば、0~1013)に沿って分配するコード割当関数を定義することができる前に、典型的なHDRをエンコードするための最良の範囲であるマスタ輝度範囲と呼ぶことができるものを定義しなければならない。このステップは見落とされてはならない。LDRにおいては、中間のグレイ及び白に対して露光することにより、並びにセンサがどの様なダイナミックレンジを有していたかにより(そして、恐らくはセルロイドフィルムの穏やかな傾斜が相当にコントラストの低い画像を生じ得る一方、デジタルカメラ画像が当該符号化の白側でのクリッピング及び/又は黒側でのノイズへの没入を有し得ることを無視することにより)或る範囲を偶然に有する。静止画について研究していた初期の研究者は、単にマスタ輝度範囲をシーンにおける典型的な輝度の線形範囲(即ち、ニットの非常に小さな部分から何十億のニットまで)にすることが道理にかなっていると考えたが、全ての実際的な側面が考慮に入れられたビデオ符号化の場合、このマスタ輝度範囲を日光の十億ものニットまで到達させることは実用的に余り意味が無い。
しかしながら、全ての典型的HDR画像(表示(高品質HDR表示であっても)に適し得るオブジェクト輝度への適切な芸術的グレーディングの後に典型的な)を処理するための新たなマスタ輝度範囲を定義することが必要であると理解しても、予測は、全てのシナリオに対して十分である単一の十分に大きなHDRマスタ輝度範囲を定義するだけでよいというものであった。シーンのHDR外見(見え方)を望むアプリケーションは、この場合、このマスタ輝度範囲(例えば、10000又は5000ニットである最大輝度までの輝度を伴う)に沿ってエンコードされた受信画像に対して動作することになる。
国際特許出願公開第WO2014/009844号は、出願人の瞬時当たり単一画像符号化方式に従うという点で後述の実施態様に類似する斯様なマスタ輝度範囲型HDRビデオ符号化システムの一例を記載しており、これによれば、この教示においては第1LDR(即ち、100ニット)外見である唯一の画像が当該ビデオの各瞬時に対してエンコードされると共に、これに加えて、HDR外見(5000ニットのマスタグレーディング再生であり得る)に変換するためのカラー処理関数が上記唯一画像に関連付けられたメタデータにエンコードされる。しかしながら、この特許出願における教示内容は単一固定マスタ輝度範囲技術設計法の原理に従うものである。典型的に単一のLDR及びHDR外見のみがエンコードされる(この情報からは、受信側において計算される他の中間の外見が存在し得る(例えば、LDR画像は1200ニットの接続されたディスプレイに必要とされる外見にアップグレードすることができる)が、自身をエンコードする他の中間の一層低いHDR品質の画像は教示されていない(即ち、100ニットのLDR画像のみが送信される))。そして、このHDR外見は5000ニットのマスタ輝度範囲で形成されるマスタ外見であり、LDR画像はLDR時代にあったような100ニットの基準ディスプレイのための画像であり、HDR画像は上記の唯一の伝送されるLDR画像から機能的変換を介して実際にエンコードされる。即ち、旧来のディスプレイとの互換性等にとり典型的に必要とされるLDR外見に加えて、マスタHDR、例えば5000ニットの画像(HDR_ORIG,HDR_FIN)が教示されているに過ぎない。
出願人の米国特許出願公開第2014/097113号も、受信される唯一のHDR画像であり得るHDR画像をどの様に伝送することができるかを教示しており、該画像からは他のグレーディングを計算することができるが、その態様に関して該文献は言及していない。この従来技術が教示するものは、幾つかのダイナミックレンジの外見を、同じ既存のLDR符号化コンテナ技術に代替的にエンコードすることができるということである。この場合、受信機が混乱しないように、どのバージョンが使用されたかを示さなければならない。例えば、画像ピクセルは標準のLDR符号化定義による(即ち、Rec.709コード割当関数を用いた)3つの16ビットR、G及びBカラー成分により定義されたカラーを有する。この場合、受信機は、これが100ニットディスプレイのためのグレーディングであることを知り、従って、該ディスプレイが2500ニットのピーク輝度を有し、そのように明るく画像をレンダリングすることができるとしても、当該画像を100ニットに正確に又は大凡等しい最大輝度で表示するであろう。代わりに、同じR、G及びBカラー成分は、例えば5000ニットのHDR画像のカラーを含み得、このことは、オブジェクトピクセルカラーの相対値が異なる(例えば、暗いオブジェクトはLDRでは0.05であるがHDRでは0.0005の赤成分を有し得る)ことを意味する。受信されたLDRコンテナ符号化画像がHDR画像を実際に格納している場合、その事実は受信機に対して当該符号化が実際に何であるかを記述するメタデータにより示される。従って、受信機は自身の最適化処理により特定のディスプレイ上にどの様に最適にレンダリングすべきかを知ることができる。例えば、5000ニットの画像が受信され、4500ニットのディスプレイが接続されている場合、該画像は事前の測色変換なしで直接レンダリングすることができる。しかしながら、100ニットのディスプレイが接続されている場合、斯様な受信5000ニット画像は先ず格下げ処理されねばならないが、既に適切な100ニット画像が受信されていたなら該格下げ処理は必要とされない。従って、該従来技術において教示されることは、受信機は自身の側で例えば1000ニットの受信HDR画像を例えば500ニットディスプレイにとり一層適したものにさせるための何らかのカラー変換を実施することを要し得るということであるが、この教示では、それがどの様になされるべきかについては教示されておらず、ましてや、それが送信側から一層多くの情報を通知することにより容易化されるべきか又はどの様に容易化されるべきか教示されていない。即ち、種々の可能性のあるHDR及びLDRグレーディングをどの様にエンコード及び指定するかを教示することは別として、この文献は、送信機側に少なくとも2つのHDR符号化を実際に有するシステム構成についても、受信側における斯かる符号化の復元可能性についても教示していない(この従来技術においては、出願人のマスタ5000ニットグレーディングと同等と見なすことができる1つのみのHDR画像しか存在しない)。
汎用HDR符号化システムを策定する場合に単一マスタ輝度範囲上での最終的HDR画像符号化から逸脱することは一見したところ非論理的に見えるが(とりわけ、最高の合理的にレンダリング可能なオブジェクト輝度であるものに到達するまでのHDRシーンの該最良の可能なグレーディング以外の何かを何故必要とするか、又はHDRを定義するための一層多くの方法を有することにより何故物事を複雑にさせるのか等)、発明者は、ある種のアプリケーションに対しては、ルマコードの定義及びどのHDR輝度(もっと正確には1以上のディスプレイ上でレンダリングされるべき輝度)に当該ルマが対応するかに関しての更に一層の汎用性に対する必要性が存在すると感じた。
本発明の目的は、より将来性のある一層汎用的HDRビデオ符号化技術を提供することである。
より将来性のある一層汎用的HDRビデオ符号化技術を有するという上記目的は、第1最大輝度(L_MAX_M)以下の輝度を伴うピクセルカラーを持つ一群の画像(Im_5000)を有する入力高ダイナミックレンジビデオを、符号化高ダイナミックレンジビデオ(Im_2000)にエンコードするエンコーダ(301)であって、前記符号化高ダイナミックレンジビデオ(Im_2000)における如何なるピクセルの輝度も少なくとも900ニットである第2最大輝度(L_MAX_C)以下であり、前記第1最大輝度(L_MAX_M)が前記第2最大輝度(L_MAX_C)の少なくとも2倍であることを特徴とするエンコーダにより実現され、当該エンコーダは、
- コンテンツ作成者に、低い方の第2最大輝度(L_MAX_C)の前記符号化高ダイナミックレンジビデオ(Im_2000)を前記高ダイナミックレンジビデオ(Im_5000)の高ダイナミックレンジビデオ再生(Im_5000*)にカラーマッピングするための少なくとも1つのトーンマッピング関数(F_2Tu)を指定することを可能にするように構成された再グレーディングユニット(320)と、
- ビデオ信号(S_im)に、前記符号化高ダイナミックレンジビデオ(Im_2000)及び、メタデータとして、前記少なくとも1つのトーンマッピング関数(F_2Tu,601)を書き込むように構成されたフォーマッタと、
を有する。
このことは、グレーダが例えば5000ニットのマスタグレーディングを、技術的理由により利用可能な別の2000ニットの基準範囲/色域上で利用可能な空間にマッピングするために非常に正確に必要とされるカラーマッピング仕様(F_2Tu)を指定することを可能にするので、如何なる従来技術の教示又は自明な論理が示すものとは反して、実際に2つのHDRグレーディングが存在する。グレーダが任意に作成することができるものと、該グレーダが少なくとも1つの受信機への伝達のために最適化することを要するものである。第1のマスタグレーディングの輝度は、例えば5000ニットにまで達する。実際に伝達されるHDR符号化のピクセルの輝度は、潜在的に一層低い最大値(L_MAX_C)まで達し、見た目では、これを一層低い品質のHDRグレーディングにさせる。これらの最大値はグレーディングされた画像に関連付けられ、例えば、典型的には、エンコードされた高ダイナミックレンジの画像ピクセルのカラーデータは、これが2000ニットなる可能性のある最大値(例えば、CODE_MAX=2000)までの輝度を持つグレーディングであることを示すメタデータ指示子により補足される。典型的に、実用的なコード割当関数も存在し、その機能的形態も他のメタデータで受信機に伝達することができる。グレーダは符号化の品質をバランスさせることもでき、これは、とりわけ、5000ニットのディスプレイはマスタグレーディングの近似Im_5000*を必要とするが、これに加えて、受信機が約2000ニットのピーク輝度のディスプレイ上にレンダリングするためIm_2000の外見(見え方)も必要とする場合に関係する。グレーダが何を選択しても、当該再グレーディングユニットのツールセットの可逆性の制約が、相応の再生(再構築)Im_5000*を保証する。即ち、受信された2000ニット画像から5000ニット画像へアップグレードするカラーマッピング関数の正確な計算を指定するデータとして典型的に同時に伝送されるであろうものは、所与のアプリケーションにとり前記5000ニット画像に十分に近い5000ニット画像を生じさせる(即ち、典型的に当該関数は工場においてアプリケーションに対し、例えば縞模様(banding)又はノイズがどの様な場合においても妥当なものとなるように設計され、本発明の場合、これは、グレーダが調整することができる(即ち、グレーダが上記機能のうちの少なくとも1つを選択すると共に、次いで例えばスライダにより線形セグメントの傾斜等のパラメータを指定する)少なくとも1つのトーンマッピング関数を有する一群のカラー変換関数であり、如何なる受信機も、該関数を受信したら、必要とされるIm_5000*を簡単に計算することができる)。更なる実施態様は、グレーダがこれに気付かされ当該微調整に関わらされているか、自身の最良のIm_2000を自身の芸術的判断のみに基づいて作成することだけに集中しているかによらず、2000ニット及び5000ニットのグレーディング/外見を同じ単一の符号化画像に同時にエンコードすることの最適なバランスを達成するために該グレーダを更に補助するための入念な技術的計算を使用することができる。
エンコーダ301の種々の実施態様は、第2最大輝度(L_MAX_C)に対して、意図するアプリケーション(例えば、インターネットからの無料ビデオは、より低い品質要件を有し得る)にとり有用な事前に協定された値を使用することができる。L_MAX_Cに対する値は、典型的には900ニットと3500ニットとの間に入ることができ、好ましくは、例えば1000又は2000ニットである。これらは、なかでも、近い将来において市場に最も高い頻度で配備されるディスプレイの平均的に想定されるピーク輝度との合致故に、MPEG_HEVC/265等のMPEG技術を再利用する実用的なビデオ符号化に適した最大輝度と見られる。
一実施態様として有利なものは、前記再グレーディングユニットが、任意形状の単調増加トーンマッピング関数及び輝度依存性彩度乗算(増倍)関数を適用するカラーマッピング仕様であって、これらの関数が対応する輝度及び彩度の変更を、前記高ダイナミックレンジビデオ再生(Im_5000*)の出力画像におけるピクセルカラーに対して前記符号化高ダイナミックレンジビデオ(Im_2000)の入力画像におけるのと同一の色相(hue)を保ちながら適用するカラー処理に使用されるべきものであるカラーマッピング仕様を有する前記マッピング関数(F_2Tu)の仕様を可能にするよう構成された、入力高ダイナミックレンジビデオをエンコードするエンコーダである。これは、前記技術システムに準拠したカラーマッピングの一番簡単であるが汎用的な態様であると共に、エンコーダ又はデコーダIC構造の点で簡単であると見ることができる。色相を一定に保つ処理を用いることには意味があり、次いで、ピクセルの輝度及び彩度を最適に変換することにより、新たなレンダリング状況、特に最適に再グレーディングされた画像が供給される接続されたディスプレイのピーク輝度に対して所望の再グレーディングされた外見を得ることができる(等価的に、輝度処理をルマ処理として指定することもできるが、これは本発明及びその実施態様の主たる思想のために熟考されるべき細部ではない)。熟練した読者は、シーン及びそのHDR効果の意味論的複雑さ故に、グレーダは低い品質(2000ニット)のHDRグレーディングと高い品質のもの(マスタの5000ニットのグレーディング)との間の複雑なマッピングを設計することを欲し得るが、典型的に、これらの関数的形状は、明暗反転は望まないので、単調に増加するものである。また、有利なものは、請求項の1つに記載される入力高ダイナミックレンジビデオをエンコードするエンコーダ301であって、前記符号化高ダイナミックレンジビデオ(Im_2000)を前記第1最大輝度(L_MAX_M)及び前記第2最大輝度(L_MAX_C)とは異なるピーク輝度(PL_1,PL_2)を持つディスプレイ上でレンダリングするために最適化された第3ビデオにどの様にカラーマッピングするかを指定するための少なくとも1つの他のカラーマッピング関数(F_2T1,F_d2d)を指定するように構成された他のグレーディングユニット325を有する。市場に出回った各等級のディスプレイに対して、グレーダは、この技術的メカニズムにより、最も適した外見をレンダリングされたディスプレイ出力として得るために必要とされるカラー処理を正確に指定することができる。又は、グレーダは2~3のグレーディング、例えば2000ニットのものIm_2000、5000ニットのものIm_5000*及びIm_100ニットのもののみを指定することができ、この情報から、当該ディスプレイに、ディスプレイのピーク輝度が2000ニットより高く又は低くなった場合にどの最終処理を適用すべきかを解明させるようにする。グレーダが、1つの他の基準状況に、より詳細には1つのLDRグレーディングにどの様に再グレーディングすべきかを少なくとも指定することができれば、有益である。何故なら、種々のHDRグレーディングの間で変換することは、HDRグレーディングとLDRグレーディングとの間でグレーディングすることとは、芸術的及び技術的の両方で非常に異なり得るからである。そこでは、グレーダは、種々のディスプレイのピーク輝度に対して望むだけ多くのカラーマッピングシナリオを対応する関数で指定することができるが、典型的には、労力及び予算に鑑みて、グレーダは当該符号化ビデオが応じなければならないディスプレイピーク輝度の範囲の両端に対して2~3の重要な主たる変換のみを指定し、受信機に特定のディスプレイに対する所要のグレーディングの最終的最適化を実施させることもできる(しかしながら、ここに記載する符号化技術は、少なくとも最小限の量の所要のカラーマッピング関数情報を指定することを可能にする)。
有利なものは、前記他のグレーディングユニットが、前記少なくとも1つの他のカラーマッピング関数が前記符号化高ダイナミックレンジビデオ(Im_2000)から100ニットのビデオを得るためのカラーマッピング関数であることを指定するように構成されたエンコーダの実施態様である。典型的に、ユーザは依然として幾つかの古い装置を有している(例えば、ユーザは自宅を介して自動車まで歩く間の幾らかの時間に自身の携帯電話にビデオを共有させたい場合がある)ので、デコーダが旧来のHDRストリームも発生することができれば有益であり、このことは、エンコーダがグレーダに斯様なLDRグレーディングがどの様に見えるべきかを、特に該LDRグレーディングがHDR外見にどの様に関係すべきか、即ち該LDRグレーディングが2000ニットの受信された画像から少なくとも変化する種々のオブジェクト輝度をカラー処理することによりどの様に導出されるべきかを指定することを可能にしなければならないことを意味する。また、他のピーク輝度のディスプレイのための他のグレーディングに調整するために、大幅に低いピーク輝度の1つの基準ディスプレイ(典型的には、旧来の100ニットLDRディスプレイ)に対する該カラーマッピング、即ち、その関数及びパラメータは、受信機が、如何なる所要のディスプレイピーク輝度グレーディングに対しても自身の最適化されたカラーマッピングを実行するために、斯様な関数をどの様に修正するかを決定するための非常に有用な情報を含むが、如何なる受信機も斯かるマッピング関数を再計算することを望むものである。
また、有用なものは、コンテンツ作成者が、前記符号化高ダイナミックレンジビデオ(Im_2000)又は他のカラーマッピング(F_2d2)を適用することにより該ビデオから導出された何れかのビデオが該コンテンツ作成者によれば十分な視覚的品質のものであるピーク輝度範囲内のディスプレイを識別するディスプレイピーク輝度の少なくとも1つの限界(LH_100,LL_100)を指定することを可能にするように構成された限界指定ユニット389を有するエンコーダ301の実施態様である。この構成は、どの範囲のディスプレイに対して当該関数的再マッピング定義が一番適する/最適であるかを特定することを可能にし、例示的な正確な実施化は後述される。
また、有利なものは、第1最大輝度(L_MAX_M)以下の輝度を伴うピクセルカラーを持つ一群の画像(Im_5000)を有する入力高ダイナミックレンジビデオを、符号化高ダイナミックレンジビデオ(Im_2000)としてエンコードする方法であって、前記符号化高ダイナミックレンジビデオ(Im_2000)における如何なるピクセルの輝度も少なくとも900ニットである第2最大輝度(L_MAX_C)以下であり、前記第1最大輝度(L_MAX_M)は前記第2最大輝度(L_MAX_C)の少なくとも2倍であり、
- 低い方の第2最大輝度(L_MAX_C)の前記符号化高ダイナミックレンジビデオ(Im_2000)を前記高ダイナミックレンジビデオ(Im_5000)の高ダイナミックレンジビデオ再生(Im_5000*)にカラーマッピングするための少なくとも1つのトーンマッピング関数(F_2Tu)を有するカラーマッピングを指定するステップと、
- ビデオ信号(S_im)に、前記符号化高ダイナミックレンジビデオ(Im_2000)のピクセルカラーデータ及び、メタデータとして、前記少なくとも1つのトーンマッピング関数(F_2Tu,601)を書き込むステップと、
を有する方法である。
受信側には、前記種々のエンコーダ実施態様を鏡映させると、第1最大輝度(L_MAX_M)までの値の輝度を持つピクセルを備えた一群の画像(Im_5000)を有する高ダイナミックレンジビデオを復号するためのビデオデコーダ401が存在し得、前記高ダイナミックレンジビデオは符号化高ダイナミックレンジビデオ(Im_2000)としてエンコードされ、前記符号化高ダイナミックレンジビデオ(Im_2000)における如何なるピクセルの輝度も少なくとも900ニットである第2最大輝度(L_MAX_C)以下であり、前記第1最大輝度(L_MAX_M)は前記第2最大輝度(L_MAX_C)の少なくとも2倍であり、当該デコーダは、
- ビデオ信号(S_im)から圧縮画像データを読み出すと共に該データを伸張して前記符号化高ダイナミックレンジビデオ(Im_2000)を得るように構成されたビデオ伸張器403と、
- 前記ビデオ信号(S_im)から少なくとも1つのカラーマッピング仕様(F_2Tu)を抽出するように構成されたメタデータ読出ユニット477と、
- 前記カラーマッピング仕様を前記符号化高ダイナミックレンジビデオ(Im_2000)に適用して、前記第2最大輝度(L_MAX_C)より少なくとも2倍高い第3最大輝度を持つ再生高ダイナミックレンジビデオ(Im_5000*)を得るように構成されたカラー処理ユニット410と、
を有する。
従って、このビデオデコーダは、カラーグレーダのコンピュータ内では(非常に異なってグレーディングされた画像又は一群の画像を受信しても)一層小さな輝度範囲(Im_2000)のものであったオリジナルのIm_5000を大凡再構築することができる。当該分野における種々のアプリケーションは、マスタグレーディングの最大輝度と、符号化のものとの比について大体が意欲的であり得るが、典型的にはマスタグレーディングは少なくとも符号化のもの(L_MAX_C)の2倍である最大値を有さなければならないと言うことができるものの、10倍大きい又はそれ以上とすることもできる(典型的に、2つのHDRグレーディングの間のマッピングの関数及び/又はパラメータは幾らか異なり得るが、同じ技術的枠組みは適用可能なままである)。典型的に、どのL_MAX_Cをグレーダが使用するかは送信側で選択可能であり、グレーダは、確かに、自身のマスタグレーディングを符号化高ダイナミックレンジビデオ内に忠実にエンコードされ得るように作成する(又は、逆に、自身のマスタグレーディングを特定の最大値で作成した後、グレーダは受信機に通知するための一群のコーデックから、どれが十分な精度で斯かるマスタグレーディングを処理することができるかを選択することができる)。一旦選択されると、エンコーダは全てをメタデータにエンコードし、従って、如何なる受信機も、どのピクセルカラーを得ているかを、特にどのカラーマッピングにより受信されたIm_2000画像からIm_5000*画像を再生すべきかを正確に知ることができる。
有利なものは、前記第3最大輝度が前記第1最大輝度(L_MAX_M)に等しい、一群の画像の高ダイナミックレンジビデオを復号するためのビデオデコーダ401である。これは、例えば6000ニットのものではない、正確な輝度再生である。勿論、デコーダは、例えば中間の3000ニットグレーディングのように、マスタグレーディング以外のピーク輝度のグレーディングに再グレーディングすることもできる。グレーダは、これを、一群のカラーマッピング関数を正確に受信されたままで適用することにより実行するか、又は受信された全カラーマッピング関数の少なくとも幾つかから最終組のカラーマッピング関数を導出することができる(例えば、2つのHDRグレーディングの間で再グレーディングする場合、受信機は、グレーダが選択した2つのHDRグレーディングの間で再グレーディングすべきであることを、該グレーダがどの様に指定したかをチェックすべきである)。
有用なものは、また、論理プロセッサ405を有する一群の画像の高ダイナミックレンジビデオを復号するためのビデオデコーダであり、該論理プロセッサは、どのピーク輝度を持つどの少なくとも1つのディスプレイ452が接続され、且つ、ビデオが供給されることを要しているかを決定すると共に、該少なくとも1つのディスプレイ452のピーク輝度に基づいて、該ディスプレイに伝送するための出力画像(Im_x00,Im_5000*)を得るために前記符号化高ダイナミックレンジビデオ(Im_2000)に対しどのカラー処理(F_2Tu,F_d2d)が適用されるべきかを決定するように構成される。
この論理プロセッサは、受信機が、非常に広い範囲の可能性として接続されるディスプレイの要求を満たすために駆動画像を最適化することを可能にする。該プロセッサは、常にIm_2000で定義されたオブジェクトピクセルカラーテクスチャ情報から開始して、適用する適切な関数を読み出し、決定する。
該ビデオデコーダ401の実施態様は、有線ビデオ伝送コネクタ432又は無線ビデオ伝送コネクタ433に接続することができると共に、少なくとも出力画像(Im_x00,Im_5000*)を、有線ビデオ伝送コネクタ432又は無線ビデオ伝送コネクタ433を経るビデオ伝送に使用可能なビデオ伝送プロトコルのために必要とされるものに従ってフォーマットするように構成された伝送フォーマッタ415を有する。従って、例えばWi-Fi規格が特定の態様での(例えば、1500ニット等の基準範囲/色域の更に他の最大輝度による)HDR画像伝送を必要とする場合、当該フォーマッタは該フォーマットに従って再エンコードすることができる。重要なことは、オリジナルの画像情報(Im_5000)及び作成者が有した芸術的カラー情景、即ちIm_2000にエンコードされたもの及びその処理方法、即ち少なくともF_2Tuは、受信側で決定することができると共に、次いで固有のローカルなレンダリング状況に要するものに最適に変換することができることである。
該ビデオデコーダ401の実施態様は、前記論理プロセッサが、更に、前記ビデオ信号(S_im)からディスプレイピーク輝度の少なくとも1つの限界(LH_100,LL_100)を読み出すと共に、該ディスプレイピーク輝度の少なくとも1つの限界(LH_100,LL_100)に基づいてどのカラー処理(F_2Tu,F_d2d)が適用されるべきかを決定するように構成されることを特徴とすることができる。このようにして、該デコーダは、画像を供給する必要があるディスプレイが、当該ビデオ信号S_imと同時供給された例えば第3組のカラーマッピング関数を適用することにより例えば再グレーディングされた画像を作成することによってサービスすることができる特定の範囲に入るか(熟練した当業者は、受信機が全ての情報を時間内に有する場合、如何なるメカニズムも斯様な同時供給と同等と見なすことができると理解するものであることに注意されたい)、又は例えば受信されたIm_2000画像から計算することにより当該ディスプレイに伝達されるべき所要の再グレーディングされた画像を導出するために自身の最適なカラーマッピング関数を計算する必要があるか、を即座に確認することができる。
有利なものは、また、第1最大輝度(L_MAX_M)まで復号可能な輝度を持つピクセルを備えた一群の画像の高ダイナミックレンジビデオをビデオ復号する方法であって、前記高ダイナミックレンジビデオは符号化高ダイナミックレンジビデオ(Im_2000)としてエンコードされ、前記符号化高ダイナミックレンジビデオ(Im_2000)における如何なるピクセルの輝度も少なくとも900ニットである第2最大輝度(L_MAX_C)以下であり、前記第1最大輝度(L_MAX_M)は前記第2最大輝度(L_MAX_C)の少なくとも2倍であり、
- 前記符号化高ダイナミックレンジビデオ(Im_2000)を、ビデオ信号(S_im)から読み出すと共に伸張するステップと、
- 前記ビデオ信号(S_im)から少なくとも1つのカラーマッピング仕様(F_2Tu)を抽出するステップと、
- 前記カラーマッピング仕様を前記符号化高ダイナミックレンジビデオ(Im_2000)に適用して、前記第2最大輝度(L_MAX_C)より少なくとも2倍高い第3最大輝度を持つ再生高ダイナミックレンジビデオ(Im_5000*)を得るステップと、
を有する方法である。
本発明による方法及び装置の上記及び他の態様は、後述する実施化構成及び実施態様並びに添付図面から明らかとなり、これらを参照して解説されるであろう。これら実施化構成及び実施態様並びに添付図面は、より一般的な概念を例示する限定するものでない特定の解説としてのみ役立つものである。
図1は、グレーダがどの様にして如何なるHDRシーンも、例えば0ニットから5000ニットまでの大きな輝度基準範囲を持つ高品質マスタ符号化に変換することができるかを概略的に示す。 図2は、基準輝度範囲GRAD_MSTR上で指定された該マスタグレーディングを、大幅に小さい最大輝度を持つ(それでも、撮像されたシーンのHDR側面の全て又は殆どを依然として捕捉している)受信側に伝達されるべきHDR符号化に如何にして再定義することができるかを概略的に示し、上記コードの最大輝度M_COD_REFは典型的にはオリジナル範囲(5000)の80%以下、例えば2000ニットであり、時には少なくとも2倍小さい。 図3は、伝達される2000ニットグレーディングから5000ニットグレーディングを再現するためのカラー処理関数と共に、特には例えば2000ニットグレーディング及び該グレーディングと一緒にパラメータ関数態様で技術的にエンコードされる5000ニットグレーディング等の創作者が必要とするものをグレーダが指定することを可能にする後述の新規な教示内容によるエンコーダ実施態様を備えた可能性のある創作側符号化技術を概略的に示す。 図4は、少なくともディスプレイのピーク輝度及び視聴環境、視聴者の好み等の他の要因に基づいて各接続ディスプレイに対して最適にグレーディングされたビデオを用いることを可能にする可能な受信側復号及びHDR画像使用システムを概略的に示す。 図5は、この例では開始画像として機能するエンコードされ受信される画像(Im_2000)の最大輝度より低いピーク輝度の2つのディスプレイに対する本カラーマッピング仕様(F_d2d)による可能なカラー再マッピングであって、これらディスプレイには各ディスプレイ(400又は100ニットのピーク輝度PBを持つ)のための当該ビデオ画像セットの適切にグレーディングされたディスプレイ駆動画像に到達するために上記カラーマッピングが適用されるようなカラー再マッピングを概略的に示すと共に、例えば教会内部又は暗い地下室等のシーンの場面の画像からの幾つかの選択されたカラーの相対的明化による例示的処理を示し、該図において図5aは輝度及び彩度の両方が重要なオブジェクトに関するHDRへの典型的なマッピングを示し、図5bは外れたカラーを処理するための可能な方法を示す。 図6は、2000ニットグレーディング(ビデオ信号S_imにエンコードされた)から最大輝度5000ニットでグレーディングされたビデオ、即ち創作者の側及び時点におけるマスタグレーディングの最大と外見的に実質的に等しいものに到達するための可能なカラー再マッピングを概略的に示す。 図7は、例えば約5000ニットのピーク輝度のディスプレイに供給するために又は該一層高い品質のビデオを後の使用のために記憶するために、2000ニットの参照ビデオから5000ニットの参照ビデオに到るための他のカラー再マッピング例を概略的に示す。 図8は、何らかのピーク輝度又はダイナミックレンジ能力のディスプレイ上で使用されるべき何らのオリジナル品質(即ち、例えば5000ニット又は15000ニット等の、GRAD_MSTRの何らかの最大輝度)のHDR画像を、大幅に低減されたダイナミックレンジ能力(即ち、例えば2000ニット又は1200ニット等の最大輝度L_MAX_Cであるが、勿論、エンコードされた画像が依然としてHDR符号化、即ち最小でも900ニットの関連する基準ディスプレイのピーク輝度を超えるものとなるのに十分に高い最大輝度の)のHDRコーデックにより伝送するためにエンコードされることにより、エンコードするために後述の技術をどの様に使用することができるかを概略的に示す。 図9は、より高いピーク輝度のHDRグレーディング及びLDRグレーディングの両方を、受信された2000ニットのグレーディングからどの様に導出することができるか、及び斯かる2つがどの様に技術的に基本的に異なる性質のものであり得るかを概略的に示す。 図10は、HDR画像の2~3の典型的なルマのヒストグラムを概略的に示す。
図1は、夜間の内部照明された玩具店に関する典型的なHDR撮像シナリオの一例を示す。該例は高度に照明された(夜の暗い外部と比較して)玩具を含み、これら玩具は、勿論、如何なる反射物体とも同様にランプ自体よりも大幅に低いピーク輝度を有するが、それでも相対的に高い輝度を有することができる。そして、子供用の玩具は、通常、非常にカラフルでもある。そして、見る者が品質の難点を持つことなくクリップされた状態で容易にレンダリングすることができるランプ101とは対照的に(もっとも、ランプ、照明器具102及びランプの周辺の領域104の間の構造の幾らかは理想的には忠実にエンコードされ、可能なら、好ましくは種々のグレイ値でレンダリングされるべきである)、玩具106の関連する情報のクリッピングは低品質でレンダリングされた画像につながり得る。コード割当の問題、即ちどのルマ値Y’がどのカメラでキャプチャされた又はレンダリングされるべき輝度Y(これらは更にディスプレイに最適化されるというより直接レンダリングされると仮定する)に対応すべきかに注目する前に、先ずどの輝度が如何なる斯様な符号化においてもキャプチャされることを要するかの問題に注目する必要があり、これは技術的に基準輝度範囲を指定することにより実施することができる。この基準輝度範囲は、この例示的画像のみでなく、全てのHDR画像に関する全ての必要とされるオブジェクトの輝度を現実的にレンダリングするために十分に高いエンコード可能な最大輝度を有するものであろう。店舗の一般的照明は例えば200ルクスであると仮定する。TLランプに10倍近い天井における玩具は、100倍大きな照明、即ち20,000ルクスを受けるであろう。従って、反射するオブジェクトカラーとしての白の輝度は、約0.8*20,000/pi=5000ニットであろう。このことは、最大値が5000ニットであるならばランプの輝度に近い斯様に相対的に明るく照らされたオブジェクトの輝度をもたらすか、又は明るいオブジェクトの少なくともカラーは、例えば5000ニットの基準輝度範囲又は2000ニットの基準輝度範囲(COD_REF)により定義される可能なカラーの色域(ガマット)の上部領域に入り得る。勿論、一方において、最適なレンダリングのためのカラーは現実のシーンにおける値により正確にグレーディングされる必要はなく(何故なら、当該レンダリングの如何なる特定の視聴環境の平均輝度が撮像されたシーンの平均輝度と正確に同一であったとしても、これは、その性質上幾らか近似的なものであるレンダリングに過ぎないからである)、他方において、後に示すように、或る輝度を他の輝度でエンコードするための数学的技術、もっと正確には他の輝度をエンコードすることを前提とされたルマコードが存在し得る。しかしながら、計算は、HDR符号化システムにとり望ましい技術的制約についての即座の見通しを与える。高度に飽和されたカラーは、例えば赤い玩具の場合、これの約30%の輝度を生じるが、これらカラーは、より小さな色域の最上部の輝度領域における赤の角に存在し得る(しかしながら、強くクリップされるか穏やかにクリップされるかによらず、マッピングされる)。このことは、シーンの所望のHDR(ネイティブの又は導出された)符号化の特性は付与するが、同じシーンに対する如何なる低いダイナミックレンジの外見画像について未だ何も指定しておらず、これは、その技術的限界、即ち意図する中間ダイナミックレンジ(MDR)レンダリングディスプレイのピーク輝度の正に性質により非常に異なったものになり得る。
如何なるHDR画像符号化チェーンにおいても第1の問題は、現実のシーン輝度をどの様に本基準輝度範囲GRAD_MSTRの輝度にマッピングするかであり、これは、簡略化のために、典型的にコンテンツ創作者が、これを用いて作業をしたい、即ち所望の芸術的外見を生じる自身の最終的カラーグレーディングを行いたいものと仮定する。理想的には、少なくとも忠実にレンダリングされることが必要な輝度をレンダリングすることができる高品質ディスプレイ(グレーダは自身の高品質マスタグレーディングを高品質基準ディスプレイ上でチェックしたいものであり、最終的ディスプレイがどの様なものでも自身のコンテンツは種々の視聴者に対して見せられるので、理想的には幾つかのレンダリングは非常に高いピーク輝度のHDRディスプレイ上で生じ、それでもコンテンツは見事に見えなければならない)、即ち少なくとも5000ニットのピーク輝度を有するものが、基準範囲の輝度をレンダリングするべきであり、説明の簡略化のために、実際の視聴環境が定義された基準視聴環境と同一であるならば、この基準ディスプレイはGRAD_MSTRからの基準輝度を正に1対1でレンダリングすると仮定することができる。即ち、指定された輝度が例えば3200ニットである場合、該基準ディスプレイは3200ニットをレンダリングする。
合理的な基準輝度範囲GRAD_MSTRを固定した後、適切な基準範囲GRAD_MSTRを一旦選択したら、決定しなければならないことは、シーン基準を該基準範囲にどの様にマッピングするかである。非常に明るい20,000ニットのTL管における全ての細部が正確に表される/コード化されることを望む場合、確かなことに、実用的なビデオ符号化にとり太陽の表面の10億ニットの正確な符号化を有することは必要ではない。この第1ステップは主にシーンに依存する芸術的最適化であり、その場合、斯かる高輝度は“歪めて表示される”、即ち斯かる輝度はGRAD_MSTR上の合理的な代用として表される。例えば、マスタグレーダはどの極端に明るいオブジェクトが自身のマスタHDRグレーディングにおいてクリップするかを選択すると共に、例えばグレーディングすることができ、これにより、如何なる後のステップに対しても該太陽を白色又は単一の高輝度黄色(例えば、最大の黄色(R=G=100%,B=0%))で表すことができる。HDR画像及び特にビデオ符号化における全ての関連する要因を念頭に置くと、典型的な基準範囲GRAD_MSTRは例えば20000ニット、10000ニット又は5000ニットであり、当該実施態様の残りの説明においてGRAD_MSTRは輝度[0,5000]をカバーするものと仮定するが、これは技術的に良い実利的な選択である。値ゼロは実際に非常に小さな輝度とすることができ、該値は使用されるべき規格化されたコード割当関数に依存して変化し得るものであるが、実用的目的ではゼロに等しくすることができる如くに小さいものであろう。
第2の問題は、キャプチャされたシーン輝度をどの様にマッピングするかである。この問題は輝度を何れかのディスプレイ上にどの様にレンダリングするかとは必ずしも同一ではない。何故なら、特定のディスプレイ及び典型的には何らかの視聴環境に対しても最も適したレンダリングを得るために当該基準輝度(及び実際にはカラー、しかしながら、説明を簡略化するために、カラーの色相及び彩度は撮像パイプラインを通して同一に留まり、該カラーの輝度のみが変化すると概して仮定する)に対して作用する何らかのレンダリングカラー変換が依然として存在し得るからである。しかしながら、これらは幾らかリンクされ、基準範囲を何らかの近未来及び中期的未来のディスプレイと関連付けるなら、ディスプレイの特性を基準範囲自体に供給する。今後何年も、そして恐らくは永久に、ディスプレイは典型的に20000ニットを遙かに超える又は恐らく2000ニットを超えるピーク輝度さえ有さないであろうから、正確なシーンの符号化という観点よりもディスプレイでレンダリング可能という観点から如何なるシーン輝度もエンコードすることに一層意味がある。即ち、シーン輝度を“歪めて表す”ことができる。これに役立つものは、2つの要因、即ち1)ピークテクスチャに関する十分に区別可能な情報がコード化されている限り、如何なる符号化からも異なる表現を導出することができるという事実及び洞察(即ち、最悪ケースで、例えば赤いキルトのテクスチャをキャプチャすると共に該キルトをソフトウェアでピクセル毎に緑のキルトに再着色することができ、同じことをグレイ値又は輝度に関しても実施することができるが、その場合、模様を決定する異なる輝度又はカラー値の何れも単一の値にグループ化されるべきでない);及び2)人の視覚は順応可能なものであり、特に見る者が現場におらず実際のカラーを知らなかった場合、脳は不体裁なカラーに関して想像により補正することができる。如何なるHDR技術、特に符号化システムの任務も、測光的に正しいものより信じられる画像を作成することができるということである。
従って、一般的に、グレーダは当該玩具店又は暗い部屋内部から見た太陽の当たる景色等のHDRシーンを、5000ニットまでもの十分に大きな基準範囲GRAD_MSTR上に自身の好みに従って相対的に忠実にマッピングすることができる。該初期のマスタグレーディングは自身の記述的及び芸術的規則を有するが、画像処理パイプラインの更に下流の技術的構成要素において何が生じるかを混同してはならない。特に、このような環境を例えば最大で2000ニットのCOD_REF等の一層小さな範囲にどの様にマッピングするかは些細なことではない。もっとも、種々の理由で、当該パイプラインには斯様な小さな範囲を自身のHDR基準範囲として用いる(典型的に、その時点以降に又は少なくとも当該パイプラインの一部において)種々の技術は存在し得る。
本出願は、より大きな一層良好な基準範囲GRAD_MSTR及び典型的に該基準範囲上でグレーディングされた最良品質の画像から開始して、より小さな基準範囲COD_REFによる斯様な中間表示に進むための幾つかの実施態様を説明する。
図1は、一例により、グレーダが典型的に自身のシーン輝度をGRAD_MSTRの種々の利用可能な副範囲に対してどの様に表したいか(割り当てたいか)を詳細に示している。TL管又は他のランプ101自体は、当該グレーダは最大値L_max_M又は該最大値に非常に近い値(例えば、L1=4995)にマッピングしたいであろう。典型的に反射性金属である照明器具102自体は幾つかの興味ある模様を含み、これら模様は、当該照明器具を単なる“白い穴”としてより一層現実的にレンダリングするために幾つかの区別する値により少なくとも暗示したい(即ち、該照明器具を非常に明るい光の範囲R_BL内で符号化したい)であろう。これらは、恐らく、無色ではなくても中間色に近い非常に彩度が減じられたものであり得、従って、これらのピクセルカラーはRGBコード化可能な色域の典型的に狭いテント上部に入ることができる。該非常に明るい光の範囲R_BLより下は、ランプに非常に近い当該玩具106のような、明るいオブジェクトの範囲R_BOであろう。明るいオブジェクトの斯かるピクセル(本例では、当該玩具のみならず、例えば家の塗装された壁又は屋外の日向の草等)は、しばしば、(強く)有色であるので、オリジナルのシーンカラーと比較して該カラーのコード化値を少なくとも幾らか彩度を減じるようにすることができるとしても、明るい有色カラーを表すことができるRGB色域テントの範囲を割り当てる必要がある。実際のシーンとの相関関係が存在するので、これらを合理的に明るく且つ合理的に着色させるだけで十分であり得る。図1Aには、余り説明に役立たない1D輝度ビューではなくコード化可能な色域における三次元の(もっと正確には、三次元からの二次元的赤-シアン-輝度カット)サブセット選択を示す(当該方法の実際的実施化においては、該選択を決定するために例えばValue=max(R,G,B)等の輝度相関も使用し得るか、又は何らかのカラー処理を実行し得ることに注意)。見られるように、実際に有色(例えば、赤いTL管)でない限り、明るいランプは、しばしば、低減された彩度の非常に明るい値により表すことができ、見る者はこれを許容する。しかしながら、このようなパステル化は、例えば日の当たった草に対しては行ってはならない。何故なら、これは正確にはLDRコード化において生じる一種のエラーであるからである。色彩に富んだカラーが必要とされる場合、これらカラーは明るい合理的に有色の副範囲R_BOにグレーディングすることができる。一層高い彩度をレンダリングすることができるディスプレイ(例えば、専用の原色を有する多原色ディスプレイ)のために、カラーをオリジナルの彩度の半分でコード化したとしても、過度の画像アーチファクトを有さずに彩度を常に2倍にすることができる。
例えば5000ニットの良好なHDR基準ディスプレイを定義したとして、シーンカラーを、又はもっと特定的には斯かるカラーの輝度をどの様にエンコードするかの問題を定める必要がある。古典的なLDR撮像は、この見地に関して余分な考慮を有さなかった。シーンの照度がどの様なものであっても、カメラの自動露出は、単に、撮像されたシーンにおける何らかの明るいカラーをコード白に関連付けた(実際には、何らかの平均カラー計算を介して、中間グレイにマッピングする)。ここで、これをHDR研究からの後知恵により熟考すると、このことはシーンに対する非常に特有の見方であり、これは常に数学的に働くが、技術的及び芸術的には、過度のコントラスト比でない良好に照明された環境、例えば均一に照明された1%~100%反射するオブジェクトに最も適しており、ノイズを超えて当該センサ又は符号化数学において依然として偶然に忠実に表されるどんなに暗いオブジェクトカラーまでも記録する(LDR画像が対応しなければならないどのレンダリングされる輝度に対しても付与される通常の数は、0.1ニット~100ニットのピクセル輝度である)。幾つかの又は多くのカラーはクリップされている可能性があり、最も白い忠実にコード化された白は、日当たりの良いシーンでは20,000ニットであり得、長時間露出された夜のシーンでは50ニットであり得た。また、LDR画像処理方式におけるレンダリング側においても、100ニットに対して理論的に最適なグレーディングが特定の視聴者により200ニット、400ニット又は50ニットのディスプレイ上で実際に見られているかも、又は該グレーディングが暗くされた部屋で又は駅のプラットフォーム上で見られるかも無関心であった。殆どの画像及び通常の厳しくない視聴者にとり、多分2~3絞りの斯様な差はその様に重大ではないが、100ニットからピーク輝度で多数の絞りにより相違する高度に厳しいHDR画像及び/又はディスプレイに関しては特定の時点で、差は好ましくないものとなる。最終的にレンダリングされる外見及び創作する芸術家の意図する外見の類似性は、そもそもLDR符号化時に明確に定義されていたとしても、視聴条件が理論的基準条件から過度に相違しない場合にのみ保証されることは明らかであろう。
しかしながら、画像(コンテンツの複雑さがどのようであっても)が現場(ディスプレイ+環境)において多様な異なるレンダリング条件で合理的にレンダリングするために正しく解釈可能でなければならない未来志向のHDR画像又はビデオ符号化技術においては、基準範囲及び色域のみならず該範囲及び色域をキャプチャされ表現されるシーンカラーによりどの様に使用/満たすかが、十分に検討されなければならない。
好ましくは、当該割当をLDRにおけるように完全に相対的には行わない(即ち、LDR画像においてシーンがどの様であっても、コードの白は常にディスプレイの白にマッピングされ、該ディスプレイがどの様なピーク輝度をもっていても、例えば暗いシーンをレンダリングする必要がある場合、ピーク輝度より低い輝度をエンコードするコードをうまく利用する)。HDR符号化システムに関しても最終的レンダリングに幾らかの相対性が存在する。何故なら、目/脳は相対的なカラー検出器であり、レンダリング条件は大幅に変化し得るが、該可変性は、何らかのカラー表現での中間のカラーの一層数学的に正確な仕様から開始するが、受信側において処理することができる(これ自体は、NTSC及びMPEG2が市場において一時は唯一のディスプレイであったガンマ2.2及びEBU原色のCRTにリンクされていたように、1つの特定の表示技術に最早リンクされるものではない)。
しかしながら、一方ではシーン輝度の例えば5000ニットの基準範囲内の基準輝度への、及び他方では該基準輝度のディスプレイでレンダリングされる輝度への正確な1対1のマッピングを必要とすることも、実利的で容易且つ汎用的な使用にとって制約である。
従って、典型的には輝度の大部分が大凡1対1でマッピングされるように構成及び充填される基準範囲GRAD_MSTRを有したいものであり、これによれば、特定のシーン輝度が全てのタイプの受信ディスプレイ上でレンダリングされるべき輝度に最終的に一致するであろうことを意味する(これにより、ある種のシーン、例えば明るい日当たり又は夜景、に関してはレンダリングされる輝度がシーン輝度と等しくなることは必要でない。何故なら、当該シーンにおける物理的に観察され得る輝度とディスプレイ上のものとの間には幾らかの減光係数(dimming factor)が存在し得、斯かる減光係数は或る程度ディスプレイ依存性でもあり得て、典型的なディスプレイ分類に対して最初に決定することができるからである)。種々のディスプレイ上で一層暗くレンダリングされるピクセル輝度の該近似的同一性は、典型的に、多くの(全てではなくても)ディスプレイ上でレンダリングされ得る当該シーン内の一層低い輝度に典型的に当てはまる。しかしながら、上端において輝度は理論的に何かであり得るので(可能性として、例えばセンサを照らす画像レーザビームに対応する輝度まで)、可能性のあるシーン輝度の明るい端部においては、シーン輝度の基準輝度に対する一層自由な割当を用いることができる。何故なら、例えば50,000ニット(そもそも、市場における十分な量のディスプレイ上で既にレンダリング可能である場合)は視聴者にとり快適であるには明る過ぎ(特に暗い視聴環境において)、従って、いずれにせよ一層レンダリングされるのに適した輝度値に変換される必要があるからである(レンダリングするディスプレイのピクセル輝度がどの様なものであっても)。出願人によれば、10000ニットも良好に利用可能な値であるが、5000ニットが基準範囲の上限にとり合理的な値であろう。
この場合、幾分暗い余り強く照明されていない玩具/オブジェクト108はLDRディスプレイ上でも適度に忠実にレンダリングすることができる通常範囲R_N内の何らかの輝度に割り当てることができ、オブジェクト110が前記ランプから一層遠くなるにつれて、即ち当該シーンから線形に測定可能な該オブジェクトのピクセル輝度が一層暗くなるにつれて、これらオブジェクトは基準範囲に一層低く割り当てられる(ここでは、GRAD_MSTR上のL_ref=k*L_シーンによる線形の割当方法であると仮定し、kは1に等しいか、全てのピクセルカラー及び特に一層低いものを十分に明るく維持するために典型的には過度に小さくない、例えば0.5等の何らかの状況に応じて最適に選択された(カラーグレーダにより)倍率である)。当該玩具店の外部、即ち僅かのランプにより照明された夜間の街路には、非常に暗いオブジェクトが存在し、これらオブジェクトは基準範囲の暗い副範囲R_Dにマッピングされる。そこでは、これらオブジェクトを幾らか明るくするために典型的には何らかの非線形コード割当を用いることができるが、輝度に対して十分なコード(例えば、10ビット)が存在する場合、選択された値を持つkにより上記線形割当を継続することができる。この場合、例えば殆ど照明されていない扉112の斯かる値は、これらの暗いカラーが低コントラストのLDRディスプレイ上で酷い、即ち相対的に明るい黒でレンダリングされる(され得る)かに拘わらず、少なくともクリップされない十分に固有なコードによりコード化される。同じことが暗い溝のピクセルにも当てはまるが、下水道格子を介して見られる下水道114のピクセルは、グレーダが最小のコード化可能な値(例えば、ルマ1又は0)であるコード(最小)黒及びその対応する輝度に全てマッピングすることができるほど暗く関心のないものであろう(そもそも、カメラにより十分に明瞭に且つ無雑音でキャプチャされた場合)。
この5000ニット範囲へのマッピングは実行するのが合理的に素直なものであり得、例えばグレーダは斯かるマッピングを実行すると推測することができるが、これら値を一層小さな[0,2000]ニット範囲に直接マッピングすることは、少なくとも幾つかの厳しいシーンに関してグレーダに問題を課し得る。即ち、これら問題は異なるシーンオブジェクトに対して適切な基準輝度を選択するというグレーダの芸術的熟練度により全て純粋に解決されるべきものではなく、グレーダは自身を補助する技術的解決策を有すべきである。例えば、当該店舗の電灯及び明るい部分がCOD_REFの1500~2000の副範囲にマッピングするために暗く(調光)された場合、この調光により当該暗い部分に何が起きるだろうか?該調光が簡単な非線形コード(再)割当を使用する場合、これらの一層暗いカラーは、少なくとも簡単な直接的使用の場合、例えばコードを固定のEOTFで表示するレンダラにより過度に暗くなったであろうか?とりわけ、一方における輝度範囲に沿って恐らくは存在し得る(又は実際のシーンに存在する)各オブジェクトテクスチャに対してどの程度多くのコードを確保すべきか等の見地と、当該画像の妥当な見え方(外見)、即ち1つの典型的レンダリングシナリオに対応する少なくとも1つの基準輝度範囲上での各オブジェクトに対する妥当な輝度値(後に特定のディスプレイ上での特定のレンダリングシナリオに調整するために測色的外見に対して余り影響のない二次オーダ的カラー変換しか必要としない)等の見地との間には対立が存在する。幾つかの取引を、その場的に想定することができるが、事をうまく実行するために、常に、ガイドする枠組みが望ましい。
図2には、マスタ基準輝度範囲GRAD_MSTRに沿うピクセル輝度(及び、これに関連して、例えば10ビットワードのような実際のコードのために使用するワードであるルマ)を、大幅に小さな(典型的には少なくとも1/2であり、1絞り少ないとも書くことができる)コード化基準輝度範囲COD_REFに再コード化する一般的問題をどの様に処理するかについての図が見られ、これは、例えば、[0,5000]ニットへのグレーダのマスタグレーディング、及び例えば[0,2000]ニットの規格化された基準輝度範囲を持つビデオ伝送コード化技術による例えばブルーレイ等のメモリ上への記憶又はネットワーク技術を介しての伝送のために実際に使用される技術的コード化である。
該再割当問題は、マスタ輝度範囲[0,5000]上で定義される合理的にグレーディングされた画像へのシーン輝度の初期的マスタグレーディングとは技術的に非常に異なる問題であるが、勿論、オリジナルの基準表現(GRAD_MSTRにおける)、並びに最終的に比色特性を伴うオリジナルのシーン及び該シーンに含まれるオブジェクト又は十分に忠実なディスプレイレンダリングとの幾らかの関連は存在する。
これは2つの側面を含む。即ち、一方では、両範囲が無限のコード化精度を有すると見なす場合(この場合、簡略化のために、両範囲に沿う輝度を正規化された輝度の再正規化された[0,1]範囲内の実数として書くことができ、これにより、勿論[0,5000]における定義から再正規化された輝度は、[0,2000]で定義されたので、同一のオブジェクトに関して対応する輝度と同一の値を有することはないであろう)、原理的に本教示によれば輝度をマッピングするために非線形マッピング関数を使用することができ、勿論、状況により幾つかのマッピングは他のものより望ましい。例えば、種々の理由により恐らく最適ではないであろうが、概念として原理的には線形伸張を使用することができる。他方において、この輝度の再割当において、COD_REFの輝度を実際の(例えば、10ビットの)ルマにより表さねばならない場合に生じることを要するコード化精度の問題を扱うことができる。ピクセルルマを定義するために利用可能な該ビット量は、どの特定の選択されたコード割当関数が輝度範囲に沿う種々のオブジェクトに対して副範囲及び該副範囲のコードの量をどの様に割り当てるかに依存して、常にオブジェクト(例えばピーク輝度の10%より明るくないもの等)のコード化の精度及び、特に、忠実なレンダリングのために十分なコードが存在するか(例えば、ピーク輝度の20%と30%との間でグレーディングを滑らかに変化させる青、対、最高のコード化及び輝度/カラー再生精度を必要としなくてもよい背景内の玩具店の複雑なテクスチャ部分)を決定する。
実際に、10ビットのルマは1024の異なる輝度(/グレイ値)しかエンコードすることができないので(とりあえず色度成分は無視する)、何処においても(明るいカラー副範囲、中間上部のグレイ、中間下部のグレイ、暗部及び超暗部)最高の精度を必要とする非常に高いダイナミックレンジのシーンを有する場合、全ての画像構造を忠実にエンコードするには1024を超える異なる値を必要とし得る。これが、HDR画像符号化を単純なLDR撮像方式から相違させるものである。このような状況においては、当該シーンを5000ニット又は2000ニットの範囲の何れにおいても忠実にエンコードすることができる如何なる可能な解決策も存在しないと言うことができる。しかしながら、全ての実際的な画像において、十分な品質の符号化のために必要とされるコードの量を緩和することができる。恐らく、空間的にテクスチャ化された領域は一層少ないコードしか必要とせず、一層多くのコードを滑らかな勾配のために見越しておく。最悪の場合、時には幾らかの縞模様(banding)を許容し、それでいて少なくともHDRディスプレイ上で全ての綺麗なHDR効果をレンダリングすることができるようにすることさえ考えることができる(マスタ範囲及び該範囲上のグレーディングを有することにより、グレーダは種々の後の受信側のレンダリングシナリオの品質についての良好な初期的見方を有することができる)。
ここで、特にHDR符号化に対する新たな概念を熟考するために一息つく必要があろう。即ち、特に以下の場合には2つの競合する互いに関連する事項が存在する。この場合とは、該2000ニットの再マッピングを、実質的に直接的にレンダリングするための画像として(即ち、最終的ディスプレイ、例えば2800ニットディスプレイ又は1500ニットディスプレイに対して最適な外見を得るためには何らかの更なる再マッピングが存在し得るが、2000ニットのコード化でグレーディングされた外見から開始するものであり、該外見にはオリジナルの外見は依然としてどうにか染みこまれているものであり、これは2ステップ的アプローチ:即ち最終的画像レンダリングに対する画像及び外見作成、並びに、HDR画像処理チェーンの当該部分で生じ得る全ての更なる考察及び処理である)、及び同時にオリジナルのHDRシーン内にあった全ての興味あるもの究極の(即ち、如何なる将来の使用に対しても、装置非依存性及び使用非依存性の)完全な符号化として、即ち該オリジナルシーンの全オブジェクトの測色的特性の十分に忠実な表現又は該シーンの少なくとも十分なHDR品質の表現としての両方で使用したい場合である。前者の考えは芸術的グレーダが典型的に関わる何かであり、後者の要件は部分的又は主に技術的問題である。
5000ニットから2000ニットへの線形圧縮、及び例えば2000ニットピーク輝度の実際のディスプレイ(モニタ若しくはTV又はプロジェクタ等)又は例えば5000ニットディスプレイの0~2000ニット副範囲(これは、0~2000ニットの再定義されたシーン輝度の5000ニットのピーク輝度のディスプレイの全範囲への(再)伸張とは異なり得る)での2000ニット範囲の1対1のレンダリングを一例として挙げよう。
利用可能なディスプレイに関し人の視覚についての心理物理学を良く考慮に入れてハードウェアを最適化することができるとして、この不適切な“図らずも選択された”マッピングにより何らかのHDRレンダリングの品質問題が存在し得る。例えば、明るい領域のHDR効果は準最適であり得る。即ち、実際の5000ニットグレーディングの画像が利用可能でないので、該明るい領域を2000ニットのディスプレイ上でさえ心理視覚的に一層HDR的に見えるようにさせるための何らかのカラー処理操作を実施したい場合があり得る。しかしながら、5000ニットのディスプレイが利用可能である場合はどうであろうか?これら輝度を単純に伸張(画像処理ソフトウェア又はハードウェアで自動的に)する(これは、当該マッピングに関する如何なる知的ガイダンスも無しに実施し得る)ことが、これら輝度を5000ニットのディスプレイ上で最適にレンダリングするために行う最良のことであろうか?少なくとも一層厳しいHDRシーンにとっては、大概そうでないであろう。
一方、グレーダは直接レンダリングされた2000ニット範囲の下側副範囲におけるオブジェクトの幾つかが暗過ぎる又は低コントラスト過ぎると感じ得る。該グレーダが、そのために例えば当該副範囲を明るくすることにより調整しようと試みる場合、該グレーダは、例えば再グレーディング/再マッピングにおいて穏やかに圧縮することにより該明るいHDR範囲を更に悪化さえさせ得る。
一方、例えば或るシナリオに対して定義された特定のビデオ規格(該定義は、典型的に、特定の輝度ステップが依然として見えるか否か、当該2000ニット範囲にわたって不均一に分布されている、最適な関数として何らかの対数ガンマ的関数又は同様のものを生じるという仮定から開始し得る)において、該2000ニット範囲に対して最適コード割当関数又はEOTFを固定的に定義した場合、例えばLc3とL_max_Cとの間の範囲の1/10等の各副範囲に対してどの程度多くのルマコードが利用可能であるかの問題にも気を配らねばならない。どういう訳か、余りにも少ないコードしか利用可能でない場合、HDRシーンは最適に表されることはない。何故なら、例えば10000ニットのディスプレイ上で綺麗にレンダリングされ得る重要な非常に明るい内容を伴うシーンに対する当該副範囲は、2000ニットのコード化において十分にエンコードされ得ないからである。このことは、該2000ニットのグレーディングを2000ニットのディスプレイ上で1対1にレンダリング場合のような可視的問題ではないかも知れないが、例えば20,000ニットのディスプレイにマッピングする場合に現れる。
従って、このバランスを注意深く処理するための何らかのメカニズムが必要であり、HDRシーン画像をエンコードすると共に、特に単一の基準ディスプレイ(例えば、5000ニット)のみならず市場における将来の全てのディスプレイに正しくサービスすることができる(シーン符号化における調整可能で再決定可能な見え方を介して)ために我々の技術に導入された基本概念は、以下に示されるように、この問題に非常に良く適している。読者が要点を理解することを確かにするために、2つの新たな命名を用いることができる。一方において、典型的に受信機における最適化ユニットにより自動的に決定することができる最終グレーディングが存在し得、これは、どの様なコード化表現を受信しようとも特定のディスプレイに調整する。例えば100ニット周辺にピーク輝度を持つレガシLDRディスプレイのための100ニットグレーディング及び例えば5000ニットのハイエンドHDRディスプレイ等の一連のディスプレイ調整における末端の2つの標準グレーディングの間の例えば1250ニットディスプレイ上にレンダリングされるべき該グレーディングを、中ダイナミックレンジ(MDR)グレーディングと呼ぶ。以下の教示では、中間の符号化、即ち例えば1000ニット(これも100及び5000なる範囲末端の間である)の関連する基準ディスプレイを有する符号化にも言及し、これを中間ダイナミックレンジ(IDR)と呼ぶ。何かの理由で特定の技術が、シーンのどの様なダイナミックレンジ画像でも(即ち、どの様なオリジナルシーンでも、及びどの様にレンダリングされるべきであっても)、例えば1000ニットの基準ディスプレイピーク輝度によるIDR符号化にエンコードするよう指示する場合、これは依然としてレンダリングされ得るものである、即ち、例えば実際に接続された850ニットのディスプレイ又は代わりに若しくは加えて1550ニットのディスプレイ等のために、種々のMDRグレーディングへの更なるカラー変換により調整されることを要し得るものであると理解されるべきである。
第1実施態様が、エンコーダ301を示す図3を参照して説明される。該エンコーダ301により、グレーダは、何が起きているか、及び該エンコーダが2000ニット画像を全ての外見の代表的画像として使用することを必要とし得るので何が技術的に起きなければならないかに過度に気を配ることを要せずに2000ニットの芸術的グレーディングを自由に行うことができる。即ち、グレーダは2000ニット画像の外見に集中することができ、従って、約2000ニットのピーク輝度のディスプレイに直接適用された場合、これら画像は最適に見えるであろう(例えば、暗闇に隠れている人がはっきりと見えることもなく見えないこともないような十分な明るさ、霧に半分隠れている人がぼんやりと見えるような十分な局部的コントラスト、又はビンが光って見える等)。例えば記憶メモリ300から到来し、グレーディング装置303に入力するオリジナルのRAW
HDRビデオ(例えば、HDRカメラから発生し、線形カラー表現である)が存在すると仮定する。熟練した読者は、例えばカメラに直に組み込まれたエンコーダを有するような本発明又は実施態様の異なる実際的実現例も存在し得る、と勿論理解することができる。
グレーダは、多くの実施態様では初期グレーディングユニット310及びユーザ入力コントローラ311(例えば、グレーディングコンソールであり得る)を使用したマスタグレーディングである初期グレーディングを行う。初期グレーディングユニット310は、例えばダビンチ(Da Vinci’s)等のグレーディングソフトウェアを実行するプロセッサとすることができ、該ソフトウェアは例えば全体的トーン及びカラーマッピング関数を実行し、画像の場面における移動するくすんだ局部的領域を選択し、これらのための処理を指定すること等ができる。一例として、上記RAWビデオは例えばARRIのカメラからの不適切なオブジェクト間及びオブジェクト内コントラストを持つ対数ビデオであると仮定することができる。グレーダは自身のマスタグレーディング画像(又は複数の画像)Im_5000を作成し、その場合において、該グレーダは、とりわけ、対応する5000ニットのGRAD_MSTR基準範囲における適切な輝度により全てのオブジェクト及びピクセルカラーを指定する。これは、何らかのビデオ伝送規格が該5000ニット参照ビデオを自身の規格によりエンコードする方法を定義する場合にのみ、HDRビデオの素晴らしい表現(これは、次いで、とりわけDCT符号化等によりビデオ圧縮され得る)であろう(伝送規格とは、とりわけ、例えばBD上のビデオのような光学規格等のメモリ担体を介しての伝送、及び例えばDVBによる航空会社放送等のネットワーク化規格又はインターネット供給若しくはHDMI(登録商標)ケーブル通信等の装置間通信システムを介しての伝送の両方を意味する)。
しかしながら、規格は、一層の自由度を欲し得ると共に、例えば2000ニットのピーク輝度で定義されたコード化ビデオのみを許容すると規定し得る。その場合、グレーダは自身の5000ニット基準内部符号化を直接使用することができず、再エンコードすることを必要とし得、このことは相当な再マッピングを含み得る(何故なら、必ずしも2000ニットグレーディングの比色的外見が2000ニットディスプレイ上でレンダリングされる場合に最適でなければならない場合ということではないが、原理的に、如何なる再定義及び該2000ニットの見え方内でエンコードされた5000ニット外見を用いることもできるからである)。可能性のあるシナリオは、グレーダが自身の殆どの時間を2000ニットグレーディングの所望の外見を作成するために集中させ、二次的な作業は、これから5000ニットグレーディングをどの様に作成することができるかに集中する。逆も可能であり(基本的に、技術的には両シナリオに、伝達される低ダイナミックレンジのHDR画像、及び、これを受信機により高ダイナミックレンジHDR画像に再グレーディングするための関数が存在する)、下記の解説では、この第2のシナリオ、即ちグレーダが自身の殆どの時間を所望の5000ニットHDRグレーディングを作成することに集中させ、次いで二次的に(高価なグレーディング時間を節約するために、自身は許容又は補正しなければならないだけで、部分的に自動的に実行することもできる)良好な2000ニット外見(及び典型的には100ニットのLDR外見も。該外見は5000ニット外見から定義すると共に2000ニット外見からの再定義に変換することができるが、LDR外見が2000ニットグレーディング画像から開始してグレーディングすることにより定義されるのみならず作成される例を説明する)を定義するシナリオを説明する。
グレーダは小範囲HDR画像(例えば、2000又は1200ニット)への大範囲HDR画像(例えば、5000ニット)の再マッピングを再グレーディングユニット320により実行する。このユニット320は、カラーグレーディングを初期グレーディングユニット310と同様に実行することができるが、2つの基本的な差がある。即ち、1)限られた組の再グレーディング関数しか使用することができず(これはHDR外見のコード化システムであるので、全ての受信機により理解可能な言語を形成すべきであるからである)、2)これらは実質的に視覚的に可逆的でなければならない(もっと一般的に言うと、2000ニット画像へのカラー変換は実質的に全ての高品質大範囲HDR情報を保持すべきであり、かくして、該情報を何らかのディスプレイ依存性マッピングの後にどの様なHDRレンダリングシステム上でも最適に使用することができるようにし、画像意味的に余り関心の無い情報のみを符号化の観点から大幅に不適切な値に置換する(例えば、粗く量子化する)ことができるようにする)。実質的に可逆的とは、a)5000ニットHDRから2000ニットHDRへの適用された関数又は再マッピング手順の何らかの数学的逆数を計算することができる、及びb)平方根がとられた画像を量子化するため、二乗し直された画像はオリジナル画像とは少し異なって見え得るが、視覚的に過度に重大な差は有すべきでない(重大さの量はグレーダ及び/又は自動画像解析アルゴリズムが決定することができる)ことを意味する。例えば、テクスチャにおいては、幾らかの量子化アーチファクトで免れることができる。何故なら、空間パターンは脳においてピクセルの非常に正確なカラー値よりも支配的な情報であるからである。このことは、数学的に、受信された2000ニットのHDRグレーディングを最終的品質(例えば、5000ニットグレーディングの画像)にカラーマッピングする関数は、輝度(又はルマ若しくは線形R、G及びB成分のうちの最大のもの等の何らかの等価的表現)に対して単調に増加すべきであることを意味し、さもなければ、トーンマッピング関数をアップグレードすることは幾つかの複雑なHDRシーンに対しては非常に複雑となり得る。
読者にとり一層明瞭にするために、ここに提示される新規なHDR画像/ビデオコード化技術と混同すべきでない2つの他のシナリオとの明確な区別を行う。例えば2000又は例えば1000ニット等のピーク輝度を持つ最適な意図するものの周辺にピーク輝度を持つディスプレイに対して素晴らしく見える画像を表す芸術的グレーディングがなされるとしても、そして、この得られたIm_2000ニットグレーディングの視聴者にとっての最終的な外見は、当該グレーダが如何なる他のディスプレイ又はグレーディングを考慮に入れる必要がない(即ち、単に芸術的に唯一の2000ニットグレーディングを作成し、この画像から何らかの他のグレーディングが導出され得るかに悩まされる必要がない)場合に取得するものと実質的に同一であり得るとしても、当該記載される技術は、単にIm_5000画像から新たなIm_2000画像を生じる簡単な(再)グレーディングが存在しない状況に対処する必要があるというより、むしろ更なる要件を考慮に入れる必要がある。2000ニットより大幅に明るいピーク輝度を持つディスプレイ上で(即ち、グレーダが実行していることの実際のHDRの視覚的影響をチェックするために該グレーダがコンテンツ創作側に利用可能にすると共に、該グレーダが5000ニット最大値及び2000ニット最大値のエミュレーションモードの間で切り換えることができる基準ディスプレイ360であり得る、約5000ニットのピーク輝度を持つ対応するディスプレイにより)良好なHDR外見を得るのに最適であるオリジナルの(一層高い品質のHDRレンダリングに必要とされる)Im_5000画像は、実際には記憶され又は送信されようとしているのではなく、むしろ、当該規格は2000ニット画像をコード化することを規定しているので、当該エンコーダはHDRシーンの2000ニット画像のみを記憶又は送信する。このIm_2000は、当該シーン上にどの様な外見で最終的にレンダリング(即ち、カラー変換)されるとしても、全てのオブジェクトテクスチャに対して十分に正確な情報を含む必要がある。
このIm_2000に加えて、当該エンコーダは、5000ニット外見をエンコードするIm_5000内の追加情報(この情報は、殆どの場合、オブジェクトが正確な幾何学的テクスチャというよりどの最終的平均カラーを有すべきかである)をパラメータ的に同時エンコードする何らかの関数F_2Yuを同時記憶しようとする。即ち、例えば日の当たる屋外景色又はランプ(又は他の高輝度HDR外見効果)が、異なるディスプレイのピーク輝度に対応する異なる外見に関して輝度軸又は全範囲カラー空間を介してどの様に最適に進展し得るか、即ち良くても2000ニットのディスプレイ又は1000ニットのディスプレイさえもの余り明るくないディスプレイしか有さない場合と比較して一層明るいディスプレイを有した場合にどの様に最適にレンダリングすることができるかである。この少なくとも1組の追加の関数F_2Tuは、5000ニット外見自体のみならず、例えば2000及び5000ニットの間の他の中間の外見に(即ち、斯様なピーク輝度により最適に見える画像でサービスされるべきディスプレイのために)再グレーディングする(ディスプレイチューニングと称する)ことを可能にする。従って、送信機側においてのみ複数の外見を再グレーディングする技術だけでなく、一群の外見をエンコードするための新たな方法に関して言及しているのである。
本技術は、5000ニットのディスプレイがレンダリングするために2000ニット画像Im_2000により直接供給されるような更に他のシナリオとは明確に区別されるべきであると共に混同されるべきではない。2000ニット画像は相当のオブジェクト間コントラストを持つ何らかのHDR画像であり、従って、この画像は例えば5000ニットのディスプレイ上に、所謂相対符号化及びレンダリング枠組みにおいて使用することにより、即ち2000ニットであるべき白を5000ニットの白としてレンダリングする(これが、視覚的に一層見事に見えるか又は例えばかすんだ景色の所与のシーンにとり明るすぎる故に余り望ましくないかによらず)ことにより直接レンダリングすることができる。これらが消費側で必要とされる唯一の画像であった場合、誤った比色(即ち、カラーコードは誤っており、これらの模倣画像を2000ニットのディスプレイ上で直接レンダリングしようと欲したかを示すであろう)によるものであるが2000ニットの外見であると見せかける、斯様な最終的に望まれる5000ニット外見を真似るためのトリックを想定することさえできる。このシナリオにおいて、受信端におけるディスプレイは、Im_2000(しかしながら、これは何らかの選択された芸術的理由で取得されたものである)のみを有し、オリジナルのIm_5000がどうであったかについてのどの情報も有さない。従って、受信機は受信端における例えば5000又は6000ニットのディスプレイのための“最適な”駆動画像を導出する際に、全ての種類の闇雲の仮定を行わなければならない。このようなことは、特に複雑なHDRシーンに対し最適であるとは思われない。この技術的画像化チェーンは市場における2000ニットディスプレイを有するユーザの割合は最適に満足させるが、一層高品質の5000ニットディスプレイに多くの金銭を使ったユーザは、自身の費用に対する最良の品質及びオリジナルのグレーダが意図したもの(該グレーダの最適化したIm_5000画像)を確かに常に自動的は得ていないことになり兼ねない。従って、全体の潜在的にサービスされるべき市場、即ち特定のユーザが有するどのシステムに対しても満足のゆく、何らかの技術的手段を介して伝達することができる追加の技術を必要とする。これは、視聴者が、例えば、BD読取器を有する何らかの装置により読み取り、該ディスク上の何らかの更なるカラーマッピングメタデータ情報を得るようなBDディスクのHDRx型バージョンを介して、又は代わりに例えばインターネットを介して何らかの特定の情報を購入する一方、該ユーザが当該ビデオを、例えば別荘又は滞在している高級ホテルにおけるハイエンド6000ニットTV及び自身の息子が自宅で使用している500ニットの携帯電話451等の2つの異なるディスプレイ上で同時に表示したいというシナリオで動作する。
当該符号化システムは、基準ディスプレイのうちの実際に送信された画像に関連されるものより高い種々の可能性のある実際のディスプレイピーク輝度を満足させることができなければならないだけでなく、一層低いもの、例えば200ニットも満足させることができなければならない。従って、典型的には、コンテンツ作成側には、本発明の核心ではないが、簡単に説明する他のグレーディングユニット325が存在する。本コード化方式では、単一の(HDR外見のみの)符号化でも動作し得るが、好ましくは、グレーダがLDR外見についても何かを(即ち、より小さな輝度ダイナミックレンジ能力しか持たないディスプレイに対して最適となるために、HDRがどの様にダウングレードされるべきかを)記述することができるようにしたい。このために、グレーダは、当該画像伝達技術にコード化されるIm_2000外見を例えば100ニット基準LDRにマッピングするために使用することができる少なくとも1つの関数F_2T1(又は、典型的には、例えば全体的及び/又は部分的に局部的な彩度等のピクセルの輝度及び色度の両方に作用する関数の組)を指定することができる。
読者は、当該2000ニットHDRは依然としてHDR画像であり、従って、2000及び5000ニット、並びに2000及び100ニット(及びシーン上のLDR外見)の間で変換することは技術的且つ芸術的に非常に異なるものであり得ると理解すべきである。更に、実際に伝送される画像(又は複数の画像)の基準範囲のピーク輝度が、例えば1000若しくは2000、又は恐らくは4000であるかが関連する。前者は100ニットLDRより10倍(だけ)明るい(即ち、約3絞り)のに対し、後者は既に印象的に40倍明るい(これは、特に薄暗い又は暗い視聴環境において見られる画像にとり重要な要因である)。エンコードされるべきHDRシーンのタイプに依存して、LDRと比較して上記3つの追加の絞りのために付加的に利用可能な絞りに対し幾つかの余分に明るい画像領域を割り当てることができる。40倍(5絞り、即ち更なる2つの追加絞り)に対しては、極めて明るいレーザ剣又は爆発等の幾つかの素晴らしいHDR効果を作成することができる。勿論、上記剣は2000ニットでもレンダリングすることができるが、その場合、余り素晴らしく明るいものとならない。
種々の解説例に関して、カラーマッピングは相対輝度色域において行うと仮定する。即ち、画像は典型的に10ビットのカラー成分表現を有する場合例えば0~1023に量子化され、最大コード1023は特定のコーデックに対して何らかの基準最大輝度に対応するので、例えば入力Im_2000画像及び100ニット基準LDRディスプレイのための出力Im_100の両方を1023に対応するLmax=1.0に物理的にコード化可能/実現可能な正規化されたピーク輝度を持つ相対色域又はグラフ上で指定することができ、そこで如何なるカラーマッピングも指定することができる。
図9は、上方グレーディング(及びF_2Tuで伝送される該グレーディングの情報)が下方グレーディング、即ち2000より低いピーク輝度へのグレーディング(例えば2000から100ニットへ再グレーディングするために少なくとも1つの又は一群の関数F_2T1でエンコードされるが、例えば800ニットに再グレーディングするための他の群の関数も受信機に付加的に通知することもできるか、又は一般的に下方グレーディングをどの様に行うべきかを指定する一群のカラー変換のみに基づいて再グレーディングするためのメカニズムが存在してもよい)とはどの様に大幅に相違し得るかの解説例を示す。困難な又は容易なHDRシーンが存在し得るが、システムは、勿論、これらの全てを妥当な態様で処理することができなければならないことに注意されたい。古典的ビデオ符号化(画像がDCTブロックに分割されねばならない等の技術的問題を主に扱い、幾つかのブロックアーチファクトは別として、撮像されるシーンが実際にどの様であろうとも常に実行され得、恐らく移動する水が最悪のシーンである)との大きな差は、このHDR外見スペクトル符号化方式では、種々の外見も現実的に見えるか又は芸術的に望ましいように見えることを要することであり、これは、シーン/画像の種類及び特定のレンダリング環境に順応される人の視覚の非線形な挙動の両方の複雑な関数である。従って、どの様な種類のオブジェクトレンダリングが10xLDR範囲(即ち、1000ニットまで)及び15x範囲(従って、1000及び1500ニットの間の部分も)等におけるHDR効果となり得るかとの質問を問うことができる。これは、視覚脳は状況及び見られる画像の解釈に高度に順応することができるので、部分的に相対的問題である。また、例えばファン・スヘンデルの古い絵画において、キャンバス又は白絵の具と黒絵の具との間には物理的に確かに大きなダイナミックレンジは存在しないが、画家は、脳が例えば明るい光を推定することによる高ダイナミックレンジ効果を模するためのトリックを用いることができる。従って、単に一部が陰にある晴れた日の街路を挙げると、ある者は日向部分に対して陰がどの様に暗くあるべきか又はあるべきでないかについて厳格であり得る一方、他の者は幾つかの可能なレンダリングを許容し得る。日向部分がどの様に正確に明るくあるべきかについては、一層多くの意見の不一致、又は言い換えると最適なレンダリングの一層大きな相違が存在し得る。勿論、視聴者の居間において2000ニットで最適にレンダリングされなければならない場合、1000ニットのピーク輝度のモニタは上記日向の街路を“正しく”レンダリングすることはできないが、大凡1000ニットのレンダリングは、1000ニットのディスプレイが当該画像から形成することができる最良のものであり、このことは完全に駄目というものでもない(これは、見る者が、実際に完全に体験する(正しい輝度外見から)というよりも、自身により脳内で日当たりの体験の多くを埋め込むような何となく余りインパクトのない画像というだけである)。図9は、素晴らしい例により、意図するディスプレイのピーク輝度範囲に沿う種々の点に対するグレーディングがどの様に変化し得るか、即ち主たるグレーディング案内方式に関して変化し得るかを示す。2~3の白色(例えば、自動車の前照灯のように見え得る)、街路灯及び建物の窓を介しての光等を有する、自然の自然的というより一層図形的(グラフィック的)な画像を有すると仮定する。実生活におけるようにHDRでは、LDRとは対照的に、幾つかの白色が存在し得ることに注意されたい。LDRは自身の白色及び明るい表示に対する僅かな余裕しか有さないが、実世界では、及び主関心領域拡散的白色を超えて残された十分な輝度範囲を有する如何なるコード化においても、例えば日光により外部から強く照明される白、又はTL管の白い表面等が存在し得、これらは全て大幅に異なる平均輝度を有し得る。グラフィック的レンダリングにおいては(例えば、映画シン・シティー2を想像されたい)、芸術的に(不自然に)白くされたオブジェクトさえ有し得る。例えば、白い眼鏡をした人が存在するとする。LDRにおいては、これらを100ニット又は例えば500ニットのピーク輝度によりどの問題も無くレンダリングすることができるが、これらを例えば5000ニットのディスプレイ上でピーク輝度の白でレンダリングすると、上記人は目から灯台のビームが出ているように見え、これは元々の意図とはかけ離れ得る。従って、これら白をHDRでは例えば自動車の前照灯よりも大幅に低い輝度でレンダリングし、それでいて、LDRでは1つ且つ同一の白に対しての色域余裕しか存在しないようにしたいであろう。
ここで図9を受信側から見ると仮定する。グラフ902は、送信側において6000ニットのマスタグレーディングであったかもしれないが(カメラから直接のもので、恐らくは、カメラ操作者が何らかの輝度及びコントラスト値を変える何らかの調整ボタンで外見を素早く調整したものか、又はオフラインで高度に芸術的にグレーディングされたかによらず)、ここでは伝送されたグレーディング901から導出することができるグレーディングである。幾つかのHDR白色(又は、明るい領域)の実世界の例は、例えば、窓を介しての屋内カーペット上への日差し、屋外の一層明るい空、及び例えば屋外金属屋根上への一層明るい日差しである。
従って、受信機は2000ニットのピーク輝度に対応する正規化された輝度軸上で定義された画像を得る。当該グラフ(ここでは、x軸上の2000ニット入力がそれ自体に出力として再グレーディングされねばならない場合、同一性として変換又は対角線を示す)は4つの部分からなる。最も暗い部分は、通常のシーン、即ち室内の反射性物体又は街路等に対し約45%(即ち、900ニットまでのレンダリングされるべき輝度であり、これは、例えば薄暗い視聴環境においてレンダリングされた日の当たる屋外を模することができる)にまで達する。この範囲より上には、3つの明るい範囲が存在し、これらは簡略化のために仮定するものは白色範囲である(即ち、これらには物体構造により幾つかの異なる輝度が存在し得るが、カラーは存在しないと仮定する)。これら3つのうちの一番低いものは、例えば人の芸術的な極めて白い眼鏡(spectacles)である。中間のものは、外から見た心地よく照明された部屋の内部であり得る一方、最も高いものは、例えば街路等又は自動車の前照灯ビーム等であり得る。
読者は、当該再グレーディング、即ち伝達されたIm_2000より高いピーク輝度に向かってF_2Tuにエンコードされたトーンマッピングによりなされる事項は、主に光の再分配に関するものであると理解することができる。(下部の)オブジェクトカラーは、視聴者が2000ニット、6000ニット又は10000ニットさえものディスプレイを有しているかどうかに無関係に同一にレンダリングされるべきであると仮定する。即ち、相対(線形)軸上において、曲線902の下部は曲線901の三分の一である。しかしながら、5000ニットグレーディング(902)における明るい領域は現実的な絶対位置に配置される。即ち、撮像されたシーンの全ての高品質レンダリングは見えなければならない。グレーダは、良好な追加輝度の印象を与えるためには、第2の明るい領域は理想的には第1のものより平均で2倍明るくなるべきである(avL_2_6000=2*avL_1_6000)ことに気付く。しかしながら、2000ニットグレーディングにおいて、これは簡単に実現することはできない。この場合、第2の明るい領域の幾らかはクリップせざるを得ないのみならず、もっと重要なことに、2000ニット基準輝度軸上に第3の明るい領域をエンコードするためのそれ以上の余裕が全く存在しない。即ち、技術的必要性により、これらは一緒に一層近くに配置されねばならない。しかしながら、グレーダは、これを、それでもavL_2_2000とavL_1_6000との間に幾らかの妥当な差(即ち、これが依然として異なる種類の光であるとの幾らかの妥当な印象)が存在するような方法で実行することを選択し得る。更に、受信機が正しい関数を受信した場合、2000ニットの受信された画像のピーク輝度に基づいて5000ニットグレーディングに対する必要な相対輝度を再計算することができる。勿論、特にどの様に視聴者に対しものが芸術的に最適に見えるかは、高度にシーン依存性の問題であり、従って、良好なHDR処理及び符号化技術を有するためには、これらの詳細な事項の全てを十分に処理することができるシステムを必要とする。下方グレーディングの場合、このことは、当該カラー処理関数の矢印の単なる反転とはかけ離れていることに注意されたい。この例において、グレーダは、最初に曲線901の下部を係数20により押し上げるのではなく、これら輝度を100ニットグレーディング(曲線903)の利用可能な相対輝度範囲の殆どにわたって広げることを選択し、次いで3つの明るい領域を全てピーク輝度の白にすることを決定する。従って、前後の上方再グレーディングとは対照的に、これは、この例では確かに必ずしも逆演算ではない。
図5における図5aは、ステンドグラスを備えた教会のHDR範囲画像を表す必要がある、可能なLDRへのマッピングの幾つかの詳細を示す。該教会の内部は、視覚的に(即ち、その見え方は)普通に明るいが、勿論、白に対してはかなり暗い。これは、当該色域において明るいステンドグラス窓のカラーに対して余裕が必要とされるからである。即ち、教会内部のピクセル(CD_HRD2000又はCD_LDR100)とステンドグラスのピクセル(CR_HDR2000又はCR_LDR100)との間のオブジェクト間コントラストCR_ioは、LDRグレーディングにおいても大きい(即ち、レンダリング時にオブジェクトも平均輝度で十分に相違するように、コーデック色域の輝度範囲の大きな割合)ことを要するからである(当該LDRグレーディングにおいて、コントラストは、勿論、せいぜい物理的に実現可能で、それでいて妥当である程度に大きく、このことは、グレーダの好ましい解決策として時にはクリッピング又は少なくともカラーの減彩度が含まれ得ることを意味する)。輝度軸に沿って色度動作及び明化の両方を示すために、ここでも赤-シアン断面を形成した該色域図には、((最良にエンコードされた)開始画像としての)HDRのIm_2000、第2の中間表現MDR(例えば、400ニットのピーク輝度ディスプレイのための)及び100ニットのピーク輝度の典型的な基準LDRの間でマッピングするためのマッピング関数の結果を示す(ここでは、どの汎用マルチセグメント・トーンマッピング関数、彩度制御関数及び局部領域選択関数等を使用することができるかについての詳細を重視する必要はない。というのは、これらは当業者が一般的に推測することができ、本発明は、むしろ、グレーディングの枠組み、このグレーディング情報が受信側に正しく到達することを可能にするための関連するコード化の枠組み、及び最終的な対応する正しいレンダリングに関するものであるからである)。一層暗いピーク輝度のディスプレイに向かうことは、しばしば、相対色域において明るくすることを典型的に伴う。従って、このことは典型的に、[当該符号化信号が、典型的に当該画像が基準ディスプレイのどのピーク輝度のためのものであるか及び当該ルマコードを発生する際にどのコード割当関数が使用されたか(そして、他のピーク輝度へ変換するための関数が存在する場合は、これらのピーク輝度の値)等の、これら符号化信号が何であるかを説明するメタデータを有することは別として]HDR及びLDR画像の間の差をどの様に見ることができるかでもある。即ち、LDR画像は、しばしば、シーンオブジェクトの均一な照明により一層均一に広げられたヒストグラム(時には、簡略化して単一モードの又は“ガウス分布の”とも呼ばれる)を有する一方、HDRは相対的に暗い副範囲に相当に強い極大部(ローブ)を有すると共に明るい副範囲に、例えば強く照らされた領域及び、時には、間に疎に割り当てられた輝度のギャップ等のコンテンツを有し得る。図10には、数個の例示的なHDRシーンのルマヒストグラムが示され、1001は外部への視界を備える倉庫(bunker)、1002は内部に暗い部分を有し、日の当たる外部から見られる建物、1003は教会のステンドグラス窓、1004は日没を背景にした建物及び低木、1005は建物の相対的に暗い内部及び相対的に大きな窓を介して見られる外部である。例えば、空は典型的に当該シーンの残部よりも2~3絞り明るく、ランプ(少なくともランプ自体)は、勿論、典型的に当該シーンの残部よりも大幅に明るい。暗いローブ(極大部)内に非常に多くのピクセルを持つ画像を直接レンダリングする(即ち、LDRディスプレイ上で、LDRディスプレイに適していないHDR画像をレンダリングする)と、当該ピクセルの大きな領域又は割合が、見分けるのが困難な黒みがかったものに見えるので、典型的に過度に暗く見える画像を得ることになる。即ち、各シーンに対してグレーダがどの様に正確なカラー変換を望もうとも、LDR再グレーディングは、時には、少なくとも例えば当該輝度ヒストグラム副ローブの掛け算的コントラスト伸張を介しての暗いピクセルの明化を伴う。読者にとり、ダイナミックレンジが一般的に何を意味するかに注意することも有益である。過去の専門家は、非常に簡単な形で、例えばダイナミックレンジは最も高くレンダリングされるカラーの輝度、対、最も暗いものの輝度であると答えたであろう。これは、レンダリングのための十分に合理的な尺度であり得るが、符号化については殆ど述べていない。前述したように、画像は例えば0.01ニット~2000ニット(基準ディスプレイのピーク輝度)としてエンコードされ得る、即ち200,000:1なるダイナミックレンジのシーンの符号化として見え得る。しかしながら、5000ニット表現までアップグレードすることができる場合、同一画像内に500,000:1なるダイナミックレンジの符号化を有するように思われる。符号化の観点からは、ダイナミックレンジ、もっと重要なことには画像の輝度の複雑さは、むしろ、どれだけ多くの(そして、どの、即ち、それらの典型的にレンダリング可能な平均輝度が何であるべきかの)異なるグレイ値の(又は、典型的には、異なって照明された)副領域が存在するか、及びどのオブジェクト内テクスチャ/幾何学的オブジェクト特性の複雑さの符号化品質によりエンコードされるかにより決定される。例えば、霧の中に部分的に隠れた人又は怪物は、心理視覚的又は芸術的に、その平均輝度がレンダリング可能な輝度軸上において何処に配置されるかのみの問題ではなく、該怪物を正確に不気味にさせるためにどの正確なオブジェクト内コントラストが必要とされるかの問題でもある。この輝度分布特定は、何故に相対的レンダリング(即ち、ディスプレイのピーク輝度とLDRディスプレイの知覚可能な黒との間の色域上への圧縮)が、しばしば、HDRレンダリング(レンダリングのこのやり方は、この特定の画像及びシーンの正しいダイナミックレンジ又は輝度分布の側面を無視し、従って、非常に誤ったダイナミックレンジのレンダリングを行う)を処理するため良い態様ではないことを示している。または、技術的要素の枠組みが、これらの全ての側面を、即ち全ての必要なピクセルの明るさ(輝度)の例えば5000ニットディスプレイ上での高品質レンダリングのみならず、より低い能力(即ち、より低いピーク輝度の)ディスプレイ上でレンダリングすることが必要な場合の忠実な近似も、処理することができるであろう。このことは、当該シーンの画像のどの高品質的側面、特にどのHDR効果(例えば、ランプの明るさの外見、対、霧から現れる人のコントラスト)が、より低いディスプレイのピーク輝度である場合、特定の程度まで犠牲にされることを要するかについての複雑な取引を伴い、これは、幾つかのケースでは知的画像解析ソフトウェアにより部分的に実行することができるが、しばしば、人のカラーグレーダにより芸術的に最適化される。
図5における図5aの教会のLDR再グレーディングに戻ると、教会内部の暗い角のカラー(CD)を種々のディスプレイ上で可能な範囲において同一に見える(即ち、同一のディスプレイ出力輝度でレンダリングされる)ようにしたい場合、2000ニットのディスプレイが全てのカラーに対して(即ち、例えばピークの白色に対して相対的に等しく駆動される場合)100ニットディスプレイよりも20倍明るいなら、同一の出力レンダリングのために、LDRディスプレイ(又は、そのカラーCD_LDR100)に対する駆動輝度(又は、実際に、勿論対応するルマR’,G’,B’)を20倍ブーストしなければならない。勿論、教会内部を十分に見ることができるために要する場合でさえ、これは、LDRディスプレイの色域限界が与えられた場合、可能な場合にのみ行うことができる。例えば、CD_HDR2000が0.05の輝度を有する場合、このようなLDR変換は現実的でないであろう。何故なら、LDRに対しては1.0の輝度、即ち白になってしまうが、勿論、典型的に非常に暗い輝度まで低下することができるHDRコード化においては、相対輝度は例えばピーク白色の1/10000又はそれ以下となり得るからである。それでも、勿論、CD_HDR2000をCD_LDR100にマッピングする場合、グレーダは自身の規準として正確な出力輝度の同等性を用いる必要はなく、視覚的に心地よいと思うどんなマッピングも使用することができる。これらの一層低いダイナミックレンジ外見へのマッピングは可逆的である必要はないことに注意されたい。何故なら、Im_2000からLDR画像を導出することだけが必要であり、再び再グレードアップする必要はないからである。簡単にするために、MDRのマッピングはLDRへのマッピングの何らかの補間(心理視覚的等距離目盛上の中間点)とすることができるが、勿論、どのようなものとすることもでき、グレーダはIm_2000からMDRにマッピングするために他の専用の関数を指定することを欲しさえもし得る。当該シーンにおけるステンドグラス内の表現されるべき赤のカラーは、高度に飽和されたものであるが、それでいて非常に明るいものであり得る。このことはIm_2000HDR画像では、これらを赤原色Rの最大輝度又は駆動値(例えば、255又は1023)の近くでエンコードする場合に生じる。下方に(例えば、MDR)に進むと、グレーダは当該システムの物理的限界に出会い、窓の明るさの印象を可能な限り多く得るために色彩の豊かさをバランスさせる、即ち十分なオブジェクト間コントラスト(脳が素晴らしく明るい色彩豊かな窓と解釈する)を維持することを欲し得る。これは、色域頂部におけるカラーを十分な彩度(即ち、無色輝度軸から依然として十分な距離)に、即ち該色域の集束する上部において依然として十分に低く且つ色域境界に対し可能な限り近くに(即ち、当該テクスチャにおける隣接するカラーが等しくなることによるポスター化が生じることなく)維持するCD_MDR400へのマッピングを伴う。LDRに対して、グレーダは当該マッピングを継続することを選択する(2000から400は約2絞りであり、400から100もそうであるので、グレーダは当該マッピングを同一方向に等しい距離にわたって実行することを考えることができるが、一般的に、これは両ディスプレイの心理視覚的側面(即ち、一層高いピーク輝度のディスプレイに関しどのピーク輝度から特定の光効果が視覚的外見に生じ始めるか、対、グレーダが100ニットのもの等の一層低いピーク輝度のディスプレイ上に何らかのHDR効果を過度に詰め込まねばならない)を考慮に入れて輝度及び彩度をバランスさせる如何なるマッピングとすることもできる。)。この例では、グレーダの選択は、CR_LDR100の白(の近傍)にクリップし、当該LDR外見に微妙に透き通るステンドグラス上の絵のテクスチャの僅かのものだけを残すものであることが分かる。これらの下方マッピング関数F_2T1を技術的にどの様にエンコードするかに関しては、種々の方法が存在し得る。例えば、グレーダはディスク上の関数を(有効な)限られた範囲[0,1]内に留まるように指定する(即ち、MDRへのマッピングがIm_2000に対するメタデータとして同時エンコードされる)と共に、これからLDR外見が受信側において数学的に外挿される技術を用いることができる。又は、典型的な[0,1]色域範囲を超える拡張色域内に定義された擬似カラーPCへのカラーマッピングを技術的に可能にすることができる。その場合、適切なMDRカラーCD_MDR400を補間により得るためにLDRカラーPCを正確に指定することができ、実際のレンダリング可能なLDRカラーCR_LDR100は受信端においてデコーダがクリッピングメカニズム(固定とするか、又は例えば複数の選択可能なクリッピング方法からの選択番号をエンコードすることにより指定することもできる)を適用することにより決定される。図5における図5bは、LDRグレーディングの画像仕様に関して外れた値をどの様にエンコードすることができるかの実施態様の1つを示す。或る者は、0.0と1.0との間の全色域555にマッピングするが、コードの幾つかはLDRにおいてレンダリング不可能な(MDRカラーに調整された場合はレンダリング可能である)カラーのために確保される。LDRでレンダリング可能なカラーの実際の色域は556であり(即ち、恐らくは望ましいクリッピングを含み、これらカラーがLDRディスプレイ上でどの様にレンダリングされるべきか)、これは最大の又は白の点CWを例えば0.85に定義することにより指定することができる。色域556の外部のカラーは、何らかの固定の又は伝達されるクリッピング方法により、LDR画像をレンダリングする前に当該色域にクリップされる。一部のコンテンツ創作者は、LDRオブジェクト領域に対しては少なくないカラーが存在するので、ディスク上のMDRコード化からのLDR外見の外挿が一層無難な実施態様であると思うかも知れない。それでも、結局は同様の方法となる。何故なら、実際には一層大きな色域555を、現画像(又は複数の画像)のために必要とされる殆どのLDR色域外カラーの定義の周囲でぴったりと囲むことによりCWを相対的に定義するからである。即ち、テクスチャデータを、最大の占有度を持つ、即ち最も低くエンコードされた画像にクリッピングがない画像により定義する。従って、このことは、何らかのMDR画像をディスク上に置くと共に、たまにはクリッピング成分を有する、レンダリングするべき最終LDRを生じさせるための更なるマッピングを適用することに対応する。
要約すると、一般的に、HDR表現の間のマッピングは典型的に相対輝度軸に沿う一層明るいオブジェクトの再配置(例えば、ディスプレイの能力を実際に画像におけるオブジェクトの意味とバランスを取り、明るさの外見に加えて輝きの外見を心理視覚的に利用しながら、これらオブジェクトを特別に明るくさせるために)が伴うのに対し、LDR画像へのマッピングは、利用可能なレンダリング可能なカラーの小さな色域が与えられたとして、全てのオブジェクトのグレイ値範囲を一緒に、何らかの最適な態様による解決を伴い、これらは2つの技術的に異なる作業である。
この背後にあるのは、単一のHDR画像だけでなく、実際に種々のディスプレイのピーク輝度による種々のレンダリング状況のための一連の外見もエンコードする有効性についての考え方であるが、これは些細なことではない。何故なら、各外見の画像に対して、協定されたカラーコードのワード長等の技術的制限(実際には、計算ICの複雑さ、通信のために利用可能なビットの予算、及び時には例えば衛星ビデオ放送等の古い技術への組み込み可能性等)のような全ての要因が与えられた場合の最適化動作のみならず、勿論芸術的考慮も常に必要とするが、実際に、これらの全ての必要なものは一緒に最適化されるものであるからである(従って、例えば人のカラーグレーダが、芸術的には素晴らしいが利用可能な技術によってはマッピングせず、結局は期待外れに見えるようなものを作成し得ないような優れた技術的枠組みを必要とする)。
例えば、平均的に照明されているが相当に暗い領域を備えると共に、幾つかの開口部を介して臨界的なカラー及び/又は輝度の幾つかの領域を持つ日の当たる外部の眺めも備える内部の部屋を含むダイナミックレンジ的に複雑なシーン(5000ニットの基準輝度範囲又は色域上で最適化するには既に複雑なシーンであり得る)を有すると考えよう。この場合でも、視聴者は当該部屋の内部における幾らか暗い種々の領域を視認性のみならず当該シーンの雰囲気が正しいような正しい平均輝度で正確に見るのみならず、実際の外部領域を模する種々の明るい領域も正しく見るであろう。しかしながら、ここで問題は、当該シーン上の全ての一層小さなダイナミックレンジのビューに対し、どの様にして、これら全ての様々に照明された領域がバランスされた態様で分散されるように維持するか(即ち、一層小さな最大輝度で、及び一層低いピーク輝度のディスプレイ上でレンダリングするために)である。2000ニットのレンダリングは、依然として極めて高い品質のHDR外見を有し得るが、例えば3000及び5000ニットの間であった輝度を2000ニットより幾らか低い輝度にどの様に再分布させるかを依然として決定しなければならない。例えば、グレーダは、これは最適に実施されるべきと考え、内部の全ての輝度を5000ニットグレーディングのものと等しく維持し、外部を十分に明るく且つ日の照ったものに維持し、即ち外部の平均輝度を2000ニットの最大値(又は、より良くは、外部にあるどの様なオブジェクトに対しても十分な彩度という制約の下で達成可能な最大値)の近くに維持し、例えば当該領域の反射的な最も明るい部分で幾らかを犠牲にし得る。
1000ニットの場合、明るい領域を一層厳格に再グレーディングする必要があり得、従って内部及び外部の平均輝度の間のコントラスト比を十分に高く維持するために、ここでは、内部のカラーも暗くすることを考えることができる。例えば700ニットの場合、グレーダは、例えばローカルな及び準全体的なコントラスト等を考慮しながらではあるが、一層小さな利用可能な輝度副範囲内で全ての斯かる様々に照明された内部領域を一緒に解決するために屋内オブジェクトの全ての輝度を大幅に変更することを要することを考え得る。勿論、ここでも、グレーダは屋外オブジェクトの輝度に目を向けることを要し得る。
HDR符号化のための優れた技術的枠組みは、勿論画像消費側において必要とされる種々のシナリオも与えられたとして、特に全てのオブジェクトを少なくとも輝度軸方向に沿って再着色するための種々の態様を可能にする十分な自由度をコンテンツ作成者に付与する必要がある。
最後に、フォーマッタ330は単一の例えば2000ニットの参照した画像Im_2000を、HDR画像をコード化するための選択されたビデオ伝送符号化規格による何らかの規定されたフォーマットにエンコードする。既存のLDR画像コード化及び通信技術を大いに再使用することができる方法を開発した。最終的には、HDR画像に対してさえも、例えば正規化されたRGB値を有するのみであり、これらを、ピクセルが実際には何であるかについては構わないコード化フォーマットで記憶することができる(勿論、受信機は当該ルマ又は非線形R’G’B’値が実際にどの輝度に対応するかを説明するメタデータを必要とし、さもなければ、例えば該受信機が古いLDR画像を受信すると仮定すると、当該ピクセルの大部分を低いピーク輝度を持つディスプレイ上に過度に暗くレンダリングする)。出願人の研究において、利用可能な1024のコードが特定の輝度をルマとしてエンコードするためにどの様に使用されるかを定義するために正しいEOTFが使用されるという条件で、HDR画像を標準のMPEGコード化構造(例えば、YCrCb 10ビット)でエンコードすることができることを示したので、エンコードされたIm_2000Cを得るために典型的にDCT符号化が関わり得る。この画像と同時伝送されて、例えば低ダイナミックレンジディスプレイ(例えば、300ニットまで)のための最終駆動画像を得るために、少なくとも1つの低ダイナミックレンジ画像(例えば、典型的には100ニット)を計算するためのF_2T1関数等の、どの様に導出画像(即ち、グレーディング又は外見)がIm_2000から得られるべきかを規定する(又は少なくともガイドする)全ての所要のメタデータが存在すべきである。上記画像及びメタデータは、例えばBDディスク上に配置されるか又はビデオ伝送コード化信号としてエンコードすることができると共に、例えばネットワーク接続を介して送信されるか、又は後の伝送のために記憶することができる。これに加えて、本発明によれば、追加の組のメタデータMET(F_2Tu)が存在し、該メタデータは本説明ではBDディスク上に記憶されたIm_2000ニット画像から例えばIm_5000ニットグレーディングの非常に近い近似を再構築するための関数F_2Tuとして解説する。従って、要約すると、ユニット310により生じるグレーディングは、芸術家が如何にして現実のシーンが高品質(一層大きなピーク輝度の)HDR画像上にマッピングされることを欲するかを定義する基本的な芸術的グレーディングである。2番目のグレーディングユニット320は、この最適なHDR表現をグレーダの指示の下で一層低いピーク輝度のHDR画像にマッピングするために典型的に使用される(一層高いピーク輝度のディスプレイに対して最適な再変換を可能にするための領域の十分なコード化品質を依然として有するが、オブジェクト輝度が一層低いピーク輝度範囲にマッピングされているので心理視覚的には少ないHDR効果しか有さないトレードオフ)。幾つかのエンコーダ実施態様は、これのみを実施し、ディスプレイしかサービスする必要がない受信機アプリケーションにサービスして、画像通信に関して協定されたものより高いピーク輝度のシナリオをレンダリングすることができる。しかしながら、一層低いピーク輝度に如何にしてダウングレードするかについての情報も有することが典型的に有益である。従って、典型的には、第3のユニット325も存在し、自動アルゴリズムが又は典型的にはグレーダも、2000ニットの画像が如何にして典型的には100ニットの画像にダウングレードされるべきかを指定することを可能にする。最後に、全てのデータは、協定された記憶又は通信システムが必要とするものに従ってフォーマットされる。
ここで、5000ニット及び2000ニットのHDR符号化の間におけるマッピングに関してグレーダが何を実行することができるか、及びこのためにどの技術的側面を種々の技術的実施態様が満たさねばならないかについての更に幾つかの実施態様の側面を解説する。前述したように、自身により使用されねばならないIm_2000ニット符号化を単にグレーディングするのみならず、当該パラメータ関数符号化技術により5000ニットの最適グレーディングIm_5000もコード化する場合、実際に2000ニットへのグレーディングは、常に、グレーダが理解し注意を払うか否かに拘わらず、シーンカラー表現(即ち、全てのHDRオブジェクトテクスチャの十分に正確に量子化された特性)と他方における芸術的外見との間のバランスをとる行為となる。従って、良いグレーディングは、最適化する際に、これらの両制約を考慮に入れなければならない。図6における1つの可能性のあるグレーディング方法で理論的に開始する。非常に異なる照明の2つの副領域(例えば、暗褐色のパブの内部及び窓を介しての明るい外部、又は、その逆に、夜間の暗い外部及び例えば明るく照らされたショーウインドウ内部等)からなるHDR画像を有すると仮定する。これら2つの領域を輝度境界子Ltにより少なくとも概念的に区切る。実際には、例えばLtより上のIm_2000の輝度に対しては複雑なマッピング及び下の輝度に対しては簡単な乗算的スケーリング係数を単に指定するか、又は5000ニットグレーディングに再構築されるべき入力Im_2000の全輝度範囲にわたり単一のマッピングを指定する等のように、当該マッピングを技術的に種々の同等の態様で実現及びエンコードすることができる。この例において、グレーダは自身のコンテンツ創作を、5000ニットの基準外見(Im_5000)内にパブの内部のための素敵な外見を作成することにより開始した。ここで、グレーダは上記外見をエンコード及び伝送するために、該外見をIm_2000ニットグレーディングにコピー(即ち、レンダリングされるのと同一の輝度、即ち基準輝度範囲における同一の輝度で)したい。即ち、Ltより下の領域においては、2つのグレーディングが2.5なるスケーリング係数による線形マッピングにより関係付けられる。勿論、熟練した読者はグレーダが全ての種類の他のマッピングを使用する、例えば低い副範囲の幾らかの部分を暗くすることができることを理解することができる。何故なら、この場合、幾つかの茶色の椅子は5000ニットのレンダリング/グレーディングで実行するものと比較して2000ニットのレンダリングでは一層良好に見え、このことは、例えば線形マッピング曲線601上に小さな隆起を付与するであろう。
次いで、グレーダは一層高い輝度のカラーに対して何をなすべきかについて集中することができる(簡略化のために、これらカラーの色度は両HDR符号化に対して同一に留まると仮定し、これは、本発明を輝度の挙動に基づいて解説することができることを意味するが、熟練した読者は、これが例えば彩度又は色調も変化させ得る(例えば日光を模擬するための黄色に向かう移動等)より一般的なカラーマッピングに対してどの様に動作すべきかを理解するであろう)。これが単に種々の明るいHDRテクスチャの符号化である場合、即ち、2000ニットではいずれにしても完全に作成することができないか又は後処理することができるので、これら領域に対する理想的輝度の外見要件を今や無視する場合、当該画像の残部に対して部分的マッピング曲線602を用いることができる。即ち、この例では、正規化されたLN_2000がLtより上では同じ相対的/正規化されたLN_5000輝度に1対1でマッピングされる(この場合、これは勿論比色計又は光度計に対しては5000ニットの意図するディスプレイ上でレンダリングされた場合に一層明るく見えるであろうが、人の視覚系に対する見え方は、とりわけ、視覚的順応性及び人の脳による画像の認識的解釈に依存するであろう)。即ち、多分外部の日の当たる領域の上部は5000ニットのディスプレイ上では一層明るく見えるが、そうすることができ、そうあるべきである。そして、脳は、外部ではどの様に正確に日が当たるかを知ることも構うこともないが、少なくとも特定のピーク輝度の何れかのディスプレイが許す限りにおいて、“相当に明るい”領域を期待する。従って、幾つかのタイプのシーンに対し、これは、妥当な結果を伴い、悪いグレーディング方法ではない。もっとも、これは、依然として可逆的ではあるが不連続なマッピングを有するので、少し直感に反するものに見え得る。可逆性の基準(即ち、グレーダが一層高い品質の5000ニットグレーディングから“より低い品質の”2000ニットコード化を何らかの関数を適用することにより行う場合、受信側では、これらの関数は受信された2000ニットのものから5000ニットグレーディングを再構築するために逆に適用されねばならない)は、送信側においてIm_2000を再構築Im_5000*に、Im_5000に対する十分な視覚的近さの特性で以ってマッピングするための何らかのF_2Tu関数(又は複数の関数)を定義することができることしか必要とせず、従って、当該実施態様の説明では単に当該エンコーダはメタデータとして下方マッピング関数自体ではなく、Im_5000*を再構築するために必要とされると共に典型的には単調に増加する上記関数の逆関数F_2Tu(この場合、5000ニットグレーディングを再構築するためのF_2T5)をエンコードすると仮定することに注意されたい。
恐らく、グレーダは、例えば限られたグレーディングツールセットには連続関数(例えば、調整可能なセグメント位置を持つ多重線形等の)が存在するので、他の関数を使用することを欲し得る。その場合、グレーダは上部の輝度(上部輝度範囲R_U)に対して部分マッピング603を使用することを選択し得ると共に、例えばIm_2000を輝度値がLtの直ぐ上には存在せず、例えば入力輝度範囲の最後の四分の一のみに存在するようにグレーディングし得る。とはいえグレーダは種々の要件を連続してバランスさせねばならず、従って、良好な5000ニットグレーディングが導出可能であることを欲すると共に、特に、その品質に関して責任を負うことを欲する場合、該グレーダは典型的に2000ニットのグレーディングに対して何を行っているかのみならず、再構築される5000ニットのものについてもチェックするであろう。グレーダは、例えば、これらを並べてチェックすることができるか、又は自身の単一のディスプレイ上で切り替えてチェックすることができる。該切り替えは大きな変更の領域を即座に示すが、並べるものは他の種類のチェック(例えば、何らかの付加的理由又は効果のために意図的に違ってグレーディングされた副領域)のために用いることもできる。更に、自動アルゴリズムが、例えば縞模様(banding)等の何らかの視覚的状況により厳しいものであり得る領域の事前分析を行うことができ、この場合、これら領域はグレーダが其処をもっと厳格に見るように赤で点滅させることができる。両画像はHDRでなければならないが、これらは勿論幾らか異なるHDR外見であろう。曲線603の延び方は、特にIm_5000画像が明るい5000ニットのディスプレイ上に示されねばならない故に、例えばIm_2000画像における局部的に利用可能なコードの数Nと比較して過度に大きな微分値Dによる縞模様等を伴った幾つかの領域につながり得る。この場合、グレーダは当該曲線を、これを考慮に入れるために再調整することができる。例えば、グレーダは該曲線の傾斜を少なくとも当該範囲において僅かに低下させ、曲線603に関して、少なくとも視覚的に許容可能であるなら、高い傾斜部分の間の小さな傾斜の部分によりN字状曲線を得るようにすることができる。又は、グレーダは当該曲線を僅かにずらし、602ほど多くではないが、該曲線に平均で一層小さな傾斜を付与するようにすることができる(グレーダは、内側と比較した外側領域に対する心地よいオブジェクト間コントラストを決定することにより絞り高を調和させたい、例えば窓の境界の周りでのパブ内部への光の染み込みを制限したいと欲し得る)。又は、自動アルゴリズムが、これをグレーダのために実行し得る。その場合、何らかの技術的にグレーディングされた画像Im_2000Tをディスク上に記憶することができ、そして、この場合、該Im_2000Tからグレーダにより望まれたように芸術的グレーディングIm_2000を導出するF_2T2T等の更なるマッピングパラメータが典型的に存在する。
図7は、2つの明るい及び薄暗いHDRグレーディングを関数変換により関係付けるためにグレーダが何を行うことができるかの或る一般例を概略的に示す。一層低い輝度の内部領域の正確な再生の代わりに、グレーダは、例えば、それが5000ニットにおいて一層良く見えるか、又は2000ニットの一層小さな範囲における最適化であると思う故に、2つの外見のうちの一方に何らかの付加的なグレーディング効果を追加することができる。例えば、グレーダが例えば典型的な5000ニットのディスプレイは暗い部分(又は、少なくとも相対的に暗い部分であるが、多分、例えば0.01ニットの代わりに0.005又は0.0001ニットまでもレンダリングする超HDRディスプレイにより絶対的な暗い部分も)をレンダリングすることができる、即ち、例えば暗い地下室若しくは洞窟又は夜のような森のホラー映画における画像に役立ち得る何らかの追加の暗闇の見え方を取り入れることができると思う場合、該グレーダは701のマッピング部分を僅かに一層暗い方に曲げることができる。同様に、グレーダは、上部の部分的なマッピング曲線703を曲げて、幾らかの一層のコントラストをもたらすと共に、特定の輝度の副領域を強調することができ、又はその逆に目立たないようにすることもできる。局部的なグレーディングの例も示している。即ち、通常は、画像Im_2000における全てのピクセルに対して曲線701が純粋に空間的位置に基づいてではなくピクセルの輝度に基づいて使用されるが、該例においては、曲線710が幾つかの局部的な領域/オブジェクト(例えば、内部の相対的に暗い部分により囲まれた小さな窓を介しての明るい外部に対する第2の眺め)に対して使用される。このことは、カラー処理機能の形状指定データに加えて、受信機が画像710におけるどのピクセルに適用されるべきかを決定することを可能にするために何らかの位置特定情報が伝達されることを意味する。このことは、例えば何らかの特定のオブジェクトには、例えばIm_2000において一層良く見えるようにさせるべく追加の非平均的ブーストが付与されるが、これは過剰にならないように軽減されることを要するからである。また、人の視覚の局部順応的性質により、暗い内部の壁の小さな開口を介して見られる空の一部が、当該画像内の他の位置における空の一層大きな残部とは、両者が比色的に正確に同一であるにも拘わらず、異なるカラーのものとして知覚され得ると理解することができ、これは局部的な処理仕様により補正することができる。又は、これはグレーダが場面の何らかの部分に関して全体の曲線をいじくり回すより局部的処理を指定する方が有利であることに気付く故に使用することもできる。これらの全ての必要とされるマッピング関数は、簡略化のためにF_2Tuにより概念的に示しているものであり、全ての該所要のパラメータ及び他のデータは、受信機により理解され得るように事前に規格化された態様でメタデータとして適切にエンコードされる。グレーダは原理的に5000ニットのIm_5000*から更に高いピーク輝度のディスプレイへどの様にマッピングするかを同時エンコードすることを望むことさえできることに注意すべきであり、該関数F_5TEは、例えば、白っぽい曇った空等の特定の大きな領域を日が当たった場合でも決して過度に明るくさせないが、小さな電灯は極めて明るくさせる等の頭打ち処理を規定することができる。これらの関数は、Im_2000から例えば20,000ニットのグレーディングへ直接計算するために再計算しディスク上に記憶することができる。勿論、グレーダは、Im_5000画像が気に掛ける最も明るいものであり、やるとしても更なるブーストは、テレビジョンメーカ若しくはSTBメーカの好み、又は何らかの受信端画像変換装置にまかせることを考えることもできる。
例えば光ディスク上での記憶のため又は何らかのテレビジョン規格のための、画像信号S_imへの所要のカラー処理関数メタデータの符号化は、例えば、HDR画像グレーディング処理定義部において、これが斯様なタイプの情報であることを示す特定の指示子コード値及び処理状況、特に必要とされるカラーマッピング関数の形状をエンコードするパラメータにより行い得る。記述子が、一方においてSTB表の処理を、他方において2000ニットビデオの定義をエンコードすることができる。例えば、どのディスプレイのピーク輝度にグレーディングされた画像が最適に合っているかの定義は:
Video_Type_definition_descriptor()
{ Peak Luminance of codec
reference range
EOTF
}
とすることができる。
BDに書かれるピーク輝度は、当該解説例では、2000ニットであり、EOTFはブルーレイスペックに(数学的関数又はLUTとして)定義されるであろう。というのは、どの様な単一又は複数変形例を規定しようとも、複数の場合はどの1つが使用されるかを示すために例えば整数を使用するからである。
勿論、3000ニットを書き込み、指定された2000ニットの定義で何らかの3000ニットコード化を強制することもできるが(即ち、EOTFを2000ニット符号化のために使用して)、通常は仕様に従う。
Im_5000*を再生する処理は、例えば:
Video_processing_descriptor(){
Characterizing type #2000_to_5000
K ルママッピングのための線形セグメントの数
For(i=0;i<K;i++){(LN_2000_i,LN_5000_i)}なる部分セグメントの終点の座標であり、LN_2000_iは例えばセグメントの始点のx座標、LN_5000_iはy座標であり、LN_2000_iが最大値(典型的に1)を有する場合、最後の始点は終点である、
L ルマ依存性彩度乗数のための線形セグメントの数
For(j=0;j<L;j++){(LN_2000_j,MULT_SATJ)}なる、現在の線形セグメントで開始又は終了する軸に沿った輝度(又はルマ)の座標であり、y方向においては彩度ブースト値、例えば0.3又は3.5の乗数である[注:このグラフは、例えば8ビット=255の可能な値がMULTSAT=f(mult_sat_code)=例えばA*mult_sat_code+Bとして線形又は非線形に分布された例えば0.25~3.0の標準範囲を、例えば2.0のSAT_SCAL_FACTORによりスケーリングすることによりエンコードすることができるので、彩度は2.0*3.0までエンコードすることができる]
}
と定義することができる。
このメタデータ(一層簡単なHDRコード化シナリオにおける)から、受信側は必要とする全ての情報を有する。即ち、受信側はIm_2000がどの様に指定されたか、即ち装置非依存性(それでいて、当該HDR効果を特定のHDRディスプレイ能力に対して最適にグレーディングすることにより、一群のレンダリングシナリオにとり部分的に最適化された)符号化として比色的に何を意味するかの確認を取り、これは装置固有の必要性を満たすために必要なら更に調整することができる。また、デコーダは処理関数を読み取ると共に、これらを自身のカラー処理ユニットにロードすることができる。
図4は、例示的な消費者向け家庭用レンダリング構成(勿論、読者は、当該実施態様を、適宜変更を加えて映画館用のデジタルシネマ等のプロ用システムとして具現化することもできると理解する)の受信端におけるHDR画像(又はビデオ)デコーダ401(例えば、IC若しくは処理ボード、又はTV、BD読取器を備えるSTB、コンピュータ又は医療画像受信ステーション等の装置におけるプロセッサ上で動作するソフトウェアであり得る)を概略的に示す。
画像信号S_imは、例えばブルーレイディスク340から読み出されて、圧縮画像Im_2000Cを開始画像として生じ、画像伸張器403は該画像を、例えばランレングス復号、逆DCT等を実行することにより非圧縮画像に伸張し、例えば線形輝度CIE(X,Y,Z)の符号化Im_2000を得る。これに加えて、種々のメタデータ処理関数、例えばIm_2000から100ニット外見画像を得るための関数F_d2d及び本発明の種々の実施態様を説明するために特に重要なIm_5000*を再構築するためのF_2Tu関数が、同じディスク及び/又はメタデータの二次源から読み出される。論理プロセッサ405は、例えば内部デコーダを備えるセットトップボックス(STB)の特別な構成は何であるか、特にどのディスプレイ(又は複数のディスプレイ)が現在接続されているかを決定する(該プロセッサは、更に、例えば平均の視聴用周辺照明、視聴者がリモコンを介して当該システムに記憶した視聴の好み等のレンダリング環境の他の側面を更に分析することもできる)。現在2000ニットのディスプレイ450(のみ)が接続されている場合、上記論理プロセッサは処理されていない(斯様なディスプレイにとり芸術的に既に最適であるから)Im_2000ビデオを該ディスプレイに直接中継することができる。これは、典型的に、当該画像を何らかの特定のビデオ伝送(メモリが接続されビデオが供給される場合は、ビデオストレージ)規格に準拠するように更に(如何なる比色的処理自体は行う必要はないが)フォーマットすることができる伝送フォーマッタ415を介して行う。例えば、ディスプレイ450は、例えばHDMI(登録商標)の十分にHDR可能なバージョンに準拠したケーブル接続出力端(例えば、HDMI(登録商標)コネクタ)432を介して接続することができる。メタデータが、例えば当該ディスプレイが自身の最終の比色的微調整処理を実行することを可能にするための有用な情報として、伝送される場合、このメタデータは、HDMI(登録商標)仕様の協定されたフォーマットで伝送することができる。同時に、当該STBは、例えば携帯電話又はタブレットの携帯ディスプレイ451に情報を供給することもできる。これは、x*100ニットに最適化された画像を、無線出力端433を介した無線接続を経て(例えば、802.11Wi-Fiプロトコル又は同様のものを介してストリーミングビデオにより)行うことができる。勿論、この大幅に低いダイナミックレンジ能力(例えば、ピーク輝度500ニット)の携帯ディスプレイには、異なるカラー/輝度外見で処理された信号、即ち異なってグレーディングされた画像が供給されねばならない。このために、カラー処理ユニット410は正しい処理機能F_d2dから情報を取り出し、例えば典型的には該関数をIm_2000に適用することにより適切なグレーディングを得る(及び、論理プロセッサ405は所要のデータ、即ちIm_2000及びF_d2dを伝送する)。従って、カラー処理ユニット410は各シナリオに対して(即ち、受信された符号化画像のピーク輝度がどの様であっても、及び再グレーディングされた画像が示されるディスプレイのピーク輝度がどの様なものであっても)適切な比色的変換を、受信された関数を直接適用することにより、又は適切なカラーマッピング関数を受信された画像にエンコードされた再グレーディング情報に基づいて決定することにより計算して、正しくグレーディングされた出力画像を得ると共に、該正しくグレーディングされた例えば100ニットの画像を伝送フォーマッタ415に(直接に又は論理プロセッサを介して)伝送するか、又は3200ニット画像等を伝送するように構成される。伝送フォーマッタ415は、従って、所要の情報が接続されたディスプレイに伝達可能となるために必要とされる如何なる再フォーマッティングも実行する。即ち、該フォーマッタは、少なくとも何らかの事前に協定された画像符号化プロトコルに従う画像を送る(例えば、850ニット画像をLDR画像符号化コンテナに記憶する)と共に、メタデータ内の全ての又は幾つかのカラーマッピング関数を伝達することもできる。
論理プロセッサ405は、例えば1000ニットで参照された復号ビデオの画像を1500ニットのディスプレイのための画像に変換するために、カラー処理が必要とされるか又はどの様なカラー処理が必要とされるかを決定することができる。
このために、作成者は当該カラーマッピング関数F_d2dがどの様なレンダリング状況のためのものであるかをエンコードすることができ、これは:
Mapping_function_meaning {
Starting_max_luminance 2000 nit
Optimal_max_luminance 100 nit [即ち、当該マッピングは、“平均で”、100ニットのディスプレイのために適切にグレーディングされた駆動画像を作成するためのものである]
Upper_limit_max_luminance 500 nit
Lower limit max luminance 40 nit
}
として実行することができる。
最後の2つのパラメータは全ての実施態様において必要とされないが(これらは、伝送される画像のピーク輝度が事前に定められるとして、ディスプレイの少なくともどの意図するピーク輝度まで当該関数が再グレーディングするかのみを典型的にエンコードし、典型的には、ここでStarting_max_luminanceと呼ぶ符号化ピーク輝度を書き込むことも有効であり得る)、受信機が接続されたディスプレイに対して当該画像を再グレーディングする必要があるかを即座に決定することができるように、外見の適切さに関する限界を伝達することも有益であり得る。
即ち、コンテンツ作成者が最適出力最大輝度のみならず、限界も記入する場合、該作成者は自身によれば何が、この例ではIm_2000から始まるカラーマッピングが使用可能なLDRディスプレイであるかを定義することになる。もっと正確には、該作成者は、当該画像を100ニット周辺から例えば500ニットまでのディスプレイ上で使用する場合[即ち、たとえ該ディスプレイ自体が自身の改善処理を行わず、このLDRグレーディングIm_100を直接レンダリングするとしても]、該画像は依然として妥当に見え、例えば過度に明るく見えないことを保証する。該作成者は、例えば当該画像は過度に暗くはなく、50ニットのディスプレイ上でも十分な視覚的品質でレンダリングすることができるが、40ニットより下では、少なくともグレーダの判断によれば、平均的視聴者にとり暗い領域は気楽に見るには暗くなり過ぎることを理解している可能性がある。このことは、ディスプレイ又は論理プロセッサが、例えば750ニットのディスプレイのためのIm_750の予測のために種々の可能性のある関数のうちのどれを使用すべきかを推定することを容易にし得る。これは、F_2000T1000関数ではなくて、例えばF_2000T400関数であり得るか、該ディスプレイが両予測を使用し、適切に補間することができる。これらの限界は、HDRシーン上のどのダイナミックレンジ外見に対して当該グレーダの芸術的レンダリングの選択が有効であるか、対、どの場合において範囲に沿う種々の平均的オブジェクトの輝度の他の最適化が一層良くなるかを指定する。
第3の例は、STBの所有者又はユーザが、例えば6000ニットのピーク輝度を持つハイエンドHDRディスプレイを利用可能にした場合である。これは5000ニットに十分に近く、該ディスプレイはIm_5000*でグレーディングされた画像を供給されることが可能で、これら画像を、直接、僅かに準最適にレンダリングすることができるか、又は代わりに自身の5000から6000へのカラー処理を実行することができる。この例において、当該信号は出力端431を介して進み、インターネット420(又は、これはローカルネットワーク等であり得る)へ供給する。当業者であれば、種々の第三者又は追加の技術的要素がインターネットを介して関わり得、例えばディスプレイ452が、Im_2000信号(既にディスプレイに最適化された画像の代わりに)を供給されたなら2000から5000への変換を実行する場合、ユーザはインターネット上の第三者を介して該ディスプレイに対する所要のF_2Tu関数を得ることができることを理解するであろう。
当該符号化枠組みには余りにも多数の変数が存在するので(何故なら、種々のLDR又はHDRビデオキャプチャをコーデック色域に関して異なる基準輝度範囲を持つ種々のコーデック定義で処理することができると共に、種々のディスプレイに対して最適な画像を供給することができることを欲するからである)、図8は本発明の幾つかの側面を再度図式的に要約する。
従って、グレーダが作成側のグレーディング装置内に内部的に有するもの、例えば何らかの線形輝度符号化においては、例えばビデオ伝送のために未だ最適化されていない一群のOpenEXR画像等は、左側の軸、即ちL_orig上にある。前述したように、このマスタグレーディング画像におけるピクセル輝度は、それ自体、実際のシーンにおける輝度ではなく、この画像は、最終結果を、これらが例えば2つの違なる露出のARRIカメラの装置によりどの様にキャプチャされたか、からコード化していると共に、次いで余り遠くない将来の大多数のHDRディスプレイにサービスするように適切にグレーディングされたものである(勿論、該グレーディングは、幾つかの例では、カメラマンが自身のカメラ上で構成するもののように簡単であり得る)。出願人は、グレーダが5000ニットの最大輝度の基準輝度範囲を選択する解説例を提供した。例えば、これは手に入れることができた最良の基準ディスプレイであり、いずれにせよ一層明るい輝度は見ることができないからである。従って、十分な資金を持つ消費者が同じディスプレイを購入する場合、該消費者は該オリジナルのグレーディング(“ディレクターズ版”)を見ることができるであろう。最終的にレンダリングされるもの(中間のコード化選択については、未だ何も言っていない)はL_DISP軸上に示され、これはディスプレイが当該輝度を、特にピーク白(例えば、R’=G’=B’=1023)のレンダリングにより簡略化された出力輝度としてどの様にレンダリングするかを示している。
しかしながら、このチェーンは、この場合、大幅に低いコーデックの最大輝度値(当該コード化における色域の可能性のある標準化された輝度最大値のL_COD軸上に見られるが、これは前述したように両側の画像/カメラ及びディスプレイの色域/範囲と混同されるべきでない)を介して進行する。即ち、当該コーデックは例えば2500ニットのピーク輝度(L_MAX_C)を持つように定義されており、全てのコード化を、このことを考慮に入れて正しいパイプライン通信を得るように実行しなければならない。前述したように、このIm_2500なる組のビデオ画像を例えばDVB又はATSC通信を介して送信する場合、例えばF_2T10等の種々のカラーマッピング関数組を同時に供給することができ、これらは、受信側のカラー処理ユニットが上記Im_2500から始まる例えば10,000ニットの最適にグレーディングされた画像を導出するために適用することができる。これらの関数は間接的に指定することもでき、例えばF_D1T05は50ニット周辺にピーク輝度を持つディスプレイのために50ニットのビデオにマッピングするが、カラーマッピングされた100ニットのものから開始して、Im_2500から直接というよりは受信側で計算可能である。
当該ビデオ信号は、幾つかの方法で、例えばブルーレイディスク340又は固体メモリ製品等のメモリ製品上で伝達することができ、900ニット及び3500ニットの間の及び好ましくは2000ニット又は1000ニットの最大輝度(L_MAX_C)を持つ符号化高ダイナミックレンジビデオIm_2000、並びに該符号化高ダイナミックレンジビデオIm_2000にカラーマッピングを適用することにより上記最大輝度(L_MAX_C)より高い、好ましくは少なくとも1.25倍高い最大輝度を備えたピクセルを持つ第2ビデオを導出するための少なくとも輝度マッピング関数を有するカラーマッピング仕様F_2Tuを有するビデオ信号S_imを有する。上記メモリ製品は、オプションとして、少なくとも1つの他のカラーマッピング仕様F_2d2を有すると共に、オプションとして、どの範囲のディスプレイに対して当該符号化高ダイナミックレンジビデオIm_2000又は該ビデオからカラー処理により計算される何らかのビデオが視覚的に最適であるかを示すために使用することが可能なディスプレイピーク輝度の少なくとも1つの限界(LH_100,LL_100)を有する。視覚的に最適とは、当該画像が、更なるカラー処理(多分、RGBに基づくマトリクス処理の変更等の些細な処理は除く)なしに当該範囲内にピーク輝度を持つディスプレイ上で直接レンダリングされた場合に最も適して見える(コンテンツ作成者/グレーダによれば)一方、例えば一層暗いディスプレイ上では当該画像の幾つかが楽に見るには暗過ぎるか又は見苦しいと判断される領域を含み得ることを意味する。特に、グレーダは比色的に正確なHDR効果を形成したものとすることができ、従って、これらは例えば1000及び2000ニットの間のピーク輝度のディスプレイ上で最良に見られると共に、例えば500又は4000ニットでは他の対応するカラー処理が実行されねばならず、当該領域に幾らか異なる外見を付与し、これが当該HDRを斯様な異なるダイナミックレンジ能力のディスプレイ上で一層好適にレンダリングする。
本明細書に開示されるアルゴリズム的構成要素は、(完全に又は部分的に)実際にハードウェア(例えば、特定用途向けICの部品)として、又は特別なデジタル信号プロセッサ若しくは汎用プロセッサ上で動作するソフトウェアとして実現することができる。
当業者にとっては、どの構成要素がオプション的な改善であり得るか及び他の構成要素との組み合わせで実現可能であるか、並びに方法の(オプション的)ステップが装置の各手段に及びその逆にどの様に対応するかは本提示から理解可能であろう。この出願における“装置”なる用語は、最も広い意味で、即ち特定の目的を実現することを可能にする一群の手段として用いられ、従って、例えばIC(の小部分)、専用の機器(ディスプレイを備える機器等)又はネットワーク化されたシステムの一部等であり得る。“配置(装置)”も最も広い意味で使用されることを意図し、従って該用語は、なかでも、単一の装置、装置の一部、協動する装置(の各部)の集合等を含み得る。
明示的意味としての本実施態様のコンピュータプログラム製品版は、汎用又は専用プロセッサを可能にするコマンドの集合の、これらコマンドをプロセッサに入力するための及び発明の特徴的機能の何れかを実行するための一連のローディングステップ(中間言語及び最終プロセッサ言語への翻訳等の中間変換ステップを含み得る)の後の如何なる物理的実現も含むと理解されるべきである。特に、コンピュータプログラム製品は、例えばディスク若しくはテープ等の担体上のデータ、メモリ内に存在するデータ、有線若しくは無線のネットワーク接続を介して伝送するデータ、又は紙上のプログラムコードとして実現することができる。プログラムコードとは別に、当該プログラムに必要とされる特徴的データも、コンピュータプログラム製品として具現化することができる。コンピュータにより、データ計算を実行することができる如何なる装置も意味する、即ちコンピュータは例えば携帯電話でもあり得ることは明らかであろう。また、装置の請求項は、前記実施態様のコンピュータで実施化されるものもカバーすることができる。
本方法の動作に必要とされるステップの幾つかは、データ入力及び出力ステップのようにコンピュータプログラム製品に記述される代わりに、当該プロセッサの機能に既に存在し得る。
上述した実施態様は本発明を限定するというよりは解説するものであることに注意すべきである。当業者が請求項の他の領域への提示された例のマッピングを容易に実現することができる場合、簡潔にするために、これらオプションの全てには詳細に言及していない。請求項において組み合わされた、本発明の構成要素の組み合わせとは別に、構成要素の他の組み合わせも可能である。構成要素の如何なる組み合わせも、単一の専用の要素において実現することができる。
請求項における括弧内の如何なる符号も、該請求項を限定することを意図するものではない。“有する”なる用語は、請求項に記載されていない要素又は態様の存在を排除するものではない。単数形の要素は、複数の斯様な要素の存在を排除するものではない。
401 ビデオデコーダ
403 ビデオ伸張器
405 論理プロセッサ
410 カラー処理ユニット
415 伝送フォーマッタ
420 インターネット
450 ディスプレイ
451 携帯電話
452 ディスプレイ
477 メタデータ読出ユニット

Claims (4)

  1. 第1最大輝度以下の輝度を有するピクセルカラーを有する一群の画像を含む入力高ダイナミックレンジビデオを符号化するエンコーダであって、前記第1最大輝度は前記入力高ダイナミックレンジビデオのピクセルが有することのできる最高輝度として定義され、
    前記入力高ダイナミックレンジビデオは、符号化高ダイナミックレンジビデオとして符号化され、
    前記符号化高ダイナミックレンジビデオは、第2最大輝度を有し、
    前記第2最大輝度は、少なくとも900ニットの値を有し、
    前記第1最大輝度は、前記第2最大輝度より少なくとも2倍高い値を有し、
    前記エンコーダは、
    前記入力高ダイナミックレンジビデオの輝度から前記符号化高ダイナミックレンジビデオのピクセル輝度を導出するためのトーンマッピング関数をコンテンツ作成者が生成することを可能にするよう構成され、前記トーンマッピング関数を前記入力高ダイナミックレンジビデオのピクセルに適用することにより前記符号化高ダイナミックレンジビデオを導出するよう構成される再グレーディングユニットと、
    送信されるべきビデオ信号に、前記符号化高ダイナミックレンジビデオを、及びメタデータとして、前記トーンマッピング関数の逆であり及び前記符号化高ダイナミックレンジビデオから前記入力高ダイナミックレンジビデオの再生を計算するために使用できる逆トーンマッピング関数を書き込むよう構成されるフォーマッタと、
    を含むエンコーダ。
  2. 第1最大輝度以下の輝度を有するピクセルカラーを有する一群の画像を含む入力高ダイナミックレンジビデオを符号化高ダイナミックレンジビデオとして符号化する方法であって、前記符号化高ダイナミックレンジビデオ内のピクセルの輝度は、少なくとも900ニットである第2最大輝度以下であり、前記第1最大輝度は、前記第2最大輝度より少なくとも2倍であり、
    前記方法は、
    前記入力高ダイナミックレンジビデオの輝度を前記符号化高ダイナミックレンジビデオの輝度にマッピングするトーンマッピング関数を指定し、前記トーンマッピング関数を前記入力高ダイナミックレンジビデオに適用して前記符号化高ダイナミックレンジビデオを取得するステップと、
    送信されるべきビデオ信号に、前記符号化高ダイナミックレンジビデオを、及びメタデータとして、前記トーンマッピング関数の逆であり及び前記符号化高ダイナミックレンジビデオから前記入力高ダイナミックレンジビデオの再生を計算するために使用できる逆トーンマッピング関数を書き込むステップと、
    を含む方法。
  3. 最大で第1最大輝度を有する輝度を有するピクセルを有する一群の画像を含む再生高ダイナミックレンジビデオへの復号のためのビデオデコーダであって、前記再生高ダイナミックレンジビデオのピクセルは、最大で前記第1最大輝度の輝度を有することができ、
    前記再生高ダイナミックレンジビデオへと復号されるべきピクセルデータは、2次HDRビデオである符号化高ダイナミックレンジビデオとして受信され、前記符号化高ダイナミックレンジビデオ内のピクセルの輝度が、少なくとも900ニットの値を有する第2最大輝度以下であり、前記第1最大輝度が前記第2最大輝度より少なくとも2倍高いことを特徴とし、
    前記デコーダは、
    ビデオ信号内で受信したメタデータから逆トーンマッピング関数を抽出するよう構成されるメタデータ読出ユニットであって、前記逆トーンマッピング関数は、最大で前記第1最大輝度の値を有する輝度を有するピクセルカラーを有する一群の画像を含む入力高ダイナミックレンジビデオから前記符号化高ダイナミックレンジビデオを生成したエンコーダにより使用されたトーンマッピング関数の逆である、メタデータ読出ユニットと、
    前記ビデオ信号から、圧縮画像データを読み出し伸張して、前記符号化高ダイナミックレンジビデオを取得するよう構成されるビデオ伸張器と、
    前記逆トーンマッピング関数を前記符号化高ダイナミックレンジビデオのピクセルに適用して、前記再生高ダイナミックレンジビデオを取得するよう構成されるカラー処理ユニットと、
    を含むビデオデコーダ。
  4. 最大で第1最大輝度を有する輝度を有するピクセルを有する一群の画像を含む再生高ダイナミックレンジビデオへのビデオ復号の方法であって、前記再生高ダイナミックレンジビデオのピクセルは、最大で前記第1最大輝度の輝度を有することができ、
    前記再生高ダイナミックレンジビデオへと復号されるべきピクセルデータは、2次HDRビデオである符号化高ダイナミックレンジビデオとして受信され、前記符号化高ダイナミックレンジビデオ内のピクセルの輝度が、少なくとも900ニットの値を有する第2最大輝度以下であり、前記第1最大輝度が前記第2最大輝度より少なくとも2倍高いことを特徴とし、
    前記方法は、
    ビデオ信号内で受信したメタデータから逆トーンマッピング関数を抽出するステップであって、前記逆トーンマッピング関数は、最大で前記第1最大輝度の値を有する輝度を有するピクセルカラーを有する一群の画像を含む入力高ダイナミックレンジビデオから前記符号化高ダイナミックレンジビデオを生成したエンコーダにより使用されたトーンマッピング関数の逆である、ステップと、
    前記ビデオ信号から、圧縮画像データを読み出し伸張して、前記符号化高ダイナミックレンジビデオを取得するステップと、
    前記逆トーンマッピング関数を前記符号化高ダイナミックレンジビデオのピクセルに適用して、前記再生高ダイナミックレンジビデオを取得するステップと、
    を含む方法。
JP2022008351A 2014-08-08 2022-01-24 Hdr画像をエンコードする方法及び装置 Active JP7343629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023141256A JP2023162375A (ja) 2014-08-08 2023-08-31 Hdr画像をエンコードする方法及び装置

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
EP14180314 2014-08-08
EP14180314.8 2014-08-08
US201562135452P 2015-03-19 2015-03-19
US62/135,452 2015-03-19
PCT/EP2015/066653 WO2016020189A1 (en) 2014-08-08 2015-07-21 Methods and apparatuses for encoding hdr images
JP2017506784A JP7053259B6 (ja) 2014-08-08 2015-07-21 Hdr画像をエンコードする方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017506784A Division JP7053259B6 (ja) 2014-08-08 2015-07-21 Hdr画像をエンコードする方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023141256A Division JP2023162375A (ja) 2014-08-08 2023-08-31 Hdr画像をエンコードする方法及び装置

Publications (2)

Publication Number Publication Date
JP2022058724A true JP2022058724A (ja) 2022-04-12
JP7343629B2 JP7343629B2 (ja) 2023-09-12

Family

ID=51301135

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2017506784A Active JP7053259B6 (ja) 2014-08-08 2015-07-21 Hdr画像をエンコードする方法及び装置
JP2022008351A Active JP7343629B2 (ja) 2014-08-08 2022-01-24 Hdr画像をエンコードする方法及び装置
JP2023141256A Pending JP2023162375A (ja) 2014-08-08 2023-08-31 Hdr画像をエンコードする方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017506784A Active JP7053259B6 (ja) 2014-08-08 2015-07-21 Hdr画像をエンコードする方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023141256A Pending JP2023162375A (ja) 2014-08-08 2023-08-31 Hdr画像をエンコードする方法及び装置

Country Status (8)

Country Link
US (1) US10362337B2 (ja)
EP (1) EP3178231A1 (ja)
JP (3) JP7053259B6 (ja)
KR (1) KR102209563B1 (ja)
CN (1) CN107005720B (ja)
MX (1) MX368411B (ja)
RU (1) RU2686642C2 (ja)
WO (1) WO2016020189A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2667034C2 (ru) 2014-05-28 2018-09-13 Конинклейке Филипс Н.В. Способы и устройства для кодирования hdr-изображений и способы и устройства для использования таких кодированных изображений
WO2016074999A1 (en) 2014-11-10 2016-05-19 Koninklijke Philips N.V. Method for encoding, video processor, method for decoding, video decoder
WO2017015564A1 (en) * 2015-07-22 2017-01-26 Arris Enterprises Llc System for coding high dynamic range and wide color gamut sequences
EP3142002A1 (en) * 2015-09-09 2017-03-15 Red.Com, Inc. Motion video output for multiple displays
JP2017151308A (ja) * 2016-02-25 2017-08-31 キヤノン株式会社 情報処理装置および情報処理方法
GB2549696A (en) * 2016-04-13 2017-11-01 Sony Corp Image processing method and apparatus, integrated circuitry and recording medium
JP6751233B2 (ja) * 2016-09-12 2020-09-02 オンキヨー株式会社 映像処理装置
US10218952B2 (en) 2016-11-28 2019-02-26 Microsoft Technology Licensing, Llc Architecture for rendering high dynamic range video on enhanced dynamic range display devices
JP6852411B2 (ja) * 2017-01-19 2021-03-31 ソニー株式会社 映像信号処理装置、映像信号処理方法およびプログラム
US10176561B2 (en) 2017-01-27 2019-01-08 Microsoft Technology Licensing, Llc Content-adaptive adjustments to tone mapping operations for high dynamic range content
US10104334B2 (en) 2017-01-27 2018-10-16 Microsoft Technology Licensing, Llc Content-adaptive adjustment of display device brightness levels when rendering high dynamic range content
EP3399497A1 (en) * 2017-05-05 2018-11-07 Koninklijke Philips N.V. Optimizing decoded high dynamic range image saturation
US10769817B2 (en) * 2017-08-07 2020-09-08 Samsung Display Co., Ltd. Measures for image testing
JP7084984B2 (ja) * 2017-09-06 2022-06-15 ドルビー ラボラトリーズ ライセンシング コーポレイション トーンカーブ最適化方法および関連するビデオエンコーダとビデオデコーダ
EP3477946A1 (en) * 2017-10-31 2019-05-01 Thomson Licensing Method and device for obtaining a second image from a first image when the dynamic range of the luminance of said first image is greater than the dynamic range of the luminance of said second image
US10856040B2 (en) * 2017-10-31 2020-12-01 Avago Technologies International Sales Pte. Limited Video rendering system
CN110019719B (zh) * 2017-12-15 2023-04-25 微软技术许可有限责任公司 基于断言的问答
EP3588964A1 (en) * 2018-06-26 2020-01-01 InterDigital VC Holdings, Inc. Metadata translation in hdr distribution
CN108933933B (zh) * 2018-07-05 2019-08-20 华为技术有限公司 一种视频信号处理方法及装置
CN108882028B (zh) * 2018-07-05 2019-06-14 华为技术有限公司 视频信号的处理方法及装置
EP3824633A1 (en) * 2018-07-20 2021-05-26 InterDigital VC Holdings, Inc. Method and apparatus for processing a medium dynamic range video signal in sl-hdr2 format
JP7157714B2 (ja) * 2018-09-03 2022-10-20 キヤノン株式会社 画像処理装置およびその制御方法
US11272195B2 (en) 2018-09-05 2022-03-08 Koninklijke Philips N.V. Multi-range HDR video coding
EP3621307A1 (en) 2018-09-05 2020-03-11 Koninklijke Philips N.V. Multi-range hdr video coding
CN111050143B (zh) 2018-10-11 2021-09-21 华为技术有限公司 一种图像拍摄方法和终端设备
US10957024B2 (en) 2018-10-30 2021-03-23 Microsoft Technology Licensing, Llc Real time tone mapping of high dynamic range image data at time of playback on a lower dynamic range display
CN109712703B (zh) * 2018-12-12 2023-08-25 上海牙典软件科技有限公司 一种基于机器学习的正畸预测方法及装置
CN109920056B (zh) * 2019-03-18 2023-08-01 阿波罗智联(北京)科技有限公司 建筑物渲染方法、装置、设备和介质
KR20200144775A (ko) 2019-06-19 2020-12-30 삼성전자주식회사 디스플레이장치 및 그 제어방법
CN112689138B (zh) * 2019-10-18 2022-08-26 华为技术有限公司 一种图像信号转换处理方法、装置及终端设备
JP7427423B2 (ja) * 2019-10-30 2024-02-05 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN112351264B (zh) * 2020-11-04 2023-05-23 深圳Tcl数字技术有限公司 显示精度调整方法、装置、终端设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140210847A1 (en) * 2011-09-27 2014-07-31 Koninklijke Philips N.V. Apparatus and method for dynamic range transforming of images

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8218625B2 (en) 2004-04-23 2012-07-10 Dolby Laboratories Licensing Corporation Encoding, decoding and representing high dynamic range images
WO2007082562A2 (en) * 2006-01-23 2007-07-26 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. High dynamic range codecs
RU2496252C2 (ru) * 2007-06-29 2013-10-20 Шарп Кабусики Кайся Устройство кодирования изображения, способ кодирования изображения, устройство декодирования изображения, способ декодирования изображения, программа и запоминающий носитель
CN102354489B (zh) * 2008-05-08 2014-01-22 香港应用科技研究院有限公司 增强图像动态范围的方法和装置
JP5899120B2 (ja) 2010-03-03 2016-04-06 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. カラーレジームを定義する装置及び方法
US8511770B2 (en) 2010-05-12 2013-08-20 Hewlett-Packard Development Company, L.P. Bi-directional color printing
EP2599316A4 (en) * 2010-07-26 2017-07-12 Associated Universities, Inc. Statistical word boundary detection in serialized data streams
RU2609760C2 (ru) * 2010-09-16 2017-02-02 Конинклейке Филипс Электроникс Н.В. Устройства и способы усовершенствованного кодирования изображений
JP5409577B2 (ja) * 2010-10-05 2014-02-05 株式会社ソニー・コンピュータエンタテインメント パノラマ画像生成装置およびパノラマ画像生成方法
EP2445214A1 (en) * 2010-10-19 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video coding using temporally coherent dynamic range mapping
US11049473B2 (en) * 2011-03-24 2021-06-29 Koninklijke Philips N.V. Apparatuses and methods for analyzing image gradings
TWI521973B (zh) 2011-04-15 2016-02-11 杜比實驗室特許公司 高動態範圍影像的編碼、解碼及表示
CN103891294B (zh) 2011-04-28 2017-09-01 皇家飞利浦有限公司 用于hdr图像编码和解码的装置与方法
JP5992997B2 (ja) * 2011-04-28 2016-09-14 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 映像符号化信号を発生する方法及び装置
JP6234920B2 (ja) * 2011-05-10 2017-11-22 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ハイダイナミックレンジ画像信号生成及び処理
MX353235B (es) * 2011-09-29 2018-01-08 Sharp Kk Star Dispositivo de decodificación de imágenes, método de decodificación de imágenes y dispositivo de codificación de imágenes.
US20140007911A1 (en) * 2012-07-05 2014-01-09 General Electric Company Heating element for a dishwashing appliance
EP2873237B1 (en) * 2012-07-13 2022-03-30 Koninklijke Philips N.V. Improved hdr image decoding methods and devices
EP2836983B1 (en) * 2012-10-08 2017-07-12 Koninklijke Philips N.V. Luminance changing image processing with color constraints
WO2015098315A1 (ja) * 2013-12-27 2015-07-02 ソニー株式会社 画像処理装置及び画像処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140210847A1 (en) * 2011-09-27 2014-07-31 Koninklijke Philips N.V. Apparatus and method for dynamic range transforming of images

Also Published As

Publication number Publication date
RU2686642C2 (ru) 2019-04-29
MX2017001710A (es) 2017-04-27
KR20170044129A (ko) 2017-04-24
JP7343629B2 (ja) 2023-09-12
RU2017107185A3 (ja) 2019-03-01
JP7053259B6 (ja) 2022-06-01
RU2017107185A (ru) 2018-09-10
EP3178231A1 (en) 2017-06-14
MX368411B (es) 2019-10-02
JP2017528971A (ja) 2017-09-28
KR102209563B1 (ko) 2021-02-02
CN107005720B (zh) 2020-03-06
US20170180759A1 (en) 2017-06-22
BR112017002313A2 (pt) 2018-01-16
JP2023162375A (ja) 2023-11-08
WO2016020189A1 (en) 2016-02-11
US10362337B2 (en) 2019-07-23
CN107005720A (zh) 2017-08-01
JP7053259B2 (ja) 2022-04-12

Similar Documents

Publication Publication Date Title
JP7343629B2 (ja) Hdr画像をエンコードする方法及び装置
JP6700322B2 (ja) 改善されたhdrイメージ符号化及び復号化方法、装置
JP6596125B2 (ja) Hdrイメージの符号化のためのコードマッピング関数を作成するための方法及び装置、並びに、かかる符号化イメージの使用のための方法及び装置
US11887285B2 (en) Encoding and decoding HDR videos
US10863201B2 (en) Optimizing high dynamic range images for particular displays
US10057600B2 (en) Brightness region-based apparatuses and methods for HDR image encoding and decoding
US10902567B2 (en) Handling multiple HDR image sources
CN107111980B (zh) 针对特定显示器优化高动态范围图像
CN109219961B (zh) 对hdr视频进行编码和解码的方法和装置
JP2019506817A (ja) 複数のhdr画像ソースの処理
EP3764346A1 (en) Adjustment of display optimization behaviour for hdr images
KR102279842B1 (ko) Hdr 이미지 인코딩 방법 및 장치
BR112017002313B1 (pt) Codificador para codificar um vídeo de entrada de alto alcance dinâmico, método para codificar um vídeo de entrada de alto alcance dinâmico, decodificador de vídeo para decodificar um vídeo de alto alcance dinâmico, decodificador de vídeo para decodificar um conjunto de imagens de vídeo de alto alcance dinâmico e método de decodificação de vídeo de um conjunto de imagens de vídeo de alto alcance dinâmico

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230831

R150 Certificate of patent or registration of utility model

Ref document number: 7343629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150