JP7300070B2 - 飽和色のための改善されたhdrカラー処理 - Google Patents

飽和色のための改善されたhdrカラー処理 Download PDF

Info

Publication number
JP7300070B2
JP7300070B2 JP2022550798A JP2022550798A JP7300070B2 JP 7300070 B2 JP7300070 B2 JP 7300070B2 JP 2022550798 A JP2022550798 A JP 2022550798A JP 2022550798 A JP2022550798 A JP 2022550798A JP 7300070 B2 JP7300070 B2 JP 7300070B2
Authority
JP
Japan
Prior art keywords
luma
pixels
pixel
lookup table
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022550798A
Other languages
English (en)
Other versions
JP2023504311A (ja
Inventor
ルトガー ナイランド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of JP2023504311A publication Critical patent/JP2023504311A/ja
Application granted granted Critical
Publication of JP7300070B2 publication Critical patent/JP7300070B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/77Circuits for processing the brightness signal and the chrominance signal relative to each other, e.g. adjusting the phase of the brightness signal relative to the colour signal, correcting differential gain or differential phase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/68Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Of Color Television Signals (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、特に画像が高度に飽和したピクセル色を含む場合における、入力画像からのピクセルの輝度の出力画像のピクセルの輝度への変更を含むダイナミックレンジ変換を実行するための方法及び装置に関する。
高ダイナミックレンジビデオ処理(コーディング、ディスプレイアダプテーション等)は極めて最近の技術分野であり、依然として幾つかの未解決の問題及び課題を有している。HDRテレビは数年前から販売されているが(通常、1000nit又はCd/m以下のピーク輝度として知られた最大表示可能輝度を備える)、純粋な表示より重要な技術(コンテンツ作成、コーディング、カラー処理)は、依然として、発明/改善及び展開すべき多くの解決策を有している。作成され、伝達された多くの映画、及び幾つかの初期の放送も存在し、また、一般的に結果は良好であるが、依然として特定の側面を更に改善する可能性も存在し、それ故、当該技術は、現在のところ、大きく解決された段階にはない。
高ダイナミックレンジ画像は、標準ダイナミックレンジ画像として知られている従来型(レガシ)低ダイナミックレンジ画像(20世紀の後半に生成及び表示されたもので、依然として、例えば地上波放送からインターネット等を介するyoutube(登録商標)ビデオ供給までの、何らかの技術を介してのテレビジョン又は映画配信等の、殆どのビデオ技術の主流である)と比較して、典型的に一層印象的な色を有する画像として定義され、このことは、これらが典型的に一層明るいピクセル(エンコードされ、且つ表示される)を有し得ることを意味する。
正式には、輝度ダイナミックレンジは、最小の黒(minimum black:MB)からピークの白又はピーク輝度(PB)までの全ての輝度の範囲(スパン)として定義でき、それ故に、原理的に非常に深い黒を伴うHDR映画を有することができる。実用的には、HDR画像は、主に唯一の値、すなわち一層高いピーク明度又はより正式には輝度(通常、これは、明るい爆発であろうと、又は単に一層実際的な金属及び宝石上の鏡面的反射スポット等であろうと、ユーザーが最も関心のあるものであり、実用的には最小の黒はSDR画像及びHDR画像に対し同じであると言える)に基づいて定義及び処理(例えば、カラー処理)することができる。
実際には、レガシ時代から、SDR画像の1000:1輝度ダイナミックレンジは100nit未満(及び0.1nit以上)であり、HDR画像は、通常、少なくとも5倍明るいPB、それ故、500nit又はそれ以上を有すると言える。より正確には、レガシのSDR画像は、明確な最大輝度を有さないが、約100nitの表示ピーク輝度(PB_D)のエンドユーザディスプレイ上に表示するであろう。そして、SDR画像は、新しいHDRフレームワークでは、正確に100nitに対応する最も明るいピクセルルーマ(輝度)を有すると再解釈できる。
ここでは不要であろう多くの詳細に入り込むことなく、何の種類のHDRを有するかを、ピーク輝度数をメタデータとして当該HDR画像に関連付けることにより示すことができることに注意されたい。これは、画像に存在する最も明るいピクセルの輝度、又は一層正確には画像のビデオ内の最も明るいコード化可能な画像ピクセルの輝度と見なすことができ、しばしば、正式には参照ディスプレイに当該画像に関連付けることにより定義される(すなわち、そのピークの明るさが当該画像又はビデオ内に存在する最も明るいピクセル、すなわち表示が必要な最も明るいピクセルに対応するようにして、仮想ディスプレイを画像に関連付け、次いで、当該仮想ディスプレイの該PB_C(Cはコーディング)を、画像ピクセルカラーマトリックスに追加するメタデータとしてコーディングする)。熟練した読者であれば、HDR画像のピーク輝度PB_Cのコーディングが何であれ、各ピクセル輝度をPB_Cで除算することにより正規化されたピクセル輝度を生成できることを理解できる。正規化されたルーマ(輝度)は、最も大きなコード、例えば10ビットでの1023等、で除算することによっても形成できる。
このようにして、HDR画像を過剰な量のビット(例えば、カラー成分あたり16ビット)で「無粋に」コーディングする必要はなく、カラー成分に対し10ビットワード長による既存の技術を単に再利用できる(12ビット以上は、少なくとも近い将来にとり、種々の理由で、全体のビデオ処理チェーンにおける幾つかの技術サプライヤにより既に相当に困難である見なされており、通常は、専門の非消費者のための使用のみが考慮されている。当該PB_Cメタデータは、将来のシナリオのためにHDRフレームワークを容易にアップグレードすることを可能にする)。
ピクセルカラーは、通常、Yがいわゆるルーマ成分(輝度のための技術コーディングである)であり、Cb及びCrが三色加法色定義を完成させる青及び赤のクロマ(色)成分として、常にYCbCrカラーとして伝達されると云うように、従来のビデオ技術から1つの側面が再利用された。
ルーマは、非線形R’G’B’カラー成分(プライム記号’は、カラー、言わば何れかの特定の色の表示されたピクセルから到来する赤、緑及び青のフォトンの量の線形RGB成分からの差を示す)から、及びY=a1*R’+a2*G’+a3*B’[式1]なる方程式を介して定義される。
上記3つの定数は、RGBカラーを定義する特定の原色に依存する(明らかに、赤の原色としての50%の非常に飽和した強い赤の混合により色を定義する場合、赤が微弱なピンクである原色の組における同じR=0.5;G=x;B=xカラー定義よりも一層赤みがかった色を得るであろう)。
実際に、これらの定数a1、a2、a3は、色を定義する原色毎に、式1における線形RGB成分を埋めた場合に正確な(絶対的な、又は通常はピークホワイトに対して1.0を有する相対的な)輝度を生じるような定数として固有に定義される。
非線形(プライム符号付き)成分は、光電伝達関数を適用することにより線形成分から導出される。HDRの場合、これは、ほぼ平方根(SDRのRec.709 OETF)よりも最も暗い線形入力成分に対して一層急峻な傾斜を持つ関数である(例えば、SMPTE2084で標準化された知覚量子化関数)。
LDRの時代には、ハイエンドのビデオではRec.709原色のみを使用していたため、あまり議論はなかったが、現在は、例えばRec.2020等の広色域原色も有している。
この場合、CbはCb=b1*(B’-Y)及びCr=c1*(R’-Y)から得られ、ここでも、b1及びc1は選択された原色システムから固定される定数である(1.0表現への正規化においてオーバーフローを生じないように)。
尋ねるべき第2の問題は、非線形R’G’B’が線形RGB成分に対してどの様に関係付けられるか(実際には、定義されるか)である。線形成分は、各々が加法的に作成されるべき色に対して容易に決定できる{少なくとも再現可能な色の色域内で、例えば、選択された原色の3つの色度位置の三角形の内側において(例えば、標準のCIE 1976u’v’色平面内において);原色は原則として自由に選択できるが、画像は市場における実際のディスプレイによっても表示できるような原色(すなわち、例えば単一波長レーザ原色ではない)で定義することに意味があることに注意されたい}。すなわち、これは基本的比色定量(測色)から得られる(如何なる色、例えばCIE XYZ又は色相、彩度、輝度等に対しても、平均的観察者に同じ色を示すために、そのような原色を持つ特定のディスプレイが表示すべき対応するメタメリック(条件等色的)RGB三つ組みを計算できる)。
コーディングシステムの定義、すなわちいわゆる電光(Electro-Optical)伝達関数、又は対応する線形成分から非線形成分を計算する、その逆の光電(Opto-Electrical)伝達関数、例えば:
R’=OETF_PQ(R) [式2]
は技術的な問題である。
OETFを赤、緑、青のピクセルカラー成分に適用しても、ルーマ及び輝度は同じOETFを介して関連していることを数学的に示すこともできることに注意されたい(無色の灰色はR=G=B及びR’=G’=B’なので、輝度L=(a1+a2+a3=1.0)*0.x及びルーマ度Y=1.0*OETF[0.x]=OETF[L]である)。
例えば、LDRの時代にはRec709 OETFしか存在せず、該OETF(本特許出願のために幾つかの無関係な詳細はショートカットする)はEOTFの逆関数であり、これは、かなり良い近似で、単純な平方根であった。
次いで、広い範囲のHDR輝度(例えば、1/10,000thnit~10,000nit)をわずか10ビットでコーディングする技術的課題(これは、平方根関数では不可能である)が出現した際、新たなEOTF、いわゆる知覚量子化器EOTF(US9077994)が発明された。
したがって、この異なるEOTFの定義、及びそれにより定義される如何なる入力YCbCr色も、YCbCr_Rec709であるか又はYCbCr_PQであるかに依存して明らかに異なる数値正規化成分を有するであろう(実際に、これを、R’G’B’立方体を、異なるルーマの無色の灰色のY軸が垂直線を形成するようにして、黒先端上で回転させることにより確認できる。この場合、種々の画像ピクセル色は、これらの同じ画像オブジェクトピクセル色が709ベースのカラー立方体又はPQベースのカラー立方体で表されているかに依存して、該垂直線に沿って異なる広がりを有する)。
YCbCr_PQコーディングのこの与えられた技術的事実は、本出願人がTechnicolorと一緒に作成したHDRコーデックと組み合わせると、新しい興味深い実験的事実につながる(国際特許出願公開第WO2017157977号及びETSI標準TS103433-2V1.1.1“High performace Single Layer High Dynamic Range [SLHDR], Part 2”、及び本出願において図1を参照して再要約したもの参照)。
図1は、YCbCr_PQで定義されたピクセルカラー入力画像(Im_1)を取り込むことができる我々のデコーダを示し、この場合、ピクセルはスキャンラインにおいてピクセル毎に処理されている。したがって、この画像は、例えばブルーレイディスクから、10,000nitのPQピーク輝度に対応するPQ正規化ルーマで到来し得る。例えばSDR画像にダウングレードするために必要な関数の形状は、例えば(限定するものではないが)当該ディスクの映画がトランスコードされている際に計算される、グレーダ、人間、又はオートマトンからのものであり得る。
処理回路の上側の経路(通常、集積回路上のハードウェアブロックであり、様々な構成であり得、例えば、輝度処理サブ回路101全体は、実際には、LUT、いわゆるP_LUTとして具体化され得る(知覚的に均一化されたルーマで動作する)のみならず、サブブロックも集積回路等の別個のトランジスタ計算エンジンとして具体化することができるが、これを、これらブロック内における、画像の見え、及び全ての可能性のある技術的な問題、特に以下で扱われる問題の両方に対して技術的利点を生じさせるものとして技術的に説明する必要がある)は、ピクセルカラーの輝度処理部分に関係する。これは、勿論、ダイナミックレンジ調整の最も興味深い部分である。例えば、1000nitPB_C HDR画像の入力から、600nit出力画像を計算する場合、種々の画像オブジェクトの正規化されたピクセルルーマをYCbCr色空間のY軸に沿って再配分する必要がある。すなわち、通常、当該画像の一層暗いピクセルルーマはY軸の一層明るい(正規化された)グレーに向かって上方にシフトし、これにより、一層明るいピクセルルーマをY軸の一層小さなサブ範囲内に圧縮する。図1の回路の下側部分は、特にピクセルの彩度の色処理を含む。入力画像及び出力画像において同じ色相を維持したいからであり、このことも、高品質のダイナミックレンジ変換のために十分に気を付けるべきであるからである。
この特定の解明実施形態において、出力ピクセルのカラーも、PQ OETF(又は技術的に正確であるためには逆EOTF)により非線形に定義され、例えば、そのような入力を期待するHDR TVに直接伝送可能な非線形R”、G”及びB”成分を生じる(正しいカラーマッピングされた、出願人のアプローチによれば再グレーディングされたカラーとして知られるものであるが)。
当該集積回路ユニットの幾つかは、固定曲線、行列乗算等を適用するという意味で静的である一方、幾つかのブロックは、それらの挙動を適応させることができるという意味で動的である。特に、これらは関数の形状、例えば、最も暗い入力に対してマッピング関数がどれだけ急激に上昇するか、及び最も明るい入力をどれだけ強く圧縮するかを、可能性として当該ビデオの連続する画像毎に適応させることができる。確かなことに、画像処理の問題は、常に、コンテンツのほぼ無限の変動性が存在することである(入力ビデオは、夜間に発生する強盗の暗いハリウッド映画、又はオンラインゲームを楽しんでいる誰かの明るく着色されたコンピューターグラフィックスを追跡するYouTube(登録商標)映画等であり得る。すなわち、当該コンテンツがプロ若しくは低品質のカメラにより自然のシーンから生成されたか、又はグラフィックスとして生成されたか等にかかわらず、入力(全てYCbCrとしてエンコードされているが)は、何らかの画像におけるピクセルの色及び明るさに関して大幅に変化し得る)。したがって、夜間のシーンは、最も暗い輝度、又は実際には入力画像Im_inのルーマに関して、太陽が降り注ぐビーチのシーン画像とは異なるマッピングを必要とし得る。
したがって、当該回路の幾つか(粗ダイナミックレンジ変換器112、カスタマイズ可能な変換器113、及びカラールックアップテーブル102)は、可変形状の関数を適用でき、該関数の形状は画像関連情報のソース199からのパラメータにより制御される。典型的に、このソースには画像(Im_in)及びメタデータ(MET)が供給され、後者は、これらのダイナミック回路が適用する種々のルーママッピング関数の形状を決定するパラメータを有する。この再等級付け関数のメタデータは、コンテンツ作成(エンコーダ)側から伝達でき、如何なるビデオ通信ネットワーク(ケーブル、インターネット等)を介しても伝達でき、デコーダ内の又は該デコーダに接続されたメモリに一時的に保存できる。該デコーダは、次いで、当該ビデオの作成者が指定したマッピングを適用できる。
画像内のピクセルカラーは、YCbCr_PQ、すなわち、3つ全てが知覚量子化器関数でエンコードされた非線形R’、G’及びB’成分として到来する。ルーマ成分は、輝度計算回路129が計算するように構成されたPQ EOTFを介して送られる(無彩色のグレイカラーに対し、これは問題なく行うことができる。これらのルーマコードは様々な正規化された輝度を一意的に表すからである)。
次いで、この正規化された輝度Lは知覚器111により物理視覚的に知覚的に均一化され、出力として知覚的に均一な輝度PYを生じる。これは、下記の式により実行される。
RHO(PB_C_HDR)=1+32*power[PB_C_HDR/10,000;1/(2.4)]
PY=log10[1+(RHO(PB_C_HDR)-1)*power[L;1/(2.4)]]/log10[RHO(PB_C_HDR)] [式3]
この知覚化において、HDR入力画像においてコード化可能な最大値、すなわち画像内で発生し得る(すなわち、表示されるべき)最大の(絶対)ピクセル輝度、PB_C_HDRへの依存性がわかり、これも、通常、メタデータ(MET)の一部として伝達され得る。実際に、これにより、特定の入力ピーク明るさから出力ピーク明るさへの、画像ピクセルルーマ及び最終的に、表示された場合の、輝度の既に十分に合理的な分布が得られるが、より高品質グレード画像を有するために、コンテンツ作成者(エンコード側)は、更に構成可能な回路(すなわち、112及び113)においてルーマの再マッピングを継続できる。
続いて、粗ダイナミックレンジ変換器112は、略良好なダイナミックレンジ低減関数を適用し、その形状は平方根として象徴的に示されている{出願人により有用であると認められた実際の関数は、間に放物線セグメントを伴う2つの線形セグメント(その傾斜(勾配)はメタデータにより構成可能である)からなり、関心のある読者は、これらの詳細を、本説明とは無関係であるため、SLHDR ETSI標準で見つけることができる}。この関数は、対応する粗ルーマCYを、画像スキャンに沿う現在処理されているピクセル組の入力された知覚的に均一な輝度PYから計算する。アイデアは、HDRの一層暗いピクセルを一層明るいピクセルと比較して相対的に明るくし、全体が一層小さなダイナミックレンジ内に収まるようにするというものであり、これは多くの状況に対して既に十分であろう。
続いて、カスタマイズ可能コンバータ113は、更に選択可能な(例えば、コンテンツ作成側においてRAWキャプチャビデオ又は映画を符号化するカラーグレーダ又はシェーダの制御下で決定され、次いで、この特定の画像又はビデオからの連続した画像の再グレーディングに最も適切したものである選択された関数をメタデータとして通知する)輝度マッピング関数を以前に取得した粗輝度CYに適応して、知覚出力ルーマPOを取得する。このマッピング関数の形状は自由に決定できる(例えば、輝度の部分組におけるコントラストを、画像内の何らかの重要なオブジェクト又は領域に対応して、該関数の当該部分を該関数の残部に関する傾向より上昇させることによりブーストできる)。
図示されているように、この関数はS字状関数であると、すなわち、上側及び下側入力輝度サブレンジでは相対的に弱い勾配(傾斜)を持ち、中間では急な傾斜を持つ関数であると仮定する(限定するものではない)。本発明は、カスタマイズ可能変換器113により適用されるS字状関数に限定されるものではなく、特に、入力ルーマの最も低いサブレンジ(例えば、0.0の入力値から開始し、ある値0.x、通常は0.5未満で終了する)に変化する傾斜の挙動が存在する全てのシナリオ、例えば、入力ルーマの最も低いサブレンジの一層明るいピクセルに対する傾斜と比較して、非常に暗いピクセルに対して相対的に低い傾斜又は平均傾斜を有するタイプにとり特に有効である。開始点(0.0,0.0)から定式化された傾斜を考慮することができる。
最後に、知覚出力ルーマPO{すなわち、現在の画像コンテンツが必要とするように完全に輝度が再グレーディングされている、すなわち、入力マスタHDR画像に対応する最高の再グレーディング画像を供給する(例えば、PB_C=100 nitで出力SDR画像として出力される)、例えば、低減されたダイナミックレンジが許す限り、明るさ及びコントラストをマスタHDR画像に有する視覚的インパクトに可能な限り近く見えるようにさせ、又は代わりに少なくともきちんと見える若しくは良く観察できる画像を生じさせる、等}は、リニアライザ114により、再び正規化された出力輝度L_outに線形化され、該リニアライザは式3の逆方程式を使用するが、ここではPB_C_OUT値を用いる。説明目的で、デコーダが入力HDR画像をSDR画像にダウングレードする、すなわち、PB_C_OUT=100nit(標準化で同意されているように)であると仮定するが、例えば、650nitのHDR出力画像等にダウングレードすることもできる(この場合、当該関数は幾らか異なる形状を有するであろうが、その表示適応の詳細も、本出願の新しい技術原理を理解するのに役立つものではなく、前記ETSI標準に見つけることができる)。
下側の経路は、色処理、言い換えると3D色処理における輝度処理に属する完成に関するものである(実際に、カラー画像に対する如何なる輝度処理も、色成分を注意深く処理するかどうかに関係なく、実際には3D色処理であるからである)。これは、グレーの軸上の無彩色に関するダイナミックレンジ変更動作よりも技術的に一層興味深いものになる箇所である。
ルーマが通常色の明るさを定量化する場合、Cr及びCbはその色相(Cb/Crの比率)及び彩度(Cb及びCrの大きさ)を定量化する。正式には、Cb及びCrはクロミナンスである。
その上、我々のコーデック処理回路はカラールックアップテーブル102を有し、該ルックアップテーブルは、選択された形状を持ち、ここでもメタデータにより構成可能なY_PQの関数を指定する。したがって、当該クロミナンスの処理は、両方のクロミナンスが同じ定数Bにより乗算されることにより定義され、この定数は全ての処理されたピクセルのルーマY_PQの関数であり、この関数の形状、すなわち全ての可能なY_PQに対するB(Y_PQ)の各値も設定可能である。
このLUTの主な目的は、変更された(ダイナミックレンジが調整された)正規化されたルーマYに対して、Cb及びCr成分の過度に多い又は過度に少ない量を少なくとも補正することである。実際に、Cb及びCrは、この色空間表現YCbCrにおけるルーマと共進化する(色の彩度は、実際に、Cb/Y及びCr/Yに関係する)が、画像の他の比色的(測色的)側面は、それと共に変更できる(例えば、明るい青空の彩度は調整することができる)からである。いずれの場合においても、少なくとも現在のビデオ画像をダイナミックレンジ処理するためにカラーLUT CL(Y_PQ)がロードされているとすると、カラールックアップテーブル102は、実行中/カラー処理中のピクセルのY_PQ値ごとに乗数Bを生成する。当該ピクセルの入力クロマ成分Cb_PQ及びCr_PQは、乗算器121により、この値Bにより乗算され、補正されたクロマ成分CbCr_CORを生じる。次に、行列化演算が行列化器122により適用され(その詳細は、ETSI標準に見られる)、正規化されたR’G’B’_norm成分を得る。これらの成分は、0.0~1.0の間の非線形カラー立方体内にあるという通常の意味では正規化されていないが、ダイナミックレンジがないという意味で正規化されている(全てが、通常のデュオの代わりにトリオとして、「色度」だけでクラスター化され、すなわち、如何なる輝度又はルーマも伴っていない)。したがって、実際の正しい3D色を取得するには、それらは、ルーマにより、正確には、前記上側のルーマ処理サブ回路で最適に決定したルーマにより乗算されねばならない。このためには、正規化された出力輝度L_outはPQOETFによりマッピングされることを要し、該PQOETFはPQOETF回路115が実行する。乗数123は、クロマチックサブ回路の出力である3つの正規化されたR’G’B_norm成分のこの正しい乗法スケーリングを行なう。
最後に、該知覚量子化器で定義された赤、緑及び青の色成分R”G”B”_PQを、斯様な入力を理解するように構成されたHDRディスプレイに直接送信でき、該ディスプレイは当該入力を直接表示できる(例えば、650nitのPB_C出力画像は、我々の技術により、650nitの実際のDISPLAYピーク輝度のPB_Dディスプレイを駆動するように最適化されたものであり得るので、このディスプレイは、供給された画像にエンコードされた輝度範囲と、その表示能力との間の差をどの様に処理するかを、自身で解決する必要はない)。ここでは、本技術的革新を説明するために、基本的なコア技術要素の動作を説明したことに注意されたい。ETSIにより標準化された実際のSLHDRデコーダには、黒リミッタ回路サブユニットも存在するが、これは本アプローチには必須ではないので、その説明にも必須ではない(黒リミッタは種々の実施形態に存在する場合と存在しない場合があるので、これについて該序論において議論することは、本質的な教示よりも当該メッセージの拡散を生じるであろうが、興味のある読者のために、図5にその変形を示す)。また、粗ダイナミックレンジ変換器112の粗いダイナミックレンジ変換は、幾つかの実施形態ではオプションであり得る、すなわち、該変換がアイデンティティ変換を行うように、その形状制御パラメータを設定し、カスタマイズ可能コンバータ113のカスタマイズ可能なマッピングのみを適用することもできることに注意されたい。例えば、接続されたディスプレイに対する出力又は当該画像の記憶が必ずしもPQ YCbCrである必要はない等の他の変更も存在し得るが、その複雑さも、解説している当該教示の核心にすることを思いとどまらせる。
種々の画像の該測色的最適化は、当該種々のユニットが全ての状況及びアプリケーション(オフライン等級映画コンテンツ対リアルタイム放送、等)に対し最適なアプローチを提供するように長年にわたって設計されたため少し複雑であるが、種々の技術的配慮及び制限を考慮すると、今や理解できると共に、多くの異なる入力画像の状況の殆どに対して十分に満足に機能する。
しかしながら、図2により説明されるように、カラーデコーディングを更に改善できる、幾つかの幾らか風変わりな状況が存在する。この問題は、教示される新しい技術要素で処理される。
図2のaは、垂直軸としてルーマYの代わりに正規化された輝度Lを使用する場合に形成できる理想的なYCbCr色空間を示している。この色空間は、以下のような意味で理想的である。或る色相の青色は、このひし形を経る三角形の垂直区域内に位置する。一層飽和した色は垂直から一層大きな角度を有するので、カラー201は同じ色相の青であるが余り飽和していない薄い青であり、カラー202は一層飽和した青である。これら両カラーは同一の輝度を有し得、このことは中央の縦軸の輝度スケールから容易に読み取ることができる(例えば、輝度レベルL1対L2)。両方の異なる色のピクセルが同一の輝度を有していることを検証できる。(ピクセル)カラー201及び(ピクセル)カラー202の輝度は同一、すなわち、L1であるからである。
比色的にユニークな輝度とは対照的に、ルーマは人間の視覚にとって決して完全な(使いやすい、均一な等)色表現になるように設計されたものではなく、色の三つ組みを例えば3x8ビット、又は近年ではHDRのために典型的に3x10ビット(この3x10ビットは、SDRより数倍明るいだけでなく、100倍までも明るく、更に大幅に暗いHDRをコード化できることに注意されたい)にコード化するのを容易にさせるシステムである。したがって、ルーマ及び特にYCbCrの色表現は、色処理のためではなく、主に(可逆)コーディングのために設計された。
このコーディングは、原理的に数学的に容易に反転可能であり、したがって、コーディングシステムが主たる特性として有するとされるように、受信されたYCbCrピクセルカラーコーディングから元々意図された(線形)RGB成分を常に再導出し、次いでこれらを表示できる。そして、輝度を導出することもできる。
しかしながら、現在のHDR時代のビデオのための(必要な)一層高度なデコーディングを開始する場合、幾つかの不便な問題が生じ得る。実際、図2のbに示されるように、有彩色(すなわち、縦軸上にあり、Cb=Cr=0の成分値を持つ純粋なグレーではない)に対し、輝度Yは、最早、ピクセル輝度(すなわち、元の線形RGBコンポーネントに式1を適用することから直ちに得られる輝度)を正しく又は一意的に符号化しない。すなわち、ルーマはL=EOTF(Y)を計算することにより輝度には変換できない。実際に、色の如何なる選択された固定の輝度値Lに対しても、該色の彩度(飽和度)Sが高いほど、対応する輝度Yは低くなる。実際に、図2のdに示されるような典型的な状況は、略同じ均一な照明であり、したがって当該花の全てのピクセルが略同一の輝度であるが、これらピクセルが異なる飽和度であるオブジェクト(例えば紫色の花)を有する場合、ルーマの正規化された水平軸上にマッピングされた場合のピクセル輝度205の締まった略単一値のヒストグラム205(垂直軸カウントN(L_in)に対応する)は、より低い正規化された(入力)値に位置されるのみならず、一層広げられた対応するルーマヒストグラム206(カウントN(PY))となるということである。正規化された(又は絶対)輝度を、ルーマ軸上の所与のOETFにより定義された位置にマッピングできる。無彩色ピクセルに対し、ルーマYは正規化された輝度に一意に対応することがわかっているからである(OETF形状で再マッピングすることにより:Y=“L_in”=OETF(ピクセル輝度))。
このことは、幾つかの問題を生じさせる。第1に、ルーマ値Yだけを調べることから、すなわちEOTFをYに適用することにより、何の輝度を有しているかは正確に分からず、このことは、3D測色を自然な3D態様では処理せず、図1のデコーダのように、実用的な理由で1D+2Dの態様で処理するフレームワークでは既に問題を生じさせ得る。確かに、理論的には、Cb及びCrのピクセルに対して特定の値の補正的依存性を取り入れれば、全てを正しく行うことができるが、このことは、幾つかの事前に設計されたカラー処理トポロジでは可能でないであろう。更に、理解されるように、実際に、入力画像は既に輝度ではなくピクセルルーマによりコード化されているので、(知覚的に均一化された)ルーマに対して輝度又は明るさの再グレーディング関数を適用している。したがって、少なくとも理論的には、何か間違ったことをしている可能性がある。
それにもかかわらず、このことは、通常は、(実際の)問題ではなく、多数の異なる種類の画像コンテンツにより過去数年にわたってテストされたように、実際的に技術を見ると、合理的な懸念となるほどの十分なエラーの大きさとは見られない。したがって、ほとんどの場合、図1の処理を実行するだけで全てうまくいくと言うことができ、たまたま出力画像が完全でない場合は、その問題は我慢するであろう。
しかし、状況の非常に特殊な組み合わせでは、以下に提示されるような、これは、一方においては、非常に飽和した色を有する場合に発生し得る(例えば、Rec.2020では、高度に飽和した色を作成できる。これらの色は、このような飽和された基準の原色では殆どの通常の画像色は一層不飽和のCbCr値を有するので、このことは通常は発生しないであろうが、少なくとも理論的には可能である)。他方においては、粗ダイナミックレンジコンバータ112の滑らかな粗輝度マッピング関数だけでなく、例えば続いての、カスタマイズ可能コンバータ113における、小さい入力ルーマCY(これらは、図2のdに示されるように、それらの輝度と比較して誤って低すぎ、更に、オブジェクト上の様々な点に対して潜在的に示差的に異なるであろう)に対応する出力PO値のための小さい値を有するS曲線等の、都合の悪い曲がりを有する何らかの一層高度な関数も適用することを選択する。すなわち、この全体的な処理によるオブジェクトに沿った出力色、特に輝度の変化は、問題があると見なされ得る。残念なことに、特許制度では実際のカラー画像を特許出願明細書に含めることは許容しないが、図2のcは、例えば飽和した紫色の花において見るであろうものを象徴化している。すなわち、当該花の特定の場所に暗い斑点203が存在し得るか、又は、該花では通常では見えない微細構造204が過度に見え得るが、これらは、入力画像にも実世界にもない。見栄えの良い花は、適度に滑らかに、又は少なくとも徐々に変化する輝度を伴うが、このような鋭く目立つ変化を伴わずに見え、該変化は、色処理されるはずの色の一部が、このような全体の輝度の再等級付け(グレーディング)が十分に大きく変化する点を超えてまたがる異なるPY値に等しくジャンプするためである。
図2のdにおいて、受信されるであろうピクセルの正規化された(色度依存性)ルーマ(PY)と、正規化された輝度(より正確には輝度-ルーマ、すなわち無彩色軸上で得られるルーマ、すなわちルーマPYのピクセルの正しい輝度)L_inとの間の差が、対応するルーマヒストグラム206及び輝度ヒストグラム205(Nは各値のカウントを示す)により示されている。単一のピクセルの場合、もちろん1つのルーマPY及び1つの対応する正しい輝度L_inが存在するであろうが、例えば前記花のような、特定の平均輝度及び飽和度のオブジェクトの複数のピクセルの広がりを示す。例えば、高彩度の紫色の花が均一に照明される場合、僅かな数の輝度値しか存在しないであろうが、当該花のピクセルには異なる色飽和度が存在し得るので、ルーマのヒストグラムは一層広がり得ることが分かる。いずれにせよ、これらは、輝度の1次表現に関して「正しくない」。以下に示すように、このことは、我々のSLHDRデコーディングアプローチにおいて処理エラーにつながり得、これは、逆修正される、具体的には教示され及び請求項に記載されるように逆修正されることを要するであろう。
理論的には、より優れた異なる3Dベースのデコーディングシステムを構築することだけを検討し、これは当該問題を容易に解決するかも知れないが、実際の技術的に制限された既に展開されているビデオエコシステム(個別の輝度処理と色処理を伴う)において、これは実際にはそれほど簡単にできない。いずれにせよ、最後の小さな不都合さ、特に飽和色度オブジェクトにおける何らかの不正確な輝度に対しても改善するために、そのようなエンコーダ及び対応するデコーダを有するとしても、変更できるものはそれほど多くなく、したがって、実際的な解決策を得ようとすることは、かなりの思考及び実験を伴い得る。
以下の先行技術文書が見付かっており、それらの僅かに触れる程度の不十分な重要性について簡単に説明する。
出願人の関心のある幾つかの背景的教示内容は以下の通りである。
文献EP3496028は、出願人のピクセルパイプラインをエンコード又はデコードする基本的なルーマ処理及び並列クロミナンス処理の他の改善を教示している。すなわち、特定のルーママッピングの下で、一部の出力カラー、特にそれらのルーマは、コード化可能な色域の上限を超える場合がある。したがって、これらを色域内に維持して、好ましくは暗い色を過度に悩ますことがないような戦略が必要とされる。このために、ルーマの3D色域内の最も高い領域内へのルーマの特定のマッピングが教示される。一部のルーマダウンマッピングは、飽和度の低下ために交換され得、ダウンマッピングを過度に要するが、必要なルーマダウンマップの特定の割合に対してニュートラルグレーの軸に向かってマッピングすることもでき、これにより、最も明るい色を幾らか飽和させないようにする。いずれにせよ、これは、本発明におけるようにG_PQ計算により、また色域の別の範囲における異なる色の問題についても起こらない。
国際特許出願公開第WO2017/157977号は、画像内の最も暗いルーマの特定のルーマ処理に関係している。例えば、ビデオコンテンツの作成者は、一部の暗いピクセルに過度に深い一次マスタHDR画像から二次画像の色を決定できるようにしたい場合があり、これは、デコードのための逆ルーママッピングの品質に影響を与え得る。このために、2つの代替的ルーママッピングの並列戦略が教示され、該戦略において、コンテンツ作成者の問題のある望ましいルーママッピング曲線に対して、2番目の一層安全なルーママッピングが開始できる。クロミナンスマッピングの標準的な手段に単に言及する以外、該発明は、本出願におけるようにクロミナンスマッピングの特定の詳細には関係していない。
米国特許出願公開第2018/0005356号は、間に放物線状の滑らかなマッピングを備えた、HDRピクセルルーマの最も暗いサブ範囲及び最も明るいサブ範囲のための構成可能な線形傾斜を使用した特定の略良好なルーママッピングに関するものである。該ルーママッピングは、我々のアプローチのルーマ処理経路に適用され又は適用されなくても良いが、カラーLUTを使用したクロミナンス処理についての教示ではない。
本発明の目的は、上述された種々の問題を解決することである。
まれにしか発生しない画像ピクセルカラーに対するSLHDRシステムの残存する問題は、第1の最大ピクセル輝度(PB_C1)の高ダイナミックレンジ画像(IM_HDR)を、一層低いダイナミックレンジ及び対応する一層低い第2の最大ピクセル輝度(PB_C2)の第2の画像(Im_LWRDR)と共にエンコードするように構成された高ダイナミックレンジビデオエンコード回路(300)により軽減でき、
前記第2の画像は、デコーダが前記高ダイナミックレンジ画像のピクセルルーマ(Y_PQ)に適用して前記第2の画像の対応するピクセルルーマ(PO)を得るためのルーママッピング関数(400)として機能的にエンコードされ、
当該エンコーダ(エンコード回路)は、ビデオ通信媒体(399)に前記高ダイナミックレンジ画像及び前記ルーママッピング関数(400)をエンコードするメタデータ(MET)を出力するように構成されたデータフォーマッタ(304)を有し、
前記第2の画像の前記機能的なエンコードは、前記高ダイナミックレンジ画像の前記ピクセルルーマの全ての可能な値に対する乗数定数(B)をエンコードするカラールックアップテーブル(CL(Y_PQ))にも基づくものである一方、これら乗数定数は前記ピクセルのクロミナンス(Cb、Cr)による乗算のためのものであり、前記フォーマッタは該カラールックアップテーブルを前記メタデータにおいて出力するように構成され、
特徴として、当該高ダイナミックレンジビデオエンコード回路は:
- 前記高ダイナミックレンジ画像(IM_HDR)における各々がルーマ及び2つのクロミナンスを有するピクセルを受信し、各ピクセルに対してルーマ利得値(G_PQ)を決定するように構成された利得決定回路(302)であって、該ルーマ利得値は、各ピクセルの前記ルーマの正規化された輝度に等しいルーマに関する第1の出力ルーマの、当該ピクセルの前記ルーマに関する第2の出力ルーマにより除算された比を定量化し、前記第1の出力ルーマは前記ルーママッピング関数を前記正規化された輝度に適用することにより得られ、前記第2の出力ルーマが前記ルーママッピング関数を前記ピクセルのルーマに適用することにより得られる、利得決定回路;
を有し、
当該高ダイナミックレンジビデオエンコード回路は、前記カラールックアップテーブル(CL(Y_PQ))を前記高ダイナミックレンジ画像に存在するピクセルの種々のルーマに関する前記ルーマ利得値の値に基づいて決定するように構成されたカラールックアップテーブル決定回路(303)を有し、前記ルーマ(Y_PQ)の前記可能な値の少なくとも部分組からのルーマに関する前記乗数定数(B)の値は、これらのルーマに関して決定された前記ルーマ利得(G_PQ)の値と相関する。
明確にするために、このエンコード回路は、HDR画像を単に伝達するだけでなく、典型的には一層低いダイナミックレンジの、通常はPB_C_SDR=100nitの標準ダイナミックレンジの、少なくとも対応する二次グレードの画像も伝達する。これにより、受信者が、受信側のディスプレイ(PB_D)のピーク輝度能力をはるかに超えるピーク輝度PB_Cの高品質HDR画像(IM_HDR)を受信する場合に、輝度マッピング的に何をすべきかを推測する必要がないことが保証される。実際に、当該ルーママッピング関数によれば、コンテンツ作成者、例えば該作成者のカラーグレーダは、自身の望みにしたがって、受信者が入力HDR画像における全ての輝度を対応するSDR輝度にどの様にマッピングすべきかを具体的に決定できる(例えば、暗い洞窟内の影の領域はSDR画像でも十分に明るく維持されるべきであり、そこに隠れているナイフを持った男性が依然として十分に見え、過度に目立たないが、ほとんど見えなくもないようにする)。各画像(又は時間的に連続する複数の画像)に関して少なくとも1つのルーママッピング関数(400)を伝達することにより、読者は、この関数を使用して、各入力ピクセルルーマに対し、1つの対応する出力ルーマ(又は、対応するEOTFによる、当該ルーママッピングが指定された任意のルーマコーディングシステムからの線形化後の輝度)を計算できることを理解するであろう。すなわち、例えば入力ピクセルは2000nitのPB_Cグレードでエンコードされた画像(該エンコードは、通常は少なくともYCbCrへのマッピングを含む)からのものであり、出力ピクセルはSDR画像ピクセルである(通常、当該関数が何の種類の画像に関連するかを指定するメタデータが存在することに注意すべきであり、これは、SLHDRによれば、これは、通常、少なくともHDR画像のPB_C_HDR、すなわち2000nitであろう)。実際に、これら2つの参照グレーディングを伝達することにより、受信側は、コンテンツ作成者から受信されたルーママッピング関数から他のルーママッピング関数を指定することを含むディスプレイ適応化又はディスプレイチューニングと呼ばれるプロセスにより(ETSI標準を参照)、100nitとPB_C_HDRとの間のPB_Cで画像を作成することも理解するであろう。しかしながら、これらの詳細は本説明にはあまり関係がない。以下で解説される原理は、必要な変更を加えて機能するからである。すなわち、前記メタデータは、二次の異なるダイナミックレンジ(通常はSDR)の画像を機能的に同時エンコードするために必要な唯一の情報である。受信者は、メタデータで同時伝達される前記関数を、実際に受信されたYCbCrのピクセルカラーマトリクス画像、IM_HDRに適用することにより、そのピクセルカラーを計算できるからである。
発明者は、最初のステップとして、ルーマ値が特定の色度に関して色度軸上の値と比較してどの程度多く下方に移動しているかを定量化するルーマ利得値(G_PQ)をPQドメインで計算できる(すなわち、そこでは、現在のカラーの輝度を、その無色ルーマ値にPQ EOTFを適用することにより一意に決定できる)。クロマ色は、ゼロに設定されたクロマを有するような対応するグレー色と同じ輝度及び無色軸上で読み取れる輝度-ルーマを有するはずであるからである(図2のb参照)。
発明者は、更に、この同じルーマ利得値をピクセルのクロマに適用することにより、非常に満足のいく結果が達成できることを実験的に理解した。これは、色に対して幾らかの飽和度誤差を生じ得るが、該誤差は元の輝度誤差よりもはるかに目立たず、実際には、このような高い色飽和度のオブジェクトの問題を有する画像にとっては許容できる。
相関とは、Y_PQの可能な値(通常は、正規化されている。すなわち、カラーLUTエントリの数、又はルーマエントリの数に対応して、幾らかの精度ステップで0から1の間に入る)の何れかの特定の値に対するルーマ利得値の散在する値を見た場合、カラーLUT内の当該位置のBの値は、G_PQ値が位置する場所とほぼ同一であろう。種々のアルゴリズムにより、カラーLUTの形状、すなわちY_PQの関数としてのBの変数値の関数(B[Y_PQ])が、どの程度おおよそ、G_PQ値の分散したクラウドと空間的に一緒に並ぶかを決定できる。例えば、一方において、画像のピクセルの(幾何学的な)部分組並びにそれらに対応するY_PQ及びG_PQ値のみを散布図に寄与させることができ(例えば、画像の特に何処で図2のcで説明したタイプの重大なアーチファクトが生じるかの検出器が存在し得、これらのピクセルのみが寄与する一方、他のピクセルは破棄できる)、又はエンコード側において貢献するピクセルの選択が、これも人間のコンテンツ作成者により決定できる。他方において、この手段により全体のカラーLUT形状を決定することは必要ではなく、例えば、下半分[0、0.5]であるルーマの部分組、又はかなりの量の散乱が発生する場所に対してのみ決定でき、他の半分は、他のアルゴリズムにより決定され(例えば、固定され)得る。変更されるルーマの部分組は、全てのピクセルが使用されない場合、寄与するピクセルの幾何学的部分組に関連され得る。デコーダ側では、カラーLUTの決定は、元々同時伝達されたカラーLUTからの逸脱に対応し得るので、前記相関は、この元々のカラーLUTも考慮に入れることができる。すなわち、出力画像を得るために全ての入力HDR画像ピクセルに適用されるべき最終的に決定されたLUTは、例えば、(Y、PQ、G_PQ)点のクラウド内の平均位置から逸脱し得る。前記決定は、クロミナンスの或る部分組に制限される場合もあり、その場合、他の適切に機能する補正されたカラーLUTを得る。
クロミナンスは、時には、クロマとも呼ばれる。任意のルーマに対応する(正しい)輝度は計算できるのみならず、ルーマの範囲に配置することもできる。両者は1.0に正規化されるからである。
エンコーダの場合、良好に機能するカラーLUTは、通常、受信側のデコーダに対して単純に適用するために伝達される。コンテンツ作成者は、例えば、自身の側における1以上のディスプレイについて当該補正が十分に機能するかをチェックできる。
高ダイナミックレンジビデオエンコード回路(300)の有用な実施形態はカラールックアップテーブル決定回路(303)を有し、該回路はカラールックアップテーブルの値をルーマ利得値(G_PQ)の値、対、高ダイナミックレンジ画像ピクセルルーマ(Y_PQ)の対応する値の散布図を要約する最良の当てはめ(ベストフィッティング)関数に基づいて決定する。幾つかのフィッティングを等しく適用することができ、例えば(Y_PQ、G_PQ)点の点クラウドのほぼ中央を通過する関数は十分に機能するであろう。同じ革新的原理に従って他の関数を設計することができ、例えば、デコーダが色相分類メカニズムを有する場合、異なる色相領域のための異なる関数を設計できる。
有利には、当該高ダイナミックレンジビデオエンコード回路(300)は、更に、知覚傾斜利得(SG_PU)を計算するように構成された知覚傾斜利得決定回路(301)を有し、該知覚傾斜利得は、水平方向の高ダイナミックレンジの画像ルーマ(PY)及び垂直方向の出力画像ルーマ(PO)の知覚的に均一化されたルーマの座標系において、前記高ダイナミックレンジ画像ピクセルに対応する正規化された輝度(Y1)の位置に等しくする入力ルーマ(L_e1)に前記ルーママッピング関数(400)を適用することにより得られる出力ルーマ(L_o1)の前記入力ルーマ(L_e1)により除算された除算に対応し、前記高ダイナミックレンジ画像ピクセル(Y1)により乗算された、前記高ダイナミックレンジ画像ピクセル(Y1)のための補正された出力ルーマ(Y_corr1)に到達するために、前記ルーママッピング関数(400)を前記高ダイナミックレンジ画像ピクセルのルーマ(Y1)に適用する際に得られる出力ルーマ(Y_o1)のパーセント増加に対応する。これは、対応する正しい輝度入力及び出力点から(0,0)点まで線を描くことによって、過度に暗いルーマカラーに、有するであろうものと少なくとも同一の傾斜を付与することにより、非線形ルーママッピング関数の修正された動作を線形化する方法である。
当該補正の原理は、高ダイナミックレンジのビデオデコード回路(700)においても具現化でき、
該ビデオデコード回路は、第1の最大ピクセル輝度(PB_C1)を有する高ダイナミックレンジ画像(IM_HDR)を、一層低いダイナミックレンジ及び対応する一層低い第2の最大ピクセル輝度(PB_C2)の第2の画像(Im_LWRDR)にカラーマッピングするように構成され、前記高ダイナミックレンジ画像(IM_HDR)のピクセルのルーマ(Y_PQ)をルーママッピング関数(400)でマッピングするように構成されたルーママッピング回路(101)と、各ピクセルルーマ(Y_PQ)に関する乗数値(B)を、前記高ダイナミックレンジ画像(IM_HDR)のピクセルのクロミナンス成分(CbCr_PQ)を前記乗算値(B)により乗算する乗算器(121)に出力するように構成されたルックアップテーブル(102)を有するカラーマッピング回路と、を有し、特徴として、当該ビデオデコード回路は:
- 前記高ダイナミックレンジ画像の一群のピクセルにおける各ピクセルに関して、当該ピクセルのルーマ(Y_PQ)の正規化された輝度に等しいルーマに関する出力ルーマの、当該ピクセルのルーマ(Y_PQ)に関する出力ルーマにより除算された比を定量化するルーマ利得値(G_PQ)を決定するように構成された利得決定回路(302);及び
- 種々の入力ルーマ値に対する出力として乗数定数(B)を指定する前記ルックアップテーブルのためのカラールックアップテーブルを決定するように構成されたカラールックアップテーブル決定回路(303)であって、前記ルーマ(Y_PQ)の可能な値の少なくとも部分組の乗数定数(B)の少なくとも部分組の値が、これらルーマに関する前記ルーマ利得値(G_PQ)に基づいて決定される、カラールックアップテーブル決定回路;
を有する。
エンコーダが何らかの理由で同時伝達されるCL(Y_PQ)LUTにおいてエラー軽減を実行しなかった場合、同じ原理をデコーダで適用できる。このために、デコーダは、受信されたYCrCb_PQカラーから、対応する輝度及び輝度-ルーマを計算するであろう。該デコードは、次いで、受信されたHDR画像を、異なるダイナミックレンジの何れかの機能的に同時エンコードされた二次画像、例えばSDR 100nitPB_C_SDR画像にデコードできる。該デコーダは、同じ新しい技術要素を使用して、SLHDRデコーダのカラー処理回路の対応するLUT 102に、適切なルーマ誤差軽減CL(Y_PQ)ルックアップテーブルを入力する。
有用なものは、高ダイナミックレンジビデオをエンコードする方法でもあり、該方法は、第1の最大ピクセル輝度(PB_C1)の高ダイナミックレンジ画像(IM_HDR)を、一層低いダイナミックレンジ及び対応する一層低い第2の最大ピクセル輝度(PB_C2)の第2の画像(Im_LWRDR)と共にエンコードするように構成され、
前記第2の画像は、デコーダが高ダイナミックレンジ画像のピクセルルーマ(Y_PQ)に適用して前記第2の画像の対応するピクセルルーマ(PO)を得るためのルーママッピング関数(400)として機能的にエンコードされ、
ビデオ通信媒体(399)に、前記高ダイナミックレンジ画像及び前記ルーママッピング関数(400)をエンコードするメタデータ(MET)を出力するステップを有し、
前記第2の画像の前記機能的なエンコードは、前記高ダイナミックレンジ画像の前記ピクセルルーマの全ての可能な値に対する乗数定数(B)をエンコードするカラールックアップテーブル(CL(Y_PQ))にも基づくものである一方、これら乗数定数は前記ピクセルのクロミナンス(Cb、Cr)による乗算のためのものであり、前記カラールックアップテーブルも前記メタデータにおいて出力され、
特徴として、当該高ダイナミックレンジビデオをエンコードする方法は:
- 各ピクセルがルーマ及び2つのクロミナンスを有する前記高ダイナミックレンジ画像(IM_HDR)のピクセルを受信すると共に、各ピクセルに対してルーマ利得値(G_PQ)を決定するステップであって、該ルーマ利得値は、各ピクセルのルーマの正規化された輝度に等しいルーマに関する第1の出力ルーマの、該ピクセルのルーマに関する第2の出力ルーマにより除算された比を定量化し、前記第1の出力ルーマは前記正規化された輝度に前記ルーママッピング関数を適用することにより得られ、前記第2の出力ルーマが前記ピクセルのルーマに前記ルーママッピング関数を適用することにより得られる、ステップ;
を有し、
当該高ダイナミックレンジビデオをエンコードする方法は、前記高ダイナミックレンジ画像に存在するピクセルの種々のルーマに対する前記ルーマ利得値の値に基づいてカラールックアップテーブル(CL(Y_PQ))を決定するステップを有し、前記ルーマ(Y_PQ)の可能な値の少なくとも部分組からのルーマに対する前記乗数定数(B)の値は、これらルーマに対する前記決定されたルーマ利得(G_PQ)の値と相関する。
有用なものは、第1の最大ピクセル輝度(PB_C1)を有する高ダイナミックレンジ画像(IM_HDR)を、一層低いダイナミックレンジ及び対応する一層低い第2の最大ピクセル輝度(PB_C2)の第2の画像(Im_LWRDR)にカラーマッピングするための、高ダイナミックレンジビデオをデコードする方法でもあり、該方法は、前記高ダイナミックレンジ画像(IM_HDR)のピクセルのルーマ(Y_PQ)をルーママッピング関数(400)でマッピングして、該関数の出力として前記第2の画像のルーマを得ることにより該第2の画像を形成するステップを有し、
前記カラーマッピングは、更に、前記高ダイナミックレンジ画像(IM_HDR)のピクセルのクロミナンス成分(CbCr_PQ)を乗数値(B)により乗算することにより前記第2の画像のクロミナンスを得るステップを有し、
前記乗数値(B)は、ルックアップテーブル(102)において前記高ダイナミックレンジ画像(IM_HDR)のピクセルのルーマ(Y_PQ)の種々の値に関して指定され、
特徴として、当該ビデオをデコードする方法は:
- 前記高ダイナミックレンジ画像の一連のピクセルの各ピクセルについて、当該ピクセルのルーマ(Y_PQ)の正規化された輝度に等しいルーマに関する出力ルーマの、当該ピクセルのルーマ(Y_PQ)に関する出力ルーマにより除算された比を定量化するルーマ利得値(G_PQ)を決定するステップ;及び
- 前記ルーマ(Y_PQ)の可能な値の少なくとも部分組の前記乗数値(B)の少なくとも部分組の値を、これらルーマに関するルーマ利得(G_PQ)の値に基づいて計算することにより前記カラールックアップテーブルを決定するステップ;
を有する。
本新規な技術は、ビデオコンテンツ作成者が問題のあるルーママッピングを行う場合に、他の状況では問題を引き起こさずに、改善された再グレーディングされた、すなわち、特に一層低いピーク輝度の画像のためにダウンマッピングされた画像を可能にする。前記計算されるG_PQ値は、主に、カラーLUTのY_PQ依存性出力として定義されたB定数の値を、G_PQ計算から得られる値と相関させることにより、クロマ経路における追加の飽和色処理として実施できる。すなわち、Y_PQ当たりの単一のB値は、エンコーダ又はデコーダにおける共配置の事前に設計された尺度により、G_PQ値の分散の位置にほぼ従う。
本発明による方法及び装置の上記及び他の態様は、以下に説明する構成及び実施形態並びに添付図面から明らかとなり、これらを参照して解明されるであろう。尚、添付図面は、より一般的な概念を例示する非限定的な特定の図示として単に役立つものであり、破線及び点線は構成要素がオプションであることを示すために使用され、破線でない構成要素はは必ずしも必須ではない。破線又は点線は、必須であると説明されているがオブジェクトの内部に隠されている要素を示すため、又は例えばオブジェクト/領域の選択(及び、それらがディスプレイ上でどのように示され得るか)等の無形のもののために使用され得る。
図1は、ETSI TS 103 433-2 V1.1.1で標準化された、いわゆる単層HDR画像デコーダ(SLHDR)による出願人のHDR画像デコーダを概略的に示している。エンコーダは、通常、可能性としてマッピング関数の形状が調整された、対応するデコーダと同じ画像処理回路のトポロジを有し得ることに注意されたい(デコーディングは、エンコーダがデコーダにより適用されるべきダウングレーディング関数をどの様に決定するかと同じダウングレーディング方向で進むので、凸状等の形状の側面は、エンコーディング及びデコーディングに対し同一であり得るが、どの出力ピーク輝度に当該ルーマをマッピングしたいかに依存して、共同通知された例えば1/7乗のルーママッピング関数は、デコーダにおいて1/4乗で適用され得る)。 図2は、このSLHDRデコーダ(又は対応するエンコーダ)にルーマが使用される、高度に色が飽和されたオブジェクトを含む風変わりな画像に対して発生し得る幾つかの問題を概略的に示す。 図3は、本新規原理によるSLHDR符号化を行うための新たな方法、及び対応するHDRビデオエンコーダ300を概略的に示し、特に、クロミナンスによる乗算のための定数Bを決定するためのカラーLUTを決定するための、例えば図1に類似するエンコーダトポロジの一部を示す。 図4は、発明者により想定されるように本発明のアプローチを具体化できる幾つかの原理、特に、本発明の原理による知覚傾斜利得決定回路301の実施形態の内部機能を概略的に示す。 図5は、利得決定回路302の実施形態がどのように機能するかを、すなわち、図示された全ルーマ処理回路の少なくとも幾つかを介して2回、乗算器401に対する異なる乗数定数でピクセルカラーを送ることにより機能するかを概略的に示している。 図6は、カラールックアップテーブル決定回路303が、回路302により入力HDR画像におけるピクセルに対して計算された種々の(Y_PQ、G_PQ)値から、LUT102にロードされるべき各Y_PQ値のためのB乗数をコード化する関数をどのように決定できるかを概略的に示す(LUTを決定する他の方法が存在する)。 図7は、SLHDRコード化HDRビデオデータの受信側において、エンコーダ300と同じ革新的処理を適用するように構成されたHDRビデオデコーダ700を概略的に示す。 図8は、本技術の典型的な配備、すなわち、リアルタイムなテレビ放送及び受信における装置を示す(同じ原理は、他のビデオ通信技術、例えば、非リアルタイムデジタル映画の制作及びグレーディング、ならびにその後の映画館への通信等においても使用できる)。
図3は、SLHDRHDRビデオエンコーディングアプローチに準拠した修正されたエンコーダが、どのように機能するかを示している。エンコード側において、入力として、元のマスタHDR画像(例えば、洞窟内の明るい爆発及び暗い影の領域等の種々のビデオ画像内の全てのオブジェクトが最適に見えるように、人のカラーグレーダによりグレーディングされた5000nitのPB_C画像)が利用可能であり、したがって、ピクセル輝度(L)及び対応するルーマ(Y)の両方が利用可能である。ルーママッピング関数決定回路350が含まれ(又は接続され)、該回路は、例えば図4に示され、図4を参照して説明された最適な例えばS字状のルーママッピング曲線(すなわち、図1の回路113の)決定できる。このS字状のマッピング関数を使用して原理を説明するが、当該処理は関数に関係なく一般的であることに注意されたい(該処理は、改善されない状況でも機能でき、悪化もさせない)。出願人により開発された種々の実施形態によりこれを行うことができる多くの方法について詳しく説明する必要はなく、例えば、これを、マスタHDR入力画像(最終的にIM_HDRとして受信機に伝達される)に存在するルーマを分析し、このようなルーマの分布に対する最適な関数(S字曲線等)を決定するオートマトンにより実行でき、又は、エンコーディング装置の他の物理的実施形態において、これは、人のカラーグレーダによる着色コンソールのようなユーザーインターフェースを介して構成できる。ルーママッピング関数決定回路350からの3つの矢印は、決定されたルーママッピング関数400を、他の各回路に伝達する。例えば、これは、典型的な動作実施形態が図4で教示される知覚傾斜利得決定回路301により使用されるであろう。典型的な実施形態は、式3により定義されるフィリップス知覚ドメインで動作し得るが、これは我々の革新の必要な要素ではなく、幾つかの実施形態においてはPQ利得で直接定式化できるので、回路301はオプションを示す点線で描かれている。最終的に、データフォーマッタ304が、マスタHDR画像に基づいて少なくとも2つの異なるグレードの画像(これらのうちの1つは、ピクセルカラーの実際の画像、IM_HDR、例えば、MPEG又は例えばAV1等の同様のビデオコーディング標準におけるように圧縮されたDCTとして通信される)を符号化する全てのデータを受信機へ伝達するであろう。すなわち、該フォーマッタは、任意のビデオ通信媒体399(例えば、シリアルデジタルインターフェース(SDI)ケーブル又はHDMI(登録商標)ケーブル等の有線接続、インターネットケーブル、例えば地上放送チャンネル等の無線データ接続、ブルーレイディスク等のビデオデータを送信するための物理媒体等)に対して、マスタHDR画像のエンコードされて通常は圧縮されたバージョン、すなわち高ダイナミックレンジ画像IM_HDR、受信機が適用する(異なる、通常は低いピーク輝度に再グレーディングする場合)ための少なくとも1つのルーママッピング関数、及びカラールックアップテーブル(CL_(Y_PQ))を、後者の2つはメタデータ(MET)として出力し、これらは、例えばSEIメッセージである使用されるビデオ通信プロトコルに依存する。上記カラールックアップテーブルは、(ピクセルの)ルックアップ位置Y_PQごとに、任意のピクセルの2つのクロミナンス値Cb及びCrにより乗算するための値Bを供給するよう機能する。
図4は、この場合はSDR出力ルーマを得るために、HDR入力ルーマ(SLHDRルーママッピングが指定される知覚的に均一化されたドメインで表される)に適用されるマッピングを示している。上記知覚的に均一化されたルーマは正規化される。すなわち、縦軸上の値1.0はSDRのピーク輝度PB_C2=100nitに対応し、横軸において、該1.0は、この例では、高ダイナミックレンジ画像(IM_HDR)の1000nitのマスタHDR画像のピーク輝度PB_C1に対応する。これは、ルーママッピングを記述するための有用な方法であり、例えば、人のカラーグレーダに、マッピングが元々輝度ドメインで指定される場合よりも、一層良好な制御を提供する(熟練した読者であれば、軸を異なる方法で定量化した場合、何れかのルーママッピング関数の形状のみが予測可能な態様で変化するであろうと理解する)。この説明例においては、粗ダイナミックレンジコンバータ112の粗いルーママッピングをスキップしており(我々のコーデックは、図5に示された白/黒伸張及び利得制限等の他の処理も許容する)、当該ルーママッピングは完全に該S字曲線からなっている(このような曲線は、例えば、かなり明るいシーンが存在し、該シーンのうちの一層暗い部分でコントラスト伸張を行いたく、これが出力SDR画像の見栄えを良くしたい場合に発生し得る)。
ルーマY1を有する特定のピクセルの色、例えば飽和したマゼンタ色に注目しよう。このルーマがルーママッピング曲線400によりマッピングされた場合、出力ルーマY_o1が生じる(同様に、入力ルーマY2を有する他のピクセルについても、同様である)。これは、相対的に暗い出力結果であり得る(知覚的に均一化された軸は本質的に幾らか対数的であることに留意する必要があるからである)。ルーマ、又は、技術的にもっと正確には、輝度に一意に対応するルーマ(又は横軸上の位置)L_e1の代わりに「輝度」をマッピングすべきだった場合(これは、エンコーダ側における正確な輝度-ルーマ[OETFを介して輝度に一意に対応するルーマである]であり得る。エンコーダは全ての情報を利用できるためである)、実際に何が一層良くなければならなかったかは、L_o1の、すなわちY_o1よりも明るい出力ルーマを得るであろうということである。すなわち、このL_e1は、当該ルーマ表現(例えばPQ、又はPhilipsの知覚的に均一化されたルーマの)に強い輝度の漏れがなかった場合に、この画像オブジェクトのこのカラフルなピクセルが実際のルーマY1の代わりに有すべきだったルーマ軸の値である。
実際、無色グレーの場合、当該軸上には色度依存性ルーマ損失は存在せず、EOTF(luma)は輝度に一意的且つ正確に等しいため、この輝度-ルーマL_e1に従って実際にマッピングするであろう(すなわち、画像内の中間/無色及び略無色のカラーの場合、例えば幾つかの素晴らしい深い黒色を作成するために、斯様な好ましい再グレーディングに従うであろう)。更に、図2のdに示されたように、元々同様であった色に対し、これらは元々はほぼ同じ輝度を有したものであり、加えて、このように高度に非線形なS字状曲線の場合、ルーマの1つが当該関数の非常に異なるマッピング部分、例えば最も暗い入力ルーマをマッピングする小さな傾斜の線形部分、対、大きな傾斜の中央部分、にジャンプし得ることにより、ルーマ値(Y1対Y2)に相当の広がりが存在し得る。
そのため、一方において、彩度の高いオブジェクトでは出力色が暗すぎるという問題があるので、(少なくとも特定の画像の色に対し)ある程度の明るさの増加を適用する必要がある。更に、発明者は、線形曲線の場合、重大な視覚的障害がないことを実験的に発見した(多少の誤差があっても、視覚的に重要なものではない)。
しかし、このルーママッピング関数400を簡単に変更することはできない。これは、受信された画像(IM_HDR)から二次画像が(コンテンツ作成者にしたがって)例えば100nitのPB_C_SDRのSDR画像にどのようにして再グレーディングされる必要があるかを決定する重要なメタデータであるからである。前述したように、このルーママッピング関数は無色及び略中間のカラーに対して正確に正しいため、これを変更しなければならなかったとすると、これらのカラーは突然誤ってルーマが再グレーディングされ、これらは、通常、例えば顔の色次のような一層重要なカラーである。一方、多くのシナリオにおいて、当該関数は無色でないカラーに対しても十分に望むように機能する。
図3に戻ると、知覚傾斜利得決定回路302は、単に「状況特徴付け値(situation characterizer value)」、すなわち知覚傾斜利得SG_PUを決定し、これは:
SG_PU=(L_o1/L_e1)/(Y_o1/Y1) [式4]
のように決定される。
すなわち、これは2つの傾斜の比である。すなわち、最初に、ルーママッピング曲線を、ルーマ値L_e1を表す(実質的に又は正確に)正しい輝度に適用して得られる出力輝度を、該輝度-ルーマL_e1により除算し;次に、(入力画像の)当該特定のカラーピクセルY1の入力ルーマに対する出力ルーマの、該入力ルーマY1により除算された比により除算される。実質的に又は正確に正しい輝度位置とは、幾つかの実施形態では正確に輝度を決定でき、他の実施形態においては該輝度を推定したい(これは様々な方法で行われ得る)という事実を指すが、「正規化された輝度」(及び特定のフィリップスの知覚的均一化範囲で表される)で継続するものとし、読者は、それが正確に正しい輝度値(例えば、ビデオ作成者がグレーディングしたものであり、例えば、式1をコンピューター内で画像のピクセルの線形RGB係数に適用することにより計算できる)であると仮定できる。
図5に、この知覚傾斜利得SG_PUが使用される利得決定回路302の一実施形態を示す。最終的に必要なものは、図1に見られるように、PQドメイン(US9077994のもので、SMPTE ST.2084として標準化されている)における補正であるが、少なくともSLHDRデコーダの全てのルーママッピングは知覚的に均一な(PU)ドメイン(前記式3の)で行われる。発明者は、クルマの調整(及びエンコーダにおける、受信側デコーダに伝達されるべきカラールックアップテーブルCL(Y_PQ)の決定)により当該問題にかなりきちんと取り組むことができることを理解した。すなわち、これは、グレーダが既に最初のもの定義している場合は、変更されたカラールックアップテーブルである。すなわち、ルーママッピングサブ回路101における全てはPUドメインで生じるが、入力Y_PQ及びCbCr_PQはPQドメインにおけるものである。
したがって、実際には、本アプローチによれば、PQドメインにおける飽和された画像オブジェクトのシミ及び他の暗すぎる部分のエラーに対する補正を決定しなければならず、これは回路302が実行することである。例示的実施形態において、これは、切り替えられた乗算値を用いて乗算器により制御される2つのパス(当該画像の各ピクセル色に対して)を実行する。当業者であれば、例えば、バッファリング、画像遅延の提供等の実装の詳細は自身で理解できることに注意されたい。
最初に、この値は1に設定され、次いで、入力輝度L(PQ EOTFを適用することにより入力ルーマY_PQから計算できる)が再び知覚的に均一化されたルーマドメインに変換される、すなわち、同等の代表的な知覚的ルーマ値PYに変換される。したがって、全体的なマッピング動作は、図2のdにPY値であると示されるものに対するこのパスのピクセルに適用される。
実際に、このユニットのブロックは、ETSI TS 103 433-2 V1.1.1規格の図1及び図4で説明されたものに対応する。新しく描かれたブロックは黒と白のレベルオフセット器402であり、該オフセット器は、入力HDRルーマの特定の定数値を、知覚的に均一化された表現の0又は1の値にシフトできる。例えば、HDRが0.1nit(又はそれに相当するルーマ表現値)よりも暗くならない場合、更なるルーママッピングを適用する前に、この値を最小のSDR値ゼロに事前にマッピングすることが、しばしば、有利であり、最大の値に対しても同様である。利得制限器403は、特定の状況下で作動し、上側経路(すなわち、回路402、112、113等)において様々な処理ステップを適用した結果と、代替のルーママッピング戦略との間の最大値を決定する回路であり、したがって、入力画像の全てのピクセルにこのルーママッピングを適用した結果の画像内の出力ルーマは低くなりすぎない(詳細についてはETSI標準を参照されたい。本イノベーションに関して知っておく必要があることは、本発明無しの古典的なSLHDRルーママッピングに関して通常の状況下で適用するであろう処理の全てを適用する、すなわち、例えば、粗いマッピングが適用される場合、回路302によりそのように適用され、そうでない場合、回路302もまったく同様に適用しないということ、のみである)。
したがって、最初のパスにおいて、当該乗数を1に設定する場合、ピクセルルーマ入力Y1に対して通常の出力ルーマY_o1が現れる(又は同様に、Y2等の他の何れの入力ルーマに対しても対応する出力ルーマが現れる)。このY_o1値は依然として知覚的に均一化されたルーマドメイン(PO)内にあるため、式3の逆により(線形化回路114により)線形化され、次いで、PQドメイン変換(回路115による)される必要があることに注意されたい。
第2のパスにおいて、前記乗算器は知覚的ルーマPYを知覚傾斜利得値SG_PU(回路301により決定された)により乗算し、そうすれば、図4にY_corr1として示された補正された値が出現する。このことは、(真の)正規化された輝度の計算を適用し、当該位置(L_e1、L_o1)に対して全マッピング曲線に何の傾斜が存在するかをルックアップし、これを使用して該傾斜を局所的に増加させ、Y1に関して出力することに対応する。
実際に、利得決定回路302は、PQドメインルーマ利得値(G_PQ)を:
G_PQ=OETF_PQ[Inv_PU(Y_corr1)]/OETF_PQ [Inv_PU(Y_o1)] [式5]
と計算し、ここで、Inv_PUは、式3の知覚的均一化の逆数、すなわち対応する(線形の)正規化された輝度の計算である。
すなわち、G_PQは、補正されていない(すなわち受信された)ルーマ値をSLHDRルーマ処理チェーン全体を介して送信したときに得られる出力ルーマ(PQドメインにおける)と、該ルーマ処理チェーンを介する補正されたPQドメインルーマ(該補正されたPQドメインルーマは、輝度-ルーマ、すなわちEOTF(Y1)である)との比である。エンコーディング側において、エンコーダを構築するための幾つかの選択肢が存在することに注意されたい。例えば、G_PQ値は、実際の色度依存性ルーマ(すなわち、エンコーダの出力画像IM_HDRにエンコードされるため)及び輝度-ルーマを表す正しい(無彩色)輝度から直接計算できる。すなわち、回路301は我々のイノベーションの必須のコア技術要素ではなく、幾つかのエンコーダ実施形態では無くてもよい(このような場合、回路302は、入力としてルーマY及び輝度-ルーマLをそれぞれ使用して2つの計算を行ない、両状況において乗数が存在しないか又は1xに設定されることを示す図3の点線を参照されたい)。
このG_PQ値は、対応するカラーLUT CL(Y_PQ)の決定のためにルックアップテーブル決定回路303により使用されるであろう。これを行うための幾つかの方法が存在し得(何を達成したいかに依存する。当該状況のために決定できるLUT関数の形状は1つだけであるが、例えば全体的な動作等に焦点を当てる代わりに、当該画像における特定の色等の特定の側面に特に焦点を当てることもできる)、これを図6の1つの原型的な例により示すことができる。実際に、理想的には特に各ピクセルに対して当該補正を行いたいであろうが、これは、当該SLHDRアプローチが動作する態様ではない(1D-2D処理分割による単純化のため)。アイデアは、ルーマ処理アーチファクトが発生する(少なくとも)ピクセルの飽和度を高めたいということである。この場合、このような高いクロマに対応する低いルーマは、出力R”G”B”カラーにおいて一層高い輝度に再変換されるであろう。欠点は、入力色と出力色との間に幾らかの飽和度の変化が存在することであるが、これは許容可能である。目は飽和度の変化よりも輝度の変化に対して一層厳しく、輝度の再調整はダイナミックレンジ調整において一層重要な視覚特性であるからである。いずれにせよ、当該正則化は(「全体的に」色を幾らか微調整し得るが)、図2cの花におけるシミ等の不快な局所的アーチファクトを除去又は軽減し、このことが、本構成の計算が実行される理由である。
図6は、どの様にして、回路302により計算されたデータポイントに対する当てはめ(フィッティング)関数(すなわち、Y_PQだけでなく、Cb及びCr値を持つビデオの少なくとも1つの特定の画像内の任意のピクセルについて、何のG_PQ値が出現するか)を決定することにより(平均して)補正戦略を決定できるかを示している。すなわち、回路302は、例えば、画像の全ての(又は幾つかの;例えば、影響を受ける特定のピクセルのみが検出され、当該アルゴリズム、すなわちカラーLUTの決定に寄与する場合)ピクセルを得ると共に、上記で解明された技術プロセスによりG_PQ値を計算する。これらを2Dプロット構造で編成すると、如何なる単一の値に対しても、幾つかの(それぞれのピクセルに対して)必要とされるG_PQ値が生じ得る(特に小さなY_PQ値に対して)ことが分かる。図6のプロットは、回路302から出力する種々の(Y_PQ、G_PQ)値を示している。通常、高いルーマY_PQ(補正無しに等しいと乗数定数1がある)に対して広がりは見られない。通常は飽和色(又は暗い不飽和色)に対応する一層低い領域では、特定のY_PQを持つピクセルが有し得る種々のCb、Cr値のため、各Y_PQ位置に対しG_PQ値の広がりが存在する。図1からのカラーLUT、CL(Y_PQ)も、このプロットに示され得る挙動を有する。すなわち、これは、各Y_PQ値に対するブースト値を決定するので、前記ルーマ処理経路について上記で計算したように(しかしながら、該ルーマ経路において変更不可と計算可能であるが)、BをG_PQと等しくすると、1DカラーLUT CL(Y_PQ)に入力される値に対応する関数を描くことができる。熟練した読者であれば、関数を点群にどの様に当てはめるかについての種々の方法が存在することが分かるであろう。例えば、平均二乗誤差の最小化を使用できる。
この関数がエンコーダ側で適用される場合、基本的にカラーLUTのみが決定されねばならず(図3参照)、この場合、このカラーLUTは受信側に通信され、デコーダはこれを簡単に適用できる。これは、本原則を具現化する1つの優雅な方法である。
しかしながら、同じプロセスはデコード側において適用することもできる(エンコード側でまだ適用されていない場合)が、幾つかの小さな違いがあるであろう。しかしながら、同じままであることは、輝度の再グレーディングを行う必要があるたびに、乗算器121が:
Cb_COR=CL(Y_PQ)*Cb_PQ及びCr_COR=CL(Y_PQ)*Cr_PQ [式6]
を計算することにより、当該ルーマの問題のためにクロマ成分を逆補正することである。
図7は、本発明によるデコーダ700を示している。基本的に、ほとんど全てのブロックは、図1のエンコーダ100におけるものと同じである。特に、利得決定回路302は、ここでも、少なくともアーチファクト損傷ピクセルについて一群のルーマ利得値(G_PQ)を決定しなければならず、これは、ここでも、(正しい)正規化された輝度位置に等しいルーマ位置(すなわち、図2のbで示されているような無色グレーの垂直軸上に見られる減少されていないルーマ位置)の出力画像ルーマを、高ダイナミックレンジ画像のピクセルの色度依存性ルーマの出力ルーマにより除算した比を定量化する。ここで、当該高ダイナミックレンジビデオデコード回路は、これらのG_PQ値を、ここでは全てデコーダ側で決定されるが当該デコーダのピクセルカラープロセッサパイプライン、すなわちLUT102にロードされるべきカラーLUT CL(Y_PQ)を決定するために使用する同様のカラールックアップテーブル決定回路303を備える。カラーLUTを決定してロードするのではなく、伝達されたカラーLUTを変更し、元の飽和度処理LUTの動作(回路303又は同等の別個の回路における)と、本発明による必要な補正とのバランスをとる詳細な実施形態が依然として存在し得るが、これらは詳細である。例えば、当該2つのLUTを補間することができ、重み係数は、アーチファクトの重大性の尺度(例えば、平均ピクセルが周囲と比較してどれだけ暗いか、エッジ強度の累積に基づく尺度又はテクスチャ尺度等)に依存したものであり得る。この場合、例えば一層大きな誤差の場合、回路303は、本アプローチにより決定されるLUTは例えば80%の重みを得る、すなわち他のLUTは、図6のグラフの上に示すことはできるが、20%等の強度でのみ引き寄せ得る。テクノロジーにとり非常に一般的であるように、当該解決策は100%完全ではないが、問題は明らかに軽減される。
このデコーダで新しいことは、該デコーダが原則として輝度L(通常、エンコード側では容易に利用可能である)は有さず、Y_PQのみを有することである。
Lを決定できる幾つかの態様が存在し得、これは輝度計算機701により実行されるが、最も簡単なものは、YCbCrから非線形R’G’B’_PQへの行列化を行うだけであり、その場合、EOTF_PQを介して線形化し、次いで、式1で説明されたように、R、G及びB成分の重み付けを介して輝度を計算する。輝度計算機701は、通常、輝度-ルーマを計算することに留意すべきであり、これは回路302に入り、図5で説明されたように、その計算の2番目でルーママッピングチェーン全体を通過する。
当該デコーダは、メタデータ内のインジケータをチェックするように構成されたメタデータチェッカーも有することに注意すべきであり、該インジケータは当該エンコーダが、該エンコーダが伝達するカラールックアップテーブルに必要な修正を既に適用したかを示す。通常、この場合、デコーダは上記ルックアップテーブルに如何なる補正も適用しないが、幾つかの実施形態は、受信されたカラールックアップテーブルを検証及び/又は微調整するために依然として独自の計算を行うことができる。作成/コーディング側と消費側との間の合意のための他のメカニズム、例えば特定のHDRビデオ供給経路のための事前定義された状況、又はソフトウェア更新若しくはユーザー制御等を介して構成される何か等、が採用される可能性もある。
図8は、ビデオ通信エコシステムの典型的な(非限定的な)例を示している。ビデオ作成側には、実況放送スタジオが見られ、該スタジオではプレゼンタ803が例えば科学ショーを提供している。該スタジオの種々の部分を通って歩くことができ、これらは非常に創作的に(自由に)照明され得る。例えば、プレゼンテーションエリアの明るい領域801があり得、該領域は多くのスタジオライト802により照明される。より暗い領域804もあり得る。ビデオ画像は、1つ又は典型的には一層多くのカメラ805、806によりキャプチャされる。理想的には、これらは同じタイプのものであり、カラーコーディネート(色調和)されるが、例えばカメラの1つはドローン等であり得る。最終的な責任者820がおり、該責任者は最終的制作、特にその比色(カラリメトリ)を決定する(当業者は、制作の種類に依存して、幾つかのシステム及び人までも関与するが、本説明のために、この人820をカラーグレーダと呼ぶ)。該カラーグレーダは、切り替え、演出、色付け等のためのパネルのような手段を有し得る。該カラーグレーダは、HDR基準モニタ及び/又はSDRモニタ等で、ライブ制作の1以上を観察できる。例えば、このショーは、教材のために、例えば水中シーンの二次ビデオ810も含み得る。これは、例えばライブカメラフィードとは異なる輝度ダイナミックレンジ特性のSDRビデオ又はHDRビデオであり得る。最も高いレベルの議論に着目すると、2つの状況が存在し得る。すなわち、二次ビデオ810が実際に特定の光レベルで示され、非常に明るいと仮定するか、又それはグリーンスクリーンであり、ビデオは最終責任者820の制作ブース内にのみ存在するかである。
本議論で興味深いものは、制作ブース内でルーママッピングを決定できることである。例えば、ライブアクションが開始する前に、HDRカメラを適切な虹彩レベルに設定した後に全ての照明領域に対して良好に又は合理的に良好に機能するマッピング関数を最適化できる。しかし、種々の領域、例えば暗い領域へのズームイン、に対して幾つかの関数を決定し、ビデオエンコーダ822において最終的HDR画像出力を計算する場合に関数を切り替え、又は、これら関数を、手動介入の有無にかかわらず当該関数を画像ごとのオートマトン最適化バージョンのために使用することもできる。最後に、この例では、消費者又は専門の中間局への衛星アンテナ830を介する衛星リンクも有するが、コード化されたHDRビデオは、ビデオ通信技術としてのインターネット等を介して出力することもできる。受信側には、典型的に、消費者の家、例えば消費者のリビングルームがある。この消費者は、放送されたHDRビデオをローカルな衛星アンテナ851及び衛星テレビセットトップボックス852を介して取得し、当該画像は最終的にHDRテレビ853又は他のディスプレイ上で視聴されることを説明した。HDRビデオデコーダは、セットトップボックス又はディスプレイに含まれ得る。コード化されたピーク輝度PB_Cで受信されたHDR画像の、消費者のテレビの最大輝度PB_Dへの他の画像輝度最適化も存在し得る。これはセットトップボックス内で行われ得、最適化された画像は、例えばHDMI(登録商標)ケーブル又はワイヤレスビデオリンク等を介してテレビへ伝達されるか、又はセットトップボックスは単にデータ通過器であり得、テレビが上述されたような何れかのデコーダの実施形態を有し得る。
上記で説明したイノベーションの全体又は一部を提供する技術的要素は、実際には、ハードウェア(例えば、特定用途向けICの一部等)として、又は特別なデジタル信号プロセッサ若しくは汎用プロセッサ、FGGA等で動作するソフトウェアとして(全体として又は部分的に)実現できる。如何なるプロセッサ、プロセッサの一部、又は接続されたプロセッサの複合体は、内部又は外部データバス、キャッシュ、RAM、ROM等のオンボード又はオフボードメモリを備え得る。斯かるプロセッサが含まれる装置は、例えばディスプレイに接続するためのHDMI(登録商標)と等の画像通信ケーブルプロトコルのようなハードウェアに対する特別な接続のための、又は当該装置がディスプレイである場合の表示パネルに接続するための内部接続のための特別なプロトコルを備え得る。回路は、技術的なアクションを実行する前に、動的な命令により構成できる。如何なる要素又は装置も、任意のコンテンツ作成又は配信サイト等におけるビデオ作成システム等の、より大きな技術システムの一部を形成することができる。
当業者は、画像を通信(又は保存)するために、どの技術的要素が利用可能又は使用可能であるかを、それが世界の他の部分へのものであるか、又は例えばHDRに適したビデオケーブル等の2つの隣接する装置間のものであるかよらず、理解すべきである。当業者は、どのような状況下で、どの形式のビデオ又は画像圧縮を使用できるかを理解するであろう。当業者は、信号を混合することができ、例えば最適なS字状曲線の決定のように、画像に対し何らかの計算を適用する前に先ず混合することが、絶対に必要というわけではないが有利であり得ることを理解できる。もっとも、この決定は、事前に混合された画像に適用された場合でも、例えば、カメラフィード画像及び二次画像の種々の画像側面に種々の特定の態様で依然として重荷になる。当業者は、様々な実現化が、例えば、幾つかのビデオエンコーダを幾つかのHDRビデオ又はビデオストリームを出力するために使用することにより、並行に機能し得ることを理解するであろう。
当業者によれば、当該提示から、どの要素がオプション的改善であり、他の要素と組み合わせで実現できるか、並びに方法の(オプションの)ステップが装置の各手段にどの様に対応するか及びその逆を理解できるはずである。本出願における「装置」という文言は、その最も広い意味で使用され、すなわち、特定の目的の実現を可能にする一群の技術的要素であり、したがって、IC(の小さな回路部分)、専用の機器(ディスプレイを備える機器等)、又はネットワークシステムの一部等であり得る。「配置」又は「システム」も、最も広い意味で使用されることが意図され、したがって、それは、とりわけ、単一の装置、装置の一部、協動する装置(の一部)の集合等を含み得る。
当該方法の処理に必要とされるステップの幾つかは、コンピュータプログラムに記述される代わりに、プロセッサの機能に既に存在することもできる。同様に、本イノベーションが協動する幾つかの態様、例えば、幾つかのカラーコーディングデジタル値により駆動されると、スクリーンの前に対応する表示色を示す表示パネルの機能等は、良く知られた技術的回路若しくは要素、又は別個の装置内に存在し得、このような既存の詳細は、当該技術分野に何が正確に貢献されるかに焦点を合わせることにより当該教示を一層明確にするために、徹底して議論されることはないであろう。
上記の実施形態は、本発明を限定するのではなく例示するものであることに留意されたい。当業者が提示された例の請求項の他の領域へのマッピングを容易に実現できる場合、簡潔にするために、これら全てのオプションについて詳細に言及するものではない。前記例又は請求項において組み合わされる本発明の要素の組み合わせとは別に、これら要素の他の組み合わせも可能である。要素の如何なる組み合わせも、単一の専用の要素において実現され得る。熟練した読者であれば、幾つかの処理順序は入れ替え可能であることを理解できる。
請求項における括弧内の参照記号は、当該請求項を限定することを意図したものではない。「有する(含む)」という文言は、請求項に記載されていない要素又は態様の存在を排除するものではない。単数形の要素は、複数の斯様な要素の存在を排除するものではない。

Claims (7)

  1. データフォーマッタ回路と、
    利得決定回路と、
    カラールックアップテーブル決定回路と
    を有する、高ダイナミックレンジビデオエンコード回路であって、
    前記データフォーマッタ回路は、高ダイナミックレンジ画像及びメタデータをビデオ通信媒体に出力し、
    前記高ダイナミックレンジ画像は、第1のピクセルを有し、
    前記第1のピクセルは、前記第1のピクセルの第1の輝度を有し
    前記第1の輝度は、第1の最大輝度以下である値を有し、
    前記第1の輝度の各々は、第1のルーマとしてエンコードされ、
    前記第1のピクセルの各々は、2つの第1のクロミナンスを有し、
    前記データフォーマッタ回路は、第2の画像の第2のピクセルをエンコードし、
    前記第2の画像の第2のピクセルは、前記第2のピクセルの第2の輝度を有し
    前記第2のピクセルは、前記第1のピクセルに対応し、
    前記第2の輝度は、第2の最大輝度以下である値を有し、
    前記第2の輝度の各々は、第2のルーマとしてエンコードされ、
    前記第2の最大輝度は、前記第1の最大輝度よりも低く、
    前記第2の輝度は、関数によってエンコードされ、
    前記関数は、前記第2のルーマを定義し、
    前記第2のピクセルの前記第2のルーマは、空間的に同位置の第1のピクセルの第1のルーマに応じた前記関数の出力であり、
    第2のピクセルの第2のクロミナンスは、同位置の第1のピクセルのクロミナンス及び乗数定数に基づき、
    前記乗数定数は、カラールックアップテーブルから得られ、
    前記カラールックアップテーブルは、入力インデックスの組を有し、
    前記入力インデックスの組は、前記第1のピクセルのルーマの全ての可能な値にまたがり、
    前記カラールックアップテーブルは、各インデックスに対する乗数定数を定義し、
    前記利得決定回路は、前記第1のピクセルを受信し、
    前記利得決定回路は、前記第1のピクセルの一部における部分組ピクセルの各々に対してルーマ利得値を決定し、
    前記ルーマ利得値は、分子を分母で除算した比であり、
    前記分子は、前記部分組ピクセルのうちの1つの正規化されたバージョンの輝度に前記関数を適用することによって得られ、
    前記部分組ピクセルの各々の前記正規化されたバージョンの輝度は、前記部分組ピクセルの各々の輝度を前記第1の最大輝度により除算することによって得られ、
    前記分母は、前記部分組ピクセルのうちの1つの正規化されたルーマに前記関数を適用することによって得られ、
    前記正規化されたルーマは、前記部分組ピクセルの各々のルーマを最大ルーマコードにより除算することによって得られ、
    前記カラールックアップテーブル決定回路は、前記カラールックアップテーブルを部分組ピクセルのルーマの少なくとも一部に関する前記ルーマ利得値に基づいて決定し、
    前記カラールックアップテーブルのインデックスに関する前記乗数定数の一部が、前記部分組ピクセルのルーマの前記一部に関する前記ルーマ利得値の値と相関し、
    前記データフォーマッタ回路は、前記カラールックアップテーブルを前記メタデータにおいて出力する、
    高ダイナミックレンジビデオエンコード回路。
  2. 前記カラールックアップテーブル決定回路が、前記カラールックアップテーブルの値を、最良の当てはめ関数に基づいて決定し、
    前記最良の当てはめ関数は、前記ルーマ利得値の値の前記部分組ピクセルの各々の前記正規化されたルーマの対応する値に対する散布図を集約する、
    請求項1に記載の高ダイナミックレンジビデオエンコード回路。
  3. ルーママッピング回路と、
    カラーマッピング回路と、
    乗数回路と、
    利得決定回路と、
    カラールックアップテーブル決定回路と
    を有する、高ダイナミックレンジビデオデコード回路であって、
    前記ルーママッピング回路は、高ダイナミックレンジ画像を第2の画像にマッピングし、
    前記高ダイナミックレンジ画像は、第1のピクセルを有し、
    前記第1のピクセルの各々は、第1のルーマ及び2つの第1のクロミナンスを有し、
    前記第1のルーマは、対応する第1の輝度を表し
    前記高ダイナミックレンジ画像は、第1の最大輝度を有し、
    前記第2の画像は、第2のピクセルを有し、
    前記ピクセルは、第2のルーマ及び2つの第2のクロミナンスを有し、
    前記第2のルーマは、対応する第2の輝度を表し
    前記第2の画像は、第2の最大輝度を有し、
    前記第2の最大輝度は、前記第1の最大輝度よりも低く、
    マッピングは、前記第1のルーマから前記第2のルーマまでであり、
    前記マッピングは、前記第1の輝度に基づいて前記第2の輝度を定義する関数を有し、
    前記カラーマッピング回路は、カラールックアップテーブルを有し、
    前記カラールックアップテーブルは、入力インデックスの組を有し、
    前記入力インデックスの組は、前記第1のピクセルのルーマの全ての可能な値にまたがり、
    前記カラールックアップテーブルは、前記入力インデックスの組のインデックスの各々に関する乗数定数を出力し、
    前記乗数回路は、前記第2のクロミナンスを得るために、前記第1のクロミナンスを前記乗数定数により乗算し、
    前記利得決定回路は、前記第1のピクセルを受信し、
    前記利得決定回路は、前記第1のピクセルの一部における部分組ピクセルの各々に対してルーマ利得値を決定し、
    前記ルーマ利得値は、分子を分母で除算した比であり、
    前記分子は、前記部分組ピクセルのうちの1つの正規化されたバージョンの輝度に前記関数を適用することによって得られ、
    前記部分組ピクセルの各々の前記正規化されたバージョンの輝度は、前記部分組ピクセルの各々の輝度を前記第1の最大輝度により除算することによって得られ、
    前記分母は、前記部分組ピクセルのうちの1つの正規化されたルーマに前記関数を適用することによって得られ、
    前記正規化されたルーマは、前記部分組ピクセルの各々のルーマを最大ルーマコードにより除算することによって得られ、
    前記カラールックアップテーブル決定回路は、前記カラールックアップテーブルを部分組ピクセルのルーマの少なくとも一部に関する前記ルーマ利得値に基づいて決定し、
    前記カラールックアップテーブルのインデックスに関する前記乗数定数の一部が、前記部分組ピクセルのルーマの前記一部に関する前記ルーマ利得値の値と相関する、
    高ダイナミックレンジビデオデコード回路。
  4. 高ダイナミックレンジビデオをエンコードする方法であって、前記方法は、
    高ダイナミックレンジ画像及びメタデータをビデオ通信媒体に出力するステップであって、
    前記高ダイナミックレンジ画像は、第1のピクセルを有し、
    前記第1のピクセルは、前記第1のピクセルの第1の輝度を有し
    前記第1の輝度は、第1の最大輝度以下である値を有し、
    前記第1の輝度は、対応する第1のルーマとしてエンコードされ、
    前記第1のピクセルの各々は、2つの第1のクロミナンスを有する、出力するステップと、
    第2の画像をエンコードするステップであって、
    前記第2の画像は、前記高ダイナミックレンジ画像に対応し、
    前記第2の画像は、第2のピクセルを有し、
    前記第2の画像の第2のピクセルは、前記第2のピクセルの第2の輝度を有し
    前記第2の輝度は、第2の最大輝度以下である値を有し、
    前記第2の輝度は、対応する第2のピクセルのルーマとしてエンコードされ、
    前記第2の最大輝度は、前記第1の最大輝度よりも低く、
    前記第2の輝度は、関数によってエンコードされ、
    前記関数は、第2のルーマを定義し、
    前記第2のピクセルの前記第2のルーマは、空間的に同位置の第1のピクセルの前記第1のルーマに応じた前記関数の出力であり、
    前記第2のピクセルの各々は、2つの第2のクロミナンスを有し、
    前記第2のピクセルの第2のクロミナンスは、同位置の第1のピクセルのクロミナンス及び乗数定数に基づき、
    前記乗数定数は、カラールックアップテーブルから得られ、
    前記カラールックアップテーブルは、入力インデックスの組を有し、
    前記入力インデックスの組は、前記第1のピクセルのルーマの全ての可能な値にまたがり、
    前記カラールックアップテーブルは、各インデックスに対する乗数定数を定義し、
    前記2つの第2のクロミナンスの各々は、前記2つの第1のクロミナンスのうちの対応する1つを乗数定数により乗算することによって得られる、エンコードするステップと、
    前記第1のピクセルの一部における部分組ピクセルの各々に対してルーマ利得値を決定するステップであって、
    前記ルーマ利得値は、分子を分母で除算した比であり、
    前記分子は、前記部分組ピクセルのうちの1つの正規化されたバージョンの輝度に前記関数を適用することによって得られ、
    前記部分組ピクセルの各々の前記正規化されたバージョンの輝度は、前記部分組ピクセルの各々の輝度を前記第1の最大輝度により除算することによって得られ、
    前記分母は、前記部分組ピクセルのうちの1つの正規化されたルーマに前記関数を適用することによって得られ、
    前記正規化されたルーマは、前記部分組ピクセルの各々のルーマを最大ルーマコードにより除算することによって得られる、ルーマ利得値を決定するステップと、
    カラールックアップテーブルを決定するステップであって、
    前記カラールックアップテーブルは、部分組ピクセルのルーマの少なくとも一部に関する前記ルーマ利得値に基づいて決定され、
    前記カラールックアップテーブルのインデックスに関する前記乗数定数の一部が、前記部分組ピクセルのルーマの前記一部に関する前記ルーマ利得値の値と相関する、カラールックアップテーブルを決定するステップと、
    前記カラールックアップテーブルを前記メタデータにおいて出力するステップと
    を有する、方法。
  5. 高ダイナミックレンジビデオをデコードする方法であって、前記方法は、
    高ダイナミックレンジ画像を第2の画像にカラーマッピングするステップであって、
    前記高ダイナミックレンジ画像は、第1のピクセルを有し、
    前記第1のピクセルの各々は、第1のルーマ及び2つの第1のクロミナンスを有し、
    前記第1のルーマは、対応する第1の輝度を表し
    前記高ダイナミックレンジ画像は、第1の最大輝度を有し、
    前記第2の画像は、第2のピクセルを有し、
    前記ピクセルは、第2のルーマ及び2つの第2のクロミナンスを有し、
    前記第2のルーマは、対応する第2の輝度を表し
    前記第2の画像は、第2の最大輝度を有し、
    前記第2の最大輝度は、前記第1の最大輝度よりも低く、
    マッピングは、前記第1のルーマから前記第2のルーマまでであり、
    前記マッピングは、
    前記第2のピクセルの前記第2のルーマを得るために関数を適用するステップと、
    カラールックアップテーブルを用いて、前記第1のクロミナンスを第2のクロミナンスにカラーマッピングするステップと、
    を有し、
    前記カラールックアップテーブルは、乗算定数を出力し、
    前記カラールックアップテーブルは、入力インデックスの組を有し、
    前記入力インデックスの組は、前記第1のピクセルのルーマの全ての可能な値にまたがり、
    前記カラールックアップテーブルは、各インデックスに関する乗数定数を定義する、カラーマッピングするステップと、
    前記第2のクロミナンスを得るために、前記第1のクロミナンスを前記乗数定数により乗算するステップと、
    前記第1のピクセルの一部における部分組ピクセルの各々に対してルーマ利得値を決定するステップであって、
    前記ルーマ利得値は、分子を分母で除算した比であり、
    前記分子は、前記部分組ピクセルのうちの1つの正規化されたバージョンの輝度に前記関数を適用することによって得られ、
    前記部分組ピクセルの各々の前記正規化されたバージョンの輝度は、前記部分組ピクセルの各々の輝度を前記第1の最大輝度により除算することによって得られ、
    前記分母は、前記部分組ピクセルのうちの1つの正規化されたルーマに前記関数を適用することによって得られ、
    前記正規化されたルーマは、前記部分組ピクセルの各々のルーマを最大ルーマコードにより除算することによって得られる、前記ルーマ利得値を決定するステップと、
    前記カラールックアップテーブルを決定するステップであって、
    前記カラールックアップテーブルは、部分組ピクセルのルーマの少なくとも一部に関する前記ルーマ利得値に基づき、
    前記カラールックアップテーブルのインデックスに関する前記乗数定数の一部が、前記部分組ピクセルのルーマの前記一部に関する前記ルーマ利得値の値と相関する、前記カラールックアップテーブルを決定するステップと、
    を有する、方法。
  6. 非一時的媒体に記憶されたコンピュータプログラムであって、前記コンピュータプログラムは、プロセッサ上で実行されるときに、高ダイナミックレンジビデオをエンコードする方法を実行し、前記方法は、
    高ダイナミックレンジ画像及びメタデータをビデオ通信媒体に出力するステップであって、
    前記高ダイナミックレンジ画像は、第1のピクセルを有し、
    前記第1のピクセルは、前記第1のピクセルの第1の輝度を有し
    前記第1の輝度は、第1の最大輝度以下である値を有し、
    前記第1の輝度は、対応する第1のルーマとしてエンコードされ、
    前記第1のピクセルの各々は、2つの第1のクロミナンスを有する、出力するステップと、
    第2の画像をエンコードするステップであって、
    前記第2の画像は、前記高ダイナミックレンジ画像に対応し、
    前記第2の画像は、第2のピクセルを有し、
    前記第2の画像の第2のピクセルは、前記第2のピクセルの第2の輝度を有し
    前記第2の輝度は、第2の最大輝度以下である値を有し、
    前記第2の輝度は、対応する第2のピクセルのルーマとしてエンコードされ、
    前記第2の最大輝度は、前記第1の最大輝度よりも低く、
    前記第2の輝度は、関数によってエンコードされ、
    前記関数は、第2のルーマを定義し、
    前記第2のピクセルの前記第2のルーマは、空間的に同位置の第1のピクセルの前記第1のルーマに応じた前記関数の出力であり、
    前記第2のピクセルの各々は、2つの第2のクロミナンスを有し、
    前記第2のピクセルの第2のクロミナンスは、同位置の第1のピクセルのクロミナンス及び乗数定数に基づき、
    前記乗数定数は、カラールックアップテーブルから得られ、
    前記カラールックアップテーブルは、入力インデックスの組を有し、
    前記入力インデックスの組は、前記第1のピクセルのルーマの全ての可能な値にまたがり、
    前記カラールックアップテーブルは、各インデックスに対する乗数定数を定義し、
    前記2つの第2のクロミナンスの各々は、前記2つの第1のクロミナンスのうちの対応する1つを乗数定数により乗算することによって得られる、エンコードするステップと、
    前記第1のピクセルの一部における部分組ピクセルの各々に対してルーマ利得値を決定するステップであって、
    前記ルーマ利得値は、分子を分母で除算した比であり、
    前記分子は、前記部分組ピクセルのうちの1つの正規化されたバージョンの輝度に前記関数を適用することによって得られ、
    前記部分組ピクセルの各々の前記正規化されたバージョンの輝度は、前記部分組ピクセルの各々の輝度を前記第1の最大輝度により除算することによって得られ、
    前記分母は、前記部分組ピクセルのうちの1つの正規化されたルーマに前記関数を適用することによって得られ、
    前記正規化されたルーマは、前記部分組ピクセルの各々のルーマを最大ルーマコードにより除算することによって得られる、ルーマ利得値を決定するステップと、
    カラールックアップテーブルを決定するステップであって、
    前記カラールックアップテーブルは、部分組ピクセルのルーマの少なくとも一部に関する前記ルーマ利得値に基づいて決定され、
    前記カラールックアップテーブルのインデックスに関する前記乗数定数の一部が、前記部分組ピクセルのルーマの前記一部に関する前記ルーマ利得値の値と相関する、カラールックアップテーブルを決定するステップと、
    前記カラールックアップテーブルを前記メタデータにおいて出力するステップと
    を有する、コンピュータプログラム。
  7. 非一時的媒体に記憶されたコンピュータプログラムであって、前記コンピュータプログラムは、プロセッサ上で実行されるときに、高ダイナミックレンジビデオをデコードする方法を実行し、前記方法は、
    高ダイナミックレンジ画像を第2の画像にカラーマッピングするステップであって、
    前記高ダイナミックレンジ画像は、第1のピクセルを有し、
    前記第1のピクセルの各々は、第1のルーマ及び2つの第1のクロミナンスを有し、
    前記第1のルーマは、対応する第1の輝度を表し
    前記高ダイナミックレンジ画像は、第1の最大輝度を有し、
    前記第2の画像は、第2のピクセルを有し、
    前記ピクセルは、第2のルーマ及び2つの第2のクロミナンスを有し、
    前記第2のルーマは、対応する第2の輝度を表し
    前記第2の画像は、第2の最大輝度を有し、
    前記第2の最大輝度は、前記第1の最大輝度よりも低く、
    マッピングは、前記第1のルーマから前記第2のルーマまでであり、
    前記マッピングは、
    前記第2のピクセルの前記第2のルーマを得るために関数を適用するステップと、
    カラールックアップテーブルを用いて、前記第1のクロミナンスを第2のクロミナンスにカラーマッピングするステップと、
    を有し、
    前記カラールックアップテーブルは、乗算定数を出力し、
    前記カラールックアップテーブルは、入力インデックスの組を有し、
    前記入力インデックスの組は、前記第1のピクセルのルーマの全ての可能な値にまたがり、
    前記カラールックアップテーブルは、各インデックスに関する乗数定数を定義する、カラーマッピングするステップと、
    前記第2のクロミナンスを得るために、前記第1のクロミナンスを前記乗数定数により乗算するステップと、
    前記第1のピクセルの一部における部分組ピクセルの各々に対してルーマ利得値を決定するステップであって、
    前記ルーマ利得値は、分子を分母で除算した比であり、
    前記分子は、前記部分組ピクセルのうちの1つの正規化されたバージョンの輝度に前記関数を適用することによって得られ、
    前記部分組ピクセルの各々の前記正規化されたバージョンの輝度は、前記部分組ピクセルの各々の輝度を前記第1の最大輝度により除算することによって得られ、
    前記分母は、前記部分組ピクセルのうちの1つの正規化されたルーマに前記関数を適用することによって得られ、
    前記正規化されたルーマは、前記部分組ピクセルの各々のルーマを最大ルーマコードにより除算することによって得られる、前記ルーマ利得値を決定するステップと、
    前記カラールックアップテーブルを決定するステップであって、
    前記カラールックアップテーブルは、部分組ピクセルのルーマの少なくとも一部に関する前記ルーマ利得値に基づき、
    前記カラールックアップテーブルのインデックスに関する前記乗数定数の一部が、前記部分組ピクセルのルーマの前記一部に関する前記ルーマ利得値の値と相関する、前記カラールックアップテーブルを決定するステップと、
    を有する、コンピュータプログラム。
JP2022550798A 2020-02-25 2021-02-12 飽和色のための改善されたhdrカラー処理 Active JP7300070B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20159237.5A EP3873096A1 (en) 2020-02-25 2020-02-25 Improved hdr color processing for saturated colors
EP20159237.5 2020-02-25
PCT/EP2021/053470 WO2021170425A1 (en) 2020-02-25 2021-02-12 Improved hdr color processing for saturated colors

Publications (2)

Publication Number Publication Date
JP2023504311A JP2023504311A (ja) 2023-02-02
JP7300070B2 true JP7300070B2 (ja) 2023-06-28

Family

ID=69742658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022550798A Active JP7300070B2 (ja) 2020-02-25 2021-02-12 飽和色のための改善されたhdrカラー処理

Country Status (7)

Country Link
US (1) US11582434B2 (ja)
EP (2) EP3873096A1 (ja)
JP (1) JP7300070B2 (ja)
KR (1) KR20220143932A (ja)
CN (1) CN115176469A (ja)
DE (1) DE102021104214A1 (ja)
WO (1) WO2021170425A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017102606A1 (en) 2015-12-17 2017-06-22 Koninklijke Philips N.V. Dynamic range coding for images and video
WO2017108906A1 (en) 2015-12-21 2017-06-29 Koninklijke Philips N.V. Optimizing high dynamic range images for particular displays
WO2017157977A1 (en) 2016-03-18 2017-09-21 Koninklijke Philips N.V. Encoding and decoding hdr videos
WO2017201139A1 (en) 2016-05-19 2017-11-23 Dolby Laboratories Licensing Corporation Chroma reshaping for high dynamic range images
WO2019110752A1 (en) 2017-12-08 2019-06-13 Koninklijke Philips N.V. Improved high dynamic range video color remapping

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2835379T3 (es) 2011-12-06 2021-06-22 Dolby Laboratories Licensing Corp Dispositivo y método para mejorar el intercambio de datos de imágenes basado en no linealidad de luminancia perceptual a través de diferentes capacidades de visualización
US9225988B2 (en) * 2013-05-30 2015-12-29 Apple Inc. Adaptive color space transform coding
EP3251082A1 (en) * 2015-01-30 2017-12-06 Koninklijke Philips N.V. Simple but versatile dynamic range coding
US20180146190A1 (en) * 2015-06-08 2018-05-24 Thomson Licensing Method and apparatus for color gamut scalability (cgs) video encoding with artifact detection
WO2017040237A1 (en) * 2015-08-28 2017-03-09 Arris Enterprises Llc Color volume transforms in coding of high dynamic range and wide color gamut sequences
CN108141614B (zh) * 2015-09-23 2021-06-18 艾锐势有限责任公司 信号传送传输流中的高动态范围和宽色域内容
EP3396936A1 (en) * 2017-04-27 2018-10-31 Thomson Licensing Method and device for color gamut mapping
EP3399735A1 (en) * 2017-05-02 2018-11-07 Thomson Licensing Method and device for color gamut mapping
EP3416363A1 (en) * 2017-06-13 2018-12-19 Koninklijke Philips N.V. Gamut mapping for hdr (de)coding
US20200236381A1 (en) * 2017-09-28 2020-07-23 Sharp Kabushiki Kaisha Value limiting filter apparatus, video coding apparatus, and video decoding apparatus
US10652537B1 (en) * 2018-11-21 2020-05-12 Alibaba Group Holding Limited Coding unit size adaptive palette mode for video compression system
US11240507B2 (en) * 2019-09-24 2022-02-01 Qualcomm Incorporated Simplified palette predictor update for video coding
US11076151B2 (en) * 2019-09-30 2021-07-27 Ati Technologies Ulc Hierarchical histogram calculation with application to palette table derivation
US11776508B2 (en) * 2019-12-30 2023-10-03 Ati Technologies Ulc Pre-display adaptive codeword mapping for display monitor with non-ideal electro-optical transfer function

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017102606A1 (en) 2015-12-17 2017-06-22 Koninklijke Philips N.V. Dynamic range coding for images and video
WO2017108906A1 (en) 2015-12-21 2017-06-29 Koninklijke Philips N.V. Optimizing high dynamic range images for particular displays
WO2017157977A1 (en) 2016-03-18 2017-09-21 Koninklijke Philips N.V. Encoding and decoding hdr videos
WO2017201139A1 (en) 2016-05-19 2017-11-23 Dolby Laboratories Licensing Corporation Chroma reshaping for high dynamic range images
WO2019110752A1 (en) 2017-12-08 2019-06-13 Koninklijke Philips N.V. Improved high dynamic range video color remapping

Also Published As

Publication number Publication date
EP3873096A1 (en) 2021-09-01
KR20220143932A (ko) 2022-10-25
US20210266509A1 (en) 2021-08-26
WO2021170425A1 (en) 2021-09-02
JP2023504311A (ja) 2023-02-02
US11582434B2 (en) 2023-02-14
DE102021104214A1 (de) 2021-08-26
EP4111689A1 (en) 2023-01-04
CN115176469A (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
US10902567B2 (en) Handling multiple HDR image sources
JP6495552B2 (ja) 画像及びビデオのためのダイナミックレンジ符号化
US20230177659A1 (en) Encoding and decoding hdr videos
US11521537B2 (en) Optimized decoded high dynamic range image saturation
RU2642335C2 (ru) Обработка изображений с изменением яркости при цветовых ограничениях
JP7203048B2 (ja) Hdrコード化(復号)のための色域マッピング
CN109219961B (zh) 对hdr视频进行编码和解码的方法和装置
US10937135B2 (en) Saturation processing specification for dynamic range mappings
CN111699507A (zh) 改进的高动态范围视频颜色重新映射
JP2019506817A (ja) 複数のhdr画像ソースの処理
WO2019170465A1 (en) Versatile dynamic range conversion processing
JP7300070B2 (ja) 飽和色のための改善されたhdrカラー処理
JP2022541884A (ja) Hdr画像のための表示最適化挙動の調節
EP4277281A1 (en) Hdr video reconstruction by converted tone mapping
EP4086842A1 (en) Content-optimized ambient light hdr video adaptation
EP4086843A1 (en) Display-optimized hdr video contrast adaptation
EP4086844A1 (en) Display-optimized hdr video contrast adaptation
EP4086841A1 (en) Display-optimized ambient light hdr video adaptation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221215

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230616

R150 Certificate of patent or registration of utility model

Ref document number: 7300070

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150