JP6609708B2 - 高ダイナミックレンジ映像データの再形成および適応のためのシステムおよび方法 - Google Patents

高ダイナミックレンジ映像データの再形成および適応のためのシステムおよび方法 Download PDF

Info

Publication number
JP6609708B2
JP6609708B2 JP2018534516A JP2018534516A JP6609708B2 JP 6609708 B2 JP6609708 B2 JP 6609708B2 JP 2018534516 A JP2018534516 A JP 2018534516A JP 2018534516 A JP2018534516 A JP 2018534516A JP 6609708 B2 JP6609708 B2 JP 6609708B2
Authority
JP
Japan
Prior art keywords
video data
transfer function
data
reconstruction
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018534516A
Other languages
English (en)
Other versions
JP2018530281A (ja
Inventor
エム. バイロン、デイビッド
グ、ジョーイ
ルトラ、アジェイ
ミヌー、コーヤル
ユ、ユエ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Arris Enterprises LLC
Original Assignee
Arris Enterprises LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arris Enterprises LLC filed Critical Arris Enterprises LLC
Publication of JP2018530281A publication Critical patent/JP2018530281A/ja
Application granted granted Critical
Publication of JP6609708B2 publication Critical patent/JP6609708B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Processing Of Color Television Signals (AREA)

Description

本開示は、高ダイナミックレンジ(HDR:High Dynamic Range)および/または広色域(WCG:Wide Color Gamut)映像シーケンスの映像符号化および復号化の分野に関し、特に、このようなシーケンスを符号化するため、および、復号化映像シーケンスからHDRおよび/またはWCG映像シーケンスを回復するために使用される伝達関数を格納および送信するための方法に関する。
HDR映像およびWCG映像は、従来の標準ダイナミックレンジ(SDR:Standard Dynamic Range)映像よりも広範な輝度および色値を提供する。たとえば、SDR映像は、輝度および色の範囲が制限され得るため、画像の取り込み、符号化、および/または表示に際して、暗部またはハイライトの詳細が失われてしまう可能性がある。これに対して、HDRおよび/またはWCG映像では、より広範な輝度および色情報を取り込めるため、映像がより自然かつ実際に近い形で人間の眼に映ることになる。
しかし、MPEG−4高度映像符号化(AVC:Advanced Video Coding)および高効率映像符号化(HEVC:High Efficiency Video Coding)などの多くの一般的な映像符号化および復号化方式は、直接、HDRまたはWCG映像を取り扱うようには設計されていない。このように、HDRおよびWCG映像情報は通常、該情報がこれらの映像圧縮アルゴリズムのうちの1つを使用して符号化されることができる前に、他のフォーマットへと変換される。
例えば、EXRファイルフォーマットなどのHDR映像フォーマットは、10個の有効ビット、5個の指数ビットおよび1個の符号ビットを有する16ビット半精度浮動小数点値で、線形光の赤、緑、青(RGB)色空間の色を記述する。これらの値は、潜在的な強度および色値の広い範囲をカバーする。SDR映像は、非HDRおよび非WCG映像の色を表現するために8または10ビット整数値を採用する。多くの既存の映像圧縮アルゴリズムは、SDR映像での使用向けであり、したがって、8または10ビット整数値の受信を予期する。映像ダイナミックレンジを実質的に減少させることなく、または、大きな歪みを導入することなく、圧縮アルゴリズムが協働可能な10ビット値へと16ビット半精度浮動小数点色値を量子化することは困難であり得る。
いくつかの符号化器は、均一量子化の前に非線形値へと入力映像からの線形値を変換する符号化伝達関数を使用する。非限定的な例として、符号化伝達関数は、量子化範囲の一端または両端での輝度および/または色(クロミナンス)値を圧縮するガンマ関数を含み得、これにより、より大きな範囲が、符号化器に提供される8または10ビット値で表され得る。符号化伝達関数は、入力映像の内容に応じて変化しないように固定であり得る。例えば、符号化器の符号化伝達関数は、0から10,000ニットまで(カンデラ毎平方メートル、すなわちcd/m)などのHDR範囲内のすべての可能な入力値を、8ビット値については0から255までまたは10ビット値については0から1023までの範囲の特定の非線形値に静的にマッピングするために定義することができる。しかし、入力映像がその範囲の一部のみに入力値を含む場合、固定マッピングによって量子化レベルの割り当てが不十分となり、再生画像中に量子化歪みが生じる可能性がある。例えば、主に青空を示すピクチャは、青の多くの類似した色合いを有する可能性があるが、それらの青の色合いは、符号化伝達関数が定義されている全範囲の小さな部分を占める可能性がある。このように、同系の青の色合いは同じ値に量子化され得る。この量子化は、輪郭削りまたはバンディングとして視聴者に知覚され得、青の量子化された色合いは、色合い間のより自然な遷移の代わりに、画面上に表示される空を横切ってバンド状に延びる。
さらに、人間の視覚系の精神物理学的研究では、特定の場所でのコントラストレベルへの視聴者の感度は、その場所自体の実際のレベルよりも周囲の場所の平均明るさに、より依存する可能性があることが示されている。しかし、多くの符号化伝達関数は、これを考慮せず、代わりに、周囲画素の特性を考慮に入れない固定変換関数またはテーブルを使用する。
符号化映像データから高ダイナミックレンジ(HDR)映像データを再生するためのシステムおよび方法は、映像データ再形成伝達関数を指定する自己参照メタデータ構造を符号化映像データから抽出する。映像データ再形成伝達関数は、メタデータ構造からのデータを用いて再生され、抽出再形成伝達関数は、再形成伝達関数に復号化映像データ値を適用することによって、HDR映像データを生成するために使用される。
本発明のさらなる詳細については、添付の図面を用いて説明する。
符号化システムおよび復号化システムを含む映像符号化システムの実施形態を示す図。 2つまでの色ボリューム変換処理および2つの伝達関数を使用して、非HDR、非WCG映像符号化器と互換性のある符号化データロウバイトシーケンスペイロード(RBSP)へと入力HDRおよび/またはWCG映像シーケンスを符号化し、逆色ボリューム変換処理および伝達関数を使用する相補的映像復号化器で復号化映像へとその符号化RBSPを復号化するための処理の第1の例を示す図。 2つまでの色ボリューム変換処理および2つの伝達関数を使用して、非HDR、非WCG映像符号化器と互換性のある符号化データロウバイトシーケンスペイロード(RBSP)へと入力HDRおよび/またはWCG映像シーケンスを符号化し、逆色ボリューム変換処理および伝達関数を使用する相補的映像復号化器で復号化映像へとその符号化RBSPを復号化するための処理の第1の例を示す図。 符号化器によって使用される再形成伝達関数が知覚正規化演算と組み合わされ、復号化器によって使用される逆再形成伝達関数が逆知覚正規化処理と組み合わされた、非HDR、非WCG映像符号化器および復号化器を使用して入力HDRおよび/またはWCG映像シーケンスを符号化および復号化するための処理の第2の例を示す図。 符号化器によって使用される再形成伝達関数が知覚正規化演算と組み合わされ、復号化器によって使用される逆再形成伝達関数が逆知覚正規化処理と組み合わされた、非HDR、非WCG映像符号化器および復号化器を使用して入力HDRおよび/またはWCG映像シーケンスを符号化および復号化するための処理の第2の例を示す図。 図2Aおよび図3Aに示す符号化器によって適用され得る例示的な再形成伝達関数を示すグラフ。 図2Bおよび図3Bに示す復号化器によって適用され得る例示的な逆再形成伝達関数を示すグラフ。
以下に説明する例示的なシステムおよび方法は、効率的にHDRおよび/またはWCG映像を圧縮するために、再形成伝達関数を適応させ、または、HDRおよび/またはWCG映像データを別様に変換および/または再分配し、これにより、該データは、H.265 HEVC(高効率映像符号化)、H.264/MPEG−4 AVC(高度映像符号化)またはMPEG−2符号化器などの非HDR、非WCG符号化器によって量子化および符号化され得、そして、受信器でHDRおよび/またはWCGデータの少なくとも一部を回復するために再構成され得る。伝達関数は、入力映像のグループオブピクチャ、ピクチャまたはサブピクチャウィンドウのレベルでの実際の映像内容に基づき得る。これらの映像処理は、潜在的な値の全範囲にわたってとする代わりに入力映像データの時間的および/または空間的セグメントに実際に存在する色および/または強度情報を圧縮する非線形方程式またはトーンマップを生成することによって達成され得る。このように、非線形値が均一に量子化される場合、均一量子化によって導入されるノイズおよび/または歪みを、人間の視聴者によって知覚されにくくなるように最小限に抑えることができる。加えて、入力映像データを圧縮して符号化するために使用される再形成伝達関数に関するメタデータ情報は、復号化器に送信される自己参照メタデータ構造へと効率的に挿入される。復号化器は、映像データを復号化する際に、対応する逆演算を実行するためにルックアップテーブル(LUT)としてこの伝達関数を回復する。
図1は、符号化器100システムと復号化器システム150とを含む映像符号化システムの実施形態を示す。符号化器100システムは、入力映像を符号化データストリーム109へと符号化、トランスコードおよび/または圧縮するよう構成された、プロセッサ(デジタルシグナルプロセッサ(DSP)または専用映像プロセッサを含む)、メモリ、回路および/または他のハードウェアおよびソフトウェア要素を含むことができる。符号化器システム100は、例えば、映像符号化フォーマットおよび/または圧縮方式に従って符号化データストリーム109を生成するように構成することができる。符号化器システムは、例えば、H.265 HEVC(高効率映像符号化)規格で定義されるようなロウバイトシーケンスペイロード(RBSP)、または、H.264/MPEG−4 AVC(高度映像符号化)もしくはMPEG−2規格で定義されるような符号化ビットストリームを生成し得る。
例示的な符号化器システム100は、映像源102からHDRおよび/またはWCG映像データを受信する。システム100は、プリプロセッサ104を含み、これは、HDRおよび/またはWCGデータを適応的に処理し、これにより、該データは符号化器106およびメモリ105を用いて符号化され得る。符号化器106は、参照ピクチャキャッシュ118内の参照ピクチャを用いて映像データを符号化するMain 10 HEVC符号化器であり得る。符号化映像データは、メモリ105に格納され得、これはまた、復号化器106によって使用されるデータ、例えば、プロセッサ104が使用する伝達関数および/またはトーンマップを実装するルックアップテーブルも格納し得る。プリプロセッサ104および復号化器106は共有メモリ105を使用するものとして示されているが、それらは別個のメモリを使用し得ることが企図される。符号化データは、復号化器システム150の受信器110へビットストリーム109として送信器108を使用して送信され得る。送信器および受信器は、有線、無線または光接続を含む、任意の送信方法を使用し得る。1つの実施形態では、送信器は、インターネットプロトコル(IP)パケットとして符号化映像データをフォーマットして、ネットワークを介して受信器110にIPパケットを送信し得る。ネットワークは、直交振幅変調(QAM:Quadrature Amplitude Modulation)を使用するデジタルケーブルテレビ接続、または、他のデジタル伝送メカニズムであり得る。ネットワークは、有線ケーブルネットワーク、光ファイバネットワークまたは無線ネットワークであり得る。ネットワークは、プライベートネットワークまたはグローバル情報ネットワーク(例えば、Internet(登録商標))であり得る。符号化映像データの送信に加えて、送信器100は、プリプロセッサ104によって実行される処理を記述するメタデータ122を送信する。メタデータ122は別個の信号として示されているが、メタデータ122は、例えば画像エッセンス、画像シーケンス、グループオブピクチャ(GOP:Group of Pictures)、ピクチャ、スライスまたは他のサブピクチャ要素のデータストリーム内またはヘッダ内の付加拡張情報(SEI:Supplemental Enhancement Information)または映像ユーザビリティ情報(VUI:Video Usability Information)メッセージとして、データストリーム109に含まれ得る。SEIまたはVUIメッセージは、矩形の処理ウィンドウを識別し得、該ウィンドウは、入力画像データのxおよびy座標と、識別された処理ウィンドウ上で符号化器によって実行される処理を定義する特定のメタデータとによって定義される。メタデータは、送信データストリームの帯域幅の一部を使用する。したがって、符号化器システム100から復号化器システム150へ送信されるメタデータの量を低減することが望ましい。
復号化器システム150は、受信器110でデータトストリーム109を受信し、符号化データストリーム109をディスプレイ116での提示のために復号化HDRおよび/またはWCG映像へと復号化、トランスコードおよび/または解凍するよう構成された、プロセッサ、メモリ、回路および/または他のハードウェアおよびソフトウェア要素を含むことができる。復号化器システム150は、H.265 HEVC、H.264/MPEG−4 AVCまたはMPEG−2などの映像符号化フォーマットおよび/または圧縮方式に従って符号化データストリーム109を復号化するように構成することができる。非限定的な例として、いくつかの実施形態では、復号化器112は、参照ピクチャキャッシュ120に格納された参照画像を使用するMain 10 HEVC復号化器とすることができる。復号化器112は、メモリ111に結合されており、メモリ111は、符号化ビットストリームを保持し、また、ポストプロセッサ114が使用する逆伝達関数および/またはトーンマップを実装するルックアップテーブルなどの、復号化器が使用するデータも保持し得る。復号化器112およびポストプロセッサ114は、共有メモリ111を使用するものとして示されているが、それらは別個のメモリを使用し得ることが企図される。映像データが復号化された後、該データはポストプロセッサ114によって処理され、ポストプロセッサ114は、符号化器から受信したメタデータに応じて、プリプロセッサ104によって実行される処理を逆転させ、HDRおよび/またはWCG映像データを再生する。復号化HDRおよび/またはWCG映像データを、テレビ、モニタまたは他のディスプレイ116上での再生など、再生用のディスプレイデバイスに出力することができる。
いくつかの実施形態では、符号化器システム100および/または復号化器システム150は、専用のハードウェアデバイスとすることができる。他の実施形態では、符号化器システム100および/または復号化器システム150は、サーバ、コンピュータまたは映像処理デバイスなどの他のハードウェア上で実行されるソフトウェアプログラムとすることができ、または、それらを使用することができる。非限定的な例として、符号化器システム100は、映像サービスプロバイダによって運用される映像符号化器とすることができ、一方、復号化器システム150は、コンシューマテレビディスプレイに接続された、ケーブルボックスなどのセットトップボックスの一部とすることができる。
映像源102によって提供される入力映像データは、画像フレームのシーケンス、グループオブピクチャ(GOP)または画像エッセンスを含むことができる。以下のマテリアルにおいて、用語「フレーム」、「ピクチャ」および「画像」は、単一の表示フレーム、画像またはピクチャに対応する映像データを示すために互換的に使用される。いくつかの実施形態では、ピクチャ内の色は、色空間または色モデルに応じて1つ以上の値を使用してデジタル的に記述することができる。非限定的な例として、赤チャネル、緑チャネルおよび青チャネルの値の組み合わせを介して色が記述されるRGB色モデル、または、輝度値Yおよび2つのクロミナンス値、例えばCrおよびCbによって色が定義される輝度/クロミナンスモデルを用いて、ピクチャ内の色を示すことができる。
入力映像データは、高ダイナミックレンジ(HDR)および/または広色域(WCG)で記述される輝度および/またはクロミナンス値を伴う1つ以上のフレームシーケンスを有するHDR映像とすることができる。非限定的な例として、高ダイナミックレンジを有する映像は、非HDR映像よりも広い範囲の可能な値のスケールで示される輝度値を有することができ、広色域を使用する映像は、少なくともいくつかのチャネルで非WCG映像よりも広い範囲の可能な値の色モデルにて発現されるその色を有することができる。このように、HDR入力映像は、標準または非HDR映像よりも広い範囲の輝度および/またはクロミナンス値を有することができる。
いくつかの実施形態では、HDR入力映像データは、色チャネルあたり8または10ビットなどのより低いビット深度を用いて色値を表す非HDRフォーマットに対して、高ビット深度フォーマット内のRGB値で示されるその色を有することができる。非限定的な例として、HDR入力映像データは、各色チャネルについて16ビット浮動小数点値を用いて線形光RGB領域で表されるRGB色値を伴うEXRファイルフォーマットとすることができる。
図2Aに示すように、符号化器システム200は、処理データの10ビット値への量子化、クロミナンス情報のダウンサンプリング、および、Main 10 HEVC符号化器などの既存の符号化器216を使用して得られたデータの符号化の前に、第1の(中間)色変換演算(色ボリューム変形)202、第1の伝達関数204、第2の(最終)色変換演算206、第2の(再形成)伝達関数208(これは、任意選択の知覚正規化演算210を含み得る)を、線形HDR RGBデータに適用することができる。ブロック202、204、206、208および210は、映像内容の1つ以上の時間的および/または空間的局所化特性に基づいて、非線形曲線上の値へと映像源202からの線形HDR RGB値を変換する圧縮および知覚マッピング演算を実装する。
非限定的な例として、知覚マッピング演算は、映像データセットの内容に合わせて調整することができ、これは、意図される最大サンプル値または最小サンプル値、最小明るさ、平均明るさ、ピーク明るさ、最大コントラスト比、累積分布関数、量子化ステップサイズおよび/またはデータセット内の任意の他の要因に基づいて、HDR/WCG映像データの全てまたは一部を含み得る。いくつかの実施形態では、このような特性をデータセットについて予め決定して指定することができる。あるいは、特性を、処理の様々な段階における、映像の色成分または輝度成分のヒストグラムまたは統計解析により求めることができる。1つの例では、デジタル画像データは、伝達関数またはトーンマッピング演算を適用する前に、処理ウィンドウへとセグメント化され得る。各処理ウィンドウの1つ以上の成分(例えば、Y’CbCr)は、例えば、最小サンプル値、最大サンプル値、平均サンプル値、値、および最大コントラスト(例えば、最大サンプル値の最小サンプル値に対する比)を決定するために分析され得る。これらの値は、単一成分または2つ以上の成分の組み合わせについて計算され得る。これらの値は、処理ウィンドウに適用するための知覚マッピング(例えば、再形成伝達関数および知覚正規化)を決定するために分析され得る。
例示的な知覚マッピングは、符号化器216を用いてより効率的にHDR映像データを符号化できるように、グローバルまたはローカルな時間的または空間的範囲上の入力映像データの内容に合わせて調整される非線形曲線上の線形色情報を再分配するように構成されており、これにより、該データは、図2Bに示す復号化システム220内のHDR映像データとして復号化および再構成され得る。後述するように、限定された時間的または空間的範囲における入力映像の内容に基づく他の色空間への線形色値の変換および非線形曲線の適用は、均一量子化演算を介して導入される歪みおよび/またはノイズのリスクを低減しながら、再構成画像にHDRおよび/またはWCG詳細を提供することができる。いくつかの実施形態では、映像フレームの一部に存在する、および/または、人間の視聴者に最も知覚されやすい強度および色相の範囲に、より大きな数のビットおよび/または量子化レベルを割り当てることができ、一方、色チャネルに存在しない、および/または、視聴者に知覚されにくい強度および色相に、より小さなビットおよび/または量子化レベルを割り当てることができる。
非限定的な例として、入力映像データが夜間に起こるシーンを表す場合、その画像は主に、RGB領域で実質的に一緒に束ねられる暗色を含む可能性がある。このようなシーンでは、RGB領域内のより明るい色は、存在しないか、またはまれである可能性がある。このような状況では、シーン内に存在しない値を省略または強調抑制しつつ、クロミナンスおよび輝度値が、シーン内に実際に存在するクロミナンスおよび輝度値の範囲を含む1つ以上の非線形曲線に再分配されるように、結合知覚マッピングを適応させることができる。このように、以前に一緒に束ねられた暗いクロミナンスおよび輝度値を、(より大きな数の均一量子化ステップを割り当てられた)非線形値の曲線に実質的に均一に広げることができ、一方、あまり一般的ではない、より明るい値を、一緒に圧縮する(より少ない数の量子化ステップを割り当てる)ことができ、あるいは、それらがシーンに存在しない場合には省略すら行うことができる。暗い値を曲線上に広げることができるので、非線形曲線上の値を離散値またはコードワードへと均一に量子化する場合であっても、それらの間の微細な違いを区別することができる。
上述のように、知覚マッピング演算は、ピクチャのシーケンス、単一ピクチャまたはサブピクチャウィンドウについて入力映像の内容に応じて異なる非線形伝達関数を適用するよう変更することができるように、適応的とすることができる。サブピクチャ処理により、処理ウィンドウ、スライス、AVCのマクロブロックまたはHEVCの符号化ツリー単位(CTU:Coding Tree Unit)などの、同じピクチャの異なるサブエリアを、その内容に基づいて異なるように処理することができる。他の実施形態または状況では、知覚マッピング演算を、異なるピクチャについてピクチャレベルで変更することができる。さらに他の実施形態または状況では、知覚マッピング演算を、異なるグループオブピクチャ(GOP)または画像エッセンスなどのピクチャの異なるシーケンスについて、超(supra)ピクチャレベルで変更することができる。知覚マッピング演算を、RGB、Y’CbCr、X’Y’Z’またはI’PT色空間などの任意の所望の色空間にて適用することができる。ピクチャの特定シーケンス、単一ピクチャまたはサブピクチャ要素を表す映像データの内容は、映像データによって表される画素値のヒストグラムを生成することによって決定され得る。例えば、比較的暗いエリアおよび比較的明るいエリアの両方を有する画像は、例えば四分木アルゴリズムを使用してセグメント化され得、これにより、暗いエリアからのデータが処理ウィンドウの1つのセットになり、明るいエリアからのデータはウィンドウの別のセットになる。暗いエリアのウィンドウに適用される知覚マッピングは、明るいエリアに適用されるものとは異なり得、両エリアにおける詳細を維持して再生HDR画像に表示することができる。
1つの実施態様では、知覚正規化ブロック210および/または再形成伝達関数ブロック208は、知覚的にマッピングされたY’CbCr値を生成するために、色変換ブロック206によって提供されるY’CbCr値に知覚マッピング伝達関数を適用することができる。いくつかの実施形態では、知覚マッピング演算は、関連する知覚的にマッピングされたY’CbCr値にY’CbCr値をマッピングする3Dルックアップテーブル(LUT)または複数の1DのLUTを使用することができる。他の実施形態では、知覚マッピング演算は、各色成分を変換するために1つ以上の数式を使用することができる。非限定的な例として、知覚マッピング演算は次のような数式を使用して値を変換することができる:Y’_PM=f(Y’,Cb,Cr)Cb_PM=g(Y’,Cb,Cr)Cr_PM=h(Y’,Cb,Cr)。この例では、関数は各々、入力として3つのY’CbCr値を取り、知覚的にマッピングされたY’CbCr値を出力することができる。
再形成伝達関数を実装するために1つ以上のLUTまたは方程式が使用される場合、符号化システム100から復号化システム150へと対応する逆再形成伝達関数を定義するメタデータを送信することが望ましい場合がある。異なるグループオブピクチャ、ピクチャまたはサブピクチャ処理ウィンドウについて異なる符号化関数を使用し得るので、符号化システム100は、LUTおよび/または方程式のそれぞれを記述するメタデータを復号化システム150へ送信し得る。以下のマテリアルは、効率的なデータ構造(すなわちメタデータ構造)、および、このメタデータを格納して送信するための方法を記述し、これにより、メタデータは、符号化システム100と復号化システム150との間で、全信号帯域幅のうち比較的少量を消費する。
図2Aに示すように、例示的な符号化器200はHDR/WCG線形RGBデータセット上に第1の色変換演算202を行う。この演算は、中間線形色空間、例えば、LMS、XYZまたはYCbCrへと線形RGB値を変形する。この変形は、RGBデータの冗長性を低減し、データを、より圧縮に資するフォーマットにする。しかし、入力データのフォーマットに応じて、ブロック202は、まったく色変換を行わないか、または、単一フレームの異なる部分を含む映像シーケンスの異なる部分に異なる色変換演算を実行し得ることが企図されている。色変換演算202はまた、実行された変換演算、および、シーケンス、フレームまたは画像のどの部分にそれが実行されたか、を示すメタデータを生成し得る。単に変形を識別する代わりに、メタデータは、ブロック202により適用される色変形演算の逆を表す行列係数を含み得る。逆係数を含むメタデータの代わりに、それが色ボリューム変換演算202にて使用された係数を含み得ること、および、逆係数が復号化器204で生成され得ることが企図される。色変換演算202は、第1の伝達関数204により処理することがより容易な色空間内のデータを生成し得る。
伝達関数204は、値のより小さい範囲へと明るいおよび/または暗い画素値を圧縮するガンマ関数であり得る。あるいは、伝達関数204は知覚量子化(PQ:Perceptual Quantization)伝達関数などの知覚伝達関数であり得る。別の代替として、色変換映像データの変形をまったくもたらさない恒等関数であり得る。この関数は、輝度チャネルYにのみ、または、各チャネル(例えば、Y,Cb,Cr)に適用することができ、異なる関数が、映像シーケンスの異なる部分および/またはシーケンスにおける異なるフレームまたはフレームの部分に適用され得る。例えば、画像の比較的暗いエリアの輝度チャネルに適用されるガンマまたはPQ伝達関数は、その画像エリア内のクロミナンスチャネルデータに適用される関連演算(例えば、クロスチャネルオフセットおよびスケーリング演算)をもたらし得る。ブロック204はまた、適用された変形の逆、および、それが適用された画像データの部分を記述するメタデータも生成する。このメタデータは、線形二次、三次またはより高次の方程式として逆伝達関数を記述するパラメータを含み得る。完全な伝達関数は、逆伝達関数の各セグメントをモデル化する、線形、二次または三次方程式の各係数値セットを指定するために、例えば、線形、二次、三次またはより高次のスプライン曲線フィッティング演算を使用して、これらの値から生成され得る。これらの方法を用いて、伝達関数は、ピボットポイントの各連続ペアを結合する関数について線形、二次、三次またはより高次の方程式のピボットポイントのシーケンスおよび係数セットとして指定され得る。
次いで、ブロック204からの色変換および変形データは、ブロック206において最終的な色変換演算の対象となる。この色変換処理は、例えば、特にWCG画像データについて、より知覚圧縮に適しているI’PTまたはY’CbCrなどの色空間に映像データを変換し得る。ブロック206は、知覚正規化および量子化のための処理がより容易である1つ以上の色空間へと画像のシーケンス、単一画像または画像の部分を変換し得る。ブロック202と同様に、ブロック206によって実行される色変換は、恒等関数であり得、その結果、変換はない。あるいは、異なる色変形演算が、映像データの異なる部分上で実行され得る。さらに、ブロック206は、実行された色変換、および、それが適用された映像データの部分(超ピクチャ、ピクチャまたはサブピクチャ)を記述するメタデータを生成することができる。このメタデータは、単にデータの部分および適用された変換を識別し得る。あるいは、変換を識別する代わりに、メタデータは、3×3変換行列の係数を含み得る。上述したように、メタデータは、ブロック206によって実行された色変換またはその逆を記述し得る。この例では、ブロック206は、YCbCr色空間に映像データを変換する。
ブロック206の後、二度色変換された映像データが、第2の伝達関数208の対象となる。関数208は、人間の視覚系によって重要であると知覚される映像情報に、より多くの量子化ステップを実効的に割り当てること、および、重要でないと知覚される映像情報に、より少ない量子化ステップを割り当てることによって、より低いビット深度での符号化のための映像データを準備する再形成伝達関数であり得る。伝達関数208は、人間の知覚にデータを適合させる関数であり得、例えば、処理される映像データの部分における画像内容、意図される最大サンプル値および最小サンプル値、最大明るさまたは輝度コントラストおよび/または量子化ステップサイズに基づいて選択することができるガンマ成分を有するスティーブンスのべき法則(Stevens’ power law)またはウェーバーの法則(Weber law)の伝達関数であり得る。ブロック208は、複数の伝達関数を含み得、そのうちの1つは、特定の映像データセットについて選択される。伝達関数208は、輝度画素のコントラスト感度を考慮するために画像を調整し得、輝度サンプルに適用される変形に基づいて、対応するクロミナンスサンプルを再マッピングし得る。この関数は、処理ウィンドウなどの、フレームのシーケンス、単一フレームまたはフレームの部分を含み得る映像データセットに適用され得る。前処理ステージ内の他のブロックと同様に、再形成伝達関数ブロック208は、適用された伝達関数またはその逆、および、それが適用されたフレームまたはフレームの部分を記述するメタデータを生成することができる。このメタデータは、パラメトリックに、または、値のシーケンスによって伝達関数を記述し得る。適用される伝達関数のパラメータは、伝達関数に提供される映像データを分析することによって決定され得る。
1つの実施態様では、複数の逆伝達関数は、様々な復号化データセットに適用される複数の伝達関数に対応して定義され得る。複数の逆伝達関数を記述する情報は、比較的高いレベル(例えば、画像エッセンス、シーケンスまたはGOPレベル)で画像データにシグナリングされ得、複数の逆伝達関数のうちの特定の1つは、特定のデータセット(例えば、画像、スライスまたはサブ画像処理ウィンドウ)に適用されるように選択され得る。あるいは、伝達関数(1つまたは複数)および伝達関数(1つまたは複数)が適用されるデータセットの表示はともに、例えば、SEIメッセージを使用して、サブピクチャレベルでシグナリングされ得る。
映像データは、例えば、画像データに四分木分解を適用することにより、処理ウィンドウへと分割され得、これにより、各リーフのデータは、特性値(例えば、最大サンプル値および最小サンプル値、最大明るさまたは輝度コントラストおよび/または量子化ステップサイズ)を有する。あるいは、四分木アルゴリズムは、四分木の各リーフにおける画像データの所定割合(例えば、80〜95%)が(1つまたは複数の)所定範囲内のデータ値を有するように、画像を分割し得る。別の代替では、処理ウィンドウは、カラリストによって決定されるように、所望の主観的目標を達成するためにトーンマッピングが適用される領域として指定されることができる。領域形状は、矩形、円形等とすることができ、形状、位置、サイズ等のパラメータを指定することができる。処理ウィンドウを識別する場合、処理ウィンドウ内の映像データの各映像成分の最大値、平均値および最小値を決定して、伝達関数ブロック208にこれらの値を供給することが望ましい場合がある。例えば、システムは、ビンへと画像画素を分割する処理ウィンドウ上でヒストグラムを実行すること、および、処理ウィンドウ内の画素のある割合(例えば、80〜95%)にまたがる連続ビンのセットを選択することによって、最小値、平均値および最大値を決定し得る。最小データ値は、最小データ値を含むビンによって定義される最小値であり得、最大データ値は、最大データ値を含むビンによって定義される最大値であり得、平均値は、全ての選択ビンのすべての値の平均値または中央値であり得る。次いで、ブロック208は、再形成伝達関数および/または知覚正規化器210を適応させ(例えば、あらかじめ定義された伝達関数の特定の1つを選択して)、最小値未満のおよび/または最大値よりも大きい値に割り当てられた量子化ステップの数を減少させながら、最小値と最大値との間に割り当てられた量子化ステップの数を増加させる。適応は、処理ウィンドウを識別するデータをも含むメタデータに記載される。このメタデータは、データストリームで復号化器に送られ、これにより、逆知覚正規化および逆再形成伝達関数が、データストリームから復号化されたデータに適用され得る。メタデータは、複数の逆伝達関数が取得され得るデータ、ならびに、特定のデータセットに適用される選択伝達関数を記述するパラメータを含み得、これにより、選択逆伝達関数をルックアップテーブル(LUT)として再構成し得る。
処理ウィンドウの特定が、再形成伝達関数ブロック208によって実行されるものとして記述されている場合、それが復号化器の他の構成要素によって実行され得ることが企図される。例えば、それは、(図1に示す)映像源102によって、または、中間色変換ブロック202によって実行され得る。処理ウィンドウへと個々のフレームを分割することに加えて、同じアルゴリズムが、それらの共通の特性によってデジタル映像データのフレームをグループ化するために、および/または、個々のフレームの特性を識別するために使用され得る。共通の特性を有するデジタル映像データの部分を符号化処理の早期において識別することは有利であり得、これにより、色変換処理および圧縮伝達関数処理の両方が同一の部分に合わせて調整され得る。
再形成伝達関数208の後、または該係数の一部として、映像データセットは、ブロック210で知覚正規化の対象となり得る。このステップは、映像データのゲイン(スケーリング)およびオフセットを調整し、映像データの知覚圧縮をフレームのグループおよび/またはフレームにわたって、より均一にする。知覚正規化はまた、対応する輝度サンプル上で実行される処理についてクロミナンスサンプルを補償するためにクロスチャネル処理を行い得る。ゲインおよびオフセット値またはそれらの逆、ならびに、それらが適用された画像データの部分の特定は、メタデータとして提供される。均一に知覚変換されたデータを伝達関数204および208が生成する場合、または、映像データにとって均一に知覚変換されることが重要でない場合、知覚正規化は使用されなくてもよい。
Main 10 HEVC符号化器を使用するこの例では、伝達関数208および/または任意選択の知覚正規化処理210によって提供される正規化知覚圧縮データは、量子化器212にて10ビット値に量子化される。伝達関数208および/または知覚正規化器210の出力サンプルが浮動小数点値である場合、量子化器212は、浮動小数点から10ビット固定小数点値へ画素サンプルを変換し得る。出力サンプルがNビット固定小数点値(N>10)である場合、量子化器は、Nビットサンプルの10個の最上位ビット(MSB:Most Significant Bit)を選択し得、または、11番目ビットに基づいてこれらの値を丸め得る。ブロック202、204、206、208および210によって実行される前処理のため、より知覚的に顕著な画像データが、より知覚的に顕著でないデータよりもより多くの数の量子化レベルを受け取る。量子化器212が色成分についてスカラーまたはベクトル量子化を採用し得ることが企図される。
次に、ブロック214は、クロミナンス情報をダウンサンプリングして4:2:0画素へと4:4:4画素を変換する。クロミナンスサンプルの解像度低下は、輝度よりも低い空間解像度で色を知覚する人間の視覚系にとって、比較的気付かれにくいものである。クロミナンス情報をダウンサンプリングするために実行される処理を定義するメタデータは、符号化器のダウンサンプリングブロック214からのメタデータに追加される。このメタデータは、例えば、ダウンサンプリングされたデータを生成するために使用された二次元空間フィルタまたはダウンサンプリングされたデータから空間的にアップサンプリングされたデータを生成する逆フィルタのカーネルを記述し得る。メタデータはまた、サブサンプリング演算で任意の位相シフトオフセットを指定し得る。次いで、符号化器216は、前処理され、量子化およびダウンサンプリングされたデータを符号化し、出力データストリームを生成する。1つの実施形態では、メタデータは、付加拡張情報(SEI)メッセージとしてまたは映像ユーザビリティ情報(VUI)メッセージとしてデータストリームで符号化される。ブロック214は4:4:4画素を4:2:0画素に変換するものとして示されているが、他の変換、例えば、4:4:4画素から4:2:2または4:1:1画素フォーマットへの変換が実行され得ることが企図される。これらの代替のダウンサンプリングフォーマットのいずれかがブロック214によって生成される場合、対応するアップサンプリングが、復号化システムにおける対応するブロックによって実行されるであろう。
図2Bに示す復号化システム220は、復号化器222でデータストリームを受信する。例示のMain 10 HEVC復号化器222は、メタデータを抽出し、符号化器216により実行される符号化演算を逆転させて4:2:0画素フォーマットで10ビット映像データを生成する。クロミナンスダウンサンプラ214によって生成されるメタデータは、アップサンプラ224に適用され、アップサンプラ224は、例えば空間補間フィルタに4:2:0サンプルを適用することにより、4:2:0サンプルから4:4:4画素フォーマットサンプルを再構成する。これらのサンプルは、浮動小数点値に4:4:4画素サンプルを変換する、または、固定小数点サンプルにゼロ値の上位ビットを追加し得る逆量子化器226に提供される。逆量子化器226によって実行される演算は、量子化器212によって実行される量子化演算を逆転させる傾向がある。
ブロック228は、知覚正規化ブロック210から受信したメタデータに基づいて、相補的ゲインおよびオフセット演算を実行して、知覚正規化フィルタ210によって実行されるゲインおよびオフセット調整を逆転させる。同様に、ブロック230は、再形成伝達関数208の逆である伝達関数を適用する。これは、メタデータ内のパラメータから発生する逆スティーブンス法則または逆ウェーバー法則伝達関数であり得、または、それは、線形化またはより高次の特性の適用フィルタ特性またはラインセグメントのいずれかのサンプルを表すメタデータの値から再生される伝達関数であり得る。上記のように、複数の逆伝達関数が、シーケンスまたはGOPレベルにおいて指定されていてもよく、これらの伝達関数のうちの1つが、映像データセット(例えば、フレームまたはサブフレーム)について、映像データセットの内容に応じてシグナリングされ得る。
同様に、復号化器220のブロック232、234および236はそれぞれ、ブロック206によって実行される最終的な色変換演算、ブロック204によって実行される第1の伝達関数および符号化器200のブロック202によって実行される中間色変換演算を逆転させ得る。これらの演算は、メタデータによって示されるように色変換演算および伝達関数に関連付けられた(1つまたは複数の)フレームの領域を表すデータセットに対してのみ実行される。逆色変換ブロック236によって提供される出力データは、再構成された線形HDRおよび/またはWCG RGB信号である。画像暗部の詳細およびテクスチャならびに画像の暗部と明部との両方の色値などの知覚的に重要なデータは、再構成データに保存される一方、知覚的にあまり重要でないデータは失われ得る。図2Aおよび図2Bに示されているシステムならびに以下の図3Aおよび図3Bに示されているシステムは、線形HDR RGBデータを受信して再構成するように示されているが、それらが他のHDRおよび/またはWCGデータを受信および再構成し得ることが企図される。
図3Aおよび図3Bは、図2Aおよび図2Bに示されている符号化および復号化システムの変形例を記載している。図3Aおよび図3Bに示すブロックの多くは、同じ番号を有する図2Aおよび図2B内のブロックと同じである。簡潔にするため、これらのブロックの演算は、個別には本明細書中に記載されていない。一方の図2Aおよび図2Bならびに他方の図3Aおよび図3Bにおける違いの1つは、知覚再形成ブロック304、および、図3Bに示す対応する逆知覚再形成ブロック327である。ブロック304は、再形成伝達関数306を知覚正規化演算308と組み合わせ、同様に、ブロック327は、逆知覚正規化演算326および逆再形成伝達関数ブロック328を組み合わせる。
図2Aおよび図2Bに示すシステム200および220の間の、図3Aおよび図3Bに示す各システム300および320に対する他の違いは、処理ストリームにおけるクロミナンスダウンサンプリング処理302およびクロミナンスアップサンプリング処理330の位置である。図3Aにおいて、ダウンサンプリング処理302は、最終的な色変換処理206によって提供されたデータ上で演算される。同様に、図3Bにおいて、アップサンプリング処理330によって提供されるアップサンプリング出力値は、処理206の逆である逆色変換処理232に適用される。ダウンサンプリングおよびアップサンプリング処理の再配置により、ダウンサンプリングされたクロミナンス値を有する画素に対して知覚再形成処理が実行されることとなる。この変形例により、図2Aに示す対応ブロック208,210および212ならびに図2Bに示すブロック226、228および230によって処理されるよりも、図3Aに示すブロック306、308、310ならびに図3Bに示すブロック324、326および328によって処理されるクロミナンスサンプルがより少なくなるので、より少ない処理をもたらし得る。上記のように、再形成伝達関数306を伴って知覚正規化処理308によって実行されるオフセットおよびゲイン調整を含むことと、逆再形成伝達関数328を伴って逆知覚正規化処理326によって実行される逆オフセットおよびゲイン調整を含むこととにより、さらなる処理の低減を達成し得る。したがって、図3Aおよび図3Bに示す符号化器および復号化器システムは、図2Aおよび図2Bに示す符号化器および復号化器よりもより効率的であり得る。
1つの例では、入力色成分をx(例えばY,Cb,Cr)とすると、f(x)として、すなわちf(x)に基づいて、逆再スケーリングの出力を計算することができる。N個のセグメントを有する区分関数について、N個の関数f(x)は、0≦i<Nとして、以下のように定義することができる。
1つの実施態様では、本明細書でピボットと称されるN+1個のセグメント境界ポイントxと、区分関数についてのパラメータとをシグナリングすることができる。f(x)が次数Mを有する多項式である場合、多項式を記述するメタデータは、M+1個のパラメータを含む。シグナリング値に基づいて、逆再形成伝達関数に対応するLUTを、復号化システム150において再構成することができる。異なるLUTを、各色成分について使用することができ、どのLUTが所与の画像またはサブ画像処理ウィンドウにおける所与の色成分について再形成するために使用されるかについての指示も、メタデータにてシグナリングすることができる。複数(L個)の逆再形成伝達関数をシグナリングするために使用されるメタデータの量を低減するために、L個のLUTについての対応する区分関数を、符号化システム100から復号化システム150へと送信されるメタデータを含む自己参照メタデータ構造にてシグナリングし得る。
図4および図5はそれぞれ、例示的な再形成伝達関数および逆伝達関数を示す。図4に示す関数410、420および430は、それぞれ異なったガンマ値を有するガンマ再形成伝達関数であり、図5に示す関数510、520および530は、対応する逆ガンマ伝達関数である。逆伝達関数510は、4つのピボットポイントによって定義される3つのセグメントへと分割される。最初のピボットポイントA、および最終ピボットポイントNは、すべての3つの伝達関数について共通である。関数510は、ピボットポイントAおよびNに加えて2つのピボットポイント510Bおよび510Cを有する。ピボットポイントAおよび510B間のセグメントがほぼ線形である(例えば、その線形係数の5%未満である二次係数を有する)ことに留意されたい。ポイント510Bおよび510C間のセグメントは曲線を示し、したがって、有意な二次および三次係数を有し得る。ピボットポイント510CおよびピボットポイントN間のセグメントも、ほぼ線形である。
曲線520によって定義される伝達関数は、ポイントAおよび520B間のセグメントがほぼ線形であり、ポイント520Bおよび520C間のセグメントが曲線であり、ポイント520CおよびN間のセグメントがほぼ線形であるという点で、510によって定義されたものと同様である。曲線530は、より多数のピボットポイントを有する伝達関数を示し、この場合は6個、すなわち、A、530B、530C、530D、530EおよびNである。一方でポイントAおよび530B間、他方でポイント530EおよびN間のセグメントの両方は、ほぼ線形である。伝達関数530は、4つのピボットポイント530B、530C、530Dおよび530Eによって定義された3つの曲線セグメントを有している。
以下のマテリアルは、符号化システム100から復号化システム150(図1に示す)に送信されたメタデータで伝達関数がどのように表されるかについて定義する例示の構文を提示する。
表1〜表5の例示の構文では、多数の再形成伝達関数NumLutReshapeが、メタデータにてシグナリングされ得、インデックス値lut_reshape_index[c]が、特定の映像データセットの色成分cについて逆再形成関数を選択するために使用され得ることが提案されている。したがって、NumLutReshape LUT(表1〜表3に示されている)を定義するメタデータは、比較的高いレベルにおいて(例えばシーケンスパラメータセット(SPS:Sequence Parameter Set)で)メタデータに含まれ得る一方、映像データセットの色成分に使用するための特定LUT(表4および表5に示されている)のreshapeing_idを指定するメタデータが、より低いレベルにおける(例えばピクチャパラメータセット(PPS:Picture Parameter Set)で)メタデータ内にあり得る。以下のマテリアルは、復号化器150における逆再形成演算において使用されるメタデータに関する。したがって、簡略化のために、本明細書に記載する逆再形成演算を単に再形成演算と称する場合がある。
以下の例は、高ダイナミックレンジ(HDR)および/または広色域(WCG)を有する映像シーケンスの符号化および復号化のための映像符号化方式を使用するという概念に関連する。より具体的には、それらは、符号化器または復号化器の処理から得られた映像データの処理および再構成を記載している。符号化器または復号化器の処理の例は、MPEG−4高度映像符号化(AVC)および高効率映像符号化(HEVC)である。ある例では、前処理および後処理が、より良好な符号化効率および視覚品質のためのHDR映像の符号化および復号化再形成処理で使用され、再形成パラメータの効率的なシグナリングが提案される。別の例では、HDR適応情報は、SEIメッセージを介してシグナリングされる。
以下のマテリアルは、参照により本明細書に組み込まれるHEVC規格(勧告ITU−T H.265|国際標準ISO/IEC23008−2、HEVCバージョン2、2014年10月)(以下、「HEVC規格」)に関して例示の構文およびテキスト修正を提示する。これらの修正は、HDR映像についての再形成およびHDR適応処理を規定する。構文は、H.265映像信号内で再形成伝達関数を記述するメタデータを送信するために使用され得る自己参照データ構造を定義し、これにより、HDR/WCG映像データが、H.265映像信号から映像データ復号化器より再構成され得る。
1つの例では、再形成およびHDR適応処理は、HEVC Main 10復号化の後に適用される。パラメータの選択に応じて、復号化処理は、出力表示および視聴のためにHDRおよびSDRバージョンの両方を生成することができる。
以下の構文は、追加の再形成処理に順応するように拡張することができる。例えば、cが色成分を示すreshaping_mode[c]の異なる値を、異なる再形成処理のために使用することができる。最近傍同一位置のサンプルに加えて、他の近傍値およびフィルタリングされた値を使用することができる。
他の例では、構文要素のシグナリングを、VPS、SPS、PPS等で行うことができる。固定小数点計算について、他のビット深度精度、丸め、切り捨て、中間演算等を使用することができる。
表1に示す構文は、HEVC規格のセクション7.3.2.2.1で指定される一般シーケンスパラメータセット(SPS)ロウバイトシーケンスペイロード(RBSP)構文の一部を置き換えるためにHEVC規格を修正する。省略記号は、HEVC規格の一般シーケンスパラメータセットから変更のない部分を示し、これは以下のマテリアルで参照されず、簡潔さのために省略されている。
11行目、12行目、22行目および23行目の項目は、HEVC規格の構文に追加または修正される。2つの新しい値が、構文について定義される:sps_hdrwcg_extension_flag(8行目)およびsps_extension_3bits(11行目)。22行目において、sps_hdrwcg_extension_flagが1に等しい場合、23行目におけるsps_hdrwcg_extension()構文構造は、RBSP構文構造のSPS内に存在する。sps_hdrwcg_extension_flagが0に等しい場合、sps_hdrwcg_extension()構文構造は存在しない。構文構造が存在しない場合、sps_hdrwcg_extension_flagの値は、0に等しいと推定される。
sps_extension_3bits(24行目)が0に等しい場合、いかなるsps_extension_data_flag構文要素も、SPSロウバイトシーケンスペイロード(RBSP)構文構造内に存在しない。存在する場合、sps_extension_3bitsは、HEVC規格についての修正構文に準拠するRBSPにおいて0に等しくなる。0に等しくないsps_extension_3bitsの値は、ITU−T|ISO/IECによって将来の使用のために予約されている。復号化器は、sps_extension_3bitsの値を0に等しくはさせず、SPS NALユニット内のすべてのsps_extension_data_flag構文要素を無視することになるであろう。存在しない場合、sps_extension_3bitsの値は、0に等しいと推定される。
sps_hdrwcg_extension()は、表2に示すように定義され得、これは、1行目で、以下の表3で定義されるhdr_reshaping_sps_table()を含む。これらの構造の両方が、HEVC規格に追加される。
2行目の値reshape_output_luma_bit_depth_incrementは、HEVC規格で指定された入力輝度成分(8+bit_depth_luma_minus8)のビット深度に対して再形成処理の出力輝度成分のサンプルビット深度増分を指定する。reshape_output_luma_bit_depth_incrementの値は、0〜8の範囲を有する。出力輝度サンプルのビット深度、BitDepthReshapeOutputLumaは、次のように導かれる。
同様に、3行目の値reshape_output_chroma_bit_depth_incrementは、入力クロミナンス成分(8+bit_depth_chroma_minus8)のビット深度に対して再形成処理の出力クロミナンス成分のサンプルビット深度増分を指定する。reshape_output_chroma_bit_depth_incrementの値は、0〜8の範囲を有する。出力クロミナンスサンプルのビット深度、BitDepthReshapeOutputChromaは、次のように導かれる。
表3は、表2の1行目に示すhdr_reshaping_sps_table()についての構文を提供する。
reshape_present_flag(1行目)が1に等しい場合、再形成パラメータについての構文要素が存在している。reshape_present_flagが0に等しい場合、再形成パラメータについての構文要素は存在せず、再形成演算は存在しない。存在しない場合、reshape_present_flagの値は0に等しいと推定される。
num_lut_reshape_greater1_flag(3行目)が0に等しい場合、1つの再形成LUT関数のみが存在する。num_lut_reshape_greater1_flagが1に等しい場合、複数の再形成LUT関数がシーケンスパラメータセット(SPS)で定義されている。存在しない場合、num_lut_reshape_greater1_flagの値は0に等しいと推定される。
複数の再形成関数が存在する場合、このような関数の数は、2+num_lut_reshape_minus2で与えられる(5行目)。この例では、num_lut_reshape_minus2の値は、0〜15の範囲を有している。各再形成関数は、ルックアップテーブル(LUT)を定義する。再形成LUTの数、NumLutReshapeは、次のように導かれる。
表3の構文では、変数kは、特定の再形成関数(LUT)を指定するために使用される。各関数は、セグメントへと分割され、各セグメントは方程式でモデル化される。値2+reshape_num_pivots_minus2[k](7行目)は、k番目の区分セグメント化関数におけるピボット値の数を指定する。この例では、reshape_num_pivots_minus2[k]の値は0〜7の範囲を有する。
また、表3において、変数iは、特定のreshape_coded_pivot_value[k][i](9行目)を指定するために使用される。この値は、k番目のLUTについてのi番目のピボット値である。最後のピボットポイントを除く各ピボットポイントは、別個の再形成伝達関数を有している。この例では、reshape_coded_pivot_value[k][i]の値は0〜1023の範囲である。
値smoothness_degree[k][i](12行目)は、再形成伝達関数kのセグメントiの多項式関数についての平滑条件を指定する。この実施態様において、smoothness_degree[k][i]の値は0〜3の範囲を有する。この値は、係数のセット上の制約を指定する。0の値は、制約がないことを示す。1の値は、伝達関数を定義するセグメントが連続していること、すなわち、1つのセグメントの開始エンドポイントは、以前のセグメントの終点と同じであることを示している。2の値は、ピボットポイントにおける伝達関数の傾きが、現在および以前のセグメントの両方について同じであることを示している。以下に説明するように、smoothness_degree値は、第1のピボットポイントを除くすべてのピボットポイントについて提供される係数の数を制限する。
値1+poly_degree_of_freedom_minus1[k][i](13行目)は、テーブルkのピボットポイント(セグメント)iの多項式関数についてシグナリングされた係数の数を指定する。この例では、poly_degree_of_freedom_minus1[k][i]の値は、0と(3−smoothness_degree[k][i])との間の範囲を有している。したがって、smoothness_degree[k][i]とpoly_degree_of_freedom_minus1[k][i]との組み合わせは、伝達関数kについて指定される係数の数を決定する。値1+poly_degree_of_freedom_minus1は、現在のピボットポイントと次のピボットポイントとの間の伝達関数をモデル化するために使用される方程式の次数を指定する。制約されたセグメントの係数値は、以前のセグメントを記述する方程式から推定され得るので、係数セットにおける係数の数は低減され得る。例えば、以前のセグメントを定義する方程式のエンドポイントから第1の係数が推定されるので、1の平滑度および2の次数を有するセグメントについて、係数セットは、2つの係数のみを含む。同様に、2の平滑度および2の次数を有するセグメントは、その係数セットにおいて1つの係数のみを有する。
値poly_free_coef[k][i][j](15行目)は、再形成伝達関数kのセグメントiの多項式関数についての多項式係数jを指定する。poly_coef[k][i][j]の値は、−221〜221−1(両端を含む)の範囲を有する。
表1、表2および表3は、復号化HEVC映像データからHDR/WCG映像データを回復するために使用され得る再形成伝達関数を記述するメタデータをシグナリングするために使用され得る自己参照データ構造(すなわち、メタデータ構造)を定義する。これらの表は、シーケンスレベルで送信されるメタデータを定義する。
表4は、HEVC規格のRBSP構文の一般ピクチャパラメータセット(PPS)への修正を定義する。上記の一般シーケンスパラメータセットと同様に、省略記号は、構文の変更のない部分を示し、これは以下で参照されていない。これらの部分は、簡潔にするために削除されている。
8行目、9行目、19行目および20行目の項目は、HEVC規格の構文で追加または修正される。pps_hdrwcg_extension_flag(8行目)が1に等しい場合(19行目)、pps_hdrwcg_extension()構文構造(20行目)は、RBSP構文構造のPPS内に存在する。pps_hdrwcg_extension_flagが0に等しい場合、pps_hdrwcg_extension()構文構造は存在せず、再形成演算が存在しない。reshape_present_flagが0に等しい場合、pps_hdrwcg_extension_flagを1に設定することができない。存在しない場合、pps_hdrwcg_extension_flagの値は、0に等しいと推定される。
pps_extension_3bits(9行目)が0に等しい場合、いかなるpps_extension_data_flag構文要素も、PPS RBSP構文構造内に存在しない。存在する場合、pps_extension_3bitsは、HEVC規格に準拠するRBSPにおいて0に等しくなる。0に等しくないpps_extension_3bitsの値は、ITU−T|ISO/IECによって将来の使用のために予約されている。復号化器は、pps_extension_3bitsの値を0に等しくはさせず、PPS NALユニット内のすべてのsps_extension_data_flag構文要素を無視することになるであろう。存在しない場合、pps_extension_3bitsの値は、0に等しいと推定される。HEVC規格に適したpps_hdrwcg_extension()の1つの例示の構文は、表5によって定義される。
値lut_reshape_index[c](4行目)は、色成分c(例えばY、CbまたはCr)についての再形成伝達関数を定義する再形成テーブルのインデックスを指定する。存在しない場合、lut_reshape_index[c]の値は、0に等しいと推定される。lut_reshape_index[c]の値は、num_lut_reshape_minus2+1以下となるであろう。
値reshaping_mode[c](7行目)は、k番目の再形成伝達関数についてのLUTがどのようにインデックス付けされ、再形成処理で使用されるかを指定する。1つの実施態様では、reshaping_mode[c]の値は、0〜15の範囲を有する。2つのモードは、以下に詳細に記載されている。第1のモードでは、各色成分が、それぞれの伝達関数に関連付けられている。第2のモードは、クロスチャネル関数、この場合はクロス輝度関数を使用し、これにより、各クロミナンスデータセットは、特定のクロミナンス成分についての入力オフセットおよび出力オフセットで輝度伝達関数によって修正される。他のモード、例えば、Cbについての伝達関数を使用してCrについてのサンプル値を決定するクロスチャネル関数を実装し得ることが企図される。これらの他のモードのそれぞれは、別個のreshaping_mode[c]の値により表され得る。
値lut_offset_1[c](9行目)は、再形成処理についての入力オフセット値を指定する。lut_offset_1[c]の値は、−2(reshape_input_c_bit_depth_minus8+8)〜2(reshape_input_c_bit_depth_minus8+8)−1(両端を含む)の範囲を有する。構文において、左シフト演算は、記号「≪」で表され、右シフト演算は、記号「≫」で表される。したがって、値2(reshape_input_c_bit_depth_minus8+8)はまた、1≪(reshape_input_c_bit_depth_minus8+8)としても表され得る。この例では、各クロミナンスデータ値は、輝度LUTに適用される前にオフセット値で合計される。
値lut_offset_2[c](10行目)は、再形成処理についての出力オフセット値を指定する。lut_offset_2[c]の値は、−2(reshape_output_c_bit_depth_minus8+8)〜2(reshape_output_c_bit_depth_minus8+8)−1(両端を含む)の範囲を有する。この例では、各クロミナンス値についてのLUTの出力値は、そのクロミナンス成分についての出力オフセット値で合計される。
表1〜表5によって説明される構文は、図1のシステム100などの符号化システムから図1に示すシステム150などの復号化システムへ1つ以上の再形成伝達関数を定義するメタデータを送信するために使用されるHEVC規格についての自己参照データ構造を定義する。復号化システムがメタデータを受信する場合、それは、(1つまたは複数の)逆伝達関数を記述する(1つまたは複数の)LUTを生成し、復号化HEVCデータからHDR/WCGデータを再構成する。以下は、(1つまたは複数の)生成LUTに復号化データを適用するHDR再形成処理を含むHDR/WCG再構成処理の説明である。
HEVC規格により定義されるように、復号化映像データは、輝度およびクロミナンス成分の両方を含み得る。これらの成分のフォーマットは、値ChromaArrayTypeによって指定される。輝度サンプルのみが存在する場合、すなわちモノクロ画像の場合、ChromaArrayTypeは0であり、サンプルが4:2:0フォーマットである場合、ChromaArrayTypeは1であり、それらが4:2:2フォーマットである場合、ChromaArrayTypeは2であり、それらが4:4:4フォーマットである場合、ChromaArrayTypeは3である。HDR再形成処理は、再構成輝度ピクチャサンプルアレイSで、ChromaArrayTypeが0に等しくない場合、入力としてのクロミナンスピクチャサンプルアレイSCbおよびSCrで、また、修正再構成ピクチャサンプルアレイS’で、ChromaArrayTypeが0に等しくない場合、出力としてのHDR再形成後のアレイS’CbおよびS’Crで、呼び出される。
再形成処理への入力は、再構成輝度ピクチャサンプルアレイrecPictureであり、ChromaArrayTypeが0に等しくない場合、アレイrecPictureCbおよびrecPictureCrである。入力ビット深度は、BitDepthReshapeInputによって指定される。
この処理の出力は、HDR再形成処理reshapePictureの後の修正再構成ピクチャサンプルアレイであり、ChromaArrayTypeが0に等しくない場合、アレイreshapePictureCbおよびreshapePictureCrである。出力ビット深度は、BitDepthReshapeOutputにより指定される。値ChromaArrayTypeは、HEVC規格で定義されている。
修正再構成ピクチャサンプルアレイreshapePictureにおけるサンプル値、ならびに、ChromaArrayTypeが0に等しくない場合には、アレイreshapePictureCbおよびreshapePictureCrにおけるサンプル値は、それぞれ最初に、再構成ピクチャサンプルアレイrecPictureにおけるサンプル値、ならびに、ChromaArrayTypeが0に等しくない場合には、アレイrecPictureCbおよびrecPictureCrにおけるサンプル値に等しく設定される。
0とPicWidthInSamplesY−1との間の範囲のxP、および、0とPicHeightInSamplesY−1との間の範囲のyPを伴う再形成輝度サンプルreshapePicture[xP][yP]は、入力として、輝度サンプル位置(xP,yP)およびサンプルアレイrecPictureLで以下に指定されるように、輝度サンプル値についてHDR再形成処理を呼び出すことによって導かれる。値PicWidthInSamplesYおよびPicHeightInSamplesYは、HEVC規格で定義されている。
同様に、0とPicWidthInSamplesC−1との間の範囲のxCおよび0とPicHeightInSamplesC−1との間の範囲のyCを伴う再形成クロミナンスサンプルreshapePictureCb[xC][yC]は、入力として、クロミナンスサンプル位置(xC,yC)およびサンプルアレイrecPictureCbで以下に指定されるように、クロミナンスサンプル値のHDR再形成処理を呼び出すことによって導かれる。値PicWidthInSamplesCおよびPicHeightInSamplesCは、HEVC規格で定義されている。
0とPicWidthInSamplesC−1との間の範囲のxCおよび0とPicHeightInSamplesC−1との間の範囲のyCを伴うCr信号についての再形成クロミナンスサンプルreshapePictureCr[xC][yC]は、Cbサンプルと同じ方法で導かれる。
1つの実施形態で使用されるHDR再形成処理について、以下に説明する。この処理への入力は、現在のピクチャの左上の輝度またはクロミナンスサンプルおよび指定位置での輝度またはクロミナンスサンプルに対して、成分cについて輝度またはクロミナンスサンプル位置を指定する輝度またはクロミナンス位置(xP,yP)である。
この処理の出力は、HDR再形成輝度またはクロミナンスサンプル値reshapeSampleである。reshapeSampleの値は、次の順序付けられたステップを適用することによって、各色成分c(Y=0、Cb=1およびCr=2)について導かれる。
cが0に等しい場合、BitDepthReshapeOutputは、BitDepthReshapeOutputLumaに等しく設定され、BitDepthReshapeInputは、(8+bit_depth_luma_minus8)に等しく設定され、reshape_output_bit_depth_incrementは、reshape_output_luma_bit_depth_incrementに等しく設定される。
cが0に等しくない場合、BitDepthReshapeOutputは、BitDepthReshapeOutputChromaに等しく設定され、BitDepthReshapeInputは、(8+bit_depth_chroma_minus8)に等しく設定され、reshape_output_bit_depth_incrementは、reshape_output_chroma_bit_depth_incrementに等しく設定される。
reshape_present_flagが0に等しいか、または、pps_hdrwcg_extension_flagが0に等しい場合、reshapeSampleは、成分cについてrecPicture[xP][yP]≪reshape_output_bit_depth_incrementに等しく設定される(すなわち、recPicture[xP][yP]は、reshape_output_bit_depth_incrementビット位置によって左にシフトされる)。
reshape_present_flagが0に等しくなく、かつ、pps_hdrwcg_extension_flagが0に等しくない場合、reshaping_mode[c]が0に等しければ、reshapeSampleは、次の順序付けられたステップを適用することによって導かれる。
A)再形成テーブルインデックスの値、LutIndxがlut_reshape_index[c]に等しく設定される。
B)変数idxは、LutIndxによって示される再形成ルックアップテーブルを用いて、成分cについてサンプル値recPicture[xP][yP]の入力で表6に以下で指定されるように区分関数インデックスの特定を呼び出すことによって導かれる。
C)PolyOrder[LutIndx][idx]は、poly_degree_of_freedom_minus1[LutIndx][idx]+smoothness_degree[LutIndx][idx]に設定される。
D)多項式再形成テーブルLutIndxについてセグメントidxの係数についてのPolyCoef[LutIndx][idx][j]の値は、以下のように指定される。
PolyCoef[LutIndx][idx][j]の値は、j=0〜3について0に等しく設定される。
smoothness_degree[LutIndx][idx]が0に等しい場合、PolyCoef[LutIndx][idx][j]は、0とPolyOrder[LutIndx][idx]との間の範囲のjについてpoly_free_coef[LutIndx][idx][j]に等しく設定される。
smoothness_degree[LutIndx][idx]が0よりも大きい場合、PolyCoef[LutIndx][idx][j]は、以下の表7で指定されるように多項式係数処理の導出を呼び出すことによって導かれる。
E)reshapeSampleの値は、以下のように導かれる。
そうでなければ、reshaping_mode[c]が0よりも大きい場合、reshapeSampleは、次の順序付けられたステップを適用することによって導かれる。
A)再形成テーブルインデックスLutIndxの値は、lut_reshape_index[c]に等しく設定される。
B)ChromaArrayTypeが0に等しい場合、変数idxは、LutIndxによって識別される再形成テーブルを用いて成分cについてのサンプル値recPicture[xP][yP]の入力で以下の表6で指定されるように区分関数インデックスの特定を呼び出すことによって導かれる。
C)ChromaArrayTypeが0に等しくない場合、変数idxは以下のように導かれる。
・recPictureLumaの値は、輝度成分c=0について入力輝度サンプル値recPicture[2*xP][2*yP]に等しく設定される。
・変数idxは、再形成テーブルLutIndxを用いて輝度成分c=0についてサンプル値recPictureLumaの入力で以下の表6で指定されるように区分関数インデックスの特定を呼び出すことによって導かれる。
D)PolyOrder[LutIndx][idx]の値は、poly_degree_of_freedom_minus1[LutIndx][idx]+smoothness_degree[LutIndx][idx]に設定される。
E)多項式再形成テーブルLutIndxについてセグメントidxの係数についてのPolyCoef[LutIndx][idx][j]の値は、次のように指定される。
・PolyCoef[LutIndx][idx][j]の値は、j=0〜3について0に等しく設定される。
・smoothness_degree[LutIndx][idx]が0に等しい場合、PolyCoef[LutIndx][idx][j]は、j=0〜PolyOrder[LutIndx][idx]についてpoly_free_coef[LutIndx][idx][j]に等しく設定される。
・そうでなければ(smoothness_degree[LutIndx][idx]が0よりも大きい)、PolyCoef[LutIndx][idx][j]は、以下の表7で指定されるように多項式係数処理の導出を呼び出すことによって導かれる。
F)reshapeSampleの値は、次のように導かれる。
上述したように、再形成サンプル値の生成の一部は、伝達関数についての区分関数インデックスの特定である。例示的な処理は、表6でコンピュータコードにより記述される。この処理への入力は、テーブルインデックスkについてのサンプル値Sであり、出力は、区分関数のインデックスidxSである。値Sが第1のピボットポイント未満である場合、Sは第1のピボットポイントに設定される。Sが次から最後までのピボットポイントよりも大きい場合、Sは次から最後までのピボットポイントに設定される。次いで、idxSは、0からピボットの数−1までインクリメントされ、Sは次のピボット値と比較される。Sが、(IdxSによって識別される)次のピボット値未満であって、(idxS+1によって識別される)現在のピボット値よりも大きい場合、idxSについての値が求められている。idxSが求められる前にループが終了した場合、idxSは、次から最後までのピボットポイントのインデックスに設定される。
以下は、上述したメタデータを用いて多項式係数を導くための例示的な処理の説明である。この処理への入力は、テーブルインデックスkおよび多項式セグメントインデックスiであり、この処理の出力は、j=0〜PolyOrder[k][i]について多項式係数PolyCoef[k][i][j]である。係数を導くための例示的な処理は、表7に示されている。第1のセグメント(i==0)について、すべての係数が構文で指定される。平滑度0について、すべての係数が、後続のセグメントについて指定される。1に等しい平滑度について、現在のセグメントの開始ポイントが以前のセグメントの終了ポイント(すなわち、ピボットポイントにおける以前のセグメントの値)となるよう制限されるので、第1の(オフセット)係数は指定されない。2に等しい平滑度について、伝達関数の現在のセグメントの傾きが伝達関数の以前のセグメントのピボットポイントにおける傾きとなるよう制限されるので、第1の(オフセット)係数も第2の(傾き)係数も指定されない。
上記のマテリアルは、メタデータ構造から再構成された方程式に復号化サンプル値を適用することによって「オンザフライ」で再形成サンプル値を生成することを記述している。しかし、各伝達関数の各セグメントを記述する方程式が、1つ以上のルックアップテーブル(LUT)に格納されたデータを生成するために抽出および使用され得ることが企図される。このデータは、例えば、方程式の各値を事前計算し、入力サンプル値によってアドレス指定されたセル内に計算値を格納することによって、生成され得る。この実施態様では、復号化サンプル値は、再形成サンプル値を生成するためにセグメントに関連付けられたLutIndexに対応するLUTにアドレス入力として適用されるであろう。
SPSまたはPPS内の自己参照データ構造において区分伝達関数を定義するメタデータをシグナリングする代わりに、伝達関数は、RBSPの1つ以上の付加拡張情報(SEI)メッセージでシグナリングされ得る。例と同様に、表8に示す例示の構文は、適用されるいくつかの所定の伝達関数の1つを指定する。この表に示す伝達関数は、復号化器にとって既知であり、SEIメッセージでシグナリングされる。識別された伝達関数は、SEIメッセージ内パラメータ値によって、ならびに、スケールおよびオフセット値によって修正され得る。例示のSEIメッセージは、それが後続SEIメッセージによって、または、持続フラグの設定に基づいて以下に説明するようにキャンセルされるまで、映像データセットに適用される。上記区分関数と同様に、これらの伝達関数は、HEVC映像データが復号化された後に後処理ステップにおいて適用され得る。
構文内の値は、次のように定義される。
hadp_id(1行目)は、hdr適応情報SEIメッセージの目的を識別するために使用され得る識別番号を含む。hadp_idの値は0〜232−2(両端を含む)の範囲を有する。
hadp_cancel_flag(1行目)は、hdr適応情報SEIメッセージが、現在の層に適用される出力順序内の任意の以前のhdr適応SEIメッセージの持続をキャンセルするか否かを示す(hadp_cancel_flagが1に等しい)。hadp_cancel_flagが0に等しい場合、hdr適応情報が続く。hadp_cancel_flagが1である場合、4行目〜16行目の構文要素のいずれも、SEIメッセージに含まれない。
hadp_persistence_flag(4行目)は、現在の層についてのhdr適応情報SEIメッセージの持続を指定する。0に等しいhadp_persistence_flagは、現在の層に適用されるhdr適応情報を指定する。hadp_persistence_flagが1に等しい場合、条件AまたはBのいずれかが真となるまで、適応情報が持続する。これらの条件は、picAが現在のピクチャであることを前提とする。
A)現在の層の新しい符号化層状映像シーケンス(CLVS:Coded Layer−Wise Video Sequence)が開始される。
B)hadp_idの同じ値を伴い、現在の層に適用可能であるhdr適応情報SEIメッセージを含むアクセスユニット内の現在の層におけるピクチャpicBは、PicOrderCnt(picB)がPicOrderCnt(picA)よりも大きい出力であり、PicOrderCnt(picB)およびPicOrderCnt(picA)は、それぞれ、picBについてのピクチャ順序カウントについて復号化処理の呼び出し直後の、picBおよびpicAのピクチャ順序カウント値(PicOrderCntVal)である。ピクチャ順序カウント値(PicOrderCntVal)は、マージモードおよび動きベクトル予測における動きパラメータを導くため、および、復号化器適合性チェックのために、ピクチャを識別するために使用される。
hadp_full_range(5行目)は、HDR適応処理への入力コンポーネント信号の黒レベルおよび範囲を指定する。0に等しいhadp_full_rangeは、サンプル範囲を標準範囲であると指定し、一方、1に等しいhadp_full_rangeは、サンプル範囲を全範囲であると指定する。video_full_range_flag構文要素が存在しない場合、video_full_range_flagの値は、0に等しいと推定される。標準範囲では、白および黒レベルを規定する値の範囲は、すべての値が使用される場合に達成されるであろう全範囲未満である。例えば、8ビットシステムでは、全範囲黒レベルは0に等しく、白レベルは255に等しい。標準範囲では、しかし、黒レベルは16に等しく、白レベルは235に等しい。
1に等しいatf_present_flag(6行目)は、適応伝達関数が各成分について入力信号に適用されることを示している。0に等しいatf_present_flagは、atf_id、atf_para1およびatf_para2がRBSP内に存在せず、atf_idが0であると推定される(伝達特性が指定されていないか、または、アプリケーションによって決定される)ことを示している。このフラグの使用により、必要とされる場合にのみパラメータが提供され、SEIメッセージ内のデータの量を減少させることができる。
atf_id(8行目)は、0〜1の名目実数値範囲を有する線形光強度入力Lcの関数として表9で指定されるようにソースピクチャの光電子伝達特性を指定する。
atf_param[i](10行目)は、atf_idによって識別される伝達関数についてのパラメータの値を指定する。
scale[c](15行目)は、成分cについてのスケール値を指定する。scale[c]の値は0〜65535(両端を含む)の範囲となるであろう。scale[c]が存在しない場合、それは256であると推定される。
offset[c](16行目)は、成分cについてのオフセット値を指定する。offset[c]の値は−32768〜32767(両端を含む)の範囲となるであろう。オフセット[c]が存在しない場合、それは0であると推定される。
1に等しいrange_adaptation_present_flag(13行目)は、構文要素scale[c](15行目)およびoffset[c](16行目)がこのhdr適応情報でシグナリングされることを示している。値range_adaptation_present_flagが0に等しい場合、そのscale[c]およびoffset[c]は、RBSP内に存在しない。値scale[c]およびoffset[c]の適用の例は、表9で以下に記載されているように伝達関数で示されている。
表9は、表8を参照して上述したSEIメッセージ構文を使用してシグナリングされ得る伝達関数の非排他的な例を提供する。伝達関数に関する情報は、情報的備考欄にて提供される。これらの4つの伝達特性が示されているが、他の伝達特性が、それらが復号化システムに既知である限り使用され得ることが企図される。
動的パラメータで既知の伝達関数を指定するためにSEIメッセージを使用する代わりに、1つ以上のセグメント化伝達関数を定義するメタデータ構造をシグナリングするためにSEIメッセージが使用され得る。表10は、このようなメタデータ構造をシグナリングするために使用され得る第1の例示的な構文である。
この構文は、SPSおよびPPSデータ構造にてセグメント化伝達関数をシグナリングするために使用されるのと同じパラメータを使用する。SEI構文はまた、持続性を使用して、表8で用いたものと同様のフラグ構文をキャンセルするように修正することもできることに留意されたい。簡潔にするために、表10のパラメータの説明は省略する。
別のSEI構文の例を、表11に示す。
表10と表11とは、成分データ(例えばY、Cb、Cr)のそれぞれについて使用するためのルックアップテーブルが、複数の再形成テーブルが存在するかどうか(すなわち、num_lut_reshape_greater1_flagが1に等しい)および再形成テーブルの数(すなわち、2+num_lut_reshape_minus2)に基づいて推定される点で異なる。値num_lut_reshape_greater1_flag(5行目)およびnum_lut_reshape_minus2(7行目)は、上述のSPSおよびPPSメタデータ構造と同じであり、ここでは説明されない。
推定は値NumLutReshapeを使用して、以下のように導かれる。
NumLutReshapeが1に等しい場合、すべての輝度およびクロミナンス成分は同じLUTを使用する。NumLutReshapeが2に等しい場合、輝度成分(Y)は、第1のLUTを使用し、2つのクロミナンス成分(例えばCb、Cr)は第2のLUTを使用する。NumLutReshapeが3に等しい場合、輝度成分は、第1のLUTを使用し、Cb成分は、第2のLUTを使用し、Cr成分は、第3のLUTを使用する。
図1〜図3Bを参照して上述したように、復号化システムは、受信した符号化データストリーム(例えばRBSP)から抽出されたメタデータ構造に基づいて、逆再形成伝達関数(ブロック230または328)および、おそらくは逆伝達関数(ブロック234)を再生する。復号化器222または322によって提供される再生SDR復号化映像データサンプルは、HDR/WCG映像モニタ上に表示され得るHDR/WCG映像データを再生するために、(1つまたは複数の)伝達関数を介して処理される。
上記において、例を、特定のデバイス、装置、システム、構文および/または方法に関連して説明してきたが、この説明は単なる例としてなされたのであって、限定としてではないことが明らかに理解されるであろう。特定の実施形態は、例えば、命令実行システム、装置、システムまたはマシンによる使用またはそれと関連しての使用のための非一時的なコンピュータ可読記憶媒体に実装され得る。コンピュータ可読記憶媒体は、特定の実施形態によって説明したように、方法を実行するかまたはメタデータ構造を保持するためにコンピュータシステムを制御するための命令を含む。1つ以上のコンピュータプロセッサによって実行されると、命令は、特定の実施形態に記載されているものを実行するように動作可能であり得る。
特許請求の範囲で使用される場合、単語「含む(comprise)」またはその派生語は、特許請求の範囲に記載の構造または方法における他の要素またはステップの存在を除外することを意図していない、非排他的な意味で使用されている。本明細書の説明においておよび以下の特許請求の範囲を通して使用される際に、文脈が別様に明確に指示しない限り、「1つの(a、an)」および「該、前記(the)」は複数への言及を含む。また、本明細書の説明においておよび以下の特許請求の範囲を通して使用される際に、文脈が別様に明確に指示しない限り、「において、における、内の、内に、(in)」の意味は、「において、における、内の、内に、(in)」および「の上の、の上で(on)」を含む。
上記の説明は、特定の実施形態の態様を実装し得る方法の例とともに種々の実施形態を示しており、以下の特許請求の範囲によって定義されるように特定の実施形態の柔軟性および利点を説明するために提示され、これらの実施形態のみであると見なされるべきではない。当業者は、上記開示および以下の特許請求の範囲に基づいて、特許請求の範囲によって定義されるその範囲から逸脱することなく、他の構成、実施形態、実施態様および均等物を採用し得ることを理解するであろう。したがって、明細書および図面は、限定的な意味ではなく例示として捉えられるべきであり、全てのこのような変形は、特許請求の範囲内に含まれることが意図されている。利益、利点、課題の解決策、および、任意の利益、利点または解決策をより顕著に生起または発生させ得る(1つもしくは複数の)任意の要素は、特許請求の範囲のいずれかまたはすべての重要な、必要な、または必須の特徴または要素として解釈されるべきではない。本発明は、本出願の係属中に行われる任意の補正および発行時のそれらの特許請求の範囲のすべての均等物を含む、添付の特許請求の範囲によってのみ定義される。

Claims (20)

  1. 符号化映像データストリームから高ダイナミックレンジ(HDR)または広色域(WCG)映像データを生成するための方法であって、
    符号化映像データストリームにおいて映像データセットについてシグナリングされるメタデータ構造を抽出する工程であって、
    シグナリングされる前記メタデータ構造は、シグナリングされる複数の伝達関数のうちの映像データ再形成伝達関数についてのインデックスおよび再形成パラメータを含み、
    前記複数の伝達関数は、前記符号化映像データストリームにおいてシーケンスレベルでシグナリングされ、
    前記映像データセットに関連する前記映像データ再形成伝達関数についての前記インデックスおよび前記再形成パラメータは、前記符号化映像データストリームにおいてピクチャレベルでシグナリングされる、前記抽出する工程と、
    前記符号化映像データストリームを復号化して、復号化映像データを生成する工程と、
    抽出した前記メタデータ構造に基づいて前記映像データ再形成伝達関数を再生する工程と、
    再生した前記映像データ再形成伝達関数に復号化映像データを適用することによって、出力データとして再形成HDRまたはWCG映像データを生成する工程と、
    を備える、方法。
  2. 前記伝達関数に復号化映像データ値の範囲を表す値を適用すること、および、適用された前記値によってアドレス指定されるルックアップテーブル(LUT)内の位置に前記伝達関数の出力値を格納することによって、前記映像データ再形成伝達関数について前記LUTを生成する工程をさらに備え、
    前記再形成HDRまたはWCG映像データを生成する工程は、前記LUTにアドレス値として前記復号化映像データを適用する工程を含む、請求項1に記載の方法。
  3. 抽出した前記メタデータ構造は、前記伝達関数の複数のセグメントを定義するデータを含み、各セグメントは、第1および第2のピボットポイントおよび係数値のセットによって指定され、係数の前記セット内の前記係数値は、前記メタデータ構造にてシグナリングされ、前記セット内の係数値の数は、前記セグメントの特性に基づいて変化し、
    前記映像データ再形成伝達関数の前記再生は、各セグメントについてシグナリングされた前記係数値から、各セグメントについての各方程式を再生することを含む、請求項1に記載の方法。
  4. 各セグメントは、2つの係数の係数セットを有する一次関数、3つの係数の係数セットを有する二次関数および4つの係数の係数セットを有する三次関数のうちの1つとしてモデル化される、請求項3に記載の方法。
  5. 前記複数のセグメントの各セグメントを定義する前記データは、前記伝達関数の直前のセグメントから導かれた前記伝達関数の現在のセグメントについての係数の数を示す平滑度の値をさらに含み、
    1および2の平滑度の値を有するセグメントについての前記メタデータ構造から抽出された前記係数セットはそれぞれ、同じ次数と0の平滑度とを有する方程式によってモデル化されたセグメントについての係数セットより1および2だけ少ない係数値を有する、請求項3に記載の方法。
  6. 前記メタデータ構造は、
    前記データストリームのうちの部分に関連付けられた第1のメタデータ構造であって、前記映像データ再形成伝達関数を定義する前記データを含む、第1のメタデータ構造と、
    前記データストリームのピクチャまたはサブピクチャ要素に関連付けられた第2のメタデータ構造であって、前記復号化映像データの少なくとも1つの成分への前記映像データ再形成伝達関数の適用を定義する、第2のメタデータ構造と、を含む、請求項1に記載の方法。
  7. 前記復号化映像データは、輝度成分および2つのクロミナンス成分を含み、
    前記第1のメタデータ構造は、複数の映像データ再形成伝達関数を定義するデータを含み、
    前記第2のメタデータ構造は、前記輝度成分および前記クロミナンス成分の各々に適用するために前記複数の映像データ再形成伝達関数のうちの1つを識別するデータを含む、請求項6に記載の方法。
  8. 前記復号化映像データは、輝度成分および2つのクロミナンス成分を含み、
    前記第1のメタデータ構造は、1つの映像データ再形成伝達関数を定義するデータを含み、
    前記第2のメタデータ構造は、
    前記輝度成分および前記2つのクロミナンス成分に関連付けられるものとして前記1つの映像データ再形成伝達関数を識別するデータと、
    各クロミナンス成分についてそれぞれの入力および出力オフセット値を示すデータと
    を含み、
    前記映像データ再形成伝達関数の前記再生は、前記第1のメタデータ構造から抽出されたデータを使用し、
    前記クロミナンス成分についての前記再形成HDRまたはWCG映像データの前記生成は、前記第2のメタデータ構造から抽出された入力および出力オフセット値によって修正されたものとして前記映像データ再形成伝達関数に復号化された前記クロミナンス成分を適用することを含む、請求項6に記載の方法。
  9. 前記復号化映像データは、輝度成分および2つのクロミナンス成分を含み、
    前記第1のメタデータ構造は、第1および第2の映像データ再形成伝達関数を定義するデータを含み、
    前記第2のメタデータ構造は、
    前記輝度成分に関連付けられるものとして前記第1の映像データ再形成伝達関数を識別するデータと、
    前記2つのクロミナンス成分のうちの少なくとも1つに関連付けられるものとして前記第2の映像データ再形成伝達関数を識別するデータと、を含み、
    前記映像データ再形成伝達関数の前記再生は、前記第1のメタデータ構造から抽出されたデータを使用し、
    前記再形成HDRまたはWCG映像データの前記生成は、前記第2のメタデータ構造から抽出されたデータを使用して、前記第1の映像データ再形成伝達関数に前記輝度成分の前記復号化映像データを適用し、前記第2の映像データ再形成伝達関数に前記2つのクロミナンス成分のうちの前記少なくとも1つの前記復号化映像データを適用する、請求項6に記載の方法。
  10. 前記第1のメタデータ構造は、第3の映像データ再形成伝達関数を定義するデータを含み、
    前記第2のメタデータ構造は、前記2つのクロミナンス成分の第1のものに関連付けられるものとして前記第2の映像データ再形成伝達関数を識別するデータと、前記2つのクロミナンス成分の第2のものに関連付けられるものとして前記第3の映像データ再形成伝達関数を識別するデータとを含み、
    前記再形成HDRまたはWCG映像データの前記生成は、前記第2のメタデータ構造から抽出されたデータを使用して、前記第2の伝達関数から生成されたLUTに前記第1のクロミナンス成分の前記復号化映像データを適用し、前記第3の伝達関数に前記第2のクロミナンス成分の前記復号化映像データを適用する、請求項9に記載の方法。
  11. 前記符号化データストリームは、H.265 HEVCロウバイトシーケンスペイロード(RBSP)であり、
    前記メタデータの前記抽出は、前記RBSPのシーケンスパラメータセット(SPS)から前記第1のメタデータ構造を抽出することを含み、
    前記メタデータの前記抽出は、前記RBSPのピクチャパラメータセット(PPS)から前記第2のメタデータ構造を抽出することを含む、請求項6に記載の方法。
  12. 前記符号化データストリームは、H.265 HEVCロウバイトシーケンスペイロード(RBSP)であり、
    前記メタデータの前記抽出は、前記H.265 HEVC RBSPの付加拡張情報(SEI)メッセージから前記第1および第2のメタデータ構造を抽出することを含む、請求項6に記載の方法。
  13. 抽出した前記メタデータ構造は、前記映像データ再形成伝達関数として所定の伝達関数のグループのうち1つの伝達関数を識別するデータ、および、前記映像データ再形成伝達関数の修正を示すデータを含み、
    前記伝達関数の修正を識別する前記データは、前記LUT内に生成された前記値を格納する前に、生成された前記値に適用されるオフセット値およびスケール値を含む、請求項に記載の方法。
  14. 前記伝達関数の修正を示す前記データは、前記所定の伝達関数のグループのうちの前記1つの伝達関数のパラメータ値を含む、請求項13に記載の方法。
  15. 符号化映像データストリームから高ダイナミックレンジ(HDR)または広色域(WCG)映像データを生成するための装置であって、
    符号化映像データストリームを保持するように構成されたメモリであって、前記符号化映像データストリームは、前記符号化映像データストリームにおいて映像データセットについてシグナリングされるメタデータ構造を含む、メモリと、
    前記メモリに結合されたプロセッサを含む映像データ復号化器システムであって、前記プロセッサによって実行されたときに、前記復号化器システムに、
    前記符号化映像データストリームにおいて映像データセットについてシグナリングされる記メタデータ構造を抽出する工程であって、
    シグナリングされる前記メタデータ構造は、シグナリングされる複数の伝達関数のうちの映像データ再形成伝達関数についてのインデックスおよび再形成パラメータを含み、
    前記複数の伝達関数は、前記符号化映像データストリームにおいてシーケンスレベルでシグナリングされ、
    前記映像データセットに関連する前記映像データ再形成伝達関数についての前記インデックスおよび前記再形成パラメータは、前記符号化映像データストリームにおいてピクチャレベルでシグナリングされる、前記抽出する工程と、
    号化映像データを生成するために前記符号化映像データストリームを復号化する工程と、
    抽出した前記メタデータ構造に基づいて前記映像データ再形成伝達関数を再生する工程と、
    前記再生映像データ再形成伝達関数に復号化映像データを適用することによって、出力データとして再形成高ダイナミックレンジ(HDR)または広色域(WCG)映像データを生成する工程と、
    を行わせるプログラム命令を含む映像データ復号化器システムと、
    を備える、装置。
  16. 前記プログラム命令は、前記復号化器システムに、
    前記伝達関数に復号化映像データ値の範囲を表す値を適用すること、および、前記適用値によってアドレス指定されるルックアップテーブル(LUT)内の位置に前記伝達関数の出力値を格納することによって、前記映像データ再形成伝達関数について前記メモリ内で前記LUTを生成する工程をさらに行わせ、前記プログラム命令は、前記復号化器システムに、前記LUTにアドレス値として前記復号化映像データを適用することによって、前記再形成HDRまたはWCG映像データを生成させる、請求項15に記載の装置。
  17. 抽出した前記メタデータ構造は、前記伝達関数の複数のセグメントを定義するデータを含み、各セグメントは、第1および第2のピボットポイントと1〜4の間の係数値を含む係数値のセットとによって指定され、係数の前記セット内の前記係数値の数は、前記メタデータ構造にてシグナリングされ、
    前記プログラム命令は、前記復号化器システムに、各セグメントについてのシグナリングされた前記係数値から、各セグメントについての各方程式を再生することによって前記映像データ再形成伝達関数を再生させる、請求項15に記載の装置。
  18. 各セグメントは、2つの係数の係数セットを有する一次関数、3つの係数の係数セットを有する二次関数および4つの係数の係数セットを有する三次関数のうちの1つとしてモデル化される、請求項17に記載の装置。
  19. 前記複数のセグメントの各セグメントを定義する前記データは平滑度の値をさらに含み、前記プログラム命令は、前記平滑度の値に応じて、前記復号化システムに、前記伝達関数の直前のセグメントに基づいて前記伝達関数の現在のセグメントについての係数の数を導く工程を行わせ、
    1および2の平滑度の値を有するセグメントについての前記メタデータ構造から抽出した前記係数セットはそれぞれ、同じ次数と0の平滑度とを有する方程式によってモデル化されたセグメントについての係数セットより1および2だけ少ない係数値を有する、請求項17に記載の装置。
  20. 符号化映像データストリームから高ダイナミックレンジ(HDR)または広色域(WCG)映像データを生成するべく、プロセッサに、
    符号化映像データストリームにおいて映像データセットについてシグナリングされるメタデータ構造を抽出する工程であって、
    シグナリングされる前記メタデータ構造は、シグナリングされる複数の伝達関数のうちの映像データ再形成伝達関数についてのインデックスおよび再形成パラメータを含み、
    前記複数の伝達関数は、前記符号化映像データストリームにおいてシーケンスレベルでシグナリングされ、
    前記映像データセットに関連する前記映像データ再形成伝達関数についての前記インデックスおよび前記再形成パラメータは、前記符号化映像データストリームにおいてピクチャレベルでシグナリングされる、前記抽出する工程と、
    号化映像データを生成するために前記符号化映像データストリームを復号化する工程と、
    抽出した前記メタデータ構造に基づいて前記映像データ再形成伝達関数を再生する工程と、
    再生した前記映像データ再形成伝達関数に復号化映像データを適用することによって、出力データとして再形成高ダイナミックレンジ(HDR)または広色域(WCG)映像データを生成する工程と、
    を行わせるプログラム命令を含む、非一時的なコンピュータ可読媒体。
JP2018534516A 2015-09-23 2016-09-23 高ダイナミックレンジ映像データの再形成および適応のためのシステムおよび方法 Active JP6609708B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201562222723P 2015-09-23 2015-09-23
US62/222,723 2015-09-23
US201562241087P 2015-10-13 2015-10-13
US201562241094P 2015-10-13 2015-10-13
US62/241,087 2015-10-13
US62/241,094 2015-10-13
US201562242272P 2015-10-15 2015-10-15
US62/242,272 2015-10-15
US15/274,442 US10674150B2 (en) 2015-09-23 2016-09-23 System and method for reshaping and adaptation of high dynamic range video data
PCT/US2016/053511 WO2017053846A1 (en) 2015-09-23 2016-09-23 System and method for reshaping and adaptation of high dynamic range video data
US15/274,442 2016-09-23

Publications (2)

Publication Number Publication Date
JP2018530281A JP2018530281A (ja) 2018-10-11
JP6609708B2 true JP6609708B2 (ja) 2019-11-20

Family

ID=58283609

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018534516A Active JP6609708B2 (ja) 2015-09-23 2016-09-23 高ダイナミックレンジ映像データの再形成および適応のためのシステムおよび方法
JP2018534518A Expired - Fee Related JP6609056B2 (ja) 2015-09-23 2016-09-23 高ダイナミックレンジおよび広色域シーケンスの再形成および符号化のためのシステム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018534518A Expired - Fee Related JP6609056B2 (ja) 2015-09-23 2016-09-23 高ダイナミックレンジおよび広色域シーケンスの再形成および符号化のためのシステム

Country Status (5)

Country Link
US (10) US10506232B2 (ja)
EP (3) EP3338450A1 (ja)
JP (2) JP6609708B2 (ja)
KR (6) KR102483438B1 (ja)
WO (3) WO2017053852A1 (ja)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3275190B1 (en) * 2015-03-25 2024-04-17 Dolby Laboratories Licensing Corporation Chroma subsampling and gamut reshaping
KR102254535B1 (ko) * 2015-07-22 2021-05-20 애리스 엔터프라이지즈 엘엘씨 높은 동적 범위 및 넓은 컬러 재현 시퀀스들을 코딩하기 위한 시스템
JP6990172B2 (ja) * 2015-09-18 2022-01-12 インターデジタル ヴイシー ホールディングス, インコーポレイテッド Hdr符号化/復号のための色成分サンプルの共に配置される輝度サンプルの決定
US10506232B2 (en) 2015-09-23 2019-12-10 Arris Enterprises Llc System for reshaping and coding high dynamic range and wide color gamut sequences
JP6921815B2 (ja) * 2015-11-09 2021-08-18 インターデジタル ヴイシー ホールディングス, インコーポレイテッド エレメンタリーストリームから復号されたビデオコンテンツをディスプレイの特性に適応させる方法およびデバイス
CN106937121B (zh) * 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器
US10397586B2 (en) * 2016-03-30 2019-08-27 Dolby Laboratories Licensing Corporation Chroma reshaping
US10542296B2 (en) * 2016-05-10 2020-01-21 Dolby Laboratories Licensing Corporation Chroma reshaping of HDR video signals
GB201611253D0 (en) * 2016-06-29 2016-08-10 Dolby Laboratories Licensing Corp Efficient Histogram-based luma look matching
CN113452999B (zh) * 2016-07-22 2023-12-05 夏普株式会社 使用自适应分量缩放对视频数据进行编码的系统和方法
KR102554379B1 (ko) * 2016-10-31 2023-07-11 엘지디스플레이 주식회사 하이 다이나믹 레인지 영상 처리 방법 및 영상 처리 모듈과 그를 이용한 표시 장치
US20180152686A1 (en) * 2016-11-28 2018-05-31 Microsoft Technology Licensing, Llc Tone mapping functions for rendering high dynamic range video on enhanced dynamic range display devices
US10218952B2 (en) 2016-11-28 2019-02-26 Microsoft Technology Licensing, Llc Architecture for rendering high dynamic range video on enhanced dynamic range display devices
JP6822121B2 (ja) * 2016-12-19 2021-01-27 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
GB2558236B (en) * 2016-12-22 2021-03-31 Apical Ltd Image data comprising encoded image data and additional data for modification of image
US10104334B2 (en) 2017-01-27 2018-10-16 Microsoft Technology Licensing, Llc Content-adaptive adjustment of display device brightness levels when rendering high dynamic range content
US10176561B2 (en) * 2017-01-27 2019-01-08 Microsoft Technology Licensing, Llc Content-adaptive adjustments to tone mapping operations for high dynamic range content
JP7086587B2 (ja) * 2017-02-24 2022-06-20 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 復号された画像データから画像データを再構成する方法および装置
CN107277399B (zh) 2017-06-09 2020-10-20 深圳Tcl新技术有限公司 电视终端及hdr图像转为sdr的方法和计算机可读存储介质
US11100888B2 (en) 2017-06-28 2021-08-24 The University Of British Columbia Methods and apparatuses for tone mapping and inverse tone mapping
US10728559B2 (en) * 2017-07-07 2020-07-28 Qualcomm Incorporated Precision of computation and signaling of dynamic range adjustment and color remapping information
CN109691117B (zh) * 2017-07-07 2022-05-27 松下知识产权经营株式会社 影像处理系统及影像处理方法
CN110999300B (zh) * 2017-07-24 2023-03-28 杜比实验室特许公司 用于图像/视频处理的单通道逆映射
WO2019023835A1 (zh) * 2017-07-31 2019-02-07 华为技术有限公司 一种广色域图像显示方法及设备
JP7005268B2 (ja) * 2017-10-16 2022-01-21 日本放送協会 符号化装置、復号装置及びプログラム
US10972767B2 (en) * 2017-11-01 2021-04-06 Realtek Semiconductor Corp. Device and method of handling multiple formats of a video sequence
US11928796B2 (en) * 2017-12-01 2024-03-12 Interdigital Patent Holdings, Inc. Method and device for chroma correction of a high-dynamic-range image
US20190045198A1 (en) * 2017-12-28 2019-02-07 Intel Corporation Region adaptive data-efficient generation of partitioning and mode decisions for video encoding
CN117082246A (zh) * 2018-02-14 2023-11-17 杜比实验室特许公司 在视频编码中利用率失真优化进行图像再成形
US11303912B2 (en) * 2018-04-18 2022-04-12 Qualcomm Incorporated Decoded picture buffer management and dynamic range adjustment
EP3557875A1 (en) * 2018-04-19 2019-10-23 Ymagis Multidynamic transport and restitution system for theatrical display
EP3595308A1 (en) 2018-07-12 2020-01-15 THOMSON Licensing Method and apparatus for encoding an image
US10957024B2 (en) 2018-10-30 2021-03-23 Microsoft Technology Licensing, Llc Real time tone mapping of high dynamic range image data at time of playback on a lower dynamic range display
US11503310B2 (en) * 2018-10-31 2022-11-15 Ati Technologies Ulc Method and apparatus for an HDR hardware processor inline to hardware encoder and decoder
WO2020180044A1 (ko) * 2019-03-01 2020-09-10 엘지전자 주식회사 Lmcs에 기반한 영상 코딩 방법 및 그 장치
US20220060709A1 (en) * 2019-03-01 2022-02-24 Lg Electronics Inc. Image coding method based on lmcs, and device therefor
CN113475072B (zh) * 2019-03-04 2023-12-15 北京字节跳动网络技术有限公司 视频处理中滤波信息的信令
WO2020180120A1 (ko) * 2019-03-05 2020-09-10 엘지전자 주식회사 Lmcs에 기반한 영상 코딩 방법 및 그 장치
WO2020180143A1 (ko) * 2019-03-07 2020-09-10 엘지전자 주식회사 루마 맵핑 및 크로마 스케일링 기반 비디오 또는 영상 코딩
EP3709656A1 (en) * 2019-03-11 2020-09-16 InterDigital VC Holdings, Inc. Method and device for picture encoding and decoding with forward and inverse mapping models
US11388406B2 (en) * 2019-05-20 2022-07-12 Dolby Laboratories Licensing Corporation Piece-wise-linear mapping for in-loop reshaping in image coding
TWI734501B (zh) * 2019-05-31 2021-07-21 聯發科技股份有限公司 視訊編解碼的方法和裝置
WO2021030375A1 (en) * 2019-08-12 2021-02-18 Dolby Laboratories Licensing Corporation Adaptive image data linearization for hdr image sensors
US11170690B2 (en) * 2019-09-26 2021-11-09 Apple Inc. Pixel leakage and internal resistance compensation systems and methods
GB2589066B (en) * 2019-10-24 2023-06-28 Advanced Risc Mach Ltd Encoding data arrays
CN110740391B (zh) * 2019-10-31 2021-10-26 四川效率源信息安全技术股份有限公司 一种修复mp4损坏文件的方法
CN114747224B (zh) * 2019-11-27 2023-12-01 杜比实验室特许公司 一种用于生成整形函数的方法、装置以及存储介质
KR102348633B1 (ko) * 2020-05-20 2022-01-11 국방과학연구소 비디오 암호화 및 복호화 방법 및 장치
US11544826B2 (en) * 2021-04-30 2023-01-03 Realnetworks, Inc. Intelligent metadata service for video enhancement
WO2023287427A1 (en) * 2021-07-16 2023-01-19 Pqsecure Technologies, Llc A method and system for computing large-degree isogenies with an odd degree
CN113538280B (zh) * 2021-07-20 2022-03-04 江苏天汇空间信息研究院有限公司 基于矩阵二值化的遥感影像去除彩线和残缺影像拼接方法
US11606605B1 (en) * 2021-09-30 2023-03-14 Samsung Electronics Co., Ltd. Standard dynamic range (SDR) / hybrid log-gamma (HLG) with high dynamic range (HDR) 10+
WO2023113200A1 (ko) * 2021-12-15 2023-06-22 현대자동차주식회사 잔차신호들의 매핑을 이용하는 비디오 코딩을 위한 방법 및 장치
US20230252611A1 (en) * 2022-02-09 2023-08-10 Samsung Electronics Co., Ltd. Generation of three-dimensional (3d) lookup table for tone mapping or other image processing functions

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6075977A (ja) * 1983-10-03 1985-04-30 Photo Composing Mach Mfg Co Ltd 文字画像デ−タの処理方法
JPH0675977A (ja) 1992-08-26 1994-03-18 Hitachi Inf Syst Ltd オフィス調査票作成支援システム
US8665942B2 (en) 2007-01-23 2014-03-04 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction signaling
EP2702766B1 (en) 2011-04-28 2017-06-14 Koninklijke Philips N.V. Apparatuses and methods for hdr image encoding and decoding
JP6075977B2 (ja) * 2012-06-19 2017-02-08 Ntn株式会社 転がり軸受
AR091515A1 (es) * 2012-06-29 2015-02-11 Sony Corp Dispositivo y metodo para el procesamiento de imagenes
US10540920B2 (en) * 2013-02-21 2020-01-21 Dolby Laboratories Licensing Corporation Display management for high dynamic range video
KR101767331B1 (ko) * 2013-04-17 2017-08-10 노키아 테크놀로지스 오와이 비디오 코딩 및 디코딩을 위한 장치, 방법 및 컴퓨터 프로그램
US9584811B2 (en) * 2013-06-17 2017-02-28 Dolby Laboratories Licensing Corporation Adaptive reshaping for layered coding of enhanced dynamic range signals
US9369739B2 (en) * 2014-10-28 2016-06-14 Avid Technology, Inc. Preserving dynamic range precision in integer image formats
RU2666234C1 (ru) * 2015-03-20 2018-09-06 Долби Лэборетериз Лайсенсинг Корпорейшн Аппроксимация восстановления формы сигнала
US10735755B2 (en) 2015-04-21 2020-08-04 Arris Enterprises Llc Adaptive perceptual mapping and signaling for video coding
WO2016172091A1 (en) * 2015-04-22 2016-10-27 Dolby Laboratories Licensing Corporation Signal reshaping and coding in the ipt-pq color space
CN107836118B (zh) * 2015-05-21 2020-12-01 瑞典爱立信有限公司 像素预处理和编码的方法、装置和计算机可读存储介质
WO2017003525A1 (en) * 2015-06-30 2017-01-05 Dolby Laboratories Licensing Corporation Real-time content-adaptive perceptual quantizer for high dynamic range images
JP6530854B2 (ja) * 2015-07-16 2019-06-12 ドルビー ラボラトリーズ ライセンシング コーポレイション Hdrおよび広色域の信号のための信号整形および符号化
WO2017015397A1 (en) * 2015-07-22 2017-01-26 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
TWI764870B (zh) * 2015-07-28 2022-05-21 法商內數位麥德遜專利控股有限公司 視訊訊號處理裝置及方法
US10652588B2 (en) * 2015-09-21 2020-05-12 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US10506232B2 (en) 2015-09-23 2019-12-10 Arris Enterprises Llc System for reshaping and coding high dynamic range and wide color gamut sequences
US20170279640A1 (en) * 2016-03-25 2017-09-28 Qualcomm Incorporated Systems and methods for training field boosting

Also Published As

Publication number Publication date
US20220166981A1 (en) 2022-05-26
US11277610B2 (en) 2022-03-15
KR20180056705A (ko) 2018-05-29
US20200288132A1 (en) 2020-09-10
KR20200093694A (ko) 2020-08-05
WO2017053852A1 (en) 2017-03-30
US11659183B2 (en) 2023-05-23
KR20240037363A (ko) 2024-03-21
KR20220058969A (ko) 2022-05-10
KR102483438B1 (ko) 2023-01-02
EP3338452A1 (en) 2018-06-27
US20170085889A1 (en) 2017-03-23
EP3338452B1 (en) 2020-08-26
US10674150B2 (en) 2020-06-02
KR102140237B1 (ko) 2020-07-31
JP2018530282A (ja) 2018-10-11
KR102140083B1 (ko) 2020-07-31
KR102393231B1 (ko) 2022-05-03
JP2018530281A (ja) 2018-10-11
US20230141102A1 (en) 2023-05-11
US11575899B2 (en) 2023-02-07
US20170085879A1 (en) 2017-03-23
WO2017053846A1 (en) 2017-03-30
US20170085880A1 (en) 2017-03-23
US11070809B2 (en) 2021-07-20
EP3338451A1 (en) 2018-06-27
KR20230008891A (ko) 2023-01-16
EP3338450A1 (en) 2018-06-27
US20230362376A1 (en) 2023-11-09
US20230254488A1 (en) 2023-08-10
US20210314570A1 (en) 2021-10-07
US11750814B2 (en) 2023-09-05
KR20180056704A (ko) 2018-05-29
JP6609056B2 (ja) 2019-11-20
US10506232B2 (en) 2019-12-10
KR102647783B1 (ko) 2024-03-15
WO2017053849A1 (en) 2017-03-30
US20200059646A1 (en) 2020-02-20

Similar Documents

Publication Publication Date Title
JP6609708B2 (ja) 高ダイナミックレンジ映像データの再形成および適応のためのシステムおよび方法
US11375193B2 (en) System for coding high dynamic range and wide color gamut sequences
US10432955B2 (en) High dynamic range adaptation operations at a video decoder
EP3308541B1 (en) System for coding high dynamic range and wide color gamut sequences

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191028

R150 Certificate of patent or registration of utility model

Ref document number: 6609708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350