JP6838201B2 - 後方互換性ディスプレイマネジメントメタデータ圧縮 - Google Patents

後方互換性ディスプレイマネジメントメタデータ圧縮 Download PDF

Info

Publication number
JP6838201B2
JP6838201B2 JP2020516637A JP2020516637A JP6838201B2 JP 6838201 B2 JP6838201 B2 JP 6838201B2 JP 2020516637 A JP2020516637 A JP 2020516637A JP 2020516637 A JP2020516637 A JP 2020516637A JP 6838201 B2 JP6838201 B2 JP 6838201B2
Authority
JP
Japan
Prior art keywords
metadata
frame
sequence
image
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020516637A
Other languages
English (en)
Other versions
JP2020534759A (ja
Inventor
スゥ,グワン‐ミーン
ガドギル,ニーラジ,ジェイ.
チェン,タオ
キュ,シェン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2020534759A publication Critical patent/JP2020534759A/ja
Application granted granted Critical
Publication of JP6838201B2 publication Critical patent/JP6838201B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • H04N19/68Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Description

関連出願への相互参照
本願は、2017年9月22日に出願された米国仮特許出願第62/561,782号および2017年9月22日に出願された欧州特許出願第17192724.7号に関連し得るものであり、両出願の開示内容を全て本願に援用する。
技術
本発明は、画像全般に関する。より詳細には、本発明のある実施形態は、後方互換性ディスプレイマネジメント(DM)メタデータ圧縮に関する。
背景
本明細書において、用語「ダイナミックレンジ」(DR)は、人間の視覚系(HVS)が画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最も暗い黒(暗)から最も明るい白(ハイライト)まで)を知覚する能力に関し得る。この意味では、DRは、「シーン−リファード(scene−referred)」な強度に関する。DRはまた、ディスプレイデバイスが特定幅を有する強度範囲を十分にまたは近似的に描画する能力にも関し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)な強度に関する。本明細書中のいずれの箇所においても、一方の特定の意味が特に重要であると明示されない限り、この用語は、どちらの意味にも(例えば、交換可能に)使用できるものとする。
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚系(HVS)においておよそ14〜15桁以上にわたるDR幅に関する。実際において、人間は、幅広い強度範囲を同時に知覚し得るが、そのDRは、HDRと比べて幾分切り捨てられ得る。本明細書において、エンハンストダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、個別にまたは交換可能に、人間の視覚系(HVS)(眼球運動を含み、シーンまたは画像全体においてある程度の明順応変化を可能にする)がシーンまたは画像において知覚可能なDRに関する。本明細書において、EDRは、5〜6桁にわたるDRに関し得る。従って、EDRは、真のシーンリファードなHDRに対しては幾分狭いものの、広いDR幅を表し、HDRとも呼ばれ得る。
実際において、画像は、色空間の1つ以上の色成分(例えば、ルマYならびにクロマCbおよびCr)を含み、各色成分は、1画素あたりnビットの精度(例えば、n=8)で表される。線形輝度符号化(linear luminance coding)を用いた場合、n≦8の画像(例えば、カラー24ビットJPEG画像)は、スタンダードダイナミックレンジの画像とされ、n>8の画像は、エンハンストダイナミックレンジの画像とされる。
あるディスプレイについてのリファレンス電気−光伝達関数(EOTF)は、入力映像信号の明度(color values)(例えば、輝度)間の関係を特徴づけて、そのディスプレイによって生成されるスクリーン明度(例えば、スクリーン輝度)を特徴づける。例えば、その開示内容がすべて本願に援用されるITU Rec.ITU−R BT.1886、「Reference electro−optical transfer function for flat panel displays used in HDTV studio production」(2011年3月)は、フラットパネルディスプレイ用のリファレンスEOTFを定義している。映像ストリームについては、そのEOTFに関する情報が典型的にはメタデータとしてビットストリーム中に埋め込まれる。本明細書において、用語「メタデータ」は、符号化ビットストリームの一部として送信され、デコーダによる復号化画像の描画を補助する、任意の補助情報に関する。そのようなメタデータは、本明細書において記載される、色空間または色域情報、リファレンスディスプレイパラメータ、および補助信号パラメータを含むが、これらに限定されない。
200〜1,000cd/mまたはニトの輝度をサポートするディスプレイは、EDR(またはHDR)に対し、より低いダイナミックレンジ(LDR)(スタンダードダイナミックレンジ(SDR)とも呼ばれる)の典型例である。EDRコンテンツは、より高いダイナミックレンジ(例えば1,000ニトから5,000ニト以上)をサポートするEDRディスプレイに表示され得る。そのようなディスプレイは、高輝度能力(例えば、0〜10,000ニト)をサポートする別のEOTFを用いて定義され得る。そのようなEOTFの一例が、その開示内容をすべて本願に援用するSMPTE ST 2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」(以下、「SMPTE」)に定義されている。本発明者らは、幅広い種類のSDRおよびHDRディスプレイデバイスの表示能力をサポートするために使用され得る映像データを符号化および復号化するための技術を向上させる必要があると考える。
本節に記載された手法は、検討され得る手法ではあるが、必ずしもこれまでに着想または検討されてきた手法ではない。従って、特に断らない限り、本節に記載された手法はいずれも、本節に記載されているというだけで従来技術とみなされるべきではない。同様に、特に断らない限り、1つ以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術分野においてすでに認識されていると考えるべきではない。
図面の簡単な説明
本発明のある実施形態を添付の図面に、限定することなく、例示する。図において、同様の参照符号は、同様の要素を示す。
図1は、映像供給パイプラインのプロセス例を示す。 図2Aは、シングルレイヤーコーデックフレームワーク例を例示する。 図2Bは、シングルレイヤーコーデックフレームワーク例を例示する。 図2Cは、シングルレイヤーコーデックフレームワーク例を例示する。 図3は、画像フレームにおけるフレーム毎の平均輝度の値のプロット例を例示する。 図4Aは、プロセスフロー例を例示する。 図4Bは、プロセスフロー例を例示する。 図5は、本明細書に記載するコンピュータまたはコンピューティングデバイスが実装され得るハードウェアプラットフォーム例の簡略化ブロック図を例示する。
例示的な実施形態の説明
本明細書において、後方互換性DMメタデータ圧縮を説明する。以下の説明において、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明が実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
概要
本明細書に記載される例示の実施形態は、画像メタデータを用いる映像データの符号化に関する。これらの例示の実施形態は、さらに画像メタデータ(例えば、ディスプレイマネジメントメタデータなど)の後方互換性圧縮に関し得る。メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータが生成される。前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する(例えば、前記1シーケンスの画像フレームの全体のうちの画像フレームに対して存在する)1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。前記1シーケンスの画像フレームに対して、1シーケンスをなす複数セットのフレーム存在パラメータが生成される。前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成される。前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成される1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含む。そのとき、各フレーム存在インジケータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型のうちのそれぞれの1つに対応し得る。言い換えると、フレーム存在インジケータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型におけるメタデータ型と一対一の関係を有し得る。前記1セットのフレーム存在インジケータは、メタデータパラメータ値が、特定の画像フレームに対して、符号化ビットストリームにおいてメタデータペイロードとして符号化されるべき第1のメタデータ型を特定する第1のフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が、特定の画像フレームに対して、符号化ビットストリームにおいて符号化されることのない第2のメタデータ型を示す第2のフレーム存在インジケータを含む。前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、およびメタデータペイロードは、符号化ビットストリームにおいて符号化される。符号化メタデータ(符号化メタデータペイロード)は、符号化ビットストリームの受信側デバイスが、第1のメタデータ型に対して決定されたメタデータパラメータ値に少なくとも部分的に基づいて特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成するのに適し得る。
本明細書に記載の例示の実施形態は、画像メタデータを用いる映像データの復号化に関する。これらの例示の実施形態は、さらに画像メタデータ(例えば、ディスプレイマネジメントメタデータなど)の復元(decompression)に関し得る。メディアプログラムにおける1シーケンスの画像フレームを含む符号化ビットストリームが受信される。前記1シーケンスの画像フレームに対して1セットのシーケンスレベルパラメータが復号化される。前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する(例えば、1シーケンスの画像フレームの全体のうちの画像フレームに対して存在する)1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。前記1セットのシーケンスレベルパラメータを使用して、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータを復号化する。前記1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含む。そのとき、各フレーム存在インジケータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型のうちのそれぞれの1つに対応し得る。言い換えると、フレーム存在インジケータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型におけるメタデータ型と一対一の関係を有し得る。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が符号化ビットストリームにおいてメタデータペイロードとして符号化された第1のメタデータ型を特定する第1のフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が符号化ビットストリームにおいて符号化されていない第2のメタデータ型を特定する第2のフレーム存在インジケータを含む。第1のフレーム存在インジケータを使用して、符号化ビットストリームにおけるメタデータペイロードを復号化する。ターゲットディスプレイ用のターゲットディスプレイ画像は、第1のメタデータ型に対して決定されたメタデータパラメータ値に少なくとも部分的に基づいて特定の画像フレームから生成される。
例示の映像供給プロセッシングパイプライン
図1は、映像のキャプチャから映像コンテンツの表示までの様々な段階を示す、映像供給パイプライン(100)のプロセス例を図示する。1シーケンスの映像フレーム(102)は、画像生成ブロック(105)を使用してキャプチャまたは生成される。映像フレーム(102)は、デジタル的にキャプチャされるか(例えば、デジタルカメラによって)、またはコンピュータによって生成される(例えば、コンピュータアニメーションを使用して)ことによって、映像データ(107)が得られ得る。あるいは、映像フレーム(102)は、銀塩カメラによってフィルム上にキャプチャされてもよい。フィルムがデジタルフォーマットに変換されることによって、映像データ(107)が得られる。プロダクションフェーズ(110)において、映像データ(107)は、編集され、映像プロダクションストリーム(112)を得る。
次いで、プロダクションストリーム(112)の映像データは、ポストプロダクション編集(115)のためのプロセッサに与えられる。ポストプロダクション編集(115)は、画像の特定の領域の色または明るさを調節または変更することにより、画質を上げたり、または映像制作者の制作意図にしたがってその画像が特定の見え方をするようにしたりすることを含み得る。これは、「カラータイミング」あるいは「カラーグレーディング」と呼ばれることがある。ポストプロダクション編集(115)において、その他の編集(例えば、シーン選択およびシーケンシング、手動および/または自動シーンカット情報生成、画像クロッピング、コンピュータ生成された視覚特殊効果の追加など)を行うことにより、HDR画像(117−1)またはSDR(または、比較的狭いダイナミックレンジ)画像(117)の配信用のバージョン(例えば、SDRなど)を生成してもよい。いくつかの実施形態において、ポストプロダクション編集(115)において、HDR画像(117−1)は、ハイダイナミックレンジをサポートするリファレンスHDRディスプレイ上で、HDR画像(117−1)に対してポストプロダクション編集操作を行っているカラリストによって視聴される。いくつかの他の実施形態において、ポストプロダクション編集(115)において、SDR画像(117)は、スタンダードダイナミックレンジ(または比較的狭いダイナミックレンジ)をサポートするリファレンスディスプレイ(125)上で、SDR画像(117)に対してポストプロダクション編集操作を行っているカラリストによって視聴される。いくつかの実施形態において、符号化ブロック(120)は、図2Aまたは図2Bにおいて例示するようなシングルレイヤーコーデックフレームワークを実装し得る。符号化ブロック(120)がHDR画像(117−1)をポストプロダクション編集(115)から受け取るという演算の場合、HDR画像(117−1)は、符号化ブロック(120)によってSDR画像(例えば、117)に順方向再構成され得る。
SDR画像(117)は、符号化ブロック(120)によって符号化ビットストリーム(122)に圧縮される。いくつかの実施形態において、符号化ブロック(120)は、符号化ビットストリーム(122)を生成するための、ATSC、DVB、DVD、ブルーレイおよびその他の供給フォーマットによって規定されているような音声および映像エンコーダを含んでもよい。
いくつかの実施形態において、符号化ビットストリーム(122)は、SDR画像(117)がポストプロダクション編集(115)において生成されたときの表現意図を保持するSDR画像(117)とともに符号化されている。
SDR画像(117)は、幅広い種類のSDRディスプレイデバイス(例えば、SDRディスプレイなど)に対して後方互換性(または、非後方互換性)である映像信号(例えば、8ビットSDR映像信号、10ビットSDR映像信号など)における映像データに符号化され得る。限定的でない例において、SDR画像(117)とともに符号化されている映像信号は、シングルレイヤー後方互換性(または、非後方互換性)映像信号であり得る。
いくつかの実施形態において、符号化ビットストリーム(122)は、符号化ブロック(120)によって受信される入力SDR YCbCr映像信号と同じ映像信号フォーマットに準拠する映像信号である。例えば、符号化ブロック(120)によって受信された入力SDR YCbCr映像信号が8ビットSDR YCbCr映像信号である場合、符号化ブロック(120)によって出力される符号化ビットストリーム(122)は、符号化ブロック(120)によって生成されたDMメタデータを含むがそれに限定されない画像メタデータを有する出力8ビットSDR YCbCr映像信号を表し得る。
追加的に、オプションとして、または代替的に、符号化ビットストリーム(122)は、さらにコンポーザ(composer)メタデータ(または、逆方向再構成マッピング)を含むがそれに限定されない画像メタデータとともに符号化される。コンポーザメタデータは、HDRディスプレイデバイス上での描画のために最適化され得る逆方向再構成画像を生成するために、下流のデコーダによって使用されて、SDR画像(117)に対して逆方向再構成を行うことができる。いくつかの実施形態において、逆方向再構成画像は、逆トーンマッピング、逆ディスプレイマネジメントなどを実装する1つ以上のSDR−HDR変換ツールを使用して、SDR画像(117)(または、それを復号化したもの)から生成され得る。
次いで、符号化ビットストリーム(122)は、テレビジョン受像機、セットトップボックス、映画館などの下流の復号化・再生機器に供給される。受信機(または、下流のデバイス)において、符号化ビットストリーム(122)は、復号化ブロック(130)によって復号化され、復号化画像132を生成する。復号化画像132は、SDR画像(117)と同一であり得るが、符号化ブロック(120)が圧縮を行う際や、復号化ブロック(130)が復元を行う際に量子化エラーを受け得る。第1のターゲットディスプレイ(140−1)がスタンダードダイナミックレンジ(または、比較的狭いダイナミックレンジ)をサポートする場合、復号化画像(182)において表される表現コンテンツを用いて編集されたSDR画像(117)は、リファレンスディスプレイ(125)と同様の特性を有し得る第1のターゲットディスプレイ(140−1)上でそのまま視聴可能である。いくつかの実施形態において、受信機は、HDR画像が表されるハイダイナミックレンジをサポートする第2のターゲットディスプレイ(140)に装着され得る。その場合、復号化ブロック(130)は、SDR画像(117)とともに受信したコンポーザメタデータに基づいて、SDR画像(117)に対して逆方向再構成を行って、HDRディスプレイ上での視聴に最適化された逆方向再構成画像(132)にしてもよい。追加的に、オプションとして、または代替的に、ディスプレイマネジメントブロック(135)(受信機、ターゲットディスプレイ(140)、または別のデバイス中にあってもよい)が、第2のターゲットディスプレイ(140)の特性に適合されたディスプレイマッピング(display−mapped)信号(137)を生成することによって、逆方向再構成画像(132)をさらに調節して、第2のターゲットディスプレイ(140)の特性を有するようにしてもよい。
圧縮メタデータを伴うSDRまたは非SDRコンテンツの供給
本明細書に記載の技術を使用して、DM演算に使用されるDMメタデータを含むがそれに限定されない画像メタデータを顕著に圧縮できる。これらの技術は、広い範囲の異なる演算に好適であり、画像メタデータの送信の際のオーバーヘッドを顕著に最小化し、それにより画像メタデータおよび画像データを比較的低いビットレートで送信できるように、画像メタデータを圧縮するために使用され得る。いくつかの例示の実施形態において、本明細書に記載の技術は、DMメタデータを含むがそれに限定されない、SDR画像(117)に伴う画像メタデータを圧縮して、SDR画像がSDR画像(117)および画像メタデータとともに符号化ビットストリーム(122)において比較的低いビットレートで送信可能となるように作成され得る。
過去数十年の間に非常に多くの映像/映画が、比較的低いビットレートでの送信のために符号化されたSDRコンテンツとして、世界中で制作、保存、および/または公開されてきたので、本明細書に記載の技術を用いて、広範囲の過去に制作されたSDRコンテンツを搬送する、またはそれに対して後方互換性のある符号化ストリームにおいて顕著に圧縮された画像メタデータを生成することができる。その結果、画像メタデータは、(比較的)相対的に大量のデータを搬送できるので、幅広い種類のディスプレイデバイスおよび/またはメディアプレーヤのためのDM演算を含むがそれに限定されない画像処理演算の最適化を可能にする。
追加的に、オプションとして、または代替的に、これらの技術はまた、シングルレイヤー映像信号であってもよいし、そうでなくてもよい符号化ストリームにおいて顕著に圧縮された画像メタデータを生成するために拡張され得る。追加的に、オプションとして、または代替的に、これらの技術はまた、符号化ビットストリームからSDR、非SDR、またはHDRコンテンツを生成するために使用され得る符号化ストリームにおいて顕著に圧縮された画像メタデータを生成するために拡張され得る。
いくつかの実施形態において、画像メタデータの圧縮は、当該分野または新たな展開において幅広い種類のメディアプロセッシングデバイスによってサポートされる拡張ブロック(またはメタデータブロック)を使用して実現され得る。より詳細には、拡張ブロックを使用して、過去に制作されたSDRコンテンツに伴う画像メタデータを圧縮でき、また幅広い種類のビットレートで符号化された現在または未来のSDR(または、さらに非SDRメディアコンテンツ)に伴う現在または未来の画像メタデータを圧縮できる。いくつかの実施形態において、上記技術の少なくとも一部(例えば、クライアント側、デコーダ側など)は、DM演算を含むがそれに限定されない幅広い種類の画像処理演算においてSDR(または、さらには非SDRコンテンツ)に伴う顕著に圧縮された画像メタデータを受信および利用するために、幅広い種類のTV、モバイルデバイス、セットトップボックス、スマートプレーヤなどによって実装され得るか、またはその中に配備され得る。
さらに、SDRコンテンツがSDRディスプレイデバイスに対して特別に最適化された演算の場合、そのような(例えば、後方互換性など)SDRコンテンツは、SDR描画をサポートするだけの復号化デバイスを含むがそれらに限定されない、幅広い種類の下流の復号化デバイスに供給され得る。これらのデバイスは、SDRコンテンツに伴うがそのデバイスによってサポートされない画像メタデータの部分(例えば、サポートされていないDM拡張ブロックなど)はいずれも無視できる。
例えば、本明細書に記載される圧縮フォーマットの画像メタデータを含む符号化ビットストリームを受信する第1のデコーダ(例えば、当該分野においてすでに利用されているデコーダなど)を有する第1のデバイスは、画像メタデータを圧縮するために使用されるいくつかの比較的新しい拡張ブロックを認識しないことがあり、そのデバイスに既知の、またはアクセス可能なデフォルト値(例えば、DM静的(static)値など)の使用に戻り得る。第1のデコーダは、第1のデコーダによってサポートされる圧縮フォーマットの画像メタデータの他の部分を引き続き復号化および処理できる。
これに対して、上記のような符号化ビットストリームを受信する第2のデコーダ(例えば、新しくリリースされたデコーダなど)を有する第2のデバイスは、比較的新しい拡張ブロックを認識でき、符号化ビットストリームにおいて圧縮された画像メタデータを復元でき、そして比較的新しい拡張ブロックにおけるダイナミック値または渡してこられた(passed−in)値に基づいて画像プロセッシング演算(例えば、DM演算など)を行うことができる。比較的新しい拡張ブロックなどの圧縮フォーマットは、幅広い種類のTV、モバイルデバイス、セットトップボックス、スマートプレーヤなどにおいて実装されるか、または利用され、DM演算を含むがそれに限定されない幅広い種類の画像処理演算において、SDRまたは非SDRコンテンツに伴う顕著に圧縮された画像メタデータを受信し、活用し得る。
コーデックアーキテクチャ
図2A〜2Cは、シングルレイヤーコーデックフレームワーク例を例示する。より詳細には、図2Aは、上流の映像エンコーダなどにおいて1つ以上のコンピューティングプロセッサを用いて実装され得るシングルレイヤー逆ディスプレイマネジメント(SLiDM)エンコーダ側コーデックアーキテクチャの一例を例示する。図2Bは、上流の映像エンコーダなどにおいて1つ以上のコンピューティングプロセッサを用いて実装され得るシングルレイヤーディスプレイマネジメント(SLDM)エンコーダ側コーデックアーキテクチャの一例を例示する。図2Cは、また1つ以上の下流の映像デコーダなどにおいて1つ以上のコンピューティングプロセッサを用いて実装され得、そしてSLiDMエンコーダまたはSLDMエンコーダのいずれかとともに動作できるデコーダ側コーデックアーキテクチャの一例を例示する。
SLiDMフレームワークにおいて、図2Aに例示するように、SDR画像(117)などの後方互換性SDR画像は、コーデックフレームワークのエンコーダ側で入力として受信される。ここで、「後方互換性SDR画像」は、SDRディスプレイ用に特別に最適化されているか、またはカラーグレーディングされているSDR画像を指す。
例示目的であり限定しないが、例えば、SDR−HDR変換ツールなどを表し得る逆ダイナミックレンジマッピング(DM)モジュール146を使用して、SDR画像(117)をリファレンスHDRディスプレイ上での視聴に最適化されたHDR画像148に変換する。いくつかの実施形態において、逆DMモジュールはまた、逆トーンマッピングツールと称され得る。
図2Bに示すSLDMフレームワークにおいて、リファレンスHDRディスプレイ用に最適化されたHDR画像などのHDR画像(148)は、コーデックフレームワークのエンコーダ側で入力として受信される。ここで、「リファレンスHDRディスプレイ用に最適化されたHDR画像」は、HDRディスプレイ用に特別にカラーグレーディングされたHDR画像を指し得る。
例示目的であり限定しないが、例えば、HDR−SDR変換ツールなどを表し得る順方向再構成モジュール164を使用して、HDR画像(148)をSDRディスプレイ上での視聴に最適化されたSDR画像(117)に変換する。いくつかの実施形態において、順方向再構成モジュールはまた、トーンマッピングツールと称され得る。
SLiDMおよびSLDMフレームワークの両方において、画像メタデータ生成器150(例えば、符号化ブロック(120)の一部など)は、SDR画像(117)およびHDR画像(148)の両方を入力として受信し、コンポーザメタデータ、DMメタデータなどの画像メタデータ152を生成する。例えば、画像メタデータ生成器(150)は、SDR画像(117)を最適逆方向再構成関数を用いて逆方向再構成することによって生成された逆方向再構成画像が可能な限りHDR画像(148)に近くなるような最適逆方向再構成関数を見つけるために、最適化を行い得る。最適逆方向再構成関数は、画像メタデータ152におけるコンポーザメタデータを用いて表されるか、または特定され得る。追加的に、オプションとして、または代替的に、画像メタデータ生成器(150)は、HDR画像(148)、逆方向再構成画像、またはSDR画像(117)のうちの1つ以上に基づいてDMメタデータを生成する(近似方法などを介して)。受信側デバイスは、DMメタデータを使用して、例えば再構成されたHDR画像に対してDM演算を行って、リファレンスHDRディスプレイとは異なり得るディスプレイデバイス用のディスプレイ画像を生成し得る。
SLiDMおよびSLDMフレームワークの両方において、圧縮ブロック142(例えば、図1の符号化ブロック(122)の一部など)は、映像信号のシングルレイヤー144においてSDR画像(117)を圧縮/符号化する。映像信号例は、図1の符号化ビットストリーム(122)であり得るが、必ずしもこれのみに限定されない。SDR画像(117)、HDR画像(148)、逆方向再構成画像などに基づいて画像メタデータ生成器(150)によって生成される画像メタデータ(152)(「rpu」と表示する)は、映像信号に符号化され得る(例えば、図1の符号化ブロック(122)などによって)。
SLiDMおよびSLDMフレームワークの両方において、画像メタデータ(152)は、映像信号において、SDR画像が映像信号において符号化されているシングルレイヤーとは分離して、搬送され得る。例えば、画像メタデータ(152)は、符号化ビットストリームにおけるコンポーネントストリーム(component stream)において符号化されていてもよい。コンポーネントストリームは、SDR画像(117)が符号化されているシングルレイヤー(符号化ビットストリームのシングルレイヤー)から分離されていてもよいし、そうでなくてもよい。
SLiDMおよびSLDMフレームワークの両方において、エンコーダ側アーキテクチャは、HDR画像(148)を映像信号において符号化/圧縮HDR画像にそのまま符号化することを回避するために使用され得る。その代わりに、映像信号における画像メタデータ(152)のうちのコンポーザメタデータは、下流の復号化デバイスによって、SDR画像(117)(映像信号において符号化されている)を逆方向再構成して、HDR画像(148)と同一であるか、またはそれに近く/最適に近似された再構成画像にすることを可能するために使用され得る。
SLiDMおよびSLDMフレームワークの両方において、SDRコンテンツは、エンコーダ側コーデックアーキテクチャを実装する上流の符号化デバイスによって、符号化ビットストリーム(122)など映像信号のシングルレイヤーにおいて、符号化され、送信される。SDRコンテンツは、デコーダ側コーデックアーキテクチャを実装する下流の復号化デバイスによって、映像信号のシングルレイヤーにおいて、受信され、復号化される。コンポーザメタデータはまた、映像信号においてSDRコンテンツとともに、符号化され、送信されるので、HDRディスプレイデバイスは、SDRコンテンツおよびコンポーザメタデータに基づいてHDRコンテンツを再構成できる。
いくつかの実施形態において、図2Cに例示するように、シングルレイヤー(144)においてSDR画像(117)および全画像メタデータの一部としての逆方向再構成メタデータ(152)とともに符号化されている映像信号は、SLiDMまたはSLDMコーデックフレームワークのデコーダ側で入力として受信される。
復元ブロック154(例えば、図1の復号化ブロック(130)の一部など)は、映像信号のシングルレイヤーにおける圧縮映像データを復号化SDR画像(182)に復元/復号化する。復号化SDR画像(182)は、SDR画像(117)と同じであり得るが、圧縮ブロック(142)および復元ブロック(154)において量子化エラーを受け得る。復号化SDR画像(182)は、SDRディスプレイデバイス用に最適化されていてもよい。復号化SDR画像(182)は、出力SDR映像信号156において、SDRディスプレイに出力され(例えば、HDMIインターフェース介して、映像リンクを介して、など)、そしてSDRディスプレイ上で描画され得る。
さらに、逆方向再構成ブロック158は、入力映像信号から画像メタデータ(152)を抽出し、画像メタデータ(152)におけるコンポーザメタデータに基づいて最適逆方向再構成関数を構築し、そして最適逆方向再構成関数に基づいて復号化SDR画像(117)に対して逆方向再構成演算を行って、逆方向再構成画像(132)(または再構成されたHDR画像)を生成する。いくつかの実施形態において、逆方向再構成画像は、HDR画像(148)と同一であるか、またはそれに近く/最適に近似されたプロダクション品質またはほぼプロダクション品質のHDR画像を表す。逆方向再構成画像(132)は、出力HDR映像信号160において(例えば、HDMIインターフェースを介して、映像リンクを介して、など)HDRディスプレイデバイスに出力され、そしてHDRディスプレイデバイス上で描画され得る。
いくつかの実施形態において、HDRディスプレイデバイスに特有のディスプレイマネジメント演算を、逆方向再構成画像(132)に対して、画像メタデータ(152)におけるDMメタデータに少なくとも部分的に基づいて行って、例えば描画されるべきディスプレイ画像を生成する。
例示目的として、シングルレイヤーコーデックアーキテクチャを説明した。なお、本明細書に記載される技術は、図2A〜2Cに例示したものとは異なるシングルレイヤーコーデックアーキテクチャにおいて使用され得る。追加的に、オプションとして、または代替的に、これらの技術は、マルチレイヤーコーデックアーキテクチャにおいて使用され得る。このように、シングルレイヤーまたはマルチレイヤーコーデックアーキテクチャのこれらの変形または他の変形は、本明細書に記載される上記技術の一部またはすべてとともに動作し得る。
後方互換性、柔軟性、および圧縮効率
いくつかの実施形態において、本明細書に記載される技術における圧縮方法は、拡張ブロックを使用して、DMメタデータを含むがそれに限定されない画像メタデータを圧縮し得る。拡張ブロックへの圧縮されるべきDMメタデータは、異なるDMレベルでのメタデータパラメータのうちの一部またはすべてを含み得る。
例えば、L0メタデータを使用して、画像データまたはDMメタデータの一部もしくは全部が生成される、ソース(または、リファレンス)ディスプレイのダイナミックレンジについての情報を提供/記述し得る。
レベル1(L1)メタデータを使用して、符号化ビットストリーム(122)において表され得る、ソース画像(例えば、EDR画像など)、ソースシーン(例えば、EDR画像において描写されるシーンなど)、ソースGOP(例えば、EDR画像におけるピクチャ群など)などにおける輝度値の分布についての情報を提供/記述し得る。
レベル2(L2)メタデータを使用して、リファレンスダイナミックレンジ(例えば、SDR、EDRなど)を有するリファレンスディスプレイ(例えば、リファレンスディスプレイ(125)、リファレンスEDRディスプレイなど)を備えたプロダクションスタジオにおいて、ディレクタ、カラーグレーダ(color grader)、映像プロフェッショナルなどによってなされる調節を起源とするか、またはそこにさかのぼる映像特性調節についての情報を提供/記述し得る。
レベル3(L3)メタデータを使用して、リファレンスダイナミックレンジと異なる第2のリファレンスダイナミックレンジを有する第2のリファレンスディスプレイを備えたプロダクションスタジオにおいて、ディレクタ、カラーグレーダ(color grader)、映像プロフェッショナルなどによってなされる調節を起源とするか、またはそこにさかのぼる映像特性調節についての情報を提供/記述し得る。
レベル4(L4)メタデータを使用して、局所的なディミング演算のために使用される情報を提供/記述し得る。
追加的に、オプションとして、または代替的に、上記DMレベル以外のDMレベルでの非DMメタデータ、他のDMメタデータ、および/またはメタデータパラメータは、本明細書に記載される画像処理演算および/またはDM演算によって使用され得る。
いくつかの実施形態において、圧縮方法は、時間領域予測(すなわち、時間領域における予測)に基づいて、レベル1(L1)メタデータおよびレベル4(L4)メタデータなどのDMメタデータの一部または全部に対して損失圧縮を行う。
本明細書に記載される技術を実装しない他の手法においては、画像メタデータを搬送するために使用される拡張ブロックは、顕著なオーバーヘッドを消費し得る。このように、DMメタデータにおいて表される(DM)レベルのメタデータを搬送するためには、比較的高いビットレートが必要とされ得る。DMメタデータにおいて複数(DM)レベルのメタデータを供給する際には、オーバーヘッドがさらに大きくなる。さらに、DMメタデータは、これらの他の手法において圧縮されない場合もあり、画像メタデータ以外の映像基本(elementary)ストリーム(例えば、画像データ、MPEG映像基本ストリーム、パケット化基本ストリームなどを含む)がとる所与のビットレートの大きさにかかわらず、固定数のオーバーヘッドビットが必要となり得る。
例えば、L1メタデータは、最大、最小、および平均輝度値などの3つのパラメータを含み得る。各パラメータは、12ビットであり得る。L4メタデータは、輝度および/またはクロミナンス分布における、記述統計学/定義(例えば、幾何平均、中央値、モード、分散、または標準偏差)などの2つのパラメータを含み得る。各パラメータは、12ビットであり得る。L1およびL4メタデータにおけるこれらのパラメータに対するビットは、各画像フレームに対して生成され、搬送され得る。
本明細書に記載される上記技術を実装しない他の手法においては、各拡張ブロックは、所定のオーバーヘッドを必要とする。例えば、12ビットペイロードを有する拡張ブロックは、符号化ビットストリームにおいて27ビットを必要とする。24ビットペイロードを有する拡張ブロックは、符号化ビットストリームにおいて37ビットを必要とする。36ビットペイロードを有する拡張ブロックは、符号化ビットストリームにおいて53ビットを必要とする。このように、様々なDMレベルのメタデータパラメータを搬送するために使用されるオーバーヘッドは、かなり顕著であり(例えば、30〜50%など)、大きすぎて比較的低いビットレート映像ストリーミング(例えば、SDR映像ストリーミング、適応ストリーミングなど)に収容されない恐れがある。
本明細書に記載の技術を使用して、(1)後方互換性、(2)柔軟性、および(3)圧縮効率のうちの一部またはすべてを有するDMメタデータを圧縮し得る。後方互換性を得るために、圧縮方法は、広範囲のメディアプロセッシングデバイスによってサポートされる拡張ブロックアーキテクチャの一部または全部を再利用し得る。
上記のように、当該分野ですでに利用されている第1のデコーダは、本明細書に記載される圧縮フォーマットを有する新たに作成された符号化ビットストリームを受信できる。第1のデコーダは、本明細書に記載される圧縮方法を用いて圧縮/符号化された新しい拡張ブロックを認識しなくてもよいが、そのデコーダで利用可能であるか、またはそれにアクセス可能なデフォルト値(例えば、DM静的値など)の使用に戻り得る。その結果、第1のデコーダは、新たに作成された符号化ビットストリームも引き続き復号化でき、圧縮フォーマットを処理/取り扱いでき、そして解釈可能な(interpretable)またはデフォルト値を用いて、適度な品質で画像を描画できる。ダイナミック適応ストリーミングの場合、第1のデコーダは、第1のデコーダが認識しない新しい拡張ブロックなどのDMメタデータの一部または全部をストリーミングすることも回避し得る。
新しい拡張ブロックを認識する、ある(例えば、新しい)デコーダは、新しい拡張ブロックを復元して、符号化ビットストリームにおいて符号化されているDMメタデータにおける様々なDMレベルのメタデータパラメータに対して値を得ることができる。そのようなデコーダは、DMメタデータにおける様々なDMレベルのメタデータパラメータに対する値のうちの一部またはすべてに基づいてDM演算を行うことができる。
柔軟性を得るために、本明細書に記載される技術によって拡張ブロック階層が実装され得る。拡張ブロック階層は、(a)シーケンスレベル拡張ブロック、(b)フレームレベル拡張ブロック、(c)オーバーヘッドフリー(overhead−free)ペイロード拡張ブロックなどを使用する。いくつかの実施形態において、1シーケンスの画像フレームの全体に存在する拡張ブロックIDは、例えばシーケンスレベル拡張ブロックによって搬送されるシーケンスレベル情報としてグループ化され得る。シーケンスレベル情報は、1シーケンスの画像フレームに対する1セットのシーケンスレベルパラメータに対応し得るか、またはそれを含み得る。シーケンスレベルパラメータは、1シーケンスの画像フレームの全体において存在する1特定セットのメタデータ型(例えば、拡張ブロックIDに関連する)を示す1セットのシーケンスレベルインジケータを含み得る。したがって、シーケンスレベルパラメータは、1シーケンスの画像フレームの全体に生じる、それらのメタデータ型(例えば、拡張ブロックID)のカタログ(catalog)を表すということができる。シーケンスレベル情報またはシーケンスレベル拡張ブロックは、シーケンスレベルでのリフレッシュが必要とされる場合には、比較的低頻度で送信され得る(例えば、インスタントデータリフレッシュ(Instant−Data−Refresh(IDR))画像フレーム、プログラム切り換え(switching)、ビットレート切り換えなどを用いて送信され得る)。フレームレベル拡張ブロック(例えば、フレーム存在拡張ブロックなど)は、1シーケンスの画像の全体において存在すると、シーケンスレベルで伝えられる拡張ブロックIDの一部またはすべてについて、ペイロード拡張ブロック(例えば、フレームオーバーヘッドフリー拡張ブロックなど)の存在を伝えることができる。フレームレベル拡張ブロックは、1セットのフレーム存在パラメータに対応し得るか、またはそれを含み得る。各セットのフレーム存在パラメータは、それぞれの画像フレームに対して生成される。所与の画像フレームに対する1セットのフレーム存在パラメータは、1特定セットのフレーム存在インジケータを含む。各フレーム存在インジケータは、シーケンスレベル情報(例えば、シーケンスレベルパラメータ)によって示される1特定セットのメタデータ型におけるそれぞれのメタデータ型(例えば、拡張ブロックID)に対応する。いくつかの実施形態において、フレームレベル拡張ブロックは、存在インジケータ(または、フラグ)を含み得る。各存在インジケータは、ペイロード拡張ブロックがフレームレベルで対応する型のメタデータに対して存在するか否かを示す。フレーム存在インジケータのレベルにおいて、各フレーム存在インジケータは、所与の画像フレームに対して、それに対応するメタデータ型(例えば、拡張ブロックID)がその所与の画像フレームに対して存在するか否かを示し得る。したがって、各フレーム存在インジケータは、所与の画像フレームに対して対応するメタデータ型の有無を示すことができる。よって、フレーム存在パラメータは、それらの対応するメタデータ型が所与の画像フレームに対して存在すること(およびこれらのメタデータ型に対するメタデータパラメータ値が所与の画像フレームに対して符号化されるべきであること)を示す第1のフレーム存在インジケータ、およびそれらの対応するメタデータ型が所与の画像フレームに対して存在しないこと(および所与の画像フレームに対して符号化されるべきこれらのメタデータ型に対するメタデータパラメータ値がないこと)を示す第2のフレーム存在インジケータに(仮想的に)グループ化され得る。所与の画像フレームに対して存在するメタデータ型は、第1のメタデータ型と称され得る。他方、存在しないメタデータ型は、第2のメタデータ型と称され得る。存在することがフレームレベルで伝えられるすべてのペイロード拡張ブロック(メタデータペイロードの例として)(すなわち、対応するフレーム存在インジケータが第1のフレーム存在インジケータである第1のメタデータ型)は、オーバーヘッドフリーペイロード本体(例えば、提示された異なるメタデータ型を分離するパディングビットがない)にフレームレベルで束ねられる(bundled)。言い換えると、第1のメタデータ型に対するメタデータパラメータ値(だけ)がオーバーヘッドフリーペイロード本体に束ねられる。言うまでもなく、存在しないことがフレームレベルで伝えられるペイロード拡張ブロック(例えば、メタデータ型)(すなわち、対応するフレーム存在インジケータが第2のフレーム存在インジケータである第2のメタデータ型)は、与えられた画像フレームについて符号化されない。拡張ブロック階層を用いると、比較的大きな柔軟性および圧縮効率が同時に達成され得る。
圧縮効率を得るために、いくつかの実施形態において、DMメタデータにおけるメタデータパラメータの一部またはすべてのうちの各メタデータパラメータは、時間領域における予測関数(または、予測多項式)を用いてモデル化され得る。(時間領域)予測関数は、線形(例えば、一次多項式など)または非線形(例えば、二次以上の高次多項式、非線形非多項式関数など)であり得る。所与の時点(例えば、対応する画像フレームのフレームインデックスなどで表される)での各そのようなメタデータパラメータの値は、予測関数を介して、時間領域において予測され得る。
メタデータパラメータが予測関数として時間領域において一次多項式の形態でモデル化される場合、メタデータパラメータの実際の値をそのまま伝える代わりに、一次多項式を特定するための傾きおよびオフセットが映像エンコーダから映像デコーダに伝えてもよい。
いくつかの実施形態において、メタデータパラメータは、予測関数として複数個の一次多項式の形態でモデル化される。メタデータパラメータの実際の値をそのまま伝える代わりに、複数個の一次多項式を特定するための複数セットの傾きおよびオフセットが映像エンコーダから映像デコーダに伝えてもよい。
いくつかの実施形態において、予測関数は、二次以上の高次多項式または他の非線形関数であり得る。メタデータパラメータの実際の値をそのまま伝える代わりに、二次以上の高次多項式または他の非線形関数を特定するための多項式の係数または他の関数パラメータが映像エンコーダから映像デコーダに伝えてもよい。
映像エンコーダは、時間領域予測における変化点(または、それぞれ予測エラーが最大許容可能エラーを超えるフレームインデックス)を決定または認識(例えば、ピークアヘッド(peek ahead)など)でき、そして異なる次数の多項式、非多項式関数などの予測関数を特定するための新しいセットの傾きおよびオフセットまたは新しい関数パラメータを伝えることができる。
所与の時点でのメタデータパラメータの所与の値を予測するための多項式において使用される多項式パラメータは、特定の符号化シンタックスを用いて、本明細書に記載されるペイロード拡張ブロックに符号化され得る。特定の符号化シンタックスは、メタデータパラメータがシーンベースであるか、またはフレームベースであるかに応じて、メタデータパラメータに対して多項式パラメータを符号化するために使用され得る。メタデータパラメータがシーンベースのパラメータである場合、メタデータパラメータの値は、シーンにおいて一定または不変であり得る。このように、そのようなメタデータパラメータを表すための多項式における多項式パラメータは、シーン内で変化しなくてもよい(または、変化する必要がない)。他方、メタデータパラメータがフレームベースのパラメータである場合、メタデータパラメータの値は、例えば時間にわたってフィルタ化/平滑化された値として、フレーム毎に変化し得る。本明細書に記載される技術において、メタデータパラメータの値は、一定であるか、または時間とともに変化するかのいずれであっても、符号化ビットストリームにおいて比較的効率的に(例えば、5:1圧縮比など)圧縮・搬送され得る、多項式パラメータ(または、異なる関数パラメータ)を有する、時間領域における多項式(または、異なる予測関数)を使用して予測/決定され得る。
メタデータパラメータの時間領域予測
DMメタデータなどの画像メタデータは、値が時間(例えば、画像フレームのフレームインデックスによって表される)によって変化する多数のメタデータパラメータを含み得る。
図3は、横軸で表される1シーケンスの連続する時点にわたって、縦軸によって表される画像フレーム(例えば、メディアプログラムの一部または全部の連続する画像フレームなど)におけるフレーム毎(または、フレーム当たり)の平均輝度の値のプロット例を例示する。いくつかの実施形態において、1シーケンスの連続する時点における各時点は、画像フレームのうちのそれぞれの画像フレームについての、1シーケンスの画像に対する1シーケンスのフレームインデックス値における、それぞれのフレームインデックス値に対応する。
図3において、フレーム当たりの平均輝度は、1シーケンスのフレームインデックス値によって表される1シーケンスの連続する時点にわたって、時間領域において大部分比較的滑らかに変化することが見て取れる。第1、第2および第3時点302−1〜302−3の各時点などの新しいシーンカットによる急な変化がいくつかある。
しかし、急な変化が生じる互いに近傍の時点間において、フレーム当たりの平均輝度は、比較的滑らかに変化する。例えば、第1および第2時点302−1および302−2の間において、フレーム当たりの平均輝度は、比較的滑らかに変化する。同様に、第2および第3時点302−2および302−3の間において、フレーム当たりの平均輝度はまた、比較的滑らかに変化する。
画像メタデータにおいて時間変化するメタデータパラメータの多くは、フレーム当たりの平均輝度のように、時間にわたって同様の滑らかな傾向を奏し得る。したがって、時間変化するメタデータパラメータの値は、1シーケンスの連続する時点におけるほとんどの時点に対して、これらの時間変化するメタデータパラメータの値の時間にわたっての滑らかな傾向を近似する多項式などの滑らかに変化する関数に基づいて、時間領域において、効率的に予測され得る。
例示目的であり限定しないが、例えば、画像フレームjでのメタデータパラメータの値をmと表す。フレームj+fでのメタデータパラメータの値は、オフセットtおよび傾きsなどの多項式パラメータ/係数を有する下記一次多項式を使用して、次のように予測され得る。
Figure 0006838201
メタデータパラメータの値をそのまま映像デコーダなどの受信側デバイスに送る代わりに、多項式パラメータ(t,s)が符号化ビットストリームにおいて伝えられ得る(例えば、122など)。
メタデータパラメータの実際の値mj+fとメタデータパラメータ予測値
Figure 0006838201
との間の歪み測定値(または、予測エラー)dj,j+fを以下のように表す。
Figure 0006838201
歪み測定値の一例は、以下のように、実際のメタデータ値mj+fと予測メタデータ値
Figure 0006838201
との間の絶対差(例えば、平均絶対差(MAD)など)であり得る。
Figure 0006838201
例えば1シーケンスの画像フレームの全体に対する最大許容可能歪み測定値(または閾値)をΔと表す。
(現在の)歪み測定値dj,j+fが最大許容可能歪み測定値Δよりも大きくないとの判定(例えば、映像エンコーダによって、など)に応答して、予測値
Figure 0006838201
は、メタデータパラメータの(現在の)値に対して使用され得る。例えば、モードフラグrj+f(例えば、0に設定される、など)を使用して、受信側デバイスに対して、メタデータパラメータの値を予測するための現在の多項式パラメータを使用することを継続するように伝えられ得る。
他方、(現在の)歪み測定値dj,j+fが最大許容可能歪み測定値Δよりも大きいとの判定(例えば、映像エンコーダによって、など)に応答して、新しい1セットの多項式パラメータ(tj+f,sj+f)が符号化ビットストリーム(122)において受信側デバイスに伝えられ得る。よって、モードフラグrj+fは、新しい1セットの多項式パラメータが送られることを伝えるように設定され得る(例えば、rj+f=1など)。モードフラグおよび新しい1セットの多項式パラメータを含む三重項(r,t,s)を使用して、最大許容可能歪み測定値Δによって表される許容可能閾値を用いて時間領域におけるメタデータパラメータに対する値を生成/予測することができる。
時間領域予測は、フレームベースおよびシーンベースのメタデータパラメータの両方に適用可能である。フレームベースのメタデータパラメータに対して、受信側デバイスに伝えられるsの値は、シーン内で一定または時間変化し得る。シーンベースのメタデータパラメータについて、シーン全体に対して、s=0である。
いくつかの実施形態において、メタデータパラメータに対するモードフラグおよび多項式パラメータは、以下の表1に例示する手順例を使用して、符号化ビットストリームにおいて受信側デバイスに伝えられ得る。
Figure 0006838201
メタデータパラメータの値(例えば、予測値など)をモードフラグおよび多項式パラメータによって受信側デバイス(例えば、映像デコーダなど)に伝えるために、以下の表2に示すように、映像エンコーダが符号化シンタックス例を使用して、モードフラグおよび多項式パラメータを符号化ビットストリーム(122)において画像メタデータの一部として符号化し得る。
Figure 0006838201
いくつかの実施形態において、表2に例示する符号化シンタックスは、映像エンコーダによって受信側デバイスに伝えられるべき、1つ以上のDMレベルでの一部またはすべてのメタデータパラメータに対して、それぞれのモードフラグおよび多項式パラメータを渡すために使用され得る。いくつかの実施形態において、これらのメタデータパラメータの一部(例えば、L1メタデータ、L4メタデータなど)は、1シーケンスの(連続する)画像フレームのうちの各画像フレームに対して、上記符号化シンタックスを使用して伝えられ得る。
時間領域において予測されるべき各メタデータパラメータに対して、シンタックス要素「DM_comp_mode」は、メタデータパラメータに対してモードフラグを表す。「DM_comp_mode」が1に等しい場合、メタデータパラメータの値を予測するために使用される多項式(または、時間領域予測関数)は、シンタックス要素「DM_metadata_offset」、「DM_metadata_slope_value_int」、および「DM_metadata_slope_value_frac」によって表される(新しい)多項式パラメータを用いて更新され得る。
他方、「DM_comp_mode」が0に等しい場合、メタデータパラメータの値は、1に設定された「DM_comp_mode」を有する最も近い過去の画像フレームから多項式パラメータを用いて生成される多項式から予測され得る。
表2において、「DM_metadata_offset」は、(予測)多項式におけるオフセットを指定する。「DM_metadata_slope_value_int」は、予測多項式における傾きの整数部を指定する。「DM_metadata_slope_value_frac」は、予測多項式における傾きの少数部を指定する。
この符号化シンタックスを認識する受信側デバイスは、メタデータパラメータの予測値を取り出すための復号化プロセス例を以下のように実装し得る。
DM_metadata_value=DM_metadata_offset+(DM_metadata_slope_value_int+DM_metadata_slope_value_frac>>4)*(現在のフレームインデックス−アンカー(anchor)フレームインデックス) (3)
ここで、「>>」は、ビットレベル右シフト演算子を表し、「現在のフレームインデックス」は、メタデータパラメータの値が予測多項式によって予測されるべき現在の画像フレームのフレームインデックスを表し、「アンカーフレームインデックス」は、1に設定された「DM_comp_mode」を有する最も近い過去のフレームのフレームインデックスを表す。
階層拡張ブロックのための符号化シンタックス
いくつかの実施形態において、本明細書に記載される映像エンコーダによって使用される圧縮方法は、DMメタデータを含むがそれに限定されない画像メタデータを符号化するための複数層の拡張ブロックを含む階層拡張ブロックを使用する。例示目的であり限定しないが、例えば、第1層の拡張ブロックは、シーケンスレベル情報を渡すために使用されるシークエンスサマリー(SS)拡張ブロックであり、第2層の拡張ブロックは、フレームレベル情報を渡すために使用されるフレーム存在(FP)拡張ブロックであり、第3層の拡張ブロックは、メタデータパラメータの値(例えば、実際の値、予測値を生成するために使用されるモードフラグおよび多項式パラメータなど)を搬送するために使用されるフレームオーバーヘッドフリーペイロード拡張ブロックである。
SS拡張ブロックおよびFP拡張ブロックを符号化するために映像エンコーダによって使用される複合符号化シンタックス例を以下の表3(「ext_dm_alignment_zero_bit」は、拡張ブロックを適切なバイトまたはワード境界までパディングするためのゼロなどのデフォルト値を有するパディングビットを表す)に例示する。
Figure 0006838201
表3から分かるように、映像エンコーダは、第1の入力パラメータ「ext_block_length」および第2の入力パラメータ「ext_block_level」などの入力パラメータを受け取る複合符号化シンタックスを実装し得る。
第2の入力パラメータ「ext_block_level」に対して値「SS」(例えば、数値254など)を受け取ったことに応答して、映像エンコーダによって実装される複合符号化シンタックスは、SS拡張ブロックを生成する。他方、第2の入力パラメータ「ext_block_level」に対して値「FP」(例えば、数値253など)を受け取ったことに応答して、複合符号化シンタックスは、FP拡張ブロックを生成する。
SS拡張ブロックは、シーケンスレベル情報を伝えるために使用され得る。そしてSS拡張ブロックは、シーケンスレベルが伝えられるか、または再度伝えられる必要があると映像エンコーダが判断する、画像フレームにおけるIDR位置(例えば、リフレッシュ、同期、プログラム切り換え、ビットレート切り換えなど)または他の時間的位置(例えば、比較的多数の時間変化するメタデータパラメータに対する共通の顕著な変化点など)に対応する特定のフレームインデックスにおいてのみ生じる(例えば、符号化、送信、受信、復号化など)ものであり得る。いくつかの実施形態において、1シーケンスの画像フレームに対して、最大で1つのSS拡張ブロックが映像エンコーダによって受信側デバイス(例えば、映像デコーダなど)に送信され/伝えられ得る。
表3に例示するように、SS拡張ブロックは、シーケンスレベルパラメータ「seq_number_extension_block」およびシーケンスレベルパラメータ配列「seq_extension_block_level[i]」を含み得る。ここで、インデックス「i」は、0以上(seq_number_extension_block−1)以下の値であり、SS拡張ブロックが生成される1シーケンスの画像フレームの全体に存在することになる拡張ブロックIDを表す。シーケンスレベルパラメータ「seq_number_extension_block」は、0以上65535以下の範囲の現在のシーケンスの画像フレームにおいて存在する拡張ブロックIDの総数を指定する。いくつかの実施形態において、シーケンスレベルパラメータ「seq_number_extension_block」に対する特定の値が見つかったときには、ゼロ(0)などのデフォルト値がそのパラメータに与えられ得る。
SS拡張ブロックにおいて搬送されるシーケンスレベルパラメータ配列「seq_extension_block_level[i]」は、拡張ブロックIDがそれぞれどのDMレベルに対応するかを受信側デバイスに伝えるために、映像エンコーダによって使用され得る。シーケンスレベルパラメータ配列「seq_extension_block_level[i]」は、現在のシーケンスの画像フレームにおいて存在する拡張ブロックID「i」に対するDMレベルを示す。いくつかの実施形態において、シーケンスレベルパラメータ配列「seq_extension_block_level[i]」における値は、1以上252以下の範囲にある。シーケンスレベルパラメータ配列「seq_extension_block_level[i]」が存在しない場合、ゼロ(0)などのデフォルト値が現在のシーケンスの画像フレームにおいて存在する拡張ブロックID「i」に対するDMレベルの一部またはすべてに与えられ得る。
FP拡張ブロックは、フレームレベル情報を伝えるために使用され得、各画像フレームにおいて生じ(例えば、符号化、送信、受信、復号化されるなど)得る。
表3に例示されるように、対応する画像フレームに対するFP拡張ブロックは、フレームレベルパラメータ配列「seq_extension_block_present[i]」を含み得る。ここで、iは、0以上(seq_number_extension_block−1)以下の値であり、シーケンスに対してSS拡張ブロックによって示される1シーケンスの画像フレームの全体において存在する拡張ブロックIDを表す。FP拡張ブロックにおけるフレームレベルパラメータ配列「seq_extension_block_present[i]」は、どの拡張ブロックID(「i」によって表される)が第3層の拡張ブロック(または、フレームオーバーヘッドフリー拡張ブロック)においてペイロードブロックを搬送するかを受信側デバイスに示すために映像エンコーダによって使用され得る。追加的に、オプションとして、または代替的に、FP拡張ブロックにおけるフレームレベルパラメータ配列「seq_extension_block_present[i]」は、すべてのペイロードブロックを次々に詰める(pack)ために映像エンコーダによって使用されてもよく、このとき、これらのペイロードブロックにパディングビットは一切用いず、いずれの隣り合うペイロードブロックを分離するパディングビットも一切用いない。
いくつかの実施形態において、対応する画像フレームに対して値を更新する必要のあるメタデータパラメータ(1などの特別な値に設定されたseq_extension_block_present[i]を有する拡張ブロックIDに対応する)のみが、そのペイロードブロックを映像エンコーダによって符号化されている。対応する画像フレームに対して値を更新する必要のない他のメタデータパラメータは、映像エンコーダによって符号化されたペイロードブロックを一切有さない。
例えば、特定の拡張ブロックID「i」が、対応する画像に対するFP拡張ブロックにおいて、更新を必要としていると示されている(例えば、seq_extension_block_present[i]==1など)と判断したことに応答して、映像エンコーダは、ペイロード符号化ルーチン「ext_block_payload_comp(...)」を呼び出す(call)ことができる。1シーケンスの画像フレームの全体に対するSS拡張ブロックにおけるシーケンスレベルパラメータ「seq_extension_block_level[i]」の配列を用いて設定された、特定の拡張ブロックID「i」のDMレベルは、ペイロード符号化ルーチン「ext_block_payload_comp(...)」に対する入力パラメータとして渡される。ペイロード符号化ルーチンは、DMレベルを使用して、シーケンスレベルパラメータ「seq_extension_block_level[i]」の配列において示されるDMレベルにおいてメタデータパラメータの更新値を符号化できる。いくつかの実施形態において、時間領域予測を使用して、これらのメタデータパラメータの値の一部またはすべてを更新するための簡潔な(concise)ペイロードを生成し得る。いくつかの実施形態において、これらのペイロードは、第3層の拡張ブロックにおけるフレームオーバーヘッドフリーペイロード拡張ブロックを使用して符号化され得る。
他方、特定の拡張ブロックID「i」が、対応する画像に対するFP拡張ブロックにおいて、更新を必要としていないと示されている(例えば、seq_extension_block_present[i]==0など)と判断したことに応答して、映像エンコーダは、ペイロード符号化ルーチン「ext_block_payload_comp(...)」を呼び出す(call)ことを回避できる。特定の拡張ブロックID「i」のに対する特定の拡張ブロックID「i」のDMレベルは、1シーケンスの画像フレームの全体に対するSS拡張ブロック内のシーケンスレベルパラメータ「seq_extension_block_level[i]」の配列を用いて設定されている。このように、いくつかの実施形態において、対応する画像フレームに対して、映像エンコーダは、拡張ブロックID「i」に対するフレームレベルパラメータ「seq_extension_block_present[i]」が更新をしないための特別な値(例えば、0など)に設定される場合、拡張ブロックID「i」に関連付けられたメタデータパラメータの値を更新するためのペイロードを一切生成しない。例えば、メタデータパラメータの値の時間領域予測のために使用された前回のメタデータパラメータのメタデータ値または前回の多項式を、対応する画像に対してメタデータパラメータの値を生成または提供するために継続して使用され得る。
ペイロード符号化ルーチン「ext_block_payload_comp(...)」は、様々なDMレベルに対してフレームオーバーヘッドフリーペイロード拡張ブロックを符号化するために映像エンコーダによって使用される総ペイロード符号化シンタックス例によって、以下の表4に例示されるように表され得る。
Figure 0006838201
表4から分かるように、入力パラメータとして渡してこられたDMレベルに基づいて、ペイロード符号化ルーチン「ext_block_payload_comp(...)」は、ペイロード符号化サブルーチン「DM_comp_メタデータ1()」、「DM_comp_メタデータ2()」、「DM_comp_メタデータ3()」、「DM_comp_メタデータ4()」、「DM_comp_メタデータ5()」、「DM_comp_メタデータ6()」などを呼び出す。
ペイロード符号化サブルーチンは、様々なDMレベルに対してそれぞれのフレームオーバーヘッドフリーペイロード拡張ブロックを符号化するために映像エンコーダによって使用される、それぞれの特定のペイロード符号化シンタックス例によって、下記の表5 〜10に例示されるように、表され得る。
Figure 0006838201
Figure 0006838201
Figure 0006838201
Figure 0006838201
Figure 0006838201
Figure 0006838201
表3および4から分かるように、画像メタデータを符号化するための符号化シンタックスは、それぞれの拡張ブロックレベルを有するSS拡張ブロック、FP拡張ブロック、およびフレームオーバーヘッドフリー拡張ブロックを参照し得る。
例えば、表3における符号化シンタックスは、パラメータ「ext_block_level」に対する値「SS」(例えば、数値254など)を有するSS拡張ブロックを参照する。値「SS」(例えば、数値254など)は、SS拡張ブロックに対して特定の拡張ブロックレベルを表す。
表3における同じ符号化シンタックスはまた、パラメータ「ext_block_level」に対する値「FP」(例えば、数値253など)を有するFP拡張ブロックを参照する。値「FP「(例えば、数値253など)は、FP拡張ブロックに対する特定の拡張ブロックレベルを表す。
表3および4における符号化シンタックスは、パラメータ「seq_extension_block_level[i]」またはパラメータ「ext_comp_block_level」に対して異なる値(例えば、数値1、2、3、4、5、6など)を有するリファレンスフレームオーバーヘッドフリー拡張ブロックを参照する。これらの異なる値(例えば、数値1、2、3、4、5、6など)は、フレームオーバーヘッドフリー拡張ブロックに対するそれぞれの拡張ブロックレベルを表す。
いくつかの実施形態において、フレームオーバーヘッドフリー拡張ブロックに対する異なる拡張ブロックレベルは、フレームオーバーヘッドフリー拡張ブロックにおいて搬送されるメタデータパラメータに対して、異なるDMレベルに対応し得る。
例えば、フレームオーバーヘッドフリー拡張ブロックの、表4におけるパラメータ「seq_extension_block_level[i]」またはパラメータ「ext_comp_block_level」に対して数値1によって表される拡張ブロックレベル(1)は、フレームオーバーヘッドフリー拡張ブロックに対するメタデータパラメータ(例えば、「min_PQ」、「max_PQ」、「avg_PQ」など)に対する「L1」などのDMレベルに対応し得る。同様に、フレームオーバーヘッドフリー拡張ブロックの、表4におけるパラメータ「seq_extension_block_level[i]」またはパラメータ「ext_comp_block_level」に対する数値4によって表される拡張ブロックレベル(4)は、フレームオーバーヘッドフリー拡張ブロックに対するメタデータパラメータ(例えば、「anchor_PQ」、「anchor_power」など)に対する、「L4」などのDMレベルに対応し得る。
エンコーダ側制約条件
階層拡張ブロックに対する符号化シンタックスを使用して画像メタデータを符号化する映像エンコーダは、以下のように1つ以上のエンコーダ側制約条件を実装し得る。
いくつかの実施形態において、符号化ビットストリーム(例えば、122など)において表される各画像フレームに対して、最大で1つのSS拡張ブロック(例えば、レベル254など)がその符号化ビットストリーム(122)において符号化されている。いくつかの実施形態において、1シーケンスの画像フレーム(例えば、メディアプログラムの一部に対応する、など)に対して、1つのSS拡張ブロックが符号化されている。シーケンスレベル符号化パラメータ値は、1シーケンスの画像フレームの全体のうちの各画像フレームに対して1つのSS拡張ブロックを介してアクセスされ得る。
いくつかの実施形態において、1シーケンスの画像フレームに対して符号化される1つのSS拡張ブロックには、FP拡張ブロックが伴う(例えば、後に続く、など)。FP拡張ブロックは、1シーケンスの画像フレームのうちの第1の画像フレームなどの特定の画像フレームに対して符号化され得る。FP拡張ブロックは、1シーケンスの画像フレームの全体に存在する1つのSS拡張ブロックによって示されるすべての拡張ブロックIDに対応するメタデータパラメータ(特定の画像フレームに対する)の値(例えば、初期値など)を完全に決定するために使用され得る。
いくつかの実施形態において、SS拡張ブロック(例えば、レベル254など)は、符号化ビットストリーム(122)において表される各画像フレームではなく、対応する1シーケンスの画像フレームに対して符号化され得る。いくつかの実施形態において、前の画像フレームまたは前の1シーケンスの画像フレームに対する前のSS拡張ブロックにおけるシーケンスレベル情報の一部またはすべては、符号化ビットストリーム(122)における後の画像フレームまたは後の1シーケンスの画像フレームによって再利用され得る。
いくつかの実施形態において、SS拡張ブロック(レベル254)は、SS拡張ブロック(レベル254)が符号化ビットストリーム(122)におけるすべてのFP拡張ブロック(レベル253)によって必要とされる場合、符号化ビットストリーム(122)におけるすべてのFP拡張ブロックよりも早くに、映像エンコーダによって符号化ビットストリーム(122)において符号化される。これは、正しいシーケンスレベル値を参照するFP拡張ブロック(レベル253)が復号化される前に、それらのシーケンスレベル値がSS拡張ブロック(レベル254)から読み出されることを確実にするためである。
エンコーダ側制約条件はまた、後方互換性をサポートまたは実施するために使用され得る。任意の所与の時点において、異なる符号化シンタックスバージョンをサポートするメディアデバイスが当該分野で利用され得る。例えば、L1およびL2メタデータを搬送するための第1の符号化シンタックスバージョンをサポートするメディアデバイスが、最初に当該分野にリリースされ得る。その後、L1、L2およびL4を搬送するための第2の符号化シンタックスバージョンをサポートするメディアデバイスが当該分野にリリースされ得る。さらにその後、L1、L2、L4およびL3を搬送するための第3の符号化シンタックスバージョンをサポートするメディアデバイスが当該分野にリリースされ得る。いくつかの実施形態において、最も早くにリリースされる第1の符号化シンタックスバージョンには、その後にリリースされる第2の符号化シンタックスバージョンよりも小さいバージョン値が与えられ、次いで第2の符号化シンタックスバージョンには、さらにその後にリリースされる第3の符号化シンタックスバージョンよりも小さいバージョン値が与えられる。このように、符号化シンタックスのリリースが早いほど、その符号化シンタックスのバージョンに割り当てられる値は小さくなる。
最大限の後方互換性を確実にするためには、最新の符号化シンタックスバージョンにおける新たにサポートされた拡張ブロックレベル(または、新たにサポートされたDMレベル)のメタデータパラメータを搬送する拡張ブロックは、符号化シンタックスバージョンの最大のバージョン値に関連付けられるが、最後に配置される。その結果、最新の符号化シンタックスバージョンをサポートしないメディアデバイスでも、最新の符号化シンタックスバージョンにおいて符号化されている拡張ブロックから最大個数のメタデータパラメータを認識し取り出し得る。
第1の映像デコーダが符号化シンタックスバージョン1に導入されたL1およびL2メタデータを復号化でき、第2の映像デコーダが符号化シンタックスバージョン2に導入されたL1およびL2ならびにL4メタデータを復号化でき、第3の映像デコーダが符号化シンタックスバージョン3に導入されたL1、L2およびL4ならびにL3メタデータを復号化できる例を考える。1(L1およびL2メタデータ)、2(L1、L2およびL4メタデータ)および3(L1、L2、L4およびL3メタデータ)などのバージョン値を使用して、これらの3つの符号化シンタックスバージョン1、2、および3のいずれにおいても拡張ブロックを順序付けし得る。例えば、最新の符号化シンタックスバージョン(例えば、本例におけるバージョン3など)において、拡張ブロックは、L1およびL2メタデータなどの符号化シンタックスバージョン1においてサポートされるメタデータが、L4メタデータなどのバージョン2において新たにサポートされるメタデータよりも前に符号化されることになるように順序付けされ得る。次いで、L4メタデータなどのバージョン2において新たにサポートされるメタデータは、L3メタデータなどのバージョン3においてサポートされる最新のメタデータよりも前に符号化される。
その結果、符号化シンタックスバージョン1をサポートする第1の映像デコーダは、拡張ブロックが符号化シンタックスバージョン3において符号化されている場合でも、拡張ブロックからL1およびL2メタデータを取り出すことができる。第1の映像デコーダは、L4メタデータを認識しないが、L4メタデータにおけるメタデータパラメータに対してデフォルト値を使用すること、L4メタデータにおけるこれらのメタデータパラメータを無視することなどをし得る。
符号化シンタックスバージョン1および2をサポートする第2の映像デコーダは、拡張ブロックが符号化シンタックスバージョン3において符号化されている場合でも、拡張ブロックからL1、L2、およびL4メタデータを取り出し得る。第2の映像デコーダは、L3メタデータを認識しないが、L3メタデータにおけるメタデータパラメータに対してデフォルト値を使用すること、L3メタデータにおけるこれらのメタデータパラメータを無視することなどをし得る。
いくつかの実施形態において、ペイロード拡張ブロックは、シーケンスレベル拡張ブロックにおいて示されるシーケンスレベルパラメータ配列「seq_extension_block_level[i]」を順序付けすることによって、異なる符号化シンタックスバージョンのバージョン値の昇順に順序付けられ得る。
本例において、DMレベルL1およびL2に対応する第1の拡張ブロックレベルは、まずシーケンスレベルパラメータ配列「seq_extension_block_level[i]」、続いてDMレベルL4に対応する第2の拡張ブロックレベル、さらに続いてDMレベルL3に対応する第3の拡張ブロックレベルにおいて現れ得る。
その結果、シーケンスレベルパラメータ配列「seq_extension_block_level[i]」がFP拡張ブロックを符号化する際に使用される場合、第1の拡張ブロックレベルがまず処理され、第1の拡張ブロックレベルでの任意の存在フラグまたは任意のペイロード拡張ブロックがまず符号化されることになり、続いて第2の拡張ブロックレベルが処理され、第2の拡張ブロックレベルでの任意の存在フラグまたは任意のペイロード拡張ブロックが符号化され、さらに続いて第3の拡張ブロックレベルが処理され、第3の拡張ブロックレベルでの任意の存在フラグまたは任意のペイロード拡張ブロックが符号化される。同様に、シーケンスレベルパラメータ配列「seq_extension_block_level[i]」がFP拡張ブロックおよびペイロード拡張ブロックを復号化する際に使用される場合、第1の拡張ブロックレベルがまず処理され、第1の拡張ブロックレベルでの任意の存在フラグまたは任意のペイロード拡張ブロックがまず復号化されることになり、続いて第2の拡張ブロックレベルが処理され、第2の拡張ブロックレベルでの任意の存在フラグまたは任意のペイロード拡張ブロックが復号化され、さらに続いて第3の拡張ブロックレベルが処理され、第3の拡張ブロックレベルでの任意の存在フラグまたは任意のペイロード拡張ブロックが復号化される。
オーバーヘッドおよび圧縮効率
総メタデータリフレッシュ(例えば、異なるメタデータパラメータ、メタデータパラメータに対するすべてまたは実質的にすべての値のリフレッシュ、など)のために映像エンコーダが選択する画像フレーム(例えば、IDRフレーム、非IDR画像など)に対して、SS拡張ブロックおよびFP拡張ブロック(例えば、FP拡張ブロックに伴うフレームオーバーヘッドフリー拡張ブロックを含むがそれに限定されない、など)の両方が送られ得る。残りの画像フレームに対して、映像エンコーダは、FP拡張ブロックおよびそのFP拡張ブロックにそれぞれ伴う任意のフレームオーバーヘッドフリー拡張ブロックを送信するだけであり得る。SS拡張ブロックがオーバーヘッドとしてカウントされる場合でも、そのようなオーバーヘッドは、比較的小さい。なぜなら、SS拡張ブロックのオーバーヘッドは、SS拡張ブロックが生成される1シーケンスの画像フレームのうちの複数の画像フレームにわたって償却(amortize)され得るからである。このように、SS拡張ブロックは、比較的使用頻度が少ないので、全体的に言えば、SS拡張ブロックからのオーバーヘッドは、比較的小さい。
画像フレームのシーケンス例およびその画像フレームのシーケンス例に対する拡張ブロックを下記の表11に示す。
Figure 0006838201
DMメタデータが3つの拡張ブロックレベル(表3の符号化シンタックスにおけるシーケンスレベルパラメータ配列「seq_extension_block_level[i]」によって示される)を含む演算例を考える。第1の拡張ブロックレベルは、36ビット(L1メタデータなど)を有する。第2の拡張ブロックレベルは、36ビット(L1メタデータなど)を有する。第3の拡張ブロックレベルは、24ビット(表8におけるL4メタデータなど)を有する。
このように、合計24+36+36=96ビットのペイロードとなる8個のパラメータがある。本明細書に記載される圧縮方法を実装しない他の手法においては、37ビットを使用して24ビット(L4メタデータにおける)を符号化し得、53ビットを使用して36ビット(L4メタデータにおける)を符号化し得る。このように、これらの他の手法においては、2×36ビット(L1メタデータにおける)および24ビット(L4メタデータにおける)を符号化するために、合計37+53+53=143ビットが必要となり得る。
本明細書に記載される技術においては、顕著により少ないビット数を使用して、時間領域予測を使用することなく、同じメタデータを送信できる。
例えば、SS拡張ブロックが表11におけるフレームインデックス1〜3および5に対して符号化、送信、受信および復号化されない場合、FP拡張ブロック(それに伴うフレームオーバーヘッドフリー拡張ブロックを含む)は、本例において7ビットを取る、符号なし整数Exp−Golomb−符号化シンタックスにおいて符号化されているパラメータ「ext_block_length」を含み得る。FP拡張ブロックは、3つのフレームオーバーヘッドフリー拡張ブロックに対して3ビット(L4メタデータに対して1ビット、L1メタデータに対して2ビット)を取るパラメータ配列「seq_extension_block_present」を含む。フレームオーバーヘッドフリー拡張ブロックは、L1およびL4メタデータを搬送するために96ビットを取る。最後に、SSおよびFP拡張ブロックは、パディングのためのext_dm_alignment_zero_bitの5ビットを取る(例えば、バイト境界に揃える(alignment)ための3+96+5)。このように、FP拡張ブロック(それに伴うフレームオーバーヘッドフリー拡張ブロックを含む)は、Exp−Golomb−符号化「ext_block_length」を含む、合計7+3+96+5=111ビットを使用する。その結果、SS拡張ブロックがフレームインデックス1〜3および5において送信されない場合、本明細書に記載される技術におけるビット総数は、やはり他の手法における総ビット数(143)よりも16+16=32ビット少ない。
圧縮効率は、その値がフレームオーバーヘッドフリー拡張ブロックにおいて搬送されるべきメタデータパラメータに対し時間領域予測を使用することによって、さらに向上できる。例えば、表11におけるフレームインデックス3において、L1およびL4メタデータに対してこれまでに伝えられた時間領域予測関数(または、多項式)のすべてがまだ有効である場合は、いずれのフレームオーバーヘッドフリー拡張ブロック(例えば、表8に示すL4メタデータに対する2つのメタデータパラメータなど)も含む必要がなく、伝える必要もない。その結果、SS拡張ブロックがフレームインデックス3において送信されない場合、および予測関数(または、多項式)を更新する必要がない場合、本明細書に記載される技術におけるビット総数(例えば、27ビットなど)は、その他の手法におけるビット総数(143)よりもはるかに少ない。
追加的に、オプションとして、または代替的に、フレームオーバーヘッドフリー拡張ブロックが1セットのメタデータパラメータ(L1メタデータまたはL4メタデータなど)に対して必要とされる場合でも、そのセットにおけるすべてのメタデータパラメータがそれらの予測関数(または、多項式)に対して更新を有するとは限らない。予測関数(または、多項式)に対して更新を必要としないこれらのメタデータパラメータに対して、1つのビットモードフラグを、フレームオーバーヘッドフリー拡張ブロックにおいて、それらのメタデータパラメータのそれぞれに対して使用して、各そのようなメタデータパラメータに対して予測関数(または、多項式)への更新がないことを示すことができる。このように、フレームオーバーヘッドフリー拡張ブロックに含まれるいくつかのメタデータパラメータがそれらの予測関数(または、多項式)を更新する必要がない場合および/またはそれらのメタデータパラメータに対して1つのビットモードフラグだけが使用される場合、フレームオーバーヘッドフリー拡張ブロックは、やはり比較的小さくてもよい。
なお、様々な実施形態において、本明細書に記載される映像エンコーダは、時間領域予測または任意の他の方法(必ずしも時間領域予測に基づかない)を使用して、DMメタデータを含む画像データにおけるメタデータパラメータのうちの一部またはすべての予測値または非予測値(例えば、実際値など)を伝えてもよいし、一切のメタデータパラメータの予測値または非予測値(例えば、実際値など)を伝えなくてもよい。
なお、また、様々な実施形態において、本明細書に記載される映像エンコーダは、シーケンスレベルサマリー情報が伝えられるべき開始点である、1シーケンスの画像フレームの開始点として、IDRフレーム(表11に示す)または非IDRフレーム(例えば、Pフレーム、Bフレームなど)を特定し得る。例えば、映像エンコーダは、メタデータパラメータの値を予測するために使用される予測関数に対して新しいパラメータを用いて更新される必要のあるメタデータパラメータが多くあり、そのようなメタデータパラメータの総数は、最大許容可能数を超えるほどであることを認識し得る。これに応じて、映像エンコーダは、例えば、新しいSS拡張ブロックにおいて、新しい1シーケンスの画像フレームを開始し、そしてシーケンスレベルサマリー情報を送り得る。
いくつかの実施形態において、1シーケンスの画像フレーム(例えば、その各画像フレームについてなど)に対し、特定のDMレベルでの1特定セットのメタデータパラメータの複数のインスタンスが、映像エンコーダによって映像デコーダに伝えられ得る。前記1特定セットのメタデータの各インスタンスは、映像デコーダなどの受信側デバイスによって、特定の画像プロセッシング演算を行うか、または1特定セットの画像プロセッシング演算を行うための基礎として使用され得る。例えば、1シーケンスの画像フレーム(例えば、その1シーケンスの画像フレームのうちの各画像フレーム)に対し、L1メタデータ(DMレベルL1での)の複数インスタンスが映像エンコーダによって映像デコーダに伝えられ得る。L1メタデータの複数インスタンスに部分的に基づいて、複数の異なる画像処理演算または複数の異なるセットの画像処理演算が受信側デバイスによって行われ得る。同様に、1シーケンスの画像フレーム(例えば、その1シーケンスの画像フレームのうちの各画像フレーム)に対し、L2メタデータ(DMレベルL2での)、L3メタデータ(DMレベルL3での)、L4メタデータ(DMレベルL4での)などの複数インスタンスが映像エンコーダによって映像デコーダに伝えられ得る。L2メタデータ、L3メタデータ、L4メタデータなどの複数インスタンスに部分的に基づいて、複数の異なる画像処理演算または複数の異なるセットの画像処理演算が受信側デバイスによって行われ得る。
いくつかの実施形態において、1シーケンスの画像フレームに対する、すべてのDMレベルでのメタデータパラメータセットのすべての(または、集積された)複数インスタンスは、1シーケンスの画像フレームに対するSS拡張ブロックにおけるパラメータ「seq_number_extension_block」によって示され得る。パラメータ「seq_number_extension_block」は、8ビット、16ビット、またはバイトで揃えられてもよいし、そうでなくてもよい他のビット数のうちの1つによって表される数値であり得る。
例示目的のみとして、DMメタデータなどの画像メタデータは、本明細書に記載されるように、入力映像信号におけるSDR画像に対して階層拡張ブロックおよび/または時間領域予測を使用して、伝えられ、SDR画像に関連する画像処理演算および/またはターゲットディスプレイ用のターゲットディスプレイ画像の生成に対してメタデータパラメータの値を下流のデバイスが受信または予測できるようにし得ることを幾度か記載した。
ただし、様々な実施形態において、入力映像信号において入力ダイナミックレンジおよび/または入力色域の画像は、Rec.709に規定されるようなSDR画像であってもよいし、そうでなくてもよい。例えば、いくつかの実施形態において、Rec.709のSDRとは異なる入力ダイナミックレンジ(例えば、4000ニト、1000ニトなど)のハイブリッド−ログ−ガンマ(Hybrid−Log−Gamma(HLG))画像は、本明細書に記載されるように、入力映像信号から復号化され得る。DMメタデータなどの画像メタデータは、HLG画像に対して階層拡張ブロックおよび/または時間領域予測を使用して伝えられ、HLG画像に関連する画像処理演算および/またはターゲットディスプレイ用のターゲットディスプレイ画像の生成に対してメタデータパラメータの値を下流のデバイスが受信または予測できるようにし得る
プロセスフロー例
図4Aは、本発明のある実施形態によるプロセスフロー例を例示する。いくつかの実施形態において、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、符号化デバイス/モジュール、トランスコーディングデバイス/モジュール、復号化デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュールなど)は、このプロセスフローを行い得る。ブロック402において、画像プロセッシングデバイス(例えば、符号化ブロック(120)など)は、メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータを生成する。前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。
ブロック404において、画像プロセッシングデバイスは、前記1シーケンスの画像フレームに対する1シーケンスをなす複数セットのフレーム存在パラメータを生成する。前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成される。前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータは、1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が符号化ビットストリームにおいてメタデータペイロードとして符号化されるべきである第1のメタデータ型を特定する第1のフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が符号化ビットストリームにおいて符号化されるべきでない第2のメタデータ型を特定する第2のフレーム存在インジケータを含む。
ブロック406において、画像プロセッシングデバイスは、符号化ビットストリームにおいて、前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、およびメタデータペイロードを符号化する。
ブロック408において、画像プロセッシングデバイスは、符号化ビットストリームの受信側デバイスに、第1のメタデータ型に対して決定されたメタデータパラメータ値に少なくとも部分的に基づいて特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成させる。
ある実施形態において、前記1シーケンスの画像フレームは、メディアプログラムにおける1シーケンスの連続する画像フレームを表す。
ある実施形態において、前記1セットのシーケンスレベルパラメータは、符号化ビットストリームにおいてシーケンスサマリーメタデータブロックとして送信され、1個別セットのフレーム存在パラメータは、符号化ビットストリームにおいてフレーム存在メタデータブロックとして送信され、メタデータペイロードは、符号化ビットストリームにおいてフレームオーバーヘッドフリーメタデータブロックとして送信される。
ある実施形態において、前記1セットのシーケンスレベルパラメータ、1個別セットのフレーム存在パラメータ、およびメタデータペイロードは、符号化ビットストリームにおいて、連続するビットによって形成される1つのビットブロックとして送信される。
ある実施形態において、前記1セットのシーケンスレベルパラメータ、1個別セットのフレーム存在パラメータ、およびメタデータペイロードは、符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、送信される。
ある実施形態において、メタデータペイロードは、符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、互いに隣り合って送信される。
ある実施形態において、メタデータペイロードのうちの少なくとも1つは、時間領域予測関数を指定するための1セットの関数パラメータを搬送する。時間領域予測関数は、特定の画像フレームに関連して画像処理演算において使用されるべきメタデータパラメータに対して時間領域予測値を生成する。
ある実施形態において、時間領域予測関数は、時間領域定数、時間領域における1次多項式、時間領域における2次以上の高次多項式、1セットの区分的関数、非多項式関数などのうちの1つを表す。
ある実施形態において、前記1シーケンスの画像フレームは、特定の画像フレームにおいて開始し、前記1セットのシーケンスレベルパラメータは、前記特定の画像フレーム、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードとともに送信される。
ある実施形態において、特定の画像フレームは、1シーケンスの画像フレームを含む1セットの画像から、1つ以上の選択基準に基づいて、選択される。
ある実施形態において、1つ以上の選択基準は、1つ以上のメタデータパラメータに対して1つ以上の最大許容可能予測エラーを含む。
ある実施形態において、1つ以上の選択基準は、時間領域予測関数を更新するために必要な最大許容可能総数のメタデータパラメータを含む。
ある実施形態において、特定の画像フレームは、インスタントデータリフレッシュ(IDR)画像フレーム、非IDR画像フレーム、プログラム切り換えに対応する画像フレーム、ビットレート切り換えに対応する画像フレームなどのうちの1つを表す。
ある実施形態において、画像プロセッシングデバイスは、さらに、メディアプログラムを構成する1セットの画像フレームをこの1シーケンスの画像フレームを含む複数のシーケンスの画像フレームに分割するステップと、複数のシーケンスの画像フレームのうちの各シーケンスの画像フレームに対して1個別セットのシーケンスレベルパラメータを生成するステップとを行うように構成される。1個別セットのシーケンスレベルパラメータは、各そのような1シーケンスの画像フレームのうちの各フレームに対して存在する1セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。
ある実施形態において、前記1セットのシーケンスレベルパラメータは、符号化ビットストリームにおいて、前記1シーケンスの画像フレームのうちのすべての画像フレームに対して、最大で1度送信される。
ある実施形態において、前記1シーケンスの画像フレームは、1シーケンスのスタンダードダイナミックレンジ(SDR)画像、1シーケンスのハイダイナミックレンジ(HDR)画像、1シーケンスのハイブリッド−ログ−ガンマ(HLG)画像などのうちの1つを表す。
図4Bは、本発明の実施形態よるプロセスフロー例を例示する。いくつかの実施形態において、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、符号化デバイス/モジュール、トランスコーディングデバイス/モジュール、復号化デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュールなど)は、このプロセスフローを行い得る。ブロック422おいて、画像プロセッシングデバイス(例えば、復号化ブロック(130)など)は、メディアプログラムにおいて1シーケンスの画像フレームを包含する符号化ビットストリームを受信する。
ブロック424において、画像プロセッシングデバイスは、前記1シーケンスの画像フレームに対して前記1セットのシーケンスレベルパラメータを復号化する。1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。
ブロック426において、画像プロセッシングデバイスは、前記1セットのシーケンスレベルパラメータを使用して、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータを復号化する。前記1セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値がメタデータペイロードとして符号化ビットストリームにおける特定の画像フレームに対して符号化された第1のメタデータ型を特定する第1のフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が符号化ビットストリームにおける特定の画像フレームに対して符号化されていない第2のメタデータ型を特定する第2のフレーム存在インジケータを含む。
ブロック428において、画像プロセッシングデバイスは、第1のフレーム存在インジケータを使用して、符号化ビットストリームにおけるメタデータペイロードを復号化する。
ブロック430において、画像プロセッシングデバイスは、第1のメタデータ型に対して決定されたメタデータパラメータ値に少なくとも部分的に基づいて特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成する。
ある実施形態において、1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、およびメタデータペイロードは、入力映像信号において、前記1シーケンスの画像フレームから分離した画像メタデータとして搬送される。
ある実施形態において、メタデータペイロードは、1つ以上のディスプレイマネジメント(DM)レベルに対してメタデータパラメータを含む。
ある実施形態において、画像プロセッシングデバイスは、さらに、メタデータペイロードからディスプレイマネジメント(DM)メタデータを抽出するステップと、ターゲットディスプレイ画像を生成するステップの一部として、DMメタデータを使用して特定の画像フレームに対して1つ以上のDM演算を行うステップとを行うように構成される。ある実施形態において、画像プロセッシングデバイスは、さらに、メタデータペイロードから非ディスプレイマネジメント(DM)メタデータを抽出するステップと、ターゲットディスプレイ画像を生成するステップの一部として、非DMメタデータを使用して特定の画像フレームに対して1つ以上の非DM演算を行うステップとを行うように構成される。
ある実施形態において、ディスプレイデバイス、モバイルデバイス、セットトップボックス、マルチメディアデバイスなどの、あるコンピューティングデバイスは、上記方法のいずれかを行うように構成される。ある実施形態において、ある装置は、プロセッサを含み、上記方法のいずれかを行うように構成される。ある実施形態において、ある非一時的なコンピュータ読み取り可能な記憶媒体は、ソフトウェア命令を記憶する。ソフトウェア命令は、1つ以上のプロセッサによって実行される際に、上記方法のいずれかを行わせる。
ある実施形態において、あるコンピューティングデバイスは、1つ以上のプロセッサおよび1セットの命令を含む1つ以上の記憶媒体を含む。1セットの命令は、1つ以上のプロセッサによって実行される際に、上記方法のいずれかを行わせる。
なお、別々の実施形態を本明細書において記載するが、本明細書に記載の実施形態および/または部分的な実施形態の任意の組み合わせが更なる実施形態を形成し得る。
コンピュータシステムの実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲート配列(FPG
A)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のエンハンストダイナミックレンジを有する画像の適応型知覚的量子化に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の適応型知覚的量子化プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のHDR画像の適応型知覚的量子化に関する方法を実装し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータ読み取り可能な信号を格納する任意の非一時的媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の例示の実施形態に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
一実施形態によると、本明細書に記載の技術は、1つ以上の専用コンピューティングデバイスによって実装される。専用コンピューティングデバイスは、上記技術を行うようにハードワイヤードであってもよいし、または上記技術を行うように永続的にプログラムされた1つ以上の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・配列(FPGA)などのデジタル電子デバイスを含んでもよし、またはファームウェア、メモリ、他の記憶体、またはそれらの組み合わせにおけるプログラム命令にしたがって上記技術を行うようにプログラムされた、1つ以上の汎用ハードウェアプロセッサを含んでもよい。また、そのような専用コンピューティングデバイスは、カスタムハードワイヤードロジック、ASIC、またはFPGAをカスタムプログラミングと組み合わせて上記技術を達成し得る。専用コンピューティングデバイスは、デスクトップコンピュータシステム、ポータブルコンピュータシステム、携帯デバイス、ネットワーキングデバイス、またはハードワイヤードおよび/もしくはプログラムロジックを含んで上記技術を実装する任意の他のデバイスであり得る。
例えば、図5は、本発明のある実施形態が実装され得るコンピュータシステム500を例示するブロック図である。コンピュータシステム500は、バス502または情報を送受信するための他の通信機構と、バス502に接続された、情報を処理するためのハードウェアプロセッサ504とを含む。ハードウェアプロセッサ504は、例えば、汎用マイクロプロセッサであり得る。
また、コンピュータシステム500は、バス502に接続された、情報およびプロセッサ504によって実行されることになる命令を記憶するためのランダムアクセスメモリ(RAM)または他のダイナミック記憶デバイスなどのメインメモリ506を含む。また、メインメモリ506は、プロセッサ504によって実行されるべき命令の実行中の一時的変数または他の中間情報を記憶するために使用され得る。そのような命令は、プロセッサ504がアクセス可能な非一時的な記憶媒体に記憶される場合は、コンピュータシステム500を、命令において特定される動作を行うようにカスタマイズされた専用マシンにする。
コンピュータシステム500は、バス502に接続された、静的情報およびプロセッサ504のための命令を記憶するための読み取り専用メモリ(ROM)508または他の静的記憶デバイスをさらに含む。情報および命令を記憶するために、磁気ディスクまたは光学ディスクなどの記憶デバイス510が提供され、バス502に接続される。
コンピュータシステム500は、情報をコンピュータユーザに対して表示するための液晶ディスプレイなどのディスプレイ512にバス502を介して接続され得る。プロセッサ504に情報およびコマンド選択を送受信するために、英数字キーまたは他のキーを含む入力デバイス514がバス502に接続される。プロセッサ504に方向情報およびコマンド選択を送受信するための、およびディスプレイ512上のカーソル移動を制御するための他の種類のユーザ入力デバイスは、マウス、トラックボール、またはカーソル方向キーなどのカーソル制御516である。この入力デバイスは、典型的には2つの軸(第1の軸(例えば、x)および第2の軸(例えば、y))における2つの自由度を有する。これにより、そのデバイスは、平面において位置を特定できる。
コンピュータシステム500は、コンピュータシステムと組み合わされてコンピュータシステム500を専用マシンにするか、またはプログラムする、ハードワイヤードロジック、1つ以上のASICまたはFPGA、ファームウェアおよび/またはプログラムロジックを使用して、上記技術を実装し得る。一実施形態によると、本明細書に記載される技術は、メインメモリ506に含まれる1つ以上のシーケンスの1つ以上の命令をプロセッサ504が実行することに応答して、コンピュータシステム500によって行われる。そのような命令は、記憶デバイス510などの別の記憶媒体からメインメモリ506に読み込まれ得る。メインメモリ506に含まれる命令シーケンスを実行することによって、プロセッサ504は、本明細書に記載のプロセスステップを行う。別の実施形態において、ハードワイヤードな回路をソフトウェア命令の代わりに、またはそれに組み合わせて使用し得る。
本明細書で使用する用語「記憶媒体」は、マシンを特定のやり方で動作させるデータおよび/または命令を記憶する任意の非一時的媒体を指す。そのような記憶媒体は、不揮発性媒体および/または揮発性媒体を含み得る。非揮発性媒体は、例えば、記憶デバイス510などの光学または磁気ディスクを含む。揮発性媒体は、メインメモリ506などのダイナミックメモリを含む。記憶媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、または任意の他の磁気データ記憶媒体、CD−ROM、任意の他の光学データ記憶媒体、穴のパターンを有する任意の物理媒体、RAM、PROM、およびEPROM、FLASH−EPROM、NVRAM、任意の他のメモリチップまたはカートリッジを含む。
記憶媒体は、伝送媒体とは異なるが、それと併せて使用され得る。伝送媒体は、情報を記憶媒体間で転送することに関与する。例えば、伝送媒体は、同軸ケーブル、銅ワイヤ、および光ファイバを含み、バス502を含むワイヤを含む。また、伝送媒体は、電波データ通信および赤外データ通信中に生成される音波または光波などの音波または光波の形態をとり得る。
様々な形態の媒体が1つ以上のシーケンスの1つ以上の命令を実行のためのプロセッサ504に搬送することに関与し得る。例えば、命令は、最初は遠隔のコンピュータの磁気ディスクまたはソリッドステートドライブ上に担持され得る。遠隔コンピュータは、命令をそのダイナミックメモリにロードしたり、命令をモデムを使用して電話回線を介して送信したりし得る。コンピュータシステム500に対してローカルなモデムは、電話回線上でデータを受信し、赤外送信機を使用してデータを赤外信号に変換し得る。赤外検出器が赤外信号において搬送されるデータを受信し得る。そして、適切な回路がデータをバス502上に配置し得る。バス502は、データをメインメモリ506に搬送する。プロセッサ504は、メインメモリ506から命令を取り込んで、実行する。メインメモリ506によって受信された命令は、プロセッサ504による実行の前または後のいずれかに、必要に応じて記憶デバイス510上に記憶され得る。
また、コンピュータシステム500は、バス502に接続された通信インターフェース518を含む。通信インターフェース518は、ローカルネットワーク522に接続されたネットワークリンク520に接続する双方向データ通信を提供する。例えば、通信インターフェース518は、サービス総合デジタル網(ISDN)カード、ケーブルモデム、衛星モデム、またはデータ通信接続を対応する種類の電話回線に与えるためのモデムであり得る。別の例として、通信インターフェース518は、データ通信接続を互換性のあるLANに与えるためのローカルエリアネットワーク(LAN)カードであり得る。また、無線リンクが実装され得る。任意のそのような実装において、通信インターフェース518は、様々な種類の情報を表すデジタルデータストリームを搬送する電気、電磁または光学信号を送信および受信する。
ネットワークリンク520は、典型的には、データ通信を1つ以上のネットワークを介して他のデータデバイスに与える。例えば、ネットワークリンク520は、ローカルネットワーク522を介してホストコンピュータ524、またはインターネットサービスプロバイダ(ISP)526によって操作されるデータ設備に接続を与え得る。次いで、ISP526は、データ通信サービスを、現在一般的に「インターネット」と呼ばれるワールドワイドパケットデータ通信ネットワーク528を介して提供する。ローカルネットワーク522およびインターネット528の両方は、デジタルデータストリームを搬送する電気、電磁、または光学信号を使用する。コンピュータシステム500へおよびからデジタルデータを搬送する、様々なネットワークを介する信号ならびにネットワークリンク520上のおよび通信インターフェース518を介した信号は、伝送媒体の形態例である。
コンピュータシステム500は、ネットワーク、ネットワークリンク520、および通信インターフェース518を介して、メッセージを送信し、プログラムコードなどのデータを受信し得る。インターネット例において、サーバ530は、アプリケーションプログラムについてのリクエストされたコードをインターネット528、ISP526、ローカルネットワーク522、および通信インターフェース518を介して送信し得る。
受信されたコードは、受信されるとプロセッサ504によって実行され得るか、および/または後で実行するために、記憶デバイス510または他の不揮発性記憶体に記憶され得る。
均等物、拡張物、代替物、その他
この明細書中において、実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
本発明の様々な局面は、以下に列挙される例示の実施形態(enumerated example embodiment:EEE)から理解され得る。
EEE1.
メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータを生成するステップであって、前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
前記1シーケンスの画像フレームに対して、1シーケンスをなす複数セットのフレーム存在パラメータを生成するステップであって、前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成される、ステップと、
ここで、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成される1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含み、
ここで、前記1セットのフレーム存在インジケータは、メタデータパラメータ値がメタデータペイロードとして前記符号化ビットストリームにおいて符号化されるべき第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、
ここで、前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が前記符号化ビットストリームにおいて符号化されることのない第2のメタデータ型を示す第2のフレーム存在インジケータを含み、
前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードを前記符号化ビットストリームにおいて符号化するステップと、
前記符号化ビットストリームの受信側デバイスに、前記第1のメタデータ型に対して決定された前記メタデータパラメータ値に少なくとも部分的に基づいて前記特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成させるステップと、
を含む、方法。

EEE2.
前記1シーケンスの画像フレームは、前記メディアプログラムにおける1シーケンスの連続する画像フレームを表す、
EEE1に記載の方法。

EEE3.
前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいてシーケンスサマリーメタデータブロックとして送信され、前記1個別セットのフレーム存在パラメータは、前記符号化ビットストリームにおいてフレーム存在メタデータブロックとして送信され、前記メタデータペイロードは、前記符号化ビットストリームにおいてフレームオーバーヘッドフリーメタデータブロックとして送信される、
EEE1またはEEE2に記載の方法。

EEE4.
前記1セットのシーケンスレベルパラメータ、前記1個別セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、連続するビットによって形成される1つのビットブロックとして送信される、
EEE1〜3のいずれかに記載の方法。

EEE5.
前記1セットのシーケンスレベルパラメータ、前記1個別セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、送信される、
EEE4に記載の方法。

EEE6.
前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、互いに隣り合って送信される、
EEE1〜5のいずれかに記載の方法。

EEE7.
前記メタデータペイロードのうちの少なくとも1つは、時間領域予測関数を指定するための1セットの関数パラメータを搬送し、前記時間領域予測関数は、前記特定の画像フレームに関連して画像処理演算において使用されるべきメタデータパラメータに対して時間領域予測値を生成する、
EEE1〜6のいずれかに記載の方法。

EEE8.
前記時間領域予測関数は、時間領域定数、時間領域における1次多項式、時間領域における2次以上の高次多項式、1セットの区分的関数、または非多項式関数のうちの1つを表す、
EEE1〜7のいずれかに記載の方法。

EEE9.
前記1シーケンスの画像フレームは、前記特定の画像フレームにおいて開始し、前記1セットのシーケンスレベルパラメータは、前記特定の画像フレーム、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードとともに送信される、
EEE1〜8のいずれかに記載の方法。

EEE10.
前記特定の画像フレームは、前記1シーケンスの画像フレームを含む1セットの画像から、1つ以上の選択基準に基づいて、選択される、
EEE9に記載の方法。

EEE11.
前記1つ以上の選択基準は、1つ以上のメタデータパラメータに対して1つ以上の最大許容可能予測エラーを含む、
EEE10に記載の方法。

EEE12.
前記1つ以上の選択基準は、時間領域予測関数を更新するために必要な最大許容可能総数のメタデータパラメータを含む、
EEE10またはEEE11に記載の方法。

EEE13.
前記特定の画像フレームは、インスタントデータリフレッシュ(IDR)画像フレーム、非IDR画像フレーム、プログラム切り換えに対応する画像フレーム、またはビットレート切り換えに対応する画像フレームのうちの1つを表す、
EEE9〜12のいずれかに記載の方法。

EEE14.
前記メディアプログラムを構成する1セットの画像フレームを前記1シーケンスの画像フレームを含む複数のシーケンスの画像フレームに分割するステップと、
前記複数のシーケンスの画像フレームのうちの各シーケンスの画像フレームに対して1個別セットのシーケンスレベルパラメータを生成するステップであって、前記1個別セットのシーケンスレベルパラメータは、各そのような1シーケンスの画像フレームのうちの各フレームに対して存在する1セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
をさらに含む、EEE1〜13のいずれかに記載の方法。

EEE15.
前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいて、前記1シーケンスの画像フレームのうちのすべての画像フレームに対して、最大で1度送信される、
EEE1〜14のいずれかに記載の方法。

EEE16.
前記1シーケンスの画像フレームは、1シーケンスのスタンダードダイナミックレンジ(SDR)画像、1シーケンスのハイダイナミックレンジ(HDR)画像、または1シーケンスのハイブリッド−ログ−ガンマ(HLG)画像のうちの1つを表す、
EEE1〜15のいずれかに記載の方法。

EEE17.
メディアプログラムにおける1シーケンスの画像フレームを含む符号化ビットストリームを受信するステップと、
前記1シーケンスの画像フレームに対して1セットのシーケンスレベルパラメータを復号化するステップであって、前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
前記1セットのシーケンスレベルパラメータを使用して、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータを復号化するステップと、
ここで、前記1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含み、
ここで、前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が前記特定の画像フレームに対して前記符号化ビットストリームにおいてメタデータペイロードとして符号化された第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、
ここで、前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が前記特定の画像フレームに対して前記符号化ビットストリームにおいて符号化されていない第2のメタデータ型を特定する第2のフレーム存在インジケータを含み、
前記第1のフレーム存在インジケータを使用して、前記符号化ビットストリームにおけるメタデータペイロードを復号化するステップと、
前記第1のメタデータ型に対して決定された前記メタデータパラメータ値に少なくとも部分的に基づいて前記特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成するステップと、
を含む、方法。

EEE18.
前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードは、入力映像信号において、前記1シーケンスの画像フレームから分離した画像メタデータとして搬送される、
EEE17に記載の方法。

EEE19.
前記メタデータペイロードは、1つ以上のディスプレイマネジメント(DM)レベルに対してメタデータパラメータを含む、
EEE17またはEEE18に記載の方法。

EEE20.
前記メタデータペイロードからディスプレイマネジメント(DM)メタデータを抽出するステップと、
前記ターゲットディスプレイ画像を生成するステップの一部として、前記DMメタデータを使用して、前記特定の画像フレームに対して1つ以上のDM演算を行うステップと、
をさらに含む、EEE17〜19のいずれかに記載の方法。

EEE21.
前記メタデータペイロードから非ディスプレイマネジメント(DM)メタデータを抽出するステップと、
前記ターゲットディスプレイ画像を生成するステップの一部として、前記非DMメタデータを使用して、前記特定の画像フレームに対して1つ以上の非DM演算を行うステップと、
をさらに含む、EEE17〜20のいずれかに記載の方法。

EEE22.
EEE1〜21のいずれかに記載の方法を行うように構成された、コンピュータシステム。

EEE23.
プロセッサを備え、EEE1〜21のいずれかに記載の方法を行うように構成された、装置。

EEE24.
EEE1〜21のいずれかに記載の方法を実行するためのコンピュータ実行可能な命令を記憶した、非一時的なコンピュータ読み取り可能な記憶媒体。

Claims (30)

  1. 画像メタデータとともに映像データを符号化する方法であって、
    メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータを生成するステップであって、前記1セットのシーケンスレベルパラメータは、1特定セットのメタデータ型を示す1セットのシーケンスレベルインジケータを含む、ステップと、
    前記1シーケンスの画像フレームに対して、1シーケンスをなす複数セットのフレーム存在パラメータを生成するステップであって、前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成され、
    前記1シーケンスをなす複数セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成される1特定セットのフレーム存在パラメータを含み、
    前記1特定セットのフレーム存在パラメータは、1特定セットのフレーム存在インジケータを含み、前記1特定セットのフレーム存在インジケータのうちの各フレーム存在インジケータは、前記1セットのシーケンスレベルインジケータによって示される前記1特定セットのメタデータ型のうちのそれぞれの1つのメタデータ型を示し、
    前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、前記第1のメタデータ型について、少なくとも1つのメタデータパラメータ値が前記特定の画像フレームに対して符号化ビットストリームにおいてメタデータペイロードとして符号化され、
    前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第2のメタデータ型を示す第2のフレーム存在インジケータを含み、前記第2のメタデータ型について、メタデータパラメータ値が前記特定の画像フレームに対して符号化ビットストリームにおいて符号化されない、ステップと、
    前記1シーケンスの画像フレームに対して、符号化ビットストリームにおいて、前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、および前記1シーケンスをなす複数セットのフレーム存在パラメータを符号化するステップであって、前記特定の画像フレームに対して、少なくとも1つのメタデータパラメータがメタデータペイロードとして前記符号化ビットストリームにおいて前記第1のメタデータ型に対して符号化され、メタデータパラメータ値は、メタデータペイロードとして前記符号化ビットストリームにおいて前記第2のメタデータ型に対して符号化されない、ステップと、
    を含む、方法。
  2. 前記第1のメタデータ型に対して決定された前記メタデータパラメータ値は、前記特定の画像フレームから、前記符号化ビットストリームの受信側デバイスにおけるターゲットディスプレイ用のターゲットディスプレイ画像を生成するのに適している、請求項1に記載の方法。
  3. 前記特定のフレームに対する前記メタデータペイロードは、パディングビットが前記メタデータペイロードを分離することなく、ペイロード本体に束ねられる、請求項1または2に記載の方法。
  4. 前記1シーケンスの画像フレームは、前記メディアプログラムにおける1シーケンスの連続する画像フレームを表す、請求項1から3のいずれかに記載の方法。
  5. 前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいてシーケンスサマリーメタデータブロックとして送信され、セットのフレーム存在パラメータは、前記符号化ビットストリームにおいてフレーム存在メタデータブロックとして送信され、前記メタデータペイロードは、前記符号化ビットストリームにおいてフレームメタデータブロックとして、パディングビットが前記メタデータペイロードを分離することなく、送信される、請求項1から4のいずれかに記載の方法。
  6. 前記1セットのシーケンスレベルパラメータ、セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、連続するビットによって形成される1つのビットブロックとして送信される、請求項1から5のいずれかに記載の方法。
  7. 前記1セットのシーケンスレベルパラメータ、セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、送信される、請求項6に記載の方法。
  8. 前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、互いに隣り合って送信される、請求項1から7のいずれかに記載の方法。
  9. 前記メタデータペイロードのうちの少なくとも1つは、時間領域予測関数を指定するための1セットの関数パラメータを搬送し、前記時間領域予測関数は、前記特定の画像フレームに関連して画像処理演算において使用されるべきメタデータパラメータに対して時間領域予測値を生成する、請求項1から8のいずれかに記載の方法。
  10. 前記時間領域予測関数は、時間領域定数、時間領域における1次多項式、時間領域における2次以上の高次多項式、1セットの区分的関数、または非多項式関数のうちの1つを表す、請求項に記載の方法。
  11. 前記1シーケンスの画像フレームは、前記特定の画像フレームにおいて開始し、前記1セットのシーケンスレベルパラメータは、前記特定の画像フレーム、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードとともに送信される、請求項1から10のいずれかに記載の方法。
  12. 前記特定の画像フレームは、前記1シーケンスの画像フレームを含む1セットの画像から、1つ以上の選択基準に基づいて、選択される、請求項11に記載の方法。
  13. 前記1つ以上の選択基準は、1つ以上のメタデータパラメータに対して1つ以上の最大許容可能予測エラーを含む、請求項12に記載の方法。
  14. 前記1つ以上の選択基準は、時間領域予測関数を更新するために必要な最大許容可能総数のメタデータパラメータを含む、請求項12または13に記載の方法。
  15. 前記特定の画像フレームは、インスタントデータリフレッシュ(IDR)画像フレーム、非IDR画像フレーム、プログラム切り換えに対応する画像フレーム、またはビットレート切り換えに対応する画像フレームのうちの1つを表す、請求項11から14のいずれかに記載の方法。
  16. 前記メディアプログラムを構成する1セットの画像フレームを前記1シーケンスの画像フレームを含む複数のシーケンスの画像フレームに分割するステップと、
    前記複数のシーケンスの画像フレームのうちの各シーケンスの画像フレームに対して1個別セットのシーケンスレベルパラメータを生成するステップであって、前記1個別セットのシーケンスレベルパラメータは、各そのような1シーケンスの画像フレームのうちの各フレームに対して存在する1セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
    をさらに含む、請求項1から15のいずれかに記載の方法。
  17. 前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいて、前記1シーケンスの画像フレームのうちのすべての画像フレームに対して、最大で1度送信される、請求項1から16のいずれかに記載の方法。
  18. 前記1シーケンスの画像フレームは、1シーケンスのスタンダードダイナミックレンジ(SDR)画像、1シーケンスのハイダイナミックレンジ(HDR)画像、または1シーケンスのハイブリッド−ログ−ガンマ(HLG)画像のうちの1つを表す、請求項1から17のいずれかに記載の方法。
  19. 画像メタデータとともに映像データを復号化する方法であって、
    メディアプログラムにおける1シーケンスの画像フレームを含む符号化ビットストリームを受信するステップと、
    前記1シーケンスの画像フレームを復号化するステップと、
    前記1シーケンスの画像フレームに対して1セットのシーケンスレベルパラメータを復号化するステップであって、前記1セットのシーケンスレベルパラメータは、1特定セットのメタデータ型を示す1セットのシーケンスレベルインジケータを含む、ステップと、
    前記1シーケンスの画像フレームに対して1シーケンスをなす複数セットのフレーム存在パラメータを復号化するステップであって、前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各1セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して復号化される、ステップと、
    ここで、前記1シーケンスをなす複数セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータを含み、
    ここで、前記1特定セットのフレーム存在パラメータは、1特定セットのフレーム存在インジケータを含み、前記1特定セットのフレーム存在インジケータのうちの各フレーム存在インジケータは、前記1セットのシーケンスレベルインジケータによって示される前記1特定セットのメタデータ型のうちのそれぞれの1つのメタデータタイプに対応し、
    ここで、前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、前記第1のメタデータ型について、少なくとも1つのメタデータパラメータ値が前記特定の画像フレームに対して前記符号化ビットストリームにおいてメタデータペイロードとして符号化された、
    ここで、前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第2のメタデータ型を特定する第2のフレーム存在インジケータを含み、前記第2のメタデータ型について、メタデータパラメータ値が前記特定画像フレームに対して前記符号化ビットストリームにおいて符号化されなかった、
    前記符号化ビットストリームにおけるメタデータペイロードを復号化して、前記第1のメタデータ型に対して少なくとも1つのメタデータパラメータを抽出するステップと、
    前記特定の画像フレームから、および前記抽出されたメタデータパラメータ値に少なくとも部分的に基づいて、ターゲットディスプレイ用のターゲットディスプレイ画像を生成するステップと、
    を含む、方法。
  20. 前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードは、入力映像信号において、前記1シーケンスの画像フレームから分離した画像メタデータとして搬送される、請求項19に記載の方法。
  21. 前記メタデータペイロードは、1つ以上のディスプレイマネジメント(DM)レベルに対してメタデータパラメータを含む、請求項19または20に記載の方法。
  22. 前記特定のフレームに対する前記メタデータペイロードは、パディングビットが前記メタデータペイロードを分離することなく、ペイロード本体に束ねられる、請求項19から21のいずれかに記載の方法。
  23. 前記メタデータペイロードからディスプレイマネジメント(DM)メタデータを抽出するステップと、
    前記ターゲットディスプレイ画像を生成するステップの一部として、前記DMメタデータを使用して、前記特定の画像フレームに対して1つ以上のDM演算を行うステップと、
    をさらに含む、請求項19から22のいずれかに記載の方法。
  24. 前記メタデータペイロードから非ディスプレイマネジメント(DM)メタデータを抽出するステップと、
    前記ターゲットディスプレイ画像を生成するステップの一部として、前記非DMメタデータを使用して、前記特定の画像フレームに対して1つ以上の非DM演算を行うステップと、
    をさらに含む、請求項19から23のいずれかに記載の方法。
  25. 請求項1から18のいずれかに記載の方法を実行するように構成された、コンピュータシステム。
  26. プロセッサを備え、請求項1から18のいずれかに記載の方法を実行するように構成された、装置。
  27. 請求項1から18のいずれかに記載の方法を実行するためのコンピュータ実行可能な命令を含むコンピュータプログラム
  28. 請求項19から24のいずれかに記載の方法を実行するように構成された、コンピュータシステム。
  29. プロセッサを備え、請求項19から24のいずれかに記載の方法を実行するように構成された、装置。
  30. 請求項19から24のいずれかに記載の方法を実行するためのコンピュータ実行可能な命令を含むコンピュータプログラム。
JP2020516637A 2017-09-22 2018-09-21 後方互換性ディスプレイマネジメントメタデータ圧縮 Active JP6838201B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762561782P 2017-09-22 2017-09-22
EP17192724 2017-09-22
EP17192724.7 2017-09-22
US62/561,782 2017-09-22
PCT/US2018/052292 WO2019060778A1 (en) 2017-09-22 2018-09-21 COMPRESSION OF RETROCOMPATIBLE DISPLAY MANAGEMENT METADATA

Publications (2)

Publication Number Publication Date
JP2020534759A JP2020534759A (ja) 2020-11-26
JP6838201B2 true JP6838201B2 (ja) 2021-03-03

Family

ID=63794736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020516637A Active JP6838201B2 (ja) 2017-09-22 2018-09-21 後方互換性ディスプレイマネジメントメタデータ圧縮

Country Status (5)

Country Link
US (1) US11272213B2 (ja)
EP (1) EP3685587B1 (ja)
JP (1) JP6838201B2 (ja)
CN (1) CN111133761B (ja)
WO (1) WO2019060778A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3853810B1 (en) * 2018-09-19 2023-10-25 Dolby Laboratories Licensing Corporation Automatic display management metadata generation for gaming and/or sdr+ contents
US11606605B1 (en) 2021-09-30 2023-03-14 Samsung Electronics Co., Ltd. Standard dynamic range (SDR) / hybrid log-gamma (HLG) with high dynamic range (HDR) 10+
WO2023140952A1 (en) * 2022-01-20 2023-07-27 Dolby Laboratories Licensing Corporation Data structure for multimedia applications

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110206118A1 (en) 2010-02-19 2011-08-25 Lazar Bivolarsky Data Compression for Video
KR101479435B1 (ko) * 2010-12-10 2015-01-05 후지쯔 가부시끼가이샤 입체시 동화상 생성 장치, 입체시 동화상 생성 방법
TW201415893A (zh) * 2012-06-29 2014-04-16 Vid Scale Inc 以預測資訊為基礎之訊框優先
JP5774652B2 (ja) * 2013-08-27 2015-09-09 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US9648351B2 (en) 2013-10-24 2017-05-09 Dolby Laboratories Licensing Corporation Error control in multi-stream EDR video codec
FR3035729B1 (fr) * 2015-04-28 2020-11-27 Ateme Procede d'analyse d'une sequence video et equipement pour la mise en oeuvre du procede
US10652588B2 (en) * 2015-09-21 2020-05-12 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
WO2017074493A1 (en) * 2015-10-26 2017-05-04 Intel IP Corporation Distinguishing subframes in a downlink transmission burst
WO2017079132A1 (en) * 2015-11-02 2017-05-11 Dolby Laboratories Licensing Corporation Layered representation containing crc codes and delivery of high dynamic range video
JP6132006B1 (ja) * 2015-12-02 2017-05-24 日本電気株式会社 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム

Also Published As

Publication number Publication date
US11272213B2 (en) 2022-03-08
EP3685587B1 (en) 2021-07-28
CN111133761B (zh) 2021-05-14
WO2019060778A1 (en) 2019-03-28
JP2020534759A (ja) 2020-11-26
US20200413099A1 (en) 2020-12-31
EP3685587A1 (en) 2020-07-29
CN111133761A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
US8891863B2 (en) High dynamic range, backwards-compatible, digital cinema
US10701399B2 (en) Layered representation and delivery of high dynamic range video
KR102027410B1 (ko) 계층화된 신호 품질 계층에서의 재구성 데이터의 송신
KR101751221B1 (ko) 하위 호환성 vdr 코덱을 위한 효율적인 트랜스코딩
JP6838201B2 (ja) 後方互換性ディスプレイマネジメントメタデータ圧縮
JP7037584B2 (ja) 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化
CN115398481A (zh) 对图像执行人工智能编码和人工智能解码的设备和方法
EP3306563B1 (en) Inverse luma/chroma mappings with histogram transfer and approximation
KR101584111B1 (ko) 클라우드 컴퓨팅을 이용한 멀티미디어 서비스 품질 향상 방법 및 이를 위한 기기
JP7027554B2 (ja) コンテンツスキャン適応メタデータを用いた光レベル管理
EP3725078A1 (en) Processing an image
JP7434664B2 (ja) 擬似輪郭低減による適応ストリーミング
RU2813229C1 (ru) Вычисление динамических метаданных для редактирования hdr контента
US20210176471A1 (en) Processing an image
CN114830640A (zh) 级联预测
KR20230017266A (ko) Hdr 콘텐츠를 편집하기 위한 동적 메타데이터를 계산하는 것

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200519

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200519

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200519

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210210

R150 Certificate of patent or registration of utility model

Ref document number: 6838201

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250