JP6838201B2 - 後方互換性ディスプレイマネジメントメタデータ圧縮 - Google Patents
後方互換性ディスプレイマネジメントメタデータ圧縮 Download PDFInfo
- Publication number
- JP6838201B2 JP6838201B2 JP2020516637A JP2020516637A JP6838201B2 JP 6838201 B2 JP6838201 B2 JP 6838201B2 JP 2020516637 A JP2020516637 A JP 2020516637A JP 2020516637 A JP2020516637 A JP 2020516637A JP 6838201 B2 JP6838201 B2 JP 6838201B2
- Authority
- JP
- Japan
- Prior art keywords
- metadata
- frame
- sequence
- image
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006835 compression Effects 0.000 title description 22
- 238000007906 compression Methods 0.000 title description 22
- 238000000034 method Methods 0.000 claims description 124
- 238000012545 processing Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 43
- 230000002441 reversible effect Effects 0.000 description 24
- 239000002356 single layer Substances 0.000 description 20
- 238000003860 storage Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 17
- 238000004519 manufacturing process Methods 0.000 description 15
- 238000007726 management method Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 238000013507 mapping Methods 0.000 description 9
- 238000005259 measurement Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 239000010410 layer Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- -1 silver halide Chemical class 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/65—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
- H04N19/68—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience involving the insertion of resynchronisation markers into the bitstream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
Description
本願は、2017年9月22日に出願された米国仮特許出願第62/561,782号および2017年9月22日に出願された欧州特許出願第17192724.7号に関連し得るものであり、両出願の開示内容を全て本願に援用する。
本発明は、画像全般に関する。より詳細には、本発明のある実施形態は、後方互換性ディスプレイマネジメント(DM)メタデータ圧縮に関する。
本明細書において、用語「ダイナミックレンジ」(DR)は、人間の視覚系(HVS)が画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最も暗い黒(暗)から最も明るい白(ハイライト)まで)を知覚する能力に関し得る。この意味では、DRは、「シーン−リファード(scene−referred)」な強度に関する。DRはまた、ディスプレイデバイスが特定幅を有する強度範囲を十分にまたは近似的に描画する能力にも関し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)な強度に関する。本明細書中のいずれの箇所においても、一方の特定の意味が特に重要であると明示されない限り、この用語は、どちらの意味にも(例えば、交換可能に)使用できるものとする。
本発明のある実施形態を添付の図面に、限定することなく、例示する。図において、同様の参照符号は、同様の要素を示す。
本明細書において、後方互換性DMメタデータ圧縮を説明する。以下の説明において、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明が実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
本明細書に記載される例示の実施形態は、画像メタデータを用いる映像データの符号化に関する。これらの例示の実施形態は、さらに画像メタデータ(例えば、ディスプレイマネジメントメタデータなど)の後方互換性圧縮に関し得る。メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータが生成される。前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する(例えば、前記1シーケンスの画像フレームの全体のうちの画像フレームに対して存在する)1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。前記1シーケンスの画像フレームに対して、1シーケンスをなす複数セットのフレーム存在パラメータが生成される。前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成される。前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成される1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含む。そのとき、各フレーム存在インジケータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型のうちのそれぞれの1つに対応し得る。言い換えると、フレーム存在インジケータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型におけるメタデータ型と一対一の関係を有し得る。前記1セットのフレーム存在インジケータは、メタデータパラメータ値が、特定の画像フレームに対して、符号化ビットストリームにおいてメタデータペイロードとして符号化されるべき第1のメタデータ型を特定する第1のフレーム存在インジケータを含む。前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が、特定の画像フレームに対して、符号化ビットストリームにおいて符号化されることのない第2のメタデータ型を示す第2のフレーム存在インジケータを含む。前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、およびメタデータペイロードは、符号化ビットストリームにおいて符号化される。符号化メタデータ(符号化メタデータペイロード)は、符号化ビットストリームの受信側デバイスが、第1のメタデータ型に対して決定されたメタデータパラメータ値に少なくとも部分的に基づいて特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成するのに適し得る。
図1は、映像のキャプチャから映像コンテンツの表示までの様々な段階を示す、映像供給パイプライン(100)のプロセス例を図示する。1シーケンスの映像フレーム(102)は、画像生成ブロック(105)を使用してキャプチャまたは生成される。映像フレーム(102)は、デジタル的にキャプチャされるか(例えば、デジタルカメラによって)、またはコンピュータによって生成される(例えば、コンピュータアニメーションを使用して)ことによって、映像データ(107)が得られ得る。あるいは、映像フレーム(102)は、銀塩カメラによってフィルム上にキャプチャされてもよい。フィルムがデジタルフォーマットに変換されることによって、映像データ(107)が得られる。プロダクションフェーズ(110)において、映像データ(107)は、編集され、映像プロダクションストリーム(112)を得る。
本明細書に記載の技術を使用して、DM演算に使用されるDMメタデータを含むがそれに限定されない画像メタデータを顕著に圧縮できる。これらの技術は、広い範囲の異なる演算に好適であり、画像メタデータの送信の際のオーバーヘッドを顕著に最小化し、それにより画像メタデータおよび画像データを比較的低いビットレートで送信できるように、画像メタデータを圧縮するために使用され得る。いくつかの例示の実施形態において、本明細書に記載の技術は、DMメタデータを含むがそれに限定されない、SDR画像(117)に伴う画像メタデータを圧縮して、SDR画像がSDR画像(117)および画像メタデータとともに符号化ビットストリーム(122)において比較的低いビットレートで送信可能となるように作成され得る。
図2A〜2Cは、シングルレイヤーコーデックフレームワーク例を例示する。より詳細には、図2Aは、上流の映像エンコーダなどにおいて1つ以上のコンピューティングプロセッサを用いて実装され得るシングルレイヤー逆ディスプレイマネジメント(SLiDM)エンコーダ側コーデックアーキテクチャの一例を例示する。図2Bは、上流の映像エンコーダなどにおいて1つ以上のコンピューティングプロセッサを用いて実装され得るシングルレイヤーディスプレイマネジメント(SLDM)エンコーダ側コーデックアーキテクチャの一例を例示する。図2Cは、また1つ以上の下流の映像デコーダなどにおいて1つ以上のコンピューティングプロセッサを用いて実装され得、そしてSLiDMエンコーダまたはSLDMエンコーダのいずれかとともに動作できるデコーダ側コーデックアーキテクチャの一例を例示する。
いくつかの実施形態において、本明細書に記載される技術における圧縮方法は、拡張ブロックを使用して、DMメタデータを含むがそれに限定されない画像メタデータを圧縮し得る。拡張ブロックへの圧縮されるべきDMメタデータは、異なるDMレベルでのメタデータパラメータのうちの一部またはすべてを含み得る。
DMメタデータなどの画像メタデータは、値が時間(例えば、画像フレームのフレームインデックスによって表される)によって変化する多数のメタデータパラメータを含み得る。
DM_metadata_value=DM_metadata_offset+(DM_metadata_slope_value_int+DM_metadata_slope_value_frac>>4)*(現在のフレームインデックス−アンカー(anchor)フレームインデックス) (3)
ここで、「>>」は、ビットレベル右シフト演算子を表し、「現在のフレームインデックス」は、メタデータパラメータの値が予測多項式によって予測されるべき現在の画像フレームのフレームインデックスを表し、「アンカーフレームインデックス」は、1に設定された「DM_comp_mode」を有する最も近い過去のフレームのフレームインデックスを表す。
いくつかの実施形態において、本明細書に記載される映像エンコーダによって使用される圧縮方法は、DMメタデータを含むがそれに限定されない画像メタデータを符号化するための複数層の拡張ブロックを含む階層拡張ブロックを使用する。例示目的であり限定しないが、例えば、第1層の拡張ブロックは、シーケンスレベル情報を渡すために使用されるシークエンスサマリー(SS)拡張ブロックであり、第2層の拡張ブロックは、フレームレベル情報を渡すために使用されるフレーム存在(FP)拡張ブロックであり、第3層の拡張ブロックは、メタデータパラメータの値(例えば、実際の値、予測値を生成するために使用されるモードフラグおよび多項式パラメータなど)を搬送するために使用されるフレームオーバーヘッドフリーペイロード拡張ブロックである。
階層拡張ブロックに対する符号化シンタックスを使用して画像メタデータを符号化する映像エンコーダは、以下のように1つ以上のエンコーダ側制約条件を実装し得る。
総メタデータリフレッシュ(例えば、異なるメタデータパラメータ、メタデータパラメータに対するすべてまたは実質的にすべての値のリフレッシュ、など)のために映像エンコーダが選択する画像フレーム(例えば、IDRフレーム、非IDR画像など)に対して、SS拡張ブロックおよびFP拡張ブロック(例えば、FP拡張ブロックに伴うフレームオーバーヘッドフリー拡張ブロックを含むがそれに限定されない、など)の両方が送られ得る。残りの画像フレームに対して、映像エンコーダは、FP拡張ブロックおよびそのFP拡張ブロックにそれぞれ伴う任意のフレームオーバーヘッドフリー拡張ブロックを送信するだけであり得る。SS拡張ブロックがオーバーヘッドとしてカウントされる場合でも、そのようなオーバーヘッドは、比較的小さい。なぜなら、SS拡張ブロックのオーバーヘッドは、SS拡張ブロックが生成される1シーケンスの画像フレームのうちの複数の画像フレームにわたって償却(amortize)され得るからである。このように、SS拡張ブロックは、比較的使用頻度が少ないので、全体的に言えば、SS拡張ブロックからのオーバーヘッドは、比較的小さい。
図4Aは、本発明のある実施形態によるプロセスフロー例を例示する。いくつかの実施形態において、1つ以上のコンピューティングデバイスまたはコンポーネント(例えば、符号化デバイス/モジュール、トランスコーディングデバイス/モジュール、復号化デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュールなど)は、このプロセスフローを行い得る。ブロック402において、画像プロセッシングデバイス(例えば、符号化ブロック(120)など)は、メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータを生成する。前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む。
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲート配列(FPG
A)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のエンハンストダイナミックレンジを有する画像の適応型知覚的量子化に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の適応型知覚的量子化プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
この明細書中において、実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
EEE1.
メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータを生成するステップであって、前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
前記1シーケンスの画像フレームに対して、1シーケンスをなす複数セットのフレーム存在パラメータを生成するステップであって、前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成される、ステップと、
ここで、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成される1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含み、
ここで、前記1セットのフレーム存在インジケータは、メタデータパラメータ値がメタデータペイロードとして前記符号化ビットストリームにおいて符号化されるべき第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、
ここで、前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が前記符号化ビットストリームにおいて符号化されることのない第2のメタデータ型を示す第2のフレーム存在インジケータを含み、
前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードを前記符号化ビットストリームにおいて符号化するステップと、
前記符号化ビットストリームの受信側デバイスに、前記第1のメタデータ型に対して決定された前記メタデータパラメータ値に少なくとも部分的に基づいて前記特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成させるステップと、
を含む、方法。
EEE2.
前記1シーケンスの画像フレームは、前記メディアプログラムにおける1シーケンスの連続する画像フレームを表す、
EEE1に記載の方法。
EEE3.
前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいてシーケンスサマリーメタデータブロックとして送信され、前記1個別セットのフレーム存在パラメータは、前記符号化ビットストリームにおいてフレーム存在メタデータブロックとして送信され、前記メタデータペイロードは、前記符号化ビットストリームにおいてフレームオーバーヘッドフリーメタデータブロックとして送信される、
EEE1またはEEE2に記載の方法。
EEE4.
前記1セットのシーケンスレベルパラメータ、前記1個別セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、連続するビットによって形成される1つのビットブロックとして送信される、
EEE1〜3のいずれかに記載の方法。
EEE5.
前記1セットのシーケンスレベルパラメータ、前記1個別セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、送信される、
EEE4に記載の方法。
EEE6.
前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、互いに隣り合って送信される、
EEE1〜5のいずれかに記載の方法。
EEE7.
前記メタデータペイロードのうちの少なくとも1つは、時間領域予測関数を指定するための1セットの関数パラメータを搬送し、前記時間領域予測関数は、前記特定の画像フレームに関連して画像処理演算において使用されるべきメタデータパラメータに対して時間領域予測値を生成する、
EEE1〜6のいずれかに記載の方法。
EEE8.
前記時間領域予測関数は、時間領域定数、時間領域における1次多項式、時間領域における2次以上の高次多項式、1セットの区分的関数、または非多項式関数のうちの1つを表す、
EEE1〜7のいずれかに記載の方法。
EEE9.
前記1シーケンスの画像フレームは、前記特定の画像フレームにおいて開始し、前記1セットのシーケンスレベルパラメータは、前記特定の画像フレーム、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードとともに送信される、
EEE1〜8のいずれかに記載の方法。
EEE10.
前記特定の画像フレームは、前記1シーケンスの画像フレームを含む1セットの画像から、1つ以上の選択基準に基づいて、選択される、
EEE9に記載の方法。
EEE11.
前記1つ以上の選択基準は、1つ以上のメタデータパラメータに対して1つ以上の最大許容可能予測エラーを含む、
EEE10に記載の方法。
EEE12.
前記1つ以上の選択基準は、時間領域予測関数を更新するために必要な最大許容可能総数のメタデータパラメータを含む、
EEE10またはEEE11に記載の方法。
EEE13.
前記特定の画像フレームは、インスタントデータリフレッシュ(IDR)画像フレーム、非IDR画像フレーム、プログラム切り換えに対応する画像フレーム、またはビットレート切り換えに対応する画像フレームのうちの1つを表す、
EEE9〜12のいずれかに記載の方法。
EEE14.
前記メディアプログラムを構成する1セットの画像フレームを前記1シーケンスの画像フレームを含む複数のシーケンスの画像フレームに分割するステップと、
前記複数のシーケンスの画像フレームのうちの各シーケンスの画像フレームに対して1個別セットのシーケンスレベルパラメータを生成するステップであって、前記1個別セットのシーケンスレベルパラメータは、各そのような1シーケンスの画像フレームのうちの各フレームに対して存在する1セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
をさらに含む、EEE1〜13のいずれかに記載の方法。
EEE15.
前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいて、前記1シーケンスの画像フレームのうちのすべての画像フレームに対して、最大で1度送信される、
EEE1〜14のいずれかに記載の方法。
EEE16.
前記1シーケンスの画像フレームは、1シーケンスのスタンダードダイナミックレンジ(SDR)画像、1シーケンスのハイダイナミックレンジ(HDR)画像、または1シーケンスのハイブリッド−ログ−ガンマ(HLG)画像のうちの1つを表す、
EEE1〜15のいずれかに記載の方法。
EEE17.
メディアプログラムにおける1シーケンスの画像フレームを含む符号化ビットストリームを受信するステップと、
前記1シーケンスの画像フレームに対して1セットのシーケンスレベルパラメータを復号化するステップであって、前記1セットのシーケンスレベルパラメータは、前記1シーケンスの画像フレームのうちの各画像フレームに対して存在する1特定セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
前記1セットのシーケンスレベルパラメータを使用して、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータを復号化するステップと、
ここで、前記1特定セットのフレーム存在パラメータは、前記1セットのシーケンスレベルパラメータにおいて示される前記1特定セットのメタデータ型に対応する1特定セットのフレーム存在インジケータを含み、
ここで、前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が前記特定の画像フレームに対して前記符号化ビットストリームにおいてメタデータペイロードとして符号化された第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、
ここで、前記1特定セットのフレーム存在インジケータは、メタデータパラメータ値が前記特定の画像フレームに対して前記符号化ビットストリームにおいて符号化されていない第2のメタデータ型を特定する第2のフレーム存在インジケータを含み、
前記第1のフレーム存在インジケータを使用して、前記符号化ビットストリームにおけるメタデータペイロードを復号化するステップと、
前記第1のメタデータ型に対して決定された前記メタデータパラメータ値に少なくとも部分的に基づいて前記特定の画像フレームから、ターゲットディスプレイ用のターゲットディスプレイ画像を生成するステップと、
を含む、方法。
EEE18.
前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードは、入力映像信号において、前記1シーケンスの画像フレームから分離した画像メタデータとして搬送される、
EEE17に記載の方法。
EEE19.
前記メタデータペイロードは、1つ以上のディスプレイマネジメント(DM)レベルに対してメタデータパラメータを含む、
EEE17またはEEE18に記載の方法。
EEE20.
前記メタデータペイロードからディスプレイマネジメント(DM)メタデータを抽出するステップと、
前記ターゲットディスプレイ画像を生成するステップの一部として、前記DMメタデータを使用して、前記特定の画像フレームに対して1つ以上のDM演算を行うステップと、
をさらに含む、EEE17〜19のいずれかに記載の方法。
EEE21.
前記メタデータペイロードから非ディスプレイマネジメント(DM)メタデータを抽出するステップと、
前記ターゲットディスプレイ画像を生成するステップの一部として、前記非DMメタデータを使用して、前記特定の画像フレームに対して1つ以上の非DM演算を行うステップと、
をさらに含む、EEE17〜20のいずれかに記載の方法。
EEE22.
EEE1〜21のいずれかに記載の方法を行うように構成された、コンピュータシステム。
EEE23.
プロセッサを備え、EEE1〜21のいずれかに記載の方法を行うように構成された、装置。
EEE24.
EEE1〜21のいずれかに記載の方法を実行するためのコンピュータ実行可能な命令を記憶した、非一時的なコンピュータ読み取り可能な記憶媒体。
Claims (30)
- 画像メタデータとともに映像データを符号化する方法であって、
メディアプログラムにおける1シーケンスの画像フレームに対して、1セットのシーケンスレベルパラメータを生成するステップであって、前記1セットのシーケンスレベルパラメータは、1特定セットのメタデータ型を示す1セットのシーケンスレベルインジケータを含む、ステップと、
前記1シーケンスの画像フレームに対して、1シーケンスをなす複数セットのフレーム存在パラメータを生成するステップであって、前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して生成され、
前記1シーケンスをなす複数セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成される1特定セットのフレーム存在パラメータを含み、
前記1特定セットのフレーム存在パラメータは、1特定セットのフレーム存在インジケータを含み、前記1特定セットのフレーム存在インジケータのうちの各フレーム存在インジケータは、前記1セットのシーケンスレベルインジケータによって示される前記1特定セットのメタデータ型のうちのそれぞれの1つのメタデータ型を示し、
前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、前記第1のメタデータ型について、少なくとも1つのメタデータパラメータ値が前記特定の画像フレームに対して符号化ビットストリームにおいてメタデータペイロードとして符号化され、
前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第2のメタデータ型を示す第2のフレーム存在インジケータを含み、前記第2のメタデータ型について、メタデータパラメータ値が前記特定の画像フレームに対して符号化ビットストリームにおいて符号化されない、ステップと、
前記1シーケンスの画像フレームに対して、符号化ビットストリームにおいて、前記1シーケンスの画像フレーム、前記1セットのシーケンスレベルパラメータ、および前記1シーケンスをなす複数セットのフレーム存在パラメータを符号化するステップであって、前記特定の画像フレームに対して、少なくとも1つのメタデータパラメータがメタデータペイロードとして前記符号化ビットストリームにおいて前記第1のメタデータ型に対して符号化され、メタデータパラメータ値は、メタデータペイロードとして前記符号化ビットストリームにおいて前記第2のメタデータ型に対して符号化されない、ステップと、
を含む、方法。 - 前記第1のメタデータ型に対して決定された前記メタデータパラメータ値は、前記特定の画像フレームから、前記符号化ビットストリームの受信側デバイスにおけるターゲットディスプレイ用のターゲットディスプレイ画像を生成するのに適している、請求項1に記載の方法。
- 前記特定のフレームに対する前記メタデータペイロードは、パディングビットが前記メタデータペイロードを分離することなく、ペイロード本体に束ねられる、請求項1または2に記載の方法。
- 前記1シーケンスの画像フレームは、前記メディアプログラムにおける1シーケンスの連続する画像フレームを表す、請求項1から3のいずれかに記載の方法。
- 前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいてシーケンスサマリーメタデータブロックとして送信され、各セットのフレーム存在パラメータは、前記符号化ビットストリームにおいてフレーム存在メタデータブロックとして送信され、前記メタデータペイロードは、前記符号化ビットストリームにおいてフレームメタデータブロックとして、パディングビットが前記メタデータペイロードを分離することなく、送信される、請求項1から4のいずれかに記載の方法。
- 前記1セットのシーケンスレベルパラメータ、各セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、連続するビットによって形成される1つのビットブロックとして送信される、請求項1から5のいずれかに記載の方法。
- 前記1セットのシーケンスレベルパラメータ、各セットのフレーム存在パラメータ、および前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、送信される、請求項6に記載の方法。
- 前記メタデータペイロードは、前記符号化ビットストリームにおいて、揃えるためのパディングビットによって分離されることなく、互いに隣り合って送信される、請求項1から7のいずれかに記載の方法。
- 前記メタデータペイロードのうちの少なくとも1つは、時間領域予測関数を指定するための1セットの関数パラメータを搬送し、前記時間領域予測関数は、前記特定の画像フレームに関連して画像処理演算において使用されるべきメタデータパラメータに対して時間領域予測値を生成する、請求項1から8のいずれかに記載の方法。
- 前記時間領域予測関数は、時間領域定数、時間領域における1次多項式、時間領域における2次以上の高次多項式、1セットの区分的関数、または非多項式関数のうちの1つを表す、請求項9に記載の方法。
- 前記1シーケンスの画像フレームは、前記特定の画像フレームにおいて開始し、前記1セットのシーケンスレベルパラメータは、前記特定の画像フレーム、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードとともに送信される、請求項1から10のいずれかに記載の方法。
- 前記特定の画像フレームは、前記1シーケンスの画像フレームを含む1セットの画像から、1つ以上の選択基準に基づいて、選択される、請求項11に記載の方法。
- 前記1つ以上の選択基準は、1つ以上のメタデータパラメータに対して1つ以上の最大許容可能予測エラーを含む、請求項12に記載の方法。
- 前記1つ以上の選択基準は、時間領域予測関数を更新するために必要な最大許容可能総数のメタデータパラメータを含む、請求項12または13に記載の方法。
- 前記特定の画像フレームは、インスタントデータリフレッシュ(IDR)画像フレーム、非IDR画像フレーム、プログラム切り換えに対応する画像フレーム、またはビットレート切り換えに対応する画像フレームのうちの1つを表す、請求項11から14のいずれかに記載の方法。
- 前記メディアプログラムを構成する1セットの画像フレームを前記1シーケンスの画像フレームを含む複数のシーケンスの画像フレームに分割するステップと、
前記複数のシーケンスの画像フレームのうちの各シーケンスの画像フレームに対して1個別セットのシーケンスレベルパラメータを生成するステップであって、前記1個別セットのシーケンスレベルパラメータは、各そのような1シーケンスの画像フレームのうちの各フレームに対して存在する1セットのメタデータ型を示すための1セットのシーケンスレベルインジケータを含む、ステップと、
をさらに含む、請求項1から15のいずれかに記載の方法。 - 前記1セットのシーケンスレベルパラメータは、前記符号化ビットストリームにおいて、前記1シーケンスの画像フレームのうちのすべての画像フレームに対して、最大で1度送信される、請求項1から16のいずれかに記載の方法。
- 前記1シーケンスの画像フレームは、1シーケンスのスタンダードダイナミックレンジ(SDR)画像、1シーケンスのハイダイナミックレンジ(HDR)画像、または1シーケンスのハイブリッド−ログ−ガンマ(HLG)画像のうちの1つを表す、請求項1から17のいずれかに記載の方法。
- 画像メタデータとともに映像データを復号化する方法であって、
メディアプログラムにおける1シーケンスの画像フレームを含む符号化ビットストリームを受信するステップと、
前記1シーケンスの画像フレームを復号化するステップと、
前記1シーケンスの画像フレームに対して1セットのシーケンスレベルパラメータを復号化するステップであって、前記1セットのシーケンスレベルパラメータは、1特定セットのメタデータ型を示す1セットのシーケンスレベルインジケータを含む、ステップと、
前記1シーケンスの画像フレームに対して1シーケンスをなす複数セットのフレーム存在パラメータを復号化するステップであって、前記1シーケンスをなす複数セットのフレーム存在パラメータのうちの各1セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちのそれぞれの画像フレームに対して復号化される、ステップと、
ここで、前記1シーケンスをなす複数セットのフレーム存在パラメータは、前記1シーケンスの画像フレームのうちの特定の画像フレームに対して生成された1特定セットのフレーム存在パラメータを含み、
ここで、前記1特定セットのフレーム存在パラメータは、1特定セットのフレーム存在インジケータを含み、前記1特定セットのフレーム存在インジケータのうちの各フレーム存在インジケータは、前記1セットのシーケンスレベルインジケータによって示される前記1特定セットのメタデータ型のうちのそれぞれの1つのメタデータタイプに対応し、
ここで、前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第1のメタデータ型を特定する第1のフレーム存在インジケータを含み、前記第1のメタデータ型について、少なくとも1つのメタデータパラメータ値が前記特定の画像フレームに対して前記符号化ビットストリームにおいてメタデータペイロードとして符号化された、
ここで、前記1特定セットのフレーム存在インジケータは、前記1特定セットのメタデータ型のうちの第2のメタデータ型を特定する第2のフレーム存在インジケータを含み、前記第2のメタデータ型について、メタデータパラメータ値が前記特定画像フレームに対して前記符号化ビットストリームにおいて符号化されなかった、
前記符号化ビットストリームにおけるメタデータペイロードを復号化して、前記第1のメタデータ型に対して少なくとも1つのメタデータパラメータを抽出するステップと、
前記特定の画像フレームから、および前記抽出されたメタデータパラメータ値に少なくとも部分的に基づいて、ターゲットディスプレイ用のターゲットディスプレイ画像を生成するステップと、
を含む、方法。 - 前記1セットのシーケンスレベルパラメータ、前記1特定セットのフレーム存在パラメータ、および前記メタデータペイロードは、入力映像信号において、前記1シーケンスの画像フレームから分離した画像メタデータとして搬送される、請求項19に記載の方法。
- 前記メタデータペイロードは、1つ以上のディスプレイマネジメント(DM)レベルに対してメタデータパラメータを含む、請求項19または20に記載の方法。
- 前記特定のフレームに対する前記メタデータペイロードは、パディングビットが前記メタデータペイロードを分離することなく、ペイロード本体に束ねられる、請求項19から21のいずれかに記載の方法。
- 前記メタデータペイロードからディスプレイマネジメント(DM)メタデータを抽出するステップと、
前記ターゲットディスプレイ画像を生成するステップの一部として、前記DMメタデータを使用して、前記特定の画像フレームに対して1つ以上のDM演算を行うステップと、
をさらに含む、請求項19から22のいずれかに記載の方法。 - 前記メタデータペイロードから非ディスプレイマネジメント(DM)メタデータを抽出するステップと、
前記ターゲットディスプレイ画像を生成するステップの一部として、前記非DMメタデータを使用して、前記特定の画像フレームに対して1つ以上の非DM演算を行うステップと、
をさらに含む、請求項19から23のいずれかに記載の方法。 - 請求項1から18のいずれかに記載の方法を実行するように構成された、コンピュータシステム。
- プロセッサを備え、請求項1から18のいずれかに記載の方法を実行するように構成された、装置。
- 請求項1から18のいずれかに記載の方法を実行するためのコンピュータ実行可能な命令を含むコンピュータプログラム。
- 請求項19から24のいずれかに記載の方法を実行するように構成された、コンピュータシステム。
- プロセッサを備え、請求項19から24のいずれかに記載の方法を実行するように構成された、装置。
- 請求項19から24のいずれかに記載の方法を実行するためのコンピュータ実行可能な命令を含むコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762561782P | 2017-09-22 | 2017-09-22 | |
EP17192724 | 2017-09-22 | ||
EP17192724.7 | 2017-09-22 | ||
US62/561,782 | 2017-09-22 | ||
PCT/US2018/052292 WO2019060778A1 (en) | 2017-09-22 | 2018-09-21 | COMPRESSION OF RETROCOMPATIBLE DISPLAY MANAGEMENT METADATA |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020534759A JP2020534759A (ja) | 2020-11-26 |
JP6838201B2 true JP6838201B2 (ja) | 2021-03-03 |
Family
ID=63794736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020516637A Active JP6838201B2 (ja) | 2017-09-22 | 2018-09-21 | 後方互換性ディスプレイマネジメントメタデータ圧縮 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11272213B2 (ja) |
EP (1) | EP3685587B1 (ja) |
JP (1) | JP6838201B2 (ja) |
CN (1) | CN111133761B (ja) |
WO (1) | WO2019060778A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3853810B1 (en) * | 2018-09-19 | 2023-10-25 | Dolby Laboratories Licensing Corporation | Automatic display management metadata generation for gaming and/or sdr+ contents |
US11606605B1 (en) | 2021-09-30 | 2023-03-14 | Samsung Electronics Co., Ltd. | Standard dynamic range (SDR) / hybrid log-gamma (HLG) with high dynamic range (HDR) 10+ |
WO2023140952A1 (en) * | 2022-01-20 | 2023-07-27 | Dolby Laboratories Licensing Corporation | Data structure for multimedia applications |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110206118A1 (en) | 2010-02-19 | 2011-08-25 | Lazar Bivolarsky | Data Compression for Video |
KR101479435B1 (ko) * | 2010-12-10 | 2015-01-05 | 후지쯔 가부시끼가이샤 | 입체시 동화상 생성 장치, 입체시 동화상 생성 방법 |
TW201415893A (zh) * | 2012-06-29 | 2014-04-16 | Vid Scale Inc | 以預測資訊為基礎之訊框優先 |
JP5774652B2 (ja) * | 2013-08-27 | 2015-09-09 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US9648351B2 (en) | 2013-10-24 | 2017-05-09 | Dolby Laboratories Licensing Corporation | Error control in multi-stream EDR video codec |
FR3035729B1 (fr) * | 2015-04-28 | 2020-11-27 | Ateme | Procede d'analyse d'une sequence video et equipement pour la mise en oeuvre du procede |
US10652588B2 (en) * | 2015-09-21 | 2020-05-12 | Vid Scale, Inc. | Inverse reshaping for high dynamic range video coding |
WO2017074493A1 (en) * | 2015-10-26 | 2017-05-04 | Intel IP Corporation | Distinguishing subframes in a downlink transmission burst |
WO2017079132A1 (en) * | 2015-11-02 | 2017-05-11 | Dolby Laboratories Licensing Corporation | Layered representation containing crc codes and delivery of high dynamic range video |
JP6132006B1 (ja) * | 2015-12-02 | 2017-05-24 | 日本電気株式会社 | 映像符号化装置、映像システム、映像符号化方法、及び映像符号化プログラム |
-
2018
- 2018-09-21 JP JP2020516637A patent/JP6838201B2/ja active Active
- 2018-09-21 CN CN201880061366.6A patent/CN111133761B/zh active Active
- 2018-09-21 WO PCT/US2018/052292 patent/WO2019060778A1/en unknown
- 2018-09-21 US US16/649,604 patent/US11272213B2/en active Active
- 2018-09-21 EP EP18783307.4A patent/EP3685587B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11272213B2 (en) | 2022-03-08 |
EP3685587B1 (en) | 2021-07-28 |
CN111133761B (zh) | 2021-05-14 |
WO2019060778A1 (en) | 2019-03-28 |
JP2020534759A (ja) | 2020-11-26 |
US20200413099A1 (en) | 2020-12-31 |
EP3685587A1 (en) | 2020-07-29 |
CN111133761A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8891863B2 (en) | High dynamic range, backwards-compatible, digital cinema | |
US10701399B2 (en) | Layered representation and delivery of high dynamic range video | |
KR102027410B1 (ko) | 계층화된 신호 품질 계층에서의 재구성 데이터의 송신 | |
KR101751221B1 (ko) | 하위 호환성 vdr 코덱을 위한 효율적인 트랜스코딩 | |
JP6838201B2 (ja) | 後方互換性ディスプレイマネジメントメタデータ圧縮 | |
JP7037584B2 (ja) | 効率的なエンド・ツー・エンドシングルレイヤー逆ディスプレイマネジメント符号化 | |
CN115398481A (zh) | 对图像执行人工智能编码和人工智能解码的设备和方法 | |
EP3306563B1 (en) | Inverse luma/chroma mappings with histogram transfer and approximation | |
KR101584111B1 (ko) | 클라우드 컴퓨팅을 이용한 멀티미디어 서비스 품질 향상 방법 및 이를 위한 기기 | |
JP7027554B2 (ja) | コンテンツスキャン適応メタデータを用いた光レベル管理 | |
EP3725078A1 (en) | Processing an image | |
JP7434664B2 (ja) | 擬似輪郭低減による適応ストリーミング | |
RU2813229C1 (ru) | Вычисление динамических метаданных для редактирования hdr контента | |
US20210176471A1 (en) | Processing an image | |
CN114830640A (zh) | 级联预测 | |
KR20230017266A (ko) | Hdr 콘텐츠를 편집하기 위한 동적 메타데이터를 계산하는 것 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200519 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200519 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200519 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6838201 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |