JP2022050361A

JP2022050361A - 映像動作点レコード構文及びセマンティクス

Info

Publication number: JP2022050361A
Application number: JP2021151188A
Authority: JP
Inventors: ワンイェ－クイ; Ye-Kui Wang
Original assignee: LEMON Inc
Current assignee: LEMON Inc
Priority date: 2020-09-17
Filing date: 2021-09-16
Publication date: 2022-03-30
Anticipated expiration: 2041-09-16
Also published as: US11729427B2; CN114205626B; JP2022050359A; JP2022050360A; EP3972272A1; US11877011B2; CN114205626A; JP7202429B2; CN114205602A; KR20220037382A; US20220086498A1; JP7270012B2; US20220103865A1; KR20220037379A; EP3972271A1; EP3972270A1; JP7203172B2; KR20220037380A; CN114205603A; US20220086499A1

Abstract

【課題】ビジュアルメディアデータを処理するシステム、方法及び装置を記述する。
【解決手段】一方法例は、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップを含み、ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、フォーマットルールは、ビジュアルメディアファイルにおいて指し示される各動作点について、動作点レコード及び動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する。
【選択図】図１０

Description

パリ条約に基づく適用可能な特許法及び／又はルールの下で、この出願は、２０２０年９月１７日に出願された米国仮特許出願第６３／０７９，９１０号の優先権及び利益を適時に主張して行われる。法律の下での全ての目的のために、上記出願の開示全体を、この出願の開示の一部として援用する。

この特許文書は、ファイルフォーマットにおけるデジタルオーディオビデオメディア情報の生成、記憶、及び消費に関する。

デジタル映像は、インターネット及び他のデジタル通信ネットワークにおいて最大の帯域幅使用を占めている。映像を受信して表示することが可能な接続ユーザ装置の数が増えるにつれて、デジタル映像使用に対する帯域幅需要が増加し続けることが予期される。

本文書は、ファイルフォーマットに従って映像又は画像の符号化表現を処理するためにビデオエンコーダ及びデコーダによって使用されることができる技術を開示する。

一態様例において、ビジュアルメディアデータを処理する方法が開示される。当該方法は、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行することを含み、フォーマットルールは、トラックが特定の出力レイヤセットに対応するビットストリームを含むかを指し示す第１要素が、該トラックのクロマフォーマットを指し示す第２要素及び／又は該トラックのビット深度情報を指し示す第３要素が該トラックのコンフィギュレーションレコードに含められるかを、制御するかを規定する。

他の一態様例において、ビジュアルメディアデータを処理する他の方法が開示される。当該方法は、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行することを含み、フォーマットルールは、トラックのコンフィギュレーションレコードに、該トラックのピクチャ幅を指し示す第１要素及び／又は該トラックのピクチャ高さを指し示す第２要素を含めるかを、（１）該トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むかを指し示す第３要素及び／又は（２）コンフィギュレーションレコードがシングルレイヤビットストリーム向けであるか、に基づいて規定し、フォーマットルールは更に、第１要素及び／又は第２要素が、該トラックのコンフィギュレーションレコードに含められるときに、１６ビットを含むフィールド内で表されることを規定する。

他の一態様例において、ビジュアルメディアデータを処理する他の方法が開示される。当該方法は、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行することを含み、ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、フォーマットルールは、ビジュアルメディアファイルにおいて指し示される各動作点について、動作点レコード及び動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する。

更なる他の一態様例において、映像処理装置が開示される。当該映像処理装置は、上述の方法を実施するように構成されたプロセッサを有する。

更なる他の一態様例において、１つ以上のビットストリームを含むファイルにビジュアルメディアデータを格納する方法が開示される。当該方法は、上述の方法に対応し、さらに、上記１つ以上のビットストリームを非一時的なコンピュータ読み取り可能記録媒体に格納することを含む。

更なる他の一態様例において、ビットストリームを格納したコンピュータ読み取り可能媒体が開示される。ビットストリームは、上述の方法に従って生成される。

更なる他の一態様例において、ビットストリームを格納する映像処理装置が開示され、当該映像処理装置は、上述の方法を実施するように構成される。

更なる他の一態様例において、上述の方法に従って生成されるファイルフォーマットにビットストリームが準拠するコンピュータ読み取り可能媒体が開示される。

これらの及び他の特徴が本文書を通して説明される。

映像処理システムの一例のブロック図である。映像処理システムのブロック図である。映像処理の方法の一例に関するフローチャートである。本開示の一部の実施形態に従った映像符号化システムを示すブロック図である。本開示の一部の実施形態に従ったエンコーダを示すブロック図である。本開示の一部の実施形態に従ったデコーダを示すブロック図である。エンコーダブロック図の一例を示している。開示される技術の一部の実装に基づいてビジュアルメディアデータを処理する方法例を示している。開示される技術の一部の実装に基づいてビジュアルメディアデータを処理する方法例を示している。開示される技術の一部の実装に基づいてビジュアルメディアデータを処理する方法例を示している。

セクション見出しは、本文書において理解の容易さのために使用されており、各セクションにて開示される技術及び実施形態の適用可能性をそのセクションのみに限定するものではない。また、Ｈ．２６６用語は、一部の記述において単に理解の容易さのために使用されており、開示される技術の範囲を限定するためのものではない。従って、ここに記載される技術は、他のビデオコーデックプロトコル及び設計にも適用可能である。本文書では、ＶＶＣ仕様又はＩＳＯＢＭＦＦファイルフォーマット仕様の現行ドラフトに対して、消去されるテキストを［［］］が指し示し、そして、追加されるテキストをハイライト（太字イタリック体を含む）が指し示すことによって、テキストに編集変更を示す。
１．冒頭説明

この文書はビデオファイルフォーマットに関する。具体的には、この文書は、ＩＳＯベースメディアファイルフォーマット（ISO base media file format；ＩＳＯＢＭＦＦ）に基づくバーサタイルビデオコーディング（Versatile Video Coding；ＶＶＣ）映像ビットストリームを搬送するメディアファイルにおける、クロマフォーマット、ビット深度、ピクチャ幅、及びピクチャ高さを含むピクチャフォーマット情報のシグナリングに関する。当該アイディアは、個別に又は様々な組み合わせで、例えばＶＶＣ標準といった任意のコーデックによって符号化される映像ビットストリームに、及び例えば開発中のＶＶＣビデオファイルフォーマットといった任意のビデオファイルフォーマットに適用され得る。
２．略語
ＡＣＴ adaptive colour transform（適応色変換）
ＡＬＦ adaptive loop filter（適応ループフィルタ）
ＡＭＶＲ adaptive motion vector resolution（適応動きベクトルレゾリューション）
ＡＰＳ adaptation parameter set（適応パラメータセット）
ＡＵ access unit（アクセスユニット）
ＡＵＤ access unit delimiter（アクセスユニットデリミタ）
ＡＶＣ advanced video coding（アドバンストビデオコーディング）（勧告ＩＴＵ－ＴＨ．２６４｜ＩＳＯ／ＩＥＣ１４４９６－１０）
Ｂ bi-predictive（双予測）
ＢＣＷ bi-prediction with CU-level weights（ＣＵレベル重みを用いた双予測）
ＢＤＯＦ bi-directional optical flow（双方向オプティカルフロー）
ＢＤＰＣＭ block-based delta pulse code modulation（ブロックベースデルタプラスコード変調）
ＢＰ buffering period（バッファリング期間）
ＣＡＢＡＣ context-based adaptive binary arithmetic coding（コンテキストベース適応バイナリ算術コーディング）
ＣＢ coding block（符号化ブロック）
ＣＢＲ constant bit rate（定ビットレート）
ＣＣＡＬＦ cross-component adaptive loop filter（クロスコンポーネント適応ループフィルタ）
ＣＰＢ coded picture buffer（符号化ピクチャバッファ）
ＣＲＡ clean random access（クリーンランダムアクセス）
ＣＲＣ cyclic redundancy check（サイクリック冗長性検査）
ＣＴＢ coding tree block（符号化ツリーブロック）
ＣＴＵ coding tree unit（符号化ツリーユニット）
ＣＵ coding unit（符号化ユニット）
ＣＶＳ coded video sequence（符号化映像シーケンス）
ＤＰＢ decoded picture buffer（復号ピクチャバッファ）
ＤＣＩ decoding capability information（復号能力情報）
ＤＲＡＰ dependent random access point（従属ランダムアクセスポイント）
ＤＵ decoding unit（復号ユニット）
ＤＵＩ decoding unit information（復号ユニット情報）
ＥＧ exponential-Golomb（指数ゴロム）
ＥＧｋ k-th order exponential-Golomb（Ｋ次指数ゴロム）
ＥＯＢ end of bitstream（ビットストリーム終端）
ＥＯＳ end of sequence（シーケンス終端）
ＦＤ filler data（フィラー（ダミー）データ）
ＦＩＦＯ first-in, first-out（先入先出）
ＦＬ fixed-length（固定長）
ＧＢＲ green，blue，and red（緑、青、及び赤）
ＧＣＩ general constraints information（一般的制約情報）
ＧＤＲ gradual decoding refresh（段階的復号リフレッシュ）
ＧＰＭ geometric partitioning mode（幾何学的分割モード）
ＨＥＶＣ high efficiency video coding（ハイエフィシェンシビデオコーディング）（勧告ＩＴＵ－ＴＨ．２６５｜ＩＳＯ／ＩＥＣ２３００８－２）
ＨＲＤ hypothetical reference decoder（仮説的リファレンスデコーダ）
ＨＳＳ hypothetical stream scheduler（仮説的ストリームスケジューラ）
Ｉ intra（イントラ）
ＩＢＣ intra block copy（イントラブロックコピー）
ＩＤＲ instantaneous decoding refresh（即時復号リフレッシュ）
ＩＬＲＰ inter-layer reference picture（インターレイヤ参照ピクチャ）
ＩＲＡＰ intra random access point（イントラランダムアクセスポイント）
ＬＦＮＳＴ low frequency non-separable transform（低周波数非分離可能変換）
ＬＰＳ least probable symbol（リーストプロバブルシンボル）
ＬＳＢ least significant bit（最下位ビット）
ＬＴＲＰ long-term reference picture（長期参照ピクチャ）
ＬＭＣＳ luma mapping with chroma scaling（クロマスケーリングを用いたルママッピング）
ＭＩＰ matrix-based intra prediction（行列ベースイントラ予測）
ＭＰＳ most probable symbol（最確シンボル）
ＭＳＢ most significant bit（最上位ビット）
ＭＴＳ multiple transform selection（マルチ変換選択）
ＭＶＰ motion vector prediction（動きベクトル予測）
ＮＡＬ network abstraction layer（ネットワーク抽象化層）
ＯＬＳ output layer set（出力レイヤセット）
ＯＰ operation point（動作点）
ＯＰＩ operating point information（動作点情報）
Ｐ predictive（予測）
ＰＨ picture header（ピクチャヘッダ）
ＰＯＣ picture order count（ピクチャオーダーカウント）
ＰＰＳ picture parameter set（ピクチャパラメータセット）
ＰＲＯＦ prediction refinement with optical flow（オプティカルフローを用いた予測精緻化）
ＰＴ picture timing（ピクチャタイミング）
ＰＵ picture unit（ピクチャユニット）
ＱＰ quantization parameter（量子化パラメータ）
ＲＡＤＬ random access decodable leading（ランダムアクセス復号可能リーディング（ピクチャ）
ＲＡＳＬ random access skipped leading（ランダムアクセススキップリーディング（ピクチャ）
ＲＢＳＰ raw byte sequence payload（ローバイトシーケンスペイロード）
ＲＧＢ red，green，and blue（赤、緑、及び青）
ＲＰＬ reference picture list（参照ピクチャリスト）
ＳＡＯ sample adaptive offset（サンプル適応オフセット）
ＳＡＲ sample aspect ratio（サンプルアスペクト比）
ＳＥＩ supplemental enhancement information（補助拡張情報）
ＳＨ slice header（スライスヘッダ）
ＳＬＩ subpicture level information（サブピクチャレベル情報）
ＳＯＤＢ string of data bits（データビット列）
ＳＰＳ sequence parameter set（シーケンスパラメータセット）
ＳＴＲＰ short-term reference picture（短期参照ピクチャ）
ＳＴＳＡ step-wise temporal sublayer access（段階的時間サブレイヤアクセス）
ＴＲ truncated rice（トランケーテッドライス）
ＶＢＲ variable bit rate（可変ビットレート）
ＶＣＬ video coding layer（映像符号化レイヤ）
ＶＰＳ video parameter set（ビデオパラメータセット）
ＶＳＥＩ versatile supplemental enhancement information（多用途補助拡張情報）（勧告ＩＴＵ－ＴＨ．２７４｜ＩＳＯ／ＩＥＣ２３００２－７）
ＶＵＩ video usability information（映像ユーザビリティ情報）
ＶＶＣ versatile video coding（バーサタイルビデオコーディング）（勧告ＩＴＵ－ＴＨ．２６６｜ＩＳＯ／ＩＥＣ２３０９０－３）
３．映像符号化序論
３．１．映像符号化標準

映像符号化標準は、主に、周知のＩＴＵ－Ｔ及びＩＳＯ／ＩＥＣ標準の開発を通じて発展してきた。ＩＴＵ－ＴがＨ．２６１及びＨ．２６３を作成し、ＩＳＯ／ＩＥＣがＭＰＥＧ－１及びＭＰＥＧ－４Ｖｉｓｕａｌを作成し、そして、これら２つの組織が共同で、Ｈ．２６２／ＭＰＥＧ－２Ｖｉｄｅｏ及びＨ．２６４／ＭＰＥＧ－４ＡＶＣ（Advanced Video Coding）及びＨ．２６５／ＨＥＶＣ標準を作成した。Ｈ．２６２以来、映像符号化標準は、時間予測に加えて変換符号化が利用されるハイブリッド映像符号化構造に基づいている。ＨＥＶＣの先の将来の映像符号化技術を探求するため、２０１５年にＶＣＥＧとＭＰＥＧが共同でＪＶＥＴ（Joint Video Exploration Team）を設立した。それ以来、数多くの新しい方法が、ＪＶＥＴによって採用され、共同探索モデルＪＥＭ（Joint Exploration Model）と名付けられたリファレンスソフトウェアに入れられてきた。ＪＶＥＴは後に、ＶＶＣ（Versatile Video Coding）プロジェクトが正式に開始された時に、ＪＶＥＴ（Joint Video Experts Team）と改称された。ＶＶＣ［３］は、２０２０年７月１日に終了した第１９回会議でＪＶＥＴによって最終策定されたＨＥＶＣと比較して５０％のビットレート低減を目指す新しい符号化標準である。

ＶＶＣ（Versatile Video Coding）標準（ＩＴＵ－ＴＨ．２６６｜ＩＳＯ／ＩＥＣ２３０９０－３）及び関連するＶＳＥＩ（Versatile Supplemental Enhancement Information）標準（ＩＴＵ－ＴＨ．２７４｜ＩＳＯ／ＩＥＣ２３００２－７）は、例えばテレビジョン放送、ビデオ会議、又はストレージ媒体からの再生などの伝統的な用途と、例えば適応ビットレートストリーミング、映像領域抽出、複数の符号化映像ビットストリームからのコンテンツの合成及び融合、マルチビュー映像、スケーラブル階層化コーディング、及びビューポート適応３６０°没入メディアなどのいっそう新しくて先進的な用途との両方を含む、最大限に広範囲のアプリケーションで使用に向けて設計されている。
３．２．ファイルフォーマット標準

メディアストリーミングアプリケーションは、典型的に、ＩＰ、ＴＣＰ、及びＨＴＴＰトランスポート方法に基づいており、典型的に、例えばＩＳＯベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）などのファイルフォーマットを当てにしている。１つのそのようなストリーミングシステムは、ＤＡＳＨ（dynamic adaptive streaming over HTTP）である。ある映像フォーマットをＩＳＯＢＭＦＦ及びＤＡＳＨとともに使用するためには、例えばＩＳＯ／ＩＥＣ１４４９６－１５（“Information technology ― Coding of audio-visual objects ― Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format”）におけるＨＥＶＣファイルフォーマット及びＡＶＣファイルフォーマットなどのように、その映像フォーマットに特有のファイルフォーマット仕様が、ＩＳＯＢＭＦＦトラックにおける並びにＤＡＳＨ表現及びセグメントにおける映像コンテンツのカプセル化のために必要となる。映像ビットストリームについての重要な情報、例えば、プロファイル、ティア、及びレベル、並びにその他の多くが、例えば、ストリーミングセッションの開始時の初期化のため及びストリーミングセッション中のストリーム適応のための両方での適切なメディアセグメントの選択のためといった、コンテンツ選択目的で、ファイルフォーマットレベルのメタデータ及び／又はＤＡＳＨメディアプレゼンテーション記述（ＭＰＤ）として露わにされる必要がある。

同様に、ある画像フォーマットをＩＳＯＢＭＦＦとともに使用するためには、例えばＭＰＥＧアウトプット文書Ｎ１９４５４（“Information technology ― Coding of audio-visual objects ― Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format ― Amendment 2: Carriage of VVC and EVC in ISOBMFF”，２０２０年７月）におけるＨＥＶＣ画像ファイルフォーマット及びＡＶＣ画像ファイルフォーマットなどのように、その画像フォーマットに特有のファイルフォーマット仕様が必要となる。

ＩＳＯＢＭＦＦに基づいたＶＶＣ映像コンテンツのストレージ用のファイルフォーマットであるＶＶＣ映像ファイルフォーマットは、現在、ＭＰＥＧによって開発中である。ＶＶＣ映像ファイルフォーマットの最新のドラフト仕様は、ＭＰＥＧアウトプット文書Ｎ１９４６０（“Information technology ― High efficiency coding and media delivery in heterogeneous environments ― Part 12: Image File Format ― Amendment 3: Support for VVC, EVC, slideshows and other improvements”，２０２０年７月）に含まれている。

ＩＳＯＢＭＦＦに基づいた、ＶＶＣを用いて符号化された画像コンテンツのストレージ用のファイルフォーマットである、ＶＶＣ画像ファイルフォーマットは、現在、ＭＰＥＧによって開発中である。ＶＶＣ画像ファイルフォーマットの最新のドラフト仕様は、［１２］に含まれている。
３．３．ＶＶＣ映像ファイルフォーマットの一部詳細
３．３．１．デコーダコンフィギュレーション情報
３．３．１．１．ＶＶＣデコーダコンフィギュレーションレコード
３．３．１．１．１．定義
この従属節は、ＩＳＯ／ＩＥＣ２３０９０－３映像コンテンツ向けのデコーダコンフィギュレーション情報を規定する。このレコードは、各サンプルに含まれるＮＡＬユニットの長さを指し示すために各サンプル内で使用される長さフィールドのサイズと、サンプルエントリに格納される場合のパラメータセットとを含む。このレコードは外部フレームとされる（そのサイズが、それを含む構造によって供給される）；
このレコードはバージョンフィールドを含む。仕様のこのバージョンは、このレコードのバージョン１を定義する。レコードへの適合しない変更は、バージョン番号の変更によって指し示されることになる。リーダ（ｒｅａｄｅｒ）は、バージョン番号が認識されない場合、このレコード又はそれが適用されるストリームを復号することを試みないとする；
このレコードへの適合する拡張は、それを拡張するのであって、コンフィグレーションバージョンコードを変更しない。リーダは、理解できるデータの定義を超えた、認識されないデータを無視するように整えられるべきである；
トラックが、ネイティブに、又は‘subp’トラック参照を分解してではあるが、ＶＶＣビットストリームを含むとき、VvcPtlRecordがデコーダコンフィギュレーションレコードに存在するものとする。トラックのデコーダコンフィギュレーションレコード内でptl_present_flagがゼロに等しい場合、そのトラックは‘oref’トラック参照を持つものとする；
VvcPTLRecord、chroma_format_idc、及びbit_depth_minus8の構文要素の値は、このレコードによって記述されるストリームが復号されるときにアクティブにされている全てのパラメータセット（この段落中の以下の文において“全てのパラメータセット”として参照する）に対して有効であるとする。具体的には、以下の制約が適用される：
プロファイルインジケーションgeneral_profile_idcは、このコンフィギュレーションレコードに関連するストリームが適合するプロファイルを指し示すものとする；
注記１：ＳＰＳが異なるプロファイルでマークされている場合、ストリームは、もしあれば、ストリーム全体がどのプロファイルに準拠するかを決定するための検査を必要とし得る。ストリーム全体が検査されない場合、又はストリーム全体が準拠するプロファイルが存在しないことを検査が明らかにした場合、ストリーム全体が、これらのルールを満たすことができる別々のコンフィギュレーションレコードを持つ２つ以上のサブストリームに分割されるものとする；
ティアインジケーションgeneral_tier_flagは、ティアが、全てのパラメータセットにおいて指し示される最も高いティア以上であることを指し示すとする；
general_constraint_infoの各ビットは、全てのパラメータセットがそのビットをセットする場合にのみセットされ得る；
レベルインジケーションgeneral_level_idcは、能力のレベルが、全てのパラメータセットにおける最も高いティアに対して指し示される最高レベル以上であることを指し示すものとする；
次の制約がchroma_format_idcに適用される：
－ＩＳＯ／ＩＥＣ２３０９０－３で定義されるsps_chroma_format_idcの値が、トラックのＮＡＬユニットによって参照される全てのＳＰＳにおいて同じである場合、chroma_format_idcはsps_chroma_format_idcに等しいとする；
－そうでない場合で、ptl_present_flagが１に等しい場合、chroma_format_idcは、ＩＳＯ／ＩＥＣ２３０９０－３で定義されるvps_ols_dpb_chroma_format[output_layer_set_idx]に等しいとする；
－それ以外の場合、chroma_format_idcは存在しないとする；
次の制約がbit_depth_minus8に適用される：
－ＩＳＯ／ＩＥＣ２３０９０－３で定義されるsps_bitdepth_minus8の値が、トラックのＮＡＬユニットによって参照される全てのＳＰＳにおいて同じである場合、bit_depth_minus8はsps_bitdepth_minus8に等しいとする；
－そうでない場合で、ptl_present_flagが１に等しい場合、bit_depth_minus8は、ＩＳＯ／ＩＥＣ２３０９０－３で定義されるvps_ols_dpb_bitdepth_minus8[output_layer_set_idx]に等しいとする；
－それ以外の場合、bit_depth_minus8は存在しないとする；
クロマフォーマット及びビット深度、並びにＶＶＣ映像エレメンタリストリームによって使用されるその他の重要なフォーマット情報について、ＶＶＣデコーダコンフィギュレーションレコード内で明示的なインジケーションが提供される。２つのシーケンスがそれらのＶＵＩ情報内の色空間インジケーションにおいて異なる場合、２つの異なるＶＶＣサンプルエントリも必要とされる；
初期化ＮＡＬユニットを搬送するための配列のセットが存在する。ＮＡＬユニットタイプは、ＤＣＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、プレフィックスＡＰＳ、プレフィックスＳＥＩＮＡＬユニットのみを指し示すように制約される。ＩＳＯ／ＩＥＣ２３０９０－３において及びこの仕様において留保されるＮＡＬユニットタイプが将来において定義を得ることができ、リーダはＮＡＬユニットタイプの留保された又は許可されていない値を持つ配列を無視するものとする；
注記２：この‘耐性ある’挙動は、エラーが発生しないように設計され、将来仕様における、これらの配列への、後方互換性のある拡張の可能性を許す；
注記３：サンプルエントリにて搬送されるＮＡＬユニットは、そのサンプルエントリを参照する最初のサンプルから再構築されたアクセスユニット内の、又はさもなければ該アクセスユニットの始まりにある、ＡＵＤ及びＯＰＩＮＡＬユニット（もしあれば）のすぐ後に続くように含められる；
配列がＤＣＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、プレフィックスＡＰＳ、プレフィックスＳＥＩの順であることが推奨される。
３．３．１．１．２．構文
aligned(8) class VvcPTLRecord(num_sublayers) {
unsigned int(8) num_bytes_constraint_info;
unsigned int(7) general_profile_idc;
unsigned int(1) general_tier_flag;
unsigned int(8) general_level_idc;
unsigned int(1) ptl_frame_only_constraint_flag;
unsigned int(1) ptl_multilayer_enabled_flag;
if (num_bytes_constraint_info > 0)
unsigned int(8*num_bytes_constraint_info - 2) general_constraint_info;
for (i=num_sublayers - 2; i >= 0; i--)
unsigned int(1) ptl_sublayer_level_present_flag[i];
for (j=num_sublayers; j<=8 && num_sublayers > 1; j++)
bit(1) ptl_reserved_zero_bit = 0;
for (i=num_sublayers-2; i >= 0; i--)
if (ptl_sublayer_level_present[i])
unsigned int(8) sublayer_level_idc[i];
unsigned int(8) num_sub_profiles;
for (j=0; j < num_sub_profiles; j++)
unsigned int(32) general_sub_profile_idc;
}
aligned(8) class VvcDecoderConfigurationRecord {
unsigned int(8) configurationVersion = 1;
unsigned int(16) avgFrameRate;
unsigned int(2) constantFrameRate;
unsigned int(3) numTemporalLayers;
unsigned int(2) lengthSizeMinusOne;
unsigned int(1) ptl_present_flag;
if (ptl_present_flag) {
VvcPTLRecord(numTemporalLayers) track_ptl;
unsigned int(16) output_layer_set_idx;
}
unsigned int(1) chroma_format_present_flag;
if (chroma_format_present_flag)
unsigned int(2) chroma_format_idc;
else
bit(2) reserved = '11'b;
unsigned int(1) bit_depth_present_flag;
if (bit_depth_present_flag)
unsigned int(3) bit_depth_minus8;
else
bit(3) reserved = '111'b;
unsigned int(1) reserved= '1'b;
unsigned int(8) numOfArrays;
for (j=0; j < numOfArrays; j++) {
unsigned int(1) array_completeness;
bit(1) reserved = 0;
unsigned int(6) NAL_unit_type;
unsigned int(16) numNalus;
for (i=0; i< numNalus; i++) {
unsigned int(16) nalUnitLength;
bit(8*nalUnitLength) nalUnit;
}
}
}
３．３．１．１．３．セマンティクス
general_profile_idc、general_tier_flag、general_sub_profile_idc、general_constraint_info、general_level_idc、ptl_frame_only_constraint_flag、ptl_multilayer_enabled_flag、sublayer_level_present、及びsublayer_level_idc[i]は、このコンフィギュレーションレコードが適用されるストリームについての、ＩＳＯ／ＩＥＣ２３０９０－３で定義される、フィールドgeneral_profile_idc、general_tier_flag、general_sub_profile_idcのマッチング値、general_constraint_info()、general_level_idc、ptl_multilayer_enabled_flag、ptl_frame_only_constraint_flag、sublayer_level_present、及びsublayer_level_idc[i]内のビットを含む；
avgFrameRateは、このコンフィギュレーションレコードが適用されるストリームについての、フレーム／（２５６秒）の単位での平均フレームレートを与える。値０は、規定されていない平均フレームレートを指し示す；
１に等しいconstantFrameRateは、このコンフィギュレーションレコードが適用されるストリームが一定のフレームレートのものであることを指し示す。値２は、ストリーム内の各時間レイヤの表現が一定フレームレートのものであることを指し示す。値０は、ストリームが一定のフレームレートのものであるかもしれないし、そうでないかもしれないことを指し示す；
１より大きいnumTemporalLayersは、このコンフィギュレーションレコードが適用されるトラックが時間スケーラブルであり、含まれる時間レイヤ（ＩＳＯ／ＩＥＣ２３０９０－３では時間サブレイヤ又はサブレイヤとしても参照される）の数がnumTemporalLayersに等しいことを指し示す。値１は、このコンフィギュレーションレコードが適用されるトラックが時間スケーラブルでないことを指し示す。値０は、このコンフィギュレーションレコードが適用されるトラックが時間スケーラブルであるかが不明であることを指し示す；
lengthSizeMinusOne＋１は、このコンフィギュレーションレコードが適用されるストリーム内のＶＶＣ映像ストリームサンプルにおけるNALUnitLengthフィールドの、バイト単位での長さを指し示す。例えば、１バイトのサイズが０という値で指し示される。このフィールドの値は、１、２、又は４バイトで符号化される長さにそれぞれ対応する０、１、又は３のうちの１つであるとする；
１に等しいptl_present_flagは、トラックが特定の出力レイヤセットに対応するＶＶＣビットストリームを含むことを規定する。０に等しいptl_present_flagは、トラックが特定の出力レイヤセットに対応するＶＶＣビットストリームを含まずに、むしろ、出力レイヤセットを形成しない１つ以上の個別のレイヤ、又は０に等しいTemporalIdを持つサブレイヤを除く個別のサブレイヤを含み得ることを規定する；
num_sub_profilesは、デコーダコンフィギュレーションレコードにおいて指し示されるサブプロファイルの数を定める；
track_ptlは、トラックに含まれるＶＶＣビットストリームによって表される出力レイヤセットのプロファイル、ティア、及びレベルを規定する；
output_layer_set_idxは、トラックに含まれるＶＶＣビットストリームによって表される出力レイヤセットの出力レイヤセットインデックスを規定する。output_layer_set_idxの値は、トラックに含まれるビットストリームを復号するために、ＩＳＯ／ＩＥＣ２３０９０－３に規定されるように、ＶＶＣデコーダに外部手段によって提供されるTargetOlsIdx変数の値として使用されることができる；
０に等しいchroma_format_present_flagは、chroma_format_idcが存在しないことを規定する。１に等しいchroma_format_present_flagは、chroma_format_idcが存在することを規定する；
chroma_format_idcは、そのトラックに適用されるクロマフォーマットを指し示す。次の制約がchroma_format_idcに適用される：
－ＩＳＯ／ＩＥＣ２３０９０－３で定義されるsps_chroma_format_idcの値が、トラックのＮＡＬユニットによって参照される全てのＳＰＳにおいて同じである場合、chroma_format_idcはsps_chroma_format_idcに等しいとする；
－そうでない場合で、ptl_present_flagが１に等しい場合、chroma_format_idcは、ＩＳＯ／ＩＥＣ２３０９０－３で定義されるvps_ols_dpb_chroma_format[output_layer_set_idx]に等しいとする；
－それ以外の場合、chroma_format_idcは存在しないとする；
０に等しいbit_depth_present_flagは、bit_depth_minus8が存在しないことを規定する。１に等しいbit_depth_present_flagは、bit_depth_minus8が存在することを規定する；
bit_depth_minus8は、そのトラックに適用されるビット深度を指し示す。次の制約がbit_depth_minus8に適用される：
－ＩＳＯ／ＩＥＣ２３０９０－３で定義されるsps_bitdepth_minus8の値が、トラックのＮＡＬユニットによって参照される全てのＳＰＳにおいて同じである場合、bit_depth_minus8はsps_bitdepth_minus8に等しいとする；
－そうでない場合で、ptl_present_flagが１に等しい場合、bit_depth_minus8は、ＩＳＯ／ＩＥＣ２３０９０－３で定義されるvps_ols_dpb_bitdepth_minus8[output_layer_set_idx]に等しいとする；
－それ以外の場合、bit_depth_minus8は存在しないとする；
numArraysは、指し示される（１つ以上の）タイプのＮＡＬユニットの配列の数を指し示す；
array_completenessは、１に等しいとき、所与のタイプの全てのＮＡＬユニットが続く配列内にあり、ストリーム内にないことを指し示し、０に等しいとき、指し示されるタイプの追加のＮＡＬユニットがストリーム内にあり得ることを指し示し、デフォルト値及び許容値がサンプルエントリ名によって制約される；
NAL_unit_typeは、次の配列内のＮＡＬユニットのタイプを指し示す（そのタイプの全てとする）：それは、ＩＳＯ／ＩＥＣ２３０９０－２で定義された値をとる；それは、ＤＣＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、プレフィックスＳＥＩ、又はサフィックスＳＥＩＮＡＬユニットを指し示す値のうち１つをとるように制約される；
numNalusは、このコンフィギュレーションレコードが適用されるストリームについてのコンフィギュレーションレコードに含まれる、指し示されたタイプのＮＡＬユニットの数を指し示す。ＳＥＩアレイは、‘宣言的’性質のＳＥＩメッセージ、すなわち、全体としてのストリームについての情報を提供するものとする。そのようなＳＥＩの一例は、ユーザデータＳＥＩとし得る；
nalUnitLengthは、ＮＡＬユニットのバイト単位での長さを指し示す；
nalUnitは、ＩＳＯ／ＩＥＣ２３０９０－３に規定されるように、ＤＣＩ、ＶＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ又は宣言的ＳＥＩＮＡＬユニットを含む；
３．３．２．動作点情報サンプルグループ
３．３．２．１．定義
アプリケーションは、所与のＶＶＣビットストリームによって提供される異なる動作点及びそれらの構成について、動作点情報（Operating Points Information）サンプルグループ（‘ｖｏｐｉ’）を用いて通知される。各動作点は、出力レイヤセット、最大TemporarId値、並びにプロファイル、レベル、及びティアシグナリングに関係する。これらの情報は全て、‘ｖｏｐｉ’サンプルグループによってキャプチャされる。この情報とは別に、このサンプルグループはまた、レイヤ間の従属関係情報を提供する；
ＶＶＣビットストリームに関して２つ以上のＶＶＣトラックが存在し、且つそのＶＶＣビットストリームに関して動作点エンティティグループが存在しないとき、次の両方が適用される：
－そのＶＶＣビットストリームに関するＶＶＣトラックの中に、‘ｖｏｐｉ’サンプルグループを搬送するトラックが１つのみ存在するとする；
－そのＶＶＣビットストリームの他の全てのＶＶＣトラックは、‘ｖｏｐｉ’サンプルグループを搬送するトラックへの‘ｏｒｅｆ’タイプのトラック参照を持つものとする；
所与のトラック内の任意の特定のサンプルに対して、別のトラック内の時間コロケートサンプルが、この特定のサンプルのものと同じ復号時間を有するサンプルとして定められる。‘ｖｏｐｉ’サンプルグループを搬送するトラックＴ_ｋへの‘ｏｒｅｆ’トラック参照を持つトラックＴ_Ｎ内の各サンプルＳ_Ｎに対し、以下が適用される：
－トラックＴ_ｋ内に時間コロケートサンプルＳ_ｋが存在する場合、サンプルＳ_Ｎは、サンプルＳ_ｋと同じ‘ｖｏｐｉ’サンプルグループエントリに関連付けられる；
－さうでない場合、サンプルＳ_Ｎは、復号時間においてサンプルＳ_Ｎに先行するトラックＴ_ｋ内のサンプルのうち最後のものと同じ‘ｖｏｐｉ’サンプルグループエントリに関連付けられる；
複数のＶＰＳがＶＶＣビットストリームによって参照されるとき、グルーピングタイプ‘ｖｏｐｉ’を有するサンプルグループ記述ボックスに複数のエントリを含む必要があるとし得る。より一般的な、単一のＶＰＳが存在するケースでは、ＩＳＯ／ＩＥＣ１４４９６－１２で定義されるデフォルトサンプルグループメカニズムを使用して、動作点情報サンプルグループを、各トラックフラグメントに含めるのではなく、サンプルテーブルボックスに含めることが推奨される；
grouping_type_parameterは、グルーピングタイプ‘ｖｏｐｉ’を有するSampleToGroupBoxに対しては定められない；
３．３．２．２．構文
class VvcOperatingPointsRecord {
unsigned int(8) num_profile_tier_level_minus1;
for (i=0; i<=num_profile_tier_level_minus1; i++) {
unsigned int(8) ptl_max_temporal_id[i];
VvcPTLRecord(ptl_max_temporal_id[i]+1) ptl[i];
}
unsigned int(1) all_independent_layers_flag;
bit(7) reserved = 0;
if (all_independent_layers_flag){
unsigned int(1) each_layer_is_an_ols_flag;
bit(7) reserved = 0;
} else
unsigned int(8) ols_mode_idc;
unsigned int(16) num_operating_points;
for (i=0; i<num_operating_points) {
unsigned int(16) output_layer_set_idx;
unsigned int(8) ptl_idx;
unsigned int(8) max_temporal_id;
unsigned int(8) layer_count;
for (j=0; j<layer_count; j++) {
unsigned int(6) layer_id;
unsigned int(1) is_outputlayer;
bit(1) reserved = 0;
}
bit(6) reserved = 0;
unsigned int(1) frame_rate_info_flag
unsigned int(1) bit_rate_info_flag
if (frame_rate_info_flag) {
unsigned int(16) avgFrameRate;
bit(6) reserved = 0;
unsigned int(2) constantFrameRate;
}
if (bit_rate_info_flag) {
unsigned int(32) maxBitRate;
unsigned int(32) avgBitRate;
}
}
unsigned int(8) max_layer_count;
for (i=0; i<max_layer_count; i++) {
unsigned int(8) layerID;
unsigned int(8) num_direct_ref_layers;
for (j=0; j<num_direct_ref_layers; j++)
unsigned int(8) direct_ref_layerID;
unsigned int(8) max_tid_il_ref_pics_plus1;
}
}
class VvcOperatingPointsInformation extends VisualSampleGroupEntry ('vopi') {
VvcOperatingPointsRecord oinf;
}
３．３．２．３．セマンティクス
num_profile_tier_level_minus1＋１は、続くプロファイル、ティア、及びレベルの組み合わせ並びに関連するフィールドの数を与える；
ptl_max_temporal_id[i]は、規定されるｉ番目のプロファイル、ティア、及びレベル構造に関連するビットストリームのＮＡＬユニットの最大TemporalIDを与える；
注記：ptl_max_temporal_id[i]及び後述の動作点のmax_temporal_idのセマンティクスは、それらが同じ数値を搬送し得るとはいえ異なる；
ptl[i]は、ｉ番目のプロファイル、ティア、及びレベル構造を規定する；
all_independent_layers_flag、each_layer_is_an_ols_flag、ols_mode_idc、及びmax_tid_il_ref_pics_plus1は、ＩＳＯ／ＩＥＣ２３０９０－３で定義されている；
num_operating_pointsは、それについて情報が続く動作点の数を与える；
output_layer_set_idxは、動作点を定める出力レイヤセットのインデックスである。output_layer_set_idxとlayer_id値との間のマッピングは、インデックスoutput_layer_set_idxを有する出力レイヤセットに対してＶＰＳによって規定されるものと同じとする；
ptl_idxは、インデックスoutput_layer_set_idxを有する出力レイヤセットについて列挙されるプロファイル、レベル、及びティア構造のゼロベースのインデックスをシグナリングする；
max_temporal_idは、その動作点のＮＡＬユニットの最大TemporalIdを与える；
注記：レイヤ情報サンプルグループにおいて指し示される最大TemporalId値は、ここで指し示される最大TemporalIdとは異なるセマンティクスを持つ。しかしながら、それらは文字通り同じ数値を搬送し得る；
layer_countは、その動作点の、ＩＳＯ／ＩＥＣ２３０９０－３で定義される、必要なレイヤの数を指し示すフィールドである；
layer_idは、動作点のレイヤについてのnuh_layer_id値を提供する；
is_outputlayerは、レイヤが出力レイヤであるか否かを指し示すフラグである。１が出力レイヤを指し示す；
０に等しいframe_rate_info_flagは、動作点についてフレームレート情報が存在しないことを指し示す。値１は、動作点についてフレームレート情報が存在することを指し示す；
０に等しいbit_rate_info_flagは、動作点についてビットレート情報が存在しないことを指し示す。値１は、動作点についてビットレート情報が存在することを指し示す；
avgFrameRateは、動作点についての、フレーム／（２５６秒）の単位での平均フレームレートを与える。値０は、規定されていない平均フレームレートを指し示す；
１に等しいconstantFrameRateは、動作点のストリームが一定のフレームレートのものであることを指し示す。値２は、動作点のストリーム内の各時間レイヤの表現が一定フレームレートのものであることを指し示す。値０は、動作点のストリームが一定のフレームレートのものであるかもしれないし、そうでないかもしれないことを指し示す；
maxBitRateは、１秒の任意のウィンドウ上での、動作点のストリームのビット／秒単位での最大ビットレートを与える；
avgBitRateは、動作点のストリームのビット／秒単位での平均ビットレートを与える；
max_layer_countは、その関連付けられたベーストラックに関係する全ての動作点における全ての無二のレイヤのカウントである；
layerIDは、：それについて全ての直接参照レイヤが続くdirect_ref_layerIDのループ内で与えられるレイヤのnuh_layer_idである；
num_direct_ref_layersは、layerIDに等しいnuh_layer_idを有するレイヤについての直接参照レイヤの数である；
direct_ref_layerIDは、直接参照レイヤのnuh_layer_idである；
３．３．３．動作点エンティティグループ
３．３．３．１．全般
動作点エンティティグループは、動作点へのトラックのマッピング及び動作点のプロファイルレベル情報を提供するために定義される；
このエンティティグループに記述された動作点にマッピングされるトラックのサンプルを集約するときの暗黙の再構成プロセスは、準拠するＶＶＣビットストリームを生じさせるために更なるＮＡＬユニットを除去することを必要としない。動作点エンティティグループに属するトラックは、動作点エンティティグループにおいて指し示されるgroup_idに対するタイプ‘ｏｒｅｆ’のトラック参照を持つとする；
動作点エンティティグループに含まれる全てのentity_id値は、同じＶＶＣビットストリームに属するものとする。存在するとき、OperatingPointGroupBoxは、ムービーレベルのMetaBox内のGroupsListBoxに含まれるものとし、ファイルレベル又はトラックレベルのMetaBoxに含まれるのではないとする；
３．３．３．２．構文
aligned(8) class OperatingPointGroupBox extends EntityToGroupBox('opeg',0,0)
{
unsigned int(8) num_profile_tier_level_minus1;
for (i=0; i<=num_profile_tier_level_minus1; i++)
VvcPTLRecord(0) opeg_ptl[i];
unsigned int(16) num_operating_points;
for (i=0; i<num_operating_points) {
unsigned int(16) output_layer_set_idx;
unsigned int(8) ptl_idx;
unsigned int(8) max_temporal_id;
unsigned int(8) layer_count;
for (j=0; j<layer_count; j++) {
unsigned int(6) layer_id;
unsigned int(1) is_outputlayer;
bit(1) reserved = 0;
}
bit(6) reserved = 0;
unsigned int(1) frame_rate_info_flag
unsigned int(1) bit_rate_info_flag
if (frame_rate_info_flag) {
unsigned int(16) avgFrameRate;
bit(6) reserved = 0;
unsigned int(2) constantFrameRate;
}
if (bit_rate_info_flag) {
unsigned int(32) maxBitRate;
unsigned int(32) avgBitRate;
}
unsigned int(8) entity_count;
for (j=0; j<entity_count; j++) {
unsigned int(8) entity_idx;
}
}
}
３．３．３．３．セマンティクス
num_profile_tier_level_minus1＋１は、続くプロファイル、ティア、及びレベルの組み合わせ並びに関連するフィールドの数を与える；
opeg_ptl[i]は、ｉ番目のプロファイル、ティア、及びレベル構造を規定する；
num_operating_pointsは、それについて情報が続く動作点の数を与える；
output_layer_set_idxは、動作点を定める出力レイヤセットのインデックスである。output_layer_set_idxとlayer_id値との間のマッピングは、インデックスoutput_layer_set_idxを有する出力レイヤセットに対してＶＰＳによって規定されるものと同じとする；
ptl_idxは、インデックスoutput_layer_set_idxを有する出力レイヤセットについて列挙されるプロファイル、レベル、及びティア構造のゼロベースのインデックスをシグナリングする；
max_temporal_idは、その動作点のＮＡＬユニットの最大TemporalIdを与える；
注記：レイヤ情報サンプルグループにおいて指し示される最大TemporalId値は、ここで指し示される最大TemporalIdとは異なるセマンティクスを持つ。しかしながら、それらは文字通り同じ数値を搬送し得る；
layer_countは、その動作点の、ＩＳＯ／ＩＥＣ２３０９０－３で定義される、必要なレイヤの数を指し示すフィールドである；
layer_idは、動作点のレイヤについてのnuh_layer_id値を提供する；
is_outputlayerは、レイヤが出力レイヤであるか否かを指し示すフラグである。１が出力レイヤを指し示す；
０に等しいframe_rate_info_flagは、動作点についてフレームレート情報が存在しないことを指し示す。値１は、動作点についてフレームレート情報が存在することを指し示す；
０に等しいbit_rate_info_flagは、動作点についてビットレート情報が存在しないことを指し示す。値１は、動作点についてビットレート情報が存在することを指し示す；
avgFrameRateは、動作点についての、フレーム／（２５６秒）の単位での平均フレームレートを与える。値０は、規定されていない平均フレームレートを指し示す；
１に等しいconstantFrameRateは、動作点のストリームが一定のフレームレートのものであることを指し示す。値２は、動作点のストリーム内の各時間レイヤの表現が一定フレームレートのものであることを指し示す。値０は、動作点のストリームが一定のフレームレートのものであるかもしれないし、そうでないかもしれないことを指し示す；
maxBitRateは、１秒の任意のウィンドウ上での、動作点のストリームのビット／秒単位での最大ビットレートを与える；
avgBitRateは、動作点のストリームのビット／秒単位での平均ビットレートを与える；
entity_countは、動作点に存在するトラックの数を規定する；
entity_idxは、動作点に属するエンティティグループ内のｅｎｔｉｔｙ＿ｉｄリストへのインデックスを規定する。
４．開示される技術的ソリューションによって解決される技術的問題の例

ピクチャフォーマット情報のシグナリングに関するＶＶＣ映像ファイルフォーマットの最新設計は、以下の問題を有する：
１）VvcDecoderConfigurationRecordは、クロマフォーマット及びビット深度のオプションでのシグナリングを含むが、ピクチャ幅及びピクチャ高さのシグナリングを含まず、また、動作点情報‘ｖｏｐｉ’サンプルグループエントリ及び動作点エンティティグループ‘ｏｐｅｇ’ボックスは、これらのパラメータのいずれも含んでいない；
しかしながら、ＰＴＬがある場所でシグナリングされるとき、クロマフォーマット、ビット深度、並びにピクチャ幅及びピクチャ高さも、追加の能力表示としてシグナリングされるべきである；
なお、ビジュアルサンプルエントリの幅及び高さフィールドは、クロッピングされたフレーム幅及び高さである。従って、クロッピングウィンドウオフセットが全てゼロであり且つピクチャがフレームであるのでない限り、幅及び高さの値は、復号ピクチャのピクチャ幅及び高さと同じにならない；
現行では、次のようなケースが発生し得る：
ａ． ‘ｏｒｅｆ’トラック参照なしで、１つのＶＶＣトラックに含まれたシングルレイヤビットストリームのみである。従って、ＶｖｃＰｔｌＲｅｃｏｒｄはデコーダコンフィグレーションレコード内に存在する。しかしながら、この場合、クロマフォーマット、ビット深度、ピクチャ幅、及びピクチャ高さのうちの一部又は全てが、サンプルエントリ、‘ｖｏｐｉ’サンプルグループエントリ、又は‘ｏｐｅｇ’エンティティグループボックスのいずれでもシグナリングされないことが可能である；
ｂ．各動作点についてのＰＴＬ情報を含む動作点情報が‘ｖｏｐｉ’サンプルグループエントリ又は‘ｏｐｅｇ’エンティティグループボックスのいずれかに格納されて、マルチレイヤビットストリームが複数のトラックに格納される一方で、クロマフォーマット、ビット深度、ピクチャ幅、及びピクチャ高さのいずれもが、サンプルエントリ、‘ｖｏｐｉ’サンプルグループエントリ、又は‘ｏｐｅｇ’エンティティグループボックスのいずれでもシグナリングされない；
２）VvcDecoderConfigurationRecord内のパラメータchroma_format_idcは、パラメータセット自体で復号に十分であるため、復号のためではなく、むしろ能力インジケーションである。復号のためであっても、ＳＰＳ内のchroma_format_idcが必要とされるだけでなく、マルチレイヤＯＬＳ用のvps_ols_dpb_chroma_format[]も必要とされる。従って、ここでは実際には最大のdpb_chroma_formatがシグナリングされるべきであるが、現行設計ではそうではない。対応するビット深度、ピクチャ幅、及びピクチャ高さのパラメータについても同様である；
３）ptl_present_flagが１に等しいとき、chroma_format_idcがvps_ols_dpb_chroma_format[output_layer_set_idx]に等しいものとされることが既定されている。次の２つの問題が存在する（対応するビット深度パラメータについても同様）：
ａ． vps_ols_dpb_chroma_format[]の値は、異なるＣＶＳに対して異なることができる。従って、これが全てのＶＰＳに対して同じであることを要求するか、それが最大以上であることを規定するか、のいずれかを必要とする；
ｂ． vps_ols_dpb_chroma_format[idx]のインデックス値ｉｄｘは、マルチレイヤＯＬＳのリストへのインデックスであり、それ故に、全てのＯＬＳのリストへのインデックスであるoutput_layer_set_idxを直接使用することは正しくない。
５．技術的ソリューションのリスト

上の問題を解決するため、以下に要約した方法を開示する。これらの項目は、全体的な概念を説明するための例と見なされるべきであり、狭く解釈されるべきでない。また、これらの項目は、個別に又は任意のやり方で組み合わせて適用されることができる：
１）ptl_present_flagが１に等しいとき、VvcDecoderConfigurationRecord内でchroma_format_idc及びbit_depth_minus8をシグナリングし、ptl_present_flagが０に等しいときには、VvcDecoderConfigurationRecord内でそれらをシグナリングしない；
２）コンフィギュレーションレコードが適用されるＶＶＣストリームがシングルレイヤビットストリームであるとき、sps_chroma_format_idcの値は、現在サンプルエントリ記述が適用されるサンプル内のＶＣＬＮＡＬユニットによって参照される全てのＳＰＳに対して同じであるとするとともに、chroma_format_idcの値は、sps_chroma_format_idcに等しいとする；
３）コンフィギュレーションレコードが適用されるＶＶＣストリームがマルチレイヤビットストリームであるとき、chroma_format_idcの値は、現在サンプルエントリ記述が適用される全てのＣＶＳに対して、output_layer_set_idxによって特定されるＯＬＳに適用されるvps_ols_dpb_chroma_format[output_layer_set_idx]のうちの最大値に等しいとする；
ａ．あるいは、上の“に等しい”が“以上である”に変更される；
４）コンフィギュレーションレコードが適用されるＶＶＣストリームがシングルレイヤビットストリームであるとき、sps_bitdepth_minus8の値は、現在サンプルエントリ記述が適用されるサンプル内のＶＣＬＮＡＬユニットによって参照される全てのＳＰＳに対して同じであるとするとともに、bit_depth_minus8の値は、sps_bitdepth_minus8に等しいとする；
５）コンフィギュレーションレコードが適用されるＶＶＣストリームがマルチレイヤビットストリームであるとき、bit_depth_minus8の値は、現在サンプルエントリ記述が適用される全てのＣＶＳに対して、output_layer_set_idxによって特定されるＯＬＳに適用されるvps_ols_dpb_bitdepth_minus8[output_layer_set_idx]のうちの最大値に等しいとする；
ａ．あるいは、上の“に等しい”が“以上である”に変更される；
６）chroma_format_idc及びbit_depth_minus8のシグナリングと同様に、VvcDecoderConfigurationRecord内でのpicture_width及びpicture_heightのシグナリングを追加する。そして、picture_widthフィールド及びpicture_heightフィールドはどちらも１６ビットを使ってシグナリングされる；
ａ．あるいは、picture_widthフィールド及びpicture_heightフィールドはどちらも２４ビットを使ってシグナリングされる；
ｂ．あるいは、picture_widthフィールド及びpicture_heightフィールドはどちらも３２ビットを使ってシグナリングされる；
ｃ．あるいは、さらに、コンフィギュレーションレコードが適用されるＶＶＣストリームがシングルレイヤビットストリームであるとき、picture_widthフィールド及びpicture_heightフィールドをシグナリングすることは、クロッピングウィンドウオフセットが全てゼロであり且つピクチャがフレームである場合にスキップされてもよい；
７）上のVvcDecoderConfigurationRecord内に存在する場合と同様のセマンティクス及び制約を用いて、例えばptl_idxの直後で、各動作点について、VvcOperatingPointsRecord及びOperatingPointGroupBox内でのchroma_format_idc、bit_depth_minus8、picture_width及びpicture_heightのシグナリングを追加する。
６．実施形態
以下は、ＶＶＣ映像ファイルフォーマットに関する標準仕様に適用されることができる、第５節に要約した発明態様の一部の幾つかの実施形態例である。変更対象テキストは、２０２０年７月のＭＰＥＧアウトプット文書Ｎ１９４５４“Information technology ― Coding of audio-visual objects ― Part 15: Carriage of network abstraction layer (NAL) unit structured video in the ISO base media file format ― Amendment 2: Carriage of VVC and EVC in ISOBMFF”における最新ドラフト仕様に基づいている。追加又は変更された大きく関連する部分は太字イタリック体で強調表示されており、削除された部分の一部は二重括弧で強調表示されている（例えば、［［ａ］］は文字‘ａ’の削除を表す）。本質的に編集上の変更であるために強調表示していない変更も一部あり得る。
６．１．第１実施形態
この実施形態は、項目１乃至７についてのものである。
６．１．１．デコーダコンフィギュレーション情報
６．１．１．１．ＶＶＣデコーダコンフィギュレーションレコード
６．１．１．１．１．定義
この従属節は、ＩＳＯ／ＩＥＣ２３０９０－３映像コンテンツ向けのデコーダコンフィギュレーション情報を規定する。
．．．
（外１）

（外２）

（外３）

（外４）

．．．
（外５）

（外６）

６．１．２．動作点情報サンプルグループ
６．１．２．１．定義
．．．
６．１．２．２．構文
（外７）

６．１．２．３．セマンティクス
（外８）

６．１．３．動作点エンティティグループ
６．１．３．１．全般
動作点エンティティグループは、動作点へのトラックのマッピング及び動作点のプロファイルレベル情報を提供するために定義される；
このエンティティグループに記述された動作点にマッピングされるトラックのサンプルを集約するときの暗黙の再構成プロセスは、準拠するＶＶＣビットストリームを生じさせるために更なるＮＡＬユニットを除去することを必要としない。動作点エンティティグループに属するトラックは、動作点エンティティグループにおいて指し示されるgroup_idに対するタイプ‘ｏｒｅｆ’のトラック参照を持つとする；
動作点エンティティグループに含まれる全てのentity_id値は、同じＶＶＣビットストリームに属するものとする。存在するとき、OperatingPointGroupBoxは、ムービーレベルのMetaBox内のGroupsListBoxに含まれるものとし、ファイルレベル又はトラックレベルのMetaBoxに含まれるのではないとする；
６．１．３．２．構文
（外９）

６．１．３．３．セマンティクス
（外１０）

図１は、ここに開示される様々な技術が実装され得る映像処理システム１９００の一例を示すブロック図である。様々な実装は、システム１９００のコンポーネントの一部又は全てを含み得る。システム１９００は、映像コンテンツを受信する入力１９０２を含み得る。映像コンテンツは、例えば８ビット又は１０ビットのマルチコンポーネント（多成分）ピクセル値といった、ロー（未加工）又は未圧縮のフォーマットで受信されてもよいし、あるいは圧縮又は符号化されたフォーマットで受信されてもよい。入力１９０２は、ネットワークインタフェース、周辺バスインタフェース、又はストレージインタフェースを表し得る。ネットワークインタフェースの例は、イーサネット（登録商標）、パッシブ光ネットワーク（ＰＯＮ）などの有線インタフェース、及びＷｉ－Ｆｉ（登録商標）若しくはセルラーインタフェースなどの無線インタフェースを含む。

システム１９００は、本文書に記載される様々なコーディング又は符号化方法を実装し得る符号化コンポーネント１９０４を含み得る。符号化コンポーネント１９０４は、入力１９０２から符号化コンポーネント１９０４の出力まで映像の平均ビットレートを低減させて、映像の符号化表現を生成し得る。符号化技術は、それ故に、映像圧縮技術又は映像トランスコーディング技術と呼ばれることがある。符号化コンポーネント１９０４の出力は、格納されるか、コンポーネント１９０６によって表されるように接続されて通信を介して伝送されるかし得る。入力１９０２で受信された映像の格納又は通信されるビットストリーム（又は符号化）表現は、ディスプレイインタフェース１９１０に送られるピクセル値又は表示可能映像を生成するためにコンポーネント１９０８によって使用され得る。ビットストリーム表現からユーザが見ることができる映像を生成するプロセスは、映像解凍と呼ばれることがある。また、特定の映像処理操作が“符号化”の操作又はツールとして参照されることがあるが、理解されることには、符号化のツール又は操作はエンコーダで使用され、符号化の結果を裏返す対応する復号のツール又は操作がデコーダで実行されることになる。

周辺バスインタフェース又はディスプレイインタフェースの例は、ユニバーサルシリアルバス（ＵＳＢ）又は高精細マルチメディアインタフェース（ＨＤＭＩ（登録商標））又はディスプレイポート（Displayport）などを含み得る。ストレージインタフェースの例は、ＳＡＴＡ（serial advanced technology attachment）、ＰＣＩ、ＩＤＥインタフェースなどを含む。本文書に記載される技術は、例えば携帯電話、ラップトップ、スマートフォン、又はデジタルデータ処理及び／又は映像表示を実行することが可能な他の装置などの、種々のエレクトロニクス装置にて具現化され得る。

図２は、映像処理装置３６００のブロック図である。装置３６００は、ここに記載される方法のうちの１つ以上を実装するために使用され得る。装置３６００は、スマートフォン、タブレット、コンピュータ、モノのインターネット（ＩｏＴ）受信器にて具現化され得る。装置３６００は、１つ以上のプロセッサ３６０２、１つ以上のメモリ３６０４、及び映像処理ハードウェア３６０６を含み得る。（１つ以上の）プロセッサ３６０２は、本文書に記載される１つ以上の方法を実行するように構成され得る。（１つ以上の）メモリ３６０４は、ここに記載される方法及び技術を実行するのに使用されるデータ及びコードを格納するために使用され得る。映像処理ハードウェア３６０６は、本文書に記載される一部の技術をハードウェア回路にて実装するために使用され得る。一部の実施形態において、映像処理ハードウェア３６０６は、少なくとも部分的に、例えばグラフィックス・コプロセッサといったプロセッサ３６０２に含まれ得る。

図４は、この開示の技術を利用し得る映像符号化システム１００の一例を示すブロック図である。

図４に示すように、映像符号化システム１００は、ソース装置１１０及びデスティネーション装置１２０を含み得る。ソース装置１１０は、符号化映像データを生成し、映像符号化装置として参照され得る。デスティネーション装置１２０は、ソース装置１１０によって生成された符号化映像データを復号することができ、映像復号装置として参照され得る。

ソース装置１１０は、映像ソース１１２、ビデオエンコーダ１１４、及び入力／出力（Ｉ／Ｏ）インタフェース１１６を含み得る。

映像ソース１１２は、例えば、映像キャプチャ装置、映像コンテンツプロバイダから映像データを受信するインタフェース、及び／又は映像データを生成するコンピュータグラフィックスシステム、又はそのようなソースの組み合わせなどの、ソースを含み得る。映像データは、１つ以上のピクチャを有し得る。ビデオエンコーダ１１４は、映像ソース１１２からの映像データを符号化してビットストリームを生成する。ビットストリームは、映像データの符号化表現を形成する一連のビットを含み得る。ビットストリームは、符号化ピクチャ及び関連データを含み得る。符号化ピクチャはピクチャの符号化表現である。関連データは、シーケンスパラメータセット、ピクチャパラメータセット、及び他の構文構造を含み得る。Ｉ／Ｏインタフェース１１６は、変調器／復調器（モデム）及び／又は送信器を含み得る。符号化映像データは、Ｉ／Ｏインタフェース１１６を介し、ネットワーク１３０ａを通じて直接、デスティネーション装置１２０に伝送され得る。符号化映像データはまた、デスティネーション装置１２０によるアクセスのためにストレージ媒体／サーバ１３０ｂ上に格納されてもよい。

デスティネーション装置１２０は、Ｉ／Ｏインタフェース１２６、ビデオデコーダ１２４、及び表示装置１２２を含み得る。

Ｉ／Ｏインタフェース１２６は、受信器及び／又はモデムを含み得る。Ｉ／Ｏインタフェース１２６は、ソース装置１１０又はストレージ媒体／サーバ１３０ｂから符号化映像データを取得し得る。ビデオデコーダ１２４は符号化映像データを復号し得る。表示装置１２２は、復号映像データをユーザに表示し得る。表示装置１２２は、デスティネーション装置１２０と一体化されてもよいし、あるいは、外部表示装置とインタフェースするように構成されたデスティネーション装置１２０の外部にあってもよい。

ビデオエンコーダ１１４及びビデオデコーダ１２４は、例えばハイエフィシェンシビデオコーディング（ＨＥＶＣ）標準、バーサタイルビデオコーディング（ＶＶＣ）標準、及び他の現行の及び／又は将来の標準などの、映像圧縮標準に従って動作し得る。

図５は、図４に示したシステム１００内のビデオエンコーダ１１４とし得るものであるビデオエンコーダ２００の一例を示すブロック図である。

ビデオエンコーダ２００は、この開示の技術のうちのいずれか又は全てを実行するように構成され得る。図５の例において、ビデオエンコーダ２００は、複数の機能コンポーネントを含んでいる。この開示に記載される技術は、ビデオエンコーダ２００の様々なコンポーネントの間で共有され得る。一部の例において、プロセッサが、この開示に記載される技術のうちのいずれか又は全てを実行するように構成され得る。

ビデオエンコーダ２００の機能コンポーネントは、分割ユニット２０１と、モード選択ユニット２０３、動き推定ユニット２０４、動き補償ユニット２０５、及びイントラ予測ユニット２０６を含み得る予測ユニット２０２と、残差生成ユニット２０７と、変換ユニット２０８と、量子化ユニット２０９と、逆量子化ユニット２１０と、逆変換ユニット２１１と、再構成ユニット２１２と、バッファ２１３と、エントロピー符号化ユニット２１４とを含み得る。

他の例において、ビデオエンコーダ２００は、より多くの、より少ない、又は異なる機能コンポーネントを含んでもよい。一例において、予測ユニット２０２は、イントラブロックコピー（ＩＢＣ）ユニットを含んでいてもよい。ＩＢＣユニットは、少なくとも１つの参照ピクチャが、現在映像ブロックが位置するところのピクチャである、というＩＢＣモードで予測を実行し得る。

また、例えば動き推定ユニット２０４及び動き補償ユニット２０５などの一部のコンポーネントは、図５の例では説明の目的で別々に表されているが、高度に集積されることができる。

分割ユニット２０１は、ピクチャを１つ以上の映像ブロックに分割し得る。ビデオエンコーダ２００及びビデオデコーダ３００は、様々な映像ブロックサイズをサポートし得る。

モード選択ユニット２０３は、例えば誤差結果に基づいて、イントラ又はインターである複数の符号化モードのうちの１つを選択し、得られたイントラ又はインター符号化ブロックを、残差ブロックデータを生成する残差生成ユニット２０７と、参照ピクチャとしての使用のために符号化ブロックを再構成する再構成ユニット２１２とに提供し得る。一部の例において、モード選択ユニット２０３は、予測がインター予測信号及びイントラ予測信号に基づくものである組み合わせイントラ・インター予測（combination of intra and inter predication；ＣＩＩＰ）モードを選択してもよい。モード選択ユニット２０３はまた、インター予測の場合に、ブロックに対する動きベクトルの分解能（例えば、サブピクセル又は整数ピクセルの精度）を選択し得る。

現在映像ブロックに対してインター予測を実行するために、動き推定ユニット２０４が、バッファ２１３からの１つ以上の参照フレームを現在映像ブロックと比較することによって、現在映像ブロックについての動き情報を生成し得る。動き補償ユニット２０５が、現在映像ブロックに関連付けられたピクチャ以外の、バッファ２１３からのピクチャの動き情報及び復号サンプルに基づいて、現在映像ブロックについての予測映像ブロックを決定し得る。

動き推定ユニット２０４及び動き補償ユニット２０５は、例えば、現在映像ブロックがＩスライス内にあるか、Ｐスライス内にあるか、それともＢスライス内にあるかに応じて、現在映像ブロックに対して異なる演算を実行し得る。

一部の例において、動き推定ユニット２０４は、現在映像ブロックに対して片方向予測を実行することができ、動き推定ユニット２０４は、現在映像ブロックに対する参照映像ブロックについてリスト０又はリスト１の参照ピクチャを探索し得る。そして、動き推定ユニット２０４は、参照映像ブロックを含んだリスト０又はリスト１内の参照ピクチャを指し示す参照インデックスと、現在映像ブロックと参照映像ブロックとの間の空間変位を指し示す動きベクトルとを生成し得る。動き推定ユニット２０４は、現在映像ブロックの動き情報として、上記参照インデックスと、予測方向インジケータと、上記動きベクトルとを出力し得る。現在映像ブロックの動き情報によって示される参照映像ブロックに基づいて、動き補償ユニット２０５が現在ブロックの予測映像ブロックを生成し得る。

他の例において、動き推定ユニット２０４は、現在映像ブロックに対して双方向予測を実行することができ、動き推定ユニット２０４は、現在映像ブロックに対する参照映像ブロックについてリスト０内の参照ピクチャを探索し得るとともに、現在映像ブロックに対するもう１つの参照映像ブロックについてリスト１内の参照ピクチャも探索し得る。そして、動き推定ユニット２０４は、参照映像ブロックを含んだリスト０内の及びリスト１内の参照ピクチャを指し示す参照インデックスと、それら参照映像ブロックと現在映像ブロックとの間の空間変位を指し示す動きベクトルとを生成し得る。動き推定ユニット２０４は、現在映像ブロックの動き情報として、それら参照インデックスと、現在映像ブロックの上記動きベクトルとを出力し得る。現在映像ブロックの動き情報によって示される参照映像ブロックに基づいて、動き補償ユニット２０５が現在ブロックの予測映像ブロックを生成し得る。

一部の例において、動き推定ユニット２０４は、デコーダの復号処理のために、動き情報の完全なセットを出力し得る。

一部の例において、動き推定ユニット２０４は、現在映像についての動き情報の完全なセットを出力しなくてもよい。むしろ、動き推定ユニット２０４は、別の映像ブロックの動き情報を参照して現在映像ブロックの動き情報をシグナリングしてもよい。例えば、動き推定ユニット２０４は、現在映像ブロックの動き情報が隣接映像ブロックの動き情報と十分に似ていると判定し得る。

一例において、動き推定ユニット２０４は、現在映像ブロックに関連付けられる構文構造内で、現在映像ブロックが別の映像ブロックと同じ動き情報を持つことをビデオデコーダ３００に示す値を指し示し得る。

他の一例において、動き推定ユニット２０４は、現在映像ブロックに関連付けられる構文構造内で、別の映像ブロックと動きベクトル差（ＭＶＤ）とを特定してもよい。動きベクトル差は、現在映像ブロックの動きベクトルと、指し示される映像ブロックの動きベクトルとの間の差を示す。ビデオデコーダ３００は、指し示された映像ブロックの動きベクトルと動きベクトル差とを用いて、現在映像ブロックの動きベクトルを決定し得る。

上述のように、ビデオエンコーダ２００は、動きベクトルを予測的にシグナリングし得る。ビデオエンコーダ２００によって実装され得る予測的シグナリング技術の２つの例は、アドバンスト動きベクトル予測（ＡＭＶＰ）及びマージモードシグナリングを含む。

イントラ予測ユニット２０６は、現在映像ブロックに対してイントラ予測を実行し得る。イントラ予測ユニット２０６が現在映像ブロックに対してイントラ予測を実行するとき、イントラ予測ユニット２０６は、同じピクチャ内の他の映像ブロックの復号サンプルに基づいて、現在映像ブロックについての予測データを生成し得る。現在映像ブロックについての予測データは、予測映像ブロックと様々な構文要素とを含み得る。

残差生成ユニット２０７は、現在映像ブロックの（１つ以上の）予測映像ブロックを現在映像ブロックから差し引くことによって（例えば、マイナス符号によって示される）、現在映像ブロックについての残差データを生成し得る。現在映像ブロックの残差データは、現在映像ブロック内のサンプルの異なるサンプル成分に対応する残差映像ブロックを含み得る。

他の例では、例えばスキップモードにおいて、現在映像ブロックのために現在映像ブロックについての残差データが存在しないことがあり、残差生成ユニット２０７は減算演算を実行しないことがある。

変換処理ユニット２０８は、現在映像ブロックに関連する残差映像ブロックに１つ以上の変換を適用することによって、現在映像ブロックについての１つ以上の変換係数映像ブロックを生成し得る。

変換処理ユニット２０８が現在映像ブロックに関する変換係数映像ブロックを生成した後、量子化ユニット２０９が、現在映像ブロックに関する変換係数映像ブロックを、現在映像ブロックに関する１つ以上の量子化パラメータ（ＱＰ）値に基づいて量子化し得る。

逆量子化ユニット２１０及び逆変換ユニット２１１が、変換係数映像ブロックに、それぞれ、逆量子化及び逆変換を適用して、変換係数映像ブロックから残差映像ブロックを再構成し得る。再構成ユニット２１２が、再構成された残差映像ブロックを、予測ユニット２０２によって生成された１つ以上の予測映像ブロックからの対応するサンプルに足し合わせて、バッファ２１３に記憶される現在ブロックに関する再構成映像ブロックを生成し得る。

再構成ユニット２１２が映像ブロックを再構成した後、映像ブロック内の映像ブロッキングアーチファクトを低減させるために、ループフィルタリング演算が実行され得る。

エントロピー符号化ユニット２１４が、ビデオエンコーダ２００の他の機能コンポーネントからデータを受信し得る。エントロピー符号化ユニット２１４がデータを受信すると、エントロピー符号化ユニット２１４は、１つ以上のエントロピー符号化演算を実行してエントロピー符号化データを生成し、そして、エントロピー符号化データを含むビットストリームを出力し得る。

図６は、図４に示したシステム１００内のビデオデコーダ１２４とし得るものであるビデオデコーダ３００の一例を示すブロック図である。

ビデオデコーダ３００は、この開示の技術のうちのいずれか又は全てを実行するように構成され得る。図６の例において、ビデオデコーダ３００は、複数の機能コンポーネントを含んでいる。この開示に記載される技術は、ビデオデコーダ３００の様々なコンポーネントの間で共有され得る。一部の例において、プロセッサが、この開示に記載される技術のうちのいずれか又は全てを実行するように構成され得る。

図６の例において、ビデオデコーダ３００は、エントロピー復号ユニット３０１、動き補償ユニット３０２、イントラ予測ユニット３０３、逆量子化ユニット３０４、逆変換ユニット３０５、再構成ユニット３０６、及びバッファ３０７を含んでいる。ビデオデコーダ３００は、一部の例において、ビデオエンコーダ２００（図５）に関して説明した符号化パスに対して概ね逆の復号パスを実行し得る。

エントロピー復号ユニット３０１が符号化ビットストリームを取り出し得る。符号化ビットストリームは、エントロピー符号化された映像データ（例えば、映像データの符号化ブロック）を含み得る。エントロピー復号ユニット３０１はエントロピー符号化映像データを復号することができ、エントロピー復号された映像データから、動き補償ユニット３０２が、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス、及び他のモーション情報を含む動き情報を決定し得る。動き補償ユニット３０２は、例えば、ＡＭＶＰ及びマージモードを実行することによって、そのような情報を決定し得る。

動き補償ユニット３０２は、場合により補間フィルタに基づく補間を実行して、動き補償ブロックを生成し得る。サブピクセル精度で使用される補間フィルタに関する識別子が構文要素に含められ得る。

動き補償ユニット３０２は、映像ブロックの符号化中にビデオエンコーダ２００によって使用された補間フィルタを使用して、参照ブロックのサブ整数ピクセルに対する補間値を計算し得る。動き補償ユニット３０２は、ビデオエンコーダ２００によって使用された補間フィルタを、受信した構文情報に従って決定し、その補間フィルタを用いて予測ブロックを生成し得る。

動き補償ユニット３０２は、構文情報の一部を用いて、符号化映像シーケンスのフレーム及び／又はスライスを符号化するのに使用されるブロックのサイズ、符号化映像シーケンスのピクチャの各マクロブロックがどのように分割されるかを記述するパーティション情報、各パーティションがどのように符号化されるかを指し示すモード、各インター符号化ブロックに関する１つ又は複数の参照フレーム（及び参照フレームリスト）、及び符号化映像シーケンスを復号するための他の情報を決定し得る。

イントラ予測ユニット３０３は、例えばビットストリーム内で受信した、イントラ予測モードを用いて、空間的に隣接するブロックから予測ブロックを形成し得る。逆量子化ユニット３０３が、ビットストリーム内で提供されてエントロピー復号ユニット３０１によって復号された量子化された映像ブロック係数を逆量子化する、すなわち、量子化解除する。逆変換ユニット３０３が逆変換を適用する。

再構成ユニット３０６が、残差ブロックを、動き補償ユニット３０２又はイントラ予測ユニット３０３によって生成された対応する予測ブロックと足し合わせて、復号ブロックを形成し得る。望まれる場合、ブロックアーチファクトを除去するために復号ブロックをフィルタリングするよう、デブロッキングフィルタも適用され得る。そして、復号映像ブロックがバッファ３０７に格納され、それが、後の動き補償／イントラ予測のための参照ブロックを提供し、また、表示装置上での提示のための復号映像を生成する。

次に、一部の実施形態によって好適とされるソリューションのリストを提供する。

第１セットのソリューションを以下に提供する。以下のソリューションは、前セクション（例えば、項目１）で議論された技術の実施形態例を示す。

１．ビジュアルメディア処理方法（例えば、図３に示す方法７００）であって、ビジュアルメディアデータと、該ビジュアルメディアデータのビットストリーム表現を格納するファイルと、の間での変換を、フォーマットルールに従って実行するステップ（７０２）、を有し、前記フォーマットルールは、プロファイル－ティア－レベルが前記ファイル内で指し示されるかを指し示す第１レコードが、前記ビジュアルメディアデータのクロマフォーマットを指し示す第２レコード及び／又は前記ビジュアルメディアデータを表現するのに使用されるビット深度を指し示す第３レコードが前記ファイルに含められるかを制御することを規定する、方法。

以下のソリューションは、前セクション（例えば、項目２、４）で議論された技術の実施形態例を示す。

１．ビジュアルメディア処理方法であって、ビジュアルメディアデータと、該ビジュアルメディアデータのビットストリーム表現を格納するファイルと、の間での変換を、フォーマットルールに従って実行するステップ、を有し、前記ビットストリーム表現はシングルレイヤビットストリームであり、前記フォーマットルールは、前記ファイルに格納される前記シングルレイヤビットストリームに対する制約を規定する、方法。

２．前記制約は、前記ファイルのサンプルに含まれる映像符号化層ネットワーク抽象化層ユニットによって参照される１つ以上のシーケンスパラメータにおいて指し示される１つ以上のクロマフォーマット値が相等しいというものである、ソリューション１の方法。

３．前記制約は、前記ファイルのサンプルに含まれる映像符号化層ネットワーク抽象化層ユニットによって参照される１つ以上のシーケンスパラメータにおいて指し示される１つ以上のビット深度値が相等しいというものである、ソリューション１の方法。

以下のソリューションは、前セクション（例えば、項目３、５）で議論された技術の実施形態例を示す。

１．ビジュアルメディア処理方法であって、ビジュアルメディアデータと、該ビジュアルメディアデータのビットストリーム表現を格納するファイルと、の間での変換を、フォーマットルールに従って実行するステップ、を有し、前記ビットストリーム表現はマルチレイヤビットストリームであり、前記フォーマットルールは、前記ファイルに格納される前記マルチレイヤビットストリームに対する制約を規定する、方法。

２．前記制約は、クロマフォーマットの値が、当該サンプルエントリ記述が適用される全ての符号化映像シーケンスについての出力レイヤセットのサンプルエントリ記述にて特定されるクロマフォーマットの最大値に等しく設定されるというものである、ソリューション１の方法。

３．前記制約は、ビット深度の値が、当該サンプルエントリ記述が適用される全ての符号化映像シーケンスについての出力レイヤセットのサンプルエントリ記述にて特定されるビット深度の最大値に等しく設定されるというものである、ソリューション１の方法。

８．前記変換は、前記ビジュアルメディアデータのビットストリーム表現を生成し、前記ファイルに前記フォーマットルールに従って前記ビットストリーム表現を格納することを有する、ソリューション１乃至７のいずれかの方法。

９．前記変換は、前記フォーマットルールに従って前記ファイルを構文解析して、前記ビジュアルメディアデータを復元することを有する、ソリューション１乃至７のいずれかの方法。

１０．ソリューション１乃至９のいずれかに記載の方法を実施するように構成されたプロセッサを有する映像復号装置。

１１．ソリューション１乃至９のいずれかに記載の方法を実施するように構成されたプロセッサを有する映像符号化装置。

１２．コンピュータコードを格納したコンピュータプログラムプロダクトであって、前記コードは、プロセッサによって実行されるときに、該プロセッサに、ソリューション１乃至９のいずれかに記載の方法を実施させる、コンピュータプログラムプロダクト。

１３．ソリューション１乃至９のいずれかに従って生成されるファイルフォーマットにビットストリームが準拠するコンピュータ読み取り可能媒体。

１４．本文書に記載された方法、装置又はシステム。ここに記載されたソリューションにおいて、エンコーダは、フォーマットルールに従って符号化表現を生成することによってフォーマットルールに適合することができる。ここに記載されたソリューションにおいて、デコーダは、フォーマットルールを使用することで、フォーマットルールに従った構文要素の存在及び不存在の知識を用いて符号化表現内の構文要素を構文解析して、復号映像を生成することができる。

第２セットのソリューションは、前セクション（例えば、項目１乃至５）で議論された技術の実施形態例を提供する。

１．ビジュアルメディアデータを処理する方法（例えば、図８に示す方法８００）であって、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ８０２、を有し、前記フォーマットルールは、トラックが特定の出力レイヤセットに対応するビットストリームを含むかを指し示す第１要素が、該トラックのクロマフォーマットを指し示す第２要素及び／又は該トラックのビット深度情報を指し示す第３要素が該トラックのコンフィギュレーションレコードに含められるかを、制御するかを規定する、方法。

２．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記ビットストリームを含むことを前記第１要素が指し示すことに応答して、前記第２要素及び／又は前記第３要素を含めるように規定する、ソリューション１の方法。

３．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記ビットストリームを含まないことが許されることを前記第１要素が指し示すことに応答して、前記第２要素及び／又は前記第３要素を省略するように規定する、ソリューション１の方法。

４．前記フォーマットルールは更に、コンフィギュレーションレコードが適用されるビットストリームがマルチレイヤビットストリームであるかに依存する構文制約を規定する、ソリューション１の方法。

５．前記フォーマットルールは更に、前記ビットストリームが前記マルチレイヤビットストリームでないことに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のクロマフォーマット値が相等しいというものである、ことを規定する、ソリューション４の方法。

６．前記フォーマットルールは更に、前記コンフィギュレーションレコードにおいて指し示されるクロマフォーマット値が前記１つ以上のクロマフォーマット値に等しいことを規定する、ソリューション５の方法。

７．前記フォーマットルールは更に、前記ビットストリームが前記マルチレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードにおいて指し示されるクロマフォーマットの値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのクロマフォーマット値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるクロマフォーマットの最大値、に等しく設定されるというものである、ことを規定する、ソリューション４の方法。

８．前記フォーマットルールは更に、前記ビットストリームが前記マルチレイヤビットストリームでないことに応答して、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のビット深度情報値が相等しいことを規定する、ソリューション４の方法。

９．前記フォーマットルールは更に、前記コンフィギュレーションレコードにおいて指し示されるビット深度情報値が前記１つ以上のビット深度情報値に等しいことを規定する、ソリューション８の方法。

１０．前記フォーマットルールは更に、前記ビットストリームが前記マルチレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードにおいて指し示されるビット深度情報値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのビット深度情報値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるビット深度情報の最大値、に等しく設定されるというものである、ことを規定する、ソリューション４の方法。

１１．前記変換は、前記ビジュアルメディアファイルを生成し、前記ビジュアルメディアファイルに前記フォーマットルールに従って前記１つ以上のビットストリームを格納することを有する、ソリューション１乃至１０のいずれか一の方法。

１２．前記変換は、前記フォーマットルールに従って前記ビジュアルメディアファイルを構文解析して、前記１つ以上のビットストリームを再構成することを有する、ソリューション１乃至１０のいずれか一の方法。

１３．ビジュアルメディアデータを処理する装置であって、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ、を有する方法を実行するように構成されたプロセッサを有し、前記フォーマットルールは、（１）トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むか、及び／又は（２）コンフィギュレーションレコードが適用されるビットストリームがマルチレイヤビットストリームであるかに応じて、クロマフォーマット構文要素及び／又はビット深度構文要素の存在、又は前記クロマフォーマット構文要素及び／又は前記ビット深度構文要素に対する構文制約を規定する、装置。

１４．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記特定のビットストリームを含む場合に、前記トラックの前記コンフィギュレーションレコードに前記クロマフォーマット構文要素及び／又は前記ビット深度構文要素を含めるように規定する、ソリューション１３の装置。

１５．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記ビットストリームを含まないことが許される場合に、前記トラックの前記コンフィギュレーションレコードから前記クロマフォーマット構文要素及び／又は前記ビット深度構文要素を省くように規定する、ソリューション１３の装置。

１６．前記フォーマットルールは、前記ビットストリームが前記マルチレイヤビットストリームでないことに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のクロマフォーマット構文要素の値が相等しいというものである、ことを規定する、ソリューション１３の装置。

１７．前記フォーマットルールは、前記ビットストリームが前記マルチレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードにおいて指し示される前記クロマフォーマットの値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのクロマフォーマット値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるクロマフォーマットの最大値、に等しく設定されるというものである、ことを規定する、ソリューション１３の装置。

１８．前記フォーマットルールは、前記ビットストリームが前記マルチレイヤビットストリームでないことに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のビット深度構文要素の値が相等しいというものである、ことを規定する、ソリューション１３の装置。

１９．前記フォーマットルールは、前記ビットストリームが前記マルチレイヤビットストリームであることに応答して、前記構文制約が、前記ビット深度構文要素の値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのビット深度情報値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるビット深度情報の最大値、に等しく又はそれより大きく設定されるというものである、ことを規定する、ソリューション１３の装置。

２０．命令を格納した非一時的なコンピュータ読み取り可能記録媒体であって、前記命令は、プロセッサに、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行させ、前記フォーマットルールは、（１）トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むか、及び／又は（２）コンフィギュレーションレコードが適用されるビットストリームがマルチレイヤビットストリームであるかに応じて、クロマフォーマット構文要素及び／又はビット深度構文要素の存在、又は前記クロマフォーマット構文要素及び／又は前記ビット深度構文要素に対する構文制約を規定する、非一時的なコンピュータ読み取り可能記録媒体。

２１．映像処理装置によって実行される方法により生成されたビットストリームを格納した非一時的なコンピュータ読み取り可能記録媒体であって、前記方法は、ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルを、フォーマットルールに従って生成するステップを有し、前記フォーマットルールは、（１）トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むか、及び／又は（２）コンフィギュレーションレコードが適用されるビットストリームがマルチレイヤビットストリームであるかに応じて、クロマフォーマット構文要素及び／又はビット深度構文要素の存在、又は前記クロマフォーマット構文要素及び／又は前記ビット深度構文要素に対する構文制約を規定する、非一時的なコンピュータ読み取り可能記録媒体。

２２．ソリューション１乃至１２のいずれか一の方法を実施するように構成されたプロセッサを有する映像処理装置。

２３．１つ以上のビットストリームを含むファイルにビジュアルメディアデータを格納する方法であって、当該方法は、ソリューション１乃至１２のいずれか一の方法を有し、さらに、前記１つ以上のビットストリームを非一時的なコンピュータ読み取り可能記録媒体に格納することを含む、方法。

２４．実行されるときにプロセッサにソリューション１乃至１２のいずれか一の方法を実施させるプログラムコードを格納したコンピュータ読み取り可能媒体。

２５．上述の方法のいずれかに従って生成されたビットストリームを格納したコンピュータ読み取り可能媒体。

２６．ビットストリームを格納する映像処理装置であって、ソリューション１乃至１２のいずれか一以上に記載の方法を実施するように構成された映像処理装置。

２７．ソリューション１乃至１２のいずれかに従って生成されるファイルフォーマットにビットストリームが準拠するコンピュータ読み取り可能媒体。

２８．本文書に記載された方法、装置又はシステム。

第３セットのソリューションは、前セクション（例えば、項目６）で議論された技術の実施形態例を提供する。

１．ビジュアルメディアデータを処理する方法（例えば、図９に示す方法９００）であって、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ９０２、を有し、前記フォーマットルールは、トラックのコンフィギュレーションレコードに、該トラックのピクチャ幅を指し示す第１要素及び／又は該トラックのピクチャ高さを指し示す第２要素を含めるかを、（１）該トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むかを指し示す第３要素及び／又は（２）前記コンフィギュレーションレコードがシングルレイヤビットストリーム向けであるか、に基づいて規定し、前記フォーマットルールは更に、前記第１要素及び／又は前記第２要素が、該トラックの前記コンフィギュレーションレコードに含められるときに、１６ビットを含むフィールド内で表されることを規定する、方法。

２．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記特定のビットストリームを含むことを前記第３要素が指し示すことに応答して、前記第１要素及び／又は前記第２要素を含めるように規定する、ソリューション１の方法。

３．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記特定のビットストリームを含まないことが許されることを前記第３要素が指し示すことに応答して、前記第１要素及び／又は前記第２要素を省略するように規定する、ソリューション１の方法。

４．前記フィールドは２４ビットを含む、ソリューション１の方法。

５．前記フィールドは３２ビットを含む、ソリューション１の方法。

６．前記フォーマットルールは、前記ビットストリームがシングルレイヤビットストリームであり、クロッピングウィンドウオフセットが全てゼロであり、且つピクチャがフレームであることに応答して、第１要素及び／又は第２要素を省略するように規定する、ソリューション１の方法。

７．前記フォーマットルールは更に、前記コンフィギュレーションレコードが適用されるビットストリームがシングルレイヤビットストリームであるかに基づいて、前記第１要素及び／又は前記第２要素の値に対する構文制約を規定する、ソリューション１の方法。

８．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ幅値が相等しいというものである、ことを規定する、ソリューション７の方法。

９．前記フォーマットルールは更に、前記ビットストリームを格納する前記トラックの前記第１要素の前記値が前記１つ以上のピクチャ幅値に等しいことを規定する、ソリューション８の方法。

１０．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ高さ値が相等しいことを規定する、ソリューション７の方法。

１１．前記フォーマットルールは更に、前記ビットストリームを格納する前記トラックの前記第２要素の前記値が前記１つ以上のピクチャ高さ値に等しいことを規定する、ソリューション１０の方法。

１２．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームでないことに応答して、前記構文制約が、前記第１要素の前記値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのピクチャ幅値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ幅の最大値、に等しく設定されるというものである、ことを規定する、ソリューション７の方法。

１３．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームでないことに応答して、前記構文制約が、前記第２要素の前記値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのピクチャ高さ値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ高さの最大値、に等しく設定されるというものである、ことを規定する、ソリューション７の方法。

１４．前記変換は、前記ビジュアルメディアファイルを生成し、前記ビジュアルメディアファイルに前記フォーマットルールに従って前記１つ以上のビットストリームを格納することを有する、ソリューション１乃至１３のいずれかの方法。

１５．前記変換は、前記フォーマットルールに従って前記ビジュアルメディアファイルを構文解析して、前記１つ以上のビットストリームを再構成することを有する、ソリューション１乃至１３のいずれかの方法。

１６．ビジュアルメディアデータを処理する装置であって、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ、を有する方法を実行するように構成されたプロセッサを有し、前記フォーマットルールは、トラックのコンフィギュレーションレコードに、該トラックのピクチャ幅を指し示す第１要素及び／又は該トラックのピクチャ高さを指し示す第２要素を含めるかを、（１）該トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むかを指し示す第３要素及び／又は（２）前記コンフィギュレーションレコードがシングルレイヤビットストリーム向けであるか、に基づいて規定し、前記フォーマットルールは更に、前記第１要素及び／又は前記第２要素が、該トラックの前記コンフィギュレーションレコードに含められるときに、１６ビットを含むフィールド内で表されることを規定する、装置。

１７．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記特定のビットストリームを含むことを前記第３要素が指し示すことに応答して、前記第１要素及び／又は前記第２要素を含めるように規定する、ソリューション１６の装置。

１８．前記フォーマットルールは、前記トラックが前記特定の出力レイヤセットに対応する前記特定のビットストリームを含まないことが許されることを前記第３要素が指し示すことに応答して、前記第１要素及び／又は前記第２要素を省略するように規定する、ソリューション１６の装置。

１９．前記フォーマットルールは更に、前記コンフィギュレーションレコードが適用されるビットストリームがシングルレイヤビットストリームであるかに基づいて、前記第１要素及び／又は前記第２要素の値に対する構文制約を規定する、ソリューション１の方法。

２０．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ幅値が相等しいというものである、ことを規定する、ソリューション１９の装置。

２１．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームであることに応答して、前記構文制約が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される前記ビジュアルメディアファイルのサンプルに含まれるＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ高さ値が相等しいことを規定する、ソリューション１９の装置。

２２．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームでないことに応答して、前記構文制約が、前記第１要素の前記値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのピクチャ幅値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ幅の最大値、に等しく設定されるというものである、ことを規定する、ソリューション１９の装置。

２３．前記フォーマットルールは更に、前記ビットストリームが前記シングルレイヤビットストリームでないことに応答して、前記構文制約が、前記第２要素の前記値が、前記コンフィギュレーションレコードのサンプルエントリ記述が適用される全ての符号化映像シーケンスについての全てのビデオパラメータセットにおいて指し示される全てのピクチャ高さ値のうち、あるビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ高さの最大値、に等しく設定されるというものである、ことを規定する、ソリューション１９の装置。

２４．命令を格納した非一時的なコンピュータ読み取り可能記録媒体であって、前記命令は、プロセッサに、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行させ、前記フォーマットルールは、トラックのコンフィギュレーションレコードに、該トラックのピクチャ幅を指し示す第１要素及び／又は該トラックのピクチャ高さを指し示す第２要素を含めるかを、（１）該トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むかを指し示す第３要素及び／又は（２）前記コンフィギュレーションレコードがシングルレイヤビットストリーム向けであるか、に基づいて規定し、前記フォーマットルールは更に、前記第１要素及び／又は前記第２要素が、該トラックの前記コンフィギュレーションレコードに含められるときに、１６ビットを含むフィールド内で表されることを規定する、非一時的なコンピュータ読み取り可能記録媒体。

２５．映像処理装置によって実行される方法により生成されたビットストリームを格納した非一時的なコンピュータ読み取り可能記録媒体であって、前記方法は、ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルを、フォーマットルールに従って生成するステップを有し、前記フォーマットルールは、トラックのコンフィギュレーションレコードに、該トラックのピクチャ幅を指し示す第１要素及び／又は該トラックのピクチャ高さを指し示す第２要素を含めるかを、（１）該トラックが特定の出力レイヤセットに対応する特定のビットストリームを含むかを指し示す第３要素及び／又は（２）前記コンフィギュレーションレコードがシングルレイヤビットストリーム向けであるか、に基づいて規定し、前記フォーマットルールは更に、前記第１要素及び／又は前記第２要素が、該トラックの前記コンフィギュレーションレコードに含められるときに、１６ビットを含むフィールド内で表されることを規定する、非一時的なコンピュータ読み取り可能記録媒体。

２６．ソリューション１乃至１５のいずれか一の方法を実施するように構成されたプロセッサを有する映像処理装置。

２７．１つ以上のビットストリームを含むファイルにビジュアルメディアデータを格納する方法であって、当該方法は、ソリューション１乃至１５のいずれか一の方法を有し、さらに、前記１つ以上のビットストリームを非一時的なコンピュータ読み取り可能記録媒体に格納することを含む、方法。

２８．実行されるときにプロセッサにソリューション１乃至１５のいずれか一の方法を実施させるプログラムコードを格納したコンピュータ読み取り可能媒体。

２９．上述の方法のいずれかに従って生成されたビットストリームを格納したコンピュータ読み取り可能媒体。

３０．ビットストリームを格納する映像処理装置であって、ソリューション１乃至１５のいずれか一以上に記載の方法を実施するように構成された映像処理装置。

３１．ソリューション１乃至１５のいずれかに従って生成されるファイルフォーマットにビットストリームが準拠するコンピュータ読み取り可能媒体。

第４セットのソリューションは、前セクション（例えば、項目７）で議論された技術の実施形態例を提供する。

１．ビジュアルメディアデータを処理する方法（例えば、図１０に示す方法１０００）であって、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ１００２、を有し、前記ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、前記フォーマットルールは、前記ビジュアルメディアファイルにおいて指し示される各動作点について、前記動作点レコード及び前記動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する、方法。

２．前記フォーマットルールは更に、前記第１要素、前記第２要素、前記第３要素、及び／又は前記第４要素が、出力レイヤセットインデックスによって特定される出力レイヤセットに関するプロファイル、レベル、及びティア構造のゼロベースインデックスを差し示す第５要素の直後にあることを規定する、ソリューション１の方法。

３．前記フォーマットルールは更に、ビットストリームに関連する動作点に適用される前記第１要素の値、前記第２要素の値、前記第３要素の値、及び／又は前記第４要素の値に対する構文制約を、前記動作点が単一のレイヤのみを含むかに基づいて規定する、ソリューション１の方法。

４．前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のクロマフォーマット値が相等しいというものである、ことを規定する、ソリューション３の方法。

５．前記フォーマットルールは更に、前記第１要素の前記値が前記１つ以上のクロマフォーマット値に等しいことを規定する、ソリューション４の方法。

６．前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第１要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるクロマフォーマット値、に等しく設定されるというものである、ことを規定する、ソリューション３の方法。

７．前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のビット深度情報値が相等しいというものである、ことを規定する、ソリューション３の方法。

８．前記フォーマットルールは更に、前記第２要素の前記値が前記１つ以上のビット深度情報値に等しいことを規定する、ソリューション７の方法。

９．前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第２要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるビット深度情報値、に等しく設定されるというものである、ことを規定する、ソリューション３の方法。

１０．前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ幅値が相等しいというものである、ことを規定する、ソリューション３の方法。

１１．前記フォーマットルールは更に、前記第３要素の前記値が前記１つ以上のピクチャ幅値に等しいことを規定する、ソリューション１０の方法。

１２．前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第３要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ幅値、に等しく設定されるというものである、ことを規定する、ソリューション３の方法。

１３．前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ高さ値が相等しいというものである、ことを規定する、ソリューション３の方法。

１４．前記フォーマットルールは更に、前記第４要素の前記値が前記１つ以上のピクチャ高さ値に等しいことを規定する、ソリューション１３の方法。

１５．前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第４要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ高さ値、に等しく設定されるというものである、ことを規定する、ソリューション３の方法。

１６．前記変換は、ビジュアルメディアファイルを生成し、該ビジュアルメディアファイルに前記フォーマットルールに従って前記１つ以上のビットストリームを格納することを有する、ソリューション１乃至１５のいずれか一の方法。

１７．前記変換は、前記フォーマットルールに従って前記ビジュアルメディアファイルを構文解析して、前記１つ以上のビットストリームを再構成することを有する、ソリューション１乃至１５のいずれか一の方法。

１８．ビジュアルメディアデータを処理する装置であって、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ、を有する方法を実行するように構成されたプロセッサを有し、前記ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、前記フォーマットルールは、前記ビジュアルメディアファイルにおいて指し示される各動作点について、前記動作点レコード及び前記動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する、装置。

１９．前記フォーマットルールは更に、前記第１要素、前記第２要素、前記第３要素、及び／又は前記第４要素が、出力レイヤセットインデックスによって特定される出力レイヤセットに関するプロファイル、レベル、及びティア構造のゼロベースインデックスを差し示す第５要素の直後にあることを規定する、ソリューション１８の装置。

２０．前記フォーマットルールは更に、ビットストリームに関連する動作点に適用される前記第１要素の値、前記第２要素の値、前記第３要素の値、及び／又は前記第４要素の値に対する構文制約を、前記動作点が単一のレイヤのみを含むかに基づいて規定する、ソリューション１８の装置。

２１．命令を格納した非一時的なコンピュータ読み取り可能記録媒体であって、前記命令は、プロセッサに、ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行させ、前記ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、前記フォーマットルールは、前記ビジュアルメディアファイルにおいて指し示される各動作点について、前記動作点レコード及び前記動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する、非一時的なコンピュータ読み取り可能記録媒体。

２２．映像処理装置によって実行される方法により生成されたビットストリームを格納した非一時的なコンピュータ読み取り可能記録媒体であって、前記方法は、ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルを、フォーマットルールに従って生成するステップを有し、前記ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、前記フォーマットルールは、前記ビジュアルメディアファイルにおいて指し示される各動作点について、前記動作点レコード及び前記動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する、非一時的なコンピュータ読み取り可能記録媒体。

２６．ソリューション１乃至１７のいずれか一の方法を実施するように構成されたプロセッサを有する映像処理装置。

２７．１つ以上のビットストリームを含むファイルにビジュアルメディアデータを格納する方法であって、当該方法は、ソリューション１乃至１７のいずれか一の方法を有し、さらに、前記１つ以上のビットストリームを非一時的なコンピュータ読み取り可能記録媒体に格納することを含む、方法。

２８．実行されるときにプロセッサにソリューション１乃至１７のいずれか一の方法を実施させるプログラムコードを格納したコンピュータ読み取り可能媒体。

３０．ビットストリームを格納する映像処理装置であって、ソリューション１乃至１７のいずれか一以上に記載の方法を実施するように構成された映像処理装置。

３１．ソリューション１乃至１７のいずれかに従って生成されるファイルフォーマットにビットストリームが準拠するコンピュータ読み取り可能媒体。

ソリューション例において、ビジュアルメディアデータは映像又はピクチャに対応する。本文書において、用語“映像処理”は、映像符号化、映像復号、映像圧縮又は映像解凍を指し得る。例えば、映像圧縮アルゴリズムは、映像のピクチャ表現から対応するビットストリーム表現への変換の間に適用されることができ、その逆もまた然りである。現在映像ブロックのビットストリーム表現は、例えば、構文によって定められるように、ビットストリーム内で同位置にあるビット又は異なる場所に広がったビットのいずれかに対応し得る。例えば、マクロブロックは、変換されて符号化される誤差残差値に関して、また、ビットストリーム内のヘッダ及び他のフィールド内のビットも用いて、符号化され得る。また、変換において、デコーダは、上のソリューションに記載されるように、決定に基づいて、あるフィールドが存在し得るか、それとも存在しないかという知識を用いてビットストリームを構文解析し得る。同様に、エンコーダは、特定の構文フィールドが含められるべきか否かを決定し、それら構文フィールドを含めること又はそれら構文フィールドを符号化表現から除外することによって然るべく符号化表現を生成し得る。

この文書に記述される、開示される及び他のソリューション、例、実施形態、モジュール及び機能動作は、この文書に開示されている構造及びそれらに構造的に均等なものを含め、デジタル電子回路、又はコンピュータソフトウェア、ファームウェア、若しくはハードウェアにて、あるいはこれらのうちの１つ以上の組み合わせにて実施されることができる。開示される及び他の実施形態は、１つ以上のコンピュータプログラムプロダクトとして実装されることができ、すなわち、データ処理装置による実行のための、又はデータ処理装置の動作を制御するための、コンピュータ読み取り可能媒体にエンコードされたコンピュータプログラム命令の１つ以上のモジュールとして実装されることができる。コンピュータ読み取り可能媒体は、機械読み取り可能記憶装置、機械読み取り可能記憶基板、メモリ装置、機械読み取り可能な伝搬信号を生じさせる物質の組成、又はそれらのうちの１つ以上の組み合わせとすることができる。用語“データ処理装置”は、例として、プログラマブルプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含め、データを処理するあらゆる装置、デバイス、及び機械を包含する。装置は、ハードウェアに加えて、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はそれらのうちの１つ以上の組み合わせを構成するコードといった、問題としているコンピュータプログラムのための実行環境を作り出すコードを含むことができる。伝搬される信号は、好適な受信器装置への伝送のために情報をエンコードするように生成された、例えばマシン生成された電気信号、光信号、又は電磁信号といった、人工的に生成された信号である。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる）は、コンパイル型又はインタープリタ型の言語を含め、如何なる形態のプログラミング言語で記述されてもよく、また、スタンドアロンプログラムとして、又はコンピューティング環境での使用に適したモジュール、コンポーネント、サブルーチン、若しくは他のユニットとして、を含め、如何なる形態で展開されてもよい。コンピュータプログラムは、必ずしもファイルシステム内のファイルに対応するわけではない。プログラムは、他のプログラム若しくはデータを保持するファイルの一部（例えば、マークアップ言語文書に格納された１つ以上のスクリプト）に格納されてもよいし、問題としているプログラムに専用の単一ファイルに格納されてもよいし、あるいは、複数の連携ファイル（例えば、１つ以上のモジュール、サブプログラム、又はコードの部分を格納するファイル）に格納されてもよい。コンピュータプログラムは、１つのコンピュータ上で実行されるように展開されてもよいし、あるいは、一箇所に配置された、又は複数箇所に分散されて通信ネットワークによって相互接続された、複数のコンピュータ上で実行されるように展開されてもよい。

この文書に記載されるプロセス及び論理フローは、入力データについて演算して出力を生成することによって機能を実行するよう、１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって実行されることができる。これらのプロセス及び論理フローはまた、例えばＦＰＧＡ（フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（特定用途向け集積回路）といった専用の論理回路によって実行されることもでき、また、装置も、そのような専用の論理回路として実装されることができる。

コンピュータプログラムの実行に適したプロセッサは、例として、汎用及び専用の双方のマイクロプロセッサ、及び任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般に、プロセッサは、読み出し専用メモリ若しくはランダムアクセスメモリ又はこれらの両方から命令及びデータを受信する。コンピュータの必須要素は、命令を実行するためのプロセッサと、命令及びデータを格納する１つ以上のメモリデバイスである。一般に、コンピュータはまた、例えば磁気ディスク、磁気光ディスク、又は光ディスクといった、データを格納するための１つ以上の大容量ストレージ装置を含み、あるいは、大容量ストレージ装置からデータを受信したり、それにデータを転送したりするように動作的に結合される。しかしながら、コンピュータは、そのような装置を有する必要はない。コンピュータプログラム命令及びデータを格納するのに適したコンピュータ読み取り可能媒体は、例として、例えばＥＰＲＯＭ、ＥＥＰＲＯＭ、及びフラッシュメモリデバイスといった半導体メモリデバイス、例えば内部ハードディスク又はリムーバブルディスクといった磁気ディスク、磁気光ディスク、並びにＣＤＲＯＭ及びＤＶＤ－ＲＯＭディスクを含め、あらゆる形態の不揮発性メモリ、媒体及びメモリデバイスを含む。プロセッサ及びメモリは、専用の論理回路によって補われたり、それに組み込まれたりしてもよい。

この特許文書は数多くの詳細が含んでいるが、それらは、いずれかの主題又は特許請求され得るものの範囲についての限定として解釈されるべきでなく、むしろ、特定の技術の特定の実施形態に特有とし得る機構の説明として解釈されるべきである。別々の実施形態の文脈でこの特許文書に記載されている特定の複数の機構が、単一の実施形態にて組み合わせて実装されることもできる。逆に、単一の実施形態の文脈で説明されている種々の機構が、複数の実施形態にて別々に、又は何らかの好適なサブコンビネーションで実装されることもできる。さらには、複数の機構が、特定の組み合わせにて作用するものとして上述され、さらには当初はそのように特許請求されていることがあり得るが、場合によって、特許請求されている組み合わせからの１以上の機構を組み合わせから除くこともでき、また、特許請求されている組み合わせをサブコンビネーション又はサブコンビネーションのバリエーションへと導いてもよい。

同様に、図面には処理が特定の順序で示されるが、このことは、所望の結果を達成するために、それらの動作が図示される特定の順序で若しくは順番に実行されること、又は図示される全ての処理が実行されることを要求するものとして理解されるべきでない。また、この特許文書に記載されている実施形態における種々のシステムコンポーネントの分離は、全ての実施形態においてそのような分離を必要とするものとして理解されるべきでない。

ほんの少しの実装及び例を記載したのみであり、この特許文書に記載及び図示されているものに基づいて、他の実装、拡張及び変形が行われ得る。

Claims

ビジュアルメディアデータを処理する方法であって、
ビジュアルメディアデータと、該ビジュアルメディアデータの１つ以上のビットストリームを格納する１つ以上のトラックを含むビジュアルメディアファイルと、の間での変換を、フォーマットルールに従って実行するステップ、
を有し、
前記ビジュアルメディアファイルは、動作点レコード及び動作点グループボックスを含み、
前記フォーマットルールは、前記ビジュアルメディアファイルにおいて指し示される各動作点について、前記動作点レコード及び前記動作点グループボックスに、クロマフォーマットを指し示す第１要素、ビット深度情報を指し示す第２要素、最大ピクチャ幅を指し示す第３要素、及び／又は最大ピクチャ高さを指し示す第４要素を含めるかを規定する、
方法。
前記フォーマットルールは更に、前記第１要素、前記第２要素、前記第３要素、及び／又は前記第４要素が、出力レイヤセットインデックスによって特定される出力レイヤセットに関するプロファイル、レベル、及びティア構造のゼロベースインデックスを差し示す第５要素の直後にあることを規定する、請求項１に記載の方法。
前記フォーマットルールは更に、ビットストリームに関連する動作点に適用される前記第１要素の値、前記第２要素の値、前記第３要素の値、及び／又は前記第４要素の値に対する構文制約を、前記動作点が単一のレイヤのみを含むかに基づいて規定する、請求項１に記載の方法。
前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のクロマフォーマット値が相等しいというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記第１要素の前記値が前記１つ以上のクロマフォーマット値に等しいことを規定する、請求項４に記載の方法。
前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第１要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるクロマフォーマット値、に等しく設定されるというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のビット深度情報値が相等しいというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記第２要素の前記値が前記１つ以上のビット深度情報値に等しいことを規定する、請求項７に記載の方法。
前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第２要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるビット深度情報値、に等しく設定されるというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ幅値が相等しいというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記第３要素の前記値が前記１つ以上のピクチャ幅値に等しいことを規定する、請求項１０に記載の方法。
前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第３要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ幅値、に等しく設定されるというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記動作点が前記単一のレイヤを含むことに応答して、前記構文制約が、前記動作点の前記ビットストリーム内のＮＡＬ（ネットワーク抽象化層）ユニットによって参照される１つ以上のシーケンスパラメータセットにおいて指し示される１つ以上のピクチャ高さ値が相等しいというものである、ことを規定する、請求項３に記載の方法。
前記フォーマットルールは更に、前記第４要素の前記値が前記１つ以上のピクチャ高さ値に等しいことを規定する、請求項１３に記載の方法。
前記フォーマットルールは更に、前記動作点が２つ以上のレイヤを含むことに応答して、前記構文制約が、前記第４要素の前記値が、ビデオパラメータセットにおいて指し示されて、出力レイヤセットインデックスによって特定される出力レイヤセットに適用されるピクチャ高さ値、に等しく設定されるというものである、ことを規定する、請求項３に記載の方法。
前記変換は、ビジュアルメディアファイルを生成し、前記ビジュアルメディアファイルに前記フォーマットルールに従って前記１つ以上のビットストリームを格納することを有する、請求項１乃至１５のいずれか一項に記載の方法。
前記変換は、前記フォーマットルールに従って前記ビジュアルメディアファイルを構文解析して、前記１つ以上のビットストリームを再構成することを有する、請求項１乃至１５のいずれか一項に記載の方法。
請求項１乃至１７のいずれか一項に記載の方法を実施するように構成されたプロセッサを有する映像処理装置。
実行されるときにプロセッサに請求項１乃至１７のいずれか一項に記載の方法を実施させるプログラムコードを格納したコンピュータ読み取り可能媒体。