JP2022164946A

JP2022164946A - 共通メディアアプリケーションフォーマットでのビデオユーザビリティ情報

Info

Publication number: JP2022164946A
Application number: JP2022068046A
Authority: JP
Inventors: ワンイェ－クイ; Ye-Kui Wang
Original assignee: LEMON Inc
Current assignee: LEMON Inc
Priority date: 2021-04-18
Filing date: 2022-04-18
Publication date: 2022-10-28
Anticipated expiration: 2042-04-18
Also published as: KR20220143986A; US11962808B2; EP4075811A1; US20220337879A1; EP4075812A1; US20220337860A1; US20220337878A1; JP2022164944A; CN115225910A; JP7305001B2; JP7414882B2; JP7305000B2; JP7413435B2; KR20220143988A; CN115225908A; KR20220143985A; EP4075813A1; EP4075810A1; CN115225907A; JP2022164945A

Abstract

【課題】ビデオデータを処理するメカニズムが開示される。【解決手段】バーサタイルビデオコーディング（ＶＶＣ）共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報が決定される。規則は、ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことを定める。ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間で変換が行われる。【選択図】図４

Description

［関連出願への相互参照］
適用可能な特許法及び／又はパリ条約に従う規則に下で、本願は、２０２１年４月１８日付けで出願された米国特許仮出願第６３／１７６３１５号に対する優先権及びその利益を適宜請求するようなされたものである。法の下での全ての目的のために、上記の出願の全開示は、本願の開示の部分として参照により援用される。

［技術分野］
本特許文献は、ファイルフォーマットでのデジタルオーディオビデオメディア情報の生成、記憶、及び消費に関係がある。

デジタルビデオは、インターネット及び他のデジタル通信網で使用される最大のバンド幅を占めている。ビデオを受信及び表示することができるユーザデバイスの接続数が増えるにつれて、デジタルビデオ利用に対するバンド幅要求は増え続ける可能性がある。

第１の態様は、ビデオデータを処理する方法であって、バーサタイルビデオコーディング（Versatile Video Coding，ＶＶＣ）共通メディアアプリケーションフォーマット（Common Media Application Format，ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報を決定するステップであり、規則により、前記ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ステップと、前記ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間の変換を実行するステップとを有する方法に関する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇがビデオユーザビリティ情報ペイロード（ｖｕｉ＿ｐａｙｌｏａｄ）構造に含まれる、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記ＶＶＣＣＭＡＦトラック内のビデオがプログレッシブスキャニングに従ってコーディングされることを示すよう前記ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇが１に等しい、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記規則により、前記ＳＰＳ内のビデオユーザビリティ情報インターレースソースフラグ（ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇがビデオユーザビリティ情報ペイロード（ｖｕｉ＿ｐａｙｌｏａｄ）構造に含まれる、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記ＶＶＣＣＭＡＦトラック内のビデオがインターレーシングに従ってコーディングされることを示すよう前記ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇが１に等しい、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記ＳＰＳがＶＶＣエレメンタリストリームに含まれ、該ＶＶＣエレメンタリストリームが前記ＣＭＡＦトラックに含まれる、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記変換が、前記視覚メディアデータを前記メディアデータファイルに符号化することを含む、ことを提供する。

任意に、上記の態様のいずれかで、当該態様の他の実施は、前記変換が、前記視覚メディアデータを前記メディアデータファイルから復号することを含む、ことを提供する。

第２の態様は、ビデオデータを処理する装置であって、プロセッサと、命令を有する非一時的なメモリとを有し、前記命令は、前記プロセッサによる実行時に、前記プロセッサに、バーサタイルビデオコーディング（ＶＶＣ）共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報を決定するステップであり、規則により、前記ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ステップと、前記ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間の変換を実行するステップとを実行させる、装置に関する。

第３の態様は、ビデオコーディングデバイスよって使用されるコンピュータプログラム製品を有する非一時的なコンピュータ可読媒体であって、前記コンピュータプログラム製品は、プロセッサによる実行時に、前記ビデオコーディングデバイスに、バーサタイルビデオコーディング（ＶＶＣ）共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報を決定するステップであり、規則により、前記ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ステップと、前記ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間の変換を実行するステップとを実行させるように前記非一時的なコンピュータ可読媒体に記憶されているコンピュータ実行可能命令を有する、非一時的なコンピュータ可読媒体に関する。

明りょうさのために、上記の実施形態のいずれか１つは、本開示の範囲内で新しい実施形態をもたらすように上記の他の実施形態のいずれか１つ以上と組み合わされてもよい。

これら及び他の特徴は、添付の図面及び特許請求の範囲とともに読まれる以下の詳細な説明から、より明りょうに理解されよう。

本開示のより完全な理解のために、これより、添付の図面及び詳細な説明とともに読まれる以下の簡単な説明が参照される。同じ参照番号は、同じ部分を表す。

例となる共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックを表す概略図である。例となるビデオ処理システムを示すブロック図である。例となるビデオ処理装置のブロック図である。例となるビデオ処理方法のフローチャートである。例となるビデオコーディングシステムを表すブロック図である。例となるエンコーダを表すブロック図である。例となるデコーダを表すブロック図である。例となるエンコーダの概略図である。

最初に理解されるべきは、１つ以上の実施形態の実例となる実施が以下で与えられるが、開示されているシステム及び／又は方法は、現在知られていようと、また開発されていなかろうと、任意の数の技術を用いて実装されてよい点である。開示は、本明細書で図示及び記載されている例示的な設計及び実施を含む、以下で説明されている実例となる実施、図面及び技術に決して限定されるべきではなく、添付の特許請求の範囲及びそれらの均等の全範囲の中で変更されてよい。

本特許文献は、ビデオストリーミングに関係がある。具体的に、本文献は、ファイルフォーマットでのメディアトラック及びセグメントへのビデオ符号化及びカプセル化に関する制約を指定することに関係がある。このようなファイルフォーマットには、国際標準化機構（International Organization for Standardization，ＩＳＯ）ベースメディアファイルフォーマット（base media file format）（ＩＳＯＢＭＦＦ）が含まれ得る。このようなファイルフォーマットにはまた、ＨＴＴＰによる動的適応ストリーミング（Dynamic Adaptive Streaming over hypertext transfer protocol，ＤＡＳＨ）及び／又は共通メディアアプリケーションフォーマット（Common Media Application Format，ＣＭＡＦ）のような、適応ストリーミングメディア表現フォーマットも含まれ得る。本明細書で記載されるアイデアは、ＤＡＳＨ標準規格及び関連する拡張に基づいたシステム並びに／又はＣＭＡＦ標準規格及び関連する拡張に基づいたシステムのような、メディアストリーミングシステムのために、個々に又は様々な組み合わせで適用されてよい。

本開示は、次の略語を含む。適応色変換（Adaptive color transform，ＡＣＴ）、適応ループフィルタ（Adaptive Loop Filter，ＡＬＦ）、適応動きベクトル分解（Adaptive Motion Vector Resolution，ＡＭＶＲ）、適応パラメータセット（Adaptive Parameter Set，ＡＰＳ）、アクセスユニット（Access Unit，ＡＵ）、アクセスユニットデリミタ（Access Unit Delimiter，ＡＵＤ）、アドバンスドビデオコーディング（Ｒｅｃ．ＩＴＵ－ＴＨ．２６４｜ＩＳＯ／ＩＥＣ１４４９６－１０）（Advanced Video Coding，ＡＶＣ）、双予測（Bi-predictive，Ｂ）、コーディングユニットレベル重み付き双予測（Bi-prediction with Coding unit level Weights，ＢＣＷ）、双方向オプティカルフロー（Bi-Directional Optical Flow，ＢＤＯＦ）、ブロックベースのデルタパルスコード変調（Block-based Delta Pulse Code Modulation，ＢＤＰＣＭ）、バッファリング周期（Buffering Period，ＢＰ）、コンテキストベースの適応バイナリ算術コーディング（Context-based Adaptive Binary Arithmetic Coding，ＣＡＢＡＣ）、コーディングブロック（Coding Block，ＣＢ）、固定ビットレート（Constant Bit Rate，ＣＢＲ）、交差成分適応ループフィルタ（Cross-Component Adaptive Loop Filter，ＣＣＡＬＦ）、コーディングピクチャバッファ（Coded Picture Buffer，ＣＰＢ）、クリーンランダムアクセス（Clean Random Access，ＣＲＡ）、巡回冗長検査（Cyclic Redundancy Check，ＣＲＣ）、コーディングツリーブロック（Coding Tree Block，ＣＴＢ）、コーディングツリーユニット（Coding Tree Unit，ＣＴＵ）、コーディングユニット（Coding Unit，ＣＵ）、コーディングビデオシーケンス（Coded Video Sequence，ＣＶＳ）、復号化能力情報（Decoding Capability Information，ＤＣＩ）、復号化初期化情報（Decoding Initialization Information，ＤＩＩ）、復号化ピクチャバッファ（Decoded Picture Buffer，ＤＰＢ）、依存ランダムアクセスポイント（Dependent Random Access Point，ＤＲＡＰ）、復号化ユニット（Decoding Unit，ＤＵ）、復号化ユニット情報（Decoding Unit Information，ＤＵＩ）、指数ゴロム（Exponential-Golomb，ＥＧ）、ｋ次指数ゴロム（k-th exponential-Golomb，ＥＧｋ）、エンド・オブ・ビットストリーム（End Of Bitstream，ＥＯＢ）、エンド・オブ・シーケンス（End Of Sequence，ＥＯＳ）、フィラーデータ（Filler Data，ＦＤ）、先入れ先出し（First-in, First-out，ＦＩＦＯ）、固定長（Fixed-Length，ＦＬ）、緑、青、及び赤（Green, Blue, and Red，ＧＢＲ）、一般制約情報（General Constraints Information，ＧＣＩ）、漸次復号リフレッシュ（Gradual Decoding Refresh，ＧＤＲ）、幾何学的パーティショニングモード（Geometric Partitioning Mode，ＧＰＭ）、Ｒｅｃ．ＩＴＵ－ＴＨ．２６５｜ＩＳＯ／ＩＥＣ２３００８－２としても知られている高効率ビデオコーディング（High Efficiency Video Coding，ＨＥＶＣ）、仮想参照デコーダ（Hypothetical Reference Decoder，ＨＲＤ）、仮想ストリームスケジューラ（Hypothetical Stream Scheduler，ＨＳＳ）、イントラ（Intra，Ｉ）、イントラブロックコピー（Intra Block Copy，ＩＢＣ）、瞬時復号リフレッシュ（Instantaneous Decoding Refresh，ＩＤＲ）、レイヤ間参照ピクチャ（Intra Layer Reference Picture，ＩＬＲＰ）、イントラランダムアクセスポイント（Intra Random Access Point，ＩＲＡＰ）、低周波非分離変換（Low Frequency Non-Separable Transform，ＬＦＮＳＴ）、最低確率シンボル（Least Probable Symbol，ＬＰＳ）、最下位ビット（Least Significant Bit，ＬＳＢ）、長期参照ピクチャ（Long-Term Reference Picture，ＬＴＲＰ）、クロマスケーリングを伴うルーママッピング（Luma Mapping with Chroma Scaling，ＬＭＣＳ）、マトリクスベースのイントラ予測（Matrix-based Intra Prediction，ＭＩＰ）、最高確率シンボル（Most Probable Symbol，ＭＰＳ）、最上位ビット（Most Significant Bit，ＭＳＢ）、多重変換選択（Multiple Transform Selection，ＭＴＳ）、動きベクトル予測（Motion Vector Prediction，ＭＶＰ）、ネットワーク抽象化レイヤ（Network Abstraction Layer，ＮＡＬ）、出力レイヤセット（Output Layer Set，ＯＬＳ）、動作点（Operation Point，ＯＰ）、動作点情報（Operating Point Information，ＯＰＩ）、予測（Predictive，Ｐ）、ピクチャヘッダ（Picture Header，ＰＨ）、ピクチャ順序カウント（Picture Order Count，ＰＯＣ）、ピクチャパラメータセット（Picture Parameter Set，ＰＰＳ）、オプティカルフローによる予測精緻化（Prediction Refinement with Optical Flow，ＰＲＯＦ）、ピクチャタイミング（Picture Timing，ＰＴ）、ピクチャユニット（Picture Unit，ＰＵ）、量子化パラメータ（Quantization Parameter，ＱＰ）、ランダムアクセス復号可能リーディングピクチャ（Random Access Decodable Leading picture，ＲＡＤＬ）、ランダムアクセススキップリーディングピクチャ（Random Access Skipped Leading picture，ＲＡＳＬ）、ローバイトシーケンスペイロード（Raw Byte Sequence Payload，ＲＢＳＰ）、赤、緑、及び青（Red, Green, and Blue，ＲＧＢ）、参照ピクチャリスト（Reference Picture List，ＲＰＬ）、サンプル適応オフセット（Sample Adaptive Offset，ＳＡＯ）、サンプルアスペクト比（Sample Aspect Ratio，ＳＡＲ）、補足拡張情報（Supplemental Enhancement Information，ＳＥＩ）、スライスヘッダ（Slice Header，ＳＨ）、サブピクチャレベル情報（Subpicture Level Information，ＳＬＩ）、データビット列（String Of Data Bits，ＳＯＤＢ）、シーケンスパラメータセット（Sequence Parameter Set，ＳＰＳ）、短期参照ピクチャ（Short-Term Reference Picture，ＳＴＲＰ）、ステップワイズ時間サブレイヤアクセス（Step-wise Temporal Sublayer Access，ＳＴＳＡ）、トランケーテッド・ライス（Truncated Rice，ＴＲ）、可変ビットレート（Variable Bit Rate，ＶＢＲ）、ビデオコーディングレイヤ（Video Coding Layer，ＶＣＬ）、ビデオパラメータセット（Video Parameter Set，ＶＰＳ）、Ｒｅｃ．ＩＴＵ－ＴＨ．２７４｜ＩＳＯ／ＩＥＣ２３００２－７としても知られている多目的補足拡張情報（Versatile Supplemental Enhancement Information，ＶＳＥＩ）、ビデオユーザビリティ情報（Video Usability Information，ＶＵＩ）、及びＲｅｃ．ＩＴＵ－ＴＨ．２６６｜ＩＳＯ／ＩＥＣ２３０９０－３としても知られているバーサタイルビデオコーディング（Versatile Video Coding，ＶＶＣ）。

ビデオコーディング標準規格は、国際電気通信連合（International Telecommunication Union，ＩＴＵ）電気通信標準化部門（Telecommunications Standardization Sector）（ＩＴＵ－Ｔ）及びＩＳＯ／国際電気標準会議（International Electrotechnical Commission，ＩＥＣ）標準規格の開発を通じて主に発展してきた。ＩＴＵ－ＴはＨ．２６１及びＨ．２６３を作り出し、ＩＳＯ／ＩＥＣはモーションピクチャエキスパートグループ（Motion Picture Experts Group，ＭＰＥＧ）－１及びＭＰＥＧ－４Ｖｉｓｕａｌを作り出し、２つの組織は共同でＨ．２６２／ＭＰＥＧ－２Ｖｉｄｅｏ及びＨ２６４／ＭＰＥＧ－４アドバンスドビデオコーディング（ＡＶＣ）及びＨ．２６５／ＨＥＶＣ標準規格を作り出した。Ｈ．２６２以降、ビデオコーディング標準規格は、時間予測に変換コーディングをプラスしたものが利用されるハイブリッド型ビデオコーディング構造に基づいている。ＨＥＶＣを超える更なるビデオコーディング技術を探求するために、ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ（ＪＶＥＴ）がビデオコーディングエキスパートグループ（Video Coding Experts Group，ＶＣＥＧ）及びＭＰＥＧによって共同で設立された。多くの方法がＪＶＥＴによって採用され、ＪｏｉｎｔＥｘｐｌｏｒａｔｉｏｎＭｏｄｅｌ（ＪＥＭ）と呼ばれる参照ソフトウェアに置かれてきた。ＪＶＥＴは後に、バーサタイルビデオコーディング（ＶＶＣ）プロジェクトが公式に開始したときにＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔｓＴｅａｍ（ＪＶＥＴ）と改名された。ＶＶＣは、ＨＥＶＣと比較して５０％のビットレート低減を目標とするコーディング標準規格である。ＶＶＣはＪＶＥＴによって完成された。

ＩＴＵ－ＴＨ．２６６｜ＩＳＯ／ＩＥＣ２３０９０－３としても知られているＶＶＣ標準規格、及びＩＴＵ－ＴＨ．２７４｜ＩＳＯ／ＩＥＣ２３００２－７としても知られている関連する多目的補足拡張情報（ＶＳＥＩ）は、テレビ放送、ビデオ会議、記憶媒体からの再生、適応ビットレートストリーミング、ビデオ領域抽出、複数のコーディングされたビデオビットストリームからのコンテンツの組み立て及びマージ、マルチビュービデオ、スケーラブルレイヤードコーディング、並びにビューポート適応３６０度（３６０°）没入メディアのような、広範な用途での使用のために設計されている。エッセンシャルビデオコーディング（Essential Video Coding，ＥＶＣ）標準規格（ＩＳＯ／ＩＥＣ２３０９４－１）は、ＭＰＥＧによって開発されたもう１つのビデオコーディング標準規格である。

ファイルフォーマット標準規格について以下で説明する。メディアストリーミングアプリケーションは、通常は、インターネットプロトコル（Internet Protocol，ＩＰ）、伝送制御プロトコル（Transmission Control Protocol，ＴＣＰ）、及びハイパーテキスト転送プロトコル（Hyper Transfer Protocol，ＨＴＴＰ）トランスポート方法に基づいており、通常は、ＩＳＯＢＭＦＦのようなファイルフォーマットに依存する。１つのそのようなストリーミングシステムは、ＨＴＴＰによる動的適応ストリーミング（ＤＡＳＨ）である。ビデオは、ＡＶＣ及び／又はＨＥＶＣのようなビデオフォーマットで符号化され得る。符号化されたビデオは、ＩＳＯＢＭＦＦトラックにカプセル化され、ＤＡＳＨ表現及びセグメントに含められ得る。プロファイル、ティア、及びレベルのような、ビデオビットストリームに関する重要な情報、及び多くの他の情報は、コンテンツ選択を目的としてＤＡＳＨメディアプレゼンテーション記述（Media Presentation Description，ＭＰＤ）において及び／又はファイルフォーマットレベルメタデータとして露わにされ得る。例えば、そのような情報は、ストリーミングセッションの開始時の初期化及びストリーミングセッション中のストリーム適応の両方のための適切なメディアセグメントの選択のために使用され得る。

同様に、ＩＳＯＢＭＦＦによる画像フォーマットを使用する場合に、ＡＶＣ画像ファイルフォーマット及びＨＥＶＣ画像ファイルフォーマットのような、画像フォーマットに特有のファイルフォーマット仕様が用いられてもよい。ＶＶＣビデオファイルフォーマットは、ＩＳＯＢＭＦＦに基づいたＶＶＣビデオコンテンツの記憶のためのファイルフォーマットであり、ＭＰＥＧによる開発中である。ＶＶＣ画像ファイルフォーマットは、ＩＳＯＢＭＦＦに基づいた、ＶＶＣを用いてコーディングされた画像コンテンツの記憶のためのファイルフォーマットであり、やはりＭＰＥＧによる開発中である。

これより、ファイルフォーマット標準規格について説明する。メディアストリーミングアプリケーションは、インターネットプロトコル（ＩＰ）、伝送制御プロトコル（ＴＣＰ）、及びハイパーテキスト転送プロトコル（ＨＴＴＰ）トランスポートメカニズムに基づき得る。そのようなメディアストリーミングアプリケーションも、ＩＳＯベースメディアファイルフォーマット（ＩＳＯＢＭＦＦ）のようなファイルフォーマットに依存し得る。１つのそのようなストリーミングシステムは、ＨＴＴＰによる動的適応ストリーミング（ＤＡＳＨ）である。ＩＳＯＢＭＦＦ及びＤＡＳＨによるビデオフォーマットを使用するために、ビデオフォーマットに特有のファイルフォーマット仕様が、ＩＳＯＢＭＦＦトラックにおける並びにＤＡＳＨ表現及びセグメントにおけるビデオコンテンツのカプセル化のために用いられ得る。そのようなファイルフォーマット仕様には、ＡＶＣファイルフォーマット及びＨＥＶＣファイルフォーマットが含まれ得る。プロファイル、ティア、及びレベルのような、ビデオビットストリームに関する重要な情報、及び多くの他の情報は、コンテンツ選択を目的としてＤＡＳＨメディアプレゼンテーション記述（ＭＰＤ）において及び／又はファイルフォーマットレベルメタデータとして露わにされ得る。例えば、コンテンツ選択は、ストリーミングセッションの開始時の初期化及びストリーミングセッション中のストリーム適応の両方のための適切なメディアセグメントの選択を含み得る。同様に、ＩＳＯＢＭＦＦによる画像フォーマットを使用するために、ＡＶＣ画像ファイルフォーマット及びＨＥＶＣ画像ファイルフォーマットのような、画像フォーマットに特有のファイルフォーマット仕様が用いられてもよい。ＶＶＣビデオファイルフォーマットは、ＩＳＯＢＭＦＦに基づいたＶＶＣビデオコンテンツの記憶のためのファイルフォーマットである。ＶＶＣビデオファイルフォーマットは、ＭＰＥＧによって開発されている。ＶＶＣ画像ファイルフォーマットは、ＩＳＯＢＭＦＦに基づいた、ＶＶＣを用いてコーディングされた画像コンテンツの記憶のためのファイルフォーマットである。ＶＶＣ画像ファイルフォーマットも、ＭＰＥＧによって開発されている。

これより、ＤＡＳＨについて説明する。ＤＡＳＨでは、マルチメディアコンテンツのビデオ及び／又はオーディオデータのための多数の表現が存在し得る。異なる表現は、ビデオコーディング標準規格の異なるプロファイル又はレベル、異なるビットレート、異なる空間分解能、などのような、異なるコーディング特性に対応し得る。そのような表現のマニフェストは、メディアプレゼンテーション記述（Media Presentation Description，ＭＰＤ）データ構造で記述され得る。メディアプレゼンテーションは、ＤＡＳＨストリーミングクライアントデバイスがアクセスすることができるデータの構造化された集合に対応し得る。ＤＡＳＨストリーミングクライアントデバイスは、クライアントデバイスのユーザへストリーミングサービスを提示するためにメディアデータ情報を要求及びダウンロードし得る。メディアプレゼンテーションは、ＭＰＤデータ構造で記述されてもよく、これはＭＰＤのアップデートを含み得る。

メディアプレゼンテーションは、１つ以上の周期の連続を含み得る。各周期は、次の周期の開始まで、又は最後の周期の場合には、メディアプレゼンテーションの終わりまで、延在し得る。各周期は、同じメディアコンテンツのための１つ以上の表現を含み得る。表現は、オーディオ、ビデオ、時限テキスト（timed text）、又は他のそのようなデータの多数の代替の符号化されたバージョンのうちの１つであってよい。表現は、符号化タイプごとに、例えば、ビットレート、分解能、ビデオデータ及びビットレートのためのコーデック、言語、及び／又はオーディオデータのためのコーディングごとに、異なり得る。表現という用語は、マルチメディアコンテンツの特定の周期に対応しかつ特定の方法で符号化されている符号化されたオーディオ又はビデオデータの区間に言及するために使用され得る。

特定の周期の表現は、表現が属する適応セットを示すＭＰＤ内の属性によって示されたグループに割り当てられ得る。同じ適応セット内の表現は、一般に、互いに代替するものと見なされる。従って、クライアントデバイスは、例えば、バンド幅適応を実行するために、それらの表現の間を動的にかつシームレスに切り替えることができる。例えば、特定の周期についてのビデオデータの各表現は同じ適応セットに割り当てられてもよく、それにより、表現のうちのいずれかが、対応する周期についてのマルチメディアコンテンツのビデオデータ又はオーディオデータのようなメディアデータを提示するように復号化のために選択され得る。１つの周期内のメディアコンテンツは、存在する場合には、グループ０からのどれか１つの表現、又はいくつかの例では、各非ゼログループからの多くても１つの表現の組み合わせによって表現され得る。ある周期の各表現についてのタイミングデータは、その周期の開始時に対して表され得る。

表現は１つ以上のセグメントを含み得る。各表現は、初期化セグメントを含んでよく、あるいは、表現の各セグメントは、自己初期化してもよい。存在する場合に、初期化セグメントは、表現にアクセスするための初期化情報を含み得る。一般に、初期化セグメントはメディアデータを含まない。セグメントは、ユニフォームリソースロケータ（Uniform Resource Locator，ＵＲＬ）、ユニフォームリソース名（Uniform Resource Name，ＵＲＮ）、又はユニフォームリソース識別子（Uniform Resource Identifier，ＵＲＩ）のような識別子によって一意に参照され得る。ＭＰＤは、セグメントごとに識別子を提供し得る。いくつか例では、ＭＰＤはまた、範囲属性の形でバイト範囲を提供してもよく、これは、ＵＲＬ、ＵＲＮ、又はＵＲＩによってアクセス可能なファイル内のセグメントのデータに対応し得る。

異なる表現は、異なるタイプのメディアデータの略同時の読み出しのために選択され得る。例えば、クライアントデバイスは、セグメントを読み出すためのオーディオ表現、ビデオ表現、及び時限テキスト表現を選択し得る。いくつかの例では、クライアントデバイスは、バンド幅適応を実行するための特定の適応セットを選択し得る。例えば、クライアントデバイスは、ビデオ表現を含む適応セット、オーディオ表現を含む適応セット、及び／又は時限テキストを含む適応セットを選択し得る。例において、クライアントデバイスは、ビデオのような特定のタイプのメディアについて適応セットを選択し、そして、オーディオ及び／又は時限テキストのような他のタイプのメディアについて表現を直接に選択し得る。

例となるＤＡＳＨストリーミングプロシージャは、以下のステップによって示され得る。クライアントはＭＰＤを取得する。次いで、クライアントは、ダウンリンクバンド幅を推定し、推定されたダウンリンクバンド幅、コーデック、復号化能力、表示サイズ、オーディオ言語設定、などに従ってビデオ表現及びオーディオ表現を選択する。メディアプレゼンテーションの終わりに達するまで、クライアントは、選択された表現のメディアセグメントを要求し、ストリーミングコンテンツをユーザに提示する。クライアントは、ダウンリンクバンド幅の推定を続ける。バンド幅が有意に、例えば、より低くなること又はより高くなることによって、変化すると、クライアントは、新たに推定されたバンド幅に一致するように異なるビデオ表現を選択し、更新されたダウンリンクバンド幅で引き続きセグメントをダウンロードする。

これより、ＣＭＡＦについて説明する。ＣＭＡＦは、ＩＳＯＢＭＦＦトラック、ＩＳＯＢＭＦＦセグメント、ＩＳＯＢＭＦＦフラグメント、ＤＡＳＨ表現、及び／又はＣＭＡＦトラック、ＣＭＡＦフラグメント、などへのメディア符号化及びカプセル化に関する制約の組を指定する。そのような制約は、メディアプロファイルとして定義された各インターオペラビリティポイント（interoperability point）のカプセル化のためのものである。ＣＭＡＦ開発の主な目標は、ＤＡＳＨ及びＡｐｐｌｅのＨＴＴＰライブストリーミング（HTPP Live Streaming，ＨＬＳ）の２つの別個のメディアストリーミング世界による、特定のコーデック、例えば、ビデオのためのＡＶＣを用いて符号化されて、特定のフォーマット、例えば、ＩＳＯＢＭＦＦにカプセル化された同じメディアコンテンツの再利用を可能にすることである。

これより、ＶＶＣにおける復号化能力情報（ＤＣＩ）について説明する。ＤＣＩＮＡＬユニットは、ビットストリームレベルのプロファイル、ティア、及びレベル（Profile, Tier, and Level，ＰＴＬ）情報を含む。ＤＣＩＮＡＬユニットは、ＶＶＣビットストリームの送信側と受信側との間のセッションネゴシエーション中に使用され得る１つ以上のＰＴＬシンタックス構造を含む。ＤＣＩＮＡＬユニットがＶＶＣビットストリームに存在する場合に、ビットストリームのＣＶＳ内の各出力レイヤセット（Output Layer Set，ＯＬＳ）は、ＤＣＩＮＡＬユニット内のＰＴＬ構造の少なくとも１つで運ばれるＰＴＬ情報に従わなければならない。ＡＶＣ及びＨＥＶＣでは、セッションネゴシエーションのためのＰＴＬ情報は、ＳＰＳで（ＨＥＶＣ及びＡＶＣ用）で及びＶＰＳ（ＨＥＶＣ階層化拡張用）で利用可能である。ＨＥＶＣ及びＡＶＣでセッションネゴシエーションのためにＰＴＬ情報を運ぶこのような設計は、ＳＰＳ及びＶＰＳの範囲がビットストリーム全体ではなくＣＶＳ内にあるので、欠点がある。これにより、送信側－受信側間のセッションの開始は、新しいＣＶＳごとにビットストリームストリーミング中の再開始に見舞われる可能性がある。ＤＣＩは、ＤＣＩがビットストリームレベルの情報を運ぶので、この問題を解決し、よって、示されている復号化能力に従うことは、ビットストリームの終わりまで保証され得る。

これより、ＶＶＣにおけるビデオパラメータセット（ＶＰＳ）について説明する。ＶＶＣビットストリームは、スケーラブルビットストリームの復号化プロセスの動作のために使用されるレイヤ及び出力レイヤセット（ＯＬＳ）を記述する情報を含むビデオパラメータセット（ＶＰＳ）を含み得る。ＯＬＳは、１つ以上のレイヤがデコーダから出力されるよう指定されるビットストリーム内のレイヤの組である。ＯＬＳで特定される他のレイヤも、出力レイヤを復号するために復号され得るが、そのようなレイヤは、出力されるよう指定されない。ＶＰＳに含まれる情報の大半は、セッションネゴシエーション及びコンテンツ選択のような目的のためにシステム内で使用され得る。ＶＰＳは、マルチレイヤビットストリームを扱うために導入される。シングルレイヤＶＶＣビットストリームについては、ＣＶＳでのＶＰＳの存在は任意である。これは、ＶＰＳに含まれる情報がビットストリームの復号化プロセスの動作のために必須ではないからである。ＣＶＳでのＶＰＳの欠如は、ＳＰＳで０に等しいＶＰＳ識別子（ＩＤ）を参照することによって、示される。その場合に、デフォルト値が、ＶＰＳパラメータのために推測される。

これより、ＶＶＣにおけるシーケンスパラメータセット（ＳＰＳ）について説明する。ＳＰＳは、コーディングレイヤビデオシーケンス（Coded Layer Video Sequence，ＣＬＶＳ）全体における全てのピクチャによって共有されているシーケンスレベル情報を運ぶ。これは、ＰＴＬインジケータ、ピクチャフォーマット、特徴及び／又はツール制御フラグ、コーディング、予測、及び／又は変換ブロック構造及びヒエラルキ、エンコーダによって参照され得る候補ＲＰＬ、などを含む。ピクチャフォーマットは、色サンプリングフォーマット、最大ピクチャ幅、最大ピクチャ高さ、及びビット深さを含み得る。ほとんどのアプリケーションで、ただ１つ又は少しのＳＰＳしか、ビットストリーム全体に対して使用されない。よって、ビットストリーム内のＳＰＳを更新する必要はない。ＳＰＳの更新は、既存のＳＰＳのＳＰＳＩＤを用いて、しかし特定のパラメータについては異なる値を有して、新しいＳＰＳを送信することを含み得る。異なるＳＰＳＩＤを有するか又はＳＰＳＩＤは同じであるが異なるＳＰＳコンテンツを有するＳＰＳを参照する特定のレイヤからのピクチャは、異なるＣＬＶＳに属する。ＡＶＣ及びＨＥＶＣと同様に、ＳＰＳは、インバンドで、又はインバンドとアウトオブバンドの混合シグナリングを用いて、運ばれ得る。インバンドのシグナリングは、ＳＰＳのようなデータが、コーディングされたピクチャとともに運ばれることを示し、アウトオブバンドのシグナリングは、ＳＰＳのようなデータが、コーディングされたピクチャとともに運ばれないことを示す。

これより、ＶＶＣにおけるピクチャパラメータセット（ＰＰＳ）について説明する。ＰＰＳは、ピクチャの全てのスライスによって共有されるピクチャレベル情報を運ぶ。そのような情報はまた、複数のピクチャの間でも共有され得る。これは、特徴及び／又はツールオン／オフフラグ、ピクチャ幅及び高さ、デフォルトＲＰＬサイズ、タイル及びスライスの設定、などを含む。設計によって、２つの連続したピクチャは、２つの異なるＰＰＳを参照することができる。これは、多数のＰＰＳがＣＬＶＳ内で使用されることを生じさせる可能性がある。実際には、ビットストリーム全体のためのＰＰＳの数は、ＰＰＳが、頻繁には変化せず、複数のピクチャに適用される可能性があるパラメータを運ぶよう設計されているということで、多くない。従って、ＣＬＶＳ内で、又はビットストリーム全体内でさえ、ＰＰＳを更新する必要がない場合がある。適応パラメータセット（ＡＰＳ）が、複数のピクチャに適用され得るパラメータに使用されてもよいが、ピクチャごとに頻繁に変化することが予想される。ＳＰＳのように、ＰＰＳは、インバンドで、アウトオブバンドで、又はインバンドとアウトオブバンドの混合シグナリングを用いて運ばれ得る。どのピクチャレベルパラメータがＡＰＳに含まれるべきかに対するどのピクチャレベルパラメータがＰＰＳに含まれるべきかに関する基本的な設計原則の１つは、そのようなパラメータが変更される可能性がある頻度である。従って、ＰＰＳ更新を必要とすることを回避するために、頻繁に変更されるパラメータはＰＰＳに含まれない。これにより、通常の使用ケースでは、ＰＰＳのアウトオブバンド送信が許可されなくなる。

これより、ＶＶＣにおける適応パラメータセット（ＡＰＳ）について説明する。ＡＰＳは、ピクチャの複数のスライスによって及び／又は異なるピクチャのスライスによって共有され得るが、ピクチャ間で頻繁に変化する可能性があるピクチャ及び／又はスライスレベル情報を運ぶ。ＡＰＳは、ＰＰＳでの包含に適さないバリアントの総数が多い情報をサポートする。ＡＰＳに含まれるパラメータには３種類あり、適応ループフィルタ（ＡＬＦ）パラメータ、クロマスケーリングを伴うルーママッピング（ＬＭＣＳ）パラメータ、及びスケーリングリストパラメータである。ＡＰＳは、２つの異なるＮＡＬユニットタイプで運ばれ得る。これらは、プレフィックス（prefix）又はサフィックス（suffix）として、関連するスライスの前又は後にある。後者は、エンコーダがピクチャに基づきＡＬＦパラメータを生成する前にピクチャのスライスを送信できるようにするなど、超低遅延シナリオで役立ち得る。このパラメータは、後続のピクチャによって復号化順に使用される。

これより、ピクチャヘッダ（ＰＨ）について説明する。ピクチャヘッダ（ＰＨ）構造はＰＵごとに存在する。ＰＨは、別個のＰＨＮＡＬユニットに存在するか、あるいは、スライスヘッダ（ＳＨ）に含まれるかのどちらかである。ＰＨは、ＰＵがただ１つのスライスしか含まない場合には、ＳＨにしか含まれ得ない。設計を簡単にするために、ＣＬＶＳ内で、ＰＨは、全てがＰＨＮＡＬユニットにあるか、あるいは、全てがＳＨにあるかのどちらかであることしかできない。ＰＨがＳＨにある場合に、ＣＬＶＳにＰＨＮＡＬユニットはない。ＰＨは、２つの目的のために設計される。第１に、ＰＨは、ピクチャごとに複数のスライスを含むピクチャのＳＨのシグナリングオーバーヘッドを低減するのを助ける。ＰＨは、ピクチャの全てのスライスについて同じ値を有する全てのパラメータを運び、そのようにして各ＳＨでの同じパラメータの繰り返しを防ぐことによって、これを達成する。これらのパラメータには、ＩＲＡＰ及び／又はＧＤＲピクチャ指示、インター及び／又はイントラスライス許可フラグ、及びＰＯＣ、ＲＰＬ、デブロッキングフィルタ、ＳＡＯ、ＡＬＦ、ＬＭＣＳ、スケーリングリスト、ＱＰデルタ、重み付き予測、コーディングブロックパーティショニング、仮想境界、同一位置（collocated）ピクチャ、などに関する情報がある。第２に、ＰＨは、デコーダが複数のスライスを含む各コーディングされたピクチャの最初のスライスを識別するのを助ける。ＰＨごとにただ１つのＰＨが存在するので、デコーダは、デコーダがＰＨＮＡＬユニットを受け取る場合に、次のＶＣＬＮＡＬユニットがピクチャの最初のスライスであることを認識する。

これより、動作点情報（ＯＰＩ）について説明する。ＨＥＶＣ及びＶＶＣの復号化プロセスは、復号化動作点をセットするための類似した入力変数を有する。これらには、デコーダＡＰＩにより復号されるビットストリームの最高サブレイヤ及びターゲットＯＬＳが含まれる。しかし、ビットストリームのレイヤ及び／又はサブレイヤが伝送中に削除されたり、あるいは、デバイスがデコーダアプリケーションプログラミングインターフェース（ＡＰＩ）をアプリケーションに公開したりしないシナリオでは、デコーダは、ビットストリームを処理するための動作点を正確に決定することができない場合がある。従って、デコーダは、復号化ピクチャのための適切なバッファ割り当て、及び個々のピクチャが出力されるか否かのような、ビットストリーム内のピクチャの特性について結論を出すことができない可能性がある。この問題に対処するために、ＶＶＣは、ＯＰＩＮＡＬユニットによりビットストリーム内にこれら２つの変数を示すモードを含める。ビットストリームの先頭にあるＡＵ及びビットストリームの個々のＣＶＳでは、ＯＰＩＮＡＬユニットが、デコーダに、復号されるビットストリームの最高サブレイヤ及びターゲットＯＬＳを知らせる。ＯＰＩＮＡＬユニットが存在し、動作点がデコーダＡＰＩ情報によってもデコーダに供給される場合には、デコーダＡＰＩ情報が優先される。例えば、アプリケーションは、ターゲットＯＬＳ及びサブレイヤに関する更に更新された情報を有する場合がある。ビットストリームにデコーダＡＰＩ及びＯＰＩＮＡＬユニットの両方がない場合に、適切なデコーダ動作を可能にするために、適切なフォールバック選択がＶＶＣで指定される。

これより、例となるＣＭＡＦ仕様が説明される。ＶＶＣビデオＣＭＡＦトラックは、次のように記載される。ＶＶＣＣＭＡＦトラックは、ＮＡＬ構造化ビデオＣＭＡＦトラックの要件に従わなければならない。更に、ＣＭＡＦトラックは、ここで記載される他の全ての要件に従ってもよい。ＣＭＡＦトラックがこれらの要件に従う場合に、ＣＭＡＦトラックはＶＶＣビデオＣＭＡＦトラックと呼ばれ、ブランド‘ｃｖｖｃ’を使用し得る。ＶＶＣビデオトラック制約についても説明する。例において、ＶＶＣビデオＣＭＡＦスイッチングセット制約は次の通りである。ＣＭＡＦスイッチングセット内のあらゆるＣＭＡＦトラックが、ここで定義されるようにＶＶＣビデオＣＭＡＦトラックに従わなければならない。ＶＶＣビデオＣＭＡＦスイッチングセットは、ＮＡＬ構造化ビデオＣＭＡＦスイッチングセットに対する制約に従わなければならない。

これより、視覚サンプルエントリについて説明する。ＶＶＣビデオトラックの視覚サンプルエントリのシンタックス及び値は、ＶＶＣＳａｍｐｌｅＥｎｔｒｙ（‘ｖｖｃｌ’）又はＶＶＣＳａｍｐｌｅＥｎｔｒｙ（‘ｖｖｃｉ’）サンプルエントリに従わなければならない。ＶＶＣエレメンタリストリームに対する制約についてこれより説明する。ＶＰＳに関して、ＣＭＡＦトラック内の各ＶＶＣビデオメディアサンプルは、０に等しいｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを用いてＳＰＳを参照しなければならず、その場合に、エレメンタリストリームにはＶＰＳが存在せず、あるいは、ＣＭＡＦヘッダサンプルエントリ内のＶＰＳを参照しなければならない。存在する場合には、次の更なる制約が適用される。ＶＰＳ内の各ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造について、次のフィールド：ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ、及びｇｅｎｅｒａｌ＿ｓｕｂｃ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］、の値はＶＶＣエレメンタリストリームにわたって変化してはならない。

ＣＭＡＦＶＶＣトラック内で発生するＳＰＳＮＡＬユニットは、次の更なる制約とともにここでの制約に従わなければならない。次のフィールドは、次のように、所定の値を有さなければならない：最初に、ｖｕｉ＿ｐａｒａｍｅｔｅｒｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、１にセットされなければならず、第２に、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造がＳＰＳに存在する場合には、次のフィールド：ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ、及びｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］、の条件は、ＶＶＣエレメンタリストリームにわたって変化してはならない。

これより、画像クロッピングパラメータについて説明する。ＳＰＳ及びＰＰＳクロッピングパラメータｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔは、０にセットされなければならない。ＳＰＳ及びＰＰＳクロッピングパラメータｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ及びｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔは、０以外の値にセットされてもよい。非ゼロ値にセットされる場合には、そのようなシンタックス要素は、表示を目的としていないビデオ空間サンプルを削除するためにＣＭＡＦプレイヤーによって使用されることが予想される。

これより、ビデオコーデックパラメータについて説明する。コーデックパラメータ（情報）のＶＶＣシグナリングについて以下に記載する。プレゼンテーションアプリケーションは、パラメータを用いてビデオコーデックプロファイル及び各ＶＶＣトラック及びＣＭＡＦスイッチングセットのレベルを通知すべきである。暗号化についても説明する。ＣＭＡＦＶＶＣトラック及びＣＭＡＦＶＶＣスイッチングセットの暗号化は、‘ｃｅｎｃ’ＡＥＳ－ＣＴＲスキーム又は‘ｃｂｃｓ’ＡＥＳ－ＣＢＣサブサンプルパターン暗号化スキームのどちらか一方を使用しなければならない。更に、共通暗号化（Common Encryption）の‘ｃｂｃｓ’モードがパターン暗号化を使用する場合には、１０のパターンブロック長さ及び１：９の暗号化：スキップパターンが適用されなければならない。

以下は、開示されている技術的解決法によって解決される技術的問題の例である。例えば、例となるＶＶＣＣＭＡＦ設計では、プロファイル、ティア、及びレベルは、ＶＰＳ及びＳＰＳで通知される必要があり得るので、ＶＶＣエレメンタリストリームにわたって変化しない可能性がある。しかし、ＶＶＣビットストリームについては、ＤＣＩＮＡＬユニットが、代わりに、プロファイル、ティア、及びレベルをビットストリーム内でＣＶＳごとに異ならせることを可能にしながら、ビットストリーム全体に対する必要とされる復号化能力を運ぶために使用され得る。これは更なる柔軟性を可能にし、これにより、コンテンツ準備に必要とされるトランスコーディング及び他のプロセスは減ることになる。

上記の問題の１つ以上に対処するメカニズムが、ここでは開示される。例えば、ＶＶＣビットストリームとしても知られているＶＶＣエレメンタリストリームは、ＶＶＣＣＭＡＦトラックに含まれ得る。ＶＶＣエレメンタリストリームは、１つ以上のＣＶＳを含み得る。ビットストリームのプロファイル、ティア、及びレベル（ＰＴＬ）情報は、同じビットストリーム内でＣＶＳごとに変化し得る。この機能を可能にするために、ＰＴＬ情報は、対応する制約が維持される限りは、ＤＣＩＮＡＬユニット、ＶＰＳ、及び／又はＳＰＳで通知され得る。例において、ＤＣＩＮＡＬユニットはＣＭＡＦトラックに含まれる必要がある。例において、複数のＤＣＩＮＡＬユニットがＣＭＡＦトラックに含まれる場合に、全てのＤＣＩＮＡＬユニットが同じコンテンツを含むことを求められ得る。他の例では、ＣＭＡＦトラックは、単一のＤＣＩＮＡＬユニットしか含まなくてもよい。例において、ＤＣＩＮＡＬユニットは、ＣＭＡＦヘッダサンプルエントリに含まれることを求められ得る。様々な例において、ＤＣＩＮＡＬユニットは、ＰＴＬのＤＣＩ数から１をマイナスした数（ｄｃｉ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１）のフィールド、ＰＴＬフレームのみ制約フラグ（ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇ）のフィールド、及びＰＴＬマルチレイヤ有効化フラグ（ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）を含み得る。これらは夫々、０、１、及び０等しい必要がある。例において、ＣＭＡＦトラックは、単一のＶＰＳを含むよう制限される。例において、ＤＣＩＮＡＬユニットが存在しない場合に、ＶＰＳ内の様々なｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇ関連情報は、所定の値にセットされることを求められ、かつ／あるいは、以下で更に説明されるように、ＣＶＳごとに同じままであることを求められる。例において、ＳＰＳ内の様々なＰＴＬ関連情報は、所定の値にセットされることを求められ、かつ／あるいは、以下で更に説明されるように、ＣＶＳごとに同じままであることを求められる。例において、タイミングに関連した仮想参照デコーダ（ＨＲＤ）パラメータも、ＣＶＳごとに同じままであることを求められ得る。

図１は、例となるＣＭＡＦトラック１００を表す概略図である。ＣＭＡＦトラック１００は、ＣＭＡＦ標準規格で定められている制約に基づきカプセル化されているビデオデータのトラックである。ＣＭＡＦトラック１００は、適応ストリーミングに従って広範囲のクライアントデバイスによる配信及び復号化をサポートするよう制約される。適応ストリーミングでは、メディアプロファイルは、複数の異なる交換可能な表現を記述する。これにより、クライアントデバイスは、デコーダ能力及び／又は現在のネットワーク条件に基づき所望の表現を選択することができる。ＣＭＡＦトラック１００は、対応するプロファイル、ティア、及びレベル（ＰＴＬ）での復号化能力を有し、対応するコーディングツールを使用する能力を有し、かつ／あるいは、他の所定の制約を満足する能力を有するクライアントによって復号化可能であるよう制約される表現を含むことによって、そのような機能をサポートすることができる。

ＣＭＡＦトラック１２３は、多くのタイプの復号化可能なビデオストリームを含むことができる。目下の例では、ＣＭＡＦトラック１２３はＶＶＣストリーム１２１を含む。ビットストリームとしても知られているＶＶＣストリーム１２１は、ＶＶＣ標準規格に従ってコーディングされているビデオデータのストリームである。例えば、ＶＶＣストリーム１２１は、コーディングされたピクチャのストリームと、コーディングプロセス及び／又はデコーダにとって有用である他のデータを記述する関連するシンタックスとを含むことができる。ＶＶＣストリーム１２１は１つ以上のＣＶＳ１１７を含み得る。ＣＶＳ１１７は、復号化順でのアクセスユニット（ＡＵ）のシーケンスである。ＡＵは、対応する出力／表示時間を有する１つ以上のピクチャの組である。そのようなものとして、ＣＶＳ１１７は、一連の関連するピクチャと、ピクチャを復号及び／又は記述することをサポートするために使用される対応するシンタックスとを含む。

ＣＶＳ１１７は、ＤＣＩＮＡＬユニット１１５、ＶＰＳ１１１、ＳＰＳ１１３、及び／又はコーディングされたビデオ１１９を有し得る。ＤＣＩＮＡＬユニット１１５は、ＣＶＳ１１７における及び／又はＶＶＣストリーム１２１全体におけるビデオデータを復号するための要件を記述する情報を含む。ＤＣＩＮＡＬユニット１１５は任意であり、いくつかのＶＶＣストリーム１２１及び／又はＣＶＳ１１７では省略されてもよい。留意されるべきは、ＶＶＣストリーム１２１の部分として表されているが、ＤＣＩＮＡＬユニット１１５は、いくつかの例では、ＣＭＡＦトラック１２３内のＣＭＡＦヘッダサンプルエントリに含まれてもよい点である。ＶＰＳ１１１は、ＶＶＣストリーム１２１全体に関するデータを含み得る。例えば、ＶＰＳ１１１は、ＶＶＣストリーム１２１で使用されるデータ関連出力レイヤセット（ＯＬＳ）、レイヤ、及び／又はサブレイヤを含み得る。ＶＰＳ１１１は任意であり、いくつかのＶＶＣストリーム１２１及び／又はＣＶＳ１１７では省略されてもよい。ＳＰＳ１１３は、ＶＶＣストリーム１２１に含まれるＣＶＳ１１７内の全てのピクチャに共通するシーケンスデータを含む。ＳＰＳ１１３内のパラメータは、ピクチャサイジング、ビット深さ、コーディングツールパラメータ、ビットレート制限、などを含むことができる。ＳＰＳ１１３は、少なくとも１つのＣＶＳ１１７に含まれるべきである。しかし、複数のＣＶＳ１１７が同じＳＰＳ１１３を参照することができる。従って、ＶＶＣストリーム１２１は１つ以上のＳＰＳ１１３を含むべきである。コーディングされたビデオ１１９は、ＶＶＣに従ってコーディングされたピクチャと、対応するシンタックスとを含む。

本開示は、ＤＣＩＮＡＬユニット１１５、ＶＰＳ１１１、及び／又はＳＰＳ１１３に含まれるシンタックス要素に適用される制約に関する。例において、ＤＣＩＮＡＬユニット１１５は、ＣＭＡＦトラック１２３に存在する必要がある。例において、１よりも多いＤＣＩＮＡＬユニット１１５が単一のＣＭＡＦトラック１２３に存在する場合に、全てのそのようなＤＣＩＮＡＬユニット１１５は、同じコンテンツを含むことを求められ得る。いくつかの例では、ＣＭＡＦトラック１２３は、ただ１つのＤＣＩＮＡＬユニット１１５を含むよう制限され得る。そのような場合に、ビデオコンテンツの複数のＣＶＳ１１７は、単一のＤＣＩＮＡＬユニット１１５によって記述され得る。存在する場合に、ＤＣＩＮＡＬユニット１１５は、ＰＴＬのＤＣＩ数から１をマイナスした数（ｄｃｉ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１）１３２、及び／又はＰＴＬシンタックス（ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ）構造１３０を含み得る。ｄｃｉ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１１３２は、ＤＣＩＮＡＬユニット１１５に含まれるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０の数をマイナス１形式で指定し得る。マイナス１形式は、シンタックス要素が実際の値よりも１少ない数を含むことを示すので、実際の値を決定するためには、シンタックス要素に含まれる値に１が加えられる。例において、ｄｃｉ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１１３２は、ゼロに等しいよう制限される場合がある。これは、単一のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０を示す。これは、ひと組のＰＴＬ情報に従うビデオがＣＭＡＦトラック１２３に含まれることを示す。ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０は、例に応じて、ＤＣＩＮＡＬユニット１１５、ＶＰＳ１１１、及び／又はＳＰＳ１１３に含まれ得る。これについて、以下で更に詳細に説明される。

例において、ＣＭＡＦトラック１２３は、ただ１つのＶＰＳ１１１を含むよう制限される。そのような場合に、複数のＣＶＳ１１７が、単一のＶＰＳ１１１によって記述され得る。ＶＰＳ１１１は、ＶＰＳ最大レイヤから１をマイナスした数（ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１）のフィールド１３４、ＰＴＬのＶＰＳ数から１をマイナスした数（ｖｐｓ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１）のフィールド１３３、汎用仮想参照デコーダ（ＨＲＤ）パラメータ（ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ）構造１３１、及びｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０を含み得る。ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１１３４は、ＶＰＳ１１１によって指定されるレイヤの数をマイナス１形式で示す。例において、ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１１３４は、ゼロの値を含むよう制限される場合がある。これは、ＶＰＳ１１１が単一レイヤを記述することを示す。ｖｐｓ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１フィールド１３３は、ＶＰＳ１１１に含まれるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０の数をマイナス１形式で指定し得る。例において、ｖｐｓ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１フィールド１３３は、ゼロの値を含むよう制限され得る。これは、ひと組のＰＴＬ情報がＶＰＳ１１１に含まれることを示す。

ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１は、例に応じて、ＶＰＳ１１１及び／又はＳＰＳ１１３に含まれ得る。例えば、ＶＰＳ１１１が含まれる場合に、ＶＰＳ１１１はｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１を含み得る。ＶＰＳ１１１が含まれない場合には、ＳＰＳがｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１を含み得る。ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１は、エンコーダで作動するＨＲＤによって使用されるタイミング関連パラメータを含む。一般に、ＨＲＤは、ＶＶＣストリーム１２１がＶＶＣ標準規格に従っているかどうかをチェックするためにＨＲＤパラメータを使用することができる。ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１は、コーディングされたビデオ１１９に関する時間パラメータをエンコーダに示す。例えば、ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１は、どれくらい速く各ピクチャがデコーダによる正確な表示のために復号化及び再構成されるべきかを示し得る。例において、ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１は、時間スケール（ｔｉｍｅ＿ｓｃａｌｅ）フィールド及びチック内のユニット数（ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋ）のフィールドを含み得る。ｔｉｍｅ＿ｓｃａｌｅフィールドは、秒単位で経過する時間単位の数を示し、時間単位は、ビデオ信号のピクチャレート周波数に対応する。ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋは、クロックチックと呼ばれる１インクリメントに対応するヘルツ（Ｈｚ）単位のｔｉｍｅ＿ｓｃａｌｅの周波数で動作するクロックの時間単位の数を示す。例において、ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１におけるｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋ及びｔｉｍｅ＿ｓｃａｌｅの値は、同じＶＶＣストリーム１２１内のＣＶＳ１１７ごとに変化しないように制限される。例において、ｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１内のｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋ及びｔｉｍｅ＿ｓｃａｌｅの値は、ＣＭＡＦトラック１２３全体について変化しないように制限される。

ＳＰＳ１１３は、例えば、ＶＰＳ１１１が含まれない場合に、上述されたｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ１３１を含み得る。ＳＰＳ１１３はまた、例えば、ＤＣＩＮＡＬユニット１１５及び／又はＶＰＳ１１１が含まれない場合に、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０も含み得る。ＳＰＳ１１３はまた、ビデオユーザビリティ情報ペイロード（ｖｕｉ＿ｐａｙｌｏａｄ）構造１３５も含み得る。ｖｕｉ＿ｐａｙｌｏａｄ構造１３５は、どのようにコーディングされたビデオ１１９がデコーダによって使用されるべきかを記述する情報を含む。例えば、ｖｕｉ＿ｐａｙｌｏａｄ構造１３５は、ビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールド１３９及びビデオユーザビリティ情報インターレースソースフラグ（ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールド１３８を含み得る。ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールド１３９は、ＣＭＡＦトラック１２３内のビデオがプログレッシブスキャニングに従ってコーディングされるかどうかを示すようセットされ得る。ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールド１３８は、ＣＭＡＦトラック１２３内のビデオがインターレーシングに従ってコーディングされるかどうかを示すようセットされ得る。例において、ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールド１３８、ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールド１３９、又はその両方は、１にセットされることを必要とされ得る。これは、コーディングされたビデオ１１９がインターレーシング、プログレッシブスキャニング、又はその両方に従ってコーディングされていることを示す。

上述されたように、ＤＣＩＮＡＬユニット１１５、ＶＰＳ１１１、及び／又はＳＰＳ１１３は、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０を含み得る。ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０は、コーディングされたビデオをコーディングするために使用されるプロファイル、ティア、及びレベルに関する情報を含む。プロファイルは、コーディングされたビデオをコーディングするために使用されるプロファイルを示す。異なるプロファイルは、異なるビット深さ、異なるクロマサンプリングフォーマット、交差成分予測利用可能性、イントラ平滑化無効化利用可能性のような、異なるコーディング特性（例えば、異なるコーディングツールの利用可能性）を有する。ティアは、コーディングされたビデオ１１９が高ティア又は主ティアに従ってコーディングされており、従って一般的なアプリケーションのうち要件の厳しいアプリケーションのためにコーディングされているかどうかを示す。レベルは、ビットレート最大値、最大ピクチャサイズ、最大サンプルレート、最大フレームレートでの分解能、タイルの最大数、ピクチャごとのスライスの最大数、などのような、コーディングされたビデオ１１９に関する制約を示す。従って、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０内のＰＴＬ情報は、コーディングされたビデオ１１９を復号化及び表示するためにデコーダが有さなければならない能力を記述する。

ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ構造１３０は、ＰＴＬフレームのみ制約フラグ（ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇ）フィールド１４１、ＰＴＬマルチレイヤ有効化フラグ（ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）フィールド１４３、汎用プロファイル識別コード（ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ）１４５、汎用ティアフラグ（ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ）１４７、汎用レベル識別コード（ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ）１４９、サブレイヤプロファイルの数（ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ）１４２、及び／又は各ｉ番目のインターオペラビリティインジケータの汎用サブレイヤプロファイル識別コード（ｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］）１４４を含み得る。ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇフィールド１４１は、フレーム（例えば、完全なスクリーン画像）又はフィールド（例えば、スクリーンを満たすために結合されるよう意図された部分的なスクリーン画像）を表すピクチャをＣＶＳ１１７が運ぶかどうかを指定する。例において、制約は、ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇフィールド１４１が１にセットされることを求める場合がある。これは、フレームとしてコーディングされたピクチャがコーディングされたビデオ１１９に含まれることを示す。ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ１４３は、コーディングされたビデオ１１９が複数のレイヤでコーディングされるかどうかを示す。例において、ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇ１４３は０にセットされ、これは、コーディングされたビデオ１１９が単一のレイヤでコーディングされることを示す。

ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ１４５、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ１４７、及びｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ１４９は、コーディングされたビデオ１１９のプロファイル、ティア、及びレベルを夫々示す。ｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］１４４は、インターオペラビリティインジケータの０乃至ｉ個の値を示す。ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ１４２は、ｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］１４４に含まれるシンタックス要素の数を示す。例において、ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ１４５、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ１４７、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ１４９、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ１４２、及びｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］１４４に含まれる値は、同じＶＶＣストリーム内でＣＶＳ１１７ごとに不変であることを求められる。他の例では、ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ１４５、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ１４７、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ１４９、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ１４２、及びｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］１４４に含まれる値は、ＣＭＡＦトラック１２３内で不変であることを求められる。

上記の問題及び他を解決するために、以下で要約される方法が開示される。項目は、一般概念について説明するための例と見なされるべきであり、狭い意味で解釈されるべきではない。更に、これらの項目は、個々に適用されても、又は任意の方法で組み合わされてもよい。

［例１］
一例で、規則は、ＤＣＩＮＡＬユニットがＶＶＣＣＭＡＦトラックに存在すべきであることを定めてよい。

［例２］
一例で、規則は、ＤＣＩＮＡＬユニットがＶＶＣＣＭＡＦトラックに存在しなければならないことを定めてよい。

［例３］
一例で、規則は、ＶＶＣＣＭＡＦトラックに存在する全てのＤＣＩＮＡＬユニットが同じコンテンツを有さなければならないことを定めてよい。

［例４］
一例で、規則は、ＶＶＣＣＭＡＦトラックにはただ１つのＤＣＩＮＡＬユニットが存在しなければならないことを定めてよい。

［例５］
一例で、規則は、ＤＣＩＮＡＬユニットがＶＶＣＣＭＡＦトラックに存在する場合に、ＤＣＩＮＡＬユニットがＣＭＡＦヘッダサンプルエントリに存在しなければならないことを定めてよい。

［例６］
一例で、規則は、ＶＶＣＣＭＡＦトラック内のＤＣＩＮＡＬユニットにおけるｄｃｉ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１フィールドの値が０に等しくなければならないことを定めてよい。

［例７］
一例で、規則は、ＶＶＣＣＭＡＦトラック内のＤＣＩＮＡＬユニットにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造内のｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇフィールドの値が１に等しくなければならないことを定めてよい。

［例８］
一例で、規則は、ＶＶＣＣＭＡＦトラック内のＤＣＩＮＡＬユニットにおけるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造内のｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇフィールドの値が０に等しくなければならないことを定めてよい。

［例９］
一例で、規則は、ＶＶＣＣＭＡＦトラックにはただ１つのＶＰＳユニットが存在しなければならないことを定めてよい。

［例１０］
一例で、規則は、ＤＣＩＮＡＬユニットがＶＶＣＣＭＡＦトラックに存在せず、１つ以上のＶＰＳがＶＶＣＣＭＡＦトラックに存在する場合に、次の制約のうちの１つ以上が適用されることを定めてよい。制約は、ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１フィールドの値が各ＶＰＳについて０に等しくなければならず、かつ、ｖｐｓ＿ｎｕｍ＿ｐｔｌｓ＿ｍｉｎｕｓ１フィールドの値が各ＶＰＳについて０に等しくなければならないことを含む。

例において、次の制約が、各ＶＰＳ内のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造に適用される。そのような制約は、ｐｔｌ＿ｆｒａｍｅ＿ｏｎｌｙ＿ｃｏｎｔｒａｉｎｔ＿ｆｌａｇフィールドの値が１に等しくなければならず、かつ、ｐｔｌ＿ｍｕｌｔｉｌａｙｅｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇフィールドの値が０に等しくなければならないことを含む。

例において、参照されているＶＰＳのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造内の次のフィールド：ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ、及びｉ個の値の夫々のｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］、の夫々の値は、ＶＶＣエレメンタリストリームにわたって、コーディングされたビデオシーケンスごとに変化してはならない。例において、規則は、これらの各フィールドの値が、ＶＶＣＣＭＡＦトラックに存在する全てのＶＰＳについて同じであることを求めてもよい。

［例１１］
一例で、規則は、ＶＶＣＣＭＡＦトラック内のＳＰＳにおけるｖｕｉ＿ｐａｙｌｏａｄ（）構造内のｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールドの値が１に等しくなければならないことを定めてよい。

［例１２］
一例で、規則は、ＶＶＣＣＭＡＦトラック内のＳＰＳにおけるｖｕｉ＿ｐａｙｌｏａｄ（）構造内のｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールドの値が１に等しくなければならないことを定めてよい。

［例１３］
一例で、規則は、ＤＣＩＮＡＬユニットが存在せず、ＶＰＳがＶＶＣＣＭＡＦトラックに存在しない場合に、参照されているＳＰＳのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）構造内の次のフィールド：ｇｅｎｅｒａｌ＿ｐｒｏｆｉｌｅ＿ｉｄｃ、ｇｅｎｅｒａｌ＿ｔｉｅｒ＿ｆｌａｇ、ｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃ、ｎｕｍ＿ｓｕｂ＿ｐｒｏｆｉｌｅｓ、及びｉ個の値の夫々のｇｅｎｅｒａｌ＿ｓｕｂ＿ｐｒｏｆｉｌｅ＿ｉｄｃ［ｉ］、の夫々の値が、ＶＶＣエレメンタリストリームにわたって、コーディングされたビデオシーケンスごとに変化してはならないことを定めてよい。例において、規則は、これらの各フィールドの値が、ＶＶＣＣＭＡＦトラックに存在する全てのＳＰＳについて同じであることを求めてもよい。

［例１４］
一例で、規則は、参照されているＶＰＳ又はＳＰＳ内で存在する場合にｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）構造内の次のフィールド：ｎｕｍ＿ｕｎｉｔｓ＿ｉｎ＿ｔｉｃｋ及びｔｉｍｅ＿ｓｃａｌｅ、の夫々の値が、ＶＶＣエレメンタリストリームにわたって、コーディングされたビデオシーケンスごとに変化してはならないことを定めてよい。例において、規則は、これらの各フィールドの値が、ＶＶＣＣＭＡＦトラックに存在するＶＰＳ又はＳＰＳ内の全てのｇｅｎｅｒａｌ＿ｔｉｍｉｎｇ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（構造）について同じでなければならないことを求めてもよい。

上記の例の実施形態についてこれより説明する。この実施形態はＣＭＡＦに適用され得る。ＶＶＣＣＭＡＦ仕様に関して、追加又は変更されているほとんどの関連部分は、下線付き太字で示され、削除された部分のいくつかは、太字イタリック体で示される。本質的に編集的であって、従って強調表示されないいくつか他の変更がある場合がある。

Ｘ．１ＶＶＣビデオＣＭＡＦトラック。ＶＶＣＣＭＡＦトラックは、ＮＡＬ構造化ビデオＣＭＡＦトラックの要件に従わなければならない。更に、それは、この付録内の残り全ての要件に従わなければならない。ＣＭＡＦトラックがこれらの要件に従う場合に、それは、ＶＶＣビデオＣＭＡＦトラックと呼ばれ、ブランド‘ｃｖｖｃ’を使用し得る。

Ｘ．２ＶＶＣビデオトラック制約。Ｘ．２．１ＶＶＣビデオＣＭＡＦスイッチングセット制約。ＣＭＡＦスイッチングセット内のあらゆるＣＭＡＦトラックは、第Ｘ．１項で定義されるようにＶＶＣビデオＣＭＡＦトラックに従わなければならない。ＶＶＣビデオＣＭＡＦスイッチングセットは、ＮＡＬ構造化ビデオＣＭＡＦスイッチングセットに対する制約に従わなければならない。

Ｘ．２．２視覚サンプルエントリ。ＶＶＣビデオトラックの視覚サンプルエントリのシンタックス及び値は、ＩＳＯ／ＩＥＣ１４４９６－１５で定義されるように
（外１）

に従わなければならない。

図２は、本明細書で開示される様々な技術が実装され得る例示的なビデオ処理システム４０００を示すブロック図である。様々な実施は、システム４０００のコンポーネントの一部又は全部を含んでよい。システム４０００は、ビデオコンテンツを受ける入力部４００２を含み得る。ビデオコンテンツは、生の又は圧縮されていないフォーマット、例えば、８又は１０ビットのマルチコンポーネントピクセル値で受け取られてもよく、あるいは、圧縮又は符号化されたフォーマットであってもよい。入力部４００２は、ネットワークインターフェース、ペリフェラルバスインターフェース、又はストレージインターフェースに相当してもよい。ネットワークインターフェースの例には、Ｅｔｈｅｒｎｅｔ（登録商標）、受動光ネットワーク（ＰＯＮ）などのような有線インターフェース、及びＷｉ－Ｆｉ又はセルラーネットワークなどの無線インターフェースが含まれる。

システム４０００は、本明細書で記載されている様々なコーディング又は符号化方法を実装し得るコーディングコンポーネント４００４を含んでもよい。コーディングコンポーネント４００４は、ビデオのコーディングされた表現を生成するよう、入力部４００２からコーディングコンポーネント４００４の出力部へのビデオの平均ビットレートを低減し得る。コーディング技術は、従って、ビデオ圧縮又はビデオトランスコーディング技術と時々呼ばれる。コーディングコンポーネント４００４の出力は、コンポーネント４００６によって表されるように、保存されても、あるいは、接続された通信を介して伝送されてもよい。入力部４００２で受け取られたビデオの保存又は通信されたビットストリーム（又はコーディングされた）表現は、ピクセル値又は表示インターフェース４０１０へ送られる表示可能なビデオを生成するためのコンポーネント４００８によって使用されてもよい。ユーザが見ることができるビデオをビットストリーム表現から生成するプロセスは、ビデオ圧縮解除と時々呼ばれる。更に、特定のビデオ処理動作が「コーディング」動作又はツールと呼ばれる一方で、そのようなコーディングツール又は動作はエンコーダで使用され、コーディングの結果を入れ替える対応する復号化ツール又は動作は、デコーダによって実行されることになることが理解されるだろう。

ペリフェラルバスインターフェース又は表示インターフェースの例には、ユニバーサルシリアルバス（ＵＳＢ）又は高精細マルチメディアインターフェース（ＨＤＭＩ（登録商標））又はＤｉｓｐｌａｙｐｏｒｔ（登録商標）などが含まれ得る。ストレージインターフェースの例には、ＳＡＴＡ（Serial Advanced Technology Attachment）、ＰＣＩ、ＩＤＥインターフェース、などがある。本明細書で説明されている技術は、携帯電話機、ラップトップ、スマートフォン、あるいは、デジタルデータ処理及び／又はビデオ表示を実行する能力がある他のデバイスなどの様々な電子デバイスで具現されてもよい。

図３は、ビデオ処理装置４１００のブロック図である。装置４１００は、本明細書で記載されている方法の１つ以上を実装するために使用され得る。装置４１００は、スマートフォン、タブレット、コンピュータ、インターネット・オブ・シングス（ＩｏＴ）レシーバ、などで具現されてもよい。装置４１００は、１つ以上のプロセッサ４１０２、１つ以上のメモリ４１０４、及びビデオ処理回路４１０６を含み得る。プロセッサ４１０２は、本明細書で記載される１つ以上の方法を実装するよう構成され得る。メモリ（複数のメモリ）４１０４は、本明細書で記載される方法及び技術を実装するために使用されるデータ及びコードを記憶するために使用され得る。ビデオ処理回路４１０６は、ハードウェア回路において、本明細書で記載されるいくつかの技術を実装するために使用され得る。いくつかの実施形態において、ビデオ処理回路４１０６は、部分的に又は完全にプロセッサ４１０２、例えば、グラフィクスプロセッサコアに含まれてもよい。

図４は、ビデオ処理の例示的な方法４２００についてのフローチャートである。方法４２００は、ステップ４２０２で、ＶＶＣＣＭＡＦトラックにおけるＳＰＳ内の情報を決定するステップを含む。例において、規則は、ＳＰＳ内のｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールドの値が１に等しくなければならないことを定める。例において、ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇはｖｕｉ＿ｐａｙｌｏａｄ構造に含まれる。例において、ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇは、ＶＶＣＣＭＡＦトラック内のビデオがプログレッシブスキャニングに従ってコーディングされることを示すよう１に等しい。例において、規則は、ＳＰＳ内のｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇフィールドの値が１に等しくなければならないことを定める。例において、ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇはｖｕｉ＿ｐａｙｌｏａｄ構造に含まれる。例において、ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇは、ＶＶＣＣＭＡＦトラック内のビデオがインターレーシングに従ってコーディングされることを示すよう１に等しい。例において、ＳＰＳはＶＶＣエレメンタリストリームに含まれ、ＶＶＣエレメンタリストリームはＣＭＡＦトラックに含まれる。

ステップ４２０４で、ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間で変換が実行される。方法４２００がエンコーダで実行される場合に、変換は、視覚メディアデータに従ってメディアデータファイルを生成することを有する。変換は、ＳＰＳを決定し、ＣＭＡＦトラックに含まれるビットストリーム内に符号化することを含む。方法４２００がデコーダで実行される場合に、変換は、ＳＰＳに従ってＣＭＡＦトラック内のビットストリームをパース及び復号化して、視覚メディアデータを取得することを有する。

留意されるべきは、方法４２００は、ビデオエンコーダ４４００、ビデオデコーダ４５００、及び／又はエンコーダ４６００のような、プロセッサと、命令を有する非一時的なメモリとを有するビデオデータ処理装置で実装され得ることである。更に、方法４２００は、ビデオコーディングデバイスによって使用されるコンピュータプログラム製品を有する非一時的なコンピュータ可読媒体によって実行され得る。コンピュータプログラム製品は、プロセッサによって実行される場合にビデオコーディングデバイスに方法４２００を実行させる、非一時的なコンピュータ可読媒体に記憶されたコンピュータ実行可能命令を有する。

図５は、本開示の技術を利用し得る、例となるビデオコーディングシステム４３００を表すブロック図である。ビデオコーディングシステム４３００は、発信元デバイス４３１０及び送信先デバイス４３２０を含んでよい。発信元デバイス４３１０は、符号化されたビデオデータを生成し、ビデオ符号化デバイスと呼ばれ得る。送信先デバイス４３２０は、発信元デバイス４３１０によって生成された符号化されたビデオデータを復号することができ、ビデオ復号化デバイスと呼ばれ得る。

発信元デバイス４３１０は、ビデオソース４３１２、ビデオエンコーダ４３１４、及び入力／出力（Ｉ／Ｏ）インターフェース４３１６を含んでよい。ビデオソース４３１２は、ビデオ捕捉デバイスなどのソース、ビデオコンテンツプロバイダからビデオデータを受け取るインターフェース、及び／又はビデオデータを生成するコンピュータグラフィクスシステム、あるいは、そのようなソースの組み合わせを含んでよい。ビデオデータは１つ以上のピクチャを有してもよい。ビデオエンコーダ４３１４は、ビットストリームを生成するようビデオソース４３１２からのビデオデータを符号化する。ビットストリームは、ビデオデータのコーディングされた表現を形成するビットのシーケンスを含んでよい。ビットストリームは、コーディングされたピクチャ及び関連するデータを含んでもよい。コーディングされたピクチャは、ピクチャのコーディングされた表現である。関連するデータは、シーケンスパラメータセット、ピクチャパラメータセット、及び他のシンタックス構造を含んでもよい。Ｉ／Ｏインターフェース４３１６は、変調器／復調器（モデム）及び／又は送信器を含んでよい。符号化されたビデオデータは、Ｉ／Ｏインターフェース４３１６を介して送信先デバイス４３２０に対してネットワーク４３３０を通じて直接に伝送されてよい。符号化されたビデオデータはまた、送信先デバイス４３２０によるアクセスのために記憶媒体／サーバ４３４０に記憶されてもよい。

送信先デバイス４３２０は、Ｉ／Ｏインターフェース４３２６、ビデオデコーダ４３２４、及び表示デバイス４３２２を含んでよい。Ｉ／Ｏインターフェース４３２６は、受信器及び／又はモデムを含んでよい。Ｉ／Ｏインターフェース４３２６は、発信元デバイス４３１０又は記憶媒体／サーバ４３４０から符号化されたビデオデータを取得してよい。ビデオデコーダ４３２４は、符号化されたビデオデータを復号してよい。表示デバイス４３２２は、復号されたビデオデータをユーザに表示してよい。表示デバイス４３２２は、送信先デバイス４３２０と一体化されてもよく、あるいは、外付け表示デバイスとインターフェース接続するよう構成されて送信先デバイス４３２０の外にあってもよい。

ビデオエンコーダ４３１４及びビデオデコーダ４３２４は、ＨＥＶＣ（High Efficiency Video Coding）標準規格、ＶＶＣ（Versatile Video Coding）標準規格、並びに他の現在の及び／又は更なる標準規格などのビデオ圧縮規格に従って作動してもよい。

図６は、ビデオエンコーダ４４００の例を表すブロックであり、図５に表されているシステム４３００のビデオエンコーダ４３１４であってよい。ビデオエンコーダ４４００は、本開示の技術のいずれか又は全てを実行するよう構成されてよい。ビデオエンコーダ４４００は、複数の機能コンポーネントを含む。本開示で記載される技術は、ビデオエンコーダ４４００の様々なコンポーネントの間で共有されてもよい。いくつかの例では、プロセッサは、本開示で記載される技術のいずれか又は全てを実行するよう構成されてもよい。

ビデオエンコーダ４４００の機能コンポーネントは、パーティションユニット４４０１と、モード選択ユニット４４０３、動き推定ユニット４４０４、動き補償ユニット４４０５及びイントラ予測ユニット４４０６を含み得る予測ユニット４４０２と、残差生成ユニット４４０７と、変換ユニット４４０８と、量子化ユニット４４０９と、逆量子化ユニット４４１０と、逆変換ユニット４４１１と、再構成ユニット４４１２と、バッファ４４１３と、エントロピ符号化ユニット４４１４とを含んでよい。

他の例では、ビデオエンコーダ４４００は、より多い、より少ない、又は異なる機能コンポーネントを含んでもよい。例において、予測ユニット４４０２は、イントラブロックコピー（Intra Block Copy，ＩＢＣ）ユニットを含んでもよい。ＩＢＣユニットは、少なくとも１つの参照ピクチャが、現在のビデオブロックが位置しているピクチャであるＩＢＣモードで、予測を実行し得る。

更に、動き推定ユニット４４０４及び動き補償ユニット４４０５などのいくつかのコンポーネントは、高度に集積されてもよいが、説明のために図６の例では別々に表されている。

パーティションユニット４４０１は、ピクチャを１つ以上のビデオブロックにパーティション化してよい。ビデオエンコーダ４４００及びビデオデコーダ４５００は、様々なビデオブロックサイズをサポートし得る。

モード選択ユニット４４０３は、例えば、エラー結果に基づいて、イントラ又はインターのコーディングモードの１つを選択し、結果として得られたイントラ又はインターコーディングされたブロックを、残差ブロックデータを生成する残差生成ユニット２０７へ、及び参照ピクチャとしての使用のために、符号化されたブロックを再構成する再構成ユニット２１２へ供給してよい。いくつかの例では、モード選択ユニット４４０３は、予測がインター予測信号及びイントラ予測信号に基づくイントラ－インター複合予測（Combination of Intra and Inter Prediction，ＣＩＩＰ）モードを選択してもよい。モード選択ユニット４４０３はまた、インター予測の場合に、ブロックの動きベクトルのための分解能（例えば、サブピクセル又は整数ピクセル精度）を選択してもよい。

現在のビデオブロックに対してインター予測を実行するために、動き推定ユニット４４０４は、バッファ４４１３からの１つ以上の参照フレームを現在のビデオブロックと比較することによって、現在のビデオブロックの動き情報を生成してもよい。動き補償ユニット４４０５は、動き情報と、現在のビデオブロックに関連したピクチャ以外のバッファ４４１３からのピクチャの復号されたサンプルとに基づいて、現在のビデオブロックの予測されたビデオブロックを決定してもよい。

動き推定ユニット４４０４及び動き補償ユニット４４０５は、例えば、現在のビデオブロックがＩスライス、Ｐスライス、又はＢスライスであるかどうかに応じて、現在のビデオブロックのために異なる動作を実行してもよい。

いくつかの例では、動き推定ユニット４４０４は、現在のビデオブロックのために一方向予測を実行してもよく、動き推定ユニット４４０４は、現在のビデオブロックのための参照ビデオブロックをリスト０又はリスト１の参照ピクチャから探してもよい。動き推定ユニット４４０４は、次いで、参照ビデオブロックを含むリスト０又はリスト１内の参照ピクチャを示す参照インデックスと、現在のビデオブロックと参照ビデオブロックとの間の空間変位を示す動きベクトルとを生成してよい。動き推定ユニット４４０４は、現在のビデオブロックの動き情報として参照インデックス、予測方向インジケータ、及び動きベクトルを出力し得る。動き補償ユニット４４０５は、現在のビデオブロックの動き情報によって示されている参照ビデオブロックに基づいて、現在のブロックの予測されたビデオブロックを生成し得る。

他の例では、動き推定ユニット４４０４は、現在のビデオブロックのために双方向予測を実行してもよく、動き推定ユニット４４０４は、現在のビデオブロックのための参照ビデオブロックをリスト０内の参照ピクチャから探してもよく、また、現在のビデオブロックのためのもう１つの参照ビデオブロックをリスト１内の参照ピクチャから探してもよい。動き推定ユニット４４０４は、次いで、参照ビデオブロックを含むリスト０及びリスト１内の参照ピクチャを示す参照インデックスと、参照ビデオブロックと現在のビデオブロックとの間の空間変位を示す動きベクトルとを生成してもよい。動き推定ユニット４４０４は、現在のビデオブロックの動き情報として現在のビデオブロックの参照インデックス及び動きベクトルを出力し得る。動き補償ユニット４４０５は、現在のビデオブロックの動き情報によって示されている参照ビデオブロックに基づいて、現在のビデオブロックの予測されたビデオブロックを生成し得る。

いくつかの例では、動き推定ユニット４４０４は、デコーダの復号化処理のために動き情報のフルセットを出力してもよい。いくつかの例では、動き推定ユニット４４０４は、現在のビデオの動き情報のフルセットを出力しなくてもよい。むしろ、動き推定ユニット４４０４は、他のビデオブロックの動き情報を参照して現在のビデオブロックの動き情報を通知してもよい。例えば、動き推定ユニット４４０４は、現在のビデオブロックの動き情報が隣接ビデオブロックの動き情報と十分に類似していることを決定してもよい。

一例において、動き推定ユニット４４０４は、現在のビデオブロックに関連したシンタックス構造において、現在のビデオブロックが他のビデオブロックと同じ動き情報を有していることをビデオデコーダ４５００に示す値を示してもよい。

他の例では、動き推定ユニット４４０４は、現在のビデオブロックに関連したシンタックス構造において、他のビデオブロック及び動きベクトル差分（Motion Vector Difference，ＭＶＤ）を特定してもよい。動きベクトル差分は、現在のビデオブロックの動きベクトルと、特定されているビデオブロックの動きベクトルとの間の差を示す。ビデオデコーダ４５００は、現在のビデオブロックの動きベクトルを決定するために、特定されているビデオブロックの動きベクトル及び動きベクトル差分を使用し得る。

上述されたように、ビデオエンコーダ４４００は、動きベクトルを予測的に通知してもよい。ビデオエンコーダ４４００によって実装され得る予測シグナリング技術の２つの例には、アドバンスド動きベクトル予測（Advanced Motion Vector Prediction，ＡＭＶＰ）及びマージモードシグナリングがある。

イントラ予測ユニット４４０６は、現在のビデオブロックに対してイントラ予測を実行してもよい。イントラ予測ユニット４４０６が現在のビデオブロックに対してイントラ予測を実行する場合に、イントラ予測ユニット４４０６は、同じピクチャ内の他のビデオブロックの復号されたサンプルに基づいて、現在のビデオブロックの予測データを生成し得る。現在のビデオブロックの予測データは、予測されたビデオブロック及び様々なシンタックス要素を含んでもよい。

残差生成ユニット４４０７は、現在のビデオブロックから現在のビデオブロックの予測されたビデオブロックを減じることによって、現在のビデオブロックの残差データを生成し得る。現在のビデオブロックの残差データは、現在のビデオブロック内のサンプルの異なるサンプルコンポーネントに対応する残差ビデオブロックを含んでもよい。

他の例では、例えば、スキップモードにおいては、現在のビデオブロックについて、現在のビデオブロックの残差データは存在しない場合があり、残差生成ユニット４４０７は、減算演算を実行しなくてもよい。

変換処理ユニット４４０８は、現在のビデオブロックに関連した残差ビデオブロックに１つ以上の変換を適用することによって、現在のビデオブロックの１つ以上の変換係数ビデオブロックを生成し得る。

変換処理ユニット４４０８が現在のビデオブロックに関連した変換係数ビデオブロックを生成した後、量子化ユニット４４０９は、現在のビデオブロックに関連した１つ以上の量子化パラメータ（ＱＰ）値に基づいて、現在のビデオブロックに関連した変換係数ビデオブロックを量子化し得る。

逆量子化ユニット４４１０及び逆変換ユニット４４１１は、変換係数ビデオブロックに各々逆量子化及び逆変換を適用して、変換係数ビデオブロックから残差ビデオブロックを再構成し得る。再構成ユニット４４１２は、再構成された残差ビデオブロックを、予測ユニット４４０２によって生成された１つ以上の予測されたビデオブロックからの対応するサンプルに加えて、バッファ４４１３での記憶のために、現在のブロックに関連した再構成されたビデオブロックを生成し得る。

再構成ユニット４４１２がビデオブロックを再構成した後、ループフィルタリング動作が、ビデオブロックにおいてビデオブロッキングアーチファクトを低減するよう実行されてもよい。

エントロピ符号化ユニット４４１４は、ビデオエンコーダ４４００の他の機能コンポーネントからデータを受け取ってもよい。エントロピ符号化ユニット４４１４がデータを受け取るとき、エントロピ符号化ユニット４４１４は、エントロピ符号化されたデータを生成し、そのエントロピ符号化されたデータを含むビットストリームを出力するよう、１つ以上のエントロピ符号化動作を実行してもよい。

図７は、ビデオデコーダ４５００の例を表すブロック図であり、図５で表されているシステム４３００のビデオデコーダ４３２４であってよい。ビデオデコーダ４５００は、本開示の技術のいずれか又は全てを実行するよう構成されてよい。示されている例では、ビデオデコーダ４５００は、複数の機能コンポーネントを含む。本開示で記載される技術は、ビデオデコーダ４５００の様々なコンポーネントの間で共有されてもよい。いくつかの例では、プロセッサは、本開示で記載される技術のいずれか又は全てを実行するよう構成されてもよい。

示されている例では、ビデオデコーダ４５００は、エントロピ復号化ユニット４５０１と、動き補償ユニット４５０２と、イントラ予測ユニット４５０３と、逆量子化ユニット４５０４と、逆変換ユニット４５０５と、再構成ユニット４５０６と、バッファ４５０７とを含む。ビデオデコーダ４５００は、いくつかの例では、ビデオエンコーダ４４００に関して記載された符号化パスとは概して逆の復号化パスを実行してもよい。

エントロピ復号化ユニット４５０１は、符号化されたビットストリームを取り出し得る。符号化されたビットストリームは、エントロピコーディングされたビデオデータ（例えば、ビデオデータの符号化されたブロック）を含んでもよい。エントロピ復号化ユニット４５０１は、エントロピコーディングされたビデオデータを復号してよく、エントロピ復号化されたビデオデータから、動き補償ユニット４５０２は、動きベクトル、動きベクトル精度、参照ピクチャリストインデックス、及び他の動き情報を含む動き情報を決定し得る。動き補償ユニット４５０２は、例えば、ＡＭＶＰ及びマージモードを実行することによって、そのような情報を決定してもよい。

動き補償ユニット４５０２は、場合により、補間フィルタに基づく補間を実行して、動き補償されたブロックを生成し得る。サブピクセル精度で使用される補間フィルタのための識別子は、シンタックス要素に含まれてもよい。

動き補償ユニット４５０２は、参照ブロックのサブ整数ピクセルについて補間値を計算するために、ビデオブロックの符号化中にビデオエンコーダ４４００によって使用された補間フィルタを使用してもよい。動き補償ユニット４５０２は、受け取られたシンタックス情報に従って、ビデオエンコーダ４４００によって使用された補間フィルタを決定し、その補間フィルタを使用して予測ブロックを生成し得る。

動き補償ユニット４５０２は、符号化されたビデオシーケンスのフレーム及び／又はスライスを符号化するために使用されたブロックのサイズと、符号化されたビデオシーケンスのピクチャの各マクロブロックがどのようにパーティション化されているかを記述するパーティション情報と、各パーティションがどのように符号化されているかを示すモードと、各インターコーディングされたブロックについての１つ以上の参照フレーム（及び参照フレームリスト）と、符号化されたビデオシーケンスを復号するための他の情報とを決定するために、シンタックス情報のいくつかを使用してもよい。

イントラ予測ユニット４５０３は、空間的に隣接するブロックから予測ブロックを形成するよう、例えば、ビットストリームで受け取られたイントラ予測モードを使用してもよい。逆量子化ユニット４５０４は、ビットストリームで供給されてエントロピ復号化ユニット４５０１によって復号された量子化されたビデオブロック係数を逆量子化する、すなわち、量子化解除する。逆変換ユニット４５０５は、逆変換を適用する。

再構成ユニット４５０６は、動き補償ユニット４５０２又はイントラ予測ユニット４５０３によって生成された対応する予測ブロックを残差ブロックに加算して、復号されたブロックを形成し得る。望まれる場合には、デブロッキングフィルタも、ブロッキネスアーチファクトを取り除くために、復号されたブロックにフィルタをかけるよう適用されてもよい。復号されたビデオブロックは、次いで、バッファ４５０７に格納され、バッファ４５０７は、その後の動き補償／イントラ予測のための参照ブロックを提供し、また、復号されたビデオを表示デバイスでの提示のために生成する。

図８は、例となるエンコーダ４６００の概略図である。エンコーダ４６００は、ＶＶＣの技術を実装するのに適している。エンコーダ４６００は、３つのループフィルタ、つまり、デブロッキングフィルタ（Deblocking Filter，ＤＦ）４６０２、サンプル適応オフセット（Sample Adaptive Offset，ＳＡＯ）４６０４、及び適応ループフィルタ（Adaptive Loop Filter，ＡＬＦ）４６０６を含む。予め定義されたフィルタを使用するＤＦ４６０２とは異なり、ＳＡＯ４６０４及びＡＬＦ４６０６は、夫々、オフセットを加えることによって、及び有限インパルス応答（Finite Impulse Response，ＦＩＲ）フィルタを適用することによって、元のサンプルと再構成されたサンプルとの間の平均二乗誤差を低減するために現在のピクチャの元のサンプルを利用する。なお、コーディングされたサイド情報が、オフセット及びフィルタ係数を通知する。ＡＬＦ４６０６は、各ピクチャの最後の処理段に位置し、前の段によって生じたアーチファクトを見つけて直そうと試みるツールと見なされ得る。

エンコーダ４６００は、入力されたビデオを受け取るよう構成されたイントラ予測コンポーネント４６０８及び動き推定／補償（Motion Estimation/Compensation，ＭＥ／ＭＣ）コンポーネント４６１０を更に含む。イントラ予測コンポーネント４６０８は、イントラ予測を実行するよう構成され、一方、ＭＥ／ＭＣコンポーネント４６１０は、参照ピクチャバッファ４６１２から取得された参照ピクチャを利用してインター予測を実行するよう構成される。インター予測又はイントラ予測からの残差ブロックは、量子化された残差変換係数を生成するために、変換（Transform，Ｔ）コンポーネント４６１４及び量子化（Quantization，Ｑ）コンポーネント４６１６へ供給される。量子化された残差変換係数は、エントロピコーディングコンポーネント４６１８へ供給される。エントロピコーディングコンポーネント４６１８は、予測結果及び量子化された変換係数をエントロピコーディングし、それらをビデオデコーダ（図示せず）へ送信する。量子化コンポーネント４６１６から出力された量子化成分は、逆量子化（Inverse Quantization，ＩＱ）コンポーネント４６２０、逆変換（Inverse Transform，ＩＴ）コンポーネント４６２２、及び再構成（Reconstruction，Ｒｅｃ）コンポーネント４６２４へ供給され得る。Ｒｅｃコンポーネント４６２４は、画像を、それらの画像が参照ピクチャバッファ４６１２に格納される前にフィルタ処理するために、ＤＦ４６０２、ＳＡＯ４６０４及びＡＬＦ４６０６へ出力することができる。

いくつか例によって好まれる解決法のリストが、次に与えられる。

以下の解決法は、本明細書で説明されている技術の例を示す。

解決法１．メディアデータ処理の方法（図４に表されている方法４２００）であって、
視覚メディア情報と該視覚メディア情報のデジタル表現との間の変換を規則に従って実行するステップを有し、
前記規則は、復号化能力情報（ＤＣＩ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットが前記デジタル表現におけるコーディングされたエレメンタリストリームのトラックに含まれるかどうか又はどのように含まれるかを定める、
方法。

解決法２．前記規則は、前記ＤＣＩＮＡＬユニットが前記コーディングされたエレメンタリストリームの各トラックに含まれることを定める、解決法１に記載の方法。

解決法３．前記規則は、複数のＤＣＩＮＡＬユニットが前記コーディングされたエレメンタリストリームのトラックに含まれる場合に、前記複数のＤＣＩＮＡＬユニットが同じコンテンツを有することを定める、解決法１乃至２のうちいずれかに記載の方法。

解決法４．前記規則は、前記コーディングされたエレメンタリストリームのトラックにはただ１つのＤＣＩＮＡＬユニットが含まれることを定める、解決法１乃至２のうちいずれかに記載の方法。

解決法５．前記規則は、前記ＤＣＩＮＡＬユニットが、前記コーディングされたエレメンタリストリームのトラックに存在する場合に、前記トラックのヘッダサンプルエントリにあるよう制約されることを定める、解決法１に記載の方法。

解決法６．前記規則は、前記ＤＣＩＮＡＬユニット内のフィールドの値が所定の値に等しいよう制約されるという制約に前記ＤＣＩＮＡＬユニットが従うことを定める、解決法１乃至５のうちいずれかに記載の方法。

解決法７．前記フィールドは、プロファイル、ティア、レイヤ構造の数から１をマイナスした数を示し、前記所定の値は０に等しい、解決法６に記載の方法。

解決法８．前記フィールドは、プロファイル－ティア－レベルのマルチレイヤ指示が有効であるかどうかを示し、前記所定の値は１に等しい、解決法６に記載の方法。

解決法９．メディアデータ処理の方法であって、
視覚メディア情報と該視覚メディア情報のデジタル表現との間の変換を規則に従って実行するステップを有し、
前記規則は、ビデオパラメータセット（ＶＰＳ）ユニットが前記デジタル表現におけるコーディングされたエレメンタリストリームのトラックに含まれるかどうか又はどのように含まれるかを定める、
方法。

解決法１０．前記規則は、前記コーディングされたエレメンタリストリームのトラックにただ１つのＶＰＳユニットが含まれることを定める、解決法９に記載の方法。

解決法１１．前記規則は、前記コーディングされたエレメンタリストリームのトラックが前記ＶＰＳユニットを含むが、復号化能力情報（ＤＣＩ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを含まない場合に、前記デジタル表現が制約を満足することを定める、解決法９乃至１０のうちいずれかに記載の方法。

解決法１２．前記規則は、前記ＶＰＳユニット内のフィールドの値が所定の値に等しいよう制約されるという制約に前記ＶＰＳユニットが従うことを定める、解決法９乃至１１のうちいずれかに記載の方法。

解決法１３．前記規則は、前記コーディングされたエレメンタリストリームのトラックがＶＰＳユニットを含まず、復号化能力情報（ＤＣＩ）ネットワーク抽象化レイヤ（ＮＡＬ）ユニットを含む場合に、前記デジタル表現が制約を満足することを定める、解決法９乃至１２のうちいずれかに記載の方法。

解決法１４．メディアデータ処理の方法であって、
視覚メディア情報と該視覚メディア情報のデジタル表現との間の変換を規則に従って実行するステップを有し、
前記規則は、シーケンスパラメータセットのビデオパラメータセットによって参照される仮想参照デコーダ構造に含まれるフィールドの値が前記デジタル表現におけるコーディングされたエレメンタリストリームで１つのコーディングされたビデオシーケンスから第２のコーディングされたビデオシーケンスへ変化することを許されるかどうか又はその方法を定める、
方法。

解決法１５．前記値は時間スケールを示す、解決法１４に記載の方法。

解決法１６．前記規則は、前記フィールドの値が前記デジタル表現における各仮想参照デコーダ構造で同じであることを定める、解決法１４乃至１５のうちいずれかに記載の方法。

解決法１７．メディアデータ処理の方法であって、
視覚メディア情報のデジタル表現を取得するステップであり、前記デジタル表現は、解決法１乃至１６のうちいずれかに記載の方法に従って生成される、ステップと、
前記デジタル表現をストリーミングするステップと
を有する方法。

解決法１８．メディアデータ処理の方法であって、
視覚メディア情報のデジタル表現を受け取るステップであり、前記デジタル表現は、解決法１乃至１６のうちいずれかに記載の方法に従って生成される、ステップと、
前記デジタル表現から前記視覚メディア情報を生成するステップと
を有する方法。

解決法１９．前記変換は、前記視覚メディア情報のビットストリーム表現を生成し、該ビットストリーム表現をフォーマット規則に従ってファイルに格納することを有する、解決法１乃至１８のうちいずれかに記載の方法。

解決法２０．前記変換は、フォーマット規則に従ってファイルをパースして前記視覚メディア情報を回復することを有する、解決法１乃至１８のうちいずれかに記載の方法。

解決法２１．解決法１乃至２０のうちの１つ以上に記載の方法を実装するよう構成されたプロセッサを有するビデオ復号化装置。

解決法２２．解決法１乃至２０のうちの１つ以上に記載の方法を実装するよう構成されたプロセッサを有するビデオ符号化装置。

解決法２３．コンピュータコードを記憶するコンピュータプログラム製品であって、
前記コードは、プロセッサによって実行される場合に、該プロセッサに、解決法１乃至２０のうちいずれかに記載の方法を実装させる、コンピュータプログラム製品。

解決法２４．解決法１乃至２０のうちいずれかに記載の方法に従って生成される、ファイルフォーマットに従うビットストリーム表現が記憶されるコンピュータ可読媒体。

解決法２５．本明細書で記載される方法、装置、又はシステム。本明細書で記載される解決法では、エンコーダは、コーディングされた表現をフォーマット規則に従って生成することによって、フォーマット規則に従い得る。本明細書で記載される解決法では、デコーダは、復号されたビデオを生成するために、フォーマット規則に従ってシンタックス要素の有無を知った上で、コーディングされた表現のシンタックス要素をパースするようフォーマット規則を使用し得る。

本明細書中、「ビデオ処理」（video processing）という用語は、ビデオ符号化（video encoding）、ビデオ復号化（video decoding）、ビデオ圧縮（video compression）又はビデオ圧縮解除（video decompression）を指し得る。例えば、ビデオ圧縮アルゴリズムは、ビデオのピクセル表現から、対応するビットストリーム表現への変換中に、又はその逆も同様に、適用されてもよい。現在のビデオブロックのビットストリーム表現は、例えば、シンタックスによって定義されるような、ビットストリーム内で同一位置にあるか又は異なった場所に広がっているかのどちらかであるビットに対応してもよい。例えば、マクロブロックは、変換及びコーディングされた誤差残余値に関して、更には、ビットストリーム内のヘッダ及び他のフィールドにおけるビットを用いて、符号化されてよい。更に、変換中に、デコーダは、上記の解決法で記載されるように、決定に基づき、いくつかのフィールドが存在又は不存在であり得ると知った上で、ビットストリームをパースし得る。同様に、エンコーダは、特定のシンタックスフィールドが含まれるべきか又は含まれないべきかを決定し、それに応じて、コーディングされた表現にシンタックス要素を含めること又はコーディングされた表現からシンタックス要素を除くことによって、コーディングされた表現を生成し得る。

本明細書中で記載されている開示された及び他の解決法、例、実施形態、モジュール及び機能動作は、デジタル電子回路で、あるいは、本明細書で開示されている構造及びそれらの構造的な同等物を含むコンピュータソフトウェア、ファームウェア、又はハードウェアで、あるいは、それらのうちの１つ以上の組み合わせで実装可能である。開示された及び他の実施形態は、１つ以上のコンピュータプログラム製品、つまり、データ処理装置によって実行されるか又はその動作を制御するためにコンピュータ可読媒体で符号化されたコンピュータプログラム命令の１つ以上のモジュール、として実装可能である。コンピュータ可読媒体は、マシン可読記憶デバイス、マシン可読記憶基板、メモリデバイス、マシン可読な伝播信号に影響を与える物質の組成、又はそれらの１つ以上の組み合わせであることができる。「データ処理装置」という用語は、例として、プログラム可能なプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータを含む、データを処理するための全ての装置、デバイス、及びマシンを包含する。装置は、ハードウェアに加えて、問題となっているコンピュータプログラムのための実行環境を作り出すコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又はそれらの１つ以上の組み合わせを構成するコードを含むことができる。伝播信号は、人工的に生成された信号、例えば、マシンにより生成された電気的、光学的、又は電磁気信号であり、適切なレシーバ装置への伝送のために情報を符号化するよう生成される。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られる。）は、コンパイル済み又は解釈済みの言語を含む如何なる形式のプログラミング言語でも記述可能であり、それは、スタンドアロンプログラムとして又はコンピューティング環境における使用に適したモジュール、コンポーネント、サブルーチン、若しくは他のユニットとしてを含め、如何なる形式でもデプロイ可能である。コンピュータプログラムは、必ずしもファイルシステムにおけるファイルに対応するわけではない。プログラムは、問題となっているプログラムに専用の単一のファイルで、又は複数の協調したファイル（例えば、１つ以上のモジュール、サブプログラム、又はコードの部分を保存するファイル）で、他のプログラム又はデータ（例えば、マークアップ言語文書で保存された１つ以上のスクリプト）を保持するファイルの部分において保存可能である。コンピュータプログラムは、１つのコンピュータで、あるいは、１つの場所に位置しているか、又は複数の場所にわたって分布しており、通信ネットワークによって相互接続されている複数のコンピュータで実行されるようデプロイ可能である。

本明細書で説明されているプロセス及びロジックフローは、入力データに作用して出力を生成することによって機能を実行するよう１つ以上のコンピュータプログラムを実行する１つ以上のプログラム可能なプロセッサによって実行可能である。プロセス及びロジックフローはまた、専用のロジック回路、例えば、ＦＰＧＡ（Field Programmable Gate Array）又はＡＳＩＣ（Application Specific Integrated Circuit）によっても実行可能であり、装置は、そのようなものとして実装可能である。

コンピュータプログラムの実行に適したプロセッサは、例として、汎用のマイクロプロセッサ及び専用のマイクロプロセッサの両方、並びにあらゆる種類のデジタルコンピュータのいずれか１つ以上のプロセッサを含む。一般に、プロセッサは、リード・オンリー・メモリ若しくはランダム・アクセス・メモリ又はその両方から命令及びデータを読み出すことになる。コンピュータの必須の要素は、命令を実行するプロセッサと、命令及びデータを保存する１つ以上のメモリデバイスとである。一般に、コンピュータはまた、データを保存する１つ以上の大容量記憶デバイス、例えば、磁気、光学磁気ディスク、又は光ディスクを含むか、あるいは、そのような１つ以上の大容量記憶デバイスからのデータの受信若しくはそれへのデータの転送又はその両方のために動作可能に結合されることになる。しかし、コンピュータは、そのようなデバイスを有する必要はない。コンピュータプログラム命令及びデータを保存するのに適したコンピュータ可読媒体は、例として、半導体メモリデバイス、例えば、消去可能なプログラム可能リード・オンリー・メモリ（ＥＰＲＯＭ）、電気的消去可能なプログラム可能リード・オンリー・メモリ（ＥＥＰＲＯＭ）、及びフラッシュメモリデバイス；磁気ディスク、例えば、内蔵ハードディスク又はリムーバブルディスク；光学磁気ディスク；並びにコンパクトディスク型リード・オンリー・メモリ（ＣＤＲＯＭ）及びデジタルバーサタイルディスク型リード・オンリー・メモリ（ＤＶＤ－ＲＯＭ）ディスクを含む全ての形式の不揮発性メモリ、媒体及びメモリデバイスを含む。プロセッサ及びメモリは、専用のロジック回路によって強化されるか、あるいは、それに組み込まれ得る。

本明細書は、多数の詳細を含むが、それらは、あらゆる対象の又は請求される可能性があるものの範囲に対する限定としてではなく、むしろ、特定の技術の特定の実施形態に特有であり得る特徴の説明として解釈されるべきである。別々の実施形態に関連して本明細書で説明されている特定の特徴は、単一の実施形態で組み合わせても実装可能である。逆に、単一の実施形態に関連して説明されている様々な特徴はまた、複数の実施形態で別々に、又は何らかの適切なサブコンビネーションで実装可能である。更に、特徴は、特定の組み合わせで動作するものとして先に説明され、更には、そのようなものとして最初に請求されることがあるが、請求されている組み合わせからの１つ以上の特徴は、いくつかの場合に、その組み合わせから削除可能であり、請求されている組み合わせは、サブコンビネーション又はサブコンビネーションの変形に向けられてもよい。

同様に、動作は、特定の順序で図面において表されているが、これは、所望の結果を達成するために、そのような動作が示されているその特定の順序で又は順次的な順序で実行されること、あるいは、表されている全ての動作が実行されることを求めている、と理解されるべきではない。更に、本明細書で説明されている実施形態における様々なシステムコンポーネントの分離は、全ての実施形態でそのような分離を求めている、と理解されるべきではない。

ほんのわずかの実施及び例が説明されており、他の実施、強化及び変形は、本特許文献で記載及び例示されているものに基づいて行われ得る。

第１のコンポーネントと第２のコンポーネントとの間のライン、トレース、又は他の媒質を除いて、介在するコンポーネントがない場合に、第１のコンポーネントは第２のコンポーネントへ直接に結合されている。第１のコンポーネントと第２のコンポーネントとの間にライン、トレース、又は他の媒質以外のコンポーネントが介在している場合には、第１のコンポーネントは第２コンポーネントへ間接的に結合されている。「結合される」という用語及びその変形は、直接的に結合される及び間接的に結合されることの両方を含む。「約」という用語の使用は、別段述べられない限りは、その後の数字の±１０％を含む範囲を意味する。

いくつかの実施形態が本開示で提供されているが、開示されているシステム及び方法は、本開示の精神又は範囲から逸脱せずに、多くの他の具体的な形態で具現されてもよいことが理解されるべきである。本例は、例示と見なされるべきであり、限定と見なされるべきではなく、本明細書で与えられている詳細を限定する意図はない。例えば、様々な要素又はコンポーネントは、他のシステムでは結合又は一体化されてもよく、あるいは、特定の特徴は、省略されても、又は実装されなくてもよい。

更に、個別的なもの又は分離したものとして様々な実施形態で記載及び図示されている技術、システム、サブシステム、及び方法は、本開示の範囲から逸脱せずに、他のシステム、モジュール、技術、又は方法と結合又は一体化されてもよい。結合されるものとして図示又は説明されている他のアイテムは、直接に接続されても、あるいは、電気的、機械的、又は別なふうであろうとなかろうと、何らかのインターフェース、デバイス、又は中間コンポーネントを通じて間接的に結合され又は通信してもよい。変更、置換、又は代替の他の例は、当業者によって確かめられ、本明細書で開示されている精神又は範囲から逸脱せずに行われ得る。

１００，１２３ＣＭＡＦトラック
１１１ＶＰＳ
１１３ＳＰＳ
１１５ＤＣＩＮＡＬユニット
１１７ＣＶＳ
１１９コーディングされたビデオ
１２１ＶＶＣストリーム
４０００ビデオ処理システム
４００２入力部
４００４コーディングコンポーネント
４０１０表示インターフェース
４１００ビデオ処理装置
４１０２プロセッサ
４１０４メモリ
４１０６ビデオ処理回路
４３００ビデオコーディングシステム
４３１０発信元デバイス
４３１２ビデオソース
４３１４，４４００ビデオエンコーダ
４３１６，４３２６入力／出力（Ｉ／Ｏ）インターフェース
４３２０送信先デバイス
４３２２表示デバイス
４３２４，４５００ビデオデコーダ
４４０１パーティションユニット
４４０２予測ユニット
４４０３モード選択ユニット
４４０４動き推定ユニット
４４０５，４５０２動き補償ユニット
４４０６，４５０３イントラ予測ユニット
４４０７残差生成ユニット
４４０８変換ユニット
４４０９量子化ユニット
４４１０，４５０４逆量子化ユニット
４４１１，４５０５逆変換ユニット
４４１２，４５０６再構成ユニット
４４１３，４５０７バッファ
４４１４エントロピ符号化ユニット
４６００エンコーダ

Claims

ビデオデータを処理する方法であって、
バーサタイルビデオコーディング（ＶＶＣ）共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報を決定するステップであり、規則により、前記ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ステップと、
前記ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間の変換を実行するステップと
を有する方法。
前記ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇは、ビデオユーザビリティ情報ペイロード（ｖｕｉ＿ｐａｙｌｏａｄ）構造に含まれる、
請求項１に記載の方法。
前記ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇは、前記ＶＶＣＣＭＡＦトラック内のビデオがプログレッシブスキャニングに従ってコーディングされることを示すよう１に等しい、
請求項２に記載の方法。
前記規則は、前記ＳＰＳ内のビデオユーザビリティ情報インターレースソースフラグ（ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことを定める、
請求項１に記載の方法。
前記ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇは、ビデオユーザビリティ情報ペイロード（ｖｕｉ＿ｐａｙｌｏａｄ）構造に含まれる、
請求項４に記載の方法。
前記ｖｕｉ＿ｉｎｔｅｒｌａｃｅｄ＿ｓｏｕｒｃｅ＿ｆｌａｇは、前記ＶＶＣＣＭＡＦトラック内のビデオがインターレーシングに従ってコーディングされることを示すよう１に等しい、
請求項５に記載の方法。
前記ＳＰＳはＶＶＣエレメンタリストリームに含まれ、該ＶＶＣエレメンタリストリームが前記ＣＭＡＦトラックに含まれる、
請求項１に記載の方法。
前記変換は、前記視覚メディアデータを前記メディアデータファイルに符号化することを含む、
請求項１乃至７のうちいずれか一項に記載の方法。
前記変換は、前記視覚メディアデータを前記メディアデータファイルから復号することを含む、
請求項１乃至７のうちいずれか一項に記載の方法。
ビデオデータを処理する装置であって、
プロセッサと、
命令を有する非一時的なメモリと
を有し、
前記命令は、前記プロセッサによる実行時に、前記プロセッサに、
バーサタイルビデオコーディング（ＶＶＣ）共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報を決定するステップであり、規則により、前記ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ステップと、
前記ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間の変換を実行するステップと
を実行させる、
装置。
ビデオコーディングデバイスよって使用されるコンピュータプログラム製品を有する非一時的なコンピュータ可読媒体であって、
前記コンピュータプログラム製品は、プロセッサによる実行時に、前記ビデオコーディングデバイスに、
バーサタイルビデオコーディング（ＶＶＣ）共通メディアアプリケーションフォーマット（ＣＭＡＦ）トラックにおけるシーケンスパラメータセット（ＳＰＳ）内の情報を決定するステップであり、規則により、前記ＳＰＳ内のビデオユーザビリティ情報プログレッシブソースフラグ（ｖｕｉ＿ｐｒｏｇｒｅｓｓｉｖｅ＿ｓｏｕｒｃｅ＿ｆｌａｇ）フィールドの値が１に等しくなければならないことが定められる、ステップと、
前記ＳＰＳに基づき、視覚メディアデータとメディアデータファイルとの間の変換を実行するステップと
を実行させるように前記非一時的なコンピュータ可読媒体に記憶されているコンピュータ実行可能命令を有する、
非一時的なコンピュータ可読媒体。