JP7447147B2

JP7447147B2 - 符号化ビデオ・ストリームにおけるサブ画像のビットストリーム抽出のための技術

Info

Publication number: JP7447147B2
Application number: JP2021562874A
Authority: JP
Inventors: ビョンドゥ・チェ; ステファン・ヴェンガー; シャン・リュウ
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2020-06-10
Filing date: 2021-06-07
Publication date: 2024-03-11
Anticipated expiration: 2041-06-07
Also published as: EP3949389A1; KR20210154820A; CN114342371A; JP2022540741A; JP2023184637A; CA3136556A1; EP3949389A4; AU2023203628A1; AU2021257985B2; AU2021257985A1

Description

関連出願の相互参照
本出願は、米国特許商標庁における米国仮特許出願第６３／０３７，２０２号（２０２０年６月１０日出願）及び米国特許出願第１７／３３５６００号（２０２１年６月１日出願）からの優先権を主張するものであり、その全体が参照により本明細書に組み込まれる。

本開示は、一般に、データ処理の分野、より詳細にはビデオ符号化に関する。

動き補償を伴う画像間予測を使用したビデオの符号化及び復号化は、数十年もの間知られている。非圧縮デジタル・ビデオは、一連の画像で構成することができ、各画像は、例えば、１９２０ｘ１０８０の輝度サンプル及び関連付けられたクロミナンス・サンプルの空間次元を有する。一連の画像は、例えば毎秒６０枚若しくは６０Ｈｚの固定又は可変の画像レート（非公式にはフレーム・レートとも呼ばれる）を有することができる。非圧縮ビデオには、重要なビットレート要件がある。例えば、サンプルあたり８ビットの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚのフレーム・レートで１９２０ｘ１０８０の輝度サンプル解像度）には、１．５Ｇｂｉｔ／ｓに近い帯域幅が必要である。１時間のそのようなビデオには、６００ギガバイトを超える記憶空間が必要である。

ビデオの符号化及び復号化の目的の１つは、圧縮によって入力ビデオ信号の冗長性を減らすことである。圧縮は、前述の帯域幅又は記憶空間の要件を、場合によっては２桁以上削減するのに役立つことがある。可逆圧縮及び非可逆圧縮の両方、並びにそれらの組合せを用いることができる。可逆圧縮とは、圧縮された元の信号から元の信号の正確なコピーを再構成することができる技術を指す。非可逆圧縮を使用する場合、再構成された信号は元の信号と同一ではない可能性があるが、元の信号と再構成された信号との間の歪みは、再構成された信号が意図されたアプリケーションに役立つのに十分に小さい。ビデオの場合、非可逆圧縮が広く採用されている。許容される歪みの量は、アプリケーションによって異なり、例えば、特定の消費者向けストリーミング・アプリケーションのユーザは、テレビ・コントリビューション・アプリケーションのユーザよりも高い歪みを許容することがある。達成可能な圧縮比は、許容可能／容認可能な歪みが大きいほど、圧縮比が高くなり得ることを反映することができる。

ビデオ・エンコーダ及びデコーダは、例えば、動き補償、変換、量子化、及びエントロピー符号化を含むいくつかの広いカテゴリからの技術を利用することができ、それらのうちの一部を以下に紹介する。

歴史的に、ビデオ・エンコーダ及びデコーダは、ほとんどの場合、符号化ビデオ・シーケンス（ｃｏｄｅｄｖｉｄｅｏｓｅｑｕｅｎｃｅ：ＣＶＳ）、画像群（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅｓ：ＧＯＰ）、又は同様のマルチ画像時間フレームに対して定義され、所与の画像サイズで動作する傾向があった。例えば、ＭＰＥＧ－２では、システム設計は、シーンのアクティビティなどの要因に応じて水平解像度（及びそれによって画像サイズ）を変更することが知られているが、Ｉ画像においてのみ、したがって典型的にはＧＯＰに対して行われている。ＣＶＳにおいて異なる解像度を使用するために参照画像をリサンプリングすることが、例えばＩＴＵ－ＴＲｅｃ．Ｈ．２６３ＡｎｎｅｘＰから知られている。しかしながら、ここでは画像サイズは変更されず、参照画像のみがリサンプリングされるため、結果として、画像キャンバスの一部のみが使用されるか（ダウンサンプリングの場合）、シーンの一部のみがキャプチャされる可能性がある（アップサンプリングの場合）。さらに、Ｈ．２６３ＡｎｎｅｘＱは、個々のマクロブロックを（各次元で）上向き又は下向きに２倍だけリサンプリングすることを可能とする。ここでも、画像サイズは、同じままである。マクロブロックのサイズは、Ｈ．２６３で固定されているため、シグナリングする必要はない。

現代のビデオ符号化では、予測画像において画像サイズを変更することが主流になってきた。例えば、ＶＰ９は、参照画像のリサンプリング及び画像全体の解像度の変更を可能にする。同様に、ＶＶＣに向けて行われた特定の提案（例えば、その全体が本明細書に組み込まれる、Ｈｅｎｄｒｙら、「Ｏｎａｄａｐｔｉｖｅｒｅｓｏｌｕｔｉｏｎｃｈａｎｇｅ（ＡＲＣ）ｆｏｒＶＶＣ」、ＪｏｉｎｔＶｉｄｅｏＴｅａｍｄｏｃｕｍｅｎｔＪＶＥＴ－Ｍ０１３５－ｖ１、Ｊａｎ９－１９、２０１９を含む）は、参照画像全体を異なる解像度（より高い解像度又はより低い解像度）にリサンプリングすることを可能にする。本文献では、異なる候補解像度をシーケンス・パラメータ・セットで符号化し、画像パラメータ・セットの画像ごとのシンタックス要素によって参照することが提案されている。

実施形態は、ビデオ符号化のための方法、システム、及びコンピュータ可読媒体に関する。一態様によると、ビデオ符号化のための方法が提供される。本方法は、１つ又は複数のサブ画像を有するビデオ・データを受信することを含むことができる。サブ画像に対応するリサンプリング・パラメータ及び空間スケーラビリティ・パラメータが抽出される。リサンプリング・パラメータ及び空間スケーラビリティ・パラメータは、ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する。ビデオ・データは、抽出されたリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて復号される。

別の態様によると、ビデオ符号化のためのコンピュータ・システムが提供される。コンピュータ・システムは、１つ又は複数のプロセッサ、１つ又は複数のコンピュータ可読メモリ、１つ又は複数のコンピュータ可読有形記憶デバイス、及び１つ又は複数のメモリのうちの少なくとも１つを介して１つ又は複数のプロセッサのうちの少なくとも１つによって実行するための１つ又は複数の記憶デバイスのうちの少なくとも１つに記憶されたプログラム命令を含むことができ、それによってコンピュータ・システムが方法を実行することができる。本方法は、１つ又は複数のサブ画像を有するビデオ・データを受信することを含むことができる。サブ画像に対応するリサンプリング・パラメータ及び空間スケーラビリティ・パラメータが抽出される。リサンプリング・パラメータ及び空間スケーラビリティ・パラメータは、ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する。ビデオ・データは、抽出されたリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて復号される。

さらに別の態様によると、ビデオ符号化のためのコンピュータ可読媒体が提供される。コンピュータ可読媒体は、１つ又は複数のコンピュータ可読記憶デバイスと、１つ又は複数の有形記憶デバイスのうちの少なくとも１つに記憶されたプログラム命令であって、プロセッサによって実行可能なプログラム命令と、を含むことができる。プログラム命令は、１つ又は複数のサブ画像を有するビデオ・データを受信することを適宜含むことができる方法を実行するためにプロセッサによって実行可能である。サブ画像に対応するリサンプリング・パラメータ及び空間スケーラビリティ・パラメータが抽出される。リサンプリング・パラメータ及び空間スケーラビリティ・パラメータは、ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する。ビデオ・データは、抽出されたリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて復号される。

これらの及び他の目的、特徴並びに利点は、添付の図面に関連して読まれるべき例示的な実施形態の以下の詳細な説明から明らかになるであろう。図面の様々な特徴は、詳細な説明と併せて当業者の理解を促進するために図をわかりやすくするため、縮尺どおりではない。

一実施形態による通信システムの簡略化されたブロック図の概略図である。一実施形態による通信システムの簡略化されたブロック図の概略図である。一実施形態によるデコーダの簡略化されたブロック図の概略図である。一実施形態によるエンコーダの簡略化されたブロック図の概略図である。図示するように、一実施形態によるＡＲＣパラメータをシグナリングするためのオプションの概略図である。一実施形態によるシンタックス・テーブルの一例である。一実施形態によるコンピュータ・システムの概略図である。適応解像度の変更によるスケーラビリティの予測構造の例である。一実施形態によるシンタックス・テーブルの一例である。アクセス・ユニット当たりのｐｏｃサイクル及びアクセス・ユニット・カウント値を解析及び復号する簡略化されたブロック図の概略図である。マルチレイヤ・サブ画像を含むビデオ・ビットストリーム構造の概略図である。解像度を向上させて選択されたサブ画像を表示する概略図である。マルチレイヤ・サブ画像を含むビデオ・ビットストリームの復号及び表示プロセスのブロック図である。サブ画像のエンハンスメント・レイヤを用いた３６０度ビデオ表示の概略図である。サブ画像のレイアウト情報と、それに対応するレイヤ及び画像予測構造の例である。ローカル領域の空間スケーラビリティ・モダリティを有する、サブ画像のレイアウト情報と、それに対応するレイヤ及び画像予測構造の例である。サブ画像レイアウト情報についてのシンタックス・テーブルの例である。サブ画像レイアウト情報についてのＳＥＩメッセージのシンタックス・テーブルの例である。各出力レイヤ・セットついての出力レイヤ及びプロファイル／階層／レベル情報を示すシンタックス・テーブルの例である。各出力レイヤ・セットについて出力レイヤモードがオンであることを示すシンタックス・テーブルの例である。各出力レイヤ・セットについて各レイヤの現在のサブ画像を示すシンタックス・テーブルの例である。ビデオ・パラメータ・セットＲＢＳＰのシンタックス・テーブルの例である。出力レイヤ・セットモードで出力レイヤ・セットを示すシンタックス・テーブルの例である。ＳＰＳにおいて符号化ビデオ・シーケンス内の参照画像のリサンプリング及び解像度の変化を示すシンタックス・テーブルの例である。ＰＰＳにおいて画像サイズを示すシンタックス・テーブルの例である。同一レイヤでのインター予測と、スケーリング・ウィンドウを用いた参照画像のリサンプリングを伴うレイヤ間予測の例である。スケーリング・ウィンドウのサイズ変更を伴うサブ画像のサブビットストリーム抽出の例である。スケーリング・ウィンドウのサイズ変更を伴わず、オフセット・シフトのみでサブ画像のサブビットストリームを抽出した例である。

特許請求される構造及び方法の詳細な実施形態が本明細書に開示されるが、開示される実施形態は、様々な形態で具現化され得る特許請求される構造及び方法の単なる例示であることを理解することができる。しかしながら、これらの構造及び方法は、多くの異なる形態で具現化することができ、本明細書に記載の例示的な実施形態に限定されると解釈されるべきではない。むしろ、これらの例示的な実施形態は、本開示が完璧かつ完全なものとなり、その範囲を当業者に完全に伝えるように提供される。説明では、提示される実施形態を不必要に曖昧にすることを回避するために、周知の特徴及び技術の詳細が省略されることがある。

実施形態は、一般に、データ処理の分野、より詳細にはビデオ符号化に関する。以下に説明する例示的な実施形態は、とりわけ、複数のレイヤを有する符号化ビデオ・ストリームにおけるサブ画像のビットストリーム抽出のためのシステム、方法、及びコンピュータ・プログラムを提供する。したがって、一部の実施形態は、ビデオ・ビットストリームにおける参照画像リサンプリング及び空間スケーラビリティ・パラメータのシグナリングに基づいて、改善されたビデオ符号化及び復号を可能にすることによって、コンピューティングの分野を改善する能力を有する。

態様は、本明細書において、様々な実施形態による方法の流れ図及び／又はブロック図、装置（システム）、並びにコンピュータ可読媒体を参照して説明される。流れ図及び／又はブロック図の各ブロック、並びに流れ図及び／又はブロック図のブロックの組合せは、コンピュータ可読プログラム命令によって実施することができることが理解されよう。

図１は、本開示の一実施形態による通信システム（１００）の簡略化されたブロック図を示す。システム（１００）は、ネットワーク（１５０）を介して相互接続された少なくとも２つの端末（１１０～１２０）を含むことができる。データの一方向伝送の場合、第１の端末（１１０）は、ネットワーク（１５０）を介して他の端末（１２０）に伝送するために、ローカル位置でビデオ・データを符号化することができる。第２の端末（１２０）は、ネットワーク（１５０）から他の端末の符号化されたビデオ・データを受信し、符号化されたデータを復号し、復元されたビデオ・データを表示することができる。一方向データ演奏は、メディア・サービング・アプリケーション（ｍｅｄｉａｓｅｒｖｉｎｇａｐｐｌｉｃａｔｉｏｎｓ）などで一般的な場合がある。

図１は、例えば、ビデオ会議中に行われる可能性のある符号化されたビデオの双方向伝送をサポートするために提供される第２のペアの端末（１３０、１４０）を示す。データの双方向伝送のために、各端末（１３０、１４０）は、ネットワーク（１５０）を介して他の端末に伝送するための、ローカル位置でキャプチャされたビデオ・データを符号化することができる。各端末（１３０、１４０）はまた、他の端末によって送信された符号化されたビデオ・データを受信し、符号化されたデータを復号することができ、復元されたビデオ・データをローカル・ディスプレイ・デバイスに表示することができる。

図１では、端末（１１０～１４０）は、サーバ、パーソナル・コンピュータ、及びスマート・フォンとして示されることがあるが、本開示の原理は、そのように限定されなくてもよい。本開示の実施形態は、ラップトップ・コンピュータ、タブレット・コンピュータ、メディア・プレーヤ、及び／又は専用のビデオ会議機器に適用される。ネットワーク（１５０）は、例えば、有線及び／又は無線通信ネットワークを含む、端末（１１０～１４０）間で、符号化されたビデオ・データを伝達する任意の数のネットワークを表す。通信ネットワーク（１５０）は、回線交換チャネル及び／又はパケット交換チャネルにおいてデータを交換することができる。代表的なネットワークには、電気通信ネットワーク、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、及び／又はインターネットが含まれる。本議論の目的のために、ネットワーク（１５０）のアーキテクチャ及びトポロジーは、本明細書で以下に説明されない限り、本開示の動作にとって重要ではない場合がある。

図２は、開示された主題のアプリケーションの例として、ストリーミング環境におけるビデオ・エンコーダ及びデコーダの配置を示す。開示された主題は、例えば、ビデオ会議、デジタルテレビ、ＣＤ、ＤＶＤ、メモリ・スティックなどを含むデジタル媒体への圧縮ビデオの記憶などを含む、他のビデオ対応アプリケーションに等しく適用可能である。

ストリーミング・システムは、例えば非圧縮ビデオサンプル・ストリーム（２０２）を生成するビデオ・ソース（２０１）、例えばデジタル・カメラを含むことができるキャプチャ・サブシステム（２１３）を含むことができる。符号化されたビデオ・ビットストリームと比較したときにデータ量が多いことを強調するために太線で描かれたそのサンプル・ストリーム（２０２）は、カメラ（２０１）に結合されたエンコーダ（２０３）によって処理することができる。エンコーダ（２０３）は、以下でより詳細に説明されるように、開示された主題の態様を可能にするか又は実施するために、ハードウェア、ソフトウェア、又はそれらの組合せを含むことができる。サンプル・ストリームと比較してデータ量が少ないことを強調するために細線で描かれた、符号化されたビデオ・ビットストリーム（２０４）は、将来の使用のためにストリーミング・サーバ（２０５）に記憶することができる。１つ又は複数のストリーミング・クライアント（２０６、２０８）は、ストリーミング・サーバ（２０５）にアクセスして、符号化されたビデオ・ビットストリーム（２０４）のコピー（２０７、２０９）を取り出すことができる。クライアント（２０６）は、符号化されたビデオ・ビットストリーム（２０７）の着信コピーを復号し、ディスプレイ（２１２）又は他のレンダリング・デバイス（図示せず）上でレンダリングすることができる発信ビデオサンプル・ストリーム（２１１）を作成するビデオ・デコーダ（２１０）を含むことができる。一部のストリーミング・システムでは、ビデオ・ビットストリーム（２０４、２０７、２０９）は、特定のビデオ符号化／圧縮規格に従って符号化することができる。これらの規格の例には、ＩＴＵ－Ｔ勧告Ｈ．２６５が含まれる。開発中のものには、ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ又はＶＶＣとして非公式に知られているビデオ符号化規格がある。開示された主題は、ＶＶＣの文脈で使用されることがある。

図３は、本発明の実施形態によるビデオ・デコーダ（２１０）の機能ブロック図であってもよい。

レシーバ（３１０）は、デコーダ（２１０）によって復号された１つ又は複数のコーデックビデオ・シーケンスを受信することができ、同じ又は別の実施形態において、一度に１つの符号化ビデオ・シーケンスを受信することができ、各符号化ビデオ・シーケンスの復号は、他の符号化ビデオ・シーケンスとは無関係である。符号化ビデオ・シーケンスは、チャネル（３１２）から受信されてもよく、このチャネルは、符号化ビデオ・データを記憶する記憶デバイスへのハードウェア／ソフトウェア・リンクであってもよい。レシーバ（３１０）は、符号化ビデオ・データを他のデータ、例えば符号化音声データ及び／又は補助データ・ストリームとともに受信することができ、これらは、それぞれの使用エンティティ（図示せず）に転送されてもよい。レシーバ（３１０）は、符号化ビデオ・シーケンスを他のデータから分離することができる。ネットワーク・ジッタに対処するために、バッファ・メモリ（３１５）が、レシーバ（３１０）とエントロピー・デコーダ／パーサ（３２０）（以降、「パーサ」）との間に結合されてもよい。レシーバ（３１０）が十分な帯域幅及び制御可能性のある記憶／転送デバイスから、又は等時性ネットワークからデータを受信している場合、バッファ（３１５）は、必要でない場合があり、又は小さくすることができる。インターネットなどのベストエフォート型のパケットネットワークで使用するためには、バッファ（３１５）が必要になる場合があり、比較的大きくなる可能性があり、有利には適応サイズとすることができる。

ビデオ・デコーダ（２１０）は、エントロピー符号化ビデオ・シーケンスからシンボル（３２１）を再構成するためのパーサ（３２０）を含むことができる。これらのシンボルのカテゴリには、デコーダ（２１０）の動作を管理するために使用される情報と、図２に示したような、デコーダの不可欠な部分ではないが、デコーダに結合することができるディスプレイ（２１２）などのレンダリング・デバイスを制御するための情報と、が潜在的に含まれる。レンダリング・デバイスの制御情報は、ＳＥＩメッセージ（ＳｕｐｐｌｅｍｅｎｔａｒｙＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ）又はＶＵＩ（ＶｉｄｅｏＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ）パラメータ・セット・フラグメント（図示せず）の形態であってもよい。パーサ（３２０）は、受信した符号化ビデオ・シーケンスを解析／エントロピー復号化することができる。符号化ビデオ・シーケンスの符号化は、ビデオ符号化技術又は規格に従うことができ、可変長符号化、ハフマン符号化、コンテキスト感度を伴う、又は伴わない算術符号化などの、当業者によく知られた原理に従うことができる。パーサ（３２０）は、グループに対応する少なくとも１つのパラメータに基づいて、ビデオ・デコーダにおいて、符号化ビデオ・シーケンスから、ピクセルのサブグループのうちの少なくとも１つについてのサブグループ・パラメータのセットを抽出することができる。サブグループには、画像群（ＧｒｏｕｐｓｏｆＰｉｃｔｕｒｅ：ＧＯＰ）、画像、タイル、スライス、マクロブロック、符号化ユニット（ＣｏｄｉｎｇＵｎｉｔ：ＣＵ）、ブロック、変換ユニット（ＴｒａｎｓｆｏｒｍＵｎｉｔ：ＴＵ）、予測ユニット（ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ：ＰＵ）などが含まれてもよい。エントロピー・デコーダ／パーサはまた、符号化ビデオ・シーケンスから、変換係数、量子化器のパラメータ値、動きベクトルなどの情報を抽出することができる。

パーサ（３２０）は、バッファ（３１５）から受信したビデオ・シーケンスに対してエントロピー復号化／解析動作を実行して、シンボル（３２１）を作成することができる。

シンボル（３２１）の再構成は、符号化ビデオ画像又はその一部のタイプ（画像間及び画像内、ブロック間及びブロック内など）、及び他の要因に応じて、複数の異なるユニットを含むことができる。どのユニットがどのように関与するかは、パーサ（３２０）によって符号化ビデオ・シーケンスから構文解析されたサブグループ制御情報によって制御することができる。パーサ（３２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報の流れは、わかりやすくするために描かれていない。

すでに述べた機能ブロック以外に、デコーダ２１０は、以下に説明するように、概念的にいくつかの機能ユニットに細分化することができる。商業的制約の下で動作する実際の実施態様では、これらのユニットの多くは、互いに密接に相互作用し、少なくとも部分的には互いに一体化され得る。しかしながら、開示された主題を説明する目的のために、以下の機能ユニットに概念的に細分化することが適切である。

第１のユニットは、スケーラ／逆変換ユニット（３５１）である。スケーラ／逆変換ユニット（３５１）は、量子化された変換係数、並びにどの変換を使用するか、ブロックサイズ、量子化係数、量子化スケーリング行列などを含む制御情報を、シンボル（３２１）としてパーサ（３２０）から受け取る。このユニットは、アグリゲータ（３５５）に入力することができるサンプル値を含むブロックを出力することができる。

場合によっては、スケーラ／逆変換（３５１）の出力サンプルは、イントラ符号化ブロック、すなわち、以前に再構成された画像からの予測情報は使用しないが、現在の画像の以前に再構成された部分からの予測情報を使用することができるブロックに関連することができる。そのような予測情報は、画像内予測ユニット（３５２）によって提供することができる。場合によっては、画像内予測ユニット（３５２）は、現在の（部分的に再構成された）画像（３５６）からフェッチされた周囲のすでに再構成された情報を使用して、再構成中のブロックと同じサイズ及び形状のブロックを生成する。アグリゲータ（３５５）は、場合によっては、サンプルごとに、イントラ予測ユニット（３５２）が生成した予測情報を、スケーラ／逆変換ユニット（３５１）によって提供される出力サンプル情報に追加する。

他の場合には、スケーラ／逆変換ユニット（３５１）の出力サンプルは、インター符号化され、潜在的に動き補償されたブロックに関連することができる。このような場合、動き補償予測ユニット（３５３）は、参照画像メモリ（３５７）にアクセスして、予測に使用するサンプルをフェッチすることができる。フェッチされたサンプルをブロックに関連するシンボル（３２１）に従って動き補償した後、これらのサンプルを、アグリゲータ（３５５）によってスケーラ／逆変換ユニットの出力に追加して（この場合、残差サンプル又は残差信号と呼ばれる）、出力サンプル情報を生成することができる。動き補償ユニットが予測サンプルをフェッチする参照画像メモリ形態内のアドレスは、例えば、Ｘ、Ｙ、及び参照画像成分を有することができるシンボル（３２１）の形態で、動き補償ユニットに利用可能な動きベクトルによって制御することができる。動き補償は、サブサンプルの正確な動きベクトルが使用されている場合に参照画像メモリからフェッチされたサンプル値の補間や、動きベクトル予測メカニズムなども含むことができる。

アグリゲータ（３５５）の出力サンプルは、ループ・フィルタ・ユニット（３５６）において様々なループ・フィルタリング技術の受けることができる。ビデオ圧縮技術は、符号化ビデオ・ビットストリームに含まれるパラメータによって制御され、パーサ（３２０）からのシンボル（３２１）としてループ・フィルタ・ユニット（３５６）に利用可能になるインループ・フィルタ技術を含むことができるが、符号化画像又は符号化ビデオ・シーケンスの（復号順で）前の部分の復号中に取得されたメタ情報に応答することもでき、以前に再構成され、ループ・フィルタリングされたサンプル値に応答することもできる。

ループ・フィルタ・ユニット（３５６）の出力は、レンダリング・デバイス（２１２）に出力され得るだけでなく、将来の画像間予測において使用するために参照画像メモリ（３５６）に記憶することができるサンプル・ストリームとすることができる。

特定の符号化画像は、完全に再構成されると、将来の予測のための参照画像として使用することができる。符号化画像が完全に再構成され、符号化画像が参照画像として（例えば、パーサ（３２０）によって）識別されると、現在の参照画像（３５６）は、参照画像バッファ（３５７）の一部となることができ、後続の符号化画像の再構成を開始する前に、新しい現在の画像メモリを再割り当てすることができる。

ビデオ・デコーダ３２０は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの規格に文書化され得る所定のビデオ圧縮技術に従って復号動作を実行することができる。符号化ビデオ・シーケンスは、ビデオ圧縮技術の文書又は規格において、具体的にはその中のプロファイル文書において指定されるようなビデオ圧縮技術又は規格のシンタックスに準拠するという意味で、使用されているビデオ圧縮技術又は規格によって指定されるシンタックスに準拠することができる。また、符号化ビデオ・シーケンスの複雑さが、ビデオ圧縮技術又は規格のレベルによって定義された範囲内にあることも準拠のために必要である。場合によっては、レベルによって、最大画像サイズ、最大フレーム・レート、最大再構成サンプルレート（例えば、１秒あたりのメガサンプルで測定）、最大参照画像サイズなどが制限される。レベルによって設定される制限は、場合によっては、ＨＲＤ（ＨｙｐｏｔｈｅｔｉｃａｌＲｅｆｅｒｅｎｃｅＤｅｃｏｄｅｒ）の仕様、及び符号化ビデオ・シーケンスにおいてシグナリングされるＨＲＤバッファ管理のためのメタデータによってさらに制限されることがある。

一実施形態において、レシーバ（３１０）は、符号化ビデオとともに追加の（冗長な）データを受信することができる。追加のデータは、符号化ビデオ・シーケンスの一部として含まれる場合がある。追加のデータは、データを適切に復号するために、及び／又は元のビデオ・データをより正確に再構成するために、ビデオ・デコーダ（３２０）によって使用されることがある。追加のデータは、例えば、時間的、空間的、又はＳＮＲエンハンスメント・レイヤ、冗長スライス、冗長画像、前方誤り訂正コードなどの形態とすることができる。

図４は、本開示の一実施形態によるビデオ・エンコーダ（２０３）の機能ブロック図であってもよい。

エンコーダ（２０３）は、エンコーダ（２０３）によって符号化されることになるビデオ画像をキャプチャすることができる（エンコーダの一部ではない）ビデオ・ソース（２０１）からビデオサンプルを受信することができる。

ビデオ・ソース（２０１）は、任意の適切なビット深度（例えば、８ビット、１０ビット、１２ビット、…）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢ、…）、及び任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であってもよいデジタル・ビデオ・サンプル・ストリームの形態で、エンコーダ（２０３）によって符号化されるソース・ビデオ・シーケンスを提供することができる。メディア・サービング・システムにおいて、ビデオ・ソース（２０１）は、以前に整えられたビデオを記憶する記憶デバイスであってもよい。ビデオ会議システムでは、ビデオ・ソース（２０３）は、ローカル画像情報をビデオ・シーケンスとしてキャプチャするカメラであってもよい。ビデオ・データは、順に見たときに動きを与える複数の個々の画像として提供することができる。画像自体は、ピクセルの空間配列として構成することができ、各ピクセルは、使用中のサンプリング構造、色空間などに応じて、１つ又は複数のサンプルを含むことができる。当業者は、ピクセルとサンプルとの間の関係を容易に理解することができる。以下の説明は、サンプルに焦点を当てる。

一実施形態によると、エンコーダ（２０３）は、リアルタイムで、又はアプリケーションによって要求される他の任意の時間制約の下で、ソース・ビデオ・シーケンスの画像を符号化ビデオ・シーケンス（４４３）に符号化及び圧縮することができる。適切な符号化速度を強要することは、コントローラ（４５０）の１つの機能である。コントローラは、以下に説明するように他の機能ユニットを制御し、これらのユニットに機能的に結合されている。わかりやすくするために、この結合は、描かれていない。コントローラによって設定されるパラメータには、レート制御関連のパラメータ（画像スキップ、量子化器、レート歪み最適化技術のラムダ値など）、画像サイズ、画像群（ＧＯＰ）レイアウト、最大動きベクトル探索範囲などが含まれる。当業者は、特定のシステム設計用に最適化されたビデオ・エンコーダ（２０３）に関連する可能性があるため、コントローラ（４５０）の他の機能を容易に識別することができる。

ビデオ・エンコーダの中には、当業者が容易に認識できる「符号化ループ」において動作するものがある。過度に簡略化された説明として、符号化ループは、（符号化される入力画像及び参照画像に基づいてシンボルを生成する役割を果たす）エンコーダ（４３０）（以降、「ソース・コーダ」）の符号化部分と、シンボルを再構成するエンコーダ（２０３）に組み込まれた（ローカル）デコーダ（４３３）とから構成され、（リモート）デコーダも生成するサンプル・データを生成することができる（開示された主題で考慮されるビデオ圧縮技術では、シンボルと符号化ビデオ・ビットストリームとの間のいかなる圧縮も無損失であるため）。その再構成されたサンプル・ストリームは、参照画像メモリ（４３４）に入力される。シンボル・ストリームの復号は、デコーダの位置（ローカル又はリモート）に関係なくビット厳密な結果をもたらすため、参照画像バッファの内容もローカル・エンコーダとリモート・エンコーダとの間でビット厳密になる。言い換えると、エンコーダの予測部分は、復号中に予測を使用するときにデコーダが「見る」のとまったく同じサンプル値を参照画像サンプルとして「見る」。参照画像の同期性（及び、例えばチャネル・エラーのために同期性を維持できない場合は、結果として生じるドリフト）のこの基本原理は、当業者によく知られている。

「ローカル」デコーダ（４３３）の動作は、「リモート」デコーダ（２１０）の動作と同じにすることができ、これについては、図３に関連して上で詳細に説明した。しかしながら、簡単に図３も参照すると、シンボルが利用可能であり、エントロピー・コーダ（４４５）及びパーサ（３２０）による符号化ビデオ・シーケンスへのシンボルの符号化／復号化を無損失で行うことができるため、チャネル（３１２）、レシーバ（３１０）、バッファ（３１５）、及びパーサ（３２０）を含むデコーダ（２１０）のエントロピー復号化部分は、ローカル・デコーダ（４３３）では完全には実装されない可能性がある。

この時点で観察に基づいて言えることは、デコーダに存在する解析／エントロピー復号化を除くデコーダ技術は、対応するエンコーダに実質的に同一の機能形態で必ず存在する必要があるということである。このため、開示される主題は、デコーダ動作に焦点を当てる。エンコーダ技術の説明は、包括的に説明されるデコーダ技術の逆であるため、省略することができる。特定の領域においてのみ、より詳細な説明が必要であり、以下に提供される。

その動作の一部として、ソース・コーダ（４３０）は、「参照フレーム」として指定されたビデオ・シーケンスからの１つ又は複数の以前に符号化されたフレームを参照して、入力フレームを予測的に符号化する動き補償予測符号化を実行することができる。このようにして、符号化エンジン（４３２）は、入力フレームのピクセル・ブロックと、入力フレームに対する予測参照として選択される可能性がある参照フレームのピクセル・ブロックとの間の差異を符号化する。

ローカル・ビデオ・デコーダ（４３３）は、ソース・コーダ（４３０）によって生成されたシンボルに基づいて、参照フレームとして指定される可能性があるフレームの符号化ビデオ・データを復号することができる。符号化エンジン（４３２）の動作は、有利には、非可逆的なプロセスであってもよい。符号化ビデオ・データがビデオ・デコーダ（図４には示されていない）で復号され得る場合、再構成されたビデオ・シーケンスは、典型的には、いくつかのエラーを伴うソース・ビデオ・シーケンスのレプリカである可能性がある。ローカル・ビデオ・デコーダ（４３３）は、ビデオ・デコーダが参照フレームに対して実行することができる復号プロセスを複製し、再構成された参照フレームを参照画像キャッシュ（４３４）に記憶させることができる。このようにして、エンコーダ（２０３）は、遠端のビデオ・デコーダによって取得される（伝送エラーがない）再構成された参照フレームと共通のコンテンツを有する、再構成された参照フレームのコピーをローカルに記憶することができる。

予測器（４３５）は、符号化エンジン（４３２）の予測探索を実行することができる。すなわち、符号化される新しいフレームについて、予測器（４３５）は、新しい画像のための適切な予測参照として役立つ可能性がある、サンプル・データ（参照ピクセル・ブロックの候補として）、又は参照画像動きベクトル、ブロック形状などの特定のメタデータについて参照画像メモリ（４３４）を探索することができる。予測器（４３５）は、適切な予測参照を見つけるために、ピクセル・ブロックごとのサンプルに動作することができる。場合によっては、予測器（４３５）によって取得された探索結果によって決定されるように、入力画像は、参照画像メモリ（４３４）に記憶された複数の参照画像から引き出された予測参照を有することができる。

コントローラ（４５０）は、例えば、ビデオ・データを符号化するために使用されるパラメータ及びサブグループ・パラメータの設定を含む、ビデオ・コーダ（４３０）の符号化動作を管理することができる。

前述したすべての機能ユニットの出力は、エントロピー・コーダ（４４５）においてエントロピー符号化されてもよい。エントロピー・コーダは、様々な機能ユニットによって生成されたシンボルを、例えばハフマン符号化、可変長符号化、算術符号化などの当業者に知られている技術に従って可逆圧縮することによって、符号化ビデオ・シーケンスに変換する。

トランスミッタ（４４０）は、エントロピー・コーダ（４４５）によって作成された符号化ビデオ・シーケンスをバッファリングして、符号化されたビデオ・データを記憶する記憶デバイスへのハードウェア／ソフトウェア・リンクあってもよい通信チャネル（４６０）を介して伝送するための準備をすることができる。トランスミッタ（４４０）は、ビデオ・コーダ（４３０）からの符号化ビデオ・データを、伝送される他のデータ、例えば、符号化音声データ及び／又は補助データ・ストリーム（ソースは図示せず）とマージすることができる。

コントローラ（４５０）は、エンコーダ（２０３）の動作を管理することができる。符号化中に、コントローラ（４５０）は、各符号化画像に特定の符号化画像タイプを割り当てることができ、これは、それぞれの画像に適用される可能性がある符号化技術に影響を与える可能性がある。例えば、画像は、多くの場合、以下のフレーム・タイプのうちの１つとして割り当てられてもよい。

イントラ画像（ＩｎｔｒａＰｉｃｔｕｒｅ：Ｉ画像）は、予測のソースとしてシーケンス内の他のフレームを使用することなく符号化及び復号化することができるものであってもよい。ビデオ・コーデックの中には、異なるタイプのイントラ画像、例えばＩｎｄｅｐｅｎｄｅｎｔＤｅｃｏｄｅｒＲｅｆｒｅｓｈＰｉｃｔｕｒｅｓを可能にするものがある。当業者は、Ｉ画像のこれらの変形、並びにそれらのそれぞれのアプリケーション及び特徴を知っている。

予測画像（Ｐ画像）は、各ブロックのサンプル値を予測するために、最大１つの動きベクトル及び参照インデックスを使用するイントラ予測又はインター予測を使用して符号化及び復号化することができるものであってもよい。

双方向予測画像（Ｂ画像）は、各ブロックのサンプル値を予測するために、最大２つの動きベクトル及び参照インデックスを使用するイントラ予測又はインター予測を使用して符号化及び復号化することができるものであってもよい。同様に、複数の予測画像は、単一のブロックの再構成のために３つ以上の参照画像及び関連付けられたメタデータを使用することができる。

ソース画像は、通常、空間的に複数のサンプル・ブロック（例えば、それぞれ４ｘ４、８ｘ８、４ｘ８、又は１６ｘ１６サンプル・ブロック）に細分化され、ブロックごとに符号化されることがある。ブロックは、ブロックのそれぞれの画像に適用される符号化割り当てによって決定されるように、他の（すでに符号化された）ブロックを参照して予測的に符号化することができる。例えば、Ｉ画像のブロックは、非予測的に符号化される場合もあれば、同じ画像のすでに符号化されたブロックを参照して予測的に符号化される場合もある（空間予測又はイントラ予測）。Ｐ画像のピクセル・ブロックは、以前に符号化された１つの参照画像を参照して、非予測的に、空間予測を介して、又は時間予測を介して符号化されてもよい。Ｂ画像のブロックは、以前に符号化された１つ又は２つの参照画像を参照して、非予測的に、空間予測を介して、又は時間予測を介して符号化されてもとい。

ビデオ・コーダ（２０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの所定のビデオ符号化技術又は規格に従って符号化動作を実行することができる。その動作では、ビデオ・コーダ（２０３）は、入力ビデオ・シーケンスにおける時間的及び空間的冗長性を利用する予測符号化動作を含む、様々な圧縮動作を実行することができる。したがって、符号化ビデオ・データは、使用されているビデオ符号化技術又は規格によって指定されたシンタックスに準拠することができる。

一実施形態において、トランスミッタ（４４０）は、符号化ビデオとともに追加のデータを送信することができる。ビデオ・コーダ（４３０）は、符号化ビデオ・シーケンスの一部としてそのようなデータを含むことができる。追加のデータは、時間的／空間的／ＳＮＲエンハンスメント・レイヤ、冗長画像及びスライスなどの他の形態の冗長なデータ、ＳｕｐｐｌｅｍｅｎｔａｒｙＥｎｈａｎｃｅｍｅｎｔＩｎｆｏｒｍａｔｉｏｎ（ＳＥＩ）メッセージ、ＶｉｓｕａｌＵｓａｂｉｌｉｔｙＩｎｆｏｒｍａｔｉｏｎ（ＶＵＩ）パラメータ・セット・フラグメントなどを含むことができる。

開示された主題の特定の態様をより詳細に説明する前に、本明細書の残りの部分で参照されるいくつかの用語を紹介する必要がある。

以降、サブ画像とは、場合によっては、意味的にグループ化され、変更された解像度で独立して符号化することができるサンプル、ブロック、マクロブロック、符号化ユニット、又は同様のエンティティの矩形配置を指す。１つ又は複数のサブ画像は、画像を形成することができる。１つ又は複数の符号化サブ画像は、符号化画像を形成することができる。１つ又は複数のサブ画像を画像にアセンブルすることができ、１つ又は複数のサブ画像を画像から抽出することができる。特定の環境では、１つ又は複数の符号化サブ画像を、サンプル・レベルにトランスコーディングすることなく、圧縮領域において符号化画像にアセンブルすることができ、同じ又は特定の他の場合に、１つ又は複数の符号化サブ画像を圧縮領域において符号化画像から抽出することができる。

以降、適応解像度変更（ＡｄａｐｔｉｖｅＲｅｓｏｌｕｔｉｏｎＣｈａｎｇｅ：ＡＲＣ）とは、例えば参照画像のリサンプリングによって、符号化ビデオ・シーケンス内の画像又はサブ画像の解像度を変更することができるメカニズムを指す。以降、ＡＲＣパラメータとは、適応解像度変更を行うために必要な制御情報を指し、これには、例えば、フィルタ・パラメータ、スケーリング係数、出力及び／又は参照画像の解像度、様々な制御フラグなどが含まれてもよい。

上記の説明は、単一の意味的に独立した符号化ビデオ画像を符号化及び復号化することに焦点を当てている。独立したＡＲＣパラメータで複数のサブ画像を符号化／復号化することの意味とその含意された追加の複雑さを説明する前に、ＡＲＣパラメータをシグナリングするためのオプションについて説明することができる。

図５を参照すると、ＡＲＣパラメータをシグナリングするためのいくつかの新規なオプションが示されている。各オプションに関して記載されるように、符号化の効率、複雑さ、及びアーキテクチャの観点から、特定の長所及び短所がある。ビデオ符号化規格又は技術は、ＡＲＣパラメータをシグナリングするために、これらのオプション、又は従来技術から知られているオプションのうちの１つ又は複数を選択することができる。オプションは、相互に排他的でなくてもよく、おそらくはアプリケーションのニーズ、関連する標準技術、又はエンコーダの選択に基づいて交換されてもよい。

ＡＲＣパラメータのクラスには、以下が含まれてもよい。

－Ｘ次元及びＹ次元で分離又は結合されたアップ／ダウンサンプル係数。

－時間的次元が追加されたアップ／ダウンサンプル係数であって、所与の数の画像に対して一定速度のズームイン／ズームアウトを示す係数。

－上記の２つのいずれかは、係数を含むテーブルを指し示すことがある１つ又は複数のおそらくは短いシンタックス要素の符号化を伴うことがある。

－合成された又は別々の入力画像、出力画像、参照画像、符号化画像の、サンプル、ブロック、マクロブロック、ＣＵ、又はその他の適切な粒度の単位での、Ｘ又はＹ次元の解像度。２つ以上の解像度がある場合（例えば、入力画像用に１つ、参照画像用に１つなど）、場合によっては、ある値のセットが値の別の値のセットから推測されることがある。このようなことは、例えばフラグを使用してゲートされてもよい。より詳細な例については、以下を参照されたい。

－「ワーピング」座標は、Ｈ．２６３ＡｎｎｅｘＰで使用されているものと類似しており、やはり上述したように適切な粒度で使用される。Ｈ．２６３ＡｎｎｅｘＰは、このようなワーピング座標を符号化するための１つの効率的な方法を定義しているが、他の、潜在的により効率的な方法もおそらく考案され得る。例えば、ＡｎｎｅｘＰのワーピング座標の可変長の可逆的な「ハフマン」スタイル符号化は、適切な長さのバイナリ符号化に置き換えることができ、バイナリ符号語の長さは、例えば、最大画像サイズから導出することができ、場合によっては、特定の係数で乗算され、特定の値でオフセットされて、最大画像サイズの境界の外側での「ワープ」を可能にする。

－アップ又はダウンサンプル・フィルタ・パラメータ。最も簡単なケースでは、アップサンプリング及び／又はダウンサンプリング用のフィルタが１つしかない場合がある。しかしながら、場合によっては、フィルタ設計の柔軟性を高めることが有利な場合があり、それには、フィルタ・パラメータのシグナリングが必要になる場合がある。このようなパラメータは、可能なフィルタ設計のリストのインデックスを介して選択されてもよく、フィルタは、完全に指定されてもよく（例えば、適切なエントロピー符号化技術を使用してフィルタ係数のリストを介して）、フィルタは、アップ／ダウンサンプル比を介して暗黙的に選択されてもよく、それに応じて、上記のメカニズムのいずれかに従ってシグナリングされるなどである。

以降、説明は、符号語を介して示されるアップ／ダウンサンプル係数（Ｘ次元及びＹ次元の両方で使用される同じ係数）の有限のセットの符号化を想定している。その符号語は、例えば、Ｈ．２６４及びＨ．２６５などのビデオ符号化仕様の特定のシンタックス要素に共通のＥｘｔ－Ｇｏｌｏｍｂ符号を使用して、有利には、可変長で符号化することができる。アップ／ダウンサンプル係数への値の適切なマッピングの１つは、例えば、以下の表に従うことができる。

アプリケーションのニーズと、ビデオ圧縮技術又は規格において利用可能なアップスケール及びダウンスケール・メカニズムの能力とに応じて、多くの同様のマッピングを考案することができる。この表は、より多くの値に拡張することができる。値は、Ｅｘｔ－Ｇｏｌｏｍｂコード以外のエントロピー符号化メカニズム、例えばバイナリ符号化を使用して表すこともできる。これは、例えばＭＡＮＥによる、ビデオ処理エンジン自体（エンコーダ及びデコーダが最優先）の外部でリサンプリング係数が重要である場合に、特定の利点がある。解像度の変更が必要ない（おそらく）最も一般的なケースでは、短いＥｘｔ－Ｇｏｌｏｍｂコード（上記の表では単一ビットのみ）を選択することができることに留意されたい。これは、最も一般的なケースでは、バイナリ・コードを使用するよりも符号化効率が優れている可能性がある。

テーブル内のエントリの数、及びそれらのセマンティクスは、完全に又は部分的に構成可能であってもよい。例えば、テーブルの基本的なアウトラインは、シーケンス又はデコーダ・パラメータ・セットなどの「上位の」パラメータ・セットで伝達されてもよい。代替として、又は加えて、１つ又は複数のそのようなテーブルは、ビデオ符号化技術又は規格において定義されてもよく、例えば、デコーダ又はシーケンス・パラメータ・セットを介して選択されてもよい。

以降、上述のように符号化されたアップサンプル／ダウンサンプル係数（ＡＲＣ情報）がビデオ符号化技術又は標準シンタックスにどのように含まれるかを説明する。同様の考慮事項が、アップ／ダウンサンプル・フィルタを制御する１つ又はいくつかの符号語に適用されることがある。フィルタ又はその他のデータ構造に比較的大量のデータが必要な場合の議論については、以下を参照されたい。

Ｈ．２６３ＡｎｎｅｘＰは、ＡＲＣ情報５０２を４つのワーピング座標の形態で画像ヘッダ５０１に、具体的にはＨ．２６３ＰＬＵＳＰＴＹＰＥ（５０３）ヘッダ拡張部に含めている。これは、ａ）使用可能な画像ヘッダが存在し、ｂ）ＡＲＣ情報の頻繁な変更が予想される場合に、賢明な設計選択になる可能性がある。しかしながら、Ｈ．２６３スタイルのシグナリングを使用する場合のオーバーヘッドは非常に大きくなることがあり、画像ヘッダは、過渡的な性質のものである場合があるため、スケーリング係数は、画像境界には関係しない可能性がある。

上で引用したＪＶＣＥＴ－Ｍ１３５－ｖ１は、画像パラメータ・セット（５０４）内に位置するＡＲＣ参照情報（５０５）（インデックス）を含み、シーケンス・パラメータ・セット（５０７）内に位置するターゲット解像度を含むテーブル（５０６）にインデックスを付ける。シーケンス・パラメータ・セット（５０７）のテーブル（５０６）に可能な解像度を配置することは、作成者による言語ステートメントに従って、能力交換中に相互運用性ネゴシエーション・ポイントとしてＳＰＳを使用することによって正当化され得る。解像度は、適切な画像パラメータ・セット（５０４）を参照することによって、テーブル（５０６）内の値によって設定された制限内で、画像ごとに変更することができる。

さらに図５を参照すると、ビデオ・ビットストリームにおいてＡＲＣ情報を伝達するために、以下の追加オプションが存在する場合がある。これらのオプションのそれぞれには、上述したような既存の技術を上回る特定の利点がある。オプションは、同じビデオ符号化技術又は規格に同時に存在することがある。

一実施形態において、リサンプリング（ズーム）比などのＡＲＣ情報（５０９）は、スライス・ヘッダ、ＧＯＢヘッダ、タイル・ヘッダ、又はタイル・グループ・ヘッダ（以降、タイル・グループ・ヘッダ）（５０８）に存在することができる。これは、例えば上述したように、単一の可変長ｕｅ（ｖ）又は数ビットの固定長符号語などのＡＲＣ情報が小さい場合に十分である。ＡＲＣ情報をタイル・グループ・ヘッダ内に直接有することには、ＡＲＣ情報が画像全体ではなく、例えばそのタイル・グループによって表されるサブ画像に適用できる可能性があるという追加の利点がある。以下も参照されたい。加えて、ビデオ圧縮技術又は規格が（例えば、タイル・グループベースの適応解像度の変更とは対照的に）画像全体の適応解像度の変更のみを想定している場合でも、ＡＲＣ情報をＨ．２６３スタイルの画像ヘッダに入れるよりも、タイル・グループ・ヘッダに入れる方が、エラー回復の観点から特定の利点がある。

同じ又は別の実施形態において、ＡＲＣ情報（５１２）自体は、例えば、画像パラメータ・セット、ヘッダ・パラメータ・セット、タイル・パラメータ・セット、適応パラメータ・セットなどの適切なパラメータ・セット（５１１）内に存在することができる（適応パラメータ・セットが示されている）。そのパラメータ・セットの範囲は、画像、例えばタイル・グループよりも大きくないことが有利である可能性がある。ＡＲＣ情報の使用は、関連するパラメータ・セットのアクティブ化を通して暗黙的に行われる。例えば、ビデオ符号化技術又は規格が画像ベースのＡＲＣのみを企図している場合、画像パラメータ・セット又はそれに相当するものが適切な場合がある。

同じ又は別の実施形態において、ＡＲＣ参照情報（５１３）は、タイル・グループ・ヘッダ（５１４）又は同様のデータ構造内に存在してもよい。その参照情報（５１３）は、単一の画像を超える範囲を有するパラメータ・セット（５１６）、例えば、シーケンス・パラメータ・セット又はデコーダ・パラメータ・セットにおいて利用可能なＡＲＣ情報（５１５）のサブセットを参照することができる。

ＪＶＥＴ－Ｍ０１３５－ｖ１において使用されているようなタイル・グループ・ヘッダＰＰＳ、ＳＰＳからのＰＰＳの追加レベルの間接的な暗黙のアクティブ化は、シーケンス・パラメータ・セットと同様に、画像パラメータ・セットを能力ネゴシエーション又はアナウンスに使用することができる（ＲＦＣ３９８４などの特定の規格において使用されている）ため、不要であるように思われる。しかしながら、ＡＲＣ情報が、例えばタイル・グループによって表されるサブ画像にも適用可能であるべきである場合は、適応パラメータ・セット又はヘッダ・パラメータ・セットなどの、タイル・グループに限定されたアクティブ化範囲を有するパラメータ・セットがより良い選択である可能性がある。また、ＡＲＣ情報のサイズが無視できるサイズを超えている場合（例えば、多数のフィルタ係数などのフィルタ制御情報が含まれている場合）、パラメータは、同じパラメータ・セットを参照することによって将来の画像又はサブ画像によって再利用可能である場合があるため、符号化効率の観点から、ヘッダ（５０８）を直接使用するよりも良い選択である可能性がある。

シーケンス・パラメータ・セット又は別のより上位のパラメータ・セットを、複数の画像にまたがる範囲で使用する場合、特定の考慮事項が適用される場合がある。

１．ＡＲＣ情報テーブル（５１６）を記憶するためのパラメータ・セットは、場合によっては、シーケンス・パラメータ・セットであってもよいが、他の場合には、有利には、デコーダ・パラメータ・セットであってもよい。デコーダ・パラメータ・セットは、複数のＣＶＳ、すなわち符号化ビデオ・ストリーム、すなわちセッションの開始からセッションの切断までのすべての符号化ビデオ・ビットのアクティブ化範囲を有することができる。このような範囲は、可能なＡＲＣ係数が、ハードウェアに実装されている可能性のあるデコーダ機能である場合があり、ハードウェア機能がＣＶＳにおいて変化しない傾向がある（少なくとも一部のエンターテインメント・システムでは長さが１秒以下の画像群である）ため、より適切である可能性がある。とは言うものの、テーブルをシーケンス・パラメータ・セットに入れることは、特に以下のポイント２に関連して、本明細書で説明する配置オプションに明示的に含まれている。

２．ＡＲＣ参照情報（５１３）は、ＪＶＣＥＴ－Ｍ０１３５－ｖ１のように画像パラメータ・セット内ではなく、画像／スライス・タイル／ＧＯＢ／タイル・グループ・ヘッダ（以降、タイル・グループ・ヘッダ）（５１４）内に直接配置することができることが有利である。その理由は以下の通りである。エンコーダが、例えばＡＲＣ参照情報などの画像パラメータ・セット内の単一の値を変更したい場合、新しいＰＰＳを作成し、その新しいＰＰＳを参照する必要があるからである。ＡＲＣ参照情報のみが変更され、ＰＰＳの量子化行列情報などの他の情報はそのままであると想定する。このような情報は、かなりのサイズになる可能性があり、新しいＰＰＳを完全なものするためには再送信する必要がある。ＡＲＣ参照情報は、テーブル（５１３）へのインデックスなどの単一の符号語である可能性があり、変更される唯一の値であるため、例えば、量子化マトリックス情報をすべて再送信することは面倒で無駄である。その限りにおいて、ＪＶＥＴ－Ｍ０１３５－ｖ１において提案されているように、ＰＰＳを介した間接参照を回避することは、符号化効率の観点からかなり優れている可能性がある。同様に、ＡＲＣ参照情報をＰＰＳに入れることには、画像パラメータ・セット・アクティベーションの範囲が画像であるため、ＡＲＣ参照情報（５１３）によって参照されるＡＲＣ情報がサブ画像ではなく画像全体に必ず適用される必要があるという追加の欠点がある。

同じ又は別の実施形態において、ＡＲＣパラメータのシグナリングは、図６に概説されるような詳細な例に従うことができる。図６は、少なくとも１９９３年以来、ビデオ符号化規格において使用されている表現におけるシンタックス・ダイアグラムを示す。このようなシンタックス・ダイアグラムの表記は、Ｃスタイルのプログラミングにほぼ従っている。太字の行は、ビットストリームに存在するシンタックス要素を示し、太字でない行は、しばしば、制御フロー又は変数の設定を示す。

画像の（おそらく矩形の）部分に適用可能なヘッダの例示的なシンタックス構造としてのタイル・グループ・ヘッダ（６０１）は、可変長のＥｘｐ－Ｇｏｌｏｍ符号化シンタックス要素ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ（６０２）（太字で示されている）を条件付きで含むことができる。タイル・グループ・ヘッダ内のこのシンタックス要素の存在、ここでは太字で示されていないフラグの値は、適応解像度の使用に関してゲートすることができ（６０３）、これは、フラグが、シンタックス・ダイアグラムで発生した点でビットストリーム内に存在することを意味する。適応解像度がこの画像又はその一部に使用されているかどうかは、ビットストリームの内部又は外部の任意の高レベルのシンタックス構造においてシグナリングされてもよい。示されている例では、以下に概説するように、シーケンス・パラメータ・セットにおいてシグナリングされる。

さらに図６を参照すると、シーケンス・パラメータ・セット（６１０）の抜粋も示されている。示されている第１のシンタックス要素は、ａｄａｐｔｉｖｅ＿ｐｉｃ＿ｒｅｓｏｌｕｔｉｏｎ＿ｃｈａｎｇｅ＿ｆｌａｇ（６１１）である。真の場合、そのフラグは、適応解像度の使用を示すことができ、これにより特定の制御情報が必要になる場合がある。本例では、このような制御情報は、パラメータ・セット（６１２）のｉｆ（）ステートメントに基づくフラグの値及びタイル・グループ・ヘッダ（６０１）に基づいて条件付きで存在する。

適応解像度が使用されている場合、本例では、符号化されるのはサンプル単位の出力解像度である（６１３）。数字６１３は、ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとｏｕｔｐｕｔ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの両方を指し、これらは、合わさって出力画像の解像度を定義することができる。ビデオ符号化技術又は規格の他の場所では、いずれかの値に対する特定の制限を定義することができる。例えば、レベル定義では、総出力サンプル数を制限することがあるが、これは、これら２つのシンタックス要素の値の積である場合がある。また、特定のビデオ符号化技術若しくは規格、又はシステム規格などの外部技術若しくは規格は、数値の範囲（例えば、片方又は両方の次元が２の累乗数で割り切れる必要がある）又はアスペクト比（例えば、幅と高さが４：３や１６：９などの関係にある必要がある）を制限する場合がある。そのような制限は、ハードウェアの実装を容易にするために、又は他の理由で導入されることがあり、当技術分野でよく知られている。

特定のアプリケーションでは、エンコーダがデコーダに対して、参照画像サイズを出力画像サイズであると暗黙的に想定するのではなく、特定の参照画像サイズを使用するように指示することが賢明である可能性がある。本例では、シンタックス要素ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｓｉｚｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ（６１４）は、参照画像寸法の条件付き存在をゲートする（６１５）（ここでも、数字は幅と高さの両方を示す）。

最後に、可能な復号画像の幅及び高さのテーブルを示す。このようなテーブルは、例えば、テーブル表示（ｎｕｍ＿ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＿ｍｉｎｕｓ１）（６１６）で表すことができる。「ｍｉｎｕｓ１」は、そのシンタックス要素の値の解釈を参照することができる。例えば、符号化された値がゼロの場合、１つのテーブル・エントリが存在する。値が５の場合、６つのテーブル・エントリが存在する。次いで、テーブル内の各「行」について、復号された画像の幅及び高さがシンタックスに含まれる（６１７）。

提示されたテーブル・エントリ（６１７）は、タイル・グループ・ヘッダ内のシンタックス要素ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ（６０２）を使用してインデックスを付けることができるため、タイル・グループごとに異なる復号サイズ（実際にはズーム比）を可能にする。

特定のビデオ符号化技術又は規格、例えばＶＰ９では、空間スケーラビリティを可能にするために、時間スケーラビリティとともに、特定の形態の参照画像リサンプリング（開示された主題とはまったく異なる方法においてシグナリングされる）を実装することによって空間スケーラビリティをサポートしている。特に、特定の参照画像は、ＡＲＣスタイルの技術を使用してより高い解像度にアップサンプリングされ、空間エンハンスメント・レイヤのベースを形成することができる。これらのアップサンプリングされた画像は、高解像度で通常の予測メカニズムを使用して精緻化されて、細部を追加することができる。

開示された主題は、そのような環境で使用することができる。場合によっては、同じ又は別の実施形態において、ＮＡＬユニット・ヘッダ内の値、例えば、ＴｅｍｐｏｒａｌＩＤフィールドを使用して、時間的レイヤだけでなく空間的レイヤも示すことができる。そうすることは、特定のシステム設計に対して特定の利点があり、例えば、ＮＡＬユニット・ヘッダのＴｅｍｐｏｒａｌＩＤ値に基づいて時間的レイヤの選択された転送のために作成及び最適化された既存のＳｅｌｅｃｔｅｄＦｏｒｗａｒｄｉｎｇＵｎｉｔ（ＳＦＵ）を、スケーラブルな環境に対して修正することなく使用することができる。これを可能にするために、符号化画像サイズと時間的レイヤとの間のマッピングのための要件がある場合があり、ＮＡＬユニット・ヘッダ内の時間ＩＤフィールドによって示される。

一部のビデオ符号化技術では、アクセス・ユニット（ＡＵ）は、所与の時間インスタンスでキャプチャされ、それぞれの画像／スライス／タイル／ＮＡＬユニットのビットストリームに合成された、符号化された画像、スライス、タイル、ＮＡＬユニットなどを指すことがある。この時間インスタンスは、合成時間とすることができる。

ＨＥＶＣ及び他の特定のビデオ符号化技術では、復号画像バッファ（ｄｅｃｏｄｅｄｐｉｃｔｕｒｅｂｕｆｆｅｒ：ＤＰＢ）に記憶された複数の参照画像のうち、選択された参照画像を示すたに画像順序カウント（ｐｉｃｔｕｒｅｏｒｄｅｒｃｏｕｎｔ：ＰＯＣ）値を使用することができる。アクセス・ユニット（ＡＵ）が１つ若しくは複数の画像、スライス、又はタイルで構成されている場合、同じＡＵに属する各画像、スライス、又はタイルは、同じＰＯＣ値を担持することがあり、このことから、それらが同じ合成時間のコンテンツから作成されたものであることを推論することができる。言い換えると、２つの画像／スライス／タイルが同じ特定のＰＯＣ値を担持するシナリオでは、その２つの画像／スライス／タイルが同じＡＵに属し、同じ合成時間を有することを示すことができる。逆に、ＰＯＣ値が異なる２つの画像／タイル／スライスは、それぞれの画像／スライス／タイルが異なるＡＵに属し、合成時間が異なることを示すことができる。

開示された主題の実施形態において、アクセス・ユニットが異なるＰＯＣ値を有する画像、スライス、又はタイルを含むことができるという点で、前述の厳密な関係を緩和することができる。ＡＵ内で異なるＰＯＣ値を可能することによって、ＰＯＣ値を使用して、同じ提示時間で潜在的に独立して復号可能な画像／スライス／タイルを識別することが可能になる。これは、以下でより詳細に説明するように、参照画像選択シグナリング（例えば、参照画像セット・シグナリング又は参照画像リスト・シグナリング）を変更することなく、複数のスケーラブルなレイヤのサポートを可能にすることができる。

しかしながら、異なるＰＯＣ値を有する他の画像／スライス／タイルに関して、ＰＯＣ値のみから、画像／スライス／タイルが属するＡＵを識別できることが依然として望ましい。これは、以下に説明するように達成することができる。

同じ又は他の実施形態において、アクセス・ユニット・カウント（ａｃｃｅｓｓｕｎｉｔｃｏｕｎｔ：ＡＵＣ）は、ＮＡＬユニット・ヘッダ、スライス・ヘッダ、タイル・グループ・ヘッダ、ＳＥＩメッセージ、パラメータ・セット又はＡＵデリミタなどの高レベルのシンタックス構造においてシグナリングされてもよい。ＡＵＣの値は、どのＮＡＬユニット、画像、スライス、又はタイルが所与のＡＵに属するかを識別するために使用することができる。ＡＵＣの値は、個別の合成時間インスタンスに対応してもよい。ＡＵＣ値は、ＰＯＣ値の倍数に等しくてもよい。ＰＯＣ値を整数値で除算することによって、ＡＵＣ値を計算することができる。場合によっては、除算演算は、デコーダの実装に特定の負担をかける可能性がある。このような場合、ＡＵＣ値のナンバリング空間においてわずかに制限をかけることにより、除算演算をシフト演算に置き換えることができる。例えば、ＡＵＣ値は、ＰＯＣ値範囲の最上位ビット（ＭｏｓｔＳｉｇｎｉｆｉｃａｎｔＢｉｔ：ＭＳＢ）値と等しい場合がある。

同じ実施形態において、ＡＵごとのＰＯＣサイクルの値（ｐｏｃ＿ｃｙｃｌｅ＿ａｕ）は、ＮＡＬユニット・ヘッダ、スライス・ヘッダ、タイル・グループ・ヘッダ、ＳＥＩメッセージ、パラメータ・セット、又はＡＵデリミタなどの高レベルのシンタックス構造においてシグナリングされてもよい。ｐｏｃ＿ｃｙｃｌｅ＿ａｕは、同じＡＵにいくつの異なる連続したＰＯＣ値を関連付けることができるかを示すことができる。例えば、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値が４に等しい場合、ＰＯＣ値が両端値を含む０から３の画像、スライス、又はタイルは、ＡＵＣ値が０のＡＵに関連付けられ、ＰＯＣ値が両端値を含む４から７の画像、スライス、又はタイルは、ＡＵＣ値が１のＡＵに関連付けられる。したがって、ＡＵＣの値は、ＰＯＣ値をｐｏｃ＿ｃｙｃｌｅ＿ａｕの値で除算することによって推測することができる。

同じ又は別の実施形態において、ｐｏｃ＿ｃｙｌｅ＿ａｕの値は、符号化ビデオ・シーケンス内の空間レイヤ又はＳＮＲレイヤの数を識別する、例えばビデオ・パラメータ・セット（ＶＰＳ）内に位置する情報から導出されてもよい。このような可能な関係について、以下に簡単に説明する。上述したような導出により、ＶＰＳの数ビットが節約され、符号化効率が向上する可能性があるが、ビデオ・パラメータ・セットの階層的に下位の適切な高レベルのシンタックス構造においてｐｏｃ＿ｃｙｃｌｅ＿ａｕを明示的に符号化し、画像などのビットストリームの特定の小部分についてｐｏｃ＿ｃｙｃｌｅ＿ａｕを最小限に抑えることができるようにすることが有利な場合がある。この最適化により、ＰＯＣ値（及び／又はＰＯＣを間接的に参照するシンタックス要素の値）を低レベルのシンタックス構造で符号化することが可能であるため、上記の導出プロセスにおいて節約することができるビットよりも多くのビットを節約することができる可能性がある。

同じ又は別の実施形態において、図９は、ＶＰＳ（又はＳＰＳ）において、符号化ビデオ・シーケンスのすべての画像／スライスに使用されるｐｏｃ＿ｃｙｃｌｅ＿ａｕを示すｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕのシンタックス要素と、スライス・ヘッダにおいて、現在のスライスのｐｏｃ＿ｃｙｃｌｅ＿ａｕを示すｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕのシンタックス要素と、をシグナリングするシンタックス・テーブルの例を示す。ＰＯＣ値がＡＵごとに均一に増加する場合、ＶＰＳのｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕは１に等しく設定され、ＶＰＳのｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕがシグナリングされるこの場合、ｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕは、明示的にシグナリングされず、各ＡＵについてのＡＵＣの値は、ＰＯＣの値をｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕで除算することによって計算される。ＰＯＣ値がＡＵごとに均一に増加しない場合、ＶＰＳのｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕは、０に設定される。この場合、ｖｐｓ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔは、シグナリングされないが、ｓｌｉｃｅ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔは、各スライス又は画像のスライス・ヘッダにおいてシグナリングされる。各スライス又は画像は、ｓｌｉｃｅ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔの異なる値を有する場合がある。各ＡＵについてのＡＵＣの値は、ＰＯＣの値をｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕで除算することによって計算される。図１０は、関連するワーク・フローを示すブロック図を示す。

同じ又は他の実施形態において、画像、スライス、又はタイルのＰＯＣの値が異なることがあったとしても、同じＡＵＣ値を有するＡＵに対応する画像、スライス、又はタイルは、同じ復号化又は出力時間インスタンスに関連付けられ得る。したがって、同じＡＵ内の画像、スライス、又はタイル間でのいかなるインター解析／復号依存関係なしに、同じＡＵに関連付けられた画像、スライス、又はタイルのすべて又はサブセットが並列に復号され、同時に出力されてもよい。

同じ又は他の実施形態において、画像、スライス、又はタイルのＰＯＣの値が異なることがあったとして、同じＡＵＣ値を有するＡＵに対応する画像、スライス、又はタイルは、同じ構成／表示時間インスタンスに関連付けられてもよい。合成時間がコンテナ・フォーマットに含まれている場合、画像が異なるＡＵに対応しているとしても、画像の合成時間が同じであれば、画像を同じ時間インスタンスで表示することができる。

同じ又は他の実施形態において、各画像、スライス、又はタイルは、同じＡＵ内に同じ時間識別子（ｔｅｍｐｏｒａｌ＿ｉｄ）を有することができる。時間インスタンスに対応する画像、スライス、又はタイルのすべて又はサブセットは、同じ時間サブレイヤに関連付けられてもよい。同じ又は他の実施形態において、各画像、スライス、又はタイルは、同じＡＵ内に同じ又は異なる空間レイヤｉｄ（ｌａｙｅｒ＿ｉｄ）を有することができる。時間インスタンスに対応する画像、スライス、又はタイルのすべて又はサブセットは、同じ又は異なる空間レイヤに関連付けられてもよい。

全体を通して説明される適応解像度パラメータをシグナリングするための技術は、コンピュータ可読命令を使用してコンピュータ・ソフトウェアとして実装され、１つ又は複数のコンピュータ可読媒体に物理的に記憶されてもよい。例えば、図７は、開示された主題の特定の実施形態を実施するのに適したコンピュータ・システム７００を示す。

コンピュータ・ソフトウェアは、任意の適切な機械語又はコンピュータ言語を使用してコーディングすることができ、これらの言語は、アセンブリ、コンパイル、リンクなどのメカニズムの対象となり、コンピュータ中央処理装置（ＣＰＵ）、グラフィックス処理装置（ＧＰＵ）などによって、直接、又は解釈やマイクロコード実行などを介して実行することができる命令を含むコードを生成することができる。

命令は、例えば、パーソナル・コンピュータ、タブレット・コンピュータ、サーバ、スマート・フォン、ゲーム機器、モノのインターネット機器などを含む、様々なタイプのコンピュータ又はそのコンポーネント上で実行することができる。

コンピュータ・システム７００について図７に示されるコンポーネントは、本質的に例示的なものであり、本開示の実施形態を実施するコンピュータ・ソフトウェアの使用範囲又は機能に関して、いかなる限定も示唆することは意図されていない。また、コンポーネントの構成は、コンピュータ・システム７００の例示的な実施形態に示されるコンポーネントのいずれか１つ又は組合せに関連する依存関係又は要件を有すると解釈されるべきではない。

コンピュータ・システム７００は、特定のヒューマン・インターフェース入力デバイスを含むことができる。そのようなヒューマン・インターフェース入力デバイスは、例えば、触覚入力（キーストローク、スワイプ、データ・グローブの動きなど）、音声入力（声、拍手など）、視覚入力（ジェスチャーなど）、嗅覚入力（図示せず）を介して、１人又は複数の人間のユーザによる入力に応答することができる。ヒューマン・インターフェース・デバイスは、音声（スピーチ、音楽、周囲音など）、画像（スキャンされた画像、静止画像カメラから取得した写真画像など）、ビデオ（２次元ビデオ、立体ビデオを含む３次元ビデオなど）などの、人間による意識的な入力に必ずしも直接関連しない特定の媒体をキャプチャするためにも使用することができる。

入力ヒューマン・インターフェース・デバイスは、キーボード７０１、マウス７０２、トラックパッド７０３、タッチ・スクリーン７１０、データ・グローブ７０４、ジョイスティック７０５、マイクロフォン７０６、スキャナ７０７、カメラ７０８のうちの１つ又は複数（図示されたそれぞれのうちの１つのみ）を含むことができる。

コンピュータ・システム７００はまた、特定のヒューマン・インターフェース出力デバイスを含むことができる。そのようなヒューマン・インターフェース出力デバイスは、例えば、触覚出力、音、光、及び匂い／味覚を通して、１人又は複数の人間のユーザの感覚を刺激するものであってもよい。そのようなヒューマン・インターフェース出力デバイスは、触覚出力デバイス（例えば、タッチ・スクリーン７１０、データ・グローブ７０４、又はジョイスティック７０５による触覚フィードバックを含むことができるが、入力デバイスとして機能しない触覚フィードバック・デバイス）、音声出力デバイス（スピーカ７０９、ヘッドホン（図示せず）など）、視覚出力デバイス（ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマ・スクリーン、ＯＬＥＤスクリーンを含み、それぞれがタッチ・スクリーン入力機能を有するか又は有さず、それぞれが触覚フィードバック機能を有するか又は有さず、そのうちのいくつかが立体グラフィック出力、仮想現実眼鏡（図示せず）、ホログラフィック・ディスプレイ、スモーク・タンク（図示せず）などの手段を介して、２次元視覚出力又は３次元を超える出力を出力可能なスクリーン７１０など）、及びプリンタ（図示せず））を含むことができる。

コンピュータ・システム７００はまた、ＣＤ／ＤＶＤなどの媒体７２１を有するＣＤ／ＤＶＤＲＯＭ／ＲＷ７２０を含む光学媒体、サム・ドライブ７２２、リムーバブル・ハード・ドライブ又はソリッド・ステート・ドライブ７２３、テープやフロッピー・ディスクなどのレガシー磁気媒体（図示せず）、セキュリティ・ドングルなどの特殊なＲＯＭ／ＡＳＩＣ／ＰＬＤベースのデバイス（図示せず）などの、人間がアクセス可能な記憶デバイス及びその関連媒体を含むことができる。

当業者はまた、本開示の主題に関連して使用される「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、又は他の一過性の信号を含まないことを理解すべきである。

コンピュータ・システム７００はまた、１つ又は複数の通信ネットワークへのインターフェースを含むことができる。ネットワークは、例えば、無線、有線、光であってもよい。ネットワークはさらに、ローカル、ワイド・エリア、大都市、車両及び産業、リアルタイム、遅延耐性などとすることができる。ネットワークの例には、イーサネットなどのローカル・エリア・ネットワーク、無線ＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラー・ネットワーク、ケーブルＴＶ、衛星ＴＶ、地上波放送ＴＶを含むＴＶ有線又は無線ワイド・エリア・デジタル・ネットワーク、ＣＡＮＢｕｓを含む車両及び産業などが含まれる。特定のネットワークは、通常、特定の汎用データポート又は周辺バス（７４９）に接続された外部ネットワーク・インターフェース・アダプタを必要とし（例えば、コンピュータ・システム７００のＵＳＢポートなど、他は、通常、以下で説明するようなシステム・バスに取り付けることによってコンピュータ・システム７００のコアに組み込まれている（例えば、ＰＣコンピュータ・システムへのイーサネット・インターフェース又はスマート・フォン・コンピュータ・システムへのセルラー・ネットワーク・インターフェース）。これらのネットワークのいずれかを使用して、コンピュータ・システム７００は、他のエンティティと通信することができる。このような通信は、単方向、受信のみ（例えば、テレビ放送）、単方向送信のみ（例えば、ＣＡＮｂｕｓから特定のＣＡＮｂｕｓデバイスへ）、又は双方向（例えば、ローカル又はワイド・エリア・デジタル・ネットワークを使用して他のコンピュータ・システムへ）とすることができる。特定のプロトコル及びプロトコル・スタックを上述したようなこれらのネットワーク及びネットワーク・インターフェースのそれぞれで使用することができる。

前述のヒューマン・インターフェース・デバイス、ヒューマンアクセス可能記憶デバイス、及びネットワーク・インターフェースは、コンピュータ・システム７００のコア７４０に取り付けることができる。

コア７４０は、１つ又は複数の中央処理装置（ＣＰＵ）７４１、グラフィックス処理装置（ＧＰＵ）７４２、フィールド・プログラマブル・ゲート・エリア（ＦＰＧＡ）７４３の形態の専用プログラマブル処理装置、特定のタスクのためのハードウェア・アクセラレータ７４４などを含むことができる。これらのデバイスは、読み取り専用メモリ（ＲＯＭ）７４５、ランダム・アクセス・メモリ７４６、内部ユーザアクセス不能ハード・ドライブなどの内部大容量ストレージ、ＳＳＤなど７４７とともに、システム・バス７４８を介して接続することができる。一部のコンピュータ・システムでは、システム・バス７４８は、１つ又は複数の物理プラグの形態でアクセス可能であり、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にする。周辺機器は、コアのシステム・バス７４８に直接接続することも、周辺バス７４９を介して接続することもできる。周辺バスのアーキテクチャには、ＰＣＩ、ＵＳＢなどが含まれる。

ＣＰＵ７４１、ＧＰＵ７４２、ＦＰＧＡ７４３、及びアクセラレータ７４４は、組み合わされて、前述のコンピュータ・コードを構成することができる特定の命令を実行することができる。そのコンピュータ・コードは、ＲＯＭ７４５又はＲＡＭ７４６に記憶することができる。また、一過性のデータもＲＡＭ７４６に記憶することができるが、恒久的なデータは、例えば、内部大容量記憶装置７４７に記憶することができる。１つ又は複数のＣＰＵ７４１、ＧＰＵ７４２、大容量記憶装置７４７、ＲＯＭ７４５、ＲＡＭ７４６などと密接に関連付けることができるキャッシュ・メモリを使用することにより、メモリ・デバイスのいずれかへの高速記憶及び取得を可能にすることができる。

コンピュータ可読媒体は、様々なコンピュータ実施動作を実行するためのコンピュータ・コードを有することができる。媒体及びコンピュータ・コードは、本開示の目的のために専用に設計及び構築されたものであってもよく、又はコンピュータ・ソフトウェア分野の当業者によく知られている利用可能な種類のものとすることができる。

限定ではなく例として、アーキテクチャを有するコンピュータ・システム７００、具体的にはコア７４０は、プロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータなどを含む）が１つ又は複数の有形のコンピュータ可読媒体で具現化されたソフトウェアを実行する結果として、機能を提供することができる。そのようなコンピュータ可読媒体は、上で紹介したようなユーザアクセス可能な大容量記憶装置、並びにコア内部の大容量記憶装置７４７又はＲＯＭ７４５などの非一過性の性質のものである、コア７４０の特定の記憶装置に関連する媒体であってもよい。本開示の様々な実施形態を実施するソフトウェアは、そのようなデバイスに記憶され、コア７４０によって実行され得る。

コンピュータ可読媒体は、特定のニーズに応じて、１つ又は複数のメモリ・デバイス又はチップを含むことができる。ソフトウェアは、コア７４０、具体的にはその中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む）に、ＲＡＭ７４６に記憶されたデータ構造を定義すること、及びソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することを含む、本明細書に記載の特定のプロセス又は特定のプロセスの特定の部分を実行させることができる。加えて、又は代替として、コンピュータ・システムは、本明細書に記載の特定のプロセス又は特定のプロセスの特定の部分を実行するために、ソフトウェアの代わりに、又はソフトウェアとともに動作することができる回路（例えば、アクセラレータ７４４）にハードワイヤード又はその他の方法で具現化されたロジックの結果として機能を提供することができる。

適切な場合は、ソフトウェアへの言及は、ロジックを包含することができ、その逆も可能である。コンピュータ可読媒体への言及は、適切な場合は、実行のためのソフトウェアを記憶する回路（集積回路（ＩＣ）など）、実行のためのロジックを具現化する回路、又はその両方を包含することができる。本開示は、ハードウェアとソフトウェアの任意の適切な組合せを包含する。

図８は、ｔｅｍｐｏｒａｌ＿ｉｄ、ｌａｙｅｒ＿ｉｄ、ＰＯＣ、及びＡＵＣ値の組合せによる適応解像度変更を伴うビデオ・シーケンス構造の例を示す。本例では、ＡＵＣ＝０を有する第１のＡＵ内の画像、スライス、又はタイルは、ｔｅｍｐｏｒａｌ＿ｉｄ＝０及びｌａｙｅｒ＿ｉｄ＝０又は１を有することができ、一方、ＡＵＣ＝１を有する第２のＡＵ内の画像、スライス、又はタイルは、ｔｅｍｐｏｒａｌ＿ｉｄ＝１及びｌａｙｅｒ＿ｉｄ＝０又は１をそれぞれ有することができる。ＰＯＣの値は、ｔｅｍｐｏｒａｌ＿ｉｄ及びｌａｙｅｒ＿ｉｄの値に関係なく、画像ごとに１ずつ増加する。本例では、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は、２に等しくすることができる。好ましくは、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は、（空間スケーラビリティ）レイヤの数に等しく設定されてもよい。したがって、本例では、ＰＯＣの値は、２だけ増加し、ＡＵＣの値は、１だけ増加する。

上記の実施形態において、画像間又はレイヤ間予測構造及び参照画像表示のすべて又はサブセットは、ＨＥＶＣにおける既存の参照画像セット（ｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｓｅｔ：ＲＰＳ）シグナリング又は参照画像リスト（ｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｌｉｓｔ：ＲＰＬ）シグナリングを使用することによってサポートされてもよい。ＲＰＳ又はＲＰＬでは、選択された参照画像は、現在の画像と選択された参照画像との間のＰＯＣの値、又はＰＯＣのデルタ値をシグナリングすることによって示される。開示された主題について、ＲＰＳ及びＲＰＬは、シグナリングを変更することなく、画像間又はレイヤ間予測構造を示すために使用することができるが、以下の制限がある。参照画像のｔｅｍｐｏｒａｌ＿ｉｄの値がｔｅｍｐｏｒａｌ＿ｉｄの現在の画像の値よりも大きい場合、現在の画像は、動き補償又はその他の予測に参照画像を使用しない場合がある。参照画像のｌａｙｅｒ＿ｉｄの値がｌａｙｅｒ＿ｉｄの現在の画像の値よりも大きい場合、現在の画像は、動き補償や又はその他の予測に参照画像を使用しない場合がある。

同じ及び他の実施形態において、時間動きベクトル予測のためのＰＯＣ差分に基づく動きベクトルのスケーリングは、アクセス・ユニット内の複数の画像にわたって無効にされてもよい。したがって、各画像は、アクセス・ユニット内で異なるＰＯＣ値を有することがあるが、動きベクトルは、スケーリングされず、アクセス・ユニット内の時間動きベクトル予測に使用されない。これは、同じＡＵ内に異なるＰＯＣを有する参照画像が、同じ時間インスタンスを有する参照画像と見なされるためである。したがって、本実施形態において、参照画像が現在の画像に関連付けられたＡＵに属する場合、動きベクトルのスケーリング関数は、１を返すことができる。

同じ及び他の実施形態において、時間動きベクトル予測のためのＰＯＣ差分に基づく動きベクトルのスケーリングは、参照画像の空間解像度が現在の画像の空間解像度と異なる場合、複数の画像にわたって所望により無効にされてもよい。動きベクトルのスケーリングが許可されている場合、動きベクトルは、現在の画像と参照画像との間のＰＯＣ差分と空間解像度比の両方に基づいてスケーリングされる。

同じ又は別の実施形態において、特にｐｏｃ＿ｃｙｃｌｅ＿ａｕが不均一な値を有する場合（ｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ＝＝０の場合）、時間動きベクトル予測のために、動きベクトルは、ＰＯＣ差分ではなくＡＵＣ差分に基づいてスケーリングされてもよい。そうではない場合（ｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ＝＝１の場合）、ＡＵＣ差分に基づく動きベクトルのスケーリングはＰＯＣ差分に基づく動きベクトルのスケーリングと同一であってもよい。

同じ又は別の実施形態において、動きベクトルがＡＵＣ差分に基づいてスケーリングされる場合、現在の画像と同じＡＵの（同じＡＵＣ値を有する）参照動きベクトルは、ＡＵＣ差分に基づいてスケーリングされず、現在の画像と参照画像との間の空間解像度比に基づいて、スケーリングの有無にかかわらず動きベクトル予測に使用される。

同じ及び他の実施形態において、ＡＵＣ値は、ＡＵの境界を識別するために使用され、ＡＵ粒度での入力及び出力タイミングを必要とする仮想参照デコーダ（ＨＲＤ）動作に使用される。ほとんどの場合、ＡＵ内の最上位レイヤを有する復号画像が表示用に出力される。ＡＵＣ値及びｌａｙｅｒ＿ｉｄ値は、出力画像を識別するために使用することができる。

一実施形態において、画像は、１つ又は複数のサブ画像から構成することができる。各サブ画像は、画像のローカル領域又は領域全体をカバーすることができる。サブ画像によってサポートされる領域は、別のサブ画像によってサポートされる領域と重複しても、しなくてもよい。１つ又は複数のサブ画像によって構成される領域は、画像の領域全体をカバーしても、しなくてもよい。画像がサブ画像によって構成されている場合、サブ画像によってサポートされている領域は、その画像によってサポートされている領域と同じである。

同じ実施形態において、サブ画像は、符号化画像に使用される符号化方法と同様の符号化方法によって符号化されてもよい。サブ画像は、独立して符号化されてもよく、又は別のサブ画像若しくは符号化画像に依存して符号化されてもよい。サブ画像は、別のサブ画像又は符号化画像からの解析依存関係を有しても、有さなくてもよい。

同じ実施形態において、符号化サブ画像は、１つ又は複数のレイヤに含まれていてもよい。レイヤ内の符号化サブ画像は、異なる空間解像度を有してもよい。元のサブ画像は、空間的にリサンプリング（アップサンプリング又はダウンサンプリング）され、異なる空間解像度パラメータで符号化され、レイヤに対応するビットストリームに含められてもよい。

同じ又は別の実施形態において、Ｗがサブ画像の幅を示し、Ｈがサブ画像の高さをそれぞれ示す（Ｗ、Ｈ）のサブ画像は、レイヤ０に対応する符号化ビットストリームに符号化され、含められてもよく、一方、元の空間解像度を有するサブ画像からアップサンプリング（又はダウンサンプリング）された、（Ｗ＊Ｓ_ｗ，ｋ，Ｈ＊Ｓ_ｈ，ｋ）のサブ画像は、レイヤｋに対応する符号化ビットストリームに符号化され、含められてよく、ここで、Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋは、水平方向及び垂直方向のリサンプリング比を示す。Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋの値が１よりも大きい場合、リサンプリングは、アップサンプリングに等しい。一方、Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋの値が１よりも小さい場合、リサンプリングは、ダウンサンプリングに等しい。

同じ又は別の実施形態において、レイヤ内の符号化サブ画像は、同じサブ画像又は異なるサブ画像内の別のレイヤ内の符号化サブ画像の視覚品質とは異なる視覚品質を有してもよい。例えば、レイヤｎのサブ画像ｉは、量子化パラメータＱ_ｉ，ｎで符号化されるが、レイヤｍのサブ画像ｊは、量子化パラメータＱ_ｊ，ｍで符号化される。

同じ又は別の実施形態において、レイヤ内の符号化サブ画像は、同じローカル領域の別のレイヤ内の符号化サブ画像からのいかなる解析又は復号化依存関係もなしに、独立して復号化可能であってもよい。同じローカル領域の別のサブ画像レイヤを参照することなく独立して復号できるサブ画像レイヤは、独立サブ画像レイヤである。独立サブ画像レイヤ内の符号化サブ画像は、同じサブ画像レイヤ内の以前に符号化されたサブ画像からの復号又は解析の依存関係を有しても、有さなくてもよいが、符号化サブ画像は、別のサブ画像レイヤ内の符号化画像からの依存関係を有さなくてもよい。

同じ又は別の実施形態において、レイヤ内の符号化サブ画像は、同じローカル領域の別のレイヤ内の符号化サブ画像からの任意の解析又は復号に依存して、従属的に復号可能であってもよい。同じローカル領域の別のサブ画像レイヤを参照することで従属的に復号可能であるサブ画像レイヤは、従属サブ画像レイヤである。従属サブ画像内の符号化サブ画像は、同じサブ画像に属する符号化サブ画像、同じサブ画像レイヤ内の以前に符号化されたサブ画像、又は両方の参照サブ画像を参照することができる。

同じ又は別の実施形態において、符号化サブ画像は、１つ又は複数の独立サブ画像レイヤ及び１つ又は複数の従属サブ画像レイヤから構成される。しかしながら、少なくとも１つの独立サブ画像レイヤが、符号化サブ画像のために存在してもよい。独立サブ画像レイヤは、ＮＡＬユニット・ヘッダ又は別の高レベルのシンタックス構造に存在することがあるレイヤ識別子（ｌａｙｅｒ＿ｉｄ）の値を有することができ、この値は０に等しい。ｌａｙｅｒ＿ｉｄが０に等しいサブ画像レイヤは、ベース・サブ画像レイヤである。

同じ又は別の実施形態において、画像は、１つ又は複数の前景サブ画像及び１つの背景サブ画像から構成されてもよい。背景サブ画像によってサポートされる領域は、画像の領域と等しくてもよい。前景サブ画像によってサポートされる領域は、背景サブ画像によってサポートされる領域と重複してもよい。背景サブ画像は、ベース・サブ画像レイヤであってもよいが、前景サブ画像は、非ベース（エンハンスメント）サブ画像レイヤであってもよい。１つ又は複数の非ベース・サブ画像レイヤは、復号のために同じベース・レイヤを参照することができる。ｌａｙｅｒ＿ｉｄがａに等しい非ベース・サブ画像レイヤはそれぞれ、ｌａｙｅｒ＿ｉｄがｂに等しい非ベース・サブ画像レイヤを参照することができ、ここで、ａはｂよりも大きい。

同じ又は別の実施形態において、画像は、背景サブ画像を有する、又は有さない１つ又は複数の前景サブ画像から構成されてもよい。各サブ画像は、それ自体のベース・サブ画像レイヤと、１つ又は複数の非ベース（エンハスメント）レイヤを有することができる。各ベース・サブ画像レイヤは、１つ又は複数の非ベース・サブ画像レイヤによって参照されてもよい。ｌａｙｅｒ＿ｉｄがａに等しい非ベース・サブ画像レイヤはそれぞれ、ｌａｙｅｒ＿ｉｄがｂに等しい非ベース・サブ画像レイヤを参照することができ、ここで、ａはｂよりも大きい。

同じ又は別の実施形態において、画像は、背景サブ画像を有する、又は有さない１つ又は複数の前景サブ画像から構成されてもよい。（ベース又は非ベース）サブ画像レイヤ内の各符号化サブ画像は、同じサブ画像に属する１つ又は複数の非ベース・レイヤのサブ画像と、同じサブ画像に属していない１つ又は複数の非ベース・レイヤのサブ画像とによって参照されてもよい。

同じ又は別の実施形態において、画像は、背景サブ画像を有する、又は有さない１つ又は複数の前景サブ画像から構成されてもよい。レイヤａ内のサブ画像は、同じレイヤ内の複数のサブ画像にさらに分割されてもよい。レイヤｂ内の１つ又は複数の符号化サブ画像は、レイヤａ内の分割されたサブ画像を参照することができる。

同じ又は別の実施形態において、符号化ビデオ・シーケンス（ｃｏｄｅｄｖｉｄｅｏｓｅｑｕｅｎｃｅ：ＣＶＳ）は、符号化画像のグループであってもよい。ＣＶＳは、１つ又は複数の符号化サブ画像シーケンス（ｃｏｄｅｄｓｕｂ－ｐｉｃｔｕｒｅｓｅｑｕｅｎｃｅ：ＣＳＰＳ）から構成されてもよく、ここで、ＣＳＰＳは、画像の同じローカル領域をカバーする符号化サブ画像のグループであってもよい。ＣＳＰＳは、符号化ビデオ・シーケンスの時間解像度と同じか又は異なる時間解像度を有することができる。

同じ又は別の実施形態において、ＣＳＰＳは、符号化され、１つ又は複数のレイヤ内に含められてもよい。ＣＳＰＳは、１つ又は複数のＣＳＰＳレイヤから構成されてもよい。ＣＳＰＳに対応する１つ又は複数のＣＳＰＳレイヤを復号することにより、同じローカル領域に対応する一連のサブ画像のシーケンスを再構成することができる。

同じ又は別の実施形態において、ＣＳＰＳに対応するＣＳＰＳレイヤの数は、別のＣＳＰＳに対応するＣＳＰＳレイヤの数と同一であっても異なっていてもよい。

同じ又は別の実施形態において、ＣＳＰＳレイヤは、別のＣＳＰＳレイヤとは異なる時間解像度（例えば、フレーム・レート）を有することができる。元の（圧縮されていない）サブ画像シーケンスは、時間的にリサンプリング（アップサンプリング又はダウンサンプリング）され、異なる時間解像度パラメータで符号化され、レイヤに対応するビットストリームに含められてもよい。

同じ又は別の実施形態において、フレーム・レートＦを有するサブ画像シーケンスは、符号化され、レイヤ０に対応する符号化されたビットストリームに含められてもよく、一方、Ｆ＊Ｓ_ｔ，ｋを有する元のサブ画像シーケンスから時間的にアップサンプリングされた（又はダウンサンプリングされた）サブ画像シーケンスは、符号化され、レイヤｋに対応する符号化されたビットストリームに含められてもよく、ここで、Ｓ_ｔ，ｋはレイヤｋについての時間的なサンプリング比である。Ｓ_ｔ，ｋの値が１よりも大きい場合、時間的なリサンプリング・プロセスは、フレーム・レートのアップコンバージョンに等しい。一方、Ｓ_ｔ，ｋの値が１よりも小さい場合、時間的なリサンプリング・プロセスは、フレーム・レートのダウンコンバージョンに等しい。

同じ又は別の実施形態において、動き補償又は任意のレイヤ間予測のために、ＣＳＰＳレイヤａを有するサブ画像が、ＣＳＰＳレイヤｂを有するサブ画像によって参照されるときに、ＣＳＰＳレイヤａの空間解像度がＣＳＰＳレイヤｂの空間解像度と異なる場合、ＣＳＰＳレイヤａ内の復号ピクセルがリサンプリングされ、参照のために使用される。リサンプリング・プロセスでは、アップサンプリング・フィルタリング又はダウンサンプリング・フィルタリングが必要となる場合がある。

図１１は、ｌａｙｅｒ＿ｉｄが０に等しい背景ビデオＣＳＰＳと、複数の前景ＣＳＰＳレイヤとを含む例示的なビデオ・ストリームを示す。符号化サブ画像は、１つ又は複数のＣＳＰＳレイヤで構成されていてもよいが、いずれの前景ＣＳＰＳレイヤにも属していない背景領域は、ベース・レイヤで構成されている場合がある。ベース・レイヤは、背景領域及び前景領域を含むことができるが、エンハンスメントＣＳＰＳレイヤは、前景領域を含む。エンハンスメントＣＳＰＳレイヤは、同じ領域において、ベース・レイヤよりも視覚的な品質が優れている場合がある。エンハンスメントＣＳＰＳレイヤは、同じ領域に対応する、再構成されたピクセルとベース・レイヤの動きベクトルとを参照することができる。

同じ又は別の実施形態において、ベース・レイヤに対応するビデオ・ビットストリームはトラックに含められ、一方、各サブ画像に対応するＣＳＰＳレイヤは、ビデオファイル内の別個のトラックに含められる。

同じ又は別の実施形態において、ベース・レイヤに対応するビデオ・ビットストリームは、トラックに含められ、一方、同じｌａｙｅｒ＿ｉｄを有するＣＳＰＳレイヤは、別個のトラックに含められる。本例では、レイヤｋに対応するトラックは、レイヤｋに対応するＣＳＰＳレイヤのみを含む。

同じ又は別の実施形態において、各サブ画像の各ＣＳＰＳレイヤは、別個のトラックに記憶される。各トラックは、１つ又は複数の他のトラックからの解析又は復号依存関係があっても、なくてもよい。

同じ又は別の実施形態において、各トラックは、サブ画像のすべて又はサブセットのＣＳＰＳレイヤのうちのレイヤｉからレイヤｊに対応するビットストリームを含むことができ、ここで、０＜ｉ＝＜ｊ＝＜ｋであり、ｋは、ＣＳＰＳの最上位レイヤである。

同じ又は別の実施形態において、画像は、深度マップ、アルファ・マップ、３Ｄジオメトリデータ、占有マップなどを含む１つ又は複数の関連付けられた媒体データから構成されている。そのような関連付けられた時限式媒体データは、それぞれが１つのサブ画像に対応する１つ又は複数のデータサブストリームに分割することができる。

同じ又は別の実施形態において、図１２は、マルチレイヤ・サブ画像方法に基づくビデオ会議の例を示す。ビデオ・ストリームには、背景画像に対応する１つのベース・レイヤ・ビデオ・ビットストリームと、前景サブ画像に対応する１つ又は複数のエンハンスメント・レイヤ・ビデオ・ビットストリームとが含まれる。各エンハンスメント・レイヤ・ビデオ・ビットストリームは、ＣＳＰＳレイヤに対応する。ディスプレイでは、デフォルトでベース・レイヤに対応する画像が表示される。これには、１つ又は複数のユーザのピクチャ・イン・ピクチャ（ＰＩＰ）が含まれている。クライアントの制御によって特定のユーザが選択されると、選択されたユーザに対応するエンハンスメントＣＳＰＳレイヤが復号され、品質又は空間解像度を向上させて表示される。図１３は、その動作を示す図である。

同じ又は別の実施形態において、ネットワーク・ミドル・ボックス（ルータなど）は、その帯域幅に応じて、ユーザに送信するレイヤのサブセットを選択することができる。画像／サブ画像の構成は、帯域幅の適応に使用することができる。例えば、ユーザが帯域幅を有していない場合、ルータは、レイヤを削除するか、重要性に応じて、又は使用されているセットアップに基づいていくつかのサブ画像を選択し、これは、帯域幅に適応するために動的に行うことができる。

図１４は、３６０度ビデオの使用事例を示す。球面の３６０度画像が平面画像上に投影されると、投影３６０度画像は、ベース・レイヤとして複数のサブ画像に分割されることがある。特定のサブ画像のエンハンスメント・レイヤを符号化して、クライアントに送信することができる。デコーダは、すべてのサブ画像を含むベース・レイヤと、選択されたサブ画像のエンハンスメント・レイヤとの両方を復号することが可能であってもよい。現在のビューポートが、選択されたサブ画像と同一である場合、表示される画像は、エンハンスメント・レイヤを有する復号サブ画像でより高品質になる可能性がある。さもなければ、ベース・レイヤを有する復号画像が低品質で表示されることがある。

同じ又は別の実施形態において、表示のための任意のレイアウト情報は、補足情報（ＳＥＩメッセージ又はメタデータなど）としてファイルに存在してもよい。シグナリングされたレイアウト情報に応じて、１つ又は複数の復号サブ画像が再配置及び表示されてもよい。レイアウト情報は、ストリーミング・サーバ又はブロードキャスタによってシグナリングされてもよく、ネットワーク・エンティティ又はクラウド・サーバによって再生成されてもよく、或いはユーザのカスタマイズされた設定によって決定されてもよい。

一実施形態において、入力画像が１つ又は複数の（矩形の）サブ領域に分割される場合、各サブ領域は、独立レイヤとして符号化されてもよい。ローカル領域に対応する各独立レイヤは、一意のｌａｙｅｒ＿ｉｄ値を有することができる。独立レイヤごとに、サブ画像のサイズ及び位置情報がシグナリングされてもよい。例えば、画像サイズ（幅、高さ）、左上隅のオフセット情報（ｘ＿ｏｆｆｓｅｔ、ｙ＿ｏｆｆｓｅｔ）である。図１５は、分割されたサブ画像のレイアウト、そのサブ画像のサイズ及び位置情報、並びにその対応する画像予測構造の例を示す。サブ画像サイズ及びサブ画像位置を含むレイアウト情報は、パラメータ・セット、スライス若しくはタイル・グループのヘッダ、又はＳＥＩメッセージなどの高レベルのシンタックス構造においてシグナリングされてもよい。

同じ実施形態において、独立レイヤに対応する各サブ画像は、ＡＵ内でその一意のＰＯＣ値を有することができる。ＤＰＢに記憶された画像のうちの参照画像がＲＰＳ又はＲＰＬ構造のシンタックス要素を使用して示される場合、レイヤに対応する各サブ画像のＰＯＣ値を使用することができる。

同じ又は別の実施形態において、（レイヤ間）予測構造を示すために、ｌａｙｅｒ＿ｉｄを使用せず、ＰＯＣ（ｄｅｌｔａ）値を使用してもよい。

同じ実施形態において、あるレイヤ（又はローカル領域）に対応するＰＯＣ値がＮに等しいサブ画像は、同じレイヤ（又は同じローカル領域）に対応するＰＯＣ値がＮ＋Ｋに等しいサブ画像の参照画像として、動き補償予測に使用されても、されなくてもよい。ほとんどの場合、数Ｋの値は、（独立）レイヤの最大数に等しくてもよく、これは、サブ領域の数と等しくてもよい。

同じ又は別の実施形態において、図１６は、図１５の拡張されたケースを示す。入力画像が複数（例えば４つ）のサブ領域に分割される場合、各ローカル領域は、１つ又は複数のレイヤで符号化されてもよい。この場合、独立レイヤの数は、サブ領域の数に等しくてもよく、１つ又は複数のレイヤがサブ領域に対応していてもよい。したがって、各サブ領域は、１つ又は複数の独立レイヤ及び０又は複数の従属レイヤで符号化されてもよい。

同じ実施形態において、図１６において、入力画像は、４つのサブ領域に分割されてもよい。右上のサブ領域は、レイヤ１とレイヤ４の２つのレイヤとして符号化されてもよく、一方、右下のサブ領域は、レイヤ３とレイヤ５の２つのレイヤとして符号化されてもよい。この場合、レイヤ４は、動き補償予測のためにレイヤ１を参照することができ、一方、レイヤ５は、動き補償のためにレイヤ３を参照することができる。

同じ又は別の実施形態において、レイヤ境界を横切るインループ・フィルタリング（デブロッキング・フィルタリング、適応インループ・フィルタリング、リシェーパ、双方向フィルタリング、又は任意の深層学習ベースのフィルタリングなど）は、（所望により）無効にされてもよい。

同じ又は別の実施形態において、レイヤ境界を横切る動き補償予測又はイントラブロック・コピーは、（所望により）無効にされてもよい。

同じ又は別の実施形態において、サブ画像の境界での動き補償予測又はインループ・フィルタリングのための境界パディングを所望により処理することができる。境界パディングが処理されるかどうかを示すフラグは、パラメータ・セット（ＶＰＳ、ＳＰＳ、ＰＰＳ、又はＡＰＳ）、スライス又はタイル・グループ・ヘッダ、ＳＥＩメッセージなどの高レベルのシンタックス構造においてシグナリングされてもよい。

同じ又は別の実施形態において、サブ領域（又はサブ画像）のレイアウト情報は、ＶＰＳ又はＳＰＳにおいてシグナリングされてもよい。図１７は、ＶＰＳ及びＳＰＳのシンタックス要素の例を示す。本例では、ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇは、ＶＰＳにおいてシグナリングされる。フラグは、入力画像が複数のサブ領域に分割されているかどうかを示すことができる。ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇの値が０に等しい場合、現在のＶＰＳに対応する符号化ビデオ・シーケンスの入力画像は、複数のサブ領域に分割されなくてもよい。この場合、入力画像サイズは、ＳＰＳにおいてシグナリングされる符号化画像サイズ（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）に等しくてもよい。ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇの値が１に等しい場合、入力画像は、複数のサブ領域に分割されてもよい。この場合、シンタックス要素ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、ＶＰＳにおいてシグナリングされる。ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、それぞれ入力画像の幅と高さに等しくてもよい。

同じ実施形態において、ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、復号に使用されなくてもよいよいが、合成及び表示に使用されてもよい。

同じ実施形態において、ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇの値が１に等しい場合、シンタックス要素ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ及びｐｉｃ＿ｏｆｆｓｅｔ＿ｙは、特定のレイヤに対応するＳＰＳにおいてシグナリングされてもよい。この場合、ＳＰＳにおいてシグナリングされる符号化画像のサイズ（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）は、特定のレイヤに対応するサブ領域の幅及び高さに等しくてもよい。また、サブ領域の左上隅の位置（ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ、ｐｉｃ＿ｏｆｆｓｅｔ＿ｙ）は、ＳＰＳにおいてシグナリングされてもよい。

同じ実施形態において、サブ領域の左上隅の位置情報（ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ，ｐｉｃ＿ｏｆｆｓｅｔ＿ｙ）は、復号化に使用されなくてもよいが、合成及び表示に使用されてもよい。

同じ又は別の実施形態において、入力画像のすべて又はサブセットのサブ領域のレイアウト情報（サイズ及び位置）、レイヤ間の依存関係情報は、パラメータ・セット又はＳＥＩメッセージにおいてシグナリングされてもよい。図１８は、サブ領域のレイアウト、レイヤ間の依存関係、及びサブ領域と１つ又は複数のレイヤとの間の関係に関する情報を示すためのシンタックス要素の例を示す。本例では、シンタックス要素ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎは、現在の符号化ビデオ・シーケンス内の（矩形の）サブ領域の数を示し、シンタックス要素ｎｕｍ＿ｌａｙｅｒｓは、現在の符号化ビデオ・シーケンス内のレイヤ数を示す。ｎｕｍ＿ｌａｙｅｒｓの値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎの値以上であってもよい。任意のサブ領域が単一レイヤとして符号化される場合、ｎｕｍ＿ｌａｙｅｒｓの値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎの値に等してもよい。１つ又は複数のサブ領域が複数のレイヤとして符号化される場合、ｎｕｍ＿ｌａｙｅｒｓの値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎの値よりも大きくなる可能性がある。シンタックス要素ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］は、ｊ番目のレイヤからｉ番目のレイヤへの依存関係を示す。ｎｕｍ＿ｌａｙｅｒｓ＿ｆｏｒ＿ｒｅｇｉｏｎ［ｉ］は、ｉ番目のサブ領域に関連付けられたレイヤの数を示す。ｓｕｂ＿ｒｅｇｉｏｎ＿ｌａｙｅｒ＿ｉｄ［ｉ］［ｊ］は、ｉ番目のサブ領域に関連付けられたｊ番目のレイヤのｌａｙｅｒ＿ｉｄを示す。ｓｕｂ＿ｒｅｇｉｏｎ＿ｏｆｆｓｅｔ＿ｘ［ｉ］及びｓｕｂ＿ｒｅｇｉｏｎ＿ｏｆｆｓｅｔ＿ｙ［ｉ］は、ｉ番目のサブ領域の左上隅の水平位置及び垂直位置をそれぞれ示す。ｓｕｂ＿ｒｅｇｉｏｎ＿ｗｉｄｔｈ［ｉ］及びｓｕｂ＿ｒｅｇｉｏｎ＿ｈｅｉｇｈｔ［ｉ］は、ｉ番目のサブ領域の幅及び高さをそれぞれ示す。

一実施形態において、プロファイル階層レベル情報の有無にかかわらず出力されるより多くのレイヤのうちの１つを示す出力レイヤ・セットを指定する１つ又は複数のシンタックス要素は、高レベルのシンタックス構造、例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ又はＳＥＩメッセージにおいてシグナリングされてもよい。図１９を参照すると、ＶＰＳを参照する符号化ビデオ・シーケンス内の出力レイヤ・セット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ：ＯＬＳ）の数を示すシンタックス要素ｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓは、ＶＰＳにおいてシグナリングされてもよい。各出力レイヤ・セットについて、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇは、出力レイヤの数と同じ数だけシグナリングされてもよい。

同じ実施形態において、１に等しいｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］は、ｉ番目のレイヤが出力されることを指定する。０に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］は、ｉ番目のレイヤが出力されないことを指定する。

同じ又は別の実施形態において、各出力レイヤ・セットについてのプロファイル階層レベル情報を指定する１つ又は複数のシンタックス要素は、高レベルのシンタックス構造、例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ又はＳＥＩメッセージにおいてシグナリングされてもよい。さらに図１９を参照すると、ＶＰＳを参照する符号化ビデオ・シーケンスにおけるＯＬＳ当たりのプロファイル階層レベル情報の数を示すシンタックス要素ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｌｅ＿ｌｅｖｅｌは、ＶＰＳにおいてシグナリングされてもよい。各出力レイヤ・セットについて、プロファイル階層レベル情報に対するシンタックス要素のセット、又はプロファイル階層レベル情報内のエントリのうちの特定のプロファイル階層レベル情報を示すインデックスは、出力レイヤの数だけシグナリングされてもよい。

同じ実施形態において、ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｉｄｘ［ｉ］［ｊ］は、ｉ番目のＯＬＳのｊ番目のレイヤに適用されるｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造の、ＶＰＳ内のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造のリスト内にインデックスを指定する。

同じ又は別の実施形態において、図２０を参照すると、最大レイヤの数が１よりも大きい場合（ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＞０）、シンタックス要素ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｌｅ＿ｌｅｖｅｌ及び／又はｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓがシグナリングされてもよい。

同じ又は別の実施形態において、図２０を参照すると、ｉ番目の出力レイヤ・セットのための出力レイヤ・シグナリングのモードを示すシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］がＶＰＳ内に存在することができる。

同じ実施形態において、０に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］は、ｉ番目の出力レイヤ・セットを有する最上位レイヤのみを出力することを指定する。ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｍｏｄｅ［ｉ］が１の場合、ｉ番目の出力レイヤ・セットを有するすべてのレイヤを出力することを指定する。ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｍｏｄｅ［ｉ］が２に等しい場合、出力されるレイヤは、ｉ番目の出力レイヤ・セットを有するｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいレイヤであることを指定する。より多くの値が予約されていてもよい。

同じ実施形態において、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｉ番目の出力レイヤ・セットについてｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］の値に応じて、シグナリングされる場合と、されない場合がある。

同じ又は別の実施形態において、図２０を参照すると、フラグｖｐｓ＿ｐｔｌ＿ｓｉｇｎａｌ＿ｆｌａｇ［ｉ］がｉ番目の出力レイヤ・セットに対して存在することができる。ｖｐｓ＿ｐｔｌ＿ｓｉｇｎａｌ＿ｆｌａｇ［ｉ］の値に応じて、ｉ番目の出力レイヤ・セットのプロファイル階層レベルの情報がシグナリングされる場合と、されない場合がある。

同じ又は別の実施形態において、図２１を参照すると、現在のＣＶＳ内のサブ画像の数ｍａｘ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１は、高レベルのシンタックス構造、例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ又はＳＥＩメッセージにおいてシグナリングされてもよい。

同じ実施形態において、図２１を参照すると、サブ画像の数が１よりも大きい場合（ｍａｘ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１＞０）、ｉ番目のサブ画像のサブ画像識別子ｓｕｂ＿ｐｉｃ＿ｉｄ［ｉ］がシグナリングされてもよい。

同じ又は別の実施形態において、各出力レイヤ・セットの各レイヤに属するサブ画像識別子を示す１つ又は複数のシンタックス要素がＶＰＳにおいてシグナリングされてもよい。図２２を参照すると、ｓｕｂ＿ｐｉｃ＿ｉｄ＿ｌａｙｅｒ［ｉ］［ｊ］［ｋ］は、ｉ番目の出力レイヤ・セットのｊ番目のレイヤに存在するｋ番目のサブ画像を示す。これらの情報を用いて、デコーダは、特定の出力レイヤ・セットの各レイヤについてどのサブ画像が復号及び出力され得るかを認識することができる。

一実施形態において、画像ヘッダ（ｐｉｃｔｕｒｅｈｅａｄｅｒ：ＰＨ）は、符号化画像のすべてのスライスに適用されるシンタックス要素を含むシンタックス構造である。画像ユニット（ｐｉｃｔｕｒｅｕｎｉｔ：ＰＵ）は、指定された分類ルールに従って互いに関連付けられ、復号順に連続しており、厳密に１つの符号化画像を含むＮＡＬユニットのセットである。ＰＵは、画像ヘッダ（ＰＨ）と、符号化画像を構成する１つ又は複数のＶＣＬＮＡＬユニットとを含むことができる。

一実施形態において、ＳＰＳ（ＲＢＳＰ）は、参照される前に復号プロセスに利用可能であってもよく、ＴｅｍｐｏｒａｌＩｄが０に等しい少なくとも１つのＡＵに含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＳＰＳ（ＲＢＳＰ）は、参照される前に復号プロセスに利用可能であってもよく、ＳＰＳを参照する１つ又は複数のＰＰＳを含む、ＴｅｍｐｏｒａｌＩｄがＣＶＳにおいて０に等しい少なくとも１つのＡＵに含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＳＰＳ（ＲＢＳＰ）は、１つ又は複数のＰＰＳによって参照される前に復号プロセスに利用可能であってもよく、ＳＰＳを参照する１つ又は複数のＰＰＳを含む、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＣＶＳ内のＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しい少なくとも１つのＰＵ内に含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＳＰＳ（ＲＢＳＰ）は、１つ又は複数のＰＰＳによって参照される前に復号プロセスに利用可能であってもよく、ＴｅｍｐｏｒａｌＩｄが０に等しく、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの、最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しい少なくとも１つのＰＵに含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＳＰＳ（ＲＢＳＰ）は、１つ又は複数のＰＰＳによって参照される前に復号プロセスに利用可能であってもよく、ＳＰＳを参照する１つ又は複数のＰＰＳを含む、ＴｅｍｐｏｒａｌＩｄが０に等しく、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＣＶＳ内のＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しい少なくとも１つのＰＵに含まれていてもよく、外部手段を通じて提供されてもよい。

同じ又は別の実施形態において、ｐｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、参照されるＳＰＳについてｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値を指定する。ｐｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値は、ＣＬＶＳ内の符号化画像によって参照されるすべてのＰＰＳにおいて同じであってもよい。

同じ又は別の実施形態において、ＣＶＳにおいて特定の値のｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄを有するすべてのＳＰＳＮＡＬユニットは、同じコンテンツを有することができる。

同じ又は別の実施形態において、ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に関係なく、ＳＰＳＮＡＬユニットは、ｓｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの同じ値空間を共有することができる。

同じ又は別の実施形態において、ＳＰＳＮＡＬユニットのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値は、ＳＰＳＮＡＬユニットを参照するＰＰＳＮＡＬユニットの最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しくてもよい。

一実施形態において、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｍに等しいＳＰＳが、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｎに等しい１つ又は複数のＰＰＳによって参照される場合、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｍに等しいレイヤは、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｎに等しいレイヤ、又はｎｕｈ＿ｌａｙｅｒ＿ｉｄがｍに等しいレイヤの（直接又は間接）参照レイヤと同じであってもよい。

一実施形態において、ＰＰＳ（ＲＢＳＰ）は、参照される前に復号プロセスに利用可能であってもよく、ＴｅｍｐｏｒａｌＩｄがＰＰＳＮＡＬユニットのＴｅｍｐｏｒａｌＩｄに等しい少なくとも１つのＡＵに含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＰＰＳ（ＲＢＳＰ）は、参照される前に復号プロセスに利用可能であってもよく、ＰＰＳを参照する１つ又は複数のＰＨ（若しくは符号化スライスＮＡＬユニット）を含む、ＴｅｍｐｏｒａｌＩｄがＣＶＳ内のＰＰＳＮＡＬユニットのＴｅｍｐｏｒａｌＩｄに等しい少なくとも１つのＡＵ内に含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＰＰＳ（ＲＢＳＰ）は、１つ又は複数のＰＨ（又は符号化スライスＮＡＬユニット）によって参照される前に、復号プロセスに利用可能であってもよく、ＰＰＳを参照する１つ又は複数のＰＨ（若しくは符号化スライスＮＡＬユニット）を含む、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＣＶＳ内のＰＰＳＮＡＬユニットを参照する符号化スライスＮＡＬユニットの最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しい少なくとも１つのＰＵに含まれていてもよく、又は外部手段を通じて提供されてもよい。

一実施形態において、ＰＰＳ（ＲＢＳＰ）は、１つ又は複数のＰＨ（若しくは符号化スライスＮＡＬユニット）によって参照される前に復号プロセスに利用可能であってもよく、ＰＰＳを参照する１つ又は複数のＰＨ（若しくは符号化スライスＮＡＬユニット）を含む、ＴｅｍｐｏｒａｌＩｄがＰＰＳＮＡＬユニットのＴｅｍｐｏｒａｌＩｄに等しく、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＣＶＳ内のＰＰＳＮＡＬユニットを参照する符号化スライスＮＡＬユニットの最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しい少なくとも１つのＰＵ内に含まれていてもよく、又は外部手段を通じて提供されてもよい。

同じ又は別の実施形態において、ＰＨ内のｐｈ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、使用において参照されるＰＰＳに対するｐｐｓ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値を指定する。ｐｐｓ＿ｓｅｑ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値は、ＣＬＶＳ内の符号化画像によって参照されるすべてのＰＰＳにおいて同じであってもよい。

同じ又は別の実施形態において、ＰＵ内のｐｐｓ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの特定の値を有するすべてのＰＰＳＮＡＬユニットは、同じコンテンツを有することができる。

同じ又は別の実施形態において、ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に関係なく、ＰＰＳＮＡＬユニットは、ｐｐｓ＿ｐｉｃ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの同じ値空間を共有することができる。

同じ又は別の実施形態において、ＰＰＳＮＡＬユニットのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値は、ＰＰＳＮＡＬユニットを参照するＮＡＬユニットを参照する符号化スライスＮＡＬユニットの最低のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値に等しくてもよい。

一実施形態において、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｍに等しいＰＰＳが、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｎに等しい１つ又は複数の符号化スライスＮＡＬユニットによって参照される場合、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｍに等しいレイヤは、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｎに等しいレイヤ、又はｎｕｈ＿ｌａｙｅｒ＿ｉｄがｍに等しいレイヤの（直接又は間接）参照レイヤと同じであってもよい。

出力レイヤは、出力される出力レイヤ・セットのレイヤを示す。出力レイヤ・セット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ：ＯＬＳ）は、指定されたレイヤのセットで構成されるレイヤのセットを示し、ここで、レイヤのセット内の１つ又は複数のレイヤが出力レイヤであると指定される。出力レイヤ・セット（ＯＬＳ）のレイヤ・インデックスは、ＯＬＳ内のレイヤの、ＯＬＳ内のレイヤのリストに対するインデックスである。

サブレイヤは、ＴｅｍｐｏｒａｌＩｄ変数の特定の値を有するＶＣＬＮＡＬユニットと、関連付けられた非ＶＣＬＮＡＬユニットとで構成される、時間的にスケーラブルなビットストリームの時間的にスケーラブルなレイヤを示す。サブレイヤ表現は、特定のサブレイヤ及び下位サブレイヤのＮＡＬユニットで構成されるビットストリームのサブセットを示す。

ＶＰＳＲＢＳＰは、参照される前に復号プロセスに使用されてもよく、ＴｅｍｐｏｒａｌＩｄが０に等しい少なくとも１つのＡＵに含まれていてもよく、又は外部手段を通じて提供されてもよい。ＣＶＳ内のｖｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの特定の値を有するすべてのＶＰＳＮＡＬユニットは、同じコンテンツを有することができる。

ｖｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは、他のシンタックス要素による参照のためにＶＰＳの識別子を提供する。ｖｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄの値は、０よりも大きくてもよい。

ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１ｐｌｕｓ１は、ＶＰＳを参照する各ＣＶＳ内の最大許容レイヤ数を指定する。

ｖｐｓ＿ｍａｘ＿ｓｕｂｌａｙｅｒｓ＿ｍｉｎｕｓ１ｐｌｕｓ１は、ＶＰＳを参照する各ＣＶＳ内のレイヤに存在する可能性のある時間的なサブレイヤの最大数を指定する。ｖｐｓ＿ｍａｘ＿ｓｕｂｌａｙｅｒｓ＿ｍｉｎｕｓ１の値は、両端値を含む０から６の範囲にあってもよい。

１に等しいｖｐｓ＿ａｌｌ＿ｌａｙｅｒｓ＿ｓａｍｅ＿ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＿ｆｌａｇは、ＶＰＳを参照する各ＣＶＳ内のすべてのレイヤで、時間的なサブレイヤの数が同じであることを指定する。０に等しいｖｐｓ＿ａｌｌ＿ｌａｙｅｒｓ＿ｓａｍｅ＿ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＿ｆｌａｇは、ＶＰＳを参照する各ＣＶＳ内のレイヤが同じ数の時間的なサブレイヤを有しても、有さなくてもよいことを指定する。存在しない場合、ｖｐｓ＿ａｌｌ＿ｌａｙｅｒｓ＿ｓａｍｅ＿ｎｕｍ＿ｓｕｂｌａｙｅｒｓ＿ｆｌａｇの値は、１に等しいと推測される。

１に等しいｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇは、ＣＶＳ内のすべてのレイヤがレイヤ間予測を使用することなく独立して符号化されることを指定する。０に等しいｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇは、ＣＶＳ内の１つ又は複数のレイヤがレイヤ間予測を使用することができることを指定する。存在しない場合、ｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇの値は、１に等しいと推測される。

ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］は、ｉ番目のレイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する。ｍ及びｎの任意の２つの非負の整数値について、ｍがｎ未満の場合、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｍ］の値は、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｎ］未満であってもよい。

１に等しいｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］は、インデックスｉを有するレイヤがレイヤ間予測を使用しないことを指定する。０に等しいｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］は、インデックスｉを有するレイヤがレイヤ間予測を使用することができ、両端値を含む０からｉ－１の範囲内のｊに対するシンタックス要素ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］がＶＰＳ内に存在することを指定する。存在しない場合、ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］の値は、１に等しいと推測される。

０に等しいｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、インデックスｊを有するレイヤがインデックスｉを有するレイヤのための直接参照レイヤではないことを指定する。１に等しいｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、インデックスｊを有するレイヤがインデックスｉを有するレイヤのための直接参照レイヤであることを指定する。両端値を含む０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲のｉ及びｊについて、ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］が存在しない場合、これは、０に等しいと推測される。ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］が０に等しい場合、ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］の値が１に等しくなるようなｊの値が、両端値を含む０からｉ－１までの範囲に少なくとも１つ存在する可能性がある。

変数ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｉ］、ＤｉｒｅｃｔＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｄ］、ＮｕｍＲｅｆＬａｙｅｒｓ［ｉ］、ＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｒ］、及びＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｊ］は、以下のように導出される。
ｆｏｒ（ｉ＝０；ｉ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｉ＋＋）｛
ｆｏｒ（ｊ＝０；ｊ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｊ＋＋）｛
ｄｅｐｅｎｄｅｎｃｙＦｌａｇ［ｉ］［ｊ］＝ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］
ｆｏｒ（ｋ＝０；ｋ＜ｉ；ｋ＋＋）
ｉｆ（ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｋ］＆＆ｄｅｐｅｎｄｅｎｃｙＦｌａｇ［ｋ］［ｊ］）
ｄｅｐｅｎｄｅｎｃｙＦｌａｇ［ｉ］［ｊ］＝１
｝
ＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｉ］＝０
｝
ｆｏｒ（ｉ＝０；ｉ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｉ＋＋）｛
ｆｏｒ（ｊ＝０，ｄ＝０，ｒ＝０；ｊ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｊ＋＋）｛
ｉｆ（ｖｐｓ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］）｛
ＤｉｒｅｃｔＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｄ＋＋］＝ｊ
ＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｊ］＝１
｝
ｉｆ（ｄｅｐｅｎｄｅｎｃｙＦｌａｇ［ｉ］［ｊ］）
ＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｒ＋＋］＝ｊ
｝
ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｉ］＝ｄ
ＮｕｍＲｅｆＬａｙｅｒｓ［ｉ］＝ｒ
｝

ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］に等しいレイヤのレイヤ・インデックスを指定する変数ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｉ］は、以下のように導出される。
ｆｏｒ（ｉ＝０；ｉ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｉ＋＋）
ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］］＝ｉ

両方とも、両端値を含む０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲のｉ及びｊの２つの異なる値について、ｄｅｐｅｎｄｅｎｃｙＦｌａｇ［ｉ］［ｊ］が１に等しい場合、ｉ番目のレイヤに適用されるｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ及びｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８の値が、ｊ番目のレイヤに適用されるｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃ及びｂｉｔ＿ｄｅｐｔｈ＿ｍｉｎｕｓ８の値にそれぞれ等しくなり得ることが、ビットストリーム適合性の要件である。

１に等しいｍａｘ＿ｔｉｄ＿ｒｅｆ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、シンタックス要素ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］が存在することを指定する。０に等しいｍａｘ＿ｔｉｄ＿ｒｅｆ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］は、シンタックス要素ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］が存在しないことを指定する。

０に等しいｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］は、レイヤ間予測がｉ番目のレイヤの非ＩＲＡＰ画像によって使用されないことを指定する。０よりも大きいｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］は、ｉ番目のレイヤの画像を復号するために、ＴｅｍｐｏｒａｌＩｄがｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］－１よりも大きい画像がＩＬＲＰとして使用されないことを指定する。存在しない場合、ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］の値は、７に等しいと推測される。

１に等しいｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇは、各ＯＬＳには１つのレイヤしか含まれておらず、ＶＰＳを参照するＣＶＳ内の各レイヤ自体が、含まれている単一のレイヤを唯一の出力レイヤとするＯＬＳであることを指定する。０に等しいｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇは、ＯＬＳが２つ以上のレイヤを含むことができることを指定する。ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１が０に等しい場合、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇの値は１に、等しいと推測される。そうではなく、ｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇが０に等しい場合、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇの値は、０に等しいと推測される。

０に等しいｏｌｓ＿ｍｏｄｅ＿ｉｄｃは、ＶＰＳによって指定されたＯＬＳの総数がｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１に等しいことを指定する。ｉ番目のＯＬＳは、両端値を含む０からｉまでのレイヤ・インデックスを有するレイヤを含み、各ＯＬＳについて、ＯＬＳの最上位レイヤのみが出力される。

１に等しいｏｌｓ＿ｍｏｄｅ＿ｉｄｃは、ＶＰＳによって指定されたＯＬＳの総数がｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１に等しいことを指定し、ｉ番目のＯＬＳは、両端値を含む０からｉまでのレイヤ・インデックスを有するレイヤを含み、各ＯＬＳについて、ＯＬＳ内のすべてのレイヤが出力される。

２に等しいｏｌｓ＿ｍｏｄｅ＿ｉｄｃは、ＶＰＳによって指定されたＯＬＳの総数が明示的にシグナリングされ、各ＯＬＳについて出力レイヤが明示的にシグナリングされ、他のレイヤがＯＬＳの出力レイヤの直接又は間接参照レイヤであるレイヤであることを指定する。

ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値は、両端値を含む０から２の範囲にあってもよい。ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値３は、ＩＴＵ－Ｔ｜ＩＳＯ／ＩＥＣによる将来の使用のために予約されている。

ｖｐｓ＿ａｌｌ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒｓ＿ｆｌａｇが１に等しく、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇが０に等しい場合、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値は、２に等しいと推測される。

ｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１ｐｌｕｓ１は、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しい場合、ＶＰＳによって指定されたＯＬＳの総数を指定する。

ＶＰＳによって指定されたＯＬＳの総数を指定する変数ＴｏｔａｌＮｕｍＯｌｓｓは、以下のように導出される。
ｉｆ（ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＝＝０）
ＴｏｔａｌＮｕｍＯｌｓｓ＝１
ｅｌｓｅｉｆ（ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇ｜｜ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝０｜｜ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝１）
ＴｏｔａｌＮｕｍＯｌｓｓ＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１
ｅｌｓｅｉｆ（ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝２）
ＴｏｔａｌＮｕｍＯｌｓｓ＝ｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１＋１

１に等しいｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しい場合に、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］に等しいレイヤが、ｉ番目のＯＬＳの出力レイヤであることを指定する。０に等しいｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しい場合、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］に等しいレイヤが、ｉ番目のＯＬＳの出力レイヤではないことを指定する。

ｉ番目のＯＬＳにおける出力レイヤの数を指定する変数ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］、ｉ番目のＯＬＳにおけるｊ番目のレイヤにおけるサブレイヤの数を指定する変数ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］、ｉ番目のＯＬＳにおけるｊ番目の出力レイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する変数ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］、及びｋ番目のレイヤが少なくとも１つのＯＬＳにおいて出力レイヤとして使用されるかどうかを指定する変数ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｋ］は、以下のように導出される。
ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［０］＝１
ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［０］［０］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［０］
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［０］［０］＝ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１
ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［０］＝１
ｆｏｒ（ｉ＝１，ｉ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｉ＋＋）｛
ｉｆ（ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇ｜｜ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＜２）
ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｉ］＝１
ｅｌｓｅ／＊（！ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇ＆＆ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝２）＊／
ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｉ］＝０
｝
ｆｏｒ（ｉ＝１；ｉ＜ＴｏｔａｌＮｕｍＯｌｓｓ；ｉ＋＋）
ｉｆ（ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇ｜｜ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝０）｛
ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］＝１
ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［０］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］
ｆｏｒ（ｊ＝０；ｊ＜ｉ＆＆（ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝０）；ｊ＋＋）
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］＝ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｉ］＝ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１
｝ｅｌｓｅｉｆ（ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝１）｛
ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］＝ｉ＋１
ｆｏｒ（ｊ＝０；ｊ＜ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］；ｊ＋＋）｛
ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］＝ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１
｝
｝ｅｌｓｅｉｆ（ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝２）｛
ｆｏｒ（ｊ＝０；ｊ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｊ＋＋）｛
ｌａｙｅｒＩｎｃｌｕｄｅｄＩｎＯｌｓＦｌａｇ［ｉ］［ｊ］＝０
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］＝０
｝
ｆｏｒ（ｋ＝０，ｊ＝０；ｋ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｋ＋＋）
ｉｆ（ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｋ］）｛
ｌａｙｅｒＩｎｃｌｕｄｅｄＩｎＯｌｓＦｌａｇ［ｉ］［ｋ］＝１
ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｋ］＝１
ＯｕｔｐｕｔＬａｙｅｒＩｄｘ［ｉ］［ｊ］＝ｋ
ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ＋＋］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｋ］
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］＝ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１
｝
ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］＝ｊ
ｆｏｒ（ｊ＝０；ｊ＜ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］；ｊ＋＋）｛
ｉｄｘ＝ＯｕｔｐｕｔＬａｙｅｒＩｄｘ［ｉ］［ｊ］
ｆｏｒ（ｋ＝０；ｋ＜ＮｕｍＲｅｆＬａｙｅｒｓ［ｉｄｘ］；ｋ＋＋）｛
ｌａｙｅｒＩｎｃｌｕｄｅｄＩｎＯｌｓＦｌａｇ［ｉ］［ＲｅｆＬａｙｅｒＩｄｘ［ｉｄｘ］［ｋ］］＝１
ｉｆ（ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ＲｅｆＬａｙｅｒＩｄｘ［ｉｄｘ］［ｋ］］＜
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］］）
ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ＲｅｆＬａｙｅｒＩｄｘ［ｉｄｘ］［ｋ］］＝
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］］
｝
｝
｝

両端値を含む０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲のｉの各値について、ＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｉ］及びＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｉ］の値は、両方とも０に等しくない場合がある。言い換えると、少なくとも１つのＯＬＳの出力レイヤでも、他のレイヤの直接参照レイヤでもないレイヤが存在しない場合がある。

各ＯＬＳについて、出力レイヤであるレイヤが少なくとも１つ存在してもよい。言い換えると、両端値を含む０からＴｏｔａｌＮｕｍＯｌｓｓ－１までの範囲のｉの任意の値について、ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］の値は、１以上であってもよい。

ｉ番目のＯＬＳにおけるレイヤ数を指定する変数ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］と、ｉ番目のＯＬＳにおけるｊ番目のレイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する変数ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］とは、以下のように導出される。
ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［０］＝１
ＬａｙｅｒＩｄＩｎＯｌｓ［０］［０］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［０］
ｆｏｒ（ｉ＝１；ｉ＜ＴｏｔａｌＮｕｍＯｌｓｓ；ｉ＋＋）｛
ｉｆ（ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇ）｛
ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］＝１
ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［０］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］
｝ｅｌｓｅｉｆ（ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝０｜｜ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝１）｛
ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］＝ｉ＋１
ｆｏｒ（ｊ＝０；ｊ＜ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］；ｊ＋＋）
ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］
｝ｅｌｓｅｉｆ（ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝＝２）｛
ｆｏｒ（ｋ＝０，ｊ＝０；ｋ＜＝ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１；ｋ＋＋）
ｉｆ（ｌａｙｅｒＩｎｃｌｕｄｅｄＩｎＯｌｓＦｌａｇ［ｉ］［ｋ］）
ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ＋＋］＝ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｋ］
ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］＝ｊ
｝
｝

ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］に等しいレイヤのＯＬＳレイヤ・インデックスを指定する変数ＯｌｓＬａｙｅｒＩｄｘ［ｉ］［ｊ］は、以下のように導出される。
ｆｏｒ（ｉ＝０；ｉ＜ＴｏｔａｌＮｕｍＯｌｓｓ；ｉ＋＋）
ｆｏｒｊ＝０；ｊ＜ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］；ｊ＋＋）
ＯｌｓＬａｙｅｒＩｄｘ［ｉ］［ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］］＝ｊ

各ＯＬＳの最下位レイヤは、独立レイヤであってもよい。言い換えると、両端値を含む０からＴｏｔａｌＮｕｍＯｌｓｓ－１までの範囲の各ｉについて、ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［０］］］の値は、１に等しくてもよい。

各レイヤは、ＶＰＳによって指定される少なくとも１つのＯＬＳに含まれていてもよい。言い換えると、両端値を含む０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲のｋについて、ｎｕｈ＿ｌａｙｅｒ＿ｉｄｎｕｈＬａｙｅｒＩｄの特定の値がｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｋ］のうちの１つに等しい各レイヤについて、ｉとｊの値のペアが少なくとも１つ存在してもよく、ここで、ｉは両端値を含む０からＴｏｔａｌＮｕｍＯｌｓｓ－１までの範囲にあり、ｊは両端値を含むＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］－１までの範囲にあって、ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］の値がｎｕｈＬａｙｅｒＩｄに等しくなるようにする。

一実施形態において、復号プロセスは、現在の画像ＣｕｒｒＰｉｃに対して以下のように動作する。ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、以下のように設定される。以下の条件のいずれかが真である場合、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、０に設定される。そうではない場合、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｐｉｃ＿ｏｕｔｐｕｔ＿ｆｌａｇに等しく設定される。
－現在の画像がＲＡＳＬ画像であり、関連付けられたＩＲＡＰ画像のＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１である。
－ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、現在の画像が、ＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいＧＤＲ画像である。
－ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、現在の画像が、ＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇが１に等しいＧＤＲ画像に関連付けられ、現在の画像のＰｉｃＯｒｄｅｒＣｎｔＶａｌが関連付けられたＧＤＲ画像のＲｐＰｉｃＯｒｄｅｒＣｎｔＶａｌよりも小さい。
－ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが０に等しく、現在のＡＵが以下のすべての条件を満たす画像ｐｉｃＡを含む。
－ＰｉｃＡが１に等しいＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇを有する。
－ＰｉｃＡが現在の画像よりも大きなｎｕｈ＿ｌａｙｅｒ＿ｉｄｎｕｈＬｉｄを有する。
－ＰｉｃＡがＯＬＳの出力レイヤに属する（すなわち、ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ＴａｒｇｅｔＯｌｓＩｄｘ］［０］がｎｕｈＬｉｄに等しい）。
－ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しく、ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＴａｒｇｅｔＯｌｓＩｄｘ］［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］が０に等しい。

現在の画像のすべてのスライスが復号された後、現在の復号画像は「短期参照用に使用」とマークされ、ＲｅｆＰｉｃＬｉｓｔ［０］又はＲｅｆＰｉｃＬｉｓｔ［１］の各ＩＬＲＰエントリは、「短期参照用に使用」とマークされる。

同じ又は別の実施形態において、各レイヤが出力レイヤ・セットである場合、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃの値に関係なく、ｐｉｃ＿ｏｕｔｐｕｔ＿ｆｌａｇに等しく設定される。

同じ又は別の実施形態において、ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇが０に等しく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが０に等しく、現在のＡＵが以下のすべての条件を満たす画像ｐｉｃＡを含んでいる場合、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、０に設定される。すなわち、ＰｉｃＡが１に等しいＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇを有し、ＰｉｃＡが現在の画像よりも大きなｎｕｈ＿ｌａｙｅｒ＿ｉｄｎｕｈＬｉｄを有し、ＰｉｃＡがＯＬＳの出力レイヤに属する（すなわち、ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ＴａｒｇｅｔＯｌｓＩｄｘ］［０］がｎｕｈＬｉｄに等しい）。

同じ又は別の実施形態において、ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０よりも大きく、ｅａｃｈ＿ｌａｙｅｒ＿ｉｓ＿ａｎ＿ｏｌｓ＿ｆｌａｇが０に等しく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しく、ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＴａｒｇｅｔＯｌｓＩｄｘ］［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］が０に等しい場合、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、０に等しく設定される。

参照画像のリサンプリングにより、符号化された（階層化された）ビデオ・シーケンス内の適応解像度の変更、及び同じ出力レイヤ・セットに属するレイヤ間に依存関係があるレイヤ間の空間スケーラビリティが可能になる。

一実施形態において、図２４に示すように、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、パラメータ・セット（例えばシーケンス・パラメータ・セット）においてシグナリングされる。フラグｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ＳＰＳを参照する符号化ビデオ・シーケンス内の適応解像度の変更、又はレイヤ間の空間スケーラビリティに参照画像のリサンプリングを使用するかどうかを示す。１に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照画像のリサンプリングが有効であり、ＣＬＶＳ内の１つ又は複数の画像スライスが、参照画像リストのアクティブなエントリ内の異なる空間解像度の参照画像を参照することを指定する。０に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照画像のリサンプリングが無効となり、ＣＬＶＳ内の画像のどのスライスも、参照画像リストのアクティブなエントリ内の異なる空間解像度を有する参照画像を参照しないことを指定する。

同じ又は別の実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合、現在の画像について、異なる空間解像度を有する参照画像は、現在の画像を含むレイヤと同じレイヤ、又はそれとは異なるレイヤのいずれかに属する。

別の実施形態において、１に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照画像のリサンプリングが有効であり、ＣＬＶＳ内の画像の１つ又は複数のスライスが、参照画像リストのアクティブなエントリ内の異なる空間解像度又は異なるスケーリング・ウィンドウを有する参照画像を参照することを指定する。０に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、参照画像のリサンプリングが無効となり、ＣＬＶＳ内の画像のどのスライスも、参照画像リストのアクティブなエントリ内の異なる空間解像度又は異なるスケーリング・ウィンドウを有する参照画像を参照しないことを指定する。

同じ又は別の実施形態において、１に等しいｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、現在の画像について、異なる空間解像度又は異なるスケーリング・ウィンドウを有する参照画像は、現在の画像を含むレイヤと同じレイヤ、又はそれとは異なるレイヤのいずれかに属する。

同じ又は別の実施形態において、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、画像解像度がＣＬＶＳ又はＣＶＳにおいて変更されるかどうかを示す。１に等しいｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、ＳＰＳを参照するＣＬＶＳ内で画像の空間解像度が変化してもよいことを指定する。０に等しいｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、ＳＰＳを参照するＣＬＶＳ内で画像の空間解像度が変化しないことを指定する。存在しない場合、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、０に等しいと推測される。

同じ又は別の実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合、参照画像のリサンプリングは、ＣＬＶＳ内の適応解像度の変更ではなく、空間スケーラビリティのみに使用することができる。

同じ又は別の実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが１に等しい場合、参照画像のリサンプリングは、ＣＬＶＳ内の空間スケーラビリティ及び適応解像度変更の両方に使用することができる。

ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しく、ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄが０に等しい場合、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎｄｏｗ＿ｅｘｐｌｉｃｉｔ＿ｓｉｇｎａｌｌｉｎｇ＿ｆｌａｇは、１に等しくてもよい。これは、画像の解像度がＣＬＶＳ又はＣＶＳにおいて一定で、参照画像のリサンプリングが使用される場合、スケーリング・ウィンドウパラメータを、適合ウィンドウパラメータから値を推測するのではなく、明示的にシグナリングする必要があることを意味する。

一実施形態において、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、図２４に示すように、ＳＰＳにおいてシグナリングされる。フラグｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、仮想境界情報がＳＰＳにおいてシグナリングされるかどうかを示す。

同じ又は別の実施形態において、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合にのみ条件付きでシグナリングされ、これは、参照画像のリサンプリングが使用される場合、仮想境界情報がＳＰＳにおいてシグナリングされない可能性があるためである。

同じ実施形態において、１に等しいｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、仮想境界の情報がＳＰＳにおいてシグナリングされることを指定する。０に等しいｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、仮想境界の情報がＳＰＳにおいてシグナリングされないことを指定する。ＳＰＳにおいてシグナリングされる１つ又は複数の仮想境界がある場合、ＳＰＳを参照する画像の仮想境界を横切るインループ・フィルタリング動作が無効にされる。インループ・フィルタリング動作は、デブロッキング・フィルタ、サンプル適応オフセット・フィルタ、及び適応ループ・フィルタ動作を含む。存在しない場合、ｓｐｓ＿ｖｉｒｔｕａｌ＿ｂｏｕｎｄａｒｉｅｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しいと推測される。

一実施形態において、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、図２４に示すように、ＳＰＳにおいてシグナリングされる。フラグｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブ画像分割情報がＳＰＳにおいてシグナリングされるかどうかを示す。

同じ又は別の実施形態において、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合にのみ条件付きでシグナリングされるが、これは、参照画像のリサンプリングが使用される場合、サブ画像の分割情報がＳＰＳにおいてシグナリングされないことがあるためである。

同じ実施形態において、１に等しいｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブ画像情報がＣＬＶＳに対して存在し、ＣＬＶＳの各画像に１つ又は複数のサブ画像が存在してもよいことを指定する。０に等しいｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇは、サブ画像情報がＣＬＶＳに対して存在せず、ＣＬＶＳの各画像にサブ画像が１つしかないことを指定する。存在しない場合、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しいと推測される。

一実施形態において、図２５に示すように、ｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇは、ＰＰＳにおいてシグナリングされてもよい。ＰＰＳのｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、ＰＰＳが参照するＳＰＳのｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値と同じであってもよい。

同じ実施形態において、画像の幅と高さの情報は、ｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値が１に等しい場合にのみＰＰＳにおいてシグナリングされてもよい。ｐｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しい場合、画像の幅と高さの値は、ＳＰＳにおいてシグナリングされた画像の最大幅と高さの値に等しいと推測される。

同じ実施形態において、ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、ルーマ・サンプルの単位でＰＰＳを参照する各復号画像の幅を指定する。ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなくてもよく、Ｍａｘ（８、ＭｉｎＣｂＳｉｚｅＹ）の整数倍であってもよく、ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ以下であってもよい。存在しない場合、ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓに等しいと推測される。ｓｐｓ＿ｒｅｆ＿ｗｒａｐａｒｏｕｎｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合、（ＣｔｂＳｉｚｅＹ／ＭｉｎＣｂＳｉｚｅＹ＋１）の値は、（ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ／ＭｉｎＣｂＳｉｚｅＹ－１）の値以下であってもよい。ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、ルーマ・サンプルの単位でＰＰＳを参照する各復号画像の高さを指定する。ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓは、０に等しくなくてもよく、Ｍａｘ（８、ＭｉｎＣｂＳｉｚｅＹ）の整数倍であってもよく、ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ以下であってもよい。存在しない場合、ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値は、ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓに等しいと推測される。

参照画像リストでは、画像に対するすべてのアクティブな参照画像は、画像自体と同じサブ画像レイアウトを有し、すべてのアクティブな参照画像は、単一のサブ画像を有するレイヤ間参照画像である。

同じ又は別の実施形態において、ＲｅｆＰｉｃＬｉｓｔ［０］又はＲｅｆＰｉｃＬｉｓｔ［１］における各アクティブなエントリによって参照される画像は、現在の画像と同じ画像サイズ及び同じサブ画像レイアウトを有する（すなわち、その画像及び現在の画像によって参照されるＳＰＳは、両端値を含む０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１までの範囲のｊの各値について、同じ値のｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１と、同じ値のｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｊ］、及びｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｊ］と、をそれぞれ有する）。ＲｅｆＰｉｃＬｉｓｔ［０］又はＲｅｆＰｉｃＬｉｓｔ［１］の各アクティブなエントリによって参照される画像は、ｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１の値が０に等しいＩＬＲＰである。

同じ又は別の実施形態において、ｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１が０よりも大きく、ｓｐｓ＿ｓｕｂｐｉｃ＿ｔｒｅａｔｅｄ＿ａｓ＿ｐｉｃ＿ｆｌａｇ［ｉ］が１に等しい場合、ＳＰＳを参照する現在のレイヤの各ＣＬＶＳについて、ｔａｒｇｅｔＡｕＳｅｔを、両端値を含めて、復号順にＣＬＶＳの最初の画像を含むＡＵから開始して、復号順にＣＬＶＳの最後の画像を含むＡＵまでのすべてのＡＵとすると、現在のレイヤと、参照レイヤとして現在のレイヤを有するすべてのレイヤとから構成されるｔａｒｇｅｔＬａｙｅｒＳｅｔについて、以下の条件がすべて真であることが、ビットストリーム適合性の要件である。
－ｔａｒｇｅｔＡｕＳｅｔの各ＡＵについて、ｔａｒｇｅｔＬａｙｅｒＳｅｔのレイヤのすべての画像が、同じ値のｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓと、同じ値のｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとを有することができる。
－ｔａｒｇｅｔＬａｙｅｒＳｅｔにおいて、現在のレイヤを参照レイヤとして有するレイヤによって参照されるすべてのＳＰＳが、同じ値のｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１を有することができ、両端値を含む０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１までの範囲のｊの各値について、同じ値のｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｊ］、及びｓｐｓ＿ｓｕｂｐｉｃ＿ｔｒｅａｔｅｄ＿ａｓ＿ｐｉｃ＿ｆｌａｇ［ｊ］を有することができる。
－ｔａｒｇｅｔＡｕＳｅｔにおける各ＡＵについて、ｔａｒｇｅｔＬａｙｅｒＳｅｔにおける現在のレイヤを参照レイヤとして有するレイヤのすべての画像が、両端値を含む０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１までの範囲のｊの各値について、同じ値のＳｕｂｐｉｃＩｄＶａｌ［ｊ］を有することができる。

同じ又は別の実施形態において、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔは、スケーリング比計算のために画像サイズに適用されるオフセットを指定する。存在しない場合、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値は、ｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔにそれぞれ等しいと推測される。

ＳｕｂＷｉｄｔｈＣ＊（Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ）＋Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ））の値は、ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ未満であってもよく、ＳｕｂＨｅｉｇｈｔＣ＊（Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ）＋Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ））の値は、ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ未満であってもよい。

変数ＣｕｒｒＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ及びＣｕｒｒＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬは、以下のように導出される。
ＣｕｒｒＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ＝ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ－
ＳｕｂＷｉｄｔｈＣ＊（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ＋ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ）
ＣｕｒｒＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬ＝ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ－
ＳｕｂＨｅｉｇｈｔＣ＊（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ＋ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ）

ｒｅｆＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ及びｒｅｆＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬを、それぞれ、このＰＰＳを参照する現在の画像の参照画像のＣｕｒｒＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ及びＣｕｒｒＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬとする。以下のすべての条件が満たされることがビットストリーム適合性の要件である。
－ｃｕｒｒＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ＊２がｒｅｆＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ以上である。
－ｃｕｒｒＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬ＊２がｒｅｆＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬ以上である。
－ｃｕｒｒＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬがｒｅｆＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ＊８以下である。
－ｃｕｒｒＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬがｒｅｆＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬ＊８以下である。
－ｃｕｒｒＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ＊ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓがｒｅｆＰｉｃＳｃａｌＷｉｎＷｉｄｔｈＬ＊（ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ－Ｍａｘ（８、ＭｉｎＣｂＳｉｚｅＹ））以上である。
－ｃｕｒｒＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬ＊ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓがｒｅｆＰｉｃＳｃａｌＷｉｎＨｅｉｇｈｔＬ＊（ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ－Ｍａｘ（８、ＭｉｎＣｂＳｉｚｅＹ））以上である。

同じ又は別の実施形態において、ＳｕｂＷｉｄｔｈＣ＊（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ＋ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ）の値は、－ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＊１５以上かつｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ未満であってもよく、ＳｕｂＨｅｉｇｈｔＣ＊（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ＋ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）の値は、－ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＊１５以上かつｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ未満であってよい。

同じ又は別の実施形態において、ＳｕｂＷｉｄｔｈＣ＊（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ＋ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ）の値は、－ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＊７以上かつｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ未満であってもよく、－ＳｕｂＨｅｉｇｈｔＣ＊（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ＋ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）の値は、－ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＊７以上かつｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ未満であってもよい。

同じ又は別の実施形態において、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しく、ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが０に等しく、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しい場合、ＳｕｂＷｉｄｔｈＣ＊（Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ）＋Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ））の値は、０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１までの範囲のｉについて、ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］＋１の最小値よりも小さくてもよく、ＳｕｂＨｅｉｇｈｔＣ＊（Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ）＋Ａｂｓ（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ））の値は、０からｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１までの範囲のｉについて、ｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｉ］＋１の最小値よりも小さくてもよい。

同じ又は別の実施形態において、現在のレイヤの値ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが１に等しい場合、ｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しくてもよい。

同じ又は別の実施形態において、現在のレイヤの値ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが１に等しい場合、現在のレイヤを参照するレイヤのｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しくてもよい。

同じ又は別の実施形態において、現在のレイヤの値ｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇが１に等しい場合、現在のレイヤ及び現在のレイヤを参照するすべてのレイヤのｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値は、０に等しくてもよい。

同じ又は別の実施形態において、現在のレイヤのｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値が１に等しくてもよい場合、現在のレイヤのｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、０に等しくてもよい。

同じ又は別の実施形態において、現在のレイヤのｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値が１に等しくてもよい場合、現在のレイヤの参照レイヤのｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、０に等しくてもよい。

同じ又は別の実施形態において、現在のレイヤのｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値が１に等しくてもよい場合、現在のレイヤ及び現在のレイヤのすべての参照レイヤのｓｐｓ＿ｒｅｓ＿ｃｈａｎｇｅ＿ｉｎ＿ｃｌｖｓ＿ａｌｌｏｗｅｄ＿ｆｌａｇの値は、０に等しくてもよい。

同じ又は別の実施形態において、現在のレイヤのｓｐｓ＿ｓｕｂｐｉｃ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇの値が１に等しくてもよく、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値が１に等しくてもよい場合、現在のレイヤの参照レイヤのｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は、１に等しくてもよい。

一実施形態において、レイヤｋ内の符号化画像は、図２６に示すように、１つ又は複数のサブ画像に分割されてもよく、同じレイヤ内の１つ又は複数の参照画像を参照することができ、レイヤｋの参照レイヤ内の１つ又は複数の参照画像を参照することができる。図２６の例では、ｓｐｓ＿ｒｅｆ＿ｐｉｃ＿ｒｅｓａｍｐｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇ（図２４の）の値が１に等しい場合、画像サイズが同じであっても、現在の画像と各参照画像は、異なるスケーリング・ウィンドウを有することができる。

同じ又は別の実施形態において、サブ画像が抽出されるとき、参照画像リサンプリングのためのスケーリング比計算に使用されるスケーリング・ウィンドウのサイズ及びそのオフセット値は、サブ画像のサイズ及び位置に従って更新されてもよい。現在の画像のスケーリング・ウィンドウのサイズ及びそのオフセット値が更新されると、現在の画像の１つ又は複数の参照画像のスケーリング・ウィンドウのサイズ及びそのオフセット値がそれに応じて更新されてもよい。図２７は、同じレイヤ内の参照画像及び異なるレイヤ内のレイヤ間参照画像のスケーリング・ウィンドウの更新の例を示す。

同じ又は別の実施形態において、レイヤｋ内の画像が同じ分割レイアウトで１つ又は複数のサブ画像に分割される場合、レイヤｋが参照レイヤとして参照する別のレイヤ内の画像は、複数のサブ画像に分割されなくてもよい。

同じ又は別の実施形態において、スケーリング・ウィンドウのサイズ及びオフセット値が図２７の例で更新される場合、スケーリング・ウィンドウのサイズは、元の画像サイズと抽出されたサブ画像サイズとの間のスケーリング比に関連して再スケーリングされてもよい。スケーリング・ウィンドウのサイズが更新されると、元の画像サイズ及びサブ画像サイズに応じて、更新されたスケーリング・ウィンドウのサイズは、図２５に示すように、ＰＰＳにおいてシグナリングされるスケーリング・ウィンドウオフセット値（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ，ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ，ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ，ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）で表すことができない小数の画素値を有する場合がある。また、本手法では、参照画像のすべてのスケーリング・オフセット値が更新される可能性がある。これは、かなり大きな負担である。

同じ又は別の実施形態において、図２８に示すように、サブ画像が抽出されるときに、現在の画像と参照画像との間で同じスケーリング比をシグナリングするために、スケーリング・ウィンドウのサイズは、抽出前の元のスケーリング・ウィンドウと比較して変更されないことがあるが、スケーリング・ウィンドウの位置のみが、ＰＰＳにおいてシグナリングされるスケーリング・ウィンドウのオフセット値（ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ）の値を更新することによってシフトされる。

同じ実施形態において、元の画像のスケーリング・ウィンドウのオフセット値が、元の画像のｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値にそれぞれ等しいｏｒｇＳｃａｌｉｎｇＷｉｎＬｅｆｔ、ｏｒｇＳｃａｌｉｎｇＷｉｎＲｉｇｈｔ、ｏｒｇＳｃａｌｉｎｇＷｉｎＴｏｐ、ｏｒｇＳｃａｌｉｎｇＷｉｎＢｏｔｔｏｍである場合、抽出されたサブ画像の位置及びサイズは、ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ、ＳｕｂｐｉｃＲｉｇｈｔＢｏｕｎｄａｒｙＰｏｓ、ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ、ＳｕｂｐｉｃＢｏｔＢｏｕｎｄａｒｙＰｏｓで表され、ここで、これらの値は以下のように導出される。
ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ＝ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］＊ＣｔｂＳｉｚｅＹ
ＳｕｂｐｉｃＲｉｇｈｔＢｏｕｎｄａｒｙＰｏｓ＝Ｍｉｎ（ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ－１，
（ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］＋
ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］＋１）＊ＣｔｂＳｉｚｅＹ－１）
ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ＝ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］＊ＣｔｂＳｉｚｅＹ
ＳｕｂｐｉｃＢｏｔＢｏｕｎｄａｒｙＰｏｓ＝Ｍｉｎ（ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ－１
（ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］＋
ｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ＣｕｒｒＳｕｂｐｉｃＩｄｘ］＋１）＊ＣｔｂＳｉｚｅＹ－１）

抽出されたサブ画像のｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値は、以下のように導出される。
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＬｅｆｔ－（ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）；
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＲｉｇｈｔ－（ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）；
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＴｏｐ－（ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）；
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＢｏｔｔｏｍ－（ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）．

同じ又は別の実施形態において、サブ画像サブビットストリーム抽出プロセスは以下の通りである。このプロセスへの入力は、ビットストリームｉｎＢｉｔｓｔｒｅａｍ、ターゲットＯＬＳインデックスｔａｒｇｅｔＯｌｓＩｄｘ、ターゲット最高ＴｅｍｐｏｒａｌＩｄ値ｔＩｄＴａｒｇｅｔ、及び各レイヤのターゲット・サブ画像インデックス値の配列ｓｕｂｐｉｃＩｄｘＴａｒｇｅｔ［］である。このプロセスの出力は、サブビットストリームｏｕｔＢｉｔｓｔｒｅａｍである。

入力ビットストリームに対するビットストリーム適合性の要件は、以下のすべての条件を満たす出力サブビットストリームが適合ビットストリームであることである。出力サブビットストリームは、ビットストリーム、ＶＰＳによって指定されたＯＬＳのリストへのインデックスに等しいｔａｒｇｅｔＯｌｓＩｄｘ、及びＯＬＳに存在するサブ画像インデックスに等しいｓｕｂｐｉｃＩｄｘＴａｒｇｅｔ［］を入力として用いる、本節で指定されたプロセスの出力である。出力サブビットストリームは、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＬａｙｅｒＩｄＩｎＯｌｓ［ｔａｒｇｅｔＯｌｓＩｄｘ］のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値のそれぞれに等しい少なくとも１つのＶＣＬＮＡＬユニットを含む。出力サブビットストリームは、ＴｅｍｐｏｒａｌＩｄがｔＩｄＴａｒｇｅｔに等しいＶＣＬＮＡＬユニットを少なくとも１つ含む。適合ビットストリームは、ＴｅｍｐｏｒａｌＩｄが０に等しい１つ又は複数の符号化スライスＮＡＬユニットを含むが、ｎｕｈ＿ｌａｙｅｒ＿ｉｄが０に等しい符号化スライスＮＡＬユニットを含む必要はない。出力サブビットストリームは、両端値を含む０からＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｔａｒｇｅｔＯｌｓＩｄｘ］－１までの範囲の各ｉについて、ｎｕｈ＿ｌａｙｅｒ＿ｉｄがＬａｙｅｒＩｄＩｎＯｌｓ［ｔａｒｇｅｔＯｌｓＩｄｘ］［ｉ］に等しく、ｓｈ＿ｓｕｂｐｉｃ＿ｉｄがＳｕｂｐｉｃＩｄＶａｌ［ｓｕｂｐｉｃＩｄｘＴａｒｇｅｔ［ｉ］］の値に等しい少なくとも１つのＶＣＬＮＡＬユニットを含む。

出力サブビットストリームｏｕｔＢｉｔｓｔｒｅａｍは、以下のように導出される。サブビットストリーム抽出プロセスは、ｉｎＢｉｔｓｔｒｅａｍ、ｔａｒｇｅｔＯｌｓＩｄｘ、及びｔＩｄＴａｒｇｅｔを入力として呼び出され、プロセスの出力は、ｏｕｔＢｉｔｓｔｒｅａｍに割り当てられる。サブビットストリームｏｕｔＢｉｔｓｔｒｅａｍの置換パラメータ・セットを提供するために、本明細書で指定されていないなんらかの外部手段が利用可能である場合、すべてのパラメータ・セットを置換パラメータ・セットに置換する。

そうではなく、サブ画像レベルの情報ＳＥＩメッセージがｉｎＢｉｔｓｔｒｅａｍに存在する場合、以下が適用される。変数ｓｕｂｐｉｃＩｄｘは、ｓｕｂｐｉｃＩｄｘＴａｒｇｅｔ［［ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｔａｒｇｅｔＯｌｓＩｄｘ］－１］］の値に等しく設定される。参照されるすべてのＶＰＳＮＡＬユニットのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造のリストのｖｐｓ＿ｏｌｓ＿ｐｔｌ＿ｉｄｘ［ｔａｒｇｅｔＯｌｓＩｄｘ］番目のエントリのｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃの値を、ｓｕｂｐｉｃＩｄｘに等しいサブ画像インデックスを有するサブ画像で構成されるサブ画像のセットに対して、ＳｕｂｐｉｃＬｅｖｅｌＩｄｃに等しくなるように書き換える。ＶＣＬＨＲＤパラメータ又はＮＡＬＨＲＤパラメータが存在する場合、参照されるすべてのＶＰＳＮＡＬユニットにおけるｖｐｓ＿ｏｌｓ＿ｈｒｄ＿ｉｄｘ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｔａｒｇｅｔＯｌｓＩｄｘ］］番目のｏｌｓ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造と、ｉ番目のレイヤによって参照されるすべてのＳＰＳＮＡＬユニットにおけるｏｌｓ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造とにおいて、ｊ番目のＣＰＢのｃｐｂ＿ｓｉｚｅ＿ｖａｌｕｅ＿ｍｉｎｕｓ１［ｔＩｄＴａｒｇｅｔ］［ｊ］及びｂｉｔ＿ｒａｔｅ＿ｖａｌｕｅ＿ｍｉｎｕｓ１［ｔＩｄＴａｒｇｅｔ］［ｊ］のそれぞれの値を、それらがＳｕｂｐｉｃＣｐｂＳｉｚｅＶｃｌ［ＳｕｂｐｉｃＳｅｔＬｅｖｅｌＩｄｘ］［ｓｕｂｐｉｃＩｄｘ］及びＳｕｂｐｉｃＣｐｂＳｉｚｅＮａｌ［ＳｕｂｐｉｃＳｅｔＬｅｖｅｌＩｄｘ］［ｓｕｂｐｉｃＩｄｘ］に対応するように書き換える

サブ画像インデックスがｓｕｂｐｉｃＩｄｘに等しいサブ画像に対するＳｕｂｐｉｃＢｉｔｒａｔｅＶｃｌ［ＳｕｂｐｉｃＳｅｔＬｅｖｅｌＩｄｘ］［ｓｕｂｐｉｃＩｄｘ］及びＳｕｂｐｉｃＢｉｔｒａｔｅＮａｌ［ＳｕｂｐｉｃＳｅｔＬｅｖｅｌＩｄｘ］［ｓｕｂｐｉｃＩｄｘ］、ｊは、両端値を含む０からｈｒｄ＿ｃｐｂ＿ｃｎｔ＿ｍｉｎｕｓ１までの範囲、ｉは、両端値を含む０からＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｔａｒｇｅｔＯｌｓＩｄｘ］－１までの範囲にある。

ｉが０からＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｔａｒｇｅｔＯｌｓＩｄｘ］－１までの範囲にあるｉ番目のレイヤには、以下が適用される。変数ｓｕｂｐｉｃＩｄｘは、ｓｕｂｐｉｃＩｄｘＴａｒｇｅｔ［ｉ］の値に等しく設定される。ｓｐｓ＿ｐｔｌ＿ｄｐｂ＿ｈｒｄ＿ｐａｒａｍｓ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しいすべての参照ＳＰＳＮＡＬユニットのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）シンタックス構造のｇｅｎｅｒａｌ＿ｌｅｖｅｌ＿ｉｄｃの値を、ｓｕｂｐｉｃＩｄｘに等しいサブ画像インデックスを有するサブ画像から構成されるサブ画像のセットについてＳｕｂｐｉｃＬｅｖｅｌＩｄｃに等しくなるように書き換える。

変数ｓｕｂｐｉｃＷｉｄｔｈＩｎＬｕｍａＳａｍｐｌｅｓ及びｓｕｂｐｉｃＨｅｉｇｈｔＩｎＬｕｍａＳａｍｐｌｅｓは、以下のように導出される。
ｓｕｂｐｉｃＷｉｄｔｈＩｎＬｕｍａＳａｍｐｌｅｓ＝ｍｉｎ（（ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｓｕｂｐｉｃＩｄｘ］＋
ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｓｕｂｐｉｃＩｄｘ］＋１）＊ＣｔｂＳｉｚｅＹ，ｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）－
ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｓｕｂｐｉｃＩｄｘ］＊ＣｔｂＳｉｚｅＹ
ｓｕｂｐｉｃＨｅｉｇｈｔＩｎＬｕｍａＳａｍｐｌｅｓ＝ｍｉｎ（（ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｓｕｂｐｉｃＩｄｘ］＋
ｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｓｕｂｐｉｃＩｄｘ］＋１）＊ＣｔｂＳｉｚｅＹ，ｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ）－
ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｓｕｂｐｉｃＩｄｘ］＊ＣｔｂＳｉｚｅＹ

参照されるすべてのＳＰＳＮＡＬユニットのｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値、及び参照されるすべてのＰＰＳＮＡＬユニットのｐｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓとｐｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの値を、それぞれ、ｓｕｂｐｉｃＷｉｄｔｈＩｎＬｕｍａＳａｍｐｌｅとｓｕｂｐｉｃＨｅｉｇｈｔＩｎＬｕｍａＳａｍｐｌｅｓに等しくなるように書き換える。参照されるすべてのＳＰＳＮＡＬユニットのｓｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１の値、及び参照されるすべてのＰＰＳＮＡＬユニットのｐｐｓ＿ｎｕｍ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１の値を０に書き換える。参照されるすべてのＳＰＳＮＡＬユニットにおいて、シンタックス要素ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｓｕｂｐｉｃＩｄｘ］及びｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｓｕｂｐｉｃＩｄｘ］が存在する場合は、それらを０に書き換える。参照されるすべてのＳＰＳＮＡＬユニットにおいて、ｓｕｂｐｉｃＩｄｘに等しくない各ｊについて、シンタックス要素ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｊ］、ｓｐｓ＿ｓｕｂｐｉｃ＿ｔｒｅａｔｅｄ＿ａｓ＿ｐｉｃ＿ｆｌａｇ［ｊ］、ｓｐｓ＿ｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｓｕｂｐｉｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｊ］、及びｓｐｓ＿ｓｕｂｐｉｃ＿ｉｄ［ｊ］を削除する。タイルとスライスのシグナリングのための、参照されるすべてのＰＰＳのシンタックス要素を書き換え、サブ画像インデックスがｓｕｂｐｉｃＩｄｘに等しいサブ画像に関連付けられていないすべてのタイル行、タイル列、及びスライスを削除する。

変数ｓｕｂｐｉｃＣｏｎｆＷｉｎＬｅｆｔＯｆｆｓｅｔ、ｓｕｂｐｉｃＣｏｎｆＷｉｎＲｉｇｈｔＯｆｆｓｅｔ、ｓｕｂｐｉｃＣｏｎｆＷｉｎＴｏｐＯｆｆｓｅｔ、及びｓｕｂｐｉｃＣｏｎｆＷｉｎＢｏｔｔｏｍＯｆｆｓｅｔは、以下のように導出される。
ｓｕｂｐｉｃＣｏｎｆＷｉｎＬｅｆｔＯｆｆｓｅｔ＝ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｓｕｂｐｉｃＩｄｘ］＝＝０
ｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ：０
ｓｕｂｐｉｃＣｏｎｆＷｉｎＲｉｇｈｔＯｆｆｓｅｔ＝（ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｘ［ｓｕｂｐｉｃＩｄｘ］＋
ｓｐｓ＿ｓｕｂｐｉｃ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｓｕｂｐｉｃＩｄｘ］＋１）＊ＣｔｂＳｉｚｅＹ＞＝
ｓｐｓ＿ｐｉｃ＿ｗｉｄｔｈ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ：０
ｓｕｂｐｉｃＣｏｎｆＷｉｎＴｏｐＯｆｆｓｅｔ＝ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｓｕｂｐｉｃＩｄｘ］＝＝０
ｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ：０
ｓｕｂｐｉｃＣｏｎｆＷｉｎＢｏｔｔｏｍＯｆｆｓｅｔ＝（ｓｐｓ＿ｓｕｂｐｉｃ＿ｃｔｕ＿ｔｏｐ＿ｌｅｆｔ＿ｙ［ｓｕｂｐｉｃＩｄｘ］＋
ｓｐｓ＿ｓｕｂｐｉｃ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｓｕｂｐｉｃＩｄｘ］＋１）＊ＣｔｂＳｉｚｅＹ＞＝
ｓｐｓ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｍａｘ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ：０

参照されるすべてのＳＰＳＮＡＬユニットのｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｓｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値と、参照されるすべてのＰＰＳＮＡＬユニットのｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｃｏｎｆ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値とを、それぞれ、ｓｕｂｐｉｃＣｏｎｆＷｉｎＬｅｆｔＯｆｆｓｅｔ、ｓｕｂｐｉｃＣｏｎｆＷｉｎＲｉｇｈｔＯｆｆｓｅｔ、ｓｕｂｐｉｃＣｏｎｆＷｉｎＴｏｐＯｆｆｓｅｔ、及びｓｕｂｐｉｃＣｏｎｆＷｉｎＢｏｔｔｏｍＯｆｆｓｅｔに等しくなるように書き換える。ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値を以下のように書き換える。
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＬｅｆｔ－（ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＲｉｇｈｔ－（ＳｕｂｐｉｃＬｅｆｔＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＴｏｐ－（ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）
ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ＝ｏｒｇＳｃａｌｉｎｇＷｉｎＢｏｔｔｏｍ－（ＳｕｂｐｉｃＴｏｐＢｏｕｎｄａｒｙＰｏｓ／ＳｕｂＷｉｄｔｈＣ）、
ここで、ｏｒｇＳｃａｌｉｎｇＷｉｎＬｅｆｔ、ｏｒｇＳｃａｌｉｎｇＷｉｎＲｉｇｈｔ、ｏｒｇＳｃａｌｉｎｇＷｉｎＴｏｐ、及びｏｒｇＳｃａｌｉｎｇＷｉｎＢｏｔｔｏｍは、元の符号化画像のｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｌｅｆｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ、ｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｔｏｐ＿ｏｆｆｓｅｔ、及びｐｐｓ＿ｓｃａｌｉｎｇ＿ｗｉｎ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔの値に等しい。ｎｕｈ＿ｌａｙｅｒ＿ｉｄがｉ番目のレイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく、ｓｈ＿ｓｕｂｐｉｃ＿ｉｄがＳｕｂｐｉｃＩｄＶａｌ［ｓｕｂｐｉｃＩｄｘ］に等しくないすべてのＶＣＬＮＡＬユニットをｏｕｔＢｉｔｓｔｒｅａｍから削除する。

ｓｌｉ＿ｃｂｒ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇが１に等しい場合、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＦＤ＿ＮＵＴに等しいすべてのＮＡＬユニットと、ｓｕｂｐｉｃＩｄＴａｒｇｅｔ［］内のサブ画像のＶＣＬＮＡＬユニットに関連付けられていないフィラー・ペイロードＳＥＩメッセージとを削除し、参照されるすべてのＶＰＳＮＡＬユニット及びＳＰＳＮＡＬユニットのｖｐｓ＿ｏｌｓ＿ｈｒｄ＿ｉｄｘ［ＭｕｌｔｉＬａｙｅｒＯｌｓＩｄｘ［ｔａｒｇｅｔＯｌｓＩｄｘ］］番目のｏｌｓ＿ｈｒｄ＿ｐａｒａｍｅｔｅｒｓ（）シンタックス構造において、ｊ番目のＣＰＢのｃｂｒ＿ｆｌａｇ［ｔＩｄＴａｒｇｅｔ］［ｊ］を１に設定し、ｊは０からｈｒｄ＿ｃｐｂ＿ｃｎｔ＿ｍｉｎｕｓ１までの範囲にある。そうではない場合（ｓｌｉ＿ｃｂｒ＿ｃｏｎｓｔｒａｉｎｔ＿ｆｌａｇが０に等しい）、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＦＤ＿ＮＵＴに等しいすべてのＮＡＬユニットと、フィラー・ペイロードＳＥＩメッセージとを削除し、ｃｂｒ＿ｆｌａｇ［ｔＩｄＴａｒｇｅｔ］［ｊ］を０に設定する。

ｏｕｔＢｉｔｓｔｒｅａｍが、ｏｕｔＢｉｔｓｔｒｅａｍに適用可能な、ｓｎ＿ｏｌｓ＿ｆｌａｇが１に等しく、ｓｎ＿ｓｕｂｐｉｃ＿ｆｌａｇが１に等しいスケーラブルなネスティングＳＥＩメッセージを含むＳＥＩＮＡＬユニットを含む場合、ｐａｙｌｏａｄＴｙｐｅが１（ＰＴ）、１３０（ＤＵＩ）、又は１３２（復号された画像ハッシュ）に等しい適切な非スケーラブルなネスティングＳＥＩメッセージをスケーラブルなネスティングＳＥＩメッセージから抽出し、抽出されたＳＥＩメッセージをｏｕｔＢｉｔｓｔｒｅａｍに配置する。

一部の実施形態は、任意の可能な技術的詳細レベルの統合におけるシステム、方法、及び／又はコンピュータ可読媒体に関してもよい。コンピュータ可読媒体は、プロセッサに動作を実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読非一過性記憶媒体を含むことができる。

コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持及び記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光記憶デバイス、電磁記憶デバイス、半導体記憶デバイス、又は前述のものの任意の適切な組合せであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラム可能読み取りメモリ（ＥＰＲＯＭ又はフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリ・スティック、フロッピー・ディスク、パンチ・カード又は命令が記録された溝内の隆起構造などの機械的に符号化されたデバイス、及び前述したものの任意の適切な組合せが含まれる。本明細書で使用されるようなコンピュータ可読記憶媒体は、電波又は他の自由に伝播する電磁波、導波路若しくは他の伝送媒体を通して伝播する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、又はワイヤを通して伝送される電気信号などの、それ自体が一過性の信号であると解釈されるべきではない。

本明細書に記載されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスに、或はネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク及び／又はワイヤレス・ネットワークを介して外部コンピュータ若しくは外部記憶デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ及び／又はエッジ・サーバを含むことができる。各コンピューティング／処理デバイスのネットワーク・アダプタ・カード又はネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体に記憶するためにコンピュータ可読プログラム命令を転送する。

動作を実行するためのコンピュータ可読プログラムコード／命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路の構成データ、又は、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語、及び「Ｃ」プログラミング言語などの手続き型プログラミング言語若しくは同様のプログラミング言語を含む、１つ又は複数のプログラミング言語の任意の組合せで記述されたソース・コード或はオブジェクト・コードのいずれかであってもよい。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で、部分的にユーザのコンピュータ上で、独立型のソフトウェアパッケージとして、部分的にユーザのコンピュータ及び部分的に遠隔コンピュータ上で、或は完全に遠隔コンピュータ又はサーバ上で実行することができる。後者のシナリオでは、遠隔コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）又はワイド・エリア・ネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、又は外部コンピュータに（例えばインターネット・サービス・プロバイダを使用してインターネットを介して）接続されてもよい。一部の実施形態において、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、又はプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路は、態様又は動作を実行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路を個人専用にすることによってコンピュータ可読プログラム命令を実行することができる。

これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサに提供され、コンピュータ又は他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、流れ図及び／又はブロック図のブロックにおいて指定された機能／行為を実施するための手段を作成するように機械を生成することができる。これらのコンピュータ可読プログラム命令は、内部に命令が記憶されたコンピュータ可読記憶媒体が、流れ図及び／又はブロック図のブロックにおいて指定された機能／行為の態様を実施する命令を含む製造品を含むように、コンピュータ、プログラム可能なデータ処理装置及び／又は他のデバイスを特定のやり方で機能させるように指示することができるコンピュータ可読記憶媒体に記憶することもできる。

コンピュータ可読ログラム命令は、コンピュータ、他のプログラム可能なデータ処理装置、又は他のデバイスにロードされて、コンピュータ、他のプログラム可能な装置、又は他のデバイス上で実行される命令が、流れ図及び／又はブロック図のブロックにおいて指定された機能／行為を実施するように、一連の動作ステップをコンピュータ、他のプログラム可能な装置、又は他のデバイス上で実行させて、コンピュータ実装プロセスを生成することもできる。

図中の流れ図及びブロック図は、様々な実施形態によるシステム、方法、及びコンピュータ可読媒体の可能な実施態様のアーキテクチャ、機能、及び動作を示す。これに関連して、流れ図又はブロック図の各ブロックは、指定されたロジック機能を実装するための１つ又は複数の実行可能な命令を構成するモジュール、セグメント、又は命令の一部を表すことができる。本方法、コンピュータ・システム、及びコンピュータ可読媒体は、追加のブロック、より少ないブロック、異なるブロック、又は図に描かれているものとは異なる配置のブロックを含むことができる。一部の代替の実施態様では、ブロックに示された機能は、図に示された順序とは異なって行われてもよい。例えば、連続して示されている２つのブロックは、実際には、同時に、又は実質的に同時に実行されてもよく、或は、ブロックは、関与する機能に応じて、時には逆の順序で実行されてもよい。ブロック図及び／又は流れ図の各ブロック、並びにブロック図及び／又は流れ図のブロックの組合せは、指定された機能若しくは行為を実行する、又は専用のハードウェア及びコンピュータ命令の組合せを実行する専用のハードウェア・ベースのシステムによって実施することができることにも留意されたい。

本明細書に記載のシステム及び／又は方法は、異なる形態のハードウェア、ファームウェア、又はハードウェアとソフトウェアの組合せで実装され得ることは明らかであろう。これらのシステム及び／また方法を実装するために使用される実際の専用の制御ハードウェア又はソフトウェア・コードは、実装を限定するものではない。したがって、システム及び／又は方法の動作並びに挙動は、特定のソフトウェア・コードを参照せずに本明細書で説明されたが、ソフトウェア及びハードウェアは、本明細書の説明に基づいてシステム及び／又は方法を実装するように設計され得ることを理解されたい。

本書で使用されるいかなる要素、行為、又は命令も、明示的に説明されていない限り、重要又は必須であると解釈されるべきではない。また、本明細書で使用される場合、冠詞「ａ」及び「ａｎ」は、１つ又は複数の項目を含むことが意図されており、「１つ又は複数」と交換可能に使用されることがある。さらに、本明細書で使用される場合、「セット」という用語は、１つ又は複数のアイテム（例えば、関連アイテム、非関連アイテム、関連アイテムと非関連アイテムの組合せなど）を含むことが意図されており、「１つ又は複数」と交換可能に使用されることがある。１つのアイテムのみが意図されている場合、「ｏｎｅ」という用語又は同様の言語が使用される。また、本明細書で使用される場合、「有する（ｈａｓ）」、「有する（ｈａｖｅ）」、「有している（ｈａｖｉｎｇ）」などの用語は、オープンエンドの用語であることが意図されている。さらに、「に基づく」という語句は、特に明記しない限り、「に少なくとも部分的に基づく」を意味することが意図されている。

様々な態様及び実施形態の説明は、例示の目的で提示されているが、網羅的であること、又は開示された実施形態に限定されることは意図されていない。機能の組合せが特許請求の範囲に記載されている、及び／又は明細書に開示されているとしても、これらの組合せは、可能な実施の開示を制限することを意図するものではない。実際、これらの特徴の多くは、特許請求の範囲に具体的に記載されていない仕方、及び／又は明細書に開示されていない仕方で組み合わせることができる。以下に列挙される各従属請求項は、１つの請求項のみに直接的に依存してもよいが、可能な実施態様の開示は、請求項セットにおける他のすべての請求項と組み合わせた各従属請求項を含む。記載された実施形態の範囲から逸脱することなく、多くの修正形態及び変形形態が当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の適用、又は市場で見出される技術に対する技術的改良を最も良く説明するために、或は当業者が本明細書に開示された実施形態を理解することができるように選択された。

１００通信システム
１１０端末
１２０端末
１３０端末
１４０端末
１５０通信ネットワーク
２０１ビデオ・ソース、カメラ
２０２データ・ストリーム
２０３エンコーダ
２０４ビデオ・ビットストリーム
２０５ストリーミング・サーバ
２０６ストリーミングクライアント
２０７ビデオ・ビットストリームのコピー
２０８ストリーミングクライアント
２０９ビデオ・ビットストリームのコピー
２１０デコーダ
２１１ビデオサンプルストリーム
２１２ディスプレイ、レンダリング・デバイス
２１３キャプチャサブシステム
３１０レシーバ
３１２チャネル
３１５バッファメモリ
３２０パーサ、ビデオ・デコーダ
３２１シンボル
３５１スケーラ／逆変換ユニット
３５２画像間予測ユニット、イントラ予測ユニット
３５３動き補償予測ユニット
３５５アグリゲータ
３５６現在の画像又はループ・フィルタユニット
３５７参照画像メモリ、参照画像バッファ
４３０エンコーダ
４３２符号化エンジン
４３３ローカルデコーダ
４３４参照画像メモリ
４３５予測器
４４０トランスミッタ
４４３ビデオ・シーケンス
４４５エントロピー・コーダ
４５０コントローラ
４６０通信チャネル
５０１画像ヘッダ
５０２ＡＲＣ情報
５０４画像パラメータ・セット
５０５ＡＲＣ参照情報
５０６テーブル
５０７シーケンス・パラメータ・セット
５０８タイル・グループ・ヘッダ
５０９ＡＲＣ情報
５１１パラメータ・セット
５１２ＡＲＣ情報
５１３ＡＲＣ参照情報、テーブル
５１４タイル・グループ・ヘッダ
５１５ＡＲＣ情報
５１６ＡＲＣ情報テーブル、セット
６０１タイル・グループ・ヘッダ
６０２シンタックス要素
６０３シンタックス要素
６１０シーケンス・パラメータ・セット
６１１シンタックス要素
６１２パラメータ・セット
６１３シンタックス要素
６１４シンタックス要素
６１５参照画像次元
６１６シンタックス要素
６１７シンタックス要素
７００コンピュータ・システム
７０１キーボード
７０２マウス
７０３トラックパッド
７０４データ・グローブ
７０５ジョイスティック
７０６マイクロフォン
７０７スキャナ
７０８カメラ
７０９スピーカ
７１０スクリーン
７２０ＣＤ／ＤＶＤＲＯＭ／ＲＷ
７２１媒体
７２２サム・ドライブ
７２３ソリッド・ステート・ドライブ
７４０コア
７４３ＦＰＧＡ
７４１ＣＰＵ
７４２ＧＰＵ
７４３ＦＰＧＡ
７４４アクセラレータ
７４５ＲＯＭ
７４６ＲＡＭ
７４７内部大容量記憶装置
７４８システム・バス
７４９周辺バス

Claims

プロセッサが実行するビデオ符号化の方法であって、
１つ又は複数のサブ画像を有するビデオ・データを受信するステップと、
前記サブ画像に対応するリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに関連付けられたサブビットストリームを前記ビデオ・データに関連付けられたターゲット出力レイヤ・セット・インデックス、ターゲット最高時間識別値、及びターゲット・サブ画像インデックス値の配列に基づいて、前記ビデオ・データに関連付けられたビットストリームから抽出するステップと、
前記抽出されたサブビットストリームのリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて前記ビデオ・データを復号するステップと、
前記抽出されたサブビットストリームのリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて前記ビデオ・データをスケーリングするステップと、
を含み、
抽出された前記サブ画像の、高レベルのシンタックス構造においてシグナリングされるスケーリング・ウィンドウの左及び右のオフセット値を、抽出された前記サブ画像の左の境界位置に基づいて更新し、前記高レベルのシンタックス構造においてシグナリングされる前記スケーリング・ウィンドウの上および下のオフセット値を、抽出された前記サブ画像の上の境界位置に基づいて更新し、前記更新されたオフセット値に基づいて前記スケーリング・ウィンドウの位置をシフトする、方法。
前記リサンプリング・パラメータに基づいて、前記受信されたビデオ・データの適応解像度変更を可能にするステップをさらに含む、請求項１に記載の方法。
前記リサンプリング・パラメータが、前記ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する、請求項１に記載の方法。
空間スケーラビリティ・パラメータが、前記ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する、請求項１に記載の方法。
復号中の前記ビデオ・データのリサンプリングが、前記リサンプリング・パラメータに基づいて無効にされる、請求項１に記載の方法。
ビデオ符号化のためのコンピュータ・システムであって、
コンピュータ・プログラム・コードを記憶するように構成された１つ又は複数のコンピュータ可読非一過性記憶媒体と、
前記コンピュータ・プログラム・コードにアクセスし、前記コンピュータ・プログラム・コードによって命令されたとおりに動作するように構成された１つ又は複数のコンピュータ・プロセッサと、を備える、コンピュータ・システムであり、前記コンピュータ・プログラム・コードが、
前記１つ又は複数のコンピュータ・プロセッサに、１つ又は複数のサブ画像を有するビデオ・データを受信させるように構成された受信コードと、
前記１つ又は複数のコンピュータ・プロセッサに、前記サブ画像に対応するリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに関連付けられたサブビットストリームを前記ビデオ・データに関連付けられたターゲット出力レイヤ・セット・インデックス、ターゲット最高時間識別値、及びターゲット・サブ画像インデックス値の配列に基づいて、前記ビデオ・データに関連付けられたビットストリームから抽出させるように構成された抽出コードと、
前記１つ又は複数のコンピュータ・プロセッサに、前記抽出されたサブビットストリームのリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて、前記１つ又は複数のコンピュータ・プロセッサに、前記ビデオ・データを復号させるように構成された復号コードと、
前記１つ又は複数のコンピュータ・プロセッサに、前記抽出されたサブビットストリームのリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて前記ビデオ・データをスケーリングさせるように構成されたスケーリング・コードと、
を含み、
抽出された前記サブ画像の、高レベルのシンタックス構造においてシグナリングされるスケーリング・ウィンドウの左及び右のオフセット値を、抽出された前記サブ画像の左の境界位置に基づいて更新し、前記高レベルのシンタックス構造においてシグナリングされる前記スケーリング・ウィンドウの上および下のオフセット値を、抽出された前記サブ画像の上の境界位置に基づいて更新し、前記更新されたオフセット値に基づいて前記スケーリング・ウィンドウの位置をシフトする、
コンピュータ・システム。
前記１つ又は複数のコンピュータ・プロセッサに、前記リサンプリング・パラメータに基づいて前記受信されたビデオ・データの適応解像度変更を可能にするように構成された有効化コードをさらに備える、請求項６に記載のコンピュータ・システム。
前記リサンプリング・パラメータが、前記ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する、請求項６に記載のコンピュータ・システム。
空間スケーラビリティ・パラメータが、前記ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する、請求項６に記載のコンピュータ・システム。
復号中の前記ビデオ・データのリサンプリングが、前記リサンプリング・パラメータに基づいて無効にされる、請求項６に記載のコンピュータ・システム。
ビデオ符号化のためのコンピュータ・プログラムであって、前記コンピュータ・プログラムが１つ又は複数のコンピュータ・プロセッサに、
１つ又は複数のサブ画像を含むビデオ・データを受信させ、
前記サブ画像に対応するリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに関連付けられたサブビットストリームを前記ビデオ・データに関連付けられたターゲット出力レイヤ・セット・インデックス、ターゲット最高時間識別値、及びターゲット・サブ画像インデックス値の配列に基づいて、前記ビデオ・データに関連付けられたビットストリームから抽出させ、
前記抽出されたサブビットストリームのリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて前記ビデオ・データを復号させ、
前記抽出されたサブビットストリームのリサンプリング・パラメータ及び空間スケーラビリティ・パラメータに基づいて前記ビデオ・データをスケーリングさせ、
抽出された前記サブ画像の、高レベルのシンタックス構造においてシグナリングされるスケーリング・ウィンドウの左及び右のオフセット値を、抽出された前記サブ画像の左の境界位置に基づいて更新し、前記高レベルのシンタックス構造においてシグナリングされる前記スケーリング・ウィンドウの上および下のオフセット値を、抽出された前記サブ画像の上の境界位置に基づいて更新し、前記更新されたオフセット値に基づいて前記スケーリング・ウィンドウの位置をシフトする、
ように構成されている、コンピュータ・プログラム。
前記コンピュータ・プログラムが前記１つ又は複数のコンピュータ・プロセッサに、前記リサンプリング・パラメータに基づいて前記受信されたビデオ・データの適応解像度変更を可能にするようにさらに構成されている、請求項１１に記載のコンピュータ・プログラム。
前記リサンプリング・パラメータが、前記ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する、請求項１１に記載のコンピュータ・プログラム。
空間スケーラビリティ・パラメータが、前記ビデオ・データに関連付けられたパラメータ・セットにおいてシグナリングされる１つ又は複数のフラグに対応する、請求項１１に記載のコンピュータ・プログラム。