JP2022526439A

JP2022526439A - 複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームをデコードする方法、システム、及びコンピュータプログラム

Info

Publication number: JP2022526439A
Application number: JP2021560267A
Authority: JP
Inventors: チョイ，ビョンドゥ; リィウ，シャン; ウェンジャー，ステファン
Original assignee: テンセント・アメリカ・エルエルシー
Priority date: 2020-01-27
Filing date: 2020-10-15
Publication date: 2022-05-24
Also published as: CN113994664A; US11272214B2; EP4097972A4; AU2020426060B2; US12069313B2; AU2023202725A1; US11729429B2; US20240364933A1; AU2024287218A1; US20210235123A1; WO2021154348A1; AU2023202725B2; KR20210137203A; SG11202111958UA; AU2020426060A1; EP4097972A1; US20220159305A1; CA3138519A1; US20230319313A1

Abstract

コーディング及び復号化のためのシステム及び方法が提供される。方法は、複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームを受け取るステップと、コーディングされたビデオストリームのビデオデータをデコードするステップと、出力レイヤセットシグナリングのモードを示すシンタックス要素に基づいて、コーディングされたビデオストリームの第１ピクチャが出力されるべきであるかどうかを決定するステップとを含む。

Description

［関連出願への相互参照］
本願は、２０２０年１月２７日付けで出願された米国特許仮出願第６２／９６６１２７号及び２０２０年１０月６日付けで出願された米国特許出願第１７／０６３９３７号からの優先権を主張する。

［技術分野］
本開示の実施形態は、ビデオコーディング及び復号化に、より具体的には、出力レイヤセットによるピクチャ出力に関係がある。

動き補償付きのインターピクチャ予測を使用したビデオコーディング及び復号化は、以前より使用されている。圧縮されていないデジタルビデオは、ピクチャの連続を含むことができ、各ピクチャは、例えば、１９２０×１０８０のルミナンスサンプル及び関連するクロミナンスサンプルの空間寸法を有する。ピクチャの連続は、例えば、毎秒６０ピクチャ、つまり６０Ｈｚの固定又は可変のピクチャレート（俗にフレームレートとしても知られている。）を有することができる。圧縮されていないビデオは、有意なビットレート要件を有している。例えば、サンプル当たり８ビットでの１０８０ｐ６０４：２：０ビデオ（６０Ｈｚのフレームレートでの１９２０×１０８０のルミナンスサンプル解像度）は、１．５Ｇビット／ｓに近いバンド幅を必要とする。そのようなビデオの１時間は、６００Ｇバイト超の記憶空間を必要とする。

ビデオコーディング及び復号化の１つの目的は、圧縮による入力ビデオ信号の冗長性の低減であることができる。圧縮は、いくつかの場合に２桁以上、上記のバンド幅又は記憶空間要件を減らすのを助けることができる。可逆及び不可逆圧縮の両方並びにそれらの組み合わせが用いられ得る。可逆圧縮は、原信号の厳密なコピーが圧縮された原信号から再構成可能である技術を指す。不可逆圧縮を使用する場合に、再構成された信号は、原信号と同じでない場合があるが、原信号と再構成された信号との間のひずみは、再構成された信号を、意図された用途にとって有用なものとするほど十分に小さい。ビデオの場合には、不可逆圧縮が広く用いられている。許容されるひずみの量は用途に依存し、例えば、特定の消費者ストリーミング用途のユーザは、テレビジョン配信用途のユーザよりも高いひずみを許容し得る。達成可能な圧縮比は、より高い許容可能な／受け入れ可能なひずみがより高い圧縮比をもたらし得ることを反映することができる。

ビデオエンコーダ及びデコーダは、例えば、動き補償、変換、量子化、及びエントロピコーディングを含む、いくつかの広いカテゴリからの技術を利用することができる。そのような技術のいくつかは以下で紹介される。

従前、ビデオエンコーダ及びデコーダは、ほとんどの場合に、コーディングされたビデオシーケンス（Coded Video Sequence，ＣＶＳ）、グループ・オブ・ピクチャ（Group of Picture，ＧＯＰ）、又は同様のマルチピクチャタイムフレームについて定義され一定に保たれた所与のピクチャサイズで動作する傾向があった。例えば、ＭＰＥＧ－２では、システム設計は、シーンの活動などの因子に応じて、しかしＩピクチャでのみ、従って、通常はＧＯＰについて、水平解像度（及び、それによって、ピクチャサイズ）を変えるために使用された。ＣＶＳ内の異なる解像度の使用のための参照ピクチャのリサンプリングは、例えば、ＩＴＵ－ＴＲｅｃ．Ｈ．２６３ＡｎｎｅｘＰで、使用されている。しかし、ここでは、ピクチャサイズは変化せず、参照ピクチャのみがリサンプリングされて、結果として、潜在的に、ピクチャキャンバスの部分のみが（ダウンサンプリングの場合に）使用されるか、あるいは、シーンの部分のみが（アップサンプリングの場合に）捕捉されることになる。更に、Ｈ．２６３ＡｎｎｅｘＱは、上向き又は下向きに（各次元で）２倍で個々のマクロブロックのリサンプリングを可能にする。この場合もやはり、ピクチャサイズは同じままである。マクロブロックのサイズは、Ｈ．２６３では固定であるから、シグナリングされる必要がない。

予測されたピクチャにおけるピクチャサイズの変化は、現代のビデオコーディングでは、より主流になっている。例えば、ＶＰ９は、参照ピクチャリサンプリング、及びピクチャ全体の解像度の変化を可能にする、同様に、ＶＶＣに向けて行われたある提案（例えば、その全文を本願に援用されるHendry, et. al，“On adaptive resolution change (ARC) for VVC”，Joint Video Team document JVET-M0135-v1，２０１９年１月９～１８日）は、異なる（より高い又はより低い）解像度への参照ピクチャ全体のリサンプリングを可能にする。そのような文献では、異なる候補解像度が、シーケンスパラメータセットでコーディングされて、ピクチャパラメータセットでピクチャごとのシンタックス要素によって参照されることが提案されている。

近年、単一のビデオピクチャへの複数の意味的に独立したピクチャ部分の圧縮領域の集約又は抽出が多少の注目を集めている。特に、例えば、３６０度のコーディング又は特定の監視アプリケーションとの関連で、複数の意味的に独立したソースピクチャ（例えば、立方体に投影された３６０度のシーンの６つの立方体表面、又はマルチカメラ監視環境の場合における個々のカメラ入力）は、所与の時点での種々のシーンごとの活動に対照するよう、個別の適応解像度設定を必要とすることがある。すなわち、エンコードは、所与の時点で、３６０度全体又は監視シーンを構成する種々の意味的に独立したピクチャに対して異なるリサンプリング係数を使用することを選択してよい。独立したピクチャが単一のピクチャに結合されるとき、参照ピクチャリサンプリングが実行される必要があり、適応解像度コーディングシグナリングは、コーディングされたピクチャの部分について、利用可能である。

本開示の実施形態は、上記のニーズ及び／又は他の問題に対処し得る。

１つ以上の実施形態に従って、少なくとも１つのプロセッサによって実行される方法が提供される。方法は、複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームを受け取るステップと、前記コーディングされたビデオストリームの前記ビデオデータをデコードするステップを含み、前記デコードするステップは、出力レイヤセットシグナリングのモードを示すシンタックス要素に基づいて、前記コーディングされたビデオストリームの第１ピクチャが出力されるべきであるかどうかを決定するステップを含む。

実施形態に従って、前記決定するステップは、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素に基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを含み、前記モードは、パラメータセットによって指定されている出力レイヤセットの総数が、前記パラメータセットを参照する前記コーディングされたビデオストリームの各コーディングされたビデオシーケンスにおけるレイヤの最大許容数に等しく、前記出力レイヤセットの中のｉ番目の出力レイヤセットが、０以上ｉ以下のレイヤインデックスを有するレイヤを含み、前記出力レイヤセットの中の各出力レイヤセットについて、当該出力レイヤセットの中の最も高いレイヤのみが出力されるべきである、ことを含む。

実施形態に従って、前記シンタックス要素は、前記出力レイヤセットシグナリングの前記モードを示すよう０の値を有する。

実施形態に従って、前記パラメータセットは、ビデオパラメータセットである。

実施形態に従って、前記決定するステップは、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素と、出力されることを示されている、前記第１ピクチャと同じアクセスユニットに属する第２ピクチャと、前記第１ピクチャよりも高いレイヤに属する前記第２ピクチャと、出力レイヤに属する前記第２ピクチャとに基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを含む。

実施形態に従って、前記決定するステップは、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素に基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを含み、前記モードは、パラメータセットによって指定されている出力レイヤセットの総数が明示的にシグナリングされ、前記パラメータセットによって指定されている前記出力レイヤセットの出力レイヤが明示的にシグナリングされ、前記出力レイヤのうちの少なくとも１つが参照レイヤを有する、ことを含む。

実施形態に従って、前記シンタックス要素は、前記出力レイヤセットシグナリングの前記モードを示すよう２の値を有する。

実施形態に従って、前記決定するステップは、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素と、０よりも大きい前記パラメータセットの識別子の値と、如何なる出力レイヤにも属さないことを示されている、前記第１ピクチャと同じアクセスユニットに属する第２ピクチャとに基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを含む。

実施形態に従って、前記決定するステップは、前記第１ピクチャが出力されるべきであることを決定するステップを含む。

１つ以上の実施形態に従って、複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームをデコードするシステムが提供される。システムは、コンピュータプログラムコードを記憶するよう構成されるメモリと、前記コーディングされたビデオストリームを受け取り、前記コンピュータプログラムコードにアクセスし、該コンピュータプログラムコードによって指示されるように動作する少なくとも１つのプロセッサとを含み、前記コンピュータプログラムコードは、前記少なくとも１つのプロセッサに、前記コーディングされたビデオストリームのビデオデータをデコードさせるよう構成される復号化コードを含み、前記復号化コードは、前記少なくとも１つのプロセッサに、出力レイヤセットシグナリングのモードを示すシンタックス要素に基づいて、前記コーディングされたビデオストリームの第１ピクチャが出力されるべきであるかどうかを決定させるよう構成される決定コードを含む。

実施形態に従って、前記決定コードは、前記少なくとも１つのプロセッサに、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素に基づいて、前記第１ピクチャが出力されるべきではないことを決定させるよう構成され、前記モードは、パラメータセットによって指定されている出力レイヤセットの総数が、前記パラメータセットを参照する前記コーディングされたビデオストリームの各コーディングされたビデオシーケンスにおけるレイヤの最大許容数に等しく、前記出力レイヤセットの中のｉ番目の出力レイヤセットが、０以上ｉ以下のレイヤインデックスを有するレイヤを含み、前記出力レイヤセットの中の各出力レイヤセットについて、当該出力レイヤセットの中の最も高いレイヤのみが出力されるべきである、ことを含む。

実施形態に従って、前記決定コードは、前記少なくとも１つのプロセッサに、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素と、出力されることを示されている、前記第１ピクチャと同じアクセスユニットに属する第２ピクチャと、前記第１ピクチャよりも高いレイヤに属する前記第２ピクチャと、出力レイヤに属する前記第２ピクチャとに基づいて、前記第１ピクチャが出力されるべきではないことを決定させるよう構成される。

実施形態に従って、前記決定コードは、前記少なくとも１つのプロセッサに、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素に基づいて、前記第１ピクチャが出力されるべきではないことを決定させるよう構成され、前記モードは、パラメータセットによって指定されている出力レイヤセットの総数が明示的にシグナリングされ、前記パラメータセットによって指定されている前記出力レイヤセットの出力レイヤが明示的にシグナリングされ、前記出力レイヤのうちの少なくとも１つが参照レイヤを有する、ことを含む。

実施形態に従って、前記決定コードは、前記少なくとも１つのプロセッサに、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素と、０よりも大きい前記パラメータセットの識別子の値と、如何なる出力レイヤにも属さないことを示されている、前記第１ピクチャと同じアクセスユニットに属する第２ピクチャとに基づいて、前記第１ピクチャが出力されるべきではないことを決定させるよう構成される。

１つ以上の実施形態に従って、コンピュータ命令を記憶している非一時的なコンピュータ可読媒体が提供される。コンピュータ命令は、少なくとも１つのプロセッサに、コーディングされたビデオストリームのビデオデータをデコードさせるよう構成され、前記ビデオデータは、複数のレイヤにパーティション化され、前記デコードすることは、出力レイヤセットシグナリングのモードを示すシンタックス要素に基づいて、前記コーディングされたビデオストリームの第１ピクチャが出力されるべきであるかどうかを決定することを含む。

開示されている対象の更なる特徴、性質、及び様々な利点は、以下の詳細な説明及び添付の図面からより明らかになる。

実施形態に従う通信システムの略ブロック図の概略図である。実施形態に従う通信システムの略ブロック図の概略図である。実施形態に従うデコーダの略ブロック図の概略図である。実施形態に従うエンコーダの略ブロック図の概略図である。対比技術の実施形態に従う、ＡＲＣパラメータのシグナリングのための第１構成の概略図である。対比技術の実施形態に従う、ＡＲＣパラメータのシグナリングのための第２構成の概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのための第１構成の概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのための第２構成の概略図である。実施形態に従う、ＡＲＣパラメータのシグナリングのための第３構成の概略図である。実施形態に従う、タイルグループヘッダの抜粋の概略図である。実施形態に従う、シーケンスパラメータセットの抜粋の概略図である。適応解像度変更によるスケーラビリティのための予測構造の例である。実施形態に従うシンタックステーブルの例を表す。実施形態に従うシンタックステーブルの例を表す。実施形態に従う、アクセスユニットごとのＰＯＣサイクル及びアクセスユニットカウント値のパージング及び復号化の略ブロック図の概略図である。実施形態に従う、多層サブピクチャを含むビデオビットストリーム構造の概略図である。実施形態に従う、強化された解像度による選択されたサブピクチャの表示の概略図である。実施形態に従う、多層サブピクチャを含むビデオビットストリームのための復号化及び表示プロセスのブロック図である。実施形態に従う、サブピクチャのエンハンスメントレイヤによる３６０度ビデオ表示の概略図である。実施形態に従う、分割されたサブピクチャのレイアウトの例を表す。実施形態に従う、１つのサブピクチャの対応するサブピクチャサイズ及び位置情報の例を表す。図１５Ａ及び１５Ｂに表されているサブピクチャの対応するピクチャ予測構造を表す。実施形態に従う、１つ以上のレイヤによりコーディングされ得る複数のサブ領域に分割された入力ピクチャの例を表す。図１７に表されているサブ領域の、局所領域の空間スケーラビリティモダリティによる対応するレイヤ及びピクチャ予測構造を表す。実施形態に従う、ビデオパラメータセットの抜粋の概略図である。実施形態に従う、シーケンスパラメータセットの抜粋の概略図である。実施形態に従う、サブピクチャレイアウト情報のためのシンタックステーブルの例である。実施形態に従う、各出力レイヤセットについて出力レイヤ及びプロファイル／ティア／レベル情報を示すためのシンタックステーブルの例である。実施形態に従う、各出力レイヤセットについて出力レイヤモードを示すためのシンタックステーブルの例である。各出力レイヤセットについて各レイヤの目下のサブピクチャを示すためのシンタックステーブルの例である。実施形態に従うデコーダの図である。実施形態を実装するのに適したコンピュータシステムの図である。

図１は、本開示の実施形態に従う通信システム（１００）の略ブロック図を表す。通信システム（１００）は、ネットワーク（１５０）を介して相互接続されている少なくとも２つの端末（１１０、１２０）を含んでよい。データの一方向伝送については、第１端末（１１０）は、ネットワーク（１５０）を介した他の端末（１２０）への伝送のためにローカル位置でビデオデータをコーディングしてよい。第２端末（１２０）は、他の端末のエンコーディングされたビデオデータをネットワーク（１５０）から受信し、コーディングされたデータをデコードして、回復されたビデオデータを表示してよい。一方向データ伝送は、メディアサービングアプリケーションなどにおいて一般的であり得る。

図１は、例えば、ビデオ会議中に、現れ得るコーディングされたビデオの双方向伝送をサポートするよう設けられた端末（１３０、１４０）の第２対を表す。データの双方向伝送については、各端末（１３０、１４０）は、ネットワーク（１５０）を介した他の端末への伝送のために、ローカル位置で捕捉されたビデオデータをコーディングしてよい。各端末（１３０、１４０）はまた、他の端末によって送信されたコーディングされたビデオデータを受信してよく、コーディングされたデータをデコードしてよく、そして、回復されたビデオデータをローカルの表示デバイスで表示してよい。

図１では、端末（１１０～１４０）は、サーバ、パーソナルコンピュータ、及びスマートフォン、並びに／又は任意の他のタイプの端末として表され得る。例えば、端末（１１０～１４０）は、ラップトップコンピュータ、タブレットコンピュータ、メディアプレイヤー、及び／又は専用のビデオ会議装置であってもよい。ネットワーク（１５０）は、例えば、ワイヤライン及び／又はワイヤレス通信ネットワークを含む、端末（１１０～１４０）の間でコーディングされたビデオデータを伝達する任意数のネットワークを表す。通信ネットワーク（１５０）は、回路交換及び／又はパケット交換チャネルにおいてデータを交換してよい。代表的なネットワークには、電気通信網、ローカルエリアネットワーク、ワイドエリアネットワーク、及び／又はインターネットがある。本議論のために、ネットワーク（１５０）のアーキテクチャ及びトポロジは、以降で説明されない限りは本開示の動作に無関係であってよい。

図２は、開示されている対象の応用例として、ストリーミング環境におけるビデオエンコーダ及びデコーダの配置を表す。開示されている対象は、例えば、ビデオ会議と、デジタルＴＶと、ＣＤ、ＤＶＤ、メモリスティックなどを含むデジタル媒体上での圧縮されたビデオの記憶と、などを含む他のビデオ対応用途に同様に適用可能であることができる。

図２で表されているように、ストリーミングシステム（２００）は、ビデオソース（２０１）及びエンコーダ（２０３）を含むことができる捕捉サブシステム（２１３）を含んでよい。ビデオソース（２０１）は、例えば、デジタルカメラであってよく、圧縮されていないビデオサンプルストリーム（２０２）を生成するよう構成されてよい。圧縮されていないビデオサンプルストリーム（２０２）は、エンコードされたビデオビットストリームと比較して高いデータボリュームを提供してよく、カメラ（２０１）へ結合されたエンコーダ（２０３）によって処理され得る。エンコーダ（２０３）は、以下で更に詳細に記載されるように、開示されている対象の態様を可能にする又は実装するためのハードウェア、ソフトウェア、又はそれらの組み合わせを含むことができる。エンコードされたビデオビットストリーム（２０４）は、サンプルストリームと比較して低いデータボリュームを含んでよく、将来の使用のためにストリーミングサーバ（２０５）に記憶され得る。１つ以上のストリーミングクライアント（２０６）は、エンコードされたビデオビットストリーム（２０４）のコピーであってよいビデオビットストリーム（２０９）を読み出すためにストリーミングサーバ（２０５）にアクセスすることができる。

実施形態において、ストリーミングサーバ（２０５）はまた、ＭＡＮＥ（Media Aware Network Element）として機能してもよい。例えば、ストリーミングサーバ（２０５）は、潜在的に異なったビットストリームをストリーミングクライアント（２０６）の１つ以上に合わせるために、エンコードされたビデオビットストリーム（２０４）をプルーニングするよう構成されてよい。実施形態において、ＭＡＮＥは、ストリーミングシステム（２００）でストリーミングサーバ（２０５）とは別に設けられてもよい。

ストリーミングクライアント（２０６）は、ビデオデコーダ（２１０）及びディスプレイ（２１２）を含むことができる。ビデオデコーダ（２１０）は、例えば、エンコードされたビデオビットストリームの入来するコピーであるビデオビットストリーム（２０９）をデコード、ディスプレイ（２１２）又は他のレンダリングデバイス（図示せず。）でレンダリングされ得る送出ビデオサンプルストリーム（２１１）を生成することができる。いくつかのストリーミングシステムでは、ビデオビットストリーム（２０４、２０９）は、特定のビデオコーディング／圧縮規格に従ってエンコードされ得る。そのような規格の例には、ＩＴＵ－Ｔ推奨Ｈ．２６５があるが、これに限られない。バーサタイル・ビデオ・コーディング（Versatile Video Coding，ＶＶＣ）として俗に知られているビデオコーディング規格が開発中である。本開示の実施形態は、ＶＶＣとの関連で使用されてもよい。

図３は、本開示の実施形態に従って、ディスプレイ（２１２）に取り付けられているビデオデコーダ（２１０）の例となる機能ブロック図を表す。

ビデオデコーダ（２１０）は、チャネル（３１２）、受信器（３１０）、バッファメモリ（３１５）、エントロピデコーダ／パーサ（３２０）、スケーラ／逆変換ユニット（３５１）、イントラ予測ユニット（３５２）、動き補償予測ユニット（３５３）、アグリゲータ（３５５）、ループフィルタユニット（３５６）、参照ピクチャメモリ（３５７）、及び現在ピクチャメモリ（３５８）を含んでよい。少なくとも１つの実施形態で、ビデオデコーダ（２１０）は、集積回路、集積回路の連続、及び／又は他の電子回路を含んでよい。ビデオデコーダ（２１０）はまた、関連するメモリとともに１つ以上のＣＰＵで実行されるソフトウェアで部分的に又は全体的に具現されてもよい。

この実施形態及び他の実施形態で、受信器（３１０）は、ビデオデコーダ（２１０）によってデコードされるべき１つ以上のコーディングされたビデオシーケンスを一度に１つずつ受信してよい。ここで、夫々のコーディングされたビデオシーケンスの復号化（デコード）は、他のコーディングされたビデオシーケンスから独立している。コーディングされたビデオシーケンスは、チャネル（３１２）から受信されてよく、チャネルは、エンコードされたビデオデータを記憶している記憶デバイスへのハードウェア／ソフトウェアリンクであってよい。受信器（３１０）は、エンコードされたビデオデータを他のデータ、例えば、コーディングされたオーディオデータ及び／又は補助的なデータストリームとともに受信してよく、それらは、それらの各々の使用エンティティ（図示せず。）へ転送されてよい。受信器（３１０）は、コーディングされたビデオシーケンスを他のデータから分離してよい。ネットワークジッタに対抗するために、バッファメモリ（３１５）が受信器（３１０）とエントロピデコーダ／パーサ（３２０）（以降「パーサ」）との間に結合されてもよい。受信器（３１０）が十分なバンド幅及び可制御性の記憶／転送デバイスから、又はアイソシンクロナス（isosynchronous）ネットワークからデータを受信しているときに、バッファ（３１５）は使用されなくてもよく、あるいは、小さくてよい。インターネットなどのベストエフォートのパケットネットワークでの使用のために、バッファ（３１５）は必要とされる場合があり、比較的に大きくかつ適応サイズであることができる。

ビデオデコーダ（２１０）は、エントロピコーディングされたビデオシーケンスからシンボル（３２１）を再構成するためのパーサ（３２０）を含んでよい。それらのシンボルのカテゴリは、例えば、デコーダ（２１０）の動作を管理するために使用される情報と、潜在的に、図２で表されるようにデコーダへ結合され得るディスプレイ（２１２）などのレンダリングデバイスを制御するための情報とを含む。レンダリングデバイスのための制御情報は、ＳＥＩ（Supplementary Enhancement Information）メッセージ又はＶＵＩ（Video Usability Information）パラメータセットフラグメント（図示せず。）の形をとってよい。パーサ（３２０）は、受信されたコーディングされたビデオシーケンスをパース／エントロピデコードしてよい。コーディングされたビデオシーケンスのコーディングは、ビデオコーディング技術又は規格に従うことができ、可変長コーディング、ハフマンコーディング、文脈依存による又はよらない算術コーディング、などを含む、当業者によく知られている原理に従うことができる。パーサ（３２０）は、コーディングされたビデオシーケンスから、ビデオデコーダにおけるピクセルのサブグループのうちの少なくとも１つについてのサブグループパラメータの組を、そのグループに対応する少なくとも１つのパラメータに基づいて抽出してよい。サブグループは、グループ・オブ・ピクチャ（Groups of Pictures，ＧＯＰ）、ピクチャ、タイル、スライス、マクロブロック、コーディングユニット（Coding Units，ＣＵ）、ブロック、変換ユニット（Transform Units，ＴＵ）、予測ユニット（Prediction Units，ＰＵ）、などを含むことができる。パーサ（３２０）はまた、変換係数などのコーディングされたビデオシーケンス情報から、量子化パラメータ値、動きベクトル、なども抽出してよい。

パーサ（３２０）は、シンボル（３２１）を生成するために、バッファ（３１５）から受信されたビデオシーケンスに対してエントロピ復号化／パージング動作を実行してよい。

シンボル（３２１）の再構成は、コーディングされたビデオピクチャ又はその部分（例えば、インター及びイントラピクチャ、インター及びイントラブロック）のタイプ及び他の因子に応じて多種多様なユニットを有することができる。どのユニットが含まれるか、及びそれらがどのように含まれるかは、コーディングされたビデオシーケンスからパーサ（３２０）によってパースされたサブグループ制御情報によって制御され得る。パーサ（３２０）と以下の複数のユニットとの間のそのようなサブグループ制御情報のフローは、明りょうさのために表されていない。

既に述べられた機能ブロックを超えて、デコーダ２１０は、概念的に、以下で説明される多数の機能ユニットに細分され得る。商業上の制約の下で動作する実際の実施では、それらのユニットの多くが互いに密に相互作用し、少なくとも部分的に互いに組み込まれ得る。しかし、開示されている対象を説明することを目的として、以下での機能ユニットへの概念的細分は適切である。

１つのユニットは、スケーラ／逆変換ユニット（３５１）である。スケーラ／逆変換ユニット（３５１）は、パーサ（３２０）からシンボル（３２１）として、量子化された変換係数とともに、使用するために変換するもの、ブロックサイズ、量子化係数、量子化スケーリングマトリクスなどを含む制御情報を受信してよい。スケーラ／逆変換ユニット（３５１）は、アグリゲータ（３５５）へ入力することができるサンプル値を含むブロックを出力することができる。

いくつかの場合に、スケーラ／逆変換ユニット（３５１）の出力サンプルは、イントラコーディングされたブロック、すなわち、前に再構成されたピクチャからの予測情報を使用しておらず、現在のピクチャの前に再構成された部分からの予測情報を使用することができるブロック、に関係することができる。そのような予測情報は、イントラピクチャ予測ユニット（３５２）によって供給され得る。いくつかの場合に、イントラピクチャ予測ユニット（３５２）は、現在ピクチャメモリ（３５８）からの現在の（部分的に再構成された）ピクチャからフェッチされた周囲の既に再構成された情報を用いて、再構成中のブロックと同じサイズ及び形状のブロックを生成する。アグリゲータ（３５５）は、いくつかの場合に、サンプルごとに、イントラ予測ユニット（３５２）が生成した予測情報を、スケーラ／逆変換ユニット（３５１）によって供給される出力サンプル情報に加える。

他の場合では、スケーラ／逆変換ユニット（３５１）の出力サンプルは、インターコーディングされた、そして潜在的に動き補償されたブロックに関係することができる。そのような場合に、動き補償予測ユニット（３５３）は、予測のために使用されるサンプルをフェッチするよう参照ピクチャメモリ（３５７）にアクセスすることができる。ブロックに関係するシンボル（３２１）に従って、フェッチされたサンプルを動き補償した後に、それらのサンプルは、出力サンプル情報を生成するために、アグリゲータ（３５５）によって、スケーラ／逆変換ユニット（３４５１）の出力（この場合に、残差サンプル又は残差信号と呼ばれる。）に加えられ得る。動き補償予測ユニット（３５３）が予測サンプルをフェッチする参照ピクチャメモリ（３５７）内のアドレスは、動きベクトルによって制御され得る。動きベクトルは、例えば、Ｘ、Ｙ及び参照ピクチャコンポーネントを有することができるシンボル（３２１）の形で動き補償予測ユニット（３５３）が利用することができるものであってよい。動き補償はまた、サブサンプルの正確な動きベクトルが使用されているときに参照ピクチャメモリ（３５７）からフェッチされるサンプル値の補間や、動きベクトル予測メカニズムなどを含むこともできる。

アグリゲータ（３５５）の出力サンプルは、ループフィルタユニット（３５６）において様々なループフィルタリング技術を受けることができる。ビデオ圧縮技術は、インループフィルタ技術を含むことができる。この技術は、コーディングされたビデオビットストリームに含まれており、パーサ（３２０）からのシンボル（３２１）としてループフィルタユニット（３５６）に利用可能にされたパラメータによって制御されるが、コーディングされたピクチャ又はコーディングされたビデオシーケンスの（復号化順序において）前の部分の復号化中に得られたメタ情報にも応答することができ、更には、前に構成されたループフィルタ処理されたサンプル値に応答することができる。

ループフィルタユニット（３５６）の出力は、ディスプレイ（２１２）などのレンダーデバイスへ出力され、更には、将来のインターピクチャ予測における使用のために参照ピクチャメモリ（３５７）に記憶され得るサンプルストリームであることができる。

特定のコーディングされたピクチャは、完全に再構成されると、将来の予測のための参照ピクチャとして使用され得る。コーディングされたピクチャが完全に再構成され、コーディングされたピクチャが（例えば、パーサ（３２０）によって）参照ピクチャとして識別されると、現在の参照ピクチャが参照ピクチャメモリ（３５７）の部分になることができ、未使用の現在ピクチャメモリは、後続のコーディングされたピクチャの再構成を開始する前に再割当てされ得る。

ビデオデコーダ（２１０）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５などの規格で文書化されることがある所定のビデオ圧縮技術に従って復号化動作を実行してよい。コーディングされたビデオシーケンスは、それが、ビデオ圧縮技術文書又は規格で、具体的にはその中のプロファイル文書で、定められているビデオ圧縮技術又は規格のシンタックスに従うという意味で、使用中のビデオ圧縮技術又は規格によって規定されたシンタックスに従い得る。また、いくつかのビデオ圧縮技術又は規格に従うために、コーディングされたビデオシーケンスの複雑さは、ビデオ圧縮技術又は規格のレベルによって定義された境界内にあってよい。いくつかの場合に、レベルは、最大ピクチャサイズ、最大フレームレート、最大再構成サンプルレート（例えば、メガサンプル／秒で測定される。）、最大参照ピクチャサイズ、などを制限する。レベルによって設定された制限は、いくつかの場合に、ハイポセティカル・リファレンス・デコーダ（Hypothetical Reference Decoder，ＨＲＤ）仕様及びコーディングされたビデオシーケンスにおいて通知されるＨＲＤバッファ管理のためのメタデータを通じて更に制限され得る。

実施形態において、受信器（３１０）は、エンコードされたビデオとともに、追加の（冗長な）データを受信してもよい。追加のデータは、コーディングされたビデオシーケンスの部分としても含まれてもよい。追加のデータは、ビデオデコーダ（２１０）によって、データを適切にデコードするために及び／又は原ビデオデータをより正確に再構成するために使用されてよい。追加のデータは、例えば、時間、空間、又は信号対雑音比（ＳＮＲ）エンハンスメントレイヤ、冗長スライス、冗長ピクチャ、前方誤り訂正符号、などの形をとることができる。

図４は、本開示の実施形態に従って、ビデオソース（２０１）に関連したビデオエンコーダ（２０３）の例となる機能ブロック図を表す。

ビデオエンコーダ（２０３）は、例えば、ソースコーダ（４３０）であるエンコーダ、コーディングエンジン（４３２）、（ローカル）デコーダ（４３３）、参照ピクチャメモリ（４３４）、予測器（４３５）、送信器（４４０）、エントロピコーダ（４４５）、コントローラ（４５０）、及びチャネル（４６０）を含んでよい。

エンコーダ（２０３）は、エンコーダ（２０３）によってコーディングされるべきビデオ画像を捕捉し得るビデオソース（２０１）（エンコーダの部分ではない。）からビデオサンプルを受け取ってよい。

ビデオソース（２０１）は、任意の適切なビット深さ（例えば、８ビット、１０ビット、１２ビットなど）、任意の色空間（例えば、ＢＴ．６０１ＹＣｒＣＢ、ＲＧＢなど）、及び任意の適切なサンプリング構造（例えば、ＹＣｒＣｂ４：２：０、ＹＣｒＣｂ４：４：４）であることができるデジタルビデオサンプルストリームの形で、エンコーダ（２０３）によってコーディングされるべきソースビデオシーケンスを供給してよい。メディアサービングシステムでは、ビデオソース（２０１）は、前に準備されたビデオを記憶している記憶デバイスであってもよい。ビデオ会議システムでは、ビデオソース（２０１）は、ローカル画像情報をビデオシーケンスとして捕捉するカメラであってもよい。ビデオデータは、順に見られる場合に動きを授ける複数の個別ピクチャとして供給されてもよい。ピクチャ自体は、ピクセルの空間アレイとして編成されてよく、各ピクセルは、使用中のサンプリング構造、色空間、などに依存する１つ以上のサンプルを有することができる。当業者であれば、ピクセルとサンプルとの間の関係を容易に理解することができる。本明細書は、以下、サンプルに焦点を当てる。

実施形態に従って、エンコーダ（２０３）は、実時間において又は用途によって必要とされる任意の他の時間制約の下で、ソースビデオシーケンスのピクチャを、コーディングされたビデオシーケンス（４４３）へとコーディング及び圧縮してよい。適切なコーディング速度を強いることは、コントローラ（４５０）の一機能である。コントローラ（４５０）はまた、以下で記載されるような他の機能ユニットを制御してもよく、それらのユニットへ機能的に結合されてもよい。結合は明りょうさのために表されていない。コントローラ（４５０）によってセットされるパラメータには、レート制御に関連したパラメータ（ピクチャスキップ、量子化器、レートひずみ最適化技術のラムダ値、など）、ピクチャサイズ、グループ・オブ・ピクチャ（ＧＯＰ）レイアウト、最大動きベクトル探索範囲、などが含まれ得る。当業者は、コントローラ（４５０）の他の機能を、それらが特定のシステム設計のために最適化されたビデオエンコーダ（２０３）に関係し得るということで、容易に識別することができる。

いくつかのビデオエンコーダは、当業者が「コーディングループ」として容易に実現するものにおいて動作する。過度に単純化された記載として、コーディングループは、ソースコーダ（４３０）の符号化部分（コーディングされるべき入力ピクチャと、参照ピクチャとに基づいて、シンボルを生成することに関与する。）と、シンボルとコーディングされたビデオビットストリームとの間の圧縮が特定のビデオ圧縮技術で可逆であるときに（遠隔の）デコーダも生成することになるサンプルデータを生成するようシンボルを再構成する、ビデオエンコーダ（２０３）に埋め込まれた（ローカルの）デコーダ（４３３）とから成ることができる。その再構成されたサンプルストリームは、参照ピクチャメモリ（４３４）へ入力されてよい。シンボルストリームの復号化は、デコーダの場所（ローカル又は遠隔）に依存しないビットパーフェクト（bit-exact）な結果をもたらすので、参照ピクチャメモリコンテンツも、ローカルのエンコーダと遠隔のエンコーダとの間でビットパーフェクトである。すなわち、エンコーダの予測部分は、デコーダが復号化中に予測を使用するときに“見る”ことになるのとまさに同じサンプル値を参照ピクチャサンプルとして“見る”。参照ピクチャのシンクロニシティ（及び、例えば、チャネルエラーのために、シンクロニシティが維持され得ない場合に、結果として生じるドリフト）のこの基本原理は、当業者に知られている。

“ローカル”のデコーダ（４３３）の動作は、図３とともに既に詳細に上述されている、“遠隔”のデコーダ（２１０）と同じであることができる。しかしながら、シンボルが利用可能であり、エントロピコーダ（４４５）及びパーサ（３２０）によるコーディングされたビデオシーケンスへのシンボルの符号化／復号化が可逆であることができるので、チャネル（３１２）、受信器（３１０）、バッファ（３１５）、及びパーサ（３２０）を含むデコーダ（２１０）のエントロピ復号化部分は、ローカルのデコーダ（４３３）において完全には実施されなくてもよい。

この時点で行われ得る観察は、デコーダに存在するパージング／エントロピ復号化を除く如何なるデコーダ技術も、対応するエンコーダにおいて実質的に同じ機能形態で存在する必要があり得ることである。この理由により、開示されている対象は、デコーダの動作に焦点を当てる。エンコーダ技術の説明は、それらが、包括的に記載されているデコーダ技術の逆であってよいということで、省略可能である。特定の範囲においてのみ、より詳細な説明が必要とされ、以下で与えられている。

その動作の部分として、ソースコーダ（４３０）は、動き補償された予測コーディングを実行してよい。これは、「参照ピクチャ」として指定されたビデオシーケンスからの１つ以上の前にコーディングされたフレームを参照して予測的に入力ピクチャをコーディングする。このようにして、コーディングエンジン（４３２）は、入力ピクチャに対する予測参照として選択され得る参照ピクチャのピクセルブロックと入力ピクチャのピクセルブロックとの間の差をコーディングする。

ローカルのビデオデコーダ（４３３）は、ソースコーダ（４３０）によって生成されたシンボルに基づいて、参照フレームとして指定され得るフレームのコーディングされたビデオデータをデコードしてよい。コーディングエンジン（４３２）の動作は、有利なことに、不可逆プロセスであってよい。コーディングされたビデオデータがビデオデコーダ（図４には図示せず。）でデコードされ得るとき、再構成されたビデオシーケンスは、通常は、いくらかのエラーを伴ったソースビデオシーケンスの複製であり得る。ローカルのビデオデコーダ（４３３）は、参照フレームに対してビデオデコーダによって実行され得る復号化プロセスを再現し、再構成された参照フレームを参照ピクチャメモリ（４３４）に格納されるようにしてよい。このように、エンコーダ（２０３）は、（伝送エラーなしで）遠端のビデオデコーダによって取得されることになる再構成された参照フレームと共通の内容を有している再構成された参照ピクチャのコピーをローカルで記憶し得る。

予測器（４３５）は、コーディングエンジン（４３２）の予測探索を実行してよい。すなわち、新しいピクチャがコーディングされるために、予測器（４３５）は、その新しいピクチャのための適切な予測基準となり得る参照ピクチャ動きベクトル、ブロック形状、などの特定のメタデータ又は（候補参照ピクセルブロックとしての）サンプルデータを参照ピクチャメモリ（４３４）から探してよい。予測器（４３５）は、適切な予測基準を見つけるためにサンプルブロック・バイ・ピクセルブロックベース（sample block-by-pixel block basis）で動作してよい。いくつかの場合に、予測器（４３５）によって取得された探索結果によって決定されるように、入力ピクチャは、参照ピクチャメモリ（４３４）に記憶されている複数の参照ピクチャから引き出された予測基準を有してよい。

コントローラ（４５０）は、例えば、ビデオデータをエンコードするために使用されるパラメータ及びサブグループパラメータの設定を含め、ビデオコーダ（４３０）のコーディング動作を管理してもよい。

上記の全ての機能ユニットの出力は、エントロピコーダ（４４５）においてエントロピコーディングを受けてよい。エントロピコーダ（４４５）は、ハフマンコーディング、可変長コーディング、算術コーディングなどとして当業者に知られている技術に従ってシンボルを可逆圧縮することによって、様々な機能ユニットによって生成されたシンボルを、コーディングされたビデオシーケンスへと変換する。

送信器（４４０）は、エントロピコーダ（４４５）によって生成されたコーディングされたビデオシーケンスを、通信チャネル（４６０）を介した伝送のために準備するようにバッファリングしてよい。通信チャネル（４６０）は、エンコードされたビデオデータを記憶する記憶デバイスへのハードウェア／ソフトウェアリンクであってよい。送信器（４４０）は、ビデオコーダ（４３０）からのコーディングされたビデオデータを、送信されるべき他のデータ、例えば、コーディングされたオーディオデータ及び／又は補助的なデータストリーム（ソースは図示せず）とマージしてもよい。

コントローラ（４５０）は、エンコーダ（２０３）の動作を管理してもよい。コーディング中、コントローラ（４５０）は、各々のピクチャに適用され得るコーディング技術に影響を及ぼす可能性がある特定のコーディングされたピクチャタイプを各コーディングされたピクチャに割り当ててよい。例えば、ピクチャはしばしば、イントラピクチャ（Ｉピクチャ）、予測ピクチャ（Ｐピクチャ）、又は双方向予測ピクチャ（Ｂピクチャ）として割り当てられてよい。

イントラピクチャ（Intra Picture）（Ｉピクチャ）は、予測のソースとしてシーケンス内の如何なる他のピクチャも使用せずにコーディング及びデコードされ得るピクチャであってよい。いくつかのビデオコーデックは、例えば、独立したデコーダリフレッシュ（Independent Decoder Refresh，ＩＤＲ）ピクチャを含む種々のタイプのイントラピクチャを許容する。当業者であれば、Ｉピクチャのそのような変形並びにそれらの各々の応用及び特徴を知っている。

予測ピクチャ（Predictive Picture）（Ｐピクチャ）は、各ブロックのサンプル値を予測するために多くても１つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測によりコーディング及びデコードされ得るピクチャであってよい。

双方向予測ピクチャ（Bi-directionally Predictive Picture）（Ｂピクチャ）は、各ブロックのサンプル値を予測するために多くても２つの動きベクトル及び参照インデックスを用いてイントラ予測又はインター予測によりコーディング及び復号化され得るピクチャであってよい。同様に、多重予測ピクチャ（multiple-predictive picture(s)）は、単一のブロックの再構成のために２つよりも多い参照ピクチャ及び関連するメタデータを使用することができる。

ソースピクチャは、一般に、複数のサンプルブロック（例えば、夫々、４×４、８×８、４×８、又は１６×１６のサンプルのブロック）に空間的に細分され、ブロックごとにコーディングされてよい。ブロックは、ブロックの各々のピクチャに適用されているコーディング割り当てによって決定される他の（既にコーディングされた）ブロックを参照して予測的にコーディングされてよい。例えば、Ｉピクチャのブロックは、非予測的にコーディングされてよく、あるいは、それらは、同じピクチャの既にコーディングされたブロックを参照して予測的にコーディングされてもよい（空間予測又はイントラ予測）。Ｐピクチャのピクセルブロックは、非予測的に、あるいは、１つの前にコーディングされた参照ピクチャを参照して空間予測により又は時間予測により、コーディングされてよい。Ｂピクチャのブロックは、非予測的に、あるいは、１つ又は２つの前にコーディングされた参照ピクチャを参照して空間予測により又は時間予測により、コーディングされてよい。

ビデオコーダ（２０３）は、ＩＴＵ－ＴＲｅｃ．Ｈ．２６５のような所定のビデオコーディング技術又は規格に従ってコーディング動作を実行してよい。その動作中に、ビデオコーダ（２０３）は、入力ビデオシーケンスにおける時間及び空間冗長性を利用する予測コーディング動作を含む様々な圧縮動作を実行してよい。従って、コーディングされたビデオデータは、使用されているビデオコーディング技術又は規格によって定められているシンタックスに従い得る。

実施形態において、送信器（４４０）は、エンコードされたビデオとともに追加のデータを送信してもよい。ソースコーダ（４３０）は、コーディングされたビデオシーケンスの部分としてそのようなデータを含めてよい。追加のデータは、時間／空間／ＳＮＲエンハンスメントレイヤ、冗長ピクチャ及びスライスなどの他の形式の冗長データ、ＳＥＩメッセージ又はＶＵＩパラメータセットフラグメント、などを有してよい。

本開示の実施形態の特定の態様について更に詳細に説明する前に、本明細書の残りで言及される２、３の項目が、以下で紹介される。

「サブピクチャ」は、以降、いくつかの場合に、意味的にグループ分けされており、変更された解像度で独立してコーディングされ得るサンプル、ブロック、マクロブロック、コーディングユニット、又は同様のエンティティの長方形配置を指す。１つ以上のサブピクチャは、ピクチャを形成してよい。１つ以上のコーディングされたサブピクチャは、コーディングされたピクチャを形成してよい。１つ以上のサブピクチャは、ピクチャにまとめられてもよく、１つ以上のサブピクチャは、ピクチャから抽出されてもよい。特定の環境で、１つ以上のコーディングされたサブピクチャは、同じレベルにトランスコーディングせずに圧縮領域で、コーディングされたピクチャにまとめられてもよく、同じ又は特定の他の場合には、１つ以上のコーディングされたサブピクチャは、圧縮領域で、コーディングされたサブピクチャから抽出されてもよい。

「適応解像度変更」（Adaptive Resolution Change，ＡＲＣ）は、以降、コーディングされたビデオシーケンス内のピクチャ又はサブピクチャの解像度の変化を、例えば、参照ピクチャリサンプリングによって、可能にするメカニズムを指す。「ＡＲＣパラメータ」は、以降、適応解像度変更を実行するために必要な制御情報を指し、例えば、フィルタパラメータ、スケーリング係数、出力及び／又は参照ピクチャの解像度、様々な制御フラグ、などを含んでよい。

上記の説明は、単一の、意味的に独立したコーディングされたビデオピクチャのコーディング及び復号化に焦点を当てる。独立したＡＲＣパラメータによる複数のサブピクチャのコーディング／復号化の意味合い及びその暗黙的な更なる複雑性について記載する前に、ＡＲＣパラメータのシグナリングについての実施形態が説明されるべきである。

図６Ａ～６Ｃを参照すると、ＡＲＣパラメータのシグナリングについてのいくつかの新規の例となる実施形態が示されている。実施形態の夫々により述べられているように、それらは、コーディング効率、複雑性、及びアーキテクチャ視点から特定の利点を有している。ビデオコーディング規格又は技術は、これらの実施形態のうちの１つ以上を実装してよく、ＡＲＣパラメータのシグナリングについての、対比技術から知られている実施形態も含んでよい。対比技術の実施形態は、図５Ａ～５Ｂで表されている例を含む。新規の実施形態は、相互排他的でなくてよく、考えられる限りは、対比技術の実施形態も含む規格又は技術に含まれてもよく、それにより、どちらも、アプリケーションニーズ、関連する標準技術、又はエンコーダの選択に基づいて使用され得る。

ＡＲＣパラメータの分類には、（１）Ｘ及びＹ次元で別々であるか又は結合されているアップ／ダウンサンプル係数、又は（２）所与の数のピクチャについて一定速度のズームイン／アウトを示す時間次元を追加されたアップ／ダウンサンプル係数、が含まれてよい。上記の２つのうちのどちらも、その係数を含む表を指し示し得る１つ以上のシンタックス要素のコーディング又は復号化を伴ってよい。そのようなシンタックス要素は、実施形態では、長さが短くてもよい。

「解像度」は、組み合わせて又は別々に、入力ピクチャ、出力ピクチャ、参照ピクチャ、コーディングされたピクチャのサンプル、ブロック、マクロブロック、ＣＵ、又は任意の他の適切な粒度の単位で、Ｘ又はＹ次元での解像度を指してよい。１つよりも多い解像度がある場合に（例えば、入力ピクチャについて１つと参照ピクチャについて１つ）、特定の場合に、ひと組の値が他の組の値から推測されてもよい。解像度は、例えば、フラグの使用によって、ゲーティング（gated）されてもよい。解像度のより詳細な例は、以下で更に与えられる。

「ワーピング」（Warping）座標は、Ｈ．２６３ＡｎｎｅｘＰで使用されるものと同種であって、上述された適切な粒度にあってよい。Ｈ．２６３ＡｎｎｅｘＰは、そのようなワーピング座標をコーディングするための１つの効率的な方法を定義するが、他の、潜在的により効率的な方法も、考えられる限りは、使用されてよい。例えば、ＡｎｎｅｘＰのワーピング座標の可変長リバーシブルな「ハフマン」スタイルコーディングは、適切な長さのバイナリコーディングで置換されてもよく、このとき、バイナリコードワードの長さは、例えば、最大ピクチャサイズから導出されて、場合により、最大ピクチャサイズの境界の外での「ワーピング」を可能にするために、特定の係数を乗じられかつ特定の値でオフセットされてもよい。

アップ又はダウンサンプルフィルタパラメータを参照して、最も簡単な場合に、アップ及び／又はダウンサンプリングのための単一のフィルタしか存在しなくてもよい。しかし、特定の場合に、フィルタ設計における更なる柔軟性を可能にすることが有利であり得る。これは、フィルタパラメータのシグナリングによって実装されてよい。そのようなパラメータは、とり得るフィルタ設計のリストにおいてインデックスにより選択されてよく、フィルタは、（例えば、適切なエントロピコーディング技術を用いてフィルタ係数のリストを通じて）完全に指定されてもよく、かつ／あるいは、フィルタは、上記のメカニズムのいずれかなどに従ってシグナリングされるアップ／ダウンサンプル比により暗黙的に選択されてもよい。

以降、説明は、有限なアップ／ダウンサンプル係数の組（同じ係数がＸ及びＹの両方の次元で使用される。）のコーディングがコードワードにより示される、例となる場合を前提とする。そのコードワードは、有利なことに、例えば、Ｈ．２６４及びＨ．２６５などのビデオコーディング規格で特定のシンタックス要素に共通なＥｘｔ－Ｇｏｌｏｍｂコードを使用することによって、可変長コーディングされ得る。アップ／ダウンサンプル係数への値の１つの適切なマッピングは、例えば、以下の表１に従うことができる。

多くの類似したマッピングが、ビデオ圧縮技術又は規格で利用可能なアップ及びダウンスケールメカニズムの適用のニーズ及び能力に従って考案され得た。表は、より多くの値に拡張されてもよい。値はまた、Ｅｘｔ－Ｇｏｌｏｍｂコード以外のエントロピコーディングメカニズムによって（例えば、バイナリコーディングを用いて）表されてもよい。これは、リサンプリング係数が、例えば、ＭＡＮＥによって、ビデオ処理エンジン（エンコーダ及びデコーダなど）自体の外で重要である場合に、特定の利点を有し得る。解像度変更が不要である（おそらく）最も一般的な場合について、短い（例えば、表１の２行目に示されているような、単一ビットのみ）Ｅｘｔ－Ｇｏｌｏｍｂコードが選択可能であることが留意されるべきであり、これは、その最も一般的な場合のためにバイナリコードを使用することよりもコーディング効率が優れている可能性がある。

表中のエントリの数及びそれらのセマンティクスは、完全に又は部分的に設定可能であってよい。例えば、表の基本概要は、シーケンス又はデコーダパラメータセットなどの「ハイ」パラメータセットで運ばれてよい。代替的に、又は追加的に、１つ以上のそのような表は、ビデオコーディング技術又は規格で定義されてもよく、例えば、デコーダ又はシーケンスパラメータセットにより選択されてもよい。

以下では、上述されたようにコーディングされているアップサンプル／ダウンサンプル係数（ＡＲＣ情報）がビデオコーディング技術又は標準シンタックスにどのように含まれ得るかの説明が与えられる。同様の考えは、アップ／ダウンサンプルフィルタを制御する１つ又は数個のコードワードに当てはまる。以下ではまた、比較的大量のデータがフィルタ又は他のデータ構造のために必要とされ得る場合に関する説明も与えられる。

図５Ａを参照して、Ｈ．２６３ＡｎｎｅｘＰは、ピクチャヘッダ（５０１）内の４つのワーピング座標の形で、具体的に、Ｈ．２６３ＰＬＵＳＰＴＹＰＥ（５０３）ヘッダ拡張において、ＡＲＣ情報（５０２）を含める。そのような設計は、（ａ）利用可能なピクチャヘッダが有り、かつ、（ｂ）ＡＲＣ情報の頻繁な変化が期待される、場合に適切であり得る。しかし、Ｈ．２６３スタイルシグナリングを使用する場合のオーバーヘッドは極めて高くなる可能性があり、スケーリング係数は、ピクチャヘッダが過渡的な性質を有し得るので、ピクチャ境界に付随しないことがある。

図５Ｂを参照して、ＪＶＣＥＴ－Ｍ１３５－ｖ１は、シーケンスパラメータセット（５０７）の中に位置している目標解像度を含む表（５０６）を含むピクチャパラメータセット（５０４）に（インデックス）位置しているＡＲＣ参照情報（５０５）を含む。シーケンスパラメータセット（５０７）における表（５０６）でのとり得る解像度の配置は、能力交換（capability exchange）中に相互運用ネゴシエーションポイント（interoperability negotiation point）としてＳＰＳ（５０７）を使用することによって正当化されてよい。解像度は、適切なピクチャパラメータセット（５０４）を参照することによってピクチャごとに表（５０６）の値によってセットされた限界内で変化し得る。

図６Ａ～６Ｃを参照して、本開示の次の実施形態は、ＡＲＣ情報をビデオビットストリームで、例えば、本開示のデコーダへ、運んでよい。これらの実施形態の夫々は、上記の対比技術に対して特定の利点を有する。実施形態は、同時に、同じビデオコーディング技術又は規格において存在してもよい。

実施形態において、図６Ａを参照して、リサンプリング（ズーム）係数などのＡＲＣ情報（５０９）は、例えば、スライスヘッダ、ＧＯＢヘッダ、タイルヘッダ、又はタイルグループヘッダなどのヘッダ（５０８）に存在してよい。例として、図６Ａは、タイルグループヘッダとしてヘッダ（５０８）を表す。そのような構成は、例えば、表１に示されるような、数ビットの単一の可変長ｕｅ（ｖ）又は固定長コードワードのように、ＡＲＣ情報が小さい場合に、適切であることができる。タイルグループヘッダで直接にＡＲＣ情報を有することは、ＡＲＣ情報が、例えば、ピクチャ全体ではなく、タイルグループヘッダに対応するタイルグループによって表されるサブピクチャに適用可能であり得るという付加的な利点を有している。更には、たとえビデオ圧縮技術又は規格が（例えば、タイルグループに基づいた適応的な解像度変化とは対照的に）ピクチャ全体にのみ適応可能な解像度変化を使用するとしても、ＡＲＣ情報をタイルグループヘッダに（例えば、Ｈ２６３スタイルのピクチャヘッダに）置くことは、誤り耐性の観点から特定の利点を有する。上記の説明は、タイルグループヘッダに存在するＡＲＣ情報（５０９）について記載しているが、上記の説明はまた、ＡＲＣ情報（５０９）が、例えば、スライスヘッダ、ＧＯＢヘッダ、又はタイルヘッダに存在する場合にも、同様に当てはまり得る。

同じ又は他の実施形態において、図６Ｂを参照して、ＡＲＣ情報（５１２）自体が、例えば、ピクチャパラメータセット、ヘッダパラメータセット、タイルパラメータセット、適応パラメータセット、などのような適切なパラメータセット（５１１）であってもよい。例として、図６Ｂは、適応パラメータセット（Adaptation Parameter Set，ＡＰＳ）としてパラメータセット（５１１）を表す。そのパラメータセットの範囲は、有利なことに、ピクチャよりも大きくならない。例えば、パラメータセットの範囲はタイルグループであってもよい。ＡＲＣ情報（５１２）の使用は、関連するパラメータセットの活性化を通じて潜在してもよい。例えば、ビデオコーディング技術又は規格がピクチャベースのＡＲＣのみを企図する場合に、ピクチャパラメータセット又は同等物は、関連するパラメータセットとして適切であり得る。

同じ又は他の実施形態において、図６Ｃを参照して、ＡＲＣ参照情報（５１３）は、タイルグループヘッダ（５１４）又は類似したデータ構造に存在してもよい。ＡＲＣ参照情報（５１３）は、単一のピクチャを越える範囲でパラメータセット（５１６）において利用可能なＡＲＣ情報（５１５）のサブセットを参照することができる。例えば、パラメータセット（５１６）は、シーケンスパラメータセット（ＳＰＳ）又はデコーダパラメータセット（ＤＰＳ）であってよい。

ＪＶＣＥＴ－Ｍ１３５－ｖ１で使用されるタイルグループヘッダ、ＰＰＳ、又はＳＰＳからのＰＰＳの追加レベルの間接的な暗黙の活性化は、ピクチャパラメータセットが、シーケンスパラメータセットと同様に、能力交換又は告示のために使用可能であるから、不要であり得る。しかし、ＡＲＣ情報が、例えば、タイルグループによっても表されるサブピクチャに適用可能であるべき場合には、タイルグループに制限された活性化範囲を有するパラメータセット（例えば、適応パラメータセット又はヘッダパラメータセット）がより良い選択である場合がある。また、ＡＲＣ情報が無視してよいサイズよりも大きい、例えば、多数のフィルタ係数などのフィルタ制御情報を含む、場合には、パラメータは、コーディング効率の観点から、直接にヘッダを使用することよりも良い選択である場合がある。これは、そのような設定が、同じパラメータセットを参照することによって将来のピクチャ又はサブピクチャによって再利用可能であり得るからである。

複数のピクチャに及ぶ範囲でシーケンスパラメータセット又は他のより高いパラメータセットを使用する場合に、特定の考えが適用されてよい。

（１）表にＡＲＣ情報（５１５）を格納するためのパラメータセット（５１６）は、いくつかの場合に、シーケンスパラメータセットであることができるが、他の場合には、有利なことに、デコーダパラメータセットであることができる。デコーダパラメータセットは、複数のＣＶＳ、つまり、コーディングされたビデオストリームの活性化範囲、すなわち、セッション開始からセッション終了（session teardown）までの全てのコーディングされたビデオビットを有することができる。とり得るＡＲＣ係数が、場合によりハードウェアで実装されるデコーダ特徴であり、ハードウェア特徴は、如何なるＣＶＳ（少なくともいくつかのエンターテイメントシステムでは、長さが１秒以下であるグループ・オブ・ピクチャである）でも変化しない傾向があるので、そのような範囲は、より適切であることができる。それでもなお、いくつかの実施形態は、特に、以下の点（２）に関連して、ここで記載されているように、シーケンスパラメータセットにＡＲＣ情報の表を含めてよい。

（２）ＡＲＣ参照情報（５１３）は、有利なことに、ＪＶＣＥＴ－Ｍ１３５－ｖ１で見られるようにピクチャパラメータセットにではなくヘッダ（５１４）（例えば、ピクチャ／スライスタイル／ＧＯＢ／タイルグループヘッダ；以降、タイルグループヘッダ）に直接に置かれてよい。理由は、次の通りである：エンコーダが、例えば、ＡＲＣ参照情報などの、ピクチャパラメータセット内の単一の値を変更したい場合に、エンコーダは、新しいＰＰＳを生成し、その新しいＰＰＳを参照しなければならないことがある。ＡＲＣ参照情報しか変化せず、例えば、ＰＰＳ内の量子化マトリクス情報などの他の情報はそのままである場合に、そのような情報はかなりのサイズになる可能性があり、新しいＰＰＳを完成させるために再送される必要がある。ＡＲＣ参照情報は、変化する唯一の値となる、ＡＲＣ情報内のインデックスなどの、単一のコードワードである場合があるので、例えば、全ての量子化マトリクス情報を再送することは、面倒かつ無駄になる。従って、ヘッダ（例えば、ヘッダ（５１４））に直接にＡＲＣ参照情報を置くことは、ＪＶＣＥＴ－Ｍ１３５－ｖ１で提案されているようなＰＰＳを通じた間接参照が回避可能であるから、コーディング効率の観点から相当に優れている可能性がある。また、ＡＲＣ参照情報をＰＰＳに置くことは、ピクチャパラメータセット活性化の範囲がピクチャであるということで、ＡＲＣ参照情報によって参照されるＡＲＣ情報が必然的にサブピクチャにではなくピクチャ全体に適用される必要があるという追加の利点を有する。

同じ又は他の実施形態において、ＡＲＣパラメータのシグナリングは、図７Ａ～７Ｂで説明される詳細な例に従うことができる。図７Ａ～７Ｂは、シンタックスダイアグラムを表す。そのようなシンタックスダイアグラムの表記法は、Ｃスタイルプログラミングにおおよそ従う。太字の行は、ビットストリームに存在するシンタックス要素を示し、太字でない行は、しばしば、制御フロー又は変数の設定を示す。

ピクチャの（場合により長方形の）部分に適用可能なヘッダの例となるシンタックス構造として、タイルグループヘッダ（６００）は、可変長のＥｘｐ－Ｇｏｌｏｍｂコーディングされたシンタックス要素ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ（６０２）（太字で表示）を条件付きで含むことができる。タイルグループヘッダ（６００）におけるこのシンタックス要素の存在は、適応解像度（６０３）の使用によってゲーティングされ得る。ここで、適応解像度フラグの値は太字で表されていない。これは、フラグが、シンタックスダイアグラムで発生する時点でビットストリームに存在することを意味する。適応解像度がこのピクチャ又はその部分に対して使用中であるか否かは、ビットストリーム内又は外の如何なる高レベルシンタックス構造でもシグナリングされ得る。図７Ａ～７Ｂで表されている例では、適応解像度は、以下で説明されるようにシーケンスパラメータセット（６１０）でシグナリングされる。

図７Ｂは、シーケンスパラメータセット（６１０）の抜粋を表す。示されている最初のシンタックス要素は、ａｄａｐｔｉｖｅ＿ｐｉｃ＿ｒｅｓｏｌｕｔｉｏｎ＿ｃｈａｎｇｅ＿ｆｌａｇ（６１１）である。真である場合に、そのようなフラグは、適応解像度の使用を示すことができ、翻って、特定の制御情報を必要とし得る。例において、そのような制御情報は、シーケンスパラメータセット（６１０）及びタイルグループヘッダ（６００）においてｉｆ（）文に基づくフラグの値に基づいて条件付きで存在する。

適応解像度が使用中である場合に、この例では、サンプルのユニットで出力解像度がコーディングされる。この例となる実施形態での出力解像度（６１３）は、シンタックス要素ｏｕｔｐｕｔ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ及びｏｕｔｐｕｔ＿ｐｉｃ＿ｈｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓの両方を参照する。これらは一緒に、出力ピクチャの解像度を定義することができる。ビデオコーディング技術又は規格の他の場所で、どちらかの値に対する特定の制限が定義され得る。例えば、レベル定義は、上記の２つのシンタックス要素の値の積であることができる総出力サンプル数を制限してよい。また、特定のビデオコーディング技術又は規格、あるいは、例えば、システム規格などの外部技術又は規格は、番号付け範囲（例えば、一方又は両方の次元が２の累乗で割り切れる必要がある）、又はアスペクト比（例えば、幅及び高さは４：３又は１６：９などの関係になければならない）を制限してもよい。そのような制限は、ハードウェア実装を容易にするために，又は他の理由のために、導入されてもよい。

特定のアプリケーションで、エンコーダは、サイズを出力ピクチャサイズであると暗黙的に想定するのではなく、特定のピクチャサイズを使用するようにデコーダに指示することが賢明であることができる。この例では、シンタックス要素ｒｅｆｅｒｅｎｃｅ＿ｐｉｃ＿ｓｉｚｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ（６１４）は、参照ピクチャ次元（６１５）の条件付きの存在をゲーティングする（先と同じく、数字は、例となる実施形態で、幅及び高さの両方を参照する）。

図７Ｂは、とり得る復号化ピクチャ幅及び高さの表を表す。そのような表は、例えば、表指示（６１６）（シンタックス要素ｎｕｍ＿ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ＿ｍｉｎｕｓ１）によって、表現され得る。シンタックス要素の「ｍｉｎｕｓ１」は、そのシンタックス要素の値の解釈（interpretation）を指すことができる。例えば、シンタックス要素のコーディングされた値が０である場合に、１つの表エントリが存在する。コーディングされた値が５である場合に、６つの表エントリが存在する。表の各“行”ごとに、デコードされたピクチャ幅及び高さが、次いで、表エントリ（６１７）としてシンタックスに含まれる。

提示されている表エントリ（６１７）は、タイルグループヘッダ（６００）におけるシンタックス要素ｄｅｃ＿ｐｉｃ＿ｓｉｚｅ＿ｉｄｘ（６０２）を用いてインデックスを付され得る。それによって、タイルグループごとに異なった復号化サイズ、実際にはズーム係数が可能となる。

特定のビデオコーディング技術又は規格、例えば、ＶＰ９は、空間スケーラビリティを可能にするために、時間スケーラビリティとともに特定の形態の参照ピクチャリサンプリング（本開示の実施形態とは全く別なふうにシグナリングされてよい）を実装することによって空間スケーラビリティをサポートする。特に、特定の参照ピクチャは、空間エンハンスメントレイヤのベースを形成するよう、ＡＲＣスタイル技術を用いて、より高い解像度へアップサンプリングされてもよい。そのようなアップサンプリングされたピクチャは、詳細を追加するために、高い解像度で通常の予測メカニズムを使用して精緻化され得る。

本開示の実施形態は、そのような環境で使用され得る。特定の場合に、同じ又は他の実施形態において、ネットワーク抽象レイヤ（Network Abstraction Layer，ＮＡＬ）ユニットヘッダ、例えば、一時ＩＤ（Temporal ID）フィールドにおける値は、時間レイヤのみならず空間レイヤも示すために使用され得る。そうすることは、特定のシステム設計にとって特定の利点を有する。例えば、ＮＡＬユニットヘッダの一時ＩＤ値に基づいて時間レイヤ選択的転送のために生成及び最適化された既存の選択的転送ユニット（Selected Forwarding Units，ＳＦＵ）は、スケーラブル環境のために変更無しで使用可能である。それを可能にするために、本開示の実施形態は、ＮＡＬユニットヘッダにおいて一時ＩＤフィールドによって示される時間レイヤとコーディングされたピクチャとの間のマッピングを含んでよい。

いくつかのビデオコーディング技術で、アクセスユニット（Access Unit，ＡＵ）は、所与の時点で捕捉されて各々のピクチャ／スライス／タイル／ＮＡＬユニット内に構成されたコーディングされたピクチャ、スライス、タイル、ＮＡＬユニットなどを指すことができる。そのような時点は、合成時間（composition time）であることができる。

ＨＥＶＣ、及び特定の他のビデオコーディング技術では、ピクチャ・オーダー・カウント（Picture Order Count，ＰＯＣ）値が、復号化ピクチャバッファ（Decoded Picture Buffer，ＤＰＢ）に格納された複数の参照ピクチャの中から選択された参照ピクチャを示すために使用され得る。アクセスユニット（ＡＵ）が１つ以上のピクチャ、スライス、又はタイルを有する場合に、同じＡＵに属する各ピクチャ、スライス、又はタイルは、同じＰＯＣ値を運んでよく、ＰＯＣ値から、それらが同じ合成時間のコンテンツから生成されたことが導出され得る。すなわち、２つのピクチャ／スライス／タイルが同じ所与のＰＯＣ値を運ぶシナリオにおいて、その２つのピクチャ／スライス／タイルは同じＡＵに属しかつ同じ合成時間を有していることが決定され得る。対照的に、異なるＰＯＣ値を有する２つのピクチャ／タイル／スライスは、それらのピクチャ／スライス／タイルが異なるＡＵに属しかつ異なる合成時間を有していることを示すことができる。

本開示の実施形態において、上記の堅固な関係は、アクセスユニットが異なるＰＯＣ値を有するピクチャ、スライス、又はタイルを有することができる点で緩和され得る。ＡＵ内の異なるＰＯＣ値を許すことによって、ＰＯＣ値を使用して、同じ提示時間（presentation time）を有する潜在的に独立してデコード可能なピクチャ／スライス／タイルを識別することが可能になる。従って、本開示の実施形態は、以下で更に詳細に記載されるように、参照ピクチャ選択シグナリング（例えば、参照ピクチャセットシグナリング又は参照ピクチャリストシグナリング）の変化無しで複数のスケーラブルレイヤのサポートを可能にすることができる。

実施形態において、ＰＯＣ値のみから、異なるＰＯＣ値を有する他のピクチャ／スライス／タイルに対して、ピクチャ／スライス／タイルが属するＡＵを識別することができることは、依然として望ましい。これは、以下で記載される実施形態で達成され得る。

同じ又は他の実施形態において、アクセスユニットカウント（Access Unit Count，ＡＵＣ）は、ＮＡＬユニットヘッダ、スライスヘッダ、タイルグループヘッダ、ＳＥＩメッセージ、パラメータセット又はＡＵデリミタ（delimiter）などの高位シンタックス構造でシグナリングされてよい。ＡＵＣの値は、どのＮＡＬユニット、ピクチャ、スライス、又はタイルが所与のＡＵに属するかを識別するために使用されてよい。ＡＵＣの値は、個別の合成時間インスタンスに対応していてよい。ＡＵＣ値は、ＰＯＣ値の倍数に等しくなる。整数値でＰＯＣ値を割ることによって、ＡＵＣ値は計算され得る。特定の場合に、割り算は、デコーダ実装に一定の負担をかける可能性がある。そのような場合に、ＡＵＣ値の番号付け空間における小さな制限は、本開示の実施形態によって実行されるシフト演算による割り算の置換を可能にし得る。例えば、ＡＵＣ値は、ＰＯＣ値範囲の最上位ビット（ＭＳＢ）値に等しくなる。

同じ実施形態において、ＡＵごとのＰＯＣサイクル（例えばシンタックス要素ｐｏｃ＿ｃｙｃｌｅ＿ａｕ）の値は、ＮＡＬユニットヘッダ、スライスヘッダ、タイルグループヘッダ、ＳＥＩメッセージ、パラメータセット又はＡＵデリミタなどの高位シンタックス構造でシグナリングされてよい。ｐｏｃ＿ｃｙｃｌｅ＿ａｕシンタックス要素は、多数の異なる連続したＰＯＣ値が同じＡＵとどのように関連付けられ得るかを示してよい。例えば、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値が４に等しい場合に、０以上３以下に等しいＰＯＣ値を有するピクチャ、スライス、又はタイルは、０に等しいＡＵＣ値を有するＡＵと関連付けられ、４以上７以下に等しいＰＯＣ値を有するピクチャ、スライス、又はタイルは、１に等しいＡＵＣ値を有するＡＵと関連付けられる。従って、ＡＵＣの値は、ｐｏｃ＿ｃｙｃｌｅ＿ａｕでＰＯＣ値を割ることによって、本開示の実施形態によって推測されてよい。

同じ又は他の実施形態において、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は、コーディングされたビデオシーケンスにおける空間又はＳＮＲレイヤの数を識別する、例えば、ビデオパラメータセット（ＶＰＳ）に位置している情報から、導出されてもよい。そのような可能な関係は、以下で簡単に説明される。上述された導出はＶＰＳで数ビットを節約し得るので、コーディング効率を改善し得る一方で、ピクチャなどのビットストリームの所与の小さな部分についてｐｏｃ＿ｃｙｃｌｅ＿ａｕを最小化することが可能であるために、階層的にビデオパラメータセットの下にある適切な高位シンタックス構造でｐｏｃ＿ｃｙｃｌｅ＿ａｕを明示的にコーディングすることが有利であり得る。この最適化は、ＰＯＣ値（及び／又はＰＯＣを間接的に参照するシンタックス要素の値）が低位シンタックス構造でコーディングされ得るので、上記の導出プロセスを通じてセーブ可能であるよりも多いビットをセーブし得る。

同じ又は他の実施形態において、図９Ａは、コーディングされたビデオシーケンスにおける全てのピクチャ／スライスのために使用されるｐｏｃ＿ｃｙｃｌｅ＿ａｕを示す、ＶＰＳ（６３０）又はＳＰＳにおけるｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕ（６３２）のシンタックス要素をシグナリングするためのシンタックステーブルの例を表し、図９Ｂは、スライスヘッダ（６４０）における現在のスライスのｐｏｃ＿ｃｙｃｌｅ＿ａｕを示すｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕ（６４２）のシンタックス要素をシグナリングするためのシンタックステーブルの例を表す。ＰＯＣ値がＡＵごとに一様に増大する場合に、ＶＰＳ（６３０）におけるｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ（６３４）は、１に等しくセットされ、ｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕ（６３２）は、ＶＰＳ（６３０）でシグナリングされる。この場合に、ｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕ（６４２）は、明示的にはシグナリングされず、各ＡＵのＡＵＣの値は、ｖｐｓ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕ（６３２）でＰＯＣの値を割ることによって計算される。ＰＯＣ値がＡＵごとに一様に増大しない場合に、ＶＰＳ（６３０）におけるｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ（６３４）は、０に等しくセットされる。この場合に、ｖｐｓ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔはシグナリングされず、一方、ｓｌｉｃｅ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔは各スライス又はピクチャごとにスライスヘッダでシグナリングされる。各スライス又はピクチャは、異なる値のｓｌｉｃｅ＿ａｃｃｅｓｓ＿ｕｎｉｔ＿ｃｎｔを有してよい。各ＡＵのＡＵＣの値は、ｓｌｉｃｅ＿ｐｏｃ＿ｃｙｃｌｅ＿ａｕ（６４２）でＰＯＣの値を割ることによって計算される。

図１０は、実施形態の関連するワークフローを説明するブロック図を表す。例えば、デコーダ（又はエンコーダ）は、ＶＰＳ／ＳＰＳをパースして、ＡＵごとのＰＯＣサイクルが一定であるか否かを識別する（６５２）。次に、デコーダ（又はエンコーダ）は、ＡＵごとのＰＯＣサイクルがコーディングされたビデオシーケンス内で一定であるかどうかに基づいて、決定を行う。すなわち、ＡＵごとのＰＯＣサイクルが一定である場合に、デコーダ（又はエンコーダ）は、シーケンスレベルのｐｏｃ＿ｃｙｃｌｅ＿ａｕ値及びＰＯＣ値からアクセスユニットカウントの値を計算する（６５６）。代替的に、ＡＵごとのＰＯＣサイクルが一定でない場合に、デコーダ（又はエンコーダ）は、ピクチャレベルのｐｏｃ＿ｃｙｃｌｅ＿ａｕ値及びＰＯＣ値からアクセスユニットカウントの値を計算する（６５８）。いずれの場合にも、デコーダ（又はエンコーダ）は、次いで、例えば、ＶＰＳ／ＳＰＳをパースして、ＡＵごとのＰＯＣサイクルが一定であるか否かを識別することによって、プロセスを繰り返してよい（６６２）。

同じ又は他の実施形態において、たとえピクチャ、スライス、又はタイルのＰＯＣの値が異なり得るとしても、同じＡＵＣ値を有するＡＵに対応するピクチャ、スライス、又はタイルは、同じ復号化又は出力時間インスタンスと関連付けられてよい。従って、同じＡＵ内のピクチャ、スライス、又はタイルの間で如何なる相互的なパージング／復号化依存性もなしで、同じＡＵと関連付けられたピクチャ、スライス、又はタイルの全て又はサブセットは、並行してデコードされてよく、同じ時間インスタンスで出力されてよい。

同じ又は他の実施形態において、たとえピクチャ、スライス、又はタイルのＰＯＣの値が異なり得るとしても、同じＡＵＣ値を有するＡＵに対応するピクチャ、スライス、又はタイルは、同じ合成／表示時間インスタンスと関連付けられてよい。合成時間がコンテナフォーマットに含まれる場合に、たとえピクチャが異なるＡＵに対応するとしても、ピクチャが同じ合成時間を有しているならば、ピクチャは同じ時間インスタンスで表示され得る。

同じ又は他の実施形態において、各ピクチャ、スライス、又はタイルは、同じＡＵにおいて同じ時間識別子（例えば、シンタックス要素ｔｅｍｐｏｒａｌ＿ｉｄ）を有してよい。ある時間インスタンスに対応するピクチャ、スライス、又はタイルの全て又はサブセットは、同じ時間サブレイヤと関連付けられてよい。同じ又は他の実施形態において、各ピクチャ、スライス、又はタイルは、同じＡＵにおいて同じ又は異なる空間レイヤｉｄ（例えば、シンタックス要素ｌａｙｅｒ＿ｉｄ）を有してもよい。ある時間インスタンスに対応するピクチャ、スライス、又はタイルの全て又はサブセットは、同じ又は異なる空間レイヤと関連付けられてよい。

図８は、適応解像度変更とのｔｅｍｐｏｒａｌ＿ｉｄ、ｌａｙｅｒ＿ｉｄ、並びにＰＯＣ及びＡＵＣ値の組み合わせによるビデオシーケンス構造（６８０）の例を示す。この例では、ＡＵＣ＝０を有する最初のＡＵ内のピクチャ、スライス、又はタイルは、ｔｅｍｐｏｒａｌ＿ｉｄ＝０及びｌａｙｅｒ＿ｉｄ＝０又は１を有してよく、一方、ＡＵＣ＝１を有する第２のＡＵ内のピクチャ、スライス、又はタイルは、ｔｅｍｐｏｒａｌ＿ｉｄ＝１及びｌａｙｅｒ＿ｉｄ＝０又は１を夫々有してよい。ＰＯＣの値は、ｔｅｍｐｏｒａｌ＿ｉｄ及びｌａｙｅｒ＿ｉｄの値にかかわらずピクチャごとに１ずつ増える。この例では、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は２に等しくなる。実施形態において、ｐｏｃ＿ｃｙｃｌｅ＿ａｕの値は、（空間スケーラビリティ）レイヤの数に等しくセットされてよい。この例では、ＰＯＣの値は２ずつ増え、一方、ＡＵＣの値は１ずつ増える。例として、図８は、最初のＡＵ（ＡＵＣ＝０）内で、ＰＯＣ０、ＴＩＤ０、及びＬＩＤ０を有するＩスライス（６８１）と、ＰＯＣ１、ＴＩＤ０、及びＬＩＤ１を有するＢスライス（６８２）とを表す。第２のＡＵ（ＡＵＣ＝１）内で、図８は、ＰＯＣ２、ＴＩＤ１、及びＬＩＤ０を有するＢスライス（６８３）と、ＰＯＣ３、ＴＩＤ１、及びＬＩＤ１を有するＢスライス（６８４）とを表す。第３のＡＵ（ＡＵＣ＝３）内で、図８は、ＰＯＣ４、ＴＩＤ０、及びＬＩＤ０を有するＢスライス（６８５）と、ＰＯＣ５、ＴＩＤ０、及びＬＩＤ１を有するＢスライス（６８６）とを表す。

上記の実施形態で、インターピクチャ又はインターレイヤ予測構造及び参照ピクチャ指示の全て又はサブセットは、ＨＥＶＣでの既存の参照ピクチャセット（ＲＰＳ）シグナリング又は参照ピクチャリスト（ＲＰＬ）シグナリングによってサポートされてよい。ＲＰＳ又はＲＰＬで、選択された参照ピクチャは、ＰＯＣの値、又は現在のピクチャと選択された参照ピクチャとの間のＰＯＣの差分値をシグナリングすることによって、示される。本開示の実施形態において、ＲＰＳ又はＲＰＬは、シグナリングの変化無しで、しかし、次の制限を有して、インターピクチャ又はインターレイヤ予測構造を示すために使用され得る。参照ピクチャのｔｅｍｐｏｒａｌ＿ｉｄの値が現在のピクチャのｔｅｍｐｏｒａｌ＿ｉｄの値よりも大きい場合に、現在のピクチャは、動き補償又は他の予測のために参照ピクチャを使用しなくもよい。参照ピクチャのｌａｙｅｒ＿ｉｄの値が現在のピクチャのｌａｙｅｒ＿ｉｄの値よりも大きい場合に、現在のピクチャは、動き補償又は他の予測のために参照ピクチャを使用しなくてもよい。

同じ及び他の実施形態において、時間動きベクトル予測のためのＰＯＣ差分に基づいた動きベクトルスケーリングは、アクセスユニット内の複数のピクチャにわたって無効にされてもよい。従って、各ピクチャがアクセスユニット内で異なるＰＯＣ値を有することがあるが、動きベクトルは、アクセスユニット内の時間動きベクトル予測のためにスケーリング及び使用されなくてもよい。これは、同じＡＵで異なるＰＯＣを有する参照ピクチャが同じ時間インスタンスを有する参照ピクチャと見なされ得るからである。従って、実施形態において、動きベクトルスケーリング関数は、参照ピクチャが現在のピクチャに関連したＡＵに属する場合に１を返してよい。

同じ及び他の実施形態において、時間動きベクトル予測のためのＰＯＣ差分に基づいた動きベクトルスケーリングは、参照ピクチャの空間分解能が現在のピクチャの空間分解能とは異なる場合に、複数のピクチャにわたって任意に無効化されてもよい。動きベクトルスケーリングが許可される場合に、動きベクトルは、現在のピクチャと参照ピクチャとの間のＰＯＣ差分及び空間分解能比の両方に基づいてスケーリングされてよい。

同じ又は他の実施形態において、動きベクトルは、特に、ｐｏｃ＿ｃｙｃｌｅ＿ａｕが非一様値を有する場合に（ｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ＝＝０である場合に）、時間動きベクトル予測のためのＰＯＣ差分の代わりにＡＵＣ差分に基づいてスケーリングされてもよい。そうでない場合（ｖｐｓ＿ｃｏｎｔａｎｔ＿ｐｏｃ＿ｃｙｃｌｅ＿ｐｅｒ＿ａｕ＝＝１である場合）には、ＡＵＣ差分に基づいた動きベクトルスケーリングは、ＰＯＣ差分に基づいた動きベクトルスケーリングと同じであってよい。

同じ又は他の実施形態において、動きベクトルがＡＵＣ差分に基づいてスケーリングされる場合に、現在のピクチャを含む同じＡＵ内の（同じＡＵＣ値を有する）参照動きベクトルは、ＡＵＣ差分に基づいてスケーリングされず、現在のピクチャと参照ピクチャとの間の空間分解能比に基づいたスケーリングを有して又はスケーリング無しで動きベクトル予測のために使用される。

同じ及び他の実施形態において、ＡＵＣ値は、ＡＵの境界を識別するために使用され、かつ、ＡＵ粒度での入力及び出力タイミングを必要とする仮想リファレンスデコーダ（Hypothetical Reference Decoder，ＨＲＤ）動作のために使用される。ほとんどの場合に、ＡＵの最上位レイヤを有するデコードされたピクチャは、表示のために出力されてよい。ＡＵＣ値及びｌａｙｅｒ＿ｉｄ値は、出力ピクチャを識別するために使用され得る。

実施形態において、ピクチャは、１つ以上のサブピクチャを有してもよい。各サブピクチャは、ピクチャの局所領域又は全体領域をカバーしてよい。サブピクチャによってサポートされる領域は、他のサブピクチャによってサポートされる領域と重なり合っても重なり合わなくてもよい。１つ以上のサブピクチャによって構成された領域は、ピクチャの全体領域をカバーしてもしなくてもよい。ピクチャがサブピクチャからなる場合に、そのサブピクチャによってサポートされる領域は、ピクチャによってサポートされる領域と同じであってもよい。

同じ実施形態で、サブピクチャは、コーディングされたピクチャのために使用されているコーディング方法と類似したコーディング方法によってコーディングされてもよい。サブピクチャは、独立してコーディングされてもよく、あるいは、他のサブピクチャ又はコーディングされたピクチャに依存してコーディングされてもよい。サブピクチャは、他のサブピクチャ又はコーディングされたピクチャからの如何なるパージング依存性も有しても有さなくてもよい。

同じ実施形態で、コーディングされたサブピクチャは、１つ以上のレイヤに含まれてよい。レイヤ内のコーディングされたサブピクチャは、異なる空間分解能を有してもよい。元のサブピクチャは、空間的にリサンプリング（アップサンプリング又はダウンサンプリング）され、異なる空間分解能パラメータでコーディングされ、レイヤに対応するビットストリームに含まれてよい。

同じ又は他の実施形態において、Ｗがサブピクチャの幅を示し、Ｈがサブピクチャの高さを示すとして、（Ｗ，Ｈ）を有するサブピクチャは、コーディングされて、レイヤ０に対応するコーディングされたビットストリームに含まれてよく、一方、元の空間分解能を有するサブピクチャからアップサンプリング（又はダウンサンプリングされた）、（Ｗ×Ｓ_ｗ，ｋ，Ｈ×Ｓ_ｈ，ｋ）を有するサブピクチャは、コーディングされ、レイヤｋに対応するコーディングされたビットストリームに含まれてよい。ここで、Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋは、夫々、水平方向及び垂直方向でのリサンプリング比を示す。Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋの値が１よりも大きい場合に、リサンプリングはアップサンプリングに等しい。一方、Ｓ_ｗ，ｋ、Ｓ_ｈ，ｋの値が１よりも小さい場合には、リサンプリングはダウンサンプリングに等しい。

同じ又は他の実施形態において、レイヤ内のコーディングされたサブピクチャは、同じサブピクチャ又は異なるサブピクチャにおける他のレイヤ内のコーディングされたサブピクチャのそれとは異なった視覚品質を有してもよい。例えば、レイヤｎ内のサブピクチャｉは、量子化品質Ｑ_ｉ，ｎでコーディングされ、一方、レイヤｍ内のサブピクチャｊは、量子化パラメータＱ_ｊ，ｍでコーディングされる。

同じ又は他の実施形態において、レイヤ内のコーディングされたサブピクチャは、同じ局所領域の他のレイヤ内のコーディングされたサブピクチャからの如何なるパージング又は復号化依存性もなしで、独立してデコード可能であってよい。同じ局所領域の他のサブピクチャレイヤを参照せずに独立にデコード可能であることができるサブピクチャレイヤは、独立サブピクチャレイヤである。独立サブピクチャレイヤ内のコーディングされたサブピクチャは、同じサブピクチャレイヤ内の前にコーディングされたサブピクチャからの復号化又はパージング依存性を有しても有さなくてもよいが、コーディングされたサブピクチャは、他のサブピクチャレイヤ内のコーディングされたサブピクチャからの如何なる依存性も有さなくてよい。

同じ又は他の実施形態において、レイヤ内のコーディングされたサブピクチャは、同じ局所領域の他のレイヤ内のコーディングされたサブピクチャからの何らかのパージング又は復号化依存性を有して、従属的にデコード可能であってもよい。同じ局所領域の他のサブピクチャレイヤを参照して従属的にデコード可能であることができるサブピクチャレイヤは、従属サブピクチャレイヤである。従属サブピクチャレイヤ内のコーディングされたサブピクチャは、同じサブピクチャに属するコーディングされたサブピクチャ、同じサブピクチャレイヤ内の前にコーディングされたサブピクチャ、又は両方の参照サブピクチャを参照してよい。

同じ又は他の実施形態において、コーディングされたサブピクチャは、１つ以上の独立サブピクチャレイヤと、１つ以上の従属サブピクチャレイヤとを有する。しかし、少なくとも１つの独立サブピクチャレイヤが、コーディングされたサブピクチャのために存在してよい。独立サブピクチャレイヤは、０に等しい、ＮＡＬユニットヘッダ又は他の高位シンタックス構造に存在し得るレイヤ識別子（例えば、シンタックス要素ｌａｙｅｒ＿ｉｄ）の値を有してよい。０に等しいｌａｙｅｒ＿ｉｄを有するサブピクチャレイヤは、基本サブピクチャレイヤであってよい。

同じ又は他の実施形態において、ピクチャは、１つ以上の前景サブピクチャと、１つの背景サブピクチャとを有してよい。背景サブピクチャによってサポートされる領域は、ピクチャの領域に等しくてよい。前景サブピクチャによってサポートされる領域は、背景サブピクチャによってサポートされる領域と重なり合ってもよい。背景サブピクチャは、基本サブピクチャレイヤであってよく、一方、前景サブピクチャは、非基本（拡張）サブピクチャレイヤであってよい。１つ以上の非基本サブピクチャレイヤは、復号化のために同じ基本レイヤを参照してよい。ａがｂよりも大きいとして、ａに等しいｌａｙｅｒ＿ｉｄを有する各非基本サブピクチャレイヤは、ｂに等しいｌａｙｅｒ＿ｉｄを有する非基本サブピクチャレイヤを参照してもよい。

同じ又は他の実施形態において、ピクチャは、背景サブピクチャの有無によらず１つ以上の前景サブピクチャを有してもよい。各サブピクチャは、それ自身の基本サブピクチャレイヤと、１つ以上の非基本（拡張）レイヤとを有してよい。各基本サブピクチャレイヤは、１つ以上の非基本サブピクチャレイヤによって参照されてよい。ａがｂよりも大きいとして、ａに等しいｌａｙｅｒ＿ｉｄを有する各非基本サブピクチャレイヤは、ｂに等しいｌａｙｅｒ＿ｉｄを有する非基本サブピクチャレイヤを参照してよい。

同じ又は他の実施形態において、ピクチャは、背景サブピクチャの有無によらず１つ以上の前景サブピクチャを有してもよい。（基本又は非基本）サブピクチャレイヤ内の各コーディングされたサブピクチャは、同じサブピクチャに属する１つ以上の非基本レイヤサブピクチャと、同じサブピクチャに属さない１つ以上の非基本レイヤサブピクチャとによって参照されてよい。

同じ又は他の実施形態において、ピクチャは、背景サブピクチャの有無によらず１つ以上の前景サブピクチャを有してもよい。レイヤａ内のサブピクチャは、同じレイヤ内の複数のサブピクチャに更にパーティション化されてよい。レイヤｂ内の１つ以上のコーディングされたサブピクチャは、レイヤａ内のパーティション化されたサブピクチャを参照してよい。

同じ又は他の実施形態において、コーディングされたビデオシーケンス（ＣＶＳ）は、コーディングされたピクチャのグループであってよい。ＣＶＳは、１つ以上のコーディングされたサブピクチャシーケンス（ＣＳＰＳ）から成ってよく、ＣＳＰＳは、ピクチャの同じ局所領域をカバーするコーディングされたサブピクチャのグループであってよい。ＣＳＰＳは、コーディングされたビデオシーケンスのそれと同じ又は異なった時間分解能を有してよい。

同じ又は他の実施形態において、ＣＳＰＳは、コーディングされて、１つ以上のレイヤに含まれてよい。ＣＳＰＳは、１つ以上のＣＳＰＳレイヤを有しても又はそれらから成ってもよい。ＣＳＰＳに対応する１つ以上のＣＳＰＳレイヤをデコードすることは、同じ局所領域に対応するサブピクチャのシーケンスを再構成してよい。

同じ又は他の実施形態において、ＣＳＰＳに対応するＣＳＰＳレイヤの数は、他のＣＳＰＳに対応するＣＳＰＳレイヤの数と同じであっても又は異なってもよい。

同じ又は他の実施形態において、ＣＳＰＳレイヤは、他のＣＳＰＳレイヤとは異なった時間分解能（例えば、フレームレート）を有してもよい。元の（圧縮されていない）サブピクチャシーケンスは、時間的にリサンプリング（アップサンプリング又はダウンサンプリング）され、異なる時間分解能パラメータでコーディングされ、レイヤに対応するビットストリームに含まれてよい。

同じ又は他の実施形態において、フレームレートＦを有するサブピクチャシーケンスは、コーディングされて、レイヤ０に対応するコーディングされたビットストリームに含まれてよく、一方、元のサブピクチャシーケンスから時間的にアップサンプリング（又はダウンサンプリング）された、Ｆ×Ｓ_ｔ，ｋを有するサブピクチャシーケンスは、コーディングされて、レイヤｋに対応するコーディングされたビットストリームに含まれてよい。ここで、Ｓ_ｔ，ｋは、レイヤｋのための時間サンプリング比を示す。Ｓ_ｔ，ｋの値が１よりも大きい場合には、時間リサンプリングプロセスは、フレームレートアップコンバージョンに等しい。一方、Ｓ_ｔ，ｋが１よりも小さい場合には、時間リサンプリングプロセスは、フレームレートダウンコンバージョンに等しい。

同じ又は他の実施形態において、ＣＳＰＳレイヤａを有するサブピクチャが、動き補償又は何らかのインターレイヤ予測のために、ＣＳＰＳレイヤｂを有するサブピクチャによって参照される場合に、ＣＳＰＳレイヤａの空間分解能がＣＳＰＳレイヤｂの空間分解能とは異なるならば、ＣＳＰＳレイヤａでのデコードされたピクセルは、リサンプリングされて、参照のために使用される。リサンプリングプロセスは、アップサンプリングフィルタリング又はダウンサンプリングフィルタリングを必要としてよい。

図１１は、０に等しいｌａｙｅｒ＿ｉｄを有する背景ビデオＣＳＰＳと、複数の前景ＣＳＰＳレイヤとを含むビデオストリームの例を示す。コーディングされたサブピクチャは、１つ以上のエンハンスメントＣＳＰＳレイヤ（７０４）から成ってよく、一方、如何なる前景ＣＳＰＳレイヤにも属さない背景領域は、基本レイヤ（７０２）を有してよい。基本レイヤ（７０２）は、背景領域及び前景領域を含んでよく、一方、エンハンスメントＣＳＰＳレイヤ（７０４）は、前景領域を含む。エンハンスメントＣＳＰＳレイヤ（７０４）は、同じ領域で、基本レイヤ（７０２）よりも良い視覚品質を有し得る。エンハンスメントＣＳＰＳレイヤ（７０４）は、同じ領域に対応する基本レイヤ（７０２）の動きベクトル及び再構成されたピクセルを参照してよい。

同じ又は他の実施形態において、ビデオファイルでは、基本レイヤ（７０２）に対応するビデオビットストリームは、トラックに含まれ、一方、各サブピクチャに対応するＣＳＰＳレイヤ（７０４）は、別個のトラックに含まれる。

同じ又は他の実施形態において、基本レイヤ（７０２）に対応するビデオビットストリームは、トラックに含まれ、一方、同じｌａｙｅｒ＿ｉｄを有するＣＳＰＳレイヤ（７０４）は、別個のトラックに含まれる。この例では、レイヤｋに対応するトラックは、レイヤｋに対応するＣＳＰＳレイヤのみを含む。

同じ又は他の実施形態において、各サブピクチャの各ＣＳＰＳレイヤ（７０４）は、別のトラックに格納される。各トラックは、１つ以上の他のトラックからの如何なるパージング又は復号化依存性も有しても有さなくてもよい。

同じ又は他の実施形態において、各トラックは、サブピクチャの全て又はサブセットのＣＳＰＳレイヤ（７０４）のレイヤｉからレイヤｊに対応するビットストリームを含んでよい。ここで、０＜ｉ＝＜ｊ＝＜ｋであり、ｋはＣＳＰＳの最高レイヤである。

同じ又は他の実施形態において、ピクチャは、デプスマップ、アルファマップ、３Ｄジオメトリデータ、占有マップ、などを含む１つ以上の関連するメディアデータを有するか又はそれらから成る。そのような関連する時間付き（timed）メディアデータは、夫々が１つのサブピクチャに対応する１つ又は複数のデータサブストリームに分けられ得る。

同じ又は他の実施形態において、図１２は、多層サブピクチャ方法に基づいたビデオ会議の例を示す。ビデオストリームには、背景ピクチャに対応する１つの基本レイヤビデオビットストリームと、前景サブピクチャに対応する１つ以上のエンハンスメントレイヤビデオビットストリームとが含まれる。各エンハンスメントレイヤビデオビットストリームは、ＣＳＰＳレイヤに対応してよい。ディスプレイでは、基本レイヤ（７１２）に対応するピクチャがデフォルトで表示される。基本レイヤ（７１２）は、一人以上のユーザのピクチャ・イン・ピクチャ（Picture In Picture，ＰＩＰ）を含んでよい。特定のユーザがクライアントの制御によって選択される場合に、選択されたユーザに対応するエンハンスメントＣＳＰＳレイヤ（７１４）は、強化された品質又は空間分解能でデコード及び表示される。

図１３は、実施形態の動作のための図を表す。実施形態において、デコーダは、例えば、１つの基本レイヤ及び１つ以上のエンハンスメントＣＳＰＳレイヤなどの複数のレイヤを含むビデオビットストリームをデコードしてよい（７２２）。続いて、デコーダは、背景領域及び１つ以上の前景サブピクチャを識別し（７２４）、特定のサブピクチャ領域が選択されるかどうかを決定してよい（７２６）。例えば、ユーザのＰＩＰに対応する、特定のサブピクチャ領域が選択される場合に（ＹＥＳ）、デコーダは、選択されたユーザに対応する強化されたサブピクチャをデコード及び表示してよい（７２８）。例えば、デコーダは、エンハンスメントＣＳＰＳレイヤ（７１４）に対応する画像をデコード及び表示してもよい。特定のサブピクチャ領域が選択されない場合に（ＮＯ）、デコーダは、背景領域をデコード及び表示してよい（７３０）。例えば、デコーダは、基本レイヤ（７１２）に対応する画像をデコード及び表示してよい。

同じ又は他の実施形態において、ネットワークミドルボックス（例えば、ルータ）は、そのバンド幅に応じてユーザへ送信するレイヤのサブセットを選択してもよい。ピクチャ／サブピクチャ編成は、バンド幅適応のために使用されてよい。例えば、ユーザがバンド幅を有さない場合に、ルータは、それらの重要性により又は使用されている設定に基づいてレイヤを削除するか又はいくつかのサブピクチャを選択する。実施形態において、そのようなプロセスは、バンド幅に適応するよう動的に行われてよい。

図１４は、３６０度ビデオの使用ケースの例を表す。球状の３６０度ピクチャ（７４２）が平面ピクチャに投影される場合に、投影される球状の３６０度ピクチャ（７４２）は、基本レイヤ（７４４）として複数のサブピクチャ（７４５）にパーティション化されてよい。サブピクチャ（７４５）のうちの特定の１つのエンハンスメントレイヤ（７４６）がコーディングされて、クライアントへ送信されてもよい。デコーダは、全てのサブピクチャ（７４５）を含む基本レイヤ（７４４）と、サブピクチャ（７４５）のうちの選択された１つのエンハンスメントレイヤ（７４６）との両方をデコードしてよい。現在のビューポートがサブピクチャ（７４５）のうちの選択された１つと同じである場合に、表示されているピクチャは、エンハンスメントレイヤ（７４６）を伴ったデコードされたサブピクチャ（７４５）でより高い品質を有し得る。そうでない場合には、基本レイヤ（７４４）を含むデコードされたピクチャが、より低い品質で表示され得る。

同じ又は他の実施形態において、表示のための如何なるレイアウト情報も、補足情報（例えば、ＳＥＩメッセージ又はメタデータ）としてファイルに存在してもよい。１つ以上のデコードされたサブピクチャは、シグナリングされたレイアウト情報に応じて再配置又は表示されてよい。レイアウト情報は、ストリーミングサーバ又はブロードキャスタによってシグナリングされてよく、あるいは、ネットワークエンティティ又はクラウドサーバによって再生されてもよく、あるいは、ユーザのカスタマイズされた設定によって決定されてもよい。

実施形態において、入力されたピクチャが１つ以上の（長方形の）サブ領域に分けられる場合に、各サブ領域は、独立レイヤとしてコーディングされてもよい。局所領域に対応する各独立レイヤは、一意のｌａｙｅｒ＿ｉｄ値を有してよい。各独立レイヤについて、サブピクチャサイズ及び位置情報がシグナリングされてよい。例えば、ピクチャサイズ（幅、高さ）及び左上隅のオフセット情報（ｘ＿ｏｆｆｓｅｔ、ｙ＿ｏｆｆｓｅｔ）がシグナリングされてもよい。図１５Ａは、分割されたサブピクチャ（７５２）のレイアウトの例を表し、図１５Ｂは、サブピクチャ（７５２）のうちの１つの対応するサブピクチャサイズ及び位置情報の例を表し、図１６は、対応するピクチャ予測構造を表す。サブピクチャサイズ及びサブピクチャ位置を含むレイアウト情報は、パラメータセット、スライス若しくはタイルグループのヘッダ、又はＳＥＩメッセージなどの高位シンタックス構造でシグナリングされてよい。

同じ実施形態で、独立レイヤに対応する各サブピクチャは、ＡＵ内でその一意のＰＯＣ値を有してもよい。ＤＰＢに格納されているピクチャの中の参照ピクチャがＲＰＳ又はＲＰＬ構造でシンタックス要素を使用することによって指示される場合に、レイヤに対応する各サブピクチャのＰＯＣ値が使用されてもよい。

同じ又は他の実施形態において、（インターレイヤ）予測構造を示すために、ｌａｙｅｒ＿ｉｄは使用されなくてもよく、ＰＯＣ（差分）値が使用され得る。

同じ実施形態で、レイヤ（又は局所領域）に対応するＮに等しいＰＯＣ値を有しているサブピクチャは、動き補償された予測のために、同じレイヤ（又は同じ局所領域）に対応する、Ｋ＋Ｎに等しいＰＯＣ値を有するサブピクチャの参照ピクチャとして使用されてもされなくてもよい。ほとんどの場合に、数Ｋの値は、サブ領域の数と同じであってもよい（独立）レイヤの最大数に等しくなる。

同じ又は他の実施形態において、図１７及び図１８は、図１５Ａ、１５Ｂ及び図１６の拡張された場合を表す。入力されたピクチャが複数（例えば、４つ）のサブ領域に分けられる場合に、各局所領域は、１つ以上のレイヤを有してコーディングされてよい。その場合に、独立レイヤの数はサブ領域の数に等しくてよく、１つ以上のレイヤは１つのサブ領域に対応してよい。よって、各サブ領域は、１つ以上の独立レイヤ及びゼロ個以上の従属レイヤを有してコーディングされてよい。

同じ実施形態で、図１７を参照して、入力されたピクチャは、左上サブ領域（７６２）、右上サブ領域（７６３）、左下サブ領域（７６４）、及び右下サブ領域（７６５）を含む４つのサブ領域に分けられてよい。右上サブ領域（７６３）は、レイヤ１及びレイヤ４である２つのレイヤとしてコーディングされてよく、一方、右下サブ領域（７６５）は、レイヤ３及びレイヤ５である２つのレイヤとしてコーディングされてよい。この場合に、レイヤ４は、動き補償された予測のためにレイヤ１を参照してよく、一方、レイヤ５は、動き補償のためにレイヤ３を参照してよい。

同じ又は他の実施形態において、レイヤ境界にわたるインループフィルタリング（例えば、デブロッキングフィルタリング、適応インループフィルタリング、リシェーパ（reshaper）、バイラテラルフィルタリング、又は任意のディープラーニングに基づいたフィルタリング）は、（任意に）無効にされてもよい。

同じ又は他の実施形態において、レイヤ境界にわたる動き補償された予測又はイントラブロックコピーは、（任意に）無効にされてもよい。

同じ又は他の実施形態において、サブピクチャの境界での動き補償された予測又はインループフィルタリングのための境界パディングが、任意に処理されてもよい。境界パディングが処理されるか否かを示すフラグは、パラメータセット（ＶＰＳ、ＳＰＳ、ＰＰＳ、若しくはＡＰＳ）、スライス若しくはタイルグループヘッダ、又はＳＥＩメッセージなどの高位シンタックス構造でシグナリングされてもよい。

同じ又は他の実施形態において、サブ領域（又はサブピクチャ）のレイアウト情報は、ＶＰＳ又はＳＰＳでシグナリングされてもよい。図１９Ａは、ＶＰＳ（７７０）でのシンタックス要素の例を示し、図１９Ｂは、ＳＰＳ（７８０）でのシンタックス要素の例を示す。この例では、ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇ（７７２）がＶＰＳ（７７０）でシグナリングされる。フラグは、入力されたピクチャが複数のサブ領域に分けられるか否かを示してよい。ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇ（７７２）の値が０に等しい場合に、現在のＶＰＳに対応するコーディングされたビデオシーケンス内の入力されたピクチャは、複数のサブ領域に分けられなくてもよい。この場合に、入力されたピクチャのサイズは、ＳＰＳ（６８０）でシグナリングされるコーディングされたピクチャのサイズ（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７８６）、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７８８））に等しくなる。ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇ（７７２）の値が１に等しい場合に、入力されたピクチャは、複数のサブ領域に分けられ得る。この場合に、シンタックス要素ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７７４）及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍａｐｌｅｓ（７７６）は、ＶＰＳ（７７０）でシグナリングされる。ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７７４）及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍａｐｌｅｓ（７７６）の値は、夫々、入力されたピクチャの幅及び高さに等しくなる。

同じ実施形態で、ｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７７４）及びｖｐｓ＿ｆｕｌｌ＿ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍａｐｌｅｓ（７７６）の値は、復号化のために使用されなくてもよいが、合成及び表示のために使用され得る。

同じ実施形態で、ｖｐｓ＿ｓｕｂ＿ｐｉｃｔｕｒｅ＿ｄｉｖｉｄｉｎｇ＿ｆｌａｇ（７７２）の値が１に等しい場合に、シンタックス要素ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ（７８２）及びｐｉｃ＿ｏｆｆｓｅｔ＿ｙ（７８４）は、特定のレイヤに対応するＳＰＳ（７８０）でシグナリングされてよい。この場合に、ＳＰＳ（７８０）でシグナリングされるコーディングされたピクチャのサイズ（ｐｉｃ＿ｗｉｄｔｈ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７８６）、ｐｉｃ＿ｈｅｉｇｈｔ＿ｉｎ＿ｌｕｍａ＿ｓａｍｐｌｅｓ（７８８））は、特定のレイヤに対応するサブ領域の幅及び高さに等しくなる。また、サブ領域の左上隅の位置（ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ（７８２）、ｐｉｃ＿ｏｆｆｓｅｔ＿ｙ（７８４））が、ＳＰＳ（７８０）でシグナリングされてもよい。

同じ実施形態で、サブ領域の左上隅の位置情報（ｐｉｃ＿ｏｆｆｓｅｔ＿ｘ（７８２）、ｐｉｃ＿ｏｆｆｓｅｔ＿ｙ（７８４））は、復号化のために使用されなくてもよいが、合成及び表示のために使用され得る。

同じ又は他の実施形態において、入力されたピクチャのサブ領域の全て又はサブセットのレイアウト情報（サイズ及び位置）、及びレイヤ間の依存関係情報が、パラメータセット又はＳＥＩメッセージでシグナリングされてもよい。図２０は、サブ領域のレイアウトの情報、レイヤ間の依存性、及びサブ領域と１つ以上のレイヤとの間の関係を示すシンタックス要素の例を表す。この例では、シンタックス要素ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎ（７９１）は、現在のコーディングされたビデオシーケンス内の（長方形）サブ領域の数を示す。シンタックス要素ｎｕｍ＿ｌａｙｅｒｓ（７９２）は、現在のコーディングされたビデオシーケンス内のレイヤの数を示す。ｎｕｍ＿ｌａｙｅｒｓ（７９２）の値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎ（７９１）の値以上であってよい。いずれかのサブ領域が単一のレイヤとしてコーディングされる場合に、ｎｕｍ＿ｌａｙｅｒｓ（７９２）の値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎ（７９１）の値と等しくなる。１つ以上のサブ領域が複数のレイヤとしてコーディングされる場合に、ｎｕｍ＿ｌａｙｅｒｓ（７９２）の値は、ｎｕｍ＿ｓｕｂ＿ｒｅｇｉｏｎ（７９１）の値よりも大きくなる。シンタックス要素ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］（７９３）は、ｊ番目のレイヤからｉ番目のレイヤへの依存性を示す。シンタックス要素ｎｕｍ＿ｌａｙｅｒｓ＿ｆｏｒ＿ｒｅｇｉｏｎ［ｉ］（７９４）は、ｉ番目のサブ領域に関連したレイヤの数を示す。シンタックス要素ｓｕｂ＿ｒｅｇｉｏｎ＿ｌａｙｅｒ＿ｉｄ［ｉ］［ｊ］（７９５）は、ｉ番目のサブ領域に関連したｊ番目のレイヤのｌａｙｅｒ＿ｉｄを示す。シンタックス要素ｓｕｂ＿ｒｅｇｉｏｎ＿ｏｆｆｓｅｔ＿ｘ［ｉ］（７９６）及びｓｕｂ＿ｒｅｇｉｏｎ＿ｏｆｆｓｅｔ＿ｙ［ｉ］（７９７）は、夫々、ｉ番目のサブ領域の左上隅の水平及び垂直位置を示す。シンタックス要素ｓｕｂ＿ｒｅｇｉｏｎ＿ｗｉｄｔｈ［ｉ］（７９８）及びｓｕｂ＿ｒｅｇｉｏｎ＿ｈｅｉｇｈｔ［ｉ］（７９９）は、夫々、ｉ番目のサブ領域の幅及び高さを示す。

一実施形態において、プロファイルティアレベル情報の有無によらず出力されるべき１つ以上のレイヤを示すための出力レイヤセットを定める１つ以上のシンタックス要素は、高位シンタックス構造（例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、又はＳＥＩメッセージ）でシグナリングされてよい。図２１を参照すると、ＶＰＳを参照するコーディングされたビデオシーケンスにおける出力レイヤセット（Output Layer Set，ＯＬＳ）の数を示すシンタックス要素ｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓ（８０４）は、ＶＰＳでシグナリングされてよい。各出力レイヤセットについて、シンタックス要素ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ（８１０）は、出力レイヤの数と同じ回数だけシグナリングされてよい。

同じ実施形態で、１に等しいシンタックス要素ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ（８１０）は、ｉ番目のレイヤが出力されることを示す。０に等しいシンタックス要素ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ（８１０）は、ｉ番目のレイヤが出力されないことを示す。

同じ又は他の実施形態において、各出力レイヤセットについてプロファイルティアレベル情報を定める１つ以上のシンタックス要素は、高位シンタックス構造（例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、又はＳＥＩメッセージ）でシグナリングされてよい。依然として図２１を参照すると、ＶＰＳを参照するコーディングされたビデオシーケンスにおけるＯＬＳごとのプロファイルティアレベル情報の数を示すシンタックス要素ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（８０６）は、ＶＰＳでシグナリングされてよい。各出力レイヤセットについて、プロファイルティアレベル情報のためのシンタックス要素の組又はプロファイルティアレベル情報内のエントリの中で特定のプロファイルティアレベル情報を示すインデックスは、出力レイヤの数と同じ回数だけシグナリングされてよい。

同じ実施形態で、シンタックス要素ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｉｄｘ［ｉ］［ｊ］（８１２）は、ｉ番目のＯＬＳのｊ番目のレイヤに適用するｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）（８０８）シンタックス構造の、ＶＰＳでのｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）（８０８）シンタックス構造内へのインデックスを指定する。

プロファイル、ティア、及びレベル（並びにそれらの対応する情報）は、ビットストリームに対する制限、よって、ビットストリームをデコードするために必要とされる能力の限界を指定してよい。プロファイル、ティア、及びレベル（並びにそれらの対応する情報）はまた、個別的なデコーダ実装間の相互運用性ポイントを示すためにも使用されてよい。プロファイルは、例えば、標準の、ビットストリームシンタックス全体のサブセットであってよい。各プロファイル（及びその対応する情報）は、プロファイルに従う全てのデコーダによってサポートされ得るアルゴリズム機能及び制限のサブセットを指定してよい。ティア（tiers）及びレベルは、各プロファイルで指定されてよく、ティアのレベルは、ビットストリーム内のシンタックス要素の値に課された特定の制約の組であってよい。ティアの各レベル（及びその対応する情報）は、本開示のシンタックス要素が取る可能性がある値に対する制限及び／又は値の算術組み合わせに対する制限の組を指定してよい。ティア及びレベル定義の同じ組は、全てのプロファイルにより使用されてよいが、個々の実装は、サポートされているプロファイルごとに異なるティアを、そして、１つのティア内では、異なるレベルをサポートしてもよい。いずれかの所与のプロファイルについては、ティアのレベルは、特定のデコーダ処理負荷及びメモリ容量に対応してよい。より低いティアに対して指定されたレベルは、より高いティアに対して指定されたレベルよりも制約されてもよい。

同じ又は他の実施形態において、図２２を参照すると、シンタックス要素ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｌｅ＿ｌｅｖｅｌ（８０６）及び／又はｎｕｍ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔｓ（８０４）は、最大レイヤ数が１よりも多い（ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＞０）場合にシグナリングされてよい。

同じ又は他の実施形態において、図２２を参照すると、ｉ番目の出力レイヤセットについての出力レイヤシグナリングのモードを示すシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］（８２２）が、ＶＰＳに存在してもよい。

同じ実施形態で、０に等しいシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］（８２２）は、最高レイヤのみがｉ番目の出力レイヤセットにより出力されることを示す。１に等しいシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］（８２２）は、全てのレイヤがｉ番目の出力レイヤセットにより出力されることを示す。２に等しいシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］（８２２）は、ｉ番目の出力レイヤセットにより出力されるレイヤが、１に等しいｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］を有するレイヤであることを示す。より多くの値がリザーブされてもよい。

同じ実施形態で、シンタックス要素ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］（８１０）は、ｉ番目の出力レイヤセットについてのシンタックス要素ｖｐｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒｓ＿ｍｏｄｅ［ｉ］（８２２）の値に応じて、シグナリングされてもされなくてもよい。

同じ又は他の実施形態において、図２２を参照すると、フラグｖｐｓ＿ｐｔｌ＿ｆｌａｇ［ｉ］（８２４）が、ｉ番目の出力レイヤセットについて存在してもよい。ｖｐｓ＿ｐｔｌ＿ｆｌａｇ［ｉ］（８２４）の値に応じて、ｉ番目の出力レイヤセットのプロファイルティアレベル情報は、シグナリングされてもされなくてもよい。

同じ又は他の実施形態において、図２３を参照すると、現在のＣＶＳでのサブピクチャの数ｍａｘ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１は、高位シンタックス構造（例えば、ＶＰＳ、ＤＰＳ、ＳＰＳ、ＰＰＳ、ＡＰＳ、又はＳＥＩメッセージ）でシグナリングされてもよい。

同じ実施形態で、図２３を参照すると、ｉ番目のサブピクチャのサブピクチャ識別子ｓｕｂ＿ｐｉｃ＿ｉｄ［ｉ］（８２１）は、サブピクチャの数が１よりも多い（ｍａｘ＿ｓｕｂｐｉｃｓ＿ｍｉｎｕｓ１＞０）場合にシグナリングされてよい。

同じ又は他の実施形態において、各出力レイヤセットの各レイヤに属するサブピクチャ識別子を示す１つ以上のシンタックス要素は、ＶＰＳでシグナリングされてもよい。図２３を参照すると、識別子ｓｕｂ＿ｐｉｃ＿ｉｄ＿ｌａｙｅｒ［ｉ］［ｊ］［ｋ］（８２６）は、ｉ番目の出力レイヤセットのｊ番目のレイヤに存在するｋ番目のサブピクチャを示す。識別子ｓｕｂ＿ｐｉｃ＿ｉｄ＿ｌａｙｅｒ［ｉ］［ｊ］［ｋ］（８２６）の情報を使用することによって、デコーダは、特定の出力レイヤセットの各レイヤについて、どのサブピクチャがデコードされ出力され得るかを認識し得る。

実施形態において、デコードされるべき対象ＯＬＳのＯＬＳインデックスを識別する変数ＴａｒｇｅｔＯｌｓＩｄｘ、及びデコードされるべき最高時間サブレイヤを識別する変数Ｈｔｉｄは、いくつかの外部手段によってセットされる。ビットストリームＢｉｔｓｔｒｅａｍＴｏＤｅｃｏｄｅは、対象ＯＬＳに含まれているレイヤ以外の如何なるレイヤも含まなくてもよく、Ｈｔｉｄよりも大きいＴｅｍｐｒａｌＩＤを有する如何なるＮＡＬユニットも含まなくてもよい。

同じ又は他の実施形態において、１に等しいｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ（８６４）が２に等しい場合に、ｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤがｉ番目のＯＬＳの出力レイヤであることを示す。０に等しいｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃが２に等しい場合に、ｐｓ＿ｌａｙｅｒ＿ｉｄ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤがｉ番目のＯＬＳの出力レイヤでないことを示す。シンタックス要素ｎｕｈ＿ｌａｙｅｒ＿ｉｄは、非ビデオコーディングレイヤ（ＶＣＬ）ＮＡＬユニットが属するレイヤの識別子、又は非ＶＣＬＮＡＬユニットが適用されるレイヤの識別子を指定してよい。ｎｕｈ＿ｌａｙｅｒ＿ｉｄの値は、コーディングされたピクチャの全てのＶＣＬＮＡＬユニットについて同じであってもよい。コーディングされたピクチャ又はピクチャユニット（ＰＵ）のｎｕｈ＿ｌａｙｅｒ＿ｉｄの値は、コーディングされたピクチャ又はＰＵのＶＣＬＮＡＬユニットのｎｕｈ＿ｌａｙｅｒ＿ｉｄの値であってもよい。シンタックス要素ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅの値は、コーディングビデオシーケンス開始（Coded Video Sequence Start）ＡＵの全てのピクチャについて同じであってもよい。

ｉ番目のＯＬＳの中の出力レイヤの数を指定する変数ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］、ｉ番目のＯＬＳの中のｊ番目のレイヤ内のサブレイヤの数を指定する変数ＮｕｍＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＩｎＯＬＳ［ｉ］［ｊ］、ｉ番目のＯＬＳの中のｊ番目の出力レイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する変数ＯｕｔｐｕｔＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］、及びｋ番目のレイヤが少なくとも１つのＯＬＳで出力レイヤとして使用されるかどうかを指定する変数ＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｋ］は、次のように導出されてよい：

０以上ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＞０以下の範囲内のｉの各値について、ＬａｙｅｒＵｓｅｄＡｓＲｅｆＬａｙｅｒＦｌａｇ［ｉ］及びＬａｙｅｒＵｓｅｄＡｓＯｕｔｐｕｔＬａｙｅｒＦｌａｇ［ｉ］の値は、両方とも０に等しくなくもよい。すなわち、少なくとも１つのＯＬＳの出力レイヤでも、いずれかの他のレイヤの直接参照レイヤでもないレイヤは存在しなくてもよい。

各ＯＬＳについて、出力レイヤである少なくとも１つのレイヤが存在してもよい。すなわち、０以上ＴｏｔａｌＮｕｍＯｌｓｓ－１以下の範囲内のｉの各値について、ＮｕｍＯｕｔｐｕｔＬａｙｅｒｓＩｎＯｌｓ［ｉ］の値は１以上であってよい。

ｉ番目のＯＬＳ内のレイヤの数を指定する変数ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］、及びｉ番目のＯＬＳの中のｊ番目のレイヤのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指定する変数ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］は、次のように導出されてよい：

０番目のＯＬＳは、最下レイヤ（すなわち、ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［０］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤ）しか含まなくてもよく、０番目のＯＬＳについて、唯一の含まれているレイヤは出力であってよい。

ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのＯＬＳレイヤインデックスを指定する変数ＯｌｓＬａｙｅｒＩｄｘ［ｉ］［ｊ］は、次のように導出される：

各ＯＬＳにおける最下レイヤは、独立レイヤであってよい。すなわち、０以上ＴｏｔａｌＮｕｍＯｌｓｓ－１以下の範囲内の各ｉについて、ｖｐｓ＿ｉｎｄｅｐｅｎｄｅｎｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ＬａｙｅｒＩｄｉｎＯｌｓ［ｉ］［０］］］の値は１に等しくなる。

各レイヤは、ＶＰＳによって指定された少なくとも１つのＯＬＳに含まれてよい。すなわち、ｎｕｈ＿ｌａｙｅｒ＿ｉｄの特定の値、つまり、０以上ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１以下の範囲内のｋについてのｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｋ］の１つに等しいｎｕｈＬａｙｅｒＩｄ、を有する各レイヤについて、ｉ及びｊの値の少なくとも一対が存在してよい。ここで、ｉは、０以上ＴｏｔａｌＮｕｍＯｌｓｓ－１以下の範囲内にあり、ｊは、０以上ＮｕｍＬａｙｅｒｓＩｎＯｌｓ［ｉ］－１以下の範囲内にある。それにより、ＬａｙｅｒＩｄＩｎＯｌｓ［ｉ］［ｊ］の値は、ｎｕｈＬａｙｅｒＩｄに等しい。

０に等しいシンタックス要素ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ（８６４）は、ＶＰＳによって指定されたＯＬＳの総数がｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１に等しく、ｉ番目のＯＬＳが０以上ｉ以下のレイヤインデックスを有するレイヤを含み、各ＯＬＳについて、ＯＬＳ内の最高レイヤのみが出力される、ことを指定してもよい。

１に等しいシンタックス要素ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ（８６４）は、ＶＰＳによって指定されたＯＬＳの総数がｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１に等しく、ｉ番目のＯＬＳが０以上ｉ以下のレイヤインデックスを有するレイヤを含み、各ＯＬＳについて、ＯＬＳ内の全てのレイヤが出力される、ことを指定してもよい。

２に等しいシンタックス要素ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ（８６４）は、ＶＰＳによって指定されたＯＬＳの総数が明示的にシグナリングされ、各ＯＬＳについて、出力レイヤは明示的にシグナリングされ、他のレイヤは、そのＯＬＳの出力レイヤの直接又は間接参照レイヤであるレイヤである、ことを指定してもよい。

シンタックス要素ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ（８６４）の値は、０以上２以下の範囲内であってよい。シンタックス要素ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ（８６４）の値３は、ＩＴＵ｜ＩＳＯ／ＩＥＣによる将来の使用のためにリザーブされてもよい。

同じ又は他の実施形態において、復号化プロセスは、以下で説明されるように実行されてよい。

Bross, et. al，“Versatile Video Coding (Draft 8)”，Joint Video Experts Team document JVET-Q2001-vA，２０２０年１月７～１７日は、その全文を本願に援用され、以降、「文献１」と呼ばれる。

復号化プロセスは、ビットストリームＢｉｔｓｔｒｅａｍＴｏＤｅｃｏｄｅ内の各コーディングされたピクチャに適用されてよい。各コーディングされたピクチャは、現在のピクチャと呼ばれ、変数ＣｕｒｒＰｉｃによって表記される。ビットストリームＢｉｔｓｔｒｅａｍＴｏＤｅｃｏｄｅは、復号化プロセスへ入力されてよい。

シンタックス要素ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃがエンコーダ又はデコーダによって出力され得る。シンタックス要素ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃは、ルーマサンプリングに対してクロマサンプリングを指定してよい。シンタックス要素ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃの値に応じて、現在のピクチャのサンプルアレイの数は、次のように（例えば、デコーダによって）決定され得る。

（Ａ）シンタックス要素ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃが０に等しい場合には、現在のピクチャは、１つのサンプルアレイＳ_Ｌから成る。

（Ｂ）そうでない（ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃが０に等しくない）場合には、現在のピクチャは、３つのサンプルアレイＳ_Ｌ、Ｓ_Ｃｂ、Ｓ_Ｃｒから成る。

現在のピクチャに対する復号化プロセスは、入力として、文献１の第７節からのシンタックス要素及び大文字の変数を取ってよい。各ＮＡＬユニット内の各シンタックス要素のセマンティクスを解釈する場合に、及び文献１の第８節の残りの部分では、「ビットストリーム」という用語（又はその部分、例えば、ビットストリームのＣＶＳ）は、ＢｉｔｓｔｒｅａｍＴｏＤｅｃｏｄｅ（又はその部分）を指す。

シンタックス要素ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇは、ピクチャが別個のカラープレーンを用いてコーディングされるかどうかを示してよい。例えば、シンタックス要素ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇが１に等しい場合に、そのシンタックス要素は、ピクチャが３つの別個のカラープレーンを用いてコーディングされることを示してよい。ピクチャが３つの別個のカラープレーンを用いてコーディングされる場合に、スライスは、ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｉｄの対応する値によって識別されている１つの色成分のコーディングツリーユニット（Coding Tree Units，ＣＴＵ）しか含まなくてもよく、ピクチャの各色成分アレイは、同じｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄ値を有するスライスから成ってよい。ピクチャ内の、異なる値のｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有するコーディングされたスライスは、ｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄの各値について、その値のｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有するコーディングされたスライスＮＡＬユニットが、各コーディングされたスライスＮＡＬユニットの最初のＣＴＵについて、タイルスキャン順序において、ＣＵＴアドレスが増加する順序にあってよい、という制約の下で互いにインターリーブされてよい。シンタックス要素ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇが１に等しい場合には、色成分の各ＣＴＵが厳密に１つのスライスに含まれ得る（すなわち、ピクチャの各ＣＴＵの情報は、厳密に３つのスライスに存在し、それら３つのスライスは、異なる値のｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有する）。シンタックス要素ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇが０に等しい場合には、ピクチャの各ＣＴＵが厳密に１つのスライスに含まれ得る。

シンタックス要素ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇの値に応じて、復号化プロセスは、次のように構造化されてよい。

（Ａ）ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇが０に等しい場合に、復号化プロセスは１回呼び出され、現在のピクチャが出力され得る。

（Ｂ）そうでない（ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇが１に等しい）場合に、復号化プロセスは３回呼び出され得る。復号化プロセスへの入力は、同じ値のｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有するコーディングされたピクチャの全てのＮＡＬユニットである。特定の値のｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有するＮＡＬユニットの復号化プロセスは、あたかもその特定の値のｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有するモノクロカラーフォーマットによるＣＶＳしかビットストリームに存在しないかのように、指定されてよい。３回の復号化プロセスの夫々の出力は、現在のピクチャの３つのサンプルアレイのうちの１つへ割り当てられてよく、０、１及び２に等しいｃｏｌｏｒ＿ｐｌａｎｅ＿ｉｄを有するＮＡＬユニットは、夫々、Ｓ_Ｌ、Ｓ_Ｃｂ、及びＳ_Ｃｒに割り当てられる。

変数ＣｈｒｏｍａＡｒｒａｙＴｙｐｅは、シンタックス要素ｓｅｐａｒａｔｅ＿ｃｏｌｏｕｒ＿ｐｌａｎｅ＿ｆｌａｇが１に等しく、ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃが３に等しい場合に、０に等しいと導出され得る。復号化プロセスで、変数ＣｈｒｏｍａＡｒｒａｙＴｙｐｅの値は評価されてよく、これは、（ｃｈｒｏｍａ＿ｆｏｒｍａｔ＿ｉｄｃが０に等しい場合に）モノクロピクチャのそれと同じ動作をもたらし得る。

復号化プロセスは、現在のピクチャＣｕｒｒＰｉｃに対して次のように作動してよい。

（Ａ）ＮＡＬユニットの復号化は、文献１の第８．２節に従って実行されてよい。例えば、復号化の入力は、現在のピクチャのＮＡＬユニット及びそれらの関連する非ＶＣＬＮＡＬユニットであってよい。復号化の出力は、ＮＡＬユニット内にカプセル化されたパースされたローバイトシーケンスペイロード（Raw Byte Sequence Payload，ＲＢＳＰ）シンタックス構造であってよい。各ＮＡＬユニットに対する復号化は、ＮＡＬユニットからＲＢＳＰシンタックス構造を抽出し、次いで、ＲＢＳＰシンタックス構造をパースしてよい。

（Ｂ）スライスヘッダレイヤ及びその上にあるシンタックス要素を使用する復号化プロセスは、例えば、文献１の第８．３節に従って、実行されてよい。

（１）ピクチャ・オーダー・カウントに関する変数及び関数が、文献１の第８．３．１節に従って導出され得る。これは、ピクチャの最初のスライスについてしか呼び出されなくてもよい。

（２）非ＩＤＲピクチャの各スライスに対する復号化プロセスの開始時に、参照ピクチャリスト構成のための復号化プロセスが、文献１の第８．３．２節に従って、参照ピクチャリスト０（ＲｅｆＰｉｃＬｉｓｔ［０］）及び参照ピクチャリスト１（ＲｅｆＰｉｃＬｉｓｔ［１］）の導出のために呼び出され得る。

（３）参照ピクチャマーキングのための復号化プロセスが、文献１の第８．３．３節に従って実行されてよく、参照ピクチャは、「参照用に使用されず」又は「長期参照用の使用」とマークされてよい。参照ピクチャマーキングのための復号化プロセスは、ピクチャの最初のスライスについてしか呼び出されてなくもよい。

（４）現在のピクチャが、１に等しいＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇを有するＣＲＡピクチャ、又は１に等しいＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇを有するＧＤＲピクチャである場合に、文献１の第８．３．４節に従って利用不可能な参照ピクチャを生成するための復号化プロセスが呼び出されてよく、これは、ピクチャの最初のスライスについてしか呼び出されてなくもよい。

（５）ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、次のように（例えば、デコーダによって）セットされ得る。

次の条件のうちの１つが真であると決定される場合に、現在のピクチャのＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ピクチャが「出力に不要」とマークされて出力されないように、０に等しくセットされてよい。

（ａ）現在のピクチャはＲＡＳＬピクチャで有り、関連するＩＲＡＰピクチャのシンタックス要素ＮｏＯｕｔｐｕｔは１に等しい。

（ｂ）シンタックス要素ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇは１に等しく、現在のピクチャは、１に等しいＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇを有するＧＤＲピクチャである。

（ｃ）シンタックス要素ｇｄｒ＿ｅｎａｂｌｅｄ＿ｆｌａｇは１に等しく、現在のピクチャは、１に等しいＮｏＯｕｔｐｕｔＢｅｆｏｒｅＲｅｃｏｖｅｒｙＦｌａｇを有するＧＤＲピクチャに関連し、現在のピクチャのＰｉｃＯｒｄｅｒＣｎｔＶａｌは、関連するＧＤＲピクチャのＲｐＰｉｃＯｒｄｅｒＣｎｔＶａｌよりも小さい。

（ｄ）シンタックス要素ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは０よりも大きく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃは０に等しく、現在のＡＵは、次の条件：ＰｉｃＡが１に等しいＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇを有する；ＰｉｃＡが現在のピクチャよりも大きいｎｕｈ＿ｌａｙｅｒ＿ｉｄｎｕｈＬｉｄを有する；及び、ＰｉｃＡが出力レイヤに属する、の全てを満足するピクチャｐｉｃＡを含む（例えば、ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＴａｒｇｅｔＯｌｓＩｄｘ］［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］が１に等しい）。

（ｅ）シンタックス要素ｓｐｓ＿ｖｉｄｅｏ＿ｐａｒａｍｅｔｅｒ＿ｓｅｔ＿ｉｄは０よりも大きく、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃは２に等しく、シンタックス要素ｏｌｓ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ＴａｒｇｅｔＯｌｓＩｄｘ］［ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］は０に等しい。

そうでない場合には、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇは、ｐｉｃ＿ｏｕｔｐｕｔ＿ｆｌａｇに等しくセットされる。

復号化プロセスは、文献１の第８．４節、第８．５節、第８．６節、第８．７節、及び第８．８節に従って、全てのシンタックス構造レイヤ内のシンタックス要素を用いて実行されてよい。例えば、イントラ予測モード、インター予測モード、及びＩＢＣ予測モードでコーディングされているコーディングユニットに対する復号化プロセスが実行されてよく、スケーリング、変換、及びアレイプロセスが実行されてよく、インループフィルタプロセスが実行されてよい。スライスへのピクチャの分割及びＣＴＵへのスライスの分割が夫々ピクチャのパーティショニングを形成するように、ピクチャのコーディングされたスライスがピクチャのＣＴＵごとにスライスデータを含むべきであることは、ビットストリーム適合（bitstream conformance）の要件であってよい。

現在のピクチャの全てのスライスがデコードされた後、現在のデコードされたピクチャは、「短期参照用の使用」とマークされてよく、ＲｅｆＰｉｃＬｉｓｔ［０］又はＲｅｆＰｉｃＬｉｓｔ［１］内の各ＩＬＲＰエントリは、「短期参照用の使用」とマークされてよい。

ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのレイヤインデックスを指定する変数ＧｅｎｅｒａｌＬａｙｅｒＩｄｘ［ｉ］は、次のように導出されてよい：

１つ以上の実施形態に従って、ＮＡＬユニット及びその中のシンタックス要素（例えば、本開示で説明されるもの）は、コーディングされたビデオストリームからビデオデータをデコードするために、本開示のデコーダによって受け取られてよい。本開示のデコーダは、コーディングされたビデオストリームからビデオデータをデコードしてよい。例えば、図２４を参照して、デコーダ（８８０）は、デコーダ（８８０）の少なくとも１つのプロセッサにビデオデータをデコードさせるよう構成された復号化コード（８８５）を有してよい。実施形態に従って、復号化コード（８８５）は、少なくとも１つのプロセッサに、出力レイヤセットシグナリングのモード（例えば、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝０又はｏｌｓ＿ｍｏｄｅ＿ｉｄｃ＝２）を示すシンタックス要素（例えば、ｏｌｓ＿ｍｏｄｅ＿ｉｄｃ）に基づいて、コーディングされたビデオストリームの第１ピクチャが出力されるべきかどうか（例えば、ＰｉｃｔｕｒｅＯｕｔｐｕｔＦｌａｇ＝０又は１）を決定させるよう構成された決定コード（８８７）を有してよい。代替的に、又は追加的に、決定コード（８８７）は、少なくとも１つのプロセッサに、本開示で説明されている他の条件に基づいて、コーディングされたビデオストリームの第１ピクチャが出力されるべきかどうかを決定させるよう構成されてもよい。

上記の技術は、コンピュータ読み出し可能な命令を使用しかつ１つ以上のコンピュータ可読媒体に物理的に記憶されているコンピュータソフトウェアとして実装可能である。例えば、図２５は、開示されている対象の特定の実施形態を実装することに適したコンピュータシステム（９００）を示す。

コンピュータソフトウェアは、１つ以上の中央演算処理装置（ＣＰＵ）、グラフィクス処理ユニット（ＧＰＵ）などによって直接に又は解釈、マイクロコード実行などを通じて実行され得る命令を含むコードを生成するようにアセンブリ、コンパイル、リンキングなどのメカニズムに従い得る如何なる適切な機械コード又はコンピュータ言語によってもコーディング可能である。

命令は、例えば、パーソナルコンピュータ、タブレットコンピュータ、サーバ、スマートフォン、ゲーム機、モノのインターネット（Internet of Things）のためのデバイス、などを含む様々なタイプのコンピュータ又はその構成要素で実行可能である。

コンピュータシステム（９００）に関して図２５に示される構成要素は、本質的に例示であり、本開示の実施形態を実装するコンピュータソフトウェアの使用又は機能の範囲に関して如何なる制限も示唆することを意図しない。構成要素の構成は、コンピュータシステム（９００）の例となる実施形態において説明される構成要素のうちのいずれか１つ又は組み合わせに関して何らかの依存又は要件も有するものとして解釈されるべきではない。

コンピュータシステム（９００）は、特定のヒューマンインターフェース入力デバイスを含んでよい。そのようなヒューマンインターフェース入力デバイスは、例えば、触覚入力（例えば、キーボード、スワイプ、データグローブ操作）、音声入力（例えば、声、拍手）、視覚入力（例えば、ジェスチャ）、嗅覚入力（図示せず。）を通じた一人以上のユーザによる入力に反応してよい。ヒューマンインターフェースデバイスはまた、音声（例えば、発話、音楽、周囲音）、画像（例えば、スキャンされた画像、静止画カメラから取得された写真画像）、映像（例えば、二次元映像、立体視映像を含む三次元映像）など、人による意識的な入力に必ずしも直接には関係しない特定のメディアを捕捉するためにも使用され得る。

入力ヒューマンインターフェースデバイスは、キーボード（９０１）、マウス（９０２）、トラックパッド（９０３）、タッチスクリーン（９１０）、データグローブ、ジョイスティック（９０５）、マイク（９０６）、スキャナ（９０７）、及びカメラ（９０８）のうちの１つ以上（夫々表されているもののうちの１つのみ）を含んでよい。

コンピュータシステム（９００）は、特定のヒューマンインターフェース出力デバイスも含んでよい。そのようなヒューマンインターフェース出力デバイスは、例えば、触覚出力、音響、光、及び匂い／味を通じて一人以上のユーザの感覚を刺激し得る。そのようなヒューマンインターフェース出力デバイスは、触覚出力デバイス（例えば、タッチスクリーン（９１０）、データグローブ、又はジョイスティック（９０５）による触覚フィードバック、しかし、入力デバイスとして機能しない触覚フィードバックデバイスも存在し得る。）を含んでよい。例えば、そのようなデバイスは、音声出力デバイス（例えば、スピーカ（９０９）、ヘッドホン（図示せず。））、視覚出力デバイス（例えば、夫々タッチスクリーン入力機能の有無によらず、夫々触覚フィードバック機能の有無によらず、ＣＲＴスクリーン、ＬＣＤスクリーン、プラズマスクリーン、ＯＬＥＤスクリーンを含み、それらのうちのいくつかは、立体視出力、仮想現実メガネ（図示せず。）、ホログラフィックディスプレイ及びスモークタンク（図示せず。）などの手段により二次元視覚出力又は三次元よりも多い次元の出力を出力可能なスクリーン（９１０））、及びプリンタ（図示せず。）であってもよい。

コンピュータシステム（９００）は、人がアクセス可能な記憶デバイス及びそれらの関連する媒体、例えば、ＣＤ／ＤＶＤ又は同様の媒体（９２１）を伴ったＣＤ／ＤＶＤＲＯＭ／ＲＷ（９２０）、サムドライブ（９２２）、リムーバブルハードディスク又はソリッドステートドライブ（９２３）、レガシー磁気媒体、例えば、テープ及びフロッピー（登録商標）ディスク（図示せず。）、専用のＲＯＭ／ＡＳＩＣ／ＰＬＤベースデバイス、例えば、セキュリティドングル（図示せず。）、なども含むことができる。

当業者であれば、目下開示されている対象に関連して使用されている「コンピュータ可読媒体」という用語が、伝送媒体、搬送波、又は他の一時的な信号を含まないことも理解するはずである。

コンピュータシステム（９００）はまた、１つ以上の通信ネットワークへのインターフェースも含むことができる。ネットワークは、例えば、ワイヤレス、ワイヤライン、光であることができる。ネットワークは更に、ローカル、ワイドエリア、メトロポリタン、車両及び工業、実時間、遅延耐性、などであることができる。ネットワークの例には、イーサネット（登録商標）などのローカルエリアネットワーク、ワイヤレスＬＡＮ、ＧＳＭ、３Ｇ、４Ｇ、５Ｇ、ＬＴＥなどを含むセルラーネットワーク、ケーブルＴＶ、衛星ＴＶ、及び地上放送ＴＶを含むＴＶワイヤライン又はワイヤレス広域デジタルネットワーク、ＣＡＮバスを含む車両及び工場ネットワーク、などがある。特定のネットワークは、一般に、特定の汎用デジタルポート又はペリフェラルバス（９４９）（例えば、コンピュータシステム（９００）のＵＳＢポートなど）に取り付けられた外付けネットワークインターフェースアダプタを必要とする。他は、一般に、後述されるようなシステムバスへの取り付け（例えば、ＰＣコンピュータシステムへのイーサネットネットワーク、又はスマートフォンコンピュータシステムへのセルラーネットワークインターフェース）によってコンピュータシステム（９００）のコアに組み込まれる。これらのネットワークのいずれかを使用して、コンピュータシステム（９００）は他のエンティティと通信することができる。そのような通信は、単方向の受信専用（例えば、ブロードキャストＴＶ）又は単方向の送信専用（例えば、特定のＣＡＮバスデバイスへのＣＡＮバス）であることができ、あるいは、例えば、ローカル若しくは広域デジタルネットワークを使用して他のコンピュータシステムに対して双方向であることができる。そのような通信は、クラウドコンピューティング環境（９５５）への通信を含むことができる。特定のプロトコル又はプロトコルスタックが、上述されたようなネットワーク及びネットワークインターフェースの夫々で使用可能である。

上記のヒューマンインターフェースデバイス、人がアクセス可能な記憶デバイス、及びネットワークインターフェース（９５４）は、コンピュータシステム（９００）のコア（９４０）へ取り付けられ得る。

コア（９４０）は、１つ以上の中央演算処理装置（ＣＰＵ）（９４１）、グラフィクス処理ユニット（ＧＰＵ）（９４２）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）（９４３）の形をとる専用のプログラム可能処理ユニット、特定のタスクのためのハードウェアアクセラレータ（９４４）、などを含むことができる。これらのデバイスは、リードオンリーメモリ（ＲＯＭ）（９４５）、ランダムアクセスメモリ（ＲＡＭ）（９４６）、内部のユーザアクセス不能ハードドライブなどの内蔵大容量記憶装置、ＳＳＤ、など（９４７）とともに、システムバス（９４８）を通じて接続されてよい。いくつかのコンピュータシステムでは、システムバス（９４８）は、追加のＣＰＵ、ＧＰＵなどによる拡張を可能にするように、１つ以上の物理プラグの形でアクセス可能であることができる。コアのシステムバス（２２４８）へ直接に又はペリフェラルバス（９４９）を通じて、周辺機器が取り付けられ得る。ペリフェラルバスのためのアーキテクチャには、ＰＣＩ、ＵＳＢなどがある。グラフィクスアダプタ（９５０）は、コア（９４０）に含まれてもよい。

ＣＰＵ（９４１）、ＧＰＵ（９４２）、ＦＰＧＡ（９４３）、及びアクセラレータ（９４４）は、組み合わせて上記のコンピュータコードを構成することができる特定の命令を実行可能である。そのコンピュータコードは、ＲＯＭ（９４５）又はＲＡＭ（９４６）に記憶され得る。一時データもＲＡＭ（９４６）に記憶可能であり、一方、永続性データは、例えば、内蔵大容量記憶装置（９４７）に記憶可能である。メモリデバイスのいずれかへの高速な格納及び読み出しは、キャッシュメモリの使用により可能にされ得る。キャッシュメモリは、１つ以上のＣＰＵ（９４１）、ＧＰＵ（９４２）、大容量記憶装置（９４７）、ＲＯＭ（９４５）、ＲＡＭ（９４６）などと密接に関連し得る。

コンピュータ可読媒体は、様々なコンピュータ実装動作を実行するためのコンピュータコードを有することができる。媒体及びコンピュータコードは、本開示の目的のために特別に設計及び構成されたものであることができ、あるいは、それらは、コンピュータソフトウェア技術で通常の知識を有する者によく知られており利用可能である種類のものであることができる。

例として、限定としてではなく、アーキテクチャ（９００）、具体的にはコア（９４０）を有するコンピュータシステムは、１つ以上の有形なコンピュータ可読媒体において具現されているソフトウェアを実行するプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡ、アクセラレータ、などを含む。）の結果として機能を提供することができる。そのようなコンピュータ可読媒体は、コア内蔵大容量記憶装置（９４７）又はＲＯＭ（９４５）などの、非一時的な性質であるコア（９４０）の特定の記憶装置に加えて、先に紹介されたユーザアクセス可能な大容量記憶装置に関連した媒体であることができる。本開示の様々な実施形態を実装するソフトウェアは、そのようなデバイスに記憶され、コア（９４０）によって実行可能である。コンピュータ可読媒体には、特定のニーズに応じて、１つ以上のメモリデバイス又はチップが含まれ得る。ソフトウェアは、コア（９４０）、及び、具体的には、その中のプロセッサ（ＣＰＵ、ＧＰＵ、ＦＰＧＡなどを含む。）に、ＲＡＭ（９４６）に記憶されているデータ構造を定義し、ソフトウェアによって定義されたプロセスに従ってそのようなデータ構造を変更することを含め、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行させることができる。追加的に、又は代替案として、コンピュータシステムは、本明細書で説明されている特定のプロセス又は特定のプロセスの特定の部分を実行するようにソフトウェアの代わりに又はそれとともに動作することができる、回路内でハードウェアにより実現されるか又は別なふうに具現されるロジックの結果として、機能を提供することができる。ソフトウェアへの言及は、必要に応じて、ロジックを包含することができ、その逆も同様である。コンピュータ可読媒体への言及は、必要に応じて、実行のためのソフトウェアを記憶している回路（例えば、集積回路（ＩＣ））、実行のためのロジックを具現する回路、又は両方を包含することができる。本開示は、ハードウェア及びソフトウェアの如何なる適切な組み合わせも包含する。

本開示は、いくつかの例となる実施形態について記載してきたが、本開示の範囲内にある代替、交換、及び様々な置換均等物が存在する。よって、明らかなように、当業者であれば、たとえ本明細書で明示的に図示又は説明されていないとしても、本開示の原理を具現し、よって、その精神及び範囲の中にある多数のシステム及び方法に想到可能である。

Claims

少なくとも１つのプロセッサによって実行される方法であって、
複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームを受け取るステップと、
前記コーディングされたビデオストリームの前記ビデオデータをデコードするステップと
を有し、
前記デコードするステップは、
出力レイヤセットシグナリングのモードを示すシンタックス要素に基づいて、前記コーディングされたビデオストリームの第１ピクチャが出力されるべきであるかどうかを決定するステップを有する、
方法。
前記決定するステップは、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素に基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを有し、
前記モードは、パラメータセットによって指定されている出力レイヤセットの総数が、前記パラメータセットを参照する前記コーディングされたビデオストリームの各コーディングされたビデオシーケンスにおけるレイヤの最大許容数に等しく、前記出力レイヤセットの中のｉ番目の出力レイヤセットが、０以上ｉ以下のレイヤインデックスを有するレイヤを含み、前記出力レイヤセットの中の各出力レイヤセットについて、当該出力レイヤセットの中の最も高いレイヤのみが出力されるべきである、ことを含む、
請求項１に記載の方法。
前記シンタックス要素は、前記出力レイヤセットシグナリングの前記モードを示すよう０の値を有する、
請求項２に記載の方法。
前記パラメータセットは、ビデオパラメータセットである、
請求項２又は３に記載の方法。
前記決定するステップは、
前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素と、
出力されることを示されている、前記第１ピクチャと同じアクセスユニットに属する第２ピクチャと、
前記第１ピクチャよりも高いレイヤに属する前記第２ピクチャと、
出力レイヤに属する前記第２ピクチャと
に基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを有する、
請求項２乃至４のうちいずれか一項に記載の方法。
前記決定するステップは、前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素に基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを有し、
前記モードは、パラメータセットによって指定されている出力レイヤセットの総数が明示的にシグナリングされ、前記パラメータセットによって指定されている前記出力レイヤセットの出力レイヤが明示的にシグナリングされ、前記出力レイヤのうちの少なくとも１つが参照レイヤを有する、ことを含む、
請求項１に記載の方法。
前記シンタックス要素は、前記出力レイヤセットシグナリングの前記モードを示すよう２の値を有する、
請求項６に記載の方法。
前記パラメータセットは、ビデオパラメータセットである、
請求項６又は７に記載の方法。
前記決定するステップは、
前記出力レイヤセットシグナリングの前記モードを示す前記シンタックス要素と、
０よりも大きい前記パラメータセットの識別子の値と、
如何なる出力レイヤにも属さないことを示されている、前記第１ピクチャと同じアクセスユニットに属する第２ピクチャと
に基づいて、前記第１ピクチャが出力されるべきではないことを決定するステップを有する、
請求項６乃至８のうちいずれか一項に記載の方法。
前記決定するステップは、前記第１ピクチャが出力されるべきであることを決定するステップを有する、
請求項１乃至９のうちいずれか一項に記載の方法。
複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームをデコードするシステムであって、
コンピュータプログラムコードを記憶するよう構成されるメモリと、
前記コーディングされたビデオストリームを受け取り、前記コンピュータプログラムコードにアクセスし、該コンピュータプログラムコードによって指示されるように動作する少なくとも１つのプロセッサと
を有し、
前記コンピュータプログラムコードは、前記少なくとも１つのプロセッサによって実行される場合に、
前記少なくとも１つのプロセッサに、請求項１乃至１０のうちいずれか一項に記載の方法を実行させる、
システム。
少なくとも１つのプロセッサに、複数のレイヤにパーティション化されたビデオデータを含むコーディングされたビデオストリームをデコードさせるよう構成されるコンピュータ命令を含み、
前記コンピュータ命令は、前記少なくとも１つのプロセッサによって実行される場合に、前記少なくとも１つのプロセッサに、請求項１乃至１０のうちいずれか一項に記載の方法を実行させる、
コンピュータプログラム。