JP2016538756A

JP2016538756A - 符号化のための情報のシグナリング

Info

Publication number: JP2016538756A
Application number: JP2016521795A
Authority: JP
Inventors: サーチンジー．デシュパンダ
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2013-10-11
Filing date: 2014-10-14
Publication date: 2016-12-08
Anticipated expiration: 2034-10-14
Also published as: EP3056005A4; EP3056005A1; JP6472442B2; WO2015052942A1; HK1224468A1; CN105556975A; US20160261878A1

Abstract

ビデオシーケンスを表すベースビットストリームおよびエンハンスメントビットストリームを含むビデオビットストリームを符号化および／または復号するためのシステム。

Description

関連出願の相互参照
なし。

技術分野
本開示は一般的に、電子デバイスに関する。

電子デバイスは、消費者の要求を満たすため、ならびに可搬性および利便性を改善するために、より小型かつ強力になってきている。消費者は電子デバイスに依存するようになっており、機能性の向上を期待している。電子デバイスのいくつかの例は、デスクトップコンピュータ、ラップトップコンピュータ、携帯電話、スマートフォン、メディアプレーヤ、集積回路などを含む。

いくつかの電子デバイスは、デジタルメディアを処理および表示するために用いられる。たとえばポータブル電子デバイスは、今や消費者が存在し得るほとんどあらゆる場所でデジタルメディアが消費されることを可能にする。さらに、いくつかの電子デバイスは、消費者の使用および娯楽のためのデジタルメディアコンテンツのダウンロードまたはストリーミングを提供し得る。

デジタルメディアの人気が高まることによって、いくつかの問題が提示されている。たとえば、記憶、送信および迅速な再生のために高品質のデジタルメディアを効率的に表すことは、いくつかの課題を提示する。この考察から観察され得るとおり、改善された性能を伴って効率的にデジタルメディアを表すシステムおよび方法は有益であり得る。

本発明の前述およびその他の目的、特徴および利点は、添付の図面とともに以下の本発明の詳細な説明を考慮することによって、より容易に理解されるだろう。

本発明の一実施形態は、ビデオビットストリームを復号するための方法を開示しており、この方法は、（ａ）レイヤセットを含む前記ビデオビットストリームを受信するステップであって、前記レイヤセットは前記ビットストリームの複数の異なるレイヤを識別し、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、（ｂ）前記ビデオビットストリームの少なくとも１つのレイヤに関する情報を含むビデオパラメータセットを受信するステップと、（ｃ）前記複数の異なるレイヤおよび前記複数の時間サブレイヤに関するデータを含む、前記ビデオパラメータセットによって参照されるビデオパラメータセット拡張を受信するステップと、（ｄ）複数の時間サブレイヤに関する前記情報が存在するかどうかを示す、前記ビデオパラメータセット拡張内のビデオパラメータセット時間サブレイヤ情報存在フラグを受信するステップとを含む。

本発明の別の実施形態は、ビデオビットストリームを復号するための方法を開示しており、この方法は、（ａ）レイヤセットを含む前記ビデオビットストリームを受信するステップであって、前記レイヤセットは前記ビットストリームの複数の異なるレイヤを識別し、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、（ｂ）前記複数の異なるレイヤおよび前記複数のサブレイヤに関するデータを含むビデオパラメータセット拡張を受信するステップと、（ｄ）特定のレイヤセットに対する時間サブレイヤの０から最大数までに対して、（１）ビットレート存在フラグ、（２）ピクチャレート存在フラグ、（３）ビットレート情報、（４）ピクチャレート情報を受信するステップとを含む。

本発明の別の実施形態は、ビデオビットストリームを復号するための方法を開示しており、この方法は、（ａ）複数の異なるレイヤを含む前記ビデオビットストリームを受信するステップであって、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、（ｂ）前記複数の時間サブレイヤのうちの１つの第１のフレームの一部として第１のスライスを含む、前記ビデオビットストリームを受信するステップと、（ｃ）前記複数の時間サブレイヤのうちの別の１つの第２のフレームの一部として第２のスライスを含む、前記ビデオビットストリームを受信するステップと、（ｄ）前記ビデオビットストリームの前記第１のスライスに関する情報を含む、第１のスライスセグメントヘッダを受信するステップと、（ｅ）前記第１のスライスに対するインターレイヤ予測に用いられ得る前記第１のスライスに対するアクティブ参照レイヤピクチャとして前記第２のスライスを含ませるかどうかを判定するために、ビデオパラメータセットからの時間サブレイヤ最大値と、前記第２のフレームの時間識別子とを比較するステップとを含む。

本発明の別の実施形態は、ビデオビットストリームを復号するための方法を開示しており、この方法は、（ａ）複数の異なるレイヤを含む前記ビデオビットストリームを受信するステップであって、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、（ｂ）前記複数の時間サブレイヤのうちの１つの第１のフレームの一部として第１のスライスを含む、前記ビデオビットストリームを受信するステップと、（ｃ）前記ビデオビットストリームの前記第１のスライスに関する情報を含む第１のスライスセグメントヘッダを受信するステップと、（ｄ）前記第１のスライスセグメントヘッダとともに時間識別子およびｎａｌユニットタイプを受信するステップとを含み、（ｅ）もし前記ｎａｌユニットタイプがＩＲＡＰピクチャであれば、前記時間識別子に基づいて導出されるＴｅｍｐｏｒａｌＩｄは０に等しく、（ｆ）もし前記ｎａｌユニットタイプがＴＳＡおよびＴＳＡ＿Ｎの少なくとも１つであれば、前記ＴｅｍｐｏｒａｌＩｄは０に等しくなく、（ｇ）もし前記ｎａｌユニットタイプがＳＴＳＡ＿ＲおよびＳＴＳＡ＿Ｎの少なくとも１つであれば、前記ＴｅｍｐｏｒａｌＩｄは０に等しくない。

メッセージを送り、かつビットストリームをバッファリングするためのシステムおよび方法が実現され得る、１つまたはそれ以上の電子デバイスの例を示すブロック図である。メッセージを送り、かつビットストリームをバッファリングするためのシステムおよび方法が実現され得る、１つまたはそれ以上の電子デバイスの例を示す、別のブロック図である。電子デバイスのエンコーダ６０４の一構成を示すブロック図である。電子デバイスのエンコーダ６０４の一構成を示す、別のブロック図である。電子デバイスのデコーダの一構成を示すブロック図である。電子デバイスのデコーダの一構成を示す、別のブロック図である。送信電子デバイスにおいて使用され得るさまざまなコンポーネントを示す図である。受信電子デバイスにおいて使用され得るさまざまなコンポーネントを示すブロック図である。メッセージを送るためのシステムおよび方法が実現され得る電子デバイスの一構成を示すブロック図である。ビットストリームをバッファリングするためのシステムおよび方法が実現され得る電子デバイスの一構成を示すブロック図である。異なるＮＡＬユニットヘッダシンタックスを示す図である。異なるＮＡＬユニットヘッダシンタックスを示す図である。異なるＮＡＬユニットヘッダシンタックスを示す図である。一般的なＮＡＬユニットシンタックスを示す図である。既存のビデオパラメータセットを示す図である。既存のスケーラビリティタイプを示す図である。ベースレイヤおよびエンハンスメントレイヤを示す図である。複数のスライスを有する例示的なピクチャを示す図である。複数のスライスを有する別の例示的なピクチャを示す図である。列および行境界を有するピクチャを示す図である。スライスを有するピクチャを示す図である。ベースレイヤ、エンハンスメントレイヤ、およびタイルを有するアクセスユニットを示す図である。例示的なスライドセグメントヘッダシンタックスを示す図である。例示的なスライドセグメントヘッダシンタックスを示す図である。例示的なスライドセグメントヘッダシンタックスを示す図である。例示的なスライドセグメントヘッダシンタックスを示す図である。ベースレイヤおよびエンハンスメントレイヤを示す図である。例示的なｖｐｓ拡張シンタックスシンタックスを示す図である。例示的なｖｐｓ拡張シンタックスシンタックスを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。許可された関係を有する例示的なベースレイヤおよびエンハンスメントレイヤを示す図である。例示的なスライスセグメントヘッダを示す図である。例示的なｖｐｓ拡張シンタックスを示す図である。例示的なｖｐｓ拡張シンタックスを示す図である。例示的なシーケンスパラメータセットシンタックスを示す図である。例示的なピクチャパラメータセットシンタックスを示す図である。ベースレイヤおよびエンハンスメントレイヤ内の時間サブレイヤを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。例示的なスライスセグメントヘッダシンタックスを示す図である。例示的なｖｐｓ＿ｅｘｔｅｎｓｉｏｎシンタックスを示す図である。ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１シグナリングを示す図である。例示的なｖｐｓ＿ｅｘｔｅｎｓｉｏｎシンタックスを示す図である。ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１シグナリングを示す図である。例示的なｖｐｓ＿ｅｘｔｅｎｓｉｏｎシンタックスを示す図である。ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１シグナリングを示す図である。例示的なｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒシンタックスを示す図である。例示的なｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒシンタックスを示す図である。例示的なｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒシンタックスを示す図である。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］に対する例示的な実施を示す図である。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］に対する例示的な実施を示す図である。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］に対する例示的な実施を示す図である。インターレイヤ参照ピクチャセットに対する例示的な復号プロセスを示す図である。インターレイヤ参照ピクチャセットに対する例示的な復号プロセスを示す図である。インターレイヤ参照ピクチャセットに対する例示的な復号プロセスを示す図である。インターレイヤ参照ピクチャセットに対する例示的な復号プロセスを示す図である。例示的なスライスセグメントヘッダを示す図である。例示的なｖｐｓ拡張シンタックスを示す図である。例示的なｖｐｓ拡張シンタックスを示す図である。例示的なｖｐｓビデオユーザビリティ情報（ｖｉｄｅｏｕｓａｂｉｌｉｔｙｉｎｆｏｒｍａｔｉｏｎ：ＶＵＩ）シンタックスを示す図である。例示的なｖｐｓビデオユーザビリティ情報（ＶＵＩ）シンタックスを示す図である。ＩＲＡＰピクチャおよび非ＩＲＡＰピクチャ内の時間サブレイヤを示す図である。ＩＲＡＰピクチャおよび非ＩＲＡＰピクチャ内の別の時間サブレイヤを示す図である。ＩＲＡＰピクチャ、ＴＳＡピクチャ、ＳＴＳＡピクチャ内の時間サブレイヤを示す図である。ＩＲＡＰピクチャ、ＴＳＡピクチャ、ＳＴＳＡピクチャ内の別の時間サブレイヤを示す図である。

図１Ａは、メッセージを送り、かつビットストリームをバッファリングするためのシステムおよび方法が実現され得る、１つまたはそれ以上の電子デバイス１０２の例を示すブロック図である。この例においては、電子デバイスＡ１０２ａおよび電子デバイスＢ１０２ｂが示される。しかし、いくつかの構成においては、電子デバイスＡ１０２ａおよび電子デバイスＢ１０２ｂに関して記載された特徴および機能の１つまたはそれ以上が単一の電子デバイス内に組み合わされてもよいことが留意されるべきである。

電子デバイスＡ１０２ａはエンコーダ１０４を含む。エンコーダ１０４はメッセージ生成モジュール１０８を含む。電子デバイスＡ１０２ａに含まれるエレメント（例、エンコーダ１０４およびメッセージ生成モジュール１０８）の各々は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現されてもよい。

電子デバイスＡ１０２ａは、１つまたはそれ以上の入力ピクチャ１０６を得てもよい。いくつかの構成において、入力ピクチャ１０６は、画像センサを用いて電子デバイスＡ１０２ａに捕捉されてもよいし、メモリから検索されてもよいし、および／または別の電子デバイスから受信されてもよい。

エンコーダ１０４は、入力ピクチャ１０６を符号化して符号化データを生成し得る。たとえば、エンコーダ１０４は一連の入力ピクチャ１０６（例、ビデオ）を符号化してもよい。一構成において、エンコーダ１０４はＨＥＶＣエンコーダであってもよい。符号化データはデジタルデータ（例、ビットストリーム１１４の一部）であってもよい。エンコーダ１０４は、入力信号に基づくオーバーヘッドシグナリングを生成してもよい。

メッセージ生成モジュール１０８は、１つまたはそれ以上のメッセージを生成し得る。たとえば、メッセージ生成モジュール１０８は１つもしくはそれ以上のＳＥＩメッセージまたはその他のメッセージを生成し得る。サブピクチャレベルにおける動作をとりうるＣＰＢに対して、電子デバイス１０２はサブピクチャパラメータ（例、ＣＰＢ除去遅延パラメータ）を送ってもよい。特定的には、電子デバイス１０２（例、エンコーダ１０４）は、ピクチャタイミングＳＥＩメッセージに共通復号ユニットＣＰＢ除去遅延パラメータを含ませるかどうかを判定してもよい。たとえば、エンコーダ１０４がピクチャタイミングＳＥＩメッセージに共通復号ユニットＣＰＢ除去遅延パラメータ（例、ｃｏｍｍｏｎ＿ｄｕ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ）を含んでいるとき、電子デバイスはフラグ（例、ｃｏｍｍｏｎ＿ｄｕ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ＿ｆｌａｇ）を１に設定してもよい。共通復号ユニットＣＰＢ除去遅延パラメータが含まれるとき、電子デバイスは、アクセスユニット内のすべての復号ユニットに適用可能な共通復号ユニットＣＰＢ除去遅延パラメータを生成してもよい。言換えると、アクセスユニット内の各復号ユニットに対する復号ユニットＣＰＢ除去遅延パラメータを含むのではなく、ピクチャタイミングＳＥＩメッセージが関連付けられるアクセスユニット内のすべての復号ユニットに、共通パラメータが適用され得る。

上述の場合に対し、ピクチャタイミングＳＥＩメッセージに共通復号ユニットＣＰＢ除去遅延パラメータが含まれないとき、電子デバイス１０２は、ピクチャタイミングＳＥＩメッセージが関連付けられるアクセスユニット内の各復号ユニットに対して、別個の復号ユニットＣＰＢ除去遅延を生成してもよく、いくつかの構成において、電子デバイスＡ１０２ａは電子デバイスＢ１０２ｂに、ビットストリーム１１４の一部としてメッセージを送ってもよい。いくつかの構成において、電子デバイスＡ１０２ａは、分離した送信１１０によって電子デバイスＢ１０２ｂにメッセージを送ってもよい。たとえば、分離した送信はビットストリーム１１４の一部でなくてもよい。たとえば、何らかの帯域外機構を用いて、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージが送られてもよい。なお、いくつかの構成においては、その他のメッセージが上述のピクチャタイミングＳＥＩメッセージの特徴の１つまたはそれ以上を含んでいてもよい。さらに、１つまたはそれ以上の局面において、その他のメッセージが上述のＳＥＩメッセージと同様に使用されてもよい。

エンコーダ１０４（およびたとえばメッセージ生成モジュール１０８）は、ビットストリーム１１４を生成し得る。ビットストリーム１１４は、入力ピクチャ１０６に基づく符号化ピクチャデータを含み得る。いくつかの構成において、ビットストリーム１１４はさらに、たとえばピクチャタイミングＳＥＩメッセージまたはその他のメッセージ、スライスヘッダ、ＰＰＳなどのオーバーヘッドデータを含んでもよい。付加的な入力ピクチャ１０６が符号化されるため、ビットストリーム１１４は１つまたはそれ以上の符号化ピクチャを含んでもよい。たとえば、ビットストリーム１１４は、１つまたはそれ以上の符号化ピクチャを対応するオーバーヘッドデータ（例、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージ）とともに含んでもよい。

ビットストリーム１１４はデコーダ１１２に提供され得る。一例において、ビットストリーム１１４は、有線または無線リンクを用いて電子デバイスＢ１０２ｂに送信され得る。場合によっては、この送信が、たとえばインターネットまたはローカルエリアネットワーク（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ：ＬＡＮ）などのネットワークを通じて行われてもよい。図１Ａに示されるとおり、デコーダ１１２は、電子デバイスＡ１０２ａのエンコーダ１０４とは別に電子デバイスＢ１０２ｂ上に実現されてもよい。しかし、いくつかの構成においては、エンコーダ１０４とデコーダ１１２とが同じ電子デバイス上に実現されてもよいことに留意すべきである。エンコーダ１０４とデコーダ１１２とが同じ電子デバイス上に実現される実施においては、たとえばビットストリーム１１４はバスを通じてデコーダ１１２に提供されてもよいし、またはデコーダ１１２による検索のためにメモリに保存されてもよい。

デコーダ１１２は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現されてもよい。一構成において、デコーダ１１２はＨＥＶＣデコーダであってもよい。デコーダ１１２はビットストリーム１１４を受信して（例、得て）もよい。デコーダ１１２は、ビットストリーム１１４に基づく１つまたはそれ以上の復号ピクチャ１１８を生成し得る。復号ピクチャ１１８は表示されるか、再生されるか、メモリに保存されるか、および／または別のデバイスに送信されるなどしてもよい。

デコーダ１１２はＣＰＢ１２０を含み得る。ＣＰＢ１２０は、符号化ピクチャを一時的に保存し得る。ＣＰＢ１２０は、データをいつ除去するかを定めるために、ピクチャタイミングＳＥＩメッセージに見出されるパラメータを使用し得る。ＣＰＢ１２０がサブピクチャレベルにおける動作をとりうるときは、一度にアクセスユニット全体を除去するのではなく、個々の復号ユニットが除去され得る。デコーダ１１２は復号ピクチャバッファ（ＤｅｃｏｄｅｄＰｉｃｔｕｒｅＢｕｆｆｅｒ：ＤＰＢ）１２２を含み得る。各復号ピクチャは、復号プロセスによる参照のため、ならびに出力およびクロッピングのためにＤＰＢ１２２に入れられる。復号ピクチャは、ＤＰＢ出力時間の後、またはその復号ピクチャがインター予測参照に必要なくなったときに、ＤＰＢから除去される。

デコーダ１１２はメッセージ（例、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージ）を受信し得る。加えて、デコーダ１１２は、受信したメッセージが共通復号ユニットＣＰＢ除去遅延パラメータ（例、ｃｏｍｍｏｎ＿ｄｕ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ）を含むかどうかを判定し得る。この判定は、ピクチャタイミングＳＥＩメッセージに共通パラメータが存在するときに設定されるフラグ（例、ｃｏｍｍｏｎ＿ｄｕ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ＿ｆｌａｇ）を識別することを含み得る。もし共通パラメータが存在すれば、デコーダ１１２は、アクセスユニット内のすべての復号ユニットに適用可能な共通復号ユニットＣＰＢ除去遅延パラメータを定め得る。もし共通パラメータが存在しなければ、デコーダ１１２は、アクセスユニット内の各復号ユニットに対して別個の復号ユニットＣＰＢ除去遅延パラメータを定め得る。デコーダ１１２はさらに、その共通復号ユニットＣＰＢ除去遅延パラメータまたは別個の復号ユニットＣＰＢ除去遅延パラメータのいずれかを用いて、ＣＰＢ１２０から復号ユニットを除去し得る。

上述のＨＲＤは、図１Ａに示されるデコーダ１１２の一例であり得る。よって、いくつかの構成において、電子デバイス１０２は上述のＨＲＤおよびＣＰＢ１２０およびＤＰＢ１２２に従って動作してもよい。

なお、電子デバイス１０２に含まれるエレメントの１つもしくはそれ以上、またはエレメントの一部が、ハードウェアにおいて実現されてもよい。たとえば、これらのエレメントの１つもしくはそれ以上、またはエレメントの一部がチップ、回路、またはハードウェアコンポーネントなどとして実現されてもよい。加えて、本明細書に記載される機能または方法の１つまたはそれ以上が、ハードウェアにおいて実施されるか、および／またはハードウェアを用いて実行されてもよいことに留意すべきである。たとえば、本明細書に記載される方法の１つまたはそれ以上が、チップセット、特定用途向け集積回路（Ａｐｐｌｉｃａｔｉｏｎ−ＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）、大規模集積回路（Ｌａｒｇｅ−ＳｃａｌｅＩｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ：ＬＳＩ）、もしくは集積回路などにおいて実施されるか、および／またはこうした回路を用いて実現されてもよい。

図１Ｂは、エンコーダ１９０８およびデコーダ１９７２の別の例を示すブロック図である。この例においては、電子デバイスＡ１９０２および電子デバイスＢ１９７０が示される。しかし、いくつかの構成においては、電子デバイスＡ１９０２および電子デバイスＢ１９７０に関して記載された特徴および機能が単一の電子デバイス内に組み合わされてもよいことが留意されるべきである。

電子デバイスＡ１９０２はエンコーダ１９０８を含む。エンコーダ１９０８は、ベースレイヤエンコーダ１９１０と、エンハンスメントレイヤエンコーダ１９２０とを含んでもよい。後で説明するとおり、ビデオエンコーダ１９０８は、スケーラブルビデオ符号化およびマルチビュービデオ符号化に対して好適である。エンコーダ１９０８は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現されてもよい。一構成において、エンコーダ１９０８は、スケーラブルおよび／またはマルチビューを含む高効率ビデオ符号化（ｈｉｇｈ−ｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ：ＨＥＶＣ）コーダであってもよい。他のコーダが同様に用いられてもよい。電子デバイスＡ１９０２はソース１９０６を得てもよい。いくつかの構成において、ソース１９０６は、画像センサを用いて電子デバイスＡ１９０２に捕捉されても、メモリから検索されても、または別の電子デバイスから受信されてもよい。

エンコーダ１９０８はソース１９０６を符号化して、ベースレイヤビットストリーム１９３４およびエンハンスメントレイヤビットストリーム１９３６を生成し得る。たとえば、エンコーダ１９０８はソース１９０６内の一連のピクチャ（例、ビデオ）を符号化してもよい。特に、品質スケーラビリティとしても公知であるＳＮＲスケーラビリティに対するスケーラブルビデオ符号化に対しては、ベースレイヤおよびエンハンスメントレイヤエンコーダに同じソース１９０６が提供され得る。特に、空間スケーラビリティに対するスケーラブルビデオ符号化に対しては、ベースレイヤエンコーダにはダウンサンプリングされたソースが用いられ得る。特に、マルチビュー符号化に対しては、ベースレイヤエンコーダおよびエンハンスメントレイヤエンコーダに異なるビューソースが用いられ得る。エンコーダ１９０８は、図２Ｂに関連して後述するエンコーダ１７８２と類似のものであってもよい。

ビットストリーム１９３４、１９３６は、ソース１９０６に基づく符号化ピクチャデータを含んでもよい。いくつかの構成において、ビットストリーム１９３４、１９３６はさらに、たとえばスライスヘッダ情報、ＰＰＳ情報などのオーバーヘッドデータを含んでもよい。ソース１９０６内の付加的なピクチャが符号化されるために、ビットストリーム１９３４、１９３６は１つまたはそれ以上の符号化ピクチャを含んでもよい。

ビットストリーム１９３４、１９３６はデコーダ１９７２に提供され得る。デコーダ１９７２は、ベースレイヤデコーダ１９８０と、エンハンスメントレイヤデコーダ１９９０とを含んでもよい。ビデオデコーダ１９７２は、スケーラブルビデオ復号およびマルチビュービデオ復号に対して好適である。一例において、ビットストリーム１９３４、１９３６は、有線または無線リンクを用いて電子デバイスＢ１９７０に送信され得る。場合によっては、この送信が、たとえばインターネットまたはローカルエリアネットワーク（ＬＡＮ）などのネットワークを通じて行われてもよい。図１Ｂに示されるとおり、デコーダ１９７２は、電子デバイスＡ１９０２のエンコーダ１９０８とは別に電子デバイスＢ１９７０上に実現されてもよい。しかし、いくつかの構成においては、エンコーダ１９０８とデコーダ１９７２とが同じ電子デバイス上に実現されてもよいことに留意すべきである。エンコーダ１９０８とデコーダ１９７２とが同じ電子デバイス上に実現される実施においては、たとえばビットストリーム１９３４、１９３６はバスを通じてデコーダ１９７２に提供されてもよいし、またはデコーダ１９７２による検索のためにメモリに保存されてもよい。デコーダ１９７２は、出力として復号ベースレイヤ１９９２および復号エンハンスメントレイヤピクチャ１９９４を提供し得る。

デコーダ１９７２は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現されてもよい。一構成において、デコーダ１９７２は、スケーラブルおよび／またはマルチビューを含む高効率ビデオ符号化（ＨＥＶＣ）デコーダであってもよい。他のデコーダが同様に用いられてもよい。デコーダ１９７２は、図３Ｂに関連して後述するデコーダ１８１２と類似のものであってもよい。加えて、ベースレイヤエンコーダおよび／またはエンハンスメントレイヤエンコーダの各々が、たとえば図１Ａに関して説明したものなどのメッセージ生成モジュールを含んでもよい。加えて、ベースレイヤデコーダおよび／またはエンハンスメントレイヤデコーダが、たとえば図１Ａに関して説明したものなどの符号化ピクチャバッファおよび／または復号ピクチャバッファを含んでもよい。加えて、図１Ｂの電子デバイスが、図１Ａの電子デバイスの機能に従って適用可能なとおりに動作してもよい。

図２Ａは、電子デバイス６０２のエンコーダ６０４の一構成を示すブロック図である。なお、電子デバイス６０２内に含まれるものとして示されるエレメントの１つまたはそれ以上は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現されてもよい。たとえば、電子デバイス６０２は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現され得るエンコーダ６０４を含む。たとえば、エンコーダ６０４は回路、集積回路、特定用途向け集積回路（ＡＳＩＣ）、実行可能な命令を有するメモリと電子通信を行うプロセッサ、ファームウェア、フィールドプログラマブルゲート配列（ｆｉｅｌｄ−ｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ：ＦＰＧＡ）など、またはその組み合わせとして実現されてもよい。いくつかの構成において、エンコーダ６０４はＨＥＶＣコーダであってもよい。

電子デバイス６０２はソース６２２を含み得る。ソース６２２は、ピクチャまたは画像データ（例、ビデオ）を、１つまたはそれ以上の入力ピクチャ６０６としてエンコーダ６０４に提供し得る。ソース６２２の例は、画像センサ、メモリ、通信インタフェース、ネットワークインタフェース、無線受信機、ポートなどを含んでもよい。

１つまたはそれ以上の入力ピクチャ６０６は、イントラフレーム予測モジュールおよび再構築バッファ６２４に提供され得る。加えて、入力ピクチャ６０６は、動き推定および動き補償モジュール６４６と、減算モジュール６２８とに提供され得る。

イントラフレーム予測モジュールおよび再構築バッファ６２４は、１つまたはそれ以上の入力ピクチャ６０６および再構築データ６６０に基づいて、イントラモード情報６４０およびイントラ信号６２６を生成してもよい。動き推定および動き補償モジュール６４６は、１つまたはそれ以上の入力ピクチャ６０６および復号ピクチャバッファ６７６からの参照ピクチャ６７８に基づいて、インターモード情報６４８およびインター信号６４４を生成してもよい。いくつかの構成において、復号ピクチャバッファ６７６は、復号ピクチャバッファ６７６内に１つまたはそれ以上の参照ピクチャからのデータを含んでもよい。

エンコーダ６０４は、モードに従ってイントラ信号６２６とインター信号６４４との間で選択を行ってもよい。イントラ信号６２６は、イントラ符号化モードにおいてピクチャ内の空間的特徴を利用するために用いられ得る。インター信号６４４は、インター符号化モードにおいてピクチャ間の時間的特徴を利用するために用いられ得る。イントラ符号化モードの間は、イントラ信号６２６が減算モジュール６２８に提供されてもよく、かつイントラモード情報６４０がエントロピー符号化モジュール６４２に提供されてもよい。インター符号化モードの間は、インター信号６４４が減算モジュール６２８に提供されてもよく、かつインターモード情報６４８がエントロピー符号化モジュール６４２に提供されてもよい。

予測残差６３０を生成するために、減算モジュール６２８において（モードによって）イントラ信号６２６またはインター信号６４４のいずれかが入力ピクチャ６０６から減算される。予測残差６３０は変換モジュール６３２に提供される。変換モジュール６３２は予測残差６３０を圧縮して変換信号６３４を生成してもよく、変換信号６３４は量子化モジュール６３６に提供される。量子化モジュール６３６は変換信号６３４を量子化して、変換および量子化係数（ｔｒａｎｓｆｏｒｍｅｄａｎｄｑｕａｎｔｉｚｅｄｃｏｅｆｆｉｃｉｅｎｔｓ：ＴＱＣ）６３８を生成する。

ＴＱＣ６３８は、エントロピー符号化モジュール６４２および逆量子化モジュール６５０に提供される。逆量子化モジュール６５０は、ＴＱＣ６３８に対して逆量子化を行って逆量子化信号６５２を生成し、逆量子化信号６５２は逆変換モジュール６５４に提供される。逆変換モジュール６５４は、逆量子化信号６５２を展開して展開信号６５６を生成し、展開信号６５６は再構築モジュール６５８に提供される。

再構築モジュール６５８は、展開信号６５６に基づいて再構築データ６６０を生成してもよい。たとえば、再構築モジュール６５８は（修正された）ピクチャを再構築してもよい。再構築データ６６０は、デブロッキングフィルタ６６２と、イントラ予測モジュールおよび再構築バッファ６２４とに提供され得る。デブロッキングフィルタ６６２は、再構築データ６６０に基づいてフィルタ信号６６４を生成し得る。

フィルタ信号６６４は、サンプル適応オフセット（ｓａｍｐｌｅａｄａｐｔｉｖｅｏｆｆｓｅｔ：ＳＡＯ）モジュール６６６に提供され得る。ＳＡＯモジュール６６６は、エントロピー符号化モジュール６４２に提供されるＳＡＯ情報６６８と、適応ループフィルタ（ａｄａｐｔｉｖｅｌｏｏｐｆｉｌｔｅｒ：ＡＬＦ）６７２に提供されるＳＡＯ信号６７０とを生成し得る。ＡＬＦ６７２はＡＬＦ信号６７４を生成し、ＡＬＦ信号６７４は復号ピクチャバッファ６７６に提供される。ＡＬＦ信号６７４は、参照ピクチャとして用いられ得る１つまたはそれ以上のピクチャからのデータを含んでもよい。

エントロピー符号化モジュール６４２は、ＴＱＣ６３８を符号化してビットストリームＡ６１４ａ（例、符号化ピクチャデータ）を生成し得る。たとえば、エントロピー符号化モジュール６４２は、コンテキスト適応型可変長符号化（Ｃｏｎｔｅｘｔ−ＡｄａｐｔｉｖｅＶａｒｉａｂｌｅＬｅｎｇｔｈＣｏｄｉｎｇ：ＣＡＶＬＣ）またはコンテキスト適応型２値算術符号化（Ｃｏｎｔｅｘｔ−ＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈｍｅｔｉｃＣｏｄｉｎｇ：ＣＡＢＡＣ）を用いてＴＱＣ６３８を符号化してもよい。特に、エントロピー符号化モジュール６４２は、イントラモード情報６４０、インターモード情報６４８、およびＳＡＯ情報６６８のうちの１つまたはそれ以上に基づいてＴＱＣ６３８を符号化してもよい。ビットストリームＡ６１４ａ（例、符号化ピクチャデータ）は、メッセージ生成モジュール６０８に提供され得る。メッセージ生成モジュール６０８は、図１に関連して説明したメッセージ生成モジュール１０８と同様に構成され得る。

たとえば、メッセージ生成モジュール６０８は、サブピクチャパラメータを含むメッセージ（例、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージ）を生成してもよい。サブピクチャパラメータは、復号ユニットに対する１つまたはそれ以上の除去遅延（例、ｃｏｍｍｏｎ＿ｄｕ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙまたはｄｕ＿ｃｐｂ＿ｒｅｍｏｖａｌ＿ｄｅｌａｙ［ｉ］）および１つまたはそれ以上のＮＡＬパラメータ（例、ｃｏｍｍｏｎ＿ｎｕｍ＿ｎａｌｕｓ＿ｉｎ＿ｄｕ＿ｍｉｎｕｓ１またはｎｕｍ＿ｎａｌｕｓ＿ｉｎ＿ｄｕ＿ｍｉｎｕｓ１［ｉ］）を含んでもよい。いくつかの構成において、そのメッセージがビットストリームＡ６１４ａに挿入されて、ビットストリームＢ６１４ｂが生成され得る。よって、メッセージは、たとえばビットストリームＡ６１４ａ全体が生成された後（例、ビットストリームＢ６１４ｂのほとんどが生成された後）に生成されてもよい。他の構成においては、メッセージがビットストリームＡ６１４ａに挿入されずに（この場合、ビットストリームＢ６１４ｂはビットストリームＡ６１４ａと同じであり得る）、分離した送信６１０において提供されてもよい。

いくつかの構成において、電子デバイス６０２は、ビットストリーム６１４を別の電子デバイスに送る。たとえば、ビットストリーム６１４は通信インタフェース、ネットワークインタフェース、無線送信機、ポートなどに提供され得る。たとえば、ビットストリーム６１４はＬＡＮ、インターネット、携帯電話基地局などを介して別の電子デバイスに送信されてもよい。付加的または代替的に、ビットストリーム６１４は電子デバイス６０２のメモリまたはその他のコンポーネントに保存されてもよい。

図２Ｂは、電子デバイス１７０２のビデオエンコーダ１７８２の一構成を示すブロック図である。ビデオエンコーダ１７８２は、エンハンスメントレイヤエンコーダ１７０６と、ベースレイヤエンコーダ１７０９と、解像度アップスケーリングブロック１７７０と、出力インタフェース１７８０とを含み得る。本明細書に記載されるとおり、たとえば図２Ｂのビデオエンコーダは、スケーラブルビデオ符号化およびマルチビュービデオ符号化に対して好適である。

エンハンスメントレイヤエンコーダ１７０６は、入力ピクチャ１７０４を受信するビデオ入力１７８１を含んでもよい。ビデオ入力１７８１の出力は、予測選択１７５０の出力を受信する加算器／減算器１７８３に提供され得る。加算器／減算器１７８３の出力は、変換および量子化ブロック１７５２に提供され得る。変換および量子化ブロック１７５２の出力は、エントロピー符号化１７４８ブロックならびにスケーリングおよび逆変換ブロック１７７２に提供され得る。エントロピー符号化１７４８が行われた後、エントロピー符号化ブロック１７４８の出力は、出力インタフェース１７８０に提供され得る。出力インタフェース１７８０は、符号化ベースレイヤビデオビットストリーム１７０７と、符号化エンハンスメントレイヤビデオビットストリーム１７１０との両方を出力してもよい。

スケーリングおよび逆変換ブロック１７７２の出力は、加算器１７７９に提供され得る。加算器１７７９はさらに、予測選択１７５０の出力を受信し得る。加算器１７７９の出力は、デブロッキングブロック１７５１に提供され得る。デブロッキングブロック１７５１の出力は、参照バッファ１７９４に提供され得る。参照バッファ１７９４の出力は、動き補償ブロック１７５４に提供され得る。動き補償ブロック１７５４の出力は、予測選択１７５０に提供され得る。参照バッファ１７９４の出力は、イントラ予測因子１７５６にも提供され得る。イントラ予測因子１７５６の出力は、予測選択１７５０に提供され得る。予測選択１７５０はさらに、解像度アップスケーリングブロック１７７０の出力を受信し得る。

ベースレイヤエンコーダ１７０９は、ダウンサンプリングされた入力ピクチャ、または別の画像と組み合わせるために好適なその他の画像内容、または代替ビュー入力ピクチャもしくは同じ入力ピクチャ１７０３（すなわち、エンハンスメントレイヤエンコーダ１７０６が受信する入力ピクチャ１７０４と同じ入力ピクチャ）を受信するビデオ入力１７６２を含んでもよい。ビデオ入力１７６２の出力は、符号化予測ループ１７６４に提供され得る。符号化予測ループ１７６４の出力にエントロピー符号化１７６６が提供され得る。符号化予測ループ１７６４の出力は、参照バッファ１７６８にも提供され得る。参照バッファ１７６８は、符号化予測ループ１７６４にフィードバックを提供し得る。参照バッファ１７６８の出力は、解像度アップスケーリングブロック１７７０にも提供され得る。エントロピー符号化１７６６が行われたとき、出力は出力インタフェース１７８０に提供され得る。所望に応じて、１つまたはそれ以上のメッセージ生成モジュールに、符号化ベースレイヤビデオビットストリーム１７０７および／または符号化エンハンスメントレイヤビデオビットストリーム１７１０が提供されてもよい。

図３Ａは、電子デバイス７０２のデコーダ７１２の一構成を示すブロック図である。デコーダ７１２は、電子デバイス７０２に含まれてもよい。たとえば、デコーダ７１２はＨＥＶＣデコーダであってもよい。デコーダ７１２、およびデコーダ７１２内に含まれるものとして示されるエレメントの１つまたはそれ以上は、ハードウェア、ソフトウェア、または両方の組み合わせにおいて実現されてもよい。デコーダ７１２は、復号のためのビットストリーム７１４（例、ビットストリーム７１４に含まれる１つまたはそれ以上の符号化ピクチャおよびオーバーヘッドデータ）を受信し得る。いくつかの構成において、受信されたビットストリーム７１４は、たとえばメッセージ（例、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージ）、スライスヘッダ、ＰＰＳなどの受信オーバーヘッドデータを含み得る。いくつかの構成において、デコーダ７１２は付加的に、分離した送信７１０を受信し得る。分離した送信７１０は、メッセージ（例、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージ）を含み得る。たとえば、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージは、ビットストリーム７１４の代わりに分離した送信７１０において受信されてもよい。しかし、分離した送信７１０は任意のものであってもよく、いくつかの構成においては使用されないこともあることが留意されるべきである。

デコーダ７１２はＣＰＢ７２０を含む。ＣＰＢ７２０は、図１に関連して上述したＣＰＢ１２０と同様に構成され得る。デコーダ７１２は、サブピクチャパラメータを有するメッセージ（例、ピクチャタイミングＳＥＩメッセージまたはその他のメッセージ）を受信して、そのサブピクチャパラメータに基づいて、アクセスユニット内の復号ユニットを除去および復号してもよい。なお、１つまたはそれ以上のアクセスユニットはビットストリームに含まれてもよく、かつ符号化ピクチャデータおよびオーバーヘッドデータの１つまたはそれ以上を含んでもよい。

符号化ピクチャバッファ（ＣｏｄｅｄＰｉｃｔｕｒｅＢｕｆｆｅｒ：ＣＰＢ）７２０は、符号化ピクチャデータをエントロピー復号モジュール７０１に提供し得る。符号化ピクチャデータがエントロピー復号モジュール７０１にエントロピー復号されることによって、動き情報信号７０３と、量子化、スケーリングおよび／または変換係数７０５とが生成され得る。

動き情報信号７０３は、動き補償モジュール７８０において復号ピクチャバッファ７０９からの参照フレーム信号７９８の一部と組み合わされてもよく、動き補償モジュール７８０はインターフレーム予測信号７８２を生成し得る。量子化、デスケーリングおよび／または変換係数７０５が逆モジュール７０７に逆量子化、スケーリングおよび逆変換されることによって、復号残差信号７８４が生成され得る。復号残差信号７８４が予測信号７９２に加算されて、結合信号７８６が生成され得る。予測信号７９２は、動き補償モジュール７８０が生成したインターフレーム予測信号７８２か、またはイントラフレーム予測モジュール７８８が生成したイントラフレーム予測信号７９０のいずれかから選択された信号であり得る。いくつかの構成において、この信号選択は、ビットストリーム７１４に基づいて（例、制御されて）いてもよい。

イントラフレーム予測信号７９０は、（たとえば現フレーム内の）結合信号７８６からの、以前復号された情報から予測されてもよい。結合信号７８６はさらに、デブロッキングフィルタ７９４によってフィルタ処理され得る。結果として得られるフィルタ信号７９６は、復号ピクチャバッファ７０９に書込まれ得る。結果として得られるフィルタ信号７９６は、復号ピクチャを含み得る。復号ピクチャバッファ７０９は、出力７１８され得る復号ピクチャを提供し得る。場合によっては、７０９はフレームメモリとみなされ得る。

図３Ｂは、電子デバイス１８０２のビデオデコーダ１８１２の一構成を示すブロック図である。ビデオデコーダ１８１２は、エンハンスメントレイヤデコーダ１８１５と、ベースレイヤデコーダ１８１３とを含んでもよい。加えてビデオデコーダ８１２は、インタフェース１８８９と、解像度アップスケーリング１８７０とを含んでもよい。本明細書に記載されるとおり、たとえば図３Ｂのビデオデコーダは、スケーラブルビデオ符号化およびマルチビュービデオ符号化に対して好適である。

インタフェース１８８９は、符号化ビデオストリーム１８８５を受信し得る。符号化ビデオストリーム１８８５は、ベースレイヤ符号化ビデオストリームと、エンハンスメントレイヤ符号化ビデオストリームとからなっていてもよい。これら２つのストリームは別々に送られても、または一緒に送られてもよい。インタフェース１８８９は、符号化ビデオストリーム１８８５の一部またはすべてを、ベースレイヤデコーダ１８１３内のエントロピー復号ブロック１８８６に提供し得る。エントロピー復号ブロック１８８６の出力は、復号予測ループ１８８７に提供され得る。復号予測ループ１８８７の出力は、参照バッファ１８８８に提供され得る。参照バッファは、復号予測ループ１８８７にフィードバックを提供し得る。加えて参照バッファ１８８８は、復号ベースレイヤビデオストリーム１８８４を出力し得る。

加えてインタフェース１８８９は、符号化ビデオストリーム１８８５の一部またはすべてを、エンハンスメントレイヤデコーダ１８１５内のエントロピー復号ブロック１８９０に提供し得る。エントロピー復号ブロック１８９０の出力は、逆量子化ブロック１８９１に提供され得る。逆量子化ブロック１８９１の出力は、加算器１８９２に提供され得る。加算器１８９２は、逆量子化ブロック１８９１の出力と、予測選択ブロック１８９５の出力とを加算し得る。加算器１８９２の出力は、デブロッキングブロック１８９３に提供され得る。デブロッキングブロック１８９３の出力は、参照バッファ１８９４に提供され得る。参照バッファ１８９４は、復号エンハンスメントレイヤビデオストリーム１８８２を出力し得る。参照バッファ１８９４の出力は、イントラ予測因子１８９７にも提供され得る。エンハンスメントレイヤデコーダ１８１５は、動き補償１８９６を含み得る。動き補償１８９６は、解像度アップスケーリング１８７０の後に行われ得る。予測選択ブロック１８９５は、イントラ予測因子１８９７の出力と、動き補償１８９６の出力とを受信し得る。加えてデコーダは、たとえばインタフェース１８８９とともに、所望に応じて１つまたはそれ以上の符号化ピクチャバッファを含んでもよい。

図４は、送信電子デバイス８０２において使用され得るさまざまなコンポーネントを示す。本明細書に記載される電子デバイス１０２、６０２、７０２の１つまたはそれ以上が、図４に示される送信電子デバイス８０２に従って実現されてもよい。

送信電子デバイス８０２は、電子デバイス８０２の動作を制御するプロセッサ８１７を含む。プロセッサ８１７は、ＣＰＵと呼ばれることもある。リードオンリメモリ（ｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ：ＲＯＭ）、ランダムアクセスメモリ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ：ＲＡＭ）の両方、または情報を保存し得る任意のタイプのデバイスを含み得るメモリ８１１は、プロセッサ８１７に命令８１３ａ（例、実行可能な命令）およびデータ８１５ａを提供する。メモリ８１１の一部は、不揮発性ランダムアクセスメモリ（ｎｏｎ−ｖｏｌａｔｉｌｅｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ：ＮＶＲＡＭ）をさらに含んでもよい。メモリ８１１は、プロセッサ８１７と電子通信していてもよい。

加えて、プロセッサ８１７内にも命令８１３ｂおよびデータ８１５ｂが存在してもよい。プロセッサ８１７にロードされた命令８１３ｂおよび／またはデータ８１５ｂはさらに、プロセッサ８１７による実行または処理のためにロードされた、メモリ８１１からの命令８１３ａおよび／またはデータ８１５ａを含み得る。本明細書において開示されるシステムおよび方法を実現するために、プロセッサ８１７によって命令８１３ｂが実行されてもよい。たとえば、上述の方法２００、３００、４００、５００の１つまたはそれ以上を実行するために、命令８１３ｂが実行可能であってもよい。

送信電子デバイス８０２は、他の電子デバイス（例、受信電子デバイス）と通信するための１つまたはそれ以上の通信インタフェース８１９を含んでもよい。通信インタフェース８１９は、有線通信技術、無線通信技術、またはその両方に基づいていてもよい。通信インタフェース８１９の例は、シリアルポート、パラレルポート、ユニバーサルシリアルバス（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ：ＵＳＢ）、イーサネット（登録商標）アダプタ、ＩＥＥＥ１３９４バスインタフェース、小型コンピュータシステムインタフェース（ｓｍａｌｌｃｏｍｐｕｔｅｒｓｙｓｔｅｍｉｎｔｅｒｆａｃｅ：ＳＣＳＩ）バスインタフェース、赤外線（ｉｎｆｒａｒｅｄ：ＩＲ）通信ポート、Ｂｌｕｅｔｏｏｔｈ（登録商標）無線通信アダプタ、および第３世代パートナーシッププロジェクト（３^ｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ：３ＧＰＰ）仕様に従う無線トランシーバなどを含む。

送信電子デバイス８０２は、１つまたはそれ以上の出力デバイス８２３および１つまたはそれ以上の入力デバイス８２１を含んでもよい。出力デバイス８２３の例は、スピーカ、プリンタなどを含む。電子デバイス８０２に含まれ得る１つのタイプの出力デバイスは、ディスプレイデバイス８２５である。本明細書において開示される構成とともに使用されるディスプレイデバイス８２５は、たとえば陰極線管（ｃａｔｈｏｄｅｒａｙｔｕｂｅ：ＣＲＴ）、液晶ディスプレイ（ｌｉｑｕｉｄｃｒｙｓｔａｌｄｉｓｐｌａｙ：ＬＣＤ）、発光ダイオード（ｌｉｇｈｔ−ｅｍｉｔｔｉｎｇｄｉｏｄｅ：ＬＥＤ）、気体プラズマ、またはエレクトロルミネセンスなど、任意の好適な画像投影技術を使用してもよい。メモリ８１１に保存されたデータを、ディスプレイ８２５において示されるテキスト、グラフィックス、および／または動画に（適宜）変換するために、ディスプレイコントローラ８２７が提供されてもよい。入力デバイス８２１の例は、キーボード、マウス、マイクロホン、リモートコントロールデバイス、ボタン、ジョイスティック、トラックボール、タッチパッド、タッチスクリーン、ライトペンなどを含む。

送信電子デバイス８０２のさまざまなコンポーネントは、バスシステム８２９によってともに結合されており、バスシステム８２９は、データバスに加えて電力バス、制御信号バスおよびステータス信号バスを含み得る。しかし、明瞭にするために、図４においてはさまざまなバスがバスシステム８２９として示される。図４に示される送信電子デバイス８０２は、特定のコンポーネントのリストではなく、機能ブロック図である。

図５は、受信電子デバイス９０２において使用され得るさまざまなコンポーネントを示すブロック図である。本明細書に記載される電子デバイス１０２、６０２、７０２の１つまたはそれ以上が、図５に示される受信電子デバイス９０２に従って実現されてもよい。

受信電子デバイス９０２は、電子デバイス９０２の動作を制御するプロセッサ９１７を含む。プロセッサ９１７は、ＣＰＵと呼ばれることもある。リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）の両方、または情報を保存し得る任意のタイプのデバイスを含み得るメモリ９１１は、プロセッサ９１７に命令９１３ａ（例、実行可能な命令）およびデータ９１５ａを提供する。メモリ９１１の一部は、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）をさらに含んでもよい。メモリ９１１は、プロセッサ９１７と電子通信していてもよい。

加えて、プロセッサ９１７内にも命令９１３ｂおよびデータ９１５ｂが存在してもよい。プロセッサ９１７にロードされた命令９１３ｂおよび／またはデータ９１５ｂはさらに、プロセッサ９１７による実行または処理のためにロードされた、メモリ９１１からの命令９１３ａおよび／またはデータ９１５ａを含み得る。本明細書において開示されるシステムおよび方法を実現するために、プロセッサ９１７によって命令９１３ｂが実行されてもよい。たとえば、上述の方法２００、３００、４００、５００の１つまたはそれ以上を実行するために、命令９１３ｂが実行可能であってもよい。

受信電子デバイス９０２は、他の電子デバイス（例、送信電子デバイス）と通信するための１つまたはそれ以上の通信インタフェース９１９を含んでもよい。通信インタフェース９１９は、有線通信技術、無線通信技術、またはその両方に基づいていてもよい。通信インタフェース９１９の例は、シリアルポート、パラレルポート、ユニバーサルシリアルバス（ＵＳＢ）、イーサネット（登録商標）アダプタ、ＩＥＥＥ１３９４バスインタフェース、小型コンピュータシステムインタフェース（ＳＣＳＩ）バスインタフェース、赤外線（ＩＲ）通信ポート、Ｂｌｕｅｔｏｏｔｈ（登録商標）無線通信アダプタ、および第３世代パートナーシッププロジェクト（３ＧＰＰ）仕様に従う無線トランシーバなどを含む。

受信電子デバイス９０２は、１つまたはそれ以上の出力デバイス９２３および１つまたはそれ以上の入力デバイス９２１を含んでもよい。出力デバイス９２３の例は、スピーカ、プリンタなどを含む。電子デバイス９０２に含まれ得る１つのタイプの出力デバイスは、ディスプレイデバイス９２５である。本明細書において開示される構成とともに使用されるディスプレイデバイス９２５は、たとえば陰極線管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）、気体プラズマ、またはエレクトロルミネセンスなど、任意の好適な画像投影技術を使用してもよい。メモリ９１１に保存されたデータを、ディスプレイ９２５において示されるテキスト、グラフィックス、および／または動画に（適宜）変換するために、ディスプレイコントローラ９２７が提供されてもよい。入力デバイス９２１の例は、キーボード、マウス、マイクロホン、リモートコントロールデバイス、ボタン、ジョイスティック、トラックボール、タッチパッド、タッチスクリーン、ライトペンなどを含む。

受信電子デバイス９０２のさまざまなコンポーネントは、バスシステム９２９によってともに結合されており、バスシステム９２９は、データバスに加えて電力バス、制御信号バスおよびステータス信号バスを含み得る。しかし、明瞭にするために、図５においてはさまざまなバスがバスシステム９２９として示される。図５に示される受信電子デバイス９０２は、特定のコンポーネントのリストではなく、機能ブロック図である。

図６は、メッセージを送るためのシステムおよび方法が実現され得る電子デバイス１００２の一構成を示すブロック図である。電子デバイス１００２は、符号化手段１０３１および送信手段１０３３を含む。符号化手段１０３１および送信手段１０３３は、ビットストリーム１０１４を生成し得る。上記図４は、図６の具体的な装置構造の一例を示すものである。ソフトウェアによってＤＳＰが実現されてもよい。

図７は、ビットストリーム１１１４をバッファリングするためのシステムおよび方法が実現され得る電子デバイス１１０２の一構成を示すブロック図である。電子デバイス１１０２は、受信手段１１３５および復号手段１１３７を含み得る。受信手段１１３５および復号手段１１３７は、ビットストリーム１１１４を受信し得る。上記図５は、図７の具体的な装置構造の一例を示すものである。ソフトウェアによってＤＳＰが実現されてもよい。

参照ピクチャセット（ｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｓｅｔ：ＲＰＳ）に対する復号プロセスが呼び出され得る。参照ピクチャセットとは、あるピクチャに関連する参照ピクチャのセットであり、復号順で関連ピクチャの前にある、関連ピクチャまたは復号順で関連ピクチャに後続する任意のピクチャのインター予測に用いられ得るすべての参照ピクチャからなる。

ビデオのビットストリームは、一般的にネットワーク抽象化レイヤ（ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔｉｏｎＬａｙｅｒ：ＮＡＬ）ユニットと呼ばれる論理データパケットに入れられるシンタックス構造を含んでもよい。各ＮＡＬユニットは、関連するデータペイロードの目的を識別するための、たとえば２バイトＮＡＬユニットヘッダ（例、１６ビット）などのＮＡＬユニットヘッダを含む。たとえば、各符号化スライス（および／またはピクチャ）は、１つまたはそれ以上のスライス（および／またはピクチャ）ＮＡＬユニットにおいて符号化されてもよい。たとえば補足エンハンスメント情報、時間サブレイヤアクセス（ｔｅｍｐｏｒａｌｓｕｂ−ｌａｙｅｒａｃｃｅｓｓ：ＴＳＡ）ピクチャの符号化スライス、段階的時間サブレイヤアクセス（ｓｔｅｐ−ｗｉｓｅｔｅｍｐｏｒａｌｓｕｂ−ｌａｙｅｒａｃｃｅｓｓ：ＳＴＳＡ）ピクチャの符号化スライス、符号化スライス非ＴＳＡ、非ＳＴＳＡトレイリングピクチャ、ブロークンリンクアクセスピクチャの符号化スライス、瞬時復号リフレッシュピクチャの符号化スライス、クリーンランダムアクセスピクチャの符号化スライス、復号可能リーディングピクチャの符号化スライス、廃棄タグ付きピクチャの符号化スライス、ビデオパラメータセット、シーケンスパラメータセット、ピクチャパラメータセット、アクセスユニットデリミタ、シーケンスの最後、ビットストリームの最後、フィラーデータ、および／またはシーケンスエンハンスメント情報メッセージなど、他のカテゴリのデータに対して、他のＮＡＬユニットが含まれてもよい。表（１）は、ＮＡＬユニットコードおよびＮＡＬユニットタイプクラスの一例を示すものである。所望に応じて、他のＮＡＬユニットタイプが含まれてもよい。加えて、表（１）に示されるＮＡＬユニットに対するＮＡＬユニットタイプ値の入れ替えおよび再割り当てが行われ得ることが理解されるべきである。さらに、付加的なＮＡＬユニットタイプが追加されてもよい。さらに、いくつかのＮＡＬユニットタイプが除去されてもよい。

イントラランダムアクセスポイント（ｉｎｔｒａｒａｎｄｏｍａｃｃｅｓｓｐｏｉｎｔ：ＩＲＡＰ）ピクチャとは、表（１）に示されるとおり、そのピクチャに対する各ビデオ符号化レイヤＮＡＬユニットが、両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内のｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する、符号化ピクチャである。ＩＲＡＰピクチャは、イントラ（Ｉｎｔｒａ）符号化（Ｉ）スライスのみを含む。瞬時復号リフレッシュ（ｉｎｓｔａｎｔａｎｅｏｕｓｄｅｃｏｄｉｎｇｒｅｆｒｅｓｈ：ＩＤＲ）ピクチャとは、表（１）に示されるとおり、そのピクチャに対する各ビデオ符号化レイヤＮＡＬユニットが、ＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する、ＩＲＡＰピクチャである。瞬時復号リフレッシュ（ＩＤＲ）ピクチャはＩスライスのみを含み、かつビットストリームにおいて復号順で第１のピクチャであってもよいし、またはビットストリームにおいて後で出現してもよい。各ＩＤＲピクチャは、復号順で符号化ビデオシーケンス（ｃｏｄｅｄｖｉｄｅｏｓｅｑｕｅｎｃｅ：ＣＶＳ）の第１のピクチャである。ブロークンリンクアクセス（ｂｒｏｋｅｎｌｉｎｋａｃｃｅｓｓ：ＢＬＡ）ピクチャとは、表（１）に示されるとおり、そのピクチャに対する各ビデオ符号化レイヤＮＡＬユニットが、ＢＬＡ＿Ｗ＿ＬＰ、ＢＬＡ＿Ｗ＿ＲＡＤＬ、またはＢＬＡ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する、ＩＲＡＰピクチャである。ＢＬＡピクチャはＩスライスのみを含み、かつビットストリームにおいて復号順で第１のピクチャであってもよいし、またはビットストリームにおいて後で出現してもよい。各ＢＬＡピクチャは新たな符号化ビデオシーケンスを開始し、復号プロセスに対してＩＤＲピクチャと同じ効果を有する。しかし、ＢＬＡピクチャは空でない参照ピクチャセットを示すシンタックスエレメントを含む。

表（２）を参照すると、ＮＡＬユニットヘッダシンタックスは、２バイトすなわち１６ビットのデータを含んでもよい。第１のビットは「ｆｏｒｂｉｄｄｅｎ＿ｚｅｒｏ＿ｂｉｔ」であり、このビットはＮＡＬユニットの最初に常に０に設定される。次の６ビットは「ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ」であり、この６ビットは表（１）に示されるとおり、ＮＡＬユニットに含まれるローバイトシーケンスペイロード（ｒａｗｂｙｔｅｓｅｑｕｅｎｃｅｐａｙｌｏａｄｓ）（「ＲＢＳＰ」）データ構造のタイプを示す。次の６ビットは「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」であり、この６ビットはレイヤの識別子を示す。場合によっては、これらの６ビットが代わりに「ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ」と示されることもある。規格の基本仕様において、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓは０に等しくてもよい。スケーラブルビデオ符号化および／またはシンタックス拡張において、ｎｕｈ＿ｌａｙｅｒ＿ｉｄは、この特定のＮＡＬユニットがこれら６ビットの値によって識別されるレイヤに属することを示してもよい。次のシンタックスエレメントは「ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１」である。ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１マイナス１は、ＮＡＬユニットに対する時間識別子を示してもよい。変数時間識別子ＴｅｍｐｏｒａｌＩｄは、ＴｅｍｐｏｒａｌＩｄ＝ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１−１と示され得る。時間識別子ＴｅｍｐｏｒａｌＩｄは、時間サブレイヤを識別するために用いられる。変数ＨｉｇｈｅｓｔＴｉｄは、復号される最高時間サブレイヤを識別する。

図８Ａを参照すると、前述のとおり、ＮＡＬユニットヘッダシンタックスは、２バイトすなわち１６ビットのデータを含んでもよい。第１のビットは「ｆｏｒｂｉｄｄｅｎ＿ｚｅｒｏ＿ｂｉｔ」であり、このビットはＮＡＬユニットの最初に常に０に設定される。次の６ビットは「ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ」であり、この６ビットはＮＡＬユニットに含まれるローバイトシーケンスペイロード（「ＲＢＳＰ」）データ構造のタイプを示す。次の６ビットは「ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ」である。規格の基本仕様において、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓは０に等しくてもよい。所望に応じて、他の値のｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓが示されてもよい。デコーダは、規格の基本仕様に基づいてストリームを処理するときに、０に等しくない値のｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓを有するすべてのＮＡＬユニットを無視（すなわち、ビットストリームから除去して廃棄）してもよい。スケーラブルまたはその他の拡張において、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓは、スケーラブルビデオ符号化および／またはシンタックス拡張をシグナリングするために、その他の値を示し得る。場合によっては、シンタックスエレメントｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓがｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓと呼ばれることがある。場合によっては、図８Ｂおよび図８Ｃに示されるとおり、シンタックスエレメントｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓがｌａｙｅｒ＿ｉｄ＿ｐｌｕｓ１またはｌａｙｅｒ＿ｉｄと呼ばれることがある。この場合、エレメントｌａｙｅｒ＿ｉｄはｌａｙｅｒ＿ｉｄ＿ｐｌｕｓ１マイナス１となる。この場合、このエレメントは、スケーラブル符号化ビデオのレイヤに関係する情報をシグナリングするために使用され得る。次のシンタックスエレメントは「ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１」である。ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１マイナス１は、ＮＡＬユニットに対する時間識別子を示してもよい。変数時間識別子ＴｅｍｐｏｒａｌＩｄは、ＴｅｍｐｏｒａｌＩｄ＝ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１−１と示され得る。

図９を参照すると、一般的なＮＡＬユニットシンタックス構造が示される。図８のＮＡＬユニットヘッダ２バイトシンタックスは、図９のｎａｌ＿ｕｎｉｔ＿ｈｅａｄｅｒ（）に対する参照に含まれる。残りのＮＡＬユニットシンタックスは、主にＲＢＳＰに関する。

「ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓ」を用いるための既存の技術の１つは、ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの６ビットを別個のビットフィールドに分割する、すなわち依存性ＩＤ、品質ＩＤ、ビューＩＤ、および深さフラグのうちの１つまたはそれ以上に分割することによって、スケーラブルビデオ符号化情報をシグナリングすることであり、このビットフィールドの各々は、スケーラブル符号化ビデオの異なるレイヤの識別を示す。したがってこの６ビットは、この特定のＮＡＬユニットがスケーラブル符号化技術のどのレイヤに属するかを示す。次いで、たとえば図１０に示されるビデオパラメータセット（ｖｉｄｅｏｐａｒａｍｅｔｅｒｓｅｔ）（「ＶＰＳ」）拡張シンタックス（「ｓｃａｌａｂｉｌｉｔｙ＿ｔｙｐｅ」）などのデータペイロードにおいて、そのレイヤに関する情報が定められる。図１０のＶＰＳ拡張シンタックスは、符号化ビデオシーケンスにおいて使用されるスケーラビリティタイプと、ＮＡＬユニットヘッダにおけるｌａｙｅｒ＿ｉｄ＿ｐｌｕｓ１（またはｌａｙｅｒ＿ｉｄ）を通じてシグナリングされるディメンジョンとを示すスケーラビリティタイプ（シンタックスエレメントｓｃａｌａｂｉｌｉｔｙ＿ｔｙｐｅ）に対して４ビットを含む。スケーラビリティタイプが０に等しいとき、符号化ビデオシーケンスは基本仕様に適合し、よってすべてのＮＡＬユニットのｌａｙｅｒ＿ｉｄ＿ｐｌｕｓ１は０に等しく、エンハンスメントレイヤまたはビューに属するＮＡＬユニットは存在しない。より高い値のスケーラビリティタイプは、図１１に示されるとおりに解釈される。

ｌａｙｅｒ＿ｉｄ＿ｄｉｍ＿ｌｅｎ［ｉ］は、ｉ番目のスケーラビリティディメンジョンＩＤのビット長を示す。０から７の範囲のすべてのｉ値に対するｌａｙｅｒ＿ｉｄ＿ｄｉｍ＿ｌｅｎ［ｉ］値の合計は６以下である。ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｂｙｔｅ＿ａｌｉｇｎｍｅｎｔ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿ｂｉｔは０である。ｖｐｓ＿ｌａｙｅｒ＿ｉｄ［ｉ］は、以下のレイヤ依存性情報が適用されるｉ番目のレイヤのｌａｙｅｒ＿ｉｄの値を示す。ｎｕｍ＿ｄｉｒｅｃｔ＿ｒｅｆ＿ｌａｙｅｒｓ［ｉ］は、ｉ番目のレイヤが直接依存するレイヤの数を示す。ｒｅｆ＿ｌａｙｅｒ＿ｉｄ［ｉ］［ｊ］は、ｉ番目のレイヤが直接依存するｊ番目のレイヤを識別する。

この態様で、既存の技術は、図１１に挙げられるスケーラビリティタイプにビットを割り当てるために、ＮＡＬユニットおよびビデオパラメータセットにおけるスケーラビリティ識別子をシグナリングする。次いで、図１１は各スケーラビリティタイプに対して、ディメンジョンがいくつとりうるかを定める。たとえば、スケーラビリティタイプ１は２つのディメンジョン（すなわち、空間および品質）を有する。各ディメンジョンに対して、ｌａｙｅｒ＿ｉｄ＿ｄｉｍ＿ｌｅｎ［ｉ］は、これら２つのディメンジョンの各々に割り当てられるビットの数を定め、ｌａｙｅｒ＿ｉｄ＿ｄｉｍ＿ｌｅｎ［ｉ］のすべての値の総計は６以下であり、６はＮＡＬユニットヘッダのｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓにおけるビット数である。よって組み合わせによって、この技術はどのタイプのスケーラビリティが使用されているか、およびＮＡＬユニットヘッダの６ビットがスケーラビリティにどのように割り当てられるかを識別する。

以前に説明されたとおり、スケーラブルビデオ符号化とは、１つまたはそれ以上のサブセットビットストリームをさらに含むビデオビットストリームを符号化する技術である。サブセットビデオビットストリームは、サブセットビットストリームに必要とされる帯域幅を低減させるために、より大きなビデオからパケットを落とすことによって導出され得る。サブセットビットストリームは、より低い空間解像度（より小さいスクリーン）、より低い時間解像度（より低いフレームレート）、またはより低品質のビデオ信号を表し得る。たとえば、ビデオビットストリームは５つのサブセットビットストリームを含んでもよく、各々のサブセットビットストリームはベースビットストリームに付加的な内容を加える。ハンヌクセラ（Ｈａｎｎｕｋｓｅｌａ）ら、「高効率ビデオ符号化（ＨＥＶＣ）のスケーラブル拡張のためのテストモデル（ＴｅｓｔＭｏｄｅｌｆｏｒＳｃａｌａｂｌｅＥｘｔｅｎｓｉｏｎｓｏｆＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ））」ＪＣＴＶＣ−Ｌ０４５３、上海（Ｓｈａｎｇｈａｉ）、２０１２年１０月は、本明細書においてその全体が引用により援用される。チェン（Ｃｈｅｎ）ら、「ＳＨＶＣドラフトテキスト１（ＳＨＶＣＤｒａｆｔＴｅｘｔ１）」、ＪＣＴＶＣ−Ｌ１００８、ジュネーブ（Ｇｅｎｅｖａ）、２０１３年３月は、本明細書においてその全体が引用により援用される。Ｊ．チェン、Ｊ．ボイス（Ｂｏｙｃｅ）、Ｙ．イェ（Ｙｅ）、Ｍハンヌクセラ、ＳＨＶＣドラフト３（ＳＨＶＣＤｒａｆｔ３）、ＪＣＴＶＣ−Ｎ１００８、ウィーン（Ｖｉｅｎｎａ）、２０１３年８月；およびＹ．チェン、Ｙ．−Ｋ．ワン（Ｗａｎｇ）、Ａ．Ｋ．ラマスブロマニアン（Ｒａｍａｓｕｂｒｏｍａｎｉａｎ）、ＭＶ−ＨＥＶＣ／ＳＨＶＣＨＬＳ：クロスレイヤＰＯＣアライメント（Ｃｒｏｓｓ−ｌａｙｅｒＰＯＣＡｌｉｇｎｍｅｎｔ）、ＪＣＴＶＣ−Ｎ０２４４、ウィーン、２０１３年７月の各々は、本明細書においてその全体が引用により援用される。

以前に説明されたとおり、マルチビュービデオ符号化とは、代替ビューを表す１つまたはそれ以上の他のビットストリームをさらに含むビデオビットストリームを符号化する技術である。たとえば、多重ビューは立体ビデオのための一対のビューであってもよい。たとえば、多重ビューは異なる視点からの同じシーンの多重ビューを表してもよい。一般的に、多重ビューは大量のインタービュー統計的依存性を含む。なぜなら、それらの画像は異なる視点からの同じシーンの画像だからである。したがって、時間およびインタービュー予測を組み合わせることによって、効率的なマルチビュー符号化を達成できる。たとえば、時間的に関係するフレームだけでなく、近傍の視点のフレームからも効率的にフレームが予測され得る。ハンヌクセラら、「スケーラブルおよびマルチビュー拡張のための共通仕様テキスト（Ｃｏｍｍｏｎｓｐｅｃｉｆｉｃａｔｉｏｎｔｅｘｔｆｏｒｓｃａｌａｂｌｅａｎｄｍｕｌｔｉ−ｖｉｅｗｅｘｔｅｎｓｉｏｎｓ）」、ＪＣＴＶＣ−Ｌ０４５２、ジュネーブ、２０１３年１月は、本明細書においてその全体が引用により援用される。テック（Ｔｅｃｈ）ら、「ＭＶ−ＨＥＶＣドラフトテキスト３（ＭＶ−ＨＥＶＣＤｒａｆｔＴｅｘｔ３）（ＩＳＯ／ＩＥＣ２３００８−２：２０１ｘ／ＰＤＡＭ２）」、ＪＣＴ３Ｖ−Ｃ１００４＿ｄ３、ジュネーブ、２０１３年１月は、本明細書においてその全体が引用により援用される。Ｇ．テック、Ｋ．ウェグナー（Ｗｅｇｎｅｒ）、Ｙ．チェン、Ｍ．ハンヌクセラ、Ｊ．ボイス、「ＭＶ−ＨＥＶＣドラフトテキスト５（ＭＶ−ＨＥＶＣＤｒａｆｔＴｅｘｔ５）（ＩＳＯ／ＩＥＣ２０３００８−２：２０１ｘ／ＰＤＡＭ２）」、ＪＣＴＶＣ−Ｅ１００４、ウィーン、２０１３年８月は、本明細書においてその全体が引用により援用される。

チェンら、「ＳＨＶＣドラフトテキスト１（ＳＨＶＣＤｒａｆｔＴｅｘｔ１）」、ＪＣＴＶＣ−Ｌ１００８、ジュネーブ、２０１３年１月；ハンヌクセラら、「高効率ビデオ符号化（ＨＥＶＣ）のスケーラブル拡張のためのテストモデル（ＴｅｓｔＭｏｄｅｌｆｏｒＳｃａｌａｂｌｅＥｘｔｅｎｓｉｏｎｓｏｆＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ））」、ＪＣＴＶＣ−Ｌ０４５３−ｓｐｅｃ−ｔｅｘｔ、上海、２０１２年１０月；およびハンヌクセラ、「高効率ビデオ符号化（ＨＥＶＣ）のマルチビュー拡張のためのドラフトテキスト（ＤｒａｆｔＴｅｘｔｆｏｒＭｕｌｔｉｖｉｅｗＥｘｔｅｎｓｉｏｎｏｆＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ（ＨＥＶＣ））」、ＪＣＴＶＣ−Ｌ０４５２−ｓｐｅｃ−ｔｅｘｔ−ｒ１、上海、２０１２年１０月の各々は、本明細書においてその全体が引用により援用され、各々は出力順復号ピクチャバッファ（ＤＰＢ）を有し、出力順復号ピクチャバッファ（ＤＰＢ）は、ＤＰＢからのピクチャ０の出力および除去に対するｓｐｓ＿ｍａｘ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ＨｉｇｈｅｓｔＴｉｄ］、ｓｐｓ＿ｍａｘ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ＨｉｇｈｅｓｔＴｉｄ］、およびｓｐｓ＿ｍａｘ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ［ＨｉｇｈｅｓｔＴｉｄ］シンタックスエレメントの使用に基づいて動作する。この情報は、ベースレイヤに対するビデオパラメータセットにおいてシグナリングされ、もしあればエンハンスメントレイヤを含むビデオ内容に対するバッファリング情報を提供する。

図１２を参照すると、スケーラブル高効率符号化（ｓｃａｌａｂｌｅｈｉｇｈｅｆｆｉｃｉｅｎｃｙｃｏｄｉｎｇ）（「ＳＶＨＣ」）を符号化するとき、ベースレイヤは１つまたはそれ以上のＳＰＳを含んでもよく、さらに１つまたはそれ以上のＰＰＳを含んでもよい。加えて、各エンハンスメントレイヤは１つまたはそれ以上のＳＰＳを含んでもよく、さらに１つまたはそれ以上のＰＰＳを含んでもよい。図１２において、ＳＰＳ＋は１つまたはそれ以上のＳＰＳ、ＰＰＳ＋は１つまたはそれ以上のＰＰＳが特定のベースまたはエンハンスメントレイヤに対してシグナリングされることを示す。この態様で、ベースレイヤおよび１つまたはそれ以上のエンハンスメントレイヤの両方を有するビデオビットストリームに対して、ＳＰＳおよびＰＰＳデータセットの集合的な数が、こうしたデータを送信するために必要とされる帯域幅とともに有意となり、この帯域幅は多くの適用において制限される傾向がある。こうした帯域幅の制限があるために、送信する必要のあるデータを制限し、かつそのデータをビットストリーム内に効果的な態様で位置付けることが望ましい。各レイヤは、あらゆる特定の時間にアクティブにされる１つのＳＰＳおよび／またはＰＰＳを有してもよく、かつ所望に応じて異なるアクティブＳＰＳおよび／またはＰＰＳを選択してもよい。

入力ピクチャは複数の符号化ツリーブロック（例、本明細書においては一般的にブロックと呼ぶ）を含んでもよく、１つまたはいくつかのスライスに分割されてもよい。エンコーダおよびデコーダにおいて用いられる参照ピクチャが同じであり、かつデブロッキングフィルタ処理がスライス境界を越えた情報を使用しないとき、あるスライスが表すピクチャの区域内のサンプルの値は、他のスライスからのデータを使用することなく適切に復号され得る。したがって、あるスライスに対するエントロピー復号およびブロック再構築は、他のスライスに依存しない。特に、エントロピー符号化状態は、各スライスの最初にリセットされてもよい。エントロピー復号および再構築の両方に対する近傍の利用可能性を定めるとき、他のスライスのデータは利用不可能とマーク付けされてもよい。スライスは、並行してエントロピー復号および再構築されてもよい。スライスの境界を越えたイントラ予測および動きベクトル予測は許可されないことが好ましい。これに対し、デブロッキングフィルタ処理は、スライス境界を越えた情報を使用してもよい。

図１３は、水平方向に１１ブロック、鉛直方向に９ブロックを含む例示的ビデオピクチャ２０９０を示す（９つの例示的ブロックが２０９１〜２０９９とラベル付けされる）。図１３は、３つの例示的スライスを示す。すなわち、「ＳＬＩＣＥ＃０」と表示される第１のスライス２０８０、「ＳＬＩＣＥ＃１」と表示される第２のスライス２０８１、および「ＳＬＩＣＥ＃２」と表示される第３のスライス２０８２である。デコーダは、３つのスライス２０８０、２０８１、２０８２を並行して復号および再構築し得る。各々のスライスは、連続的な態様で走査線の順序で送信されてもよい。各スライスに対する復号／再構築プロセスの開始時に、コンテキストモデルは初期化またはリセットされ、他のスライスのブロックは、エントロピー復号およびブロック再構築の両方に対して利用不可能とマーク付けされる。コンテキストモデルは一般的に、エントロピーエンコーダおよび／またはデコーダの状態を表す。よって、たとえば「ＳＬＩＣＥ＃１」内の２０９３とラベル付けされたブロックなどのブロックに対して、「ＳＬＩＣＥ＃０」内のブロック（たとえば２０９１および２０９２とラベル付けされたブロック）は、コンテキストモデル選択または再構築のために使用され得ない。一方で、たとえば「ＳＬＩＣＥ＃１」内の２０９５とラベル付けされたブロックなどのブロックに対して、「ＳＬＩＣＥ＃１」内の他のブロック（たとえば２０９３および２０９４とラベル付けされたブロック）は、コンテキストモデル選択または再構築のために使用され得る。したがって、エントロピー復号およびブロック再構築は、スライス内で連続的に進行する。スライスがフレキシブルブロック順序付け（ｆｌｅｘｉｂｌｅｂｌｏｃｋｏｒｄｅｒｉｎｇ：ＦＭＯ）を用いるものと定められない限り、スライス内のブロックはラスタスキャン順に処理される。

フレキシブルブロック順序付けは、ピクチャがどのようにスライスに分割されるかを修正するためにスライスグループを定める。スライスグループ内のブロックはブロック対スライスグループマップによって定められ、このブロック対スライスグループマップは、スライスヘッダ内のピクチャパラメータセットおよび付加的情報の内容によってシグナリングされる。ブロック対スライスグループマップは、ピクチャ内の各ブロックに対するスライスグループ識別番号からなる。スライスグループ識別番号は、関連ブロックがどのスライスグループに属するかを指定する。各スライスグループは１つまたはそれ以上のスライスに分割されてもよく、スライスとは、特定のスライスグループのブロックのセット内でラスタスキャン順に処理される、同じスライスグループ内の一連のブロックである。エントロピー復号およびブロック再構築は、スライスグループ内で連続的に進行する。

図１４は、３つのスライスグループへの例示的なブロック割り当てを示す。３つのスライスグループとは、「ＳＬＩＣＥＧＲＯＵＰ＃０」と表示される第１のスライスグループ２０８３、「ＳＬＩＣＥＧＲＯＵＰ＃１」と表示される第２のスライスグループ２０８４、および「ＳＬＩＣＥＧＲＯＵＰ＃２」と表示される第３のスライスグループ２０８５である。これらのスライスグループ２０８３、２０８４、２０８５は、ピクチャ２０９０内の２つの前景領域と、背景領域とにそれぞれ関連付けられてもよい。

図１４に示されるスライスの配置は、ラスタスキャンまたはラスタスキャン順としても公知である画像スキャン順での一対のブロック間で各スライスを定めることに限定され得る。このスキャン順スライスの配置は計算上効率的であるが、高効率の並行符号化および復号を受けにくい。さらに、このスライスのスキャン順定義は、符号化効率のために非常に好適な共通の特徴を有すると考えられる画像のより小さな局部的領域をともにグループ化しない傾向がある。図１４に示されるスライス２０８３、２０８４、２０８５の配置は、自身の配置においては柔軟性が高いが、高効率の並行符号化または復号を受けにくい。さらに、この柔軟性の高いスライスの定義は、デコーダにおいて実現するための計算が複雑である。

図１５を参照すると、タイル技術は、画像を（正方形を含む）矩形領域のセットに分割する。各タイル内のブロック（いくつかのシステムにおいては、代替的に最大符号化ユニットまたは符号化ツリーブロックと呼ばれる）は、ラスタスキャン順に符号化および復号される。タイルの配列も、同様にラスタスキャン順に符号化および復号される。したがって、任意の好適な数の列境界（例、０またはそれ以上）が存在してもよく、かつ任意の好適な数の行境界（例、０またはそれ以上）が存在してもよい。よって、フレームはたとえば図１５に示される１つのスライスなどの、１つまたはそれ以上のスライスを定め得る。いくつかの実施形態において、異なるタイルに位置するブロックは、イントラ予測、動き補償、エントロピー符号化コンテキスト選択、または近傍ブロック情報に依拠するその他のプロセスに利用できない。

図１６を参照すると、画像を３つの矩形の列のセットに分割するタイル技術が示される。各タイル内のブロック（いくつかのシステムにおいては、代替的に最大符号化ユニットまたは符号化ツリーブロックと呼ばれる）は、ラスタスキャン順に符号化および復号される。タイルも同様に、ラスタスキャン順に符号化および復号される。タイルのスキャン順において１つまたはそれ以上のスライスが定められてもよい。各々のスライスは独立に復号可能である。たとえば、スライス１はブロック１〜９を含むものと定められてもよく、スライス２はブロック１０〜２８を含むものと定められてもよく、スライス３は３つのタイルにまたがるブロック２９〜１２６を含むものと定められてもよい。タイルの使用によって、フレームのより局部的領域でデータを処理することによって、符号化効率が高まる。

図１７を参照すると、ベースレイヤおよびエンハンスメントレイヤの各々はタイルを含んでもよく、各タイルは集合的にピクチャまたはピクチャの一部を形成する。ベースレイヤおよび１つまたはそれ以上のエンハンスメントレイヤからの符号化ピクチャは、集合的にアクセスユニットを形成し得る。アクセスユニットはＮＡＬユニットのセットとして定義されてもよく、それらのＮＡＬユニットは、指定された分類規則に従って互いに関連付けられ、復号順に連続しており、および／または、（ピクチャ順序カウントもしくは別様で）同じ出力時間に関連するすべての符号化ピクチャのＶＣＬＮＡＬユニットと、ＶＣＬＮＡＬユニットに関連する非ＶＣＬＮＡＬユニットとを含む。ＶＣＬＮＡＬは、ネットワーク抽象化レイヤのビデオ符号化レイヤである。同様に、符号化ピクチャはピクチャの符号化表現として定義されてもよく、アクセスユニット内に特定の値のｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＶＣＬＮＡＬユニットを含み、かつそのピクチャのすべての符号化ツリーユニットを含む。付加的な説明は、Ｂ．ブロス（Ｂｒｏｓ）、Ｗ−Ｊ．ハン（Ｈａｎ）、Ｊ−Ｒ．オーム（Ｏｈｍ）、Ｇ．Ｊ．サリバン（Ｓｕｌｌｉｖａｎ）、およびＴ−．ウィーガンド（Ｗｉｅｇａｎｄ）、「高効率ビデオ符号化（ＨＥＶＣ）テキスト仕様ドラフト１０（Ｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ（ＨＥＶＣ）ｔｅｘｔｓｐｅｃｉｆｉｃａｔｉｏｎｄｒａｆｔ１０）」、ＪＣＴＶＣ−Ｌ１００３、ジュネーブ、２０１３年１月；Ｊ．チェン、Ｊ．ボイス、Ｙ．イェ、Ｍ．Ｍ．ハンヌクセラ、「ＳＨＶＣドラフトテキスト２（ＳＨＶＣＤｒａｆｔＴｅｘｔ２）」、ＪＣＴＶＣ−Ｍ１００８、仁川（Ｉｎｃｈｅｏｎ）、２０１３年５月；Ｇ．テック、Ｋ．ウェグナー、Ｙ．チェン、Ｍ．ハンヌクセラ、Ｊ．ボイス、「ＭＶ−ＨＥＶＣドラフトテキスト４（ＭＶ−ＨＥＶＣＤｒａｆｔＴｅｘｔ４）（ＩＳＯ／ＩＥＣ２３００８−２：２０１ｘ／ＰＤＡＭ２）」、ＪＣＴＶＣ−Ｄ１００４、仁川、２０１３年５月に記載されており、その文献の各々は本明細書においてその全体が引用により援用される。

図１８Ａ〜１８Ｄを参照すると、各スライスはスライスセグメントヘッダを含み得る。場合によっては、スライスセグメントヘッダがスライスヘッダと呼ばれることもある。スライスセグメントヘッダ内には、インターレイヤ予測に用いられるシンタックスエレメントが含まれる。このインターレイヤ予測は、そのスライスが他のどのレイヤに依存し得るかを定める。言換えると、このインターレイヤ予測は、そのスライスが他のどのレイヤを自身の参照レイヤとして用い得るかを定める。参照レイヤは、サンプル予測および／または動きファイル予測のために用いられ得る。たとえば図１９を参照すると、エンハンスメントレイヤ３は、エンハンスメントレイヤ２およびベースレイヤ０に依存し得る。この依存性の関係を、たとえば［２，０］などのリストの形で表現してもよい。

ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいとき、インデックスｊを有するレイヤはインデックスｉを有するレイヤに対する直接参照レイヤではないことが示されることに基づいて、レイヤに対するＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓが導出されてもよい。ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいことは、インデックスｊを有するレイヤがインデックスｉを有するレイヤに対する直接参照レイヤであり得ることを示す。０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１の範囲内のｉおよびｊに対するｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］が存在しないとき、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］は０に等しいと推測される。

ｄｉｒｅｃｔ＿ｄｅｐ＿ｔｙｐｅ＿ｌｅｎ＿ｍｉｎｕｓ２プラス２は、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］シンタックスエレメントのビット数を示す。このバージョンのこの仕様に適合するビットストリームにおいて、ｄｉｒｅｃｔ＿ｄｅｐ＿ｔｙｐｅ＿ｌｅｎ＿ｍｉｎｕｓ２の値は０に等しくなる。このバージョンのこの仕様におけるｄｉｒｅｃｔ＿ｄｅｐ＿ｔｙｐｅ＿ｌｅｎ＿ｍｉｎｕｓ２の値は０に等しくなるが、デコーダは、両端値を含めて０から３０までの範囲内の、その他の値のｄｉｒｅｃｔ＿ｄｅｐ＿ｔｙｐｅ＿ｌｅｎ＿ｍｉｎｕｓ２がシンタックスに出現することを可能にする。

変数ＮｕｍＳａｍｐｌｅＰｒｅｄＲｅｆＬａｙｅｒｓ［ｉ］、ＮｕｍＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒｓ［ｉ］、ＳａｍｐｌｅＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｉ］［ｊ］、およびＭｏｔｉｏｎＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｉ］［ｊ］を導出するために、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］が用いられる。このバージョンのこの仕様に適合するビットストリームにおいて、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］は、両端値を含めて０から２までの範囲内となる。このバージョンのこの仕様において、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］の値は両端値を含めて０から２までの範囲内となるが、デコーダは、両端値を含めて３から２^３２−２までの範囲内のｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］の値がシンタックスに出現することを可能にする。

変数ＮｕｍＳａｍｐｌｅＰｒｅｄＲｅｆＬａｙｅｒｓ［ｉ］、ＮｕｍＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒｓ［ｉ］、ＳａｍｐｌｅＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｉ］［ｊ］、ＭｏｔｉｏｎＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｉ］［ｊ］、ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｉ］、ＤｉｒｅｃｔＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｊ］、ＲｅｆＬａｙｅｒＩｄ［ｉ］［ｊ］、ＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒＩｄ［ｉ］［ｊ］、およびＳａｍｐｌｅＰｒｅｄＲｅｆＬａｙｅｒＩｄ［ｉ］［ｊ］は、以下のとおりに導出される。

ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］、ｄｉｒｅｃｔ＿ｄｅｐ＿ｔｙｐｅ＿ｌｅｎ＿ｍｉｎｕｓ２、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］は、図２０Ａおよび図２０Ｂに示されるｖｐｓ＿ｅｘｔｅｎｓｉｏｎシンタックスに含まれ、このシンタックスは、符号化ビデオシーケンスに対するシンタックスを提供するＶＰＳシンタックスにおける参照によって含まれる。

典型的に、ビットストリーム内でシグナリングされる必要がある、参照されるレイヤの数を低減することが望ましく、こうした低減を実現するために、スライスセグメントヘッダ内のその他のシンタックスエレメントが使用されてもよい。その他のシンタックスエレメントは、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１、および／またはｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］を含み得る。これらのシンタックスエレメントは、スライスセグメントヘッダにおいてシグナリングされ得る。

ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいことは、現ピクチャの復号にインターレイヤ予測が用いられ得ることを示す。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しいことは、現ピクチャの復号にインターレイヤ予測が用いられないことを示す。存在しないとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇの値は０に等しいと推測される。

ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１プラス１は、インターレイヤ予測のために現ピクチャの復号において用いられ得るピクチャの数を示す。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１シンタックスエレメントの長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］））ビットである。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１の値は、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内となる。

変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓは、次のとおりに導出される。

符号化ピクチャのすべてのスライスは、同じ値のＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓを有する。

ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は、インターレイヤ予測のために現ピクチャによって使用され得るｉ番目のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄを表す変数ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］を示す。シンタックスエレメントｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］））ビットである。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内であり得る。存在しないとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は０に等しいと推測される。

たとえば、システムはさまざまなシンタックスエレメント、特にＶＰＳにおけるｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］をシグナリングしてもよく、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］は、レイヤ３に対するインターレイヤ参照ピクチャセットが［２，０］となるようにする。次いでシステムは、［２］などのスライスセグメントヘッダ内のシンタックスエレメントなどの付加的なシンタックスエレメントを使用することによってインターレイヤ参照ピクチャセットをさらに精密化してもよいし、［０］などの付加的なシンタックスエレメントを使用することによってインターレイヤ参照ピクチャセットをさらに精密化してもよいし、または空集合である［］などの付加的なシンタックスエレメントを使用することによってインターレイヤ参照ピクチャセットをさらに精密化してもよい。しかし、エンコーダの設計によっては、［２，０］の参照ピクチャセットが［２，０］としてシグナリングされることもある。

図２１を参照すると、特定のレイヤに対する直接参照レイヤの数（シンタックスにおけるＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｍ＿ｌａｙｅｒ＿ｉｄ］）と、同じ特定のレイヤに対するアクティブ参照レイヤの数（シンタックスにおけるＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ）との比較を含むように、スライスセグメントヘッダが修正されてもよい。特に、この比較は「ｉｆ（ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ！＝ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］）」としてシグナリングされてもよい。よって、もしこれらの数の両方が同数のレイヤを示していれば、ビットストリームにおいてｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］をシグナリングする必要はなく、代わりにすでにシグナリングされた他のシンタックスエレメントに基づいて、こうした値が決定／推測され得る。

図２２を参照すると、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］に対する値を、それらの値をシグナリングせずに推測するために、図２１と類似の態様でスライスセグメントヘッダシグナリングが修正されてもよい。

もしＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓがＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］に等しければ、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は次のとおりに推測され得る。

存在せず、かつＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓがＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］に等しくないとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は０に等しいと推測される。

ｉが０より大きいとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ−１］よりも大きくてもよい。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対するＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］、ＮｕｍＡｃｔｉｖｅＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒｓ、および両端値を含めて０からＮｕｍＡｃｔｉｖｅＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒｓ−１までの範囲内のｊの各値に対するＡｃｔｉｖｅＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒＩｄ［ｊ］の変数は、以下のとおりに導出され得る。

ピクチャのすべてのスライスは、両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、同じ値のｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］を有し得る。

ＶＰＳ拡張において、ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］がシグナリングされる。ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］が０に等しいことは、ＣＶＳ内で、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する非ＩＲＡＰピクチャが、インターレイヤ予測のための参照として使用されないことを示す。ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］が０より大きいことは、ＣＶＳ内で、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄおよびｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］−１より大きいＴｅｍｐｏｒａｌＩｄを有するピクチャが、インターレイヤ予測のための参照として使用されないことを示す。存在しないとき、ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］は未指定である。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、次の２つの条件のいずれかが真であり得ることがビットストリーム適合の要件であってもよい。
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］の値がＴｅｍｐｏｒａｌＩｄより大きい。
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］およびＴｅｍｐｏｒａｌＩｄの値がどちらも０に等しく、かつＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する現アクセスユニット内のピクチャがＩＲＡＰピクチャである。

別の実施形態においては、両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、次の２つの条件のいずれかが真であり得ることがビットストリーム適合の要件であってもよい。
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］の値が、ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する現アクセスユニット内のピクチャのＴｅｍｐｏｒａｌＩｄより大きい。
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］の値が０に等しく、かつＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する現アクセスユニット内のピクチャがＩＲＡＰピクチャである。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、ＳａｍｐｌｅＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］またはＭｏｔｉｏｎＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］の値が１に等しくなることが、ビットストリーム適合の要件であってもよい。

図２３を参照すると、スライスセグメントヘッダをシグナリングするための別の実施形態が示される。

図２３に示される実施形態に対して、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｍａｓｋ［ｉ］が１に等しいことは、レイヤＲｅｆＬａｙｅｒＩｄ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ｉ］がインターレイヤ予測のために現ピクチャによって使用され得ることを示す。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｍａｓｋ［ｉ］が０に等しいことは、レイヤＲｅｆＬａｙｅｒＩｄ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ｉ］がインターレイヤ予測のために現ピクチャによって使用されないことを示す。

存在しないとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｍａｓｋ［ｉ］の値は０に等しいと推測される。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対するＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］、ＮｕｍＡｃｔｉｖｅＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒｓ、および両端値を含めて０からＮｕｍＡｃｔｉｖｅＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒｓ−１までの範囲内のｊの各値に対するＡｃｔｉｖｅＭｏｔｉｏｎＰｒｅｄＲｅｆＬａｙｅｒＩｄ［ｊ］の変数は、次のとおりに導出される。

ピクチャのすべてのスライスは、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内のｉの各値に対して、同じ値のｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｍａｓｋ［ｉ］を有し得る。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、次の２つの条件のいずれかが真となることがビットストリーム適合の要件であってもよい。
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］の値がＴｅｍｐｏｒａｌＩｄより大きい。
ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］およびＴｅｍｐｏｒａｌＩｄの値がどちらも０に等しく、かつＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する現アクセスユニット内のピクチャがＩＲＡＰピクチャである。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、ＳａｍｐｌｅＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］またはＭｏｔｉｏｎＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］の値が１に等しくなり得ることが、ビットストリーム適合の要件であってもよい。

図２３では、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｍａｓｋ［ｉ］が１ビットを用いるｕ（１）によって符号付けされ得ることが示され、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］をシグナリングする図２２は、複数のビットを用い得るｕ（ｖ）によって符号付けされ得る。ある実施形態においては、ｉｎｔｒａ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｉｄｃ［ｉ］の代わりにｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｍａｓｋ［ｉ］がシグナリングされる。

図２４を参照すると、異なるレイヤ（例、ベースレイヤおよび／エンハンスメントレイヤ）の間の、許可される参照相互関係を制限することによって、システムの複雑性を低減するようなプロファイルを定めることが望ましい。一般的に、シンタックス構造は１つのレイヤが複数の他のレイヤを参照することを許可し、その結果として比較的高いデコーダ複雑性および同様に高いエンコーダ複雑性をもたらす。所望であれば、１つのレイヤが最大ただ１つの他のレイヤを参照することをシンタックス構造が許可するような、複雑性を低減したプロファイルに対する修正されたシンタックス構造が使用されてもよい。シンタックス構造に対するこの制限は、１に設定されたｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇを設定することによってシグナリングされ得る。

ＶＰＳ拡張において、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇがシグナリングされる。ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しいことは、ＣＶＳ内の各ピクチャに対するインターレイヤ予測のために最大１つのピクチャが使用されることを示す。ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが０に等しいことは、ＣＶＳ内の各ピクチャに対するインターレイヤ予測のために２つ以上のピクチャが使用され得ることを示す。

ＶＰＳ拡張において、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］がシグナリングされる。ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］は、ｉ番目のレイヤのＶＣＬＮＡＬユニットにおけるｎｕｈ＿ｌａｙｅｒ＿ｉｄシンタックスエレメントの値を示す。両端値を含めて０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲内のｉに対して、存在しないとき、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］の値はｉに等しいと推測される。ｉが０より大きいとき、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］はｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ−１］よりも大きくなる。

あるレイヤに対してただ１つの直接参照レイヤが用いられるか、またはＣＶＳ内の各ピクチャに対するインターレイヤ予測のために最大１つのピクチャが用いられる場合には、たとえば以下のものなどのビットストリーム制約が含まれ得る。
１つの選択においては、もし各レイヤｉ＝１，．．．ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に対するＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］］が１に等しければ、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇは１に等しいことがビットストリーム適合の要件であり得る。
別の選択においては、次のとおりにする。

もし各レイヤｉ＝１，．．．ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に対するＮｕｍＤｉｒＤｅｐＦｌａｇｓ［ｉ］が１に等しければ、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇは１に等しいことがビットストリーム適合の要件であり得る。

別の実施形態においては、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しく設定されているときに、各ピクチャに対して異なる直接依存レイヤからのインターレイヤ参照ピクチャをシグナリングする能力をとりえないことが望ましい。この実施形態の結果として、出力レイヤセットの復号に対する複雑性が低くなる。この実施形態においては、ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓが１に等しいことに関する、下に提案されるビットストリーム制約に従うことが要求され得る。
１つの選択においては、もしｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しければ、各レイヤｉ＝１，．．．ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に対するＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］］は１に等しいことがビットストリーム適合の要件である。
別の選択においては、次のとおりにする。

もしｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しければ、ｉ＝１，．．．ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に対するＮｕｍＤｉｒＤｅｐＦｌａｇｓ［ｉ］は１に等しいことがビットストリーム適合の要件であり得る。

別の実施形態は、インターレイヤ予測シグナリングに関するスライスヘッダにおいて選択されたシンタックスエレメントを条件付きでシグナリングするために、パラメータセット（例、ｐｐｓ、ｓｐｓおよび／またはｖｐｓ）において制御されるゲーティングフラグを含み得る。

図２５を参照すると、たとえばシンタックスエレメントｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１、および／またはｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいときのみスライスセグメントヘッダにおいてシグナリングされる。よって、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇはゲーティングフラグである。

図２６Ａおよび図２６Ｂを参照すると、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、たとえばビデオパラメータセットなどのパラメータセットにおいてシグナリングされてもよい。図２７を参照すると、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、たとえばシーケンスパラメータセットなどのパラメータセットにおいてシグナリングされてもよい。図２８を参照すると、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、たとえばピクチャパラメータセットなどのパラメータセットにおいてシグナリングされてもよい。所望に応じて、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇはビットストリームの別の場所においてシグナリングされてもよい。これらのパラメータセットの各々において、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、図示される場所とは異なる任意の場所において送られてもよい。

ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいことは、スライスセグメントヘッダ内にｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］が存在することを示す。ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しいことは、スライスセグメントヘッダ内にｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］が存在しないことを示す。いくつかの実施形態において、ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇはｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｐｒｅｓｅｎｔ＿ｆｌａｇと呼ばれることもある。

ｉｌｐ＿ｓｌｉｃｅ＿ｓｉｇｎａｌｉｎｇ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］、およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒｓＰｉｃｓの値は次のとおりに推測される。
ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓは次のとおりに推測される。
ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ＝ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］
ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は次のとおりに推測される。

ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１は、ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１に等しいと推測される。
ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇは１に等しいと推測される。

別の実施形態において、シンタックスエレメントの１つまたはそれ以上は、ｕｅ（ｖ）の代わりのｕ（ｖ）の代わりに、既知の固定数のビットを用いてシグナリングされてもよい。たとえば、それらのシンタックスエレメントはｕ（８）またはｕ（１６）またはｕ（３２）またはｕ（６４）などを用いてシグナリングされてもよい。

別の実施形態において、これらのシンタックスエレメントの１つまたはそれ以上は、たとえばｕ（ｖ）符号化などの固定数のビットの代わりに、ｕｅ（ｖ）または何らかのその他の符号化スキームによってシグナリングされてもよい。

別の実施形態において、さまざまなシンタックスエレメントの名称およびそれらのシンタックスエレメントのセマンティクスは、記載されるシンタックスおよびセマンティクスに比べて、ｐｌｕｓ１もしくはｐｌｕｓ２を加算するか、またはｍｉｎｕｓ１もしくはｍｉｎｕｓ２を減算することによって変更されてもよい。

さらに別の実施形態において、さまざまなシンタックスエレメントは、ビットストリーム内のあらゆる場所でピクチャ毎にシグナリングされてもよい。たとえば、それらのシンタックスエレメントは、スライスセグメントヘッダ、ｐｐｓ／ｓｐｓ／ｖｐｓ／もしくはあらゆるその他のパラメータセット、またはビットストリームのその他の規範的部分においてシグナリングされてもよい。

図２９を参照すると、ビデオは、階層的時間予測構造におけるレベルを示す、ＮＡＬユニットヘッダ内の時間識別子によって示される時間サブレイヤをとってもよい。１つの符号化ビデオシーケンスの復号プロセスの際に、復号時間サブレイヤの数が調整され得る。異なるレイヤは、異なる数のサブレイヤを有し得る。たとえば図２９において、ベースレイヤは３つの時間サブレイヤ、すなわちＴｅｍｐｏｒａｌＩｄ０、ＴｅｍｐｏｒａｌＩｄ１、ＴｅｍｐｏｒａｌＩｄ２を含み得る。たとえば、エンハンスメントレイヤ１は４つの時間サブレイヤ、すなわちＴｅｍｐｏｒａｌＩｄ０、ＴｅｍｐｏｒａｌＩｄ１、ＴｅｍｐｏｒａｌＩｄ２、およびＴｅｍｐｏｒａｌＩｄ３を含み得る。アクセスユニットはＮＡＬユニットのセットとして定義されてもよく、それらのＮＡＬユニットは、指定された分類規則に従って互いに関連付けられ、復号順に連続しており、および／または、（ピクチャ順序カウントもしくは別様で）同じ出力時間に関連するすべての符号化ピクチャのＶＣＬＮＡＬユニットと、ＶＣＬＮＡＬユニットに関連する非ＶＣＬＮＡＬユニットとを含む。
図２９において、ベースレイヤは、エンハンスメントレイヤ１よりも低い全フレームレートを有する。たとえば、ベースレイヤのフレームレートは３０Ｈｚすなわち１秒当り３０フレームであってもよい。エンハンスメントレイヤ１のフレームレートは６０Ｈｚすなわち１秒当り６０フレームであってもよい。図２９において、いくつかの出力時間において、アクセスユニットはベースレイヤの符号化ピクチャおよびエンハンスメントレイヤ１の符号化ピクチャを含み得る（例、図２９のアクセスユニットＹ）。図２９において、いくつかの出力時間において、アクセスユニットはエンハンスメントレイヤ１の符号化ピクチャのみを含み得る（例、図２９のアクセスユニットＸ）。

以前に説明されたとおり、１つまたはそれ以上の他のレイヤに対する１つのレイヤの依存性は、シーケンスに対するＶＰＳにおいてシグナリングされてもよい。加えて、それぞれのレイヤ内の各スライスにおいて、スライスセグメントヘッダシンタックスは、それぞれのスライスに対する依存性の１つまたはそれ以上を除去することによって、この依存性をさらに精密化することを可能にする。たとえば、ＶＰＳにおけるレイヤ依存性は、レイヤ３がレイヤ２およびベースレイヤ０に依存することを示してもよい。たとえば、レイヤ３内のスライスは、レイヤ２に対する依存性を除去するようにこの依存性をさらに修正してもよい。

図３０Ａ〜３０Ｄを参照すると、スライスセグメントヘッダ（ｓｌｉｃｅ＿ｓｅｇｍｅｎｔ＿ｈｅａｄｅｒ）は、依存性の識別を容易にするシンタックス構造を含んでおり、そのシンタックス構造の一部が下に抜粋されている。

一例の場合、ベースレイヤは３０ヘルツの速度でピクチャを符号化しており、エンハンスメントレイヤは６０ヘルツの速度でピクチャを符号化しており、ここでエンハンスメントレイヤの１つおきの符号化ピクチャは、ベースレイヤの符号化ピクチャと整列されない。このシナリオは図２９と類似のものである。加えて、一般的にエンハンスメントレイヤの各符号化ピクチャは、ベースレイヤにおける対応する符号化ピクチャを含まなくてもよいことを注記する。場合によっては、エンハンスメントレイヤの符号化ピクチャを有する対応符号化ピクチャがベースレイヤにいくつか存在し得る。残念ながら、このシンタックス構造は、元のビットストリーム内のアクセスユニットにベースレイヤの符号化ピクチャが存在しない場合（例、図２９のアクセスユニットＸ）と、元のビットストリーム内のアクセスユニットにはベースレイヤの符号化ピクチャが存在したが、送信の際に失われた場合との区別ができない。この態様で、ベースレイヤの符号化ピクチャが失われたのか（すなわち損失ピクチャ）、または最初の場所にベースレイヤの符号化ピクチャが存在しなかったのか（すなわち非存在ベースレイヤピクチャ）がデコーダには分からない。

図３０Ａ〜３０Ｄに示されるシンタックスを伴っても、システムがスライスセグメントヘッダにおいてレイヤの除去をシグナリングできない条件が存在することが明らかになっている。こうした条件下では、デコーダは、（参照レイヤが異なるフレームレートを有するために）ビットストリームにそのピクチャが存在しないために、ＡＵが現レイヤの直接参照レイヤに対する符号化ピクチャを有さなかった場合と、現レイヤの直接参照レイヤに対する符号化ピクチャが送信中に失われた場合とを区別できない。この特定の条件は３つの条件を含み、その条件とはすなわち、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しいとき、ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］が１に等しく、および／またはａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが１に等しいことである。これらの条件の各々に対しては、たとえベースレイヤ（すなわち参照レイヤ）が元のビットストリームにピクチャを有さなかったときでも、インターレイヤ参照ピクチャセットに対する復号プロセスの際に「参照ピクチャなし」が推測される。この推測は不正確であり、最適な挙動ではない。このシナリオにおいて、場合によっては、こうした「参照ピクチャなし」に対して利用不可能な参照ピクチャが再生されて、ベースレイヤ（すなわち参照レイヤ）ピクチャとして使用されるために、誤った動作がもたらされる。

この制限を緩和するために、ＳＨＶＣおよび／またはＭＶ−ＨＥＶＣにおいて各レイヤに対する時間サブレイヤの最大数をシグナリングすることが望ましいことが明らかになっている。このシグナリングは、あらゆる好適な態様で達成されてもよい。各レイヤに対する時間サブレイヤの最大数をシグナリングするための第１の技術は、各レイヤに対する最大数を常時明示的にシグナリングすることによるものである。シグナリングのための第２の技術では、各レイヤに対する時間サブレイヤの最大数が、存在フラグにおいて条件付けられてシグナリングされる。シグナリングのための第３の技術では、存在フラグにおいて条件付けられることによって、各レイヤに対する時間サブレイヤの最大数が、前のレイヤに対する時間サブレイヤの最大数に関して予測的に符号化される。加えて、スライスセグメントヘッダシンタックスエレメントｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１およびｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］のセマンティクス、ならびにＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓの導出は、各レイヤに対する時間サブレイヤ情報のシグナリングに基づいて修正されてもよい。付加的または代替的に、損失ピクチャの場合と非存在ピクチャの場合とを同様に明確にするために、スライスセグメントヘッダにおいてＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓに対してｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］がシグナリングされてもよい。

ＨＥＶＣ（ＪＣＴＶＣ−Ｌ１００３）、ＳＨＶＣ（ＪＣＴＶＣ−Ｎ１００８）およびＭＶ−ＨＥＶＣ（ＪＣＴ３Ｖ−Ｅ１００４）においては、次のことが要求される。
−アクセスユニットのすべてのＶＣＬＮＡＬユニットに対するＴｅｍｐｏｒａｌＩｄの値が同じになる。
−アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニットのＶＣＬＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値である。

図３１を参照すると、修正されたｖｐｓ＿ｅｘｐｅｎｓｉｏｎ（）シンタックスは、ビットストリーム全体ではなく、各レイヤに対して存在し得る最大数の時間サブレイヤを明示的にシグナリングすることを含み得る。この態様で、２つの異なるレイヤの各々は、時間サブレイヤの異なる最大数を有し得る。特に、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］プラス１は、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤに対してＣＶＳ内に存在し得る時間サブレイヤの最大数を示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、両端値を含めて０からｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲内となる。存在しないとき、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］はｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に等しくなる。代替的に、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、両端値を含めて０から６までの範囲内であってもよい。代替的に、図３２に示されるとおり、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、ＶＰＳ拡張におけるエンハンスメントレイヤに対してのみシグナリングされてもよい。

図３３を参照すると、修正されたｖｐｓ＿ｅｘｐｅｎｓｉｏｎ（）シンタックスは、存在フラグにおいて条件付けられた、各レイヤに対する最大数をシグナリングすることを含み得る。この態様で、２つの異なるレイヤの各々は、時間サブレイヤの異なる最大数を有し得る。特に、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しいことは、シンタックスエレメントｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］が存在することを示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しいことは、シンタックスエレメントｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］が存在しないことを示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］プラス１は、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤに対してＣＶＳ内に存在し得る時間サブレイヤの最大数を示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、両端値を含めて０からｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲内となる。存在しないとき、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］はｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に等しくなる。代替的に、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、両端値を含めて０から６までの範囲内であってもよい。代替的に、図３４に示されるとおり、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、ＶＰＳ拡張におけるエンハンスメントレイヤに対してのみシグナリングされてもよい。図３５を参照すると、修正されたｖｐｓ＿ｅｘｐｅｎｓｉｏｎ（）シンタックスは、存在フラグにおいて条件付けられることによって、各レイヤに対する時間サブレイヤの最大数を、前のレイヤに対する時間サブレイヤの最大数に関して予測的に符号化することによってシグナリングすることを含み得る。この態様で、２つの異なるレイヤの各々は、時間サブレイヤの異なる最大数を有し得る。特に、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１＿ｐｒｅｄｉｃｔ＿ｆｌａｇ［ｉ］が１に等しいことは、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］がｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ−１］に等しいと推測されることを示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１＿ｐｒｅｄｉｃｔ＿ｆｌａｇ［ｉ］が０に等しいことは、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］が明示的にシグナリングされることを示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１＿ｐｒｅｄｉｃｔ＿ｆｌａｇ［０］の値は、０に等しいと推測される。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］プラス１は、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤに対してＣＶＳ内に存在し得る時間サブレイヤの最大数を示す。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、両端値を含めて１からｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲内となる。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１＿ｐｒｅｄｉｃｔ＿ｆｌａｇ［ｉ］が１に等しいとき、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］はｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ−１］に等しいと推測される。ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［０］の値は、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１に等しいと推測される。代替的に、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、両端値を含めて０から６までの範囲内であってもよい。代替的に、図３６に示されるとおり、ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］の値は、ＶＰＳ拡張におけるエンハンスメントレイヤに対してのみシグナリングされてもよい。

たとえば以下に記載されるとおり、各レイヤに対して存在し得る時間サブレイヤの最大数に関するシグナリング情報を用いる曖昧性を低減するように、前述の３つの条件の１つの出現をＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓの導出が説明するような態様で、スライスセグメントヘッダが修正されてもよい。

ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいことは、現ピクチャの復号においてインターレイヤ予測が用いられ得ることを示す。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しいことは、現ピクチャの復号においてインターレイヤ予測が用いられないことを示す。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１プラス１は、インターレイヤ予測のために現ピクチャの復号において用いられ得るピクチャの数を示す。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１シンタックスエレメントの長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］））ビットである。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１の値は、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内となる。変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓは、次のとおりに導出される。

符号化ピクチャのすべてのスライスは、同じ値のＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓを有する。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は、インターレイヤ予測のために現ピクチャによって用いられ得るｉ番目のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄを表す変数ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］を示す。シンタックスエレメントｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］））ビットである。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内となる。存在しないとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は次のとおりに推測される。

変形実施形態においては、存在しないとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は次のとおりに推測される。

ｉが０より大きいとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］はｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ−１］よりも大きくなる。両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉのすべての値に対して、変数ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］は次のとおりに導出される。

両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、ピクチャのすべてのスライスは、同じ値のｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］を有する。両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉの各値に対して、次の２つの条件のいずれかが真であることが、ビットストリーム適合の要件である。
（１）ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］の値がＴｅｍｐｏｒａｌＩｄより大きい。
（２）ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］］］およびＴｅｍｐｏｒａｌＩｄの値がどちらも０に等しく、かつＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する現アクセスユニット内のピクチャがＩＲＡＰピクチャである。

別の実施形態において、ｉｆ文における条件のいくつかは、記載されるシンタックスに比べて、ｐｌｕｓ１もしくはｐｌｕｓ２を加算するか、またはｍｉｎｕｓ１もしくはｍｉｎｕｓ２を減算することによって変更されてもよい。

図３７を参照すると、付加的なシグナリング技術は、ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］をシグナリングすることを含む。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］が１に等しいことは、ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャが現アクセスユニット内に存在することを示す。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］が０に等しいことは、ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャが現アクセスユニット内に存在しないことを示す。存在しないとき、ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］は１に等しいと推測される。

図３８を参照すると、付加的なシグナリング技術は、ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］をシグナリングすることを含む。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］が１に等しいことは、ＲｅｆＬａｙｅｒＩｄ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャが現アクセスユニット内に存在することを示す。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］が０に等しいことは、ＲｅｆＬａｙｅｒＩｄ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャが現アクセスユニット内に存在しないことを示す。存在しないとき、ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］は１に等しいと推測される。

図３９を参照すると、付加的なシグナリング技術は、ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］をシグナリングすることを含む。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］が１に等しいことは、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャが現アクセスユニット内に存在することを示す。ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］が０に等しいことは、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するピクチャが現アクセスユニット内に存在しないことを示す。存在しないとき、ｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］は１に等しいと推測される。

所望であれば、図３７、図３８および／または図３９において、フラグｌａｙｅｒ＿ｐｒｅｓｅｎｔ＿ｉｎ＿ａｕ＿ｆｌａｇ［ｉ］は次の条件の１つまたはそれ以上が満たされるときにのみシグナリングされてもよい。

第１の条件は、各レイヤに対してただ１つのアクティブ参照レイヤが使用され得る（すなわち、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しい）ときである。

第２の条件は、レイヤ間の直接従属関係によって（例、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］によって）シグナリングされたレイヤに対する直接参照レイヤの数が１に等しい（すなわち、ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］が１に等しい）ことである。

第３の条件は、レイヤ間の直接従属関係によって（例、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］によって）シグナリングされたレイヤに対するすべての直接参照レイヤが１に等しく、そのレイヤの符号化ピクチャに対するアクティブ参照レイヤである（例、ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが１に等しい）ことである。

上記３つの条件に対して図４０、図４１、および図４２に示される３つの変形は、それぞれ図３７、図３８、および図３９に対応する。

図４３を参照すると、インターレイヤ参照ピクチャセットに対する復号プロセスが修正されてもよい。このプロセスの出力は、インターレイヤ参照ピクチャＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１の更新リスト、ならびに変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１である。変数ｃｕｒｒＬａｙｅｒＩｄは、現復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定される。リストＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は最初に空にされ、ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１は０に等しく設定され、その後に図４３に示されるステップが続く。ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１には、「参照ピクチャなし」に等しいエントリは存在しない。すべてのレイヤに対するＶｉｅｗＩｄ［ｉ］の値は０に等しいため、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は常時空である。もし現ピクチャがＲＡＤＬピクチャであれば、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１にはＲＡＳＬピクチャであるエントリは存在しない。アクセスユニットは、ＲＡＳＬおよびＲＡＤＬピクチャの両方を含み得る。

図４４を参照すると、インターレイヤ参照ピクチャセットに対する復号プロセスが修正されてもよい。このプロセスの出力は、インターレイヤ参照ピクチャＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１の更新リスト、ならびに変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１である。変数ｃｕｒｒＬａｙｅｒＩｄは、現復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定される。リストＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は最初に空にされ、ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１は０に等しく設定され、その後に図４４に示されるステップが続く。ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１には、「参照ピクチャなし」に等しいエントリは存在しない。すべてのレイヤに対するＶｉｅｗＩｄ［ｉ］の値は０に等しいため、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は常時空である。もし現ピクチャがＲＡＤＬピクチャであれば、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１にはＲＡＳＬピクチャであるエントリは存在しない。アクセスユニットは、ＲＡＳＬおよびＲＡＤＬピクチャの両方を含み得る。

図４５を参照すると、インターレイヤ参照ピクチャセットに対する復号プロセスが修正されてもよい。このプロセスの出力は、インターレイヤ参照ピクチャＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１の更新リスト、ならびに変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１である。変数ｃｕｒｒＬａｙｅｒＩｄは、現復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定される。リストＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は最初に空にされ、ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１は０に等しく設定され、その後に図４５に示されるステップが続く。ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１には、「参照ピクチャなし」に等しいエントリは存在しない。すべてのレイヤに対するＶｉｅｗＩｄ［ｉ］の値は０に等しいため、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は常時空である。もし現ピクチャがＲＡＤＬピクチャであれば、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１にはＲＡＳＬピクチャであるエントリは存在しない。アクセスユニットは、ＲＡＳＬおよびＲＡＤＬピクチャの両方を含み得る。

図４６を参照すると、インターレイヤ参照ピクチャセットに対する復号プロセスが修正されてもよい。このプロセスの出力は、インターレイヤ参照ピクチャＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１の更新リスト、ならびに変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１である。変数ｃｕｒｒＬａｙｅｒＩｄは、現復号ピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄに等しく設定される。リストＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０およびＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は最初に空にされ、ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ０およびＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ１は０に等しく設定され、その後に図４６に示されるステップが続く。ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１には、「参照ピクチャなし」に等しいエントリは存在しない。すべてのレイヤに対するＶｉｅｗＩｄ［ｉ］の値は０に等しいため、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１は常時空である。もし現ピクチャがＲＡＤＬピクチャであれば、ＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ０またはＲｅｆＰｉｃＳｅｔＩｎｔｅｒＬａｙｅｒ１にはＲＡＳＬピクチャであるエントリは存在しない。アクセスユニットは、ＲＡＳＬおよびＲＡＤＬピクチャの両方を含み得る。

代替的実施形態において、スライスセグメントヘッダにおいてインターレイヤ予測情報をシグナリングするためのシンタックスは、図４７に示されるとおりに修正されてもよい。この場合、シンタックスエレメントｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１、およびｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は、たとえ次の条件の１つまたはそれ以上が真であるときにも、常にシグナリングされる。すなわち、ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１に等しいとき、および／またはＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］が１に等しいとき、および／またはａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが１に等しいときである。
この場合、損失参照レイヤピクチャと、非存在参照レイヤピクチャとに関する曖昧さが取除かれる。この場合には、以下の事項が適用され得る。

ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しいことは、現ピクチャの復号にインターレイヤ予測が用いられ得ることを示す。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０に等しいことは、現ピクチャの復号にインターレイヤ予測が用いられないことを示す。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１プラス１は、インターレイヤ予測のために現ピクチャの復号において用いられ得るピクチャの数を示す。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１シンタックスエレメントの長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］））ビットである。ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１の値は、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内となる。変数ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓは、次のとおりに導出される。

符号化ピクチャのすべてのスライスは、同じ値のＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓを有する。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］は、インターレイヤ予測のために現ピクチャによって用いられ得るｉ番目のピクチャのｎｕｈ＿ｌａｙｅｒ＿ｉｄを表す変数ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］を示す。シンタックスエレメントｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の長さは、Ｃｅｉｌ（Ｌｏｇ２（ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］））ビットである。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］の値は、両端値を含めて０からＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］−１までの範囲内となる。ｉが０より大きいとき、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］はｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ−１］よりも大きくなる。両端値を含めて０からＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ−１までの範囲内のｉのすべての値に対して、変数ＲｅｆＰｉｃＬａｙｅｒＩｄ［ｉ］は次のとおりに導出される。

ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいとき、インデックスｊを有するレイヤはインデックスｉを有するレイヤに対する直接参照レイヤではないことが示されることに基づいて、レイヤに対するＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓが導出されてもよい。ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいことは、インデックスｊを有するレイヤがインデックスｉを有するレイヤに対する直接参照レイヤであり得ることを示す。０からｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１までの範囲内のｉおよびｊに対するｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］が存在しないとき、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］は０に等しいと推測される。

変数ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［ｉ］、ＲｅｆＬａｙｅｒＩｄ［ｉ］［ｊ］ＳａｍｐｌｅＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｉ］［ｊ］、ＭｏｔｉｏｎＰｒｅｄＥｎａｂｌｅｄＦｌａｇ［ｉ］［ｊ］、およびＤｉｒｅｃｔＲｅｆＬａｙｅｒＩｄｘ［ｉ］［ｊ］は、次のとおりに導出され得る。

ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］は、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤと、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤとの間の依存性のタイプを示す。ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］が０に等しいことは、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤが、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのインターレイヤサンプル予測に使用されるが、インターレイヤ動き予測には使用されないことを示す。ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］が１に等しいことは、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤが、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのインターレイヤ動き予測に使用されるが、インターレイヤサンプル予測には使用されないことを示す。ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］が２に等しいことは、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｊ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤが、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤのインターレイヤサンプル動き予測およびインターレイヤ動き予測の両方に使用されることを示す。ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］の値は両端値を含めて０から２までの範囲内になるが、このバージョンのこの仕様において、デコーダは、両端値を含めて３から２^３２−２までの範囲内の値のｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］がシンタックスに出現することを可能にする。

ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］、ｄｉｒｅｃｔ＿ｄｅｐ＿ｔｙｐｅ＿ｌｅｎ＿ｍｉｎｕｓ２、ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｔｙｐｅ［ｉ］［ｊ］は図４８Ａおよび図４８Ｂに示されるｖｐｓ＿ｅｘｔｅｎｓｉｏｎシンタックスに含まれ、このシンタックスは、符号化ビデオシーケンスに対するシンタックスを提供するＶＰＳシンタックスにおける参照によって含まれる。

図４８Ｂにおいて、ｖｐｓ＿ｖｕｉ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１に等しいことは、ＶＰＳ内にｖｐｓ＿ｖｕｉ（）シンタックス構造が存在することを示す。ｖｐｓ＿ｖｕｉ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０に等しいことは、ＶＰＳ内にｖｐｓ＿ｖｕｉ（）シンタックス構造が存在しないことを示す。ｖｐｓ＿ｖｕｉ＿ａｌｉｇｎｍｅｎｔ＿ｂｉｔ＿ｅｑｕａｌ＿ｔｏ＿ｏｎｅは１に等しくてもよい。

ＶＰＳＶＵＩは、インターレイヤ予測の制限を示すシンタックスエレメントを含む。使用される空間セグメント化ツールに本質的に依存して、参照レイヤ内の連結された空間セグメントに関する、スライス、タイル、ウェーブフロント符号化ツリーブロック（ｃｏｄｅｄｔｒｅｅｂｌｏｃｋ：ＣＴＢ）行の単位での遅延がシグナリングされてもよい。加えて、フラグに基づいて、ＣＴＢの単位での遅延がシグナリングされてもよい。これらのインターレイヤ復号遅延シグナリングはレイヤの並行復号を助けることができ、ここで依存レイヤは、自身の復号を開始する前に各参照レイヤ全体が完全に復号されるのを待つ代わりに、各参照レイヤに対して示される遅延の後に復号を開始できる。

図４９は、例示的なＶＰＳビデオユーザビリティ情報（ＶＵＩ）シンタックスの一部を示す。この図面は図４８Ｂのｖｐｓ＿ｖｕｉ（）構造および例示的なｖｐｓ拡張シンタックスに対応し得る。

図５０は、図４９に比べてシンタックスにいくつかの相違を有する、別の例示的なＶＰＳビデオユーザビリティ情報（ＶＵＩ）シンタックスの一部を示す。この図面は図４８Ｂのｖｐｓ＿ｖｕｉ（）構造および例示的なｖｐｓ拡張シンタックスに対応し得る。

ＶＰＳＶＵＩは、ビデオに対するビットレートおよびピクチャレート情報に関するシンタックスエレメントを含む。

ＳＨＶＣにおいて、異なるレイヤは異なるフレームレートを有し得る。その結果、高いフレームレートを有するレイヤは、低いフレームレートを有するレイヤよりも高い値の最大時間サブレイヤを有し得る。サブビットストリーム抽出プロセスが、入力としてのレイヤセットｊおよびそのレイヤセットに関連するレイヤ識別子リストによって呼び出されるとき、サブビットストリーム抽出プロセスの出力はレイヤセットのｊ番目のサブセットである。特定のレイヤセットに対する混合フレームレートの場合、そのレイヤセットにおける時間サブレイヤの最大数は、ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１よりも小さくなり得る。この場合、こうしたレイヤセットの（ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１＋１）サブセットのいくつかが同一となる。これらの同一サブセットに対するビットレートおよびピクチャ情報をシグナリングすることは無駄である。レイヤに対する時間サブレイヤの最大数に関する情報（ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１）は、ＶＰＳにおいてすでにシグナリングされている。

図５０に示されるＶＰＳＶＵＩにおけるビットレートおよびピクチャレート情報のシグナリングの修正は、同一のサブセットに対する情報を送るためにビットを無駄にしないという利益を有する。図５０において、ビットレートおよびピクチャレート情報（ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］、ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］、ａｖｇ＿ｂｉｔ＿ｒａｔｅ［ｉ］［ｊ］、ｍａｘ＿ｂｉｔ＿Ｒａｔｅ［ｉ］［ｊ］、ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］、ａｖｇ＿ｐｉｃ＿ｒａｔｅ［ｉ］［ｊ］を含む）は、対応するレイヤセットにおける最大時間サブレイヤまでしかシグナリングされない。よって、対応するレイヤセットにおける最大時間サブレイヤまでしかサブセットに対するビットレートおよびピクチャレート情報をシグナリングしないことが好ましい。

変数ＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ｉ］は、次のとおりに導出される。

別の実施形態において、変数ＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ｉ］は、次のとおりに導出される。

次いで、サブセットに対するｊインデックスが、両端値を含めて０からｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１の範囲内ではなく、両端値を含めて０からＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ｉ］の範囲内となるように、導出されたＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ｉ］が用いられる。

ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇが１に等しいことは、シンタックスエレメントｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在することを示す。ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇが０に等しいことは、シンタックスエレメントｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在しないことを示す。

ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇが１に等しいことは、シンタックスエレメントｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在することを示す。ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇが０に等しいことは、シンタックスエレメントｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在しないことを示す。

ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットに対するビットレート情報が存在することを示す。ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が０に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットに対するビットレート情報が存在しないことを示す。サブビットストリーム抽出プロセスが、入力としてのレイヤセットｊおよびそのレイヤセットに関連するレイヤ識別子リストによって呼び出されるとき、サブビットストリーム抽出プロセスの出力はレイヤセットのｊ番目のサブセットである。存在しないとき、ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］の値は０に等しいと推測される。

ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットに対するピクチャレート情報が存在することを示す。ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットに対するピクチャレート情報が存在しないことを示す。存在しないとき、ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］の値は０に等しいと推測される。

ａｖｇ＿ｂｉｔ＿ｒａｔｅ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットの平均ビットレートを、ビット毎秒で示す。この値は、関数ＢｉｔＲａｔｅＢＰＳ（）が次のとおりに示されるとき、ＢｉｔＲａｔｅＢＰＳ（ａｖｇ＿ｂｉｔ＿ｒａｔｅ［ｉ］［ｊ］）によって与えられる。

平均ビットレートは、節Ｆ．１３に示されるアクセスユニット除去時間に従って導出される。以下において、ｂＴｏｔａｌはｉ番目のレイヤセットのｊ番目のサブセットのすべてのＮＡＬユニット内のビット数であり、ｔ_１はＶＰＳが適用される第１のアクセスユニットの除去時間（秒）であり、ｔ_２はＶＰＳが適用される（復号順で）最後のアクセスユニットの除去時間（秒）である。ｘがａｖｇ＿ｂｉｔ＿ｒａｔｅ［ｉ］［ｊ］の値を示すとき、以下が適用される。
もしｔ_１がｔ_２に等しくなければ、次の条件が真となる。

そうでなければ（ｔ_１がｔ_２に等しい）、次の条件が真となる。

ｍａｘ＿ｂｉｔ＿ｒａｔｅ＿ｌａｙｅｒ［ｉ］［ｊ］は、節Ｆ．１３に示されるアクセスユニット除去時間の任意の１秒時間ウィンドウにおけるｉ番目のレイヤセットのｊ番目のサブセットのビットレートに対する上限を示す。ビット毎秒でのビットレートに対する上限は、ＢｉｔＲａｔｅＢＰＳ（ｍａｘ＿ｂｉｔ＿ｒａｔｅ＿ｌａｙｅｒ［ｉ］［ｊ］）によって与えられる。ビットレート値は、節Ｆ．１３に示されるアクセスユニット除去時間に従って導出される。以下において、ｔ_１は任意の時点（秒）であり、ｔ_２は

に等しく設定され、ｂＴｏｔａｌはｔ_１以上ｔ_２未満の除去時間を有するアクセスユニットのすべてのＮＡＬユニットにおけるビット数である。ｘがｍａｘ＿ｂｉｔ＿ｒａｔｅ＿ｌａｙｅｒ［ｉ］［ｊ］の値を示すとき、ｔ_１のすべての値が次の条件に従う。

ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］は、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定かどうかを示す。以下において、時間セグメントｔＳｅｇは、ｉ番目のレイヤセットのｊ番目のサブセットの復号順で２つまたはそれ以上の連続アクセスユニットの任意のセットであり、ａｕＴｏｔａｌ（ｔＳｅｇ）は時間セグメントｔＳｅｇ内のアクセスユニットの数であり、ｔ_１（ｔＳｅｇ）は時間セグメントｔＳｅｇの（復号順で）第１のアクセスユニットの除去時間（秒）であり、ｔ_２（ｔＳｅｇ）は時間セグメントｔＳｅｇの（復号順で）最後のアクセスユニットの除去時間（秒）であり、ａｖｇＰｉｃＲａｔｅ（ｔＳｅｇ）は時間セグメントｔＳｅｇにおける平均ピクチャレートであって、次のとおりに示される。

ｉ番目のレイヤセットのｊ番目のサブセットが１つまたは２つのアクセスユニットしか含まないか、またはすべての時間セグメントにわたってａｖｇＰｉｃＲａｔｅ（ｔＳｅｇ）の値が一定であるとき、ピクチャレートは一定である。そうでなければ、ピクチャレートは一定ではない。

ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］が０に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定ではないことを示す。ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］が１に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定であることを示す。ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］が２に等しいことは、ｉ番目のレイヤセットのｊ番目のサブセットのピクチャレートが一定であっても、または一定でなくてもよいことを示す。ｃｏｎｓｔａｎｔ＿ｐｉｃ＿ｒａｔｅ＿ｉｄｃ［ｉ］［ｊ］の値は、両端値を含めて０から２までの範囲内となる。

ａｖｇ＿ｐｉｃ＿ｒａｔｅ［ｉ］は、レイヤセットのｊ番目のサブセットの、２５６秒当りのピクチャの単位での平均ピクチャレートを示す。ａｕＴｏｔａｌはｉ番目のレイヤセットのｊ番目のサブセットにおけるアクセスユニットの数であり、ｔ_１はＶＰＳが適用される第１のアクセスユニットの除去時間（秒）であり、ｔ_２はＶＰＳが適用される（復号順で）最後のアクセスユニットの除去時間（秒）であるとき、以下が適用される。
もしｔ_１がｔ_２に等しくなければ、次の条件が真となる。

現在、ＤＰＢサイズセマンティクスにおけるＪＣＴＶＣ−Ｐ１００８およびＪＣＴ３Ｖ−Ｇ１００４において、変数ＭａｘＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＳｅｔＭｉｎｕｓ１［ｉ］は次のとおりに導出される。

いくつかの実施形態においては、ＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ｉ］の上記の導出および提案される導出が、次のとおりにＭａｘＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＳｅｔＭｉｎｕｓ１［ｉ］の導出と組み合わされてもよい。
変数ＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ｉ］は、次のとおりに導出される。

さらに別の実施形態においては、変数ＭａｘＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＳｅｔＭｉｎｕｓ１［ｉ］の代わりに、変数ＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］が直接用いられてもよい。

よって、ｄｐｂ＿ｓｉｚｅは次のとおりにシグナリングされ得る。

ＭａｘＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＳｅｔＭｉｎｕｓ１［ｉ］を用いるさまざまなパラメータのセマンティクスは、ＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］を直接使用するように変えられ得る。

ｓｕｂ＿ｌａｙｅｒ＿ｆｌａｇ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が１に等しいことは、両端値を含めて１からＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］までの範囲内のｉに対するｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在することを示す。ｓｕｂ＿ｌａｙｅｒ＿ｆｌａｇ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が０に等しいことは、０より大きいｊの各値に対するｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が存在しないことを示し、その値は０に等しいと推測される。

ｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいことは、ｊ番目のサブレイヤに対して、両端値を含めて０からＮｕｍＳｕｂＤｐｂｓ［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］−１までの範囲内のｋに対してｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］が存在し、かつｊ番目のサブレイヤに対してｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ］およびｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］が存在することを示す。ｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいことは、両端値を含めて０からＮｕｍＳｕｂＤｐｂｓ［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］−１までの範囲内のｋに対してｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］の値がｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］に等しく、かつｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ］およびｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］の値がそれぞれｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ−１］およびｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ−１］に等しく設定されることを示す。あらゆる可能な値のｉに対するｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［０］の値は、１に等しいと推測される。存在しないとき、０よりも大きいｊおよびあらゆる可能な値のｉに対するｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］の値は、０に等しいものと等しいと推測される。

ｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］プラス１は、ＨｉｇｈｅｓｔＴｉｄがｊに等しいときの、ピクチャ記憶バッファの単位での、ｉ番目の出力レイヤセットにおけるＣＶＳに対するｋ番目のサブＤＰＢの最大要求サイズを示す。ｊが０より大きいとき、ｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］はｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］以上になる。両端値を含めて１からＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］までの範囲内のｊに対するｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］が存在しないとき、ｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］はｍａｘ＿ｖｐｓ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆｅｒｉｎｇ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］に等しいと推測される。

ｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］プラス１は、ＨｉｇｈｅｓｔＴｉｄがｊに等しいときに、ＤＰＢに保存される必要のあるｉ番目の出力レイヤセットにおけるＣＶＳに対するｋ番目のレイヤの復号ピクチャの最大数を示す。ｊが０より大きいとき、ｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］はｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］以上になる。両端値を含めて０からＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］までの範囲内のｊに対するｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］が存在しないとき、ｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］はｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］に等しいと推測される。

ｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ］は、ＨｉｇｈｅｓｔＴｉｄがｊに等しいときに、復号順でＣＶＳにおけるｉ番目の出力レイヤセットにおける１に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するピクチャを含む任意のアクセスユニットａｕＡに先行でき、かつ出力順で１に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するピクチャを含むアクセスユニットａｕＡに後続できる、１に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するピクチャを含むアクセスユニットの最大許容数を示す。ｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいために、両端値を含めて１からＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］までの範囲内のｊに対するｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ］が存在しないとき、ｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ］はｍａｘ＿ｖｐｓ＿ｎｕｍ＿ｒｅｏｒｄｅｒ＿ｐｉｃｓ［ｉ］［ｊ−１］に等しいと推測される。

ＨｉｇｈｅｓｔＴｉｄがｊに等しいときに、出力順でＣＶＳにおける１に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するピクチャを含む任意のアクセスユニットａｕＡに先行、かつ復号順で１に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するピクチャを含むアクセスユニットａｕＡに後続する、ｉ番目の出力レイヤセットにおける１に等しいＰｉｃＯｕｔｐｕｔＦｌａｇを有するピクチャを含むアクセスユニットの最大数を示すＶｐｓＭａｘＬａｔｅｎｃｙＰｉｃｔｕｒｅｓ［ｉ］［ｊ］の値を計算するために、０に等しくないｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］が使用される。ｓｕｂ＿ｌａｙｅｒ＿ｄｐｂ＿ｉｎｆｏ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいために、両端値を含めて１からＭａｘＳｌＬａｙｅｒｓｅｔＭｉｎｕｓ１［ＬａｙｅｒＳｅｔＩｄｘＦｏｒＯｕｔｐｕｔＬａｙｅｒＳｅｔ［ｉ］］までの範囲内のｊに対するｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］が存在しないとき、ｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］はｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ−１］に等しいと推測される。

ｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］が０に等しくないとき、ＶｐｓＭａｘＬａｔｅｎｃｙＰｉｃｔｕｒｅｓ［ｉ］［ｊ］の値は次のとおりに示される。

ｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］が０に等しいとき、対応する制限は表現されない。ｍａｘ＿ｖｐｓ＿ｌａｔｅｎｃｙ＿ｉｎｃｒｅａｓｅ＿ｐｌｕｓ１［ｉ］［ｊ］の値は、両端値を含めて０から２^３２−２までの範囲内となる。

別の実施形態において、ｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］プラス１は、ＨｉｇｈｅｓｔＴｉｄがｊに等しいときに、ＤＰＢに保存される必要のあるｉ番目の出力レイヤセットにおけるＣＶＳに対するｋ番目のレイヤの復号ピクチャの最大数を示す。ｊが０より大きいとき、ｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］はｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］以上になる。両端値を含めて０からＭａｘＳｕｂＬａｙｅｒｓＩｎＬａｙｅｒＳｅｔＭｉｎｕｓ１［ｉ］までの範囲内のｊに対するｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］が存在しないとき、ｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ］はｍａｘ＿ｖｐｓ＿ｌａｙｅｒ＿ｄｅｃ＿ｐｉｃ＿ｂｕｆｆ＿ｍｉｎｕｓ１［ｉ］［ｋ］［ｊ−１］に等しいと推測される。

ＨＥＶＣ（ＪＣＴＶＣ−Ｌ１００３）、ＳＨＶＣ（ＪＣＴＶＣ−Ｎ１００８）およびＭＶ−ＨＥＶＣ（ＪＣＴ３Ｖ−Ｅ１００４）においては、アクセスユニットのすべてのＶＣＬＮＡＬユニットに対するＴｅｍｐｏｒａｌＩｄの値が同じになることが要求される。アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニットのＶＣＬＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値である。

ＨＥＶＣに対して、アクセスユニットはＮＡＬユニットのセットとして定義され、それらのＮＡＬユニットは指定された分類規則に従って互いに関連付けられ、復号順に連続しており、かつ厳密に１つの符号化ピクチャを含む。

ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいて、アクセスユニットはＮＡＬユニットのセットとして定義され、それらのＮＡＬユニットは指定された分類規則に従って互いに関連付けられ、復号順に連続しており、かつ同じ出力時間に関連するすべての符号化ピクチャのＶＣＬＮＡＬユニットと、ＶＣＬＮＡＬユニットに関連する非ＶＣＬＮＡＬユニットとを含む。

ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいて、ＩＲＡＰピクチャはレイヤ間で整列されない。このことは、異なるレイヤに対する頻度の異なるＩＲＡＰを可能にする。加えて、レイヤ間での非整列は、他のレイヤに対して同じアクセスユニット内でＩＲＡＰピクチャが符号化されることを必要とせずに、任意のレイヤにおけるＩＲＡＰピクチャの柔軟な配置を可能にする。しかし、ＨＥＶＣ、ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいて、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅが両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内にあるとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、ＴｅｍｐｏｒａｌＩｄは０に等しくなる。

よって、ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいては、同じアクセスユニット内の他のレイヤのＩＲＡＰピクチャを必要とすることなく、アクセスユニット内の任意のレイヤにおいてＩＲＡＰピクチャを柔軟に符号化できるが、現在もなお、アクセスユニット内の任意のレイヤにおいてＩＲＡＰピクチャが符号化されるときは、同じアクセスユニット内の他のすべてのレイヤが０に等しいＴｅｍｐｏｒａｌＩｄを有する符号化ピクチャを有さなければならないことが要求される。この要求によって、とり得る符号化構造の柔軟性に対して不必要な制限が加わると言われている。たとえば、以下のシナリオは現在ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいてとりえない。

特定のレイヤ（例、ベースレイヤ）が、各符号化ピクチャがＩＲＡＰピクチャである全イントラ構成によって符号化されるとき、他のすべてのレイヤに対するそれらのアクセスユニット内のすべての連結ピクチャは、０に等しいＴｅｍｐｏｒａｌＩｄによって（０に等しいＴｅｍｐｏｒａｌＩｄを有するＩＲＡＰピクチャまたは非ＩＲＡＰピクチャのいずれかとして）符号化される必要があり、このことはそれらのピクチャに対して時間サブレイヤを使用できないことを意味する。この制限を図５１に示す。よって、現在のＳＨＶＣおよびＭＶ−ＨＥＶＣ仕様による符号化構成は、ベースレイヤのすべての符号化ピクチャがＩＲＡＰピクチャである、図５１に示される構成と類似のものにしかなり得ない。この場合、エンハンスメントレイヤ１に対する同じＡＵ内のすべての符号化ピクチャは、０に等しいＴｅｍｐｏｒａｌＩｄによって符号化される必要がある。

より柔軟な符号化構造を支援するためのＴｅｍｐｏｒａｌＩＤアライメントの変更を以下に説明する。説明される変更は、ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいてより柔軟な符号化構造がとりうることを可能にする。以下に説明される変更によって、図５２に示される符号化構造がとりうる。図５２の符号化構造において、ベースレイヤはすべてＩＲＡＰピクチャである符号化ピクチャからなり、よってそれらの符号化ピクチャは０に等しいＴｅｍｐｏｒａｌＩｄを有する。しかし、同じＡＵ内のエンハンスメントレイヤ１ピクチャは、ＴｅｍｐｏｒａｌＩｄ０とは異なるＴｅｍｐｏｒａｌＩｄによって符号化され得る。よって、ベースレイヤピクチャがＩＲＡＰピクチャであって０に等しいＴｅｍｐｏｒａｌＩｄを有するのと同じＡＵ内で、エンハンスメントレイヤ１ピクチャはＴｅｍｐｏｒａｌＩｄ１を有し得る。

ＳＨＶＣおよびＭＶ−ＨＥＶＣにおいてこの柔軟性を達成するための変更を、次に説明する。

非イントラランダムアクセスポイント（Ｎｏｎ−ｉｎｔｒａｒａｎｄｏｍａｃｃｅｓｓｐｏｉｎｔ：非ＩＲＡＰ）アクセスユニットは、中の「符号化ピクチャ」が「ＩＲＡＰピクチャ」ではない「アクセスユニット」として定義される。

非イントラランダムアクセスポイント（非ＩＲＡＰ）ピクチャは、符号化「ピクチャ」であって、その符号化「ピクチャ」に対する各「ＶＣＬＮＡＬユニット」が、両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内の任意の値を除くＶＣＬＮＡＬユニットタイプ値を有するｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するような符号化「ピクチャ」として定義される。

なお、非ＩＲＡＰピクチャとは、ＢＬＡピクチャでも、ＣＲＡピクチャでも、ＩＤＲピクチャでもないピクチャのことである。

ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１マイナス１は、ＮＡＬユニットに対する時間識別子を示す。ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１の値は０に等しくならない。

変数ＴｅｍｐｏｒａｌＩｄは、ＴｅｍｐｏｒａｌＩｄ＝ｎｕｈ＿ｔｅｍｐｏｒａｌ＿ｉｄ＿ｐｌｕｓ１−１と示され得る。

ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅが両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内にあるとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、ＴｅｍｐｏｒａｌＩｄは０に等しくなる。そうでなければ、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＴＳＡ＿Ｒ、ＴＳＡ＿Ｎ、ＳＴＳＡ＿Ｒ、またはＳＴＳＡ＿Ｎに等しいとき、ＴｅｍｐｏｒａｌＩｄは０に等しくならない。

アクセスユニット内のすべての非ＩＲＡＰ符号化ピクチャのすべてのＶＣＬＮＡＬユニットに対して、ＴｅｍｐｏｒａｌＩｄの値は同じになる。アクセスユニットにおいて、すべてのＶＣＬＮＡＬユニットが両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内のｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、アクセスユニットのＴｅｍｐｏｒａｌＩＤの値は０である。そうでなければ、アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内の非ＩＲＡＰ符号化ピクチャのＶＣＬＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値である。

非ＶＣＬＮＡＬユニットに対するＴｅｍｐｏｒａｌＩｄの値は、次のとおりの制約を受ける。
もしｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＶＰＳ＿ＮＵＴまたはＳＰＳ＿ＮＵＴに等しければ、ＴｅｍｐｏｒａｌＩｄは０に等しくなり、かつＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄは０に等しくなる。
そうでなければ、もしｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＥＯＳ＿ＮＵＴまたはＥＯＢ＿ＮＵＴに等しければ、ＴｅｍｐｏｒａｌＩｄは０に等しくなる。
そうでなければ、もしｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＡＵＤ＿ＮＵＴまたはＦＤ＿ＮＵＴに等しければ、ＴｅｍｐｏｒａｌＩｄは、ＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄに等しくなる。
そうでなければ、ＴｅｍｐｏｒａｌＩｄは、ＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄ以上になる。

なお、ＮＡＬユニットが非ＶＣＬＮＡＬユニットであるとき、ＴｅｍｐｏｒａｌＩｄの値は、その非ＶＣＬＮＡＬユニットが適用されるすべてのアクセスユニットのＴｅｍｐｏｒａｌＩｄ値の最小値に等しい。ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＰＰＳ＿ＮＵＴに等しいとき、すべてのＰＰＳはビットストリームの最初に含まれ得るため、ＴｅｍｐｏｒａｌＩｄは含有アクセスユニットのＴｅｍｐｏｒａｌＩｄ以上であってもよく、ここで第１の符号化ピクチャは０に等しいＴｅｍｐｏｒａｌＩｄを有する。ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＰＲＥＦＩＸ＿ＳＥＩ＿ＮＵＴまたはＳＵＦＦＩＸ＿ＳＥＩ＿ＮＵＴに等しいとき、ＴｅｍｐｏｒａｌＩｄは含有アクセスユニットのＴｅｍｐｏｒａｌＩｄ以上であってもよい。なぜなら、ＳＥＩＮＡＬユニットは、たとえばバッファリング期間ＳＥＩメッセージまたはピクチャタイミングＳＥＩメッセージなどの中に、そのＳＥＩＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄよりも大きなＴｅｍｐｏｒａｌＩｄ値を有するアクセスユニットを含むビットストリームサブセットに適用される情報を含み得るからである。

変形実施形態において、ＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内の両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内の値を除く任意の値に等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するすべてのＶＣＬＮＡＬユニットに対して同じになる。アクセスユニットにおいて、すべてのＶＣＬＮＡＬユニットが、両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内のｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、アクセスユニットのＴｅｍｐｏｒａｌＩＤの値は０である。そうでなければ、アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内の非ＩＲＡＰ符号化ピクチャのＶＣＬＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値である。

別の変形実施形態において、ＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内の両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内の値を除く任意の値に等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するすべてのＶＣＬＮＡＬユニットに対して同じになる。アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内のＶＣＬＮＡＬユニットの最高ＴｅｍｐｏｒａｌＩｄの値である。

さらなる変形実施形態において、ＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内のすべての非ＩＲＡＰ符号化ピクチャのすべてのＶＣＬＮＡＬユニットに対して同じになる。アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内のＶＣＬＮＡＬユニットの最高ＴｅｍｐｏｒａｌＩｄの値である。

以前に述べたとおり、ＨＥＶＣ（ＪＣＴＶＣ−Ｌ１００３）、ＳＨＶＣ（ＪＣＴＶＣ−Ｎ１００８）およびＭＶ−ＨＥＶＣ（ＪＣＴ３Ｖ−Ｅ１００４）においては、アクセスユニットのすべてのＶＣＬＮＡＬユニットに対してＴｅｍｐｏｒａｌＩｄの値が同じになることが要求される。

加えてＨＥＶＣ、ＳＨＶＣ、およびＭＶ−ＨＥＶＣにおいて、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅが両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内にあるとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、ＴｅｍｐｏｒａｌＩｄは０に等しくなる。

さらに、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＴＳＡ＿Ｒ、ＴＳＡ＿Ｎ、ＳＴＳＡ＿Ｒ、またはＳＴＳＡ＿Ｎに等しいとき、ＴｅｍｐｏｒａｌＩｄは０に等しくならないことが要求される。

加えてＨＥＶＣ、ＳＨＶＣ、およびＭＶ−ＨＥＶＣにおいては、次のとおりのさらなる制限が存在する。
レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。
レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

よって、ＨＥＶＣ、ＳＨＶＣ、およびＭＶ−ＨＥＶＣにおける現在のすべての制限によって、同じアクセスユニット内の任意の他のピクチャがＩＲＡＰピクチャであるときに、レイヤはＴＳＡまたはＳＴＳＡピクチャを符号化できない。さらにこの場合には、レイヤの直接および間接参照レイヤにおいてＴＳＡまたはＳＴＳＡピクチャを符号化する必要がある。この現在の制限が図５３に示されており、この制限によって符号化構造の柔軟性が低くなる。図５３において、エンハンスメントレイヤ１は、ベースレイヤを自身の直接参照レイヤとして使用している。エンハンスメントレイヤ１においてＴＳＡピクチャが符号化されているとき、ベースレイヤの同じアクセスユニットにおいてＴＳＡピクチャが符号化される必要がある。同様に、エンハンスメントレイヤ１においてＳＴＳＡピクチャが符号化されているとき、ベースレイヤの同じアクセスユニットにおいてＳＴＳＡピクチャが符号化される必要がある。このことが柔軟性を制限する。

より柔軟なシナリオにおいては、もしＩＤＲピクチャが直接または間接参照レイヤの１つにおいて符号化されることができ、かつＴＳＡまたはＳＴＳＡピクチャが他のレイヤにおいて符号化されることができれば、そのアクセスユニットにおける時間レイヤアップスイッチングをなおもとりうる。図５４は、こうした柔軟な符号化構造を示す。図５４の符号化構造において、エンハンスメントレイヤ１においてＴＳＡピクチャが符号化されているとき、図５３と同様にベースレイヤの同じアクセスユニットにおいてＴＳＡピクチャが符号化されてもよい。このシナリオは図５４に示されていないがとりうる。加えて図５４に示されるとおり、出力時間ｔ２において、エンハンスメントレイヤ１においてＴＳＡピクチャが符号化されているとき、ベースレイヤの同じアクセスユニットにおいてＩＤＲピクチャ（または変形実施形態においてはＩＲＡＰピクチャ）が符号化されてもよい。同様に図５４に示されるとおり、出力時間ｔ３において、エンハンスメントレイヤ１においてＳＴＳＡピクチャが符号化されているとき、ベースレイヤの同じアクセスユニットにおいてＩＤＲピクチャ（または変形実施形態においてはＩＲＡＰピクチャ）が符号化されてもよい。加えて、図５４の符号化構造において、エンハンスメントレイヤ１においてＳＴＳＡピクチャが符号化されているとき、図５３と同様にベースレイヤの同じアクセスユニットにおいてＳＴＳＡピクチャが符号化されてもよい。このシナリオは図５４に示されていないがとりうる。図５４に示される全体の柔軟性は、現在ＳＨＶＣおよびＭＶ−ＨＥＶＣによって許容されていない。

より柔軟な符号化構造を支援するための、ＴＳＡおよびＳＴＳＡピクチャのアライメントの変更を次に説明する。これらの変更は、ＴＳＡおよびＳＴＳＡピクチャを使用するときに、図５４に示される符号化構造の例およびその他の類似の柔軟な符号化構造を可能にするものである。

ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅは、表（１）に示されるとおりのＮＡＬユニットに含まれるＲＢＳＰデータ構造のタイプを示す。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＴＳＡ＿ＮまたはＴＳＡ＿ＲまたはＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＳＴＳＡ＿ＮまたはＳＴＳＡ＿ＲまたはＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

変形実施形態において、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅは、表（１）に示されるとおりのＮＡＬユニットに含まれるＲＢＳＰデータ構造のタイプを示す。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＴＳＡ＿ＮまたはＴＳＡ＿ＲまたはＩＤＲ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＳＴＳＡ＿ＮまたはＳＴＳＡ＿ＲまたはＩＤＲ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＴＳＡ＿ＮまたはＴＳＡ＿ＲまたはＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰまたはＢＬＡ＿Ｗ＿ＬＰまたはＢＬＡ＿Ｗ＿ＲＡＤＬまたはＢＬＡ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＳＴＳＡ＿ＮまたはＳＴＳＡ＿ＲまたはＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰまたはＢＬＡ＿Ｗ＿ＬＰまたはＢＬＡ＿Ｗ＿ＲＡＤＬまたはＢＬＡ＿Ｎ＿ＬＰに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＴＳＡ＿ＮまたはＴＳＡ＿ＲまたはＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰまたはＢＬＡ＿Ｗ＿ＬＰまたはＢＬＡ＿Ｗ＿ＲＡＤＬまたはＢＬＡ＿Ｎ＿ＬＰまたはＣＲＡ＿ＮＵＴに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＳＴＳＡ＿ＮまたはＳＴＳＡ＿ＲまたはＩＤＲ＿Ｗ＿ＲＡＤＬまたはＩＤＲ＿Ｎ＿ＬＰまたはＢＬＡ＿Ｗ＿ＬＰまたはＢＬＡ＿Ｗ＿ＲＡＤＬまたはＢＬＡ＿Ｎ＿ＬＰまたはＣＲＡ＿ＮＵＴに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有する。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＴＳＡ＿ＮまたはＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するか、またはまたは、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅは両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内にある。

レイヤｌａｙｅｒＡの１つのピクチャｐｉｃＡがＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、ｌａｙｅｒＡの直接または間接参照レイヤにおけるｐｉｃＡと同じアクセスユニット内の各ピクチャは、ＳＴＳＡ＿ＮまたはＳＴＳＡ＿Ｒに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するか、または、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅは両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内にある。

ｎｕｈ＿ｌａｙｅｒ＿ｉｄはレイヤの識別子を示す。

ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＡＵＤ＿ＮＵＴに等しいとき、ｎｕｈ＿ｌａｙｅｒ＿ｉｄの値は、アクセスユニット内のすべてのＶＣＬＮＡＬユニットのｎｕｈ＿ｌａｙｅｒ＿ｉｄ値の最小値に等しくなる。

ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＶＰＳ＿ＮＵＴに等しいとき、ｎｕｈ＿ｌａｙｅｒ＿ｉｄの値は０に等しくなる。デコーダは、ＶＰＳ＿ＮＵＴに等しいｎａｌ＿ｕｎｉｔ＿ｔｙｐｅおよび０より大きいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するＮＡＬユニットを無視する。

変数ＴｅｍｐｏｒａｌＩｄは次のとおりに示される。

ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅが両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内にあるとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、ＴｅｍｐｏｒａｌＩｄは０に等しくなる。そうでなければ、ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＴＳＡ＿Ｒ、ＴＳＡ＿Ｎ、ＳＴＳＡ＿Ｒ、またはＳＴＳＡ＿Ｎに等しいとき、ＴｅｍｐｏｒａｌＩｄは０に等しくならない。
アクセスユニット内のすべての非ＩＲＡＰ符号化ピクチャのすべてのＶＣＬＮＡＬユニットに対して、ＴｅｍｐｏｒａｌＩｄの値は同じになる。アクセスユニットにおいて、すべてのＶＣＬＮＡＬユニットが両端値を含めてＢＬＡ＿Ｗ＿ＬＰからＲＳＶ＿ＩＲＡＰ＿ＶＣＬ２３までの範囲内のｎａｌ＿ｕｎｉｔ＿ｔｙｐｅを有するとき、すなわち符号化スライスセグメントがＩＲＡＰピクチャに属するとき、アクセスユニットのＴｅｍｐｏｒａｌＩＤの値は０である。そうでなければ、アクセスユニットのＴｅｍｐｏｒａｌＩｄの値は、アクセスユニット内の非ＩＲＡＰ符号化ピクチャのＶＣＬＮＡＬユニットのＴｅｍｐｏｒａｌＩｄの値である。

非ＶＣＬＮＡＬユニットに対するＴｅｍｐｏｒａｌＩｄの値は、次のとおりの制約を受ける。
もしｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＶＰＳ＿ＮＵＴまたはＳＰＳ＿ＮＵＴに等しければ、ＴｅｍｐｏｒａｌＩｄは０に等しくなり、かつＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄは０に等しくなる。
そうでなければ、もしｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＥＯＳ＿ＮＵＴまたはＥＯＢ＿ＮＵＴに等しければ、ＴｅｍｐｏｒａｌＩｄは０に等しくなる。
そうでなければ、もしｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＡＵＤ＿ＮＵＴまたはＦＤ＿ＮＵＴに等しければ、ＴｅｍｐｏｒａｌＩｄは、ＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄに等しくなる。
そうでなければ、ＴｅｍｐｏｒａｌＩｄは、ＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄ以上になる。
ＮＡＬユニットが非ＶＣＬＮＡＬユニットであるとき、ＴｅｍｐｏｒａｌＩｄの値は、その非ＶＣＬＮＡＬユニットが適用されるすべてのアクセスユニットのＴｅｍｐｏｒａｌＩｄ値の最小値に等しい。ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＰＰＳ＿ＮＵＴに等しいとき、すべてのＰＰＳはビットストリームの最初に含まれ得るため、ＴｅｍｐｏｒａｌＩｄは含有アクセスユニットのＴｅｍｐｏｒａｌＩｄ以上であってもよく、ここで第１の符号化ピクチャは０に等しいＴｅｍｐｏｒａｌＩｄを有する。ｎａｌ＿ｕｎｉｔ＿ｔｙｐｅがＰＲＥＦＩＸ＿ＳＥＩ＿ＮＵＴまたはＳＵＦＦＩＸ＿ＳＥＩ＿ＮＵＴに等しいとき、ＴｅｍｐｏｒａｌＩｄは含有アクセスユニットのＴｅｍｐｏｒａｌＩｄ以上であってもよい。なぜなら、ＳＥＩＮＡＬユニットは、たとえばバッファリング期間ＳＥＩメッセージまたはピクチャタイミングＳＥＩメッセージなどの中に、そのＳＥＩＮＡＬユニットを含むアクセスユニットのＴｅｍｐｏｒａｌＩｄよりも大きなＴｅｍｐｏｒａｌＩｄ値を有するアクセスユニットを含むビットストリームサブセットに適用される情報を含み得るからである。

あるべきまたは必要であるとして示される特徴のいずれかが、所望に応じて省略されてもよいことが理解されるべきである。加えて、それらの特徴が所望に応じて異なる組み合わせで組み合わされてもよい。

「コンピュータ読取り可能媒体」という用語は、コンピュータまたはプロセッサによるアクセスが可能なあらゆる利用可能な媒体を示す。本明細書において用いられる「コンピュータ読取り可能媒体」という用語は、非一時的かつ有形なコンピュータおよび／またはプロセッサ読取り可能媒体を示し得る。限定ではなく例として、コンピュータ読取り可能媒体またはプロセッサ読取り可能媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭもしくはその他の光ディスク記憶装置、磁気ディスク記憶装置もしくはその他の磁気記憶装置、または、命令もしくはデータ構造の形の所望のプログラムコードを保有もしくは保存するために使用でき、かつコンピュータもしくはプロセッサによるアクセスが可能なあらゆるその他の媒体を含んでもよい。本明細書において用いられるディスク（Ｄｉｓｋ）およびディスク（ｄｉｓｃ）は、コンパクトディスク（ｃｏｍｐａｃｔｄｉｓｃ：ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ｄｉｇｉｔａｌｖｅｒｓａｔｉｌｅｄｉｓｃ：ＤＶＤ）、フロッピー（登録商標）ディスク、およびＢｌｕ−ｒａｙ（登録商標）ディスクを含み、ここでディスク（ｄｉｓｋ）は通常データを磁気的に再生するのに対し、ディスク（ｄｉｓｃ）はデータをレーザによって光学的に再生する。

なお、本明細書に記載される方法の１つまたはそれ以上が、ハードウェアにおいて実施されるか、および／またはハードウェアを用いて実行されてもよい。たとえば、本明細書に記載される方法またはアプローチの１つまたはそれ以上が、チップセット、ＡＳＩＣ、大規模集積回路（ＬＳＩ）、もしくは集積回路などにおいて実施されるか、および／またはこうした回路を用いて実現されてもよい。

本明細書において開示される各々の方法は、記載される方法を達成するための１つまたはそれ以上のステップまたは動作を含む。これらの方法ステップおよび／または動作は、請求項の範囲から逸脱することなく互いに交換されても、および／または組み合わされて単一のステップにされてもよい。言換えると、記載される方法の適切な動作のために特定の順序のステップまたは動作が必要とされるのでない限り、特定のステップおよび／または動作の順序および／または使用は、請求項の範囲から逸脱することなく修正され得る。

請求項は上記に示された厳密な構成および構成要素に限定されないことが理解されるべきである。請求項の範囲から逸脱することなく、本明細書に記載されるシステム、方法および装置の配置、動作および詳細にさまざまな修正、変更および変形が行われ得る。

Claims

ビデオビットストリームを復号するための方法であって、
（ａ）レイヤセットを含む前記ビデオビットストリームを受信するステップであって、前記レイヤセットは前記ビットストリームの複数の異なるレイヤを識別し、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、
（ｂ）前記ビデオビットストリームの少なくとも１つのレイヤに関する情報を含むビデオパラメータセットを受信するステップと、
（ｃ）前記複数の異なるレイヤおよび前記複数の時間サブレイヤに関するデータを含む、前記ビデオパラメータセットによって参照されるビデオパラメータセット拡張を受信するステップと、
（ｄ）複数の時間サブレイヤに関する前記情報が存在するかどうかを示す、前記ビデオパラメータセット拡張内のビデオパラメータセット時間サブレイヤ情報存在フラグを受信するステップと
を含む、方法。
複数の時間サブレイヤに関する前記情報は、前記複数の異なるレイヤに対して存在し得る前記複数の時間サブレイヤの最大値マイナス１を示す、請求項１に記載の方法。
前記ビデオパラメータセットサブレイヤ存在フラグが１に等しいことは、前記複数の時間サブレイヤに関する情報の前記存在が存在することを示す、請求項２に記載の方法。
前記ビデオパラメータセットサブレイヤ存在フラグが０に等しいことは、前記複数の時間サブレイヤに関する情報の前記存在が存在しないことを示す、請求項３に記載の方法。
前記ビデオパラメータセットサブレイヤ存在フラグが前記１に等しいとき、前記シンタックスエレメントｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］が存在する、請求項４に記載の方法。
前記ビデオパラメータセットサブレイヤ存在フラグが前記０に等しいとき、前記シンタックスエレメントｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］が存在しない、請求項５に記載の方法。
複数の時間サブレイヤに関する前記情報は、前記複数の異なるレイヤに対して存在し得る前記複数の時間サブレイヤの最大値マイナス１を示し、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］に等しいｎｕｈ＿ｌａｙｅｒ＿ｉｄを有するレイヤに対してシンタックスエレメントｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］によって示される、請求項２に記載の方法。
ビデオビットストリームを復号するための方法であって、
（ａ）レイヤセットを含む前記ビデオビットストリームを受信するステップであって、前記レイヤセットは前記ビットストリームの複数の異なるレイヤを識別し、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、
（ｂ）前記複数の異なるレイヤおよび前記複数のサブレイヤに関するデータを含むビデオパラメータセット拡張を受信するステップと、
（ｄ）特定のレイヤセットに対する時間サブレイヤの０から最大数までに対して、（１）ビットレート存在フラグ、（２）ピクチャレート存在フラグ、（３）ビットレート情報、（４）ピクチャレート情報を受信するステップと
を含む、方法。
前記特定のレイヤセットに対する前記時間サブレイヤの最大数は、前記レイヤセットに対する前記ビデオ内に存在し得る時間サブレイヤの数以下である、請求項８に記載の方法。
前記複数の異なるレイヤおよび前記複数の時間サブレイヤに関する前記ビデオ前記データは、ビデオパラメータセット拡張に含まれる、請求項９に記載の方法。
前記レイヤセットの前記レイヤの第１のものは、存在し得る時間サブレイヤの第１の数を有し、前記レイヤセットの前記レイヤの第２のものは、存在し得る時間サブレイヤの第２の数を有し、前記時間サブレイヤの第１の数は前記時間サブレイヤの第２の数とは異なり、前記レイヤセットに対する前記時間サブレイヤの最大数は、前記時間サブレイヤの第１の数および前記時間サブレイヤの第２の数のうち大きい方の数である、請求項１０に記載の方法。
前記最大数は、前記最大数マイナス１である、請求項１１に記載の方法。
前記時間サブレイヤの最大数は、前記時間サブレイヤの最大数マイナス１である、請求項１０に記載の方法。
前記時間サブレイヤの最大数は、前記時間サブレイヤの最大数マイナス１である、請求項８に記載の方法。
（１）ビットレート存在フラグ、（２）ピクチャレート存在フラグ、（３）ビットレート情報、（４）ピクチャレート情報を受信する前記ステップは、特定のレイヤセットに対する時間サブレイヤの最大数＋１から、ビットストリーム内に存在し得る時間サブレイヤの最大数までの、時間サブレイヤに対する情報を受信するステップを含まない、請求項８に記載の方法。
ビデオビットストリームを復号するための方法であって、
（ａ）複数の異なるレイヤを含む前記ビデオビットストリームを受信するステップであって、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、
（ｂ）前記複数の時間サブレイヤのうちの１つの第１のフレームの一部として第１のスライスを含む、前記ビデオビットストリームを受信するステップと、
（ｃ）前記複数の時間サブレイヤのうちの別の１つの第２のフレームの一部として第２のスライスを含む、前記ビデオビットストリームを受信するステップと、
（ｄ）前記ビデオビットストリームの前記第１のスライスに関する情報を含む、第１のスライスセグメントヘッダを受信するステップと、
（ｅ）前記第１のスライスに対するインターレイヤ予測に用いられ得る前記第１のスライスに対するアクティブ参照レイヤピクチャとして前記第２のスライスを含ませるかどうかを判定するために、ビデオパラメータセットからの時間サブレイヤ最大値と、前記第２のフレームの時間識別子とを比較するステップと
を含む、方法。
前記比較するステップは、ビデオパラメータセットからの時間サブレイヤ最大値に基づくものである、請求項１６に記載の方法。
前記比較するステップは、前記サブレイヤビデオパラメータセット最大値マイナス１に基づくものである、請求項１７に記載の方法。
前記第１のスライスに対する前記アクティブ参照レイヤピクチャの総数が定められる、請求項１８に記載の方法。
前記アクティブ参照レイヤピクチャの前記総数はＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓである、請求項１９に記載の方法。
ビデオパラメータセットからの時間サブレイヤ最大値が前記第２のフレームの時間識別子以上であるとき、前記第１のスライスに対するインターレイヤ予測に使用され得る前記第１のスライスに対するアクティブ参照レイヤピクチャとして、前記第２のスライスが使用され得る、請求項１６に記載の方法。
ビデオパラメータセットからの時間サブレイヤ最大値が前記第２のフレームの時間識別子未満であるとき、前記第２のスライスは、前記第１のスライスに対するアクティブ参照レイヤピクチャとして使用されないことがある、請求項１６に記載の方法。
ビデオビットストリームを復号するための方法であって、
（ａ）複数の異なるレイヤを含む前記ビデオビットストリームを受信するステップであって、前記複数の異なるレイヤの少なくとも１つは複数の時間サブレイヤを含む、ステップと、
（ｂ）前記複数の時間サブレイヤのうちの１つの第１のフレームの一部として第１のスライスを含む、前記ビデオビットストリームを受信するステップと、
（ｃ）前記ビデオビットストリームの前記第１のスライスに関する情報を含む第１のスライスセグメントヘッダを受信するステップと、
（ｄ）前記第１のスライスセグメントヘッダとともに時間識別子およびｎａｌユニットタイプを受信するステップとを含み、
（ｅ）もし前記ｎａｌユニットタイプがＩＲＡＰピクチャであれば、前記時間識別子に基づいて導出されるＴｅｍｐｏｒａｌＩｄは０に等しく、
（ｆ）もし前記ｎａｌユニットタイプがＴＳＡおよびＴＳＡ＿Ｎの少なくとも１つであれば、前記ＴｅｍｐｏｒａｌＩｄは０に等しくなく、
（ｇ）もし前記ｎａｌユニットタイプがＳＴＳＡ＿ＲおよびＳＴＳＡ＿Ｎの少なくとも１つであれば、前記ＴｅｍｐｏｒａｌＩｄは０に等しくない、方法。