JP7490592B2

JP7490592B2 - 映像の復号化方法及びこれを利用する装置

Info

Publication number: JP7490592B2
Application number: JP2021022000A
Authority: JP
Inventors: リー、ハ、ヒョン; カン、ジョン、ウォン; リー、ジン、ホ; チェ、ジン、ス; キム、ジン、ウン
Original assignee: Electronics and Telecommunications Research Institute ETRI
Current assignee: Electronics and Telecommunications Research Institute ETRI
Priority date: 2014-01-02
Filing date: 2021-02-15
Publication date: 2024-05-27
Anticipated expiration: 2034-12-17
Also published as: KR102294092B1; US10397584B2; EP3086555A1; EP3086555A4; JP2023072090A; JP2021101538A; KR20150081229A; KR20220106094A; KR102423851B1; JP2019134444A; US9967571B2; EP3937494A1; US10326997B2; KR20210105868A; US20180213238A1; US10291920B2; US20180213237A1; US20180288421A1; CN105122799A; US20230114591A1

Description

本発明は、映像の符号化及び復号化処理に関し、より詳しくはビットストリーム内の複数のレイヤを支援する映像の符号化及び復号化方法及び装置に関する。

最近、ＨＤ（ＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）解像度を有する放送サービスが韓国内だけでなく世界的に拡大されるに伴い、多くの使用者が高解像度、高画質の映像に慣れており、これによって多くの機関が次世代映像機器に対する開発に拍車をかけている。また、ＨＤＴＶとともにＨＤＴＶの４倍以上の解像度を有するＵＨＤ（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎ）に対する関心が増大しながら、より高い解像度、高画質の映像に対する圧縮技術が要求されている。

映像圧縮のために、時間的に以前及び／又は以後のピクチャから現在ピクチャに含まれた画素値を予測するインター（ｉｎｔｅｒ）予測技術、現在ピクチャ内の画素情報を利用して現在ピクチャに含まれた画素値を予測するイントラ（ｉｎｔｒａ）予測技術、出現頻度の高いシンボル（ｓｙｍｂｏｌ）に短い符号を割り当て、出現頻度の低いシンボルに長い符号を割り当てるエントロピー符号化技術などが用いられ得る。

映像圧縮技術には、流動的なネットワーク環境を考慮することなく、ハードウェアの制限的な動作環境下で一定のネットワーク帯域幅を提供する技術がある。しかし、随時に帯域幅が変化するネットワーク環境に適用される映像データを圧縮するためには新しい圧縮技術が要求され、このためにスケーラブル（ｓｃａｌａｂｌｅ）ビデオ符号化／復号化方法が用いられ得る。

本発明は、時間的サブ階層を含む多数の階層構造の映像符号化されたビットストリーム内に存在する階層情報をシグナリングする方法、階層間予測方法及びターゲット出力階層を求める方法を提供する。

また、本発明は、セッション交渉などのためにビットストリーム内のＶＰＳに記述された階層情報をエントロピーデコーダがなくとも接近できる方法及びこれを利用する装置を提供する。

また、本発明の一実施形態は、現在ピクチャのデコーディングに必要な階層間参照ピクチャの有効な個数を把握して階層間予測に活用する方法、及びターゲット出力階層を求める方法及びこれを利用する装置を提供する。

本発明の一実施形態である複数の階層を支援する映像のデコーディング方法は、階層間予測のために現在ピクチャのデコーディングに用いられる参照階層に対する情報を受信する段階と、前記参照階層に対する情報に基づいて前記現在ピクチャのデコーディングに用いられる有効参照階層ピクチャの個数を誘導する段階と、前記有効な参照階層ピクチャの個数に基づいて階層間予測を行う段階とを含むことができる。

前記現在ピクチャに属する全てのスライスの前記有効な参照階層ピクチャの個数は同一であり得る。

前記現在ピクチャが属している現在階層を識別するレイヤ識別子が０の場合、前記有効な参照階層ピクチャの個数は０に誘導され得る。

前記現在ピクチャが属している現在階層に対する直接参照階層の個数が０の場合、前記有効な参照階層ピクチャの個数は０に誘導され得る。

現在階層に対する直接参照階層の個数、参照階層の最大時間的サブ階層情報、参照階層で階層間予測を許容する最大時間的サブ階層情報及び現在ピクチャの時間的識別子を考慮して誘導された現在ピクチャと同一のアクセスユニット内の参照階層ピクチャ個数が０の場合、前記有効な参照階層の個数は０に誘導され得る。

前記現在ピクチャが属している現在階層を識別するレイヤ識別子が０であるか、前記現在ピクチャと同一のアクセスユニット内の階層間予測に利用することができる参照ピクチャの個数が０の場合ではなく、前記現在ピクチャを含む階層に対する全ての直接参照階層に属して現在ピクチャと同一のアクセスユニットに存在し、現在ピクチャの階層間参照ピクチャセットに含まれる全ての直接参照階層ピクチャを現在ピクチャの参照階層ピクチャとして用いる場合、前記有効な参照階層ピクチャの個数は、前記現在階層に対する直接参照階層個数を表す変数、各階層の最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値、現在ピクチャの時間的識別子に基づいて誘導され得る。

前記現在ピクチャに対する直接参照階層ピクチャのうち、参照階層の最大時間的サブ階層情報が現在ピクチャの時間的識別子より大きいか同一であり、参照階層で階層間予測を許容した最大時間的サブ階層情報が現在ピクチャの時間的識別子より大きい場合に当該する参照階層のピクチャの個数を、現在ピクチャのデコーディングのための前記有効な参照階層ピクチャの個数として用いることができる。

前記現在ピクチャのデコーディングに階層間予測が用いられない場合、前記有効な参照階層ピクチャの個数は０に誘導され得る。

最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、前記現在ピクチャが属している階層の直接参照階層の個数が１であれば、前記有効な参照階層ピクチャの個数は１に誘導され得る。

最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、前記現在ピクチャが属している階層の直接参照階層の個数が１であれば、前記現在ピクチャのデコーディングに用いられ得る参照階層ピクチャの個数が０より大きければ、前記有効な参照階層ピクチャの個数は１に誘導され、前記現在ピクチャのデコーディングに用いられ得る参照階層ピクチャ個数が０であれば、前記有効な参照階層ピクチャの個数は０に誘導され得る。

最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、前記現在ピクチャと同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの個数が１であれば、前記有効な参照階層ピクチャの個数は１に誘導され得る。

前記参照階層に対する情報が階層間予測のために現在ピクチャのデコーディングに用いられるピクチャの個数を表す個数情報を含む場合、前記有効な参照階層ピクチャの個数は前記個数情報に特定される値に誘導され得る。

本発明の一実施形態によれば、時間的サブ階層を含む多数の階層構造の映像符号化されたビットストリーム内に存在する階層情報をシグナリングする方法、階層間予測方法及びターゲット出力階層を求める方法が提供される。

また、本発明の一実施形態によれば、エントロピーデコーダを有しないＭＡＮＥ（ＭｅｄｉａＡｗａｒｅＮｅｔｗｏｒｋＥｑｕｉｐｍｅｎｔ）でもセッション交渉等のためにビットストリーム内に存在する階層情報を接近できる方法及びこれを利用する装置が提供される。

また、本発明によれば、現在ピクチャのデコーディングに必要な階層間参照ピクチャの有効な個数を正確に把握して階層間予測に活用する方法と、実際に所望する出力階層を出力することができる方法及びこれを利用する装置が提供される。

映像符号化装置の一実施形態による構成を示すブロック図である。映像復号化装置の一実施形態による構成を示すブロック図である。本発明が適用され得る、複数階層を利用したスケーラブルビデオコーディング構造の一実施形態を概略的に示す概念図である。本発明に係る映像の復号化方法を説明するための制御フローチャートである。本発明の一実施形態による有効な参照階層ピクチャの個数を誘導する方法を説明するための図である。

以下、図面を参照して本発明の実施形態に対して具体的に説明する。本明細書の実施例を説明するにおいて、関連公知構成または機能に対する具体的な説明が本明細書の要旨をぼやかし得ると判断される場合にはその詳細な説明は略する。

ある構成要素が他の構成要素に「連結されて」いるか、「接続されて」いると言及された際には、その他の構成要素に直接的に連結されているか、または接続されていることもあるが、中間に他の構成要素が存在することもあると理解されなければならない。さらに、本発明で特定の構成を「含む」と記述する内容は当該構成以外の構成を排除するものではなく、追加の構成が本発明の実施または本発明の技術的思想の範囲に含まれ得ることを意味する。

第１、第２などの用語は、多様な構成要素を説明するのに用いられ得るが、前記構成要素は前記用語によって限定されてはならない。前記用語は、一つの構成要素を他の構成要素から区別する目的にのみ用いられる。例えば、本発明の権利範囲を外れないながらも、第１構成要素は第２構成要素に命名され得、類似に第２構成要素もまた第１構成要素に命名され得る。

また、本発明の実施例に示される構成部は互いに異なる特徴的な機能を現わすために独立的に示されるものであって、各構成部が分離されたハードウェアや一つのソフトウェア構成単位からなることを意味しない。すなわち、各構成部は説明の便宜上、それぞれの構成部に並べて含むものであって、各構成部のうち少なくとも二つの構成部が合されて一つの構成部からなるか、一つの構成部が複数個の構成部に分けられて機能を行うことができ、このような各構成部の統合された実施例及び分離された実施例もまた本発明の本質から外れない限り本発明の権利範囲に含まれる。

また、一部の構成要素は、本発明で本質的な機能を行う必須な構成要素ではなく、単に性能向上のための選択的構成要素であり得る。本発明は、単に性能向上のために用いられる構成要素を除いた本発明の本質を具現するのに必須な構成部のみを含んで具現され得、単に性能向上のために用いられる選択的構成要素を除いた必須構成要素のみを含む構造も本発明の権利範囲に含まれる。

図１は、映像符号化装置の一実施形態による構成を示すブロック図である。スケーラブル（ｓｃａｌａｂｌｅ）ビデオ符号化／復号化方法または装置はスケーラビリティ（ｓｃａｌａｂｉｌｉｔｙ）を提供しない一般的な映像符号化／復号化方法または装置の拡張（ｅｘｔｅｎｓｉｏｎ）によって具現され得、図１のブロック図はスケーラブルビデオ符号化装置の基礎となり得る映像符号化装置の一実施形態を示す。

図１を参照すれば、前記映像符号化装置１００は、動き予測部１１１、動き補償部１１２、イントラ予測部１２０、スイッチ１１５、減算器１２５、変換部１３０、量子化部１４０、エントロピー符号化部１５０、逆量子化部１６０、逆変換部１７０、加算器１７５、フィルタ部１８０及び参照映像バッファ１９０を含む。

映像符号化装置１００は、入力映像に対してイントラ（ｉｎｔｒａ）モードまたはインター（ｉｎｔｅｒ）モードで符号化を行ってビットストリーム（ｂｉｔｓｔｒｅａｍ）を出力することができる。イントラ予測は、画面内予測、インター予測は画面間予測を意味する。イントラモードの場合、スイッチ１１５がイントラに転換され、インターモードの場合、スイッチ１１５がインターに転換される。映像符号化装置１００は、入力映像の入力ブロックに対する予測ブロックを生成した後、入力ブロックと予測ブロックの差分を符号化することができる。

イントラモードの場合、イントラ予測部１２０は現在ブロック周辺の既に符号化されたブロックの画素値を利用して空間的予測を行って予測ブロックを生成することができる。

インターモードの場合、動き予測部１１１は、動き予測過程で参照映像バッファ１９０に貯蔵されている参照映像で入力ブロックと最もよくマッチできる領域を探して動きベクトルを求めることができる。動き補償部１１２は、動きベクトルと参照映像バッファ１９０に貯蔵されている参照映像を利用して動き補償を行うことにより、予測ブロックを生成することができる。

減算器１２５は、入力ブロックと生成された予測ブロックの差分により残余ブロック（ｒｅｓｉｄｕａｌｂｌｏｃｋ）を生成することができる。変換部１３０は、残余ブロックに対して変換（ｔｒａｎｓｆｏｒｍ）を行って変換係数（ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）を出力することができる。また、量子化部１４０は、入力された変換係数を量子化パラメータによって量子化し、量子化された係数（ｑｕａｎｔｉｚｅｄｃｏｅｆｆｉｃｉｅｎｔ）を出力することができる。

エントロピー符号化部１５０は、量子化部１４０で算出された値または符号化過程で算出された符号化パラメータ値などに基づいて、シンボル（ｓｙｍｂｏｌ）を確率分布によってエントロピー符号化してビットストリーム（ｂｉｔｓｔｒｅａｍ）を出力することができる。エントロピー符号化方法は、多様な値を有するシンボルの入力を受けて、統計的重複性を除去しながら、復号可能な２進数の列で表現する方法である。

ここで、シンボルとは、符号化／復号化対象構文要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）及び符号化パラメータ（ｃｏｄｉｎｇｐａｒａｍｅｔｅｒ）、残余信号（ｒｅｓｉｄｕａｌｓｉｇｎａｌ）の値などを意味する。符号化パラメータは、符号化及び復号化に必要な媒介変数であって、構文要素のように符号化器で符号化されて復号化器へ伝達される情報だけでなく、符号化あるいは復号化過程で類推され得る情報を含むことができ、映像を符号化するか復号化する際に必要な情報を意味する。符号化パラメータは、例えば、イントラ／インター予測モード、移動／動きベクトル、参照映像索引、符号化ブロックパターン、残余信号有無、変換係数、量子化された変換係数、量子化パラメータ、ブロックの大きさ、ブロック分割情報などの値または統計を含むことができる。また、残余信号は原信号と予測信号の差を意味することができ、また原信号と予測信号の差が変換（ｔｒａｎｓｆｏｒｍ）された形態の信号または原信号と予測信号の差が変換されて量子化された形態の信号を意味することもできる。残余信号は、ブロック単位では残余ブロックと言える。

エントロピー符号化が適用される場合、高い発生確率を有するシンボルに少ない数のビットが割り当てられ、低い発生確率を有するシンボルに多い数のビットが割り当てられてシンボルが表現されることにより、符号化対象シンボル等に対するビット列の大きさが減少され得る。したがって、エントロピー符号化を介して映像符号化の圧縮性能が高くなり得る。

エントロピー符号化のために指数ゴロム（ｅｘｐｏｎｅｎｔｉａｌｇｏｌｏｍｂ）、ＣＡＶＬＣ（Ｃｏｎｔｅｘｔ－ＡｄａｐｔｉｖｅＶａｒｉａｂｌｅＬｅｎｇｔｈＣｏｄｉｎｇ）、ＣＡＢＡＣ（Ｃｏｎｔｅｘｔ－ＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈｍｅｔｉｃＣｏｄｉｎｇ）のような符号化方法が用いられ得る。例えば、エントロピー符号化部１５０には可変長符号化（ＶＬＣ：ＶａｒｉａｂｌｅＬｅｎｇｈｔｈＣｏｄｉｎｇ／Ｃｏｄｅ）テーブルのようなエントロピー符号化を行うためのテーブルが貯蔵され得、エントロピー符号化部１５０は貯蔵された可変長符号化（ＶＬＣ）テーブルを用いてエントロピー符号化を行うことができる。また、エントロピー符号化部１５０は、対象シンボルの二進化（ｂｉｎａｒｉｚａｔｉｏｎ）方法及び対象シンボル／ビン（ｂｉｎ）の確率モデル（ｐｒｏｂａｂｉｌｉｔｙｍｏｄｅｌ）を導出した後、導出された二進化方法または確率モデルを用いてエントロピー符号化を行うこともできる。

量子化された係数は、逆量子化部１６０で逆量子化されて逆変換部１７０で逆変換され得る。逆量子化、逆変換された係数は、加算器１７５を介して予測ブロックと加われ、復元ブロックが生成され得る。

復元ブロックはフィルタ部１８０を経て、フィルタ部１８０はデブロッキングフィルタ（ｄｅｂｌｏｃｋｉｎｇｆｉｌｔｅｒ）、ＳＡＯ（ＳａｍｐｌｅＡｄａｐｔｉｖｅＯｆｆｓｅｔ）、ＡＬＦ（ＡｄａｐｔｉｖｅＬｏｏｐＦｉｌｔｅｒ）のうち少なくとも一つ以上を復元ブロックまたは復元ピクチャに適用することができる。フィルタ部１８０を経た復元ブロックは、参照映像バッファ１９０に貯蔵され得る。

図２は、映像復号化装置の一実施形態による構成を示すブロック図である。図１で前述したようにスケーラブルビデオ符号化／復号化方法または装置は、スケーラビリティを提供しない一般的な映像符号化／復号化方法または装置の拡張によって具現され得、図２のブロック図はスケーラブルビデオ復号化装置の基礎となり得る映像復号化装置の一実施形態を示す。

図２を参照すれば、前記映像復号化装置２００は、エントロピー復号化部２１０、逆量子化部２２０、逆変換部２３０、イントラ予測部２４０、動き補償部２５０、フィルタ部２６０及び参照映像バッファ２７０を含む。

映像復号化装置２００は、符号化器で出力されたビットストリームの入力を受けてイントラモードまたはインターモードで復号化を行って再構成された映像、すなわち復元映像を出力することができる。イントラモードの場合、スイッチがイントラに転換され、インターモードの場合、スイッチがインターに転換され得る。映像復号化装置２００は、入力を受けたビットストリームから復元された残余ブロック（ｒｅｓｉｄｕａｌｂｌｏｃｋ）を得て予測ブロックを生成した後、復元された残余ブロックと予測ブロックを加えて再構成されたブロック、すなわち復元ブロックを生成することができる。

エントロピー復号化部２１０は、入力されたビットストリームを確率分布によってエントロピー復号化し、量子化された係数（ｑｕａｎｔｉｚｅｄｃｏｅｆｆｉｃｉｅｎｔ）形態のシンボルを含むシンボル等を生成することができる。エントロピー復号化方法は、２進数の列の入力を受けて各シンボル等を生成する方法である。エントロピー復号化方法は、前述したエントロピー符号化方法と類似である。

量子化された係数は、逆量子化部２２０で逆量子化されて逆変換部２３０で逆変換され、量子化された係数が逆量子化／逆変換された結果、復元された残余ブロック（ｒｅｓｉｄｕａｌｂｌｏｃｋ）が生成され得る。

イントラモードの場合、イントラ予測部２４０は、現在ブロック周辺の既に符号化されたブロックの画素値を利用して空間的予測を行って予測ブロックを生成することができる。インターモードの場合、動き補償部２５０は、動きベクトル及び参照映像バッファ２７０に貯蔵されている参照映像を利用して動き補償を行うことにより予測ブロックを生成することができる。

復元された残余ブロックと予測ブロックは加算器２５５を介して加えられ、加えられたブロックはフィルタ部２６０を経る。フィルタ部２６０は、デブロッキングフィルタ、ＳＡＯ、ＡＬＦのうち少なくとも一つ以上を復元ブロックまたは復元ピクチャに適用することができる。フィルタ部２６０は、再構成された映像、すなわち復元映像を出力する。復元映像は、参照映像バッファ２７０に貯蔵されて画面間予測に用いられ得る。

前記映像復号化装置２００に含まれているエントロピー復号化部２１０、逆量子化部２２０、逆変換部２３０、イントラ予測部２４０、動き補償部２５０、フィルタ部２６０及び参照映像バッファ２７０のうち映像の復号化に直接的に係る構成要素等、例えば、エントロピー復号化部２１０、逆量子化部２２０、逆変換部２３０、イントラ予測部２４０、動き補償部２５０、フィルタ部２６０などを他の構成要素と区分して復号化部またはデコーディング部で表現することができる。

また、映像復号化装置２００は、ビットストリームに含まれているエンコーディングされた映像に係る情報をパッシングする、示していないパッシング部をさらに含むことができる。パッシング部は、エントロピー復号化部２１０を含むこともでき、エントロピー復号化部２１０に含まれることもできる。このようなパッシング部はまた、デコーディング部の一つの構成要素として具現されることもできる。

図３は、本発明が適用され得る、複数階層を利用したスケーラブルビデオコーディング構造の一実施形態を概略的に示す概念図である。図３において、ＧＯＰ（ＧｒｏｕｐｏｆＰｉｃｔｕｒｅ）はピクチャ群、すなわちピクチャのグループを示す。

映像データを転送するためには伝送媒体が必要であり、その性能は多様なネットワーク環境によって転送媒体別に差がある。このような多様な転送媒体またはネットワーク環境への適用のためにスケーラブルビデオコーディング方法が提供され得る。

スケーラブルビデオコーディング方法は、階層（ｌａｙｅｒ）間のテクスチャ情報、動き情報、残余信号などを活用して階層間の重複性を除去して符号化／復号化性能を高めるコーディング方法である。スケーラブルビデオコーディング方法は、転送ビットレート、転送エラーレート、システム資源などの周辺条件によって、空間的、時間的、画質的、視点的観点で多様なスケーラビリティを提供することができる。

スケーラブルビデオコーディングは、多様なネットワーク状況に適用可能なビットストリームを提供できるように、複数階層（ｍｕｌｔｉｐｌｅｌａｙｅｒｓ）構造を用いて行われ得る。例えば、スケーラブルビデオコーディング構造は、一般的な映像符号化方法を利用して映像データを圧縮して処理する基本階層を含むことができ、基本階層の符号化情報及び一般的な映像符号化方法を共に用いて映像データを圧縮処理する向上階層を含むことができる。

ここで、階層（ｌａｙｅｒ）は空間（ｓｐａｔｉａｌ、例えば、映像の大きさ）、時間（ｔｅｍｐｏｒａｌ、例えば、符号化順序、映像出力順序、フレームレート）、画質、視点、複雑度などを基準に区分される映像、及びビットストリーム（ｂｉｔｓｔｒｅａｍ）の集合を意味する。また、基本階層（Ｂａｓｅｌａｙｅｒ）は下位階層または参照階層、向上階層（Ｅｎｈａｎｃｅｍｅｎｔｌａｙｅｒ）は上位階層を意味することができる。また、複数の階層は互いに従属性を有することもできる。

図３を参照すれば、例えば基本階層はＳＤ（ｓｔａｎｄａｒｄｄｅｆｉｎｉｔｉｏｎ）、１５Ｈｚのフレームレート、１Ｍｂｐｓのビットレートに定義され得、第１向上階層はＨＤ（ｈｉｇｈｄｅｆｉｎｉｔｉｏｎ）、３０Ｈｚのフレームレート、３．９Ｍｂｐｓのビットレートに定義され得、第２向上階層は４Ｋ－ＵＨＤ（ｕｌｔｒａｈｉｇｈｄｅｆｉｎｉｔｉｏｎ）、６０Ｈｚのフレームレート、２７．２Ｍｂｐｓのビットレートに定義され得る。前記フォーマット（ｆｏｒｍａｔ）、フレームレート、ビットレートなどは一つの実施例として、必要に応じて異に定められ得る。また、用いられる階層の数も本実施例に限定されず、状況に応じて異に定められ得る。

例えば、伝送帯域幅が４Ｍｂｐｓであれば、前記第１向上階層ＨＤのフレームレートを減らして１５Ｈｚ以下に転送することができる。スケーラブルビデオコーディング方法は、前記図３の実施例で前述した方法によって時間的、空間的、画質的、視点的スケーラビリティを提供することができる。

スケーラブルビデオコーディングは、以下の符号化観点ではスケーラブルビデオ符号化、復号化観点ではスケーラブルビデオ復号化と同一の意味を有する。

本発明は、複数の階層（ｌａｙｅｒ）または視点（ｖｉｅｗ）を含む映像の符・復号化（ｅｎ－／ｄｅ－ｃｏｄｉｎｇ）過程に関するものであって、前記複数の階層または視点は、第１、第２、第３、第ｎ階層または視点で表現することができる。以下の説明では、第１階層と第２階層が存在するピクチャを例として記述し、それ以上の階層または視点にも同一の方法で適用することができる。また、前記第１階層は下位（ｂａｓｅ）階層、第２階層は上位（ｕｐｐｅｒ）階層として表現することもできる。また、前記第１階層は参照（ｒｅｆｅｒｅｎｃｅ）階層、第２階層は向上（ｅｎｈａｎｃｅｍｅｎｔ）階層として表現され得る。

第２階層のピクチャ／ブロックに対応する第１階層のピクチャ／ブロックは、前記第２階層ピクチャ／ブロックの大きさに合わせて変更することができる。すなわち、第１階層のピクチャ／ブロックの大きさが第２階層のピクチャ／ブロックより小さい場合、アップサンプリング（ｕｐ－ｓａｍｐｌｉｎｇ）、ｒｅ－ｓａｍｐｌｉｎｇなどの方法を利用してスケーリング（ｓｃａｌｉｎｇ）することができる。

また、第１階層のピクチャは、前記第２階層の参照ピクチャリスト（ｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｌｉｓｔ）に追加して第２階層の映像符／復号化に利用され得る。このとき、第２階層は通常の画面間予測のように参照ピクチャリストにある第１階層映像を利用して予測及び符／復号化を行うことができる。

符／復号化のためのブロックの大きさは、４×４、８×８、１６×１６、３２×３２、６４×６４などＮ×Ｎ形態の正四角形または４×８、１６×８、８×３２などのＮ×Ｍ形態の直四角形であってもよく、ブロックの単位は符号化ブロック（ＣＢ：ＣｏｄｉｎｇＢｌｏｃｋ）、予測ブロック（ＰＢ：ＰｒｅｄｉｃｔｉｏｎＢｌｏｃｋ）、変換ブロック（ＴＢ：ＴｒａｎｓｆｏｒｍＢｌｏｃｋ）のうち少なくとも一つであってもよく、それぞれ互いに異なる大きさを有し得る。

以下で、スケーラブルビデオ、すなわち多階層構造を用いる映像の符号化及び復号化方法のうち上位階層の符号化及び復号化対象となるブロック（以下、現在ブロックまたは対象ブロックと称する）の予測ブロック、すなわち予測信号を生成する方法に対して検討してみる。以下発明の内容（方法または装置）は、通常、符号化器と復号化器に同一に適用され得る。

一方、現在ＳＨＶＣ（ＳｃａｌａｂｌｅＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）及びＭＶ－ＨＥＶＣ（Ｍｕｌｔｉｖｉｅｗ－ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）の標準草案で、ビデオパラメータ拡張（ｖｉｄｅｏｐａｒａｍｅｔｅｒｓｅｔｅｘｔｅｎｓｉｏｎ, ＶＰＳｅｘｔｅｎｓｉｏｎ）でレイヤセットに用いられるプロファイル、ティア及びレベルを示すシンタックス要素（ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ）は表１のように記述（ｄｅｓｃｒｉｐｔｉｏｎ）されている。

表１を参照すれば、ｖｐｓ＿ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｍｉｎｕｓ１で特定される値は、ＶＰＳ内のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造（ｓｙｎｔａｘｓｔｒｕｃｔｕｒｅｓ）の個数を示す。

ｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が「１」であれば、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造内にプロファイル及びティア情報（ｐｒｏｆｉｌｅａｎｄｔｉｅｒｉｎｆｏｒｍａｔｉｏｎ）が存在することを示し、「０」であれば、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造内にプロファイル及びティア情報が存在せずに類推されることを示す。

ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［ｉ］は、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造のためのプロファイル及びティア情報は、（ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［ｉ］＋１番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造のためのプロファイル及びティア情報と同一であるものと類推されることを示す。このとき、ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［ｉ］に１を足し合わせた値は、ｉと同一であるか、小さくなければならない。

表１のような現在標準草案によれば、ｉが１であり、ｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［１］が０の値を有する場合、１番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造のためのプロファイル及びティア情報は、（ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［１］＋１番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造から類推しなければならない。すなわち、「ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［１］＋１」の値が１と同一であるか、０を有しなければならない。「ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［１］＋１」が０であれば、ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［１］が－１値を有することとなり、ｕ（６）に符号化されるｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［ｉ］のシンタックス定義に違背される。

また、（ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［１］＋１が「１」値を有するとする場合、１番目のプロファイル及びティア情報を１番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌのシンタックス構造から類推しなければならない問題が発生することができる。

このような問題点を解決するために前記シンタックスに対するセマンティックスに「一番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌのシンタックス構造（ｓｙｎｔａｘｓｔｒｕｃｔｕｒｅ）に対しては、常にｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［１］が１にならなければならない。」のような制約を追加することができる。この場合、表１のｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］に対するセマンティックスは次のように表現され得る。

ｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が「１」であれば、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造内にプロファイル及びティア情報（ｐｒｏｆｉｌｅａｎｄｔｉｅｒｉｎｆｏｒｍａｔｉｏｎ）が存在することを示し、ｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が「０」であれば、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造内にプロファイル及びティア情報が存在せずに類推されることを指示することを示すことができる。一番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌのシンタックス構造のためのｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［１］は、１の値を有しなければならない。

また、他の実施例によれば、前記のような問題点を解決するために表２のようなシグナリング方法を考慮することができる。

表２を参照すれば、ｖｐｓ＿ｎｕｍ＿ｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ＿ｍｉｎｕｓ１で特定される値は、ＶＰＳ内のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造（ｓｙｎｔａｘｓｔｒｕｃｔｕｒｅｓ）の個数を示す。

ｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が「１」であれば、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造内にプロファイル及びティア情報（ｐｒｏｆｉｌｅａｎｄｔｉｅｒｉｎｆｏｒｍａｔｉｏｎ）が存在することを示し、ｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［ｉ］が「０」であれば、ｉ番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造内にプロファイル及びティア情報が存在せず、ｉ－１番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌ（）のシンタックス構造のプロファイル及びティア情報から類推されることを示す。一番目のｐｒｏｆｉｌｅ＿ｔｉｅｒ＿ｌｅｖｅｌのシンタックス構造のためのｖｐｓ＿ｐｒｏｆｉｌｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ［１］は、１の値を有しなければならない。

表２による場合、ｐｒｏｆｉｌｅ＿ｒｅｆ＿ｍｉｎｕｓ１［１］はシグナリングされない。

本発明のまた他の実施例によれば、エントロピーデコーダのないＭＡＮＥ（ＭｅｄｉａＡｗａｒｅＮｅｔｗｏｒｋＥｑｕｉｐｍｅｎｔ）でもＶＰＳｅｘｔｅｎｓｉｏｎをパッシングできるように、ＶＰＳのシンタックス構造を変更することができる。表３から５は、本発明のいくつかの側面によるＶＰＳを示している。

表３を参照すれば、ＶＰＳで転送されるシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）のｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔは、ＶＰＳＮＡＬユニットの開始点から「ａｖｃ＿ｂａｓｅ＿ｌａｙｅｒ＿ｆｌａｇ」のシンタックスで始まる固定長符号化情報（ｆｉｘｅｄｌｅｎｇｔｈｃｏｄｅｄｉｎｆｏｒｍａｔｉｏｎ）までのバイトオフセット（ｂｙｔｅｏｆｆｓｅｔ）を示す。

ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔによって定義されるバイトオフセットは、ＶＰＳＮＡＬユニット内のエントロピーデコーディングを必要とせずにセッション交渉（ｓｅｓｓｉｏｎｎｅｇｏｔｉａｔｉｏｎ）を可能にする基本情報等に接近できるようにする。

例えば、エントロピーデコーダのないＭＡＮＥ（ＭｅｄｉａＡｗａｒｅＮｅｔｗｏｒｋＥｑｕｉｐｍｅｎｔ）は、ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔによって記述されるバイトオフセット値に基づいて、エントロピー復号化が必要でない基本情報をパッシングしてセッション交渉に用いることができる。

エントロピーデコーダのないＭＡＮＥは、セッション交渉のためにｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔ情報に基づいてｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔ以後の情報をエントロピーデコーディングせずに、表４のＶＰＳｅｘｔｅｎｓｉｏｎ内の出力レイヤセット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔｓ）情報をパッシングする場合、レイヤ識別子リスト内のレイヤ個数の意味を示す変数ＮｕｍＬａｙｅｒｓＩｎＩｄＬｉｓｔは、表３のｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔ以後に記述されるレイヤセット（ｌａｙｅｒｓｅｔｓ）に対する情報、すなわち、ｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］から計算される値でエントロピーデコーディングされなければならない。

エントロピーデコーディングなく、ＶＰＳｅｘｔｅｎｓｉｏｎ内の出力レイヤセット情報をセッション交渉などに用いることができるように、表５でのようにＶＰＳｅｘｔｅｎｓｉｏｎ内にレイヤセット（ｌａｙｅｒｓｅｔｓ）に対する情報を記述することができる。

一方、表５のＶＰＳｅｘｔｅｎｓｉｏｎ内に記述されるレイヤセット（ｌａｙｅｒｓｅｔｓ）に係るシンタックス要素等の意味（ｓｅｍａｎｔｉｃｓ）は次の通りである。

ｖｐｓ＿ｍａｘｉｍｕｍ＿ｌａｙｅｒ＿ｉｄは、ＶＰＳで記述されるｖｐｓ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄと同一に、ＣＶＳ内の全てのＮＡＬユニットで許容される最大ｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を示し、ＶＰＳで記述されるｖｐｓ＿ｍａｘ＿ｌａｙｅｒ＿ｉｄと同一の値を有することができる。

ｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１で特定される値はレイヤセットの個数を表すと、ｖｐｓ＿ｖｕｉ＿ｏｆｆｓｅｔ以前にシグナリングされ得る。

ＶＰＳで記述されるｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］と同一に、ｌａｙｅｒ＿ｉｄ＿ｎｕｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］が１であれば、ｊと同一のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値がレイヤ識別子リスト（ｌａｙｅｒｉｄｅｎｔｉｆｉｅｒｌｉｓｔ、ｌａｙｅｒＳｅｔＬａｙｅｒＩｄＬｉｓｔ［ｉ］）に含まれることを示し、ｌａｙｅｒ＿ｉｄ＿ｎｕｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］が０であれば、ｊと同一のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値がレイヤ識別子リスト（ｌａｙｅｒＳｅｔＬａｙｅｒＩｄＬｉｓｔ［ｉ］）に含まれないことを示す。ｌａｙｅｒ＿ｉｄ＿ｎｕｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］は、ＶＰＳで記述されるｌａｙｅｒ＿ｉｄ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］と同一の値を有しなければならない。

１からｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１までの値を有し得るｉに対するｎｕｍＬａｙｅｒｓＩｎＩｄＬｉｓｔ［ｉ］とレイヤ識別子リスト（ｌａｙｅｒＳｅｔＬａｙｅｒＩｄＬｉｓｔ［ｉ］）は、下記のように求めることができる。

ｎ＝０
ｆｏｒ（ｍ＝０；ｍ＜＝ｖｐｓ＿ｍａｘｉｍｕｍ＿ｌａｙｅｒ＿ｉｄ；ｍ＋＋）
ｉｆ（ｌａｙｅｒ＿ｉｄ＿ｎｕｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｍ］）
ｌａｙｅｒＳｅｔＬａｙｅｒＩｄＬｉｓｔ［ｉ］［ｎ＋＋］＝ｍ
ｎｕｍＬａｙｅｒｓＩｎＩｄＬｉｓｔ［ｉ］＝ｎ
多階層基盤の映像符号化復号化方法では、ＶＰＳｅｘｔｅｎｓｉｏｎに記述されたｌａｙｅｒ＿ｉｄ＿ｎｕｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］に基づいて、ＶＰＳＶＵＩビットストリーム分割ＨＲＤ（ＶＰＳＶｉｄｅｏｕｓａｂｉｌｉｔｙｉｎｆｏｒｍａｔｉｏｎｂｉｔｓｔｒｅａｍｐａｒｔｉｔｉｏｎｈｙｐｏｔｈｅｔｉｃａｌｒｅｆｅｒｅｎｃｅｄｅｃｏｄｅｒ）パラメータシンタックス、ビットストリーム分割ＨＲＤ（ＢｉｔｓｔｒｅａｍｐａｒｔｉｔｉｏｎＨＲＤ）パラメータＳＥＩメッセージ（ｓｕｐｐｌｅｍｅｎｔａｌｅｎｈａｎｃｅｍｅｎｔｉｎｆｏｒｍａｔｉｏｎｍｅｓｓａｇｅ）シンタックスなどを記述するか、レイヤセットに関する情報を解釈することができる。

本発明のまた他の実施例によれば、表６のようにＶＰＳｅｘｔｅｎｓｉｏｎ内にレイヤセット（ｌａｙｅｒｓｅｔｓ）に対する情報を記述することができる。

表６は、ＶＰＳｅｘｔｅｎｓｉｏｎ内のレイヤセット（ｌａｙｅｒｓｅｔｓ）に対する情報を示しており、このようなＶＰＳｅｘｔｅｎｓｉｏｎ内の出力レイヤセット情報を利用して、エントロピーデコーディングがなくともセッション交渉などが行われ得る。

レイヤセットに関するシンタックス（ｖｐｓ＿ｍａｘｉｍｕｍ＿ｌａｙｅｒ＿ｉｄ、ｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１、ｌａｙｅｒ＿ｉｄ＿ｎｕｈ＿ｉｎｃｌｕｄｅｄ＿ｆｌａｇ［ｉ］［ｊ］）は、シンタックス要素ｖｐｓ＿ｖｕｉ＿ｏｆｆｓｅｔの上に記述され得る。

さらに、階層間従属性可否を報知するシンタックス要素ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇの位置を、ｖｐｓ＿ｖｕｉ＿ｏｆｆｓｅｔの上に変更させることができる。この場合、ｖｐｓ＿ｖｕｉ＿ｏｆｆｓｅｔ以後のシンタックス要素をパッシングしなくとも、ｖｐｓ＿ｖｕｉ＿ｏｆｆｓｅｔ値を用いてｖｐｓ＿ｖｕｉに対する情報を把握することができる。

また他の実施例によって、表７のようにＶＰＳｅｘｔｅｎｓｉｏｎ内にレイヤセット（ｌａｙｅｒｓｅｔｓ）に対する情報を記述することができる。

表７を参照すれば、ＶＰＳ内に存在するレイヤセットに関するシンタックス要素等の位置は、ｖｐｓ＿ｅｘｔｅｎｓｉｏｎ＿ｏｆｆｓｅｔ以前に位置され得る。

既存に可変的なビット数ｕｅ（Ｖ）で符号化されていたｖｐｓ＿ｎｕｍ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１は、エントロピーデコーディングを避けるために固定ビット数ｕ１０で符号化され得、ＶＰＳｅｘｔｅｎｓｉｏｎで記述されている同一機能のｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１は削除され得る。

一方、ＶＰＳＶＵＩで記述されるビデオシグナリング情報は、セッション交渉に用いられ得る情報であり、ＶＰＳＶＵＩは表８の通りである。

表８を参考すれば、ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが１であれば、シンタックス要素ｖｐｓ＿ｎｕｍ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｍｉｎｕｓ１とｖｐｓ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ［ｉ］が存在することを示し、ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ＿ｐｒｅｓｅｎｔ＿ｆｌａｇが０であれば、シンタックス要素ｖｐｓ＿ｎｕｍ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｍｉｎｕｓ１とｖｐｓ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ［ｉ］が存在しないことを示す。

ｖｐｓ＿ｎｕｍ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｍｉｎｕ１に１を足し合わせた値は、ＶＰＳ内のｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ（）のシンタックス構造（ｓｙｎｔａｘｓｔｒｕｃｔｕｒｅｓ）の個数を示す。ｖｐｓ＿ｎｕｍ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｍｉｎｕ１が存在しない場合、ｖｐｓ＿ｎｕｍ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｍｉｎｕｓ１の個数はＭａｘＬａｙｅｒｓＭｉｎｕｓ１の値と同一であるものと類推される。

ｖｐｓ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘは、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］と同一のｎｕｈ＿ｌａｙｅｒ＿ｉｄを有する階層に適用されるｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ（）のシンタックス構造リストのインデックスを示す。ｖｐｓ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘが存在しない場合、ｖｐｓ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ［ｉ］は（ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ？０：ｉ）に類推される。ｖｐｓ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ［ｉ］は、０からｖｐｓ＿ｎｕｍ＿ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｍｉｎｕｓ１の範囲に存在することができる。

現在ＳＨＶＣ及びＭＶ－ＨＥＶＣ標準草案では、表８のようにビデオシグナリング情報以前に指数ゴロム（Ｅｘｐ－ｇｏｌｏｍｂ）コード（ｕｅ（ｖ））に符号化されたシンタックス要素等が存在するため、エントロピーデコーダのないＭＡＮＥではビデオシグナリング情報をセッション交渉に用いることができない問題が発生することがある。

このような問題点を解決するために、すなわちＶＰＳＶＵＩ内のビデオシグナリング情報をエントロピーデコーディングなしにセッション交渉に用いるため、表９のようにエントロピーデコーディングがなくとも接近可能な位置でビデオシグナリング情報が記述され得る。

表９のようにエントロピーデコーディングなしにビデオシグナリング情報に接近するため、ＶＰＳ＿ＶＵＩ内のビットレート（ｂｉｔ＿ｒａｔｅ）及びピクチャレート（ｐｉｃ＿ｒａｔｅ）に関するシンタックス要素（ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇ、ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｖｐｓ＿ｆｌａｇ、ｂｉｔ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ、ｐｉｃ＿ｒａｔｅ＿ｐｒｅｓｅｎｔ＿ｆｌａｇなど）の次にビデオシグナリング情報に係るシンタックスを記述することができる。

すなわち、ビデオシグナル情報（ｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ）の個数とビデオシグナル情報のインデックスを指示する信号の存在可否を指示するフラッグ情報、すなわちｖｉｄｅｏ＿ｓｉｇｎａｌ＿ｉｎｆｏ＿ｉｄｘ＿ｐｒｅｓｅｎｔ＿ｆｌａｇを固定されたビットを利用してシグナリングされる信号等の次に受信することにより、エントロピーデコーディングなしにビデオシグナリング情報に接近することができる。

一方、本発明の一側面は、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を求める多様な方法を提案する。

第１方法
階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を表す変数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は下記のように求めることができる。第１方法による場合、ピクチャの全てのスライスは同一の「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」値を有するものと限定され得る。

（１）現在ピクチャが属している階層のレイヤ識別子に当該する「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」が０であるか、現在ピクチャが属している階層の直接参照階層の個数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ」が０である場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は０に設定することができる。すなわち、レイヤがベースレイヤであるか、直接的に参照するレイヤの個数が０であれば、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数は０に設定される。

（２）そうではなく、もし（ｅｌｓｅｉｆ）、ＶＰＳｅｘｔｅｎｓｉｏｎで記述されるシンタックス要素「ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇ」値が１である場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は、数式１、数式２または数式３から求められた変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値に設定され得る。

ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが１であれば、ビデオパラメータセットを参照している各ピクチャに対して、当該ピクチャを含む階層の全ての直接参照階層に属する直接参照階層ピクチャのうち、現在ピクチャと同一のアクセスユニットに存在して当該ピクチャの階層間参照ピクチャセットに含まれた全ての直接参照ピクチャが階層間予測に用いられることを示す。同一アクセスユニットが存在するかの可否及び階層間参照ピクチャセットを含むかの可否は、各階層の最大時間サブ階層情報（ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍｉｎｕｓ１［ｉ］）と各階層で階層間予測を許容する時間的サブ階層の最大許容値（ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］）で指示され得る。

ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが０であれば、前記制約が適用されるか、適用されないこともあり得ることを示す。

このようなａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇは、ｄｅｆａｕｌｔ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇのようなシンタックスで表現されることもある。

現在ピクチャと同一のアクセスユニット内に階層間予測のために用いることができる参照階層ピクチャの個数を指示する変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」は次のように誘導され得る。

数式１を参照すれば、変数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［］」はＶＰＳｅｘｔｅｎｓｉｏｎに記述されたシンタックス要素「ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ」から計算された現在階層が直接参照している参照階層の個数を示す。

「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」は、各階層の最大時間サブ階層情報を示し、「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」は、各階層で階層間予測を許容する時間的サブ階層の最大許容値を示し、「ＴｅｍｐｏｒａｌＩｄ」は現在ピクチャの時間的識別子を示す。

数式１によれば、現在ピクチャを含んでいる階層の直接参照階層のうち、参照階層の「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」値が現在ピクチャの「ＴｅｍｐｏｒａｌＩｄ」値より大きいか同一であり、現在階層に対する参照階層の「ｍａｘ＿ｔｉｌｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」値が現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値より大きい参照階層のピクチャのみ階層間予測のために現在ピクチャのデコーディングに用いられ得る直接参照階層ピクチャとしてみなされ得る。

一方、シンタックス要素「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」が「０」の場合、「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］」と同一の「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」を有するＩＲＡＰではないピクチャ（ｎｏｎ－ｉｎｔｒａｒａｎｄｏｍａｃｃｅｓｓｐｏｉｎｔｐｉｃｔｕｒｅ）は「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｊ］」と同一の「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」値を有するピクチャに対して階層間予測のための参照ピクチャとして用いることができない。このような制約事項を反映するために数式１は下記数式２に代替され得る。

数式２において、変数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［］」はＶＰＳｅｘｔｅｎｓｉｏｎに記述されたシンタックス要素「ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ」から計算された現在階層が直接参照している参照階層の個数を示す。

「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」は、各階層の最大時間サブ階層情報を示し、「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」は各階層で階層間予測を許容する時間的サブ階層の最大許容値を示し、「ＴｅｍｐｏｒａｌＩｄ」は現在ピクチャの時間的識別子を示す。

数式２によれば、現在ピクチャを含んでいる階層の直接参照階層のうち、「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」値が「０」の場合、現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値と参照階層の「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」値が「０」と同一であり、参照階層の「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」値が現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値より大きいか同一である参照階層のピクチャのみ階層間予測のために現在ピクチャのデコーディングに用いられ得る参照階層ピクチャとみなされ得る。この場合、参照階層のピクチャは、ＩＲＡＰピクチャであるものと制約を置くことができる。

「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」が「０」より大きい場合、参照階層の「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」値が現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値より大きいか同一であり、参照階層の「ｍａｘ＿ｔｉｌｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」値が現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値より大きい参照階層のピクチャのみ階層間予測のために現在ピクチャのデコーディングに用いられ得る参照階層ピクチャとみなされ得る。

他の実施例によれば、シンタックス要素「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」が「０」の場合、「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］」と同一の「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」を有するＩＲＡＰではないピクチャ（ｎｏｎ－ｉｎｔｒａｒａｎｄｏｍａｃｃｅｓｓｐｏｉｎｔｐｉｃｔｕｒｅ）は、「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｊ］」と同一の「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」値を有するピクチャに対して階層間予測のための参照ピクチャとして用いることができない。このような制約事項を反映するために数式１は下記数式３に代替され得る。

数式３において、変数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［］」はＶＰＳｅｘｔｅｎｓｉｏｎに記述されたシンタックス要素「ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ」から計算された現在階層が直接参照している参照階層の個数を示す。

数式３によれば、参照階層の「ｓｕｂ＿ｌａｙｅｒ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」値が現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値より大きいか同一であり、現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値が「０」を有するか、参照階層の「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」値が現在ピクチャの時間的識別子「ＴｅｍｐｏｒａｌＩｄ」値より大きい場合にのみ当該参照階層のピクチャを現在ピクチャのデコーディングに用いられ得る参照階層ピクチャとみなされ得る。

（３）そうではなく、もし（ｅｌｓｅｉｆ）、現在ピクチャのスライスセグメントヘッダーで記述されたシンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ」が「０」である場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「０」に設定され得る。ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、現在ピクチャのデコーディングに階層間予測が用いられるのか否かを示す。

（４）そうではなく、もし（ｅｌｓｅｉｆ）、ＶＰＳで記述されたシンタックス要素「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」が１であるか、現在ピクチャが属している階層の直接参照階層の個数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ」が１の場合には、数式１、数式２または数式３から求められた変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」が「０」より大きいと、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「１」に設定され得る。もし、数式１、数式２または数式３から求められた変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」が「０」であれば、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「０」に設定され得る。

「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」値が「１」であれば、最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられることを示し、「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」値が「０」であれば、一つ以上のピクチャが階層間予測のために用いられ得ることを示す。

（５）（１）から（４）の全ての条件を満足しない場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は、スライスセグメントヘッダーに転送されるシンタックス要素「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」に「１」を足し合わせた値に設定され得る。

（６）（１）から（５）でｎｕｍＲｅｆＬａｙｅｒＰｉｃｓは、当該階層のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値が「ｋ」であり、時間的サブ階層識別子であるＴｅｍｐｏｒａｌＩｄ値が「ｍ」の場合にｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｋ］［ｍ］のように表現され得、数式４または数式５から計算され得る。

ビットストリームに含まれた全体階層に対して、各階層のサブ階層ピクチャのデコーディングに用いられ得る参照階層ピクチャの個数を指示する変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」をＶＰＳレベルに誘導するための数式１は数式４または数式５に代替され得る。この場合、「ｎｕｍＲｅｆＬａｙｅｒＬａｙｅｒＰｉｃｓ」は、「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＴｅｍｐｏｒａｌＩｄ］」に代替され得る。

数式４において、変数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［］」はＶＰＳｅｘｔｅｎｓｉｏｎに記述されたシンタックス要素「ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ」から計算された現在階層が直接参照している参照階層の個数を示す。

「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」は、各階層の最大時間サブ階層情報を示し、「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」は各階層で階層間予測を許容する時間的サブ階層の最大許容値を示し、「ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１」はＶＰＳに記述された全体階層で許容可能な最大サブ階層情報を示す。

数式４の参照階層ピクチャに対する「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ」は、ＶＣＬＮＡＬユニットヘッダーに存在する「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」値を意味する。

数式４によれば、先ず上位レベル（例えば、ＶＰＳ）で各階層（０～ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１を対象として、０から「ｖｐｓ＿ｍａｘ＿ｓｕｂ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１」までｔｉｄ（Ｔｅｍｐｏｒａｌ）値を有するサブ階層に対して、直接参照階層から参照可能なサブ階層の存在可否が判断される。

判断の結果、参照可能なサブ階層が存在する場合、当該サブ階層に対する「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ」値をＲｅｆＬａｙｅｒＩｄＬｉｓｔＦｏｒＴｉｄ［［ｌＩｄ］［ｔＩｄ］［ｋ＋＋］に代入することができる。ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｌＩｄ］［ｔＩｄ］はｌＩｄ階層に対してｔＩｄ値を有するサブ階層が有する参照可能なサブ階層の数を意味する。

参照可能なサブ階層の存在可否は、参照階層の「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［］」値が現在ピクチャの「ＴｅｍｐｏｒａｌＩｄ（ｔＩｄ）」値より大きいか同一であり、参照階層の「ｍａｘ＿ｔｉｌｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［］［］」値が現在ピクチャの「ＴｅｍｐｏｒａｌＩｄ（ｔＩｄ）」値より大きいか、現在ピクチャのＴｅｍｐｏｒａｌＩｄ（ｔＩｄ）値が０である場合、当該参照階層のピクチャのみ階層間予測のために現在ピクチャのデコーディングに用いられ得る参照階層ピクチャと判断され得る。

数式５で、変数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［］」は、ＶＰＳｅｘｔｅｎｓｉｏｎに記述されたシンタックス要素「ｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ」から計算された現在階層が直接参照している参照階層の個数を示す。

「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」は、各階層の最大時間サブ階層情報を示し、「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」は各階層で階層間予測を許容する時間的サブ階層の最大許容値を示す。

数式５の参照階層ピクチャに対する「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ」は、ＶＣＬＮＡＬユニットヘッダーに存在する「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」値を意味する。

数式５によれば、先ず上位レベル（例えば、ＶＰＳ）で各階層（０～ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１を対象として０から各階層の最大時間サブ階層「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１」までｔｉｄ（Ｔｅｍｐｏｒａｌ）値を有するサブ階層に対して、直接参照階層から参照可能なサブ階層の存在可否が判断される。

判断の結果、参照可能なサブ階層が存在する場合、当該サブ階層に対する「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ」値をＲｅｆＬａｙｅｒＩｄＬｉｓｔＦｏｒＴｉｄ［［ｌＩｄ］［ｔＩｄ］［ｋ＋＋］に代入することができる。ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｌＩｄ］［ｔＩｄ］はｌＩｄ階層に対して、ｔＩｄ値を有するサブ階層が有する参照可能なサブ階層の数を意味する。

参照可能なサブ階層の存在可否は、参照階層の「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［］」値が現在ピクチャの「ＴｅｍｐｏｒａｌＩｄ（ｔＩｄ）」値より大きいか同一であり、参照階層の「ｍａｘ＿ｔｉｌｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［］［］」値が現在ピクチャの「ＴｅｍｐｏｒａｌＩｄ（ｔＩｄ）」値より大きいか、現在ピクチャのＴｅｍｐｏｒａｌＩｄ（ｔＩｄ）値が０である場合、当該参照階層のピクチャのみ階層間予測のために現在ピクチャのデコーディングに用いられ得る参照階層ピクチャとして判断され得る。

第２方法
階層間予測のため、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は、下記のように誘導されることもある。ピクチャの全てのスライスは、同一の「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」値を有するものと限定され得る。

（１）現在ピクチャが属している階層の「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」が０の値を有するか、数式１、数式２または数式３から求められた変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値が「０」の場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「０」に設定され得る。

（２）そうではなく、もし（ｅｌｓｅｉｆ）、ＶＰＳで記述されたシンタックス要素「ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇ」値が１である場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は、数式１、数式２または数式３から求められた変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値と同一になるように設定され得る。

（３）そうではなく、もし（ｅｌｓｅｉｆ）、現在ピクチャのスライスセグメントヘッダーで記述されたシンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ」が「０」であれば、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「０」に設定され得る。

（４）そうではなく、もし（ｅｌｓｅｉｆ）、ＶＰＳで記述されたシンタックス要素「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」が１であるか、現在ピクチャが属している階層の直接参照階層の数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ」が１の場合、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「１」に設定され得る。

（５）（１）から（４）の全ての条件を満足しない場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は、スライスセグメントヘッダーから転送されるシンタックス要素「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」に「１」を足し合わせた値に設定され得る。

（６）（１）から（５）のｎｕｍＲｅｆＬａｙｅｒＰｉｃｓは、当該階層のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値が「ｋ」であり、時間的サブ階層識別子であるＴｅｍｐｏｒａｌＩｄ値が「ｍ」の場合にｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｋ］［ｍ］のように表現され得、数式４または数式５から誘導され得る。

第３方法
また他の例として、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は、下記のように誘導されることもある。ピクチャの全てのスライスは、同一の「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」値を有するものと限定され得る。

（２）そうではなく、もし（ｅｌｓｅｉｆ）、ＶＰＳで記述されたシンタックス要素「ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇ」値が１である場合、階層間予測のために現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は数式１、数式２または数式３から求められた変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値と同一になるように設定され得る。

（４）そうではなく、もし（ｅｌｓｅｉｆ）、ＶＰＳで記述されたシンタックス要素「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」値が１であるか、数式１、数式２または数式３から変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」値が「１」の場合、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」は「１」に設定され得る。

一方、ＶＰＳｅｘｔｅｎｓｉｏｎに記述されたシンタックス要素から計算された現在階層が直接参照している参照階層の個数を指示する変数「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ［］」、各階層の最大時間サブ階層情報を指示するシンタックス要素「ｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］」、各階層で階層間予測を許容する時間的サブ階層の最大許容値を指示するシンタックス要素「ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］」情報、現在ピクチャの時間情報「ＴｅｍｐｏｒａｌＩｄ」を利用して階層間予測のために現在ピクチャのデコーディングに用いられ得る参照階層ピクチャの個数を指示する変数「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」を誘導する場合、階層間予測に用いられるピクチャに関する情報をシグナリングするスライスセグメントヘッダーは、下記の表１０のように記述することができる。

表１０を参照すれば、「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」が０より大きく、ＶＰＳｅｘｔｅｎｓｉｏｎで記述されたシンタックス要素「ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇ」が０であり、数式１または数式２から誘導された「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値が「０」より大きい場合にのみ、階層間参照ピクチャに対する情報（ｉｎｔｅｒ－ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）がシグナリングされ得る。

また、シンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ」が１であり、「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値が「１」より大きい場合にのみ、階層間参照ピクチャの個数情報を指示するシンタックス要素「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」及び階層間参照ピクチャを指示するシンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」がシグナリングされ得る。

前記条件において、ＶＰＳｅｘｔｅｎｓｉｏｎで記述されたシンタックス要素「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」が１である場合には、階層間参照ピクチャの個数を指示するシンタックス要素「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」はシグナリングされないこともある。

前記条件において、「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」と「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」の値が同一である場合には、階層間参照ピクチャを指示するシンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」はシグナリングされないこともある。

シンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」は、０から現在ピクチャが属している階層の「ＮｕｍＤｉｒｅｃｔＲｅｆＬａｙｅｒｓ－１」までの値を有することができ、「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」がシグナリングされない場合には、数式１または数式２から誘導された「ｒｅｆＬａｙｅｒＰｉｃＩｄｃ［ｉ］」のようなものにも類推され得る。

このとき、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャに対する情報は、下記の数式６のように誘導され得る。「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」は現在ピクチャの「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」値であり、ＲｅｆＬａｙｅｒＩｄ［］［］は参照階層の「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［］」値を有する。
一方、他の例として数式４または数式５を利用して「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ」を誘導する場合、階層間予測に用いられるピクチャに関する情報をシグナリングするスライスセグメントヘッダーは、下記の表１１のように記述することができる。

表１１でｎｕｈ＿ｌａｙｅｒ＿ｉｄは、現在デコーディング対象ピクチャのＮＡＬヘッダーに記述された階層識別子情報であり、ＴｅｍｐｏｒａｌＩｄは現在デコーディング対象ピクチャの時間情報、すなわちサブレイヤ階層情報を示す。

表１１を参照すれば、「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」が０より大きく、ＶＰＳｅｘｔｅｎｓｉｏｎで記述されたシンタックス要素「ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇ」が０であり、数式４または数式５から誘導された「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＴｅｍｐｏｒａｌＩｄ］」の値が「０」より大きい場合にのみ、階層間参照ピクチャに対する情報（ｉｎｔｅｒ－ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）がシグナリングされ得る。

また、シンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ」が１であり、「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＴｅｍｐｏｒａｌＩｄ］」の値が「１」より大きい場合にのみ、階層間参照ピクチャの個数情報を指示するシンタックス要素「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」及び階層間参照ピクチャを指示するシンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」がシグナリングされ得る。

前記条件でＶＰＳｅｘｔｅｎｓｉｏｎで記述されたシンタックス要素「ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ」が１である場合には、階層間参照ピクチャの個数を指示するシンタックス要素「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」はシグナリングされないこともある。「ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１」は、０から数式４または数式５から誘導された「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＴｅｍｐｏｒａｌＩｄ］－１」値を有することができる。

前記条件で「ＮｕｍＡｃｔｉｖｅＲｅｆＬａｙｅｒＰｉｃｓ」と「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＴｅｍｐｏｒａｌＩｄ］」の値が同一の場合には、階層間参照ピクチャを指示するシンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」はシグナリングされないこともある。

シンタックス要素「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」は、０から現在ピクチャが属している階層の「ｎｕｍＲｅｆＬａｙｅｒＰｉｃｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］［ＴｅｍｐｏｒａｌＩｄ］－１」までの値を有し得ると、「ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｌａｙｅｒ＿ｉｄｃ［ｉ］」がシグナリングされない場合にはインデックス「ｉ」値と同一であると類推され得る。

このとき、現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャに対する情報は、下記の数式７のように誘導され得る。「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」は現在ピクチャの「ｎｕｈ＿ｌａｙｅｒ＿ｉｄ」値であり、ＲｅｆＬａｙｅｒＩｄＬｉｓｔＦｏｒＴｉｄ［］［］は数式４または数式５から誘導された参照階層の「ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［］」値を有する変数である。

一方、現在ＳＨＶＣ及びＭＶ－ＨＥＶＣ標準草案では、ターゲットデコーディング階層に対する情報（ＴａｒｇｅｔＤｅｃＬａｙｅｒＩｄＬｉｓｔ）とターゲット出力階層に対する情報（ＴａｒｇｅｔＯｐｔＬａｙｅｒＩｄＬｉｓｔ）は数式８のように誘導される。

数式８を参照すれば、変数ＴａｒｇｅｔＯｐｔＬａｙｅｒＳｅｔＩｄｘはターゲット出力レイヤセットインデックスを示し、ＶＰＳｅｘｔｅｎｓｉｏｎで記述されるシンタックス要素のｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｓｅｔ＿ｉｄｘ＿ｍｉｎｕｓ１［］によってレイヤセット（ｌａｙｅｒｓｅｔｓ）インデックスに変換され得る。

ＮｕｍＬａｙｅｒｓＩｎＩｄＬｉｓｔはレイヤセットに含まれている階層の数を示し、ＴａｒｇｅｔＤｅｃＬａｙｅｒＩｄＬｉｓｔはレイヤセットに含まれてデコーディングされなければならない階層のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指示する。ＴａｒｇｅｔＯｐｔＬａｙｅｒＩｄＬｉｓｔはレイヤセットに含まれて出力されなければならない階層のｎｕｈ＿ｌａｙｅｒ＿ｉｄ値を指示する。

ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇが１である階層のｎｕｈ＿ｌａｙｅｒ＿ｉｄのみが、ＴａｒｇｅｔＯｐｔＬａｙｅｒＩｄＬｉｓｔに含まれ得る。

ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［］［］は、ＶＰＳｅｘｔｅｎｓｉｏｎで出力レイヤセット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ）単位でシグナリングされる。

しかし、数式８では出力レイヤセット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ）単位ではないレイヤセット（ｌａｙｅｒｓｅｔ）単位でｏｕｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ値を判断しているので、出力される階層の情報を正常に識別することができない問題が発生することがある。

また、ｉが０からｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１範囲の値を有するｉ番目の出力レイヤセット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ）に対するｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］を明示していないので、出力される階層の情報を正常に識別することができない問題が発生することがある。

前記のような問題を解決するため、ターゲットデコーディング階層に対する情報（ＴａｒｇｅｔＤｅｃＬａｙｅｒＩｄＬｉｓｔ）とターゲット出力階層に対する情報（ＴａｒｇｅｔＯｐｔＬａｙｅｒＩｄＬｉｓｔ）を誘導するための数式８を数式９のように変更することができる。

数式９を利用してｉが０からｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１範囲の値を有するｉ番目の出力レイヤセット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ）に対するｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］値が明示され得る。

数式９で、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］が１であれば、ｉ番目の出力レイヤセット内にｊ番目の階層がターゲット出力階層であることを示し、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］が０であればｉ番目の出力レイヤセット内にｊ番目の階層がターゲット出力階層ではないことを示す。

ターゲット出力レイヤセットインデックス（ＴａｒｇｅｔＯｐｔＬａｙｅｒＳｅｔＩｄｘ）が指示する出力レイヤセット内のｊ番目レイヤの出力可否を指示する出力レイヤフラッグ（ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ）が１であれば、ターゲット出力階層に対する情報を有しているターゲット出力レイヤアイディリスト（ＴａｒｇｅｔＯｐｔＬａｙｅｒＩｄＬｉｓｔ）は、ターゲットデコーディングレイヤセットインデックス（ＴａｒｇｅｔＤｅｃＬａｙｅｒＳｅｔＩｄｘ）が指示するレイヤセット内のｊ番目レイヤのｌａｙｅｒ＿ｉｄ値で構成され得る。

ターゲットデコーディングレイヤセットインデックス（ＴａｒｇｅｔＤｅｃＬａｙｅｒＳｅｔＩｄｘ）は、ビデオパラメータセットでシグナリングされる出力レイヤセットインデックス情報から特定され得る。

ターゲットデコーディング階層に対する情報を有しているターゲットデコーディングレイヤアイディリスト（ＴａｒｇｅｔＤｅｃＬａｙｅｒＩｄＬｉｓｔ）は、ターゲットデコーディングレイヤセットインデックス（ＴａｒｇｅｔＤｅｃＬａｙｅｒＳｅｔＩｄｘ）が指示するレイヤセット内のｊ番目レイヤのｌａｙｅｒ＿ｉｄ値で構成され得る。

ｉが０からｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１範囲の値を有するｉ番目の出力レイヤセット（ｏｕｔｐｕｔｌａｙｅｒｓｅｔ）に対するｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は、下記の（ａ）と（ｂ）のように類推され得ることを標準文書上に明示することができる。

ｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃは、出力レイヤセットに対する出力レイヤを誘導するためにシグナリングされる値であって、０から３の値を有することができる。

ｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃが０であれば、出力レイヤセットに含まれている全てのレイヤが出力されることを示すことができ、ｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃが１であることを出力レイヤセットに含まれているレイヤのうち最上位レイヤ、すなわち最も高いレイヤｉｄを有するレイヤのみが出力されることを示すことができる。

また、ｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃが２であれば、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇが１であるレイヤのみ出力されることを示すことができる。ｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃが３であれば、それ以後に用いられ得るリゾルブ値を示すことができる（ｒｅｓｅｒｖｅｄｆｏｒｆｕｔｕｒｅｕｓｅ）。

（ａ）ＶＰＳで記述されるｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃが１であれば、ｉ番目レイヤセットに含まれているｊ番目レイヤに対するｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は「１」に類推され得る。ｊは、ＮｕｍＬａｙｅｒｓＩｎＩｄＬｉｓｔ［ｉ］－１に設定される。そうでなければ、（ｏｔｈｅｒｗｉｓｅ）ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は０に類推され得る。このとき、ｊは０からＮｕｍＬａｙｅｒＩｎＩｄＬｉｓｔ［ｉ］－１の値を有する。

（ｂ）ＶＰＳで記述されるｄｅｆａｕｌｔ＿ｏｎｅ＿ｔａｒｇｅｔ＿ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｉｄｃが０であれば、ｏｕｔｐｕｔ＿ｌａｙｅｒ＿ｆｌａｇ［ｉ］［ｊ］は１に類推され得る。このとき、ｊは０からＮｕｍＬａｙｅｒＩｎＩｄＬｉｓｔ［ｉ］－１値を有する。

ＶＰＳｅｘｔｅｎｓｉｏｎで記述されるｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１は、ＶＰＳに記述されるｌａｙｅｒｓｅｔｓの個数を報知する情報であり、ＭＶ－ＨＥＶＣ／ＳＨＶＣビットストリームは二つ以上のレイヤセット（ｌａｙｅｒｓｅｔｓ）を含むため、ｖｐｓ＿ｎｕｍｂｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１の値は常に１より大きい値を有する。よって、ｕ（１０）で符号化されるｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１は、１から１０２３値を有すると明示することができる。または、ｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ１をｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ２に変えて、ｖｐｓ＿ｎｕｍｂｅｒ＿ｌａｙｅｒ＿ｓｅｔｓ＿ｍｉｎｕｓ２は０から１０２２値を有すると明示することができる。

また、本発明によれば、階層間予測のために必要ではない非参照ピクチャを表す方法が提供される。

最上位の時間レベル（ＨｉｇｈｅｓｔＴｅｍｐｒｏａｌＩｄ）を有するピクチャに対しては、ＶＰＳｅｘｔｅｎｓｉｏｎでシグナリングされるｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［］［］値に基づいて非参照ピクチャであるのか、参照ピクチャであるのかを把握することができる。

現在ＳＨＶＣ及びＭＶ－ＨＥＶＣ標準草案では、下記の数式１０のように最上位の時間レベルを有するピクチャに対して参照ピクチャであるのか、非参照ピクチャであるのか区分して表示している。

数式１０でｃｕｒｒＴｉｄは、現在デコーディングされたピクチャの時間レベルを示し、ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉＬｉｄｘ］［ｊＬｉｄｘ］は現在階層で階層間予測を許容する最大時間レベルの情報を示し、ＶＰＳでシグナリングされる。ｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉＬｉｄｘ］［ｊＬｉｄｘ］は、現在階層と従属関係を有する上位階層別にシグナリングされる。

現在デコーディングされたピクチャの時間レベルが従属性を有する上位階層のためのｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［］［］より小さいか同一である場合、現在デコーディングされたピクチャが属している階層と従属性（ｄｅｐｅｎｄｅｎｃｙ）を有する上位階層に対してｒｅｍａｉｎｉｎｇＩｎｔｅｒＬａｙｅｒＲｅｆｅｒｅｎｃｅｓＦｌａｇ値を１に設定する。

現在デコーディングされたピクチャと従属性を有する全ての上位階層に対してｒｅｍａｉｎｉｎｇＩｎｔｅｒＬａｙｅｒＲｅｆｅｒｅｎｃｅｓＦｌａｇ値を判断した後、ｒｅｍａｉｎｉｎｇＩｎｔｅｒＬａｙｅｒＲｅｆｅｒｅｎｃｅｓＦｌａｇ値が０である場合、現在ピクチャに対して「非参照ピクチャ」と表示することとなる。

しかし、現在デコーディングされたピクチャが従属性を有する上位階層のうちいずれか一階層に対して参照階層として用いられた場合、現在デコーディングされたピクチャは「参照ピクチャ」と表示されなければならない。

したがって、下記数式１０のように従属性を有する上位階層のうち一階層に対して「参照ピクチャ」を意味するｒｅｍａｉｎｉｎｇＩｎｔｅｒＬａｙｅｒＲｅｆｅｒｅｎｃｅｓＦｌａｇが１に設定される場合には、残りの上位階層に対するｒｅｍａｉｎｉｎｇＩｎｔｅｒＬａｙｅｒＲｅｆｅｒｅｎｃｅＦｌａｇ値を判断する過程を略して現在デコーディングされたピクチャを「非参照ピクチャ」に変更しないことができる。すなわち、現在デコーディングされたピクチャは「参照ピクチャ」とみなされ得る。

図４は、本発明に係る映像の復号化方法を説明するための制御フローチャートである。

先ず、復号化装置は、階層間予測のために現在ピクチャのデコーディングに用いられる参照階層に対する情報を受信することができる（Ｓ４１０）。

このような参照階層に対する情報は、ｊインデックスを有するレイヤがｉインデックスを有するレイヤのための直接的な参照階層であるのか否かを指示するｄｉｒｅｃｔ＿ｄｅｐｅｎｄｅｎｃｙ＿ｆｌａｇ［ｉ］［ｊ］、各階層の最大時間サブ階層情報を指示するｓｕｂ＿ｌａｙｅｒｓ＿ｖｐｓ＿ｍａｘ＿ｍｉｎｕｓ１［ｉ］、各階層で階層間予測を許容する時間的サブ階層の最大許容値を指示するｍａｘ＿ｔｉｄ＿ｉｌ＿ｒｅｆ＿ｐｉｃｓ＿ｐｌｕｓ１［ｉ］［ｊ］、現在ピクチャの時間的サブレイヤ識別子、現在ピクチャを含む現在階層の全ての直接的な参照階層に属し、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値によって特定される階層間予測に用いられ得る参照階層ピクチャが、現在ピクチャと同一のアクセスユニットに存在し、現在ピクチャの階層間参照ピクチャセットに含まれるのか否かを示すａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇ、現在ピクチャのデコーディングに階層間予測が用いられるのか否かを示すｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるのか否かを示すｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇ、階層間予測のために現在ピクチャのデコーディングに用いられるピクチャの個数を示すｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１などのようなフラッグ情報と個数に対する情報を含むことができる。

復号化装置は、参照階層に対する情報に基づいて現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を誘導する（Ｓ４２０）。

現在ピクチャに属する全てのスライスは、同一の有効な参照階層ピクチャの個数を有することができる。

図５は、本発明の一実施形態による有効な参照階層ピクチャの個数を誘導する方法を説明するための図である。図５を参照して本実施例による有効な参照階層ピクチャの個数を誘導する過程を説明すれば次の通りである。

先ず、現在ピクチャが属している現在階層を識別するレイヤ識別子が０であるか、現在ピクチャが属している現在階層が直接参照する階層の個数が０であるかの可否が判断される（Ｓ５１０）。

判断の結果、現在ピクチャが属している現在階層を識別するレイヤ識別子が０であるか、現在ピクチャが属している現在階層が直接参照する階層の個数が０であれば、有効な参照階層ピクチャの個数は０に誘導される（Ｓ５２０）。

そうではない場合、すなわち、現在ピクチャが属している現在階層を識別するレイヤ識別子が０であるか、現在ピクチャが属している現在階層が直接参照する階層の個数が０の場合でなければ、当該ピクチャを含む階層の全ての直接参照階層に属する直接参照階層ピクチャのうち、現在ピクチャと同一のアクセスユニットに存在して当該ピクチャの階層間参照ピクチャセットに含まれた全ての直接参照ピクチャが階層間予測に用いられるのか否かが判断される（Ｓ５３０）。

段階Ｓ５３０は、ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇのようなフラッグ情報に基づいて本段階が判断され得、ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが１であれば、有効な参照階層ピクチャの個数は現在ピクチャのデコーディングに用いられ得る参照階層ピクチャの個数を指示する参照階層ピクチャ個数に誘導され得る（Ｓ５４０）。

参照階層ピクチャ個数は、現在階層が直接参照している参照階層の個数を指示する変数、各階層の最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値、現在ピクチャの時間的識別子に基づいて誘導される。このとき、現在ピクチャに属している直接参照階層のピクチャのうち、参照階層の最大時間的サブ階層情報が現在ピクチャの時間的識別子より大きいか同一であり、現在階層に対する参照階層の最大時間的サブ階層情報が前記現在ピクチャの時間的識別子より大きい場合、該当する参照階層のピクチャが階層間予測のために現在ピクチャのデコーディングに用いられ得る参照階層ピクチャとみなされ得る。

ａｌｌ＿ｒｅｆ＿ｌａｙｅｒｓ＿ａｃｔｉｖｅ＿ｆｌａｇが０であれば、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇを介して現在ピクチャのデコーディングに階層間予測が用いられないのか否かが判断され（Ｓ５５０）、ｉｎｔｅｒ＿ｌａｙｅｒ＿ｐｒｅｄ＿ｅｎａｂｌｅｄ＿ｆｌａｇが０であれば、有効な参照階層ピクチャの個数は０に誘導される（Ｓ５２０）。

そうではない場合、最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、現在ピクチャが属している階層の直接参照階層の個数が１であるかの可否が判断される（Ｓ５６０）。

ｍａｘ＿ｏｎｅ＿ａｃｔｉｖｅ＿ｒｅｆ＿ｌａｙｅｒ＿ｆｌａｇが１であるか、現在ピクチャが属している階層の直接参照階層の個数が１であれば、有効な参照階層ピクチャの個数は１に誘導される（Ｓ５７０）。

前記全ての判断条件を満足しない場合、有効な参照階層ピクチャの個数は、参照階層に対する情報が階層間予測のために現在ピクチャのデコーディングに用いられるピクチャの個数を示す個数情報（ｎｕｍ＿ｉｎｔｅｒ＿ｌａｙｅｒ＿ｒｅｆ＿ｐｉｃｓ＿ｍｉｎｕｓ１で特定される値に誘導され得る（Ｓ５８０）。

また、図４に戻って、有効な参照階層ピクチャの個数が誘導されると、これに基づいて復号化装置は階層間予測を行う（Ｓ４３０）。

前述したように、本発明に係る場合、時間的階層を含む多数の階層構造の映像符号化されたビットストリーム内に存在する階層情報を報知するシグナリング方法、階層間予測及びターゲット出力階層を求める方法及びこれを利用する装置が提供される。

また、本発明は、セッション交渉などのためにビットストリーム内のＶＰＳに記述された階層情報を、エントロピーデコーダがなくとも接近できる方法及びこれを利用する装置を提供する。

前述した実施例において、方法は一連の段階またはブロックとしてフローチャートに基づいて説明されているが、本発明は段階の順序に限定されるものではなく、ある段階は前述したところと異なる段階と異なる順序で、または同時に発生することができる。また、当該技術分野で通常の知識を有する者であれば、フローチャートに示されている段階が排他的ではなく、他の段階が含まれるか、フローチャートの一つまたはそれ以上の段階が本発明の範囲に影響を及ぼさずに削除され得ることを理解できるはずである。

前述した実施例は多様な様態の例示を含む。多様な様態を現わすために可能な全ての組合せを記述することはできないが、当該技術分野の通常の知識を有する者は異なる組合せが可能であることが認識できる。よって、本発明は、以下の特許請求の範囲内に属する全ての異なる交替、修正及び変更を含む。

Claims

複数の階層を支援する映像のデコーディング方法において、
階層間予測のために現在ピクチャのデコーディングに用いられる参照階層に対する情報を受信する段階と、
前記参照階層に対する情報に基づいて前記現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を誘導する段階と、
前記有効な参照階層ピクチャの個数に基づいて階層間予測を行う段階とを含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が０でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が０でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピクチャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が０より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が０の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする方法。
前記現在ピクチャの全てのスライスは、前記有効な参照階層ピクチャの同一の個数を参照することを特徴とする請求項１に記載の方法。
前記現在ピクチャを含む前記現在階層の前記レイヤ識別子が０の場合、前記有効な参照階層ピクチャの個数は０に誘導されることを特徴とする請求項１に記載の方法。
前記現在ピクチャと同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの前記最後の個数が０である場合、前記有効な参照階層ピクチャの個数は、０に誘導されることを特徴とする請求項１に記載の映像復号化方法。
前記現在ピクチャのデコーディングに階層間予測が用いられない場合、前記有効な参照階層ピクチャの個数は０に誘導されることを特徴とする請求項１に記載の方法。
最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、あるいは前記現在ピクチャを含む前記階層の直接参照階層の個数が１である場合、前記有効な参照階層ピクチャの個数は１に誘導されることを特徴とする請求項１に記載の方法。
前記参照階層に対する情報が、階層間予測のために現在ピクチャのデコーディングに用いられるピクチャの個数を示す個数情報を含む場合、前記有効な参照階層ピクチャの個数は、前記個数情報によって特定される値に誘導されることを特徴とする請求項１に記載の方法。
複数の階層を支援する映像のデコーディング装置において、
階層間予測のために現在ピクチャのデコーディングに用いられる参照階層に対する情報を受信し、前記参照階層に対する前記情報に基づいて、前記現在ピクチャのデコーディングに用いられる有効な参照階層ピクチャの個数を誘導し、前記有効な参照階層ピクチャの個数に基づいて階層間予測を行うデコーディング部を含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が０でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が０でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピク
チャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が０より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が０の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする装置。
前記現在ピクチャを含む前記現在階層の前記レイヤ識別子が０の場合、前記有効な参照階層ピクチャの個数は０に誘導されることを特徴とする請求項８に記載の装置。
前記現在ピクチャと同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの前記最後の個数が０である場合、前記有効な参照階層ピクチャの個数は、０に誘導されることを特徴とする請求項８に記載の装置。
前記現在ピクチャのデコーディングに階層間予測が用いられない場合、前記有効な参照階層ピクチャの個数は０に誘導されることを特徴とする請求項８に記載の装置。
最大一つのピクチャがコーディングビデオシーケンス内の各ピクチャのための階層間予測のために用いられるか、あるいは前記現在ピクチャを含む前記階層の直接参照階層の個数が１である場合、前記有効な参照階層ピクチャの個数は１に誘導されることを特徴とする請求項８に記載の装置。
複数の階層を支援する映像のエンコーディング方法において、
階層間予測のために現在ピクチャのエンコーディングに用いられる参照階層に対する情報を決定する段階と、
前記参照階層に対する情報に基づいて前記現在ピクチャのエンコーディングに用いられる有効な参照階層ピクチャの個数を誘導する段階と、
前記有効な参照階層ピクチャの個数に基づいて階層間予測を行う段階とを含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が０でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が０でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピク
チャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が０より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が０の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする方法。
複数の階層を支援する映像のエンコーディング装置において、
階層間予測のために現在ピクチャのエンコーディングに用いられる参照階層に対する情報を決定し、前記参照階層に対する前記情報に基づいて、前記現在ピクチャのエンコーディングに用いられる有効な参照階層ピクチャの個数を誘導し、前記有効な参照階層ピクチャの個数に基づいて階層間予測を行うエンコーディング部を含み、
前記現在ピクチャを含む現在階層のレイヤ識別子が０でない場合、かつ、前記現在ピクチャの階層間予測と同一のアクセスユニット内の階層間予測に用いられ得る参照階層ピクチャの最後の個数が０でない場合、かつ、前記現在階層の全ての直接参照階層に含まれる直接参照階層ピクチャのうち、各階層の最大時間サブ階層情報と各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する情報の値によって特定される階層間予測に用いられ得る参照階層ピクチャが、前記現在ピクチャと同一のアクセスユニットに存在し、前記現在ピクチャの階層間参照ピクチャセットに含まれる場合、前記有効な参照階層ピク
チャの個数は、前記参照階層ピクチャの最後の個数と等しくなるように誘導され、
前記参照階層ピクチャの個数が増加するか否かは、前記現在階層の直接参照階層の個数を指示する情報、各階層の前記最大時間的サブ階層情報、各階層で階層間予測を許容する時間的サブ階層の最大許容値に対する前記情報、現在ピクチャの時間的識別子に基づいて決定され、
前記参照階層の前記最大時間サブ階層情報が前記現在ピクチャの前記時間的識別子以上である場合、前記現在ピクチャの前記時間的識別子に基づいて、前記参照階層ピクチャの数が増加するか否かが決定され、
前記現在ピクチャの前記時間的識別子が０より大きい場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間的識別子より大きい場合にのみ、前記参照階層ピクチャの数が増加し、
前記現在ピクチャの前記時間的識別子が０の場合、参照階層で階層間予測を可能にする時間サブ階層の最大許容値に関する情報が前記現在ピクチャの前記時間レイヤより大きいか否かに関係なく、前記参照階層ピクチャの数が増加し、
前記参照階層ピクチャの最後の個数は、前記現在ピクチャの前記時間的識別子に基づく増加処理が実行された後に得られる前記参照階層ピクチャの数に対応することを特徴とする装置。