JP2019050595A

JP2019050595A - 効率的なスケーラブル符号化概念

Info

Publication number: JP2019050595A
Application number: JP2018206897A
Authority: JP
Inventors: カルステンズューリング; Suehring Karsten; トーマスシーアル; Schierl Thomas; ヴァレーリジョージ; George Valeri; デトレフマルペ; Detlev Marpe; ローベルトスクーピン; Skupin Robert
Original assignee: GE Video Compression LLC
Current assignee: GE Video Compression LLC
Priority date: 2013-01-04
Filing date: 2018-11-01
Publication date: 2019-03-28
Anticipated expiration: 2034-01-04
Also published as: KR20150103224A; KR102149959B1; KR102539065B1; US20150304667A1; KR20200104926A; US11677966B2; US10609396B2; JP2016506196A; CN116320392A; JP6839158B2; CN116366835A; CN116708768A; KR20170136654A; JP2021078156A; WO2014106651A1; CN116347068A; CN110062240B; US20190020883A1; EP2941891B1; CN105144720B

Abstract

【課題】スケーラブルビデオ符号化概念を改善した装置及び方法を提供する。【解決手段】エンコーダ１０は、レイヤ１の画像の空間セグメント間の境界がレイヤ０の空間セグメントの各境界を覆うように、短期シンタックス要素の時間間隔より大きい所定期間の間、特定の値を仮定するときに、従属するレイヤの画像が再分割されることを保証する長期シンタックス要素構造を導入し、マルチレイヤビデオデータストリームの相互依存しているレイヤの並列復号化を改善する。また、ベースレイヤからエンハンスレイヤまでアップサンプリングに関し、ベースレイヤの分割に沿った補間が、ベースレイヤ画像の隣接した分割のピクセル／画素を混同しないように修正されることをデコーダに通知するシンタックス要素が、導入される。さらに、デコーダが所定期間の間インターレイヤオフセットを決定するのを可能にする長期シンタックス要素構造を導入する。【選択図】図１

Description

本出願は、例えばスケーラブルビデオ符号化等の、スケーラブル符号化概念に関する。

スケーラブル符号化概念は、従来技術において周知である。ビデオ符号化において、例えば、Ｈ．２６４は、ベースレイヤ符号化ビデオデータストリームが異なる条件、例えば空間分解能、信号対雑音比（ＳＮＲ）等、におけるベースレイヤ品質ビデオの再生品質を向上させるために付加的なエンハンスメントレイヤデータにより付随されるべきベースレイヤ符号化ビデオデータストリームを可能にするＳＶＣ拡張（スケーラブルビデオ符号化）を含む。最近まとまったＨＥＶＣ規格は、ＳＶＣプロファイルによっても拡張される。ＨＥＶＣは、その前身のＨ．２６４と多くの態様、例えば並列復号化／符号化および低遅延伝送のための適合性、において異なる。並列符号化／復号化に関する限り、ＨＥＶＣはタイル並列処理概念と同様に、ＷＰＰ（波面並列処理）符号化／復号化をサポートする。ＷＰＰ概念によれば、個々の画像は、行方向の態様でサブストリームに分割される。各サブストリーム内の符号化順序は、左から右に向けられる。サブストリームは、最上位のサブストリームから最下位のサブストリームに進むそれらの間で定義された復号化順序を有する。サブストリームのエントロピー符号化は、確率適合を使用して実行される。確率初期化は、第２のＣＴＢ（符号化ツリーブロック）の端のような、先行するサブストリームの左側の端から、それぞれ、特定の位置まで、各サブストリームごとに独立に、または、直接先行するサブストリームをエントロピー符号化する際に使用される確率の前もって適合された状態に基づいて行われる。空間予測は、制限される必要はない。すなわち、空間予測は、直ちに後続するサブストリームの間で境界と交差し得る。このように、左から右に、左下から右上まで進行する傾斜された態様で、この種のサブストリームは、走行する波面を形成する現在符号化／復号化している位置と並列に符号化／復号化され得る。タイル概念によれば、画像はタイルに分割され、そして、これらのタイルの符号化／復号化に並列処理可能な対象を与えるために、タイル境界全体の空間予測は禁止される。単に、タイル境界全体のインループフィルタリングのみが、許容され得る。低遅延処理をサポートするために、スライス概念は、拡張された：以前のサブストリーム、すなわち、現在のスライスが始まるサブストリームに先行するサブストリームが属する、を処理する間、保存されたエントロピー確率を採用し新たに初期化するために、かつ、直前のスライスの端まで連続的に更新されていたエントロピー確率を採用するために、スライスは、切替え可能でもあり得る。この測定により、ＷＰＰおよびタイル概念は、低遅延処理により適しているようになる。

それにもかかわらず、スケーラブル符号化概念を更に改善する概念を手元に有することは、より有利である。

したがって、スケーラブル符号化概念を更に改善する概念を提供することは、本発明の目的である。

この目的は、係属している独立クレームの主題によって達成される。

本出願の第１の態様は、並列処理概念と関連してスケーラブルビデオ符号化に関する。ＷＰＰおよびタイル分割のような並列処理概念は、画像が例えばサブストリーム、タイルまたはスライスに再分割される空間セグメントにおけるビデオの画像の並列復号化を可能にする。空間イントラ画像予測のように、インターレイヤ予測は、インターレイヤ予測を介して互いに従属しているレイヤを復号化する際の並列化の度合を制限する。より正確には、空間イントラレイヤ予測は、単一レイヤの画像を復号化する際に並列化の程度を制限するが、課題は、異なる方法で解決される。例えば、空間セグメントとしてタイルを使用するときに、空間イントラレイヤ予測は、タイル境界と交差しないように制限される。ＷＰＰサブストリームの場合、その並列処理は、波面を適当にチルト処理することに結果としてなるように、千鳥状に実行される。インターレイヤ予測の場合、従属するレイヤを復号化することは、リファレンスレイヤの同じ位置に配置された部分に依存しているようになる。従って、リファレンスレイヤの同じ位置に配置された部分がすでに処理された／復号化された所で、従属するレイヤの空間セグメントを復号化することは、その時に可及的速やかに開始され得る。「同じ位置に配置された部分」の領域は、「動き補償」を可能にする場合、異なるレイヤとしての異なるビューの場合のインターレイヤ予測の例のように、または、より低いレイヤからより高いレイヤまでアップサンプリングすることのために拡大される。すなわち、ビデオデコーダが、短期シンタックス要素がこれら相互依存するレイヤの画像の空間セグメントへの再分割を定義する、これら相互依存しているレイヤに関する短期シンタックス要素から相互依存するレイヤを並列処理する際に並列化の度合を導出するインターレイヤ予測および並列復号化を使用しているスケーラブル復号化をサポートすることを実行可能にする。しかしながら、着実にそうすることは、扱いにくく、かつ、計算量的に複雑である。それを越えて、そうするときに、ビデオデコーダは適切に、マルチレイヤビデオデータストリームを復号化するために並列に実行される復号化スレッドをスケジュールし得ない。したがって、本発明の第１の態様によれば、マルチレイヤビデオデータストリームの相互依存しているレイヤの並列復号化は、特定の値を仮定するときに、ビデオデコーダに、短期シンタックス要素の時間間隔より大きい所定期間の間、第２のレイヤの画像の空間セグメント間の境界が第１のレイヤの空間セグメントのあらゆる境界と重畳するように、従属するレイヤの画像が再分割されることを保証する長期シンタックス要素構造を導入することにより改善される。この指標によれば、相互依存しているレイヤの画像の空間セグメントへの再分割がこれら相互依存しているレイヤの間で可能な並列化の度合を不注意に減らさないように、ビデオデコーダは、マルチレイヤビデオデータストリームが適切にエンコードされたという事実に依存し得る。むしろ、デコーダは、所定期間の間、異なるレイヤの空間セグメントの境界が示された態様における各々と重畳する制約を利用することによって、前もってビデオデコーダの並列処理スレッド上への空間セグメントの配布をスケジュールし得る。しかし、長期シンタックス要素構造は、この保証をオフすることを可能にし、それにより、他の応用シナリオにおいて、または、ハイエンドビデオデコーダのために、短期シンタックス要素のみに応じて短期基礎上の並列処理スケジューリングを実行するために、すなわち相互依存しているレイヤの空間セグメントの境界の間の相対的な位置に関するいかなる保証も利用しないことを可能にする。日和見主義的な復号化の決定のために、長期シンタックス要素も、使用され得る。

相互依存しているレイヤの並列処理と関連して、本出願の他の態様は、相互依存しているレイヤの画像がベースレイヤからエンハンスメントレイヤまでアップサンプリングを使用しているインターレイヤ予測に従属するスケーラブル符号化に関する。特に、この態様は、ベースレイヤからエンハンスメントレイヤまでアップサンプリングを行うために使用される補間に関係する。通常、この種の補間は、ベースレイヤ画像の隣接した分割を、互いに従属するようにさせる。すなわち、補間は、アップサンプリングされたベースレイヤ基準画像の部分の外側の円周での補間結果が、隣接した分割のピクセル／ペルだけではなくベースレイヤ画像の同じ位置に配置された間で両方のピクセル／ペルに依存している原因となる。換言すれば、エンハンスメントレイヤ画像において予測されるために同じ位置に配置された部分のためのインターレイヤ予測のための参照として役立っているベースレイヤ画像の領域は、「外にスメアして」拡大する。不注意に、インターレイヤ予測の補間によって生じるこの種の相互依存は、相互依存しているレイヤの並列処理において達成可能な並列性の度合に悪影響を及ぼす。本出願のこの第２の態様によれば、シンタックス要素が導入され、それは、ベースレイヤの分割に沿った補間が、ベースレイヤ画像の隣接した分割、ベースレイヤ画像の分割およびエンハンスメントレイヤ画像または例えばベースおよびエンハンスメントレイヤの双方の空間セグメントに依存したそのアップサンプリングされたバージョンのピクセル／ペルの混同を生じないように修正される旨を、デコーダに通知する。この種のシンタックス要素を導入することにより、エンコーダは、２つのモードの間で切替わり得る：補間がベースレイヤ画像の部分を自己充足的なままにするために制限される場合、すなわち、制限がオンされる場合、最大限に達成可能である相互依存しているレイヤの並列復号化の並列性の度合は、ベースレイヤ画像の分割端に沿ってわずかに補間品質を減少させると共に増加する、そして、補間を制限しない場合、並列度は、しかしながら、分割端で補間品質の増加と共に減少する。

本発明の第３の態様は、相互依存しているレイヤの並列復号化を有するスケーラブルビデオ符号化に関連し、並列処理スケジューリングを実行するデコーダの負荷を軽減しようとする、すなわち、デコーダが相互依存しているレイヤのオフセットまたは相互依存しているレイヤの遅延を可能にする短期シンタックス要素が相互依存するレイヤの画像の空間セグメントのサイズおよび位置およびこれらの画像の空間サンプリング解像度を示す時間間隔よりも長い所定期間に対しデコーダがインターレイヤオフセット−またはインターレイヤ遅延−を決定することを可能にする長期シンタックス要素構造を導入することにより、並列処理スレッド上の空間セグメントを分配する。インターレイヤオフセットを信号伝送する長期シンタックス要素構造を導入することにより、ビデオエンコーダは、２つのモードの間で切替わり得る：第１のモードによれば、エンコーダは、相互依存しているレイヤを復号化する間の特定の並列性の度合いに対応して、デコーダに、特定のインターレイヤオフセットを保証する。そして、所定期間内で、実際のインターレイヤオフセットが保証されたものに等しいかさらにより低いように、短期シンタックス要素を対応して設定する。他のモードによれば、この種の保証はデコーダに提供されない、そして、それ故、エンコーダは例えば他の基準、例えば、所定期間の間、短期シンタックス要素をビデオコンテンツに最適に適応させる、等を満たすために短期シンタックス要素を自由にセットし得る。全体の所定期間上のこのカウントに従い、この所定期間の間、エンハンスメントレイヤ画像の第１の空間セグメントを復号化することに関して少なくともいかなる衝突にも向かわないとき、時間的に共同整列配置されたエンハンスメントレイヤ画像の第１の空間セグメントが開始される前に、このように明確にデータストリームにおいて示されたインターレイヤオフセットは、最低限復号化されねばならないベースレイヤ空間セグメントのカウントであり得る。

本出願の第４の態様は、スケーラブルビデオ符号化および、スケーラビリティ空間を測定するスケーラビリティ次元の意味と同様にスケーラビリティ空間内のこれらのレイヤの位置と同様に、マルチレイヤビデオデータストリームのさまざまなＮＡＬユニットが属するレイヤの信号伝送に関する。マルチレイヤビデオデータストリームを転送することを含んでいる中間のネットワーク実体によって実行されるべきタスクを軽減するために、この種の情報は、これらの中間のネットワーク実体のために容易にアクセス可能でなければならず、容易に管理され得るべきである。本出願の第４の態様は、発明者の発見に基づく。そして、それによれば、典型的なアプリケーションシナリオは、各種レイヤと関連したＮＡＬユニットヘッダの範囲内のレイヤインジケータフィールドが解釈されることになっている方法を変えるタイプインジケータフィールドに対する費用を正当化する：タイプインジケータフィールドに第１の状態がある場合、一般的な情報ＮＡＬユニットにおけるマッピング情報は、レイヤインジケータフィールドのあり得る値を運転点にマップする、そして、レイヤのＮＡＬユニットは、それぞれのレイヤインジケータフィールドおよびマッピング情報を使用している運転点と関連している。このように、レイヤおよびスケーラビリティ配置間のマッピングは、可変に適合され得て、しかしながら管理上のオーバーヘッドが増加する欠点とともに、スケーラビリティ空間の多数が実現されるのを可能にする。タイプインジケータフィールドに第２の状態がある場合、レイヤインジケータフィールドは、複数の部分に分割される、そして、それぞれのＮＡＬユニットが関連している運転点は、スケーラビリティ空間内のベクトルの座標としてこれらの部分の値を用いて設置される。この測定によって、レイヤおよびスケーラビリティ配列間のマッピングは、少数のスケーラビリティ空間を実現されるのを可能にするが、ネットワーク実体のための管理オーバーヘッドは減少する。レイヤインジケータフィールドは、アプリケーションシナリオに関係なくどちらの場合においても同じであり得るが、レイヤインジケータフィールドがレイヤのＮＡＬユニットを、スケーラビリティ空間を介して通過させる方法は、本出願およびその明細書に適合し得る。適合効果は、タイプインジケータフィールドに対する付加的な費用の必要性を過度に補償する。

本出願の第５の態様は、マルチレイヤビデオ符号化、すなわちスケーラブルビデオ符号化、に関し、様々なコーデック／規格が様々なレイヤのために使用されるのを可能にする。様々なコーデック／規格が連続したレイヤのために使用され得る可能性は、更なるエンハンスメントレイヤによってその後拡張されたマルチレイヤビデオデータストリームに対応するために、およびこの目的を達成するために、新たなおよび潜在的により良好なコーデック／規格を使用するために、既存のビデオ環境の遅れた拡張を可能にする。いくつかのエンハンスメントレイヤのコーデック／規格を理解し得ないネットワークシンクは、下位レイヤを処理することが依然可能である、そして、マルチコーデックデコーダは、マルチレイヤビデオデータストリームの各ＮＡＬユニットごとに、同上がどのコーデックと関連しているかについて識別して、従ってマルチレイヤビデオデータストリームのＮＡＬユニットをマルチ規格マルチレイヤデコーダに手渡すトランスポートレイヤデコーダによって供給される。

本出願の第６の態様は、各々、ベースレイヤの画像およびエンハンスメントレイヤの画像の両方の画像がブロックの配列に再分割されるマルチレイヤビデオ符号化に関する。その場合、インターレイヤオフセットは、シンタックス要素構造をマルチレイヤビデオデータストリームに挿入することにより、効率的に示され得る。そして、それはベースレイヤブロックを単位にしてベースおよびエンハンスメントレイヤの画像の並列復号化のためのインターレイヤオフセットを示す。すなわち、本出願の第６の態様は、べースレイヤブロックを単位とするベースレイヤおよびエンハンスメントレイヤ間のインターレイヤオフセットを示すシンタックス要素構造の明確な伝送が、軽微な方法だけで単に送信されるべきデータを増加させる発見に基づくが、デコーダのための計算量は、デコーダがさもなければ、例えば、ベースおよびエンハンスメントレイヤブロックのブロックサイズ、ベースおよびエンハンスメントレイヤ画像のサンプル解像度等を表す他のシンタックス要素に基づきベースおよびエンハンスメントレイヤの画像を並列復号化するためにインターレイヤオフセットを導出するケースと比較して大幅に減少させられる。インターレイヤオフセットが、マルチレイヤビデオデータストリームにおける短期シンタックス要素がこれらのシンタックス要素を比較的複合した態様に組込むことでインターレイヤオフセットを決定するためにさもなければ必要であるそれらのヒントを示す時間間隔より大きい所定期間の間有効である保証としてデコーダに示されるように、長期のシンタックス要素構造としてシンタックス要素構造を実現するときに、第６の態様は、第３の態様に密接に関連する。

当然、上記の態様の全ては、一組、三つ組、４つ組またはその全部に組み込まれ得る。

本出願の好ましい実施例は、図面に関して以下に詳述される。

図１は、以下の図に関して更に概説されたマルチレイヤエンコーダのいずれかを実施するための図示する実施例としての目的を果たすビデオエンコーダを示す図である。図２は、図１のビデオエンコーダに適合するビデオデコーダを示す概略ブロック図を示す図である。図３は、ＷＰＰ処理のためにサブストリームに再分割された画像のブロック線図を示す図である。図４は、図式的にベースおよびエンハンスメントレイヤの空間セグメントのインターレイヤ配列が復号化プロセスを軽減するために利用される実施例に従うビデオデコーダを示す図である。図５は、符号化ブロックの整数倍および画像のタイルへの再分割の後に符号化ブロックの間で定義された復号化順序を含むタイルとともに、それぞれ符号化ブロックおよびタイルに再分割された画像のブロック線図を示す図である。図６は、図４の実施例を実現するためのシンタックスの例を示す図である。図７は、ベースレイヤおよびタイルに異なって再分割されたエンハンスメントレイヤ画像の一対のブロック線図を示す図である。図８は、図４の実施例と関連して、適用できる他の典型的なシンタックスを示す図である。図９は、インターレイヤ予測のためにアップサンプリングを実行するための画像、タイルへのその再分割および補間フィルタのアプリケーションのブロック線図を示す図である。図１０は、アップサンプリングしている補間分離をオンあるいはオフに切換えるためにマルチレイヤデータストリームの中でシンタックス要素に応答するように構成されたマルチレイヤデコーダの概略ブロック図を示す図である。図１１は、ベースレイヤサンプル解像度から増加したエンハンスメントレイヤサンプル解像度まで通過するようにアップサンプリングを使用してベースレイヤからエンハンスメントレイヤまでインターレイヤ予測を使用した一対のベースレイヤおよびエンハンスメントレイヤ画像のブロック線図を示す図である。図１２は、図１０に従って切替え可能なアップサンプリングしている補間分離を説明するブロック線図を示す図である。図１３は、両方ともＷＰＰサブストリームに再分割された、ベースレイヤおよびエンハンスメントレイヤ画像のオーバレイのブロック線図を示す図である。図１４は、図１０の実施例を実現するための典型的なシンタックスを示す図である。図１５ａは、両方とも空間セグメントに異なって再分割されたベースおよびエンハンスメントレイヤ画像の空間的に整列配置されたオーバレイのブロック線図を示す図である。図１５ｂは、図１５ａのベースおよびエンハンスメントレイヤ画像のオーバレイのブロック線図を示すが、アップサンプリング補間分離が実行される分割を選択するための他の可能性を説明する図である。図１６は、ベースおよびエンハンスメントレイヤ復号化の間のインターレイヤオフセットに関する保証を引出すか引出さないために、マルチレイヤビデオデータストリーム内にビデオデコーダが長期シンタックス要素構造に応答する実施例に従うビデオデコーダの概略ブロック図を示す図である。図１７ａは、実施例による図１６の長期シンタックス要素構造により伝達されるインターレイヤオフセット信号伝達を説明するために、両方ともタイルに再分割された、一対のベースレイヤおよびエンハンスメントレイヤ画像のブロック線図を示す図である。図１７ｂは、実施例による図１６の長期シンタックス要素構造を実現するための実施例を説明するために、両方ともＷＰＰ処理のためのサブストリームに再分割された、一対のベースおよびエンハンスメントレイヤ画像のブロック線図を示す図である。図１７ｃは、更なる実施例による図１６の長期シンタックス要素構造を実現するための実施例を説明するために、両方ともスライスに再分割された、一対のベースおよびエンハンスメントレイヤ画像のブロック線図を示す図である。図１８は、実施例によるＷＰＰを使用する画像を並列復号化／符号化した結果生じる波面を追加的に示すことに関するＷＰＰ処理のためのサブストリームに再分割された画像のブロック線図を示す図である。図１９は、本出願の実施例による最小インターレイヤ復号化オフセットおよびブロックサイズおよびベースおよびエンハンスメントレイヤ間のサンプリング解像度比率の間の関係を示すテーブルを示す図である。図２０は、図１６による長期シンタックス要素構造信号伝送を実現するための典型的なシンタックスを示す図である。図２１は、図１６の実施例を実現するためのシンタックスのための他の実施例を示す図である。図２２は、ＨＥＶＣのような構成のための実施例によるＮＡＬユニットヘッダのシンタックスを示す図である。図２３は、スケーラブル符号化が様々なレイヤインジケータフィールド解釈の間で切替わるのを可能にすることにより軽減される実施例によるネットワーク実体の説明用のブロック図を示す図である。図２４は、タイプインジケータフィールドに応答して切替わる方法を説明するブロック線図を示す図である。図２５は、より詳細に実施例による切替え可能なレイヤインジケータフィールド解釈を示す説明のためのブロック線図を示す図である。図２６は、図２３による切替え可能なレイヤインジケータフィールド解釈を実現するための説明のためのシンタックスを示す図である。図２７は、図２６のシンタックスに関して切替わるレイヤインジケータフィールドを示すブロック線図を示す図である。図２８は、ベースレイヤコーデック以外のコーデックのエンハンスメントレイヤＮＡＬユニットを単に廃棄するように構成されたトランスストリームデコーダのブロック図を示す図である。図２９は、単一規格マルチレイヤデコーダとインターフェースするトランスポートストリームデコーダを示し、実施例によるトランスポートストリームデコーダの挙動を示す図である。図３０は、マルチ規格マルチレイヤデコーダとインターフェースするトランスポートストリームデコーダおよび実施例によるトランスポートストリームデコーダの挙動を示す図である。図３１は、更なる実施例による切替え可能なレイヤインジケータフィールド解釈を実現するためのシンタックスのための他の実施例を示す図である。図３２は、画像の空間セグメントへの更なる再分割を示すことに関するブロックに再分割された、任意のレイヤの画像を示すブロック線図を示す図である。図３３は、ブロックおよびタイルに再分割された、任意のレイヤの画像のブロック線図を示す図である。図３４は、ブロックおよびサブストリームに再分割された画像のブロック線図を示す図である。図３５は、ビデオデコーダがそれらの間で定義されたラスタースキャン順序を有するブロックを単位とする中間予測的に処理された画像の間でインターレイヤオフセットを導出するためにデータストリームにおけるシンタックス要素構造を使用するように構成された実施例によるビデオデコーダの概略ブロック図を示す図である。図３６は、実施例によるデータストリーム内でシンタックス要素構造に関する図３４のビデオデコーダの動作の動作可能なモードを示すブロック線図を示す図である。図３７は、インターレイヤオフセット信号伝送が様々な明確な信号伝送タイプ、すなわち様々なタイプを単位とした信号伝送、の間で切替え可能であることによる更なる実施例と関連して図３５のビデオデコーダの動作モードを示すブロック線図を示す図である。図３８は、ベースエンハンスメントレイヤ画像の並列復号化の間、インターレイヤオフセットが連続的に調査を受ける更なる実施例による図３５のビデオデコーダの動作のモードを示すブロック線図を示す図である。図３９は、一方ではラスタースキャン復号化順序による画像の特定ブロックのランクおよび他方では実施例による行および列のインデックスの間の関係を示す図である。図４０は、ベースおよびエンハンスメントレイヤ画像のブロックへの相対的に規則的な再分割のための様々な実施例、およびこれらの様々な実施例から生じている結果を示す図である。図４１は、図３５から図４０までの実施例のいずれかを実施するためのシンタックスのための実施例を示す図である。図４２は、図４１の一つに代わるものとして、他のシンタックスの例を示す図である。図４３は、図１６および３５の実施例がマルチレイヤデータストリームの他の部分で示され得るシンタックスの例を示す図である。図４４は、実施例によるマルチレイヤマルチ規格デコーダとインターフェースするトランスポートレイヤデコーダの概略ブロック図を示す図である。

最初に、概要として、エンコーダ／デコーダ構造のための実施例が示され、それは、その後提示された概念のいずれかに適合する。

図１は、実施例によるエンコーダの一般的な構造を示す。エンコーダ１０は、マルチスレッドウェイあるいはそうでない、すなわち単にシングルスレッドで動作し得るように実現され得る。すなわち、エンコーダ１０は、例えば、複数のＣＰＵコアを使用して実現され得る。換言すれば、エンコーダ１０は、並列処理をサポートし得るが、そうする必要はない。発生するビットストリームは、シングルスレッドエンコーダ／デコーダにより生成可能／復号化可能でもある。本出願の符号化概念は、しかしながら、並列処理エンコーダが、しかしながら、能率的に、圧縮効率を落とすことなく並列処理を適用することを可能にする。並列処理能力に関して、類似の記載は、図２に関して後述するデコーダに当てはまる。

エンコーダ１０は、ビデオエンコーダであるが、一般に、エンコーダ１０は、画像エンコーダでもよい。ビデオ１４の画像１２は、入力１６でエンコーダ１０に入力するものとして示される。画像１２は、特定のシーン、すなわち画像内容、を示す。しかしながら、エンコーダ１０は、その入力１６で、様々なレイヤに属する画像１２および１５とともに同じ瞬間に付随する他の画像１５も受信する。単に説明の便宜のために、画像１５がレイヤ１に属するとして示されるのに対し、画像１２はレイヤゼロに属するとして示される。図１は、レイヤ１は、レイヤゼロに関して、より高い空間分解能、すなわち、より多数のピクチャサンプルでもって同じシーンを示し得ること、を含み得ることを示す。しかし、これは、単に説明の便宜上そうであるだけであり、レイヤ１の画像１５は、同じ空間分解能を有するが、例えば、レイヤゼロと関連するビュー方向において、異なり得る、すなわち、画像１２および１５は、様々な視点からキャプチャされ得た。

エンコーダ１０は、ハイブリッドブリードエンコーダである。すなわち、画像１２および１５は、予測器１８によって予測される、そして、残差決定器２２により得られた予測残差２０は、変換、例えばＤＣＴのようなスペクトル分解および変換／量子化モジュール２４における量子化、に影響される。このように得られた、変換されかつ量子化された予測残差２６は、エントロピー符号化器２８のエントロピー符号化、例えば、コンテキスト適応を使用する算数符号化または可変長符号化等、に影響される。残差の再構成可能なバージョンは、デコーダに使用可能であり、すなわち、逆量子化され再変換された残差信号３０は、再変換／再量子化モジュール３１により回復されて、結合器３３により予測器１８の予測信号３２とともに再結合され、それにより、それぞれ画像１２および１５の再構成３４をもたらす。しかしながら、エンコーダ１０は、ブロック基礎に作用する。したがって、再構成された信号３４は、ブロック境界で不連続に陥る、そして、従って、フィルタ３６は、それぞれ、画像１２および１５のための基準ピクチャ３８を生成するために、再構成された信号３４に適用され得る。そして、それを基礎として、予測器１８は、様々なレイヤのその後符号化された画像を予測する。図１の点線によって示されるように、予測器１８は、しかしながら、例えば空間予測モードのような他の予測モードで、フィルタ３６または中間バージョンのない再構成された信号３４を直接利用し得る。

予測器１８は、画像１２の特定のブロックを予測するために、様々な予測モードの間で選択し得る。画像１２のそのようなブロック３９は、図１に手本として示される。画像１２が分割される画像１２の任意のブロックに対し代表的であるブロック３９が同じレイヤ、例えば画像１２'、の以前に符号化された画像を基礎として予測される時間予測モードが、存在し得る。空間予測モードも、ブロック３９がいずれに同じ画像１２、隣接ブロック３９の以前に符号化された部分に基づいて予測されるかに従って存在し得る。画像１５のブロック４１は、画像１５が分割される他のブロックのいずれかに対し代表的であるために、図１にも実例として示される。ブロック４１のために、予測器１８は、ちょうど述べられた予測モード、すなわち時間および空間予測モードをサポートし得る。加えて、予測器１８は、ブロック４１が下位レイヤの画像１２の対応する部分に基づいて予測されるインターレイヤ予測モードを提供し得る。「対応する部分」において「対応する」ことは、空間対応、すなわち、画像１２の範囲内の部分は、画像１５において予測されるべきボック４１としてのシーンの同じ部分を示す、ことを意味する。

予測器１８の予測は、当然、画像サンプルに制限され得ない。予測は、いかなる符号化パラメータ、すなわち、予測モード、時間予測の動きベクトル、マルチビュー予測の視差ベクトル、等にも適用し得る。単に残差は、そのとき、ビットストリーム４０において符号化され得る。

特定のシンタックスが、量子化残差データ２６、すなわち、変換係数レベルおよび他の残差データ、を編集するために使用される、そして、例えば、予測器１８およびシンタックス要素によって定義されるように画像１２および１５の個々のブロック３９および４１のための予測モードおよび予測パラメータを例えば含む符号化パラメータは、エントロピー符号化器２８によってエントロピー符号化を受ける。エントロピー符号化器２８による出力としての、このようにして得られたデータストリーム４０は、エンコーダ１０によって出力されたようにビットストリーム４０を形成する。

図２は、エンコーダ図１に適合する、すなわち、それがビットストリーム４０を復号化し得るデコーダを示す。図２のデコーダは、通常、参照符号５０によって示されて、エントロピー復号化器、再変換／逆量子化モジュール５４、結合器５６、フィルタ５８および予測器６０を含む。エントロピー復号化器４２は、ビットストリームを受信し、残差データ６２および符号化パラメータ６４を回復するために、エントロピー復号化を実行する。再変換／逆量子化モジュール５４は、残差データ６２を逆量子化および再変換し、このようにして得られた残差信号を、結合器５６に転送する。結合器５６も、次に、予測信号６６および残差信号６５を結合することにより結合器５６で決定される再構成された信号６８に基づき符号化パラメータ６４を使用して予測信号６６を順次形成する予測器６０から、予測信号６６を受信する。予測は、最後に選択された予測が予測器１８であることを反映する、すなわち、同じ予測モードが利用でき、そして、これらのモードは画像１２および１５の個々のブロックのために選択されて、予測パラメータに従って進められる。図１に関してすでに上記で説明したように、予測器６０は、再構成された信号６８のフィルタ処理バージョンまたはいくつかの中間バージョンを代わりにまたは加えて使用し得る。最後に再生されデコーダ５０の出力７０で出力されるべき様々なレイヤの画像は、組合せ信号６８のフィルタ処理されてないバージョンまたはその若干フィルタ処理されたバージョンを同様に決定され得る。

タイル概念によれば、それぞれ、画像１２および１５は、タイル８０および８２に再分割され、そして、少なくとも、これらのタイル８０および８２の範囲内のブロック３９および４１の予測は、それぞれ、空間予測の根拠として、それぞれ、単に同じ画像１２、１５の同じタイルに関連するデータだけを使用するために制限される。これは、ブロック３９の空間予測は、同じタイルの以前に符号化された部分を使用するために制限されるが、時間予測モードは、以前に符号化された画像、例えば画像１２'の情報に依存するために制限されないことを意味する。同様に、ブロック４１の空間予測モードは、同じタイルだけの以前に符号化されたデータを使用するために制限されるが、時間およびインターレイヤ予測モードは、制限されない。６枚のタイルへの画像１５および１２の再分割は、それぞれ、単に説明の便宜上選択されただけである。それぞれ、タイルへの再分割は、選択され得て、個々に画像１２'、１２および１５、１５'のためのビットストリーム４０の範囲内で示され得る。画像１２および１５当たりのタイルの数は、それぞれ、１、２、３、４、６のいずれかおよびその他でもよく、タイルの分割は、タイルだけの行および列への通常の分割に制限され得る。完全性のために、別々にタイルを符号化する方法は、イントラ予測または空間予測に制限され得るのではなく、タイル境界全体の符号化パラメータのいかなる予測も含み得て、エントロピー符号化におけるコンテキスト選択が同じタイルのデータだけに依存しているために制限され得ることに注意されたい。このように、デコーダは、ちょうど言及された動作を並列に、すなわちタイルを単位に、実行し得る。

図１および２のエンコーダおよびデコーダは、ＷＰＰ概念を使用することが代わりに、または、付加的に可能であり得る。図３を参照されたい。ＷＰＰサブストリーム１００も、画像１２、１５のＷＰＰサブストリームへの空間分割を表す。タイルおよびスライスとは対照的に、ＷＰＰサブストリームは、ＷＰＰサブストリーム１００全体の予測およびコンテキスト選択への制限を課さない。ＷＰＰサブストリーム１００は、例えば、ＬＣＵｓ（最大符号化ユニット）すなわち予測符号化モードがビットストリームにおいて個々に伝送可能である最大の可能なブロックの行と交差するように行方向に伸長する、そして、並列処理を可能にするために、単に１つの妥協が、エントロピー符号化に関してなされる。特に、順序１０２が、ＷＰＰサブストリームの間で定義され、上端から下端まで手本として進み、各ＷＰＰサブストリームに対し、順序１０２における最初のＷＰＰサブストリームを除き、シンボルアルファベットに対する確率評価、すなわち、エントロピー確率は、完全にリセットされるのではなく確率から採用されあるいは確率に等しくなるようにセットされ、ライン１０４で示されたように、ＬＣＵ順序またはサブストリームのデコーダ順序は、画像１２および１５の同じ側で各ＷＰＰサブストリームに対し、それぞれ開始する、例えば、矢印１０６により示されたように左側からＬＣＵ行方向に他の側に進む、ように、第２のＬＣＵまで、直接先行するＷＰＰサブストリームをエントロピー符号化／復号化した後に生じる。従って、同じ画像１２および１５のＷＰＰサブストリームのシーケンスの間にそれぞれ同じ符号化遅延に従うことにより、これらＷＰＰサブストリーム１００は、並列に復号化／符号化可能であり、その結果、それぞれの画像１２および１５が並列に、すなわち同時に、符号化／復号化され、左から右に傾けられた様態で画像を横切って移動する一種の波面１０８を同時に形成する。

順序１０２および１０４も上端から下端まで行ごとにＬＣＵ１０１の左上から右下のＬＣＵまで進行するＬＣＵ間のラスタースキャン順序を定義する点が簡潔に指摘される。ＷＰＰサブストリームは、各々１つのＬＣＵ行に対応し得る。簡潔にタイルが参照されて、後者は、ＬＣＵ境界に整列配置されるために制限され得る。サブストリームの内側における２つのスライス間の境界に関する限り、サブストリームは、ＬＣＵ境界に結合することなく一つ以上のスライスに断片化され得る。サブストリームの１つのスライスからサブストリームの次まで遷移するときに、エントロピー確率は、しかしながら、その場合採用される。タイルの場合には、全部のタイルは１つのスライスに集約され得る、または、タイルの内側で２つのスライス間の境界に関する限り、１つのタイルは、再びＬＣＵ境界と結合せずに一つ以上のスライスに断片化され得る。タイルの場合には、ＬＣＵ間の順序は、タイル順序における次のタイルへ進む前に最初にラスタースキャン順序のタイル順序におけるタイルを横断するために変化する。

これまで記載されているように、画像１２は、タイルまたはＷＰＰサブストリームに分割され得る、そして、同様に、画像１５は、また、タイルまたはＷＰＰサブストリームに分割され得る。理論的には、ＷＰＰサブストリーム分割／概念は、画像１２および１５のうちの一方のために選択され得る一方、タイル分割／概念が二者のうちの他方のために選択される。あるいは、制限は、概念タイプ、すなわちタイルまたはＷＰＰサブストリーム、がレイヤ間の同じものでなければならないことにより、ビットストリーム上に課され得る。空間セグメントのための他の実施例は、スライスを含む。スライスは、伝送目的のためのビットストリーム４０を分割するために使用される。スライスは、伝送のための最小の実体であるＮＡＬユニットにパックされる。各スライスは、それぞれに符号化可能／復号化可能である。すなわち、コンテキスト選択等と同様に、スライス境界全体のいかなる予測も禁止される。これらは、全く、空間セグメントのための３つの実施例である：スライス、タイルおよびＷＰＰサブストリームである。加えて、全３つの並列化概念である、タイル、ＷＰＰサブストリームおよびスライス、は、組合せて使用され得る、すなわち、画像１２または画像１５は、タイルに分割され得て、各タイルは、複数のＷＰＰサブストリームに分割される。また、スライスは、タイルまたはＷＰＰ境界で例えば（しかし、制限されずに）ビットストリームを複数のＮＡＬユニットに分割するために使用され得る。画像１２、１５がタイルまたはＷＰＰサブストリームを使用して、そして、加えて、スライスを使用して分割される場合、およびスライス分割が他のＷＰＰ／タイル分割から逸脱する場合、それから空間セグメントは、画像１２，１５の最小独立復号化可能なセクションとして定義される。あるいは、制限は、概念の組合せが画像（１２または１５）の範囲内で使用され得るおよび／または異なる使用された概念の間で境界が整列されなければならない場合に、ビットストリームに課され得る。

本出願の上記の提示された概念について議論する前に、再び図１および２を参照して、図１および２のエンコーダおよびデコーダのブロック構造は、単に説明目的だけのために存在し、構造は異なってもよい点に留意すべきである。

「タイル境界の配列」と呼ばれ得る第１の態様によれば、長期シンタックス要素構造は、所定期間の間、例えば一連の画像に及ぶ期間、第２のレイヤの画像の空間セグメント８２間の境界８４が、第１レイヤの空間セグメント８０のあらゆる境界８６と重畳するように第２のレイヤの画像１５が再分割されるような保証を示すために使用される。デコーダは、マルチレイヤビデオデータストリーム４０の短期シンタックス要素に基づいて空間セグメント８０および８２に、第１レイヤおよび第２レイヤの画像１２、１５の実際の再分割を、所定期間、例えば個々の画像の単位、すなわち画像ピッチ間隔より短い時間間隔において、依然周期的に決定する、しかし、配列上の知識は、並列処理作業負荷割当を予定する際にすでに役立つ。図１の実線８４は、例えば、タイル境界８４がレイヤ０のタイル境界８６に完全に空間的に整列配置される実施例を表す。ちょうど言及された保証は、しかしながら、レイヤ１の分割が、レイヤ０の任意のタイル境界８６と空間的に重畳しない、付加的なタイル境界をさらに含むように、レイヤ０のタイル分割よりも微細であるようにレイヤ１のタイル分割を可能にする。いずれにせよ、レイヤ１およびレイヤ０間のタイル登録についての知識は、並列に同時処理される空間セグメントの間で利用可能な作業負荷または処理パワーを割当てる際にデコーダを支援する。長期シンタックス要素構造なしで、デコーダは、より小さい時間間隔で、すなわち画像につき、作業負荷配分を実行しなければならず、それにより、作業負荷配分を実行するためのコンピュータパワーを浪費する。他の態様は、「オポチュニスティック型復号化」である：複数のＣＰＵコアを有するデコーダは、より大きい複雑さの、すなわちより高い空間分解能またはレイヤのより多い個数の、レイヤを復号化しようとするか復号化しようとしないかを決めるレイヤの並列性についての知識を利用し得る。シングルコアの能力を上回るビットストリームは、同じデコーダのすべてのコアを利用することにより復号化可能であり得る。プロファイルおよびレベル表示器が最小限の並列性に関するこの種の表示を含まない場合、この情報は特に有用である。

本出願のまさに概説された態様をより明確に理解するために、図２に関して述べられ得るように、実現し得るビデオデコーダ６００を示す図４が参照される。すなわち、デコーダ６００は、すでに上述されているように、シーンが第１のレイヤ０から第２のレイヤ１までインターレイヤ予測を使用するレイヤの階層において符号化されるマルチレイヤビデオデータストリームを復号化するように構成される。ビデオデコーダは、レイヤの画像が再分割される空間セグメントにおけるマルチレイヤビデオデータストリームの並列復号化をサポートし、空間セグメントは、例えば、タイル、ＷＰＰサブストリーム等である。換言すれば、ビデオデコーダは、マルチレイヤビデオデータストリームを並列に復号化し得る、そして、そうする際に、ビデオデコーダ６００は、空間セグメントを単位にしてレイヤ０および１の画像１２および１５に作用する。

例えば、上記で概説されるように、空間セグメントは、タイルであり得、そして、ビデオデコーダ６００は、イントラピクチャ空間予測を使用してレイヤ０および１の画像１２および１５を復号化するように構成されると共に、ビデオデコーダ６００は、そのタイル境界で各タイルに対しイントラピクチャ空間予測を中断させる。タイルへの画像１２および１５の再分割は、例えば個々に各画像１２および１５が関連する、すなわち特定の時間枠６０４に属する画像１２および１５の一対ごとに、時間枠６０４の短期基礎、例えば時間間隔を単位として、に関する短期シンタックス要素として、データストリーム４０内で示される。上述の通り、タイルへの画像１２および１５の再分割は、矩形の規則的な再分割のみに、すなわちタイルの行および列に、制限され得る。短期シンタックス要素６０２は、このようにタイル再分割の行の個数および列の個数を、両方のレイヤの各画像１２のためにおよび各画像１５のために個々に設定する。インバウンドマルチレイヤビデオデータストリーム４０を復号化する際に、ビデオデコーダ６００は、空間予測および潜在的に時間予測を適用するように構成される。任意には、ビデオデコーダ６００は、タイルの各々を別々にエントロピー復号化する。各タイルを復号化する間に確率適合が使用される場合、タイルが並列にエントロピー復号化可能であるように、ビデオデコーダ６００は、タイルごとにエントロピー確率を別々に初期化する。空間予測および任意には時間予測に加え、レイヤ１の画像１５のタイルの復号化に関する限り、ビデオデコーダ６００はインターレイヤ予測をサポートする。上述の通り、インターレイヤ予測は、復号化レイヤ１に含まれる異なるパラメータに関係し得る：インターレイヤ予測は、レイヤ１の予測残差、例えば、それは変換係数、復号化レイヤ１において使用される予測モード、復号化レイヤ１において使用される予測パラメータ、エンハンスメントレイヤ１画像のサンプル等を予測し得る。インターレイヤ予測は、レイヤ０の画像１２のすでに復号化した部分、−直接（中央に）同じ位置に配置されたものまたは、同じシーンの、例えば、様々なビューに関してレイヤ０および１の場合に、インターレイヤ予測を制御している不同性ベクトル予測パラメータを例えば、経由して直接同じ位置に配置された位置から、わずかに空間的に逸脱したものに基づき、レイヤ１の画像１５のタイルの範囲内で、部分を予測する。

ビデオデコーダ６００は、データストリーム４０の長期シンタックス要素構造に応答すると、長期シンタックス要素構造６０６の後に所定期間６０８を別々に処理するために、図４の参照符号６０６を使用することを示した。そして、所定期間６０８は、いくつかの時間間隔、すなわち短期シンタックス要素６０２が個々に画像のタイルへの再分割を示す複数の時間枠６０４、を含む。６０８がＳＰＳの範囲（＝期間）に関連し得て、ＳＰＳの変化はいずれにしろ重要な再初期化につながる点に留意する必要がある。長期特性が、そこにおいて、言及される限り、ちょうど言及された注釈は、他の態様に関するすべての実施例のためにも有効である。特に、長期シンタックス要素構造６０６が、第１のあり得る値のセットから値を仮定する場合、画像１５のタイル間の境界がレイヤ０の画像１２のタイルの各境界を覆うように、ビデオデコーダ６００は、この状況を所定期間の間、レイヤ１の画像１５が再分割されるという保証として解釈する。ビデオデコーダ６００は、依然、その場合、画像１２および１５のタイルへの再分割を所定期間６０８の範囲内で時間間隔６０２に対し決定するために、短期シンタックス要素６０２を検査するが、ビデオデコーダ６００は、その事実に依存し得て、画像１２のべースレイヤタイルの境界が画像１５のエンハンスメントレイヤタイルの境界により完全に覆われる、すなわち、画像１５のタイル再分割は、画像１２および１５の各時間で整列配置された一対を比較することにより、画像１２のタイルへの再分割の空間精緻化に局所的に対応するか、表現することを実現する。上述の通り、ビデオデコーダ６００は、並列に所定期間６０８の範囲内で画像１２および１５のタイルの並列処理を予定することにより、すなわち、画像１２および１５の時間整列配置された一対のタイルを並列復号化することにより、この種の信号伝送、すなわち第１のあり得る値のセットからの値とみなす長期シンタックス要素構造６０６を利用し得る。例えば、第１のあり得る値のセットから、値を仮定している長期シンタックス要素の構造の場合には、ビデオデコーダ６００は、以下を知り得る：レイヤ０の特定の画像１２のために、画像１２のタイルの中のタイル順序における第１のタイルは、時間整列配置されたエンハンスメントレイヤ画像１５のそれぞれのタイルと局所的に一致するか、またはエンハンスメントレイヤ画像１５のタイルの中のタイル順序における時間整列配置されたエンハンスメントレイヤ画像１５の第１のタイルを完全に局所的に覆う。従って、少なくとも視差／動作補償のないインターレイヤ予測の場合、時間整列配置されたベースレイヤ画像１２の第１のタイルの復号化が終了するとすぐに、ビデオデコーダ６００は、ちょうど言及された保証は、インターレイヤ予測のために必要とされるベースレイヤ画像１２の同じ位置に配置された部分がエンハンスメントレイヤ画像１５の全部の第１のタイルに利用し得ることをビデオデコーダ６００に知らせるので、エンハンスメントレイヤ画像１５の第１のタイルを復号化するのを開始し得る。インターレイヤオフセットまたはベースレイヤ画像１２およびエンハンスメントレイヤ画像１５間の並列性の度合は、ベースレイヤ画像１２の１つのタイルに等しいことが、ビデオデコーダ６００により、このように認識／決定され得る。オフセットは、非ゼロの垂直構成要素を有する視差ベクトルおよび／または右に向かって、そこでは、タイルの中のタイル順序は、画像１２、１５の左上隅からその右下隅の方へ行方向ラスタースキャン順序で、進み得るベースレイヤ画像の範囲内で対応する部分をシフトする水平構成要素を有する視差ベクトルを含んでいるインターレイヤ予測の場合には、わずかに増加され得る。

長期シンタックス要素構造が、第２のあり得る値のセット、それは第１のあり得る値のセットとは異なる、以外の値を仮定する場合、ビデオデコーダ６００は、いかなる保証も利用しない、しかし、短期シンタックス要素６０２、画像１２および１５の並列復号化、画像１２および１５の時間整列配置された少なくともいくらかの並列復号化、ベースおよびエンハンスメントレイヤのタイルを利用する短期基礎を計画し予定する。その場合、ビデオデコーダ６００は、しかしながらそれは面倒な処理である短期基礎に関するレイヤ０および１間の並列復号化、すなわちレイヤ０および１間の並列度における最小のインターレイヤオフセットまたはインターレイヤ空間処理オフセットを決定する。少なくとも短期シンタックス要素の可能な値のセットのサブセットに対し、第１のレイヤの空間セグメントの任意の境界を覆わない第２のレイヤの画像の空間セグメント間に境界が存在する。しかし、第１のレイヤの空間セグメントの各境界を覆う第２のレイヤの画像の空間セグメント間の境界に、短期シンタックス要素のためにあり得る値のセットのさらなるサブセットが存在する。後者のサブセットは、ベースおよびエンハンスメントレイヤ間にタイル境界整列を示す長期シンタックス要素の場合に使用されるのみである。

それに加えて、または、あるいは、ビデオデコーダ６００は、長期シンタックス要素構造が試験を実行するために第１のあり得る値のセットからの値とみなす、すなわち、第２のあり得る値のセットからの値とみなす長期シンタックス要素構造６０６の場合にはこの試験を実行するのを控えることで、とにかくレイヤ１の復号化を実行しようとする、という事実を使用あるいは利用し得る。その場合、特に電池駆動装置のために、有益な計算パワーは、時間内、すなわち、実時間内におけるエンハンスメントレイヤ１を復号化することにおける成果または成功が、理論的である場合において節約される。抑制が第４の態様に関して下記で述べられたレベル表示器に基づいて選択され得ることは、言及する価値がある。

図４が空間セグメントとして手本としてタイルを使用することより上記に記載されていたにもかかわらず、ビデオデコーダ６００が、他の空間セグメント、例えばサブストリームまたはスライス等、と関連して、このことにより示され得る長期シンタックス要素構造および保証を利用し得ることは明らかである。前者の場合、ビデオデコーダ６００は、第１のレイヤ１２の画像の空間セグメントを並列に復号化するとともに第１のレイヤの画像の空間セグメントの境界を横切るイントラピクチャ空間予測をサポートし、かつ、これら空間セグメント、すなわちサブストリーム、の復号化の間に復号化遅延に従いながら、イントラピクチャ空間予測を使用するレイヤの画像１２および１５を復号化する。上述の通り、サブストリームは、それぞれの画像の横縞に対応し得る、すなわち垂直に、それぞれの画像を再分割する。各サブストリームを復号化することにおいて、ビデオデコーダ６００は、左から右に一般に進行する復号化順序を使用し得る、そして、画像のサブストリームの中で定められた復号化順序は、上端から下端まで進行し得る。このように、空間予測が、現在の画像の上端に隣接したすでに復号化された部分および左側のすでに復号化された部分から実行される、直ちに後続するサブストリームとの間に特定の復号化遅延に従っている典型的空間予測概念を使用することは、サブストリームの並列復号化を許容する。例えば、復号化遅延は、例えばＬＣＵのユニットにおいて測定され得る。これは、レイヤ１の画像１５と同様にレイヤ０の画像１２においてなされ得る。このように、ビデオデータストリームを復号化する際の並列性は、個々に画像１２および１５内で両方の並列性を含み得る、しかし、また、サブストリームの並列復号化は、１つの時間枠６０４の異なるレイヤの画像１２および１５に属する。サブストリームの任意のエントロピー復号化に関する限り、同上は、それぞれのサブストリームを復号化する過程でエントロピー確率の適合を含み得る。各画像１２または１５のサブストリーム順序の第１のサブストリームは、他のサブストリームから独立しているエントロピー確率の個々の初期化に従属し得る。いかなる次のサブストリームも、それぞれの先行するサブストリームの左側から特定の距離まで直前のサブストリームを復号化する間、例えば直前のサブストリームの２つのＬＣＵｓを復号化した後、例えば適合されるエントロピー確率を採用することにより同じ画像の復号化順序における直前のサブストリームの中間に在って適合されるエントロピー確率に依存して、エントロピー確率初期化に従属し得る。

波面並列処理サブストリームの場合でさえ、ビデオデコーダ６００は、長期シンタックス要素構造６０６を利用し得る：保証がこのシンタックス要素構造６０６として示される場合、ビデオデコーダ６００は、所定期間６０８内のベースレイヤ画像１２の連続的な／隣接したサブストリーム間のすべての境界が時間整列配置されたエンハンスメントレイヤ画像１５の連続した／隣接したサブストリームの間にそれぞれの境界によって覆われるという事実に依存し得る。すなわち、ベースレイヤサブストリームは、時間整列配置されたエンハンスメントレイヤ画像１５のそれぞれのエンハンスメントレイヤサブストリームと局所的に一致する、あるいは、同上は、時間整列配置されたエンハンスメントレイヤ画像の２つ以上のサブストリームに正確に対応する。従って、保証が適用される場合、デコーダ６００は、ベースレイヤ画像１２の第１のサブストリームの復号化が終了するとすぐに、時間整列配置されたエンハンスメントレイヤ画像１５の第１のサブストリームの復号化が開始され得ることを知っている。

上述のように、タイル再分割化と異なって、短期シンタックス要素６０２は、同上がこれらの画像のいくつかの符号化ブロック、例えばＬＣＵ、への再分割に関する画像１２および１５のサブストリームの位置を定義するように選択し得る。サブストリームは、従って、この種の符号化ブロックの一つ以上の行の一まとまりであり得る。タイルを再分割化している場合のように、時間間隔６０４は、短期シンタックス要素６０２が画像１２および１５の再分割を画像基礎につき、すなわち画像枠６０４基礎につき、サブストリームに示すように存在し得る。保証が長期シンタックス要素構造６０６によって設けられていない場合、ビデオデコーダ６００は、それにもかかわらず、一般の時間枠の異なるレイヤのサブストリームを並列に復号化しようとし得る、しかし、そうするために、ビデオデコーダ６００は、短期シンタックス要素６０２を検査することを要する。

空間セグメントとしてタイルを使用することに関するケースであるので、ビデオデコーダ６００は、長期シンタックス要素構造６０６によって仮定される値に依存しているエンハンスメントレイヤ１を復号化することの投機的な試みを描き得る。

ビデオエンコーダ側に関する限り、図１に示すように実現され得るそれぞれのビデオエンコーダがデータストリーム４０に長期シンタックス要素構造６０６を挿入しかつセットして、デコーダ６００に保証を付与するか否かを決定し得る点に留意する必要がある。許可される場合、符号化は、境界配列保証に従う設定に短期シンタックス要素６０２を対応する所定期間６０８に対し設定する際の可能性を制限する。そうでなければ、エンコーダは、期間６０８の間それが好むように短期シンタックス要素６０２を自由にセットするままである。空間セグメントとしてタイルを使用するとき、エンコーダは、空間予測がタイル境界を横切らず、かつ、画像１２および１５のタイルの任意のエントロピー符号化がタイルごとに自己充足的態様で実行されるとの制限に従う。例えば、エントロピー確率は、他のタイルから独立しているタイルごとに新たに初期化される。サブストリームの場合には、いかなる第２のおよび以下のサブストリームが関連する限り、直接先行しているサブストリームの中間の位置まで適合されるように、エントロピー確率を採用することにより、サブストリームのエントロピー確率初期化が新たに、すなわち他のいかなるサブストリームから独立して、それぞれの画像１２、１５のいかなる第１のサブストリームに対し、実行される。空間予測は、サブストリーム境界と交差することに関して、いかなる制限なしで実行される。

図４に関して記載されている方法において、すなわち後述する方法で、配列概念は、ＨＥＶＣ規格の現在構想された拡張に導入され得る。その範囲において、すぐ以下において挙げられた説明も、図４に関して上記に挙げられた説明に関する可能な実施の詳細の基礎として、解釈される。

ＨＥＶＣは、タイルと呼ばれてインループフィルタリングを除いて独立に処理され得る矩形状領域に垂直および水平境界のグリッドにより符号化ベースレイヤ画像のＣＴＢを分割することを可能にする。インループフィルタは、それらを完全に独立させるようにするため、タイル境界でオフし得る。

タイル境界アーチファクトを減少するために、適切に構成される場合、インループフィルタは、タイル境界と交差し得るのに対し、解析および予測依存性は、画像境界に酷似しているタイル境界で破壊されている。従って、個々のタイルの処理は、完全に、または、フィルタ構成に依存して非常に大きく、画像の範囲内で他のタイルに依存しない。タイルのすべてのＣＴＢが同じスライスに属さねばならず、あるいは、スライスのすべてのＣＴＢが同じタイルに属さなければならないという、制限が導入されている。図１に見られるように、タイルは、ＣＴＢ走査順序をタイルの順序とみなすことを余儀なくする、すなわち、第２のタイル、例えば右上、に属するＣＴＢを続ける前に、第１、例えば左上のタイル、に属しているすべてのＣＴＢを通過する。タイル構造は、画像の範囲内でグリッドを構成する各タイルの行および列におけるＣＴＢの数およびサイズを通して定義される。この構造は、フレーム基礎につき変化し得る、あるいは、符号化ビデオシーケンスの全体にわたって不変であり得る。

図５は、画像の範囲内でＣＴＢの９つのタイルへの典型的な分割を示す。太い黒線は、タイル境界を表し、番号付けは、ＣＴＢのスキャン順序を表す。そして、また、タイル順序を表わす。

ベースレイヤビットストリームにおける対応する画像エリアをカバーするすべてのタイルが復号化されるとすぐに、ＨＥＶＣ拡張のエンハンスメントレイヤタイルは、復号化され得る。

以下のセクションは、図４の概念を使用しているベースレイヤ情報へのより簡単なアクセスを可能にする制約、信号伝送および復号化プロセスの改良を記載する。

タイルレベル並列化のために最も簡単なケースは、ベースおよびエンハンスメントレイヤのタイル境界が整列配置される時である。ＳＮＲのスケーラビリティのために、これは、境界が正確に同じ位置にあることを意味する。空間スケーラビリティのために、これは、同じタイルに属する各２つのエンハンスメントレイヤ画素のために、対応するベースレイヤ画素もまた同じタイルに属し、かつ、同じタイルに属する各２つのベースレイヤ画素のために、対応するエンハンスメントレイヤ画素もまた同じタイルに属する、ことを意味する。

ＨＥＶＣは、ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］およびｒｏｗ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｉ］によって以下に与えられる画像パラメータセットを使用することにより画像基礎につき画像の範囲内でタイルの次元および構造を示すために図４における６０２に対応する短期信号伝送を特徴とする。図６は、典型的なシンタックスを示す。

例えば、単一レイヤＨＥＶＣ符号化ビデオシーケンス（以下に提供されるＶＵＩシンタックスにおけるｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇと比較）における符号化タイル構造を示すために、ＨＥＶＣは、ＨＥＶＣ符号化ビデオシーケンスの特定の設定を保証する制限を信号伝送することを更なる特徴とする。スケーラブル符号化ビデオシーケンスにおけるタイルの更なる制限は、デコーダ初期化および動作のために有益である。そのベースレイヤタイルが終了したあと、デコーダがベースレイヤタイルと関連しているエンハンスメントレイヤ画像エリアを復号化し始めるのを可能にするために、完全な配列を実施することは必要ではない。特に、空間スケーラビリティにおいて、ベースレイヤにおいてよりエンハンスメントレイヤにおいてより多くのタイルを許容することは、有用かも知れない。例えば、２つの空間スケーラビリティの要素において、４倍の画素数が、対応するベースレイヤ画像エリアに比べエンハンスメントレイヤ画像エリアにおいて含まれる。それで、ベースレイヤタイルごとに、エンハンスメントレイヤにおける４つのタイルを許容することは、有用であるかもしれない。空間スケーラビリティを有する整列配置されたタイル境界のための実施例を示す図７を参照されたい。すべての垂直境界は、ベースおよびエンハンスメントレイヤにおいて整列配置される。エンハンスレイヤにおける付加的なタイル（水平境界）は、ベースレイヤタイル分割におけるものとしてエンハンスメントレイヤタイルにつき画素の同数を使用し並列化を可能にするのに使用される。

このように、我々は、各ベースレイヤ境界だけがエンハンスメントレイヤにおける対応する境界を有する方法におけるタイル境界配列を定義するが、その逆ではない。正確には、これは、２つのエンハンスメントレイヤ画素ごとに、それは、同じタイルに属し、対応するベースレイヤ画素はまた、同じタイルに属することを意味する。

信号伝送６０６は、さもなければ、複数のパラメータセットを解析することにより情報を集めなければならない並列デコーダ環境を初期化するのを支援する。さらに、ビットストリーム制限の形で、図４の概念は、例えば、上述の制限が完全な符号化ビデオシーケンスに当てはまることを保証する。

ベースレイヤのタイル境界がエンハンスメントレイヤのタイル境界のサブセットである場合、あり得る実施例は、エンハンスメントレイヤにおけるベースレイヤタイル境界の節減した信号伝送を可能にする。

タイル配列に関する情報は、デコーダによる簡単なアクセスのためのビットストリームにおいて、明確に示され得る。

図８において与えられるように、特定の実施例において、信号伝送は、エンハンスメントレイヤＳＰＳのＶＵＩパラメータにおけるフラグを用いて達成され得る：

１に等しいｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇは、符号化ビデオシーケンスにおいて活性化された各画像パラメータセットが、存在するときシンタックス要素ｎｕｍ＿ｔｉｌｅ＿ｃｏｌｕｍｎｓ＿ｍｉｎｕｓ１、ｎｕｍ＿ｔｉｌｅ＿ｒｏｗｓ＿ｍｉｎｕｓ１、ｕｎｉｆｏｒｍ＿ｓｐａｃｉｎｇ＿ｆｌａｇ、ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］ｒｏｗ＿ｈｅｉｇｈｔ＿ｍｉｎｕｓ１［ｉ］およびｌｏｏｐ＿ｆｉｌｔｅｒ＿ａｃｒｏｓｓ＿ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇの同じ値を有することを示し、かつ、０に等しいｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇは、異なる画像パラメータセットにおけるタイルシンタックス要素が同じ値を有し得るかまたは有し得ないことを示す。ｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇシンタックス要素が存在しないときに、それは０に等しいと推測される。

１に等しいｔｉｌｅｓ＿ｆｉｘｅｄ＿ｓｔｒｕｃｔｕｒｅ＿ｆｌａｇの信号伝送が、符号化ビデオシーケンスにおける各画像がマルチスレッド復号化の場合に作業負荷配分に役立つかもしれない同一方法で分配されたタイルの同じ数を有するというデコーダへの保証であることに注意されたい。

ｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇは、図４の構造６０６に対応する。同上が１に等しい場合、ベースレイヤ画像に対応するすべてのタイル境界が所与のエンハンスメントレイヤにおける対応するタイル境界を有することを示す。０に等しいｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇは、対応するベースレイヤおよび所与のエンハンスメントレイヤの間のタイル構成に関して制限が存在しないことを示す。

長期シンタックス要素構造の値によるｎについては、長期シンタックス要素構造が、所定期間、例えば画像シーケンスの間、第２のレイヤの画像１５が再分割される空間セグメント８２の最小限の数が第１のレイヤの画像１２が再分割される空間セグメント８０の最小限の数を超えるｎ回である、または、画像１２のその各々の空間セグメントが時間整列配置された画像１５の正確にｎ空間セグメントから成立ち、ｎが長期シンタックス要素構造に依存することを保証し得ることに注意されたい。図７の場合、ｎは、３に等しいであろう。デコーダは、所定期間より短い時間間隔において、マルチレイヤビデオデータストリーム４０の短期シンタックス要素に基づいて空間セグメント８０および８２への第１のレイヤおよび第２のレイヤの画像１２、１５の実際の再分割を依然周期的に決定し得る、しかし、また、保証はより能率的に作業負荷配分を実行するためにデコーダによって利用され得る。他の態様は、「日和見主義的復号化」である：複数のＣＰＵコアを有するデコーダは、レイヤの並列性に関して、そして、その上により大きい複雑さのレイヤを復号化することを決めるために、すなわちより高い空間分解能またはレイヤのより多い個数の中で、ヒントとして保証を利用し得る。シングルコアの能力を超えるビットストリームは、同じデコーダのすべてのコアを利用することによって復号化可能であり得る。プロフィールおよびレベル表示器が、最小限の並列性に関するこの種の表示を含まない場合、この情報は、特に有用である。

以下に述べられ提示される第２の態様は、「制限されたインターレイヤアップサンプリング」と呼ばれ得る概念に関する：ビットストリーム（ｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃを手本として比較）におけるシンタックス要素が、空間スケーラブルなマルチレイヤビデオの場合にはアップサンプリングフィルタ３６を操作するために使用される。アップサンプリングフィルタリングが、空間セグメント境界８６全体のレイヤ０において実行される場合、レイヤ０の空間セグメント８０の符号化／復号化と関連してレイヤ１の空間セグメント８２の並列符号化／復号化において対処されるべき遅延は、アップサンプリングフィルタリング結合として増加し、かつ、このように相互に依存する、レイヤ１のブロック４１のインターレイヤ予測において使用される予測参照３８として役立つレイヤ０の隣接した空間セグメントの情報、を表す。例えば、図９を参照されたい。画像１２および１５はともに、空間一致、すなわちシーンの同じ部分が互いに覆うことを示す部分、によると必要な大きさにされて、各々に登録される両方の画像を有する覆い合う態様に示される。画像１２および１５は、それぞれ６および１２、タイルのような空間セグメント、に分割されることを手本として示す。フィルタカーネル２００は、画像１５のタイルの範囲内で任意のブロックをインターレイヤ予測していて、空間的に左上タイルを覆う基礎として役立つそのアップサンプリングされたバージョンを得るために画像１２の左上タイルを横切るものとして実例として示される。例えば２０２等の若干の中間の例で、カーネル２００は、画像１２の隣接タイルと重畳する。アップサンプリングされたバージョンの位置２０２でカーネル２００の中央のサンプル値は、画像１２の左上タイルのサンプルおよび画像１２のタイルの右へのサンプルの両方に依存する。画像１２のアップサンプリングされたバージョンがインターレイヤ予測の根拠として役立つ場合、レイヤのセグメントを並列処理する際に、インターレイヤオフセットは増加する。制限は、このように、異なるレイヤ全体の並列化量を増加させて、したがって、全体の符号化遅延を減少させることに役立つ。当然、シンタックス要素は、一連の画像に当てはまる長期シンタックス要素でもあり得る。制限は、以下の方法の１つにおいて成し遂げられ得る：例えば、カーネル２００の非破線部分の範囲内でサンプル値の中心傾向によって重畳する位置２０２で、カーネル２００の重畳する部分を満たし、破線のもの等に線形であるか他の関数を使用して非破線の部分を外挿する。

後の態様をさらにより明白に表すために、画像がレイヤ０の画像１２およびレイヤ１の画像１５に対応する異なる空間レイヤにおいて符号化される空間スケーラブルビットストリーム４０を受信しているデコーダ６１０を示す図１０が参照される。少なくともこれらの空間レイヤのうちの１つのために、デコーダ６１０は、空間セグメントにおける同上を復号化するように構成される。上記の説明と一致して、これらの空間セグメントは、タイルまたはサブストリームまたはスライスであり得る。同様に、デコーダ６１０は、画像１２または画像１５のこの種の空間セグメントを並列復号化させるように構成され得る。すなわち、ベースレイヤ画像１２は、タイルおよび／またはサブストリームおよび／またはスライスのような空間セグメントに再分割され得るおよび／またはエンハンスメントレイヤ画像１５は、タイルおよび／またはサブストリームおよび／またはスライスに再分割され得る。並列復号化に関する詳細に関する限り、図４の前記説明が参照される。そして、それは、図１０のデコーダ６１０に直ちに転用され得る。すなわち、ベースレイヤ画像１２を復号化する際に、ベースレイヤ１２および１５が、例えば、レイヤをなしたビデオの一部である場合、デコーダ６１０は、空間予測および任意に時間予測を使用する。タイルの場合には、空間予測は、タイル境界と交差しないことに制限される、そして、同上は、エントロピー復号化に当てはまる。そして、エントロピー復号化が使用される場合、それはタイルのために別に完全に実行される。加えて、インターレイヤ予測をサポートすると共に、同上は、エンハンスメントレイヤ画像１５に当てはまる。すでに上述したように、インターレイヤ予測は、ベースレイヤを復号化する際に使用されていた対応する予測パラメータに基づいて予測されるエンハンスメントレイヤの予測パラメータに関するだけでなく、インターレイヤ予測を使用して現在予測されるエンハンスメントレイヤ画像１５の部分と関連して同じ位置に配置された部分でベースレイヤ画像の再生されたサンプルから導出される予測にも関連する。しかしながら、ビットストリーム４０が空間スケーラブルビットストリームであり得るので、エンハンスメントレイヤ画像１５の現在処理された部分のインターレイヤ予測の基礎を形成するためのベースレイヤ画像１２の任意の同じ位置に配置された部分は、画像１２と関連して画像１５のより高い空間分解能の原因であるためにデコーダ６１０によってアップサンプリングされ得る。例えば、図１１を参照のこと。現在、エンハンスメントレイヤ画像１５の予測された部分であることは、参照符号６１２を使用して図１１に示される。ベースレイヤ画像１２の同じ位置に配置された部分は、参照符号６１４を使用して示される。エンハンスメントレイヤ画像１５のより高い空間分解能のために、部分６１２（点によって示される）の範囲内のサンプル位置の数は、部分６１４（同様に、点によって示される）の範囲内でサンプルより多いことが示される。従って、デコーダ６１０は、ベースレイヤ画像１２の部分６１４のすでに再構成されたバージョンをアップサンプリングするために補間を使用する。この際、図１０のデコーダ６１０は、空間スケーラブルなビットストリーム４０におけるシンタックス要素６１６に応答する。

特に、ちょうど言及された応答は、図１２に関してより詳細に説明される。図１２は、ベースレイヤ画像１２、すなわちその非アップサンプリングされたバージョンの参照部分、の範囲内でその対応するアップサンプリングされたバージョンと同様に部分６１４を示す。そして、参照符号６１８を使用して示される。ちょうど言及したように、エンハンスメントレイヤ１５の部分６１２への部分６１８のそれぞれのアップサンプリングされたサンプル値を例えばコピーすることによりインターレイヤ予測のために後に使用されるバージョン６１８は、補間６２０によりベースレイヤ画像１２から得られる。しかしながら、補間６２０は、ちょうど言及されたシンタックス要素６１６に依存する。補間６２０がシンタックス要素６１６に応じて変化する方法は、それぞれ、ベースレイヤ画像１２の分割およびそのアップサンプリングされたバージョンの隣接した部分の間で境界に沿った領域に関係する。特に、分割は、少なくとも画像１２および１５の１つが再分割される上述した空間セグメントに依存する。分割は、点線６２２を使用するベースレイヤ画像１２の範囲内で、図１１において示される。分割６２２は、例えば、下記で更に詳細に概説されるように、画像１２および１５の空間セグメントの境界の空間オーバレイの論理積または論理和の組合せに対応し得るまたはエンハンスメントレイヤ画像１５の空間セグメントによって定義された分割と空間的に一致し得る。いずれにせよ、シンタックス要素６１６に応じて、デコーダ６１０は、分割６２２にかかわりなく、または、分割６２２を考慮して補間６２０を実行する。分割を考慮するときに、アップサンプリングされた部分６１８の範囲内のすべてのサンプルが、単に開始するだけであるか、または従属するだけであるか、または影響されるだけであるように、デコーダ６１０は、補間６２０を実行する一方、分割の他の部分から独立している。例えば、分割６２２が、画像１２および１５の空間セグメントの境界のローカル論理積の組合せまたはそれらのローカル論理和の組合せである場合、これは、補間部分６１８のすべてのサンプルが単にベースレイヤ画像１２の１つの分割だけから生じることを意味する。しかしながら、シンタックス要素６１６が、デコーダ６１０に分割６２２に反応しないように指示する場合、補間部分６１８の範囲内の様々なサンプルが分割６２２の隣接した分割から生じることは、起こり得る。

６１２は、例えば、フィルタカーネル２００が補間６２０を実行するために用いられ、そして、図１２において丸で囲まれた補間されたサンプルを得るために、カーネル６２４が、分割６２２の２つの隣接した分割の間の境界を覆う場合を示す。その場合、デコーダ６１０は、通常はフィルタカーネル６２４を充填するために、すなわち完全にベースレイヤ画像１２のそれぞれに含まれたサンプル上にフィルタカーネル６２４を適用することにより、または、部分６１４および６１８を含まない隣接した分割に突出しているフィルタカーネル６２４の断片をそれぞれ満たすことにより、ベースレイヤ画像１２の根本的サンプルから独立して充填されたこのそれぞれの断片に従って代替規則を使用することにより、図１２におけるハッシングを使用して示された、シンタックス要素６１６に応答する。例えば、フィルタカーネル６２４の断片化された部分は、フィルタカーネル６２４の非断片化部分のサンプル値の若干の平均基準または若干の外挿により充填される。他の変形例において、断片化された部分によって覆われるベースレイヤ画像１２のサンプル値は、例えば０等の所定の値を使用して充填される。通常、デコーダ６１０は、画像１２自体の外縁部のように部分６１４を含んでいる部分およびその隣接した分割を分離している分割境界を扱い得て、画像１２の近傍または外側で、アップサンプリング／補間を実行することにおいて使用されるように、補間６２０における同じ代替規則を例えば使用し得る。

本出願の一実施例によれば、分割６２２は、エンハンスメントレイヤ画像１５の空間セグメントへの任意の再分割とはかかわりなくベースレイヤ画像の空間セグメントへの再分割と一致するために選択される。それから、ベースレイヤ画像１２およびエンハンスメントレイヤ画像１５をデコーダ６１０により復号化する間のインターレイヤオフセットは、エンハンスメントレイヤ画像１５の部分６１２のインターレイヤ予測を実行する前に復号化されるべき隣接する分割／空間セグメントを有するために部分、例えばベースレイヤ画像１２の部分６１４はデコーダ６１０を必要としないので、減少され得る。

あるいは、デコーダ６１０は、画像１５の空間セグメントへの再分割と局所的に一致するために分割６２２を決定するように構成され得る。他の変形例において、デコーダ６１０は、分割６２２が単に画像１２および１５、それは空間的に一致する、すなわち、画像１２および１５の境界の空間セグメントの論理積に対応するように、の空間セグメントの境界を単に作り出すために分割６２２を選択するように構成され得る。−換言すれば、単に画像１５の空間セグメントへの再分割のこれらの境界は、分割６２２、それはベースレイヤ画像１２の空間セグメントへの再分割のそれぞれの境界に空間的に対応する、の分割の間に対応する境界を形成する。

それは、シンタックス要素６１６は、デコーダ６１０に補間６２０における分割６２２を無視するか否かのみならず分割６２２を選択する様々な方法を区別させることが、可能でもあって、以下で更に詳細に概説されもする。例えば、図９参照。ここで、タイルは空間セグメントとして手本として使用された。シンタックス要素６１６がデコーダ６１０に分割６２２のために別々に補間６２０を実行する旨を示す場合、それらがエンハンスメントレイヤ画像１５のタイルへのより微細な再分割と一致した時から、デコーダ６１０は、例えば、分割６２２の境界としてベースレイヤ画像１２の境界を使用し得る。従って、エンハンスメントレイヤ画像１５の最上行の第２のタイルの復号化を開始するために、「補間分離」がベースレイヤ画像１２の最上行の最初の２つのタイルの再構成された試料のいかなる混成も禁止するので、デコーダ６１０は、ベースレイヤ画像１２の最上行における第２のタイルの復号化の終了を待つ必要はない。エンハンスメントレイヤ画像１５のタイルへの完全な再分割を採用する場合、分割６２２を決定するために、補間分離は、図９の点線でも実行される、そして、デコーダ６１０は、以前でさえ、すなわちベースレイヤ画像１２の第１のタイルのそれぞれの同じ位置に配置されたサブ部分を復号化するのを達成するとすぐに、エンハンスメントレイヤ画像１５の左上タイルを復号化するのを開始し得る。この点に関し、タイルを復号化する際でさえ、デコーダ６１０は、例えば、行方向態様のそれぞれのタイルの左上角からそれぞれのタイルの右下角まで進行する例えば若干のラスタースキャン順序を含み得る若干の復号化順序を使用し得る点に注意されたい。

すなわち、第２の態様によれば、ビットストリームを形成しているエンコーダ４０は、シンタックス要素６１６として２つのモードの間で選択し得る：デコーダ６１０を分割６２２に無反応にさせるように設定するために、シンタックス要素６１６がセットされ、−そして、ビットストリーム４０に挿入された−場合、より良好なインターレイヤ予測が、より良好な補間のために達成され得る、しかし、並列復号化画像１２および１５における並列化の得られる度合は、減少される、すなわち、従うべき最小インターレイヤオフセットは、増加する。他のモードにおいて、インターレイヤ予測目的のための補間６２０を実行するときに、シンタックス要素６１６は、デコーダ６１０に分割６２２を考慮に入れさせる、そして、インターレイヤ予測品質は、したがって、並列性の増加度、および、並列復号化画像１２および１５においてそれぞれ減少された最小インターレイヤ復号化オフセットのために減少する。

本出願の第２の態様の説明が、主にタイル再分割またはタイル並列処理概念にフォーカスしたにもかかわらず、ＷＰＰサブストリームを使用するときに、補間６２０を制御するためにシンタックス要素６１６を使用することが有利であることは、明らかであるべきである。例えば、図１３を参照されたい。図１３は、ベースレイヤ画像１２が、２つのサブストリームに手本として再分割され、そこでは、エンハンスメントレイヤ画像１５の同じ位置に配置された部分が、共に各々２つのサブストリームに再分割される場合を示す。シンタックス要素６１６に応答して補間分離を適用する場合、デコーダ６１０は、画像１５の第１のエンハンスメントレイヤサブストリームのそれぞれの左側部分を覆うために充分離れたベースレイヤ画像１２の最初のサブストリームを復号化するとすぐに、デコーダ６１０は、最初の、すなわちエンハンスメントレイヤ画像１５のサブストリームの最上の、復号化を開始し得る。そして、これは、補間分離が第２のエンハンスメントレイヤサブストリームを空間的に覆う画像１２のベースレイヤサブストリームの任意の再構成された部分から独立した任意のインターレイヤ予測を表すので、画像１５の第２のサブストリームと境界を接する画像１５の第１のエンハンスメントレイヤサブストリームのこれらの部分でさえ正しい。

上記に概説された切替え可能な制限されたインターレイヤアップサンプリングを実現する詳細な実施例を以下に提供する前に、例えば、ちょうど図４における場合であるように、ビデオの画像の時間整列配置された対である画像１２および１５の場合における時間枠につきシンタックス要素６１６は、制限を示し得るあるいは切替え得ることが記述されている。さらに、また、本出願の実施例によるデコーダが、図４および図１０の両方に関して上記に提供された説明および機能と一致し得ることに注意されたい。この点に関し、図４に関して上記を提供した説明が、短期シンタックス要素および画像１２および１５の空間セグメントの位置の信号伝送は、図１０から１３までに関して記述された実施例に等しく当てはまるとみなされることに注意されたい。最後に、図１０のデコーダがレイヤ０および１の画像を復号化する画像デコーダである場合、第２の態様も有利であろうことに注意されたい。時間要素は、任意である。

ＨＥＶＣにおいて制限されたインターレイヤアップサンプリングを実現することは、以下のようになされ得る。空間スケーラビリティにおいて、アップサンプリングされたベースレイヤ画像は、エンハンスメントレイヤ画像を予測するために使用される。この方法では、予測値は、対応するベースレイヤ画像エリア（通常水平および垂直方向において）の複数の画素値を用いてエンハンスメントレイヤの各画素位置ごとに計算される。異なるベースレイヤのタイルから画素が使用される場合、エンハンスメントレイヤタイルとして同じ画像エリアを覆うベースレイヤタイル情報からのみエンハンスメントレイヤタイルを復号化し得ない。ビットストリーム制限として制限されたインターレイヤアップサンプリングを信号伝送することは、符号化ビデオシーケンスのすべてのパラメータセットにおいて示された空間分割は、制限に従い、このように並列マルチレイヤデコーダの初期化と動作を単純化することを、デコーダに保証する。

図１０の概念は、エンハンスメントレイヤタイルに対応するベースレイヤタイルに含まれないアップサンプリングのために隣接する画素情報の使用を承認しない機構として実現され得る。デコーダが全てのエンハンスメントレイヤタイル境界でベースレイヤの対応する画像エリアの外側で画素の使用を許容されるかどうかが、ビットストリーム内に示される。

代案として、デコーダが、ベースレイヤタイル境界に対応するエンハンスメントレイヤタイル境界のみのために全てのエンハンスメントレイヤタイル境界でベースレイヤの対応する画像エリアの外側の画素の使用を許容されるかどうかがビットストリームにおいて示される。

特定の実施例において、隣接画素が利用できない画像境界上に存在するので、タイル境界でベースレイヤのアップサンプリングが、実行される。

特定の実施例において、信号伝送は、図１４において与えられるように、エンハンスメントレイヤの画像パラメータセットのフラグを用いて達成され得る。

ｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃは、シンタックス要素６１２に対応する。０に等しくないｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃは、タイル境界と交差しないようにアップサンプリングフィルタを制限する。ｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃが２に等しい場合、エンハンスメントレイヤタイルに対応する画像エリアの外に位置するベースレイヤサンプルは、アップサンプリングのために使用されるべきでない。ｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃが１に等しい場合、制限は、ベースレイヤタイル境界に並べられるエンハンスメントレイヤタイル境界のみに適用される。０に等しいｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃは、この制限を意味しない。

最後に、図１５ａは、図１４のシンタックス要素の６１２の例を示すために、空間的に対応する態様で覆われる２つのタイル分割された画像１２および１５を、手本として示す：２に等しいｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃは、アップサンプリングフィルタがいかなるエンハンスメントレイヤタイル境界と交差しないように制限する。破線の単純な点線４００を参照されたい。ｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃが１に等しい場合、制限は、ベースレイヤタイル境界と整合されるエンハンスメントレイヤタイル境界だけに適用される。二点鎖線４０２を参照されたい。０に等しいｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃは、この制限を意味しない。

あるいは、モードｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝２に、または、ｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝３のような更なるモードとして、アップサンプリングフィルタは、ベースレイヤのそれらでもなくエンハンスメントレイヤのそれらでもない、いかなるタイル境界と交差しないように制限される。図１５ｂの線４０４を参照されたい。

すなわち、モードに依存して、境界４００、４０２または４０４で、アップサンプリングフィルタは、図９に関して前述したように取扱われるであろう。

本出願の次の態様を始める前に、上述された補間６２０が、例えば、インターレイヤ予測結果を得るために図２の予測器６０で実行されるであろう点が簡潔に記述されている。エンコーダが符号化側で同じ予測を実行するので、補間６２０は、例えば、予測器１８内で、エンコーダ側で同様にシンタックス要素６１６の設定に依存して実行される。符号化側で、シンタックス要素をどのようにセットすべきかに関する決定は、例えばアプリケーションシナリオに応じて実行され得る。低遅延がより高い重要度である場合には、例えば、シンタックス要素がインターレイヤアップサンプリングを制限するために設定され、そして、ほかの応用シナリオにおいて、良好な予測を有することおよび圧縮比を増すことは、インターレイヤアップサンプリングを制限しないためにシンタックス要素６１２をセットすることが望ましくあるように、より重要であり得る。

連続的なレイヤの空間セグメントの符号化の間のまさに言及された最小符号化遅延−或いはオフセット−は、同様に次の態様の主題であり、そして、それは「レイヤ復号化遅延表示」と名付け得る。デコーダは、短期シンタックス要素に基づく画像１２の空間セグメントと関連する画像１５の空間セグメントの符号化の間に、この種の最小復号化遅延または、−オフセット−を決定し得る。しかし、次の概念によれば、前もって所定期間で、長期シンタックス要素構造が、このインターレイヤ−遅延−もしくは−オフセット−を示すために使用される。また、これは、ビットストリーム４０を並列復号化する範囲内で作業負荷配分を実行する際のデコーダを支援する。「遅延」または「オフセット」空間セグメントのための測定が使用され得るように、すなわち、オフセットは、空間セグメント（タイル、スライスまたはＷＰＰのためのＣＴＢ行）を単位にして表され得る。

更に詳細に後の態様を記載するために、図１６が参照され、それは大部分図４と一致する。従って、可能な所で、同じ参照符号が図１６において使われ、そして、これらの共通要素によって関連される要素に関して、図４に関して上記で挙げられた説明は、図１６に等しく適用される。図１６に示されるビデオデコーダ６４０が、下記で述べられる機能に加えて、長期シンタックス要素６０６に関して図４に記載されている機能を組込み得るとも述べられるべきである。現在、図１６の本出願の態様も、長期シンタックス要素構造、すなわち、６４２、を使用し、それは所定期間６０８に言及するか関連するためにビットストリーム４０にも挿入される。換言すれば、ビデオデコーダ６４０が、シンタックス要素構造６４２と同様に図４のシンタックス要素構造６０６に応答し得たにもかかわらず、単に以下で更に概説される後の機能だけは、図１６のデコーダ６４０にとって重要であるが、シンタックス要素構造６０６およびビットストリーム４０におけるシンタックス要素構造６０６の存在に関する機能は、ビデオデコーダ６４０にとって任意である。しかしながら、ビデオデコーダ６００に関して上記に述べられる説明は、ビデオデコーダ６４０に等しく適用される。すなわち、ビデオデコーダ６４０は、マルチレイヤビデオデータストリーム４０を復号化し得て、シーンは、第１のレイヤ、レイヤ０、から第２のレイヤ、レイヤ１、までインターレイヤ予測を使用するレイヤの階層において符号化される。ビデオデコーダ４０は、空間セグメントにおけるマルチレイヤビデオデータストリームの並列復号化をサポートし、レイヤの画像は、第２のレイヤの画像の空間セグメントの横断と関連して第１のレイヤの画像の空間セグメントの横断との間にインターレイヤオフセットを有する時間重畳態様における空間セグメントを順次横断することにより分割される。軽微な注釈として、空間セグメントがタイル、サブストリームまたはスライスであり得ることが表され、しかし、ちょうど言及されたセグメントユニットの混合物さえ実現可能である。スライス概念をタイルおよび／またはサブストリーム概念と結合することにおいて、「空間セグメント」が実際に何であるかという定義は、異なり得る。

いかなる場合でも、共通の時間枠６０４の画像１２および１５に関して、図１６のビデオデコーダ６４０は、一方では画像１２の空間セグメントを、他方では画像１５の空間セグメントを、並列に、すなわち時間重畳態様で、復号化し得る。当然に、この目的を達成するために、ビデオデコーダ６４０は、両方のレイヤの間にインターレイヤ予測によるものとして若干の最小復号化オフセットに従うことを必要とし、画像１５の範囲におけるエンハンスメントレイヤ１の現在復号化された部分は、レイヤ０の時間整列配置された画像１２のすでに復号化された部分に属さなければならない。

図１６の場合には、長期シンタックス要素構造６４２は、所定期間６０８に先立ってインターレイヤオフセットを決定するために、ビデオデコーダ６４０により使用される。

図１６の実施例と関連して、インターレイヤオフセットは、一方では画像１２の第１の空間セグメントの「距離」のためのスカラー測度であり、他方では時間整列配置された画像１５である。「距離」は、好ましくは空間的に測定される。さらに、意味があるようにするために、長期シンタックス要素構造６４２に基づいて決定され得る、インターレイヤオフセットは、画像１２の第１の空間セグメントの全部の復号化プロセスに当てはまる。すなわち、ベースレイヤ画像１２の第１の「インターレイヤオフセット」空間セグメントが以前に復号化された場合、インターレイヤ予測のための画像１２におけるすべての必要な参照部分は、画像１５の全部の第１の空間セグメントを復号化するのに利用し得る。

上記したように、画像１５の範囲内の「現在復号化された部分」は、ある所定の態様において、すなわちタイル並列処理を使用する場合には上述したタイル順序において、そして、サブストリームを使用しているＷＰＰ概念を使用する場合に傾けられた波面の形において、画像１５を横断する。同じことは、ベースレイヤ画像１２の空間セグメントに当てはまる。インターレイヤオフセットは、画像１５の第１の空間セグメントが最初に復号化する対象となり得る前に、すでに処理されるべき画像１２の横断の部分を決定する。

より詳細にこれを記載するために、図１７ａおよび１７ｂが参照される。図１７ａは、タイル概念に関して更に詳細に長期シンタックス要素構造６４２から決定可能なインターレイヤオフセットを記載し、一方、図１７ｂは、ＷＰＰに関して更に詳細に長期シンタックス要素構造６４２に基づいて決定されるインターレイヤオフセットを記載する。後に、図１７ｃと関連して、長期シンタックス要素構造６４２を使用するインターレイヤオフセット信号伝送概念が、タイルおよび／またはＷＰＰ概念の使用に制限されないことが示される。むしろ、定義上（すなわち、エントロピー復号化および空間イントラ画像予測は、完全に「スライスの」か、または隣接したスライスから独立して実行される）自己充足的な方法で復号化可能なスライスへの画像の単なる再分割により、長期シンタックス要素６４２に基づいて、インターレイヤオフセットの解釈を表す。

図１７ａは、２つの時間整列配置された画像１２および１５を示し、両方ともタイルに再分割される。上記で提示されたタイル概念の説明から明瞭になったように、通常、復号
化されるべき画像１２または１５のタイルの範囲内で、固定の順序は、存在しない。むしろ、タイルは、いかなる順序においても復号化され得る。それにもかかわらず、図１６の実施例と関連して、タイル順序は、ベースレイヤ画像１２のタイルに関して、少なくとも定義される。タイル順序６４４は、左上タイルからタイルの規則的な配列の右下タイルまでラスタースキャン順序行方向で進行するために定義される。図１７ａの実施例によれば、長期シンタックス要素構造６４２によって示されたインターレイヤオフセットは、デコーダ６４０がエンハンスメントレイヤ画像１５の第１のタイルを復号化するのを開始し得るために、ベースレイヤ画像１２のタイル順序６４４においてすでに復号化されねばならないタイルの数を示す。エンハンスメントレイヤ画像１５のタイル間の「第１のタイル」を決定するために、エンハンスメントレイヤ画像１５の第１のタイルは、エンハンスメントレイヤ画像１５の左上タイルとして、固定して定義され得る。エンハンスメントレイヤ画像１５のこの第１のタイルから始まり、ビデオデコーダ６４０は、タイル順序を画像１２のタイル再分割に依存して画像１５のエンハンスメントレイヤタイルを横断するために適応させ得る。図１７ａの場合、例えば、タイルへの画像１２の再分割は、タイルの２つの行および３つの列から成るが、画像１５は、タイルの２つの列を有するタイルの４つの行に再分割される。その場合、デコーダ６４０が、最初に最初の２本の行の左側のタイルを横断するためにエンハンスメントレイヤタイルを横断するタイル順序を選択することは有利であり得る。そして、最初の２本の行の右側のものを横断する、そうすると、矢印６４６で示すように、エンハンスメントレイヤ画像１５のタイルの下側の行に関してこの横断を繰返す。本願明細書において記載されているすべての態様に当てはまる他の実施例によれば、しかしながら、画像１５のエンハンスメントレイヤタイルの間のタイル復号化順序は、固定され、かつ、ベースレイヤ画像からタイルへの再分割から独立している。エンハンスメントレイヤ画像を復号化することを始める／開始するためのトリガとして単に信号伝送されたインターレイヤ符号化オフセットを使用する場合において、並べ替えは、いずれにしろ必要でない。点線を使用して、図１７ａは、エンハンスメントレイヤ画像１５の第１のタイルの位置に局所的に対応する画像１２の位置を示す。図１７ａから明らかになるように、図１７ａの手本となるケースで、デコーダ６４０がエンハンスメントレイヤ画像１５の第１のタイルを復号化開始し得る前に、画像１２の最初の２つのタイルが復号化されなければならなかったので、長期シンタックス要素構造６４２により決定されるインターレイヤオフセットは、「２」である。単にその場合において、インターレイヤ予測のために必要とされる同じ位置に配置された部分は、ベースレイヤ画像１２において利用可能である。

すなわち、図１７ａの場合、ビデオデコーダ６４０は、長期シンタックス要素構造６４２から、画像１５のエンハンスメントレイヤタイルの第１のタイルを復号化することと関連して画像１２のベースレイヤタイルの横断６４４の間のインターレイヤオフセットが２つのベースレイヤタイルであることを決定する：ビデオデコーダ６４０が、タイル順序６４６における画像１５のエンハンスレイヤタイルの第１のタイルを復号化するのを開始し得る前に、タイル順序６４４における最初の２つのベースレイヤタイルを復号化することは待たれなければならない。

図１７ｂは、両方の時間整列配置された画像１２および１５がサブストリーム、すなわち、図１２の場合２つのサブストリームおよび図１５の場合４つのサブストリームに再分割される典型的なケースに関する。例えば、すなわち各サブストリームがこの種の符号化ブロックの１つの行に対応するように、サブストリームは、符号化ブロックの行および列における画像１２および１５の上述した規則的な再分割と一致し得る。いずれにせよ、ＷＰＰ処理のために、上記の通り、画像１２のサブストリームの中で定義される復号化順序が存在し、そして、画像１５のサブストリームは、それぞれ復号化順序６４８および６５０が、上端から下端まで進行する。図１７ａの場合と同様に、デコーダ６４０は、長期シンタックス要素構造６４２から画像１５の最初のサブストリームを復号化開始すべき前に進行するサブストリームの数を決定するように構成される。この場合、ベースレイヤ画像１２の第１のサブストリームを完全に復号化することは、必要な基礎をエンハンスメントレイヤ画像１５の第１のサブストリームのいかなるインターレイヤ予測に提供するために十分であるので、長期シンタックス要素構造６４２は、１であるべきインターレイヤオフセットを示す。

図１７ｃは、時間整列配置された画像１２および１５の一対を示し、両方ともスライスに再分割される。また、それぞれ、スライス順序または復号化順序は、画像１２のスライスの間で、そして、画像１５のスライスの間でそれぞれ定義され、そして、順序６５２も６５４も上から下まで進行する。図１７ｃの手本としてのケースにおいて、一方の画像１２と他方の画像１５の範囲内のスライス間の境界は、局所的に、各々に対応する。従って、ベースレイヤ画像１２からエンハンスメントレイヤ画像１５までインターレイヤ予測によって導かれた「ぼけ」に依存して、長期シンタックス要素構造６４２は、１と同等であるべきか２と同等であるべきインターレイヤオフセットを示す。特に、画像１５のインターレイヤ予測された部分のための画像１２の対応する同じ位置に配置された参照部の引伸しのために、デコーダ６４０がエンハンスメントレイヤ画像１５の第１のスライスを復号化するのを開始することが可能な前に、スライス順序における画像１２の最初の２枚のスライスのため、例えば視差補償ベクトルのために、または、図９に関して、例えば上記で述べたようにアップサンプリング補間フィルタカーネルにより、スライス順序６５２における画像１２の最初の２つのスライスは、デコーダ６４０がエンハンスメントレイヤ画像１５の最初の１つを復号化開始し得る前に、既に復号化しなければならないかもしれない。しかしながら、インターレイヤ予測のこの種のぼけオプションは、選択をオフされるか、あるいは、適用されない。その理由は、例えば、画像１２および１５の間のサンプリング解像度が互いに等しく、画像１２および１５は、視差補償が生じないように、共に同じビューに関連する場合、ベースレイヤ画像１２が完全に復号化されるとすぐに、デコーダ６４０がエンハンスメントレイヤ画像１５の第１のスライスを復号化開始するように、長期シンタックス要素構造がエンコーダ６４０により１に等しくなるようにセットされるであろう。

従って、すなわち全部の所定期間６０８に当てはまり、かつ、時間整列配置された画像１５の第１の空間セグメントを始める前にすでに復号化されるべきベースレイヤ画像１２の空間セグメントの数に関連するインターレイヤオフセットについて長期シンタックス要素の構造を基礎としてデコーダに知らせることにより、図１６から１７ｃまでに対する説明は、長期シンタックス要素構造６４２の使用が、エンコーダが時間整列配置された画像１２および１５も任意に並列復号化することを予定する際のデコーダをサポートするのを助けることを明らかにした。ビデオデコーダ６４０が、短期シンタックス要素６０２の検査／評価に基づいてさえ長期シンタックス要素６４２により示されたインターレイヤオフセットを決定し得て、かつ、潜在的オプションに関する更なるシンタックス要素は、ベースレイヤからエンハンスメントレイヤまでインターレイヤ予測におけるまさに概説されたぶれをオンあるいはオフに切り替えるこれらのオプションとともにインターレイヤ予測に関連する点に注意すべきである。しかしながら、ビデオデコーダ６４０は、長期シンタックス要素構造６４２によって設けられているので、同じ情報を導出するためにシンタックス要素の多数を検査しなければならない、そして、ビデオデコーダ６４０は、単に長い所定期間６０８よりむしろ前もって短期基礎上の同じ情報を導出し得るのみである。

以下において、態様１および２と同様に、遅延表示態様をＨＥＶＣにもたらし得る方法が、以下に記載される。

まず第１に、図１８に関して、ＷＰＰがどのようにＨＥＶＣにおいて現在実現されているかが、記述される。すなわち、この記述は、前記実施例のいずれかのＷＰＰ処理の任意の実現の基礎も形成する。

ベースレイヤにおいて、波面並列処理は、符号化ツリーブロック（ＣＴＢ）行の並列処理を可能にする。予測依存性は、ＣＴＢ行全体にわたって壊れていない。エントロピー符号化に関して、図１８に見られるように、ＷＰＰは、それぞれの上側ＣＴＢ行における左上ＣＴＢへのＣＡＢＡＣ依存性を変える。次の行におけるＣＴＢのエントロピー符号化は、一旦対応する右上ＣＴＢのエントロピー復号化が終了すれば、開始し得る。

エンハンスメントレイヤにおいて、対応する画像エリアを含んでいるＣＴＢが完全に復号化され利用可能となるのと同時に、ＣＴＢの復号化が、開始し得る。

図１６の復号化遅延またオフセット表示概念は、並列化のためのタイル、ＷＰＰまたはスライスを使用する、レイヤ状のビットストリームのためのデコーダの初期化および動作を容易にする信号伝送において終わり得る。

空間スケーラビリティの使用が、ベースレイヤＣＴＢが対応する画像エリアを覆うベースレイヤＣＴＢを一度だけ開始し得たとき、エンハンスメントレイヤＣＴＢの復号化が、利用し得る。空間スケーラビリティを有するレイヤをなしたビットストリームを有するＷＰＰを並列化するときに、レイヤは画像サイズに関して異なり得る、例えば、レイヤ間の１．５および２の画像サイズスケーリング係数ファクタは、ＨＥＶＣ［１］のスケーラブル拡張の提案の発行された要求において述べられており、そして、さらに最大ＣＴＢサイズ、例えば１６、３２および６４の画像サンプルは、ＨＥＶＣのメインプロファイルにおいてサポートされる。良質なスケーラビリティのために、画像サイズスケーリングファクタは、通常一定である、しかし、最大ＣＴＢサイズは、レイヤ間で依然異なり得る。

最大ＣＴＢサイズおよびレイヤの画像サイズスケーリング係数間の比率は、レイヤ復号化遅延に影響する、すなわち、エンハンスメントレイヤの第１のＣＴＢ行前のベースレイヤＣＴＢ行は、ベースレイヤＣＴＢ行の復号化に関して復号化され得る。図１９は、ＣＴＢ行に関して画像サイズスケーリング係数およびＣＴＢサイズおよび導入されたレイヤ復号化遅延のための典型的なパラメータ値で両方のレイヤにおける対応する画像エリアを覆うＣＴＢの比率を報告する。

レイヤ間の良質なスケーラビリティのために、それぞれのレイヤにおける最大ＣＴＢサイズが依然異なり得て、レイヤ復号化遅延に影響を与え得る一方、レイヤ間の画像サイズスケーリング係数は、通常１に等しい。

シンタックス要素構造６４２は、ＷＰＰ処理が空間エンハンスメントレイヤ全体に並列化されるときに、従属する空間あるいは良質なエンハンスメントレイヤのための遅延を復号化しているレイヤ復号化遅延を示すビットストリームにデコーダヒントを提供する。

実施例は、遅延を復号化している信号伝送されたレイヤを決定するために、それぞれのレイヤ間に画像サイズスケーリング係数および最大ＣＴＢサイズスケーリング係数を使用する。

独立したベースおよび従属するエンハンスメントレイヤビットストリーム間のスケーラビリティのタイプに依存して、レイヤ復号化遅延に影響する要因は、異なる。

マルチビュースケーラビリティにおいて、レイヤは、カメラビューを表す、そして、インターレイヤ予測の機構は、さまざまな角度からのカメラビューの間に予測を実行するために使用される。予測は、カメラ設置の範囲内でカメラの異なる位置を補償するために、動き補償の機構を使用する。この場合、レイヤ復号化遅延は、空間もしくは良質なスケーラビリティのケースと比較して、垂直方向の最大であるか実際の動きベクトルによって、更に制限される。

シンタックス要素構造６４２は、ＷＰＰ処理が複数のカメラビュー全体にわたって並列化されるときに、従属するカメラビューのためのレイヤ復号化遅延を示すビットストリームにおけるデコーダヒントを記述する。

実施例は、信号伝送されたレイヤ復号化遅延を決定するために、それぞれのレイヤの間に、垂直方向に画像サイズスケーリング係数、最大ＣＴＢサイズスケーリング係数および最大動きベクトル長を使用する。

実施例は、ＷＰＰがエンハンスメントレイヤに関連したＳＰＳのＶＵＩシンタックスにおいてまたはＶＰＳ拡張シンタックスの範囲内での編集において使用されたとき、空間セグメント、すなわちＣＴＢの行、に関する空間、品質およびマルチビュースケーラビリティに対するレイヤ復号化遅延を示す。

タイルおよびスライス
タイルまたはスライスのような他の分割技術を有する並列処理は、画像の空間セグメント、すなわちタイルまたはスライス、への分割に基づく復号化遅延を示すビットストリームの範囲内で、ヒントから利益になり得る。ベースレイヤ（例えば再構成された画像データ）の情報は、エンハンスメントレイヤ復号化プロセスのために必要であり得る。

シンタックス要素構造６４２は、デコーダヒントをタイルおよび／またはスライスのためのレイヤ復号化遅延を示すビットストリームに記述する。

本発明の可能な実施例は、符号化ビデオシーケンスにおいて使用される並列化テクニックのタイプに依存する導入されたレイヤ処理遅延を表すユニットとして、空間セグメントを使用する。

図２０におけるシンタックスは、並列化ツールＷＰＰ、タイルおよびスライスのためのエンハンスメントレイヤＳＰＳのＶＵＩパラメータにおけるｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔｓ＿ｄｅｌａｙ（シンタックス要素構造６４２のための実施例）の表示のための典型的な実施例を与える。

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、空間セグメントに関して対応するベースレイヤに関する符号化依存によって導かれた現在のレイヤの復号化遅延を記述する。

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙの値に依存して、以下が、適用される：

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙが０に等しい場合、レイヤの復号化間の最小遅延に対する制限は、示されない。

さもなければ（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、０に等しくない）、以下の状況のうちのちょうど１つが真であることは、ビットストリーム一致の要件である：
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルもＷＰＰも、ビデオシーケンスにおいて使用されない）に等しい、そして、ビットストリーム順序におけるベースレイヤの第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙスライスが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第１のスライスの復号化プロセスのためのすべてのベースレイヤ資源が、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルが、ビデオシーケンスにおいて使用される）に等しい、そして、同じ画像エリアを覆う第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙタイルが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第１のタイルの復号化プロセスのためのすべてのベースレイヤ資源が、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１（すなわち、ＷＰＰが、符号化ビデオシーケンスにおいて使用される）に等しい、そして、ベースレイヤの第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙＣＴＢ行が完了されるときに、現在のレイヤの第１のＣＴＢ行の復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。

〔４〕において報告され、かつ図２１に示すように拡張されたように、他の典型的実施例は、ＶＰＳ拡張シンタックスにおけるｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔｓ＿ｄｅｌａｙの表示である。

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、空間セグメントに関して対応するベースレイヤに関して符号化依存によって導かれたレイヤ［ｉ］の復号化遅延を記述する。

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙの値に依存して、以下が、適用される：ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙが、０に等しい場合、レイヤの復号化間の最小遅延に関する制限は、示されない。

さもなければ（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、０に等しくない）、以下の状況のうちの１つが正確に真であることは、ビットストリーム一致の要件である：
・符号化ビデオシーケンスの間で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しく、かつ、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルもＷＰＰも、ビデオシーケンスにおいて使用されない）に等しい、そして、ビットストリーム順序におけるベースレイヤの第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙスライスが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第１のスライスの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの間で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しく、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルが、ビデオシーケンスにおいて使用される）に等しい、そして、同じ画像エリアを覆う第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙタイルが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第１のタイルの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しく、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１（すなわち、ＷＰＰが、符号化ビデオシーケンスにおいて使用される）に等しい、そして、ベースレイヤの第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙＣＴＢ行が完了されるときに、現在のレイヤにおける第１のＣＴＢ行の復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。

並列処理概念、例えばタイルおよび／またはＷＰＰ概念、を可能にするために、エントロピー符号化／復号化のためのコンテキスト導出と同様に予測モード上へ課される制限と同様にエンコーダおよびデコーダによってサポートされたさまざまな予測モードは、上記に記載されていた。エンコーダおよびデコーダがブロック基礎に作用し得ることは、上述されてもいた。例えば、上記説明された予測モードは、ブロック基礎、すなわち画像自体より粒状に微細、に選択される。本出願の他の態様を記述し続ける前に、スライス、タイル、ＷＰＰサブストリームおよびちょうど言及されたブロックの関係が、説明される。

図３２は、例えばレイヤ１２等のレイヤ０の画像、または例えば画像１５等のレイヤ１の画像、を示す。画像は、ブロック９０の配列に、定期的に再分割される。しばしば、これらブロック９０は、最大符号化ブロック（ＬＣＢ）、最大符号化ユニット（ＬＣＵ）、符号化ツリーブロック（ＣＴＢ）等とも呼ばれる。画像のブロック９０への再分割は、上述の予測および残差符号化が実行される一種のベースまたは最も粗い粒状を形成し得る、そして、個々にレイヤ０およびレイヤ１のために、この最も粗い粒状、すなわちブロック９０の次元、は、エンコーダにより示されセットされ得る。例えば、四分木のようなマルチツリー再分割が、各ブロック９０を予測ブロック、残差ブロックおよび／または符号化ブロックにそれぞれ再分割するために、データストリーム内で使用され示され得る。特に、符号化ブロックは、ブロック９０の再分割している再帰的なマルチツリーのリーフブロックでもよい、そして、いくつかの予測に関連した決定が符号化ブロック、例えば予測モードの粒度で示され得る。そして、例えば、一時的なインター予測の場合における動きベクトルのような予測パラメータおよび例えばインターレイヤ予測の場合における視差ベクトルの粒度が符号化される粒度での予測ブロック、および、予測残差が符号化される粒度での残差ブロックは、符号化ブロックの分割された再帰的マルチツリー再分割のリーフブロックである。

ラスタースキャン符号化／復号化順序９２は、ブロック９０の間で定義され得る。符号化／復号化順序９２は、空間予測の目的のために隣接した部分の可能性を制限する：単に符号化／復号化順序９２による画像の部分が、現在の部分、例えばブロック９０またはそれより少数のブロック、に先行する。現在予測されるべきシンタックス要素が関連するのは、現在の画像の範囲内で空間予測に使用される。各レイヤの範囲内で、符号化／復号化順序９２は、それから、必ずしも画像の時間再生順序に従うというわけではない画像符号化／復号化順序のそれぞれのレイヤの次の画像のブロックを横断するのを続行するために、画像のすべてのブロック９０を横断する。個々のブロック９０内に、符号化／復号化順序９２は、より小さいブロック、例えば符号化ブロック、の間の走査中に改善される。

ちょうど概説されたブロック９０およびより小さいブロックに関して、各画像は、ちょうど言及された符号化／復号化順序９２に沿って、一つ以上のスライスに更に再分割される。従って、図３２に手本として示されるスライス９４ａおよび９４ｂは、それぞれの画像を間断なく覆う。一つの画像の間の連続的なスライス９４ａおよび９４ｂ間の境界またはインターフェース９６は、隣接ブロック９０の境界に合わせられ得るかまたは合わせられ得ない。より正確に言えば、そして、図３２の右側で示せば、１つの画像の範囲内の連続的なスライス９４ａおよび９４ｂは、符号化ブロック、すなわちブロック９０のうちの１つの再分割のリーフブロック、のようなより小さいブロックの境界で、互いに接し得る。

画像のスライス９４ａおよび９４ｂは、画像が符号化されるデータストリームの部分がパケット、すなわちＮＡＬユニット、にパケット化され得る最小ユニットを形成し得る。スライスの更に可能な特性、すなわち、スライス境界全体の予測およびエントロピーコンテキストの決定に関するスライス上への制限は、例えば、上述されていた。この種の制限を有するスライスは、「通常の」スライスと呼ばれ得る。以下で更に詳細に概説されるように、通常のスライスの他に、「従属するスライス」が同様に存在し得る。

タイル分割概念が画像のために使用される場合、ブロック９０の配列内で定義された符号化／復号化順序９２は、変化し得る。これは、画像が、４つのタイル８２ａ〜８２ｄに分割されることが手本として示される図３３に示される。図３３に示されるように、タイルは、ブロック９０を単位とする画像の規則的な再分割として、それ自身定義される。すなわち、各タイル８２ａ〜８２ｄは、タイルの行ごとに個々にセットされるｎおよびタイルの各列に個々にセットされるｍを有するｎ×ｍブロック９０の配列から構成される。符号化／復号化順序９２の後に、第１のタイルにおけるブロック９０は、次のタイル８２ｂその他へ進む前に最初にラスタースキャン順序において走査され、そこにおいて、タイル８２ａ〜８２ｄは、ラスタースキャン順序においてそれ自身走査される。

ＷＰＰストリーム分割概念によれば、画像は、符号化／復号化順序９２に沿って、ブロック９０の一つ以上の行を単位にして、ＷＰＰサブストリーム９８ａ〜９８ｄに再分割される。各ＷＰＰサブストリームは、例えば、図３４に示されたように、ブロック９０の１つの完全な行を覆い得る。

タイル概念およびＷＰＰサブストリーム概念は、しかしながら、混合され得る。その場合、各ＷＰＰサブストリームは、例えば各タイルの範囲内のブロック９０の１つの行を覆う。

画像のスライス分割でさえ、タイル分割および／またはＷＰＰサブストリーム分割で共用され得る。タイル、一つまたはそれ以上のスライスの各々に関して、画像が再分割されて１つの完全なタイルまたは１つ以上の完全なタイルまたは符号化／復号化順序９２に沿った単に１つのタイルだけのサブ部分がそれぞれ正確に構成され得る。スライスは、ＷＰＰサブストリーム９８ａ〜９８ｄを形成するために使用され得る。この目的のために、パケット化のために最小ユニットを形成しているスライスは、一方では通常のスライス、他方では従属するスライスから構成され得る：一方、通常のスライスが予測およびエントロピーコンテキスト派生上へ上述の制限を課すと共に、従属するスライスは、この種の制限を課さない。符号化／復号化順序９２が実質的に行−方向を外れて示す画像の境界で始まる従属するスライスは、ブロック９０の直前の行におけるエントロピー復号化ブロック９０から生じるエントロピーコンテキストを採用する、そして、別の箇所で始まっている従属するスライスは、その端まで直前のスライスをエントロピー符号化／復号化することから生じるエントロピー符号化コンテキストを採用し得る。この測定によって、各ＷＰＰサブストリーム９８ａ〜９８ｄは、一つ以上の従属するスライスから構成され得る。

すなわち、ブロック９０の間で定義された符号化／復号化順序９２は、それぞれの画像の第１の側面、ここでは手本として、左側、から反対側、ここでは手本として右側に直線的に進み、それから、下方への／底方向へブロック９０の次の行に、進む。利用し得る、すなわち現在の画像のすでに符号化／復号化された部分は、従って、現在符号化／復号化された部分、例えば現行ブロック９０、の主に左に、そして、主に上端に位置する。予測の混乱およびタイル境界全体のエントロピーコンテキスト派生のため、１つの画像のタイルは、並列に処理され得る。１つの画像のタイルの符号化／復号化は、並行して開始さえし得る。同上がタイル境界を横切り得る場合、制限は、前述のインループフィルタリングから生じる。次に、ＷＰＰサブストリームの符号化／復号化を始めることは、上端から下端までスタガー態様で実行される。連続的なＷＰＰサブストリーム間のイントラピクチャ遅延は、ブロック９０、２つのブロック９０において測定される。

しかしながら、画像１２および１５、すなわち異なるレイヤの瞬間、の符号化／復号化さえ並列化することは、好ましい。明らかに、従属するレイヤの画像１５を符号化／復号化することは、すでに利用可能なベースレイヤの「空間的に、一致している」部分が存在することを保証するために、ベースレイヤの符号化／復号化と関連して遅延しなければならない。これらの考えは、個々に画像１２および１５のいずれの範囲内でも符号化／復号化のいかなる並列化も使用しない場合には有効でさえある。全部の画像１２および１５をカバーするために１つのスライスを使用する場合でさえ、それぞれ、タイルおよびＷＰＰサブストリーム処理を使用しないことで、画像１２および１５の符号化／復号化は、並列化され得る。次に記述した信号伝送、すなわち態様６、は、タイルまたはＷＰＰ処理がレイヤの画像のいずれかのためにどこで、または、かどうかにかかわりなく、この種の場合でさえレイヤ間のこの種の復号化／符号化遅延さえ表現する可能性がある。

連続的なレイヤの符号化の間に最小限の符号化遅延に関する前記説明から明白になったように、デコーダは、短期シンタックス要素に基づき最小限の復号化遅延を決定し得ることが明白になった。しかしながら、上述のように長期シンタックス要素を使用する場合には、所定期間の間に対しより前のこのインターレイヤ時間遅延を示すために、デコーダは、設けられている保証を使用して将来を計画し得て、ビットストリーム４０の並列復号化の範囲内で、作業負荷配分をより容易に実行し得る。

次に記述された本出願の態様、すなわち本出願の第６の態様は、任意のインターレイヤオフセットの明確な信号伝送における態様３に何らかの形で関連がある。しかしながら、本出願の第６の態様に関して、インターレイヤオフセットを明確に信号伝送するシンタックス要素構造は、インターレイヤオフセットがさもなければ導き出せる短期シンタックス要素と関連して長期基礎に示される必要はない。むしろ、本出願の第６の態様は、他の発見を利用する：図１７ａから１７ｃを述べるときに明らかになったように、ベースおよびエンハンスメントレイヤ画像が両方ともそれらの間で定義されたラスタースキャン復号化順序を有するブロックに再分割される場合には、そのとき、ベースおよびエンハンスメントレイヤ間のインターレイヤオフセットは、ベースレイヤブロックを単位にしてインターレイヤオフセットを測定する測定によって効率的に明確に示され得る。更に下記で記述されている態様と関連して、インターレイヤオフセットが明確に示された単位で、ベースレイヤブロックは、空間セグメントに制限されない。むしろ、他の符号化ブロックが、この目的のために使用し得る。従って、図３４に関して本出願の第６の態様に関して実施例を記載するときに、図１６から１７ｃまでに関して使用された参照符号が主に共用され、そして、後の図面に関して上記で提出された説明は、不必要な繰り返しを避けるために更に下記で記載された実施例に等しく適用される。これを越えて、これらの図が一方では符号化ブロックおよび他方では空間セグメントの間に可能な共存を形成するので、図３２および３３の説明が参照される。

このように、図３５は、シーンが第１のレイヤの部分から第２のレイヤの共通位置までインターレイヤ予測を使用してレイヤの階層中に符号化されたマルチレイヤビデオデータストリーム４０を受信するように構成されたビデオデコーダ７２０を示す。上記図面に類似し、代表例としてレイヤ１へ並置されたレイヤ０を手本として示す並置のレイヤ０を示している。両方のレイヤの２つの時間整列配置された画像１２および１５は、図３５において手本として示される。ベースレイヤ０の画像１２は、第１のブロック７２２の配列に再分割され、そして、エンハンスメントレイヤ１の画像は、第２のブロック７２４の配列に再分割される。ラスタースキャン復号化順序７２６は、ブロック７２２の中で定義され、そして、同様に、ラスタースキャン復号化順序７２８は、ブロック７２４の中で定義される。

ビデオデータストリーム４０は、順次第１および第２のブロック７２２および７２４の横断の間にインターレイヤオフセットを有する時間重畳態様で、ベースレイヤブロック７２２を単位にして測定された第１および第２のブロック７２２および７２４を連続的に横断することによって並列復号化された画像１２および１５間で、インターレイヤオフセットを示すシンタックス要素構造を具備する。ビデオデコーダ７２０は、このシンタックス要素構造７３０に応答するように構成される。特に、ビデオデコーダは、後者からのインターレイヤオフセットを決定する。

図１６の実施例と一致して、シンタックス要素構造７３０は、それぞれ、任意のシンタックス要素信号画像１２および１５のそれぞれブロック７２２および７２４への再分割を示す短期時間間隔より長く所定期間の間の時間整列配置された画像１２および１５の並列復号化を実行するための成功に対する保証としてインターレイヤオフセットを示し得る。これは、しかしながら、強制的でない。むしろ、シンタックス要素構造７３０としてインターレイヤオフセットの明確な信号伝送は、データストリーム４０において異なる範囲で、例えばベースおよびエンハンスメント画像１２および１５の各時間整列配置された対に対して、例えば、すなわち、サイズおよびブロック７２２および７２４への再分割に関する信号伝送として同じ間隔で、実現され得る。

上記実施例との更なる合意として、デコーダ７２０は、それぞれ、並列に復号化する画像１２および１５の第１のブロック７２２の横断と関連して第２のブロック７２４の横断を開始する際のオフセットのための測定としてシンタックス要素構造７３０として明確に示されたインターレイヤオフセットを使用し得る。換言すれば、ビデオデコーダ７２０は、シンタックス要素構造７３０からカウント値を導出するように構成され得て、シンタックス要素構造７３０により明確に示された最小カウントに達しているすでに復号化されたブロック７２２のカウントのみの後、復号化順序７２８に沿ってエンハンスメントレイヤ画像１５のブロック７２４の順序を復号化することを開始することを可能にすると共に、ラスタースキャン復号化順序７２６に沿ってベースレイヤ画像１２の既に復号化されたブロック７２２をカウントする。従って、ビデオデコーダ７２０は、ビデオデータストリーム４０のいかなる非常に複雑なおよび分布された部分を検査する必要はない。そして、それはさもなければビデオデコーダ７２０が、一方では開始している復号化ブロック７２２と他方ではブロック７２４との間に実際の最小限のインターレイヤオフセットを計算可能にする。

しかしながら、興味深いことに、図３５の実施例によれば、ブロック７２２および７２４は、空間セグメントが特にいかなる並列処理に従属するために費やされていることを必ずしも表すというわけではない。むしろ、ブロック７２２および７２４は、それぞれ、画像１２および１５の内容がビデオデータストリーム４０に符号化されることを単位とした通常の符号化ブロックであり得る。例えば、ブロック７２２および７２４は、画像１２および１５が規則正しく、すなわち行および列に、再分割されるツリールートブロックであり得る。そして、ツリールートブロックは、そのとき、図３２に関して上述したように、再帰的マルチツリー態様にさらに独立に再分割される。例えば、予測モードは、−空間、時間および図１５に関して選択されたインターレイヤ予測−のいずれを単位として、画像１２および１５の符号化ブロックへの再分割を表すツリールートブロックのリーフブロックを結果として生じることに伴い、インターレイヤ予測が、−ビデオデータストリーム４０中に示される。

更に詳細に図３５の実施例を説明するために、図３６が参照される。図３６に示すように、ラスタースキャン復号化順序７２６における画像１２の第１のブロック７２２からカウントを開始することで、ビデオデコーダ７２０は、ベースレイヤ画像１２のすでに復号化されたブロック７２２の個数を計数するために、カウンタ７３２を使用し得る。デコーダ７２０のコンパレータ７３４は、カウンタ７３２によってこの着実に増加しているカウント出力を、ビデオデータストリーム４０から得られるものとしてのシンタックス要素構造７３０の明確に示された値と比較する。シンタックス要素構造７３０によって示される値との所定の関係を満たすカウントの場合には、例えば、カウンタ７３２のカウントがシンタックス要素構造７３０によって示される値に達するかまたは等しいとすぐに、コンパレータは、活性化するかあるいはエンハンスメントレイヤ画像１５の復号化の開始を生じる、すなわち開始すべきラスタースキャン復号化順序７２８におけるエンハンスメントレイヤ画像１５の第１のブロック７２４の復号化を生じる。

以下で詳しく述べるように、シンタックス要素構造７３０のためのシンタックスのための明確な実施例に関して、図３５のシンタックス要素構造を、シンタックス要素構造および図１６のその目的と統一することは、可能である。これは、以下を意味する。シンタックス要素構造７３０は、一組の可能な値、すなわちあり得る値のセット、を有し得る。図１６に関して手本として言及されるように、あり得る値の明確でないインターレイヤオフセットからの値は、ビデオデコーダ７２０にシンタックス要素構造７３０の値を無視させ、かつ画像１２および１５の並列復号化を実行させず、あるいは短期シンタックス要素６０２に基づき任意のインターレイヤオフセットを決定させ得る。可能な値の第２のセットから値を仮定しているシンタックス要素構造７３０の場合には、これはビデオデコーダ７２０にすでに、例えば、図３６に関して概説される動作を実行させる。そして、それによれば、シンタックス要素構造７３０の値は、ベースレイヤブロック７２２を単位にしてインターレイヤオフセットを明確に示す。しかしながら、シンタックス要素構造７３０の可能な値の他のサブセットがあり得る。そして、それはシンタックス要素構造７３０により仮定されるときに、図１６に関してビデオデコーダ７２０に上述したように行動させる：ブロック７２２および７２４の整数のものからそれぞれ構成され得る、しかし必ずしも構成され得ない、空間セグメントを単位としてインターレイヤオフセットを測定するように後者を解釈することによりシンタックス要素構造７３０の値に基づきベースレイヤ画像１２のおよびエンハンスメントレイヤ画像１５の復号化の間のインターレイヤオフセットを決定する。

図３５の実施例を図１６のそれと結合するちょうど言及された可能性は、図３７に関して示される。図３７に示すように、ビデオデコーダは、同上が一組の可能な値７４２から第１のサブセット７３６、第２のサブセット７３８、または第３のサブセット７４０の値を有するかどうかを決定するために、シンタックス要素構造７３０を検査し得る。調査またはチェックの結果に応じて、デコーダ７２０も、シンタックス要素構造７３０から保証を引き出さず、かつ、シンタックス要素構造７３０からインターレイヤオフセットに関する明確な信号伝送を導出せず、すなわち空間セグメントまたはブロックを単位としてシンタックス要素構造７３０からインターレイヤオフセットの導出を実行する。第２のサブセット７３８の場合には、導出／保証は起こらない、空間セグメントを単位にしたインターレイヤオフセットの導出は、サブセット７３６の場合に起こる、そして、ブロックを単位にしたインターレイヤオフセットの導出は、第３のサブセット７４０から値を仮定したシンタックス要素７３０の場合には起こる。更に下記で概説される特定のシンタックス実施例において、シンタックス要素構造は、２つのフラグ、すなわち、ｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇおよびｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）を含み、ｃｔｐ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝０およびｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０は、サブセット７３６のケースに対応し、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０は、第２のサブセット７３８に対応し、かつ、ｃｔｐ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝１およびｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０は、第３のサブセット７４０に対応する。

最後に、図３８に関して、デコーダ７２０が、シンタックス要素構造７３０により示された任意のインターレイヤオフセットを解釈するよう構成され得ることが示される。それに従うとき、エンハンスメントレイヤ画像１５の第１のブロックまたは空間セグメントの復号化開始に関するインターレイヤオフセットではなく、連続するインターレイヤオフセットであり、結果として、画像１２および１５の矛盾なき並列復号化がそれぞれ生じる。図３８に示すように、カウンタ７３２は、ベースレイヤ画像１２のすでに復号化されたブロック７２２の数を依然計数し、そこにおいて、付加されたカウンタ７４４は復号化順序７２８に沿ったエンハンスメントレイヤ画像１５の既に復号化されたブロック７２４を同様にカウントし、そこにおいて、減算器７４６が、両方のカウント、すなわち、ｓおよびｔ−１、の差を形成する、すなわち、ｓ−ｔ＋１を計算する。この差の値は、シンタックス要素構造７３０に由来するインターレイヤオフセット値を、コンパレータ７３４によって比較される。そして、両方の値、すなわち導出されたインターレイヤオフセットおよびカウントの差の値は、所定の関係、例えば差の値が等しいかまたは導出されたインターレイヤオフセットを上回っている、があるとすぐに、エンハンスメントレイヤブロック７２４の間の復号化順序７２８におけるブロックｔを復号化することが開始される。この測定によって、一方ではベースレイヤ画像１２のブロック７２２および他方ではハンスメントレイヤ画像１５のブロック７２４の間を復号化する原因の間に連続した調査が、導入される。

図３８に従って、連続調査が空間セグメントにも適用され得ることは、明らかである。より一般的にいえば、図３８および３６の説明は、同様に空間セグメント上に直ちに移し得る、そして、この記載もシンタックス要素構造６４２が、図３６および３８において７３０で示される関連したシンタックス要素構造として機能し得る図１６の実施例に適用される。換言すれば、少なくとも、空間セグメントとしてタイルを使用するときに、符号化ブロックに関して述べられる図３６および図３８の概念がタイルの横断およびそれらの復号化に容易に移し得るように、それらの間で定義されるラスタースキャン復号化順序も存在する。

それに対して記載されている第６の態様および実施例を手短に要約すれば、シンタックス要素構造７３０は、各々と関連してベースおよびエンハンスメントレイヤ画像を並列復号化することを制御するためにデコーダに明確なヒントを提供するために、ビデオエンコーダによってビットストリームに挿入され得る。シンタックス要素構造により明確に示されたインターレイヤオフセットは、活性化あるいは不活性化され得る。活性化される場合、この種のブロックのユニットおよび空間セグメントのユニットの示された一つにおいて、表示は、ＣＴＢのようなブロックを単位にし得る、または、より正確な信号伝送を経由してなし得る。一方ではベースレイヤブロックおよび他方ではエンハンスメントレイヤブロックの間のラスタースキャン順序の使用により、双方は、例えば、上端から下端まで１行ずつ各画像１２／１５の左上角から右下角まで行方向に進み、インターレイヤオフセットは、エンハンスメントレイヤ画像１５の第１のブロックの復号化に着手／開始するための、すなわちエンハンスメントレイヤ画像１５の各ブロックを復号化するトリガを決定するための「トリガ」としてまたは一方ではベースレイヤ画像１２の現在復号化されているブロックおよび他方ではエンハンスメントレイヤ画像１５の現在復号化されているブロック、間の連続的な「安全距離」として単に解釈されることにより、明確に示された。第６の態様に関して提出された説明は、空間セグメントに関するタイルの説明、信号伝送されたインターレイヤオフセットに関する準拠の解釈およびチェックに関する限り、第３の態様の説明および実施例に移動され得る、図３６および３８の実施例は、使用され得る。すなわち、ラスタースキャンタイル復号化順序に沿うベースおよびエンハンスメントレイヤ画像の範囲内で復号化されたタイルの横断は、図３６および３８の説明に関してある意味で制御され得る。

このように、「遅延」空間セグメントのための測定が使用され得るように、すなわち、遅延は、空間セグメント（タイル、スライスまたはＷＰＰのためのＣＴＢ行）を単位にして表現され得る、または、遅延／オフセットは、ブロック９０を単位にして測定され得る。

高効率映像符号化（ＨＥＶＣ）規格は、以下のように第６の態様に合致するように拡張し得る。特に、参照データを利用し得る場合、個々のレイヤ（またはビュー）の並列復号化が可能である。ベースレイヤ符号化ツリーブロック（ＣＴＢ）の復号化および対応する従属エンハンスメントレイヤＣＴＢの復号化の間の最小遅延（特にレイヤ復号化遅延）は、タイル、波面またはスライスまたは動き補償ベクトルが、適用し得る（例えばステレオスコピックまたはマルチビュービデオ符号化において）ように並列化ツールの保証を通じて決定される。

図２０は、エンハンスメントレイヤシーケンスパラメータセットシンタックスにより実現されたレイヤ復号化遅延表示およびシンタックス要素ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙにより実現されたセマンティックスを示した。

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、空間セグメントに関して対応するベースレイヤに関する符号化依存によって導かれた現在のレイヤの復号化遅延を記述した。

多くの垂直および水平ＣＴＢが使用されることに基づいて潜在的並列化技術に関係なく独立関係ベースレイヤおよび従属エンハンスメントレイヤとの間にレイヤ復号化遅延を任意に表すことを可能にするＨＥＶＣ高水準シンタックスにおける機構は、以下の通り獲得され得る。

フラグまたはインデックス（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ）は、レイヤ復号化遅延（第２のシンタックス要素で示されたように）が、符号化画像における特定のＣＴＢアドレスとして表現されることを示すために使用し得る。

ラスタースキャン順序におけるＣＴＢアドレスは、図３９からおよび以下に従って見られるように遅延を表すのに使用される画像の範囲内で水平垂直位置を明確に定義する。

ＣＴＢｃｏｏｒｄｉｎａｔｅｓ = (ＣＴＢａｄｄｒｅｓｓ％ＰｉｃＷｉｄｔｈｌｎＣＴＢｓ, ＣＴＢａｄｄｒｅｓｓ / ＰｉｃＷｉｄｔｈｌｎＣＴＢｓ)

ＰｉｃＷｉｄｔｈＩｎＣＴＢｓは、ＣＴＢを単位にして画像の幅を記述する。

図３９は、以下を示す。画像の範囲内のＣＴＢアドレス、例えば７、は、水平ＣＴＢ列および垂直ＣＴＢ行、例えばタプル（２，１）、を定義する。

フラグがイネーブルにされる場合、現在従属するレイヤにおけるＣＴＢを復号化するときに、他のシンタックス要素（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙと比較）の値は、相対的なベースレイヤ画像の同じ位置に配置されたＣＴＢのＣＴＢアドレスへのオフセットとして解釈されるべきである。

図４０において示され、以下の説明の間詳述されるように、同じ位置に配置されたＣＴＢは、２つのそれぞれのレイヤにおけるＣＴＢのサイズおよび２つのそれぞれのレイヤの画像の幅に従って計算され得る。

図４０は、画像のスケーリングにかかわりなく、２つのそれぞれのベースおよびエンハンスメントレイヤにおけるＣＴＢサイズおよび画像サイズのさまざまなセットアップを示す、左から右へ３つの実施例を含む。ベースレイヤ画像において太線で描かれた箱は、エンハンスメントレイヤＣＴＢのサイズにおける画像エリアおよびそれぞれのベースレイヤのＣＴＢ配置における同じ位置に配置された画像エリアをマークする。

レイヤ復号化遅延表示に基づくこの種の任意のＣＴＢの実施例は、図４１におけるシンタックス要素ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙによって、エンハンスメントレイヤシーケンスパラメーターセットシンタックスおよびセマンティックスにおいて与えられる。

１に等しいｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙがＣＴＢを単位にして与えられることを示す遅延を示す。ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙが、ＣＴＢを単位にして与えられないことを示す。ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、空間セグメントに関して対応するベースレイヤに関して符号化依存によって導かれる現在のレイヤの復号化遅延を記述する。ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙの値に応じて、以下が、適用される：ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙが０に等しい場合、レイヤの復号化間の最小遅延に関する制限は、示されない。さもなければ、（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙが、０に等しくない）および、ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇが１に等しい場合、以下の条件が真であることは、ビットストリーム一致の要件である：
・ＣｔｂＳｉｚｅＹ_A、ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ_AおよびｃｔｂＡｄｄｒＲｓＡは、ＣｔｂＳｉｚｅＹおよびベースレイヤＡのＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹおよびラスタースキャン順序におけるベースレイヤＡにおけるＣｔｂのＣｔｂＡｄｄｒｅｓｓであり、ＣｔｂＳｉｚｅＹ_B、ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ_BおよびｃｔｂＡｄｄｒＲｓ_Bは、ＣｔｂＳｉｚｅＹおよび従属レイヤ／ビューＢのＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹおよびラスタースキャン順序における従属レイヤＢのＣｔｂのＣｔｂＡｄｄｒｅｓｓであり、かつ、ＣｔｂＳｃａｌｉｎｇＦａｃｔｏｒ_BA、ＣｔｂＲｏｗ_BA（ｃｔｂＡｄｄｒＲｓＢ）およびＣｔｂＣｏｌ_BA（ｃｔｂＡｄｄｒＲｓ）は次のように定義される。
ＣｔｂＳｃａｌｉｎｇＦａｃｔｏｒ_BA＝（ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ_A／ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ_B）
ＣｔｂＲｏｗ_BA（ｃｔｂＡｄｄｒＲｓ）＝
Ｃｅｉｌ（（Ｆｌｏｏｒ（ｃｔｂＡｄｄｒＲｓ／ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ_B）＋１）＊ＣｔｂＳｃａｌｉｎｇＦａｃｔｏｒ_BA）−１
ＣｔｂＣｏｌ_BA（ｃｔｂＡｄｄｒＲｓ）＝
Ｃｅｉｌ（（（ｃｔｂＡｄｄｒＲｓ％ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ_B）＋１）＊ＣｔｂＳｃａｌｉｎｇＦａｃｔｏｒ_BA）−１
現在のエンハンスメントレイヤ／ビューＢのｃｔｂＡｄｄｒＲｓ_Bを有するＣＴＢを復号化するとき、ＰｉｃＷｉｄｔｈＩｎＣｔｂｓ_YA＊ＣｔｂＲｏｗ_BA（ｃｔｂＡｄｄｒＲｓ_B）＋ＣｔｂＣｏｌ_BA（ｃｔｂＡｄｄｒＲｓ_B）＋ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙに等しいｃｔｂＡｄｄｒＲｓ_Aを有するベースレイヤＣＴＢが完全に復号化されるときに、すべての必要なベースレイヤ資源が、利用し得る。
さもなければ（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、０に等しくなく、かつ、ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄは、０に等しい）、以下の状況のうちの１つが正確に真であることは、ビットストリーム一致の要件である：
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい（すなわち、タイルもＷＰＰも、ビデオシーケンスにおいて使用されない）、そして、ビットストリーム順序におけるベースレイヤの第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙスライスが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第１のスライスの復号化プロセスのための全てのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルが、ビデオシーケンスにおいて使用される）に等しい、そして、同じ画像エリアを覆う第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙタイルが完全に復号化されるときに、ビットストリーム順序における現在のレイヤの第１のタイルの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しく、かつ、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しい（すなわち、ＷＰＰが、符号化ビデオシーケンスにおいて使用される）、そして、ベースレイヤの第１のｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙＣＴＢ行が完了されるときに、現在のレイヤにおける第１のＣＴＢ行の復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。

あるいは、インターレイヤオフセットは、前の実施例のような第１のスライス／タイル／ＣＴＢ行のための最初の遅延の代わりに、ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇのための最悪のケースの遅延の一種として示され得る。同じ位置に配置された空間セグメントさらに信号伝送されたオフセットが完全に復号化されるときに、最悪のケースの遅延は、従属する画像の空間セグメントを復号化する過程で、すべての必要なそれぞれのベースレイヤ資源が利用し得るという保証を与える。

シンタックスのための実施例は、図４２に示される。

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、空間セグメントに関して対応するベースレイヤに関して符号化依存によって導かれる現在のレイヤの復号化遅延を記述する。
ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙの値に応じて、以下が、適用される：
ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙが０に等しい場合、レイヤの復号化間の最小遅延に関する制限は、示されない。
さもなければ（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、０に等しくない）、以下の条件のちょうど１つが真であることは、ビットストリーム一致の要件である：
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルもＷＰＰも、ビデオシーケンスにおいて使用されない）に等しい、そして、現在のレイヤにおけるスライスＡに関して同じ画像エリアの少なくとも一部を含むビットストリーム順序における最後のスライスセグメントＢの後でベースレイヤにおけるビットストリーム順序における（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ−１）スライスに続く第１のスライスセグメントＣが、完全に復号化されるときに、ビットストリーム順序における現在のレイヤの任意のスライスセグメントＡの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンス内で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０（すなわち、タイルが、ビデオシーケンスにおいて使用される）に等しい、そして、タイルＡに関して同じ画像エリアの少なくとも一部を含むビットストリーム順序における最後のタイルＢの後でビットストリーム順序における（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ−１）タイルに続く第１のタイルＣが完全に復号化されたときに、ビットストリーム順序における現在のレイヤの任意のタイルＡの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。
・符号化ビデオシーケンスの中で活性化される各画像パラメータセットにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しい（すなわち、ＷＰＰが、符号化ビデオシーケンスにおいて使用される）、そして、ビットストリーム順序におけるエンハンスメントレイヤのＣＴＢ行Ａに関する同じ画像エリアの少なくとも一部を覆うベースレイヤの最後のＣＴＢ行Ｂの後の（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ−１）ＣＴＢ行に続く第１のＣＴＢ行Ｃが完全に復号化されたときに、現在のレイヤにおける任意のＣＴＢ行Ａの復号化プロセスのためのすべてのベースレイヤ資源は、利用し得る。

画像、またはｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙの信号伝送に基づくサブ符号化ビデオシーケンスは、同様に可能である。関連するＮＡＬユニットに関するＳＥＩメッセージの範囲は、図２０に与えられたように時間領域における符号化ビデオシーケンスより小さく、ビットストリームのＳＥＩメッセージの位置によって、または、インデックスによって定義されもする。一つの実施例が、図４３のＬａｙｅｒ＿ｄｅｃｏｄｉｎｇ＿ｄｅｌａｙ＿ＳＥＩにおいて与えられる。

前述の実施例に関するセマンティックスは、ＳＥＩメッセージおよびそのシンタックス要素の範囲を反映するために変化し得る。

上記の明確な実施例は、わずかに修正され得る。上記実施例において、シンタックス要素構造は、−空間セグメント／ＣＴＢ復号化順序に沿って−、一次元またはスカラー態様においていずれも測定しているｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙおよびｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙを有するｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇを含む、そして、空間セグメントまたはＣＴＢを単位にしたインターレイヤオフセットは、−ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇに依存する。しかし、ベースレイヤ画像のＣＴＢの数は、通常、空間セグメント、例えばタイルまたはベースレイヤ画像のサブストリーム、の数より大きいので、わずかに異なる実施例において、ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇがＣＴＢベースのインターレイヤオフセット表示を示している場合には、このインターレイヤオフセットは、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙのみに基づいて決定されるのではなく、むしろ、後者のシンタックス要素は、その場合、水平次元におけるベースレイヤ画像のＣＴｂの位置を示すものとして解釈され、その中で、完全な復号化は、エンハンスメントレイヤ画像の復号化を開始するためにデコーダによりトリガとして使用され得る。当然、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙは、代わりに、垂直次元に沿ってベースレイヤ画像のＣＴＢを示すとして解釈され得る。ｃｔｂ＿ｂａｓｅｄ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇに応じて、すなわち、同上がＣＴＢベース表示を示す場合、更なるシンタックス要素は、他の次元において、ちょうど言及されたトリガとして作用しているベースレイヤ画像のＣＴＢの位置を示すデータストリームにおいて送信される。

すなわち、以下のシンタックスフラグメントが、信号伝送のために使用され得る、すなわちシンタックス要素構造として使用され得る：

インデックスｉおよびｊは、ベースレイヤおよびエンハンスメントレイヤのレイヤｉｄを示し得る。

上記シンタックス要素のセマンティックスは、以下のように記述され得る：

ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］は、下記で特定されるように、空間領域が、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤの各画像において、それ自体によって、または、ｍｉｎ＿ｈｏｒｉｚｏｎｔａｌ＿ｃｔｕ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］と共に、第ｉのレイヤのいかなる画像の復号化のためのインターレイヤ予測のために使用されないことを示す。ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］の値は、０からｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］＊ｒｅｆＰｉｃＨｅｉｇｈｔＩｎＣｔｂｓＹ［ｉ］［ｊ］までの範囲を含んでいる。存在しないときに、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］の値は、０に等しいと推測される。
１に等しいｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］［ｊ］は、ＣＴＵｓを単位にして、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤの各画像において、空間領域が第ｉのレイヤのいかなる画像の復号化のためのインターレイヤ予測のためにも使われないことが、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］およびｍｉｎ＿ｈｏｒｉｚｏｎｔａｌ＿ｃｔｕ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］によってともに示されることを記述している。０に等しいｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］［ｊ］は、スライス部分、タイルまたはＣＴＵ行を単位にして、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤの各画像において、第ｉのレイヤのいかなる画像の復号化のためのインターレイヤ予測のために使用されないことが、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］のみによって示されることを記述している。存在しないときに、ｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］の値は、０に等しいと推測される。
ｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］［ｊ］が１に等しいときに、ｍｉｎ＿ｈｏｒｉｚｏｎｔａｌ＿ｃｔｕ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］は、下記で特定されるように、空間領域が、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤの各画像において、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］と共に、第ｉのレイヤのいかなる画像の復号化のためのインターレイヤ予測のために使用されないことを示す。ｍｉｎ＿ｈｏｒｉｚｏｎｔａｌ＿ｃｔｕ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］の値は、０からｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］までの範囲を含んでいる。

ｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］［ｊ］が、１に等しいときに、変数ｍｉｎＨｏｒｉｚｏｎｔａｌＣｔｂＯｆｆｓｅｔ［ｉ］［ｊ］は、以下の通りに導出される：ｍｉｎＨｏｒｉｚｏｎｔａｌＣｔｂＯｆｆｓｅｔ［ｉ］［ｊ］＝（ｍｉｎ＿ｈｏｒｉｚｏｎｔａｌ＿ｃｔｕ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］＞０）？

（ｍｉｎ＿ｈｏｒｉｚｏｎｔａｌ＿ｃｔｕ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］−１）：（ｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］−１）
変数ｃｕｒＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］，ｃｕｒＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L［ｉ］，ｃｕｒＣｔｂＬｏｇ２ＳｉｚｅＹ［ｉ］，ｃｕｒＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］およびｃｕｒＰｉｃＨｅｉｇｈｔＩｎＣｔｂｓＹ［ｉ］は、ｉ番目のレイヤのＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L、ＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L、ＣｔｂＬｏｇ２ＳｉｚｅＹ、ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹおよびＰｉｃＨｅｉｇｈｔＩｎＣｔｂｓＹにそれぞれ等しくセットされる。
変数ｒｅｆＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］，ｒｅｆＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］，ｒｅｆＣｔｂＬｏｇ２ＳｉｚｅＹ［ｉ］［ｊ］，ｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］およびｒｅｆＰｉｃＨｅｉｇｈｔＩｎＣｔｂｓＹ［ｉ］［ｊ］は、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤのＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L、ＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓＬ、ＣｔｂＬｏｇ２ＳｉｚｅＹ、ＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹおよびＰｉｃＨｅｉｇｈｔＩｎＣｔｂｓＹにそれぞれ等しくセットされる。
変数ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＬｅｆｔＯｆｆｓｅｔ［ｉ］［ｊ］，ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＴｏｐＯｆｆｓｅｔ［ｉ］［ｊ］，ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＲｉｇｈｔＯｆｆｓｅｔ［ｉ］［ｊ］およびｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＢｏｔｔｏｍＯｆｆｓｅｔ［ｉ］［ｊ］は、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤのｓｃａｌｅｄ＿ｒｅｆ＿ｌａｙｅｒ＿ｌｅｆｔ＿ｏｆｆｓｅｔ［ｊ］＜＜１，ｓｃａｌｅｄ＿ｒｅｆ＿ｌａｙｅｒ＿ｔｏｐ＿ｏｆｆｓｅｔ［ｊ］＜＜１，ｓｃａｌｅｄ＿ｒｅｆ＿ｌａｙｅｒ＿ｒｉｇｈｔ＿ｏｆｆｓｅｔ［ｊ］＜＜１，ｓｃａｌｅｄ＿ｒｅｆ＿ｌａｙｅｒ＿ｂｏｔｔｏｍ＿ｏｆｆｓｅｔ［ｊ］＜＜１にそれぞれ等しく設定される。
第ｉのレイヤの第ｊのダイレクトリファレンスレイヤの画像において、第ｉのレイヤの画像におけるｃｔｂＡｄｄｒに等しいラスタースキャンアドレスを有するＣＴＵの配置されたＣＴＵのラスタースキャンアドレスを意味する変数ｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］は、以下の通りに導出される：
第ｉのレイヤの画像における左上輝度輝度サンプルと関連してｃｔｂＡｄｄｒに等しいラスタースキャンアドレスを有するＣＴＵの左上輝度サンプルの位置を特定している変数（ｘＰ、ｙＰ）は、以下の通りに導出される：
ｘＰ＝（ｃｔｂＡｄｄｒ％ｃｕｒＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］）＜＜ｃｕｒＣｔｂＬｏｇ２ＳｉｚｅＹ
ｙＰ＝（ｃｔｂＡｄｄｒ／ｃｕｒＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］）＜＜ｃｕｒＣｔｂＬｏｇ２ＳｉｚｅＹ
−変数ｓｃａｌｅＦａｃｔｏｒＸ［ｉ］［ｊ］およびｓｃａｌｅＦａｃｔｏｒＹ［ｉ］［ｊ］は、以下の通りに導出される：
ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］＝ｃｕｒＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］−ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＬｅｆｔＯｆｆｓｅｔ［ｉ］［ｊ］−ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＲｉｇｈｔＯｆｆｓｅｔ［ｉ］［ｊ］
ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓＬ［ｉ］［ｊ］＝ｃｕｒＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓＬ［ｉ］−ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＴｏｐＯｆｆｓｅｔ［ｉ］［ｊ］−ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＢｏｔｔｏｍＯｆｆｓｅｔ［ｉ］［ｊ］
ｓｃａｌｅＦａｃｔｏｒＸ［ｉ］［ｊ］＝（（ｒｅｆＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］＜＜１６）＋（ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］＞＞１））／ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］
ｓｃａｌｅＦａｃｔｏｒＹ［ｉ］［ｊ］＝（（ｒｅｆＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］＜＜１６）＋（ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L＞＞１））／ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］

−第ｉのレイヤの輝度サンプル位置（ｘＰ、ｙＰ）の第ｊのダイレクトリファレンスレイヤにおける画像の配置された輝度サンプル位置を特定している変数（ｘＣｏｌ［ｉ］［ｊ］，ｙＣｏｌｘＣｏｌ［ｉ］［ｊ］）は、以下の通りに導出される：
ｘＣｏｌ［ｉ］［ｊ］＝Ｃｌｉｐ３（０，（ｒｅｆＰｉｃＷｉｄｔｈＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］−１），（（ｘＰ−ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＬｅｆｔＯｆｆｓｅｔ［ｉ］［ｊ］）＊ｓｃａｌｅＦａｃｔｏｒＸ［ｉ］［ｊ］＋（１＜＜１５））＞＞１６））
ｙＣｏｌ［ｉ］［ｊ］＝Ｃｌｉｐ３（０，（ｒｅｆＰｉｃＨｅｉｇｈｔＩｎＳａｍｐｌｅｓ_L［ｉ］［ｊ］−１），（（ｙＰ−ｃｕｒＳｃａｌｅｄＲｅｆＬａｙｅｒＴｏｐＯｆｆｓｅｔ［ｉ］［ｊ］）＊ｓｃａｌｅＦａｃｔｏｒＹ［ｉ］［ｊ］＋（１＜＜１５））＞＞１６））
−変数ｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］は、以下の通りに導出される：
ｘＣｏｌＣｔｂ［ｉ］［ｊ］＝ｘＣｏｌ［ｉ］［ｊ］＞＞ｒｅｆＣｔｂＬｏｇ２ＳｉｚｅＹ［ｉ］［ｊ］
ｙＣｏｌＣｔｂ［ｉ］［ｊ］＝ｙＣｏｌ［ｉ］［ｊ］＞＞ｒｅｆＣｔｂＬｏｇ２ＳｉｚｅＹ［ｉ］［ｊ］
ｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］＝ｘＣｏｌＣｔｂ［ｉ］［ｊ］＋（ｙＣｏｌＣｔｂ［ｉ］［ｊ］＊ｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］）
ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］が０より大きいとき、以下が適用されることは、ビットストリーム一致の要件である：
−ｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］［ｊ］が０に等しいとき、以下のちょうど１つが適用される：
・第ｉのレイヤの第ｊのダイレクトリファレンスレイヤの画像によって関連される各ＰＰＳにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、以下が適用される：
・スライスセグメントＡを、第ｉのレイヤの画像の任意のスライスセグメントとし、ｃｔｂＡｄｄｒをスライスセグメントＡにおける最後のＣＴＵのラスタースキャンアドレスとする。スライスセグメントＢを、スライスセグメントＡとして同じアクセスユニットに属し、第ｉのレイヤの第ｊのダイレクトリファレンスレイヤに属し、かつラスタースキャンアドレスｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］を有するＣＴＵを含むスライスセグメントとする。スライスセグメントＣを、スライスセグメントＢとして同じ画像内に存在し、復号化順序におけるスライスセグメントＢに続き、そして、スライスセグメントＢおよびそのスライスセグメントの間に復号化順序におけるｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］−１スライスセグメントが存在するスライスセグメントとする。スライスセグメントＣが存在するとき、サンプルまたはスライスセグメントＣの値または復号化順序におけるＣに続く同じ画像のいかなるスライスセグメントが、スライスセグメントＡの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、スライスセグメントＡのシンタックス要素は、拘束される。
・第ｉのレイヤの第ｊのダイレクトリファレンスレイヤにおける画像によって参照される各ＰＰＳにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しく、かつ、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しい、そして、以下が適用される：
・タイルＡを、第ｉのレイヤの任意の画像ｐｉｃＡにおける任意のタイルであるとし、ｃｔｂＡｄｄｒをタイルＡにおける最後のＣＴＵのラスタースキャンアドレスであるとする。タイルＢを、ｐｉｃＡとして同じアクセスユニットに属しかつ第ｉのレイヤの第ｊのダイレクトリファレンスレイヤに属しかつラスタースキャンアドレスｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］を有するＣＴＵを含む画像ｐｉｃＢに存在するものとする。タイルＣを、ｐｉｃＢにおいても存在し、復号化順序におけるタイルＢに続くタイルであるものとする、そして、タイルＢおよびそのタイルの間に、復号化順序におけるｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］が存在する。スライスセグメントＣが存在するとき、サンプルまたはタイルＣにおけるシンタックス要素値または復号化順序におけるＣに続く同じ画像のいかなるタイルも、タイルＡの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、タイルＡのシンタックス要素は、拘束される。
・第ｉのレイヤの第ｊのダイレクトリファレンスレイヤにおける画像によって参照される各ＰＰＳにおいて、ｔｉｌｅｓ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、０に等しく、かつ、ｅｎｔｒｏｐｙ＿ｃｏｄｉｎｇ＿ｓｙｎｃ＿ｅｎａｂｌｅｄ＿ｆｌａｇは、１に等しい、そして、以下が適用される：
・ＣＴＵ行Ａを、第ｉのレイヤのいかなる画像ｐｉｃＡにおけるいかなるＣＴＵ行とし、ｃｔｂＡｄｄｒをＣＴＵ行Ａにおける最後のＣＴＵのラスタースキャンアドレスとする。ＣＴＵ行Ｂを、ｐｉｃＡとして同じアクセスユニットに属しかつ第ｉのレイヤの第ｊのダイレクトリファレンスレイヤに属しかつラスタースキャンアドレスｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］を有するＣＴＵを含む画像ｐｉｃＢに存在するものとする。ＣＴＵ行Ｃを、ｐｉｃＢにおいても存在し、復号化順序におけるＣＴＵ行Ｂに続くＣＴＵ行であるものとする、そして、ＣＴＵ行ＢおよびそのＣＴＵ行の間に、復号化順序におけるｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］−１ＣＴＵ行が存在する。ＣＴＵ行Ｃが存在するとき、サンプルまたはＣＴＵ行Ｃにおけるシンタックス要素値またはＣに続く同じ画像の行も、ＣＴＵ行Ａの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、ＣＴＵ行ＣにおけるＣＴＵ行Ａのシンタックス要素は、拘束される。
−さもなければ（ｃｔｕ＿ｂａｓｅｄ＿ｏｆｆｓｅｔ＿ｅｎａｂｌｅｄ＿ｆｌａｇ［ｉ］［ｊ］は、１に等しい）、以下が、適用される：
・変数ｒｅｆＣｔｂＡｄｄｒ［ｉ］［ｊ］は、以下の通りに導出される：
ｘＯｆｆｓｅｔ［ｉ］［ｊ］＝（（ｘＣｏｌＣｔｂ［ｉ］［ｊ］＋ｍｉｎＨｏｒｉｚｏｎｔａｌＣｔｂＯｆｆｓｅｔ［ｉ］［ｊ］）＞（ｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］−１））？
（ｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］−１―ｘＣｏｌＣｔｂ［ｉ］［ｊ］）：
（ｍｉｎＨｏｒｉｚｏｎｔａｌＣｔｂＯｆｆｓｅｔ［ｉ］［ｊ］）
ｙＯｆｆｓｅｔ［ｉ］［ｊ］＝（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｏｆｆｓｅｔ＿ｐｌｕｓ１［ｉ］［ｊ］−１）＊ｒｅｆＰｉｃＷｉｄｔｈＩｎＣｔｂｓＹ［ｉ］［ｊ］
ｒｅｆＣｔｂＡｄｄｒ［ｉ］［ｊ］＝ｃｏｌＣｔｂＡｄｄｒ［ｉ］［ｊ］＋ｘＯｆｆｓｅｔ［ｉ］［ｊ］＋ｙＯｆｆｓｅｔ［ｉ］［ｊ］
・ＣＴＵＡを、第ｉのレイヤのいかなる画像ｐｉｃＡにおける任意のＣＴＵとし、ｃｔｂＡｄｄｒをＣＴＵＡのラスタースキャンアドレスｃｔｂＡｄｄｒであるとする。ＣＴＵＢは、ｐｉｃＡとして同じアクセスユニットに属しかつｉ番目のレイヤのｊ番目のダイレクトリファレンスレイヤに属しかつｒｅｆＣｔｂＡｄｄｒ［ｉ］［ｊ］より大きいラスタースキャンアドレスを有する画像において存在するＣＴＵとする。ＣＴＵＢが存在するとき、サンプルまたはＣＴＵ行Ｂにおけるシンタックス要素値が、ＣＴＵＡの範囲内でいかなるサンプルの復号化プロセスにおけるインターレイヤ予測のためにも使用されないように、ＣＴＵＡのシンタックス要素は、拘束される。

すなわち、ちょうど提供された実施例を要約すれば、インターレイヤオフセットのＣＴＢベース表示は、一方ではＣＴＢベース表示、他方ではインターレイヤオフセットの空間セグメントベース表示の間で切替わるフラグを使用して切替え可能な方法でなされ得る。そしてそのように行う際に、ＣＴＢベースの代替手段は、無条件に、すなわち、ＣＴＢベースまたは空間セグメントベースのインターレイヤオフセット表示に関わらず、伝送されるシンタックス要素を使用し得る。すなわち、シンタックス要素は、空間セグメント方向の表示が１つの構成要素、例えばベースレイヤ画像における「トリガＣＴＢ」の位置の水平または垂直構成要素として示された場合に空間要素を単位としてインターレイヤオフセットを示す。インターレイヤオフセット表示に基づきＣＴＢベースおよび空間セグメントベース間で切替わるシンタックス要素に依存して、更なるシンタックス要素がそれから伝送され、あるいは伝送されない。特に、ＣＴＢベースの表示が示される場合、それは伝送される。その場合、後者のシンタックス要素は、「トリガＣＴＢ」の位置の失われた次元を示す。デコーダは、このように２つのシンタックス要素を用いる行および列におけるベースレイヤ画像のＣＴＢの規則的配列の間で「トリガＣＴＢ」を確認し得る、そして、このＣＴＢが復号化されるとすぐに、デコーダは、エンハンスメントレイヤ画像の復号化を開始し得る。それでも、いかなるインターレイヤオフセットの表示は、第１のシンタックス要素、すなわち、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ、の表示可能な状態の１つを使用することにより、完全にオフされ得る。ＣＴＢベースのインターレイヤオフセット表示の場合において、ＣＴＢ間で定義された既定の復号化順序により、デコーダは、トリガＣＴＢの位置の水平および垂直要素を、インターレイヤオフセットのＣＴＢベース表示に従う制御を行うためにデコーダが図３６の実施例を使用し得るように、エンハンスメントレイヤ画像の第１のＣＴＢの復号化を開始する前に完全に復号化されるべきベースレイヤ画像のＣＴＢの数に伝送し得る。

以下に、本発明の更なる態様が、更に詳細に記載されている。第４の態様は、エンコーダからビットストリームを受け取るすべての参加しているネットワーク実体が、マルチレイヤデータストリームにおいて伝達される各種レイヤの間で容易に区別することを好ましくは可能にされる課題についてである。例えば、中間のネットワーク実体は、特定の情報レイヤを更なる伝送、例えば若干の解像度閾値を上回っているサンプル解像度に関するレイヤ、から除外することに興味を持たれ得る。以下の説明は、ＨＥＶＣの構想された拡張の現在の状況の概要を提供する。

ＨＥＶＣ［１］のビデオパラメータセット（ＶＰＳ）は、高水準アクセスを符号化ビットストリームに提供して、中間のまたは終端装置でプロセスビットストリームに不可欠である情報を含む。ＨＥＶＣの次回のスケーラブルなおよびマルチビュー拡張は、スケーラブルビットストリームのために設計されたシンタックスを提供するＶＰＳ拡張から、更に利益を得る。ＶＰＳ拡張のメインタスクのうちの１つは、ＮＡＬユニットヘッダにおけるｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓの解釈への統一的な方法を提供することである。ｎｕｈ＿ｒｅｓｅｒｖｅｄ＿ｚｅｒｏ＿６ｂｉｔｓは、ｌａｙｅｒ＿ｉｄとして改称されて、スケーラブルビデオ符号化シナリオの一般的なレイヤ識別子としての役割を果たすことを目的とする。ＮＡＬユニットヘッダにおけるｌａｙｅｒ＿ｉｄシンタックス要素は、〔１〕において与えられ、そして、図２２に示されるようにＮＡＬユニットヘッダに沿って、以下のテーブルにおいて与えられる。

２つの一般的な方法が、設計プロセス［５］内で考慮された。第１に、ＮＡＬユニットのヘッダにおける単一の識別子の値を、ＶＰＳ拡張において示された潜在的に複数のスケーラブル識別子にマップする方法である。第２に、ＮＡＬのヘッダにおける単一の識別子の個々のビット（またはビットのブロック）をＶＰＳ拡張において示された特定のスケーラブル識別子に割り当てる方法である。

〔４〕において報告されるように、現在のＶＰＳ拡張シンタックスの設計は、マッピング方法を使用するが、すでに、両方の方法のために必要な全てのシンタックス要素を既に含む、すなわち、２つのシンタックス要素は、スケーラビリティのタイプ（ｓｃａｌａｂｉｌｉｔｙ＿ｍａｐを比較されたい）およびスケーラビリティ次元（ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１）につきレイヤの総計を示す。

エンコーダが非連続形のｌａｙｅｒ＿ｉｄの値をまばらに割当てることを選択する場合、マッピング方法は、更なるシンタックス要素をＶＰＳ拡張シンタックス、すなわちｕ（ｖ）および任意にはｌａｙｅｒ＿ｉｄとして符号化されたスケーラブル識別子の実効値に導入する。

多くの非常にありそうなスケーラブルなシナリオ、例えば２つまたは３つの空間レイヤ、２または３つのビューその他、において、ＮＡＬユニットヘッダにおいて６ビットのレイヤ識別子の全６３値を利用するのに必要でない。これらスケーラブルなシナリオのために、マッピングベースの方法と比較したとき、ＮＡＬユニットヘッダにおけるレイヤ識別子の個々のビットを特定のスケーラブルな次元に割り当てる方法は、２つの効果がある：
・スケーラビリティ次元識別子に関するＮＡＬユニットヘッダにおけるレイヤ識別子の値の解釈は、間接指定またはルックアップを必要としない。
・マッピング方法のために必要なＶＰＳ拡張シンタックス要素は、送信される必要はなく、それは、スケーラビリティ信号伝送のためのＶＳＰ拡張ビットの有意部分を構成する。
・中間のユニットは、通過するビデオビットストリームごとにマッピングテーブルを格納する必要はない。

後述する第４の態様の概念によれば、マッピングまたは分割方法のいずれを用いるかについて指し示すヒントが、ＨＥＶＣの高レベルシンタックス内で存在し得る。

一つの実施例によれば、ヒントに依存して、シンタックス要素に関連したマッピング部分（ｖｐｓ＿ｎｕｈ＿ｌａｙｅｒ＿ｉｄ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］およびｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］と比較されたい）は、送信されるかまたは無視される、そして、スケーラビリティタイプ（ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋと比較されたい）のためのシンタックス要素およびスケーラビリティ（ｃｐ．ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１と比較されたい）当たりのレイヤの総計が示され、分割に関する情報またはＮＡＬユニットヘッダにおけるスケーラブル識別子のマッピングとして、ヒントに従って解釈されなければならない。

本発明の第４の態様の概念に対応する、または利用している実施例は、図２３に関して示される。図２３は、すでに上述されるそれらのいずれか一つとしてのビデオデコーダであり得るネットワーク実体を示すか、または、エンコーダおよびデコーダの間で生じている中間のネットワーク実体であり得る。ネットワーク実体は、一般的に、参照符号６８０を用いて示される。それは、マルチレイヤビデオデータストリーム６８２、例えば上述のデータストリーム４０の任意の一つ、を処理するためにある。ネットワーク実体６８０がビデオデコーダである場合、処理は、マルチレイヤビデオデータストリーム６８２を復号化することを含む。中間のネットワーク実体の場合、処理は、例えば、ビデオデータストリームの転送を含み得る。

各レイヤにおいて、このシーンがスケーラビリティ次元によって測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンは、レイヤにおけるマルチレイヤビデオデータストリームに符号化され、そこにおいて、マルチレイヤビデオデータストリームは、第１のＮＡＬユニットを含み、そして、それぞれは、レイヤの１つに関連し、かつ、第２のＮＡＬユニットは、第１のＮＡＬユニットマルチレイヤ内に組込まれて、マルチレイヤビデオデータストリームに関する一般の情報を示す。換言すれば、第１のＮＡＬユニット６８４は、マルチレイヤビデオデータストリーム６８２のレイヤのいずれかに対応する「画像」とともに、ビデオ画像の一つ以上のスライスを運送し得る。前記実施例において、説明を簡単にするために、レイヤ０およびレイヤ１の単に２つのレイヤだけが述べられる。当然、レイヤの数は２より大きくてもよく、そして、レイヤが以前のレイヤのいずれかに貢献する情報の種類でさえ、レイヤごとに異なり得る。第１のＮＡＬユニット６８４に加えて、ＮＡＬユニット６８６は、ＮＡＬユニット６８４に組込まれていることを示す、しかし、それらの伝送は、第１のＮＡＬユニット６８４と比較して別々のチャネルを経由して実行され得る。第２のＮＡＬユニットは、以下で更に詳細に述べられる方法のマルチレイヤビデオデータストリームに関する一般的な情報を示する。

一方では第１のＮＡＬユニットと他方ではデータストリーム６８２のレイヤのセットとの間の関連を記載するために、更に詳細に、図２４が参照される。図２４は、すべての第１のＮＡＬユニット６８４のための代表として第１のＮＡＬユニット６８４を示し、ヘッダ６８８の範囲内で、レイヤインジケータフィールド６９０を含む。ヘッダ６８８の他に、ＮＡＬユニット６８４は、他の図面、すなわちインターレイヤ予測を使用して符号化されたビデオコンテンツに関するデータ、に関して上述されたように、スライスデータに関するペイロードデータ６９２を含む。図２４も、レイヤのセット、すなわち、６９４、を示す。特に、図２４に示されるレイヤのセット６９４は、ＮＡＬユニット６８４のレイヤインジケータフィールド６９０を経由して各々を、表わされ得て区別され得る可能なレイヤの全てを意味する。すなわち、一方ではセット６９４およびレイヤインジケータフィールド６９０の可能な値の間の関連機能は、全単射（ｂｉｊｅｃｔｉｖｅ）なものであるとみなされる。図２４において、セット６９４の個々のレイヤは、小円を使用して手本として示される。そして、一定数を有する各々がそこへ内接する。これら内接する数が、セット６９４のレイヤの間で定義されるべき順序を示唆するにもかかわらず、以下の説明がセット６９４におけるレイヤが配列されるかまたはソートされる方法がレイヤインジケータフィールド６９０の基礎として導出されないことを明らかにする点に注意されたい。むしろ、このために、ネットワーク実体６８０は、分散型の第２のＮＡＬユニット６８６におけるタイプインジケータフィールド６９６を検査することを必要とする。しかしながら、これは、後述する。

換言すれば、これまで、図２４におけるセット６９４の各要素は、単にＮＡＬユニット６８４におけるレイヤインジケータフィールド６９０の可能な状態のうちの１つを表すだけである。セット６９４のレイヤは、レイヤインジケータフィールド６９０により識別可能である、しかし、これらレイヤの間の意味論的意味および順序は、第２のＮＡＬユニット６８６により提供されている付加的情報のないネットワーク実体６８０のために明確にならない。それにもかかわらず、実際は、セット６９４のレイヤは、特定のスケーラビリティ次元または軸に対応するツリーの間に、ツリーのノードを分岐により形成する。レイヤのうちの１つは、例えば、ベースレイヤであって、ツリーのルートに対応する。２つのレイヤ、すなわちツリーの２つのノード、を接続している各分岐は、特定のレイヤがどのように他のレイヤに貢献するか、すなわち、どの種類の情報がインターレイヤ予測を使用して付加的に供給されているかについて記述し、情報の種類は、スケーラビリティ次元に対応し、そして、例えば、空間分解能増加、ＳＮＲ増加、等であり得る。簡潔に説明するために、図２４は、例えば、空間スケーラビリティおよびＳＮＲスケーラビリティに対応する２つのスケーラビリティ次元７００および７０２により渡される二次元スケーラビリティ空間６９８を示す。レイヤおよび空間６９８によるその拡張の典型的なツリーは、図２４に示される。図２４も、セット６９４の可能なレイヤの全てがデータストリーム６８２に存在し得るというわけではないことを示す。図２４の典型的なケースにおいて、例えば、単に５つのレイヤだけが、実際にデータストリーム６８２において使用される。

図２２は、例えば、レイヤインジケータフィールドが６ビットを有し得ることを示した。それによって、２⁶＝６４の可能な状態またはセット６９４の可能なレイヤを区別する。それは、第２のＮＡＬユニット６８６を経由して下記でより詳細に記載されている方法で調整され得るスケーラビリティ空間６９８における運転点上へのセット６９４のこれら可能な値またはレイヤからのマッピングである。マッピングは、参照符号７０４を使用している図２４において示される。「運転点」は、スケーラビリティ空間６９８の範囲内でセット６９４の中で少なくとも実際に存在するレイヤの位置を意味する。例えば、スケーラビリティ空間６９８の起源は、ベースレイヤまたはツリールートと関係し得る、その一方で、スケーラビリティ空間６９８の軸７００および７０２のいずれかに沿った各分岐は、１の固定長を有し得る。スケーラビリティ空間６９８の運転点を示しているベクトルは、このように整数値を有する座標を有し得る。

今までに挙げられた説明を手短に要約すれば、マルチレイヤビデオデータストリーム６８２は、ビデオコンテンツに関する情報または複数のレイヤのシーンを提供する。レイヤは、分岐を介してツリーに接続している各レイヤを有するツリーにおいて配置される。ツリールートを形成しているベースレイヤから始まり、次の以下のレイヤは、スケーラビリティ次元として解釈可能な１種類の特定の情報に関してビデオコンテンツ情報の再構成可能なバージョンに貢献する。従って、各レイヤは、ツリールートレイヤでもあるかまたはブランチの特定の経路経由でも、後者に接続され、そして、この経路に沿って存在しているレイヤに属するＮＡＬユニット６８４は、それぞれのレイヤでビデオコンテンツを再構成するために必要である。当然、ツリールートに関してそれぞれのブランチの末端で進行している任意の「貢献している」レイヤが、レイヤインジケータフィールド６９０の値を有するように、マッピング７０４が実行される場合、それは好ましく、そして、それはそれぞれのブランチの近端部でレイヤのレイヤインジケータフィールドの値よりも高い。

図２５は、タイプインジケータフィールド６９６の意味を更に詳細に示す。図２５は、固定ビット長のフィールドとして、レイヤインジケータフィールド６９０を示す。いずれにせよ、フィールド６９０の長さは、タイプインジケータフィールド６９６の値から独立している。しかしながら、タイプインジケータフィールドが第１の状態を有する場合、レイヤインジケータフィールド６９０は、全体として扱われる、すなわちそのｎビットの全てが、その可能な値を区別するためにすべて共通に扱われる。タイプインジケータフィールド６９６が、第１の状態を仮定する場合、好ましくは、ｎ−ビット整数は、ネットワーク実体６８０によってレイヤインジケータフィールド６９０より導出される。第１の状態を仮定しているタイプインジケータフィールド６９６の場合、ネットワーク実体６８０は、第２のＮＡＬユニット６８６の範囲内で伝達されるマッピング情報を用いて操作上の位置上へｍ−ビットフィールド６９０の可能な値のマッピング７０４を実行する、そして、マッピング情報は、参照符号７０８を使用して図２５において示される。図２５に示されるように、マッピング情報７０８は、例えば、それぞれの可能な値の関連する運転点を示しているベクトルをレイヤインジケータフィールド６９０の各実際に使用される可能な値に割当てているテーブルを含む。すなわち、第１の状態を仮定しているタイプインジケータフィールド６９６の場合には、ネットワーク実体６８０は、第２のＮＡＬユニット６８６からマッピング情報７０８を導出し得て、空間６９８におけるそれぞれの／関連する運転点を決めるために、関連するベクトルを検索するために各レイヤインジケータフィールド６９０に対しマッピング情報またはテーブル７０８への検索を実行し得る。マッピング情報７０８におけるあり得る値に関連するベクトルの次元の数ｐは、デフォルトでセットされ得るかまたはデータストリーム、例えば第２のＮＡＬユニット６８６、の中で示され得る。後ほど、以下の情報がマッピング情報７０８について伝達するために示され得ることが示されるであろう：ｖｐｓ＿ｍａｘ＿ｌａｙｅｒｓ＿ｍｉｎｕｓ１は、Ｍ−ビットフィールド６９０の実際に使用される可能な値の数Ｍを決定し得る。ｎｕｍ＿ｄｉｍｅｎｓｉｏｎｓ＿ｍｉｎｕｓ１は、次元の数を決定し得る。後の２つの変数は、シンタックス要素ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋを使用して送信され得る。テーブル自体は、それから一方では、一対の可能な値、すなわち、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈを介して、およびｐ次元ベクトル、すなわち、ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］により示され得る。マッピング７０４は、それから、ｐ次元ベクトル、すなわち、レイヤインジケータフィールド６９０を有するＮＡＬユニットのレイヤと関連した空間６９８の間の運転点を示しているこのそれぞれのベクトル７１０上へマッピング情報７０８を介してマップされるもの、に通じる。

しかしながら、タイプインジケータフィールド６９６が第２の状態を仮定する場合、マッピング７０４は異なって実行される。特に、マッピングは、レイヤインジケータフィールド６９０を複数の部分に分割することによって、すなわちフィールド６９０のｍ−ビットの数列をビットの連続した部分列の数ｎに分割することによって、その場合実行される。このように得られた各部分が、ｎ次元ベクトル７１２の座標ｘ₁…ｘ_nとして使用され、そして、それはレイヤインジケータフィールド６９０を構成するＮＡＬユニットのレイヤと関連したスケーラビリティ空間６９８内の運転点を次々に示している。例えば、レイヤインジケータフィールド６９０のｍ−ビットは、フィールド６９０の最初の（最も重要な）ｍ₁ビットからの第１の部分、フィールド６９０の次のｍ₂（次により重要な）ビットからの第２の部分、ｍ₁＋…＋ｍ_n＝ｍを満たす第ｎの部分までその他を形成することにより、ｎ部分に分割される。各部分のＴｈビットは、整数値表現と直接みなされ得る。

第２の状態を仮定しているタイプインジケータフィールドの場合、次元ｎの数は、デフォルトでセットされ得るかまたはデータストリームにより示され得る。後に、本願明細書において記載されている特定の実施例の場合には、ｎは、第１の状態、すなわちｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋに基づく、を仮定しているタイプインジケータフィールド６９６の場合にｐを決定するために使用された同じシンタックス要素に基づいて導出される。レイヤインジケータフィールド６９０が再分割される部分のビット長、すなわちｍ₁、…、ｍ_nは、シンタックス要素ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１を介しても手本として示される、しかし、また、再分割は、明確な伝送のないデフォルトによって達成され得る。

同じシンタックス構造、例えばｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ、がタイプインジケータフィールド６９６にかかわりなく解析可能で、スケーラビリティ空間の次元数およびセマンティックな意味を示し得る点に留意する必要がある。このシンタックス要素の許容された状態が、レイヤインジケータフィールドの構成要素方向の解釈を示すタイプインジケータフィールド６９６の場合におけるシンタックス要素の利用可能な状態の固有のサブセット上で−マッピングケースと関連して−制限され得る。しかしながら、例えば、マッピング事例（タイプインジケータの第１の状態は、保管された）において利用可能な（または設定可能な）スケーラビリティ空間の次元の最大数は、コンポーネント解釈事例（タイプインジケータの第１の状態は、保管された）における利用可能な最大数よりも大きくなり得る。エンコーダは、したがって、この制限に従う。

図２３〜２５の実施例のための典型的な使用事例は、以下の通りである：

大量の複数関係者会議開催
ＲＴＰ、例えばウェブ会議、に基づく大量の会話サービスシナリオにおいて、複数の関係者間の転送されたビデオは、それぞれのビデオビットストリームのパラメータセットを知っていなければならない多点制御ユニット（ＭＣＵ）において適している。各関係者は、サムネイルビットストリームおよび２つのビットストリームに話者の強化された空間分解能、例えば７２０ｐおよび４Ｋ、を提供する。ＭＣＵは、どの関係者にどのストリームを与えるべきかという決定をする。スケーラビリティパラメータの簡単な分析は、従って、ＭＣＵに対する重要な救済である。分割ベースの方法は、スケーラビリティ信号伝送のマッピングベースアプローチと比較して、計算およびメモリ資源が少なくて済む。

トランスポートシステム
トランスポートシステム、例えばＲＴＰまたはＭＰＥＧ２−ＴＳ、において、スケーラビリティ関連のコーデック情報をそれぞれの要素にマップすることは、マッピングベース法と比較して分割等のより少ない複雑さおよびビット節約機構から利益を享受し得る。転送システムがマッピングアプローチの仕方のスケーラビリティ信号伝送を採用するが、むしろマッピング間接指定を分解して、分割法で例えば次々に明確に示される各スケーラビリティ次元ごとに専用のスケーラビリティ識別子を生じさせることは、ありそうにない。

図２６の実施例は、〔４〕において報告されるように、ＶＰＳ拡張シンタックスに基づき、ＨＥＶＣ拡張におけるスケーラビリティ信号伝送のための方法に基づくマッピングおよび分割の間で切替わることを可能にするＶＰＳ拡張シンタックスにおけるシンタックスフラグとして可能な実施例を示す。

１に等しい値を有するｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇは、ＮＡＬユニットヘッダにおけるｌａｙｅｒ＿ｉｄフィールドのビットがｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１の値に従って分割され、ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋにおいて示されたそれぞれのスケーラビリティ次元に属することを示す。１に等しい値を有するｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇは、シンタックス要素ｖｐｓ＿ｎｕｈ＿ｌａｙｅｒ＿ｉｄ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ、ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］およびｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］が示されないことを示す。１に等しい値を有するｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇは、対応するＮＡＬユニットのスケーラブル識別子を記載している変数の派生がＮＡＬユニットヘッダ（ｌａｙｅｒ＿ｉｄと比較）のスケーラブル識別子のそれぞれの関連ビットだけを使用することを示す。例えば以下の通り。

ＤｅｐｅｎｄｅｎｃｙＩｄ＝ｌａｙｅｒ＿ｉｄ＆＆０ｘ０７

ＱｕａｌｉｔｙＩｄ＝ｌａｙｅｒ＿ｉｄ＆＆０ｘ３８

０に等しい値を有するｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇは、シンタックス要素ｖｐｓ＿ｎｕｈ＿ｌａｙｅｒ＿ｉｄ＿ｐｒｅｓｅｎｔ＿ｆｌａｇ，ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］およびｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］が示され、かつ、ＮＡＬユニットヘッダにおけるｌａｙｅｒ＿ｉｄのビットが特定のスケーラビリティ次元に関連しておらず、ＶＰＳ拡張におけるスケーラブル識別子にマップされることを示す。０に等しい値を有するｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇは、ＮＡＬユニットに対応するスケーラブル識別子を記述している変数の派生が、ＮＡＬユニットヘッダにおいて、例えば次のような方法で、示されるｌａｙｅｒ＿ｉｄが与えられたシンタックス要素ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］を使用することを示す：

ｉｆ（ｌａｙｅｒ＿ｉｄ＝＝ｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［０］）｛

ＤｅｐｅｎｄｅｎｃｙＩｄ＝ｄｉｍｅｎｓｉｏｎ＿ｉｄ〔０〕〔０〕

ＱｕａｌｉｔｙＩｄ＝ｄｉｍｅｎｓｉｏｎ＿ｉｄ〔０〕〔１〕

ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇが０に等しいとき、ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１［ｉ］は、ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］の断片的な長さを示す。ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇが１に等しいとき、ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１［ｉ］は、以下を示す。

ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋによって示されるように、第ｉのスケーラビリティ次元と関連したＮＡＬユニットヘッダにおけるｌａｙｅｒ＿ｉｄのビットの数

図２７におけるフローチャートは、本発明の可能な実施例を更に示す。スケーラブル識別子は、マスクされたビットコピーにより、ｌａｙｅｒ＿ｉｄのビットから直接に導出されるかまたはｌａｙｅｒ＿ｉｄの特定の値まで、関連性によりＶＰＳにおいて示される。

他のシンタックス実施例は、図３１に示される。ここで、提出されるタイプインジケータは、「ｓｐｌｉｔｔｉｎｇ＿ｆｌａｇ」によって示され、一方、提出されるレイヤインジケータは、ｎｕｈ＿ｌａｙｅｒ＿ｉｄと呼ばれている。「ｓｐｌｉｔｔｉｎｇ＿ｆｌａｇ」に応じて、マッピング概念または分割概念が、ｎｕｈ＿ｌａｙｅｒ＿ｉｄからスケーラビリティ空間におけるそれぞれのＮＡＬユニットのレイヤの運転点を導出するために使用される。分割概念は、１に等しいｓｐｌｉｔｔｉｎｇ＿ｆｌａｇによって手本として示される。それから、スケーラブル識別子、すなわちスケーラビリティ空間のスケーラビリティ次元に関するベクトル成分、は、ビットマスクされたコピーによってＮＡＬユニットヘッダにおけるｎｕｈ＿ｌａｙｅｒ＿ｉｄシンタックス要素より導出され得る。第ｉのスケーラブル次元のためのそれぞれのビットマスク、図２５におけるベクトル７１２の第ｉの構成要素、は、以下の通りに定義される。特に、１に等しいｓｐｌｉｔｔｉｎｇ＿ｆｌａｇは、ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］シンタックス要素が存在せず（すなわち、マッピング情報７０８は、存在せず）、かつ、ＮＡＬユニットヘッダにおけるｎｕｈ＿ｌａｙｅｒ＿ｉｄｖａｌｕｅのバイナリ表現は、一連のＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓに分割される、すなわち、ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１［ｊ］の値によれば、ｎ、セグメント、長さを有するベクトルｘ₁…_n、ビットにおけるおよびｄｉｍｅｎｓｉｏｎ＿ｉｄ［ＬａｙｅｒＩｄｘＩｎＶｐｓ［ｎｕｈ＿ｌａｙｅｒ＿ｉｄ］］［ｊ］の値によれば、すなわち、ベクトル７１２の構成要素ｘ₁…_nは、フィールド６９０のＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓセグメントから推定されることを示す。意味論的な意味およびスケーラビリティ空間のスケーラビリティ軸の数は、それぞれのスケーラビリティタイプがそれぞれのスケーラビリティ空間６９８のスケーラビリティ次元のいずれかに属するか否かに関してこの手本として所定の定数の各々を示す一連のフラグｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ＿ｆｌａｇによって示される。特に、ネットワーク実体６８０は、スケーラビリティ空間、すなわちスケーラビリティ軸ＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓの意味論的な意味および数、を、図３１におけるｆｏｒループによるフラグｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ＿ｆｌａｇのシーケンスから導出され得る。

for( i = 0, NumScalabilityTypes = 0; i < 16; i++ ) [
scalability＿mask＿flag[ i ]
NumScalabilityTypes += scalability＿mask＿flag[ i ]
]

１に等しいｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ＿ｆｌａｇ［ｉ］は、第ｉのスケーラビリティ次元が存在することを示す。そして、０に等しいｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ＿ｆｌａｇ［ｉ］は、第ｉのスケーラビリティ次元が存在しないことを示す。ここで、ｉ＝１は、マルチビュースケーラビリティを意味し得て、ｉ＝２は、空間／ＳＮＲスケーラビリティを意味し得て、ｉ＝０は、深さマップ情報の追加を意味し得る。他のスケーラビリティ次元タイプは、同様に存在し得て、当然に、まさに概説された実施例は、単に図示されるだけである。ｎｕｈ＿ｌａｙｅｒ＿ｉｄの長さが手本として６である場合、分割しているかマスクされたコピーは、以下の通りになされ得る：

−変数ｄｉｍＢｉｔＯｆｆｓｅｔ〔０〕は、０に等しくセットされ、１からＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓ−１までを含む範囲におけるｊのために、ｄｉｍＢｉｔＯｆｆｓｅｔ［ｊ］は、次のように導出される：

−ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１［ＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓ−１］の値は、５−ｄｉｍＢｉｔＯｆｆｓｅｔ［ＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓ−１]に等しいと推定される。−ｄｉｍＢｉｔＯｆｆｓｅｔ［ＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓ］の値は、６に等しく設定される。

ＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓが０より大きい場合に、ｄｉｍＢｉｔＯｆｆｓｅｔ［ＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓ−１］は、６未満であることが、ビットストリーム一致の要件である。

０からＮｕｍＳｃａｌａｂｉｌｉｔｙＴｙｐｅｓ−１までのｊのために、ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］は、（（ｎｕｈ＿ｌａｙｅｒ＿ｉｄ＆（（１＜＜ｄｉｍＢｉｔＯｆｆｓｅｔ［ｊ＋１］）−１））＞＞ｄｉｍＢｉｔＯｆｆｓｅｔ［ｊ］）に等しいと推測されることを含む。

要約すると、以下のシンタックス要素は、スケーラビリティ空間におけるその運転点によって各々の最初のＮＡＬユニットを関連することと関係している：

1) ｎｕｈ＿ｌａｙｅｒ＿ｉｄ、すなわちレイヤインジケータフィールド６９０
2) ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ＿ｆｌａｇ、すなわち空間６９８のうちのスケーラビリティ軸７００、７０２の数および意味、およびそれ故にフィールドの部分ｘ_iの数ｎを明らかにしている情報、のシーケンス
3) ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１、すなわち軸の各々のためのフィールド６９０の各部分ｘ_iのビット長、（１つを除く全て、その理由は、フィールド６９０のすべての残りのビット７０６を含むために推定され得る

ｓｐｌｉｔｔｉｎｇ＿ｆｌａｇが０に等しい場合には、マッピング概念が、使用される。マッピング情報７０８は、それから以下の情報を使用して送信される：

このように、ｓｐｌｉｔｔｉｎｇ＿ｆｌａｇが０に等しい場合には、ベクトル７１０は、明確な信号伝送なしで分割することにより、すなわちその代わりに推定されるｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］を信号伝送せずに、本質的に導出される。

このように、第４の態様に従って、すなわち「ＮＡＬユニットレイヤ識別子の切替え可能な解釈」の概念において、ビットストリーム４０は、ＮＡＬユニット、すなわち、ＶＰＳＮＡＬユニット、を含み得て、それは、「通常の」ＮＡＬユニットにおけるレイヤインジケータフィールド３０２を解釈するためにマッピング概念およびビット分割概念の間で切替わり得るタイプインジケータフィールド３００から構成され得る。このように、フィールド３０２の同じビット位置は、両方のモードにおいて使用されるが、ビットの解釈および規定情報の解釈が示される、すなわち、ビットストリームにおいて転送される、マッピング情報または分割およびセマンティック情報は、モード間において変化する。これが、タイプインジケータフィールドの更なる伝送を必要とするにもかかわらず、この概念は、全く、マッピング概念の効果としてより効率的なビットストリーム伝送につながり、そして、レイヤ等の個数に応じて、両方の概念が例えば異なるマルチレイヤデータに異なって適合しているので、ビット分割概念は、必要に応じて利用され得る。

本出願の第５の態様は、マルチ規格マルチレイヤビデオデコーダインタフェースに関する。以下に述べる概念は、トランスポートレイヤデコーダ、および、異なるレイヤ（例えばベースレイヤにおけるＨ．２６４／ＡＶＣおよびエンハンスメントレイヤにおけるＨＥＶＣ）における様々なビデオ符号化規格をサポートするトランスポートレイヤデコーダ（ＭＰＥＧトランスポートストリームまたはＲＴＰのような）およびスケーラブルなビデオデコーダの間のインターフェースを記述する。

スケーラブルビデオビットストリームは、複数のレイヤから成る：それは１つのベースレイヤから成る。そして、それは独立して復号化可能なビデオ信号およびベースレイヤ（そして、潜在的に他のエンハンスメントレイヤ）と結合して復号化のみされ得て、より高い時間分解能（時間スケーラビリティ）、空間分解能（空間スケーラビリティ）、品質（ＳＮＲスケーラビリティ）、より大きいビット深さ（ビット深さスケーラビリティ）ビデオ信号または他のカメラビュー（マルチビュースケーラビリティ）を提供する１つ以上のエンハンスメントレイヤを含む。

Ｈ．２６４／ＡＶＣＳＶＣのような既存のスケーラブルビデオ符号化規格は、同じ規格のベースおよびエンハンスメントレイヤを定義する。それらは、スケーラブルビットストリームがノンスケーラブルビットストリームのような同じ基本的なフォーマットを有するような方法で設計される。スケーラブルビットストリームがノンスケーラブルデコーダに入力される場合、それは依然パケットタイプを検出し得て、未知のパケットを廃棄し得る。

ＨＥＶＣは、符号化規格がベースレイヤ（例えばＨ．２６４／ＡＶＣ）のための様々なビデオ符号化規格を使用するのを可能にする第１のビデオ符号化規格である。両方の規格のためのパケットフォーマットは異なり、従って、ベースレイヤデコーダは、エンハンスメントレイヤパケットを理解し得ない。一方、エンハンスメントレイヤデコーダは、ベースレイヤパケットフォーマットでなく、エンハンスメントレイヤパケットフォーマットを理解し得る。

オーディオ／ビデオシステムにおいて、トランスポートレイヤは、いくつかのオーディオおよびビデオストリームを結合して、タイミングおよびストリームタイプのようなメタデータを提供するために使用される。

既存のマルチレイヤトランスポートレイヤデコーダにおいて、ベースおよびエンハンスメントレイヤのアクセスユニットは、単一のビデオデータストリーム（例えば付録ＢＨ．２６４／ＡＶＣのバイトストリーム）にマルチプレックスされる。このビデオストリームは、ビデオデコーダへの入力である。

異なるビデオ符号化規格が、ベースおよびエンハンスメントレイヤのために使用される場合、すべてのケースにおいてベースおよびエンハンスメントレイヤパケットが、単一のビットストリームに構成され得るというわけではない。

第５の態様の実施例によれば、トランスポートレイヤデコーダは、以下のケースを区別する：

１．出力を読込んでいるビデオデコーダは、ベースレイヤを復号化し得るのみである。
２．出力を読込んでいるビデオデコーダは、ベースおよびエンハンスメントレイヤを復号化し得る、そして、ベースおよびエンハンスメントレイヤは、同じビデオ符号化規格を使用して符号化される。
３．出力を読込んでいるビデオデコーダは、ベースおよびエンハンスメントレイヤを復号化し得る、そして、ベースおよびエンハンスメントレイヤは、異なるビデオ符号化規格を使用して符号化される。

ケース１において、トランスポートレイヤデコーダは、以下のビヘイビアを使用する：

ベースレイヤを含んでいるパケットのみは、トランスポートレイヤから抽出され、ビデオ符号化規格において特定されるフォーマットにおける単一規格シングルレイヤビデオデコーダに入力される。

特定の実施例は、Ｈ．２６４／ＡＶＣ仕様書の付録Ｂにおいて定義されたバイトストリームフォーマットにおけるＨ．２６４／ＡＶＣビデオデコーダに割当てられそれらに入力されるストリームタイプ"AVC video stream conforming to one or more profiles defined in Annex A of ITU-T Rec. H.264 | ISO/IEC 14496-10 or AVC video sub-bit stream"を有するストリームのみを選択することにより、ＭＰＥＧ−２トランスポートストリームからＨ．２６４／ＡＶＣＮＡＬユニットを抽出するトランスポートストリームデコーダである。そのストリームタイプがストリームタイプ"AVC video stream conforming to one or more profiles defined in Annex A of ITU-T Rec. H.264 | ISO/IEC 14496-10 or AVC video sub-bit stream"と等しくないストリームに属するＮＡＬユニットは、トランスポートストリームデコーダ内で廃棄される。図２８は、特定の実施例の具体例を与える。

ケース２において、トランスポートレイヤデコーダは、以下のビヘイビアを使用する：

ベースおよびエンハンスメントレイヤからのパケットは、トランスポートレイヤから抽出され、ビデオ符号化規格において特定されたフォーマットにおける単一規格マルチレイヤビデオデコーダに入力される。

特定の実施例は、ストリームタイプ "AVC video stream conforming to one or more profiles defined in Annex A of ITU-T Rec. H.264 | ISO/IEC 14496-10 or AVC video sub-bit stream"が割当てられたストリームタイプを有するベースレイヤストリームおよびストリームタイプ"SVC video sub-bit stream of an AVC video stream conforming to one or more profiles defined in Annex G of ITU-T Rec. H.264 | ISO/IEC 14496-10"が割当てられたストリームタイプを有する１つ以上のエンハンスメントレイヤストリームをも選択することにより、ＭＰＥＧ−２トランスポートストリームからＨ．２６４／ＡＶＣＮＡＬユニットを抽出し得る。様々なレイヤのＮＡＬユニットは、Ｈ．２６４／ＡＶＣ仕様書の付録Ｂにおいて定義されたバイトストリームフォーマットにマルチプレックスされ、Ｈ．２６４／ＡＶＣＳＶＣビデオデコーダに入力される。図２９は、特定の実施例の具体例を与える。

ケース３において、トランスポートレイヤデコーダは、以下のビヘイビアを使用する：

ベースおよびエンハンスメントレイヤからのパケットは、トランスポートレイヤから抽出される。これらのパケットは、以下のセクションに記述された方法の１つにおけるマルチ規格マルチレイヤビデオデコーダに渡される。

インターフェースA
エンハンスメントレイヤ規格パケットフォーマットは、ベースレイヤパケットを運ぶことを可能にする場合、ベースレイヤパケットは、エンハンスメントレイヤフォーマットに要約される。これは、ヘッダがエンハンスメントレイヤ規格ビデオデコーダによって理解され得る各ベースレイヤパケットに加えられ、そして、エンハンスメントレイヤビデオデコーダが様々なビデオ符号化規格のベースレイヤとしてパッケージを確認し得ることを可能にする。

本発明の特定の実施例において、Ｈ．２６４／ＡＶＣＮＡＬユニットが、ＨＥＶＣＮＡＬユニットのペイロードとして使用される。すなわち、ＨＥＶＣＮＡＬユニットヘッダが、Ｈ．２６４／ＡＶＣＮＡＬユニットヘッダの前に加えられる。ＨＥＶＣＮＡＬユニットヘッダ（例えばｎａｌ＿ｕｎｉｔ＿ｔｙｐｅ）におけるフィールドは、Ｈ．２６４／ＡＶＣのＮＡＬユニットとしてペイロードを確認するために使用される。ビットストリームは、ＨＥＶＣ付録Ｂバイトストリームフォーマットにおけるビデオデコーダに入力され得る。図３０は、特定の実施例の具体例を与える。

インターフェースＢ
異なるチャンネルは、スケーラブルなビットストリームの各レイヤのために使用される。ビデオ符号化規格は、チャンネル選択によりデコーダにおいて決定される。

２つのレイヤのための本発明の特定の実施例において、２つのレイヤが、２つの別々のチャネルにおいて手渡される。第２のチャンネルがＨＥＶＣエンハンスメントレイヤパケットの用途にのみ、使用されると共に、第１のチャンネルがＨ．２６４／ＡＶＣベースレイヤパケット（またはアネックスＢバイトストリーム）の用途にのみ、使用される。

インターフェースＣビデオ符号化規格のタイプを示しているメタデータフィールドは、トランスポートストリームデコーダからマルチ規格マルチレイヤビデオデコーダまで通過する各パケットと関連している。他のメタデータ、例えばタイミング等は、同様に示され得る。

特定の実施態様において、各ベースレイヤＮＡＬユニットは、関連するメタデータフィールドによるＨ．２６４／ＡＶＣＮＡＬユニットとして確認され、そして、各エンハンスメントレイヤＮＡＬユニットは、関連するメタデータフィールドによるＨＥＶＣＮＡＬユニットとして確認される。

このように、第５の態様の概念は、様々のコーデックのビットストリームを結合する方法に関して可能性を提供している「マルチ−規格マルチ−レイヤビデオデコーダインターフェース」として記述され得る。

このように、本出願の第５の態様によれば、図４４に関して以下で概説されるように、トランスポートレイヤデコーダが構成され得る。図４４に示されるトランスポートレイヤデコーダは、通常、参照符号７７０を使用して示される。トランスポートレイヤデコーダ７７０は、シーンがレイヤにおいて符号化されるインバウンドマルチレイヤビデオデータストリーム４０を、トランスポートレイヤデコーダ７７０の出力インターフェースが接続されるマルチ規格マルチレイヤデコーダ７７２によって復号化させるように構成される。マルチレイヤビデオデータストリーム４０は、説明が図４４の実施例上へ移動し得る、本出願のさまざまな他の態様に関して上記ですでに概説された、合成されたＮＡＬユニットである。ＮＡＬユニットの各々は、レイヤのうちの１つと関係している。レイヤは、様々なコーデック、すなわち様々な規格と関連している。各レイヤに対し、それぞれのレイヤと関連したＮＡＬユニットは、同じコーデック、すなわち、それぞれのレイヤが関連するもの、を使用して符号化される。

トランスポートレイヤデコーダ７７０は、ＮＡＬユニットごとに、同上がどのコーデックと関係しているかについて識別するように構成される、そして、マルチレイヤビデオデータストリーム４０のＮＡＬユニットを、マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用するマルチ規格マルチレイヤデコーダに引き渡す。

上述したように、すでに本出願の第４の態様に関して上記で概説されるように、各ＮＡＬユニットは、特定のレイヤインジケータフィールドを経由してマルチレイヤビデオデータストリーム４０のレイヤのうちの１つと関連し得る。ＮＡＬユニットの一部、または、大部分は、内容関連のデータ、すなわち、一つ以上のスライス、をもたらし得る。レイヤの特定のセットに関してすべてのＮＡＬユニットを集めることにより、データストリーム４０に符号化されるビデオコンテンツまたはシーンは、レイヤのこのセットにより与えられた情報量で、デコーダ７７２により復号化され得る。レイヤ依存、２つ以上のスケーラビリティ次元を有するオプションその他に関して、本出願の第４の態様の説明が参照される。

マルチレイヤマルチ規格デコーダ７７２は、様々なコーデック／規格を扱い得る。様々な規格のための実施例は、上記、すなわちＨ．２６４、ＨＥＶＣ、に示された、しかし、他の規格は、同様に混合され得る。異なるコーデック／規格は、ハイブリッドコーデックに制限されない。むしろ、コーデックの異なる種類の混合物が、同様に用いられ得る。マルチレイヤマルチ規格デコーダ７７２により使用されたインターレイヤ予測は、異なるレイヤにおいて使用された予測パラメータに関連し得るか、または様々な時間整列配置されたレイヤの画像サンプルに言及し得る。これは、他の態様および実施例に関して上記ですでに記載されていた。

トランスポートレイヤデコーダ７７０は、マルチレイヤマルチ規格デコーダ７７２のみが対処し得るコーデックのレイヤに属しているＮＡＬユニットの中で手渡すことを実行するように構成され得る。すなわち、トランスポートレイヤデコーダ７７０によって実行された手渡しは、各ＮＡＬユニットが関連するコーデックのトランスポートレイヤデコーダ７７０の識別に依存し得る。特に、トランスポートレイヤデコーダ７７０は、ＮＡＬユニットごとに以下を実行し得る：

・現在検査されるＮＡＬユニットが、ＮＡＬユニットのＮＡＬユニットヘッダにおけるレイヤインジケータフィールドを、例えば、検査することによって関連しているレイヤを確認する。
・データストリーム４０のそれぞれの高水準シンタックスの調査に基づきトランスポートレイヤデコーダ７７０により導出された、一方ではデータストリーム４０のレイヤおよび同上のコーデック／規格の間の関連、に基づき、トランスポートレイヤデコーダ４０は、現在検査されたＮＡＬユニットが２つの基準を満たすか否かを決定する：ＮＡＬユニットレイヤは、デコーダ７７２に転送されるべきレイヤのサブセットに属し、どのサブセットがスケーラビリティ空間内における現在検査されたＮＡＬユニットレイヤの運転点により決定され、スケーラビリティ空間内におけるいずれの運転点がマルチレイヤマルチ規格デコーダ７７２に転送され得るか、そして、そうでないかに関する院外処方が、決定される。更に、トランスポートレイヤデコーダ７７０は、現在検査されたＮＡＬユニットレイヤコーデックが、マルチレイヤマルチ規格デコーダ７７２が扱い得るコーデック／規格のセットに属するかどうかを調べる。
・チェックで両方の基準が現在検査されたＮＡＬユニットによって満足されることが分かる場合、トランスポートレイヤデコーダ７７０は、復号化するためのデコーダ７７２に現在のＮＡＬユニットを転送する。

様々な可能性が、一方ではデータストリーム４０に含まれるレイヤを他方では同上の基礎となるレイヤ間に上述した関連を他方では同上の基礎となるコーデック／規格を決定するために、トランスポートレイヤデコーダ７７０のために存在する。例えば、「インターフェースＢ」に関して、上記で説明したように、様々なチャネルが、データストリーム４０、すなわち、１つのチャネル上の１つのコーデック／規格のレイヤのＮＡＬユニットおよび他のチャネル上の他のコーデック／規格に従って符号化されたレイヤのＮＡＬユニット、を伝達するために使用され得る。この測定によって、トランスポートレイヤデコーダ７７０は、さまざまなチャネル間で区別することにより、一方ではレイヤ間でちょうど言及された関連をおよび他方ではコーデック／規格を導出し得る。例えば、トランスポートレイヤデコーダ７７０は、データストリーム４０の各ＮＡＬユニットに対し、それぞれのＮＡＬユニットまたはそれぞれのＮＡＬユニットのレイヤが関連するコーデック／規格を確認するためにそれぞれのＮＡＬユニットが到着するチャネルを決定する。

加えて、または、あるいは、他のチャネルに、１つのコーデック／規格に属するレイヤのＮＡＬユニットがデコーダ７７２に対する１本のチャネル上に送信され、かつ様々なコーデック／規格のレイヤのＮＡＬユニットがマルチレイヤマルチ規格デコーダ７７２に転送されるように、トランスポートレイヤデコーダ７７０は、それぞれのコーデック／規格に依存する態様でマルチレイヤマルチ規格デコーダ７７２に様々なコーデック／規格に属するレイヤのＮＡＬユニットを転送し得る。

「異なるチャネル」は、基礎にあるトランスポートレイヤによって設けられ得る。すなわち、理解の容易のための図４４に示されない、下記にあるトランスポートレイヤによって設けられているように、様々なチャネル間の識別は、異なるチャネル識別子間を区別することによって実現され得る。

データストリーム４０をマルチレイヤマルチ規格デコーダ７７２に手渡す他の可能性は、トランスポートレイヤデコーダ７７０がそれぞれのレイヤのコーデックを示している状態に設定されるＮＡＬユニットタイプインジケータを有する所定のコーデックのＮＡＬユニットヘッダを使用して所定のコーデックと異なるいかなるコーデックとも関連しているレイヤと関連しているとして確認されていたそれらのＮＡＬユニットをカプセル化するということである。これは、以下を意味する：所定のコーデックは、例えば、データストリーム４０のいかなるエンハンスメントレイヤのいかなるコーデックでもあり得る。ベースレイヤコーデック、すなわちデータストリーム４０のベースレイヤと関連したコーデック、は、例えば、ＨＥＶＣである所定のコーデックと異なり得る。従って、同上をマルチレイヤマルチ規格デコーダ７７２に渡すときに、トランスポートレイヤデコーダ７７０は、データストリーム４０を所定のコーデックに一致するデータストリームに変換し得る。この目的を達成するために、トランスポートレイヤデコーダ７７０は、所定のコーデックのＮＡＬユニットヘッダを使用して、所定のコーデックを使用して符号化されないレイヤに属する各ＮＡＬユニットをカプセル化し、そして、それぞれの実際のレイヤのコーデックを示している状態に、そのＮＡＬユニットヘッダの範囲内でＮＡＬユニットタイプインジケータをセットする。例えば、ベースレイヤＮＡＬユニットは、例えば、Ｈ．２６４である、そして、ベースレイヤのＮＡＬユニットは、したがって、Ｈ．２６４を示している状態に設定されるＮＡＬユニットタイプインジケータを有するＨＥＶＣおよびＮＡＬユニットヘッダを使用してカプセル化される。マルチレイヤマルチ規格７７２は、従って、データストリームに従うＨＥＶＣを受信する。

当然ながら、インターフェースＣについて述べたように、トランスポートレイヤデコーダ７７０が、インバウンドデータストリーム４０の各ＮＡＬユニットにそれぞれのＮＡＬユニットが関連したレイヤが関連するコーデックを示すメタデータを提供することは、あるいは、可能である。データストリームの４０個のＮＡＬユニットは、したがって、このようにして拡張態様におけるデコーダ７７２に送られる。

ちょうど記載されている変形例を使用して、しかしながら、他のコーデック、例えばより新規なコーデック、を使用して符号化される更なるレイヤによってデータストリームに符号化される内容を拡張することは実現可能である、そして、コーデック４０の既存の部分は、訂正される必要はない。より新規なコーデック、すなわち新規に加えられたもの、を順に取扱い得る、マルチレイヤマルチ規格デコーダは、既存のデータストリームのこの種の混合物をより新規なコーデックを使用して符号化されるレイヤで処理し得る。

このように、ＨＥＶＣスケーラブルビットストリームのための並列の／低遅延のビデオ符号化概念は、上記で提示された。

高効率ビデオ符号化（ＨＥＶＣ）規格［１］は、最初に、エンコーダおよびデコーダ側上の並列処理を可能にする２つの専用並列化ツールを特徴とする：タイルおよび波面並列処理（ＷＰＰ）。これらのツールは、個々の画像の範囲内で並列処理を特徴としないＨＥＶＣ符号化ビデオと比較したとき、符号化効率損失を最小化する間に、処理時間改善を目標とする画像の範囲内で、並列化を可能にする。

スケーラブルな〔２〕またはマルチビュー［３］ＨＥＶＣビットストリームにおいて、復号化されたベースレイヤまたはベースビュー画像は、エンハンスメントレイヤまたは従属するビュー画像を予測するために用いる。上述の説明において、終端のレイヤは、また、同時にビューの概念もカバーするために使用された。

前記実施例は、関連するベースレイヤ画像の復号化が終了する前に、エンハンスメントレイヤ画像の復号化を開始し得るスケーラブルビデオデコーダを記述する。画像エリアの復号化は、各レイヤにおいて使用される高水準並列化ツールに基づいてパイプライン処理される。ベースおよびエンハンスメントレイヤデコーダは、互いに並列に、同時に、実際のレイヤの範囲内で並列に動作し得る。各レイヤの範囲内の並列化度は、ベースおよびエンハンスメントレイヤの間で異なり得る。更に、信号伝送は、適切に特定のビットストリームのための並列復号化環境を準備することを必要とすることが記述された。

一般的な注釈として、以下に、注意されたい：上述の実施例は、デコーダを記述し、かつ、さまざまな態様に従う対応して設計されたエンコーダを記述する。すべてのこれらの態様に関する限り、それらの全てが共通してそのデコーダおよびエンコーダがＷＰＰおよび／またはタイル並列処理をサポートし得ることに注意されたい、そして、従って、どこで詳細がその辺に記載されていても、これらの詳細は、他のいかなる態様に同時に適用されるとして取扱われ、かつ、それらに対応する説明は、これらの他の態様の新規な実施例に通じるか、またはこれらの他の態様の実施例の説明を補足するために、−それぞれの説明が転送されるそれぞれの態様が画像の並列処理可能なセグメントをより一般的に意味するためのタイル／サブストリームの代わりに用語「部分」、「空間セグメント」等を使用して記載されているかどうか、に関係なく、同時に他の態様のいずれかに当てはまると見なされる。同じことは、画像を再分割するあり得る方法を述べている符号化／予測パラメータおよび説明に関して詳細に当てはまる：すべての態様は、同上を単位とするタイルおよび／またはサブストリームを決定することに関するＬＣＵｓ／ＣＴＢへの再分割を使用するデコーダ／エンコーダに結果としてなるために実現され得る。加えて、これらの態様のいずれかにおいて、ＬＣＵｓ／ＣＴＢは、態様およびそれらの実施例のサブセットに関して上述したように、再帰的なマルチツリー再分割を使用することにより符号化ブロックに更に再分割され得る。そして、加えて、または、あるいは、スライスおよびサブストリーム／タイル間の関係が記述されることに関するそれらの態様から、スライス概念は、すべての態様の実施例により採用され得る。

若干の態様が装置のコンテキストに記述されていたにもかかわらず、これらの態様も対応する方法の説明を表すことは明らかであり、ここで、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップのコンテキストに記載されている態様は、対応するユニットのブロックまたは項目または特徴に対応する説明も表す。方法ステップのいくつかまたは全ては、ハードウェア装置、例えば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路等、によって実行され（または使用され）得る。いくつかの実施形態では、最も重要な方法ステップのいくつかの一つ以上は、この種の装置により実行され得る。

特定の実施要件に応じて、本発明の実施例は、ハードウェアにおいて、または、ソフトウェアにおいて実現され得る。実現は、その上に格納される電子的に可読な制御信号を有するデジタル記憶媒体、例えば、フロッピー（登録商標）ディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはＦＬＡＳＨメモリ、を使用して実行され得る。そして、それぞれの方法が実行されるように、それはプログラム可能なコンピュータシステムと協同する（または協同し得る）。従って、デジタル記憶媒体は、計算機可読であり得る。

本発明によるいくつかの実施例は、本願明細書において記載されている方法のうちの１つが実行されるように、プログラム可能なコンピュータシステムと協同し得る、電子的に可読な制御信号を有するデータ担体を含む。

通常、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として実現され得る。そして、コンピュータプログラム製品がコンピュータ上で実行されるときに、プログラムコードが方法の１つを実行するために動作されている。プログラムコードは、機械可読担体に例えば格納され得る。

他の実施例は、本願明細書において記載され、機械可読担体に格納された方法の１つを実行するためのコンピュータプログラムを含む。

換言すれば、発明の方法の実施例は、従って、コンピュータプログラムがコンピュータ上で実行されるとき、本願明細書に記載されている方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

発明の方法の更なる実施例は、従って、その上に記録された、本願明細書において記載されている方法の１つを実行するためのコンピュータプログラムから成るデータ担体（またはデジタル記憶媒体またはコンピュータ可読媒体）である。データ担体、デジタル記憶媒体または記録された媒体は、通常は有形および／または、非過渡的である。

発明の方法の更なる実施例は、従って、本願明細書に記載されている方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号の系列である。データストリームまたは信号の系列は、データ通信接続を介して、例えばインターネットを介して転送されるように、例えば構成され得る。

更なる実施例は、本願明細書に記載されている方法の１つを実行するように構成された、あるいは実行するのに適合する処理手段、例えばコンピュータまたはプログラム可能な論理装置、を含む。

更なる実施例は、本願明細書に記載されている方法の１つを実行するためのコンピュータプログラムがその上にインストールされたコンピュータを含む。

本発明による更なる実施例は、レシーバに本願明細書において記載されている方法の１つを実行するためのコンピュータプログラムを転送する（例えば、電子的に、または、光学的に）ように構成されるユニットまたはシステムを含む。レシーバは、例えば、コンピュータ、モバイル機器、メモリデバイス等であり得る。ユニットまたはシステムは、例えば、コンピュータプログラムをレシーバに転送するためのファイルサーバを含み得る。

いくつかの実施形態では、プログラム可能な論理ユニット（例えばフィールドプログラマブルゲートアレイ）は、本願明細書において記載されている方法の機能のいくつかまたは全てを実行するために使用し得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本願明細書において記載されている方法の１つを実行するために、マイクロプロセッサと協同し得る。通常、方法は、いかなるハードウェアユニットによっても好ましくは実行される。

本願明細書において記載されている装置は、ハードウェアユニットを使用するか、またはコンピュータを使用するか、またはハードウェア装置およびコンピュータの組合せを使用して実現し得る。

本願明細書において記載されている方法は、ハードウェアユニットを使用するか、またはコンピュータを使用するか、またはハードウェア装置およびコンピュータの組合せを使用して実行され得る。

上述の実施例は、本発明の原理を単に説明するだけである。変更および配置のバリエーションおよび本願明細書において記載されている詳細は、他の当業者にとって明らかであることが理解される。従って、係属中の特許クレームの範囲のみにより、そして、本願明細書において実施例の明細書および説明として示される具体的な詳細だけであることにより制限されないことが、意図される。

このように、以下の態様は、上述されている。

第１の態様は、第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層においてシーンが符号化されるマルチレイヤビデオデータストリーム（４０）を復号化するためのビデオデコーダであって、前記ビデオデコーダは、前記レイヤの画像（１２，１５）が再分割される空間セグメント（８０）における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６０６；例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ）を以下のために検査し、
前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記画像（１２）の前記空間セグメントの各境界を覆い、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素（例えば６０２；ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］およびｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］）に基づく前記空間セグメントへの前記第１のレイヤおよび前記第２のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔（６０４）で、周期的に決定するように、前記所定期間（６０８）の間、前記第２のレイヤの前記画像（６０８）が再分割される保証として第１のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝１）から値を仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素構造が、第２のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝０）から値を仮定した場合、少なくとも前記短期シンタックス要素の第１のあり得る値に対し、前記第１のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第２のレイヤの前記画像の前記空間セグメントの間に境界が存在し、かつ、少なくとも前記短期シンタックス要素の第２のあり得る値に対し、前記第１のレイヤの前記空間セグメントの各境界を覆う前記第２のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、ように構成されているビデオデコーダに関する。

第２の態様は、それぞれの前記空間セグメントの境界で各空間セグメントごとに前記イントラピクチャ空間予測を中断させることを伴うイントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化する；または、
前記第１のレイヤの前記画像の前記空間セグメントの境界と交差していて、前記第１のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第１のレイヤの画像の前記空間セグメントを復号化することにより、および前記第２のレイヤの前記画像の前記空間セグメントの境界を交差していて、前記第２のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第２のレイヤの画像の前記空間セグメントを復号化することにより、イントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化するように構成された、第１の態様に記載のビデオデコーダに関する。

第３の態様は、前記レイヤの画像が再分割されるタイルにおける前記マルチレイヤビデオデータストリームのタイル並列復号化をサポートし、
前記デコーダは、
前記第１のあり得る値のセットから値を仮定している長期シンタックス要素を、前記第２のレイヤの前記画像の前記タイル間の境界が前記第１のレイヤの前記タイルの各境界を覆い、かつ前記短期シンタックス要素に基づき前記第１のレイヤと関連して前記第２のレイヤの前記画像の再分割のタイル改良を、所定期間より短い時間間隔において、周期的に決定するように、所定期間の間、前記第２のレイヤの前記画像が再分割される保証として、解釈し、かつ、
前記長期シンタックス要素が前記第２のあり得る値のセットから前記値を仮定した場合、少なくとも前記短期シンタックス要素の第１のあり得る値に対し、前記第１のレイヤの前記タイルの前記境界のいずれも覆っていない前記第２のレイヤの前記画像の前記タイル間で境界が存在し、かつ、少なくとも前記短期シンタックス要素の第２のあり得る値に対し、前記第１のレイヤの前記タイルの各境界を覆う前記第２のレイヤの前記画像の前記タイル間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記レイヤの前記画像の前記タイルへの前記再分割を、前記所定期間より短い時間間隔において、周期的に決定するように構成された、第１の態様または第２の態様に記載のビデオデコーダに関する。

第４の態様は、前記ビデオデコーダは、それぞれの前記タイルの境界線で各タイルのイントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用しているレイヤの画像を復号化するように構成されている、第３の態様に記載のビデオデコーダに関する。

第５の態様は、前記デコーダは、所定期間の間、前記第１のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存するｎでもって第２のレイヤの前記画像の正確にｎの空間セグメントを占めるように、前記第２のレイヤの前記画像が再分割される保証として、第１のあり得る値からの値であることを仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素が第２のあり得る値のセットの中の値にセットされる場合、前記所定期間よりも短い期間において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定するように構成された、第１または第２の態様に記載のビデオデコーダに関する。

第６の態様は、前記デコーダは、前記第１のあり得る値であるか否かの中から前記値を仮定する前記長期シンタックス要素構造に依存する前記マルチレイヤビデオデータストリームの前記第２のレイヤを復号化するための検査を開始するか開始しないかを決定するように構成されている、第１または第２の態様に記載のビデオデコーダに関する。

第７の態様は、前記ビデオデコーダは、ハイブリッドビデオデコーダである、第１ないし第６の態様のいずれかに記載のビデオデコーダに関する。

第８の態様は、前記マルチレイヤビデオデータストリームが、前記レイヤの画像が再分割される空間セグメントにおいて、並列に復号化可能であるように、第１のレイヤから第２のレイヤまでインターレイヤ予測を使用しているレイヤの階層においてマルチレイヤビデオデータストリームにシーンを符号化するためのビデオエンコーダであって、前記エンコーダは、
長期シンタックス要素構造（６０６）および短期シンタックス要素（６０２）を前記マルチレイヤビデオデータストリームに挿入し、かつ、前記短期シンタックス要素は、前記時間間隔において、前記第１のレイヤおよび前記第２のレイヤの前記画像の前記空間セグメントへの前記再分割を定義し、かつ
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間（６０８）の間、第１のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第２のレイヤの前記画像の前記空間セグメントの間の境界は前記第１のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第２のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第２のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第１のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第２のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも１つの設定を、および、前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えるように構成された、ビデオエンコーダに関する。

第９の態様は、前記ビデオエンコーダは、前記それぞれの空間セグメントの境界で各空間セグメントに対し前記イントラピクチャ空間予測を中断させるとともにイントラピクチャ空間予測を使用している前記レイヤの前記画像を符号化し；あるいは、
前記第１のレイヤの画像の前記空間セグメントの境界を横断する前記イントラピクチャ空間予測をサポートすることにより、および、前記第１のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第１のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、および前記第２のレイヤの画像の前記空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートすることにより、および、前記第２のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第２のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従い、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記レイヤの前記画像を符号化しかつエントロピーコンテキスト確率に適合するエントロピー符号化を行うように構成されている、第８の態様に記載のビデオエンコーダに関する。

第１０の態様は、前記空間セグメントはタイルであり、前記エンコーダは、
前記長期シンタックス要素構造を設定する場合、
前記第１のあり得る値のセット（ｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝１）からの値は、前記時間間隔より大きい所定期間の間に、前記短期シンタックス要素を一組のあり得る設定から適当なサブセットに設定され、前記所定期間の間に、タイルへの前記第２のレイヤの画像の再分割が一致するかまたはタイルへの前記第１のレイヤの画像の再分割を精緻化するように前記適当なサブセットが選択されている、あるいは、
第２のあり得る値のセット（ｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝０）からの値は、前記所定期間の間に、前記第１のレイヤの前記タイルの前記境界のいずれかに重畳しない前記第２のレイヤの前記画像の前記タイルの間に境界が存在することにより、前記短期シンタックス要素は、前記所定期間の間少なくとも一回間隔で、あり得る設定の前記セットの第１のあり得る値にセットされるように設定され、前記所定期間の間、少なくとも他の時間間隔に対し、前記第２のレイヤの前記画像の前記タイルが前記第１のレイヤの前記タイルの各境界に重畳する間境界に従って、あり得る設定の前記セットの第２のあり得る値に設定する、ように構成された第８または第９の態様に記載のビデオエンコーダに関する。

第１１の態様は、前記ビデオエンコーダは、それぞれの前記タイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させつつ、イントラピクチャ空間予測を使用している前記レイヤの前記画像を符号化するように構成されている、第１０の態様に記載のビデオエンコーダに関する。

第１２の態様は、前記エンコーダは、
前記長期シンタックス要素構造を、
前記第１のあり得る値からの値に設定する場合、前記時間間隔より長い前記所定期間を使用して、前記短期シンタックス要素を一連のあり得るセットからの適切なサブセットに設定し、所定期間の間、前記第１のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存してｎを有する第２のレイヤの前記画像のｎ空間セグメントから正確に成立つように前記適切なサブセットが選択されているように構成されている、第８または第９の態様に記載のビデオエンコーダに関する。

第１３の態様は、画像が異なる空間レイヤにおいておよび、前記空間レイヤの少なくとも１つのために、第１の空間セグメントにおいて符号化される空間スケーラブルビットストリーム（４０）を復号化するためのデコーダであって、前記デコーダは、
前記第１の空間セグメントに依存する前記アップサンプリングされた基準画像の分割（６２２）の任意の部分が、前記分割の他の任意の分割により覆われた前記第１の空間レイヤの前記画像の部分から独立であるように、あるいは、
前記アップサンプリングされた基準画像の前記分割（６２２）の任意の部分が、前記それぞれの分割に空間的に隣接する分割の他の分割により覆われた前記第１の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得て前記アップサンプリングされた基準画像を使用して第２の空間レイヤを予測するために第１の空間レイヤの画像（１２）をアップサンプリングし、そして、前記デコーダは、前記シンタックス要素に依存して、前記第１の空間レイヤの前記画像を補間（６２０）するために、前記空間スケーラブルビットストリームにおいてシンタックス要素（６１６；例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ）に応答する、ように構成されているデコーダに関する。

第１４の態様は、前記デコーダは、異なる空間レイヤを並列に復号化するように構成されている、第１３の態様に記載のデコーダに関する。

第１５の態様は、前記デコーダは、前記第１の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第１の空間セグメントの他のいずれかによって覆われる前記第１の空間レイヤの前記画像の部分から独立しているように、または、
前記第１の空間セグメントのいずれかによって空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分も、前記それぞれの空間セグメントに隣接して、前記第１の空間セグメントの他のいかなる空間セグメントによって覆われた前記第１の空間レイヤの前記画像の部分に依存しているように、シンタックス要素に応じて、前記第１の空間レイヤの前記画像を補間（６２０）するために、前記空間スケーラブルビットストリームにおける前記シンタックス要素（６１６）に応答する、第１３または第１４の態様によるデコーダに関する。

第１６の態様は、前記空間スケーラブルビットストリームは、前記第１の空間セグメントにおいてそこに符号化される第２の空間レイヤの前記画像を有する、第１３〜第１５の態様のいずれかに記載のデコーダに関する。

第１７の態様は、前記デコーダは、
前記それぞれの第１の空間セグメントの境界で各第１の空間セグメントに対する前記イントラピクチャ空間予測を中断させながら、または、
前記第１の空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートしながら、エントロピーコンテキスト確率の適合を使用して最初の各空間セグメントをエントロピー復号化しながら、かつ第１の空間セグメントその他から独立して前記第１の空間セグメントの前記エントロピーコンテキスト確率を初期化しながら、または、前記以前の第１の空間セグメントの中間位置まで適合するように、前記第１のレイヤの前記画像の前記空間セグメントの以前の第１の空間セグメントの、前記第１の空間セグメントの間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記復号化を実行するように構成された、第１３〜第１６の態様のいずれかの態様に記載のデコーダに関する。

第１８の態様は、（例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝２）前記第２のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記第２のタイルの他のいずれかにより空間的に覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、（例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝１）前記第１および第２のタイルの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第１および第２のタイルの空間的に同位置に配置された境界により空間的に限定された、前記アップサンプリングされた基準ピクチャの他のいずれかの部分により覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
（例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝０）前記第２のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記それぞれのタイルに隣接している第２のタイルの他のいずれかによって覆われた前記第１の空間レイヤの前記画像の部分に依存しているように、
前記空間スケーラブルビットストリームが前記第１の空間セグメントにおいてその中に符号化された前記第１の空間レイヤの前記画像を有し、前記第２の空間セグメントにおいてその中に符号化された前記第２の空間レイヤの前記画像を有し、前記デコーダは、前記シンタックス要素に依存して、前記第１の空間レイヤの前記画像を補間するために、前記空間スケーラブルビットストリームにおいて前記シンタックス要素（６０６）に応答する、第１３または第１４の態様に記載のデコーダに関する。

第１９の態様は、前記デコーダは、前記独立を達成するために、前記フィルタカーネルが突出する前記第１の空間レイヤの前記画像の前記それぞれの部分から独立して断片が満たされたことに従う代替規則を使用して、前記分割する前記他の分割のいずれかにより覆われ、前記第１の空間レイヤの前記画像のいずれの種類の部分に突出する、前記第１の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を満たすように構成されている、第１３〜第１８の態様のいずれかに記載のデコーダに関する。

第２０の態様は、前記デコーダは、前記第１の空間レイヤの画像の外側境界から突出している前記フィルタカーネルの断片を満たしている前記代替規則を使用するように構成されている、第１９の態様に記載のデコーダに関する。

第２１の態様は、前記デコーダは、ビデオデコーダであって、画像ごとにまたは画像−シーケンスの基礎ごとに前記空間スケーラブルなビットストリームにおける前記シンタックス要素（６０６）に応答するように構成されている、第１３〜第２０の態様のいずれかに記載のデコーダに関する。

第２２の態様は、前記空間スケーラブルビットストリームは、前記第１の空間セグメントにおいてその中に符号化される前記第１の空間レイヤの前記画像を有し、前記空間スケーラブルビットストリームは、第２の空間セグメントに符号化された前記第２の空間レイヤの前記画像を有し、前記分割の境界は、前記第１および第２の空間セグメントの境界の空間重畳の論理積にあるいは前記第２の空間セグメントの前記境界に対応し、前記デコーダは、前記第１の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を、前記シンタックス要素に依存して、満たすために応答し、前記断片が前記フィルタカーネルが突出する前記第１の空間レイヤの前記画像の前記それぞれの部分から独立してあるいは前記フィルタカーネルが突出する前記第１の空間レイヤの前記画像の前記それぞれの部分を使用して前記断片が充填されることに従って前記代替規則を使用する前記分割の隣接する分割に１つの分割から突出する、第１３ないし第２１のいずれかの態様に記載のデコーダに関する。

第２３の態様は、前記デコーダは、シンタックス要素（６０６）に依存するインターレイヤオフセットを用いて並列に前記第１および第２のレイヤを復号化するように構成されている、第１３〜第２２の態様のいずれかに記載のデコーダに関する。

第２４の態様は、前記デコーダは、前記シンタックス要素に従属する前記第１および第２の空間セグメントの境界、または、前記第２の空間セグメントの境界、の空間重畳の論理積に対応するように、前記分割の境界を設置するように構成されている、第１３または第２３の態様に記載のデコーダに関する。

第２５の態様は、様々な空間レイヤにおいて、および前記空間レイヤの少なくとも１つに対し第１の空間セグメントにおいて、画像を空間スケーラブルなビットストリームに符号化するエンコーダであって、前記エンコーダは、
前記第１の空間セグメントに依存する前記アップサンプリングされた基準画像の分割のいかなる分割が、前記分割の前記他のいかなる分割により覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、または
前記アップサンプリングされた基準画像の前記分割のいかなる分割が、前記それぞれの分割に空間的に隣接している前記分割の他の分割により覆われた前記第１の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るためにおよび前記アップサンプリングされた基準画像を使用して第２の空間レイヤの画像を予測するために、第１の空間レイヤの画像をアップサンプリングし、前記エンコーダは、シンタックス要素（６０６）を空間スケーラブルビットストリームにセットしかつ挿入し、かつ前記シンタックス要素に依存して、前記第１の空間レイヤの前記画像を補間するよう構成されている、エンコーダに関する。

第２６の態様は、前記エンコーダは、
前記第１の空間セグメントのいずれかによって空間的に覆われたアップサンプリングされた基準画像のいかなる部分が、前記第１の空間セグメントの他のいずれかにより覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第１の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第１の空間セグメントの他のいかなる空間セグメントによって覆われる前記第１の空間レイヤの前記画像の部分に従属して、前記それぞれの第１の空間セグメントに隣接するように、
前記シンタックス要素を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に応じて、前記第１の空間レイヤの前記画像を補間するように構成されている、第２５の態様に記載のデコーダに関する。

第２７の態様は、前記エンコーダは、前記第１の空間レイヤを、前記第１の空間セグメントにおける前記空間スケーラブルビットストリームに前記第１の空間レイヤの画像をエンコードするように構成されている、第２５または第２６の態様に記載のエンコーダに関する。

第２８の態様は、前記エンコーダは、前記それぞれの第１の空間セグメントの境界で各第１の空間セグメントに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用している前記第１の空間レイヤの画像を符号化するように構成されている、第２７の態様に記載のエンコーダに関する。

第２９の態様は、前記第２の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記第２の空間セグメントの他のいずれかにより空間的に覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第１および第２の空間セグメントの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第１および第２の空間セグメントの空間的に同位置に配置された境界により空間的に制限された、前記アップサンプリングされた基準画像の他のいずれかの部分により覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第２の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記それぞれの空間セグメントに隣接する第２の空間セグメントの他のいずれかにより覆われた前記第１の空間レイヤの前記画像の部分に従属するように、
前記エンコーダは、前記第２の空間レイヤの前記画像を前記第２の空間セグメントにおける前記空間スケーラブルビットストリームに符号化されるように構成され、前記エンコーダは、前記シンタックス要素を前記空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第１の空間レイヤの前記画像を補間するように構成されている、第２７または第２８の態様に記載のエンコーダに関する。

第３０の態様は、前記エンコーダは、前記それぞれの第２の空間セグメントの境界で各第２の空間セグメントに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間画像を使用している前記第２の空間レイヤの前記画像を符号化するように構成されている、第２９の態様に記載のエンコーダに関する。

第３１の態様は、前記エンコーダは、前記第１の空間レイヤの前記画像の任意の部分からの前記独立を成し遂げるために、前記第１の空間レイヤの前記画像の前記補間において使用されるフィルタカーネルの断片を満たすために、前記第１の空間レイヤの前記画像のそのような部分に突出し、前記フィルタカーネルがその中に突出する前記第１の空間レイヤの前記画像の各部から独立して前記断片が満たされることに従って代替規則を使用するように構成されている、第２５〜第３０の態様のいずれかに記載のエンコーダに関する。

第３２の態様は、前記エンコーダは、前記第１の空間レイヤの前記画像の外側境界から突出しているフィルタカーネルの断片を満たしている代替規則をも使用するように構成される、第３１の態様に記載のエンコーダに関する。

第３３の態様は、前記エンコーダは、ビデオエンコーダであって、前記シンタックス要素を画像ごとにまたは画像シーケンスの基礎ごとに前記空間スケーラブルビットストリームにセットしかつ挿入するように構成されている、第２５〜第３２の態様のいずれかに記載のエンコーダに関する。

第３４の態様は、シーンが第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリームを復号化するためのビデオデコーダであって、前記ビデオデコーダは、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することにより分割された前記レイヤの画像への空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、
前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６４２；例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）を検査し、
前記長期シンタックス要素構造（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）があり得る値の第１のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素（６０２）にそれぞれ基づき前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の前記第１のセットと素なあり得る値の第２のセット（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値にセットされた場合、前記所定期間よりも短い時間間隔で、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づき前記所定期間内で前記インターレイヤオフセットを周期的に決定する、ように構成されているビデオデコーダに関する。

第３５の態様は、前記ビデオデコーダは、前記第２のレイヤの画像のサブストリームの前記横断に関して、前記第１のレイヤの画像のサブストリームの前記横断の間に、前記同じ画像および前記インターレイヤオフセットの直接的に連続したサブストリームの前記横断の間にイントラピクチャインターサブストリーム遅延を伴って時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して、前記レイヤの画像が分割され、前記レイヤの前記画像が定期的に再分割されるブロックの行からなるサブストリームにおける前記マルチレイヤビデオデータストリームを並列に復号化するように構成されている、第３４の態様に記載のビデオデコーダに関する。

第３６の態様は、前記ビデオデコーダは、前記サブストリームの境界と交差するイントラピクチャ空間予測をサポートする、前記サブストリームを並列に復号化するように構成されている、第３５の態様に記載のビデオデコーダに関する。

第３７の態様は、前記ビデオデコーダは、前記レイヤの画像が分割されるタイルにおける前記マルチレイヤビデオデータストリームを復号化するように構成されており、前記第１および第２のレイヤの前記画像の各々の中で前記タイルの間のタイル順序で前記タイルを横断して、前記第２のレイヤの前記画像のタイルの前記横断と関連して前記第１のレイヤの前記画像の前記タイルの前記横断との間に前記インターレイヤオフセットと並列に前記第１のレイヤの画像の直ちに後続するタイルおよび前記第２のレイヤの画像の直ちに後続するタイルを復号化するように構成されている、第３４の態様に記載のビデオデコーダに関する。

第３８の態様は、前記ビデオデコーダは、前記それぞれのタイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用して前記第１および第２のレイヤの前記画像を復号化するように構成されている、第３７の態様に記載のビデオデコーダに関する。

第３９の態様は、前記ビデオ復号化器は、前記第１のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定するため前記長期シンタックス要素の前記値を使用して前記インターレイヤオフセットを決定する際に前記長期シンタックス要素の前記値を使用するように構成されている、第３４〜第３８の態様のいずれかに記載のビデオデコーダに関する。

第４０の態様は、前記ビデオ復号器は、前記第１のレイヤの前記画像の前記復号化および横断を開始するのに対し遅れるべき前記第２のレイヤの前記画像の第１の空間セグメントの前記復号化により前記第１のレイヤの前記画像の空間セグメントの数として前記長期シンタックス要素の前記値を使用することにより、前記インターレイヤオフセットを決定する際の前記長期シンタックス要素の前記値を使用するように構成されている、第３４ないし第３９の態様のいずれかに記載のビデオデコーダに関する。

第４１の態様は、マルチレイヤビデオデータストリームが、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間にインターレイヤオフセットを有する時間重畳態様において前記空間セグメントを順次横断することにより前記レイヤの画像が分割された空間セグメントに復号化可能なように第１のレイヤから第２のレイヤにインターレイヤ予測を使用してレイヤの階層においてシーンをマルチレイヤビデオデータストリームに符号化するビデオエンコーダであって、前記ビデオエンコーダは、
長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記エンコーダは、セットの間を切替えるように構成され、
前記所定期間の間、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度が、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第１のセットの値への前記長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）をセットし、
前記所定期間の間、あり得る値の第２のセット（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値への前記長期シンタックス要素は、あり得る値の前記第１のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つのセットを含むあり得る一連のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つの他のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、ビデオエンコーダに関する。

第４２の態様は、前記ビデオエンコーダは、
前記同じ画像の直接連続した前記横断の間のサブストリームのイントラピクチャイントラサブストリーム遅延および前記第２のレイヤの画像のサブストリームの前記横断に関連した前記第１のレイヤの画像のサブストリームの前記横断の間の前記インターレイヤオフセットを有する時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して前記サブストリームにおける前記マルチレイヤビデオデータストリームを並列に復号化可能にする態様で、前記空間セグメントは、前記レイヤが分割されかつ前記レイヤの前記画像が通常再分割されるサブストリームであるように、符号化を実行するように構成されている、第４１の態様に記載のビデオエンコーダに関する。

第４３の態様は、前記ビデオエンコーダは、
前記サブストリームの境界を横断する前記イントラピクチャ空間予測をサポートし、かつ前記サブストリームを個々にエントロピー符号化する、または中間適応状態で以前の、前記サブストリーム間の順序に従い、サブストリームの前記エントロピーコンテキスト確率を採用するために、前記エントロピーコンテキスト確率を初期化することにより、イントラピクチャ空間予測を使用し、かつエントロピーコンテキスト確率に適合するエントロピー符号化を行うことにより、前記サブストリームを符号化するように構成されている、第４２の態様に記載のビデオエンコーダに関する。

第４４の態様は、前記ビデオエンコーダは、
前記第１および第２のレイヤの前記画像の各々の範囲内で前記タイル間のタイル順序で前記タイルを横断することにより、前記マルチレイヤビデオデータストリームが前記タイルに復号化可能とする態様で、前記空間セグメントは前記レイヤの画像が分割されるタイルであるように、符号化を実行し、かつ、前記第２のレイヤの前記画像のタイルの前記横断に関連して前記第１のレイヤの前記画像の前記タイルの前記横断の間に前記インターレイヤオフセットに並行して前記第１のレイヤの画像の直接続行するタイルおよび前記第２のレイヤの画像の直接続行するタイルの復号化を実行するように構成されている、第４１の態様に記載のビデオエンコーダに関する。

第４５の態様は、前記ビデオエンコーダは、それぞれのタイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用して前記第１および第２のレイヤの前記画像を符号化するように構成された、第４４の態様に記載のビデオエンコーダに関する。

第４６の態様は、前記ビデオエンコーダは、前記長期シンタクックス要素の前記値が前記第１のレイヤの前記画像の空間要素を単位として前記インターレイヤオフセットのための測定を定義するように構成されている、第４１ないし第４５のいずれかの態様に記載のビデオエンコーダに関する。

第４７の態様は、前記ビデオエンコーダが、前記第２のレイヤの前記画像の第１の空間セグメントを復号化することが、前記第１のレイヤの前記画像の前記復号化および横断を開始することに対し遅れるべきであることにより前記第１のレイヤの前記画像の空間セグメントの数を示すために前記長期シンタックス要素の前記値をセットするように構成されている、第４１ないし第４６の態様のいずれかに記載のビデオデコーダに関する。

第４８の態様は、各レイヤにおいて、前記シーンが、スケーラビリティ次元により測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するためのネットワーク実体であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの１つと関連した第１のＮＡＬユニット、および、前記第１のＮＡＬユニット内で散在して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第２のＮＡＬユニットを含み、前記ネットワーク実体は、
前記第２のＮＡＬユニットにおいて、タイプインジケータフィールド（６９６、例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ）を検査し；
前記タイプインジケータフィールドに第１の状態（例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットから前記運転点まで前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールド（例えばｌａｙｅｒ＿ｉｄ）のあり得る値をマップしているマッピング情報（例えばｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］，ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］）を読み込んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第１のＮＡＬユニットを前記第１のＮＡＬユニットの運転点と関連させ；
前記タイプインジケータフィールドに第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより、および、前記スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、前記第１のＮＡＬユニットの前記運転点を配置することで、前記第１のＮＡＬユニットを前記運転点に関連させる、ように構成されたネットワーク実体に関する。

第４９の態様は、前記ネットワーク実体は、
前記タイプインジケータフィールドには、前記第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第２のＮＡＬユニットにおけるシンタックス要素（ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１）に従って１つ以上の部分に前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを分割することにより、前記第１のＮＡＬユニットを前記運転点に関連付け、前記スケーラビリティ空間内におけるベクトルの座標として前記部分の前記値を使用することにより前記第１のＮＡＬユニットの前記運転点を配置して、前記第２のＮＡＬユニットにおける更なるシンタックス要素（ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ）に従って前記スケーラビリティ次元を意味論的に決定するように構成された、第４８の態様に記載のネットワーク実体に関する。

第５０の態様は、前記ネットワーク実体は、
前記タイプインジケータフィールドは、前記第１の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットにおける更なるシンタックス要素（ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ）から前記スケーラビリティ次元の数ｐおよび意味論的意味を決定し、かつ前記第２のＮＡＬユニットからｐ次元ベクトルのリスト（７０８）を読込むことにより前記レイヤインジケータフィールドの前記あり得る値を前記運転点に関連付けるように構成されている、請求項４８または第４９に記載のネットワーク実体に関する。

第５１の態様は、前記タイプインジケータフィールドに前記第２の状態がある場合、前記ネットワーク実体は、前記第２のＮＡＬユニットからリストを読込むことをスキップするように構成されている、第５０の態様に記載のネットワーク実体に関する。

第５２の態様は、前記ネットワーク実体は、前記第１のまたは前記第２の状態を有する前記タイプインジケータフィールドにかかわりなく前記第２のＮＡＬユニットから前記さらなるシンタックス要素を読込み、前記レイヤインジケータフィールドの前記サイズは、前記第１のまたは前記第２の状態を有する前記タイプインジケータフィールドにかかわりなく同じであるように構成されている、第４９または第５１のいずれかの態様に記載のネットワーク実体に関する。

第５３の態様は、前記ネットワーク実体が、ビデオデコーダから構成されている、第４
８または第５２の態様のいずれかに記載のネットワーク実体に関する。

第５４の態様は、各レイヤにおいて、前記シーンはスケーラビリティ次元により測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンをレイヤにおけるマルチレイヤビデオデータストリームに符号化するためのビデオエンコーダであって、前記マルチレイヤビデオデータストリームは、前記レイヤの１つと各々が関連した第１のＮＡＬユニットおよび前記第１のＮＡＬユニット内に散在し前記マルチレイヤビデオデータストリームに関する一般情報を示す第２のＮＡＬ情報を含み、前記ビデオエンコーダは、
タイプインジケータフィールドを前記第２のＮＡＬユニットに挿入しかつ、
同上が前記運転点への前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールドのあり得る値を前記第２のＮＡＬユニットにマッピングするマップ情報を挿入して第１の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記第１のＮＡＬユニットの運転点は、前記マップ情報により、前記それぞれのレイヤインジケータフィールドに関連するように、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットし、
同上が前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットして第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）を有するように前記タイプインジケータフィールドをセットし、かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が、前記それぞれの第１のＮＡＬユニットに関連する前記運転点を示すように前記以上の部分をセットする、
間で切替えるように構成された、ビデオエンコーダに関する。

第５５の態様は、前記ビデオエンコーダは、
同上には第２の状態があるように前記タイプインジケータフィールドを設定する際に、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドが１つ以上の部分に分割されるものに関して定義する前記第２のＮＡＬユニットにシンタックス要素をセットしかつ挿入し、前記スケーラビリティ次元を意味論的に定義する前記第２のＮＡＬユニットに更なるシンタックス要素をセットしかつ挿入するように構成されている、第５４の態様に記載のビデオエンコーダに関する。

第５６の態様は、各レイヤにおいて、前記シーンがスケーラビリティ次元によって測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームであって、前記マルチレイヤビデオデータストリームは、各々第１のＮＡＬユニットを含み、各々は前記レイヤの１つと関連し、かつ前記第２のＮＡＬユニットは、前記第１のＮＡＬユニット内に散在し、かつ前記マルチレイヤビデオデータストリームに関する一般情報を表し、タイプインジケータフィールド（６９６、例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）は、
前記タイプインジケータフィールドには第１の状態（例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットにおけるマッピング情報は、前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールド（例えばｌａｙｅｒ＿ｉｄ）のあり得る値を前記運転点にマップすることに応じて；
前記タイプインジケータフィールドには第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドは、前記スケーラビリティ空間内のベクトルの座標として前記部分の前記値により定義された前記第１のＮＡＬユニットの前記運転点を有する１つ以上の部分に分割されることに応じて、
前記第２のＮＡＬユニットの中で存在する、マルチレイヤビデオデータストリームに関する。

第５７の態様は、シーンがレイヤに符号化されるマルチレイヤビデオデータストリームを対象とし、マルチ規格マルチレイヤデコーダによって復号化し、前記マルチレイヤビデオデータストリームは、各々がレイヤの１つと関連したＮＡＬユニットを含み、前記レイヤは、各レイヤに対し、前記それぞれのレイヤが関連する様々なコーデックを使用してそれぞれのレイヤに関連したＮＡＬユニットが符号化されるように、様々なコーデックに関連し、前記トランスポートレイヤデコーダは、
各ＮＡＬユニットに対し、どのコーデックが関係しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームの前記ＮＡＬユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに手渡す、トランスポートレイヤデコーダに関する。

第５８の態様は、それぞれのレイヤのコーデックを示している状態に設定されるＮＡＬユニットタイプインジケータを有する前記所定のコーデックのＮＡＬユニットヘッダを使用して、所定のコーデックと異なる任意のコーデックとも関連しているレイヤと関連しているとして確認されていたＮＡＬユニットをカプセル化するようにさらに構成されている、第５７の態様に記載のビデオデコーダに関する。

第５９の態様は、前記ＮＡＬユニットがそれぞれ到着するチャネルに応じて、識別を実行するようにさらに構成された、第５７または第５８の態様に記載のビデオデコーダに関する。

第６０の態様は、様々なコーデックと関連した前記ＮＡＬユニットが、様々なチャネル上の前記マルチ規格マルチレイヤデコーダに手渡されるように手渡しを実行するようにさらに構成された、第５７または第５９の態様のいずれかに記載のビデオデコーダに関する。

第６１の態様は、前記それぞれのＮＡＬユニットが関連する前記レイヤが関連する前記コーデックを示しているメタデータを各ＮＡＬユニットに提供するようにさらに構成されている、第５７または第６０の態様に記載のビデオデコーダに関する。

第６２の態様は、マルチレイヤビデオデータストリームを、シーンが第１のレイヤの部分から第２のレイヤの同じ位置に配置された部分までインターレイヤ予測を使用してレイヤの階層において符号化され、前記第１のレイヤの画像が第１のブロックの配列に再分割され、かつ、前記第２のレイヤの画像が第２のブロックの配列に再分割され、ラスタースキャン復号化順序が、前記第１のブロックおよび前記第２のブロックの間でそれぞれ定義されるように復号化するためのビデオデコーダであって、前記ビデオデコーダは、
マルチレイヤビデオデータストリームのシンタックス要素構造（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）に応じて、前記第２のレイヤの画像の空間的な第２のブロックの前記横断と関連して前記第１のレイヤの画像の第１のブロックの前記横断との間で、インターレイヤオフセットを有する時間重畳態様で前記第１および第２のブロックを順次横断することにより前記第１および第２のレイヤの前記画像の並列復号化のために、前記第１のブロックを単位として測定されたインターレイヤオフセットを決定するように構成された、ビデオデコーダに関する。

第６３の態様は、前記シンタックス要素構造は、長期シンタックス要素構造であり、前記ビデオデコーダは、
所定期間を予め決定し、かつ、
前記所定期間より短い時間間隔において、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記第１のレイヤの前記画像の前記第１のブロックおよび前記第２のレイヤの前記画像の前記第２のブロックのサイズおよび位置、および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定するように構成された、第６２の態様に記載のビデオデコーダ。

第６４の態様は、前記ビデオデコーダは、前記ラスタースキャン復号化順序に沿って順次配置された空間セグメントにおける前記マルチレイヤビデオデータストリームの、および、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間前記インターレイヤオフセットとともに時間重畳態様における前記空間セグメントを順次横断することにより、前記レイヤの画像が分割される並列復号化をサポートし、前記ビデオデコーダは、
前記長期シンタックス要素（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝０、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）があり得る値の第１のセットの値にセットされる場合、前記第１のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定する所定期間に対し予め前記インターレイヤオフセットを決定するために前記長期シンタックス要素構造の前記値を使用し、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記所定期間よりも短い時間間隔において、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントのサイズおよび位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第１のセットに素なあり得る値の第２のセット（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値にセットされる場合、前記所定期間よりも短い時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第１および第２のセットに素なあり得る値の第３のセット（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝１、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）の値にセットされる場合、前記第１のブロックを単位とした前記インターレイヤオフセットの前記決定を実行し、前記第１のレイヤの前記画像の前記第１のブロックおよび前記第２のレイヤの前記画像の前記第２のブロックの前記サイズおよび位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度の周期的な決定をそれぞれ実行する、
ように、前記マルチレイヤビデオデータストリームの前記長期シンタックス要素を検査する、第６３の態様に記載のビデオデコーダに関する。

第６５の態様は、前記ビデオデコーダは、前記レイヤの画像が分割され前記第１および第２のブロックの行から構成された以外のサブストリームにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記第２のレイヤの画像のサブストリームの前記横断と関連して前記第１のレイヤの画像のサブストリームの前記横断の間に前記同じ画像およびインターレイヤオフセットの直接連続したサブストリームの前記横断の間にイントラピクチャインターサブストリーム遅延を有する時間重畳態様における前記サブストリームを順次横断することによって、波面並列処理を使用する、第６３または第６４の態様に記載のビデオデコーダに関する。

第６６の態様は、前記長期シンタックス要素構造がユニットフラグ（手本としてｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇと比較）および遅延インジケータ（手本としてｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙと比較）を含み、前記ビデオデコーダは、前記長期シンタックス要素構造を調査する際に、
前記遅延インジケータを、同上がゼロまたはそれ以外にセットされるかに関して決定するために調査し、
前記遅延インジケータがゼロにセットされた場合、前記長期シンタックス要素構造の値が前記第２のセットの値にセットされ、かつ、
前記遅延インジケータがゼロ以外の値にセットされた場合、前記長期シンタックス要素構造の前記値を決定するために前記ゼロ以外の値を使用し、かつ前記ユニットフラグがゼロの場合、前記長期シンタックス要素構造の前記値が前記第１のセットの値にセットされ、かつ前記ユニットフラグが１の場合、前記長期シンタックス要素構造の前記値が前記第３のセットの値にセットされることを決定する、第６４ないし第６５の態様のいずれかに記載のビデオデコーダに関する。

第６７の態様は、第１および第２のレイヤの並列復号化を開始する際に前記インターレイヤオフセットに依存するように構成されている、第６５ないし第６６の態様のいずれかに記載のビデオデコーダに関する。

第６８の態様は、前記第１のレイヤの空間セグメントの数ｓまたは符号化ブロックが前記シンタックス要素構造に一意的に従属して数ｓによって完全に復号化されるかに関してチェックし、かつ、前記第１のレイヤの空間セグメントまたは符号化ブロックの間で、少なくともｓが完全に復号化されたことが前記チェックで判明しない限り、前記第１のレイヤを復号化する間、前記第２のレイヤを復号化するのを開始することを延期するように構成されている、第６２ないし第６７の態様のいずれかに記載のビデオデコーダに関する。

第６９の態様は、開始する際にインターレイヤオフセットに依存し、かつ第１および第２のレイヤの並列復号化を完全に処理するように構成された、第６２ないし第６８の態様のいずれかに記載のビデオデコーダに関する。

第７０の態様は、前記第１のレイヤの空間セグメントの数ｓまたは符号化ブロックが前記シンタックス要素構造に一意的に従属して数ｓによって、および、前記第２のレイヤの既に復号化された空間セグメントまたは符号化ブロックの数ｔ−１によって完全に復号化されるかに関してチェックし、前記第１のレイヤの空間セグメントまたは符号化ブロックの第１のレイヤの間で、少なくともｓが完全に復号化されたことが判明しない限り、第１のレイヤを復号化することの間、第２のレイヤの第ｔの空間セグメントまたは符号化ブロックを復号化するのを開始することを延期するように構成されている、第６２ないし第６９の態様のいずれかに記載のビデオデコーダに関する。

第７１の態様は、シーンが第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリーム（４０）を復号化する方法であって、
前記ビデオデコーダは、前記レイヤの画像（１２、１５）が再分割される空間セグメント（８０）における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６０６；例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ）を検査し、
前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記画像（１２）の前記空間セグメントの各境界に重畳し、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素（６０２；例えば、ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］およびｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］）に基づく前記空間セグメントへの前記第１のレイヤおよび前記第２のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔（６０４）で、周期的に決定するように、前記所定期間（６０８）の間、前記第２のレイヤの前記画像（６０８）が再分割される保証として第１のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝１）から値を仮定する前記長期シンタックス要素構造を解釈し、かつ、
前記長期シンタックス要素構造が、第２のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝０）から値を仮定した場合、少なくとも前記短期シンタックス要素の第１のあり得る値に対し、前記第１のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第２のレイヤの前記画像の前記空間セグメントの間の境界、および、少なくとも前記短期シンタックス要素の第２のあり得る値に対し、前記第１のレイヤの前記空間セグメントの各境界に重畳する前記第２のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、方法に関する。

第７２の態様は、前記マルチレイヤビデオデータストリームが前記レイヤの画像が再分割される空間セグメントにおいて並列に復号化可能であるように、第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層におけるマルチレイヤビデオデータストリームにシーンを符号化する方法であって、前記方法は、
長期シンタックス要素構造（６０６）および短期シンタックス要素（６０２）を前記マルチレイヤビデオデータストリームに挿入し、前記短期シンタックス要素は、前記第１のレイヤおよび前記第２のレイヤの前記画像の前記空間セグメントへの前記再分割を、時間間隔において、定義しており、かつ、
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間（６０８）の間、第１のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第２のレイヤの前記画像の前記空間セグメントの間の境界は前記第１のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第２のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第２のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第１のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第２のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも１つの設定を、および、前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えることを含む、方法に関する。

第７３の態様は、画像がさまざまな空間レイヤにおいてかつ前記空間レイヤの少なくとも１つに対し、第１の空間セグメントにおいて、符号化される空間スケーラブルビットストリーム（４０）を復号化するための方法であって、
前記方法は、
前記第１の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割（６２２）の任意の分割は、前記分割の任意の他の分割により覆われた前記第１の空間レイヤの前記画像の部分から独立するように、あるいは、
前記アップサンプリングされた基準ピクチャの前記分割（６２２）の任意の部分は、前記それぞれの分割に空間的に隣接する前記分割の他の分割により覆われた前記第１の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得るために第１の空間レイヤの画像（１２）をアップサンプリングし、かつ前記アップサンプリングされた基準画像を使用して第２の空間レイヤの画像（１５）を予測し、前記復号化のための方法は、前記シンタックス要素に従属して、前記第１の空間レイヤの前記画像を補間（６２０）するために、空間スケーラブルビットストリームにおけるシンタックス要素（６１６；例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ）に応答することを含む方法に関する。

第７４の態様は、第１の空間セグメントにおいて、画像をさまざまな空間レイヤにおけるかつ空間レイヤの少なくとも１つに対しスケーラブルビットストリームに符号化するための方法であって、
前記方法は、
前記第１の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割の任意の部分は、前記分割の前記他の部分のいずれかにより覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、
前記アップサンプリングされた基準画像の前記分割の任意の部分は、前記それぞれの部分に空間的に隣接する前記分割の他の部分により覆われた前記第１の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るために第１の空間レイヤの画像をアップサンプリングし、前記アップサンプリングされた基準画像を使用して第２の空間レイヤの画像を予測し、前記方法は、シンタックス要素（６０６）を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第１の空間レイヤの前記画像を補間することを含む、方法に関する。

第７５の態様は、シーンが第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリームを復号化する方法であって、前記ビデオデコーダは、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することによりレイヤの画像が分割された空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６４２；例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）を検査し、
前記長期シンタックス要素構造（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）があり得る値の第１のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素（６０２）にそれぞれ基づき前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の第１のセットと素なあり得る値の第２のセット（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値にセットされるとき、前記所定期間より短い時間間隔において、所定の時間より小さい時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく所定期間内で前記インターレイヤオフセットを周期的に決定することを含む方法に関する。

第７６の態様は、マルチレイヤビデオデータストリームが、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間にインターレイヤオフセットを有する時間重畳態様において前記空間セグメントを順次横断することにより前記レイヤの画像が分割された空間セグメントに復号化可能なように第１のレイヤから第２のレイヤにインターレイヤ予測を使用してレイヤの階層においてシーンをマルチレイヤビデオデータストリームに符号化する方法であって、前記方法は、
長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記方法は、セットの間を切替えるように構成され、
前記所定期間の間、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度が、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第１のセットの値への前記長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）をセットし、
前記所定期間の間、あり得る値の第２のセット（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値への前記長期シンタックス要素は、あり得る値の前記第１のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つのセットを含むあり得る一連のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つの他のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、方法に関する。

第７７の態様は、各レイヤにおいて、前記シーンがスケーラビリティ次元によって測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するための方法であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの１つと関連した第１のＮＡＬユニット、および、前記第１のＮＡＬユニット内で散在して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第２のＮＡＬユニットを含む方法であって、前記方法は、
前記第２のＮＡＬユニットにおいて、タイプインジケータフィールド（６９６、例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ）を検査し；
前記タイプインジケータフィールドに第１の状態（例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットから前記運転点まで前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールド（例えばｌａｙｅｒ＿ｉｄ）のあり得る値をマップしているマッピング情報（例えばｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］，ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］）を読み込んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第１のＮＡＬユニットを前記第１のＮＡＬユニットの前記運転点と関連させ；
前記タイプインジケータフィールドに第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより、および、前記スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、前記第１のＮＡＬユニットの前記運転点を配置することで、前記第１のＮＡＬユニットを前記運転点に関連させることを含む方法。

第７８の態様は、各レイヤにおいて、前記シーンはスケーラビリティ次元によって測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンをレイヤにおけるマルチレイヤビデオデータストリームに符号化するための方法であって、前記マルチレイヤビデオデータストリームは、前記レイヤの１つと各々が関連した第１のＮＡＬユニットおよび前記第１のＮＡＬユニット内に散在し前記マルチレイヤビデオデータストリームに関する一般の情報を表す第２のＮＡＬユニットを含み、前記方法は、
タイプインジケータフィールドを前記第２のＮＡＬユニットに挿入しかつ、
同上が前記運転点への前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールドのあり得る値を前記第２のＮＡＬユニットにマッピングするマップ情報を挿入して第１の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記第１のＮＡＬユニットの運転点は、前記マップ情報により、前記それぞれのレイヤインジケータフィールドに関連するように、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットし、
同上が前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットして第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）を有するように前記タイプインジケータフィールドをセットし、かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が、前記それぞれの第１のＮＡＬユニットに関連する前記運転点を示すように前記以上の部分をセットする、
間で切替えることを含む、方法に関する。

第７９の態様は、シーンがレイヤに符号化されるマルチレイヤビデオデータストリームを対象とし、マルチ規格マルチレイヤデコーダにより復号化し、前記マルチレイヤビデオデータストリームは、レイヤの１つと各々が関連したＮＡＬユニットより構成され、前記レイヤは、前記それぞれのレイヤが関連する様々なコーデックを使用して前記それぞれのレイヤに関連したＮＡＬユニットが符号化されるように様々なコーデックと関連する方法であって、前記方法は、
各ＮＡＬユニットごとに、どのコーデックが関連しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームのＮＡＬユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに渡すこと、を含む方法に関する。

第８０の態様は、マルチレイヤビデオデータストリームを、シーンが第１のレイヤの部分から第２のレイヤの同じ位置に配置された部分までインターレイヤ予測を使用してレイヤの階層において符号化され、前記第１のレイヤの画像が第１のブロックの配列に再分割され、かつ、前記第２のレイヤの画像が第２のブロックの配列に再分割され、ラスタースキャン復号化順序が、前記第１のブロックおよび前記第２のブロックの間でそれぞれ定義されるように復号化する方法であって、前記方法は、
前記マルチレイヤビデオデータストリームのシンタックス要素構造（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）に応じて、前記第２のレイヤの画像の空間的な第２のブロックの前記横断に関連して前記第１のレイヤの画像の第１のブロックの前記横断の間前記インターレイヤオフセットを有する時間重畳態様における前記第１および第２のブロックを順次横断することにより、前記第１および第２のレイヤの前記画像を並列復号化するための、前記第１のブロックを単位として測定されたインターレイヤオフセットを決定することを含む、方法に関する。

第８１の態様は、コンピュータが第７１〜第８０の態様のいずれかに記載の方法で動くときに、実行するためのプログラムコードを有するコンピュータプログラムに関する。

Claims

第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層においてシーンが符号化されるマルチレイヤビデオデータストリーム（４０）を復号化するためのビデオデコーダであって、前記ビデオデコーダは、前記レイヤの画像（１２，１５）が再分割される空間セグメント（８０）における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６０６；例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ）を以下のために検査し、
前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記画像（１２）の前記空間セグメントの各境界を覆い、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素（例えば６０２；ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］およびｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］）に基づく前記空間セグメントへの前記第１のレイヤおよび前記第２のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔（６０４）で、周期的に決定するように、前記所定期間（６０８）の間、前記第２のレイヤの前記画像（６０８）が再分割される保証として第１のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝１）から値を仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素構造が、第２のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝０）から値を仮定した場合、少なくとも前記短期シンタックス要素の第１のあり得る値に対し、前記第１のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第２のレイヤの前記画像の前記空間セグメントの間に境界が存在し、かつ、少なくとも前記短期シンタックス要素の第２のあり得る値に対し、前記第１のレイヤの前記空間セグメントの各境界を覆う前記第２のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、ように構成されているビデオデコーダ。
それぞれの前記空間セグメントの境界で各空間セグメントごとに前記イントラピクチャ空間予測を中断させることを伴うイントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化する；または、
前記第１のレイヤの前記画像の前記空間セグメントの境界と交差していて、前記第１のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第１のレイヤの画像の前記空間セグメントを復号化することにより、および前記第２のレイヤの前記画像の前記空間セグメントの境界を交差していて、前記第２のレイヤの前記画像の前記空間セグメントの前記復号化の間の復号化遅延に従っている前記イントラピクチャ空間予測をサポートすることと並行して前記第２のレイヤの画像の前記空間セグメントを復号化することにより、イントラピクチャ空間予測を使用している前記レイヤの前記画像を復号化するように構成された、請求項１に記載のビデオデコーダ。
前記レイヤの画像が再分割されるタイルにおける前記マルチレイヤビデオデータストリームのタイル並列復号化をサポートし、
前記デコーダは、
前記第１のあり得る値のセットから値を仮定している長期シンタックス要素を、前記第２のレイヤの前記画像の前記タイル間の境界が前記第１のレイヤの前記タイルの各境界を覆い、かつ前記短期シンタックス要素に基づき前記第１のレイヤと関連して前記第２のレイヤの前記画像の再分割のタイル改良を、所定期間より短い時間間隔において、周期的に決定するように、所定期間の間、前記第２のレイヤの前記画像が再分割される保証として、解釈し、かつ、
前記長期シンタックス要素が前記第２のあり得る値のセットから前記値を仮定した場合、少なくとも前記短期シンタックス要素の第１のあり得る値に対し、前記第１のレイヤの前記タイルの前記境界のいずれも覆っていない前記第２のレイヤの前記画像の前記タイル間で境界が存在し、かつ、少なくとも前記短期シンタックス要素の第２のあり得る値に対し、前記第１のレイヤの前記タイルの各境界を覆う前記第２のレイヤの前記画像の前記タイル間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記レイヤの前記画像の前記タイルへの前記再分割を、前記所定期間より短い時間間隔において、周期的に決定するように構成された、請求項１または２に記載のビデオデコーダ。
前記ビデオデコーダは、それぞれの前記タイルの境界線で各タイルのイントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用しているレイヤの画像を復号化するように構成されている、請求項３に記載のビデオデコーダ。
前記デコーダは、所定期間の間、前記第１のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存するｎでもって第２のレイヤの前記画像の正確にｎの空間セグメントを占めるように、前記第２のレイヤの前記画像が再分割される保証として、第１のあり得る値からの値であることを仮定する前記長期シンタックス要素構造を解釈し、
前記長期シンタックス要素が第２のあり得る値のセットの中の値にセットされる場合、前記所定期間よりも短い期間において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定するように構成された、請求項１または２に記載のビデオデコーダ。
前記デコーダは、前記第１のあり得る値であるか否かの中から前記値を仮定する前記長期シンタックス要素構造に依存する前記マルチレイヤビデオデータストリームの前記第２のレイヤを復号化するための検査を開始するか開始しないかを決定するように構成されている、請求項１または２に記載のビデオデコーダ。
前記ビデオデコーダは、ハイブリッドビデオデコーダである、請求項１ないし６のいずれかに記載のビデオデコーダ。
前記マルチレイヤビデオデータストリームが、前記レイヤの画像が再分割される空間セグメントにおいて、並列に復号化可能であるように、第１のレイヤから第２のレイヤまでインターレイヤ予測を使用しているレイヤの階層においてマルチレイヤビデオデータストリームにシーンを符号化するためのビデオエンコーダであって、前記エンコーダは、
長期シンタックス要素構造（６０６）および短期シンタックス要素（６０２）を前記マルチレイヤビデオデータストリームに挿入し、かつ、前記短期シンタックス要素は、前記時間間隔において、前記第１のレイヤおよび前記第２のレイヤの前記画像の前記空間セグメントへの前記再分割を定義し、かつ
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間（６０８）の間、第１のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第２のレイヤの前記画像の前記空間セグメントの間の境界は前記第１のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第２のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第２のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第１のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第２のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも１つの設定を、および、前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えるように構成された、ビデオエンコーダ。
前記ビデオエンコーダは、前記それぞれの空間セグメントの境界で各空間セグメントに対し前記イントラピクチャ空間予測を中断させるとともにイントラピクチャ空間予測を使用している前記レイヤの前記画像を符号化し；あるいは、
前記第１のレイヤの画像の前記空間セグメントの境界を横断する前記イントラピクチャ空間予測をサポートすることにより、および、前記第１のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第１のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、および前記第２のレイヤの画像の前記空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートすることにより、および、前記第２のレイヤの前記画像の前記空間セグメントの前記サブセットの前記エントロピー符号化に対する前記エントロピーコンテキスト確率を初期化することにより、または、前記直接適合状態で前記第２のレイヤの前記画像の前記空間セグメントの以前のサブセットの、前記サブセット間の順序に従い、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記レイヤの前記画像を符号化しかつエントロピーコンテキスト確率に適合するエントロピー符号化を行うように構成されている、請求項８に記載のビデオエンコーダ。
前記空間セグメントはタイルであり、前記エンコーダは、
前記長期シンタックス要素構造を設定する場合、
前記第１のあり得る値のセット（ｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝１）からの値は、前記時間間隔より大きい所定期間の間に、前記短期シンタックス要素を一組のあり得る設定から適当なサブセットに設定され、前記所定期間の間に、タイルへの前記第２のレイヤの画像の再分割が一致するかまたはタイルへの前記第１のレイヤの画像の再分割を精緻化するように前記適当なサブセットが選択されている、あるいは、
第２のあり得る値のセット（ｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝０）からの値は、前記所定期間の間に、前記第１のレイヤの前記タイルの前記境界のいずれかに重畳しない前記第２のレイヤの前記画像の前記タイルの間に境界が存在することにより、前記短期シンタックス要素は、前記所定期間の間少なくとも一回間隔で、あり得る設定の前記セットの第１のあり得る値にセットされるように設定され、前記所定期間の間、少なくとも他の時間間隔に対し、前記第２のレイヤの前記画像の前記タイルが前記第１のレイヤの前記タイルの各境界に重畳する間境界に従って、あり得る設定の前記セットの第２のあり得る値に設定する、ように構成された請求項８または９に記載のビデオエンコーダ。
前記ビデオエンコーダは、それぞれの前記タイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させつつ、イントラピクチャ空間予測を使用している前記レイヤの前記画像を符号化するように構成されている、請求項１０に記載のビデオエンコーダ。
前記エンコーダは、
前記長期シンタックス要素構造を、
前記第１のあり得る値からの値に設定する場合、前記時間間隔より長い前記所定期間を使用して、前記短期シンタックス要素を一連のあり得るセットからの適切なサブセットに設定し、所定期間の間、前記第１のレイヤの前記画像の各空間セグメントが前記長期シンタックス要素構造の前記値に依存してｎを有する第２のレイヤの前記画像のｎ空間セグメントから正確に成立つように前記適切なサブセットが選択されているように構成されている、請求項８または９に記載のビデオエンコーダ。
画像が異なる空間レイヤにおいておよび、前記空間レイヤの少なくとも１つのために、第１の空間セグメントにおいて符号化される空間スケーラブルビットストリーム（４０）を復号化するためのデコーダであって、前記デコーダは、
前記第１の空間セグメントに依存する前記アップサンプリングされた基準画像の分割（６２２）の任意の部分が、前記分割の他の任意の分割により覆われた前記第１の空間レイヤの前記画像の部分から独立であるように、あるいは、
前記アップサンプリングされた基準画像の前記分割（６２２）の任意の部分が、前記それぞれの分割に空間的に隣接する分割の他の分割により覆われた前記第１の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得て前記アップサンプリングされた基準画像を使用して第２の空間レイヤを予測するために第１の空間レイヤの画像（１２）をアップサンプリングし、そして、前記デコーダは、前記シンタックス要素に依存して、前記第１の空間レイヤの前記画像を補間（６２０）するために、前記空間スケーラブルビットストリームにおいてシンタックス要素（６１６；例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ）に応答する、ように構成されているデコーダ。
前記デコーダは、異なる空間レイヤを並列に復号化するように構成されている、請求項１３に記載のデコーダ。
前記デコーダは、前記第１の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第１の空間セグメントの他のいずれかによって覆われる前記第１の空間レイヤの前記画像の部分から独立しているように、または、
前記第１の空間セグメントのいずれかによって空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分も、前記それぞれの空間セグメントに隣接して、前記第１の空間セグメントの他のいかなる空間セグメントによって覆われた前記第１の空間レイヤの前記画像の部分に依存しているように、シンタックス要素に応じて、前記第１の空間レイヤの前記画像を補間（６２０）するために、前記空間スケーラブルビットストリームにおける前記シンタックス要素（６１６）に応答する、請求項１３または１４によるデコーダ。
前記空間スケーラブルビットストリームは、前記第１の空間セグメントにおいてそこに符号化される第２の空間レイヤの前記画像を有する、請求項１３〜１５のいずれかに記載のデコーダ。
前記デコーダは、
前記それぞれの第１の空間セグメントの境界で各第１の空間セグメントに対する前記イントラピクチャ空間予測を中断させながら、または、
前記第１の空間セグメントの境界と交差する前記イントラピクチャ空間予測をサポートしながら、エントロピーコンテキスト確率の適合を使用して最初の各空間セグメントをエントロピー復号化しながら、かつ第１の空間セグメントその他から独立して前記第１の空間セグメントの前記エントロピーコンテキスト確率を初期化しながら、または、前記以前の第１の空間セグメントの中間位置まで適合するように、前記第１のレイヤの前記画像の前記空間セグメントの以前の第１の空間セグメントの、前記第１の空間セグメントの間の順序に従って、前記エントロピーコンテキスト確率を採用する状況下で、イントラピクチャ空間予測を使用して前記復号化を実行するように構成された、請求項１３〜１６のいずれかに記載のデコーダ。
（例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝２）前記第２のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記第２のタイルの他のいずれかにより空間的に覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
（例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝１）前記第１および第２のタイルの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第１および第２のタイルの空間的に同位置に配置された境界により空間的に限定された、前記アップサンプリングされた基準ピクチャの他のいずれかの部分により覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
（例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ＝０）前記第２のタイルのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャの任意の部分が、前記それぞれのタイルに隣接している第２のタイルの他のいずれかによって覆われた前記第１の空間レイヤの前記画像の部分に依存しているように、
前記空間スケーラブルビットストリームが前記第１の空間セグメントにおいてその中に符号化された前記第１の空間レイヤの前記画像を有し、前記第２の空間セグメントにおいてその中に符号化された前記第２の空間レイヤの前記画像を有し、前記デコーダは、前記シンタックス要素に依存して、前記第１の空間レイヤの前記画像を補間するために、前記空間スケーラブルビットストリームにおいて前記シンタックス要素（６０６）に応答する、請求項１３または１４に記載のデコーダ。
前記デコーダは、前記独立を達成するために、前記フィルタカーネルが突出する前記第１の空間レイヤの前記画像の前記それぞれの部分から独立して断片が満たされたことに従う代替規則を使用して、前記分割する前記他の分割のいずれかにより覆われ、前記第１の空間レイヤの前記画像のいずれの種類の部分に突出する、前記第１の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を満たすように構成されている、請求項１３〜１８のいずれかに記載のデコーダ。
前記デコーダは、前記第１の空間レイヤの前記画像の外側境界から突出している前記フィルタカーネルの断片を満たしている前記代替規則を使用するように構成されている、請求項１９に記載のデコーダ。
前記デコーダは、ビデオデコーダであって、画像ごとにまたは画像−シーケンスの基礎ごとに前記空間スケーラブルなビットストリームにおける前記シンタックス要素（６０６）に応答するように構成されている、請求項１３〜２０のいずれかに記載のデコーダ。
前記空間スケーラブルビットストリームは、前記第１の空間セグメントにおいてその中に符号化される前記第１の空間レイヤの前記画像を有し、前記空間スケーラブルビットストリームは、第２の空間セグメントに符号化された前記第２の空間レイヤの前記画像を有し、前記分割の境界は、前記第１および第２の空間セグメントの境界の空間重畳の論理積にあるいは前記第２の空間セグメントの前記境界に対応し、前記デコーダは、前記第１の空間レイヤの前記画像の前記補間において使用されたフィルタカーネルの断片を、前記シンタックス要素に依存して、満たすために応答し、前記断片が前記フィルタカーネルが突出する前記第１の空間レイヤの前記画像の前記それぞれの部分から独立してあるいは前記フィルタカーネルが突出する前記第１の空間レイヤの前記画像の前記それぞれの部分を使用して前記断片が充填されることに従って前記代替規則を使用する前記分割の隣接する分割に１つの分割から突出する、請求項１３ないし２１のいずれかに記載のデコーダ。
前記デコーダは、シンタックス要素（６０６）に依存するインターレイヤオフセットを用いて並列に前記第１および第２のレイヤを復号化するように構成されている、請求項１３〜２２のいずれかに記載のデコーダ。
前記デコーダは、前記シンタックス要素に従属する前記第１および第２の空間セグメントの境界、または、前記第２の空間セグメントの境界、の空間重畳の論理積に対応するように、前記分割の境界を設置するように構成されている、請求項１３または２３に記載のデコーダ。
様々な空間レイヤにおいて、および前記空間レイヤの少なくとも１つに対し第１の空間セグメントにおいて、画像を空間スケーラブルなビットストリームに符号化するエンコーダであって、前記エンコーダは、
前記第１の空間セグメントに依存する前記アップサンプリングされた基準画像の分割のいかなる分割が、前記分割の前記他のいかなる分割により覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、または
前記アップサンプリングされた基準画像の前記分割のいかなる分割が、前記それぞれの分割に空間的に隣接している前記分割の他の分割により覆われた前記第１の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るためにおよび前記アップサンプリングされた基準画像を使用して第２の空間レイヤの画像を予測するために、第１の空間レイヤの画像をアップサンプリングし、前記エンコーダは、シンタックス要素（６０６）を空間スケーラブルビットストリームにセットしかつ挿入し、かつ前記シンタックス要素に依存して、前記第１の空間レイヤの前記画像を補間するよう構成されている、エンコーダ。
前記エンコーダは、
前記第１の空間セグメントのいずれかによって空間的に覆われたアップサンプリングされた基準画像のいかなる部分が、前記第１の空間セグメントの他のいずれかにより覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第１の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準ピクチャのいかなる部分が、前記第１の空間セグメントの他のいかなる空間セグメントによって覆われる前記第１の空間レイヤの前記画像の部分に従属して、前記それぞれの第１の空間セグメントに隣接するように、
前記シンタックス要素を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に応じて、前記第１の空間レイヤの前記画像を補間するように構成されている、請求項２５に記載のデコーダ。
前記エンコーダは、前記第１の空間レイヤを、前記第１の空間セグメントにおける前記空間スケーラブルビットストリームに前記第１の空間レイヤの画像をエンコードするように構成されている、請求項２５または２６に記載のエンコーダ。
前記エンコーダは、前記それぞれの第１の空間セグメントの境界で各第１の空間セグメントに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用している前記第１の空間レイヤの画像を符号化するように構成されている、請求項２７に記載のエンコーダ。
前記第２の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記第２の空間セグメントの他のいずれかにより空間的に覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第１および第２の空間セグメントの空間的に同位置に配置された境界により空間的に限定された前記アップサンプリングされた基準ピクチャの任意の部分は、前記第１および第２の空間セグメントの空間的に同位置に配置された境界により空間的に制限された、前記アップサンプリングされた基準画像の他のいずれかの部分により覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、あるいは、
前記第２の空間セグメントのいずれかにより空間的に覆われた前記アップサンプリングされた基準画像の任意の部分は、前記それぞれの空間セグメントに隣接する第２の空間セグメントの他のいずれかにより覆われた前記第１の空間レイヤの前記画像の部分に従属するように、
前記エンコーダは、前記第２の空間レイヤの前記画像を前記第２の空間セグメントにおける前記空間スケーラブルビットストリームに符号化されるように構成され、前記エンコーダは、前記シンタックス要素を前記空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第１の空間レイヤの前記画像を補間するように構成されている、請求項２７または２８に記載のエンコーダ。
前記エンコーダは、前記それぞれの第２の空間セグメントの境界で各第２の空間セグメントに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間画像を使用している前記第２の空間レイヤの前記画像を符号化するように構成されている、請求項２９に記載のエンコーダ。
前記エンコーダは、前記第１の空間レイヤの前記画像の任意の部分からの前記独立を成し遂げるために、前記第１の空間レイヤの前記画像の前記補間において使用されるフィルタカーネルの断片を満たすために、前記第１の空間レイヤの前記画像のそのような部分に突出し、前記フィルタカーネルがその中に突出する前記第１の空間レイヤの前記画像の各部から独立して前記断片が満たされることに従って代替規則を使用するように構成されている、請求項２５〜３０のいずれかに記載のエンコーダ。
前記エンコーダは、前記第１の空間レイヤの前記画像の外側境界から突出しているフィルタカーネルの断片を満たしている代替規則をも使用するように構成される、請求項３１に記載のエンコーダ。
前記エンコーダは、ビデオエンコーダであって、前記シンタックス要素を画像ごとにまたは画像シーケンスの基礎ごとに前記空間スケーラブルビットストリームにセットしかつ挿入するように構成されている、請求項２５〜３２のいずれかに記載のエンコーダ。
シーンが第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリームを復号化するためのビデオデコーダであって、前記ビデオデコーダは、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することにより分割された前記レイヤの画像への空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、
前記ビデオデコーダは、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６４２；例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）を検査し、
前記長期シンタックス要素構造（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）があり得る値の第１のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素（６０２）にそれぞれ基づき前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の前記第１のセットと素なあり得る値の第２のセット（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値にセットされた場合、前記所定期間よりも短い時間間隔で、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づき前記所定期間内で前記インターレイヤオフセットを周期的に決定する、ように構成されているビデオデコーダ。
前記ビデオデコーダは、前記第２のレイヤの画像のサブストリームの前記横断に関して、前記第１のレイヤの画像のサブストリームの前記横断の間に、前記同じ画像および前記インターレイヤオフセットの直接的に連続したサブストリームの前記横断の間にイントラピクチャインターサブストリーム遅延を伴って時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して、前記レイヤの画像が分割され、前記レイヤの前記画像が定期的に再分割されるブロックの行からなるサブストリームにおける前記マルチレイヤビデオデータストリームを並列に復号化するように構成されている、請求項３４に記載のビデオデコーダ。
前記ビデオデコーダは、前記サブストリームの境界と交差するイントラピクチャ空間予測をサポートする、前記サブストリームを並列に復号化するように構成されている、請求項３５に記載のビデオデコーダ。
前記ビデオデコーダは、前記レイヤの画像が分割されるタイルにおける前記マルチレイヤビデオデータストリームを復号化するように構成されており、前記第１および第２のレイヤの前記画像の各々の中で前記タイルの間のタイル順序で前記タイルを横断して、前記第２のレイヤの前記画像のタイルの前記横断と関連して前記第１のレイヤの前記画像の前記タイルの前記横断との間に前記インターレイヤオフセットと並列に前記第１のレイヤの画像の直ちに後続するタイルおよび前記第２のレイヤの画像の直ちに後続するタイルを復号化するように構成されている、請求項３４に記載のビデオデコーダ。
前記ビデオデコーダは、前記それぞれのタイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用して前記第１および第２のレイヤの前記画像を復号化するように構成されている、請求項３７に記載のビデオデコーダ。
前記ビデオ復号化器は、前記第１のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定するため前記長期シンタックス要素の前記値を使用して前記インターレイヤオフセットを決定する際に前記長期シンタックス要素の前記値を使用するように構成されている、請求項３４〜３８のいずれかに記載のビデオデコーダ。
前記ビデオ復号器は、前記第１のレイヤの前記画像の前記復号化および横断を開始するのに対し遅れるべき前記第２のレイヤの前記画像の第１の空間セグメントの前記復号化により前記第１のレイヤの前記画像の空間セグメントの数として前記長期シンタックス要素の前記値を使用することにより、前記インターレイヤオフセットを決定する際の前記長期シンタックス要素の前記値を使用するように構成されている、請求項３４ないし３９のいずれかに記載のビデオデコーダ。
マルチレイヤビデオデータストリームが、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間にインターレイヤオフセットを有する時間重畳態様において前記空間セグメントを順次横断することにより前記レイヤの画像が分割された空間セグメントに復号化可能なように第１のレイヤから第２のレイヤにインターレイヤ予測を使用してレイヤの階層においてシーンをマルチレイヤビデオデータストリームに符号化するビデオエンコーダであって、前記ビデオエンコーダは、
長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記エンコーダは、セットの間を切替えるように構成され、
前記所定期間の間、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度が、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第１のセットの値への前記長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）をセットし、
前記所定期間の間、あり得る値の第２のセット（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値への前記長期シンタックス要素は、あり得る値の前記第１のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つのセットを含むあり得る一連のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つの他のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、ビデオエンコーダ。
前記ビデオエンコーダは、
前記同じ画像の直接連続した前記横断の間のサブストリームのイントラピクチャイントラサブストリーム遅延および前記第２のレイヤの画像のサブストリームの前記横断に関連した前記第１のレイヤの画像のサブストリームの前記横断の間の前記インターレイヤオフセットを有する時間重畳態様における前記サブストリームを順次横断することにより波面並列処理を使用して前記サブストリームにおける前記マルチレイヤビデオデータストリームを並列に復号化可能にする態様で、前記空間セグメントは、前記レイヤが分割されかつ前記レイヤの前記画像が通常再分割されるサブストリームであるように、符号化を実行するように構成されている、請求項４１に記載のビデオエンコーダ。
前記ビデオエンコーダは、
前記サブストリームの境界を横断する前記イントラピクチャ空間予測をサポートし、かつ前記サブストリームを個々にエントロピー符号化する、または中間適応状態で以前の、前記サブストリーム間の順序に従い、サブストリームの前記エントロピーコンテキスト確率を採用するために、前記エントロピーコンテキスト確率を初期化することにより、イントラピクチャ空間予測を使用し、かつエントロピーコンテキスト確率に適合するエントロピー符号化を行うことにより、前記サブストリームを符号化するように構成されている、請求項４２に記載のビデオエンコーダ。
前記ビデオエンコーダは、
前記第１および第２のレイヤの前記画像の各々の範囲内で前記タイル間のタイル順序で前記タイルを横断することにより、前記マルチレイヤビデオデータストリームが前記タイルに復号化可能とする態様で、前記空間セグメントは前記レイヤの画像が分割されるタイルであるように、符号化を実行し、かつ、前記第２のレイヤの前記画像のタイルの前記横断に関連して前記第１のレイヤの前記画像の前記タイルの前記横断の間に前記インターレイヤオフセットに並行して前記第１のレイヤの画像の直接続行するタイルおよび前記第２のレイヤの画像の直接続行するタイルの復号化を実行するように構成されている、請求項４１に記載のビデオエンコーダ。
前記ビデオエンコーダは、それぞれのタイルの境界で各タイルに対し前記イントラピクチャ空間予測を中断させるイントラピクチャ空間予測を使用して前記第１および第２のレイヤの前記画像を符号化するように構成された、請求項４４に記載のビデオエンコーダ。
前記ビデオエンコーダは、前記長期シンタクックス要素の前記値が前記第１のレイヤの前記画像の空間要素を単位として前記インターレイヤオフセットのための測定を定義するように構成されている、請求項４１ないし４５のいずれかに記載のビデオエンコーダ。
前記ビデオエンコーダが、前記第２のレイヤの前記画像の第１の空間セグメントを復号化することが、前記第１のレイヤの前記画像の前記復号化および横断を開始することに対し遅れるべきであることにより前記第１のレイヤの前記画像の空間セグメントの数を示すために前記長期シンタックス要素の前記値をセットするように構成されている、請求項４１ないし４６のいずれかに記載のビデオデコーダ。
各レイヤにおいて、前記シーンが、スケーラビリティ次元により測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するためのネットワーク実体であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの１つと関連した第１のＮＡＬユニット、および、前記第１のＮＡＬユニット内で散在して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第２のＮＡＬユニットを含み、前記ネットワーク実体は、
前記第２のＮＡＬユニットにおいて、タイプインジケータフィールド（６９６、例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ）を検査し；
前記タイプインジケータフィールドに第１の状態（例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットから前記運転点まで前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールド（例えばｌａｙｅｒ＿ｉｄ）のあり得る値をマップしているマッピング情報（例えばｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］，ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］）を読み込んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第１のＮＡＬユニットを前記第１のＮＡＬユニットの運転点と関連させ；
前記タイプインジケータフィールドに第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより、および、前記スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、前記第１のＮＡＬユニットの前記運転点を配置することで、前記第１のＮＡＬユニットを前記運転点に関連させる、ように構成されたネットワーク実体。
前記ネットワーク実体は、
前記タイプインジケータフィールドには、前記第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第２のＮＡＬユニットにおけるシンタックス要素（ｄｉｍｅｎｓｉｏｎ＿ｉｄ＿ｌｅｎ＿ｍｉｎｕｓ１）に従って１つ以上の部分に前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを分割することにより、前記第１のＮＡＬユニットを前記運転点に関連付け、前記スケーラビリティ空間内におけるベクトルの座標として前記部分の前記値を使用することにより前記第１のＮＡＬユニットの前記運転点を配置して、前記第２のＮＡＬユニットにおける更なるシンタックス要素（ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ）に従って前記スケーラビリティ次元を意味論的に決定するように構成された、請求項４８に記載のネットワーク実体。
前記ネットワーク実体は、
前記タイプインジケータフィールドは、前記第１の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットにおける更なるシンタックス要素（ｓｃａｌａｂｉｌｉｔｙ＿ｍａｓｋ）から前記スケーラビリティ次元の数ｐおよび意味論的意味を決定し、かつ前記第２のＮＡＬユニットからｐ次元ベクトルのリスト（７０８）を読込むことにより前記レイヤインジケータフィールドの前記あり得る値を前記運転点に関連付けるように構成されている、請求項４８または４９に記載のネットワーク実体。
前記タイプインジケータフィールドに前記第２の状態がある場合、前記ネットワーク実体は、前記第２のＮＡＬユニットからリストを読込むことをスキップするように構成されている、請求項５０に記載のネットワーク実体。
前記ネットワーク実体は、前記第１のまたは前記第２の状態を有する前記タイプインジケータフィールドにかかわりなく前記第２のＮＡＬユニットから前記さらなるシンタックス要素を読込み、前記レイヤインジケータフィールドの前記サイズは、前記第１のまたは前記第２の状態を有する前記タイプインジケータフィールドにかかわりなく同じであるように構成されている、請求項４９または５１のいずれかに記載のネットワーク実体。
前記ネットワーク実体が、ビデオデコーダから構成されている、請求項４８または５２のいずれかに記載のネットワーク実体。
各レイヤにおいて、前記シーンはスケーラビリティ次元により測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンをレイヤにおけるマルチレイヤビデオデータストリームに符号化するためのビデオエンコーダであって、前記マルチレイヤビデオデータストリームは、前記レイヤの１つと各々が関連した第１のＮＡＬユニットおよび前記第１のＮＡＬユニット内に散在し前記マルチレイヤビデオデータストリームに関する一般情報を示す第２のＮＡＬ情報を含み、前記ビデオエンコーダは、タイプインジケータフィールドを前記第２のＮＡＬユニットに挿入しかつ、
同上が前記運転点への前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールドのあり得る値を前記第２のＮＡＬユニットにマッピングするマップ情報を挿入して第１の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記第１のＮＡＬユニットの運転点は、前記マップ情報により、前記それぞれのレイヤインジケータフィールドに関連するように、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットし、
同上が前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットして第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）を有するように前記タイプインジケータフィールドをセットし、かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が、前記それぞれの第１のＮＡＬユニットに関連する前記運転点を示すように前記以上の部分をセットする、
間で切替えるように構成された、ビデオエンコーダ。
前記ビデオエンコーダは、
同上には第２の状態があるように前記タイプインジケータフィールドを設定する際に、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドが１つ以上の部分に分割されるものに関して定義する前記第２のＮＡＬユニットにシンタックス要素をセットしかつ挿入し、前記スケーラビリティ次元を意味論的に定義する前記第２のＮＡＬユニットに更なるシンタックス要素をセットしかつ挿入するように構成されている、請求項５４に記載のビデオエンコーダ。
各レイヤにおいて、前記シーンがスケーラビリティ次元によって測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームであって、前記マルチレイヤビデオデータストリームは、各々第１のＮＡＬユニットを含み、各々は前記レイヤの１つと関連し、かつ前記第２のＮＡＬユニットは、前記第１のＮＡＬユニット内に散在し、かつ前記マルチレイヤビデオデータストリームに関する一般情報を表し、タイプインジケータフィールド（６９６、例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）は、
前記タイプインジケータフィールドには第１の状態（例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットにおけるマッピング情報は、前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールド（例えばｌａｙｅｒ＿ｉｄ）のあり得る値を前記運転点にマップすることに応じて；
前記タイプインジケータフィールドには第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドは、前記スケーラビリティ空間内のベクトルの座標として前記部分の前記値により定義された前記第１のＮＡＬユニットの前記運転点を有する１つ以上の部分に分割されることに応じて、
前記第２のＮＡＬユニットの中で存在する、マルチレイヤビデオデータストリーム。
シーンがレイヤに符号化されるマルチレイヤビデオデータストリームを対象とし、マルチ規格マルチレイヤデコーダによって復号化し、前記マルチレイヤビデオデータストリームは、各々がレイヤの１つと関連したＮＡＬユニットを含み、前記レイヤは、各レイヤに対し、前記それぞれのレイヤが関連する様々なコーデックを使用してそれぞれのレイヤに関連したＮＡＬユニットが符号化されるように、様々なコーデックに関連し、前記トランスポートレイヤデコーダは、各ＮＡＬユニットに対し、どのコーデックが関係しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームの前記ＮＡＬユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに手渡す、トランスポートレイヤデコーダ。
それぞれのレイヤのコーデックを示している状態に設定されるＮＡＬユニットタイプインジケータを有する前記所定のコーデックのＮＡＬユニットヘッダを使用して、所定のコーデックと異なる任意のコーデックとも関連しているレイヤと関連しているとして確認されていたＮＡＬユニットをカプセル化するようにさらに構成されている、請求項５７に記載のビデオデコーダ。
前記ＮＡＬユニットがそれぞれ到着するチャネルに応じて、識別を実行するようにさらに構成された、請求項５７または５８に記載のビデオデコーダ。
様々なコーデックと関連した前記ＮＡＬユニットが、様々なチャネル上の前記マルチ規格マルチレイヤデコーダに手渡されるように手渡しを実行するようにさらに構成された、請求項５７または５９のいずれかに記載のビデオデコーダ。
前記それぞれのＮＡＬユニットが関連する前記レイヤが関連する前記コーデックを示しているメタデータを各ＮＡＬユニットに提供するようにさらに構成されている、請求項５７または６０に記載のビデオデコーダ。
マルチレイヤビデオデータストリームを、シーンが第１のレイヤの部分から第２のレイヤの同じ位置に配置された部分までインターレイヤ予測を使用してレイヤの階層において符号化され、前記第１のレイヤの画像が第１のブロックの配列に再分割され、かつ、前記第２のレイヤの画像が第２のブロックの配列に再分割され、ラスタースキャン復号化順序が、前記第１のブロックおよび前記第２のブロックの間でそれぞれ定義されるように復号化するためのビデオデコーダであって、前記ビデオデコーダは、
マルチレイヤビデオデータストリームのシンタックス要素構造（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）に応じて、前記第２のレイヤの画像の空間的な第２のブロックの前記横断と関連して前記第１のレイヤの画像の第１のブロックの前記横断との間で、インターレイヤオフセットを有する時間重畳態様で前記第１および第２のブロックを順次横断することにより前記第１および第２のレイヤの前記画像の並列復号化のために、前記第１のブロックを単位として測定されたインターレイヤオフセットを決定するように構成された、ビデオデコーダ。
前記シンタックス要素構造は、長期シンタックス要素構造であり、前記ビデオデコーダは、
所定期間を予め決定し、かつ、
前記所定期間より短い時間間隔において、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記第１のレイヤの前記画像の前記第１のブロックおよび前記第２のレイヤの前記画像の前記第２のブロックのサイズおよび位置、および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定するように構成された、請求項６２に記載のビデオデコーダ。
前記ビデオデコーダは、前記ラスタースキャン復号化順序に沿って順次配置された空間セグメントにおける前記マルチレイヤビデオデータストリームの、および、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間前記インターレイヤオフセットとともに時間重畳態様における前記空間セグメントを順次横断することにより、前記レイヤの画像が分割される並列復号化をサポートし、前記ビデオデコーダは、
前記長期シンタックス要素（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝０、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）があり得る値の第１のセットの値にセットされる場合、前記第１のレイヤの前記画像の空間セグメントを単位として前記インターレイヤオフセットを測定する所定期間に対し予め前記インターレイヤオフセットを決定するために前記長期シンタックス要素構造の前記値を使用し、前記マルチレイヤビデオデータストリームの短期シンタックス要素に基づき、前記所定期間よりも短い時間間隔において、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントのサイズおよび位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度をそれぞれ周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第１のセットに素なあり得る値の第２のセット（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値にセットされる場合、前記所定期間よりも短い時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく前記所定期間内に前記インターレイヤオフセットを周期的に決定し、
前記長期シンタックス要素構造があり得る値の前記第１および第２のセットに素なあり得る値の第３のセット（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ＝１、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）の値にセットされる場合、前記第１のブロックを単位とした前記インターレイヤオフセットの前記決定を実行し、前記第１のレイヤの前記画像の前記第１のブロックおよび前記第２のレイヤの前記画像の前記第２のブロックの前記サイズおよび位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度の周期的な決定をそれぞれ実行する、
ように、前記マルチレイヤビデオデータストリームの前記長期シンタックス要素を検査する、請求項６３に記載のビデオデコーダ。
前記ビデオデコーダは、前記レイヤの画像が分割され前記第１および第２のブロックの行から構成された以外のサブストリームにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記第２のレイヤの画像のサブストリームの前記横断と関連して前記第１のレイヤの画像のサブストリームの前記横断の間に前記同じ画像およびインターレイヤオフセットの直接連続したサブストリームの前記横断の間にイントラピクチャインターサブストリーム遅延を有する時間重畳態様における前記サブストリームを順次横断することによって、波面並列処理を使用する、請求項６３または６４に記載のビデオデコーダ。
前記長期シンタックス要素構造がユニットフラグ（手本としてｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇと比較）および遅延インジケータ（手本としてｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙと比較）を含み、前記ビデオデコーダは、前記長期シンタックス要素構造を調査する際に、
前記遅延インジケータを、同上がゼロまたはそれ以外にセットされるかに関して決定するために調査し、
前記遅延インジケータがゼロにセットされた場合、前記長期シンタックス要素構造の値が前記第２のセットの値にセットされ、かつ、
前記遅延インジケータがゼロ以外の値にセットされた場合、前記長期シンタックス要素構造の前記値を決定するために前記ゼロ以外の値を使用し、かつ前記ユニットフラグがゼロの場合、前記長期シンタックス要素構造の前記値が前記第１のセットの値にセットされ、かつ前記ユニットフラグが１の場合、前記長期シンタックス要素構造の前記値が前記第３のセットの値にセットされることを決定する、請求項６４ないし６５のいずれかに記載のビデオデコーダ。
第１および第２のレイヤの並列復号化を開始する際に前記インターレイヤオフセットに依存するように構成されている、請求項６５ないし６６のいずれかに記載のビデオデコーダ。
前記第１のレイヤの空間セグメントの数ｓまたは符号化ブロックが前記シンタックス要素構造に一意的に従属して数ｓによって完全に復号化されるかに関してチェックし、かつ、前記第１のレイヤの空間セグメントまたは符号化ブロックの間で、少なくともｓが完全に復号化されたことが前記チェックで判明しない限り、前記第１のレイヤを復号化する間、前記第２のレイヤを復号化するのを開始することを延期するように構成されている、請求項６２ないし６７のいずれかに記載のビデオデコーダ。
開始する際にインターレイヤオフセットに依存し、かつ第１および第２のレイヤの並列復号化を完全に処理するように構成された、請求項６２ないし６８のいずれかに記載のビデオデコーダ。
前記第１のレイヤの空間セグメントの数ｓまたは符号化ブロックが前記シンタックス要素構造に一意的に従属して数ｓによって、および、前記第２のレイヤの既に復号化された空間セグメントまたは符号化ブロックの数ｔ−１によって完全に復号化されるかに関してチェックし、前記第１のレイヤの空間セグメントまたは符号化ブロックの第１のレイヤの間で、少なくともｓが完全に復号化されたことが判明しない限り、第１のレイヤを復号化することの間、第２のレイヤの第ｔの空間セグメントまたは符号化ブロックを復号化するのを開始することを延期するように構成されている、請求項６２ないし６９のいずれかに記載のビデオデコーダ。
シーンが第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリーム（４０）を復号化する方法であって、
前記ビデオデコーダは、前記レイヤの画像（１２、１５）が再分割される空間セグメント（８０）における前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６０６；例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ）を検査し、
前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記画像（１２）の前記空間セグメントの各境界に重畳し、かつ、前記マルチレイヤビデオデータストリームの短期シンタックス要素（６０２；例えば、ｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］およびｃｏｌｕｍｎ＿ｗｉｄｔｈ＿ｍｉｎｕｓ１［ｉ］）に基づく前記空間セグメントへの前記第１のレイヤおよび前記第２のレイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔（６０４）で、周期的に決定するように、前記所定期間（６０８）の間、前記第２のレイヤの前記画像（６０８）が再分割される保証として第１のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝１）から値を仮定する前記長期シンタックス要素構造を解釈し、かつ、
前記長期シンタックス要素構造が、第２のあり得る値のセット（例えばｔｉｌｅ＿ｂｏｕｎｄａｒｉｅｓ＿ａｌｉｇｎｅｄ＿ｆｌａｇ＝０）から値を仮定した場合、少なくとも前記短期シンタックス要素の第１のあり得る値に対し、前記第１のレイヤの前記空間セグメントの前記境界のいずれかを覆わない前記第２のレイヤの前記画像の前記空間セグメントの間の境界、および、少なくとも前記短期シンタックス要素の第２のあり得る値に対し、前記第１のレイヤの前記空間セグメントの各境界に重畳する前記第２のレイヤの前記画像の前記空間セグメントの間の境界が存在するように、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素から前記空間セグメントへの前記レイヤの前記画像の前記再分割を、前記所定期間より短い時間間隔で、周期的に決定する、方法。
前記マルチレイヤビデオデータストリームが前記レイヤの画像が再分割される空間セグメントにおいて並列に復号化可能であるように、第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層におけるマルチレイヤビデオデータストリームにシーンを符号化する方法であって、前記方法は、
長期シンタックス要素構造（６０６）および短期シンタックス要素（６０２）を前記マルチレイヤビデオデータストリームに挿入し、前記短期シンタックス要素は、前記第１のレイヤおよび前記第２のレイヤの前記画像の前記空間セグメントへの前記再分割を、時間間隔において、定義しており、かつ、
前記長期シンタックス要素構造を設定する間で切替え、
前記時間間隔より長い所定期間（６０８）の間、第１のあり得る値のセットからの値は、前記短期シンタックス要素をあり得る設定のセットからの適切なサブセットに設定しながら、前記第２のレイヤの前記画像の前記空間セグメントの間の境界は前記第１のレイヤの前記空間セグメントの各境界に重畳するように、前記適切なサブセットは、前記所定期間の間に、前記第２のレイヤの前記画像が再分割されるように選択され、
前記所定期間の間、第２のあり得る値のセットからの値は、あり得る設定の前記セットのいずれかに前記短期シンタックス要素を設定しながら、前記あり得る設定のセットは、前記第１のレイヤの前記空間セグメントの前記境界のいずれかに重畳しない前記第２のレイヤの前記画像の前記空間セグメントの間に境界が存在することにより、少なくとも１つの設定を、および、前記第２のレイヤの前記画像の前記空間セグメントの間の境界が前記第１のレイヤの前記空間セグメントの各境界に重畳することによる少なくとも他の設定を含む、ように切替えることを含む、方法。
画像がさまざまな空間レイヤにおいてかつ前記空間レイヤの少なくとも１つに対し、第１の空間セグメントにおいて、符号化される空間スケーラブルビットストリーム（４０）を復号化するための方法であって、
前記方法は、
前記第１の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割（６２２）の任意の分割は、前記分割の任意の他の分割により覆われた前記第１の空間レイヤの前記画像の部分から独立するように、あるいは、
前記アップサンプリングされた基準ピクチャの前記分割（６２２）の任意の部分は、前記それぞれの分割に空間的に隣接する前記分割の他の分割により覆われた前記第１の空間レイヤの前記画像の部分に従属するように、
アップサンプリングされた基準画像を得るために第１の空間レイヤの画像（１２）をアップサンプリングし、かつ前記アップサンプリングされた基準画像を使用して第２の空間レイヤの画像（１５）を予測し、前記復号化のための方法は、前記シンタックス要素に従属して、前記第１の空間レイヤの前記画像を補間（６２０）するために、空間スケーラブルビットストリームにおけるシンタックス要素（６１６；例えばｉｎｄｅｐｅｎｄｅｎｔ＿ｔｉｌｅ＿ｕｐｓａｍｐｌｉｎｇ＿ｉｄｃ）に応答することを含む方法。
第１の空間セグメントにおいて、画像をさまざまな空間レイヤにおけるかつ空間レイヤの少なくとも１つに対しスケーラブルビットストリームに符号化するための方法であって、
前記方法は、
前記第１の空間セグメントに依存する、前記アップサンプリングされた基準画像の分割の任意の部分は、前記分割の前記他の部分のいずれかにより覆われた前記第１の空間レイヤの前記画像の部分から独立しているように、
前記アップサンプリングされた基準画像の前記分割の任意の部分は、前記それぞれの部分に空間的に隣接する前記分割の他の部分により覆われた前記第１の空間レイヤの前記画像の部分に従属しているように、
アップサンプリングされた基準画像を得るために第１の空間レイヤの画像をアップサンプリングし、前記アップサンプリングされた基準画像を使用して第２の空間レイヤの画像を予測し、前記方法は、シンタックス要素（６０６）を空間スケーラブルビットストリームにセットしかつ挿入し、前記シンタックス要素に依存して前記第１の空間レイヤの前記画像を補間することを含む、方法。
シーンが第１のレイヤから第２のレイヤまでインターレイヤ予測を使用してレイヤの階層において符号化されたマルチレイヤビデオデータストリームを復号化する方法であって、前記ビデオデコーダは、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間インターレイヤ遅延を有する時間重畳態様における前記空間セグメントを順次横断することによりレイヤの画像が分割された空間セグメントにおける前記マルチレイヤビデオデータストリームの並列復号化をサポートし、前記方法は、
前記マルチレイヤビデオデータストリームの長期シンタックス要素構造（６４２；例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）を検査し、
前記長期シンタックス要素構造（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）があり得る値の第１のセットの値にセットされた場合、所定期間に対し前もって前記インターレイヤオフセットを決定するために前記長期シンタックス要素の前記値を使用し、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントのサイズおよび位置を、および、前記所定期間よりも短い時間間隔で、および前記マルチレイヤビデオデータストリームの短期シンタックス要素（６０２）にそれぞれ基づき前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の空間サンプリング解像度を、周期的に決定し、
前記長期シンタックス要素があり得る値の第１のセットと素なあり得る値の第２のセット（例えばｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値にセットされるとき、前記所定期間より短い時間間隔において、所定の時間より小さい時間間隔において、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素に基づく所定期間内で前記インターレイヤオフセットを周期的に決定するのことを含む方法。
マルチレイヤビデオデータストリームが、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間にインターレイヤオフセットを有する時間重畳態様において前記空間セグメントを順次横断することにより前記レイヤの画像が分割された空間セグメントに復号化可能なように第１のレイヤから第２のレイヤにインターレイヤ予測を使用してレイヤの階層においてシーンをマルチレイヤビデオデータストリームに符号化する方法であって、前記方法は、
長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）および短期シンタックス要素を前記マルチレイヤビデオデータストリームに挿入およびセットし、前記マルチレイヤビデオデータストリームの前記短期シンタックス要素は、定期的に、それぞれ前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの時間間隔、サイズ、位置において定義し、かつ、前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度を定義し、
前記方法は、セットの間を切替えるように構成され、
前記所定期間の間、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度が、前記第２のレイヤの画像の空間セグメントの前記横断に関連して前記第１のレイヤの画像の空間セグメントの前記横断の間前記長期シンタックス要素により示された前記インターレイヤオフセットより短いまたは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより、それぞれ前記マルチレイヤビデオデータストリームの復号化を可能にするように、前記時間間隔より長い所定期間に対し前記インターレイヤオフセットを示す前記値を有し、所定期間に対し、あり得る一連のセットから適切なサブセットへ前記短期シンタックス要素を、セットして、前記適切なサブセットが選択され、あり得る値の第１のセットの値への前記長期シンタックス要素構造（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ≠０）をセットし、
前記所定期間の間、あり得る値の第２のセット（ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ＝０）の値への前記長期シンタックス要素は、あり得る値の前記第１のセットと素であり、前記短期シンタックス要素を可能な一連のセットのいずれかにセットし、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つのセットを含むあり得る一連のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を不可にし、かつ、前記第１のレイヤの前記画像の前記空間セグメントおよび前記第２のレイヤの前記画像の前記空間セグメントの前記サイズおよび前記位置および前記第１のレイヤの前記画像および前記第２のレイヤの前記画像の前記空間サンプリング解像度に従う少なくとも１つの他のセットは、それぞれ、前記第２のレイヤの画像の空間セグメントの前記横断に関連する前記第１のレイヤの画像の空間セグメントの前記横断の間、前記長期シンタックス要素により示された前記インターレイヤオフセットより短いあるいは等しい現実のインターレイヤオフセットを有する前記時間重畳態様における前記空間セグメントを順次横断することにより前記マルチレイヤビデオデータストリームの復号化を可能にするようにセットすることを含む、方法。
各レイヤにおいて、前記シーンがスケーラビリティ次元によって測定されるスケーラビリティ空間の異なる運転点において符号化されるように、シーンがレイヤにおいて符号化されるマルチレイヤビデオデータストリームを処理するための方法であって、前記マルチレイヤビデオデータストリームは、その各々が前記レイヤの１つと関連した第１のＮＡＬユニット、および、前記第１のＮＡＬユニット内で散在して、前記マルチレイヤビデオデータストリームに関する一般情報を表す第２のＮＡＬユニットを含む方法であって、前記方法は、
前記第２のＮＡＬユニットにおいて、タイプインジケータフィールド（６９６、例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ）を検査し；
前記タイプインジケータフィールドに第１の状態（例えばｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝０）がある場合、前記第２のＮＡＬユニットから前記運転点まで前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールド（例えばｌａｙｅｒ＿ｉｄ）のあり得る値をマップしているマッピング情報（例えばｌａｙｅｒ＿ｉｄ＿ｉｎ＿ｎｕｈ［ｉ］，ｄｉｍｅｎｓｉｏｎ＿ｉｄ［ｉ］［ｊ］）を読み込んで、前記レイヤインジケータフィールドおよび前記マッピング情報を介して前記第１のＮＡＬユニットを前記第１のＮＡＬユニットの前記運転点と関連させ；
前記タイプインジケータフィールドに第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）がある場合、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより、および、前記スケーラビリティ空間内でベクトルの座標として前記部分の前記値を使用することにより、前記第１のＮＡＬユニットの前記運転点を配置することで、前記第１のＮＡＬユニットを前記運転点に関連させることを含む方法。
各レイヤにおいて、前記シーンはスケーラビリティ次元によって測定されたスケーラビリティ空間の様々な運転点において符号化されるように、シーンをレイヤにおけるマルチレイヤビデオデータストリームに符号化するための方法であって、前記マルチレイヤビデオデータストリームは、前記レイヤの１つと各々が関連した第１のＮＡＬユニットおよび前記第１のＮＡＬユニット内に散在し前記マルチレイヤビデオデータストリームに関する一般の情報を表す第２のＮＡＬユニットを含み、前記方法は、
タイプインジケータフィールドを前記第２のＮＡＬユニットに挿入しかつ、
同上が前記運転点への前記第１のＮＡＬユニットヘッダにおけるレイヤインジケータフィールドのあり得る値を前記第２のＮＡＬユニットにマッピングするマップ情報を挿入して第１の状態を有するように前記タイプインジケータフィールドをセットし、かつ、前記第１のＮＡＬユニットの運転点は、前記マップ情報により、前記それぞれのレイヤインジケータフィールドに関連するように、前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットし、
同上が前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドを１つ以上の部分に分割することにより前記第１のＮＡＬユニットにおける前記レイヤインジケータフィールドをセットして第２の状態（ｄｅｄｉｃａｔｅｄ＿ｓｃａｌａｂｉｌｉｔｙ＿ｉｄｓ＿ｆｌａｇ＝１）を有するように前記タイプインジケータフィールドをセットし、かつ、前記スケーラビリティの範囲内で、ベクトルの座標に対応する前記部分の前記値が、前記それぞれの第１のＮＡＬユニットに関連する前記運転点を示すように前記以上の部分をセットする、
間で切替えることを含む、方法。
シーンがレイヤに符号化されるマルチレイヤビデオデータストリームを対象とし、マルチ規格マルチレイヤデコーダにより復号化し、前記マルチレイヤビデオデータストリームは、レイヤの１つと各々が関連したＮＡＬユニットより構成され、前記レイヤは、前記それぞれのレイヤが関連する様々なコーデックを使用して前記それぞれのレイヤに関連したＮＡＬユニットが符号化されるように様々なコーデックと関連する方法であって、前記方法は、
各ＮＡＬユニットごとに、どのコーデックが関連しているかを確認し、かつ、
前記マルチレイヤビデオデータストリームのＮＡＬユニットを、前記マルチレイヤビデオデータストリームを復号化するために様々なコーデックと関連したレイヤの間にインターレイヤ予測を使用する前記マルチ規格マルチレイヤデコーダに渡すこと、を含む方法。
マルチレイヤビデオデータストリームを、シーンが第１のレイヤの部分から第２のレイヤの同じ位置に配置された部分までインターレイヤ予測を使用してレイヤの階層において符号化され、前記第１のレイヤの画像が第１のブロックの配列に再分割され、かつ、前記第２のレイヤの画像が第２のブロックの配列に再分割され、ラスタースキャン復号化順序が、前記第１のブロックおよび前記第２のブロックの間でそれぞれ定義されるように復号化する方法であって、前記方法は、
前記マルチレイヤビデオデータストリームのシンタックス要素構造（例えばｃｔｂ＿ｄｅｌａｙ＿ｅｎａｂｌｅｄ＿ｆｌａｇ、ｍｉｎ＿ｓｐａｔｉａｌ＿ｓｅｇｍｅｎｔ＿ｄｅｌａｙ）に応じて、前記第２のレイヤの画像の空間的な第２のブロックの前記横断に関連して前記第１のレイヤの画像の第１のブロックの前記横断の間前記インターレイヤオフセットを有する時間重畳態様における前記第１および第２のブロックを順次横断することにより、前記第１および第２のレイヤの前記画像を並列復号化するための、前記第１のブロックを単位として測定されたインターレイヤオフセットを決定することを含む、方法。
コンピュータが請求項７１〜８０のいずれかに記載の方法で動くときに、実行するためのプログラムコードを有するコンピュータプログラム。