JP2023116468A

JP2023116468A - エンハンスメント層予測に層間予測寄与を使用するスケーラブルビデオ符号化

Info

Publication number: JP2023116468A
Application number: JP2023081951A
Authority: JP
Inventors: トビアスヒンツ; Tobias Hinz; ハリチャランラクシュマン; Lakshman Haricharan; ヤンシュテーゲマン; Stegemann Jan; フィリップヘレ; Helle Philipp; ミーシャジークマン; Siekmann Mischa; カルステンズューリング; Suehring Karsten; デトレフマルペ; Detlev Marpe; ハイコシュヴァルツ; Heiko Schwarz; クリスティアンバルトニク; Bartnik Christian; アブデルハミドアリアテフイブラヒムハイラト; Atef Ibrahim Khairat Abdelhamid Ali
Original assignee: GE Video Compression LLC
Current assignee: GE Video Compression LLC
Priority date: 2012-10-01
Filing date: 2023-05-18
Publication date: 2023-08-22
Also published as: EP2904783B1; KR102472484B1; US20160014425A1; JP2021182742A; US11575921B2; WO2014053518A1; KR20200035484A; US11589062B2; KR20190091377A; CN105009577B; EP3618436A1; JP2018042257A; CN110267035B; US10687059B2; KR20210063454A; US10681348B2; JP6301933B2; US10694183B2; US10218973B2; JP2015537412A

Abstract

【課題】より高い符号化効率を実現するスケーラブルビデオデコーダ、エンコーダ及び方法を提供する。【解決手段】スケーラブルビデオデコーダは、符号化されたデータストリームからベース層信号を再構成して再構成されたベース層信号を得る、エンハンスメント層信号の既に再構成された部分から、現在再構成されたエンハンスメント層信号の一部を空間的又は時間的に予測することを含むように再構成して、エンハンスメント層内部予測信号３４を得、現在再構成されるべき部分において、層間予測信号３８とエンハンスメント層内部信号との間の重み付けが、異なる空間周波数成分にわたって変化するように、再構成されたベース層信号から得られた層間予測信号とエンハンスメント層内部予測信号との重み付け平均を形成してエンハンスメント層予測信号４２を得、エンハンスメント層予測信号を用いてエンハンスメント層信号を予測的に再構成されたバージョン５４を得る。【選択図】図７

Description

本願発明は、スケーラブルビデオ符号化に関する。

非スケーラブル（ｎｏｎ－ｓｃａｌａｂｌｅ）符号化において、イントラ符号化は、既に符号化された画像の参照データでなく、現在の画像の既に符号化された部分のデータ（例えば、再構築サンプル、符号化モード、またはシンボル統計）だけを利用する符号化技術を参照する。例えば、イントラ符号化された画像（またはイントラ画像）は、いわゆるランダムアクセスポイントで、デコーダをビットストリームに同調できるために、放送ビットストリーム内で使用される。また、イントラ画像は、エラー傾向がある環境内で、エラー伝播を制限するために使用される。一般に、参照画像として使用できる画像は、ここでは入手できないので、符号化映像系列の最初の画像は、イントラ画像として符号化されなければならない。しばしば、イントラ画像は、時間予測が適した予測信号を通常提供できない場面カットでも使用される。

さらに、イントラ符号化モードは、いわゆるインター画像内で特定の領域／ブロックのために使用される。そこでは、それらは、レート歪み効率に対してインター符号化モードより良く実行する。これは、時間予測が相当不十分に行われる領域（オクルージョン、部分的にディソルブしたりフェードするオブジェクト）と同様に、平坦な領域内でよくある場合である。

スケーラブル（ｓｃａｌａｂｌｅ）符号化において、イントラ符号化の概念（イントラ画像の符号化とインター画像内のイントラブロックの符号化）は、同じアクセス単位（ｕｎｉｔ）または時刻に属する全ての画像に拡張できる。従って、空間または品質エンハンスメント（ｅｎｈａｎｃｅｍｅｎｔ）層のためのイントラ符号化モードは、符号化効率を増加させると同時に瞬時に、下位層画像から層間予測の使用をすることができる。それは、現在のエンハンスメント層の画像内で既に符号化された部分がイントラ予測のために使用できるだけではなく、同じ時刻に既に符号化された下位層画像も利用できることを意味する。また、後者の概念は、層間イントラ予測とも称される。

最先端のハイブリッドビデオ符号化規格（Ｈ．２６４／ＡＶＣまたはＨＥＶＣなど）において、ビデオ系列の画像はサンプルのブロックに区分される。ブロックのサイズは、固定されるか、または、符号化手法はブロックをさらに小さいブロックのサイズにサブ分割されることを可能にする階層構造を提供される。通常、ブロックの再構成は、ブロックの予測信号を発生させて、送信された残差信号を付加することによって得られる。通常、残差信号は、変換符号化を使用して、送信される。それは、変換係数のための量子化インデックスリスト（変換係数レベルとも称される）が、エントロピー符号化技術を使用して、送信されることを意味する。そして、デコーダ側では、これら送信された変換係数レベルが、スケーリングされ、逆変換されて、予測信号に追加される残差信号を得られる。残差信号は、（現在の時刻のための既に送信されたデータのみを使用する）イントラ予測によって、または、（異なる時刻のために既に送信されたデータを使用する）インター予測によって発生する。

仮にインター予測が使用されるならば、予測ブロックは、既に再構成されたフレームのサンプルを使用して、動き補償予測によって導出される。これは、（１つの参照画像と１セットの動きパラメータを使用して、）単方向の予測によって行うことができる。あるいは、予測信号は、マルチ仮説予測によって発生することができる。後者の場合、２つ以上の予測信号が重畳される。すなわち、各サンプルに対して、重み付け平均が、最終予測信号を形成するために構成される。（重畳された）多重予測信号は、異なる仮説（例えば、異なる参照画像または動きベクトル）毎に異なる動きパラメータを使用して発生できる。また、単方向の予測に対して、動き補償予測信号のサンプルに定数因子を掛けて、最終予測信号を形成するために一定のオフセットを加えることも可能である。また、このようなスケーリングとオフセット補正が、マルチ仮説予測において、全ての仮説に、または、選択された仮説にも使用される。

現在の技術レベルのビデオ符号化技術において、ブロックのためのイントラ予測信号が、現在のブロックの空間的近傍（それは、ブロック処理順序に従って現在のブロックの前で再構成されたブロック）からサンプルを予測することによって得られる。最新の規格において、空間領域で予測を実行する様々な予測手法が、利用される。隣接ブロックのサンプルをフィルタにかけた、または、フィルタにかけなかった、精密な粒状の方向性予測モードが、特定の角度に拡張されて、予測信号を発生させる。更に、隣接するブロックのサンプルを使用する平面に基づいたおよびＤＣに基づいた予測モードも存在して、平坦な予測平面またはＤＣ予測ブロックを発生させる。

古いビデオ符号化規格（例えば、Ｈ．２６３、ＭＰＥＧ－４）において、イントラ予測は変換領域内で実行された。この場合、送信係数は逆量子化された。そして、変換係数のサブセット（ｓｕｂｓｅｔ）に対して、変換係数値は、隣接するブロックの対応する再構成された変換係数を使用して、予測された。逆量子化変換係数は、予測変換係数値に追加され、そして、再構成された変換係数は、逆変換に入力として使用された。逆変換の出力は、ブロックのための最終再構成信号を形成した。

スケーラブルビデオ符号化においても、ベース層情報は、エンハンスメント層のための予測過程を補助するために利用される。スケーラブル符号化のための最先端のビデオ符号化規格（Ｈ．２６４／ＡＶＣのＳＶＣ拡張）において、エンハンスメント層内でイントラ予測過程の符号化効率を向上させるための１つの追加モードがある。このモードは、マクロブロックレベル（１６×１６個のルマ（ｌｕｍａ）のサンプルのブロック）でシグナリングされる。このモードは、下位層内の併置されたサンプルが、イントラ予測モードを使用して、符号化される場合にだけ、補助される。仮に、このモードが、品質エンハンスメント層内でマクロブロックのために選択されるならば、予測信号は、非ブロッキングフィルタ操作の前に、再構成された下位層信号の併置されたサンプルによって組立てられる。仮に、層間イントラ予測モードが、空間エンハンスメント層内で選択されるならば、予測信号は、（非ブロッキングフィルタ操作の後で、）併置された再構成されたベース層信号をアップサンプリングすることによって発生する。アップサンプリングするために、ＦＩＲフィルタが使用される。一般に、層間イントラ予測モードのためには、追加残差信号が変換符号化によって送信される。また、仮に、それがビットストリーム内で対応してシグナリングされるならば、残差信号の送信は省略できる（ゼロに等しいと推論される）。最終再構成信号が、（送信された変換係数レベルをスケーリングして、逆空間変換を適用することによって得られる）再構成された残差信号を予測信号に追加することによって得られる。

しかしながら、スケーラブルビデオ符号化において、より高い符号化効率を達成できることが好ましい。

従って、本願発明の目的は、より高い符号化効率を実現するスケーラブルビデオ符号化のための概念を提供することである。

この目的は同時期に提出の書類に記載の独立請求項の主題によって達成される。

本願発明の１つの実施の形態は、スケーラブルビデオ符号化内で、エンハンスメント層信号を予測符号化するための、より良い予測器（ｐｒｅｄｉｃｔｏｒ）が、エンハンスメント層予測信号を得るために、異なる空間周波数成分に対して異なる重み付けの方法で、層間予測信号とエンハンスメント層内部予測信号とから、エンハンスメント層予測信号を形成することによって（すなわち、現在再構成されるべき部分で、層間予測信号とエンハンスメント層内部予測信号との重み付け平均を形成することによって）達成され得て、層間予測信号とエンハンスメント層内部予測信号がエンハンスメント層予測信号に寄与する重み付けが、異なる空間周波数成分を変化するようにエンハンスメント層予測信号が得られるということである。このため、個別の寄与成分（すなわち、一方で層間予測信号および他方でエンハンスメント層内部予測信号）のスペクトル特性に対して最適化された方法で、層間予測信号およびエンハンスメント層内部予測信号から、エンハンスメント層予測信号を解釈することが可能である。例えば、解像度または品質の改良に基づいて、層間予測信号が、再構成されたベース層信号から得られる。層間予測信号は、高周数波と比較して低周波数で、より正確であり得る。エンハンスメント層内部予測信号に関する限り、特性は逆であり得る。すなわち、その精度は、低周波数と比較して高周波数に対して増加する。この例では、低周波数では、層間予測信号のエンハンスメント層予測信号への寄与が、それぞれの重み付けで、エンハンスメント層内部予測信号のエンハンスメント層予測信号への寄与を超える。そして、高周波に関する限り、エンハンスメント層内部予測信号のエンハンスメント層予測信号への寄与を超えない。このため、より正確なエンハンスメント層予測信号が達成され得る。その結果、符号化効率が増加して、より高い圧縮率がもたらされる。

様々な実施の形態によって、異なる可能性が、ちょうど概説された概念を、概念に基づいたどんなスケーラブルビデオ符号化にも組込むために説明される。例えば、重み付け平均の形成は空間領域または変換領域内のいずれかで形成され得る。スペクトル重み付け平均の実行は、個別の寄与（すなわち、層間予測信号とエンハンスメント層内部予測信号）で実行されるべき変換を必要とする。しかし、例えば、ＦＩＲまたはＩＩＲフィルタリングを含む空間領域内の層間予測信号とエンハンスメント層内部予測信号とのいずれかをスペクトル的にフィルタにかけることを回避する。しかしながら、空間領域内のスペクトル重み付け平均の形成を実行することは、変換領域を経由して重み付け平均への個別の寄与の迂回を避けることができる。領域が実際にスペクトル重み付け平均の形成を実行するために選択される決定は、スケーラブルビデオデータストリームが、エンハンスメント層信号内で現在構成されるべき部分に対して、変換係数の形式で残差信号を含んでいるか否かに依存し得る。仮に、含んでいなければ、変換領域を経由する迂回は止められ得る。一方、残差信号が存在する場合、変換領域を経由する迂回路は、変換領域内の送信された残差信号に対して、変換領域内のスペクトル重み付け平均に直接に加算することを許容するので、更に有利である。

本願発明の１つの態様は、ベース層の符号化／復号化から利用可能な情報（すなわち、ベース層ヒント）が、より効率的にエンハンスメント層動き（ｍｏｔｉｏｎ）パラメータを符号化することによって、エンハンスメント層の動き補償予測をより効率的にすることに利用され得る、ということである。特に、エンハンスメント層信号のフレームの隣接する既に再構成されたブロックから集められた動きパラメータ候補のセットは、おそらくベース層信号（エンハンスメント層信号のフレームのブロックに併置されたベース層信号）のブロックの１つ以上のベース層動きパラメータセットによって拡大され得る。その結果、動きパラメータ候補セットの利用可能な品質が、エンハンスメント層信号のブロックの動き補償予測が、拡張された動きパラメータ候補セットの動きパラメータ候補の１つを選択して、その選択された動きパラメータ候補を予測のために使用して、実行され得ることに基づいて改良される。追加的に、または、二者択一的に、エンハンスメント層信号の動きパラメータ候補リストが、ベース層の符号化／復号化に関わるベース層動きパラメータに依存して順序付けされ得る。このため、順序付けされた動きパラメータ候補リストからエンハンスメント層動きパラメータを選択するための確率分布は、例えば、明らかにシグナリングされたインデックス構文要素が、少ないビットを使用して、（例えば、エントロピー符号化などを使用して、）符号化され得るように圧縮される。さらに、付加的に、または、二者択一的に、ベース層の符号化／復号化内で使用されたインデックスが、エンハンスメント層のための動きパラメータ候補リスト内へインデックスを決定する基礎として作用し得る。このため、エンハンスメント層のためのインデックスのどんなシグナリングも、完全に回避され得る。または、単にインデックスに対して、このようにして決定した予測の偏差が、エンハンスメント層サブストリーム内で送信され得て、その結果、符号化効率が向上され得る。

本願発明の１つの態様は、スケーラブルビデオ符号化が、ベース層信号の上でベース層符号化パラメータの空間的な変化を評価することによって、エンハンスメント層ブロックの可能なサブブロックのサブ分割のセット内で、エンハンスメント層予測のために使用されるべきサブブロックのサブ分割の導出／選択によって、より効率的にされる、ということである。このため、仮に、そうならば、少ない信号化オーバーヘッドが、エンハンスメント層データストリーム内で、このサブブロックのサブ分割をシグナリングするために費やされなければならない。このようにして選択されたサブブロックのサブ分割は、エンハンスメント層信号を予測的に符号化／復号化する際に使用され得る。

本願発明の１つの態様は、仮に、それぞれの変換係数ブロックのサブブロックのサブ分割が、ベース層残差信号またはベース層信号に基づいて制御されるならば、エンハンスメント層の変換係数ブロックのサブブロックに基づいた符号化が、より効率的になされ得る、ということである。特に、それぞれのベース層ヒントを利用することによって、サブブロックは、ベース層残差信号またはベース層信号から観察可能なエッジ拡張に対して水平な空間周波数軸に沿って、より長くなり得る。このため、サブブロックの形状を、増加する確率では、各サブブロックが、ほぼ完全に重要な変換係数（すなわち、ゼロに量子化されていない変換係数）、または、重要でない変換係数（すなわち、ゼロに量子化された変換係数のみ）のいずれかで充填され、一方、減少する確率では、どんなサブブロックも、一方に重要な変換係数の数と他方に重要でない変換係数の数を同数有するように、エンハンスメント層変換係数ブロックの変換係数のエネルギーの推定分布に適合させることが可能である。しかしながら、重要な変換係数を有さないサブブロックが、単に１つのフラグ（ｆｌａｇ）の使用などによって、データストリーム内で効率的にシグナリングされ得るという事実のため、そして、重要な変換係数で殆んど完全に充填されたサブブロックが、そこに点在し得る非重要な変換係数を符号化するための信号化量の浪費を必要としないという事実のため、エンハンスメント層の変換係数ブロックを符号化するための符号化効率が増加する。

本願発明の１つの態様は、スケーラブルビデオ符号化の符号化効率が、ベース層信号の併置されたブロックのイントラ予測パラメータの使用によって、エンハンスメント層の現在のブロックの空間的近傍部内の失われている空間イントラ予測パラメータ候補を代用することによって増加し得る、ということである。このため、空間イントラ予測パラメータを符号化するための符号化効率は、エンハンスメント層のイントラ予測パラメータのセットの改良された予測品質のために増加する、または、より正確に述べると、増加する見込みである。エンハンスメント層のイントラ予測されたブロックのためのイントラ予測パラメータのための適切な予測器が、有用であり、その結果、それぞれのエンハンスメント層ブロックのイントラ予測パラメータのシグナリングが、平均的に少ないビットで実行され得る、という見込みを増加させる。

更なる有利な実現は従属請求項で説明される。

好ましい実施の形態が、図面に関して以下にさらに説明される。

図１は本明細書に記載された実施形態および態様が実装され得るスケーラブルビデオエンコーダを示すブロック図である。図２は本明細書に記載された実施形態および態様が同様に実装され得る図１のスケーラブルビデオエンコーダに適合するスケーラブルビデオデコーダを示すブロック図である。図３は本明細書に記載された実施形態および態様が実装され得るスケーラブルビデオエンコーダのより特定した実施の形態を示すブロック図である。図４は本明細書に記載された実施形態および態様が実装され得る図３のスケーラブルビデオエンコーダに適合するスケーラブルビデオデコーダのブロック図である。図５は符号化／復号化の順序付けを更に説明する、ビデオ、そのベース層およびエンハンスメント層のバージョンを示す模式図である。図６はエンハンスメント層のための可能な予測モードを説明するために階層化されたビデオ信号の一部分を示す模式図である。図７は実施形態によりエンハンスメント層イントラ予測信号と層間予測信号との間の重み付けをスペクトル的に変えて使用して、エンハンスメント層予測信号の形成を示す構成図である。図８は実施形態によりエンハンスメント層のサブストリーム内におそらく含まれた構文要素の模式図である。図９は形成／結合が空間領域内で実行された実施の形態に従って、図７の形成の可能な実現を示す模式図である。図１０は形成／結合がスペクトル領域内で実行された実施の形態に従って、図７の形成の実現を説明するための模式図である。図１１は実施形態に従って図１１はベース層からエンハンスメント層信号への空間イントラ予測パラメータ導出を説明するために、階層化されたビデオ信号から取り出した一部分を示す模式図である。図１２は実施形態に従って図１１の導出の拡張を説明する模式図である。図１３は実施形態に従ってベース層から得られた１つ空間イントラ予測パラメータが挿入される１セットの空間イントラ予測パラメータ候補を示す模式図である。図１４は実施形態に従ってベース層からの予測パラメータ粒状導出を説明するために、階層化されたビデオ信号から取出した一部分を示す模式図である。図１５ａおよび図１５ｂは、ベース層内で２つの異なる例に従って、ベース層動きパラメータの空間的な変化を使用して、現在のブロックのために適切なサブ分割の選択方法を示す模式図である。図１５ｃは現在のエンハンスメント層のブロックのために可能なサブブロックのサブ分割内で最も粗い選択方法の第１の可能性を説明するための模式図である。図１５ｄは現在のエンハンスメント層のブロックのために可能なサブブロックのサブ分割内で最も粗い選択方法の第２の可能性を説明するための模式図である。図１６は実施例に従って現在のエンハンスメント層のブロックのためにサブブロックのサブ分割の導出の使用を説明するために、階層化されたビデオ信号から取り出した一部分を示す模式図である。図１７は実施例に従ってエンハンスメント層動きパラメータデータを効率的に符号化するためのベース層ヒントの利用を説明するために階層化されたビデオ信号から取り出した一部分を示す模式図である。図１８はエンハンスメント層動きパラメータ信号化の効率を増加させる第１の可能性を説明するための模式図である。図１９ａはエンハンスメント層動きパラメータ信号化をより効率的にするためのベース層ヒントを利用する方法の第２の可能性を示す模式図である。図１９ｂはエンハンスメント層動きパラメータ候補のリストに載っている順にベース層を転送する第１の可能性を説明するための模式図である。図１９ｃはエンハンスメント層動きパラメータ候補のリストに載っている順にベース層を転送する第２の可能性を説明するための模式図である。図２０はエンハンスメント層動きパラメータのシグナリングをより効率的にするためのベース層ヒントを利用する別の可能性を説明するための模式図である。図２１は実施の形態に従って変換係数ブロックのサブブロックのサブ分割が、適切にベース層から得られたヒントに調整される実施の形態を説明するために、階層化されたビデオ信号から取出した一部分を説明するための模式図である。図２２はベース層からの変換係数ブロックの適切なサブブロックのサブ分割の導出方法の異なる可能性を説明する模式図である。図２３は本明細書で概説した実施例および実施の形態が実装され得る、スケーラブルビデオデコーダのためのさらに詳細な実施の形態を示すブロック図である。図２４ａは本明細書で概説した実施例および実施の形態が実装され得る、図２３のスケーラブルビデオデコーダに適合するスケーラブルビデオエンコーダを示すブロック図である。図２４ｂは本明細書で概説した実施例および実施の形態が実装され得る、図２３のスケーラブルビデオデコーダに適合するスケーラブルビデオエンコーダを示すブロック図である。図２５は（アップサンプリングされた／フィルタにかけられた）ベース層再構成信号（ＢＬＲｅｃｏ）と、既に符号化された隣接ブロックの差（ｄｉｆｆｅｒｅｎｃｅ）信号（ＥＨＤｉｆｆ）を使用する空間イントラ予測との合計によって、層間イントラ予測信号の生成を説明するための模式図である。図２６は（アップサンプリングされた／フィルタにかけられた）ベース層残差信号（ＢＬＲｅｓｉ）と、既に符号化された隣接ブロックの再構成されたエンハンスメント層のサンプル（ＥＨＲｅｃｏ）を使用する空間イントラ予測との合計によって、層間イントラ予測信号の生成を説明するための模式図である。図２７は（アップサンプリングされた／フィルタにかけられた）ベース層再構成信号（ＢＬＲｅｃｏ）と、既に符号化された隣接ブロックの再構成されたエンハンスメント層のサンプル（ＥＨＲｅｃｏ）を使用する空間イントラ予測とを、周波数で重み付けした合計によって、層間イントラ予測信号の生成を説明するための模式図である。図２８は明細書中で使用されるベース層信号とエンハンスメント層信号とを説明するための模式図である。図２９はエンハンスメント層の動き補償予測を説明する模式図である。図３０はベース層残差とエンハンスメント層再構成とを使用する予測を説明するための模式図である。図３１はＢＬ再構成とＥＬ差分信号とを使用する予測を説明するための模式図である。図３２はＢＬ再構成とＥＬ差分信号の第２仮説とを使用する予測を説明するための模式図である。図３３はＢＬ再構成とＥＬ再構成とを使用する予測を説明するための模式図である。図３４は一例として、画像を正方形ブロックに分解することと、対応する四分木構造を説明するための模式図である。図３５は好ましい実施の形態において、サブブロック内に正方形ブロックの許容された分解を説明するための模式図である。図３６は動きベクトル予測の位置を説明するための模式図である。（ａ）は空間候補の位置を表現し、（ｂ）は時間候補の位置を表現する。図３７はアルゴリズムとマージするブロック（ａ）と、空間候補のために実行された冗長検査（ｂ）とを説明するための模式図である。図３８はブロックマージアルゴリズム（ａ）と、空間候補のために実行された冗長検査（ｂ）とを説明するための模式図である。図３９は４×４変換ブロックのための走査方向（対角線、垂直、水平）を説明するための模式図である。図４０は８×８変換ブロックのための走査方向（対角線、垂直、水平）を説明するための模式図である。斜線の領域は重要なサブグループを定義する。図４１は対角線の走査だけが定義されている、１６×１６変換図である。図４２はＪＣＴＶＣ－Ｇ７０３で提案されるように、１６×１６変換のための垂直走査を説明するための模式図である。図４３は１６×１６変換ブロックのための垂直かつ水平な走査の実現を説明するための模式図である。係数サブグループは、それぞれ一つの行または一つの列と定義される。図４４は１６×１６変換ブロックのための垂直かつ水平な走査を説明するための模式図である。図４５は隣接する再構成されたエンハンスメント層のサンプルと再構成されたベース層のサンプルとを使用する後方に適応したエンハンスメント層イントラ予測を説明するための模式図である。図４６は実施形態に従って差分信号の空間的な挿入を説明するために、エンハンスメント層の画像／フレームを示す模式図である。

図１は、以下にさらに概説された実施の形態が組込まれ得る、スケーラブルビデオエンコーダのための実施の形態を一般的な方法で示す。図１のスケーラブルビデオエンコーダは、一般に、参照符号２を使用して示され、ビデオ４を受信して符号化する。スケーラブルビデオエンコーダ２は、スケーラブルな方法で、ビデオ４をデータストリーム６内に符号化するように構成されている。すなわち、データストリーム６は、第１の情報内容量でその中に符号化されたビデオ４を有している第１の部分６ａと、部分６ａのものより大きい情報内容量でその中に符号化されたビデオ４を有しているさらなる部分６ｂと、を含む。例えば、部分６ａと６ｂの情報内容量は、品質または忠実度において、すなわち、オリジナルビデオ４からの画素単位の偏差量および／または空間解像度において異なり得る。しかしながら、また、情報内容量の異なる他の形式が、例えば、色忠実度などにも適用され得る。部分６ａはベース層データストリームまたはベース層サブストリームと呼ばれ得る。一方、部分６ｂはエンハンスメント層データストリームまたはエンハンスメント層サブストリームと呼ばれ得る。

スケーラブルビデオエンコーダ２は、一方でエンハンスメント層サブストリーム６ｂ無しでベース層サブストリーム６ａから、他方でサブストリーム６ａと６ｂの両方から、再構成可能なビデオ４のバージョン８ａと８ｂとの間の冗長性を利用するように構成されている。そうするために、スケーラブルビデオエンコーダ２は層間予測を使用する。

図１に示すように、スケーラブルビデオエンコーダ２は、二者択一的に、ビデオ４の２つのバージョン４ａと４ｂを受信する。両方のバージョン４ａと４ｂは、ちょうどベース層サブストリーム６ａとエンハンスメント層サブストリーム６ｂとが異なるように、情報内容量が互いに異なる。従って、例えば、スケーラブルビデオエンコーダ２は、サブストリーム６ａと６ｂを発生させるように構成される。その結果、ベース層サブストリーム６ａは、その中に符号化されたバージョン４ａを有する。一方、エンハンスメント層データストリーム（サブストリーム）６ｂは、ベース層サブストリーム６ｂに基づいた層間予測を使用して、その中に符号化されたバージョン４ｂを有する。サブストリーム６ａと６ｂの符号化は共に損失する。

仮に、スケーラブルビデオエンコーダ２が、単に、ビデオ４のオリジナルバージョンを受信するのみであっても、スケーラブルビデオエンコーダ２は、例えば、空間ダウンスケーリング、および／または、より高いビット深さからより低いビット深さへのトーンマッピング（写像）によって、ベース層バージョン４ａを得ることによって、そこから内部的に２つのバージョン４ａと４ｂを導出するように構成できる。

図２は、図１のスケーラブルビデオエンコーダ２に適合するスケーラブルビデオデコーダを、以下に概説された実施の形態を取入れるのに適した同様な方法で示す。図２のスケーラブルビデオデコーダは、一般に、参照符号１０を使用して示され、かつ、スケーラブルビデオデコーダは、一般的に、仮に、完全な方法で、データストリーム６の両方の部分６ａと６ｂがスケーラブルビデオデコーダ１０に達するならば、そこからビデオのエンハンスメント層バージョン８ｂを再構成するように、または、仮に、例えば、部分６ｂが送信損失などのために利用できないならば、そこからビデオのベース層バージョン８ａを再構成するように、符号化データストリーム６をデコード（復号化）するように構成されている。すなわち、スケーラブルビデオデコーダ１０は、ベース層サブストリーム６ａだけからバージョン８ａを再構成でき、かつ、部分６ａと６ｂの両方から層間予測を使用して、バージョン８ｂを再構成できるように構成されている。

より詳細な以下の本願発明の実施の形態（すなわち、実施の形態は、図１と図２の実施の形態がどのように実施されるかを示す）が詳細に説明される前に、図１と図２のスケーラブルビデオエンコーダとデコーダのより詳しい実現が、図３と図４について説明される。図３は、ベース層符号化器１２、エンハンスメント層符号化器１４およびマルチプレクサ１６を備えたスケーラブルビデオエンコーダ２を示す。ベース層符号化器１２は、入力ビデオのベース層バージョン４ａを符号化するように構成されている、一方、エンハンスメント層符号化器１４は、ビデオのエンハンスメント層バージョン４ｂを符号化するように構成されている。従って、マルチプレクサ１６は、ベース層符号化器１２からのベース層サブストリーム６ａとエンハンスメント層符号化器１４からのエンハンスメント層サブストリーム６ｂとを受信して、出力する際に符号化データストリーム６中に両者を多重化する。

図３に示されているように、両方の符号化器１２と１４は、それぞれの入力バージョン４ａと４ｂを、それぞれのサブストリーム６ａと６ｂ内に符号化するために、例えば、空間予測および／または時間予測を使用する予測符号化器であり得る。特に、符号化器１２と１４はそれぞれ、ハイブリッドビデオブロック符号化器であり得る。すなわち、符号化器１２と１４のそれぞれは、例えば、それぞれのビデオバージョン４ａと４ｂの画像またはフレームが、それぞれサブ分割されるブロックの各ブロックのための異なる予測モードの間で選択されている間、ブロックごとに基づいて、ビデオのそれぞれの入力バージョンを符号化するように構成され得る。ベース層符号化器１２の異なる予測モードは、空間および／または時間予測モードを含み得る。一方、エンハンスメント層符号化器１４は、追加して、層間予測モードをサポートし得る。ブロック内へのサブ分割は、ベース層とエンハンスメント層の間で異なり得る。予測モード、様々なブロックのために選択された予測モードのための予測パラメータ、予測残差、そして、オプションで、それぞれのビデオバージョンのブロックサブ分割は、エントロピー符号化を使用して、順番にそれぞれのサブストリーム６ａ，６ｂ内に符号化され得る構文要素を含むそれぞれの構文を使用して、それぞれの符号化器１２，１４によって記述され得る。層間予測は、２，３の例でちょうど言及したように、エンハンスメント層ビデオ、予測モード、予測パラメータ、および／または、ブロックのサブ分割のサンプルを予測するために、例えば１回以上利用される。従って、ベース層符号化器１２とエンハンスメント層符号化器１４の両方が、それぞれ、エントロピー符号化器１９ａ，１９ｂが後に続く予測符号化器１８ａ，１８ｂを含み得る。一方、予測符号化器１８ａ，１８ｂは、それぞれ入力（ｉｎｂｏｕｎｄ）バージョン４ａと４ｂから、予測符号化を使用して、構文要素ストリームを形成する。エントロピー符号化器１９ａ，１９ｂは、それぞれの予測符号化器１８ａ，１８ｂによって出力された構文要素をエントロピー符号化する。ちょうど言及するように、エンコーダ２の層間予測は、エンハンスメント層の符号化手順内で異なる時に関連し得る。従って、予測符号化器１８ｂは、予測符号化器１８ａ、それの出力、およびエントロピー符号化器１９ａの１つ以上に接続されるように示される。同様に、エントロピー符号化器１９ｂは、例えば、ベース層からのエントロピー符号化のために使用されたコンテキストを予測することによって、オプションで層間予測を利用し得る。従って、エントロピー符号化器１９ｂは、オプションで、ベース層符号化器１２の要素のいずれかに接続されるように示される。

図１に対する図２と同じ方法で、図４は、図３のスケーラブルビデオエンコーダに適合するスケーラブルビデオデコーダ１０の可能な実現を示す。従って、図４のスケーラブルビデオデコーダ１０は、サブストリーム６ａと６ｂを得るためにデータストリーム６を受信するデマルチプレクサ４０と、ベース層サブストリーム６ａを復号化するように構成されたベース層デコーダ８０と、エンハンスメント層サブストリーム６ｂを復号化するように構成されたエンハンスメント層デコーダ６０と、を備えている。図示されているように、デコーダ６０は、層間予測を利用するためにそこから情報を受信するためにベース層デコーダ８０に接続されている。これにより、ベース層デコーダ８０は、ベース層サブストリーム６ａからベース層バージョン８ａを再構成できる。そして、エンハンスメント層デコーダ６０は、エンハンスメント層サブストリーム６ｂを使用して、ビデオのエンハンスメント層バージョン８ｂを再構成するように構成されている。図３のスケーラブルビデオエンコーダと類似して、それぞれエンハンスメント層デコーダ６０とベース層デコーダ８０は、エントロピーデコーダ１００，３２０、続いて、予測デコーダ１０２，３２２をそれぞれ内部に含み得る。

以下の実施の形態の理解を簡素化するために、図５は、ビデオ４の異なるバージョン、すなわち、単に符号化損失によって互いから外れているベース層バージョン４ａと８ａとを例示的に示す。同様に、エンハンスメント層バージョン４ｂと８ｂとは、それぞれ符号化損失によって互いから単に外れている。図示されているように、ベース層信号とエンハンスメント層信号は、それぞれ画像２２ａと２２ｂの系列で構成され得る。それらは、時間軸２４に沿って互い（すなわち、エンハンスメント層信号の時間的に対応する画像２２ｂの他にも、ベース層バージョンの画像２２ａ）に登録されるように、図５内に示されている。前述のように、画像２２ｂは、より高い空間解像度を有し、および／または、より高い忠実度などで（例えば、画像のサンプル値の、より高いビット深さで）ビデオ４を表し得る。実線および点線を使用して、符号化／復号化の順序が、画像２２ａ，２２ｂの間で定義されるために示される。図５内で示された例に従って、符号化／復号化の順序が、所定の時間のタイムスタンプ／インスタンスのベース層画像２２ａは、エンハンスメント層信号の同じタイムスタンプのエンハンスメント層画像２２ｂの前に横断されるような方法で、画像２２ａと２２ｂを横断する。時間軸２４に関して、画像２２ａ，２２ｂは、提供時間の順序で符号化／復号化の順序２６によって横断される。しかし、画像２２ａ，２２ｂの提供時間の順序から外れる順序も、可能である。エンコーダ２もデコーダ１０も、符号化／復号化の順序２６に沿って連続して符号化／復号化する必要はない。むしろ、符号化／復号化は平行して使用され得る。符号化／復号化順序２６は、空間的、時間的、および／または、層間の意味で、互いに隣接するベース層信号とエンハンスメント層信号の部分の間の利用性を定義し得る。その結果、エンハンスメント層の現在の部分を符号化／復号化する時に、その現在のエンハンスメント層部分の利用可能な部分が、符号化／復号化の順序を通して定義される。従って、この符号化／復号化の順序２６に従って利用可能である単に隣接する部分が、予測のためにエンコーダによって使用されるので、デコーダは、予測を手直しするために、同じ情報源にアクセスする。

以下の図に対して、図１～図４に対して前述したスケーラブルビデオエンコーダまたはデコーダが、本願発明の１つの態様に従って、本願発明の実施の形態を形成するようにどのように実装されるかが説明される。以下で説明される態様の可能な実装が、表示「態様Ｃ」を使用して議論される。

特に、図６は、参照符号３６０を使用して示されたエンハンスメント層信号の画像２２ｂと、参照符号２００を使用して示されたベース層信号の画像２２ａを説明する。異なる層の時間的に対応する画像は、時間軸２４に対して互いに示された方法で示される。斜線を使用して、符号化／復号化の順序に従って既に符号化／復号化されているベースとエンハンスメント層信号内の部分２００とが、図５に示された符号化／復号化の順序に従って未だ符号化または復号化されていない部分３６と区別される。また、図６は、現在符号化／復号化されるエンハンスメント層信号３６０の一部分２８を示す。

現在説明されている実施の形態に従って、部分２８の予測は、部分２８を予測するために、エンハンスメント層自体内のイントラ層予測とベース層からの層間予測の両方を使用する。しかしながら、予測は、これらの予測がスペクトル的に変化する方法で、部分２８の最終予測に寄与するように結合される。その結果、特に、両方の寄与の間の比率は、スペクトル的に変化する。

特に、部分２８は、エンハンスメント層信号４００の既に再構成された部分（すなわち、図６でエンハンスメント層信号４００内の斜線によって示された部分）から、空間的または時間的に予測される。空間予測は矢印３０を使用して説明される。一方、時間予測は矢印３２を使用して説明される。時間予測は、例えば、動きベクトルの情報が、現在の部分２８のために、エンハンスメント層サブストリーム内で送信されるに従って、動き補償予測を含み得る。動きベクトルは、現在の部分２８の時間予測を得るために、コピーされるべきエンハンスメント層信号４００の参照画像の一部分の置き換えを示す。空間予測３０は、現在の部分２８内に、推定する空間的に隣接する部分、画像２２ｂの既に符号化／復号化された部分、空間的に隣接する現在の部分２８を含み得る。このために、推定（または角度）方向のようなイントラ予測情報が、現在の部分２８のために、エンハンスメント層サブストリーム内でシグナリングされる。また、空間予測３０および時間予測３２の組合せが、同様に使用され得る。どのような場合でも、その結果、エンハンスメント層の内部予測信号３４が、図７で説明されるように得られる。

現在の部分２８の別の予測を得るために、層間予測が使用される。このために、ベース層信号２００は、エンハンスメント層信号４００の現在の部分２８に空間的かつ時間的に対応する部分３６で、現在の部分２８のための層間予測信号が、増加する潜在的解像度を得るために、解像度または品質の改良を受ける。改良手順は図６の矢印３８を使用して説明され、図７に示すように層間予測信号３９をもたらす。

従って、２つの予測寄与３４と３９が、現在の部分２８のために存在する。そして、両方の寄与の重み付け平均が、現在の部分２８に対して、層間予測信号とエンハンスメント層内部予測信号とが、エンハンスメント層予測信号４２に寄与する重み付けが、図７に４４で図式的に示すように、空間周波数成分を異なって変化する方法で、エンハンスメント層予測信号４２を得るために形成される。図７は、例示的に、あらゆる空間周波数成分に対して、予測信号３４と３８が最終予測信号に寄付する重み付けが、全てのスペクトル的成分に対して、しかしながら、予測信号３４に適用された重み付けと予測信号３９に適用された重み付けとの間の比をスペクトル的に変化する状態で、同じ値４６を加算する場合を示す。

一方、予測信号４２が、現在の部分２８に、エンハンスメント層信号４００によって直接使用され得る。あるいはまた、残差信号は、現在の部分２８の再構成されたバージョン５４内で、例えば図７で示される加算のように予測信号４２との結合５０によって、もたらされる現在の部分２８のエンハンスメント層サブストリーム６ｂ内に提供され得る。中間的な注意として、スケーラブルビデオエンコーダとデコーダの両方は、予測残差を符号化／復号化するために、変換符号化を使用して、予測的符号化を使用するハイブリッドビデオデコーダ／エンコーダである、ことに注意すべきである。

図６，７の記述をまとめると、エンハンスメント層サブストリーム６ｂが、現在の部分２８に対して、空間的および／または時間的予測３０，３２を制御するためのイントラ予測パラメータ５６と、オプションで、スペクトル重み付け平均の形成４１を制御するための重み付けパラメータ５８と、残差信号４８をシグナリングするための残差情報５９とを含み得る。一方、スケーラブルビデオエンコーダは、それに従って、これらのパラメータ５６，５８，５９の全てを決定し、エンハンスメント層サブストリーム６ｂ内に、パラメータ５６，５８，５９を差し込む。スケーラブルビデオデコーダは、上に概説したように、現在の部分２８を再構成するためにパラメータ５６，５８，５９を使用する。これらの要素５６，５８，５９の全てが、量子化のいくつかを受け得る。そして、それに従って、スケーラブルビデオエンコーダは、これらのパラメータ／要素（すなわち、量子化として比／歪コスト関数を使用する）を決定し得る。興味深いことに、エンコーダ２は、現在の部分２８に対して再構成されたバージョン５４を得るために、例えば、符号化／復号化の順序で続く、エンハンスメント層信号４００の部分のためのどんな予測の基礎としても役立つように、このようにして決められたパラメータ／要素５６，５８，５９を使用する。

異なる可能性が、重み付けパラメータ５８と、それらがスペクトル重み付け平均の形成４１を制御する方法とのために存在する。例えば、重み付けパラメータ５８が、現在の部分２８に対して、２つの状態（すなわち、今までに説明したスペクトル重み付け平均の形成を活性化する一方の状態、および、層間予測信号３８の寄与を非活性化する他方の状態）の１つにのみシグナリングし得る。その結果、最終エンハンスメント層予測信号４２は、その場合、エンハンスメント層内部予測信号３４によってのみ作成される。現在の部分２８のための重み付けパラメータ５８は、一方のスペクトル的重み付け平均形成の活性化と、他方の単独でエンハンスメント層予測信号４２を形成する層間予測信号３９との間を切換わり得る。また、重み付けパラメータ５８は、言及した３つの状態／二者択一の１つにシグナリングするように設計され得る。二者択一的に／追加的に、重み付けパラメータ５８は、さらに、現在の部分２８に対して、予測信号３４と３９が最終予測信号４２に寄与する重み付けの間の比率のスペクトル変化に関して、スペクトル重み付け平均形成４１を制御し得る。後で、スペクトル重み付け平均形成４１が、予測信号３４と３９を加算する前の予測信号３４と３９の１つまたは両方を、例えば、ハイパスフィルタおよび／またはローパスフィルタを使用して、フィルタにかけることを伴い得る、ことが説明される。その場合、重み付けパラメータ５８は、現在の部分２８の予測に対して使用されるべきフィルタのためのフィルタ特性をシグナリングし得る。またはフィルタリングし得る。二者択一として、重み付けパラメータ５８は、スペクトル重み付け平均形成４１におけるスペクトル重み付けが、変換領域内のスペクトル成分の個々の重み付けによって達成され得て、従って、この場合、重み付けパラメータ５８は、これらのスペクトル成分の個々の重み付けの値をシグナリング／設定できる、ということが以下で説明される。

追加的に、または、二者択一的に、現在の部分２８についての加重（重み付け）パラメータは、ステップ４１内でスペクトル加重が、変換領域または空間領域内で実行されるか否かをシグナリングできる。

図９は空間領域内のスペクトル重み付け平均構成を実行するための実施の形態を説明する。予測信号３９と３４は、現在の部分２８の画素ラスタ（ｒａｓｔｅｒ）と一致しているそれぞれの画素配列の形式で得られるように図示されている。スペクトル重み付け平均構成を実行するために、予測信号３４と３９の両方の画素配列は、フィルタリングを受けるように示される。図９は、例えばＦＩＲフィルタリングを実行するために、予測信号３４と３９の画素配列を横断しているフィルタ核（ｋｅｒｎｅｌ）６２と６４を示すことによって、実例としてフィルタリングを図示する。しかしながら、また、ＩＩＲフィルタリングも可能である。さらに、予測信号３４と３９の１つのみが、フィルタリングを受けてもよい。両方のフィルタ６２と６４の伝達関数は異なっているので、予測信号３９と３４の画素配列のフィルタリングの結果の加算６６は、スペクトル重み付け平均構成の結果、すなわち、エンハンスメント層予測信号４２をもたらす。換言すれば、加算６６は、それぞれフィルタ６２と６４を使用して、フィルタがかけられた予測信号３９と３４の中の併置されたサンプルを容易に加算する。その結果、６２～６６はスペクトル重み付け平均構成４１をもたらす。図９は、変換係数の形式で存在している残差情報５９の場合、変換領域内の残差信号４８をシグナリングし、逆変換６８が画素配列７０の形式で空間領域をもたらすために使用され得て、その結果、再構成されたバージョン５５をもたらしている結合５２が、残差信号アレイ７０とエンハンスメント層予測信号４２との簡単な画素単位付加によって実現されることを図示する。

再び、予測が、デコーダとエンコーダ内でそれぞれ再構成のための予測を使用して、スケーラブルビデオエンコーダとデコーダによって実行されることを想起されたい。

図１０は、変換領域内でどのようにスペクトル重み付け平均形成が実行されるかを例示的に示す。ここで、予測信号３９と３４の画素配列は、それぞれ変換７２と７４を受ける。その結果、それぞれスペクトル分解７６と７８をもたらす。各スペクトル分解７６と７８は、１スペクトル成分当たり１つの変換係数で、変換係数アレイが作成される。それぞれの変換係数ブロック７６と７８は、重み付けの対応するブロック、つまり、ブロック８２と８４に掛けられる。その結果、各スペクトル成分毎に、ブロック７６と７８の変換係数は個別に重み付けされる。スペクトル成分毎に、ブロック８２と８４の加重値は、全てのスペクトル成分に共通の値を加算され得るが、これは義務的ではない。事実上、ブロック７６と８２との間の乗数８６と、ブロック７８とブロック８４の間の乗数８８とは、それぞれ変換領域内のスペクトルフィルタリングを表す。そして、変換係数／スペクトル成分単位加算９０は、変換係数の１ブロックの形式でエンハンスメント層予測信号４２の変換領域バージョンをもたらすために、スペクトル重み付け平均形成４１を終了する。図１０に示すように、変換係数ブロックの形式で残差信号４８をシグナリングする残差信号５９の場合、残差信号５９は、エンハンスメント層予測信号４２を表す変換係数ブロックと、容易に変換係数的加算結合（または別の結合）５２がなされて、変換領域内の現在の部分２８の再構成されたバージョンをもたらす。従って、結合５２の付加結果に適用される逆変換８４は、現在の部分２８を再構成している画素配列、すなわち、再構成されたバージョン５４をもたらす。

前述したように、現在の部分２８のためのエンハンスメント層サブストリーム６ｂ内の現在のパラメータ、例えば残差情報５９や重み付けパラメータ５８が、平均形成４１が図１０に示した変換領域、または、図９に従った空間領域内で実行されるかについてシグナリングする。例えば、仮に、残差情報５９は、現在の部分２８のためのどんな変換係数ブロックの欠如も示す。また、空間領域が使用される。あるいは、加重パラメータ５８は、変換係数を含む残差情報５９または変換係数を含まない残差情報５９の如何に関係なく両方の領域を切り換え得る。

その後、層間エンハンスメント層予測信号を得るために、差分信号が、エンハンスメント層信号の既に再構成された部分と層間予測信号との間で、計算されて管理され得ることが、説明される。エンハンスメント層信号の一部に併置された第１の部分で差分信号の空間予測は、現在、差分信号の第２の部分から再構成される。エンハンスメント層信号の第１の部分に空間的に隣接して、かつ、既に再構成された部分に属して、その時、差分信号を空間的に予測するために使用され得る。あるいはまた、第１の部分の差分信号の時間予測はエンハンスメント層信号の部分に併置されて、現在、エンハンスメント層信号の以前に再構成されたフレームに属しながら差分信号の第２の部分から再構成されるのは、時間的に予測された差分信号を得るために使用され得る。層間予測信号と予測された差分信号との結合は、内部エンハンスメント層予測信号を得るために使用され得て、次に、層間予測信号と結合される。

以下の図に関して、図１～図４に対して前述したようなスケーラブルビデオエンコーダまたはデコーダが、どのように出願の別の態様に従って本出願の実施の形態を形成するように実行されるかが記載される。

この内容について説明するために、図１１を参照する。図１１は現在の部分２８の空間予測３０を実行する可能性を示す。その結果、図１１の以下の記述は、図６～図１０に関する記述と組合わされる。特に、以下に説明される内容は、「態様」ＸとＹに言及することによって、図示された実現の例に関して後に説明される。

図１１に示された状況は、図６に示されたものに対応する。すなわち、ベース層信号２００とエンハンスメント層信号４００が示される。既に符号化／復号化された部分が、斜線を使用して示されている。エンハンスメント層信号４００内で、現在、符号化／復号化されるべき部分は、隣接するブロック９２と９４を有している。ここで、例示的に、現在のブロック２８と同じサイズを有している両方のブロック９２と９４に対して、現在の部分２８の上側にブロック９２が描かれ、左側にブロック９４が描かれている。しかしながら、サイズの一致は義務的ではない。むしろ、エンハンスメント層信号４００の画像２２ｂがサブ分割されているブロックの部分は、異なるサイズを有し得る。それらは四角形に制限さえされていない。それらは、長方形または他の形であってもよい。さらに、現在のブロック２８は、図１１に明確に表現されていない隣接ブロックを有している。しかしながら、隣接ブロックは、まだ復号化／符号化されていない。すなわち、隣接ブロックは、符号化／復号化の順序で続き、その結果、予測のために利用できない。これを超えて、符号化／復号化の順序に従って既に符号化／復号化されたブロック９２と９４より別のブロック（現在のブロック２８に隣接する、例えば現在のブロック２８の左上隅で斜めに隣接するブロック９６のようなブロック）が存在する。しかし、ブロック９２と９４は、ここで考慮された例におけるイントラ予測３０の対象となる現在のブロック２８のためのイントラ予測パラメータを予測する役割を果たす、予め決められた隣接するブロックである。そのような予め決められた隣接するブロックの数は、２つに制限されない。それは、より多くても、または１つでもよい。

スケーラブルビデオエンコーダとスケーラブルビデオデコーダは、既に符号化された隣接するブロックのセットから、予め決められた隣接するブロックのセット（ここでは、ブロック９２，９４）を決定し得る。ここに、ブロック９２～９６は、例えば、その左上のサンプルのように現在の部分２８内の予め決められたサンプル位置９８に依存する。例えば、現在の部分２８のそれらの既に符号化された隣接するブロックのみが、予め決められたサンプル位置９８に直ぐに隣接するサンプル位置を含む「予め決められた隣接するブロック」のセットを形成し得る。どのような場合でも、隣接する既に符号化／復号化されたブロックは、現在のブロック２８の領域が空間的に予測されるべきサンプル値に基づいた現在のブロック２８に隣接するサンプル１０２を含む。このために、５６などの空間予測パラメータは、エンハンスメント層サブストリーム６ｂ内でシグナリングされる。例えば、現在のブロック２８のための空間予測パラメータは、サンプル１０２のサンプル値が現在のブロック２８の領域内にコピーされるべき空間的方向を指示する。

どのような場合でも、少なくとも、時間的に対応する画像２２ａが関連する空間的に対応する領域に関する限り、上で説明したように、ブロック状の予測を使用し、例えば、空間予測モードと時間予測モードとの間のブロック状の選択を使用して、現在のブロック２８を空間的に予測する時、スケーラブルビデオデコーダ／エンコーダは、ベース層サブストリーム６ａを使用して、ベース層２００を既に再構成している（エンコーダの場合には、符号化されている）。

図１１において、ベース層信号２００の時間で並べられた画像２２ａがサブ分割されるいくつかのブロック１０４は、例示的に表現された現在の部分２８に局所的に対応する領域内、および、その周囲にある。それはちょうどエンハンスメント層信号４００内の空間的に予測されたブロックの場合である。エンハンスメント層信号４００内の空間的に予測されたブロックの場合と同様に空間予測パラメータは、空間予測モードの選択がシグナリングされたべース層信号２００内の、それらのブロック１０４についてベース層サブストリーム内に含まれる、または、シグナリングされる。

ここで、例示的に、空間的なイントラ層予測３０が選択されたブロック２８に関する符号化データストリームから、エンハンスメント層信号の再構成を可能にするために、イントラ予測パラメータが、以下のビットストリーム内で使用され、符号化される。

イントラ予測パラメータは、全ての可能なイントラ予測パラメータのかなり小さいサブセットである「最尤イントラ予測パラメータ」の概念を使用してしばしば符号化される。「最尤イントラ予測パラメータ」は、例えば、最尤イントラ予測パラメータのセットは、１つ、２つまたは３つのイントラ予測パラメータを含む。一方、例えば、全ての可能なイントラ予測パラメータのセットは、３５個のイントラ予測パラメータを含むことができる。仮に、イントラ予測パラメータが、最尤イントラ予測パラメータのセットに含まれているならば、それは、ビットストリーム内で、少ない数のビットで、シグナリングされ得る。仮に、イントラ予測パラメータが、最尤イントラ予測パラメータのセットに含まれていないならば、ビットストリーム内のそのシグナリングは、より多くのビットを必要とする。従って、現在のイントラ予測されたブロックのためのイントラ予測パラメータをシグナリングするために、構文要素に費やされるべきビットの量は、最尤、または、おそらく有利なイントラ予測パラメータのセットの品質に依存する。この概念を使用して、最尤イントラ予測パラメータのセットを適切に導出できると仮定した場合、イントラ予測パラメータを符号化するために平均してより少ないビット数が必要とされる。

通常、最尤イントラ予測パラメータのセットは、それが、直接隣接するブロックのイントラ予測パラメータを含む、および／または、追加的に、例えば既定のパラメータの形でイントラ予測パラメータをしばしば使用する方法で選択される。例えば、隣接するブロックの主な勾配方向が同じであるので、最尤イントラ予測パラメータのセット内の隣接するブロックのイントラ予測パラメータを含むことは、一般的に有利である。

しかしながら、仮に、隣接するブロックが、空間イントラ予測モードで符号化されないならば、それらのパラメータは、デコーダ側で利用できない。

スケーラブル符号化において、併置されたベース層ブロックのイントラ予測パラメータを使用することは、しかしながら可能である。従って、以下に概説される実施例に従って、この状況が、空間イントラ予測モード内の符号化されない隣接するブロックの場合に、併置されたベース層ブロックのイントラ予測パラメータを使用して利用される。

その結果、図１１に従って、現在のエンハンスメント層ブロックについてのおそらく有利なイントラ予測パラメータのセットは、予め決められた隣接するブロックのイントラ予測パラメータを検査することによって、そして、例えば、それぞれの予め決められた隣接するブロックが、イントラ予測モードで符号化されないので、予め決められた隣接するブロックが、それに関連した適当なイントラ予測パラメータを有さないどの場合にも、ベース層内に併置されたブロックに例外的に再分類することによって、構成される。

先ず、現在のブロック２８のブロック９２または９４などの予め決められた隣接するブロックが、空間イントラ予測モードを使用して予測されたか否かをチェックされる。すなわち、空間イントラ予測モードが、その隣接するブロックのために選択されたか否かをチェックされる。それによって、その隣接するブロックのイントラ予測パラメータが、現在のブロック２８のためのおそらく有利なイントラ予測パラメータのセット、または、もしあれば、代替として、ベース層の併置されたブロック１０８のイントラ予測パラメータ内に含まれる。この過程は、予め決められた隣接するブロック９２と９４のそれぞれに対して実行できる。

例えば、仮に、それぞれの予め決められた隣接するブロックが、空間イントラ予測ブロックでないならば、初期設定予測等を使用する代わりに、ベース層信号２００のブロック１０８のイントラ予測パラメータが、現在のブロック２８に併置されている、現在のブロック２８のためのおそらく有利なインター予測パラメータのセット内に含まれる。例えば、併置されたブロック１０８は、現在のブロック２８の予め決められたサンプル位置９８を使用して決定される。つまり、ブロック１０８は、ベース層信号２００の時間的に並べられた画像２２ａ内の予め決められたサンプル位置９８に局所的に対応している位置１０６をカバーする。当然に、予めベース層信号２００内のこの併置されたブロック１０８が、実際に空間イントラ予測ブロックであるか否か、の更なるチェックが実行され得る。図１１の場合において、これがその場合であることが例示的に説明される。しかしながら、仮に、併置されたブロックも、イントラ予測モード内で符号化されないならば、おそらく有利なイントラ予測パラメータのセットが、その予め決められた隣接するブロックのために少しの寄与も無く残され得る。または、初期設定イントラ予測パラメータが、代替として代わりに使用され得る。すなわち、初期設定イントラ予測パラメータは、おそらく有利なイントラ予測パラメータのセットに挿入される。

従って、仮に、現在のブロック２８に併置されたブロック１０８が、空間的にイントラ予測であれば、ベース層サブストリーム６ａ内でシグナリングされたそのイントラ予測パラメータは、一種の代替として、イントラ予測パラメータが時間予測モードのような別の予測モードを使用して符号化されるため、どんなイントラ予測パラメータも有していない、現在のブロック２８の予め決められた隣接するブロック９２または９４のために使用される。

別の実施の形態に従って、所定の場合、仮に、それぞれの予め決められた隣接するブロックが、イントラ予測モードのものであっても、予め決められた隣接するブロックのイントラ予測パラメータは、併置されたベース層ブロックのイントラ予測パラメータによって代替される。例えば、イントラ予測パラメータが所定の基準を満たしているか否かのような更なるチェックが、イントラ予測モードのどんな予め決められた隣接するブロックに対しても実行され得る。仮に、所定の基準が、隣接するブロックのイントラ予測パラメータによって満たされていないが、同じ基準が、併置されたベース層ブロックのイントラ予測パラメータによって満たされているならば、代替が、イントラ符号化された非常に隣接するブロックにも関わらず実行される。例えば、仮に、隣接するブロックのイントラ予測パラメータが、角度（ａｎｇｕｌａｒ）イントラ予測モード（しかし、例えばＤＣまたは平面イントラ予測モード）を表わさない、しかし、併置されたベース層ブロックのイントラ予測パラメータが角度イントラ予測モードを表わすならば、隣接するブロックのイントラ予測パラメータが、ベース層ブロックのイントラ予測パラメータによって置換され得る。

現在のブロック２８のためのインター予測パラメータは、その時、現在のブロック２８のためのエンハンスメント層サブストリーム６ｂ、および、おそらく有利なイントラ予測パラメータのセットなどの符号化データストリーム内に存在する構文要素に基づいて決定される。すなわち、構文要素は、おそらく有利なイントラ予測パラメータのセットのメンバーである現在のブロック２８についてのインター予測パラメータの場合に、おそらく有利なイントラ予測パラメータのセットに繋がらない、可能なイントラ予測パラメータのセットの残りのメンバーの場合より、少ないビットを使用して符号化され得る。

可能なイントラ予測パラメータのセットは、現在のブロックが、それぞれのモード／パラメータの角度方向に沿ってコピーすることによって、既に符号化／復号化された隣接するサンプルからコピーすることによって満たされることに従ういくつかの角度方向のモードと、現在のブロックのサンプルが、例えばいくつかの平均によって、既に符号化／復号化された隣接するサンプルなどに基づいて決められた一定値にセットされることに従う１つのＤＣモードと、現在のブロックのサンプルが、例えば、既に符号化／復号化された隣接するサンプルに基づいて決められる、ｘとｙのスロープおよび遮断の線形関数をフォローする値分布にセットされることに従う平面モードとを含む。

図１２は、ベース層の併置されたブロック１０８から得られた空間予測パラメータの代替が、エンハンスメント層サブストリーム内でシグナリングされた構文要素と共に、どのように使用され得るかについての可能性を示す。図１２は、隣接する既に符号化／復号化されたサンプル１０２と予め決められた隣接するブロック９２および９４と共に、現在のブロック２８を拡大して示す。また、図１２は、併置されたブロック１０８の空間予測パラメータによって示される角度の方向１１２を例示的に示す。

現在のブロック２８のためにエンハンスメント層サブストリーム６ｂ内でシグナリングされた構文要素１１４は、例えば図１３に示されるように、条件付きで符号化されたインデックス１１８を、ここに例示的に、角度方向１２４として図示された、可能な有利なイントラ予測パラメータの結果であるリスト１２２内にシグナリングすることができる。または、仮に、実際のイントラ予測パラメータ１１６が、最尤セット１２２内になく、１２７に示されるように、可能性として除外される可能なイントラ予測モードのリスト１２５内のインデックス１２３であるならば、リスト１２２の候補は、その結果、実際のイントラ予測パラメータ１１６を特定する。構文要素の符号化は、リスト１２２内に属する実際のイントラ予測パラメータの場合、ビットの消費をより少なくできる。例えば、構文要素はフラグ（ｆｌａｇ）とインデックスフィールドとを含み得る。フラグは、リスト１２２のメンバーを含めるか、または、除外するか、インデックスがリスト１２２またはリスト１２５のいずれかを指すのか、つまり、リスト１２２のメンバーに含めるかまたは除外するかを示す。構文要素は、リスト１２２のメンバー１２４またはエスケープコードの一つを特定する分野を含む。そして、構文要素は、エスケープコードの場合、リスト１２２のメンバーを含むまたは除外するリスト１２５からメンバーを特定する第２の分野を含む。リスト１２２内のメンバー１２４内の順序は、例えば、初期設定規則に基づいて決定され得る。

従って、スケーラブルビデオデコーダは、エンハンスメント層サブストリーム６ｂから構文要素１１４を得る、または、検索し得る。そして、スケーラブルビデオエンコーダは、構文要素１１４をエンハンスメント層サブストリーム６ｂに挿入し得る。そして、次に、例えば、構文要素１１４は、リスト１２２から１つの空間予測パラメータを索引するために使用される。リスト１２２を形成する際に、前述の代替は、予め決められた隣接ブロック９２と９４が、空間予測符号化モードタイプであるか否かがチェックされて実行され得る。そうでなければ、前述したように、併置されたブロック１０８は、例えば順に空間的に予測されたブロックであるか否かがチェックされ、そうであれば、この併置されたブロック１０８を空間的に予測するために使用される角度方向１１２のような、同じ空間予測パラメータがリスト１２２に含まれる。また、仮に、ベース層ブロック１０８が、適したイントラ予測パラメータを含まないならば、リスト１２２はそれぞれの予め決められた隣接ブロック９２または９４から寄与無しで残され得る。なぜなら、リスト１２２が空であることを避けるために、例えば、予め決められた隣接ブロック９２、９８の両方が、イントラ予測されているので、適したイントラ予測パラメータを欠いている併置されたブロック１０８と同様に、少なくともメンバー１２４の１つは初期設定イントラ予測パラメータを使用して、無条件に決定され得る。あるいはまた、リスト１２２が空であることが許容され得る。

当然、図１１～図１３に対して説明した態様は、図６～図１０に対して概説した態様と繋がることができる。特に、図１１～図１３に従ってベース層を迂回して引き出された空間イントラ予測パラメータを使用して得られたイントラ予測は、スペクトル的に重み付けされた方法で、上述したように層間予測信号３８に結合されるために、図６～図１０の態様のエンハンスメント層インター予測信号３４を特に表し得る。

以下の図面に対して、図１～図４に対して上記に記載したように、スケーラブルビデオエンコーダまたはデコーダが、どのようにして出願の別の態様に従って本出願の実施の形態を形成するように実施できるかが説明される。後で、以下に記載された態様のために、追加の実現例が態様ＴとＵを参照して提示される。

エンハンスメント層信号４００とベース層信号２００の画像２２ｂと２２ａを、それぞれ時間的登録方法で示す図１４を参照されたい。現在、符号化／復号化されるべき部分は２８で示されている。現在の態様に従って、ベース層信号２００は、ベース層信号を空間的に変化させているベース層符号化パラメータを使用して、スケーラブルビデオエンコーダによって予測的に符号化され、スケーラブルビデオデコーダによって予測的に再構成されている。空間的な変化は、図１４においてベース層符号化パラメータを予測的に符号化／再構成化するために用いられるベース層符号化パラメータが一定である斜線部分１３２を用い、斜線部分１３２から非斜線領域に移行するとき、ベース層符号化パラメータが変化する非斜線領域によって囲まれていることを示す。上で概説された態様に従って、エンハンスメント層信号４００は、ブロック単位で符号化／復号化される。現在の部分２８はそのようなブロックである。上で概説された態様に従って、現在の部分２８のためのサブブロックのサブ分割は、ベース層信号２００の併置された部分１３４内で、すなわちベース層信号２００の時間的に対応する画像２２ａの空間的に併置された部分内で、ベース層符号化パラメータの空間的変化に基づいて１セットの可能なサブブロックのサブ分割から選択される。

特に、現在の部分２８のために、エンハンスメント層サブストリーム６ｂのサブ分割情報内でシグナリングする代わりに、上の記述が、選択されたサブブロックのサブ分割が、可能なサブブロックのサブ分割のセット内で最も粗いように、現在の部分２８の可能なサブブロックのサブ分割のセット内でサブブロックのサブ分割を選択すること、を提示する。そこでは、ベース層信号の併置された部分１３４の上に移されたとき、ベース層符号化パラメータは、それぞれのサブブロックのサブ分割の各サブブロック内で、互いに十分同様であるように、ベース層信号２００をサブ分割する。理解し易くするために、図１５ａを参照する。図１５ａは併置された部分１３４内で、ベース層符号化パラメータの空間的な変化を、斜線を使用して、記載している部分２８を示す。特に、部分２８は、ブロック２８に適用されている異なるサブブロックのサブ分割が、３回示されている。特に、四分木のサブ分割が、図１５ａの場合に例示的に使用されている。すなわち、可能なサブブロックのサブ分割のセットは、四分木のサブ分割である（あるいは、それによって定義される）。そして、図１５ａに表現された部分２８のサブブロックのサブ分割の３つの具体例が、ブロック２８の四分木のサブ分割の異なる階層のレベルに属する。下から上まで、サブブロック内のブロック２８のサブ分割のレベルまたは粗さは増加する。最高レベルでは、部分２８はそのまま残される。次の下のレベルでは、ブロック２８は４つのサブブロックにサブ分割される。そして、少なくとも後者の１つは、次の下のレベルなどでさらに４つのサブブロックにサブ分割される。図１５ａ内で、各レベルにおいて、四分木のサブ分割は、サブブロックの数が最も小さい場所、それでも、ベース層符号化パラメータ変化境界と重複しているサブブロックでない場所が選択される。すなわち、図１５ａの場合、ブロック２８をサブ分割するために選択されるべきブロック２８の四分木のサブ分割は、図１５ａに示されている中で最も低いものであると認められる。ここで、ベース層のベース層符号化パラメータは、サブブロックのサブ分割のそれぞれのサブブロックに併置された各部分の中で一定である。

従って、ブロック２８のためのサブ分割情報は、エンハンスメント層サブストリーム６ｂ内でシグナリングされる必要はない。その結果、符号化効率が増加する。そのうえ、概説されているように、サブ分割を得る方法は、どんなグリッド（格子）に関する現在の部分２８の位置、または、ベース層信号２００のサンプルアレイのどんな登録にも関係なく適切である。また、特に、サブ分割導出は、ベース層とエンハンスメント層との間の断片的な空間分解比率の場合に働く。

このようにして決定された部分２８のサブブロックのサブ分割に基づいて、部分２８は、予側的に再構成／符号化され得る。上の記述に対して、異なる可能性が、現在のブロック２８の異なる利用可能なサブブロックのサブ分割の粗さを「測る」ために存在することに注意すべきである。例えば、粗さの大きさはサブブロックの数に基づいて決定される。それぞれのサブブロックのサブ分割が有しているサブブロックが多いほど、レベルはより低くなる。この定義は、それぞれのサブブロックのサブ分割のサブブロックの数と、それぞれのサブブロックのサブ分割の全てのサブブロックの最も小さいサイズとの組み合わせによって、「粗さの大きさ」が決定される図１５ａの場合において、明らかに適用されない。

完全を期すために、図１５ｂは、利用可能なセットとして、図３５のサブ分割を例示的に使用するとき、現在のブロック２８のために利用可能なサブブロックのサブ分割の１セットから一つの可能なサブブロックのサブ分割を選択する場合を例示的に示す。異なる斜線（および非斜線）は、ベース層信号内のそれぞれに併置された領域が、それらに関連した同じベース層符号化パラメータを有している領域を示す。

前述したように、概説された選択は、粗さの増加するレベルまたは減少するレベルの順序のように、ある連続した順序に従って、可能なサブブロックのサブ分割を横断し、かつ、それぞれのサブブロックのサブ分割の各サブブロック内で、ベース層符号化パラメータが互いに十分同様である状況で、可能なサブブロックのサブ分割からその可能なサブブロックのサブ分割を選択することによって実装され得る。（増加する粗さに従う横断を使用する場合において）もはや適用されない。あるいは、（減少する粗さのレベルに従う横断を使用する場合において）最初にたまたま適用する。二者択一的に、全ての可能なサブ分割がテストされ得る。

図１４と図１５ａ、図１５ｂの記述において、広義語「ベース層符号化パラメータ」は、好ましい実施の形態の中で使用されるけれども、これらのベース層符号化パラメータは、ベース層予測パラメータ、すなわち、ベース層信号の予測の形成に関するけれども、予測残差の形成に関連しないパラメータを表す。従って、例えば、ベース層符号化パラメータは、空間予測と時間予測、角度方向などの空間予測に割当てられたベース層信号のブロック／部分のための予測パラメータ、動きパラメータなどの時間予測に割当てられたベース層信号のブロック／部分のための予測パラメータ、との間を区別する予測モードを含む。

しかしながら、興味深いことに、所定のサブブロック内で、ベース層符号化パラメータの類似性の「十分」の定義は、ベース層符号化パラメータのサブセットを決定／定義するだけである。例えば、類似性は、予測モードだけに基づいて決定され得る。あるいはまた、さらに空間予測および／または時間予測を調整する予測パラメータは、所定のサブブロック内でベース層符号化パラメータの類似性が依存するパラメータを形成し得る。

さらに、既に概説したように、互いに十分に類似になるために、所定のサブブロック内で、ベース層符号化パラメータは、それぞれのサブブロック内で互いに完全に等しい必要がある。あるいはまた、使用される類似性の大きさは、「類似性」の基準を満たすために、所定の間隔の範囲内であることが必要であり得る。

上に概説したように、選択されたサブブロックのサブ分割は、ベース層信号から予測される、または、転送され得る量だけではない。むしろ、ベース層符号化パラメータ自体が、それに基づいて、ベース層信号からエンハンスメント層信号に、選択されたサブブロックのサブ分割を転送することによって得られたサブブロックのサブ分割のサブブロックのためのエンハンスメント層符号化パラメータを導出するために、エンハンスメント層信号に転送され得る。動きパラメータに関する限り、例えば、スケーリングは、ベース層からエンハンスメント層へ転送するために使用され得る。好ましくは、ベース層の予測パラメータのそれらの部分または構文要素のみが、類似性の大きさに影響するベース層から得られた現在の部分のサブブロックのサブ分割のサブブロックを設定するために使用される。この大きさによって、選択されたサブブロックのサブ分割の各サブブロック内の予測パラメータのこれらの構文要素が、どうにか互いに同様であるという事実は、現在の部分３０８のサブブロックの対応する予測パラメータを予測するために使用されるベース層予測パラメータの構文要素が、同様である、または、互いと等しくさえあることを保証する。その結果、いくつかの変化を可能にする最初の場合に、それぞれのサブブロックによってカバーされたベース層信号の部分に対応するベース層予測パラメータの構文要素のいくつかの重要な「意味」が、対応するサブブロックのための予測器として使用され得る。しかしながら、また、類似性の大きさに寄与する構文要素の部分のみが、モード特定ベース層予測パラメータが類似性の大きさ決定に参加するけれども、現在の部分２８のサブブロックのモードを単に推測または予め設定するように、サブ分割の転写自体だけを追加してエンハンスメント層のサブ分割のサブブロックの予測パラメータを予測するために使用されることもある。

ベース層からエンハンスメント層へのサブ分割層間予測だけを使用しないというそのような１つの可能性は、現在、次の図（図１６）に対して説明される。図１６は、プレゼンテーション時間軸２４に沿って登録された方法で、エンハンスメント層信号４００の画像２２ｂと、ベース層信号２００の画像２２ａを示す。

図１６の実施の形態に従って、ベース層信号２００は、ベース層信号２００の画像２２ａを、イントラブロックおよびインターブロック内にサブ分割することによって、スケーラブルビデオデコーダによって予測的に再構成され、そして、スケーラブルビデオエンコーダの使用によって予測的に符号化される。図１６の例に従って、後者のサブ分割は２ステージ法でなされる。まず、フレーム２２ａは、正規に、図１６内で参照符号３０２によって示された、最も大きいブロックまたは最も大きい符号化単位に、その周辺に沿って二重線を使用して、サブ分割される。それから、それぞれの最も大きいブロック３０２が、前述のイントラブロックおよびインターブロックを形成している符号化単位内の階層的四分木のサブ分割に従属させられる。その結果、それらは、最も大きいブロック３０２の四分木のサブ分割の葉である。図１６では、参照符号３０４は、これらの葉のブロックまたは符号化単位を示すために使用される。通常、実線は、これらの符号化単位の周辺を示すために使用される。一方、空間イントラ予測はイントラブロックのために使用され、時間インター予測はインターブロックのために使用される。空間イントラ予想と時間インター予測とに関連した予測パラメータは、それぞれ、より小さいブロックの単位内にセットされる。しかしながら、イントラおよびインターブロックまたは符号化単位３０４は、サブ分割される。そのようなサブ分割は、より小さいブロックを示すために参照符号３０６を使用して、符号化単位３０４の１つに対して、図１６で例示的に示される。より小さいブロック３０４は、点線を使用して輪郭が描かれる。すなわち、図１６の実施の形態の場合、空間的なビデオエンコーダは、ベース層のそれぞれの符号化単位３０４に対して、一方の空間予測と他方の時間予測との間で選択する機会を有している。しかしながら、エンハンスメント層信号に関する限り、自由度は増加する。ここで、特に、エンハンスメント層信号４００のフレーム２２ｂは、エンハンスメント層信号４００のフレーム２２ｂがサブ分割される符号化単位内で、空間イントラ予測と時間インター予測だけではなく、以下に詳細に概説されるような層間予測も含む１セットの予測モードのそれぞれの１つに割り当てられる。これらの符号化単位内のサブ分割は、ベース層信号に対して説明されるように同じ方法でなされ得る。先ず、フレーム２２ｂは二重線を使用して、輪郭が描かれた最も大きいブロックの行と列にサブ分割され、その後、通常の実線を使用して、外形が形成された符号化単位内に、階層的な四分木のサブ分割過程内で、サブ分割され得る。

エンハンスメント層信号４００の現在の画像２２ｂの１つの符号化単位３０８は、例示的に、層間予測モードに割り当てられると推論され、斜線を使用して示される。図１４、図１５ａおよび図１５ｂと同様の方法で、図１６は、３１２で、符号化単位３０８のサブ分割が、ベース層信号から局所転送によって予測的にどのように導出されるかを示す。特に、符号化単位３０８によって重畳された局部領域が、３１２で示されている。この領域内では、点線はベース層信号の隣接しているブロックの間の境界、または、より一般的にベース層のベース層符号化パラメータがおそらく変化する境界を示す。その結果、これらの境界は、ベース層信号２００の予測ブロック３０６の境界であり、そして、それぞれベース層信号２００の隣接している符号化単位３０４、または、等しく隣接している最も大きい符号化単位３０２の間の境界と部分的に一致し得る。３１２における点線は、ベース層信号２００からの局部転送によって導出された／選択された予測ブロック内への現在の符号化単位３０８のサブ分割を示す。局部転送に関する詳細は、前述した。

図１６の実施の形態に従って、既に説明したように、予測ブロック内へのサブ分割だけでなくベース層からも採用される。むしろ、領域３１２内で使用されたベース層信号の予測パラメータが、エンハンスメント層信号４００の符号化単位３０８の予測ブロックに関して、予測を実行するために使用されるべき予測パラメータを導出するために使用される。

特に、図１６の実施の形態に従って、予測ブロック内へのサブ分割が、ベース層信号から導出されるだけでなく、予測モードも、導出されたサブ分割のそれぞれのサブブロックによって局所的にカバーされたそれぞれの領域を符号化／再構成化するために、ベース層信号２００内で使用される。１つの例が以下である。前述に従って符号化単位３０８のサブ分割を導出するために、予測モードが、関連しているベース層信号２００と繋がって使用される。モード特有の予測パラメータは、上で議論した「類似性」を決定するために使用され得る。従って、図１６で示された異なる斜線は、ベース層の異なる予測ブロック３０６に対応し得る。異なる予測ブロック３０６の各々は、イントラまたはインター予測モード（すなわち、それらに関連した空間または時間予測モード）を有し得る。上で説明したように、「十分類似」になるために、符号化単位３０８のサブ分割のそれぞれのサブブロックに併置された領域内で使用された予測モードと、サブエリア内でそれぞれの予測モードのために特定の予測パラメータとは、互いに完全に等しくなければならない。あるいはまた、多少の変化には耐えられるかも知れない。

特に、図１６の実施の形態に従って、左上から右下に延びる斜線によって示された全てのブロックは、ベース層信号の局所的に対応する部分が、それらに関連した空間イントラ予測モードを有している予測ブロック３０６によってカバーされているので、符号化単位３０８のイントラ予測ブロックにセットされ得る。一方、他のブロック（すなわち、左下から右上に延びる斜線によって示されたブロック）は、ベース層信号の局所的に対応する部分が、それらに関連した時間インター予測モードを有している予測ブロック３０６によってカバーされているので、インター予測ブロックにセットされ得る。

一方、代替の実施の形態に対して、予測の導出が、符号化単位３０８内で、予測を実行するための詳細がここで停止される。すなわち、予測ブロック内の符号化単位３０８のサブ分割の導出と、非時間予測または空間予測を使用して符号化された予測ブロック内および時間予測を使用して符号化された予測ブロック内のこれらの予測ブロックの割り当てと、が制限でき、それは図１６の実施の形態に従わない。

後者の実施の形態に従って、それに割り当てられた非時間予測モードを有する符号化単位３０８の全ての予測ブロックは、これらの非時間モードのブロックのエンハンスメント層予測パラメータとして、ベース層信号２００の局所的に一致しているイントラブロックの予測パラメータから導出された予測パラメータを使用している間、空間イントラ予測などの非時間予測を受ける。その結果、そのような導出は、ベース層信号２００の局所的に併置されたイントラブロックの空間予測パラメータに関連し得る。例えば、そのような空間予測パラメータは、空間予測が実行される角度方向の指示であってもよい。上に概説したように、空間ベース層予測パラメータが、符号化単位３０８のそれぞれの非時間予測ブロックが、互いに同じであることによって重畳する、または、符号化単位３０８のそれぞれの非時間予測ブロックに対して、空間ベース層予測パラメータのいくつかの平均が、それぞれの非時間予測ブロックが、それぞれの非時間予測ブロックの予測パラメータを導出するために使用されることによって重畳する、といういずれか一方の自身による類似性の定義が必要である。

あるいはまた、割り当てられた非時間予測モードを有している符号化単位３０８の全ての予測ブロックは、以下の方法で、層間予測を受ける。先ず、ベース層信号が、少なくとも符号化単位３０８の非時間予測モード予測ブロックに空間的に併置されたそれらの領域内で、分解または品質改良を受けて層間予測信号が得られる。そして、次に、符号化単位３０８のこれらの予測ブロックが、層間予測信号を使用して、予測される。

スケーラブルビデオデコーダとエンコーダは、初期設定によって、符号化単位３０８の全てに、空間予測または層間予測を受けさせる。あるいはまた、スケーラブルビデオエンコーダ／デコーダは、両方の代替をサポートし、符号化ビデオデータストリーム信号内でシグナリングする。そのバージョンは、符号化単位３０８の非時間予測モード予測ブロックに関する限り使用される。特に、両方の代替間での決定は、例えば、個別的に符号化単位３０８のどんな大きさでも、データストリーム内でシグナリングされ得る。

符号化単位３０８の別の予測ブロックに関する限り、符号化単位３０８は、ちょうどそれが非時間予測モード予測ブロックの場合であるとして、局所的に一致しているインターブロックの予測パラメータから導出される予測パラメータを使用して、時間インター予測を受ける。その結果、導出は、順に、ベース層信号の対応している部分に割り当てられた動きベクトルに関連する。

それに割り当てられた空間イントラ予測モードと時間インター予測モードのいずれも有している全ての別の符号化単位に対して、別の符号化単位は、空間予測または時間予測を、以下の方法で受ける。特に、別の符号化単位は、それに割当てられた予測モードを有している予測ブロック内に更にサブ分割される。予測モードは、符号化単位内で、予測ブロックの全てに対して共通し、特に、それぞれの符号化単位に割り当てられる同じ予測モードである。すなわち、符号化単位３０８のように層間予測モードが関連付けられている符号化単位と異なり、空間イントラ予測モードが関連付けられている符号化単位、または、時間インター予測モードが関連付けられている符号化単位は、同じ予測モード、すなわちそれぞれの符号化単位のサブ分割化によって導出されるそれぞれの符号化単位から承継された予測モードのみの予測ブロックに細分化される。

３０８を含む全ての符号化単位のサブ分割は、予測ブロック内の四分木のサブ分割であり得る。

符号化単位３０８のような層間予測モードの符号化単位と、空間イントラ予測モードまたは時間インター予測モードの符号化単位との間の更なる差は、空間イントラ予測モード符号化単位または時間インター予測モード符号化単位の予測ブロックに、空間予測および時間予測をそれぞれ受けさせるときである。予測パラメータは、例えば、エンハンスメント層サブストリーム６ｂ内でシグナリングする方法によって、ベース層信号２００などに依存することなくセットされる。符号化単位３０８のようなそれらに関連する層間予測モードを有しているそれら以外の符号化単位のサブ分割でさえ、エンハンスメント層信号６ｂ内でシグナリングされる。すなわち、３０８などの層間予測モード符号化単位は、低いビットレートのシグナリングの必要性の利点がある。実施の形態に従って、符号化単位３０８自体のモード指標は、エンハンスメント層サブストリーム内でシグナリングされる必要がない。オプションで、別のパラメータは、個々の予測ブロックのために、予測パラメータ残差などの符号化単位３０８に対して送信され得る。追加的に、または、二者択一的に、符号化単位のための予測残差が、エンハンスメント層サブストリーム６ｂ内で送信され／シグナリングされ得る。一方、スケーラブルビデオデコーダは、エンハンスメント層サブストリームからのこの情報を検索し、現在の実施の形態に従ったスケーラブルビデオエンコーダは、これらのパラメータを決定して、これらのパラメータをエンハンスメント層サブストリーム６ｂ内に挿入する。

換言すれば、ベース層信号２００の予測は、ベース層符号化パラメータを使用して、ベース層符号化パラメータが、ベース層ブロック３０４の単位内で、ベース層信号２００を空間的に変化するという方法でなされ得る。ベース層について利用可能な予測モードは、例えば、空間および時間予測を含む。ベース層符号化パラメータは、さらに、角度方向（空間的に予測されたブロック３０４に関連する限り）、および、動きベクトル（時間的に予測されたブロック３０４に関する限り）のような予測モードの個別の予測パラメータを含み得る。後者の予測モードの個別の予測パラメータは、ベース層ブロック３０４より小さい単位内で、すなわち、前述の予測ブロック３０６内で、ベース層信号を変化させ得る。十分な類似性の前に概説した要件を満足させるために、それぞれ可能なサブブロックのサブ分割の領域を重複している全てのベース層ブロック３０４の予測モードが、互いに等しい、ということが必要であり得る。そして、それぞれのサブブロックのサブ分割のみが、選択されたサブブロックのサブ分割を得るために選抜候補リストに入れられる。しかしながら、要件は更に厳しい。それは、それぞれのサブブロックのサブ分割の共通領域を重複している、予測ブロックの予測モード個別予測パラメータも、互いに等しくなければならないということである。ベース層信号内で、このそれぞれのサブブロックのサブ分割および対応する領域の各サブブロックに関して、この要件を満足するサブブロックのサブ分割のみが、最終選択されたサブブロックのサブ分割を得るために選抜候補リストに入れられ得る。

特に、上に簡潔に概説したように、可能なサブブロックの分割のセット内で、選択を実行する方法に対して様々な可能性がある。更に詳細にこれについて概説するために、図１５ｃと図１５ｄを参照する。セット３５２が、現在のブロック２８の全ての可能なサブブロックのサブ分割３５４を取り囲むと仮定する。当然、図１５ｃは単に一例を示す。現在のブロック２８の可能な、または、利用可能なサブブロックのサブ分割のセット３５２は、初期設定によってスケーラブルビデオデコーダとスケーラブルビデオエンコーダに知られ得る、または、例えば画像または同様のものの系列などの符号化データストリーム内でシグナリングされ得る。図１５ｃの例に従って、セット３５２の各メンバー、すなわち、それぞれの利用可能なサブブロックのサブ分割３５４は、チェック３５６を受け、それぞれのサブブロックのサブ分割３５４をエンハンスメント層からベース層に転送することによって、サブ分割されるベース層信号の併置された部分１０８内の領域が、予測ブロック３０６および符号化単位３０４によって単に重畳されるか否かがチェックされる。そして、ベース層符号化パラメータが、十分な類似性の要件を満たしているか否かをチェックする。例えば参照番号３５４が付いている例示的なサブ分割を参照されたい。この例示的に利用可能なサブブロックのサブ分割に従って、現在のブロック２８は、４つの四分円／サブブロック３５８にサブ分割される。そして、左上のサブブロックは、ベース層内で、領域３６２に対応している。明らかに、この領域３６２は、ベース層の４つブロック（すなわち、予測ブロック内の別のサブ分割でなくて、その結果、予測ブロック自身を表わす、２つの予測ブロック３０６と２つの符号化単位３０４）に重複する。従って、仮に、領域３６２を重複しているこれらの予測ブロックの全てのベース層符号化パラメータが、類似性の基準を満足し、そして、これが更に可能なサブブロックのサブ分割３５４の全てのサブブロック／四分円、および、それらの対応する領域を重複しているベース層符号化パラメータの場合であるならば、この可能なサブブロックのサブ分割３５４は、それぞれのサブブロックのサブ分割のサブブロックによってカバーされた全ての領域に対して十分な要件を満たして、サブブロックのサブ分割のセット３６４に属する。それから、このセット３６４内で、最も粗いサブ分割は矢印３６６によって示されるように選択され、その結果、セット３５２から、選択されたサブブロックのサブ分割３６８が得られる。

明らかに、セット３５２の全てのメンバーに対してチェック３５６を実行することを避けようとすることは好ましい。従って、図１５ｄに示すように、かつ、前述したように、可能なサブ分割３５４が大きさを増加または減少するために横断され得る。横断は、双頭矢印３７２を使用して示される。図１５ｄは、少なくとも利用可能なサブブロックのサブ分割のいくつかに対して、粗さのレベルまたは尺度が互いに等しいことを示す。換言すれば、粗さの増加または減少するレベルに従った順序付けはあいまいであり得る。しかしながら、そのような等しく粗い可能なサブブロックのサブ分割の１つが、セット３６４に属し得るだけなので、これは、セット３６４に属する「最も粗いサブブロックのサブ分割」の検索を妨げない。従って、選択されるべきサブブロックのサブ分割３５４である２番目から最後へ横断された可能なサブブロックのサブ分割で、粗さが増加するレベルの方向に横断するとき、基準チェック３５６の結果が、充填されるから充填されないへと変わると直ぐに、最も大きい可能なサブブロックのサブ分割３６８が発見できる。または、サブブロックのサブ分割３６８である大部分が最近横断されたサブブロックのサブ分割で、大きさが減少するレベルの方向に横断するときには、基準チェック３５６の結果が、充填されないから充填されるへと切替わると同時に最も粗い可能なサブブロックのサブ分割３６８が見出される。

以下の図に対して、図１～図４に関して前述したようなスケーラブルビデオエンコーダまたはデコーダが、本願の別の実施の態様に従って本願の実施の形態を形成するように実装される。以下で記載された態様の可能な実装の形態が、態様Ｋ、Ａ、およびＭを参照しながら以下に提示される。

態様について説明するために、図１７を参照する。図１７は現在の部分２８の時間予測３２に対する可能性を示す。その結果、図１７の以下の記述は、層間予測信号との組合せに関連する限り、図６～図１０に関する記述に組み合わされ得る。あるいは、時間層間予測モードとの組み合わせに関連する限り、図１１～図１３に関する記述に組合わされ得る。

図１７に示された状況は、図６に示された状況に対応する。すなわち、ベース層信号２００とエンハンスメント層信号４００とは、斜線を使用して示されている既に符号化／復号化された部分と共に、示されている。エンハンスメント層信号４００内で、現在、符号化／復号化されるべき部分は、ここで、例示的に、現在の部分２８の上のブロック９２と左の９４として記載された、隣接するブロック９２と９４とを有している。両方のブロック９２と９４は、例示的に、現在のブロック２８と同じサイズを持っている。しかしながら、サイズの一致は必須ではない。むしろ、サブ分割されているエンハンスメント層信号４００の画像２２ｂ内へのブロックの部分は、異なるサイズを有し得る。それらは矩形にさえ制限されない。それらは、長方形、または、他の形でもよい。別の隣接しているブロックを有する現在のブロック２８は、図１７に明確に記載されていない。しかしながら、別の隣接しているブロックは、未だ符号化／復号化されていない。すなわち、それらは、符号化／復号化の順序で続き、その結果、予測のために利用できない。これ以外に、既に符号化／復号化の順序に従って符号化／復号化されたブロック９２および９４より他のブロック、例示的に、現在のブロック２８の隣の、現在のブロック２８の左上斜めにあるブロック９６が存在する。しかし、ブロック９２と９４は、ここで考慮された例において、インター予測３０を受ける現在のブロック２８のためのインター予測パラメータを予測する役割をする、隣接するブロックを予め決められる。そのような予め決められた隣接するブロックの数は、２つに制限されない。それは、１より大きくてもよいし、単に１でもよい。可能な実施の形態の議論は図３６～図３８に対して提示される。

スケーラブルビデオエンコーダとスケーラブルビデオデコーダは、その左上のサンプルなどの現在の部分２８内に、例えば、予め決められたサンプル位置９８に依存している、既に符号化された隣接しているブロック（ここでは、ブロック９２～９６）のセットから、予め決められた隣接しているブロック（ここでは、ブロック９２，９４）のセットを決定し得る。例えば、現在の部分２８のそれらの既に符号化された隣接しているブロックのみが、予め決められたサンプル位置９８に直接隣接したサンプル位置を含む「予め決められた隣接しているブロック」のセットを形成する。さらなる可能性は図３６～図３８に対して説明され得る。

どのような場合でも、復号化／符号化の順序に従って、動きベクトル５０４によって現在のブロック２８の併置された位置から置き換えられた、エンハンスメント層信号４００の以前に符号化／復号化された画像２２ｂの部分５０２が、単なるコピーや補間などによって予測される部分２８のサンプル値に基づいて再構成されたサンプル値を含む。このために、動きベクトル５０４は、エンハンスメント層サブストリーム６ｂ内でシグナリングされる。例えば、現在のブロック２８のための時間予測パラメータは、部分２８のサンプル上にコピーされるために、任意に補間によって参照画像２２ｂ内の部分２８の併置された位置から部分５０２の置換を示している変位ベクトル５０６を示す。

どのような場合でも、現在のブロック２８を時間的に予測する時に、スケーラブルビデオデコーダ／エンコーダは、ベース層サブストリーム６ａを使用して、ベース層２００を既に再構成している（そして、エンコーダの場合は、既に符号化している）。少なくとも、時間的に対応する画像２２ａの関連する空間的に対応する領域がそのように関連する限り、前述したように、ブロック単位の予測を使用し、そして、例えば、空間予測モードと時間予測モードとの間のブロック単位の選択を使用する。

図１７において、ベース層信号２００の画像２２ａを併置された時間が、数ブロック１０４にサブ分割されている。ブロック１０４は、例示的に表わされる現在の部分２８に局所的に対応している領域で、周りに位置する。ちょうどそれは、エンハンスメント層信号４００内の空間的に予測されたブロックを有する場合である。空間予測パラメータは、ベース層信号２００内でそれらのブロック１０４に対してベース層サブストリーム６ａ内に含まれ、またはシグナリングされる。空間予測モードの選択は、ベース層信号２００に対してシグナリングされる。

ここで、例示的に、時間イントラ層予測３２が選択されたブロック２８に関して、符号化データストリームからエンハンスメント層信号の再構成を可能にするために、動きパラメータのようなインター予測パラメータが、以下の方法のどれかを使用して決定される。

最初の可能性は図１８に対して説明される。特に、先ず、動きパラメータ候補５１４のセット５１２が、予め決められたブロック９２と９４のようなフレームの隣接する既に再構成されたブロックから集められる、または、生成される。動きパラメータは動きベクトルである。ブロック９２と９４の動きベクトルは、（その中に、）それぞれ１と２が記された矢印５１６と５１８を使用して、表わされる。図示されているように、これらの動きパラメータ５１６と５１８は、直接に候補５１４を形成し得る。いくつかの候補は図１８に示すように、５１８や５１６のような動きベクトルを結合することによって形成され得る。

さらに、部分２８に併置された、ベース層信号２００のブロック１０８の１つ以上のベース層動きパラメータ５２４のセット５２２は、ベース層動きパラメータから集められ、または、生成される。換言すれば、ベース層内で併置されたブロック１０８に関連した動きパラメータは、１つ以上のベース層動きパラメータ５２４を導出するために使用される。

その時は、１つ以上のベース層動きパラメータ５２４、または、それのスケーリングされたバージョンが、動きパラメータ候補の拡張動きパラメータ候補セット５２８を得るために、動きパラメータ候補５１４のセット５１２に加算５２６される。これは、候補５１４のリストの終わりでベース層動きパラメータ５２４を単に追加するような多様な方法で、または、一例が図１９ａに対して概説される異なる方法でなされる。

少なくとも拡張動きパラメータ候補セット５２８の動きパラメータ候補５３２の一つが、次に、選択される。部分２８の動き補償予測によって、時間予測３２が、拡張動きパラメータ候補セットの動きパラメータ候補の選択された一つを使用して、実行される。選択５３４は、リスト／セット５２８内のインデックス５３６の方法によって、部分２８のためのサブストリーム６ｂのようなデータストリーム内でシグナリングされ得る、または、図１９ａに対して説明される別の方法で実行され得る。

前述したように、ベース層動きパラメータ５２３が、マージを使用して、ベース層サブストリーム６ａのような符号化データストリーム内で符号化されたか否かがチェックされ得る。そして、仮に、ベース層動きパラメータ５２３が、マージを使用して、符号化データストリーム内で符号化されるならば、加算５２６は抑制され得る。

図１８に従って述べた動きパラメータは、動きベクトル（動きベクトル予測）だけに、または、ブロック、参照インデックス、パーティショニング情報（マージ）毎に、動き仮説の数を含む動きパラメータの完全なセットに関連し得る。従って、「スケーリングされたバージョン」は、空間スケーラビリティの場合に、ベース層信号とエンハンスメント層信号との間の空間解像度比率に従ってベース層信号内で使用される動きパラメータのスケーリングから由来し得る。符号化データストリームの方法によって、ベース層信号のベース層動きパラメータの符号化／復号化が、例えば空間的または時間的な動きベクトル予測、または、マージ化に関与し得る。

マージ／動きベクトル候補５３２のセット５２８内へのベース層信号の併置された部分１０８で使用された動きパラメータ５２３の編入５２６は、イントラ層候補５１４と１つ以上の層間候補５２４との中で、非常に有効な索引を可能にする。選択５３４は、予測ブロック毎に、符号化単位または同様のもの毎に、エンハンスメント層信号６ｂ内の動きパラメータ候補の拡張されたセット／リスト内へのインデックスの明白なシグナリングに関わり得る。あるいはまた、選択インデックス５３６は、エンハンスメント層信号６ｂの別の情報、または、層間の情報から推論され得る。

図１９ａの可能性に従って、部分２８のためのエンハンスメント層信号のための最終動きパラメータ候補リストの形成５４２は、図１８に関して概説されているように、オプションで実行されるだけである。すなわち、形成５４２は、５２８または５１２でもよい。しかしながら、リスト５２８／５１２は、例えば、併置されたベース層ブロック１０８の（動きベクトル５２３によって表わされた）動きパラメータなどのベース層動きパラメータに依存して順序付け５４４される。例えば、メンバー（すなわち、リスト５２８／５１２の動きパラメータ候補５３２または５１４）のランクが、動きパラメータ５２３の潜在的にスケーリングされたバージョンに対して、それぞれのメンバーの偏差に基づいて決定される。偏差が大きいほど、順序付けリスト５２８／５１２´内のそれぞれのメンバー５３２／５１２のランクが低い。その結果、順序付け５４４は、リスト５２８／５１２のメンバー５３２／５１４毎に、偏差の大きさの決定に関わる。順序付けリスト５２８／５１２´内の１つの候補５３２／５１２の選択５３４は、エンハンスメント層信号の部分２８に対して、順序付けられた動きパラメータ候補リスト５２８／５１２´からエンハンスメント層動きパラメータを得るために、符号化データストリーム内の明らかにシグナリングされたインデックス構文要素５３６を経由して実行され、制御される。そして、次に、時間予測３２は、エンハンスメント層信号の部分２８の動き補償予測によって、インデックス５３６が５３４を指す、選択された動きパラメータを使用して実行される。

図１９ａで言及された動きパラメータに対して、上で図１８に関して述べられた動きパラメータが適用される。符号化データストリームからのベース層動きパラメータ５２０の復号化は、（任意に）空間的または時間的動きベクトル予測、または、マージに関わり得る。順序付けが、ちょうど、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連して、それぞれのエンハンスメント層動きパラメータ候補とベース層信号のベース層動きパラメータとの間の差を大きくする大きさに従ってなされ得る。すなわち、エンハンスメント層信号の現在のブロックに対して、エンハンスメント層動きパラメータ候補のリストが、最初に決定され得る。次に、順序付けが実行されることが、説明される。以下に、選択は明白なシグナリングで実行される。

あるいはまた、順序付け５４４が、エンハンスメント層信号の現在のブロック２８に併置されたベース層信号のブロック１０８に関連しているベース層信号のベース層動きパラメータ５２３と、ベース層内の空間的および／または時間的に隣接するブロック５４８のベース層動きパラメータ５４６との間の差を大きくする大きさに従ってなされ得る。次に、ベース層内の決定された順序付けが、エンハンスメント層に転送される。その結果、エンハンスメント層動きパラメータ候補が、対応するベース層候補に対して、決定された順序付けと同じ方法で、順序付けされる。この点で、関連ベース層ブロック５４８が、考慮されたエンハンスメント層動きパラメータに関連する、隣接するエンハンスメント層ブロック９２と９４に空間的／時間的に併置されるとき、ベース層動きパラメータ５４６が、隣接しているエンハンスメント層ブロック９２，９４のエンハンスメント層動きパラメータに対応すると言われ得る。あるいはまた、関連ベース層ブロック５４８と現在のエンハンスメント層ブロック２８に併置されたブロック１０８との間の隣接関係（左隣、上隣、Ａ１，Ａ２，Ｂ１，Ｂ２，Ｂ０、または、更なる例に対して図３６～図３８を参照）が、現在のエンハンスメント層ブロック２８とそれぞれエンハンスメント層隣接ブロック９２，９４との間の隣接関係と同じであるとき、ベース層動きパラメータ５４６は、エンハンスメント層隣接ブロック９２，９４のエンハンスメント層動きパラメータに対応すると言われ得る。ベース層順序付けに基づいて、選択５３４が、その時、明白なシグナリングによって実行される。

さらに詳細にこれについて説明するために、図１９ｂを参照する。図１９ｂは、ベース層ヒントを使用して、動きパラメータ候補のリストのために順序付けされるエンハンスメント層をちょうど得るための概説される代替の１番目を示す。図１９ｂは、現在のブロック２８と、３つの異なる予め決められたサンプル（すなわち、例示的に、左上のサンプル５８１、左下のサンプル５８３および右上のサンプル５８５）の位置とを示す。例は、説明としてのみ解釈される。予め決められた隣接するブロックのセットが、例示的にサンプル位置５８１に隣接しその上に位置するサンプル位置５８７をカバーする隣接するブロック９４ａおよびサンプル位置５８５に隣接して直上に位置するサンプル位置５８９を含む、またはカバーする隣接するブロック９４ｂという隣接の４つのタイプを含むと仮定する。同様に、隣接するブロック９２ａと９２ｂは、サンプル位置５８１と５８３の直ぐ左側に隣接して位置するサンプル位置５９１と５９３を含むそれらのブロックである。また、図３６～図３８に対して説明されるように、予め決められた数の決定規則にもかかわらず、予め決められた隣接するブロックの数は変化し得る点に留意されたい。それにもかかわらず、予め決められた隣接するブロック９２ａ，９２ｂ，９４ａ，９４ｂは、それらの決定規則によって区別できる。

図１９ｂの代替に従って、それぞれ予め決められた隣接するブロック９２ａ，９２ｂ，９４ａ，９４ｂに対して、ベース層内の併置されたブロックが決定される。例えば、このために、それぞれ隣接するブロックの左上のサンプル５９５が使用される。ちょうどそれは、図１９ａ内で正式に言及された左上のサンプル５８１に関して、現在のブロック２８を有する場合である。これは、図１９ｂ中で、点線の矢印を使用して説明される。この手段によって、予め決められた隣接するブロックのそれぞれに対して、対応するブロック５９７が、併置されたブロック１０８、併置された現在のブロック２８に加えて発見される。併置されたベース層ブロック５９７の動きパラメータｍ１，ｍ２，ｍ３，ｍ４と、併置されたベース層ブロック１０８のベース層動きパラメータｍに対するそれらのそれぞれの差とを使用して、予め決められた隣接するブロック９２ａ，９２ｂ，９４ａ，９４ｂのエンハンスメント層動きパラメータＭ１，Ｍ２，Ｍ３，Ｍ４が、リスト５２８または５１２内で順序付けされ得る。例えば、ｍ１～ｍ４のどれかの距離が大きいほど、対応するエンハンスメント層動きパラメータＭ１～Ｍ４はより高い。すなわち、より高いインデックスが、リスト５２８／５１２´から同じ状態で索引を付けるために必要であり得る。距離の大きさに対して、絶対差が使用される。同様にして、動きパラメータ候補５３２または５１４は、エンハンスメント層動きパラメータＭ１～Ｍ４の結合であるそれらのランクに対して、リスト内で再配列され得る。

図１９ｃは、ベース層内の対応するブロックが、別の方法で決定される代替を示す。特に、図１９ｃは、現在のブロック２８の予め決められた隣接ブロック９２ａ，９２ｂ，９４ａ，９４ｂ、および、現在のブロック２８の併置されたブロック１０８を示す。図１９ｃの実施の形態に従って、現在のブロック２８のこれらに対応するベース層ブロック（すなわち、９２ａ，９２ｂ，９４ａ，９４ｂ）が、これらのベース層ブロックが、これらのベース層隣接ブロックを決定するために同じ隣接決定規則を使用して、エンハンスメント層隣接ブロック９２ａ，９２ｂ，９４ａ，９４ｂに関連付けられるような方法で決定される。特に、図１９ｃは、併置されたブロック１０８の予め決められたサンプル位置、すなわち、左上、左下、および右上のサンプル位置６０１を示す。これらのサンプル位置に基づいて、ブロック１０８の４つの隣接ブロックが、現在のブロック２８の予め決められたサンプル位置５８１，５８３，５８５に関するエンハンスメント層隣接ブロック９２ａ，９２ｂ，９４ａ，９４ｂに関して記述されたのと同じ方法で決定される。４つのベース層隣接ブロック６０３ａ，６０３ｂ，６０５ａ，６０５ｂは、この様にして見つけられる。６０３ａは、明らかにエンハンスメント層隣接ブロック９２ａに対応する。ベース層ブロック６０３ｂは、エンハンスメント層隣接ブロック９２ｂに対応する。ベース層ブロック６０５ａは、エンハンスメント層隣接ブロック９４ａに対応する。ベース層ブロック６０５ｂは、エンハンスメント層隣接ブロック９４ｂに対応する。以前説明したのと同じ方法で、ベース層ブロック９０３ａ，９０３ｂ，９０５ａ，９０５ｂのベース層動きパラメータＭ１～Ｍ４と、併置されたベース層ブロック１０８のベース層動きパラメータｍに対するそれらの距離とが、エンハンスメント層ブロック９２ａ，９２ｂ，９４ａ，９４ｂの動きパラメータＭ１～Ｍ４から形成されたリスト５２８／５１２内で動きパラメータ候補を順序付けるために使用される。

図２０の可能性に従って、部分２８のためのエンハンスメント層信号のための最終動きパラメータ候補リストの形成５６２は、図１８および／または図１９に対して概説されているように、単に任意に実行される。すなわち、形成５６２は、５２８または５１２または５２８／５１２´である。参照符号５６４は図２０で使用され得る。図２０に従って、動きパラメータ候補リスト５６４内で指摘するインデックス５６６は、例えば、併置されたブロック１０８に対して、ベース層信号を符号化／復号化するために使用された、動きパラメータ候補リスト５６８内のインデックス５６７に依存して決定される。例えば、ブロック１０８でベース層信号を再構成する際、動きパラメータ候補のリスト５６８は、予め決められた隣接するエンハンスメント層ブロック９２，９４と現在のブロック２８との間の隣接関係と同じであるブロック１０８に対して、隣接関係（左側に隣接、上側に隣接、Ａ１，Ａ２，Ｂ１，Ｂ２，Ｂ０、または、さらに別の例に対しては図３６～３８参照）を有しているブロック１０８の隣接するブロック５４８の動きパラメータ５４８に基づいて決定され得る。ここで、リスト５６７の決定５７２は、リスト５６８と５６４のリストメンバー内の順序付けなどの形成５６２内で使用されるのと同じ構成規則を潜在的に使用する。より一般的に、エンハンスメント層のためのインデックス５６６は、その隣接するエンハンスメント層ブロック９２，９４が、索引をつけられたベース層候補（すなわち、インデックス５６７が指摘するもの）に関連したベース層ブロック５４８と併置されたインデックス５６６によって指摘される方法で決定される。その結果、インデックス５６７は、インデックス５６６の重要な予測として機能し得る。エンハンスメント層動きパラメータは、その時、動きパラメータ候補リスト５６４内へのインデックス５６６を使用して決定され、そして、ブロック２８の動き補償予測は、決定された動きパラメータを使用して実行される。

図２０で言及した動きパラメータに関して、図１８と図１９に関して上述したと同じことが適用される。

以下の図に関して、図１～図４に対して上述したそれらのように、スケーラブルビデオエンコーダまたはデコーダが、応用の別の態様に従って、本願の実施の形態を形成するためにどのようにして実装できるかが記載される。以下に説明される態様の詳細な実現は、以下で実施例Ｖを参照して説明される。

本態様は、エンハンスメント層内の残差符号化に関する。特に、図２１は、例示的に、エンハンスメント層信号４００の画像２２ｂと、ベース層信号２００の画像２２ａとを、時間的に登録された方法で示す。図２１は、スケーラブルビデオデコーダ内で再構成する、または、スケーラブルビデオエンコーダ内で符号化する方法、およびエンハンスメント層信号を示し、エンハンスメント層信号４００を表わす変換係数４０２の予め決められた変換係数ブロックと予め決められた部分４０４とに集中する。換言すれば、変換係数ブロック４０２は、エンハンスメント層信号４００の部分４０４の空間分解を表わす。符号化／復号化の順序付けに従って既に上で説明したように、ベース層信号２００の対応する部分４０６は、変換係数ブロック４０２を復号化／符号化する時に、既に復号化／符号化され得る。ベース層信号２００に関する限り、予測の符号化／復号化は、ベース層サブストリーム６ａなどの符号化データストリーム内のベース層残差信号の信号化を含めて、使用され得る。

図２１に対して記載された実施例に従って、スケーラブルビデオデコーダ／エンコーダは、ベース層信号またはベース層残差信号の評価４０８が、部分４０４に併置された部分４０６にて、サブブロック４１２内の変換係数ブロック４０２のサブ分割の有利な選択をもたらし得るという事実を利用する。特に、変換係数ブロック４０２をサブブロックにサブ分割するためのいくつかの可能なサブブロックのサブ分割が、スケーラブルビデオデコーダ／エンコーダによってサポートされ得る。これらの可能なサブブロックのサブ分割は、規則的に矩形のサブブロック４１２内の変換係数ブロック４０２をサブ分割し得る。すなわち、変換係数ブロック４０２の変換係数４１４が、列と行に配置され得、そして、可能なサブブロックのサブ分割に従って、これらの変換係数４１４が、規則的にサブブロック４１２内に密集させられるので、サブブロック４１２自身が行と列に並べられる。評価４０８は、このようにして選択されたサブブロックのサブ分割を使用して、変換係数ブロック４０２の符号化が、最も効率的であるような方法で、サブブロック４１２の行の数と列の数との間の比（すなわち、それらの幅と高さとの間の比）を設定可能にする。仮に、例えば、評価４０８が、併置された部分４０６内の再構成されたベース層信号２００、または少なくとも対応する部分４０６内のベース層残差信号が、空間領域内の水平なエッジで主として構成される、ということを判明するならば、変換係数ブロック４０２は、有意さ（すなわち、変換係数レベルが非ゼロである、すなわち、量子化された変換係数が、変換係数ブロック４０２のゼロ水平周波数側の近くである）を有して、おそらく存在する。垂直なエッジの場合、変換係数ブロック４０２は、変換係数ブロック４０２のゼロ垂直周波数側の近くの位置で、非ゼロの変換係数レベルを有して、おそらく存在する。従って、先ず、サブブロック４１２が、垂直方向に沿ってより長く、かつ、水平方向に沿ってより小さくなるように選択される。そして、２番目に、サブブロックは、水平方向により長く、かつ、垂直方向により小さくされる。後者の場合が模式的に図４０に示されている。

すなわち、スケーラブルビデオデコーダ／エンコーダは、ベース層残差信号またはベース層信号に基づいて、可能なサブブロックのサブ分割のセット内で、１つのサブブロックのサブ分割を選択する。その時、変換係数ブロック４０２の符号化４１４または復号化が、選択されたサブブロックのサブ分割を適用しながら実行される。特に、変換係数４１４の位置が、サブブロック４１２の単位内で横断されるので、１つのサブブロック内の全ての位置は、サブブロック内で定義されたサブブロックの順序付けの中で、次のサブブロックに直ぐに連続して続く方法で横断される。参照符号４１２が図４０の２２に例示的に示されているサブブロック４１２などの現在訪問されているサブブロックについて、現在訪問されたサブブロックが任意の有意な変換係数を有するか否かを示す、構文要素は、エンハンスメント層サブストリーム６ｂなどのデータストリーム内でシグナリングされる。図２１では、構文要素４１６が、２つの例示的なサブブロックに対して説明される。仮に、それぞれのサブブロックのそれぞれの構文要素が、有意でない変換係数を示すならば、他には何も、データストリームまたはエンハンスメント層サブストリーム６ｂ内で送信される必要がない。むしろ、スケーラブルビデオデコーダは、そのサブブロック内の変換係数をゼロに設定し得る。しかしながら、仮に、それぞれのサブブロックの構文要素４１６が、このサブブロックは有意な変換係数を有する、ことを示すならば、そのサブブロック内で変換係数に関連する別の情報が、データストリームまたはサブストリーム６ｂ内でシグナリングされる。復号化側では、スケーラブルビデオデコーダが、データストリームまたはサブストリーム６ｂから、それぞれのサブブロック内の変換係数のレベルを示す構文要素４１８を復号化する。構文要素４１８は、それぞれのサブブロック内のこれらの変換係数内の走査順序、および、オプションで、それぞれのサブブロック内の変換係数内の走査順序に従って、そのサブブロック内の有意な変換係数の位置を示し得る。

図２２は、評価４０８内の可能なサブブロックのサブ分割内での選択を実行するためにそれぞれ存在する、異なる可能性を示す。図２２は、変換係数ブロック４０２が部分４０４のスペクトル分解を後に表すことに関連する、エンハンスメント層信号の部分４０４を再び記載する。例えば、変換係数ブロック４０２は、エンハンスメント層信号を予測的に符号化／復号化するスケーラブルビデオデコーダ／エンコーダを伴う、エンハンスメント層残差信号のスペクトル分解を表わす。特に、変換の符号化／復号化は、エンハンスメント層残差信号を符号化するために、スケーラブルビデオデコーダ／エンコーダによって使用される。変換の符号化／復号化は、ブロック単位の（すなわち、エンハンスメント層信号の画像２２ｂがサブ分割されるブロック内の）方法で実行される。図２２は、ベース層信号の、対応するまたは併置された部分４０６を示す。ここに、スケーラブルビデオデコーダ／エンコーダは、ベース層信号の予測残差に対して（すなわち、ベース層残差信号に対して）変換の符号化／復号化を使用しながら、予測的な符号化／復号化をベース層信号に適用する。特に、ブロック単位の変換は、ベース層残差信号に対して使用される。すなわち、ベース層残差信号は、図２２に点線で記載されている個別に変換されたブロックで、ブロック単位で変換される。図２２に記載されているように、ベース層の変換ブロックのブロック境界は、併置された部分４０６の外形と一致する必要はない。

それにもかかわらず、評価４０８を実行するために、以下のオプションＡ～Ｃの１つまたは組合せが使用され得る。

特に、スケーラブルビデオデコーダ／エンコーダは、符号化／復号化されるべき変換係数ブロック４０２にサイズで一致する変換係数の変換係数ブロック４２４を得るために、部分４０６内で、ベース層残差信号または再構成されたベース層信号に、変換４２２を実行し得る。変換係数ブロック４２４，４２６内の変換係数の値の分布の検査は、水平周波数の方向４２８に沿ってサブブロック４１２の寸法を適切に設定し、かつ、垂直周波数の方向４３２に沿ってサブブロック４１２の寸法を適切に設定するために使用され得る。

加えて、あるいは、二者択一的に、スケーラブルビデオデコーダ／エンコーダは、少なくとも併置された部分４０６を部分的に重ねる、図２２の異なる斜線によって描かれたベース層変換ブロック４３４の全ての変換係数ブロックを検査し得る。図２２の例示的な場合において、４つのベース層変換ブロックが存在し、次に、それらの変換係数ブロックが検査される。特に、これらのベース層変換ブロックの全ては、互いに異なるサイズであり得て、変換係数ブロック４１２に対してさらにサイズが異なり得る。スケーリング４３６は、部分４０６内でベース層残差信号のスペクトル分解の変換係数ブロック４３８の近似をもたらすために、ベース層変換ブロック４３４を重ねるこれらの変換係数ブロックに対して実行され得る。その変換係数ブロック４３８内の変換係数の値の分布（すなわち、４４２）は、サブブロックの寸法４２８と４３２を適切に設定するために、評価４０８内で使用され得る。その結果、変換係数ブロック４０２のサブブロックのサブ分割が選択される。

評価４０８を実行するために、追加して、あるいは、二者択一的に、実行され得る。さらなる代替案は、エッジ検出４４４または主な勾配方向の決定を使用して空間領域内でベース層残差信号または再構成ベース層信号を検査し、例えば、サブブロック寸法４２８と４３２を適切に設定するように同位置部分４０６内で検出されたエッジの拡大方向または決定された勾配）に基づいて決定する。

上で明確に説明されていないけれども、変換係数の位置とサブブロック４１２の単位を横断することにおいて、変換係数ブロックのゼロ周波数角部（図２１の左上隅部）から出発して、ブロック４０２の最高周波数角部（図２１の右下隅部）に至る順序で、サブブロック４１２を横断することが好ましい。さらに、エントロピー符号化が、データストリーム６ｂ内で構文要素をシグナリングするために使用され得る。すなわち、構文要素４１６と４１８は、演算、可変長符号化または別の形式のエントロピー符号化などの、符号化された都合の良いエントロピー符号化であり得る。サブブロック４１２を横断する順序付けは、４０８に従って選択されたサブブロック形状にも依存し得る。それらの高さより広くなるように選択されたサブブロックに対して、縦断の順序は、最初列方向にサブブロックを横断して、次に、次の列などに進行し得る。これを超えて、サブブロックの寸法を選択するために使用されるベース層情報が、ベース層残差信号または再構成されたベース層信号自体であり得る、ということに再び注意すべきである。

以下では、上で説明された態様に組合せられる、異なる実施の形態が説明される。以下で記載された実施の形態は、多くの異なる態様または手段に関連して、スケーラブルビデオ符号化を更に効率的にする。部分的に、上の態様は、一般概念を保持した状態で、以下で詳細に説明されて、それの別の導出した実施の形態を提示する。これらの以下に提示された記述は、上の実施の形態／態様の代替または拡張を得るために使用され得る。しかしながら、以下で記載された実施の形態の大部分は、サブ側面に関するものであり、任意に、上で既に説明された態様に組合わされる。すなわち、それらは、同時に１つのスケーラブルビデオデコーダ／エンコーダ内で、上の実施の形態と共に実装される。しかし、それは必須ではない。

前の記述をより容易に理解するために、実施の形態や実施の形態の組合せを取込んだ適切なスケーラブルビデオエンコーダ／デコーダを実装するためのより詳細な実施の形態が、次に提示される。以下で記載された異なる実施例は、英数字の符号の使用によって列挙される。これらの態様のいくつかの説明は、１つの実施の形態に従って、これらの態様が共通に実施され得る、今説明する図中の要素を参照する。しかしながら、個々の実施例に関する限り、スケーラブルビデオデコーダ／エンコーダの実装内の各要素の提供が、あらゆる態様に関する限り、必要ではない。問題の態様に依存して、いくつかの要素といくつかの相互接続とが、次に記載された図面内で省略され得る。それぞれの態様に対して参照された要素のみが、それぞれの態様の記述で言及した仕事または関数を実行するために提供される。しかしながら、特に、いくつかの要素が１つの関数に挙げられているとき、代替が存在することもある。

しかしながら、スケーラブルビデオデコーダ／エンコーダの機能の概要を提供するために、次に記載された態様が実装される。以下の図に示された要素は、今、簡潔に説明される。

図２３は、符号化データストリーム６の主のサブ部分（すなわち、６ａ）が第１の解像度または品質レベルで映像を表わすような方法で、映像が符号化される符号化データストリーム６を復号化するためのスケーラブルビデオデコーダを示す。符号化データストリームの追加部分６ｂは、増加する解像度または品質レベルで映像の表現に対応している。符号化データストリーム６のデータ量を低く保つために、サブストリーム６ａと６ｂの間の層間の冗長が、サブストリーム６ｂを形成する際に利用される。以下で記載された態様のいくつかが、サブストリーム６ａが関連するベース層からの層間予測に向けられ、そして、サブストリーム６ｂが関連するエンハンスメント層に向けられる。

スケーラブルビデオデコーダは、並行に稼働する２つのブロックベースの予測デコーダ８０、６０を含み、サブストリーム６ａと６ｂをそれぞれ受信する。図に示すように、デマルチプレクサ４０は、別々に復号化ステージ８０と６０を、対応するサブストリーム６ａと６ｂと共に提供し得る。

ブロックベースの予測符号化ステージ８０と６０の内部構造は、図示されているように、同じであり得る。それぞれの復号化ステージ８０，６０の入力から、エントロピー符号化モジュール１００；３２０、逆変換器５６０；５８０、加算器１８０；３４０、オプションのフィルタ１２０；３００および１４０；２８０が、この記述の順序に直列に接続されている。その結果、この直列接続の最後に、再構成されたベース層信号６００と再構成されたエンハンスメント層信号３６０が、それぞれ導出され得る。一方、加算器１８０，３４０とフィルタ１２０，１４０，３００，２８０の出力が、それぞれベース層信号とエンハンスメント層信号の再構成の異なるバージョンを提供する。そうすれば、それぞれの予測プロバイダ１６０；２６０は、これらのバージョンのサブセットまたは全てを受信して、それに基づいて、予測信号を加算器１８０；３４０の残差入力へそれぞれ提供するために提供する。エントロピー復号化ステージ１００；３２０は、それぞれの入力信号６ａと６ｂからそれぞれ復号化し、変換係数ブロックは逆変換器５６０；５８０に入り、予測プロバイダ１６０；２６０のための予測パラメータを含むパラメータを符号化する。

従って、予測プロバイダ１６０と２６０は、それぞれの解像度／品質レベルで映像のフレームのブロックを予測する。そして、このために、予測プロバイダ１６０と２６０は、空間イントラ予測モードや時間インター予測モードのような所定の予測モード内で選択され得る。両方のモードは、イントラ層予測モード（すなわち、それぞれのレベルが入っているサブストリーム内のデータに唯一依存する予測モード）である。

しかしながら、前述の層間の冗長を利用するために、エンハンスメント層復号化ステージ６０は、符号化パラメータ層間予測器２４０、解像度／品質改良器２２０、および／または、予測プロバイダ１６０と比較される予測プロバイダ２６０を付加的に含む。さらに、／あるいはまた、エンハンスメント層復号化ステージ６０は、ベース層復号化ステージ８０の内部ステージから導出されたデータに基づいたエンハンスメント層予測信号４２０を提供できる層間予測モードを支援する。解像度／品質改良器２２０は、再構成されたベース層信号２００ａ，２００ｂ，２００ｃまたはベース層残差信号４８０のどれかに、解像度または品質の改良を受けさせて、層間予測信号３８０を得る。符号化パラメータ層間予測器２４０は、それぞれ予測パラメータや動きパラメータのような符号化パラメータを何らかの形で予測することである。予測プロバイダ２６０は、例えば、さらに、２００ａ，２００ｂ，２００ｃのようなベース層信号の再構成された部分に従って、層間予測モードを支援する。あるいは、増加する解像度／品質レベルに潜在的に改良されたベース層残差信号６４０の再構成された部分が、参照／基礎として使用される。

前述したように、復号化ステージ６０と８０は、ブロックベースの方法で操作され得る。すなわち、映像のフレームは、ブロックのような部分にサブ分割され得る。異なる粗さレベルは、予測プロバイダ１６０，２６０によって実行される予測モード、逆変換器５６０，５８０による局所変換、フィルタ１２０，１４０によるフィルタ係数選択、および、予測プロバイダ１６０，２６０による予測モードのための予測パラメータ設定を割り当てるために使用され得る。すなわち、フレームを予測ブロックにサブ分割することは、順に、予測モードが選択されているブロック（例えば、いわゆる符号化単位または予測単位）へのフレームのサブ分割の続きになる。変換符号化のためにブロックへのフレームのサブ分割（いわゆる変換単位）は、予測単位へのパーティションと異なり得る。予測プロバイダ２６０によって使用される層間予測モードのいくつかは、以下で実施例に対して説明される。予測プロバイダ２６０は、いくつかのイントラ層予測モード、すなわち、それぞれの加算器１８０，３４０に入力されるそれぞれの予測信号を内部的に導出する予測モード、すなわち、それぞれ、現在のレベルの符号化ステージ６０，８０に関わる状態に唯一基づいて適用される。

図示されたブロックのいくつかの別の詳細が、以下の個々の態様の記述から明らかになる。そのような記述が提供された態様に明確に関連しない限り、これらの記述は、等しく一般に別の態様と図の記述に転載可能であることに注意されたい。

特に、図２３のスケーラブルビデオデコーダのための実施の形態は、図２と図４に従って、スケーラブルビデオデコーダの可能な実現を表す。図２３に従ったスケーラブルビデオデコーダは前述されているけれども、図２３は、対応するスケーラブルビデオエンコーダを示し、同じ参照符号が図２３と図２４内の予測符号化／復号化方式の内部要素のために使用される。理由は前出のとおりである。また、エンコーダとデコーダとの間の一般的な予測基礎を維持する目的のために、ベースとエンハンスメント層信号の再構成可能バージョンは、エンコーダで使用され、また、この終わりまで既に符号化された部分を再構成して、スケーラブルビデオの再構成可能バージョンを得る。従って、図２３の記述との唯一の差は、符号化パラメータ層間予測器２４０と同様に、予測プロバイダ１６０と予測プロバイダ２６０とが、データストリームから予測パラメータを受信するよりむしろ、何らかの比率／歪最適化の処理内で予測パラメータを決定する、ということである。むしろ、プロバイダは、このようにして決定された予測パラメータを、エントロピーデコーダ１９ａと１９ｂに送信する。エントロピーデコーダ１９ａと１９ｂは、データストリーム６内に含めるために、マルチプレクサ１６を経由して、それぞれのベース層サブストリーム６ａとエンハンスメント層サブストリーム６ｂを順番に送信する。同様の方法で、これらのエントロピーエンコーダ１９ａと１９ｂが、そのような残差のエントロピー復号化結果を出力するよりもむしろ、変換モジュール７２４，７２６が後続の減算器７２０と７２２を経由して得られるように、再構成されたベース層信号２００および再構成されたエンハンスメント層信号４００と、オリジナルのベース層およびエンハンスメント層バージョン４ａ，４ｂの間の予測残差を受信する。しかしながら、この他、図２４のスケーラブルビデオエンコーダの構造は、図２３のスケーラブルビデオデコーダの構造と一致する。従って、これらの問題に関して、図２３の上の記述が参照される。ここでは、ちょうど概説されているように、どんなデータストリームからのどんな導出も、それぞれのデータストリーム内へのその後の挿入を有するそれぞれの要素のそれぞれの決定に変えられなければならない。

次に記載された実施の形態に使用されるエンハンスメント層信号のイントラ符号化のための技術は、エンハンスメント層ブロックのために、イントラ予測信号を（ベース層データを使用して）発生させるための複数の方法を含む。これらの方法は、再構成されたエンハンスメント層のサンプルだけに基づいてイントラ予測信号を発生させる方法に追加して提供される。

イントラ予測は、イントラ符号化されたブロックの再構成の過程の一部である。最終再構成ブロックは、変換で符号化された残差信号（ゼロであるかもしれない）をイントラ予測信号に追加することによって得られる。残差信号は、逆変換が後に続いたビットストリーム内で送信された変換係数レベルの逆量子化（スケーリング）によって発生する。

以下の記述は、（エンハンスメント層がベース層と同じ解像度を有するけれども、より高い品質または忠実度を有する入力ビデオを表わす）品質エンハンスメント層を有するスケーラブル符号化と、（エンハンスメント層がベース層より高い解像度、つまり、より多くのサンプル数を有する）空間エンハンスメント層を有するスケーラブル符号化とに適用される。品質エンハンスメント層の場合には、ベース層信号のアップサンプリングは、ブロック２２０などの中で必要でないけれども、再構成されたベース層のサンプルのフィルタリング５００などには適用され得る。空間エンハンスメント層の場合には、一般に、ベース層信号のアップサンプリングが、例えばブロック２２０内で要求される。

次に記載された態様は、エンハンスメント層ブロックのイントラ予測に対して、再構成されたベース層サンプル（２００と比べて）またはベース層残差サンプル（６４０と比べて）を使用するために、異なる方法をサポートする。以下に記載された方法の１つ以上は、イントラ層イントラ符号化（そこでは再構成されたエンハンスメント層サンプル（４００と比べて）だけがイントラ予測のために使用される）に加えて、サポートすることができる。特定の方法の使用が、最も大きいサポートされたブロックサイズ（ＨＥＶＣ内のＨ．２６４／ＡＶＣまたは符号化ツリーのブロック／最も大きい符号化単位内のマクロブロックなどのサイズ）のレベルにて、シグナリングされ得る。または、それは、全てのサポートされたブロックサイズにてシグナリングされる。あるいは、それは、サポートされたブロックサイズのサブセットに対してシグナリングされ得る。

以下に記載される全ての方法に対して、予測信号が、ブロックのための再構成信号として直接に使用され得る。すなわち、残差は全く送信されない。または、層間イントラ予測のための選択された方法は、残差符号化と組み合わされ得る。特定の実施の形態において、残差信号は、変換符号化を経由して送信される。すなわち、量子化された変換係数（変換係数レベル）は、エントロピー符号化技術（例えば、可変長符号化または算術符号化（１９ｂと比べて））を使用して、送信される。そして、残差は、送信された変換係数レベルを逆量子化（スケーリング）して、逆変換（５８０と比べて）を適用することによって得られる。特定のバージョンでは、層間イントラ予測信号が発生するブロックに対応する完全な残差ブロックが、一つの変換を使用して変換される（７２６と比べて）。すなわち、全体のブロックが、予測ブロックと同じサイズの一つの変換を使用して変換される。別の実施の形態では、予測ブロックが、（例えば、階層的な分解を使用して、）より小さいブロックにさらにサブ分割され得る。そして、小さいブロック（また、異なるブロックサイズを有することができる）のそれぞれに対して、別々の変換が適用され得る。別の実施の形態では、符号化単位が、より小さい予測ブロックに分割される。そして、予測ブロックのゼロ以上に対して、予測信号が、層間イントラ予測のための方法の１つを使用して生成される。そして、次に、全体の符号化単位の残差が、一つの変換（７２６と比べて）を使用して変換される。または、符号化単位が、異なる変換単位にサブ分割される。ここで、変換単位（一つの変換が適用されるブロック）を形成するためのサブ分割は、符号化単位を予測ブロックに分解するためのサブ分割とは異なる。

特定の実施の形態において、（アップサンプリングされる／フィルタにかけられる）再構成されたベース層信号（３８０と比べて）は、予測信号として直接に使用される。エンハンスメント層をイントラ予測するためにベース層を使うための多重方法は、以下の方法を含む。（アップサンプリングされる／フィルタにかけられる）再構成されたベース層信号（３８０と比べて）は、エンハンスメント層予測信号として直接に使用される。この方法は、周知のＨ．２６４／ＳＶＣの層間イントラ予測モードと同様である。この方法において、エンハンスメント層についての予測ブロックは、アップサンプリング（２２０と比べて）されて、エンハンスメント層の対応するサンプル位置に整合され、かつ、アップサンプリングの前または後に任意にフィルタにかけられた、ベース層再構成信号の併置されたサンプルによって形成される。ＳＶＣ層間イントラ予測モードと対照して、このモードは、マクロブロックレベル（または、最も大きいサポートされたブロックサイズ）にてサポートされ得るだけでなく、任意のブロックサイズにてサポートされる。それは、モードは、最も大きいサポートされたブロックサイズに対してシグナリングされ得るだけではなく、最も大きいサポートされたブロックサイズのブロック（ＭＰＥＧ４，Ｈ．２６４内のマクロブロックと、ＨＥＶＣ内の符号化ツリーブロック／最も大きい符号化単位）が、より小さいブロック／符号化単位に階層的にサブ分割され、そして、層間イントラ予測モードの使用が、（対応するブロックに対して）どんなサポートされたブロックサイズにてもシグナリングされ得ることを意味する。特定の実施の形態では、このモードは選択されたブロックサイズのためにサポートされるだけである。次に、このモードの使用をシグナリングする構文要素が、対応するブロックサイズに対してだけ送信され得る。または、このモードの使用を（別の符号化パラメータ内で）シグナリングする構文要素の値が、別のブロックサイズに対して、対応して制限され得る。Ｈ．２６４／ＡＶＣのＳＶＣ拡張内の層間イントラ予測モードとの別の相違は、層間イントラ予測モードが、ベース層内の併置された領域がイントラ符号化される場合にサポートされるだけではなく、併置されたベース層領域がインター符号化または一部インター符号化される場合にもサポートされるということである。

特定の実施の形態において、差分信号（態様Ａ参照）の空間イントラ予測が実行される。多重方法は以下の方法を含む。（潜在的にアップサンプリングされる／フィルタにかけられる）再構成されたベース層信号（３８０と比較）は、空間イントラ予測信号と組合わされる。そこでは、空間イントラ予測（４２０と比較）が、隣接するブロックのための差分サンプルに基づいて導出される（２６０と比較）。差分サンプルは、再構成されたエンハンスメント層信号（４００と比較）と、（潜在的にアップサンプリングされる／フィルタにかけられる）再構成されたベース層信号（３８０と比較）との差を表わす。

図２５は、（アップサンプリングされる／フィルタにかけられる）ベース層再構成信号３８０（ＢＬＲｅｃｏ）と、既に符号化された隣接ブロック７３６の差分信号７３４（ＥＨＤｉｆｆ）を使用する空間イントラ予測との合計７３２によって、層間イントラ予測信号の発生を示す。そこでは、既に符号化されたブロック７３６のための差分信号（ＥＨＤｉｆｆ）が、再構成されたエンハンスメント層信号（ＥＨＲｅｃｏ）（４００と比べて）から、既に符号化／復号化された部分がハッチングされている（アップサンプリングされる／フィルタにかけられる）ベース層再構成信号３８０（ＢＬＲｅｃｏ）を引き算すること７３８によって発生する。現在の符号化された／復号化された、ブロック／領域／部分は２８である。すなわち、図２５に記載された層間イントラ予測方法は、２つの重畳された入力信号を使用して、予測ブロックを発生させる。この方法のために、差分信号７３４が必要である。差分信号７３４は、再構成されたエンハンスメント層信号４００と併置された再構成されたベース層信号２００との差分である。前記ベース層信号２００は、エンハンスメント層の対応するサンプル位置に整合するためにアップサンプリング２２０され、アップサンプリングの前または後に任意にフィルタにかけられ得る（それが品質スケーラブル符号化の場合であるとき、仮に、アップサンプリングが適用されないならば、それはフィルタにかけられ得る）。特に、空間スケーラブル符号化のために、通常、差分信号７３４は、主として高周波成分を含む。差分信号７３４は、全ての既に再構成されたブロック（すなわち、既に符号化／復号化された全てのエンハンスメント層ブロック）に利用可能である。既に符号化／復号化されたブロック７３６の隣接するサンプル７４２のための差分信号７３４は、空間イントラ予測技術（Ｈ．２６４／ＡＶＣまたはＨＥＶＣ内で指定された空間イントラ予測モードなど）への入力として使用される。矢印７４４によって示された空間イントラ予測によって、予測されるべきブロック２８の異なる成分ための予測信号７４６が発生する。特定の実施の形態では、空間イントラ予測処理（Ｈ．２６４／ＡＶＣまたはＨＥＶＣから周知であるように）のどんなクリップ機能も、差分信号７３４の動的範囲と整合するために変更される、あるいは無効にされる。実際に使用されたイントラ予測方法（複数の提供された方法の１つであり、どんな特定の角度も有する平面イントラ予測、ＤＣイントラ予測、または、方向イントラ予測７４４を含むことができる）は、ビットストリーム６ｂ内でシグナリングされる。Ｈ．２６４／ＡＶＣとＨＥＶＣに提供された方法と異なる空間イントラ予測技術（既に符号化された隣接するブロックのサンプルを使用して、予測信号を発生させるための方法）を使用することが可能である。（隣接するブロックの差分サンプルを使用して、）得られた予測ブロック７４６は、最終予測ブロック４２０の最初の部分である。

予測信号の第２の部分が、ベース層の再構成された信号２００内の併置された領域２８を使用して発生する。品質エンハンスメント層に対して、併置されたベース層のサンプルが、直接に使用される、または、例えば、ローパスフィルタまたは高周波成分を減衰させるフィルタ５００によって、オプションでフィルタにかけられる。空間エンハンスメント層に対して、併置されたベース層のサンプルがアップサンプリングされる。アップサンプリング２２０のために、ＦＩＲフィルタまたはＦＩＲフィルタのセットが使用され得る。ＩＩＲフィルタも使用できる。オプションで、再構成されたベース層のサンプル２００が、アップサンプリング前にフィルタにかけられ得る。または、ベース層予測信号（ベース層をアップサンプリングした後に得られた信号）が、アップサンプリング段の後にフィルタにかけられる。ベース層の再構成の処理は、非ブロック化フィルタ（１２０と比べて）や適応型のループフィルタ（１４０と比べて）などの１個以上の追加フィルタを含むことができる。アップサンプリングのために使用されるベース層再構成２００は、いずれかのループフィルタの前の再構成信号であり得る（２００ｃと比べて）。あるいは、それは、非ブロック化フィルタの後、しかし、いずれかの別のフィルタの前の再構成信号であり得る（２００ｂと比べて）。あるいはそれは、特定のフィルタの後の再構成信号、または、ベース層復号化処理で使用される全てのフィルタを適用した後の再構成信号である（２００ａと比べて）。

予測信号の２つの発生部分（空間的に予測された差分信号７４６と潜在的にフィルタにかけられた／アップサンプリングされたベース層再構成３８０）が、最終予測信号４２０を形成するために、サンプルごとに追加７３２される。

ちょうど概説した態様を図６～図１０の実施の形態に転用することは、エンハンスメント層信号の現在のブロックを予測することのちょうど概説された可能性が、図６～図１０に関して概説された予測スキームに代わるものとして、それぞれのスケーラブルビデオデコーダ／エンコーダによってサポートされるということであり得る。使用されるモードが、図８に示されないそれぞれの予測モード識別子を経由して、エンハンスメント層サブストリーム６ｂ内でシグナリングされる。

特定の実施の形態において、イントラ予測は層間残差予測に続く（実施例Ｂ参照）。ベース層データを使用してイントラ予測信号を発生させるための複数の方法は、以下の方法を含む。（隣接する再構成されたエンハンスメント層のサンプルを使用して導出された）従来の空間イントラ予測信号は、（アップサンプリングされた／フィルタにかけられた）ベース層残差信号（ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差）に結合される。

図２６は、（アップサンプリングされた／フィルタにかけられた）ベース層残差信号７５４（ＢＬＲｅｓｉ）と、点線７６２で記載された既に符号化された隣接ブロックの再構成されたエンハンスメント層のサンプル７５８（ＥＨＲｅｃｏ）を使用する空間イントラ予測７５６との合計７５２による、層間イントラ予測信号４２０の発生を示す。

図２６に示された概念は、２つの予測信号を重ねて、予測ブロック４２０を形成する。そこでは、一方の予測信号７６４が、既に再構成されたエンハンスメント層サンプル７５８から発生し、他方の予測信号７５４が、ベース層残差サンプル４８０から発生する。予測信号４２０の第１の部分７６４が、再構成されたエンハンスメント層サンプル７５８を使用して、空間イントラ予測７５６を適用することによって導出される。空間イントラ予測７５６は、Ｈ．２６４／ＡＶＣ内で指定された方法の１つであり得る。または、ＨＥＶＣ内で指定された方法の１つである。あるいは、それは、隣接するブロック７６２のサンプル７５８を形成する現在のブロック１８のために、予測信号７６４を発生する別の空間イントラ予測技術であり得る。実際に使用されたイントラ予測方法７５６（複数の提供された方法の１つであり、平面イントラ予測、ＤＣイントラ予測、または、どんな特定の角度も有する方向イントラ予測を含むことができる）は、ビットストリーム６ｂ内でシグナリングされる。Ｈ．２６４／ＡＶＣとＨＥＶＣとに提供された方法と異なる空間イントラ予測技術（既に符号化された隣接するブロックのサンプルを使用して、予測信号を発生させるための方法）を使用することが可能である。予測信号４２０の第２の部分７５４が、ベース層の併置された残差信号４８０を使用して発生する。品質エンハンスメント層に対して、残差信号が、ベース層内で再構成されるように使用し得る。または、残差信号は、追加してフィルタにかけることができる。空間エンハンスメント層４８０に対して、残差信号は、それが予測信号の第２の部分として使用される前に、（ベース層サンプル位置をエンハンスメント層サンプル位置に写像するために、）アップサンプリング２２０される。また、ベース層残差信号４８０は、アップサンプリングステージの前または後に、フィルタにかけることができる。残差信号をアップサンプリング２２０するために、ＦＩＲフィルタが適用され得る。アップサンプリング処理は、アップサンプリングの目的のために適用されるベース層内の変換ブロック境界を横切ってフィルタにかけられない方法で、構成され得る。

層間予測のために使用されるベース層残差信号４８０は、スケーリングおよび逆変換５６０によって、ベース層の変換係数レベルが得られる残差信号であり得る。または、ベース層残差信号４８０は、再構成されたベース層信号２００（非ブロック化および追加フィルタリングの前または後、あるいは、どんなフィルタリング操作の間でも）と、ベース層内で使用された予測信号６６０との間の差であり得る。

２つの発生した信号成分（空間イントラ予測信号７６４と層間残差予測信号７５４）は、加算７５２され、最終エンハンスメント層イントラ予測信号を形成する。

これは、図２６に関してちょうど概説した予測モードが、現在の符号化／復号化された部分２８に対して、図６～図１０に関して上述した代替予測モードを形成するために、図６～図１０に従ってどんなスケーラブルビデオデコーダ／エンコーダでも使用され得る、または、サポートされる、という意味である。

特定の実施の形態において、空間イントラ予測とベース層再構成との重み付けされた予測（態様Ｃ参照）が、使用される。これは、図６～図１０に関して上で概説された実施の形態の特定の実装を上で発表した明細書を、および従って、上の実施の形態の代替としてだけでなく、所定の態様と異なって図６～図１０に関して上で概説された実施の形態を実装する方法の可能性の記述としても解釈された、そのような重み付けされた予測に関する記述を、実際に表わす。

ベース層データを使用して、イントラ予測信号を発生させるための多重方法は、以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、空間イントラ予測信号に結合される。そこでは、空間イントラ予測が、隣接するブロックの再構成されたエンハンスメント層のサンプルに基づいて導出される。最終予測信号は、異なる周波数成分が異なる重み付けを使用する方法で、空間予測信号とベース層予測信号とが重み付け（４１と比べて）されることによって、得られる。これは、例えば、ローパスフィルタでベース層予測信号（３８と比べて）にフィルタをかけ（６２と比べて）、かつ、ハイパスフィルタで空間イントラ予測信号（３４と比べて）にフィルタをかけ（６４と比べて）て、そして、得られたフィルタにかけられた信号を追加する（６６と比べて）ことによって、実現され得る。または、周波数に基づいた重み付けが、ベース層予測信号（３８と比べて）とエンハンスメント層予測信号（３４と比べて）とを変換（７２、７４と比べて）し、得られた変換ブロック（７６、７８と比べて）を重ねることによって、実現でき、異なる重み付け係数（８２、８４と比べて）は、異なる周波数位置に対して使用される。次に、得られた変換ブロック（図１０の４２と比べて）は、逆変換（８４と比べて）され、エンハンスメント層予測信号（５４と比べて）として使用される。あるいは、得られた変換係数は、スケーリングされた送信された変換係数レベル（５９と比べて）に追加（５２と比べて）され、そして、非ブロック化およびループ内処理の前に、再構成されたブロック（５４と比べて）を得るために、逆変換（８４と比べて）される。

図２７は、（アップサンプリングされた／フィルタにかけられた）ベース層再構成信号（ＢＬＲｅｃｏ）と、既に符号化された隣接するブロックの再構成されたエンハンスメント層のサンプル（ＥＨＲｅｃｏ）を使用する空間イントラ予測との周波数重み付けされた合計による、層間イントラ予測信号の生成を示す。

図２７の概念は、２つの重畳信号７７２、７７４を使用して予測ブロック４２０を形成する。信号４２０の第１の部分７７４が、エンハンスメント層内の既に構成された隣接するブロックの再構成されたサンプル７７８を使用して、図６の３０に対応している空間イントラ予測７７６を適用することによって導出される。予測信号４２０の第２の部分７７２が、ベース層の併置された再構成された信号２００を使用して生成される。品質エンハンスメント層に対して、併置されたベース層サンプル２００が、直接に使用される。または、それらは、例えば、ローパスフィルタまたは高周波成分を減衰させるフィルタによって、オプションでフィルタにかけられ得る。空間エンハンスメント層に対して、併置されたベース層のサンプルが、アップサンプリング２２０される。アップサンプリングのために、ＦＩＲフィルタまたはＦＩＲフィルタのセットが使用され得る。また、ＩＩＲフィルタを使用することも可能である。オプションで、再構成されたベース層のサンプルが、アップサンプリングの前にフィルタにかけられる。あるいは、ベース層予測信号（ベース層をアップサンプリングした後に得られた信号）が、アップサンプリング段階の後にフィルタにかけられ得る。ベース層の再構成の過程は、非ブロック化フィルタ１２０や適応型ループフィルタ１４０などの１つ以上の追加フィルタを含むことができる。アップサンプリングのために使用されるベース層再構成２００は、いずれかのループフィルタ１２０、１４０の前の再構成信号２００ｃであり得る。あるいは、それは、非ブロック化フィルタ１２０の後、しかし、別のフィルタの前の再構成信号２００ｂであり得る。あるいは、それは、特定のフィルタの後の再構成信号２００ａ、または、ベース層復号化処理で使用される全てのフィルタ１２０、１４０を適用した後の再構成信号であり得る。

図２３と図２４で使用された参照符号と、図６～図１０に関連して使用された参照符号とが比較されるとき、ブロック２２０は、図６で使用された参照符号３８に対応している。３９は、３８０の部分に対応している。少なくとも、現在の部分２８に併置された部分に関する限り、現在の部分２８に併置された４２０は、４２に対応している。空間予測７７６は、３２に対応する。

２つの予測信号（潜在的にアップサンプリングされた／フィルタにかけられたベース層再構成３８６とエンハンスメント層イントラ予測７８２）が、最終予測信号４２０を形成するように結合される。これらの信号を結合するための方法は、異なる重み付け因子が異なる周波数成分のために使用されるという特性を有することができる。特定の実施の形態では、アップサンプリングされたベース層再構成は、ローパスフィルタ（６２と比べて）でフィルタにかけられる（また、アップサンプリング２２０の前にベース層再構成をフィルタにかけることも可能である）。そして、イントラ予測信号（３０によって得られた３４と比べて）は、ハイパスフィルタ（６４と比べて）でフィルタにかけられる。両方のフィルタにかけられた信号は、追加７８４（６６と比べて）されて、最終予測信号４２０を形成する。ローパスフィルタとハイパスフィルタの一対は、直交ミラーフィルタ対を表わし得るけれども、これは必ずしも必要ではない。

別の特定の実施の形態（図１０と比べて）において、２つの予測信号３８０と７８２との結合処理は、空間変換を介して実現される。（潜在的にアップサンプリングされた／フィルタにかけられた）ベース層再構成３８０とイントラ予測信号７８２との両方が、空間変換を使用して変換（７２、７４と比べて）される。次に、両方の信号の変換係数（７６、７８と比べて）は、適切な重み付け係数（８２、８４と比べて）でスケーリングされて、次に、追加（９０と比べて）され、最終予測信号の変換係数ブロック（４２と比べて）を形成する。１つのバージョンにおいて、重み付け係数（８２、８４と比べて）は、それぞれの変換係数位置に対して、両方の信号の成分のための重み付け係数の合計が１と等しいように選択される。別のバージョンにおいて、いくつかのまたは全ての変換係数位置に対して、重み付け係数の合計が１に等しくない。特定のバージョンにおいて、重み付け係数が、低周波数成分を表わす変換係数に対して、ベース層再構成のための重み付け係数は、エンハンスメント層イントラ予測信号のための重み付け係数より大きく、そして、高周波成分を表す変換係数に対して、ベース層再構成のための重み付け係数が、エンハンスメント層イントラ予測信号のための重み付け係数より小さくなる方法で選択される。

１つの実施の形態において、（両方の成分に対して、重み付けされた変換された信号をまとめることによって得られた）得られた変換係数ブロック（４２と比べて）は、逆変換（８４と比べて）されて、最終予測信号４２０（５４と比べて）を形成する。別の実施の形態において、予測は変換領域内で直接になされる。すなわち、符号化された変換係数レベル（５９と比べて）は、スケーリングされ（すなわち、逆量子化され）て、（両方の成分について重み付けされた変換信号を加算することによって得られた）予測信号の変換係数（４２と比べて）、および、次に、（図１０では示されていないけれども、（潜在的非ブロック化１２０とさらにループ内フィルタリングステップ１４０の前に、）逆変換（８４と比べて）される）変換係数の結果として起こるブロックに追加（５２と比べて）されて、現在のブロックのための再構成された信号４２０が得られる。換言すれば、最初の実施の形態では、両方の成分のための重み付けされた変換信号を加算することによって得られた変換ブロックは、逆変換されてエンハンスメント層予測信号として使用され得る。あるいは、２番目の実施の形態では、スケーリングされた送信された変換係数レベルに追加されて、非ブロック化とループ内処理との前に再構成されたブロックを得るために、逆変換され得る。

ベース層再構成と残差信号との選択（態様Ｄ参照）も使用され得る。再構成されたベース層信号を使用する（上述したように）方法について、以下のバージョンが使用される。

・非ブロック化１２０とさらにループ内処理１４０（サンプル適応型オフセットフィルタまたは適応ループフィルタなど）の前の再構成されたベース層サンプル２００ｃ。
・非ブロック化１２０の後、しかし、別のループ内処理１４０（サンプル適応オフセットフィルタまたは適応ループフィルタなど）の前の再構成されたベース層サンプル２００ｂ。
・非ブロック化１２０とさらにループ内処理１４０（サンプル適応オフセットフィルタまたは適応ループフィルタなど）後の、または、複数のループ内処理ステップの間の再構成されたベース層サンプル２００ａ。

対応するベース層信号２００ａ、ｂ、ｃの選択は、特定のデコーダ（そして、エンコーダ）の実装のために固定され得る。または、それは、ビットストリーム６内でシグナリングされ得る。後者の場合に対して、異なるバージョンが使用され得る。ベース層信号の特定のバージョンの使用が、系列レベルにおいて、または、画像レベルにおいて、または、スライスレベルにおいて、または、最も大きい符号化単位レベルにおいて、または、符号化単位レベル、または、予測ブロックレベルにおいて、または、変換ブロックレベルにおいて、または、いかなる別のブロックレベルにおいてもシグナリングされ得る。別のバージョンでは、選択は、（符号化モードのような）別の符号化パラメータに、または、ベース層信号の特性に依存し得るようにすることができる。

別の実施の形態では、（アップサンプリングされた／フィルタにかけられた）ベース層信号２００を使用する方法の複数のバージョンが、使用され得る。例えば、アップサンプリングされたベース層信号（すなわち、２００ａ）を直接に使用する２つの異なるモードが、提供され得る。そこでは、２つのモードは、異なる補間フィルタを使用し得る。または、１つのモードが、（アップサンプリングされた）ベース層再構成信号の追加フィルタリング５００を使用する。同様に、前述した別の他のモードのための複数の異なるバージョンが、提供され得る。モードの異なるバージョンのために採用されたアップサンプリングされた／フィルタにかけられたベース層信号３８０が、使用された補間フィルタ（整数サンプル位置もフィルタにかける補間フィルタを含む）内で異なり得る。または、第２のバージョンのためのアップサンプリングされた／フィルタにかけられたベース層信号３８０が、第１のバージョンのためのアップサンプリングされた／フィルタにかけられたベース層信号をフィルタにかけること５００によって、得られ得る。異なるバージョンの１つの選択が、系列、画像、スライス、最大符号化単位、符号化単位レベル、予測ブロックレベル、または変換ブロックレベルでシグナリングされ得る。あるいは、それは、対応する再構成されたベース層信号または送信された符号化パラメータの特性から推論され得る。

同様のことが、４８０を経由して、再構成されたベース層残差信号を使用するモードに適用される。ここで、使用された補間フィルタまたは追加フィルタリングステップと異なるバージョンも使用され得る。

異なるフィルタが、再構成されたベース層信号とベース層残差信号とをアップサンプリングする／フィルタにかけるために使用され得る。それは、ベース層残差信号をアップサンプリングするために、異なるアプローチが、ベース層再構成信号のアップサンプリングより使用されることを意味する。

ベース層ブロックに対して、残差信号はゼロである（すなわち、変換係数レベルは、全くブロックに送信されない）。対応するベース層残差信号は、ベース層から導出された別の信号と置き替えられ得る。例えば、これは、再構成されたベース層ブロックのハイパスフィルタバージョン、または、隣接するブロックの再構成されたベース層サンプルまたは再構成されたベース層残差サンプルから導出される他の差分的な信号とすることができる。

エンハンスメント層内の空間イントラ予測のために使用されるサンプル（態様Ｈ参照）に関する限り、以下の特別な処理が提供される。空間イントラ予測を使用するモードについて、エンハンスメント層内の利用できない隣接するサンプル（隣接するブロックは、現在のブロックの後に符号化されるので、隣接するサンプルは利用できない）が、アップサンプリングされた／フィルタにかけられたベース層信号の対応するサンプルに置き替えられ得る。

イントラ予測モードの符号化（態様Ｘ参照）に関する限り、以下の特別なモードと機能性が提供され得る。３０ａのような空間イントラ予測を使用するモードに対して、イントラ予測モードの符号化は、（仮に、利用可能であるならば、）ベース層内のイントラ予測モードについての情報が、エンハンスメント層内のイントラ予測モードをより効率的に符号化するために使用される方法で変更され得る。これは、例えば、パラメータ５６のために使用され得る。仮に、ベース層内の併置された領域（３６と比べて）が、特定の空間イントラ予測モードを使用して、イントラ符号化されるならば、同様のイントラ予測モードが、エンハンスメント層ブロック（２８と比べて）内で使用されそうである。イントラ予測モードは、通常、可能なイントラ予測モードのセット内で、１つ以上のモードが、最尤モードとして分類される方法でシグナリングされる。そこでは、より短い符号語でシグナリングされ得る。あるいは、それ以下の算術符号化判定で、より少ないビット数になる。ＨＥＶＣのイントラ予測内で、（仮に、利用可能であるならば）上のブロックのイントラ予測モードと、（仮に、利用可能であるならば）左のブロックのイントラ予測モードとは、最尤モードのセット内に含まれる。これらのモードに追加して、１つ以上の追加モード（しばしば使用される）が、最尤モードのリスト内に含められる。そこでは、実際の追加モードが、現在のブロックの上のブロックおよび現在のブロックの左のブロックのイントラ予測モードの有用性に依存する。ＨＥＶＣ内で、３つのモードが、最尤モードとして正確に分類される。Ｈ．２６４／ＡＶＣ内で、１つのモードが、最尤モードとして分類される。このモードは、現在のブロックの上のブロックおよび現在のブロックの左のブロックのために使用されるイントラ予測モードに基づいて導出される。イントラ予測モードを分類するためのいかなる他の概念（Ｈ．２６４／ＡＶＣとＨＥＶＣとは異なる）も可能であり、以下の拡張のために使用され得る。

エンハンスメント層内のイントラ予測モードの効率的符号化に対してベース層データを使用するために、１つ以上の最尤モードを使用する概念が、（仮に、対応するベース層ブロックが、イントラ符号化されるならば、）最尤モードが併置されたベース層ブロック内で使用されたイントラ予測モードを含む方法で、変更される。特定の実施の形態において、以下のアプローチが使用され得る。現在のエンハンスメント層ブロックが与えられると、併置されたベース層ブロックが決定される。特定のバージョンでは、併置されたベース層ブロックは、エンハンスメントブロックの左上サンプルの併置された位置をカバーするベース層ブロックである。別のバージョンでは、併置されたベース層ブロックが、エンハンスメントブロックの中央部のサンプルの併置された位置をカバーするベース層ブロックである。他のバージョンでは、エンハンスメント層ブロック内の別のサンプルが、併置されたベース層ブロックを決定するために使用され得る。仮に、決定された併置されたベース層ブロックがイントラ符号化され、ベース層イントラ予測モードが角度イントラ予測モードを指定して、現在のエンハンスメント層ブロックの左側のエンハンスメント層ブロックから導出されたイントラ予測モードが、角度イントラ予測モードを使用しないならば、左のエンハンスメント層ブロックから導出されたイントラ予測モードは、対応するベース層イントラ予測モードに取替えられる。さもなければ、仮に、決定された併置されたベース層ブロックは、イントラ符号化され、ベース層イントラ予測モードは、角度イントラ予測モードを指定し、現在のエンハンスメント層ブロックの上のエンハンスメント層ブロックから導出されたイントラ予測モードは、角度イントラ予測モードを使用しないならば、上記のエンハンスメント層ブロックから導出されたイントラ予測モードは、対応するベース層イントラ予測モードに取り替えられる。他のバージョンでは、ベース層イントラ予測モードを使用して、（単一要素から成る）最尤モードのリストを変更するための異なるアプローチが使用される。

空間かつ品質のエンハンスメント層のためのインター符号化技術が、次に、提供される。

最先端のハイブリッドビデオ符号化規格（Ｈ．２６４／ＡＶＣまたは今度のＨＥＶＣなど）において、画像系列の画像が、サンプルのブロックに分割される。ブロックサイズは、固定され得る、または、符号化手法が、ブロックを、より小さいブロックサイズを有するブロックに更にサブ分割することを可能にする階層構造を提供し得る。ブロックの再構成は、通常、ブロックのための予測信号を発生させて、送信された残差信号を追加することによって得られる。残差信号は、通常、変換符号化を使用して送信され、それは、変換係数（また、変換係数レベルとも呼ばれる）のための量子化インデックスが、エントロピー符号化技術を使用して送信されることを意味する。そして、デコーダ側では、これらの送信された変換係数レベルは、スケーリングされ、そして、逆変換されて、予測信号に追加される残差信号が得られる。残差信号は、（現在の時刻のために既に送信されたデータのみを使用して）イントラ予測によって、または、（異なる時刻のために既に送信されたデータを使用して）インター予測のいずれかによって発生する。

インター予測において、予測ブロックは、既に再構成されたフレームのサンプルを使用して、動き補償予測によって導出される。これは、（１つの参照画像と１セットの動きパラメータを使用して）単方向の予測によってなされる。または、予測信号は、多重仮説予測によって発生させることができる。後者の場合、２つ以上の予測信号が重畳される。すなわち、各サンプルに対して、重み付け平均が、最終予測信号を形成するために構成される。（重畳される）多重予測信号は、異なる仮説のための異なる動きパラメータ（例えば、異なる参照画像または動きベクトル）を使用して、発生され得る。また、単方向の予測に対して、一定の係数を有する動き補償予測信号のサンプルを掛けて、最終予測信号を形成するために一定のオフセットを追加することも可能である。また、そのようなスケーリングとオフセット補正が、多重仮説予測内の全てのまたは選択された仮説のために使用され得る。

スケーラブルビデオ符号化内でも、ベース層情報が、エンハンスメント層のためのインター予測処理をサポートするために利用され得る。スケーラブル符号化のための最先端のビデオ符号化規格、Ｈ．２６４／ＡＶＣのＳＶＣ拡張は、エンハンスメント層内のインター予測処理の符号化効率を向上させるための１つの追加モードが存在する。このモードは、マクロブロックレベル（１６×１６個のｌｕｍａサンプルのブロック）でシグナリングされる。このモード内で、低層内の再構成された残差サンプルは、エンハンスメント層内の動き補償予測信号を改良するために使用される。このモードは、層間の残差予測とも呼ばれる。仮に、このモードが、品質エンハンスメント層内のマクロブロックのために選択されるならば、層間予測信号は、再構成された低層残差信号の併置されたサンプルによって組立てられる。仮に、層間残差予測モードが、空間エンハンスメント層内で選択されるならば、予測信号は、併置された再構成されたベース層残差信号をアップサンプリングすることによって発生する。アップサンプリングに対して、ＦＩＲフィルタが使用される。しかし、フィルタリングは、変換ブロック境界を横切って適用されない。再構成されたベース層残差のサンプルから発生する予測信号は、従来の動き補償予測信号に追加されて、エンハンスメント層ブロックのための最終予測信号を形成する。一般的に、層間残差予測モードに対して、追加残差信号が、変換符号化によって送信される。残差信号の送信は、仮に、それがビットストリーム内で対応してシグナリングされるならば、省略され得る（ゼロに等しいと推論される）。最終再構成信号は、送信された変換係数レベルをスケーリングして、逆空間変換を適用することによって得られる再構成された残差信号を、予測信号に追加することによって得られる。そこでは、層間残差予測信号を動き補償予測信号に追加することによって得られる。

次に、エンハンスメント層信号のインター符号化のための技術が説明される。このセクションは、スケーラブルビデオ符号化シナリオ内で符号化されるべきエンハンスメント層信号をイントラ予測するために、既に再構成されたエンハンスメント層信号に加えて、ベース層信号を使用するための方法を説明する。符号化されるべきエンハンスメント層信号をインター予測するためのベース層信号を使用することによって、予測誤差が十分に抑えられ得る。それは、エンハンスメント層の符号化に対して節約する総合的なビットレートをもたらす。このセクションの主な焦点は、ベース層からの追加信号を有する既に符号化されたエンハンスメント層のサンプルを使用して、エンハンスメント層のサンプルのブロックベースの動き補償を増大させることである。以下の記述は、符号化されたベース層から様々な信号を使用するための可能性を提供する。四分木ブロックパーティションが、好ましい実施の形態として、一般に採用されるけれども、提示された例は、どんな特定のブロックパーティションも仮定することなく、一般的なブロックベースのハイブリッド符号化アプローチに応用される。現在の時間インデックスのベース層再構成、現在の時間インデックスのベース層残差、または、符号化されるべきエンハンスメント層ブロックのインター予測のための既に符号化された画像のベース層再構成の使用さえ説明される。また、現在のエンハンスメント層についての、より良い予測を得るために、ベース層信号が既に符号化されたエンハンスメント層信号と結合できる方法が説明される。
最先端の主な技術の１つは、Ｈ．２６４／ＳＶＣ内の層間残差予測である。Ｈ．２６４／ＳＶＣ内の層間残差予測は、それらがベースモードフラグまたは従来のマクロブロックタイプのどれかを使用することによってシグナリングされたＳＶＣマクロブロックタイプを使用して、符号化されるか否かに関係なく、全てのインター符号化されたマクロブロックに対して採用され得る。フラグは、空間および品質のエンハンスメント層のためのマクロブロック構文（層間残差予測の用法をシグナリングする）に追加される。この残差予測フラグが１と等しいとき、参照層内の対応する領域の残差信号が、双線型フィルタを使用してブロック的にアップサンプリングされ、エンハンスメント層マクロブロックの残差信号のための予測として使用される。その結果、対応する差分信号だけが、エンハンスメント層内で符号化される必要がある。
このセクションの記述について、以下の記法が使用される。
ｔ₀：＝現在の画像の時間インデックス
ｔ₁：＝既に再構成された画像の時間インデックス
ＥＬ：＝エンハンスメント層
ＢＬ：＝ベース層
ＥＬ（ｔ₀）：＝符号化されるべき現在のエンハンスメント層画像
ＥＬ＿ｒｅｃｏ：＝エンハンスメント層再構成
ＢＬ＿ｒｅｃｏ：＝ベース層再構成
ＢＬ＿ｒｅｓｉ：＝ベース層残差信号（ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差）
ＥＬ＿ｄｉｆｆ：＝エンハンスメント層再構成と、アップサンプリングされた／フィルタにかけられたベース層再構成との間の差
異なるベース層信号とエンハンスメント層信号とは、図２８内で説明された記載内で使用される。

記述に対して、フィルタの以下の特性が使用される。
・直線性：明細書内で言及した多くのフィルタが直線的であるけれども、非線形のフィルタも使用され得る。
・出力サンプルの数：アップサンプリング操作において、出力サンプルの数は、入力サンプルの数より大きい。ここで、入力データのフィルタリングは、入力値より多いサンプルを作り出す。従来のフィルタリングでは、出力サンプルの数は、入力のサンプルの数と等しい。そのようなフィルタリング操作は、例えば、高品質スケーラブル符号化内で使用され得る。
・位相遅延：整数位置でのサンプルのフィルタリングに対して、位相遅延は、通常、ゼロ（または、サンプル内の整数値の遅延）である。断片的な位置（例えば、半ペルの位置または４分の１ペルの位置）のサンプルの発生に対して、通常、（サンプルの単位内の）断片的な遅延を有するフィルタが、整数格子のサンプルに適用される。

全てのハイブリッドビデオ符号化規格（例えば、ＭＰＥＧ－２、Ｈ．２６４／ＡＶＣ、または、今度のＨＥＶＣ規格）に使用された従来の動き補償予測は、図２９で説明される。現在のブロックの信号を予測するために、既に再構成された画像の領域は、予測信号として置き換えられて、使用される。置き換えのシグナリングのために、動きベクトルが、ビットストリーム内で、通常、符号化される。整数サンプルの精度動きベクトルに対して、参照画像内の参照領域が直接にコピーされ得て予測信号を形成する。しかしながら、分数サンプルの精度動きベクトルを送信することも可能である。この場合、予測信号が、断片的なサンプル遅延を有するフィルタで、参照信号をフィルタリングすることによって得られる。使用された参照画像は、通常、参照画像インデックスを、ビットストリーム構文に含めることによって指定され得る。一般に、最終予測信号を形成するために、２つ以上の予測信号を重畳することも可能である。概念は、例えば、２つの動き仮説で、Ｂスライス内でサポートされる。この場合、多重予測信号は、異なる仮説に対する異なる動きパラメータ（例えば、異なる参照画像または動きベクトル）を使用して発生する。単一方向の予測について、最終予測信号を形成するために一定の要因を有する動き補償予測信号のサンプルを掛けて、一定のオフセットを加えることも可能である。そのようなスケーリングとオフセット補正が、また、マルチ仮説予測内の全てまたは選択された仮説のためにも使用され得る。

以下の記述は、品質エンハンスメント層を有するスケーラブル符号化（エンハンスメント層は、ベース層と同じ解像度を持っているけれども、より高い品質または忠実度を有する入力ビデオを表わす）、および、空間エンハンスメント層を有するスケーラブル符号化（エンハンスメント層は、ベース層より高い解像度、すなわち、サンプルのより大きな数を持っている）に適用される。品質エンハンスメント層に対して、ベース層信号のアップサンプリングは必要でないけれども、再構成されたベース層のサンプルのフィルタリングは適用され得る。空間エンハンスメント層の場合、ベース層信号のアップサンプリングが一般に必要である。

実施の形態は、エンハンスメント層ブロックのインター予測のために、再構成されたベース層サンプルまたはベース層残差サンプルを使用するための異なる方法をサポートする。従来のインター予測とイントラ予測とを追加して、以下に記載された１つ以上の方法をサポートすることが可能である。特定の方法の使用法が、最も大きくサポートされたブロックサイズ（Ｈ．２６４／ＡＶＣ内のマクロブロック、または、ＨＥＶＣ内の符号化ツリーブロック／最大符号化単位など）のレベルでシグナリングされ得る。それは、全てのサポートされたブロックサイズでシグナリングされ得る。または、それは、サポートされたブロックサイズのサブセットのためにシグナリングされ得る。

以下で記載された全ての方法に対して、予測信号が、ブロックのための再構成信号として、直接に使用され得る。あるいは、層間インター予測のための選択された方法が、残差符号化と結合され得る。特定の実施の形態において、残差信号は、変換符号化を経由して送信される。そして、すなわち、量子化変換係数（変換係数レベル）は、エントロピー符号化技術（例えば、可変長符号化または算術符号化）を使用して送信され、そして、残差が、送信された変換係数レベルを逆量子化（スケーリング）して、逆変換を適用することによって得られる。特定のバージョンでは、層間インター予測信号が発生するブロックに対応する完全な残差ブロックが、単一の変換を使用して変換される。すなわち、全体のブロックが、予測ブロックと同じサイズの単一の変換を使用して変換される。別の実施の形態では、予測ブロックが、例えば、階層的な分解を使用して、より小さいブロックに更にサブ分割され得る。そして、それぞれの異なるブロックサイズを有する、より小さいブロックに対して、別々の変換が適用される。別の実施の形態では、符号化単位は、より小さい予測ブロックに分割され得る。そして、予測ブロックのゼロ以上に対して、予測信号が、層間インター予測のための方法の１つを使用して発生する。そして、次に、全体の符号化単位の残差が、単一の変換を使用して変換される。または、符号化単位は、異なる変換単位にサブ分割される。そこでは、変換単位（単一の変換が適用されるブロック）を形成するためのサブ分割が、符号化単位を予測ブロックに分解するためのサブ分割とは異なる。

以下では、ベース層残差とエンハンスメント層再構成を使用して、予測を実行する可能性が説明される。多重方法は以下の方法を含む。（既に再構成されたエンハンスメント層の動き補償された画像の補間によって得られた）従来のインター予測信号は、（アップサンプリングされた／フィルタにかけられた）ベース層残差信号（ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差）に結合される。この方法は「ＢＬ＿ｒｅｓｉ」モード（図３０に例えて）とも呼ばれる。

要するに、エンハンスメント層のサンプルのための予測が、以下に記載され得る。
ＥＬｐｒｅｄｉｃｔｉｏｎ＝ｆｉｌｔｅｒ（ＢＬ＿ｒｅｓｉ（ｔ₀））＋ＭＣＰ＿ｆｉｌｔｅｒ（ＥＬ＿ｒｅｃｏ（ｔ₁））
エンハンスメント層再構成信号の２つ以上仮説が使用されることも、可能である。例えば、
ＥＬｐｒｅｄｉｃｔｉｏｎ＝ｆｉｌｔｅｒ（ＢＬ＿ｒｅｓｉ（ｔ₀））＋ＭＣＰ＿ｆｉｌｔｅｒ１（ＥＬ＿ｒｅｃｏ（ｔ₁））＋ＭＣＰ＿ｆｉｌｔｅｒ２（ＥＬ＿ｒｅｃｏ（ｔ₂））
エンハンスメント層（ＥＬ）参照画像の上で使用される動き補償予測（ＭＣＰ）フィルタは、整数または断片的なサンプル精度のものである。ＥＬ参照画像の上で使用されるＭＣＰフィルタは、ＢＬ復号化処理の間に、ＢＬ参照画像の上で使用されるＭＣＰフィルタと同じ、または、異なる。
動きベクトルＭＶ（ｘ、ｙ、ｔ）は、ＥＬ参照画像内の特定の位置を示すために定義される。パラメータｘとｙが、画像内の空間位置を示す。パラメータｔは、参照画像の時間インデックスを記述するために使用され、参照インデックスとも呼ばれる。しばしば、動きベクトルという用語は、２つの空間成分（ｘ、ｙ）だけについて言及するために使用される。ＭＶの整数部分は、参照画像からの１セットのサンプルを取ってくるために使用される。そして、ＭＶの分数部分は、１セットのフィルタからＭＣＰフィルタを選択するために使用される。取得された参照サンプルは、フィルタリングされて、フィルタリングされた参照サンプルを作り出す。動きベクトルは、一般に、異なる予測を使用して符号化される。それは、動きベクトル予測器が、既に符号化された動きベクトル（そして、構文要素が、潜在的動きベクトル予測器のセットの使用された１つを、潜在的に示す）に基づいて導出され、そして、異なるベクトルが、ビットストリーム内に含まれていることを意味する。最終動きベクトルは、送信された動きベクトル差を、動きベクトル予測器に加えることによって得られる。通常、ブロックのための動きパラメータを完全に導出することも可能である。従って、通常、潜在的動きパラメータ候補のリストは、既に符号化されたデータに基づいて構成される。このリストは、参照フレーム内の併置されたブロック内の動きパラメータに基づいて導出される動きパラメータと同様に、空間的に隣接するブロックの動きパラメータを含むことができる。
ベース層（ＢＬ）残差信号は、以下の１つと定義できる。
ＢＬ変換係数の逆変換、または、
・ＢＬ再構成とＢＬ予測との間の差、または、
・ＢＬ変換係数の逆変換がゼロであるＢＬブロックに対して、それは、ＢＬ（例えば、再構成されたＢＬブロックのハイパスフィルタにかけられたバージョン）から導出された別の信号に取替えることができる、または、
・上の方法の組合せ。
現在のＢＬ残差からＥＬ予測要素を計算するために、ＥＬ画像内の考慮される領域と併置されたＢＬ画像内の領域が特定され、そして、残差信号が、特定されたＢＬ領域から取り出される。併置された領域の定義は、それが、ＢＬ解像度の整数のスケーリング係数（例えば、２×スケーラビリティ）、または、ＢＬ解像度の小数スケーリング係数（例えば、１．５×スケーラビリティ）を説明するように作られ得る。または、ＢＬ解像度と同じＥＬ解像度（例えば、品質スケーラビリティ）を生み出すことさえできる。品質スケーラビリティの場合、ＢＬ画像内の併置されたブロックは、予測されるべきＥＬブロックと同じ座標を有する。
併置されたＢＬ残差は、アップサンプリングされる／フィルタにかけることができ、フィルタにかけられたＢＬ残差サンプルを発生する。
最終ＥＬ予測は、フィルタにかけられたＥＬ再構成サンプルと、フィルタにかけられたＢＬ残差サンプルとを加えることによって得られる。

ベース層再構成とエンハンスメント層差分信号（実施例Ｊ参照）を使用する予測に関する多重方法は、以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、動き補償予測信号に結合される。そこでは、動き補償予測信号が、動作補償差分画像によって得られる。差分画像は、参照画像に対して、再構成されたエンハンスメント層信号と、（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号との差を表わす。この方法は、ＢＬ＿ｒｅｃｏモードとも呼ばれる。

この概念は図３１で説明される。要するに、ＥＬサンプルのための予測が、以下に記載される。
ＥＬｐｒｅｄｉｃｔｉｏｎ＝ｆｉｌｔｅｒ（ＢＬ＿ｒｅｃｏ（ｔ₀））＋ＭＣＰ＿ｆｉｌｔｅｒ（ＥＬ＿ｄｉｆｆ（ｔ₁））

ＥＬ差分信号の２つ以上の仮説が使用されることも可能である。例えば、
ＥＬｐｒｅｄｉｃｔｉｏｎ＝ｆｉｌｔｅｒ（ＢＬ＿ｒｅｓｉ（ｔ₀））＋ＭＣＰ＿ｆｉｌｔｅｒ１（ＥＬ＿ｄｉｆｆ（ｔ₁））＋ＭＣＰ＿ｆｉｌｔｅｒ２（ＥＬ＿ｄｉｆｆ（ｔ₂））

ＥＬ差分信号に対して、以下のバージョンが使用され得る。
・ＥＬ再構成とアップサンプリングされた／フィルタにかけられたＢＬ再構成との間の差分、または、
・（非ブロック化、ＳＡＯ、ＡＬＦのような）ループフィルタリング段階の前または間のＥＬ再構成と、アップサンプリングされた／フィルタにかけられたＢＬ再構成との間の差分。

特定のバージョンの使用法は、デコーダ内で固定され得る、または、それは、系列レベルで、画像レベルで、スライスレベルで、最も大きい符号化単位レベルで、符号化単位レベルで、または、別のパーティションレベルでシグナリングされ得る。あるいは、それは、別の符号化パラメータに依存することができる。

ＥＬ差分信号が、ＥＬ再構成とアップサンプリングされた／フィルタにかけられたＢＬ再構成との間の差分を使用して定義されるとき、これにより、ＥＬ再構成とＢＬ再構成を保存し、予測（ｓｐｒｅｄｉｃｔｉｏｎ）モードを使用しているブロックのＥＬ差分信号をその場で計算することが可能になる。その結果、ＥＬ差分信号を収納するために必要なメモリを節約できる。しかしながら、それはわずかな計算量のオーバーヘッドを招く。

ＥＬ差分画像上で使用されるＭＣＰフィルタは、整数または分数のサンプル精度のものであり得る。
・差分画像のＭＣＰに対して、再構成された画像のＭＣＰと異なる補間フィルタが使用できる。
・差分画像のＭＣＰに対して、補間フィルタが、差分画像内の対応する領域の特性に基づいて、（または、ビットストリーム内の符号化パラメータに基づいて、または、送信された情報に基づいて、）選択され得る。

動きベクトルＭＶ（ｘ，ｙ，ｔ）は、ＥＬ差分画像内の特定の位置を指すように定義される。パラメータｘとｙは、画像内で空間位置を指し、そして、パラメータｔが、フィルタにかけられた差分画像の時間インデックスを指定するために使用される。

ＭＶの整数部分は、差分画像から１セットのサンプルを取得するために使用され、ＭＶの断片的な部分は、１セットのフィルタからＭＣＰフィルタを選択するために使用される。取得された差分サンプルは、フィルタにかけられた差分サンプルを作り出すためにフィルタにかけられる。

差分画像のダイナミック（能動）範囲は、理論的にオリジナル画像のダイナミック範囲を超えることができる。範囲［０２５５］内の画像の８ビット表現を仮定する場合、差分画像は範囲［－２５５２５５］を持つことができる。しかしながら、実際には、振幅の大部分は、０の正負近傍に分布している。差分画像を格納する好ましい実施の形態において、１２８の一定のオフセットが加えられ、結果は、範囲［０２５５］にクリップされ、正規の８ビット像として格納される。その後、符号化および復号化過程内で、１２８のオフセットが、差分画像から読み込まれた差分振幅から引き算される。

再構成されたＢＬ信号を使用する方法に対して、以下のバージョンを使用できる。これは、固定される、または、それは、系列レベルで、画像レベルで、スライスレベルで、最大符号化単位レベルで、符号化単位レベルで、または、別のパーティションレベルでシグナリングされる。あるいは、それは、別の符号化パラメータに依存することができる。
・非ブロック化および更にループ内処理の前の再構成されたベース層サンプル（サンプル適応型オフセットフィルタまたは適応ループフィルタなど）。
・非ブロック化の後、しかし、更にループ内処理の前の再構成されたベース層サンプル（サンプル適応型オフセットフィルタまたは適応ループフィルタなど）。
・非ブロック化および更なるループ内処理（サンプル適応オフセットフィルタまたは適応型ループフィルタなど）の後、あるいは、複数のループ内処理ステップの間の再構成されたベース層サンプル。

現在のＢＬ再構成からＥＬ予測成分を計算するために、ＥＬ画像内で考慮された領域に併置されたＢＬ画像内の領域が特定される。そして、再構成信号が、特定されたＢＬ領域から取り出される。併置された領域の定義は、それが、ＢＬ解像度の整数スケーリング係数（例えば、２×スケーラビリティ）、または、ＢＬ解像度の端数のスケーリング係数（例えば、１．５×スケーラビリティ）、または、ＢＬ解像度（例えば、ＳＮＲスケーラビリティ）と同じＥＬ解像度を生み出すことさえ説明するように作られる。ＳＮＲスケーラビリティの場合、ＢＬ画像内の併置されたブロックは、予測されるべきＥＬブロックと同じ座標を有する。

最終ＥＬ予測は、フィルタにかけられたＥＬ差分サンプルとフィルタにかけられたＢＬ再構成サンプルとを追加することによって得られる。

（アップサンプリングされた／フィルタにかけられた）ベース層再構成信号と動き補償されたエンハンスメント層差分信号とを結合するモードのいくつかの可能なバリエーションが、以下に記載される。
・（アップサンプリングされた／フィルタにかけられた）ＢＬ信号を使用する方法の複数のバージョンが、使用され得る。これらのバージョンのために採用されたアップサンプリングされた／フィルタにかけられたＢＬ信号が、使用された（整数サンプル位置もフィルタにかける補間フィルタを含む）補間フィルタと異なることができる、または、２番目のバージョンのためにアップサンプリングされた／フィルタにかけられたＢＬ信号が、最初のバージョンのためにアップサンプリングされた／フィルタにかけられたＢＬ信号を、フィルタにかけることによって得られ得る。異なるバージョンの１つの選択が、系列で、画像で、スライスで、最大符号化単位で、符号化単位レベルで、または、画像パーティションの別のレベルでシグナリングされ得る。あるいは、それは、対応する再構成されたＢＬ信号、または、送信された符号化パラメータの特性から推論され得る。
・異なるフィルタは、ＢＬ＿ｒｅｃｏモードの場合のアップサンプリングされた／フィルタにかけられたＢＬ再構成された信号と、ＢＬ＿ｒｅｓｉモードの場合のＢＬ残差信号とのために使用され得る。
・アップサンプリングされた／フィルタにかけられたＢＬ信号は、動き補償された差分信号の２つ以上の仮説に結合されることも可能である。これは図３２で説明される。

上記を考慮すると、予測は、ベース層再構成とエンハンスメント層再構成の組み合わせを使用して実行され得る（実施例Ｃ参照）。図１１、図１２、図１３に関する上の記述との１つの大きな相違は、空間的というよりむしろ時間的に実行されるイントラ層予測３４を得るための符号化モードである。すなわち、空間予測３０の代わりに、時間予測３２が、イントラ層予測信号３４を形成するために使用される。従って、以下で記載されたいくつかの実施例が、図６～図１０と図１１～図１３とのそれぞれの上の実施の形態に容易に転用可能である。多重方法は以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、インター予測信号に結合され、そこでは、インター予測が、再構成されたエンハンスメント層の画像を使用して、動き補償予測によって導出される。最終予測信号は、異なる周波数成分が、異なる重み付けを使用する方法で、インター予測信号とベース層予測信号とを重み付けすることによって得られる。例えば、これは、以下のいずれかによって実現できる。
・ローパスフィルタでベース層予測信号をフィルタにかけて、ハイパスフィルタでインター予測信号をフィルタにかけて、得られたフィルタにかけられた信号を合計すること。
・ベース層予測信号とインター予測信号とを変換して、得られた変換ブロックを重畳すること。そこでは、異なる重み付け係数が、異なる周波数位置のために使用される。次に、得られた変換ブロックは、逆変換され、エンハンスメント層予測信号として使用される。あるいは、得られた変換係数は、スケーリングされた送信された変換係数レベルに追加され、非ブロック化およびループ内処理の前に再構成されたブロックを得るために逆変換される。

このモードは、図３３で記載された「ＢＬ＿ｃｏｍｂ」モードとも呼ばれ得る。

要するに、ＥＬ予測は、以下に示され得る。
ＥＬｐｒｅｄｉｃｔｉｏｎ＝ＢＬ＿ｗｅｉｇｈｔｉｎｇ（ＢＬ＿ｒｅｃｏ（ｔ₀））＋ＥＬ＿ｗｅｉｇｈｔｉｎｇ（ＭＣＰ＿ｆｉｌｔｅｒ（ＥＬ＿ｒｅｃｏ（ｔ₁）））

好ましい実施の形態では、重み付けは、ＥＬ解像度対ＢＬ解像度の比率に依存してなされる。例えば、ＢＬが、範囲［１，１．２５）内で係数によってスケーリングアップされるべきとき、ＥＬおよびＢＬ再構成のための所定のセットの重み付けが使用され得る。ＢＬが、範囲［１．２５１．７５）内で係数によってスケーリングアップされるべきとき、異なるセットの重み付けが使用され得る。ＢＬが、１．７５以上の係数によってスケーリングアップされるべきとき、別の異なるセットの重み付けなどが使用され得る。

スケーリング因子分離ベース層とエンハンスメント層とに依存する特定の重み付けをすることも、空間イントラ層予測に関する他方の実施の形態で可能である。

別の好ましい実施の形態では、重み付けが、予測されるためにＥＬブロックサイズに依存してなされる。例えば、ＥＬ内での４×４ブロックに対して、ＥＬ再構成変換係数のための重み付けを指定する重み付けマトリックスが、定義され得る。そして、ＢＬ再構成変換係数のための重み付けを指定する別の重み付けマトリックスが、定義され得る。ＢＬ再構成変換係数のための重み付けマトリックスは、例えば、以下の通りであり得る。
６４，６３，６１，４９，
６３，６２，５７，４０，
６１，５６，４４，２８，
４９，４６，３２，１５，
そして、ＥＬ再構成変換係数のための重み付けマトリックスは、例えば、以下の通りである。
０，２，８，２４，
３，７，１６，３２，
９，１８，２０，２６，
２２，３１，３０，２３，

同様に、８×８、１６×１６、３２×３２などのようなブロックサイズに対して、分離重み付けマトリックスが定義され得る。

周波数領域の重み付けに使用される実際の変換は、予測残差を符号化するために使用される変換と同じ、あるいは、異なり得る。例えば、ＤＣＴのための整数近似は、周波数領域の重み付けと、周波数領域内で符号化されるべき予測残差の変換係数を計算することの両方に使用できる。

別の好ましい実施の形態では、最大変換サイズは、計算量を制限するために、周波数領域の重み付けのために定義される。仮に、考慮されているＥＬブロックサイズが、最大の変換サイズより大きいならば、ＥＬ再構成とＢＬ再構成とは、一連の隣接するサブブロックに空間的に分離され、周波数領域の重み付けは、サブブロック上に実行され、最終予測信号は、重み付けされた結果を組み立てることによって形成される。

その上、重み付けは、輝度と色差成分、または、色成分の選択されたサブセットを実行できる。

以下では、エンハンスメント層符号化パラメータを導出するための様々な可能性が、説明される。エンハンスメント層ブロックを再構成するために使用されるべき符号化（または、予測）パラメータは、ベース層内の併置された符号化パラメータから多重方法によって導出される。ベース層とエンハンスメント層とは、異なる空間解像度を持つことができる、または、それらは同じ空間解像度を持つことができる。

Ｈ．２６４／ＡＶＣのスケーラブルビデオ拡張において、層間動き予測が、構文要素ベースモードフラグによってシグナリングされるマクロブロックタイプに対して実行される。仮に、ベースモードフラグが１と等しく、ベース層内の対応する参照マクロブロックがインター符号化されるならば、エンハンスメント層マクロブロックも、インター符号化される、そして、全ての動きパラメータが、併置されたベース層ブロックから推論される。そうでなければ（ベースモードフラグは０と等しい）、各動きベクトル、いわゆる「動き予測フラグ」に対して、構文要素は送信され、ベース層動きベクトルが、動きベクトル予測器として使用されるか否かが指定される。仮に、「動き予測フラグ」が１と等しいならば、ベース層の併置された参照ブロックの動きベクトル予測器は、解像度比率に従ってスケーリングされて、動きベクトル予測器として使用される。仮に、「動き予測フラグ」が０と等しいならば、動きベクトル予測器は、Ｈ．２６４／ＡＶＣ内で指定されたように計算される。

以下では、エンハンスメント層符号化パラメータを導出するための方法が説明される。ベース層の画像に関連しているサンプルアレイは、ブロックに分解され、各ブロックは、符号化（または、予測）パラメータが関連する。換言すれば、特定のブロック内の全てのサンプル位置は、特定の関連符号化（または、予測）パラメータを有する。符号化パラメータは、動き仮説、参照インデックスリスト、動きベクトル、動きベクトル予測識別子、およびマージ識別子の数を含む動き補償予測のためのパラメータを含み得る。符号化パラメータは、イントラ予測方向などのイントラ予測パラメータも含み得る。

エンハンスメント層内のブロックが、ベース層からの併置された情報を使用して符号化されることが、ビットストリーム内でシグナリングされる。

例えば、エンハンスメント層符号化パラメータの導出（実施例Ｔ参照）は、以下の通りに作られ得る。併置されたベース層情報を使用してシグナリングされるエンハンスメント層のＮ×Ｍブロックに対して、ブロック内のサンプル位置に関連した符号化パラメータは、ベース層サンプルアレイ内の併置されたサンプル位置に関連した符号化パラメータに基づいて導出され得る。

特定の実施の形態において、この処理は以下のステップによってなされる。
１．ベース層符号化パラメータに基づいて、Ｎ×Ｍエンハンスメント層ブロック内の各サンプル位置についての符号化パラメータの導出。
２．特定のサブブロック内の全てのサンプル位置が、同一の関連した符号化パラメータを持つように、サブブロック中のＮ×Ｍエンハンスメント層ブロックのパーティションの導出。

また、２番目のステップは省略できる。

ステップ１は、エンハンスメント層サンプル位置ｐ_elの関数ｆ_cを使用し、符号化パラメータｃ、すなわち、
ｃ＝ｆ_c（ｐ_el）
を与えて実行される。

２つの水平または垂直の隣接するベース層のサンプル位置ベース層の間の距離は、その結果、１に等しい。最も左上のベース層のサンプルと、最も左上のエンハンスメント層のサンプルの両方が、ｐ＝（０，０）の位置を持つ。

別の例として、関数ｆ_c（ｐ_el）は、ベース層サンプル位置ｐ_elに最も近い、ベース層サンプル位置ｐ_blに関連した符号化パラメータｃに戻すことができる。
また、関数ｆ_c（ｐ_el）は、特定のエンハンスメント層サンプル位置が、ベース層サンプル位置の間の距離の単位内の断片的な成分を有する場合において、符号化パラメータを補間できる。

動きパラメータを戻す前に、関数ｆ_cは、エンハンスメント層サンプリンググリッド内で最も近い利用可能な値に対して、動きパラメータの空間置換成分を丸める。

各サンプル位置が、ステップ１の後に予測パラメータに関連するので、ステップ１の後に、それぞれのエンハンスメント層のサンプルが予測され得る。それにもかかわらず、ステップ２では、ブロックパーティションが、より大きいブロックのサンプルの予測操作を実行するために、または、導出したパーティションのブロック内で予測残差を変換符号化するために導出され得る。

ステップ２は、エンハンスメント層サンプル位置を、正方形または長方形のブロックに分類することによって実行され得る。それぞれは、サブブロック内への可能な分解の１セットの１つに分解される。正方形または長方形のブロックは、それらが図３４内で表現された異なるレベルに存在できる四分木構造内の葉に相当する。

それぞれの正方形または長方形のブロックのレベルと分解は、以下の順序付けされたステップを実行することによって決定され得る。
ａ）最高レベルをサイズＮ×Ｍのブロックに対応するレベルに設定すること。現在のレベルを、最も低いレベル（すなわち、正方形または長方形のブロックが、最小のブロックサイズの単一ブロックを含むレベル）に設定すること。ステップｂ）に行く。
ｂ）現在のレベルでそれぞれの正方形または長方形のブロックに対して、仮に、正方形または長方形のブロックの可能な分解が存在するならば、それぞれのサブブロック内の全てのサンプル位置が、同じ符号化パラメータに関連する、または、（何らかの差の大きさに従って、）小さい差で符号化パラメータに関連する。その分解は、候補分解である。全ての候補分解のうち、正方形または長方形のブロックを、サブブロックの最小数に分解するものを選択する。仮に、現在のレベルが最高レベルであれば、ステップｃ）に行く。さもなければ、現在のレベルを、次のより高いレベルに設定して、ステップｂ）に行く。ｃ）終了

関数ｆ_cは、ステップｂ）内のあるレベルで、常に、少なくとも１つの候補分解が存在するような方法で選択され得る。

同じ符号化パラメータを有するブロックのグループ分けは、正方形ブロックに制限されないけれども、ブロックを矩形ブロックにまとめることができる。さらに、グループ分けは四分木構造に制限されない。ブロックが２つの同じサイズの矩形ブロックに、または、２つの異なるサイズの矩形ブロックに分解される構造を使用することも可能である。四分木分解を特定のレベルまで使用して、次に２つの矩形ブロックへの分解を使用する分解構造を使用することも可能である。また、いかなる他のブロック分解も可能である。

ＳＶＣ層間の動きパラメータ予測モードと対照して、記載されたモードは、マクロブロックレベル（または、最も大きく支持されたブロックサイズ）で支持されているだけではなく、任意のブロックサイズでも支持されている。それは、モードは、最も大きく支持されたブロックサイズのためにシグナリングされ得るだけではなく、最も大きく支持されたブロックサイズのブロック（ＭＰＥＧ４、Ｈ．２６４内のマクロブロック、および、ＨＥＶＣ内の符号化ツリーブロック／最大符号化単位）が、階層的により小さいブロック／符号化単位にサブ分割され得て、層間動きモードの使用が、（対応するブロックに対して）どんな支持されたブロックサイズにもシグナリングされ得るということを意味している。特定の実施の形態では、このモードは、選択されたブロックサイズだけを支持する。次に、このモードの使用法をシグナリングする構文要素は、対応するブロックサイズのためだけに送信され得る。または、このモードの使用法を（別の符号化パラメータ内で）シグナリングする構文要素の値は、別のブロックサイズに対応して制限され得る。また、Ｈ．２６４／ＡＶＣのＳＶＣ拡張内の層間動きパラメータ予測モードとの違いは、このモードで符号化されたブロックが、完全にインター符号化されていないということである。ブロックは、併置されたベース層信号に依存して、イントラ符号化されたサブブロックを含むことができる。

上の記載された方法によって導出された符号化パラメータを使用して、Ｍ×Ｍエンハンスメント層ブロックのサンプルを再構成するためのいくつかの方法の１つが、ビットストリーム内でシグナリングされ得る。導出された符号化パラメータを使用して、エンハンスメント層ブロックを予測するためのそのような方法は、以下を含み得る。
・動き補償のために、導出された動きパラメータと、再構成されたエンハンスメント層参照画像とを使用して、エンハンスメント層ブロックのための予測信号を導出すること。
・（アップサンプリングされた／フィルタにかけられた）ベース層再構成を、再構成されたエンハンスメント層画像から引き算することによって生成された、導出された動きパラメータとエンハンスメント層参照画像を使用して、（ａ）現在の画像のための（アップサンプリングされた／フィルタにかけられた）ベース層再構成と、（ｂ）動き補償信号との組み合わせ。
・（ａ）現在の画像についての（アップサンプリングされた／フィルタにかけられた）ベース層残差（再構成された信号と予測との間の差、または、符号化された変換係数値の逆変換）と、（ｂ）導出された動きパラメータと再構成されたエンハンスメント層参照画像を使用する動き補償信号との組み合わせ。

別のサブブロックが、インター符号化されるとして、分類されている間、現在のブロックに対してより小さいブロック内へのパーティションを得て、サブブロックに対して符号化パラメータを導出するための過程が、イントラ符号化されるとして、いくつかのサブブロックに分類できる。インター符号化されたサブブロックに対して、動きパラメータが、併置されたベース層ブロックから得られ得る。しかし、仮に、併置されたベース層ブロックが、イントラ符号化されるならば、エンハンスメント層内の対応するサブブロックは、イントラ符号化されるとして分類され得る。そのようなイントラ符号化されたサブブロックのサンプルに対して、エンハンスメント層信号が、ベース層から情報を使用することによって、予測され得る。例えば、
・対応するベース層再構成の（アップサンプリングされた／フィルタにかけられた）バージョンは、イントラ予測信号として使用される。
・導出されたイントラ予測パラメータは、エンハンスメント層内に空間イントラ予測のために使用される。

予測信号の重み付けされた組み合わせを使用して、エンハンスメント層ブロックを予測するために以下の実施の形態は、（ａ）再構成されたエンハンスメント層のサンプルを使用して、空間的または時間的（すなわち、動き補償）予測によって得られたエンハンスメント層イントラ予測信号と、（ｂ）現在の画像についての（アップサンプリングされた／フィルタにかけられた）ベース層再構成であるベース層予測信号とを結合することによって、エンハンスメント層ブロックのための予測信号を発生させるための方法を含む。最終予測信号は、各サンプルに対して、重み付け関数に従った重み付けが使用される方法で、エンハンスメント層内部予測信号とベース層予測信号との重み付けによって得られる。

例えば、重み付け関数は、以下の方法によって実現され得る。オリジナルのエンハンスメント層内部予測信号ｖのローパスフィルタにかけられたバージョンを、ベース層再構成ｕのローパスフィルタにかけられたバージョンと比較する。その比較から、オリジナルのインター予測信号と（アップサンプリングされた／フィルタにかけられた）ベース層再構成とを結合するために、使用されるべき各サンプル位置のための重み付けを導出する。例えば、重み付けは、伝達関数ｔを使用して、重み付けｗに対して差ｕ－ｖを写像することによって導出される。すなわち、
ｔ（ｕ－ｖ）＝ｗ

異なる重み付け関数が、予測されるべき現在のブロックの異なるブロックサイズのために使用され得る。また、重み付け関数が、インター予測仮説が得られる参照画像の時間的距離に従って変更され得る。

イントラ予測信号であるエンハンスメント層内部予測信号の場合、重み付け関数が、例えば、予測されるべき現在のブロック内の位置に依存する異なる重み付けを使用して、実現され得る。

好ましい実施の形態において、エンハンスメント層符号化パラメータを導出するための方法が使用される。そして、方法のステップ２が、図３５に記載されたように、正方形ブロックの可能な分解のセットを使用している。

好ましい実施の形態において、関数ｆ_c（ｐ_el）は、上でｍ＝４、ｎ＝４で記載された関数ｆ_p,m×_n（ｐ_el）によって与えられたベース層サンプル位置に関連した符号化パラメータを戻す。

実施の形態において、関数ｆ_c（ｐ_el）は、以下の符号化パラメータｃを戻す。
・最初に、ベース層サンプル位置は、ｐ_bl＝ｆ_p,4×₄（ｐ_el）として導出される。
・仮に、ｐ_blが、以前に符号化されたベース層ブロックとマージすることによって得られた関連したインター予測パラメータを持つ（または、同じ動きパラメータを持つ）ならば、ｃは、ベース層内でマージするために使用される、ベース層ブロックに対応するエンハンスメント層ブロックの動きパラメータと等しい（すなわち、動きパラメータは、対応するエンハンスメント層ブロックからコピーされる）。
・さもなければ、ｃはｐ_blに関連した符号化パラメータと等しい。

また、上の実施の形態の組み合わせも可能である。

別の実施の形態では、併置されたベース層情報を使用して、シグナリングされるべきエンハンスメント層ブロックに対して、動きパラメータの初期設定セットから得られたイントラ予測パラメータとそれらのエンハンスメント層サンプル位置に関連するので、ブロックは、これらのサンプル（すなわち、動きパラメータの初期設定セットのコピー）を含むブロックとマージされ得る。動きパラメータの初期設定セットは、１つまたは２つの仮説を使用するための指示器、参照画像のリスト内の最初の画像を参照する参照インデックス、および、ゼロ空間置き換えを有する動きベクトルからなる。

別の実施の形態では、併置されたベース層情報を使用して、シグナリングされるべきエンハンスメント層ブロックに対して、導出された動きパラメータを有するエンハンスメント層サンプルが、ある順序付けで最初に、予測されて、再構成される。その後に、導出されたイントラ予測パラメータを有するサンプルが、イントラ再構成順序で予測される。その結果、イントラ予測は、（ａ）隣接するインター予測ブロックと、（ｂ）イントラ再構成順序内の前任の隣接するイントラ予測ブロックとから、既に再構成されたサンプル値を使用し得る。

別の実施の形態では、マージされている（すなわち、別のインター予測ブロックから導出された動きパラメータを取る）エンハンスメント層ブロックに対して、マージ候補のリストは、追加的に、対応するベース層ブロックから候補を含む。そして、仮に、エンハンスメント層が、ベース層より高い空間サンプリング比率を有するならば、追加して、空間置換成分をエンハンスメント層内の利用可能な隣接する値のみを改良することによって、ベース層候補から導出された最大４つの候補を含む。

別の実施の形態では、ステップ２ｂ）で使用された差の大きさは、仮に差が全てなくなる場合にだけ、サブブロック内に小さい差があると主張する。すなわち、全ての含まれたサンプル位置が、同じ導出された符号化パラメータを持つときだけ、サブブロックのみは形成され得る。

別の実施の形態において、ステップ２ｂ）で使用された差の大きさは、仮に、（ａ）全ての含まれたサンプル位置が、導出された動きパラメータを持ち、そして、ブロック内のサンプル位置のペアが、対応する動きベクトルに適用されたベクトルノルムに従って特定の値より多く異なる導出された動きパラメータを持っていない、あるいは、（ｂ）全ての含まれたサンプル位置が、導出されたイントラ予測パラメータを持ち、そして、ブロック内のサンプル位置のペアが、特定の角度より大きく異なる方向イントラ予測パラメータを持っていない、のいずれかとするならば、サブブロック内に小さい差があると主張する。サブブロックのためにもたらされたパラメータは、平均、または、メジアンの操作によって計算される。
別の実施の形態では、ベース層から符号化パラメータを推論することによって得られたパーティションは、ビットストリーム内でシグナリングされたサイド情報に基づいてさらに改良され得る。
別の実施の形態では、符号化パラメータがベース層から推論されるブロックについての残差符号化は、ベース層から推論されるブロック内のパーティションから独立している。例えば、それは、ベース層からの符号化パラメータの推論が、ブロックを、符号化パラメータの別々のセットを有してそれぞれいくつかのサブブロックに仕切るけれども、単一の変換がブロックに適用され得ることを意味する。または、サブブロックのためのパーティションと符号化パラメータとがベース層から推論されるブロックが、残差を変換符号化する目的のために、より小さいブロックに分割され得る。そこでは、変換ブロックへの分割が、異なる符号化パラメータを有するブロック内の推論されたパーティションから独立している。

別の実施の形態では、符号化パラメータがベース層から推論されるブロックについての残差符号化が、ベース層から推論されるブロック内のパーティションに依存している。例えば、それは、変換符号化に対して、変換ブロック内のブロックの分割が、ベース層から推論されるパーティションに依存することを意味する。あるバージョンでは、単一の変換が、異なる符号化パラメータを有するそれぞれのサブブロックに適用され得る。別のバージョンでは、パーティションが、ビットストリーム内に含まれるサイド情報に基づいて改良され得る。別のバージョンでは、いくつかのサブブロックが、残差信号を変換符号化の目的のために、ビットストリーム内でシグナリングされるように、より大きなブロックにまとめられ得る。

また、前述の実施の形態の組み合わせによって得られた実施の形態も可能である。

エンハンスメント層動きベクトル符号化に関連して、この次の部分は、エンハンスメント層の動き情報を効率的に符号化するために、複数のエンハンスメント層予測器を提供して、ベース層内で符号化された動き情報を使うことによって、スケーラブルビデオ符号化アプリケーション内で動き情報を減少するための方法を説明する。この考えは、空間、時間および品質のスケーラビリティを含むスケーラブルビデオ符号化のために適切である。

Ｈ．２６４／ＡＶＣ層間のスケーラブルビデオ拡張において、動き予測は、構文要素「ベースモードフラグ」についてシグナリングされるマクロブロックタイプのために実行される。
仮に、「ベースモードフラグ」が１に等しく、かつ、ベース層内の対応する参照マクロブロックがインター符号化されるならば、エンハンスメント層マクロブロックも、インター符号化される。そして、全ての動きパラメータが、併置されたベース層ブロックから推論される。さもなければ（「ベースモードフラグ」が０に等しいならば）、各動きベクトル（いわゆる「動き予測フラグ」の構文要素）は、ベース層動きベクトルが動きベクトル予測器として使用されるか否かに関係なく、送信され、指定される。仮に、「動き予測フラグ」が１に等しいならば、ベース層の併置された参照ブロックの動きベクトル予測器は、解像度比率に従ってスケーリングされて、動きベクトル予測器として使用される。仮に、「動き予測フラグ」が０に等しいならば、動きベクトル予測器は、Ｈ．２６４／ＡＶＣで規定されるように計算される。
ＨＥＶＣにおいて、動きパラメータは、適応動きベクトル予測（ＡＭＶＰ）を適用することによって予測される。ＡＭＶＰは互いに競争する２つの空間動きベクトル予測器と１つの時間動きベクトル予測器とを備えることを特色とする。空間候補は、現在の予測ブロックの左または上に位置した、隣接する予測ブロックの位置から選択される。時間候補は、前に符号化された画像の併置された位置の中で選択される。全ての空間的で時間的候補の位置は、図３６内で表示される。

空間的および時間的候補が推論された後に、ゼロ動きベクトルを候補としてリストに導入し得る冗長検査が、実行される。インデックスを記述する候補リストは、動き補償予測のために、動きベクトル差と共に使用される動きベクトル予測器を特定するために送信される。
ＨＥＶＣは、更に、符号化構成に基づいた四分木から生じる符号化冗長動きパラメータの減少を狙うブロックマージアルゴリズムを用いる。これは、特定動きパラメータを共有する多重予測ブロックから成る領域を、作成することによって達成される。これらの動きパラメータは、新しい動き情報の種を蒔いている各領域の最初の予測ブロックのために、一度符号化される必要があるだけである。ＡＭＶＰと同様に、ブロックマージアルゴリズムは、それぞれの予測ブロックのために、可能なマージ候補を含むリストを構成する。候補の数は、スライスヘッダー内でシグナリングされて１から５までの範囲がある「ＮｕｍＭｅｒｇｅＣａｎｄｓ」によって定義される。候補は、空間的近傍予測ブロックと併置された時間画像内の予測ブロックとから推論される。候補であるとみなされる予測ブロックのための可能なサンプル位置は、図３６に示された位置と等しい。ＨＥＶＣ内の可能な予測ブロックのパーティションを有するブロックマージアルゴリズムの例は、図３７で説明される。図３７（ａ）内の太線は、１つの領域にマージされて特定の動きデータを保持する予測ブロックを全て定義する。この動きデータはブロックＳだけに送られる。符号化されるべき現在の予測ブロックは、「Ｘ」によって示される。縞模様領域内の予想ブロックは、ブロック走査順序内で予測ブロックＸの後継者であるので、関連した予測データをまだ有さない。ドットは、可能な空間マージ候補である隣接するブロックのサンプル位置を示す。可能な候補が予測器リストに挿入される前に、空間候補のための冗長検査が、図３７（ｂ）内で示されるように実行される。

空間的で時間的な候補の数が、「ＮｕｍＭｅｒｇｅＣａｎｄｓ」より少ない場合、追加候補が、既存の候補と結合することによって、または、ゼロ動きベクトル候補を挿入することによって提供される。仮に、候補がリストに追加されるならば、それは候補を特定するために使用されるインデックスを備えている。新しい候補がリストへ追加されると、リストが、インデックス「ＮｕｍＭｅｒｇｅＣａｎｄｓ」－１によって特定された最後の候補で完成するまでマージインデックスは（０からスタートして）増加する。固定長符号ワードは、マージ候補インデックスを符号化するために使用されて、候補リストの導出およびビットストリームの構文解析の独立操作を確実にする。

以下のセクションは、エンハンスメント層の動きパラメータを符号化するために、ベース層から得られた予測器を含む、多重エンハンスメント層予測器を使用するための方法を説明する。ベース層のために既に符号化された動き情報は、エンハンスメント層を符号化している間、動きデータ速度をかなり減少させるために用いることができる。この方法は、ベース層から予測ブロックの全ての動きデータを直接導出する可能性を含む。この場合、追加動きデータは、符号化される必要がない。以下の記述において、予測ブロックという用語は、ＨＥＶＣ内の予測単位（Ｈ．２６４／ＡＶＣ内のＭ×Ｎブロック）を示し、画像内のサンプルの一般的なセットとして理解され得る。

現在のセクションの最初の部分は、ベース層動きベクトル予測器（態様Ｋ参照）によって動きベクトル予測候補のリストを拡張することに関するものである。ベース層動きベクトルは、エンハンスメント層符号化の間、動きベクトル予測器リストに追加される。これは、ベース層からの併置された予測ブロックの１つまたは多重の動きベクトル予測器を推論し、そして、動き補償予測のための予測器のリスト内の候補としてそれらを使用することによって達成される。ベース層の併置された予測ブロックは、現在のブロックの中央、左、上、右または下部に位置している。仮に、選択された位置のベース層の予想ブロックが、動き関連データを含まない、または、現在の範囲の外に存在して、それ故に現在アクセス可能でないならば、二者択一の位置が、動きベクトル予測器を推論するために使用できる。これらの二者択一の位置は図３８に表現される。

ベース層の推論された動きベクトルは、予測器候補としてそれらが使用され得る前に、解像度比率に従ってスケーリングされ得る。動きベクトル差と同様に、動きベクトル予測器の候補リストを記述するインデックスが、動き補償予測のために使用される最終動きベクトルを指定する予測ブロックに送信される。Ｈ．２６４／ＡＶＣ規格のスケール可能な拡張と対照して、ここに提示された実施の形態は、参照画像内の併置されたブロックの動きベクトル予測器の使用法を構成しない－むしろそれは、別の予測器内のリスト内で利用可能であり、送信されるインデックスによって記述され得る。
実施の形態において、動きベクトルは、ベース層の併置された予測ブロック内心位置Ｃ₁から得られ、最初のエントリーとして候補リストの先頭に加えられる。動きベクトル予測器の候補リストは、１つの項目によって拡張される。仮に、サンプル位置Ｃ₁のために利用可能なベース層内に動きデータが全くなければ、リスト構造は触れられない。別の実施の形態では、ベース層内のサンプル位置のどんな系列も、動きデータに対してチェックされ得る。動きデータが見つけられた場合において、対応する位置の動きベクトル予測器は、候補リストに挿入され、エンハンスメント層の動き補償予測のために利用可能である。その上、ベース層から導出された動きベクトル予測器は、リストのいかなる他の位置の候補リストにも挿入される。別の実施の形態では、仮に、所定の規制が認められるならば、ベース層動き予測器は候補リストに挿入されるだけであり得る。これらの制約は、ゼロと等しくなければならない、併置された参照ブロックのマージフラグの値を含む。別の制約は、解像度比率に対してベースの併置された予測ブロックの広さと等しいエンハンスメント層内の予測ブロックの広さであり得る。例えば、Ｋ×空間スケーラビリティの応用において、仮に、ベース層内の併置されたブロックの幅がＮと等しく、エンハンスメント層内の符号化されるべき予測ブロックの幅がＫ^*Ｎと等しい場合のみ、動きベクトル予測器が推論のみなされ得る。
別の実施の形態では、ベース層の数個のサンプル位置からの１個以上の動きベクトル予測器が、エンハンスメント層の候補リストに追加され得る。別の実施の形態では、併置されたブロックから推論された動きベクトル予測器を有する候補が、リストを拡張することよりむしろ、リスト内の空間的あるいは時間的な候補に置き代わり得る。また、動きベクトル予測器候補リスト内のベース層データから導出された多重動きベクトル予測器を含むことも可能である。

第２の部分は、ベース層候補によってマージ候補のリストを拡張することに関するものである（態様Ｋ参照）。ベース層の１つ以上の併置されたブロックの動きデータは、マージ候補リストに追加される。この方法は、ベース層とエンハンスメント層とを横切って特定の動きパラメータを共有するマージ領域を作成する可能性を可能にする。前のセクションと同様、図３８に表現されるように、中央位置で併置されたサンプルをカバーするベース層ブロックは、この中央位置に制限されるのではなく、直ぐ近傍のどんな位置からも得られ得る。どんな動きデータも、所定の位置に対して利用可能でなく、または、アクセス可能でない場合、二者択一の位置が、可能なマージ候補を推論するために選択できる。導出された動きデータが、マージ候補リストに挿入される前に、それは、解像度比率に従ってスケーリングされ得る。マージ候補リストを記述するインデックスは、送信され、動きベクトルを定義する。それは、動き補償予測のために使用される。しかしながら、また、方法は、ベース層内の予測ブロックの動きデータに依存する可能な動き予測器候補をも抑制できる。
実施の形態において、図３８のサンプル位置Ｃ₁をカバーするベース層内の併置されたブロックの動きベクトル予測器は、エンハンスメント層内の現在予測ブロックを符号化するための可能なマージ候補であるとみなされる。しかしながら、仮に、参照ブロックの「ｍｅｒｇｅ＿ｆｌａｇ」（マージフラグ）が１と等しい、または、併置された参照ブロックが動きデータを全く含んでいないならば、動きベクトル予測器はリストに挿入されない。いかなる他の場合でも、得られた動きベクトル予測器は、２番目のエントリーとしてマージ候補リストに追加される。この実施の形態では、マージ候補リストの長さが保有され、拡張されないことに注意されたい。別の実施の形態では、図３８に表現されているように、１個以上の動きベクトル予測器が、候補リストをマージするために加えられるように、サンプル位置のいずれもカバーする予測ブロックから導出される。別の実施の形態では、ベース層の１個または数個の動きベクトル予測器が、どんな位置にてもマージ候補リストに追加され得る。別の実施の形態では、仮に、特定の制約を満たすならば、１個または複数個の動きベクトル予測器が、マージ候補リストに追加されるだけである。そのような制約は、（動きベクトル予測のために前の実施の形態のセクション内で記載された解像度比率に関する）ベース層の併置されたブロックの広さに整合するエンハンスメント層の予測ブロックの大きさを含む。別の実施の形態内の別の制約は、１に等しい「ｍｅｒｇｅ＿ｆｌａｇ」の値である。別の実施の形態では、マージ候補リストの長さが、ベース層の併置された参照ブロックから推論された動きベクトル予測器の数によって拡張され得る。

この明細書の３番目の部分は、ベース層データ（実施例Ｌ参照）を使用して、動きパラメータ（または、マージ）候補リストを再順序付けすることに対してであって、ベース層内の既に符号化された情報に従って、マージ候補リストを再順序付けする過程について説明する。仮に、現在のブロックのサンプルをカバーする併置されたベース層ブロックが、特定のオリジナルから導出された候補を有する動き補償予測であれば、（仮に存在するならば）同等のオリジナルからの対応するエンハンスメント層候補が、最初のエントリーとして、マージ候補リストの先頭に置かれる。このステップは、最も低いインデックスを有するこの候補を記述することに等しい。最も低いインデックスは、最も簡素な符号語をこの候補に割り当てる。
実施の形態では、併置されたベース層ブロックは、図３８に表現されるように、サンプル位置Ａ₁をカバーする予測ブロックから発生する候補と共に動き補償予測される。仮に、エンハンスメント層内の予測ブロックのマージ候補リストが、動きベクトル予測器がエンハンスメント層内に対応するサンプル位置Ａ₁から発生する候補を含むならば、この候補は、最初のエントリーとしてリスト内に置かれる。その結果、この候補は、インデックス０によって索引付けられ、従って、最も短い固定長符号語を割り当てられる。この実施の形態において、このステップは、エンハンスメント層内のマージ候補リストに対して、併置されたベース層ブロックの動きベクトル予測器の導出の後に実行される。従って、再順序付け過程は、併置されたベース層ブロックの動きベクトル予測器として、対応するブロックから発生する候補に最も低いインデックスを割当てる。２番目に低いインデックスは、このセクションの２番目の部分で説明されているように、ベース層内の併置されたブロックから導出された候補に割当てられる。その上、再順序付けの過程は、ベース層内の併置されたブロックの「ｍｅｒｇｅ＿ｆｌａｇ」が１と等しい場合にだけ、行われる。別の実施の形態では、再順序付けの過程は、ベース層内の併置された予測ブロックの「ｍｅｒｇｅ＿ｆｌａｇ」の値の如何に関わらず実行され得る。別の実施の形態において、対応するオリジナルの動きベクトル予測器を有する候補は、マージ候補リストのどんな位置にも置かれ得る。別の実施の形態では、再順序付けの過程は、マージ候補リスト内の他の全ての候補を除去し得る。ここに、動きベクトル予測器が、ベース層内の併置されたブロックの動き補償予測のために使用される動きベクトル予測器と同じオリジナルを有している候補だけが、リスト内に留まる。この場合、単独の候補が利用され、そして、インデックスは全く送信されない。

この明細書の４番目の部分は、ベース層データを使用して、動きベクトル予測器候補リストを再順序付けすること（態様Ｌ参照）に対してであって、ベース層ブロックの動きパラメータを使用して、動きベクトル予測の候補リストを再順序付けする過程を実施の形態とする。仮に、現在の予測ブロックのサンプルをカバーする併置されたベース層ブロックが、特定のオリジナルからの動きベクトルを使用するならば、エンハンスメント層内の対応するオリジナルからの動きベクトル予測器は、最初のエントリーとして、現在の予測ブロックの動きベクトル予測器リスト内で使用される。これは、最も安い符号語を、この候補に割り当てることをもたらす。
実施の形態において、併置されたベース層ブロックは、図３８に表わされるように、サンプル位置Ａ₁をカバーする予測ブロックから発生する候補と共に、動き補償予測される。仮に、エンハンスメント層内のブロックの動きベクトル予測器候補リストが、動きベクトル予測器がエンハンスメント層内に対応するサンプル位置Ａ₁から発生する候補を含むならば、この候補は最初のエントリーとしてリスト内に置かれる。その結果、この候補は、インデックス０によって索引付けられ、従って、最も短い固定長符号ワードを割り当てられる。この実施の形態において、このステップは、エンハンスメント層内の動きベクトル予測器リストに対して、併置されたベース層ブロックの動きベクトル予測器の導出の後に実行される。従って、再順序付け処理は、併置されたベース層ブロックの動きベクトル予測器として、対応するブロックから発生する候補に最も低いインデックスを割り当てる。２番目に低いインデックスは、このセクションの最初の部分で説明されているように、ベース層内の併置されたブロックから導出する候補に割り当てられる。その上、再順序付け処理は、ベース層内の併置されたブロックの「ｍｅｒｇｅ＿ｆｌａｇ」が０と等しい場合にだけ、行われる。別の実施の形態では、再順序付け処理は、ベース層内の併置された予測ブロックの「ｍｅｒｇｅ＿ｆｌａｇ」の値の如何に関わらず実行され得る。別の実施の形態において、対応するオリジナルの動きベクトル予測器を有する候補は、動きベクトル予測器候補リストのどんな位置にも置かれ得る。

以下は変換係数のエンハンスメント層符号化に関するものである。

最先端のビデオと画像符号化において、予測信号の残差は、前に変換され、結果の量子化された変換係数が、ビットストリーム内でシグナリングされる。この係数符号化は固定されたスキームに続く。

変換サイズ（ルマ（ｌｕｍａ）残差に対して：４×４，８×８，１６×１６，３２×３２）に依存して、異なる走査方向が定義される。走査順に最初と最後の位置が与えられ、これらの走査は、どの係数位置が有意である場合があり得るかを唯一決定して、その結果、符号化される必要がある。全ての走査内で、最初の係数は位置（０，０）におけるＤＣ係数であるように設定され、最後の位置はビットストリーム内でシグナリングされなければならないけれども、変換ブロック内で（水平な）ｘと（垂直な）ｙの位置を符号化することによって行われる。最後の位置からスタートして、有意な係数のシグナリングが、ＤＣ位置に達するまで、逆の走査順でなされる。

変換サイズ１６×１６と３２×３２に対して、１つの走査、すなわち、「対角線走査」だけが定義される。ところが、サイズ２×２と４×４と８×８の変換ブロックは、さらに、「垂直」で「水平」な走査を利用できる。しかしながら、垂直および水平な走査の使用は、イントラ予測符号化単位の残差に制限される。そして、実際に使用された走査が、そのイントラ予測の指示モードから導出される。インデックスが６と１４の範囲にある指示モードは、垂直な走査をもたらす。インデックスが２２と３０の範囲にある指示モードは、水平な走査をもたらす。全ての残差指示モードが、対角線の走査をもたらす。

図３９は、４×４変換ブロックに対して定義される対角線の走査、垂直な走査および水平な走査を示す。より大きい変換の係数は、１６の係数のサブグループに分割される。これらのサブグループは重要な係数位置の階層的な符号化を可能にする。有意でないとしてシグナリングされたサブグループは、有意な係数を含まない。８×８と１６×１６に対しての変換は、走査と図４０と図４１のそれらが関連したサブグループ区分と共にそれぞれ表わされる。大きい矢印は係数サブグループの走査順を表する。

ジグザグ走査において、４×４より大きいサイズのブロックに対して、サブグループは、ジグザグ走査で走査された４×４画素のブロックからなる。サブグループはジグザグな方法で走査される。図４２は、ＪＣＴＶＣ－Ｇ７０３内で提案されるように、１６×１６変換のための垂直な走査を示す。

以下の段落は変換係数符号化についての拡張について説明する。これらは新しい走査モード（変換ブロックへの走査と重要な係数位置の変更された符号化を割り当てる方法）の導入を含む。これらの拡張は、変換ブロック内に異なる係数分布の、より良い適合を可能とし、その結果、レート歪関数内で符号化利得を達成する。

垂直水平走査パターンについての新しい実現は、１６×１６と３２×３２変換ブロックのために導入される。以前に提案された走査パターンと対照して、走査サブグループのサイズは、それぞれ水平走査に対して１６×１で、垂直走査に対して１×１６である。また、８×２と２×８のサイズを有するサブグループが、それぞれ選択される。サブグループ自体は同じ方法で走査される。

垂直走査は、列方向の拡がりの中に位置している変換係数について効率的である。これは、水平エッジを含む画像内で見出され得る。

水平走査は、行方向の拡がりの中に見つかる変換係数のために効率的である。これは、垂直なエッジを含む画像内で認められる。

図４３は、１６×１６変換ブロックのための垂直水平走査の実現を示す。係数サブグループは、それぞれ一つの行または一つの列として定義される。垂直水平走査は、導入された走査パターンである。その走査パターンは、行方向走査によって、列内に係数の符号化を可能にする。４×４ブロックに対して、最初の列は、最初の行の残りに続いて走査され、次に、２番目の列の残りに続いて走査され、次に、２番目の行の係数の残りに続いて走査される。次に、３番目の行の残りが走査され、最後に４番目の行と列の残りが走査される。

より大きいブロックに対しては、ブロックは４×４のサブグループに区分される。これらの４×４ブロックは、垂直水平走査で走査され、サブグループは垂直水平走査自体で走査される。

垂直水平走査は、係数がブロック内の最初の行と列に位置している場合に使用できる。このように、係数は、別の走査、例えば対角線走査、を使用する場合より早く走査される。これは、水平なエッジと垂直なエッジとを両方を含む画像に対して見出される。

図４４は１６×１６変換ブロックに対して垂直および水平な走査を示す。

別の走査も同様に可能である。例えば、走査とサブグループとの間の全ての組み合わせが使用できる。例えば、４×４ブロックに対して水平走査を使用して、サブグループに対して対角線走査を使用する。走査の適切な選択が、各サブグループに対して異なる走査を選択することによって適用できる。

変換係数がエンコーダ側での量子化の後に並び替えられて、従来の符号化が使用される方法で、異なる走査が実現できる、ということを述べるべきである。デコーダ側で、変換係数は、従来の復号化が行われて、スケーリングと逆変換との前に（または、スケーリングの後と逆変換の前に）並び替えられる。

ベース層信号の異なる部分は、ベース層信号から符号化パラメータを導出するために利用される。ベース層信号内には以下がある。
・併置された再構成されたベース層信号
・併置された残差ベース層信号
・エンハンスメント層予測信号を再構成されたベース層信号から引き算することによって得られた、推定されたエンハンスメント層の残差信号
・ベース層フレームの画像パーティション

［勾配パラメータ］
勾配パラメータは以下の通り導出される：
調査されたブロックの各画素に対して、勾配が計算される。これらの勾配から、大きさと角度が計算される。ブロック内で最も発生した角度は、ブロックに関連する（ブロック角度）。角度は、３つの方向のみ、水平（０°）、垂直（９０°）、対角（４５°）を使用するように丸められる。

［エッジ検出］
エッジ検出器は、以下のような調査されたブロックに適用され得る：
最初に、ブロックが、ｎ×ｎ平滑化フィルタ（例えば、ガウシアン）によって平滑化される。
サイズｍ×ｍの勾配マトリクスが、各画素の勾配を計算するために使用される。あらゆる画素の大きさと角度が計算される。角度は、３つの方向のみ、水平（０°）、垂直（９０°）、対角（４５°）を使用するように丸められる。
所定の閾値１より大きい大きさを有するあらゆる画素に対して、隣接する画素がチェックされる。仮に、隣接する画素が閾値２より大きい大きさを有するならば、そして、現在の画素と同じ角度を有しているならば、この角度の計数器が増加する。全体のブロックに対して、最高値の計数器がブロックの角度として選択される。

［前の変換によってベース層係数を得ること］
特定のＴＵに対して、ベース層信号の周波数領域から符号化パラメータを導出されるために、調査され併置された信号（再構成されたベース層信号／残差ベース層信号／推定されたエンハンスメント層信号）は、周波数領域内に変換される。好ましくは、これは、その特定のエンハンスメント層ＴＵによって使用される同じ変換を使用して、実行される。
結果としてもたらされるベース層変換係数は、量子化されても、されなくてもよい。
エンハンスメント層ブロックと比較可能な係数分布を得るために、変更されたラムダによるレート歪量子化が使用される。

［特定の分布および走査の走査有効スコア］
特定の重要な係数分布の走査有効スコアが、以下の通り定義される：
調査されたブロックの各位置を、調査された走査の順にインデックスによって表わすとしよう。次に、重要な係数位置のインデックス値の合計が、この走査の有効スコアと定義される。その結果、より小さいスコアを有する走査であるほど、特定の分布は、より良い効率性を表わす。

［変換係数符号化に対して適切な走査パターン選択］
仮に、いくつかの走査が、特定のＴＵに対して利用可能であるならば、走査の１つを唯一選択する規則が、定義される必要がある。

［走査パターン選択のための方法］
選択された走査が、（どんな追加データも送信されること無く）既に復号化された信号から直接導出することができる。これは、併置されたベース層信号の特性に基づいて、または、エンハンスメント層信号だけを利用することによってのどちらかによって可能である。
走査パターンが、以下によって、ＥＬ信号から導出することができる。
・前述された最先端の導出規則。
・併置された輝度残差のために選択された色差残差のための走査パターンを使用すること。
・符号化モードと使用した走査パターンとの間の固定写像を定義すること。
・最後の重要な係数位置から走査パターンを得ること（推定された固定走査パターンに比例して）。
・好ましい実施の形態において、走査パターンが、以下の通り既に復号化された最後の位置に依存して選択される：

最後の位置は、変換ブロック内のｘとｙ座標として表わされ、既に復号化される（符号化される最後に依存する走査に対して、固定走査パターンが、最後の位置の復号化過程のために推定される。それは、そのＴＵの最先端の走査パターンであり得る）。Ｔを特定の変換サイズに依存する、定義された閾値であるとしよう。仮に、最後の重要な位置のｘ座標のみならずｙ座標も、Ｔを超えないならば、対角線走査が選択される。

さもなければ、ｘはｙと比較される。仮に、ｘがｙを超えるならば、水平走査が選択され、垂直走査は選択されない。４×４ＴＵのためのＴの好ましい値は１である。４×４より大きいＴＵのためのＴの好ましい値は４である。

別の好ましい実施の形態において、前の実施の形態内で説明されるように走査パターンの導出は、サイズ１６×１６と３２×３２のＴＵのためだけにされるべく制限される。それは、さらに輝度信号だけに制限され得る。

また、走査パターンは、ＢＬ信号から導出される。ベース層信号から選択された走査パターンを導出するために、前述したどのような符号化パラメータも使用できる。特に、併置されたベース層信号の勾配が、計算でき、事前に定義された閾値と比較される、および／または、潜在的に発見されたエッジが利用できる。

好ましい実施の形態において、走査方向が、以下の通り、ブロック勾配角度に依存して導出される。水平方向において量子化された勾配に対して、垂直な走査が使用される。垂直方向において量子化された勾配に対して、水平走査が使用される。さもなければ、対角線走査が選択される。

別の好ましい実施の形態において、走査パターンは、前の実施の形態で記載されたように得られる。しかし、ブロック角度の発生数が閾値を超えている、それらの変換ブロックだけに対して得られる。残っている変換単位は、ＴＵの最先端の走査パターンを使用して、復号化される。

仮に、併置されたブロックのベース層係数が有効であり、明らかに、ベース層データストリーム内でシグナリングされる、または、前の変換によって計算されるならば、ベース層係数は以下の方法で利用され得る。
・それぞれの利用可能な走査に対して、ベース層係数を符号化するためのコストが評価され得る。最低コストを有する走査は、エンハンスメント層係数を復号化するために使用される。
・それぞれの利用可能な走査の有効スコアは、ベース層係数分布のために計算される。最小のスコアを有する走査は、エンハンスメント層係数を復号化するために使用される。
・変換ブロック内のベース層係数の分布は、特定の走査パターンに関連している分布の事前に定義されたセットの１つに分類される。
・走査パターンは、最後の重要なベース層係数に依存して選択される。

仮に、併置されたベース層ブロックが、イントラ予測を使用して、予測されたならば、その予測のイントラ方向が、エンハンスメント層走査パターンを導出するために使用され得る。

その上、併置されたベース層ブロックの変換サイズは、走査パターンを導出するために利用される。

好ましい実施の形態において、走査パターンが、ＩＮＴＲＡ＿ＣＯＰＹモード予測ブロックの残差を表わすＴＵだけに対して、ＢＬ信号から導出される。そして、それらの併置されたベース層ブロックは、イントラ予測されている。それらのブロックに対して、変更された最先端技術の走査選択が使用される。最先端技術の走査選択と対照して、併置されたベース層ブロックのイントラ予測方向は、走査パターンを選択するために使用される。

ビットストリーム内で走査パターンインデックスにシグナリングすること（態様Ｒ参照）。
変換ブロックの走査パターンが、エンコーダによってレート歪の意味で選択でき、次に、ビットストリーム内でシグナリングできる。

特定の走査パターンが、利用できる走査パターン候補のリストにインデックスをシグナリングすることによって、符号化できる。このリストは、特定の変換サイズのために定義された走査パターンの固定リストであるか、または、復号化過程内で動的に満たすことができる。動的にリストを満たすことは、それらの走査パターンの適した選択を可能し、走査パターンは、おそらく最も効率的に、特定の係数分布を符号化する。そうすることによって、特定のＴＵのための利用可能な走査パターンの数は減少できる。そして、その結果、そのリストへのインデックスのシグナリングは、より低コストである。仮に、特定のリストの走査パターンの数が、１つまで減少するならば、シグナリングは必要ない。
特定のＴＵに対して、走査パターン候補を選択する過程は、上述した、どんな符号化パラメータも利用してよい、および／または、その特定のＴＵの特定の特性を利用する所定の規則に従う。それらの中には、以下が存在する。
・ＴＵは輝度／色信号の残差を表わす。
・ＴＵは、特定のサイズを有する。
・ＴＵは特定の予測モードの残差を表わす。
・ＴＵ内の最後の重要な位置は、デコーダによって知られ、ＴＵの特定のサブ分割内に属する。
・ＴＵは１つのＩ／Ｂ／Ｐ－スライス（Ｓｌｉｃｅ）の部分である。
・ＴＵの係数は、特定の量子化パラメータを使用して、量子化される。

好ましい実施の形態において、走査パターン候補のリストは、全てのＴＵに対して、３つの走査を含む：「対角線走査」、「垂直走査」および「水平走査」。

別の実施の形態が、候補リストに、走査パターンの任意の組み合わせを含ませることによって、得られ得る。

特定の好ましい実施の形態の中で、走査パターン候補のリストは、「対角線走査」、「垂直走査」および「水平走査」のどれかを含み得る。

ところが、（上述の）最先端の走査導出によって選択された走査パターンが、最初に、リスト内にあるように設定される。特定のＴＵが１６×１６または３２×３２のサイズを有する場合にだけ、別の候補がリストに追加される。残っている走査パターンの順序は、最後の重要な係数位置に依存する。

（注意：対角線の走査は、いつも、１６×１６と３２×３２変換を推定するリスト内での最初のパターンである）

仮に、ｘ座標の大きさがｙ座標の大きさを超えるならば、水平走査が次に選ばれる。そして、垂直走査が最後の位置に置かれる。さもなければ、垂直走査は、水平走査が後に続く、２番目の位置に置かれる。

別の好ましい実施の形態が、リスト内に１つ以上の候補を有しているために、更に条件を制限することによって得られる。

別の実施の形態において、仮に、変換ブロックの係数が、輝度信号の残差を表わすならば、垂直および水平走査は、１６×１６と３２×３２変換ブロックの候補リストに追加されるだけである。

別の実施の形態において、仮に、最後の重要な位置のｘおよびｙ座標の両方が、特定の閾値より大きいならば、垂直で水平な走査は、変換ブロックの候補リストに追加される。この閾値はサイズに依存するモードおよび／またはＴＵであり得る。好ましい閾値は、４×４より大きい全てのサイズに対して３であり、４×４ＴＵに対しては１である。

別の実施の形態において、仮に、最後の重要な位置のｘおよびｙ座標のいずれかが、特定の閾値より大きいならば、垂直で水平な走査は、変換ブロックの候補リストに追加されるだけである。この閾値はサイズに依存するモードおよび／またはＴＵであり得る。好ましい閾値は、４×４より大きい全てのサイズに対して３であり、４×４ＴＵに対しては１である。

別の実施の形態において、仮に、最後の重要な位置のｘおよびｙ座標の両方が、特定の閾値より大きいならば、垂直で水平な走査は、１６×１６と３２×３２変換ブロックの候補リストに追加されるだけである。この閾値はサイズに依存するモードおよび／またはＴＵであり得る。好ましい閾値は、４×４より大きい全てのサイズに対して３であり、４×４ＴＵに対しては１である。

別の実施の形態において、仮に、最後の重要な位置のｘおよびｙ座標のいずれかが、特定の閾値より大きいならば、垂直と水平な走査は、１６×１６と３２×３２変換ブロックの候補リストに追加されるだけである。この閾値はモードおよび／またはＴＵサイズに依存し得る。好ましい閾値は、４×４より大きい全てのサイズに対して３であり、４×４ＴＵに対しては１である。

記載された実施の形態のいずれかに対して、特定の走査パターンが、ビットストリーム内でシグナリングされる。シグナリング自体は、異なるシグナリングレベルでなされ得る。特に、シグナリングは、残差四分木のどんな節（ノード）（その節の全てのサブＴＵ、それはシグナリングされた走査を使用し、同じ候補リストインデックスを使用する）で、ＣＵ／ＬＣＵレベルで、または、スライスレベルで、シグナリングされた走査パターンを有したＴＵのサブグループ内で低下する各ＴＵに対してなされ得る。

候補リスト内へのインデックスが、固定長符号化、可変長符号化、算術符号化（コンテキスト適合２進算術符号化を含む）、または、ＰＩＰＥ符号化を使用して、送信され得る。仮に、コンテキスト適合符号化が使用されるならば、コンテキストは、隣接するブロック、前述した符号化モード、および／または、特定のＴＵ自身の特性に基づいて導出され得る。

好ましい実施の形態において、コンテキスト適合符号化は、ＴＵの走査パターン候補リスト内へのインデックスをシグナリングするために使用される。しかし、コンテキストモデルは、ＴＵ内で、最後の重要な位置の変換サイズおよび／または位置に基づいて導出される。
走査パターンを導出するために前述したいずれかの方法が、特定のＴＵに対して、明白な走査パターンをシグナリングするためのコンテキストモデルを導出するために使用され得る。

最後の重要な走査位置を符号化するために、以下の変更がエンハンスメント層内で使用され得る。
・別々のコンテキストモデルが、ベース層情報を使用して、全てのまたはサブセットの符号化モードに対して使用される。また、異なるコンテキストモデルを、ベース層情報を有する異なるモードに対して使用することも可能である。
・コンテキストモデルは、併置されたベース層ブロック内のデータに依存できる（例えば、ベース層内の変換係数分布、ベース層の勾配情報、併置されたベース層ブロック内の最後のスキャン位置）。
・最後の走査位置が、最後のベース層走査位置との差として符号化できる。
・仮に、最後の走査位置が、ＴＵ内で、ｘおよびｙ位置にシグナリングすることによって符号化されるならば、２番目のシグナリングされた座標のコンテキストモデルは、最初のシグナリングの値に依存できる。
・最後の重要な位置から独立している走査パターンを導出するために、前述のいずれかの方法が、最後の重要な位置にシグナリングするために、コンテキストモデルを導出するために使用される。

特定のバージョンにおいて、走査パターン導出は、最後の重要な位置に依存する：
・仮に、最後の走査位置が、ＴＵ内で、そのｘおよびｙ位置にシグナリングすることによって符号化されるならば、２番目の座標のコンテキストモデルは、既に最初の座標を知るとき、まだ可能な候補であるそれらの走査パターンに依存できる。
・仮に、最後の走査位置が、ＴＵ内で、そのｘおよびｙ位置にシグナリングすることによって符号化されるならば、２番目の座標のコンテキストモデルは、既に最初の座標を知るとき、走査パターンが既に唯一選択されるかどうかに依存し得る。

別のバージョンにおいて、走査パターン導出は、最後の重要な位置から独立している。
・コンテキストモデルは、特定のＴＵ内の使用された走査パターンに依存できる。
・走査パターンを導出するために前述した方法のいずれかが、最後の重要な位置にシグナリングするためにコンテキストモデルを導出するために使用され得る。

ＴＵ内の重要な位置と重要なフラグ（一つの変換係数のためのサブグループフラグおよび／または重要なフラグ）を符号化するために、それぞれ、以下の変更がエンハンスメント層内で使用される：
・別々のコンテキストモデルは、ベース層情報を使用する全てのまたはサブセットの符号化モードに対して使用される。また、ベース層情報を有する異なるモードに対して異なるコンテキストモデルを使用することも可能である。
・コンテキストモデルは、併置されたベース層ブロック内のデータ（例えば、特定の周波数位置対して、重要な変換係数の数）に依存できる。
・走査パターンを導出するために前述した方法のいずれかが、重要な位置および／またはそれらのレベルをシグナリングするために、コンテキストモデルを導出するために使用され得る。
・符号化されるべき係数の空間的近傍内の既に符号化された変換係数レベルの重要な数、および、同様の周波数位置の併置されたベース層信号内の重要な変換係数の数の両方を評価する一般化されたテンプレートが、使用される。
・符号化されるべき係数の空間的近傍内の既に符号化された変換係数レベルの重要な数、および、同様の周波数位置の併置されたベース層信号内の重要な変換係数のレベルの両方を評価する一般化されたテンプレートが、使用され得る。
・サブグループフラグのためにモデル化されるコンテキストは、使用された走査パターンおよび／または特定の変換サイズに依存し得る。

ベース層とエンハンスメント層のための異なるコンテキスト初期化テーブルの使用法が使用され得る。エンハンスメント層のためのコンテキストモデル初期化は、以下の方法で変更され得る。
・エンハンスメント層は、初期化値の別々のセットを使用する。
・エンハンスメント層は、異なる操作モード（空間的／時間的、または、品質のスケーラビリティ）に対して、初期化値の別々のセットを使用し得る。
・ベース層内の計数部分を有するエンハンスメント層コンテキストモデルが、初期化状態として、それらの計数部分の状態を使用し得る。
・コンテキストモデルの初期状態を導出するためのアルゴリズムが、ベース層ＱＰおよび／またはデルタＱＰに依存し得る。

次に、ベース層データを使用して、後方の適合エンハンスメント層符号化の可能性が説明される。この以下の部分は、スケーラブルビデオ符号化システム内で、エンハンスメント層予測信号を生成する方法を説明する。その方法は、予測パラメータの値を推論するために画像のサンプル情報を復号化したベース層を使用し、予測パラメータの値は、符号化映像ビットストリーム内に送信されないけれども、エンハンスメント層のための予測信号を形成するために使用される。従って、エンハンスメント層信号を符号化するために必要な総合的なビットレートは減少する。

最先端のハイブリッドビデオエンコーダは、原初（ソース）イメージを、通常、階層構造に従って、異なるサイズのブロックに分解する。各ブロックに対して、ビデオ信号は、空間的に隣接するブロックから予測される（イントラ予測）、または、以前に時間的に符号化された画像から予測される（インター予測）。予測と実際のイメージとの間の差は、変換と量子化である。結果としてもたらされる予測パラメータと変換係数は、符号化映像ビットストリームを形成するためにエントロピー符号化される。整合しているデコーダは、逆の順序のステップに従う…
ビットストリームを符号化するスケーラブルビデオは、様々な層で構成される：完全な復号化可能ビデオを提供するベース層と、復号化のために追加して使用され得るエンハンスメント層とである。エンハンスメント層は、より高い空間解像度（空間的スケーラビリティ）、時間解像度（時間的スケーラビリティ）または品質（ＳＮＲスケーラビリティ）を提供できる。
Ｈ．２６４／ＡＶＣＳＶＣのような以前の規格では、動きベクトル、参照画像インデックスまたはイントラ予測モードのような構文要素は、符号化されたベース層内の対応する構文要素から直接に予測される。
エンハンスメント層内では、メカニズムは、ブロックレベルで、ベース層構文要素から導出された、あるいは、別のエンハンスメント層構文要素または復号化されたエンハンスメント層サンプルから予測された予測信号を使用して、その間において切換えるために存在する。

以下の部分では、ベース層データが、デコーダ側でエンハンス層パラメータを導出するために使用される。

［方法１：動きパラメータ候補導出］
空間的または品質的エンハンスメント層の画像のブロック（ａ）に対して、ベース層の画像の対応するブロック（ｂ）が決定され、それは同じ画像領域をカバーする。
エンハンスメント層のブロック（ａ）についてのインター予測信号は、以下の方法を使用して形成される：
１．動き補償パラメータセット候補は、例えば、時間的または空間的に隣接するエンハンスメント層ブロックまたはそれの導出物から決定される。
２．動き補償は、各候補動き補償パラメータセットに対して、エンハンスメント層内でインター予測信号を形成するために実行される。
３．最良の動き補償パラメータセットは、エンハンスメント層ブロック（ａ）のための予測信号と、ベース層ブロック（ｂ）の再構成信号との間の誤差の大きさを最小にすることによって選択される。空間的スケーラビリティについて、ベース層ブロック（ｂ）は、補間フィルタを使用して、空間的にアップサンプリングされる。

動き補償パラメータセットは、動き補償パラメータの特定の組合わせを含む。

動き補償パラメータは、動きベクトル、参照画像インデックス、１つおよび２つの予測と別のパラメータとの間の選択であり得る。

二者択一の実施の形態において、ベース層ブロックから、動き補償パラメータセットの候補が使用される。また、インター予測は、（ベース層の参照画像を使用して、）ベース層内で実行される。誤差の大きさを適用するために、ベース層ブロック（ｂ）再構成信号が、アップサンプリングされることなく、直接に使用され得る。選択された最適動き補償パラメータセットは、エンハンスメント層の参照画像に適用されて、ブロック（ａ）の予測信号を形成する動きベクトルが空間エンハンスメント層内で適用されるとき、動きベクトルは解像度変化に従ってスケーリングされる。
エンコーダとデコーダの両方が、利用可能な候補内で、最適動き補償パラメータセットを選択して、同じ予測信号を作成するために、同じ予測ステップを実行できる。これらのパラメータは、符号化映像ビットストリーム内ではシグナリングされない。

予測方法の選択は、ビットストリーム内でシグナリングされ、エントロピー符号化を使用して、符号化され得る。階層的なブロックサブ分割構造内で、この符号化方法は、あらゆるサブレベル、または、代わりに符号化階層構造のサブセットだけで選択できる。代わりの実施の形態において、エンコーダは、改良動きパラメータセット予測信号をデコーダに送信できる。リファインメント信号は動きパラメータの符号化された値を差分的に含む。リファインメント信号は、エントロピー符号化される。

代替の実施の形態において、デコーダは最良候補のリストを生成する。使用された動きパラメータセットのインデックスは、符号化映像ビットストリーム内でシグナリングされる。インデックスは、エントロピー符号化される。実施例において、リストは誤差の大きさを増加させることによって順序付けし得る。

実施例は、ＨＥＶＣの適応動きベクトル予測（ＡＭＶＰ）候補リストを使用して動き補償パラメータセット候補を生成する。
別の実施例は、ＨＥＶＣのマージモード候補リストを使用して、動き補償パラメータセット候補を生成する。

［方法２：動きベクトル導出］
空間的または品質のエンハンスメント層の画像のブロック（ａ）に対して、同じ画像領域をカバーするベース層画像の対応するブロック（ｂ）が決定される。

エンハンスメント層のブロック（ａ）についてのインター予測信号は、以下の方法を使用して形成される：
１．動きベクトル予測が選択される。
２．検索位置の定義されたセットの動きの推定が、エンハンスメント層参照画像で実行される。
３．それぞれの検索位置に対して、誤差の大きさが決定され、最も小さい誤差を有する動きベクトルが選択される。
４．ブロック（ａ）の予測信号が、選択された動きベクトルを使用して形成される。

代替の実施の形態において、検索が、再構成されたベース層信号で実行される。空間スケーラビリティに対して、選択された動きベクトルは、ステップ４内で予測信号を生成する前に、空間解像度変化に従って、スケーリングされる。

検索位置は、完全な解像度またはサブペル（ｓｕｂ－ｐｅｌ）の解像度でもよい。また、検索は複数のステップ内で、例えば、選択された完全ペル位置に基づいた別のセットの候補が後に続く、最良の完全ペル位置を最初に決定することを実行できる。例えば、誤差の大きさが、定義された閾値の下であるとき、検索を早く終了できる。

エンコーダとデコーダの両方が、候補内で最適動きベクトルを選択して、同じ予測信号を生成するために、同じ予測ステップを実行できる。これらのベクトルは、符号化映像ビットストリーム内ではシグナリングされない。

予測方法の選択は、ビットストリーム内でシグナリングして、エントロピー符号化を使用して、符号化され得る。階層的なブロックサブ分割構造内で、この符号化方法が、あらゆるサブレベル内で、または、代わりの符号化階層のサブセットだけで選択され得る。代替の実施の形態において、エンコーダは、改良動きベクトル予測信号をデコーダに送信できる。リファインメント信号は、エントロピー符号化される。

実施例は、方法１で記載されたアルゴリズムを使用して、動きベクトル予測器を選択する。

別の実施例は、ＨＥＶＣの適応動きベクトル予測（ＡＭＶＰ）方法を使用してエンハンスメント層の時間的または空間的に隣接するブロックから動きベクトル予測器を選択する。

［方法３：イントラ予測モード導出］
エンハンスメント層（ｎ）画像内の各ブロック（ａ）に対して、再構成されたベース層（ｎ－１）画像内の同じ領域をカバーする、対応するブロック（ｂ）が決定される。

スケーラブルビデオデコーダにおいて、それぞれのベース層ブロック（ｂ）に対して、イントラ予測信号が、以下のアルゴリズムによって推論されるイントラ予測モード（ｐ）を使用して、形成される。
１）イントラ予測信号は、エンハンスメント層のイントラ予測のための規則に従い、しかし、ベース層からサンプル値を使用して、それぞれの利用可能なイントラ予測モードのために生成される。
２）最良予測モード（ｐ_best）は、イントラ予測信号と復号化されたベース層ブロック（ｂ）との間の誤差の大きさ（例えば、絶対差の合計）を最小にすることによって決定される。
３）ステップ２）内で選択された予測（ｐ_best）モードは、エンハンスメント層のためのイントラ予測規則に従って、エンハンスメント層ブロック（ａ）のための予測信号を生成するために使用される。

エンコーダとデコーダの両方が、最良予測モード（ｐ_best）を選択して、整合している予測信号を形成するために、同じステップを実行できる。従って実際のイントラ予測モード（ｐ_best）は、符号化映像ビットストリーム内でシグナリングされない。

予測方法の選択は、ビットストリーム内でシグナリングされて、エントロピー符号化を使用して、符号化され得る。階層的なブロックサブ分割構造内で、この符号化モードは、あらゆるサブレベル内で、または、替りに符号化階層のサブセットだけで選択され得る。代わりの実施の形態は、ステップ２）内でエンハンスメント層からサンプルを使用してイントラ予測信号を生成する。空間スケーラブルエンハンスメント層に対して、ベース層は、誤差の大きさを適用するために、補間フィルタを使用して、アップサンプリングできる。

代替の実施の形態は、エンハンスメント層ブロックを、より小さいブロックサイズ（ａ_i）の複数のブロックに分ける（例えば、１６×１６ブロック（ａ）は１６個の４×４ブロック（ａ_i）に分けられ得る）。前述したアルゴリズムは、それぞれのサブブロック（ａ_i）と、対応するベース層ブロック（ｂ_i）とに適用される。ブロック（ａ_i）の予測の後に、残差符号化が適用される、そして、結果は、ブロック（ａ_i+1）を予測するために使用される。

代替の実施の形態は、（ｂ）または（ｂ_i）の周囲のサンプル値を使用して、予測されたイントラ予測モード（ｐ_best）を決定する。例えば、空間エンハンスメント層（ｎ）の４×４ブロック（ａ_i）が、対応する２×２ベース層ブロック（ｂ_i）を有するとき、（ｂ_i）の周囲のサンプルが、予測されたイントラ予測モード（ｐ_best）の決定のために使用される４×４ブロック（ｃ_i）を形成するために使用される。

代替の実施の形態において、エンコーダは、リファインメントイントラ予測方向信号をデコーダに送信できる。例えば、ＨＥＶＣのような映像コーデックにおいて、ほとんどのイントラ予測モードが、境界画素が予測信号を形成するために使用される角度に対応している。最適モードへのオフセットが、（上で説明されているように決定されている）予測された予測モード（ｐ_best）に対する差分として送信される。改良モードは、エントロピー符号化される。

イントラ予測モードは、通常、それらの確率に依存して符号化される。Ｈ．２６４／ＡＶＣにおいて、最尤モードは、ブロックの（空間的）近傍で使用されるモードに基づいて決定される。ＨＥＶＣリストにおいて、最尤モードが作成される。これらの最尤モードは、全体のモード数が必要とするより少ない、ビットストリーム内のシンボルを使用して選択され得る。代替の実施の形態は、最尤モード、または、最尤モードのリストのメンバーとして、ブロック（ａ）（前述のアルゴリズムで説明されているように決定されている）に対して、予測されたイントラ予測モード（ｐ_best）を使用する。

［方法４：境界領域を使用するイントラ予測］
スケーラブルまたは品質のエンハンスメント層のブロック（ａ）（図４５参照）のためのイントラ予測信号を形成するためのスケーラブルビデオデコーダにおいて、同じ層の周囲領域からのサンプル（ｂ）のラインは、ブロック領域内に満たされるように使用される。これらのサンプルは、既に符号化された領域から取得される（通常、しかし、上側と左側の境界上には必要ない）。

これらの画素を選択する以下の代替の変形が使用され得る。
ａ）仮に、周囲領域内の画素が、まだ符号化されていないならば、画素値は、現在のブロックを予測するために使用されない。
ｂ）仮に、周囲領域内の画素が、まだ符号化されていないならば、画素値は、既に符号化された隣接する画素から導出される（例えば、反復によって）。
ｃ）仮に、周囲領域内の画素が、まだ符号化されていないならば、画素値は、復号化されたベース層画像の対応する領域内で画素から導出される。

ブロック（ａ）のイントラ予測を形成するために、上で説明するように導出される画素（ｂ）の隣接するラインが、テンプレートとして使用され、ブロック（ａ）のそれぞれのライン（ａ_j）内を満たす。

ブロック（ａ）のライン（ａ_j）は、ｘ軸に沿って一つ一つ満たされる。可能な限り良い予測信号を達成するために、テンプレートサンプル（ｂ）の列は、ｙ軸に沿って移行して、関連ライン（ａ_j）のための予測信号（ｂ´_j）を形成する。

各ライン内で最適の予測を見つけるために、シフトオフセット（ｏ_j）が、結果として得られた予測信号（ａ_j）とベース層内の対応するラインのサンプル値との間の誤差の大きさを最小にすることによって、決定される。

仮に、（ｏ_j）が非整数値であれば、補間フィルタが、（ｂ´₇）内に示されているように、（ａ_j）の整数サンプル位置に（ｂ）の値を写像するために使用され得る。

仮に、空間スケーラビリティが使用されるならば、補間フィルタが、ベース層の対応するラインのサンプル値の整合する数を作成するために使用され得る。

充填方向（ｘ軸）は、水平（左右）、垂直（上下）、対角またはいかなる他の角度にもできる。テンプレートライン（ｂ）のために使用されるサンプルは、ｘ軸に沿ったブロックの直接隣接するサンプルである。テンプレートライン（ｂ）は、ｘ軸に対して９０°の角度を形成するｙ軸に沿って移行する。

ｘ軸の最適な方向を見つけるために、完全イントラ予測信号が、ブロック（ａ）のために生成される。予測信号と対応するベース層ブロックとの間の最小の誤差大きさを有する角度が選択される。
可能な角度の数は制限される。

エンコーダとデコーダの両方が、同じアルゴリズムを実行し、最良の予測角度とオフセットとを決定する。どんな明白な角度情報またはオフセット情報も、ビットストリーム内でシグナリングされる必要はない。
代替の実施の形態では、ベース層の画像のサンプルだけが、オフセット（ｏ_i）を決定するために使用され得る。

代替の実施の形態では、予測されたオフセット（ｏ_i）の改良（例えば、差分の値）が、ビットストリーム内でシグナリングされる。エントロピー符号化が、改良オフセット値を符号化するために使用される。

代替の実施の形態では、予測された方向の改良（例えば、差分の値）が、ビットストリーム内で、シグナリングされる。エントロピー符号化が、改良方向値を符号化するために使用され得る。

仮に、ライン（ｂ´_j）が予測のために使用されるならば、代替の実施の形態は、閾値を使用して、選択する。仮に、最適なオフセット（ｏ_j）のための誤差大きさが、閾値未満であるならば、ライン（ｃ_i）は、ブロックライン（ａ_j）の値を決定するために使用される。仮に、最適なオフセット（ｏ_j）のための誤差の大きさが、閾値以上であるならば、（アップサンプリングされた）ベース層信号は、ブロックライン（ａ_j）の値を決定するために使用される。

［方法５：別の予測パラメータ］
別の予測情報が、例えば、サブブロック内のブロックのパーティションのために、方法１～３と同様にして推論される。

空間または品質のエンハンスメント層の画像のブロック（ａ）に対して、ベース層の画像の対応するブロック（ｂ）の画像が決定される。それは、同じ画像領域をカバーする。

エンハンスメント層のブロック（ａ）のための予測信号は、以下の方法を使用して形成される。
１）予測信号は、テストされたパラメータのそれぞれの可能な値のために生成される。
２）最も良い予測モード（ｐ_best）が、予測信号と復号化されたベース層ブロック（ｂ）との間の誤差の大きさ（例えば、絶対差の合計）を最小にすることによって決定される。
３）ステップ２）で選択された予測（ｐ_best）モードが、エンハンスメント層ブロック（ａ）のための予測信号を生成するために使用される。

エンコーダとデコーダの両方が、可能な候補内で最適な予測モードを選択して同じ予測信号を生成するために、同じ予測ステップを実行できる。実際の予測モードは、符号化映像ビットストリーム内でシグナリングされない。

予測方法の選択が、ビットストリーム内でシグナリングされて、エントロピー符号化を使用して符号化され得る。階層的なブロックサブ分割構造内で、この符号化方法は、あらゆるサブレベル内で、または、符号化階層のサブセットのみに対して二者択一的に選択され得る。

以下の記述は、簡潔に、上の実施の形態のいくつかをまとめる。

［再構成されたベース層のサンプルを使用して、イントラ予測信号を生成するための多重方法を有するエンハンスメント層符号化］
主な実施例：エンハンスメント層内のブロックを符号化することに対して、再構成されたベース層のサンプルを使用してイントラ予測信号を生成するための多重方法が、再構成されたエンハンスメント層のサンプルだけに基づく予測信号を生成する方法に加えて、提供される。

サブ実施例：
・多重方法は以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、エンハンスメント層予測信号として直接に使用される。
・多重方法は以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、空間イントラ予測信号に結合される。そこでは、空間イントラ予測が、隣接するブロックに対して差分サンプルに基づいて導出される。差分サンプルは、再構成されたエンハンスメント層信号と（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号との差を表わす（態様Ａ参照）。
・多重方法は以下の方法を含む。（隣接する再構成されたエンハンスメント層のサンプルを使用して得られた）従来の空間イントラ予測信号は、（アップサンプリングされた／フィルタにかけられた）ベース層残差信号（ベース層変換係数の逆変換、または、ベース層再構成とベース層予測の差）に結合される（態様Ｂ参照）。
・多重方法は以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、空間イントラ予測信号に結合される。そこでは、空間イントラ予測が、隣接するブロックの再構成されたエンハンスメント層のサンプルに基づいて導出される。最終予測信号が、異なる周波数成分が異なる重み付けを使用する方法で、空間予測信号とベース層予測信号とに重み付けすることによって得られる（態様Ｃ１参照）。
これは、例えば、以下のどれかによって実現され得る。
○ベース層予測信号を、ローパスフィルタによってフィルタにかけ、空間イントラ予測信号を、ハイパスフィルタによってフィルタにかけ、得られたフィルタにかけられた信号を加算すること（態様Ｃ２参照）。
○ベース層予測信号とエンハンスメント層予測信号を変換し、得られた変換ブロックを重ねる。そこでは、異なる重み付け係数が、異なる周波数位置に対して使用される（実施例Ｃ３参照）。得られた変換ブロックは、逆変換され得て、エンハンスメント層予測信号として使用される。あるいは、得られた変換係数は、スケーリングされた送信された変換係数レベルに追加され、次に、非ブロック化およびループ内処理の前に再構成されたブロックを得るために、逆変換される（態様Ｃ４参照）。
・再構成されたベース層信号を使用する方法に対して、以下のバージョンが使用され得る。これは固定され得る、または、それは、系列レベル、画像レベル、スライスレベル、最大符号化単位レベル、符号化単位レベルでシグナリングされ得る。または、それは、別の符号化パラメータに依存して作成され得る。
○非ブロック化およびループ内処理の前の再構成されたベース層のサンプル（サンプル適応型オフセットフィルタまたは適応型ループフィルタなど）。
○非ブロック化の後で、ループ内処理の前の再構成されたベース層のサンプル（サンプル適応型オフセットフィルタまたは適応型ループフィルタなど）。
○非ブロック化およびさらなるループ内処理（サンプル適応型オフセットフィルタまたは適応型ループフィルタなど）の後、または、多重ループ内処理ステップの間の後の再構成されたベース層のサンプル（態様Ｄ参照）
・（アップサンプリングされた／フィルタにかけられた）ベース層信号を使用する方法の多重バージョンが使用され得る。これらのバージョンのために採用された、アップサンプリングされた／フィルタにかけられたベース層信号が、使用された補間フィルタ（整数サンプル位置をフィルタにかける補間フィルタを含む）内で異なり得る。または、２番目のバージョンのためにアップサンプリングされた／フィルタにかけられたベース層信号が、最初のバージョンのためにアップサンプリングされた／フィルタにかけられたベース層信号をフィルタにかけることによって得られ得る。異なるバージョンの１つの選択が、系列レベル、画像レベル、スライスレベル、最大符号化単位レベル、符号化単位レベルでシグナリングされ得る。それは、対応する再構成されたベース層信号、または、送信された符号化パラメータの特性から推論され得る（態様Ｅ参照）。
・異なるフィルタが、再構成されたベース層信号（態様Ｅ参照）およびベース層残差信号（態様Ｆ参照）を、アップサンプリングする／フィルタにかけるために使用され得る。
・残差信号がゼロであるベース層ブロックに対して、それは、ベース層から導出された別の信号（例えば、再構成されたベース層ブロックのハイパスフィルタにかけられたバージョン）に取り替えられ得る、（態様Ｇ参照）。
・空間イントラ予測を使用するモードに対して、（特定の符号化順序による）エンハンスメント層内の利用できない隣接するサンプルが、アップサンプリングされた／フィルタにかけられたベース層信号の対応するサンプルに取替えられ得る（態様Ｈ参照）。
・空間イントラ予測を使用するモードに対して、イントラ予測モードの符号化が変更され得る。最尤モードのリストは、併置されたベース層信号のイントラ予測モードを含む。
・特定のバージョンにおいて、エンハンスメント層の画像は、２段階の処理内で復号化される。最初の段階では、予測のために、ベース層信号を使用のみするブロックだけ（隣接するブロックを使用しない）が、または、インター予測信号が、復号化され、再構成される。２番目の段階では、予測のための隣接するサンプルを使用する残りのブロックは、再構成され得る。２番目の段階で再構成されたブロックに対して、空間イントラ予測概念が拡張される（態様Ｉ参照）。既に再構成されたブロックの有用性に基づいて、現在のブロックの上側や左側に隣接するサンプルだけではなく、下側や右側に隣接するサンプルも、空間イントラ予測のために使用され得る。

［再構成されたベース層のサンプルを使用して、インター予測信号を発生させるための多重方法を有するエンハンスメント層符号化］
主な実施例：エンハンスメント層内のブロックを符号化することに対して、再構成されたベース層のサンプルを使用して、インター予測信号を発生させるための多重方法が、再構成されたエンハンスメント層のサンプルのみに基づいて予測信号を発生させる方法に追加して提供される。

サブ実施例：
・多重方法は以下の方法を含む。（既に再構成されたエンハンスメント層の画像の動き補償された補間によって導出される）従来のインター予測信号は、（アップサンプリングされた／フィルタにかけられた）ベース層残差信号（ベース層変換係数の逆変換、または、ベース層再構成とベース層予測との間の差）に結合される。
・多重方法は以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、動き補償予測信号に結合される。そこでは、動き補償予測信号が、動き補償差分画像によって得られる。差分画像は、参照画像に対して、再構成されたエンハンスメント層信号と（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号との間の差を表わす（実施例Ｊ参照）。
・多重方法は以下の方法を含む。（アップサンプリングされた／フィルタにかけられた）再構成されたベース層信号は、インター予測信号に結合される。そこでは、インター予測が、再構成されたエンハンスメント層の画像を使用して、動き補償予測によって導出される。最終予測信号が、異なる周波数成分が異なる重み付け付けを使用する方法で、インター予測信号およびベース層予測信号を重み付けすることによって得られる（実施例Ｃ参照）。
これは、例えば、以下のどれかによって実現できる。
○ローパスフィルタでベース層予測信号をフィルタにかけ、ハイパスフィルタでインター予測信号をフィルタにかけ、得られたフィルタにかけられた信号を加算すること。
○ベース層予測信号およびインター予測信号を変換し、得られた変換ブロックを重ねる。そこでは、異なる重み付け係数が、異なる周波数位置に対して使用される。得られた変換ブロックは、非ブロック化およびループ内処理の前に再構成されたブロックを得るために、逆変換され、エンハンスメント層予測信号として使用される、あるいは、得られた変換係数が、スケーリングされた送信された変換係数レベルに追加され、次に、逆変換される。
・再構成されたベース層信号を使用する方法に対して、以下のバージョンが使用され得る。これが固定され得る、または、それが、系列レベル、画像レベル、スライスレベル、最大符号化単位レベル、符号化単位レベルでシグナリングされ得る。または、それが、別の符号化パラメータに依存して作成され得る。
○非ブロック化およびループ内処理の前の再構成されたベース層のサンプル（サンプル適応型オフセットフィルタまたは適応型ループフィルタなど）。
○非ブロック化の後で、ループ内処理（サンプル適応型オフセットフィルタまたは適応型ループフィルタなど）を行う前の再構成されたベース層のサンプル。
○非ブロック化およびループ内処理（サンプル適応型オフセットフィルタまたは適応型ループフィルタなど）の後、または、多重ループ内処理ステップの間の再構成されたベース層のサンプル（態様Ｄ参照）。
・残差信号がゼロであるベース層ブロックに対して、それは、ベース層から導出された別の信号（例えば、再構成されたベース層ブロックのハイパスフィルタにかけられたバージョン）に取替えられ得る（実施例Ｇ参照）。
・（アップサンプリングされた／フィルタにかけられた）ベース層信号を使用する方法の多重バージョンが使用され得る。これらのバージョンのために採用された、アップサンプリングされた／フィルタにかけられたベース層信号が、使用された補間フィルタ（整数サンプル位置をフィルタにかける補間フィルタを含む）内で異なる。または、２番目のバージョンのためにアップサンプリングされた／フィルタにかけられたベース層信号が、最初のバージョンのためにアップサンプリングされた／フィルタにかけられたベース層信号をフィルタにかけることによって得られ得る。異なるバージョンの１つの選択が、系列レベル、画像レベル、スライスレベル、最大符号化単位レベル、符号化単位レベルでシグナリングされ得る。それは、対応する再構成されたベース層信号、または、送信された符号化パラメータの特性から推論され得る（実施例Ｅ参照）。
・異なるフィルタが、再構成されたベース層信号（実施例Ｅ参照）およびベース層残差信号（実施例Ｆ参照）を、アップサンプリングする／フィルタにかけるために使用され得る。
・差分画像（エンハンスメント層再構成と、アップサンプリングされた／フィルタにかけられたベース層信号との間の差）の動き補償予測に対して（実施例Ｊ参照）、異なる補間フィルタが、再構成された画像の動き補償予測に対してより使用される。
・差分画像（エンハンスメント層再構成と、アップサンプリングされた／フィルタにかけられたベース層信号との間の差）の動き補償予測に対して（実施例Ｊ参照）、補間フィルタが、差分画像内の対応する領域の特性に基づいて（または、符号化パラメータに基づいて、または、ビットストリーム内で送信された情報に基づいて）選択される。

［エンハンスメント層動きパラメータ符号化］
主な態様：エンハンスメント層動きパラメータ符号化のために、複数のエンハンスメント層予測器と、ベース層から導出された少なくとも１つの予測器との使用。

サブ実施例：
・（スケーリングされた）ベース層動きベクトルを、動きベクトル予測器リストに追加すること（実施例Ｋ参照）。
○現在のブロックの中央位置の併置されたサンプルをカバーするベース層ブロックの使用（可能な別の導出）。
○解像度比率に従うスケール動きベクトル。
・併置されたベース層ブロックの動きデータをマージ候補リストに加えること（実施例Ｋ参照）。
○現在のブロックの中央位置の併置されたサンプルをカバーするベース層ブロックの使用（可能な別の導出）。
○解像度比率に従うスケーリング動きベクトル。
○仮に、ベース層内で「マージ＿フラグ」が１と等しいならば、加算しない。
・ベース層マージ情報に基づくマージ候補リストの再順序付け（実施例Ｌ参照）
○仮に、併置されたベース層ブロックが、特定の候補にマージされるならば、対応するエンハンスメント層候補が、エンハンスメント層マージ候補リスト内で、最初のエントリーとして使用される。
・ベース層動き予測器情報に基づく動き予測器候補リストの再順序付け（実施例Ｌ参照）
○仮に、併置されたベース層ブロックが、特定の動きベクトル予測器を使用するならば、対応するエンハンスメント層動きベクトル予測器が、エンハンスメント層動きベクトル予測器候補リスト内で、最初のエントリーとして使用される。
・マージインデックスの導出（すなわち、現在のブロックがマージされる候補）は、併置されたブロック内のベース層情報に基づく（実施例Ｍ参照）。例として、仮に、ベース層ブロックが、特定の隣接するブロックにマージされ、そして、それが、エンハンスメント層ブロックもマージするビットストリーム内でシグナリングされるならば、マージインデックスは、全く送信されないけれども、代わりに、エンハンスメント層ブロックが、併置されたベース層ブロックとして、同じ隣接するブロック（しかし、エンハンスメント層内の）にマージされる。

［エンハンスメント層パーティションと動きパラメータ推論］
主な態様：ベース層パーティションおよび動きパラメータに基づいた、エンハンスメント層パーティションおよび動きパラメータの推論（おそらく、この態様をサブ態様のどれかに結合することが要求される）。

サブ態様：
・併置されたベース層動きデータに基づくエンハンスメント層のＮ×Ｍサブブロックのための動きパラメータを導出すること。同じ導出されたパラメータ（または、小さい差を有するパラメータ）を有するブロックを、より大きいブロックに纏めること。予測と符号化単位を決定すること。（実施例Ｔ参照）
・動きパラメータは、動き仮説、参照インデックス、動きベクトル、動きベクトル予測器識別子、マージ識別子の数を含み得る。
・エンハンスメント層予測信号を発生させるための多重方法の１つにシグナリングすること。そのような方法は以下を含み得る。
○導出された動きパラメータおよび再構成されたエンハンスメント層の参照画像を使用する動き補償。
○（ａ）現在の画像のための（アップサンプリングされた／フィルタにかけられた）ベース層再構成と、（ｂ）得られた動きパラメータを使用する動き補償信号と、再構成されたエンハンスメント層の画像から、（アップサンプリングされた／フィルタにかけられた）ベース層再構成を引き算することによって生成されるエンハンスメント層の参照画像とを結合すること。
○（ａ）現在の画像のための（アップサンプリングされた／フィルタにかけられた）ベース層残差（再構成された信号と予測との間の差、または、符号化された変換係数値の逆変換）と、（ｂ）得られた動きパラメータを使用する動き補償信号と、再構成されたエンハンスメント層の参照画像とを結合すること。
・仮に、ベース層内の併置されたブロックが、イントラ符号化されているならば、対応するエンハンスメント層Ｍ×Ｎブロック（または、ＣＵ）も、また、イントラ符号化される。そこでは、イントラ予測信号が、ベース層情報を使用して導出される（態様Ｕ参照）。例えば、
○対応するベース層再構成の（アップサンプリングされた／フィルタにかけられた）バージョンは、イントラ予測信号として使用される（態様Ｕ参照）。
○イントラ予測モードは、ベース層内で使用されたイントラ予測モードに基づいて導出される。そして、このイントラ予測モードは、エンハンスメント層内の空間イントラ予測のために使用される。
・仮に、Ｍ×Ｎエンハンスメント層ブロック（サブブロック）のための併置されたベース層ブロックが、以前に符号化されたベース層ブロックにマージされる（または、同じ動きパラメータを有する）ならば、Ｍ×Ｎエンハンスメント層（サブ）ブロックも、また、ベース層内でマージするために使用されるベース層ブロックに対応するエンハンスメント層ブロックにマージされる（すなわち、動きパラメータは、対応するエンハンスメント層ブロックからコピーされる）（実施例Ｍ参照）。

［変換係数レベルの符号化／コンテキストモデル化］
主な態様：異なる走査パターンを使用して、変換係数を符号化すること。エンハンスメント層に対して、符号化モードおよび／またはベース層データに基づいてコンテキストをモデル化すること、そして、コンテキストモードに対して異なる初期化をすること。

サブ実施例：
・１つ以上の追加走査パターン、例えば、水平で垂直な走査パターンを導入すること。追加走査パターンのためにサブブロックを再定義すること。４×４サブブロックの代わりに、例えば１６×１または１×１６サブブロックが使用され得る。または、８×２や８×２サブブロックが使用され得る。追加走査パターンは、特定のサイズ、例えば８×８または１６×１６より大きいまたは等しいブロックに対してのみ導入され得る（実施例Ｖ参照）。
・（仮に、符号化されたブロックフラグが１と等しいならば、）選択された走査パターンは、ビットストリーム内でシグナリングされる（実施例Ｎ参照）。対応する構文要素にシグナリングするために、固定コンテキストが使用される。または、対応する構文要素のためのコンテキスト導出は、以下のどれかに依存できる。
○併置された再構成されたベース層信号または再構成されたベース層残差の勾配。または、ベース層信号内で検出されたエッジ。
○併置されたベース層ブロック内の変換係数分布。
・選択された走査は、併置されたベース層信号の特性に基づいて、ベース層信号（どんな追加データも送信されることなく）から直接に得られ得る（実施例Ｎ参照）。
○併置された再構成されたベース層信号または再構成されたベース層残差の勾配。または、ベース層信号内で検出されたエッジ。
○併置されたベース層ブロック内の変換係数分布。
・異なる走査が、変換係数がエンコーダ側で量子化の後に再順序付けされ、かつ、従来の符号化が使用される方法で実現され得る。デコーダ側では、変換係数は、従来通り復号化され、スケーリングおよび逆変換前に（または、スケーリング後および逆変換前に）、再順序付けされる。
・重要なフラグ（単一の変換係数のためのサブグループフラグおよび／または重要なフラグ）を符号化するために、以下の変更が、エンハンスメント層内で使用され得る。
○分離コンテキストモデルが、ベース層情報を使用する符号化モードの全てまたはサブセットのために使用される。また、ベース層情報を有する異なるモードに対して、異なるコンテキストモデルを使用することも可能である。
○コンテキストモデル化は、併置されたベース層ブロックのデータ（例えば、特定の周波数位置のための重要な変換係数の数）に依存できる（実施例Ｏ参照）。
○符号化されるべき係数の空間的近傍内の既に符号化された重要な変換係数レベルの数、および、同様の周波数位置の併置されたベース層信号内の重要な変換係数の数の両方を評価した一般化されたテンプレートが使用され得る（実施例Ｏ参照）。
・最後の重要な走査位置を符号化するために、以下の変更がエンハンスメント層内で使用され得る。
○分離コンテキストモデルが、ベース層情報を使用する符号化モードの全てまたはサブセットのために使用される。また、ベース層情報を有する異なるモードに対して、異なるコンテキストモデルを使用することも可能である（実施例Ｐ参照）。
○コンテキストモデル化は、併置されたベース層ブロック内のデータに依存できる（例えば、ベース層内の変換係数分布、ベース層の勾配情報、併置されたベース層ブロック内の最後の走査位置）。
○最後の走査位置は、最後のベース層走査位置に対する差として符号化できる（実施例Ｓ参照）。
・ベース層およびエンハンスメント層のための異なるコンテキスト初期化テーブルの使用。

［ベース層データを使用する、後方の適応エンハンスメント層の符号化］
主な実施例：エンハンスメント層符号化パラメータを導出するためのベース層データの使用。

サブ態様：
・（潜在的にアップサンプリングされる）ベース層再構成に基づいたマージ候補を導出すること。エンハンスメント層内では、マージの使用のみがシグナリングされる。しかし、実際には、現在のブロックをマージするために使用される候補が、再構成されたベース層信号に基づいて導出される。従って、全てのマージ候補に対して、現在のエンハンスメント層ブロックのための（潜在的にアップサンプリングされる）ベース層信号と、（マージ候補に動きパラメータを使用して導出された）対応する予測信号との間の誤差の大きさが、全てのマージ候補（または、そのサブセット）に対して評価される。そして、最も小さい誤差の大きさに関連するマージ候補が選択される。また、誤差の大きさが、再構成されたベース層信号とベース層の参照画像とを使用して、ベース層内で計算され得る（実施例Ｑ参照）。
・（潜在的にアップサンプリングされる）ベース層再構成に基づいたマージ候補を得ること。動きベクトル差分は、符号化されないけれども、再構成されたベース層に基づいて推論される。現在のブロックのために、動きベクトル予測器を決定し、動きベクトル予測器の周囲に位置する定義された検索のセットを評価すること。それぞれの検索位置に対して、現在のエンハンスメント層ブロックのための（潜在的にアップサンプリングされる）ベース層信号と、置き換えられた参照フレーム（置換えは、検索位置によって与えられる）との間の誤差の大きさを決定すること。最小誤差の大きさをもたらす検索位置／動きベクトルを選択すること。検索は、いくつかの段階に分けられ得る。例えば、完全なペル検索が最初に行われる。続いて、半ペル検索が、全ペルベクトルの周囲で行われる。続いて、４分の１ペル検索が、最良全／半ペルベクトルの周囲で行われる。また、検索は、再構成されたベース層信号とベース層の参照画像とを使用して、ベース層内で行われ得る。発見された動きベクトルは、次に、ベース層とエンハンスメント層との間の解像度変化に従ってスケーリングされる（実施例Ｑ参照）。
・（潜在的にアップサンプリングされる）ベース層再構成に基づいたイントラ予測モードを導出すること。イントラ予測モードは、符号化されないけれども、再構成されたベース層に基づいて推論される。それぞれの可能なイントラ予測モード（または、そのサブセット）に対して、（テストされた予測節（ノード）を使用して、）現在のエンハンスメント層ブロックのための（潜在的にアップサンプリングされる）ベース層信号と、イントラ予測信号との間の誤差の大きさを決定すること。最小誤差の大きさをもたらす予測モードを選択すること。また、誤差の大きさの計算は、ベース層内の再構成されたベース層信号とイントラ予測信号とを使用して、ベース層内でなされ得る。さらに、イントラブロックは、４×４ブロック（または、別のブロックサイズ）に分解できる。そして、各４×４ブロックに対して、分離イントラ予測モードが決定される（実施例Ｑ参照）。
・イントラ予測信号は、再構成されたベース層信号を有する境界サンプルの行方向の整合または列方向の整合によって決定され得る。隣接するサンプルと現在のライン／列との間のシフトを導出するために、誤差の大きさは、隣接するサンプルのシフトされたライン／列と再構成されたベース層信号との間で計算される。そして、最小誤差の大きさをもたらすシフトが、選択される。隣接するサンプルとして、（アップサンプリングされた）ベース層のサンプル、または、エンハンスメント層のサンプルが使用され得る。また、誤差の大きさが、ベース層内で直接に計算され得る（実施例Ｗ参照）。
・ブロックパーティションなどの別の符号化パラメータの導出のために、後述の適応方法を使用すること。

前記実施の形態の更なる簡潔な概要が、以下に提示される。特に、前記実施の形態が説明される。

Ａ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，２００ｂ，２００ｃ）を再構成（８０）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
再構成されたベース層信号（２００ａ，２００ｂ，２００ｃ）に解像度または品質改良を受け（２２０）させて、層間予測信号（３８０）を得、
エンハンスメント層信号の既に再構成された部分（４００ａまたは４００ｂ）と層間予測信号（３８０）との間の差分信号を計算（２６０）し、
現在再構成されるべきエンハンスメント層信号（３６０）の部分に併置された第１の部分（４４０、図４６に例えて）で、空間的に前記第１の部分に隣接し、かつ、エンハンスメント層信号（３６０）の既に再構成された部分に属する、差分信号の第２の部分（４６０）から差分信号を空間的に予測（２６０）して、空間イントラ予測信号を得、
層間予測信号（３８０）と空間イントラ予測信号とを結合（２６０）して、エンハンスメント層予測信号（４２０）を得、
エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３２０，５８０，３４０，３００，２８０）することを含む、ように構成されている。
実施例Ａ１に従って、ベース層信号は、例えば、ベース層残差信号６４０／４８０が関連する限り、変換復号化を有する前述したブロックに基づいた予測方法で、符号化データストリーム６またはサブストリーム６ａから、ベース層復号化ステージ８０によってそれぞれ再構成され得る。しかし、別の代替の再構成も可能である。
エンハンスメント層復号化ステージ６０によるエンハンスメント層信号３６０の再構成に関する限り、再構成されたベース層信号２００ａ，２００ｂまたは２００ｃが受ける解像度または品質の改良は、例えば、解像度の改良の場合にはアップサンプリング、または、品質の改良の場合にはコピー、または、ビット深さの改良の場合にはｎビットからｍビットへのトーンマッピング（ｍ＞ｎ）を意味する。
差分信号の計算は、画素単位でなされる。すなわち、一方にエンハンスメント層信号および他方に予測信号３８０が併置された画素が、互いからを引き算される。そして、これは画素位置毎になされる。
差分信号の空間予測は、符号化データストリーム６内で、または、サブストリーム６ｂ内で、イントラ予測方向のようなイントラ予測パラメータを送信して、そして、エンハンスメント層信号の現在の部分内のこのイントラ予測方向に沿って、現在再構成されるべきエンハンスメント層信号３６０の部分に接する既に再構成された画素をコピー／補間するような、何らかの方法によってなされ得る。組合せは、周波数領域内の寄与を異なって重み付けする組合せのように、加算、重み付けされた合計または更に精巧な組合せを意味し得る。
エンハンスメント層予測信号４２０を使用するエンハンスメント層信号３６０の予測再構成は、図に示されているように、エンハンスメント層残差信号５４０のエントロピー復号化および逆変換と、エンハンスメント層予測信号４２０および後者５４０の組合せ３４０とを意味する。

Ｂ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層残差信号（４８０）を復号化（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
層間残差予測信号（３８０）を得るために、再構成されたベース層残差信号（４８０）に、解像度または品質の改良を受け（２２０）させ、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号（３６０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間的に予測（２６０）し、
エンハンスメント層予測信号（４２０）を得るために、層間残差予測信号とエンハンスメント層イントラ予測信号とを結合（２６０）して、
エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３４０）することを含む、ように構成されている。
符号化データストリームからのベース層残差信号の復号化は、図に示すように、エントロピー復号化と逆変換とを使用して実行され得る。さらに、スケーラブルビデオデコーダは、オプションで、ベース層予測信号６６０を導出して、この信号とベース層残差信号４８０とを結合することによって、予測的に復号化することによって、ベース層信号自体の再構成を実行し得る。ちょうど言及するように、これは単に任意である。
エンハンスメント層信号の再構成に関する限り、解像度または品質の改良が、実施例Ａ）に対して前記指示したように実行される。
また、エンハンスメント層信号の部分の空間的予測に関する限り、この空間的予測は、異なる信号に関するＡ）に例示的に概説されているように実行され得る。組合せと予測的再構成に関する限り、同様の注意は有効である。
しかしながら、実施例Ｂ）内のベース層残差信号４８０が、ベース層残差信号４８０の明らかにシグナリングされたバージョンと等しいように制限されないということが言及されるべきである。むしろ、スケーラブルビデオデコーダが、ベース層予測信号６６０を有するどんな再構成されたベース層信号バージョン２００も引き算すること、は可能である。その結果、フィルタ１２０または１４０のようなフィルタ関数から食い止めている偏差によって明らかにシグナリングされたものから逸れるベース層残差信号４８０を得る。また、後者の状態は、ベース層残差信号が層間予測に関わる別の実施例に対しても有効である。

Ｃ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，２００ｂ，２００ｃ）を再構成（８０）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
層間予測信号（３８０）を得るために、再構成されたベース層信号（２００）に、解像度または品質の改良を受け（２２０）させ、
エンハンスメント層イントラ予測信号を得るために、エンハンスメント層信号（３６０）の既に再構成された部分（「空間的」の場合は４００ａ，ｂ；「時間的」の場合は４００ａ，ｂ，ｃ）から現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間的または時間的に予測（２６０）し、
層間予測信号とエンハンスメント層内部予測信号（３８０）がエンハンスメント層予測信号（４２０）に寄与する重み付けが、異なる空間周波数成分に亘って変化させるように、エンハンスメント層予測信号（４２０）を得るために、現在再構成されるべき部分で、層間予測信号とエンハンスメント層内部予測信号（３８０）との重み付け平均を形成（２６０）して、
エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３４０）することを含む、ように構成されている。

Ｃ２）ここで、重み付け平均の形成（２６０）は、現在再構成されるべき部分で、フィルタがかけられた信号を得るために、ローパスフィルタで層間予測信号（３８０）をフィルタ（２６０）にかけ、かつ、ハイパスフィルタでエンハンスメント層内部予測信号をフィルタ（２６０）にかけて、得られたフィルタにかけられた信号を合計することを含む。
Ｃ３）ここで、重み付け平均の形成（２６０）は、現在再構成されるべき部分で、変換係数を得るために、層間予測信号とエンハンスメント層内部予測信号とを変換（２６０）し、そして、重畳された変換係数を得るために、得られた変換係数に、異なる空間周波数成分に対して異なる重み付け係数を使用して重畳（２６０）し、そして、エンハンスメント層予測信号を得るために、重畳された変換係数を逆変換することを含む。
Ｃ４）ここで、エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号の予測再構成（３２０，３４０）は、符号化データストリーム（６）からエンハンスメント層信号のための変換係数レベルを引き出し（３２０）、エンハンスメント層信号の変換バージョンを得るために、変換係数レベルと重畳された変換係数の合計を実行（３４０）して、エンハンスメント層信号（３６０）を得るために、エンハンスメント層信号の変換バージョンに逆変換を受けさせる（すなわち、図中の逆変換Ｔ^-1が、少なくともその符号化モードのために、加算器３４０の下流に置かれる）ことを含む。
ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例Ａ）およびＢ）に対するように、前述に対してなされる。
同じことが、空間予測と同様に、Ｃ）内で言及された解像度または品質の改良に適用される。
Ｃ）で言及された時間予測は、動き予測パラメータを、符号化データストリーム６とサブストリーム６ａからそれぞれ導出している予測プロバイダ１６０に関わり得る。動きパラメータは、動きベクトル、引用フレームインデックスを含み得る。あるいは、動きパラメータは、現在再構成された部分のサブブロック毎に、動きサブ分割情報と動きベクトルの組み合わせを含み得る。
前述したように、重み付け平均の形成は、空間領域または変換領域内で終わり得る。従って、加算器３４０での加算は、空間領域または変換領域内で実行され得る。後者の場合、逆変換器５８０は逆変換を重み付け平均に適用する。

Ｄ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，２００ｂ，２００ｃ）を再構成（８０）し、
エンハンスメント層信号（３８０）を再構成（６０）し、
再構成（６０）は、
層再構成されたベース層信号に、解像度または品質の改良を受け（２２０）させて、間予測信号（３８０）を得て、
層間予測信号（３８０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３２０、３４０）し、
ここで、エンハンスメント層信号の再構成（６０）は、層間予測信号（３８０）が発展するように実行され、ベース層信号とエンハンスメント層信号それぞれによってスケール的に表わされたビデオの異なる部分に対して、非ブロック化およびループ内のフィルタリング（１４０）の何も無い（２００ａ）、または、１つまたは全て（２００ｂ，２００ｃ）のうちの異なる１つから、符号化ビットストリーム（３６０）内のサイド情報を経由して制御されることを含む、ように構成されている。

ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例Ａ）およびＢ）に対するように、前述に対してなされる。同じことが、解像度または品質の改良に適用される。
Ｄ）で言及された予測再構成は、前述したように、予測プロバイダ１６０に関わり得る。そして、予測再構成は、
エンハンスメント層信号（３８０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間的または時間的に予測（２６０）して、エンハンスメント層内部予測信号を得て、
層間予測信号（３８０）とエンハンスメント層内部予測信号とを結合（２６０）して、エンハンスメント層予測信号（４２０）を得ることに関わる。
層間予測信号（３８０）が発展するという事実は、符号化されたビットストリーム（３６０）内のサイド情報を経由して、非ブロック化の何も無い（２００ａ）、または、１つまたは全て（２００ｂ，２００ｃ）の異なる１つから制御され、以下に意味するビデオの異なる部分に対して、ループ内のフィルタ（１４０）がかけられるということがある。
当然、ベース層サブストリーム６ａ自体は、全てのフィルタ１２０，１４０をバイパスするように、異なる手段の使用（非ブロック化のみの使用、または、ループ内フィルタリングのみの使用、または、非ブロック化およびループ内フィルタリングの両方の使用）を（任意に）シグナリングし得て、最終ベース層信号６００をもたらす。フィルタ伝達関数さえ、ベース層サブストリーム６ａ内のサイド情報によってシグナリングされ、変化され得る。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化単位、予測ブロックまたはいかなる他の大きさによっても定義され得る。その結果、スケーラブルビデオデコーダ（符号化ステージ８０）は、仮に、ベース層信号のみが再構成されるのであれば、これらの変化を適用する。しかしながら、そこから独立して（すなわち、ベース層信号６ａ内のちょうど言及されたサイド情報から独立して）、サブストリーム６ｂは、フィルタリングの組合せが、ベース層信号を得るために使用される新しい変化をシグナリングするサイド情報を含む。そこでは、全てのフィルタ１２０，１４０をバイパスさせて、エンハンスメント信号の予測的再構成内で使用（非ブロック化のみの使用、または、ループ内フィルタリングのみの使用、または、非ブロック化およびループ内フィルタリングの両方の使用）がなされる。すなわち、フィルタ伝達関数さえ、サブストリーム６ｂ内のサイド情報によってシグナリングされ、変化され得る。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化単位、または、予測ブロック、または、いかなる別の大きさによっても定義され、このシグナリングがベース層信号６ａ内で使用される大きさと異なり得る。

Ｅ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，２００ｂ，２００ｃ）を再構成（８０）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
再構成されたベース層信号に、解像度または品質の改良を受け（２２０）させて、層間予測信号（３８０）を得て、
層間予測信号（３８０）を使用して、エンハンスメント層信号（６０）を予測的に再構成（３２０、３４０）し、
ここで、エンハンスメント層信号（３６０）の再構成（６０）は、層間予測信号が発展するように実行され、符号化されたビットストリーム（６）内のサイド情報を経由して、または、シグナリングに依存して、ベース層信号とエンハンスメント層信号それぞれによってスケール的に表わされたビデオの異なる部分に対して、アップサンプリング補間フィルタ（２２０）のための異なるフィルタ伝達関数から制御されることを含む、ように構成されている。

ベース層信号の再構成に関する限り、参照が、一般的には図に対して、そして、実施例Ａ）およびＢ）に対するように、前述に対してなされる。同じことが、解像度または品質の改良に適用される。
言及された予測再構成は、前述したように、予測プロバイダ１６０に関わる。そして、予測再構成は、
エンハンスメント層信号（３６０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間的または時間的に予測（２６０）して、エンハンスメント層内部予測信号を得て、
層間予測信号（３８０）とエンハンスメント層内部予測信号とを結合（２６０）して、エンハンスメント層予測信号（４２０）を得ることに関わる。
層間予測信号が発展するという事実は、符号化されたビットストリーム（６）内のサイド情報を経由して、または、シグナリングに依存して、以下のビデオ手段の異なる部分に対して、アップサンプリング補間フィルタ（２２０）のための異なるフィルタ伝達関数から制御されるということである。
当然、ベース層サブストリーム６ａ自体は、全てのフィルタ１２０，１４０をバイパスするように、異なる手段の使用（非ブロック化のみの使用、または、ループ内フィルタリングのみの使用、または、非ブロック化およびループ内フィルタリングとの両方の使用）を（任意に）シグナリングし得て、最終ベース層信号６００をもたらす。フィルタ伝達関数さえ、ベース層サブストリーム６ａ内のサイド情報によってシグナリングされ、変化され得る。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化単位、予測ブロックまたはいかなる別の大きさによっても定義され得る。その結果、スケーラブルビデオデコーダ（符号化ステージ８０）は、仮に、ベース層信号のみが再構成されるのであれば、これらの変化を適用する。しかしながら、そこから独立して（すなわち、ベース層信号６ａ内のちょうど言及されたサイド情報から独立して）、サブストリーム６ｂは、改良器２２０内で使用されるフィルタ伝達関数の変化を追加的にシグナリングするサイド情報を含み得て、改良された信号３８０を得る。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化単位、または、予測ブロック、または、いかなる別の大きさによっても定義され得て、ベース層信号６ａの前述の大きさと異なり得る。
前述のように、使用されるべき変化は、追加サイド情報の使用の有無に関わらず、ベース層信号またはベース層残差信号またはサブストリーム６ａ内の符号化パラメータから、信号に依存して推論され得る。

Ｆ１）スケーラブルビデオデコーダは、
符号化データストリームからベース層残差信号（４８０）を復号化（１００）し、
再構成されたベース層残差信号（４８０）に、解像度または品質の改良を受け（２２０）させて、層間残差予測信号（３８０）を得とともに、エンハンスメント層信号（３６０）を再構成（６０）し、そして、オプションで層間残差予測信号（３８０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３２０，３４０、およびオプションで２６０）し、
ここで、エンハンスメント層信号（３６０）の再構成（６０）は、層間残差予測信号が展開するように実行され、符号化されたビットストリーム（６）内のサイド情報を経由して、または、シグナリングに依存して、ベース層信号とエンハンスメント層信号それぞれによってスケール的に表わされたビデオの異なる部分に対して、異なるフィルタ伝達関数から制御されるように構成されている。
ベース層残差信号の再構成に関する限り、一般的には図に対して、そして、実施例Ｂ）に対するように、前述に対して、参照がなされる。同じことが、解像度または品質の改良に適用される。
言及された予測再構成は、前述したように、予測プロバイダ１６０に関わり得る。そして、予測再構成は、
エンハンスメント層信号（３６０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間的または時間的に予測（２６０）して、エンハンスメント層内部予測信号を得て、
エンハンスメント層残差信号を、符号化されたデータストリームから復号化（３２０）し、
エンハンスメント層内部予測信号と層間残差予測信号（３８０）とエンハンスメント層残差信号とを結合（３４０と２６０とに関わる）して、エンハンスメント層信号（３６０）を得ることに関わる。
層間残差予測信号が発展するという事実は、符号化されたビットストリーム内のサイド情報を経由して、以下のビデオ手段の異なる部分に対して、異なるフィルタ伝達関数から制御されるということである。
当然、ベース層サブストリーム６ａ自体は、全てのフィルタ１２０，１４０をバイパスするように、異なる手段の使用に（任意に）シグナリングでき、最終ベース層信号６００をもたらす。前述のＤ）とＥ）を参照されたい。しかしながら、そこから独立して（すなわち、ベース層信号６ａ内のちょうど言及されたサイド情報から独立して）、サブストリーム６ｂは、改良された残差信号３８０を得るために、改良器２２０内で使用されるフィルタ伝達関数の変化を追加的にシグナリングするサイド情報を含み得る。これらの変化が行われる異なる部分を定義する大きさは、前述の符号化単位、または、予測ブロック、または、いかなる別の大きさによっても定義でき、ベース層信号６ａの前述の大きさと異なり得る。
前述のように、使用されるべき変化は、追加サイド情報の使用の有無に関わらず、ベース層信号またはベース層残差信号またはサブストリーム６ａ内の符号化パラメータから、信号に依存して推論され得る。

Ｇ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００）のベース層残差信号（４８０）を復号化（１００）し、
再構成されたベース層残差信号（４８０）に、解像度または品質の改良を受け（２２０）させて、層間残差予測信号（３８０）を得るとともに、エンハンスメント層信号（３６０）を再構成（６０）し、そして、オプションで、層間残差予測信号（４８０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３２０，３４０、およびオプションで２６０）し、
ここで、エンハンスメント層信号（３６０）の再構成（６０）は、全てをゼロにされたベース層残差信号（４８０）のブロックを識別（２６０）して、識別されたブロックを、ベース層信号（２００）の部分から導出された置換信号に取替えることを含む、
ように構成されている。
ベース層残差信号の復号化に関する限り、図面全般に対して、そして、実施例Ｂ）に対するように、上の記述を参照されたい。同じことが、解像度または品質の改良に適用される。
言及された予測再構成は、前述したように、予測プロバイダ１６０に関わり得る。そして、予測再構成は、
エンハンスメント層信号（３６０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間的または時間的に予測（２６０）して、エンハンスメント層内部予測信号を得て、
エンハンスメント層残差信号を、符号化されたデータストリームから復号化（３２０）し、
エンハンスメント層信号（３６０）を得るために、エンハンスメント層内部予測信号と層間残差予測信号（３８０）とエンハンスメント層残差信号とを結合（３４０と２６０とに関わる）することに関わる。
好ましくは、識別は、ベース層ストリーム（６ａ）内の構文要素をチェックし、それぞれの変換ブロックが全てゼロであるか否かに対して、例えば、前述の符号化単位の別のサブ分割である変換ブロックの大きさで示すプロバイダ２６０に関わる。
前述するように、交換に使用されるベース層信号の部分は、例えば、ベース層信号２００ａ，ｂ，ｃのハイパスフィルタにかけられたバージョンである。

Ｈ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，ｂ，ｃ）を再構成（８０）し、
再構成されたベース層信号（２００）に解像度または品質の改良を受け（２２０）させて、層間予測信号（３８０）を得て、
エンハンスメント層信号（３６０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を空間予測（２６０）して、エンハンスメント層予測信号（４２０）を得て、
エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３４０）することを含んで、
エンハンスメント層信号を再構成（６０）することとを含み、
ここで、空間予測（２６０）は、現在再構成されるべき部分の予め決められた隣接部分内の非利用可能な部分を、層間予測信号（３８０）の非利用可能な部分に併置された、併置された部分と取り替えて、層間予測信号（３８０）の併置された部分に依存する空間予測も実行することを含む、
ように構成されている。
ベース層信号の再構成に関する限り、一般的には図に対して、そして、実施例Ａ）およびＢ）に対するように、前述に対して参照される。同じことが、前述された空間予測と予測的再構成と同様に、解像度または品質改良に適用される。
非利用可能性は以下の事実から生じ得る。予め決められた隣接部分が、その右に更に拡がるサンプルと同様に、現在再構成されるべき部分／ブロックの上側エッジの上に隣接しているサンプルと、その下方に更に拡がるサンプルと同様に、再構成されるべき現在のブロック／部分の左側エッジの左に隣接しているサンプルとを含む、と仮定されたい。さらに、空間予測が、サブ分割に基づいた多分木の葉であるブロック／部分に適用され、そして、これらのブロックが、深く最初にジグザグに横断する順序で、予測再構成過程内を横断される、と仮定する。次に、あるブロックでは、問題のあるすべての隣接するサンプルが利用できる。すなわち、それらは既に再構成されている。しかしながら、いくつかのブロックは、これらのいくつかのサンプルを欠いている。すなわち、それらは完全には再構成されていない。そして、説明されるように、欠陥サンプルが取替えられる。潜在的に交換を必要とする別の事実は、どんなフレームに対しても内部内のスライス境界の位置である。交換自体は、欠陥サンプルに対して、層間予測信号（３８０）の併置されたサンプルをコピーすることによって行われる。次に、空間予測が、層間予測信号（３８０）からコピーされたサンプルと再構成されたエンハンスメント層信号からのサンプルとを含んでいる完全な（完成された）予め決められた隣接部分を使用して行われる。

Ｉ１）スケーラブルビデオデコーダは、
フレームの異なるブロックに対して、層間予測モード、時間インター予測モードおよび空間イントラ予測モードのうちの異なる１つを使用して、エンハンスメント層信号（３６０）を再構成（６０）するように構成され、
ここで、スケーラブルビデオデコーダは、エンハンスメント層信号（３６０）を再構成（６０）する中で、最初の走査と、次の、２番目の走査との中で、ブロックを横断することによってブロックを再構成（６０）し、最初の走査内で、空間イントラ予測モードを使用して、再構成されるべきブロックを跳ばし、層間予測モードおよびインター予測モードの１つを使用して、再構成されるべきブロックを再構成し、そして、２番目の走査内で、空間イントラ予測モードを使用して、再構成されるべきブロックを再構成するように構成されている。
「空間イントラ予測モード」と「時間インター予測モード」に関する限り、参照が、可能な実現のための前述の議論に対してなされる。「層間予測モード」に関する限り、そのようなモードのための例のいずれも、今までのところまたは以下で説明されるように、使用され得る。既に再構成されたサンプルによって囲まれたエンハンスメント層信号の空間的イントラ予測モードブロックの完全な外形を持つ増加する機会のために、現在予測された空間イントラ予測モードブロックの内部が充填されるべき隣接するサンプルのテンプレートは、外形を完全に囲むように増加し得る。

Ｊ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，ｂ，ｃ）を再構成（８０）し、
参照フレームと現在のフレームに対して、再構成されたベース層信号（２００ａ，ｂ，ｃ）に、解像度または品質の改良を受け（２２０）させて、層間予測信号（３８０）を得て、
参照フレームの層間予測信号（３８０）と参照フレームの既に再構成されたエンハンスメント層信号（３６０）との間の差分信号を形成（２６０）し、
現在のフレームの差分信号予測を得るために、差分信号に動き補償予測を受け（２６０）させ、
エンハンスメント層予測信号（４２０）を得るために、現在のフレームの層間予測信号（３８０）と現在のフレームの差分信号予測とを結合（２６０）して、
エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３２０，３４０，３００，２８０）することを含んで、
エンハンスメント層信号（３６０）を再構成（６０）すること、
とを含む、
ように構成されている。
Ｊ２）ここで、参照フレームの差分信号の形成において、使用された再構成されたエンハンスメント層信号は、非ブロック化の前、または、非ブロック化の後で任意のループ内フィルタリングの前、または、非ブロック化および任意のループ内フィルタリングの後のエンハンスメント層再構成である。
Ｊ３）ここで、参照フレームの差分信号を形成するために使用されるエンハンスメント層信号の選択は、系列、画像、またはブロックレベルで、ビットストリーム内でシグナリングされる。
動き補償予測は、エンハンスメント信号（デコーダ３２０に関わる導出）の現在再構成されたブロックに対して、動き予測パラメータを、それぞれ符号化データストリーム６とサブストリーム６ｂとから導出されている予測プロバイダ２６０に関わり得る。動きベクトルは、現在再構成されるべきエンハンスメント層信号の部分の位置に適用される。そして、それぞれ置き換えられた部分は、差分信号から、（断片的なサンプル補間の有無に関わらず）コピーされる。このようにしてコピーされた部分は、例えば、画素的な組合せの中で、現在再構成されるべき部分に併置された層間予測信号（３８０）の部分に加算される。

Ｋ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層動きパラメータ（５２０）を復号し、
エンハンスメント層信号（２６０）を再構成（６０）し、
再構成（６０）は、
エンハンスメント層信号（３６０）のフレームのブロックに対して、フレームの隣接する既に再構成されたブロックから動きパラメータ候補のセットを集め（２６０）、
ベース層動きパラメータ（５２０）から、エンハンスメント層信号（３６０）のフレームのブロックに併置されたベース層信号のブロックのベース層動きパラメータを集め（２６０）、
ベース層動きパラメータまたはベース層動きパラメータのスケーリングされたバージョンを、動きパラメータ候補のセットに加算（２６０）して、動きパラメータ候補の拡張動きパラメータ候補セットを得て、
少なくとも拡張動きパラメータ候補セットの動きパラメータ候補の１つを選択（２６０）し、
動き補償予測によって、拡張動きパラメータ候補セットの動きパラメータ候補の選択された１つを使用して、エンハンスメント層信号を予測（２６０）することを含む、ように構成されている。

Ｋ２）ここで、スケーラブルビデオデコーダは、ベース層信号とエンハンスメント層信号との間の空間解像度比率に従って、ベース層動きパラメータをスケーリングして、ベース層動きパラメータのスケーリングされたバージョンを得るように構成されている。
Ｋ３）ここで、スケーラブルビデオデコーダは、ベース層動きパラメータが、マージを使用して、符号化データストリーム内で符号化されるか否かをチェックし、仮に、ベース層動きパラメータが、マージを使用して、符号化データストリーム内で符号化されるならば、加算を抑圧するように構成されている。
この実施例で言及された動きパラメータは、動きベクトル（動きベクトル予測）のみに、または、ブロック毎の動き仮説、参照インデックス、パーティショニング情報（マージ化）の数を含む動きパラメータの完全なセットに関連し得る。
従って、「スケーリングされたバージョン」は、空間スケーラビリティの場合において、ベース層信号とエンハンスメント層信号との間の空間解像度比率に従って、ベース層信号内で使用された動きパラメータのスケーリングに由来してもよい。
符号化データストリームからのベース層動きパラメータ５２０の復号化は、動きベクトル予測またはマージ化にも関わり得る。
マージ化／動きベクトル候補のセット内のベース層信号の併置された部分で、使用された動きパラメータの補間は、イントラ層候補および層間候補内で、非常に有効な索引を可能にする。
選択は、予測ブロックや符号化単位のようなエンハンスメント層信号内の、動きパラメータ候補の拡張されたセット／リスト内のインデックスの明白なシグナリングに関わり得る。あるいはまた、選択インデックスはエンハンスメント層信号６ｂまたは層間情報の別の情報から推論され得る。

Ｌ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層動きパラメータ（５２０）を復号（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
ベース層動きパラメータに依存するエンハンスメント層信号のための動きパラメータ候補リストを順序付け（２４０）し、
符号化データストリーム（６）内の明らかにシグナリングされたインデックス構文要素を経由して制御された、エンハンスメント層信号のための順序付けされた動きパラメータ候補リストからエンハンスメント層動きパラメータを選択（２４０）し、
動き補償予測によって、決められた動きパラメータを使用して、エンハンスメント層信号を予測（２６０）することを含む、ように構成されている。
この実施例で言及された動きパラメータに関する限り、実施例Ｋに関して上で述べたと同じことが適用される。
符号化データストリームからのベース層動きパラメータ５２０の復号化は、（任意に）動きベクトル予測またはマージにも関わり得る。
順序付けは、それぞれのエンハンスメント層動きパラメータ候補と、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連するベース層信号のベース層動きパラメータとの間の差を測る大きさに従ってなされ得る。すなわち、エンハンスメント層信号の現在のブロックに対して、エンハンスメント層動きパラメータ候補のリストが、最初に決定され得る。次に、順序付けが、ちょうど述べられるように実行される。以下に、選択が明白なシグナリングで実行される。
また、順序付けは、エンハンスメント層信号の現在のブロックと、ベース層内の空間的および／または時間的に隣接するブロックのベース層動きパラメータに併置されたベース層信号のブロックに関連するベース層信号のベース層動きパラメータとの間の差を測る大きさに従ってもなされ得る。次に、ベース層内の決められた順序付けが、エンハンスメント層に転送される。その結果、エンハンスメント層動きパラメータ候補が、対応するベース層候補に対して決められた順序付けと同じ方法で順序付けされる。ここで、関連したベース層ブロックが、考慮されたエンハンスメント層動きパラメータ候補に関連しているエンハンスメント層ブロックに、空間的／時間的に併置されるとき、ベース層動きパラメータ候補は、エンハンスメント層動きパラメータ候補に対応すると言われる。順序付けに基づいて、選択は明白なシグナリングによって実行される。

Ｍ１）スケーラブルビデオデコーダは、
ベース層信号（２００）のための動きパラメータ候補リスト内のインデックスを使用して、符号化データストリーム（６）からベース層動きパラメータ（５２０）を復号化（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
ベース層信号のための動きパラメータ候補リスト内のインデックスに依存するエンハンスメント層信号のための動きパラメータ候補リスト内のインデックスを決定（２４０）し、
エンハンスメント層信号のための動きパラメータ候補リスト内のインデックスを使用して、エンハンスメント層動きパラメータを決定（２４０）して、
動き補償予測によって、決められた動きパラメータを使用して、エンハンスメント層信号を予測（２６０）することを含む、ように構成されている。
この実施例で言及された動きパラメータに関する限り、実施例Ｋに関して上で述べたと同じことが適用される。
ベース層動きパラメータ５２０の復号化は、ベース層信号のブロックに対して、
現在のブロックのための動きパラメータが、マージまたはマージ無しの方法（予測的にまたは非予測的に符号化される方法）で、ベース層サブストリーム６ａ内でシグナリングされるか否かに対してシグナリングするフラグを点検し、
仮に、マージを使用して、符号化される、または、予測的に符号化されるならば、（例えば、ベース層動きパラメータは、決定のために使用されるベース層信号の隣接するブロックのために使用／選択される）ベース層動きパラメータのリストを決定し、
それぞれのリスト内のインデックスは、ベース層信号６ａから得られ、リスト内のベース層動きパラメータの１つを選択するために使用され、
エンハンスメント層のためのインデックスは、インデックスされたベース層候補に関連するベース層ブロックに併置されたエンハンスメント層ブロックが、選択される方法で決定されること、を含むことができる。
エンハンスメント層信号の現在のブロックに対して、エンハンスメント層動きパラメータのリストが決定される。例えば、エンハンスメント層信号の隣接するブロックのために使用／選択される動きパラメータは、決定のために使用される。
エンハンスメント層内の動きパラメータインデックスの選択は、それぞれのエンハンスメント層動きパラメータと、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連するベース層信号の（中で使用／選択される）ベース層動きパラメータとの間の差を測る大きさに従って実行され得る。
また、エンハンスメント層内の動きパラメータインデックスの選択は、エンハンスメント層信号の現在のブロックに併置されたベース層信号のブロックに関連するベース層信号のベース層動きパラメータと、ベース層内の空間的および／または時間的に隣接するブロックのベース層動きパラメータとの間の差を測る大きさに従って実行され得る。次に、ベース層のための選択が、エンハンスメント層に移される。その結果、選択されたベース層候補に対応するエンハンスメント層動きパラメータ候補が、選択される。関連ベース層ブロックが、考慮されるエンハンスメント層動きパラメータ候補に関連しているエンハンスメント層ブロックに空間的／時間的に併置されるとき、ベース層動きパラメータ候補は、エンハンスメント層動きパラメータ候補に対応すると言われる。

Ｎ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号のベース層残差信号（４８０）を復号化（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
ベース層残差信号（４８０）またはベース層信号の、スペクトル分解の勾配または情報を決定（２４０）して、走査予測器（５２０）を得て、
走査予測器（５２０）に依存する走査パターンを使用して、符号化データストリーム（６）から、エンハンスメント層残差信号（５４０）の変換係数を復号化（３２０）することを含む、ように構成されている。
すなわち、変換係数の復号化は、そのすべてが変換ブロックを完全にカバーする、可能な走査パターンのセットからの走査パターンの選択に関わり得る。好ましくは、選択された走査パターンが、ベース層残差信号の重要なスペクトル成分を、可能な走査パターンのセットの別の走査パターンよりも早く横断するように、選択がなされる。

Ｒ１）ビデオデコーダは、
そのすべてが変換ブロックを完全にカバーする、可能な走査パターンのセットからの走査パターンの選択によって、符号化データストリーム（６）から残差信号（５４０または１００の出力）の変換ブロックの変換係数を復号化（３２０）し、選択は、符号化データストリーム内の明白なシグナリングに依存するように構成されている。
Ｒ２）ここで、復号化（３２０）は、走査パターンの（５２０と２４０を経由した）選択に依存する変換係数に関連する構文要素のためのコンテキストモデルを使用する。
Ｒ２ａ）ここで、変換係数に関連する構文要素は、変換係数が、特定の走査位置に対して、ゼロに等しいか、または、ゼロに等しくないかを指示する構文要素を含む。
Ｒ２ｂ）ここで、変換係数に関連する構文要素は、特定の走査順序における最後のゼロでない変換係数の位置を指示する構文要素を含む。
Ｒ２ｃ）ここで、変換係数に関連する構文要素は、変換ブロックのサブブロックが、ゼロに等しくない変換係数を含むか否かを指示する構文要素を含む。
Ｒ３）ここで、明白なシグナリングが、ベース層残差信号（４８０）またはベース層信号の勾配、またはスペクトル的分解の情報に依存する、コンテキストモデルを使用して、可能な走査パターンのセット内のインデックスをエントロピー復号化（３２０）することに関わる。
Ｒ４）ここで、変換係数レベルの復号化（３２０）に対して、変換ブロックはサブブロックにサブ分割され、サブブロックがゼロでない変換係数を含むか否かをシグナリングする構文要素は送信され、そして、サブブロックのサイズまたは形状は、または、サブブロック内の変換ブロックのパーティションは、選択された走査パターンに依存する。

Ｓ１）スケーラブルビデオデコーダは、
ベース層残差信号の変換ブロックの最後の重要な変換係数の位置を指示する符号化データストリームから最初の構文要素を復号化することを含む、符号化データストリーム（６）からベース層残差信号の変換ブロックの変換係数を復号化（１００）し、
符号化データストリームから２番目の復号化構文要素を含む符号化データストリーム（６）からエンハンスメント層残差信号の変換ブロックの変換係数を復号化（１００）し、最初の構文要素と２番目の構文要素に基づくエンハンスメント層残差信号の変換ブロックの最後の重要な変換係数の位置を計算するように構成されている。

Ｏ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号のベース層残差信号（４８０）を復号（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
ベース層残差信号（４８０）またはベース層信号に（５２０と２４０を経由して）依存する文脈モデルまたは予測器を使用して、符号化データストリーム（６）から、エンハンスメント層残差信号（５４０）の変換係数ブロックに関連する構文要素を復号（３２０）することを含む、ように構成されている。
例えば、テンプレートは、現在訪問された変換係数位置での所定の変換係数を符号化するためのコンテキストを決定するために使用される。そして、また、テンプレートは、（ベース層とエンハンスメント層内の変換ブロックのサイズの大きさでの）位置、および、スペクトル周波数の観点から、所定の変換係数位置に対応するベース層残差信号内の１つ以上の変換ブロック内の位置に関わる。
または、ベース層残差信号（４８０）またはベース層信号の勾配またはスペクトル分解の情報が、コンテキストモデルを決定するために使用される。

Ｐ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号のベース層残差信号（４８０）を復号（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
エンハンスメント層信号（３６０）の部分と異なる予測モードに従って、エンハンスメント層信号（３６０）、ベース層残差信号およびベース層信号の既に再構成された部分から、エンハンスメント層信号（３６０）の部分を予測（２６０）し、
変換係数ブロックが属するエンハンスメント層信号（３６０）が、ベース層残差信号とベース層信号とのいずれかに基づいた層間予測に関わるか否かに（５２０と２４０を経由して）依存するコンテキストモデルを使用して、符号化データストリーム（６）から、エンハンスメント層残差信号（５４０）の変換係数ブロックに関連する構文要素を復号化（３２０）し、
そして、エンハンスメント層予測信号（４２０）を使用して、エンハンスメント層信号（３６０）を予測的に再構成（３４０）することを含む、
ように構成されている。

Ｑ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，ｂ，ｃ）を再構成（８０）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
再構成されたベース層信号（２００）に解像度または品質の改良を受け（２２０）させて、層間予測信号（３８０）を得て、
符号化パラメータ候補のセットの各符号化パラメータ候補に対して、それぞれの符号化パラメータ候補を使用して、エンハンスメント層信号（３６０）の再構成または部分的な再構成を試験的に実行（２６０）して、それぞれの試験的な再構成または部分的な再構成の結果を得て、
各符号化パラメータ候補に対して、層間予測信号（３８０）とそれぞれの試験的な再構成または部分的再構成の結果との間の差の大きさを決定（２６０）し、
各符号化パラメータ候補に対して大きさに依存して、符号化パラメータ候補のセット内で選択（２６０）し、
そして、選択された符号化パラメータ候補を使用して、エンハンスメント層信号（３６０）を等しく再構成（３２０，３４０，２６０）することを含む、
ように構成されている。
Ｑ２）ここで、エンハンスメント層に対して決定された符号化パラメータは、イントラ予測モードに関連する。
Ｑ３）ここで、エンハンスメント層に対して決定された符号化パラメータは、参照画像または動きベクトルなどの動きパラメータに関連する。
Ｑ４）ここで、エンハンスメント層に対して決定された符号化パラメータは、マージ候補に関連する。

Ｚ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００ａ，ｂ，ｃ）を再構成（８０）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
符号化パラメータ候補のセットの各符号化パラメータ候補に対して、それぞれの符号化パラメータ候補を使用して、ベース層信号（３６０）の再構成または部分的な再構成を試験的に実行（２６０）して、それぞれの試験的な再構成または部分的な再構成の結果を得、
各符号化パラメータ候補に対して、実際に復号化されたベース層再構成とそれぞれの実験的な再構成または部分的な再構成の結果との間の差の大きさを決定（２６０）し、
各符号化パラメータ候補に対して大きさに依存して、符号化パラメータ候補のセット内で選択（２６０）し、
選択された符号化パラメータ候補をエンハンスメント層に転送し、転送は解像度の差に従うスケーリングを含み得て、
そして、転送された符号化パラメータ候補を使用して、エンハンスメント層信号（３６０）を等しく再構成（３２０，３４０，２６０）することを含む、
ように構成されている。

Ｔ１）スケーラブルビデオデコーダは、
イントラブロックのための空間イントラ予測およびインターブロックのための時間インター予測を使用して、イントラブロックおよびインターブロック内へのサブ分割フレームによって、ベース層信号を予測的に再構成（１００，１８０，１６０）し、
エンハンスメント層信号（３６０）を予測的に再構成（３２０，３４０，２６０）し、再構成（３２０，３４０，２６０）は、
現在再構成されるべきエンハンスメント層信号（３６０）の部分のサブ部分を得るために、現在再構成されるべきエンハンスメント層信号（３６０）の部分に併置されたベース層信号のブロックのブロックサブ分割を、現在再構成されるべきエンハンスメント層信号（３６０）の部分に局所的に転送し、そして、関連するエンハンスメント層動きベクトルを、ベース層動きベクトルに基づくサブ部分に局所的に転送し、
ベース層動きベクトルに基づくサブ部分に関連するエンハンスメント層動きベクトルを使用して、エンハンスメント層信号（３６０）の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を、動き補償予測によって予測（２６０）することを含む、
ように構成されている。

Ｔ２）スケーラブルビデオデコーダは、
ベース層信号を空間的に変化させるベース層符号化パラメータを使用して、ベース層信号を予測的に再構成（１０，１８，１６）し、
ブロックの単位内でエンハンスメント層信号（３６）を再構成（３２，３４，２６）し、
再構成（３２，３４，２６）は、
ブロックの予め決められたブロックに対して、ベース層信号の併置された部分に転送されたとき、選択されたサブブロックのサブ分割が、サブ分割される可能なサブブロックのサブ分割のセット内で最も粗いように、可能なサブブロックのサブ分割のセット内のサブブロックのサブ分割を選択し、その結果、ベース層信号は、それぞれのサブブロックのサブ分割の各サブブロック内で、ベース層符号化パラメータは互いに十分同じであり、
選択されたサブブロックのサブ分割を使用して、予め決められたブロックを予測的に再構成することを含む、
ように構成されている。

Ｕ１）スケーラブルビデオデコーダは、
イントラブロックのための空間イントラ予測とインターブロックのための時間インター予測を使用して、イントラブロックとインターブロックにベース層信号のフレームをサブ分割して、そして、イントラブロックとインターブロックがサブ分割されるブロックの単位内で、それぞれ空間イントラ予測と時間インター予測に関連した予測パラメータをセットすることによって、ベース層信号を予測的にそれぞれ再構成（１００，１８０，１６０）し、
エンハンスメント層信号（３６０）を予測的に再構成（３２０，３４０，２６０）し、
再構成（３２０，３４０，２６０）は、
符号化データストリーム内の予測モード構文を経由して制御され、エンハンスメント信号のフレームが、空間イントラ予測モード、時間インター予測モードおよび層間予測モードを含む予測モードのセットのそれぞれの１つにサブ分割される符号化単位内のエンハンスメント信号のフレームを割当て、
それぞれの符号化単位が割当てられたそれぞれの予測モードを使用して、各符号化単位を予測的に再構成し、
割り当てられた空間イントラ予測モードおよび時間インター予測モードのいずれかを有する符号化単位に対して、
更に予測ブロック内の符号化単位をサブ分割して、それぞれの符号化単位が予測ブロックの単位内で割当てられたそれぞれの予測モードに関連する予測パラメータをセットし、
割当てられた空間イントラ予測を有するそれぞれの符号化単位の場合には、予測パラメータセットを使用して、全ての予測ブロックに空間イントラ予測を受けさせ、そして、割り当てられた時間インター予測を有するそれぞれの符号化単位の場合には、予測パラメータセットを使用して、全ての予測ブロックに時間インター予測を受けさせ、
割当てられた層間予測モードを有するそれぞれの符号化単位に対して、
イントラブロックおよびインターブロックの両方に局所的に重なる符号化単位が、非時間的モードに関連しかつイントラブロックに局所的に一致する少なくとも１つの予測ブロックと、時間インター予測モードに関連しかつインターブロックに局所的に一致する少なくとも１つの予測ブロックとにサブ分割されるように、ベース層信号のイントラブロックとインターブロックとのサブ分割を、それぞれ符号化単位に局所的に転送し、
割当てられた非時間的予測モードを有するそれぞれの符号化単位の全ての予測ブロックに、局所的に一致するイントラブロックの予測パラメータから導出された予測パラメータを使用して、空間イントラ予測を受けさせ、あるいは、ベース層信号に、解像度または品質の改良を受け（２２０）させて、層間予測の場合には、層間予測信号（３８０）を得て、
層間予測信号（３８０）を使用して、割当てられた非時間的予測モードを有するそれぞれの符号化単位の予測ブロックを予測（２６０）し、
そして、割当てられた時間インター予測モードを有するそれぞれの符号化単位の全ての予測ブロックに、局所的に一致するインターブロックの予測パラメータから導出された予測パラメータを使用して、時間インター予測を受けさせることを含む、ように構成されている。

Ｖ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００）のベース層残差信号（４８０）を復号化（１００）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
以下の構成によって、符号化データストリームからエンハンスメント層信号を表す変換係数の変換係数ブロックを復号し、
ベース層残差信号またはベース層信号に基づいて、可能なサブブロックのサブ分割のセット内でサブブロックのサブ分割を選択し、
１つのサブブロック内の全ての位置が、サブブロック内で定義されたサブブロックの順序で次のサブブロックに続く直ぐに連続した方法で、横断されるように、変換係数ブロックが、選択されたサブブロックのサブ分割に従って規則的にサブ分割される、サブブロックの単位内の変換係数の位置を横断し、
現在訪問されたサブブロックに対して、
データストリームから、現在訪問されたサブブロックが重要な変換係数を有するか否かについて示す構文要素を復号し、
仮に、構文要素が、現在訪問されたサブブロックは重要な変換係数を有さないことを示すならば、現在訪問されたサブブロック内の変換係数をゼロにセットし、
仮に、構文要素が、現在訪問されたサブブロックは重要な変換係数を有することを示すならば、データストリームから、現在訪問されたサブブロック内の変換係数のレベルを示す構文要素を復号することを含む、
ように構成されている。

Ｗ１）スケーラブルビデオデコーダは、
符号化データストリーム（６）からベース層信号（２００）を再構成（８０）し、
エンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
再構成されたベース層信号（２００ａ，２００ｂ，２００ｃ）に、解像度または品質の改良を受け（２２０）させて、層間予測信号（３８０）を得ることによりエンハンスメント層信号のブロックを空間的に予測し、
層間予測信号（３８０）の第１のラインを登録（２６０）し、エンハンスメント層信号の既に再構成された部分の第２のラインでブロックを局所的に重ね、第１のラインと第２のラインが両方ともライン方向に平行であるブロックを隣接させ、それによってシフト値を得て、
第１のラインの内容で、第１のラインに併置されたブロックのラインを充填（２６０）し、シフト値によってシフトすることを含む、ように構成されている。
例えば、ライン方向は水平または垂直であり、その結果、予測は、それぞれ、列ごとに、または、行ごとになされる。

Ｘ１）スケーラブルビデオデコーダは、
ブロック単位予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック単位選択と、空間イントラ予測モードが選択されたベース層信号のブロックのためのイントラ予測パラメータを使用することによって、符号化データストリーム（６）からベース層信号（２００）を再構成（８０）し、
ブロック単位予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック単位選択と、空間イントラ予測モードが選択されたエンハンスメント層信号のブロックのためのイントラ予測パラメータを使用することによって、符号化データストリーム（６）からエンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
エンハンスメント層信号の現在のブロックに隣接する、エンハンスメント層信号の隣接するブロックが、空間イントラ予測モードを使用して予測されたか否かについて、エンハンスメント層信号の隣接するブロックをチェックし、
仮に、そうであるならば、現在のブロックのためのおそらく有利なイントラ予測パラメータを、隣接するブロックのイントラ予測パラメータと選定し、
仮に、そうでなければ、現在のブロックのためのおそらく有利なイントラ予測パラメータを、現在のブロックに併置されたベース層信号のブロックのイントラ予測パラメータと選定し、
現在のブロックのための符号化データストリーム内に存在する構文要素に基づいた現在のブロックのためのイントラ予測パラメータと、おそらく有利なイントラ予測パラメータとを決定することを含む、ように構成されている。

Ｙ１）スケーラブルビデオデコーダは、
ブロック単位予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック単位選択と、空間イントラ予測モードが選択されたベース層信号のブロックのサブセットのための角度イントラ予測パラメータを使用することによって、符号化データストリーム（６）からベース層信号（２００）を再構成（８０）し、
ブロック単位予測と、空間イントラ予測モードと時間インター予測モードとの間のブロック単位選択と、空間イントラ予測モードが選択されたエンハンスメント層信号のブロックのサブセットのための角度イントラ予測パラメータを使用することによって、符号化データストリーム（６）からエンハンスメント層信号（３６０）を再構成（６０）し、
再構成（６０）は、
エンハンスメント層信号の現在のブロックに隣接する、エンハンスメント層信号の隣接するブロックを、角度イントラ予測パラメータを有する空間イントラ予測モードを使用して予測されたか否かについて、チェックし、
仮に、そうであるならば、現在のブロックのためのおそらく有利なイントラ予測パラメータを、隣接するブロックの角度イントラ予測パラメータと指定し、
仮に、そうではないけれども、現在のブロックに併置されたベース層信号のブロックが、角度イントラ予測パラメータで符号化されるならば、現在のブロックのためのおそらく有利なイントラ予測パラメータを、現在のブロックに併置されたベース層信号のブロックの角度イントラ予測パラメータと指定し、
現在のブロックのための符号化データストリーム内に存在する構文要素に基づいた現在のブロックのためのイントラ予測パラメータと、おそらく有利なイントラ予測パラメータとを決定することを含む、ように構成されている。

いくつかの態様が装置のコンテキスト内で説明されているけれども、これらの態様が、対応する方法の記述を表わすことも明確である。そこでは、ブロックまたはデバイスが、方法ステップまたは方法ステップの特徴に対応する。また、類似して、方法ステップのコンテキスト内で記載された態様は、対応する装置の対応するブロックまたは項目または特徴の記述を表わす。方法ステップのいくつかまたは全てが、例えば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路のようなハードウェア装置によって（または、を使用して）実行され得る。いくつかの実施例の内で、最も重要な方法ステップの１つ以上が、そのような装置によって実行され得る。

所定の実現の要求に依存して、本願発明の実施の形態が、ハードウェアまたはソフトウェア内で実現することができる。実現が、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する（または、協働できる）、保存された電子的に読み込み可能な制御信号を有するデジタル保存媒体、例えば、フロッピー（登録商標）ディスク、ＤＶＤ、ブルーレイ（登録商標）、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリを使用して実行され得る。従って、デジタル保存媒体は、コンピュータ読み込み可能である。

本願発明によるいくつかの実施の形態が、本明細書に記載された方法の１つが実行されるように、プログラム可能なコンピュータシステムと協働できる電子的に読み込み可能な制御信号を有するデータキャリアを含む。

一般に、本願発明の実施の形態が、プログラムコードを有するコンピュータプログラム製品として実行され得る。コンピュータプログラム製品がコンピュータで稼働するとき、プログラムコードが、方法の１つを実行するために操作される。例えば、プログラムコードは、機械読み込み可能なキャリアに格納され得る。

別の実施の形態は、機械読み込み可能なキャリアに保存された、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを含む。

換言すれば、発明の方法の実施の形態は、本明細書に記載された方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

従って、発明の方法の更なる実施の形態は、データキャリア（または、デジタル記憶媒体、または、コンピュータ読込み可能な媒体）は、その上に記録された、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを含む。データキャリア、デジタル記憶媒体または記録媒体は、通常、有形および／または非一時的なものである。

従って、発明の方法の更なる実施の形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを表わすデータストリームまたは信号系列である。例えば、データストリームまたは信号系列が、データ通信接続経由、例えば、インターネット経由で転送されるように構成される。

更なる実施の形態は、本明細書に記載された方法の１つが実行されるように構成される、または、適合されるプロセス手段、例えば、コンピュータまたはプログラム可能な論理回路、を備える。

更なる実施の形態は、本明細書に記載された方法の１つが実行するためのコンピュータプログラムをインストールしたコンピュータを含む。

本願発明に係る更なる実施の形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを、レシーバに（例えば、電子的または光学的に）転送するように構成された装置またはシステムを含む。例えば、レシーバは、コンピュータ、モバイル機器、メモリ素子または同様のものである。例えば、装置またはシステムは、コンピュータプログラムをレシーバに転送するためにファイルサーバーを含む。

いくつかの実施の形態において、プログラム可能な論理回路（例えば、フィールドプログラマブルゲートアレイ）は、本明細書に記載された方法の機能のいくつかまたは全てを実行するために使用され得る。いくつかの実施の形態において、フィールドプログラマブルゲートアレイは、本明細書に記載された方法の１つを実行するためにマイクロプロセッサと協働し得る。一般に、好ましくは、方法はどんなハードウェア装置によっても実行される。

上述の実施の形態は、本願発明の原理のためにのみ例示するだけである。配置および本願明細書において記載される詳細の修正および変更は、他の当業者にとって明らかであるものと理解される。従って、差し迫った本願発明の特許請求の範囲の概要のみに制限され、本実施の形態の記述および説明の目的により提供される特定の詳細によっては制限されないことを意図している。

Claims

符号化データストリーム（６）からベース層信号を再構成（８０）して、再構成されたベース層信号を得ることと、
エンハンスメント層信号の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号（３６０）の部分を、空間的に（３０）、または、時間的に（３２）予測して、エンハンスメント層内部予測信号（３４）を得ることと、
現在再構成されるべき部分（２８）で、層間予測信号（３９）と前記エンハンスメント層内部予測信号との間の重み付けが、異なる空間周波数成分を変化させるように、再構成されたベース層信号（２００）から得られた前記層間予測信号と、前記エンハンスメント層内部予測信号との重み付け平均を形成（４１）して、エンハンスメント層予測信号（４２）を得ることと、
前記エンハンスメント層予測信号を使用して、前記エンハンスメント層信号を予測的に再構成（５２）することとを含み、
前記エンハンスメント層信号（４００）を再構成（６０）するように構成されていること、
を特徴とする、スケーラブルビデオデコーダ。
前記エンハンスメント層信号を再構成（６０）する際に、前記再構成されたベース層信号が、解像度または品質改良を受けて、前記層間予測信号を得るように構成されていること、を特徴とする、請求項１に記載のスケーラブルビデオデコーダ。
前記重み付け平均を形成する際に、前記現在再構成されるべき部分で、第１のフィルタ（６２）で前記層間予測信号（３９）をフィルタにかけると共に、第２のフィルタ（６４）で前記エンハンスメント層内部予測信号（３４）をフィルタにかけて、フィルタにかけられた信号を得るとともに、
異なる転送関数を有している前記第１のフィルタおよび前記第２のフィルタから得られた前記フィルタにかけられた信号を加算するようにさらに構成されていること、を特徴とする、請求項１または請求項２に記載のスケーラブルビデオデコーダ。
前記第１のフィルタがローパスフィルタであり、前記第２のフィルタがハイパスフィルタであること、を特徴とする、請求項３に記載のスケーラブルビデオデコーダ。
前記第１のフィルタと前記第２のフィルタとは直交ミラー（ｑｕａｄｒａｔｕｒｅｍｉｒｒｏｒ）のフィルタペアを形成していること、を特徴とする、請求項３または請求項４に記載のスケーラブルビデオデコーダ。
前記重み付け平均を形成する際に、前記現在再構成されるべき部分で、変換係数（７６，７８）を得るために、前記層間予測信号および前記エンハンスメント層内部予測信号を変換（７２，７４）し、そして、異なる空間周波数成分の間の異なる比率の重み付け係数（８２，８４）を使用して、得られた前記変換係数を重畳（９０）して、重畳された前記変換係数を得るようにさらに構成されていること、を特徴とする、請求項１または請求項２に記載のスケーラブルビデオデコーダ。
前記重畳された変換係数を逆変換（８４）して、前記エンハンスメント層予測信号を得るようにさらに構成されていること、を特徴とする、請求項６に記載のスケーラブルビデオデコーダ。
前記エンハンスメント層予測信号を使用して前記エンハンスメント層信号を予測的に再構成し、前記符号化データストリーム（６）から前記エンハンスメント層信号のための変換係数レベル（５９）を抽出し、
前記エンハンスメント層信号の変換されたバージョンを得るために、前記変換係数レベルと前記重畳された変換係数との合計（５２）を実行し、
そして、前記エンハンスメント層信号を得るために、前記エンハンスメント層信号の前記変換されたバージョンが、逆変換（８４）を受けるようにさらに構成されていること、を特徴とする、請求項６に記載のスケーラブルビデオデコーダ。
空間周波数成分毎に、前記層間予測信号と前記エンハンスメント層内部予測信号とを重み付けするための重み付け係数が、全ての空間周波数成分に対して、等しい値（４６）まで加算するように構成されていること、を特徴とする、請求項５～請求項８のいずれかに記載のスケーラブルビデオデコーダ。
前記層間予測信号を重み付けするための重み付け係数が、ローパス変換関数に対応し、前記エンハンスメント層内部予測信号を重み付けするための重み付け係数が、ハイパス変換関数に対応していること、を特徴とする、請求項５～請求項９のいずれかに記載のスケーラブルビデオデコーダ。
前記エンハンスメント層信号を再構成（６０）する際に、前記エンハンスメント層信号の既に再構成された部分と前記層間予測信号との間の差信号（７３４）を計算し、
現在再構成されるべき前記エンハンスメント層信号の前記部分に併置された第１の部分（７４４）で、空間的に前記第１の部分に隣接し、かつ、前記エンハンスメント層信号の既に再構成された部分に属する、前記差信号の第２の部分（７３６）から前記異なる信号を空間的に予測して、空間内部予測信号（７４６）を得、
前記層間予測信号と前記空間内部予測信号を結合（７３２）して、前記エンハンスメント層予測信号を得る、ように構成されていること、を特徴とする、請求項１～請求項１０のいずれかに記載のスケーラブルビデオデコーダ。
前記エンハンスメント層信号を再構成（６０）する際に、前記エンハンスメント層信号の既に再構成された部分と前記層間予測信号との間の差信号（７３４）を計算し、
現在再構成されるべき前記エンハンスメント層信号の前記部分に併置された第１の部分（７４４）で、前記エンハンスメント層信号の前に再構成されたフレームに属する、前記差信号の第２の部分（７３６）から前記差信号を時間的に予測して、時間的に予測された差信号（７４６）を得、
前記層間予測信号と前記時間的に予測された差信号とを結合（７３２）して、前記エンハンスメント層予測信号を得るようにさらに構成されていること、を特徴とする、請求項１～請求項１０のいずれかに記載のスケーラブルビデオデコーダ。
符号化データストリーム（６）からベース層信号を再構成（８０）して、再構成されたベース層信号を得ることと、
エンハンスメント層信号の既に再構成された部分から、現在再構成されるべきエンハンスメント層信号の部分を、空間的または時間的に予測して、エンハンスメント層内部予測信号を得ることと、
現在再構成されるべき部分で、層間予測信号と前記エンハンスメント層内部予測信号との間の重み付けが、異なる空間周波数成分を変化させるように、前記再構成されたベース層信号から得られた前記層間予測信号と、前記エンハンスメント層内部予測信号（３８０）との重み付け平均を形成して、エンハンスメント層予測信号を得ることと、
前記エンハンスメント層予測信号を使用して、前記エンハンスメント層信号を予測的に再構成することを含むこととを含み、
前記エンハンスメント層信号を再構成（６０）することとを含むこと、
を特徴とする、スケーラブルビデオ復号化方法。
符号化データストリーム（６）から再構成されたベース層信号を再構成することを可能にするように、前記符号化データストリームの中へのベース層信号を符号化（１２）することと、
エンハンスメント層信号の既に符号化された部分から、現在符号化されるべきエンハンスメント層信号の部分を、空間的または時間的に予測して、エンハンスメント層内部予測信号を得ることと、
現在符号化されるべき部分で、層間予測信号と前記エンハンスメント層内部予測信号との間の重み付けが、異なる空間周波数成分を変化させるように、前記再構成されたベース層信号から得られた前記層間予測信号と、前記エンハンスメント層内部予測信号との重み付け平均を形成して、エンハンスメント層予測信号を得ることと、
前記エンハンスメント層予測信号を使用して、前記エンハンスメント層信号を予測的に符号化することとを含み、
前記エンハンスメント層信号を符号化（１４）するように構成されていること、
を特徴とする、スケーラブルビデオエンコーダ。
符号化データストリーム（６）から再構成されたベース層信号を再構成することを可能にするように、前記符号化データストリームの中にベース層信号を符号化（１２）することと、
エンハンスメント層信号の既に符号化された部分から、現在符号化されるべきエンハンスメント層信号の部分を、空間的または時間的に予測してエンハンスメント層内部予測信号を得ることと、
現在符号化されるべき部分で、層間予測信号と前記エンハンスメント層内部予測信号との間の重み付けが、異なる空間周波数成分を変化させるように、前記再構成されたベース層信号から得られた前記層間予測信号と、前記エンハンスメント層内部予測信号との重み付け平均を形成してエンハンスメント層予測信号を得ることと、
前記エンハンスメント層予測信号を使用して、前記エンハンスメント層信号を予測的に符号化することとを含み、
前記エンハンスメント層信号を符号化（１４）することとを含むこと、
を特徴とする、スケーラブルビデオ符号化方法。
コンピュータ上で動作するとき、請求項１３または１５に記載の方法を実行するプログラムコードを有することを特徴とするコンピュータプログラム。