JP6526292B2

JP6526292B2 - 符号化装置、復号装置、符号化方法、復号方法、及びプログラム

Info

Publication number: JP6526292B2
Application number: JP2018113122A
Authority: JP
Inventors: ジスケクリストフ; オンノパトリス; ラロシュギローム; フランソワエドワード
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2013-04-05
Filing date: 2018-06-13
Publication date: 2019-06-05
Anticipated expiration: 2034-03-24
Also published as: US20180302644A1; CN109547799A; US11089324B2; JP2018174547A; PL3534608T3; CN109510993A; KR20170110178A; BR122017024393B1; RU2639675C2; ES2803426T3; EP3534608B1; KR20150140315A; KR101906753B1; GB201306221D0; KR20190122884A; CN109246436A; US10582214B2; JP2020114013A; JP6701409B2; KR102038243B1

Description

本発明は、一般に、スケーラブルなビデオコーディングおよびビデオデコーディングの分野に関し、特に、高効率ビデオコーディング（ＨＥＶＣ：ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）規格を拡張し得るスケーラブルなビデオコーディングおよびビデオデコーディングに関する。より詳細には、本発明は、スケーラブルなビデオエンコーダおよびビデオデコーダにおける動きベクトル予測のための方法、装置、およびコンピュータプログラムに関する。

ビデオコーディングは、一連のビデオ画像をコンパクトなデジタルビットストリームに変換して、ビデオ画像を伝送または記憶することができるようにする方法である。エンコーディング装置は、ビデオ画像をコーディングするために使用され、関連するデコーディング装置は、表示および視聴の目的でビットストリームを再構成するために利用可能である。一般的な目的は、元のビデオ情報よりも小さなサイズになるようにビットストリームを生成することである。このことは、好適に、ビットストリームコードの伝送または記憶を行うために伝送ネットワークまたは記憶装置に必要とされる容量を低減する。

共通の規格化された手法が、コーディング処理、特に、デコーディング部分に関して、のフォーマットおよび方式のために採用されてきた。過去のビデオ規格のほとんどが、ビデオ画像をより小さなセクション（マクロブロックまたはブロックと呼ばれる）に分割する。完成されている新しい高効率ビデオコーディング（ＨＥＶＣ）ビデオ圧縮規格において、マクロブロックは、いわゆる最大コーディングユニット（ＬＣＵ：ＬａｒｇｅｓｔＣｏｄｉｎｇＵｎｉｔ）（コーディングツリーブロック（ＣＴＢ：ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ）とも呼ばれる）に置き換えられ、考慮中の元の画像セグメントの特性に応じてブロック（ここではコーディングユニット（ＣＵ：ｃｏｄｉｎｇｕｎｉｔ）と呼ばれる）に分割され、調整される。これは、比較的多くの情報を含む、ビデオ画像の領域のより細かなコーディングを可能にし、特徴の少ない領域に対するコーディング負荷の低減を可能にする。画像領域はまた、ビデオ圧縮の文献において以下の様々な用語、すなわち、ピクセルブロック、ピクセルのブロック、ブロック、コーディングユニット（ＣＵ）、およびマクロブロックで知られていることに留意されたい。

次に、ＨＥＶＣのスケーラブル拡張について定義する。この拡張において、画像は、複数の階層レイヤから構成されるものとして考えられている。階層レイヤは、ベースレイヤ（元のビデオシーケンスの画像（またはフレーム）の低品質バージョンのコレクションに相当する）および１つ以上のエンハンスメントレイヤ（リファインメントレイヤとしても知られている）を含む。

ビデオ画像は、元々は、静止画像または静止ピクチャのデジタルコーディングに似た方法で各マクロブロックを個々にコーディングすることによって処理されていた。その後のコーディングモデルは、隣接するマクロブロックからの予測（空間予測またはイントラ予測）または隣接するフレームにおける類似のマクロブロックとの関連付けによる予測（時間予測）のいずれかによって１つのフレームの特徴の予測を可能にしている。これは、既に利用可能になっているコーディングされた情報の使用を可能にし、その結果、全体的に必要とされるコーディングビットレートの量を小さくする。エンコードすべき元のブロックと予測に使用されたブロックとの差が、差分値セットに取り込まれる。次に、元のブロックは、予測に使用されたブロックの識別子および差分の形でエンコードされる。多くの様々な種類の予測が可能である。効果的なコーディングは、ビットストリームで前記ブロックを表すために各予測モードによって生じるビットストリームサイズを考慮に入れながら、デコーディング時に、エンコードすべきブロックに最良の品質をもたらす最良の予測モードを選択する。デコードされるピクチャの品質と必要なビットレートの減少とのトレードオフ（レート／歪みトレードオフとしても知られている）が全体の目標である。

時間予測の場合、いくつかの種類の予測が、可能であるが、２つの主な種類（単方向予測および双方向予測）にまとめられる。単方向予測の場合、予測すべきブロックは、１つの予測子に関連付けられる。予測子の位置は、動き情報としてエンコードされる。この動き情報は、予測子を含む参照フレームのインデックス（規格ではｒｅｆ＿ｉｄｘと呼ばれる）ならびに参照されているフレームにおける予測子ブロックの位置を与える、垂直方向の変位量および水平方向の変位量によって規定されるベクトルによって構成される。双方向予測の場合、エンコードすべきブロックは、２つの異なる参照フレームから得られる２つの予測子に関連付けられる。結果として、動き情報は、参照フレームの２つのインデックスおよび２つのベクトルを含む。

動き情報自体が、予測的方法でエンコードされてもよい。同じフレームの隣接するコーディングユニットに関して得られる動き情報が、空間的な動き情報予測子として使用されてもよい。他のフレームの同じ位置に配置された（コロケートされた）コーディングユニットから得られる動き情報が、時間的な動き情報予測子として使用されてもよい。次に、エンコードすべきブロックに関してエンコードされる動き情報は、使用された動き情報予測子のインデックスならびに選択された動き情報予測子とエンコードされる動き情報との差を表す差分情報を用いてエンコードされる。

前の画像に対応する動き情報からの、動き情報の予測は、エンコーダおよびデコーダが、前にエンコードされた画像の動きフィールドを記憶することを必要とする。この動きフィールドは、４ｋ２ｋまたは８ｋ４ｋのビデオのように大きな分解能を示すビデオに関してはなおさらであるが、記憶すべき膨大な量のデータを示すであろう。ＨＥＶＣコーデックの記憶要求を制限するために、ＨＥＶＣ規格は、完全な動きフィールドの代わりに、動き情報予測のために、圧縮された動きフィールドを使用するという戦略を採用してきた。

動きフィールドの記憶は、前の画像の動き情報が使用される場合にのみ必要とされる。ＨＥＶＣにおいて、時間的な動き情報予測子の使用は、非アクティブ化することも可能である。その場合、動き情報の記憶を阻止することによって、ＨＥＶＣコーデックの記憶要求のさらなる低減が、可能となる。

スケーラブルコーデックの主なアイデアの１つは、エンハンスメントレイヤの情報をエンコードするために所定のコーデック（例えば、ＨＥＶＣ）を用いてコ−ディングされる参照レイヤ（ＲＬ：ＲｅｆｅｒｅｎｃｅＬａｙｅｒ）からの情報を再使用することである。

エンハンスメントレイヤにおける動き情報の予測的エンコーディングのために参照レイヤで決定された動き情報を使用することは望ましい。特に、時間的な動き情報予測子の使用が、参照レイヤにおいて非アクティブ化される場合、動き情報が、エンハンスメントレイヤの動き情報予測への使用のために利用可能でないことが起こり得る。

本発明のある態様によれば第１のレイヤに対応する画像における符号化対象のブロックの動きベクトルを符号化するための動き情報予測子の候補を、前記第１のレイヤとは異なる参照レイヤに対応する参照画像のブロックに対応する動きベクトルから選択する場合に、前記符号化対象のブロックにおける中心に対応する第１の位置に対応する前記参照画像における位置である第２の位置を導出する導出手段と、前記導出手段によって導出された前記第２の位置を前記参照画像における所定の位置に丸めた第３の位置を導出する丸め位置導出手段と、前記第３の位置に基づくブロックに対応する動きベクトルを、前記動き情報予測子の候補として選択する選択手段とを有し、前記第２の位置のＸ座標をＸとし、前記第３の位置のＸ座標をＸ´とした場合、前記第３の位置のＸ座標は下記の式で表される。

また、本発明のある態様によれば、第１のレイヤに対応する画像における復号対象のブロックの動きベクトルを導出するための動き情報予測子の候補を、前記第１のレイヤとは異なる参照レイヤに対応する参照画像のブロックに対応する動きベクトルから選択する場合に、前記復号対象のブロックにおける中心に対応する第１の位置に対応する前記参照画像における位置である第２の位置を導出する導出手段と、前記導出手段によって導出された前記第２の位置を前記参照画像における所定の位置に丸めた第３の位置を導出する丸め位置導出手段と、前記第３の位置に基づくブロックに対応する動きベクトルを、前記動き情報予測子の候補として選択する選択手段とを有し、前記第２の位置のＸ座標をＸとし、前記第３の位置のＸ座標をＸ´とした場合、前記第３の位置のＸ座標は下記の式で表される。

また、本発明は、前述の懸案事項の１つ以上に対処するために案出された。それは、動き導出処理としても知られるスケーラブルエンコーディングスキームのエンハンスメントレイヤの動き情報予測子を決定する処理に関する。それは、圧縮スキームに起因して利用可能なより関連性のある動き情報をピックアップするために使用される参照レイヤの位置の補正を含む。

本発明の第１の態様によれば、スケーラブルエンコーディングフォーマットに従って画像をエンコーディングまたはデコーディングする方法であって、前記エンコーディングフォーマットが、少なくとも参照レイヤおよびエンハンスメントレイヤを含み、画像の少なくとも一部が、動き情報に基づいて予測的にエンコードされ、前記動き情報自体が、一組の動き情報予測子に基づいて予測的にエンコードされ、前記方法が、少なくともエンハンスメントレイヤの画像領域に関して、参照レイヤに属する画像の他の部分の動き情報に基づいて一組の動き情報予測子を決定するステップと、エンハンスメントレイヤにおいてエンコードすべき画像領域の、参照レイヤにおける同じ位置に配置された位置を、前記一組の動き情報予測子の一部である前記位置に関連する動き情報を選択するために決定するステップと、参照レイヤの動き情報に適用される圧縮スキームを考慮に入れて前記同じ位置に配置された位置を補正するステップを含む方法が提供される。したがって、動き情報予測は改善される。

実施形態において、前記同じ位置に配置された位置を補正するステップは、前記同じ位置に配置された位置の座標の少なくとも一方に丸め関数を適用することを含む。

実施形態において、シンタックス要素は、丸め関数に使用される丸め値を表す。

実施形態において、前記同じ位置に配置された位置を補正するステップは、前記同じ位置に配置された位置の座標の少なくとも一方のための補正値を、前記座標によってインデックス化されたルックアップテーブルに基づいてピックアップすることを含む。

実施形態において、本方法は、補正された値が所定の基準に適合するか否かをテストするステップと、そうである場合に、補正された値を変更するステップとをさらに含む。

実施形態において、前記基準は、補正された位置に対応する動き情報の可用性であり、変更された補正された値は、関連する動き情報を有する近傍の値である。

実施形態において、前記基準は、座標の一方に沿った画像寸法に対応する閾値であり、変更された補正された値は、元の値である。

実施形態において、前記基準は、記憶領域の境界に対応する閾値であり、変更された補正された値は、元の値である。

本発明の別の態様によれば、スケーラブルエンコーディングフォーマットに従って画像をエンコーディングまたはデコーディングする装置であって、前記エンコーディングフォーマットが、少なくとも参照レイヤおよびエンハンスメントレイヤを含み、画像の少なくとも一部が、動き情報に基づいて予測的にエンコードされ、前記動き情報自体が、一組の動き情報予測子に基づいて予測的にエンコードされ、前記装置が、エンハンスメントレイヤの少なくとも画像領域に関して、参照レイヤに属する画像の他の部分の動き情報に基づいて一組の動き情報予測子を決定するための予測子決定モジュールと、エンハンスメントレイヤにおいてエンコードすべき画像領域の、参照レイヤにおける同じ位置に配置された位置を、前記一組の動き情報予測子の一部である前記位置に関連する動き情報を選択するために決定するための位置決定モジュールと、参照レイヤの動き情報に適用される圧縮スキームを考慮に入れて前記同じ位置に配置された位置を補正するための位置補正モジュールを備える装置が提供される。

実施形態において、位置補正モジュールは、前記同じ位置に配置された位置の座標の少なくとも一方に丸め関数を適用するための丸めモジュールを備える。

実施形態において、位置補正モジュールは、前記同じ位置に配置された位置の座標の少なくとも一方のための補正値を、前記座標によってインデックス化されたルックアップテーブルに基づいてピックアップするための手段を備える。

実施形態において、本装置は、補正された値が所定の基準に適合するか否かをテストするための手段と、そうである場合に、補正された値を変更するための手段とをさらに含む。

本発明の別の態様によれば、プログラマブルな装置のためのコンピュータプログラム製品であって、プログラマブルな装置にロードされ、プログラマブルな装置によって実行されたときに、本発明に係る方法を実施するための一連の命令を含むコンピュータプログラム製品が提供される。

本発明の別の態様によれば、本発明に係る方法を実施するためのコンピュータプログラムの命令を記憶するコンピュータ読み取り可能な記憶媒体が提供される。

本発明に係る方法の少なくとも一部は、コンピュータにより実施されてもよい。したがって、本発明は、全体的にハードウェアの実施形態、全体的にソフトウェアの実施形態（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）、またはソフトウェアおよびハードウェアの態様を組み合わせた実施形態の形をとってもよい。なお、これらはすべて、本明細書において一般的に「回路」、「モジュール」、または「システム」と呼ばれる。さらに、本発明は、有形の媒体であって、該媒体で実施される、コンピュータで使用可能なプログラムコードを有する表現の有形の媒体で実施されるコンピュータプログラム製品の形をとってもよい。

本発明は、ソフトウェアで実施され得るため、本発明は、任意の適切な搬送媒体（ｃａｒｒｉｅｒｍｅｄｉｕｍ）においてプログラマブルな装置に供給するためのコンピュータ読み取り可能なコードとして実施されてもよい。有形の搬送媒体は、フロッピーディスク、ＣＤ−ＲＯＭ、ハードディスクドライブ、磁気テープ装置、または固体メモリ装置などの記憶媒体を含んでもよい。一時的な搬送媒体は、電気信号、電子信号、光信号、音響信号、磁気信号、または電磁信号（例えば、マイクロ波またはＲＦ信号）などの信号を含んでもよい。

次に、本発明の実施形態が、以下の図面を参照しながら単なる例として説明される。
図１は、旧知のスケーラブルビデオエンコーダのブロック図を示している。図２は、本発明の実施形態における動き情報予測子に関する空間的位置および時間的位置を示している。図３は、本発明の実施形態における、参照レイヤの動き情報を用いる、エンハンスメントレイヤの動き情報の予測を示している。図４は、本発明の実施形態におけるデコーディング処理に関するフローチャートを示している。図５は、本発明の実施形態における動き情報の粒度を示している。図６は、本発明の実施形態におけるテクスチャＲＬ（ＴｅｘｔｕｒｅＲＬ）手法の原理を概略的に示している。図７は、本発明の実施形態における、エンハンスメントレイヤのテクスチャＲＬ手法のＡＭＶＰモードおよびマージモードの両方との関連で構成された動き情報予測子の導出処理を示している。図８は、本発明の実施形態における参照フレームインデックス手法との関連で構成された処理を示している。図９は、本発明の実施形態におけるマージモードの動き情報導出処理のフローチャートである。図１０は、本発明の実施形態におけるスケーラブルデコーダのブロック図を提示している。図１１は、本発明の１つ以上の実施形態の実施のためのコンピュータ装置の概略ブロック図である。図１２は、本発明の実施形態における、ＡＭＶＰ動き情報予測子セットの導出を示している。図１３は、本発明の実施形態における記憶領域の詳細を示している。

図１は、古典的なスケーラブルビデオエンコーダのブロック図を示しており、古典的なスケーラブルビデオエンコーダは、多数のサブパートまたはステージを含むことができ、また、ＨＥＶＣのスケーラブル拡張を表すことができる。ここで示されているのは、ベースレイヤ１．１３に対応するデータおよび１つのエンハンスメントレイヤ１．１４に対応するデータを生成する２つのサブパートまたはステージＡ１０およびＢ１０である。サブパートＡ１０およびＢ１０のそれぞれは、変換、量子化、およびエントロピーコーディングのステップが各レイヤに対応する２つの別個のパスに適用される標準ビデオエンコーダの原理に従う。

第１のステージＢ１０は、Ｈ．２６４／ＡＶＣまたはＨＥＶＣに準拠したベースレイヤの出力スケーラブルストリームのエンコーディングを目的としている。この非スケーラブルエンコーダへの入力は、画像１．１にダウンサンプリング１．１７を適用することによって得られる元の一連のフレーム画像である。このエンコーダは、標準ビデオビットストリームをエンコードするために以下のステップを連続的に実行する。エンコードされる（圧縮される）ピクチャまたはフレームは、ステップ１．２においてピクセルブロック（ＨＥＶＣ規格ではコーディングユニット（ＣＵ）と呼ばれる）に分割される。各ブロックには、最初に、動き推定演算１．３が施される。動き推定演算１．３は、専用メモリバッファ１．４に記憶された参照ピクチャの中から、良好なブロックの予測を提供し得る参照ブロックを探索することを含む。この動き推定ステップは、発見された参照ブロックおよび対応する動きベクトルを含む１つ以上の参照ピクチャインデックスを提供する。次に、動き補償ステップ１．５が、動き補償された予測ブロックと予測すべき元のブロックとの差である時間的な差分ブロックを得るために、推定された動きベクトルを発見された参照ブロックに適用する。さらに、イントラ予測ステップ１．６が、現在のブロックを予測するために最良の性能を提供するであろう空間予測モードを決定する。再び、空間的な差分ブロックが、ここでは空間予測子と予測すべき元のブロックとの差として計算される。

その後、コーディングモード選択機構１．７が、空間予測および時間予測の中から、現在のブロックのコーディングにおいて最良のレート歪みトレードオフを提供するコーディングモードを選択する。次に、選択された予測モードに応じて、予測差分ブロックに、変換（ＤＣＴ）および量子化１．８が施される。そうして量子化された係数ＱＴＣ（および関連付けられた動きデータＭＤ）のエントロピーコーディング１．１０が実行される。コーディングされている現在のブロック１．２に関連付けられ圧縮されたテクスチャデータ１．１３が、出力に送信される。

コーディング効率をさらに改善するために、動き補償ステップを実行するインターブロックに関連付けられた動き情報が、隣接するブロックの動き情報を用いて予測的にエンコードされる。その場合、隣接するブロックは、空間的に隣接するブロックおよび、随意に、時間的に隣接するブロックを含む。結果として、時間的に隣接するブロックが使用される場合、前にエンコードされた画像の動き情報が、予測を可能にするために記憶される必要がある。現在の規格のバージョンにおいて、この情報は、エンコーディング処理およびデコーディング処理のメモリ使用量を制限するためにエンコーダおよびデコーダによって、圧縮された形式で記憶される。しかしながら、先に言及したように、時間予測子が、動き情報予測に使用されない場合、前の画像の動きフィールドを記憶する必要はない。

次に、現在のブロックは、逆量子化（スケーリングとも呼ばれる）および逆変換１．１１によって再構成される。このステップの後には、必要に応じて、再構成されたブロックを生成するために現在のブロックの逆変換された差分ブロックと予測ブロックとを加算することが続く。再構成されたブロックは、再構成されたフレームを生成するためにバッファに追加される。次に、この再構成されたフレームは、１．１２においてポストフィルタリングされる。このポストフィルタ後の再構成されたフレームは、ＤＰＢ（デコードされたピクチャバッファ（ＤｅｃｏｄｅｄＰｉｃｔｕｒｅＢｕｆｆｅｒ）を表す）と呼ばれるメモリバッファ１．４に記憶され、これにより、それは、エンコードされるその後のピクチャを予測するための参照ピクチャとしての使用に利用可能となる。

最終的に、最後のエントロピーコーディングステップには、コーディングモードおよびインターブロックの場合は動きデータならびに前に計算された量子化されたＤＣＴ係数が与えられる。このエントロピーコーダは、データのこれらの部分のそれぞれを、それぞれのバイナリ形式にエンコードし、そうしてエンコードされたブロックを、ＮＡＬ（ネットワーク抽象レイヤ（ＮｅｔｗｏｒｋＡｂｓｔｒａｃｔＬａｙｅｒ）を表す）ユニットと呼ばれるコンテナに格納する。ＮＡＬユニットは、所与のスライスからのすべてのエンコードされたコーディングユニットを含む。コーディングされたＨＥＶＣビットストリームは、一連のＮＡＬユニットである。

次に、第２のステージＡ１０は、ベースレイヤを参照レイヤとして用いる、エンハンスメントレイヤのコーディングを示している。ここでは、このエンハンスメントレイヤは、アップサンプリングされたベースレイヤに空間分解能のリファインメントをもたらす。図１に示されているように、このエンハンスメントレイヤのコーディングスキームは、圧縮されている、ストリーム１．１０からの現在のピクチャの各コーディングユニットのために、レイヤ間予測に基づく追加モードが考えられている点を除いて、ベースレイヤのコーディングスキームと同様である。通常は以下の修正が含まれる。

アップサンプリングされた、参照ブロックの同じ位置に配置されたブロックを用いてエンハンスメントレイヤのブロックを予測するイントラＢＬ１．９０と呼ばれる追加モードが、エンハンスメントレイヤブロックを考慮するモードのリストに追加されている。

インターモードに使用される動き情報予測は、参照レイヤからもたらされる動き情報を考慮に入れて修正されてもよい。加えて、動き情報の特定のエントロピーコーディングが、エントロピーコーディングステップ１．２０中に適用されてもよい。

これらの新しいツールに関して、中間のレイヤ間モジュール１．１８が、参照レイヤから、エンハンスメントレイヤエンコーディングの様々なモジュール（動き推定モジュール１．２３、イントラＢＬモード１．９０、またはイントラ予測モジュール１．２６など）に情報（動き情報、サンプル）、おそらく空間分解能の変更に応じてアップサンプリングされた、を提供することが可能である。特に、参照フレーム手法において、モジュール１．１８は、ＤＰＢ１．４の、結果として得られたフレームのサンプルデータおよび動きデータの両方を、エンハンスメントレイヤの寸法に適合するようにアップサンプリングし、結果として得られたデータ（画像およびその動き）をＤＰＢ１．２４に挿入し、これにより、次には１．２５および１．２３の演算に影響を及ぼす。

図１０は、２つのスケーラビリティレイヤ（例えば、ベースレイヤおよびエンハンスメントレイヤを含む）から生成されたスケーラブルビットストリームに適用されるであろうスケーラブルデコーダのブロック図を提示している。したがって、このデコーディング処理は、図１のスケーラブルコーディング処理とは逆の処理である。デコードされるスケーラブルストリーム１０．１０は、１つのベースレイヤおよび該ベースレイヤの上の１つの空間的エンハンスメントレイヤから生成され、ステップ１０．２０において、それぞれのレイヤにデマルチプレックスされる。

図１０の第１のステージは、ベースレイヤのデコーディング処理Ｂ１２に関する。このデコーディング処理は、ベースレイヤにおいてコーディングされた各ピクチャの各コーディングユニットまたはブロックのエントロピーデコーディング１０．３０によって開始される。このエントロピーデコーディング１０．３０は、コーディングモード、動き情報（参照ピクチャインデックスおよびインターコーディングされたブロックの動きベクトル）、イントラ予測のための予測の方向、および差分データを提供する。この差分データは、量子化され、変換されたＤＣＴ係数からなる。次に、これらの量子化されたＤＣＴ係数に、逆量子化および逆変換演算１０．３１が施される。動き補償１０．３２またはイントラ予測１０．３３のデータが、演算１０．３４によってこの差分に加算可能である。

次に、デブロッキングフィルタステップ１０．３５が適用される。次に、そうして再構成された画像が、フレームバッファ１０．４０に記憶される。

次に、インターブロックのためにデコードされた動き情報および再構成されたブロックが、図１０の第１のスケーラブルデコーダ（Ｂ１２）のフレームバッファに記憶される。このようなフレームは、上位のスケーラビリティレイヤを予測するために参照データとして使用可能なデータを含む。

次に、図１０の第２のステージは、第１のステージによってデコードされたベースレイヤの上の空間的エンハンスメントレイヤＡ１２のデコーディングを実行する。この空間的エンハンスメントレイヤのデコーディングは、第２のレイヤのエントロピーデコーディングを含み、第２のレイヤのエントロピーデコーディングは、コーディングモード、動き情報、およびイントラ予測情報、ならびに変換され、量子化された、第２のレイヤの、ブロックの差分情報を提供する。

次のステップは、エンハンスメントピクチャのブロックを予測することである。異なる種類のブロック予測（イントラ予測、インター予測、またはテクスチャＲＬ手法の場合はレイヤ間予測）間の選択１０．５１は、エントロピーデコーディングステップ１０．５０から得られた予測モードに依存する。

イントラブロックに関して、その処理は、イントラコーディングユニットの種類に依存する。レイヤ間予測されるイントラブロック（イントラＢＬコーディングモード）１０．５７の場合、差分データが、ブロックに関してエンコードされていたら、エントロピーデコーディング１０．５０の結果が、逆量子化および逆変換１０．５２され、次に、演算１０．５３によってベースピクチャの現在のブロックの同じ位置に配置されたブロック（デコードされ、ポストフィルタリングされ、アップサンプリングされた（空間的スケーラビリティの場合）バージョンの）に加算される。イントラブロックの場合、このようなブロックは、空間ドメインの差分データを得るための逆量子化、逆変換、次に、完全に再構成されたブロックを得るためのイントラ予測１０．５４によって完全に再構成される。

インターブロックに関しては、その再構成は、フレームメモリ１０．６０から計算されるその動き補償１０．５５、差分データのデコーディング、および、その時間予測子ブロックへのデコードされたその差分情報の加算を含む。このブロック間デコーディング処理において、考慮されているブロックに関連する動き情報は、ベースピクチャの同じ位置に配置されたブロックの動き情報のリファインメント（補正量）として、予測的方法でデコードすることも可能である。この態様については以下で詳述する。

ベースレイヤの場合のように、デブロッキングフィルタステップ１０．５６が、１０．５３から出力された画像に適用され、完全にデコードされたフレーム１０．７０としてデコードされることによって戻される前にフレームメモリ１０．６０に記憶されることも可能である。本発明の実施形態において、動き補償１０．５５は、実際に、エンハンスメントレイヤ画像バッファ１０．６０およびベースレイヤ画像バッファ１０．４０からのデータを使用することに留意されたい。サンプルデータと共に、モジュール１０．８０は、上記のデータをアップサンプリングすることによって参照レイヤからのこのデータを提供する役割を果たしてもよい。

画像予測のための２つの手法が考えられる。より詳細には、画像予測は、動き情報予測を含む。両方の手法において、動き情報予測は、異なる方法で影響を及ぼされる。画像予測の２つの手法が以下で説明される。これらの手法の特徴は、エンハンスメントレイヤにおける動き情報の予測のために参照レイヤの動き情報を使用することを可能にすることである。この特徴は、図３に関連してより詳細に説明されるが、この特徴は、図１の参照レイヤのフレームメモリ１．４にアクセスする仕方に影響を及ぼす。

次に、本発明の要点である動き情報予測の事例が、両方の手法に関して詳細に説明される。

第１の手法は、イントラＢＬモードの使用が可能なことから通常はテクスチャＲＬ（ＲｅｆｅｒｅｎｃｅＬａｙｅｒ）と呼ばれている。この手法は、イントラＢＬモードの使用をシグナリングするためにブロックレベルの低レベルのシンタックスを使用する。この手法は、一部の専門家によって場合により「イントラＢＬ手法」と呼ばれている。

参照フレーム挿入と呼ばれる第２の手法は、主として高レベルの変更を使用することである。特に、シンタックスの変更は、ブロックレベルでは行われない。参照フレームインデックス手法の主な特徴は、参照レイヤの画像（場合により、分解能が異なる場合はアップスケーリングされた）（ＩＬＲ画像（レイヤ間参照（ＩｎｔｅｒＬａｙｅｒＲｅｆｅｒｅｎｃｅ）画像を表す）と呼ばれる）を、エンハンスメントレイヤのデコードされた画像のバッファに導入することである。そして、これらの画像は、ＤＰＢ（デコードされたピクチャのバッファ（ＤｅｃｏｄｅｄＰｉｃｔｕｒｅＢｕｆｆｅｒ））の参照画像として使用される特定の参照画像リスト（Ｌ０リストおよびＬ１リスト）の最後に挿入される。挿入は、エンハンスメントレイヤの現在のスライスの種類に依存する。Ｐスライスでは、ＩＬＲ画像は、Ｌ０リストの最後に挿入される。Ｂスライスでは、ＩＬＲ画像は、Ｌ０リストおよびＬ１リストの両方の最後に挿入される。この手法は、一部の専門家によって場合により「ｒｅｆ＿ｉｄｘ手法」と呼ばれている。この手法の場合、所与のブロックの動き情報は、参照レイヤにおいて同じ位置に配置された、参照レイヤの時間的な動き情報予測子を用いて予測的にエンコードされても良い。

テクスチャＲＬ手法におけるイントラＢＬおよび参照フレームインデックス手法における挿入された参照フレームの使用は、エンハンスメントレイヤを予測するためにベースレイヤ情報を使用する２つの方法であることは注目に値する。本発明の説明において、簡単にするために、一度にこれらの手法の一方を検討し、両方一緒には検討しない。

次に、両方の手法に有効な、動き情報に関する一般的な情報について説明する。

通常のビデオコーデックは、イントラモードおよびインターモードのそれぞれにおいてピクセル間の空間的相関および時間的相関の両方を活用する。ここでは、現在のフレームおよび前にエンコード／デコードされたフレームのピクセル間の時間的相関を活用するインターモードに焦点を合わせる。

ＨＥＶＣ（および拡張によるＳＨＶＣ）において、「インター」モードは、時間予測方向を規定する予測モードである。動き情報の０〜２のセットが、この時間的方向に応じて規定される。「インター」予測方向が、０に等しい場合、ブロックは、イントラモードでコーディングされ、動き情報を含まない。「インター」予測方向が、１に等しい場合、ブロックは、Ｌ０と呼ばれる、参照フレームのリストからの動き情報を含む。「インター」予測方向が、２に等しい場合、ブロックは、Ｌ１と呼ばれる、参照フレームの別のリストからの動き情報を含む。「インター」予測方向が、３に等しい場合、ブロックは、リストＬ０およびＬ１の両方からの動き情報を含む。

動き情報は、以下の情報、すなわち、参照フレームのリストのインデックス（ｒｅｆ＿ｉｄｘ）ならびに２つの成分（水平方向および垂直方向の動き値）を有する動きベクトルである。これらの値は、現在のブロックと参照フレームの時間予測子ブロックの位置の間の、ピクセルに関する空間変位に対応する。この変位は、サブピクセル精度（ピクセルの４分の０、１、２、または３）を有することができる。

上で言及した「インター」予測方向１および２は、単方向予測に対応し、Ｉスライス（＝イントラコーディングされるスライス）には使用できないが、Ｐスライス（予測されるスライス）およびＢ（双予測される）スライスに使用することができる。特定の種類（Ｉ、Ｐ、またはＢ）の画像は、同じ種類の少なくとも１つのスライスから生成される。「インター」予測方向３は、双方向予測と呼ばれ、Ｂスライスにのみ使用することができる。この場合、２つのブロック予測子が、リストＬ０およびＬ１のそれぞれに関して考慮される。その結果として、２つの参照フレームインデックスおよび２つの動きベクトルが考慮される。双予測のためのブロック間予測子は、これらの２つの動きベクトルによって指し示されたこれらの２つのブロックの、ピクセル毎の平均である。ブロック予測子は、ここでは、ＨＥＶＣまたはＳＨＶＣにおける予測ユニットまたは予測ブロックの概念に対応する。

上で説明したように、ＨＥＶＣにおける動き情報は、複数の動き情報予測子（これらの中には、時間的に同じ位置に配置された動き情報がある）を用いる予測コーディングによってコーディングされる。したがって、参照フレームとして使用される各フレームは、エンコーダ側およびデコーダ側に、関係するその動き情報を記憶することが必要である。この動き情報は、動き情報の専用メモリ中におけるサイズを縮小するために圧縮される。

したがって、ＨＥＶＣは、動きを表すために特定の粒度を使用する。このことは、図５に描かれている。１６×１６ピクセルのどのブロック５．０についても、ＨＥＶＣによって使用される最小粒度は、４×４ピクセルであり、このため、４×４ブロックの各ブロックに対して、１６の動き情報の部分が有りうる。動き情報の圧縮は、所与のブロック５．０に対して左上の４×４ブロック５．１に対応する動き情報のみを保持することにある。

動き情報の圧縮処理は、最終的な選択が１６×１６ブロックに対して行われ、それがエンコードされたらすぐに行われてもよい。しかしながら、それを視覚化することは、画像全体が一度エンコードされたときに行われるのでより簡単である。簡単にするために、適応ループフィルタ処理の後、およびデコードされたピクチャがデコードされたピクチャのバッファ（ＤＰＢ）に入れられる前に、それを実行することを考慮することも可能である。この圧縮処理は、特定のルックアップとして説明され得る。すなわち、所定のピクセル座標ＸおよびＹに対して、動き情報は、位置Ｘ’＝（Ｘ＞＞４）＜＜４およびＹ’＝（Ｙ＞＞４）＜＜４から得られる。ただし、「＞＞」および「＜＜」というオペレータは、以下のように説明される。

ｘ＞＞ｙは、ｘ掛けるｙの２進数の２の補数の整数表現の算術右シフトを表す。この関数は、非負の整数値のｙに関してのみ規定される。右シフトの結果としてＭＳＢにシフトされたビットは、シフト演算の前のｘのＭＳＢと等しい値を有する。

ｘ＜＜ｙは、ｘ掛けるｙの２進数の２の補数の整数表現の算術左シフトを表す。この関数は、非負の整数値のｙに関してのみ規定される。左シフトの結果としてＬＳＢにシフトされたビットは、０に等しい値を有する。

幾つかの実施では、対応する圧縮された動きを記憶するためにバッファを使用することを記載しておこう。

ＨＥＶＣ設計において、動きベクトルは、複数の動き情報予測子を用いて予測コーディングによってコーディングされる。インターコーディングされるブロックに対して、スキップ、インター、およびマージのブロックエンコーディングサブモードと呼ばれる３つのサブモードが存在する。インターサブモードは、ＡＭＶＰと呼ばれる特定の動き予測方法を使用し、差分テクスチャデータを使用する。スキップおよびマージサブモードは、同じ動き予測方法を使用する（しかしながら、前者は、差分データを使用しない）。この予測方法は、所定のセット（このセットは、空間的および時間的な動き情報から構成される）からの最良の動き情報予測子の選択を可能にする。

マージモードと呼ばれる動き情報予測モードおよびそれがどのように上で言及した両方の手法、つまりテクスチャＲＬおよび参照フレームインデックス、に適用されるかについて説明する。これは、２つのインターコーディングサブモード、つまりスキップおよびマージのサブモード、に使用される。次に、ＡＭＶＰモードで使用されであろう同等のスキームについて詳述する。

図３は、短縮して「マージモード」と呼ばれる、エンコーダ側のマージおよびスキップのサブモードのためのマージ動き情報予測子スキームに関する一般的なフローチャートを示している。マージモードの原理は、動きリファインメントをコーディングすることなく動き補償のために動きベクトル予測を使用することである。動き情報予測子生成モジュール３．３は、後で詳細に説明されるように動き情報フィールド３．１に基づいて動き情報予測子セット３．４を生成する。最良の動き情報予測子のレート／歪み選択３．７が、動き情報予測子セット３．４に共通して適用される。これは、コーディングされるべき動きベクトル予測子インデックス３．８を生成する。

変換モジュール３．１４は、前記インデックスをトランケートユーナリコード３．１５に変換する。すなわち、エンコードすべき値Ｎに対して、その代わりにＮ個のビットを必要とする、Ｎが最大値の場合を除いて、長さＮ＋１のコード語が生成される。このコードは、１に設定されるＮ個のビットおよび０に設定される最後のビットからなる。Ｎの値が、候補の最大数に等しい場合、そのターミナルビットは必要なく、したがって、コード語の長さはＮとなる。その最大値のために、マージ候補の数（通常、ＨＥＶＣに関しては５）が、スライスレベルで選択されてもよく（ＨＥＶＣでは、ｆｉｖｅ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿Ｍｅｒｇｅ＿ｃａｎｄというシンタックス要素）、ステップ３．１４では、予測子の最大数３．１６が考慮に入れられる。

次に、生成されたコード語３．１５は、エントロピーコーディングステップ３．１２によってエントロピーコーディングされる。すなわち、
−最初のビットは、特定のコンテキストを有する算術コーディングを使用し、
−残りのビットは、バイパスコーディングを使用する（すなわち、実際のビットが生成される）。

図４は、対応するデコーディング処理に関するフローチャートを示している。最初のステップにおいて、モジュール４．２は、現在のフレームおよび前のフレームの動き情報フィールド４．１に基づいて動き情報予測子セット４．８を生成する。動き予測子の最大数４．１６が、スライスヘッダに配置されたシンタックス要素ｆｉｖｅ＿ｍｉｎｕｓ＿ｍａｘ＿ｎｕｍ＿Ｍｅｒｇｅ＿ｃａｎｄからデコードされている。次に、それは、動き情報予測子コードワード４．１４を抽出するために４．６において使用される。このコード語は、ステップ４．１５によって予測子インデックス４．９に変換される。次に、使用すべき動き情報予測子４．１０が、この予測子インデックス値４．９に応じてセット４．８から抽出される。次に、この予測子は、動き補償中に実際の動き情報として使用される。

動き情報予測子または候補は、すべての動き情報、すなわち、方向（すなわち、動きベクトルの可用性およびリスト内の参照インデックス）、参照フレームインデックス、および動きベクトルを含む。それぞれがインデックスを有するいくつかの候補が、以下で説明されるマージ導出処理によって生成される。ＨＥＶＣにおいて、候補の最大数Ｍａｘ＿Ｃａｎｄは、デフォルトでは５に等しいが、１に低減されてもよい。ここで、テクスチャＲＬ手法および参照フレームインデックス手法のための特定の部分に関する、マージ動き情報予測子決定について説明する。

図９は、マージモードの動き情報導出処理のフローチャートである。ＨＥＶＣコアのテクスチャＲＬ手法および参照フレームインデックス手法の両方における導出の最初のステップにおいて、７つのブロック位置９．１〜９．７が考えられる。

尚、テクスチャＲＬ手法の場合、もう１つの候補、つまりＳＭＶＰ９．０（ＳＭＶＰは、空間的動きベクトル予測子（ＳｐａｔｉａｌＭｏｔｉｏｎＶｅｃｔｏｒＰｒｅｄｉｃｔｏｒ）を表す）、が、前に説明したように考えられる。これらの位置は、図２に描かれている空間的位置および時間的位置である。各位置は、両方の図において同じ名称を有する。このＳＭＶＰは、参照フレームインデックス手法には存在しない。

モジュール９．８は、空間的動き情報を、また、テクスチャＲＬ手法ではさらにエンハンスメントレイヤのために、ＳＭＶＰの可用性をチェックする。それは、最大で４つの動き情報予測子を選択する。このモジュールにおいて、予測子は、それが参照レイヤに存在する場合およびこのブロックがイントラコーディングされない場合に利用可能である。更に、その後、テクスチャＲＬ手法内では、追加される任意の候補は、他の動き情報に加えてさらにＳＭＶＰと比較され、異なる場合にのみ実際に追加される。例えば、Ａ１または９．１として参照される「左」候補は、ＳＭＶＰとも比較され、動きが位置Ｘ２に存在する場合には第２の候補として、そうでなければ第１の候補として追加される。この比較は、以下をチェックすることによって実行される。すなわち、
−２つの候補からの動き情報が、同じ予測方向を有するか否か、
−そうである場合、予測方向に関係づけられた、動き情報の各部分に関して、
・同じフレームが参照されるのか否か（すなわち、ｒｅｆ＿ｉｄｘインデックスが同じ値であるか否か）、
・動きベクトルが、その垂直方向および水平方向の座標の両方において同一であるか否か
をチェックする。

これらの５つの動きベクトルの選択およびチェックは、以下の条件において説明される。

・テクスチャＲＬ手法において、ＰＵの中心位置Ｘ１の同じ位置に配置された位置Ｘ２からの動き情報９．０が利用可能な場合９．８、それは、リスト９．１０の第１の候補としてスケーリングされ、使用される。

・「左」Ａ１の動き情報９．１が利用可能な場合９．８、このことは、それが存在する場合およびこのブロックがイントラコーディングされない場合に、「左」ブロックの動き情報が、リスト９．１０の第１の候補として選択され、使用されることを意味する。

・「上」Ｂ１の動き情報９．２が利用可能な場合９．８、候補「上」ブロックが、Ａ１と比較される９．９（それが存在する場合）。Ｂ１が、Ａ１と等しい場合、Ｂ１は、空間的候補のリスト９．１０に追加されず、そうでなければ、それは追加される。

・「右上」Ｂ０の動き情報９．３が利用可能な場合９．８、「右上」の動きベクトルが、Ｂ１と比較される９．９。Ｂ０が、Ｂ１と等しい場合、Ｂ０は、空間的候補のリスト（９．１０）に追加されず、そうでなければ、それは追加される。

・「左下」Ａ０の動きベクトル９．４が利用可能な場合９．８、「左下」の動き情報が、Ａ１と比較される９．９。Ａ０が、Ａ１と等しい場合、Ａ０は、空間的候補のリスト９．１０に追加されず、そうでなければ、それは追加される。

・空間的候補のリストが、４つの候補を含まない場合、「左上」Ｂ２の動き情報９．５の可用性がテストされ９．８、それが利用可能な場合、「左上」Ｂ２の動きベクトルが、Ａ１およびＢ１と比較される９．９。Ｂ２が、Ａ１およびＢ１のどちらかと等しい場合、Ｂ２は、空間的候補９．１０のリストに追加されず、そうでなければ、それは追加される。

このステージの最後において、リスト９．１０は、０から４つまでの候補を含む。

時間的候補に関しては、２つの位置、すなわち、同じ位置に配置された（コロケートされた）ブロックの右下位置ＢＲ１に対応するＨ９．６または現在のブロックの中心位置Ｘ１に対応する、同じ位置に配置されたブロックの中心Ｃ９．７（「コロケートされた」は、時間的に異なるフレームの同じ位置のブロックを意味する））、が使用可能である。これらの位置は、図２に描かれている。

最初に、Ｈ位置９．６のブロックの可用性がチェックされる９．１１。それが利用可能でない場合、中心位置９．７のブロックがチェックされる９．１１。これらの位置の少なくとも１つの動き情報が利用可能な場合、この時間的動き情報は、必要に応じて時間的候補９．１３を生成するために、両方のリストＬ０およびＬ１に関してインデックス０を有する参照フレームからもたらされる動き情報と相同になるように必要に応じてスケーリングされてもよい９．１２。次に、時間的候補は、マージ候補リストの、空間的候補の直後に挿入される。

さらに、時間的候補に対する最終位置（可用性に応じてＨまたは中心）は、メモリアクセスを低減するために同じＣＴＢ（コーディングツリーブロック（ＣｏｄｉｎｇＴｒｅｅＢｌｏｃｋ）を表す）内またはその右隣りに残るように制約されている。

すべてのレイヤおよびすべての手法に関して（もっとも重要なのは、参照レイヤにおいてだが）、この動き情報予測子が、以下に応じて条件的に決定され、追加されることに留意することは重要である。

−前記時間的動き情報予測子（ＴＭＶＰ）は、シーケンスレベルで無効であるか否か（例えば、ＳＰＳ（シーケンスパラメータセット（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）を表す）に配置されたフラグｓｐｓ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｅｎａｂｌｅ＿ｆｌａｇを用いて）（これは、特に、本発明の実施形態に関連する）
−それが、シーケンスレベルで有効な場合、それは、スライスレベルで無効であるか否か（例えば、スライスヘッダに配置されたフラグｅｎａｂｌｅ＿ｔｅｍｐｏｒａｌ＿ｍｖｐ＿ｆｌａｇを用いて）
この動き情報予測子が無効な可能性があるという事実は、それが動きベクトルメモリ圧縮によってどの様に影響されるかと共に、説明されている処理および予測子ＳＭＶＰ９．０がどの様に導出されるかにおいて重要な役割を演じる。

第二に、参照フレームインデックス手法において、この時間的動き情報予測子は、挿入されたフレームからもたらされてもよい。後述するように、前記動き情報は、実際に、参照レイヤフレームの圧縮された動きフィールドから導出される。

候補の量（Ｎｂ＿Ｃａｎｄ）９．１４が、候補の最大数Ｍａｘ＿Ｃａｎｄよりも厳密に少ない場合、デフォルトで、そしては最大で５つの組み合わされた候補が、ステップ９．１５で生成され、そうでなければ、マージ候補の最終リストが、ステップ９．１８において構成される。モジュール９．１５は、現在のフレームがＢフレームの場合にのみ使用され、それは、ステップ９．１５において２つのマージリストの利用可能な候補に基づいていくつかの候補を生成する。この生成は、リストＬ０の候補の１つの動き情報をリストＬ１の異なる候補の別の動き情報に組み合わせることである。

候補の量（Ｎｂ＿Ｃａｎｄ）９．１６が、候補の最大数Ｍａｘ＿Ｃａｎｄよりも厳密に少ない場合、Ｎｂ＿ＣａｎｄがＭａｘ＿Ｃａｎｄと等しくなるまで、変位のないヌル動き情報候補（０，０）（すなわち、動きベクトル値が、すべてゼロに等しい）が、ステップ９．１７において追加され、Ｎｂ＿Ｃａｎｄがインクリメントされる。

この処理の最後において、マージ候補の最終リストが、ステップ９．１８において構成される。

ＳＨＶＣ（ＨＥＶＣのスケーラブル拡張）に関する現在の詳述は、ＡＭＶＰモードにおいて参照レイヤから得られる動き情報予測子を使用していないが、このことは、以下のように導入され得る。

図１２は、ＡＭＶＰ動き情報予測子セットの導出を示している。この処理は、動き情報を予測的にコーディングするために使用される。マージモードと比較して、さらなる情報が伝送されなければならない。すなわち、予測方向ならびに伝送すべき動き情報の各々対して参照フレームインデックス、予測子インデックス、および動き情報差分がさらに伝送される。

予測子インデックスは、候補の数に依存する。すなわち、ＨＥＶＣは、最大で２つの動き情報予測子を生成する必要がある。その場合、この図のＭａｘ＿Ｃａｎｄは、２に等しく設定されるが、エンハンスメントレイヤのために３を使用することも想像できる。第１の空間的候補が、マージモードに関する位置と同様の位置に関して左ブロックＡ０１２．１およびＡ１１２．２から選択される。

ＡＭＶＰモードの２つの空間的動き情報予測子は、再度マージモードに関しては、上隅のブロックおよび左隅のブロックを含む上ブロックおよび左ブロックから選択される。この左の予測子Ｃａｎｄ１１２．９は、ブロック「左下」Ａ０および「左」Ａ１から選択される１２．８。この特定の順序で、以下の条件が、動き情報値が、同じ参照リストおよび同じ参照ピクチャからの動き情報または他の参照リストおよび同じ参照ピクチャからの動き情報に関して発見されるまで評価される。

上の動き情報予測子Ｃａｎｄ２１２．１１は、ステップ１２．１０において、後述する同じ条件を用いて「右上」Ｂ０１２．３、「上」Ｂ１１２．４、および「左上」Ｂ２１２．５の中から、この特定の順序で選択される。次に、Ｃａｎｄ１およびＣａｎｄ２は、これらが等しい場合にこれらの動き情報予測子の一方を除去するために比較される１２．１５。このプルーニングの後で、候補の数が、ステップ１２．１６においてＭａｘ＿Ｃａｎｄと比較され、等しい場合、ＡＭＶＰ動き情報候補のリストは完全に決定され、処理は、ステップ１２．２３において終了する。

そうではなく、候補の数が、Ｍａｘ＿Ｃａｎｄを下回る場合、時間的動き予測子Ｃａｎｄ３１２．１４が、マージモードの場合のように導出され、ステップ１２．１７において、それが存在するならば追加される。そうするために、右下（Ｈ）１２．６の位置が、最初に、可用性チェックモジュール１２．１２において検討される。それが存在しない場合、同じ位置に配置されたブロックの中心１２．７が選択される。

次に、追加された候補の数が、ステップ１２．１８において再び候補の最大数と比較される。この最大数に達している場合、ＡＭＶＰ予測子の最終リストが、ステップ１２．２３において構成される。そうでなければ、ステップ１２．１９において、エンハンスメントレイヤのためのリストを構成するか否かがチェックされる。そうでない場合、古典的なリスト構成（ここでは、最大に達するのに必要なだけのゼロ候補が、リストに追加される）が、ステップ１２．２２において再開され、その結果、それを完成させ、ステップ１２．２３において終了する。そうでなければ、特定の処理が行われるが、この場合、ＳＭＶＰ候補が、後述する計算に従って参照レイヤから得られる。これが行われるとき、通常の処理が、ステップ１２．２２において再開される。

Ｃａｎｄ３の後でこの候補を使用することを示す選択をしてきた。言うまでもなく、Ｃａｎｄ３の前、Ｃａｎｄ１とＣａｎｄ２との間、またはＣａｎｄ２とＣａｎｄ３との間にそれを使用することが考えられることは明らかである。すべての場合に、さらなる比較が、新しい候補ＳＭＶＰを考慮に入れるためにプルーニング処理において実行されるだろう。

マージモードをテクスチャＲＬ手法に適用することを考えるとき、マージモードは、その参照レイヤから得られる、エンハンスメントレイヤの新しい動き情報予測子（ＳＭＶＰ）を追加する。前記動き情報予測子は、今や、圧縮される、参照レイヤの時間的候補の決定に使用される動き情報からもたらされる。図６は、テクスチャＲＬ手法の原理を概略的に示している。説明は、ここでは画像の輝度（ルマ）色成分に言及しているが、この処理は、色差（クロマ）色成分にも適用される。

図６には、エンハンスメントレイヤ画像６．１およびその参照レイヤ画像６．２が示されており、６．１と６．２との空間比率はＲ（通常は１、１．５、または２）である。Ｒの値がどうであれ、エンハンスメントレイヤ寸法に適合させるために参照レイヤに適用される再サンプリング処理として「アップスケーリング」の用語を使用する。Ｒが１に等しい場合、再サンプリングは、入力と同一の出力を生成する。逆再サンプリングは、「ダウンスケーリング」と呼ばれる。エンハンスメントレイヤ画像は、画像の粒度を示すグリッドに再分割される。より小さな正方形のそれぞれは、以下の本文ではサンプルと呼ばれる。

さて、太い線の正方形で示されている所定の予測子ユニット６．３に関して、処理は、以下の通りである。

Ａ．検討中の輝度予測ブロック６．３の中心位置６．４（ｘＰＣｔｒ，ｙＰＣｔｒ）を計算する。これは、以下のように導出される。

・ｘＰＣｔｒ＝ｘＰ＋ｎＰｂＷ／２
・ｙＰＣｔｒ＝ｙＰ＋ｎＰｂＨ／２
・ｘＰ、ｙＰは、現在のピクチャの左上の輝度サンプル６．７を基準として現在の輝度予測ブロックの左上サンプル６．６を特定する
・ｎＰｂＷおよびｎＰｂＨは、輝度予測ブロックの幅および高さを特定する
Ｂ．参照レイヤ画像６．２における同じ位置に配置された位置６．５を探すためにスケーリング係数Ｒ（１、１．５、および２．０）に応じてその座標をダウンスケーリングする。

・ｘＰＣｔｒＲＬ＝（ｘＰＣｔｒ＊ＰｉｃＷＲＬ＋ＳｃａｌｅｄＷ／２）／ＳｃａｌｅｄＷ
・ｙＰＣｔｒＲＬ＝（ｙＰＣｔｒ＊ＰｉｃＨＲＬ＋ＳｃａｌｅｄＨ／２）／ＳｃａｌｅｄＨ
・変数ＰｉｃＷＲＬおよびＰｉｃＨＲＬは、参照レイヤピクチャの幅および高さに等しく設定される
・ＳｃａｌｅｄＨの値は、Ｒ＊ＰｉｃＨＲＬの値をとり、ＳｃａｌｅｄＷの値は、Ｒ＊ＰｉｃＷＲＬの値に等しい。

Ｃ．１の番号が付けられている輝度予測ブロックｂｌＰｂ６．８を特定し、参照レイヤピクチャ内の（（ｘＰＣｔｒＲＬ＞＞４）＜＜４，（ｙＰＣｔｒＲＬ＞＞４）＜＜４）によって与えられる修正された位置を対象にすることによって参照レイヤ画像６．２からその位置の動き情報を検索する。これは、参照レイヤの動き要約ステップに対応する。

・そのとき、輝度位置（ｘＰＲＬ，ｙＰＲＬ）は、参照レイヤピクチャの左上輝度サンプルに対してｂｌＰｂによって指定される同じ位置に配置された輝度予測ブロックの左上サンプル６．８に等しく設定される
Ｄ．対応する情報が、イントラでない場合、動きベクトルＭＶ_ＲＬを抽出し、比率Ｒに応じてそれらをアップスケーリングする。この演算は、基本的に、空間的動きベクトルであって、その値がＳＭＶＰと等しい空間的動きベクトルを生成する。すなわち、ＳＭＶＰ＝ｒｎｄ（Ｒ＊ＭＶ_ＲＬ（ｒｎｄ（ｘＰＲＬ／Ｒ），ｒｎｄ（ｙＰＲＬ／Ｒ））（ただし、ｒｎｄは、丸め処理を表す）。この空間的動きベクトルに関係付けられた参照フレームインデックスと共に、これは、セットの最初に挿入される空間的動きベクトル予測子を構成する。

テクスチャＲＬのための現在のＳＨＶＣ設計は、参照レイヤに対する動きベクトルＭＶ_ＲＬの値が、上記のステップＣに関して見たように参照レイヤの動き圧縮バッファから得られる。このことは、４×４ブロック６．８に対応する動き情報が、動き情報圧縮処理によって全体の１６×１６ブロックのために保持される唯一のものであることから必要とされる。

次に参照フレームインデックス手法について考えると、その場合、エンハンスメントレイヤの参照リストに挿入される、新しいフレームの動き情報は、前記圧縮された動き情報フィールドからももたらされる。そのとき、その動き情報は、上で説明したように時間予測子を決定するために使用できる。

この動きがどのように導出されるかについて詳述しよう。所定の１６×１６ブロックに関して、そのブロックの中心が選択され、この位置は、対応する動き情報を探すために、上で説明したのと同様に使用される。輝度成分のための対応するステップについて詳述しよう。ほとんどの部分が、本質的に、図６に関連して説明した処理と同一であり、同一の変数に関する定義は同じままであることに留意されたい。それらは以下の通りである。

Ａ．輝度予測ブロックの中心位置（ｘＰＣｔｒ，ｙＰＣｔｒ）は、以下のように導出される（変数の名称は、前のセクションで定義されている）。
ｘＰＣｔｒ＝ｘＰ＋８
ｙＰＣｔｒ＝ｙＰ＋８

Ｂ．参照レイヤ画像における同じ位置に配置された位置を発見するためにスケーリング係数Ｒ（１、１．５、および２．０）に応じてその座標をダウンスケーリングする。
ｘＰＣｔｒＲＬ＝（ｘＰＣｔｒ＊ＰｉｃＷＲＬ＋ＳｃａｌｅｄＷ／２）／ＳｃａｌｅｄＷ
ｙＰＣｔｒＲＬ＝（ｙＰＣｔｒ＊ＰｉｃＨＲＬ＋ＳｃａｌｅｄＨ／２）／ＳｃａｌｅｄＨ

変数ＰｉｃＷＲＬおよびＰｉｃＨＲＬは、参照レイヤピクチャの幅および高さに等しく設定される。

ＳｃａｌｅｄＨの値は、Ｒ＊ＰｉｃＨＲＬの値をとり、ＳｃａｌｅｄＷの値は、Ｒ＊ＰｉｃＷＲＬの値に等しい。

Ｃ．同じ位置に配置された位置（ｘＲＬ，ｙＲＬ）は、以下のように導出される。
ｘＲＬ＝（ｘＲｅｆ＞＞４）＜＜４
ｙＲＬ＝（ｙＲｅｆ＞＞４）＜＜４

Ｄ．参照レイヤ動きベクトルは、以下のように導出される。この演算は、基本的に、以下のように参照レイヤの動きベクトルＲＬ＿ＭＶの値を生成する。

ＲＬ＿ＭＶ＝ｒｎｄ（Ｒ＊ＭＶ（ｒｎｄ（ｘＰＲＬ／Ｒ），ｒｎｄ（ｙＰＲＬ／Ｒ））
次に、この情報は、動き情報圧縮の出力であるかのように使用される。これは、エンハンスメントレイヤの動き情報を予測するために参照レイヤからの動き情報を使用することを可能にする。テクスチャＲＬ手法とは対照的に、動き情報は、より粗い粒度を有するが、インターブロックのために使用されるマージリスト決定処理またはＡＭＶＰリスト決定処理の両方において、時間的動き情報予測子として使用され得る。

スケーラブルコーデックの全体的なアーキテクチャ、２つの手法、およびそれらが予測のために動き情報をどのように使用するかを提示したので、以下のように要約することができる。

テクスチャＲＬ手法において、エンハンスメントレイヤの新しい動き情報予測子は、その参照レイヤから得られる。前記動き情報予測子は、通常は、圧縮されている、参照レイヤの時間的候補の決定に使用される動き情報からもたらされる。したがって、圧縮は、その導出に影響を及ぼし、その結果、マージモードに影響を及ぼす。ＡＭＶＰモードにおいて、スケーラブル候補が存在する場合、圧縮は、それにも影響を及ぼす。参照フレームインデックス手法のＡＭＶＰモードおよびマージモードは常に影響を受ける。なぜなら、それらもまた、時間的動きベクトル予測子を使用し、参照されたフレームが、挿入されたものである場合、この予測子が、参照レイヤフレームの動きからもたらされるからである。

参照フレームインデックス手法において、エンハンスメントレイヤの参照リストに挿入されている、新しいフレームの動き情報は、前記圧縮された動き情報からももたらされる。

図６に関連して説明したように、参照レイヤの為に記憶される動き情報は圧縮される。これは、完全な１６×１６ブロックに関して、初期には最大で１６の動き情報の部分が存在する場合、１６×１６ブロックに含まれる４×４ブロックのそれぞれについて、１つのみ（通常は、左上の４×４ブロックに関連するもの）が保持されることを意味する。

参照レイヤの動き情報が必要とされるときの、動き情報予測子の導出の処理において、この圧縮に起因して、使用される動き情報は、利用可能なもの、すなわち、左上の４×４ブロックに関係付けられた動き情報である。再び図６を参照すると、エンコードすべきコーディングユニットの中心６．４に対応する同じ位置に配置された点６．５に関連付けられた動き情報を探索するとき、１の番号が付けられた左上の４×４ブロック６．８に関連付けられた動き情報が使用される。下に位置する１６×１６ブロックに対する圧縮の後に保持される動き情報に対応する、３の番号が付けられている左上の４×４ブロックに関連付けられた動き情報は、同じ位置に配置された点６．５の位置のより近傍にあり、したがって、４×４ブロック６．８の動き情報よりも関連性がある可能性があることが注目されるであろう。

参照レイヤの動き情報に適用される圧縮処理に起因する、動き情報のこの最適でない選択は、コーディング効率の損失を招くものであると評価されるであろう。本発明の実施形態において、動き情報予測子導出処理は、この位置問題を克服するように構成される。

図７は、テクスチャＲＬ手法との関連で構成された処理の詳細を示している。それは、エンハンスメントレイヤのＡＭＶＰ導出処理およびマージ導出処理の両方に適用されるであろう。この修正されたマージ導出処理は、図１のエンコーダの動き推定モジュール１．２３および図１０のデコーダの動き推定モジュール１０．５５に配置されてもよい。本質的に、これのすべては、図９のＳＭＶＰ候補９．０を決定するときに行われる。

ステップ７．１は、参照レイヤにおいて動きを決定する位置を計算することによって、例えば、現在の予測子ユニット情報（寸法／位置）を設定し、前記予測子ユニットの中心を導出することによって処理を初期化する。主な適合は、位置を補正するステップ７．３にある。これは、最初に、以下の２つの可能性を通して行われる。

第１の実施形態では、参照レイヤの位置に対して得られる所定の座標Ｘ（例えば、上で説明したｘＰＣｔｒＲＬまたはｙＰＣｔｒＲＬのいずれか）に対してして、２つのパラメータｒおよびＭに応じて丸め演算を実行することによって新しい値を計算する。

例えば、新しい値Ｘ’は、以下のように計算されてもよい。

ただし、

は、ｘのトランケートを表し、その整数部分をとることを意味する。Ｍは、２の累乗であってもよく、好ましい実施形態においては、ＨＥＶＣの圧縮される動き粒度に適合させるためにＭ＝１６である。好ましい実施形態において、ｒ＝４および自然な選択としてせいぜいｒ＝８が、より良好なコーディング効率を実現するため使用される。

同じことが、多分異なる値のパラメータｒおよびＭを用いて他の座標に適用されてもよい。

第２の実施形態では、位置の補正は、ルックアップテーブルに基づいてもよい。その場合、所定の座標（Ｘ，Ｙ）、補正Ｆ［Ｘ，Ｙ］のテーブルが、座標の少なくとも一方に関して規定されてもよい。このテーブルは、座標毎に異なってもよい。テーブルはまた、座標の一方（すなわち、ＸまたはＹ）のみによってインデックス化されてもよい。テーブルはまた、座標自体の代わりに座標に関係する値をインデックスとして使用することによって低減されてもよい。例えば、補正は、Ｆ［Ｘ］の代わりにＦ［ＸｍｏｄｕｌｏＭ］（ただし、通常の値としてＭ＝２^Ｎである）によって達成されてもよい。好ましい実施形態では、Ｍ＝１６である。

すべての場合に、補正値（ｒの値または少なくとも一方の成分に関するテーブルのいずれか）は、高レベルのシンタックス情報（例えば、ビデオパラメータセット、シーケンスパラメータセット、ピクチャパラメータセット、またはスライスヘッダ）に送信およびそこから検索されてもよい。ｒの少なくとも１つの値を送信する場合、
−ビットフラグは、ｒの値が第１の値または第２の値（例えば、０および４）のどちらであるかを示することが出来（この場合、それは、補正に関するオン／オフのフラグとみなすことが出来る）、
−コードは、ｒの明示的な値、例えば、ｒマイナス４の値を表すトランケートユーナリコード（例えば、ｒ＝４の場合はバイナリシーケンス「０」、Ｒ＝５の場合は「１０」、他の値の場合は「１１０」、「１１１０」、および「１１１１」））を示してもよい。

上記において、１つの座標（具体的には、横座標）のみが影響されるかもしれないことに注意することは重要である。なぜなら、縦座標の修正は、異なる記憶領域から動き情報を検索することにつながるため、付加的なメモリアクセスを発生させ得るからである。

メモリアクセスを低減するというこの要求に従って、少なくとも１つの補正された値が、別の値に変更されてもよい。この他の値は、前記補正された値が、閾値を満たすなどの基準に適合しない場合、多分元の値である。前記閾値は、その座標に沿った画像寸法であってもよく、これにより、ルックアップが、画像の外側で行われ得なくなる。あるいは、前記閾値は、その座標に沿った記憶領域の境界であってもよい。記憶領域は、通常は、参照レイヤの最大コーディングユニットの所定のセットに対応する。この記憶領域は、図１３を用いてさらに詳細に示される。

次に、通常の予測子決定が、ステップ７．４において再開される。動き情報が、ステップ７．３の出力位置を用いて圧縮された動きのバッファから検索される。それがイントラの場合（すなわち、動きが存在しない場合）、候補は、ステップ７．８においてそのようなものとしてマークされ、特に、マージ候補リストに対する予測子の計算も追加も行われず、したがって、導出処理は、ステップ７．９において終了する。そうでなければ、対応する動きは、エンハンスメントレイヤ寸法に適合するようにアップスケーリングされる。

図８は、参照フレームインデックス手法との関連で構成された処理を示している。それは、エンハンスメントレイヤのＡＭＶＰ導出処理およびマージ導出処理の両方に適用されるであろう。この構成された処理は、図１のエンコーダのフレームバッファ１．２４または動き推定モジュール１．２３のいずれかおよび図１０のデコーダのフレームバッファ１０．６０または動き推定モジュール１０．５５に配置される。確かに、それは、圧縮された動き情報に関するフレームメモリの内容に影響を及ぼす。

したがって、ステップ８．１は、現在の１６×１６ブロックをエンハンスメントレイヤ画像の第１のブロックとして設定することによって動き情報予測子の導出処理を初期化する。ステップ８．２において、１６×１６コーディングユニットの中心の位置が決定され、参照レイヤの対応する同じ位置に配置された位置が、ステップ８．３において発見される。新しいステップ８．４では、発見された位置が補正される。この補正の詳細を理解するために上記のステップ７．１を参照することができ、同じことがここでも適用される。

ステップ８．５において、その位置の動きがイントラであるか否かが検証される。はいの場合、１６×１６ブロックの動きは、ステップ８．７においてイントラとして設定され、そうでなければ、動きベクトルが、取得されて、エンハンスメントレイヤ寸法に適合するようにアップスケーリングされ、アップスケーリングされた動きベクトル、参照インデックス、および可用性が、ステップ８．８において現在の１６×１６ブロックの動き情報予測子として設定される。

ステップ８．９は、現在のブロックが画像の最後のブロックであるか否かを検証することによって次の反復を準備する。そうである場合、新しいフレームのための動き情報が完全に決定され、処理は、ステップ８．１１．において終了する。そうでなければ、現在のブロックが、ステップ８．１０において次の１６×１６ブロックに設定され、反復は、ステップ８．２にループバックする。

図１３は、記憶領域として規定されるものの詳細を示している。参照レイヤ画像１３．４およびこれに関連付けられたエンハンスメントレイヤ画像１３．５があるとして、動き決定処理が適用される領域１３．６（例えば、ＣＴＢ）を規定することが可能である。メモリアクセス制限が適用されてもよく（例えば、エンハンスメントレイヤＣＴＢが、同じ位置に配置された参照レイヤのＣＴＢの直後に処理される、パイプラインエンコーダまたはパイプラインデコーディングの場合）、したがって、本発明の第１の態様において、参照レイヤフレーム１３．４の内側の同じ位置に配置された領域１３．１を規定することが可能である。ステップ７．１および８．４で言及した記憶領域は、第１の態様と１３．１を含む領域１３．２（ここでは、参照レイヤの２つのＣＴＢから作られている）とを対応付ける。１３．６の部分に対してして発見された補正された位置は、領域１３．２．内に留まるはずである。より緩い制限方法において、記憶領域が領域１３．２の右のＣＴＢのさらなる列を含み、領域１３．３がもたらされるようにすることが出来る。ここでの制約は１３．６に基づくが、エンハンスメントレイヤの領域の任意のサイズまたは参照レイヤの拡大された記憶領域が使用されてもよいことがわかるであろう。

図１１は、本発明の１つ以上の実施形態の実施のためのコンピュータ装置１１．０の概略ブロック図である。コンピュータ装置１１．０は、マイクロコンピュータ、ワークステーション、または軽い携帯機器などの装置であってもよい。コンピュータ装置１１．０は、通信バスを備え、この通信バスは、以下に接続されている。

中央処理装置１１．１（マイクロプロセッサなど）（ＣＰＵと表示されている）、
本発明の実施形態の方法の実行可能コードを記憶するための、および本発明の実施形態に従って画像の少なくとも一部をエンコーディングまたはデコーディングするための方法の実施に必要な変数およびパラメータを記録するように構成されたレジスタのためのランダム・アクセス・メモリ１１．２（ＲＡＭと表示されている）（そのメモリ容量は、例えば、拡張ポートに接続された随意のＲＡＭによって増大されてもよい）、
本発明の実施形態を実施するためのコンピュータプログラムを記憶するための読み取り専用メモリ１１．３（ＲＯＭと表示されている）、
通常、ネットワークインターフェース１１．４は、処理されるデジタルデータが伝送または受信される通信ネットワークに接続される。ネットワークインターフェース１１．４は、単一のネットワークインターフェースであってもよいし、あるいは、一組の異なるネットワークインターフェース（例えば、有線および無線のインターフェースまたは異なる種類の有線もしくは無線のインターフェース）から構成されることも可能である。データパケットは、ＣＰＵ１１．１において動作するソフトウェアアプリケーションの制御下で、伝送のためにネットワークインターフェースに書き込まれるか、または受信のためにネットワークインターフェースから読み出される、
ユーザインターフェース１１．５は、ユーザからの入力を受信するために、またはユーザに情報を表示するために使用されるであろう、
ハードディスク１１．６（ＨＤと表示されている）はマスストレージとして用意されるであろう、
Ｉ／Ｏモジュール１１．７はビデオソースまたはディスプレイなどの外部装置からの／へのデータの受信／送信のために使用されるであろう。

実行可能コードは、読み取り専用メモリ１１．３、ハードディスク１１．６、またはリムーバブルデジタルメディア（例えば、ディスク）のいずれかに記憶されてもよい。変形例によれば、プログラムの実行可能コードは、実行される前に、通信装置１１．０の記憶手段の１つ（ハードディスク１１．６など）に記憶するためにネットワークインターフェース１１．４を介して通信ネットワークから受信されることも出来る。

中央処理装置１１．１は、本発明の実施形態に係るプログラムまたは複数のプログラムのソフトウェアコードの命令または部分の実行を制御および指示するように構成される。なお、その命令は、前述の記憶手段の１つに記憶される。電源オン後に、ＣＰＵ１１．１は、ソフトウェアアプリケーションに関係するメインのＲＡＭメモリ１１．２からの命令を、この命令が例えばプログラムＲＯＭ１１．３またはハードディスク（ＨＤ）１１．６からロードされた後で実行することができる。このようなソフトウェアアプリケーションは、ＣＰＵ１１．１によって実行されると、図１〜図４に示されているフローチャートのステップを実行させる。

図７に示されているアルゴリズムのいずれのステップも、プログラマブル計算機（ＰＣ（「パーソナルコンピュータ」）、ＤＳＰ（「デジタル信号プロセッサ」）、またはマイクロコントローラなど）による一組の命令またはプログラムの実行によってソフトウェアで実施されてもよいし、あるいは、マシンまたは専用部品（ＦＰＧＡ（「フィールド・プログラマブル・ゲート・アレイ」）またはＡＳＩＣ（「特定用途向け集積回路」）など）によってハードウェアで実施されてもよい。

以上、本発明について、特定の実施形態を参照しながら説明してきたが、本発明は、特定の実施形態に限定されず、本発明の範囲内にある修正例は当業者にとって明らかである。

多くのさらなる修正例および変形例は、前述の例示的な実施形態を参照するときに、それらが単なる例として与えられており、本発明の範囲を限定することを意図されておらず、添付の特許請求の範囲によってのみ決定されることを当業者に示唆する。具体的には、異なる実施形態からの異なる特徴は、適切であれば入れ替えられてもよい。

特許請求の範囲において、「を備える（ｃｏｍｐｒｉｓｉｎｇ）」と言う言葉は、他の要素またはステップを排除せず、不定冠詞「ある（ａ）」または「ある（ａｎ）」は、複数を排除しない。異なる特徴が互いに異なる従属請求項に記載されているという単なる事実は、これらの特徴の組み合わせが好適に使用され得ないことを示すものではない。

Claims

第１のレイヤに対応する画像における符号化対象のブロックの動きベクトルを符号化するための動き情報予測子の候補を、前記第１のレイヤとは異なる参照レイヤに対応する参照画像のブロックに対応する動きベクトルから選択する場合に、前記符号化対象のブロックにおける中心に対応する第１の位置に対応する前記参照画像における位置である第２の位置を導出する導出手段と、
前記導出手段によって導出された前記第２の位置を前記参照画像における所定の位置に丸めた第３の位置を導出する丸め位置導出手段と、
前記第３の位置に基づくブロックに対応する動きベクトルを、前記動き情報予測子の候補として選択する選択手段と
を有し、
前記第２の位置のＸ座標をＸとし、前記第３の位置のＸ座標をＸ´とした場合、前記第３の位置のＸ座標は下記の式で表される

ことを特徴とする符号化装置。
前記丸め位置導出手段によって導出された前記第３の位置を他の位置へと変更する変更手段
を有することを特徴とする請求項１記載の符号化装置。
前記変更手段は、前記第３の位置に基づくブロックに対応する動きベクトルが利用可能ではない場合に、前記丸め位置導出手段によって導出された前記第３の位置を他の位置へと変更する
ことを特徴とする請求項２記載の符号化装置。
前記ｒは４である
ことを特徴とする請求項１〜３のいずれか１項に記載の符号化装置。
前記ｒは８である
ことを特徴とする請求項１〜３のいずれか１項に記載の符号化装置。
前記Ｍは１６である
ことを特徴とする請求項１〜５のいずれか１項に記載の符号化装置。
前記選択手段は、複数の動き情報予測子の候補を選択し、
前記複数の動き情報予測子の候補の内のいずれかを用いて前記符号化対象のブロックの動きベクトルを符号化するベクトル符号化手段
を有することを特徴とする請求項１〜６のいずれか１項に記載の符号化装置。
前記複数の動き情報予測子の候補は、前記第３の位置に基づくブロックに対応する動きベクトルを含むことが可能である
ことを特徴とする請求項７記載の符号化装置。
第１のレイヤに対応する画像における復号対象のブロックの動きベクトルを導出するための動き情報予測子の候補を、前記第１のレイヤとは異なる参照レイヤに対応する参照画像のブロックに対応する動きベクトルから選択する場合に、前記復号対象のブロックにおける中心に対応する第１の位置に対応する前記参照画像における位置である第２の位置を導出する導出手段と、
前記導出手段によって導出された前記第２の位置を前記参照画像における所定の位置に丸めた第３の位置を導出する丸め位置導出手段と、
前記第３の位置に基づくブロックに対応する動きベクトルを、前記動き情報予測子の候補として選択する選択手段と
を有し、
前記第２の位置のＸ座標をＸとし、前記第３の位置のＸ座標をＸ´とした場合、前記第３の位置のＸ座標は下記の式で表される

ことを特徴とする復号装置。
前記丸め位置導出手段によって導出された前記第３の位置を他の位置へと変更する変更手段
を有することを特徴とする請求項９記載の復号装置。
前記変更手段は、前記第３の位置に基づくブロックに対応する動きベクトルが利用可能ではない場合に、前記丸め位置導出手段によって導出された前記第３の位置を他の位置へと変更する
ことを特徴とする請求項１０記載の復号装置。
前記ｒは４である
ことを特徴とする請求項９〜１１のいずれか１項に記載の復号装置。
前記第ｒは８である
ことを特徴とする請求項９〜１１のいずれか１項に記載の復号装置。
前記Ｍは１６である
ことを特徴とする請求項９〜１３のいずれか１項に記載の復号装置。
前記選択手段は、複数の動き情報予測子の候補を選択し、
前記複数の動き情報予測子の候補の内のいずれかを用いて前記復号対象のブロックの動きベクトルを導出するベクトル導出手段
を有することを特徴とする請求項９〜１４のいずれか１項に記載の復号装置。
前記複数の動き情報予測子の候補は、前記第３の位置に基づくブロックに対応する動きベクトルを含むことが可能である
ことを特徴とする請求項１５記載の復号装置。
第１のレイヤに対応する画像における符号化対象のブロックの動きベクトルを符号化するための動き情報予測子の候補を、前記第１のレイヤとは異なる参照レイヤに対応する参照画像のブロックに対応する動きベクトルから選択する場合に、前記符号化対象のブロックにおける中心に対応する第１の位置に対応する前記参照画像における位置である第２の位置を導出する導出工程と、
前記導出工程によって導出された前記第２の位置を前記参照画像における所定の位置に丸めた第３の位置を導出する丸め位置導出工程と、
前記第３の位置に基づくブロックに対応する動きベクトルを、前記動き情報予測子の候補として選択する選択工程と
を有し、
前記第２の位置のＸ座標をＸとし、前記第３の位置のＸ座標をＸ´とした場合、前記第３の位置のＸ座標は下記の式で表される

ことを特徴とする符号化方法。
第１のレイヤに対応する画像における復号対象のブロックの動きベクトルを導出するための動き情報予測子の候補を、前記第１のレイヤとは異なる参照レイヤに対応する参照画像のブロックに対応する動きベクトルから選択する場合に、前記復号対象のブロックにおける中心に対応する第１の位置に対応する前記参照画像における位置である第２の位置を導出する導出工程と、
前記導出工程によって導出された前記第２の位置を前記参照画像における所定の位置に丸めた第３の位置を導出する丸め位置導出工程と、
前記第３の位置に基づくブロックに対応する動きベクトルを、前記動き情報予測子の候補として選択する選択工程と
を有し、
前記第２の位置のＸ座標をＸとし、前記第３の位置のＸ座標をＸ´とした場合、前記第３の位置のＸ座標は下記の式で表される

ことを特徴とする復号方法。
請求項１〜８のいずれか１項に記載の符号化装置の各手段としてコンピュータを機能させることを特徴とするプログラム。
請求項９〜１６のいずれか１項に記載の復号装置の各手段としてコンピュータを機能させることを特徴とするプログラム。