JP5238021B2

JP5238021B2 - スケーラブル・ストリームの形でビデオ・コンテンツを符号化する装置および方法

Info

Publication number: JP5238021B2
Application number: JP2010510750A
Authority: JP
Inventors: フランソワ，エドワール; ボトロー，ヴァンサン; シェヴァンス，クリストフ; ヴィロン，ジェローム
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2007-06-05
Filing date: 2008-05-30
Publication date: 2013-07-17
Anticipated expiration: 2028-05-30
Also published as: TWI423171B; EP2163098B1; KR101485014B1; KR20100017507A; EP2163098A1; FR2917262A1; ATE522087T1; CN101682766B; CN101682766A; JP2010529763A; WO2008148708A1; TW200849142A; BRPI0811999A2

Description

１．発明の分野
本発明は、時間的にスケーラブルなストリームの形でビデオ・コンテンツを符号化するという一般的な領域に関する。

本発明はより詳細には、第二フィールドとインターレースされた第一フィールドによって形成されるインターレースされた画像からなる第一のグループと順次走査画像からなる第二のグループとによって表されるビデオ・コンテンツを時間的にスケーラブルなストリームの形で符号化するための装置および方法に関する。

２．従来技術
ビデオ・コンテンツを符号化されたデータのスケーラブルなストリームの形で符号化するのに好適な多層〔マルチレイヤー〕符号化法が知られている。スケーラビリティとは、解像度および／または品質および／または時間的周波数のいくつかのレベルでデコードできるようにするよう情報をスケーリングする能力を表す。この型の符号化方法によって生成される符号化されたデータ・ストリームは、一般にいくつかの層、具体的には基本層（base layer）および一つまたは複数の向上層（enhancement layer）に分けられる。そのような符号化手順は、ビデオ・コンテンツが単一のストリームの形で符号化され、その単一のストリームがたとえば受信装置のさまざまな能力（CPU、表示装置の特性などの面で）に対して適応することを可能にする。第一の受信装置は、ストリームの基本層に関する部分をデコードできるのみであり、一方、第二のより強力な装置はストリーム全体をデコードできる。そのような符号化方法は、ビデオ・コンテンツを、基本層がコンテンツの第一のバージョン、たとえばHD1080i 30Hzバージョンに関し、向上層が同じビデオ・コンテンツの第二のバージョン、たとえばHD1080p 60Hzバージョンに関する単一のストリームの形で符号化するために特に有益である。そのような符号化されたデータ・ストリームは有利なことに、HD1080i 30Hzフォーマットのコンテンツを再構成できる現在のデコード・プラットフォームによってデコードされることができる。この同じコンテンツは将来には、HD1080p 60Hzフォーマットでコンテンツを再構成できる将来のデコード・プラットフォームによってデコードされることもできるであろう。現在のプラットフォームはストリームの基本層に関する部分をデコードするのみで、将来のプラットフォームはストリーム全体をデコードすることになる。

そのような符号化方法は、層間予測（inter-layer prediction）の名で知られるツールによって基本層の画像部分から、向上層の画像または画像部分（たとえばブロックまたはマクロブロック）を符号化するのに好適である。そのようなツールは、2007年1月に公開され、「SVC改訂合同草案９（Joint Draft 9 of SVC amendment）」と題されたISO/IEC MPEGおよびITU-T VCEGの文書JVT-V201において定義されている。この文書は、スケーラビリティに関係するMPEG-4 AVCのSVC拡張を記載している。より精密には、向上層の画像の画像データ・ブロックが空間的（イントラ符号化モード）または時間的（インター符号化モード）に予測される。この後者の場合、向上層の画像ブロックから標準的な予測モード（たとえば双方向予測（bidirectional prediction）モード、直接予測（direct prediction）モード、予期予測（anticipated prediction）モードなど）に従って予測され、あるいはさもなければ基本層の画像ブロックから層間予測モードに従って予測される。この後者の場合、向上層の画像ブロックに関連付けられた動きデータ（たとえば、マクロブロックのブロックへの分割、可能性としては動きベクトルおよび参照画像インデックス）および可能性としては画像データが、基本層の画像ブロックに関連付けられた画像データの動きデータからそれぞれ推定または継承される。

さらに、順次走査画像について図１に示されているような階層的GOP構造に従ってGOP（Group Of Pictures［ピクチャー・グループ］）ごとにビデオ・コンテンツを符号化するために好適な符号化方法が知られている。この図において、GOPは、二価の（dyadic）画像間（inter-picture）時間依存性構造に従って符号化される（非特許文献１）。画像間の時間的依存性は点線によって示されている。画像２は画像０および４に時間的に依存する。すなわち、画像２または画像２の部分は、画像０および４を参照して時間的予測によって符号化できる。そのような構造によれば、画像はいくつかの時間的レベル（temporal level）で符号化される。所与の時間的レベルの画像は、前に符号化済みの、より下位のまたは同じ時間的レベルの画像を参照して符号化されることができるのみである。この構造は、所与の時間的レベルの画像が周波数Fであるとして、次の時間的レベルの画像が加えられたら、前のものの二倍の周波数、すなわち2Fのシーケンスが得られるという意味で二価（dyadic）として知られている。そのような構造は有利なことに、高い圧縮率を提供することによって時間的にスケーラブルなデータ・ストリームが生成されることを可能にする。実際、高い時間的レベルを無視することによって、すなわちそれらのレベルに関する符号化されたデータ・ストリーム部分をデコードしないことによって、ビデオの時間的周波数はこのように、符号化データ・ストリーム全体をデコードすることによって再構成されたはずのビデオの時間的周波数と比べて低下させられる。これを達成するために、時間的レベル情報がストリーム中に挿入される。この情報は特に、デコード方法によって、所与の時間的レベルに関する符号化データ・パケットを識別し、その結果として所与の周波数でビデオ・コンテンツを再構成するために無視すべき符号化データ・パケットを識別するために使われる。SVC規格によれば、この時間的レベル情報は各NAL（Network Adaptation Layer［ネットワーク適応層］）型パケットのヘッダ中において符号化される。

インターレースされたビデオの場合、各画像は、第二フィールドとインターレースされた第一フィールドによって形成される。インターレースされたビデオが画像モード（picture mode）で符号化されるとき、画像の二つのフィールドは同時に符号化される。インターレースされたビデオがフィールド・モード（field mode）で符号化されるとき、画像の両フィールドは相続いて符号化される、つまり、第二フィールドは第一フィールドの直後に符号化される。この型の符号化は有利なことに、デコーダのメモリ・スペース要件を低減することを可能にする。実際、同じ画像の二つのフィールドが相続いて符号化されない場合、画像全体を復元できるよう、この第二のフィールド自身が再構成されるまで、デコーダ側で第一の再構成されたフィールドをメモリ中に記憶しておくことが必要になる。

第一フィールドが上（up）フィールドまたは表（TOP）フィールドとして知られるフィールドであれば、第二フィールドは下（lower）フィールドまたは裏（BOTTOM）フィールドとして知られるフィールドであり、逆に、第一フィールドが下フィールドまたは裏フィールドとして知られるフィールドであれば、第二フィールドは上フィールドまたは表フィールドとして知られるフィールドである。順次走査ビデオの場合に図１によって示される階層的GOP構造は、フィールド・モードで符号化されたインターレースされたビデオの場合には、図２に示されるように、画像をそれを構成する二つのフィールドで置き換えることによって適用される。この図において、表フィールドは実線で示されており、裏フィールドは点線で示されている。図２では、インデックスkのインターレースされた画像は、参照符号kTを付された表フィールドおよび参照符号kBを付された裏フィールドからなる。そのような図において、画像２の二つのフィールド2Tおよび2Bは相続いて符号化される。つまり、画像２の第二フィールドは画像２の第一フィールドの直後に符号化される。これは、画像２の符号化のために、よって該画像の将来のデコードのために、いかなる時間も導入しないことを可能にする。そのような図において、フィールド2Tの全部または一部は、前に符号化されたフィールド0T、0B、4T、4Bを参照して符号化できる。このフィールドはまた、完全にまたは部分的に、イントラ・モードで、すなわちシーケンス中の他のいかなる画像からも独立に符号化されることもできることを注意しておく。フィールド2Bについては、完全にまたは部分的に、前に符号化されたフィールド0T、0B、4T、4Bを参照して、またフィールド2Tを参照しても、符号化できる。この構造は、インターレースされた場合においても順次走査の場合と同じ利点をもつ（つまり、高い圧縮率および時間的スケーラビリティ）。

さらに、基本層と向上層が図１および図２によって示されるような階層的GOP構造に従って符号化される多層符号化法が知られている。インターレースされた基本層および順次走査の向上層の二層の階層的GOP構造が図３に示されている。この図において、向上層の順次走査画像はそのインデックスkによって参照される。向上層の各画像および基本層の各フィールドにはタイムスタンプが関連付けられている。図３において、同じタイムスタンプをもつ向上層の画像および基本層のフィールドは縦に一致している。向上層の画像は、基本層における対応するすなわち同じタイムスタンプをもつフィールドを参照して層間予測ツールを使って、あるいは向上層の一つまたは複数の以前に符号化された画像を参照して、あるいはさらにはシーケンスの他の画像からは独立して（イントラ符号化）、符号化できる。たとえば、向上層の画像２は、完全にまたは部分的に、層間予測法によって基本層のフィールド1Tのデータから符号化できる。しかしながら、そのような構造がSVC規格のコンテキスト内で使用されるとき、向上層のいくつかの画像は層間予測を使うことができない。これは時間的レベル３画像の場合である。実際、SVC規格は、同じ時間的レベルの画像間の層間予測を許容するのみである。しかしながら、画像１は時間的レベル３にあり、一方、同じタイムスタンプのフィールド、つまりフィールド0Bは時間的レベル０にある。さらに、SVC規格は、プロファイルの定義を通じて、参照画像を記憶するために好適なメモリのサイズを制限する。メモリ・サイズのこの制限のおかげで、向上層の画像１の符号化の際、画像0Bはもはや前記参照画像メモリ内に存在しない。実際、画像およびフレームは次の順序で符号化される：0T,0B,0,4B,4T,8,2T,2B,4,1T,1B,2,3T,3B,6,1,3,5,7,9。よって、参照画像メモリが４枚の参照画像を記憶する機能があるとすると、画像0T,0Bおよび0は画像１の符号化の際にはもはや参照として使うために利用可能ではない。画像１および対応するフィールド0Bの間の層間予測レベルを作ることができるためには、15枚の参照画像がメモリに記憶されねばならない。向上層のいくつかの画像を層間予測によって符号化することができないという事実は、符号化パフォーマンスに対してマイナスの効果をもつ。

M. Flierl and B. Girod, "Generalized B Pictures and the Draft JVT/H.264 Video Compression standard", IEEE trans. on Circuits and Systems for Video Technology, vol. 13, pp. 587-597, July 2003

３．発明の要約
本発明の目的は、従来技術の少なくとも一つの欠点を補償することである。

本発明は、時間的にスケーラブルなストリームの形でビデオ・コンテンツを符号化する方法に関する。このコンテンツは、第二フィールドとインターレースされた第一フィールドによって形成されるインターレースされた画像の第一のグループと順次走査画像の第二のグループとによって表される。第二のグループの各画像は第一のグループのあるフィールドと一致する。本方法は以下のステップを含む：
・第一のグループのフィールドを、第一の所定の符号化順に従って、Mを厳密に1より大きい整数としてM個の時間的レベル上で符号化し、その際、インターレースされた画像の第二フィールドがこのインターレースされた画像の第一フィールドの直後に符号化される。
・画像の第二のグループの画像を、M個の時間的レベル上で、第二の所定の符号化順で符号化する。

本発明の本質的な特性によれば、第二の符号化順は第一の符号化順に等しい。

有利なことに、本発明は、向上層の各画像が、基本層のフィールドを参照して層間予測によって完全にまたは部分的に符号化されることを可能にする。

別の側面によれば、前記第一のグループの画像のうちの画像の第二フィールドが、前記画像の第一フィールドが符号化される時間的レベルよりも厳密に高い時間的レベルにおいて符号化され、前記第二フィールドと一致する前記第二のグループの画像は前記第一フィールドと一致する前記第二のグループの画像が符号化される時間的レベルよりも厳密に高い時間的レベルで符号化される。

本発明のある個別的な特性によれば、所与の時間的レベルで符号化されたフィールドは、完全にまたは部分的に、前記時間的レベルより低いまたはそれに等しいレベルで以前に符号化されたフィールドを参照して符号化される。

本発明はまた、時間的にスケーラブルなストリームの形でビデオ・コンテンツを符号化する装置に関する。このコンテンツは、第二フィールドとインターレースされた第一フィールドによって形成されるインターレースされた画像の第一のグループと順次走査画像の第二のグループとによって表される。第二のグループの各画像は第一のグループのあるフィールドと一致する。本装置は：
・第一のグループのフィールドを、第一の所定の符号化順に従って、Mを厳密に1より大きい整数としてM個の時間的レベル上で符号化し、その際、インターレースされた画像の第二フィールドがこのインターレースされた画像の第一フィールドの直後に符号化される、第一符号化手段と、
・画像の第二のグループの画像を、M個の時間的レベル上で、第二の所定の符号化順で符号化する第二符号化手段とを有する。

４．図面一覧
本発明は、付属の図面を参照しつつ、決して限定するものではない実施形態および実装によってよりよく理解され、例示される。

従来技術に基づく順次走査画像からなるグループの階層構造を示す図である。従来技術に基づくインターレース画像からなるグループの階層構造を示す図である。従来技術に基づく画像のグループの多層構造を示す図である。本発明の第一の実施形態に基づく、画像のグループの多層構造を示す図である。本発明の第二の実施形態に基づく、画像のグループの多層構造を示す図である。本発明に基づく符号化方法を示す図である。本発明に基づく符号化装置を示す図である。本発明の変形例に基づく符号化装置を示す図である。

５．発明の詳細な説明
本発明は、時間的にスケーラブルなストリームの形でビデオ・コンテンツを符号化する方法および装置に関する。ビデオ・コンテンツは、インターレースされた、すなわち第二フィールドとインターレースされた第一フィールドによって形成される画像の第一のグループと、順次走査画像の第二のグループとによって表される。第二のグループの各画像は第一のグループのあるフィールドと時間的に一致する、すなわち同じタイムスタンプをもつ。基本層の画像と呼ばれる第一のグループの画像は基本層の形で符号化され、向上層の画像と呼ばれる第二のグループの画像は向上層の形で符号化される。

図４および図６を参照すると、本発明の第一の実施形態は、M/2枚のインターレース画像すなわちM枚のフィールドの第一のグループおよびM枚の順次走査画像の第二のグループについて記述される。ここで、Mは正の整数である。図４および図６では、M＝10である。10枚の画像またはフィールドは、階層的GOPの二価構造に従って、レベル０、レベル１、レベル２と参照符号を付された３つの時間的レベル上で符号化される。本発明は、基本層のインターレース画像のフィールド・モードでの符号化ステップ１０を有する。基本層の画像はたとえば、ISO/IEC文書14496-10:2005において定義されている規格MPEG-4 AVCに従って符号化される。時間的依存性は、図２を参照して定義されるGOP構造によって決定される。基本層のフレームは所定の符号化順に従って符号化される。この例では、レベル０のフィールドは、より高いレベルのフィールドより前に次の順序で符号化される：0T,0B,4T,4B。次いでレベル１のフィールドは、可能性としてはレベル０のフィールドを参照して、次の順序で符号化される：2T,2B。フィールド2Bは、完全にまたは部分的にフィールド2Tを参照して符号化されることもできる。次いでレベル２のフィールドは次の順序で符号化される：1T,1B,3T,3B。フィールド1Tは完全にまたは部分的に、以前に符号化され、その符号化の時点でまだメモリに記憶されているより低い層のフレームを参照して符号化される。同様に、フィールド1B、フィールド3Tおよびフィールド3Bは、より低いレベルのフィールドを参照して、あるいは以前に符号化された同じ時間的レベルのフィールドを参照して、符号化される。本発明のステップ１０は、図２を参照して本稿で記載した従来技術の方法に基づく基本層の符号化ステップと同一である。

本発明の本質的な特性によれば、ステップ２０において、向上層の画像が、図１および図３を参照して従来技術において定義される標準的な階層的GOP構造に従って符号化される。この目的のため、図３に示されるGOPの構造は、向上層の画像が基本層のフィールドと同じ符号化順で符号化されるような仕方で修正される。基本層の同じ画像の二つのフィールドと時間的に一致する向上層の二つの画像は相続いて符号化され、第二の画像は第一の画像の直後に符号化される。標準的な構造ではそうではなかった。たとえば、標準的な階層的GOP構造では、画像１は画像０の直後に符号化されるのではない。実際、画像８、４、２および６が両者の間に符号化される。

新しい階層的GOP構造は、向上層の画像が、基本層のフィールドと同じ符号化順で対ごとに符号化されること、すなわち、基本層のある画像の第二フィールドと同じタイムスタンプをもつ向上層の画像が基本層の前記画像の第一フィールと同じタイムスタンプをもつ向上層の画像の直後に符号化されることを可能にする。この実施形態では、画像およびフレームは次の順序で符号化される：0T,0B,0,1,4T,4B,8,9,2T,2B,4,5,1T,1B,2,3,3T,3B,6,7。したがって、基本層の画像は次の順序で符号化される：0,1,8,9,4,5,2,3,6,7。これは基本層のフィールド、すなわち0T,0B,4T,4B,2T,2B,1T,1B,3T,3Bと同じ符号化順である。結果として、参照画像メモリが４枚の参照画像を記憶する容量をもつとすると、画像１の符号化の際、画像0T,0Bおよび0が参照として使うために利用可能である。図３を参照して定義した二価GOP構造ではそうではなかった。図３の場合、画像１が層間予測の恩恵を受けるためには１５枚の参照画像を記憶することが必要である。よって、インデックス2kの向上層の画像は、k表（kTOP）フィールドからの層間予測の恩恵を受け、一方、画像2k+1はk裏（kBOTTOM）フィールドからの層間予測の恩恵を受ける。画像2kおよび2k+1が相続いて、すなわち基本層のフィールドと同じ符号化順で符号化されるので、k裏フィールドの利用不能の問題はもはや生起しない。したがって、奇数インデックスをもつすべての画像はそれらの対応する裏フィールドからの層間予測の恩恵を受けることができる（図４の灰色の長方形によって示されるように）。このことは、ビデオ・コンテンツの符号化効率の向上を可能にする。そのようなGOP構造は、向上層の画像すべてについて、層間予測に優先性を与える。

しかしながら、それは、より高い時間的レベル、つまりレベル２の画像を落とすことによって時間的スケーラビリティが得られることを可能にするが、この時間的スケーラビリティは、図３を参照して定義されたGOP構造を用いて得られるスケーラビリティほど細かくない。二つの相続く画像、たとえば画像２と３、６と７が必然的に除去されるからである。

図５を参照して記述される本発明のもう一つの側面によれば、画像およびフィールドに関連付けられた時間的レベルは図４の画像およびフィールドに関連付けられたレベルに対して修正される。SVC規格のフレームワーク内で、時間的レベルは上記したように各NALユニットのヘッダ内に符号化されることを注意しておく。本発明によれば、基本層の各画像について、該画像の第二フィールド、すなわち裏フィールドには、前記画像の第一フィールド、すなわち表フィールドに関連付けられた時間的レベルより厳密に高い時間的レベルが関連付けられる。たとえば、時間的レベル０がフィールド0Tに、時間的レベル３がフィールド0Bに関連付けられ、時間的レベル１がフィールド2Tに、時間的レベル４がフィールド2Bに関連付けられる。同様に、向上層の各画像対について、基本層の画像の第二フィールド、すなわち図５における裏フィールドに一致する前記対の画像には、基本層の前記画像の第一フィールド、すなわち図５における表フィールドに一致する前記対の画像に関連付けられた時間的レベルより厳密に高い時間的レベルが前記対に関連付けられる。より一般には、基本層のすべての裏フィールドおよび向上層の奇数インデックスをもつすべての画像に対して、それぞれ、基本層の表フィールドの時間的レベルより高い時間的レベルおよび向上層の偶数インデックスをもつ画像の時間的レベルより高い時間的レベルが割り当てられる。一般に、時間的レベルは次のようにして画像およびフレームに関連付けられる。

i＝0からN−1について。ここで、Nは2^N＋2＝Mとなるよう定義される正の整数、すなわちN＝log(M−2)/log2
基本層について
k*2^N-iが0から2^N−1までの間にあるような任意のkについて：
・レベルiがインデックスk*2^N-iの表フィールドに関連付けられる
・レベルi＋Nがインデックスk*2^N-iの裏フィールドに関連付けられる
向上層について
k*2^N+1-iが0から2^N+1−1までの間にあるような任意のkについて：
・レベルiがインデックスk*2^N+1-iの画像に関連付けられる
・レベルI＋Nがインデックス1＋k*2^N+１-iの画像に関連付けられる。

さらに、SVC符号化規格によって課される制約に準拠するため、所与の時間的レベルのフィールドまたは画像は、厳密により高いレベルの画像または以前に符号化されていない画像を参照して符号化されることはできない。たとえば、本発明によれば、時間的レベル３が関連付けられている画像１は、時間的レベル２が関連付けられている画像２についての時間的参照基準として使うことはできない。有利なことに、このように、最も高い諸時間的レベル、つまり時間的レベル３、４、５に対応するNALユニットをデコードしないことによって、図３で定義された二価GOP構造を用いて得られたのと同じ時間的スケーラビリティを得ることが可能である。よって、時間的レベルを画像およびフィールドと関連付けることによって、細かい粒度で時間的スケーラビリティを保ちつつ、向上層のすべての画像が基本層の対応するフィールドから層間予測を使うことによって符号化されることができる。

図７を参照するに、本発明は、符号化装置６に関する。この図では本発明の本質的な要素のみが示されている。ビデオ符号化器の分野の当業者によく知られている要素、たとえば動き推定モジュール、動き補償モジュールなどは示されていない。示されているモジュールは、物理的に区別できるユニットに対応してもよいししなくてもよい機能ユニットである。たとえば、これらのモジュールまたはその一部は単一のコンポーネント中に一緒にまとめられることができ、あるいは同じソフトウェアの諸機能をなすことができる。逆に、いくつかのモジュールは別個の物理的実体から構成されてもよい。本装置は、第一の入力６０、第二の入力６２、第一の符号化モジュール６４、第一のメモリ６６、第二のメモリ６７、第二の符号化モジュール６８、多重化モジュール７０および出力７２を有する。

第一の入力６０は、基本層の画像と呼ばれる、ビデオ・コンテンツを表すインターレース画像からなる第一のグループI1を受領するのに好適である。第二の入力６２は、向上層の画像と呼ばれる、同じビデオ・コンテンツを表す順次走査画像の第二のグループI1を受領するのに好適である。第一の符号化モジュール６４は、第一の入力６０から基本層のインターレース画像を受領し、フィールド・モードで該画像を第一のストリームS1の形で符号化するのに好適である。基本層の画像はたとえば、ビデオ符号化規格MPEG-4 AVCで符号化され、フィールド間の時間的依存性は図２を参照して定義された階層的GOP構造によって決定される。したがって、この目的のため、フィールドは所定の符号化順序に従って符号化される。フィールドは、可能性としては、完全にまたは部分的に、別の以前に符号化されたフィールドを参照して符号化され、再構成されて第一のメモリ６６に記憶される。ひとたび符号化され、再構成されたとき、フィールドは可能性としては第一のメモリ６６および第二のメモリ６７に記憶される。第一の符号化モジュールは、本発明に基づく方法のステップ１０を実装する。

本発明の本質的な特徴によれば、第二の符号化モジュール６８は、第二の入力６２から向上層の順次走査画像を受領し、基本層のフィールドと同じ符号化順序に従って該画像を第二のストリームS2の形で符号化するのに好適である。基本層の同じ画像の二つのフィールドに時間的に一致する向上層の二つの画像は相続いて符号化され、第二の画像は第一の画像の直後に符号化される。標準的な構造ではそうではなかった。たとえば、標準的な階層的GOP構造では、画像１は画像０の直後に符号化されるのではない。実際、画像８、４、２および６が両者の間に符号化される。ひとたび符号化され、再構成されたとき、画像は第二のメモリ６６に記憶される。第二の符号化モジュールは、本発明に基づく方法のステップ２０を実装する。

多重化モジュール７０は第一の符号化モジュール６４、第二の符号化モジュール６８それぞれのストリームS1およびS2を受領し、S1およびS2を単一のストリームSに多重化する。この単一のストリームSが出力７２に送られる。

図８に示される変形例によれば、符号化装置７は、画像の第二のグループを受領するのに好適な単一の入力８を有する。符号化装置７はさらに、画像の第一のグループから画像の第二のグループI2を生成するのに好適な処理モジュール８２を有する。

本発明の別の側面によれば、符号化装置６は、本稿に記載される方法に従って時間的レベルを基本層のフィールドと、かつ向上層の画像と関連付けるのに好適である。

もちろん、本発明は上で述べた実施例に限定されるものではない。特に、当業者は述べられている実施形態に対していかなる変形をも適用し、それらの実施形態を組み合わせてそれらのさまざまな利点から裨益してもよい。特に、SVCビデオ符号化規格の枠組みの範囲内で記載されている本発明は、決してこの規格に制約されるものではない。インターレース画像の基本層および順次走査画像の向上層の二つの層を用いて記載されている本発明は、いくつかの向上層に拡張されることができる。さらに、基本層の画像を、表画像が裏画像より前に符号化されるフィールド・モード（「表フィールド先行」モード）に符号化する枠組みの範囲内で記載されている本発明は、基本層の画像を裏画像が表画像より前に符号化されるフィールド・モード（「裏フィールド先行」モード）に符号化する場合にも同じように適用されることができる。

Claims

基本層および向上層を有する時間的にスケーラブルなストリームの形でビデオ・コンテンツを符号化する方法であって、前記コンテンツは、第二フィールドとインターレースされた第一フィールドによって形成されるインターレース画像の第一のグループと順次走査画像の第二のグループとによって表され、第二のグループの各画像は第一のグループのあるフィールドと時間的に一致し、当該方法は以下のステップ、すなわち：
・第一のグループのフィールドを、インターレース画像の第二フィールドが該インターレース画像の第一フィールドの直後に符号化されるよう第一の所定の符号化順に従って、Mを厳密に1より大きい整数としてM個の時間的レベル上で基本層として符号化するステップと、
・画像の第二のグループの画像を、M個の時間的レベル上で、第二の所定の符号化順で符号化するステップとを有し、
前記第二の符号化順が前記第一の符号化順に等しいことを特徴とする、
方法。
前記第一のグループの画像のうちの画像の第二フィールドが、前記画像の第一フィールドが符号化される時間的レベルよりも厳密に高い時間的レベルにおいて符号化され、前記第二フィールドと時間的に一致する前記第二のグループの画像は、前記第一フィールドと時間的に一致する前記第二のグループの画像が符号化される時間的レベルよりも厳密に高い時間的レベルで符号化される、請求項１記載の方法。
所与の時間的レベルで符号化されたフィールドは、完全にまたは部分的に、前記所与の時間的レベルより低いまたはそれに等しいレベルで以前に符号化されたフィールドを参照して符号化される、請求項１または２記載の方法。
基本層および向上層を有する時間的にスケーラブルなストリームの形でビデオ・コンテンツを符号化する装置であって、前記コンテンツは、第二フィールドとインターレースされた第一フィールドによって形成されるインターレース画像の第一のグループと順次走査画像の第二のグループとによって表され、第二のグループの各画像は第一のグループのあるフィールドと時間的に一致し、当該装置は：
・第一のグループのフィールドを、インターレース画像の第二フィールドが前記インターレース画像の第一フィールドの直後に符号化されるよう第一の所定の符号化順に従って、Mを厳密に1より大きい整数としてM個の時間的レベル上で基本層として符号化する第一符号化手段と、
・画像の第二のグループの画像を、M個の時間的レベル上で、第二の所定の符号化順で符号化する第二符号化手段とを有し、
前記第二の符号化順が前記第一の符号化順に等しいことを特徴とする、
装置。