JP2009523339A

JP2009523339A - インタレースされたビデオデータを符号化する方法および装置

Info

Publication number: JP2009523339A
Application number: JP2008549801A
Authority: JP
Inventors: インチェン; ヴィエロンジェローム; ボトローヴァンサン; フランソワエドゥアール; ロペスパトリック
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2006-01-13
Filing date: 2006-12-05
Publication date: 2009-06-18
Anticipated expiration: 2026-12-05
Also published as: CN101356824B; JP4943451B2; EP1972143B1; US8090017B2; EP1972143A1; CN101356824A; EP1809042A1; US20090067496A1; WO2007080032A1

Abstract

多くの場合、階層型の双方向予測（Ｂ）フレーム構造が、ビデオピクチャシーケンスの符号化に用いられる。このフレームはインタレースしたフィールド群からなる。本発明のインタレースされたビデオを符号化する方法は、フィールド群の相互予測が用いられ、参照リストが参照フレームまたは参照フィールドを示すためにフィールド群に割り当てられる。参照リスト内に他のフレームへの参照が含まれている場合には、他のフレームの両フィールド（４、４’）への参照（ｆｗｄ_６０、ｆｗｄ_６１）は、別々に、順に含まれる。フレームの表示順序に従って、時間的レベルがフレームのそれぞれに割り当てられ、１つの時間的レベルを除くすべてのフレームについて、量子化パラメータは、一方のタイプ（トップ）のフィールドの方が他方のタイプ（ボトム）のフィールドよりも高い。

Description

本発明は、インタレースされたビデオデータの符号化および復号に関する。詳細には、本発明は、インタレースされたビデオデータにおいて双方向に予測されるフレームの符号化および復号化に関する。

ＭＰＥＧ＆ＩＴＵのＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）によって現在定義されているＳＶＣ規格には、プログレッシブなビデオ素材のための符号化策が示されている。空間的なスケーラビリティは、プログレッシブな素材に対してのみ考慮されている。

ＳＶＣ（スケーラブル符号化）は、符号化時に、階層化Ｂ（双方向予測）フレーム構造をデフォルトとして使用し、フレームの表示順序に従って、予め定義された時間的パターン（ｔｅｍｐｏｒａｌｐａｔｔｅｒｎ）がそのフレームに割り当てらる。これは、常にデコーダの何らかのデフォルトの性能をもたらす。

現在、ＪＳＶＭエンコーダではオープンループ符号化およびクローズドループ符号化をサポートしている。オープンループ符号化については、Ｂピクチャは、オリジナルの参照に基づいて動き予測およびモード決定を行い、生成されたモードおよびモーション情報を用いることにより符号化される。すなわち、エンコーダでの予測のための参照フレームは、以前に符号化されたフレームである。クローズドループ符号化は、参照フレームとして再構築されたフレームを用いるが、このフレームは量子化誤差を含んでいる。

通常、クローズドループ符号化の方が、誤差を抑制し、かつ量子化および不正確な動き予測によって引き起こされる可能性のがある伝搬効果を減少させるのに向いている。オープンループ符号化はＦＧＳ（ＦｉｎｅＧｒａｉｎＳｃａｌａｂｉｌｉｔｙ）レイヤの扱いに対してより柔軟に対応することができ、ＭＣＴＦ（Ｍｏｔｉｏｎ−ＣｏｍｐｅｎｓａｔｅｄＴｅｍｐｏｒａｌＦｉｌｔｅｒｉｎｇ）を容易にサポートすることができる。

エンコーダで構築されるＰピクチャおよびＢピクチャの予測のための参照フレームリストは、ＧＯＰサイズに基づいて常に同じ構造を持ってる。ＰピクチャおよびＢピクチャは、１つのリスト（ｌｉｓｔ＿０）を前方予測、つまりより小さいＰＯＣ番号（ｐｉｃｔｕｒｅ＿ｏｒｄｅｒ＿ｃｏｕｎｔ：表示順序番号）を有するフレームからの予測に用いる。Ｂピクチャは、別のリスト（ｌｉｓｔ＿１）も、後方予測つまりより大きいＰＯＣ番号を有するフレームからの予測に用いる。参照リストは、規定数の参照フレームの後で切り捨てられる。最も低い時間的レベル（ｔｅｍｐｏｒａｌｌｅｖｅｌ）、すなわちローパスレベルはキーピクチャを含んでいる。基本レイヤ（ＢＬ）および拡張レイヤ（ＥＬ）などの異なる空間レイヤについても、参照リストの構築方法は同じである。

既知のエンコーダには、従うべきいくつかの基本的な規則がある。先のＧＯＰ（ｇｒｏｕｐ−ｏｆ−ｐｉｃｔｕｒｅｓ）から、キーピクチャだけが、次のＧＯＰの符号化プロセスに用いられる。一方、先のＧＯＰの他のピクチャは用いられず、ＭＭＣＯ（ＭｅｍｏｒｙＭａｎａｇｅｍｅｎｔＣｏｎｔｒｏｌＯｐｅｒａｔｉｏｎ）コマンドによって短期参照リストから削除される。同じ時間的レベルのフレームは、キーフレームを除いては互いに参照することはない。

クローズドループ符号化の動き予測（ＭＥ）については、エンコーダは、より高い時間的レベルのフレームに対してまず最初に動き予測を実行するため、フレームはより高い時間的レベルを有するフレームのみを参照する。しかし、オープンループ符号化のＭＥについては、より低い時間的レベルのＭＥが最初に実行される。

参照リストは、ＲＰＬＲ（ＲｅｆｅｒｅｎｃｅＰｉｃｔｕｒｅＬｉｓｔＲｅｏｒｄｅｒｉｎｇ）コマンドによって生成される。ＭＭＣＯコマンドは、短期リストから以前のＧＯＰのＢフレーム（または、非キーピクチャ）および未使用のキーフレームを削除するために用いられる。これらのコマンドは、キーピクチャのスライスヘッダにおいて呼び出される。

符号化効率を向上させるために、量子化パラメータ（ＱＰ）をスケールファクタ（ＳＦ）によって適合させることができる。フレームは、以下の式による２つの値に基づいて、エンコーダで異なるＱＰを付与される。
ｑｐ_ｉ＝ｑｐ_ｉ−１ − ６・ｌｏｇ_２（ＳＦ）
これが意味するのは、各時間的レベルｉのＱＰがスケールファクタ（ＳＦ）によって調節され、スケールファクタは異なる時間的レベルのフレームの残差エネルギーの平衡を保つために用いられるということである。

オープンループ符号化については、スケールファクタはブロックの合計エネルギーの割合（ｐｒｏｐｏｔｉｏｎ）として計算される。各ブロックのエネルギーの割合は、それが他のブロックによってどのように予測されるかに基づいて計算される。双方向予測される場合、実際のところ、エネルギーの割合は以下のフィルタを用いて計算される。

このブロックのエネルギー向上（ｅｎｅｒｇｙｉｍｐｒｏｖｅｍｅｎｔ）を正規化するために、以下の係数が導入される。

ブロックが一方向予測のみの場合は、動き補償（ＭＣ）はフィルタ［１，−１］を用いる。このブロックのエネルギー向上を正規化するために、以下の係数が導入される。

時間的レベルｉにおいて、すべてのブロックはこれらの係数を有し、その合計はレベルｉ−１のスケールファクタを計算するために用いられる。

クローズドループ符号化においても同じ考え方であるが、時間的レベルｉが符号化された場合に、時間的レベルｉ−１でいくつのブロックが双方向予測を使用するかは分からない。したがって、双方向予測と一方向予測の比率は、たとえば６０／４０と推測される。

しかしながら、インタレース符号化をサポートするには、すなわち、すべてまたは一部のフレームを、トップフィールドおよびボトムフィールドという２つのインタレースしたフィールド群のペアとして符号化するには、異なる手段が必要である。

本発明は、インタレースビデオ符号化のための参照リストを構築する方法を提供する。これらの参照リストは、デフォルトの参照リストとして用いることができる。

本発明の一態様によれば、インタレースされたビデオを符号化する本発明の方法は、ビデオはトップまたはボトムの少なくとも２タイプのインタレースしたフィールド群を有するフレームを含む。フィールド群の相互予測が用いられ、参照リストが参照フレームまたは参照フィールドを示すためにフィールドに割り当てられる。このような参照リスト内に他のフレームへの参照が含まれている場合は、この他のフレームの両フィールドへの参照は、別々に、順に含まれることを特徴とする。

一実施形態では、インタレースされたビデオを符号化する方法は、フレームの２つのフィールドのうちの第１のフィールドが同じフレームの他方のフィールドへの参照を有し、他方のフィールドは前記第１のフィールドへの参照を有さないことにおいてもさらに特定することができる。

一実施形態では、本発明のインタレースされたビデオを符号化する方法は、第１のタイプ（たとえばボトム）のフィールドについて、他のフレームのフィールドへの参照のうちの第１の参照は、同じフィールドタイプ（たとえばボトム）を有するフィールドを参照し、前記他のフレームへの参照のうちの第２の参照は、反対のフィールドタイプ、この例ではトップを有するフィールドを参照することにおいても特定することができる。

一実施形態では、本発明のインタレースされたビデオを符号化する方法は、フレームがＧＯＰにグループ化され、現在のグループ外の１つのフレームだけを参照することができ、この１つのフレームは、先のグループの最も低い時間的レベルを割り当てていることにおいても特定することができる。

一実施形態では、本発明のインタレースされたビデオを符号化する方法は、ビデオデータは量子化パラメータ（ＱＰ）を用いて量子化され、フレームのフィールド群に対して、異なる量子化パラメータが用いられることにおいても特定することができる。

一実施形態では、インタレースされたビデオを符号化する方法は、フレームの表示順序に従って、時間的レベルがフレームのそれぞれに割り当てられ、１つの時間的レベルを除くすべてのフレームについて、量子化パラメータが、一方のフィールドタイプの方が他方のフィールドタイプより高いことにおいても特定することができる。

本発明の他の態様によれば、インタレースされたビデオを復号する方法は、ビデオはたとえばトップおよびボトムなどの少なくとも２タイプのインタレースしたフィールド群を有するフレームを含み、フィールド群の予測が用いられる。他のインタレースされたフレームが参照として予測に用いられる場合、この他のフレームの両フィールドが別個の参照として順に用いられることを特徴とする。

一実施形態では、本発明のインタレースされたビデオを復号する方法は、フレームの２つのフィールドのうちの第１のフィールドが同じフレームの他方のフィールドへの参照を有し、前記他方のフィールドはこの第１のフィールドへの参照を有さないことにおいてもさらに特定することができる。

一実施形態では、本発明のインタレースされたビデオを復号する方法は、第１のタイプのフィールドについて、他のフレームのフィールドへの参照のうちの第１の参照は、同じフィールドタイプを有するフィールドを参照し、前記他のフレームへの参照のうちの第２の参照は、反対のフィールドタイプを有するフィールドを参照することにおいてもさらに規定することができる。

本発明のさらに他の態様によれば、インタレースされたビデオデータを含む信号において、ビデオデータは少なくとも２タイプのインタレースしたフィールド群を有するフレームを含み、他のフレーム群またはフィールド群からのフィールド群の相互予測については、参照リストが参照フレームまたは参照フィールドを示すために含まれる。このような参照リスト内に他のフレームへの参照が含まれている場合は、この他のフレームの両フィールドへの参照が順に含まれる。

本発明の一実施形態では、フレームおよび／またはフィールドは、割り当てられた時間的レベルを有し、所与のフレームもしくはフィールドの参照フレーム群または参照フィールド群のリストは、その所与のフレームまたはフィールドの時間的レベルより（先に復号された）低い時間的レベルを持つ現在のＧＯＰのすべてのフレーム群またはフィールド群を含む。

本発明の一態様によれば、インタレースされたビデオの同じ時間的レベルのフレームのトップフィールドおよびボトムフィールドは、原則として異なる時間的レベルのように扱われる。

本発明の好ましい実施形態を、従属クレーム、以下の説明および図面に示す。また、以下に示す添付の図面を参照しながら、本発明の例示的な実施形態について説明する。

図１は、たとえばＪＳＶＭエンコーダで用いられている、階層化ＢピクチャのＧＯＰ構造に関する従来の参照リストの構造を示す。フレームは、それらのＰＯＣ番号を用いて示されている。例として、８に等しいＧＯＰサイズを持つ階層化Ｂ構造が示されているため、４つの時間的レベルがある。時間的レベル０は、フレーム０および８を有する。実際に、シーケンスの最初のＧＯＰが示されているが、すべてのＧＯＰが同じ方法によって符号化される。この理由は、先のＧＯＰのキーピクチャだけが次のＧＯＰの符号化プロセスに用いられるためである。先のＧＯＰの他のピクチャは参照されず、ＭＭＣＯコマンドによって短期リストから削除される。

エンコーダが従う、いくつかの基本的な規則がある。第１に、同じ時間的レベルのフレーム群は、キーフレームを除いて互いに参照しない。図１に示すように、基本レイヤＧＯＰであるか拡張レイヤＧＯＰであるかに関係なく、参照リストの構築方法は同じである。たとえば、フレーム６はフレーム２を参照しない。第２に、１つのフレームは、より高い時間的レベルを有するフレーム群のみを参照する。この理由の１つは、エンコーダが、より高い時間的レベルのフレームをまず最初に符号化するためである。第３に、各Ｂピクチャに対して、ｌｉｓｔ＿０およびｌｉｓｔ＿１もいくつかの制約を有している。ｌｉｓｔ＿０（図１においてｆｗｄで示す）は、現在のＢピクチャのフレームより大きいＰＯＣ番号を持つフレームを用いない。ｌｉｓｔ＿１（図１においてｂｗｄで示す）は、現在のＢピクチャのフレームより小さいＰＯＣ番号を持つフレームを用いない。たとえばフレーム５において、ｌｉｓｔ＿０は、ｆｗｄ_５０、ｆｗｄ_５１、ｆｗｄ_５２に対応する｛４、２、０｝であり、ｌｉｓｔ＿１はｂｗｄ_５０、ｂｗｄ_５１に対応する｛６、８｝である。

上記の規則に次いで、このリストは、符号化構成（設定）およびエンコーダ構成でも指定できる低遅延制約で指定された参照の数によって切り捨てられる。

本発明は、インタレースされたビデオに対してデフォルトの参照リストを構築しおよび用いる方法を提供する。便宜上、現在のフレームまたはフィールドがどのように符号化されるかを示すために、Ｐｉｃ＿Ｔｙｐｅアイテムが導入される。フレーム符号化（プログレッシブ）されている場合は、そのＰｉｃ＿ＴｙｐｅはＦＲＡＭＥである。フィールド符号化（インタレース）されており、およびトップフィールドである場合は、Ｐｉｃ＿ＴｙｐｅはＴＯＰ＿ＦＩＥＬＤである。フィールド符号化されており、およびボトムフィールドである場合は、Ｐｉｃ＿ＴｙｐｅはＢＯＴ＿ＦＩＥＬＤである。

図２は、単にインタレース符号化された階層化ＢのＧＯＰ構造の時間的レベル群を示した図である。実線はトップフィールド０〜８を表し、点線はボトムフィールド０’〜８’を表す。各フィールドペアは同じフレームに属し、同じＰＯＣ番号を用いる。たとえば、時間的レベル１は、ＰＯＣ＝４を有するフレームを含み、トップフィールド４およびボトムフィールド４’からなる。

インタレースされた階層化Ｂピクチャに対する、例示的な符号化規則を以下に示す。

第１に、同じｆｒａｍｅ＿ｎｕｍを有し、かつ同じフレームに属するフィールドのペアは、連続的に、つまり順に参照される必要がある。現在のフィールドと同じＰｉｃ＿Ｔｙｐｅを有するフィールドは、最初に参照リストに入れられ、その後、同じフィールドペアに属するが、異なるＰｉｃ＿ｔｙｐｅを有する他のフィールドが続く。

第２に、あるフィールドが参照リストに存在する場合は、それに対応するペアも参照リストに在る必要がある（現在符号化しているボトムフィールドの対応するトップフィールドを除く。また、参照リストのサイズが指定されたサイズより大きい場合を除く）。

第３に、現在のＪＳＶＭエンコーダがフレームに対して実行するのと同様に、より大きいＰＯＣを持つフィールド群はｌｉｓｔ＿０の参照フィールドとして用いられず、および、より小さいＰＯＣを有するフィールド群はｌｉｓｔ＿１の参照フィールドとして用いられない。

第４に、参照ｌｉｓｔ＿１は、トップフィールドであるかボトムフィールドであるかに関係なく、現在のフィールドと同じｆｒａｍｅ＿ｎｕｍを有する参照フィールドを持つことができない。

図３〜図５は、ＧｏｐＳｉｚｅ＝８を有するインタレース符号化された階層化Ｂピクチャの例示的なデフォルトの参照リストを示す図である。図３は、キーフィールドの参照リスト構造の例を示す。トップフィールド８は、第１の参照ｆｗｄ_８０（Ｒｅｆ＿Ｉｄｘ＝０）として先のキーピクチャのトップフィールド０を得て、かつ第２の参照ｆｗｄ_８１として先のキーピクチャのボトムフィールド０’を得る。キーピクチャのボトムフィールド８’は、最初の参照（Ｒｅｆ＿Ｉｄｘ＝＝０を有する）ｆｗｄ_８’０と同じピクチャのトップフィールド８、第２の参照ｆｗｄ_８’１として先のキーピクチャのボトムフィールド０’、および第３の参照ｆｗｄ_８’２として先のキーピクチャのトップフィールド０を得る。

一般にＢピクチャに対しては、上記のように、トップフィールドの参照リストはプログレッシブな符号化の参照リストと同様に構築される。異なる点は、各フレームは次にフィールドペアになることである。つまり最初にトップフィールドとなり、次にボトムフィールドになる。図４に示すように、ＰＯＣ＝６を持つピクチャのトップフィールド６は、以下の順の参照ｌｉｓｔ＿０（ｆｗｄ_６０、ｆｗｄ_６１、ｆｗｄ_６２、ｆｗｄ_６３）：４トップ、４ボトム、０トップ、０ボトムを有する。その参照ｌｉｓｔ＿１（ｂｗｄ_６０、ｂｗｄ_６１）は８トップ、８ボトムである。

Ｂフィールドがボトムフィールドである場合は、そのｎａｌ＿ｒｅｆ＿ｉｄｃが０でない場合（のみ）、その参照ｌｉｓｔ＿０は最初にその対応するトップフィールドを得る。フレーム／フィールドのｎａｌ＿ｒｅｆ＿ｉｄｃは、このフレーム／フィールドが参照として用いられないことを意味する。エンコーダにおいて、最も高い時間的レベルを有するフィールド／フレームのｎａｌ＿ｒｅｆ＿ｉｄｃ値は０に設定される。図５は、たとえば、ピクチャ６のボトムフィールドについて、ピクチャ６のトップフィールドが最初の参照０（ｆｗｄ_６’０）として用いられることを示す。これは、このフレームは通常、デコーダの短期リストで利用可能な他のフィールドと比較して、最も近い時間的距離（表示時間において）を有するためである。その後、他のフィールドは、フィールドペアにより構築される。ピクチャ６ボトムフィールドの最終的な順序付けられた参照ｌｉｓｔ＿０は、（ｆｗｄ_６’０、ｆｗｄ_６’１、ｆｗｄ_６’２、ｆｗｄ_６’３、ｆｗｄ_６’４）、６トップ、４ボトム、４トップ、０ボトム、０トップである。ｌｉｓｔ＿１については、フィールドペア（ｂｗｄ_６’０、ｂｗｄ_６’１）：８ボトム、８トップのみを有する。

一実施形態では、符号化構成および低遅延制約において指定された参照の数によってプログレッシブな符号化で知られているように参照リストは切り詰めることができる。これは、エンコーダ構成によっても指定することができる。

一実施形態では、動き予測（ＭＥ）プロセス時にはオープンループ符号化およびクローズドループ符号化に、異なる参照が用いられる。オープンループ符号化においては、ＭＥ時にオリジナルのフィールドが用いられ、クローズドループ符号化においては、ＭＥ時に再構築されたフィールドが用いられる。ボトムフィールドがその対応するトップフィールドを参照するときでも、参照は再構築されたトップフィールドである必要がある。

ＰＡＦＦ（ＰｉｃｔｕｒｅＡｄａｐｔｉｖｅＦｒａｍｅＦｉｅｌｄＣｏｄｉｎｇ）の場合でも、フィールド符号化ピクチャおよびフレーム符号化ピクチャに対して提案された参照リストの構築方法を用いることができる。

フィールドに対するＲＰＬＲおよびＭＭＣＯコマンド
一実施形態では、上記の参照リストの構造を指定するために、ＲＰＬＲコマンドも実装される。キーピクチャがフレーム符号化されている場合、ＭＭＣＯフィールドが用いられる（オリジナルのＪＳＶＭ方式と同様）。キーピクチャがフィールド符号化されている場合、先のＧＯＰのすべての非キーピクチャのすべてのフィールドペア、および先のＧＯＰのキーピクチャの前のキーピクチャ（存在する場合）を削除するために、キーピクチャのトップフィールドでＭＭＣＯコマンドが生成される。

インタレース符号化のスケールファクタ
本発明の一実施形態においては、ＱＰの適応はインタレース符号化にも用いられる。この場合、トップフィールドとボトムフィールドは異なるスケールファクタを得ることになる。このことは、これらの残差エネルギーが異なるために有利である。トップフィールドと対応するボトムフィールドとのペアが最高位の時間的レベルに属していない場合、トップフィールドは常に対応するボトムフィールドより高いＱＰを持っている。したがって、この実施形態において、インタレースされたピクチャのトップフィールドおよびボトムフィールドは、個別の異なるスケールファクタを使って、原則として異なる時間的レベルのように扱われる。このため、現在の時間的レベルが最高でない場合、トップフィールドおよびボトムフィールドに対して、これらが同じ時間的レベルにある場合であっても異なるスケールファクタを導入することができる。

本発明の一実施形態は、ＳＶＣ階層のＢフレーム構造に対するインタレース符号化における完全な解決策である。

本発明の一実施形態はデフォルトの参照リストの構築方法であり、エンコーダで用いることができるインタレースまたはＰＡＦＦ符号化に対する拡張レイヤデコーダのデフォルトの解決策である。

一実施形態では、対応するＲＰＬＲおよびＭＭＣＯコマンドが、階層化ＢピクチャのＰＡＦＦ符号化をサポートするのに用いられる。

一実施形態では、符号化効率を向上させるために、同じ時間的レベルのトップおよびボトムフィールドに対して、異なるスケールファクタが導入される。

前述したように、参照リストは定義された最大長の後で切り詰めることができる。上記の定義された規則の例外として、フレームの１つのフィールドだけがリストに含まれていて、リストが長すぎるために、他のフィールドを除外する必要がある場合がある。

ビデオは少なくとも２タイプのインタレースしたフィールドを有するフレームを含む、本発明によるインタレースされたビデオのエンコーダは、他のフィールドまたはフレームからフィールドを相互予測する手段と、参照リストを生成する手段と、参照フレームまたは参照フィールドを示すためにフィールドに参照リストを割り当てる手段とを備える。そのような参照リスト内に他のフレームへの参照が含まれている場合には、他のフレームの両フィールドへの参照が各リストに含まれ、特定のフレームの２つのフィールドへの参照は別々に順に含まれる。

一実施形態では、参照リストを生成する手段は、フレームの２つのフィールドのうちの第１のフィールドについては、同じフレームの他のフィールドへの参照を生成し、他のフィールドについては、前記第１のフィールドへの参照を生成しない。

一実施形態では、参照リストを生成する手段は、他のフレームを参照する場合には、第１のタイプのフィールド、たとえばトップについては、常に同じフィールドタイプ、つまりトップを有するフィールドへの参照を最初に生成し、次に、反対のフィールドタイプ、つまりボトムを有するフィールドへの参照を生成する。

一実施形態では、エンコーダは、量子化パラメータによってビデオデータを量子化する手段を含み、フレームのフィールド群については、異なる量子化パラメータが用いられる。

一実施形態では、エンコーダは、フレームの表示順序に従ってフレームのそれぞれに時間的レベルを割り当てる手段を含み、１つの時間的レベルを除くすべてのフレームについて、量子化パラメータは、一方のタイプのフィールドの方が他方のタイプのフィールドより高い。

本発明によるインタレースされたビデオのデコーダは、そのビデオが少なくとも２タイプのインタレースしたフィールド群を有するフレームを含み、他のフィールド群またはフレーム群からフィールドを予測するための手段を含む。他のインタレースされたフレームが参照として予測に用いられる場合は、この手段は、個別の参照として順にこの他のフレームの両フィールドを用いる。

本発明は、インタレースされたビデオデータ、特に、空間的および／または時間的にスケーラブルなインタレースされたビデオデータの符号化／復号に用いることができる。原則として、本発明は、複数の時間的レベルを有する単一の空間レイヤのビデオにも使用できる。

階層化ＢフレームのＧＯＰ構造に関する従来の参照リストの構造を示す図である。インタレース符号化された階層化ＢのＧＯＰ構造の時間的レベルを示す図である。トップおよびボトムキーフィールドに関するインタレース符号化された階層化Ｂピクチャのデフォルトの参照リストを示す図である。トップＢフィールド群の参照リストの構造を示す図である。ボトムＢフィールド群の参照リストの構造を示す図である。

Claims

量子化パラメータ（ＱＰ）を用いて量子化されているインタレースされたビデオデータを符号化する方法であって、
前記ビデオデータは少なくとも２タイプ（トップ、ボトム）のインタレースしたフィールド群を有するフレームを含み、フィールド群（６、６’）の相互予測が用いられ、参照リストが参照フレームまたは参照フィールドを示すためにフィールドに割り当てられ、
そのような参照リスト内に他のフレームへの参照が含まれている場合には、前記他のフレームの両フィールド（４、４’）への参照（ｆｗｄ_６０、ｆｗｄ_６１）は別々に順に含まれ、
フレームのフィールド群について、異なる量子化パラメータ（ＱＰ）が用いられ、
フレームの表示順序に従って、時間的レベルがフレームのそれぞれに割り当てられ、１つの時間的レベルを除くすべてのフレームについて、前記量子化パラメータ（ＱＰ）は、一方のタイプ（トップ）のフィールドの方が他方のタイプ（ボトム）のフィールドより高いこと
を特徴とする符号化方法。
フレームの２つのフィールド群のうちの第１のフィールド（６’）は、同じフレームの他方のフィールド（６）への参照（ｆｗｄ_６’０）を有し、前記他方のフィールド（６）は前記第１のフィールド（６’）への参照を有さないことを特徴とする請求項１に記載の方法。
第１のタイプ（ボトム）のフィールドについては、他のフレームのフィールドへの参照のうちの第１の参照は、同じフィールドタイプ（ボトム）を有するフィールドを参照し、前記他のフレームへの参照のうちの第２の参照は、反対のフィールドタイプ（トップ）を有するフィールドを参照することを特徴とする請求項１または２に記載の方法。
フレームはグループ化され（ＧＯＰ）、現在のグループ外の１つのフレームだけを参照することができ、前記１つのフレームは、先のグループの最も低い時間的レベルを割り当てていることを特徴とする請求項１乃至３いずれかに記載の方法。
量子化パラメータ（ＱＰ）を用いて量子化されているインタレースされたビデオデータを復号する方法であって、
前記ビデオデータは少なくとも２タイプ（トップ、ボトム）のインタレースしたフィールド群を有するフレームを含み、
フィールド群（６、６’）の予測が用いられ、他のインタレースされたフレームが参照として予測に用いられる場合、前記他のフレームの両フィールド（４、４’）は、個別の参照（ｆｗｄ_６０、ｆｗｄ_６１）として順に用いられ、
フレームの表示順序に従って、時間的レベルが前記フレームのそれぞれに割り当てられ、
１つの時間的レベルを除くすべてのフレームについて、前記量子化パラメータ（ＱＰ）は、一方のタイプ（トップ）のフィールドの方が他方のタイプ（ボトム）のフィールドより高いこと
を特徴とする復号する方法。
フレームの２つのフィールド群のうちの第１のフィールド（６’）は、同じフレームの他方のフィールド（６）への参照（ｆｗｄ_６’０）を有し、前記他方のフィールド（６）は前記第１のフィールド（６’）への参照を有さないことを特徴とする請求項５に記載の方法。
第１のタイプのフィールド（トップ、ボトム）については、他のフレームのフィールドへの参照のうちの第１の参照は、同じフィールドタイプを有するフィールドを参照し、前記他のフレームへの参照のうちの第２の参照は、反対のフィールドタイプを有するフィールドを参照することを特徴とする請求項５または６に記載の方法。
インタレースされたビデオデータを含む信号であって、
前記ビデオデータは量子化パラメータ（ＱＰ）を用いて量子化され、少なくとも２タイプ（トップ、ボトム）のインタレースしたフィールド群を有するフレームを含み、他のフレームまたはフィールドからのフィールド群（６、６’）の相互予測については、参照リストが参照フレームまたは参照フィールドを示すために含まれ、このような参照リスト内に他のフレームへの参照が含まれている場合には、前記他のフレームの両フィールド（４、４’）への参照（ｆｗｄ_６０、ｆｗｄ_６１）は順に含まれ、
フレームの表示順序に従って、時間的レベルがフレームのそれぞれに割り当てられ、
１つの時間的レベルを除くすべてのフレームについて、前記量子化パラメータ（ＱＰ）は、一方のタイプ（トップ）のフィールドの方が他方のタイプ（ボトム）のフィールドより高いこと
を特徴とする信号。
前記フレームおよび／またはフィールドは、割り当てられた時間的レベルを有し、所与のフレームもしくはフィールドの参照フレーム群または参照フィールド群のリストは、前記所与のフレームまたはフィールドの時間的レベルより低い時間的レベルを持つ現在のＧＯＰのすべてのフレーム群またはフィールド群を含むことを特徴とする請求項８に記載の信号。
第１のタイプ（ボトム）のフィールドについては、他のフレームのフィールドへの参照のうちの第１の参照は、同じフィールドタイプ（ボトム）を有するフィールドを参照し、前記他のフレームへの参照のうちの第２の参照は、反対のフィールドタイプ（トップ）を有するフィールドを参照することを特徴とする請求項８または９に記載の信号。