JP2008527870A

JP2008527870A - 画像データストリームをスケーラブル符号化および復号するための装置および方法、信号、コンピュータプログラム、および画像品質適応モジュール

Info

Publication number: JP2008527870A
Application number: JP2007550726A
Authority: JP
Inventors: アモヌ，イザベル; カマス，ナタリー; パトゥ，ステファン
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2005-01-12
Filing date: 2005-12-20
Publication date: 2008-07-24
Anticipated expiration: 2025-12-20
Also published as: US20090016434A1; CN102065295A; DE602005019473D1; EP1839442A1; KR20070102547A; ATE458355T1; PL1839442T3; CN101120591B; BRPI0519842B1; FR2880743A1; CN101120591A; ES2341178T3; BRPI0519842A2; EP1839442B1; US8315315B2; JP5042856B2; WO2006074855A1; CN102065295B; KR101291555B1

Abstract

画像列を符号化するための符号化方法であって、各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有するデータストリームを生成する。本方法は、レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤを、前記レベルｎレイヤに基づいて予測符号化するとともに、レベルｎの各データレイヤを、基本サブストリームと、場合によっては、前記画像を少なくとも１つの上位品質で再生することを可能にする少なくとも１つのエンハンスメント・サブストリームの形で符号化する。本方法は更に、前記レベルｎの少なくとも１つのデータレイヤに対し、前記レベルｎ解像度において前記画像を前記上位品質より高い品質で再生することを可能にする少なくとも１つのシングル・サブストリームを符号化する。前記レベルｎレイヤの前記シングル・サブストリームは、前記レベルｎ以外のレベルのレイヤの予測符号化には使用されない。

Description

本発明は、画像または動画像列を符号化および復号するための技術に関する。より具体的には、本発明は、画像のスケーラブル符号化・復号技術、すなわち画像を適応性のある画像品質と可変な空間／時間解像度で符号化および復号するための技術に関する。

現在のところ、多くのデータ伝送システムは、多種多様なタイプのデータアクセス方式を利用する複数のカスタマにサービス提供するという意味で混成的(heterogeneous)である。例えばワールドワイドなインタネットはＰＣ型端末からも無線電話機からもアクセス可能である。より一般に、ネットワークにアクセスするための帯域幅、カスタマ端末の処理能力およびそれらのスクリーンサイズはユーザごとに大きく変わる。つまり、第１のカスタマは、例えば、強力なＰＣからＡＤＳＬビットレート１０２４ｋｂｐｓで自由にインタネットにアクセスする場合があるが、その一方で、第２のカスタマは、同じデータに同時刻に、モデムと繋がったＰＤＡ（personal digital assistant）型端末を使って、低ビットレートでアクセスしようとする場合がある。

それゆえこれらの異なるユーザにはビットレートと画像解像度の両点で変わるユーザ要件に適応したデータストリームが提供される必要がある。この必要性は、多種多様なアクセス・処理能力を有するカスタマにとって利用可能な全ての用途、特に以下の用途である、
・ＵＭＴＳ（Universal Mobile Telecommunication Service）型無線通信端末、ＡＤＳＬアクセス方式のＰＣまたはテレビ受像機で利用可能なＶＯＤ（Video On Demand）。
・セッションモビリティ（例えば、テレビ受像機で開始されたビデオセッションのＰＤＡにおける再開、またはＧＰＲＳ（General packet radio service）で開始されたセッションのＵＭＴＳ型携帯電話機における再開）。
・セッション継続性（新しいアプリケーションと帯域幅を共有するコンテクストにおける）。
・単一のビデオ符号化で標準品位（ＳＤ：standard definition）のカスタマから高品位（ＨＤ：high definition）のカスタマまでサービスを提供しなければならない高品位テレビ。
・単一の符号化がＵＭＴＳアクセスやインタネットアクセスを有するカスタマ達のニーズを満足しなればならないビデオ会議。
・その他
により広範に当てはまる。

これらの異なる要件を満足するため、適応性のある画像品質と可変な空間時間解像度を可能にするスケーラブル（scalable）画像符号化アルゴリズムが開発されている。この符号器は各レイヤが自分より上位のレイヤに埋め込まれたレイヤの階層構造を有する圧縮ストリームを生成する。例えば、第１のデータレイヤはＰＤＡ型端末によって復号することができる２５６ｋｂｐｓ（キロビット／秒）ストリームを搬送し、第２の補完的なデータレイヤは、第１のストリームを補完して、より性能の高いＰＣ型端末によって復号することができる２５６ｋｂｐｓより高い解像度のストリームを搬送する。これら２つの埋込レイヤ（embedded layers）を搬送するのに必要なビットレートは、本例では、５１２ｋｂｐｓである。

これらのスケーラブル・ビデオ符号化アルゴリズムの一部はＭＰＥＧ−２１ワーキンググループのコンテクストにおけるＭＰＥＧ（Moving Picture Expert Group）標準によって現在採用されている。

特に、ＭＰＥＧ−２１ワーキンググループによって最近選ばれたモデルであるＳＶＣ（Scalable Video Coding）モデルはＳＶＭ（Scalable Video Model）と呼ばれ、ＡＶＣ（Advanced Video Coding）型ソリューションに準拠したスケーラブル符号器に基づく。このモデルは２００４年１０月にスペイン国パルマ・デ・マリョルカ（Palma de Majorca）で公表された"Scalable Video Model 3.0"と題された文書N6716 ISO/IEC JTC 1/SC 29/WG 11に詳細に記載されている。ＭＰＥＧ−２１ワーキンググループは空間時間次元と品質において平均的な粗さ（average-grained）のスケーラブル・ストリームを供給するための標準（standard）を提案することを目的としている。

（２．１ＭＰＥＧ−２１ＳＶＭ符号器）
（２．１．１符号器の主な特性）
図１にピラミッド構造を有する符号器の構造を示す。ビデオ入力コンポーネント１０は２部分から成る（ダイアディック：dyadic）サブサンプリング操作（間引き率２の２Ｄデシメーション１１、間引き率４の２Ｄデシメーション１２）を受ける。次にサブサンプリングされたストリームの各ストリームはＭＣＴＦ（motion-compensated temporal filtering、動き補償時間方向フィルタ）型時間方向分割１３を受ける。低解像度版の動画像列は、低空間解像度ｒ０（この基本レベルはＡＶＣコンパチブルである）に対する最大復号可能ビットレートに相当する所与のビットレートＲ_ｒ０_ｍａｘまで符号化１４される。

上位レベルは次に、前回再構築されたオーバサンプリングされたレベルを差し引き、その残差（あるいは誤差）を以下の形で符号化することによって符号化１５、１６される。
・基本レベル（base level）。
・場合によっては、ビットプレーンのマルチラン（multi-run）符号化（以下、“fine-grain scalability”の頭文字をとってＦＧＳと呼ぶ）によって得られる１つ以上のエンハンスメントレベル（enhancement level、拡張レベル、上位レベル）。予測残差（あるいは予測誤差）は解像度ｒｉに対する復号可能な最大ビットレートに相当するビットレートＲ_ｒｉ_ｍａｘまで符号化される。

より具体的には、ＭＣＴＦフィルタリング・ブロック１３は時間方向ウェーブレット・フィルタリングを実行する。すなわち、それらのブロックはウェーブレット・フィルタリングの前に動き（motion）の意味で信号を再編成する。それらは動き符号化ブロック１４〜１６に供給される動き（motion）に関する情報１７と、予測モジュール１９に供給されるテクスチャ情報１８を配信する。予測モジュール１９から出力された予測データは下位レベルからの補間（interpolation）２０の実行に役立つ。それらは信号の精細レベルに作用する空間変換・エントロピー符号化ブロック２１にも供給される。多重化モジュール２２は生成された異なるサブストリームを１つのトータル圧縮データストリームに多重化する。

図２に図１のスケーラブル符号器を使って得られた結果を、異なるスケーラブル解像度（ＣＩＦ（Common Interface Format）／ＱＣＩＦ（Quarter Common Interface Format）、ＣＩＦはＴＶの１／２フォーマットに相当し、ＱＣＩＦはＴＶの１／４フォーマットに相当する）または異なる時間解像度（７．５−３０Ｈｚ、１秒あたりの画像数）に対して表されたビットレート／歪曲線（bit-rate/distortion curves）の形で示す。ｙ軸はＰＳＮＲ（Peak Signal to Noise Ratio）を示し、ｘ軸はビットレートｋｂｐｓ（ｋｂｉｔｓ／ｓ）を示す。従って、曲線２３は時間解像度が７．５ＨｚのＱＣＩＦ空間解像度に対応し、曲線２４は１５ＨｚにおけるＱＣＩＦ解像度に対応し、曲線２５は１５ＨｚにおけるＣＩＦ解像度に対応し、そして曲線２６は３０ＨｚにおけるＣＩＦ解像度に対応する。

（２．１．２符号器における情報レイヤの生成）
図３にＳＶＭ符号器で実行される情報の予測（prediction）／抽出（extraction）のメカニズムを示す。以下、符号化する際に実行される予測をより詳しく説明する。この予測は、所与のレベルｎの空間解像度のレイヤを、それより低いレベルの空間解像度のレイヤからのデータから予測することによって、符号化することにある。

より具体的に、図３に、それぞれビットレート／歪曲線３０（ＱＣＩＦフォーマット）と３１（ＣＩＦフォーマット）に関連するＱＣＩＦとＣＩＦフォーマットの空間解像度レイヤの２つの連続するレイヤの生成を例示する。当業者であれば、この例を空間レイヤ数が３以上（ｎ＞２）のより一般的な場合に拡張することに困難は感じないであろう。既に述べたように、ｘ軸はビットレート（ｋｂｐｓ）を表し、ｙ軸はＰＳＮＲ（ｄＢ）を表す。

各空間解像度レイヤごとに、符号器は２つのサブストリームの形で情報を符号化する。１つはＢＬ（base layer）と称される基本サブストリーム（base sub-stream）であり、もう１つはＥＬ（enhancement layer）と称される段階的エンハンスメント・サブストリームまたはサブレイヤ（gradual enhancement sub-stream or sub-layer）である。

ＱＣＩＦフォーマットが時間周波数およびビットレートの値の全てのレンジで最初に符号化される。１つの基本レベル（ＢＬ）３０１と２つの可能なエンハンスメントレベル（ＥＬ）−１つは符号３０２のＦＧＳ１、もう１つは符号３０３のＦＧＳ２（ＦＧＳは“fine grain scalable”の頭文字）−が存在する。エンハンスメント・レイヤＥＬは従って２回のラン（run）ＦＧＳ１・３０２およびＦＧＳ２・３０３を有する。中間精細ポイントは復号するときにＦＧＳ１とＦＧＳ２の間のデータパケットをカットすることによって得られることがある。

ＱＣＩＦフォーマットは最大ビットレートポイント３０４まで符号化され、そのポイントは後でＣＩＦフォーマットの符号化の際に予測のための参照ポイントとして利用される。このポイントは、システムが一般に最適に機能するためのベストなポイントでなければならない。

次にＣＩＦフォーマットはＱＣＩＦ曲線の最高ポイント３０４（すなわちこの曲線の最大ビットレートポイント）を予測変数（predictor）として使用することによって符号化される。ＣＩＦ情報も２つのサブストリーム−基本サブストリーム（ＢＬ）と２度のラン（ＦＧＳ１およびＦＧＳ２）で構成されるエンハンスメント・サブストリーム（ＥＬ）−で符号化される。

図３は、最大ＱＣＩＦビットレートポイント３０４から開始してＣＩＦ空間解像度レベルの基本レイヤ（ＢＬ）３１１を加えることによって、ＣＩＦ参照ポイント３１２に到達することを示している。このポイントは復号で達成可能な最小ビットレートポイント３１３ではない。この参照ポイント３１２から始めて、エンハンスメント・レイヤＥＬ３１４（ＦＧＳ１）および３１５（ＦＧＳ２）のおかげで、他のより高いＣＩＦビットレートポイント、最大ＣＩＦビットレート３１６まで到達することができる。

図４は任意の不特定レベルｎ−１およびｎの空間レイヤ（ｎ：整数）に対して符号器で行われる情報の処理の順序をまとめたものである。ＢＬは、ある空間解像度レベルの、基本品質（base quality）サブレイヤを表し、ＥＬは拡張品質（enhancement quality）サブレイヤを表す。最初に、レベルｎ−１の基本サブレイヤＢＬが符号化４１され、次にｎ−１レベルのエンハンスメント・サブレイヤＥＬが符号化され、次にｎレベル空間解像度の基本サブストリームＢＬが符号化４３され、そしてこのｎレベルのエンハンスメント・サブストリームＥＬが符号化４４される。この後もより高いレベルの空間解像度に対して同じ手続きが実行される。

（２．２ＭＰＥＧ−２１ＳＶＭエクストラクタ）
ここでは画像品質適応モジュールとも呼ばれるエクストラクタ（extractor）は、符号器によって生成されたトータルデータストリームの中から所与の空間時間解像度レベルおよび所与のビットレートに対応する部分を復号器のために抽出するためのツールである。

（２．２．１スケーラブル・ストリーム・エクストラクタの一般的な機能）
スケーラブル符号器には２つのタイプが存在する。
・互いに埋め込まれた（これは例えばＪＰＥＧ２０００標準によって提案されたビデオ符号器に当てはまる）、復号ポイントの間の特別な関係を指定しない非予測“自然にスケーラブルな”符号器（例えばウェーブレット変換に基づく）。
・埋込経路を構築する必要がある予測ＳＶＭ型符号器。より具体的には、圧縮ストリーム抽出を実行するため、ＳＶＭのエクストラクタは、図５に示したような、互いに埋め込まれた事前に指定された経路をたどる。

図５において、ｘ軸はＨｚで表された時間解像度を示し、ｙ軸はビットレート（高Ｈ、低Ｌ）を示し、ｚ軸は空間解像度（ＱＣＩＦまたはＣＩＦ）を示す。符号器によって生成されるトータルデータストリーム５０は、各立方体が所与の空間時間解像度および所与のビットレートに対応する複数の立方体で表現される１セットのサブストリームから成る。従って、７．５ＨｚにおけるＱＣＩＦ空間解像度レベルから最高ビットレートを抽出するには、エクストラクタは抽出経路：ＣＩＦ３０Ｈ→ＣＩＦ１５Ｈ→ＱＣＩＦ１５Ｈ→ＱＣＩＦ７．５Ｈを辿（たど）らねばならない（例えばＣＩＦ３０Ｈは、時間周波数３０ＨｚのＣＩＦ空間解像度フォーマットにおける、高ビットレートレベルＨのストリームを表していることに注意する）。

同様に、７．５ＨｚにおけるＱＣＩＦの最低ビットレートを抽出するには、エクストラクタは経路：ＣＩＦ３０Ｈ→ＣＩＦ１５Ｈ→ＣＩＦ１５Ｌ→ＱＣＩＦ１５Ｌ→ＱＣＩＦ７．５Ｌを辿（たど）らねばならない。

（２．２．２ＭＰＥＧ−２１ＳＶＭエクストラクタの動作）
ＭＰＥＧ−２１ＳＶＭエクストラクタは次のように働く。ビデオストリームを所与のビットレートＲｔにおいて空間時間解像度Ｓｔ−Ｔｔで復号するため、トータルストリームからサブストリームが次のように抽出される。全てのレベルの空間解像度（基本レベルから目標解像度Ｓｔまで）の基本品質レイヤ（ＢＬｎ−１，ＢＬｎ，．．．）が空間解像度Ｓｔに対する最小復号可能ビットレートに相当するＲｍｉｎを費やして抽出される。基本品質サブストリームの抽出の後、許されたビットレートはＲｔ＝Ｒｔ−Ｒｍｉｎになる。

エクストラクタは次に下位の空間解像度の時間方向サブバンドを１つずつ調べ、各サブバンドの異なるエンハンスメント・レイヤＥＬを抽出する。それは下位空間解像度の時間方向サブバンド上にループを作り、次に各時間方向サブバンドのエンハンスメント・レイヤ上にループを作る。

Ｒｆを時間方向サブバンドから品質レイヤを抽出するのに必要なビットレートとする。許されたビットレートＲｔ＞Ｒｆの場合、議論されるサブバンドのレイヤが抽出され、ビットレートはＲｔ＝Ｒｔ−Ｒｆとなる。それ以外の場合は、議論されるサブバンドのレイヤはトランケート（truncate）され、抽出は終了する。

下位空間解像度の時間方向サブバンドの全てのレイヤが抽出し終わった場合、エクストラクタは空間解像度レベルＳｔのサブバンドを調べる。エクストラクタはＦＧＳ品質レイヤ上に、そして次に時間方向サブバンド上にループを作る。Ｒｆｓは全ての時間方向サブバンドに対して品質ｑレイヤを抽出するために必要なビットレートを表す。許されたビットレートＲｔ＞Ｒｆの場合、全てのサブバンドの品質ｑレイヤが抽出され、ビットレートはＲｔ＝Ｒｔ−Ｒｆｓとなる。それ以外の場合は、全てのサブバンドの品質ｑレイヤはトランケート（truncate）され、抽出は終了する。

図６に、エクストラクタまたは画像品質適応モジュールによる情報の処理の順序を示す。レベルｎの空間解像度ｎにおける抽出では、エクストラクタは、最初にレベル０からレベルｎまでの全ての空間レベル（ＱＣＩＦ、ＣＩＦなど）の全ての基本品質ＢＬレベルを１つずつ調べ、次に、下位の空間レベル（ＥＬ０）からレベルｎ（ＥＬｎ）までの拡張品質レイヤＥＬを調べる。

抽出メカニズムは、ビットレート／歪曲線３０および３１を使って、予測メカニズムとの関連で既に述べた図３によって同じく示すことができる。ここでは以下、復号におけるビットレートの異なるポイントを生成するためにこれらの曲線に沿ってＳＶＭＭＰＥＧ−２１のエクストラクタが辿る経路を議論する。

従って、ＱＣＩＦフォーマットにおけるビットレートポイントを生成するため、エクストラクタは、最初にＱＣＩＦレベルから基本レイヤ３０１を取り出す。ＱＣＩＦ最小ポイント３０５から、ＱＣＩＦ最小ポイント３０５より高く、最大ビットレートポイント３０４（これはＣＩＦフォーマットより高い空間解像度レイヤの予測に用いられるもの）より低い任意のビットレートを抽出することが可能である。このために、ＦＧＳ１・３０２とＦＧＳ２・３０３で構成されるエンハンスメント・レイヤまたはサブストリーム（ＥＬ）は割り当てられたビットレートに従ってカットされる。

ＣＩＦフォーマットにおけるビットレートを生成するには、要求されるビットレートが参照ポイント３１２より高いかまたはこの参照ポイントより低いかに応じて２つのアプローチが可能である。

目標ビットレートがＣＩＦ参照ポイント３１２のビットレートを下回る場合、エクストラクタは２つのＱＣＩＦおよびＣＩＦ空間レベルの基本レイヤＢＬ３０１および３１１を取り出し、その結果、最小ＣＩＦビットレートポイント３１３がもたらされる。残りのビットレートに応じて、エクストラクタはＱＣＩＦ空間解像度レベルのエンハンスメント・レイヤＥＬ３０２および３０３をトランケート（truncate、切り捨て）する。

要求されるビットレートがＣＩＦ参照ポイント３１２のビットレートを上回る場合、エクストラクタはＣＩＦおよびＱＣＩＦレベルの基本レイヤＢＬ３０１および３１１、ＱＣＩＦレベルのエンハンスメント・レイヤＥＬ３０２および３０３を取り出し、ＣＩＦエンハンスメント・レイヤ３１４、３１５を残りのビットレートに応じてカットする。

（３．従来技術の欠点）
ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルの符号化／復号技術は様々な欠点を有する。この技術に関連する抽出メカニズムには多くの欠点がある。

最初に、エクストラクタにおける情報の処理の順序（すなわち、空間解像度の全ての基本レイヤＢＬ、次に、空間基本レベルから必要とされる空間レベルまで行くエンハンスレイヤＥＬ）によって、復号するときに要求されるビットレートが何であれ、抽出は常に同じ経路を辿る。このとき、この経路は常に復号時の各目標ビットレートの最適経路というわけではない。

さらに、それより高いレベルの空間解像度の符号化に対して予測が行われた各所与のレベルの空間解像度ごとに、予測に使用されたビットレートポイントに相当する最大ビットレートが存在する。このとき、この最大ビットレートポイントは常にこのレベルの空間解像度に対して到達することが求められる最高ポイントというわけではない。実際、予測ポイントは上位空間レベルの符号化の際の予測誤差を最小化するよう選ばれるが、現時点の空間レベルに対する非常に高い品質のポイントに対応しない。多くの場合、特に低い空間解像度に対しては、予測ポイントによって与えられるものよりも高い画像再生品質を提供するのに有効なポイントを有することが望ましくまたは必要である。

最後に、ＭＰＥＧ−２１ＳＶＭ符号化技術の１つの最後の欠点は、レベルｎの空間解像度における（例えばＣＩＦフォーマットにおける）、このレベルの参照ポイント（例えば図３におけるポイント３１２、すなわち、空間レベル０〜ｎの基本レイヤＢＬと空間レベル０〜ｎ−１の全ての精細レイヤ（refinement layers）ＥＬの復号によって得られるポイント）のビットレートより低いビットレートのポイントの抽出に、レベルｎの精細情報（refinement info.）（すなわち、例えばＣＩＦレベルの拡張レベルＥＬ３１４および３１５からの情報）が全く使用されないという点である。

（４．本発明の目標）
本発明は従来技術の上記欠点を克服することを目標とする。

より具体的には、本発明の目標は、２００４年１０月にスペイン国パルマ・デ・マリョルカ（Palma de Majorca）で公表された"Scalable Video Model 3.0"と題された文書N6716 ISO/IEC JTC 1/SC 29/WG 11の中でＭＰＥＧ−２１ワーキンググループによって提案されたＳＶＭモデルの技術の改良として、レイヤ間予測（inter-layer prediction）を用いて、データストリームをレイヤ編成することに基づく、動画像および／または動画像列のスケーラブル符号化・復号技術を提供することにある。

特に、本発明の目標は、復号の際、所与の解像度レベルｎにおいて従来技術より高い品質の画像を再生するために使用することができる、この種の技術を提供することにある。より具体的には、本発明の目標は、所与のレベルの解像度ｎ−１に対し、解像度レベルｎの予測による符号化に使用されるものより高いビットレートを実現することを可能にする、この種の技術を提供することにある。

本発明のもう１つの目標は、各ビットレートポイントごとに、最適な抽出経路、すなわちビットレート／歪の点でベストな再生を実現する経路を指定するために使用することができる、この種の技術を提供することにある。

本発明の更にもう１つの目標は、実装がシンプルで、リソース（帯域幅、処理能力など）面でコストがほとんどかからない、この種の技術を提供することにある。

本発明の更にもう１つの目標は、効率的なデータ圧縮を可能にすると同時に画像の高品質再生を可能にする、この種の技術を提供することにある。

本発明の更にもう１つの目標は、データストリームへの異なるアクセス方式を有し、異なる処理能力を有する表示端末を有する複数のユーザに満足ゆくサービスを提供するために使用することが可能な、この種の技術を提供することにある。

（５．本発明の基本的な特徴）
以上の目標並びに以下明らかとなる他の目標は、画像または画像列を符号化するための方法であって、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有するデータストリームを生成するステップを実行する方法を用いて達成される。本方法は、レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤを、少なくとも前記レベルｎレイヤからの予測によって符号化するステップ（予測符号化ステップ）を含む。前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にする。

本発明によれば、本方法は、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記画像を前記解像度レベルｎで前記所定の最大品質より高い品質で再生することを可能にする特異サブストリーム（singular sub-stream）または“デッド・サブストリーム（dead-sub-stream）”と呼ばれる少なくとも１つの追加のサブストリームを符号化する。前記レイヤレベルｎの前記デッド・サブストリームはｎとは異なるレベルの前記レイヤの予測符号化ステップの際には使用されない。

このように、本発明はスケーラブル画像ストリームまたはビデオストリームの符号化に対する全く新規で革新的なアプローチに基づく。実際、先行技術（特にＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに記述された技術）では、解像度ｎ−１を有するレベルのレイヤのデータ全体が上位のレベルｎレイヤの予測符号化に使用されたが、本発明では解像度レベルｎ−１に関連する追加の情報の符号化を提案する。この追加の情報は、レベルｎの予測符号化にも、解像度レベルｎにおける画像の再生にも使用されない。この追加の情報は、デッド・サブストリームに符号化され、解像度レベルｎ−１における画像の再生のみに使用される。

言い換えると、符号化ストリームの埋込データレイヤの各レイヤの関連するビットレート・歪曲線に基づく論証によって、本発明は所与の解像度レベルｎ−１のレイヤのビットレート・歪曲線の最大ビットレートポイントＰ_ｍａｘを、解像度レベルｎのデータレイヤを予測するために使用される、予測ポイントＰ_ｐｒｅｄと呼ばれる、この曲線のポイントから分離することを提案する。レベルｎレイヤのデッド・サブストリームのおかげで、予測ポイントＰ_ｐｒｅｄのビットレートと最大ポイントＰ_ｍａｘのビットレートとの間に位置する全てのビットレートをカバーすることが可能となる。

このデッド・サブストリームを通じて、復号において解像度レベルｎにおいて従来技術より高い品質の画像または動画像列の再生を達成することが可能である。このことは特に、Ｐ_ｐｒｅｄからのレベルｎにおける再生によって達成される品質が十分でない一部の表示端末に役立つ。

有利には、各レベルｎデータレイヤはレベルｎの解像度で基本品質の画像を再生することができるようにする少なくとも１つの基本サブストリームＢＬと、場合によっては、少なくとも１つの上位品質の画像を取得するため、基本品質画像の精細化を可能にする少なくとも１つのエンハンスメント・サブストリームＥＬの形で、符号化される。前記所定の最大品質は、
・前記エンハンスメント・サブストリームが符号化されない場合は、基本品質、
・少なくとも１つのエンハンスメント・サブストリームが符号化される場合は、前記少なくとも１つの上位品質、
である。

実際、一部のデータレイヤは基本サブストリームの形でのみ符号化されることがあり、他のデータレイヤは１つ以上のエンハンスメント・サブストリームも含む。本発明に基づいて符号化されたデッド・サブストリームのおかげで、基本サブストリームのみから、あるいは１つ以上のエンハンスメント・サブストリームが存在する場合には基本サブストリームおよび１つ以上のエンハンスメント・サブストリームから得られる最大品質より高い品質の画像を再生することができる。

本発明の１つの有利な態様として、この種の符号化方法は、前記データストリーム内の前記少なくとも１つのデッド・サブストリームを識別するために使用される少なくとも１つの情報を前記データストリームに挿入する第１のステップを更に含む。それは実際、復号するときに、空間解像度レベルｎに関連する最大ビットレートポイントを、それより高い空間解像度レベルｎ＋１の符号化に使用される予測ポイントから区別することができるようにするために必要である。

本発明の好ましい態様として、この種の符号化方法は、前記画像の少なくとも一部の画像に対して、前記データストリームに前記レイヤの少なくとも一部のレイヤの少なくとも一部のデータに関連する再生品質に関する少なくとも１つの情報を挿入する第２のステップも含む。前記再生品質は少なくとも１つのビットレート／歪パラメータの関数である。

品質に関するこの情報をストリームに挿入することにより、レベルｎの解像度の異なるレイヤにおける品質の選択的適応が可能となる。この結果、復号における目標ビットレートの各ポイントごとに、最適な抽出経路が指定される。この経路はビットレート・歪の点でこのビットレートにおけるこの画像のベストな再生を可能にする経路である。

本発明は、画像または画像列を符号化するための符号器も提供する。この符号器は、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有するデータストリームを生成するための手段を含む。本符号器は、レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤを、少なくとも前記レベルｎレイヤから予測符号化するための手段を含み、前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にする。

本発明によれば、本符号器は、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記画像を前記解像度レベルｎにおいて前記所定の最大品質より高い品質で再生することを可能にする、デッド・サブストリーム（dead sub-stream）と呼ばれる、少なくとも１つのサブストリームを符号化するための手段も含み、前記レベルｎレイヤの前記デッド・サブストリームはｎとは異なるレベルの前記レイヤの予測による前記符号化手段には使用されない。このデッド・サブストリームは、レベルｎレイヤに対して、基本サブストリームＢＬに加えられ、そして場合によっては、エンハンスメント・サブストリームＥＬにもこれが存在すれば加えられる。

有利には、この種の符号器は、前記レベルｎレイヤ内から、前記レベルｎ＋１レイヤの予測符号化の際に考慮しなければならないデータの抽出に使用される予測ポイント抽出モジュールを更に含む。この予測ポイント抽出モジュールは上位レイヤの符号化を実行するために使用される、最大ビットレーポイントとは異なるポイントを決定するために利用される。

本発明は、上記符号化技術に基づいて符号化されたデータストリームを復号するための復号方法とそれに関連する復号器も提供する。本発明の復号方法は、前記レベルｎ解像度で前記画像の１つを再生するため、
・レベルｎより低いレベルの前記データレイヤを復号するステップと、
・許された復号ビットレートに応じて、前記レベルｎレイヤと、場合によっては、前記レベルｎレイヤの前記デッド・サブストリームを、少なくとも部分的に復号するステップを含み、
レベルｎより低いレベルの前記レイヤの前記デッド・サブストリームは前記再生の際に復号されない。

より具体的には、まず最初にｎ以下のレベルの基本サブストリームが復号され、続いてｎより低いレベルのレイヤのエンハンスメント・サブストリームがそれらが存在する場合に復号される。最後に、許された復号ビットレートに応じて、レベルｎレイヤの少なくとも１つのエンハンスメント・サブストリームと、場合によっては、このレイヤのデッド・サブストリームで、少なくとも部分的な復号が実行される。

本発明は、上述した技術に基づいて符号化されたデータストリームを伝送するための信号も提供する。本信号は、前記データストリームがその中で搬送される情報エンティティの形で構造化され、前記情報エンティティの各エンティティは、前記情報エンティティのタイプに関する情報を提供するヘッダと、ペイロードデータフィールドとを含む。

本発明によれば、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、本信号は、前記レベルｎ解像度で前記画像を前記所定の最大品質より高い品質で再生することを可能にする、デッド・サブストリームと呼ばれる、少なくとも１つのサブストリームも搬送する。前記レベルｎデッド・サブストリームはｎとは異なるレベルの解像度で前記画像を再生するのには使用されない。

第１の代わりの態様では、本信号は前記デッド・サブストリームを、前記基本サブストリームおよび前記エンハンスメント・サブストリームを搬送する前記情報エンティティのタイプとは異なる第１の特定のタイプ（例えばＳＶＭモデルのシンタクスに規定されたタイプ２２または２３のＮＡＬ）の少なくとも１つの情報エンティティ内で搬送する。

第２の代わりの態様では、前記デッド・サブストリームの少なくとも１つおよび前記エンハンスメント・サブストリームの少なくとも１つは同じタイプの情報エンティティ（ＮＡＬ）内で搬送され、このとき本発明の信号は、前記特異サブストリームおよび前記エンハンスメント・サブストリームを前記ＮＡＬ内で識別することを可能にする少なくとも１つの切断情報（cutting information）を搬送する。

最適抽出経路の指定を可能にする、品質の適応選択に関係する上記態様が符号化の際に適用されるとき、本発明の信号は、この態様において、特定のデータに関連する品質の再生に関する情報も搬送しなければならない。このために、２つのアプローチが考案された。

第１の態様は、既存の情報エンティティ（すなわちＮＡＬ）の構造を、それらの一部が前記ペイロードデータフィールドの少なくとも一部のデータを指す少なくとも１つのポインタを含む疑似ヘッダ（pseudo-header）も含むように修正することにある。この少なくとも１つのポインタは、少なくとも１つのビットレート／歪パラメータに依存する、前記データに関連した再生品質のレベルに関する情報を提供する。

第２の態様は、既存の情報エンティティの構造を全く修正しないという点から好ましく、本発明の信号内に、前記ストリームの少なくとも一部のデータに関連する再生品質に関する少なくとも１つの情報を含む特定のタイプの少なくとも１つの情報エンティティを導入することから成る。このとき前記再生品質は少なくとも１つのビットレート／歪パラメータに依存する。

このため、情報ＮＡＬと呼ばれる特定のＮＡＬが導入される。これらの情報ＮＡＬは、それらのペイロードデータフィールドに、データ搬送ＮＡＬ（すなわち、例えばエンハンスメント・サブストリームを搬送するＮＡＬ）における品質レベルの特定を可能にするオフセットを含む。

これらの情報ＮＡＬは、デッド・サブストリームの始まりに対応する品質レベルを示す追加情報を含むときには、デッド・サブストリームを識別するための情報も搬送することができる。

本発明は、マイクロプロセッサで実行されたときに、画像または画像列を符号化するための上記符号化方法のステップを実行するためのプログラムコード命令と、同じくマイクロプロセッサで実行されたときに、画像または画像列を表すデータストリームを復号するための上記復号方法のステップを実行するためのプログラムコード命令を含むコンピュータプログラムも提供する。

本発明は、画像または画像列の品質を適応させるための適応モジュールも提供する。この適応モジュールには、上述したような、画像または画像列を表すソースデータのストリームが供給される。

この種の適応モジュールは、少なくとも１つの表示端末が前記画像を表示するよう設計された修正されたデータストリームを生成するための手段を含む。前記修正されたデータストリームは、前記ソースデータストリームから、前記少なくとも１つの表示端末が前記画像を前記解像度レベルｎで再生しない場合には前記レベルｎデッド・サブストリームを抽出することによって得られる。

本適応モジュールは、エクストラクタ（extractor）とも呼ばれ、ストリームから、例えばサービス対象の端末の性質に起因して再生に使用されないサブストリームを抽出するために使用される。この適応モジュールは、符号器の出力直後、復号器の直前（あるいは復号器に組み込まれることもある）、あるいはカスタマ端末がストリームにアクセスする伝送ネットワークの任意のポイントに配置される場合がある。

最後に、本発明は、前記データストリームを格納するよう設計されており、このサブストリームのデータの埋込レイヤを階層的に格納するための構造を有するデータ搬送波（data carrier）も提供する。この種のデータ搬送波は、前記レベルｎデータレイヤの少なくとも１つに対し、少なくとも１つのデッド・サブストリームを格納するための少なくとも１つのゾーンを含む。前記格納ゾーンはｎとは異なるレベルの解像度で前記画像を再生する際には読み出されない。

本発明の他の特徴および利点は、単に例示的でありかつ非制限的な例による好ましい実施形態についての以下の説明および添付の図面からより明らかになるであろう。

本発明の一般原理は、追加のサブストリームをそのストリームの一部または全ての解像度レベルで符号化し、その解像度レベルでより良い品質の画像を再生することができるように設計することに基づく。この追加のサブストリームは、デッド・サブストリーム（dead sub-stream）と呼ばれ、それが符号化される解像度でのみ使用される。言い換えると、符号化において、それはその他の解像度レベルのレイヤの予測には使用されず、復号において、それは他の解像度レベルでの画像の再生には使用されない。

このストリームで符号化される各解像度レベルに関連するビットレート・歪曲線を考えると、斯かるデッド・ストリームの挿入はある解像度レベルの最大ビットレートポイントをそれより高い解像度レベルの予測に使用されるこのレベルのポイントから引き離すことを意味する。

図７に、デッド・ストリームを所与のレベルｎの空間および／または時間解像度データのレイヤに追加することに基づく、本発明の符号化技術の実施の一形態を示す。

前にも述べたように（図３参照）、ここでの説明は、２つの埋込解像度フォーマット（embedded resolution formats）、つまりＱＣＩＦおよびＣＩＦフォーマットで画像を符号化する特別なケースに関するものである。当業者であれば、ここでの教示をｎ個の連続する解像度レベル（例えばＱＣＩＦ、ＣＩＦ、ＳＤ、ＨＤなど）の一般的なケースに拡張することにはさほど難しさは感じないであろう。図７はこれら２つのフォーマットに対するビットレート・歪曲線（ＱＣＩＦに対する曲線３０とＣＩＦに対する曲線３１）を示している。図中、ｘ軸はｋｂｐｓ（ｋｂｉｔｓ／ｓ）で表されたビットレートを示し、ｙ軸はＰＳＮＲ（ｄＢ）で表された歪み（distortion）を示す。図３と図７において同じ要素に同じ参照符号が付されていることに注意する。

このとき本発明の原理は、符号化において、ある空間レベルｎ−１に対する最大ビットレートポイント（本ケースではＱＣＩＦフォーマットのビットレート／歪曲線に対するＰ_ｍａｘポイント７０４）を、次の空間レベルｎの予測に使用されるビットレートポイント（すなわちＣＩＦフォーマットの予測に使用されるポイントＰ_ｐｒｅｄ７０６）とは異なるものとして定義することから成る。

このために以下のような符号化ステップが実行される。
・空間レベルｎ−１（ＱＣＩＦ）のデータレイヤを最大ビットレートポイントＰ_ｍａｘ７０４にまで符号化する。
・空間レベルｎ−１（ＱＣＩＦ）のビットレートポイントＰ_ｐｒｅｄ７０６を抽出する。
・トータル符号化ストリーム（total encoded stream）に、Ｐ_ｐｒｅｄ７０６からＰ_ｍａｘ７０４までのビットレートをカバーする、空間レベルｎ−１（ＱＣＩＦ）に対するデッド・サブストリーム７０７と呼ばれる追加のサブストリームを導入する。このストリームは解像度レベルｎ−１（ＱＣＩＦ）におけるあるビットレートポイントにおける動画像列の再生のみに役立ち、それより高いまたは低い空間レベルポイントの再生には使用されない。
・トータル符号化ストリームに、このストリームからデータを復号または抽出する際に、ＱＣＩＦビットレート／歪曲線上における予測ポイントＰ_ｐｒｅｄ７０６の、最大ビットレートポイントＰ_ｍａｘ７０４からの位置を特定することを可能にする、デッド・サブストリームの識別情報を導入する。
・ビットレートポイントＰ_ｐｒｅｄ７０６における空間レベルｎ−１（ＱＣＩＦ）の予測を使用して空間レベルｎ（ＣＩＦ）のデータレイヤを符号化する。

それゆえ、この符号化技術によれば、ＱＣＩＦフォーマットにおける画像の再生にのみ（排他的に）使用されるデッド・サブストリーム７０７に属する空間解像度ＱＣＩＦに関連するビットレート/歪曲線３０上に新たなポイントが出現する結果となる。

端末がこのようにして符号化されたトータルデータストリームを復号しようとするとき、動画像列（video sequence）の再生に必要なデータは、端末が望む空間時間解像度およびビットレートに応じて、このトータルデータストリームから抽出される。解像度レベルｎにおける再生には、ｎとは異なる空間レベル（特に下位空間レベル（the lower spacial lebels））のデッド・ストリームのどれも使用しないよう注意を払い、しかし必要ならば、空間レベルｎのデッド・サブストリームを所望のビットレートがその使用を可能にする場合には使用して、この空間レベルｎのビットレートポイントが抽出される。

図１７に本発明の符号器（エンコーダ）の単純化した構造を示す。この符号器は、メモリＭ１７８と、例えばマイクロプロセッサを搭載しておりコンピュータプログラムＰｇ１７７によって駆動される処理装置１７６とから構成される。初期化の際、コンピュータプログラム１７７コード命令が処理装置のプロセッサで実行される前に例えばＲＡＭにロードされる。処理装置１７６は入力側で符号化対象のビデオコンテンツ１０を受信する。処理装置１７６のマイクロプロセッサμＰは動画像列１０をｎ個の連続する空間解像度レベルＰｇ１７７の複数の埋込レイヤを含む圧縮ストリーム８３の形式で符号化する。処理装置１７６は圧縮データストリーム（compressed data stream）８３を出力する。

図８に一部または全ての空間解像度レベルにおいてデッド・サブストリームの導入を可能にする符号器のより詳しい構造を示す。斯かるコーダの構造は、図１を参照して説明したＭＰＥＧ−２１ＳＶＣ符号器の構造とは、予測ポイント抽出モジュール（prediction point extraction module）８１および８２が存在する点だけ異なることに留意する。このため図１および図８において同じ構成要素には同じ参照符号が付されてある。図８の例は、動き補償とレイヤ間表現によるレイヤ表現とともに時間方向ウェーブレット変換に基づく、スケーラブル・ビデオ符号化のコンテクストに設定してある。

図８の符号器は次のように動作する。
（ｉ）符号器の入力側で受信されたビデオデータ１０は符号器の同時に働く３つのアームに供給される。１つ目のアームでは受信データは間引き率４のデシメーション（decimation）１２を受け、２つ目のアームではデータは間引き率２のデシメーション１１を受け、そして最後のアームでは受信データはサブサンプリングされることなくデシメーションは一切受けない。

（ｉｉ）動画像列は、まず最初に、ウェーブレット係数の形のテクスチャ情報を生成するために使用されるＭＣＴＦ（motion-compensated temporal transform、動き補償時間方向フィルタ）１３1を用いて基本空間フォーマット（ＱＣＩＦ）で符号化される（ここでは簡単のため、動画像列の動き情報を処理するためのモジュールは示されていないことに留意する）。変換係数（transformed coefficeints）は同じ空間レベルの他の係数に関連して予測符号化１９₁された後、スケーラブル・エントロピー符号化２１₁に送られる。基本（base）空間解像度レベルを表すスケーラブル・サブストリーム（サブビットストリーム８４）がトータルビットレートＲ_ｒ０_ｍａｘで得られる。ここでｒ０は空間レベルを表し、ｍａｘは関連するビットレート・歪曲線の最高ビットレートポイントを示す。

より高い空間符号化レベルの予測に使用されるビットレートポイントＰ_ｐｒｅｄは予測ポイント抽出モジュール８２によって符号化スケーラブル・サブストリーム（encoded scalable sub-stream）から抽出される。ポイントＰ_ｐｒｅｄのビットレートはビットレートＲ_ｒ０_ｍａｘよりも低い。

抽出されたサブストリームは、より高い空間解像度レベルの予測１９₂に使用されるよう、復号・補間２０₁される。スケーラブル・サブストリーム８４は、最終的なストリーム８３を形成するために全ての空間解像度レベルの全てのサブストリームを編成する役割を担うマルチプレクサ（multiplexer）２２に送られる。

（ｉｉｉ）次に、ビデオ（動画像列）は、ＭＣＴＦ（motion-compensated temporal transform、動き補償時間方向フィルタ）１３₂を用いてより高い空間解像度（ＣＩＦ）で符号化される。ここでも変換係数は同じ空間レベル（ＣＩＦ）のウェーブレット係数または下位の空間レベルから来る補間信号（interpolated signal）２０₁の係数を用いて予測１９₂される。予測１９₂の次はスケーラブル・エントロピー符号化２１₂である。空間解像度レベルｒ１を表すスケーラブル・サブストリーム８５は最大ビットレートＲ_ｒ１_ｍａｘで得られる。このサブストリーム８５はマルチプレクサ２２に送られる。次により高い空間レベルの予測に使用されるビットレートポイントは符号化サブストリーム８５から予測ポイント抽出モジュール８１によって抽出され、補間２０₂される。

より高い空間レベルに対しても、最後の空間レベルに対しては予測ポイントは抽出されないことを除いて、同じ手続きが実行される。

図９に図８の符号器によって生成されるデータを示す。特に本例では、２つの異なる空間解像度レベルのみ、すなわちＱＣＩＦおよびＣＩＦのみ、を考える（言い換えると、議論される要素は図８の符号器の２つの下位アームから来てそれぞれ入力ビデオデータ１０の間引き率２と４のデシメーションを受けたサブストリームのみである）。

ある空間解像度レベル（ＱＣＩＦおよびＣＩＦ）の各データレイヤごとに、データは複数のサブレイヤ−１つの基本レイヤＢＬと、その後に続く第１のエンハンスメント・レイヤ（エンハンスメント・レイヤ１あるいはＥＬ１）と第２のエンハンスメント・レイヤ（エンハンスメント・レイヤ２あるいはＥＬ２）−に編成される。最初の２つのサブレイヤ（ＢＬおよびＥＬ１）は符号化段階ではより高い空間レベルの予測に使用され、復号段階では現空間レベルとそれより高い空間レベルのポイントの再生に使用される。

それに対し、第２のエンハンスメント・サブレイヤ（ＥＬ２）は現空間レベルのポイントの再生のみに使用される。この第２のエンハンスメント・サブレイヤはデッド・サブストリーム（dead sub-stream）を表す。

図９は、各データレイヤが、本発明が提案する追加のサブストリームＥＬ２に加えて、少なくとも１つのエンハンスメント・サブレイヤＥＬ１を含む、実施形態の特別な例を示していることに注意する。無論、特定の空間レベルの特定のデータレイヤが基本サブストリームＢＬ（本発明はこれにデッド・サブストリームを単一のエンハンスメントサブレイヤＥＬで追加する）の形でのみ符号化されることも可能である。

デッド・サブストリームが符号器によって所与の空間解像度ｎのデータレイヤに追加されるとき、このことは復号時にそのデッド・サブストリームが活用できるように特定の情報をトータルデータストリームに挿入することによって報告される必要がある。

ここでは次に、トータルデータストリームにおけるデッド・サブストリームの存在に関する特定の情報を挿入する例を提示する。まず最初に、ＭＰＥＧ−２１のＳＶＭの枠組みで提案されたデータストリームの構造を思い起こす。

ＳＶＭの実装では、ストリームはＮＡＬ（network adaptation layers）と呼ばれる情報エンティティとして構造化される。ＮＡＬはＨ２６４標準（ITU-T and ISO/IEC JTC1, "Advanced Video Coding for Generic Audiovisual Services," ITU-T Recommendation H.264-ISO/IEC 14496-10 AVC, 2003）に準拠した搬送単位（transportation unit）である。これはヘッダおよび整数バイトのデータバイト（“ペイロード（payload）”とも称される）を含むパケットである。

ＮＡＬのヘッダはＮＡＬのタイプを限定するために使用することができるタイプバイト（type byte）を含む。ペイロードデータフィールドは、サブバンド画像または画像の一部に対する、空間レベル、時間レベルおよび品質レベル（基本レベルまたはＦＧＳレベル）の符号化に対応するストリームを搬送するために使用される。ＳＶＭシンタックス（syntax）では、ＮＡＬはいくつかのタイプに分かれることがある。特に、タイプ２０と２１は、そのサブストリームが画像（イントラまたは非イントラ）のエンハンスメント・サブストリームであるＮＡＬを記述するために確保されている。

デッド・サブストリームのストリームへの導入は図９を参照してここで既に説明した追加のエンハンスメント・サブストリーム（サブレイヤＥＬ２）の導入に相当することから、このデッド・サブストリームはＮＡＬで送信される。ＶＭＳのシンタックスによってその用途がまだ指示されていないあらゆるＮＡＬタイプ（例えばタイプ２２または２３）はデッド・サブストリームを搬送するＮＡＬを指定するために使用することが可能である。

本発明の別の代わりの実施形態では、レベルｎのレイヤのデッド・サブストリームと、存在する場合にはエンハンスメント・サブストリームを、同じＮＡＬで搬送することを想定することも可能である。言い換えると、サブレイヤＥＬ１およびＥＬ２は同じＮＡＬに一緒にグループ化され、追加の情報はサブストリームＥＬ１およびＥＬ２の間のブレークポイント（区切り点）がＮＡＬのどこに位置するかを示す。

図１０と図１１を参照する以下の記述は、エクストラクタ（extractor）とも呼ばれる、画像品質適応モジュールの動作原理を中心とする。斯かるエクストラクタは符号器の出力の直後、復号器の直前、またはカスタマがそれを通じて符号化データストリームにアクセスする伝送ネットワークの任意のポイントに配置できることを思い起こされたい。このエクストラクタのおかげで、トータルストリームから、最終的なカスタマにとって不要な特定のデータを抽出することができる。より具体的には、ＳＶＭのエクストラクタは各ＮＡＬの特性（空間レベルと時間レベル、ＦＧＳ）を調べ、所与のビットレートおよび所与のフォーマット（または空間時間解像度）での復号に使用されるＮＡＬを保持またはトランケート（truncate、切り捨て）する。

本発明によれば、デッド・サブストリームを導入することで、エクストラクタによるＮＡＬのヘッダの読み出し（reading）は次のように修正される。
nivSpatialDecを復号で要求される空間解像度のレベル、
nivSpatialNALを現ＮＡＬの空間解像度レベル、
typeNALを現ＮＡＬのタイプとすると、
If((typeNAL==22 || typeNAL==23)and nivSpatialDec == nivSpatialNAL)[Extraction of the NAL]

言い換えると、エクストラクタの働きは、トータルデータストリームから、復号で達成されるべき空間解像度レベルのデッド・サブストリームを搬送するＮＡＬも抽出するように修正される。図１０および図１１に、２つの連続する空間解像度のレベルＣＩＦおよびＱＣＩＦのみを考えたときに、それぞれＣＩＦおよびＱＣＩＦフォーマットの動画像列を抽出するための２つの抽出例を提示する。

ＣＩＦフォーマットでの画像の再生に、復号器は２つの空間レベルの基本サブストリーム（ＢＬＱＣＩＦおよびＢＬＣＩＦ）、２つの空間レベルの第１のエンハンスメント・レイヤ（エンハンスメント・レイヤＥＬ１ＱＣＩＦおよびエンハンスメント・レイヤＥＬ１ＣＩＦ）、並びにＣＩＦレベルの第２のエンハンスメント・レイヤ（エンハンスメント・レイヤＥＬ２ＣＩＦ）を使用する。このとき、エクストラクタは、トータルストリームから、図１０に示された１セットのサブレイヤをそれらを修正ストリーム（modified stream）に挿入するためにこの順序で抽出しなければならない。そのポイントの再生に使用されるビットレートに応じて、異なるサブレイヤが復号されることがある。すなわち、対応するサブストリームは一部分のみトランケート（truncate、切り捨て）されることがある（例えば、エンハンスメント・サブストリームＥＬ１ＣＩＦの部分的復号、そして本ケースではデッド・サブストリームＥＬ２ＣＩＦはビットレートがそれを許さないときは使用されない）。

ＱＣＩＦフォーマットでの再生に、復号器は、図１１に示すように、ＱＣＩＦレベルの基本サブストリーム（基本レイヤＢＬＱＣＩＦ）、ＱＣＩＦレベルの２つのエンハンスメント・サブストリーム（エンハンスメント・レイヤＥＬ１ＱＣＩＦおよびエンハンスメント・レイヤＥＬ２ＱＣＩＦ）を使用する。この場合も同じように、異なるレイヤＢＬＱＣＩＦ、ＥＬ１ＱＣＩＦおよびＥＬ２ＱＣＩＦがＱＣＩＦフォーマットでの画像の再生に割り当てられたビットレートに応じてトランケート（truncate、切り捨て）されることがある。

図１８に斯かるエクストラクタまたは品質抽出モジュールの単純化された構造を示す。このエクストラクタまたは画像品質抽出モジュールは、メモリＭ１８０と、例えばマイクロプロセッサを搭載しておりコンピュータプログラムＰｇ１８２によって駆動される処理装置１８１とから構成される。初期化の際、コンピュータプログラム１８２のコード命令が処理装置１８１のプロセッサで実行される前に例えばＲＡＭにロードされる。処理装置１８１は入力側において、連続する解像度レベルｎの階層構造に従って編成された圧縮データストリーム（compressed data stream）８３を受信する。データストリーム８３から、マイクロプロセッサμＰは、コンピュータプログラムＰｇ１８２の命令に従って、（例えば目標端末の特性と所望の再生品質に応じて）復号で使用されない全てのサブストリームを抽出する。処理装置１８１は、カスタマ端末の処理能力または伝送ネットワークの制約条件に適応した修正されたデータストリーム１８３を出力する。

デッド・サブストリームがタイプ２２または２３タイプＮＡＬ（typeNAL）によって搬送される本発明の代わりの実施形態では、ＭＥＰＧ−２１ＳＶＭモデルのコンテクストで提案された復号器は次のようにタイプ２２または２３モジュールを復号するよう修正されなければならない。
If (typeNAL == 20 || typeNAL == 21 || typeNAL == 22 || typeNAL == 23) [Decode NAL]

ここでは次に、図１２〜図１６を参照して、デッド・サブストリームの挿入に加えて、空間レイヤにおける画像品質の適応選択を実行する本発明の実施の一形態を説明する。連続するレベルｎのデータレイヤにおける画像品質の適応選択のおかげで、復号で達成されるべき各ビットレートポイントごとに、最適な抽出経路、すなわちビットレート・歪の点でポイントのベストな再構築を実現する経路、を指定することができる。本発明の本変形は情報セルをトータルストリームに指定・挿入することに基づく。

適応型抽出経路を使用することで以下のように本発明の抽出技術が更に改善される。
・各空間時間解像度レベルＮごと（すなわち各ビットレート／歪曲線ごと）のいくつかのビットレートポイントに対して、最小値ＱＮｍｉｎと最大値ＱＮｍａｘの間に含まれるそれらの品質を表す値の計算が行われる。この計算は、
・・各空間解像度レイヤの符号化の時点、または、
・・異なる空間レベルの全てのレイヤの符号化の後、
のいずれかで行われる。
・トータルストリームに、復号作業に先立つ抽出においてこの品質測定値を取り出すことを可能にする情報が挿入される。これは、
・・この情報を符号化ストリーム自体のデータエンティティ、すなわち基本ストリームまたはエンハンスメント・サブストリームを搬送するＮＡＬ、に挿入することによって、または、
・・この情報を符号化ストリームのデータエンティティとは別のエンティティに挿入することによって、
のいずれかで行われる。
・空間レベルｎの品質Ｑに相当するビットレートポイントＲの抽出の時に、ｎより低いレベルのデッド・サブストリームが使用されないようにして、この品質に相当するデータエンティティがｎ以下の全ての空間レベルに対して抽出される。

従って、本変形によれば、各画像ごとに独立なサブストリームが生成される。これらのサブストリームの各ストリームは、各画像ごとに、所与の画像品質および／またはビットレートを取得することを可能にするトランケーション（打ちきり：truncation）ポイントを決定するために走査される。最終的なストリームはそれゆえある一定量の画像品質“レベル”から成る。

図１２に最適な抽出経路の適用に基づく本発明の本変形によって引き起こされる予測／抽出メカニズムの修正点をより詳しく示す。この場合も同様に、ここでの説明は２つの連続する空間時間解像度ＱＣＩＦおよびＣＩＦの特別なコンテクストで行われる。本説明ではこれら２つのレベルに関連するビットレート／歪曲線を考える。図中、ｘ軸はビットレート（ｋｂｐｓ）、ｙ軸はＰＳＮＲ（ｄＢ）を示している。

レベルＮ−１（ＱＣＩＦ）曲線３０上の利用可能な４つのポイントＰ１、Ｐ２、Ｐ３およびＰ４を考える。これら４つのポイントＰ１〜Ｐ４はレベルＮ曲線（ＣＩＦ）に対する可能な予測変数（predictors）と見なされる。

従って、ポイントＰ１は、予測によって、曲線Ｃ１を得るために使用することができる。それに対し、曲線Ｃ２とＣ３はそれぞれポイントＰ２とＰ３から予測によって導き出される。曲線３１はＱＣＩＦレベルの最大ビットレートポイントＰ４から予測によって得られる曲線に対応し、それゆえ、先行技術のＭＰＥＧ−２１ＳＶＭ符号器から得られるＣＩＦレベル曲線を表す。

異なる曲線Ｃ１〜Ｃ３から、ＱＣＩＦ曲線３０の、各目標ビットレートに対応する、（ビットレート／歪の意味で）ベストな予測ポイントを選択することが可能である。例えば、ビットレート１２８ｋｂｐｓにおける最小歪みは曲線Ｃ１上で得られ、その結果、１２８ｋｂｐｓビットレートポイントが予測ポイントＰ１からベストに予測される。同様に、１９２ｋｂｐｓビットレートポイントの最小歪みは曲線Ｃ３上で得られ、その結果、このビットレートポイントは予測ポイントＰ３からベストに予測される。

このようにして、上記アルゴリズム（符号器で使用されるものとは異なる場合がある）に従って理解されるように、レベルＮ（ＣＩＦ）曲線のポイントによって、そして（ＱＣＩＦ）レベルＮ−１曲線のその最適予測変数（optimal predictor）によって形成される“品質（quality）”曲線が得られる。

最適処理経路は符号器レベルにおける追加の処理ステップによって決定される。既にここで示したように、このステップは符号化の際に実行することができる、あるいはそれはデータ符号化／圧縮作業の後に実行されるので符号器とは独立している場合がある。

次に、図１３を参照して、符号器またはポストプロセッサにおいて実行されるビットレートポイントに関連する品質の計算の例をより詳しく説明する。

ＮＡＬで配信される複数の品質レベル（すなわち基本レベルおよび１つ以上のエンハンスメントレベルまたは改善レベル）に細分（sub-divide）される利用可能な１セットの“画像”（残差であろうがなかろうが）を用意する。ＮＡＬＮ_iは歪みＤ_i ⁿに対するビットレートＲ_i ⁿを生成する（主にエンハンスメント・サブストリームに適用される）サブポイントｎ_iでトランケート（truncate）されると仮定する。また、単純化のため、歪み（distortion）の測定値は加法的であると仮定する。

議論される空間時間解像度レベルに対して達成可能な最大ビットレートの制約条件付きで、歪みを最小化するために、画像のＮＡＬをｉ個のポイントｎ_iλに再分割する最適な方法が探索される。そのために画像における次の量を最小化する試みがなされる。

実際には、一定数の可能なトランケーション・ポイント（例えばｋ個のポイント、しかしエントロピー符号器の各ラン（run）の最後は余りが出るように（non-exhausitively））が各ＮＡＬごとに指定される。

図１３に示すように、画像全体に対して１セットの情報エンティティＮＡＬから得られるポイントの集団１３０を考える。図中、ｘ軸はビットレートを表し、ｙ軸は歪みを表している。最初に、議論される空間時間解像度のビットレート・歪曲線に属するこの集団のポイント１３０は特に文書David Taubman著"High Performance Scalable Image Compression with EBCOT"に記述された技術に基づいて決定される（詳細はこの文書を参照されたい）。それゆえ所与の空間時間解像度のこれらのポイントが含まれる凸包１３１の探索が行われる。

λの所与の値に対して、すなわち所与の品質（quality）に対して、アルゴリムは次のようになる。

次に、曲線の各特定されたポイントごとに、ビットレート値ΔＲ_i ^jおよびこのポイントにおける勾配の値Ｓ_i ^j＝ΔＲ_i ^j／ΔＤ_i ^jが記憶される。

これらの異なる品質レベルが復号の際に活用できるようにするため、すなわち、達成すべき品質レベルに関係する特定のポイントにおいてＮＡＬのトランケーション（truncation）を行うことができるようにするため、デッド・サブストリームを特定する情報に加えて、これらの品質レベルの特定を可能にする、第２の特定の情報をトータルデータストリームに記録することが必要である。

このために、本発明は２つの実施形態を提案する。１つの実施形態では、トランケーション（truncation）ポイントを設定するときに選ばれるポイントに関連するペア（ビットレート、品質）がデータＮＡＬ（すなわち、基本サブストリームとエンハンスメント・サブストリームを搬送するＮＡＬ）に直接記憶される。もう１つの実施形態では、これらのペアは情報ＮＡＬと呼ばれる特定のＮＡＬに記録される。あるポイントに関連する品質Ｑ_iは勾配Ｓ_i ^jの関数（Ｑ_i＝ｆ（Ｓ_i ^j））として計算される。

図１４に示した第１の実施形態では、データＮＡＬ１４０のヘッダ１４１とペイロードデータフィールド１４２との間に疑似ヘッダ（pseudo header）１４３が挿入される。この疑似ヘッダ１４３は、図１３のtroncatureポイントの探索の際に特定される異なる品質レベルに関するポインタを（例えばオフセット値の形で）含む。ポインタ（オフセット）はビットレート値に相当し、品質の値Ｑ₁、Ｑ₂〜Ｑ₄に対応するとともに、図１４においてペイロードデータフィールドを指す矢印によって表される。

図５に示した第２の実施形態は、トータルストリームのデータＮＡＬ１５１内の品質レベルの特定を可能にする、情報ＮＡＬ１５０として知られる新しいタイプのＮＡＬを使用する。データＮＡＬ１５１と同様に、この種の情報ＮＡＬ１５０は、ヘッダ１５２とペイロードデータフィールド１５３を含む。例えば、１０個の異なる品質レベルＱ₁〜Ｑ₁₀を提案することが望まれるときには、ペイロード１５３に１０個の整数を含む情報ＮＡＬが構築される。各整数はデータＮＡＬ１５１のペイロードデータフィールド１５４におけるオフセットを示す。

動画像列を品質レベルＱ_extで再生することが望まれるときには、必要なデータがトータル圧縮ストリームから抽出される。このために、エクストラクタ（または画像品質適応モジュール）は、各ＮＡＬごとに、レベルＱ_extに最も近い品質レベル（すなわち品質Ｑ_ext以下の品質レベル）の探索を実行する。

図１６に連続する品質レベルにおける画像の構造の一例を示す。７つの画像１６１〜至１６７を考える。最初の３つの画像１６１〜１６３はＱＣＩＦ解像度フォーマットにあり、最後の４つの画像１６４〜１６７はＣＩＦフォーマットにある。これらの画像の各画像は、基本サブストリームＢＬ１６８、第１のエンハンスメント・サブストリームＥＬ１１６９、およびデッド・サブストリームに対応する第２のエンハンスメント・サブストリームＥＬ２１７０の形で符号化される。５つの連続する品質レベル１７１〜１７５はこれらの画像の各画像内で区別することができる。これらの品質レベルは画像再生データを搬送する情報エンティティまたはＮＡＬのトランケーション（truncation）ポイントに対応する。

図１６から分かるように、最低品質レベル１７１は基本サブストリームＢＬ１６８に対応する。第１のエンハンスメント・サブストリームＥＬ１を復号することで中間品質レベル１７３を達成することができ、デッド・サブストリームＥＬ２１７０を復号することで最大品質レベル１７５を達成することが可能となる。

従って、ＣＩＦ復号には、エクストラクタから要求される品質がＱ_ext＝３であれば、下位３つの品質レベル１７１、１７２および１７３が各画像に全部使用される。これとは対照的に、エクストラクタから要求される品質がＱ_ext＝４であれば、下位３つの品質レベル１７１、１７２および１７３が各ＣＩＦおよびＱＣＩＦサブバンドごとに全体的に復号され、ＣＩＦに対しては品質レベル１７４も復号される。

品質レベルに基づくこの代わりの実施形態では、エクストラクタまたは画像品質適応モジュールは情報エンティティのトランケーション（truncation）を再生に望まれる品質レベルに対する最適ポイントにおいて実行する（このトランケーションは画像またはサブバンドによって適応的であることに留意する）。それゆえ復号器は“ベスト”ポイントで事前にトランケートされたＮＡＬを受信し、それに対して行うべき残りの全ては動画像列を再生するために復号することである。

図１９にこの種の復号器（デコーダ）の単純化した構造を示す。この復号器は、メモリＭ１９０と、例えばマイクロプロセッサを搭載しておりコンピュータプログラムＰｇ１９２によって駆動される処理装置１９１とから構成される。初期化の際、コンピュータプログラム１９２のコード命令が処理装置１９１のプロセッサで実行される前に例えばＲＡＭにロードされる。処理装置１９１は、入力側で、復号すべき１セットのデータパケットまたは情報エンティティ、例えば達成すべき再生品質に応じて最適なビットレートポイントで切り捨てられた１セットのＮＡＬを受信する。処理装置１９１のマイクロプロセッサμＰは、プログラムＰｇ１９２に命令に従って、受信された情報エンティティ１８３を復号する。処理装置１９１はカスタマの表示端末の処理能力に適応した再生された動画像列１９３を出力する。

先行技術に関連して述べた、ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに係る、本明細書に記載の文書Ｎ６７１６に記述されたＭＰＥＧ−２１ＳＶＣのブロック図である。先行技術に関連して述べた、ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに係る、図１の符号器から得られる異なるビットレート・歪曲線を示す図である。先行技術に関連して述べた、ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに係る、図２と同じタイプのビットレート／歪曲線を基礎にしてＭＰＥＧ−２１のＳＶＭモデルによって提案された予測／抽出メカニズムを説明するための図である。先行技術に関連して述べた、ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに係る、図１の符号器によるデータレイヤの処理の順序を示す図である。先行技術に関連して述べた、ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに係る、ＭＰＥＧ標準に定められた埋込抽出経路の原理を説明するための図である。先行技術に関連して述べた、ＭＰＥＧ−２１ワーキンググループのＳＶＭモデルに係る、復号に先立つ抽出におけるデータレイヤの処理の順序を示す図である。ビットレート・歪曲線の形で、解像度レベルｎにおけるデッド・サブストリームの挿入原理を説明するための図である。本発明の符号器のブロック図である。図８の符号器によって実行されるデータの、デッド・サブストリームが挿入される編成を示す図である。ＣＩＦおよびＱＣＩＦフォーマットからの抽出の一例を示す図である。ＣＩＦおよびＱＣＩＦフォーマットからの抽出の別の例を示す図である。デッド・サブストリームに加えて、画像がその再生の際に使用される連続する品質レベルに細分される本発明の実施の一形態による、図３の予測／抽出メカニズムの変更点を説明するための図である。デッド・サブストリームに加えて、画像がその再生の際に使用される連続する品質レベルに細分される本発明の実施の一形態による、画像に関連するサブストリームにおけるトランケーション（truncation）ポイントの設定原理を説明するための図である。デッド・サブストリームに加えて、画像がその再生の際に使用される連続する品質レベルに細分される本発明の実施の一形態による、ストリームに挿入された品質情報を搬送する情報エンティティまたはＮＡＬの構造の一例を示す図である。デッド・サブストリームに加えて、画像がその再生の際に使用される連続する品質レベルに細分される本発明の実施の一形態による、ストリームに挿入された品質情報を搬送する情報エンティティまたはＮＡＬの構造の別の例を示す図である。デッド・サブストリームに加えて、画像がその再生の際に使用される連続する品質レベルに細分される本発明の実施の一形態による、連続する品質レベルにおける画像の構造の一例を示す図である。本発明の符号器の略構成図である。本発明の画像品質適応モジュールの略構成図である。本発明の復号器の略構成図である。

Claims

画像または画像列を符号化するための符号化方法であって、
ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有するデータストリームを生成し、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤを、少なくとも前記レベルｎレイヤから予測符号化するステップを含み、
前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、このとき、
当該符号化方法は更に、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記解像度レベルｎにおいて前記画像を前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームを符号化するとともに、
前記レベルｎレイヤの前記デッド・サブストリームは、ｎとは異なるレベルの前記レイヤの前記予測符号化ステップには使用されない、ことを特徴とする符号化方法。
前記レベルｎデータレイヤは、前記解像度レベルｎで前記画像を基本品質で再生することを可能にする少なくとも１つの基本サブストリームと、前記レベルｎデータレイヤの少なくとも１つのレイヤに対しては、前記基本品質の画像の精細化を可能にする少なくとも１つのエンハンスメント・サブストリームと、の形で符号化されるとともに、
前記所定の最大品質は、
前記エンハンスメント・サブストリームが符号化されない場合は、前記基本品質であり、
少なくとも１つのエンハンスメント・サブストリームが符号化される場合は、前記少なくとも１つの上位品質である、ことを特徴とする請求項１に記載の符号化方法。
前記データストリームに、このデータストリーム内の前記少なくとも１つのデッド・サブストリームを識別するために使用される少なくとも１つの情報を挿入する第１のステップを更に含むことを特徴とする請求項１または２に記載の符号化方法。
前記画像の少なくとも一部の画像に対して、前記データストリームに、前記レイヤの少なくとも一部のレイヤの少なくとも一部のデータに関連する再生品質に関する少なくとも１つの情報を挿入する第２のステップを更に含み、前記再生品質は少なくとも１つのビットレート／歪みパラメータの関数であることを特徴とする請求項１から３のいずれかに記載の符号化方法。
画像または画像列を符号化するための符号器であって、
ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有するデータストリームを生成するための手段と、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤを、少なくとも前記レベルｎレイヤからの予測によって符号化するための手段と
を含み、
レベルｎの前記データレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、このとき、
当該符号器は、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記解像度レベルｎにおいて前記画像を前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームを符号化するための手段を更に含み、
前記レベルｎレイヤの前記デッド・サブストリームはｎとは異なるレベルの前記レイヤの予測による前記符号化手段には使用されない、ことを特徴とする符号器。
前記レベルｎレイヤ内から、前記レベルｎ＋１レイヤの予測符号化の際に考慮しなければならないデータの抽出を可能にする予測ポイント抽出モジュールを更に含むことを特徴とする請求項５に記載の符号器。
画像または画像列を表すデータストリームを復号するための復号方法であって、
前記データストリームは、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有し、
前記データストリームの前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤは、少なくとも前記レベルｎレイヤから予測符号化されており、このとき、
前記データストリームは、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記解像度レベルｎにおいて前記画像を前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームを含み、
当該復号方法は、前記解像度レベルｎで前記画像を再生するため、
ｎより低いレベルの前記データレイヤを復号するステップと、
許された復号ビットレートに応じて、前記レベルｎレイヤと、場合によっては、前記レベルｎレイヤの前記デッド・サブストリームを、少なくとも部分的に復号するステップとを含み、
ｎより低いレベルの前記レイヤの前記デッド・サブストリームは前記再生の際に復号されない、ことを特徴とする復号方法。
画像または画像列を表すデータストリームを復号するための復号器であって、
前記データストリームは、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有し、
前記データストリームの前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤは、少なくとも前記レベルｎレイヤから予測符号化されており、このとき、
前記データストリームは、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記解像度レベルｎにおいて前記画像を前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームを含み、
当該復号器は、前記解像度レベルｎで前記画像を再生するため、
ｎより低いレベルの前記データレイヤを復号するための手段と、
許された復号ビットレートに応じて、前記レベルｎレイヤと、場合によっては、前記レベルｎレイヤの前記デッド・サブストリームを、少なくとも部分的に復号するための手段とを含み、
ｎより低いレベルの前記レイヤの前記デッド・サブストリームは前記再生の際に復号されない、ことを特徴とする復号器。
画像または画像列を表すデータストリームを伝送するための信号であって、
前記データストリームは、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有し、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤは、少なくとも前記レベルｎレイヤから予測符号化されており、
前記データストリームの前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、
当該信号は、前記データストリームがその中で搬送される情報エンティティの形で構造化されており、
前記情報エンティティの各エンティティは、前記情報エンティティのタイプに関する情報を提供するヘッダと、ペイロードデータフィールドとを含み、このとき、
当該信号は、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記画像を前記解像度レベルｎにおいて前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームも搬送し、
レベルｎの前記デッド・サブストリームはｎとは異なるレベルの解像度での前記画像の再生には使用されない、ことを特徴とする信号。
当該信号は、前記ストリームの少なくとも一部のデータに関連する再生品質に関する少なくとも１つの情報を含む特定のタイプの少なくとも１つの情報エンティティを更に含み、前記再生品質は少なくとも１つのビットレート／歪パラメータに依存する、ことを特徴とする請求項９に記載の信号。
マイクロプロセッサによって実行されるときに請求項１から４のいずれかに記載された符号化方法を構成するステップを実行するためのプログラムコード命令を含むコンピュータプログラム。
マイクロプロセッサによって実行されるときに請求項７に記載された復号方法を構成するステップを実行するためのプログラムコード命令を含むコンピュータプログラム。
画像または画像列の品質を適応させるための画像品質適応モジュールであって、
当該適応モジュールには、画像または画像列を表すソースデータストリームが供給され、
前記データストリームは、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する連続するレベルｎの埋込データレイヤの階層構造を有し、
前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤは、少なくとも前記レベルｎレイヤから予測符号化されており、このとき、
前記ソースデータストリームは、前記レベルｎデータレイヤの少なくとも１つのレイヤに対し、前記画像を前記解像度レベルｎにおいて前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームを含み、
当該適応モジュールは、少なくとも１つの端末が前記画像を表示することを意図して修正されたデータストリームを生成するための手段を含み、
前記修正されたデータストリームは、前記ソースデータストリームから、前記少なくとも１つの表示端末が前記画像を前記解像度レベルｎで再生しない場合には前記レベルｎデッド・サブストリームを抽出することによって得られる、ことを特徴とする画像品質適応モジュール。
画像または画像列を表す少なくとも１つのデータストリームを含むデータ搬送波であって、
当該データ搬送波は、ｎを整数として各レベルｎが前記画像の所定の解像度に対応する前記データストリームの連続するレベルｎの埋込データレイヤを階層的に格納するための構造を有し、
レベルｎ＋１の、前記レイヤの少なくとも１つのレイヤは、少なくとも前記レベルｎレイヤから予測符号化されており、
前記ストリームの前記レベルｎデータレイヤの各レイヤは前記解像度レベルｎにおいて前記画像を所定の最大品質で再生することを可能にし、このとき、
当該データ搬送波は、前記レベルｎデータレイヤの少なくとも１つに対し、前記画像を前記解像度レベルｎにおいて前記所定の最大品質より高い品質で再生することを可能にするデッド・サブストリームと呼ばれる少なくとも１つのサブストリームを格納するための少なくとも１つのゾーンを更に含み、
レベルｎの前記デッド・サブストリームの前記格納ゾーンはｎとは異なるレベルの解像度で前記画像を再生する際には読み出されない、ことを特徴とするデータ搬送波。