次に、本発明の実施の形態について図面と共に説明する。本発明は、HD解像度からSD解像度へ空間解像度変換を行う際に、変換対象となるSD解像度の画像領域内に、HD解像度内においてできるだけ本来の画像情報を維持するための領域であるオリジナル領域を設けると共に、HD解像度内の本来の画像情報を多少犠牲にしつつも、可能な限りSD解像度内にHD解像度内の画像情報の特徴を取り込むための領域である歪み領域をオリジナル領域の外側かつSD解像度の画像領域内に設けるものである。
図1は本発明になる空間スケーラブル符号化方法及び符号化装置により空間解像度変換を行う画像領域の一例の説明図を示す。HD解像度の画像領域は、エンハンス領域であるものとする。図1では、エンハンス領域を定義するために、領域11の左上の座標をE(XE,YE)、横方向の大きさをWE、縦方向の大きさをHEとする。換言すると、領域11は、HD解像度の画像領域であり、エンハンス領域である。
また、SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域12の左上の座標をC(XC,YC)、横方向の大きさをWC、縦方向の大きさをHCとする。換言すると、領域12は、SD解像度の画像領域であり、クロッピング領域である。更に、オリジナル領域を定義するために、領域13の左上の座標をO(XO,YO)、横方向の大きさをWO、縦方向の大きさをHOとする。このオリジナル領域13はクロッピング領域12内にある。
このオリジナル領域13は、エンハンス領域11のHD解像度の画像を歪ませずに元のままの縦横比で画像が格納される領域である。これに対し、クロッピング領域12内で、かつ、オリジナル領域13の外側の領域は、オリジナル領域13の外側にあるエンハンス領域11のHD解像度の画像情報を所定のフィルタリング及び縮小処理して歪ませて取り込んだ画像情報の領域(歪み領域)である。すなわち、クロッピング領域12内で、かつ、オリジナル領域13の外側の領域は、HD解像度内の本来の画像情報を多少犠牲にしつつも、可能な限りSD解像度のクロッピング領域12内にHD解像度内の画像情報の特徴を取り込むための歪み領域である。
図2は本発明の空間スケーラブル符号化方法及び符号化装置により用いる空間解像度変換によって一般的な横1920画素、縦1080画素のHD解像度から、横720画素、縦480画素のSD解像度へ空間解像度変換を行う処理過程を示す。また、図3は本発明の空間スケーラブル符号化方法及び符号化装置により用いる空間解像度変換方法の一例の処理説明用フローチャートである。この図2と図3を用いて本発明の一実施の形態で用いる空間解像度変換の処理過程を以下に説明する。
まず、高精細なHD解像度の画像フレームを取得する(図3のステップS101)。図2(A)に21で示すHD解像度の全画像領域をエンハンス領域(図1の11に相当)とする。続いて、このエンハンス領域21内のクロッピング領域(図1の12に相当)を特定する(図3のステップS102)。このステップS102では、図2(A)に点線で示されるように、SD解像度の画像領域を2.25倍することでクロッピング領域の縦の大きさをHD解像度の画像領域の縦の大きさに合わせる。また、クロッピング領域の横方向に対しては所定の位置とすることで、エンハンス領域21内に図2(A)に点線の四角形で示されるクロッピング領域22を設定する。
ここでは、図2(A)に点線の四角形で示すように、クロッピング領域22をクロッピング領域の外側の領域が均等になるように配置している。これは、一般に画面内の中央付近に映像としてより重要な内容が含まれることを想定した場合に相当する。ただし、クロッピング領域の配置は、エンハンス領域21内であれば特に限定されるものではなく、SD解像度に変換した際に、より映像の特徴を残すことができる位置に配置することが望ましい。
次に、画像情報を維持するためのオリジナル領域(図1の13に相当)の形状を特定する(図3のステップS103)とともに、オリジナル領域を設定する(図3のステップS104)。ここでは、オリジナル領域の形状は矩形とし、オリジナル領域を図2(B)に23で示す位置に設定している。なお、オリジナル領域の形状は、図4に示されるような形状モードIDが与えられることにより特定することができるようにするとよい。このオリジナル領域23の配置は、クロッピング領域22内であれば特に限定されるものではない。
次に、歪み領域を設定する(図3のステップS105)。ここでは、クロッピング領域外に存在する通常であれば情報が欠落してしまう領域の分だけクロッピング領域側に折り返した分の領域を歪み領域とする。すなわち、クロッピング領域22内で、かつ、オリジナル領域23の外側の2つの領域が歪み領域(後述の図2(C)の26,27に相当)に設定される。これにより、図2(B)に示すように、オリジナル領域23の外の左側の領域24の画像情報と、オリジナル領域23の外の右側の領域25の画像情報とが、それぞれの歪み領域(後述の図2(C)の26,27に相当)に格納される縮小処理対象となる。
続いて、この縮小処理対象となる領域24,25の画像情報に対して、縮小方法を特定し(図3のステップS106)、横方向に対する所定の空間フィルタリング処理及び縮小処理を行い(図3のステップS107)、その結果を歪み領域に格納する(図3のステップS108)。このような処理を行うことで、図2(C)に示すように、オリジナル領域23と、歪み領域26及び27とからなるクロッピング領域22を生成する。
この図2(C)に示すクロッピング領域22は最終目標であるSD解像度の領域の縦,横ともに2.25倍した領域であることから、このオリジナル領域23と、歪み領域26及び27とからなるクロッピング領域の画像情報に対して所定の空間フィルタリング及び縮小処理により1/2.25倍に縮小する処理を行うことで、図2(E)に示すように、オリジナル領域28及び歪み領域31,32で構成される最終目標である、空間解像度変換後のSD解像度の大きさの画像を得ることができる(図3のステップS109)。
なお、上記の説明では、図2(B)に示したオリジナル領域23の外側の領域24、25の画像情報に対して縮小処理を行うものとして説明したが、図2(B)に示した全体の画像領域の画像情報に対して所定の空間フィルタリング及び縮小処理を行い、1/2.25倍に縮小して、図2(D)に示すような領域28,29,30からなる縮小画像を得た後、その縮小画像のオリジナル領域28の外側の領域29、30の画像情報に対して所定の空間フィルタリング及び縮小処理を行い、その結果を歪み領域31、32に格納することで、図2(E)に示した、オリジナル領域28及び歪み領域31,32で構成される最終目標である、空間解像度変換後のSD解像度の大きさの画像を得るようにしてもよい。
更に、以上の実施の形態では、いずれも歪み領域については2段階の縮小処理を行っているが、図2(B)に示す全領域の画像情報のうち、オリジナル領域23の外の左側の領域24の画像情報と、オリジナル領域23の外の右側の領域25の画像情報に対しては、横方向及び縦方向に対して同時に1段階の所定の空間フィルタリング及び縮小処理を行い、その結果を同図(E)に示す歪み領域31、32に格納すると共に、オリジナル領域23に対しても1回の所定の空間フィルタリング及び縮小処理を行うことにより1/2.25倍に縮小する処理を行って同図(E)に示すオリジナル領域28を得るようにしてもよい。
このような処理を行うことで、オリジナル領域28に対しては従来のクロッピング処理と同等の画像品質を維持し、従来のスクイーズ処理によるHD解像度からSD解像度への変換で生じていた画像全体の歪みは視覚上重要なオリジナル領域28では発生せず、視覚的な影響を軽減できる。更に、上記の実施の形態では、歪み領域31、32に対してはクロッピング領域以外のエンハンス領域に含まれる画像情報を最も少ない劣化で格納することができ、従来のクロッピング処理では欠落していたクロッピング領域外の画像情報をクロビング領域内に反映することができる。
次に、本発明の空間スケーラブル符号化方法及び符号化装置で用いる空間解像度変換における縮小方法について説明する。図5は所定の空間フィルタリングを行った後の縮小処理、つまり画素の再配置の様子の一例を示す。ここでは説明を簡単にするため、図2のような空間解像度変換を行うものとする。図5において、オリジナル領域と歪み領域との境界を原点とし、クロッピング領域の境界までの長さをB、エンハンス領域の境界までの長さをAとしている。図2の例では、同図(B)に示す領域23や24の横方向の長さをA、同図(C)に示す歪み領域26や27の横方向の長さをBであるとする。また、一般的には、図1のように、オリジナル領域13と歪み領域との境界を基準として、DEO1,DEO2,DEO3,DEO4は上記のAに対応し、DCO1,DCO2,DCO3,DCO4は上記のBに対応する。
図5において、41は、区間Aの領域に含まれる画素の位置を区間Bの領域に含まれる画素に再配置を行うための変換式の一例である。変換式41の定義域は42に示すものとする。変換式41中のγが”1”の場合は、図5(A)に43で示す特性の変換及び同図(B)に示すような変換となる。上記のγが”1”よりも小さくなるにつれて、図5(A)に示す特性44及び同図(C)、同図(A)に示す特性45及び同図(D)といったように、オリジナル領域と歪み領域との境界である原点から離れるにつれて縮小率が変化するように画素を再配置することができる。
また、所定の空間フィルタリングで用いられる手法としては、一般には、下記の数1で表わされるフィルタ特性のLanczos2,あるいは下記の数2で表わされるフィルタ特性のLanczos3などを用いる。
なお、所定の空間フィルタリングで用いられる手法としては、上記以外の周波数変換に基づく縮小方法、ローパスフィルタを利用した手法であっても構わず、本発明において特に限定されるものではないことに注意する。
次に、オリジナル領域に隣接する領域に対する解像度変換処理の様子について説明する。図6(A)、(B)、(C)、(D)は、オリジナル領域の上側、下側、左側、右側の領域に対する解像度変換処理の様子を示す。図6(A)に示すオリジナル領域13の上側に存在する領域52が歪み領域であり、領域51,52に含まれる画像に対して、所定の空間フィルタリング及び縮小処理を行うことで、歪み領域52に格納する。すなわち、図6(A)に51,52で示すようにオリジナル領域13の外の上側の画素領域に対して、歪み領域52に収まるように所定のフィルタリングによる縮小処理を行い、歪み領域52に格納する。
また、図6(B)に示すオリジナル領域13の下側の領域53及び54、同図(C)に示すオリジナル領域13の左側の領域55及び56、同図(D)に示すオリジナル領域13の右側の領域57及び58に対しても所定の空間フィルタリング及び縮小処理を行うことで、同様に歪み領域54、56、58にそれらの領域の画像情報を格納する。その後、本来のSD解像度を得るために所定のフィルタリングによる縮小処理を行うことで、HD解像度からSD解像度への変換を行う。
また、図7(A)、(B)、(C)、(D)は、オリジナル領域の左上側、左下側、右上側、右下側の領域に対する解像度変換処理の様子を示す。図7(A)に示すオリジナル領域13の左上側に存在する領域62が歪み領域であり、領域61,62に含まれる画像に対して、所定の空間フィルタリング及び縮小処理を行うことで、歪み領域62に格納する。
また、図7(B)に示すオリジナル領域13の左下側の領域63及び64、同図(C)に示すオリジナル領域13の右上側の領域65及び66、同図(D)に示すオリジナル領域13の右下側の領域67及び68に対しても所定の空間フィルタリング及び縮小処理を行うことで、同様に歪み領域64、66、68にそれらの領域の画像情報を格納する。
また、図8(A)、(B)、(C)、(D)は、オリジナル領域の上側、下側、左側、右側の領域に対する解像度変換処理の様子を示す。図8(A)に示すオリジナル領域13の上側に存在する領域72が歪み領域であり、領域71,72に含まれる画像に対して、所定の空間フィルタリング及び縮小処理を行うことで、歪み領域72に格納する。
また、図8(B)に示すオリジナル領域13の下側の領域73及び74、同図(C)に示すオリジナル領域13の左側の領域75及び76、同図(D)に示すオリジナル領域13の右側の領域77及び78に対しても所定の空間フィルタリング及び縮小処理を行うことで、同様に歪み領域74、76、78にそれらの領域の画像情報を格納する。
ここで、図6のような処理では縦方向及び横方向の処理が別々に行われるため、図7に示した左上側、右上側、左下側、右下側の領域61〜68に対しては空間的なフィルタリング及び縮小処理を行うことで図8で示す領域とは別の処理を行っても構わない。図8で示す領域71〜78に対しては、図6で示したような横方向、縦方向のフィルタリング及び縮小処理を行う。このように、図6のフィルタリング及び縮小処理にてオリジナル領域に隣接する領域に対する解像度変換処理を行うか、図7と図8のフィルタリング及び縮小処理を組み合わせてオリジナル領域に隣接する領域に対する解像度変換処理を行う。
次に、上記の空間解像度変換方法を用いた本発明の空間スケーラブル符号化方法について図9の画像変換の過程を示す図を用いて説明する。まず、空間スケーラブル符号化を行うにあたり、元のHD解像度をもつ画像フレームを利用して、本発明の空間解像度変換処理を図2に示すように行うことで、図2(E)に示すオリジナル領域28及び歪み領域31と32で構成されるSD解像度の大きさの画像フレームを得る。
このオリジナル領域と歪み領域を含むSD解像度の画像フレームをベースレイヤとし、このベースレイヤに対して所定の符号化を行う。エンハンスレイヤは、図9(F)の元のHD解像度を持つ画像フレーム97とする。その後、所定の復号化を行うことで、図9(A)に示すように、オリジナル領域81及び歪み領域82,83で構成されるSD解像度の大きさの復号画像フレームを得る。領域81,82,83は、図2(E)の領域28,31,32に相当する。なお、図9(A)及び(B)にハッチングを付して示す領域は、本来のHD解像度では画像が存在していたが、前述した歪み処理によって必要なくなった存在しない領域を仮想的に示したものである。
このオリジナル領域81及び歪み領域82,83からなる復号画像フレームのクロッピング領域の全体に対して所定の空間フィルタリング及び拡大処理により2.25倍に拡大することで、図9(B)に示すように、拡大されたオリジナル領域89と歪み領域90,91からなる画像フレームのクロッピング領域を得る。その後、歪み領域90,91に対して所定の空間フィルタリング及び拡大処理を行い、その処理結果をオリジナル領域89の外側に格納することで、図9(D)に示すオリジナル領域89と横方向の歪みが解消された領域92,93とからなるHD解像度の画像フレームを得る。
なお、上記の処理の替わりに、図9(A)の歪み領域82,83に対して先に所定の空間フィルタリング及び拡大処理を行い、その処理結果をオリジナル領域の外側に格納することで、同図(C)に示すようなオリジナル領域81と横方向の歪みが解消された領域86,87からなるクリッピング領域の画像フレームを取得し、この画像フレーム全体に対して所定の空間フィルタリング及び2.25倍の拡大処理を行うことにより、同様に図9(D)に示すオリジナル領域89と歪みが解消された領域92,93からなるHD解像度の拡大画像フレームを得るようにしてもよい。
あるいは、以上の歪み領域の2段階の拡大処理に替えて、図9(A)の歪み領域82,83に対して先に所定の空間フィルタリング及び拡大処理を行うと共に、オリジナル領域81に対しては所定の空間フィルタリング及び2.25倍の拡大処理を行うことにより、直接に図9(D)に示したオリジナル領域89と歪みが解消された領域92,93からなるHD解像度の拡大画像フレームを得るようにしてもよい。
その後、ベースレイヤから得られた図9(D)に示す画像フレームと、図9(F)に示すエンハンスレイヤ97との間で階層間の予測符号化を行う。なお、図9(F)中、点線で囲んだ領域97は、クロッピング領域を示す。この階層間の予測符号化によって得られた図9(E)に示すレイヤ間の予測符号情報98に対して所定の符号化を行うことで、エンハンスレイヤの符号化出力を得る。このような処理を行うことで、本発明の空間スケーラブル符号化方法を実現することができる。
また、本発明の空間スケーラブル復号化方法の一実施の形態としては、符号化方法で行ったベースレイヤの復号処理と同様の処理を行うことで、図9(D)に示したオリジナル領域89と歪みが解消された領域92,93からなるHD解像度の拡大画像フレームを得ると共に、エンハンスレイヤの復号処理を行うことで図9(E)に示すレイヤ間の予測符号情報98を得る。その後、ベースレイヤとエンハンスレイヤとの間で階層間の予測復号化を行い、図9(F)に示すクロッピング領域97を復号する。これにより、本発明の空間スケーラブル復号化方法の一実施の形態を実現することができる。
次に、ベースレイヤであるSD解像度からエンハンスレイヤであるHD解像度への、拡大方向の本発明の解像度変換方法の一実施の形態について、更に図10及び図11と共に説明する。図10は拡大方向の本発明の解像度変換方法の一実施の形態の概念図を示す。
図10(A)に示すSD解像度のベースレイヤ画像から同図(D)に示すHD解像度のエンハンスレイヤ画像に拡大方向の解像度変換を行う場合、少なくともエンハンスレイヤ画像の領域707の左上端E1と右下端E2の各座標(XE1,YE1)、(XE2,YE2)と、オリジナル領域706の左上端E3と右下端E4の各座標(XE3,YE3)、(XE4,YE4)、若しくはエンハンスレイヤ画像の2つの領域706、707を特定するためのこれらの座標情報を取得するための代替情報が必要となる。つまり、E3、E4によってエンハンスレイヤ側で対応するオリジナル領域706を特定できる。その周囲の領域707は、歪み領域を元に戻した後の画像を格納する領域である。
また、図10(A)に示すベースレイヤ画像の領域702の左上端B1と右下端B2の各座標(XB1,YB1)、(XB2,YB2)と、オリジナル領域701の左上端B3と右下端B4の各座標(XB3,YB3)、(XB4,YB4)、若しくはベースレイヤ画像の2つの領域701、702を特定するためのこれらの座標情報を取得するための代替情報が必要となる。つまり、B3、B4によってベースレイヤ側のオリジナル領域701を特定できる。その周囲の領域702は、歪み領域である。
なお、座標の基準点は、説明を簡単にするため、E1、B1を(0,0)として説明する。また、B2,B3,B4はB1を基準にした図であるものとする。次に、図11のフローチャートと共に本実施の形態の空間解像度変換動作について説明する。まず、SD解像度のベースレイヤ画像のオリジナル領域の形状を特定するための情報を取得することで、オリジナル領域(図10(A)の701)の形状を特定し(ステップS201)、続いてHD解像度からSD解像度に変換したときに得られるE1、E2、E3、E4、及びB1、B2、B3、B4の座標情報を取得する(ステップS202)。若しくは、エンハンスレイヤ及びベースレイヤに含まれる各領域を特定するための座標情報を取得するための代替情報を取得し、これらの座標を特定する。これらの情報からオリジナル領域を特定する(ステップS203)。
次に、クロッピング領域を特定する(ステップS204)。このステップS204の処理では、説明を簡単にするために図10(B)に示す仮想画像Mを考える。この仮想画像Mの左上端M1と右下端M2によって特定できる領域がエンハンスレイヤ画像内で対応するクロッピング領域となる。そこで、このM1、M2によって特定できる領域の求め方を以下説明する。
まず、ベースレイヤ画像のオリジナル領域701の点B3、B4と、エンハンスレイヤ画像のオリジナル領域の点E3、E4に注目する。これらの点の座標からベースレイヤ画像のオリジナル領域701を、エンハンスレイヤ画像の対応するオリジナル領域706に拡大するための拡大率を算出する。拡大率は点B3、B4及びE3、E4から得られる各領域の対応する辺同士の比から算出する。
求めた拡大率に基づいて、図10(A)のベースレイヤ画像を拡大すると、同図(B)の仮想画像Mのような拡大したオリジナル領域を含むベースレイヤ画像が得られる。拡大処理により、B1はM1、B2はM2、B3はM3、B4はM4に対応する。
しかし、この段階では、図10(B)の点M1、M2、M3、M4は、同図(D)のエンハンスレイヤ画像内のどの部分に対応するかが分からないため、M3とE3、M4とE4の座標が対応するように、仮想画像Mの点M1、M2、M3、M4の座標を平行移動して対応させる。このような処理を行うことで、M1、M2がエンハンスレイヤ画像内のどの位置に対応するかを特定する。このようにして修正したM1、M2の座標をエンハンスレイヤ画像内の対応するクロッピング領域として特定する。
次に、クロッピング領域内で、かつ、オリジナル領域の外側の歪み領域を特定する(ステップS205)。ここでは、図10(D)のE1、E2、E3、E4の関係から歪み領域707を特定する。また、ベースレイヤ画像から歪み領域を先に元に戻す必要がある場合は、E1、E2、E3、E4の座標から特定されるエンハンスレイヤ画像の大きさを仮想画像Mを作成した時の拡大率の逆数により縮小率を算出し、エンハンスレイヤ画像の各座標を縮小率を用いて縮小することで図10(C)に示す仮想画像Nを生成する。
生成した仮想画像Nの左上端N1、右下端N2からなる領域内の点N3、N4によって特定されるオリジナル領域の外側の領域を特定することができる。これらの領域に対して、本実施の形態の解像度変換方法を用いて歪みを元に戻すことができる。
次に、歪み領域に含まれる画像を拡大する際の拡大方法を特定するための情報を取得することで拡大方法を特定し(ステップS206)、その特定した拡大方法によって歪み領域を元に戻すための拡大処理を行う(ステップS207)。歪み領域を元に戻した後の画像をオリジナル領域外に格納する(ステップS208)。これにより、例えば仮想画像Nのオリジナル領域704の外側の領域705に歪み領域の画像情報を元に戻した画像情報が格納される。
最後に、クロッピング領域に含まれる画像を所定の拡大方法により拡大する(ステップS209)。ここでは、仮想画像Mを想定する場合は、ステップS204のクロッピング領域特定ステップにおいてクロッピング領域の拡大を行ってもよい。また、クロッピング領域内に含まれる画像であるベースレイヤ画像内のオリジナル領域に対して拡大処理を行ってもよい。また、仮想画像Nを想定する場合は、ベースレイヤ画像から仮想画像Nを作成するために歪み領域拡大ステップS207を行った後、仮想画像NのN1、N2の座標から特定される縮小後のクロッピング領域に対してステップS208の拡大処理を行う。このときの拡大では、E3、E4、B3、B4の関係から求めた拡大率を利用する。
なお、以上の実施の形態では、説明を簡単にするために図1を用いて本発明で利用する各領域について説明している。この説明において、オリジナル領域は矩形であるものとして話を進めているが、必ずしもオリジナル領域は矩形である必要はない。図12から図17は、オリジナル領域の形状について示した概念図である。
図12は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第1の例の説明図を示す。この例では、オリジナル領域1003として回転を許容した長方形を採用した場合の例である。図1で示されたオリジナル領域13の長方形では、長方形を定義するために左上の座標O(X0,Y0)と、長方形の横の大きさWO,縦の大きさHOを採用していたため、オリジナル領域13に対して長方形を回転させた領域を定義することが難しかった。
そこで、図12の例では、オリジナル領域1003の長方形の中心座標O(X0,Y0)と長方形の左上の座標S1(Xs1,Ys1)を腕の長さとした座標形式で定義する。ここでは、中心座標をO、補助座標をS1としている。なお、図12ではエンハンス領域を定義するために、領域1001の左上の座標をE(XE,YE)、横方向の大きさをWE、縦方向の大きさをHEとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1002の左上の座標をC(XC,YC)、横方向の大きさをWC、縦方向の大きさをHCとする。
図13は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第2の例の説明図を示す。この例では、オリジナル領域1103として円形を採用した場合の例である。この場合も同様に中心座標O、補助座標をS1としている。また、図13ではエンハンス領域を定義するために、領域1101の左上の座標をE(XE,YE)、横方向の大きさをWE、縦方向の大きさをHEとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1102の左上の座標をC(XC,YC)、横方向の大きさをWC、縦方向の大きさをHCとする。
図14は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第3の例の説明図を示す。この例では、オリジナル領域1203として回転を許容したひし形を採用した場合の例である。ひし形の場合、対角線の長さが縦方向と横方向で異なることから、中心座標O、補助座標S1,補助座標S2を定義する。また、図14では、エンハンス領域を定義するために、領域1201の左上の座標をE(XE,YE)、横方向の大きさをWE、縦方向の大きさをHEとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1202の左上の座標をC(XC,YC)、横方向の大きさをWC、縦方向の大きさをHCとする。
図15は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第4の例の説明図を示す。この例では、オリジナル領域1303として回転を許容した楕円形を採用した場合の例である。オリジナル領域1303の楕円形は2つの焦点が必要となるが、他の形状との整合性を保つため中心座標Oを採用し、1つ目の焦点座標を補助座標S1として中心座標Oと補助座標S1からもうひとつの焦点座標を計算することで2つの焦点を特定する。また、楕円上に補助座標S2を定義することで、回転を許容した楕円形を定義することができる。
また、図15では、エンハンス領域を定義するために、領域1301の左上の座標をE(XE,YE)、横方向の大きさをWE、縦方向の大きさをHEとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1302の左上の座標をC(XC,YC)、横方向の大きさをWC、縦方向の大きさをHCとする。
図16は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第5の例の説明図を示す。この例では、オリジナル領域1403として回転を許容した多角形を採用した場合の例である。オリジナル領域1403の中心座標O、補助座標S1を定義することで、まず円形を想定し、円周を等分する距離に補助座標S2を定義することで、回転を許容した多角形を定義することができる。
また、図16では、エンハンス領域を定義するために、領域1401の左上の座標をE(XE,YE)、横方向の大きさをWE、縦方向の大きさをHEとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1402の左上の座標をC(XC,YC)、横方向の大きさをWC、縦方向の大きさをHCとする。
図17は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第6の例の説明図を示す。この例では、オリジナル領域1503として任意形状を採用した場合の例である。オリジナル領域1503は任意形状であるため、中心座標Oと、複数の補助座標S1、S2等を用意することで任意形状を定義する。
ただし、以上のような各種のオリジナル領域の形状は、単に中心座標と補助座標の位置や数からでは判断することが難しい。そこで、オリジナル領域の形状を特定するために、図4のような対応表によって管理するとよい。この対応表は、形状を形状モードIDで番号付けする。また、各形状を表現するために必要な中心座標、補助座標の数を特定するための情報との関連付けが行われている。
このような形状モードIDと、中心座標、補助座標の情報を本発明の解像度変換後の画像フレームとともに伝送することで、歪み領域を元に戻す際にオリジナル領域や歪み領域などを特定することができ、正しくもとの大きさの画像フレームに戻すことが可能となる。また、歪み領域へ格納する際の空間フィルタリング及び縮小処理は、図13に示すようなオリジナル領域の法線方向に対して行うとよい。
次に、本発明の空間解像度変換を用いたスケーラブル符号化装置の構成について説明する。図18は本発明になる空間スケーラブル符号化装置の一実施の形態のブロック図を示す。同図において、画像入力部1602は、入力される高精細な空間解像度をもつHD解像度の画像フレーム1601を取得するための手段と、取得した画像フレーム1601を、ベースレイヤの符号化処理を行うため、以下で説明するクロッピング領域特定部1603に通知するための手段と、エンハンスレイヤの符号化処理を行うため、以下に説明するエンハンス側のME部1619に通知する手段とを備える。
クロッピング領域特定部1603は、ベースレイヤ側の符号化を行う際に利用する、より低い解像度をもつSD解像度の画像フレームを生成するため、画像入力部1602から取得した高精細な空間解像度をもつHD解像度のフレームの中から、クロッピング領域を特定し、クロッピング領域情報を生成するための手段を備える。生成したクロッピング領域情報は、エントロピー符号化部1612に通知して符号化するように構成することが望ましいが、ここでは説明を簡単にするために省略する。
歪み領域特定部1604は、取得したクロッピング領域情報に基づいて、クロッピング領域内にオリジナル領域を設定し、オリジナル領域情報を生成することで、クロッピング領域内で、かつ、オリジナル領域外の領域を歪み領域として特定する手段を備える。生成したオリジナル領域情報は、エントロピー符号化部1612に通知して符号化するように構成することが望ましいが、ここでは説明を簡単にするために省略する。
歪み領域縮小部1605は、生成したオリジナル領域情報に基づいて、歪み領域に格納する対象領域である歪み領域格納対象領域を特定する手段を備える。一般に、歪み領域格納対象領域は、エンハンスレイヤ側の空間解像度であるHD解像度の画像フレームの領域内で、かつ、オリジナル領域外の領域である。また、歪み領域縮小部1605は、この歪み領域格納対象領域に含まれる画素に対して、特定した歪み領域に収まるように所定のフィルタリング及び縮小方法を特定し、フィルタリング及び縮小処理を行った後に歪み領域に格納する手段を備える。
クロッピング領域縮小部1606は、ベースレイヤ側で必要としている空間解像度、ここではSD解像度の画像フレームを取得するために、クロッピング領域に対して所定のフィルタリング処理及び縮小処理を行うことで、歪み領域を含んだSD解像度の画像フレームを生成する手段を備える。
ME部1607は、ベースレイヤ側のME(動き推定)処理を行うための手段を備える。ME処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のME処理を行うことが望ましい。ME部1607は、現在符号化対象となっているSD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1609からの参照フレームとの間でME処理を行うことで、動きベクトル情報を生成する。生成した動きベクトル情報は、MC部1608及びレイヤ間予測部1620に通知される。また、ME部1607は、生成した動きベクトル情報に対して所定の符号化を行うために、動きベクトル情報をエントロピー符号化部1612に通知する手段を備える。
MC部1608は、ベースレイヤ側のMC(動き補償)処理を行うための手段を備える。MC処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1608は、ME部1607から動きベクトル情報を取得する手段と、フレームバッファ1609から参照フレームを取得する手段と、取得した参照フレームに対して、取得した動きベクトル情報に基づいて、MC画像フレームを生成する手段と、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1609に通知する手段とを備える。
フレームバッファ部1609は、ローカルデコード画像フレームを格納するための手段を備える。格納されるローカルデコード画像フレームは、MC部1608では参照フレームとして用いられる。直交変換部1610は、イントラ符号化の場合はクロッピング領域縮小部1606で生成したSD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成する手段と、イントラ符号化以外の場合には、クロッピング領域縮小部1606から得られるSD解像度の画像フレームと、MC部1608から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する手段と、生成した直交変換後の係数情報を量子化部1611に通知する手段とを備える。
量子化部1611は、直交変換部1610が生成した直交変換後の係数情報を取得し、所定の量子化処理を行い、量子化後の係数情報を生成する手段と、生成した量子化後の係数情報をエントロピー符号化部1612及び逆量子化部1613に通知する手段とを備える。
エントロピー符号化部1612は、ME部1607から動きベクトル情報を取得し、所定のエントロピー符号化を行う手段と、量子化部1611から量子化後の係数情報を取得し、所定のエントロピー符号化を行う手段と、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をMUX部1628に通知する手段とを備える。
逆量子化部1613は、ローカルデコード画像フレームを生成するために、量子化部1611から量子化後の係数情報を取得し、所定の逆量子化を行うことで逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1614に通知する手段とを備える。
逆直交変換部1614は、ローカルデコード画像フレームを生成するために、逆量子化部1613から逆量子化後の係数情報を取得し、所定の逆直交交換を行うことで、復号後の差分画像フレームを生成する手段と、生成した復号後の差分画像フレームをフレームバッファ部1609に通知する手段とを備える。復号後の差分画像フレームをフレームバッファ部1609に通知することで、フレームバッファ部1609は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームをMC部1608においては参照フレームとして利用する。
歪み領域特定部1615は、フレームバッファ部1609に格納されているローカルデコード画像フレームを取得し、取得したローカルデコード画像フレーム内の歪み領域を再度特定する手段を備える。歪み領域の特定は、クロッピング領域情報、オリジナル領域情報、クロッピング領域縮小部1606で行う縮小処理の縮小倍率から、ローカルデコード画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1615で特定した歪み領域情報は、歪み領域拡大部1616に通知される。
歪み領域拡大部1616は、歪み領域特定部1615から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行うことで、歪み領域に含まれる画像を元の歪みのない画像に復元し、この歪み領域を復元した画像フレームを画像拡大部1617に通知する。
画像拡大部1617は、歪み拡大部1616から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行う手段と、拡大後の画像フレームをベースレイヤからのローカルデコード画像フレームとしてクロッピング領域特定部1618に通知する手段とを備える。
クロッピング領域特定部1618は、画像拡大部1617から取得したベースレイヤからのローカルデコード画像フレームが、エンハンスレイヤ側のHD解像度をもつ画像フレームのどの位置に対応するかを特定し、この特定した位置関係情報及びベースレイヤからのローカルデコード画像フレームをレイヤ間予測部1620に通知する手段を備える。位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、より効果的にレイヤ間予測を行うことができる構成となる。
ME部1619は、エンハンスレイヤ側のME処理を行うための手段を備える。ME処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のME処理を行うことが望ましい。ME部1619は、現在符号化対象となっているHD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1622からの参照フレームとの間でME処理を行うことで、動きベクトル情報を生成する。生成した動きベクトル情報は、レイヤ間予測部1620に通知される。
レイヤ間予測部1620は、ベースレイヤ側のME部1607から出力された動きベクトル情報を取得する手段と、クロッピング領域特定部1618から出力された、ベースレイヤ側のローカルデコード画像フレーム及びエンハンスレイヤ側の画像フレームとの間の位置関係情報を取得する手段と、エンハンスレイヤ側のME部1619から出力された動きベクトル情報を取得する手段とを備える。
更に、レイヤ間予測部1620は、このような手段によって取得した情報に基づいて、レイヤ間の相関を利用し、動きベクトル情報の予測符号化を行い、レイヤ間予測に基づいた動きベクトル情報を生成する手段を備える。このレイヤ間予測に基づいた動きベクトル情報は、MC部1621に通知されると共に、また、エンハンス側の動きベクトル情報を符号化するために、エントロピー符号化部1625に通知される。ここで、エントロピー符号化部1625に通知されるエンハンス側の動きベクトル情報は、ベースレイヤ側から取得した動きベクトル情報とのレイヤ間予測によって生成した動きベクトル差分情報であっても構わない。
MC部1621は、エンハンスレイヤ側のMC処理を行うための手段を備える。このMC処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に、所定のMC処理を行うことが望ましい。また、MC部1621は、レイヤ間予測部1620から動きベクトル情報を取得する手段と、フレームバッファ部1622から参照フレームを取得する手段と、取得した参照フレームに対して、取得した動きベクトル情報に基づいて、MC画像フレームを生成する手段と、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1622に通知する手段とを備える。
フレームバッファ部1622は、エンハンスレイヤ側のローカルデコード画像フレームを格納するための手段を備える。格納されるローカルデコード画像フレームは、MC部1621では参照フレームとして用いられる。
直交変換部1623は、イントラ符号化の場合は画像入力部1602から取得した高精細なHD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成する手段と、イントラ符号化以外の場合には、画像入力部1602から得られるHD解像度の画像フレームと、MC部1621から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する手段とを備える。生成した直交変換後の係数情報は、量子化部1624に通知される。
量子化部1624は、直交変換部1623が生成した直交変換後の係数情報を取得し、所定の量子化処理を行い、量子後の係数情報を生成する手段と、生成した量子化後の係数情報をエントロピー符号化部1625及び逆量子化部1626に通知する手段とを備える。エントロピー符号化部1625は、レイヤ間予測部1620から動きベクトル情報を取得し、所定のエントロピー符号化を行う手段と、量子化部1624から量子化後の係数情報を取得し、所定のエントロピー符号化を行う手段とを備える。また、エントロピー符号化部1625は、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をMUX部1628に通知する。
逆量子化部1626は、ローカルデコード画像フレームを生成するために、量子化部1624から量子化後の係数情報を取得し、所定の逆量子化を行うことで逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1627に通知する手段とを備える。
逆直交変換部1627は、ローカルデコード画像フレームを生成するために、逆量子化部1626から逆量子化後の係数情報を取得し、所定の逆直交変換を行うことで、復号後の差分画像フレームを生成する手段と、生成した復号後の差分画像フレームをフレームバッファ部1622に通知する手段とを備える。復号後の差分画像フレームをフレームバッファ部1622に通知することで、フレームバッファ部1622は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームは、MC部1621においては参照フレームとして利用される。
MUX部1628は、ベースレイヤ側のエントロピー符号化部1612からエントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報を取得する手段と、エンハンスレイヤ側のエントロピー符号化部1625からエントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報を取得する手段と、取得したこれらの情報に対して所定の多重化(MUX)を行うことで多重化出力情報を生成する手段とを備える。生成した多重化出力情報は、符号化出力部1629に通知される。符号化出力部1629は、MUX部1628から多重化出力情報を取得し、符号化ビットストリーム1630を出力する手段を備える。以上のような各手段を備えた各部により本発明のスケーラブル符号化装置の一実施の形態を構成することができる。
次に、図20及び図21のフローチャートを用いて、図18に示したスケーラブル符号化装置の動作について説明する。図20は、主に図18のベースレイヤ側の処理過程を示すためのフローチャートである。また図21は、主にエンハンスレイヤ側の処理過程を示すためのフローチャートである。
まず、画像入力部1602は、高精細な空間解像度(例えば、HD解像度)を持つ画像フレーム1601を取得して(図20のステップS301)、クロッピング領域特定部1603に取得した画像フレームを通知する。
クロッピング領域特定部1603は、入力された高精細な空間解像度を持つ画像フレーム1601内からより低い空間解像度(例えば、SD解像度)として残すべき領域を、図1の12その他で説明したクロッピング領域として特定する(図20のステップS302)。このクロッピング領域は、所定の位置に基づくものであっても構わない。また、画像内の状態を考慮してクロッピング領域を決定するようにしても構わない。このようにして特定されたクロッピング領域情報は、画像フレーム1601と共に歪み領域特定部1604に供給される。
歪み領域特定部1604は、入力された上記のクロッピング領域情報と画像フレーム1601とに基づいて、クロッピング領域内に図1の13その他で説明したオリジナル領域を特定する。オリジナル領域の位置に関しては、予め決められた位置情報を利用して領域を特定しても構わない。また、エンハンスレイヤの符号化を行う際により重要となる領域をクロッピング領域内を探索することでオリジナル領域を決定しても構わない。歪み領域特定部1604は、更にクロッピング領域内で、かつ、オリジナル領域外の領域内に、画像を歪ませて空間解像度変換後の画像を格納する領域である歪み領域を特定する(図20のステップS303)。
歪み領域縮小部1605は、歪み領域特定部1604から取得したオリジナル領域情報、特定した歪み領域情報及び画像フレーム1601に基づいて、オリジナル領域の外側の画像フレームの画像情報が、特定した歪み領域に収まるように所定のフィルタリング及び縮小方法を特定し、フィルタリング及び縮小処理を行った後にその歪み領域に格納することで、歪み領域を縮小する(図20のステップS304)。その後、歪み領域縮小部1605は、オリジナル領域及び歪み領域からなるクロッピング領域の画像フレームを、クロッピング領域縮小部1606に通知する。
クロッピング領域縮小部1606は、ベースレイヤ側で必要としている空間解像度の画像フレームを取得するために、クロッピング領域に対して所定のフィルタリング処理及び縮小処理を行うことでクロッピング領域を縮小する(図20のステップS305)。このようにして、歪み領域を含んだSD解像度の画像フレームが生成される。生成された画像フレームは、ベースレイヤ側のME部1607と直交変換部1610に通知される。
ME部1607は、フレーム内符号化であるイントラ符号化以外のモードである場合にクロッピング領域縮小部1606が生成したSD解像度の画像フレームと、フレームバッファ部1609から参照フレームを取得して所定のME処理を行うことが望ましい。ME部1607は、現在符号化対象となっているSD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1609からの参照フレームとを取得し、これらのフレーム間でME処理を行う(図20のステップS306)ことで、動きベクトル情報を生成する。
ME部1607は、生成した動きベクトル情報を、MC部1608及びレイヤ間予測部1620に通知すると共に、生成した動きベクトル情報に対して所定の符号化を行うために、動きベクトル情報をエントロピー符号化部1612に通知する。このような処理を行うことでME処理を完了する。
MC部1608は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1608は、ME部1607から取得した動きベクトル情報に基づいて、フレームバッファ部1609から取得した参照フレームに対して、MC画像フレームを生成することでMCを行う(図20のステップS307)。その後、MC部1608は、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1609に供給して記憶させる。
直交変換部1610は、イントラ符号化の場合はクロッピング領域縮小部1606で生成したSD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成し、イントラ符号化以外の場合には、クロッピング領域縮小部1606から得られるSD解像度の画像フレームと、MC部1608から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する。このような処理により直交変換を行う(図20のステップS308)。生成された直交変換後の係数情報は量子化部1611に通知される。
量子化部1611は、直交変換部1610が生成した直交変換後の係数情報を取得し、所定の量子化を行い(図20のステップS309)、量子化後の係数情報を生成し、それをエントロピー符号化部1612及び逆量子化部1613に供給する。エントロピー符号化部1612は、ME部1607から動きベクトル情報を取得し、所定のエントロピー符号化を行う。また、量子化部1611から量子化後の係数情報を取得し、所定のエントロピー符号化を行う(図20のステップS310)。エントロピー符号化部1612は、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をそれぞれMUX部1628に供給する。
逆量子化部1613は、ローカルデコード画像フレームを生成するために、量子化部1611から量子化後の係数情報を取得し、所定の逆量子化を行う(図20のステップS312)ことで逆量子化後の係数情報を生成する。生成された逆量子化後の係数情報は、逆直交変換部1614に供給される。
逆直交変換部1614は、ローカルデコード画像フレームを生成するために、逆量子化部1613から逆量子化後の係数情報を取得し、所定の逆直交変換を行う(図20のステップS312)ことで、復号後の差分画像フレームを生成する。生成された復号後の差分画像フレームは、フレームバッファ部1609に供給される。逆直交変換部1614から復号後の差分画像フレームがフレームバッファ部1609に入力されることで、フレームバッファ部1609は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームは、MC部1608においては参照フレームとして利用される。
歪み領域特定部1615は、フレームバッファ部1609に格納されているローカルデコード画像フレームを取得し、取得したローカルデコード画像フレーム内の歪み領域を再度特定する(図20のステップS313)。歪み領域の特定は、クロッピング領域情報、オリジナル領域情報、クロッピング領域縮小部1606で行う縮小処理の縮小倍率から、ローカルデコード画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1615は、特定した歪み領域情報を歪み領域拡大部1616に通知する。
歪み領域拡大部1616は、歪み領域特定部1615から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行うことで歪み領域を拡大する(図20のステップS314)。このような処理を行うことで、歪み領域に含まれる画像を元の歪みのない画像に復元する。歪み領域拡大部1616は、この歪み領域を復元した画像とオリジナル領域の画像とからなる画像フレームを画像拡大部1617に通知する。
画像拡大部1617は、歪み拡大部1616から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行う(図20のステップS315)。拡大後の画像フレームをベースレイヤからのローカルデコード画像フレームとしてクロッピング領域特定部1618に通知する。
クロッピング領域特定部1618は、画像拡大部1617から取得したベースレイヤからのローカルデコード画像フレームが、エンハンスレイヤ側のHD解像度をもつ画像フレームのどの位置に対応するかを特定し(図20のステップS316)、この特定した位置関係情報及びベースレイヤからのローカルデコード画像フレームをレイヤ間予測部1620に通知する。位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、より効果的にレイヤ間予測を行うことができる構成となる。以上のような各部の処理を行うことで、ベースレイヤ側における1フレーム分の符号化が完了する。
次に、エンハンスレイヤ側の符号化処理に移る。エンハンスレイヤ側では、ベースレイヤ側の処理と同様に画像入力部1602が高精細な空間解像度をもつ画像フレーム1601を取得する(図21のステップS401)。ME部1619は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のME処理を行うことが望ましい。ME部1619は、現在符号化対象となっているHD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1622から参照フレームを取得し、これらのフレーム間でMEを行う(図21のステップS402)ことで、動きベクトル情報を生成する。生成された動きベクトル情報は、レイヤ間予測部1620に通知される。
レイヤ間予測部1620は、ベースレイヤ側からのレイヤ間予測のための情報を取得する(図21のステップS403)。ここでは、レイヤ間予測部1620は、ベースレイヤ側のME部1607から動きベクトル情報を取得し、クロッピング領域特定部1618から、ベースレイヤ側のローカルデコード画像フレーム及びエンハンスレイヤ側の画像フレームとの間の位置関係情報を取得し、エンハンスレイヤ側のME部1619から動きベクトル情報を取得する。
このような手段によって取得した情報に基づいて、レイヤ間予測部1620は、レイヤ間の相関を利用し、動きベクトル情報の予測符号化を行い、レイヤ間予測に基づいた動きベクトル情報を生成する(図21のステップS404)。このレイヤ間予測に基づいた動きベクトル情報は、MC部1621に供給され、また、エンハンス側の動きベクトル情報を符号化するために、エントロピー符号化部1625に供給される。ここで、エントロピー符号化部1625に供給されるエンハンス側の動きベクトル情報は、ベースレイヤ側から取得した動きベクトル情報とのレイヤ間予測によって生成した動きベクトル差分情報であっても構わない。
MC部1621は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1621は、レイヤ間予測部1620から動きベクトル情報を取得する。また、フレームバッファ1622から参照フレームを取得する。取得した参照フレームに対して、取得した動きベクトル情報に基づいて、MC画像フレームを生成することでMCを行う(図21のステップS405)。MC部1621は、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1622に供給する。
直交変換部1623は、イントラ符号化の場合は画像入力部1602から取得した高精細なHD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成する。また、イントラ符号化以外の場合には、画像入力部1602から得られるHD解像度の画像フレームと、MC部1621から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する(図21のステップS406)。直交変換部1623は、生成した直交変換後の係数情報を量子化部1624に供給する。
量子化部1624は、直交変換部1623が生成した直交変換後の係数情報を取得し、所定の量子化処理を行い、量子化後の係数情報を生成する(図21のステップS407)。生成された量子化後の係数情報は、エントロピー符号化部1625及び逆量子化部1626に供給される。
エントロピー符号化部1625は、レイヤ間予測部1620から動きベクトル情報を取得し、所定のエントロピー符号化を行う。また、量子化部1624から量子化後の係数情報を取得し、所定のエントロピー符号化を行う(図21のステップS408)。エントロピー符号化部1625は、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をMUX部1628に通知する。
逆量子化部1626は、ローカルデコード画像フレームを生成するために、量子化部1624から量子化後の係数情報を取得し、所定の逆量子化を行う(図21のステップS409)ことで逆量子化後の係数情報を生成する。生成された逆量子化後の係数情報は、逆直交変換部1627に供給される。
逆直交変換部1627は、ローカルデコード画像フレームを生成するために、逆量子化部1626から逆量子化後の係数情報を取得し、所定の逆直交変換を行う(図21のステップS410)ことで、復号後の差分画像フレームを生成し、生成した復号後の差分画像フレームをフレームバッファ部1622に供給する。復号後の差分画像フレームをフレームバッファ部1622に供給することで、フレームバッファ部1622は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームは、MC部1621においては参照フレームとして利用される。
MUX部1628は、ベースレイヤ側のエントロピー符号化部1612からエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とを取得し(図21のステップS411)、エンハンスレイヤ側のエントロピー符号化部1625からエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報を取得し、取得したこれらの情報に対して所定の多重化(MUX)を行う(図21のステップS412)。
これにより、MUX部1628からは多重化出力情報が取り出され、符号化出力部1629に供給され、ここで符号化ビットストリーム1630として生成されて出力される(図21のステップS413)。以上のような各部の処理を行うことで、エンハンスレイヤ側における1フレーム分の符号化及び、一連の符号化出力処理が完了する。本実施の形態の空間スケーラブル符号化装置によれば、前述した発明の効果に記載した(1)〜(3)等の効果を奏する。
次に、空間解像度変換を用いた本発明の空間スケーラブル復号化装置の構成について説明する。図19は本発明になる空間スケーラブル復号化装置の一実施の形態のブロック図を示す。同図において、符号化入力部1702は、本実施の形態のスケーラブル符号化装置によって得られた符号化出力である符号化ビットストリームを取得するための手段と、取得した符号化ビットストリームをDEMUX部1703に通知する手段とを備える。
DEMUX部1703は、符号化入力部1702から符号化ビットストリームを取得する手段と、取得した符号化ビットストリームに対して多重化分離(DEMUX)を行う手段とを備える。DEMUX処理により、ベースレイヤ側の符号化出力情報と、エンハンスレイヤ側の符号化出力情報とに分離される。更に、各レイヤの符号化出力情報は、エントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とに分離される。
また、DEMUX部1703は、ベースレイヤ側のエントロピー復号部1704、エンハンスレイヤ側のエントロピー復号部1722に対して、それぞれ対応するレイヤの符号化出力情報であるエントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報を通知する手段を備える。
エントロピー復号部1704は、ベースレイヤ側の復号化処理を行うために、DEMUX部1703からベースレイヤ側の符号化出力情報であるエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とを取得する手段と、取得したエントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化する手段と、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する手段とを備える。
更に、エントロピー復号部1704は、復号化した動きベクトル情報をMC部1708及びエンハンスレイヤ側のレイヤ間予測部1721に通知する手段と、復号化した量子化後の係数情報を逆量子化部1705に通知する手段とを備える。
逆量子化部1705は、エントロピー復号部1704から量子化後の係数情報を取得する手段と、取得した量子化後の係数情報に対して所定の逆量子化を行うことで、逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1706に通知する手段とを備える。
MC部1706は、フレーム内復号化であるイントラ復号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1706は、エントロピー復号部1704から動きベクトル情報を取得する手段と、フレームバッファ部1707から参照フレームを取得する手段と、取得した動きベクトル情報に基づいて参照フレームに対してMCを行い、MC画像フレームを生成する手段と、生成したMC画像フレームをフレームバッファ部1707に通知する手段とを備える。
フレームバッファ部1707は、MC部1706からMC画像フレームを取得し、格納する手段と、逆直交変換部1708から復号後の画像フレームを取得し、格納されているMC画像フレームと合成する手段とを備える。
逆直交変換部1708は、逆量子化部1705から取得した逆量子化後の係数情報を取得する手段と、取得した逆量子化後の係数情報に対して逆直交変換を行うことで、復号後の画像フレームを生成する手段と、生成した復号後の画像フレームを、フレームバッファ部1707に通知する手段とを備える。ここで、イントラ復号化である場合には、生成する画像フレームは差分画像フレームとなる。また、イントラ復号化以外の場合には、差分画像ではない復号画像フレームとなる。復号後の画像フレームは、フレームバッファ部1707に通知される。
画像出力部1709は、フレームバッファ部1707から復号後の画像フレームを取得して、取得した復号後の画像フレームを第1ベースレイヤ画像フレーム1710として出力する。歪み領域特定部1711は、フレームバッファ部1707から復号後の画像フレームを取得し、取得した復号後の画像フレーム内の歪み領域を再度特定する。歪み領域の特定は、エンハンスレイヤ側の復号画像フレーム全体の領域情報、クロッピング領域情報、オリジナル領域情報、復号時のクロッピング領域の拡大率を考慮することで復号画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1711で特定した歪み領域情報は、歪み領域拡大部1714に通知される。
画像出力部1712は、歪み領域特定部1711から復号後の画像フレームを取得する手段と、取得した復号後の画像フレームを出力する手段とを備える。この画像出力部1712は、表示方法に応じた画像成型を行う手段を備えるとよい。ここでは、特定した歪み領域を除外して表示するような手段を備えることが望ましい。その際、歪み領域に対して例えば画素値として0を埋めることで縦の帯状に無効領域を生成し、表示するような手段を備えることでより多様な表示を行うことができる。
画像出力部1712は、オリジナル領域を縦方向、横方向にそれぞれ拡大し、画像表示装置の領域に合わせて表示するような手段を備えてもよい。また、オリジナル領域の上下の領域を除いて画像表示装置の縦横比に合わせるために、オリジナル領域に対して再度クロッピング処理を行い、その後画像表示装置の表示領域に合わせるために拡大して表示する手段を備えても構わない。
歪み領域拡大部1714は、歪み領域特定部1711から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行うことで、歪み領域に含まれる画像を元の歪みのない画像に復元する。歪み領域拡大部1714は、この歪み領域を復元した画像フレームを画像拡大部1717に通知する手段を備える。
画像出力部1715は、歪み領域拡大部1714から歪み領域を復元した画像フレームを取得する手段と、取得した歪み領域を復元した画像フレームを出力する手段とを備える。この画像出力部1715は、表示方法に応じた画像成型を行う手段を備えるとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示するような手段を備えることが望ましい。
画像拡大部1717は、歪み領域拡大部1714から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行う手段と、拡大後の画像フレームをベースレイヤからの復号画像フレームとしてクロッピング領域特定部1720に通知する手段とを備える。
画像出力部1718は、画像拡大部1717からベースレイヤからの復号画像フレームを取得する手段と、取得した復号画像フレームを出力する手段とを備える。この画像出力部1718は、表示方法に応じた画像成型を行う手段を備えるとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示するような手段を備えることが望ましい。
クロッピング領域特定部1720は、画像拡大部1717から取得したベースレイヤからの復号画像フレームが、エンハンスレイヤ側のHD解像度をもつ復号画像フレームのどの位置に対応するかを特定し、この特定した位置関係情報及びベースレイヤからの復号画像フレームをレイヤ間予測部1721に通知する手段を備える。上記の位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、レイヤ間予測復号を行うような構成が望ましい。
レイヤ間予測部1721は、ベースレイヤ側のエントロピー復号部1704から動きベクトル情報を取得する手段と、クロッピング領域特定部1720から、ベースレイヤ側の復号画像フレーム及びエンハンスレイヤ側の復号画像フレームとの間の位置関係情報を取得する手段と、エンハンスレイヤ側のエントロピー復号部1722から動きベクトル情報を取得する手段と、取得した動きベクトル情報に対して予測復号化を行い、エンハンスレイヤ側の復号化で必要な予測復号後の動きベクトル情報を生成する手段と、予測復号後の動きベクトル情報をMC部1724に通知する手段とを備える。
エントロピー復号部1722は、エンハンスレイヤ側の復号化処理を行うために、DEMUX部1703からエンハンスレイヤ側の符号化出力情報であるエントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報を取得する手段を備える。また、エントロピー復号部1722は、取得したエントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化する手段と、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する手段とを備える。
エントロピー復号部1722は、更に、復号化した動きベクトル情報をレイヤ間予測部1721に通知する手段と、復号化した量子化後の係数情報を逆量子化部1723に通知する手段とを備える。逆量子化部1723は、エントロピー復号化部1722から量子化後の係数情報を取得する手段と、取得した量子化後の係数情報に対して所定の逆量子化を行うことで、逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1726に通知する手段とを備える。
MC部1724は、フレーム内復号化であるイントラ復号化以外のモードである場合に、所定のMC処理を行うことが望ましい。このMC部1724は、レイヤ間予測部1721から予測復号後の動きベクトル情報を取得する手段と、フレームバッファ部1725から参照フレームを取得する手段と、取得した予測復号後の動きベクトル情報に基づいて参照フレームに対してMCを行い、MC画像フレームを生成する手段と、生成したMC画像フレームをフレームバッファ部1725に通知する手段とを備える。
フレームバッファ部1725は、MC部1725からMC画像フレームを取得し、格納する手段と、逆直交変換部1726から復号後の画像フレームを取得し、格納されているMC画像フレームと合成する手段とを備える。逆直交変換部1726は、逆量子化部1723から取得した逆量子化後の係数情報を取得する手段と、取得した逆量子化後の係数情報に対して逆直交変換を行うことで、復号後の画像フレームを生成する手段と、生成した復号後の画像フレームをフレームバッファ部1725に通知する手段とを備える。
ここで、イントラ復号化である場合には、生成する復号後の画像フレームは差分画像フレームとなる。また、イントラ復号化以外の場合には、差分画像ではない復号画像フレームとなる。復号後の画像フレームは、フレームバッファ部1724に通知される。
画像出力部1727は、フレームバッファ部1725から復号後の画像フレームを取得する手段と、取得した復号後の画像フレームを出力する手段とを備える。以上のような各手段を備えた各部により本発明のスケーラブル復号化装置を構成することができる。
次に、図22及び図23のフローチャートを用いて、図19に示した本実施の形態のスケーラブル復号化装置の動作について説明する。図22は、主に図19のベースレイヤ側の処理過程を示すためのフローチャートである。また図23は、主にエンハンスレイヤ側の処理過程を示すためのフローチャートである。
図19において、まず、符号化入力部1702は、図18に示したスケーラブル符号化装置によって生成された符号化ビットストリーム1701(図18の1630に相当)を取得し(図22のステップS501)、その取得した符号化ビットストリーム1701をDEMUX部1703に通知する。
DEMUX部1703は、符号化入力部1702から取得した符号化ビットストリーム1701に対して多重化分離(DEMUX)を行う(図22のステップS502)。このDEMUX処理により、符号化ビットストリーム1701は、ベースレイヤ側の符号化出力情報とエンハンスレイヤ側の符号化出力情報とに分離され、更に、各レイヤの符号化出力情報が、エントロピー符号化を行った動きベクトル情報とエントロピー符号化を行った量子化後の係数情報とに分離される。
DEMUX部1703は、ベースレイヤ側のエントロピー復号部1704と、エンハンスレイヤ側のエントロピー復号部1722に対して、それぞれ対応するレイヤの符号化出力情報であるエントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報を供給する。
エントロピー復号部1704は、ベースレイヤ側の復号化処理を行うために、DEMUX部1703から取得した、ベースレイヤ側の符号化出力情報であるエントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報のうち、エントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化すると共に、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する(図22のステップS503)。
エントロピー復号部1704は、復号化した動きベクトル情報を、MC部1706及びエンハンスレイヤ側のレイヤ間予測部1721に供給し、また、復号化した量子化後の係数情報を逆量子化部1705に供給する。逆量子化部1705は、エントロピー復号部1704から取得した量子化後の係数情報に対して、所定の逆量子化を行うことで、逆量子化後の係数情報を生成する(図22のステップS504)。この生成された逆量子化後の係数情報は、逆直交変換部1706に供給される。
MC部1706は、フレーム内復号化であるイントラ復号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1706は、エントロピー復号部1704から取得した動きベクトル情報に基づいて、フレームバッファ部1707から取得した参照フレームに対してMCを行い、MC画像フレームを生成する(図22のステップS505)。この生成されたMC画像フレームは、フレームバッファ部1707に供給される。
逆直交変換部1708は、逆量子化部1705から所得した逆量子化後の係数情報に対して逆直交変換を行うことで、復号後の画像フレームを生成する(図22のステップS506)。この生成された復号後の画像フレームは、フレームバッファ部1707に供給される。ここで、イントラ復号化である場合には、上記の生成された画像フレームは差分画像フレームとなる。また、イントラ復号以外の場合には、差分画像ではない復号画像フレームとなる。
画像出力部1709は、フレームバッファ部1707から取得した復号後の画像フレームを第1のベースレイヤ画像フレーム1710として出力する(図22のステップS507)。この第1のベースレイヤ画像フレーム1710は、例えば、図9(A)に示したオリジナル領域81と歪み領域82、83の各画像情報からなる、SD解像度のアスペクト比4:3の復号画像フレームである。
歪み領域特定部1711は、フレームバッファ部1707から復号後の画像フレームを取得し、取得した復号後の画像フレーム内の歪み領域を再度特定する(図22のステップS508)。歪み領域の特定は、エンハンスレイヤ側の復号画像フレーム全体の領域情報、クロッピング領域情報、オリジナル領域情報、復号時のクロッピング領域の拡大率を考慮することで復号画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1711で特定した歪み領域情報は、歪み領域拡大部1714に供給される。
画像出力部1712は、歪み領域特定部1711から復号後の画像フレームを取得し、取得した復号後の画像フレームを第2のベースレイヤ画像フレーム1713として出力する(図22のステップS509)。この画像出力部1712は、表示方法に応じた画像成型を行うとよい。ここでは、特定した歪み領域を除外して表示することが望ましい。その際、歪み領域に対して例えば画素値として0を埋めることで縦の帯状に無効領域を生成し、表示することでより多様な表示を行うことができる。例えば、上記の第2のベースレイヤ画像フレーム1713は、図9(A)に示したオリジナル領域81の画像情報のみからなる、SD解像度のアスペクト比4:3の復号画像フレームである。従って、この第2のベースレイヤ画像フレーム1713には、歪み領域82、83の画像情報は表示されない。
なお、画像出力部1712は、オリジナル領域を縦方向、横方向にそれぞれ拡大し、画像表示装置の領域に合わせて表示してもよい。また、オリジナル領域の上下の領域を除いて画像表示装置の縦横比に合わせるために、オリジナル領域に対して再度クロッピング処理を行い、その後画像表示装置の表示領域に合わせるために拡大して表示しても構わない。
歪み領域拡大部1714は、歪み領域特定部1711から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行う(図22のステップS510)。これにより、歪み領域に含まれる画像が元の歪みのない画像に復元される。歪み領域拡大部1714は、この歪み領域を復元した画像フレームを画像拡大部1717に供給する。
画像出力部1715は、歪み領域拡大部1714から歪み領域を復元した画像フレームを取得する。取得した歪み領域を復元した画像フレームを第3のベースレイヤ画像フレーム1716として出力する(図22のステップS511)。この画像出力部1715は、表示方法に応じた画像生成を行うとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示することが望ましい。上記の第3のベースレイヤ画像フレーム1716は、例えば、図9(C)に示した、オリジナル領域81と歪み領域拡大領域86及び87の各半分の領域とからなる、すなわち、点線で囲まれたクロッピング領域内の各画像情報からなる、SD解像度のアスペクト比4:3の復号画像フレームである。
画像拡大部1717は、歪み領域拡大部1714から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行い(図22のステップS512)、拡大後の画像フレームをベースレイヤからの復号画像フレームとしてクロッピング領域特定部1720に通知する。
画像出力部1718は、画像拡大部1717からベースレイヤからの復号画像フレームを取得し、取得した復号画像フレームを第4のベースレイヤ画像フレーム1719として出力する(図22のステップS513)。この画像出力部1718は、表示方法に応じた画像成型を行うとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示することが望ましい。上記の第4のベースレイヤ画像フレーム1719は、例えば、図9(D)に示した、オリジナル領域89と歪み領域拡大領域92及び93の各半分の領域とからなる、すなわち、点線で囲まれたクロッピング領域内の各画像情報からなる、HD解像度のアスペクト比4:3の復号画像フレームである。
クロッピング領域特定部1720は、画像拡大部1717から取得したベースレイヤからの復号画像フレームが、エンハンスレイヤ側のHD解像度をもつ復号画像フレームのどの位置に対応するかを特定し(図22のステップS514)、この特定した位置関係情報及びベースレイヤからの復号画像フレームをレイヤ間予測部1721に通知する。位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、レイヤ間予測復号を行うような構成が望ましい。以上のような各部の処理を行うことで、ベースレイヤ側における1フレーム分の復号化処理が完了する。
次に、エンハンスレイヤ側の復号化処理に移る。エンハンスレイヤ側では、ベースレイヤ側の処理と同様に符号化入力部1702が符号化ビットストリーム1701を取得し(図23のステップS601)、取得した符号化ビットストリーム1701をDEMUX部1703に通知する。その後、DEMUX部1703は、取得した符号化ビットストリーム1701に対して多重化分離(DEMUX)を行う(図23のステップS602)。
DEMUX処理により、符号化ビットストリーム1701がベースレイヤ側の符号化出力情報とエンハンスレイヤ側の符号化出力情報に分離され、更に各レイヤの符号化出力情報は、エントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報に分離される。
エントロピー復号部1722は、エンハンスレイヤ側の復号化処理を行うために、DEMUX部1703から取得した、エンハンスレイヤ側の符号出力情報であるエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とのうち、取得したエントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化し、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する(図23のステップS603)。エントロピー復号部1722は、復号化した動きベクトル情報をレイヤ間予測部1721に供給する一方、復号化した量子化後の係数情報を逆量子化部1723に供給する。
逆量子化部1723は、エントロピー復号部1722から取得した量子化後の係数情報に対して所定の逆量子化を行うことで、逆量子化後の係数情報を生成する(図23のステップS604)。この生成された逆量子化後の係数情報は、逆直交変換部1726に供給される。
レイヤ間予測部1721は、ベースレイヤ側のエントロピー復号部1704から動きベクトル情報を取得し、クロッピング領域特定部1720からベースレイヤ側の復号画像フレーム及びエンハンスレイヤ側の復号画像フレームとの間の位置関係情報を取得し、エンハンスレイヤ側のエントロピー復号部1722から動きベクトル情報を取得し、取得した動きベクトル情報に対してレイヤ間の予測復号化を行い(図23のステップS605)、エンハンスレイヤ側の復号化で必要な予測復号後の動きベクトル情報を生成する。この予測復号後の動きベクトル情報は、MC部1724に供給される。
MC部1724は、フレーム内復号化であるイントラ復号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1724は、レイヤ間予測部1721から取得した予測復号後の動きベクトル情報に基づいて、フレームバッファ部1725から取得した参照フレームに対してMCを行い(図23のステップS606)、MC画像フレームを生成する。生成されたMC画像フレームは、フレームバッファ部1725に供給される。
逆直交変換部1726は、逆量子化部1723から取得した逆量子化後の係数情報に対して逆直交変換を行う(図23のステップS607)。これにより、復号後の画像フレームが生成される。ここで、生成される復号後の画像フレームは、イントラ復号化である場合には、差分画像フレームとなり、また、イントラ復号化以外の場合には、差分画像ではない復号画像フレームとなる。生成された復号後の画像フレームは、フレームバッファ部1724に供給される。
画像出力部1727は、フレームバッファ部1725から復号後の画像フレームを取得し、その取得した復号後の画像フレームをエンハンスレイヤ画像フレーム1728として出力する(図23のステップS608)。このエンハンスレイヤ画像フレーム1728は、HD解像度のアスペクト比16:9の画像フレームである。以上のような各部の処理を行うことで、エンハンスレイヤ側における1フレーム分の復号化及び、一連の復号化出力処理が完了する。本実施の形態の空間スケーラブル復号化装置によれば、前述した発明の効果に記載した(4)〜(8)等の効果を奏する。
次に、本発明になる空間スケーラブル符号化プログラムについて説明する。図24は本発明の空間スケーラブル符号化プログラムを実行する情報処理装置の一例のブロック図を示す。図24において、情報処理装置2900は、入力装置2901、出力装置2902、中央処理制御装置2903、外部記憶装置2904、一時記憶装置2905、通信装置2906から構成されており、コンピュータである中央処理制御装置2903により空間スケーラブル符号化装置の機能を空間スケーラブル符号化プログラムにより実現させるものである。
ここで、上記のプログラムは、記録媒体から読み取られて中央処理制御装置2903に取り込まれてもよいし、ネットワークを介して通信装置2906により受信されて中央処理制御装置2903に取り込まれてもよい。
中央処理制御装置2903は、上記のプログラムにより、画像入力部1602に相当する画像入力管理手段2932、MUX部1628に相当するMUX手段2933、符号化出力部1629に相当する符号化出力管理手段2934をソフトウェア処理にて実現する。また、中央処理制御装置2903は、上記のプログラムにより、ベースレイヤ用の符号化処理とエンハンスレイヤ用の符号化処理をソフトウェア処理にて実現する。
すなわち、中央処理制御装置2903は、上記のプログラムにより、ベースレイヤ用の符号化処理として、クロッピング領域特定部1603に相当するクロッピング領域特定手段2907、歪み領域特定部1604に相当する歪み領域特定手段2908、歪み領域縮小部1605に相当する歪み領域縮小手段2909、クロッピング領域縮小部1606に相当するクロッピング領域縮小手段2910、ME部1607に相当するME手段2911、MC部1608に相当するMC手段2912、フレームバッファ部1609に相当するフレームバッファ管理手段2913、直交変換部1610に相当する直交変換手段2914、量子化部1611に相当する量子化手段2915、エントロピー符号化部1612に相当するエントロピー符号化手段2916、逆量子化部1613に相当する逆量子化手段2917、逆直交変換部1614に相当する逆直交変換手段2918、歪み領域特定部1615に相当する歪み領域特定手段2919、歪み領域拡大部1616に相当する歪み領域拡大手段2920、画像拡大部1617に相当する画像拡大手段2921、クロッピング領域特定部1618に相当するクロッピング領域特定手段2922をソフトウェア処理により実現する。
また、中央処理制御装置2903は、上記のプログラムにより、エンハンスレイヤ用の符号化処理として、ME部1619に相当するME手段2923、レイヤ間予測部1620に相当するレイヤ間予測手段2924、MC部1621に相当するMC手段2925、フレームバッファ部1622に相当するフレームバッファ管理手段2926、直交変換部1623に相当する直交変換手段2927、量子化部1624に相当する量子化手段2928、エントロピー符号化部1625に相当するエントロピー符号化手段2929、逆量子化部1626に相当する逆量子化手段2930、逆直交変換部1627に相当する逆直交変換手段2931をソフトウェア処理にて実現する。
次に、本発明になる空間スケーラブル復号化プログラムについて説明する。図25は本発明の空間スケーラブル復号化プログラムを実行する情報処理装置の一例のブロック図を示す。図25において、情報処理装置3000は、入力装置3001、出力装置3002、中央処理制御装置3003、外部記憶装置3004、一時記憶装置3005、通信装置3006から構成されており、コンピュータである中央処理制御装置3003により空間スケーラブル符号化装置の機能を空間スケーラブル復号化プログラムにより実現させるものである。
ここで、上記のプログラムは、記録媒体から読み取られて中央処理制御装置3003に取り込まれてもよいし、ネットワークを介して通信装置3006により受信されて中央処理制御装置3003に取り込まれてもよい。
中央処理制御装置3003は、上記のプログラムにより、符号化入力部1702に相当する符号化入力管理手段3022、DEMUX部1703に相当するDEMUX手段3023、画像出力部1709、1712、1715、1718、1727に相当する画像出力管理手段3024をソフトウェア処理にて実現する。また、中央処理制御装置3003は、上記のプログラムにより、ベースレイヤ用の復号化処理とエンハンスレイヤ用の復号化処理をソフトウェア処理にて実現する。
すなわち、中央処理制御装置3003は、上記のプログラムにより、ベースレイヤ用の復号化処理として、エントロピー復号部1704に相当するエントロピー符号化手段3007、逆量子化部1705に相当するエントロピー復号化手段3007、逆量子化部1705に相当する逆量子化手段3008、MC部1706に相当するMC手段3009、フレームバッファ部1707に相当するフレームバッファ管理手段3010、逆直交変換部1708に相当する逆直交変換手段3011、歪み領域特定部1711に相当する歪み領域特定手段3012、歪み領域拡大部1714に相当する歪み領域拡大手段3013、画像拡大部1717に相当する画像拡大手段3014、クロッピング領域特定部1720に相当するクロッピング特定手段3015をソフトウェア処理にて実現する。
また、中央処理制御装置3003は、上記のプログラムにより、エンハンスレイヤ用の復号化処理として、レイヤ間予測部1721に相当するレイヤ間予測手段3016、エントロピー復号部1722に相当するエントロピー復号化手段3017、逆量子化部1723に相当する逆量子化手段3018、MC部1724に相当するMC手段3019、フレームバッファ部1725に相当するフレームバッファ管理手段3020、逆直交変換部1726に相当する逆直交変換手段3021をソフトウェア処理にて実現する。