JP4321484B2 - 空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム - Google Patents

空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム Download PDF

Info

Publication number
JP4321484B2
JP4321484B2 JP2005114440A JP2005114440A JP4321484B2 JP 4321484 B2 JP4321484 B2 JP 4321484B2 JP 2005114440 A JP2005114440 A JP 2005114440A JP 2005114440 A JP2005114440 A JP 2005114440A JP 4321484 B2 JP4321484 B2 JP 4321484B2
Authority
JP
Japan
Prior art keywords
image frame
area
image
spatial resolution
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005114440A
Other languages
English (en)
Other versions
JP2006295600A (ja
Inventor
智 坂爪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2005114440A priority Critical patent/JP4321484B2/ja
Publication of JP2006295600A publication Critical patent/JP2006295600A/ja
Application granted granted Critical
Publication of JP4321484B2 publication Critical patent/JP4321484B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラムに係り、特に動画像に対して空間解像度変換を利用する空間スケーラブル符号化方法、符号化装置、符号化プログラム、復号化方法、復号化装置及び符号化プログラムに関する。
従来のスケーラブル符号化においては図26(A)〜(C)に示すように、ある解像度から縦、横ともに半分ずつ縮小するような空間解像度を設定し、これらの空間解像度を自由に切り替えることができるように構成することで空間方向のスケーラビリティを実現することが一般的である。
また、このような縦、横とも半分ずつ縮小することで得られる空間解像度では対応できない空間解像度、例えば、横1920画素、縦1080画素のHD解像度から、横720画素、縦480画素への空間解像度変換に対しては、図27の画像102,105が示すようなクロッピング処理、図27の縮小画像108,109,110が示すようなレターボックス処理、図31の画像502,503が示すようなスクイーズ処理を行うことにより、HD(High Definition)解像度からSD(Standard Definition)解像度への空間解像度変換を作ったスケーラブル符号化及び復号化を実現している(例えば、特許文献1、特許文献2、特許文献3参照)。
また、16:9や4:3のアスペクト比をもつディスプレイ装置において、より柔軟な空間解像度変換を利用して多様な表示を実現しているものも多く存在する(例えば、特許文献4参照)。
特許第3374989号公報 特開平6−284413号公報 特許第3564087号公報 特開平6−6634号公報
従来は、画像信号に対してスケーラブル符号化及び復号化を行う場合、高解像度の画像信号に対して所定の空間フィルタリング処理を施した後に2:1の割合でダウンサンプリングして、低解像度の画像信号を生成する。例えば、HD解像度の画像信号を所定の空間フィルタリング処理を行った後に2:1の割合でダウンサンプリングして低解像度の画像信号を生成する。
この低解像度の画像信号を符号化して伝送すると、その画像のアスペクト比は元のHD解像度の画像信号のそれの16:9のままである。よって、4:3のアスペクト比であるNTSC方式のテレビジョン受像機において、HD解像度の画像信号からダウンサンプリングして得られた、1/4の解像度の画像信号をモニタすることができないという問題があり、その問題に関しては多くの検討が行われていることで改善が進んでいる。
しかしながら、従来のHD解像度からSD解像度への空間解像度変換を利用した空間解像度スケーラブル符号化においては、いくつかの問題点が生じる。
図27(A)〜(C)は、HD解像度からSD解像度へ空間解像度変換を行う際にクロッピング処埋を用いた例である。ここで説明を簡単にするために、特に断らない限り、以後、水平方向1920画素、垂直方向1080画素(1920×1080画素)をもつ解像度はHD解像度とする。また、水平方向720画素、垂直方向480画素(720×480画素)をもつ解像度はSD解像度とする。
図27において、まず同図(A)に示すHD解像度の動画像の画像フレーム101からより重要な領域を特定して同図(B)に102で示す領域にクロッピング処理を行う。領域102は、同図(C)に示す領域105が示すSD解像度を縦、横ともに2.25倍することで、前の画素をHD解像度の縦の画素と同じ画素領域とし、HD解像度内に収まり、かつ、SD解像度のアスペクト比で表現できる最大の画素領域を用いてHD解像度からクロッピングされた領域である。
その後、図27(B)に102で示す画像フレームを、本来のSD解像度である720×480画素とするために、縦、横ともに1/2.25倍に縮小するための所定のフィルタリング処理を行うことで同図(C)に示すSD解像度に縮小する。このようにして得られたSD解像度の動画像フレーム105は、HD解像度の動画像フレームからクロッピングした領域102内のテクスチャ情報を最大限利用することができる代わりに、図27(B)に103,104で示すようなSD解像度内では表現できない領域が生じてしまう。
図28は、図27が示すようなクロッピング処理を利用して空間スケーラビリティをもつ動画像符号化において、それぞれの空間解像度間の符号化処理を示している。一般に、空間解像度変換を伴う空間スケーラブル符号化では、基本となる空間解像度を持つベースレイヤと、このベースレイヤに対して空間解像度を向上させるための付加情報を持つエンハンスレイヤを設定して符号化を行う。
このエンハンスレイヤは、少なくとも1つのレイヤによって構成される。複数のエンハンスレイヤを用いることで、より細かな解像度のスケーラビリティを実現することができるが、その分複数のエンハンスレイヤを構成するためのオーバヘッド情報が必要となり、符号化効率に影響を与えるため注意が必要である。図28では、同図(A)の201がベースレイヤ、同図(D)の206,207,208がエンハンスレイヤとなる。
図28に示すように、ベースレイヤ201が元のHD解像度からクロッピング処理によって生成したSD解像度に基づいて符号化されるため、ベースレイヤ201を符号化した後に復号化して得られるローカルデコード画像に対して縦、横ともに2.25倍すると、同図(B)に示す画像202を得る。この画像202は、空間スケーラブル符号化においては各レイヤ(図28ではレイヤを階層と表現している)間での予測符号化を行う。
しかし、図28(C)に示すHD解像度のレイヤのローカルデコード画像において、画像202と相関が高い領域は203のみであることから、204、205の領域はレイヤ間の相関を利用することができずに面内符号化であるイントラ符号化の対象領域となる。レイヤ間の予測符号化を行うことで、図28(D)に示すように、領域202と領域203との予測符号化の結果生じるレイヤ間の予測符号情報206と、領域204をイントラ符号化した結果生じるイントラ符号情報207と、領域205をイントラ符号化した結果生じるイントラ符号情報208とを得る。また、予測符号化においては、動きベクトル情報や符号化時の状態を表す情報などを含む各種付加情報であるレイヤ間予測符号化付加情報を得る。この206,207,208及びレイヤ間予測符号化付加情報がエンハンスレイヤを構成するための情報となる。
このように、空間スケーラブル符号化において解像度変換にクロッピング処理を利用した場合には、イントラ符号情報207,208のようなイントラ符号化を伴うため、符号化効率を低下させるとともに、符号化及び復号化時の演算量を増大させる要因となる。
また、図28(D)に示すレイヤ間予測符号情報206を得るレイヤ間予測符号化と、イントラ符号情報207,208を得るイントラ符号化といった別々の符号化を行うことから、復号結果の画像品質にばらつきが生じる。その結果、復号結果の主観的な画像品質に影響を与えるだけでなく、画像品質が均一でないことが更に上位のエンハンスレイヤを構成しようとした際に符号化効率を低下させる要因となる。
図29は、図28と同様に図27が示すようなクロッピング処理を利用して空間スケーラビリティをもつ動画像符号化において、それぞれの空間解像度間の符号化処理を示す。図29は、ベースレイヤに関しては図28と同様である。図29において、エンハンスレイヤに関しては、まず第1のエンハンスレイヤとして図29(A)に示すクロッピング領域外の領域301に対するイントラ符号化結果により構成し、この第1のエンハンスレイヤから再度復号化することで得られるローカルデコード画像302,303を用いる。
また、第2のエンハンスレイヤを構成するために、領域301,画像302,303に対して所定の拡大処理を行うことで図29(B)に示すような画像304,305,306を得る。その後、画像304,305,306と、図29(C)に示すローカルデコード画像307との間でレイヤ間予測符号化を行い、得られた結果を第2のエンハンスレイヤとすることで、空間スケーラビリティをもつ動画像符号化を行うことができる。
しかし、このような構成であっても、図28の構成で起こりうる要因は根本的には改善することが難しい。
図27(A)の画像フレーム101と同図(D)の縮小画像108、及び上記画像フレーム101,同図(E)の画像109,同図(F)の画像110は、それぞれHD解像度からSD解像度へ空間解像度変換を行う際にレターボックス処理を用いた例である。縮小画像108は、画像フレーム101から直接縦横比固定でHD解像度の画像フレーム101に対して所定の空間フィルタリング処理及び縮小処理を行うことで縦、横共に3/8倍し、SD解像度に収めるために上下の領域を所定の画素値、通常は黒を表現するための画素値で補填することで生成された画像である。
図27(E)に示す画像109は、まず、HD解像度の画像フレーム101の横サイズを縦横比固定でSD解像度の2.25倍の横サイズに合わせるために、画像フレーム101に対して所定の空間フィルタリング処理及び所定の縮小処理により縦、横ともに27/32倍するとともに、上下の領域を所定の画素値、通常は黒を表現するための画素値で補填することで生成される。その後、図27(E)に示す画像109に対して所定の空間フィルタリング処理及び所定の縮小処理を行い、縦、横共に1/2.25倍することで図27(F)に示す縮小画像110が生成される。
このような縮小画像108,110が示すSD解像度の動画像フレームは、HD解像度の動画像フレームからレターボックス処理によりSD解像度に内接するように所定の空間フィルタリング及び縮小処理により生成されるため、動画像フレーム101全体の特徴を利用することができる代わりに、図27(C)に示した縮小画像105よりも更に縮小処理を行うため、縮小画像108,110に含まれる領域内のテクスチャ情報、つまり画像の細部を表現するための高周波数成分情報が縮小画像105に比べて少ない状態となってしまう。
図30は、図27が示すようなレターボックス処理を利用して空間スケーラビリティをもつ動画像符号化において、それぞれの空間解像度間の符号化処理を示している。図30では、401がベースレイヤ、405がエンハンスレイヤとなる。まず、図30(A)に示すSD解像度の画像401に対して、上下に充填した画素の除去を行うとともに、所定の空間フィルタリング処理による拡大処理により縦、横ともに8/3倍することで、画像401から図30(C)に示す画像403を直接得る。
もしくは、画像401に対して所定の空間フィルタリング処理による拡大処理により縦、横ともに2.25倍することで図30(B)に示す画像402を得る。その後、画像402に対して上下に充填した画素の除去を行うとともに、所定の空間フィルタリング処理による拡大処理により縦、横ともに32/27倍することで図30(C)に示す画像403を得る。
次に、図30(E)に示す画像405のエンハンスレイヤを構成するために、画像403と図30(D)に示すHD解像度のローカルデコード画像404との間でレイヤ間予測符号化を行い、得られた同図(E)に示すレイヤ間予測符号化情報405をエンハンスレイヤとすることで、空間スケーラビリティをもつ動画像符号化を行うことができる。
このような空間スケーラブル符号化において、解像度変換にレターボックス処理を利用した場合には、図28や図29のような解像度変換にクロッピング処理を用いた場合と比べて、図30(A)に示す画像401に含まれるテクスチャ情報、つまり画像の細部を表現するための高周波数成分情報が少ないため、画像401に対して拡大処理を行って得られた図30(C)に示す画像403は、仮にベースレイヤの符号化の影響が出ないように可逆符号化を適用して符号化及び復号化を行った場合であっても、図28に示した画像202,204,205や図29に示した画像304,305,306と比較して精細感の乏しいボケた画像となる。
従って、解像度変換にレターボックス処理を利用することは、図28や図29のベースレイヤの復号画像の画像品質と比較して、復号化時に得られるベースレイヤの復号画像の画像品質を劣化させる要因となる。また、エンハンスレイヤを利用して図28や図29と同等の画像品質を維持しようとした場合には、より多くの符号量をエンハンスレイヤに割く必要が生じる。
図31(A)、(B)、(D)及び図31(A)、(C)、(D)は、HD解像度からSD解像度へ空間解像度変換を行う際にスクイーズ処理を用いた例を示す。図31(C)に示す画像502は、同図(A)に示すHD解像度の画像フレーム501の横方向に所定の空間フィルタリング処理及び所定の縮小処理により27/32倍することでスクイーズ処理を行うことで生成される。その後、画像502に対して所定の空間フィルタリング処理及び所定の縮小処理を行うことで、縦、横共に1/2.25倍することで図31(D)に示す縮小画像503が生成される。
また、図31(B)に示す画像504は、同図(A)に示すHD解像度の画像フレーム501に対して所定の空間フィルタリング処理及び所定の縮小処理を行うことで、縦、横共に4/9倍することで生成される。その後、画像504の横方向に所定の空間フィルタリング処理及び所定の縮小処理により27/32倍してスクイーズ処理を行うことで図31(D)に示す縮小画像503が生成される。
このようにして得られた縮小画像503が示すSD解像度の動画像フレームは、HD解像度の動画像の画像フレーム501からスクイーズ処理により横方向に対して所定の空間フィルタリング及び縮小処理を行うことで生成されるため、画像フレーム501全体の特徴を利用することができる代わりに、図27(C)に示した縮小画像105よりも横方向に対して更に縮小処理を行うため、図31(D)に示す縮小画像503に含まれる領域内の横方向のテクスチャ情報、つまり画像の細部を表現するための高周波数成分情報が前記縮小画像105に比べて少ない状態となってしまう。
また、前記縮小画像105はより重要とされた領域に対してクロッピング処埋を行った結果得られた画像であり、このクロッピング処理された領域に対しては画像の縦横比を保っているが、スクイーズ処理を行って生成された縮小画像503の場合には、図31(D)に示したように、画像全体に渡って横方向の縮小処理を行うことから本来の画像の縦横比を保つことができずに、画像全体として歪んだ画像となってしまう。
図32は、図31が示すようなスクイーズ処理を利用して空間スケーラビリティをもつ動画像符号化において、それぞれの空間解像度間の符号化処理を示す。図32では、(A)に示す601がベースレイヤ、(E)に示す606がエンハンスレイヤとなる。まず、図32(A)に示すSD解像度の画像601に対して所定の空間フィルタリング処理による拡大処理を行い、縦、横ともに2.25倍することで図32(B)に示す画像603を得る。
その後、スクイーズを解除するために画像603に対して横方向に所定の空間フィルタリング処理による拡大処理を行って32/27倍することで、図32(D)に示す画像604を生成する。もしくは、SD解像度の画像601に対して先にスクイーズを解除することで図32(C)に示す画像602を生成し、その後所定の空間フィルタリング処理による拡大処理により、縦・横ともに2.25倍することで同図(D)に示す画像604を得る。
次に、画像606のエンハンスレイヤを構成するために、画像604と図24(F)に示すHD解像度のローカルデコード画像605との間でレイヤ間予測符号化を行い、得られた図32(E)に示すレイヤ間予測符号化情報606をエンハンスレイヤの画像情報とすることで、空間スケーラビリティをもつ動画像符号化を行うことができる。
このような空間スケーラブル符号化において解像度変換にスクイーズ処理を利用した場合には、図28や図29のような解像度変換にクロッピング処理を用いた場合と比べてベースレイヤの画像601に含まれる横方向のテクスチャ情報、つまり画像の細部を表現するための高周波数成分情報が少ないため、図32のスクイーズ解除及び拡大処理によって得られた画像604は、仮にベースレイヤの符号化の影響が出ないように可逆符号化を適用して符号化及び復号化を行った場合であっても、図28の202,204,205や図21の304,305,306と比較して横方向に対して精細感の乏しいボケた画像となる。
従って、解像度変換にスクイーズ処理を利用することは、図28や図29のベースレイヤの復号画像の画像品質と比較して、復号化時に得られるベースレイヤの復号画像の画像品質を劣化させる要因となる。また、エンハンスレイヤを利用して図28や図29と同等の画像品質を維持しようとした場合には、より多くの符号量をエンハンスレイヤに割く必要が生じる。
更に、スケーラブル復号化時にベースレイヤの復号画像を表示しようとした場合には、スクイーズ処理が施されていることから画像全体が歪んでいるため、正しく表示しようとした場合には画像全体に対して再度スクイーズを解除し、表示対象がSD解像度のアスペクト比である場合には、表示領域に対してクロッピング処理を行わなければならないという問題が生じる。
本発明は以上の点に鑑みなされたもので、スケーラブル符号化及び復号化を行う際に、より効率良く符号化及び復号化できるような、空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラムを提供することを目的とする。
上記の目的を達成するため、第1の発明の空間スケーラブル符号化方法は、高精細な第1の空間解像度を持つ映像から、第1の空間解像度より低い第2の空間解像度をもつ映像まで対応するために、当該映像を構成している画像フレームの空間解像度を変換する空間解像度変換を利用した空間スケーラブル符号化方法であって、
第1の空間解像度を有する映像信号の画像フレームである第1の画像フレームから、第1の画像フレームとは縦横比の異なる第2の空間解像度を有する映像信号の画像フレームである第2の画像フレームを、空間解像度変換を利用して生成するに際し、第1の画像フレーム内で、第2の画像フレームとするための画像領域であるクロッピング領域を特定する第1のステップと、クロッピング領域内で画像形状を歪ませずに空間解像度変換を行う領域である第1のオリジナル領域を特定すると共に、第1の画像フレームにおける第1のオリジナル領域を特定するための情報である第1の領域情報を生成する第2のステップと、クロッピング領域内における第1のオリジナル領域外の領域を、画像形状を歪ませて空間解像度変換を行う領域である第1の歪み領域に特定する第3のステップと、第2の画像フレームのサイズと第1の画像フレームのサイズとの比に応じて、第1のオリジナル領域を第1の縮小方法にて画像形状を歪ませずに縮小して第2のオリジナル領域とすると共に、第1の画像フレームにおける第1のオリジナル領域外の領域を、第1の歪み領域を第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して第2の歪み領域とし、第2の画像フレームにおける第2のオリジナル領域を特定するための情報である第2の領域情報を生成して、第2のオリジナル領域と第2の歪み領域とにより、第2の空間解像度を有する第2の画像フレームを生成する第4のステップと、のステップで生成された第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力する第のステップと、第1の符号化信号を復号化して第2の画像フレームの第1の復号信号を得る第のステップと、第1の復号信号中の第2の歪み領域の画像を元の縦横比の画像とし、かつ、第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の第2の復号信号を得る第のステップと、第1の画像フレームと第2の復号信号との間でレイヤ間予測処理を行う第のステップと、第のステップによるレイヤ間予測処理結果に基づいて、第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成して出力する第のステップとを含むことを特徴とする。
また、上記の目的を達成するため、第2の発明は、高精細な第1の空間解像度を持つ映像から、第1の空間解像度より低い第2の空間解像度をもつ映像まで対応するために、当該映像を構成している画像フレームの空間解像度を変換する空間解像度変換を利用した空間スケーラブル符号化装置であって、
第1の空間解像度を有する映像信号の画像フレームである第1の画像フレームから、第1の画像フレームとは縦横比の異なる第2の空間解像度を有する映像信号の画像フレームである第2の画像フレームを、空間解像度変換を利用して生成するに際し、第1の画像フレーム内で、第2の画像フレームとするための画像領域であるクロッピング領域を特定するクロッピング領域特定手段と、クロッピング領域内で画像形状を歪ませずに空間解像度変換を行う領域である第1のオリジナル領域を特定すると共に、第1の画像フレームにおける第1のオリジナル領域を特定するための情報である第1の領域情報を生成する領域特定・領域情報生成手段と、クロッピング領域内における第1のオリジナル領域外の領域を、画像形状を歪ませて空間解像度変換を行う領域である第1の歪み領域に特定する第1の歪み領域特定手段と、第2の画像フレームのサイズと第1の画像フレームのサイズとの比に応じて、第1のオリジナル領域を第1の縮小方法にて画像形状を歪ませずに縮小して第2のオリジナル領域とすると共に、第1の画像フレームにおける第1のオリジナル領域外の領域を、第1の歪み領域を第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して第2の歪み領域とし、第2の画像フレームにおける第2のオリジナル領域を特定するための情報である第2の領域情報を生成して、第2のオリジナル領域と第2の歪み領域とにより、第2の空間解像度を有する第2の画像フレームを生成する第2の画像フレーム生成手段と、第2の画像フレーム生成手段で生成された第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力する第1の符号化手段と、第1の符号化信号を復号化して第2の画像フレームの第1の復号信号を得る第1の復号化手段と、第1の復号信号中の第2の歪み領域の画像を元の縦横比の画像とし、かつ、第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の第2の復号信号を得る第2の復号化手段と、第1の画像フレームと第2の復号信号との間でレイヤ間予測処理を行う予測処理手段と、レイヤ間予測処理結果に基づいて、第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成して出力する第2の符号化手段とを有することを特徴とする。
上記の第1及び第2の発明では、第1の画像フレーム内の予め設定した第1の領域の画像に対しては縦横比を変化させず、かつ、第1の領域以外の第1の画像フレーム内の第2の領域の画像に対しては所定のフィルタリング処理及び縮小処理を行うことにより縦横比を変化させた構成の、部分的に画像の歪みを伴った第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力する。また、第1の符号化信号を復号化し、更に所定の処理を行って縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の復号信号を得、その復号信号と第1の画像フレームとの間でのレイヤ間予測処理結果に基づいて、第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成出力する。
また、上記の目的を達成するため、第3の発明は、高精細な第1の空間解像度を持つ映像から、第1の空間解像度より低い第2の空間解像度をもつ映像まで対応するために、当該映像を構成している画像フレームの空間解像度を変換する空間解像度変換を利用した空間スケーラブル符号化を、コンピュータにより実行させる空間スケーラブル符号化プログラムであって、第1の発明の各ステップをコンピュータにより順次に実行させることを特徴とする。
また、上記の目的を達成するため、第4の発明は、第1の空間解像度を有する映像信号の第1の画像フレームから変換された、第1の空間解像度よりも低い第2の空間解像度を有する第2の画像フレームの映像信号を、当該映像信号を構成している画像フレーム単位で、再度、第1の空間解像度を有する映像信号に変換する空間解像度変換を利用した空間スケーラブル符号化方法により符号化されて出力された、第1及び第2の符号化信号を復号化する空間スケーラブル復号化方法であって、
復号化対象の第1の符号化信号は、第1の画像フレーム内で第2の画像フレームとするための画像領域である第1のクロッピング領域内において空間解像度変換を行う第1のオリジナル領域を、第2の画像フレームのサイズと第1の画像フレームのサイズとの比に応じて、第1の縮小方法にて画像形状を歪ませずに縮小して得られた第2のオリジナル領域と、第1の画像フレームにおける第1のオリジナル領域外の領域を、第1の歪み領域を第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して得られた第2の歪み領域とよりなる第2の画像フレームに対して符号化処理して得られた符号化信号であり、
復号化対象の第2の符号化信号は、第1の符号化信号を復号して得た第2の画像フレームの第1の復号信号中の第2の歪み領域の画像を元の縦横比の画像とし、かつ、第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより得られた、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の第2の復号信号と、第1の画像フレームとの間で行ったレイヤ間予測処理結果に基づいて、第1の画像フレームに対して符号化処理して得られた符号化信号であり、
第1の符号化信号に対して復号化処理を行って第2のオリジナル領域と第2の歪み領域とからなる第2の画像フレームの第3の復号信号を得る第1のステップと、第1のステップにより得られた第3の復号信号中の第2の歪み領域の画像を、第1の画像フレームの元の縦横比の画像とし、かつ、復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等で、クロッピング領域の第4の復号信号を生成する第2のステップと、第2の符号化信号に対して復号化処理を行って第1の空間解像度の第5の復号信号を出力する第3のステップと、第4の復号信号と第5の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って第1の画像フレームの復号信号を生成して出力する第4のステップとを含むことを特徴とする。
また、上記の目的を達成するため、第5の発明は、第1の空間解像度を有する映像信号の第1の画像フレームから変換された、第1の空間解像度よりも低い第2の空間解像度を有する第2の画像フレームの映像信号を、当該映像信号を構成している画像フレーム単位で、再度、第1の空間解像度を有する映像信号に変換する空間解像度変換を利用した空間スケーラブル符号化方法により符号化されて出力された、第1及び第2の符号化信号を復号化する空間スケーラブル復号化装置であって、
復号化対象の第1の符号化信号は、第1の画像フレーム内で第2の画像フレームとするための画像領域である第1のクロッピング領域内において空間解像度変換を行う第1のオリジナル領域を、第2の画像フレームのサイズと第1の画像フレームのサイズとの比に応じて、第1の縮小方法にて画像形状を歪ませずに縮小して得られた第2のオリジナル領域と、第1の画像フレームにおける第1のオリジナル領域外の領域を、第1の歪み領域を第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して得られた第2の歪み領域とよりなる第2の画像フレームに対して符号化処理して得られた符号化信号であり、
復号化対象の第2の符号化信号は、第1の符号化信号を復号して得た第2の画像フレームの第1の復号信号中の第2の歪み領域の画像を元の縦横比の画像とし、かつ、第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより得られた、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の第2の復号信号と、第1の画像フレームとの間で行ったレイヤ間予測処理結果に基づいて、第1の画像フレームに対して符号化処理して得られた符号化信号であり、
第1の符号化信号に対して復号化処理を行って第2のオリジナル領域と第2の歪み領域とからなる第2の画像フレームの第3の復号信号を得る第1の復号手段と、第1の復号手段により得られた第3の復号信号中の第2の歪み領域の画像を、第1の画像フレームの元の縦横比の画像とし、かつ、復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等で、クロッピング領域の第4の復号信号を生成する第2の復号手段と、第2の符号化信号に対して復号化処理を行って第1の空間解像度の第5の復号信号を出力する第3の復号手段と、第4の復号信号と第5の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って第1の画像フレームの復号信号を生成して出力する第4の復号手段とを有することを特徴とする。
第4及び第5の発明では、第1の符号化信号を復号化し、更に所定の処理を行うことにより、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の第4の復号信号を生成し、また、第2の符号化信号に対して復号化処理を行って得た第5の復号信号と第4の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って第1の画像フレームの復号信号を生成する。
また、上記の目的を達成するため、第6の発明は、第1の発明の空間スケーラブル符号化方法により符号化されて出力された、第1及び第2の符号化信号を復号化する空間スケーラブル復号化を、コンピュータにより実行させる空間スケーラブル復号化プログラムであって、コンピュータに、第4の発明の空間スケーラブル復号化方法の各ステップを順次に実行させることを特徴とする。
本発明の空間スケーラブル符号化方法、符号化装置及び符号化プログラムによれば、空間解像度方向に対するスケーラブル符号化を行う場合には、第1の空間解像度の第1の画像フレーム内の予め設定した第1の領域の画像に対しては縦横比を変化させず、かつ、第1の領域以外の第1の画像フレーム内の第2の領域の画像に対しては所定のフィルタリング処理及び縮小処理を行うことにより縦横比を変化させた構成の、部分的に画像の歪みを伴った第2の空間解像度の第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力し、また、第1の符号化信号を復号化し、更に所定の処理を行って縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の復号信号を得、その復号信号と第1の画像フレームとの間でのレイヤ間予測処理結果に基づいて、第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成出力するようにしたため、以下の特長を有する。
(1)本発明では、従来のクロッピング処理では欠落していたクロッピング領域外の画像情報を、第2の画像フレーム内に反映できるため、従来欠落していた領域に対して行っていたイントラ符号化を行うことなく、レイヤ間の相関を利用して符号化するレイヤ間予測の結果に基づいて符号化を行うことにより、符号化効率を向上させることができる。
(2)本発明によれば、第1の画像フレーム内の予め設定した第1の領域の画像に対しては縦横比を変化させず、第1の領域内の画素を保護した空間解像度変換を行うようにしていることため、レイヤ間の相関を利用して符号化するレイヤ間予測において、画像品質の良いベースレイヤ画像フレームを予測フレームとして利用することで符号化効率を向上させることができる。
(3)本発明によれば、第2の画像フレーム中の歪みのある画像領域へ格納する際の縮小率を変化させることができるため、必要に応じて画像情報として重要な部分の周波数成分情報をできるだけ維持しつつ、歪みのある画像領域へ格納できることである。よって、スケーラブル符号化を行う際に、歪み領域に対するレイヤ間予測の効率が改善し、符号化効率を向上させることができる。
また、本発明の空間スケーラブル復号化方法、復号化装置及び復号化プログラムによれば、第1の符号化信号を復号化し、更に所定の処理を行うことにより、縦横比が第1の画像フレームの縦横比と等しく、かつ、空間解像度が第1の空間解像度と同等の第4の復号信号を生成し、また、第2の符号化信号に対して復号化処理を行って得た第5の復号信号と第4の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って第1の画像フレームの復号信号を生成するようにしたため、以下の特長を有する。
(4)空間解像度方向に対するスケーラブル復号化において、より低い第2の空間解像度では部分的に画像の歪みを伴った第2の画像フレームの復号信号を得ることができる。また、第2の画像フレームの復号信号中の画像の歪みのある領域の一部を元に戻し、再度拡大処理を行うことで従来のクロッピング処理では得られることができない領域を表示領域とすることができる。よって従来よりも多様な復号画像を得ることができる。
(5)空間解像度方向に対するスケーラブル復号化において、従来のスクイーズ処理によるHD解像度からSD解像度への変換では変換した画像全体が歪んでしまうため、SD解像度をそのまま表示することは視覚的に問題を生じていたが、本発明では視覚上重要な部分を歪ませることなく、第2の解像度(SD解像度)の第2の画像フレーム内に格納することができるため、復号時の第2の画像フレームをそのまま表示した場合であっても視覚的な影響を軽減できる。
(6)空間解像度方向に対するスケーラブル復号化において、従来のスクイーズ処理によるHD解像度からSD解像度への変換では変換した画像全体が歪んでしまうため、SD解像度を表示するためには再度スクイーズを解除するために拡大処理を行った後に表示領域を再度クロッピング処理を行った上で表示する必要があったが、本発明では表示したい領域に含まれる歪み領域部に対してのみ拡大処理を行えばよいため、表示に至るまでの処理を削減できる。
(7)本発明によれば、部分的に画像の歪みを伴った第2の空間解像度の第2の画像フレーム中の、第1の空間解像度の第1の画像フレームと縦横比が同一である領域を必要に応じて自由に設定することができるため、画質を維持したい領域を自由に設定できる。このため、符号化効率に影響を与え易い領域を、上記の縦横比が空間解像度変換前と後で同一である上記の領域に選択することで、符号化効率を向上させることができる。
(8)本発明によれば、画質を維持したい領域を自由に設定できるため、復号後の第2の解像度の第2の画像フレームをそのまま表示した場合であっても、画質を維持したい領域に対する視覚的な影響を軽減できる。
次に、本発明の実施の形態について図面と共に説明する。本発明は、HD解像度からSD解像度へ空間解像度変換を行う際に、変換対象となるSD解像度の画像領域内に、HD解像度内においてできるだけ本来の画像情報を維持するための領域であるオリジナル領域を設けると共に、HD解像度内の本来の画像情報を多少犠牲にしつつも、可能な限りSD解像度内にHD解像度内の画像情報の特徴を取り込むための領域である歪み領域をオリジナル領域の外側かつSD解像度の画像領域内に設けるものである。
図1は本発明になる空間スケーラブル符号化方法及び符号化装置により空間解像度変換を行う画像領域の一例の説明図を示す。HD解像度の画像領域は、エンハンス領域であるものとする。図1では、エンハンス領域を定義するために、領域11の左上の座標をE(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。換言すると、領域11は、HD解像度の画像領域であり、エンハンス領域である。
また、SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域12の左上の座標をC(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。換言すると、領域12は、SD解像度の画像領域であり、クロッピング領域である。更に、オリジナル領域を定義するために、領域13の左上の座標をO(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。このオリジナル領域13はクロッピング領域12内にある。
このオリジナル領域13は、エンハンス領域11のHD解像度の画像を歪ませずに元のままの縦横比で画像が格納される領域である。これに対し、クロッピング領域12内で、かつ、オリジナル領域13の外側の領域は、オリジナル領域13の外側にあるエンハンス領域11のHD解像度の画像情報を所定のフィルタリング及び縮小処理して歪ませて取り込んだ画像情報の領域(歪み領域)である。すなわち、クロッピング領域12内で、かつ、オリジナル領域13の外側の領域は、HD解像度内の本来の画像情報を多少犠牲にしつつも、可能な限りSD解像度のクロッピング領域12内にHD解像度内の画像情報の特徴を取り込むための歪み領域である。
図2は本発明の空間スケーラブル符号化方法及び符号化装置により用いる空間解像度変換によって一般的な横1920画素、縦1080画素のHD解像度から、横720画素、縦480画素のSD解像度へ空間解像度変換を行う処理過程を示す。また、図3は本発明の空間スケーラブル符号化方法及び符号化装置により用いる空間解像度変換方法の一例の処理説明用フローチャートである。この図2と図3を用いて本発明の一実施の形態で用いる空間解像度変換の処理過程を以下に説明する。
まず、高精細なHD解像度の画像フレームを取得する(図3のステップS101)。図2(A)に21で示すHD解像度の全画像領域をエンハンス領域(図1の11に相当)とする。続いて、このエンハンス領域21内のクロッピング領域(図1の12に相当)を特定する(図3のステップS102)。このステップS102では、図2(A)に点線で示されるように、SD解像度の画像領域を2.25倍することでクロッピング領域の縦の大きさをHD解像度の画像領域の縦の大きさに合わせる。また、クロッピング領域の横方向に対しては所定の位置とすることで、エンハンス領域21内に図2(A)に点線の四角形で示されるクロッピング領域22を設定する。
ここでは、図2(A)に点線の四角形で示すように、クロッピング領域22をクロッピング領域の外側の領域が均等になるように配置している。これは、一般に画面内の中央付近に映像としてより重要な内容が含まれることを想定した場合に相当する。ただし、クロッピング領域の配置は、エンハンス領域21内であれば特に限定されるものではなく、SD解像度に変換した際に、より映像の特徴を残すことができる位置に配置することが望ましい。
次に、画像情報を維持するためのオリジナル領域(図1の13に相当)の形状を特定する(図3のステップS103)とともに、オリジナル領域を設定する(図3のステップS104)。ここでは、オリジナル領域の形状は矩形とし、オリジナル領域を図2(B)に23で示す位置に設定している。なお、オリジナル領域の形状は、図4に示されるような形状モードIDが与えられることにより特定することができるようにするとよい。このオリジナル領域23の配置は、クロッピング領域22内であれば特に限定されるものではない。
次に、歪み領域を設定する(図3のステップS105)。ここでは、クロッピング領域外に存在する通常であれば情報が欠落してしまう領域の分だけクロッピング領域側に折り返した分の領域を歪み領域とする。すなわち、クロッピング領域22内で、かつ、オリジナル領域23の外側の2つの領域が歪み領域(後述の図2(C)の26,27に相当)に設定される。これにより、図2(B)に示すように、オリジナル領域23の外の左側の領域24の画像情報と、オリジナル領域23の外の右側の領域25の画像情報とが、それぞれの歪み領域(後述の図2(C)の26,27に相当)に格納される縮小処理対象となる。
続いて、この縮小処理対象となる領域24,25の画像情報に対して、縮小方法を特定し(図3のステップS106)、横方向に対する所定の空間フィルタリング処理及び縮小処理を行い(図3のステップS107)、その結果を歪み領域に格納する(図3のステップS108)。このような処理を行うことで、図2(C)に示すように、オリジナル領域23と、歪み領域26及び27とからなるクロッピング領域22を生成する。
この図2(C)に示すクロッピング領域22は最終目標であるSD解像度の領域の縦,横ともに2.25倍した領域であることから、このオリジナル領域23と、歪み領域26及び27とからなるクロッピング領域の画像情報に対して所定の空間フィルタリング及び縮小処理により1/2.25倍に縮小する処理を行うことで、図2(E)に示すように、オリジナル領域28及び歪み領域31,32で構成される最終目標である、空間解像度変換後のSD解像度の大きさの画像を得ることができる(図3のステップS109)。
なお、上記の説明では、図2(B)に示したオリジナル領域23の外側の領域24、25の画像情報に対して縮小処理を行うものとして説明したが、図2(B)に示した全体の画像領域の画像情報に対して所定の空間フィルタリング及び縮小処理を行い、1/2.25倍に縮小して、図2(D)に示すような領域28,29,30からなる縮小画像を得た後、その縮小画像のオリジナル領域28の外側の領域29、30の画像情報に対して所定の空間フィルタリング及び縮小処理を行い、その結果を歪み領域31、32に格納することで、図2(E)に示した、オリジナル領域28及び歪み領域31,32で構成される最終目標である、空間解像度変換後のSD解像度の大きさの画像を得るようにしてもよい。
更に、以上の実施の形態では、いずれも歪み領域については2段階の縮小処理を行っているが、図2(B)に示す全領域の画像情報のうち、オリジナル領域23の外の左側の領域24の画像情報と、オリジナル領域23の外の右側の領域25の画像情報に対しては、横方向及び縦方向に対して同時に1段階の所定の空間フィルタリング及び縮小処理を行い、その結果を同図(E)に示す歪み領域31、32に格納すると共に、オリジナル領域23に対しても1回の所定の空間フィルタリング及び縮小処理を行うことにより1/2.25倍に縮小する処理を行って同図(E)に示すオリジナル領域28を得るようにしてもよい。
このような処理を行うことで、オリジナル領域28に対しては従来のクロッピング処理と同等の画像品質を維持し、従来のスクイーズ処理によるHD解像度からSD解像度への変換で生じていた画像全体の歪みは視覚上重要なオリジナル領域28では発生せず、視覚的な影響を軽減できる。更に、上記の実施の形態では、歪み領域31、32に対してはクロッピング領域以外のエンハンス領域に含まれる画像情報を最も少ない劣化で格納することができ、従来のクロッピング処理では欠落していたクロッピング領域外の画像情報をクロビング領域内に反映することができる。
次に、本発明の空間スケーラブル符号化方法及び符号化装置で用いる空間解像度変換における縮小方法について説明する。図5は所定の空間フィルタリングを行った後の縮小処理、つまり画素の再配置の様子の一例を示す。ここでは説明を簡単にするため、図2のような空間解像度変換を行うものとする。図5において、オリジナル領域と歪み領域との境界を原点とし、クロッピング領域の境界までの長さをB、エンハンス領域の境界までの長さをAとしている。図2の例では、同図(B)に示す領域23や24の横方向の長さをA、同図(C)に示す歪み領域26や27の横方向の長さをBであるとする。また、一般的には、図1のように、オリジナル領域13と歪み領域との境界を基準として、DEO1,DEO2,DEO3,DEO4は上記のAに対応し、DCO1,DCO2,DCO3,DCO4は上記のBに対応する。
図5において、41は、区間Aの領域に含まれる画素の位置を区間Bの領域に含まれる画素に再配置を行うための変換式の一例である。変換式41の定義域は42に示すものとする。変換式41中のγが”1”の場合は、図5(A)に43で示す特性の変換及び同図(B)に示すような変換となる。上記のγが”1”よりも小さくなるにつれて、図5(A)に示す特性44及び同図(C)、同図(A)に示す特性45及び同図(D)といったように、オリジナル領域と歪み領域との境界である原点から離れるにつれて縮小率が変化するように画素を再配置することができる。
また、所定の空間フィルタリングで用いられる手法としては、一般には、下記の数1で表わされるフィルタ特性のLanczos2,あるいは下記の数2で表わされるフィルタ特性のLanczos3などを用いる。
Figure 0004321484
Figure 0004321484
なお、所定の空間フィルタリングで用いられる手法としては、上記以外の周波数変換に基づく縮小方法、ローパスフィルタを利用した手法であっても構わず、本発明において特に限定されるものではないことに注意する。
次に、オリジナル領域に隣接する領域に対する解像度変換処理の様子について説明する。図6(A)、(B)、(C)、(D)は、オリジナル領域の上側、下側、左側、右側の領域に対する解像度変換処理の様子を示す。図6(A)に示すオリジナル領域13の上側に存在する領域52が歪み領域であり、領域51,52に含まれる画像に対して、所定の空間フィルタリング及び縮小処理を行うことで、歪み領域52に格納する。すなわち、図6(A)に51,52で示すようにオリジナル領域13の外の上側の画素領域に対して、歪み領域52に収まるように所定のフィルタリングによる縮小処理を行い、歪み領域52に格納する。
また、図6(B)に示すオリジナル領域13の下側の領域53及び54、同図(C)に示すオリジナル領域13の左側の領域55及び56、同図(D)に示すオリジナル領域13の右側の領域57及び58に対しても所定の空間フィルタリング及び縮小処理を行うことで、同様に歪み領域54、56、58にそれらの領域の画像情報を格納する。その後、本来のSD解像度を得るために所定のフィルタリングによる縮小処理を行うことで、HD解像度からSD解像度への変換を行う。
また、図7(A)、(B)、(C)、(D)は、オリジナル領域の左上側、左下側、右上側、右下側の領域に対する解像度変換処理の様子を示す。図7(A)に示すオリジナル領域13の左上側に存在する領域62が歪み領域であり、領域61,62に含まれる画像に対して、所定の空間フィルタリング及び縮小処理を行うことで、歪み領域62に格納する。
また、図7(B)に示すオリジナル領域13の左下側の領域63及び64、同図(C)に示すオリジナル領域13の右上側の領域65及び66、同図(D)に示すオリジナル領域13の右下側の領域67及び68に対しても所定の空間フィルタリング及び縮小処理を行うことで、同様に歪み領域64、66、68にそれらの領域の画像情報を格納する。
また、図8(A)、(B)、(C)、(D)は、オリジナル領域の上側、下側、左側、右側の領域に対する解像度変換処理の様子を示す。図8(A)に示すオリジナル領域13の上側に存在する領域72が歪み領域であり、領域71,72に含まれる画像に対して、所定の空間フィルタリング及び縮小処理を行うことで、歪み領域72に格納する。
また、図8(B)に示すオリジナル領域13の下側の領域73及び74、同図(C)に示すオリジナル領域13の左側の領域75及び76、同図(D)に示すオリジナル領域13の右側の領域77及び78に対しても所定の空間フィルタリング及び縮小処理を行うことで、同様に歪み領域74、76、78にそれらの領域の画像情報を格納する。
ここで、図6のような処理では縦方向及び横方向の処理が別々に行われるため、図7に示した左上側、右上側、左下側、右下側の領域61〜68に対しては空間的なフィルタリング及び縮小処理を行うことで図8で示す領域とは別の処理を行っても構わない。図8で示す領域71〜78に対しては、図6で示したような横方向、縦方向のフィルタリング及び縮小処理を行う。このように、図6のフィルタリング及び縮小処理にてオリジナル領域に隣接する領域に対する解像度変換処理を行うか、図7と図8のフィルタリング及び縮小処理を組み合わせてオリジナル領域に隣接する領域に対する解像度変換処理を行う。
次に、上記の空間解像度変換方法を用いた本発明の空間スケーラブル符号化方法について図9の画像変換の過程を示す図を用いて説明する。まず、空間スケーラブル符号化を行うにあたり、元のHD解像度をもつ画像フレームを利用して、本発明の空間解像度変換処理を図2に示すように行うことで、図2(E)に示すオリジナル領域28及び歪み領域31と32で構成されるSD解像度の大きさの画像フレームを得る。
このオリジナル領域と歪み領域を含むSD解像度の画像フレームをベースレイヤとし、このベースレイヤに対して所定の符号化を行う。エンハンスレイヤは、図9(F)の元のHD解像度を持つ画像フレーム97とする。その後、所定の復号化を行うことで、図9(A)に示すように、オリジナル領域81及び歪み領域82,83で構成されるSD解像度の大きさの復号画像フレームを得る。領域81,82,83は、図2(E)の領域28,31,32に相当する。なお、図9(A)及び(B)にハッチングを付して示す領域は、本来のHD解像度では画像が存在していたが、前述した歪み処理によって必要なくなった存在しない領域を仮想的に示したものである。
このオリジナル領域81及び歪み領域82,83からなる復号画像フレームのクロッピング領域の全体に対して所定の空間フィルタリング及び拡大処理により2.25倍に拡大することで、図9(B)に示すように、拡大されたオリジナル領域89と歪み領域90,91からなる画像フレームのクロッピング領域を得る。その後、歪み領域90,91に対して所定の空間フィルタリング及び拡大処理を行い、その処理結果をオリジナル領域89の外側に格納することで、図9(D)に示すオリジナル領域89と横方向の歪みが解消された領域92,93とからなるHD解像度の画像フレームを得る。
なお、上記の処理の替わりに、図9(A)の歪み領域82,83に対して先に所定の空間フィルタリング及び拡大処理を行い、その処理結果をオリジナル領域の外側に格納することで、同図(C)に示すようなオリジナル領域81と横方向の歪みが解消された領域86,87からなるクリッピング領域の画像フレームを取得し、この画像フレーム全体に対して所定の空間フィルタリング及び2.25倍の拡大処理を行うことにより、同様に図9(D)に示すオリジナル領域89と歪みが解消された領域92,93からなるHD解像度の拡大画像フレームを得るようにしてもよい。
あるいは、以上の歪み領域の2段階の拡大処理に替えて、図9(A)の歪み領域82,83に対して先に所定の空間フィルタリング及び拡大処理を行うと共に、オリジナル領域81に対しては所定の空間フィルタリング及び2.25倍の拡大処理を行うことにより、直接に図9(D)に示したオリジナル領域89と歪みが解消された領域92,93からなるHD解像度の拡大画像フレームを得るようにしてもよい。
その後、ベースレイヤから得られた図9(D)に示す画像フレームと、図9(F)に示すエンハンスレイヤ97との間で階層間の予測符号化を行う。なお、図9(F)中、点線で囲んだ領域97は、クロッピング領域を示す。この階層間の予測符号化によって得られた図9(E)に示すレイヤ間の予測符号情報98に対して所定の符号化を行うことで、エンハンスレイヤの符号化出力を得る。このような処理を行うことで、本発明の空間スケーラブル符号化方法を実現することができる。
また、本発明の空間スケーラブル復号化方法の一実施の形態としては、符号化方法で行ったベースレイヤの復号処理と同様の処理を行うことで、図9(D)に示したオリジナル領域89と歪みが解消された領域92,93からなるHD解像度の拡大画像フレームを得ると共に、エンハンスレイヤの復号処理を行うことで図9(E)に示すレイヤ間の予測符号情報98を得る。その後、ベースレイヤとエンハンスレイヤとの間で階層間の予測復号化を行い、図9(F)に示すクロッピング領域97を復号する。これにより、本発明の空間スケーラブル復号化方法の一実施の形態を実現することができる。
次に、ベースレイヤであるSD解像度からエンハンスレイヤであるHD解像度への、拡大方向の本発明の解像度変換方法の一実施の形態について、更に図10及び図11と共に説明する。図10は拡大方向の本発明の解像度変換方法の一実施の形態の概念図を示す。
図10(A)に示すSD解像度のベースレイヤ画像から同図(D)に示すHD解像度のエンハンスレイヤ画像に拡大方向の解像度変換を行う場合、少なくともエンハンスレイヤ画像の領域07の左上端E1と右下端E2の各座標(XE1,YE1)、(XE2,YE2)と、オリジナル領域06の左上端E3と右下端E4の各座標(XE3,YE3)、(XE4,YE4)、若しくはエンハンスレイヤ画像の2つの領域06、07を特定するためのこれらの座標情報を取得するための代替情報が必要となる。つまり、E3、E4によってエンハンスレイヤ側で対応するオリジナル領域06を特定できる。その周囲の領域07は、歪み領域を元に戻した後の画像を格納する領域である。
また、図10(A)に示すベースレイヤ画像の領域02の左上端B1と右下端B2の各座標(XB1,YB1)、(XB2,YB2)と、オリジナル領域01の左上端B3と右下端B4の各座標(XB3,YB3)、(XB4,YB4)、若しくはベースレイヤ画像の2つの領域01、02を特定するためのこれらの座標情報を取得するための代替情報が必要となる。つまり、B3、B4によってベースレイヤ側のオリジナル領域01を特定できる。その周囲の領域02は、歪み領域である。
なお、座標の基準点は、説明を簡単にするため、E1、B1を(0,0)として説明する。また、B2,B3,B4はB1を基準にした図であるものとする。次に、図11のフローチャートと共に本実施の形態の空間解像度変換動作について説明する。まず、SD解像度のベースレイヤ画像のオリジナル領域の形状を特定するための情報を取得することで、オリジナル領域(図10(A)の01)の形状を特定し(ステップS201)、続いてHD解像度からSD解像度に変換したときに得られるE1、E2、E3、E4、及びB1、B2、B3、B4の座標情報を取得する(ステップS202)。若しくは、エンハンスレイヤ及びベースレイヤに含まれる各領域を特定するための座標情報を取得するための代替情報を取得し、これらの座標を特定する。これらの情報からオリジナル領域を特定する(ステップS203)。
次に、クロッピング領域を特定する(ステップS204)。このステップS204の処理では、説明を簡単にするために図10(B)に示す仮想画像Mを考える。この仮想画像Mの左上端M1と右下端M2によって特定できる領域がエンハンスレイヤ画像内で対応するクロッピング領域となる。そこで、このM1、M2によって特定できる領域の求め方を以下説明する。
まず、ベースレイヤ画像のオリジナル領域01の点B3、B4と、エンハンスレイヤ画像のオリジナル領域の点E3、E4に注目する。これらの点の座標からベースレイヤ画像のオリジナル領域01を、エンハンスレイヤ画像の対応するオリジナル領域06に拡大するための拡大率を算出する。拡大率は点B3、B4及びE3、E4から得られる各領域の対応する辺同士の比から算出する。
求めた拡大率に基づいて、図10(A)のベースレイヤ画像を拡大すると、同図(B)の仮想画像Mのような拡大したオリジナル領域を含むベースレイヤ画像が得られる。拡大処理により、B1はM1、B2はM2、B3はM3、B4はM4に対応する。
しかし、この段階では、図10(B)の点M1、M2、M3、M4は、同図(D)のエンハンスレイヤ画像内のどの部分に対応するかが分からないため、M3とE3、M4とE4の座標が対応するように、仮想画像Mの点M1、M2、M3、M4の座標を平行移動して対応させる。このような処理を行うことで、M1、M2がエンハンスレイヤ画像内のどの位置に対応するかを特定する。このようにして修正したM1、M2の座標をエンハンスレイヤ画像内の対応するクロッピング領域として特定する。
次に、クロッピング領域内で、かつ、オリジナル領域の外側の歪み領域を特定する(ステップS205)。ここでは、図10(D)のE1、E2、E3、E4の関係から歪み領域07を特定する。また、ベースレイヤ画像から歪み領域を先に元に戻す必要がある場合は、E1、E2、E3、E4の座標から特定されるエンハンスレイヤ画像の大きさを仮想画像Mを作成した時の拡大率の逆数により縮小率を算出し、エンハンスレイヤ画像の各座標を縮小率を用いて縮小することで図10(C)に示す仮想画像Nを生成する。
生成した仮想画像Nの左上端N1、右下端N2からなる領域内の点N3、N4によって特定されるオリジナル領域の外側の領域を特定することができる。これらの領域に対して、本実施の形態の解像度変換方法を用いて歪みを元に戻すことができる。
次に、歪み領域に含まれる画像を拡大する際の拡大方法を特定するための情報を取得することで拡大方法を特定し(ステップS206)、その特定した拡大方法によって歪み領域を元に戻すための拡大処理を行う(ステップS207)。歪み領域を元に戻した後の画像をオリジナル領域外に格納する(ステップS208)。これにより、例えば仮想画像Nのオリジナル領域04の外側の領域05に歪み領域の画像情報を元に戻した画像情報が格納される。
最後に、クロッピング領域に含まれる画像を所定の拡大方法により拡大する(ステップS209)。ここでは、仮想画像Mを想定する場合は、ステップS204のクロッピング領域特定ステップにおいてクロッピング領域の拡大を行ってもよい。また、クロッピング領域内に含まれる画像であるベースレイヤ画像内のオリジナル領域に対して拡大処理を行ってもよい。また、仮想画像Nを想定する場合は、ベースレイヤ画像から仮想画像Nを作成するために歪み領域拡大ステップS207を行った後、仮想画像NのN1、N2の座標から特定される縮小後のクロッピング領域に対してステップS208の拡大処理を行う。このときの拡大では、E3、E4、B3、B4の関係から求めた拡大率を利用する。
なお、以上の実施の形態では、説明を簡単にするために図1を用いて本発明で利用する各領域について説明している。この説明において、オリジナル領域は矩形であるものとして話を進めているが、必ずしもオリジナル領域は矩形である必要はない。図12から図17は、オリジナル領域の形状について示した概念図である。
図12は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第1の例の説明図を示す。この例では、オリジナル領域1003として回転を許容した長方形を採用した場合の例である。図1で示されたオリジナル領域13の長方形では、長方形を定義するために左上の座標O(X,Y)と、長方形の横の大きさW,縦の大きさHを採用していたため、オリジナル領域13に対して長方形を回転させた領域を定義することが難しかった。
そこで、図12の例では、オリジナル領域1003の長方形の中心座標O(X,Y)と長方形の左上の座標S1(Xs1,Ys1)を腕の長さとした座標形式で定義する。ここでは、中心座標をO、補助座標をS1としている。なお、図12ではエンハンス領域を定義するために、領域1001の左上の座標をE(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1002の左上の座標をC(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。
図13は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第2の例の説明図を示す。この例では、オリジナル領域1103として円形を採用した場合の例である。この場合も同様に中心座標O、補助座標をS1としている。また、図13ではエンハンス領域を定義するために、領域1101の左上の座標をE(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1102の左上の座標をC(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。
図14は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第3の例の説明図を示す。この例では、オリジナル領域1203として回転を許容したひし形を採用した場合の例である。ひし形の場合、対角線の長さが縦方向と横方向で異なることから、中心座標O、補助座標S1,補助座標S2を定義する。また、図14では、エンハンス領域を定義するために、領域1201の左上の座標をE(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1202の左上の座標をC(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。
図15は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第4の例の説明図を示す。この例では、オリジナル領域1303として回転を許容した楕円形を採用した場合の例である。オリジナル領域1303の楕円形は2つの焦点が必要となるが、他の形状との整合性を保つため中心座標Oを採用し、1つ目の焦点座標を補助座標S1として中心座標Oと補助座標S1からもうひとつの焦点座標を計算することで2つの焦点を特定する。また、楕円上に補助座標S2を定義することで、回転を許容した楕円形を定義することができる。
また、図15では、エンハンス領域を定義するために、領域1301の左上の座標をE(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1302の左上の座標をC(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。
図16は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第5の例の説明図を示す。この例では、オリジナル領域1403として回転を許容した多角形を採用した場合の例である。オリジナル領域1403の中心座標O、補助座標S1を定義することで、まず円形を想定し、円周を等分する距離に補助座標S2を定義することで、回転を許容した多角形を定義することができる。
また、図16では、エンハンス領域を定義するために、領域1401の左上の座標をE(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。SD解像度の画像領域はクロッピング領域であるものとし、クロッピング領域を定義するために、領域1402の左上の座標をC(X,Y)、横方向の大きさをW、縦方向の大きさをHとする。
図17は本発明になる空間スケーラブル符号化方法及び復号化方法で用いる空間解像度変換された画像領域の第6の例の説明図を示す。この例では、オリジナル領域1503として任意形状を採用した場合の例である。オリジナル領域1503は任意形状であるため、中心座標Oと、複数の補助座標S1、S2等を用意することで任意形状を定義する。
ただし、以上のような各種のオリジナル領域の形状は、単に中心座標と補助座標の位置や数からでは判断することが難しい。そこで、オリジナル領域の形状を特定するために、図4のような対応表によって管理するとよい。この対応表は、形状を形状モードIDで番号付けする。また、各形状を表現するために必要な中心座標、補助座標の数を特定するための情報との関連付けが行われている。
このような形状モードIDと、中心座標、補助座標の情報を本発明の解像度変換後の画像フレームとともに伝送することで、歪み領域を元に戻す際にオリジナル領域や歪み領域などを特定することができ、正しくもとの大きさの画像フレームに戻すことが可能となる。また、歪み領域へ格納する際の空間フィルタリング及び縮小処理は、図13に示すようなオリジナル領域の法線方向に対して行うとよい。
次に、本発明の空間解像度変換を用いたスケーラブル符号化装置の構成について説明する。図18は本発明になる空間スケーラブル符号化装置の一実施の形態のブロック図を示す。同図において、画像入力部1602は、入力される高精細な空間解像度をもつHD解像度の画像フレーム1601を取得するための手段と、取得した画像フレーム1601を、ベースレイヤの符号化処理を行うため、以下で説明するクロッピング領域特定部1603に通知するための手段と、エンハンスレイヤの符号化処理を行うため、以下に説明するエンハンス側のME部1619に通知する手段とを備える。
クロッピング領域特定部1603は、ベースレイヤ側の符号化を行う際に利用する、より低い解像度をもつSD解像度の画像フレームを生成するため、画像入力部1602から取得した高精細な空間解像度をもつHD解像度のフレームの中から、クロッピング領域を特定し、クロッピング領域情報を生成するための手段を備える。生成したクロッピング領域情報は、エントロピー符号化部1612に通知して符号化するように構成することが望ましいが、ここでは説明を簡単にするために省略する。
歪み領域特定部1604は、取得したクロッピング領域情報に基づいて、クロッピング領域内にオリジナル領域を設定し、オリジナル領域情報を生成することで、クロッピング領域内で、かつ、オリジナル領域外の領域を歪み領域として特定する手段を備える。生成したオリジナル領域情報は、エントロピー符号化部1612に通知して符号化するように構成することが望ましいが、ここでは説明を簡単にするために省略する。
歪み領域縮小部1605は、生成したオリジナル領域情報に基づいて、歪み領域に格納する対象領域である歪み領域格納対象領域を特定する手段を備える。一般に、歪み領域格納対象領域は、エンハンスレイヤ側の空間解像度であるHD解像度の画像フレームの領域内で、かつ、オリジナル領域外の領域である。また、歪み領域縮小部1605は、この歪み領域格納対象領域に含まれる画素に対して、特定した歪み領域に収まるように所定のフィルタリング及び縮小方法を特定し、フィルタリング及び縮小処理を行った後に歪み領域に格納する手段を備える。
クロッピング領域縮小部1606は、ベースレイヤ側で必要としている空間解像度、ここではSD解像度の画像フレームを取得するために、クロッピング領域に対して所定のフィルタリング処理及び縮小処理を行うことで、歪み領域を含んだSD解像度の画像フレームを生成する手段を備える。
ME部1607は、ベースレイヤ側のME(動き推定)処理を行うための手段を備える。ME処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のME処理を行うことが望ましい。ME部1607は、現在符号化対象となっているSD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1609からの参照フレームとの間でME処理を行うことで、動きベクトル情報を生成する。生成した動きベクトル情報は、MC部1608及びレイヤ間予測部1620に通知される。また、ME部1607は、生成した動きベクトル情報に対して所定の符号化を行うために、動きベクトル情報をエントロピー符号化部1612に通知する手段を備える。
MC部1608は、ベースレイヤ側のMC(動き補償)処理を行うための手段を備える。MC処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1608は、ME部1607から動きベクトル情報を取得する手段と、フレームバッファ1609から参照フレームを取得する手段と、取得した参照フレームに対して、取得した動きベクトル情報に基づいて、MC画像フレームを生成する手段と、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1609に通知する手段とを備える。
フレームバッファ部1609は、ローカルデコード画像フレームを格納するための手段を備える。格納されるローカルデコード画像フレームは、MC部1608では参照フレームとして用いられる。直交変換部1610は、イントラ符号化の場合はクロッピング領域縮小部1606で生成したSD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成する手段と、イントラ符号化以外の場合には、クロッピング領域縮小部1606から得られるSD解像度の画像フレームと、MC部1608から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する手段と、生成した直交変換後の係数情報を量子化部1611に通知する手段とを備える。
量子化部1611は、直交変換部1610が生成した直交変換後の係数情報を取得し、所定の量子化処理を行い、量子化後の係数情報を生成する手段と、生成した量子化後の係数情報をエントロピー符号化部1612及び逆量子化部1613に通知する手段とを備える。
エントロピー符号化部1612は、ME部1607から動きベクトル情報を取得し、所定のエントロピー符号化を行う手段と、量子化部1611から量子化後の係数情報を取得し、所定のエントロピー符号化を行う手段と、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をMUX部1628に通知する手段とを備える。
逆量子化部1613は、ローカルデコード画像フレームを生成するために、量子化部1611から量子化後の係数情報を取得し、所定の逆量子化を行うことで逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1614に通知する手段とを備える。
逆直交変換部1614は、ローカルデコード画像フレームを生成するために、逆量子化部1613から逆量子化後の係数情報を取得し、所定の逆直交交換を行うことで、復号後の差分画像フレームを生成する手段と、生成した復号後の差分画像フレームをフレームバッファ部1609に通知する手段とを備える。復号後の差分画像フレームをフレームバッファ部1609に通知することで、フレームバッファ部1609は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームをMC部1608においては参照フレームとして利用する。
歪み領域特定部1615は、フレームバッファ部1609に格納されているローカルデコード画像フレームを取得し、取得したローカルデコード画像フレーム内の歪み領域を再度特定する手段を備える。歪み領域の特定は、クロッピング領域情報、オリジナル領域情報、クロッピング領域縮小部1606で行う縮小処理の縮小倍率から、ローカルデコード画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1615で特定した歪み領域情報は、歪み領域拡大部1616に通知される。
歪み領域拡大部1616は、歪み領域特定部1615から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行うことで、歪み領域に含まれる画像を元の歪みのない画像に復元し、この歪み領域を復元した画像フレームを画像拡大部1617に通知する。
画像拡大部1617は、歪み拡大部1616から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行う手段と、拡大後の画像フレームをベースレイヤからのローカルデコード画像フレームとしてクロッピング領域特定部1618に通知する手段とを備える。
クロッピング領域特定部1618は、画像拡大部1617から取得したベースレイヤからのローカルデコード画像フレームが、エンハンスレイヤ側のHD解像度をもつ画像フレームのどの位置に対応するかを特定し、この特定した位置関係情報及びベースレイヤからのローカルデコード画像フレームをレイヤ間予測部1620に通知する手段を備える。位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、より効果的にレイヤ間予測を行うことができる構成となる。
ME部1619は、エンハンスレイヤ側のME処理を行うための手段を備える。ME処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のME処理を行うことが望ましい。ME部1619は、現在符号化対象となっているHD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1622からの参照フレームとの間でME処理を行うことで、動きベクトル情報を生成する。生成した動きベクトル情報は、レイヤ間予測部1620に通知される。
レイヤ間予測部1620は、ベースレイヤ側のME部1607から出力された動きベクトル情報を取得する手段と、クロッピング領域特定部1618から出力された、ベースレイヤ側のローカルデコード画像フレーム及びエンハンスレイヤ側の画像フレームとの間の位置関係情報を取得する手段と、エンハンスレイヤ側のME部1619から出力された動きベクトル情報を取得する手段とを備える。
更に、レイヤ間予測部1620は、このような手段によって取得した情報に基づいて、レイヤ間の相関を利用し、動きベクトル情報の予測符号化を行い、レイヤ間予測に基づいた動きベクトル情報を生成する手段を備える。このレイヤ間予測に基づいた動きベクトル情報は、MC部1621に通知されると共に、また、エンハンス側の動きベクトル情報を符号化するために、エントロピー符号化部1625に通知される。ここで、エントロピー符号化部1625に通知されるエンハンス側の動きベクトル情報は、ベースレイヤ側から取得した動きベクトル情報とのレイヤ間予測によって生成した動きベクトル差分情報であっても構わない。
MC部1621は、エンハンスレイヤ側のMC処理を行うための手段を備える。このMC処理は、フレーム内符号化であるイントラ符号化以外のモードである場合に、所定のMC処理を行うことが望ましい。また、MC部1621は、レイヤ間予測部1620から動きベクトル情報を取得する手段と、フレームバッファ部1622から参照フレームを取得する手段と、取得した参照フレームに対して、取得した動きベクトル情報に基づいて、MC画像フレームを生成する手段と、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1622に通知する手段とを備える。
フレームバッファ部1622は、エンハンスレイヤ側のローカルデコード画像フレームを格納するための手段を備える。格納されるローカルデコード画像フレームは、MC部1621では参照フレームとして用いられる。
直交変換部1623は、イントラ符号化の場合は画像入力部1602から取得した高精細なHD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成する手段と、イントラ符号化以外の場合には、画像入力部1602から得られるHD解像度の画像フレームと、MC部1621から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する手段とを備える。生成した直交変換後の係数情報は、量子化部1624に通知される。
量子化部1624は、直交変換部1623が生成した直交変換後の係数情報を取得し、所定の量子化処理を行い、量子後の係数情報を生成する手段と、生成した量子化後の係数情報をエントロピー符号化部1625及び逆量子化部1626に通知する手段とを備える。エントロピー符号化部1625は、レイヤ間予測部1620から動きベクトル情報を取得し、所定のエントロピー符号化を行う手段と、量子化部1624から量子化後の係数情報を取得し、所定のエントロピー符号化を行う手段とを備える。また、エントロピー符号化部1625は、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をMUX部1628に通知する。
逆量子化部1626は、ローカルデコード画像フレームを生成するために、量子化部1624から量子化後の係数情報を取得し、所定の逆量子化を行うことで逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1627に通知する手段とを備える。
逆直交変換部1627は、ローカルデコード画像フレームを生成するために、逆量子化部1626から逆量子化後の係数情報を取得し、所定の逆直交変換を行うことで、復号後の差分画像フレームを生成する手段と、生成した復号後の差分画像フレームをフレームバッファ部1622に通知する手段とを備える。復号後の差分画像フレームをフレームバッファ部1622に通知することで、フレームバッファ部1622は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームは、MC部1621においては参照フレームとして利用される。
MUX部1628は、ベースレイヤ側のエントロピー符号化部1612からエントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報を取得する手段と、エンハンスレイヤ側のエントロピー符号化部1625からエントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報を取得する手段と、取得したこれらの情報に対して所定の多重化(MUX)を行うことで多重化出力情報を生成する手段とを備える。生成した多重化出力情報は、符号化出力部1629に通知される。符号化出力部1629は、MUX部1628から多重化出力情報を取得し、符号化ビットストリーム1630を出力する手段を備える。以上のような各手段を備えた各部により本発明のスケーラブル符号化装置の一実施の形態を構成することができる。
次に、図20及び図21のフローチャートを用いて、図18に示したスケーラブル符号化装置の動作について説明する。図20は、主に図18のベースレイヤ側の処理過程を示すためのフローチャートである。また図21は、主にエンハンスレイヤ側の処理過程を示すためのフローチャートである。
まず、画像入力部1602は、高精細な空間解像度(例えば、HD解像度)を持つ画像フレーム1601を取得して(図20のステップS301)、クロッピング領域特定部1603に取得した画像フレームを通知する。
クロッピング領域特定部1603は、入力された高精細な空間解像度を持つ画像フレーム1601内からより低い空間解像度(例えば、SD解像度)として残すべき領域を、図1の12その他で説明したクロッピング領域として特定する(図20のステップS302)。このクロッピング領域は、所定の位置に基づくものであっても構わない。また、画像内の状態を考慮してクロッピング領域を決定するようにしても構わない。このようにして特定されたクロッピング領域情報は、画像フレーム1601と共に歪み領域特定部1604に供給される。
歪み領域特定部1604は、入力された上記のクロッピング領域情報と画像フレーム1601とに基づいて、クロッピング領域内に図1の13その他で説明したオリジナル領域を特定する。オリジナル領域の位置に関しては、予め決められた位置情報を利用して領域を特定しても構わない。また、エンハンスレイヤの符号化を行う際により重要となる領域をクロッピング領域内を探索することでオリジナル領域を決定しても構わない。歪み領域特定部1604は、更にクロッピング領域内で、かつ、オリジナル領域外の領域内に、画像を歪ませて空間解像度変換後の画像を格納する領域である歪み領域を特定する(図20のステップS303)。
歪み領域縮小部1605は、歪み領域特定部1604から取得したオリジナル領域情報、特定した歪み領域情報及び画像フレーム1601に基づいて、オリジナル領域の外側の画像フレームの画像情報が、特定した歪み領域に収まるように所定のフィルタリング及び縮小方法を特定し、フィルタリング及び縮小処理を行った後にその歪み領域に格納することで、歪み領域を縮小する(図20のステップS304)。その後、歪み領域縮小部1605は、オリジナル領域及び歪み領域からなるクロッピング領域の画像フレームを、クロッピング領域縮小部1606に通知する。
クロッピング領域縮小部1606は、ベースレイヤ側で必要としている空間解像度の画像フレームを取得するために、クロッピング領域に対して所定のフィルタリング処理及び縮小処理を行うことでクロッピング領域を縮小する(図20のステップS305)。このようにして、歪み領域を含んだSD解像度の画像フレームが生成される。生成された画像フレームは、ベースレイヤ側のME部1607と直交変換部1610に通知される。
ME部1607は、フレーム内符号化であるイントラ符号化以外のモードである場合にクロッピング領域縮小部1606が生成したSD解像度の画像フレームと、フレームバッファ部1609から参照フレームを取得して所定のME処理を行うことが望ましい。ME部1607は、現在符号化対象となっているSD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1609からの参照フレームとを取得し、これらのフレーム間でME処理を行う(図20のステップS306)ことで、動きベクトル情報を生成する。
ME部1607は、生成した動きベクトル情報を、MC部1608及びレイヤ間予測部1620に通知すると共に、生成した動きベクトル情報に対して所定の符号化を行うために、動きベクトル情報をエントロピー符号化部1612に通知する。このような処理を行うことでME処理を完了する。
MC部1608は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1608は、ME部1607から取得した動きベクトル情報に基づいて、フレームバッファ部1609から取得した参照フレームに対して、MC画像フレームを生成することでMCを行う(図20のステップS307)。その後、MC部1608は、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1609に供給して記憶させる。
直交変換部1610は、イントラ符号化の場合はクロッピング領域縮小部1606で生成したSD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成し、イントラ符号化以外の場合には、クロッピング領域縮小部1606から得られるSD解像度の画像フレームと、MC部1608から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する。このような処理により直交変換を行う(図20のステップS308)。生成された直交変換後の係数情報は量子化部1611に通知される。
量子化部1611は、直交変換部1610が生成した直交変換後の係数情報を取得し、所定の量子化を行い(図20のステップS309)、量子化後の係数情報を生成し、それをエントロピー符号化部1612及び逆量子化部1613に供給する。エントロピー符号化部1612は、ME部1607から動きベクトル情報を取得し、所定のエントロピー符号化を行う。また、量子化部1611から量子化後の係数情報を取得し、所定のエントロピー符号化を行う(図20のステップS310)。エントロピー符号化部1612は、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をそれぞれMUX部1628に供給する。
逆量子化部1613は、ローカルデコード画像フレームを生成するために、量子化部1611から量子化後の係数情報を取得し、所定の逆量子化を行う(図20のステップS312)ことで逆量子化後の係数情報を生成する。生成された逆量子化後の係数情報は、逆直交変換部1614に供給される。
逆直交変換部1614は、ローカルデコード画像フレームを生成するために、逆量子化部1613から逆量子化後の係数情報を取得し、所定の逆直交変換を行う(図20のステップS312)ことで、復号後の差分画像フレームを生成する。生成された復号後の差分画像フレームは、フレームバッファ部1609に供給される。逆直交変換部1614から復号後の差分画像フレームがフレームバッファ部1609に入力されることで、フレームバッファ部1609は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームは、MC部1608においては参照フレームとして利用される。
歪み領域特定部1615は、フレームバッファ部1609に格納されているローカルデコード画像フレームを取得し、取得したローカルデコード画像フレーム内の歪み領域を再度特定する(図20のステップS313)。歪み領域の特定は、クロッピング領域情報、オリジナル領域情報、クロッピング領域縮小部1606で行う縮小処理の縮小倍率から、ローカルデコード画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1615は、特定した歪み領域情報を歪み領域拡大部1616に通知する。
歪み領域拡大部1616は、歪み領域特定部1615から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行うことで歪み領域を拡大する(図20のステップS314)。このような処理を行うことで、歪み領域に含まれる画像を元の歪みのない画像に復元する。歪み領域拡大部1616は、この歪み領域を復元した画像とオリジナル領域の画像とからなる画像フレームを画像拡大部1617に通知する。
画像拡大部1617は、歪み拡大部1616から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行う(図20のステップS315)。拡大後の画像フレームをベースレイヤからのローカルデコード画像フレームとしてクロッピング領域特定部1618に通知する。
クロッピング領域特定部1618は、画像拡大部1617から取得したベースレイヤからのローカルデコード画像フレームが、エンハンスレイヤ側のHD解像度をもつ画像フレームのどの位置に対応するかを特定し(図20のステップS316)、この特定した位置関係情報及びベースレイヤからのローカルデコード画像フレームをレイヤ間予測部1620に通知する。位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、より効果的にレイヤ間予測を行うことができる構成となる。以上のような各部の処理を行うことで、ベースレイヤ側における1フレーム分の符号化が完了する。
次に、エンハンスレイヤ側の符号化処理に移る。エンハンスレイヤ側では、ベースレイヤ側の処理と同様に画像入力部1602が高精細な空間解像度をもつ画像フレーム1601を取得する(図21のステップS401)。ME部1619は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のME処理を行うことが望ましい。ME部1619は、現在符号化対象となっているHD解像度の画像フレームと、少なくとも1フレームの参照フレームを格納することができるフレームバッファ部1622から参照フレームを取得し、これらのフレーム間でMEを行う(図21のステップS402)ことで、動きベクトル情報を生成する。生成された動きベクトル情報は、レイヤ間予測部1620に通知される。
レイヤ間予測部1620は、ベースレイヤ側からのレイヤ間予測のための情報を取得する(図21のステップS403)。ここでは、レイヤ間予測部1620は、ベースレイヤ側のME部1607から動きベクトル情報を取得し、クロッピング領域特定部1618から、ベースレイヤ側のローカルデコード画像フレーム及びエンハンスレイヤ側の画像フレームとの間の位置関係情報を取得し、エンハンスレイヤ側のME部1619から動きベクトル情報を取得する。
このような手段によって取得した情報に基づいて、レイヤ間予測部1620は、レイヤ間の相関を利用し、動きベクトル情報の予測符号化を行い、レイヤ間予測に基づいた動きベクトル情報を生成する(図21のステップS404)。このレイヤ間予測に基づいた動きベクトル情報は、MC部1621に供給され、また、エンハンス側の動きベクトル情報を符号化するために、エントロピー符号化部1625に供給される。ここで、エントロピー符号化部1625に供給されるエンハンス側の動きベクトル情報は、ベースレイヤ側から取得した動きベクトル情報とのレイヤ間予測によって生成した動きベクトル差分情報であっても構わない。
MC部1621は、フレーム内符号化であるイントラ符号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1621は、レイヤ間予測部1620から動きベクトル情報を取得する。また、フレームバッファ1622から参照フレームを取得する。取得した参照フレームに対して、取得した動きベクトル情報に基づいて、MC画像フレームを生成することでMCを行う(図21のステップS405)。MC部1621は、生成したMC画像フレームを次のMC処理以降に参照フレームとして利用できるようにするため、フレームバッファ部1622に供給する。
直交変換部1623は、イントラ符号化の場合は画像入力部1602から取得した高精細なHD解像度の画像フレームに対してそのまま直交変換を行い、直交変換後の係数情報を生成する。また、イントラ符号化以外の場合には、画像入力部1602から得られるHD解像度の画像フレームと、MC部1621から得られるMC画像フレームとの差分画像フレームに対して直交変換を行い、直交変換後の係数情報を生成する(図21のステップS406)。直交変換部1623は、生成した直交変換後の係数情報を量子化部1624に供給する。
量子化部1624は、直交変換部1623が生成した直交変換後の係数情報を取得し、所定の量子化処理を行い、量子化後の係数情報を生成する(図21のステップS407)。生成された量子化後の係数情報は、エントロピー符号化部1625及び逆量子化部1626に供給される。
エントロピー符号化部1625は、レイヤ間予測部1620から動きベクトル情報を取得し、所定のエントロピー符号化を行う。また、量子化部1624から量子化後の係数情報を取得し、所定のエントロピー符号化を行う(図21のステップS408)。エントロピー符号化部1625は、エントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報をMUX部1628に通知する。
逆量子化部1626は、ローカルデコード画像フレームを生成するために、量子化部1624から量子化後の係数情報を取得し、所定の逆量子化を行う(図21のステップS409)ことで逆量子化後の係数情報を生成する。生成された逆量子化後の係数情報は、逆直交変換部1627に供給される。
逆直交変換部1627は、ローカルデコード画像フレームを生成するために、逆量子化部1626から逆量子化後の係数情報を取得し、所定の逆直交変換を行う(図21のステップS410)ことで、復号後の差分画像フレームを生成し、生成した復号後の差分画像フレームをフレームバッファ部1622に供給する。復号後の差分画像フレームをフレームバッファ部1622に供給することで、フレームバッファ部1622は、既に格納されているMC画像フレームと合成してローカルデコード画像フレームを生成する。このローカルデコード画像フレームは、MC部1621においては参照フレームとして利用される。
MUX部1628は、ベースレイヤ側のエントロピー符号化部1612からエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とを取得し(図21のステップS411)、エンハンスレイヤ側のエントロピー符号化部1625からエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報を取得し、取得したこれらの情報に対して所定の多重化(MUX)を行う(図21のステップS412)。
これにより、MUX部1628からは多重化出力情報が取り出され、符号化出力部1629に供給され、ここで符号化ビットストリーム1630として生成されて出力される(図21のステップS413)。以上のような各部の処理を行うことで、エンハンスレイヤ側における1フレーム分の符号化及び、一連の符号化出力処理が完了する。本実施の形態の空間スケーラブル符号化装置によれば、前述した発明の効果に記載した(1)〜(3)等の効果を奏する。
次に、空間解像度変換を用いた本発明の空間スケーラブル復号化装置の構成について説明する。図19は本発明になる空間スケーラブル復号化装置の一実施の形態のブロック図を示す。同図において、符号化入力部1702は、本実施の形態のスケーラブル符号化装置によって得られた符号化出力である符号化ビットストリームを取得するための手段と、取得した符号化ビットストリームをDEMUX部1703に通知する手段とを備える。
DEMUX部1703は、符号化入力部1702から符号化ビットストリームを取得する手段と、取得した符号化ビットストリームに対して多重化分離(DEMUX)を行う手段とを備える。DEMUX処理により、ベースレイヤ側の符号化出力情報と、エンハンスレイヤ側の符号化出力情報とに分離される。更に、各レイヤの符号化出力情報は、エントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とに分離される。
また、DEMUX部1703は、ベースレイヤ側のエントロピー復号部1704、エンハンスレイヤ側のエントロピー復号部1722に対して、それぞれ対応するレイヤの符号化出力情報であるエントロピー符号化を行った動きベクトル情報、エントロピー符号化を行った量子化後の係数情報を通知する手段を備える。
エントロピー復号部1704は、ベースレイヤ側の復号化処理を行うために、DEMUX部1703からベースレイヤ側の符号化出力情報であるエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とを取得する手段と、取得したエントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化する手段と、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する手段とを備える。
更に、エントロピー復号部1704は、復号化した動きベクトル情報をMC部1708及びエンハンスレイヤ側のレイヤ間予測部1721に通知する手段と、復号化した量子化後の係数情報を逆量子化部1705に通知する手段とを備える。
逆量子化部1705は、エントロピー復号部1704から量子化後の係数情報を取得する手段と、取得した量子化後の係数情報に対して所定の逆量子化を行うことで、逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1706に通知する手段とを備える。
MC部1706は、フレーム内復号化であるイントラ復号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1706は、エントロピー復号部1704から動きベクトル情報を取得する手段と、フレームバッファ部1707から参照フレームを取得する手段と、取得した動きベクトル情報に基づいて参照フレームに対してMCを行い、MC画像フレームを生成する手段と、生成したMC画像フレームをフレームバッファ部1707に通知する手段とを備える。
フレームバッファ部1707は、MC部1706からMC画像フレームを取得し、格納する手段と、逆直交変換部1708から復号後の画像フレームを取得し、格納されているMC画像フレームと合成する手段とを備える。
逆直交変換部1708は、逆量子化部1705から取得した逆量子化後の係数情報を取得する手段と、取得した逆量子化後の係数情報に対して逆直交変換を行うことで、復号後の画像フレームを生成する手段と、生成した復号後の画像フレームを、フレームバッファ部1707に通知する手段とを備える。ここで、イントラ復号化である場合には、生成する画像フレームは差分画像フレームとなる。また、イントラ復号化以外の場合には、差分画像ではない復号画像フレームとなる。復号後の画像フレームは、フレームバッファ部1707に通知される。
画像出力部1709は、フレームバッファ部1707から復号後の画像フレームを取得して、取得した復号後の画像フレームを第1ベースレイヤ画像フレーム1710として出力する。歪み領域特定部1711は、フレームバッファ部1707から復号後の画像フレームを取得し、取得した復号後の画像フレーム内の歪み領域を再度特定する。歪み領域の特定は、エンハンスレイヤ側の復号画像フレーム全体の領域情報、クロッピング領域情報、オリジナル領域情報、復号時のクロッピング領域の拡大率を考慮することで復号画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1711で特定した歪み領域情報は、歪み領域拡大部1714に通知される。
画像出力部1712は、歪み領域特定部1711から復号後の画像フレームを取得する手段と、取得した復号後の画像フレームを出力する手段とを備える。この画像出力部1712は、表示方法に応じた画像成型を行う手段を備えるとよい。ここでは、特定した歪み領域を除外して表示するような手段を備えることが望ましい。その際、歪み領域に対して例えば画素値として0を埋めることで縦の帯状に無効領域を生成し、表示するような手段を備えることでより多様な表示を行うことができる。
画像出力部1712は、オリジナル領域を縦方向、横方向にそれぞれ拡大し、画像表示装置の領域に合わせて表示するような手段を備えてもよい。また、オリジナル領域の上下の領域を除いて画像表示装置の縦横比に合わせるために、オリジナル領域に対して再度クロッピング処理を行い、その後画像表示装置の表示領域に合わせるために拡大して表示する手段を備えても構わない。
歪み領域拡大部1714は、歪み領域特定部1711から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行うことで、歪み領域に含まれる画像を元の歪みのない画像に復元する。歪み領域拡大部1714は、この歪み領域を復元した画像フレームを画像拡大部1717に通知する手段を備える。
画像出力部1715は、歪み領域拡大部1714から歪み領域を復元した画像フレームを取得する手段と、取得した歪み領域を復元した画像フレームを出力する手段とを備える。この画像出力部1715は、表示方法に応じた画像成型を行う手段を備えるとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示するような手段を備えることが望ましい。
画像拡大部1717は、歪み領域拡大部1714から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行う手段と、拡大後の画像フレームをベースレイヤからの復号画像フレームとしてクロッピング領域特定部1720に通知する手段とを備える。
画像出力部1718は、画像拡大部1717からベースレイヤからの復号画像フレームを取得する手段と、取得した復号画像フレームを出力する手段とを備える。この画像出力部1718は、表示方法に応じた画像成型を行う手段を備えるとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示するような手段を備えることが望ましい。
クロッピング領域特定部1720は、画像拡大部1717から取得したベースレイヤからの復号画像フレームが、エンハンスレイヤ側のHD解像度をもつ復号画像フレームのどの位置に対応するかを特定し、この特定した位置関係情報及びベースレイヤからの復号画像フレームをレイヤ間予測部1721に通知する手段を備える。上記の位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、レイヤ間予測復号を行うような構成が望ましい。
レイヤ間予測部1721は、ベースレイヤ側のエントロピー復号部1704から動きベクトル情報を取得する手段と、クロッピング領域特定部1720から、ベースレイヤ側の復号画像フレーム及びエンハンスレイヤ側の復号画像フレームとの間の位置関係情報を取得する手段と、エンハンスレイヤ側のエントロピー復号部1722から動きベクトル情報を取得する手段と、取得した動きベクトル情報に対して予測復号化を行い、エンハンスレイヤ側の復号化で必要な予測復号後の動きベクトル情報を生成する手段と、予測復号後の動きベクトル情報をMC部1724に通知する手段とを備える。
エントロピー復号部1722は、エンハンスレイヤ側の復号化処理を行うために、DEMUX部1703からエンハンスレイヤ側の符号化出力情報であるエントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報を取得する手段を備える。また、エントロピー復号部1722は、取得したエントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化する手段と、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する手段とを備える。
エントロピー復号部1722は、更に、復号化した動きベクトル情報をレイヤ間予測部1721に通知する手段と、復号化した量子化後の係数情報を逆量子化部1723に通知する手段とを備える。逆量子化部1723は、エントロピー復号化部1722から量子化後の係数情報を取得する手段と、取得した量子化後の係数情報に対して所定の逆量子化を行うことで、逆量子化後の係数情報を生成する手段と、生成した逆量子化後の係数情報を逆直交変換部1726に通知する手段とを備える。
MC部1724は、フレーム内復号化であるイントラ復号化以外のモードである場合に、所定のMC処理を行うことが望ましい。このMC部1724は、レイヤ間予測部1721から予測復号後の動きベクトル情報を取得する手段と、フレームバッファ部1725から参照フレームを取得する手段と、取得した予測復号後の動きベクトル情報に基づいて参照フレームに対してMCを行い、MC画像フレームを生成する手段と、生成したMC画像フレームをフレームバッファ部1725に通知する手段とを備える。
フレームバッファ部1725は、MC部1725からMC画像フレームを取得し、格納する手段と、逆直交変換部1726から復号後の画像フレームを取得し、格納されているMC画像フレームと合成する手段とを備える。逆直交変換部1726は、逆量子化部1723から取得した逆量子化後の係数情報を取得する手段と、取得した逆量子化後の係数情報に対して逆直交変換を行うことで、復号後の画像フレームを生成する手段と、生成した復号後の画像フレームをフレームバッファ部1725に通知する手段とを備える。
ここで、イントラ復号化である場合には、生成する復号後の画像フレームは差分画像フレームとなる。また、イントラ復号化以外の場合には、差分画像ではない復号画像フレームとなる。復号後の画像フレームは、フレームバッファ部1724に通知される。
画像出力部1727は、フレームバッファ部1725から復号後の画像フレームを取得する手段と、取得した復号後の画像フレームを出力する手段とを備える。以上のような各手段を備えた各部により本発明のスケーラブル復号化装置を構成することができる。
次に、図22及び図23のフローチャートを用いて、図19に示した本実施の形態のスケーラブル復号化装置の動作について説明する。図22は、主に図19のベースレイヤ側の処理過程を示すためのフローチャートである。また図23は、主にエンハンスレイヤ側の処理過程を示すためのフローチャートである。
図19において、まず、符号化入力部1702は、図18に示したスケーラブル符号化装置によって生成された符号化ビットストリーム1701(図18の1630に相当)を取得し(図22のステップS501)、その取得した符号化ビットストリーム1701をDEMUX部1703に通知する。
DEMUX部1703は、符号化入力部1702から取得した符号化ビットストリーム1701に対して多重化分離(DEMUX)を行う(図22のステップS502)。このDEMUX処理により、符号化ビットストリーム1701は、ベースレイヤ側の符号化出力情報とエンハンスレイヤ側の符号化出力情報とに分離され、更に、各レイヤの符号化出力情報が、エントロピー符号化を行った動きベクトル情報とエントロピー符号化を行った量子化後の係数情報とに分離される。
DEMUX部1703は、ベースレイヤ側のエントロピー復号部1704と、エンハンスレイヤ側のエントロピー復号部1722に対して、それぞれ対応するレイヤの符号化出力情報であるエントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報を供給する。
エントロピー復号部1704は、ベースレイヤ側の復号化処理を行うために、DEMUX部1703から取得した、ベースレイヤ側の符号化出力情報であるエントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報のうち、エントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化すると共に、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する(図22のステップS503)。
エントロピー復号部1704は、復号化した動きベクトル情報を、MC部1706及びエンハンスレイヤ側のレイヤ間予測部1721に供給し、また、復号化した量子化後の係数情報を逆量子化部1705に供給する。逆量子化部1705は、エントロピー復号部1704から取得した量子化後の係数情報に対して、所定の逆量子化を行うことで、逆量子化後の係数情報を生成する(図22のステップS504)。この生成された逆量子化後の係数情報は、逆直交変換部1706に供給される。
MC部1706は、フレーム内復号化であるイントラ復号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1706は、エントロピー復号部1704から取得した動きベクトル情報に基づいて、フレームバッファ部1707から取得した参照フレームに対してMCを行い、MC画像フレームを生成する(図22のステップS505)。この生成されたMC画像フレームは、フレームバッファ部1707に供給される。
逆直交変換部1708は、逆量子化部1705から所得した逆量子化後の係数情報に対して逆直交変換を行うことで、復号後の画像フレームを生成する(図22のステップS506)。この生成された復号後の画像フレームは、フレームバッファ部1707に供給される。ここで、イントラ復号化である場合には、上記の生成された画像フレームは差分画像フレームとなる。また、イントラ復号以外の場合には、差分画像ではない復号画像フレームとなる。
画像出力部1709は、フレームバッファ部1707から取得した復号後の画像フレームを第1のベースレイヤ画像フレーム1710として出力する(図22のステップS507)。この第1のベースレイヤ画像フレーム1710は、例えば、図9(A)に示したオリジナル領域81と歪み領域82、83の各画像情報からなる、SD解像度のアスペクト比4:3の復号画像フレームである。
歪み領域特定部1711は、フレームバッファ部1707から復号後の画像フレームを取得し、取得した復号後の画像フレーム内の歪み領域を再度特定する(図22のステップS508)。歪み領域の特定は、エンハンスレイヤ側の復号画像フレーム全体の領域情報、クロッピング領域情報、オリジナル領域情報、復号時のクロッピング領域の拡大率を考慮することで復号画像フレーム内のオリジナル領域を特定し、このオリジナル領域外の領域を歪み領域とすることが望ましい。歪み領域特定部1711で特定した歪み領域情報は、歪み領域拡大部1714に供給される。
画像出力部1712は、歪み領域特定部1711から復号後の画像フレームを取得し、取得した復号後の画像フレームを第2のベースレイヤ画像フレーム1713として出力する(図22のステップS509)。この画像出力部1712は、表示方法に応じた画像成型を行うとよい。ここでは、特定した歪み領域を除外して表示することが望ましい。その際、歪み領域に対して例えば画素値として0を埋めることで縦の帯状に無効領域を生成し、表示することでより多様な表示を行うことができる。例えば、上記の第2のベースレイヤ画像フレーム1713は、図9(A)に示したオリジナル領域81の画像情報のみからなる、SD解像度のアスペクト比4:3の復号画像フレームである。従って、この第2のベースレイヤ画像フレーム1713には、歪み領域82、83の画像情報は表示されない。
なお、画像出力部1712は、オリジナル領域を縦方向、横方向にそれぞれ拡大し、画像表示装置の領域に合わせて表示してもよい。また、オリジナル領域の上下の領域を除いて画像表示装置の縦横比に合わせるために、オリジナル領域に対して再度クロッピング処理を行い、その後画像表示装置の表示領域に合わせるために拡大して表示しても構わない。
歪み領域拡大部1714は、歪み領域特定部1711から歪み領域情報を取得し、歪み領域に対してフィルタリング及び拡大処理を特定した後に、歪み領域に対して特定したフィルタリング及び拡大処理を行う(図22のステップS510)。これにより、歪み領域に含まれる画像が元の歪みのない画像に復元される。歪み領域拡大部1714は、この歪み領域を復元した画像フレームを画像拡大部1717に供給する。
画像出力部1715は、歪み領域拡大部1714から歪み領域を復元した画像フレームを取得する。取得した歪み領域を復元した画像フレームを第3のベースレイヤ画像フレーム1716として出力する(図22のステップS511)。この画像出力部1715は、表示方法に応じた画像生成を行うとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示することが望ましい。上記の第3のベースレイヤ画像フレーム1716は、例えば、図9(C)に示した、オリジナル領域81と歪み領域拡大領域86及び87の各半分の領域とからなる、すなわち、点線で囲まれたクロッピング領域内の各画像情報からなる、SD解像度のアスペクト比4:3の復号画像フレームである。
画像拡大部1717は、歪み領域拡大部1714から取得した歪み領域を復元した画像フレームを取得し、元のHD解像度の大きさに拡大処理を行い(図22のステップS512)、拡大後の画像フレームをベースレイヤからの復号画像フレームとしてクロッピング領域特定部1720に通知する。
画像出力部1718は、画像拡大部1717からベースレイヤからの復号画像フレームを取得し、取得した復号画像フレームを第4のベースレイヤ画像フレーム1719として出力する(図22のステップS513)。この画像出力部1718は、表示方法に応じた画像成型を行うとよい。ここでは、歪み領域を復元した画像フレーム内から画像表示装置の表示領域の分だけクロッピング処理を行った後に表示することが望ましい。上記の第4のベースレイヤ画像フレーム1719は、例えば、図9(D)に示した、オリジナル領域89と歪み領域拡大領域92及び93の各半分の領域とからなる、すなわち、点線で囲まれたクロッピング領域内の各画像情報からなる、HD解像度のアスペクト比4:3の復号画像フレームである。
クロッピング領域特定部1720は、画像拡大部1717から取得したベースレイヤからの復号画像フレームが、エンハンスレイヤ側のHD解像度をもつ復号画像フレームのどの位置に対応するかを特定し(図22のステップS514)、この特定した位置関係情報及びベースレイヤからの復号画像フレームをレイヤ間予測部1721に通知する。位置関係情報には、クロッピング領域の位置情報からオリジナル領域の位置関係情報を含むようにすることで、レイヤ間予測復号を行うような構成が望ましい。以上のような各部の処理を行うことで、ベースレイヤ側における1フレーム分の復号化処理が完了する。
次に、エンハンスレイヤ側の復号化処理に移る。エンハンスレイヤ側では、ベースレイヤ側の処理と同様に符号化入力部1702が符号化ビットストリーム1701を取得し(図23のステップS601)、取得した符号化ビットストリーム1701をDEMUX部1703に通知する。その後、DEMUX部1703は、取得した符号化ビットストリーム1701に対して多重化分離(DEMUX)を行う(図23のステップS602)。
DEMUX処理により、符号化ビットストリーム1701がベースレイヤ側の符号化出力情報とエンハンスレイヤ側の符号化出力情報に分離され、更に各レイヤの符号化出力情報は、エントロピー符号化を行った動きベクトル情報及びエントロピー符号化を行った量子化後の係数情報に分離される。
エントロピー復号部1722は、エンハンスレイヤ側の復号化処理を行うために、DEMUX部1703から取得した、エンハンスレイヤ側の符号出力情報であるエントロピー符号化を行った動きベクトル情報と、エントロピー符号化を行った量子化後の係数情報とのうち、取得したエントロピー符号化を行った動きベクトル情報に対して、所定のエントロピー復号化を行うことで、動きベクトル情報を復号化し、取得したエントロピー符号化を行った量子化後の係数情報に対しても所定のエントロピー復号化を行うことで、量子化後の係数情報を復号化する(図23のステップS603)。エントロピー復号部1722は、復号化した動きベクトル情報をレイヤ間予測部1721に供給する一方、復号化した量子化後の係数情報を逆量子化部1723に供給する。
逆量子化部1723は、エントロピー復号部1722から取得した量子化後の係数情報に対して所定の逆量子化を行うことで、逆量子化後の係数情報を生成する(図23のステップS604)。この生成された逆量子化後の係数情報は、逆直交変換部1726に供給される。
レイヤ間予測部1721は、ベースレイヤ側のエントロピー復号部1704から動きベクトル情報を取得し、クロッピング領域特定部1720からベースレイヤ側の復号画像フレーム及びエンハンスレイヤ側の復号画像フレームとの間の位置関係情報を取得し、エンハンスレイヤ側のエントロピー復号部1722から動きベクトル情報を取得し、取得した動きベクトル情報に対してレイヤ間の予測復号化を行い(図23のステップS605)、エンハンスレイヤ側の復号化で必要な予測復号後の動きベクトル情報を生成する。この予測復号後の動きベクトル情報は、MC部1724に供給される。
MC部1724は、フレーム内復号化であるイントラ復号化以外のモードである場合に所定のMC処理を行うことが望ましい。MC部1724は、レイヤ間予測部1721から取得した予測復号後の動きベクトル情報に基づいて、フレームバッファ部1725から取得した参照フレームに対してMCを行い(図23のステップS606)、MC画像フレームを生成する。生成されたMC画像フレームは、フレームバッファ部1725に供給される。
逆直交変換部1726は、逆量子化部1723から取得した逆量子化後の係数情報に対して逆直交変換を行う(図23のステップS607)。これにより、復号後の画像フレームが生成される。ここで、生成される復号後の画像フレームは、イントラ復号化である場合には、差分画像フレームとなり、また、イントラ復号化以外の場合には、差分画像ではない復号画像フレームとなる。生成された復号後の画像フレームは、フレームバッファ部1724に供給される。
画像出力部1727は、フレームバッファ部1725から復号後の画像フレームを取得し、その取得した復号後の画像フレームをエンハンスレイヤ画像フレーム1728として出力する(図23のステップS608)。このエンハンスレイヤ画像フレーム1728は、HD解像度のアスペクト比16:9の画像フレームである。以上のような各部の処理を行うことで、エンハンスレイヤ側における1フレーム分の復号化及び、一連の復号化出力処理が完了する。本実施の形態の空間スケーラブル復号化装置によれば、前述した発明の効果に記載した(4)〜(8)等の効果を奏する。
次に、本発明になる空間スケーラブル符号化プログラムについて説明する。図24は本発明の空間スケーラブル符号化プログラムを実行する情報処理装置の一例のブロック図を示す。図24において、情報処理装置2900は、入力装置2901、出力装置2902、中央処理制御装置2903、外部記憶装置2904、一時記憶装置2905、通信装置2906から構成されており、コンピュータである中央処理制御装置2903により空間スケーラブル符号化装置の機能を空間スケーラブル符号化プログラムにより実現させるものである。
ここで、上記のプログラムは、記録媒体から読み取られて中央処理制御装置2903に取り込まれてもよいし、ネットワークを介して通信装置2906により受信されて中央処理制御装置2903に取り込まれてもよい。
中央処理制御装置2903は、上記のプログラムにより、画像入力部1602に相当する画像入力管理手段2932、MUX部1628に相当するMUX手段2933、符号化出力部1629に相当する符号化出力管理手段2934をソフトウェア処理にて実現する。また、中央処理制御装置2903は、上記のプログラムにより、ベースレイヤ用の符号化処理とエンハンスレイヤ用の符号化処理をソフトウェア処理にて実現する。
すなわち、中央処理制御装置2903は、上記のプログラムにより、ベースレイヤ用の符号化処理として、クロッピング領域特定部1603に相当するクロッピング領域特定手段2907、歪み領域特定部1604に相当する歪み領域特定手段2908、歪み領域縮小部1605に相当する歪み領域縮小手段2909、クロッピング領域縮小部1606に相当するクロッピング領域縮小手段2910、ME部1607に相当するME手段2911、MC部1608に相当するMC手段2912、フレームバッファ部1609に相当するフレームバッファ管理手段2913、直交変換部1610に相当する直交変換手段2914、量子化部1611に相当する量子化手段2915、エントロピー符号化部1612に相当するエントロピー符号化手段2916、逆量子化部1613に相当する逆量子化手段2917、逆直交変換部1614に相当する逆直交変換手段2918、歪み領域特定部1615に相当する歪み領域特定手段2919、歪み領域拡大部1616に相当する歪み領域拡大手段2920、画像拡大部1617に相当する画像拡大手段2921、クロッピング領域特定部1618に相当するクロッピング領域特定手段2922をソフトウェア処理により実現する。
また、中央処理制御装置2903は、上記のプログラムにより、エンハンスレイヤ用の符号化処理として、ME部1619に相当するME手段2923、レイヤ間予測部1620に相当するレイヤ間予測手段2924、MC部1621に相当するMC手段2925、フレームバッファ部1622に相当するフレームバッファ管理手段2926、直交変換部1623に相当する直交変換手段2927、量子化部1624に相当する量子化手段2928、エントロピー符号化部1625に相当するエントロピー符号化手段2929、逆量子化部1626に相当する逆量子化手段2930、逆直交変換部1627に相当する逆直交変換手段2931をソフトウェア処理にて実現する。
次に、本発明になる空間スケーラブル復号化プログラムについて説明する。図25は本発明の空間スケーラブル復号化プログラムを実行する情報処理装置の一例のブロック図を示す。図25において、情報処理装置3000は、入力装置3001、出力装置3002、中央処理制御装置3003、外部記憶装置3004、一時記憶装置3005、通信装置3006から構成されており、コンピュータである中央処理制御装置3003により空間スケーラブル符号化装置の機能を空間スケーラブル復号化プログラムにより実現させるものである。
ここで、上記のプログラムは、記録媒体から読み取られて中央処理制御装置3003に取り込まれてもよいし、ネットワークを介して通信装置3006により受信されて中央処理制御装置3003に取り込まれてもよい。
中央処理制御装置3003は、上記のプログラムにより、符号化入力部1702に相当する符号化入力管理手段3022、DEMUX部1703に相当するDEMUX手段3023、画像出力部1709、1712、1715、1718、1727に相当する画像出力管理手段3024をソフトウェア処理にて実現する。また、中央処理制御装置3003は、上記のプログラムにより、ベースレイヤ用の復号化処理とエンハンスレイヤ用の復号化処理をソフトウェア処理にて実現する。
すなわち、中央処理制御装置3003は、上記のプログラムにより、ベースレイヤ用の復号化処理として、エントロピー復号部1704に相当するエントロピー符号化手段3007、逆量子化部1705に相当するエントロピー復号化手段3007、逆量子化部1705に相当する逆量子化手段3008、MC部1706に相当するMC手段3009、フレームバッファ部1707に相当するフレームバッファ管理手段3010、逆直交変換部1708に相当する逆直交変換手段3011、歪み領域特定部1711に相当する歪み領域特定手段3012、歪み領域拡大部1714に相当する歪み領域拡大手段3013、画像拡大部1717に相当する画像拡大手段3014、クロッピング領域特定部1720に相当するクロッピング特定手段3015をソフトウェア処理にて実現する。
また、中央処理制御装置3003は、上記のプログラムにより、エンハンスレイヤ用の復号化処理として、レイヤ間予測部1721に相当するレイヤ間予測手段3016、エントロピー復号部1722に相当するエントロピー復号化手段3017、逆量子化部1723に相当する逆量子化手段3018、MC部1724に相当するMC手段3019、フレームバッファ部1725に相当するフレームバッファ管理手段3020、逆直交変換部1726に相当する逆直交変換手段3021をソフトウェア処理にて実現する。
本発明により空間解像度変換を行う画像領域の一例の説明図である。 本発明による空間解像度変換の処理過程の一例を示すための概念図である。 本発明による解像度変換処理の一例の説明用フローチャートである。 本発明の歪み領域の形状の種類及び形状を表現するために必要な座標数を示すための図である。 本発明における歪み領域を作成するための縮小方法の一例を説明する概念図である。 本発明の解像度変換の上側、下側、左側、右側の領域に対する解像度変換処理の様子を示すための概念図である。 本発明の解像度変換の左上側、右上側、左下側、右下側の領域に対する解像度変換処理の様子を示すための概念図である。 本発明の解像度変換において、左上側、右上側、左下側、右下側の領域を除いた上側、下側、左側、右側の領域に対する解像度変換処理の様子を示すための概念図である。 本発明の解像度変換処理を用いた空間スケーラブル符号化の処理過程を示すための概念図(その1)である。 本発明の解像度変換処理を用いた空間スケーラブル符号化の処理過程を示すための概念図(その2)である。 本発明による解像度変換処理の他の例の説明用フローチャートである。 本発明の解像度変換処理を行う際の歪み領域の形状を回転を許容する長方形とした場合の様子を示すための概念図である。 本発明の解像度変換処理を行う際の歪み領域の形状を円形とした場合の様子を示すための概念図である。 本発明の解像度変換処理を行う際の歪み領域の形状を回転を許容するひし形とした場合の様子を示すための概念図である。 本発明の解像度変換処理を行う際の歪み領域の形状を回転を許容する楕円形とした場合の様子を示すための概念図である。 本発明の解像度変換処理を行う際の歪み領域の形状を回転を許容する多角形とした場合の様子を示すための概念図である。 本発明の解像度変換処理を行う際の歪み領域の形状を任意形状とした場合の様子を示すための概念図である。 本発明の空間スケーラブル符号化装置の一実施の形態のブロック図である。 本発明の空間スケーラブル復号化装置の一実施の形態のブロック図である。 図18のスケーラブル符号化装置のベースレイヤを符号化する際の処理の流れを示すためのフローチャートである。 図18のスケーラブル符号化装置のエンハンスレイヤを符号化する際の処理の流れを示すためのフローチャートである。 図19のスケーラブル復号化装置のベースレイヤを復号化する際の処理の流れを示すためのフローチャートである。 図19のスケーラブル復号化装置のエンハンスレイヤを復号化する際の処理の流れを示すためのフローチャートである。 本発明の空間スケーラブル符号化プログラムを実行する情報処理装置の一例を示すためのブロック図である。 本発明の空間スケーラブル復号化プログラムを実行する情報処理装置の一例を示すためのブロック図である。 従来のスケーラブル符号化で行われる解像度変換の様子を示すための概念図である。 従来のクロッピング処理及びレターボックス処理の様子を示すための概念図である。 従来のクロッピング処埋を用いた空間スケーラブル符号化の処理過程を示すための概念図(その1)である。 従来のクロッピング処理を用いた空間スケーラブル符号化の処理過程を示すための概念図(その2)である。 従来のレターボックス処理を用いた空間スケーラブル符号化の処理過程を示すための概念図である。 従来のスクイーズ処理の様子を示すための概念図である。 従来のスクイーズ処埋を用いた空間スケーラブル符号化の処理過程を示すための概念図である。
符号の説明
11、21 エンハンス領域
12、22、97 クロッピング領域
13、23、28、81、89、701、706 オリジナル領域
26、27、31、32、82、83、90、91、702 歪み領域
1602 画像入力部
1603、1618、1720 クロッピング領域特定部
1604、1615、1711 歪み領域特定部
1605 歪み領域縮小部
1606 クロッピング領域縮小部
1607、1619 ME部
1608、1621、1706、1724 MC部
1609、1622、1707、1725 フレームバッファ部
1610、1623 直交変換部
1611、1624 量子化部
1612、1625 エントロピー符号化部
1613、1626、1705、1723 逆量子化部
1614、1627、1708、1726 逆直交変換部
1616、1714 歪み領域拡大部
1617、1717 画像拡大部
1620、1721 レイヤ間予測部
1628 MUX部
1629 符号化出力部
1702 符号化入力部
1703 DEMUX部
1704、1722 エントロピー復号部
1709、1712、1715、1718、1727 画像出力部
2903、3003 中央処理制御装置


Claims (6)

  1. 高精細な第1の空間解像度を持つ映像から、前記第1の空間解像度より低い第2の空間解像度をもつ映像まで対応するために、当該映像を構成している画像フレームの空間解像度を変換する空間解像度変換を利用した空間スケーラブル符号化方法であって、
    前記第1の空間解像度を有する映像信号の画像フレームである第1の画像フレームから、該第1の画像フレームとは縦横比の異なる前記第2の空間解像度を有する映像信号の画像フレームである第2の画像フレームを、空間解像度変換を利用して生成するに際し、前記第1の画像フレーム内で、前記第2の画像フレームとするための画像領域であるクロッピング領域を特定する第1のステップと、
    前記クロッピング領域内で画像形状を歪ませずに空間解像度変換を行う領域である第1のオリジナル領域を特定すると共に、前記第1の画像フレームにおける前記第1のオリジナル領域を特定するための情報である第1の領域情報を生成する第2のステップと、
    前記クロッピング領域内における前記第1のオリジナル領域外の領域を、画像形状を歪ませて空間解像度変換を行う領域である第1の歪み領域に特定する第3のステップと、
    前記第2の画像フレームのサイズと前記第1の画像フレームのサイズとの比に応じて、前記第1のオリジナル領域を第1の縮小方法にて画像形状を歪ませずに縮小して第2のオリジナル領域とすると共に、前記第1の画像フレームにおける前記第1のオリジナル領域外の領域を、前記第1の歪み領域を前記第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して第2の歪み領域とし、前記第2の画像フレームにおける前記第2のオリジナル領域を特定するための情報である第2の領域情報を生成して、前記第2のオリジナル領域と前記第2の歪み領域とにより、前記第2の空間解像度を有する第2の画像フレームを生成する第4のステップと、
    前記第のステップで生成された前記第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力する第のステップと、
    前記第1の符号化信号を復号化して前記第2の画像フレームの第1の復号信号を得る第のステップと、
    前記第1の復号信号中の前記第2の歪み領域の画像を元の縦横比の画像とし、かつ、前記第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等の第2の復号信号を得る第のステップと、
    前記第1の画像フレームと前記第2の復号信号との間でレイヤ間予測処理を行う第のステップと、
    前記第のステップによるレイヤ間予測処理結果に基づいて、前記第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成して出力する第のステップと
    を含むことを特徴とする空間スケーラブル符号化方法。
  2. 高精細な第1の空間解像度を持つ映像から、前記第1の空間解像度より低い第2の空間解像度をもつ映像まで対応するために、当該映像を構成している画像フレームの空間解像度を変換する空間解像度変換を利用した空間スケーラブル符号化装置であって、
    前記第1の空間解像度を有する映像信号の画像フレームである第1の画像フレームから、該第1の画像フレームとは縦横比の異なる前記第2の空間解像度を有する映像信号の画像フレームである第2の画像フレームを、空間解像度変換を利用して生成するに際し、前記第1の画像フレーム内で、前記第2の画像フレームとするための画像領域であるクロッピング領域を特定するクロッピング領域特定手段と、
    前記クロッピング領域内で画像形状を歪ませずに空間解像度変換を行う領域である第1のオリジナル領域を特定すると共に、前記第1の画像フレームにおける前記第1のオリジナル領域を特定するための情報である第1の領域情報を生成する領域特定・領域情報生成手段と、
    前記クロッピング領域内における前記第1のオリジナル領域外の領域を、画像形状を歪ませて空間解像度変換を行う領域である第1の歪み領域に特定する第1の歪み領域特定手段と、
    前記第2の画像フレームのサイズと前記第1の画像フレームのサイズとの比に応じて、前記第1のオリジナル領域を第1の縮小方法にて画像形状を歪ませずに縮小して第2のオリジナル領域とすると共に、前記第1の画像フレームにおける前記第1のオリジナル領域外の領域を、前記第1の歪み領域を前記第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して第2の歪み領域とし、前記第2の画像フレームにおける前記第2のオリジナル領域を特定するための情報である第2の領域情報を生成して、前記第2のオリジナル領域と前記第2の歪み領域とにより、前記第2の空間解像度を有する第2の画像フレームを生成する第2の画像フレーム生成手段と、
    前記第2の画像フレーム生成手段で生成された前記第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力する第1の符号化手段と、
    前記第1の符号化信号を復号化して前記第2の画像フレームの第1の復号信号を得る第1の復号化手段と、
    前記第1の復号信号中の前記第2の歪み領域の画像を元の縦横比の画像とし、かつ、前記第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等の第2の復号信号を得る第2の復号化手段と、
    前記第1の画像フレームと前記第2の復号信号との間でレイヤ間予測処理を行う予測処理手段と、
    前記レイヤ間予測処理結果に基づいて、前記第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成して出力する第2の符号化手段と
    を有することを特徴とする空間スケーラブル符号化装置。
  3. 高精細な第1の空間解像度を持つ映像から、前記第1の空間解像度より低い第2の空間解像度をもつ映像まで対応するために、当該映像を構成している画像フレームの空間解像度を変換する空間解像度変換を利用した空間スケーラブル符号化を、コンピュータにより実行させる空間スケーラブル符号化プログラムであって、
    前記コンピュータに、
    前記第1の空間解像度を有する映像信号の画像フレームである第1の画像フレームから、該第1の画像フレームとは縦横比の異なる前記第2の空間解像度を有する映像信号の画像フレームである第2の画像フレームを、空間解像度変換を利用して生成するに際し、前記第1の画像フレーム内で、前記第2の画像フレームとするための画像領域であるクロッピング領域を特定する第1のステップと、
    前記クロッピング領域内で画像形状を歪ませずに空間解像度変換を行う領域である第1のオリジナル領域を特定すると共に、前記第1の画像フレームにおける前記第1のオリジナル領域を特定するための情報である第1の領域情報を生成する第2のステップと、
    前記クロッピング領域内における前記第1のオリジナル領域外の領域を、画像形状を歪ませて空間解像度変換を行う領域である第1の歪み領域に特定する第3のステップと、
    前記第2の画像フレームのサイズと前記第1の画像フレームのサイズとの比に応じて、前記第1のオリジナル領域を第1の縮小方法にて画像形状を歪ませずに縮小して第2のオリジナル領域とすると共に、前記第1の画像フレームにおける前記第1のオリジナル領域外の領域を、前記第1の歪み領域を前記第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して第2の歪み領域とし、前記第2の画像フレームにおける前記第2のオリジナル領域を特定するための情報である第2の領域情報を生成して、前記第2のオリジナル領域と前記第2の歪み領域とにより、前記第2の空間解像度を有する第2の画像フレームを生成する第4のステップと、
    前記第のステップで生成された前記第2の画像フレームに対して符号化処理を行って第1の符号化信号を生成して出力する第のステップと、
    前記第1の符号化信号を復号化して前記第2の画像フレームの第1の復号信号を得る第のステップと、
    前記第1の復号信号中の前記第2の歪み領域の画像を元の縦横比の画像とし、かつ、前記第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等の第2の復号信号を得る第のステップと、
    前記第1の画像フレームと前記第2の復号信号との間でレイヤ間予測処理を行う第のステップと、
    前記第のステップによるレイヤ間予測処理結果に基づいて、前記第1の画像フレームに対して符号化処理を行って第2の符号化信号を生成して出力する第のステップと
    を順次実行させることを特徴とする空間スケーラブル符号化プログラム。
  4. 第1の空間解像度を有する映像信号の第1の画像フレームから変換された、前記第1の空間解像度よりも低い第2の空間解像度を有する第2の画像フレームの映像信号を、当該映像信号を構成している画像フレーム単位で、再度、前記第1の空間解像度を有する映像信号に変換する空間解像度変換を利用した空間スケーラブル符号化方法により符号化されて出力された、第1及び第2の符号化信号を復号化する空間スケーラブル復号化方法であって、
    復号化対象の前記第1の符号化信号は、
    前記第1の画像フレーム内で前記第2の画像フレームとするための画像領域である第1のクロッピング領域内において空間解像度変換を行う第1のオリジナル領域を、前記第2の画像フレームのサイズと前記第1の画像フレームのサイズとの比に応じて、第1の縮小方法にて画像形状を歪ませずに縮小して得られた第2のオリジナル領域と、前記第1の画像フレームにおける前記第1のオリジナル領域外の領域を、前記第1の歪み領域を前記第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して得られた第2の歪み領域とよりなる前記第2の画像フレームに対して符号化処理して得られた符号化信号であり、
    復号化対象の前記第2の符号化信号は、
    前記第1の符号化信号を復号して得た前記第2の画像フレームの第1の復号信号中の前記第2の歪み領域の画像を元の縦横比の画像とし、かつ、前記第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより得られた、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等の第2の復号信号と、前記第1の画像フレームとの間で行ったレイヤ間予測処理結果に基づいて、前記第1の画像フレームに対して符号化処理して得られた符号化信号であり、
    前記第1の符号化信号に対して復号化処理を行って前記第2のオリジナル領域と前記第2の歪み領域とからなる前記第2の画像フレームの第3の復号信号を得る第1のステップと、
    前記第1のステップにより得られた前記第3の復号信号中の前記第2の歪み領域の画像を、前記第1の画像フレームの元の縦横比の画像とし、かつ、該復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等で、前記クロッピング領域の第4の復号信号を生成する第2のステップと、
    前記第2の符号化信号に対して復号化処理を行って前記第1の空間解像度の第5の復号信号を出力する第3のステップと、
    前記第4の復号信号と前記第5の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って前記第1の画像フレームの復号信号を生成して出力する第4のステップと
    を含むことを特徴とする空間スケーラブル復号化方法。
  5. 第1の空間解像度を有する映像信号の第1の画像フレームから変換された、前記第1の空間解像度よりも低い第2の空間解像度を有する第2の画像フレームの映像信号を、当該映像信号を構成している画像フレーム単位で、再度、前記第1の空間解像度を有する映像信号に変換する空間解像度変換を利用した空間スケーラブル符号化方法により符号化されて出力された、第1及び第2の符号化信号を復号化する空間スケーラブル復号化装置であって、
    復号化対象の前記第1の符号化信号は、
    前記第1の画像フレーム内で前記第2の画像フレームとするための画像領域である第1のクロッピング領域内において空間解像度変換を行う第1のオリジナル領域を、前記第2の画像フレームのサイズと前記第1の画像フレームのサイズとの比に応じて、第1の縮小方法にて画像形状を歪ませずに縮小して得られた第2のオリジナル領域と、前記第1の画像フレームにおける前記第1のオリジナル領域外の領域を、前記第1の歪み領域を前記第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して得られた第2の歪み領域とよりなる前記第2の画像フレームに対して符号化処理して得られた符号化信号であり、
    復号化対象の前記第2の符号化信号は、
    前記第1の符号化信号を復号して得た前記第2の画像フレームの第1の復号信号中の前記第2の歪み領域の画像を元の縦横比の画像とし、かつ、前記第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより得られた、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等の第2の復号信号と、前記第1の画像フレームとの間で行ったレイヤ間予測処理結果に基づいて、前記第1の画像フレームに対して符号化処理して得られた符号化信号であり、
    前記第1の符号化信号に対して復号化処理を行って前記第2のオリジナル領域と前記第2の歪み領域とからなる前記第2の画像フレームの第3の復号信号を得る第1の復号手段と、
    前記第1の復号手段により得られた前記第3の復号信号中の前記第2の歪み領域の画像を、前記第1の画像フレームの元の縦横比の画像とし、かつ、該復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等で、前記クロッピング領域の第4の復号信号を生成する第2の復号手段と、
    前記第2の符号化信号に対して復号化処理を行って前記第1の空間解像度の第5の復号信号を出力する第3の復号手段と、
    前記第4の復号信号と前記第5の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って前記第1の画像フレームの復号信号を生成して出力する第4の復号手段と
    を有することを特徴とする空間スケーラブル復号化装置。
  6. 第1の空間解像度を有する映像信号の第1の画像フレームから変換された、前記第1の空間解像度よりも低い第2の空間解像度を有する第2の画像フレームの映像信号を、当該映像信号を構成している画像フレーム単位で、再度、前記第1の空間解像度を有する映像信号に変換する空間解像度変換を利用した空間スケーラブル符号化方法により符号化されて出力された、第1及び第2の符号化信号を復号化する空間スケーラブル復号化を、コンピュータにより実行させる空間スケーラブル復号化プログラムであって、
    復号化対象の前記第1の符号化信号は、
    前記第1の画像フレーム内で前記第2の画像フレームとするための画像領域である第1のクロッピング領域内において空間解像度変換を行う第1のオリジナル領域を、前記第2の画像フレームのサイズと前記第1の画像フレームのサイズとの比に応じて、第1の縮小方法にて画像形状を歪ませずに縮小して得られた第2のオリジナル領域と、前記第1の画像フレームにおける前記第1のオリジナル領域外の領域を、前記第1の歪み領域を前記第1の縮小方法にて縮小した領域と一致する領域となるように、第2の縮小方法にて画像形状を歪ませて縮小して得られた第2の歪み領域とよりなる前記第2の画像フレームに対して符号化処理して得られた符号化信号であり、
    復号化対象の前記第2の符号化信号は、
    前記第1の符号化信号を復号して得た前記第2の画像フレームの第1の復号信号中の前記第2の歪み領域の画像を元の縦横比の画像とし、かつ、前記第1の復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより得られた、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等の第2の復号信号と、前記第1の画像フレームとの間で行ったレイヤ間予測処理結果に基づいて、前記第1の画像フレームに対して符号化処理して得られた符号化信号であり、
    前記コンピュータに、
    前記第1の符号化信号に対して復号化処理を行って前記第2のオリジナル領域と前記第2の歪み領域とからなる前記第2の画像フレームの第3の復号信号を得る第1のステップと、
    前記第1のステップにより得られた前記第3の復号信号中の前記第2の歪み領域の画像を、前記第1の画像フレームの元の縦横比の画像とし、かつ、該復号信号に対して所定のフィルタリング処理及び拡大処理を行うことにより、縦横比が前記第1の画像フレームの縦横比と等しく、かつ、空間解像度が前記第1の空間解像度と同等で、前記クロッピング領域の第4の復号信号を生成する第2のステップと、
    前記第2の符号化信号に対して復号化処理を行って前記第1の空間解像度の第5の復号信号を出力する第3のステップと、
    前記第4の復号信号と前記第5の復号信号との間でレイヤ間予測復号処理を行い、そのレイヤ間予測復号処理結果に基づいて復号化処理を行って前記第1の画像フレームの復号信号を生成して出力する第4のステップと
    を順次に実行させることを特徴とする空間スケーラブル復号化プログラム。
JP2005114440A 2005-04-12 2005-04-12 空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム Active JP4321484B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005114440A JP4321484B2 (ja) 2005-04-12 2005-04-12 空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005114440A JP4321484B2 (ja) 2005-04-12 2005-04-12 空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム

Publications (2)

Publication Number Publication Date
JP2006295600A JP2006295600A (ja) 2006-10-26
JP4321484B2 true JP4321484B2 (ja) 2009-08-26

Family

ID=37415678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005114440A Active JP4321484B2 (ja) 2005-04-12 2005-04-12 空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム

Country Status (1)

Country Link
JP (1) JP4321484B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548056B2 (en) * 2007-01-08 2013-10-01 Qualcomm Incorporated Extended inter-layer coding for spatial scability
US8514932B2 (en) * 2010-02-08 2013-08-20 Disney Enterprises, Inc. Content adaptive and art directable scalable video coding
US9648319B2 (en) * 2012-12-12 2017-05-09 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding

Also Published As

Publication number Publication date
JP2006295600A (ja) 2006-10-26

Similar Documents

Publication Publication Date Title
KR102453512B1 (ko) 투영 기반 프레임을 프로세싱하기 위한 방법
EP1878260B1 (en) Method for scalably encoding and decoding video signal
JP2007528675A (ja) Avc用解像度低下更新モード
JP2004531969A (ja) ビデオ画像の解像度をダウンスケールする方法及び装置
JP2011223519A (ja) データ変換装置
KR100963424B1 (ko) 스케일러블 영상 복호화기 및 그 제어 방법
JP2000341695A (ja) 符号化高精細度ビデオ信号から拡張デコード低減解像度ビデオ信号を得るための装置および方法
JP2023171607A (ja) 参照ピクチャー再サンプリングがある場合のラップアラウンド動き補償に関する方法、装置、コンピュータ・プログラム
JP4321484B2 (ja) 空間スケーラブル符号化方法、空間スケーラブル符号化装置、空間スケーラブル符号化プログラム、空間スケーラブル復号化方法、空間スケーラブル復号化装置及び空間スケーラブル復号化プログラム
JP2010098352A (ja) 画像情報符号化装置
US7787700B2 (en) Signal processing method, signal processing apparatus, computer-readable medium and a data recording medium
JP2008204182A (ja) 画像処理装置、制御方法、プログラム、及び記憶媒体
JP4321483B2 (ja) 空間解像度変換方法及び空間解像度変換プログラム
JP2007180916A (ja) 空間解像度変換装置
RU2785364C1 (ru) Способ циклической компенсации движения с передискретизацией опорного изображения
JP2014103568A (ja) 画像処理装置、画像処理方法、およびプログラム
CN113196759B (zh) 图像编码设备和方法、图像解码设备和方法以及存储介质
RU2772795C1 (ru) Способ передискретизации опорного изображения со смещением в битовом потоке видеоданных
JP2004214983A (ja) 画像処理方法
JP5332329B2 (ja) 特定領域を等倍出力する機能を持ったダウンデコード装置
JP4194311B2 (ja) 動画像符号化装置及び動画像復号装置並びにそれらの方法
JP3869303B2 (ja) 画像復号化方法及び装置
JP6071618B2 (ja) 画像処理装置及びプログラム
JP2004274630A (ja) 画像データ生成装置、画像データ生成方法及び記録媒体
JP2004214982A (ja) 画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090525

R151 Written notification of patent or utility model registration

Ref document number: 4321484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4