<第1実施の形態>
(符号化装置の第1実施の形態の構成例)
図4は、本技術を適用した符号化装置の第1実施の形態の構成例を示すブロック図である。
図4の符号化装置50は、設定部51と符号化部52により構成される。符号化装置50は、1次元配列で並ぶ複数の撮影部としてのカメラにより撮影された複数の視点の画像(以下、多視点画像という)を3D符号化方式で符号化して符号化ストリームを生成し、伝送する。
具体的には、符号化装置50の設定部51は、SPS(Sequence Parameter Set),PPS(Picture Parameter Set)等を設定する。また、設定部51は、1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順にビューID(視点識別情報)を付与する。さらに、設定部51は、ビューIDが1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順に付与されていることを識別する順序信頼フラグ(順序信頼情報)を生成する。そして、設定部51は、ビューIDと順序信頼フラグを含むVPSを設定する。設定部51は、SPS,PPS,VPS等のパラメータセットを符号化部52に供給する。
符号化部52は、設定部51から供給されるVPSに含まれる順序信頼フラグとビューIDに基づいて、外部から入力される多視点画像を3D符号化方式で符号化し、符号化データを生成する。符号化部52は、符号化データに、設定部51から供給されるパラメータセットを付加して符号化ストリームを生成する。符号化部52は、伝送部として機能し、生成された符号化ストリームを伝送する。
(VPSのシンタックスの構成例)
図5は、図4の設定部51により設定されるVPSのシンタックスの例を示す図である。
図5の6行目に示すように、VPSには、順序信頼フラグ(view_order_idc)が含まれる。順序信頼フラグは、ビューIDが1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順に大きくなるように付与されていることを表す場合0であり、順に小さくなるように付与されていることを表す場合1である。また、順序信頼フラグは、ビューIDが1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順に付与されていないことを表す場合0である。
例えば、カメラが水平方向に並び、左端のカメラから順に、右端のカメラの視点のビューIDが最も大きくなるようにビューIDが付与されている場合、順序信頼フラグは0となる。また、カメラが水平方向に並び、左端のカメラから順に、右端のカメラの視点のビューIDが最も小さくなるようにビューIDが付与されている場合、順序信頼フラグは1となる。
また、11行目乃至15行目に示すように、VPSには、図1の場合と同様に、ビューID(view_id)、参照画像の数(num_direct_ref_layers)、および参照画像特定情報(ref_layer_id)が含まれる。
(ビューIDの説明)
図6は、ビューIDとカメラの位置の関係の例を示す図である。
なお、図6において、横軸はカメラの位置を表し、縦軸はビューIDを表している。
図6に示すように、ビューIDは、端のカメラから単調増加する。具体的には、図6の例では、5個のカメラが存在し、各カメラの位置は、中央のカメラの位置を0としたとき、それぞれ、-n´-m´,-n´,0,n,n+mである。この場合、最も端の位置、即ち位置-n´-m´のカメラのビューIDがv-2とされ、そのカメラの隣の位置-n´のカメラのビューIDがv-1とされる。また、中央のカメラのビューIDがvとされ、位置nのカメラのビューIDがv+1とされ、位置n+mのカメラのビューIDはv+2とされる。
このように、ビューIDは端のカメラから単調増加するため、符号化部52は、ビューIDを各視点の位置を表す情報として用いることができる。
(符号化部の構成例)
図7は、図4の符号化部52の構成例を示すブロック図である。
図7の符号化部52は、A/D変換部101、画面並べ替えバッファ102、演算部103、直交変換部104、量子化部105、可逆符号化部106、および蓄積バッファ107を有する。また、符号化部52は、逆量子化部108、逆直交変換部109、演算部110、フィルタ111、デコードピクチャバッファ112、選択部113、イントラ予測部114、動き視差予測・補償部115、予測画像選択部116、および多視点デコードピクチャバッファ121を有する。符号化部52は、外部から入力される多視点画像を視点ごとに順に符号化する。
具体的には、符号化部52のA/D変換部101は、入力された所定の視点の画像をA/D変換し、変換後のデジタルデータである画像を画面並べ替えバッファ102に供給し、記憶させる。画面並べ替えバッファ102は、記憶した表示の順番のフレームの画像を、GOP(Group Of Picture)に応じて、符号化のためのフレームの順番に並べ替える。画面並べ替えバッファ102は、フレームの順番を並び替えた画像を、その画像のビューIDおよびPOC(Picture Order Count)とともに、演算部103に供給する。
また、画面並べ替えバッファ102は、フレームの順番を並び替えた画像を、その画像のビューIDおよびPOCとともに、イントラ予測部114および動き視差予測・補償部115にも供給する。
演算部103は、符号化部として機能し、画面並べ替えバッファ102から読み出された画像から、予測画像選択部116を介してイントラ予測部114または動き視差予測・補償部115から供給される予測画像を減算することにより符号化を行う。演算部103は、その結果得られる差分情報を直交変換部104に出力する。
例えば、イントラ符号化が行われる場合、演算部103は、画面並べ替えバッファ102から読み出された画像から、イントラ予測部114から供給される予測画像を減算する。また、インター符号化が行われる場合、演算部103は、画面並べ替えバッファ102から読み出された画像から、動き視差予測・補償部115から供給される予測画像を減算する。
直交変換部104は、演算部103から供給される差分情報に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。なお、この直交変換の方法は任意である。直交変換部104は、その変換係数を量子化部105に供給する。
量子化部105は、直交変換部104から供給される変換係数を量子化する。量子化部105は、符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。なお、この量子化の方法は任意である。量子化部105は、量子化された変換係数を可逆符号化部106に供給する。
可逆符号化部106は、量子化部105において量子化された変換係数を任意の符号化方式で可逆符号化し、符号化データを生成する。また、可逆符号化部106は、イントラ予測のモードを示す情報等を含むイントラ予測情報をイントラ予測部114から取得し、インター予測のモードを示す情報や動き視差ベクトル情報などを含むインター予測情報を動き視差予測・補償部115から取得する。さらに、可逆符号化部106は、フィルタ111において使用されたフィルタ係数等を取得する。
可逆符号化部106は、これらの各種情報を任意の符号化方式で可逆符号化し、符号化データのヘッダ情報の一部とする(多重化する)。可逆符号化部106は、ヘッダ情報が多重化された符号化データを蓄積バッファ107に供給して蓄積させる。
可逆符号化部106の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、H.264/AVC方式で定められているCAVLC(Context-Adaptive Variable Length Coding)などが挙げられる。算術符号化としては、例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)などが挙げられる。
蓄積バッファ107は、可逆符号化部106から供給された符号化データを、一時的に保持する。蓄積バッファ107は、所定のタイミングにおいて、保持している符号化データを、図4の設定部51から供給されるパラメータセットとともに符号化ストリームとして、例えば、後段の図示せぬ記録装置(記録媒体)や伝送路などに出力する。つまり、符号化ストリームが復号側に供給される。
また、量子化部105において量子化された変換係数は、逆量子化部108にも供給される。逆量子化部108は、その量子化された変換係数を、量子化部105による量子化に対応する方法で逆量子化する。この逆量子化の方法は、量子化部105による量子化処理に対応する方法であればどのような方法であってもよい。逆量子化部108は、得られた変換係数を、逆直交変換部109に供給する。
逆直交変換部109は、逆量子化部108から供給された変換係数を、直交変換部104による直交変換処理に対応する方法で逆直交変換する。この逆直交変換の方法は、直交変換部104による直交変換処理に対応する方法であればどのようなものであってもよい。逆直交変換された出力(局所的に復元された差分情報)は、演算部110に供給される。
演算部110は、逆直交変換部109から供給された逆直交変換結果、すなわち、局所的に復元された差分情報に、予測画像選択部116を介してイントラ予測部114若しくは動き視差予測・補償部115から供給される予測画像を加算し、局所的に復号された画像(以下、再構成画像と称する)を得る。その再構成画像は、フィルタ111またはデコードピクチャバッファ112に供給される。
フィルタ111は、デブロックフィルタや適応ループフィルタ等を含み、演算部110から供給される再構成画像に対して適宜フィルタ処理を行う。例えば、フィルタ111は、再構成画像に対してデブロックフィルタ処理を行うことにより再構成画像のブロック歪を除去する。また、例えば、フィルタ111は、そのデブロックフィルタ処理結果(ブロック歪みの除去が行われた再構成画像)に対して、ウィナーフィルタ(Wiener Filter)を用いてループフィルタ処理を行うことにより画質改善を行う。
なお、フィルタ111は、再構成画像に対して任意のフィルタ処理を行うようにしてもよい。また、フィルタ111は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部106に供給し、可逆符号化させるようにすることもできる。
フィルタ111は、フィルタ処理結果(以下、復号画像と称する)をデコードピクチャバッファ112に供給する。
デコードピクチャバッファ112は、演算部110から供給される再構成画像と、フィルタ111から供給される復号画像とをそれぞれ記憶する。また、デコードピクチャバッファ112は、再構成画像と復号画像のビューIDおよびPOCを記憶する。
デコードピクチャバッファ112は、所定のタイミングにおいて、若しくは、イントラ予測部114等の外部からの要求に基づいて、記憶している再構成画像、並びに、その再構成画像のビューIDおよびPOCを、選択部113を介してイントラ予測部114に供給する。また、デコードピクチャバッファ112は、所定のタイミングにおいて、若しくは、動き視差予測・補償部115等の外部からの要求に基づいて、記憶している復号画像、並びに、その復号画像のビューIDおよびPOCを、選択部113を介して動き視差予測・補償部115に供給する。
選択部113は、デコードピクチャバッファ112から出力される再構成画像または復号画像の供給先を示す。具体的には、イントラ符号化が行われる場合、選択部113は、デコードピクチャバッファ112からフィルタ処理されていない再構成画像を読み出し、予測対象領域の周辺に位置する周辺領域の画像(周辺画像)として、イントラ予測部114に供給する。
また、インター符号化が行われる場合、選択部113は、デコードピクチャバッファ112からフィルタ処理された復号画像を読み出し、参照画像として、それを動き視差予測・補償部115に供給する。
イントラ予測部114は、デコードピクチャバッファ112から、周辺画像を取得すると、その周辺画像の画素値を用いて、基本的にプレディクションユニット(PU)を処理単位として予測画像を生成するイントラ予測を行う。イントラ予測部114は、候補となる全てのイントラ予測モードで、このイントラ予測を行う。
イントラ予測部114は、候補となる全てのイントラ予測モードのイントラ予測により生成された予測画像と、画面並べ替えバッファ102から供給される入力画像とを用いて各予測画像のコスト関数値を評価し、最適なイントラ予測モードを選択する。そして、イントラ予測部114は、最適なイントラ予測モードで生成された予測画像とコスト関数値を、予測画像選択部116に供給する。
また、イントラ予測部114は、予測画像選択部116から選択が通知された場合、最適なイントラ予測モード等のイントラ予測に関する情報を含むイントラ予測情報を、適宜可逆符号化部106に供給し、符号化させる。
動き視差予測・補償部115は、図4の設定部51から供給されるVPSに含まれる順序信頼フラグに基づいて、VPSに含まれる参照画像特定情報をリストに登録することにより、リストを生成する。
具体的には、動き視差予測・補償部115は、予測対象の画像よりPOCが前の同一視点の画像を参照画像とする参照画像特定情報を、VPSに設定されている順にリストL0に登録する。また、動き視差予測・補償部115は、予測対象の画像よりPOCが後の同一視点の画像を参照画像とする参照画像特定情報を、VPSに設定されている順にリストL1に登録する。また、動き視差予測・補償部115は、設定部として機能し、順序信頼フラグに基づいて、予測対象の画像と異なる視点の画像を参照画像とする参照画像特定情報をリストL0とリストL1に登録(設定)する。
動き視差予測・補償部115は、リストに登録されている参照画像特定情報により特定される復号画像を、リストに登録されている順にデコードピクチャバッファ112から参照画像として読み出す。動き視差予測・補償部115は、画面並べ替えバッファ102から供給される入力画像と参照画像とを用いて、基本的にPUを処理単位として、動き予測や視差予測をインター予測として行う。
動き予測とは、時間方向の相関性を利用した予測であり、視差予測とは、視差方向の相関性を利用した予測である。動き視差予測・補償部115は、動き予測の結果動きベクトルを検出し、視差予測の結果視差ベクトルを検出する。なお、以下では、動きベクトルと視差ベクトルを特に区別する必要がない場合、それらをまとめて動き視差ベクトルという。
動き視差予測・補償部115は、インター予測の結果検出された動き視差ベクトルに応じて補償処理を行い、予測画像を生成する。動き視差予測・補償部115は、候補となる全てのインター予測モードで、このようなインター予測と補償処理を行う。
動き視差予測・補償部115は、候補となる全てのインター予測モードの予測画像と、画面並べ替えバッファ102から供給される入力画像とを用いて、各予測画像のコスト関数値を評価し、最適なインター予測モードを選択する。そして、動き視差予測・補償部115は、最適なインター予測モードで生成された予測画像とコスト関数値を、予測画像選択部116に供給する。
また、動き視差予測・補償部115は、予測画像選択部116から選択が通知された場合、順序信頼フラグに基づいて、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。
具体的には、動き視差ベクトルが動きベクトルである場合、動き視差予測・補償部115は、予測対象の画像とその画像の参照画像のPOCの差分と、予測対象の画像の時間的な周辺領域の画像(以下、時間周辺領域画像という)とその画像の参照画像のPOCの差分とに基づいて、時間周辺領域画像の動きベクトルを補正し、予測ベクトルとする時間スケーリング処理を行う。
一方、動き視差ベクトルが視差ベクトルである場合、動き視差予測・補償部115は、順序信頼フラグに基づいて、視差スケーリング処理を行う。視差スケーリング処理とは、ビューIDを各視点の位置を表す情報として用いて、視点間の距離(カメラ間の距離)に基づいて、予測対象の画像の視差的な周辺領域の画像(以下、視差周辺領域画像という)の視差ベクトルを補正し、予測ベクトルとする処理である。具体的には、視差スケーリング処理では、予測対象の画像とその画像の参照画像のビューIDの差分と、視差周辺領域画像と視差周辺領域画像の参照画像のビューIDの差分とに基づいて、視差周辺領域画像の視差ベクトルが補正され、予測ベクトルとされる。
動き視差予測・補償部115は、生成された予測ベクトルと、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの差分を演算し、動き視差ベクトル情報とする。また、動き視差予測・補償部115は、動き視差ベクトル情報、最適なインター予測モード等のインター予測に関する情報を含むインター予測情報を可逆符号化部106に供給し、可逆符号化させる。
予測画像選択部116は、イントラ予測部114と動き視差予測・補償部115から供給されるコスト関数値に基づいて、演算部103と演算部110に供給する予測画像の供給元を選択する。
具体的には、イントラ予測部114から供給されるコスト関数値が動き視差予測・補償部115から供給されるコスト関数値より小さい場合、予測画像選択部116は、予測画像の供給元としてイントラ予測部114を選択する。これにより、イントラ予測部114から供給される予測画像が演算部103と演算部110に供給され、イントラ符号化が行われる。
一方、動き視差予測・補償部115から供給されるコスト関数値がイントラ予測部114から供給されるコスト関数値より小さい場合、予測画像選択部116は、予測画像の供給元として動き視差予測・補償部115を選択する。これにより、動き視差予測・補償部115から供給される予測画像が演算部103と演算部110に供給され、インター符号化が行われる。動き視差予測・補償部115は、選択した供給元に選択を通知する。
デコードピクチャバッファ112は、処理対象の視点の復号画像および再構成画像、並びに、復号画像および再構成画像のビューIDとPOCを記憶するが、多視点デコードピクチャバッファ121は、各視点の復号画像、並びに、復号画像のビューIDとPOCを記憶する。つまり、多視点デコードピクチャバッファ121は、デコードピクチャバッファ112に供給された復号画像、並びに、復号画像のビューIDおよびPOCを取得し、デコードピクチャバッファ112とともに記憶する。
デコードピクチャバッファ112は、処理対象の視点が変わると、前の処理対象の視点の復号画像を消去するが、多視点デコードピクチャバッファ121は、そのまま保持する。そして、デコードピクチャバッファ112などの要求に従って、記憶している復号画像、並びに、復号画像のビューIDおよびPOCを、「処理対象ではない視点の復号画像、並びに、復号画像のビューIDおよびPOC」として、デコードピクチャバッファ112に供給する。デコードピクチャバッファ112は、多視点デコードピクチャバッファ121から読み出した「処理対象ではない視点の復号画像、並びに、復号画像のビューIDおよびPOC」を、選択部113を介して動き視差予測・補償部115に供給する。
(時間スケーリング処理と視差スケーリング処理の説明)
図8は、時間スケーリング処理と視差スケーリング処理の演算を説明する図である。
時間スケーリング処理では、時間周辺領域画像の予測ベクトルに対して係数distScaleFactorが乗算されることにより、時間周辺領域画像の予測ベクトルが補正される。この係数distScaleFactorは、図8の1行目および2行目に示すように、係数tbと係数tdに基づいて求められる。
そして、係数tbは、7行目に示すように、予測対象の画像のPOC(PicOrderCntVal)とその画像の参照画像のPOC(PicOrderCnt(refpicListA[refIdxA]))の差分に基づいて求められる。また、係数tdは、8行目に示すように、時間周辺領域画像のPOC(PicOrderCntVal)と、時間周辺領域画像の参照画像のPOC(PicOrderCnt(RefpicListX[refIdxLX]))との差分に基づいて求められる。
一方、視差スケーリング処理では、視差周辺領域画像の予測ベクトルに対して係数distScaleFactorが乗算されることにより、視差周辺領域画像の予測ベクトルが補正される。この係数distScaleFactorは、時間スケーリング処理の場合と同様に、図8の1行目および2行目に示すように、係数tbと係数tdに基づいて求められる。
但し、このときの係数tbは、10行目に示すように、予測対象の画像のビューID(ViewOrderIdx Val)とその画像の参照画像のビューID(ViewOrderIdx(refpicListA[refIdxA])との差分に基づいて求められる。また、係数tdは、11行目に示すように、視差周辺領域画像のビューID(ViewOrderIdx Val)と視差周辺領域画像の予測画像のビューID(ViewOrderIdx (RefpicListX[refIdxLX]))との差分に基づいて求められる。
(リストの登録方法の説明)
図9と図10は、従来のリストの登録方法を説明する図であり、図11と図12は、図7の動き視差予測・補償部115によるリストの登録方法を説明する図である。
図9に示すように、従来のリストの登録方法では、L0リスト(RefPicListTemp0[rIdx])とL1リスト(RefPicListTemp0[rIdx])は、VPSで設定される順の参照画像特定情報(RefPicSetIvCurr)である。
従って、例えば、図10に示すように、Iピクチャ、Bピクチャ、Pピクチャの視点にそれぞれ、ビューID「0」、「1」、「2」が付与され、符号化順(view order index)が、Iピクチャ、Pピクチャ、Bピクチャの順である場合、例えば、Bピクチャの参照画像特定情報として、Iピクチャ、Pピクチャを参照画像とする参照画像特定情報が順にVPSに設定されると、L0リストとL1リストの両方に、Iピクチャ、Pピクチャを参照画像とする参照画像特定情報が順に登録される。
一方、動き視差予測・補償部115によるリストの登録方法では、図11の5行目と6行目に示すように、予測対象の画像のビューIDより小さいビューIDの画像を参照画像とする参照画像特定情報が、予測対象の画像のビューIDとビューIDが近い順にRefPicSetIvCurrBeforeに設定される。また、7行目と8行目に示すように、予測対象の画像のビューIDより大きいビューIDの画像を参照画像とする参照画像特定情報が、予測対象の画像のビューIDとビューIDが近い順にRefPicSetIvCurrAfterに設定される。
このように、動き視差予測・補償部115は、ビューIDを各視点の位置を表す情報として用いて、予測対象の画像の視点より所定の方向に存在する視点の画像を参照画像とする参照画像特定情報を、予測対象の画像の視点から近い順にRefPicSetIvCurrBeforeとする。また、動き視差予測・補償部115は、ビューIDを各視点の位置を表す情報として用いて、予測対象の画像の視点より所定の方向と逆の方向に存在する視点の画像を参照画像とする参照画像特定情報を、予測対象の画像の視点から近い順にRefPicSetIvCurrAfterとする。
そして、19行目乃至22行目に示すように、L0リスト(RefPicListTemp0[rIdx])として、RefPicSetIvCurrBeforeが設定された後、RefPicSetIvCurrAfterが設定される。また、33行目乃至36行目に示すように、L1リスト(RefPicListTemp0[rIdx])として、RefPicSetIvCurrAfterが設定された後、RefPicSetIvCurrBeforeが設定される。
従って、例えば、図12に示すように、Iピクチャ、2つのBピクチャ、Pピクチャの視点にそれぞれ、ビューID「0」乃至「3」が順に付与され、符号化順が、Iピクチャ、Pピクチャ、Bピクチャ、Bピクチャの順である場合、例えば、符号化順で後方のBピクチャの参照画像特定情報として、符号化順で前方のBピクチャ、Iピクチャ、PピクチャがVPSに設定されると、動き視差予測・補償部115によるリストの登録方法では、図11に示すように、まず、符号化順で後方のBピクチャのビューID「2」より小さいピクチャを参照画像とする参照画像特定情報が、ビューID「2」から近い順にL0リストに登録される。
即ち、ビューIDが「2」より小さい「0」であるIピクチャと「1」であるBピクチャを参照画像とする参照画像特定情報が、ビューID「1」、「0」の順にリストL0に登録される。その後、ビューIDが「2」より大きい「3」であるPピクチャを参照画像とする参照画像特定情報がリストL0に登録される。
また、図11に示すように、リストL1には、まず、ビューIDが符号化順で後方のBピクチャのビューID「2」より大きい「3」であるPピクチャを参照画像とする参照画像特定情報が登録される。その後、リストL1には、ビューIDが「2」より小さい「0」であるIピクチャと「1」であるBピクチャを参照画像とする参照画像特定情報が、ビューID「2」に近いビューID「1」、「0」の順に登録される。
以上のように、動き視差予測・補償部115によるリストの登録方法では、リストL0とリストL1で、予測対象の画像と異なる視点の参照画像(視点方向の参照ピクチャ)の登録順が異なる。従って、リストに登録可能な参照画像特定情報の数が制限される場合であっても、より多くの異なる参照画像特定情報をリストL0またはリストL1に登録することができ、符号化効率を向上させることができる。
<符号化装置の処理の説明>
図13は、符号化装置の生成処理を説明するフローチャートである。
図13のステップS11において、符号化装置50の設定部51は、SPSを設定する。ステップS12において、設定部51は、PPSを設定する。ステップS13において、設定部51は、ビューIDと順序信頼フラグを含むVPSを設定する。設定部51は、SPS,PPS,VPS等のパラメータセットを符号化部52に供給する。
ステップS14において、符号化部52は、設定部51から供給されるVPSに含まれる順序信頼フラグとビューIDに基づいて、外部から入力される多視点画像を3D符号化方式で符号化する符号化処理を行う。この符号化処理の詳細は、後述する図14を参照して説明する。
ステップS15において、符号化部52は、蓄積バッファ107に蓄積される符号化データに、設定部51から供給されるパラメータセットを付加して符号化ストリームを生成し、伝送する。そして、処理は終了する。
図14は、図13のステップS14の符号化処理の詳細を説明するフローチャートである。
図14のステップS101において、符号化部52のA/D変換部101は、入力された所定の視点の画像をA/D変換し、変換後のデジタルデータである画像を画面並べ替えバッファ102に供給し、記憶させる。
ステップS102において、画面並べ替えバッファ102は、GOPに応じて、記憶した表示の順番のフレームの画像の、符号化のためのフレームの順番への並べ替えを行う。画面並べ替えバッファ102は、フレームの順番を並び替えた画像を、その画像のビューIDおよびPOCとともに、演算部103、イントラ予測部114、および動き視差予測・補償部115にも供給する。
ステップS103において、イントラ予測部114は、デコードピクチャバッファ112から選択部113を介して供給される周辺画像を用いて、基本的にPUを処理単位として予測画像を生成するイントラ予測を行う。イントラ予測部114は、候補となる全てのイントラ予測モードで、このイントラ予測を行う。
また、イントラ予測部114は、候補となる全てのイントラ予測モードのイントラ予測により生成された予測画像と、画面並べ替えバッファ102から供給される入力画像とを用いて各予測画像のコスト関数値を評価し、最適なイントラ予測モードを選択する。そして、イントラ予測部114は、最適なイントラ予測モードで生成された予測画像とコスト関数値を、予測画像選択部116に供給する。
ステップS104において、動き視差予測・補償部115は、図4の設定部51から供給されるVPSに含まれる順序信頼フラグに基づいて、リストL0およびリストL1を登録し、視差スケーリング処理の有無を設定する設定処理を行う。この設定処理の詳細は、後述する図15を参照して説明する。
ステップS105において、動き視差予測・補償部115は、リストL0およびリストL1に基づく参照画像と、画面並べ替えバッファ102から供給される入力画像とを用いて、基本的にPUを処理単位としてインター予測を行う。そして、動き視差予測・補償部115は、インター予測の結果検出された動き視差ベクトルに応じて補償処理を行い、予測画像を生成する。動き視差予測・補償部115は、候補となる全てのインター予測モードで、このようなインター予測と補償処理を行う。
また、動き視差予測・補償部115は、候補となる全てのインター予測モードの予測画像と、画面並べ替えバッファ102から供給される入力画像とを用いて、各予測画像のコスト関数値を評価し、最適なインター予測モードを選択する。そして、動き視差予測・補償部115は、最適なインター予測モードで生成された予測画像とコスト関数値を、予測画像選択部116に供給する。
ステップS106において、予測画像選択部116は、イントラ予測部114と動き視差予測・補償部115から供給されるコスト関数値に基づいて、演算部103と演算部110に供給する予測画像の供給元としてイントラ予測部114を選択するかどうかを判定する。
ステップS106でイントラ予測部114を選択すると判定された場合、予測画像選択部116は、イントラ予測部114から供給される予測画像を演算部103と演算部110に供給し、イントラ予測部114に選択を通知する。そして、ステップS107において、イントラ予測部114は、イントラ予測情報を可逆符号化部106に供給し、処理をステップS109に進める。
一方、ステップS106でイントラ予測部を選択しないと判定された場合、予測画像選択部116は、動き視差予測・補償部115から供給される予測画像を演算部103と演算部110に供給し、動き視差予測・補償部115に選択を通知する。そして、ステップS108において、動き視差予測・補償部115は、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。
具体的には、動き視差予測・補償部115は、視差スケーリング処理が有効である場合、時間スケーリング処理または視差スケーリング処理を行い、予測ベクトルを生成する。一方、動き視差予測・補償部115は、視差スケーリング処理が無効である場合、時間スケーリング処理を行い予測ベクトルを生成するか、または、視差周辺領域画像の視差ベクトルをそのまま予測ベクトルとする。
そして、動き視差予測・補償部115は、予測ベクトルと最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの差分を動き視差ベクトル情報として求める。そして、動き視差予測・補償部115は、動き視差ベクトル情報、最適なインター予測モード等を含むインター予測情報を可逆符号化部106に供給し、処理をステップS109に進める。
ステップS109において、演算部103は、画面並べ替えバッファ102から読み出された画像と、予測画像選択部116を介してイントラ予測部114または動き視差予測・補償部115から供給される予測画像の差分を演算する。演算部103は、その結果得られる差分情報を直交変換部104に出力する。
ステップS110において、直交変換部104は、演算部103から供給される差分情報を直交変換し、その結果得られる変換係数を量子化部105に供給する。
ステップS111において、量子化部105は、直交変換部104から供給される変換係数を量子化し、量子化された変換係数を可逆符号化部106と逆量子化部108に供給する。
ステップS112において、逆量子化部108は、量子化部105から供給される量子化された変換係数を量子化部105による量子化に対応する方法で逆量子化し、得られた変換係数を逆直交変換部109に供給する。
ステップS113において、逆直交変換部109は、逆量子化部108から供給された変換係数を、直交変換部104による直交変換処理に対応する方法で逆直交変換し、その結果得られる局所的に復元された差分情報を、演算部110に供給する。
ステップS114において、演算部110は、逆直交変換部109から供給される局所的に復元された差分情報を、予測画像選択部116を介してイントラ予測部114または動き視差予測・補償部115から供給される予測画像と加算し、再構成画像を得る。その再構成画像は、フィルタ111またはデコードピクチャバッファ112に供給される。
ステップS115において、フィルタ111は、演算部110から供給される再構成画像に対して適宜フィルタ処理を行い、その結果得られる復号画像をデコードピクチャバッファ112に供給する。
ステップS116において、デコードピクチャバッファ112は、演算部110から供給される再構成画像、並びに、その再構成画像のビューIDおよびPOCを記憶する。また、デコードピクチャバッファ112と多視点デコードピクチャバッファ121は、フィルタ111から供給される復号画像、並びに、その復号画像のビューIDおよびPOCを記憶する。
デコードピクチャバッファ112に記憶されている再構成画像並びに再構成画像のビューIDおよびPOCは、イントラ符号化が行われる場合、選択部113を介して読み出され、周辺画像並びに周辺画像のビューIDおよびPOCとしてイントラ予測部114に供給される。また、デコードピクチャバッファ112に記憶されている復号画像並びに復号画像のビューIDおよびPOCは、インター符号化が行われる場合、選択部113を介して読み出され、参照画像並びに参照画像のビューIDおよびPOCとして動き視差予測・補償部115に供給される。
また、多視点デコードピクチャバッファ121に記憶されている復号画像、並びに、その復号画像のビューIDおよびPOCは、必要に応じて、デコードピクチャバッファ112に供給され、記憶される。
ステップS117において、可逆符号化部106は、量子化部105からの量子化された変換係数を可逆符号化し、符号化データを得る。また、可逆符号化部106は、イントラ予測部114からのイントラ予測情報または動き視差予測・補償部115からのインター予測情報、フィルタ111において使用されたフィルタ係数等を可逆符号化し、符号化データのヘッダ情報の一部とする。可逆符号化部106は、符号化データを蓄積バッファ107に供給する。
ステップS118において、蓄積バッファ107は、可逆符号化部106から供給された符号化データを、一時的に蓄積する。そして、処理は、図13のステップS14に戻り、ステップS15に進む。
図15は、図14のステップS104の設定処理の詳細を説明するフローチャートである。
図15のステップS131において、動き視差予測・補償部115は、設定部51から供給されるVPSに含まれる順序信頼フラグが1以下であるかどうかを判定する。ステップS131で順序信頼フラグが1以下であると判定された場合、即ち、ビューIDが端のカメラの視点から順に付与されている場合、処理はステップS132に進む。
ステップS132において、動き視差予測・補償部115は、視差スケーリング処理を有効にする。ステップS133において、動き視差予測・補償部115は、ビューIDを各視点の位置を表す情報として用いて参照画像特定情報をリストに登録するリスト登録処理を行う。このリスト登録処理の詳細は、後述する図16を参照して説明する。ステップS132の処理後、処理は図14のステップS104に戻り、ステップS105に進む。
一方、ステップS131で順序信頼フラグが1以下ではないと判定された場合、即ちビューIDが端のカメラの視点から順に付与されていない場合、処理はステップS134に進む。
ステップS134において、動き視差予測・補償部115は、視差スケーリング処理を無効にする。ステップS135において、動き視差予測・補償部115は、VPSで設定されている順に参照画像特定情報をL0リストとL1リストに登録する。そして、処理は図14のステップS104に戻り、ステップS105に進む。
図16は、図15のステップS133のリスト登録処理の詳細を説明するフローチャートである。
図16のステップS151において、動き視差予測・補償部115は、VPSに含まれる参照特定情報のうちの、予測対象の画像のビューIDより小さいビューIDの画像を参照画像とする参照画像特定情報を、予測対象の画像のビューIDに近い順(ビューIDが大きい順)にRefPicSetIvCurrBeforeに設定する。
ステップS152において、動き視差予測・補償部115は、VPSに含まれる参照特定情報のうちの、予測対象の画像のビューIDより大きいビューIDの画像を参照画像とする参照画像特定情報を、予測対象の画像のビューIDに近い順(ビューIDが小さい順)にRefPicSetIvCurrAfterに設定する。
ステップS153において、動き視差予測・補償部115は、L0リストにRefPicSetIvCurrBefore,RefPicSetIvCurrAfterの順に登録する。ステップS154において、動き視差予測・補償部115は、L1リストにRefPicSetIvCurrAfter,RefPicSetIvCurrBeforeの順に登録する。そして、処理は、図15のステップS133に戻り、図14のステップS104に戻り、ステップS105に進む。
以上のように、符号化装置50は、順序信頼フラグに基づいて多視点画像を符号化するので、ビューIDが端のカメラの視点から順に付されている場合にのみ、リスト登録処理や視差スケーリング処理を行うことができる。その結果、リストL0とリストL1で、予測対象の画像と異なる視点の参照画像(視点方向の参照ピクチャ)の登録順を異ならせることができる。また、正確に視差スケーリング処理を行うことができる。従って、符号化効率を向上させることができる。
また、ビューIDが端のカメラの視点から順に付されていない場合に、リスト登録処理や視差スケーリング処理が行われることにより、符号化効率が悪化することを防止することができる。
(復号装置の第1実施の形態の構成例)
図17は、図4の符号化装置50から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第1実施の形態の構成例を示すブロック図である。
図17の復号装置200は、抽出部201と復号部202により構成される。復号装置200は、符号化装置50から伝送される符号化ストリームを符号化装置50の符号化方法に対応する復号方法で復号し、多視点画像を生成する。
具体的には、復号装置200の抽出部201は、受け取り部として機能し、符号化装置50から伝送されてくる符号化ストリームを受け取る。抽出部201は、符号化ストリームから、SPS,PPS,VPS等のパラメータセットと符号化データを抽出し、復号部202に供給する。
復号部202は、抽出部201から供給されるVPSに含まれる順序信頼フラグとビューIDに基づいて、抽出部201から供給される符号化データを復号し、多視点画像を生成する。このとき、復号部202は、必要に応じて、SPS,PPS等も参照する。復号部202は、多視点画像を出力する。
(復号部の構成例)
図18は、図17の復号部202の構成例を示すブロック図である。
図18の復号部202は、蓄積バッファ301、可逆復号部302、逆量子化部303、逆直交変換部304、演算部305、ループフィルタ306、画面並べ替えバッファ307、およびD/A変換部308を有する。また、復号部202は、デコードピクチャバッファ309、選択部310、イントラ予測部311、動き視差補償部312、および選択部313を有する。
さらに、復号部202は、多視点デコードピクチャバッファ321を有する。復号部202は、図17の抽出部201から供給される多視点画像の符号化データを視点ごとに順に復号する。
蓄積バッファ301は、抽出部201から供給される所定の視点の符号化データを蓄積し、所定のタイミングにおいてその符号化データを可逆復号部302に供給する。可逆復号部302は、蓄積バッファ301より供給された符号化データを、図7の可逆符号化部106の符号化方式に対応する方式で可逆復号する。可逆復号部302は、可逆復号して得られた量子化された変換係数を、その変換係数に対応する画像のビューIDおよびPOCとともに逆量子化部303に供給する。
また、可逆復号部302は、符号化データを復号することにより、イントラ予測情報が得られた場合、そのイントラ予測情報をイントラ予測部311に供給し、インター予測情報が得られた場合、そのインター予測情報を動き視差補償部312に供給する。
逆量子化部303は、可逆復号部302から供給される量子化された変換係数を、図7の量子化部105の量子化方式に対応する方式で逆量子化し、得られた変換係数を逆直交変換部304に供給する。逆直交変換部304は、図7の直交変換部104の直交変換方式に対応する方式で逆量子化部303から供給される変換係数を逆直交変換し、差分情報を得る。
逆直交変換されて得られた差分情報は、演算部305に供給される。また、演算部305には、選択部313を介して、イントラ予測部311または動き視差補償部312から予測画像が供給される。
演算部305は、復号部として機能し、差分情報と予測画像とを加算することにより復号を行い、再構成画像を得る。演算部305は、その再構成画像をループフィルタ306またはデコードピクチャバッファ309に供給する。
ループフィルタ306は、演算部305から供給された再構成画像に対して、図7のフィルタ111と同様に、フィルタ処理を適宜施して復号画像を生成する。なお、ループフィルタ306は、可逆復号部302による可逆復号でフィルタ係数が得られる場合、そのフィルタ係数を用いてフィルタ処理を行う。
ループフィルタ306は、フィルタ処理結果である復号画像を画面並べ替えバッファ307およびデコードピクチャバッファ309に供給する。
画面並べ替えバッファ307は、ループフィルタ306から供給される復号画像の並べ替えを行う。すなわち、図7の画面並べ替えバッファ102により符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。D/A変換部308は、画面並べ替えバッファ307から供給された多視点の復号画像をD/A変換する。D/A変換部308は、その結果得られる多視点画像を図示せぬディスプレイに出力し、表示させる。
デコードピクチャバッファ309は、演算部305から供給される再構成画像並びに再構成画像のビューIDおよびPOCを記憶する。また、デコードピクチャバッファ309は、ループフィルタ306から供給される復号画像並びに復号画像のビューIDおよびPOCを記憶する。
また、デコードピクチャバッファ309は、所定のタイミングにおいて、若しくは、イントラ予測部311や動き視差補償部312等の外部の要求に基づいて、記憶している再構成画像、並びに、その再構成画像のビューIDおよびPOCを、選択部310を介してイントラ予測部311に供給する。また、デコードピクチャバッファ309は、所定のタイミングにおいて、若しくは、動き視差予測・補償部115等の外部からの要求に基づいて、記憶している復号画像、並びに、その復号画像のビューIDおよびPOCを、選択部310を介して動き視差補償部312に供給する。
イントラ予測部311は、図7のイントラ予測部114と基本的に同様の処理を行う。ただし、イントラ予測部311は、符号化の際にイントラ予測により予測画像が生成された領域に対してのみ、可逆復号部302から供給されるイントラ予測情報の最適なイントラ予測モードのイントラ予測を行う。イントラ予測部311は、イントラ予測の結果得られる予測画像を選択部313に供給する。
動き視差補償部312は、設定部として機能し、図17の抽出部201から供給されるVPSに含まれる順序信頼フラグに基づいて、図7の動き視差予測・補償部115と同様に、VPSに含まれる参照画像特定情報をリスト(参照リスト)に登録する。そして、動き視差補償部312は、リストに登録されている参照画像特定情報により特定される画像を、リストに登録されている順にデコードピクチャバッファ309から参照画像として読み出す。
また、動き視差補償部312は、動き視差予測・補償部115と同様に、順序信頼フラグに基づいて、可逆復号部302から供給されるインター予測情報の最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。そして、動き視差補償部312は、生成された予測ベクトルと可逆復号部302から供給されるインター予測情報の動き視差ベクトル情報とを加算し、動き視差ベクトルを生成する。
動き視差補償部312は、生成された動き視差ベクトルと参照画像とに基づいて、基本的にPUを処理単位として、最適なインター予測モードの補償処理を行い、予測画像を生成する。なお、動き視差補償部312は、可逆復号部302から供給されるインター予測情報に基づいて、符号化の際にインター予測が行われた領域に対してのみ、補償処理を行う。動き視差補償部312は、生成した予測画像を、選択部313を介して演算部305に供給する。
選択部313は、イントラ予測部311から供給される予測画像、または、動き視差補償部312から供給される予測画像を演算部305に供給する。
デコードピクチャバッファ309は、処理対象の視点の復号画像および再構成画像、並びに、復号画像および再構成画像のビューIDとPOCを記憶するが、多視点デコードピクチャバッファ321は、各視点の復号画像、並びに、復号画像のビューIDとPOCを記憶する。つまり、多視点デコードピクチャバッファ321は、デコードピクチャバッファ309に供給された復号画像、並びに、復号画像のビューIDおよびPOCを取得し、デコードピクチャバッファ309とともに記憶する。
デコードピクチャバッファ309は、処理対象の視点が変わると、前の処理対象の視点の復号画像を消去するが、多視点デコードピクチャバッファ321は、そのまま保持する。そして、デコードピクチャバッファ309などの要求に従って、記憶している復号画像、並びに、復号画像のビューIDおよびPOCを、「処理対象ではない視点の復号画像、並びに、復号画像のビューIDおよびPOC」として、デコードピクチャバッファ309に供給する。デコードピクチャバッファ309は、多視点デコードピクチャバッファ321から読み出した「処理対象ではない視点の復号画像、並びに、復号画像のビューIDおよびPOC」を、選択部310を介して動き視差補償部312に供給する。
(復号装置の処理の説明)
図19は、図17の復号装置200の画像生成処理を説明するフローチャートである。
図19のステップS170において、復号装置200の抽出部201は、符号化装置50から伝送されてくる符号化ストリームを受け取る。ステップS171において、抽出部201は、符号化ストリームからSPSを抽出し、復号部202に供給する。ステップS172において、抽出部201は、符号化ストリームからPPSを抽出し、復号部202に供給する。ステップS173において、抽出部201は、符号化ストリームからビューIDと順序信頼フラグを含むVPSを抽出し、復号部202に供給する。
ステップS174において、抽出部201は、符号化ストリームから符号化データを抽出し、復号部202に供給する。ステップS175において、復号部202は、抽出部201から供給されるVPSに含まれる順序信頼フラグとビューIDに基づいて、抽出部201から供給される符号化データを復号する復号処理を行い、処理は終了する。
図20は、図19のステップS175の復号処理の詳細を説明するフローチャートである。
図20のステップS300において、動き視差補償部312は、図15の設定処理と同様の設定処理を行う。ステップS301において、蓄積バッファ301は、図17の抽出部201から供給される所定の視点の符号化データを蓄積し、所定のタイミングにおいてその符号化データを可逆復号部302に供給する。
ステップS302において、可逆復号部302は、蓄積バッファ301より供給された符号化データを、図7の可逆符号化部106の符号化方式に対応する方式で可逆復号する。可逆復号部302は、可逆復号して得られた量子化された変換係数を、その変換係数に対応する画像のビューIDおよびPOCとともに逆量子化部303に供給する。
また、可逆復号部302は、符号化データを復号することにより、イントラ予測情報が得られた場合、そのイントラ予測情報をイントラ予測部311に供給し、インター予測情報が得られた場合、そのインター予測情報を動き視差補償部312に供給する。
ステップS303において、逆量子化部303は、可逆復号部302から供給される量子化された変換係数を、図7の量子化部105の量子化方式に対応する方式で逆量子化し、得られた変換係数を逆直交変換部304に供給する。ステップS304において、逆直交変換部304は、図7の直交変換部104の直交変換方式に対応する方式で逆量子化部303から供給される変換係数を逆直交変換し、差分情報を得る。逆直交変換されて得られた差分情報は、演算部305に供給される。
ステップS305において、イントラ予測部311は、可逆復号部302からイントラ予測情報が供給されたかどうかを判定する。ステップS305でイントラ予測情報が供給されたと判定された場合、ステップS306において、イントラ予測部311は、図7のイントラ予測部114と基本的に同様のイントラ予測を行う。イントラ予測部311は、イントラ予測の結果得られる予測画像を選択部313に供給し、処理をステップS309に進める。
一方、ステップS305でイントラ予測情報が供給されていないと判定された場合、即ち動き視差補償部312がインター予測情報を取得した場合、処理はステップS307に進む。ステップS307において、動き視差補償部312は、可逆復号部302から供給されるインター予測モード情報の最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルを生成する。
ステップS308において、動き視差補償部312は、生成された動き視差ベクトルと参照画像とに基づいて、基本的にPUを処理単位として、最適なインター予測モードの補償処理を行い、予測画像を生成する。動き視差補償部312は、生成した予測画像を、選択部313を介して演算部305に供給する。
ステップS309において、演算部305は、逆直交変換部304から供給される差分情報と、選択部313から供給される予測画像とを加算し、再構成画像を得る。演算部305は、その再構成画像をループフィルタ306またはデコードピクチャバッファ309に供給する。
ステップS310において、ループフィルタ306は、演算部305から供給された再構成画像に対して、図7のフィルタ111と同様に、フィルタ処理を適宜施して復号画像を生成する。なお、ループフィルタ306は、可逆復号部302による可逆復号でフィルタ係数が得られる場合、そのフィルタ係数を用いてフィルタ処理を行う。ループフィルタ306は、フィルタ処理結果である復号画像を画面並べ替えバッファ307およびデコードピクチャバッファ309に供給する。
ステップS311において、画面並べ替えバッファ307は、ループフィルタ306から供給される復号画像の並べ替えを行う。ステップS312において、D/A変換部308は、画面並べ替えバッファ307から供給された多視点の復号画像をD/A変換し、その結果得られる多視点画像を図示せぬディスプレイに出力して、表示させる。
ステップS313において、デコードピクチャバッファ309は、演算部305から供給される再構成画像、並びに、その再構成画像のビューIDおよびPOCを記憶する。また、デコードピクチャバッファ309と多視点デコードピクチャバッファ321は、ループフィルタ306から供給される復号画像、並びに、その復号画像のビューIDおよびPOCを記憶する。さらに、デコードピクチャバッファ309は、多視点デコードピクチャバッファ321に記憶されている復号画像、並びに、その復号画像のビューIDおよびPOCを、「処理対象ではない視点の復号画像、並びに、その復号画像のビューIDおよびPOC」として読み出し、記憶する。
デコードピクチャバッファ309に記憶されている再構成画像、並びに、その再構成画像のビューIDおよびPOCは、選択部310を介してイントラ予測部311に供給される。また、デコードピクチャバッファ309に記憶されている復号画像、並びに、その復号画像のビューIDおよびPOCは、選択部310を介して動き視差補償部312に供給される。そして、処理は、図19のステップS175に戻り、処理は終了する。
以上のように、復号装置200は、順序信頼フラグを受け取り、順序信頼フラグに基づいて多視点画像を復号するので、符号化装置50から伝送されてくる符号化ストリームを復号することができる。
<第2実施の形態>
(符号化装置の第2実施の形態の構成例)
図21は、本技術を適用した符号化装置の第2実施の形態の構成例を示すブロック図である。
図21の符号化装置400は、設定部401と符号化部402により構成される。符号化装置400は、順序信頼フラグの代わりに、図16のリスト登録処理を行うことを識別するリストフラグと視差スケーリング処理を行うことを識別するスケーリングフラグをVPSに含めて伝送する。
具体的には、符号化装置400の設定部401は、図4の設定部51と同様に、SPS,PPS等を設定する。また、設定部401は、設定部51と同様に、1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順にビューIDを付与する。さらに、設定部401は、ビューIDが1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順に付与され、かつ、リスト登録処理を行うことを識別するリストフラグ(順序信頼情報)を生成する。
また、設定部401は、ビューIDが1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順に付与され、かつ、視差スケーリング処理を行うことを識別するスケーリングフラグ(順序信頼情報)を生成する。そして、設定部401は、ビューID、リストフラグ、およびスケーリングフラグを含むVPSを設定する。設定部401は、SPS,PPS,VPS等のパラメータセットを符号化部402に供給する。
符号化部402は、設定部401から供給されるVPSに含まれるリストフラグ、スケーリングフラグ、およびビューIDに基づいて、外部から入力される多視点画像を3D符号化方式で符号化し、符号化データを生成する。符号化部402は、符号化データに、設定部401から供給されるパラメータセットを付加して符号化ストリームを生成する。符号化部402は、生成された符号化ストリームを伝送する。
(VPSのシンタックスの構成例)
図22は、図21の設定部401により設定されるVPSのシンタックスの例を示す図である。
図22の10行目に示すように、VPSには、図1の場合と同様に、ビューID(view_id)が含まれる。また、11行目に示すように、VPSには、リストフラグ(inter_view_default_reference_flag)が含まれる。リストフラグは、リスト登録処理を行うことを表す場合1であり、行わないことを表す場合0である。
さらに、12行目に示すように、VPSには、スケーリングフラグ(inter_view_scaling_flag)が含まれる。スケーリングフラグは、視差スケーリング処理を行うことを表す場合1であり、行わないことを表す場合0である。
また、13行目乃至16行目に示すように、VPSには、図1の場合と同様に、参照画像の数(num_direct_ref_layers)と参照画像特定情報(ref_layer_id)が含まれる。
(符号化部の構成例)
図23は、図21の符号化部402の構成例を示すブロック図である。
図23に示す構成のうち、図7の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図23の符号化部402の構成は、動き視差予測・補償部115の代わりに動き視差予測・補償部411が設けられる点が図4の符号化部52の構成と異なる。
符号化部402の動き視差予測・補償部411は、図21の設定部401から供給されるVPSに含まれるリストフラグに基づいて、VPSに含まれる参照画像特定情報をリストに登録する。
動き視差予測・補償部411は、図7の動き視差予測・補償部115と同様に、リストに登録されている参照画像特定情報により特定される画像を、リストに登録されている順にデコードピクチャバッファ112から参照画像として読み出す。動き視差予測・補償部411は、動き視差予測・補償部115と同様に、画面並べ替えバッファ102から供給される入力画像と参照画像とを用いてインター予測を行い、その結果検出された動き視差ベクトルに応じて補償処理を行い、予測画像を生成する。動き視差予測・補償部411は、候補となる全てのインター予測モードで、このようなインター予測と補償処理を行う。
動き視差予測・補償部411は、動き視差予測・補償部115と同様に、各予測画像のコスト関数値を評価し、最適なインター予測モードを選択する。そして、動き視差予測・補償部411は、動き視差予測・補償部115と同様に、最適なインター予測モードで生成された予測画像とコスト関数値を、予測画像選択部116に供給する。
また、動き視差予測・補償部411は、予測画像選択部116から選択が通知された場合、スケーリングフラグに基づいて、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。そして、動き視差予測・補償部411は、生成された予測ベクトルと、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの差分を演算し、動き視差ベクトル情報とする。動き視差予測・補償部411は、動き視差ベクトル情報、最適なインター予測モード等を含むインター予測情報を可逆符号化部106に供給し、可逆符号化させる。
(符号化装置の処理の説明)
図24は、図21の符号化装置400の生成処理を説明するフローチャートである。
図24のステップS331およびS332の処理は、図13のステップS11およびS12の処理と同様であるので、説明は省略する。
ステップS332の処理後、ステップS333において、設定部401は、ビューID、スケーリングフラグ、およびリストフラグを含むVPSを設定する。設定部401は、SPS,PPS,VPS等のパラメータセットを符号化部402に供給する。
ステップS334において、符号化部402は、設定部401から供給されるVPSに含まれるビューID、スケーリングフラグ、およびリストフラグに基づいて、外部から入力される多視点画像を3D符号化方式で符号化する符号化処理を行う。この符号化処理の詳細は、図14のステップS104の設定処理を除いて図14の符号化処理と同様である。従って、設定処理の詳細についてのみ、後述する図25を参照して説明する。
ステップS335において、符号化部402は、蓄積バッファ107に蓄積される符号化データに、設定部401から供給されるパラメータセットを付加して符号化ストリームを生成し、伝送する。そして、処理は終了する。
図25は、図24のステップS334の符号化処理における設定処理の詳細を説明するフローチャートである。
図25のステップS351において、動き視差予測・補償部411は、設定部401から供給されるVPSに含まれるスケーリングフラグが1であるかどうかを判定する。ステップS351でスケーリングフラグが1であると判定された場合、ステップS352において、動き視差予測・補償部411は、視差スケーリング処理を有効にし、処理をステップS354に進める。
一方、ステップS351でスケーリングフラグが1ではないと判定された場合、ステップS353において、動き視差予測・補償部411は、視差スケーリング処理を無効にし、処理をステップS354に進める。
ステップS354において、動き視差予測・補償部411は、設定部401から供給されるVPSに含まれるリストフラグが1であるかどうかを判定する。ステップS354でリストフラグが1であると判定された場合、ステップS355において、動き視差予測・補償部411は、図16のリスト登録処理を行う。そして、設定処理は終了する。
一方、ステップS354でリストフラグが1ではないと判定された場合、ステップS356において、動き視差予測・補償部411は、VPSで設定されている順に参照画像特定情報をL0リストとL1リストに登録する。そして、設定処理は終了する。
以上のように、符号化装置400は、リストフラグとスケーリングフラグに基づいて多視点画像を符号化するので、ビューIDが端のカメラの視点から順に付される場合にのみ、リスト登録処理や視差スケーリング処理を行うことができる。その結果、リストL0とリストL1で、予測対象の画像と異なる視点の参照画像(視点方向の参照ピクチャ)の登録順を異ならせることができる。また、正確に視差スケーリング処理を行うことができる。従って、符号化効率を向上させることができる。
また、ビューIDが端のカメラの視点から順に付されていない場合に、リスト登録処理や視差スケーリング処理が行われることにより、符号化効率が悪化することを防止することができる。
(復号装置の第2実施の形態の構成例)
図26は、図21の符号化装置400から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第2実施の形態の構成例を示すブロック図である。
図26に示す構成のうち、図17の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図26の復号装置500の構成は、復号部202の代わりに復号部501が設けられる点が図17の復号装置200の構成と異なる。復号装置500は、符号化装置400から伝送される符号化ストリームを符号化装置400の符号化方法に対応する復号方法で復号し、多視点画像を生成する。
具体的には、復号装置500の復号部501は、抽出部201から供給されるVPSに含まれるリストフラグ、スケーリングフラグ、およびビューIDに基づいて、抽出部201から供給される符号化データを復号し、多視点画像を生成する。このとき、復号部501は、必要に応じて、SPS,PPS等も参照する。復号部501は、多視点画像を出力する。
(復号部の構成例)
図27は、図26の復号部501の構成例を示すブロック図である。
図27に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図27の復号部501の構成は、動き視差補償部312の代わりに動き視差補償部511が設けられる点が図18の復号部202の構成と異なる。
動き視差補償部511は、図26の抽出部201から供給されるVPSに含まれるリストフラグに基づいて、図23の動き視差予測・補償部411と同様に、VPSに含まれる参照画像特定情報をリストに登録する。そして、動き視差補償部511は、リストに登録されている参照画像特定情報により特定される画像を、リストに登録されている順にデコードピクチャバッファ309から参照画像として読み出す。
また、動き視差補償部511は、動き視差予測・補償部411と同様に、スケーリングフラグに基づいて、可逆復号部302から供給されるインター予測情報の最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。そして、動き視差補償部511は、生成された予測ベクトルと可逆復号部302から供給されるインター予測情報の動き視差ベクトル情報とを加算し、動き視差ベクトルを生成する。
動き視差補償部511は、生成された動き視差ベクトルと参照画像とに基づいて、基本的にPUを処理単位として、最適なインター予測モードの補償処理を行い、予測画像を生成する。なお、動き視差補償部511は、可逆復号部302から供給されるインター予測情報に基づいて、符号化の際にインター予測が行われた領域に対してのみ、動き視差補償を行う。動き視差補償部511は、生成した予測画像を、選択部313を介して演算部305に供給する。
(復号装置の処理の説明)
図28は、図26の復号装置500の画像生成処理を説明するフローチャートである。
図28のステップS370乃至S372の処理は、図19のステップS170乃至S172の処理と同様であるので、説明は省略する。ステップS373において、抽出部201は、符号化ストリームからビューID、リストフラグ、およびスケーリングフラグを含むVPSを抽出し、復号部501に供給する。
ステップS374において、抽出部201は、符号化ストリームから符号化データを抽出し、復号部501に供給する。ステップS375において、復号部501は、抽出部201から供給されるVPSに含まれるビューID、リストフラグ、およびスケーリングフラグに基づいて、抽出部201から供給される符号化データを復号する復号処理を行う。この復号処理の詳細は、図20のステップS300の設定処理が図25の設定処理と同様の設定処理に代わる点を除いて図20の復号処理と同様である。ステップS375の処理後、処理は終了する。
以上のように、復号装置500は、リストフラグとスケーリングフラグを受け取り、リストフラグとスケーリングフラグに基づいて多視点画像を復号するので、符号化装置400から伝送されてくる符号化ストリームを復号することができる。
<第3実施の形態>
(符号化装置の第3実施の形態の構成例)
図29は、本技術を適用した符号化装置の第3実施の形態の構成例を示すブロック図である。
図29の符号化装置600は、設定部601と符号化部602により構成される。符号化装置600は、スケーリングフラグの代わりに視差スケーリング処理における係数tbと係数tdを表す係数情報をVPSに含めて伝送する。
具体的には、符号化装置600の設定部601は、図4の設定部51と同様に、SPS,PPS等を設定する。また、設定部601は、設定部51と同様に、1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順にビューIDを付与する。さらに、設定部601は、リストフラグと係数情報を生成する。
なお、ビューIDが1次元配列で並ぶ複数のカメラのうちの端のカメラの視点から順に付与されている場合、図8で説明したように係数情報が生成されるが、順に付与されていない場合、係数情報として所定値が生成される。
設定部601は、ビューID、リストフラグ、および係数情報を含むVPSを設定する。設定部601は、SPS,PPS,VPS等のパラメータセットを符号化部602に供給する。
符号化部602は、設定部601から供給されるVPSに含まれるリストフラグ、係数情報、およびビューIDに基づいて、外部から入力される多視点画像を3D符号化方式で符号化し、符号化データを生成する。符号化部602は、符号化データに、設定部601から供給されるパラメータセットを付加して符号化ストリームを生成する。符号化部602は、生成された符号化ストリームを伝送する。
(VPSのシンタックスの構成例)
図30は、図29の設定部601により設定されるVPSのシンタックスの例を示す図である。
図30の10行目に示すように、VPSには、図1の場合と同様に、ビューID(view_id)が含まれる。また、11行目に示すように、VPSには、図22の場合と同様に、リストフラグ(inter_view_default_reference_flag)が含まれる。
また、12行目乃至16行目に示すように、VPSには、参照画像の数(num_direct_ref_layers)、参照画像特定情報(ref_layer_id)、および係数情報(inter_view_scaling_factor)が含まれる。
(符号化部の構成例)
図31は、図29の符号化部602の構成例を示すブロック図である。
図31に示す構成のうち、図23の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図31の符号化部602の構成は、動き視差予測・補償部411の代わりに動き視差予測・補償部611が設けられる点が図23の符号化部402の構成と異なる。
符号化部602の動き視差予測・補償部611は、動き視差予測・補償部411と同様に、図29の設定部601から供給されるVPSに含まれるリストフラグに基づいて参照画像特定情報をリストに登録する。
動き視差予測・補償部611は、動き視差予測・補償部411と同様に、リストに登録されている参照画像特定情報により特定される画像を、リストに登録されている順にデコードピクチャバッファ112から参照画像として読み出す。動き視差予測・補償部611は、動き視差予測・補償部411と同様に、画面並べ替えバッファ102から供給される入力画像と参照画像とを用いてインター予測を行い、その結果検出された動き視差ベクトルに応じて補償処理を行い、予測画像を生成する。動き視差予測・補償部611は、候補となる全てのインター予測モードで、このようなインター予測と補償処理を行う。
動き視差予測・補償部611は、動き視差予測・補償部411と同様に、各予測画像のコスト関数値を評価し、最適なインター予測モードを選択する。そして、動き視差予測・補償部611は、動き視差予測・補償部411と同様に、最適なインター予測モードで生成された予測画像とコスト関数値を、予測画像選択部116に供給する。
また、動き視差予測・補償部611は、予測画像選択部116から選択が通知された場合、係数情報を用いて、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。具体的には、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルが動きベクトルである場合、動き視差予測・補償部611は、時間スケーリング処理を行う。一方、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルが動きベクトルである場合、動き視差予測・補償部611は、係数情報を用いて視差スケーリング処理を行う。
そして、動き視差予測・補償部611は、生成された予測ベクトルと、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの差分を演算し、動き視差ベクトル情報とする。動き視差予測・補償部611は、動き視差ベクトル情報、最適なインター予測モード等を含むインター予測情報を可逆符号化部106に供給し、符号化させる。
(符号化装置の処理の説明)
図32は、図29の符号化装置600の生成処理を説明するフローチャートである。
図32のステップS401およびS402の処理は、図24のステップS331およびS332の処理と同様であるので、説明は省略する。
ステップS402の処理後、ステップS403において、設定部601は、ビューID、係数情報、およびリストフラグを含むVPSを設定する。設定部601は、SPS,PPS,VPS等のパラメータセットを符号化部602に供給する。
ステップS404において、符号化部602は、設定部601から供給されるVPSに含まれるビューID、係数情報、およびリストフラグに基づいて、外部から入力される多視点画像を3D符号化方式で符号化する符号化処理を行う。この符号化処理の詳細は、後述する図33を参照して説明する。
ステップS405において、符号化部602は、蓄積バッファ107に蓄積される符号化データに、設定部601から供給されるパラメータセットを付加して符号化ストリームを生成し、伝送する。そして、処理は終了する。
図33は、図32のステップS404の符号化処理の詳細を説明するフローチャートである。
図33のステップS421乃至S423の処理は、図14のステップS101乃至S103の処理と同様であるので、説明は省略する。
ステップS424において、動き視差予測・補償部611は、図29の設定部601から供給されるVPSに含まれるリストフラグに基づいてリストL0およびリストL1を登録する登録処理を行う。この登録処理の詳細は、後述する図34を参照して説明する。
ステップS425乃至S427の処理は、図14のステップS105乃至S107の処理と同様であるので、説明は省略する。
ステップS426でイントラ予測部を選択しないと判定された場合、予測画像選択部116は、動き視差予測・補償部611から供給される予測画像を演算部103と演算部110に供給し、動き視差予測・補償部611に選択を通知する。そして、ステップS428において、動き視差予測・補償部611は、設定部601から供給されるVPSに含まれる係数情報を用いて、最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。
そして、動き視差予測・補償部611は、予測ベクトルと最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの差分を動き視差ベクトル情報として求める。そして、動き視差予測・補償部611は、動き視差ベクトル情報、最適なインター予測モード等を含むインター予測情報を可逆符号化部106に供給し、処理をステップS429に進める。
ステップS429乃至S438の処理は、図14のステップS109乃至S118の処理と同様である。
図34は、図33のステップS424の登録処理の詳細を説明するフローチャートである。
図34のステップS451乃至S453の処理は、図25のステップS354乃至S356の処理と同様であるので、説明は省略する。
以上のように、符号化装置600は、係数情報を用いて多視点画像を符号化するので、ビューIDが端のカメラの視点から順に付されているかどうかによらず、正確に視差スケーリング処理を行うことができる。従って、符号化効率を向上させることができる。
(復号装置の第3実施の形態の構成例)
図35は、図29の符号化装置600から伝送される符号化ストリームを復号する、本技術を適用した復号装置の第3実施の形態の構成例を示すブロック図である。
図35に示す構成のうち、図26の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図35の復号装置700の構成は、復号部501の代わりに復号部701が設けられる点が図26の復号装置500の構成と異なる。復号装置700は、符号化装置600から伝送される符号化ストリームを符号化装置600の符号化方法に対応する復号方法で復号し、多視点画像を生成する。
具体的には、復号装置700の復号部701は、抽出部201から供給されるVPSに含まれるリストフラグ、係数情報、およびビューIDに基づいて、抽出部201から供給される符号化データを復号し、多視点画像を生成する。このとき、復号部701は、必要に応じて、SPS,PPS等も参照する。復号部701は、多視点画像を出力する。
(復号部の構成例)
図36は、図35の復号部701の構成例を示すブロック図である。
図36に示す構成のうち、図27の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図36の復号部701の構成は、動き視差補償部511の代わりに動き視差補償部711が設けられる点が図27の復号部501の構成と異なる。
動き視差補償部711は、図35の抽出部201から供給されるVPSに含まれるリストフラグに基づいて、図31の動き視差予測・補償部611と同様に、VPSに含まれる参照画像特定情報をリストに登録する。そして、動き視差補償部711は、リストに登録されている参照画像特定情報により特定される画像を、リストに登録されている順にデコードピクチャバッファ309から参照画像として読み出す。
また、動き視差補償部711は、動き視差予測・補償部611と同様に、係数情報を用いて、可逆復号部302から供給されるインター予測情報の最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルの予測ベクトルを生成する。そして、動き視差補償部711は、生成された予測ベクトルと可逆復号部302から供給されるインター予測情報の動き視差ベクトル情報とを加算し、動き視差ベクトルを生成する。
動き視差補償部711は、生成された動き視差ベクトルと参照画像とに基づいて、基本的にPUを処理単位として、最適なインター予測モードの補償処理を行い、予測画像を生成する。なお、動き視差補償部711は、可逆復号部302から供給されるインター予測情報に基づいて、符号化の際にインター予測が行われた領域に対してのみ、動き視差補償を行う。動き視差補償部711は、生成した予測画像を、選択部313を介して演算部305に供給する。
(復号装置の処理の説明)
図37は、図35の復号装置700の画像生成処理を説明するフローチャートである。
図37のステップS470乃至S472の処理は、図28のステップS370乃至S372の処理と同様であるので、説明は省略する。ステップS473において、抽出部201は、符号化ストリームからビューID、リストフラグ、および係数情報を含むVPSを抽出し、復号部701に供給する。
ステップS474において、抽出部201は、符号化ストリームから符号化データを抽出し、復号部701に供給する。ステップS475において、復号部701は、抽出部201から供給されるVPSに含まれるリストフラグ、係数情報、およびビューIDに基づいて、抽出部201から供給される符号化データを復号する復号処理を行う。この復号処理の詳細は、後述する図38を参照して説明する。ステップS475の処理後、処理は終了する。
図38は、図37のステップS475の復号処理の詳細を説明するフローチャートである。
図38のステップS490において、動き視差補償部711は、図34の登録処理と同様の登録処理を行う。ステップS491乃至S496の処理は、図20のステップS301乃至S306の処理と同様であるので、説明は省略する。
ステップS495でイントラ予測情報が供給されていないと判定された場合、処理はステップS497に進む。ステップS497において、動き視差補償部711は、図35の抽出部201から供給されるVPSに含まれる係数情報を用いて、可逆復号部302から供給される最適なインター予測モードで生成された予測画像に対応する動き視差ベクトルを生成する。そして、処理はステップS498に進む。
ステップS498乃至S503の処理は、図20のステップS308乃至S313の処理と同様であるので、説明は省略する。
以上のように、復号装置700は、リストフラグと係数情報を受け取り、リストフラグと係数情報に基づいて多視点画像を復号するので、符号化装置600から伝送されてくる符号化ストリームを復号することができる。
なお、第3実施の形態では、ビューIDが端のカメラの視点から順に付されていない場合にも係数情報が生成されたが、係数情報は生成されず、視差スケーリング処理が行われないようにしてもよい。
また、第3実施の形態では、リストフラグが符号化ストリームに含められるようにしたが、リストフラグの代わりに順序信頼フラグが符号化ストリームに含められるようにしてもよい。この場合、順序信頼フラグに基づいてリスト登録処理が行われる。
<第4実施の形態>
(本技術を適用したコンピュータの説明)
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図39は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)801,ROM(Read Only Memory)802,RAM(Random Access Memory)803は、バス804により相互に接続されている。
バス804には、さらに、入出力インタフェース805が接続されている。入出力インタフェース805には、入力部806、出力部807、記憶部808、通信部809、及びドライブ810が接続されている。
入力部806は、キーボード、マウス、マイクロホンなどよりなる。出力部807は、ディスプレイ、スピーカなどよりなる。記憶部808は、ハードディスクや不揮発性のメモリなどよりなる。通信部809は、ネットワークインタフェースなどよりなる。ドライブ810は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア811を駆動する。
以上のように構成されるコンピュータでは、CPU801が、例えば、記憶部808に記憶されているプログラムを、入出力インタフェース805及びバス804を介して、RAM803にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU801)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア811に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア811をドライブ810に装着することにより、入出力インタフェース805を介して、記憶部808にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部809で受信し、記憶部808にインストールすることができる。その他、プログラムは、ROM802や記憶部808に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
<第5実施の形態>
(テレビジョン装置の構成例)
図40は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース部909を有している。さらに、テレビジョン装置900は、制御部910、ユーザインタフェース部911等を有している。
チューナ902は、アンテナ901で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ903に出力する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ904に出力する。また、デマルチプレクサ903は、EPG(Electronic Program Guide)等のデータのパケットを制御部910に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。
デコーダ904は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部905、音声データを音声信号処理部907に出力する。
映像信号処理部905は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部905は、表示部906に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部905は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部905は、このようにして生成した映像データに基づいて駆動信号を生成して表示部906を駆動する。
表示部906は、映像信号処理部905からの駆動信号に基づき表示デバイス(例えば液晶表示素子等)を駆動して、番組の映像などを表示させる。
音声信号処理部907は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのD/A変換処理や増幅処理を行いスピーカ908に供給することで音声出力を行う。
外部インタフェース部909は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。
制御部910にはユーザインタフェース部911が接続されている。ユーザインタフェース部911は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部910に供給する。
制御部910は、CPU(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ、EPGデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置900の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、テレビジョン装置900がユーザ操作に応じた動作となるように各部を制御する。
なお、テレビジョン装置900では、チューナ902、デマルチプレクサ903、映像信号処理部905、音声信号処理部907、外部インタフェース部909等と制御部910を接続するためバス912が設けられている。
このように構成されたテレビジョン装置では、デコーダ904に本願の復号装置(復号方法)の機能が設けられる。このため、複数の視点の画像の符号化効率を向上させた符号化ストリームを復号することができる。
<第6実施の形態>
(携帯電話機の構成例)
図41は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機920は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931を有している。これらは、バス933を介して互いに接続されている。
また、通信部922にはアンテナ921が接続されており、音声コーデック923には、スピーカ924とマイクロホン925が接続されている。さらに制御部931には、操作部932が接続されている。
携帯電話機920は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
音声通話モードにおいて、マイクロホン925で生成された音声信号は、音声コーデック923で音声データへの変換やデータ圧縮が行われて通信部922に供給される。通信部922は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部922は、送信信号をアンテナ921に供給して図示しない基地局へ送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック923に供給する。音声コーデック923は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ924に出力する。
また、データ通信モードにおいて、メール送信を行う場合、制御部931は、操作部932の操作によって入力された文字データを受け付けて、入力された文字を表示部930に表示する。また、制御部931は、操作部932におけるユーザ指示等に基づいてメールデータを生成して通信部922に供給する。通信部922は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部930に供給して、メール内容の表示を行う。
なお、携帯電話機920は、受信したメールデータを、記録再生部929で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、RAMや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB(Universal Serial Bus)メモリ、またはメモリカード等のリムーバブルメディアである。
データ通信モードにおいて画像データを送信する場合、カメラ部926で生成された画像データを、画像処理部927に供給する。画像処理部927は、画像データの符号化処理を行い、符号化データを生成する。
多重分離部928は、画像処理部927で生成された符号化データと、音声コーデック923から供給された音声データを所定の方式で多重化して通信部922に供給する。通信部922は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部928に供給する。多重分離部928は、多重化データの分離を行い、符号化データを画像処理部927、音声データを音声コーデック923に供給する。画像処理部927は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部930に供給して、受信した画像の表示を行う。音声コーデック923は、音声データをアナログ音声信号に変換してスピーカ924に供給して、受信した音声を出力する。
このように構成された携帯電話装置では、画像処理部927に本願の符号化装置および復号装置(符号化方法および復号方法)の機能が設けられる。このため、複数の視点の画像の符号化効率を向上させることができる。また、複数の視点の画像の符号化効率を向上させた符号化ストリームを復号することができる。
<第7実施の形態>
(記録再生装置の構成例)
図42は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置940は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置940は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置940は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。
記録再生装置940は、チューナ941、外部インタフェース部942、エンコーダ943、HDD(Hard Disk Drive)部944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)部948、制御部949、ユーザインタフェース部950を有している。
チューナ941は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ941は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ946に出力する。
外部インタフェース部942は、IEEE1394インタフェース、ネットワークインタフェース部、USBインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部942は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。
エンコーダ943は、外部インタフェース部942から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ946に出力する。
HDD部944は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。
ディスクドライブ945は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)やBlu−ray(登録商標)ディスク等である。
セレクタ946は、映像や音声の記録時には、チューナ941またはエンコーダ943からのいずれかの符号化ビットストリームを選択して、HDD部944やディスクドライブ945のいずれかに供給する。また、セレクタ946は、映像や音声の再生時に、HDD部944またはディスクドライブ945から出力された符号化ビットストリームをデコーダ947に供給する。
デコーダ947は、符号化ビットストリームの復号化処理を行う。デコーダ947は、復号処理化を行うことにより生成された映像データをOSD部948に供給する。また、デコーダ947は、復号処理化を行うことにより生成された音声データを出力する。
OSD部948は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ947から出力された映像データに重畳して出力する。
制御部949には、ユーザインタフェース部950が接続されている。ユーザインタフェース部950は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部949に供給する。
制御部949は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置940の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、記録再生装置940がユーザ操作に応じた動作となるように各部を制御する。
このように構成された記録再生装置では、デコーダ947に本願の復号装置(復号方法)の機能が設けられる。このため、複数の視点の画像の符号化効率を向上させた符号化ストリームを復号することができる。
<第8実施の形態>
(撮像装置の構成例)
図43は、本技術を適用した撮像装置の概略構成を例示している。撮像装置960は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、カメラ信号処理部963、画像データ処理部964、表示部965、外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970を有している。また、制御部970には、ユーザインタフェース部971が接続されている。さらに、画像データ処理部964や外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970等は、バス972を介して接続されている。
光学ブロック961は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCDまたはCMOSイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部963に供給する。
カメラ信号処理部963は、撮像部962から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部963は、カメラ信号処理後の画像データを画像データ処理部964に供給する。
画像データ処理部964は、カメラ信号処理部963から供給された画像データの符号化処理を行う。画像データ処理部964は、符号化処理を行うことにより生成された符号化データを外部インタフェース部966やメディアドライブ968に供給する。また、画像データ処理部964は、外部インタフェース部966やメディアドライブ968から供給された符号化データの復号化処理を行う。画像データ処理部964は、復号化処理を行うことにより生成された画像データを表示部965に供給する。また、画像データ処理部964は、カメラ信号処理部963から供給された画像データを表示部965に供給する処理や、OSD部969から取得した表示用データを、画像データに重畳させて表示部965に供給する。
OSD部969は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部964に出力する。
外部インタフェース部966は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部966には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部966は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部970は、例えば、ユーザインタフェース部971からの指示にしたがって、メディアドライブ968から符号化データを読み出し、それを外部インタフェース部966から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部970は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部966を介して取得し、それを画像データ処理部964に供給したりすることができる。
メディアドライブ968で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触IC(Integrated Circuit)カード等であってもよい。
また、メディアドライブ968と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。
制御部970は、CPUを用いて構成されている。メモリ部967は、制御部970により実行されるプログラムや制御部970が処理を行う上で必要な各種のデータ等を記憶する。メモリ部967に記憶されているプログラムは、撮像装置960の起動時などの所定タイミングで制御部970により読み出されて実行される。制御部970は、プログラムを実行することで、撮像装置960がユーザ操作に応じた動作となるように各部を制御する。
このように構成された撮像装置では、画像データ処理部964に本願の符号化装置および復号装置(符号化方法および復号方法)の機能が設けられる。このため、複数の視点の画像の符号化効率を向上させることができる。また、複数の視点の画像の符号化効率を向上させた符号化ストリームを復号することができる。
<第9実施の形態>
(実施のその他の例)
以上において本技術を適用する装置の例を説明したが、本技術は、これに限らず、このような装置を構成する装置に搭載するあらゆる構成、例えば、システムLSI(Large Scale Integration)等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等(すなわち、装置の一部の構成)として実施することもできる。
(ビデオセットの構成例)
本技術をセットとして実施する場合の例について、図44を参照して説明する。図44は、本技術を適用したビデオセットの概略的な構成の一例を示している。
近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、1機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する1セットとして実施を行う場合も多く見られるようになってきた。
図44に示されるビデオセット1300は、このような多機能化された構成であり、画像の符号化や復号(いずれか一方でもよいし、両方でも良い)に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。
図44に示されるように、ビデオセット1300は、ビデオモジュール1311、外部メモリ1312、パワーマネージメントモジュール1313、およびフロントエンドモジュール1314等のモジュール群と、コネクティビティ1321、カメラ1322、およびセンサ1323等の関連する機能を有するデバイスとを有する。
モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。
図44の例の場合、ビデオモジュール1311は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ、ビデオプロセッサ、ブロードバンドモデム1333、およびRFモジュール1334を有する。
プロセッサは、所定の機能を有する構成をSoC(System On a Chip)により半導体チップに集積したものであり、例えばシステムLSI(Large Scale Integration)等と称されるものもある。この所定の機能を有する構成は、論理回路(ハードウエア構成)であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム(ソフトウエア構成)であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路(ハードウエア構成)により実現し、その他の機能をCPUにおいて実行されるプログラム(ソフトウエア構成)により実現するようにしてもよい。
図44のアプリケーションプロセッサ1331は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ1331において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ1332等、ビデオモジュール1311内外の構成を必要に応じて制御することもできる。
ビデオプロセッサ1332は、画像の符号化・復号(その一方若しくは両方)に関する機能を有するプロセッサである。
ブロードバンドモデム1333は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線(またはその両方)の広帯域通信に関する処理を行うプロセッサ(若しくはモジュール)である。例えば、ブロードバンドモデム1333は、送信するデータ(デジタル信号)をデジタル変調する等してアナログ信号に変換したり、受信したアナログ信号を復調してデータ(デジタル信号)に変換したりする。例えば、ブロードバンドモデム1333は、ビデオプロセッサ1332が処理する画像データや画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報をデジタル変調・復調することができる。
RFモジュール1334は、アンテナを介して送受信されるRF(Radio Frequency)信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール1334は、ブロードバンドモデム1333により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール1334は、フロントエンドモジュール1314を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。
なお、図44において点線1341に示されるように、アプリケーションプロセッサ1331とビデオプロセッサ1332を、一体化し、1つのプロセッサとして構成されるようにしてもよい。
外部メモリ1312は、ビデオモジュール1311の外部に設けられた、ビデオモジュール1311により利用される記憶デバイスを有するモジュールである。この外部メモリ1312の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM(Dynamic Random Access Memory)のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。
パワーマネージメントモジュール1313は、ビデオモジュール1311(ビデオモジュール1311内の各構成)への電力供給を管理し、制御する。
フロントエンドモジュール1314は、RFモジュール1334に対してフロントエンド機能(アンテナ側の送受信端の回路)を提供するモジュールである。図44に示されるように、フロントエンドモジュール1314は、例えば、アンテナ部1351、フィルタ1352、および増幅部1353を有する。
アンテナ部1351は、無線信号を送受信するアンテナおよびその周辺の構成を有する。アンテナ部1351は、増幅部1353から供給される信号を無線信号として送信し、受信した無線信号を電気信号(RF信号)としてフィルタ1352に供給する。フィルタ1352は、アンテナ部1351を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール1334に供給する。増幅部1353は、RFモジュール1334から供給されるRF信号を増幅し、アンテナ部1351に供給する。
コネクティビティ1321は、外部との接続に関する機能を有するモジュールである。コネクティビティ1321の物理構成は、任意である。例えば、コネクティビティ1321は、ブロードバンドモデム1333が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。
例えば、コネクティビティ1321が、Bluetooth(登録商標)、IEEE 802.11(例えばWi-Fi(Wireless Fidelity、登録商標))、NFC(Near Field Communication)、IrDA(InfraRed Data Association)等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ1321が、USB(Universal Serial Bus)、HDMI(登録商標)(High-Definition Multimedia Interface)等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ1321が、アナログ入出力端子等のその他のデータ(信号)伝送機能等を有するようにしてもよい。
なお、コネクティビティ1321が、データ(信号)の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ1321が、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ(リムーバブルメディアのドライブだけでなく、ハードディスク、SSD(Solid State Drive)、NAS(Network Attached Storage)等も含む)を有するようにしてもよい。また、コネクティビティ1321が、画像や音声の出力デバイス(モニタやスピーカ等)を有するようにしてもよい。
カメラ1322は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ1322の撮像により得られた画像データは、例えば、ビデオプロセッサ1332に供給されて符号化される。
センサ1323は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ1323により検出されたデータは、例えば、アプリケーションプロセッサ1331に供給されてアプリケーション等により利用される。
以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。
以上のような構成のビデオセット1300において、後述するようにビデオプロセッサ1332に本技術を適用することができる。したがって、ビデオセット1300は、本技術を適用したセットとして実施することができる。
(ビデオプロセッサの構成例)
図45は、本技術を適用したビデオプロセッサ1332(図44)の概略的な構成の一例を示している。
図45の例の場合、ビデオプロセッサ1332は、ビデオ信号およびオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータおよびオーディオデータを復号し、ビデオ信号およびオーディオ信号を再生出力する機能とを有する。
図45に示されるように、ビデオプロセッサ1332は、ビデオ入力処理部1401、第1画像拡大縮小部1402、第2画像拡大縮小部1403、ビデオ出力処理部1404、フレームメモリ1405、およびメモリ制御部1406を有する。また、ビデオプロセッサ1332は、エンコード・デコードエンジン1407、ビデオES(Elementary Stream)バッファ1408Aおよび1408B、並びに、オーディオESバッファ1409Aおよび1409Bを有する。さらに、ビデオプロセッサ1332は、オーディオエンコーダ1410、オーディオデコーダ1411、多重化部(MUX(Multiplexer))1412、逆多重化部(DMUX(Demultiplexer))1413、およびストリームバッファ1414を有する。
ビデオ入力処理部1401は、例えばコネクティビティ1321(図44)等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第1画像拡大縮小部1402は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第2画像拡大縮小部1403は、画像データに対して、ビデオ出力処理部1404を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第1画像拡大縮小部1402と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部1404は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ1321(図44)等に出力する。
フレームメモリ1405は、ビデオ入力処理部1401、第1画像拡大縮小部1402、第2画像拡大縮小部1403、ビデオ出力処理部1404、およびエンコード・デコードエンジン1407によって共用される画像データ用のメモリである。フレームメモリ1405は、例えばDRAM等の半導体メモリとして実現される。
メモリ制御部1406は、エンコード・デコードエンジン1407からの同期信号を受けて、アクセス管理テーブル1406Aに書き込まれたフレームメモリ1405へのアクセススケジュールに従ってフレームメモリ1405に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル1406Aは、エンコード・デコードエンジン1407、第1画像拡大縮小部1402、第2画像拡大縮小部1403等で実行される処理に応じて、メモリ制御部1406により更新される。
エンコード・デコードエンジン1407は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン1407は、フレームメモリ1405から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ1408Aに順次書き込む。また、例えば、ビデオESバッファ1408Bからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ1405に順次書き込む。エンコード・デコードエンジン1407は、これらの符号化や復号において、フレームメモリ1405を作業領域として使用する。また、エンコード・デコードエンジン1407は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部1406に対して同期信号を出力する。
ビデオESバッファ1408Aは、エンコード・デコードエンジン1407によって生成されたビデオストリームをバッファリングして、多重化部(MUX)1412に供給する。ビデオESバッファ1408Bは、逆多重化部(DMUX)1413から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン1407に供給する。
オーディオESバッファ1409Aは、オーディオエンコーダ1410によって生成されたオーディオストリームをバッファリングして、多重化部(MUX)1412に供給する。オーディオESバッファ1409Bは、逆多重化部(DMUX)1413から供給されたオーディオストリームをバッファリングして、オーディオデコーダ1411に供給する。
オーディオエンコーダ1410は、例えばコネクティビティ1321(図44)等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3(AudioCode number 3)方式等の所定の方式で符号化する。オーディオエンコーダ1410は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ1409Aに順次書き込む。オーディオデコーダ1411は、オーディオESバッファ1409Bから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ1321(図44)等に供給する。
多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法(すなわち、多重化により生成されるビットストリームのフォーマット)は任意である。また、この多重化の際に、多重化部(MUX)1412は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部(MUX)1412は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部(MUX)1412は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ(ファイルデータ)に変換する。
逆多重化部(DMUX)1413は、多重化部(MUX)1412による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部(DMUX)1413は、ストリームバッファ1414から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する(ビデオストリームとオーディオストリームとを分離する)。つまり、逆多重化部(DMUX)1413は、逆多重化によりストリームのフォーマットを変換(多重化部(MUX)1412による変換の逆変換)することができる。例えば、逆多重化部(DMUX)1413は、例えばコネクティビティ1321やブロードバンドモデム1333等(いずれも図44)から供給されたトランスポートストリームを、ストリームバッファ1414を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部(DMUX)1413は、例えばコネクティビティ1321により(図44)各種記録媒体から読み出されたファイルデータを、ストリームバッファ1414を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。
ストリームバッファ1414は、ビットストリームをバッファリングする。例えば、ストリームバッファ1414は、多重化部(MUX)1412から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ1321やブロードバンドモデム1333(いずれも図44)等に供給する。
また、例えば、ストリームバッファ1414は、多重化部(MUX)1412から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ1321(図44)等に供給し、各種記録媒体に記録させる。
さらに、ストリームバッファ1414は、例えばコネクティビティ1321やブロードバンドモデム1333等(いずれも図44)を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部(DMUX)1413に供給する。
また、ストリームバッファ1414は、例えばコネクティビティ1321(図44)等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部(DMUX)1413に供給する。
次に、このような構成のビデオプロセッサ1332の動作の例について説明する。例えば、コネクティビティ1321(図44)等からビデオプロセッサ1332に入力されたビデオ信号は、ビデオ入力処理部1401において4:2:2Y/Cb/Cr方式等の所定の方式のデジタル画像データに変換され、フレームメモリ1405に順次書き込まれる。このデジタル画像データは、第1画像拡大縮小部1402または第2画像拡大縮小部1403に読み出されて、4:2:0Y/Cb/Cr方式等の所定の方式へのフォーマット変換および拡大縮小処理が行われ、再びフレームメモリ1405に書き込まれる。この画像データは、エンコード・デコードエンジン1407によって符号化され、ビデオストリームとしてビデオESバッファ1408Aに書き込まれる。
また、コネクティビティ1321(図44)等からビデオプロセッサ1332に入力されたオーディオ信号は、オーディオエンコーダ1410によって符号化され、オーディオストリームとして、オーディオESバッファ1409Aに書き込まれる。
ビデオESバッファ1408Aのビデオストリームと、オーディオESバッファ1409Aのオーディオストリームは、多重化部(MUX)1412に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部(MUX)1412により生成されたトランスポートストリームは、ストリームバッファ1414にバッファされた後、例えばコネクティビティ1321やブロードバンドモデム1333(いずれも図44)等を介して外部ネットワークに出力される。また、多重化部(MUX)1412により生成されたファイルデータは、ストリームバッファ1414にバッファされた後、例えばコネクティビティ1321(図44)等に出力され、各種記録媒体に記録される。
また、例えばコネクティビティ1321やブロードバンドモデム1333(いずれも図44)等を介して外部ネットワークからビデオプロセッサ1332に入力されたトランスポートストリームは、ストリームバッファ1414にバッファされた後、逆多重化部(DMUX)1413により逆多重化される。また、例えばコネクティビティ1321(図44)等において各種記録媒体から読み出され、ビデオプロセッサ1332に入力されたファイルデータは、ストリームバッファ1414にバッファされた後、逆多重化部(DMUX)1413により逆多重化される。つまり、ビデオプロセッサ1332に入力されたトランスポートストリームまたはファイルデータは、逆多重化部(DMUX)1413によりビデオストリームとオーディオストリームとに分離される。
オーディオストリームは、オーディオESバッファ1409Bを介してオーディオデコーダ1411に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ1408Bに書き込まれた後、エンコード・デコードエンジン1407により順次読み出されて復号されてフレームメモリ1405に書き込まれる。復号された画像データは、第2画像拡大縮小部1403によって拡大縮小処理されて、フレームメモリ1405に書き込まれる。そして、復号された画像データは、ビデオ出力処理部1404に読み出されて、4:2:2Y/Cb/Cr方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。
このように構成されるビデオプロセッサ1332に本技術を適用する場合、エンコード・デコードエンジン1407に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン1407が、第1乃至第3実施の形態に係る符号化装置や復号装置の機能を有するようにすればよい。このようにすることにより、ビデオプロセッサ1332は、図1乃至図38を参照して上述した効果と同様の効果を得ることができる。
なお、エンコード・デコードエンジン1407において、本技術(すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能)は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。
(ビデオプロセッサの他の構成例)
図46は、本技術を適用したビデオプロセッサ1332(図44)の概略的な構成の他の例を示している。図46の例の場合、ビデオプロセッサ1332は、ビデオデータを所定の方式で符号化・復号する機能を有する。
より具体的には、図46に示されるように、ビデオプロセッサ1332は、制御部1511、ディスプレイインタフェース1512、ディスプレイエンジン1513、画像処理エンジン1514、および内部メモリ1515を有する。また、ビデオプロセッサ1332は、コーデックエンジン1516、メモリインタフェース1517、多重化・逆多重化部(MUX DMUX)1518、ネットワークインタフェース1519、およびビデオインタフェース1520を有する。
制御部1511は、ディスプレイインタフェース1512、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516等、ビデオプロセッサ1332内の各処理部の動作を制御する。
図46に示されるように、制御部1511は、例えば、メインCPU1531、サブCPU1532、およびシステムコントローラ1533を有する。メインCPU1531は、ビデオプロセッサ1332内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU1531は、そのプログラム等に従って制御信号を生成し、各処理部に供給する(つまり、各処理部の動作を制御する)。サブCPU1532は、メインCPU1531の補助的な役割を果たす。例えば、サブCPU1532は、メインCPU1531が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ1533は、メインCPU1531およびサブCPU1532が実行するプログラムを指定する等、メインCPU1531およびサブCPU1532の動作を制御する。
ディスプレイインタフェース1512は、制御部1511の制御の下、画像データを例えばコネクティビティ1321(図44)等に出力する。例えば、ディスプレイインタフェース1512は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、またはデジタルデータの画像データのまま、コネクティビティ1321(図44)のモニタ装置等に出力する。
ディスプレイエンジン1513は、制御部1511の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。
画像処理エンジン1514は、制御部1511の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。
内部メモリ1515は、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516により共用される、ビデオプロセッサ1332の内部に設けられたメモリである。内部メモリ1515は、例えば、ディスプレイエンジン1513、画像処理エンジン1514、およびコーデックエンジン1516の間で行われるデータの授受に利用される。例えば、内部メモリ1515は、ディスプレイエンジン1513、画像処理エンジン1514、またはコーデックエンジン1516から供給されるデータを格納し、必要に応じて(例えば、要求に応じて)、そのデータを、ディスプレイエンジン1513、画像処理エンジン1514、またはコーデックエンジン1516に供給する。この内部メモリ1515は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM(Static Random Access Memory)のような比較的(例えば外部メモリ1312と比較して)小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。
コーデックエンジン1516は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン1516が対応する符号化・復号の方式は任意であり、その数は1つであってもよいし、複数であってもよい。例えば、コーデックエンジン1516は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化若しくは符号化データの復号を行うようにしてもよい。
図46に示される例において、コーデックエンジン1516は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video1541、AVC/H.2641542、HEVC/H.2651543、HEVC/H.265(Scalable)1544、HEVC/H.265(Multi-view)1545、およびMPEG-DASH1551を有する。
MPEG-2 Video1541は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.2641542は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.2651543は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)1544は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)1545は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。
MPEG-DASH1551は、画像データをMPEG-DASH(MPEG-Dynamic Adaptive Streaming over HTTP)方式で送受信する機能ブロックである。MPEG-DASHは、HTTP(HyperText Transfer Protocol)を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の1つとする。MPEG-DASH1551は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video1541乃至HEVC/H.265(Multi-view)1545を利用する。
メモリインタフェース1517は、外部メモリ1312用のインタフェースである。画像処理エンジン1514やコーデックエンジン1516から供給されるデータは、メモリインタフェース1517を介して外部メモリ1312に供給される。また、外部メモリ1312から読み出されたデータは、メモリインタフェース1517を介してビデオプロセッサ1332(画像処理エンジン1514若しくはコーデックエンジン1516)に供給される。
多重化・逆多重化部(MUX DMUX)1518は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部(MUX DMUX)1518は、複数のデータを1つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部(MUX DMUX)1518は、1つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部(MUX DMUX)1518は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部(MUX DMUX)1518は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ(ファイルデータ)に変換することができる。もちろん、逆多重化によりその逆変換も可能である。
ネットワークインタフェース1519は、例えばブロードバンドモデム1333やコネクティビティ1321(いずれも図44)等向けのインタフェースである。ビデオインタフェース1520は、例えばコネクティビティ1321やカメラ1322(いずれも図44)等向けのインタフェースである。
次に、このようなビデオプロセッサ1332の動作の例について説明する。例えば、例えばコネクティビティ1321やブロードバンドモデム1333(いずれも図44)等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース1519を介して多重化・逆多重化部(MUX DMUX)1518に供給されて逆多重化され、コーデックエンジン1516により復号される。コーデックエンジン1516の復号により得られた画像データは、例えば、画像処理エンジン1514により所定の画像処理が施され、ディスプレイエンジン1513により所定の変換が行われ、ディスプレイインタフェース1512を介して例えばコネクティビティ1321(図44)等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン1516の復号により得られた画像データは、コーデックエンジン1516により再符号化され、多重化・逆多重化部(MUX DMUX)1518により多重化されてファイルデータに変換され、ビデオインタフェース1520を介して例えばコネクティビティ1321(図44)等に出力され、各種記録媒体に記録される。
さらに、例えば、コネクティビティ1321(図44)等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース1520を介して多重化・逆多重化部(MUX DMUX)1518に供給されて逆多重化され、コーデックエンジン1516により復号される。コーデックエンジン1516の復号により得られた画像データは、画像処理エンジン1514により所定の画像処理が施され、ディスプレイエンジン1513により所定の変換が行われ、ディスプレイインタフェース1512を介して例えばコネクティビティ1321(図44)等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン1516の復号により得られた画像データは、コーデックエンジン1516により再符号化され、多重化・逆多重化部(MUX DMUX)1518により多重化されてトランスポートストリームに変換され、ネットワークインタフェース1519を介して例えばコネクティビティ1321やブロードバンドモデム1333(いずれも図44)等に供給され図示せぬ他の装置に伝送される。
なお、ビデオプロセッサ1332内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ1515や外部メモリ1312を利用して行われる。また、パワーマネージメントモジュール1313は、例えば制御部1511への電力供給を制御する。
このように構成されるビデオプロセッサ1332に本技術を適用する場合、コーデックエンジン1516に、上述した各実施形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン1516が、第1乃至第3実施の形態に係る符号化装置や復号装置を実現する機能ブロックを有するようにすればよい。さらに、例えば、コーデックエンジン1516が、このようにすることにより、ビデオプロセッサ1332は、図1乃至図38を参照して上述した効果と同様の効果を得ることができる。
なお、コーデックエンジン1516において、本技術(すなわち、上述した各実施形態に係る画像符号化装置や画像復号装置の機能)は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。
以上にビデオプロセッサ1332の構成を2例示したが、ビデオプロセッサ1332の構成は任意であり、上述した2例以外のものであってもよい。また、このビデオプロセッサ1332は、1つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する3次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。
(装置への適用例)
ビデオセット1300は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット1300は、テレビジョン装置900(図40)、携帯電話機920(図41)、記録再生装置940(図42)、撮像装置960(図43)等に組み込むことができる。ビデオセット1300を組み込むことにより、その装置は、図1乃至図38を参照して上述した効果と同様の効果を得ることができる。
なお、上述したビデオセット1300の各構成の一部であっても、ビデオプロセッサ1332を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ1332のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線1341により示されるプロセッサやビデオモジュール1311等を本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール1311、外部メモリ1312、パワーマネージメントモジュール1313、およびフロントエンドモジュール1314を組み合わせ、本技術を適用したビデオユニット1361として実施することもできる。いずれの構成の場合であっても、図1乃至図38を参照して上述した効果と同様の効果を得ることができる。
つまり、ビデオプロセッサ1332を含むものであればどのような構成であっても、ビデオセット1300の場合と同様に、画像データを処理する各種装置に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット1300の場合と同様に、図1乃至図38を参照して上述した効果と同様の効果を得ることができる。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
なお、本技術は、以下のような構成もとることができる。
(1)
符号化対象の画像の視点より第1の方向に存在する視点の第1の画像を特定する第1の画像特定情報と、前記第1の方向とは反対の第2の方向に存在する視点の第2の画像を特定する第2の画像特定情報とを、第1の順に第1の参照リストに設定し、前記第1の順とは異なる第2の順に第2の参照リストに設定する設定部と、
前記設定部により設定された前記第1の参照リストと前記第2の参照リストとに基づいて、前記符号化対象の画像を符号化し、符号化データを生成する符号化部と
を備える符号化装置。
(2)
前記設定部は、前記第1の画像特定情報と前記第2の画像特定情報を、前記第1の画像特定情報、前記第2の画像特定情報の順に前記第1の参照リストに設定し、前記第2の画像特定情報、前記第1の画像特定情報の順に前記第2の参照リストに設定する
前記(1)に記載の符号化装置。
(3)
前記第1の画像、前記第2の画像、および前記符号化対象の画像の視点に対して、最も前記第1の方向に存在する視点から順に値が大きくなるように付与された前記視点を識別する識別情報と、前記符号化部により生成された前記符号化データとを伝送する伝送部
をさらに備え、
前記設定部は、前記識別情報に基づいて、前記符号化対象の画像の前記識別情報より小さい識別情報が付与された視点の画像を前記第1の画像とし、前記符号化対象の画像の前記識別情報より大きい識別情報が付与された視点の画像を第2の画像とする
前記(1)または(2)に記載の符号化装置。
(4)
前記設定部は、前記視点識別情報が、前記第1の画像、前記第2の画像、および前記符号化対象の画像の視点に対して、最も前記第1の方向に存在する視点から順に値が大きくなるように付与されたことを識別する順序信頼情報に基づいて、前記第1の参照リストおよび前記第2の参照リストを設定する
前記(3)に記載の符号化装置。
(5)
前記設定部は、前記識別情報が大きい順に前記第1の画像特定情報を前記第1の参照リストおよび前記第2の参照リストに設定し、前記識別情報が小さい順に前記第2の画像特定情報を前記第1の参照リストおよび前記第2の参照リストに設定する
前記(3)または(4)に記載の符号化装置。
(6)
符号化装置が、
符号化対象の画像の視点より第1の方向に存在する視点の第1の画像を特定する第1の画像特定情報と、前記第1の方向とは反対の第2の方向に存在する視点の第2の画像を特定する第2の画像特定情報とを、第1の順に第1の参照リストに設定し、前記第1の順とは異なる第2の順に第2の参照リストに設定する設定ステップと、
前記設定ステップの処理により設定された前記第1の参照リストと前記第2の参照リストとに基づいて、前記符号化対象の画像を符号化し、符号化データを生成する符号化ステップと
を含む符号化方法。
(7)
復号対象の画像の視点より第1の方向に存在する視点の第1の画像を特定する第1の画像特定情報と、前記第1の方向とは反対の第2の方向に存在する視点の第2の画像を特定する第2の画像特定情報とを、第1の順に第1の参照リストに設定し、前記第1の順とは異なる第2の順に第2の参照リストに設定する設定部と、
前記設定部により設定された前記第1の参照リストと前記第2の参照リストとに基づいて、前記復号対象の画像の符号化データを復号する復号部と
を備える復号装置。
(8)
前記設定部は、前記第1の画像特定情報と前記第2の画像特定情報を、前記第1の画像特定情報、前記第2の画像特定情報の順に前記第1の参照リストに設定し、前記第2の画像特定情報、前記第1の画像特定情報の順に前記第2の参照リストに設定する
前記(7)に記載の復号装置。
(9)
前記設定部は、前記第1の画像、前記第2の画像、および前記復号対象の画像の視点に対して、最も前記第1の方向に存在する視点から順に値が大きくなるように付与された前記視点を識別する識別情報に基づいて、前記復号対象の画像の前記識別情報より小さい識別情報が付与された視点の画像を前記第1の画像とし、前記復号対象の画像の前記識別情報より大きい識別情報が付与された視点の画像を第2の画像とする
前記(7)または(8)に記載の復号装置。
(10)
前記設定部は、前記視点識別情報が、前記第1の画像、前記第2の画像、および前記復号対象の画像の視点に対して、最も前記第1の方向に存在する視点から順に値が大きくなるように付与されたことを識別する順序信頼情報に基づいて、前記第1の参照リストおよび前記第2の参照リストを設定する
前記(9)に記載の復号装置。
(11)
前記設定部は、前記識別情報が大きい順に前記第1の画像特定情報を前記第1の参照リストおよび前記第2の参照リストに設定し、前記識別情報が小さい順に前記第2の画像特定情報を前記第1の参照リストおよび前記第2の参照リストに設定する
前記(9)または(10)に記載の復号装置。
(12)
復号装置が、
復号対象の画像の視点より第1の方向に存在する視点の第1の画像を特定する第1の画像特定情報と、前記第1の方向とは反対の第2の方向に存在する視点の第2の画像を特定する第2の画像特定情報とを、第1の順に第1の参照リストに設定し、前記第1の順とは異なる第2の順に第2の参照リストに設定する設定ステップと、
前記設定ステップの処理により設定された前記第1の参照リストと前記第2の参照リストとに基づいて、前記復号対象の画像の符号化データを復号する復号ステップと
を含む復号方法。