<第1実施の形態>
[符号化装置の第1実施の形態]
図1は、本発明を適用した符号化装置の第1実施の形態の構成例を示すブロック図である。
図1において、符号化装置は、左眼用画像の画像データ(以下、左眼用視点画像データともいう)と、右眼用画像の画像データ(以下、右眼用視点画像データともいう)とからなるステレオ画像の画像データを符号化する。
すなわち、図1において、符号化装置は、複数である2個の符号化部111及び112、フラグ設定部12、並びに、生成部13から構成される。
符号化部111には、ステレオ画像の左眼用視点画像データが供給される。
符号化部111は、そこに供給される左眼用視点画像データを、例えば、MPEG2やAVC/H.264方式等の所定の符号化方式に従って符号化し、その結果得られる符号化データ(以下、左眼用符号化データともいう)を、生成部13に供給する。
符号化部112には、ステレオ画像の右眼用視点画像データが供給される。
符号化部112は、そこに供給される右眼用視点画像データを、例えば、符号化部111と同様に符号化し、その結果得られる符号化データ(以下、右眼用符号化データともいう)を、生成部13に供給する。
フラグ設定部12は、例えば、ステレオ画像の制作者等のユーザの操作等に応じて、ステレオ画像の2個の視点の左眼用視点画像データ、及び、右眼用視点画像データのうちの、2次元画像の表示に用いる画像データを、例えば、シーン等ごとに指定するフラグであるビュースイッチングフラグ(view_switching_flag)を設定し、生成部13に供給する。
生成部13は、ステレオ画像の画像データと、ビュースイッチングフラグとを含むビットストリームを生成して出力する。
すなわち、生成部13は、符号化部111からの左眼用符号化データと、符号化部112からの右眼用符号化データとを多重化して多重化データとし、その多重化データのヘッダ等に、フラグ設定部12からのビュースイッチングフラグを含めて出力する。
[符号化部111の構成例]
図2は、図1の符号化部111の構成例を示すブロック図である。
なお、図1の符号化部112も、符号化部111と同様に構成される。
符号化部111は、例えば、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償により画像圧縮を実現する画像情報符号化装置である。
符号化対象の画像データは、A/D(Analog/Digital)変換部21に供給される。A/D変換部21は、そこに供給される画像データがアナログ信号の画像データである場合に、その画像データをA/D変換することで、ディジタル信号の画像データに変換し、画面並べ替えバッファ22に供給する。
画面並べ替えバッファ22は、A/D変換部21からの画像データを一時記憶し、必要に応じて読み出すことで、符号化部111の出力である符号化データのGOP(Group of Pictures)構造に応じて、画像データのピクチャ(フレーム)(フィールド)の並べ替えを行う。
画面並べ替えバッファ22から読み出されたピクチャのうちの、イントラ符号が行われるイントラピクチャは、演算部23に供給される。
演算部23は、画面並べ替えバッファ22から供給されるイントラピクチャの画素値から、必要に応じて、イントラ予測部33から供給される予測画像の画素値を減算し、直交変換部24に供給する。
直交変換部24は、イントラピクチャ(の画素値、又は、予測画像が減算された減算値)に対して、離散コサイン変換や、カルーネン・レーベ変換等の直交変換を施し、その結果得られる変換係数を、量子化部25に供給する。
量子化部25は、直交変換部24からの変換係数を量子化し、その結果得られる量子化値を、可逆符号化部26に供給する。
可逆符号化部26は、量子化部25からの量子化値に対して、可変長符号化や、算術符号化等の可逆符号化を施し、その結果得られる符号化データを、蓄積バッファ27に供給する。
蓄積バッファ27は、可逆符号化部26からの符号化データを一時記憶し、所定のレートで出力する。
レート制御部28は、蓄積バッファ27の符号化データの蓄積量を監視しており、その蓄積量に基づき、量子化部25の量子化ステップ等の、量子化部25の挙動を制御する。
量子化部25で得られる量子化値は、可逆符号化部26に供給される他、逆量子化部29にも供給される。逆量子化部29は、量子化部25からの量子化値を、変換係数に逆量子化し、逆直交変換部30に供給する。
逆直交変換部30は、逆量子化部29からの変換係数を逆直交変換し、演算部31に供給する。
演算部31は、逆直交変換部30から供給されるデータに対して、必要に応じて、イントラ予測部33から供給される予測画像の画素値を加算することで、イントラピクチャの復号画像を得て、フレームメモリ32に供給する。
フレームメモリ32は、演算部31から供給される復号画像を一時記憶し、その復号画像を、必要に応じて、予測画像を生成するのに用いる参照画像として、イントラ予測部33や動き予測/動き補償部34に供給する。
イントラ予測部33は、イントラピクチャの中で、演算部23で処理の対象となっている部分(ブロック)の近傍の画素のうちの、既にフレームメモリ32に記憶されている画素から予測画像を生成し、演算部23及び31に供給する。
イントラ符号化が行われるピクチャについて、上述したようにして、イントラ予測部33から演算部23に予測画像が供給される場合、演算部23では、画像並べ替えバッファ22から供給されるピクチャから、イントラ予測部33から供給される予測画像が減算される。
また、演算部31では、演算部23で減算された予測画像が、逆直交変換部30から供給されるデータに加算される。
一方、インター符号化が行われるノンイントラピクチャは、画像並べ替えバッファ22から、演算部23、及び、動き予測/動き補償部34に供給される。
動き予測/動き補償部34は、フレームメモリ32から、画像並べ替えバッファ22からのノンイントラピクチャの動き予測に際して参照される復号画像のピクチャを、参照画像として読み出す。さらに、動き予測/動き補償部34は、フレームメモリ32からの参照画像を用いて、画像並べ替えバッファ22からのノンイントラピクチャについて、動きベクトルを検出する。
そして、動き予測/動き補償部34は、動きベクトルに従い、参照画像に動き補償を施すことで、ノンイントラピクチャの予測画像を生成し、演算部23及び31に供給する。
演算部23では、画像並べ替えバッファ22から供給されるノンイントラピクチャから、イントラ予測部33から供給される予測画像が減算され、以下、イントラピクチャの場合と同様にして、符号化が行われる。
なお、イントラ予測部33が予測画像を生成するモードであるイントラ予測モードは、イントラ予測部33から可逆符号化部26に供給される。また、動き予測/動き補償部34で得られる動きベクトル、及び、動き予測/動き補償部34が動き補償を行うモードである動き補償予測モードは、動き予測/動き補償部34から可逆符号化部26に供給される。
可逆符号化部26では、イントラ予測モード、動きベクトル、動き補償予測モード、その他、各ピクチャのピクチャタイプ等の、復号に必要な情報が可逆符号化され、符号化データのヘッダに含められる。
[フラグ設定部12によるビュースイッチングフラグの設定の説明]
次に、図3を参照して、図1のフラグ設定部12によるビュースイッチングフラグの設定について説明する。
いま、図1の符号化装置での符号化の対象のステレオ画像が、図3に示すように、シーン#1,#2,#3から構成されることとする。
さらに、ステレオ画像が、2次元画像として表示される場合に、ステレオ画像の制作者が、2次元画像として表示される画像(以下、提示画像ともいう)として、シーン#1については、左眼用画像を、シーン#2については、右眼用画像を、シーン#3については、左眼用画像を選択するように、フラグ設定部12を操作したこととする。
この場合、フラグ設定部12は、シーン#1及び#3については、左眼用画像を提示画像として指定する値である、例えば、0を、ビュースイッチングフラグとして設定する。
また、フラグ設定部12は、シーン#2については、右眼用画像を提示画像として指定する値である、例えば、1を、ビュースイッチングフラグとして設定する。
したがって、ここでは、ビュースイッチングフラグとしては、1ビットのフラグを採用することができる。
ここで、シーンとは、1以上の(連続する)ピクチャ(の集まり)であり、例えば、シーンチェンジの直後のピクチャから、次のシーンチェンジの直前のピクチャまでや、GOP等を、1シーンとすることができる。
なお、シーンごとに、提示画像の選択を可能とするため、図1の符号化部111において、AVC/H.264方式で符号化が行われる場合には、シーンの先頭のピクチャは、IDRピクチャとして符号化される。符号化部112でも同様である。
また、図1のフラグ設定部12でのビュースイッチングフラグの設定では、例えば、1シーンごとに、1つのビュースイッチングフラグを設定することもできるし、1ピクチャごとに、1つのビュースイッチングフラグを設定することもできる。
したがって、シーンに対するビュースイッチングフラグの設定は、シーンに、1つのビュースイッチングフラグを設定することによって行うこともできるし、シーンを構成する各ピクチャに、ビュースイッチングフラグを設定することによって行うこともできる。
なお、図1の生成部13において、ビュースイッチングフラグは、多重化データの、例えば、システムレイヤやピクチャレイヤのヘッダ等に含められる。具体的には、例えば、符号化部111及び112において、例えば、AVC/H.264方式で符号化が行われる場合には、ビュースイッチングフラグは、例えば、ユーザデータであるSEI (Supplemental Enhancement Information) に含めることができる。
[符号化装置の処理の説明]
図4を参照して、図1の符号化装置の処理(符号化処理)を説明する。
図1の符号化装置では、フラグ設定部12が、ステレオ画像の制作者によって操作されると、ステップS11において、フラグ設定部12が、ステレオ画像の制作者の操作に従って、ステレオ画像の各シーンに対するビュースイッチングフラグを設定し、生成部13に供給する。
その後、符号化装置に対して、ステレオ画像の画像データである左眼用視点画像データ、及び、右眼用視点画像データが供給されるのを待って、処理は、ステップS11からステップS12に進み、符号化部111及び112は、符号化を行う。
すなわち、符号化部111は、左眼用視点画像データを符号化し、その結果得られる左眼用符号化データを、生成部13に供給する。また、符号化部112は、右眼用視点画像データを符号化し、その結果得られる右眼用符号化データを、生成部13に供給する。
その後、処理は、ステップS12からステップS13に進み、生成部13は、符号化部111からの左眼用符号化データと、符号化部112からの右眼用符号化データとを多重化し、多重化データとする。さらに、生成部13は、多重化データのヘッダに、フラグ設定部12からのビュースイッチングフラグを含め、多重化データを出力する。
そして、処理は、ステップS13からステップS14に進み、符号化装置は、まだ符号化すべきステレオ画像の画像データがあるかどうかを判定し、あると判定された場合、処理は、ステップS12に戻り、以下、ステップS12ないしS14の処理が繰り返される。
ここで、ステップS12ないしS14の処理は、例えば、ビュースイッチングフラグが設定されるシーン等の単位で行われる。
一方、ステップS14において、符号化すべきステレオ画像の画像データがないと判定された場合、符号化装置は、符号化処理を終了する。
以上のようにして、生成部13が出力する多重化データ、すなわち、ステレオ画像の画像データ(を符号化した符号化データ)と、ビュースイッチングフラグとを含むビットストリームは、例えば、伝送媒体を介して伝送され、又は、記録媒体に記録される。
[復号装置の第1実施の形態]
図5は、本発明を適用した復号装置の第1実施の形態の構成例を示すブロック図である。
図5において、復号装置は、図1の符号化装置が出力する多重化データを復号する。
すなわち、図5において、復号装置は、抽出部41、複数である2個の復号部421及び422、立体視画像変換部43、選択部44、並びに、復号部45から構成される。
抽出部41は、多重化データから、ビュースイッチングフラグを抽出し、選択部44に供給する。
また、抽出部41は、多重化データから、左眼用符号化データ、及び、右眼用符号化データを分離(逆多重化)し、左眼用符号化データを、復号部421に、右眼用符号化データを、復号部422に、それぞれ供給する。
さらに、抽出部41は、左眼用符号化データ、及び、右眼用符号化データを、選択部44に供給する。
復号部421は、抽出部41からの左眼用符号化データを復号し、その結果得られる左眼用視点画像データを、立体視画像変換部43に供給する。
復号部422は、抽出部41からの右眼用符号化データを復号し、その結果得られる右眼用視点画像データを、立体視画像変換部43に供給する。
立体視画像変換部43は、復号部421からの左眼用視点画像データ、及び、復号部422からの右眼用視点画像データを、立体視用デバイスで扱うことができるフォーマットの立体視用の立体視画像データに変換し、図示せぬ立体視用デバイスに供給する。
選択部44は、抽出部41から供給されるビュースイッチングフラグに従い、同じく抽出部41から供給される左眼用符号化データ、又は、右眼用符号化データのうちの一方を、2次元画像の表示に用いる画像データの符号化データとして、ビュースイッチングフラグが設定されているシーンやピクチャ等の単位で選択し、復号部45に供給する。
復号部45は、選択部44から供給される符号化データ(左眼用符号化データ、又は、右眼用符号化データ)を復号し、その結果得られる画像データ(左眼用視点画像データ、又は、右眼用視点画像データ)を、図示せぬ2次元表示デバイスに供給する。
なお、図5では、選択部44は、抽出部41が出力する、復号前のデータである左眼用符号化データ、又は、右眼用符号化データを選択するようになっているが、選択部44では、その他、例えば、復号後のデータ、すなわち、復号部421で得られる左眼用視点画像データ、又は、復号部422で得られる右眼用視点画像データを選択することが可能である。この場合、図5の復号装置は、復号部45を設けずに構成することができる。後述する図16でも同様である。
[復号部421の構成例]
図6は、図5の復号部421の構成例を示すブロック図である。
なお、図5の復号部422及び45も、復号部421と同様に構成される。
復号部421は、例えば、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償により画像圧縮を実現する画像情報符号化装置で得られる符号化データを復号する画像情報復号装置である。
復号の対象となる符号化データは、蓄積バッファ51に供給される。蓄積バッファ51は、そこに供給される符号化データを一時記憶し、可逆符号復号部52に供給する。
可逆符号復号部52は、蓄積バッファ51からの符号化データに対して、その符号化データのフォーマットに基づき、可変長復号や、算術復号等の処理を施すことで、量子化値と、符号化データのヘッダに含められたイントラ予測モード、動きベクトル、動き補償予測モード、その他、各ピクチャのピクチャタイプ等の、画像の復号に必要な情報を復号する。
可逆符号復号部52で得られる量子化値は、逆量子化部53に供給され、イントラ予測モードは、イントラ予測部57に供給される。また、可逆符号復号部52で得られる動きベクトル(MV)、動き補償予測モード、及び、ピクチャタイプは、動き予測/動き補償部58に供給される。
逆量子化部53、逆直交変換部54、演算部55、フレームメモリ56、イントラ予測部57、及び、動き予測/動き補償部58は、図2の逆量子化部29、逆直交変換部30、演算部31、フレームメモリ32、イントラ予測部33、及び、動き予測/動き補償部34とそれぞれ同様の処理を行い、これにより、画像が復号される(復号画像が得られる)。
すなわち、逆量子化部53は、可逆符号復号部52からの量子化値を、変換係数に逆量子化し、逆直交変換部54に供給する。
逆直交変換部54は、逆量子化部53からの変換係数を逆直交変換し、演算部55に供給する。
演算部55は、逆直交変換部54から供給されるデータのうちの、イントラピクチャのデータについては、必要に応じて、イントラ予測部57から供給される予測画像の画素値を加算することで、イントラピクチャの復号画像を得る。また、演算部55は、逆直交変換部54から供給されるデータのうちの、ノンイントラピクチャのデータについては、動き予測/動き補償部58から供給される予測画像の画素値を加算することで、ノンイントラピクチャの復号画像を得る。
演算部55で得られた復号画像は、必要に応じて、フレームメモリ56に供給されるとともに、画像並べ替えバッファ59に供給される。
フレームメモリ56は、演算部55から供給される復号画像を一時記憶し、その復号画像を、必要に応じて、予測画像を生成するのに用いる参照画像として、イントラ予測部57や動き予測/動き補償部34に供給する。
イントラ予測部57は、演算部55で処理の対象となっているデータが、イントラピクチャのデータである場合、そのイントラピクチャの予測画像を、フレームメモリ56からの参照画像としての復号画像を用いて、必要に応じて生成し、演算部55に供給する。
すなわち、イントラ予測部57は、可逆符号復号部52からのイントラ予測モードに従い、演算部55で処理の対象となっている部分(ブロック)の近傍の画素のうちの、既にフレームメモリ56に記憶されている画素から予測画像を生成し、演算部55に供給する。
一方、動き予測/動き補償部58は、演算部55で処理の対象となっているデータが、ノンイントラピクチャのデータである場合、そのノンイントラピクチャの予測画像を生成し、演算部55に供給する。
すなわち、動き予測/動き補償部58は、可逆符号復号部52からのピクチャタイプ等に従い、フレームメモリ56から、予測画像の生成に用いる復号画像のピクチャを、参照画像として読み出す。さらに、動き予測/動き補償部58は、フレームメモリ56からの参照画像に対して、可逆符号復号部52からの動きベクトル、及び、動き補償予測モードに従った動き補償を施すことにより、予測画像を生成し、演算部55に供給する。
演算部55では、以上のようにして、イントラ予測部57、又は、動き予測/動き補償部58から供給される予測画像を、逆直交変換部54から供給されるデータに加算することで、ピクチャ(の画素値)が復号される。
画像並べ替えバッファ59は、演算部55からのピクチャ(復号画像)を一時記憶して読み出すことで、ピクチャの並びを、元の並びに並び替え、D/A(Digital/Analog)変換部60に供給する。
D/A変換部60は、画像並べ替えバッファ59からの復号画像をアナログ信号で出力する必要がある場合に、その復号画像をD/A変換して出力する。
[2次元画像が表示される場合の復号装置の処理]
次に、図7を参照して、ステレオ画像が2次元画像として表示される場合の、図5の復号装置の処理を説明する。
なお、図7において、Iは、I(Intra)ピクチャを表し、Pは、P(Predictive)ピクチャを表す。
図7のAは、図5の抽出部41が出力する左眼用符号化データと、右眼用符号化データとを示している。
左眼用符号化データにおいては、シーンの先頭のピクチャは、Iピクチャ(IDRピクチャ)になっており、他のピクチャは、Pピクチャになっている。右眼用符号化データについても同様である。
図7のBは、図7のAの左眼用符号化データと、右眼用符号化データとが多重化された状態の多重化データを示している。
図7のBでは、左眼用符号化データと、右眼用符号化データとが、シーンごとに多重化されている。さらに、図7のBでは、シーンに対して設定されたビュースイッチングフラグが、多重化データに含まれている。図7のBでは、シーン#1には、値が0のビュースイッチングフラグが設定されており、シーン#2には、値が1のビュースイッチングフラグが設定されている。
図7のCは、2次元画像として表示されるピクチャを示している。
シーン#1には、値が0のビュースイッチングフラグが設定されており、この場合、図5の選択部44は、抽出部41から供給される左眼用符号化データ、又は、右眼用符号化データのうちの、左眼用符号化データを選択して、復号部45に供給する。
したがって、この場合、2次元表示デバイスでは、シーン#1については、左眼用符号化データを復号して得られる画像データに対応する左眼用画像が表示される。
一方、シーン#2には、値が1のビュースイッチングフラグが設定されており、この場合、選択部44は、抽出部41から供給される左眼用符号化データ、又は、右眼用符号化データのうちの、右眼用符号化データを選択して、復号部45に供給する。
したがって、この場合、2次元表示デバイスでは、シーン#2については、右眼用符号化データを復号して得られる画像データに対応する右眼用画像が表示される。
[復号装置の処理の説明]
図8Aおよび図8Bを参照して、図5の復号装置の処理(復号処理)を説明する。
図8Aは、立体視画像の表示が行われる場合の、図5の復号装置の復号処理を説明するフローチャートである。
立体視画像の表示が行われる場合、ステップS21において、抽出部41は、そこに供給される多重化データから、左眼用符号化データ、及び、右眼用符号化データを分離する。さらに、抽出部41は、左眼用符号化データを、復号部421に、右眼用符号化データを、復号部422に、それぞれ供給して、処理は、ステップS21からステップS22に進む。
ステップS22では、多重化データに多重化されているすべての符号化データが復号され、処理は、ステップS23に進む。
すなわち、復号部421は、抽出部41からの左眼用符号化データを復号し、その結果得られる左眼用視点画像データを、立体視画像変換部43に供給する。さらに、復号部422は、抽出部41からの右眼用符号化データを復号し、その結果得られる右眼用視点画像データを、立体視画像変換部43に供給する。
ステップS23では、立体視画像変換部43は、復号部421からの左眼用視点画像データ、及び、復号部422からの右眼用視点画像データを、立体視画像データに変換し、図示せぬ立体視用デバイスに供給して、処理は、ステップS24に進む。
ステップS24では、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS21に戻り、以下、ステップS21ないしS24の処理が繰り返される。
また、ステップS24において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
図8Bは、2次元画像の表示が行われる場合の、図5の復号装置の復号処理を説明するフローチャートである。
2次元画像の表示が行われる場合、ステップS31において、抽出部41は、そこに供給される多重化データから、ビュースイッチングフラグを抽出し、選択部44に供給して、処理は、ステップS32に進む。
ステップS32では、抽出部41は、多重化データから、左眼用符号化データ、及び、右眼用符号化データを分離し、選択部44に供給して、処理は、ステップS33に進む。
ステップS33では、選択部44は、抽出部41からのビュースイッチングフラグが0又は1のうちのいずれであるかを判定する。
ステップS33において、ビュースイッチングフラグが0であると判定された場合、すなわち、2次元画像の表示に用いる画像データとして、左眼用画像データが指定されている場合、処理は、ステップS34に進み、選択部44は、抽出部41からの左眼用符号化データ、又は、右眼用符号化データのうちの左眼用符号化データを選択符号化データとして選択し、復号部45に供給して、処理は、ステップS36に進む。
この場合、ステップS36では、復号部45は、選択部44から供給される左眼用符号化データ(選択符号化データ)を復号し、その結果得られる左眼用視点画像データを、図示せぬ2次元表示デバイスに供給して、処理は、ステップS37に進む。
したがって、この場合、2次元表示デバイスでは、2次元画像として、左眼用視点画像データに対応する左眼用画像が表示される。
一方、ステップS33において、ビュースイッチングフラグが1であると判定された場合、すなわち、2次元画像の表示に用いる画像データとして、右眼用画像データが指定されている場合、処理は、ステップS35に進み、選択部44は、抽出部41からの左眼用符号化データ、又は、右眼用符号化データのうちの右眼用符号化データを選択符号化データとして選択し、復号部45に供給して、処理は、ステップS36に進む。
この場合、ステップS36では、復号部45は、選択部44から供給される右眼用符号化データ(選択符号化データ)を復号し、その結果得られる右眼用視点画像データを、図示せぬ2次元表示デバイスに供給して、処理は、ステップS37に進む。
したがって、この場合、2次元表示デバイスでは、2次元画像として、右眼用視点画像データに対応する右眼用画像が表示される。
ステップS37では、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS31に戻り、以下、ステップS31ないしS37の処理が繰り返される。
ここで、ステップS31ないしS37の処理は、ビュースイッチングフラグが設定されるシーン等の単位で行われる。
一方、ステップS37において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
以上のように、図1の符号化装置では、2個の視点の画像データである左眼用視点画像データ及び右眼用視点画像データと、ビュースイッチングフラグとを含む多重化データが生成される。そして、図5の復号装置では、その多重化データから、ビュースイッチングフラグが抽出され、そのビュースイッチングフラグに従い、左眼用視点画像データと右眼用視点画像データとから、2次元画像の表示に用いる画像データがシーン単位等で選択される。
したがって、ビュースイッチングフラグによって、2次元画像の表示に用いる画像データをシーン単位等で指定することができるので、ステレオ画像のコンテンツを、2次元画像として表示する場合に、左眼用画像、又は、右眼用画像のうちの、コンテンツの制作者が意図する画像をシーン単位等で表示することができる。
なお、ビュースイッチングフラグは、2次元画像の表示に用いる画像データを指定するフラグであるが、図5の復号装置では、ビュースイッチングフラグに従い、2次元画像として表される画像が、左眼用画像、又は、右眼用画像に切り替えられる。したがって、図5の復号装置では、ビュースイッチングフラグは、2次元画像として表される画像を切り替えるフラグとして機能する。
<第2実施の形態>
[符号化装置の第2実施の形態]
図9は、本発明を適用した符号化装置の第2実施の形態の構成例を示すブロック図である。
なお、図中、図1の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
図9の符号化装置は、符号化部111及び112、フラグ設定部12、及び、生成部13を有する点で、図1の場合と共通し、入れ替え部71をさらに有する点で、図1の場合と相違する。
入れ替え部71には、ステレオ画像の左眼用視点画像データ及び右眼用視点画像データが供給される。
また、入れ替え部71には、フラグ設定部12からビュースイッチングフラグが供給される。
入れ替え部71は、フラグ設定部12からのビュースイッチングフラグに従い、2個の視点の画像データである左眼用視点画像データ及び右眼用視点画像データのうちの1個の視点の画像データを、他の視点の画像データと入れ替えることにより、2個の視点の画像データを、2次元画像の表示に用いる画像データである1個の基本画像データと、2次元画像の表示に用いない画像データである1個の追加画像データとに変換する。
なお、入れ替え部71は、基本画像データを、符号化部111に供給し、追加画像データを、符号化部112に供給する。
このため、図9では、符号化部111は、左眼用視点画像データに代えて、入れ替え部71からの基本画像データを符号化し、その結果得られる符号化データ(以下、基本符号化データともいう)を、生成部13に供給する。
また、符号化部112は、右眼用視点画像データに代えて、入れ替え部71からの追加画像データを符号化し、その結果得られる符号化データ(以下、追加符号化データともいう)を、生成部13に供給する。
そして、生成部13は、符号化部111からの基本符号化データと、符号化部112からの追加符号化データとを多重化して多重化データとし、その多重化データのヘッダ等に、フラグ設定部12からのビュースイッチングフラグを含める。
すなわち、図9において、生成部13で得られる多重化データには、基本画像データ及び追加画像データ、並びに、ビュースイッチングフラグが含まれる。
[入れ替え部71の処理の説明]
図10を参照して、図9の入れ替え部71の処理について説明する。
いま、図9の符号化装置での符号化の対象のステレオ画像が、図3に示したように、シーン#1,#2,#3から構成されることとする。
さらに、ステレオ画像が、2次元画像として表示される場合に、ステレオ画像の制作者が、2次元画像として表示される画像(提示画像)として、シーン#1については、左眼用画像を、シーン#2については、右眼用画像を、シーン#3については、左眼用画像を、それぞれ選択するように、フラグ設定部12を操作したこととする。
この場合、フラグ設定部12は、シーン#1及び#3については、左眼用画像を提示画像として指定する値である、例えば、0を、ビュースイッチングフラグとして設定する。
また、フラグ設定部12は、シーン#2については、左眼用画像を提示画像として指定する値である、例えば、1を、ビュースイッチングフラグとして設定する。
ここで、以上のことは、図3で説明したことと同様である。
入れ替え部71は、上述したように、ビュースイッチングフラグに従い、2個の視点の画像データである左眼用視点画像データ及び右眼用視点画像データのうちの1個の視点の画像データを、他の視点の画像データと入れ替えることにより、2個の視点の画像データを、2次元画像の表示に用いる画像データである1個の基本画像データと、2次元画像の表示に用いない画像データである1個の追加画像データとに変換する。
すなわち、入れ替え部71は、左眼用視点画像データ及び右眼用視点画像データのうちの1個である、例えば、左眼用視点画像データのシーンのうちの、ビュースイッチングフラグが左眼用視点画像データを指定していないシーン、つまり、右眼用視点画像データを指定するシーンについては、そのシーンの左眼用視点画像データを、右眼用視点画像データに入れ替える(左眼用視点画像データと、右眼用視点画像データとを、互いに入れ替える)。
図10では、左眼用視点画像データのシーン#1ないし#3のうちの、シーン#2が、ビュースイッチングフラグによって右眼用視点画像データが指定されているシーンになっているので、左眼用視点画像データのシーン#1ないし#3のうちの、シーン#2のデータが、右眼用視点画像データのシーン#2のデータと入れ替えられ、その入れ替え後の画像データが、基本画像データとされる。
そして、右眼用視点画像データのシーン#1ないし#3のうちの、シーン#2のデータが、左眼用視点画像データのシーン#2のデータと入れ替えられ、その入れ替え後の画像データが、追加画像データとされる。
この場合、基本画像データにおいては、シーン#1及び#3のデータは、左眼用視点画像データとなっており、シーン#2のデータは、右眼用視点画像データになっている。そして、基本画像データは、2次元画像の表示に用いる画像データとしてビュースイッチングフラグが指定するデータになっている。
したがって、ステレオ画像を2次元画像として表示する場合には、基本画像データに対応する画像を表示することで、コンテンツの制作者が意図する画像をシーン単位等で表示することができる。
一方、追加画像データにおいては、シーン#1及び#3のデータは、右眼用視点画像データとなっており、シーン#2のデータは、左眼用視点画像データになっている。
追加画像データは、2次元画像の表示には必要がなく、立体視画像(ステレオ画像)を表示するときに、基本画像データとともに用いられる。
[符号化装置の処理の説明]
図11を参照して、図9の符号化装置の処理(符号化処理)を説明する。
図9の符号化装置では、フラグ設定部12が、ステレオ画像の制作者によって操作されると、ステップS51において、フラグ設定部12が、ステレオ画像の制作者の操作に従って、ステレオ画像の各シーンに対するビュースイッチングフラグを設定し、生成部13及び入れ替え部71に供給する。
その後、符号化装置に対して、ステレオ画像の画像データである左眼用視点画像データ、及び、右眼用視点画像データが供給されるのを待って、処理は、ステップS51からステップS52に進み、入れ替え部71は、フラグ設定部12からのビュースイッチングフラグに従い、図10で説明したように、左眼用視点画像データを、右眼用画像データと入れ替えることにより、左眼用視点画像データ、及び、右眼用画像データを、1個の基本画像データと、1個の追加画像データとに変換する(左眼用視点画像データ、及び、右眼用画像データから、基本画像データ、及び、追加画像データを生成する)。
なお、ここでは、左眼用視点画像データを、右眼用画像データと入れ替えることにより、左眼用視点画像データ、及び、右眼用画像データを、基本画像データ、及び、追加画像データに変換することとしたが、逆に、右眼用視点画像データを、左眼用画像データと入れ替えることにより、左眼用視点画像データ、及び、右眼用画像データを、基本画像データ、及び、追加画像データに変換することも可能である。
また、左眼用視点画像データと、右眼用画像データとの入れ替えは、例えば、ビュースイッチングフラグが設定される単位と同一のシーン単位等で行うことができる。
ステップS52の処理後、入れ替え部71は、基本画像データを符号化部111に供給するとともに、追加画像データを符号化部112に供給する。
そして、その後、処理は、ステップS53ないしS55に順次進み、図4のステップS12ないしS14の場合とそれぞれ同様の処理が行われる。
すなわち、ステップS53では、符号化部111が、入れ替え部71からの基本画像データを符号化し、その結果得られる基本符号化データを、生成部13に供給する。さらに、ステップS53では、符号化部112が、入れ替え部71からの追加画像データを符号化し、その結果得られる追加符号化データを、生成部13に供給して、処理は、ステップS54に進む。
ステップS54では、生成部13は、符号化部111からの基本符号化データと、符号化部112からの追加符号化データとを多重化し、多重化データとする。さらに、生成部13は、多重化データのヘッダに、フラグ設定部12からのビュースイッチングフラグを含め、多重化データを出力する。
そして、処理は、ステップS54からステップS55に進み、符号化装置は、まだ符号化すべきステレオ画像の画像データがあるかどうかを判定し、あると判定された場合、処理は、ステップS52に戻り、以下、ステップS52ないしS55の処理が繰り返される。
一方、ステップS55において、符号化すべきステレオ画像の画像データがないと判定された場合、符号化装置は、符号化処理を終了する。
以上のようにして、生成部13が出力する多重化データ、すなわち、ステレオ画像の画像データを変換した基本画像データ及び追加画像データ(を符号化した符号化データ)と、ビュースイッチングフラグとを含むビットストリームは、例えば、伝送媒体を介して伝送され、又は、記録媒体に記録される。
[復号装置の第2実施の形態]
図12は、本発明を適用した復号装置の第2実施の形態の構成例を示すブロック図である。
なお、図中、図5の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
図12の復号装置は、抽出部41、復号部421及び422、並びに、立体視画像変換部43を有する点で、図5の場合と共通する。但し、図12の復号装置は、図5の選択部44及び復号部45が設けられていない点、並びに、復元部81が新たに設けられている点で、図5の場合と相違する。
図12において、復号装置は、図9の符号化装置が出力する多重化データを復号する。
ここで、図9の符号化装置が出力する多重化データは、左眼用符号化データ、及び、右眼用符号化データに代えて、基本符号化データ、及び、追加符号化データを含んでいる。
このため、図12の復号装置では、抽出部41は、多重化データから、基本符号化データ、及び、追加符号化データを分離する。そして、抽出部41は、基本符号化データを復号部421に、追加符号化データを復号部422に、それぞれ供給する。
復号部421は、左眼用符号化データに代えて、抽出部41からの基本符号化データを復号する。また、復号部422は、右眼用符号化データに代えて、抽出部41からの追加符号化データを復号する。
復号部421が基本符号化データを復号することにより得られる基本画像データと、復号部422が追加符号化データを復号することにより得られる追加画像データとは、復元部81に供給される。
ここで、ステレオ画像が2次元画像として表示される場合には、復号部421が基本符号化データを復号することにより得られる基本画像データが、図示せぬ2次元表示デバイスに供給される。そして、2次元表示デバイスでは、復号部421からの基本画像データに対応する画像が表示される。
復元部81には、上述のように、復号部421から基本画像データが供給されるとともに、復号部422から追加画像データが供給される他、多重化データから抽出されたビュースイッチングフラグが、抽出部41から供給される。
復元部81は、抽出部41からのビュースイッチングフラグに従い、復号部421からの基本画像データを、復号部422からの追加画像データと入れ替えることで、基本画像データ、及び、追加画像データを、元の左眼用画像データ、及び、右眼用画像データに変換する。
すなわち、復元部81は、抽出部41からのビュースイッチングフラグに従い、基本画像データ、及び、追加画像データを対象に、図9の入れ替え部71の場合と逆の入れ替えを行うことで、左眼用画像データ、及び、右眼用画像データを復元する。
そして、復元部81は、左眼用画像データ、及び、右眼用画像データを、立体視画像変換部43に供給する。
[復号装置の処理の説明]
図13Aおよび図13Bを参照して、図12の復号装置の処理(復号処理)を説明する。
図13Aは、立体視画像の表示が行われる場合の、図12の復号装置の復号処理を説明するフローチャートである。
立体視画像の表示が行われる場合、ステップS61において、抽出部41は、そこに供給される多重化データから、ビュースイッチングフラグを抽出し、復元部81に供給して、処理は、ステップS62に進む。
ステップS62では、抽出部41は、多重化データから、基本符号化データ、及び、追加符号化データを分離し、基本符号化データを、復号部421に、追加符号化データを、復号部422に、それぞれ供給して、処理は、ステップS63に進む。
ステップS63では、多重化データに多重化されているすべての符号化データが復号され、処理は、ステップS64に進む。
すなわち、復号部421は、抽出部41からの基本符号化データを復号し、その結果得られる基本画像データを、復元部81に供給する。さらに、復号部422は、抽出部41からの追加符号化データを復号し、その結果得られる追加画像データを、復元部81に供給する。
ステップS64では、復元部81は、抽出部41からのビュースイッチングフラグに従い、基本画像データ、及び、追加画像データを対象に、図9の入れ替え部71の場合と逆の入れ替えを行い、これにより、左眼用画像データ、及び、右眼用画像データを復元する。
そして、復元部81は、左眼用画像データ、及び、右眼用画像データを、立体視変換部43に供給する。
その後、処理は、ステップS64からステップS65及びS66に順次進み、図8AのステップS23及びS24の場合とそれぞれ同様の処理が行われる。
すなわち、ステップS65では、立体視画像変換部43は、復元部81からの左眼用視点画像データ、及び、右眼用視点画像データを、立体視画像データに変換し、図示せぬ立体視用デバイスに供給して、処理は、ステップS66に進む。
ステップS66では、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS61に戻り、以下、ステップS61ないしS66の処理が繰り返される。
また、ステップS66において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
図13Bは、2次元画像の表示が行われる場合の、図12の復号装置の復号処理を説明するフローチャートである。
2次元画像の表示が行われる場合、ステップS71において、抽出部41は、そこに供給される多重化データから、基本符号化データを分離し、復号部421に供給して、処理は、ステップS72に進む。
ステップS72では、復号部421は、抽出部41から供給される基本符号化データを復号し、その結果得られる基本画像データを、図示せぬ2次元表示デバイスに供給する。
したがって、2次元表示デバイスでは、2次元画像として、基本画像データに対応する画像が表示される。
その後、処理は、ステップS72からステップS73に進み、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS71に戻り、以下、ステップS71ないしS73の処理が繰り返される。
一方、ステップS73において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
以上のように、図9の符号化装置では、2次元画像の表示に用いる画像データを指定するビュースイッチングフラグに従い、左眼用画像データ又は右眼用画像データのうちの、一方を、他方と入れ替えることにより、左眼用画像データ、及び、右眼用画像データが、基本画像データと追加画像データとに変換され、基本画像データ、及び、追加画像データと、ビュースイッチングフラグとを含む多重化データが生成される。
したがって、図12の復号装置では、ステレオ画像のコンテンツを、2次元画像として表示する場合に、基本画像データに対応する画像を表示することにより、左眼用画像、又は、右眼用画像のうちの、コンテンツの制作者が意図する画像をシーン単位等で表示することができる。
また、図12の復号装置では、その多重化データから、ビュースイッチングフラグが抽出され、そのビュースイッチングフラグに従い、基本画像データ、及び、追加画像データが、元の左眼用視点画像データと右眼用視点画像データとに復元される。
したがって、立体視用デバイスにおいて、ステレオ画像を表示することができる。
なお、ビュースイッチングフラグは、2次元画像の表示に用いる画像データを指定するフラグであるが、図12の復号装置では、ビュースイッチングフラグに従い、基本画像データ、及び、追加画像データのそれぞれから、左眼用視点画像データと、右眼用視点画像データとが分離される。したがて、図12の復号装置では、基本画像データ、及び、追加画像データの中の、左眼用視点画像データと、右眼用視点画像データとのそれぞれを指定するフラグとして機能する。
また、図9の符号化装置では、ステレオ画像の画像データである左眼用視点画像データ及び右眼用視点画像データは、基本画像データと追加画像データとにされてから、その基本画像データと追加画像データとのそれぞれが符号化される。
したがって、基本画像データ全体については、復号画像の画質の劣化を抑制するような符号化パラメータ(量子化パラメータやエントロピー符号化方式など)を採用して、符号化を行うことができる。
すなわち、左眼用視点画像データと、右眼用視点画像データとのそれぞれを符号化する場合には、左眼用視点画像データと、右眼用視点画像データとのうちの一方について、復号画像の画質の劣化を抑制する符号化パラメータを採用しても、復号装置において、2次元画像として表示される画像全体の画質の劣化が抑制されるとは限らない。
これに対して、図9の符号化装置では、基本画像データと追加画像データとのそれぞれが符号化されるため、2次元画像の表示に用いられる基本画像データの符号化に、復号画像の画質の劣化を抑制する符号化パラメータを採用することにより、復号装置において、2次元画像として表示される画像全体の画質の劣化を抑制することができる。
以上、第1実施の形態及び第2実施の形態では、2個の視点の画像データである左眼用視点画像データと右眼用視点画像データからなるステレオ画像の画像データを、符号化の対象としたが、符号化の対象としては、2個を超えるN個の視点の画像データを採用することができる。
そこで、以下では、2個を超えるN個の視点の画像データを符号化の対象とする実施の形態について説明する。
<第3実施の形態>
[符号化装置の第3実施の形態]
図14は、本発明を適用した符号化装置の第3実施の形態の構成例を示すブロック図である。
なお、図14において、図1の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
図14の符号化装置は、2個の符号化部111及び112に代えて、N個の符号化部111,112,・・・,11Nが設けられていることを除いて、図1の場合と同様に構成されている。
図14において、符号化装置は、3個以上のN個の視点の画像データ(以下、視点画像データともいう)からなる立体視画像の画像データを符号化する。
すなわち、立体視画像の画像データのうちの、n番目の視点の画像データである第n視点画像データは、符号化部11nに供給される。
符号化部11nは、そこに供給される第n視点画像データを、例えば、MPEG2やAVC/H.264方式等の所定の符号化方式に従って符号化し、その結果得られる符号化データ(以下、第n視点符号化データともいう)を、生成部13に供給する。
フラグ設定部12は、例えば、立体視画像の制作者等のユーザの操作等に応じて、立体視画像のN個の視点画像データのうちの、2次元画像の表示に用いる画像データを指定するフラグであるビュースイッチングフラグを設定し、生成部13に供給する。
なお、第1実施の形態、及び、第2実施の形態では、ビュースイッチングフラグは、上述したように、1ビットのフラグを採用することができるが、第3実施の形態(及び、後述する第4実施の形態)では、ビュースイッチングフラグは、log2N以上のビット数のフラグを採用することができる。
ここで、2次元画像の表示に用いる画像データが、第n視点画像データである場合、ビュースイッチングフラグの値は、例えば、n-1とされることとする。なお、第n視点画像データを撮影したカメラに、そのカメラを識別するためのインデクスが付されている場合には、第n視点画像データを、2次元画像の表示に用いる画像データに指定するビュースイッチングフラグの値としては、その第n視点画像データを撮影したカメラのインデクスを採用することができる。
生成部13は、立体視画像の画像データと、ビュースイッチングフラグとを含むビットストリームを生成して出力する。
すなわち、生成部13は、符号化部111ないし11Nそれぞれからの第1視点符号化データないし第N視点符号化データを多重化して多重化データとし、その多重化データのヘッダ等に、フラグ設定部12からのビュースイッチングフラグを含める。
[符号化装置の処理の説明]
図15を参照して、図14の符号化装置の処理(符号化処理)を説明する。
図14の符号化装置では、フラグ設定部12が、立体視画像の制作者によって操作されると、ステップS101において、フラグ設定部12が、立体視画像の制作者の操作に従って、立体視画像の各シーンに対するビュースイッチングフラグを設定し、生成部13に供給する。
その後、符号化装置に対して、立体視画像の画像データである第1視点画像データないし第N視点画像データが供給されるのを待って、処理は、ステップS101からステップS102に進み、符号化部111ないし11Nは、符号化を行う。
すなわち、符号化部11nは、第n視点画像データを符号化し、その結果得られる第n視点符号化データを、生成部13に供給する。
その後、処理は、ステップS102からステップS103に進み、生成部13は、符号化部111ないし11Nそれぞれからの第1視点符号化データないし第N視点符号化データを多重化し、多重化データとする。さらに、生成部13は、多重化データのヘッダに、フラグ設定部12からのビュースイッチングフラグを含め、多重化データを出力する。
そして、処理は、ステップS103からステップS104に進み、符号化装置は、まだ符号化すべき立体視画像の画像データがあるかどうかを判定し、あると判定された場合、処理は、ステップS102に戻り、以下、ステップS102ないしS104の処理が繰り返される。
一方、ステップS104において、符号化すべき立体視画像の画像データがないと判定された場合、符号化装置は、符号化処理を終了する。
以上のようにして、生成部13が出力する多重化データ、すなわち、立体視画像の画像データ(を符号化した符号化データ)と、ビュースイッチングフラグとを含むビットストリームは、例えば、伝送媒体を介して伝送され、又は、記録媒体に記録される。
[復号装置の第3実施の形態]
図16は、本発明を適用した復号装置の第3実施の形態の構成例を示すブロック図である。
なお、図16において、図5の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
図16の復号装置は、復号部421及び422に代えて、N個の復号部421,422,・・・,42Nが設けられている他は、図5の場合と同様に構成されている。
図16において、復号装置は、図14の符号化装置が出力する多重化データを復号する。
すなわち、抽出部41は、そこに供給される多重化データから、ビュースイッチングフラグを抽出し、選択部44に供給する。
また、抽出部41は、多重化データから、第1視点符号化データないし第N視点符号化データを分離し、第n視点符号化データを、復号部42nに供給する。
さらに、抽出部41は、第1視点符号化データないし第N視点符号化データのすべてを、選択部44に供給する。
復号部42nは、抽出部41からの第n視点符号化データを復号し、その結果得られる第n視点画像データを、立体視画像変換部43に供給する。
立体視画像変換部43は、復号部421ないし42Nそれぞれから供給される第1視点画像データないし第N視点画像データを、立体視画像データに変換し、図示せぬ立体視用デバイスに供給する。
選択部44は、抽出部41から供給される、シーン等ごとのビュースイッチングフラグに従い、同じく抽出部41から供給される第1視点符号化データないし第N視点符号化データのうちの1つを、2次元画像の表示に用いる画像データの符号化データとして選択し、選択符号化データとして、復号部45に供給する。
復号部45は、選択部44から供給される選択符号化データを復号し、その結果得られる画像データ(第1視点画像データないし第N視点画像データのうちのいずれか)を、図示せぬ2次元表示デバイスに供給する。
[復号装置の処理の説明]
図17Aおよび図17Bを参照して、図16の復号装置の処理(復号処理)を説明する。
図17Aは、立体視画像の表示が行われる場合の、図16の復号装置の復号処理を説明するフローチャートである。
立体視画像の表示が行われる場合、ステップS111において、抽出部41は、そこに供給される多重化データから、第1視点符号化データないし第N視点符号化データのそれぞれを分離する。さらに、抽出部41は、第n視点符号化データを、復号部42nに供給して、処理は、ステップS111からステップS112に進む。
ステップS112では、多重化データに多重化されている第1視点符号化データないし第N視点符号化データのすべてが復号され、処理は、ステップS113に進む。
すなわち、復号部42nは、抽出部41からの第n視点符号化データを復号し、その結果得られる第n視点画像データを、立体視画像変換部43に供給する。
ステップS113では、立体視画像変換部43は、復号部421ないし42Nそれぞれから供給される第1視点画像データないし第N視点画像データを、立体視画像データに変換し、図示せぬ立体視用デバイスに供給して、処理は、ステップS114に進む。
ステップS114では、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS111に戻り、以下、ステップS111ないしS114の処理が繰り返される。
また、ステップS114において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
図17Bは、2次元画像の表示が行われる場合の、図16の復号装置の復号処理を説明するフローチャートである。
2次元画像の表示が行われる場合、ステップS121において、抽出部41は、そこに供給される多重化データから、ビュースイッチングフラグを抽出し、選択部44に供給して、処理は、ステップS122に進む。
ステップS122では、抽出部41は、多重化データから、第1視点符号化データないし第N視点符号化データを分離し、選択部44に供給して、処理は、ステップS123に進む。
ステップS123では、選択部44は、抽出部41からのビュースイッチングフラグに従い、抽出部41からの第1視点符号化データないし第N視点符号化データのうちの1つを、選択符号化データとして選択する。
すなわち、選択部44は、抽出部41からのビュースイッチングフラグの値がn-1である場合、抽出部41からの第1視点符号化データないし第N視点符号化データのうちの、第n視点符号化データを、選択符号化データとして選択する。
そして、選択部44は、選択符号化データを、復号部45に供給して、処理は、ステップS123からステップS124に進む。
ステップS124では、復号部45は、選択部44から供給される選択符号化データを復号し、その結果得られる画像データを、図示せぬ2次元表示デバイスに供給して、処理は、ステップS125に進む。
ステップS125では、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS121に戻り、以下、ステップS121ないしS125の処理が繰り返される。
一方、ステップS125において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
以上のように、図14の符号化装置では、N個の視点の画像データである第1視点画像データないし第N視点画像データと、ビュースイッチングフラグとを含む多重化データが生成される。そして、図16の復号装置では、その多重化データから、ビュースイッチングフラグが抽出され、そのビュースイッチングフラグに従い、第1視点画像データないし第N視点画像データから、2次元画像の表示に用いる画像データがシーン等の単位で選択される。
したがって、ビュースイッチングフラグによって2次元画像の表示に用いる画像データを指定することができるので、立体視画像のコンテンツを、2次元画像として表示する場合に、第1視点画像データないし第N視点画像データのうちの、コンテンツの制作者が意図する画像をシーン単位等で表示することができる。
<第4実施の形態>
[符号化装置の第4実施の形態]
図18は、本発明を適用した符号化装置の第4実施の形態の構成例を示すブロック図である。
なお、図中、図9又は図14の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
図18の符号化装置は、符号化部111及び112に代えて、N個の符号化部111,112,・・・,11Nが設けられていることを除いて、図9の場合と同様に構成されている。
入れ替え部71には、立体視画像の第1視点画像データないし第N視点画像データが供給される。
入れ替え部71は、フラグ設定部12からのビュースイッチングフラグに従い、N個の視点の画像データである第1視点画像データないし第N視点画像データのうちの1個の視点の画像データを、他の視点の画像データと入れ替えることにより、N個の第1視点画像データないし第N視点画像データを、2次元画像の表示に用いる画像データである1個の基本画像データと、2次元画像の表示に用いない画像データであるN-1個の追加画像データ#1ないし#N-1とに変換する。
なお、入れ替え部71は、基本画像データを、符号化部111に供給し、追加画像データ#nを、符号化部11n+1に供給する。
このため、図18では、符号化部111は、入れ替え部71からの基本画像データを符号化し、その結果得られる符号化データ(基本符号化データ)を、生成部13に供給する。
また、符号化部11n+1は、入れ替え部71からの追加画像データ#nを符号化し、その結果得られる符号化データ(以下、追加符号化データ#nともいう)を、生成部13に供給する。
そして、生成部13は、符号化部111からの基本符号化データと、符号化部112ないし11Nそれぞれからの追加符号化データ#1ないし#N-1とを多重化して多重化データとし、その多重化データのヘッダ等に、フラグ設定部12からのビュースイッチングフラグを含める。
したがって、図18において、生成部13で得られる多重化データには、1個の基本画像データ、及び、N-1個の追加画像データ#1ないし#N-1、並びに、ビュースイッチングフラグが含まれる。
[入れ替え部71の処理の説明]
図19を参照して、図18の入れ替え部71の処理について説明する。
なお、以下、第n視点画像データに対応する画像を、第n視点画像ともいう。
いま、図18の符号化装置での符号化の対象の立体視画像が、例えば、シーン#1,#2,#3,#4,#5から構成され、また、立体視画像の画像データが、3個の視点の画像データである第1視点画像データ、第2視点画像データ、及び、第3視点画像データからなることとする。
さらに、立体視画像が、2次元画像として表示される場合に、立体視画像の制作者が、2次元画像として表示される画像(提示画像)として、図中、太線の枠で囲んで示すように、シーン#1及びシーン#4については、第1視点画像を、シーン#2及び#3については、第2視点画像を、シーン#5については、第3視点画像を、それぞれ選択するように、フラグ設定部12を操作したこととする。
この場合、フラグ設定部12は、シーン#1及び#4については、第1視点画像を提示画像として指定する値である、例えば、0を、ビュースイッチングフラグとして設定する。
また、フラグ設定部12は、シーン#2及び#3については、第2視点画像を提示画像として指定する値である、例えば、1を、ビュースイッチングフラグとして設定する。
さらに、フラグ設定部12は、シーン#5については、第3視点画像を提示画像として指定する値である、例えば、2を、ビュースイッチングフラグとして設定する。
入れ替え部71は、上述したように、ビュースイッチングフラグに従い、3個の視点の画像データである第1視点画像データないし第3視点画像データのうちの1個の視点の画像データと、他の視点の画像データとを、ビュースイッチングフラグが設定されたシーン等の単位で入れ替えることにより、3個の第1視点画像データないし第3視点画像データを、1個の基本画像データと、2個の追加画像データ#1及び#2とに変換する。
すなわち、入れ替え部71は、3個の第1視点画像データないし第3視点画像データのうちの1個である、例えば、第2視点画像データを基準として、その第2視点画像データのシーンのうちの、ビュースイッチングフラグが基準である第2視点画像データを指定していないシーン、つまり、第1視点画像データ又は第3視点画像データを指定するシーンについては、そのシーンの第2視点画像データを、ビュースイッチングフラグが指定する画像データに入れ替える。
図19では、基準である第2視点画像データのシーン#1ないし#5のうちの、シーン#1及び#4が、ビュースイッチングフラグが第2視点画像データではない第1視点画像データを指定するシーンになっている。このため、第2視点画像データのシーン#1ないし#5のうちの、シーン#1及び#4のデータが、第1視点画像データのシーン#1及び#4のデータとそれぞれ入れ替えられる。
さらに、図19では、基準である第2視点画像データのシーン#1ないし#5のうちの、シーン#5が、ビュースイッチングフラグが第2視点画像データではない第3視点画像データを指定するシーンになっている。このため、第2視点画像データのシーン#1ないし#5のうちの、シーン#5のデータが、第3視点画像データのシーン#5のデータと入れ替えられる。
そして、第2視点画像データについて、シーンの画像データが基準以外の第1視点画像データ又は第3視点画像データと入れ替えられることにより得られる画像データが、基本画像データとされる。
また、第1視点画像データについて、シーンの画像データが基準である第2視点画像データと入れ替えられることにより得られる画像データが、追加画像データ#1とされる。さらに、第3視点画像データについて、シーンの画像データが基準である第2視点画像データと入れ替えられることにより得られる画像データが、追加画像データ#2とされる。
この場合、基本画像データにおいては、シーン#1及び#4のデータは、第1視点画像データに、シーン#2及び#3のデータは、第2視点画像データに、シーン#5のデータは、第3視点画像データに、それぞれなっている。
すなわち、基本画像データは、2次元画像の表示に用いる画像データとしてビュースイッチングフラグが指定するデータになっている。
したがって、立体視画像を2次元画像として表示する場合には、基本画像データに対応する画像を表示するだけで、コンテンツの制作者が意図する画像をシーン単位等で表示することができる。
一方、追加画像データ#1においては、シーン#1及び#4のデータは、第2視点画像データに、シーン#2,#3、及び#5のデータは、第1視点画像データに、それぞれなっている。
さらに、追加画像データ#2においては、シーン#1ないし#4のデータは、第3視点画像データに、シーン#5のデータは、第2視点画像データに、それぞれなっている。
追加画像データ#1及び#2は、2次元画像の表示には必要がなく、立体視画像(立体視画像)を表示するときに、基本画像データとともに用いられる。
[符号化装置の処理の説明]
図20を参照して、図18の符号化装置の処理(符号化処理)を説明する。
図18の符号化装置では、フラグ設定部12が、立体視画像の制作者によって操作されると、ステップS141において、フラグ設定部12が、立体視画像の制作者の操作に従って、立体視画像の各シーンに対するビュースイッチングフラグを設定し、生成部13及び入れ替え部71に供給する。
その後、符号化装置に対して、立体視画像の画像データである第1視点画像データないし第N視点画像データが供給されるのを待って、処理は、ステップS141からステップS142に進み、入れ替え部71は、フラグ設定部12からのビュースイッチングフラグに従い、図19で説明したように、第1視点画像データないし第N視点画像データのうちの、1個の視点の画像データを、他の視点の画像データと入れ替えることにより、第1視点画像データないし第N視点画像データを、1個の基本画像データと、N-1個の追加画像データ#1ないし#N-1とに変換する(第1視点画像データないし第N視点画像データから、1個の基本画像データと、N-1個の追加画像データ#1ないし#N-1とを生成する)。
ステップS142の処理後、入れ替え部71は、基本画像データを符号化部111に供給するとともに、追加画像データ#nを符号化部11n+1に供給する。
その後、処理は、ステップS143に進み、符号化部111が、入れ替え部71からの基本画像データを符号化し、その結果得られる基本符号化データを、生成部13に供給する。さらに、ステップS143では、符号化部11n+1が、入れ替え部71からの追加画像データ#nを符号化し、その結果得られる追加符号化データ#nを、生成部13に供給して、処理は、ステップS144に進む。
ステップS144では、生成部13は、符号化部111からの基本符号化データと、符号化部112ないし11Nそれぞれからの追加符号化データ#1ないし#N-1とを多重化し、多重化データとする。さらに、生成部13は、多重化データのヘッダに、フラグ設定部12からのビュースイッチングフラグを含め、多重化データを出力する。
そして、処理は、ステップS144からステップS145に進み、符号化装置は、まだ符号化すべき立体視画像の画像データがあるかどうかを判定し、あると判定された場合、処理は、ステップS142に戻り、以下、ステップS142ないしS145の処理が繰り返される。
一方、ステップS145において、符号化すべき立体視画像の画像データがないと判定された場合、符号化装置は、符号化処理を終了する。
以上のようにして、生成部13が出力する多重化データ、すなわち、立体視画像の画像データを変換した1個の基本画像データ、及び、N-1個の追加画像データ(を符号化した符号化データ)と、ビュースイッチングフラグとを含むビットストリームは、例えば、伝送媒体を介して伝送され、又は、記録媒体に記録される。
[復号装置の第4実施の形態]
図21は、本発明を適用した復号装置の第4実施の形態の構成例を示すブロック図である。
なお、図中、図12又は図16の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。
図21の復号装置は、復号部421及び422に代えて、N個の復号部421ないし42Nが設けられていることを除けば、図12の場合と同様に構成されている。
図21において、復号装置は、図18の符号化装置が出力する多重化データを復号する。
ここで、図18の符号化装置が出力する多重化データは、1個の基本符号化データ、及び、N-1個の追加符号化データ#1ないし#N-1を含んでいる。
このため、図21の復号装置では、抽出部41は、多重化データから、1個の基本符号化データ、及び、N-1個の追加符号化データ#1ないし#N-1のそれぞれを分離する。そして、抽出部41は、基本符号化データを復号部421に、追加符号化データ#nを復号部42n+1に、それぞれ供給する。
したがって、復号部421は、抽出部41からの基本符号化データを復号し、復号部42n+1は、抽出部41からの追加符号化データ#nを復号する。
復号部421が基本符号化データを復号することにより得られる基本画像データと、復号部42n+1が追加符号化データ#nを復号することにより得られる追加画像データ#nとは、復元部81に供給される。
ここで、立体視画像が2次元画像として表示される場合には、復号部421が基本符号化データを復号することにより得られる基本画像データが、図示せぬ2次元表示デバイスに供給される。そして、2次元表示デバイスでは、復号部421からの基本画像データに対応する画像が表示される。
復元部81には、上述のように、復号部421から基本画像データが供給されるとともに、復号部42n+1から追加画像データ#nが供給される他、多重化データから抽出されたビュースイッチングフラグが、抽出部41から供給される。
復元部81は、抽出部41からのビュースイッチングフラグに従い、復号部421からの基本画像データを、復号部42n+1からの追加画像データ#nと入れ替えることで、基本画像データ、及び、N-1個の追加画像データ#1ないし#N-1を、元のN個の第1視点画像データないし第N視点画像データに変換する。
すなわち、復元部81は、抽出部41からのビュースイッチングフラグに従い、基本画像データ、及び、N-1個の追加画像データ#1ないし#N-1を対象に、図18の入れ替え部71の場合と逆の入れ替えを行うことで、N個の第1視点画像データないし第N視点画像データを復元する。
そして、復元部81は、第1視点画像データないし第N視点画像データを、立体視画像変換部43に供給する。
立体視画像変換部43は、復元部81からの第1視点画像データないし第N視点画像データを、立体視画像データに変換し、図示せぬ立体視用デバイスに供給する。
[復号装置の処理の説明]
図22Aおよび図22Bを参照して、図21の復号装置の処理(復号処理)を説明する。
図22Aは、立体視画像の表示が行われる場合の、図21の復号装置の復号処理を説明するフローチャートである。
立体視画像の表示が行われる場合、ステップS151において、抽出部41は、そこに供給される多重化データから、ビュースイッチングフラグを抽出し、復元部81に供給して、処理は、ステップS152に進む。
ステップS152では、抽出部41は、多重化データから、基本符号化データ、及び、N-1個の追加符号化データ#1ないし#N-1を分離し、基本符号化データを、復号部421に、追加符号化データ#nを、復号部42n+1に、それぞれ供給して、処理は、ステップS153に進む。
ステップS153では、多重化データに多重化されているすべての符号化データが復号され、処理は、ステップS154に進む。
すなわち、復号部421は、抽出部41からの基本符号化データを復号し、その結果得られる基本画像データを、復元部81に供給する。さらに、復号部42n+1は、抽出部41からの追加符号化データ#nを復号し、その結果得られる追加画像データ#nを、復元部81に供給する。
ステップS154では、復元部81は、抽出部41からのビュースイッチングフラグに従い、基本画像データ、及び、N-1個の追加画像データ#1ないし#N-1を対象に、図18の入れ替え部71の場合と逆の入れ替えを行い、これにより、N個の第1視点画像データないし第N視点画像データを復元する。
そして、復元部81は、第1視点画像データないし第N視点画像データを、立体視変換部43に供給する。
その後、処理は、ステップS154からステップS155に進み、立体視画像変換部43は、復元部81からの第1視点画像データないし第N視点画像データを、立体視画像データに変換し、図示せぬ立体視用デバイスに供給して、処理は、ステップS156に進む。
ステップS156では、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS151に戻り、以下、ステップS151ないしS156の処理が繰り返される。
また、ステップS156において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
図22Bは、2次元画像の表示が行われる場合の、図21の復号装置の復号処理を説明するフローチャートである。
2次元画像の表示が行われる場合、ステップS161において、抽出部41は、そこに供給される多重化データから、基本符号化データを分離し、復号部421に供給して、処理は、ステップS162に進む。
ステップS162では、復号部421は、抽出部41から供給される基本符号化データを復号し、その結果得られる基本画像データを、図示せぬ2次元表示デバイスに供給する。
したがって、2次元表示デバイスでは、2次元画像として、基本画像データに対応する画像が表示される。
その後、処理は、ステップS162からステップS163に進み、抽出部41が、まだ処理していない多重化データがあるかどうかを判定し、あると判定した場合、処理は、ステップS161に戻り、以下、ステップS161ないしS163の処理が繰り返される。
一方、ステップS163において、まだ処理していない多重化データがないと判定された場合、復号装置は、復号処理を終了する。
以上のように、図18の符号化装置では、2次元画像の表示に用いる画像データを指定するビュースイッチングフラグに従い、N個の第1視点画像データないし第N視点画像データのうちの、1個の視点の画像データを、他の視点の画像データと入れ替えることにより、N個の第1視点画像データないし第N視点画像データが、1個の基本画像データとN-1個の追加画像データ#1ないし#N-1とに変換され、基本画像データ、及び、追加画像データ#1ないし#N-1と、ビュースイッチングフラグとを含む多重化データが生成される。
したがって、図21の復号装置では、立体視画像のコンテンツを、2次元画像として表示する場合に、基本画像データに対応する画像を表示することにより、N個の第1視点画像データないし第N視点画像データのうちの、コンテンツの制作者が意図する画像をシーン単位等で表示することができる。
また、図21の復号装置では、その多重化データから、ビュースイッチングフラグが抽出され、そのビュースイッチングフラグに従い、基本画像データ、及び、N-1個の追加画像データ#1ないし#N-1が、元のN個の第1視点画像データないし第N視点画像データに復元される。
したがって、立体視用デバイスにおいて、立体視画像を表示することができる。
なお、上述の符号化装置、及び、復号装置では、立体視画像以外の複数の視点の画像を対象として、処理を行うこともできる。
すなわち、上述の符号化装置、及び、復号装置では、例えば、ある俳優Aをメインに撮影するカメラで得られた画像と、他の俳優Bをメインに撮影するカメラで得られた画像VAとの2個の視点の画像VBを、対象として処理を行うことができる。
この場合、復号装置に、例えば、ユーザの操作に応じて、画像VA及びVBのうちのいずれかを選択する手段を設けることにより、ユーザは、興味がある俳優をメインとした画像を視聴することができる。
但し、この場合、画像VA及びVBは、立体視画像ではないため、画像の表示は、2次元画像の表示しか行うことができず、立体視画像の表示を行うことはできない。
[本発明を適用したコンピュータの実施の形態]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図23は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク105やROM103に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブル記録媒体111に格納(記録)しておくことができる。このようなリムーバブル記録媒体111は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体111としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブル記録媒体111からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク105にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)102を内蔵しており、CPU102には、バス101を介して、入出力インタフェース110が接続されている。
CPU102は、入出力インタフェース110を介して、ユーザによって、入力部107が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)103に格納されているプログラムを実行する。あるいは、CPU102は、ハードディスク105に格納されたプログラムを、RAM(Random Access Memory)104にロードして実行する。
これにより、CPU102は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU102は、その処理結果を、必要に応じて、例えば、入出力インタフェース110を介して、出力部106から出力、あるいは、通信部108から送信、さらには、ハードディスク105に記録等させる。
なお、入力部107は、キーボードや、マウス、マイク等で構成される。また、出力部106は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
すなわち、例えば、本実施の形態では、画像データを、AVC/H.264方式等によって符号化し、復号することとしたが、画像データの符号化、及び、復号は、行わなくても良い。
また、本実施の形態では、フラグをビットストリームに多重化(記述)するものとして説明したが、多重化する以外にも、フラグと画像データ(又はビットストリーム)とを伝送(記録)してもよい。さらに、フラグと画像データ(又はビットストリーム)と連結する形態もある。
本実施の形態では、連結を以下のように定義する。連結とは、画像データ(又はビットストリーム)とフラグとが互いにリンクされている状態であれば良い。例えば、画像データ(又はビットストリーム)とフラグとを、別の伝送路で伝送してもよい。また、画像データ(又はビットストリーム)とフラグとを、互いに別の記録媒体(又は同一の記録媒体内の別々の記録エリア)に記録してもよい。なお、画像データ(又はビットストリーム)とフラグとをリンクさせる単位は、例えば、符号化処理単位(1フレーム、複数フレーム等)で設定してもよい。
ここで、図1等の符号化装置において、符号化部111及び112、並びに生成部13は、複数であるN個の視点の画像データを符号化してビットストリームを生成する符号化手段として機能するとみなすことができる。また、フラグ設定部12は、N個の視点の画像データのうちの、2次元画像の表示に用いる画像データを指定するビュースイッチングフラグを生成する生成手段として機能するとみなすことができる。さらに、生成部13は、N個の視点の画像データを符号化したビットストリームと、ビュースイッチングフラグとを伝送する伝送手段として機能するとみなすことができる。
また、図5等の復号装置において、抽出部41は、複数であるN個の視点の画像データを符号化して得られるビットストリームと、N個の視点の画像データのうちの、2次元画像の表示に用いる画像データを指定するビュースイッチングフラグと、を受け取る受け取り手段として機能するとみなすことができる。さらに、選択部44は、ビュースイッチングフラグに従い、ビットストリームに含まれるN個の視点の画像データから、2次元画像の表示に用いる画像データを選択する選択手段として機能するとみなすことができる。
[本発明を適用した電子機器の実施の形態]
例えば、上述した符号化装置や復号装置は、任意の電子機器に適用することができる。以下にその例について説明する。
図24は、本発明を適用した復号装置を用いるテレビジョン受像機の主な構成例を示すブロック図である。
図24に示されるテレビジョン受像機1000は、地上波チューナ1013、ビデオデコーダ1015、映像信号処理回路1018、グラフィック生成回路1019、パネル駆動回路1020、および表示パネル1021を有する。
地上波チューナ1013は、地上アナログ放送の放送波信号を、アンテナを介して受信し、復調し、映像信号を取得し、それをビデオデコーダ1015に供給する。ビデオデコーダ1015は、地上波チューナ1013から供給された映像信号に対してデコード処理を施し、得られたデジタルのコンポーネント信号を映像信号処理回路1018に供給する。
映像信号処理回路1018は、ビデオデコーダ1015から供給された映像データに対してノイズ除去などの所定の処理を施し、得られた映像データをグラフィック生成回路1019に供給する。
グラフィック生成回路1019は、表示パネル1021に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成し、生成した映像データや画像データをパネル駆動回路1020に供給する。また、グラフィック生成回路1019は、項目の選択などにユーザにより利用される画面を表示するための映像データ(グラフィック)を生成し、それを番組の映像データに重畳したりすることによって得られた映像データをパネル駆動回路1020に供給するといった処理も適宜行う。
パネル駆動回路1020は、グラフィック生成回路1019から供給されたデータに基づいて表示パネル1021を駆動し、番組の映像や上述した各種の画面を表示パネル1021に表示させる。
表示パネル1021はLCD(Liquid Crystal Display)などよりなり、パネル駆動回路1020による制御に従って番組の映像などを表示させる。
また、テレビジョン受像機1000は、音声A/D(Analog/Digital)変換回路1014、音声信号処理回路1022、エコーキャンセル/音声合成回路1023、音声増幅回路1024、およびスピーカ1025も有する。
地上波チューナ1013は、受信した放送波信号を復調することにより、映像信号だけでなく音声信号も取得する。地上波チューナ1013は、取得した音声信号を音声A/D変換回路1014に供給する。
音声A/D変換回路1014は、地上波チューナ1013から供給された音声信号に対してA/D変換処理を施し、得られたデジタルの音声信号を音声信号処理回路1022に供給する。
音声信号処理回路1022は、音声A/D変換回路1014から供給された音声データに対してノイズ除去などの所定の処理を施し、得られた音声データをエコーキャンセル/音声合成回路1023に供給する。
エコーキャンセル/音声合成回路1023は、音声信号処理回路1022から供給された音声データを音声増幅回路1024に供給する。
音声増幅回路1024は、エコーキャンセル/音声合成回路1023から供給された音声データに対してD/A変換処理、増幅処理を施し、所定の音量に調整した後、音声をスピーカ1025から出力させる。
さらに、テレビジョン受像機1000は、デジタルチューナ1016およびMPEGデコーダ1017も有する。
デジタルチューナ1016は、デジタル放送(地上デジタル放送、BS(Broadcasting Satellite)/CS(Communications Satellite)デジタル放送)の放送波信号を、アンテナを介して受信し、復調し、MPEG-TS(Moving Picture Experts Group-Transport Stream)を取得し、それをMPEGデコーダ1017に供給する。
MPEGデコーダ1017は、デジタルチューナ1016から供給されたMPEG-TSに施されているスクランブルを解除し、再生対象(視聴対象)になっている番組のデータを含むストリームを抽出する。MPEGデコーダ1017は、抽出したストリームを構成する音声パケットをデコードし、得られた音声データを音声信号処理回路1022に供給するとともに、ストリームを構成する映像パケットをデコードし、得られた映像データを映像信号処理回路1018に供給する。また、MPEGデコーダ1017は、MPEG-TSから抽出したEPG(Electronic Program Guide)データを図示せぬ経路を介してCPU1032に供給する。
テレビジョン受像機1000は、このように映像パケットをデコードするMPEGデコーダ1017として、図5、図12、図16、または図21を参照して上述した復号装置を用いる。なお、放送局等より送信されるMPEG-TSは、図1、図9、図14、または図18を参照して上述した符号化装置によって符号化されており、複数の画像データが符号化されて1つのビットストリームとされている。
MPEGデコーダ1017は、図5、図12、図16、または図21の復号装置の場合と同様に、ビュースイッチングフラグに基づいて2次元画像として表示される画像データの符号化データを選択し、復号するか、若しくは、符号化装置がビュースイッチングフラグによる指定に基づいて画像を入れ替えながら生成した、2次元画像表示に用いる基本画像データを符号化した基本符号化データを復号する。したがって、MPEGデコーダ1017は、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
MPEGデコーダ1017から供給された映像データは、ビデオデコーダ1015から供給された映像データの場合と同様に、映像信号処理回路1018において所定の処理が施され、グラフィック生成回路1019において、生成された映像データ等が適宜重畳され、パネル駆動回路1020を介して表示パネル1021に供給され、その画像が表示される。
MPEGデコーダ1017から供給された音声データは、音声A/D変換回路1014から供給された音声データの場合と同様に、音声信号処理回路1022において所定の処理が施され、エコーキャンセル/音声合成回路1023を介して音声増幅回路1024に供給され、D/A変換処理や増幅処理が施される。その結果、所定の音量に調整された音声がスピーカ1025から出力される。
また、テレビジョン受像機1000は、マイクロホン1026、およびA/D変換回路1027も有する。
A/D変換回路1027は、音声会話用のものとしてテレビジョン受像機1000に設けられるマイクロホン1026により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データをエコーキャンセル/音声合成回路1023に供給する。
エコーキャンセル/音声合成回路1023は、テレビジョン受像機1000のユーザ(ユーザA)の音声のデータがA/D変換回路1027から供給されている場合、ユーザAの音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路1024を介してスピーカ1025より出力させる。
さらに、テレビジョン受像機1000は、音声コーデック1028、内部バス1029、SDRAM(Synchronous Dynamic Random Access Memory)1030、フラッシュメモリ1031、CPU1032、USB(Universal Serial Bus) I/F1033、およびネットワークI/F1034も有する。
A/D変換回路1027は、音声会話用のものとしてテレビジョン受像機1000に設けられるマイクロホン1026により取り込まれたユーザの音声の信号を受信し、受信した音声信号に対してA/D変換処理を施し、得られたデジタルの音声データを音声コーデック1028に供給する。
音声コーデック1028は、A/D変換回路1027から供給された音声データを、ネットワーク経由で送信するための所定のフォーマットのデータに変換し、内部バス1029を介してネットワークI/F1034に供給する。
ネットワークI/F1034は、ネットワーク端子1035に装着されたケーブルを介してネットワークに接続される。ネットワークI/F1034は、例えば、そのネットワークに接続される他の装置に対して、音声コーデック1028から供給された音声データを送信する。また、ネットワークI/F1034は、例えば、ネットワークを介して接続される他の装置から送信される音声データを、ネットワーク端子1035を介して受信し、それを、内部バス1029を介して音声コーデック1028に供給する。
音声コーデック1028は、ネットワークI/F1034から供給された音声データを所定のフォーマットのデータに変換し、それをエコーキャンセル/音声合成回路1023に供給する。
エコーキャンセル/音声合成回路1023は、音声コーデック1028から供給される音声データを対象としてエコーキャンセルを行い、他の音声データと合成するなどして得られた音声のデータを、音声増幅回路1024を介してスピーカ1025より出力させる。
SDRAM1030は、CPU1032が処理を行う上で必要な各種のデータを記憶する。
フラッシュメモリ1031は、CPU1032により実行されるプログラムを記憶する。フラッシュメモリ1031に記憶されているプログラムは、テレビジョン受像機1000の起動時などの所定のタイミングでCPU1032により読み出される。フラッシュメモリ1031には、デジタル放送を介して取得されたEPGデータ、ネットワークを介して所定のサーバから取得されたデータなども記憶される。
例えば、フラッシュメモリ1031には、CPU1032の制御によりネットワークを介して所定のサーバから取得されたコンテンツデータを含むMPEG-TSが記憶される。フラッシュメモリ1031は、例えばCPU1032の制御により、そのMPEG-TSを、内部バス1029を介してMPEGデコーダ1017に供給する。
MPEGデコーダ1017は、デジタルチューナ1016から供給されたMPEG-TSの場合と同様に、そのMPEG-TSを処理する。このようにテレビジョン受像機1000は、映像や音声等よりなるコンテンツデータを、ネットワークを介して受信し、MPEGデコーダ1017を用いてデコードし、その映像を表示させたり、音声を出力させたりすることができる。
また、テレビジョン受像機1000は、リモートコントローラ1051から送信される赤外線信号を受光する受光部1037も有する。
受光部1037は、リモートコントローラ1051からの赤外線を受光し、復調して得られたユーザ操作の内容を表す制御コードをCPU1032に出力する。
CPU1032は、フラッシュメモリ1031に記憶されているプログラムを実行し、受光部1037から供給される制御コードなどに応じてテレビジョン受像機1000の全体の動作を制御する。CPU1032とテレビジョン受像機1000の各部は、図示せぬ経路を介して接続されている。
USB I/F1033は、USB端子1036に装着されたUSBケーブルを介して接続される、テレビジョン受像機1000の外部の機器との間でデータの送受信を行う。ネットワークI/F1034は、ネットワーク端子1035に装着されたケーブルを介してネットワークに接続し、ネットワークに接続される各種の装置と音声データ以外のデータの送受信も行う。
テレビジョン受像機1000は、MPEGデコーダ1017として、図5、図12、図16、または図21を参照して上述した復号装置を用いることにより、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示することができる。
図25は、本発明を適用した符号化装置および復号装置を用いる携帯電話機の主な構成例を示すブロック図である。
図25に示される携帯電話機1100は、各部を統括的に制御するようになされた主制御部1150、電源回路部1151、操作入力制御部1152、画像エンコーダ1153、カメラI/F部1154、LCD制御部1155、画像デコーダ1156、多重分離部1157、記録再生部1162、変復調回路部1158、および音声コーデック1159を有する。これらは、バス1160を介して互いに接続されている。
また、携帯電話機1100は、操作キー1119、CCD(Charge Coupled Devices)カメラ1116、液晶ディスプレイ1118、記憶部1123、送受信回路部1163、アンテナ1114、マイクロホン(マイク)1121、およびスピーカ1117を有する。
電源回路部1151は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話機1100を動作可能な状態に起動する。
携帯電話機1100は、CPU、ROMおよびRAM等でなる主制御部1150の制御に基づいて、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
例えば、音声通話モードにおいて、携帯電話機1100は、マイクロホン(マイク)1121で集音した音声信号を、音声コーデック1159によってデジタル音声データに変換し、これを変復調回路部1158でスペクトラム拡散処理し、送受信回路部1163でデジタルアナログ変換処理および周波数変換処理する。携帯電話機1100は、その変換処理により得られた送信用信号を、アンテナ1114を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号(音声信号)は、公衆電話回線網を介して通話相手の携帯電話機に供給される。
また、例えば、音声通話モードにおいて、携帯電話機1100は、アンテナ1114で受信した受信信号を送受信回路部1163で増幅し、さらに周波数変換処理およびアナログデジタル変換処理し、変復調回路部1158でスペクトラム逆拡散処理し、音声コーデック1159によってアナログ音声信号に変換する。携帯電話機1100は、その変換して得られたアナログ音声信号をスピーカ1117から出力する。
更に、例えば、データ通信モードにおいて電子メールを送信する場合、携帯電話機1100は、操作キー1119の操作によって入力された電子メールのテキストデータを、操作入力制御部1152において受け付ける。携帯電話機1100は、そのテキストデータを主制御部1150において処理し、LCD制御部1155を介して、画像として液晶ディスプレイ1118に表示させる。
また、携帯電話機1100は、主制御部1150において、操作入力制御部1152が受け付けたテキストデータやユーザ指示等に基づいて電子メールデータを生成する。携帯電話機1100は、その電子メールデータを、変復調回路部1158でスペクトラム拡散処理し、送受信回路部1163でデジタルアナログ変換処理および周波数変換処理する。携帯電話機1100は、その変換処理により得られた送信用信号を、アンテナ1114を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号(電子メール)は、ネットワークおよびメールサーバ等を介して、所定のあて先に供給される。
また、例えば、データ通信モードにおいて電子メールを受信する場合、携帯電話機1100は、基地局から送信された信号を、アンテナ1114を介して送受信回路部1163で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機1100は、その受信信号を変復調回路部1158でスペクトラム逆拡散処理して元の電子メールデータを復元する。携帯電話機1100は、復元された電子メールデータを、LCD制御部1155を介して液晶ディスプレイ1118に表示する。
なお、携帯電話機1100は、受信した電子メールデータを、記録再生部1162を介して、記憶部1123に記録する(記憶させる)ことも可能である。
この記憶部1123は、書き換え可能な任意の記憶媒体である。記憶部1123は、例えば、RAMや内蔵型フラッシュメモリ等の半導体メモリであってもよいし、ハードディスクであってもよいし、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアであってもよい。もちろん、これら以外のものであってもよい。
さらに、例えば、データ通信モードにおいて画像データを送信する場合、携帯電話機1100は、撮像によりCCDカメラ1116で画像データを生成する。CCDカメラ1116は、レンズや絞り等の光学デバイスと光電変換素子としてのCCDを有し、被写体を撮像し、受光した光の強度を電気信号に変換し、被写体の画像の画像データを生成する。CCDカメラ1116は、その画像データを、カメラI/F部1154を介して、画像エンコーダ1153で符号化し、符号化画像データに変換する。
携帯電話機1100は、このような処理を行う画像エンコーダ1153として、図1、図9、図14、または図18を参照して上述した符号化装置を用いる。画像エンコーダ1053は、これらの符号化装置の場合と同様に、複数の視点の画像データをそれぞれ符号化し、それらの符号化データをビュースイッチングフラグと多重化する。これにより、画像エンコーダ1053は、復号側において、ビュースイッチングフラグが用いられてコンテンツの制作者が意図する画像が表示されるようにすることができる。
なお、携帯電話機1100は、このとき同時に、CCDカメラ1116で撮像中にマイクロホン(マイク)1121で集音した音声を、音声コーデック1159においてアナログデジタル変換し、さらに符号化する。
携帯電話機1100は、多重分離部1157において、画像エンコーダ1153から供給された符号化画像データと、音声コーデック1159から供給されたデジタル音声データとを、所定の方式で多重化する。携帯電話機1100は、その結果得られる多重化データを、変復調回路部1158でスペクトラム拡散処理し、送受信回路部1163でデジタルアナログ変換処理および周波数変換処理する。携帯電話機1100は、その変換処理により得られた送信用信号を、アンテナ1114を介して図示しない基地局へ送信する。基地局へ伝送された送信用信号(画像データ)は、ネットワーク等を介して、通信相手に供給される。
なお、画像データを送信しない場合、携帯電話機1100は、CCDカメラ1116で生成した画像データを、画像エンコーダ1153を介さずに、LCD制御部1155を介して液晶ディスプレイ1118に表示させることもできる。
また、例えば、データ通信モードにおいて、簡易ホームページ等にリンクされた動画像ファイルのデータを受信する場合、携帯電話機1100は、基地局から送信された信号を、アンテナ1114を介して送受信回路部1163で受信し、増幅し、さらに周波数変換処理およびアナログデジタル変換処理する。携帯電話機1100は、その受信信号を変復調回路部1158でスペクトラム逆拡散処理して元の多重化データを復元する。携帯電話機1100は、多重分離部1157において、その多重化データを分離して、符号化画像データと音声データとに分ける。
携帯電話機1100は、画像デコーダ1156において符号化画像データをデコードすることにより、再生動画像データを生成し、これを、LCD制御部1155を介して液晶ディスプレイ1118に表示させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる動画データが液晶ディスプレイ1118に表示される。
携帯電話機1100は、このような処理を行う画像デコーダ1156として、図5、図12、図16、または図21を参照して上述した復号装置を用いる。つまり、画像デコーダ1156は、これらの復号装置の場合と同様に、ビュースイッチングフラグに基づいて2次元画像として表示される画像データの符号化データを選択し、復号するか、若しくは、符号化装置がビュースイッチングフラグによる指定に基づいて画像を入れ替えながら生成した、2次元画像表示に用いる基本画像データを符号化した基本符号化データを復号する。したがって、画像デコーダ1156は、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
このとき、携帯電話機1100は、同時に、音声コーデック1159において、デジタルの音声データをアナログ音声信号に変換し、これをスピーカ1117より出力させる。これにより、例えば、簡易ホームページにリンクされた動画像ファイルに含まれる音声データが再生される。
なお、電子メールの場合と同様に、携帯電話機1100は、受信した簡易ホームページ等にリンクされたデータを、記録再生部1162を介して、記憶部1123に記録する(記憶させる)ことも可能である。
また、携帯電話機1100は、主制御部1150において、撮像されてCCDカメラ1116で得られた2次元コードを解析し、2次元コードに記録された情報を取得することができる。
さらに、携帯電話機1100は、赤外線通信部1181で赤外線により外部の機器と通信することができる。
携帯電話機1100は、画像エンコーダ1153として図1、図9、図14、または図18を参照して上述した符号化装置を用いることにより、復号側において、ビュースイッチングフラグが用いられてコンテンツの制作者が意図する画像が表示されるようにすることができる。
また、携帯電話機1100は、画像デコーダ1156として図5、図12、図16、または図21を参照して上述した復号装置を用いることにより、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
なお、以上において、携帯電話機1100が、CCDカメラ1116を用いるように説明したが、このCCDカメラ1116の代わりに、CMOS(Complementary Metal Oxide Semiconductor)を用いたイメージセンサ(CMOSイメージセンサ)を用いるようにしてもよい。この場合も、携帯電話機1100は、CCDカメラ1116を用いる場合と同様に、被写体を撮像し、被写体の画像の画像データを生成することができる。
また、以上においては携帯電話機1100として説明したが、例えば、PDA(Personal Digital Assistants)、スマートフォン、UMPC(Ultra Mobile Personal Computer)、ネットブック、ノート型パーソナルコンピュータ等、この携帯電話機1100と同様の撮像機能や通信機能を有する装置であれば、どのような装置であっても携帯電話機1100の場合と同様に、上述した符号化装置や復号装置を適用することができる。
図26は、本発明を適用した符号化装置および復号装置を用いるハードディスクレコーダの主な構成例を示すブロック図である。
図26に示されるハードディスクレコーダ(HDDレコーダ)1200は、チューナにより受信された、衛星や地上のアンテナ等より送信される放送波信号(テレビジョン信号)に含まれる放送番組のオーディオデータとビデオデータを、内蔵するハードディスクに保存し、その保存したデータをユーザの指示に応じたタイミングでユーザに提供する装置である。
ハードディスクレコーダ1200は、例えば、放送波信号よりオーディオデータとビデオデータを抽出し、それらを適宜復号し、内蔵するハードディスクに記憶させることができる。また、ハードディスクレコーダ1200は、例えば、ネットワークを介して他の装置からオーディオデータやビデオデータを取得し、それらを適宜復号し、内蔵するハードディスクに記憶させることもできる。
さらに、ハードディスクレコーダ1200は、例えば、内蔵するハードディスクに記録されているオーディオデータやビデオデータを復号してモニタ1260に供給し、モニタ1260の画面にその画像を表示させ、モニタ1260のスピーカよりその音声を出力させることができる。また、ハードディスクレコーダ1200は、例えば、チューナを介して取得された放送波信号より抽出されたオーディオデータとビデオデータ、または、ネットワークを介して他の装置から取得したオーディオデータやビデオデータを復号してモニタ1260に供給し、モニタ1260の画面にその画像を表示させ、モニタ1260のスピーカよりその音声を出力させることもできる。
もちろん、この他の動作も可能である。
図26に示されるように、ハードディスクレコーダ1200は、受信部1221、復調部1222、デマルチプレクサ1223、オーディオデコーダ1224、ビデオデコーダ1225、およびレコーダ制御部1226を有する。ハードディスクレコーダ1200は、さらに、EPGデータメモリ1227、プログラムメモリ1228、ワークメモリ1229、ディスプレイコンバータ1230、OSD(On Screen Display)制御部1231、ディスプレイ制御部1232、記録再生部1233、D/Aコンバータ1234、および通信部1235を有する。
また、ディスプレイコンバータ1230は、ビデオエンコーダ1241を有する。記録再生部1233は、エンコーダ1251およびデコーダ1252を有する。
受信部1221は、リモートコントローラ(図示せず)からの赤外線信号を受信し、電気信号に変換してレコーダ制御部1226に出力する。レコーダ制御部1226は、例えば、マイクロプロセッサなどにより構成され、プログラムメモリ1228に記憶されているプログラムに従って、各種の処理を実行する。レコーダ制御部1226は、このとき、ワークメモリ1229を必要に応じて使用する。
通信部1235は、ネットワークに接続され、ネットワークを介して他の装置との通信処理を行う。例えば、通信部1235は、レコーダ制御部1226により制御され、チューナ(図示せず)と通信し、主にチューナに対して選局制御信号を出力する。
復調部1222は、チューナより供給された信号を、復調し、デマルチプレクサ1223に出力する。デマルチプレクサ1223は、復調部1222より供給されたデータを、オーディオデータ、ビデオデータ、およびEPGデータに分離し、それぞれ、オーディオデコーダ1224、ビデオデコーダ1225、またはレコーダ制御部1226に出力する。
オーディオデコーダ1224は、入力されたオーディオデータをデコードし、記録再生部1233に出力する。ビデオデコーダ1225は、入力されたビデオデータをデコードし、ディスプレイコンバータ1230に出力する。レコーダ制御部1226は、入力されたEPGデータをEPGデータメモリ1227に供給し、記憶させる。
ディスプレイコンバータ1230は、ビデオデコーダ1225またはレコーダ制御部1226より供給されたビデオデータを、ビデオエンコーダ1241により、例えばNTSC(National Television Standards Committee)方式のビデオデータにエンコードし、記録再生部1233に出力する。また、ディスプレイコンバータ1230は、ビデオデコーダ1225またはレコーダ制御部1226より供給されるビデオデータの画面のサイズを、モニタ1260のサイズに対応するサイズに変換し、ビデオエンコーダ1241によってNTSC方式のビデオデータに変換し、アナログ信号に変換し、ディスプレイ制御部1232に出力する。
ディスプレイ制御部1232は、レコーダ制御部1226の制御のもと、OSD(On Screen Display)制御部1231が出力したOSD信号を、ディスプレイコンバータ1230より入力されたビデオ信号に重畳し、モニタ1260のディスプレイに出力し、表示させる。
モニタ1260にはまた、オーディオデコーダ1224が出力したオーディオデータが、D/Aコンバータ1234によりアナログ信号に変換されて供給されている。モニタ1260は、このオーディオ信号を内蔵するスピーカから出力する。
記録再生部1233は、ビデオデータやオーディオデータ等を記録する記憶媒体としてハードディスクを有する。
記録再生部1233は、例えば、オーディオデコーダ1224より供給されるオーディオデータを、エンコーダ1251によりエンコードする。また、記録再生部1233は、ディスプレイコンバータ1230のビデオエンコーダ1241より供給されるビデオデータを、エンコーダ1251によりエンコードする。記録再生部1233は、そのオーディオデータの符号化データとビデオデータの符号化データとをマルチプレクサにより合成する。記録再生部1233は、その合成データをチャネルコーディングして増幅し、そのデータを、記録ヘッドを介してハードディスクに書き込む。
記録再生部1233は、再生ヘッドを介してハードディスクに記録されているデータを再生し、増幅し、デマルチプレクサによりオーディオデータとビデオデータに分離する。記録再生部1233は、デコーダ1252によりオーディオデータおよびビデオデータをデコードする。記録再生部1233は、復号したオーディオデータをD/A変換し、モニタ1260のスピーカに出力する。また、記録再生部1233は、復号したビデオデータをD/A変換し、モニタ1260のディスプレイに出力する。
レコーダ制御部1226は、受信部1221を介して受信されるリモートコントローラからの赤外線信号により示されるユーザ指示に基づいて、EPGデータメモリ1227から最新のEPGデータを読み出し、それをOSD制御部1231に供給する。OSD制御部1231は、入力されたEPGデータに対応する画像データを発生し、ディスプレイ制御部1232に出力する。ディスプレイ制御部1232は、OSD制御部1231より入力されたビデオデータをモニタ1260のディスプレイに出力し、表示させる。これにより、モニタ1260のディスプレイには、EPG(電子番組ガイド)が表示される。
また、ハードディスクレコーダ1200は、インターネット等のネットワークを介して他の装置から供給されるビデオデータ、オーディオデータ、またはEPGデータ等の各種データを取得することができる。
通信部1235は、レコーダ制御部1226に制御され、ネットワークを介して他の装置から送信されるビデオデータ、オーディオデータ、およびEPGデータ等の符号化データを取得し、それをレコーダ制御部1226に供給する。レコーダ制御部1226は、例えば、取得したビデオデータやオーディオデータの符号化データを記録再生部1233に供給し、ハードディスクに記憶させる。このとき、レコーダ制御部1226および記録再生部1233が、必要に応じて再エンコード等の処理を行うようにしてもよい。
また、レコーダ制御部1226は、取得したビデオデータやオーディオデータの符号化データを復号し、得られるビデオデータをディスプレイコンバータ1230に供給する。ディスプレイコンバータ1230は、ビデオデコーダ1225から供給されるビデオデータと同様に、レコーダ制御部1226から供給されるビデオデータを処理し、ディスプレイ制御部1232を介してモニタ1260に供給し、その画像を表示させる。
また、この画像表示に合わせて、レコーダ制御部1226が、復号したオーディオデータを、D/Aコンバータ1234を介してモニタ1260に供給し、その音声をスピーカから出力させるようにしてもよい。
さらに、レコーダ制御部1226は、取得したEPGデータの符号化データを復号し、復号したEPGデータをEPGデータメモリ1227に供給する。
以上のようなハードディスクレコーダ1200は、ビデオデコーダ1225、デコーダ1252、およびレコーダ制御部1226に内蔵されるデコーダとして、図5、図12、図16、または図21を参照して上述した復号装置を用いる。つまり、ビデオデコーダ1225、デコーダ1252、およびレコーダ制御部1226に内蔵されるデコーダは、これらの復号装置の場合と同様に、ビュースイッチングフラグに基づいて2次元画像として表示される画像データの符号化データを選択し、復号するか、若しくは、符号化装置がビュースイッチングフラグによる指定に基づいて画像を入れ替えながら生成した、2次元画像表示に用いる基本画像データを符号化した基本符号化データを復号する。したがって、ビデオデコーダ1225、デコーダ1252、およびレコーダ制御部1226に内蔵されるデコーダは、それぞれ、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
したがって、ハードディスクレコーダ1200は、例えば、チューナや通信部1235によるビデオデータ(符号化データ)の受信の際や、記録再生部1233によるビデオデータ(符号化データ)のハードディスクからの再生の際に、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
また、ハードディスクレコーダ1200は、エンコーダ1251として図1、図9、図14、または図18を参照して上述した符号化装置を用いる。したがって、エンコーダ1251は、これらの符号化装置の場合と同様に、複数の視点の画像データをそれぞれ符号化し、それらの符号化データをビュースイッチングフラグと多重化する。したがって、ハードディスクレコーダ1200は、例えば、復号側において、ビュースイッチングフラグが用いられてコンテンツの制作者が意図する画像が表示されるようにすることができる。
なお、以上においては、ビデオデータやオーディオデータをハードディスクに記録するハードディスクレコーダ1200について説明したが、もちろん、記録媒体はどのようなものであってもよい。例えばフラッシュメモリ、光ディスク、またはビデオテープ等、ハードディスク以外の記録媒体を適用するレコーダであっても、上述したハードディスクレコーダ1200の場合と同様に、上述した符号化装置や復号装置を適用することができる。
図27は、本発明を適用した符号化装置および復号装置を用いるカメラの主な構成例を示すブロック図である。
図27に示されるカメラ1300は、被写体を撮像し、被写体の画像をLCD1316に表示させたり、それを画像データとして、記録メディア1333に記録したりする。
レンズブロック1311は、光(すなわち、被写体の映像)を、CCD/CMOS1312に入射させる。CCD/CMOS1312は、CCDまたはCMOSを用いたイメージセンサであり、受光した光の強度を電気信号に変換し、カメラ信号処理部1313に供給する。
カメラ信号処理部1313は、CCD/CMOS1312から供給された電気信号を、Y,Cr,Cbの色差信号に変換し、画像信号処理部1314に供給する。画像信号処理部1314は、コントローラ1321の制御の下、カメラ信号処理部1313から供給された画像信号に対して所定の画像処理を施したり、その画像信号をエンコーダ1341で符号化したりする。画像信号処理部1314は、画像信号を符号化して生成した符号化データを、デコーダ1315に供給する。さらに、画像信号処理部1314は、オンスクリーンディスプレイ(OSD)1320において生成された表示用データを取得し、それをデコーダ1315に供給する。
以上の処理において、カメラ信号処理部1313は、バス1317を介して接続されるDRAM(Dynamic Random Access Memory)1318を適宜利用し、必要に応じて画像データや、その画像データが符号化された符号化データ等をそのDRAM1318に保持させる。
デコーダ1315は、画像信号処理部1314から供給された符号化データを復号し、得られた画像データ(復号画像データ)をLCD1316に供給する。また、デコーダ1315は、画像信号処理部1314から供給された表示用データをLCD1316に供給する。LCD1316は、デコーダ1315から供給された復号画像データの画像と表示用データの画像を適宜合成し、その合成画像を表示する。
オンスクリーンディスプレイ1320は、コントローラ1321の制御の下、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを、バス1317を介して画像信号処理部1314に出力する。
コントローラ1321は、ユーザが操作部1322を用いて指令した内容を示す信号に基づいて、各種処理を実行するとともに、バス1317を介して、画像信号処理部1314、DRAM1318、外部インタフェース1319、オンスクリーンディスプレイ1320、およびメディアドライブ1323等を制御する。FLASH ROM1324には、コントローラ1321が各種処理を実行する上で必要なプログラムやデータ等が格納される。
例えば、コントローラ1321は、画像信号処理部1314やデコーダ1315に代わって、DRAM1318に記憶されている画像データを符号化したり、DRAM1318に記憶されている符号化データを復号したりすることができる。このとき、コントローラ1321は、画像信号処理部1314やデコーダ1315の符号化・復号方式と同様の方式によって符号化・復号処理を行うようにしてもよいし、画像信号処理部1314やデコーダ1315が対応していない方式により符号化・復号処理を行うようにしてもよい。
また、例えば、操作部1322から画像印刷の開始が指示された場合、コントローラ1321は、DRAM1318から画像データを読み出し、それを、バス1317を介して外部インタフェース1319に接続されるプリンタ1334に供給して印刷させる。
さらに、例えば、操作部1322から画像記録が指示された場合、コントローラ1321は、DRAM1318から符号化データを読み出し、それを、バス1317を介してメディアドライブ1323に装着される記録メディア1333に供給して記憶させる。
記録メディア1333は、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアである。記録メディア1333は、もちろん、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であっても良い。
また、メディアドライブ1323と記録メディア1333を一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。
外部インタフェース1319は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタ1334と接続される。また、外部インタフェース1319には、必要に応じてドライブ1331が接続され、磁気ディスク、光ディスク、あるいは光磁気ディスクなどのリムーバブルメディア1332が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、FLASH ROM1324にインストールされる。
さらに、外部インタフェース1319は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。コントローラ1321は、例えば、操作部1322からの指示に従って、DRAM1318から符号化データを読み出し、それを外部インタフェース1319から、ネットワークを介して接続される他の装置に供給させることができる。また、コントローラ1321は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース1319を介して取得し、それをDRAM1318に保持させたり、画像信号処理部1314に供給したりすることができる。
以上のようなカメラ1300は、デコーダ1315として図5、図12、図16、または図21を参照して上述した復号装置を用いる。つまり、デコーダ1315は、これらの復号装置の場合と同様に、ビュースイッチングフラグに基づいて2次元画像として表示される画像データの符号化データを選択し、復号するか、若しくは、符号化装置がビュースイッチングフラグによる指定に基づいて画像を入れ替えながら生成した、2次元画像表示に用いる基本画像データを符号化した基本符号化データを復号する。したがって、デコーダ1315は、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
したがって、カメラ1300は、例えば、CCD/CMOS1312において生成される画像データや、DRAM1318または記録メディア1333からビデオデータの符号化データを読み出す際や、ネットワークを介してビデオデータの符号化データを取得する際に、複数の視点の画像データからなるコンテンツの、そのコンテンツの制作者が意図する画像を表示させるようにすることができる。
また、カメラ1300は、エンコーダ1341として図1、図9、図14、または図18を参照して上述した符号化装置を用いる。エンコーダ1341は、これらの符号化装置の場合と同様に、複数の視点の画像データをそれぞれ符号化し、それらの符号化データをビュースイッチングフラグと多重化する。これにより、エンコーダ1341は、復号側において、ビュースイッチングフラグが用いられてコンテンツの制作者が意図する画像が表示されるようにすることができる。
したがって、カメラ1300は、例えば、DRAM1318や記録メディア1333に符号化データを記録する際や、符号化データを他の装置に提供する際に、復号側において、ビュースイッチングフラグが用いられてコンテンツの制作者が意図する画像が表示されるようにすることができる。
なお、コントローラ1321が行う復号処理に上述した復号装置の復号方法を適用するようにしてもよい。同様に、コントローラ1321が行う符号化処理に上述した符号化装置の符号化方法を適用するようにしてもよい。
また、カメラ1300が撮像する画像データは動画像であってもよいし、静止画像であってもよい。
もちろん、上述した符号化装置および復号装置は、上述した装置以外の装置やシステムにも適用可能である。
[拡張マクロブロック]
また、マクロブロックの大きさは任意である。本発明は、例えば図28に示されるようなあらゆる大きさのマクロブロックに対して適用することができる。例えば、本発明は、通常の16×16画素のようなマクロブロックだけでなく、32×32画素のような拡張されたマクロブロック(拡張マクロブロック)にも適用することができる。
図28において、上段には、左から、32×32画素、32×16画素、16×32画素、および16×16画素のブロック(パーティション)に分割された32×32画素で構成されるマクロブロックが順に示されている。また、中段には、左から、16×16画素、16×8画素、8×16画素、および8×8画素のブロックに分割された16×16画素で構成されるブロックが順に示されている。さらに、下段には、左から、8×8画素、8×4画素、4×8画素、および4×4画素のブロックに分割された8×8画素のブロックが順に示されている。
すなわち、32×32画素のマクロブロックは、上段に示される32×32画素、32×16画素、16×32画素、および16×16画素のブロックでの処理が可能である。
上段の右側に示される16×16画素のブロックは、H.264/AVC方式と同様に、中段に示される16×16画素、16×8画素、8×16画素、および8×8画素のブロックでの処理が可能である。
中段の右側に示される8×8画素のブロックは、H.264/AVC方式と同様に、下段に示される8×8画素、8×4画素、4×8画素、および4×4画素のブロックでの処理が可能である。
これらのブロックは、以下の3階層に分類することができる。すなわち、図28の上段に示される32×32画素、32×16画素、および16×32画素のブロックを第1階層と称する。上段の右側に示される16×16画素のブロック、並びに、中段に示される16×16画素、16×8画素、および8×16画素のブロックを、第2階層と称する。中段の右側に示される8×8画素のブロック、並びに、下段に示される8×8画素、8×4画素、4×8画素、および4×4画素のブロックを、第3階層と称する。
このような階層構造を採用することにより、16×16画素のブロック以下に関しては、H.264/AVC方式と互換性を保ちながら、そのスーパーセットとして、より大きなブロックを定義することができる。
例えば、本発明を適用した符号化装置や復号装置が、階層毎にフィルタ係数を算出するようにしてもよい。また、例えば、本発明を適用した符号化装置や復号装置が、第2の階層よりブロックサイズが大きい階層である第1階層に対応するフィルタ係数を、第2階層に対しても設定するようにしてもよい。さらに、例えば、本発明を適用した符号化装置や復号装置が、過去の同一の階層に対するフィルタ係数を設定するようにしてもよい。
第1階層や第2階層のように、比較的大きなブロックサイズを用いて符号化が行われるマクロブロックは、比較的高周波成分を含んでいない。これに対して、第3階層のように、比較的小さなブロックサイズを用いて符号化が行われるマクロブロックは、比較的、高周波成分を含んでいると考えられる。
そこで、ブロックサイズの異なる各階層に応じて、別々にフィルタ係数を算出することにより、画像の持つ、局所的性質に適した符号化性能向上を実現させることが可能である。
なお、フィルタのタップ数も、階層毎に異なるものであってもよい。