<第1実施の形態>
[符号化装置の一実施の形態の構成例]
図2は、本技術を適用した符号化装置の第1実施の形態の構成例を示すブロック図である。
図2の符号化装置50は、撮影部51A乃至51C、画像変換部52、視差画像生成部53、画像情報生成部54、互換情報生成部55、視点間距離情報生成部56、視差画像情報生成部57、エンコーダ58、および多重化部59により構成される。
符号化装置50は、多視点の画像のうちの1視点の画像を2D画像として既存の符号化方式で符号化し、単独でTSを生成することにより、既存の2D画像を符号化する符号化装置との互換性を確保する。
なお、以下では、多視点の画像のうちの、既存の符号化装置との互換性を確保するために既存の符号化方式で符号化される画像を互換画像といい、互換画像を用いて互換画像の視点数より多い視点の画像を生成するための画像を補助画像という。
符号化装置50において、撮影部51Aは、所定の視点のHD(High Definition)画像を画像A1として撮影し、画像変換部52、視差画像生成部53、および視点間距離情報生成部56に供給する。撮影部51Bは、撮影部51Aから距離Δd1ABだけ、被写体との奥行方向の距離が同一である水平方向に離れた位置で、画像A1とは異なる視点のHD画像を画像B1として撮影し、画像変換部52、視差画像生成部53、および視点間距離情報生成部56に供給する。撮影部51Cは、撮影部51Aから距離Δd1ACだけ撮影部51Bとは反対の水平方向に離れた位置で、画像A1および画像B1とは異なる視点のHD画像を画像C1として撮影し、画像変換部52、視差画像生成部53、および視点間距離情報生成部56に供給する。
なお、画像B1と画像C1に対応する視点は、3D画像として知覚可能な画像の視点のうち、より外側の視点である。これにより、符号化装置50に対応する復号装置は、画像A1乃至画像C1を用いて、画像B1および画像C1の視点より内側の視点の画像を補間することで、多視点の画像を生成することができる。その結果、内側の視点の画像を用いて外側の視点の画像を補間する場合に比べて、多視点の画像を高精度に生成することができる。距離Δd1ABと距離Δd1ACは、固定であってもよいし、時間ごとに変化するようにしてもよい。
画像変換部52は、撮影部51A乃至撮影部51Cのうちの水平方向の位置が内側にある撮影部51Aから供給される画像A1を互換画像に決定する。画像変換部52は、互換画像として画像A1を指定する情報を互換情報生成部55に供給する。そして、画像変換部52は、互換画像である画像A1をそのままエンコーダ58に供給する。
また、画像変換部52は、画像A1以外の画像B1および画像C1を補助画像とし、所定の多重化方式で多重化する。具体的には、例えば多重化方式がサイドバイサイド方式である場合、画像変換部52は、画像B1および画像C1の解像度を半分にする。そして、画像変換部52は、解像度が半分にされた画像B1(以下、1/2解像度画像B1という)が画面の左半分の画像となり、解像度が半分にされた画像C1(以下、1/2解像度画像C1という)が画面の右半分の画像となるように、1/2解像度画像B1および1/2解像度画像C1を多重化する。画像変換部52は、多重化の結果得られる多重化画像をエンコーダ58に供給し、補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
視差画像生成部53は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、画像A1乃至画像C1の各画素の視差を検出する。視差画像生成部53は、互換画像である画像A1の各画素の視差を表す視差画像A1’を生成し、そのままエンコーダ58に供給する。また、視差画像生成部53は、補助画像である画像B1の各画素の視差を表す視差画像B1’と、補助画像である画像C1の各画素の視差を表す視差画像C1’を生成し、所定の多重化方式で多重化する。視差画像生成部53は、その結果得られる多重化画像をエンコーダ58に供給する。視差画像生成部53は、補助画像の視差画像の多重化方式を示す情報を視差画像情報生成部57に供給する。
画像情報生成部54は、画像変換部52から供給される情報に基づいて、補助画像の多重化方式を示す情報などを、互換画像および補助画像に関する情報である画像情報として生成し、多重化部59に供給する。
互換情報生成部55は、画像変換部52から供給される情報に基づいて、互換画像を指定する情報、互換モードなどを、互換に関する情報である互換情報として生成し、多重化部59に供給する。
なお、互換モードとは、互換画像の符号化方法を表すモードである。互換モードとしては、例えば、1視点の互換画像をAVC方式で符号化する符号化方法を表すモノモード(mono)、2視点の互換画像を多重化し、AVC方式で符号化する符号化方法を表すフレームパッキングモード(frame packing)、2視点の互換画像をMVC方式で符号化する符号化方法を表すステレオモード(stereo)などがある。
視点間距離情報生成部56は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、画像A1乃至画像C1のうちの2枚の画像の視点間の距離(以下、視点間距離という)を検出する。例えば、視点間距離情報生成部56は、撮影部51Aと撮影部51Bの間の水平方向の距離Δd1AB、および、撮影部51Aと撮影部51Cの間の水平方向の距離Δd1ACを視点間距離として検出する。視点間距離情報生成部56は、視点間距離を表す情報などを、視点間距離に関する情報である視点間距離情報として生成し、多重化部59に供給する。
視差画像情報生成部57は、視差画像生成部53から供給される情報に基づいて、補助画像の視差画像の多重化方式を示す情報などを、視差画像に関する情報である視差画像情報として生成し、多重化部59に供給する。
エンコーダ58は、互換用エンコーダ61と補助用エンコーダ62により構成される。
互換用エンコーダ61(互換画像符号化部)は、画像変換部52から供給される互換画像と補助画像の多重化画像から互換画像である画像A1を指定し、画像A1に対して既存のAVC方式でアクセスユニット単位の符号化を行う。互換用エンコーダ61は、その結果得られる符号化ストリームを互換ストリーム(第1の符号化ストリーム)として多重化部59に供給する。
補助用エンコーダ62(補助画像符号化部)は、画像変換部52からの補助画像の多重化画像、並びに視差画像生成部53からの互換画像の視差画像A1’および補助画像の視差画像の多重化画像に対して所定の方式でアクセスユニット単位の符号化を行う。補助用エンコーダ62は、その結果得られる符号化ストリーム(第2の符号化ストリーム、第1の視差符号化ストリーム、第2の視差符号化ストリーム)を補助ストリームとして多重化部59に供給する。なお、補助用エンコーダ62における符号化方式としては、AVC方式、MVC方式、MPEG2(Moving Picture Experts Group phase 2)方式などを用いることができる。
多重化部59(設定部および伝送部)は、互換用エンコーダ61から供給される互換ストリーム、補助用エンコーダ62から供給される補助ストリーム、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部56からの視点間距離情報、および視差画像情報生成部57からの視差画像情報などを用いて、TSを生成する。多重化部59は、生成されたTSを多重化し、その結果得られる多重化ストリームを送信する。
なお、以下では、画像情報、互換情報、視点間距離情報、および視差画像情報をまとめて補助情報という。
[TSの構成例]
図3は、図2の多重化部59により生成されるTSの構成例を示す図である。
図3の例では、多重化部59において、互換ストリームからTS1が生成される。また、符号化された補助画像の多重化画像、互換画像の視差画像A’、および補助画像の視差画像の多重化画像を含む補助ストリームと補助情報からTS2が生成される。
図3の例では、互換ストリームと、互換ストリーム以外のものが別のTSに格納されるので、互換ストリームの情報量を削減する必要がない。よって、互換画像の画質を、既存のAVC方式で符号化される2D画像の画質と同等にすることができる。
図4は、図3のTS2の詳細構成例を示す図である。
図4のA乃至図4のCに示すように、図3のTS2には、ユニット単位でデータが配置され、各ユニットの先頭には、ユニットの区切り(境界)を表すデリミタ(Del)(境界情報)が挿入される。
図4のAの例では、各ユニットに、デコード単位であるアクセスユニット単位の符号化された補助画像の多重化画像(B1+C1)と補助画像の多重化画像の補助情報(Aux Inf)、符号化された互換画像の視差画像(A1’)と互換画像の視差画像の補助情報、または符号化された補助画像の視差画像の多重化画像(B1'+C1’)と補助画像の視差画像の多重化画像の補助情報が、データとして配置されている。
この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を、それぞれ独立に抽出することができる。その結果、例えば、復号装置が、互換画像と互換画像の視差画像のみを用いて多視点の画像を生成する場合、多視点の画像の生成に用いられる画像を容易に抽出することができる。また、補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像の各画像と、その画像の補助情報が同一のユニット内に配置されるので、各ユニットに配置される画像を容易に独立して処理することができる。
図4のBの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像、並びに補助情報がまとめて配置されている。この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像、並びに補助情報をまとめて抽出することができる。
図4のCの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像と補助画像の多重化画像の補助情報、または、符号化された互換画像の視差画像および補助画像の視差画像の多重化画像、並びに互換画像の視差画像および補助画像の視差画像の補助情報が、配置されている。
この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像と、互換画像の視差画像および補助画像の視差画像の多重化画像とを、それぞれ独立に抽出することができる。その結果、例えば、復号装置において、画像用のデコーダと視差画像用のデコーダが別に用意される場合、それぞれのデコーダに効率的にデータを供給することができる。また、復号装置において、画像と視差画像を容易に独立して処理することができる。
[多重化方法の説明]
図5は、TS1とTS2の多重化方法の例を説明する図である。
図5に示すように、TS1およびTS2は、アクセスユニット単位で、TS2、TS1の順に先頭から配置されることにより、多重化される。なお、TS2の先頭には、互換ストリーム以外の情報を含むTSの先頭であることを表す3DV Representation Delimiter(境界情報)が設定され、付加される。即ち、3DV Representation Delimiterは、あるアクセスユニットのTS2と、1つ前のアクセスユニットのTS1の境界に配置される。よって、符号化装置50に対応する復号装置は、ある3DV Representation Delimiterから次の3DV Representation Delimiterまでの間のデータを抽出することにより、互換ストリームと、それに同期する補助ストリームおよび補助画像を容易に認識することができる。
[符号化装置の処理の説明]
図6および図7は、図2の符号化装置50による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部51A乃至撮影部51Cから画像A1乃至画像C1が出力されたとき開始される。
図6のステップS11において、視点間距離情報生成部56は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて、距離Δd1ABと距離Δd1ACを視点間距離として検出する。
ステップS12において、視点間距離情報生成部56は、ステップS11で検出された視点間距離を表す情報などを視点間距離情報として生成し、多重化部59に入力する。
ステップS13において、画像変換部52は、撮影部51A乃至撮影部51Cのうちの水平方向の位置が内側にある撮影部51Aから供給される画像A1を互換画像に決定し、補助画像の多重化方式を決定する。画像変換部52は、互換画像として画像A1を指定する情報を互換情報生成部55に供給し、補助画像の多重化方式を画像情報生成部54に供給する。
ステップS14において、互換情報生成部55は、画像変換部52から供給される情報に基づいて、互換画像として画像A1を指定する情報、互換モードとしてのモノモードなどを互換情報として生成し、多重化部59に入力する。
ステップS15において、画像情報生成部54は、画像変換部52から供給される情報に基づいて、補助画像の多重化方式を示す情報などを画像情報として生成し、多重化部59に入力する。
ステップS16において、画像変換部52は、画像A1以外の画像B1および画像C1を補助画像として、ステップS13で決定された補助画像の多重化方式に基づいて補助画像を多重化し、補助画像の多重化画像を得る。
ステップS17において、画像変換部52は、互換画像である画像A1と補助画像の多重化画像をエンコーダ58に入力する。
図7のステップS18において、視差画像生成部53は、撮影部51A乃至撮影部51Cから供給される画像A1乃至画像C1を用いて画像A1乃至画像C1の各画素の視差を検出し、視差画像A1’乃至視差画像C1’を生成する。
ステップS19において、視差画像生成部53は、補助画像の視差画像の多重化方式を決定し、その多重化方式を示す情報を視差画像情報生成部57に供給する。
ステップS20において、視差画像情報生成部57は、視差画像生成部53から供給される情報に基づいて、補助画像の視差画像の多重化方式を示す情報などを、視差画像情報として生成し、多重化部59に入力する。
ステップS21において、視差画像生成部53は、ステップS19で決定された補助画像の視差画像の多重化方式に基づいて、補助画像の視差画像を多重化し、補助画像の視差画像の多重化画像を得る。
ステップS22において、視差画像生成部53は、互換画像の視差画像A1'と補助画像の視差画像の多重化画像をエンコーダ58に入力する。
ステップS23において、エンコーダ58の互換用エンコーダ61は、画像変換部52から供給される互換画像である画像A1を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS24において、補助用エンコーダ62は、画像変換部52からの補助画像の多重化画像、並びに視差画像生成部53からの互換画像の視差画像A1’および補助画像の視差画像の多重化画像を所定の方式で符号化する。補助用エンコーダ62は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部59に供給する。
ステップS25において、多重化部59は、互換用エンコーダ61から供給される互換ストリームからTS1を生成し、補助用エンコーダ62から供給される補助ストリームおよび補助情報からTS2を生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD(Blu-Ray(登録商標) Disc )等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
以上のように、符号化装置50は、互換ストリームと、補助ストリームおよび補助情報とを別のTSに格納して多重化を行うので、多重化において既存の2D画像を符号化する符号化装置との互換性を確保することができる。即ち、符号化装置50は、多視点の画像に対して、既存の方式との互換性を有する方式で多重化を行うことができる。
また、符号化装置50は、多視点の画像のうちの1視点の画像を互換画像とし、既存の符号化方式で符号化するので、符号化において既存の2D画像を符号化する符号化装置との互換性を確保することができる。即ち、符号化装置50は、多視点の画像に対して、既存の符号化方式との互換性を有する方式で符号化を行うことができる。
さらに、符号化装置50は、3視点の画像A1乃至C1を符号化するので、符号化装置50に対応する復号装置は、3視点の画像A1乃至C1から多視点の画像を生成することができる。これにより、復号装置は、2視点の画像から生成する場合に比べて、生成可能な画像の視点が限られず、また、より精度の高い多視点の画像を生成することができる。
また、符号化装置50は、補助画像の解像度を低解像度化して符号化するので、低解像度化せずに符号化する場合に比べて、符号化処理および復号処理の処理コストを軽減することができる。例えば、2視点の補助画像が低解像度化されずに符号化される場合、符号化処理や復号処理の処理コストは、2枚のHD画像に対する符号化処理や復号処理の処理コストと等価であるが、符号化装置50による2視点の補助画像に対する符号化処理の処理コストは、1枚のHD画像に対する符号化処理や復号処理の処理コストと等価になる。その結果、復号装置における復号処理の性能が多視点の画像の画質に大きな影響を及ぼすことを防止することができる。
なお、符号化装置50に対応する復号装置は、後述するように、多視点の画像を合成する際、その多視点の画像の視点数の逆数倍に解像度を低下させるため、符号化装置50による補助画像の低解像度化は、合成後の多視点の画像の画質に影響を与えない。
また、符号化装置50は、補助画像の解像度を半分にして符号化し、補助画像の視差画像を半分にして符号化するので、符号化対象の情報量は、AVC方式における4HD画像分(1080ix4)程度にすることができる。
ここで、現在の多視点の画像を表示する表示装置と、それに伴う復号装置の処理速度、消費電力に対する処理パフォーマンス、伝送データレート、伝送帯域幅、メモリのバンド幅、メモリのアクセス速度などを総合的に鑑みると、復号装置で処理可能な情報量として妥当な値は、現状のMVC方式におけるHD画像分の2倍程度、即ちAVC方式における4HD画像分程度であると考えられる。従って、符号化対象の情報量がAVC方式における4HD画像分(1080ix4)程度である符号化装置50に対応する復号装置(復号方法)は、妥当な処理コスト、合理的なアプローチで実現することができる。
また、符号化装置50では、符号化対象の情報量がAVC方式における4HD画像分(1080ix4)程度に削減されるので、使用可能な帯域に制限のあるBDや放送のアプリケーションで容易に扱うことができる。
さらに、符号化装置50は、視差画像を生成し、符号化ストリームに含めて送信するので、符号化装置50に対応する復号装置は、多視点の画像を生成するために視差画像を生成する必要がなく、復号装置の処理の負荷を軽減することができる。その結果、復号装置の製造コストを低減することができる。また、復号装置の視差検出の性能が多視点の画像の画質に大きな影響を及ぼすことを防止することができる。
[復号装置の構成例]
図8は、図2の符号化装置50から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図8の復号装置120は、分離部121、デコーダ122、画像情報取得部123、視点間距離情報取得部124、視差画像情報取得部125、互換情報取得部126、および画像生成部127により構成される。復号装置120は、符号化装置50から送信される多重化ストリームを分離して復号し、1視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置120の分離部121(分離部)は、符号化装置50から送信されてくる多重化ストリームを受信し、TSごとに分離する。分離部121は、TSに含まれる互換ストリームと、TSに含まれる補助ストリームを抽出し、デコーダ122に供給する。また、分離部121は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
デコーダ122は、互換用デコーダ131と補助用デコーダ132により構成される。デコーダ122の互換用デコーダ131(互換画像復号部)は、分離部121から供給される互換ストリームに含まれる符号化された互換画像をAVC方式に対応する方式で復号し、画像生成部127に供給する。
補助用デコーダ132(補助画像復号部)は、分離部121から供給される補助ストリームに含まれる補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を、図2の補助用エンコーダ62に対応する方式で復号する。補助用デコーダ132は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像A’、および補助画像の視差画像の多重化画像を画像生成部127に供給する。
画像情報取得部123は、分離部121から供給される画像情報を取得し、画像生成部127に供給する。視点間距離情報取得部124は、分離部121から供給される視点間距離情報を取得し、画像生成部127に供給する。
視差画像情報取得部125は、分離部121から供給される視差画像情報を取得し、画像生成部127に供給する。互換情報取得部126は、分離部121から供給される互換情報を取得し、画像生成部127に供給する。
画像生成部127は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部127(生成部)は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部127は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部127は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。
さらに、画像生成部127は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部127は、互換画像、各補助画像、互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部127は、生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部127は、視聴者からの2D画像の表示指令に応じて、デコーダ122の互換用デコーダ131から供給される互換画像である画像A1を出力して、図示せぬ表示装置に表示させる。これにより、視聴者は、2D画像を見ることができる。
[復号装置の処理の説明]
図9は、図8の復号装置120による復号処理を説明するフローチャートである。この復号処理は、例えば、図2の符号化装置50から送信される多重化ストリームが復号装置120に入力されたとき、開始される。
図9のステップS31において、復号装置120の画像生成部127は、視聴者から2D画像の表示が指令されたかどうかを判定する。ステップS31で視聴者から2D画像の表示が指令されていないと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、処理はステップS32に進む。
ステップS32において、分離部121は、符号化装置50から送信されてくる多重化ストリームを受信し、その多重化ストリームからTS1とTS2を分離する。分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームとTS2に含まれる補助ストリームを抽出し、デコーダ122に供給する。また、分離部121は、デリミタなどを参照して、TS2に含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
ステップS33において、デコーダ122の互換用デコーダ131は、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、その互換画像をAVC方式に対応する方式で復号する。そして、互換用デコーダ131は、復号の結果得られる画像A1を画像生成部127に供給する。
ステップS34において、補助用デコーダ132は、補助ストリームから符号化された補助画像の多重化画像、互換画像の視差画像A’、および補助画像の視差画像の多重化画像を抽出し、図2の補助用エンコーダ62に対応する方式で復号する。補助用デコーダ132は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像A’、および補助画像の視差画像の多重化画像を画像生成部127に供給する。
ステップS35において、画像情報取得部123は、分離部121から供給される画像情報を取得し、画像生成部127に入力する。ステップS36において、視点間距離情報取得部124は、分離部121から供給される視点間距離情報を取得し、画像生成部127に入力する。
ステップS37において、視差画像情報取得部125は、分離部121から供給される視差画像情報を取得し、画像生成部127に入力する。ステップS38において、互換情報取得部126は、分離部121から供給される互換情報を取得し、画像生成部127に供給する。
ステップS39において、画像生成部127は、視点間距離情報取得部124からの視点間距離情報と、図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。例えば、視点間距離情報に含まれる視点間距離が狭い場合には、画像生成部127は、画像B1と画像C1の視点より外側の視点の位置も、生成する多視点の3D画像の視点の位置に決定する。一方、視点間距離情報に含まれる視点間距離が広い場合には、画像生成部127は、画像B1と画像C1の視点より内側の視点の位置のみを、生成する多視点の3D画像の視点の位置として決定する。
ステップS40において、画像生成部127は、ステップS39で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。
ステップS41において、画像生成部127は、ステップS40で生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換し、変換後の各視点の画像を視点の位置に基づいて合成する。
ステップS42において、画像生成部127は、ステップS41の処理により得られる合成後の多視点の画像を図示せぬ表示装置に出力し、視点ごとに視認可能な角度が異なるように表示させる。そして、処理は終了する。
一方、ステップS31で視聴者から2D画像の表示が指令されたと判定された場合、ステップS43において、分離部121は、多重化ストリームからTS1を分離する。具体的には、分離部121は、多重化ストリームのうち3DV Representation Delimiter NAL unitが付加されたTS2以外のTS1を取得する。そして、分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームを抽出し、デコーダ122に供給する。
ステップS44において、デコーダ122の互換用デコーダ131は、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、AVC方式に対応する方式で復号する。互換用デコーダ131は、復号の結果得られる互換画像である画像Aを画像生成部127に供給する。
ステップS45において、画像生成部127は、互換用デコーダ131から供給される互換画像である画像A1を図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
なお、復号装置120との互換性を有する互換ストリームのみを復号可能な復号装置では、3DV Representation Delimiter NAL unitが付加されたTS2が無視され、ステップS44およびS45の処理が行われる。
以上のように、復号装置120は、符号化装置50により既存の方式との互換性を有する方式で多重化された多重化ストリームを分離することができる。また、復号装置120は、符号化装置50により既存の方式との互換性を有し、処理コストの比較的少ない方式で符号化された互換ストリームと補助ストリームを復号することができる。
さらに、復号装置120は、1視点の互換画像と2視点の補助画像を用いて多視点の画像を生成するので、符号化装置50は、多視点の画像を生成するための撮影部として、既存の1視点の互換画像を撮影する撮影部51Aのほかに、2台の撮影部51Bと撮影部51Cのみを用意するだけでよい。従って、多視点の画像を生成するための撮影部の設置を容易に、かつ、低コストで行うことができる。
[TSの他の構成例]
図10は、図2の多重化部59により生成されるTSの他の構成例を示す図である。
図10の例では、多重化部59において、3本のTSが生成され、補助ストリームと補助情報が別のTSに含まれる。具体的には、互換ストリームからTS1が生成され、補助ストリームからTS2が生成され、補助情報からTS3が生成される。
図10の例では、比較的情報量が少ない補助情報のみから単独のTS3が生成される。従って、例えばBDのアプリケーションのように、同時に処理可能なTSの数に制限があるアプリケーションを実行する復号装置は、比較的情報量が少ないTS3をプリロードすることで、TS1とTS2を同期して再生することが可能になる。
なお、補助ストリームからなるTS2および補助情報からなるTS3の先頭には、補助ストリームと補助情報が同一のTSに含まれる場合と同様に、図5に示した3DV Representation Delimiterが配置される。
図11は、図10のTS2の詳細構成例を示す図である。
図11のA乃至図11のCに示すように、図10のTS2には、ユニット単位でデータが配置され、各ユニットの先頭には、ユニットの区切りを表すデリミタが挿入される。
図11のAの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像(B+C)、互換画像の視差画像(A’)、または補助画像の視差画像の多重化画像(B'+C’)が、データとして配置されている。
この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を、それぞれ独立に抽出することができる。その結果、例えば、復号装置が、互換画像と互換画像の視差画像のみを用いて多視点の画像を生成する場合、多視点の画像の生成に用いられる画像を容易に抽出することができる。
図11のBの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像がまとめて配置されている。この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像をまとめて抽出することができる。
図11のCの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像、または、符号化された互換画像の視差画像および補助画像の視差画像の多重化画像が、まとめて配置されている。
この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像と、互換画像の視差画像および補助画像の視差画像の多重化画像とを、それぞれ独立に抽出することができる。その結果、例えば、復号装置において、画像用のデコーダと視差画像用のデコーダが別に用意される場合、それぞれのデコーダに効率的にデータを供給することができる。また、復号装置において、画像と視差画像を容易に独立して処理することができる。
図12は、図10のTS3の詳細構成例を示す図である。
図12のA乃至図12のDに示すように、図10のTS3には、ユニット単位でデータが配置され、各ユニットの先頭には、ユニットの区切りを表すデリミタが挿入される。
図12のAの例では、各ユニットに、アクセスユニット単位の補助画像の多重化画像の補助情報(Aux Info(B+C))、互換画像の視差画像の補助情報(Aux Info(A’))、または補助画像の視差画像の多重化画像の補助情報(Aux Info(B'+C'))が、データとして配置されている。
この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の補助画像の多重化画像の補助情報、互換画像の視差画像の補助情報、および補助画像の視差画像の多重化画像の補助情報を、それぞれ独立に抽出することができる。その結果、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を容易に独立して処理することができる。
図12のBの例では、各ユニットに、アクセスユニット単位の補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像の補助情報(Aux Info(B+C,A',B'+C'))がまとめて配置されている。この場合、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像の補助情報をまとめて抽出することができる。
図12のCの例では、各ユニットに、アクセスユニット単位の補助画像の多重化画像の補助情報(Aux Info(B+C))、または、互換画像の視差画像および補助画像の視差画像の多重化画像の補助情報(Aux Info(A',B'+C'))が、配置されている。
この場合、TS3を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の補助画像の多重化画像の補助情報と、互換画像の視差画像および補助画像の視差画像の多重化画像の補助情報を、それぞれ独立に抽出することができる。その結果、例えば、復号装置において、画像用のデコーダと視差画像用のデコーダが別に用意される場合、復号結果に同期して効率的に補助情報を供給することができる。
図12のDの例では、各ユニットに、所定の時間分(例えば、2時間分)の補助画像の多重化画像の補助情報(Aux Info(All B+C))、互換画像の視差画像の補助情報(Aux Info(All A'))、および補助画像の視差画像の多重化画像の補助情報(Aux Info(All B'+C'))が配置されている。この場合、TS3を受信する復号装置は、補助情報をプリロードする際、ユニット単位でデータを抽出することにより、所定の時間分の補助画像の多重化画像の補助情報、互換画像の視差画像の補助情報、および補助画像の視差画像の多重化画像の補助情報をそれぞれまとめて抽出し、保持することができる。
[他の符号化処理の説明]
図10乃至図12で説明した構成のTSを生成する場合の符号化装置50の符号化処理は、図7のステップS25で、互換ストリームからTS1を生成し、補助ストリームからTS2を生成し、補助情報からTS3を生成して多重化する点を除いて、図6および図7の符号化処理と同様であるので説明は省略する。
[他の復号処理の説明]
図13は、多重化ストリームにおいて多重化されているTSの構成が図10乃至図12で説明した構成である場合の図8の復号装置120による復号処理を説明するフローチャートである。この復号処理は、例えば、図2の符号化装置50から送信される多重化ストリームが復号装置120に入力されたとき、開始される。
図13のステップS51において、復号装置120の画像生成部127は、視聴者から2D画像の表示が指令されたかどうかを判定する。ステップS31で視聴者から2D画像の表示が指令されていないと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、処理はステップS52に進む。
ステップS52において、分離部121は、符号化装置50から送信されてくる多重化ストリームを取得し、その多重化ストリームからTS3を分離する。そして、分離部121は、デリミタなどを参照して、TS3に含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給して保持させ、視点距離情報を視点間距離情報取得部124に供給して保持させる。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給して保持させ、互換情報を互換情報取得部126に供給して保持させる。そして、処理はステップS53に進む。
ステップS53乃至S66の処理は、図9のステップS32乃至S45の処理と同様であるので、説明は省略する。
なお、復号装置120との互換性を有する互換ストリームのみを復号可能な復号装置では、TS2およびTS3が無視され、ステップS65およびS66の処理が行われる。
<第2実施の形態>
[符号化装置の第2実施の形態の構成例]
図14は、本技術を適用した符号化装置の第2実施の形態の構成例を示すブロック図である。
図14に示す構成のうち、図2の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図14の符号化装置140の構成は、主に、撮影部51A乃至撮影部51C、画像変換部52、視差画像生成部53、視点間距離情報生成部56、エンコーダ58の代わりに撮影部141A乃至撮影部141D、画像変換部142、視差画像生成部143、視点間距離情報生成部144、エンコーダ145が設けられている点が図2の構成と異なる。
符号化装置140は、多視点の画像のうちの2視点の画像を互換画像としてAVC方式で符号化し、単独でTSを生成することにより、既存の2視点方式の3D画像をAVC方式で符号化する符号化装置との互換性を確保する。
具体的には、符号化装置140の撮影部141Aは、所定の視点のHD画像を画像A2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。撮影部141Bは、撮影部141Aから距離Δd2ABだけ水平方向に離れた位置で、画像A2とは異なる視点のHD画像を画像B2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。
撮影部141Cは、撮影部141Bから距離Δd2BCだけ撮影部141Aとは反対の水平方向に離れた位置で、画像A2および画像B2とは異なる視点のHD画像を画像C2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。撮影部141Dは、撮影部141Aから距離Δd2ADだけ撮影部141Bとは反対の水平方向に離れた位置で、画像A2乃至画像C2とは異なる視点のHD画像を画像D2として撮影し、画像変換部142、視差画像生成部143、および視点間距離情報生成部144に供給する。
なお、画像C2と画像D2に対応する視点は、3D画像として知覚可能な画像の視点のうち、より外側の視点である。これにより、符号化装置140に対応する復号装置は、画像A2乃至画像D2を用いて、画像C2および画像D2の視点より内側の視点の画像を補間することで、多視点の画像を生成することができる。その結果、内側の視点の画像を用いて外側の視点の画像を補間する場合に比べて、多視点の画像を高精度に生成することができる。距離Δd2AB、距離Δd2BC、および距離Δd2ADは、固定であってもよいし、時間ごとに変化するようにしてもよい。
画像変換部142は、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と撮影部141Bから供給される画像B2を互換画像に決定する。そして、画像変換部142は、互換画像である画像A2および画像B2を所定の多重化方式で多重化し、エンコーダ145に供給する。また、画像変換部142は、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給する。
また、画像変換部142は、画像A2および画像B2以外の画像C2および画像D2を補助画像とし、所定の多重化方式で多重化する。画像変換部142は、多重化の結果得られる多重化画像をエンコーダ145に供給する。画像変換部142は、互換画像と補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
視差画像生成部143は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2乃至画像D2の各画素の視差を検出する。視差画像生成部143は、互換画像である画像A2の各画素の視差を表す視差画像A2’と、画像B2の各画素の視差を表す視差画像B2’を生成し、所定の多重化方式で多重化する。視差画像生成部143は、その結果得られる多重化画像をエンコーダ145に供給する。
また、視差画像生成部143は、補助画像である画像C2の各画素の視差を表す視差画像C2’と、補助画像である画像D2の各画素の視差を表す視差画像D2’を生成し、所定の多重化方式で多重化する。視差画像生成部143は、その結果得られる多重化画像をエンコーダ145に供給する。視差画像生成部143は、互換画像および補助画像の視差画像の多重化方式を示す情報を視差画像情報生成部57に供給する。
視点間距離情報生成部144は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2乃至画像D2の視点間距離を検出する。例えば、視点間距離情報生成部144は、撮影部141Aと撮影部141Bの間の水平方向の距離Δd2AB、撮影部141Bと撮影部141Cの間の水平方向の距離Δd2BC、撮影部141Aと撮影部141Dの間の水平方向の距離Δd2ADを視点間距離として検出する。視点間距離情報生成部144は、視点間距離を表す情報などを視点間距離情報として生成し、多重化部59に供給する。
エンコーダ145は、互換用エンコーダ151と補助用エンコーダ152により構成される。互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像と補助画像の多重化画像から互換画像の多重化画像を指定し、互換画像の多重化画像に対して既存のAVC方式でアクセスユニット単位の符号化を行う。エンコーダ145は、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
補助用エンコーダ152は、画像変換部142からの補助画像の多重化画像、並びに視差画像生成部143からの互換画像の視差画像の多重化画像および補助画像の視差画像の多重化画像に対して所定の方式でアクセスユニット単位の符号化を行う。補助用エンコーダ152は、その結果得られる符号化ストリームを補助ストリームとして多重化部59に供給する。なお、補助用エンコーダ152における符号化方式としては、例えば、AVC方式、MVC方式などを用いることができる。
[TSの構成例]
図15は、図14の多重化部59により生成されるTSの構成例を示す図である。
図15の例では、多重化部59において、互換ストリームからTS1が生成され、補助ストリームと補助情報からTS2が生成される。
なお、図示は省略するが、図15のTS2の構成は、互換画像の視差画像の代わりに互換画像の視差画像の多重化画像が配置される点を除いて図4で説明した構成と同様である。
[符号化装置の処理の説明]
図16および図17は、図14の符号化装置140による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図16のステップS71において、視点間距離情報生成部144は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、距離Δd2AB、距離Δd2BC、距離Δd2ADを視点間距離として検出する。
ステップS72において、視点間距離情報生成部144は、ステップS71で検出された視点間距離を表す情報などを視点間距離情報として生成し、多重化部59に入力する。
ステップS73において、画像変換部142は、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と、撮影部141Bから供給される画像B2を互換画像に決定し、互換画像および補助画像の多重化方式を決定する。画像変換部142は、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給し、互換画像および補助画像の多重化方式を画像情報生成部54に供給する。
ステップS74において、互換情報生成部55は、画像変換部142から供給される情報に基づいて、互換画像として画像A2および画像B2を指定する情報、互換モードとしてのフレームパッキングモードなどを互換情報として生成し、多重化部59に入力する。
ステップS75において、画像変換部142は、ステップS73で決定された互換画像の多重化方式に基づいて互換画像である画像A2と画像B2を多重化し、エンコーダ145に供給する。
ステップS76において、画像情報生成部54は、画像変換部142から供給される情報に基づいて、互換画像および補助画像の多重化方式を示す情報などを画像情報として生成し、多重化部59に入力する。
ステップS77において、画像変換部142は、画像A2および画像B2以外の画像C2および画像D2を補助画像として、ステップS73で決定された補助画像の多重化方式に基づいて補助画像を多重化し、補助画像の多重化画像を得る。
ステップS78において、画像変換部142は、互換画像の多重化画像と補助画像の多重化画像をエンコーダ145に入力する。
図17のステップS79において、視差画像生成部143は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて画像A2乃至画像D2の各画素の視差を検出し、視差画像A2’乃至視差画像D2’を生成する。
ステップS80において、視差画像生成部143は、互換画像の視差画像と補助画像の視差画像の多重化方式を決定し、その多重化方式を示す情報を視差画像情報生成部57に供給する。
ステップS81において、視差画像情報生成部57は、視差画像生成部143から供給される情報に基づいて、互換画像の視差画像と補助画像の視差画像の多重化方式を示す情報などを、視差画像情報として生成し、多重化部59に入力する。
ステップS82において、視差画像生成部143は、ステップS80で決定された互換画像の視差画像の多重化方式に基づいて、互換画像の視差画像A2’と視差画像B2’を多重化し、補助画像の視差画像の多重化方式に基づいて補助画像の視差画像C2’と視差画像D2’を多重化する。
ステップS83において、視差画像生成部143は、ステップS82の多重化の結果得られる互換画像の視差画像の多重化画像と補助画像の視差画像の多重化画像をエンコーダ145に入力する。
ステップS84において、エンコーダ145の互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS85において、補助用エンコーダ152は、画像変換部142からの補助画像の多重化画像、並びに、視差画像生成部143からの互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を所定の方式で符号化する。補助用エンコーダ152は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部59に供給する。
ステップS86において、多重化部59は、互換用エンコーダ151から供給される互換ストリームからTS1を生成し、補助用エンコーダ152から供給される補助ストリームおよび補助情報からTS2を生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
以上のように、符号化装置140は、互換ストリームと、補助ストリームおよび補助情報とを別のTSに格納して多重化を行うので、多重化において既存の2視点方式の3D画像をAVC方式で符号化する符号化装置との互換性を確保することができる。即ち、符号化装置140は、多視点の画像に対して、既存の方式との互換性を有する方式で多重化を行うことができる。
また、符号化装置140は、多視点の画像のうちの2視点の画像を互換画像とし、既存の符号化方式で符号化するので、符号化において既存の2視点方式の3D画像を符号化する符号化装置との互換性を確保することができる。
さらに、符号化装置140は、4視点の画像A2乃至D2を符号化するので、符号化装置140に対応する復号装置は、4視点の画像A2乃至D2から多視点の画像を生成することができる。これにより、復号装置は、2視点の画像から生成する場合に比べて、生成可能な画像の視点が限られず、また、より精度の高い多視点の画像を生成することができる。
[復号装置の構成例]
図18は、図14の符号化装置140から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図18に示す構成のうち、図8の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図18の復号装置170の構成は、主に、画像生成部127の代わりに画像生成部171が設けられている点が図8の構成と異なる。復号装置170は、符号化装置140から送信される多重化ストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置170の画像生成部171は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部171は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部171は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部171は、視差画像情報に含まれる互換画像の視差画像の多重化方式を示す情報に基づいて、互換画像の視差画像の多重化画像から、各互換画像の視差画像を分離する。
さらに、画像生成部171は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部171は、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部171は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部171は、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部171は、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部171は、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ122から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部171は、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図19は、図18の復号装置170による復号処理を説明するフローチャートである。この復号処理は、例えば、図14の符号化装置140から送信される多重化ストリームが復号装置170に入力されたとき、開始される。
図19のステップS91において、復号装置170の分離部121は、符号化装置50から送信されてくる多重化ストリームを取得し、その多重化ストリームからTS1とTS2を分離する。分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームとTS2に含まれる補助ストリームを抽出し、デコーダ122に供給する。また、分離部121は、デリミタなどを参照して、TS2に含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
ステップS92において、画像生成部171は、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS92で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち多視点方式の3D画像の表示が指令された場合、処理はステップS93に進む。
ステップS93乃至S102の処理は、互換画像が互換画像の多重化画像であり、互換画像の視差画像が互換画像の視差画像の多重化画像である点を除いて、図9のステップS33乃至S42の処理と同様であるので、説明は省略する。
一方、ステップS92で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、処理はステップS103に進む。
ステップS103において、デコーダ122の互換用デコーダ131は、分離部121から供給される互換ストリームから符号化された互換画像の多重化画像を抽出し、AVC方式に対応する方式で復号する。互換用デコーダ131は、復号の結果得られる互換画像の多重化画像を画像生成部171に供給する。
ステップS104において、画像情報取得部123は、分離部121から供給される画像情報を画像生成部171に入力する。
ステップS105において、画像生成部171は、画像情報取得部123から供給される画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換用デコーダ131による復号の結果得られる互換画像の多重化画像を分離する。
ステップS106において、画像生成部171は、分離された互換画像の解像度の半分の解像度の互換画像である画像A2および画像B2を、交互に図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
なお、復号装置170との互換性を有する互換ストリームのみを復号可能な復号装置では、3DV Representation Delimiter NAL unitが付加されたTS2が無視され、ステップS103,S105、およびS106の処理が行われる。但し、この場合、ステップS105の処理では、予め決められた多重化方式に基づいて、互換画像の多重化画像が分離される。
以上のように、復号装置170は、符号化装置140により既存の方式との互換性を有する方式で多重化された多重化ストリームを分離することができる。また、復号装置170は、符号化装置140により既存の方式との互換性を有し、処理コストの比較的少ない方式で符号化された互換ストリームと補助ストリームを復号することができる。
さらに、復号装置170は、2視点の互換画像と2視点の補助画像を用いて多視点の画像を生成するので、符号化装置140は、多視点の画像を生成するための撮影部として、既存の2視点の互換画像を撮影する撮影部141Aおよび撮影部141Bのほかに、2台の撮影部141Cと撮影部141Dのみを用意するだけでよい。従って、多視点の画像を生成するための撮影部の設置を容易に、かつ、低コストで行うことができる。
[TSの他の構成例]
図20は、図14の多重化部59により生成されるTSの他の構成例を示す図である。
図20の例では、多重化部59において、3本のTSが生成され、補助ストリームと補助情報が別のTSに含まれる。具体的には、互換ストリームからTS1が生成され、補助ストリームからTS2が生成され、補助情報からTS3が生成される。
図20の例では、比較的情報量が少ない補助情報のみから単独のTS3が生成される。従って、例えばBDのアプリケーションのように、同時に処理可能なTSの数に制限があるアプリケーションを実行する復号装置は、比較的情報量が少ないTS3をプリロードすることで、TS1とTS2を同期して再生することが可能になる。
なお、図示は省略するが、図20のTS2の構成は、互換画像の視差画像の代わりに互換画像の視差画像の多重化画像が配置される点を除いて図11で説明した構成と同様である。また、TS3の構成は、互換画像の視差画像の補助画像の代わりに互換画像の視差画像の多重化画像の補助画像が配置される点を除いて図12で説明した構成と同様である。
[他の符号化処理の説明]
図20で説明した構成のTSを生成する場合の符号化装置140の符号化処理は、図17のステップS86で、互換ストリームからTS1を生成し、補助ストリームからTS2を生成し、補助情報からTS3を生成して多重化する点を除いて、図16および図17の符号化処理と同様であるので説明は省略する。
[他の復号処理の説明]
図21は、多重化ストリームにおいて多重化されているTSの構成が図20で説明した構成である場合の図18の復号装置170による復号処理を説明するフローチャートである。この復号処理は、例えば、図14の符号化装置140から送信される多重化ストリームが復号装置170に入力されたとき、開始される。
図21のステップS111において、復号装置120の分離部121は、符号化装置50から送信されてくる多重化ストリームを取得し、その多重化ストリームからTS3を分離する。そして、分離部121は、デリミタなどを参照して、TS3に含まれる補助情報を抽出する。分離部121は、補助情報のうちの画像情報を画像情報取得部123に供給して保持させ、視点距離情報を視点間距離情報取得部124に供給して保持させる。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給して保持させ、互換情報を互換情報取得部126に供給して保持させる。そして、処理はステップS112に進む。
ステップS112において、画像生成部127は、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS112で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち多視点方式の3D画像の表示が指令された場合、処理はステップS113に進む。
ステップS113において、分離部121は、多重化ストリームから、TS1とTS2を分離する。分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームとTS2に含まれる補助ストリームを抽出し、デコーダ122に供給する。そして、処理はステップS114に進む。
ステップS114乃至S123の処理は、図19のステップS93乃至S102の処理と同様であるので、説明は省略する。
一方、ステップS112で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、ステップS124において、分離部121は、多重化ストリームからTS1を分離する。そして、分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームをデコーダ122に供給し、処理をステップS125に進める。
ステップS125乃至S128の処理は、図19のステップS103乃至S106の処理と同様であるので、説明は省略する。
<第3実施の形態>
[符号化装置の第3実施の形態の構成例]
図22は、本技術を適用した符号化装置の第3実施の形態の構成例を示すブロック図である。
図22に示す構成のうち、図2や図14の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図22の符号化装置180の構成は、主に、画像変換部142、エンコーダ145の代わりに画像変換部181、エンコーダ182が設けられている点が図14の構成と異なる。符号化装置180は、多視点の画像のうちの2視点の画像を互換画像としてMVC方式で符号化し、1つのTSにまとめて格納するか、または、視点ごとに別のTSに格納することにより、既存の2視点方式の3D画像をMVC方式で符号化する符号化装置との互換性を確保する。
具体的には、符号化装置180の画像変換部181は、図14の画像変換部142と同様に、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と撮影部141Bから供給される画像B2を互換画像に決定する。そして、画像変換部181は、互換画像である画像A2および画像B2を、そのままエンコーダ182に供給する。また、画像変換部181は、画像変換部142と同様に、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給する。
また、画像変換部181は、画像変換部142と同様に、画像A2および画像B2以外の画像C2および画像D2を補助画像とし、所定の多重化方式で多重化する。画像変換部181は、多重化の結果得られる多重化画像をエンコーダ182に供給し、補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
エンコーダ182は、互換用エンコーダ191と補助用エンコーダ152により構成される。エンコーダ182の互換用エンコーダ191は、画像変換部181から供給される互換画像と補助画像の多重化画像から互換画像を指定し、互換画像のうちの画像A2をベース画像として既存のAVC方式でアクセスユニット単位の符号化を行い、画像B2をディペンデント画像として既存のMVC方式でアクセスユニット単位の符号化を行う。互換用エンコーダ191は、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
[TSの第1の構成例]
図23は、図22の多重化部59により生成されるTSの第1の構成例を示す図である。
図23の例では、多重化部59において、互換ストリームのうちの符号化後の画像A2からTS1が生成され、符号化後の画像B2、補助ストリーム、および補助情報からTS2が生成される。
[符号化装置の処理の説明]
図24および図25は、図22の符号化装置180による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図24のステップS131およびS132の処理は、図16のステップS71およびS72の処理と同様であるので、説明は省略する。
ステップS132の処理後、ステップS133において、画像変換部181は、撮影部141A乃至撮影部141Dのうちの水平方向の位置が内側にある撮影部141Aから供給される画像A2と、撮影部141Bから供給される画像B2を互換画像に決定し、補助画像の多重化方式を決定する。画像変換部181は、互換画像として画像A2および画像B2を指定する情報を互換情報生成部55に供給し、補助画像の多重化方式を画像情報生成部54に供給する。そして、処理はステップS134に進む。
ステップS134乃至S137の処理は、図6のステップS14乃至S17の処理と同様であるので、説明は省略する。ステップS138乃至S142の処理は、図17のステップS79乃至S83の処理と同様であるので、説明は省略する。
ステップS142の処理後、ステップS143において、エンコーダ182の互換用エンコーダ191は、画像変換部181から供給される互換画像のうちの画像A2をベース画像として既存のAVC方式で符号化し、画像B2をディペンデント画像として既存のMVC方式で符号化する。互換用エンコーダ191は、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS144において、補助用エンコーダ152は、画像変換部142からの補助画像の多重化画像、並びに、視差画像生成部53からの互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を所定の方式で符号化する。補助用エンコーダ152は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部59に供給する。
ステップS145において、多重化部59は、互換ストリームのうちの符号化後の画像AからTS1を生成し、符号化後の画像B、補助ストリーム、および補助情報からTS2を生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
以上のように、符号化装置180は、符号化後の互換画像のうちの一方と他方を別のTSに格納して多重化を行うので、多重化において既存の2視点方式の3D画像をMVC方式で符号化し、2つのTSに格納する符号化装置との互換性を確保することができる。
また、符号化装置180は、多視点の画像のうちの2視点の画像を互換画像とし、既存の符号化方式で符号化するので、符号化において既存の2視点方式の3D画像を符号化する符号化装置との互換性を確保することができる。
[復号装置の構成例]
図26は、図22の符号化装置180から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図26に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図26の復号装置200の構成は、主に、デコーダ122、画像生成部171の代わりにデコーダ201、画像生成部202が設けられている点が図18の構成と異なる。復号装置200は、符号化装置180から送信される多重化ストリームを復号し、1視点の画像、2視点の画像、または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置200のデコーダ201は、互換用デコーダ211と補助用デコーダ132により構成される。デコーダ201の互換用デコーダ211は、分離部121から供給される互換ストリームに含まれる符号化された互換画像をMVC方式に対応する方式で復号し、画像生成部202に供給する。
画像生成部202は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部202は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部202は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部202は、視差画像情報に含まれる互換画像の視差画像の多重化方式を示す情報に基づいて、互換画像の視差画像の多重化画像から、各互換画像の視差画像を分離する。
さらに、画像生成部202は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部202は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部202は、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部202は、画像生成部127と同様に、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部202は、視聴者からの2視点方式の3D画像の表示指令に応じて、デコーダ122から供給される互換画像としての画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
さらに、画像生成部202は、視聴者からの2D画像の表示指令に応じて、デコーダ122から供給される互換画像のうちの画像A2を出力して、図示せぬ表示装置に表示させる。これにより、視聴者は、2D画像を見ることができる。
[復号装置の処理の説明]
図27は、図26の復号装置200による復号処理を説明するフローチャートである。この復号処理は、例えば、図22の符号化装置180から送信される多重化ストリームが復号装置200に入力されたとき、開始される。
図27のステップS151において、復号装置200の画像生成部202は、視聴者から2D画像の表示が指令されたかどうかを判定する。ステップS151で視聴者から2D画像の表示が指令されたと判定された場合、処理はステップS152に進む。
ステップS152において、分離部121は、符号化装置180から送信されてくる多重化ストリームを受信し、その多重化ストリームからTS1を分離する。そして、分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームのうちの一部を抽出し、デコーダ201に供給する。
ステップS153において、デコーダ201の互換用デコーダ211は、分離部121から供給される互換ストリームの一部から符号化された互換画像のうちのベース画像である画像A2を抽出し、AVC方式に対応する方式で復号する。互換用デコーダ211は、復号の結果得られる画像A2を画像生成部202に供給する。
ステップS154において、画像生成部202は、互換用デコーダ211から供給される画像A2を図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
一方、ステップS151で視聴者から2D画像の表示が指令されていないと判定された場合、ステップS155において、分離部121は、多重化ストリームから、TS1とTS2を分離する。そして、分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームの一部を抽出し、デコーダ122に供給する。また、分離部121は、デリミタなどを参照して、TS2に含まれる互換ストリームの他の一部および補助ストリームを抽出し、デコーダ122に供給する。また、分離部121は、デリミタなどを参照して、TS2に含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。
ステップS156において、画像生成部202は、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS156で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、処理はステップS157に進む。
ステップS157において、デコーダ122の互換用デコーダ211は、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、復号する。具体的には、互換用デコーダ211は、分離部121から供給される互換ストリームの一部から符号化された画像Aを抽出し、互換ストリームの他の一部から符号化された画像Bを抽出する。そして、互換用デコーダ211は、符号化された画像Aを符号化されたベース画像としてAVC方式に対応する方式で復号し、符号化された画像Bを符号化されたディペンデント画像として、MVC方式に対応する方式で復号する。互換用デコーダ211は、復号の結果得られる互換画像である画像Aおよび画像Bを画像生成部202に供給する。
ステップS158において、画像生成部202は、互換用デコーダ211から供給される互換画像のうちの画像A1と画像B1を交互に出力し、図示せぬ表示装置に表示させる。そして、処理は終了する。
一方、ステップS156で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、処理はステップS159に進む。
ステップS159において、互換用デコーダ211は、ステップS157の処理と同様に、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、MVC方式に対応する方式で復号する。互換用デコーダ211は、復号の結果得られる互換画像である画像Aおよび画像Bを画像生成部202に供給する。
ステップS160において、補助用デコーダ132は、補助ストリームから符号化された補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を抽出し、図22の補助用エンコーダ152に対応する方式で復号する。補助用デコーダ132は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を画像生成部202に供給する。
ステップS161乃至S168の処理は、互換画像の視差画像が互換画像の視差画像の多重化画像である点を除いて、図9のステップS35乃至S42の処理と同様であるので、説明は省略する。
なお、復号装置200との互換性を有する互換ストリームのみを復号可能な復号装置では、TS2の補助ストリームおよび補助情報は無視され、ステップS151乃至S155、S157、およびS158の処理が行われる。
以上のように、復号装置200は、符号化装置180により既存の方式との互換性を有する方式で多重化された多重化ストリームを分離することができる。また、復号装置200は、符号化装置180により既存の方式との互換性を有し、処理コストの比較的少ない方式で符号化された互換ストリームと補助ストリームを復号することができる。
[TSの第2の構成例]
図28は、図22の多重化部59により生成されるTSの第2の構成例を示す図である。
図28の例では、多重化部59において、3本のTSが生成され、互換ストリームのうちの符号化された互換画像の1つである画像B2と、補助ストリームおよび補助情報が別のTSに含まれる。具体的には、互換ストリームのうちの符号化された互換画像の一方である画像A2からTS1が生成され、他方である画像B2からTS2が生成され、補助ストリームおよび補助情報からTS3が生成される。
図28の例では、互換ストリームのうちの符号化後の画像A1と画像B2がそれぞれ単独でTSに格納されるので、互換ストリームの情報量を削減する必要がない。よって、互換画像の画質を既存のMVC方式で符号化される2視点の画像の画質と同等にすることができる。
[多重化方法の説明]
図29は、図28のTS1乃至TS3の多重化方法の例を説明する図である。
図29に示すように、TS1乃至TS3は、アクセスユニット単位で、TS3、TS1、TS2の順に先頭から配置されることにより、多重化される。なお、TS3の先頭には、互換ストリーム以外の情報を含むTSの先頭であることを表す3DV Representation Delimiterが付加される。即ち、3DV Representation Delimiterは、あるアクセスユニットのTS3と、1つ前のアクセスユニットのTS2の境界に配置される。よって、復号装置200は、ある3DV Representation Delimiterから次の3DV Representation Delimiterまでの間のデータを抽出することにより、互換ストリームと、それに同期する補助ストリームおよび補助画像を容易に認識することができる。
[第2の符号化処理の説明]
図28で説明した構成のTSを生成する場合の符号化装置180の符号化処理は、図25のステップS145で、互換ストリームのうちの符号化後の画像AからTS1が生成され、符号化後の画像BからTS2が生成され、補助ストリームおよび補助情報からTS3が生成される点を除いて、図24および図25で説明した符号化処理と同様であるので、説明は省略する。
[第2の復号処理の説明]
図30は、多重化ストリームにおいて多重化されているTSの構成が図28で説明した構成である場合の図26の復号装置200による復号処理を説明するフローチャートである。この復号処理は、例えば、図22の符号化装置180から送信される多重化ストリームが復号装置200に入力されたとき、開始される。
図30のステップS181乃至S184の処理は、図27のステップS151乃至S154の処理と同様であるので、説明は省略する。
ステップS181で視聴者から2D画像の表示が指令されていないと判定された場合、ステップS185において、画像生成部202は、図30のステップS156の処理と同様に、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS185で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、処理はステップS186に進む。
ステップS186において、分離部121は、図27のステップS155の処理と同様に、多重化ストリームから、TS1とTS2を分離する。そして、分離部121は、デリミタなどを参照して、TS1に含まれる互換ストリームの一部とTS2に含まれる互換ストリームの他の一部を抽出し、デコーダ122に供給する。そして、処理はステップS187に進む。
ステップS187およびS188の処理は、図27のステップS157およびS158の処理と同様であるので、説明は省略する。
一方、ステップS185で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、処理はステップS189に進む。
ステップS189において、分離部121は、多重化ストリームからTS3を分離する。そして、分離部121は、デリミタなどを参照して、TS3に含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給して保持させ、視点距離情報を視点間距離情報取得部124に供給して保持させる。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給して保持させ、互換情報を互換情報取得部126に供給して保持させる。また、分離部121は、デリミタなどを参照して、TS3に含まれる補助ストリームを抽出し、デコーダ122に供給する。
ステップS190において、分離部121は、ステップS186の処理と同様に、多重化ストリームから、TS1とTS2を分離する。そして、分離部121は、TS1に含まれる互換ストリームの一部とTS2に含まれる互換ストリームの他の一部を抽出し、デコーダ122に供給する。
ステップS191乃至S200の処理は、図27のステップS159乃至S168の処理と同様であるので、説明は省略する。
なお、復号装置200との互換性を有する互換ストリームのみを復号可能な復号装置では、TS3は無視され、ステップS181乃至S188の処理が行われる。
以上のように、復号装置200は、符号化装置180により既存の方式との互換性を有する方式で多重化された多重化ストリームを分離することができる。
[TSの第3の構成例]
図31は、図22の多重化部59により生成されるTSの第3の構成例を示す図である。
図31の例では、多重化部59において、3本のTSが生成され、互換ストリーム、補助ストリーム、および補助情報がそれぞれ別のTSに含まれる。具体的には、互換ストリームからTS1が生成され、補助ストリームからTS2が生成され、補助情報からTS3が生成される。
図31の例では、比較的情報量が少ない補助情報のみから単独のTS3が生成される。従って、例えばBDのアプリケーションのように、同時に処理可能なTSの数に制限があるアプリケーションを実行する復号装置は、比較的情報量が少ないTS3をプリロードすることで、TS1とTS2を同期して再生することが可能になる。
また、図31の例では、互換ストリームが、補助ストリームおよび補助情報とは異なるTSに格納されるので、符号化装置は、互換ストリームを生成した後に、他の装置から補助ストリームおよび補助情報をダウンロード等により取得し、多重化ストリームを生成することができる。
さらに、互換ストリームが、1つのTSに格納されるので、符号化装置180は、多重化において既存の2視点方式の3D画像をMVC方式で符号化し、1つのTSに格納する符号化装置との互換性を確保することができる。
[第3の符号化処理の説明]
図31で説明した構成のTSを生成する場合の符号化装置180の符号化処理は、図25のステップS145で、互換ストリームからTS1が生成され、補助ストリームからTS2が生成され、補助情報からTS3が生成される点を除いて、図24および図25で説明した符号化処理と同様であるので、説明は省略する。
[第3の復号処理の説明]
図32は、多重化ストリームにおいて多重化されているTSの構成が図31で説明した構成である場合の図26の復号装置200による復号処理を説明するフローチャートである。この復号処理は、例えば、図22の符号化装置180から送信される多重化ストリームが復号装置200に入力されたとき、開始される。
図32のステップS211において、復号装置200の画像生成部202は、図27のステップS151の処理と同様に、視聴者から2D画像の表示が指令されたかどうかを判定する。ステップS211で視聴者から2D画像の表示が指令されたと判定された場合、処理はステップS212に進む。
ステップS212において、分離部121は、符号化装置180から送信されてくる多重化ストリームを受信し、その多重化ストリームからTS1を分離する。そして、分離部121は、TS1に含まれる互換ストリームを抽出し、デコーダ201に供給する。
ステップS213において、デコーダ201の互換用デコーダ211は、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、MVC方式に対応する方式で復号する。互換用デコーダ211は、復号の結果得られる画像A2を画像生成部202に供給する。
ステップS214において、画像生成部202は、図15のステップS154の処理と同様に、互換用デコーダ211から供給される画像A2を図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
一方、ステップS211で視聴者から2D画像の表示が指令されていないと判定された場合、ステップS215において、画像生成部202は、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS215で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、処理はステップS216に進む。
ステップS216において、分離部121は、多重化ストリームからTS1を分離する。そして、分離部121は、TS1に含まれる互換ストリームを抽出し、デコーダ122に供給する。
ステップS217において、デコーダ122の互換用デコーダ211は、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、MVC方式に対応する方式で復号する。互換用デコーダ211は、復号の結果得られる互換画像である画像Aおよび画像Bを画像生成部202に供給する。
ステップS218において、画像生成部202は、互換用デコーダ211から供給される互換画像のうちの画像A1と画像B1を交互に出力し、図示せぬ表示装置に表示させる。そして、処理は終了する。
一方、ステップS215で視聴者から2視点方式の3D画像の表示が指令されたと判定された場合、即ち視聴者から多視点方式の3D画像の表示が指令された場合、処理はステップS219に進む。
ステップS219において、分離部121は、符号化装置180から出力される多重化ストリームからTS3を分離する。そして、分離部121は、デリミタなどを参照して、TS3に含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給して保持させ、視点距離情報を視点間距離情報取得部124に供給して保持させる。さらに、分離部121は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給して保持させ、互換情報を互換情報取得部126に供給して保持させる。
ステップS220において、分離部121は、符号化装置180から出力される多重化ストリームから、TS1とTS2を分離する。そして、分離部121は、TS1に含まれる互換ストリームとTS2に含まれる補助ストリームを、デコーダ122に供給する。
ステップS221において、デコーダ122の互換用デコーダ211は、分離部121から供給される互換ストリームから符号化された互換画像を抽出し、MVC方式に対応する方式で復号する。互換用デコーダ211は、復号の結果得られる互換画像である画像Aおよび画像Bを画像生成部202に供給する。そして、処理はステップS222に進む。
ステップS222乃至S230の処理は、図30のステップS192乃至S200の処理と同様であるので、説明は省略する。
なお、上述した説明では、復号装置が、デリミタによりTSを分離したが、各TSのPIDが固定値である場合には、PIDによりTSを分離するようにしてもよい。この場合、互換ストリームのみを復号可能な復号装置は、互換ストリームが含まれるTS以外のPIDを認識していないため、そのTS以外無視する。
また、補助情報は、符号化されるようにしてもよい。
<第4実施の形態>
[符号化装置の第4実施の形態の構成例]
図33は、本技術を適用した符号化装置の第4実施の形態の構成例を示すブロック図である。
図33に示す構成のうち、図2の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図33の符号化装置230の構成は、主に、撮影部51Bおよび撮影部51C、画像変換部52、視差画像生成部53、視点間距離情報生成部56の代わりに、撮影部231−1乃至231−N(Nは4以上の2の倍数)、画像変換部232、視差画像生成部233、視点間距離情報生成部234が設けられている点が図2の構成と異なる。符号化装置230は、多視点の画像のうちの1視点の画像を互換画像とし、残りのN視点の画像を補助画像として符号化する。
具体的には、符号化装置230において、撮影部231−1乃至231−Nは、撮影部51Aを中心として、水平方向に順に並べられる。撮影部231−1と撮影部231−2、撮影部231−2と撮影部231−3、・・・、撮影部231−(N−1)と撮影部231−Nの距離は、それぞれ、距離Δd11、Δd12、・・・、Δd1N−1である。
撮影部231−1乃至231−Nは、それぞれ、画像A1とは異なる視点のHD画像を画像P1乃至PNとして撮影し、画像変換部232、視差画像生成部233、および視点間距離情報生成部234に供給する。なお、以下では、撮影部231−1乃至231−Nのそれぞれを特に区別する必要がない場合、それらをまとめて撮影部231という。同様に、画像P1乃至PNを画像Pという。
なお、画像Pに対応する視点は、3D画像として知覚可能な画像の視点のうち、より外側の視点である。これにより、符号化装置230に対応する復号装置は、画像A1と画像Pを用いて、画像Pの視点より内側の視点の画像を補間することで、多視点の画像を生成することができる。その結果、内側の視点の画像を用いて外側の視点の画像を補間する場合に比べて、多視点の画像を高精度に生成することができる。距離Δd11乃至Δd1N−1は、固定であってもよいし、時間ごとに変化するようにしてもよい。
画像変換部232は、撮影部51Aと撮影部231のうちの水平方向の位置が内側にある撮影部51Aから供給される画像A1を互換画像に決定する。画像変換部232は、互換画像として画像A1を指定する情報を互換情報生成部55に供給する。そして、画像変換部232は、互換画像である画像A1をそのままエンコーダ58に供給する。
また、画像変換部232は、画像A1以外の画像Pを補助画像とし、所定の多重化方式で多重化する。具体的には、例えば多重化方式がサイドバイサイド方式である場合、画像変換部232は、画像Pの解像度を半分にする。そして、画像変換部232は、解像度が半分にされた画像P1,P3,・・・,P(N−1)(以下、1/2解像度奇数画像という)が画面の左半分の画像となり、解像度が半分にされた画像P2,P4,・・・,PN(以下、1/2解像度偶数画像という)が画面の右半分の画像となるように、1/2解像度奇数画像と1/2解像度偶数画像を多重化する。画像変換部232は、多重化の結果得られる多重化画像をエンコーダ58に供給し、補助画像の多重化方式を示す情報を画像情報生成部54に供給する。
視差画像生成部233は、撮影部51Aからの画像A1と撮影部231からの画像Pとを用いて、画像A1と画像Pの各画素の視差を検出する。視差画像生成部233は、互換画像である画像A1の視差画像A1’を生成し、そのままエンコーダ58に供給する。また、視差画像生成部233は、補助画像である画像P1乃至PNの視差画像P1’乃至PN’を生成し、画像変換部232と同様に、所定の多重化方式で多重化する。視差画像生成部233は、その結果得られる多重化画像をエンコーダ58に供給する。視差画像生成部233は、補助画像の視差画像の多重化方式を示す情報を視差画像情報生成部57に供給する。
なお、以下では、視差画像P1’乃至PN’を特に区別する必要がない場合、それらをまとめて視差画像P’という。
視点間距離情報生成部234は、撮影部51Aからの画像A1と撮影部231からの画像Pを用いて、画像A1と画像Pの視点間距離を検出する。例えば、視点間距離情報生成部234は、撮影部231−1と撮影部231−2の間の水平方向の距離Δd11、・・・、および、撮影部231−(N−1)と撮影部231−Nの間の水平方向の距離Δd1N−1を視点間距離として検出する。視点間距離情報生成部234は、視点間距離を表す情報などを視点間距離情報として生成し、多重化部59に供給する。
[TSの構成例]
図34は、図33の多重化部59により生成されるTSの構成例を示す図である。
図34の例では、多重化部59において、互換ストリームからTS1が生成される。また、符号化された補助画像である画像Pの多重化画像、互換画像の視差画像A’、および補助画像の視差画像P’の多重化画像を含む補助ストリームと補助情報からTS2が生成される。
図34の例では、図3の場合と同様に、互換ストリームと、互換ストリーム以外のものが別のTSに格納されるので、互換ストリームの情報量を削減する必要がない。よって、互換画像の画質を、既存のAVC方式で符号化される2D画像の画質と同等にすることができる。
図35は、図34のTS2の詳細構成例を示す図である。
図35のA乃至図35のCに示すように、図34のTS2には、ユニット単位でデータが配置され、各ユニットの先頭にはデリミタ(Del)が挿入される。
図35のAの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像(P1+P2,・・・,P(N-1)+PN)と補助画像の多重化画像の補助情報(Aux Inf)、符号化された互換画像の視差画像(A1')と互換画像の視差画像の補助情報、または符号化された補助画像の視差画像の多重化画像(P1’+P2’,・・・,P(N-1)’+PN’)と補助画像の視差画像の多重化画像の補助情報が、データとして配置されている。
この場合、図4のAの場合と同様に、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を、それぞれ独立に抽出することができる。その結果、例えば、復号装置が、互換画像と互換画像の視差画像のみを用いて多視点の画像を生成する場合、多視点の画像の生成に用いられる画像を容易に抽出することができる。また、補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像の各画像と、その画像の補助情報が同一のユニット内に配置されるので、各ユニットに配置される画像を容易に独立して処理することができる。
図35のBの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像、並びに補助情報がまとめて配置されている。この場合、図4のBの場合と同様に、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像、並びに補助情報をまとめて抽出することができる。
図35のCの例では、各ユニットに、アクセスユニット単位の符号化された補助画像の多重化画像と補助画像の多重化画像の補助情報、または、符号化された互換画像の視差画像および補助画像の視差画像の多重化画像、並びに互換画像の視差画像および補助画像の視差画像の補助情報が、配置されている。
この場合、図4のCの場合と同様に、TS2を受信する復号装置は、ユニット単位でデータを抽出することにより、アクセスユニット単位の符号化された補助画像の多重化画像と、互換画像の視差画像および補助画像の視差画像の多重化画像とを、それぞれ独立に抽出することができる。その結果、例えば、復号装置において、画像用のデコーダと視差画像用のデコーダが別に用意される場合、それぞれのデコーダに効率的にデータを供給することができる。また、復号装置において、画像と視差画像を容易に独立して処理することができる。
なお、図33の符号化装置230の符号化処理は、補助画像の視点数が2視点ではなく、N視点である点を除いて、図6および図7の符号化処理と同様であるので、説明は省略する。
以上のように、符号化装置230は、互換ストリームと、補助ストリームおよび補助情報とを別のTSに格納して多重化を行うので、多重化において既存の2D画像を符号化する符号化装置との互換性を確保することができる。
また、符号化装置230は、多視点の画像のうちの1視点の画像を互換画像とし、既存の符号化方式で符号化するので、符号化において既存の2D画像を符号化する符号化装置との互換性を確保することができる。即ち、符号化装置230は、多視点の画像に対して、既存の符号化方式との互換性を有する方式で符号化を行うことができる。
さらに、符号化装置230は、N+1視点の画像A1および画像Pを符号化するので、符号化装置230に対応する復号装置は、N+1視点の画像A1および画像Pから多視点の画像を生成することができる。これにより、復号装置は、2視点の画像から生成する場合に比べて、生成可能な画像の視点が限られず、また、より精度の高い多視点の画像を生成することができる。
また、符号化装置230は、補助画像の解像度を低解像度化して符号化するので、低解像度化せずに符号化する場合に比べて、符号化処理および復号処理の処理コストを軽減することができる。
[復号装置の構成例]
図36は、図33の符号化装置230から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図36に示す構成のうち、図8の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図36の復号装置260の構成は、主に、デコーダ122、画像生成部127の代わりに、デコーダ261、画像生成部262が設けられている点が図8の構成と異なる。復号装置120は、符号化装置230から送信される多重化ストリームを分離して復号し、1視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
図36の復号装置260のデコーダ261は、互換用デコーダ131と補助用デコーダ271により構成される。デコーダ261の補助用デコーダ271(補助画像復号部)は、分離部121から供給される補助ストリームに含まれる補助画像の多重化画像、互換画像の視差画像、および補助画像の視差画像の多重化画像を、図33の補助用エンコーダ62に対応する方式で復号する。補助用デコーダ271は、復号の結果得られる補助画像である画像Pの多重化画像、互換画像の視差画像A’、および補助画像の視差画像である視差画像P’の多重化画像を画像生成部262に供給する。
画像生成部262は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部262(生成部)は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像である画像A、補助画像である画像Pの多重化画像、互換画像の視差画像A’、および補助画像の視差画像P’の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部262は、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像P1’の多重化画像から、各補助画像の視差画像P’を分離する。また、画像生成部262は、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像である画像Pの多重化画像から、各画像Pを分離する。
さらに、画像生成部262は、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部262は、互換画像、各補助画像、互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部262は、生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部262は、視聴者からの2D画像の表示指令に応じて、デコーダ261の互換用デコーダ131から供給される互換画像である画像A1を出力して、図示せぬ表示装置に表示させる。これにより、視聴者は、2D画像を見ることができる。
なお、図36の復号装置260の復号処理は、補助画像がN視点の画像Pである点を除いて、図9の復号処理と同様であるので、説明は省略する。
以上のように、復号装置260は、符号化装置230により既存の方式との互換性を有する方式で多重化された多重化ストリームを分離することができる。また、復号装置260は、符号化装置230により既存の方式との互換性を有し、処理コストの比較的少ない方式で符号化された互換ストリームと補助ストリームを復号することができる。
<第5実施の形態>
[符号化装置の第5実施の形態の構成例]
図37は、本技術を適用した符号化装置の第5実施の形態の構成例を示すブロック図である。
図37の符号化装置290は、画像変換処理部291、視差情報生成部292、符号化処理部293、および伝送部294により構成される。符号化装置290は、2視点の互換画像のうちの一方をAVC方式で符号化し、他方をMVC方式で符号化し、1視点の補助画像、互換画像の視差画像、および補助画像の視差画像を3DV方式で符号化する。なお、3DV方式とは、AVC方式やMVC方式に準じた多視点方式での表示用の画像を符号化するための方式である。
具体的には、符号化装置290には、1視点の互換画像としての2視点方式における左目用の画像であるL画像と、L画像の視差画像(以下、L視差画像という)とからなるL視点画像が入力される。また、符号化装置290には、他の1視点の互換画像としての2視点方式における右目用の画像であるR画像と、R画像の視差画像(以下、R視差画像という)とからなるR視点画像が入力される。さらに、符号化装置290には、補助画像としてのO画像とO画像の視差画像(以下、O視差画像という)とからなるO視点画像が入力される。ここでは、L視点画像、R視点画像、およびO視点画像の解像度は全て同一であるものとする。
符号化装置290の画像変換処理部291は、符号化装置290に入力されるO視点画像を構成するO画像とO視差画像に対して、それぞれ、フィルタ処理等の低解像度化処理を行うことにより、解像度を低下させる。画像変換処理部291は、低解像度化処理後のO視点画像を符号化処理部293に供給する。また、画像変換処理部291は、低解像度化処理におけるフィルタの種類を表す情報等を、補助画像の低解像度化処理に関する情報である補助画像低解像度変換情報として生成し、伝送部294に供給する。
視差情報生成部292(設定部)は、L画像、R画像、およびO画像の撮影時の情報等に基づいて、L視差画像、R視差画像、およびO視差画像の視差画像に関する情報である視差情報を生成し、符号化処理部293に供給する。
符号化処理部293は、符号化装置290に入力されるL視点画像のうちのL画像をAVC方式で符号化する。また、符号化処理部293は、R視点画像のうちのR画像を、L画像をベースビュー(ベース画像)とし、R画像をノンベースビュー(ディペンデント画像)として、MVC方式で符号化する。
さらに、符号化処理部293は、L視差画像、R視点画像、および、画像変換処理部291から供給される低解像度化処理後のO視点画像を、3DV方式で符号化する。このとき、符号化処理部293は、低解像度化処理後のO視点画像を符号化する場合、参照するL視点画像やR視点画像に対して、フィルタ処理等の低解像度化処理を行い、その結果得られるO視点画像の解像度と同一の解像度のL視点画像やR視点画像を参照画像として用いる。
符号化処理部293は、符号化の結果得られるL視点画像、R視点画像、およびO視点画像の符号化データ、並びに、視差情報生成部292から供給される視差情報からビットストリームを生成し、そのビットストリームを伝送部294に供給する。また、符号化処理部293は、O視点画像の参照画像を生成する際の低解像度化処理におけるフィルタの種類を表す情報等を、参照画像の低解像度化処理に関する情報である参照画像低解像度変換情報として生成し、伝送部294に供給する。
伝送部294は、画像変換処理部291から供給される補助画像低解像度変換情報、並びに、符号化処理部293から供給されるビットストリームおよび参照画像低解像度変換情報からTSを生成し、伝送する。
[符号化処理部の構成例]
図38は、図37の符号化処理部293の構成例を示す図である。
図38の符号化処理部293は、符号化部301、付加情報生成部302、付加部303、およびビットストリーム生成部304により構成される。
符号化処理部293の符号化部301は、互換符号化部311と補助符号化部312により構成される。符号化部301の互換符号化部311は、互換画像であるL画像とR画像のうちのL画像をAVC方式で符号化する。また、互換符号化部311は、L画像をベースビューとし、R画像をノンベースビューとしてR画像をMVC方式で符号化する。互換符号化部311は、符号化の結果得られるL画像とR画像の符号化データを付加部303に供給する。
補助符号化部312は、互換画像の視差画像であるL視差画像およびR視差画像、補助画像であるO画像、並びに補助画像の視差画像であるO視差画像を3DV方式で符号化する。具体的には、補助符号化部312は、O画像を、L画像やR画像を参照画像として3DV方式で符号化する。このとき、補助符号化部312は、参照するL画像やR画像に対して低解像度化処理を行い、そのL画像やR画像の解像度をO画像の解像度と同一の解像度に低下させる。そして、補助符号化部312は、低解像度化処理後のL画像やR画像を参照してO画像を符号化する。
また、補助符号化部312は、同一の視点の視差画像以外を参照せずにL視差画像を3DV方式で符号化し、R視差画像を、L視差画像を参照して3DV方式で符号化する。また、補助符号化部312は、低解像度化処理後のO視差画像を、L視差画像やR視差画像を参照して3DV方式で符号化する。このとき、補助符号化部312は、参照するL視差画像やR視差画像の解像度を、低解像度化処理により、O視差画像と同一の解像度に低下させ、低解像度化処理後のL視差画像やR視差画像を参照する。
補助符号化部312は、符号化の結果得られるL視差画像、R視差画像、およびO視点画像の符号化データを付加部303に供給する。また、補助符号化部312は、O視点画像の参照画像を生成する際の低解像度化処理におけるフィルタの種類を表す情報等を、参照画像低解像度変換情報として生成し、図37の伝送部294に供給する。
付加情報生成部302は、L画像のSPS(Sequence Parameter Set)、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSの情報を生成する。また、付加情報生成部302は、L画像、R画像、およびO画像のSEI(Supplemental Enhancement Information)の情報を生成する。さらに、付加情報生成部302は、図37の視差情報生成部292から供給されるL視差画像の視差情報を含むL視差画像のSEIの情報、R視差画像の視差情報を含むR視差画像のSEIの情報、およびO視差画像の視差情報を含むO視差画像のSEIの情報を生成する。付加情報生成部302は、L画像のSPSおよびSEIの情報、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSおよびSEIの情報を付加部303に供給する。
付加部303は、互換符号化部311から供給されるL画像の符号化データに、NAL(Network Abstraction Layer)ユニットのタイプとして、AVC方式のピクチャの種類を表す情報を含むNALヘッダを付加し、NALユニットを生成する。また、付加部303は、互換符号化部311から供給されるR画像の符号化データに、NALユニットのタイプとして、MVC方式の符号化データを表す情報を含むNALヘッダを付加し、NALユニットを生成する。
また、付加部303は、補助符号化部312から供給されるO画像の符号化データに、NALユニットのタイプとして3DV方式の符号化データを表す情報を含み、視差画像ではないことを表す視差フラグを含むNALヘッダを付加し、NALユニットを生成する。さらに、付加部303は、補助符号化部312から供給されるL視差画像、R視差画像、およびO視差画像の符号化データに、それぞれ、NALユニットのタイプとして3DV方式の符号化データを表す情報を含み、視差画像であることを表す視差フラグ(視差識別情報)、対応する画像に関する情報等を含むNALヘッダを付加し、NALユニットを生成する。
さらに、付加部303は、付加情報生成部302から供給されるL画像のSPSおよびSEIの情報、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSおよびSEIの情報に、それぞれ、NALユニットのタイプとして、それぞれの情報を表すNALヘッダを付加し、NALユニットを生成する。付加部303は、以上のようにして生成されたNALユニットをビットストリーム生成部304に供給する。
ビットストリーム生成部304は、付加部303から供給されるNALユニットを所定の順に配置してビットストリームを生成し、図37の伝送部294に供給する。
[符号化の説明]
図39は、図38の符号化部301による符号化における参照関係を示す図である。
図39に示すように、互換符号化部311は、L画像をAVC方式で符号化する。また、互換符号化部311は、L画像をベースビューとし、R画像をノンベースビューとして、R画像をMVC方式で符号化する。また、補助符号化部312は、低解像度化処理後のL画像やR画像を参照して、低解像度化処理後のO画像を3DV方式で符号化する。
また、図39に示すように、補助符号化部312は、同一の視点の視差画像以外を参照せずにL視差画像を3DV方式で符号化し、L視差画像を参照してR視差画像を3DV方式で符号化する。さらに、補助符号化部312は、低解像度化処理後のL視差画像やR視差画像を参照して、低解像度化処理後のO視差画像を3DV方式で符号化する。
[NALユニットの構成例]
図40は、図38の符号化処理部293により生成されるビットストリームのうちの、L視点画像、R視点画像、およびO視点画像の符号化データのNALユニットの構成例を示す図である。
図40のAに示すように、例えば、L画像が既存のAVC方式で符号化され、L視差画像、R視点画像、およびO視点画像がL画像をベースビューとしてMVC方式で符号化される場合、L画像の符号化データのNALユニットは、NALユニットのタイプとして、そのL画像のAVC方式のピクチャの種類を表す情報を含むNALヘッダと、L画像の符号化データとから構成される。
また、R画像、O画像、L視差画像、R視差画像、およびO視差画像の符号化データのNALユニットは、それぞれ、NALユニットのタイプ(NAL unit type)としてMVCの符号化データを表す情報を含むNALヘッダと、その符号化データとから構成される。従って、MVC方式で符号化されるR画像、O画像、L視差画像、R視差画像、およびO視差画像の符号化データのNALユニットのNALヘッダは同一である。
よって、ビットストリームを復号する復号装置において、R画像、O画像、L視差画像、R視差画像、およびO視差画像のNALユニットを識別することができない。従って、既存のMVC方式の復号装置は、必要なR画像のNALユニットだけを抽出して復号することができず、無駄な復号処理を行う。
これに対して、図40のBに示すように、符号化処理部293による符号化処理では、O画像、L視差画像、R視差画像、およびO視差画像のNALユニットのNALヘッダに、NALユニットのタイプとして3DV方式の符号化データを表す情報が含まれるとともに、拡張情報(nal_unit_header_3dv_extension)として視差フラグ(is_depth)が含まれる。
具体的には、O画像のNALユニットのNALヘッダには、視差画像ではないことを表す0である視差フラグが含まれる。これにより、復号装置において、O画像を識別することができる。また、L視差画像、R視差画像、およびO視差画像のNALユニットのNALヘッダには、視差画像であることを表す1である視差フラグが含まれる。これにより、復号装置において、L視差画像、R視差画像、およびO視差画像を識別することができる。
さらに、L視差画像、R視差画像、およびO視差画像のNALユニットのNALヘッダには、拡張情報として、対応する画像(互換画像、補助画像)に関する情報が含まれる。対応する画像に関する情報としては、対応する画像の視点数(num_cor_view_id)と、対応する画像の視点を特定する情報(cor_view_id)(互換画像識別情報、補助画像識別情報)がある。
ここでは、L視差画像は、1視点のL画像の視差画像であり、R視差画像は、1視点のR画像の視差画像であり、O視差画像は、1視点のO画像の視差画像である。また、図40の例では、L画像の視点を特定する情報が0であり、R画像の視点を特定する情報が1であり、O画像の視点を特定する情報が2である。
従って、L視差画像のNALユニットのNALヘッダに含まれる対応する画像に関する情報は、対応する画像の視点数としての1と、対応する画像の視点を特定する情報としての0である。また、R視差画像のNALユニットのNALヘッダに含まれる対応する画像に関する情報は、対応する画像の視点数としての1と、対応する画像の視点を特定する情報としての1である。さらに、O視差画像のNALユニットのNALヘッダに含まれる対応する画像に関する情報は、対応する画像の視点数としての1と、対応する画像の視点を特定する情報としての2である。
以上のように、拡張情報として、対応する画像に関する情報が含まれることにより、L視差画像、R視差画像、およびO視差画像をそれぞれ識別することができる。また、視差画像と画像の対応関係を表す、視差画像に対応する画像を特定する情報が、画像のNALヘッダではなく、視差画像のNALヘッダに含まれるので、互換画像のNALユニットの互換性を保つことができる。
なお、互換画像であるL画像のNALユニットのタイプは、AVC方式のピクチャであることを表す情報であり、R画像のNALユニットのタイプは、MVC方式の符号化データを表す情報である。従って、3DV方式の符号化データを表すNALユニットのタイプは、互換画像以外の情報の先頭を表す情報、即ち互換画像以外の情報の境界を表す境界情報であるといえる。
[ビットストリームの構成例]
図41は、図38のビットストリーム生成部304により生成されるビットストリームの構成例を示す図である。
図41のAに示すように、AVC方式で符号化されたL画像のビットストリームは、L画像のAVC方式のSPSの情報のNALユニット、L画像のAVC方式のSEIの情報のNALユニット、およびL画像の符号化データ(L color)のNALユニットにより構成される。
また、図41のBに示すように、MVC方式で符号化されたR画像のビットストリームは、R画像のMVC方式のSubset SPSの情報のNALユニット、R画像のMVC方式のSEIの情報のNALユニット、およびR画像の符号化データ(R color)のNALユニットにより構成される。
図41のCに示すように、3DV方式で符号化されたO画像のビットストリームは、O画像の3DV方式のSubset SPSの情報のNALユニット、O画像の3DV方式のSEIの情報のNALユニット、およびO画像の符号化データ(O color)のNALユニットにより構成される。
図41のDに示すように、3DV方式で符号化されたL視差画像のビットストリームは、L視差画像の3DV方式のSubset SPSの情報のNALユニット、L視差画像の視差情報(3DV_view_synthesis_info)を含む3DV方式のSEIの情報のNALユニット、およびL視差画像の符号化データ(L Depth)のNALユニットにより構成される。
図41のEに示すように、3DV方式で符号化されたR視差画像のビットストリームは、R視差画像の3DV方式のSubset SPSの情報のNALユニット、R視差画像の視差情報を含む3DV方式のSEIの情報のNALユニット、およびR視差画像の符号化データ(R Depth)のNALユニットにより構成される。
なお、図示は省略するが、3DV方式で符号化されたO視差画像のビットストリームは、R視差画像のビットストリームと同様に、O視差画像の3DV方式のSubset SPSの情報のNALユニット、O視差画像の視差情報を含む3DV方式のSEIの情報のNALユニット、およびO視差画像の符号化データのNALユニットにより構成される。
以上のように、視差情報は3DV方式のSEIに含まれるので、3DV方式に対応していない復号装置において、無駄に視差情報を処理する必要がない。
[3DV方式のSEIの構成例]
図42は、3DV方式のSEIの構成例を示す図である。
図42に示すように、3DV方式のSEIには、視差情報(3DV_view_synthesis_info)が含まれる。
図43は、視差情報(3DV_view_synthesis_info)の記述例を示す図である。
図43に示すように、視差情報としては、視差画像の各画素値が、視差そのものを表す視差値(Disparity)であるか、視差に対応する被写体の奥行き(Depth)を表すデプス値であるかを表す視差タイプ(depth_type)が記述される。
また、視差情報としては、視差画像の各画素値が所定の範囲(例えば、0から255までの範囲)内に正規化されているかどうかを表す正規化フラグ(is_normalized)(正規化識別情報)が記述される。
さらに、視差画像の各画素値がデプス値である場合、視差情報として、全視点に共通のデプス値の最大値(z_near)と、デプス値の最小値(z_far)が記述される。また、視差画像の各画素値が視差値である場合、視点ごとの視差値の最大値(max_disp)、視差値の最小値(min_disp)が記述される。
また、視差情報としては、視差画像に対応する画像を撮影するカメラの撮影モード(camera_mode)が記述される。撮影モードとしては、カメラと被写体との奥行方向の距離が同一となるように撮影する平行撮影モード(1D parallel mode)と、被写体から輻射方向に各カメラを配置して撮影する輻射付き撮影モード(General mode)がある。
視差情報としては、さらに、視差画像が表す視差が、その視差画像に対応する画像と、どの画像との視差であるのかを表す対応関係情報(interval_view_id)が記述される。さらに、視差情報としては、視差画像に対応する画像の視点数(num_cor_view_id)と、その画像を特定する情報(cor_vie_id)とが記述される。
また、視差情報としては、視差画像に対応する画像を撮影するカメラのパラメータ(camera_parameters)が記述される。なお、カメラのパラメータは、内部パラメータと外部パラメータにより構成される。内部パラメータは、全視点に共通のカメラの水平方向の焦点距離と、画像中心である主点、即ちレンズの光学的な中心の水平方向の位置とからなる。なお、主点の水平方向の位置は、視点ごとに異なり得る。また、外部パラメータは、カメラの水平方向の位置を定義するパラメータである。
[符号化装置の処理の説明]
図44は、図37の符号化装置290の多視点符号化処理を説明するフローチャートである。この多視点画像符号化処理は、例えば、L視点画像、R視点画像、およびO視点画像が符号化対象として符号化装置290に入力されたとき、開始される。
図44のステップS251において、符号化装置290の符号化処理部293は、符号化装置290に入力されたL視点画像を取得する。ステップS252において、符号化処理部293は、符号化装置290に入力されたR視点画像を取得する。ステップS253において、画像変換処理部291は、符号化装置290に入力されたO視点画像を取得する。
ステップS254において、画像変換処理部291は、O視点画像のうちのO画像とO視差画像のそれぞれに対して低解像度化処理を行う。画像変換処理部291は、低解像度化処理後のO視点画像を符号化処理部293に供給する。
ステップS255において、画像変換処理部291は、ステップS254の低解像度化処理におけるフィルタの種類を表す情報等を補助画像低解像度変換情報として生成し、伝送部294に供給する。
ステップS256において、視差情報生成部292は、L画像、R画像、およびO画像の撮影時の情報等に基づいて、L視差画像、R視差画像、およびO視差画像の視差情報を生成し、符号化処理部293に供給する。
ステップS257において、符号化処理部293は、L視点画像およびR視点画像、並びに、画像変換処理部291から供給される低解像度化処理後のO視点画像を符号化する符号化処理を行う。この符号化処理の詳細は、後述する図45を参照して説明する。
ステップS258において、伝送部294は、画像変換処理部291から供給される補助画像低解像度変換情報、並びに、符号化処理部293から供給される参照画像低解像度変換情報およびビットストリームからTSを生成し、伝送する。そして、処理は終了する。
図45は、図44のステップS257の符号化処理の詳細を説明するフローチャートである。
図45のステップS270において、符号化処理部293の符号化部301(図38)は、L視点画像、R視点画像、および低解像度化処理後のO視点画像を符号化する。具体的には、符号化部301の互換符号化部311が、L画像をAVC方式で符号化し、R画像をMVC方式で符号化する。また、補助符号化部312が、L視差画像、R視差画像、および低解像度化処理後のO視点画像を3DV方式で符号化する。符号化部301は、符号化の結果得られるL視点画像、R視点画像、およびO視点画像の符号化データを付加部303に供給する。
ステップS271において、補助符号化部312は、参照画像低解像度変換情報を生成し、図37の伝送部294に供給する。
ステップS272において、付加情報生成部302は、図37の視差情報生成部292から供給される視差情報を用いて、L画像のSPSおよびSEIの情報、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSおよびSEIの情報を生成し、付加部303に供給する。
ステップS273において、付加部303は、互換符号化部311から供給されるL画像の符号化データに、AVC方式のピクチャの種類を表すNALユニットのタイプを含むNALヘッダを付加し、NALユニットを生成する。付加部303は、生成されたL画像の符号化データのNALユニットをビットストリーム生成部304に供給する。
ステップS274において、付加部303は、互換符号化部311から供給されるR画像の符号化データに、MVC方式の符号化データを表すNALユニットのタイプを含むNALヘッダを付加し、NALユニットを生成する。付加部303は、生成されたR画像の符号化データのNALユニットをビットストリーム生成部304に供給する。
ステップS275において、付加部303は、補助符号化部312から供給されるO画像の符号化データに、3DV方式の符号化データを表すNALユニットのタイプと、視差画像ではないことを表す視差フラグを含むNALヘッダを付加し、NALユニットを生成する。付加部303は、生成されたO画像の符号化データのNALユニットをビットストリーム生成部304に供給する。
ステップS276において、付加部303は、補助符号化部312から供給されるL視差画像、R視差画像、およびO視差画像の符号化データに、それぞれ、3DV方式の符号化データを表すNALユニットのタイプ、視差画像であることを表す視差フラグ、および、対応する画像に関する情報を含むNALヘッダを付加し、NALユニットを生成する。付加部303は、生成されたL視差画像、R視差画像、およびO視差画像の符号化データのNALユニットをビットストリーム生成部304に供給する。
ステップS277において、付加部303は、付加情報生成部302から供給されるL画像のSPSおよびSEIの情報、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSおよびSEIの情報に、それぞれの情報を表すNALユニットのタイプを含むNALヘッダを付加し、NALユニットを生成する。付加部303は、生成されたL画像のSPSおよびSEIの情報、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSおよびSEIの情報のNALユニットを、ビットストリーム生成部304に供給する。
ステップS278において、ビットストリーム生成部304は、付加部303から供給されるNALユニットを所定の順に配置してビットストリームを生成し、図37の伝送部294に供給する。そして、処理は図44のステップS257に戻り、処理はステップS258に進む。
以上のように、符号化装置290は、互換画像を既存の符号化方式で符号化し、補助画像であるO画像の符号化データに、3DV方式の符号化データを表すNALユニットのタイプを含むNALヘッダを付加する。これにより、既存の符号化方式にのみ対応する復号装置は、NALヘッダに基づいて復号可能な互換画像の符号化データのみを抽出し、既存の符号化方式に対応する方式で復号することができるので、符号化装置290は、既存の方式との互換性を有する方式で符号化を行っているといえる。その結果、例えば、AVC方式、MVC方式、および3DV方式のそれぞれに対応するアプリケーション用のデータをまとめて符号化して放送することができる。
[AVC方式の復号装置の構成例]
図46は、図37の符号化装置290により伝送されてくるビットストリームを復号するAVC方式の復号装置の構成例を示すブロック図である。
図46の復号装置320は、受信部321、分離部322、およびAVC復号部323により構成され、符号化装置290により伝送されてくるビットストリームに含まれるL画像の符号化データを復号する。
復号装置320の受信部321は、図37の符号化装置290により伝送されてくるTSを受信し、そのTSに含まれるビットストリームを分離部322に供給する。
分離部322は、受信部321から供給されるビットストリームを、NALヘッダに基づいて、L画像のSPS,SEI、および符号化データのNALユニットと、そのNALユニット以外のNALユニットに分離する。
具体的には、分離部322は、ビットストリームから、AVC方式のピクチャの種類を表すNALユニットのタイプをNALヘッダに含むL画像の符号化データのNALユニット、AVC方式のSPSを表すNALユニットのタイプをNALヘッダに含むL画像のSPSのNALユニット、およびAVC方式のSEIを表すNALユニットのタイプをNALヘッダに含むL画像のSEIのNALユニットを抽出する。分離部322は、分離されたNALユニットに含まれるデータであるL画像のSPSの情報、SEIの情報、および符号化データを、そのデータが、SPSの情報、SEIの情報、および符号化データのいずれであるかを表す種類情報とともにAVC復号部323に供給する。なお、種類情報は、対応するNALユニットのタイプに基づいて生成される。
AVC復号部323は、分離部322から供給される種類情報に基づいて、SPSの情報およびSEIの情報を表す種類情報に対応して供給されるSPSおよびSEIの情報を保持する。AVC復号部323は、保持しているSPSおよびSEIの情報に基づいて、分離部322から符号化データを表す種類情報とともに供給されるL画像の符号化データを、AVC方式に対応する方式で復号する。AVC復号部323は、復号の結果得られるL画像を図示せぬ表示装置に出力し、表示させる。これにより、視聴者は、2D画像を見ることができる。
[AVC方式の復号装置の処理の説明]
図47は、図46の復号装置320の復号処理を説明するフローチャートである。この復号処理は、例えば、図37の符号化装置290からTSが伝送されてきたとき、開始される。
図47のステップS291において、復号装置320の受信部321は、符号化装置290により伝送されてくるTSを受信する。受信部321は、TSに含まれるビットストリームを分離部322に供給する。なお、以降のステップS292乃至S297の処理は、ビットストリームを構成するNALユニットごとに行われる。
ステップS292において、分離部322は、NALユニットのNALヘッダに含まれるNALユニットのタイプが、AVC方式のタイプであるかどうかを判定する。即ち、分離部322は、NALユニットのタイプが、AVC方式のピクチャの種類、SPS、またはSEIを表す情報であるかどうかを判定する。
ステップS292でNALユニットのタイプがAVC方式のタイプであると判定された場合、処理はステップS293に進む。ステップS293において、分離部322は、そのNALユニットに含まれるL画像のデータ、即ちL画像のSPSの情報、SEIの情報、または符号化データを、種類情報とともにAVC復号部323に入力する。
ステップS294において、AVC復号部323は、分離部322から供給されるL画像のデータに対応する種類情報に基づいて、そのデータがL画像の符号化データであるかどうかを判定する。ステップS294でL画像の符号化データであると判定された場合、ステップS295において、AVC復号部323は、そのL画像の符号化データを、保持しているSPSおよびSEIの情報に基づいてAVC方式に対応する方式で復号する。
ステップS296において、AVC復号部323は、復号の結果得られるL画像を図示せぬ表示装置に出力し、表示させる。そして、処理は終了する。
一方、ステップS294でL画像の符号化データではないと判定された場合、即ち、分離部322から供給されるL画像のデータがL画像のSPSまたはSEIの情報である場合、処理はステップS297に進む。
ステップS297において、AVC復号部323は、分離部322から供給されるL画像のSEIまたはSPSの情報を保持し、処理を終了する。
また、ステップS292でNALユニットのタイプがAVC方式のタイプではないと判定された場合、そのNALユニットはAVC復号部323に供給されず、処理は終了する。
以上のように、復号装置320は、NALヘッダに基づいて、ビットストリームを、復号装置320で復号可能な互換画像であるL画像のSPS,SEI、および符号化データのNALユニットと、そのNALユニット以外のNALユニットに分離し、分離されたNALユニットに含まれる符号化データのみを既存のAVC方式に対応する方式で復号する。従って、復号装置320は、符号化装置290で既存の方式との互換性を有する方式で符号化された結果得られるビットストリームを復号することができる。
[MVC方式の復号装置の構成例]
図48は、図37の符号化装置290により伝送されてくるビットストリームを復号するMVC方式の復号装置の構成例を示すブロック図である。
図48に示す構成のうち、図46の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図48の復号装置320の構成は、主に、分離部322、AVC復号部323の代わりに、分離部341、MVC復号部342が設けられている点が図46の構成と異なる。復号装置320は、符号化装置290により伝送されてくるビットストリームに含まれるL画像とR画像の符号化データを復号する。
具体的には、復号装置320の分離部341は、受信部321から供給されるビットストリームを、NALヘッダに基づいて、L画像のSPSおよびR画像のSubset SPS、並びに、L画像とR画像のSEIおよび符号化データのNALユニットと、そのNALユニット以外のNALユニットに分離する。
より詳細には、分離部341は、図46の分離部322と同様に、ビットストリームから、L画像の符号化データ、SPS、およびSEIのNALユニットを抽出する。また、分離部341は、ビットストリームから、MVC方式の符号化データを表すNALユニットのタイプをNALヘッダに含むR画像の符号化データのNALユニット、MVC方式のSubset SPSを表すNALユニットのタイプをNALヘッダに含むR画像のSubset SPSのNALユニット、およびMVC方式のSEIを表すNALユニットのタイプをNALヘッダに含むR画像のSEIのNALユニットを抽出する。
分離部341は、分離されたNALユニットに含まれるデータであるL画像のSPSおよびR画像のSubset SPS、並びに、L画像とR画像のSEIおよび符号化データを、そのデータの種類情報とともにMVC復号部342に供給する。
MVC復号部342は、分離部341から供給される種類情報に基づいて、L画像とR画像のSEI、L画像のSPS、およびR画像のSubset SPSの情報を保持する。MVC復号部342は、図46のAVC復号部323と同様に、保持しているL画像のSEIおよびSPSの情報に基づいて、分離部341から供給されるL画像の符号化データを、AVC方式に対応する方式で復号する。
また、MVC復号部342は、保持しているR画像のSEIおよびSubset SPSの情報に基づいて、分離部341からR画像の符号化データを表す種類情報とともに供給されるR画像の符号化データを、L画像をベースビューとし、R画像をノンベースビューとして、MVC方式に対応する方式で復号する。MVC復号部342は、復号の結果得られるL画像とR画像を図示せぬ表示装置に交互に出力し、表示させる。
このとき、視聴者は、L画像の表示時に左目用のシャッタが開き、R画像の表示時に右目用のシャッタが開くメガネを装着して、表示装置に交互に表示されるL画像とR画像を見ることにより、3D画像を見ることができる。
[MVC方式の復号装置の処理の説明]
図49は、図48の復号装置340の復号処理を説明するフローチャートである。この復号処理は、例えば、図37の符号化装置290からTSが伝送されてきたとき、開始される。
図49のステップS311において、復号装置340の受信部321は、符号化装置290により伝送されてくるTSを受信する。受信部321は、TSに含まれるビットストリームを分離部341に供給する。なお、以降のステップS312乃至S317の処理は、ビットストリームを構成するNALユニットごとに行われる。
ステップS312において、分離部341は、NALユニットのNALヘッダに含まれるNALユニットのタイプが、AVC方式のタイプまたはMVC方式のタイプであるかどうかを判定する。即ち、分離部341は、NALユニットのタイプが、AVC方式のピクチャの種類、SPS、またはSEI、もしくは、MVC方式の符号化データ、Subset SPS、またはSEIを表す情報であるかどうかを判定する。
ステップS312でNALユニットのタイプがAVC方式のタイプまたはMVC方式のタイプであると判定された場合、処理はステップS313に進む。ステップS313において、分離部341は、そのNALユニットに含まれるL画像またはR画像のデータ、即ちL画像のSPSの情報、SEIの情報、または符号化データ、もしくは、R画像のSubset SPSの情報、SEIの情報、または符号化データを、種類情報とともにMVC復号部342に入力する。
ステップS314において、MVC復号部342は、種類情報に基づいて、分離部341から供給されるデータがL画像またはR画像の符号化データであるかどうかを判定する。ステップS314でL画像またはR画像の符号化データであると判定された場合、ステップS315において、MVC復号部342は、そのL画像またはR画像の符号化データを、保持しているSPSまたはSubset SPSおよびSEIの情報に基づいて復号する。
ステップS316において、MVC復号部342は、復号の結果得られるL画像またはR画像を図示せぬ表示装置に出力して表示させ、処理を終了する。
一方、ステップS314でL画像またはR画像の符号化データではないと判定された場合、即ち、分離部341からのデータがL画像のSPSまたはSEIの情報、もしくは、R画像のSubset SPSまたはSEIの情報である場合、処理はステップS317に進む。
ステップS317において、MVC復号部342は、分離部341から供給されるL画像のSPSまたはSEIの情報、もしくは、R画像のSubset SPSまたはSEIの情報を保持し、処理を終了する。
また、ステップS312でNALユニットのタイプがAVC方式のタイプまたはMVC方式のタイプではないと判定された場合、そのNALユニットはMVC復号部342に供給されず、処理は終了する。
以上のように、復号装置340は、NALヘッダに基づいて、ビットストリームを、復号装置340で復号可能な互換画像であるL画像のSPS、SEI、および符号化データ、並びに、R画像のSubset SPS、SEI、および符号化データのNALユニットと、そのNALユニット以外のNALユニットに分離し、分離されたNALユニットに含まれる符号化データのみを既存のAVC方式またはMVC方式に対応する方式で復号する。従って、復号装置340は、符号化装置290で既存の方式との互換性を有する方式で符号化された結果得られるビットストリームを復号することができる。
[3DV方式の復号装置の構成例]
図50は、図37の符号化装置290により伝送されてくるビットストリームを復号する3DV方式の復号装置の構成例を示すブロック図である。
図50の復号装置360は、受信部361、分離部362、3DV復号部363、低解像度画像逆変換処理部364、および画像生成部365により構成される。復号装置360は、符号化装置290により伝送されてくるビットストリームに含まれるL視点画像、R視点画像、およびO視点画像の符号化データを復号する。
具体的には、復号装置360の受信部361は、図37の符号化装置290により伝送されてくるTSを受信する。受信部361は、TSに含まれるビットストリームを分離部362に供給し、参照画像低解像度変換情報を3DV復号部363に供給し、補助画像低解像度変換情報を低解像度画像逆変換処理部364に供給する。
分離部362は、受信部361から供給されるビットストリームを、NALヘッダに基づいて各NALユニットに分離する。より詳細には、分離部362は、図48の分離部341と同様に、ビットストリームから、L画像の符号化データ、SPS、およびSEIのNALユニットを抽出する。また、分離部362は、分離部341と同様に、ビットストリームから、R画像の符号化データ、Subset SPS、およびSEIのNALユニットを抽出する。
さらに、分離部362は、3DV方式の符号化データを表すNALユニットのタイプをNALヘッダに含むL視差画像、R視差画像、およびO視点画像の符号化データのNALユニットを抽出する。また、分離部362は、3DV方式のSubset SPS,SEIを表すNALユニットのタイプをNALヘッダに含む、L視差画像、R視差画像、およびO視点画像のSubset SPS、並びにL視差画像、R視差画像、およびO視点画像のSEIのNALユニットを抽出する。
また、分離部362は、NALヘッダに含まれる拡張情報に基づいて、L視差画像、R視差画像、およびO視点画像の符号化データのNALヘッダを、さらに分離する。具体的には、分離部362は、拡張情報が視差画像ではないことを表す視差フラグであるNALユニットを、O視差画像の符号化データのNALユニットとして抽出する。また、分離部362は、拡張情報が、視差画像であることを表す視差フラグ、対応する画像の視点数としての1、および、対応する画像の視点を特定する情報としてのL画像を特定する情報であるNALユニットを、L視差画像の符号化データのNALユニットとして抽出する。同様に、分離部362は、R視差画像の符号化データのNALユニットとO視差画像の符号化データのNALユニットを抽出する。
分離部362は、分離されたNALユニットに含まれるデータであるL画像のSPSの情報、L視差画像、R視点画像、およびO視点画像のSubset SPSの情報、並びに、L視点画像、R視点画像、およびO視点画像のSEIの情報および符号化データを、そのデータの種類情報とともに3DV復号部363に供給する。
3DV復号部363は、分離部362から供給される種類情報に基づいて、L画像のSPSおよびSEIの情報、並びに、L視差画像、R視点画像、およびO視点画像のSubset SPSとSEIの情報を保持する。3DV復号部363は、図48のMVC復号部342と同様に、保持しているL画像のSEIおよびSPSの情報に基づいて、分離部362から供給されるL画像の符号化データを、AVC方式に対応する方式で復号する。また、3DV復号部363は、MVC復号部342と同様に、保持しているR画像のSEIおよびSubset SPSの情報に基づいて、分離部362から供給されるR画像の符号化データを、MVC方式に対応する方式で復号する。
また、3DV復号部363は、保持しているO画像のSEIおよびSubset SPSの情報に基づいて、分離部362からO画像の符号化データを表す種類情報とともに供給されるO画像の符号化データを、L画像やR画像を参照して、3DV方式に対応する方式で復号する。このとき、3DV復号部363は、受信部361から供給される参照画像低解像度変換情報に基づいて、参照するL画像やR画像に対して低解像度化処理を行い、低解像度化処理後のL画像やR画像を参照する。
さらに、3DV復号部363は、保持しているL視差画像のSEIおよびSubset SPSの情報に基づいて、分離部362からL視差画像の符号化データを表す種類情報とともに供給されるL視差画像の符号化データを、同一の視点の視差画像以外を参照せずに3DV方式に対応する方式で復号する。また、3DV復号部363は、保持しているR視差画像のSEIおよびSubset SPSの情報に基づいて、分離部362からR視差画像の符号化データを表す種類情報とともに供給されるR視差画像の符号化データを、L視差画像を参照して3DV方式に対応する方式で復号する。
また、3DV復号部363は、保持しているO視差画像のSEIおよびSubset SPSの情報に基づいて、分離部362からO視差画像の符号化データを表す種類情報とともに供給されるO視差画像の符号化データを、L視差画像やR視差画像を参照して3DV方式に対応する方式で復号する。このとき、3DV復号部363は、受信部361から供給される参照画像低解像度変換情報に基づいて、参照するL視差画像やR視差画像に対して低解像度化処理を行い、低解像度化処理後のL視差画像やR視差画像を参照する。
3DV復号部363は、復号の結果得られるL視点画像とR視点画像を画像生成部365に供給する。また、3DV復号部363は、復号の結果得られるO視点画像を低解像度画像逆変換処理部364に供給する。さらに、3DV復号部363は、保持しているL視差画像、R視差画像、およびO視差画像のSEIに含まれる視差情報を画像生成部365に供給する。
低解像度画像逆変換処理部364は、受信部361からの補助画像低解像度変換情報に基づいて、3DV復号部363からのO視点画像を構成するO画像とO視差画像のそれぞれに対して、図37の画像変換処理部291における低解像度化処理に対応するフィルタ処理等の高解像度化処理を行う。これにより、O視点画像の解像度は、L視点画像およびR視点画像の解像度と同一になる。低解像度画像逆変換処理部364は、高解像度化処理後のO視点画像を画像生成部365に供給する。
画像生成部365は、3DV復号部363から供給されるL視差画像の視差情報に基づいて、必要に応じて、3DV復号部363から供給されるL視差画像に対して変換を行う。
例えば、画像生成部365は、L視差画像の視差情報に含まれる視差タイプが、視差画像の各画素値がデプス値であることを表し、画像生成部365が処理可能な視差を表す値が視差値である場合、L視差画像の各画素値を視差値に変換する。
また、画像生成部365は、L視差画像の視差情報に含まれる正規化フラグが、正規化されていないことを表す値であり、画像生成部365が処理可能な視差を表す値が正規化後の値である場合、L視差画像の各画素値を正規化し、正規化後の値に変換する。
さらに、画像生成部365は、L視差画像の視差情報に含まれる撮影モードが輻射付き撮影モードであり、画像生成部365が処理可能な視差画像が平行撮影モードで撮影された画像の視差画像である場合、L視差画像を、平行撮影モードで撮影されたL画像の視差画像に変換する。
画像生成部365は、L視差画像と同様に、必要に応じて、R視差画像の視差情報に基づいてR視差画像を変換し、O視差画像の視差情報に基づいてO視差画像を変換する。
画像生成部365は、変換後のL視差画像、R視差画像、およびO視差画像、L画像、R画像、およびO画像、並びに、視差情報に含まれる、デプス値の最大値および最小値または視差値の最大値および最小値、並びに、対応関係情報に基づいて、図示せぬ表示装置に対応する3以上の視点数の画像を生成する。そして、画像生成部365は、生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に出力して表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
[3DV方式の復号装置の処理の説明]
図51は、図50の復号装置360の復号処理を説明するフローチャートである。この復号処理は、例えば、図37の符号化装置290からTSが伝送されてきたとき、開始される。
図51のステップS331において、復号装置340の受信部361は、符号化装置290により伝送されてくるTSを受信する。受信部361は、TSに含まれるビットストリームを分離部362に供給し、参照画像低解像度変換情報を3DV復号部363に供給し、補助画像低解像度変換情報を低解像度画像逆変換処理部364に供給する。なお、以降のステップS332乃至S342の処理は、ビットストリームを構成するNALユニットごとに行われる。
ステップS332において、分離部362は、NALユニットのNALヘッダに基づいて各NALユニットを分離し、そのNALユニットに含まれる、L視点画像、R視点画像、または低解像度化処理後のO視点画像のデータを、種類情報とともに3DV復号部363に供給する。
ステップS333において、3DV復号部363は、種類情報に基づいて、その種類情報とともに分離部362から供給されるデータがL視点画像、R視点画像、または低解像度化処理後のO視点画像の符号化データであるかどうかを判定する。ステップS333でL視点画像、R視点画像、またはO視点画像の符号化データであると判定された場合、処理はステップS334に進む。
ステップS334において、3DV復号部363は、L視点画像、R視点画像、または低解像度化処理後のO視点画像の符号化データを、保持しているSPSまたはSubset SPSおよびSEIの情報に基づいて復号する。
ステップS335において、3DV復号部363は、種類情報に基づいて、復号の結果得られる画像が低解像度化処理後のO画像またはO視差画像であるかどうかを判定する。ステップS335で復号の結果得られる画像が低解像度化処理後のO画像またはO視差画像であると判定された場合、3DV復号部363は、そのO画像またはO視差画像を低解像度画像逆変換処理部364に供給する。
ステップS336において、低解像度画像逆変換処理部364は、受信部361から供給される補助画像低解像度変換情報に基づいて、3DV復号部363から供給される低解像度化処理後のO画像またはO視差画像に対して高解像度化処理を行う。これにより、O画像またはO視差画像の解像度が、L視点画像およびR視点画像と同一の解像度になる。
ステップS337において、低解像度画像逆変換処理部364は、高解像度化処理後のO画像またはO視差画像を画像生成部365に出力し、処理を終了する。
一方、ステップS335で復号の結果得られる画像が低解像度化処理後のO画像またはO視差画像ではないと判定された場合、即ち、復号の結果得られる画像がL画像、L視差画像、R画像、またはR視差画像である場合、処理はステップS338に進む。
ステップS338において、3DV復号部363は、復号の結果得られるL画像、L視差画像、R画像、またはR視差画像を画像生成部365に出力し、処理を終了する。
また、ステップS333でL視点画像、R視点画像、またはO視点画像の符号化データではないと判定された場合、即ち、分離部362から供給されるデータがSPS,Subset SPS、またはSEIの情報である場合、処理はステップS339に進む。
ステップS339において、3DV復号部363は、分離部362から供給されるSPS,Subset SPS、またはSEIの情報を保持する。
ステップS340において、3DV復号部363は、ステップS339で保持されたデータが、SEIの情報であるかどうかを判定する。ステップS340で保持されたデータがSEIの情報であると判定された場合、処理はステップS341に進む。
ステップS341において、3DV復号部363は、ステップS339で保持されたSEIの情報に視差情報があるかどうかを判定する。ステップS341で視差情報があると判定された場合、ステップS342において、3DV復号部363は、SEIの情報から視差情報を抽出して画像生成部365に出力し、処理を終了する。
一方、ステップS340で保持されたデータがSEIの情報ではないと判定された場合、または、ステップS341で視差情報がないと判定された場合、処理は終了する。
以上のように、復号装置360は、NALヘッダに基づいて、ビットストリームを各NALユニットに分離する。そして、復号装置360は、分離されたNALユニットに含まれる互換画像の符号化データを既存のAVC方式またはMVC方式に対応する方式で復号し、補助画像および視差画像の符号化データを3DV方式に対応する方式で復号する。従って、復号装置340は、符号化装置290で既存の方式との互換性を有する方式で符号化された結果得られるビットストリームを復号することができる。
[復号対象となる符号化データの説明]
図52は、図46の復号装置320、図48の復号装置340、および図50の復号装置360において復号対象となる符号化データを説明する図である。
図52の例では、図39に示した参照関係で符号化されたビットストリームが符号化装置290から伝送されてくるものとする。
この場合、図52に示すように、復号装置320は、NALユニットのタイプ(nal_unit_type)が、AVC方式のピクチャの種類を表す情報(図52の例では、1または5)であるL画像のNALユニットに含まれる符号化データ(Coded slice)のみをAVC方式に対応する方式で復号する。
一方、復号装置340は、図52に示すように、復号装置320と同様に、L画像のNALユニットの含まれる符号化データをAVC方式に対応する方式で復号する。また、復号装置340は、NALユニットのタイプがMVC方式の符号化データを表す情報(図52の例では、20)であるR画像のNALユニットに含まれる符号化データを、L画像をベースビューとし、R画像をノンベースビューとして、MVC方式に対応する方式で復号する。
また、復号装置360は、図52に示すように、復号装置320や復号装置340と同様に、L画像のNALユニットの含まれる符号化データをAVC方式に対応する方式で復号する。また、復号装置360は、復号装置340と同様に、R画像のNALユニットに含まれる符号化データを、L画像をベースビューとし、R画像をノンベースビューとして、MVC方式に対応する方式で復号する。
さらに、復号装置360は、NALユニットのタイプが3DV方式の符号化データを表す情報(図52の例では、21)であり、拡張情報(nal_unit_header_3dv_extension)が視差画像ではないことを表す視差フラグ(is_depth=0)である低解像度化処理後のO画像のNALユニットに含まれる符号化データを、低解像度化処理後のL画像およびR画像を参照して3DV方式に対応する方式で復号する。
さらに、復号装置360は、NALユニットのタイプが3DV方式の符号化データを表す情報であり、拡張情報が、視差画像であることを表す視差フラグ(is_depth=1)と、対応する画像を特定する情報としてのL画像を特定する情報(cor_view_id=0)であるL視差画像のNALユニットに含まれる符号化データを、同一の視点の視差画像以外を参照せずに、3DV方式に対応する方式で復号する。
また、復号装置360は、NALユニットのタイプが3DV方式の符号化データを表す情報であり、拡張情報が、視差画像であることを表す視差フラグと、対応する画像を特定する情報としてのR画像を特定する情報(cor_view_id=1)であるR視差画像のNALユニットに含まれる符号化データを、L視差画像を参照して3DV方式に対応する方式で復号する。
さらに、復号装置360は、NALユニットのタイプが3DV方式の符号化データを表す情報であり、拡張情報が、視差画像であることを表す視差フラグと、対応する画像を特定する情報としてのO画像を特定する情報(cor_view_id=2)である低解像度化処理後のO視差画像のNALユニットに含まれる符号化データを、低解像度化処理後のL視差画像とR視差画像を参照して3DV方式に対応する方式で復号する。
<第6実施の形態>
[符号化装置の第6実施の形態の構成例]
図53は、本技術を適用した符号化装置の第6実施の形態の構成例を示すブロック図である。
図53の符号化装置380は、多重化処理部381、多重化処理部382、視差情報生成部383、符号化処理部384、および伝送部385により構成される。符号化装置380では、互換画像がL画像およびR画像であり、補助画像が、N(Nは2の倍数)視点のO1画像乃至ON画像である。符号化装置380は、互換画像の視差画像、並びに、各2視点の補助画像および補助画像の視差画像を多重化して符号化する。
具体的には、符号化装置380の多重化処理部381は、符号化装置380に入力されるL視点画像のうちのL視差画像が入力されるとともに、R視点画像のうちのR視差画像が入力される。多重化処理部381は、L視差画像とR視差画像を所定の多重化方式で多重化する。
より詳細には、例えば多重化方式がサイドバイサイド方式である場合、多重化処理部381は、L視差画像とR視差画像の解像度を半分にする。そして、多重化処理部381は、解像度が半分にされたL視差画像が画面の左半分の画像となり、解像度が半分にされたR視差画像が画面の右半分の画像となるように、解像度が半分にされたL視差画像とR視差画像を多重化する。また、例えば多重化方式がトップアンドボトム方式である場合、多重化処理部381は、解像度が半分にされたL視差画像が画面の上半分の画像となり、解像度が半分にされたR視差画像が画面の下半分の画像となるように、解像度が半分にされたL視差画像とR視差画像を多重化する。
多重化処理部381は、多重化の結果得られる多重化画像を互換視差画像として符号化処理部384に供給する。また、多重化処理部381は、互換画像の視差画像であるL視差画像とR視差画像の多重化方式を示す情報である互換多重化情報を生成し、伝送部385に供給する。
多重化処理部382は、符号化装置380に入力される、O1画像とO1画像の視差画像であるO1視差画像とからなるO1視点画像、・・・、および、ON画像とON画像の視差画像であるON視差画像とからなるON視点画像が入力される。多重化処理部382は、O1画像とO2画像、O3画像とO4画像、・・・、O(N−1)画像とON画像をそれぞれ、所定の多重化方式で多重化する。そして、多重化処理部382は、その多重化の結果得られる多重化画像を補助多重化画像として符号化処理部384に供給する。
同様に、多重化処理部382は、O1視差画像とO2視差画像、O3視差画像とO4視差画像、・・・、O(N−1)視差画像とON視差画像をそれぞれ、所定の多重化方式で多重化する。多重化処理部382は、その多重化の結果得られる多重化画像を補助視差多重化画像として符号化処理部384に供給する。また、補助画像であるO1画像乃至ON画像と、補助画像の視差画像であるO1視差画像乃至ON視差画像の多重化方式を示す情報である補助多重化情報を生成し、伝送部385に供給する。
なお、以下では、O1視点画像乃至ON視点画像を、それぞれを特に区別する必要がない場合、それらをまとめてO多視点画像という。同様に、O多画像およびO多視差画像という。
視差情報生成部383は、L画像、R画像、およびO多画像の撮影時の情報等に基づいて、L視差画像、R視差画像、およびO多視差画像の視差情報を生成し、符号化処理部384に供給する。
符号化処理部384は、図37の符号化処理部293と同様に、符号化装置380に入力されるL視点画像のうちのL画像をAVC方式で符号化する。また、符号化処理部384は、符号化処理部293と同様に、符号化装置380に入力されるR視点画像のうちのR画像を、L画像をベースビューとし、R画像をノンベースビューとしてMVC方式で符号化する。
さらに、符号化処理部384は、多重化処理部382から供給される補助多重化画像を、L画像やR画像を参照して3DV方式で符号化する。このとき、符号化処理部384は、参照するL画像やR画像を複製して、補助多重化画像と同一の多重化方式で多重化を行い、その結果得られる多重化画像を参照する。
また、符号化処理部384は、多重化処理部381から供給される互換多重化画像を、同一の視点の互換多重化画像以外を参照せずに、3DV方式で符号化する。さらに、符号化処理部384は、多重化処理部382から供給される補助視差多重化画像を、3DV方式で符号化する
符号化処理部384は、符号化の結果得られるL画像、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像の符号化データ、並びに、視差情報生成部383から供給される視差情報からビットストリームを生成し、そのビットストリームを伝送部385に供給する。また、符号化処理部384は、互換多重化画像の参照画像を生成する際の多重化方式を示す情報である参照画像多重化情報を生成し、伝送部385に供給する。
伝送部385は、多重化処理部381から供給される互換多重化情報、多重化処理部382から供給される補助多重化情報、並びに、符号化処理部384から供給されるビットストリームおよび参照画像多重化情報からTSを生成し、伝送する。
[符号化処理部の構成例]
図54は、図53の符号化処理部384の構成例を示すブロック図である。
図54に示す構成のうち、図38の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図54の符号化処理部384の構成は、主に、符号化部301、付加情報生成部302、および付加部303の代わりに符号化部401、付加情報生成部402、付加部403が設けられている点が図38の構成と異なる。
符号化処理部384の符号化部401は、互換符号化部311と補助符号化部411により構成される。符号化部401の補助符号化部411は、互換多重化画像、補助多重化画像、および補助視差多重化画像を、3DV方式で符号化する。補助符号化部411は、符号化の結果得られる互換多重化画像、補助多重化画像、および補助視差多重化画像の符号化データを付加部403に供給する。また、符号化部401は、参照画像多重化情報を生成し、図53の伝送部385に供給する。
付加情報生成部402は、L画像のSPSの情報、並びに、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSの情報を生成する。また、付加情報生成部402は、L画像、R画像、および補助多重化画像のSEIの情報を生成する。さらに、付加情報生成部402は、図53の視差情報生成部383から供給されるL視差画像とR視差画像の視差情報を含む互換多重化画像のSEIの情報を生成する。
また、付加情報生成部402は、視差情報生成部383から供給される補助視差多重化画像を構成する2視点のO多視差画像の視差情報を含む、その補助視差多重化画像のSEIの情報を生成する。付加情報生成部402は、L画像のSPSの情報、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSの情報、並びに、L画像、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSEIの情報を付加部403に供給する。
付加部403は、図38の付加部303と同様に、互換符号化部311による符号化の結果得られるL画像の符号化データに、NALユニットのタイプとして、AVC方式のピクチャの種類を表す情報を含むNALヘッダを付加し、NALユニットを生成する。また、付加部403は、付加部303と同様に、互換符号化部311による符号化の結果得られるR画像の符号化データに、NALユニットのタイプとして、MVC方式の符号化データを表す情報を含むNALヘッダを付加し、NALユニットを生成する。
また、付加部403は、補助符号化部411から供給される補助多重化画像の符号化データに、NALユニットのタイプとして3DV方式の符号化データを表す情報を含み、視差画像ではないことを表す視差フラグを含むNALヘッダを付加し、NALユニットを生成する。さらに、付加部403は、補助符号化部411から供給される互換多重化画像と補助視差多重化画像の符号化データに、それぞれ、NALユニットのタイプとして3DV方式の符号化データを表す情報を含み、視差画像であることを表す視差フラグと、対応する画像に関する情報とを含むNALヘッダを付加し、NALユニットを生成する。
さらに、付加部403は、付加情報生成部402から供給されるL画像のSPSの情報、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSの情報、並びに、L画像、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSEIの情報に、それぞれ、NALユニットのタイプとして、それぞれの情報を表すNALヘッダを付加し、NALユニットを生成する。付加部403は、以上のようにして生成されたNALユニットをビットストリーム生成部304に供給する。
[NALユニットの構成例]
図55は、図53の符号化処理部384により生成されるビットストリームのうちの、L画像、R画像、補助多重化画像、互換多重化画像、および補助視差多重化画像の符号化データのNALユニットの構成例を示す図である。
図55において、L画像およびR画像の符号化データのNALユニットは、図40の場合と同様であるので、説明は省略する。
図55に示すように、符号化処理部384による符号化処理では、補助多重化画像のNALユニットのNALヘッダに、NALユニットのタイプとして3DV方式の符号化データを表す情報が含まれるとともに、拡張情報として視差画像ではないことを表す0である視差フラグが含まれる。これにより、復号装置において、補助多重化画像を識別することができる。
また、互換多重化画像と各補助視差多重化画像のNALユニットのNALヘッダには、視差画像であることを表す1である視差フラグが含まれる。これにより、復号装置において、互換多重化画像と補助視差多重化画像を識別することができる。
さらに、互換多重化画像と各補助視差多重化画像のNALユニットのNALヘッダには、拡張情報として、対応する画像に関する情報が含まれる。ここでは、互換多重化画像は、2視点のL画像とR画像の視差画像であり、各補助視差多重化画像は、2視点のO多画像の視差画像である。また、図55の例では、L画像の視点を特定する情報が0であり、R画像の視点を特定する情報が1であり、補助視差多重化画像に対応する2視点のO多画像の視点を特定する情報が2および3である。
従って、互換多重化画像のNALユニットのNALヘッダに含まれる対応する画像に関する情報は、対応する画像の視点数としての2と、対応する画像の視点を特定する情報としての0および1である。また、補助視差多重化画像のNALユニットのNALヘッダに含まれる対応する画像に関する情報は、対応する画像の視点数としての2と、対応する画像の視点を特定する情報としての2および3である。
以上のように、拡張情報として、対応する画像に関する情報が含まれることにより、互換多重化画像および各補助視差多重化画像をそれぞれ識別することができる。
[ビットストリームの構成例]
図56は、図54のビットストリーム生成部304により生成されるビットストリームの構成例を示す図である。
図56のAに示すL画像のビットストリームと、図56のBに示すR画像のビットストリームは、それぞれ、図41のAのL画像のビットストリーム、図41のBのR画像のビットストリームと同一であるので、説明は省略する。
図56のCに示すように、3DV方式で符号化された補助多重化画像のビットストリームは、補助多重化画像の3DV方式のSubset SPSの情報のNALユニット、補助多重化画像の3DV方式のSEIの情報のNALユニット、および補助多重化画像の符号化データのNALユニットにより構成される。
図56のDに示すように、3DV方式で符号化された互換多重化画像のビットストリームは、互換多重化画像の3DV方式のSubset SPSの情報のNALユニット、互換多重化画像の視差情報を含む3DV方式のSEIの情報のNALユニット、および互換多重化画像の符号化データのNALユニットにより構成される。
また、図56のEに示すように、3DV方式で符号化された補助視差多重化画像のビットストリームは、補助視差多重化画像の3DV方式のSubset SPSの情報のNALユニット、補助視差多重化画像の視差情報を含む3DV方式のSEIの情報のNALユニット、および補助視差多重化画像の符号化データのNALユニットにより構成される。
以上のように、視差情報は3DV方式のSEIに含まれるので、3DV方式に対応していない復号装置において、無駄に視差情報を処理する必要がない。
[符号化装置の処理の説明]
図57は、図53の符号化装置380の多視点符号化処理を説明するフローチャートである。この多視点画像符号化処理は、例えば、L視点画像、R視点画像、およびO多視点画像が符号化対象として符号化装置380に入力されたとき、開始される。
図57のステップS361において、符号化装置380の符号化処理部384は、符号化装置380に入力されたL視点画像のうちのL画像を取得し、多重化処理部382は、L視差画像を取得する。
ステップS362において、符号化処理部384は、符号化装置380に入力されたR視点画像のうちのR画像を取得し、多重化処理部382は、R視差画像を取得する。ステップS363において、多重化処理部382は、符号化装置380に入力されたO多視点画像を取得する。
ステップS364において、多重化処理部381は、ステップS361で取得されたL視差画像と、ステップS362で取得されたR視差画像を所定の多重化方式で多重化し、多重化の結果得られる多重化画像を互換視差画像として符号化処理部384に供給する。ステップS365において、多重化処理部381は、互換多重化情報を生成し、伝送部385に供給する。
ステップS366において、多重化処理部382は、O多視点画像を構成するO多画像とO多視差画像を、それぞれ、2視点ごとに、所定の多重化方式で多重化する。多重化処理部382は、その多重化の結果得られるO多画像の多重化画像を補助多重化画像とし、O多視差画像の多重化画像を補助視差多重化画像として、符号化処理部384に供給する。
ステップS367において、多重化処理部382は、補助多重化情報を生成し、伝送部385に供給する。
ステップS368において、視差情報生成部383は、L画像、R画像、およびO多画像の撮影時の情報等に基づいて、L視差画像、R視差画像、およびO多視差画像の視差情報を生成し、符号化処理部384に供給する。
ステップS369において、符号化処理部384は、L画像、R画像、多重化処理部381から供給される互換多重化画像、並びに、多重化処理部382から供給される補助多重化画像および補助視差多重化画像を符号化する符号化処理を行う。この符号化処理の詳細は、後述する図58を参照して説明する。
ステップS370において、伝送部385は、多重化処理部381からの互換多重化情報、多重化処理部382からの補助多重化情報、並びに、符号化処理部384からの参照画像多重化情報およびビットストリームから、TSを生成し、伝送する。そして、処理は終了する。
図58は、図57のステップS369の符号化処理の詳細を説明するフローチャートである。
図58のステップS390において、符号化処理部384の符号化部401(図54)は、L画像、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像を符号化する。具体的には、符号化部401の互換符号化部311が、L画像をAVC方式で符号化し、R画像をMVC方式で符号化する。また、補助符号化部411が、互換多重化画像、補助多重化画像、および補助視差多重化画像を3DV方式で符号化する。符号化部401は、符号化の結果得られるL画像、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像の符号化データを付加部403に供給する。
ステップS391において、補助符号化部411は、参照画像多重化情報を生成し、図53の伝送部385に供給する。
ステップS392において、付加情報生成部402は、図53の視差情報生成部383から供給される視差情報を用いて、L画像のSPSおよびSEIの情報、並びに、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSおよびSEIの情報を生成し、付加部303に供給する。
ステップS393およびステップS394の処理は、図45のステップS273およびS274の処理と同様であるので、説明は省略する。
ステップS394の処理後、ステップS395において、付加部403は、補助符号化部411から供給される補助多重化画像の符号化データに、3DV方式の符号化データを表すNALユニットのタイプと、視差画像ではないことを表す視差フラグとを含むNALヘッダを付加し、NALユニットを生成する。付加部403は、生成された補助多重化画像の符号化データのNALユニットをビットストリーム生成部304に供給する。
ステップS396において、付加部403は、補助符号化部411から供給される互換多重化画像と補助視差多重化画像の符号化データに、それぞれ、3DV方式の符号化データを表すNALユニットのタイプ、視差画像であることを表す視差フラグ、および、対応する画像に関する情報を含むNALヘッダを付加し、NALユニットを生成する。付加部403は、生成された互換多重化画像と補助視差多重化画像の符号化データのNALユニットをビットストリーム生成部304に供給する。
ステップS397において、付加部403は、付加情報生成部402から供給されるL画像のSPSおよびSEIの情報、並びに、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSおよびSEIの情報に、それぞれの情報を表すNALユニットのタイプを含むNALヘッダを付加し、NALユニットを生成する。付加部403は、生成されたL画像のSPSおよびSEI、並びに、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSおよびSEIのNALユニットを、ビットストリーム生成部304に供給する。
ステップS398において、ビットストリーム生成部304は、図45のステップS278の処理と同様に、付加部403から供給されるNALユニットを所定の順に配置してビットストリームを生成する。そして、ビットストリーム生成部304は、そのビットストリームを図53の伝送部385に供給し、処理を図57のステップS369に戻す。これにより、処理はステップS370に進む。
以上のように、符号化装置380は、互換画像を既存の符号化方式で符号化し、補助画像であるO多画像の符号化データに、3DV方式の符号化データを表すNALユニットのタイプを含むNALヘッダを付加する。これにより、既存の符号化方式にのみ対応する復号装置は、NALヘッダに基づいて復号可能な互換画像の符号化データのみを抽出し、既存の符号化方式に対応する方式で復号することができるので、符号化装置380は、既存の方式との互換性を有する方式で符号化を行っているといえる。
なお、上述した符号化装置290と符号化装置380は、互換画像の視差画像を、同一の視点の視差画像以外を参照せずに符号化したが、同一の視点の画像も参照して符号化するようにしてもよい。
また、符号化装置380は、互換画像をそのまま符号化したが、互換画像を多重化して符号化するようにしてもよい。
[3DV方式の復号装置の構成例]
図59は、図53の符号化装置380により伝送されてくるビットストリームを復号する3DV方式の復号装置の構成例を示すブロック図である。
図59の復号装置420は、受信部421、分離部422、3DV復号部423、分離部424、分離部425、および画像生成部426により構成される。復号装置420は、符号化装置380により伝送されてくるビットストリームに含まれるL画像、R画像、補助多重化画像、互換多重化画像、および補助視差多重化画像の符号化データを復号する。
具体的には、復号装置420の受信部421は、図53の符号化装置380により伝送されてくるTSを受信する。受信部421は、TSに含まれるビットストリームを分離部422に供給し、参照画像多重化情報を3DV復号部423に供給する。また、受信部421は、TSに含まれる互換多重化情報を分離部424に供給し、補助多重化情報を分離部425に供給する。
分離部422は、受信部421から供給されるビットストリームを、NALヘッダに基づいて各NALユニットに分離する。より詳細には、分離部422は、図50の分離部362と同様に、ビットストリームから、L画像の符号化データ、SPS、およびSEIのNALユニットを抽出する。また、分離部422は、分離部362と同様に、ビットストリームから、R画像の符号化データ、Subset SPS、およびSEIのNALユニットを抽出する。
さらに、分離部422は、3DV方式の符号化データを表すNALユニットのタイプをNALヘッダに含む互換多重化画像、補助多重化画像、および補助視差多重化画像の符号化データのNALユニットを抽出する。また、分離部422は、3DV方式のSubset SPS,SEIを表すNALユニットのタイプをNALヘッダに含む、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPS、並びに互換多重化画像、補助多重化画像、および補助視差多重化画像のSEIのNALユニットを抽出する。
また、分離部422は、NALヘッダに含まれる拡張情報に基づいて、補助多重化画像、互換多重化画像、および補助視差多重化画像の符号化データのNALヘッダを、さらに分離する。具体的には、分離部422は、拡張情報が視差画像ではないことを表す視差フラグであるNALユニットを、補助多重化画像の符号化データのNALユニットとして抽出する。また、分離部422は、拡張情報が、視差画像であることを表す視差フラグ、対応する画像の視点数としての2、および、対応する画像の視点を特定する情報としてのL画像およびR画像を特定する情報であるNALユニットを、互換多重化画像の符号化データのNALユニットを抽出する。同様に、分離部422は、補助視差多重化画像の符号化データのNALユニットを抽出する。
分離部422は、分離されたNALユニットに含まれるデータであるL画像のSPSの情報、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPSの情報、並びに、L画像、R画像、補助多重化画像、互換多重化画像、および補助視差多重化画像のSEIの情報および符号化データを、そのデータの種類情報とともに3DV復号部423に供給する。
3DV復号部423は、分離部422から供給される種類情報に基づいて、L画像のSPS、R画像、互換多重化画像、補助多重化画像、および補助視差多重化画像のSubset SPS、並びに、L画像、R画像、補助多重化画像、互換多重化画像、および補助視差多重化画像のSEIの情報を保持する。
3DV復号部423は、図50の3DV復号部363と同様に、保持しているL画像のSEIおよびSPSの情報に基づいて、分離部422から供給されるL画像の符号化データを、AVCに対応する方式で復号する。また、3DV復号部423は、3DV復号部363と同様に、保持しているR画像のSEIおよびSubset SPSの情報に基づいて、分離部422から供給されるR画像の符号化データを、MVC方式に対応する方式で復号する。
また、3DV復号部423は、保持している補助多重化画像のSEIおよびSubset SPSの情報に基づいて、分離部422から補助多重化画像の符号化データを表す種類情報とともに供給される補助多重化画像の符号化データを、L画像やR画像を参照して、3DV方式に対応する方式で復号する。このとき、3DV復号部423は、受信部421から供給される参照画像多重化情報に基づいて、参照するL画像やR画像を複製して多重化し、その結果得られる多重化画像を参照する。
さらに、3DV復号部423は、保持している互換多重化画像のSEIおよびSubset SPSの情報に基づいて、分離部422から互換多重化画像の符号化データを表す種類情報とともに供給される互換多重化画像の符号化データを、同一の視点の視差画像以外を参照せずに3DV方式に対応する方式で復号する。
また、3DV復号部423は、保持している補助視差多重化画像のSEIおよびSubset SPSの情報に基づいて、分離部422から補助視差多重化画像の符号化データを表す種類情報とともに供給される補助視差多重化画像の符号化データを、互換多重化画像を参照して3DV方式に対応する方式で復号する。
3DV復号部423は、復号の結果得られるL画像とR画像を画像生成部426に供給し、互換多重化画像を分離部424に供給し、補助多重化画像と補助視差多重化画像を分離部425に供給する。また、3DV復号部423は、保持している互換多重化画像と補助視差多重化画像のSEIに含まれる視差情報を画像生成部426に供給する。
分離部424は、受信部421から供給される互換多重化情報に基づいて、3DV復号部423から供給される互換多重化画像を、L画像やR画像と同一の解像度のL視差画像とR視差画像に分離する。具体的には、分離部424は、互換多重化画像から、解像度が半分にされたL視差画像とR視差画像を分離し、そのL視差画像とR視差画像に対して高解像度化処理を行うことにより、L画像やR画像と同一の解像度のL視差画像とR視差画像を得る。分離部424は、そのL視差画像とR視差画像を画像生成部426に供給する。
分離部425は、受信部421から供給される補助画像多重化情報に基づいて、分離部424と同様に、3DV復号部423から供給される補助多重化画像からO多画像を分離し、補助視差多重化画像からO多視差画像を分離する。分離部425は、その結果得られるO多視点画像を画像生成部426に供給する。
画像生成部426は、図50の画像生成部365と同様に、3DV復号部423から供給される視差情報に基づいて、必要に応じて、分離部424からのL視差画像およびR視差画像、並びに、分離部425からのO多視差画像に対して変換を行う。
画像生成部426は、変換後のL視差画像、R視差画像、およびO多視差画像、L画像、R画像、およびO多画像、並びに、視差情報に含まれる、デプス値の最大値および最小値または視差値の最大値および最小値、並びに、対応関係情報に基づいて、図示せぬ表示装置に対応する3以上の視点数の画像を生成する。そして、画像生成部426は、生成された各視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に出力して表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
[3DV方式の復号装置の処理の説明]
図60は、図59の復号装置420の復号処理を説明するフローチャートである。この復号処理は、例えば、図53の符号化装置380からTSが伝送されてきたとき、開始される。
図60のステップS411において、復号装置340の受信部421は、符号化装置380により伝送されてくるTSを受信する。受信部421は、TSに含まれるビットストリームを分離部422に供給し、参照画像多重化情報を3DV復号部423に供給する。また、受信部421は、TSに含まれる互換多重化情報を分離部424に供給し、補助多重化情報を分離部425に供給する。なお、以降のステップS412乃至S428の処理は、ビットストリームを構成するNALユニットごとに行われる。
ステップS412において、分離部422は、NALユニットのNALヘッダに基づいて各NALユニットを分離し、そのNALユニットに含まれる、L画像、R画像、補助多重化画像、互換多重化画像、または補助視差多重化画像のデータを種類情報とともに3DV復号部423に入力する。
ステップS413において、3DV復号部423は、分離部422から供給される種類情報に基づいて、その種類情報とともに入力されるデータがL画像、R画像、補助多重化画像、互換多重化画像、または補助視差多重化画像の符号化データであるかどうかを判定する。ステップS413でL画像、R画像、補助多重化画像、互換多重化画像、または補助視差多重化画像の符号化データであると判定された場合、処理はステップS414に進む。
ステップS414において、3DV復号部423は、L画像、R画像、補助多重化画像、互換多重化画像、または補助視差多重化画像の符号化データを、保持しているSPSまたはSubset SPSおよびSEIの情報に基づいて復号する。
ステップS415において、3DV復号部423は、種類情報に基づいて、復号の結果得られる画像が互換多重化画像であるかどうかを判定する。ステップS415で復号の結果得られる画像が互換多重化画像であると判定された場合、3DV復号部423は、その互換多重化画像を分離部424に供給する。
ステップS416において、分離部424は、受信部421からの互換多重化情報に基づいて、3DV復号部423から供給される互換多重化画像を、L画像やR画像と同一の解像度のL視差画像とR視差画像に分離する。分離部424は、そのL視差画像とR視差画像を画像生成部426に供給する。
ステップS417において、分離部424は、L視差画像とR視差画像を画像生成部426に出力し、処理を終了する。
一方、ステップS415で復号の結果得られる画像が互換多重化画像ではないと判定された場合、ステップS418において、3DV復号部423は、種類情報に基づいて、復号の結果得られる画像が補助多重化画像であるかどうかを判定する。
ステップS418で復号の結果得られる画像が補助多重化画像であると判定された場合、3DV復号部423は、その補助多重化画像を分離部425に供給し、処理をステップS419に進める。
ステップS419において、分離部425は、受信部421からの補助多重化情報に基づいて、3DV復号部423から供給される補助多重化画像を、L画像やR画像と同一の解像度の2視点のO多画像に分離する。分離部425は、その2視点のO多画像を画像生成部426に供給する。
ステップS420において、分離部425は、2視点のO多画像を画像生成部426に出力し、処理を終了する。
ステップS418で復号の結果得られる画像が補助多重化画像ではないと判定された場合、ステップS421において、3DV復号部423は、種類情報に基づいて、復号の結果得られる画像が補助視差多重化画像であるかどうかを判定する。
ステップS421で復号の結果得られる画像が補助視差多重化画像であると判定された場合、3DV復号部423は、その補助視差多重化画像を分離部425に供給し、処理をステップS422に進める。
ステップS422において、分離部425は、補助多重化情報に基づいて、3DV復号部423から供給される補助視差多重化画像を、L画像やR画像と同一の解像度の2視点のO多視差画像に分離する。分離部425は、その2視点のO多視差画像を画像生成部426に供給する。
ステップS423において、分離部424は、2視点のO多視差画像を画像生成部426に出力し、処理を終了する。
一方、ステップS421で復号の結果得られる画像が補助視差多重化画ではないと判定された場合、即ち、復号の結果得られる画像がL画像またはR画像である場合、処理はステップS424に進む。
ステップS424において、3DV復号部423は、復号の結果得られるL画像またはR画像を画像生成部426に出力し、処理を終了する。
また、ステップS413でL画像、R画像、補助多重化画像、互換多重化画像、または補助視差多重化画像の符号化データではないと判定された場合、即ち、分離部422から供給されるデータがSPS,Subset SPS、またはSEIの情報である場合、処理はステップS425に進む。
ステップS425乃至S428の処理は、図51のステップS339乃至S342の処理と同様であるので、説明は省略する。
以上のように、復号装置420は、NALヘッダに基づいて、ビットストリームを各NALユニットに分離する。そして、復号装置420は、分離されたNALユニットに含まれる互換画像の符号化データを既存のAVC方式またはMVC方式に対応する方式で復号し、補助画像および視差画像の符号化データを3DV方式に対応する方式で復号する。従って、復号装置420は、符号化装置380で既存の方式との互換性を有する方式で符号化された結果得られるビットストリームを復号することができる。
なお、図示は省略するが、図53の符号化装置380により生成されるビットストリームを復号するAVC方式の復号装置とMVC方式の復号装置は、それぞれ、図46の復号装置320、図48の復号装置340と同様である。
[視差情報の他の配置例]
上述した説明では、SEIに視差情報が含まれたが、TSに含まれるようにしてもよい。この場合、例えば、TS内のPMT(Program Map Table)やSIT(Selection Information Table)のディスクリプタに視差情報が記述される。
図61は、視差情報がPMTのディスクリプタに記述される場合の、視差情報の記述例を示す図である。
図61に示すように、視差情報がPMTのディスクリプタに記述される場合、PMTのディスクリプタとして、視差情報が配置されるディスクリプタ(3DV_view_synthesis_descriptor)が設けられる。このディスクリプタには、図43に示した視差情報(3DV_view_synthesis_info)が記述される。
なお、視差情報は、SEIとTS内のPMTやSITの両方に含まれるようにしてもよい。また、拡張情報は、NALヘッダではなく、TS内のPMTやSIT、SEI等に記述されるようにしてもよい。
さらに、補助画像低解像度変換情報、互換多重化情報、および補助多重化情報は、SEI等に含められて伝送されるようにしてもよい。
また、上述した説明では、拡張情報が符号化データに付加されたが、拡張情報は、画像データ(又はビットストリーム)と別に伝送(記録)されてもよい。また、拡張情報は画像データ(又はビットストリーム)と連結されるようにしてもよい。
なお、本実施の形態では、「連結」を以下のように定義する。「連結」とは、画像データ(又はビットストリーム)と拡張情報とが互いにリンクされている状態を指す。連結対象の画像データと拡張情報とは、別の伝送路で伝送されてもよい。また、連結対象の画像データ(又はビットストリーム)と拡張情報とは、互いに別の記録媒体(又は同一の記録媒体内の別々の記録エリア)に記録されてもよい。なお、画像データ(又はビットストリーム)と拡張情報とをリンクさせる単位は、例えば、符号化処理単位(1フレーム、複数フレーム等)にすることができる。
さらに、符号化装置290および符号化装置380は、1本のTSを生成したが、補助情報が補助画像低解像度変換情報と参照画像低解像度変換情報に代わる点を除いて、図2の符号化装置50、図14の符号化装置140、図22の符号化装置180、および図33の符号化装置230と同様に、複数のTSを生成するようにしてもよい。
<第7実施の形態>
[符号化装置の第7実施の形態の構成例]
図62は、本技術を適用した符号化装置の第7実施の形態の構成例を示すブロック図である。
図62に示す構成のうち、図14の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図62の符号化装置440の構成は、主に、視差画像生成部143、エンコーダ145の代わりに、視差画像生成部441、エンコーダ442が設けられている点が図14の構成と異なる。符号化装置440は、互換画像の視差画像を空間方向に多重化するのではなく、時間方向に多重化して符号化する。
具体的には、符号化装置440の視差画像生成部441は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2乃至画像D2の各画素の視差を検出する。視差画像生成部441は、検出結果に基づいて、互換画像である画像A2の視差画像A2’および画像B2の視差画像B2’、並びに、補助画像である画像C2の視差画像C2’および画像D2の視差画像D2’を生成する。
また、視差画像生成部441は、図14の視差画像生成部143と同様に、視差画像C2’と視差画像D2’を、所定の多重化方式で空間方向に多重化する。さらに、視差画像生成部441は、視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像を、時間方向に多重化する。視差画像生成部441は、その結果得られる、1フレーム時間内に1フレーム分の視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像が存在する多重化画像を、時間多重化画像としてエンコーダ442に供給する。
また、視差画像生成部441は、補助画像の視差画像の多重化方式と、互換画像および補助画像の視差画像の多重化方式としての時間方向に多重化する方式(以下、フレームシーケンシャル方式という)とを示す情報を、視差画像情報生成部57に供給する。
エンコーダ442は、互換用エンコーダ151と補助用エンコーダ451により構成される。エンコーダ442の補助用エンコーダ451は、画像変換部142からの補助画像の多重化画像と視差画像生成部441からの時間多重化画像に対して、3DV方式でアクセスユニット単位の符号化を行う。補助用エンコーダ451は、その結果得られる符号化ストリームを補助ストリームとして多重化部59に供給する。
[補助情報の記述例]
図63は、補助情報がPMTのディスクリプタに記述される場合の互換情報と視差画像情報の記述例を示す図である。
図63に示すように、補助情報がPMTのディスクリプタに記述される場合、PMTのディスクリプタとして、互換情報が配置されるディスクリプタ(3DV_view_structure_descriptor)、視差画像情報が配置されるディスクリプタ(depth_map_structure_descriptor)等が設けられる。
そして、ディスクリプタ(depth_map_structure_descriptor)には、図64に示すように、ディスクリプタタグ(descriptor_tag)、ディスクリプタ長(descriptor_length)に続いて、視差画像情報として、視差画像の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の多重化方式(frame_packing_mode)、多重化されている視差画像を指定する情報(comb_frame_packing_views)などが記述される。
なお、多重化方式としては、サイドバイサイド方式(SBS)、トップアンドボトム方式(TOB)、フレームシーケンシャル方式などがある。
また、本明細書では、補助情報がTSに含まれるものとするが、補助情報は補助ストリームに含まれるようにしてもよい。
図65および図66は、補助情報が補助ストリームに含まれる場合の、補助ストリーム内の互換情報と視差画像情報の記述例を示す図である。
図65に示すように、互換情報(3DV_view_structure)と視差画像情報(depth_map_structure)は、例えば、補助ストリーム内のSEI(Supplemental Enhancement Information)に配置される。
視差画像情報(depth_map_structure)としては、図66に示すように、視差画像(depth map)の数(num_of_depth_map)、視差画像が多重化されているかどうかを表すフラグ(is_frame_packing)、視差画像の多重化方式(frame_packing_mode)、多重化されている視差画像を指定する情報(comb_frame_packing_views)などが記述される。
なお、図示は省略するが、画像情報は、視差画像ではなく、互換画像および補助画像についての情報であること以外視差画像情報と同様である。
[符号化装置の処理の説明]
図67および図68は、図62の符号化装置440による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図67および図68のステップS451乃至S459の処理は、図16および図17のステップS71乃至S79の処理と同様であるので、説明は省略する。
図68のステップS460において、視差画像生成部441は、補助画像の視差画像の多重化方式と、互換画像の視差画像および補助画像の視差画像の多重化画像の多重化方式を決定し、その多重化方式を示す情報を視差画像情報生成部57に供給する。
ステップS461において、視差画像情報生成部57は、視差画像生成部441から供給される情報に基づいて、補助画像の視差画像の多重化方式と、互換画像の視差画像および補助画像の視差画像の多重化画像の多重化方式を示す情報などを、視差画像情報として生成し、多重化部59に入力する。
ステップS462において、視差画像生成部441は、ステップS460で決定された多重化方式に基づいて、補助画像の視差画像C2’と視差画像D2’を空間方向に多重化し、互換画像の視差画像A2’および視差画像B2’と補助画像の視差画像の多重化画像を時間方向に多重化する。
ステップS463において、視差画像生成部441は、ステップS462の多重化の結果得られる時間多重化画像をエンコーダ442に入力する。
ステップS464において、エンコーダ442の互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS465において、補助用エンコーダ451は、画像変換部142からの補助画像の多重化画像と視差画像生成部441からの時間多重化画像を、3DV方式で符号化する。補助用エンコーダ451は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部59に供給する。
ステップS466において、多重化部59は、図17のステップS86の処理と同様に、互換用エンコーダ151から供給される互換ストリームからTS1を生成し、補助用エンコーダ451から供給される補助ストリームおよび補助情報からTS2を生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
[復号装置の構成例]
図69は、図62の符号化装置440から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図69に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図69の復号装置460の構成は、主に、デコーダ122、画像生成部171の代わりに、デコーダ461、画像生成部462が設けられている点が図18の構成と異なる。復号装置460は、符号化装置440から送信される多重化ストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置460のデコーダ461は、互換用デコーダ131と補助用デコーダ471により構成される。デコーダ461の補助用デコーダ471は、分離部121から供給される補助ストリームに含まれる補助画像の多重化画像と時間多重化画像を、図62の補助用エンコーダ451に対応する方式で復号する。補助用デコーダ471は、復号の結果得られる補助画像の多重化画像と時間多重化画像を画像生成部462に供給する。
画像生成部462は、視聴者からの表示指令に応じて画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部462は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、および時間多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部462は、視差画像情報取得部125からの視差画像情報に含まれる互換画像の視差画像と補助画像の視差画像の多重化画像の多重化方式としてフレームシーケンシャル方式を示す情報に基づいて、時間多重化画像から、互換画像の視差画像である視差画像A2’および視差画像B2’、並びに、補助画像の視差画像の多重化画像を分離する。そして、画像生成部462は、視差画像情報に含まれる補助画像の視差画像の多重化方式に基づいて、補助画像の視差画像の多重化画像から、視差画像C2’と視差画像D2’を分離する。
さらに、画像生成部462は、図18の画像生成部171と同様に、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部462は、画像生成部171と同様に、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部462は、画像生成部171と同様に、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部462は、画像生成部171と同様に、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部462は、画像生成部171と同様に、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部462は、画像生成部171と同様に、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ461から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部462は、画像生成部171と同様に、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号処理の説明]
図70は、図69の復号装置460による復号処理を説明するフローチャートである。この復号処理は、例えば、図62の符号化装置440から送信される多重化ストリームが復号装置460に入力されたとき、開始される。
図70のステップS471乃至S473の処理は、図19のステップS91乃至S93の処理と同様であるので、説明は省略する。
ステップS474において、補助用デコーダ471は、補助ストリームから符号化された補助画像の多重化画像と時間多重化画像を抽出し、図2の補助用エンコーダ62に対応する方式で復号する。補助用デコーダ471は、復号の結果得られる補助画像の多重化画像と時間多重化画像を画像生成部127に供給し、処理をステップS475に進める。
ステップS475乃至S479の処理は、図19のステップS95乃至S99の処理と同様であるので、説明は省略する。
ステップS480において、画像生成部462は、ステップS479で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、および時間多重化画像を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。
ステップS481乃至S486の処理は、図19のステップS101乃至S106の処理と同様であるので、説明は省略する。
なお、復号装置460との互換性を有する互換ストリームのみを復号可能な復号装置では、3DV Representation Delimiter NAL unitが付加されたTS2が無視され、ステップS483,S485、およびS486の処理が行われる。但し、この場合、ステップS485の処理では、予め決められた多重化方式に基づいて、互換画像の多重化画像が分離される。
<第8実施の形態>
[符号化装置の第8実施の形態の構成例]
図71は、本技術を適用した符号化装置の第8実施の形態の構成例を示すブロック図である。
図71に示す構成のうち、図14の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図71の符号化装置480の構成は、主に、視差画像生成部143、エンコーダ145、視差画像情報生成部57の代わりに視差画像生成部481、エンコーダ482、視差画像情報生成部483が設けられている点が図14の構成と異なる。符号化装置480は、互換画像に共通の視差値を表す共通視差画像と補助画像の共通視差画像を符号化する。
具体的には、符号化装置480の視差画像生成部481は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2と画像B2の間の各画素の視差を検出し、画像C2と画像D2の間の各画素の視差を検出する。視差画像生成部481は、画像A2と画像B2の間の各画素の視差を表す視差値からなる視差画像を、互換画像の共通視差画像AB2’として生成し、エンコーダ482に供給する。また、視差画像生成部481は、画像C2と画像D2の間の各画素の視差を表す視差値からなる視差画像を、補助画像の共通視差画像CD2’として生成し、エンコーダ482に供給する。
また、視差画像生成部481は、互換画像および補助画像の視差画像が共通視差画像であることを示す情報を視差画像情報生成部483に供給する。
エンコーダ482は、互換用エンコーダ151と補助用エンコーダ491により構成される。補助用エンコーダ491は、画像変換部142からの補助画像の多重化画像、並びに視差画像生成部481からの互換画像の共通視差画像AB2’および補助画像の共通視差画像CD2’に対して、3DV方式でアクセスユニット単位の符号化を行う。補助用エンコーダ491は、その結果得られる符号化ストリームを補助ストリームとして多重化部59に供給する。
視差画像情報生成部483は、視差画像生成部53から供給される情報に基づいて、互換画像と補助画像の視差画像が共通視差画像であることを示す情報などを、視差画像情報として生成し、多重化部59に供給する。
[符号化装置の処理の説明]
図72および図73は、図71の符号化装置480による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図72のステップS491乃至S498の処理は、図16のステップS71乃至S78の処理と同様であるので、説明は省略する。
図73のステップS499において、視差画像生成部481は、撮影部141A乃至撮影部141Dから供給される画像A2乃至画像D2を用いて、画像A2と画像B2間の各画素の視差と、画像C2と画像D2の各画素の視差を検出する。そして、視差画像生成部481は、画像A2と画像B2の間の各画素の視差を表す視差値からなる共通視差画像AB2’と、画像C2と画像D2の間の各画素の視差を表す視差値からなる共通視差画像CD2’を生成する。
ステップS500において、視差画像情報生成部483は、視差画像生成部481から供給される情報に基づいて、互換画像と補助画像の視差画像が共通視差画像であることを示す情報などを、視差画像情報として生成し、多重化部59に入力する。
ステップS501において、視差画像生成部481は、ステップS499で生成された補助画像の共通視差画像CD2’と互換画像の共通視差画像AB2’をエンコーダ482に入力する。
ステップS502において、エンコーダ482の互換用エンコーダ151は、画像変換部142から供給される互換画像の多重化画像を既存のAVC方式で符号化し、その結果得られる符号化ストリームを互換ストリームとして多重化部59に供給する。
ステップS503において、補助用エンコーダ491は、画像変換部142からの補助画像の多重化画像、並びに、視差画像生成部481からの互換画像の共通視差画像、および補助画像の共通視差画像を3DV方式で符号化する。補助用エンコーダ491は、符号化の結果得られる符号化ストリームを補助用ストリームとして多重化部59に供給する。
ステップS504において、多重化部59は、互換用エンコーダ151から供給される互換ストリームからTS1を生成し、補助用エンコーダ491から供給される補助ストリームおよび補助情報からTS2を生成して、多重化し、その結果得られる多重化ストリームを送信する。この多重化ストリームは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
[復号装置の構成例]
図74は、図71の符号化装置480から送信される多重化ストリームを復号する復号装置の構成例を示す図である。
図74に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図74の復号装置500の構成は、主に、デコーダ122、画像生成部171の代わりに、デコーダ501、画像生成部502が設けられている点が図18の構成と異なる。復号装置500は、符号化装置480から送信される多重化ストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置500のデコーダ501は、互換用デコーダ131と補助用デコーダ511により構成される。デコーダ501の補助用デコーダ511は、分離部121から供給される補助ストリームに含まれる補助画像の多重化画像、互換画像の共通視差画像AB2’、および補助画像の共通視差画像CD2’を、図71の補助用エンコーダ491に対応する方式で復号する。補助用デコーダ511は、復号の結果得られる補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2’を画像生成部502に供給する。
画像生成部502は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。詳細には、画像生成部502は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2’を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部502は、視差画像情報取得部125からの視差画像情報に含まれる互換画像と補助画像の視差画像が共通視差画像であることを示す情報に基づいて、共通視差画像AB2’と共通視差画像CD2’をそのままにする。
また、画像生成部502は、図18の画像生成部171と同様に、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。さらに、画像生成部502は、画像生成部171と同様に、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部502は、画像生成部171と同様に、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部502は、各互換画像、各補助画像、共通視差画像AB2’、および共通視差画像CD2’を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部502は、画像生成部171と同様に、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部502は、画像生成部171と同様に、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ501から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部502は、画像生成部171と同様に、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図75は、図74の復号装置500による復号処理を説明するフローチャートである。この復号処理は、例えば、図71の符号化装置480から送信される多重化ストリームが復号装置500に入力されたとき、開始される。
図75のステップS511乃至S513の処理は、図19のステップS91乃至S93の処理と同様であるので、説明は省略する。
ステップS514において、補助用デコーダ511は、補助ストリームから符号化された補助画像の多重化画像、互換画像の共通視差画像AB2’、および補助画像の共通視差画像CD2’を抽出し、図71の補助用エンコーダ491における符号化方式に対応する方式で復号する。補助用デコーダ511は、復号の結果得られる補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2’を画像生成部502に供給する。
ステップS515乃至S519の処理は、図19のステップS95乃至S99の処理と同様であるので、説明は省略する。
ステップS519の処理後、ステップS520において、画像生成部502は、ステップS519で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報等に基づいて、互換画像、補助画像の多重化画像、共通視差画像AB2’、および共通視差画像CD2'を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。
ステップS521乃至S526の処理は、図19のステップS101乃至S106の処理と同様であるので、説明は省略する。
なお、符号化装置440および符号化装置480は、符号化装置140と同様に2視点の互換画像を多重化して符号化したが、図22の符号化装置180と同様に2視点の互換画像を多重化せずに符号化するようにしてもよい。また、符号化装置440および符号化装置480は、図2の符号化装置50と同様に、1視点の互換画像を符号化するようにしてもよい。
また、符号化装置140と符号化装置180は、互換画像と補助画像の視差画像を多重化せずに符号化するようにしてもよい。さらに、符号化装置50は、補助画像の視差画像を多重化せずに符号化するようにしてもよい。
<符号化対象の多重化パターンの例>
図76は、互換画像の視点数が2であり、補助画像の視点数が2である場合の、符号化対象の多重化パターンの例を示す図である。
図76の(1)に示すように、図14の符号化装置140は、互換画像である画像A2と画像B2を空間方向に多重化し、AVC方式で符号化する。また、符号化装置140は、補助画像である画像C2と画像D2、互換画像の視差画像である視差画像A2’と視差画像B2’、並びに、補助画像の視差画像である視差画像C2’と視差画像D2’をそれぞれ空間方向に多重化して、MVC方式に準ずる3DV方式で符号化する。
なお、符号化装置140は、図76の(2)に示すように、視差画像A2’乃至D2’を多重化せず、MVC方式に準ずる3DV方式で符号化するようにしてもよい。さらに、図76の(3)に示すように、図71の符号化装置480は、互換画像の視差画像である視差画像A2’と視差画像B2’の代わりに、共通視差画像AB2’を符号化し、補助画像の視差画像である視差画像C2’と視差画像D2’の代わりに、共通視差画像CD2’を符号化する。
また、図76の(4)に示すように、図62の符号化装置440は、互換画像の視差画像である視差画像A2’と視差画像B2’を空間方向に多重化せず、視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像をフレームシーケンシャル方式で多重化し、MVC方式に準ずる3DV方式で符号化する。
さらに、図76の(5)に示すように、図22の符号化装置180は、互換画像である画像A2と画像B2を多重化せずに、画像A2をAVC方式で符号化し、画像B2を、画像A2をベースビューとしたMVC方式で符号化する。また、符号化装置180は、補助画像である画像C2と画像D2、互換画像の視差画像である視差画像A2’と視差画像B2’、並びに、補助画像の視差画像である視差画像C2’と視差画像D2’をそれぞれ空間方向に多重化し、MVC方式に準ずる3DV方式で符号化する。
なお、符号化装置180は、図76の(6)に示すように、視差画像A2’乃至D2’を多重化せず、MVC方式に準ずる3DV方式で符号化するようにしてもよい。また、符号化装置180は、図76の(7)に示すように、符号化装置480と同様に、視差画像A2’と視差画像B2’の代わりに共通視差画像AB2’を符号化し、視差画像C2’と視差画像D2’の代わりに共通視差画像CD2’を符号化するようにしてもよい。
さらに、符号化装置180は、図76の(8)に示すように、符号化装置440と同様に、視差画像A2’と視差画像B2’を空間方向に多重化せず、視差画像A2’、視差画像B2’、および補助画像の視差画像の多重化画像をフレームシーケンシャル方式で多重化し、MVC方式に準ずる3DV方式で符号化するようにすることもできる。
図77は、図76の(1)乃至(8)に示した多重化パターンでの多重化による効果の特徴を示す図である。
図77の表では、効果の項目「互換性」、「画質」、および「データ量」が設けられ、図76の(1)乃至(8)に示した多重化パターンにおける各項目の効果の度合が表されている。なお、図77の表において、丸は、効果があることを表し、二重丸は、顕著な効果があることを表す。
図76の(1)に示した多重化パターンで多重化が行われる場合、互換画像の多重化方式および符号化方式が既存の方式と同一となり、互換性が確保される。また、視差画像が、互換画像と同様に空間方向に多重化されるので、例えば、復号装置側に用意されている互換画像を分離する分離部を用いて視差画像を分離することができる。従って、復号装置側で視差画像を分離できることが保証される。よって、この場合、互換性において顕著な効果があり、図77の項目「互換性」に対応して二重丸が記述されている。
また、図76の(2)に示した多重化パターンで多重化が行われる場合、互換画像の多重化方式および符号化方式が既存の方式と同一となり、互換性が確保される。また、視差画像の解像度が多重化前の画像と同一の解像度であるので精度が高い。その結果、復号装置において、視差画像を用いて生成される所定の視点の画像の精度が向上する。従って、この場合、互換性と、視差画像を用いて生成される画像の画質とにおいて効果があり、図77の項目「互換性」と「画質」に対応して丸が記述されている。
さらに、図76の(3)に示した多重化パターンで多重化が行われる場合、互換画像の符号化方式および多重化方式が既存の方式と同一となり、互換性が確保される。また、多重化前の画像と同一の解像度の互換画像および補助画像の視差画像のデータ量が、2視点分の視差画像のデータ量に削減される。従って、この場合、互換性とデータ量において効果があり、図77の項目「互換性」と「データ量」に対応して丸が記述されている。
また、図76の(4)に示した多重化パターンで多重化が行われる場合、互換画像の符号化方式および多重化方式が既存の方式と同一となり、互換性が確保される。また、視差画像が時間方向に多重化されるので、各時刻における視差画像のデータ量が、図76の(3)の場合に比べてより削減され、伝送可能なデータ量が増加する。従って、多重化前の画像と同一の解像度の視差画像を伝送可能なほど伝送帯域に余裕がない状況であっても、多重化前の画像と同一の解像度の視差画像を伝送することができるので、復号装置において、視差画像を用いて生成される所定の視点の画像の精度が向上する。よって、この場合、互換性と視差画像を用いて生成される画像の画質に効果があり、データ量において顕著な効果がある。従って、図77の項目「互換性」と「画質」に対応して丸が記述され、「データ量」に対応して二重丸が記述されている。
図76の(1)乃至(4)に示した多重化パターンでの多重化は、例えば、放送、ATSC(Advanced Television Systems Committee)2.0規格等に準拠したIP(Internet Protocol)と融合した放送である次世代放送、またはインターネット配信のアプリケーション用の画像を符号化対象とするときに行われる。
さらに、図76の(5)に示した多重化パターンで多重化が行われる場合、互換画像の符号化方式および多重化方式が既存の方式と同一となり、互換性が確保される。また、各視差画像の解像度が画像の解像度の半分であるので、互換画像および補助画像の視差画像のデータ量が、2視点分の視差画像のデータ量に削減される。従って、この場合、互換性とデータ量に効果があり、図77の項目「互換性」と「データ量」に対応して丸が記述されている。
また、図76の(6)に示した多重化パターンで多重化が行われる場合、図76の(2)と同様に、互換性が確保されるとともに、復号装置において視差画像を用いて生成される所定の視点の画像の精度が向上する。従って、この場合、互換性と視差画像を用いて生成される画像の画質に効果があり、図77の項目「互換性」と「画質」に対応して丸が記述されている。
また、図76の(7)に示した多重化パターンで多重化が行われる場合、図76の(3)と同様に、互換性が確保されるとともに、視差画像のデータ量が削減される。従って、この場合、互換性とデータ量に効果があり、図77の項目「互換性」と「データ量」に対応して丸が記述されている。
図76の(8)に示した多重化パターンで多重化が行われる場合、図76の(4)と同様に、互換性が確保される。また、図76の(4)と同様に、各時刻における視差画像のデータ量が、図76の(7)の場合に比べてより削減され、その結果、復号装置において視差画像を用いて生成される所定の視点の画像の精度が向上する。従って、この場合、互換性と視差画像を用いて生成される画像の画質に効果があり、データ量において顕著な効果がある。よって、図77の項目「互換性」と「画質」に対応して丸が記述され、「データ量」に対応して二重丸が記述されている。
また、図76の(5)、(7)、および(8)に示した多重化パターンでの多重化は、例えば、BD、放送、次世代放送、またはインターネット配信のアプリケーション用の画像を符号化対象とするときに行われる。さらに、図76の(6)に示した多重化パターンでの多重化は、例えば、BD、次世代放送、またはインターネット配信のアプリケーション用の画像を符号化対象とするときに行われる。
図78は、互換画像の視点数が1であり、補助画像の視点数が2である場合の、符号化対象の多重化パターンの例を示す図である。
図78の(1)に示すように、図2の符号化装置50は、互換画像である画像A1をAVC方式で符号化する。また、符号化装置50は、補助画像である画像B1と画像C1、および、補助画像の視差画像である視差画像B1’と視差画像C1’をそれぞれ時間方向に多重化する。そして、符号化装置50は、互換画像の視差画像である視差画像A1’、補助画像の多重化画像、および補助画像の視差画像の多重化画像を、MVC方式に準ずる3DV方式で符号化する。
なお、符号化装置50は、図78の(2)に示すように、視差画像A1’乃至C1’を多重化せず、MVC方式に準ずる3DV方式で符号化するようにしてもよい。また、図78の(3)に示すように、符号化装置50は、符号化装置480と同様に、補助画像の視差画像の多重化画像の代わりに、補助画像である画像Bと画像Cの共通視差画像BC1’を符号化するようにすることもできる。
さらに、図78の(4)に示すように、符号化装置50は、符号化装置440と同様に、視差画像B1’と視差画像C1’を空間方向に多重化せず、視差画像A1’乃至視差画像C1’をフレームシーケンシャル方式で多重化し、MVC方式に準ずる3DV方式で符号化するようにすることもできる。
なお、図78の(1)乃至(4)に示した多重化パターンでの多重化による効果、および、その多重化パターンでの多重化を行うときの符号化対象は、それぞれ、図76の(5)乃至(8)に示した多重化パターンでの多重化による効果および符号化対象と同様である。但し、図78の(1)に示した多重化パターンでの多重化では、互換画像の視差画像の解像度は互換画像と同一であるので、この多重化による効果としての視差画像のデータ量の削減は、補助画像の視差画像についてのみの効果である。
図79は、互換画像の視点数が2であり、補助画像の視点数が0である場合の、符号化対象の多重化パターンの例を示す図である。
互換画像の視点数が2であり、補助画像の視点数が0である場合、図79の(1)に示すように、図14の符号化装置140の場合と同様に、互換画像である画像A2と画像B2が空間方向に多重化されて、AVC方式で符号化される。また、互換画像の視差画像である視差画像A2’と視差画像B2’が空間方向に多重化されて、AVC方式に準ずる3DV方式で符号化される。
なお、図79の(2)に示すように、視差画像A2’と視差画像B2’は多重化されず、MVC方式に準ずる3DV方式で符号化されるようにしてもよい。また、図79の(3)に示すように、符号化装置480の場合と同様に、視差画像A2’と視差画像B2’の代わりに共通視差画像AB2’が符号化されるようにすることもできる。
また、図79の(4)に示すように、符号化装置440の場合と同様に、視差画像A2’と視差画像B2’が、時間方向に多重化されるのではなく、フレームシーケンシャル方式で多重化され、符号化されるようにすることもできる。
さらに、図79の(5)に示すように、符号化装置180の場合と同様に、互換画像である画像A2と画像B2が多重化されずに、画像A2がAVC方式で符号化されるとともに、画像B2が、画像A2をベースビューとしたMVC方式で符号化されるようにすることもできる。
また、この場合、図79の(6)に示すように、図79の(2)と同様に、視差画像が多重化されずに符号化されたり、図79の(7)に示すように、図79の(3)と同様に、共通視差画像AB2’が符号化されたりするようにすることもできる。また、図79の(8)に示すように、図79の(4)と同様に、互換画像の視差画像がフレームシーケンシャル方式で多重化され、符号化されるようにすることもできる。
なお、図78の(1)乃至(8)に示した多重化パターンでの多重化による効果、および、その多重化パターンでの多重化を行うときの符号化対象は、それぞれ、図76の(1)乃至(8)に示した多重化パターンでの多重化による効果および符号化対象と同一である。
また、上述した説明では、フレームシーケンシャル方式で多重化される視差画像の解像度は、多重化前の画像と同一の解像度であったが、多重化前の画像の解像度より低下させるようにしてもよい。また、補助画像も、視差画像と同様にフレームシーケンシャル方式で多重化されるようにしてもよい。
さらに、上述した説明では、符号化装置において、画像の多重化方式を示す情報と視差画像の多重化方式を示す情報が伝送されたが、図76、図78、および図79に示した多重化パターンを識別する情報を伝送するようにしてもよい。
また、符号化装置は、符号化対象の画像に対応するアプリケーションを識別するフラグを伝送するようにしてもよい。
<第9実施の形態>
[符号化装置の第9実施の形態の構成例]
図80は、本技術を適用した符号化装置の第9実施の形態の構成例を示すブロック図である。
図80に示す構成のうち、図14の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図80の符号化装置520の構成は、主に、エンコーダ145、多重化部59の代わりにエンコーダ523、伝送部524が設けられている点、および、多重化部521と多重化情報生成部522が新たに設けられている点が図14の構成と異なる。
符号化装置520は、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像をフレームシーケンシャル方式で多重化し、符号化する。
具体的には、符号化装置520の多重化部521は、画像変換部142による多重化の結果得られる互換画像および補助画像の多重化画像、並びに、視差画像生成部143による多重化の結果得られる互換画像および補助画像の視差画像の多重化画像を、フレームシーケンシャル方式で多重化する。
そして、多重化部521は、多重化の結果得られる、1フレーム時間内に、互換画像の多重化画像、互換画像の視差画像の多重化画像、補助画像の多重化画像、および補助画像の視差画像の多重化画像が順に存在する多重化画像を、時間方向多重化画像としてエンコーダ523に供給する。
また、多重化部521は、互換画像および補助画像の多重化画像、並びに、互換画像および補助画像の視差画像の多重化画像が、フレームシーケンシャル方式で多重化されていること、時間多重化画像内の画像の配置順等を示す情報を、多重化情報生成部522およびエンコーダ523に供給する。
多重化情報生成部522は、多重化部521から供給される情報に基づいて、その情報などを、互換画像および補助画像、並びに、互換画像および補助画像の視差画像の多重化に関する全体多重化情報として生成し、伝送部524に供給する。
エンコーダ523は、互換用エンコーダ531と補助用エンコーダ532により構成される。エンコーダ523は、多重化部521から供給される情報に基づいて、多重化部521から供給される時間多重化画像のうちの互換画像の多重化画像を指定し、互換画像の多重化画像を互換用エンコーダ531に供給する。また、エンコーダ523は、多重化部521から供給される情報に基づいて、時間多重化画像のうちの補助画像の多重化画像並びに互換画像および補助画像の視差画像の多重化画像を、補助用エンコーダ532に供給する。
エンコーダ523の互換用エンコーダ531は、時間多重化画像のうちの互換画像の多重化画像に対して、既存のAVC方式でアクセスユニット単位の符号化を行う。補助用エンコーダ532は、時間多重化画像のうちの補助画像の多重化画像並びに互換画像および補助画像の視差画像の多重化画像に対して、3DV方式でアクセスユニット単位の符号化を行う。このとき、補助画像の多重化画像は、互換画像の多重化画像を参照して符号化され、補助画像の視差画像の多重化画像は、互換画像の視差画像の多重化画像を参照して符号化される。
エンコーダ523は、互換用エンコーダ531または補助用エンコーダ532で符号化された結果得られる時間多重化画像の符号化データからなるビットストリームを伝送部524に供給する。
伝送部524は、エンコーダ523から供給されるビットストリーム、画像情報生成部54からの画像情報、互換情報生成部55からの互換情報、視点間距離情報生成部144からの視点間距離情報、視差画像情報生成部57からの視差画像情報、多重化情報生成部522からの全体多重化情報などを用いて、TSを生成する。多重化部59は、生成されたTSを送信する。
[符号化装置の処理の説明]
図81および図82は、図80の符号化装置520による符号化処理を説明するフローチャートである。この符号化処理は、例えば、撮影部141A乃至撮影部141Dから画像A2乃至画像D2が出力されたとき開始される。
図81のステップS531乃至S537の処理は、図16のステップS71乃至S77の処理と同様であるので、説明は省略する。
ステップS537の処理後、ステップS538において、画像変換部142は、互換画像の多重化画像と補助画像の多重化画像を多重化部521に入力し、処理を図82のステップS539に進める。
図82のステップS539乃至S542の処理は、図17のステップS79乃至S82の処理と同様であるので、説明は省略する。
ステップS543の処理後、ステップS544において、多重化部521は、画像変換部142による多重化の結果得られる互換画像および補助画像の多重化画像、並びに、視差画像生成部143による多重化の結果得られる互換画像および補助画像の視差画像の多重化画像を、フレームシーケンシャル方式で多重化する。多重化部521は、多重化の結果得られる多重化画像を、時間方向多重化画像としてエンコーダ523に供給する。
また、多重化部521は、互換画像および補助画像の多重化画像並びに視差画像の多重化画像がフレームシーケンシャル方式で多重化されていること、時間多重化画像内の画像の配置順等を示す情報を、多重化情報生成部522およびエンコーダ523に供給する。
ステップS545において、多重化情報生成部522は、多重化部521から供給される情報に基づいて、その情報などを全体多重化情報として生成し、伝送部524に入力する。
ステップS546において、互換用エンコーダ531は、エンコーダ523によって多重化部521からの情報に基づいて入力される、時間多重化画像のうちの互換画像の多重化画像を既存のAVC方式で符号化する。
ステップS547において、補助用エンコーダ532は、エンコーダ523によって多重化部521からの情報に基づいて入力される、時間多重化画像のうちの補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を、3DV方式で符号化する。エンコーダ523は、ステップS546およびS547の符号化の結果得られる時間多重化画像の符号化データからなるビットストリームを伝送部524に供給する。
ステップS548において、伝送部524は、エンコーダ523からのビットストリーム、補助情報、および多重化情報生成部522からの全体多重化情報からTSを生成し、送信する。このTSは、例えばBD等に記録されたり、放送用ストリームとして送信されたりする。そして、処理は終了する。
以上のように、符号化装置520は、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データから1本のビットストリームを生成する。従って、1本のビットストリームのみを復号可能なデコーダを有する復号装置において、符号化装置520により生成されたビットストリームを復号することができる。
なお、上述した説明では、互換画像の視差画像、補助画像、および補助画像の視差画像が、互換画像の符号化方式に準ずる3DV方式で符号化されるものとしたが、互換画像の符号化方式に準じないMPEG2(Moving Picture Experts Group phase 2)方式等で符号化されるようにしてもよい。
[復号装置の構成例]
図83は、図80の符号化装置520から送信されるTSを復号する復号装置の構成例を示す図である。
図83に示す構成のうち、図18の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図83の復号装置540の構成は、主に、分離部121、デコーダ122、画像生成部171の代わりに受信部541、デコーダ542、画像生成部544が設けられている点、および、多重化情報取得部543が新たに設けられている点が図18の構成と異なる。復号装置540は、符号化装置520から送信されるTSに含まれる時間多重化画像のビットストリームを復号し、2視点の画像または多視点の画像を生成して、図示せぬ表示装置に表示させる。
具体的には、復号装置540の受信部541は、符号化装置520から送信されてくるTSを受信する。受信部541は、TSに含まれる時間多重化画像のビットストリームを抽出し、デコーダ542に供給する。また、受信部541は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、受信部541は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。また、受信部541は、TSに含まれる全体多重化情報を抽出し、多重化情報取得部543に供給する。
デコーダ542は、互換用デコーダ551と補助用デコーダ552により構成される。デコーダ542の互換用デコーダ551は、受信部541から供給されるビットストリームに含まれる互換画像の多重化画像の符号化データをAVC方式に対応する方式で復号し、画像生成部544に供給する。
補助用デコーダ552は、受信部541から供給されるビットストリームに含まれる補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データを、図80の補助用エンコーダ532における符号化方式に対応する方式で復号する。補助用デコーダ552は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を画像生成部544に供給する。
多重化情報取得部543は、受信部541から供給される全体多重化情報を取得し、画像生成部544に供給する。
画像生成部544は、視聴者からの表示指令に応じて、画像を出力し、図示せぬ表示装置に表示させる。具体的には、画像生成部544は、視聴者からの多視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報、視点間距離情報取得部124からの視点間距離情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報、多重化情報取得部543からの全体多重化情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、図示せぬ表示装置に対応する3以上の視点数の、互換画像や補助画像の解像度の半分の解像度の画像を生成する。
より詳細には、画像生成部544は、多重化情報取得部543からの全体多重化情報に基づいて、補助用デコーダ552から供給される補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を識別する。また、画像生成部544は、図18の画像生成部171と同様に、視差画像情報取得部125からの視差画像情報に含まれる補助画像の視差画像の多重化方式を示す情報に基づいて、補助画像の視差画像の多重化画像から、各補助画像の視差画像を分離する。また、画像生成部544は、画像生成部171と同様に、視差画像情報に含まれる互換画像の視差画像の多重化方式を示す情報に基づいて、互換画像の視差画像の多重化画像から、各互換画像の視差画像を分離する。
さらに、画像生成部544は、画像生成部171と同様に、画像情報取得部123からの画像情報に含まれる補助画像の多重化方式を示す情報に基づいて、補助画像の多重化画像から、各補助画像を分離する。また、画像生成部544は、画像生成部171と同様に、画像情報に含まれる互換画像の多重化方式を示す情報に基づいて、互換画像の多重化画像から、各互換画像を分離する。
また、画像生成部544は、画像生成部171と同様に、視点間距離情報と図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。そして、画像生成部544は、画像生成部171と同様に、各互換画像、各補助画像、各互換画像の視差画像、および各補助画像の視差画像を用いて、位置が決定された各視点の画像を生成する。そして、画像生成部544は、生成された多視点の画像の解像度を、互換画像や補助画像の解像度の1/視点数の解像度に変換して合成し、図示せぬ表示装置に表示させる。
このとき、合成後の多視点の画像は、視点ごとに視認可能な角度が異なるように表示され、視聴者は、任意の2視点の各画像を左右の各目で見ることにより、メガネを装着せずに3D画像を見ることができる。
また、画像生成部544は、画像生成部171と同様に、視聴者からの2視点方式の3D画像の表示指令に応じて、画像情報取得部123からの画像情報に基づいて、デコーダ542から供給される互換画像の多重化画像を、互換画像の解像度の半分の解像度の画像A2と画像B2に分離する。そして、画像生成部544は、画像生成部171と同様に、分離された互換画像の解像度の半分の解像度の画像A2と画像B2を交互に出力して、図示せぬ表示装置に表示させる。このとき、視聴者は、画像A2の表示時に左目用のシャッタまたは右目用のシャッタの一方が開き、画像B2の表示時に他方が開くメガネを装着して、表示装置に交互に表示される画像A2と画像B2を見ることにより、3D画像を見ることができる。
[復号装置の処理の説明]
図84は、図83の復号装置540による復号処理を説明するフローチャートである。この復号処理は、例えば、図80の符号化装置520から送信されるTSが復号装置540に入力されたとき、開始される。
図84のステップS551において、復号装置540の受信部541は、符号化装置520から送信されてくるTSを受信する。受信部541は、TSに含まれるビットストリームを抽出し、デコーダ542に供給する。また、受信部541は、TSに含まれる補助情報を抽出し、補助情報のうちの画像情報を画像情報取得部123に供給し、視点距離情報を視点間距離情報取得部124に供給する。さらに、受信部541は、補助情報のうちの視差画像情報を視差画像情報取得部125に供給し、互換情報を互換情報取得部126に供給する。また、受信部541は、TSに含まれる全体多重化情報を抽出し、多重化情報取得部543に供給する。
ステップS552において、画像生成部544は、図19のステップS92の処理と同様に、視聴者から2視点方式の3D画像の表示が指令されたかどうかを判定する。ステップS552で視聴者から2視点方式の3D画像の表示が指令されていないと判定された場合、即ち多視点方式の3D画像の表示が指令された場合、処理はステップS553に進む。
ステップS553において、デコーダ542の互換用デコーダ551は、受信部541から供給されるビットストリームから互換画像の多重化画像の符号化データを抽出し、AVC方式に対応する方式で復号する。そして、互換用デコーダ551は、復号の結果得られる互換画像の多重化画像を画像生成部544に供給する。
ステップS554において、補助用デコーダ552は、受信部541から供給されるビットストリームから補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データを抽出し、図80の補助用エンコーダ532に対応する方式で復号する。補助用デコーダ552は、復号の結果得られる補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を画像生成部544に供給し、処理をステップS555に進める。
ステップS555乃至S558の処理は、図19のステップS95乃至S98の処理と同様であるので、説明は省略する。
ステップS558の処理後、ステップS559において、多重化情報取得部543は、受信部541から供給される全体多重化情報を取得し、画像生成部544に入力する。
ステップS560において、画像生成部544は、図19のステップS99の処理と同様に、視点間距離情報取得部124からの視点間距離情報と、図示せぬ表示装置に対応する視点数に基づいて、生成する多視点の画像の各視点の位置を決定する。
ステップS561において、画像生成部544は、ステップS560で決定された各視点の位置、画像情報取得部123からの画像情報、視差画像情報取得部125からの視差画像情報、互換情報取得部126からの互換情報、多重化情報取得部543からの全体多重化情報等に基づいて、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像を用いて、各視点の、互換画像や補助画像の半分の解像度の画像を生成する。そして、処理はステップS562に進む。
ステップS562乃至S567の処理は、図19のステップS101乃至S106の処理と同様であるので、説明は省略する。但し、ステップS564の処理では、互換用デコーダ551は、互換ストリームではなく、受信部541から供給されるビットストリームから互換画像の多重化画像を抽出する。
なお、復号装置540との互換性を有する互換画像のみを復号可能な復号装置では、処理可能な互換画像の符号化データ以外の符号化データが無視され、ステップS564,S566、およびS567の処理が行われる。但し、この場合、ステップS566の処理では、予め決められた多重化方式に基づいて、互換画像の多重化画像が分離される。
以上のように、復号装置540は、互換画像の多重化画像、補助画像の多重化画像、互換画像の視差画像の多重化画像、および補助画像の視差画像の多重化画像の符号化データから生成された1本のビットストリームを復号することができる。
<第5実施の形態におけるビットストリームの他の例>
[ビットストリームの他の構成例]
図85は、第5実施の形態で生成されるアクセスユニット単位のビットストリームの他の構成例を示す図である。
なお、図85の例では、互換画像が1920×1080画素のL画像とR画像であり、補助画像が1920×1080画素のO画像である。また、L視差画像、R視差画像、およびO視差画像のサイズは、960×1080画素である。さらに、L画像はAVC方式で符号化され、R画像はMVC方式で符号化され、O画像、L視差画像、R視差画像、およびO視差画像は3DV方式で符号化される。また、L画像、R画像、O画像、L視差画像、R視差画像、O視差画像のビューIDは、それぞれ、0,1,2,3,4,5である。なお、ビューIDとは、各視点の画像および視差画像に固有のIDである。
図85に示すように、アクセスユニット単位のビットストリームには、例えば、先頭から順に、アクセスユニットデリミタ(AUD),SPS、画像用のMVC方式のSubset SPS(Subset SPS1)、視差画像用の3DV方式のSubset SPS(Subset SPS2),PPS,AVC方式のSEI,MVC方式のSEI,3DV方式のSEI、符号化データのNALユニットが配置される。
アクセスユニットデリミタのNALユニットは、アクセスユニットの境界を表すNALユニットである。SPSのNALユニットは、AVC方式で定義されるプロファイルのうちのL画像のプロファイルを表すprofile_idc(図85の例では100)を含むSPSのNALユニットである。画像用のSubset SPSのNALユニットは、MVC方式で定義されるプロファイルのうちのR画像およびO画像のプロファイルを表すprofile_idc(図85の例では128)を含むSubset SPSのNALユニットである。視差画像用のSubset SPSのNALユニットは、3DV方式で視差画像用のプロファイルとして定義されるプロファイルのうちの、L視差画像、R視差画像、およびO視差画像のプロファイルを表すprofile_idc(図85の例では138)を含むSubset SPSのNALユニットである。
AVC方式のSEIのNALユニットは、L画像のSEIのNALユニットである。MVC方式のSEIのNALユニットは、L画像とR画像のSEIのNALユニットである。3DV方式のSEIのNALユニットは、L画像、R画像、O画像、L視差画像、R視差画像、およびO視差画像のSEIのNALユニットである。
符号化データのNALユニットとしては、先頭から順に、L画像の符号化データ、デリミタ(MVC DD)、R画像の符号化データ、デリミタ(3DV DD)、O画像の符号化データ、デリミタ(3DV DD)、L視差画像の符号化データ、デリミタ(3DV DD)、R視差画像の符号化データ、デリミタ(3DV DD)、O視差画像の符号化データのNALユニットが配置される。
L画像の符号化データのNALユニットには、NALユニットのタイプとして1または5を含むNALヘッダが付加される。また、デリミタ(MVC DD)のNALユニットは、MVC方式の符号化データの先頭を表すNALユニットである。R画像の符号化データのNALユニットには、NALユニットのタイプとして20を含むNALヘッダが付加される。また、デリミタ(3DV DD)のNALユニットは、3DV方式の符号化データの先頭を表すNALユニットである。また、O画像、L視差画像、R視差画像、およびO視差画像の符号化データのNALユニットには、NALユニットのタイプとして21を含むNALヘッダが付加される。
[視差画像用の3DV方式のSubset SPSの記述例]
図86は、図85の視差画像用の3DV方式のSubset SPSの記述例を示す図である。
図86に示すように、視差画像用の3DV方式のSubset SPSには、L視差画像、R視差画像、およびO視差画像のプロファイルを表すprofile_idc(図86の例では138)を含むSPS(seq_parameter_set_data)と、3DV方式で定義されているprofile_idcごとの情報とが記述されている。
具体的には、視差画像用の3DV方式のSubset SPSには、profile_idcが138であるときの情報として、視差画像用拡張情報(seq_parameter_set_depth_extension)、視差画像用VUI拡張情報が含まれるかどうかを表す視差画像用VUI情報フラグ(depth_vui_parameters_present_flag)等が記述される。また、視差画像用VUI情報フラグが、視差画像用VUI拡張情報が含まれることを表す場合には、視差画像用VUI拡張情報(depth_vui_parameters__extension)も記述される。
なお、視差画像用の3DV方式のSubset SPSを復号時に参照する場合、即ち、L視差画像、R視差画像、およびO視差画像を復号する場合、IDRピクチャの復号時と同様に、参照画像はリセットされる。
図87は、図86の視差画像用拡張情報の記述例を示す図である。
図87に示すように、視差画像用拡張情報は、MVC方式のSubset SPS内の拡張情報(seq_parameter_set_mvc_extension)と同様に記述される情報と、各視差画像に対応する画像のビューID(ref_view_id)とからなる。
なお、図87では、MVC方式のSubset SPS内の拡張情報と同様に記述される情報は展開されて視差画像用拡張情報に含められる。従って、各視差画像のビューID(view_id)と、各視差画像に対応する画像のビューIDとを、視差画像ごとにまとめて記述することができる。即ち、視差画像の数を表す情報(num_views_minus1)を記述し、その数だけ、視差画像のビューIDと、その視差画像に対応する画像のビューIDを読み出させる記述を行うことができる。
これに対して、MVC方式のSubset SPS内の拡張情報と同様に記述される情報が展開されずに視差画像用拡張情報に含められる場合、視差画像用拡張情報のほかに、視差画像の数を表す情報を記述し、その数だけ、視差画像に対応する画像のビューIDを読み出させる記述を行う必要がある。その結果、視差画像の数を表す情報の記述と、その数だけ情報を読み出させる記述が重複する。
従って、図87に示すように、MVC方式のSubset SPS内の拡張情報と同様に記述される情報が展開されて視差画像用拡張情報に含められる場合、その情報が展開されずに視差画像用拡張情報に含められる場合に比べて、視差画像用拡張情報のデータ量を削減することができる。
図88は、図86の視差画像用VUI拡張情報の記述例を示す図である。
図88に示すように、視差画像用VUI拡張情報は、以下の点を除いて、MVC方式のVUI拡張情報(mvc_vui_parameters__extension)と同様に記述される。即ち、視差画像用VUI情報には、視差画像の各画素の、その視差画像に対応する画像上の位置のタイプを表す位置タイプが含まれるかどうかを表す位置タイプフラグ(depth_loc_info_present_flag)と解像度変換前の視差画像のサイズを表す変換前サイズ情報が含まれるかどうかを表す変換前サイズ情報フラグ(video_src_info_present_flag)が含まれる。また、位置タイプフラグが、位置タイプが含まれることを表す場合、視差画像用VUI情報には位置タイプも含まれ、変換前サイズ情報フラグが、変換前サイズ情報が含まれることを表す場合、視差画像用VUI情報には変換前サイズ情報も含まれる。
位置タイプは、トップフィールドの位置タイプ(depth_sample_loc_type_top_field)とボトムフィールドの位置タイプ(depth_sample_loc_type_bottom_field)からなる。トップフィールドおよびボトムフィールドの位置タイプは、それぞれ、MVC方式のVUI拡張情報に含まれるトップフィールドの位置タイプ(chroma_sample_loc_type_top_field)やボトムフィールドの位置タイプ(chroma_sample_loc_type_bottom_field)と同様に記述される。
また、変換前サイズ情報は、解像度変換前の視差画像の横方向のマクロブロック数を表す情報(pic_width_in_mbs_minus1)および縦方向のマクロブロック数を表す情報(pic_height_in_mbs_minus1)、アスペクト比を表すアスペクト情報が含まれるかどうかを表すアスペクト比フラグ(aspect_ratio_info_present_flag)等により構成される。なお、アスペクト比フラグが、アスペクト情報が含まれることを表す場合、変換前サイズ情報にはアスペクト情報も含まれる。
アスペクト情報は、アスペクト比に固有のIDであるアスペクト比ID(aspect_ratio_idc)等からなる。なお、このアスペクト比IDは、予め定義されているアスペクト比に付与されるほか、定義されていないアスペクト比全体に対しても付与される。そして、アスペクト情報に含まれるアスペクト比IDが、定義されていないアスペクト比全体に対して付与されたアスペクト比ID(Extended_SAR)である場合、アスペクト情報には、解像度変換前の視差画像のアスペクト比における横方向の値(sar_width)と縦方向の値(sar_height)も含まれる。
[3DV方式の符号化データのNALヘッダの記述例]
図89は、NALユニットタイプとして21を含む、3DV方式の符号化データのNALユニットのNALヘッダの記述例を示す図である。
図89に示すように、3DV方式の符号化データのNALヘッダには、NALユニットタイプが21であるときの情報として、視差画像用ヘッダ拡張情報が含まれているかどうかを表す視差画像用ヘッダ拡張情報フラグ(depth_extension_flag)等が記述される。ここで、視差画像用ヘッダ拡張情報は、3DV方式の視差画像の符号化データのNALヘッダに記述されるものであり、視差画像用ヘッダ拡張情報フラグは、上述した視差フラグと同様のものである。
視差画像用ヘッダ拡張情報フラグが、視差画像用ヘッダ拡張情報が含まれていることを表す場合、3DV方式の符号化データのNALヘッダには、視差画像用ヘッダ拡張情報(nal_unit_header_depth_extension)も記述される。一方、視差画像用ヘッダ拡張情報フラグが、視差画像用ヘッダ拡張情報が含まれていないことを表す場合、3DV方式の符号化データのNALヘッダには、MVC方式用ヘッダ拡張情報(nal_unit_header_mvc_extension)も記述される。
図90は、図89の視差画像用ヘッダ拡張情報の記述例を示す図である。
図90に示すように、視差画像用ヘッダ拡張情報は、視差画像に対応する画像のビューID(ref_view_id)を含む点を除いて、MVC方式用ヘッダ拡張情報と同様に構成される。
[3DV方式のSEIの記述例]
図91は、図85の3DV方式のSEIの記述例を示す図である。
図91に示すように、3DV方式のSEIは、MVC方式のSEIと同様に、SEIのメッセージが記述される。
即ち、3DV方式のSEIには、オペレーションポイントを指定するかどうかを表すオペレーションポイントフラグ(operation_point_flag)が記述され、オペレーションポイントフラグが、オペレーションポイントを指定しないことを表す場合、アクセスユニット内の全ての画像および視差画像にSEIのメッセージを適応するかどうかを表す全コンポーネントフラグ(all_view_components_in_au_flag)が記述される。また、全コンポーネントフラグが、アクセスユニット内の全ての画像および視差画像に適応しないことを表す場合、SEIのメッセージを適応する画像および視差画像のビューIDの数(num_view_components_minus1)とビューID(sei_view_id)が記述される。
一方、オペレーションポイントフラグが、オペレーションポイントを指定することを表す場合、SEIのメッセージを適応するオペレーションポイントのうちの適応対象の画像および視差画像のビューID(sei_op_view_id)と、そのオペレーションポイントの番号(sei_op_temporal_id)とが記述される。そして、SEIのメッセージ(sei_rbsp)が記述される。なお、3DV方式のSEIでは、複数のSEIのメッセージを記述することが可能である。また、SEIのメッセージとしては、上述した視差情報等が記述される。
なお、図85の例では、R画像とO画像のプロファイルが同一であるものとしたが、異なるようにすることもできる。
[ビットストリームのさらに他の構成例]
図92は、図85においてR画像とO画像のプロファイルが異なる場合のアクセスユニット単位のビットストリームの構成例を示す図である。
図92のビットストリームの構成は、画像用のMVC方式のSubset SPSと視差画像用の3DV方式のSubset SPSのほかに、画像用の3DV方式のSubset SPSが配置される点が、図85のビットストリームの構成と異なっている。
画像用のMVC方式のSubset SPSのNALユニット(Subset SPS1)は、MVC方式で定義されるプロファイルのうちのR画像のプロファイルを表すprofile_idc(図92の例では128)を含むSubset SPSのNALユニットである。画像用の3DV方式のSubset SPS(Subset SPS2)のNALユニットは、3DV方式で画像用のプロファイルとして定義されるプロファイルのうちのO画像のプロファイルを表すprofile_idc(図92の例では148)を含むSubset SPSのNALユニットである。視差画像用のSubset SPS(Subset SPS3)のNALユニットは、3DV方式で視差画像用のプロファイルとして定義されるプロファイルのうちの、L視差画像、R視差画像、およびO視差画像のプロファイルを表すprofile_idc(図92の例では138)を含むSubset SPSのNALユニットである。
[画像用の3DV方式のSubset SPSの記述例]
図93は、図92の画像用の3DV方式のSubset SPSの記述例を示す図である。
図93に示すように、画像用の3DV方式のSubset SPSは、画像Oのプロファイルを表すprofile_idc(図93の例では148)を含むSPS(seq_parameter_set_data)と、3DV方式で定義されているprofile_idcごとの情報とが記述されている。
具体的には、画像用の3DV方式のSubset SPSには、profile_idcが148であるときの情報として、MVC方式のSubset SPSと同様に、MVC方式の拡張情報(seq_parameter_set_mvc_extension)、MVC方式のVUI拡張情報が含まれるかどうかを表すMVC方式VUI情報フラグ(mvc_vui_parameters_present_flag)等が記述される。また、MVC方式VUI情報フラグが、MVC方式のVUI拡張情報が含まれることを表す場合には、MVC方式のVUI拡張情報(mvc_vui_parameters_extension)も記述される。また、profile_idcが138であるときの情報としては、図86と同様の情報が記述される。
なお、第5実施の形態では、3DV方式がAVC方式やMVC方式に準じた多視点方式での表示用の画像を符号化するための方式であるものとしたが、3DV方式は、HEVC(High Efficiency Video Coding)方式に準じた多視点方式での表示用の画像を符号化するための方式であるようにしてもよい。この場合のビットストリームについて以下に説明する。なお、本明細書では、HEVC方式が、HEVC Working Draft:Thomas Wiegand,Woo-jin Han,Benjamin Bross,Jens-Rainer Ohm,Gary J. Sullivian,“WD3:Working Draft3 of High-Efficiency Video Coding”,JCTVc-E603_d5(version5),2011年5月20日の記載に基づくものであるとする。
<3DV方式がHEVC方式に準じた方式である場合のビットストリーム>
[ビットストリームの構成例]
図94は、3DV方式がHEVC方式に準じた方式である場合のアクセスユニット単位のビットストリームの構成例を示す図である。
なお、図94の例では、図85の例と同様のL視点画像、R視点画像、およびO視点画像が符号化対象とされ、L画像がAVC方式で符号化され、L視差画像、R視点画像、およびO視点画像が3DV方式で符号化される。
図94のビットストリームは、画像用の3DV方式のSubset SPS(Subset SPS1)と視差画像用の3DV方式のSubset SPS(Subset SPS2)をSPS内に記述可能である点、HEVC方式のSEIと3DV方式のSEIのNALユニットに、それぞれ別のNALユニットのタイプを含むNALヘッダが付加される点が、図85のビットストリームと異なっている。
図94のビットストリームでは、画像用の3DV方式のSubset SPSと視差画像用の3DV方式のSubset SPSをSPS内にのみ記述させたり、SPSとは別に記述させたり、SPSに記述させるとともにSPSとは別に記述させたりすることができる。なお、画像用の3DV方式のSubset SPSと視差画像用の3DV方式のSubset SPSが、SPSと別に記述されることは、BD規格に準拠して、HEVC方式の符号化データと3DV方式の符号化データを別のES(Elementary Stream)として生成する場合に好適である。
また、図94のビットストリームでは、HEVC方式のSEIのNALユニットと3DV方式のSEIのNALユニットに付加されるNALヘッダに含まれるNALユニットのタイプが異なるため、復号時にHEVC方式のSEIや3DV方式のSEIのNALユニットを容易に抽出することができる。
[SPSの記述例]
図95は、図94のSPSの記述例を示す図である。
図95のSPSの記述は、Subset SPSの情報が含まれるかどうかを表すSubset SPS情報フラグ(subset_seq_present_flag)が記述される点、および、Subset SPS情報フラグがSubset SPSの情報が含まれることを表す場合にSubset SPSの情報が記述される点を除いて、HEVC方式のSPSの記述と同様である。
図95に示すように、Subset SPSの情報は、Subset SPSの数(num_subset_seq)と、Subset SPSを含むかどうかを表すSubset SPSフラグ(subset_seq_info_present_flag)を含む。また、Subset SPSフラグが、Subset SPSを含むことを表す場合、Subset SPSの情報には、Subset SPS(subset_seq_parameter_set_data)も含まれる。
以上のように、Subset SPSの情報としてSubset SPSの数が記述されるので、復号時にSPSの記述を読み出すだけで、Subset SPSが存在するかどうかを認識することができる。また、Subset SPSフラグが記述されるので、Subset SPSをSPS内に記述せずにSPSとは別に記述することができ、Subset SPSの記述の重複を防止することができる。
[Subset SPSの記述例]
図96は、図95のSubset SPSの記述例を示す図である。
図96のSubset SPSの記述は、Subset SPSを適応する画像および視差画像のビューIDの数(num_subset_seq_views)、Subset SPSの適応対象が視差画像であるかどうかを表す視差画像用フラグ(depth_extension_flag)、およびSubset SPSの適応時にSPSを無効にするかどうかを表す無効フラグ(seq_param_override_flag)が記述される点を除いて、HEVC方式のSPSの記述と同様である。
視差画像用フラグが、Subset SPSの適応対象が視差画像であることを表す場合、Subset SPSには、適応対象の視差画像に対応する画像のビューID(ref_view_id)が記述される。また、無効フラグが、Subset SPSの適応時にSPSを無効にすることを表す場合、Subset SPSには、SPSと同様に、プロファイルを表す情報(subset_seq_profile_idc)等が記述される。
また、Subset SPSの記述のうちのSPSの記述と同様の記述としては、例えば、適応する画像および視差画像がクロッピングされているかどうかを表す情報(subset_seq_frame_cropping_flag)、VUI情報(subset_seq_vui_parameters)を含むかどうかを表すVUI情報フラグ(subset_seq_vui_parameters_present_flag)等がある。VUI情報フラグがVUI情報を含むことを表す場合、SPSと同様にVUI情報も記述される。一方、VUI情報フラグがVUI情報を含まないことを表す場合、SPSと同様にVUI情報が記述されない。この場合、VUI情報としてはSPSのVUI情報が適応される。
[Subset SPSのVUI情報の記述例]
図97は、図96のSubset SPSのVUI情報の記述例を示す図である。
図97のSubset SPSのVUI情報の記述は、適応対象の変換前サイズ情報が含まれるかどうかを表す変換前サイズ情報フラグ(video_src_info_present_flag)が記述される点を除いて、HEVC方式のSPSのVUI情報の記述と同様である。
なお、変換前サイズ情報フラグが適応対象の変換前サイズ情報が含まれることを表す場合、図97のVUI情報には、変換前サイズ情報が記述される。即ち、解像度変換前の適応対象の横方向のマクロブロック数を表す情報(src_pic_width_in_mbs_minus1)および縦方向のマクロブロック数を表す情報(src_pic_height_in_mbs_minus1)、アスペクト比を表すアスペクト情報が含まれるかどうかを表すアスペクト比フラグ(src_aspect_ratio_info_present_flag)等が記述される。
そして、アスペクト比フラグが、アスペクト情報が含まれることを表す場合、変換前サイズ情報には、アスペクト比ID(src_aspect_ratio_idc)等からなるアスペクト情報も含まれる。そして、アスペクト情報に含まれるアスペクト比IDが、定義されていないアスペクト比全体に対して付与されたアスペクト比ID(Extended_SAR)である場合、アスペクト情報には、解像度変換前の適応対象のアスペクト比における横方向の値(sar_width)と縦方向の値(sar_height)も含まれる。
なお、図97のSubset SPSのVUI情報は、SPSのVUI情報と異なる点だけ記述されるようにしてもよい。この場合、Subset SPSのVUI情報のうちの記述されない情報については、SPSのVUI情報に含まれる情報が適用される。
[SEIの記述例]
図98は、図94の3DV方式のSEIの記述例を示す図である。
図98の3DV方式のSEIの記述は、SEIメッセージのタイプ(nesting_type)、全コンポーネントフラグ(all_view_components_in_au_flag)等が記述される点を除いて、SEIメッセージのタイプのSEIメッセージの記述と同様である。
SEIメッセージのタイプとしては、MVC方式のSEIメッセージ、3DV方式のSEIメッセージ、ユーザにより定義されたSEIメッセージなどがある。また、全コンポーネントフラグが、アクセスユニット内の全ての画像および視差画像に適応しないことを表す場合、3DV方式のSEIには、SEIのメッセージを適応する画像および視差画像のビューIDの数(num_view_components_minus1)と、その数だけのビューID(nesting_sei_view_id)も記述される。
なお、第5実施の形態以外の形態のビットストリーム(符号化ストリーム)も、図85乃至図98で説明したビットストリームと同様に生成されてもよい。
<第10実施の形態>
[本技術を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図99は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としての記憶部608やROM(Read Only Memory)602に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブルメディア611に格納(記録)しておくことができる。このようなリムーバブルメディア611は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア611としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブルメディア611からドライブ610を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部608にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)601を内蔵しており、CPU601には、バス604を介して、入出力インタフェース605が接続されている。
CPU601は、入出力インタフェース605を介して、ユーザによって、入力部606が操作等されることにより指令が入力されると、それに従って、ROM602に格納されているプログラムを実行する。あるいは、CPU601は、記憶部608に格納されたプログラムを、RAM(Random Access Memory)603にロードして実行する。
これにより、CPU601は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU601は、その処理結果を、必要に応じて、例えば、入出力インタフェース605を介して、出力部607から出力、あるいは、通信部609から送信、さらには、記憶部608に記録等させる。
なお、入力部606は、キーボードや、マウス、マイク等で構成される。また、出力部607は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
本技術は、衛星放送、ケーブルTV(テレビジョン)、インターネット、および携帯電話機などのネットワークメディアを介して受信する際に、あるいは、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる符号化装置および復号装置に適用することができる。
また、上述した符号化装置および復号装置は、任意の電子機器に適用することができる。以下にその例について説明する。
<第11実施の形態>
[テレビジョン装置の構成例]
図100は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース部909を有している。さらに、テレビジョン装置900は、制御部910、ユーザインタフェース部911等を有している。
チューナ902は、アンテナ901で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ903に出力する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ904に出力する。また、デマルチプレクサ903は、EPG(Electronic Program Guide)等のデータのパケットを制御部910に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。
デコーダ904は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部905、音声データを音声信号処理部907に出力する。
映像信号処理部905は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部905は、表示部906に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部905は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部905は、このようにして生成した映像データに基づいて駆動信号を生成して表示部906を駆動する。
表示部906は、映像信号処理部905からの駆動信号に基づき表示デバイス(例えば液晶表示素子等)を駆動して、番組の映像などを表示させる。
音声信号処理部907は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのD/A変換処理や増幅処理を行いスピーカ908に供給することで音声出力を行う。
外部インタフェース部909は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。
制御部910にはユーザインタフェース部911が接続されている。ユーザインタフェース部911は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部910に供給する。
制御部910は、CPU(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ、EPGデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置900の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、テレビジョン装置900がユーザ操作に応じた動作となるように各部を制御する。
なお、テレビジョン装置900では、チューナ902、デマルチプレクサ903、映像信号処理部905、音声信号処理部907、外部インタフェース部909等と制御部910を接続するためバス912が設けられている。
このように構成されたテレビジョン装置では、デマルチプレクサ903およびデコーダ904に本願の復号装置(復号方法)の機能が設けられる。このため、既存の方式との互換性を有する方式で多重化された多視点の画像を分離することができる。
<第12実施の形態>
[携帯電話機の構成例]
図101は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機920は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931を有している。これらは、バス933を介して互いに接続されている。
また、通信部922にはアンテナ921が接続されており、音声コーデック923には、スピーカ924とマイクロホン925が接続されている。さらに制御部931には、操作部932が接続されている。
携帯電話機920は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。
音声通話モードにおいて、マイクロホン925で生成された音声信号は、音声コーデック923で音声データへの変換やデータ圧縮が行われて通信部922に供給される。通信部922は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部922は、送信信号をアンテナ921に供給して図示しない基地局へ送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック923に供給する。音声コーデック923は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ924に出力する。
また、データ通信モードにおいて、メール送信を行う場合、制御部931は、操作部932の操作によって入力された文字データを受け付けて、入力された文字を表示部930に表示する。また、制御部931は、操作部932におけるユーザ指示等に基づいてメールデータを生成して通信部922に供給する。通信部922は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部930に供給して、メール内容の表示を行う。
なお、携帯電話機920は、受信したメールデータを、記録再生部929で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、RAMや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、またはメモリカード等のリムーバブルメディアである。
データ通信モードにおいて画像データを送信する場合、カメラ部926で生成された画像データを、画像処理部927に供給する。画像処理部927は、画像データの符号化処理を行い、符号化データを生成する。
多重分離部928は、画像処理部927で生成された符号化データと、音声コーデック923から供給された音声データを所定の方式で多重化して通信部922に供給する。通信部922は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ921から送信する。また、通信部922は、アンテナ921で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部928に供給する。多重分離部928は、多重化データの分離を行い、符号化データを画像処理部927、音声データを音声コーデック923に供給する。画像処理部927は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部930に供給して、受信した画像の表示を行う。音声コーデック923は、音声データをアナログ音声信号に変換してスピーカ924に供給して、受信した音声を出力する。
このように構成された携帯電話装置では、画像処理部927および多重分離部928に本願の復号装置(復号方法)の機能が設けられる。このため、画像データの通信において、既存の方式との互換性を有する方式で多重化された多視点の画像を分離することができる。
<第13実施の形態>
[記録再生装置の構成例]
図102は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置940は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置940は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置940は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。
記録再生装置940は、チューナ941、外部インタフェース部942、エンコーダ943、HDD(Hard Disk Drive)部944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)部948、制御部949、ユーザインタフェース部950を有している。
チューナ941は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ941は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ946に出力する。
外部インタフェース部942は、IEEE1394インタフェース、ネットワークインタフェース部、USBインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部942は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。
エンコーダ943は、外部インタフェース部942から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームを多重化してセレクタ946に出力する。
HDD部944は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。
ディスクドライブ945は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)やBlu−rayディスク等である。
セレクタ946は、映像や音声の記録時には、チューナ941またはエンコーダ943からのいずれかの符号化ビットストリームを選択して、HDD部944やディスクドライブ945のいずれかに供給する。また、セレクタ946は、映像や音声の再生時に、HDD部944またはディスクドライブ945から出力された符号化ビットストリームをデコーダ947に供給する。
デコーダ947は、符号化ビットストリームの復号化処理を行う。デコーダ947は、復号処理化を行うことにより生成された映像データをOSD部948に供給する。また、デコーダ947は、復号処理化を行うことにより生成された音声データを出力する。
OSD部948は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ947から出力された映像データに重畳して出力する。
制御部949には、ユーザインタフェース部950が接続されている。ユーザインタフェース部950は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部949に供給する。
制御部949は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置940の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、記録再生装置940がユーザ操作に応じた動作となるように各部を制御する。
このように構成された記録再生装置では、エンコーダ943に本願の符号化装置(符号化方法)の機能が設けられる。このため、多視点の画像に対して、既存の方式との互換性を有する方式で多重化を行うことができる。
<第14実施の形態>
[撮像装置の構成例]
図103は、本技術を適用した撮像装置の概略構成を例示している。撮像装置960は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、カメラ信号処理部963、画像データ処理部964、表示部965、外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970を有している。また、制御部970には、ユーザインタフェース部971が接続されている。さらに、画像データ処理部964や外部インタフェース部966、メモリ部967、メディアドライブ968、OSD部969、制御部970等は、バス972を介して接続されている。
光学ブロック961は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCDまたはCMOSイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部963に供給する。
カメラ信号処理部963は、撮像部962から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部963は、カメラ信号処理後の画像データを画像データ処理部964に供給する。
画像データ処理部964は、カメラ信号処理部963から供給された画像データの符号化処理および多重化処理を行う。画像データ処理部964は、符号化処理および多重化処理を行うことにより生成された符号化データを外部インタフェース部966やメディアドライブ968に供給する。また、画像データ処理部964は、外部インタフェース部966やメディアドライブ968から供給された符号化データの分離処理および復号化処理を行う。画像データ処理部964は、分離処理および復号化処理を行うことにより生成された画像データを表示部965に供給する。また、画像データ処理部964は、カメラ信号処理部963から供給された画像データを表示部965に供給する処理や、OSD部969から取得した表示用データを、画像データに重畳させて表示部965に供給する。
OSD部969は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部964に出力する。
外部インタフェース部966は、例えば、USB入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部966には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部966は、LANやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部970は、例えば、ユーザインタフェース部971からの指示にしたがって、メモリ部967から符号化データを読み出し、それを外部インタフェース部966から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部970は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部966を介して取得し、それを画像データ処理部964に供給したりすることができる。
メディアドライブ968で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ICカード等であってもよい。
また、メディアドライブ968と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやSSD(Solid State Drive)等のように、非可搬性の記憶媒体により構成されるようにしてもよい。
制御部970は、CPUやメモリ等を用いて構成されている。メモリは、CPUにより実行されるプログラムやCPUが処理を行う上で必要な各種のデータ等を記憶する。メモリに記憶されているプログラムは、撮像装置960の起動時などの所定タイミングでCPUにより読み出されて実行される。CPUは、プログラムを実行することで、撮像装置960がユーザ操作に応じた動作となるように各部を制御する。
このように構成された撮像装置では、画像データ処理部964に本願の復号装置(復号方法)の機能が設けられる。このため、メモリ部967や記録メディア等に記録された符号化データを復号化して復号画像データを生成するとき、既存の方式との互換性を有する方式で多重化された多視点の画像を分離することができる。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。