WO2013031573A1

WO2013031573A1 - 符号化装置および符号化方法、復号装置および復号方法

Info

Publication number: WO2013031573A1
Application number: PCT/JP2012/071028
Authority: WO
Inventors: 良知高橋
Original assignee: ソニー株式会社
Priority date: 2011-08-31
Filing date: 2012-08-21
Publication date: 2013-03-07
Also published as: MX358407B; CN103748883B; RU2597256C2; EP2753080A4; EP2753080A1; MX338738B; ZA201400565B; AU2012303085A1; US20140198847A1; CA2842150A1; RU2014106532A; MX2014002066A; CN103748883A; RU2016120771A; KR20140057269A; BR112014004062A2; US9900595B2

Abstract

　本技術は、視差画像に関する情報を用いて視差画像の符号化効率を改善することができるようにする符号化装置および符号化方法、復号装置および復号方法に関する。補正部は、基準視点の視差画像に関する情報を用いて基準視点の視差画像の予測画像を補正する。演算部は、補正された予測画像を用いて基準視点の視差画像を符号化する。符号化された基準視点の視差画像と基準視点の視差画像に関する情報とは伝送される。本技術は、例えば、視差画像の符号化装置に適用することができる。

Description

符号化装置および符号化方法、復号装置および復号方法

　本技術は、符号化装置および符号化方法、復号装置および復号方法に関し、特に、視差画像に関する情報を用いて視差画像の符号化効率を改善することができるようにした符号化装置および符号化方法、復号装置および復号方法に関する。

　近年、３Ｄ画像が注目されており、多視点の３Ｄ画像の生成に用いられる視差画像の符号化方法が提案されている（例えば、非特許文献１参照）。なお、視差画像とは、その視差画像に対応する視点のカラー画像の各画素と、その画素に対応する、基点となる視点のカラー画像の画素の画面上の位置の水平方向の距離を表す視差値からなる画像である。

　また、現在、AVC（Advanced Video Coding）方式より更なる符号化効率の向上を目的として、HEVC（High Efficiency Video Coding）と呼ばれる符号化方式の標準化が進められており、2011年8月現在、Draftとして、非特許文献２が発行されている。

"Call for Proposals on 3D Video Coding Technology",ISO/IEC JTC1/SC29/WG11,MPEG2011/N12036,Geneva,Switzerland,March 2011 Thomas Wiegand,Woo-jin Han,Benjamin Bross,Jens-Rainer Ohm,GaryJ.Sullivian,"WD3:Working Draft3 of High-Efficiency Video Coding",JCTVC-E603_d5(version5),2011年5月20日

　しかしながら、視差画像に関する情報を用いて視差画像の符号化効率を向上させる符号化方法は考案されていなかった。

　本技術は、このような状況に鑑みてなされたものであり、視差画像に関する情報を用いて視差画像の符号化効率を改善することができるようにするものである。

　本技術の第１の側面の符号化装置は、基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正部と、前記補正部により補正された前記予測画像を用いて、前記基準視点の視差画像を符号化する符号化部と、前記符号化部により符号化された前記基準視点の視差画像と前記基準視点の視差画像に関する情報とを伝送する伝送部とを備える符号化装置である。

　本技術の第１の側面の符号化方法は、本技術の第１の側面の符号化装置に対応する。

　本技術の第１の側面においては、基準視点の視差画像に関する情報を用いて、基準視点の視差画像の予測画像が補正され、補正された前記予測画像を用いて、前記基準視点の視差画像が符号化され、符号化された前記基準視点の視差画像と前記基準視点の視差画像に関する情報とが伝送される。

　本技術の第２の側面の復号装置は、基準視点の視差画像に関する情報を用いて補正された前記基準視点の視差画像の予測画像を用いて符号化された前記基準視点の視差画像と、前記基準視点の視差画像に関する情報とを受け取る受け取り部と、前記受け取り部により受け取られた前記基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正部と、前記補正部により補正された前記予測画像を用いて、前記受け取り部により受け取られた、符号化された前記基準視点の視差画像を復号する復号部とを備える復号装置である。

　本技術の第２の側面の復号方法は、本技術の第２の側面の復号装置に対応する。

　本技術の第２の側面においては、基準視点の視差画像に関する情報を用いて補正された前記基準視点の視差画像の予測画像を用いて符号化された前記基準視点の視差画像と、前記基準視点の視差画像に関する情報とが受け取られ、受け取られた前記基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像が補正され、補正された前記予測画像を用いて、符号化された前記基準視点の視差画像が復号される。

　なお、第１の側面の符号化装置および第２の側面の復号装置は、コンピュータにプログラムを実行させることにより実現することができる。

　また、第１の側面の符号化装置および第２の側面の復号装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

　本技術の第１の側面によれば、視差画像に関する情報を用いて視差画像の符号化効率を改善することができる。

　また、本技術の第２の側面によれば、視差画像に関する情報を用いて符号化することにより符号化効率が改善された視差画像の符号化データを復号することができる。

本技術を適用した符号化装置の第１実施の形態の構成例を示すブロック図である。視点生成用情報の視差最大値と視差最小値を説明する図である。視点生成用情報の視差精度パラメータを説明する図である。視点生成用情報のカメラ間距離を説明する図である。図１の多視点画像符号化部の構成例を示すブロック図である。符号化部の構成例を示すブロック図である。符号化ビットストリームの構成例を示す図である。図７のPPSのシンタックスの例を示す図である。スライスヘッダのシンタックスの例を示す図である。スライスヘッダのシンタックスの例を示す図である。図１の符号化装置の符号化処理を説明するフローチャートである。図１１の多視点符号化処理の詳細を説明するフローチャートである。図１２の視差画像符号化処理の詳細を説明するフローチャートである。図１２の視差画像符号化処理の詳細を説明するフローチャートである。本技術を適用した復号装置の第１実施の形態の構成例を示すブロック図である。図１５の多視点画像復号部の構成例を示すブロック図である。復号部の構成例を示すブロック図である。図１５の復号装置１５０の復号処理を説明するフローチャートである。図１８の多視点復号処理の詳細を説明するフローチャートである。図１６の視差画像復号処理の詳細を説明するフローチャートである。予測画像の補正に用いられる情報の伝送方法を説明する図である。第２の伝送方法における符号化ビットストリームの構成例を示す図である。第３の伝送方法における符号化ビットストリームの構成例を示す図である。コンピュータの一実施の形態の構成例を示す図である。本技術を適用したテレビジョン装置の概略構成例を示す図である。本技術を適用した携帯電話機の概略構成例を示す図である。本技術を適用した記録再生装置の概略構成例を示す図である。本技術を適用した撮像装置の概略構成例を示す図である。

　＜第１実施の形態＞
　［符号化装置の第１実施の形態の構成例］
　図１は、本技術を適用した符号化装置の第１実施の形態の構成例を示すブロック図である。

　図１の符号化装置５０は、多視点カラー画像撮像部５１、多視点カラー画像補正部５２、多視点視差画像補正部５３、視点生成用情報生成部５４、および多視点画像符号化部５５により構成される。

　符号化装置５０は、所定の視点の視差画像を、視差画像に関する情報を用いて符号化する。

　具体的には、符号化装置５０の多視点カラー画像撮像部５１は、多視点のカラー画像を撮像し、多視点カラー画像として多視点カラー画像補正部５２に供給する。また、多視点カラー画像撮像部５１は、外部パラメータ、視差最大値、および視差最小値（詳細は後述する）を生成する。多視点カラー画像撮像部５１は、外部パラメータ、視差最大値、および視差最小値を視点生成用情報生成部５４に供給するとともに、視差最大値と視差最小値を多視点視差画像生成部５３に供給する。

　なお、外部パラメータは、多視点カラー画像撮像部５１の水平方向の位置を定義するパラメータである。また、視差最大値と視差最小値は、それぞれ、多視点視差画像においてとり得る世界座標上の視差値の最大値、最小値である。

　多視点カラー画像補正部５２は、多視点カラー画像撮像部５１から供給される多視点カラー画像に対して、色補正、輝度補正、歪み補正等を行う。これにより、補正後の多視点カラー画像における多視点カラー画像撮像部５１の水平方向（X方向）の焦点距離は、全視点で共通となる。多視点カラー画像補正部５２は、補正後の多視点カラー画像を多視点補正カラー画像として多視点視差画像生成部５３と多視点画像符号化部５５に供給する。

　多視点視差画像生成部５３は、多視点カラー画像撮像部５１から供給される視差最大値と視差最小値に基づいて、多視点カラー画像補正部５２から供給される多視点補正カラー画像から、多視点の視差画像を生成する。具体的には、多視点視差画像生成部５３は、多視点の各視点（基準視点）について、多視点補正カラー画像から各画素の視差値を求め、その視差値を視差最大値と視差最小値に基づいて正規化する。そして、多視点視差画像生成部５３は、多視点の各視点について、正規化された各画素の視差値を視差画像の各画素の画素値とする視差画像を生成する。

　また、多視点視差画像生成部５３は、生成された多視点の視差画像を多視点視差画像として多視点画像符号化部５５に供給する。さらに、多視点視差画像生成部５３は、多視点視差画像の画素値の精度を表す視差精度パラメータを生成し、視点生成用情報生成部５４に供給する。

　視点生成用情報生成部５４は、多視点の補正カラー画像と視差画像を用いて、その多視点以外の視点のカラー画像を生成する際に用いられる視点生成用情報（視点生成情報）を生成する。具体的には、視点生成用情報生成部５４は、多視点カラー画像撮像部５１から供給される外部パラメータに基づいて、カメラ間距離を求める。カメラ間距離とは、多視点視差画像の視点ごとに、その視点のカラー画像を撮像するときの多視点カラー画像撮像部５１の水平方向の位置と、そのカラー画像と視差画像に対応する視差を有するカラー画像を撮像するときの多視点カラー画像撮像部５１の水平方向の位置の距離である。

　視点生成用情報生成部５４は、多視点カラー画像撮像部５１からの視差最大値と視差最小値、カメラ間距離、および多視点視差画像生成部５３からの視差精度パラメータを視点生成用情報とする。視点生成用情報生成部５４は、生成された視点生成用情報を多視点画像符号化部５５に供給する。

　多視点画像符号化部５５は、多視点カラー画像補正部５２から供給される多視点補正カラー画像をHEVC方式で符号化する。また、多視点画像符号化部５５は、視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離を視差に関する情報として用いて、多視点視差画像生成部５３から供給される多視点視差画像を、HEVC方式に準じた方式で符号化する。

　また、多視点画像符号化部５５は、視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離を差分符号化し、多視点視差画像を符号化する際に用いる符号化に関する情報（符号化パラメータ）に含める。そして、多視点画像符号化部５５は、符号化された多視点補正カラー画像および多視点視差画像、差分符号化された視差最大値、視差最小値、およびカメラ間距離を含む符号化に関する情報、視点生成用情報生成部５４からの視差精度パラメータ等からなるビットストリームを、符号化ビットストリームとして伝送する。

　以上のように、多視点画像符号化部５５は、視差最大値、視差最小値、およびカメラ間距離を差分符号化して伝送するので、視点生成用情報の符号量を削減することができる。快適な３Ｄ画像を提供するために、視差最大値、視差最小値、およびカメラ間距離はピクチャ間で大きく変化させない可能性が高いため、差分符号化を行うことは符号量の削減において有効である。

　なお、符号化装置５０では、多視点視差画像が、多視点補正カラー画像から生成されたが、多視点カラー画像の撮像時に、視差値を検出するセンサにより生成されてもよい。

　［視点生成用情報の説明］
　図２は、視点生成用情報の視差最大値と視差最小値を説明する図である。

　なお、図２において、横軸は、正規化前の視差値であり、縦軸は、視差画像の画素値である。

　図２に示すように、多視点視差画像生成部５３は、各画素の視差値を、視差最小値Dminと視差最大値Dmaxを用いて、例えば0乃至255の値に正規化する。そして、多視点視差画像生成部５３は、0乃至255のいずれかの値である正規化後の各画素の視差値を画素値として、視差画像を生成する。

　即ち、視差画像の各画素の画素値Ｉは、その画素の正規化前の視差値d、視差最小値Dmin、および視差最大値Dmaxは、以下の式（１）で表される。

　従って、後述する復号装置では、以下の式（２）により、視差画像の各画素の画素値Ｉから、視差最小値Dminと視差最大値Dmaxを用いて、正規化前の視差値dを復元する必要がある。

　よって、視差最小値Dminと視差最大値Dmaxが、復号装置に伝送される。

　図３は、視点生成用情報の視差精度パラメータを説明する図である。

　図３の上段に示すように、正規化後の視差値1当たりの正規化前の視差値が0.5である場合、視差精度パラメータは、視差値の精度0.5を表すものとなる。また、図３の下段に示すように、正規化後の視差値1当たりの正規化前の視差値が1である場合、視差精度パラメータは、視差値の精度1.0を表すものとなる。

　図３の例では、1番目の視点である視点＃１の正規化前の視差値が1.0であり、2番目の視点である視点＃２の正規化前の視差値が0.5である。従って、視点＃１の正規化後の視差値は、視差値の精度が0.5であっても1.0であっても、1.0である。一方、視点＃２の視差値は、視差値の精度が0.5である場合0.5であり、視差値の精度が1.0である場合0である。

　図４は、視点生成用情報のカメラ間距離を説明する図である。

　図４に示すように、視点＃１の、視点＃２を基点とする視差画像のカメラ間距離は、視点＃１の外部パラメータが表す位置と、視点＃２の外部パラメータが表す位置の距離である。

　［多視点画像符号化部の構成例］
　図５は、図１の多視点画像符号化部５５の構成例を示すブロック図である。

　図５の多視点画像符号化部５５は、スライス符号化部６１、スライスヘッダ符号化部６２、PPS符号化部６３、およびSPS符号化部６４により構成される。

　多視点画像符号化部５５のスライス符号化部６１は、多視点カラー画像補正部５２から供給される多視点補正カラー画像に対して、HEVC方式でスライス単位の符号化を行う。また、スライス符号化部６１は、図１の視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離を視差に関する情報として用いて、多視点視差画像生成部５３からの多視点視差画像に対して、HEVC方式に準じた方式でスライス単位の符号化を行う。スライス符号化部６１は、符号化の結果得られるスライス単位の符号化データ等をスライスヘッダ符号化部６２に供給する。

　スライスヘッダ符号化部６２は、視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離を、現在の処理対象のスライスの視差最大値、視差最小値、およびカメラ間距離とし、保持する。

　また、スライスヘッダ符号化部６２は、現在の処理対象のスライスの視差最大値、視差最小値、およびカメラ間距離が、それぞれ、そのスライスより符号化順で１つ前のスライスの視差最大値、視差最小値、およびカメラ間距離と一致するかどうかを、同一のPPSが付加される単位（以下では、同一PPS単位という）で判定する。

　そして、同一PPS単位を構成する全てのスライスの視差最大値、視差最小値、およびカメラ間距離が、符号化順で１つ前のスライスの視差最大値、視差最小値、およびカメラ間距離と一致すると判定された場合、スライスヘッダ符号化部６２は、その同一PPS単位を構成する各スライスの符号化データのスライスヘッダとして、そのスライスの視差最大値、視差最小値、およびカメラ間距離以外の符号化に関する情報を付加し、PPS符号化部６３に供給する。また、スライスヘッダ符号化部６２は、視差最大値、視差最小値、およびカメラ間距離の差分符号化結果の伝送の無しを表す伝送フラグをPPS符号化部６３に供給する。

　一方、同一PPS単位を構成する少なくとも1つのスライスの視差最大値、視差最小値、およびカメラ間距離が、符号化順で１つ前のスライスの視差最大値、視差最小値、およびカメラ間距離と一致しないと判定された場合、スライスヘッダ符号化部６２は、イントラタイプのスライスの符号化データには、スライスヘッダとして、そのスライスの視差最大値、視差最小値、およびカメラ間距離を含む符号化に関する情報を付加し、PPS符号化部６３に供給する。

　また、スライスヘッダ符号化部６２は、インタータイプのスライスについては、そのスライスの視差最大値、視差最小値、およびカメラ間距離を差分符号化する。具体的には、スライスヘッダ符号化部６２は、インタータイプのスライスの視差最大値、視差最小値、およびカメラ間距離から、そのスライスより符号化順で1つ前のスライスの視差最大値、視差最小値、およびカメラ間距離を、それぞれ減算し、差分符号化結果とする。そして、スライスヘッダ符号化部６２は、インタータイプのスライスの符号化データに、スライスヘッダとして視差最大値、視差最小値、およびカメラ間距離の差分符号化結果を含む符号化に関する情報を付加し、PPS符号化部６３に供給する。

　また、この場合、スライスヘッダ符号化部６２は、視差最大値、視差最小値、およびカメラ間距離の差分符号化結果の伝送の有りを表す伝送フラグをPPS符号化部６３に供給する。

　PPS符号化部６３は、スライスヘッダ符号化部６２から供給される伝送フラグと、図１の視点生成用情報生成部５４から供給される視点生成用情報のうちの視差精度パラメータとを含むPPSを生成する。PPS符号化部６３は、同一PPS単位で、スライスヘッダ符号化部６２から供給されるスライスヘッダが付加されたスライス単位の符号化データにPPSを付加し、SPS符号化部６４に供給する。

　SPS符号化部６４は、SPSを生成する。そして、SPS符号化部６４は、シーケンス単位で、PPS符号化部６３から供給されるPPSが付加された符号化データにSPSを付加する。SPS符号化部６４は、伝送部として機能し、その結果得られるビットストリームを符号化ビットストリームとして伝送する。

　［スライス符号化部の構成例］
　図６は、図５のスライス符号化部６１のうちの任意の１視点の視差画像を符号化する符号化部の構成例を示すブロック図である。即ち、スライス符号化部６１のうちの多視点視差画像を符号化する符号化部は、視点数分の図６の符号化部１２０により構成される。

　図６の符号化部１２０は、A/D変換部１２１、画面並べ替えバッファ１２２、演算部１２３、直交変換部１２４、量子化部１２５、可逆符号化部１２６、蓄積バッファ１２７、逆量子化部１２８、逆直交変換部１２９、加算部１３０、デブロックフィルタ１３１、フレームメモリ１３２、画面内予測部１３３、動き予測・補償部１３４、補正部１３５、選択部１３６、およびレート制御部１３７により構成される。

　符号化部１２０のA/D変換部１２１は、図１の多視点視差画像生成部５３から供給される所定の視点のフレーム単位の多重化画像をA/D変換し、画面並べ替えバッファ１２２に出力して記憶させる。画面並べ替えバッファ１２２は、記憶した表示の順番のフレーム単位の視差画像を、GOP（Group of Picture）構造に応じて、符号化のための順番に並べ替え、演算部１２３、画面内予測部１３３、および動き予測・補償部１３４に出力する。

　演算部１２３は、符号化部として機能し、選択部１３６から供給される予測画像と、画面並べ替えバッファ１２２から出力された符号化対象の視差画像の差分を演算することにより、符号化対象の視差画像を符号化する。具体的には、演算部１２３は、画面並べ替えバッファ１２２から出力された符号化対象の視差画像から、選択部１３６から供給される予測画像を減算する。演算部１２３は、減算の結果得られる画像を、残差情報として直交変換部１２４に出力する。なお、選択部１３６から予測画像が供給されない場合、演算部１２３は、画面並べ替えバッファ１２２から読み出された視差画像をそのまま残差情報として直交変換部１２４に出力する。

　直交変換部１２４は、演算部１２３からの残差情報に対して離散コサイン変換、カルーネン・レーベ変換等の直交変換を施し、その結果得られる係数を量子化部１２５に供給する。

　量子化部１２５は、直交変換部１２４から供給される係数を量子化する。量子化された係数は、可逆符号化部１２６に入力される。

　可逆符号化部１２６は、量子化部１２５から供給される量子化された係数に対して、可変長符号化（例えば、CAVLC（Context-Adaptive Variable Length Coding）など）、算術符号化（例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）など）などの可逆符号化を行う。可逆符号化部１２６は、可逆符号化の結果得られる符号化データを蓄積バッファ１２７に供給し、蓄積させる。

　蓄積バッファ１２７は、可逆符号化部１２６から供給される符号化データを、一時的に記憶し、スライス単位でスライスヘッダ符号化部６２に供給する。

　また、量子化部１２５より出力された、量子化された係数は、逆量子化部１２８にも入力され、逆量子化された後、逆直交変換部１２９に供給される。

　逆直交変換部１２９は、逆量子化部１２８から供給される係数に対して、逆離散コサイン変換、逆カルーネン・レーベ変換等の逆直交変換を施し、その結果得られる残差情報を加算部１３０に供給する。

　加算部１３０は、逆直交変換部１２９から供給される復号対象の視差画像としての残差情報と、選択部１３６から供給される予測画像を加算して、局部的に復号された視差画像を得る。なお、選択部１３６から予測画像が供給されない場合、加算部１３０は、逆直交変換部１２９から供給される残差情報を局部的に復号された視差画像とする。加算部１３０は、局部的に復号された視差画像をデブロックフィルタ１３１に供給するとともに、参照画像として画面内予測部１３３に供給する。

　デブロックフィルタ１３１は、加算部１３０から供給される局部的に復号された視差画像をフィルタリングすることにより、ブロック歪を除去する。デブロックフィルタ１３１は、その結果得られる視差画像をフレームメモリ１３２に供給し、蓄積させる。フレームメモリ１３２に蓄積された視差画像は、参照画像として動き予測・補償部１３４に出力される。

　画面内予測部１３３は、加算部１３０から供給された参照画像を用いて、候補となる全てのイントラ予測モードの画面内予測を行い、予測画像を生成する。

　また、画面内予測部１３３は、候補となる全てのイントラ予測モードに対してコスト関数値（詳細は後述する）を算出する。そして、画面内予測部１３３は、コスト関数値が最小となるイントラ予測モードを最適イントラ予測モードに決定する。画面内予測部１３３は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、選択部１３６に供給する。画面内予測部１３３は、選択部１３６から最適イントラ予測モードで生成された予測画像の選択が通知された場合、最適イントラ予測モード等を示す画面内予測情報を図５のスライスヘッダ符号化部６２に供給する。この画面内予測情報は、符号化に関する情報としてスライスヘッダに含まれる。

　なお、コスト関数値は、RD(Rate Distortion)コストともいい、例えば、H．264/AVC方式における参照ソフトウェアであるJM(Joint Model)で定められているような、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて算出される。

　具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全ての予測モードに対して、仮に可逆符号化までが行われ、次の式（３）で表わされるコスト関数値が各予測モードに対して算出される。

　Cost(Mode)=D＋λ・R　　　　　　　　　　　　　　　　・・・（３）

　Dは、原画像と復号画像の差分（歪）、Rは、直交変換の係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。

　一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全ての予測モードに対して、復号画像の生成、および、予測モードを示す情報などのヘッダビットの算出が行われ、次の式（４）で表わされるコスト関数が各予測モードに対して算出される。

　Cost(Mode)=D＋QPtoQuant(QP)・Header_Bit　　　　　　・・・（４）

　Dは、原画像と復号画像の差分（歪）、Header_Bitは、予測モードに対するヘッダビット、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。

　Low Complexity モードにおいては、全ての予測モードに対して、復号画像を生成するだけでよく、可逆符号化を行う必要がないため、演算量が少なくて済む。なお、ここでは、コスト関数値の算出手法としてHigh Complexity モードが採用されるものとする。

　動き予測・補償部１３４は、画面並べ替えバッファ１２２から供給される視差画像と、フレームメモリ１３２から供給される参照画像とに基づいて、候補となる全てのインター予測モードの動き予測処理を行い、動きベクトルを生成する。具体的には、動き予測・補償部１３４は、インター予測モードごとに、参照画像と、画面並べ替えバッファ１２２から供給される視差画像のマッチングを行い、動きベクトルを生成する。

　なお、インター予測モードとは、インター予測の対象とするブロックのサイズ、予測方向、および参照インデックスを表す情報である。予測方向には、インター予測の対象とする視差画像よりも表示時刻が早い参照画像を用いた前方向の予測（L0予測）、インター予測の対象とする視差画像よりも表示時刻が遅い参照画像を用いた後方向の予測（L1予測）、およびインター予測の対象とする視差画像よりも表示時刻が早い参照画像と遅い参照画像を用いた両方向の予測（Bi-prediction）がある。また、参照インデックスとは、参照画像を特定するための番号であり、例えば、インター予測の対象とする視差画像に近い画像の参照インデックスほど番号が小さい。

　また、動き予測・補償部１３４は、予測画像生成部として機能し、インター予測モードごとに、生成された動きベクトルに基づいて、フレームメモリ１３２から参照画像を読み出すことにより、動き補償処理を行う。動き予測・補償部１３４は、その結果生成される予測画像を補正部１３５に供給する。

　補正部１３５は、図１の視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離を視差画像に関する情報として用いて、予測画像を補正する際に用いる補正係数を生成（設定）する。補正部１３５は、動き予測・補償部１３４から供給される各インター予測モードの予測画像を、補正係数を用いて補正する。

　ここで、符号化対象の視差画像の被写体の奥行方向の位置Z_cと予測画像の被写体の奥行方向の位置Z_pは、以下の式（５）で表される。

　なお、式（５）において、L_c,L_pは、それぞれ、符号化対象の視差画像のカメラ間距離、予測画像のカメラ間距離である。fは、符号化対象の視差画像と予測画像に共通の焦点距離である。また、d_c,d_pは、それぞれ、符号化対象の視差画像の正規化前の視差値の絶対値、予測画像の正規化前の視差値の絶対値である。

　また、符号化対象の視差画像の視差値I_cと予測画像の視差値I_pは、正規化前の視差値の絶対値d_c,d_pを用いて、以下の式（６）で表される。

　なお、式（６）において、D^c _min,D^p _minは、それぞれ、符号化対象の視差画像の視差最小値、予測画像の視差最小値である。D^c _max,D^p _maxは、それぞれ、符号化対象の視差画像の視差最大値、予測画像の視差最大値である。

　従って、符号化対象の視差画像の被写体の奥行方向の位置Z_cと予測画像の被写体の奥行方向の位置Z_pが同一であっても、カメラ間距離L_cとL_p、視差最小値D^c _minとD^p _min、および視差最大値D^c _max,D^p _maxの少なくとも1つが異なると、視差値I_cと視差値I_pは異なってしまう。

　そこで、補正部１３５は、位置Z_cと位置Z_pが同一である場合に視差値I_cと視差値I_pが同一となるように予測画像を補正する補正係数を生成する。

　具体的には、位置Z_cと位置Z_pが同一である場合、上述した式（５）より、以下の式（７）が成立する。

　また、式（７）を変形すると、以下の式（８）になる。

　そして、上述した式（６）を用いて、式（８）の正規化前の視差値の絶対値d_c,d_pを視差値I_cと視差値I_pに置換すると、以下の式（９）になる。

　これにより、視差値I_cは、視差値I_pを用いて以下の式（１０）で表される。

　従って、補正部１３５は、式（１０）のａとbを補正係数として生成する。そして、補正部１３５は、補正係数ａ，ｂと視差値I_pを用いて、式（１０）における視差値I_cを補正後の予測画像の視差値として求める。

　また、補正部１３５は、補正後の予測画像を用いて、各インター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、補正部１３５は、最適インター予測モードで生成された予測画像とコスト関数値とを選択部１３６に供給する。

　さらに、補正部１３５は、選択部１３６から最適インター予測モードで生成された予測画像の選択が通知された場合、動き情報をスライスヘッダ符号化部６２に出力する。この動き情報は、最適インター予測モード、予測ベクトルインデックス、現在の動きベクトルから予測ベクトルインデックスが表す動きベクトルを減算した差分である動きベクトル残差等により構成される。なお、予測ベクトルインデックスとは、復号済みの視差画像の予測画像の生成に用いられた候補となる動きベクトルのうちの1つの動きベクトルを特定する情報である。動き情報は、符号化に関する情報としてスライスヘッダに含まれる。

　選択部１３６は、画面内予測部１３３および補正部１３５から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのいずれかを、最適予測モードに決定する。そして、選択部１３６は、最適予測モードの予測画像を、演算部１２３および加算部１３０に供給する。また、選択部１３６は、最適予測モードの予測画像の選択を画面内予測部１３３または補正部１３５に通知する。

　レート制御部１３７は、蓄積バッファ１２７に蓄積された符号化データに基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１２５の量子化動作のレートを制御する。

　［符号化ビットストリームの構成例］
　図７は、符号化ビットストリームの構成例を示す図である。

　なお、図７では、説明の便宜上、多視点視差画像のスライスの符号化データのみを記載しているが、実際には、符号化ビットストリームには、多視点カラー画像のスライスの符号化データも配置される。このことは、後述する図２２および図２３においても同様である。

　図７の例では、0番目のPPSであるPPS#0の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの視差最大値、視差最小値、およびカメラ間距離が、それぞれ、符号化順で1つ前のスライスの視差最大値、視差最小値、およびカメラ間距離と一致しない。従って、PPS#0には、伝送の有りを表す伝送フラグ「1」が含まれる。また、図７の例では、PPS#0の同一PPS単位を構成するスライスの視差精度が0.5であり、PPS#0には、視差精度パラメータとして視差精度0.5を表す「1」が含まれる。

　さらに、図７の例では、PPS#0の同一PPS単位を構成するイントラタイプのスライスの視差最小値が10であり、視差最大値が50であり、カメラ間距離が100である。従って、そのスライスのスライスヘッダには、視差最小値「10」、視差最大値「50」、およびカメラ間距離「100」が含まれる。

　また、図７の例では、PPS#0の同一PPS単位を構成する1番目のインタータイプのスライスの視差最小値が9であり、視差最大値が48であり、カメラ間距離が105である。従って、そのスライスのスライスヘッダには、そのスライスの視差最小値「9」から、符号化順で1つ前のイントラタイプのスライスの視差最小値「10」を減算した差分「-1」が、視差最小値の差分符号化結果として含まれる。同様に、視差最大値の差分「-2」が視差最大値の差分符号化結果として含まれ、カメラ間距離の差分「5」がカメラ間距離の差分符号化結果として含まれる。

　さらに、図７の例では、PPS#0の同一PPS単位を構成する2番目のインタータイプのスライスの視差最小値が7であり、視差最大値が47であり、カメラ間距離が110である。従って、そのスライスのスライスヘッダには、そのスライスの視差最小値「7」から、符号化順で1つ前の1番目のインタータイプのスライスの視差最小値「9」を減算した差分「-2」が、視差最小値の差分符号化結果として含まれる。同様に、視差最大値の差分「-1」が視差最大値の差分符号化結果として含まれ、カメラ間距離の差分「5」がカメラ間距離の差分符号化結果として含まれる。

　また、図７の例では、1番目のPPSであるPPS#1の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの視差最大値、視差最小値、およびカメラ間距離が、それぞれ、符号化順で1つ前のスライスの視差最大値、視差最小値、およびカメラ間距離と一致する。即ち、PPS#1の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの視差最小値、視差最大値、カメラ間距離は、それぞれ、PPS#0の同一PPS単位を構成する2番目のインタータイプのスライスと同一の「7」、「47」、「110」である。従って、PPS#1には、伝送の無しを表す伝送フラグ「0」が含まれる。また、図７の例では、PPS#1の同一PPS単位を構成するスライスの視差精度が0.5であり、PPS#1には、視差精度パラメータとして視差精度0.5を表す「1」が含まれる。

　[PPSのシンタックスの例]
　図８は、図７のPPSのシンタックスの例を示す図である。

　図８に示すように、PPSには、視差精度パラメータ（disparity_precision）と伝送フラグ（dsiparity_pic_same_flag）が含まれる。視差精度パラメータは、例えば、視差精度1を表す場合「0」であり、視差精度0.25を表す場合「2」である。また、上述したように、視差精度パラメータは、視差精度0.5を表す場合「1」である。また、伝送フラグは、上述したように、伝送の有りを表す場合「1」であり、伝送の無しを表す場合「0」である。

　[スライスヘッダのシンタックスの例]
　図９および図１０は、スライスヘッダのシンタックスの例を示す図である。

　図１０に示すように、伝送フラグが1であり、スライスのタイプがイントラタイプである場合、スライスヘッダには、視差最小値（minimum_disparity）、視差最大値（maximum_disparity）、およびカメラ間距離（translation_x）が含まれる。

　一方、伝送フラグが1であり、スライスのタイプがインタータイプである場合、スライスヘッダには、視差最小値の差分符号化結果（delta_minimum_disparity）、視差最大値の差分符号化結果（delta_maximum_disparity）、およびカメラ間距離の差分符号化結果（delta_translation_x）が含まれる。

　[符号化装置の処理の説明]
　図１１は、図１の符号化装置５０の符号化処理を説明するフローチャートである。

　図１１のステップＳ１１１において、符号化装置５０の多視点カラー画像撮像部５１は、多視点のカラー画像を撮像し、多視点カラー画像として多視点カラー画像補正部５２に供給する。

　ステップＳ１１２において、多視点カラー画像撮像部５１は、視差最大値、視差最小値、および外部パラメータを生成する。多視点カラー画像撮像部５１は、視差最大値、視差最小値、および外部パラメータを視点生成用情報生成部５４に供給するとともに、視差最大値と視差最小値を多視点視差画像生成部５３に供給する。

　ステップＳ１１３において、多視点カラー画像補正部５２は、多視点カラー画像撮像部５１から供給される多視点カラー画像に対して、色補正、輝度補正、歪み補正等を行う。これにより、補正後の多視点カラー画像における多視点カラー画像撮像部５１の水平方向（X方向）の焦点距離は、全視点で共通となる。多視点カラー画像補正部５２は、補正後の多視点カラー画像を多視点補正カラー画像として多視点視差画像生成部５３と多視点画像符号化部５５に供給する。

　ステップＳ１１４において、多視点視差画像生成部５３は、多視点カラー画像撮像部５１から供給される視差最大値と視差最小値に基づいて、多視点カラー画像補正部５２から供給される多視点補正カラー画像から、多視点の視差画像を生成する。そして、多視点視差画像生成部５３は、生成された多視点の視差画像を多視点視差画像として多視点画像符号化部５５に供給する。

　ステップＳ１１５において、多視点視差画像生成部５３は、視差精度パラメータを生成し、視点生成用情報生成部５４に供給する。

　ステップＳ１１６において、視点生成用情報生成部５４は、多視点カラー画像撮像部５１から供給される外部パラメータに基づいて、カメラ間距離を求める。

　ステップＳ１１７において、視点生成用情報生成部５４は、多視点カラー画像撮像部５１からの視差最大値および視差最小値、カメラ間距離、並びに多視点視差画像生成部５３からの視差精度パラメータを視点生成用情報として生成する。視点生成用情報生成部５４は、生成された視点生成用情報を多視点画像符号化部５５に供給する。

　ステップＳ１１８において、多視点画像符号化部５５は、多視点カラー画像補正部５２からの多視点補正カラー画像と多視点視差画像生成部５３からの多視点視差画像を符号化する多視点符号化処理を行う。この多視点符号化処理の詳細については、後述する図１２を参照して説明する。

　ステップＳ１１９において、多視点画像符号化部５５は、多視点符号化処理の結果得られる符号化ビットストリームを伝送し、処理を終了する。

　図１２は、図１１のステップＳ１１８の多視点符号化処理を説明するフローチャートである。

　図１２のステップＳ１３１において、多視点画像符号化部５５のスライス符号化部６１（図５）は、多視点カラー画像補正部５２からの多視点補正カラー画像と、多視点視差画像生成部５３からの多視点視差画像を、スライス単位で符号化する。具体的には、スライス符号化部６１は、多視点補正カラー画像をHEVC方式で符号化するカラー画像符号化処理をスライス単位で行う。また、スライス符号化部６１は、図１の視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離を用いて、多視点視差画像をHEVC方式に準じた方式で符号化する視差画像符号化処理をスライス単位で行う。この視差画像符号化処理の詳細は、後述する図１３および図１４を参照して説明する。スライス符号化部６１は、符号化の結果得られるスライス単位の符号化データをスライスヘッダ符号化部６２に供給する。

　ステップＳ１３２において、スライスヘッダ符号化部６２は、視点生成用情報生成部５４から供給される視点生成用情報のうちのカメラ間距離、視差最大値、および視差最小値を、現在の処理対象のスライスのカメラ間距離、視差最大値、および視差最小値とし、保持する。

　ステップＳ１３３において、スライスヘッダ符号化部６２は、同一PPS単位を構成する全てのスライスのカメラ間距離、視差最大値、および視差最小値が、それぞれ、そのスライスより符号化順で１つ前のスライスのカメラ間距離、視差最大値、および視差最小値と一致するかどうかを判定する。

　ステップＳ１３３でカメラ間距離、視差最大値、および視差最小値が一致すると判定された場合、ステップＳ１３４において、スライスヘッダ符号化部６２は、カメラ間距離、視差最大値、および視差最小値の差分符号化結果の伝送の無しを表す伝送フラグを生成し、PPS符号化部６３に供給する。

　ステップＳ１３５において、スライスヘッダ符号化部６２は、ステップＳ１３３の処理対象である同一PPS単位を構成する各スライスの符号化データに、スライスヘッダとして、そのスライスのカメラ間距離、視差最大値、および視差最小値以外の符号化に関する情報を付加する。なお、この符号化に関する情報には、スライス符号化部６１から供給される画面内予測情報または動き情報が含まれる。そして、スライスヘッダ符号化部６２は、その結果得られる同一PPS単位を構成する各スライスの符号化データをPPS符号化部６３に供給し、処理をステップＳ１４０に進める。

　一方、ステップＳ１３３でカメラ間距離、視差最大値、および視差最小値が一致しないと判定された場合、ステップＳ１３６において、スライスヘッダ符号化部６２は、カメラ間距離、視差最大値、および視差最小値の差分符号化結果の伝送の有りを表す伝送フラグをPPS符号化部６３に供給する。なお、後述するステップＳ１３７乃至Ｓ１３９の処理は、ステップＳ１３３の処理対象である同一PPS単位を構成するスライスごとに行われる。

　ステップＳ１３７において、スライスヘッダ符号化部６２は、ステップＳ１３３の処理対象である同一PPS単位を構成するスライスのタイプがイントラタイプであるかどうかを判定する。ステップＳ１３７でスライスのタイプがイントラタイプであると判定された場合、ステップＳ１３８において、スライスヘッダ符号化部６２は、そのスライスの符号化データに、スライスヘッダとして、そのスライスのカメラ間距離、視差最大値、および視差最小値を含む符号化に関する情報を付加する。なお、この符号化に関する情報には、スライス符号化部６１から供給される画面内予測情報または動き情報も含まれる。そして、スライスヘッダ符号化部６２は、その結果得られるスライス単位の符号化データをPPS符号化部６３に供給し、処理をステップＳ１４０に進める。

　一方、ステップＳ１３７でスライスのタイプがイントラタイプではないと判定された場合、即ちスライスのタイプがインタータイプである場合、処理はステップＳ１３９に進む。ステップＳ１３９において、スライスヘッダ符号化部６２は、そのスライスのカメラ間距離、視差最大値、および視差最小値を差分符号化し、そのスライスの符号化データに、差分符号化結果を含む符号化に関する情報をスライスヘッダとして付加する。なお、この符号化に関する情報には、スライス符号化部６１から供給される画面内予測情報または動き情報も含まれる。そして、スライスヘッダ符号化部６２は、その結果得られるスライス単位の符号化データをPPS符号化部６３に供給し、処理をステップＳ１４０に進める。

　ステップＳ１４０において、PPS符号化部６３は、スライスヘッダ符号化部６２から供給される伝送フラグと、図１の視点生成用情報生成部５４から供給される視点生成用情報のうちの視差精度パラメータを含むPPSを生成する。

　ステップＳ１４１において、PPS符号化部６３は、同一PPS単位で、スライスヘッダ符号化部６２から供給されるスライスヘッダが付加されたスライス単位の符号化データにPPSを付加し、SPS符号化部６４に供給する。

　ステップＳ１４２において、SPS符号化部６４は、SPSを生成する。

　ステップＳ１４３において、SPS符号化部６４は、シーケンス単位で、PPS符号化部６３から供給されるPPSが付加された符号化データにSPSを付加し、符号化ビットストリームを生成する。そして、処理は図１１のステップＳ１１８に戻り、ステップＳ１１９に進む。

　図１３および図１４は、図５のスライス符号化部６１の視差画像符号化処理の詳細を説明するフローチャートである。この視差画像符号化処理は、視点ごとに行われる。

　図１３のステップＳ１６０において、符号化部１２０のA/D変換部１２１は、多視点視差画像生成部５３から入力された所定の視点のフレーム単位の視差画像をA/D変換し、画面並べ替えバッファ１２２に出力して記憶させる。

　ステップＳ１６１において、画面並べ替えバッファ１２２は、記憶した表示の順番のフレームの視差画像を、GOP構造に応じて、符号化のための順番に並べ替える。画面並べ替えバッファ１２２は、並べ替え後のフレーム単位の視差画像を、演算部１２３、画面内予測部１３３、および動き予測・補償部１３４に供給する。

　ステップＳ１６２において、画面内予測部１３３は、加算部１３０から供給される参照画像を用いて、候補となる全てのイントラ予測モードの画面内予測処理を行う。このとき、画面内予測部１３３は、候補となる全てのイントラ予測モードに対してコスト関数値を算出する。そして、画面内予測部１３３は、コスト関数値が最小となるイントラ予測モードを最適イントラ予測モードに決定する。画面内予測部１３３は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、選択部１３６に供給する。

　ステップＳ１６３において、動き予測・補償部１３４は、画面並べ替えバッファ１２２から供給される視差画像と、フレームメモリ１３２から供給される参照画像とに基づいて、動き予測・補償処理を行う。

　具体的には、動き予測・補償部１３４は、画面並べ替えバッファ１２２から供給される視差画像と、フレームメモリ１３２から供給される参照画像とに基づいて、候補となる全てのインター予測モードの動き予測処理を行い、動きベクトルを生成する。また、動き予測・補償部１３４は、インター予測モードごとに、生成された動きベクトルに基づいて、フレームメモリ１３２から参照画像を読み出すことにより、動き補償処理を行う。動き予測・補償部１３４は、その結果生成される予測画像を補正部１３５に供給する。

　ステップＳ１６４において、補正部１３５は、図１の視点生成用情報生成部５４から供給される視点生成用情報のうちの視差最大値、視差最小値、およびカメラ間距離に基づいて、補正係数を算出する。

　ステップＳ１６５において、補正部１３５は、動き予測・補償部１３４から供給される各インター予測モードの予測画像を、補正係数を用いて補正する。

　ステップＳ１６６において、補正部１３５は、補正後の予測画像を用いて、各インター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、補正部１３５は、最適インター予測モードで生成された予測画像とコスト関数値とを選択部１３６に供給する。

　ステップＳ１６７において、選択部１３６は、画面内予測部１３３および補正部１３５から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのコスト関数値が最小となる方を、最適予測モードに決定する。そして、選択部１３６は、最適予測モードの予測画像を、演算部１２３および加算部１３０に供給する。

　ステップＳ１６８において、選択部１３６は、最適予測モードが最適インター予測モードであるかどうかを判定する。ステップＳ１６８で最適予測モードが最適インター予測モードであると判定された場合、選択部１３６は、最適インター予測モードで生成された予測画像の選択を補正部１３５に通知する。

　そして、ステップＳ１６９において、補正部１３５は、動き情報をスライスヘッダ符号化部６２（図５）に出力し、処理をステップＳ１７１に進める。

　一方、ステップＳ１６８で最適予測モードが最適インター予測モードではないと判定された場合、即ち最適予測モードが最適イントラ予測モードである場合、選択部１３６は、最適イントラ予測モードで生成された予測画像の選択を画面内予測部１３３に通知する。

　そして、ステップＳ１７０において、画面内予測部１３３は、画面内予測情報をスライスヘッダ符号化部６２に出力し、処理をステップＳ１７１に進める。

　ステップＳ１７１において、演算部１２３は、画面並べ替えバッファ１２２から供給される視差画像から、選択部１３６から供給される予測画像を減算する。演算部１２３は、減算の結果得られる画像を、残差情報として直交変換部１２４に出力する。

　ステップＳ１７２において、直交変換部１２４は、演算部１２３からの残差情報に対して直交変換を施し、その結果得られる係数を量子化部１２５に供給する。

　ステップＳ１７３において、量子化部１２５は、直交変換部１２４から供給される係数を量子化する。量子化された係数は、可逆符号化部１２６と逆量子化部１２８に入力される。

　ステップＳ１７４において、可逆符号化部１２６は、量子化部１２５から供給される量子化された係数を可逆符号化する。

　図１４のステップＳ１７５において、可逆符号化部１２６は、可逆符号化処理の結果得られる符号化データを蓄積バッファ１２７に供給し、蓄積させる。

　ステップＳ１７６において、蓄積バッファ１２７は、蓄積されている符号化データをスライスヘッダ符号化部６２に出力する。

　ステップＳ１７７において、逆量子化部１２８は、量子化部１２５から供給される量子化された係数を逆量子化する。

　ステップＳ１７８において、逆直交変換部１２９は、逆量子化部１２８から供給される係数に対して逆直交変換を施し、その結果得られる残差情報を加算部１３０に供給する。

　ステップＳ１７９において、加算部１３０は、逆直交変換部１２９から供給される残差情報と、選択部１３６から供給される予測画像を加算し、局部的に復号された視差画像を得る。加算部１３０は、得られた視差画像をデブロックフィルタ１３１に供給するとともに、参照画像として画面内予測部１３３に供給する。

　ステップＳ１８０において、デブロックフィルタ１３１は、加算部１３０から供給される局部的に復号された視差画像に対してフィルタリングを行うことにより、ブロック歪を除去する。

　ステップＳ１８１において、デブロックフィルタ１３１は、フィルタリング後の視差画像をフレームメモリ１３２に供給し、蓄積させる。フレームメモリ１３２に蓄積された視差画像は、参照画像として動き予測・補償部１３４に出力される。そして、処理は終了する。

　なお、図１３および図１４のステップＳ１６２乃至Ｓ１８１の処理は、例えば、階層構造を有するコーディングユニット単位で行われる。また、図１３および図１４の視差画像符号化処理では、説明を簡単化するため、常に、画面内予測処理と動き補償処理が行われるようにしたが、実際には、ピクチャタイプ等によっていずれか一方のみが行われる場合もある。

　以上のように、符号化装置５０は、視差画像に関する情報を用いて予測画像を補正し、補正後の予測画像を用いて視差画像を符号化する。より詳細には、符号化装置５０は、視差画像に関する情報としてカメラ間距離、視差最大値、および視差最小値を用いて、予測画像と視差画像の間で、奥行方向の被写体の位置が同一である場合に視差値が同一となるように予測画像を補正し、補正後の予測画像を用いて視差画像を符号化する。従って、視差画像に関する情報によって生じる予測画像と視差画像の差分が削減され、符号化効率が向上する。特に、視差画像に関する情報がピクチャごとに変化するとき、符号化効率が向上する。

　また、符号化装置５０は、予測画像の補正に用いられる情報として、補正係数そのものではなく、補正係数の算出に用いられるカメラ間距離、視差最大値、および視差最小値を伝送する。ここで、カメラ間距離、視差最大値、および視差最小値は、視点生成用情報の一部である。従って、カメラ間距離、視差最大値、および視差最小値を、予測画像の補正に用いられる情報および視点生成用情報の一部として共有させることができる。その結果、符号化ビットストリームの情報量を削減することができる。

　[復号装置の第１実施の形態の構成例]
　図１５は、図１の符号化装置５０から伝送される符号化ビットストリームを復号する、本技術を適用した復号装置の第１実施の形態の構成例を示すブロック図である。

　図１５の復号装置１５０は、多視点画像復号部１５１、視点合成部１５２、および多視点画像表示部１５３により構成される。復号装置１５０は、符号化装置５０から伝送されてくる符号化ビットストリームを復号し、その結果得られる多視点カラー画像、多視点視差画像、および視点生成用情報を用いて表示視点のカラー画像を生成して表示する。

　具体的には、復号装置１５０の多視点画像復号部１５１は、図１の符号化装置５０から伝送されてくる符号化ビットストリームを受け取る。多視点画像復号部１５１は、受け取られた符号化ビットストリームに含まれるPPSから視差精度パラメータと伝送フラグを抽出する。また、多視点画像復号部１５１は、伝送フラグに応じて、符号化ビットストリームのスライスヘッダからカメラ間距離、視差最大値、および視差最小値を抽出する。多視点画像復号部１５１は、視差精度パラメータ、カメラ間距離、視差最大値、および視差最小値からなる視点生成用情報を生成し、視点合成部１５２に供給する。

　また、多視点画像復号部１５１は、符号化ビットストリームに含まれるスライス単位の多視点補正カラー画像の符号化データを、図１の多視点画像符号化部５５の符号化方式に対応する方式で復号し、多視点補正カラー画像を生成する。また、多視点画像復号部１５１は、復号部として機能する。多視点画像復号部１５１は、カメラ間距離、視差最大値、および視差最小値を用いて、符号化ビットストリームに含まれる多視点視差画像の符号化データを、多視点画像符号化部５５の符号化方式に対応する方式で復号し、多視点視差画像を生成する。多視点画像復号部１５１は、生成された多視点補正カラー画像および多視点視差画像を視点合成部１５２に供給する。

　視点合成部１５２は、多視点画像復号部１５１からの視点生成用情報を用いて、多視点画像復号部１５１からの多視点視差画像に対して、多視点画像表示部１５３に対応する視点数の表示視点へのワーピング処理を行う。具体的には、視点合成部１５２は、視点生成用情報に含まれるカメラ間距離、視差最大値、および視差最小値等に基づいて、視差精度パラメータに対応する精度で、多視点視差画像に対して表示視点へのワーピング処理を行う。なお、ワーピング処理とは、ある視点の画像から別の視点の画像へ幾何変換する処理である。また、表示視点には、多視点カラー画像に対応する視点以外の視点が含まれる。

　また、視点合成部１５２は、ワーピング処理の結果得られる表示視点の視差画像を用いて、多視点画像復号部１５１から供給される多視点補正カラー画像に対して、表示視点へのワーピング処理を行う。視点合成部１５２は、その結果得られる表示視点のカラー画像を、多視点合成カラー画像として多視点画像表示部１５３に供給する。

　多視点画像表示部１５３は、視点合成部１５２から供給される多視点合成カラー画像を、視点ごとに視認可能な角度が異なるように表示する。視聴者は、任意の２視点の各画像を左右の各目で見ることにより、メガネを装着せずに複数の視点から３Ｄ画像を見ることができる。

　以上のように、視点合成部１５２は、視差精度パラメータに基づいて、視点精度パラメータに対応する精度で、多視点視差画像に対する表示視点へのワーピング処理を行うので、視点合成部１５２は、無駄に高精度のワーピング処理を行う必要がない。

　また、視点合成部１５２は、カメラ間距離に基づいて、多視点視差画像に対する表示視点へのワーピング処理を行うので、ワーピング処理後の多視点視差画像の視差値に対応する視差が適正な範囲ではない場合、カメラ間距離に基づいて、視差値を適正な範囲の視差に対応する値に修正することができる。

　[多視点画像復号部の構成例]
　図１６は、図１５の多視点画像復号部１５１の構成例を示すブロック図である。

　図１６の多視点画像復号部１５１は、SPS復号部１７１、PPS復号部１７２、スライスヘッダ復号部１７３、およびスライス復号部１７４により構成される。

　多視点画像復号部１５１のSPS復号部１７１は、受け取り部として機能し、図１の符号化装置５０から伝送されてくる符号化ビットストリームを受け取り、その符号化ビットストリームのうちのSPSを抽出する。SPS復号部１７１は、抽出されたSPSとSPS以外の符号化ビットストリームをPPS復号部１７２に供給する。

　PPS復号部１７２は、SPS復号部１７１から供給されるSPS以外の符号化ビットストリームからPPSを抽出する。PPS復号部１７２は、抽出されたPPS、SPS、およびSPSとPPS以外の符号化ビットストリームをスライスヘッダ復号部１７３に供給する。

　スライスヘッダ復号部１７３は、PPS復号部１７２から供給されるSPSとPPS以外の符号化ビットストリームからスライスヘッダを抽出する。スライスヘッダ復号部１７３は、PPS復号部１７２からのPPSに含まれる伝送フラグが伝送の有りを表す「1」である場合、スライスヘッダに含まれるカメラ間距離、視差最大値、および視差最小値を保持するか、または、カメラ間距離、視差最大値、および視差最小値の差分符号化結果に基づいて保持されているカメラ間距離、視差最大値、および視差最小値を更新する。スライスヘッダ復号部１７３は、保持されているカメラ間距離、視差最大値、および視差最小値、並びに、PPSに含まれる視差精度パラメータから視点生成用情報を生成し、視点合成部１５２に供給する。

　さらに、スライスヘッダ復号部１７３は、SPS,PPS、およびスライスヘッダのカメラ間距離、視差最大値、および視差最小値に関する情報以外、並びに、SPS,PPS、およびスライスヘッダ以外の符号化ビットストリームであるスライス単位の符号化データを、スライス復号部１７４に供給する。また、スライスヘッダ復号部１７３は、カメラ間距離、視差最大値、および視差最小値をスライス復号部１７４に供給する。

　スライス復号部１７４は、スライスヘッダ復号部１７３から供給されるSPS,PPS、およびスライスヘッダのカメラ間距離、視差最大値、および視差最小値に関する情報以外に基づいて、スライス符号化部６１（図５）における符号化方式に対応する方式で、スライス単位の多重化カラー画像の符号化データを復号する。また、スライス復号部１７４は、SPS,PPS、スライスヘッダのカメラ間距離、視差最大値、および視差最小値関する情報以外、並びに、カメラ間距離、視差最大値、および視差最小値に基づいて、スライス符号化部６１における符号化方式に対応する方式で、スライス単位の多重化視差画像の符号化データを復号する。スライスヘッダ復号部１７３は、復号の結果得られる多視点補正カラー画像と多視点視差画像を、図１５の視点合成部１５２に供給する。

　［スライス復号部の構成例］
　図１７は、図１６のスライス復号部１７４のうちの任意の１視点の視差画像を復号する復号部の構成例を示すブロック図である。即ち、スライス復号部１７４のうちの多視点視差画像を復号する復号部は、視点数分の図１７の復号部２５０により構成される。

　図１７の復号部２５０は、蓄積バッファ２５１、可逆復号部２５２、逆量子化部２５３、逆直交変換部２５４、加算部２５５、デブロックフィルタ２５６、画面並べ替えバッファ２５７、D/A変換部２５８、フレームメモリ２５９、画面内予測部２６０、動きベクトル生成部２６１、動き補償部２６２、補正部２６３、およびスイッチ２６４により構成される。

　復号部２５０の蓄積バッファ２５１は、図１６のスライスヘッダ復号部１７３からスライス単位の所定の視点の視差画像の符号化データを受け取り、蓄積する。蓄積バッファ２５１は、蓄積されている符号化データを可逆復号部２５２に供給する。

　可逆復号部２５２は、蓄積バッファ２５１からの符号化データに対して、可変長復号や、算術復号等の可逆復号を施すことで、量子化された係数を得る。可逆復号部２５２は、量子化された係数を逆量子化部２５３に供給する。

　逆量子化部２５３、逆直交変換部２５４、加算部２５５、デブロックフィルタ２５６、フレームメモリ２５９、画面内予測部２６０、動き補償部２６２、および補正部２６３は、図６の逆量子化部１２８、逆直交変換部１２９、加算部１３０、デブロックフィルタ１３１、フレームメモリ１３２、画面内予測部１３３、動き予測・補償部１３４、および補正部１３５とそれぞれ同様の処理を行い、これにより、所定の視点の視差画像が復号される。

　具体的には、逆量子化部２５３は、可逆復号部２５２からの量子化された係数を逆量子化し、その結果得られる係数を逆直交変換部２５４に供給する。

　逆直交変換部２５４は、逆量子化部２５３からの係数に対して、逆離散コサイン変換、逆カルーネン・レーベ変換等の逆直交変換を施し、その結果得られる残差情報を加算部２５５に供給する。

　加算部２５５は、復号部として機能し、逆直交変換部２５４から供給される復号対象の視差画像としての残差情報と、スイッチ２６４から供給される予測画像を加算することにより、復号対象の視差画像を復号する。加算部２５５は、その結果得られる視差画像をデブロックフィルタ２５６に供給するとともに、参照画像として画面内予測部２６０に供給する。なお、スイッチ２６４から予測画像が供給されない場合、加算部２５５は、逆直交変換部２５４から供給される残差情報である視差画像をデブロックフィルタ２５６に供給するとともに、参照画像として画面内予測部２６０に供給する。

　デブロックフィルタ２５６は、加算部２５５から供給される視差画像をフィルタリングすることにより、ブロック歪を除去する。デブロックフィルタ２５６は、その結果得られる視差画像をフレームメモリ２５９に供給し、蓄積させるとともに、画面並べ替えバッファ２５７に供給する。フレームメモリ２５９に蓄積された視差画像は、参照画像として動き補償部２６２に供給される。

　画面並べ替えバッファ２５７は、デブロックフィルタ２５６から供給される視差画像をフレーム単位で記憶する。画面並べ替えバッファ２５７は、記憶した符号化のための順番のフレーム単位の視差画像を、元の表示の順番に並び替え、D/A変換部２５８に供給する。

　D/A変換部２５８は、画面並べ替えバッファ２５７から供給されるフレーム単位の視差画像をD/A変換し、所定の視点の視差画像として視点合成部１５２（図１５）に供給する。

　画面内予測部２６０は、加算部２５５から供給される参照画像を用いて、スライスヘッダ復号部１７３（図１６）から供給される画面内予測情報が表す最適イントラ予測モードの画面内予測を行い、予測画像を生成する。そして、画面内予測部２６０は、予測画像をスイッチ２６４に供給する。

　動きベクトル生成部２６１は、保持されている動きベクトルのうちの、スライスヘッダ復号部１７３から供給される動き情報に含まれる予測ベクトルインデックスが表す動きベクトルと、動きベクトル残差とを加算し、動きベクトルを復元する。動きベクトル生成部２６１は、復元された動きベクトルを保持する。また、動きベクトル生成部２６１は、復元された動きベクトルと、動き情報に含まれる最適インター予測モード等を動き補償部２６２に供給する。

　動き補償部２６２は、予測画像生成部として機能し、動きベクトル生成部２６１から供給される動きベクトルと最適インター予測モードに基づいて、フレームメモリ２５９から参照画像を読み出すことにより、動き補償処理を行う。動き補償部２６２は、その結果生成される予測画像を補正部２６３に供給する。

　補正部２６３は、図６の補正部１３５と同様に、図１６のスライスヘッダ復号部１７３から供給される視差最大値、視差最小値、およびカメラ間距離に基づいて、予測画像を補正する際に用いる補正係数を生成する。また、補正部２６３は、補正部１３５と同様に、動き補償部２６２から供給される最適インター予測モードの予測画像を、補正係数を用いて補正する。補正部２６３は、補正後の予測画像をスイッチ２６４に供給する。

　スイッチ２６４は、画面内予測部２６０から予測画像が供給された場合、その予測画像を加算部２５５に供給し、動き補償部２６２から予測画像が供給された場合、その予測画像を加算部２５５に供給する。

　[復号装置の処理の説明]
　図１８は、図１５の復号装置１５０の復号処理を説明するフローチャートである。この復号処理は、例えば、図１の符号化装置５０から符号化ビットストリームが伝送されてきたとき、開始される。

　図１８のステップＳ２０１において、復号装置１５０の多視点画像復号部１５１は、図１の符号化装置５０から伝送されてくる符号化ビットストリームを受け取る。

　ステップＳ２０２において、多視点画像復号部１５１は、受け取られた符号化ビットストリームを復号する多視点復号処理を行う。この多視点復号処理の詳細は、後述する図１９を参照して説明する。

　ステップＳ２０３において、視点合成部１５２は、カラー画像生成部として機能し、多視点画像復号部１５１から供給される視点生成用情報、多視点補正カラー画像、および多視点視差画像を用いて、多視点合成カラー画像を生成する。

　ステップＳ２０４において、多視点画像表示部１５３は、視点合成部１５２から供給される多視点合成カラー画像を、視点ごとに視認可能な角度が異なるように表示し、処理を終了する。

　図１９は、図１８のステップＳ２０２の多視点復号処理の詳細を説明するフローチャートである。

　図１９のステップＳ２２１において、多視点画像復号部１５１のSPS復号部１７１（図１６）は、受け取られた符号化ビットストリームのうちのSPSを抽出する。SPS復号部１７１は、抽出されたSPSとSPS以外の符号化ビットストリームをPPS復号部１７２に供給する。

　ステップＳ２２２において、PPS復号部１７２は、SPS復号部１７１から供給されるSPS以外の符号化ビットストリームからPPSを抽出する。PPS復号部１７２は、抽出されたPPS、SPS、およびSPSとPPS以外の符号化ビットストリームをスライスヘッダ復号部１７３に供給する。

　ステップＳ２２３において、スライスヘッダ復号部１７３は、PPS復号部１７２から供給されるPPSに含まれる視差精度パラメータを視点生成用情報の一部として視点合成部１５２に供給する。

　ステップＳ２２４において、スライスヘッダ復号部１７３は、PPS復号部１７２からのPPSに含まれる伝送フラグが伝送の有りを表す「1」であるかどうかを判定する。なお、以降のステップＳ２２５乃至Ｓ２３４の処理は、スライス単位で行われる。

　ステップＳ２２４で伝送フラグが伝送の有りを表す「1」であると判定された場合、処理はステップＳ２２５に進む。ステップＳ２２５において、スライスヘッダ復号部１７３は、PPS復号部１７２から供給されるSPSとPPS以外の符号化ビットストリームから、視差最大値、視差最小値、およびカメラ間距離、または、視差最大値、視差最小値、およびカメラ間距離の差分符号化結果を含むスライスヘッダを抽出する。

　ステップＳ２２６において、スライスヘッダ復号部１７３は、スライスのタイプがイントラタイプであるかどうかを判定する。ステップＳ２２６でスライスのタイプがイントラタイプであると判定された場合、処理はステップＳ２２７に進む。

　ステップＳ２２７において、スライスヘッダ復号部１７３は、ステップＳ２２５で抽出されたスライスヘッダに含まれる視差最小値を保持し、視点生成用情報の一部として視点合成部１５２に供給する。

　ステップＳ２２８において、スライスヘッダ復号部１７３は、ステップＳ２２５で抽出されたスライスヘッダに含まれる視差最大値を保持し、視点生成用情報の一部として視点合成部１５２に供給する。

　ステップＳ２２９において、スライスヘッダ復号部１７３は、ステップＳ２２５で抽出されたスライスヘッダに含まれるカメラ間距離を保持し、視点生成用情報の一部として視点合成部１５２に供給する。そして、処理はステップＳ２３５に進む。

　一方、ステップＳ２２６でスライスのタイプがイントラタイプではないと判定された場合、即ちスライスのタイプがインタータイプである場合、処理はステップＳ２３０に進む。

　ステップＳ２３０において、スライスヘッダ復号部１７３は、ステップＳ２２５で抽出されたスライスヘッダに含まれる視差最小値の差分符号化結果を、保持されている視差最小値に加算する。スライスヘッダ復号部１７３は、加算により復元された視差最小値を視点生成用情報の一部として視点合成部１５２に供給する。

　ステップＳ２３１において、スライスヘッダ復号部１７３は、ステップＳ２２５で抽出されたスライスヘッダに含まれる視差最大値の差分符号化結果を、保持されている視差最大値に加算する。スライスヘッダ復号部１７３は、加算により復元された視差最大値を視点生成用情報の一部として視点合成部１５２に供給する。

　ステップＳ２３２において、スライスヘッダ復号部１７３は、ステップＳ２２５で抽出されたスライスヘッダに含まれるカメラ間距離の差分符号化結果を、保持されているカメラ間距離に加算する。スライスヘッダ復号部１７３は、加算により復元されたカメラ間距離を視点生成用情報の一部として視点合成部１５２に供給する。そして、処理はステップＳ２３５に進む。

　一方、ステップＳ２２４で伝送フラグが伝送の有りを表す「1」ではないと判定された場合、即ち伝送フラグが伝送の無しを表す「0」である場合、処理はステップＳ２３３に進む。

　ステップＳ２３３において、スライスヘッダ復号部１７３は、PPS復号部１７２から供給されるSPSとPPS以外の符号化ビットストリームから、視差最大値、視差最小値、およびカメラ間距離、および、視差最大値、視差最小値、およびカメラ間距離の差分符号化結果を含まないスライスヘッダを抽出する。

　ステップＳ２３４において、スライスヘッダ復号部１７３は、保持されている視差最大値、視差最小値、およびカメラ間距離、即ち符号化順で1つ前のスライスの視差最大値、視差最小値、およびカメラ間距離を、処理対象のスライスの視差最大値、視差最小値、およびカメラ間距離とすることにより、処理対象のスライスの視差最大値、視差最小値、およびカメラ間距離を復元する。そして、スライスヘッダ復号部１７３は、復元された視差最大値、視差最小値、およびカメラ間距離を、視点生成用情報の一部として視点合成部１５２に供給し、処理をステップＳ２３５に進める。

　ステップＳ２３５において、スライス復号部１７４は、スライス符号化部６１（図５）における符号化方式に対応する方式で、スライス単位の符号化データを復号する。具体的には、スライス復号部１７４は、スライスヘッダ復号部１７３からのSPS,PPS、およびカメラ間距離、視差最大値、および視差最小値に関する情報以外のスライスヘッダに基づいて、スライス符号化部６１における符号化方式に対応する方式で、スライス単位の多視点カラー画像の符号化データを復号する。また、スライス復号部１７４は、スライスヘッダ復号部１７３からのSPS,PPS、カメラ間距離、視差最大値、および視差最小値に関する情報以外のスライスヘッダ、並びに、カメラ間距離、視差最大値、および視差最小値に基づいて、スライス符号化部６１における符号化方式に対応する方式で、スライス単位の多視点補正画像の符号化データを復号する視差画像復号処理を行う。この視差画像復号処理の詳細は、後述する図２０を参照して説明する。スライスヘッダ復号部１７３は、復号の結果得られる多視点補正カラー画像と多視点視差画像を、図１５の視点合成部１５２に供給する。

　図２０は、図１６のスライス復号部１７４の視差画像復号処理の詳細を説明するフローチャートである。この視差画像復号処理は、視点ごとに行われる。

　図２０のステップＳ２６１において、復号部２５０の蓄積バッファ２５１は、図１６のスライスヘッダ復号部１７３から所定の視点の視差画像のスライス単位の符号化データを受け取り、蓄積する。蓄積バッファ２５１は、蓄積されている符号化データを可逆復号部２５２に供給する。

　ステップＳ２６２において、可逆復号部２５２は、蓄積バッファ２５１から供給される符号化データを可逆復号し、その結果得られる量子化された係数を逆量子化部２５３に供給する。

　ステップＳ２６３において、逆量子化部２５３は、可逆復号部２５２からの量子化された係数を逆量子化し、その結果得られる係数を逆直交変換部２５４に供給する。

　ステップＳ２６４において、逆直交変換部２５４は、逆量子化部２５３からの係数に対して逆直交変換を施し、その結果得られる残差情報を加算部２５５に供給する。

　ステップＳ２６５において、動きベクトル生成部２６１は、図１６のスライスヘッダ復号部１７３から動き情報が供給されたかどうかを判定する。ステップＳ２６５で動き情報が供給されたと判定された場合、処理はステップＳ２６６に進む。

　ステップＳ２６６において、動きベクトル生成部２６１は、動き情報と保持している動きベクトルに基づいて動きベクトルを復元し、保持する。動きベクトル生成部２６１は、復元された動きベクトルと、動き情報に含まれる最適インター予測モード等を動き補償部２６２に供給する。

　ステップＳ２６７において、動き補償部２６２は、動きベクトル生成部２６１から供給される動きベクトルと最適インター予測モードに基づいて、フレームメモリ２５９から参照画像を読み出すことにより動き補償処理を行う。動き補償部２６２は、動き補償処理の結果生成される予測画像を補正部２６３に供給する。

　ステップＳ２６８において、補正部２６３は、図６の補正部１３５と同様に、図１６のスライスヘッダ復号部１７３から供給される視差最大値、視差最小値、およびカメラ間距離に基づいて、補正係数を算出する。

　ステップＳ２６９において、補正部２６３は、補正部１３５と同様に、動き補償部２６２から供給される最適インター予測モードの予測画像を、補正係数を用いて補正する。補正部２６３は、補正後の予測画像を、スイッチ２６４を介して加算部２５５に供給し、処理をステップＳ２７１に進める。

　一方、ステップＳ２６５で動き情報が供給されていないと判定された場合、即ち画面内予測情報がスライスヘッダ復号部１７３から画面内予測部２６０に供給された場合、処理はステップＳ２７０に進む。

　ステップＳ２７０において、画面内予測部２６０は、加算部２５５から供給される参照画像を用いて、スライスヘッダ復号部１７３から供給される画面内予測情報が示す最適イントラ予測モードの画面内予測処理を行う。画面内予測部２６０は、その結果生成される予測画像を、スイッチ２６４を介して加算部２５５に供給し、処理をステップＳ２７１に進める。

　ステップＳ２７１において、加算部２５５は、逆直交変換部２５４から供給される残差情報と、スイッチ２６４から供給される予測画像を加算する。加算部２５５は、その結果得られる視差画像をデブロックフィルタ２５６に供給するとともに、参照画像として画面内予測部２６０に供給する。

　ステップＳ２７２において、デブロックフィルタ２５６は、加算部２５５から供給される視差画像に対してフィルタリングを行い、ブロック歪を除去する。

　ステップＳ２７３において、デブロックフィルタ２５６は、フィルタリング後の視差画像をフレームメモリ２５９に供給し、蓄積させるとともに、画面並べ替えバッファ２５７に供給する。フレームメモリ２５９に蓄積された視差画像は、参照画像として動き補償部２６２に供給される。

　ステップＳ２７４において、画面並べ替えバッファ２５７は、デブロックフィルタ２５６から供給される視差画像をフレーム単位で記憶し、記憶した符号化のための順番のフレーム単位の視差画像を、元の表示の順番に並び替え、D/A変換部２５８に供給する。

　ステップＳ２７５において、D/A変換部２５８は、画面並べ替えバッファ２５７から供給されるフレーム単位の視差画像をD/A変換し、所定の視点の視差画像として図１５の視点合成部１５２に供給する。

　以上のように、復号装置１５０は、視差画像に関する情報を用いて補正された予測画像を用いて符号化することにより符号化効率が向上された視差画像の符号化データと、その視差画像に関する情報を含む符号化ビットストリームを受け取る。そして、復号装置１５０は、視差画像に関する情報を用いて予測画像を補正し、補正後の予測画像を用いて視差画像の符号化データを復号する。

　より詳細には、復号装置１５０は、視差画像に関する情報としてカメラ間距離、視差最大値、および視差最小値を用いて補正された予測画像を用いて符号化された符号化データと、カメラ間距離、視差最大値、および視差最小値とを受け取る。そして、復号装置１５０は、カメラ間距離、視差最大値、および視差最小値を用いて予測画像を補正し、補正後の予測画像を用いて視差画像の符号化データを復号する。これにより、復号装置１５０は、視差画像に関する情報を用いて補正された予測画像を用いて符号化することにより符号化効率が向上された視差画像の符号化データを復号することができる。

　なお、符号化装置５０は、予測画像の補正に用いられる情報として、視差最大値、視差最小値、およびカメラ間距離をスライスヘッダに含めて伝送したが、伝送方法は、これに限定されない。

　［予測画像の補正に用いられる情報の伝送方法の説明］
　図２１は、予測画像の補正に用いられる情報の伝送方法を説明する図である。

　図２１の第１の伝送方法は、上述したように、予測画像の補正に用いられる情報として、視差最大値、視差最小値、およびカメラ間距離をスライスヘッダに含めて伝送する方法である。この場合、予測画像の補正に用いられる情報と視点生成用情報を共有させ、符号化ビットストリームの情報量を削減することができる。しかしながら、復号装置１５０において、視差最大値、視差最小値、およびカメラ間距離を用いて補正係数を算出する必要があり、復号装置１５０の処理負荷は後述する第２の伝送方法に比べて大きい。

　一方、図２１の第２の伝送方法は、予測画像の補正に用いられる情報として補正係数そのものをスライスヘッダに含めて伝送する方法である。この場合、視差最大値、視差最小値、およびカメラ間距離は、予測画像の補正に用いられないため、視点生成用情報の一部として、例えば、符号化時に参照する必要がないSEI（Supplemental Enhancement Information）に含めて伝送される。第２の伝送方法では、補正係数が伝送されるので、復号装置１５０において補正係数を算出する必要がなく、復号装置１５０の処理負荷は第１の伝送方法に比べて小さい。しかしながら、補正係数が新たに伝送されるので、符号化ビットストリームの情報量は多くなる。

　なお、上述した説明では、予測画像は、視差最大値、視差最小値、およびカメラ間距離を用いて補正されたが、他の視差に関する情報（例えば、多視点カラー画像撮像部５１の奥行き方向の撮像位置を表す撮像位置情報など）も用いて補正されるようにすることもできる。

　この場合、図２１の第３の伝送方法により、予測画像の補正に用いられる情報として、視差最大値、視差最小値、カメラ間距離、および他の視差に関する情報を用いて生成された補正係数である追加補正係数がスライスヘッダに含められて伝送される。このように、視差最大値、視差最小値、およびカメラ間距離以外の視差に関する情報も用いて予測画像が補正される場合、視差に関する情報による予測画像と視差画像の差分をより削減し、符号化効率を向上させることができる。しかしながら、追加補正係数が新たに伝送されるので、第１の伝送方法に比べて符号化ビットストリームの情報量は多くなる。また、視差最大値、視差最小値、およびカメラ間距離を用いて補正係数を算出する必要があるので、第２の伝送方法に比べて復号装置１５０の処理負荷は大きい。

　図２２は、第２の伝送方法で予測画像の補正に用いられる情報を伝送する場合の符号化ビットストリームの構成例を示す図である。

　図２２の例では、PPS#0の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの補正係数が、それぞれ、符号化順で1つ前のスライスの補正係数と一致しない。従って、PPS#0には、伝送の有りを表す伝送フラグ「1」が含まれる。なお、ここでは、伝送フラグは、補正係数の伝送の有無を表すフラグである。

　また、図２２の例では、PPS#0の同一PPS単位を構成するイントラタイプのスライスの補正係数aが1であり、補正係数bが0である。従って、そのスライスのスライスヘッダには、補正係数a「1」と補正係数b「0」が含まれる。

　さらに、図２２の例では、PPS#0の同一PPS単位を構成する1番目のインタータイプのスライスの補正係数aが3であり、補正係数bが2である。従って、そのスライスのスライスヘッダには、そのスライスの補正係数a「3」から、符号化順で1つ前のイントラタイプのスライスの補正係数a「1」を減算した差分「+2」が、補正係数の差分符号化結果として含まれる。同様に、補正係数bの差分「+2」が補正係数bの差分符号化結果として含まれる。

　また、図２２の例では、PPS#0の同一PPS単位を構成する2番目のインタータイプのスライスの補正係数aが0であり、補正係数bが-1である。従って、そのスライスのスライスヘッダには、そのスライスの補正係数a「0」から、符号化順で1つ前の1番目のインタータイプのスライスの補正係数a「3」を減算した差分「-3」が、補正係数の差分符号化結果として含まれる。同様に、補正係数bの差分「-3」が補正係数bの差分符号化結果として含まれる。

　また、図２２の例では、PPS#1の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの補正係数が、それぞれ、符号化順で1つ前のスライスの補正係数と一致する。従って、PPS#1には、伝送の無しを表す伝送フラグ「0」が含まれる。

　図２３は、第３の伝送方法で予測画像の補正に用いられる情報を伝送する場合の符号化ビットストリームの構成例を示す図である。

　図２３の例では、PPS#0の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの視差最小値、視差最大値、カメラ間距離、および追加補正係数が、それぞれ、符号化順で1つ前のスライスの視差最小値、視差最大値、カメラ間距離、および追加補正係数と一致しない。従って、PPS#0には、伝送の有りを表す伝送フラグ「1」が含まれる。なお、ここでは、伝送フラグは、視差最小値、視差最大値、カメラ間距離、および追加補正係数の伝送の有無を表すフラグである。

　また、図２３の例では、PPS#0の同一PPS単位を構成するスライスの視差最小値、視差最大値、およびカメラ間距離は、図７の場合と同様であり、各スライスのスライスヘッダに含まれる視差最小値、視差最大値、およびカメラ間距離に関する情報は図７と同様であるので、説明は省略する。

　また、図２３の例では、PPS#0の同一PPS単位を構成するイントラタイプのスライスの追加補正係数は5である。従って、そのスライスのスライスヘッダには、追加補正係数「5」が含まれる。

　さらに、図２３の例では、PPS#0の同一PPS単位を構成する1番目のインタータイプのスライスの追加補正係数が7である。従って、そのスライスのスライスヘッダには、そのスライスの追加補正係数「7」から、符号化順で1つ前のイントラタイプのスライスの追加補正係数「5」を減算した差分「+2」が、追加補正係数の差分符号化結果として含まれる。

　また、図２３の例では、PPS#0の同一PPS単位を構成する2番目のインタータイプのスライスの追加補正係数が8である。従って、そのスライスのスライスヘッダには、そのスライスの追加補正係数「8」から、符号化順で1つ前の1番目のインタータイプのスライスの追加補正係数「7」を減算した差分「+1」が、追加補正係数の差分符号化結果として含まれる。

　また、図２３の例では、PPS#1の同一PPS単位を構成する1つのイントラタイプのスライスと2つのインタータイプのスライスの視差最小値、視差最大値、カメラ間距離、および追加補正係数が、それぞれ、符号化順で1つ前のスライスの視差最小値、視差最大値、カメラ間距離、および追加補正係数と一致する。従って、PPS#1には、伝送の無しを表す伝送フラグ「0」が含まれる。

　符号化装置５０は、図２１の第１乃至第３の伝送方法のいずれの方法で、予測画像の補正に用いられる情報を伝送するようにしてもよい。また、符号化装置５０は、伝送方法として採用した、第１乃至第３の伝送方法のうちの１つの伝送方法を識別する識別情報（例えば、フラグ、ＩＤなど）を、符号化ビットストリームに含めて伝送するようにしてもよい。さらに、図２１の第１乃至第３の伝送方法は、符号化ビットストリームを利用するアプリケーションに応じて、符号化ビットストリームのデータ量と復号の処理負荷のバランスを考慮して適宜選択することが可能である。

　また、本実施の形態では、予測画像の補正に用いられる情報は、符号化に関する情報としてスライスヘッダに配置されたが、予測画像の補正に用いられる情報の配置領域は、符号化時に参照される領域であれば、スライスヘッダに限定されない。例えば、予測画像の補正に用いられる情報は、PPSのNALユニット等の既存のNAL(Network Abstraction Layer)ユニットや、HEVC規格で提案されているAPS（Adaptation Parameter Set）のNALユニット等の新たなNALユニットに配置されるようにすることができる。

　例えば、補正係数や追加補正係数が複数のピクチャ間で共通である場合、その複数のピクチャに適応可能なNALユニット（例えば、PPSのNALユニット等）に、その共通の値を配置させることにより、伝送効率を向上させることができる。即ち、この場合、複数のピクチャ間で共通の補正係数や追加補正係数を伝送すればよいので、スライスヘッダに配置させる場合のように、スライスごとに補正係数や追加補正係数を伝送する必要がない。

　従って、例えば、カラー画像が、フラッシュやフェード効果を有するカラー画像である場合、視差最小値、視差最大値、カメラ間距離等などのパラメータが変化しない傾向があるため、補正係数や追加補正係数はPPSのNALユニットなどに配置させ、伝送効率を向上させる。

　補正係数や追加補正係数は、例えば、ピクチャごとに異なる場合、スライスヘッダに配置させ、複数のピクチャ間で共通である場合、スライスヘッダよりも上のレイヤ(例えば、PPSのNALユニット等)に配置することができる。

　さらに、視差画像は、その視差画像に対応する視点のカラー画像の各画素の被写体の奥行方向の位置を表すデプス値からなる画像であってもよい。この場合、視差最大値と視差最小値は、ぞれぞれ、多視点視差画像においてとり得る奥行方向の位置の世界座標値の最大値、最小値である。

　また、本技術は、HEVC方式以外のAVC,MVC（Multiview Video Coding）等の符号化方式にも適用することができる。

　＜第２実施の形態＞
　[本技術を適用したコンピュータの説明]
　次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

　そこで、図２４は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

　プログラムは、コンピュータに内蔵されている記録媒体としての記憶部８０８やROM（Read Only Memory）８０２に予め記録しておくことができる。

　あるいはまた、プログラムは、リムーバブルメディア８１１に格納（記録）しておくことができる。このようなリムーバブルメディア８１１は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブルメディア８１１としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。

　なお、プログラムは、上述したようなリムーバブルメディア８１１からドライブ８１０を介してコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵する記憶部８０８にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。

　コンピュータは、CPU(Central Processing Unit)８０１を内蔵しており、CPU８０１には、バス８０４を介して、入出力インタフェース８０５が接続されている。

　CPU８０１は、入出力インタフェース８０５を介して、ユーザによって、入力部８０６が操作等されることにより指令が入力されると、それに従って、ROM８０２に格納されているプログラムを実行する。あるいは、CPU８０１は、記憶部８０８に格納されたプログラムを、RAM(Random Access Memory)８０３にロードして実行する。

　これにより、CPU８０１は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU８０１は、その処理結果を、必要に応じて、例えば、入出力インタフェース８０５を介して、出力部８０７から出力、あるいは、通信部８０９から送信、さらには、記憶部８０８に記録等させる。

　なお、入力部８０６は、キーボードや、マウス、マイク等で構成される。また、出力部８０７は、LCD(Liquid Crystal Display)やスピーカ等で構成される。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

　また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

　本技術は、衛星放送、ケーブルＴＶ（テレビジョン）、インターネット、および携帯電話機などのネットワークメディアを介して通信する際に、あるいは、光、磁気ディスク、およびフラッシュメモリのような記憶メディア上で処理する際に用いられる符号化装置および復号装置に適用することができる。

　また、上述した符号化装置および復号装置は、任意の電子機器に適用することができる。以下にその例について説明する。

　＜第３実施の形態＞
　［テレビジョン装置の構成例］
　図２５は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース部９０９を有している。さらに、テレビジョン装置９００は、制御部９１０、ユーザインタフェース部９１１等を有している。

　チューナ９０２は、アンテナ９０１で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ９０３に出力する。

　デマルチプレクサ９０３は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ９０４に出力する。また、デマルチプレクサ９０３は、ＥＰＧ（Electronic Program Guide）等のデータのパケットを制御部９１０に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。

　デコーダ９０４は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部９０５、音声データを音声信号処理部９０７に出力する。

　映像信号処理部９０５は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部９０５は、表示部９０６に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部９０５は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部９０５は、このようにして生成した映像データに基づいて駆動信号を生成して表示部９０６を駆動する。

　表示部９０６は、映像信号処理部９０５からの駆動信号に基づき表示デバイス（例えば液晶表示素子等）を駆動して、番組の映像などを表示させる。

　音声信号処理部９０７は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのＤ／Ａ変換処理や増幅処理を行いスピーカ９０８に供給することで音声出力を行う。

　外部インタフェース部９０９は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。

　制御部９１０にはユーザインタフェース部９１１が接続されている。ユーザインタフェース部９１１は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９１０に供給する。

　制御部９１０は、ＣＰＵ(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ、ＥＰＧデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置９００の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、テレビジョン装置９００がユーザ操作に応じた動作となるように各部を制御する。

　なお、テレビジョン装置９００では、チューナ９０２、デマルチプレクサ９０３、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９等と制御部９１０を接続するためバス９１２が設けられている。

　このように構成されたテレビジョン装置では、デコーダ９０４に本願の復号装置（復号方法）の機能が設けられる。このため、視差画像に関する情報を用いて符号化することにより符号化効率が改善された視差画像の符号化データを復号することができる。

　＜第４実施の形態＞
　［携帯電話機の構成例］
　図２６は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機９２０は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１を有している。これらは、バス９３３を介して互いに接続されている。

　また、通信部９２２にはアンテナ９２１が接続されており、音声コーデック９２３には、スピーカ９２４とマイクロホン９２５が接続されている。さらに制御部９３１には、操作部９３２が接続されている。

　携帯電話機９２０は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

　音声通話モードにおいて、マイクロホン９２５で生成された音声信号は、音声コーデック９２３で音声データへの変換やデータ圧縮が行われて通信部９２２に供給される。通信部９２２は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部９２２は、送信信号をアンテナ９２１に供給して図示しない基地局へ送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック９２３に供給する。音声コーデック９２３は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ９２４に出力する。

　また、データ通信モードにおいて、メール送信を行う場合、制御部９３１は、操作部９３２の操作によって入力された文字データを受け付けて、入力された文字を表示部９３０に表示する。また、制御部９３１は、操作部９３２におけるユーザ指示等に基づいてメールデータを生成して通信部９２２に供給する。通信部９２２は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部９３０に供給して、メール内容の表示を行う。

　なお、携帯電話機９２０は、受信したメールデータを、記録再生部９２９で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、ＲＡＭや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、またはメモリカード等のリムーバブルメディアである。

　データ通信モードにおいて画像データを送信する場合、カメラ部９２６で生成された画像データを、画像処理部９２７に供給する。画像処理部９２７は、画像データの符号化処理を行い、符号化データを生成する。

　多重分離部９２８は、画像処理部９２７で生成された符号化データと、音声コーデック９２３から供給された音声データを所定の方式で多重化して通信部９２２に供給する。通信部９２２は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部９２８に供給する。多重分離部９２８は、多重化データの分離を行い、符号化データを画像処理部９２７、音声データを音声コーデック９２３に供給する。画像処理部９２７は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部９３０に供給して、受信した画像の表示を行う。音声コーデック９２３は、音声データをアナログ音声信号に変換してスピーカ９２４に供給して、受信した音声を出力する。

　このように構成された携帯電話装置では、画像処理部９２７に本願の符号化装置および復号装置（符号化方法および復号方法）の機能が設けられる。このため、視差画像に関する情報を用いて視差画像の符号化効率を改善することができる。また、視差画像に関する情報を用いて符号化することにより符号化効率が改善された視差画像の符号化データを復号することができる。

　＜第５実施の形態＞
　［記録再生装置の構成例］
　図２７は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置９４０は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置９４０は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置９４０は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。

　記録再生装置９４０は、チューナ９４１、外部インタフェース部９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）部９４８、制御部９４９、ユーザインタフェース部９５０を有している。

　チューナ９４１は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ９４１は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ９４６に出力する。

　外部インタフェース部９４２は、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース部、ＵＳＢインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部９４２は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。

　エンコーダ９４３は、外部インタフェース部９４２から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ９４６に出力する。

　ＨＤＤ部９４４は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。

　ディスクドライブ９４５は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばＤＶＤディスク（ＤＶＤ－Ｖｉｄｅｏ、ＤＶＤ－ＲＡＭ、ＤＶＤ－Ｒ、ＤＶＤ－ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）やＢｌｕ－ｒａｙディスク等である。

　セレクタ９４６は、映像や音声の記録時には、チューナ９４１またはエンコーダ９４３からのいずれかの符号化ビットストリームを選択して、ＨＤＤ部９４４やディスクドライブ９４５のいずれかに供給する。また、セレクタ９４６は、映像や音声の再生時に、ＨＤＤ部９４４またはディスクドライブ９４５から出力された符号化ビットストリームをデコーダ９４７に供給する。

　デコーダ９４７は、符号化ビットストリームの復号化処理を行う。デコーダ９４７は、復号処理化を行うことにより生成された映像データをＯＳＤ部９４８に供給する。また、デコーダ９４７は、復号処理化を行うことにより生成された音声データを出力する。

　ＯＳＤ部９４８は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ９４７から出力された映像データに重畳して出力する。

　制御部９４９には、ユーザインタフェース部９５０が接続されている。ユーザインタフェース部９５０は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９４９に供給する。

　制御部９４９は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置９４０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、記録再生装置９４０がユーザ操作に応じた動作となるように各部を制御する。

　このように構成された記録再生装置では、デコーダ９４７に本願の復号装置（復号方法）の機能が設けられる。このため、視差画像に関する情報を用いて符号化することにより符号化効率が改善された視差画像の符号化データを復号することができる。

　＜第６実施の形態＞
　［撮像装置の構成例］
　図２８は、本技術を適用した撮像装置の概略構成を例示している。撮像装置９６０は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。

　撮像装置９６０は、光学ブロック９６１、撮像部９６２、カメラ信号処理部９６３、画像データ処理部９６４、表示部９６５、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０を有している。また、制御部９７０には、ユーザインタフェース部９７１が接続されている。さらに、画像データ処理部９６４や外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０等は、バス９７２を介して接続されている。

　光学ブロック９６１は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤまたはＣＭＯＳイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部９６３に供給する。

　カメラ信号処理部９６３は、撮像部９６２から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部９６３は、カメラ信号処理後の画像データを画像データ処理部９６４に供給する。

　画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データの符号化処理を行う。画像データ処理部９６４は、符号化処理を行うことにより生成された符号化データを外部インタフェース部９６６やメディアドライブ９６８に供給する。また、画像データ処理部９６４は、外部インタフェース部９６６やメディアドライブ９６８から供給された符号化データの復号化処理を行う。画像データ処理部９６４は、復号化処理を行うことにより生成された画像データを表示部９６５に供給する。また、画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データを表示部９６５に供給する処理や、ＯＳＤ部９６９から取得した表示用データを、画像データに重畳させて表示部９６５に供給する。

　ＯＳＤ部９６９は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部９６４に出力する。

　外部インタフェース部９６６は、例えば、ＵＳＢ入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部９６６には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部９６６は、ＬＡＮやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部９７０は、例えば、ユーザインタフェース部９７１からの指示にしたがって、メモリ部９６７から符号化データを読み出し、それを外部インタフェース部９６６から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部９７０は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部９６６を介して取得し、それを画像データ処理部９６４に供給したりすることができる。

　メディアドライブ９６８で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ＩＣカード等であってもよい。

　また、メディアドライブ９６８と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやＳＳＤ（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

　制御部９７０は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ等を記憶する。メモリに記憶されているプログラムは、撮像装置９６０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、撮像装置９６０がユーザ操作に応じた動作となるように各部を制御する。

　このように構成された撮像装置では、画像データ処理部９６４に本願の符号化装置および復号装置（符号化方法および復号方法）の機能が設けられる。このため、視差画像に関する情報を用いて視差画像の符号化効率を改善することができる。また、視差画像に関する情報を用いて符号化することにより符号化効率が改善された視差画像の符号化データを復号することができる。

　本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　なお、本技術は、以下のような構成もとることができる。

　（１）
　基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正部と、
　前記補正部により補正された前記予測画像を用いて、前記基準視点の視差画像を符号化する符号化部と、
　前記符号化部により符号化された前記基準視点の視差画像と前記基準視点の視差画像に関する情報とを伝送する伝送部と
　を備える符号化装置。
　（２）
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像と前記基準視点の視差画像を用いて前記基準視点と異なる視点のカラー画像を生成する際に用いる情報である視点生成情報を含み、
　前記伝送部は、前記視点生成情報を、前記基準視点の視差画像を符号化する際に用いる符号化パラメータとして伝送する
　前記（１）に記載の符号化装置。
　（３）
　前記補正部は、前記視点生成情報に基づいて前記予測画像を補正する際に用いる補正係数を用いて、前記予測画像を補正し、
　前記伝送部は、前記補正係数を、前記符号化パラメータとして伝送する
　前記（２）に記載の符号化装置。
　（４）
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像を撮像する撮像部の奥行方向の撮像位置を表す撮像位置情報を含み、
　前記補正部は、前記撮像位置情報に基づいて前記予測画像を補正する際に用いる補正係数と前記視点生成情報とを用いて前記予測画像を補正し、
　前記伝送部は、前記補正係数を、前記符号化パラメータとして伝送する
　前記（２）に記載の符号化装置。
　（５）
　前記補正部は、前記補正係数を設定する
　前記（３）または（４）に記載の符号化装置。
　（６）
　前記符号化部は、前記基準視点の視差画像を、階層構造を有する単位で符号化する
　前記（１）乃至（５）のいずれかに記載の符号化装置。
　（７）
　前記基準視点の視差画像の予測画像を生成する予測画像生成部
　をさらに備える
　前記（１）乃至（６）のいずれかに記載の符号化装置。
　（８）
　符号化装置が、
　基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正ステップと、
　前記補正ステップの処理により補正された前記予測画像を用いて、前記基準視点の視差画像を符号化する符号化ステップと、
　前記符号化ステップの処理により符号化された前記基準視点の視差画像と前記基準視点の視差画像に関する情報とを伝送する伝送ステップと
　を含む符号化方法。
　（９）
　基準視点の視差画像に関する情報を用いて補正された前記基準視点の視差画像の予測画像を用いて符号化された前記基準視点の視差画像と、前記基準視点の視差画像に関する情報とを受け取る受け取り部と、
　前記受け取り部により受け取られた前記基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正部と、
　前記補正部により補正された前記予測画像を用いて、前記受け取り部により受け取られた、符号化された前記基準視点の視差画像を復号する復号部と
　を備える復号装置。
　（１０）
　前記復号部により復号された前記基準視点の視差画像と、前記基準視点のカラー画像とを用いて、前記基準視点と異なる視点のカラー画像を生成するカラー画像生成部
　をさらに備え、
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像と前記基準視点の視差画像を用いて前記基準視点と異なる視点のカラー画像を生成する際に用いる情報である視点生成情報を含み、
　前記受け取り部は、符号化された前記基準視点の視差画像を復号する際に用いる符号化パラメータとして伝送される前記視点生成情報を受け取り、
　前記カラー画像生成部は、前記復号部により復号された前記基準視点の視差画像と、前記基準視点のカラー画像と、前記受け取り部により受け取られた前記視点生成情報とを用いて、前記基準視点と異なる視点のカラー画像を生成する
　前記（９）に記載の復号装置。
　（１１）
　前記受け取り部は、前記符号化パラメータとして伝送される符号化時に前記予測画像の補正に用いられた補正係数を受け取り、
　前記補正係数は、前記視点生成情報に基づいて生成され、
　前記補正部は、前記受け取り部により受け取られた前記補正係数を用いて、前記予測画像を補正する
　前記（１０）に記載の復号装置。
　（１２）
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像を撮像する撮像部の奥行方向の撮像位置を表す撮像位置情報を含み、
　前記受け取り部は、前記符号化パラメータとして伝送される符号化時に前記予測画像の補正に用いられた補正係数を受け取り、
　前記補正部は、前記受け取り部により受け取られた前記補正係数と前記視点生成情報を用いて、前記予測画像を補正する
　前記（１０）に記載の復号装置。
　（１３）
　前記補正係数は、前記視点生成情報に基づいて設定される
　前記（１２）に記載の復号装置。
　（１４）
　前記基準視点の視差画像は、階層構造を有する単位で符号化される
　前記（９）乃至（１３）のいずれかに記載の復号装置。
　（１５）
　前記基準視点の視差画像の予測画像を生成する予測画像生成部
　をさらに備える
　前記（９）乃至（１４）のいずれかに記載の復号装置。
　（１６）
　復号装置が、
　基準視点の視差画像に関する情報を用いて補正された前記基準視点の視差画像の予測画像を用いて符号化された前記基準視点の視差画像と、前記基準視点の視差画像に関する情報とを受け取る受け取りステップと、
　前記受け取りステップの処理により受け取られた前記基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正ステップと、
　前記補正ステップの処理により補正された前記予測画像を用いて、前記受け取りステップの処理により受け取られた、符号化された前記基準視点の視差画像を復号する復号ステップと
　を含む復号方法。

　５０　符号化装置，　６４　SPS符号化部，　１２３　演算部，　１３４　動き予測・補償部，　１３５　補正部，　１５０　復号装置，　１５２　視点合成部，　１７１　SPS復号部，　２５５　加算部，　２６２　動き補償部，　２６３　補正部

Claims

　基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正部と、
　前記補正部により補正された前記予測画像を用いて、前記基準視点の視差画像を符号化する符号化部と、
　前記符号化部により符号化された前記基準視点の視差画像と前記基準視点の視差画像に関する情報とを伝送する伝送部と
　を備える符号化装置。
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像と前記基準視点の視差画像を用いて前記基準視点と異なる視点のカラー画像を生成する際に用いる情報である視点生成情報を含み、
　前記伝送部は、前記視点生成情報を、前記基準視点の視差画像を符号化する際に用いる符号化パラメータとして伝送する
　請求項１に記載の符号化装置。
　前記補正部は、前記視点生成情報に基づいて前記予測画像を補正する際に用いる補正係数を用いて、前記予測画像を補正し、
　前記伝送部は、前記補正係数を、前記符号化パラメータとして伝送する
　請求項２に記載の符号化装置。
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像を撮像する撮像部の奥行方向の撮像位置を表す撮像位置情報を含み、
　前記補正部は、前記撮像位置情報に基づいて前記予測画像を補正する際に用いる補正係数と前記視点生成情報とを用いて前記予測画像を補正し、
　前記伝送部は、前記補正係数を、前記符号化パラメータとして伝送する
　請求項２に記載の符号化装置。
　前記補正部は、前記補正係数を設定する
　請求項４に記載の符号化装置。
　前記符号化部は、前記基準視点の視差画像を、階層構造を有する単位で符号化する
　請求項５に記載の符号化装置。
　前記基準視点の視差画像の予測画像を生成する予測画像生成部
　をさらに備える
　請求項１に記載の符号化装置。
　符号化装置が、
　基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正ステップと、
　前記補正ステップの処理により補正された前記予測画像を用いて、前記基準視点の視差画像を符号化する符号化ステップと、
　前記符号化ステップの処理により符号化された前記基準視点の視差画像と前記基準視点の視差画像に関する情報とを伝送する伝送ステップと
　を含む符号化方法。
　基準視点の視差画像に関する情報を用いて補正された前記基準視点の視差画像の予測画像を用いて符号化された前記基準視点の視差画像と、前記基準視点の視差画像に関する情報とを受け取る受け取り部と、
　前記受け取り部により受け取られた前記基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正部と、
　前記補正部により補正された前記予測画像を用いて、前記受け取り部により受け取られた、符号化された前記基準視点の視差画像を復号する復号部と
　を備える復号装置。
　前記復号部により復号された前記基準視点の視差画像と、前記基準視点のカラー画像とを用いて、前記基準視点と異なる視点のカラー画像を生成するカラー画像生成部
　をさらに備え、
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像と前記基準視点の視差画像を用いて前記基準視点と異なる視点のカラー画像を生成する際に用いる情報である視点生成情報を含み、
　前記受け取り部は、符号化された前記基準視点の視差画像を復号する際に用いる符号化パラメータとして伝送される前記視点生成情報を受け取り、
　前記カラー画像生成部は、前記復号部により復号された前記基準視点の視差画像と、前記基準視点のカラー画像と、前記受け取り部により受け取られた前記視点生成情報とを用いて、前記基準視点と異なる視点のカラー画像を生成する
　請求項９に記載の復号装置。
　前記受け取り部は、前記符号化パラメータとして伝送される符号化時に前記予測画像の補正に用いられた補正係数を受け取り、
　前記補正係数は、前記視点生成情報に基づいて生成され、
　前記補正部は、前記受け取り部により受け取られた前記補正係数を用いて、前記予測画像を補正する
　請求項１０に記載の復号装置。
　前記基準視点の視差画像に関する情報は、前記基準視点のカラー画像を撮像する撮像部の奥行方向の撮像位置を表す撮像位置情報を含み、
　前記受け取り部は、前記符号化パラメータとして伝送される符号化時に前記予測画像の補正に用いられた補正係数を受け取り、
　前記補正部は、前記受け取り部により受け取られた前記補正係数と前記視点生成情報を用いて、前記予測画像を補正する
　請求項１０に記載の復号装置。
　前記補正係数は、前記視点生成情報に基づいて設定される
　請求項１２に記載の復号装置。
　前記基準視点の視差画像は、階層構造を有する単位で符号化される
　請求項１３に記載の復号装置。
　前記基準視点の視差画像の予測画像を生成する予測画像生成部
　をさらに備える
　請求項９に記載の復号装置。
　復号装置が、
　基準視点の視差画像に関する情報を用いて補正された前記基準視点の視差画像の予測画像を用いて符号化された前記基準視点の視差画像と、前記基準視点の視差画像に関する情報とを受け取る受け取りステップと、
　前記受け取りステップの処理により受け取られた前記基準視点の視差画像に関する情報を用いて、前記基準視点の視差画像の予測画像を補正する補正ステップと、
　前記補正ステップの処理により補正された前記予測画像を用いて、前記受け取りステップの処理により受け取られた、符号化された前記基準視点の視差画像を復号する復号ステップと
　を含む復号方法。