JPWO2012121052A1

JPWO2012121052A1 - 画像処理装置、画像処理方法、及び、プログラム

Info

Publication number: JPWO2012121052A1
Application number: JP2013503459A
Authority: JP
Inventors: 良知高橋; しのぶ服部
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-03-08
Filing date: 2012-02-28
Publication date: 2014-07-17
Also published as: WO2012121052A1; US20130336589A1; US9105076B2; CN103404154A

Abstract

本技術は、複数の視点の画像について、復号画像の画質を向上させることができる画像処理装置、画像処理方法、及び、プログラムに関する。ワーピング部４６１は、視点#1の画像、及び、視点#1と異なる視点#2の画像のうちの、視点#1の画像のピクチャをワーピングすることにより、視点#1の画像のピクチャを視点#2で得られる画像に変換したワープド画像のピクチャを生成する。視差予測部４６３は、視点#2の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスを、ヘッダ情報から取得し、その参照インデクスに基づいて、ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、参照ピクチャを選択する。本技術は、例えば、複数の視点の画像の符号化、及び、復号に適用することができる。

Description

本技術は、画像処理装置、画像処理方法、及び、プログラムに関し、複数の視点の画像について、復号画像の画質を向上させることができるようにする画像処理装置、画像処理方法、及び、プログラムに関する。

3D(Dimension)画像等の複数の視点の画像を符号化する符号化方式としては、例えば、AVC(Advanced Video Coding)(H.264/AVC)方式を拡張したMVC(Multiview Video Coding)方式等がある。

MVC方式では、符号化対象となる画像は、被写体からの光に対応する値を、画素値として有する色画像であり、複数の視点の色画像それぞれは、必要に応じて、その視点の色画像の他、他の視点の色画像をも参照して、符号化される。

すなわち、MVC方式では、複数の視点の色画像のうちの、１つの視点の色画像が、ベースビュー(Base View)の画像とされ、他の視点の色画像は、ディペンデントビュー(Dependent View)の画像とされる。

そして、ベースビューの画像（色画像）は、そのベースビューの画像のみを参照して符号化され、ディペンデントビューの画像（色画像）は、そのディペンデントビューの画像の他、他のディペンデントビューの画像をも必要に応じて参照して、符号化される。

ところで、近年においては、複数の視点の画像として、各視点の色画像の他に、各視点の色画像の画素ごとの視差に関する視差情報を、画素値として有する視差情報画像（デプス画像）を採用し、各視点の色画像と各視点の視差情報画像とを符号化する符号化方式として、例えば、MPEG3DV方式等の規格が策定されつつある。

MPEG3DV方式では、各視点の色画像と、各視点の視差情報画像とのそれぞれが、原則として、MVC方式と同様にして符号化されるが、視差情報画像については、符号化効率の向上等を目的として、種々の符号化方法が提案されている（例えば、非特許文献１を参照）。

Jin Young Lee, Hochen Wey, and Du-Sik Park, "A NOVEL APPROACH FOR EFFICIENT MULTI-VIEW DEPTH MAP CODING", 28th Picture Coding Symposium, PCS2010, December 8-10, 2010, Nagoya, Japan

複数の視点の画像としての、複数の視点の色画像や、複数の視点の視差情報画像については、符号化効率の向上の他、復号画像の画質の向上を考慮した符号化方法（及び復号方法）の提案が要請されている。

本技術は、このような状況に鑑みてなされたものであり、複数の視点の画像について、復号画像の画質を向上させることができるようにするものである。

本技術の第１の側面の画像処理装置、又は、プログラムは、第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成するワーピング部と、前記第２の視点の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスを取得し、その参照インデクスに基づいて、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、前記参照ピクチャを選択する参照ピクチャ選択部とを備える画像処理装置、又は、画像処理装置として、コンピュータを機能させるためのプログラムである。

本技術の第１の側面の画像処理方法は、第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成し、前記第２の視点の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスを取得し、その参照インデクスに基づいて、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、前記参照ピクチャを選択するステップを含む画像処理方法である。

以上のような第１の側面においては、第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャが生成される。そして、前記第２の視点の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスが取得され、その参照インデクスに基づいて、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、前記参照ピクチャが選択される。

本技術の第２の側面の画像処理装置、又は、プログラムは、第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成するワーピング部と、前記第２の視点の画像のピクチャの符号化対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャの候補であって、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補それぞれについて、前記対象ブロックの符号化に要する符号化コストを算出するコスト算出部と、前記符号化コストに基づいて、前記参照ピクチャの候補それぞれに割り当てられている参照インデクスの中から、前記対象ブロックの符号化に用いる参照ピクチャの候補に割り当てられている参照インデクスを選択して出力する選択部とを備える画像処理装置、又は、画像処理装置として、コンピュータを機能させるためのプログラムである。

本技術の第２の側面の画像処理方法は、第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成し、前記第２の視点の画像のピクチャの符号化対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャの候補であって、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補それぞれについて、前記対象ブロックの符号化に要する符号化コストを算出し、前記符号化コストに基づいて、前記参照ピクチャの候補それぞれに割り当てられている参照インデクスの中から、前記対象ブロックの符号化に用いる参照ピクチャの候補に割り当てられている参照インデクスを選択して出力するステップを含む画像処理方法である。

以上のような第２の側面においては、第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャが生成される。さらに、前記第２の視点の画像のピクチャの符号化対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャの候補であって、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補それぞれについて、前記対象ブロックの符号化に要する符号化コストが算出される。そして、前記符号化コストに基づいて、前記参照ピクチャの候補それぞれに割り当てられている参照インデクスの中から、前記対象ブロックの符号化に用いる参照ピクチャの候補に割り当てられている参照インデクスが選択されて出力される。

なお、画像処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

また、プログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

本技術によれば、復号画像の画質を向上させることができる

視点情報画像の符号化方法の一例を説明する図である。視点情報画像の符号化方法の一例を説明する図である。本技術の概要を説明する図である。ワープド視差情報画像D'#1、及び、視差情報画像D#1のうちの、ワープド視差情報画像D'#1が、参照ピクチャとして選択されやすいことを説明する図である。本技術を適用した多視点画像エンコーダの一実施の形態の構成例を示すブロック図である。多視点画像エンコーダにおいて符号化の対象となる複数の視点の画像を生成する多視点画像生成装置の構成例を示すブロック図である。 MVC方式の予測符号化において、予測画像を生成するときに参照するピクチャを説明する図である。 MVC方式でのピクチャの符号化（及び復号）順を説明する図である。エンコーダ１１の構成例を示すブロック図である。 MVC(AVC)方式のマクロブロックタイプを説明する図である。 MVC(AVC)方式の予測ベクトル(PMV)を説明する図である。 MVC(AVC)方式のスキップマクロブロックの予測ベクトルを説明する図である。エンコーダ２２の構成例を示すブロック図である。 DPB３１に記憶されるデコード視差画像と、ワープドピクチャバッファ２３２に記憶されるワープド視差画像とを説明する図である。視差予測部２３４の構成例を示すブロック図である。ビュー#2の視差画像D#2を符号化する符号化処理を説明するフローチャートである。視差予測処理を説明するフローチャートである。本技術を適用した多視点画像デコーダの一実施の形態の構成例を示すブロック図である。デコーダ３１１の構成例を示すブロック図である。デコーダ３２２の構成例を示すブロック図である。視差予測部４６３の構成例を示すブロック図である。ビュー#2の視差画像D#2の符号化データを復号する復号処理を説明するフローチャートである。視差予測処理を説明するフローチャートである。色画像を対象とするワープド参照割り当て方式を説明する図である。ワープド参照割り当て方式で色画像C#2を符号化するエンコーダ１２の構成例を示すブロック図である。視差予測部５３４の構成例を示すブロック図である。ビュー#2の色画像C#2を符号化する符号化処理を説明するフローチャートである。視差予測処理を説明するフローチャートである。ワープド参照割り当て方式で色画像C#2を復号するデコーダ３１２の構成例を示すブロック図である。視差予測部６６３の構成例を示すブロック図である。ビュー#2の色画像C#2の符号化データを復号する復号処理を説明するフローチャートである。視差予測処理を説明するフローチャートである。時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式を説明する図である。時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式で、視差画像#2を符号化するエンコーダ２２の構成例を示すブロック図である。参照インデクス割り当て部７０１の構成例を示すブロック図である。予測精度に基づいて、候補ピクチャに、参照インデクスを割り当てる方法を説明する図である。時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式で、視差画像#2の符号化データを復号するデコーダ３２２の構成例を示すブロック図である。視差と奥行きについて説明する図である。本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。本技術を適用したテレビジョン装置の概略構成例を示す図である。本技術を適用した携帯電話機の概略構成例を示す図である。本技術を適用した記録再生装置の概略構成例を示す図である。本技術を適用した撮像装置の概略構成例を示す図である。

[本明細書におけるデプス画像（視差情報画像）の説明]
図３８は、視差と奥行きについて説明する図である。

図３８に示すように、被写体Ｍのカラー画像が、位置Ｃ１に配置されたカメラｃ１と位置Ｃ２に配置されたカメラｃ２により撮影される場合、被写体Ｍの、カメラｃ１（カメラｃ２）からの奥行方向の距離である奥行きＺは、以下の式（ａ）で定義される。

・・・（ａ）

なお、Ｌは、位置Ｃ１と位置Ｃ２の水平方向の距離（以下、カメラ間距離という）である。また、ｄは、カメラｃ１で撮影されたカラー画像上の被写体Ｍの位置の、カラー画像の中心からの水平方向の距離ｕ１から、カメラｃ２で撮影されたカラー画像上の被写体Ｍの位置の、カラー画像の中心からの水平方向の距離ｕ２を減算した値、即ち視差である。さらに、fは、カメラｃ１の焦点距離であり、式（ａ）では、カメラｃ１とカメラｃ２の焦点距離は同一であるものとしている。

式（ａ）に示すように、視差ｄと奥行きＺは、一意に変換可能である。従って、本明細書では、カメラｃ１とカメラｃ２により撮影された２視点のカラー画像の視差ｄを表す画像と奥行きＺを表す画像とを総称して、デプス画像（視差情報画像）とする。

なお、デプス画像（視差情報画像）は、視差ｄまたは奥行きＺを表す画像であればよく、デプス画像（視差情報画像）の画素値としては、視差ｄまたは奥行きＺそのものではなく、視差ｄを正規化した値、奥行きＺの逆数１／Ｚを正規化した値等を採用することができる。

視差ｄを8bit（0〜255）で正規化した値Ｉは、以下の式（ｂ）により求めることができる。なお、視差dの正規化ビット数は8bitに限定されず、10bit,12bitなど他のビット数にすることも可能である。

なお、式（ｂ）において、Ｄ_ｍａｘは、視差ｄの最大値であり、Ｄ_ｍｉｎは、視差ｄの最小値である。最大値Ｄ_ｍａｘと最小値Ｄ_ｍｉｎは、１画面単位で設定されてもよいし、複数画面単位で設定されてもよい。

また、奥行きＺの逆数１／Ｚを8bit（0〜255）で正規化した値ｙは、以下の式（ｃ）により求めることができる。なお、奥行きＺの逆数１／Ｚの正規化ビット数は8bitに限定されず、10bit,12bitなど他のビット数にすることも可能である。

なお、式（ｃ）において、Ｚ_ｆａｒは、奥行きＺの最大値であり、Ｚ_ｎｅａｒは、奥行きＺの最小値である。最大値Ｚ_ｆａｒと最小値Ｚ_ｎｅａｒは、１画面単位で設定されてもよいし、複数画面単位で設定されてもよい。

このように、本明細書では、視差dと奥行きZとは一意に変換可能であることを考慮して、視差ｄを正規化した値Iを画素値とする画像と、奥行きＺの逆数１／Ｚを正規化した値yを画素値とする画像とを総称して、デプス画像（視差情報画像）とする。ここでは、デプス画像（視差情報画像）のカラーフォーマットは、YUV420又はYUV400であるものとするが、他のカラーフォーマットにすることも可能である。

なお、デプス画像（視差情報画像）の画素値としてではなく、値I又は値yの情報自体に着目する場合には、値I又は値yを、デプス情報（視差情報）とする。更に、値I又は値yをマッピングしたものをデプスマップとする。

以下、図面を参照して、本技術の一実施の形態について説明するが、その前に、前段階の準備として、複数の視点の視点情報画像を符号化する符号化方法に関し、既に提案されている符号化方法の一例を説明する。

［複数の視点の視点情報画像の符号化方法の一例］

図１は、非特許文献１において提案されている視点情報画像の符号化方法の一例を説明する図である。

ここで、以下に説明する、既に提案されている符号化方法を、提案済み方法ともいう。また、視点を、以下、ビューともいう

いま、複数の視点の画像として、（異なる）２つの視点（ビュー）の色画像であるビュー#1の色画像C#1、及び、ビュー#2の色画像C#2、並びに、２つの視点の視差情報画像であるビュー#1の視差情報画像D#1、及び、ビュー#2の視差情報画像D#2があるとする。

なお、視差情報画像D#i（ここでは、i=1,2）は、色画像C#iの画素ごとの視差に関する視差情報を、画素値として有する画像である。

提案済み方法では、色画像C#1及びC#2は、例えば、MVC方式で符号化される。したがって、色画像C#1及びC#2のピクチャは、必要に応じて、他のピクチャを参照して予測符号化されるので、符号化後に、予測符号化に用いる予測画像を生成するために、ローカルデコードされる。

いま、ビュー#2の視差情報画像D#2のある第tピクチャのあるブロック（マクロブロック）が符号化対象の対象ブロックであるとする。

ここで、対象ブロックを有するピクチャ、つまり、符号化対象のピクチャを、対象ピクチャともいう。

ビュー#2の視差情報画像D#2の第tピクチャ（先頭からt番目のピクチャ）のマクロブロックである、例えば、ブロックMBD#21やMBD#22等を対象ブロックとして、その対象ブロックの符号化が行われる場合、提案済み方法では、そのビュー#2とは異なるビュー#1の色画像C#1の、既に（符号化されて）ローカルデコードされている第tピクチャをワーピングすることにより、その色画像C#1の第tピクチャを視点#2で得られる画像に変換したワープド色画像C'#1のピクチャが生成される。

同様に、ビュー#1の視差情報画像D#1についても、既にローカルデコードされている第tピクチャをワーピングすることにより、その視差情報画像D#1の第tピクチャを視点#2で得られる画像に変換したワープド視差情報画像（ワープドデプス画像）D'#1のピクチャが生成される。

ここで、ビュー#1の色画像C#1のワーピングでは、例えば、図１に白抜きの矢印で示すように、色画像C#1の各画素（値）が、各画素における視点#1と#2との間の視差に相当する分だけ移動されることで、ワープド色画像C'#1が生成される。

ところで、視点#1の色画像C#1と、視点#2の色画像C#2とでは、色画像#2には写っているが、色画像#1には写っていない部分（や、色画像#1には写っているが、色画像#2には写っていない部分）がある。

このため、色画像C#1の各画素を、各画素における視点#1と#2との間の視差に相当する分だけ移動しただけでは、オクルージョンが生じる。

すなわち、ワープド色画像C'#1において、色画像#2には写っているが、色画像#1には写っていない部分は、いわば、画素値がない、穴が空いたオクルージョン部分となる。図１において、斜線を付してある部分が、オクルージョン部分を示している。

例えば、視点#2からは見えるが、視点#1からでは、視差によって、前景に隠されてしまう背景の部分が、オクルージョン部分となる。

ワープド色画像C'#1において、オクルージョン部分の画素は、周辺の画素、すなわち、例えば、ワーピングでの移動方向の逆方向にある（オクルージョン部に）最も近い画素等の画素値によって補間される。

ワープド視差情報画像D'#1についても、同様である。

提案済み方法では、ビュー#2の視差情報画像D#2の第tピクチャの対象ブロックである、例えば、ブロックMBD#21と同一の位置（及びサイズ）の、ビュー#2の色画像C#2の第tピクチャのブロックMBC#21が検出される。

さらに、そのブロックMBC#21と同一の位置の、ワープド色画像C'#1のピクチャ（第tピクチャ）のブロックMBC'#11が検出され、色画像C#2のブロックMBC#21の、ワープド色画像C'#1のブロックMBC'#11に対する残差に対応する値である、例えば、SAD(Sum of Absolute Differences)が求められる。

そして、ブロックMBC#21とMBC'#11とのSADが所定の閾値以下である場合、視差情報画像D#2の対象ブロックであるブロックMBD#21は、ワープド視差情報画像D'#1に対するスキップマクロブロックとして符号化される。

したがって、この場合、視差情報画像D#2のブロックMBD#21の復号では、そのブロックMBD#21と同一の位置の、ワープド視差情報画像D'#1のブロックMBD'#11（のコピー）が、ブロックMBD#21の復号結果とされる。

一方、ブロックMBC#21とMBC'#11とのSADが所定の閾値以下でないる場合、視差情報画像D#2の対象ブロックであるブロックMBD#21は、視差情報画像D#1（のピクチャ）を参照ピクチャとして、予測符号化される。

すなわち、提案済み方法では、例えば、ME(Motion Estimation)（動き検出）によって、参照ピクチャである視差情報画像D#1（のピクチャ）において、対象ブロックであるブロックMBD#21とのSADを最小にするブロック（以下、対応ブロックともいう）との位置のずれを表すベクトルであるずれベクトル（視差ベクトル）が検出される。

さらに、提案済み方法では、ずれベクトルに基づいて、MC(Motion Compensation)（動き補償）を行うことで、予測画像が生成され、すなわち、参照ピクチャである視差情報画像D#1において、対象ブロックであるブロックMBD#21の位置から、ずれベクトルだけずれた位置のブロック、つまり、対応ブロックが、予測画像として取得され、その予測画像を用いて、対象ブロックであるブロックMBD#21が符号化される。

すなわち、対象ブロックであるブロックMBD#21の、予測画像に対する残差が求められ、その残差が、対象ブロックであるブロックMBD#21のずれベクトル（MEで検出されたベクトル）とともに、符号化される。

ここで、ずれベクトル（視差ベクトル、動きベクトル）に基づいて、予測画像を生成することを、ずれ予測（視差予測、動き予測）、又は、ずれ補償（視差補償、動き補償）ともいう。なお、ずれ予測には、必要に応じて、ずれベクトルの検出が含まれる。

図１では、符号化対象の視差情報画像D#2のブロックMBD#21については、そのブロックMBD#21と同一の位置の、ビュー#2の色画像C#2のブロックMBC#21と、ワープド色画像C'#1のブロックMBC'#11とのSADが、所定の閾値以下になっており、そのため、ブロックMBD#21は、ワープド視差情報画像D'#1の、例えば、ブロックMBD#21と同一の位置のブロックMBD'#11に対するスキップマクロブロックとして符号化されている。

また、符号化対象の視差情報画像D#2のブロックMBD#22については、そのブロックMBC#22と同一の位置の、ビュー#2の色画像C#2のブロックMBC#22と、ワープド色画像C'#1のブロックMBC'#12とのSADが、所定の閾値以下になっておらず、そのため、ブロックMBC#22は、視差情報画像D#1を参照ピクチャとし、その参照ピクチャである視差情報画像D#1の、ブロックMBC#22に対応する対応ブロックであるブロックMBD#12を予測画像として、予測符号化されている。

図２は、提案済み方法をさらに説明する図である。

提案済み方法では、図１で説明したように、ビュー#2の視差情報画像D#2の符号化において、ビュー#1の色画像C#1をワーピングすることにより、ワープド色画像C'#1が生成されるとともに、ビュー#1の視差情報画像D#1をワーピングすることにより、ワープド視差情報画像D'#1が生成される。

そして、ワープド色画像C'#1、及び、ワープド視差情報画像D'#1においては、オクルージョンが生じることがあり、そのオクルージョンが生じているオクルージョン部分については、例えば、ワーピングでの移動方向の逆方向にある、オクルージョン部分に最も近い画素等の画素値が補間される。

ここで、視点#1及び#2の色画像が、例えば、背景の手前に、前景としての物体が写っている画像である場合、視点#2の色画像に写っている背景のうちの、視点#1からでは、前景に隠れて見えない部分が、視点#1の色画像C#1をワーピングすることにより得られるワープド色画像C'#1において、オクルージョン部分となる。

視点#1の視差情報画像D#1をワーピングすることにより得られるワープド視差情報画像D'#1についても同様である。

上述の場合、オクルージョン部分は、背景であり、ワーピングでの移動方向の逆方向にある、オクルージョン部分に最も近い画素も背景（の画素）である。

そして、視差情報画像において、背景が写っている、近い位置にある２つの画素の画素値としての視差情報は、背景の奥行き方向の距離が急峻に変化していない限り、（ほぼ）同一の値となるので、視点#1の視差情報画像D#1をワーピングすることにより得られるワープド視差情報画像D'#1については、オクルージョン部分の周辺の画素、すなわち、例えば、ワーピングでの移動方向の逆方向にある、オクルージョン部分に最も近い画素によって、オクルージョン部分を補間した場合に、そのオクルージョン部分と、視差情報画像D#2の、オクルージョン部分と同一の位置の部分との相関は、高いことが多い。

一方、色画像において、背景が写っている、近い位置にある２つの画素の画素値としての色は、背景のテクスチャによって大きく異なることがあるため、視点#1の色画像C#1をワーピングすることにより得られるワープド色画像C'#1については、オクルージョン部分の周辺の画素によって、オクルージョン部分を補間した場合に、そのオクルージョン部分と、色画像C#2の、オクルージョン部分と同一の位置の部分との相関は、高くならないことが多い。

このため、図２に示すように、視差情報画像D#2の対象ブロックが、ワープド色画像C'#1のオクルージョン部分（の一部）を含むブロックMBC'#12と同一の位置のブロックMBD#22である場合、そのブロックMBD#22と同一の位置の、色画像C#2のブロックMBC#22と、ワープド色画像C'#1の、オクルージョン部分を含むブロックMBC'#12とのSADは、所定の閾値以下にならず、その結果、対象ブロックであるブロックMBD#22は、視差情報画像D#1を参照ピクチャとして、予測符号化される。

視差情報画像D#2において、ワープド色画像C'#1のオクルージョン部分（の一部）を含む位置になるブロックについては、ブロックMBD#22と同様に、視差情報画像D#1を参照ピクチャとして、予測符号化される。

そして、視差情報画像D#2の対象ブロックが予測符号化される場合、視差情報画像D#2の対象ブロックと、その対象ブロックに対応する、参照ピクチャの対応ブロックとのずれを表す、（多くの場合、0ベクトルでない）ずれベクトル（MEで検出される視差ベクトル）が発生する。

提案済み方法では、図１で説明したように、仮に、視差情報画像D#2の対象ブロックであるブロックMBC#22と同一の位置の、色画像C#2のブロックMBC#22と、ワープド色画像C'#1のブロックMBC'#12とのSADが、所定の閾値以下である場合には、対象ブロックであるブロックMBC#22は、ワープド視差情報画像D'#1に対するスキップマクロブロックとして符号化される。

スキップマクロブロックについては、残差が符号化されないので、色画像C#2のブロックMBC#22と、ワープド色画像C'#1のブロックMBC'#12とのSADが、所定の閾値以下である場合に、対象ブロックであるブロックMBD#22が、必ずスキップマクロブロックとされる提案済み方法では、符号化データのビットレートに余裕があっても、スキップマクロブロックとされる対象ブロックMBD#22について、復号画像の画質を、一定画質以上に向上させることができない。

また、提案済み方法では、視差情報画像D#2の対象ブロックの符号化に、視差情報画像D#1、及び、ワープド視差情報画像D'#1のうちのいずれを用いるかの判定を、マクロブロックレイヤで行うために、すなわち、対象ブロックと同一の位置の、ワープド色画像C'#1のブロック（マクロブロック）と、色画像C#2のブロック（マクロブロック）とのSADを用いて行うために、色画像C#1及びC#2、並びに、視差情報画像D#1及びD#2の符号化を、例えば、MVC方式等の既存の符号化方式を利用して行う場合には、デコーダ側において、対象ブロックの復号に、視差情報画像D#1、及び、ワープド視差情報画像D'#1のうちのいずれを用いるかを判定するのに、マクロブロックレイヤを変更しなければならず、既存の符号化方式の大きな変更を要する。

さらに、提案済み方法では、視差情報画像D#2の対象ブロックの符号化に、視差情報画像D#1、及び、ワープド視差情報画像D'#1のうちのいずれを用いるかの判定を、ローカルデコード後の色画像C#1をワーピングすることにより生成されるワープド色画像C'#1を用いて行うので、視差情報画像D#2の符号化（及び復号）のために、ワープド色画像C'#1を生成するのに用いる（ローカル）デコード後の色画像C#1を、（ローカル）デコード後の画像を記憶するバッファであるDPB(Decode Picture Buffer)に記憶しておく必要がある。

その結果、DPBとして、記憶容量の大きなバッファが必要となる。

そこで、本技術では、（ローカルデコード後の）視差情報画像D#1をワーピングすることにより生成されるワープド視差情報画像D'#1（のピクチャ）を、少なくとも、参照インデクスが割り当てられる参照ピクチャの候補として用いて、視差情報画像D#2の対象ブロックが予測符号化される。

［本技術の概要］

図３は、本技術の概要を説明する図である。

図３では、視差情報画像D#2の対象ブロックの符号化にあたって、（ローカルデコード後の）視差情報画像D#1をワーピングすることにより生成されるワープド視差情報画像D'#1（のピクチャ）と、視差情報画像D#1（のピクチャ）とが、参照ピクチャとなりうるピクチャとされている。

ワープド視差情報画像D'#1（のピクチャ）を参照ピクチャとする場合には、ずれベクトル（視差ベクトル）が0ベクトルであると仮定して、MCによって、視差情報画像D#2の対象ブロックであるブロックMBD#21の位置から、ずれベクトルだけずれた位置のブロック、つまり、対象ブロックMBD#21と同一の位置のブロックMBD'#11が、予測画像として取得される。

そして、例えば、対象ブロックMBD#21の、予測画像であるブロックMBD'#11との残差に対応する値であるSADと、ずれベクトルの符号量に対応する値MVとを用いて、ワープド視差情報画像D'#1を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コストCOST=COST1'が、式（１）に従って算出される。

COST＝SAD＋λMV
・・・（１）

なお、式（１）において、λは、ずれベクトルの符号量に対応する値MVに対する重みであり、残差の量子化ステップに応じて設定される。

ここで、ワープド視差情報画像D'#1は、視点#1の視差情報画像D#1を、視点#2から見た画像に変換した画像であり、視点#2の視差情報画像D#2との間に、視差がない（視差補償がされている）と推定することができるので、ずれベクトルとして、0ベクトルが仮定される。

ワープド視差情報画像D'#1について、ずれベクトルが0ベクトルであると仮定する場合、その0ベクトルであるずれベクトルについては、ずれベクトルの符号量、ひいては、その符号量に対応する値MVとしては、０（又は、０に近い小さい値）を採用することができる。

すなわち、いま、ずれベクトルの符号量が、すれベクトル（、又は、ずれベクトルと後述する予測ベクトルとの差分のベクトル）の大きさに比例することとすると、0ベクトルであるずれベクトルについては、ずれベクトルの符号量に対応する値MVとしては、０（又は、０に近い小さい値）を採用することができる。

この場合、ワープド視差情報画像D'#1を参照ピクチャとして用いて、対象ブロックMBD#21を符号化するときの符号化コストCOST1'は、式COST1'＝SAD＋λ×０＝SADで表される。

なお、ここでは、ワープド視差情報画像D'#1について、ずれベクトルとして、0ベクトルを採用したが、ワープド視差情報画像D'#1については、対象ブロックMBD#21との間で、MEを行って、すれベクトルを検出してもよい。

一方、視差情報画像D#1（のピクチャ）を参照ピクチャとする場合には、対象ブロックMBD#21と、視差情報画像D#1との間で、MEを行うことによって、ずれベクトル（視差ベクトル）が検出される。

さらに、MCによって、視差情報画像D#1において、対象ブロックMBD#21の位置から、ずれベクトルだけずれた位置のブロック（対応ブロック）MBD#11が、予測画像として取得される。

そして、対象ブロックMBD#21の、予測画像であるブロックMBD#11との残差に対応する値であるSADと、ずれベクトルの符号量に対応する値MVとを用いて、視差情報画像D#1を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コストCOST=COST1が、式（１）に従って算出される。

以上のように、ワープド視差情報画像D'#1を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コスト（ワープド視差情報画像D'#1についての符号化コスト）COST1'と、視差情報画像D#1を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コスト（視差情報画像D#1についての符号化コスト）COST1との算出後、その符号化コストCOST1'及びCOST1に基づいて、ワープド視差情報画像D'#1、及び、視差情報画像D#1のうちの、符号化コストが小さい方が、対象ブロックMBD#21の符号化に用いる参照ピクチャとして選択される。

ここで、例えば、MVC(AVC)では、対象ブロックの符号化において参照ピクチャとなりうる１以上のピクチャ（参照ピクチャの候補）に、各ピクチャを区別するための参照インデクスref_idxが割り当てられる。

複数の視点の画像を、MVCのように、参照ピクチャの候補それぞれに、参照インデクスを割り当てて符号化を行う符号化方式を利用して符号化することとすると、図３において、参照ピクチャの候補（以下、候補ピクチャともいう）は、ワープド視差情報画像D'#1、及び、視差情報画像D#1（のピクチャ）であり、そのワープド視差情報画像D'#1、及び、視差情報画像D#1それぞれには、参照インデクスref_idxが割り当てられる。

図３では、ワープド視差情報画像D'#1には、値が0（第１の値）の参照インデクスref_idxが割り当てられ、視差情報画像D#1には、値が1（第２の値）の参照インデクスref_idxが割り当てられている。

ワープド視差情報画像D'#1、及び、視差情報画像D#1のうちの、符号化コストが小さい方が、対象ブロックMBD#21の符号化に用いる参照ピクチャとして選択されると、その参照ピクチャを用いて生成された予測画像に対する対象ブロックMBD#21の残差（残差画像）が求められ、その残差、予測画像を求めるのに用いたずれベクトル（視差ベクトル）に関するずれベクトル情報、及び、予測画像を求めるのに用いた参照ピクチャに割り当てられている参照インデクスref_idxが符号化される。

以上のように、図３では、ワープド視差情報画像D'#1、及び、視差情報画像D#1のうちのいずれが参照ピクチャとして選択されても、その参照ピクチャを用いて生成された予測画像に対する対象ブロックMBD#21の残差が符号化されるので、その残差に割り当てる符号量を調整することで、視差情報画像D#2の復号画像の画質を向上させることが可能となる。

すなわち、提案済み方法では、図１で説明したように、対象ブロックの符号化に、ワープド視差情報画像D'#1を用いる場合には、対象ブロックは、必ず、スキップマクロブロックとされるため、対象ブロックの残差が符号化されることはない。

一方、図３では、ワープド視差情報画像D'#1が、参照ピクチャとして選択された場合、その参照ピクチャを用いて生成された予測画像に対する対象ブロックの残差が符号化される（符号化されうる）ので、符号化データのビットレートに余裕がある場合には、その残差に多くの符号量を割り当てることで、復号画像の画質を向上させることができる。

なお、MVCでは、値が0の参照インデクスが割り当てられた参照ピクチャを用いて、対象ブロックの符号化を行う場合には、対象ブロックを、スキップマクロブロックとすることができる。

したがって、図３に示したように、ワープド視差情報画像D'#1に、値が0の参照インデクスref_idxを割り当てることで、ワープド視差情報画像D'#1が、参照ピクチャとして選択された場合には、対象ブロックを、スキップマクロブロックとして符号化することもできる。

また、図３では、参照インデクスref_idxが符号化されるので、デコーダ側において、対象ブロックの復号に、ワープド視差情報画像D'#1、及び、視差情報画像D#1のうちのいずれを参照ピクチャとして用いるのかを、参照インデクスref_idxによって判定することができるので、提案済み方法のように、マクロブロックレイヤ（以下）を変更する必要がなく、したがって、MVC等の既存の符号化方式を大きく変更することなく、その既存の符号化方式を利用して行うことができる。

さらに、図３では、視差情報画像D#2の対象ブロックを符号化するときに参照する参照ピクチャの選択にあたって、提案済み方法のように、色画像を用いることはないので、視差情報画像D#2の対象ブロックの符号化のために、ローカルデコード後の色画像を、DPBに記憶しておく必要はなく、その分、提案済み方法の場合に比較して、DPBとして、記憶容量の小さなバッファを採用することができる。

また、図３の場合には、候補ピクチャに、ワープド視差情報画像D'#1が含まれ、そのワープド視差情報画像D'#1に、値が0の参照インデクスref_idxが割り当てられるので、提案済み方法に比較して、符号化効率を向上させることができる。

ここで、MVC(AVC)では、参照インデクスref_idxとしては、0を最小値とする整数が用いられる。

さらに、MVCでは、値が0の参照インデクスref_idxの符号量は、他の値の参照インデクスref_idxの符号量よりも少ない。

したがって、複数の視点の画像を、例えば、MVCを利用して符号化する場合には、候補ピクチャの中で、より参照ピクチャとして選択されやすい候補ピクチャに、値が0の参照インデクスref_idxを割り当てることで、符号量を小さくし、符号化効率を向上させることができる。

図３では、候補ピクチャは、ワープド視差情報画像D'#1、及び、視差情報画像D#1であり、ワープド視差情報画像D'#1に、値が0の参照インデクスref_idxが、視差情報画像D#1に、値が0の参照インデクスref_idxが、それぞれ割り当てられている。

そして、候補ピクチャであるワープド視差情報画像D'#1、及び、視差情報画像D#1のうちの、ワープド視差情報画像D'#1は、参照ピクチャとして選択されやすく、そのようなワープド視差情報画像D'#1に、値が0の参照インデクスref_idxが割り当てられているので、符号化効率を向上させることができる。

図４は、ワープド視差情報画像D'#1、及び、視差情報画像D#1のうちの、ワープド視差情報画像D'#1が、参照ピクチャとして選択されやすいことを説明する図である。

ワープド視差情報画像D'#1は、上述したように、（ローカルデコード後の）視差情報画像D#1をワーピングすることにより生成される、視点#2で得られる（視点#2で得られるであろう）視差情報画像である。

そのため、視点#2の視差情報画像D#2の対象ブロックと、その対象ブロックと同一の位置の、ワープド視差情報画像D'#1のブロックとのSADは、多くの場合、小さな値となる。

ワープド視差情報画像D'#1（のピクチャ）を参照ピクチャとして、対象ブロックを符号化する場合には、ずれベクトルが0ベクトルであると仮定して、MCによって、視差情報画像D#2の対象ブロックの位置から、ずれベクトルだけずれた位置のブロック（対応ブロック）、つまり、対象ブロックと同一の位置のブロックが、予測画像として取得される。

したがって、ワープド視差情報画像D'#1を参照ピクチャとする場合には、その対象ブロックと予測画像とのSADは、多くの場合、小さな値となる。

さらに、ワープド視差情報画像D'#1については、ずれベクトルとして、0ベクトルを仮定して、図３で説明したように、ずれベクトルの符号量に対応する値MVとして、０を採用して、符号化コストCOST1'＝SAD＋λ×０＝SADが計算される。

したがって、ワープド視差情報画像D'#1についての符号化コストCOST1'は、ずれベクトルの符号量に対応する値MVが、必ずしも０ではない、視差情報画像D#1についての符号化コストCOST1＝SAD＋λMVに比較して、小さくなりやすい。

その結果、ワープド視差情報画像D'#1、及び、視差情報画像D#1については、ワープド視差情報画像D'#1の方が、視差情報画像D#1よりも、参照ピクチャとして選択されやすい。

以上のように、参照ピクチャとして選択されやすいワープド視差情報画像D'#1に、値が0の参照インデクスref_idxを割り当てることで、符号化効率を向上させることができる。

また、ワープド視差情報画像D'#1の生成では、視差情報画像D#1がワーピングされるが、そのワーピングによって、オクルージョン部分が生じる。

ワープド視差情報画像D'#1において、オクルージョン部分は、図２で説明したように、オクルージョン部分の周辺の画素によって補間されるが、このオクルージョン部分と、視差情報画像D#2の、オクルージョン部分と同一の位置の部分との相関は、高いことが多い。

したがって、視差情報画像D#2の対象ブロックが、図４に示すように、ワープド視差情報画像D'#1のオクルージョン部分（の一部）を含むブロックMBD'#22と同一の位置のブロックMBD#22である場合であっても、対象ブロックMBD#22と、ワープド視差情報画像D'#1を参照ピクチャとしたときの予測画像とのSAD、つまり、対象ブロックMBD#22と、その対象ブロックMBD#22と同一の位置の、ワープド視差情報画像D'#1のブロックMBD'#22とのSADは、小さくなりやすい。

よって、視差情報画像D#2の対象ブロックが、ワープド視差情報画像D'#1のオクルージョン部分を含むブロックMBD'#22と同一の位置のブロックMBD#22である場合であっても、ワープド視差情報画像D'#1についての符号化コストは小さくなりやすい。したがって、ワープド視差情報画像D'#1が、参照ピクチャとして選択されやすいので、そのようなワープド視差情報画像D'#1に、値が0の参照インデクスを割り当てることにより、符号化効率を向上させることができる。

また、ワープド視差情報画像D'#1が、参照ピクチャとして選択される場合には、ずれベクトルが0ベクトルであると仮定されるので、（0ベクトルでない）ずれベクトルが発生しない。

なお、色画像については、図２で説明したように、ワープド色画像のオクルージョン部分と、そのワープド色画像のワーピング前の色画像の、オクルージョン部分と同一の位置の部分との相関は、高くならないことが多い。

その結果、視差情報画像D#2の対象ブロックの符号化に、視差情報画像D#1、及び、ワープド視差情報画像D'#1のうちのいずれを用いるかの判定を、ワープド色画像C'#1のブロックと、色画像C#2のブロックとのSADを用いて行う提案済み方法では、図２で説明したように、視差情報画像D#2の対象ブロックが、ワープド色画像C'#1のオクルージョン部分（の一部）を含むブロックMBC'#12と同一の位置のブロックMBD#22である場合に、その対象ブロックMBD#22と同一の位置の、色画像C#2のブロックMBC#22と、ワープド色画像C'#1の、オクルージョン部分を含むブロックMBC'#12とのSADは、所定の閾値以下にならず、その結果、対象ブロックであるブロックMBD#22は、視差情報画像D#1を参照ピクチャとして、予測符号化される（されやすい）。

すなわち、提案済み方法では、ワープド視差情報画像D'#1のオクルージョン部分を含むブロックMBD'#22と同一の位置の、視差情報画像D#2の対象ブロックMBD#22については、対象ブロックMBD#22と、その対象ブロックMBD#22と同一の位置の、ワープド視差情報画像D'#1のブロックMBD'#22とのSADが小さくても、色画像を用いて求められるSADが小さくならず（所定の閾値以下にならず）、視差情報画像D#1を参照ピクチャとして、予測符号化されやすい。

したがって、提案済み方法では、対象ブロックMBD#22と、視差情報画像D#1とを用いて行われるMEによって、（多くの場合、0ベクトルでない）ずれベクトルが発生する。

これに対して、本技術では、ワープド視差情報画像D'#1のオクルージョン部分を含むブロックMBD'#22と同一の位置の対象ブロックMBD#22については、対象ブロックMBD#22と、その対象ブロックMBD#22と同一の位置の、ワープド視差情報画像D'#1のブロックMBD'#22とのSADが小さければ、提案済み方法でMEによって発生するずれベクトルが発生しない。

なお、提案済み方法は、色画像への適用の可否は不明であるが、図３で説明した視差情報画像の符号化方法は、色画像にも適用することができる。

［本技術を適用した多視点画像エンコーダの一実施の形態］

図５は、本技術を適用した多視点画像エンコーダの一実施の形態の構成例を示すブロック図である。

図５の多視点画像エンコーダは、例えば、MVC方式を利用して、複数の視点の画像を符号化するエンコーダであり、以下では、MVC方式と同様の処理については、適宜、説明を省略する。

なお、多視点画像エンコーダは、MVC方式を利用するエンコーダに限定されるものではない。

また、以下では、複数の視点の画像として、２つの視点#1及び#2の色画像であるビュー#1の色画像C#1、及び、ビュー#2の色画像C#2、並びに、その２つの視点#1及び#2の視差情報画像であるビュー#1の視差情報画像D#1、及び、ビュー#2の視差情報画像D#2を採用することとする。

さらに、例えば、ビュー#1の色画像C#1、及び、視差情報画像D#1を、ベースビューの画像とし、残りのビュー#2の色画像C#2、及び、視差情報画像D#2を、ディペンデントビューの画像として扱うこととする。

なお、複数の視点の画像としては、３つ以上の視点の色画像、及び、視差情報画像を採用することができ、その３つ以上の視点の色画像、及び、視差情報画像のうちの、任意の１つの視点の色画像、及び、視差情報画像を、ベースビューの画像とし、残りの視点の色画像、及び、視差情報画像を、ディペンデントビューの画像として扱うことができる。

図５において、多視点画像エンコーダは、エンコーダ１１，１２，２１，２２，DPB３１、及び、多重化部３２を有する。

エンコーダ１１には、ビュー#1の色画像C#1と、視差関連情報（デプス関連情報）とが供給される。

ここで、視差関連情報（デプス関連情報）は、視差情報(デプス情報)のメタデータであり、その詳細については、後述する。

エンコーダ１１は、ビュー#1の色画像C#1を、必要に応じて、視差関連情報を用いて符号化し、その結果得られるビュー#1の色画像C#1の符号化データを、多重化部３２に供給する。

エンコーダ１２には、ビュー#2の色画像C#2と、視差関連情報とが供給される。

エンコーダ１２は、ビュー#2の色画像C#2を、必要に応じて、視差関連情報を用いて符号化し、その結果得られるビュー#2の色画像C#2の符号化データを、多重化部３２に供給する。

エンコーダ２１には、ビュー#1の視差情報画像D#1と、視差関連情報とが供給される。

エンコーダ２１は、ビュー#1の視差情報画像D#1を、必要に応じて、視差関連情報を用いて符号化し、その結果得られるビュー#1の視差情報画像D#1の符号化データを、多重化部３２に供給する。

エンコーダ２２には、ビュー#2の視差情報画像D#2と、視差関連情報とが供給される。

エンコーダ２２は、ビュー#2の視差情報画像D#2を、必要に応じて、視差関連情報を用いて符号化し、その結果得られるビュー#2の視差情報画像D#2の符号化データを、多重化部３２に供給する。

DPB３１は、エンコーダ１１，１２，２１、及び、２２それぞれで、符号化対象の画像を符号化し、ローカルデコードすることにより得られるローカルデコード後の画像（デコード画像）を、予測画像の生成時に参照する参照ピクチャ（の候補）として一時記憶する。

すなわち、エンコーダ１１，１２，２１、及び、２２は、符号化対象の画像を予測符号化する。そのため、エンコーダ１１，１２，２１、及び、２２は、予測符号化に用いる予測画像を生成するのに、符号化対象の画像を符号化した後、ローカルデコードを行って、デコード画像を得る。

DPB３１は、エンコーダ１１，１２，２１、及び、２２それぞれで得られるデコード画像を一時記憶する、いわば共用のバッファであり、エンコーダ１１，１２，２１、及び、２２それぞれは、DPB３１に記憶されたデコード画像から、符号化対象の画像を符号化するのに参照する参照ピクチャを選択する。そして、エンコーダ１１，１２，２１、及び、２２それぞれは、参照ピクチャを用いて、予測画像を生成し、その予測画像を用いて、画像の符号化（予測符号化）を行う。

DPB３１は、エンコーダ１１，１２，２１、及び、２２で共用されるので、エンコーダ１１，１２，２１、及び、２２それぞれは、自身で得られたデコード画像の他、他のエンコーダで得られたデコード画像をも参照することができる。

多重化部３２には、エンコーダ１１，１２，２１、及び、２２のそれぞれから符号化データが供給される他、視差関連情報が供給される。

多重化部３２は、エンコーダ１１，１２，２１、及び、２２のそれぞれからの符号化データ、さらには、そこに供給される視差関連情報を多重化し、その結果得られる多重化データを出力する。

多重化部３２が出力する多重化データは、図示せぬ記録媒体に記録され、又は、図示せぬ伝送媒体を介して伝送される。

［多視点画像生成装置］

図６は、図５の多視点画像エンコーダにおいて符号化の対象となる複数の視点の画像を生成する多視点画像生成装置の構成例を示すブロック図である。

多視点画像生成装置では、複数の視点としての、例えば、２つの視点の画像を撮影するために、２つのカメラ４１及び４２が、異なる視点の色画像を撮影することができる位置に設置されている。

ここで、本実施の形態では、説明を簡単にするために、カメラ４１及び４２は、ある水平面上の一直線上の異なる位置に、その直線に垂直な方向に光軸を向けて配置されていることとする。

カメラ４１は、そのカメラ４１が配置されている位置で、被写体を撮影し、動画像である色画像C#1を出力する。

さらに、カメラ４１は、他の任意の１つのカメラであるカメラ４２の位置を、基準の視点として、色画像C#1の各画素について、基準の視点に対する視差を表す視差ベクトルd1を出力する。

カメラ４２は、そのカメラ４２が配置されている位置で、被写体を撮影し、動画像である色画像C#2を出力する。

さらに、カメラ４２は、他の任意の１つのカメラであるカメラ４１の位置を、基準の視点として、色画像C#2の各画素について、基準の視点に対する視差を表す視差ベクトルd2を出力する。

ここで、色画像の横（水平）方向を、x軸とし、縦（垂直）方向を、y軸とする２次元平面を、色画像平面ということとすると、カメラ４１及び４２は、色画像平面に直交する平面（水平面）上の一直線上に配置されている。したがって、視差ベクトルd1及びd2は、y成分が0で、x成分が、カメラ４１及び４２の水平方向の位置関係等に対応する値のベクトルとなる。

なお、カメラ４１及び４２が出力する視差ベクトル（視差）d1及びd2を、後述する、MEによって求められる視差を表す視差ベクトルと区別するために、以下、撮影視差ベクトルd1及びd2ともいう。

カメラ４１が出力する色画像C#1、及び、撮影視差ベクトルd1、並びに、カメラ４２が出力する色画像C#2、及び、撮影視差ベクトルd2は、多視点画像情報生成部４３に供給される。

多視点画像情報生成部４３は、カメラ４１及び４２からの色画像C#1を、そのまま出力する。

また、多視点画像情報生成部４３は、カメラ４１からの撮影視差ベクトルd1から、色画像#1の画素ごとの視差に関する視差情報を求め、その視差情報を、画素値として有する視差情報画像D#1を生成して出力する。

さらに、多視点画像情報生成部４３は、カメラ４２からの撮影視差ベクトルd2から、色画像#2の画素ごとの視差に関する視差情報を求め、その視差情報を、画素値として有する視差情報画像D#2を生成して出力する。

上述したように、視差情報（デプス情報）としては、例えば、撮影視差ベクトルに対応する値である視差値（値Ｉ）や、被写体までの距離（奥行き）を表す奥行きＺの正規化後の値ｙがある。

いま、視差情報画像の画素値が、例えば、8ビットで表される0ないし255の整数値をとることとする。さらに、撮影視差ベクトル（のx成分）をdで表すとともに、（例えば、ピクチャや、１つのコンテンツとしての動画像等で）撮影視差ベクトル（のx成分）の最大値と最小値を、それぞれ、dmaxとdminと表すこととする。

この場合、視差値ν（値Ｉ）は、上述したように、例えば、撮影視差ベクトル（のx成分）dと、その最大値dmax（D_ｍａｘ）及び最小値dmin（Ｄ_ｍｉｎ）を用いて、式（２）に従って求められる。

ν＝255×(d-dmin)／(dmax-dmin)
・・・（２）

なお、式（２）の視差値νは、式（３）に従って、撮影視差ベクトル（のx成分）dに変換することができる。

d＝ν×(dmax-dmin)／255＋dmin
・・・（３）

また、奥行きＺは、カメラ４１及び４２が配置されている直線上から、被写体までの距離を表す。

カメラ４１については（カメラ４２についても同様）、カメラ４１と一直線上に配置されているカメラ４２との距離（基準の視点との距離）である基線長をLと、カメラ４１の焦点距離をfと、それぞれ表すこととすると、奥行きZは、撮影視差ベクトル（のx成分）d(d1)を用い、式（４）に従って求めることができる。

Z＝(L/d)×f
・・・（４）

視差情報である視差値νと奥行きZとは、式（４）に従って相互に変換することができるので、等価な情報である。

ここで、以下では、画素値として視差値νを有する視差情報画像（デプス画像）を、視差画像ともいい、画素値として、奥行きZの正規化後の値ｙを有する画像を、奥行き画像ともいう。

なお、以下では、視差情報画像として、視差画像、及び、奥行き画像のうちの、例えば、視差画像を用いることとするが、視差情報画像としては、奥行き画像を用いることも可能である。

多視点画像情報生成部４３は、以上の色画像#1及び#2、並びに、視差画像D#1及び#2の他に、視差関連情報を出力する。

すなわち、多視点画像情報生成部４３には、外部から、カメラ４１と４２との距離（カメラ４１及び４２それぞれと、基準の視点との距離）である基線長L、及び、焦点距離fが供給される。

多視点画像情報生成部４３は、カメラ４１からの撮影視差ベクトルd1、及び、カメラ４１からの撮影視差ベクトルd2のそれぞれについて、撮影視差ベクトル（のx成分）dの最大値dmax及び最小値dminを検出する。

そして、多視点画像情報生成部４３は、撮影視差ベクトルdの最大値dmax及び最小値dmin、並びに、基線長L、及び、焦点距離fを、視差関連情報として出力する。

多視点画像情報生成部４３が出力する色画像C#1及びC#2、視差画像D#1及びD#2、並びに、視差関連情報は、図５の多視点画像エンコーダに供給される。

なお、ここでは、説明を簡単にするため、カメラ４１及び４２を、色画像平面に直交する同一の平面上の一直線上に配置し、撮影視差ベクトルd（d1及びd2）が、y成分が0のベクトルであることとしたが、カメラ４１及び４２それぞれは、色画像平面に直交する異なる平面上に配置することができる。この場合、撮影視差ベクトルdは、x成分及びy成分とも、0以外の値になりうるベクトルとなる。

［MVC方式の概要］

図７は、MVC方式の予測符号化において、予測画像を生成するときに参照するピクチャを説明する図である。

いま、ベースビューの画像であるビュー#1の画像のピクチャを、（表示）時刻順に、p11,p12,p13,・・・と表すとともに、ディペンデントビューの画像であるビュー#2の画像のピクチャを、時刻順に、p21,p22,p23,・・・と表すこととする。

ベースビューのピクチャである、例えば、ピクチャp12は、そのベースビューのピクチャである、例えば、ピクチャp11やp13を、必要に応じて参照して、予測符号化される。

すなわち、ベースビューのピクチャp12については、そのベースビューの他の時刻のピクチャであるピクチャp11やp13のみを参照し、予測（予測画像の生成）を行うことができる。

また、ディペンデントビューのピクチャである、例えば、ピクチャp22は、そのディペンデントビューのピクチャである、例えば、ピクチャp21やp23、さらには、他のビューであるベースビューのピクチャp12を、必要に応じて参照して、予測符号化される。

すなわち、ディペンデントビューのピクチャp22は、そのディペンデントビューの他の時刻のピクチャであるピクチャp21やp23の他、他のビューのピクチャであるベースビューのピクチャp12を参照し、予測を行うことができる。

ここで、符号化対象のピクチャと同一のビューのピクチャを参照して行われる予測を、時間予測ともいい、符号化対象のピクチャと異なるビューのピクチャを参照して行われる予測を、視差予測ともいう。

以上のように、MVC方式では、ベースビューのピクチャについては、時間予測のみを行うことができ、ディペンデントビューのピクチャについては、時間予測と視差予測を行うことができる。

なお、MVC方式において、視差予測において参照する、符号化対象のピクチャと異なるビューのピクチャは、符号化対象のピクチャと同一の時刻のピクチャでなければならない。

図５の多視点画像エンコーダを構成するエンコーダ１１，１２，２１、及び、２２は、原則として、MVC方式に従って、予測（予測画像の生成）を行う。

図８は、MVC方式でのピクチャの符号化（及び復号）順を説明する図である。

図７と同様に、ベースビューの画像であるビュー#1の画像のピクチャを、（表示）時刻順に、p11,p12,p13,・・・と表すとともに、ディペンデントビューの画像であるビュー#2の画像のピクチャを、時刻順に、p21,p22,p23,・・・と表すこととする。

いま、説明を簡単にするために、各ビューのピクチャが、時刻順に符号化されることとすると、まず、ベースビューの最初の時刻t=1のピクチャp11が符号化され、その後、ディペンデントビューの、同一時刻t=1のピクチャp21が符号化される。

ディペンデントビューの、同一時刻t=1のピクチャ（すべて）の符号化が終了すると、ベースビューの次の時刻t=2のピクチャp12が符号化され、その後、ディペンデントビューの、同一時刻t=2のピクチャp22が符号化される。

以下、同様の順番で、ベースビューのピクチャ、及び、ディペンデントビューのピクチャは、符号化されていく。

図５の多視点画像エンコーダを構成するエンコーダ１１，１２，２１、及び、２２では、MVC方式に従った順番で、ピクチャが符号化される。

［エンコーダ１１の構成例］

図９は、図５のエンコーダ１１の構成例を示すブロック図である。

なお、図５のエンコーダ１２及び２１も、エンコーダ１１と同様に構成され、例えば、MVC方式に従って、画像の符号化を行う。

図９において、エンコーダ１１は、A/D(Analog/Digital)変換部１１１、画面並び替えバッファ１１２、演算部１１３、直交変換部１１４、量子化部１１５、可変長符号化部１１６、蓄積バッファ１１７、逆量子化部１１８、逆直交変換部１１９、演算部１２０、デブロッキングフィルタ１２１、画面内予測部１２２、インター予測部１２３、及び、予測画像選択部１２４を有する。

A/D変換部１１１には、符号化対象の画像（動画像）であるビュー#1の色画像C#1のピクチャが、表示順に、順次、供給される。

A/D変換部１１１は、そこに供給されるピクチャが、アナログ信号である場合には、そのアナログ信号をA/D変換し、画面並び替えバッファ１１２に供給する。

画面並び替えバッファ１１２は、A/D変換部１１１からのピクチャを一時記憶し、あらかじめ決められたGOP(Group of Pictures)の構造に応じて、ピクチャを読み出すことで、ピクチャの並びを、表示順から、符号化順（復号順）に並び替える並び替えを行う。

画面並び替えバッファ１１２から読み出されたピクチャは、演算部１１３、画面内予測部１２２、及び、インター予測部１２３に供給される。

演算部１１３には、画面並び替えバッファ１１２から、ピクチャが供給される他、予測画像選択部１２４から、画面内予測部１２２、又は、インター予測部１２３で生成された予測画像が供給される。

演算部１１３は、画面並び替えバッファ１１２から読み出されたピクチャを、符号化対象の対象ピクチャとし、さらに、対象ピクチャを構成するマクロブロックを、順次、符号化対象の対象ブロックとする。

そして、演算部１１３は、対象ブロックの画素値から、予測画像選択部１２４から供給される予測画像の画素値を減算した減算値を、必要に応じて演算し、直交変換部１１４に供給する。

直交変換部１１４は、演算部１１３からの対象ブロック（の画素値、又は、予測画像が減算された残差）に対して、離散コサイン変換や、カルーネン・レーベ変換等の直交変換を施し、その結果得られる変換係数を、量子化部１１５に供給する。

量子化部１１５は、直交変換部１１４から供給される変換係数を量子化し、その結果得られる量子化値を、可変長符号化部１１６に供給する。

可変長符号化部１１６は、量子化部１１５からの量子化値に対して、可変長符号化（例えば、CAVLC(Context-Adaptive Variable Length Coding)等）や、算術符号化（例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)等）等の可逆符号化を施し、その結果得られる符号化データを、蓄積バッファ１１７に供給する。

なお、可変長符号化部１１６には、量子化部１１５から量子化値が供給される他、画面内予測部１２２やインター予測部１２３から、符号化データのヘッダに含めるヘッダ情報が供給される。

可変長符号化部１１６は、画面内予測部１２２やインター予測部１２３からの、ヘッダ情報を符号化し、符号化データのヘッダに含める。

蓄積バッファ１１７は、可変長符号化部１１６からの符号化データを一時記憶し、所定のデータレートで出力する。

蓄積バッファ１１７から出力された符号化データは、多重化部３２（図５）に供給される。

量子化部１１５で得られた量子化値は、可変長符号化部１１６に供給される他、逆量子化部１１８にも供給され、逆量子化部１１８、逆直交変換部１１９、及び、演算部１２０において、ローカルデコードが行われる。

すなわち、逆量子化部１１８は、量子化部１１５からの量子化値を、変換係数に逆量子化し、逆直交変換部１１９に供給する。

逆直交変換部１１９は、逆量子化部１１８からの変換係数を逆直交変換し、演算部１２０に供給する。

演算部１２０は、逆直交変換部１１９から供給されるデータに対して、必要に応じて、予測画像選択部１２４から供給される予測画像の画素値を加算することで、対象ブロックを復号（ローカルデコード）したデコード画像を得て、デブロッキングフィルタ１２１に供給する。

デブロッキングフィルタ１２１は、演算部１２０からのデコード画像をフィルタリングすることにより、デコード画像に生じたブロック歪を除去（低減）し、DPB３１（図５）に供給する。

ここで、DPB３１は、デブロッキングフィルタ１２１からのデコード画像、すなわち、エンコーダ１１において符号化されてローカルデコードされた色画像C#1のピクチャを、時間的に後に行われる予測符号化（演算部１１３で予測画像の減算が行われる符号化）に用いる予測画像を生成するときに参照する参照ピクチャ（の候補）として記憶する。

図５で説明したように、DPB３１は、エンコーダ１１，１２，２１、及び、２２で共用されるので、エンコーダ１１において符号化されてローカルデコードされた色画像C#1のピクチャの他、エンコーダ１２において符号化されてローカルデコードされた色画像C#2のピクチャ、エンコーダ２１において符号化されてローカルデコードされた視差画像D#1のピクチャ、及び、エンコーダ２２において符号化されてローカルデコードされた視差画像D#2のピクチャも記憶する。

なお、逆量子化部１１８、逆直交変換部１１９、及び、演算部１２０によるローカルデコードは、例えば、参照ピクチャとなることが可能な参照可能ピクチャであるIピクチャ、Pピクチャ、及び、Bsピクチャを対象として行われ、DPB３１では、Iピクチャ、Pピクチャ、及び、Bsピクチャのデコード画像が記憶される。

画面内予測部１２２は、対象ピクチャが、イントラ予測（画面内予測）され得るIピクチャ、Pピクチャ、又は、Bピクチャ（Bsピクチャを含む）である場合に、DPB３１から、対象ピクチャのうちの、既にローカルデコードされている部分（デコード画像）を読み出す。そして、画面内予測部１２２は、DPB３１から読み出した、対象ピクチャのうちのデコード画像の一部を、画面並び替えバッファ１１２から供給される対象ピクチャの対象ブロックの予測画像とする。

さらに、画面内予測部１２２は、予測画像を用いて対象ブロックを符号化するのに要する符号化コスト、すなわち、対象ブロックの、予測画像に対する残差等を符号化するのに要する符号化コストを求め、予測画像とともに、予測画像選択部１２４に供給する。

インター予測部１２３は、対象ピクチャが、インター予測され得るPピクチャ、又は、Bピクチャ（Bsピクチャを含む）である場合に、DPB３１から、対象ピクチャより前に符号化されてローカルデコードされた１以上のピクチャを、候補ピクチャ（参照ピクチャの候補）として読み出す。

また、インター予測部１２３は、画面並び替えバッファ１１２からの対象ピクチャの対象ブロックと、候補ピクチャとを用いたMEによって、対象ブロックと、候補ピクチャの、対象ブロックに対応する対応ブロック（対象ブロックとのSADを最小にするブロック）とのずれ（視差、動き）を表すずれベクトルを検出する。

ここで、候補ピクチャが、対象ピクチャと同一のビューのピクチャである場合、対象ブロックと候補ピクチャとを用いたMEによって検出されるずれベクトルは、対象ブロックと、候補ピクチャとの間の動き（時間的なずれ）を表す動きベクトルとなる。

また、候補ピクチャが、対象ピクチャと異なるビューのピクチャである場合、対象ブロックと候補ピクチャとを用いたMEによって検出されるずれベクトルは、対象ブロックと、候補ピクチャとの間の視差（空間的なずれ）を表す視差ベクトルとなる。

以上のように、MEによって求められる視差ベクトルを、図６で説明した撮影視差ベクトルと区別するために、計算視差ベクトルともいう。

本実施の形態では、説明を簡単にするため、撮影視差ベクトルは、y成分が0のベクトルであることとしたが、MEによって検出される計算視差ベクトルは、対象ブロックと、候補ピクチャの、対象ブロックとのSADを最小にするブロック（対応ブロック）とのずれ（位置関係）を表すので、y成分が0になるとは限らない。

インター予測部１２３は、対象ブロックのずれベクトルに従って、DPB３１からの候補ピクチャのずれ補償（動き分のずれを補償する動き補償、又は、視差分のずれを補償する視差補償）を行うことで、予測画像を生成する。

すなわち、インター予測部１２３は、候補ピクチャの、対象ブロックの位置から、その対象ブロックのずれベクトルに従って移動した（ずれた）位置のブロック（領域）である対応ブロックを、予測画像として取得する。

さらに、インター予測部１２３は、対象ブロックを予測画像を用いて符号化するのに要する符号化コストを、予測画像の生成に用いる候補ピクチャや、後述するマクロブロックタイプ等が異なるインター予測モードごとに求める。

そして、インター予測部１２３は、符号化コストが最小のインター予測モードを、最適なインター予測モードである最適インター予測モードとして、その最適インター予測モードで得られた予測画像と符号化コストとを、予測画像選択部１２４に供給する。

予測画像選択部１２４は、画面内予測部１２２、及び、インター予測部１２３それぞれからの予測画像のうちの、符号化コストが小さい方を選択し、演算部１１３、及び、１２０に供給する。

ここで、画面内予測部１２２は、イントラ予測に関する情報を、ヘッダ情報として、可変長符号化部１１６に供給し、インター予測部１２３は、インター予測に関する情報（ずれベクトルの情報や参照インデクス等）を、ヘッダ情報として、可変長符号化部１１６に供給する。

可変長符号化部１１６は、画面内予測部１２２、及び、インター予測部１２３それぞれからのヘッダ情報のうちの、符号化コストが小さい予測画像が生成された方からのヘッダ情報を選択し、符号化データのヘッダに含める。

［マクロブロックタイプ］

図１０は、MVC(AVC)方式のマクロブロックタイプを説明する図である。

MVC方式では、対象ブロックとなるマクロブロックは、横×縦が１６×１６画素のブロックであるが、ME（及び、予測画像の生成）は、マクロブロックをパーティションに分割して、パーティションごとに行うことができる。

すなわち、MVC方式では、マクロブロックを、１６×１６画素、１６×８画素、８×１６画素、又は８×８画素のうちのいずれかのパーティションに分割して、各パーティションごとに、MEを行って、すれベクトル（動きベクトル、又は、計算視差ベクトル）を検出することができる。

また、MVC方式では、８×８画素のパーティションは、さらに、８×８画素、８×４画素、４×８画素、又は４×４画素のうちのいずれかのサブパーティションに分割し、各サブパーティションごとに、MEを行って、すれベクトル（動きベクトル、又は、計算視差ベクトル）を検出することができる。

マクロブロックタイプは、マクロブロックを、どのようなパーティション（さらには、サブパーティション）に分割するかを表す。

インター予測部１２３（図９）のインター予測では、各マクロブロックタイプの符号化コストが、各インター予測モードの符号化コストとして算出され、符号化コストが最小のインター予測モード（マクロブロックタイプ）が、最適インター予測モードとして選択される。

［予測ベクトル(PMV(Predicted Motion Vector))］

図１１は、MVC(AVC)方式の予測ベクトル(PMV)を説明する図である。

インター予測部１２３（図９）のインター予測では、MEによって、対象ブロックのずれベクトル（動きベクトル、又は、計算視差ベクトル）が検出され、そのずれベクトルを用いて、予測画像が生成される。

ずれベクトルは、復号側において、画像を復号するのに必要であるため、ずれベクトルの情報を符号化して、符号化データに含める必要があるが、ずれベクトルを、そのまま符号化すると、ずれベクトルの符号量が多くなって、符号化効率が劣化することがある。

すなわち、MVC方式では、図９に示したように、マクロブロックが、８×８画素のパーティションに分割され、さらに、その８×８画素のパーティションそれぞれが、４×４画素のサブパーティションに分割されることがある。この場合、１つのマクロブロックは、最終的には、４×４個のサブパーティションに分割されるため、１つのマクロブロックに対して、１６（＝４×４）個のずれベクトルが生じることがあり、ずれベクトルを、そのまま符号化すると、ずれベクトルの符号量が多くなって、符号化効率が劣化する。

そこで、MVC(AVC)方式では、ずれベクトルを予測するベクトル予測が行われ、そのベクトル予測によって得られる予測ベクトルに対する、ずれベクトルの残差が、ずれベクトルの情報（ずれベクトル情報（視差ベクトル情報、動きベクトル情報））として符号化される。

すなわち、あるマクロブロックXが、符号化対象の対象ブロックであるとする。また、説明を簡単にするため、対象ブロックXは、１６×１６画素のパーティションに分割される（対象ブロックXが、そのまま、パーティションとされる）こととする。

対象ブロックXのずれベクトルmvXの予測ベクトルPMVXは、図１１に示すように、対象ブロックXが符号化されるときに、（ラスタスキャン順で）既に符号化されているマクロブロックのうちの、対象ブロックXの上に隣接するマクロブロックAのずれベクトルmvA、左に隣接するマクロブロックBのずれベクトルmvB、及び、右斜め上に隣接するマクロブロックCのずれベクトルmvCを用い、式（５）に従って算出される。

PMVX＝med(mvA,mvB,mvC)
・・・（５）

ここで、式（５）において、med()は、かっこ内の値のメディアン（中央値）を表す。

なお、対象ブロックXが、ピクチャの右端のマクロブロックである場合等、マクロブロックCのずれベクトルmvCが、利用可能でない（unavailableである）場合には、ずれベクトルmvCに代えて、対象ブロックXの左斜め上に隣接するマクロブロックDのずれベクトルmvDを用いて、予測ベクトルPMVXが算出される。

また、式（５）に従った予測ベクトルPMVXの算出は、x成分とy成分とのそれぞれについて、独立に行われる。

インター予測部１２３（図９）では、対象ブロックXのずれベクトルmvXと、その予測ベクトルPMVXとの差分mvX−PMVが、対象ブロックXのずれベクトル情報として、ヘッダ情報に含められる。

図１２は、MVC(AVC)方式のスキップマクロブロックの予測ベクトルを説明する図である。

図３で説明したように、MVC方式では、値が0の参照インデクスrev_idxが割り当てられた参照ピクチャを用いて、対象ブロックの符号化を行う場合には、対象ブロックを、スキップマクロブロックとすることができる。

対象ブロックがスキップマクロブロックとされる場合、その対象ブロックのずれベクトルの予測ベクトルの生成の方法は、対象ブロックの周辺のマクロブロックの予測画像の生成に用いられる参照ピクチャに割り当てられている参照インデクス（以下、予測用の参照インデクスともいう）によって異なる。

ここで、MVC(AVC)方式の参照ピクチャ（となりうる候補ピクチャ）と、参照インデクスについて説明する。

AVC方式では、予測画像を生成するときに、複数のピクチャを、候補ピクチャとすることができる。

そして、AVC方式のコーデックでは、候補ピクチャは、デコード（ローカルデコード）後に、DPBと呼ばれるバッファに記憶される。

DPBでは、短期間に参照されるピクチャは、短時間参照ピクチャ(used for short-term reference)として、長期間にわたって参照されるピクチャは、長時間参照ピクチャ(used for long-term reference)として、参照されないピクチャは、非参照ピクチャ(unused for reference)として、それぞれマーキングされる。

DPBを管理する管理方式としては、移動窓メモリ管理方式(Sliding window process)と、適応メモリ管理方式(Adaptive memory control process)との２種類がある。

移動窓メモリ管理方式では、DPBが、FIFO(First In First Out)方式で管理され、DPBに記憶されたピクチャは、frame_numの小さいピクチャから順に開放される（非参照ピクチャとなる）。

すなわち、移動窓メモリ管理方式では、I(Intra)ピクチャ、P(Predictive)ピクチャ、及び、参照可能なB(Bi-directional Predictive)ピクチャであるBsピクチャは、短時間参照ピクチャとして、DPBに記憶される。

そして、DPBが参照ピクチャ（となりうる候補ピクチャ）を記憶することができるだけの参照ピクチャが記憶された後は、DPBに記憶された短時間参照ピクチャの中で、最も早く（古い）短時間参照ピクチャが開放される。

なお、DPBに、長時間参照ピクチャが記憶されている場合、移動窓メモリ管理方式は、DPBに記憶されている長時間参照ピクチャには、影響しない。すなわち、移動窓メモリ管理方式において、参照ピクチャの中で、FIFO方式で管理されるのは、短時間参照ピクチャだけである。

適応メモリ管理方式では、MMCO(Memory management control operation)と呼ばれるコマンドを用いて、DPBに記憶されるピクチャが管理される。

MMCOコマンドによれば、DPBに記憶される参照ピクチャを対象として、短時間参照ピクチャを非参照ピクチャに設定することや、短時間参照ピクチャに対し、長時間参照ピクチャを管理するための参照インデクスであるlong-term frame indexを割り当てることで、短時間参照ピクチャを長時間参照ピクチャに設定すること、long-term frame indexの最大値を設定すること、すべての参照ピクチャを非参照ピクチャに設定すること等を行うことができる。

AVC方式では、DPBに記憶された参照ピクチャの動き補償を行うことで、予測画像を生成するインター予測が行われるが、Bピクチャ（Bsピクチャを含む）のインター予測には、最大で、2ピクチャの参照ピクチャを用いることができる。その2ピクチャの参照ピクチャを用いるインター予測は、それぞれ、L0(List 0)予測、及び、L1(List 1)予測と呼ばれる。

Bピクチャ（Bsピクチャを含む）については、インター予測として、L0予測、若しくは、L1予測、又は、L0予測とL1予測との両方が用いられる。Pピクチャについては、インター予測として、L0予測だけが用いられる。

インター予測において、予測画像の生成に参照する参照ピクチャは、参照リスト(Reference Picture List)により管理される。

参照リストでは、予測画像の生成に参照する参照ピクチャ（となりうる候補ピクチャ）を指定するためのインデクスである参照インデクス(Reference Index)が、DPBに記憶された参照ピクチャ（になりうる候補ピクチャ）に割り当てられる。

対象ピクチャが、Pピクチャである場合、上述したように、Pピクチャについては、インター予測として、L0予測だけが用いられるので、参照インデクスの割り当ては、L0予測についてだけ行われる。

また、対象ピクチャが、Bピクチャ（Bsピクチャを含む）である場合、上述したように、Bピクチャについては、インター予測として、L0予測とL1予測との両方が用いられることがあるので、参照インデクスの割り当ては、L0予測とL1予測との両方について行われる。

ここで、L0予測についての参照インデクスを、L0インデクスともいい、L1予測についての参照インデクスを、L1インデクスともいう。

対象ピクチャが、Pピクチャである場合、AVC方式のデフォルト（既定値）では、DPBに記憶された参照ピクチャに対し、復号順が後の参照ピクチャほど、値が小さい参照インデクス（L0インデクス）が割り当てられる。

参照インデクスは、0以上の整数値であり、最小値は、0である。したがって、対象ピクチャが、Pピクチャである場合には、対象ピクチャの直前に復号された参照ピクチャに、L0インデクスとして、0が割り当てられる。

対象ピクチャが、Bピクチャ（Bsピクチャを含む）である場合、AVCのデフォルトでは、DPBに記憶された参照ピクチャに対し、POC(Picture Order Count)順、つまり、表示順に、参照インデクス（L0インデクス、及び、L1インデクス）が割り当てられる。

すなわち、L0予測については、表示順で、対象ピクチャの時間的に前の参照ピクチャに対し、対象ピクチャに近い参照ピクチャほど、値が小さいL0インデクスが割り当てられ、その後、表示順で、対象ピクチャの時間的に後の参照ピクチャに対し、対象ピクチャに近い参照ピクチャほど、値が小さいL0インデクスが割り当てられる。

また、L1予測については、表示順で、対象ピクチャの時間的に後の参照ピクチャに対し、対象ピクチャに近い参照ピクチャほど、値が小さいL1インデクスが割り当てられ、その後、表示順で、対象ピクチャの時間的に前の参照ピクチャに対し、対象ピクチャに近い参照ピクチャほど、値が小さいL1インデクスが割り当てられる。

なお、以上のAVC方式のデフォルトでの参照インデクス（L0インデクス、及び、L1インデクス）の割り当ては、短時間参照ピクチャを対象として行われる。長時間参照ピクチャへの参照インデクスの割り当ては、短時間参照ピクチャに、参照インデクスが割り当てられた後に行われる。

したがって、AVCのデフォルトでは、長時間参照ピクチャには、短時間参照ピクチャよりも大きい値の参照インデクスが割り当てられる。

AVC方式において、参照インデクスの割り当てとしては、以上のようなデフォルトの方法で割り当てを行う他、Reference Picture List Reorderingと呼ばれるコマンド（以下、RPLRコマンドともいう）を用いて、任意の割り当てを行うことができる。

なお、RPLRコマンドを用いて、参照インデクスの割り当てが行われた後、参照インデクスが割り当てられていない参照ピクチャがある場合には、その参照ピクチャには、参照インデクスが、デフォルトの方法で割り当てられる。

いま、図１２に示すように、マクロブロックXを対象ブロックとして、その対象ブロックXがスキップマクロブロックとされる場合、その対象ブロックXのずれベクトルmvXの予測ベクトルPMVXは、対象ブロックXの上に隣接するマクロブロックA、左に隣接するマクロブロックB、及び、右斜め上に隣接するマクロブロックCそれぞれの予測用の参照インデクス（マクロブロックA，B、及び、Cそれぞれの予測画像の生成に用いられた参照ピクチャに割り当てられていた参照インデクス）によって異なる方法で求められる。

すなわち、図１２のＡに示すように、対象ブロックXに隣接する３つのマクロブロックAないしCの中に、予測用の参照インデクスref_idxが0のマクロブロックが、１つだけ存在する場合には、その１つのマクロブロック（予測用の参照インデクスref_idxが0のマクロブロック）のずれベクトルが、対象ブロックXのずれベクトルmvXの予測ベクトルPMVXとされる。

ここで、図１２のＡでは、対象ブロックXに隣接する３つのマクロブロックAないしCのうちの、マクロブロックAだけが、予測用の参照インデクスref_idxが0のマクロブロックになっており、そのため、マクロブロックAのずれベクトルmvAが、対象ブロックX（のずれベクトルmvX）の予測ベクトルPMVXとされる。

また、図１２のＢに示すように、対象ブロックXに隣接する３つのマクロブロックAないしCの中に、予測用の参照インデクスref_idxが0のマクロブロックが、２つ以上存在する場合には、その、予測用の参照インデクスref_idxが0の２つ以上のマクロブロックのずれベクトルのメディアンが、対象ブロックXの予測ベクトルPMVXとされる。

ここで、図１２のＢでは、対象ブロックXに隣接する３つのマクロブロックAないしCのすべてが、予測用の参照インデクスref_idxが0のマクロブロックになっており、そのため、マクロブロックAのずれベクトルmvA、マクロブロックBのずれベクトルmvB、及び、マクロブロックCのずれベクトルmvCのメディアンmed(mvA,mvB,mvC)が、対象ブロックXの予測ベクトルPMVXとされる。

また、図１２のＣに示すように、対象ブロックXに隣接する３つのマクロブロックAないしCの中に、予測用の参照インデクスref_idxが0のマクロブロックが、１つも存在しない場合には、0ベクトルが、対象ブロックXの予測ベクトルPMVXとされる。

ここで、図１２のＣでは、対象ブロックXに隣接する３つのマクロブロックAないしCの中に、予測用の参照インデクスref_idxが0のマクロブロックは存在しないので、0ベクトルが、対象ブロックXの予測ベクトルPMVXとされる。

なお、スキップマクロブロックについては、残差も、ずれベクトルの情報も符号化されない。そして、復号時には、予測ベクトルが、そのまま、スキップマクロブロックのずれベクトルに採用され、参照ピクチャの、スキップマクロブロックの位置からずれベクトルだけずれた位置のブロック（対応ブロック）のコピーが、スキップマクロブロックの復号結果とされる。

対象ブロックをスキップマクロブロックとするか否かは、エンコーダの仕様によるが、例えば、符号化データの符号量や、対象ブロックの符号化コスト等に基づいて決定（判定）される。

［エンコーダ２２の構成例］

図１３は、図５のエンコーダ２２の構成例を示すブロック図である。

エンコーダ２２は、符号化対象の画像であるビュー#2の視差画像D#2の符号化を、MVC方式を利用して、すなわち、図３で説明したようにして行う。

図１３において、エンコーダ２２は、A/D変換部２１１、画面並び替えバッファ２１２、演算部２１３、直交変換部２１４、量子化部２１５、可変長符号化部２１６、蓄積バッファ２１７、逆量子化部２１８、逆直交変換部２１９、演算部２２０、デブロッキングフィルタ２２１、画面内予測部２２２、予測画像選択部２２４、ワーピング部２３１、ワープドピクチャバッファ２３２、参照インデクス割り当て部２３３、及び、視差予測部２３４を有する。

A/D変換部２１１ないし画面内予測部２２２、及び、予測画像選択部２２４は、図９のエンコーダ１１のA/D変換部１１１ないし画面内予測部１２２、及び、予測画像選択部１２４と、それぞれ同様に構成されるので、その説明は、適宜省略する。

図１３において、DPB３１には、デブロッキングフィルタ２２１から、デコード画像、すなわち、エンコーダ２２において符号化されてローカルデコードされた視差画像（以下、デコード視差画像ともいう）D#2のピクチャが供給され、参照ピクチャとなりうる候補ピクチャとして記憶される。

また、DPB３１には、図５や図９で説明したように、エンコーダ１１において符号化されてローカルデコードされた色画像C#1のピクチャ、エンコーダ１２において符号化されてローカルデコードされた色画像C#2のピクチャ、及び、エンコーダ２１において符号化されてローカルデコードされた視差画像（デコード視差画像）D#1のピクチャも供給されて記憶される。

エンコーダ２２では、デブロッキングフィルタ２２１からのデコード視差画像D#2のピクチャの他、エンコーダ２１で得られるデコード視差画像D#1が、符号化対象である視差画像D#2の符号化に用いられるので、図１３では、エンコーダ２１で得られるデコード視差画像D#1が、DPB３１に供給されることを示す矢印を、図示してある。

ワーピング部２３１には、視差関連情報（図５）としての、撮影視差ベクトルd（視点#1の撮影視差ベクトルd1）の最大値dmax及び最小値dmin、基線長L、焦点距離fが供給される。

ワーピング部２３１は、DPB３１に記憶された、デコード視差画像D#1及びD#2のピクチャのうちの、デコード視差画像D#1のピクチャ（対象ピクチャと同一時刻のピクチャ）を取得する（読み出す）。

そして、ワーピング部２３１は、視差関連情報を必要に応じて用いて、DPB３１から取得したデコード視差画像D#1のピクチャをワーピングすることにより、そのデコード視差画像D#1のピクチャを視点#2で得られる画像（視差画像）に変換したワープド画像であるワープド視差画像D'#1のピクチャを生成する。

すなわち、ワーピング部２３１は、デコード視差画像D#1のピクチャの各画素の画素値である視差値νを、撮影視差ベクトルdの最大値dmax及び最小値dminを用い、式（３）に従って、画素ごとの撮影視差ベクトルdに変換する。

ここで、視差情報画像として、視差画像ではなく、奥行き画像を用いる場合には、基線長L、及び、焦点距離fを用い、式（４）に従って、奥行き画像の画素値である値ｙの正規化前の値である奥行きZが、撮影視差ベクトルdに変換される。

ワーピング部２３１は、デコード視差画像D#1のピクチャの各画素を、その画素の撮影視差ベクトルdに従って移動するワーピングを行うことにより、ワープド視差画像D'#1のピクチャを生成する。

なお、上述したように、ワーピングによれば、ワープド視差画像D'#1のピクチャには、画素値がない、穴が空いたオクルージョン部分が生じることがあるが、オクルージョン部分の画素は、周辺の画素、すなわち、例えば、ワーピングでの移動方向の逆方向にある、オクルージョン部分に最も近い画素等の画素値（視差値）によって補間される。

ここで、ワーピングでの移動方向の逆方向にある、オクルージョン部分に最も近い画素は、奥側の背景の視差を表す視差値（背景の視差値）を、画素値として有する画素であり、したがって、オクルージョン部分（の画素）は、背景の視差値によって補間される。

ワーピング部２３１は、デコード視差画像D#1のピクチャのワーピングによって、ワープド視差画像D'#1のピクチャを生成すると、そのワープド視差画像D'#1のピクチャを、ワープドピクチャバッファ２３２に供給する。

ワープドピクチャバッファ２３２は、ワーピング部２３１からのワープド視差画像D'#1のピクチャを、一時記憶する。

なお、本実施の形態では、DPB３１とは別に、ワープド視差画像D'#1のピクチャを記憶するワープドピクチャバッファ２３２を設けてあるが、DPB３１とワープドピクチャバッファ２３２とは、１つのバッファで兼用することが可能である。

参照インデクス割り当て部２３３は、DPB３１に記憶されたデコード視差画像D#1のピクチャと、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャとを、参照ピクチャの候補である候補ピクチャとして、各候補ピクチャに、参照インデクスを割り当てる。

そして、参照インデクス割り当て部２３３は、候補ピクチャに割り当てられた参照インデクスを、視差予測部２３４に供給する。

なお、参照インデクス割り当て部２３３は、候補ピクチャであるデコード視差画像D#1のピクチャと、ワープド視差画像D'#1のピクチャとのうちの、デコード視差画像D#1のピクチャに、値が1の参照インデクスを割り当て、ワープド視差画像D'#1に、値が0の参照インデクスを割り当てる。

ここで、MVC(AVC)では、値が0の参照インデクスの符号量は、値が1の参照インデクスの符号量よりも少ない。

また、図４で説明したように、ワープド視差画像D'#1、及び、視差画像D#1のピクチャについては、ワープド視差画像D'#1のピクチャが、視差画像D#1のピクチャよりも、対象ブロックの符号化コストが小さくなりやすく、参照ピクチャとして選択されやすい。

したがって、参照ピクチャとして選択されやすいワープド視差画像D'#1のピクチャに、符号量が少ない、値が0の参照インデクスを割り当てることにより、符号化効率を向上させることができる。

また、エンコーダ２２では、以上のように、候補ピクチャに、符号化対象である視差画像D#2の視点#2とは異なる視点#1の視差画像（デコード視差画像）D#1をワーピングすることにより生成されるワープド視差画像D'#1を含め、その候補ピクチャであるワープド視差画像D'#1に、参照インデクスを割り当てる他は、デコーダ１１（及びデコーダ１２，２１）と同様にMVC(AVC)方式に従った処理が行われる。

したがって、対象ブロックの予測用の参照インデクスとして、ワープド視差画像D'#1に割り当てられた値が0の参照インデクスが選択された場合、つまり、値が0の参照インデクスが割り当てられた候補ピクチャであるワープド視差画像D'#1が、参照ピクチャとして選択された場合には、対象ブロックをスキップマクロブロックとすることができる。

よって、参照ピクチャとして選択されやすいワープド視差画像D'#1のピクチャに、値が0の参照インデクスを割り当てることにより、残差やずれベクトルの情報が符号化されないスキップマクロブロックが発生する確率が高くなるので、符号化効率を向上させることができる。

視差予測部２３４は、参照インデクス割り当て部２３３において参照インデクスが割り当てられた候補ピクチャ、すなわち、DPB３１に記憶されたデコード視差画像D#1のピクチャと、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャとを、それぞれ参照ピクチャとして、対象ブロックの視差予測（予測画像の生成）を行う。

さらに、視差予測部２３４は、候補ピクチャであるデコード視差画像D#1のピクチャと、ワープド視差画像D'#1のピクチャとのそれぞれについて、候補ピクチャから視差予測によって得られる予測画像を用いた対象ブロックの符号化（予測符号化）に要する符号化コストを算出する。

そして、視差予測部２３４は、符号化コストに基づいて、候補ピクチャであるデコード視差画像D#1のピクチャと、ワープド視差画像D'#1のピクチャとのそれぞれに割り当てられている参照インデクスの中から、対象ブロックの符号化に用いる候補ピクチャに割り当てられている参照インデクスを、対象ブロックの予測用の参照インデクスとして選択し、ヘッダ情報の１つとして、可変長符号化部２１６に出力する。

また、視差予測部２３４は、対象ブロックの予測用の参照インデクスが割り当てられている候補ピクチャ（デコード視差画像D#1のピクチャ、又は、ワープド視差画像D'#1のピクチャ）を参照ピクチャとして、視差予測により生成される予測画像を、予測画像選択部２２４に供給する。

なお、図１３においては、説明を簡単にするために、エンコーダ２２に、インター予測のうちの視差予測を行う視差予測部２３４を設けてあるが、エンコーダ２２では、図９のエンコーダ１１のインター予測部１２３と同様に、視差予測の他、時間予測も行うことができる。

エンコーダ２２において、視差予測、及び、時間予測の両方を行う場合、参照インデクス割り当て部２３３では、視差予測で参照されうる候補ピクチャであるワープド視差画像D'#1、及び、デコード視差画像D#1のピクチャの他、時間予測で参照されうる候補ピクチャであるデコード視差画像D#2のピクチャ（対象ピクチャとは時刻が異なる他時刻ピクチャ）にも、参照インデクスが割り当てられる。

以上のように、視差予測に用いられるワープド視差画像D'#1のピクチャと、時間予測に用いられるデコード視差画像D#2のピクチャとが候補ピクチャに含まれる場合の、参照インデクスの割り当てについては、後述する。

図１４は、図１３のDPB３１に記憶されるデコード視差画像と、ワープドピクチャバッファ２３２に記憶されるワープド視差画像とを説明する図である。

いま、視差画像D#1及びD#2に注目すると、図５の多視点画像伝コーダのエンコーダ２１及び２２では、図８で説明したことから、ビュー#1の視差画像D#1の第1ピクチャ、ビュー#2の視差画像D#2の第1ピクチャ、ビュー#1の視差画像D#1の第2ピクチャ、ビュー#2の視差画像D#2の第2ピクチャ、・・・の順に、符号化がされていく。

そして、エンコーダ２１において、ビュー#1の視差画像D#1の第t-1ピクチャD1(t-1)が符号化され、ローカルデコードされると、そのローカルデコードによって得られるデコード視差画像D#1のピクチャD1(t-1)が、DPB３１に供給されて記憶される。

その後、エンコーダ２２（図１３）では、ワーピング部２３１において、DPB３１に記憶されたデコード視差画像D#1のピクチャD1(t-1)がワーピングされることにより、ワープド視差画像D'#1のピクチャD1'(t-1)が生成され、ワープドピクチャバッファ２３２に供給されて記憶される。

そして、エンコーダ２２では、参照インデクス割り当て部２３３において、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャD1'(t-1)に、値が0の参照インデクスが割り当てられ、DPB３１に記憶されたデコード視差画像D#1のピクチャD1(t-1)に、値が1の参照インデクスが割り当てられる。

さらに、エンコーダ２２では、参照インデクスが割り当てられたワープド視差画像D'#1のピクチャD1'(t-1)、又は、デコード視差画像D#1のピクチャD1(t-1)を、必要に応じて、参照ピクチャとして用いて、ビュー#2の視差画像D#2の第t-1ピクチャD2(t-1)が符号化され、ローカルデコードされる。そのローカルデコードによって得られるデコード視差画像D#2のピクチャD2(t-1)は、DPB３１に供給されて記憶される。

その結果、DPB３１には、図１４に示すように、デコード視差画像D#2のピクチャD2(t-1)、及び、デコード視差画像D#1のピクチャD1(t-1)が記憶される。

その後、エンコーダ２１において、ビュー#1の視差画像D#1の第tピクチャD1(t)が符号化され、ローカルデコードされる。そのローカルデコードによって得られるデコード視差画像D#1のピクチャD1(t)は、DPB３１に供給されて記憶される。

その結果、DPB３１には、図１４に示すように、デコード視差画像D#1のピクチャD1(t)、デコード視差画像D#2のピクチャD2(t-1)、及び、デコード視差画像D#1のピクチャD1(t-1)が記憶される。

以上のように、デコード視差画像D#1のピクチャD1(t)が、DPB３１に記憶されると、エンコーダ２２のワーピング部２３１は、DPB３１に記憶されたデコード視差画像D#1のピクチャD1(t)をワーピングすることにより、ワープド視差画像D'#1のピクチャD1'(t)を生成し、ワープドピクチャバッファ２３２に供給して記憶させる。

その結果、ワープドピクチャバッファ２３２には、図１４に示すように、ワープド視差画像D'#1のピクチャD1'(t)及びD1'(t-1)が記憶される。

その後、エンコーダ２２では、参照インデクス割り当て部２３３において、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャD1'(t)に、値が0の参照インデクスが割り当てられ、DPB３１に記憶されたデコード視差画像D#1のピクチャD1(t)に、値が1の参照インデクスが割り当てられる。

さらに、エンコーダ２２では、参照インデクスが割り当てられたワープド視差画像D'#1のピクチャD1'(t)、又は、デコード視差画像D#1のピクチャD1(t)を、必要に応じて、参照ピクチャとして用いて、ビュー#2の視差画像D#2の第tピクチャD2(t)が符号化され、ローカルデコードされる。

エンコーダ２１及び２２では、以下同様の処理が行われていく。

図１５は、図１３の視差予測部２３４の構成例を示すブロック図である。

図１５において、視差予測部２３４は、視差検出部２４１、視差補償部２４２及び２４３、コスト関数算出部２４４、モード選択部２４５、並びに、予測ベクトル生成部２４６を有する。

視差検出部２４１には、DPB３１に記憶された候補ピクチャであるデコード視差画像D#1のピクチャが供給される。さらに、視差検出部２４１には、参照インデクス割り当て部２３３から、候補ピクチャであるデコード視差画像D#1のピクチャに割り当てられた参照インデクスidx（ここでは、1）が供給されるとともに、画面並び替えバッファ２１２から、符号化対象の視差画像D#2のピクチャの対象ブロックが供給される。

視差検出部２４１は、MVC方式と同様に、対象ブロックと、候補ピクチャであるデコード視差画像D#1のピクチャとを用いてMEを行うことにより、対象ブロックと、デコード視差画像D#1のピクチャの、対象ブロックとのSADを最小にするブロック（対応ブロック）とのずれを表すずれベクトル、すなわち、対象ブロックの、視点#1に対する視差を表す計算視差ベクトルmvを求め、視差補償部２４２に供給する。

視差補償部２４２には、視差検出部２４１から、計算視差ベクトルmvであるずれベクトルが供給される他、DPB３１に記憶された候補ピクチャであるデコード視差画像D#1のピクチャが供給される。さらに、視差補償部２４２には、参照インデクス割り当て部２３３から、候補ピクチャであるデコード視差画像D#1のピクチャに割り当てられた参照インデクスidxが供給される。

視差補償部２４２は、候補ピクチャであるデコード視差画像D#1のピクチャを、参照ピクチャとして、その参照ピクチャのずれ補償（視差補償）を、視差検出部２４１からの計算視差ベクトルmvを用いて、MVC方式と同様にして行うことで、対象ブロックの予測画像ppを生成する。

すなわち、視差補償部２４２は、デコード視差画像D#1のピクチャの、対象ブロックの位置から、計算視差ベクトルmvだけずれた位置のブロックである対応ブロックを、予測画像ppとして取得する。

そして、視差補償部２４２は、予測画像ppを、視差検出部２４１からの計算視差ベクトルmv、及び、参照インデクス割り当て部２３３からの、デコード視差画像D#1のピクチャに割り当てられた参照インデクスidxとともに、コスト関数算出部２４４に供給する。

視差補償部２４３には、ワープドピクチャバッファ２３２に記憶された候補ピクチャであるワープド視差画像D'#1のピクチャが供給される。さらに、視差補償部２４３には、参照インデクス割り当て部２３３から、候補ピクチャであるワープド視差画像D'#1のピクチャに割り当てられた参照インデクスidx'（ここでは、0）が供給される。

視差補償部２４３は、候補ピクチャであるワープド視差画像D'#1のピクチャを、参照ピクチャとして、その参照ピクチャのずれ補償（視差補償）を、ずれベクトルとしての計算視差ベクトルmv'が0ベクトルであると仮定して、MVC方式と同様にして行うことで、対象ブロックの予測画像pp'を生成する。

すなわち、ワープド視差画像D'#1は、視差画像D#1をワーピングすることにより、視点#2で得られる視差画像に変換した画像であるから、視点#2の視差画像D#2の対象ブロックとの視差がないとみなし、計算視差ベクトルmv'として、0ベクトルが採用される。

そして、視差補償部２４３は、ワープド視差画像D'#1のピクチャの、対象ブロックの位置から、計算視差ベクトルmv'=0だけずれた位置のブロックである対応ブロック、つまり、ワープド視差画像D'#1のピクチャの、対象ブロックと同一の位置にあるブロックを、予測画像ppとして取得する。

そして、視差補償部２４３は、予測画像pp'を、計算視差ベクトルmv'、及び、参照インデクス割り当て部２３３からの、ワープド視差画像D'#1のピクチャに割り当てられた参照インデクスidx'とともに、コスト関数算出部２４４に供給する。

なお、ここでは、ワープド視差画像D'#1のピクチャに対する対象ブロックの計算視差ベクトルmv'を0ベクトルに仮定したが、ワープド視差画像D'#1のピクチャに対する対象ブロックの計算視差ベクトルmv'については、ワープド視差画像D'#1のピクチャと、対象ブロックとを用いてMEを行い、そのMEによって得られるずれベクトルを、計算視差ベクトルmv'に採用することができる。

コスト関数算出部２４４には、視差補償部２４２から、予測画像pp、計算視差ベクトルmv、及び、参照インデクスidxが供給されるとともに、視差補償部２４３から、予測画像pp'、計算視差ベクトルmv'、及び、参照インデクスidx'が供給される他、予測ベクトル生成部２４６から、予測ベクトルが供給されるとともに、画面並び替え部バッファ２１２から、対象ブロックが供給される。

コスト関数算出部２４４は、参照インデクスidx（が割り当てられたデコード視差画像D#1のピクチャ）について、マクロブロックタイプ（図１０）ごとに、対象ブロックの符号化に要する符号化コストを、符号化コストを算出するコスト関数としての、例えば、式（１）に従って求める。

すなわち、コスト関数算出部２４４は、参照インデクスidxについて、計算視差ベクトルmvの、予測ベクトルに対する残差ベクトルを求め、その残差ベクトルの符号量に対応する値MVを求める。

さらに、コスト関数算出部２４４は、参照インデクスidxについて、その参照インデクスidxが割り当てられたデコード視差画像D#1から生成された予測画像ppに対する、対象ブロックの残差に対応する値であるSADを求める。

そして、コスト関数算出部２４４は、式（１）に従い、参照インデクスidxについての、マクロブロックタイプごとの符号化コストを求める。

コスト関数算出部２４４は、参照インデクスidx'（が割り当てられたワープド視差画像D'#1のピクチャ）についても、同様に、マクロブロックタイプごとに、対象ブロックの符号化に要する符号化コストを求める。

なお、符号化コストを求めるコスト関数は、式（１）に限定されるものではない。すなわち、符号化コストは、その他、例えば、λ1及びλ2を重みとして、SAD、残差ベクトルの符号量に対応する値に重みλ1を乗算した値、参照インデクスの符号量に対応する値に重みλ2を乗算した値を加算すること等によって求めることができる。

コスト関数算出部２４４は、参照インデクスidx及びidx'のそれぞれについての、マクロブロックタイプごとの符号化コスト（コスト関数値）を求めると、符号化コストを、参照インデクス、予測画像、及び、残差ベクトル（視差ベクトル情報）とともに、モード選択部２４５に供給する。

モード選択部２４５は、コスト関数算出部２４４からの参照インデクスidx及びidx'のそれぞれについての、マクロブロックタイプごとの符号化コストの中から、最小値である最小コストを検出する。

さらに、モード選択部２４５は、最小コストが得られた参照インデクス、及び、マクロブロックタイプを、最適インター予測モードに選択する。

なお、最適インター予測モードの選択では、例えば、まず、各マクロブロックタイプについて、参照インデクスidx及びidx'のうちの、符号化コストが小さい方の参照インデクスを選択し、その後、各マクロブロックタイプから選択された参照インデクスのみを対象として、符号化コストが最小のマクロブロックタイプを選択することで、最小コストが得られた参照インデクス、及び、マクロブロックタイプを、最適インター予測モードに選択することができる。

そして、モード選択部２４５は、最適インター予測モードを表すモード関連情報、最適インター予測モードの参照インデクス（予測用の参照インデクス）、及び、最適インター予測モードの視差ベクトル情報等を、ヘッダ情報として、可変長符号化部２１６に供給する。

さらに、モード選択部２４５は、最適インター予測モードの予測画像と符号化コスト（最小コスト）を、予測画像選択部２２４に供給する。

なお、モード選択部２４５は、最小コストが得られた参照インデクスが、値が0の参照インデクスである場合には、例えば、最小コスト等に基づいて、対象ブロックを、スキップマクロブロックとして符号化するかどうかの判定を行う。

モード選択部２４５において、対象ブロックを、スキップマクロブロックとして符号化すると判定された場合、最適インター予測モードは、対象ブロックを、スキップマクロブロックとして符号化するスキップモードとされる。

予測ベクトル生成部２４６は、例えば、図１１等で説明したように、MVC(AVC)方式で、予測ベクトルを生成し、コスト関数算出部２４４に供給する。

図１６は、図１３のエンコーダ２２が行う、ビュー#2の視差画像D#2を符号化する符号化処理を説明するフローチャートである。

ステップＳ１１において、A/D変換部２１１は、そこに供給されるビュー#2の視差画像D#2のピクチャのアナログ信号をA/D変換し、画面並び替えバッファ２１２に供給して、処理は、ステップＳ１２に進む。

ステップＳ１２では、画面並び替えバッファ２１２は、A/D変換部２１１からの視差画像D#2のピクチャを一時記憶し、あらかじめ決められたGOPの構造に応じて、ピクチャを読み出すことで、ピクチャの並びを、表示順から、符号化順（復号順）に並び替える並び替えを行う。

画面並び替えバッファ２１２から読み出されたピクチャは、演算部２１３、画面内予測部２２２、及び、視差予測部２３４に供給され、処理は、ステップＳ１２からステップＳ１３に進む。

ステップＳ１３では、演算部２１３は、画面並び替えバッファ２１２からの視差画像D#2のピクチャを、符号化対象の対象ピクチャとし、さらに、対象ピクチャを構成するマクロブロックを、順次、符号化対象の対象ブロックとする。

そして、演算部２１３は、対象ブロックの画素値と、予測画像選択部２２４から供給される予測画像の画素値との差分（残差）を、必要に応じて演算し、直交変換部２１４に供給して、処理は、ステップＳ１３からステップＳ１４に進む。

ステップＳ１４では、直交変換部２１４は、演算部２１３からの対象ブロックに対して直交変換を施し、その結果得られる変換係数を、量子化部２１５に供給して、処理は、ステップＳ１５に進む。

量子化部２１５は、直交変換部２１４から供給される変換係数を量子化し、その結果得られる量子化値を、逆量子化部２１８、及び、可変長符号化部２１６に供給して、処理は、ステップＳ１６に進む。

ステップＳ１６では、逆量子化部２１８は、量子化部２１５からの量子化値を、変換係数に逆量子化し、逆直交変換部２１９に供給して、処理は、ステップＳ１７に進む。

ステップＳ１７では、逆直交変換部２１９は、逆量子化部２１８からの変換係数を逆直交変換し、演算部２２０に供給して、処理は、ステップＳ１８に進む。

ステップＳ１８では、演算部２２０は、逆直交変換部２１９から供給されるデータに対して、必要に応じて、予測画像選択部２２４から供給される予測画像の画素値を加算することで、対象ブロックを復号（ローカルデコード）したデコード視差画像D#2を求める。そして、演算部２２０は、対象ブロックをローカルデコードしたデコード視差画像D#2を、デブロッキングフィルタ２２１に供給して、処理は、ステップＳ１８からステップＳ１９に進む。

ステップＳ１９では、デブロッキングフィルタ２２１は、演算部２２０からのデコード視差画像D#2をフィルタリングし、DPB３１（図５）に供給して、処理は、ステップＳ２０に進む。

ステップＳ２０では、DPB３１が、視差画像D#1を符号化するエンコーダ２１から、その視差画像D#1を符号化して、ローカルデコードすることにより得られるデコード視差画像D#1が供給されるのを待って、そのデコード視差画像D#1を記憶し、処理は、ステップＳ２１に進む。

ステップＳ２１では、DPB３１が、デブロッキングフィルタ２２１からのデコード視差画像D#2を記憶し、処理は、ステップＳ２２に進む。

ステップＳ２２では、ワーピング部２３１が、DPB３１に記憶されたデコード視差画像D#1のピクチャをワーピングすることにより、ワープド視差画像D'#1のピクチャを生成し、ワープドピクチャバッファ２３２に供給して、処理は、ステップＳ２３に進む。

ステップＳ２３では、ワープドピクチャバッファ２３２が、ワーピング部２３１からのワープド視差画像D'#1のピクチャを記憶し、処理は、ステップＳ２４に進む。

ステップＳ２４では、参照インデクス割り当て部２３３が、DPB３１に記憶されたデコード視差画像D#1のピクチャと、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャとのそれぞれに、参照インデクスを割り当てる。

さらに、参照インデクス割り当て部２３３は、デコード視差画像D#1のピクチャと、ワープド視差画像D'#1のピクチャとのそれぞれに割り当てた参照インデクスを、視差予測部２３４に供給して、処理は、ステップＳ２４からステップＳ２５に進む。

ステップＳ２５では、画面内予測部２２２は、次に符号化の対象となるマクロブロックである次の対象ブロックについて、イントラ予測処理（画面内予測処理）を行う。

すなわち、画面内予測部２２２は、次の対象ブロックについて、DPB３１に記憶されたデコード視差画像D#2のピクチャから、予測画像（イントラ予測の予測画像）を生成するイントラ予測（画面内予測）を行う。

そして、画面内予測部２２２は、イントラ予測の予測画像を用いて、対象ブロックを符号化するのに要する符号化コストを求め、イントラ予測の予測画像とともに、予測画像選択部２２４に供給して、処理は、ステップＳ２５からステップＳ２６に進む。

ステップＳ２６では、視差予測部２３４は、次の対象ブロックについて、デコード視差画像D#1のピクチャ、及び、ワープド視差画像D'#1のピクチャを、候補ピクチャとして、視差予測処理を行う。

すなわち、視差予測部２３４は、次の対象ブロックについて、DPB３１に記憶され、参照インデクス割り当て部２３３によって参照インデクスが割り当てられたデコード視差画像D#1のピクチャ、及び、ワープドピクチャバッファ２３２に記憶され、参照インデクス割り当て部２３３によって参照インデクスが割り当てられたワープド視差画像D'#1のピクチャそれぞれを用いて、視差予測を行うことにより、マクロブロックタイプ等が異なるインター予測モードごとに、予測画像や符号化コスト等を求める。

さらに、視差予測部２３４は、符号化コストが最小のインター予測モードを、最適インター予測モードとして、その最適インター予測モードの予測画像を、符号化コストとともに、予測画像選択部２２４に供給して、処理は、ステップＳ２６からステップＳ２７に進む。

ステップＳ２７では、予測画像選択部２２４は、画面内予測部２２２からの予測画像（イントラ予測の予測画像）、及び、視差予測部２３４からの予測画像（インター予測の予測画像）のうちの、例えば、符号化コストが小さい方の予測画像を選択し、演算部２１３及び２２０に供給して、処理は、ステップＳ２８に進む。

ここで、予測画像選択部２２４がステップＳ２７で選択する予測画像が、次の対象ブロックの符号化で行われるステップＳ１３やＳ１８の処理で用いられる。

また、画面内予測部２２２は、ステップＳ２５のイントラ予測処理において得られるイントラ予測に関する情報を、ヘッダ情報として、可変長符号化部２１６に供給し、視差予測部２３４は、ステップＳ２６の視差予測処理で得られる視差予測（インター予測）に関する情報（最適インター予測モードを表すモード関連情報等）を、ヘッダ情報として、可変長符号化部２１６に供給する。

ステップＳ２８では、可変長符号化部２１６は、量子化部２１５からの量子化値に対して、可変長符号化を施し、符号化データを得る。

さらに、可変長符号化部２１６は、画面内予測部２２２、及び、視差予測部２３４それぞれからのヘッダ情報のうちの、符号化コストが小さい予測画像が生成された方からのヘッダ情報を選択し、符号化データのヘッダに含める。

そして、可変長符号化部２１６は、符号化データを、蓄積バッファ２１７に供給して、処理は、ステップＳ２８からステップＳ２９に進む。

ステップＳ２９では、蓄積バッファ２１７は、可変長符号化部２１６からの符号化データを一時記憶し、所定のデータレートで出力する。

蓄積バッファ２１７から出力された符号化データは、多重化部３２（図５）に供給される。

エンコーダ２２では、以上のステップＳ１１ないしＳ２９の処理が、適宜繰り返し行われる。

図１７は、図１６のステップＳ２６で、図１５の視差予測部２３４が行う視差予測処理を説明するフローチャートである。

ステップＳ４１において、視差予測部２３４は、DPB３１から候補ピクチャであるデコード視差画像D#1のピクチャを取得し、視差検出部２４１、及び、視差補償部２４２に供給して、処理は、ステップＳ４２に進む。

ステップＳ４２では、視差予測部２３４は、参照インデクス割り当て部２３３から、デコード視差画像D#1のピクチャに割り当てられた参照インデクスidxを取得し、視差検出部２４１、及び、視差補償部２４２に供給して、処理は、ステップＳ４３に進む。

ステップＳ４３では、視差検出部２４１が、画面並べ替えバッファ２１２から供給される原画像である視差画像D#2の（次の）対象ブロックの、参照インデクス割り当て部２３３からの参照インデクスidxが割り当てられているデコード視差画像D#1のピクチャに対する視差を表す計算視差ベクトルmvを、MEによって検出する。

そして、視差検出部２４１は、計算視差ベクトルmvを、視差補償部２４２に供給して、処理は、ステップＳ４３からステップＳ４４に進む。

ステップＳ４４では、視差補償部２４２は、デコード視差画像D#1のピクチャを、参照ピクチャとして、その参照ピクチャのずれ補償（視差補償）を、視差検出部２４１からの計算視差ベクトルmvを用いて行うことで、対象ブロックの予測画像ppを生成する。

そして、視差補償部２４２は、予測画像ppを、計算視差ベクトルmv、及び、参照インデクスidxとともに、コスト関数算出部２４４に供給して、処理は、ステップＳ４４からステップＳ４５に進む。

ステップＳ４５では、視差予測部２３４は、ワープドピクチャバッファ２３２から候補ピクチャであるワープド視差画像D'#1のピクチャを取得し、視差補償部２４３に供給して、処理は、ステップＳ４６に進む。

ステップＳ４６では、視差予測部２３４は、参照インデクス割り当て部２３３から、ワープド視差画像D'#1のピクチャに割り当てられた参照インデクスidx'を取得し、視差補償部２４３に供給して、処理は、ステップＳ４７に進む。

ステップＳ４７では、視差補償部２４３は、（次の）対象ブロックの、ワープド視差画像D'#1のピクチャに対する計算視差ベクトルmv'を0ベクトルに設定し、処理は、ステップＳ４８に進む。

ステップＳ４８では、視差補償部２４３は、ワープド視差画像D'#1のピクチャを、参照ピクチャとして、その参照ピクチャのずれ補償（視差補償）を、0ベクトルに設定した計算視差ベクトルmv'を用いて行うことで、対象ブロックの予測画像pp'を生成する。

そして、視差補償部２４２は、予測画像pp'を、計算視差ベクトルmv'、及び、参照インデクスidx'とともに、コスト関数算出部２４４に供給して、処理は、ステップＳ４８からステップＳ４９に進む。

ステップＳ４９では、予測ベクトル生成部２４６が、計算視差ベクトルmv及びmv'それぞれの予測ベクトルを生成し、コスト関数算出部２４４に供給して、処理は、ステップＳ５０に進む。

ステップＳ５０では、コスト関数算出部２４４は、画面並び替えバッファ２１２から供給される（次の）対象ブロック、視差補償部２４２から供給される予測画像pp、計算視差ベクトルmv、及び、参照インデクスidx、並びに、予測ベクトル生成部２４６から供給される予測ベクトルに基づいて、計算視差ベクトルmvと予測ベクトルとの残差ベクトルや、対象ブロックと予測画像ppとのSAD等の、コスト関数の演算に必要なパラメータを求める。

さらに、コスト関数算出部２４４は、そのパラメータを用いて、コスト関数を演算することにより、参照インデクスidx（が割り当てられたデコード視差画像D#1のピクチャ）について、マクロブロックタイプごとの符号化コストを算出し、処理は、ステップＳ５１に進む。

ステップＳ５１では、コスト関数算出部２４４は、画面並び替えバッファ２１２から供給される（次の）対象ブロック、視差補償部２４３から供給される予測画像pp'、計算視差ベクトルmv'、及び、参照インデクスidx'、並びに、予測ベクトル生成部２４６から供給される予測ベクトルに基づき、計算視差ベクトルmv'と予測ベクトルとの残差ベクトルや、対象ブロックと予測画像pp'とのSAD等の、コスト関数の演算に必要なパラメータを求める。

さらに、コスト関数算出部２４４は、そのパラメータを用いて、コスト関数を演算することにより、参照インデクスidx'（が割り当てられたワープド視差画像D'#1のピクチャ）について、マクロブロックタイプごとの符号化コストを算出する。

そして、コスト関数算出部２４４は、参照インデクスidx及びidx'のそれぞれについての、マクロブロックタイプごとの符号化コスト（コスト関数値）を、参照インデクス、予測画像、及び、残差ベクトル（視差ベクトル情報）とともに、モード選択部２４５に供給し、処理は、ステップＳ５１からステップＳ５２に進む。

ステップＳ５２では、モード選択部２４５は、コスト関数算出部２４４からの参照インデクスidx及びidx'のそれぞれについての、マクロブロックタイプごとの符号化コストの中から、最小値である最小コストを検出する。

さらに、モード選択部２４５は、最小コストが得られた参照インデクス、及び、マクロブロックタイプを、最適インター予測モードに選択して、処理は、ステップＳ５２からステップＳ５３に進む。

ステップＳ５３では、モード選択部２４５は、最適インター予測モードの予測画像と符号化コスト（最小コスト）を、予測画像選択部２２４に供給し、処理は、ステップＳ５４に進む。

ステップＳ５４では、モード選択部２４５は、最適インター予測モードを表すモード関連情報、最適インター予測モードの参照インデクス（予測用の参照インデクス）、及び、最適インター予測モードの視差ベクトル情報等を、ヘッダ情報として、可変長符号化部２１６に供給し、処理はリターンする。

［本技術を適用した多視点画像デコーダの一実施の形態］

図１８は、本技術を適用した多視点画像デコーダの一実施の形態の構成例を示すブロック図である。

図１８の多視点画像デコーダは、例えば、MVC方式を利用して、複数の視点の画像を符号化したデータを復号するデコーダであり、以下では、MVC方式と同様の処理については、適宜、説明を省略する。

なお、多視点画像デコーダは、MVC方式を利用するデコーダに限定されるものではない。

図１８の多視点画像デコーダでは、図５の多視点画像エンコーダが出力する多重化データが、２つの視点#1及び#2の色画像であるビュー#1の色画像C#1、及び、ビュー#2の色画像C#2、並びに、その２つの視点#1及び#2の視差情報画像であるビュー#1の視差画像D#1、及び、ビュー#2の視差画像D#2に復号される。

図１８において、多視点画像デコーダは、分離部３０１、デコーダ３１１，３１２，３２１，３２２、及び、DPB３３１を有する。

図５の多視点画像エンコーダが出力する多重化データは、図示せぬ記録媒体や伝送媒体を介して、分離部３０１に供給される。

分離部３０１は、そこに供給される多重化データから、色画像C#1の符号化データ、色画像C#2の符号化データ、視差画像D#1の符号化データ、視差画像D#2の符号化データ、及び、視差関連情報を分離する。

そして、分離部３０１は、色画像C#1の符号化データをデコーダ３１１に、色画像C#2の符号化データをデコーダ３１２に、視差画像D#1の符号化データをデコーダ３２１に、視差画像D#2の符号化データをデコーダ３２２に、それぞれ供給するとともに、視差関連情報を、デコーダ３１１，３１２，３２１、及び、３２２に供給する。

デコーダ３１１は、分離部３０１からの色画像C#1の符号化データを、必要に応じて、分離部３０１からの視差関連情報を用いて復号し、その結果得られる色画像C#1を出力する。

デコーダ３１２は、分離部３０１からの色画像C#2の符号化データを、必要に応じて、分離部３０１からの視差関連情報を用いて復号し、その結果得られる色画像C#2を出力する。

デコーダ３２１は、分離部３０１からの視差画像D#1の符号化データを、必要に応じて、分離部３０１からの視差関連情報を用いて復号し、その結果得られる視差画像D#1を出力する。

デコーダ３２２は、分離部３０１からの視差画像D#2の符号化データを、必要に応じて、分離部３０１からの視差関連情報を用いて復号し、その結果得られる視差画像D#2を出力する。

DPB３３１は、デコーダ３１１，３１２，３２１、及び、３２２それぞれで、復号対象の画像を復号することにより得られる復号後の画像（デコード画像）を、予測画像の生成時に参照する参照ピクチャの候補として一時記憶する。

すなわち、デコーダ３１１，３１２，３２１、及び、３２２は、それぞれ、図５のエンコーダ１１，１２，２１、及び、２２で予測符号化された画像を復号する。

予測符号化された画像を復号するには、その予測符号化で用いられた予測画像が必要であるため、デコーダ３１１，３１２，３２１、及び、３２２は、予測符号化で用いられた予測画像を生成するために、復号対象の画像を復号した後、予測画像の生成に用いる、復号後の画像を、DPB３３１に一時記憶させる。

DPB３３１は、デコーダ３１１，３１２，３２１、及び、３２２それぞれで得られる復号後の画像（デコード画像）を一時記憶する共用のバッファであり、デコーダ３１１，３１２，３２１、及び、３２２それぞれは、DPB３３１に記憶されたデコード画像から、復号対象の画像を復号するのに参照する参照ピクチャを選択し、その参照ピクチャを用いて、予測画像を生成する。

DPB３３１は、デコーダ３１１，３１２，３２１、及び、３２２で共用されるので、デコーダ３１１，３１２，３２１、及び、３２２それぞれは、自身で得られたデコード画像の他、他のデコーダで得られたデコード画像をも参照することができる。

［デコーダ３１１の構成例］

図１９は、図１８のデコーダ３１１の構成例を示すブロック図である。

なお、図１８のデコーダ３１２及び３２１も、デコーダ３１１と同様に構成され、例えば、MVC方式に従って、画像の符号化を行う。

図１９において、デコーダ３１１は、蓄積バッファ３４１、可変長復号部３４２、逆量子化部３４３、逆直交変換部３４４、演算部３４５、デブロッキングフィルタ３４６、画面並び替えバッファ３４７、D/A変換部３４８、画面内予測部３４９、インター予測部３５０、及び、予測画像選択部３５１を有する。

蓄積バッファ３４１には、分離部３０１（図１８）から、色画像C#1の符号化データが供給される。

蓄積バッファ３４１は、そこに供給される符号化データを一時記憶し、可変長復号部３４２に供給する。

可変長復号部３４２は、蓄積バッファ３４１からの符号化データを可変長復号することにより、量子化値やヘッダ情報を復元する。そして、可変長復号部３４２は、量子化値を、逆量子化部３４３に供給し、ヘッダ情報を、画面内予測部３４９、及び、インター予測部３５０に供給する。

逆量子化部３４３は、可変長復号部３４２からの量子化値を、変換係数に逆量子化し、逆直交変換部３４４に供給する。

逆直交変換部３４４は、逆量子化部３４３からの変換係数を逆直交変換し、マクロブロック単位で、演算部３４５に供給する。

演算部３４５は、逆直交変換部３４４から供給されるマクロブロックを復号対象の対象ブロックとして、その対象ブロックに対して、必要に応じて、予測画像選択部３５１から供給される予測画像を加算することで、デコード画像を求め、デブロッキングフィルタ３４６に供給する。

デブロッキングフィルタ３４６は、演算部３４５からのデコード画像に対して、例えば、図９のデブロッキングフィルタ１２１と同様のフィルタリングを行い、そのフィルタリング後のデコード画像を、画面並び替えバッファ３４７に供給する。

画面並び替えバッファ３４７は、デブロッキングフィルタ３４６からのデコード画像のピクチャを一時記憶して読み出すことで、ピクチャの並びを、元の並び（表示順）に並び替え、D/A(Digital/Analog)変換部３４８に供給する。

D/A変換部３４８は、画面並び替えバッファ３４７からのピクチャをアナログ信号で出力する必要がある場合に、そのピクチャをD/A変換して出力する。

また、デブロッキングフィルタ３４６は、フィルタリング後のデコード画像のうちの、参照可能ピクチャであるIピクチャ、Pピクチャ、及び、Bsピクチャのデコード画像を、DPB３３１に供給する。

ここで、DPB３３１は、デブロッキングフィルタ３４６からのデコード画像のピクチャ、すなわち、色画像C#1のピクチャを、時間的に後に行われる復号に用いる予測画像を生成するときに参照する参照ピクチャの候補（候補ピクチャ）として記憶する。

図１８で説明したように、DPB３３１は、デコーダ３１１，３１２，３２１、及び、３２２で共用されるので、デコーダ３１１において復号された色画像C#1のピクチャの他、デコーダ３１２において復号された色画像C#2のピクチャ、デコーダ３２１において復号された視差画像D#1のピクチャ、及び、デコーダ３２２において復号された視差画像D#2のピクチャも記憶する。

画面内予測部３４９は、可変長復号部３４２からのヘッダ情報に基づき、対象ブロックが、イントラ予測（画面内予測）で生成された予測画像を用いて符号化されているかどうかを認識する。

対象ブロックが、イントラ予測で生成された予測画像を用いて符号化されている場合、画面内予測部３４９は、図９の画面内予測部１２２と同様に、DPB３３１から、対象ブロックを含むピクチャ（対象ピクチャ）のうちの、既に復号されている部分（デコード画像）を読み出す。そして、画面内予測部３４９は、DPB３３１から読み出した、対象ピクチャのうちのデコード画像の一部を、対象ブロックの予測画像として、予測画像選択部３５１に供給する。

インター予測部３５０は、可変長復号部３４２からのヘッダ情報に基づき、対象ブロックが、インター予測で生成された予測画像を用いて符号化されているかどうかを認識する。

対象ブロックが、インター予測で生成された予測画像を用いて符号化されている場合、インター予測部３５０は、可変長復号部３４２からのヘッダ情報に基づき、予測用の参照インデクス、すなわち、対象ブロックの予測画像の生成に用いられた参照ピクチャに割り当てられている参照インデクスを認識する。

そして、インター予測部３５０は、DPB３３１に記憶されている候補ピクチャから、予測用の参照インデクスが割り当てられている候補ピクチャを、参照ピクチャとして読み出す。

さらに、インター予測部３５０は、可変長復号部３４２からのヘッダ情報に基づき、対象ブロックの予測画像の生成に用いられたずれベクトル（視差ベクトル、動きベクトル）を認識し、図９のインター予測部１２３と同様に、そのずれベクトルに従って、参照ピクチャのずれ補償（動き分のずれを補償する動き補償、又は、視差分のずれを補償する視差補償）を行うことで、予測画像を生成する。

すなわち、インター予測部３５０は、候補ピクチャの、対象ブロックの位置から、その対象ブロックのずれベクトルに従って移動した（ずれた）位置のブロック（対応ブロック）を、予測画像として取得する。

そして、インター予測部３５０は、予測画像を、予測画像選択部３５１に供給する。

予測画像選択部３５１は、画面内予測部３４９から予測画像が供給される場合には、その予測画像を、インター予測部３５０から予測画像が供給される場合には、その予測画像を、それぞれ選択し、演算部３４５に供給する。

［デコーダ３２２の構成例］

図２０は、図１８のデコーダ３２２の構成例を示すブロック図である。

デコーダ３２２は、復号対象であるビュー#2の視差画像D#2の符号化データを、MVC方式を利用して、すなわち、図１３のエンコーダ２２で行われるローカルデコードと同様にして行う。

図２０において、デコーダ３２２は、蓄積バッファ４４１、可変長復号部４４２、逆量子化部４４３、逆直交変換部４４４、演算部４４５、デブロッキングフィルタ４４６、画面並び替えバッファ４４７、D/A変換部４４８、画面内予測部４４９、予測画像選択部４５１、ワーピング部４６１、ワープドピクチャバッファ４６２、及び、視差予測部４６３を有する。

蓄積バッファ４４１ないし画面内予測部４４９、及び、予測画像選択部４５１は、図１９の蓄積バッファ３４１ないし画面内予測部３４９、及び、予測画像選択部３５１と、それぞれ同様に構成されるので、その説明は、適宜省略する。

図２０において、DPB３３１には、デブロッキングフィルタ４４６から、デコード画像、すなわち、デコーダ３２２において復号された視差画像であるデコード視差画像D#2のピクチャが供給され、参照ピクチャとなりうる候補ピクチャとして記憶される。

また、DPB３３１には、図１８や図１９で説明したように、デコーダ３１１において復号された色画像C#1のピクチャ、デコーダ３１２において復号された色画像C#2のピクチャ、及び、デコーダ３２１において復号された視差画像（デコード視差画像）D#1のピクチャも供給されて記憶される。

但し、デコーダ３２２では、デブロッキングフィルタ４４６からのデコード視差画像D#2のピクチャの他、デコーダ３２１で得られるデコード視差画像D#1が、復号対象である視差画像D#2の復号に用いられるので、図２０では、デコーダ３２１で得られるデコード視差画像D#1が、DPB３３１に供給されることを示す矢印を、図示してある。

ワーピング部４６１には、視差関連情報（図１８）としての、撮影視差ベクトルd（視点#1の撮影視差ベクトルd1）の最大値dmax及び最小値dmin、基線長L、焦点距離fが供給される。

ワーピング部４６１は、DPB３３１に記憶された、デコード視差画像D#1及びD#2のピクチャのうちの、デコード視差画像D#1のピクチャを取得する（読み出す）。

そして、ワーピング部４６１は、図１３のワーピング部２３１と同様に、視差関連情報を必要に応じて用いて、DPB３３１から取得したデコード視差画像D#1のピクチャをワーピングすることにより、そのデコード視差画像D#1のピクチャを視点#2で得られる画像（視差画像）に変換したワープド画像であるワープド視差画像D'#1のピクチャを生成する。

ワーピング部４６１は、デコード視差画像D#1のピクチャのワーピングによって、ワープド視差画像D'#1のピクチャを生成すると、そのワープド視差画像D'#1のピクチャを、ワープドピクチャバッファ４６２に供給する。

ワープドピクチャバッファ４６２は、ワーピング部４６１からのワープド視差画像D'#1のピクチャを、一時記憶する。

なお、本実施の形態では、DPB３３１とは別に、ワープド視差画像D'#1のピクチャを記憶するワープドピクチャバッファ４６２を設けてあるが、DPB３３１とワープドピクチャバッファ４６２とは、１つのバッファで兼用することが可能である。

視差予測部４６３は、可変長復号部３４２からのヘッダ情報に基づき、対象ブロックが、視差予測（インター予測）で生成された予測画像を用いて符号化されているかどうかを認識する。

対象ブロックが、視差予測で生成された予測画像を用いて符号化されている場合、視差予測部４６３は、可変長復号部３４２からのヘッダ情報に基づき、予測用の参照インデクス、すなわち、対象ブロックの予測画像の生成に用いられた参照ピクチャに割り当てられている参照インデクスを認識（取得）する。

そして、視差予測部４６３は、DPB３３１に記憶されている候補ピクチャとしてのデコード視差画像D#1のピクチャ、及び、ワープドピクチャバッファ４６２に記憶されている候補ピクチャとしてのワープド視差画像D'#1のピクチャのうちの、予測用の参照インデクスが割り当てられている候補ピクチャを、参照ピクチャとして選択する。

さらに、視差予測部４６３は、可変長復号部３４２からのヘッダ情報に基づき、候補ブロックの予測画像の生成に用いられたずれベクトルとしての計算視差ベクトルを認識し、図１３の視差予測部２３４と同様に、その計算視差ベクトルに従って、視差予測を行うことで、予測画像を生成する。

すなわち、視差予測部４６３は、候補ピクチャの、対象ブロックの位置から、その対象ブロックの計算視差ベクトルに従って移動した（ずれた）位置のブロック（対応ブロック）を、予測画像として取得する。

そして、視差予測部４６３は、予測画像を、予測画像選択部４５１に供給する。

なお、図２０においては、説明を簡単にするため、図１３のエンコーダ２２の場合と同様に、デコーダ３２２に、インター予測のうちの視差予測を行う視差予測部４６３を設けてあるが、図１３のエンコーダ２２が、視差予測の他、時間予測も行う場合には、デコーダ３２２でも、エンコーダ２２で行われるのと同様にして、視差予測、及び、時間予測（による予測画像の生成）が行われる。

図２１は、図２０の視差予測部４６３の構成例を示すブロック図である。

図２１において、視差予測部４６３は、参照ピクチャ選択部４７１、予測ベクトル生成部４７２、及び、視差補償部４７３を有する。

参照ピクチャ選択部４７１には、DPB３３１に記憶されたデコード視差画像D#1のピクチャと、ワープドピクチャバッファ４６２に記憶されたワープド視差画像D'#1ピクチャとが供給される。

さらに、参照ピクチャ選択部４７１には、可変長復号部４４２から、ヘッダ情報に含まれる、対象ブロックの予測用の参照インデクスが供給される。

参照ピクチャ選択部４７１は、DPB３３１に記憶されたデコード視差画像D#1のピクチャと、ワープドピクチャバッファ４６２に記憶されたワープド視差画像D'#1ピクチャとを、参照ピクチャの候補（候補ピクチャ）として、そのデコード視差画像D#1のピクチャと、ワープド視差画像D'#1ピクチャとのうちの、可変長復号部４４２からの予測用の参照インデクスが割り当てられている方のピクチャを、参照ピクチャに選択し、可変長復号部４４２からの予測用の参照インデクスとともに、視差補償部７７３に供給する。

予測ベクトル生成部４７２は、図１５の予測ベクトル生成部２４６と同様にして予測ベクトルを生成し、視差補償部４７３に供給する。

視差補償部４７３には、参照ピクチャ選択部４７１から、予測用の参照インデクスが割り当てられた参照ピクチャが供給されるとともに、予測ベクトル生成部４７３から、予測ベクトルが供給される他、可変長復号部４７２から、ヘッダ情報に含まれるモード関連情報、及び、視差ベクトル情報が供給される。

視差補償部４７３は、可変長復号部４７２からの視差ベクトル情報である残差ベクトルと、予測ベクトル生成部４７２からの予測ベクトルとを加算することで、対象ブロックの計算視差ベクトルとしてのずれベクトルを復号する。

さらに、視差補償部４７３は、モード関連情報（最適インター予測モード）に従い、参照ピクチャ選択部４７１からの参照ピクチャのずれ補償（視差補償）を、対象ブロックの計算視差ベクトルを用いて、MVC方式と同様にして行うことで、対象ブロックの予測画像を生成する。

すなわち、視差補償部４７３は、例えば、参照ピクチャの、対象ブロックの位置から、計算視差ベクトルだけずれた位置のブロックである対応ブロックを、予測画像として取得する。

そして、視差補償部４７３は、予測画像を、予測画像選択部４５１に供給する。

図２２は、図２０のデコーダ３２２が行う、ビュー#2の視差画像D#2の符号化データを復号する復号処理を説明するフローチャートである。

ステップＳ１１１において、蓄積バッファ４４１は、そこに供給されるビュー#2の視差画像D#2の符号化データを記憶し、処理は、ステップＳ１１２に進む。

ステップＳ１１２では、可変長復号部４４２は、蓄積バッファ４４１に記憶された符号化データを読み出して可変長復号することにより、量子化値やヘッダ情報を復元する。そして、可変長復号部４４２は、量子化値を、逆量子化部４４３に供給し、ヘッダ情報を、画面内予測部４４９、及び、視差予測部４５０に供給して、処理は、ステップＳ１１３に進む。

ステップＳ１１３では、逆量子化部４４３は、可変長復号部４４２からの量子化値を、変換係数に逆量子化し、逆直交変換部４４４に供給して、処理は、ステップＳ１１４に進む。

ステップＳ１１４では、逆直交変換部４４４は、逆量子化部４４３からの変換係数を逆直交変換し、マクロブロック単位で、演算部４４５に供給して、処理は、ステップＳ１１５に進む。

ステップＳ１１５では、演算部４４５は、逆直交変換部４４４からのマクロブロックを復号対象の対象ブロック（残差画像）として、その対象ブロックに対して、必要に応じて、予測画像選択部４５１から供給される予測画像を加算することで、デコード画像を求める。そして、演算部４４５は、デコード画像を、デブロッキングフィルタ４４６に供給し、処理は、ステップＳ１１５からステップＳ１１６に進む。

ステップＳ１１６では、デブロッキングフィルタ４４６は、演算部４４５からのデコード画像に対して、フィルタリングを行い、そのフィルタリング後のデコード画像（デコード視差画像D#2）を、DPB３３１、及び、画面並び替えバッファ４４７に供給して、処理は、ステップＳ１１７に進む。

ステップＳ１１７では、DPB３３１が、視差画像D#1を復号するデコーダ３２１から、デコード視差画像D#1が供給されるのを待って、そのデコード視差画像D#1を記憶し、処理は、ステップＳ１１８に進む。

ステップＳ１１８では、DPB３３１が、デブロッキングフィルタ４４６からのデコード視差画像D#2を記憶し、処理は、ステップＳ１１９に進む。

ステップＳ１１９では、ワーピング部４６１が、DPB３３１に記憶されたデコード視差画像D#1のピクチャをワーピングすることにより、ワープド視差画像D'#1のピクチャを生成し、ワープドピクチャバッファ４６２に供給して、処理は、ステップＳ１２０に進む。

ステップＳ１２０では、ワープドピクチャバッファ４６２が、ワーピング部４６１からのワープド視差画像D'#1のピクチャを記憶し、処理は、ステップＳ１２１に進む。

ステップＳ１２１では、画面内予測部４４９、及び、視差予測部４６３が、可変長復号部４４２から供給されるヘッダ情報に基づき、次の対象ブロック（次に復号対象となるマクロブロック）が、イントラ予測（画面内予測）、及び、視差予測（インター予測）のうちのいずれの予測方式で生成された予測画像を用いて符号化されているかを認識する。

そして、次の対象ブロックが、画面内予測で生成された予測画像を用いて符号化されている場合には、画面内予測部４４９が、イントラ予測処理（画面内予測処理）を行う。

すなわち、画面内予測部４４９は、次の対象ブロックについて、DPB３３１に記憶されたデコード視差画像D#2のピクチャから、予測画像（イントラ予測の予測画像）を生成するイントラ予測（画面内予測）を行い、その予測画像を、予測画像選択部４５１に供給して、処理は、ステップＳ１２１からステップＳ１２２に進む。

また、次の対象ブロックが、視差予測（インター予測）で生成された予測画像を用いて符号化されている場合には、視差予測部４６３が、視差予測処理（インター予測処理）を行う。

すなわち、視差予測部４６３は、次の対象ブロックについて、DPB３３１に記憶されたデコード視差画像D#1のピクチャ、及び、ワープドピクチャバッファ４６２に記憶されたワープド視差画像D'#1のピクチャのうちの、可変長復号部４４２からのヘッダ情報に含まれる、次の対象ブロックの予測用の参照インデクスが割り当てられている方のピクチャを参照ピクチャに選択する。

さらに、視差予測部４６３は、可変長復号部４４２からのヘッダ情報に含まれるモード関連情報、及び、視差ベクトル情報を用いて、視差予測（視差補償）を行うことにより、予測画像を生成し、その予測画像を、予測画像選択部４５１に供給して、処理は、ステップＳ１２１からステップＳ１２２に進む。

ステップＳ１２２では、予測画像選択部４５１は、画面内予測部４４９、及び、視差予測部４６３のうちの、予測画像が供給される方からの、その予測画像を選択し、演算部４４５に供給して、処理は、ステップＳ１２３に進む。

ここで、予測画像選択部４５１がステップＳ１２２で選択する予測画像が、次の対象ブロックの復号で行われるステップＳ１１５の処理で用いられる。

ステップＳ１２３では、画面並び替えバッファ４４７が、デブロッキングフィルタ４４６からのデコード視差画像D#2のピクチャを一時記憶して読み出すことで、ピクチャの並びを、元の並びに並び替え、D/A変換部４４８に供給して、処理は、ステップＳ１２４に進む。

ステップＳ１２４では、D/A変換部３４８は、画面並び替えバッファ４４７からのピクチャをアナログ信号で出力する必要がある場合に、そのピクチャをD/A変換して出力する。

デコーダ３２２では、以上のステップＳ１１１ないしＳ１２４の処理が、適宜繰り返し行われる。

図２３は、図２２のステップＳ１２１で、図２１の視差予測部４６３が行う視差予測処理を説明するフローチャートである。

ステップＳ１３１において、視差予測部４６３の参照ピクチャ選択部４７１は、可変長復号部４４２からのヘッダ情報に含まれる、（次の）対象ブロックの予測用の参照インデクスを取得し、処理は、ステップＳ１３２に進む。

ステップＳ１３２では、参照ピクチャ選択部４７１が、予測用の参照インデクスの値を判定する。

ステップＳ１３２において、予測用の参照インデクスが、0であると判定された場合、処理は、ステップＳ１３３に進み、参照ピクチャ選択部４７１は、候補ピクチャであるデコード視差画像D#1のピクチャ、及び、ワープド視差画像D'#1のピクチャのうちの、値0の参照インデクスが割り当てられているワープド視差画像D'#1のピクチャを、ワープドピクチャバッファ４６２から取得する。

そして、参照ピクチャ選択部４７１は、ワープド視差画像D'#1のピクチャを、参照ピクチャとして、視差補償部４７３に供給して、処理は、ステップＳ１３３からステップＳ１３５に進む。

また、ステップＳ１３２において、予測用の参照インデクスが、1であると判定された場合、処理は、ステップＳ１３４に進み、参照ピクチャ選択部４７１は、候補ピクチャであるデコード視差画像D#1のピクチャ、及び、ワープド視差画像D'#1のピクチャのうちの、値1の参照インデクスが割り当てられているデコード視差画像D#1のピクチャを、DPB３３１から取得する。

そして、参照ピクチャ選択部４７１は、デコード視差画像D#1のピクチャを、参照ピクチャとして、視差補償部４７３に供給して、処理は、ステップＳ１３４からステップＳ１３５に進む。

ステップＳ１３５では、視差補償部４７３が、可変長復号部４４２からのヘッダ情報に含まれるモード関連情報、及び、視差ベクトル情報（残差ベクトル）を取得し、処理は、ステップＳ１３６に進む。

ステップＳ１３６では、予測ベクトル生成部４７２が、予測ベクトルを生成し、視差補償部４７３に供給して、処理は、ステップＳ１３７に進む。

ステップＳ１３７では、視差補償部４７３は、可変長復号部４７２からの視差ベクトル情報である残差ベクトルと、予測ベクトル生成部４７２からの予測ベクトルとを加算することで、対象ブロックの計算視差ベクトルとしてのずれベクトルを復号し、処理は、ステップＳ１３７からステップＳ１３８に進む。

ステップＳ１３８では、視差補償部４７３は、モード関連情報に従い、参照ピクチャ選択部４７１からの参照ピクチャのずれ補償（視差補償）を、対象ブロックの計算視差ベクトルを用いて行うことで、対象ブロックの予測画像を生成し、処理は、ステップＳ１３９に進む。

ステップＳ１３９では、視差補償部４７３は、予測画像を、予測画像選択部４５１に供給して、処理はリターンする。

ここで、以上のように、符号化対象／復号対象の画像とは異なる視点の画像をワーピングすることにより生成されるワープド画像のピクチャが、少なくとも含まれる候補ピクチャに、参照インデクスを割り当てておく符号化／復号を、ワープド参照割り当て方式ともいう。

ワープド参照割り当て方式は、視差画像の符号化及び復号の他、色画像の符号化及び復号にも適用することができる。

［ワープド参照割り当て方式の色画像への適用］

図２４は、色画像を対象とするワープド参照割り当て方式を説明する図である。

図２４では、色画像C#2の対象ブロックの符号化にあたって、（ローカルデコード後の）色画像C#1をワーピングすることにより生成されるワープド色画像C'#1（のピクチャ）と、色画像C#1（のピクチャ）とが、参照ピクチャとなりうるピクチャ（候補ピクチャ）とされている。

ワープド色画像C'#1（のピクチャ）を参照ピクチャとする場合には、ずれベクトルが0ベクトルであると仮定して、MCによって、色画像C#2の対象ブロックであるブロックMBC#21の位置から、ずれベクトルだけずれた位置のブロック、つまり、対象ブロックMBC#21と同一の位置のブロックMBC'#11が、予測画像として取得される。

そして、例えば、対象ブロックMBC#21の、予測画像であるブロックMBC'#11との残差に対応する値であるSADと、ずれベクトルの符号量に対応する値MVとを用いて、ワープド色画像C'#1を参照ピクチャとする場合の、対象ブロックMBC#21の符号化に要する符号化コストCOST=COST1'が、上述の式（１）に従って算出される。

ここで、ワープド色画像C'#1は、視点#1の色画像C#1を、視点#2から見た画像に変換した画像であり、視点#2の色画像C#2との間に、視差がない（視差の補償がされている）と推定することができるので、視差画像を対象とするワープド参照割り当て方式の場合と同様に、ワープド色画像C'#1を参照ピクチャとする場合には、ずれベクトルとして、0ベクトルが仮定される。

さらに、視差画像を対象とするワープド参照割り当て方式の場合と同様に、式（１）の符号化コストCOSTの計算にあたっては、ずれベクトルの符号量に対応する値MVとして、０が採用される。

したがって、ワープド色画像C'#1を参照ピクチャとして用いて、対象ブロックMBC#21を符号化するときの符号化コストCOST1'は、視差画像を対象とするワープド参照割り当て方式の場合と同様に、式COST1'＝SAD＋λ×０＝SADで表される。

一方、色画像C#1（のピクチャ）を参照ピクチャとする場合には、対象ブロックMBC#21と、色画像C#1との間で、MEを行うことによって、ずれベクトル（計算視差ベクトル）が検出される。

さらに、MCによって、色画像C#1において、対象ブロックMBC#21の位置から、ずれベクトルだけずれた位置のブロック（対応ブロック）MBC#11が、予測画像として取得される。

そして、対象ブロックMBC#21の、予測画像であるブロックMBC#11との残差に対応する値であるSADと、ずれベクトルの符号量に対応する値MVとを用いて、色画像C#1を参照ピクチャとする場合の、対象ブロックMBC#21の符号化に要する符号化コストCOST=COST1が、式（１）に従って算出される。

以上のように、ワープド色画像C'#1を参照ピクチャとする場合の、対象ブロックMBC#21の符号化に要する符号化コスト（ワープド色画像C'#1についての符号化コスト）COST1'と、色画像C#1を参照ピクチャとする場合の、対象ブロックMBC#21の符号化に要する符号化コスト（色画像C#1についての符号化コスト）COST1との算出後、その符号化コストCOST1'及びCOST1に基づいて、ワープド色画像C'#1、及び、色画像C#1のうちの、符号化コストが小さい方が、対象ブロックMBC#21の符号化に用いる参照ピクチャとして選択される。

なお、視差画像を対象とするワープド参照割り当て方式の場合と同様の理由から、ワープド色画像C'#1には、値が0（第１の値）の参照インデクスref_idxが割り当てられ、色画像C#1には、値が1（第２の値）の参照インデクスref_idxが割り当てられる。

したがって、色画像を対象とするワープド参照割り当て方式によれば、視差画像を対象とするワープド参照割り当て方式と同様の効果を奏することができる。

［ワープド参照割り当て方式で色画像を符号化するエンコーダ１２の構成例］

図２５は、ワープド参照割り当て方式で色画像C#2を符号化する図５のエンコーダ１２の構成例を示すブロック図である。

図２５において、エンコーダ１２は、A/D変換部５１１、画面並び替えバッファ５１２、演算部５１３、直交変換部５１４、量子化部５１５、可変長符号化部５１６、蓄積バッファ５１７、逆量子化部５１８、逆直交変換部５１９、演算部５２０、デブロッキングフィルタ５２１、画面内予測部５２２、予測画像選択部５２４、ワーピング部５３１、ワープドピクチャバッファ５３２、参照インデクス割り当て部５３３、及び、視差予測部５３４を有する。

A/D変換部５１１ないし画面内予測部５２２、予測画像選択部５２４、ワーピング部５３１ないし視差予測部５３４は、視差画像ではなく、色画像を対象として処理を行うことを除き、図１３のエンコーダ２２のA/D変換部２１１ないし画面内予測部２２２、予測画像選択部２２４、ワーピング部２３１ないし視差予測部２３４と、それぞれ同様の処理を行う。

なお、図２５において、DPB３１には、デブロッキングフィルタ５２１から、デコード画像、すなわち、エンコーダ１２において符号化されてローカルデコードされた色画像（以下、デコード色画像ともいう）C#2のピクチャが供給され、参照ピクチャとなりうる候補ピクチャとして記憶される。

また、DPB３１には、図５や図９で説明したように、エンコーダ１１において符号化されてローカルデコードされた色画像（デコード色画像）C#1のピクチャ、エンコーダ２１において符号化されてローカルデコードされた視差画像（デコード視差画像）D#1のピクチャ、エンコーダ２２において符号化されてローカルデコードされた視差画像（デコード視差画像）D#2のピクチャも供給されて記憶される。

但し、エンコーダ１２では、デブロッキングフィルタ５２１からのデコード色画像C#2のピクチャの他、エンコーダ１１で得られるデコード色画像C#1、及び、エンコーダ２１で得られるデコード視差画像D#1が、符号化対象である色画像C#2の符号化に用いられるので、図２５では、エンコーダ１１で得られるデコード色画像C#1、及び、エンコーダ２１で得られるデコード視差画像D#1が、DPB３１に供給されることを示す矢印を、図示してある。

なお、DPB３１に記憶されたデコード視差画像D#1は、ワーピング部５３１において、DPB３１に記憶されたデコード色画像C#1のピクチャをワーピングすることにより、そのデコード色画像C#1のピクチャを視点#2で得られる画像（色画像）に変換したワープド画像であるワープド色画像C'#1のピクチャを生成するために用いられる。

すなわち、ワーピング部５３１は、図１３のワーピング部２３１と同様に、デコード視差画像D#1のピクチャの各画素の画素値である視差値νを、式（３）に従って、画素ごとの撮影視差ベクトルdに変換する。

そして、ワーピング部５３１は、デコード色画像C#1のピクチャの各画素を、その画素の撮影視差ベクトルdに従って移動するワーピングを行うことにより、ワープド色画像C'#1のピクチャを生成する。

なお、ワープド色画像C'#1のピクチャに、画素値がない、穴が空いたオクルージョン部分が生じる場合には、オクルージョン部分の画素は、周辺の画素によって補間される。

ここで、図２で説明したように、色画像C#1をワーピングすることにより得られるワープド色画像C'#1については、オクルージョン部分の周辺の画素によって、オクルージョン部分を補間した場合に、そのオクルージョン部分と、色画像C#2の、オクルージョン部分と同一の位置の部分との相関は、高くならないことが多い。

その結果、色画像C#2の対象ブロックが、ワープド色画像C'#1のオクルージョン部分と同一の位置の部分を含む場合には、ワープド色画像C'#1のピクチャを参照ピクチャとするときの符号化コストが大になるが、その場合、他の候補ピクチャである色画像C#1のピクチャが参照ピクチャに選択されることになるので、問題はない。

図２６は、図２５の視差予測部５３４の構成例を示すブロック図である。

図２６において、視差予測部５３４は、視差検出部５４１、視差補償部５４２及び５４３、コスト関数算出部５４４、モード選択部５４５、並びに、予測ベクトル生成部５４６を有する。

視差検出部５４１ないし予測ベクトル生成部５４６は、視差画像に代えて色画像を対象として処理を行うことを除き、図１５の視差検出部２４１ないし予測ベクトル生成部２４６と、それぞれ同様の処理を行う。

図２７は、図２５のエンコーダ１２が行う、ビュー#2の色画像C#2を符号化する符号化処理を説明するフローチャートである。

図２５のエンコーダ１２では、ステップＳ２０１ないしＳ２０９において、視差画像に代えて色画像を対象として、図１６のステップＳ１１ないしＳ１９とそれぞれ同様の処理が行われることにより、デブロッキングフィルタ５２１でのフィルタリングにより得られるデコード色画像C#2が、DPB３１（図５）に供給され、処理は、ステップＳ２１０に進む。

ステップＳ２１０では、DPB３１が、色画像C#1を符号化するエンコーダ２１から、その色画像C#1を符号化して、ローカルデコードすることにより得られるデコード色画像C#1が供給されるのを待って、そのデコード色画像C#1を記憶し、処理は、ステップＳ２１１に進む。

ステップＳ２１１では、DPB３１が、視差画像D#1を符号化するエンコーダ１１から、その視差画像D#1を符号化して、ローカルデコードすることにより得られるデコード視差画像D#1が供給されるのを待って、そのデコード視差画像D#1を記憶し、処理は、ステップＳ２１２に進む。

ステップＳ２１２では、DPB３１が、デブロッキングフィルタ５２１からのデコード色画像C#2を記憶し、処理は、ステップＳ２１３に進む。

ステップＳ２１３では、ワーピング部５３１が、DPB３１に記憶されたデコード色画像C#1のピクチャを、DPB３１に記憶されたデコード視差画像D#1のピクチャを用いてワーピングすることにより、ワープド色画像C'#1のピクチャを生成し、ワープドピクチャバッファ５３２に供給して、処理は、ステップＳ２１４に進む。

以下、ステップＳ２１４ないしＳ２２０では、エンコーダ１２において、視差画像に代えて色画像を対象として、図１６のステップＳ２３ないしＳ２９とそれぞれ同様の処理が行われる。

図２８は、図２６の視差予測部５３４が（図２７のステップＳ２１７で）行う視差予測処理を説明するフローチャートである。

図２６の視差予測部５３４では、ステップＳ２４１ないしＳ２５４において、視差画像に代えて色画像を対象として、図１７のステップＳ４１ないしＳ５４とそれぞれ同様の処理が行われる。

［ワープド参照割り当て方式で色画像を復号するデコーダ３１２の構成例］

図２９は、エンコーダ１２が図２５に示したように構成される場合の、図１８のデコーダ３１２の構成例、すなわち、ワープド参照割り当て方式で色画像C#2を復号するデコーダ３１２の構成例を示すブロック図である。

図２９において、デコーダ３１２は、蓄積バッファ６４１、可変長復号部６４２、逆量子化部６４３、逆直交変換部６４４、演算部６４５、デブロッキングフィルタ６４６、画面並び替えバッファ６４７、D/A変換部６４８、画面内予測部６４９、予測画像選択部６５１、ワーピング部６６１、ワープドピクチャバッファ６６２、及び、視差予測部６６３を有する。

蓄積バッファ６４１ないし画面内予測部６４９、予測画像選択部６５１、及び、ワーピング部６６１ないし視差予測部６６３は、視差画像ではなく、色画像を対象として処理を行うことを除き、図２９のデコーダ３２２の蓄積バッファ４４１ないし画面内予測部４４９、予測画像選択部４５１、及び、ワーピング部４６１ないし視差予測部４６３と、それぞれ同様の処理を行う。

なお、図２９において、DPB３３１には、デブロッキングフィルタ６４６から、デコード画像、すなわち、デコーダ３１２において復号された色画像であるデコード色画像C#2のピクチャが供給され、参照ピクチャとなりうる候補ピクチャとして記憶される。

また、DPB３３１には、図１８や図１９で説明したように、デコーダ３１１において復号された色画像（デコード色画像）C#1のピクチャ、デコーダ３２１において復号された視差画像（デコード視差画像）D#1のピクチャ、及び、デコーダ３２２において復号された視差画像（デコード視差画像）D#2のピクチャも供給されて記憶される。

但し、デコーダ３１２では、デブロッキングフィルタ６４６からのデコード色画像C#2のピクチャの他、デコーダ３１１で得られるデコード色画像C#1、及び、デコーダ３２１で得られるデコード視差画像D#1のピクチャが、復号対象である色画像C#2の復号に用いられるので、図２９では、デコーダ３１１で得られるデコード色画像C#1、及び、デコーダ３２１で得られるデコード視差画像D#1が、DPB３３１に供給されることを示す矢印を、図示してある。

なお、DPB３３１に記憶されたデコード視差画像D#1は、ワーピング部６６１において、図２５のワーピング部５３１と同様に、DPB３３１に記憶されたデコード色画像C#1のピクチャをワーピングすることにより、そのデコード色画像C#1のピクチャを視点#2で得られる画像（色画像）に変換したワープド画像であるワープド色画像C'#1のピクチャを生成するために用いられる。

図３０は、図２９の視差予測部６６３の構成例を示すブロック図である。

図３０において、視差予測部６６３は、参照ピクチャ選択部６７１、予測ベクトル生成部６７２、及び、視差補償部６７３を有する。

参照ピクチャ選択部６７１ないし視差補償部６７３は、視差画像ではなく、色画像を対象として処理を行うことを除き、図２５の視差予測部４６３の参照ピクチャ選択部４７１ないし視差補償部４７３と、それぞれ同様の処理を行う。

図３１は、図２９のデコーダ３１２が行う、ビュー#2の色画像C#2の符号化データを復号する復号処理を説明するフローチャートである。

図２９のデコーダ３１２では、ステップＳ３１１ないしＳ３１６において、視差画像に代えて色画像を対象として、図２２のステップＳ１１１ないしＳ１１６とそれぞれ同様の処理が行われることにより、デブロッキングフィルタ６４６でのフィルタリングにより得られるデコード色画像C#2が、DPB３３１に供給され、処理は、ステップＳ３１７に進む。

ステップＳ３１７では、DPB３３１が、色画像C#1を復号するデコーダ３１１から、デコード色画像C#1が供給されるのを待って、そのデコード色画像C#1を記憶し、処理は、ステップＳ３１８に進む。

ステップＳ３１８では、DPB３３１が、視差画像D#1を復号するデコーダ３２１から、デコード視差画像D#1が供給されるのを待って、そのデコード視差画像D#1を記憶し、処理は、ステップＳ３１９に進む。

ステップＳ３１９では、DPB３３１が、デブロッキングフィルタ６４６からのデコード色画像C#2を記憶し、処理は、ステップＳ３２０に進む。

ステップＳ３２０では、ワーピング部６６１が、DPB３３１に記憶されたデコード色画像C#1のピクチャを、DPB３３１に記憶されたデコード視差画像D#1のピクチャを用いてワーピングすることにより、ワープド色画像C'#1のピクチャを生成し、ワープドピクチャバッファ６６２に供給して、処理は、ステップＳ３２１に進む。

以下、ステップＳ３２１ないしＳ３２５では、デコーダ３１２において、視差画像に代えて色画像を対象として、図２２のステップＳ１２０ないしＳ１２４とそれぞれ同様の処理が行われる。

図３２は、図３０の視差予測部６６３が（図３１のステップＳ３２２で）行う視差予測処理を説明するフローチャートである。

図３０の視差予測部６６３では、ステップＳ３３１ないしＳ３３９において、視差画像に代えて色画像を対象として、図２３のステップＳ１３１ないしＳ１３９とそれぞれ同様の処理が行われる。

［時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式］

図３３は、時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式を説明する図である。

図１３で説明したように、エンコーダ２２（図５）では、視差予測、及び、時間予測の両方を行うことができる。

視差画像D#2を符号化するエンコーダ２２において、視差予測、及び、時間予測の両方を行う場合、視差予測で参照されうるワープド視差画像D'#1のピクチャや、デコード視差画像D#1のピクチャの他、時間予測で参照されうるデコード視差画像D#2のピクチャが、候補ピクチャとなり、参照インデクスが割り当てられる。

ここで、以下、説明を簡単にするため、視差画像D#2を符号化するエンコーダ２２において、視差予測、及び、時間予測の両方を行う場合の候補ピクチャとして、視差予測で参照されるワープド視差画像D'#1のピクチャと、時間予測で参照されるデコード視差画像D#2のピクチャとを採用することとする。

図３３では、符号化対象の視差画像D#2の対象ピクチャとしての第tピクチャの対象ブロックの符号化にあたって、（ローカルデコード後の）視差画像D#1をワーピングすることにより生成されるワープド視差画像D'#1の第tピクチャと、符号化対象の視差画像D#2の第t'ピクチャとが、参照ピクチャとなりうるピクチャ（候補ピクチャ）とされている。

ここで、候補ピクチャである視差画像D#2の第t'ピクチャは、対象ブロックのピクチャである視差画像D#2の第tピクチャよりも先に復号（ローカルデコード）され、デコード視差画像D#2のピクチャとして、DPB３１（及びDPB３３１）に記憶されるピクチャである。

候補ピクチャである視差画像D#2の第t'ピクチャとしては、例えば、対象ブロックのピクチャである視差画像D#2の第tピクチャの1ピクチャ前等に復号（及び符号化）されるピクチャを採用することができる。

ワープド視差画像D'#1の第tピクチャを参照ピクチャとする場合には、ずれベクトルが0ベクトルであると仮定して、MCによって、視差画像D#2の第tピクチャの対象ブロックであるブロックMBD#21の位置から、ずれベクトルだけずれた位置のブロック、つまり、対象ブロックMBD#21と同一の位置のブロックMBD'#11が、予測画像として取得される。

そして、例えば、対象ブロックMBD#21の、予測画像であるブロックMBD'#11との残差に対応する値であるSADと、ずれベクトルの符号量に対応する値MVとを用いて、ワープド視差画像D'#1を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コストCOST=COST1'が、上述の式（１）に従って算出される。

ここで、図３や図２４で説明したように、ワープド視差画像D'#1のピクチャを参照ピクチャとする場合には、ずれベクトルとして、0ベクトルを仮定するとともに、式（１）の符号化コストCOSTの計算にあたっては、ずれベクトルの符号量に対応する値MVとして、０を採用することができる。

したがって、ワープド視差画像D'#1のピクチャを参照ピクチャとして用いて、対象ブロックMBD#21を符号化するときの符号化コストCOST1'は、図３や図２４で説明したように、式COST1'＝SAD＋λ×０＝SADで表される。

一方、視差画像D#2の第t'ピクチャを参照ピクチャとする場合には、対象ブロックMBD#21と、視差画像D#2の第t'ピクチャとの間で、MEを行うことによって、動きベクトルであるずれベクトルが検出される。

さらに、MCによって、視差画像D#2の第t'ピクチャにおいて、対象ブロックMBD#21の位置から、動きベクトルであるずれベクトルだけずれた位置のブロック（対応ブロック）MBD#21'が、予測画像として取得される。

そして、対象ブロックMBD#21の、予測画像であるブロックMBD#21'との残差に対応する値であるSADと、ずれベクトルの符号量に対応する値MVとを用いて、視差画像D#2の第t'ピクチャを参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コストCOST=COST1が、式（１）に従って算出される。

以上のように、対象ブロックMBD#21の符号化にあたり、ワープド視差画像D'#1のピクチャ（対象ブロックMBD#21のピクチャと同一の時刻tのピクチャ）を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コスト（ワープド視差画像D'#1のピクチャについての符号化コスト）COST1'と、視差画像D#2のピクチャ（対象ブロックMBD#21のピクチャと異なる時刻t'のピクチャ）を参照ピクチャとする場合の、対象ブロックMBD#21の符号化に要する符号化コスト（視差画像D#2のピクチャについての符号化コスト）COST1との算出後、その符号化コストCOST1'及びCOST1に基づいて、ワープド視差画像D'#1の第tピクチャ、及び、視差画像D#2の第t'ピクチャのうちの、符号化コストが小さい方が、対象ブロックMBD#21の符号化に用いる参照ピクチャとして選択される。

ここで、視差画像D#2の第tピクチャの対象ブロックMBD#21の符号化にあたり、候補ピクチャとなる視差画像D#2の、第tピクチャと異なる時刻の第t'ピクチャを、他時刻ピクチャともいう。

視差画像D#2の対象ブロックの符号化において、上述のように、ワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとを、候補ピクチャとして採用する場合、図３や図２４と同様に、ワープド視差画像D'#1のピクチャには、値が0の参照インデクスref_idxを割り当て、視差画像D#2の他時刻ピクチャには、値が1の参照インデクスref_idxを割り当てることができる。

しかしながら、ワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとを、候補ピクチャとして採用する場合、ワープド視差画像D'#1のピクチャに、値が0の参照インデクスref_idxを割り当て、視差画像D#2の他時刻ピクチャに、値が1の参照インデクスref_idxを割り当てることが、適切でないことがある。

すなわち、ワープド視差画像D'#1のピクチャ（第tピクチャ）には、符号化対象の視差画像D#2のピクチャ（第tピクチャ）に映っている部分の中で、視差の影響で映っていない部分が存在することがある。

一方、視差画像D#2の他時刻ピクチャ（第t'ピクチャ）には、符号化対象の視差画像D#2のピクチャ（第tピクチャ）に映っている部分の中で、動きの影響で映っていない部分が存在することがある。

符号化対象の視差画像D#2の対象ブロックの少なくとも一部分が、ワープド視差画像D'#1のピクチャを参照ピクチャとして生成される予測画像に映っていない場合には、対象ブロックと予測画像との残差は大きくなり、ワープド視差画像D'#1のピクチャについての符号化コストが大になる。

同様に、符号化対象の視差画像D#2の対象ブロックの少なくとも一部分が、視差画像D#2の他時刻ピクチャを参照ピクチャとして生成される予測画像に映っていない場合には、対象ブロックと予測画像との残差は大きくなり、視差画像D#2の他時刻ピクチャについての符号化コストが大になる。

具体的には、例えば、符号化対象の視差画像D#2のピクチャと、候補ピクチャである視差画像D#2の他時刻ピクチャとの間に、シーンチェンジがあった場合、視差画像D#2の他時刻ピクチャについての符号化コストは、ワープド視差画像D'#1のピクチャについての符号化コストに比較して大になる。

一方、例えば、符号化対象の視差画像D#2のピクチャと、候補ピクチャである視差画像D#2の他時刻ピクチャとの間において、被写体の動きがない場合（被写体が静止している場合）、視差画像D#2の他時刻ピクチャについての符号化コストは、ワープド視差画像D'#1のピクチャについての符号化コストに比較して小になる。

したがって、ワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとが、候補ピクチャに含まれる場合において、符号化コストが小さい方を、対象ブロックの符号化に用いる参照ピクチャとして選択するときには、ワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちのいずれが、参照ピクチャに選択されやすいかは、符号化対象の視差画像D#2のピクチャ（対象ピクチャ）によって異なる。

そこで、時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式では、対象ピクチャの符号化が、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちの、ワープド視差画像D'#1のピクチャを参照ピクチャとして行われる場合、つまり、視差予測で行われる場合と、視差画像D#2の他時刻ピクチャを参照ピクチャとして行われる場合、つまり、時間予測で行われる場合とのどちらが多いかを判定する特徴量（以下、予測判定特徴量ともいう）を求め、その予測判定特徴量に基づいて、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのそれぞれに、参照インデクスref_idxを割り当てることができる。

図３４は、時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式で、視差画像#2を符号化するエンコーダ２２（図５）の構成例を示すブロック図である。

なお、図中、図１３の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３４のエンコーダ２２は、A/D変換部２１１ないし画面内予測部２２２、予測画像選択部２２４、ワーピング部２３１、及び、ワープドピクチャバッファ２３２を有する点で、図１３の場合と共通する。

但し、図３４のエンコーダ２２は、参照インデクス割り当て部２３３、及び、視差予測部２３４それぞれに代えて、参照インデクス割り当て部７０１、及び、インター予測部７０２を有する点で、図１３の場合と相違する。

図３４において、参照インデクス割り当て部７０１は、DPB３１に記憶されたデコード視差画像D#2の他時刻ピクチャ（対象ブロックのピクチャと異なる、先に符号化されてローカルデコードされたピクチャ）と、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャとを、参照ピクチャの候補である候補ピクチャとして、各候補ピクチャに、参照インデクスを割り当てる。

すなわち、参照インデクス割り当て部７０１は、予測判定特徴量を求め、その予測判定特徴量によって、符号化対象の視差画像D#2のピクチャ（対象ピクチャ）の符号化において、ワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちの参照ピクチャに選択されやすいと推定される方のピクチャに、符号量が少ない、値が0の参照インデクスを割り当て、他方のピクチャに、値が1の参照インデクスを割り当てる。

そして、参照インデクス割り当て部７０１は、候補ピクチャに割り当てられた参照インデクスを、インター予測部７０２に供給する。

インター予測部７０２は、参照インデクス割り当て部７０１において参照インデクスが割り当てられた候補ピクチャ、すなわち、DPB３１に記憶されたデコード視差画像D#2の他時刻ピクチャと、ワープドピクチャバッファ２３２に記憶されたワープド視差画像D'#1のピクチャとを、それぞれ参照ピクチャとして、対象ブロックのインター予測（時間予測と視差予測）を行い、符号化コストを算出する。

すなわち、インター予測部７０２は、ワープド視差画像D'#1のピクチャを参照ピクチャとして、図１３の視差予測部２３４の場合と同様にして、インター予測としての視差予測を、（計算）視差ベクトルが0ベクトルであると仮定して行い、視差予測の予測画像を生成する。

さらに、インター予測部７０２は、対象ブロックを、視差予測の予測画像を用いて符号化（予測符号化）するのに要する符号化コスト（ワープド視差画像D'#1のピクチャについての符号化コスト）を算出する。

また、インター予測部７０２は、デコード視差画像D#2の他時刻ピクチャを参照ピクチャとして、インター予測としての時間予測（動き予測）を行い、時間予測の予測画像を生成する。

すなわち、インター予測部７０２は、対象ブロックと、デコード視差画像D#2の他時刻ピクチャとのずれを表すずれベクトルとしての動きベクトルを検出する。さらに、インター予測部７０２は、その動きベクトルを用いて、デコード視差画像D#2の他時刻ピクチャの動き補償を行うことで、時間予測の予測画像を生成する（デコード視差画像D#2の他時刻ピクチャの、対象ブロックからずれベクトルとしての動きベクトルだけずれた位置のブロック（対応ブロック）を、予測画像として取得する）。

さらに、インター予測部７０２は、対象ブロックを、時間予測の予測画像を用いて符号化（予測符号化）するのに要する符号化コスト（デコード視差画像D#2の他時刻ピクチャについての符号化コスト）を算出する。

そして、インター予測部７０２は、候補ピクチャであるデコード視差画像D#2の他時刻ピクチャと、ワープド視差画像D'#1のピクチャとのうちの、符号化コストの小さい方を、参照ピクチャとして選択する。

さらに、インター予測部７０２は、参照インデクス割り当て部７０１からの参照インデクスの中から、参照ピクチャに選択されたピクチャ（デコード視差画像D#2の他時刻ピクチャ、又は、ワープド視差画像D'#1のピクチャ）に割り当てられている参照インデクスを、対象ブロックの予測用の参照インデクスとして選択し、ヘッダ情報の１つとして、可変長符号化部２１６に出力する。

また、インター予測部７０２は、対象ブロックの予測用の参照インデクスが割り当てられている候補ピクチャ（デコード視差画像D#2の他時刻ピクチャ、又は、ワープド視差画像D'#1のピクチャ）を参照ピクチャとして、インター予測により生成される予測画像を、予測画像選択部２２４に供給する。

なお、その他、インター予測部７０２では、候補ピクチャの１つとして、デコード視差画像D#1のピクチャに代えて、デコード視差画像D#2の他時刻ピクチャが用いられる他は、図１３の視差予測部２３４と同様の処理が行われる。

図３５は、図３４の参照インデクス割り当て部７０１の構成例を示すブロック図である。

参照インデクス割り当て部７０１は、特徴量生成部７２１、及び、割り当て部７２２を有する。

特徴量生成部７２１は、対象ブロックのピクチャ（対象ピクチャ）について、予測判定特徴量を生成し、割り当て部７２２に供給する。

割り当て部７２２は、特徴量生成部７２１からの予測判定特徴量に基づいて、ワープド視差画像D'#1のピクチャの参照インデクスidx'として、0及び1のうちの一方を割り当てるとともに、視差画像D#2の他時刻ピクチャの参照インデクスidxとして、他方を割り当て、インター予測部７０２（図３４）に供給する。

すなわち、割り当て部７２２は、予測判定特徴量に基づき、対象ピクチャについて、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちのいずれが、参照ピクチャに選択されやすいかを判定する。

そして、割り当て部７２２は、ワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちの、参照ピクチャに選択されやすい方の候補ピクチャに、値が0の参照インデクスを割り当て、他方の候補ピクチャに、値が1の参照インデクスを割り当てる。

ここで、MVC(AVC)のデフォルトではない参照インデクスの割り当ては、図１２で説明したように、RPLRコマンドで行うことができる。

また、予測判定特徴量としては、候補ピクチャを参照ピクチャとして、インター予測を行った場合の、対象ブロックのずれベクトル（計算視差ベクトル、動きベクトル）の大きさの、対象ピクチャの全マクロブロックに亘る平均値や分散を採用することができる。

この場合、特徴量生成部７２１では、ワープド視差画像D'#1のピクチャを参照ピクチャとして、インター予測（視差予測）を行った場合の、対象ブロックのずれベクトルとしての計算視差ベクトルの大きさの、対象ピクチャの全マクロブロックに亘る平均値や分散が求められる。

さらに、特徴量生成部７２１では、デコード視差画像D#2の他時刻ピクチャを参照ピクチャとして、インター予測（時間予測）を行った場合の、対象ブロックのずれベクトルとしての動きベクトルの大きさの、対象ピクチャの全マクロブロックに亘る平均値や分散が求められる。

そして、ずれベクトルの大きさが大きいと、符号量も多くなることを前提として、割り当て部７２２では、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちの、ずれベクトルの大きさの平均値、又は、分散が小さい方の候補ピクチャに、値が0の参照インデクスが割り当てられ、他方の候補ピクチャに、値が1の参照インデクスが割り当てられる。

また、予測判定特徴量としては、候補ピクチャを参照ピクチャとして、インター予測を行った場合の、対象ブロックと、参照ピクチャの対応ブロックとの残差の絶対値の、対象ピクチャの全マクロブロックに亘る総和や平均値を採用することができる。

この場合、特徴量生成部７２１では、ワープド視差画像D'#1のピクチャを参照ピクチャとして、インター予測（視差予測）を行った場合の、対象ブロックと対応ブロックとの残差の絶対値の、対象ピクチャの全マクロブロックに亘る総和や平均値が求められる。

さらに、特徴量生成部７２１では、デコード視差画像D#2の他時刻ピクチャを参照ピクチャとして、インター予測（時間予測）を行った場合の、対象ブロックと対応ブロックとの残差の絶対値の、対象ピクチャの全マクロブロックに亘る総和や平均値が求められる。

そして、割り当て部７２２では、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちの、残差の絶対値の総和、又は、平均値が小さい方の候補ピクチャに、値が0の参照インデクスが割り当てられ、他方の候補ピクチャに、値が1の参照インデクスが割り当てられる。

また、予測判定特徴量としては、候補ピクチャを参照ピクチャとして、インター予測を行った場合の、対象ブロックの符号化コストの、対象ピクチャの全マクロブロックに亘る総和や平均値を採用することができる。

この場合、特徴量生成部７２１では、ワープド視差画像D'#1のピクチャを参照ピクチャとして、インター予測（視差予測）を行った場合の、対象ブロックの符号化コストの、対象ピクチャの全マクロブロックに亘る総和や平均値が求められる。

さらに、特徴量生成部７２１では、デコード視差画像D#2の他時刻ピクチャを参照ピクチャとして、インター予測（時間予測）を行った場合の、対象ブロックの符号化コストの、対象ピクチャの全マクロブロックに亘る総和や平均値が求められる。

そして、割り当て部７２２では、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのうちの、符号化コストの総和、又は、平均値が小さい方の候補ピクチャに、値が0の参照インデクスが割り当てられ、他方の候補ピクチャに、値が1の参照インデクスが割り当てられる。

また、予測判定特徴量としては、対象ピクチャの直前に符号化されたピクチャである直前ピクチャにおける予測用の参照インデクスの割合、すなわち、値が0の参照インデクスの数と、値が1の参照インデクスの数とを採用することができる。

この場合、直前ピクチャにおいて、値が0の参照インデクスの数が、値が1の参照インデクスの数以上であるときには、割り当て部７２２は、対象ピクチャの符号化において、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのそれぞれに、直前ピクチャの符号化時と同様に、参照インデクスを割り当てる。

一方、直前ピクチャにおいて、値が0の参照インデクスの数が、値が1の参照インデクスの数より少ないときには、割り当て部７２２は、対象ピクチャの符号化において、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのそれぞれに、直前ピクチャの符号化時の参照インデクスの割り当てとは逆に、参照インデクスを割り当てる。

その他、予測判定特徴量としては、対象ピクチャの予測画像の予測精度を採用し、その予測精度に基づいて、候補ピクチャであるワープド視差画像D'#1のピクチャと、視差画像D#2の他時刻ピクチャとのそれぞれに、参照インデクスを割り当てることができる。

図３６は、予測判定特徴量として、対象ピクチャの予測画像の予測精度を採用し、その予測精度に基づいて、候補ピクチャに、参照インデクスを割り当てる方法を説明する図である。

図３６では、視差画像D#1の（表示）時刻順のピクチャとしてのIピクチャI#11，BピクチャB#12，PピクチャP#13，BピクチャB#14と、視差画像D#2の時刻順のピクチャとしてのPピクチャP#21，BピクチャB#22，PピクチャP#23，BピクチャB#24とが示されている。

図３６において、視差画像D#1のIピクチャI#11と、視差画像D#2のPピクチャP#21とは、同一の時刻のピクチャであり、BピクチャB#12とBピクチャB#22、PピクチャP#13とPピクチャP#23、及び、BピクチャB#14とBピクチャB#24も、それぞれ、同一の時刻のピクチャである。

いま、符号化対象の視差画像D#2のPピクチャP#23が、対象ピクチャであり、その対象ピクチャP#23の符号化にあたって、視差画像D#1のPピクチャP#13と、視差画像D#2のPピクチャP#21とが、候補ピクチャになっていることとする。

なお、ワープド参照割り当て方式では、視差画像D#1のPピクチャP#13（そのもの）ではなく、そのPピクチャP#13を、視点#2から見たピクチャにワーピングすることにより得られるワープド画像のピクチャが、候補ピクチャになるが、ここでは、説明を簡単にするため、候補ピクチャとして、ワープド画像のピクチャに代えて、視差画像D#1のPピクチャP#13を採用することとする。

また、図３６において、候補ピクチャである視差画像D#1のPピクチャP#13、及び、視差画像D#2のPピクチャ#21は、いずれも、視差画像D#1のIピクチャI#11を参照ピクチャとして、予測符号化されていることとする。

すなわち、視差画像D#1のPピクチャP#13については、視差画像D#1のIピクチャI#11を参照ピクチャとして、インター予測としての時間予測preT'を行うことにより得られる予測画像を用い、その予測画像とPピクチャP#13との残差が符号化されていることとする。

また、視差画像D#2のPピクチャP#21は、視差画像D#1のIピクチャI#11を参照ピクチャとして、インター予測としての視差予測preP'を行うことにより得られる予測画像を用い、その予測画像とPピクチャP#21との残差が符号化されていることとする。

この場合、時間予測preT'によって生成されるPピクチャP#13の予測画像の予測精度X#13は、例えば、式X#13＝S×Qで表すことができる。

ここで、式X#13＝S×Qにおいて、Sは、PピクチャP#13を符号化したときの（発生）符号量に相当し、Qは、PピクチャP#13を符号化するときの量子化ステップの平均値に相当する。

PピクチャP#13の符号化では、PピクチャP#13と、IピクチャI#11を参照ピクチャとする時間予測preT'を行うことにより得られる予測画像との残差が符号化されるので、その残差が小さいほど、つまり、時間予測preT'の予測精度が高く、その時間予測preT'によって生成される予測画像が、PピクチャP#13に似ている（近い）ほど、PピクチャP#13を符号化したときの符号量S、及び、PピクチャP#13（の残差）を量子化する量子化ステップの平均値Qは、小さくなる。

したがって、式X#13＝S×Qで表される予測精度X#13は、視差予測preP'（を行うことにより得られる予測画像）の精度が高いほど、小さくなる。

同様に、視差予測preP'によって生成されるPピクチャP#21の予測画像の予測精度X#21は、例えば、式X#21＝S'×Q'で表すことができる。

ここで、式X#21＝S'×Qにおいて、S'は、PピクチャP#21を符号化したときの符号量に相当し、Q'は、PピクチャP#21を符号化するときの量子化ステップの平均値に相当する。

PピクチャP#21の符号化では、PピクチャP#21と、IピクチャI#11を参照ピクチャとする視差予測preP'を行うことにより得られる予測画像との残差が符号化されるので、その残差が小さいほど、つまり、視差予測preP'の予測精度が高く、その視差予測preP'によって生成される予測画像が、PピクチャP#21に似ているほど、PピクチャP#21を符号化したときの符号量S'、及び、PピクチャP#21（の残差）を量子化する量子化ステップの平均値Q'は、小さくなる。

したがって、式X#21＝S'×Q'で表される予測精度X#21は、視差予測preP'（を行うことにより得られる予測画像）の精度が高いほど、小さくなる。

ここで、式X#13＝S×Qで表される予測精度X#13や、式X#21＝S'×Q'で表される予測精度X#21は、TM(Test Model)5で定義されている複雑度に一致する。

一方、対象ピクチャP#23が、視差画像D#1のPピクチャP#13を参照ピクチャとして符号化される場合、PピクチャP#13を参照ピクチャとする視差予測prePを行うことにより、予測画像が生成され、対象ピクチャP#23と予測画像との残差が符号化される。

また、対象ピクチャP#23が、視差画像D#2のPピクチャP#21を参照ピクチャとして符号化される場合、PピクチャP#21を参照ピクチャとする時間予測preTを行うことにより、予測画像が生成され、対象ピクチャP#23と予測画像との残差が符号化される。

ここで、視差画像D#1のピクチャI#11ないしP#13、及び、視差画像D#2のピクチャP#21ないしP#23において、シーンチェンジ等の画像の大きな変化がないと仮定すれば、対象ピクチャP#23を符号化するときのPピクチャP#13を参照ピクチャとする視差予測preP（により生成される予測画像）の予測精度は、IピクチャI#11を参照ピクチャとする視差予測preP'（により生成される予測画像）の予測精度X#21と同程度であると推定される。

同様に、対象ピクチャP#23を符号化するときのPピクチャP#21を参照ピクチャとする時間予測preTの予測精度は、IピクチャI#11を参照ピクチャとする時間予測preT'の予測精度X#13と同程度であると推定される。

そこで、予測判定特徴量として、対象ピクチャP#23の予測画像の予測精度を採用する場合には、特徴量生成部７２１では、対象ピクチャP#23の時間予測preTの参照ピクチャとなるPピクチャP#21を符号化するときに行った視差予測preP'の予測精度X#21が、Pピクチャ#13を参照ピクチャとする視差予測prePの予測精度として求められる。

さらに、特徴量生成部７２１では、対象ピクチャP#23の視差予測prePの参照ピクチャとなるPピクチャP#13を符号化するときに行った時間予測preT'の予測精度X#13が、Pピクチャ#21を参照ピクチャとする時間予測preTの予測精度として求められる。

そして、割り当て部７２２では、視差予測prePの予測精度（視差予測preP'の予測精度X#21）が、時間予測preTの予測精度（時間予測preT'の予測精度X#13）よりも良ければ（値が小さければ）、視差予測prePの参照ピクチャとなるPピクチャP#13に、値が0の参照インデクスが割り当てられ、時間予測preTの参照ピクチャとなるPピクチャP#21に、値が1の参照インデクスが割り当てられる。

また、割り当て部７２２では、視差予測prePの予測精度が、時間予測preTの予測精度よりも良くなければ、時間予測preTの参照ピクチャとなるPピクチャP#21に、値が0の参照インデクスが割り当てられ、視差予測prePの参照ピクチャとなるPピクチャP#13に、値が0の参照インデクスが割り当てられる。

以上のように、予測判定特徴量に基づいて、候補ピクチャに、参照インデクスを割り当てることにより、参照ピクチャに選択されやすい候補ピクチャに、符号量が少ない、値が0の参照インデクスを割り当てることができ、その結果、符号化効率を向上させることができる。

図３７は、時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式で、視差画像#2の符号化データを復号するデコーダ３２２（図１８）の構成例を示すブロック図である。

なお、図中、図２０の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３７のデコーダ３２２は、蓄積バッファ４４１ないし画面内予測部４４９、予測画像選択部４５１、ワーピング部４６１、及び、ワープドピクチャバッファ４６２を有する点で、図２０の場合と共通する。

但し、図３７のデコーダ３２２は、視差予測部４６３に代えて、インター予測部８０１を有する点で、図２０の場合と相違する。

インター予測部８０１は、可変長復号部３４２からのヘッダ情報に基づき、対象ブロックが、インター予測で生成された予測画像を用いて符号化されているかどうかを認識する。

対象ブロックが、インター予測で生成された予測画像を用いて符号化されている場合、インター予測部８０１は、可変長復号部３４２からのヘッダ情報に基づき、予測用の参照インデクス、すなわち、対象ブロックの予測画像の生成に用いられた参照ピクチャに割り当てられている参照インデクスを認識（取得）する。

そして、インター予測部８０１は、DPB３３１に記憶されている候補ピクチャとしてのデコード視差画像D#2のピクチャ（他時刻ピクチャ）、及び、ワープドピクチャバッファ４６２に記憶されている候補ピクチャとしてのワープド視差画像D'#1のピクチャのうちの、予測用の参照インデクスが割り当てられている候補ピクチャを、参照ピクチャとして選択する。

さらに、インター予測部８０１は、可変長復号部３４２からのヘッダ情報に基づき、対象ブロックの予測画像の生成に用いられたずれベクトル（計算視差ベクトル、又は、動きベクトル）を認識し、その計算視差ベクトルに従って、ずれ補償（視差補償、又は、動き補償）を行うことで、予測画像を生成する。

すなわち、インター予測部８０１は、候補ピクチャの、対象ブロックの位置から、その対象ブロックのずれベクトルに従って移動した（ずれた）位置のブロック（対応ブロック）を、予測画像として取得する。

そして、インター予測部８０１は、予測画像を、予測画像選択部４５１に供給する。

以上のように、インター予測部８０１では、候補ピクチャの１つとして、デコード視差画像D#1のピクチャに代えて、デコード視差画像D#2の他時刻ピクチャが用いられる他は、図２０の視差予測部４６３と同様の処理が行われる。

なお、時間予測に用いられるピクチャを含む候補ピクチャを用いるワープド参照割り当て方式は、視差画像#2を符号化するエンコーダ２２（図５）、及び、その視差画像#2の符号化データを復号するデコーダ３２２（図１８）の他、色画像#2を符号化するエンコーダ１２（図５）、及び、その色画像#2の符号化データを復号するデコーダ３１２（図１８）にも適用することができる。

［本技術を適用したコンピュータの説明］

次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

そこで、図３９は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク８０５やROM８０３に予め記録しておくことができる。

あるいはまた、プログラムは、リムーバブル記録媒体８１１に格納（記録）しておくことができる。このようなリムーバブル記録媒体８１１は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体８１１としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。

なお、プログラムは、上述したようなリムーバブル記録媒体８１１からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク８０５にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。

コンピュータは、CPU(Central Processing Unit)８０２を内蔵しており、CPU８０２には、バス８０１を介して、入出力インタフェース８１０が接続されている。

CPU８０２は、入出力インタフェース８１０を介して、ユーザによって、入力部８０７が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)８０３に格納されているプログラムを実行する。あるいは、CPU８０２は、ハードディスク８０５に格納されたプログラムを、RAM(Random Access Memory)８０４にロードして実行する。

これにより、CPU８０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU８０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース８１０を介して、出力部８０６から出力、あるいは、通信部８０８から送信、さらには、ハードディスク８０５に記録等させる。

なお、入力部８０７は、キーボードや、マウス、マイク等で構成される。また、出力部８０６は、LCD(Liquid Crystal Display)やスピーカ等で構成される。

ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

すなわち、本技術は、MVCを利用した符号化、及び、復号に限定されるものではない。すなわち、本技術は、候補ピクチャに参照インデクスを割り当てて、予測画像を生成し、その予測画像を用いて、複数の視点の画像の符号化、及び、復号を行う場合に適用することができる。

［テレビジョン装置の構成例］
図４０は、本技術を適用したテレビジョン装置の概略構成を例示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース部９０９を有している。さらに、テレビジョン装置９００は、制御部９１０、ユーザインタフェース部９１１等を有している。

チューナ９０２は、アンテナ９０１で受信された放送波信号から所望のチャンネルを選局して復調を行い、得られた符号化ビットストリームをデマルチプレクサ９０３に出力する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象である番組の映像や音声のパケットを抽出して、抽出したパケットのデータをデコーダ９０４に出力する。また、デマルチプレクサ９０３は、ＥＰＧ（Electronic Program Guide）等のデータのパケットを制御部９１０に供給する。なお、スクランブルが行われている場合、デマルチプレクサ等でスクランブルの解除を行う。

デコーダ９０４は、パケットの復号化処理を行い、復号処理化によって生成された映像データを映像信号処理部９０５、音声データを音声信号処理部９０７に出力する。

映像信号処理部９０５は、映像データに対して、ノイズ除去やユーザ設定に応じた映像処理等を行う。映像信号処理部９０５は、表示部９０６に表示させる番組の映像データや、ネットワークを介して供給されるアプリケーションに基づく処理による画像データなどを生成する。また、映像信号処理部９０５は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それを番組の映像データに重畳する。映像信号処理部９０５は、このようにして生成した映像データに基づいて駆動信号を生成して表示部９０６を駆動する。

表示部９０６は、映像信号処理部９０５からの駆動信号に基づき表示デバイス（例えば液晶表示素子等）を駆動して、番組の映像などを表示させる。

音声信号処理部９０７は、音声データに対してノイズ除去などの所定の処理を施し、処理後の音声データのＤ／Ａ変換処理や増幅処理を行いスピーカ９０８に供給することで音声出力を行う。

外部インタフェース部９０９は、外部機器やネットワークと接続するためのインタフェースであり、映像データや音声データ等のデータ送受信を行う。

制御部９１０にはユーザインタフェース部９１１が接続されている。ユーザインタフェース部９１１は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９１０に供給する。

制御部９１０は、ＣＰＵ(Central Processing Unit)やメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ、ＥＰＧデータ、ネットワークを介して取得されたデータ等を記憶する。メモリに記憶されているプログラムは、テレビジョン装置９００の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、テレビジョン装置９００がユーザ操作に応じた動作となるように各部を制御する。

なお、テレビジョン装置９００では、チューナ９０２、デマルチプレクサ９０３、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース部９０９等と制御部９１０を接続するためバス９１２が設けられている。

このように構成されたテレビジョン装置では、デコーダ９０４に本願の画像処理装置（画像処理方法）の機能が設けられる。このため、複数の視点の画像について、復号画像の画質を向上させることができる。

［携帯電話機の構成例］
図４１は、本技術を適用した携帯電話機の概略構成を例示している。携帯電話機９２０は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１を有している。これらは、バス９３３を介して互いに接続されている。

また、通信部９２２にはアンテナ９２１が接続されており、音声コーデック９２３には、スピーカ９２４とマイクロホン９２５が接続されている。さらに制御部９３１には、操作部９３２が接続されている。

携帯電話機９２０は、音声通話モードやデータ通信モード等の各種モードで、音声信号の送受信、電子メールや画像データの送受信、画像撮影、またはデータ記録等の各種動作を行う。

音声通話モードにおいて、マイクロホン９２５で生成された音声信号は、音声コーデック９２３で音声データへの変換やデータ圧縮が行われて通信部９２２に供給される。通信部９２２は、音声データの変調処理や周波数変換処理等を行い、送信信号を生成する。また、通信部９２２は、送信信号をアンテナ９２１に供給して図示しない基地局へ送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、得られた音声データを音声コーデック９２３に供給する。音声コーデック９２３は、音声データのデータ伸張やアナログ音声信号への変換を行いスピーカ９２４に出力する。

また、データ通信モードにおいて、メール送信を行う場合、制御部９３１は、操作部９３２の操作によって入力された文字データを受け付けて、入力された文字を表示部９３０に表示する。また、制御部９３１は、操作部９３２におけるユーザ指示等に基づいてメールデータを生成して通信部９２２に供給する。通信部９２２は、メールデータの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、メールデータを復元する。このメールデータを、表示部９３０に供給して、メール内容の表示を行う。

なお、携帯電話機９２０は、受信したメールデータを、記録再生部９２９で記憶媒体に記憶させることも可能である。記憶媒体は、書き換え可能な任意の記憶媒体である。例えば、記憶媒体は、ＲＡＭや内蔵型フラッシュメモリ等の半導体メモリ、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、またはメモリカード等のリムーバブルメディアである。

データ通信モードにおいて画像データを送信する場合、カメラ部９２６で生成された画像データを、画像処理部９２７に供給する。画像処理部９２７は、画像データの符号化処理を行い、符号化データを生成する。

多重分離部９２８は、画像処理部９２７で生成された符号化データと、音声コーデック９２３から供給された音声データを所定の方式で多重化して通信部９２２に供給する。通信部９２２は、多重化データの変調処理や周波数変換処理等を行い、得られた送信信号をアンテナ９２１から送信する。また、通信部９２２は、アンテナ９２１で受信した受信信号の増幅や周波数変換処理および復調処理等を行い、多重化データを復元する。この多重化データを多重分離部９２８に供給する。多重分離部９２８は、多重化データの分離を行い、符号化データを画像処理部９２７、音声データを音声コーデック９２３に供給する。画像処理部９２７は、符号化データの復号化処理を行い、画像データを生成する。この画像データを表示部９３０に供給して、受信した画像の表示を行う。音声コーデック９２３は、音声データをアナログ音声信号に変換してスピーカ９２４に供給して、受信した音声を出力する。

このように構成された携帯電話装置では、画像処理部９２７に本願の画像処理装置（画像処理方法）の機能が設けられる。このため、複数の視点の画像について、復号画像の画質を向上させることができる

［記録再生装置の構成例］
図４２は、本技術を適用した記録再生装置の概略構成を例示している。記録再生装置９４０は、例えば受信した放送番組のオーディオデータとビデオデータを、記録媒体に記録して、その記録されたデータをユーザの指示に応じたタイミングでユーザに提供する。また、記録再生装置９４０は、例えば他の装置からオーディオデータやビデオデータを取得し、それらを記録媒体に記録させることもできる。さらに、記録再生装置９４０は、記録媒体に記録されているオーディオデータやビデオデータを復号して出力することで、モニタ装置等において画像表示や音声出力を行うことができるようにする。

記録再生装置９４０は、チューナ９４１、外部インタフェース部９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）部９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）部９４８、制御部９４９、ユーザインタフェース部９５０を有している。

チューナ９４１は、図示しないアンテナで受信された放送信号から所望のチャンネルを選局する。チューナ９４１は、所望のチャンネルの受信信号を復調して得られた符号化ビットストリームをセレクタ９４６に出力する。

外部インタフェース部９４２は、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース部、ＵＳＢインタフェース、フラッシュメモリインタフェース等の少なくともいずれかで構成されている。外部インタフェース部９４２は、外部機器やネットワーク、メモリカード等と接続するためのインタフェースであり、記録する映像データや音声データ等のデータ受信を行う。

エンコーダ９４３は、外部インタフェース部９４２から供給された映像データや音声データが符号化されていないとき所定の方式で符号化を行い、符号化ビットストリームをセレクタ９４６に出力する。

ＨＤＤ部９４４は、映像や音声等のコンテンツデータ、各種プログラムやその他のデータ等を内蔵のハードディスクに記録し、また再生時等にそれらを当該ハードディスクから読み出す。

ディスクドライブ９４５は、装着されている光ディスクに対する信号の記録および再生を行う。光ディスク、例えばＤＶＤディスク（ＤＶＤ−Ｖｉｄｅｏ、ＤＶＤ−ＲＡＭ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）やＢｌｕ−ｒａｙディスク等である。

セレクタ９４６は、映像や音声の記録時には、チューナ９４１またはエンコーダ９４３からのいずれかの符号化ビットストリームを選択して、ＨＤＤ部９４４やディスクドライブ９４５のいずれかに供給する。また、セレクタ９４６は、映像や音声の再生時に、ＨＤＤ部９４４またはディスクドライブ９４５から出力された符号化ビットストリームをデコーダ９４７に供給する。

デコーダ９４７は、符号化ビットストリームの復号化処理を行う。デコーダ９４７は、復号処理化を行うことにより生成された映像データをＯＳＤ部９４８に供給する。また、デコーダ９４７は、復号処理化を行うことにより生成された音声データを出力する。

ＯＳＤ部９４８は、項目の選択などのメニュー画面等を表示するための映像データを生成し、それをデコーダ９４７から出力された映像データに重畳して出力する。

制御部９４９には、ユーザインタフェース部９５０が接続されている。ユーザインタフェース部９５０は、操作スイッチやリモートコントロール信号受信部等で構成されており、ユーザ操作に応じた操作信号を制御部９４９に供給する。

制御部９４９は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータを記憶する。メモリに記憶されているプログラムは、記録再生装置９４０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、記録再生装置９４０がユーザ操作に応じた動作となるように各部を制御する。

このように構成された記録再生装置では、デコーダ９４７に本願の画像処理装置（画像処理方法）の機能が設けられる。このため、複数の視点の画像について、復号画像の画質を向上させることができる。

［撮像装置の構成例］
図４３は、本技術を適用した撮像装置の概略構成を例示している。撮像装置９６０は、被写体を撮像し、被写体の画像を表示部に表示させたり、それを画像データとして、記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、カメラ信号処理部９６３、画像データ処理部９６４、表示部９６５、外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０を有している。また、制御部９７０には、ユーザインタフェース部９７１が接続されている。さらに、画像データ処理部９６４や外部インタフェース部９６６、メモリ部９６７、メディアドライブ９６８、ＯＳＤ部９６９、制御部９７０等は、バス９７２を介して接続されている。

光学ブロック９６１は、フォーカスレンズや絞り機構等を用いて構成されている。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤまたはＣＭＯＳイメージセンサを用いて構成されており、光電変換によって光学像に応じた電気信号を生成してカメラ信号処理部９６３に供給する。

カメラ信号処理部９６３は、撮像部９６２から供給された電気信号に対してニー補正やガンマ補正、色補正等の種々のカメラ信号処理を行う。カメラ信号処理部９６３は、カメラ信号処理後の画像データを画像データ処理部９６４に供給する。

画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データの符号化処理を行う。画像データ処理部９６４は、符号化処理を行うことにより生成された符号化データを外部インタフェース部９６６やメディアドライブ９６８に供給する。また、画像データ処理部９６４は、外部インタフェース部９６６やメディアドライブ９６８から供給された符号化データの復号化処理を行う。画像データ処理部９６４は、復号化処理を行うことにより生成された画像データを表示部９６５に供給する。また、画像データ処理部９６４は、カメラ信号処理部９６３から供給された画像データを表示部９６５に供給する処理や、ＯＳＤ部９６９から取得した表示用データを、画像データに重畳させて表示部９６５に供給する。

ＯＳＤ部９６９は、記号、文字、または図形からなるメニュー画面やアイコンなどの表示用データを生成して画像データ処理部９６４に出力する。

外部インタフェース部９６６は、例えば、ＵＳＢ入出力端子などで構成され、画像の印刷を行う場合に、プリンタと接続される。また、外部インタフェース部９６６には、必要に応じてドライブが接続され、磁気ディスク、光ディスク等のリムーバブルメディアが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて、インストールされる。さらに、外部インタフェース部９６６は、ＬＡＮやインターネット等の所定のネットワークに接続されるネットワークインタフェースを有する。制御部９７０は、例えば、ユーザインタフェース部９７１からの指示にしたがって、メモリ部９６７から符号化データを読み出し、それを外部インタフェース部９６６から、ネットワークを介して接続される他の装置に供給させることができる。また、制御部９７０は、ネットワークを介して他の装置から供給される符号化データや画像データを、外部インタフェース部９６６を介して取得し、それを画像データ処理部９６４に供給したりすることができる。

メディアドライブ９６８で駆動される記録メディアとしては、例えば、磁気ディスク、光磁気ディスク、光ディスク、または半導体メモリ等の、読み書き可能な任意のリムーバブルメディアが用いられる。また、記録メディアは、リムーバブルメディアとしての種類も任意であり、テープデバイスであってもよいし、ディスクであってもよいし、メモリカードであってもよい。もちろん、非接触ＩＣカード等であってもよい。

また、メディアドライブ９６８と記録メディアを一体化し、例えば、内蔵型ハードディスクドライブやＳＳＤ（Solid State Drive）等のように、非可搬性の記憶媒体により構成されるようにしてもよい。

制御部９７０は、ＣＰＵやメモリ等を用いて構成されている。メモリは、ＣＰＵにより実行されるプログラムやＣＰＵが処理を行う上で必要な各種のデータ等を記憶する。メモリに記憶されているプログラムは、撮像装置９６０の起動時などの所定タイミングでＣＰＵにより読み出されて実行される。ＣＰＵは、プログラムを実行することで、撮像装置９６０がユーザ操作に応じた動作となるように各部を制御する。

このように構成された撮像装置では、画像データ処理部９６４に本願の画像処理装置（画像処理方法）の機能が設けられる。このため、複数の視点の画像について、復号画像の画質を向上させることができる。

１１，１２，２１，２２エンコーダ，３１ DPB，３２多重化部，４１，４２カメラ，４３多視点画像情報生成部，１１１ A/D変換部，１１２画面並び替えバッファ，１１３演算部，１１４直交変換部，１１５量子化部，１１６可変長符号化部，１１７蓄積バッファ，１１８逆量子化部，１１９逆直交変換部，１２０演算部，１２１デブロッキングフィルタ，１２２画面内予測部，１２３インター予測部，１２４予測画像選択部，２１１ A/D変換部，２１２画面並び替えバッファ，２１３演算部，２１４直交変換部，２１５量子化部，２１６可変長符号化部，２１７蓄積バッファ，２１８逆量子化部，２１９逆直交変換部，２２０演算部，２２１デブロッキングフィルタ，２２２画面内予測部，２２４予測画像選択部，２３１ワーピング部，２３２ワープドピクチャバッファ，２３３参照インデクス割り当て部，２３４視差予測部，２４１視差検出部，２４２，２４３視差補償部，２４４コスト関数算出部，２４５モード選択部，２４６予測ベクトル生成部，３０１分離部，３１１，３１２，３２１，３２２デコーダ，３３１ DPB，３４１蓄積バッファ，３４２可変長復号部，３４３逆量子化部，３４４逆直交変換部，３４５演算部，３４６デブロッキングフィルタ，３４７画面並び替え部，３４８ D/A変換部，３４９画面内予測部，３５０インター予測部，３５１予測画像選択部，４４１蓄積バッファ，４４２可変長復号部，４４３逆量子化部，４４４逆直交変換部，４４５演算部，４４６デブロッキングフィルタ，４４７画面並び替え部，４４８ D/A変換部，４４９画面内予測部，４５１予測画像選択部，４６１ワーピング部，４６２ワープドピクチャバッファ，４６３視差予測部，４７１参照ピクチャ選択部，４７２視差補償部，４７３予測ベクトル生成部，５１１ A/D変換部，５１２画面並び替えバッファ，５１３演算部，５１４直交変換部，５１５量子化部，５１６可変長符号化部，５１７蓄積バッファ，５１８逆量子化部，５１９逆直交変換部，５２０演算部，５２１デブロッキングフィルタ，５２２画面内予測部，５２４予測画像選択部，５３１ワーピング部，５３２ワープドピクチャバッファ，５３３参照インデクス割り当て部，５３４視差予測部，５４１視差検出部，５４２，５４３視差補償部，５４４コスト関数算出部，５４５モード選択部，５４６予測ベクトル生成部，６４１蓄積バッファ，６４２可変長復号部，６４３逆量子化部，６４４逆直交変換部，６４５演算部，６４６デブロッキングフィルタ，６４７画面並び替え部，６４８ D/A変換部，６４９画面内予測部，６５１予測画像選択部，６６１ワーピング部，６６２ワープドピクチャバッファ，６６３視差予測部，６７１参照ピクチャ選択部，６７２視差補償部，６７３予測ベクトル生成部，７０１参照インデクス割り当て部，７０２インター予測部，７２１特徴量生成部，７２２割り当て部，８０１インター予測部，８０１バス，８０２ CPU，８０３ ROM，８０４ RAM，８０５ハードディスク，８０６出力部，８０７入力部，８０８通信部，８０９ドライブ，８１０入出力インタフェース，８１１リムーバブル記録媒体

Claims

第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成するワーピング部と、
前記第２の視点の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスを取得し、その参照インデクスに基づいて、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、前記参照ピクチャを選択する参照ピクチャ選択部と
を備える画像処理装置。
前記参照ピクチャの候補には、前記ワープド画像のピクチャと、前記第１の視点の画像のピクチャとが含まれる
請求項１に記載の画像処理装置。
前記参照ピクチャの候補に含まれる前記ワープド画像のピクチャには、第１の値の参照インデクスが割り当てられ、
前記参照ピクチャの候補に含まれる前記第１の視点のピクチャには、第２の値の参照インデクスが割り当てられており、
前記第１の値の参照インデクスの符号量は、前記第２の値の参照インデクスの符号量よりも少ない
請求項２に記載の画像処理装置。
前記参照ピクチャの候補には、前記ワープド画像のピクチャと、前記第２の視点の画像のピクチャの、前記対象ブロックのピクチャとは異なる時刻の他時刻ピクチャとが含まれる
請求項１に記載の画像処理装置。
前記参照ピクチャの、前記対象ブロックに対応する対応ブロックと、前記対象ブロックとのずれを表すずれベクトルに基づいて、前記参照ピクチャから、前記対応ブロックを、前記対象ブロックの予測画像として取得する補償部をさらに備える、
請求項１に記載の画像処理装置。
前記第１の視点の画像は、前記第１の視点から見た被写体からの光に対応する画素値を有する色画像の画素ごとの視差に関するデプス情報を、画素値として有するデプス画像であり、
前記第２の視点の画像は、前記第２の視点から見た被写体からの光に対応する画素値を有する色画像の画素ごとの視差に関するデプス情報を、画素値として有するデプス画像である
請求項１に記載の画像処理装置。
前記第１の視点の画像は、前記第１の視点から見た被写体からの光に対応する画素値を有する色画像であり、
前記第２の視点の画像は、前記第２の視点から見た被写体からの光に対応する画素値を有する色画像である
請求項１に記載の画像処理装置。
第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成し、
前記第２の視点の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスを取得し、その参照インデクスに基づいて、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、前記参照ピクチャを選択する
ステップを含む画像処理方法。
第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成するワーピング部と、
前記第２の視点の画像のピクチャの復号対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャを表す参照インデクスを取得し、その参照インデクスに基づいて、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補の中から、前記参照ピクチャを選択する参照ピクチャ選択部と
して、コンピュータを機能させるためのプログラム。
第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成するワーピング部と、
前記第２の視点の画像のピクチャの符号化対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャの候補であって、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補それぞれについて、前記対象ブロックの符号化に要する符号化コストを算出するコスト算出部と、
前記符号化コストに基づいて、前記参照ピクチャの候補それぞれに割り当てられている参照インデクスの中から、前記対象ブロックの符号化に用いる参照ピクチャの候補に割り当てられている参照インデクスを選択して出力する選択部と
を備える画像処理装置。
前記参照ピクチャの候補には、前記ワープド画像のピクチャと、前記第１の視点の画像のピクチャとが含まれる
請求項１０に記載の画像処理装置。
前記参照ピクチャの候補に含まれる前記ワープド画像のピクチャに、第１の値の参照インデクスを割り当てるとともに、前記参照ピクチャの候補に含まれる前記第１の視点のピクチャに、第２の値の参照インデクスを割り当てる参照インデクス割り当て部をさらに備え、
前記第１の値の参照インデクスの符号量は、前記第２の値の参照インデクスの符号量よりも少ない
請求項１１に記載の画像処理装置。
前記参照ピクチャの候補には、前記ワープド画像のピクチャと、前記第２の視点の画像のピクチャの、前記対象ブロックのピクチャとは異なる時刻の他時刻ピクチャとが含まれる
請求項１０に記載の画像処理装置。
前記参照ピクチャの候補それぞれについて、前記参照ピクチャの候補の、前記対象ブロックに対応する対応ブロックと、前記対象ブロックとのずれを表すずれベクトルに基づいて、前記参照ピクチャの候補から、前記対応ブロックを、前記対象ブロックの予測画像として取得する補償部をさらに備え、
前記参照ピクチャの候補が、前記ワープド画像のピクチャである場合、前記補償部は、前記ずれベクトルが、0ベクトルであるとして、前記予測画像を取得し、
前記コスト算出部は、
前記対象ブロックの、前記予測画像に対する残差に対応する値と、前記すれベクトルの符号量に対応する値とを加算することにより、前記符号化コストを算出し、
前記ワープド画像のピクチャについては、前記すれベクトルの符号量に対応する値を０にして、前記符号化コストを算出する
請求項１０に記載の画像処理装置。
前記第１の視点の画像は、前記第１の視点から見た被写体からの光に対応する画素値を有する色画像の画素ごとの視差に関するデプス情報を、画素値として有するデプス画像であり、
前記第２の視点の画像は、前記第２の視点から見た被写体からの光に対応する画素値を有する色画像の画素ごとの視差に関するデプス情報を、画素値として有するデプス画像である
請求項１０に記載の画像処理装置。
前記第１の視点の画像は、前記第１の視点から見た被写体からの光に対応する画素値を有する色画像であり、
前記第２の視点の画像は、前記第２の視点から見た被写体からの光に対応する画素値を有する色画像である
請求項１０に記載の画像処理装置。
第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成し、
前記第２の視点の画像のピクチャの符号化対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャの候補であって、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補それぞれについて、前記対象ブロックの符号化に要する符号化コストを算出し、
前記符号化コストに基づいて、前記参照ピクチャの候補それぞれに割り当てられている参照インデクスの中から、前記対象ブロックの符号化に用いる参照ピクチャの候補に割り当てられている参照インデクスを選択して出力する
ステップを含む画像処理方法。
第１の視点の画像、及び、前記第１の視点と異なる第２の視点の画像のうちの、前記第１の視点の画像のピクチャをワーピングすることにより、前記第１の視点の画像のピクチャを前記第２の視点で得られる画像に変換したワープド画像のピクチャを生成するワーピング部と、
前記第２の視点の画像のピクチャの符号化対象の対象ブロックの予測画像を生成するのに参照する参照ピクチャの候補であって、前記ワープド画像のピクチャを、少なくとも含む参照ピクチャの候補それぞれについて、前記対象ブロックの符号化に要する符号化コストを算出するコスト算出部と、
前記符号化コストに基づいて、前記参照ピクチャの候補それぞれに割り当てられている参照インデクスの中から、前記対象ブロックの符号化に用いる参照ピクチャの候補に割り当てられている参照インデクスを選択して出力する選択部と
して、コンピュータを機能させるためのプログラム。