WO2010095471A1

WO2010095471A1 - 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム

Info

Publication number: WO2010095471A1
Application number: PCT/JP2010/001213
Authority: WO
Inventors: 志水信哉; 木全英明; 谷本正幸
Original assignee: 日本電信電話株式会社; 国立大学法人名古屋大学
Priority date: 2009-02-23
Filing date: 2010-02-23
Publication date: 2010-08-26
Also published as: EP2400759A1; JPWO2010095471A1; EP2400759B1; EP2400759A4; KR101344425B1; US8548228B2; CA2752567A1; TWI433544B; CN102326391B; TW201103339A; BRPI1008500A2; JP5521202B2; CN102326391A; ES2524973T3; US20120027291A1; TW201424406A; KR20110119709A; TWI517674B; CA2752567C; RU2498522C2

Abstract

　本発明の多視点画像符号化／復号装置は、まず、処理対象領域に撮影されている被写体のデプス情報を求める。次に、処理対象領域に隣接する既に符号化（復号）済みの領域において、処理対象領域と同じ被写体が撮影されている画素群をデプス情報から求めてサンプル画素群を設定する。続いて、サンプル画素群に含まれる画素と処理対象領域に含まれる画素に対して視点合成画像を生成する。続いて、サンプル画素群における視点合成画像および復号画像から輝度や色のミスマッチを補正する補正パラメータを推定する。続いて、推定された補正パラメータを用いて、処理対象領域に対して生成された視点合成画像を補正することによって予測画像を生成する。

Description

多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム

　本発明は、ある被写体を撮影する複数のカメラにより撮影された画像を符号化する多視点画像符号化方法およびその装置と、その多視点画像符号化方法により符号化された符号データを復号する多視点画像復号方法およびその装置と、その多視点画像符号化方法の実現に用いられる多視点画像符号化プログラムと、その多視点画像復号方法の実現に用いられる多視点画像復号プログラムとに関する。
　本願は、２００９年２月２３日に、日本に出願された特願２００９－３８７８６号に基づき優先権を主張し、その内容をここに援用する。

　多視点画像とは、複数のカメラで同じ被写体と背景を撮影した複数の画像のことであり、多視点動画像（多視点映像）とは、その動画像のことである。

　一般的な動画像符号化や多視点動画像符号化に用いられる技術として、動き補償予測と視差補償予測とが提案されている。

　動き補償予測は、Ｈ．２６４に代表される近年の動画像符号化方式の国際標準にも採用されている手法であり、符号化対象フレームを既に符号化済みの参照フレームとの間で被写体の動きを補償して画像信号のフレーム間差分を取り、その差分信号のみを符号化する（非特許文献１参照）。

　一方、視差補償予測は、参照フレームとして別のカメラで撮影されたフレームを用いることで被写体の視差を補償して、画像信号のフレーム間差分を取りながら符号化する（非特許文献２参照）。

　ここで用いられる視差とは、異なる位置に配置されたカメラの画像平面上で、被写体上の同じ位置が投影される位置の差である。視差補償予測では、これを二次元ベクトルで表現して符号化を行っている。図９に示す通り、視差がカメラの位置と被写体のカメラからの距離（デプス）Depthとに依存して発生する情報であるため、この原理を利用した視点合成予測（視点補間予測）と呼ばれる方式が存在する。

　視点合成予測（視点補間予測）では、符号化側もしくは復号側で得られた多視点映像に対して、カメラの位置情報と三角測量の原理を用いて被写体のデプスを推定し、その推定されたデプス情報を用いて符号化対象フレームを合成（補間）して予測画像とする方式である（特許文献１、非特許文献３参照）。なお、符号化側でデプスを推定する場合には、使用したデプスを符号化する必要がある。

　これら別のカメラで撮影した画像を用いた予測では、カメラの撮像素子の応答に個体差があったり、カメラごとにゲインコントロールやガンマ補正が行われていたり、カメラごとに被写界深度や絞りなどの設定が異なっていたり、シーンに方向依存の照明効果があったりすると、符号化効率が劣化する。この理由は、符号化対象フレームと参照フレームとで被写体の輝度や色が同じであるという前提で予測を行っているためである。

　こうした被写体の輝度や色の変化に対応すべく検討された方式として、輝度補償や色補正と呼ばれるものがある。この方式においては、参照フレームの輝度や色を補正したものを予測に使用するフレームとすることで、符号化する予測残差を小さく抑える。

　Ｈ．２６４では、１次関数を用いて補正するWeighted Prediction が採用されており（非特許文献１参照）、非特許文献３では、色テーブルを用いて補正する方式が提案されている。

特開２００７－０３６８００号公報，“映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体”

ITU-T Rec. H.264/ISO/IEC 11496-10, "Advanced video coding for generic audiovisual services", Final Committee Draft, Document JVT-E022d7, September 2002.(pp.10-13, pp.62-73) Hideaki Kimata and Masaki Kitahara, "Preliminary results on multiple view video coding (3DAV)", document M10976 MPEG Redmond Meeting, July, 2004. K.Yamamoto, M.Kitahara, H.Kimata, T.Yendo, T.Fujii, M.Tanimoto, S.Shimizu, K.Kamikura, and Y.Yashima, "Multiview Video Coding Using View Interpolation and Color Correction," IEEE Transactions on Circuits and System for Video Technology, Vol.17, No.11, pp.1436-1449, November, 2007.

　上記の輝度補償や色補正を用いた符号化の場合、次の二つの問題が存在する。

　一つ目の問題は、輝度補償・色補正パラメータなどを付加することによる符号量の増加である。通常の視差補償予測や視点合成（補間）予測では符号化する必要のなかった輝度補償・色補正パラメータなどを符号化する必要が生じるため、符号化効率が低下する。

　二つ目の問題は、補正の精度である。通常の動画像符号化におけるフェードやフラッシュの場合、画面全体が同様に変化するため、単一の補正パラメータで十分な輝度補償や色補正などを行うことが可能である。しかしながら、被写体が完全な拡散反射体ではないことや、カメラごとに被写界深度やフォーカスが完全に一致していないことによるミスマッチ（輝度や色の不一致）は、シーンではなく、被写体に依存するミスマッチである。そのため単一の補正パラメータによる補正では、被写体によってはミスマッチを拡大させてしまう場合がある。

　この問題に対して、被写体ごとのミスマッチに対応するために複数の補正パラメータを用いる方法も考えられる。しかしながら、この方法を用いると、複数の補正パラメータを符号化する符号量だけでなく、画像領域ごとにどの補正パラメータを用いるのかを示す情報を符号化する必要が生じるため、更なる符号量の増大を招くことになり一つ目の問題を解決することができない。

　本発明はかかる事情に鑑みてなされたものであって、カメラ間で局所的な輝度や色のミスマッチを伴うような多視点画像（多視点の静止画像や動画像）においても、高能率な符号化を実現し、かつ、その実現にあたって必要とされる符号量の削減を実現する新たな多視点画像符号化および復号技術を提供することを目的とする。

　〔１〕本発明の基本的な技術思想
　前述の課題を解決するために、本発明では、符号化／復号対象フレームを分割して、領域ごとに多視点画像の符号化／復号を行う場合において、以下の手段を講ずる。

　まず、処理対象領域に撮影されている被写体のデプス情報を求める。次に、処理対象領域に隣接する既に符号化（復号）済みの領域において、処理対象領域と同じ被写体が撮影されている画素群をデプス情報から求めてサンプル画素群とする。続いて、このサンプル画素群に含まれる画素に対して視点合成画像を生成するとともに、処理対象領域に含まれる画素に対して視点合成画像を生成する。続いて、サンプル画素群における視点合成画像および復号画像から輝度や色のミスマッチを補正する補正パラメータを推定する。続いて、推定された補正パラメータを用いて、処理対象領域に対して生成された視点合成画像を補正することで、処理対象領域における画像信号の符号化（復号）に使用する予測画像を生成する。

　符号化対象フレームと参照フレームとを比較して補正パラメータを算出する従来の方法の場合は、符号化対象フレームは復号側では入手不可能なため、補正パラメータを符号化する必要がある。

　一方、本発明では、符号化／復号対象フレームの既に符号化／復号済みの領域の画像信号と、参照フレームを用いて生成される視点合成画像の情報とを比較して補正パラメータを算出している。これらは復号側で入手可能なものであるため、補正パラメータを符号化する必要がない。つまり、本発明によって符号量増加の問題を解決することが可能である。

　また、符号化処理は入力信号をできるだけ忠実に変換する処理であるため、符号化対象の画像信号と符号化／復号済みの画像信号はほぼ同じものとみなすことが可能である。つまり、本発明によって算出される補正パラメータは視点合成画像を符号化対象フレームに近づけ、符号化しなければならない予測差分を十分小さくすることができる。

　また、本発明では、処理対象領域に撮影されている被写体と同じ被写体が撮影されている隣接領域の情報を用いて補正パラメータの推定を行う。これにより、被写体に依存した輝度や色の補正を行うことが可能となる。なお、この被写体の判定には視点合成画像を生成する際に必要となるデプス情報を用いるため、別途情報を符号化して伝送する必要はない。

　上記の多視点画像符号化／復号において、処理対象領域におけるデプス情報の分散を求めて予め定められた閾値との比較を行うことで、処理対象領域に複数の被写体が撮影されているのか否かを判定し、複数の被写体が撮影されている場合には、被写体ごとにデプス情報及びサンプル画素群を定めて補正パラメータを推定する。なお、処理対象領域に一定画素未満しか存在しない被写体は別の被写体と同時に処理することで、演算量の増加を防ぐことも可能である。

　さらに、上記の多視点画像符号化／復号方法において、サンプル画素群の画素数に基いて、複数存在する補正モデル（補正パラメータ数）を変更する。

　〔２〕本発明の構成
　次に、本発明の多視点画像符号化装置および多視点画像復号装置の構成について説明する。

　［２－１］本発明の多視点画像符号化装置の構成
　本発明の多視点画像符号化装置は、第１のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割し、前記入力画像についてのデプス情報と前記第１のカメラとは異なる位置に配置された第２のカメラで撮影された前記被写体の既に符号化済みの画像とから合成された視点合成画像を用いて、前記符号化対象領域ごとに予測符号化を行うことによって多視点画像（多視点の静止画像や動画像）を符号化する装置であって、（１）前記符号化対象領域において撮影された被写体についての代表デプス情報を設定する代表デプス設定部と、（２）前記符号化対象領域に隣接する既に符号化済みの領域におけるデプス情報と代表デプス情報とに基づいて、前記符号化対象領域内と同じ被写体が撮影されている画素群を求めてサンプル画素群として設定するサンプル画素群設定部と、（３）サンプル画素群についての前記視点合成画像および前記サンプル画素群について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、（４）前記補正パラメータを用いて、前記符号化対象領域についての前記視点合成画像を補正して補正視点合成画像を生成する視点合成画像補正部と、（５）前記補正視点合成画像を用いて、前記符号化対象領域の画像信号を符号化して符号データを生成する画像符号化部と、（６）前記符号データを復号して、前記符号化対象領域における復号画像を生成する画像復号部とを備える。

　本発明の実施形態による多視点画像符号化装置は、さらに、（７）前記符号化対象領域における画素を、当該画素のデプス情報を基準にしてグルーピングする被写体判定部を備えてもよい。この場合には、代表デプス設定部は、被写体判定部で求められたグループごとに代表デプス情報を設定し、サンプル画素群設定部は、被写体判定部で求められたグループごとにサンプル画素群を設定し、補正パラメータ推定部は、被写体判定部で求められたグループごとに補正パラメータを推定し、視点合成画像補正部は、被写体判定部で求められたグループごとに視点合成画像を補正するようにしてもよい。

　また、本発明の実施形態による多視点画像符号化装置は、さらに、（８）サンプル画素群の画素数に応じて前記符号化対象領域についての前記視点合成画像を補正する補正モデルを選択する補正モデル選択部を備えてもよい。この場合には、補正パラメータ推定部は、補正モデル選択部で選択された補正モデルにおける補正パラメータを推定し、視点合成画像補正部は、補正モデル選択部で選択された補正モデルを用いて視点合成画像を補正する。

　以上の各処理手段が動作することで実現される本発明の多視点画像符号化方法はコンピュータプログラムでも実現できる。このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてＣＰＵなどの制御手段上で動作することにより本発明を実現することができる。

　［２－２］本発明の多視点画像復号装置の構成
　本発明の多視点画像復号装置は、第１のカメラで撮影された被写体の画像を前記第１のカメラとは異なる位置に配置された第２のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記復号対象画像についてのデプス情報と前記第２のカメラで撮影された既に復号済みの前記被写体の画像とから合成された視点合成画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行うことによって多視点画像（多視点の静止画像や動画像）の符号データを復号する装置であって、（１）前記復号対象領域において撮影された被写体についての代表デプス情報を設定する代表デプス設定部と、（２）前記復号対象領域に隣接する既に復号済みの領域におけるデプス情報と前記代表デプス情報とに基づいて、前記復号対象領域内と同じ被写体が撮影されている画素群を求めてサンプル画素群として設定するサンプル画素群設定部と、（３）サンプル画素群についての前記視点合成画像および前記サンプル画素群について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、（４）前記補正パラメータを用いて、前記復号対象領域についての前記視点合成画像を補正して補正視点合成画像を生成する視点合成画像補正部と、（５）前記補正視点合成画像を用いて、前記復号対象領域の画像信号を復号する画像復号部とを備える。

　本発明の実施形態による多視点画像復号装置は、さらに、（６）前記復号対象領域における画素を、当該画素のデプス情報を基準にしてグルーピングする被写体判定部を備えてもよい。この場合には、代表デプス設置部は、被写体判定部で求められたグループごとに代表デプス情報を設定し、サンプル画素群設定部は、被写体判定部で求められたグループごとにサンプル画素群を設定し、補正パラメータ推定部は、被写体判定部で求められたグループごとに補正パラメータを推定し、視点合成画像補正部は、被写体判定部で求められたグループごとに視点合成画像を補正するようにしてもよい。

　また、本発明の実施形態による多視点画像復号装置は、さらに、（７）サンプル画素群の画素数に応じて前記復号対象領域についての前記視点合成画像を補正する補正モデルを選択する補正モデル選択部を備えてもよい。この場合には、補正パラメータ推定部は、補正モデル選択部で選択された補正モデルにおける補正パラメータを推定し視点合成画像補正部は、補正モデル選択部で選択された補正モデルを用いて視点合成画像を補正する。

　以上の各処理手段が動作することで実現される本発明の多視点画像復号方法はコンピュータプログラムでも実現できる。このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてＣＰＵなどの制御手段上で動作することにより本発明を実現することができる。

　本発明によれば、カメラ間で輝度や色のミスマッチが被写体に応じて局所的に生じている場合においても、このミスマッチに対処するための補正パラメータを被写体に応じて局所的に求めるようにしていることから、予測差分を小さくすることができる。したがって、効率的な多視点画像や多視点動画像の符号化および復号を実現することができる。

　しかも、本発明によれば、そのようにして求める補正パラメータを別途符号化／復号する必要がないことから、多視点画像や多視点動画像の符号化および復号にあたっての符号量を大幅に削減することができる。

本発明の第１の実施形態による多視点映像符号化装置を示すブロック図である。本発明の第１の実施形態による多視点映像符号化装置が実行する処理を示すフローチャートである。本発明の第１の実施形態による多視点映像符号化装置が実行する処理の詳細を示すフローチャートである。本発明の第１の実施形態による多視点映像符号化装置が実行する処理を示すフローチャートである。本発明の第２の実施形態による多視点映像復号装置を示すブロック図である。本発明の第２の実施形態による多視点映像復号装置が実行する処理を示すフローチャートである。本発明の第２の実施形態による多視点映像復号装置が実行する処理の詳細を示すフローチャートである。本発明の第１および第２実施形態における補正パラメータ生成部を示すブロック図である。視差補償予測方式を示す図である。

　以下、本発明の実施形態を示す図面を参照して本発明を詳細に説明する。

　なお、以下の説明では、映像（フレーム）やデプス情報に、位置を特定可能な情報（記号［］で挟まれた情報であり、座標値もしくは座標値に対応付け可能なインデックス）を付加することで、その位置の画素に撮影された被写体の画像信号やデプス情報（画素ごとに定義される）を示す。

［１］本発明の第１の実施形態による多視点映像符号化装置

　図１に、本発明の第１の実施形態に係る多視点映像符号化装置１００の装置構成を図示する。

　図１に示すように、本実施形態の多視点映像符号化装置１００において、符号化対象画像入力部１０１は、第１のカメラで撮影された被写体の画像（フレーム）を符号化対象として入力する。符号化対象画像メモリ１０２は、符号化対象画像入力部１０１から入力された符号化対象フレームを蓄積する。蓄積された符号化対象フレームは、画像符号化部１０９に供給される。
　視点合成画像入力部１０３は、第１のカメラとは異なる位置に配置された別の第２のカメラで同一の被写体を撮影して得られた画像の符号化済みのフレームを用いて生成された符号化対象フレームについての視点合成画像を入力する。視点合成画像メモリ１０４は、視点合成画像入力部１０３から入力された視点合成画像を蓄積する。蓄積された視点合成画像は、補正パラメータ生成部１０７および視点合成画像補正部１０８に供給される。
　デプス情報入力部１０５は、符号化対象フレームについてのデプス情報を入力する。デプス情報メモリ１０６は、デプス情報入力部１０５から入力されたデプス情報を蓄積する。蓄積されたデプス情報は、補正パラメータ生成部１０７に供給される。
　補正パラメータ生成部１０７は、符号化対象領域の周辺領域における視点合成画像、デプス情報および復号画像と、符号化対象領域におけるデプス情報とを用いて補正パラメータを推定する。視点合成画像補正部１０８は、推定された補正パラメータを用いて符号化対象領域の視点合成画像を補正する。
　画像符号化部１０９は、補正された視点合成画像を予測信号として使用しながら符号化対象領域の画像信号を符号化する。画像符号化部１０９は、符号化された画像信号を復号する。復号画像メモリ１１１は、画像符号化部１０９によって復号された画像を蓄積する。復号画像メモリ１１１に蓄積された復号画像は、補正パラメータ生成部１０７に供給される。

　補正パラメータ生成部１０７は、図８に示すとおり、デプス情報メモリ１０６からのデプス情報が供給される被写体判定部１０７ａ、この被写体判定部１０７ａの下流に順に接続された代表デプス設定部１０７ｂおよびサンプル画素群設定部１０７ｃを有する。サンプル画素群設定部１０７ｃには、その下流に補正モデル選択部１０７ｄおよび補正パラメータ推定部１０７ｅが順に接続される。補正パラメータ推定部１０７ｅには、復号画像メモリ１１１からの復号画像および視点合成画像メモリ１０４からの視点合成画像が供給され、供給された復号画像および視点合成画像を用いて推定した補正パラメータを視点合成画像補正部１０８に供給する。

　図２に、このように構成される本実施形態の多視点映像符号化装置１００が実行する処理のフローを示す。
　この処理フローに従って、本実施形態の多視点映像符号化装置１００が実行する処理について詳細に説明する。

　まず、符号化対象画像入力部１０１により符号化対象フレームOrgが入力されて符号化対象画像メモリ１０２に格納される。視点合成画像入力部１０３により符号化対象フレームOrgに対しての視点合成画像Synthが入力されて視点合成画像メモリ１０４に格納される。デプス情報入力部１０５により符号化対象フレームOrgに対してのデプス情報Depthが入力されてデプス情報メモリ１０６に格納される［Ａ１］。

　ここで入力される視点合成画像とデプス情報とは復号装置で得られるものと同じものである。これは、復号装置で得られる情報と同じ情報を用いることでドリフト等の符号化ノイズの発生を抑えるためである。ただし、これらの符号化ノイズの発生を許容する場合は、符号化前のオリジナルのものが入力されても構わない。

　なお、デプス情報は多視点映像符号化装置１００の外部より与えられるものとしているが、非特許文献３に記載されたように、既に符号化済みの別のカメラのフレームから推定して求めることも可能である。したがって、必ずしも送信側から受信側へ伝送される必要はない。また、視点合成画像は、既に符号化済みの第２のカメラのフレームとデプス情報とを用いて生成される。

　次に、符号化対象フレームを複数の符号化対象領域に分割し、その領域ごとに視点合成画像を補正しながら、画像符号化部１０９で符号化対象フレームの画像信号を符号化する［Ａ２－Ａ１５］。

　つまり、符号化処理ブロックのインデックスをblk 、総符号化処理ブロック数を numBlks で表すとすると、blk を０で初期化した後［Ａ２］、blk に１を加算しながら［Ａ１４］、blk が numBlks になるまで［Ａ１５］、以下のステップ［Ａ３－Ａ１３］を繰り返す。

　符号化処理ブロックごとに繰り返される処理では、符号化装置１００は、まずブロックblk（符号化対象領域）の周辺の符号化済み領域の画素の集合N_blk を求める［Ａ３］。

周辺領域としてはブロックblk に隣接する符号化処理ブロックや隣接画素など、様々な単位のものを用いることが可能である。どのような定義の周辺領域を使用しても構わないが、復号側で使用する定義と同じものを使用する必要がある。

次に、補正パラメータ生成部１０７の被写体判定部１０７ａは、画素ごとに与えられたデプス情報を基準にして、ブロックblk 内の画素のグルーピングを行う［被写体判定ステップＡ４］。

この結果の各グループのインデックスをobj 、グループ数を numObjs と表し、グループobj に属する画素をC_obj と表すことにする。

　グルーピングにはどのような方法を用いても構わないが、復号側で使用する方法と同じものを使用する必要がある。最も簡単なグルーピング方法としては、ブロックblk内の画素のデプス情報の分散を求め、その値が閾値以下なら全体として１つのグループとし、閾値より大きい場合はデプス値の平均を境界にして２つのグループに分割する方法がある。この場合、全てのグループに含まれる画素のデプス情報の分散がある閾値以下になったらグルーピングを終了する。

　より複雑なグルーピング方法としては、初めは各画素が１つのグループを成しているものとし、ある２つのグループを融合した際に、グループ内の画素のもつデプス情報の分散の増加が最も少ないものを順に融合していく方法がある。この場合、どの２つのグループを融合してもある閾値を超える分散を持つグループが発生してしまう場合に、グルーピングを終了する。

　なお、グループ数が増加すると演算量が増加するため、予めグループの最大数を定義しておいてもよい。グループ数がその最大値になったらグルーピングを終了したり、予め１グループに含まれる画素の最小数を定義しておき、小さなグループを生成しないようにしたりすることで、グループ数の増大を防ぐことができる。ブロックサイズが、一般的な画像符号化の単位ブロックサイズの１６×１６画素であった場合、一般に、多数の被写体が同じブロックに撮影されることは稀である。したがって、最大グループ数は２でも精度の高いグルーピングを行うことが可能である。

　グルーピングが終了したら、各グループの画素ごとに視点合成画像を補正することで予測画像Pred を生成する［Ａ５－Ａ１１］。

　つまり、グループインデックスobj を０に初期化した後［Ａ５］、obj に１を加算しながら［Ａ１０］、obj が numObjs になるまで［Ａ１１］、補正パラメータ生成部１０７において、視点合成画像を補正するための補正パラメータを推定するステップ［Ａ６－Ａ８］を行う。この処理とともに、視点合成画像補正部１０８において、推定された補正パラメータを用いてグループobj に含まれる画素についての視点合成画像を補正して予測画像を生成するステップ［Ａ９］とを繰り返す。

　補正パラメータの推定処理では、まずデプス情報をもとに、ブロックblk （符号化対象領域）の周辺の符号化済み領域の画素の集合N_blk に含まれる、グループobj と同じ被写体が撮影されている画素の集合N_blk,obj（サンプル画素群）を求める［代表デプス設定ステップおよびサンプル画素群設定ステップＡ６］。

具体的な処理としては、まず、代表デプス設定部１０７ｂにおいて、グループobj の代表デプス値D_obj を求める（代表デプス設定ステップ）。代表デプス値D_obj を求める方法としては、グループobj 内の画素C_objについてのデプス情報を用いて１つのデプス情報を求めることが可能であれば、どのような方法を用いることができる。ただし、復号側と同じ処理で求める必要がある。例えば、平均値や中央値などを使うことができる。平均値を用いる場合の代表デプス値D_obj は次の式（１）で表すことができる。なお、∥∥はその集合の画素数を表す。

　なお、被写体判定ステップＡ４でデプス情報を基準にして画素のグルーピングを行う際に、グループの代表となる画素やグループを示すデプス情報を決めながら、画素のグルーピングを行う手法が存在する。そのような手法を用いる場合、そのときのグループの代表として用いられた画素の持つデプス情報やグループを示すデプス情報を代表デプス値としても構わない。この場合、代表デプス設定ステップの処理は被写体判定ステップＡ４で同時に行われる。グループの代表決定とグルーピングとを同時に行う手法として代表的なものにAffinity Propagationと呼ばれる手法がある。この手法は、B. J. Frey and D. Dueck, “Clustering by Passing Messages Between Data Points”, Science 2007, Vol. 315(5814): pp. 972-976に記載されている。

　このようにして代表デプス値D_objを求めると、続いて、サンプル画素群設定部１０７ｃにおいて、集合N_blkに含まれるグループobj と同じ被写体が撮影されている画素の集合N_blk,obj（サンプル画素群）を求める（サンプル画素群設定ステップ）。集合N_blk,obj は、次の式（２）で表されるように、その画素についてのデプス値と代表デプス値との差分絶対値が予め与えられた閾値thSameObj未満とすることで定義することができる。

　集合N_blk,objが求まった後、その集合の画素数に応じて、補正モデル選択部１０７ｄにおいて、予め準備されている補正モデルの中から使用するものを選択する［補正モデル選択ステップＡ７］。

　幾つの補正モデルを準備しても構わないが、復号側でも同じ補正モデルを準備し、同じ判断基準によって使用する補正モデルを選択しなくてはならない。また、補正モデルが１つしか準備されていない場合は、このステップを省略することができる。

　後述するステップＡ９で実行することになる視点合成画像を補正して予測画像を生成する処理は、視点合成画像を入力として予測画像を出力する関数として表現することが可能である。補正モデルとは、このときに用いる関数のモデルを指す。例えば、オフセットによる補正、１次関数を用いた補正、タップ長ｋの二次元線形フィルタ処理などがある。補正対象の画素をｐとすると、これらは、それぞれ、以下の式（３）～式（５）で表すことが可能である。

　オフセットによる補正や１次関数を用いた補正は、線形フィルタ処理による補正の特殊な例である。なお、補正処理は線形処理である必要はなく、補正パラメータ推定が可能であれば非線形フィルタを使用しても構わない。非線形な補正方法の例としてはガンマ補正がある。ガンマ補正は次の式（６）で表すことができる。

　これらの補正モデルの例では、それぞれ、offset、（α，β）、（｛F_i,j｝, o）、（γ，ａ，ｂ）が補正パラメータとなる。つまり、補正モデルによって補正パラメータの数が変化する。

　補正パラメータの数が多いほど精度の高い補正を行うことが可能であるが、これらの補正パラメータを決定するためには、最低でも補正パラメータと同じ数だけのサンプルが必要となる。後述するように、このサンプルが前記の集合N_blk,objに含まれるサンプル画素の視点合成画像および復号画像となるため、集合N_blk,objの画素数に応じて補正モデルを決定することによって、精度よく補正を行うことが可能となる。なお、補正パラメータ推定には出来るだけ多くのサンプルを用いたほうが、推定された補正パラメータの頑健性が向上する。したがって、十分な頑健性を保つことのできるように補正モデルの選択を行うことが望ましい。

　１つの補正モデルを選択した後、補正パラメータ推定部１０７ｅにおいて、集合N_blk,objに含まれる画素に対しての視点合成画像Synthおよび復号画像Decをサンプルとして、その補正モデルに含まれる補正パラメータの推定を行う［補正パラメータ推定ステップＡ８］。

　ここで行われる補正パラメータの推定では、集合N_blk,objに含まれる画素の補正前の値を視点合成画像とし、理想的な補正後の値を復号画像とした際に、実際に補正モデルで補正した際の値と理想値との誤差が出来るだけ小さくなるように求める。

　例えば、補正が線形処理であるとすると、最小二乗法を用いて補正パラメータを決定することができる。つまり、補正を関数Mで表すとすると、次の式（７）で表される補正パラメータの二次関数で表される値を最小化すればよい。

　つまり、各補正パラメータに関する式（７）の偏微分値が０になる連立方程式を解くことで、補正パラメータを求めることができる。

　補正パラメータが推定できたら、視点合成画像補正部１０８において、ブロックblk のグループobj についての視点合成画像Synthを補正パラメータに従って補正することで、ブロックblk のグループobj についての予測画像Pred を生成する［視点合成画像補正ステップＡ９］。

　この予測画像Pred の生成処理は、具体的には、図３の処理フローに示すように、画素ごとに行われる。ここで、図３の処理フローにおいて、pix は画素の識別情報を表し、 numPix_blk,objはブロックblk のグループobj 内の画素数を表す。

　例えば、オフセット値を用いた補正を行う場合には、前述した式（３）従って予測画像Pred が生成される。

　この予測画像Pred の生成について、補正方法（補正モデル）として、オフセット値を用いた式（３）の補正を行う例について説明する。図４に示すように、補正パラメータ推定ステップＡ８において、周辺の符号化済み領域に存在する同じ被写体に対しての視点合成画像の画素値をIn とし、その被写体の復号画像の画素値をOutとした場合のoffsetを推定することで、画素値変換式となる補正モデルを決定する。次に、ステップＡ９で、その決定した画素値変換式のIn に、ブロックblk のグループobj についての視点合成画像の画素値を代入することで、ブロックblk のグループobj についての予測画像を補正するように処理する。

　ブロックblk についての予測画像の生成が終了したら、画像符号化部１０９において、ステップＡ９で生成した予測画像Ｐred を予測信号としながら、ブロックblk についての符号化対象フレームOrgの符号化を行う［画像符号化ステップＡ１２］。

　この符号化ステップＡ１２においては、どのような符号化方法を用いても構わないが、Ｈ．２６４など一般的な符号化手法では、OrgとPred との差分に対して、ＤＣＴ・量子化・２値化・エントロピー符号化を施すことによって符号化を行う。

符号化結果のビットストリームは多視点映像符号化装置１００の出力となる。また、符号化結果のビットストリームはブロックごとに画像復号部１１０で復号され、復号結果であるところの復号画像Decが他のブロックにおける補正パラメータ推定のために復号画像メモリ１１１に格納される［画像復号ステップＡ１３］。

このようにして、図１のように構成される多視点映像符号化装置１００は、カメラ間で輝度や色のミスマッチが被写体に応じて局所的に生じている場合においても、多視点映像を高能率に符号化できるようにするために、このミスマッチに対処するための補正パラメータを被写体に応じて局所的に求める。　また、この多視点映像符号化装置１００は、符号量の増加を回避するために、その補正パラメータを別途符号化／復号する必要がない形態で求めるようにしつつ、その多視点映像の符号化を実行する。

本実施形態では、視点合成画像を必ず使用してブロックblk の画像信号を符号化する場合を説明したが、本実施形態で説明した視点合成画像を用いた映像予測を、複数存在する予測化モードの１つとして使用することも可能である。

［２］本発明の第２の実施形態による多視点映像復号装置

　図５に、本発明の第２の実施形態に係る多視点映像復号装置２００の装置構成を図示する。

　図５に示すように、本実施形態の多視点映像復号装置２００において、符号データ入力部２０１は、第１のカメラで撮影された被写体の画像（フレーム）の符号データを復号対象として入力する。符号データメモリ２０２は、符号データ入力部２０１から入力された符号データを蓄積する。蓄積された符号データは、画像復号部２０９に供給される。
　視点合成画像入力部２０３は、第１のカメラとは異なる位置に配置された第２のカメラで同一の被写体を撮影して得られた画像の復号済みのフレームを用いて生成された復号対象フレームについての視点合成画像を入力する。視点合成画像メモリ２０４は、視点合成画像入力部２０３から入力された視点合成画像を蓄積する。蓄積された視点合成画像は、補正パラメータ生成部２０７および視点合成画像補正部２０８に供給される。
　デプス情報入力部２０５は、復号対象フレームについてのデプス情報を入力する。デプス情報メモリ２０６は、デプス情報入力部２０５から入力されたデプス情報を蓄積する。蓄積されたデプス情報は、補正パラメータ生成部２０７に供給される。
　補正パラメータ生成部２０７は、復号対象領域の周辺領域における視点合成画像、デプス情報および復号画像と、復号対象領域におけるデプス情報とを用いて補正パラメータを推定する。視点合成画像補正部２０８は、推定された補正パラメータを用いて復号対象領域の視点合成画像を補正する。
　画像復号部２０９は、補正された視点合成画像を予測信号として使用しながら復号対象領域の画像信号を復号する。（１０）復号画像メモリ２１０は、画像復号部２０９で復号された画像を蓄積する。

　補正パラメータ生成部２０７は、図８に示すとおり、デプス情報メモリ２０６からのデプス情報が供給される被写体判定部２０７ａ、この被写体判定部２０７ａの下流に順に接続された代表デプス設定部２０７ｂおよびサンプル画素群設定部２０７ｃを有する。サンプル画素群設定部２０７ｃには、その下流に補正モデル選択部２０７ｄおよび補正パラメータ推定部２０７ｅが順に接続される。補正パラメータ推定部２０７ｅには、復号画像メモリ２１０からの復号画像および視点合成画像メモリ２０４からの視点合成画像が供給され、供給された復号画像および視点合成画像を用いて推定した補正パラメータを視点合成画像補正部２０８に供給する。

　図６に、このように構成される第２の実施形態の多視点映像復号装置２００が実行する処理のフローを示す。
　この処理フローに従って、本実施形態の多視点映像復号装置２００が実行する処理について詳細に説明する。

　まず、符号データ入力部２０１により復号対象フレームの符号データが入力されて符号データメモリ２０２に格納される。視点合成画像入力部２０３により復号対象フレームに対しての視点合成画像Synthが入力されて視点合成画像メモリ２０４に格納される。デプス情報入力部２０５により復号対象フレームに対してのデプス情報Depthが入力されてデプス情報メモリ２０６に格納される［Ｂ１］。

　ここで入力される視点合成画像とデプス情報は符号化装置で得られるものと同じものである。これは符号化装置で得られる情報と同じ情報を用いることでドリフト等の符号化ノイズの発生を抑えるためである。ただし、これらの符号化ノイズの発生を許容する場合は、符号化装置と異なるものが入力されても構わない。

　なお、デプス情報は多視点映像復号装置２００の外部より与えられるものとしているが、非特許文献３に記載されたように、既に復号済みの別のカメラのフレームから推定して求めることも可能である。したがって、必ずしも送信側から受信側へ伝送される必要はない。また、視点合成画像は、既に復号済みの第２のカメラのフレームとデプス情報とを用いて生成される。

　次に、復号対象フレームを複数の復号対象領域に分割し、その領域ごとに視点合成画像を補正しながら、画像復号部２０９で復号対象フレームの画像信号を復号する［Ｂ２－Ｂ１４］。

　つまり、復号処理ブロックのインデックスをblk 、総復号処理ブロック数を numBlks で表すとすると、blk を０で初期化した後［Ｂ２］、blk に１を加算しながら［Ｂ１３］、blk が numBlks になるまで［Ｂ１４］、以下のステップ［Ｂ３－Ｂ１２］を繰り返す。

　復号処理ブロックごとに繰り返される処理では、復号装置２００は、まずブロックblk （復号対象領域）の周辺の復号済み領域の画素の集合N_blk を求める［Ｂ３］。

　周辺領域としてはブロックblk に隣接する復号処理ブロックや隣接画素など、様々な単位のものを用いることが可能である。どのような定義の周辺領域を使用しても構わないが、符号化側で使用する定義と同じものを使用する必要がある。

　次に、補正パラメータ生成部２０７の被写体判定部２０７ａは、画素ごとに与えられたデプス情報を基準にして、ブロックblk 内の画素のグルーピングを行う［被写体判定ステップＢ４］。

　この結果の各グループのインデックスをobj 、グループ数を numObjs と表し、グループobj に属する画素をC_objと表すことにする。ここでの処理は第１の実施形態の被写体判定ステップＡ４と同じである。

　グルーピングが終了したら、各グループの画素ごとに視点合成画像を補正することで予測画像Pred を生成する［Ｂ５－Ｂ１１］。

つまり、グループインデックスobj を０に初期化した後［Ｂ５］、obj に１を加算しながら［Ｂ１０］、obj が numObjs になるまで［Ｂ１１］、補正パラメータ生成部２０７において、視点合成画像を補正するための補正パラメータを推定するステップ［Ｂ６－Ｂ８］を行う。この処理とともに、視点合成画像補正部２０８において、推定された補正パラメータを用いてグループobj に含まれる画素についての視点合成画像を補正して予測画像を生成するステップ［Ｂ９］とを繰り返す。

　このステップＢ９での処理は第１の実施形態のステップＡ９と同じであり、図７の処理フローに示すように、画素ごとに行われる。ここで、図７の処理フローにおいて、pix は画素の識別情報を表し、 numPix_blk,objはブロックblk のグループobj 内の画素数を表す。代表デプス設定部２０７ｂ、サンプル画素群設定部２０７ｃ、補正モデル選択部２０７ｄおよび補正パラメータ推定部２０７ｅによって行われる、補正パラメータの推定ステップ［Ｂ６－Ｂ８］は、第１の実施形態におけるステップＡ６－Ａ８と同じである。

　ブロックblk についての予測画像の生成が終了したら、画像復号部２０９において、ステップＢ９で生成した予測画像Pred を予測信号としながら、ブロックblk についての復号対象画像Decを復号する［Ｂ１２］。

ここで行われる復号処理は符号データを生成するときに用いられた方法に対応するものを使う必要がある。例えば、Ｈ．２６４を用いて符号化されている場合、エントロピー復号、多値化、逆量子化、逆ＤＣＴを行い復号された残差信号に対して予測信号を足し合わせることで復号処理が行われる。

復号結果の復号画像は多視点復号装置２００の出力となるとともに、他のブロックにおける補正パラメータ推定のために復号画像メモリ２１０に格納される。

　このようにして、図５のように構成される多視点映像復号装置２００は、図１に示された多視点映像符号化装置１００の生成した多視点映像復号の符号データを復号する。

本実施形態では、視点合成画像を必ず使用してブロックblk が符号化されているものとして説明を行った。視点合成画像を使う予測モードが複数存在する予測モードの１つとして使われて符号データを復号する場合においても、その予測モードが使われている場合にのみ前述の処理フローに従って画像を復号し、それ以外の予測モードが使われている場合は、その予測モード（それ以外の予測モード）に従った従来の復号方法を用いることで画像を復号することが可能である。

　上記説明を行った第１および第２の実施形態では、全てのブロックにおいて補正を行うようにしているが、ブロックごとに１ビットのフラグ情報を符号化することで、補正を行うか否かを選択する構成をとることもできる。

　また、１ビットのフラグ情報を符号化せずに、補正パラメータの信頼度を測定し、その信頼度に応じて補正をするのか否かを選択する方法もある。

　具体的には、ステップＡ８およびステップＢ８において補正パラメータを求めた後に、以下の式（８）～式（１０）に示すような補正の確からしさと有効性を表現する値を求めてもよい。補正パラメータ生成部１０７および２０７は、その値があらかじめ与えられた閾値よりも大きな場合にのみ、ステップＡ９およびステップＢ９において視点合成画像を補正したものを予測画像とし、それ以外の場合は、視点合成画像をそのまま予測画像とする。

　式（８）の第１項は復号画像Decと視点合成画像Synthとの差分絶対値和を示し、第２項は復号画像Decと予測画像Pred との差分絶対値和を示す。すなわち、式（８）は補正することによって真値と予測値との差分絶対値和がどの程度削減されたかを示す。また、式（９）の第１項は復号画像Decと視点合成画像Synthとの差分二乗和を示し、第２項は復号画像Decと予測画像Pred との差分二乗和を示す。すなわち、式（９）は補正することによって真値と予測値との差分二乗和がどの程度削減されたかを示す。また、式（１０）は補正モデルが得られているサンプルに対してどの程度確からしいかを表す。ここで、どの値も処理対象ブロックではなく周辺領域の値を用いて求められているため、全体で用いる閾値のみを符号化して復号側に通知するだけでよい。

　なお、本実施形態では、１つのカメラの１フレームを符号化又は復号する処理を説明したが、この処理をフレームごとに繰り返すことで多視点映像の符号化又は復号を実現することが可能である。さらに、カメラごとに繰り返すことで複数のカメラの多視点映像の符号化又は復号を実現することが可能である。

　以上説明した処理は、コンピュータとソフトウェアプログラムとによっても実現することができ、そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも、ネットワークを通して提供することも可能である。

　また、以上の実施の形態では多視点映像符号化装置および多視点映像復号装置を中心に説明したが、この多視点映像符号化装置の各部の動作に対応したステップによって本発明の多視点映像符号化方法を実現することができる。同様に、この多視点映像復号装置の各部の動作に対応したステップによって本発明の多視点映像復号方法を実現することができる。

　以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものでないことは明らかである。したがって、本発明の範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行っても良い。

　本発明は多視点画像の符号化手法に適用できる。本発明を適用することで、カメラ間で輝度や色のミスマッチが被写体に応じて局所的に生じている場合においても、効率的な多視点画像や多視点動画像の符号化および復号を実現できるようになるとともに、その実現にあたっての符号量を大幅に削減することができる。

　１００　多視点映像符号化装置
　１０１　符号化対象画像入力部
　１０２　符号化対象画像メモリ
　１０３　視点合成画像入力部
　１０４　視点合成画像メモリ
　１０５　デプス情報入力部
　１０６　デプス情報メモリ
　１０７　補正パラメータ生成部
　１０８　視点合成画像補正部
　１０９　画像符号化部
　１１０　画像復号部
　１１１　復号画像メモリ
　２００　多視点映像復号装置
　２０１　符号データ入力部
　２０２　符号データメモリ
　２０３　視点合成画像入力部
　２０４　視点合成画像メモリ
　２０５　デプス情報入力部
　２０６　デプス情報メモリ
　２０７　補正パラメータ生成部
　２０８　視点合成画像補正部
　２０９　画像復号部
　２１０　復号画像メモリ

Claims

　第１のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割し、前記入力画像についてのデプス情報と前記第１のカメラとは異なる位置に配置された第２のカメラで撮影された前記被写体の既に符号化済みの画像とから合成された視点合成画像を用いて、前記符号化対象領域ごとに予測符号化を行う多視点画像符号化方法であって、
　前記符号化対象領域において撮影された被写体についての代表デプス情報を設定する代表デプス設定ステップと、
　前記符号化対象領域に隣接する既に符号化済みの領域におけるデプス情報と前記代表デプス情報とに基づいて、前記符号化対象領域内と同じ被写体が撮影されている画素群を求めてサンプル画素群として設定するサンプル画素群設定ステップと、
　前記サンプル画素群についての前記視点合成画像および前記サンプル画素群について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定ステップと、
　前記補正パラメータを用いて、前記符号化対象領域についての前記視点合成画像を補正して補正視点合成画像を生成する視点合成画像補正ステップと、
　前記補正視点合成画像を用いて、前記符号化対象領域の画像信号を符号化して符号データを生成する画像符号化ステップと、
　前記符号データを復号して、前記符号化対象領域における復号画像を生成する画像復号ステップと、
　を有する多視点画像符号化方法。
　前記符号化対象領域における画素を、当該画素のデプス情報を基準にしてグルーピングする被写体判定ステップを有し、
　前記代表デプス設定ステップでは、前記被写体判定ステップで求められたグループごとに代表デプス情報を設定し、
　前記サンプル画素群設定ステップでは、前記被写体判定ステップで求められたグループごとにサンプル画素群を設定し、
　前記補正パラメータ推定ステップでは、前記被写体判定ステップで求められたグループごとに補正パラメータを推定し、
　前記視点合成画像補正ステップでは、前記被写体判定ステップで求められたグループごとに視点合成画像を補正する
　請求項１に記載の多視点画像符号化方法。
　前記サンプル画素群の画素数に応じて前記符号化対象領域についての前記視点合成画像を補正する補正モデルを選択する補正モデル選択ステップを備え、
　前記補正パラメータ推定ステップでは、前記補正モデル選択ステップで選択された前記補正モデルにおける補正パラメータを推定し、
　前記視点合成画像補正ステップでは、前記補正モデル選択ステップで選択された前記補正モデルを用いて視点合成画像を補正する
　請求項１または２に記載の多視点画像符号化方法。
　第１のカメラで撮影された被写体の画像を前記第１のカメラとは異なる位置に配置された第２のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記復号対象画像についてのデプス情報と前記第２のカメラで撮影された既に復号済みの前記被写体の画像とから合成された視点合成画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行う多視点画像復号方法であって、
　前記復号対象領域において撮影された被写体についての代表デプス情報を設定する代表デプス設定ステップと、
　前記復号対象領域に隣接する既に復号済みの領域におけるデプス情報と前記代表デプス情報とに基づいて、前記復号対象領域内と同じ被写体が撮影されている画素群を求めてサンプル画素群として設定するサンプル画素群設定ステップと、
　前記サンプル画素群についての前記視点合成画像および前記サンプル画素群について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定ステップと、
　前記補正パラメータを用いて、前記復号対象領域についての前記視点合成画像を補正して補正視点合成画像を生成する視点合成画像補正ステップと、
　前記補正視点合成画像を用いて、前記復号対象領域の画像信号を復号する画像復号ステップと、
　を有する多視点画像復号方法。
　前記復号対象領域における画素を、当該画素のデプス情報を基準にしてグルーピングする被写体判定ステップを有し、
　前記代表デプス設定ステップでは、前記被写体判定ステップで求められたグループごとに代表デプス情報を設定し、
　前記サンプル画素群設定ステップでは、前記被写体判定ステップで求められたグループごとにサンプル画素群を設定し、
　前記補正パラメータ推定ステップでは、前記被写体判定ステップで求められたグループごとに補正パラメータを推定し、
　前記視点合成画像補正ステップでは、前記被写体判定ステップで求められたグループごとに視点合成画像を補正する
　請求項４に記載の多視点画像復号方法。
　前記サンプル画素群の画素数に応じて前記復号対象領域についての前記視点合成画像を補正する補正モデルを選択する補正モデル選択ステップを備え、
　前記補正パラメータ推定ステップでは、前記補正モデル選択ステップで選択された前記補正モデルにおける補正パラメータを推定し、
　前記視点合成画像補正ステップでは、前記補正モデル選択ステップで選択された前記補正モデルを用いて視点合成画像を補正する
　請求項４または５に記載の多視点画像復号方法。
　第１のカメラで撮影された被写体の入力画像を複数の符号化対象領域に分割し、前記入力画像についてのデプス情報と既に前記第１のカメラとは異なる位置に配置された第２のカメラで撮影された前記被写体の符号化済みの画像とから合成された視点合成画像を用いて、前記符号化対象領域ごとに予測符号化を行う多視点画像符号化装置であって、
　前記符号化対象領域において撮影された被写体についての代表デプス情報を設定する代表デプス設定部と、
　前記符号化対象領域に隣接する既に符号化済みの領域におけるデプス情報と前記代表デプス情報とに基づいて、前記符号化対象領域内と同じ被写体が撮影されている画素群を求めてサンプル画素群として設定するサンプル画素群設定部と、
　前記サンプル画素群についての前記視点合成画像および前記サンプル画素群について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、
　前記補正パラメータを用いて、前記符号化対象領域についての前記視点合成画像を補正して補正視点合成画像を生成する視点合成画像補正部と、
　前記補正視点合成画像を用いて、前記符号化対象領域の画像信号を符号化して符号データを生成する画像符号化部と、
　前記符号データを復号して、前記符号化対象領域における復号画像を生成する画像復号部と、
　を有する多視点画像符号化装置。
　第１のカメラで撮影された被写体の画像を前記第１のカメラとは異なる位置に配置された第２のカメラで撮影された前記被写体の画像を用いて符号化した復号対象画像の符号データを、前記復号対象画像についてのデプス情報と前記第２のカメラで撮影された既に復号済みの前記被写体の画像とから合成された視点合成画像を用いて、前記復号対象画像を分割した複数の復号対象領域ごとに復号を行う多視点画像復号装置であって、
　前記復号対象領域において撮影された被写体についての代表デプス情報を設定する代表デプス設定部と、
　前記復号対象領域に隣接する既に復号済みの領域におけるデプス情報と前記代表デプス情報とに基づいて、前記復号対象領域内と同じ被写体が撮影されている画素群を求めてサンプル画素群として設定するサンプル画素群設定部と、
　前記サンプル画素群についての前記視点合成画像および前記サンプル画素群について既に復号された復号画像に基づいて、輝度および色のミスマッチを補正する補正パラメータを推定する補正パラメータ推定部と、
　前記補正パラメータを用いて、前記復号対象領域についての前記視点合成画像を補正して補正視点合成画像を生成する視点合成画像補正部と、
　前記補正視点合成画像を用いて、前記復号対象領域の画像信号を復号する画像復号部と、
　を有する多視点画像復号装置。
　請求項１ないし３のいずれか１項に記載の多視点画像符号化方法をコンピュータに実行させるための多視点画像符号化プログラム。
　請求項４ないし６のいずれか１項に記載の多視点画像復号方法をコンピュータに実行させるための多視点画像復号プログラム。