WO2012060168A1

WO2012060168A1 - 符号化装置、復号装置、符号化方法、復号方法、プログラム、記録媒体、および符号化データ

Info

Publication number: WO2012060168A1
Application number: PCT/JP2011/071913
Authority: WO
Inventors: 純生佐藤
Original assignee: シャープ株式会社
Priority date: 2010-11-04
Filing date: 2011-09-26
Publication date: 2012-05-10

Abstract

　動画像符号化装置（１）は、テクスチャ画像（＃１）と距離画像（＃２）とを符号化する装置であり、画像（＃１）の全領域を分割した複数の領域であって、各領域が類似する色の画素からなる複数の領域を規定する画像分割処理部（２１）と、上記複数の領域と同一の分割パターンで画像（＃２）の全領域を分割した複数の領域を規定する距離画像分割処理部（２２）と、画像（＃２）の各領域について、領域内の各画素の距離値から最頻値を算出する距離値修正部（２３）と、各領域の最頻値からなる距離値に関する符号化データ（＃２５）を生成する情報源符号化部（２５）と、を備えている。

Description

符号化装置、復号装置、符号化方法、復号方法、プログラム、記録媒体、および符号化データ

　本発明は、主に、距離画像（Depth Image）を符号化する符号化装置、および、そのような符号化装置により符号化された距離画像を復号する復号装置に関する。

　被写体の三次元形状を、正確に、且つ、効率良くデータとして記録することは重要なテーマであり、従来からさまざまな方法が提案されている。

　それらの方法の一つとして、被写空間を各被写体および背景の色で表現した一般的な二次元画像であるテクスチャ画像と、被写空間を各被写体および背景までの視点からの距離で表現した画像（以下、「距離画像」と呼ぶ）との二種類の画像データを関連付けて記録する方法がある。より具体的には、距離画像とは、画素ごとに、被写空間中の対応する地点までの視点からの距離値（深度値）を表現する画像である。

　この距離画像は、例えば、テクスチャ画像を記録するカメラ近傍に設置された、デプスカメラ等の測距装置によって取得できる。あるいは、多視点カメラの撮影によって得られる複数のテクスチャ画像を解析することによっても距離画像を取得することができ、その解析手法も数多く提案されている。

　また、距離画像に関する規格として、国際標準化機構／国際電機標準会議（ＩＳＯ／ＩＥＣ）のワーキンググループであるＭｏｖｉｎｇ　Ｐｉｃｔｕｒｅ　Ｅｘｐｅｒｔｓ　Ｇｒｏｕｐ（ＭＰＥＧ）において、距離値を２５６段階（すなわち８ビットの輝度値）で表現する規格であるＭＰＥＧ－Ｃ　ｐａｒｔ３が定められている。すなわち、標準的な距離画像は８ビットのグレースケール画像となる。また、視点からの距離が近いほど高い輝度値を割り当てるように規定されているため、標準的な距離画像では、手前に位置する被写体ほど白く、奥に位置する被写体ほど黒く表現される。

　同一の被写空間を表現したテクスチャ画像と距離画像とが得られれば、テクスチャ画像に描画されている被写体像を構成する各画素の視点からの距離が距離画像から分かるため、被写体を奥行きが最大２５６段階で表現される三次元形状として復元することができる。さらに、三次元形状を二次元平面上に幾何的に投影することにより、元のテクスチャ画像を、元の角度から一定範囲にある別の角度から被写体を撮影した場合の被写空間のテクスチャ画像に変換することが可能である。すなわち、１組のテクスチャ画像および距離画像によって一定範囲にある任意の角度から見たときの三次元形状を復元できるため、たかだか複数組のテクスチャ画像および距離画像を用いることにより三次元形状の自由視点画像を少ないデータ量で表すことが可能である。

　ところで、非特許文献１には、映像が内部に持つ時間的あるいは空間的な冗長性を効率良く排除することにより、映像を圧縮符号化することができる技術が開示されている。この技術を用いた符号化装置により、テクスチャ映像（テクスチャ画像を各フレームとする映像）と距離映像（距離画像を各フレームとする映像）との各映像を符号化すると、各映像が有する冗長性を排除することが可能となり、復号装置に伝送される各映像のデータ量をさらに削減することができる。

「ＩＴＵ－Ｔ　勧告　Ｈ．２６４」,International Telecommunication Union - Telecommunication Standardization Sector,２００９年３月

　しかしながら、非特許文献１に開示されている圧縮符号化技術をテクスチャ映像および距離映像に適応したとしても、距離映像のデータ量は必ずしも十分に削減されていないという問題がある。

　すなわち、距離画像においては、テクスチャ画像と比べてより広い領域において単一の画素値が表れる傾向が強いと言える。例えば、テクスチャ画像に派手な柄の服を着ている人物が描かれていても、距離画像においては、服の部分の距離値が一定になる傾向がある。非特許文献１に開示されている圧縮符号化技術は、ある程度距離画像の符号量を削減できるものの、単一の距離値から構成される領域の画素を含め距離画像の全画素の距離値を符号化するので、必ずしも十分に符号量を削減できているとは言えない。

　本発明は、上記課題に鑑みてなされたものであり、その主な目的は、復号装置に供給すべき距離画像の符号化データの符号量を従来よりも削減することが可能な符号化装置、および、そのような符号化装置から供給された符号化データから距離画像を復号する復号装置を実現することにある。

　本発明に係る符号化装置は、上記課題を解決するために、テクスチャ画像とで対を成す距離画像を符号化する符号化装置において、上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する第１領域規定手段と、上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域を規定する第２領域規定手段と、上記第２領域規定手段により規定された上記複数の領域の各々について、該領域に含まれる各画素の距離値から代表値を算出する代表値算出手段と、上記距離値に関するデータを含む、上記距離画像の符号化データを生成する符号化手段と、を備え、上記距離値に関するデータは、上記代表値算出手段により算出された各領域の代表値からなるデータであることを特徴としている。

　上記の構成によれば、本発明に係る符号化装置が生成する上記距離画像の符号化データには、距離画像の距離値として、たかだか第２領域規定手段が規定する領域の個数分の代表値が含まれることとなる。

　一方、従来の動画像符号化装置は、上記距離画像の全画素の距離値を符号化する。

　したがって、本発明に係る符号化装置は、従来の動画像符号化装置に比べ、上記距離画像の符号化データの符号量を削減することができるという効果を奏する。

　本発明に係る符号化方法は、上記課題を解決するために、テクスチャ画像とで対を成す距離画像を符号化する符号化方法において、上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する第１領域規定工程と、上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域を規定する第２領域規定工程と、上記第２領域規定工程にて規定された上記複数の領域の各々について、該領域に含まれる各画素の距離値から代表値を算出する代表値算出工程と、上記距離値に関するデータを含む、上記距離画像の符号化データを生成する符号化工程と、を含み、上記距離値に関するデータは、上記代表値算出工程にて算出された各領域の代表値からなるデータであることを特徴としている。

　上記の構成によれば、本発明に係る符号化方法は、本発明に係る符号化装置と同様の作用効果を奏する。

　本発明に係る復号装置は、上記課題を解決するために、テクスチャ画像とで対を成す距離画像を距離画像の符号化データから復号する復号装置において、上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する領域規定手段と、上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域の各々について該領域における距離値に関するデータとして該領域における各画素の距離値の代表値のみを含んでいる、上記符号化データを読み出す読出手段と、復号すべき上記距離画像を構成する上記複数の領域の各々について、該領域に含まれる画素の画素値を上記符号化データに含まれている該領域における距離値に設定することにより、上記距離画像を復号する復号手段と、を備えていることを特徴としている。

　上記の構成によれば、本発明に係る復号装置では、本発明に係る符号化装置から上記符号化データが供給された場合に、上記読出手段が、上記符号化データを読み出す。そして、本発明に係る復号装置では、上記復号手段が、領域規定手段が規定した上記複数の領域に対応する上記距離画像中の複数の領域の各々について、該領域に含まれる画素の画素値を上記符号化データに含まれている該領域における距離値に設定することにより、距離画像を復号する。

　テクスチャ画像と符号化により上記符号化データが生成された距離画像（原距離画像）とには、テクスチャ画像中のある領域が類似する色の画素からなる画素群で構成されている場合、原距離画像中の対応する領域に含まれる画素群は全部または略全ての画素が同じ距離値をとる傾向が強いという相関があることがわかっている。したがって、上記復号手段により復号される距離画像は、原距離画像と近似する画像となる。

　したがって、本発明に係る復号装置は、本発明に係る符号化装置から送信された原距離画像の符号化データから距離画像を復号することができるという効果を奏する。

　また、本発明に係る復号方法は、上記課題を解決するために、テクスチャ画像とで対を成す距離画像を距離画像の符号化データから復号する復号方法において、上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する領域規定工程と、上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域の各々について該領域における距離値に関するデータとして該領域における各画素の距離値の代表値のみを含んでいる、上記符号化データを読み出す読出工程と、復号すべき上記距離画像を構成する上記複数の領域の各々について、該領域に含まれる画素の画素値を上記符号化データに含まれている該領域における距離値に設定することにより、上記距離画像を復号する復号工程と、を含んでいることを特徴としている。

　上記の構成によれば、本発明に係る復号方法は、本発明に係る復号装置と同様の作用効果を奏する。

　さらに、テクスチャ画像とで対を成す距離画像の符号化データであって、上記距離画像の全領域を所定の分割パターンで分割した複数の領域の各々について、該領域における距離値に関するデータとして該領域に含まれる各画素の距離値の代表値のみを含んでおり、上記所定の分割パターンは、上記テクスチャ画像の全領域を、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域に分割する分割パターンである、ことを特徴とする符号化データも本発明の範疇に含まれる。

　以上説明したように、本発明に係る符号化装置は、復号装置に供給すべき距離画像の符号化データの符号量を従来よりも削減することができるという効果を奏する。

　また、本発明に係る復号装置は、本発明に係る符号化装置から供給される距離画像の符号化データから距離画像を復号することができるという効果を奏する。

本発明の一実施形態に係る動画像符号化装置の構成を示すブロック図である。図１の動画像符号化装置の動作を示すフローチャート図である。図１の動画像符号化装置に入力されるカラーのテクスチャ画像の一具体例を示した図である。図１の動画像符号化装置に入力される距離画像の一具体例を示す図であり、図５のテクスチャ画像とペアで入力される距離画像を示している。図１の動画像符号化装置が図３のテクスチャ画像から規定する各セグメントの分布を示した図である。図１の動画像符号化装置の画像分割処理部が、図５の各セグメントについて、位置情報として座標値を後段に出力する、セグメントの境界部分を示した図である。図１の動画像符号化装置が各セグメントに付与するセグメント番号の値を決定するためにテクスチャ画像を走査する順序を示す図である。図３のテクスチャ画像から規定される各セグメントに付与されるセグメント番号を模式的に示す図である。図１の動画像符号化装置が、テクスチャ画像の全領域を分割することにより規定される各セグメント（領域）について、距離画像中の対応するセグメントにおける距離値の最頻値にセグメント毎に一意なセグメント番号を関連づけることにより生成するデータを模式的に示す図である。図１の動画像符号化装置が図９に模式的に示したデータから生成する２進数列を示す図である。ＮＡＬユニットのデータ構造を模式的に示した図である。図１の動画像符号化装置の変形例に係る動画像符号化装置の構成を示すブロック図である。テクスチャ画像において、類似する色の２つの画素が近接している場合に２つの画素が１つのセグメントを構成するか否かを説明するための図である。（ａ）および（ｂ）は、それぞれ、上記２つの画素が縦方向および横方向に隣接している場合を示しており、（ｃ）は、上記２つの画素が縦方向および横方向のいずれにおいても接していない場合を示している。本発明の一実施形態に係る動画像復号装置の構成を示すブロック図である。図１４の動画像復号装置の動作を示すフローチャート図である。本発明の別の一実施形態に係る動画像符号化装置の構成を示すブロック図である。本発明の別の一実施形態に係る動画像復号装置の構成を示すブロック図である。図１の動画像符号化装置が複数のセグメントを規定する動作の一例を示すフローチャート図である。図１８のフローチャートにおけるセグメント結合処理のサブルーチンを示すフローチャート図である。

　＜実施形態１＞
　本発明の一実施形態に係る動画像符号化装置および動画像復号装置について図１～図１３を参照しながら以下に説明する。

　最初に、本実施形態に係る動画像符号化装置について説明する。本実施形態に係る動画像符号化装置は、概略的に言えば、３次元動画像を構成する各フレームについて、該フレームを構成するテクスチャ画像および距離画像を符号化することによって符号化データを生成する装置である。

　本実施形態に係る動画像符号化装置は、テクスチャ画像の符号化に、Ｈ．２６４／ＭＰＥＧ－４　ＡＶＣ規格に採用されている符号化技術を用いる一方、距離画像の符号化には本発明に特有の符号化技術を用いている動画像符号化装置である。

　本発明に特有の上記符号化技術は、テクスチャ画像と距離画像とに相関があることに着目して開発された符号化技術である。２つの画像には、テクスチャ画像中のある領域が類似する色の画素からなる画素群で構成されている場合、距離画像中の対応する領域に含まれる画素群は全部または略全ての画素が同じ距離値をとる傾向が強いという相関がある。

　最初に本実施形態に係る動画像符号化装置の構成について図１を参照しながら説明する。図１は、動画像符号化装置の要部構成を示すブロック図である。

　（動画像符号化装置１の構成）
　図１に示すように、動画像符号化装置１は、画像符号化部１１、画像復号部１２、距離画像符号化部２０、およびパッケージング部２８を備えている。また、距離画像符号化部２０は、画像分割処理部２１、距離画像分割処理部２２、距離値修正部２３、番号付与部２４、および情報源符号化部２５を備えている。

　画像符号化部１１は、Ｈ．２６４／ＭＰＥＧ－４　ＡＶＣ規格に規定されているＡＶＣ（Advanced Video Coding）符号化によりテクスチャ画像＃１の符号化を行う。

　画像復号部１２は、テクスチャ画像＃１の符号化データ＃１１からテクスチャ画像＃１’を復号する。

　画像分割処理部２１は、テクスチャ画像の全領域を複数のセグメント（領域）に分割する。そして、画像分割処理部２１は、各セグメントの位置情報からなるセグメント情報＃２１を出力する。セグメントの位置情報とは、そのセグメントのテクスチャ画像＃１における位置を表す情報である。

　距離画像分割処理部２２は、距離画像＃２およびセグメント情報＃２１が入力されると、テクスチャ画像＃１’中の各セグメントについて、距離画像＃２中の対応するセグメント（領域）に含まれる各画素の距離値からなる距離値セットを抽出する。そして、距離画像分割処理部２２は、セグメント情報＃２１から、各セグメントについて距離値セットと位置情報とが関連づけられたセグメント情報＃２２を生成する。

　距離値修正部２３は、距離画像＃２の各セグメントについて、セグメント情報＃２２に含まれる該セグメントの距離値セットから代表値＃２３ａとして最頻値を算出する。すなわち、距離値修正部２３は、距離画像＃２中のセグメントｉにＮ個の画素が含まれている場合には、Ｎ個の距離値から最頻値を算出する。なお、距離値修正部２３は、最頻値の代わりに、Ｎ個の距離値の平均を平均値、または、Ｎ個の距離値の中央値等を代表値＃２３ａとして算出してもよい。そして、距離値修正部２３は、算出の結果、平均値や中央値等の値が小数値になる場合には、さらに、切捨て、切り上げ、または四捨五入等により小数値を整数値に丸めればよい。

　そして、距離値修正部２３は、セグメント情報＃２２に含まれる各セグメントの距離値セットを、対応するセグメントの代表値＃２３ａに置き換え、セグメント情報＃２３として番号付与部２４に出力する。

　番号付与部２４は、セグメント情報＃２３が入力されると、セグメント情報＃２３に含まれている各代表値＃２３ａに、互いに値が異なる識別子を関連づける。具体的には、番号付与部２４は、セグメント情報＃２３に含まれているＭ組の位置情報および代表値＃２３ａの各組について、代表値＃２３ａと位置情報に応じたセグメント番号＃２４とを関連づける。そして、番号付与部２４は、セグメント番号＃２４と代表値＃２３ａとが関連づけられたデータを外部に出力する。

　情報源符号化部２５は、セグメント番号＃２４と代表値＃２３ａとが関連付けられたデータに圧縮符号化処理を施し、得られた距離画像の符号化データ＃２５を外部に出力する。

　パッケージング部２８は、入力されたテクスチャ画像＃１の符号化データ＃１１と距離画像＃２の符号化データ＃２５とを関連づけ、符号化データ＃２８として外部に出力する。

　（動画像符号化装置１の動作）
　次に、動画像符号化装置１の動作について、図２を参照しながら以下に説明する。図２は、動画像符号化装置１の動作を示すフローチャートである。なお、ここで説明する動画像符号化装置１の動作とは、多数のフレームからなる動画像における先頭からｔフレーム目のテクスチャ画像および距離画像を符号化する動作である。すなわち、動画像符号化装置１は、上記動画像全体を符号化するために、上記動画像のフレーム数に応じた回数だけ以下に説明する動作を繰り返すことになる。また、以下の動作の説明においては、特に明示していなければ、各データ＃１～＃２８はｔフレーム目のデータであると解釈するものとする。

　最初に、画像符号化部１１および距離画像分割処理部２２が、それぞれ、テクスチャ画像＃１および距離画像＃２を動画像符号化装置１の外部から受信する（ステップＳ１）。前述したように、外部から受信されるテクスチャ画像＃１および距離画像＃２のペアは、例えば図３のテクスチャ画像と図４の距離画像とを対比するとわかるように、画像の内容に互いに相関がある。

　次に、画像符号化部１１は、Ｈ．２６４／ＭＰＥＧ－４　ＡＶＣ規格に規定されているＡＶＣ符号化方式によりテクスチャ画像＃１の符号化を行い、得られたテクスチャ画像の符号化データ＃１１をパッケージング部２８と画像復号部１２とに出力する（ステップＳ２）。なお、ステップＳ２において、テクスチャ画像＃１がＢピクチャまたはＰピクチャである場合、画像符号化部１１は、テクスチャ画像＃１と予測画像との予測残差を符号化し、符号化済みの予測残差を符号化データ＃１１として出力する。

　そして、画像復号部１２は、符号化データ＃１１からテクスチャ画像＃１’を復号して画像分割処理部２１に出力する（ステップＳ３）。ここで、復号するテクスチャ画像＃１’は、画像符号化部１１が符号化するテクスチャ画像＃１と完全に同一ではない。これは、画像符号化部１１は符号化処理中にＤＣＴ変換処理および量子化処理を施すが、ＤＣＴ変換により得られたＤＣＴ係数を量子化する際に量子化誤差が生じるためである。

　ところで、画像復号部１２がテクスチャ画像を復号するタイミングは、テクスチャ画像＃１がＢピクチャであるか否かによって異なっているが、このことについて具体的に説明する。

　すなわち、画像復号部１２は、テクスチャ画像＃１がＩピクチャである場合には、インター予測（画面間予測）を行わずにテクスチャ画像＃１’を復号する。

　また、テクスチャ画像＃１がＰピクチャである場合には、画像復号部１２は、符号化データ＃１１から予測残差を復号する。そして、画像復号部１２は、ｔフレーム目以前の１または複数のフレームの符号化データ＃１１を参照ピクチャとして生成した予測画像に予測残差を加算することによりテクスチャ画像＃１’を復号する。

　さらに、テクスチャ画像＃１がＢピクチャである場合には、画像復号部１２は、符号化データ＃１１から予測残差を復号する。そして、画像復号部１２は、ｔフレーム目以前の１または複数のフレームの符号化データ＃１１と、ｔフレーム目以降の１または複数のフレームの符号化データ＃１１と、を参照ピクチャとして生成した予測画像に予測残差を加算することによりテクスチャ画像＃１’を復号する。

　以上の説明からわかるように、ｔフレーム目のテクスチャ画像＃１がＩピクチャまたはＰピクチャである場合には、画像復号部１２がｔフレーム目のテクスチャ画像＃１’を復号するタイミングはｔフレームの符号化データ＃１１が生成された直後となる。一方、ｔフレーム目のテクスチャ画像＃１がＢピクチャである場合、画像復号部１２がテクスチャ画像＃１’を復号するタイミングは、Ｔ（＞ｔ）フレーム目（参照ピクチャの中で最後方のフレーム）のテクスチャ画像＃１に対する符号化処理が終わった時点以降となる。

　ステップＳ３の処理の後、画像分割処理部２１は、入力されたテクスチャ画像＃１’から、複数のセグメントを規定する（ステップＳ４）。画像分割処理部２１が規定する各セグメントは、類似する色の画素（すなわち、最大画素値と最小画素値との差が所定の閾値以下であるような画素群）で構成される閉領域となる。

　ステップＳ４の処理について具体例を挙げて説明する。図５は、画像分割処理部２１が図３のテクスチャ画像＃１’から規定する各セグメントの分布を示した図である。なお、図５において、同一の模様により描かれている閉領域は１つのセグメントを示している。

　図３のテクスチャ画像＃１において、女の子の頭の分け目の左右の髪は、茶色と薄茶色との２色で描かれている。図５を見るとわかるように、画像分割処理部２１は、茶色と薄茶色とのように類似する色の画素からなる閉領域を１つのセグメントに規定する。

　一方、女の子の顔の肌の部分も、肌色と頬の部分のピンク色との２色で描かれているが、図５を見るとわかるように、画像分割処理部２１は、肌色の領域とピンク色の領域とをそれぞれ別個のセグメントとして規定している。これは、肌色とピンク色とが類似しない色（すなわち、肌色の画素値とピンク色の画素値との差が所定の閾値を上回る）ためである。

　ステップＳ４の処理の後、画像分割処理部２１は、各セグメントの位置情報からなるセグメント情報＃２１を生成し、距離画像分割処理部２２に出力する（ステップＳ５）。セグメントの位置情報としては、例えば、そのセグメントに含まれる全画素の座標値が挙げられる。すなわち、図３のテクスチャ画像＃１’から各セグメントを規定する場合、図６における各閉領域が１つのセグメントとして規定されるが、セグメントの位置情報は、そのセグメントに対応する閉領域を構成する全画素の座標値となる。

　ステップＳ５の処理の後、距離画像分割処理部２２は、入力された距離画像＃２を複数のセグメントに分割する。具体的には、距離画像分割処理部２２は、入力されたセグメント情報＃２１を参照して各セグメントのテクスチャ画像＃１’における位置を特定し、テクスチャ画像＃１’におけるセグメントの分割パターンと同一の分割パターンで、距離画像＃２を複数のセグメントに分割する（以下では、セグメントの個数がＭ個であるものとして説明する）。

　そして、距離画像分割処理部２２は、距離画像＃２の各セグメントについて、該セグメントに含まれる各画素の距離値を距離値セットとして抽出する。さらに、距離画像分割処理部２２は、セグメント情報＃２１に含まれる各セグメントの位置情報に、対応するセグメントから抽出した距離値セットを関連づける。そして、距離画像分割処理部２２は、これにより得られたセグメント情報＃２２を、距離値修正部２３に出力する（ステップＳ６）。

　距離値修正部２３は、距離画像＃２の各セグメントについて、セグメント情報＃２２に含まれる該セグメントの距離値セットから代表値＃２３ａとして最頻値を算出する。そして、距離値修正部２３は、セグメント情報＃２２に含まれるＭ個の距離値セットの各々を、対応するセグメントの代表値＃２３ａに置き換え、セグメント情報＃２３として番号付与部２４に出力する（ステップＳ７）。

　番号付与部２４は、セグメント情報＃２３に含まれているＭ組の位置情報および代表値＃２３ａの各組について、代表値＃２３ａと位置情報に応じたセグメント番号＃２４とを関連づけ、Ｍ組の代表値＃２３ａおよびセグメント番号＃２４を情報源符号化部２５に出力する（ステップＳ８）。具体的には、番号付与部２４は、セグメント情報＃２３に基づいて、１からＭ（Ｍ：セグメントの個数）までの各ｉについて、距離画像またはテクスチャ画像を図７に示すようにラスタスキャン順に走査した場合にｉ番目に画素が走査されるセグメント（以下、「ラスタスキャン順でｉ番目のセグメント」等と略称する）の代表値＃２３ａにセグメント番号「ｉ－１」を関連づける。

　図８を参照して具体例を以下に説明する。

　図８は、図３に示すようなテクスチャ画像とともに動画像符号化装置１に入力される距離画像の各セグメントの位置を模式的に示す図である。なお、図８において、１つの閉領域が１つのセグメントを示している。

　図８の距離画像においては、ラスタスキャン順で先頭に位置するセグメントＲ０にはセグメント番号「０」が割り当てられる。また、ラスタスキャン順で２番目に位置するセグメントＲ１にはセグメント番号「１」が割り当てられる。同様に、ラスタスキャン順で３、４番目に位置するセグメントＲ２、Ｒ３には、それぞれ、セグメント番号「２」「３」が割り当てられる。

　そして、番号付与部２４は、図９に具体例が示されているようなＭ組の代表値＃２３ａおよびセグメント番号＃２４を情報源符号化部２５に出力する。

　ステップＳ８の後、情報源符号化部２５は、入力されたＭ組の代表値＃２３ａおよびセグメント番号＃２４に情報源符号化処理を施し、得られた符号化データ＃２５をパッケージング部２８に出力する（ステップＳ９）。具体的には、情報源符号化部２５は、「０」から「Ｍ－１」までの各ｉについて、セグメント番号「ｉ」の組の代表値＃２３ａを１０進数から８ビットの２進数列に変換する。そして、情報源符号化部２５は、Ｍ個の２進数列を連結した８×Ｍビットの２進数列（情報系列）に情報源符号化処理を施し、得られた符号化データ＃２５（符号系列）をパッケージング部２８に出力する。なお、セグメント番号「ｉ」の組の代表値＃２３ａから変換された８ビットの２進数列は、８×Ｍビットの２進数列のうち、８×ｉ＋１ビット目から８×（ｉ＋１）ビット目までの２進数列を構成するようになっている。

　例えば、情報源符号化部２５に入力されるＭ組の代表値＃２３ａおよびセグメント番号＃２４が図９に示すような値である場合、図１０に示すように、セグメント番号「０」の組の代表値「８３」から変換された８ビットの２進数列「０１０１１００１」は、８×Ｍビットの２進数列の先頭８ビットを構成する。また、セグメント番号「１」の組の代表値「１８２」から変換された８ビットの２進数列「１０１１０１１０」は、８×Ｍビットの２進数列の９ビット目から１６ビット目までの８ビットを構成する。

　また、ステップＳ９において、上記情報源符号化方式として、任意の圧縮符号化方式を採用することができる。例えば、上記情報源符号化方式として、ハフマン符号化や算術符号化等のエントロピー符号化を採用してもよいし、Ｌｅｍｐｅｌ－Ｚｉｖ符号化等のユニバーサル符号化を採用してもよい。

　ステップＳ９の後、パッケージング部２８は、ステップＳ２にて画像符号化部１１が出力した符号化データ＃１１とステップＳ９にて情報源符号化部２５が出力した符号化データ＃２５とを統合し、得られた符号化データ＃２８を、後述する動画像復号装置に伝送する（ステップＳ１０）。

　具体的には、パッケージング部２８は、Ｈ．２６４／ＭＰＥＧ－４　ＡＶＣ規格で規定されているＮＡＬユニットのフォーマットに従って、テクスチャ画像の符号化データ＃１１と距離画像の符号化データ＃２５とを統合する。符号化データ＃１１と符号化データ＃２５との統合は、より具体的には以下のように行われる。

　図１１はＮＡＬユニットの構成を模式的に示した図であるが、図１１に示すように、ＮＡＬユニットは、ＮＡＬヘッダ部とＲＢＳＰ部とＲＢＳＰトレイリングビット部との３つの部分から構成される。

　パッケージング部２８は、主ピクチャの各スライス（主スライス）に対応するＮＡＬユニットのＮＡＬヘッダ部のnal＿unit＿type（ＮＡＬユニットの種類を示す識別子）フィールドに、規定の数値Ｉを格納する。この規定の数値Ｉは、符号化データ＃２８が本実施形態に係る符号化方法（すなわち、距離画像＃２をセグメント毎に一意な距離値（Ｍ個の代表値＃２３ａ）に変換した上で情報源符号化する符号化方法）に従って生成された符号化データであることを示す値である。また、数値Ｉとしては、例えば、Ｈ．２６４／ＭＰＥＧ－４　ＡＶＣ規格で「未定義」または「将来拡張用」と規定されている数値を用いることできる。

　そして、パッケージング部２８は、主スライスに対応するＮＡＬユニットのＲＢＳＰ部に、符号化データ＃１１と符号化データ＃２５とを格納する。さらに、パッケージング部２８は、ＲＢＳＰトレイリングビット部にＲＢＳＰトレイリングビットを格納する。

　パッケージング部２８は、このようにして得られたＮＡＬユニットを符号化データ＃２８として動画像復号装置に伝送する。

　（動画像符号化装置の変形例）
　本発明に係る符号化装置は、以下のように、動画像符号化装置１に代えて動画像符号化装置１’として実現してもよい。図１２は、動画像符号化装置１’の構成を示すブロック図である。図１２に示すように、動画像符号化装置１’は、動画像符号化装置１における距離画像符号化部２０を距離画像符号化部２０’に置き換えた装置である。具体的には、動画像符号化装置１’は、動画像符号化装置１から番号付与部２４を除き、画像分割処理部２１～距離値修正部２３を画像分割処理部２１’～距離値修正部２３’に置き換えた装置である。

　画像分割処理部２１’は、画像分割処理部２１と同じアルゴリズムでテクスチャ画像＃１’から複数のセグメントを規定するが、画像分割処理部２１’は、セグメント情報＃２１に代えて、セグメント識別用画像＃２１’を距離画像分割処理部２２’に出力するように構成されている。

　具体的には、画像分割処理部２１’は、動画像符号化装置１の番号付与部２４と同様、１からＭまでの各ｉについて、テクスチャ画像＃１’においてラスタスキャン順でｉ番目に位置するセグメントにセグメント番号「ｉ―１」を付与し、テクスチャ画像＃１’中の上記ｉ番目に位置するセグメントに含まれる各画素の画素値を「ｉ―１」に置き換える。画像分割処理部２１’は、これにより得られるセグメント識別用画像＃２１’を距離画像分割処理部２２に出力する。

　距離画像分割処理部２２’は、１からＭまでの各ｉについて、セグメント識別用画像＃２１’における画素値「ｉ―１」のセグメントに対応する距離画像＃２中のセグメントから距離値セットを抽出し、セグメント番号「ｉ―１」と距離値セットとを関連づける。そして、距離画像分割処理部２２’は、得られたＭ組のセグメント番号および距離値セットを含むセグメント情報＃２２’を距離値修正部２３’に出力する。

　距離値修正部２３’は、距離画像＃２の各セグメントについて、セグメント情報＃２２’に含まれる該セグメントの距離値セットから代表値＃２３ａとして最頻値を算出する。そして、距離値修正部２３’は、セグメント情報＃２２’に含まれるＭ個の距離値セットの各々を、対応するセグメントの代表値＃２３ａに置き換え、セグメント情報＃２３’として情報源符号化部２５に出力する。すなわち、距離値修正部２３’は、図９に具体例が表されているようなセグメント情報＃２３’を情報源符号化部２５に出力することになる。

　（セグメントについての補足事項）
　前述したセグメントについての補足事項を、図１３を参照しながら説明する。図１３（ａ）～図１３（ｃ）は、テクスチャ画像中に含まれる縦３ドット横４ドットの１２個の画素を示している。また、図１３（ａ）～（ｃ）において画素「Ａ」の色と画素「Ｂ」の色とは同一色または類似する色であるものとする。また、その他の１０個の画素の色は、画素「Ａ」の色および画素「Ｂ」の色のいずれとも全く異なっているものとする。

　前述したように各セグメントは、同一または類似する色の他のいずれかの画素と隣接する画素からなる閉領域となっている。ここで、「画素と画素とが隣接する」とは、厳密には、２つの画素の座標間のマンハッタン距離が「１」であることと同義であり、２つの画素が隣接しないとは、２つの画素の座標間のマンハッタン距離が「２以上」であることと同義である。

　すなわち、図１３（ａ）および図１３（ｂ）のように、画素「Ａ」と画素「Ｂ」とは縦方向および横方向のいずれかで接している場合、画素「Ａ」と画素「Ｂ」とは隣接している。一方、画素「Ａ」と画素「Ｂ」とが縦方向および横方向のいずれにおいても接していない場合、画素「Ａ」と画素「Ｂ」とは隣接していないものとして扱う。すなわち、例えば、図１３（ｃ）のように画素「Ａ」および画素「Ｂ」が、それぞれ、互いの画素の左下および右上に位置する場合には、画素「Ａ」および画素「Ｂ」は隣接しないことになる。

　（付記事項１）
　上記実施形態では、画像分割処理部２１は、入力されたテクスチャ画像＃１’から、各セグメントが最大画素値と最小画素値との差が所定の閾値以下であるような画素群から構成される複数のセグメントを規定するものとしたが、セグメントの規定の仕方はこの構成に限られない。すなわち、画像分割処理部２１は、入力されたテクスチャ画像＃１’から、各セグメントについて、該セグメントに含まれる画素群の画素値から算出される平均値と該セグメントに隣接するセグメントに含まれる画素群の画素値から算出される平均値との差が所定の閾値以上であるような複数のセグメントを規定すればよい。

　上記平均値の差が所定の閾値以上であるような複数のセグメントを規定する具体的なアルゴリズムについて図１８および図１９を参照しながら以下に説明する。

　図１８は、上記アルゴリズムに基づいて動画像符号化装置１が複数のセグメントを規定する動作を示すフローチャート図である。また、図１９は、図１８のフローチャートにおけるセグメント結合処理のサブルーチンを示すフローチャート図である。

　画像分割処理部２１は、次の（付記事項２）に示すような平滑化処理が施されたテクスチャ画像に対し、図中の初期化ステップで、テクスチャ画像中に含まれる全ての画素の各々について、独立した１つのセグメント（暫定セグメント）を規定し、各暫定セグメントにおける全画素値の平均値（平均色）として、対応する画素の画素値そのものを設定する（ステップＳ４１）。

　次に、セグメント結合処理ステップ（ステップＳ４２）に進み、色が似ている暫定セグメント同士を結合させる。このセグメント結合処理について以下に図１９を参照しながら詳細に説明するが、この結合処理を、結合が行われなくなるまで繰り返し続ける。

　画像分割処理部２１は、全ての暫定セグメントについて、以下の処理（ステップＳ５１～Ｓ５５）を行う。

　まず、画像分割処理部２１は、注目する暫定セグメントの高さと幅とが、いずれも閾値以下であるかどうかを判定する（ステップＳ５１）。もしいずれも閾値以下であると判定された場合（Ｓ５１においてＹＥＳ）、ステップＳ５２の処理に進む。一方、いずれかが閾値より大きいと判定された場合（Ｓ５１においてＮＯ）、次に注目すべき暫定セグメントについてステップＳ５１の処理を行う。なお、次に注目すべき暫定セグメントは、例えば、ラスタスキャン順で注目している暫定セグメントの次に位置する暫定セグメントにすればよい。

　画像分割処理部２１は、注目している暫定セグメントに隣接する暫定セグメントのうち、注目している暫定セグメントにおける平均色と最も近い平均色の暫定セグメントを選択する（ステップＳ５２）。色の近さを判断する指標としては、例えば、画素値のＲＧＢの３つの値を３次元ベクトルと見做したときの、ベクトル同士のユークリッド距離を用いることができる。各セグメントの画素値としては、各セグメントに含まれる全画素値の平均値を用いる。

　ステップＳ５２の処理の後、画像分割処理部２１は、注目している暫定セグメントと、最も色が近いと判断された暫定セグメントと、の近さが、ある閾値以下であるか否かを判定する（ステップＳ５３）。閾値より大きいと判定された場合（ステップＳ５３においてＮＯ）、次に注目すべき暫定セグメントについてステップＳ５１の処理を行う。一方、閾値以下であると判定された場合（ステップＳ５３においてＹＥＳ）、ステップＳ５４の処理に進む。

　ステップＳ５３の処理の後、画像分割処理部２１は、２つの暫定セグメント（注目している暫定セグメントと最も色が近いと判断された暫定セグメント）を結合することにより、１つの暫定セグメントに変換する（ステップＳ５４）。このステップＳ５４の処理のより暫定セグメントの数が１減ることになる。

　ステップＳ５４の処理の後、変換後の対象セグメントに含まれる全画素の画素値の平均値を計算する（ステップＳ５５）。まだステップＳ５１～Ｓ５５までの処理を行っていないセグメントがある場合には、次に注目すべき暫定セグメントについてステップＳ５１の処理を行う。

　ステップＳ５１～Ｓ５５の処理を全暫定セグメントについて完了した後、ステップＳ４３の処理に進む。

　画像分割処理部２１は、ステップＳ４２の処理を行う前の暫定セグメントの数とステップＳ４２の処理を行った後の暫定セグメントの数とを比較する（ステップＳ４３）。

　暫定セグメントの数が減少した場合（ステップＳ４３においてＹＥＳ）には、ステップＳ４２の処理に戻る。一方、暫定セグメントの数が変わらない場合（ステップＳ４３においてＮＯ）、画像分割処理部２１は、現状の各暫定セグメントを１つのセグメントとして規定する。

　以上のようなアルゴリズムによって、例えば、入力されたテクスチャ画像が１０２４×７６８ドットの画像である場合、数千個程度のセグメントに分割することができる。

　なお、前述したように、セグメントは、距離画像を分割するために用いられる。したがって、セグメントのサイズが大きくなり過ぎると、１つのセグメントの中にさまざまな距離値が含まれてしまい、代表値との誤差が大きい画素が生じてしまい、その結果、距離画像の符号化精度が低下する。したがって、本発明ではステップＳ５１の処理は必須ではないがステップＳ５１のようにセグメントの大きさを制限することにより、セグメントのサイズが大きくなり過ぎることを防ぐことが望ましい。

　上記実施形態では、画像分割処理部２１は、入力されたテクスチャ画像＃１’から、各セグメントが最大画素値と最小画素値との差が所定の閾値以下であるような画素群から構成される複数のセグメントを規定するものとしたが、各セグメントに含まれる画素の数に上限を設けてもよい。また、画素数の上限とともに、または、画素数の上限に代えて、セグメントの幅または高さに上限を設けてもよい。

　上限を設けた場合、画像分割処理部２１により規定されるセグメントの数は、上限を設けない場合に比べて多くなる。すなわち、セグメントの数が多くなる分、セグメントの大きさは相対的に小さくなる。したがって、上限を設けることにより、動画像復号装置２では、元の距離画像＃２をより忠実に再現した距離画像を復号することができる。

　（付記事項２）
　画像分割処理部２１は、入力されたテクスチャ画像＃１’に平滑化処理を施してもよい。例えば、画像分割処理部２１は、非特許文献“C.Lawrence Zinick, Sing Bing Kang, Mattew Uyttendaele, Simon Winder and Richard Szeliski, “High-quality video view interpolation using a layered representation,” ACM Trans. on Graphics, 23(3), 600-608, (2004)”に記載されているように、エッジ情報が失われない程度にテクスチャ画像＃１’に繰り返し平滑化処理を施してもよい。

　そして、画像分割処理部２１は、平滑化処理後のテクスチャ画像を、各セグメントが最大画素値と最小画素値との差が所定の閾値以下であるような画素群から構成される複数のセグメントに分割してもよい。

　上述の平滑化処理を施さない場合、テクスチャ画像＃１’にノイズが多く含まれていると、セグメントのサイズが小さくなってしまうが、平滑化処理を施すことにより、セグメントのサイズが小さくなってしまうことを抑制することができる。すなわち、平滑化処理を行うことにより、符号化データ＃２５の符号量を、平滑化処理を施さない場合に比べて削減することができる。

　また、画像分割処理部２１は、画像復号部１２と距離画像分割処理部２２との間に配置するのではなく、画像分割処理部２１を、画像符号化部１１の前段に配置してもよい。すなわち、画像分割処理部２１は、入力されたテクスチャ画像＃１をそのまま後段の画像符号化部１１に出力するとともに、テクスチャ画像＃１を各セグメントが最大画素値と最小画素値との差が所定の閾値以下であるような画素群から構成される複数のセグメントに分割し、セグメント情報＃２１を後段の距離画像分割処理部２２に出力してもよい。

　（付記事項３）
　上記実施形態では、情報源符号化部２５が、８×Ｍビットの２進数列に情報源符号化処理を施すものとした。ただし、本発明において、情報源符号化部２５による情報源符号化処理は必須ではない。すなわち、動画像符号化装置１は、Ｍ組の代表値＃２３ａおよびセグメント番号＃２４をそのまま距離画像＃２の符号化データとして動画像復号装置に伝送するようにしてもよい。あるいは、動画像符号化装置１は、Ｍ組の代表値＃２３ａおよびセグメント番号＃２４から生成される前述した８ｘＭビットの２進数列を距離画像＃２の符号化データとして動画像復号装置に伝送するようにしてもよい。

　また、上記実施形態では、情報源符号化部２５が、１０進数のＭ個の代表値＃２３ａを８×Ｍビットの２進数列に変換したが、本発明はこれに限定されない。すなわち、情報源符号化部２５は、各代表値＃２３ａを１シンボルとする長さＭのシンボル列（情報系列）を生成し、長さＭのシンボル列に情報源符号化処理を施すようにしてもよい。

　（付記事項４）
　上記実施形態では、動画像符号化装置１は、Ｈ．２６４／ＭＰＥＧ－４　ＡＶＣ規格に規定されているＡＶＣ符号化を用いてテクスチャ画像＃１を符号化するものとしたが、本発明はこれに限定されない。すなわち、動画像符号化装置１の画像符号化部１１は、ＭＰＥＧ―２やＭＰＥＧ－４他の他の符号化方式を用いてテクスチャ画像＃１を符号化してもよいし、Ｈ．２６５／ＨＶＣ規格として策定されている符号化方式を用いてテクスチャ画像＃１を符号化してもよい。

　（動画像符号化装置１の利点）
　以上のように、動画像符号化装置１では、画像分割処理部２１が、テクスチャ画像＃２の全領域を分割した複数のセグメントであって、各領域に含まれる画素群の最大画素値と最小画素値との差が所定の閾値以下となるような複数のセグメントを規定する。また、距離画像分割処理部２２が、画像分割処理部２１が規定した複数のセグメントの分割パターンと同一の分割パターンで、距離画像＃２の全領域を分割した複数のセグメントを規定する。さらに、距離画像分割処理部２２が規定した各セグメントについて、距離値修正部２３が、セグメントに含まれる各画素の距離値から代表値＃２３ａを算出する。

　距離画像符号化部２０は、距離値修正部２３により算出された複数個の代表値＃２３ａを含む符号化データ＃２５を生成する。

　動画像符号化装置１は、上記の構成によって、動画像復号装置に伝送する距離画像＃２の符号化データ＃２５として、たかだかセグメントの個数分の代表値＃２３ａを伝送することになる。

　一方、ＡＶＣ符号化を用いて距離画像を符号化した場合、距離画像の符号化データの符号量は符号化データ＃２５の符号量より明らかに大きくなる。

　例えば、距離画像分割処理部２１が、前述した特許文献に記載されている方法により複数のセグメントを規定すると、各セグメントに含まれる画素の数は１００から１６００程度になる。一方、ＡＶＣ符号化を用いて距離画像を符号化すると、ブロック（４ｘ４＝１６画素）ごとにＤＣＴ変換および量子化処理を行うことになる。また、ＡＶＣ符号化では、ブロックに含まれる全画素の画素値を符号化するので、ＡＶＣ符号化を用いた場合における距離画像の１ブロックあたりの符号量も、本実施形態の符号化方式を用いた場合における距離画像の１セグメントあたりの符号量よりも大きくなる。

　したがって、動画像符号化装置１は、距離画像＃２をＡＶＣ符号化して動画像復号装置に伝送する従来の動画像符号化装置に比べて、距離画像＃２の符号化データの符号量を削減することができるという効果を奏する。

　（動画像復号装置２）
　次に、本発明の一実施形態に係る動画像復号装置について、図１４および図１５に基づいて以下に説明する。本実施形態に係る動画像復号装置は、復号すべき動画像を構成する各フレームについて、前述した動画像符号化装置１より伝送された符号化データ＃２８からテクスチャ画像＃１’および距離画像＃２’を復号する動画像復号装置である。

　最初に本実施形態に係る動画像復号装置の構成について図１４を参照しながら説明する。図１４は、動画像復号装置の要部構成を示すブロック図である。

　図１４に示すように、動画像復号装置２は、画像復号部１２、画像分割処理部２１’、アンパッケージング部３１、情報源復号部３２、および距離値付与部３３を備えている。

　アンパッケージング部３１は、符号化データ＃２８から、テクスチャ画像＃１の符号化データ＃１１と距離画像＃２の符号化データ＃２５とを抽出する。

　画像復号部１２は、符号化データ＃１１からテクスチャ画像＃１’を復号する。画像復号部１２は、動画像符号化装置１が備える画像復号部１２と同一である。すなわち、画像復号部１２は、動画像符号化装置１から動画像復号装置２への符号化データ＃２８の伝送中に符号化データ＃２８中にノイズが混入しない限り、動画像符号化装置１の画像復号部１２が復号したテクスチャ画像と同一内容のテクスチャ画像＃１’を復号するようになっている。

　画像分割処理部２１’は、動画像符号化装置１の画像分割処理部２１（または、動画像符号化装置１’の画像分割処理部２１’）と同じアルゴリズムにより、テクスチャ画像＃１’の全体領域を複数のセグメント（領域）に分割する。そして、画像分割処理部２１’は、１からＭ（Ｍ：セグメントの個数）までの各ｉについて、テクスチャ画像＃１’中のラスタスキャン順でｉ番目に位置するセグメントに含まれる各画素の画素値を「ｉ―１」に置き換えることにより、セグメント識別用画像＃２１‘を生成する。

　情報源復号部３２は、情報源符号化された距離画像の符号化データ＃２５からＭ組の代表値＃２３ａおよびセグメント番号＃２４を復号する。

　距離値付与部３３は、入力されるＭ組の代表値＃２３ａおよびセグメント番号＃２４に基づいて、１からＭ（Ｍ：セグメントの個数）までの各ｉについて、セグメント識別用画像＃２１中の画素値「ｉ－１」の全画素の画素値を、セグメント番号「ｉ―１」の組の代表値＃２３ａに変換することにより、距離画像＃２’を復号する。

　（動画像復号装置２の動作）
　次に、動画像復号装置２の動作について、図１５を参照しながら以下に説明する。図１５は、動画像復号装置２の動作を示すフローチャートである。ここで説明する動画像復号装置２の動作とは、多数のフレームからなる３次元動画像における先頭からｔフレーム目のテクスチャ画像および距離画像を復号する動作である。すなわち、動画像復号装置２は、上記動画像全体を復号するために、上記動画像のフレーム数に応じた回数だけ以下に説明する動作を繰り返すことになる。また、以下の説明においては、特に断りがない限り、各データ＃１～＃２８はｔフレーム目のデータであると解釈するものとする。

　最初に、アンパッケージング部３１は、動画像符号化装置１より受信した符号化データ＃２８から、テクスチャ画像の符号化データ＃１１および距離画像の符号化データ＃２５を抽出する。そして、アンパッケージング部３１は、符号化データ＃１１を画像復号部１２に出力し、符号化データ＃２５を情報源復号部３２に出力する（ステップＳ２１）。

　画像復号部１２は、入力された符号化データ＃１１からテクスチャ画像＃１’を復号し、画像分割処理部２１’と動画像復号装置２の外部の立体映像表示装置（図示せず）とに出力する（ステップＳ２２）。

　画像分割処理部２１’は、動画像符号化装置１の画像分割処理部２１と同じアルゴリズムで複数のセグメントを規定する。そして、画像分割処理部２１’は、１からＭ（Ｍ：セグメントの個数）までの各ｉについて、テクスチャ画像＃１’中のラスタスキャン順でｉ番目に位置するセグメントに含まれる各画素の画素値を「ｉ―１」に置き換えることにより、セグメント識別用画像＃２１’を生成する。画像分割処理部２１’は、セグメント識別用画像＃２１’を距離値付与部３３に出力する（ステップＳ２３）。

　一方、情報源復号部３２は、情報源符号化された距離画像の符号化データ＃２５から、前述した８×Ｍビットの２進数列を復号する。さらに、情報源復号部３２は、「０」から「Ｍ－１」までの各ｉについて、８×Ｍビットの２進数列から８×ｉ＋１ビット目から８×（ｉ＋１）ビット目までの８ビットの２進数列を抽出し、２進数列を１０進数に変換した代表値＃２３ａとセグメント番号「ｉ」とを復号する。そして、情報源復号部３２は、得られたＭ組の代表値＃２３ａおよびセグメント番号＃２４を距離値付与部３３に出力する（ステップＳ２４）。

　距離値付与部３３は、入力されるＭ組の代表値＃２３ａおよびセグメント番号＃２４に基づいて、１からＭ（Ｍ：セグメントの個数）までの各ｉについて、セグメント識別用画像＃２１中の画素値「ｉ－１」の全画素の画素値を、セグメント番号「ｉ―１」の組の代表値＃２３ａに変換することにより、距離画像＃２’を復号する。そして、距離値付与部３３は、距離画像＃２’を前述した立体映像表示装置に出力する（ステップＳ２５）。

　以上、動画像復号装置２の動作について説明したが、ステップＳ２５にて距離値付与部３３が復号する距離画像＃２’は、一般的に、動画像符号化装置１に入力される距離画像２に近似する距離画像になる。

　これは、前述したように、テクスチャ画像＃１と距離画像＃２との相関から、「各セグメントが類似する色の画素群で構成されるような複数のセグメントにテクスチャ画像＃１’を分割すると、距離画像＃２中の単一のセグメントに含まれる全部または略全ての画素が同一の距離値を持つ傾向がある」と言えるからである。すなわち、距離画像＃２’は、距離画像＃２中のセグメントに含まれる極一部の距離値を該セグメントにおける代表値に変更することにより得られる画像と同一であるので、距離画像＃２’と距離画像＃２とは近似すると言える。

　（動画像復号装置２の利点）
　以上のように、動画像復号装置２は、画像分割処理部２１’が、テクスチャ画像＃１’の全領域を分割した複数のセグメントを規定する。具体的には、画像分割処理部２１’は、各セグメントが類似する色からなる画素群により構成される複数のセグメントを規定する。

　また、情報源復号部３２が、符号化データ＃２５を読み出す。符号化データ＃２５は、復号すべき距離画像＃２’を構成する複数のセグメントの各々について該セグメントにおける代表値＃２３ａをたかだか１つ距離値として含んでいるデータである。なお、復号すべき距離画像＃２’を構成する上記複数のセグメントの分割パターンは、画像分割処理部２１’が規定した複数のセグメントの分割パターンと同一である。

　そして、距離値付与部３３は、復号すべき距離画像＃２’を構成する複数のセグメントの各々について、該セグメントにおける全画素の画素値を、情報源復号部３２が読み出した符号化データ＃２５に含まれている該セグメントにおける代表値＃２３ａに設定する。距離値付与部３３は、このようにして距離画像＃２’を復号する。

　動画像復号装置２が符号化データ＃２５から復号する距離画像＃２’は、前述したように、動画像符号化装置１が符号化する距離画像＃２と類似しているので、動画像復号装置２は適切な距離画像を復号することができる。

　以上に加えて、動画像復号装置２が復号する距離画像＃２’にさらなる利点があることを以下に示す。

　すなわち、被写体および背景が描画されているテクスチャ画像＃１’と距離画像＃２とから３次元画像を生成すると、生成される３次元画像における被写体の輪郭は、距離画像＃２中の被写体と背景との境界の形状に応じたものとなる。

　一般に、テクスチャ画像＃１’と距離画像＃２とは、被写体と背景との境界の位置が一致するものの、被写体と背景との境界の位置が一致しないこともある。この場合、カメラ撮影により生成されたテクスチャ画像＃１と測距装置により生成された距離画像＃２とでは、テクスチャ画像のほうが、被写体と背景とのエッジ部分の形状をより忠実に再現する。

　動画像復号装置２が復号する距離画像＃２’において被写体と背景との境界の位置は、テクスチャ画像＃１における被写体と背景との境界の位置と一致することが多い。これは、一般に、テクスチャ画像＃１において被写体の色と背景の色とは大きく異なるため、テクスチャ画像＃１において被写体と背景との境界がセグメントの境界になるためである。

　したがって、本実施形態に係る動画像復号装置２が出力したテクスチャ画像＃１’および距離画像＃２’から立体映像表示装置で再現される３次元画像は、テクスチャ画像＃１’および距離画像＃２から再現される３次元画像に略忠実であるばかりか、場合によっては実物の被写体をより忠実に再現した３次元画像となる。

　（付記事項５）
　上記実施形態では、動画像符号化装置１が符号化データ＃２５を動画像復号装置２に伝送するものとしたが、動画像符号化装置１は、動画像復号装置２に、以下のようにして符号化データ＃２５を供給するようにしてもよい。

　すなわち、動画像符号化装置１および動画像復号装置２に光ディスクドライブ等、着脱可能な記録媒体にアクセス可能なアクセス手段を設け、記録媒体を介して動画像符号化装置１から動画像復号装置２に符号化データ＃２５を供給するようにしてもよい。換言すると、本発明の符号化装置はデータを伝送する手段を必ずしも備えていなくともよく、本発明の復号装置は、データを受信する受信手段を必ずしも備えていなくともよい。

　＜実施形態２＞
　次に、本発明の別の一実施形態に動画像符号化装置および動画像復号装置について、図１６および図１７を参照しながら以下に説明する。最初に、本実施形態に係る動画像符号化装置について説明する。

　本実施形態に係る動画像符号化装置は、テクスチャ画像の符号化にＨ．２６４／ＡＶＣにおけるＭＶＣ規格として採用されているＭＶＣ符号化を用いる一方、距離画像の符号化には本発明に特有の符号化技術を用いている動画像符号化装置である。本実施形態に係る動画像符号化装置は、１フレームあたりテクスチャ画像および距離画像を複数組（Ｎ組）符号化する点において動画像符号化装置１と異なっている。ここで、Ｎ組のテクスチャ画像および距離画像は、被写体を取り囲むようにＮ箇所に設置されたカメラおよび測距装置によって同時に取り込まれた被写体の画像である。すなわち、Ｎ組のテクスチャ画像および距離画像は、３次元形状の自由視点画像を生成するための画像である。また、各組のテクスチャ画像および距離画像（すなわち、各視点のテクスチャ画像および距離画像）には、当該組のテクスチャ画像および距離画像の実データとともに、カメラの位置や方向のほか、焦点距離情報などのカメラパラメータがメタデータとして含まれている。

　以下、本実施形態の動画像符号化装置の構成について図１６を参照して説明する。

　（動画像符号化装置）
　図１６は、本実施形態の動画像符号化装置の要部構成を示すブロック図である。図１６に示すように、動画像符号化装置１Ａは、画像符号化部１１Ａ、画像復号部１２Ａ、距離画像符号化部２０Ａ、およびパッケージング部２８’を備えている。また、距離画像符号化部２０Ａは、画像分割処理部２１、距離画像分割処理部２２Ａ、距離値修正部２３Ａ、番号付与部２４Ａ、および情報源符号化部２５’を備えている。

　画像符号化部１１Ａは、Ｈ．２６４／ＡＶＣにおけるＭＶＣ規格に規定されているＭＶＣ符号化（多視点映像符号化）によりＮ個のビューコンポーネント（すなわち、テクスチャ画像＃１－１～＃１－Ｎ）を符号化し、各ビューコンポーネントの符号化データ＃１１－１～＃１１－Ｎを生成する。また、画像符号化部１１Ａは、符号化データ＃１１－１～＃１１－Ｎを、ＮＡＬヘッダ拡張によるパラメータであるビューＩＤ「１」～「Ｎ」とともに、画像復号部１２およびパッケージング部２８’に出力する。

　画像復号部１２Ａは、上記ＭＶＣ規格に規定されている復号方式により、テクスチャ画像＃１の符号化データ＃１１－１～＃１１－Ｎからテクスチャ画像＃１’－１～＃１’－Ｎを復号する。

　距離画像分割処理部２２Ａは、距離画像＃２―ｊおよびセグメント情報＃２１―ｊが入力されると、テクスチャ画像＃１’―ｊ中の各セグメントについて、距離画像＃２―ｊ中の対応するセグメント（領域）に含まれる各画素の距離値からなる距離値セットを抽出する。そして、距離画像分割処理部２２Ａは、セグメント情報＃２１―ｊから、各セグメントについて距離値セットと位置情報とが関連づけられたセグメント情報＃２２―ｊを生成する。

　さらに、距離画像分割処理部２２Ａは、距離画像＃２―ｊのビューＩＤ「ｊ」を生成し、ビューＩＤ「ｊ」とセグメント情報＃２２―ｊとを関連づけたセグメント情報＃２２Ａ－ｊを生成する。

　距離値修正部２３Ａは、距離画像＃２―ｊの各セグメントについて、セグメント情報＃２２Ａ－ｊに含まれる該セグメントの距離値セットから代表値＃２３ａとして最頻値を算出する。そして、距離値修正部２３は、セグメント情報＃２２Ａ－ｊに含まれる各セグメントの距離値セットを、対応するセグメントの代表値＃２３ａに置き換え、セグメント情報＃２３Ａ－ｊとして番号付与部２４Ａに出力する。

　番号付与部２４Ａは、セグメント情報＃２３Ａ－ｊが入力されると、セグメント情報＃２３Ａ－ｊに含まれているＭ_j組の位置情報および代表値＃２３ａの各組について、代表値＃２３ａと位置情報に応じたセグメント番号＃２４とを関連づける。そして、番号付与部２４Ａは、Ｍ_j組のセグメント番号＃２４および代表値＃２３ａと、セグメント情報＃２３Ａ－ｊに含まれているビューＩＤ「ｊ」とが関連づけられたデータを情報源符号化部２５’に出力する。

　情報源符号化部２５’は、距離画像＃２－jに関するＭ_j組の代表値＃２３ａおよびセグメント番号＃２４、並びに、ビューＩＤ「ｊ」が入力されると、情報源符号化部２５と同様の方法により、８×Ｍ_jビットの２進数列を生成する。そして、情報源符号化部２５’は、８×Ｍ_jビットの２進数列に情報源符号化処理を施すことにより距離画像＃２－ｊの符号化データを生成する。情報源符号化部２５’は、このようにして得られた１からＮまでの各ｊに関する距離画像＃２－ｊの符号化データをＶＣＬ・ＮＡＬユニットとして、ビューＩＤ「ｊ」を非ＶＣＬ・ＮＡＬユニットとして含む符号化データ＃２５’をパッケージング部２８’に伝送する。

　パッケージング部２８’は、テクスチャ画像＃１－１～＃１－Ｎの符号化データ＃１１－１～＃１１－Ｎと、符号化データ＃２５’とを統合することにより、符号化データ＃２８’を生成する。そして、パッケージング部２８’は、符号化データ＃２８’を動画像復号装置に伝送する。

　なお、画像分割処理部２１は、実施形態１の動画像符号化装置１の画像分割処理部２１と同一であるので、説明を省略する。

　（動画像復号装置）
　次に、本実施形態の動画像復号装置の構成について図１７を参照して説明する。

　図１７は、本実施形態の動画像復号装置の要部構成を示すブロック図である。図１７に示すように、動画像復号装置２Ａは、画像復号部１２Ａ、画像分割処理部２１’、アンパッケージング部３１’、情報源復号部３２’、および距離値付与部３３’を備えている。

　なお、動画像復号装置２Ａと動画像復号装置２との違いは、画像復号部、アンパッケージング部および情報源復号部のみであるので、画像復号部１２Ａ、アンパッケージング部３１’および情報源復号部３２’についてのみ説明し、その他の各部の説明は省略することにする。

　画像復号部１２Ａは、ＭＶＣ規格に規定されている復号方式により、テクスチャ画像＃１の符号化データ＃１１－１～＃１１－Ｎからテクスチャ画像＃１’－１～＃１’－Ｎを復号する。

　アンパッケージング部３１’は、符号化データ＃２８’を受信すると、符号化データ＃１１－１～＃１１－Ｎと、符号化データ＃２５’と、を符号化データ＃２８’からそれぞれ抽出する。

　情報源復号部３２’は、符号化データ＃２５’を情報源復号することにより、１からＮまでの各ｊについて情報源復号部３２と同様の処理を行う。すなわち、情報源復号部３２’は、８×Ｍ_jビットの２進数列を復号する。そして、情報源復号部３２’は、復号した８×Ｍ_jビットの２進数列を８ビットのＭ_j個の２進数列に分割し、８ビットの各２進数列からＭ_j組の距離値＃２３ａおよびセグメント番号＃２４を復号する。

　距離値付与部３３’は、距離画像＃２’－１～＃２’－Ｎを復号する。具体的には、距離値付与部３３’は、距離画像＃２’－ｊを以下のようにして復号する。

　すなわち、距離値付与部３３’は、情報源復号部３２’から入力されるＭ_j組の代表値＃２３ａおよびセグメント番号＃２４、並びに、ビューＩＤ「ｊ」が入力されると、１からＭ_jまでの各ｉについて、ビューＩＤ「ｊ」により区別されるセグメント識別用画像＃２１―ｊ中の画素値「ｉ－１」の全画素の画素値を、セグメント番号「ｉ―１」の組の代表値＃２３ａに変換することにより、距離画像＃２’―ｊを復号する。

　そして、距離値付与部３３は、距離画像＃２’－１～＃２’－Ｎを前述した立体映像表示装置に出力する。

　（付記事項６）
　上記実施形態では、動画像符号化装置１Ａおよび動画像復号装置２Ａは、被写体を取り囲むようにＮ箇所に設置されたカメラおよび測距装置によって同時に取り込まれた被写体のＮ組のテクスチャ画像および距離画像に対して、符号化処理および復号処理を行った。

　動画像符号化装置１Ａおよび動画像復号装置２Ａは、言うまでも無く、以下のようにして生成されたＮ組のテクスチャ画像および距離画像に対して、符号化処理および復号処理を行うことができる。

　すなわち、動画像符号化装置１Ａおよび動画像復号装置２Ａは、各組のカメラおよび測距装置が互いに相異なる方向を向くように１箇所に設置されたＮ組のカメラおよび測距装置によって生成されたＮ組のテクスチャ画像および距離画像に対しても、符号化処理および復号処理を行うことができる。つまり、動画像符号化装置１Ａおよび動画像復号装置２Ａは、３次元形状の全方位画像やパノラマ画像等を生成するためのＮ組のテクスチャ画像および距離画像（すなわち、各方位のテクスチャ画像および距離画像）に対しても、符号化処理および復号処理を行うことができる。

　この場合、各組のテクスチャ画像および距離画像には、当該組のテクスチャ画像および距離画像の実データとともに、どの方向に向いている組のカメラおよび測距装置によって生成された画像であるかを示すカメラパラメータがメタデータとして含まれることになる。

　（付記事項７）
　実施形態２において、動画像符号化装置１Ａの画像符号化部１１Ａは、Ｈ．２６４／ＡＶＣにおけるＭＶＣ規格に規定されているＭＶＣ符号化を用いてテクスチャ画像＃１－１～＃１－Ｎを符号化するものとしたが、本発明はこれに限定されない。

　すなわち、動画像符号化装置１Ａの画像符号化部１１Ａは、ＶＳＰ（View Synthesis Prediction）符号化方式や、ＭＶＤ符号化方式、ＬＶＤ(Layered Video Depth)符号化方式といった他の符号化方式を用いてテクスチャ画像＃１－１～＃１－Ｎを符号化してもよい。この場合、画像符号化部１１Ａが採用する符号化方式に対応する復号方式によりテクスチャ画像＃１’－１～＃１’－Ｎを復号するように、動画像復号装置２Ａの画像復号部１２Ａを構成すればよい。

　（付記事項８）
　動画像符号化装置１Ａの情報源符号化部２５’は、以下のように、距離画像＃２－１～＃２－ｎの符号化データを、Ｎ×（Ｑ＋ｑ）ビットの２進数列に情報源符号化処理を施することにより生成してもよい。また、動画像復号装置２Ａの情報源復号部３２’は、以下のように、Ｎ×（Ｑ＋ｑ）ビットの２進数列を復号することにより、距離画像＃２’－１～＃２’－ｎを復号してもよい。この場合における、情報源符号化処理および情報源復号処理について以下に具体的に説明する。

　〔情報源符号化処理の変形例〕
　情報源符号化部２５’は、「０」から「Ｍ_j－１」までの各ｉについて、セグメント番号「ｉ」の組の代表値＃２３ａを１０進数から９ビットの２進数列に変換し、Ｍ_j個の９ビットの２進数列を生成する。ここで、代表値＃２３ａの最大値が「２５５」であることから９ビットの各２進数列の先頭ビットは必ず「０」となる。また、セグメント番号「ｉ」の組の代表値＃２３ａから変換された９ビットの２進数列は、９×Ｍ_jビットの２進数列のうち、９×ｉ＋１ビット目から９×（ｉ＋１）ビット目までの２進数列を構成するようになっている。

　そして、情報源符号化部２５’は、生成した９×Ｍ_jビットの２進数列の直後にＬ－９ｘＭ_jビットの「１」を連結することにより、Ｑビットの２進数列を生成する。

　情報源符号化部２５’は、さらに、カメラパラメータｊの値と１対１に対応するようなｑビットの２進数列を生成し、Ｑビットの２進数列の直後に連結する。

　そして、情報源符号化部２５’は、Ｎ個の距離画像のうち距離画像＃２－j以外のｋ個の距離画像についてＱ＋ｑビットの２進数列を生成済みの場合には、ｋ×（Ｑ＋ｑ）ビットの２進数列の直後に、距離画像＃２－jについて生成したＱ＋ｑビットの２進数列を連結する。

　情報源符号化部２５’は、以上のようにして生成したＮ×（Ｑ＋ｑ）ビットの２進数列に情報源符号化処理を施し、符号化データ＃２５’を生成する。

　〔情報復号処理の変形例〕
　情報源復号部３２’は、符号化データ＃２５’を情報源復号することにより、Ｎ×（Ｑ＋ｑ）ビットの２進数列を復号する。そして、情報源復号部３２’は、復号したＮ×（Ｑ＋ｑ）ビットの２進数列をＱ＋ｑビットのＮ個の２進数列に分割し、各Ｎ個の２進数列について、末尾ｑビットの２進数列からカメラパラメータｊを特定し、先頭Ｑビットの２進数列からＭ_j組の距離値＃２３ａおよびセグメント番号＃２４を復号する。

　具体的には、情報源復号部３２’は、０からＭ_j－１までの各ｉについて、Ｑビットの２進数列のうち先頭から９×ｉ＋１ビット目からの９ビットの２進列から変換された１０進数の距離値＃２３ａとセグメント番号「ｉ」とを関連づける。なお、Ｑビットの２進数列のうち先頭から９×Ｍ_j＋１ビット目以降のビットが全て「１」になることから、情報源復号部３２’は、Ｑビットの２進数列を先頭から順に９ビットずつ読み出すことにより、Ｑビットの２進数列から復号される距離値＃２３ａの数がたかだかＭ_j個であることを認識できるようになっている。

　（プログラム等）
　最後に、画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａに含まれている各ブロックは、ハードウェアロジックによって構成すればよい。また、画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａの各制御は、次のように、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）を用いてソフトウェアによって実現してもよい。

　すなわち、画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａの各制御を実現する制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録していればよい。画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａ（またはＣＰＵやＭＰＵ）が、供給された記録媒体に記録されているプログラムコードを読み出し、実行すればよい。

　プログラムコードを画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａに供給する記録媒体は、たとえば、磁気テープやカセットテープ等のテープ系、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやＣＤ－ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ／ＣＤ－Ｒ等の光ディスクを含むディスク系、ＩＣカード（メモリカードを含む）／光カード等のカード系、あるいはマスクＲＯＭ／ＥＰＲＯＭ／ＥＥＰＲＯＭ／フラッシュＲＯＭ等の半導体メモリ系などとすることができる。

　また、画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａは、通信ネットワークと接続可能に構成しても、本発明の目的を達成できる。この場合、上記のプログラムコードを、通信ネットワークを介して画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａに供給する。この通信ネットワークは、画像符号化装置１、１’、１Ａおよび画像復号装置２、２Ａにプログラムコードを供給できるものであればよく、特定の種類または形態に限定されない。たとえば、インターネット、イントラネット、エキストラネット、ＬＡＮ、ＩＳＤＮ、ＶＡＮ、ＣＡＴＶ通信網、移動体通信網、衛星通信網等であればよい。

　この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な任意の媒体であればよく、特定の構成または種類のものに限定されない。たとえば、ＩＥＥＥ１３９４、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）、電力線搬送、ケーブルＴＶ回線、電話線、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）回線などの有線でも、ＩｒＤＡやリモコンのような赤外線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、８０２．１１無線、ＨＤＲ、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

　本発明に係る符号化装置は、上記テクスチャ画像の符号化データを生成する第２符号化手段と、上記第２符号化手段により生成された上記テクスチャ画像の上記符号化データと、上記符号化手段により生成された上記距離画像の上記符号化データと、を関連づけて外部に伝送する伝送手段と、をさらに備えていることが望ましい。

　上記の構成によれば、本発明に係る符号化装置は、距離画像だけでなくテクスチャ画像を符号化するので、テクスチャ画像のデータ量と距離画像のデータ量とを合計した全体のデータ量をより削減することができるというさらなる効果を奏する。

　なお、本発明に係る符号化装置は、例えば、上記第２符号化手段により生成された上記符号化データからテクスチャ画像を復号する復号手段をさらに備え、上記第１領域規定手段は、上記復号手段により復号されたテクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する、ことができる。

　本発明に係る符号化装置は、上記符号化手段が、上記代表値算出手段により算出されたＭ（Ｍ：第２領域規定手段が規定した領域の個数）個の代表値に応じた情報系列を生成し、該情報系列に情報源符号化処理を施すことにより、上記距離画像の符号化データを生成する、ことが望ましい。

　上記の構成によれば、本発明に係る符号化装置は、Ｍ個の代表値をそのまま距離画像の符号化データとするのではなく、Ｍ個の代表値から生成された情報系列に情報源符号化処理を施すことにより距離画像の符号化データを生成するので、距離画像の符号化データの符号量をより大きく削減することができるというさらなる効果を奏する。

　また、本発明に係る符号化装置は、全方位立体画像または自由視点立体画像の表示のために生成されたＮ枚の距離画像であって各方位または各視点の立体画像を表示するために各距離画像が対を成すテクスチャ画像とともに処理されるＮ枚の距離画像の各々について当該距離画像を符号化するように、上記の各手段を動作させることが望ましい。

　本発明に係る復号装置は、上記距離画像の符号化データと、上記テクスチャ画像の符号化データと、が関連づけられた統合データから、上記テクスチャ画像の符号化データと、上記距離画像の符号化データと、を個別に抽出する抽出手段をさらに備えていることが望ましい。

　上記の構成によれば、本発明に係る復号装置は、上記距離画像の符号化データと、上記テクスチャ画像の符号化データと、が関連づけられた統合データが本発明に係る符号化装置から供給された場合であっても、上記距離画像の符号化データから距離画像を復号することができるというさらなる効果を奏する。

　本発明に係る復号装置は、上記読出手段により読み出される上記符号化データがＭ（Ｍ：領域規定手段が規定した領域の個数）個の距離値に応じた情報系列に情報源符号化処理を施すことにより得られる符号系列である場合に、上記復号手段は、上記符号系列に情報源復号処理を施すことにより上記情報系列を復号するとともに、上記情報系列から、上記距離画像を構成するＭ個の領域の画素値として設定すべき上記Ｍ個の距離値を復号する、ことが望ましい。

　上記の構成によれば、本発明に係る符号化装置から供給される符号化データがＭ（Ｍ：領域規定手段が規定した領域の個数）個の距離値に応じた情報系列に情報源符号化処理を施すことにより得られる符号系列である場合であっても、距離画像を復号することができるというさらなる効果を奏する。

　また、本発明に係る復号装置は、全方位立体画像または自由視点立体画像の表示のために生成されたＮ枚の距離画像であって各方位または各視点の立体画像を表示するために各距離画像が対を成すテクスチャ画像とともに処理されるＮ枚の距離画像の各々について当該距離画像の符号化データから当該距離画像を復号するように、上記の各手段を動作させることが望ましい。

　また、本発明に係る符号化装置の各手段としてコンピュータを機能させる符号化プログラム、本発明に係る復号装置の各手段としてコンピュータを機能させる復号プログラム、並びに、符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、および、復号プログラムを記録したコンピュータ読み取り可能な記録媒体も本発明の範疇に含まれる。

　なお、非特許文献１の内容は、参照により本明細書に組み込まれるものとする。

　本発明は、３Ｄ対応のコンテンツを生成するコンテンツ生成装置や３Ｄ対応のコンテンツを再生するコンテンツ再生装置等に好適に適用することができる。

　　１、１’、１Ａ　　　動画像符号化装置
　　２、２Ａ　　　　　　動画像復号装置
　　１１、１１Ａ　　　　　画像符号化部
　　１２、１２Ａ　　　　　画像復号部
　　２０、２０’、２０Ａ　距離画像符号化部
　　２１、２１’　　　　　　画像分割処理部（第１領域規定手段、領域規定手段）
　　２２、２２’、２２Ａ　　距離画像分割処理部（第２領域規定手段）
　　２３、２３’、２３Ａ　　距離値修正部（代表値算出手段）
　　２４、２４Ａ　　　　　　番号付与部
　　２５、２５’　　　　　　情報源符号化部（符号化手段）
　　２８、２８’　　　　　パッケージング部（伝送手段）
　　３０　　　　　　　　　距離画像復号部
　　３１、３１’　　　　　アンパッケージング部（抽出手段）
　　３２　　　　　　　　　情報源復号部（読出手段）
　　３３　　　　　　　　　距離値付与部（復号手段）

Claims

　テクスチャ画像とで対を成す距離画像を符号化する符号化装置において、
　上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する第１領域規定手段と、
　上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域を規定する第２領域規定手段と、
　上記第２領域規定手段により規定された上記複数の領域の各々について、該領域に含まれる各画素の距離値から代表値を算出する代表値算出手段と、
　上記距離値に関するデータを含む、上記距離画像の符号化データを生成する符号化手段と、を備え、
　上記距離値に関するデータは、上記代表値算出手段により算出された各領域の代表値からなるデータであることを特徴とする符号化装置。
　請求項１に記載の符号化装置であって、
　上記テクスチャ画像の符号化データを生成する第２符号化手段と、
　上記第２符号化手段により生成された上記テクスチャ画像の上記符号化データと、上記符号化手段により生成された上記距離画像の上記符号化データと、を関連づけて外部に伝送する伝送手段と、をさらに備えていることを特徴とする符号化装置。
　請求項２に記載の符号化装置であって、
　上記第２符号化手段により生成された上記符号化データからテクスチャ画像を復号する復号手段をさらに備え、
　上記第１領域規定手段は、上記復号手段により復号されたテクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する、ことを特徴とする符号化装置。
　請求項１から３のいずれか１項に記載の符号化装置であって、
　上記符号化手段は、上記代表値算出手段により算出されたＭ（Ｍ：第２領域規定手段が規定した領域の個数）個の代表値に応じた情報系列を生成し、該情報系列に情報源符号化処理を施すことにより、上記距離画像の符号化データを生成する、ことを特徴とする符号化装置。
　全方位立体画像または自由視点立体画像の表示のために生成されたＮ枚の距離画像であって各方位または各視点の立体画像を表示するために各距離画像が対を成すテクスチャ画像とともに処理されるＮ枚の距離画像の各々について当該距離画像を符号化するように、上記の各手段を動作させることを特徴とする請求項１から４のいずれか１項に記載の符号化装置。
　テクスチャ画像とで対を成す距離画像を符号化する符号化方法において、
　上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する第１領域規定工程と、
　上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域を規定する第２領域規定工程と、
　上記第２領域規定工程にて規定された上記複数の領域の各々について、該領域に含まれる各画素の距離値から代表値を算出する代表値算出工程と、
　上記距離値に関するデータを含む、上記距離画像の符号化データを生成する符号化工程と、を含み、
　上記距離値に関するデータは、上記代表値算出工程にて算出された各領域の代表値からなるデータであることを特徴とする符号化方法。
　テクスチャ画像とで対を成す距離画像を距離画像の符号化データから復号する復号装置において、
　上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する領域規定手段と、
　上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域の各々について該領域における距離値に関するデータとして該領域における各画素の距離値の代表値のみを含んでいる、上記符号化データを読み出す読出手段と、
　復号すべき上記距離画像を構成する上記複数の領域の各々について、該領域に含まれる画素の画素値を上記符号化データに含まれている該領域における代表値に設定することにより、上記距離画像を復号する復号手段と、を備えていることを特徴とする復号装置。
　請求項７に記載の復号装置であって、
　上記距離画像の符号化データと、上記テクスチャ画像の符号化データと、が関連づけられた統合データから、上記テクスチャ画像の符号化データと、上記距離画像の符号化データと、を個別に抽出する抽出手段をさらに備えていることを特徴とする復号装置。
　請求項７または８に記載の復号装置であって、
　上記読出手段により読み出される上記符号化データがＭ（Ｍ：領域規定手段が規定した領域の個数）個の距離値に応じた情報系列に情報源符号化処理を施すことにより得られる符号系列である場合に、上記復号手段は、上記符号系列に情報源復号処理を施すことにより上記情報系列を復号するとともに、上記情報系列から、上記距離画像を構成するＭ個の領域の画素値として設定すべき上記Ｍ個の距離値を復号する、ことを特徴とする復号装置。
　全方位立体画像または自由視点立体画像の表示のために生成されたＮ枚の距離画像であって各方位または各視点の立体画像を表示するために各距離画像が対を成すテクスチャ画像とともに処理されるＮ枚の距離画像の各々について当該距離画像の符号化データから当該距離画像を復号するように、上記の各手段を動作させることを特徴とする請求項７から９のいずれか１項に記載の復号装置。
　テクスチャ画像とで対を成す距離画像を距離画像の符号化データから復号する復号方法において、
　上記テクスチャ画像の全領域を分割した複数の領域であって、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域を規定する領域規定工程と、
　上記距離画像の全領域を上記テクスチャ画像の分割パターンと同一の分割パターンで分割した複数の領域の各々について該領域における距離値に関するデータとして該領域における各画素の距離値の代表値のみを含んでいる、上記符号化データを読み出す読出工程と、
　復号すべき上記距離画像を構成する上記複数の領域の各々について、該領域に含まれる画素の画素値を上記符号化データに含まれている該領域における代表値に設定することにより、上記距離画像を復号する復号工程と、を含んでいることを特徴とする復号方法。
　コンピュータを請求項１から５のいずれか１項に記載の符号化装置として動作させるプログラムであって、上記コンピュータを上記の各手段として機能させるためのプログラム。
　コンピュータを請求項７から１０のいずれか１項に記載の復号装置として動作させるプログラムであって、上記コンピュータを上記の各手段として機能させるためのプログラム。
　請求項１２に記載のプログラムおよび請求項１３に記載のプログラムのうち、少なくともいずれかのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
　テクスチャ画像とで対を成す距離画像の符号化データであって、
　上記距離画像の全領域を所定の分割パターンで分割した複数の領域の各々について、該領域における距離値に関するデータとして該領域に含まれる各画素の距離値の代表値のみを含んでおり、
　上記所定の分割パターンは、上記テクスチャ画像の全領域を、各領域について該領域に含まれる画素群の画素値から算出される平均値と該領域に隣接する領域に含まれる画素群の画素値から算出される平均値との差が所定の閾値以上となるような複数の領域に分割する分割パターンである、ことを特徴とする符号化データ。