JP7127539B2

JP7127539B2 - 画像処理装置および画像処理方法

Info

Publication number: JP7127539B2
Application number: JP2018531834A
Authority: JP
Inventors: 徹也福安; 権大古川
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2016-08-05
Filing date: 2017-07-21
Publication date: 2022-08-30
Anticipated expiration: 2037-07-21
Also published as: WO2018025660A1; JPWO2018025660A1; US11006135B2; US20190268612A1

Description

本開示は、画像処理装置および画像処理方法に関し、特に、視聴者の視野範囲の画像の画質の低下を抑制できるようにした画像処理装置および画像処理方法に関する。

マルチカメラにより撮影された全方向の撮影画像から、水平方向の周囲３６０度および垂直方向の周囲１８０度の画像を２Ｄ画像（平面画像）にマッピングした全天球画像を生成し、符号化して記録する記録装置がある（例えば、特許文献１参照）。

このような記録装置では、全天球画像の生成方法として、正距円筒図法やキューブマッピングなどの３Ｄ画像から２Ｄ画像にマッピングを行う方法が用いられる。全天球画像の生成方法として正距円筒図法が用いられる場合、全天球画像は、撮影画像を球の面にマッピングしたときの球の正距円筒図法による画像である。また、全天球画像の生成方法としてキューブマッピングが用いられる場合、全天球画像は、撮影画像を立方体（キューブ）の面にマッピングしたときの立方体の展開図の画像である。

一方、記録装置により記録された全天球画像の符号化ストリームを復号し、その結果得られる全天球画像を用いて視聴者の視野範囲の画像を表示させる再生装置がある。このような再生装置は、全天球画像を球や立方体などの３Ｄモデルの表面上にテクスチャとして貼り付け、その３Ｄモデルの内部の１点から、視聴者の視線ベクトルの方向の３Ｄモデルの表面のテクスチャを見たときの視聴者の視野範囲の画像を表示させる。これにより、視聴者の視野範囲の撮影画像を再現する。

この再現方法は、ＣＧ（Computer Graphics）の分野では、環境光モデルと呼ばれる。また、正距円筒図法で生成された画像を球の表面に貼る環境光モデルは、Sphere Modelと呼ばれ、キューブマッピングで生成された画像を立方体の表面に貼る環境光モデルは、Cube Modelと呼ばれる。

視聴者の視野範囲の撮影画像は、全天球画像のうちの、視聴者の視線ベクトルに対応する領域のみを用いて再現することができる。例えば、水平方向の視野角が９０度である場合、水平方向については、水平方向の周囲３６０度の全方向の画像がマッピングされている全天球画像のうちの４分の１しか、視聴者の視野範囲の撮影画像の再現に用いられない。垂直方向についても同様である。

従って、全天球画像全体の符号化ストリームを復号することは無駄が多い。しかしながら、視線ベクトルは視聴者によって決められるため、記録装置は、全天球画像のうちの視線ベクトルに対応する領域のみを符号化することはできない。

また、全天球画像が、MPEG2（Moving Picture Experts Group phase 2）やAVC（Advanced Video Coding）/H.264などの一般的な符号化方式で符号化される場合、画面全体の情報を用いて符号化が行われる。従って、全天球画像が１枚の画像として符号化された符号化ストリームから、視聴者の視線ベクトルに対応する領域の符号化ストリームのみを復号することは難しい。

そこで、記録装置が、全天球画像を分割して符号化し、再生装置が、視聴者の視線ベクトルに対応する分割領域の符号化ストリームのみを復号することにより、復号処理の負荷を軽減することが考えられている（例えば、特許文献２および特許文献３）。

特開２００６－１４１７４号公報特開２００１－２９８６５２号公報特開２００２－３１２７７８号公報

しかしながら、特許文献２および特許文献３の技術では、例えば、視聴者の視線ベクトルが急激に変化した場合、変化後の視線ベクトルに対応する分割領域の復号処理が間に合わず、視聴者の視野範囲の画像の全部または一部の非表示、フリーズ、または更新の遅延が発生し、画質が低下するおそれがある。

これを防ぐために、復号する分割領域の数を増やすと、結局復号処理の負荷が増大する。その結果、例えば、再生装置の処理能力等の要因により、復号処理が遅延し、視聴者の視野範囲の画像の全部または一部の非表示、フリーズ、または更新の遅延が発生し、画質が低下するおそれがある。

本開示は、このような状況に鑑みてなされたものであり、視聴者の視野範囲の画像の画質の低下を抑制できるようにするものである。

本開示の第１の側面の画像処理装置は、全天球画像を複数の面に投影することにより得られる複数の投影画像を符号化した複数の符号化ストリーム間の優先度に基づいて、復号するピクチャを間引く量またはレンダリングするピクチャを間引く量を前記優先度が低い前記符号化ストリームほど大きくするようにして、前記符号化ストリームの復号およびレンダリングを行い、表示画像の生成に用いる画像である生成画像を生成する画像処理部と、前記生成画像に基づいて、前記表示画像を生成する描画部とを備える画像処理装置である。

本開示の第１の側面の画像処理方法は、本開示の第１の側面の画像処理装置に対応する。

本開示の第２の側面の画像処理装置は、全天球画像を複数の面に投影することにより得られる複数の投影画像の符号化を行い、複数の符号化ストリームを生成する符号化部と、複数の前記投影画像間の優先度に基づいて、複数の前記投影画像を符号化して生成された前記符号化ストリームの一部を伝送する伝送部とを備える画像処理装置である。前記符号化部は、前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、符号化する前記投影画像を選択し、前記伝送部は、さらに、前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、伝送する前記符号化ストリームを選択する。

本開示の第２の側面の画像処理方法は、本開示の第２の側面の画像処理装置に対応する。

本開示の第１の側面においては、全天球画像を複数の面に投影することにより得られる複数の投影画像を符号化した複数の符号化ストリーム間の優先度に基づいて、復号するピクチャを間引く量またはレンダリングするピクチャを間引く量を前記優先度が低い前記符号化ストリームほど大きくするようにして、前記符号化ストリームの復号およびレンダリングが行われ、表示画像の生成に用いる画像である生成画像が生成され、前記生成画像に基づいて、前記表示画像が生成される。

本開示の第２の側面においては、符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、符号化する投影画像が選択され、全天球画像を複数の面に投影することにより得られる複数の前記投影画像の符号化を行うことによって複数の前記符号化ストリームが生成される。また、複数の前記投影画像間の優先度に基づいて、複数の前記投影画像を符号化して生成された前記符号化ストリームの一部が伝送される。前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、伝送する前記符号化ストリームが選択される。

なお、本開示の第１の側面または第２の側面の画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。

また、本開示の第１の側面または第２の側面の画像処理装置を実現するために、コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

本開示の第１の側面によれば、画像を生成することができる。また、本開示の第１の側面によれば、視聴者の視野範囲の画像の画質の低下を抑制することができる。

本開示の第２の側面によれば、画像を伝送することができる。また、本開示の第２の側面によれば、視聴者の視野範囲の画像の画質の低下を抑制することができる。

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

画像表示システムの第１実施の形態の構成例を示すブロック図である。コンテンツサーバの構成例を示すブロック図である。高解像度画像処理部の構成例を示すブロック図である。距離ｚと距離ｒを説明する図である。３Ｄモデル座標系のＸ軸の変化を示す図である。３Ｄモデル座標系のＸ軸の変化に伴う最小値z_minと最小値r_minの変化を説明する図である。第１レイヤの６つの面のデプス画像を球にマッピングした際の各画素の球上の位置の例を示す図である。第１レイヤの面の例を示す図である。第１レイヤの視点位置情報および面情報のテーブルの構成例を示す図である。第１レイヤの所定の面に対応する被写体の奥行き方向の位置を示す図である。第１レイヤおよび第２レイヤのテクスチャ画像の構成例を示す図である。第１レイヤと第２レイヤのテクスチャ画像の例を説明する図である。第１レイヤと第２レイヤのテクスチャ画像の他の例を説明する図である。第２レイヤの視点の第１の例を示す図である。第２レイヤの視点位置情報および面情報のテーブルの第１の構成例を示す図である。第２レイヤの視点の第２の例を示す図である。第２レイヤの視点位置情報および面情報のテーブルの第２の構成例を示す図である。ストリーム生成処理を説明するフローチャートである。ホームサーバの第１実施の形態の構成例を示すブロック図である。ＭＬ３Ｄモデル生成部の第１実施の形態の構成例を示すブロック図である。低解像度３Ｄモデル生成部の第１実施の形態の構成例を示すブロック図である。接続情報の例を説明する図である。接続情報の他の例を説明する図である。サンプリング点の例を説明する図である。サンプリング点の他の例を説明する図である。オクルージョン処理を説明する図である。再生処理の第１実施の形態を説明するフローチャートである。３次元データ生成処理の詳細を説明するフローチャートである。三角形パッチ有効無効情報を説明する図である。ホームサーバの第２実施の形態の構成例を示すブロック図である。ＭＬ３Ｄモデル生成部の第２実施の形態の構成例を示すブロック図である。低解像度３Ｄモデル生成部の第２実施の形態の構成例を示すブロック図である。再生処理の第２実施の形態を説明するフローチャートである。表示画像生成処理の詳細を説明するフローチャートである。優先度とピクチャの間引き方法の例を示す図である。優先度設定処理の詳細を説明するフローチャートである。スコア算出テーブルの例を示す図である。ホームサーバの第３実施の形態の構成例を示すブロック図である。画像表示システムの第２実施の形態の構成例を示すブロック図である。画像表示システムの第３実施の形態の構成例を示すブロック図である。撮影視点メタデータのデータ構成の例を示す図である。変換部の構成例を示すブロック図である。再構成部の構成例を示すブロック図である。ストリーム生成処理を説明するフローチャートである。再生処理を説明するフローチャートである。画像の選択方法を説明する図である。伝送視点と仮想視点の関係を示す図である。低解像度形状データとデプス画像の第１の統合方法を説明する図である。低解像度形状データとデプス画像の第２の統合方法を説明する図である。低解像度ポリゴンメッシュと高解像度ポリゴンメッシュの第１の合成方法を説明する図である。低解像度ポリゴンメッシュと高解像度ポリゴンメッシュの第２の合成方法を説明する図である。再生リソースが大きい場合の高解像度形状データの生成方法の例を説明する図である。再生リソースが小さい場合の高解像度形状データの生成方法の例を説明する図である。第１レイヤのテクスチャ画像の他の例を示す図である。投影面の座標系を説明する図である。 tan軸投影を説明する図である。コンピュータのハードウエアの構成例を示すブロック図である。車両制御システムの概略的な構成の一例を示すブロック図である。車外情報検出部及び撮像部の設置位置の一例を示す説明図である。

以下、本開示を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．第１実施の形態：画像表示システム
２．第２実施の形態：ホームサーバ
３．第３実施の形態：ホームサーバ
４．第４実施の形態：画像表示システム
５．第５実施の形態：画像表示システム
６．変形例
７．応用例

＜第１実施の形態＞
（画像表示システムの第１実施の形態の構成例）
図１は、本開示を適用した画像表示システムの第１実施の形態の構成例を示すブロック図である。

図１の画像表示システム１０は、マルチカメラ１１、コンテンツサーバ１２、ホームサーバ１３、変換装置１４、およびヘッドマウントディスプレイ１５により構成される。画像表示システム１０は、マルチカメラ１１により撮影されたYCbCr画像（YUV画像）である撮影画像から全天球画像を生成し、全天球画像のうちの視聴者の視野範囲の画像を表示する。

具体的には、画像表示システム１０のマルチカメラ１１は、水平方向の周囲360度および垂直方向の周囲180度を撮影範囲として、外向きに配置された複数（図１の例では６個）のカメラにより構成される。各カメラは、撮影を行い、撮影画像をフレーム単位で生成する。マルチカメラ１１は、各カメラの撮影画像をコンテンツサーバ１２に供給する。

コンテンツサーバ１２は、マルチカメラ１１から供給される各カメラの撮影画像から、所定の視点の全天球画像のテクスチャ画像とデプス画像を生成する。第１実施の形態では、デプス画像は、所定の視点から各画素における被写体までの直線の距離ｒを示す8ビットの値としての、距離ｒの逆数1/rを画素値とする画像である。

コンテンツサーバ１２は、全天球画像のテクスチャ画像とデプス画像を低解像度化し、低解像度テクスチャ画像と低解像度デプス画像とを生成する。コンテンツサーバ１２は、低解像度テクスチャ画像と低解像度デプス画像を、AVC(Advanced Video Coding)やHEVC(High Efficiency Video Coding)/H.265等の符号化方式で圧縮符号化する。コンテンツサーバ１２は、その結果得られる低解像度テクスチャ画像の符号化ストリーム（以下、低解像度テクスチャストリームという）と低解像度デプス画像の符号化ストリーム(以下、低解像度デプスストリームという)を記憶する。

なお、以下、低解像度テクスチャストリームおよび低解像度デプスストリームを個々に区別する必要がない場合、低解像度符号化ストリームという。

また、コンテンツサーバ１２は、各カメラの撮影画像を用いて、全天球画像における視点を中心とした立方体を構成する６つの面に対応するテクスチャ画像とデプス画像を階層化して生成する。具体的には、コンテンツサーバ１２は、６つの面の第１レイヤおよび第２レイヤのテクスチャ画像とデプス画像を生成する。なお、全天球画像における視点と立方体の中心は異なっていていてもよい。

コンテンツサーバ１２は、各面の第１レイヤのテクスチャ画像とデプス画像からなる第１レイヤ画像と、各面の第２レイヤのテクスチャ画像とデプス画像からなる第２レイヤ画像を、面、画像の種類、およびレイヤごとに、AVCやHEVC等の符号化方式で圧縮符号化する。コンテンツサーバ１２は、その結果得られる各面の第１レイヤのテクスチャ画像の符号化ストリーム（以下、第１レイヤテクスチャストリームという）、第１レイヤのデプス画像の符号化ストリーム（以下、第１レイヤデプスストリームという）、第２レイヤのテクスチャ画像の符号化ストリーム（以下、第２レイヤテクスチャストリームという）、および第２レイヤのデプス画像の符号化ストリーム(以下、第２レイヤデプスストリームという)を記憶する。なお、第１レイヤ画像と第２レイヤ画像の符号化方式は、MVC（Multiview Video Coding）方式や3D-HEVC方式等であってもよい。

なお、以下、第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを個々に区別する必要がない場合、高解像度符号化ストリームという。

また、コンテンツサーバ１２は、第１レイヤおよび第２レイヤの各面に関する情報等をメタデータとして生成し、記憶する。コンテンツサーバ１２は、記憶している低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを、図示せぬネットワークを介してホームサーバ１３に伝送する。

なお、コンテンツサーバ１２は、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを再構成（詳細は後述する）することもできる。この場合、コンテンツサーバ１２は、再構成後の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームと、それらに対応するメタデータをホームサーバ１３に伝送することもできる。しかしながら、以下では、説明の便宜上、再構成が行われた場合であっても、再構成前の６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームが、コンテンツサーバ１２に伝送されるものとする。

ホームサーバ１３（画像処理装置)は、コンテンツサーバ１２から伝送されてくる、低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを受け取る。

また、ホームサーバ１３は、カメラ１３Ａを内蔵し、視聴者の頭部に装着されるヘッドマウントディスプレイ１５に付されたマーカ１５Ａを撮影する。そして、ホームサーバ１３は、マーカ１５Ａの撮影画像に基づいて視聴位置を検出する。さらに、ホームサーバ１３は、ヘッドマウントディスプレイ１５のジャイロセンサ１５Ｂの検出結果を、ヘッドマウントディスプレイ１５から変換装置１４を介して受け取る。ホームサーバ１３は、ジャイロセンサ１５Ｂの検出結果に基づいて視聴者の視線方向を決定し、視聴位置と視線方向に基づいて視聴者の視野範囲を決定する。

ホームサーバ１３は、第１レイヤの６つの面のうちの、視聴者の視線方向に対応する３つの面を選択する。そして、ホームサーバ１３は、選択された３つの面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを復号する。これにより、ホームサーバ１３は、選択された３つの面に対応する第１レイヤおよび第２レイヤのテクスチャ画像およびデプス画像を生成する。

また、ホームサーバ１３は、低解像度テクスチャストリームと低解像度デプスストリームを復号し、低解像度テクスチャ画像と低解像度デプス画像を生成する。ホームサーバ１３は、選択された３つの面に対応する第１レイヤおよび第２レイヤのテクスチャ画像およびデプス画像、並びに、低解像度テクスチャ画像と低解像度デプス画像を用いて、視聴者の視野範囲の画像を表示画像として生成する。ホームサーバ１３は、図示せぬHDMI（登録商標）（High-Definition Multimedia Interface）ケーブルを介して表示画像を変換装置１４に伝送する。

変換装置１４は、ホームサーバ１３から伝送されてくる表示画像における座標を、ヘッドマウントディスプレイ１５における座標に変換する。変換装置１４は、座標変換後の表示画像をヘッドマウントディスプレイ１５に供給する。

ヘッドマウントディスプレイ１５は、マーカ１５Ａとジャイロセンサ１５Ｂを有し、視聴者の頭部に装着される。ヘッドマウントディスプレイ１５は、変換装置１４から供給される表示画像を表示する。また、ヘッドマウントディスプレイ１５に内蔵されるジャイロセンサ１５Ｂは、ヘッドマウントディスプレイ１５の傾きを検出し、その検出結果を、変換装置１４を介してホームサーバ１３に伝送する。

（コンテンツサーバの構成例）
図２は、図１のコンテンツサーバ１２の構成例を示すブロック図である。

図２のコンテンツサーバ１２は、デプス検出部３１、低解像度画像処理部３３、および高解像度画像処理部３４により構成される。

コンテンツサーバ１２のデプス検出部３１は、図１のマルチカメラ１１から供給される各カメラの撮影画像の画素ごとに、その画素における被写体を含む奥行き方向に垂直なデプス平面とカメラの間の奥行き方向の距離zの逆数1/zを検出する。デプス検出部３１は、その結果得られる各カメラの撮影画像の各画素の逆数1/zを画素値とするｚ画像を低解像度画像処理部３３と高解像度画像処理部３４に供給する。

低解像度画像処理部３３は、マルチカメラ１１の３次元座標系(以下、カメラ座標系という)における所定の３次元位置を視点として、マルチカメラ１１から供給される各カメラの撮影画像を、視点を中心とした正八面体にマッピング(透視投影)することにより、全天球画像のテクスチャ画像を生成する。また、低解像度画像処理部３３は、デプス検出部３１から供給される各カメラのｚ画像を、撮影画像と同様に正八面体にマッピングすることにより、全天球画像のｚ画像を生成する。

低解像度画像処理部３３は、全天球画像のｚ画像の各画素の逆数1/zを逆数1/rに変換する。そして、低解像度画像処理部３３は、以下の式（１）により、逆数1/rに対して8ビット量子化を行う。

なお、Ｉ_d（ｒ）は、距離ｒの逆数1/rの8ビット量子化後の値である。ｒ_max，ｒ_minは、それぞれ、全天球画像における距離ｒの最大値、最小値である。

低解像度画像処理部３３は、全天球画像の各画素の逆数1/rの8ビット量子化後の値を画素値とすることにより、全天球画像のデプス画像を生成する。

低解像度画像処理部３３は、全天球画像のテクスチャ画像とデプス画像を低解像度化し、低解像度テクスチャ画像と低解像度デプス画像を生成する。低解像度画像処理部３３は、低解像度テクスチャ画像と低解像度デプス画像を圧縮符号化し、その結果得られる低解像度テクスチャストリームと低解像度デプスストリームを記憶する。低解像度画像処理部３３は、記憶している低解像度テクスチャストリームと低解像度デプスストリームを、図１のホームサーバ１３に送信する。

高解像度画像処理部３４は、マルチカメラ１１から供給される各カメラの撮影画像を用いて、低解像度画像処理部３３における正八面体と中心が同一である立方体を構成する６つの面に対応する第１レイヤおよび第２レイヤのテクスチャ画像を生成する。高解像度画像処理部３４は、デプス検出部３１から供給される各カメラのｚ画像を用いて、撮影画像と同様に６つの面に対応する第１レイヤおよび第２レイヤのデプス画像を生成する。

高解像度画像処理部３４は、各面の第１レイヤおよび第２レイヤのテクスチャ画像とデプス画像を、面、画像の種類、およびレイヤごとに圧縮符号化する。コンテンツサーバ１２は、その結果得られる第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを記憶する。

また、高解像度画像処理部３４は、メタデータを生成して記憶する。コンテンツサーバ１２は、記憶している６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを、図示せぬネットワークを介してホームサーバ１３に伝送する。

（高解像度画像処理部の構成例）
図３は、図２の高解像度画像処理部３４の構成例を示すブロック図である。

図３の高解像度画像処理部３４は、第１レイヤ生成部５０、量子化部５１、エンコーダ５２、第２レイヤ生成部５３、量子化部５４、エンコーダ５５、設定部５６、メタデータ生成部５７、ストレージ５８、再構成部５９、および伝送部６０により構成される。

第１レイヤ生成部５０には、設定部５６から、カメラ座標系における全天球画像の視点を原点とした３次元座標系（以下、３Ｄモデル座標系という）における、第１レイヤの視点の３次元位置として原点を示す視点位置情報が供給される。また、第１レイヤ生成部５０には、３Ｄモデル座標系における原点を中心とした立方体を構成する６つの面をそれぞれ含む６つの面それぞれの、３Ｄモデル座標系における３次元位置およびサイズを示す面情報が供給される。

第１レイヤ生成部５０は、視点位置情報が示す原点を第１レイヤの視点（第１の視点）に設定する。第１レイヤ生成部５０は、カメラ座標系における全天球画像の視点を原点として、第１レイヤの視点から、図１のマルチカメラ１１から供給される撮影画像を、６つの各面情報が示す３次元位置およびサイズの面のそれぞれにマッピングする。これにより、第１レイヤ生成部５０は、第１レイヤの６つの面のテクスチャ画像を生成する。

また、第１レイヤ生成部５０は、第１レイヤの各面のテクスチャ画像において顔認識処理を行う。そして、第１レイヤ生成部５０は、第１レイヤの各面のテクスチャ画像内の人の顔の有無を示す顔検出情報を生成し、メタデータ生成部５７に供給する。

さらに、第１レイヤ生成部５０は、カメラ座標系における全天球画像の視点を原点として、第１レイヤの視点から、図２のデプス検出部３１から供給されるｚ画像を、６つの各面情報が示す３次元位置およびサイズの面のそれぞれにマッピングする。これにより、第１レイヤ生成部５０は、第１レイヤの６つの面のｚ画像を生成する。

第１レイヤの６つの面に対応する視点は同一であるため、第１レイヤの６つの面のテクスチャ画像は、第１レイヤの視点を中心とした３Ｄモデルにマッピングされた全天球画像を６つの面にマッピングすることにより得られた画像であるといえる。同様に、第１レイヤの６つの面のｚ画像は、第１レイヤの視点を中心とした３Ｄモデルにマッピングされた全天球画像のｚ画像を６つの面にマッピングすることにより得られた画像であるといえる。第１レイヤ生成部５０は、第１レイヤの６つの面のテクスチャ画像をエンコーダ５２に供給し、第１レイヤの６つの面のｚ画像を量子化部５１に供給する。

量子化部５１は、第１レイヤ生成部５０から供給される第１レイヤの６つの各面のｚ画像の各画素の逆数1/zを逆数1/rに変換する。そして、量子化部５１は、上述した式（１）により、逆数1/rに対して8ビット量子化を行う。但し、式（１）におけるｒ_max，ｒ_minは、６つの面全てにおける距離ｒの最大値、最小値である。ｒ_maxおよびｒ_minを６つの面全てにおける距離ｒの最大値および最小値とすることにより、各面の距離ｒの最大値および最小値とする場合に比べて、面ごとに量子化ステップが変化することを防止することができる。量子化部５１は、第１レイヤの６つの面のｚ画像の各画素の逆数1/rの8ビット量子化後の値を画素値とすることにより、第１レイヤの６つの面のデプス画像を生成し、エンコーダ５２に供給する。

エンコーダ５２は、第１レイヤの６つの面のテクスチャ画像とデプス画像を、面ごと、かつ、画像の種類ごとに圧縮符号化し、第１レイヤテクスチャストリームと第１レイヤデプスストリームを生成する。エンコーダ５２は、第１レイヤテクスチャストリームと第１レイヤデプスストリームをストレージ５８に供給する。

第２レイヤ生成部５３には、設定部５６から、第１レイヤの各面に対応する第２レイヤの各面の、第１レイヤの視点とは異なる視点（第２の視点）の視点位置情報と、第１レイヤの各面に対応する第２レイヤの各面の面情報とが供給される。第２レイヤ生成部５３は、第２レイヤの面ごとに、その面に対応する視点位置情報が示す３次元位置を第２レイヤの視点に設定する。

第２レイヤ生成部５３は、第２レイヤの面ごとに、その面に対応する第２レイヤの視点から、マルチカメラ１１から供給される撮影画像のうちの第１レイヤの視点におけるオクルージョン領域を、第２レイヤの面にマッピングする。これにより、第２レイヤ生成部５３は、第２レイヤの６つの面のテクスチャ画像を生成する。

また、第２レイヤ生成部５３は、第２レイヤの各面のテクスチャ画像において顔認識処理を行う。そして、第２レイヤ生成部５３は、第２レイヤの各面のテクスチャ画像内の人の顔の有無を示す顔検出情報を生成し、メタデータ生成部５７に供給する。

さらに、第２レイヤ生成部５３は、第２レイヤの面ごとに、その面に対応する第２レイヤの視点から、デプス検出部３１から供給されるｚ画像のうちの第１レイヤの視点におけるオクルージョン領域を、第２レイヤの面にマッピングする。これにより、第２レイヤ生成部５３は、第２レイヤの６つの面のｚ画像を生成する。

即ち、マルチカメラ１１の各カメラの位置は異なっているため、カメラ座標系における１つの３次元位置を視点としたとき、撮影画像には、その視点におけるオクルージョン領域が含まれている。しかしながら、第１レイヤのテクスチャ画像は、１つの視点の全天球画像をマッピングすることにより生成されるため、第１レイヤのテクスチャ画像には、その視点におけるオクルージョン領域の撮影画像は含まれない。よって、第２レイヤ生成部５３は、そのオクルージョン領域の撮影画像を第２レイヤのテクスチャ画像として含める。ｚ画像についても同様である。第２レイヤ生成部５３は、第２レイヤの６つの面のテクスチャ画像をエンコーダ５５に供給し、第２レイヤの６つの面のｚ画像を量子化部５４に供給する。

量子化部５４は、第２レイヤ生成部５３から供給される第２レイヤの６つの各面のｚ画像の各画素の逆数1/zを逆数1/rに変換する。そして、量子化部５４は、量子化部５１と同様に、上述した式（１）により、逆数1/rに対して8ビット量子化を行う。量子化部５４は、第２レイヤの６つの面のｚ画像の各画素の逆数1/rの8ビット量子化後の値を画素値とすることにより、第２レイヤの６つの面のデプス画像を生成し、エンコーダ５５に供給する。

エンコーダ５５は、第２レイヤの６つの面のテクスチャ画像とデプス画像を、面ごと、かつ、画像の種類ごとに圧縮符号化し、第２レイヤテクスチャストリームと第２レイヤデプスストリームを生成する。エンコーダ５５は、第２レイヤテクスチャストリームと第２レイヤデプスストリームをストレージ５８に供給する。

設定部５６は、３Ｄモデル座標系における原点を第１レイヤの視点として設定する。設定部５６は、第１レイヤの視点を中心とした立方体を構成する６つの矩形の面をそれぞれ含む６つの面を第１レイヤの面として設定する。また、設定部５６は、第１レイヤの面ごとに第２レイヤの視点と矩形の面を設定する。

設定部５６は、第１レイヤの１つの視点位置情報と６つの面情報を第１レイヤ生成部５０とメタデータ生成部５７に供給する。また、設定部５６は、第１レイヤの６つの面に対応する第２レイヤの６つの視点位置情報と６つの面情報を、第２レイヤ生成部５３とメタデータ生成部５７に供給する。

設定部５６は、必要に応じて、視聴者に対して視聴を推奨する方向である推奨視聴方向を設定する。推奨視聴方向は、例えば全天球画像の提供者等により設定され、例えばコンサートの模様を撮影した全天球画像においては、ステージ側の画像の方向が推奨視聴方向に設定される。設定部５６は、推奨視聴方向を示す推奨視聴方向情報をメタデータ生成部５７に供給する。

メタデータ生成部５７は、第１レイヤ生成部５０および第２レイヤ生成部５３から供給される顔検出情報に基づいて、顔メタデータを生成する。顔メタデータは、例えば、各面の第１レイヤテクスチャストリームおよび第２レイヤテクスチャストリームにおいて、人の顔が出現するフレームまたは期間を示す。

メタデータ生成部５７は、設定部５６から供給される第１レイヤの視点位置情報および面情報、第２レイヤの視点位置情報および面情報を含むテーブル、設定部５６から供給される推奨視聴方向情報、並びに、顔メタデータを含むメタデータを生成し、ストレージ５８に供給する。

ストレージ５８は、エンコーダ５２から供給される第１レイヤテクスチャストリームおよび第１レイヤデプスストリーム、並びに、エンコーダ５５から供給される第２レイヤテクスチャストリームおよび第２レイヤデプスストリームを記憶する。また、ストレージ５８は、メタデータ生成部５７から供給されるメタデータを記憶する。

また、ストレージ５８は、再構成部５９から供給される再構成後の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びに、メタデータを記憶する。

再構成部５９は、必要に応じて、ストレージ５８に記憶されている６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを読み出し、再構成する。

具体的には、再構成部５９は、再構成前の第１レイヤテクスチャストリームを用いて第１レイヤテクスチャストリームに対応する面の数や画角を変更し、再構成前の第１レイヤデプスストリームを用いて第１レイヤデプスストリームに対応する面の数や画角を変更する。例えば、再構成部５９は、第１レイヤの面を、立方体を構成する６つの面をそれぞれ含む６つの面から、その６つの面に各面の中心を通る法線が立方体の１２本の各辺の中点と視点を通る線である１２個の面を加えた１８個の面に変更する。

または、再構成部５９は、再構成前の第１レイヤテクスチャストリームを用いて第１レイヤテクスチャストリームに対応する面どうしの間隔（密度）を変更し、再構成前の第１レイヤデプスストリームを用いて第１レイヤデプスストリームに対応する面どうしの間隔を変更する。例えば、再構成部５９は、第１レイヤの面を、中心を通る法線の間隔が９０度である、立方体を構成する６つの面をそれぞれ含む６つの面から、中心を通る法線の間隔が４５度である１８個の面に変更する。

第１レイヤの面どうしの間隔が狭くなると、面数が増加するため、総データ容量は増加するが、ホームサーバ１３において、より視聴者の視野範囲に近い第１レイヤの面に対応するテクスチャ画像およびデプス画像を用いて表示画像を生成することができる。その結果、表示画像内の、第１レイヤまたは第２レイヤのテクスチャ画像およびデプス画像を用いて生成される高解像度領域が増加し、表示画像の画質が向上する。

なお、再構成部５９は、再構成前の第１レイヤテクスチャストリームを用いて第１レイヤテクスチャストリームに対応する面の位置を変更し、再構成前の第１レイヤデプスストリームを用いて第１レイヤデプスストリームに対応する面の位置を変更することにより、再構成を行ってもよい。この場合、再構成部５９は、例えば、主要な被写体が第１レイヤの面の境界に存在するとき、主要な被写体が第１レイヤの面の境界以外の位置（例えば中央）に存在するように、第１レイヤの６つの面に対応する立方体を回転することにより、再構成を行う。

また、再構成部５９は、再構成前の第１レイヤテクスチャストリームを用いて第１レイヤテクスチャストリームに対応する面の傾きを変更し、再構成前の第１レイヤデプスストリームを用いて第１レイヤデプスストリームに対応する面の傾きを変更することにより、再構成を行ってもよい。この場合、再構成部５９は、例えば、第１レイヤのテクスチャ画像内の主要な被写体が傾いているとき、傾きがなくなるように、第１レイヤの６つの面に対応する立方体を回転することにより、再構成を行う。

再構成部５９は、以上のようにして変更された第１レイヤの各面に対して、再構成後の第２レイヤの視点と面を設定する。そして、再構成部５９は、再構成前の第２レイヤテクスチャストリームを用いて、第２レイヤテクスチャストリームに対応する視点および面を、設定された再構成後の第２レイヤの視点および面に変更する。また、再構成部５９は、再構成前の第２レイヤデプスストリームを用いて、第２レイヤデプスストリームに対応する視点および面を、設定された再構成後の第２レイヤの視点および面に変更する。

再構成部５９は、再構成後の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームをストレージ５８に供給する。また、再構成部５９は、再構成後の第１レイヤの視点位置情報および面情報、第２レイヤの視点位置情報および面情報、推奨視聴方向情報、並びに、顔メタデータを含むテーブルをメタデータとして生成し、ストレージ５８に供給する。

伝送部６０は、ストレージ５８から６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを読み出し、図１のホームサーバ１３に送信する。

以上のように、図３の高解像度画像処理部３４は、第１レイヤ画像と第２レイヤ画像を透視投影により生成する。従って、ホームサーバ１３は、第１レイヤ画像と第２レイヤ画像に対して通常の画像用の処理を行うことができる。また、高解像度画像処理部３４は、第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、通常の画像の符号化ストリームの送信方法で送信することができる。

（距離ｚと距離ｒの説明）
図４は、距離ｚと距離ｒを説明する図である。

なお、図４は、第１レイヤに対応する立方体の所定の面を上から見た図である。

距離ｚは、視点から各画素における被写体を含む奥行き方向に垂直なデプス平面までの奥行き方向の距離である。また、第１レイヤの各面の奥行き方向は、第１レイヤの各面に垂直な方向である。従って、第１レイヤの各面とデプス平面は平行になる。よって、第１レイヤの各面における距離ｚが同一であるデプス平面である等距離ｚ面の形状は、第１レイヤの視点Ｏを中心とした立方体状になる。従って、等距離ｚ面を第１レイヤに対応する立方体の所定の面の上から見た形状は、図４のＡの点線で示すように正方形となる。

これに対して、距離ｒは、視点から各画素における被写体までの直線の距離である。また、第１レイヤの各面の視点Ｏから被写体までの直線の方向は、面によらず、視点Ｏを中心とした円の半径方向である。従って、第１レイヤの各面における距離ｒが同一である等距離ｒ面の形状は、第１レイヤの視点Ｏを中心とした球状になる。よって、等距離ｒ面を第１レイヤに対応する立方体の所定の面の上から見た形状は、図４のＢの点線で示すように円状になる。

（デプス画像の効果の説明）

なお、以下では、第１レイヤの視点Ｏと、第１レイヤに対応する立方体８０を構成する６つの面の中心を通る６つの面の法線ベクトルのうちの、互いに直交する３つを、３Ｄモデル座標系のＸ軸、Ｙ軸、Ｚ軸の正方向とし、その３つと逆方向の３つを、３Ｄモデル座標系のＸ軸、Ｙ軸、Ｚ軸の負方向とする。

図５は、３Ｄモデル座標系のＸ軸の変化を示す図であり、図６は、３Ｄモデル座標系のＸ軸の変化に伴う最小値z_minと最小値r_minの変化を示す図である。

なお、図５および図６の例では、第１レイヤの各面の画角が９０度であるものとする。

図５に示すように、第１レイヤに対応する立方体８０がＹ軸を軸としてＸＺ平面上で４５度回転され、第１レイヤの各面の位置が変更される場合、Ｘ軸がＸＺ平面上で４５度回転される。これにより、Ｘ軸の正方向を法線ベクトルとする第１レイヤの面８１の奥行き方向はＸＺ平面上で４５度回転する。

従って、図６に示すように、Ｘ座標が正の値であり、Ｚ座標が０である位置を中心とした球７６が被写体として面８１の画角内に存在するとき、回転前の面８１における最小値z_minは、図６のＡに示すように、視点Ｏと球７６の図６のＡのＸ軸の正方向の距離の最小値である。しかしながら、回転後の面８１における最小値z_minは、図６のＢに示すように、視点Ｏと画角内の球７６（図６のＢ中球７６の上半分）の図６のＢのＸ軸の正方向の距離の最小値である。

また、図６の例の場合、回転前の面８１における最大値z_maxは無限大であるため、回転後の面８１における最大値z_maxも無限大であるが、無限大ではない場合、最小値ｚ_minと同様の理由により、回転の前後で面８１における最大値z_maxは変化する。第１レイヤの他の面についても同様に、最小値z_minと最大値z_maxが変化する。

また、説明は省略するが、第１レイヤの面の画角、数、または間隔が変更される場合も、第１レイヤの全ての面における最小値z_minと最大値z_maxは変化する。

従って、第１レイヤのデプス画像の各画素のy値（輝度値）として、距離ｚの逆数1/zが用いられると、再構成部５９による再構成時に、各面における最小値z_minと最大値z_maxを計算し直し、全ての面における最小値z_minと最大値z_maxを決定し直す必要がある。その結果、デプス画像の8ビット量子化をやり直す必要がある。

これに対して、視点Ｏから被写体までの直線の方向は、第１レイヤの面の位置によらず同一である。従って、図５に示したように立方体８０がＹ軸を軸としてＸＺ平面上で４５度回転される場合であっても、最小値r_minと最大値r_maxは同一である。

即ち、図６のＢに示すように、図６のＡのＸ軸がＸＺ平面上で４５度回転されても、回転前と同様に、視点Ｏから被写体までの直線の方向は、視点Ｏから放射状に延びる方向である。従って、Ｘ軸の回転によらず、第１レイヤの全ての面における最小値r_minは、視点Ｏから球７６までの直線の距離の最小値である。第１レイヤの全ての面における最大値r_maxについても、最小値r_minの場合と同様の理由により、回転前後で変化しない。

また、説明は省略するが、第１レイヤの面の画角、数、または間隔が変更される場合も、視点Ｏから被写体までの直線の方向は変化しないため、最小値r_minと最大値r_maxは変化しない。

従って、第１レイヤのデプス画像の各画素のy値として、逆数1/zではなく、逆数1/rの量子化値が用いられることにより、再構成部５９による再構成時にデプス画像の8ビット量子化をやり直す処理を削減することができる。

なお、上述した説明では、低解像度テクスチャストリームと低解像度デプスストリームは再構成されないようにしたが、再構成されるようにしてもよい。この場合も、低解像度デプス画像の各画素のy値は逆数1/rの量子化値であるので、第１レイヤのデプス画像の再構成時と同様に、再構成時に低解像度デプス画像の8ビット量子化をやり直す処理を削減することができる。

また、低解像度テクスチャストリームと低解像度デプスストリームの再構成は、低解像度テクスチャストリームと低解像度デプスストリームのマッピング方式を変更することにより行われてもよい。この場合も、デプス画像の各画素のy値を逆数1/rの量子化値にすることにより、再構成時に低解像度デプス画像の8ビット量子化をやり直す処理を削減することができる。

（第１レイヤの６つの面のデプス画像の各画素の球上の位置の例）
図７は、第１レイヤの６つの面のデプス画像を球にマッピングした際の各画素の球上の位置の例を示す図である。

なお、図７では、第１レイヤの６つの面のデプス画像を球にマッピングした際の各画素の球上の位置が点で表されている。

第１レイヤの各面のデプス画像の各画素のデプス画像上の位置の間隔は等間隔である。しかしながら、図７に示すように、第１レイヤの６つの面のデプス画像を球にマッピングした際の各画素の球上の位置の間隔は等間隔ではない。即ち、第１レイヤの６つの面のデプス画像を球にマッピングした際の各画素の球上の位置の密度は、一定ではない。

（第１レイヤの面の例）
図８は、第１レイヤの面の例を示す図である。

なお、以下では、視点Ｏと６つの面のそれぞれとの距離をＲとしたときのＸ＝Ｒである面を、適宜、＋Ｘ面ともいい、Ｘ＝－Ｒである面を、適宜、－Ｘ面ともいう。同様に、Ｙ＝Ｒである面、Ｙ＝－ｒである面、Ｚ＝Ｒである面、Ｚ＝－Ｒである面を、適宜、＋Ｙ面、－Ｙ面、＋Ｚ面、－Ｚ面ともいう。

また、図８のＡは、第１レイヤの立方体８０の斜視図であり、図８のＢは、第１レイヤの立方体８０をＹ軸の負方向に見た図である。

図８のＡに示すように、第１レイヤの１つの面９１は、視点Ｏを中心とした立方体８０を構成する６つの面８１乃至８６のうちの＋Ｙ面８３を含む面である。より詳細には、面９１は、＋Ｙ面８３と同一の位置に設定され、横方向と縦方向の画角が、＋Ｙ面８３の画角である９０度より大きく、１８０度より小さい面である。

従って、図８のＢに示すように、面９１のテクスチャ画像は、＋Ｙ面８３にマッピングされたテクスチャ画像だけでなく、＋Ｙ面８３に隣接する＋Ｘ面８１、－Ｘ面８２、＋Ｚ面８５、および－Ｚ面８６にマッピングされるテクスチャ画像の一部を含む。面９１のデプス画像についても、テクスチャ画像と同様である。

図８では、第１レイヤの１つの面９１のみ図示したが、他の５つの面も、面９１と同様に、それぞれ、＋Ｘ面８１、－Ｘ面８２、－Ｙ面８４、＋Ｚ面８５、－Ｚ面８６と同一の位置に設定され、横方向と縦方向の画角が９０度より大きく１８０度より小さい面である。

以上のように、第１レイヤの６つの面のそれぞれは、立方体を構成する６つの面８１乃至８６のそれぞれを含むように構成されるので、第１レイヤの６つの面のいずれかに必ず、全天球画像がマッピングされる。従って、ホームサーバ１３は、第１レイヤの６つの面のうちの多くとも隣接する３つの面を用いれば、視点Ｏを視聴位置とした水平方向の周囲360度および垂直方向の周囲180度の任意の方向の表示画像を生成することができる。

（第１レイヤの視点位置情報および面情報のテーブルの構成例）
図９は、図３のメタデータ生成部５７により生成されるメタデータのうちの、第１レイヤの視点位置情報および面情報のテーブルの構成例を示す図である。

図９の例では、面情報のうちの、面の３Ｄモデル座標系における３次元位置を示す情報が、方位角、仰角、回転角、および視線ベクトルであり、サイズを示す情報が横画角と縦画角である。

方位角は、視点と各面の中心を結ぶ線とＺ軸とのなすＸＺ平面方向の角度であり、仰角は、視点と各面の中心を結ぶ線とＸＺ平面とのなす角度である。ここでは、方位角は、右回りを正方向とし、仰角は、左回りを正方向とする。視点から延びるＺ軸方向の線を方位角だけＸＺ平面上を水平回転した後、仰角だけＹ軸方向に上下回転した線が、面の中心を通る法線である。

回転角は、視点と各面の中心を結ぶ線を軸としたときの各面の回転方向の角度である。ここでは、回転角は右回りが正方向とする。視線ベクトルは、視点を起点として各面の中心へ向かう長さが１であるベクトル、即ち各面の中心を通る法線ベクトルである。横画角は、各面の横方向の２つの端部それぞれと視点とを結んだ線のなす角度であり、縦画角は、各面の縦方向の２つの端部それぞれと視点とを結んだ線のなす角度である。

図９に示すように、第１レイヤの視点位置情報および面情報のテーブルには、図３のストレージ５８において各面の第１レイヤテクスチャストリームおよび第１レイヤデプスストリームが格納されるファイルのファイル名の共通部分が登録される。

具体的には、図９の例では、＋Ｚ面８５、－Ｚ面８６、＋Ｘ面８１、－Ｘ面８２、＋Ｙ面８３、－Ｙ面８４をそれぞれ含む各面の第１レイヤテクスチャストリームのファイル名が、posZ_texture,negZ_texture,posX_texture,negX_texture,posY_texture,negY_textureである。また、＋Ｚ面８５、－Ｚ面８６、＋Ｘ面８１、－Ｘ面８２、＋Ｙ面８３、－Ｙ面８４をそれぞれ含む各面の第１レイヤデプスストリームのファイル名が、それぞれ、posZ_depth,negZ_depth,posX_depth,negX_depth,posY_depth,negY_depthである。従って、図９のテーブルには、第１レイヤの各面のファイル名の共通部分として、posZ,negZ,posX,negX,posY,negYが登録される。

また、第１レイヤの視点位置情報および面情報のテーブルには、ファイル名の共通部分に対応付けて、そのファイル名の共通部分に対応する面の面情報、視点位置情報、テクスチャ画像およびデプス画像の横画素数および縦画素数が登録される。

具体的には、＋Ｚ面８５、－Ｚ面８６、＋Ｘ面８１、－Ｘ面８２、＋Ｙ面８３、－Ｙ面８４をそれぞれ含む第１レイヤの各面の中心と視点Ｏを結ぶ線と、Ｚ軸とのなすＸＺ平面方向の角度は、それぞれ、０度、－１８０度、９０度、－９０度、０度、０度であり、ＸＺ平面とのなす角度は、それぞれ、０度、０度、０度、０度、９０度、－９０度である。従って、ファイル名の共通部分「posZ」,「negZ」,「posX」,「negX」,「posY」,「negY」のそれぞれに対応付けて、方位角「０度」、「－１８０度」、「９０度」、「－９０度」、「０度」、「０度」が登録されるとともに、仰角「０度」、「０度」、「０度」、「０度」、「９０度」、「－９０度」が登録される。

また、図９の例では、第１レイヤの全ての面の回転角は０度である。従って、ファイル名の共通部分「posZ」,「negZ」,「posX」,「negX」,「posY」,「negY」のそれぞれに対応付けて、回転角「０度」が登録される。さらに、ファイル名の共通部分「posZ」,「negZ」,「posX」,「negX」,「posY」,「negY」のそれぞれに対応付けて、視点位置情報として原点の座標(0,0,0)が登録される。

また、視点Ｏから、＋Ｚ面８５、－Ｚ面８６、＋Ｘ面８１、－Ｘ面８２、＋Ｙ面８３、－Ｙ面８４をそれぞれ含む第１レイヤの各面の視線ベクトルは、(0,0,1),(0,0,-1),(1,0,0)(-1,0,0),(0,1,0),(0,-1,0)である。従って、ファイル名の共通部分「posZ」,「negZ」,「posX」,「negX」,「posY」,「negY」のそれぞれに対応付けて、視線ベクトル(0,0,1),(0,0,-1),(1,0,0)(-1,0,0),(0,1,0),(0,-1,0)が登録される。

さらに、図９の例では、第１レイヤの全ての面の横画角および縦画角は９０度より大きい１００度であり、テクスチャ画像およびデプス画像の横方向の画素数である横画素数および縦方向の画素数である縦画素数は１０２４である。従って、ファイル名の共通部分「posZ」,「negZ」,「posX」,「negX」,「posY」,「negY」のそれぞれに対応付けて、横画角「１００度」、縦画角「１００度」、横画素数「１０２４」、および縦画素数「１０２４」が登録される。

（階層化の説明）
図１０は、第１レイヤの所定の面に対応する被写体の奥行き方向の位置を示す図であり、図１１は、第１レイヤおよび第２レイヤの視点が同一である場合の図１０の被写体の第１レイヤおよび第２レイヤのテクスチャ画像の構成例を示す図である。

なお、図１０は、第１レイヤの視点Ｏと被写体を上から見た図であり、図１０の上下方向は、この被写体を画角に含む第１レイヤの所定の面の奥行き方向である。また、図１１において、左右方向および上下方向は、それぞれ、テクスチャ画像の横方向、奥行き方向を表す。図１０および図１１の上方向が手前側、下方向が奥側である。

図１０および図１１の例では、第１レイヤの所定の面の画角内に含まれる被写体が、中央の前景１１１と、前景の奥にある背景１１２である。この場合、図１１に示すように、第１レイヤの所定の面のテクスチャ画像は、前景１１１の撮影画像１２１と、背景１１２のうちの前景１１１によって隠されない領域１１２Ａの撮影画像１２２Ａとにより構成される。

一方、この第１レイヤの所定の面に対応する第２レイヤの面のテクスチャ画像は、図１１に示すように、背景１１２のうちの前景１１１によって遮蔽されたオクルージョン領域１１２Ｂのうちの、マルチカメラ１１により撮影された撮影済みオクルージョン領域１１２Ｃの撮影画像１２２Ｃを有効領域として含む。

第２レイヤの面のテクスチャ画像のうちの有効領域以外の領域には何を配置してもよいが、無効値などの特殊値が配置されると、圧縮符号化により特殊値の値が変化し、ホームサーバ１３において復号による特殊値の復元が困難になる。

従って、第２レイヤの面のテクスチャ画像の有効領域以外の領域は、領域１１２Ａに対応する不要領域（背景領域）と、オクルージョン領域１１２Ｂのうちの撮影済みオクルージョン領域１１２Ｃ以外の領域に対応する想像領域とに分割される。

そして、オクルージョン領域が存在しない領域１１２Ａに対応する不要領域には、第１レイヤと同様に撮影画像１２２Ａが配置されるか、または、エッジ部分が急峻ではない平坦な画像が配置される。不要領域に撮影画像１２２Ａが配置される場合、不要領域における第１レイヤと第２レイヤのテクスチャ画像が同一になるので、第１レイヤのテクスチャ画像を第２レイヤのテクスチャ画像を参照してMVC方式や3D-HEVC方式等で圧縮符号化する場合、圧縮率を向上させることができる。また、不要領域に平坦な画像が配置される場合、エッジ部分が急峻な画像が配置される場合に比べて、第２レイヤ画像の圧縮率を向上させることができる。なお、不要領域の一部に撮影画像１２２Ａが配置され、他部に平坦な画像が配置されるようにしてもよい。

また、想像領域は、オクルージョン領域が存在するが、マルチカメラ１１により撮影されていない、オクルージョン領域１１２Ｂのうちの撮影済みオクルージョン領域１１２Ｃ以外の領域に対応する領域である。従って、想像領域には、撮影済みオクルージョン領域１１２Ｃの撮影画像１２２Ｃを用いて推測（インペインティング）されたインペインティング画像が配置されるか、または、第１レイヤと同様に撮影画像１２１が配置される。

なお、インペインティングには、過去の撮影画像が用いられてもよい。コンテンツサーバ１２がインペインティングを行うことにより、ホームサーバ１３は、想像領域を有効領域と同等に扱うことができる。また、コンテンツサーバ１２がインペインティングを再生前に行うことにより、多くの時間を要する処理負荷の高いインペインティングも行うことができる。

また、想像領域に撮影画像１２１が配置される場合、想像領域が点在したり、インペインティングが困難であったりするときにも、想像領域を容易に生成することが可能である。想像領域の一部にインペインティング画像が配置され、他部に撮影画像１２１が配置されるようにしてもよい。

なお、第１レイヤおよび第２レイヤのデプス画像の構成は、撮影画像がデプス画像に代わる点を除いて、第１レイヤおよび第２レイヤのテクスチャ画像の構成と同様であるので、説明は省略する。また、以下では、第２レイヤの不要領域と想像領域に、第１レイヤと同様の撮影画像またはデプス画像が配置される場合について説明する。

（第１レイヤと第２レイヤの視点の説明）
図１２は、第１レイヤと第２レイヤの視点が同一である場合の第１レイヤの所定の面に対応する第１レイヤと第２レイヤのテクスチャ画像を説明する図である。図１３は、第１レイヤと第２レイヤの視点が異なる場合の第１レイヤの所定の面に対応する第１レイヤと第２レイヤのテクスチャ画像を説明する図である。

図１２のＡと図１３のＡは、第１レイヤの視点Ｏと被写体を上から見た図であり、図１２のＡと図１３のＡの上下方向は、この被写体を画角に含む第１レイヤの所定の面の奥行き方向である。

図１２のＡに示すように、第２レイヤの視点が第１レイヤの視点Ｏである場合、第１レイヤの所定の面１３１の画角内の視点Ｏに延びる棒状の被写体１４１は、第１レイヤのテクスチャ画像１５１および第２レイヤのテクスチャ画像１５２の両方において点になる。

即ち、第１レイヤと第２レイヤにおいて視点Ｏから面１３１に向かう方向が同一になるため、第１レイヤのテクスチャ画像１５１と第２レイヤのテクスチャ画像１５２の両方において、被写体１４１が１点に縮退してしまう。従って、テクスチャ画像１５１とテクスチャ画像１５２では、被写体１４１の視点Ｏに延びる方向の長さを表現することができない。

これに対して、第２レイヤの視点が第１レイヤの視点Ｏとは異なる視点Ｏ´である場合、第１レイヤの面１３１と第２レイヤの面１６１の画角に含まれる被写体１４１は、第２レイヤのテクスチャ画像１７２において直線になる。

即ち、第１レイヤの視点Ｏから面１３１に向かう方向と第２レイヤの視点Ｏ´から面１６１に向かう方向は異なる。従って、第１レイヤのテクスチャ画像１５１において被写体１４１が１点に縮退してしまっても、第２レイヤのテクスチャ画像１７２においては被写体１４１が１点に縮退しない。よって、テクスチャ画像１７２では、被写体１４１の視点Ｏに延びる方向の長さを表現することができる。

以上により、コンテンツサーバ１２では、第１レイヤと第２レイヤの視点が異なるように設定される。

（第２レイヤの視点の第１の例）
図１４は、第２レイヤの視点の第１の例を示す図である。

図１４のＡは、第１レイヤの立方体８０の斜視図であり、図１４のＢは、立方体８０をＹ軸の負方向に見た図である。このことは、図１６においても同様である。

図１４の例では、第１レイヤの＋Ｘ面８１を含む面に対応する第２レイヤの面の視点１９１が、第１レイヤの視点ＯからＹ軸の正方向に、立方体８０の各辺の半分の長さａだけ移動した位置に設定される。図１４において視点１９１に付された矢印が示すように、第１レイヤの＋Ｘ面８１を含む面に対応する第２レイヤの面の視線ベクトルは、第１レイヤと同様に、（1,0,0）である。

第１レイヤの－Ｘ面８２を含む面に対応する第２レイヤの面の視点１９２は、視点ＯからＹ軸の負方向に長さａだけ移動した位置に設定される。図１４において視点１９２に付された矢印が示すように、第１レイヤの－Ｘ面８２を含む面に対応する第２レイヤの面の視線ベクトルは、第１レイヤと同様に、（-1,0,0）である。

また、第１レイヤの＋Ｙ面８３を含む面９１に対応する第２レイヤの面の視点１９３と－Ｙ面８４を含む面に対応する第２レイヤの面の視点１９４は、それぞれ、視点ＯからＺ軸の正方向、負方向に長さａだけ移動した位置に設定される。図１４において視点１９３および視点１９４に付された矢印が示すように、第１レイヤの面９１に対応する第２レイヤの面の視線ベクトルと－Ｙ面８４を含む面に対応する第２レイヤの面の視線ベクトルは、それぞれ、第１レイヤと同様に、（0,1,0）,（0,-1,0）である。

また、第１レイヤの＋Ｚ面８５を含む面に対応する第２レイヤの面の視点１９５と－Ｚ面８６を含む面に対応する第２レイヤの面の視点１９６は、それぞれ、第１レイヤの視点ＯからＸ軸の正方向、負方向に長さａだけ移動した位置に設定される。図１４において視点１９５および視点１９６に付された矢印が示すように、第１レイヤの＋Ｚ面８５を含む面に対応する第２レイヤの面の視線ベクトルと－Ｚ面８６を含む面に対応する第２レイヤの面の視線ベクトルは、それぞれ、第１レイヤと同様に、（0,0,1）,（0,0,-1）である。

以上のように、図１４の例では、第２レイヤの各面の視点１９１乃至１９６は、第１レイヤの視点Ｏから視線ベクトルに垂直な１方向に長さａだけ移動した位置に設定される。また、第２レイヤの各面の視線ベクトルは、対応する第１レイヤの面の視線ベクトルと同一である。さらに、第２レイヤの各面の視点１９１乃至１９６の視点Ｏに対するずれ方向は、面ごとに異なる。

なお、第２レイヤの各面の視点１９１乃至１９６と視点Ｏとの、Ｘ軸方向、Ｙ軸方向、またはＺ軸方向の距離は、立方体８０の各辺の半分の長さａに限定されない。

（第２レイヤの視点位置情報および面情報のテーブルの第１の構成例）
図１５は、第２レイヤの各面の視点として図１４の視点１９１乃至１９６が設定される場合に、図３のメタデータ生成部５７により生成されるメタデータのうちの、第２レイヤの視点位置情報および面情報のテーブルの構成例を示す図である。

図１５のテーブルは、ファイル名の共通部分と視点位置情報を除いて、図９のテーブルと同一である。

具体的には、図１５の例では、＋Ｚ面８５、－Ｚ面８６、＋Ｘ面８１、－Ｘ面８２、＋Ｙ面８３、－Ｙ面８４をそれぞれ含む第１レイヤの各面に対応する第２レイヤの各面のテクスチャ画像のファイル名が、それぞれ、posZ2_texture,negZ2_texture,posX2_texture,negX2_texture,posY2_texture,negY2_textureである。また、＋Ｚ面８５、－Ｚ面８６、＋Ｘ面８１、－Ｘ面８２、＋Ｙ面８３、－Ｙ面８４をそれぞれ含む第１レイヤの各面に対応する第２レイヤの各面のデプス画像のファイル名が、それぞれ、posZ2_depth,negZ2_depth,posX2_depth,negX2_depth,posY2_depth,negY2_depthである。従って、図１５のテーブルには、第２レイヤの各面のファイル名の共通部分として、posZ2,negZ2,posX2,negX2,posY2,negY2が登録される。

また、ファイル名の共通部分「posZ2」,「negZ2」,「posX2」,「negX2」,「posY2」,「negY2」のそれぞれに対応付けて、視点Ｏを原点としたときの視点１９１乃至１９６の座標(a,0,0),(-a,0,0),(0,a,0)(0,-a,0),(0,0,a),(0,0,-a)が登録される。

（第２レイヤの視点の第２の例）
図１６は、第２レイヤの視点の第２の例を示す図である。

図１６の例では、第１レイヤの＋Ｘ面８１を含む面に対応する第２レイヤの面の視点２１１と－Ｘ面８２を含む面に対応する第２レイヤの面の視点２１２は、それぞれ、第１レイヤの視点Ｏから、Ｙ軸の正方向とＺ軸の負方向、Ｙ軸の負方向とＺ軸の正方向に長さａだけ移動した位置に設定される。図１６において視点２１１および視点２１２に付された矢印が示すように、第１レイヤの＋Ｘ面８１を含む面に対応する第２レイヤの面の視線ベクトルと第１レイヤの－Ｘ面８２を含む面に対応する第２レイヤの面の視線ベクトルは、それぞれ、第１レイヤと同様に、（1,0,0）,（-1,0,0）である。

また、第１レイヤの＋Ｙ面８３を含む面９１に対応する第２レイヤの面の視点２１３と－Ｙ面８４を含む面に対応する第２レイヤの面の視点２１４は、それぞれ、視点Ｏから、Ｘ軸の負方向とＺ軸の正方向、Ｘ軸の正方向とＺ軸の負方向に長さａだけ移動した位置に設定される。図１６において視点２１３および視点２１４に付された矢印が示すように、第１レイヤの面９１に対応する第２レイヤの面の視線ベクトルと－Ｙ面８４を含む面に対応する第２レイヤの面の視線ベクトルは、それぞれ、第１レイヤと同様に、（0,1,0）,（0,-1,0）である。

また、第１レイヤの＋Ｚ面８５を含む面に対応する第２レイヤの面の視点２１５と－Ｚ面８６を含む面に対応する第２レイヤの面の視点２１６は、それぞれ、視点Ｏから、Ｘ軸の正方向とＹ軸の負方向、Ｘ軸の負方向とＹ軸の正方向に長さａだけ移動した位置に設定される。図１６において視点２１５および視点２１６に付された矢印が示すように、第１レイヤの＋Ｚ面８５を含む面に対応する第２レイヤの面の視線ベクトルと－Ｚ面８６を含む面に対応する第２レイヤの面の視線ベクトルは、それぞれ、第１レイヤと同様に、（0,0,1）,（0,0,-1）である。

以上のように、図１６の例では、第２レイヤの各面の視点２１１乃至２１６は、第１レイヤの視点Ｏから視線ベクトルに垂直な２方向に長さａだけ移動した位置に設定される。また、第２レイヤの各面の視線ベクトルは、対応する第１レイヤの面の視線ベクトルと同一である。さらに、第２レイヤの各面の視点２１１乃至２１６の視点Ｏに対するずれ方向は、面ごとに異なる。また、視点２１１乃至２１６は、視点Ｏに対して対称である。

なお、第２レイヤの各面の視点１９１乃至１９６と視点Ｏとの、Ｘ軸方向、Ｙ軸方向、およびＺ軸方向のうちの２方向の距離は、立方体８０の各辺の半分の長さａに限定されない。

（第２レイヤの視点位置情報および面情報のテーブルの第２の構成例）
図１７は、第２レイヤの各面の視点として図１６の視点２１１乃至２１６が設定される場合に、図３のメタデータ生成部５７により生成されるメタデータのうちの、第２レイヤの視点位置情報および面情報のテーブルの構成例を示す図である。

図１７のテーブルは、視点位置情報を除いて、図１５のテーブルと同一である。

具体的には、図１７のテーブルには、ファイル名の共通部分「posZ2」,「negZ2」,「posX2」,「negX2」,「posY2」,「negY2」のそれぞれに対応付けて、視点Ｏを原点としたときの視点２１１乃至２１６の座標(a,-a,0),(-a,a,0),(0,a,-a)(0,-a,a),(-a,0,a),(a,0,-a)が登録される。

（コンテンツサーバの処理の説明）
図１８は、図２のコンテンツサーバ１２のストリーム生成処理を説明するフローチャートである。このストリーム生成処理は、図１のマルチカメラ１１から各カメラの撮影画像がフレーム単位で供給されたとき、開始される。

図１８のステップＳ１１において、コンテンツサーバ１２のデプス検出部３１は、マルチカメラ１１から供給される各カメラの撮影画像から、各カメラの撮影画像の各画素の逆数1/zを検出し、低解像度画像処理部３３と高解像度画像処理部３４に供給する。

ステップＳ１２において、低解像度画像処理部３３は、カメラ座標系における所定の３次元位置を視点として、マルチカメラ１１から供給される各カメラの撮影画像から全天球画像のテクスチャ画像を生成し、低解像度化する。

ステップＳ１３において、低解像度画像処理部３３は、デプス検出部３１から供給される各カメラのｚ画像から、全天球画像のデプス画像を生成し、低解像度化する。

ステップＳ１４において、低解像度画像処理部３３は、ステップＳ１２の処理により生成された低解像度テクスチャ画像とステップＳ１３の処理により生成された低解像度デプス画像とを圧縮符号化して記憶する。

ステップＳ１５において、低解像度画像処理部３３は、記憶している低解像度テクスチャストリームと低解像度デプスストリームを、図１のホームサーバ１３に送信する。

ステップＳ１６において、高解像度画像処理部３４の設定部５６（図３）は、３Ｄモデル座標系における原点を第１レイヤに共通の１つの視点として設定し、第１レイヤの視点を中心とした立方体を構成する６つの面をそれぞれ含む６つの面を第１レイヤの面として設定する。また、設定部５６は、第１レイヤの各面に対応する第２レイヤの６つの視点と６つの面を設定する。設定部５６は、第１レイヤの１つの視点位置情報と６つの面の面情報を第１レイヤ生成部５０とメタデータ生成部５７に供給する。また、設定部５６は、第２レイヤの６つの視点位置情報と６つの面情報を第２レイヤ生成部５３とメタデータ生成部５７に供給する。

ステップＳ１７において、第１レイヤ生成部５０は、カメラ座標系における全天球画像の視点を原点とし、第１レイヤの視点位置情報が示す原点を視点として、各カメラの撮影画像から、第１レイヤの各面情報に対応する各面のテクスチャ画像を生成する。また、第１レイヤ生成部５０は、各カメラのｚ画像から、第１レイヤの各面情報に対応する各面のｚ画像を生成して量子化部５１に供給し、量子化部５１は、各面のｚ画像から各面のデプス画像を生成する。

ステップＳ１８において、第２レイヤ生成部５３は、第２レイヤの面情報に対応する面ごとに、カメラ座標系における全天球画像の視点を原点とし、第２レイヤの視点位置情報が示す３次元位置を視点として、各カメラの撮影画像からテクスチャ画像を生成する。また、第２レイヤ生成部５３は、第２レイヤの面情報に対応する面ごとに、各カメラのｚ画像から各面のｚ画像を生成して量子化部５４に供給し、量子化部５４は、各面のｚ画像から各面のデプス画像を生成する。

ステップＳ１９において、エンコーダ５２は、第１レイヤの各面のテクスチャ画像とデプス画像を、面ごと、かつ、画像の種類ごとに圧縮符号化してストレージ５８に供給し、記憶させる。

ステップＳ２０において、エンコーダ５５は、第２レイヤの各面のテクスチャ画像とデプス画像を、面ごと、かつ、画像の種類ごとに圧縮符号化してストレージ５８に供給し、記憶させる。

ステップＳ２１において、メタデータ生成部５７は、第１レイヤ生成部５０および第２レイヤ生成部５３から供給される顔検出情報に基づいて、顔メタデータを生成する。メタデータ生成部５７は、設定部５６から供給される第１レイヤの視点位置情報および面情報、第２レイヤの視点位置情報および面情報を含むテーブル、設定部５６から供給される推奨視聴方向情報、並びに、顔メタデータを含むメタデータを生成し、ストレージ５８に供給して記憶させる。

ステップＳ２２において、再構成部５９は、第１レイヤのテクスチャ画像とデプス画像の再構成が必要であるかどうかを判定する。例えば、再構成部５９は、ユーザから第１レイヤの面の数、画角、面どうしの間隔、位置、または傾きの変更が指示された場合、第１レイヤのテクスチャ画像とデプス画像の再構成が必要であると判定する。

ステップＳ２２で第１レイヤのテクスチャ画像とデプス画像の再構成が必要であると判定された場合、処理はステップＳ２３に進む。ステップＳ２３において、再構成部５９は、再構成後の第１レイヤの面、並びに、再構成後の第１レイヤの面に対応する第２レイヤの視点および面を設定する。

ステップＳ２４において、再構成部５９は、再構成後の第１レイヤの視点位置情報および面情報、並びに、第２レイヤの視点位置情報および面情報を含むテーブル、推奨視聴方向情報、並びに、顔メタデータを含むメタデータを生成し、ストレージ５８に供給する。

ステップＳ２５において、再構成部５９は、ストレージ５８に記憶されている各面の第１レイヤテクスチャストリームを、ステップＳ２３で設定された再構成後の第１レイヤの面のテクスチャストリームに再構成し、ストレージ５８に供給して記憶させる。また、再構成部５９は、ストレージ５８に記憶されている第１レイヤデプスストリームを、ステップＳ２３で設定された再構成後の第１レイヤの面の第１レイヤデプスストリームに再構成し、ストレージ５８に供給して記憶させる。

また、再構成部５９は、ストレージ５８に記憶されている各面の第２レイヤテクスチャストリームを、ステップＳ２３で設定された再構成後の第２レイヤの視点および面の第２レイヤテクスチャストリームに再構成し、ストレージ５８に供給して記憶させる。再構成部５９は、ストレージ５８に記憶されている第２レイヤデプスストリームを、ステップＳ２３で設定された再構成後の第２レイヤの視点および面の第２レイヤデプスストリームに再構成し、ストレージ５８に供給して記憶させる。そして、処理はステップＳ２６に進む。

一方、ステップＳ２２で第１レイヤのテクスチャ画像とデプス画像の再構成が必要ではないと判定された場合、処理はステップＳ２６に進む。

ステップＳ２６において、伝送部６０は、ストレージ５８から再構成前の６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを読み出し、ホームサーバ１３に送信する。

以上のように、コンテンツサーバ１２は、第１レイヤの視点におけるオクルージョン領域のテクスチャ画像およびデプス画像を第２レイヤのテクスチャ画像およびデプス画像として生成する。従って、ホームサーバ１３は、視聴位置が視点Ｏとは異なる場合に、第２レイヤのテクスチャ画像とデプス画像を用いることにより、表示画像に含まれる視点Ｏのオクルージョン領域を生成することができる。よって、ホームサーバ１３は、高画質の表示画像を生成することができる。

また、コンテンツサーバ１２は、第２レイヤの視点を、第１レイヤの視点Ｏとは異なる３次元位置に設定する。従って、第２レイヤにおいて、視点Ｏに延びる被写体の視点Ｏに延びる方向の長さを表現することができる。

さらに、コンテンツサーバ１２は、デプス画像の各画素のy値を逆数1/rを8ビット量子化した値とする。従って、コンテンツサーバ１２は、再構成時にデプス画像の8ビット量子化をやり直す必要がない。

（ホームサーバの第１実施の形態の構成例）
図１９は、図１のホームサーバ１３の第１実施の形態であるホームサーバ１３ａの構成例を示すブロック図である。

図１９のホームサーバ１３は、カメラ１３Ａ、受け取り部２３１、ストレージ２３２、受け取り部２３３、視線検出部２３４、３Ｄモデル生成部２３５、および描画部２３６により構成される。３Ｄモデル生成部２３５は、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３、および低解像度３Ｄモデル生成部２４２により構成される。

ホームサーバ１３ａの受け取り部２３１は、コンテンツサーバ１２から伝送されてくる低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを受け取り、ストレージ２３２に供給する。

ストレージ２３２は、受け取り部２３１から供給される低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを記憶する。

受け取り部２３３は、図１のジャイロセンサ１５Ｂの検出結果をヘッドマウントディスプレイ１５から受け取り、視線検出部２３４に供給する。

視線検出部２３４は、受け取り部２３３から供給されるジャイロセンサ１５Ｂの検出結果に基づいて、３Ｄモデル座標系における視聴者の視線方向を決定する。また、視線検出部２３４は、カメラ１３Ａからマーカ１５Ａの撮影画像を取得し、その撮影画像に基づいて、３Ｄモデル座標系における視聴位置を検出する。

視線検出部２３４は、ストレージ２３２からメタデータのうちの第１レイヤのテーブルを読み出す。視線検出部２３４は、３Ｄモデル座標系における視聴位置および視線方向、並びに、第１レイヤのテーブルに基づいて、６つの面のうちの、視聴位置から視線方向に延びる視線に最も近い視線ベクトルに対応する３つの面を選択面に決定する。具体的には、視線検出部２３４は、＋Ｘ面８１と－Ｘ面８２のいずれかを含む面、＋Ｙ面８３と－Ｙ面８４のいずれかを含む面、および、＋Ｚ面８５と－Ｚ面８６のいずれかを含む面を選択面に決定する。

以上のようにして選択面が決定されることにより、後述する描画部２３６により選択面に対応する第１レイヤおよび第２レイヤのテクスチャ画像とデプス画像を用いて生成される表示画像内の高解像度領域の割合が最も高くなる。また、３つの選択面が決定されることにより、１つの選択面が選択される場合に比べて、視線が立方体８０の頂点付近に向かう場合に表示画像内の高解像度領域の割合を増加させることができる。

視線検出部２３４は、３つの選択面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、ストレージ２３２から読み出す。視線検出部２３４は、読み出された第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、面ごとにＭＬ３Ｄモデル生成部２４１－１乃至２４１－３に供給する。また、視線検出部２３４は、低解像度テクスチャストリームと低解像度デプスストリームをストレージ２３２から読み出し、低解像度３Ｄモデル生成部２４２に供給する。

また、視線検出部２３４は、３Ｄモデル座標系における視聴位置と視線方向に基づいて、３Ｄモデル座標系における視聴者の視野範囲を決定する。視線検出部２３４は、視聴者の視野範囲と視聴位置を描画部２３６に供給する。視線検出部２３４は、３つの選択面と、その３つの選択面に対応する第２レイヤの３つの面の視点位置情報および面情報を描画部２３６に供給する。

ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３は、それぞれ、第１レイヤテクスチャストリームと第１レイヤデプスストリームを用いて、第１レイヤのテクスチャ画像の各画素に対応するサンプリング点のテクスチャ画像座標系における３次元位置（u,v,z）および接続情報と、カラー情報としてのRGB値とからなる３次元データを生成する。なお、各サンプリング点の接続情報は、そのサンプリング点(vertex)と他のサンプリング点との接続を表す情報である。テクスチャ画像座標系は、テクスチャ画像の横方向をu軸、縦方向をv軸、奥行き方向をｚ軸とする座標系である。

また、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３は、それぞれ、視線検出部２３４から供給される第２レイヤテクスチャストリームと第２レイヤデプスストリームを用いて、第２レイヤのテクスチャ画像の各画素に対応するサンプリング点の３次元データを生成する。ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３は、第１レイヤおよび第２レイヤの３次元データを描画部２３６に供給する。

低解像度３Ｄモデル生成部２４２は、視線検出部２３４から供給される低解像度テクスチャストリームと低解像度デプスストリームを復号し、低解像度テクスチャ画像と低解像度デプス画像を生成する。低解像度３Ｄモデル生成部２４２は、低解像度テクスチャ画像の各画素の画素値としてのYCbCr値をRGB値に変換し、各画素に対応するサンプリング点のRGB値とする。また、低解像度３Ｄモデル生成部２４２は、低解像度デプス画像の各画素の画素値に対して8ビット逆量子化を行い、逆数1/rを得る。そして、低解像度３Ｄモデル生成部２４２は、低解像度デプス画像の各画素の逆数1/rに基づいて、各画素の３次元位置(u,v,z)を各画素に対応するサンプリング点の３次元位置(u,v,z)として求める。

また、低解像度３Ｄモデル生成部２４２は、各サンプリング点の３次元位置(u,v,z)に基づいて、隣接する３つのサンプリング点どうしが接続するように各サンプリング点の接続情報を生成する。低解像度３Ｄモデル生成部２４２は、各サンプリング点の３次元位置(u,v,z)、接続情報、およびRGB値を、低解像度テクスチャ画像の３次元データとして、描画部２３６に供給する。

描画部２３６は、低解像度３Ｄモデル生成部２４２から供給される低解像度テクスチャ画像の３次元データに基づいて、３Ｄモデル座標系において、低解像度テクスチャ画像の三角形パッチ描画（点群描画）を行う。その後、描画部２３６は、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３のそれぞれから供給される第１レイヤおよび第２レイヤの３次元データと、視線検出部２３４から供給される視点位置情報および面情報とに基づいて、３Ｄモデル座標系において、第１レイヤおよび第２レイヤのテクスチャ画像の三角形パッチ描画を行う。

即ち、低解像度テクスチャ画像の視点は３Ｄモデル座標系における原点であり、３Ｄモデルとしての正八面体の各面の位置およびサイズは予め決まっている。従って、描画部２３６は、正八面体の各面に対応する各カメラの内部パラメータと外部パラメータを求めることができる。よって、描画部２３６は、この内部パラメータと外部パラメータを用いて、低解像度テクスチャ画像の各サンプリング点の３次元位置(u,v,z)から、各サンプリング点の画面上の位置（u,v）と３Ｄモデル座標系における３次元位置(X,Y,Z)を認識することができる。その結果、低解像度テクスチャ画像の各サンプリング点の画面上の位置（u,v）および３次元位置(X,Y,Z)と接続情報およびRGB値とを用いて三角形パッチ描画を行うことができる。

また、描画部２３６は、第１レイヤおよび第２レイヤの視点位置情報および面情報に基づいて、第１レイヤおよび第２レイヤの各面に対応する各カメラの内部パラメータと外部パラメータを求めることができる。従って、描画部２３６は、この内部パラメータと外部パラメータを用いて、第１レイヤおよび第２レイヤの各サンプリング点の３次元位置(u,v,z)から、各サンプリング点の画面上の位置（u,v）と３次元位置(X,Y,Z)を認識できる。その結果、描画部２３６は、第１レイヤおよび第２レイヤの各サンプリング点の画面上の位置（u,v）および３次元位置(X,Y,Z)と接続情報およびRGB値とを用いて三角形パッチ描画を行うことができる。

描画部２３６は、３Ｄモデル座標系において描画された三角形パッチを、視線検出部２３４から供給される視聴位置を視点として視野範囲に透視投影（マッピング）することにより、表示画像を生成する。描画部２３６は、表示画像を図１の変換装置１４に送信する。

なお、以下、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３を個々に区別する必要がない場合、単にＭＬ３Ｄモデル生成部２４１という。

（ＭＬ３Ｄモデル生成部の構成例）
図２０は、図１９のＭＬ３Ｄモデル生成部２４１の構成例を示すブロック図である。

図２０のＭＬ３Ｄモデル生成部２４１は、復号部２６１、バッファ２６２、バッファ２６３、レンダリング部２６４、復号部２６５、バッファ２６６、バッファ２６７、およびレンダリング部２６８により構成される。復号部２６１は、デコーダ２７１、およびデコーダ２７２により構成される。レンダリング部２６４は、ＲＧＢ変換部２８１、デプス変換部２８２、不連続検出部２８３、および３Ｄモデル生成部２８４により構成される。復号部２６５は、デコーダ２９１、およびデコーダ２９２により構成される。レンダリング部２６８は、ＲＧＢ変換部３０１、デプス変換部３０２、オクルージョン処理部３０３、および３Ｄモデル生成部３０４により構成される。

ＭＬ３Ｄモデル生成部２４１の復号部２６１は、第１レイヤテクスチャストリームおよび第１レイヤデプスストリームの復号を行う。

具体的には、復号部２６１のデコーダ２７１は、図１９の視線検出部２３４から供給される第１レイヤテクスチャストリームを復号し、第１レイヤのテクスチャ画像を生成する。デコーダ２７１は、第１レイヤのテクスチャ画像をバッファ２６２に蓄積する。

デコーダ２７２は、視線検出部２３４から供給される第１レイヤデプスストリームを復号し、第１レイヤのデプス画像を生成する。デコーダ２７２は、第１レイヤのデプス画像をバッファ２６３に蓄積する。

レンダリング部２６４は、復号後の第１レイヤテクスチャストリーム（第１レイヤのテクスチャ画像）および第１レイヤデプスストリーム（第１レイヤのデプス画像）のレンダリングを行い、第１レイヤの描画用のテクスチャ画像の３次元データを生成する。

具体的には、レンダリング部２６４のＲＧＢ変換部２８１は、バッファ２６２に蓄積されている第１レイヤのテクスチャ画像の各画素の画素値としてのYCbCr値をRGB値に変換し、各画素に対応するサンプリング点のRGB値とする。そして、ＲＧＢ変換部２８１は、各サンプリング点のRGB値を３Ｄモデル生成部２８４に供給する。

デプス変換部２８２は、バッファ２６３に蓄積されている第１レイヤのデプス画像の各画素の画素値に対して8ビット逆量子化を行い、逆数1/rを得る。そして、デプス変換部２８２は、第１レイヤのデプス画像の各画素の逆数1/rに基づいて、各画素の３次元位置(u,v,z)を各画素に対応するサンプリング点の３次元位置(u,v,z)として求める。デプス変換部２８２は、各サンプリング点の３次元位置(u,v,z)を不連続検出部２８３と３Ｄモデル生成部２８４に供給する。

不連続検出部２８３は、デプス変換部２８２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、第１レイヤのデプス画像の画素のうちの、隣接するサンプリング点とのｚ座標の差分が閾値以上であるサンプリング点に対応する画素である不連続画素を検出する。不連続検出部２８３は、不連続画素に対応するサンプリング点の３次元位置(u,v,z)を３Ｄモデル生成部２８４に供給する。

３Ｄモデル生成部２８４は、デプス変換部２８２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、各サンプリング点のうちの隣接する３つのサンプリング点どうしが接続するように、各サンプリング点の接続情報を生成する。即ち、３Ｄモデル生成部２８４は、サンプリング点ごとに、そのサンプリング点を頂点とする三角形パッチの３つの頂点どうしの接続を表す接続情報を生成する。そして、３Ｄモデル生成部２８４は、不連続検出部２８３から供給される不連続画素に対応するサンプリング点の３次元位置(u,v,z)に基づいて、生成された各サンプリング点の接続情報のうちの不連続画素に対応するサンプリング点との接続を表す接続情報を削除する。

３Ｄモデル生成部２８４は、第１レイヤの各サンプリング点の３次元位置(u,v,z)、RGB値、および削除後の接続情報を、第１レイヤの３次元データとして生成し、図１９の描画部２３６に供給する。

復号部２６５のデコーダ２９１は、図１９の視線検出部２３４から供給される第２レイヤテクスチャストリームを復号し、第２レイヤのテクスチャ画像を生成する。デコーダ２９１は、第２レイヤのテクスチャ画像をバッファ２６６に蓄積する。

デコーダ２９２は、視線検出部２３４から供給される第２レイヤデプスストリームを復号し、第２レイヤのデプス画像を生成する。デコーダ２９２は、第２レイヤのデプス画像をバッファ２６７に蓄積する。

レンダリング部２６８は、復号後の第２レイヤテクスチャストリーム（第２レイヤのテクスチャ画像）および第２レイヤデプスストリーム（第２レイヤのデプス画像）のレンダリングを行い、第２レイヤの描画用のテクスチャ画像の３次元データを生成する。

レンダリング部２６８のＲＧＢ変換部３０１は、バッファ２６６に蓄積されている第２レイヤのテクスチャ画像の各画素の画素値としてのYCbCr値をRGB値に変換し、各画素に対応するサンプリング点のRGB値とする。そして、ＲＧＢ変換部３０１は、各サンプリング点のRGB値を３Ｄモデル生成部３０４に供給する。

デプス変換部３０２は、バッファ２６７に蓄積されている第２レイヤのデプス画像の各画素の画素値に対して8ビット逆量子化を行い、逆数1/rを得る。そして、デプス変換部３０２は、第２レイヤのデプス画像の各画素の逆数1/rに基づいて、各画素の３次元位置(u,v,z)を各画素に対応するサンプリング点の３次元位置(u,v,z)として求める。デプス変換部３０２は、各サンプリング点の３次元位置(u,v,z)をオクルージョン処理部３０３と３Ｄモデル生成部３０４に供給する。

オクルージョン処理部３０３は、デプス変換部３０２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、第２レイヤのデプス画像の画素のうちの不連続画素を検出する。オクルージョン処理部３０３は、第２レイヤの各サンプリング点の３次元位置(u,v,z)に基づいて、不連続画素に対応するサンプリング点の３次元位置(u,v,z)を補正するオクルージョン処理を行う。

具体的には、オクルージョン処理部３０３は、例えば、不連続画素に対応するサンプリング点の２次元位置（u,v）を、そのサンプリング点の近傍かつ手前側のサンプリング点の２次元位置(u,v)に補正する。オクルージョン処理部３０３は、第２レイヤの各サンプリング点のオクルージョン処理後の３次元位置(u,v,z)を３Ｄモデル生成部３０４に供給する。

３Ｄモデル生成部３０４は、オクルージョン処理部３０３から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、サンプリング点ごとに、そのサンプリング点と隣接する２つのサンプリング点との接続を表す接続情報を生成する。３Ｄモデル生成部３０４は、各サンプリング点の３次元位置(u,v,z)および接続情報、並びに、ＲＧＢ変換部３０１から供給されるRGB値を、第２レイヤの３次元データとして生成する。３Ｄモデル生成部３０４は、第２レイヤの３次元データを図１９の描画部２３６に供給する。

（低解像度３Ｄモデル生成部の構成例）
図２１は、図１９の低解像度３Ｄモデル生成部２４２の構成例を示すブロック図である。

図２１の低解像度３Ｄモデル生成部２４２は、復号部３２１、バッファ３２２、バッファ３２３、およびレンダリング部３２４により構成される。復号部３２１は、デコーダ３３１およびデコーダ３３２により構成される。レンダリング部３２４は、ＲＧＢ変換部３４１、デプス変換部３４２、および３Ｄモデル生成部３４３により構成される。

低解像度３Ｄモデル生成部２４２の復号部３２１は、低解像度テクスチャストリームおよび低解像度デプスストリームの復号を行う。

具体的には、復号部３２１のデコーダ３３１は、図１９の視線検出部２３４から供給される低解像度テクスチャストリームを復号し、低解像度テクスチャ画像を生成する。デコーダ３３１は、低解像度テクスチャ画像をバッファ３２２に蓄積する。

デコーダ３３２は、視線検出部２３４から供給される低解像度デプスストリームを復号し、低解像度デプス画像を生成する。デコーダ３３２は、低解像度デプス画像をバッファ３２３に蓄積する。

レンダリング部３２４は、復号後の低解像度テクスチャストリーム（低解像度テクスチャ画像）および低解像度デプスストリーム（低解像度デプス画像）のレンダリングを行い、描画用の低解像テクスチャ画像の３次元データを生成する。

具体的には、レンダリング部３２４のＲＧＢ変換部３４１は、バッファ３２２に蓄積されている低解像テクスチャ画像の各画素の画素値としてのYCbCr値をRGB値に変換し、各画素に対応するサンプリング点のRGB値とする。そして、ＲＧＢ変換部３４１は、各サンプリング点のRGB値を３Ｄモデル生成部３４３に供給する。

デプス変換部３４２は、バッファ３２３に蓄積されている低解像度デプス画像の各画素の画素値に対して8ビット逆量子化を行い、逆数1/rを得る。そして、デプス変換部３４２は、低解像度デプス画像の各画素の逆数1/rに基づいて、各画素の３次元位置(u,v,z)を各画素に対応するサンプリング点の３次元位置(u,v,z)として求める。デプス変換部３４２は、各サンプリング点の３次元位置(u,v,z)を３Ｄモデル生成部３４３に供給する。

３Ｄモデル生成部３４３は、デプス変換部３４２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、各サンプリング点のうちの隣接する３つのサンプリング点どうしが接続するように、各サンプリング点の接続情報を生成する。即ち、３Ｄモデル生成部３４３は、サンプリング点ごとに、そのサンプリング点を頂点とする三角形パッチの３つの頂点どうしの接続を表す接続情報を生成する。

３Ｄモデル生成部３４３は、各サンプリング点の３次元位置(u,v,z)、RGB値、および接続情報を、低解像度テクスチャ画像の３次元データとして生成し、図１９の描画部２３６に供給する。

以上のようにして、各ＭＬ３Ｄモデル生成部２４１は、３つの選択面に対応する高解像度符号化ストリームの復号およびレンダリングを行う。低解像度３Ｄモデル生成部２４２は、低解像度符号化ストリームの復号およびレンダリングを行う。そして、描画部２３６は、３つの選択面に対応する第１レイヤおよび第レイヤの３次元データ、並びに、低解像度テクスチャ画像の３次元データに基づいて、表示画像を生成する最終的なレンダリングを行う。

（接続情報の削除およびオクルージョン処理の効果の説明）
図２２は、第１レイヤの接続情報のうちの不連続画素に対応するサンプリング点との接続を表す接続情報を削除しない場合の接続情報を説明する図であり、図２３は、削除した場合の接続情報を説明する図である。

図２２および図２３において、左右方向は、テクスチャ画像の横方向を表し、上下方向は、テクスチャ画像の奥行き方向を表す。図２２および図２３の上方向が手前側、下方向が奥側である。また、図２２および図２３において、実線は、第１レイヤの各サンプリング点の３次元位置(u,v,z)を表し、点線は、第２レイヤの各サンプリング点の３次元位置(u,v,z)を表す。また、図２２および図２３の例では、被写体が図１０の前景１１１と背景１１２である。

第１レイヤおよび第２レイヤの両方においてオクルージョン処理が行われない場合、図２２のＡに示すように、第１レイヤの前景１１１の撮影画像１２１と背景１１２の領域１１２Ａの撮影画像１２２Ａの境界の不連続画素に対応するサンプリング点の３次元位置は変更されない。

また、第１レイヤおよび第２レイヤの両方において不連続画素に対応するサンプリング点との接続を表す接続情報が削除されない場合、図２２のＡに示すように、第１レイヤおよび第２レイヤの不連続画素に対応するサンプリング点は、隣接する２つのサンプリング点と接続される。

従って、第１レイヤの不連続画素に対応するサンプリング点と、隣接する２つのサンプリング点とを頂点とする三角形パッチが生成され、その三角形パッチにより、有効領域の撮影画像１２２Ｃは塗り潰れされる。よって、図中右下から左上へ向かう視線Ｖに対応する、撮影済みオクルージョン領域１１２Ｃを含む表示画像を生成する場合に、撮影済みオクルージョン領域１１２Ｃの撮影画像１２２Ｃが配置される第２レイヤの有効領域を用いることはできない。

また、第１レイヤおよび第２レイヤの両方において、不連続画素に対応するサンプリング点との接続を表す接続情報が削除されないが、オクルージョン処理は行われる場合、図２２のＢに示すように、第１レイヤおよび第２レイヤの不連続画素に対応するサンプリング点の２次元位置が、そのサンプリング点の近傍かつ手前側のサンプリング点の２次元位置に補正される。

従って、視線Ｖに対応する表示画像を生成する場合、撮影済みオクルージョン領域１１２Ｃの表示画像として、第１レイヤの領域１１２Ａの撮影画像１２２Ａを用いることができる。その結果、表示画像の画質は向上する。

しかしながら、オクルージョン処理後の第１レイヤの不連続画素に対応するサンプリング点は、隣接する２つのサンプリング点と接続され、三角形パッチが生成される。従って、図２２のＡの場合と同様に、視線Ｖに対応する表示画像を生成する場合、撮影済みオクルージョン領域１１２Ｃの撮影画像１２２Ｃが配置される第２レイヤの有効領域を用いることはできない。

これに対して、３Ｄモデル生成部２８４は、図２３に示すように、第１レイヤの不連続画素との接続を表す接続情報を削除する。従って、第１レイヤの不連続画素に対応するサンプリング点を頂点とする三角形パッチが生成されない。よって、視線Ｖに対応する表示画像を生成する場合に、撮影済みオクルージョン領域１１２Ｃの撮影画像１２２Ｃが配置される第２レイヤの有効領域を用いることができる。第２レイヤにおいては接続情報の削除が行われないので、第１レイヤの三角形パッチが存在しない領域には、必ず第２レイヤの三角形パッチが存在する。

また、オクルージョン処理部３０３は、第２レイヤに対してオクルージョン処理を行う。従って、図２３に示すように、第２レイヤの有効領域と想像領域の境界の不連続画素に対応するサンプリング点のうちの奥側のサンプリング点の２次元位置が、そのサンプリング点の近傍かつ手前側のサンプリング点の２次元位置に補正される。従って、第２レイヤにおいてオクルージョン領域が削減される。よって、視線Ｖに対応する表示画像を生成する際に用いられる第２レイヤの画質が向上し、その結果、表示画像の画質が向上する。

（第１レイヤの面の画角の効果の説明）
図２４および図２５は、それぞれ、第１レイヤの各面の画角が９０度、１００度である場合のサンプリング点を説明する図である。

図２４および図２５の例では、説明の便宜上、第１レイヤの各面の画角が９０度、１００度である場合の第１レイヤのテクスチャ画像およびデプス画像の解像度が、それぞれ、4x4画素、6x6画素であるものとする。

図２４のＢに示すように、第１レイヤの各面の画角が９０度である場合、第１レイヤの６つの面は、立方体８０を構成する６つの面８１乃至８６になる。

しかしながら、図２４のＡに示すように、第１レイヤの－Ｚ面８６のテクスチャ画像４００上のサンプリング点４１１の位置(u,v)、即ち３Ｄモデル座標系における視点Ｏからサンプリング点４１１に向かう線が－Ｚ面８６と交差する位置は、各画素４０１の中心である。また、他の面８１乃至８５のサンプリング点の位置(u,v)も、－Ｚ面８６と同様に各画素の中心である。

従って、図２４のＢに示すように、図中黒丸で示すサンプリング点のうちの隣接する３つのサンプリング点どうしを接続することにより構成される全ての三角形パッチの、各面８１乃至８６上の領域４０２のu方向およびｖ方向サイズは、各面８１乃至８６に比べて画素の半分のサイズだけ小さい。よって、各面８１乃至８６の境界に対応する三角形パッチが生成されず、その結果、各面８１乃至８６の境界を通る視線の表示画像を高画質で生成することが困難になる。

これに対して、第１レイヤの各面の画角が１００度である場合、図２５のＡに示すように、－Ｚ面８６を含む第１レイヤの面のテクスチャ画像４２０のサイズは、図２４のテクスチャ画像４００のサイズより大きい6×6画素になる。他の面８１乃至８５をそれぞれ含む第１レイヤの各面のテクスチャ画像のサイズも同様に6×6画素になる。

従って、図２５のＢに示すように、図中黒丸で示すサンプリング点のうちの隣接する３つのサンプリング点どうしを接続することにより構成される全ての三角形パッチの、－Ｚ面８６上の領域４２１のu方向およびｖ方向サイズは、－Ｚ面８６に比べて画素の半分のサイズだけ大きい。図示は省略するが、他の面８１乃至８５をそれぞれ含む第１レイヤの各面の三角形パッチの領域のu方向およびｖ方向サイズも、領域４２１と同様に、各面８１乃至８５に比べて画素の半分のサイズだけ大きい。従って、各面８１乃至８６の境界に対応する三角形パッチが生成され、その結果、各面８１乃至８６の境界を通る視線を含む任意の視線の表示画像を高画質で生成することができる。

図２４および図２５では、第１レイヤの各面の画角が１００度である場合の効果について説明したが、第１レイヤの各面の画角が９０度より大きければ、画角が１００度ではない場合であっても同様の効果が発生する。

（第２レイヤの面の画角の効果の説明）
図２６は、第２レイヤの各面の画角が９０度および１００度である場合のオクルージョン処理を説明する図である。

図２６において、横軸はu軸を表し、縦軸はｚ軸を表す。また、丸はサンプリング点を表す。さらに、図２６の例では、奥行き方向の位置が奥側であるほどｚ座標は大きい。

第２レイヤの各面の画角が９０度である場合、サンプリング点が、第２レイヤのいずれか１つの面にのみマッピングされる。従って、図２６のＡに示すように、処理対象の面のu方向の端部にマッピングされるサンプリング点４４１に隣接するサンプリング点４４２は、処理対象の面にはマッピングされず、処理対象の面のオクルージョン処理時にサンプリング点４４２のｚ軸の位置はわからない。

よって、サンプリング点４４１とサンプリング点４４２のｚ座標の差分が閾値以上である場合であっても、サンプリング点４４１に対応する画素は不連続画素として検出されない。同様に、サンプリング点４４２がマッピングされる面が処理対象の面とされる場合にも、サンプリング点４４２に対応する画素は不連続画素として検出されない。従って、サンプリング点４４１およびサンプリング点４４２に対してオクルージョン処理を行うことはできない。即ち、サンプリング点４４１およびサンプリング点４４２に対してオクルージョン処理を行うために、処理対象の面のデプス画像以外に、処理対象の面と隣接する面のデプス画像も用いる必要がある。

これに対して、第２レイヤの各面の画角が１００度である場合、各面の端部に、その面と隣接する面の端部以外の領域にマッピングされるサンプリング点が、のりしろとして重複してマッピングされる。例えば、サンプリング点４４１がマッピングされる処理対象の面の端部に、処理対象の面に隣接する面の端部以外の領域にマッピングされるサンプリング点４４２がマッピングされる。

従って、サンプリング点４４１とサンプリング点４４２のｚ座標の差分が閾値以上である場合、サンプリング点４４１とサンプリング点４４２に対応する画素は不連続画素として検出される。よって、図２６のＢに示すように、サンプリング点４４１とサンプリング点４４２に対してオクルージョン処理を行うことができる。その結果、不連続画素に対応するサンプリング点４４２のu座標が、サンプリング点４４２近傍のサンプリング点４４２より手前側の（z座標が小さい）サンプリング点４４３のu座標に補正される。

なお、図２６の例では、処理対象の面の端部以外の領域にマッピングされるサンプリング点４４４とサンプリング点４４５のｚ座標の差分が閾値以上であるため、サンプリング点４４４とサンプリング点４４５に対応する画素も不連続画素として検出されている。その結果、図２６のＢに示すように、サンプリング点４４４のu座標が、サンプリング点４４４近傍のサンプリング点４４４より手前側のサンプリング点４４６のu座標に補正されている。

また、処理対象の面のu座標が最も大きい端部のサンプリング点４４７は、処理対象の面と隣接する面の端部以外の領域にマッピングされる。従って、この面が処理対象の面とされる場合に、サンプリング点４４７に対応する画素が不連続画素であるかどうかを判定し、不連続画素であると判定した場合に、サンプリング点４４７に対するオクルージョン処理を行うことができる。

以上のように、第２レイヤの各面の画角が１００度である場合、各面のサンプリング点のみを用いて、各面の端部以外の領域の端部にマッピングされるサンプリング点４４１に対してもオクルージョン処理を行うことができる。その結果、第２レイヤのオクルージョン領域が削減され、表示画像の画質を向上させることができる。

図２６では、第２レイヤの各面の画角が１００度である場合の効果について説明したが、第２レイヤの各面の画角が９０度より大きければ、画角が１００度ではない場合であっても同様の効果が発生する。

なお、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３は、復号の結果得られるテクスチャ画像やデプス画像に対して、周辺の画素を用いたフィルタ処理等の画像処理を行うようにしてもよい。この場合、第１レイヤおよび第２レイヤの各面の画角が９０度より大きいことにより、オクルージョン処理と同様に、各面の端部以外の領域の端部においても画像処理を行うことができるという効果を得ることができる。

（ホームサーバの処理の説明）
図２７は、図１９のホームサーバ１３ａの再生処理を説明するフローチャートである。この再生処理は、例えば、コンテンツサーバ１２から伝送されてくる低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータが伝送されてきたとき、開始される。

図２７のステップＳ４１において、ホームサーバ１３ａの受け取り部２３１は、コンテンツサーバ１２から、低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを受け取り、ストレージ２３２に供給する。

ステップＳ４２において、ストレージ２３２は、低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを記憶する。

ステップＳ４３において、受け取り部２３３は、図１のジャイロセンサ１５Ｂの検出結果をヘッドマウントディスプレイ１５から受け取り、視線検出部２３４に供給する。

ステップＳ４４において、視線検出部２３４は、受け取り部２３３から供給されるジャイロセンサ１５Ｂの検出結果に基づいて、３Ｄモデル座標系における視聴者の視線方向を決定する。ステップＳ４５において、カメラ１３Ａは、ヘッドマウントディスプレイ１５に付されたマーカ１５Ａを撮影し、その結果得られる撮影画像を視線検出部２３４に供給する。

ステップＳ４６において、視線検出部２３４は、カメラ１３Ａから供給されるマーカ１５Ａの撮影画像に基づいて、３Ｄモデル座標系における視聴位置を検出し、描画部２３６に供給する。

ステップＳ４７において、視線検出部２３４は、ストレージ２３２に記憶されているメタデータのうちの第１レイヤのテーブルと、３Ｄモデル座標系における視聴位置および視線方向とに基づいて、６つの面のうちの視線に最も近い視線ベクトルに対応する３つの面を選択面に決定する。

ステップＳ４８において、視線検出部２３４は、３Ｄモデル座標系における視聴位置と視線方向に基づいて、３Ｄモデル座標系における視聴者の視野範囲を決定し、描画部２３６に供給する。

ステップＳ４９において、視線検出部２３４は、低解像度テクスチャストリームと低解像度デプスストリームをストレージ２３２から読み出し、低解像度３Ｄモデル生成部２４２に供給する。また、視線検出部２３４は、３つの選択面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、ストレージ２３２から読み出す。視線検出部２３４は、読み出された第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、面ごとにＭＬ３Ｄモデル生成部２４１－１乃至２４１－３に供給する。また、視線検出部２３４は、３つの選択面に対応する視点位置情報および面情報をストレージ２３２から読み出し、描画部２３６に供給する。

ステップＳ５０において、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３は、面ごとに、第１レイヤおよび第２レイヤの各サンプリング点の３次元データを生成する３次元データ生成処理を行う。この３次元データ生成処理の詳細は、図２８を参照して後述する。

ステップＳ５１において、低解像度３Ｄモデル生成部２４２は、視線検出部２３４から供給される低解像度テクスチャストリームと低解像度デプスストリームから、低解像度テクスチャ画像の各サンプリング点の３次元データを生成し、描画部２３６に供給する。

ステップＳ５２において、描画部２３６は、低解像度３Ｄモデル生成部２４２から供給される低解像度テクスチャ画像の３次元データに基づいて、３Ｄモデル座標系において、低解像度テクスチャ画像の三角形パッチ描画を行う。その後、描画部２３６は、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３のそれぞれから供給される第１レイヤおよび第２レイヤの３次元データと、視線検出部２３４から供給される視点位置情報および面情報とに基づいて、３Ｄモデル座標系において、第１レイヤおよび第２レイヤのテクスチャ画像の三角形パッチ描画を行う。

ステップＳ５３において、描画部２３６は、３Ｄモデル座標系において描画された三角形パッチを、視線検出部２３４から供給される視聴位置を視点として視野範囲に透視投影することにより、表示画像を生成する。ステップＳ５４において、描画部２３６は、表示画像を図１の変換装置１４に伝送する。

図２８は、図２７のステップＳ５０において各ＭＬ３Ｄモデル生成部２４１（ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３）により行われる３次元データ生成処理の詳細を説明するフローチャートである。

図２８のステップＳ７１において、ＭＬ３Ｄモデル生成部２４１のデコーダ２７１（図２０）は、図１９の視線検出部２３４から供給される第１レイヤテクスチャストリームを復号し、第１レイヤのテクスチャ画像を生成する。デコーダ２７１は、第１レイヤのテクスチャ画像をバッファ２６２に蓄積する。

ステップＳ７２において、ＲＧＢ変換部２８１は、バッファ２６２に蓄積されている第１レイヤのテクスチャ画像の各画素の画素値としてのYCbCr値をRGB値に変換し、各画素に対応するサンプリング点のRGB値とする。そして、ＲＧＢ変換部２８１は、各サンプリング点のRGB値を３Ｄモデル生成部２８４に供給する。

ステップＳ７３において、デコーダ２７２は、視線検出部２３４から供給される第１レイヤデプスストリームを復号し、第１レイヤのデプス画像を生成する。デコーダ２７２は、第１レイヤのデプス画像をバッファ２６３に蓄積する。

ステップＳ７４において、デプス変換部２８２は、バッファ２６３に蓄積されている第１レイヤのデプス画像の各画素の画素値に対して8ビット逆量子化を行い、第１レイヤのデプス画像の各画素の逆数1/rを得る。

ステップＳ７５において、デプス変換部２８２は、第１レイヤのデプス画像の各画素の逆数1/rに基づいて、第１レイヤのデプス画像の各画素の３次元位置(u,v,z)を、各画素に対応するサンプリング点の３次元位置(u,v,z)として求める。デプス変換部２８２は、各サンプリング点の３次元位置(u,v,z)を不連続検出部２８３と３Ｄモデル生成部２８４に供給する。

ステップＳ７６において、不連続検出部２８３は、デプス変換部２８２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、第１レイヤのデプス画像の各画素のうちの不連続画素を検出する。不連続検出部２８３は、不連続画素に対応するサンプリング点の３次元位置(u,v,z)を３Ｄモデル生成部２８４に供給する。

ステップＳ７７において、３Ｄモデル生成部２８４は、デプス変換部２８２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、各サンプリング点のうちの隣接する３つのサンプリング点どうしが接続するように、第１レイヤの各サンプリング点の接続情報を生成する。

ステップＳ７８において、３Ｄモデル生成部２８４は、不連続検出部２８３から供給される不連続画素に対応するサンプリング点の３次元位置(u,v,z)に基づいて、ステップＳ７７で生成された各サンプリング点の接続情報のうちの不連続画素に対応するサンプリング点との接続を表す接続情報を削除する。

ステップＳ７９において、３Ｄモデル生成部２８４は、第１レイヤの各サンプリング点の３次元位置(u,v,z)、RGB値、および、ステップＳ７８の処理による削除後の接続情報を、第１レイヤの３次元データとして生成する。３Ｄモデル生成部２８４は、第１レイヤの３次元データを図１９の描画部２３６に供給する。

ステップＳ８０において、デコーダ２９１は、視線検出部２３４から供給される第２レイヤテクスチャストリームを復号し、第２レイヤのテクスチャ画像を生成する。デコーダ２９１は、第２レイヤのテクスチャ画像をバッファ２６６に蓄積する。

ステップＳ８１において、ＲＧＢ変換部３０１は、バッファ２６６に蓄積されている第２レイヤのテクスチャ画像の各画素の画素値としてのYCbCr値をRGB値に変換し、各画素に対応するサンプリング点のRGB値とする。そして、ＲＧＢ変換部３０１は、各サンプリング点のRGB値を３Ｄモデル生成部３０４に供給する。

ステップＳ８２において、デコーダ２９２は、視線検出部２３４から供給される第２レイヤデプスストリームを復号し、第２レイヤのデプス画像を生成する。デコーダ２９２は、第２レイヤのデプス画像をバッファ２６７に蓄積する。

ステップＳ８３において、デプス変換部３０２は、バッファ２６７に蓄積されている第２レイヤのデプス画像の各画素の画素値に対して8ビット逆量子化を行い、第２レイヤのデプス画像の各画素の逆数1/rを得る。

ステップＳ８４において、デプス変換部３０２は、第２レイヤのデプス画像の各画素の逆数1/rに基づいて、第２レイヤのデプス画像の各画素の３次元位置(u,v,z)を、各画素に対応するサンプリング点の３次元位置(u,v,z)として求める。デプス変換部３０２は、各サンプリング点の３次元位置(u,v,z)をオクルージョン処理部３０３と３Ｄモデル生成部３０４に供給する。

ステップＳ８５において、オクルージョン処理部３０３は、デプス変換部３０２から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、第２レイヤのデプス画像の各画素のうちの不連続画素を検出する。

ステップＳ８６において、オクルージョン処理部３０３は、第２レイヤの各サンプリング点の３次元位置(u,v,z)に基づいて、不連続画素に対応するサンプリング点の３次元位置(u,v,z)を補正するオクルージョン処理を行う。オクルージョン処理部３０３は、第２レイヤの各サンプリング点のオクルージョン処理後の３次元位置(u,v,z)を３Ｄモデル生成部３０４に供給する。

ステップＳ８７において、３Ｄモデル生成部３０４は、オクルージョン処理部３０３から供給される各サンプリング点の３次元位置(u,v,z)に基づいて、各サンプリング点のうちの隣接する３つのサンプリング点どうしが接続するように、第２レイヤの各サンプリング点の接続情報を生成する。

ステップＳ８８において、３Ｄモデル生成部３０４は、各サンプリング点の３次元位置(u,v,z)および接続情報、並びに、ＲＧＢ変換部３０１から供給されるRGB値を、第２レイヤの３次元データとして生成する。３Ｄモデル生成部３０４は、第２レイヤの３次元データを図１９の描画部２３６に供給する。

以上のように、ホームサーバ１３ａは、第１レイヤと第２レイヤを用いて、表示画像を生成する。従って、視聴位置が視点Ｏとは異なる場合に、第２レイヤを用いることにより、表示画像に含まれる視点Ｏのオクルージョン領域を生成することができる。従って、高画質の表示画像を生成することができる。

また、ホームサーバ１３ａは、テクスチャ画像だけでなくデプス画像も用いて表示画像を生成する。従って、三角形パッチ描画により、被写体に応じた３次元形状の三角形パッチにテクスチャ画像をマッピングし、その三角形パッチを用いて表示画像を生成することができる。よって、テクスチャ画像のみを用いてテクスチャ画像を所定の面にマッピングすることにより表示画像を生成する場合に比べて、高画質の表示画像を生成することができる。

さらに、第１レイヤのテクスチャ画像とデプス画像は、全天球画像のテクスチャ画像とデプス画像を所定の面にマッピングすることにより得られるテクスチャ画像とデプス画像である。従って、全天球画像のテクスチャ画像とデプス画像を所定の面にマッピングすることにより得られるテクスチャ画像とデプス画像のみを再生する再生装置において、第１レイヤのテクスチャ画像とデプス画像を再生することができる。

即ち、コンテンツサーバ１２により生成される第１レイヤおよび第２レイヤのテクスチャ画像とデプス画像のフォーマットは、全天球画像のテクスチャ画像とデプス画像を所定の面にマッピングすることにより得られるテクスチャ画像とデプス画像のフォーマットと互換性を有する。また、ホームサーバ１３ａによる再生方法は、全天球画像のテクスチャ画像とデプス画像を所定の面にマッピングすることにより得られるテクスチャ画像とデプス画像のみを再生する再生装置の再生方法と互換性を有する。

なお、ホームサーバ１３ａは、第１レイヤのテクスチャ画像とデプス画像のみを用いて表示画像を生成するようにしてもよい。この場合、第１レイヤに対して接続情報の削除の代わりに、オクルージョン処理が行われる。

また、上述した説明では、３Ｄモデル生成部２８４は、不連続検出部２８３において検出された不連続画素に対応するサンプリング点との接続を表す接続情報を削除したが、コンテンツサーバ１２から伝送されてくる三角形パッチ有効無効情報（詳細は後述する）に基づいて接続情報を削除するようにしてもよい。この場合、不連続検出部２８３は設けられない。

（三角形パッチ有効無効情報の説明）
図２９は、このような場合にコンテンツサーバ１２から伝送されてくる三角形パッチ有効無効情報を説明する図である。

図２９の例では、第１レイヤのサンプリング点４６１の数が１２個である。従って、隣接する３つのサンプリング点４６１を頂点とする三角形パッチ４６２の数は、１２個である。

この場合、コンテンツサーバ１２は、不連続検出部２８３と同様に、不連続画素を検出する。そして、コンテンツサーバ１２は、その不連続画素に対応するサンプリング点を頂点とする三角形パッチ４６２を無効（ＯＦＦ）に設定し、不連続画素に対応するサンプリング点を含まない三角形パッチ４６２を有効（ＯＮ）に設定する。

コンテンツサーバ１２は、各三角形パッチ４６２の有効または無効を示す三角形パッチ有効無効情報を生成し、メタデータに含める。

ホームサーバ１３ａの３Ｄモデル生成部２８４は、三角形パッチ有効無効情報に基づいて、無効の三角形パッチの頂点を構成するサンプリング点どうしの接続を表す接続情報を削除する。その結果、三角形パッチ有効無効情報が無効を示す三角形パッチは、描画されない。

なお、三角形パッチは、右端および下端のサンプリング点を除いて、各サンプリング点に対して２個ずつ生成される。また、三角形パッチ有効無効情報は、三角形パッチの有効または無効を示す１ビットの情報である。従って、全ての三角形パッチの三角形パッチ有効無効情報のビット数は、第１レイヤのテクスチャ画像の水平方向の画素数をwidthとし、垂直方向の画素数をheightとすると、（width-1)*(height-1)*2ビットである。

三角形パッチ有効無効情報は、ロスレス圧縮または非圧縮で、コンテンツサーバ１２からホームサーバ１３ａに伝送される。なお、三角形パッチ有効無効情報は、デプス画像のCb,Cr値として配置されてもよい。

＜第２実施の形態＞
第１実施の形態では、低解像度符号化ストリーム、および、視聴者の視線に近い３つの選択面に対応する高解像度符号化ストリームに基づいて、表示画像が生成される。従って、例えば、視聴者の視線方向が急激に変化したり、大きく変化したりした場合に、表示画像内の低解像度領域の割合が大きくなり、画質が低下する。これを防ぐためには、例えば、選択面の数を増やしたり、低解像度符号化ストリームを用いずに、全ての面の高解像度符号化ストリームのみを用いて表示画像を生成したりすることが考えられる。

一方で、低解像度符号化ストリームおよび高解像度符号化ストリームの復号およびレンダリングは、非常に負荷の大きな処理である。そのため、ホームサーバ１３の処理能力等により、各符号化ストリームの復号およびレンダリングが間に合わず、表示画像の全部または一部の非表示、フリーズ、または更新の遅延が発生し、画質が低下するおそれがある。特に、上述したように選択面の数を増やしたり、高解像度符号化ストリームのみを用いて表示画像を生成したりすると、符号化ストリームの復号およびレンダリングの遅延による画質の低下が発生する可能性が高くなる。

そこで、第２実施の形態は、必要に応じて符号化ストリーム間で優先度をつけて各符号化ストリームの復号およびレンダリングを行うことにより、ホームサーバ１３の負荷を軽減しつつ、表示画像の画質の低下を抑制するものである。

（ホームサーバの第２実施の形態の構成例）
図３０は、図１のホームサーバ１３の第２実施の形態であるホームサーバ１３ｂ（画像処理装置）の構成例を示すブロック図である。

図３０に示す構成のうち、図１９の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図３０のホームサーバ１３ｂは、カメラ１３Ａ、受け取り部２３１、ストレージ２３２、受け取り部２３３、描画部２３６、視線検出部５０１、および３Ｄモデル生成部５０２（画像生成部）により構成される。ホームサーバ１３ｂは、図１９のホームサーバ１３ａと比較して、視線検出部２３４および３Ｄモデル生成部２３５の代わりに、視線検出部５０１および３Ｄモデル生成部５０２が設けられている点が異なる。３Ｄモデル生成部５０２は、優先度設定部５１１、ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６、および低解像度３Ｄモデル生成部５１３により構成される。

視線検出部５０１は、図１９の視線検出部２３４と同様に、視聴者の視線方向の決定、視聴者の視聴位置の検出、並びに、視聴者の視野範囲の決定を行う。視線検出部５０１は、視聴者の視野範囲と視聴位置を描画部２３６に供給する。また、視線検出部５０１は、視聴者の視線方向と視聴位置を優先度設定部５１１に供給する。

優先度設定部５１１は、ストレージ２３２に記憶されているメタデータのうちの推奨視聴方向情報および顔メタデータ、視線検出部５０１から供給される視聴者の視聴位置および視線方向、図示せぬ音声処理部から供給される音源情報、並びに、ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６から供給される画像中の色情報の分布に基づいて、各符号化ストリームの復号およびレンダリングを行う優先度を設定する。優先度設定部５１１は、各符号化ストリームに対する優先度を、それぞれ対応するＭＬ３Ｄモデル生成部５１２－１乃至５１２－６および低解像度３Ｄモデル生成部５１３に供給する。

また、優先度設定部５１１は、各面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、ストレージ２３２から読み出す。優先度設定部５１１は、読み出された第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、面ごとにＭＬ３Ｄモデル生成部５１２－１乃至５１２－６に供給する。また、優先度設定部５１１は、低解像度テクスチャストリームと低解像度デプスストリームをストレージ２３２から読み出し、低解像度３Ｄモデル生成部５１３に供給する。

ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６は、図１９のＭＬ３Ｄモデル生成部２４１－１乃至２４１－３と同様に、それぞれ対応する面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。例えば、ＭＬ３Ｄモデル生成部５１２－１は、＋Ｘ面８１を含む面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。ＭＬ３Ｄモデル生成部５１２－２は、－Ｘ面８２を含む面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。ＭＬ３Ｄモデル生成部５１２－３は、＋Ｙ面８３を含む面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。ＭＬ３Ｄモデル生成部５１２－４は、－Ｙ面８４を含む面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。ＭＬ３Ｄモデル生成部５１２－５は、＋Ｚ面８５を含む面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。ＭＬ３Ｄモデル生成部５１２－６は、－Ｚ面８６を含む面の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する。そして、ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６は、第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを描画部２３６に供給する。

ただし、ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６は、ＭＬ３Ｄモデル生成部２４１－１乃至２４１－３と異なり、後述するように、各高解像度符号化ストリームの復号およびレンダリングを行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。また、ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６は、復号した第１レイヤテクスチャストリームおよび第２レイヤテクスチャストリームのピクチャの色情報の分布を検出し、検出結果を優先度設定部５１１に供給する。

なお、以下、ＭＬ３Ｄモデル生成部５１２－１乃至５１２－６を個々に区別する必要がない場合、単にＭＬ３Ｄモデル生成部５１２という。

低解像度３Ｄモデル生成部５１３は、図１９のホームサーバ１３ａの低解像度３Ｄモデル生成部２４２と同様に、低解像度テクスチャ画像の３次元データを生成する。低解像度３Ｄモデル生成部５１３は、低解像度テクスチャ画像の３次元データを描画部２３６に供給する。

ただし、低解像度３Ｄモデル生成部５１３は、低解像度３Ｄモデル生成部２４２と異なり、後述するように、低解像度符号化ストリームの復号およびレンダリングを行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。

（ＭＬ３Ｄモデル生成部の構成例）
図３１は、図３０のＭＬ３Ｄモデル生成部５１２の構成例を示すブロック図である。

図３０に示す構成のうち、図２０の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図３１のＭＬ３Ｄモデル生成部５１２は、バッファ２６２、バッファ２６３、レンダリング部２６４、復号部２６５、バッファ２６６、バッファ２６７、レンダリング部２６８、復号部５３１、および復号部５３２により構成される。ＭＬ３Ｄモデル生成部５１２は、図２０のＭＬ３Ｄモデル生成部２４１と比較して、復号部２６１および復号部２６５の代わりに、復号部５３１および復号部５３２が設けられている点が異なる。復号部５３１は、デコーダ５４１およびデコーダ５４２により構成される。復号部５３２は、デコーダ５５１およびデコーダ５５２により構成される。

復号部５３１のデコーダ５４１は、図２０のデコーダ２７１と同様に、優先度設定部５１１から供給される第１レイヤテクスチャストリームを復号し、第１レイヤのテクスチャ画像を生成し、第１レイヤのテクスチャ画像をバッファ２６２に蓄積する。

ただし、デコーダ５４１は、デコーダ２７１と異なり、後述するように、第１レイヤテクスチャストリームの復号を行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。また、デコーダ５４１は、復号したピクチャの色情報の分布を検出し、検出結果を図３０の優先度設定部５１１に供給する。

復号部５３１のデコーダ５４２は、図２０のデコーダ２７２と同様に、優先度設定部５１１から供給される第１レイヤデプスストリームを復号し、第１レイヤのデプス画像を生成し、第１レイヤのデプス画像をバッファ２６３に蓄積する。

ただし、デコーダ５４２は、デコーダ２７２と異なり、後述するように、第１レイヤデプスストリームの復号を行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。

復号部５３２のデコーダ５５１は、図２０のデコーダ２９１と同様に、優先度設定部５１１から供給される第２レイヤテクスチャストリームを復号し、第２レイヤのテクスチャ画像を生成し、第２レイヤのテクスチャ画像をバッファ２６６に蓄積する。

ただし、デコーダ５５１は、デコーダ２９１と異なり、後述するように、第２レイヤテクスチャストリームの復号を行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。また、デコーダ５５１は、復号したピクチャの色情報の分布を検出し、検出結果を図３０の優先度設定部５１１に供給する。

復号部５３２のデコーダ５５２は、図２０のデコーダ２９２と同様に、優先度設定部５１１から供給される第２レイヤデプスストリームを復号し、第２レイヤのデプス画像を生成し、第２レイヤのデプス画像をバッファ２６７に蓄積する。

ただし、デコーダ５５２は、デコーダ２９２と異なり、後述するように、第２レイヤデプスストリームの復号を行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。

（低解像度３Ｄモデル生成部の構成例）
図３２は、図３１の低解像度３Ｄモデル生成部５１３の構成例を示すブロック図である。

図３２に示す構成のうち、図２１の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図３２の低解像度３Ｄモデル生成部５１３は、バッファ３２２、バッファ３２３、レンダリング部３２４、および復号部５７１により構成される。低解像度３Ｄモデル生成部５１３は、図２１の低解像度３Ｄモデル生成部２４２と比較して、復号部３２１の代わりに、復号部５７１が設けられている点が異なる。復号部５７１は、デコーダ５８１およびデコーダ５８２により構成される。

復号部５７１のデコーダ５８１は、図２１のデコーダ３３１と同様に、優先度設定部５１１から供給される低解像度テクスチャストリームを復号し、低解像度テクスチャ画像を生成し、低解像度テクスチャ画像をバッファ３２２に蓄積する。

ただし、デコーダ５８１は、デコーダ３３１と異なり、後述するように、低解像度テクスチャストリームの復号を行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。

復号部５７１のデコーダ５８２は、図２１のデコーダ３３２と同様に、優先度設定部５１１から供給される低解像度デプスストリームを復号し、低解像度デプス画像を生成し、低解像度デプス画像をバッファ３２３に蓄積する。

ただし、デコーダ５８２は、デコーダ３３２と異なり、後述するように、低解像度デプスストリームの復号を行う際に、優先度設定部５１１により設定された優先度に従ってピクチャの間引き処理を行う。

（ホームサーバの処理の説明）
図３３は、図３０のホームサーバ１３ｂの再生処理を説明するフローチャートである。この再生処理は、例えば、コンテンツサーバ１２から伝送されてくる低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータが伝送されてきたとき、開始される。

ステップＳ１０１乃至Ｓ１０３において、図２７のステップＳ４１乃至Ｓ４３と同様の処理が実行される。

ステップＳ１０４において、視線検出部５０１は、図２７のステップＳ４４の処理と同様に、受け取り部２３３から供給されるジャイロセンサ１５Ｂの検出結果に基づいて、３Ｄモデル座標系における視聴者の視線方向を決定する。視線検出部５０１は、視聴者の視線方向を優先度設定部５１１に供給する。

ステップＳ１０５において、カメラ１３Ａは、ヘッドマウントディスプレイ１５に付されたマーカ１５Ａを撮影し、その結果得られる撮影画像を視線検出部２３４に供給する。

ステップＳ１０６において、視線検出部５０１は、カメラ１３Ａから供給されるマーカ１５Ａの撮影画像に基づいて、３Ｄモデル座標系における視聴位置を検出し、描画部２３６および優先度設定部５１１に供給する。

ステップＳ１０７において、図２７のステップＳ４８の処理と同様に、視線検出部５０１は、３Ｄモデル座標系における視聴位置と視線方向に基づいて、３Ｄモデル座標系における視聴者の視野範囲を決定し、描画部２３６に供給する。

ステップＳ１０８において、ホームサーバ１３ｂは、表示画像生成処理を行う。表示画像生成処理の詳細は、図３４を参照して後述する。

ステップＳ１０９において、図２７のステップＳ５４の処理と同様に、描画部２３６は、表示画像を図１の変換装置１４に伝送する。

ステップＳ１１０において、優先度設定部５１１は、符号化ストリームの再生が終了したか否かを判定する。優先度設定部５１１は、ストレージ２３２に未再生の符号化ストリームが残っている場合、符号化ストリームの再生が終了していないと判定し、処理はステップＳ１０３に戻る。

その後、ステップＳ１１０において、符号化ストリームの再生が終了したと判定されるまで、ステップＳ１０３乃至Ｓ１１０の処理が繰り返し実行される。

一方、ステップＳ１１０において、優先度設定部５１１は、ストレージ２３２に未再生の符号化ストリームが残っていない場合、符号化ストリームの再生が終了したと判定し、再生処理は終了する。

図３４は、図３３のステップＳ１０８においてホームサーバ１３ｂにより行われる表示画像生成処理の詳細を説明するフローチャートである。

ステップＳ１３１において、優先度設定部５１１は、レンダリングのアンダーフローが発生しそうか否かを判定する。例えば、優先度設定部５１１は、各ＭＬ３Ｄモデル生成部５１２のバッファ２６２、バッファ２６３、バッファ２６６、およびバッファ２６７の蓄積量を確認する。優先度設定部５１１は、全てのバッファの蓄積量が所定の閾値以上である場合、レンダリングのアンダーフローが発生しそうでないと判定し、処理はステップＳ１３２に進む。すなわち、各高解像度符号化ストリームの復号が順調に行われており、各高解像度符号化ストリームのレンダリングの遅延の発生が予測されない場合、処理はステップＳ１３２に進む。

ステップＳ１３２において、優先度設定部５１１は、優先度をデフォルト値に設定する。

図３５は、優先度とピクチャの間引き方法の例を示している。図内の四角は符号化ストリームの各ＧＯＰ（Group of Picture）内のピクチャを示している。黒地にＩの文字が示されているピクチャは、他のピクチャとの依存関係がなく、単独で復号されるＩピクチャを示している。斜線およびＰｒの文字が示されているピクチャは、フレーム間予測を用いて復号されるＰピクチャのうち、他のピクチャから参照される参照Ｐピクチャを示している。白地にＰｎの文字が示されているピクチャは、Ｐピクチャのうち他のピクチャから参照されない非参照Ｐピクチャを示している。

例えば、最も高い優先度Ａに設定されている符号化ストリームにおいては、ピクチャの間引きは行われない。すなわち、符号化ストリームの全てのピクチャの再生が行われる。例えば、優先度Ａに設定されている符号化ストリームから生成される３次元データのフレームレートは、６０ｆｐｓ（frame per second）となる。

２番目に高い優先度Ｂに設定されている符号化ストリームにおいては、符号化ストリームの各ＧＯＰ内の非参照Ｐピクチャが間引かれる。すなわち、符号化ストリームのＩピクチャおよび参照Ｐピクチャのみが再生される。例えば、優先度Ｂに設定されている符号化ストリームから生成される３次元データのフレームレートは、３０ｆｐｓとなる。

３番目に高い優先度Ｃに設定されている符号化ストリームにおいては、符号化ストリームの各ＧＯＰ内の参照Ｐピクチャおよび非参照Ｐピクチャが間引かれる。すなわち、符号化ストリームのＩピクチャのみが再生される。例えば、優先度Ｃに設定されている符号化ストリームから生成される３次元データのフレームレートは、１ｆｐｓとなる。

最も低い優先度Ｄに設定されている符号化ストリームにおいては、ＧＯＰ内の全てのピクチャが間引かれる。すなわち、符号化ストリームの再生が行われず、フレームの更新が行われない。従って、優先度Ｄに設定されている符号化ストリームは、表示画像の生成に用いられない。

このように、優先度が下がるにつれて、非参照Ｐピクチャ、参照Ｐピクチャ、Ｉピクチャの順に間引くピクチャが追加される。

例えば、優先度設定部５１１は、優先度をデフォルト値に設定する場合、全てのレイヤの全ての面の高解像度符号化ストリームを優先度Ａに設定する。すなわち、全ての高解像度符号化ストリームが、ピクチャを間引かずに再生される。一方、優先度設定部５１１は、低解像度符号化ストリームを優先度Ｄに設定する。すなわち、低解像度符号化ストリームの再生が停止される。

優先度設定部５１１は、設定した優先度を、各ＭＬ３Ｄモデル生成部５１２のデコーダ５４１、デコーダ５４２、デコーダ５５１、およびデコーダ５５２、並びに、低解像度３Ｄモデル生成部５１３のデコーダ５８１およびデコーダ５８２に供給する。

ステップＳ１３３において、優先度設定部５１１は、次に再生を行う期間（以下、再生対象期間という）内の低解像度テクスチャストリームと低解像度デプスストリームをストレージ２３２から読み出し、低解像度３Ｄモデル生成部５１３に供給する。また、優先度設定部５１１は、次の再生対象期間内の各面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、ストレージ２３２から読み出す。優先度設定部５１１は、読み出した各面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、それぞれ対応するＭＬ３Ｄモデル生成部５１２に供給する。また、優先度設定部５１１は、各面に対応する視点位置情報および面情報をストレージ２３２から読み出し、描画部２３６に供給する。

なお、再生対象期間は、例えば、所定の数のＧＯＰ単位で設定される。

ステップＳ１３４において、図２７のステップＳ５０の処理と同様に、各ＭＬ３Ｄモデル生成部５１２は、面ごとに、第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する３次元データ生成処理を行う。このとき、各ＭＬ３Ｄモデル生成部５１２は、各高解像度符号化ストリームのピクチャを間引くことなく、３次元データ生成処理を行う。

なお、低解像度符号化ストリームは優先度Ｄに設定されているため、低解像度テクスチャ画像の３次元データの生成処理は行われない。

ステップＳ１３５において、描画部２３６は、各ＭＬ３Ｄモデル生成部５１２から供給される第１レイヤおよび第２レイヤの３次元データと、視線検出部２３４から供給される視点位置情報および面情報とに基づいて、３Ｄモデル座標系において、第１レイヤおよび第２レイヤのテクスチャ画像の三角形パッチ描画を行う。

このとき、低解像度テクスチャ画像の三角形パッチ描画は行われない。

ステップＳ１３６において、図２７のステップＳ５３の処理と同様に、表示画像が生成される。上述したように、レンダリングのアンダーフローが発生しそうでないと判定された場合、低解像度テクスチャ画像の３次元データの生成処理は行われない。そして、高解像度の第１レイヤまたは第２レイヤのテクスチャ画像の３次元データのみを用いて表示画像が生成される。従って、視聴者の視野範囲の表示画像の全ての領域が高解像度となり、画質が向上する。

その後、表示画像生成処理は終了する。

一方、ステップＳ１３１において、優先度設定部５１１は、例えば、各ＭＬ３Ｄモデル生成部５１２のバッファ２６２、バッファ２６３、バッファ２６６、およびバッファ２６７のうち、少なくとも１つのバッファの蓄積量が所定の閾値未満である場合、レンダリングのアンダーフローが発生しそうであると判定し、処理はステップＳ１３７に進む。すなわち、少なくとも１つの高解像度符号化ストリームの復号が間に合わず、当該高解像度符号化ストリームのレンダリングの遅延の発生が予測される場合、処理はステップＳ１３７に進む。

ステップＳ１３７において、優先度設定部５１１は、優先度設定処理を行う。優先度設定処理の詳細は、図３６および図３７を参照して後述するが、各レイヤの各面の高解像度符号化ストリームの優先度が、優先度Ａ乃至Ｄのいずれかに設定される。

なお、視聴者の視野範囲と重なる面およびレイヤ、並びに、視聴者が見る可能性が高い面およびレイヤの高解像度符号化ストリームの優先度が高く設定される。一方、視聴者が見る可能性が低い面およびレイヤの高解像度符号化ストリームの優先度が低く設定される。また、低解像度符号化ストリームの優先度が、最も高い優先度Ａに設定される。

ステップＳ１３８において、ステップＳ１３３と同様の処理が行われる。

ステップＳ１３９において、各ＭＬ３Ｄモデル生成部５１２は、面およびレイヤごとに、優先度に従って段階的にピクチャを間引きながら、３次元データを生成する。具体的には、図２７のステップＳ５０の処理と同様に、各ＭＬ３Ｄモデル生成部５１２は、面ごとに、第１レイヤおよび第２レイヤのテクスチャ画像の３次元データを生成する３次元データ生成処理を行う。

このとき、各ＭＬ３Ｄモデル生成部５１２は、図３５を参照して上述したように、優先度設定部５１１により設定された優先度に従って、各高解像度符号化ストリームのＧＯＰ内のピクチャを間引きながら、３次元データを生成する。具体的には、各ＭＬ３Ｄモデル生成部５１２のデコーダ５４１、デコーダ５４２、デコーダ５５１、およびデコーダ５５２が、間引く対象となるピクチャの復号をスキップすることにより、ピクチャを間引く。そして、優先度が低い高解像度符号化ストリームほど、復号するピクチャを間引く量が大きくなる。

なお、各ＭＬ３Ｄモデル生成部５１２は、全てのピクチャの復号を行う一方、間引く対象となるピクチャのレンダリングをスキップすることにより、ピクチャを間引くようにしてもよい。具体的には、各ＭＬ３Ｄモデル生成部５１２のデコーダ５４１、デコーダ５４２、デコーダ５５１、およびデコーダ５５２は、全てのピクチャの復号を実施する。一方、各ＭＬ３Ｄモデル生成部５１２のレンダリング部２６４およびレンダリング部２６８は、間引く対象となるピクチャのレンダリングをスキップすることにより、ピクチャを間引く。そして、優先度が低い高解像度符号化ストリームほど、レンダリングするピクチャを間引く量が大きくなる。

ステップＳ１４０において、図２７のステップＳ５１の処理と同様に、低解像度テクスチャ画像の３次元データが生成され、描画部２３６に供給される。このとき、低解像度符号化ストリームのピクチャが間引かれることなく、３次元データが生成される。

ステップＳ１４１において、図２７のステップＳ５２の処理と同様に、三角形パッチ描画が行われる。

ステップＳ１４２において、図２７のステップＳ５３の処理と同様に、表示画像が生成される。このとき、低解像度テクスチャ画像の３次元データ、並びに、優先度Ａ乃至Ｃに設定されている面およびレイヤの高解像度テクスチャ画像の３次元データを用いて、表示画像が生成される。

ここで、上述したように、レンダリングのアンダーフローが発生しそうな場合、低解像度符号化ストリーム、視聴者の視野範囲と重なる面およびレイヤの高解像度符号化ストリーム、並びに、視聴者が見る可能性の高い面およびレイヤの高解像度符号化ストリームの優先度が高く設定される。従って、視聴者の視野範囲において高解像度領域の割合が高くなるとともに、視野範囲の高解像領域の更新頻度が高く維持される。また、視聴者の視線が想定外の動きをした場合にも、高解像度領域の画像か更新頻度が高い低解像度領域の画像かを視聴者に見せることができる。さらに、ホームサーバ１３ｂの負荷が軽減され、符号化ストリームの再生の遅延が抑制され、表示画像のリアルタイム性が保証される。その結果、視聴者の視野範囲の表示画像の画質の低下が抑制され、ユーザエクスペリエンスの低下が抑制される。

その後、表示画像生成処理は終了する。

図３６は、図３４のステップＳ１３７において優先度設定部５１１により行われる優先度設定処理の詳細を説明するフローチャートである。

また、図３７は、優先度を設定するためのスコアの算出に用いるスコア算出テーブルの例を示している。スコア算出テーブルは、加算要因、基準値、および重み係数の項目を含む。後述するように、優先度設定部５１１は、図３７のスコア算出テーブルに基づいて、スコアの算出を行う。

ステップＳ１６１において、優先度設定部５１１は、スコアを算出する面を選択する。優先度設定部５１１は、第１レイヤの６つの面および第２レイヤの６つの面の中から、まだスコアを算出していない面を１つ選択する。

なお、以下、優先度設定部５１１により選択された面を設定対象面という。

ステップＳ１６２において、優先度設定部５１１は、ストレージ２３２に記憶されているメタデータのうちの推奨視聴方向情報に基づいて、設定対象面が推奨視聴方向に設定されているか否かを判定する。優先度設定部５１１は、設定対象面が推奨視聴方向の面である場合、設定対象面が推奨視聴方向に設定されていると判定し、処理はステップＳ１６３に進む。

ステップＳ１６３において、優先度設定部５１１は、推奨視聴方向に基づくスコアを加算する。

例えば、図３７のスコア算出テーブルにおいて、設定対象面が推奨視聴方向に設定されている場合の基準値が１に設定され、推奨視聴方向に設定されていない場合の基準値が０に設定されている。また、重み係数が１０に設定されている。

なお、基準値に重み係数を乗じた値がスコアに加算される。従って、設定対象面が推奨視聴方向に設定されている場合、基準値である１に重み係数である１０を乗じた値である１０がスコアに加算される。一方、設定対象面が推奨視聴方向に設定されていない場合、スコアは加算されない。

その後、処理はステップＳ１６４に進む。

一方、ステップＳ１６２において、設定対象面が推奨視聴方向に設定されていないと判定された場合、ステップＳ１６３の処理はスキップされ、スコアの加算が行われずに、処理はステップＳ１６４に進む。

ステップＳ１６４において、優先度設定部５１１は、視聴者の視野に基づくスコアを加算する。例えば、優先度設定部５１１は、視聴者の視聴位置から視線方向に延びる視線が設定対象面と交わる場合、設定対象面が視聴者の視野の中央であると判定する。また、優先度設定部５１１は、設定対象面が視聴者の視線と交わる面と隣接する面である場合、設定対象面が視聴者の視野の周辺であると判定する。さらに、優先度設定部５１１は、設定対象面が視聴者の視線と交わる面、および、視線と交わる面に隣接する面のいずれでもない場合、設定対象面が視聴者の視野外であると判定する。

例えば、図８のＢの＋Ｙ面８３を含む面が視聴者の視線と交わる場合、＋Ｙ面８３を含む面が視野の中央となる。＋Ｘ面８１、－Ｘ面８２、＋Ｚ面８５、および－Ｚ面８６のうちいずれかを含む面が視野の周辺となる。－Ｙ面８４を含む面が視野外となる。

一方、図３７のスコア算出テーブルにおいて、設定対象面が視野中央である場合の基準値が２に設定されており、視野周辺である場合の基準値が１に設定されており、視野外である場合の基準値が０に設定されている。また、重み係数が５に設定されている。従って、設定対象面が視野中央である場合、スコアが１０だけ加算される。設定対象面が視野周辺である場合、スコアが５だけ加算される。設定対象面が視野外である場合、スコアは加算されない。

ステップＳ１６５において、優先度設定部５１１は、レイヤに基づくスコアを加算する。

例えば、図３７のスコア算出テーブルにおいて、第１レイヤの基準値が２に設定され、第２レイヤの基準値が１に設定され、それ以外のレイヤの基準値が０に設定されている。また、重み係数が４に設定されている。従って、設定対象面のレイヤが第１レイヤである場合、スコアが８だけ加算される。設定対象面のレイヤが第２レイヤである場合、スコアが４だけ加算される。設定対象面のレイヤがそれ以外のレイヤである場合、スコアは加算されない。

なお、現在の例では、第３レイヤ以降のレイヤが設定されていないため、設定対象面のレイヤがそれ以外のレイヤになる場合はない。

ステップＳ１６６において、優先度設定部５１１は、設定対象面に人物が存在するか否かを判定する。例えば、優先度設定部５１１は、ストレージ２３２に記憶されているメタデータのうちの顔メタデータに基づいて、再生対象期間内の設定対象面のテクスチャストリームにおいて人の顔が出現する否かを検出する。優先度設定部５１１は、人の顔が出現する場合、設定対象面に人物が存在すると判定し、処理はステップＳ１６７に進む。

ステップＳ１６７において、優先度設定部５１１は、人物に基づくスコアを加算する。

例えば、図３７のスコア算出テーブルにおいて、視聴者に注目される可能性が高いオブジェクトとして注目オブジェクトＡ乃至Ｃが設定されている。そのうち、注目オブジェクトＡは人物であり、人物が存在する場合の基準値が１に設定され、人物が存在しない場合の基準値が０に設定されている。また、重み係数が３に設定されている。従って、設定対象面に人物が存在する場合、スコアが３だけ加算される。設定対象面に人物が存在しない場合、スコアは加算されない。

すなわち、視聴者は人物が存在する方向を見る可能性が高いため、人物が存在する面およびレイヤに対応する符号化ストリームの優先度が高く設定される。

その後、処理はステップＳ１６８に進む。

一方、ステップＳ１６６において、優先度設定部５１１は、再生対象期間内の設定対象面のテクスチャストリームにおいて人の顔が出現しない場合、設定対象面に人物が存在しないと判定する。そして、ステップＳ１６７の処理はスキップされ、スコアの加算は行われずに、処理はステップＳ１６８に進む。

ステップＳ１６８において、優先度設定部５１１は、音源情報を取得する。具体的には、優先度設定部５１１は、再生対象期間の所定の期間前（例えば、１フレーム前）の表示画像と同期して再生される音声の音源情報を、図示せぬ音声処理部から取得する。音源情報は、例えば、各音源の３Ｄモデル座標系における位置および音量を示す。

ステップＳ１６９において、優先度設定部５１１は、設定対象面に音量が大きな音源が存在するか否かを判定する。例えば、優先度設定部５１１は、取得した音源情報に基づいて、音量が所定の閾値以上の音源を抽出する。優先度設定部５１１は、視聴者の視聴位置を基準にして、抽出した音源が設定対象面の方向に存在する場合、設定対象面に音量が大きな音源が存在すると判定し、処理はステップＳ１７０に進む。

ステップＳ１７０において、優先度設定部５１１は、音源に基づくスコアを加算する。

例えば、図３７のスコア算出テーブルにおいて、注目オブジェクトＢとして音量が大きな音源が設定されている。そして、音量が大きな音源が存在する場合の基準値が１に設定され、存在しない場合の基準値が０に設定されている。また、重み係数が２に設定されている。従って、設定対象面に音量が大きな音源が存在する場合、スコアが２だけ加算される。設定対象面に音量が大きな音源が存在しない場合、スコアは加算されない。

すなわち、視聴者は大きな音がする方向を見る可能性が高いため、音量が大きな音源が存在する面およびレイヤに対応する符号化ストリームの優先度が高く設定される。

その後、処理はステップＳ１７１に進む。

一方、ステップＳ１６９において、設定対象面に音量が大きな音源が存在しないと判定された場合、ステップＳ１７０の処理はスキップされ、スコアの加算は行われずに、処理はステップＳ１７１に進む。

ステップＳ１７１において、優先度設定部５１１は、画像中の色情報の分布を取得する。具体的には、優先度設定部５１１は、設定対象面のテクスチャストリームの復号を行うＭＬ３Ｄモデル生成部５１２のデコーダ５４１またはデコーダ５５１から、設定対象面のテクスチャストリームの復号済みのピクチャのうち時間軸上で最も新しいピクチャの色情報の分布を取得する。

ステップＳ１７２において、優先度設定部５１１は、設定対象面に視覚的に目立つ被写体が存在するか否かを判定する。例えば、優先度設定部５１１は、取得した色情報の分布において、周囲と比べて特徴のある色領域の検出を行う。なお、特徴のある色領域の検出方法には、任意の方法を採用することができる。そして、優先度設定部５１１は、特徴のある色領域が検出された場合、設定対象面に視覚的に目立つ被写体が存在すると判定し、処理はステップＳ１７３に進む。

ステップＳ１７３において、優先度設定部５１１は、視覚的に目立つ被写体に基づくスコアを加算する。

例えば、図３７のスコア算出テーブルにおいて、注目オブジェクトＣとして視覚的に目立つ被写体が設定されている。そして、視覚的に目立つ被写体が存在する場合の基準値が１に設定され、存在しない場合の基準値が０に設定されている。また、重み係数が１に設定されている。従って、設定対象面に視覚的に目立つ被写体が存在する場合、スコアが１だけ加算される。設定対象面に視覚的に目立つ被写体が存在しない場合、スコアは加算されない。

すなわち、視聴者は視覚的に目立つ被写体が存在する方向を見る可能性が高いため、視覚的に目立つ被写体が存在する面およびレイヤに対応する符号化ストリームの優先度が高く設定される。

その後、処理はステップＳ１７４に進む。

一方、ステップＳ１７２において、設定対象面に視覚的に目立つ被写体が存在しないと判定された場合、ステップＳ１７３の処理はスキップされ、スコアの加算は行われずに、処理はステップＳ１７４に進む。

ステップＳ１７４において、優先度設定部５１１は、全ての面のスコアを算出したか否かを判定する。まだ全ての面のスコアを算出していないと判定された場合、処理はステップＳ１６１に戻る。

その後、ステップＳ１７４において、全ての面のスコアを算出したと判定されるまで、ステップＳ１６１乃至Ｓ１７４の処理が繰り返し実行される。

一方、ステップＳ１７４において、全ての面のスコアを算出したと判定された場合、処理はステップＳ１７５に進む。

ステップＳ１７５において、優先度設定部５１１は、各符号化ストリームの優先度を設定する。例えば、優先度設定部５１１は、低解像度符号化ストリームの優先度を優先度Ａに設定する。すなわち、低解像度符号化ストリームは、視聴者の視野範囲を含む全ての方向をカバーするため、高解像度符号化ストリームより優先度が高く設定され、最優先で復号およびレンダリングが行われる。

また、優先度設定部５１１は、第１レイヤの６つの面および第２レイヤの６つの面の１２種類の面をスコアの高い順に並べ、スコアが上位の２５％に含まれる面に対応する高解像度符号化ストリームを優先度Ａに設定する。優先度設定部５１１は、スコアが次の上位の２５％に含まれる面に対応する高解像度符号化ストリームを優先度Ｂに設定する。優先度設定部５１１は、スコアが下位の５０％に含まれる面に対応する高解像度符号化ストリームを優先度Ｄに設定する。

これにより、視聴者の視野範囲と重なる面およびレイヤに対応する高解像度符号化ストリーム、並びに、視聴者が見る可能性が高い面およびレイヤに対応する高解像符号化ストリームの優先度が高く設定される。一方、視聴者が見る可能性が低い面およびレイヤに対応する高解像度符号化ストリームの優先度が低く設定される。

優先度設定部５１１は、各高解像度符号化ストリームに対する優先度を、それぞれ対応するＭＬ３Ｄモデル生成部５１２のデコーダ５４１、デコーダ５４２、デコーダ５５１、またはデコーダ５５２に供給する。また、優先度設定部５１１は、低解像度符号化ストリームの優先度を、低解像度３Ｄモデル生成部５１３のデコーダ５８１およびデコーダ５８２に供給する。

その後、優先度設定処理は終了する。

＜第３実施の形態＞
第３実施の形態では、第２実施の形態と同様に、優先度をつけて各符号化ストリームの復号およびレンダリングが行われる。ただし、第３実施の形態では、低解像度符号化ストリームを用いずに、高解像度符号化ストリームのみを用いて表示画像の生成が行われる。

（ホームサーバの第３実施の形態の構成例）
図３８は、図１のホームサーバ１３の第３実施の形態であるホームサーバ１３ｃ（画像処理装置）の構成例を示すブロック図である。

図３８に示す構成のうち、図３０の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図３８のホームサーバ１３ｃは、カメラ１３Ａ、受け取り部２３１、ストレージ２３２、受け取り部２３３、描画部２３６、視線検出部５０１、および３Ｄモデル生成部６０１（画像生成部）により構成される。ホームサーバ１３ｃは、図３０のホームサーバ１３ｂと比較して、３Ｄモデル生成部５０２の代わりに、３Ｄモデル生成部６０１が設けられている点が異なる。３Ｄモデル生成部６０１は、図３０の３Ｄモデル生成部５０２と比較して、低解像度３Ｄモデル生成部５１３が設けられていない点が異なる。

なお、ホームサーバ１３ｃの再生処理は、図３３乃至図３７を参照して上述したホームサーバ１３ｂの再生処理とほぼ同様である。

ただし、ホームサーバ１３ｃの３Ｄモデル生成部６０１では、第１レイヤおよび第２レイヤのテクスチャ画像の３次元データのみが生成され、低解像度テクスチャ画像の３次元データは生成されない。従って、３Ｄモデル生成部６０１は、図３０の３Ｄモデル生成部５０２と比較して、低解像度符号化ストリームの復号およびレンダリングが省略される分だけ負荷が軽減される。そして、３Ｄモデル生成部６０１は、負荷が軽減された分だけ、高解像度符号化ストリームの復号およびレンダリングの処理量を増やすことができる。

そこで、例えば、上述した図３６のステップＳ１７５において、１２種類の面をスコアの高い順に並べ、スコアが上位の２５％に含まれる面に対応する高解像度符号化ストリームが優先度Ａに設定される。スコアが次の上位の２５％に含まれる面に対応する高解像度符号化ストリームが優先度Ｂに設定される。スコアが次の上位の２５％に含まれる面に対応する高解像度符号化ストリームが優先度Ｃに設定される。スコアが下位の２５％に含まれる面に対応する高解像度符号化ストリームが優先度Ｄに設定される。すなわち、ホームサーバ１３ｂの再生処理と比較して、優先度Ｃに設定される高解像度符号化ストリームの割合が増加し、優先度Ｄに設定される高解像度符号化ストリームの割合が減少する。

そして、上述した図３４のステップＳ１４２において、描画部２３６は、高解像度の第１レイヤおよび第２レイヤのテクスチャ画像の３次元データのみを用いて表示画像を生成する。このとき、描画部２３６は、優先度Ｄに設定された高解像度符号化ストリームに基づく高解像度テクスチャ画像の３次元データも用いて表示画像を生成する。例えば、描画部２３６は、優先度Ｄに設定された高解像度符号化ストリームに対応する表示画像内の領域の画像を優先度Ｄに設定される直前の状態で更新を停止し、静止画とする。

これにより、表示画像内が全て高解像度領域となり、画質が向上する。また、視聴者の視野範囲において更新頻度が高くなるとともに、視聴者が見る可能性が低い領域の更新頻度が低くなる。さらに、ホームサーバ１３ｃの負荷が軽減され、符号化ストリームの再生の遅延が抑制され、表示画像のリアルタイム性が保証される。その結果、視聴者の視野範囲の表示画像の画質の低下が抑制され、ユーザエクスペリエンスの低下が抑制される。

なお、第３実施の形態においては、コンテンツサーバ１２において、低解像度符号化ストリームの生成処理を省略することが可能である。

＜第４実施の形態＞
（画像表示システムの第２実施の形態の構成例）
図３９は、本開示を適用した画像表示システムの第２実施の形態の構成例を示すブロック図である。

図３９に示す構成のうち、図１の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図３９の画像表示システム７００は、マルチカメラ１１、コンテンツサーバ１２、変換装置１４、ヘッドマウントディスプレイ１５、配信サーバ７０１、ネットワーク７０２、および再生装置７０３により構成される。画像表示システム７００では、例えば、６つの面のうちの、視線に対応する１つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームのみが再生装置７０３に配信され、再生される。

具体的には、画像表示システム７００の配信サーバ７０１は、コンテンツサーバ１２から送信されてくる低解像度テクスチャストリームおよび低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを受け取り、記憶する。

また、配信サーバ７０１は、ネットワーク７０２を介して再生装置７０３と接続する。配信サーバ７０１は、再生装置７０３からの要求に応じて、記憶している低解像度テクスチャストリームおよび低解像度デプスストリーム、１つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びにメタデータを、ネットワーク７０２を介して再生装置７０３に伝送する。

なお、例えば、コンテンツサーバ１２の処理能力、配信サーバ７０１の処理能力、ネットワーク７０２の負荷や構成等の要因により、配信サーバ７０１から再生装置７０３への各符号化ストリームの伝送が遅延する場合が想定される。この場合、例えば、配信サーバ７０１は、ＱｏＳ（Quality of Service）等の技術を用いて、再生装置７０３におけるリアルタイム制を確保するように、優先度をつけて各符号化ストリームの伝送を行う。

再生装置７０３（画像処理装置）は、配信サーバ７０１に低解像度テクスチャストリーム、低解像度デプスストリーム、およびメタデータを、ネットワーク７０２を介して要求し、その要求に応じて伝送されてくる低解像度テクスチャストリーム、低解像度デプスストリーム、およびメタデータを受け取る。

また、再生装置７０３は、カメラ１３Ａを内蔵する。再生装置７０３は、ホームサーバ１３ａと同様に、３Ｄモデル座標系における視聴位置を検出し、３Ｄモデル座標系における視聴者の視線方向と視野範囲を決定する。

そして、再生装置７０３は、３Ｄモデル座標系における視聴位置および視線方向、並びに、メタデータに含まれる第１レイヤのテーブルに基づいて、第１レイヤの６つの面のうちの、視線に最も近い視線ベクトルに対応する１つの面を選択面に決定する。再生装置７０３は、１つの選択面に対応する第１レイヤテクスチャストリーム、第１レイヤデプストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを、ネットワーク７０２を介して要求する。再生装置７０３は、その要求に応じて伝送されてくる１つの選択面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを受け取る。

再生装置７０３は、低解像度テクスチャストリームおよび低解像度デプスストリーム、並びに、１つの選択面に対応する第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを用いて表示画像を生成する。この場合の再生装置７０３の表示画像を生成する処理は、選択面の数が１つである点を除いて、ホームサーバ１３ａの処理と同様であるので、説明は省略する。再生装置７０３は、図示せぬHDMIケーブルを介して表示画像を変換装置１４に伝送する。

或いは、例えば、再生装置７０３は、配信サーバ７０１に低解像度テクスチャストリーム、低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びに、メタデータを、ネットワーク７０２を介して要求する。再生装置７０３は、その要求に応じて伝送されてくる低解像度テクスチャストリーム、低解像度デプスストリーム、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びに、メタデータを受け取る。

再生装置７０３は、低解像度テクスチャストリームおよび低解像度デプスストリーム、並びに、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを用いて、図３０のホームサーバ１３ｂと同様の処理により、表示画像を生成する。この場合の再生装置７０３の表示画像を生成する処理は、ホームサーバ１３ｂの処理と同様であるので、説明は省略する。再生装置７０３は、図示せぬHDMIケーブルを介して表示画像を変換装置１４に伝送する。

或いは、例えば、再生装置７０３は、配信サーバ７０１に６つの面の第１レイヤテクスチャストリーム、第１レイヤデプストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びに、メタデータを、ネットワーク７０２を介して要求する。再生装置７０３は、その要求に応じて伝送されてくる６つの面の第１レイヤテクスチャストリーム、第１レイヤデプストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリーム、並びに、メタデータを受け取る。

再生装置７０３は、６つの面の第１レイヤテクスチャストリーム、第１レイヤデプスストリーム、第２レイヤテクスチャストリーム、および第２レイヤデプスストリームを用いて、図３０のホームサーバ１３ｃと同様の処理により、表示画像を生成する。この場合の再生装置７０３の表示画像を生成する処理は、ホームサーバ１３ｃの処理と同様であるので、説明は省略する。再生装置７０３は、図示せぬHDMIケーブルを介して表示画像を変換装置１４に伝送する。

なお、この場合、コンテンツサーバ１２において、低解像度符号化ストリームの生成処理を省略することが可能である。

また、例えば、再生装置７０３が、配信サーバ７０１からの符号化ストリームの伝送の遅延の発生が予測される場合に、ホームサーバ１３ｂまたは１３ｃと同様の処理により、優先度をつけて各符号化ストリームの復号およびレンダリングを行うようにしてもよい。そして、例えば、再生装置７０３が、設定した優先度に従って、配信サーバ７０１に符号化ストリームの送信を要求するようにしてもよい。これにより、例えば、優先度Ｄに設定された符号化ストリームの伝送が停止され、符号化ストリームの伝送量が抑制されることにより、符号化ストリームの伝送の遅延が回避される。その結果、表示画像のリアルタイム性が保証され、表示画像の画質の低下を抑制することができる。

＜第５実施の形態＞
（画像表示システムの第３実施の形態の構成例）
図４０は、本開示を適用した画像表示システムの第３実施の形態の構成例を示すブロック図である。

図４０の画像表示システム８００は、送信部８０１および受信部８０２を備える。送信部８０１は、撮影部８１１、ストリーム生成部８１２、ストレージ８１３、および、伝送部８１４を備える。ストリーム生成部８１２は、形状データ生成部８２１、変換部８２２、および、符号化部８２３を備える。受信部８０２は、受け取り部８４１、ストレージ８４２、画像処理部８４３、描画部８４４、表示部８４５、カメラ８４６、および、視線検出部８４７を備える。画像処理部８４３は、復号部８５１および再構成部８５２を備える。

撮影部８１１は、複数の撮影カメラ（不図示）を備える。各撮影カメラは、受信部８０２において表示対象となるオブジェクト（以下、表示対象オブジェクトと称する）の周囲を取り囲むように配置され、複数の異なる視点（以下、撮影視点と称する）から表示対象オブジェクトを撮影する。撮影部８１１は、撮影の結果得られた複数の撮影視点からの視点画像である複数の撮影画像、および、各撮影画像の撮影視点に関する視点情報を含むメタデータ（以下、撮影視点メタデータと称する）を生成し、形状データ生成部８２１に供給する。

図４１は、撮影視点メタデータの例を示している。撮影視点メタデータは、例えば、各撮影画像の撮影に用いられた撮影カメラを識別するためのＩＤ、並びに、各撮影カメラのカメラ座標系のワールド座標系に対する回転ベクトルおよび並進ベクトルを含む。

形状データ生成部８２１は、各撮影視点の撮影画像に基づいて、表示対象オブジェクトの３次元の形状を高解像度に表す高解像度形状データを生成する。形状データ生成部８２１は、各撮影視点の撮影画像、高解像度形状データ、および、撮影視点メタデータを変換部８２２に供給する。

変換部８２２は、各撮影視点の撮影画像、高解像度形状データ、および、撮影視点メタデータに基づいて、表示対象オブジェクトを複数の異なる視点（以下、伝送視点と称する）から見た視点画像である複数のテクスチャ画像および複数のデプス画像を生成する。なお、後述するように、伝送視点は必ずしも撮影視点と一致するとは限らない。

また、変換部８２２は、各テクスチャ画像および各デプス画像の伝送視点に関する視点情報を含むメタデータ（以下、伝送視点メタデータと称する）を生成する。さらに、変換部８２２は、高解像度形状データの解像度を下げた低解像度形状データを生成する。変換部８２２は、各伝送視点のテクスチャ画像、各伝送視点のデプス画像、低解像度形状データ、および、伝送視点メタデータを符号化部８２３に供給する。

なお、伝送視点メタデータは、例えば、各テクスチャ画像および各デプス画像を識別するためのＩＤ、各テクスチャ画像および各デプス画像の伝送視点に対応する仮想のカメラのカメラ座標系のワールド座標系に対する回転ベクトルおよび並進ベクトルを含む。

符号化部８２３は、各テクスチャ画像を伝送視点毎に圧縮符号化し、各伝送視点にそれぞれ対応する複数のテクスチャストリームを生成する。また、符号化部８２３は、各デプス画像を伝送視点毎に圧縮符号化し、各伝送視点にそれぞれ対応する複数のデプストリームを生成する。さらに、符号化部８２３は、低解像度形状データの圧縮符号化を行い、形状ストリームを生成する。符号化部８２３は、テクスチャストリーム、デプスストリーム、形状ストリーム、および、伝送視点メタデータをストレージ８１３に供給する。

ストレージ８１３は、符号化部８２３から供給される各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを記憶する。

伝送部８１４は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータをストレージ８１３から読み出し、受信部８０２に送信する。

受信部８０２の受け取り部８４１は、送信部８０１から伝送されてくる各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを受け取り、ストレージ８４２に供給する。

ストレージ８４２は、受け取り部８４１から供給される各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを記憶する。

復号部８５１は、ストレージ８４２から各伝送視点のテクスチャストリームを読み出し、復号することにより、各伝送視点のテクスチャ画像を生成する。また、復号部８５１は、ストレージ８４２から各視点のデプスストリームを読み出し、復号することにより、各伝送視点のデプス画像を生成する。さらに、復号部８５１は、ストレージ８４２から形状ストリームを読み出し、復号することにより、低解像度形状データを生成する。復号部８５１は、各伝送視点のテクスチャ画像、各伝送視点のデプス画像、および、低解像度形状データを再構成部８５２に供給する。また、復号部８５１は、伝送視点メタデータをストレージ８４２から読み出し、再構成部８５２に供給する。

再構成部８５２は、各伝送視点のデプス画像および低解像度形状データに基づいて、高解像度形状データを生成する。このとき、再構成部８５２は、伝送視点メタデータ、視線検出部８４７から供給される仮想視点情報、および、外部から供給されるリソース情報に基づいて、必要に応じてデプス画像を間引きながら、高解像度形状データを生成する。

ここで、仮想視点とは、表示部８４５において表示する表示画像を生成する際の視点であり、例えば、表示部８４５を用いて表示画像を見る視聴者の視聴位置および視線方向に基づいて設定される。また、リソース情報は、画像処理部８４３および描画部８４４による再生処理に使用可能なハードウエアおよびソフトウエアのリソース（以下、再生リソースと称する）に関する情報を含む。再構成部８５２は、高解像度形状データを描画部８４４に供給する。

また、再構成部８５２は、伝送視点メタデータ、仮想視点情報およびリソース情報に基づいて、必要に応じてテクスチャ画像を間引き、残った（選択された）テクスチャ画像を描画部８４４に供給する。さらに、再構成部８５２は、伝送視点メタデータを描画部８４４に供給する。

描画部８４４は、高解像度形状データ、各伝送視点のテクスチャ画像、伝送視点メタデータ、および、視線検出部８４７から供給される仮想視点情報に基づいて、表示対象オブジェクトを仮想視点方向から見た場合の２次元の表示画像を生成する。描画部８４４は、表示画像を表示部８４５に供給する。

表示部８４５は、例えば、図１のヘッドマウントディスプレイ１５と同様のヘッドマウントディスプレイにより構成される。表示部８４５は、描画部８４４から供給される表示画像の表示を行う。また、表示部８４５は、例えば、ジャイロセンサ（不図示）等により検出される表示部８４５の傾き等の姿勢を検出し、検出した姿勢を示す姿勢情報を視線検出部８４７に供給する。

カメラ８４６は、例えば、図１のカメラ１３Ａと同様に、表示部８４５に付されているマーカの撮影を行い、得られた撮影画像を視線検出部８４７に供給する。

視線検出部８４７は、表示部８４５からの姿勢情報、および、カメラ８４６からの撮影画像に基づいて、仮想視点および視聴者の視野範囲を設定する。視線検出部８４７は、仮想視点および視野範囲を含む仮想視点情報を生成し、再構成部８５２および描画部８４４に供給する。

図４２は、図４０の変換部８２２の構成例を示している。変換部８２２は、視点設定部９０１、画像生成部９０２、および、解像度変換部９０３を備える。

視点設定部９０１は、各撮影視点の撮影画像、高解像度形状データ、および、撮影視点メタデータを形状データ生成部８２１から取得する。また、視点設定部９０１は、テクスチャ画像およびデプス画像を生成する伝送視点の設定を行い、設定した伝送視点に関する視点情報を含む伝送視点メタデータを生成する。視点設定部９０１は、各撮影視点の撮影画像、高解像度形状データ、撮影視点メタデータ、および、伝送視点メタデータを画像生成部９０２に供給する。また、視点設定部９０１は、伝送視点メタデータを符号化部８２３に供給する。

画像生成部９０２は、各撮影視点の撮影画像、高解像度形状データ、および、撮影視点メタデータに基づいて、各伝送視点に対応する複数のテクスチャ画像および複数のデプス画像を生成する。画像生成部９０２は、各伝送視点のテクスチャ画像および各伝送視点のデプス画像を符号化部８２３に供給する。

解像度変換部９０３は、高解像度形状データを形状データ生成部８２１から取得する。解像度変換部９０３は、高解像度形状データの解像度を下げることにより低解像度形状データを生成し、符号化部８２３に供給する。

図４３は、図４０の再構成部８５２の構成例を示している。再構成部８５２は、優先度設定部９５１、画像選択部９５２、および、形状復元部９５３を備える。

優先度設定部９５１は、伝送視点メタデータを復号部８５１から取得し、仮想視点情報を視線検出部８４７から取得する。優先度設定部９５１は、伝送視点メタデータおよび仮想視点情報に基づいて、各テクスチャストリーム（テクスチャ画像）間、および、各デプスストリーム（デプス画像）間の優先度を設定する。優先度設定部９５１は、設定した優先度を示す優先度情報を画像選択部９５２に供給する。

画像選択部９５２は、各伝送視点のテクスチャ画像、各伝送視点のデプス画像、低解像度形状データ、および、伝送視点メタデータを復号部８５１から取得し、リソース情報を外部から取得する。画像選択部９５２は、優先度情報およびリソース情報に基づいて、表示画像の生成に用いるテクスチャ画像およびデプス画像を選択する。画像選択部９５２は、選択したテクスチャ画像、および、伝送視点メタデータを描画部８４４に供給する。また、画像選択部９５２は、選択したデプス画像、低解像度形状データ、および、伝送視点メタデータを形状復元部９５３に供給する。

形状復元部９５３は、画像選択部９５２から供給されるデプス画像、低解像度形状データ、および、伝送視点メタデータに基づいて、高解像度形状データを生成する。形状復元部９５３は、高解像度形状データを描画部８４４に供給する。

（送信部８０１の処理の説明）
図４４は、図４０の送信部８０１のストリーム生成処理を説明するフローチャートである。このストリーム生成処理は、図４０の撮影部８１１の各撮影カメラが撮影を開始し、撮影画像および撮影視点メタデータの出力が開始されたとき、開始される。なお、各撮影カメラからは、撮影画像がフレーム単位で出力される。

なお、以下では、説明を分かりやすくするために、表示対象オブジェクトが１つの場合について説明する。

ステップＳ２０１において、形状データ生成部８２１は、形状データを生成する。具体的には、形状データ生成部８２１は、撮影部８１１から供給される各撮影視点の撮影画像、および、撮影視点メタデータに基づいて、表示対象オブジェクトの３次元の形状を高解像度に表す高解像度形状データを生成する。この高解像度形状データは、例えば、３次元のポリゴンメッシュまたはポイントクラウドからなる。形状データ生成部８２１は、各撮影視点の撮影画像、高解像度形状データ、および、撮影視点メタデータを視点設定部９０１に供給する。また、形状データ生成部８２１は、高解像度形状データを解像度変換部９０３に供給する。

ステップＳ２０２において、視点設定部９０１は、テクスチャ画像およびデプス画像を生成する視点（すなわち、伝送視点）を設定する。また、視点設定部９０１は、設定した伝送視点に関する視点情報を含む伝送視点メタデータを生成する。

なお、例えば、各伝送視点は、ユーザ設定等に基づいて設定される。また、各伝送視点は、撮影視点と一致していてもよいし、異なっていてもよい。さらに、伝送視点の数と撮影視点の数は、同じでもよいし、異なっていてもよい。また、テクスチャ画像を生成する伝送視点と、デプス画像を生成する伝送視点とは、一致していてもよいし、異なっていてもよい。さらに、テクスチャ画像を生成する伝送視点の数と、デプス画像を生成する伝送視点の数とは、同じでもよいし、異なっていてもよい。なお、通常は、テクスチャ画像を生成する伝送視点とデプス画像を生成する伝送視点とは、共通とされる。

視点設定部９０１は、各撮影視点の撮影画像、高解像度形状データ、撮影視点メタデータ、および、伝送視点メタデータを画像生成部９０２に供給する。また、視点設定部９０１は、伝送視点メタデータを符号化部８２３に供給する。

ステップＳ２０３において、画像生成部９０２は、テクスチャ画像およびデプス画像を生成する。具体的には、画像生成部９０２は、各撮影視点の撮影画像および撮影視点メタデータに基づいて、各伝送視点から表示対象オブジェクトを見た場合のテクスチャを表す複数のテクスチャ画像を生成する。なお、テクスチャ画像の生成方法には、任意の方法を採用することが可能である。また、例えば、撮影画像の撮影視点とテクスチャ画像を生成する伝送視点とが一致する場合、その撮影画像をそのままテクスチャ画像として用いることも可能である。

また、画像生成部９０２は、各撮影視点の撮影画像、高解像度形状データ、および、撮影視点メタデータに基づいて、伝送視点毎に、各伝送視点から各画素における表示対象オブジェクトまでの距離の逆数を画素値とする複数のデプス画像を生成する。なお、デプス画像の生成方法には、任意の方法を採用することが可能である。

画像生成部９０２は、各伝送視点のテクスチャ画像および各伝送視点のデプス画像を符号化部８２３に供給する。

ステップＳ２０４において、解像度変換部９０３は、形状データの解像度を下げる。すなわち、解像度変換部９０３は、高解像度形状データの解像度を下げることにより低解像度形状データを生成する。これにより、例えば、形状データの解像度がデプス画像より低くなり、形状データの容量が削減される。解像度変換部９０３は、低解像度形状データを符号化部８２３に供給する。

ステップＳ２０５において、符号化部８２３は、テクスチャ画像、デプス画像、および、形状データを圧縮符号化する。具体的には、符号化部８２３は、テクスチャ画像の圧縮符号化を伝送視点毎に行い、各伝送視点にそれぞれ対応する複数のテクスチャストリームを生成する。また、符号化部８２３は、デプス画像の圧縮符号化を伝送視点毎に行い、各伝送視点にそれぞれ対応する複数のデプストリームを生成する。さらに、符号化部８２３は、低解像度形状データの圧縮符号化を行い、形状ストリームを生成する。符号化部８２３は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータをストレージ８１３に供給する。ストレージ８１３は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを記憶する。

ステップＳ２０６において、伝送部８１４は、テクスチャストリーム、デプスストリーム、形状ストリーム、および、伝送視点メタデータを送信する。具体的には、伝送部８１４は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータをストレージ８１３から読み出す。そして、伝送部８１４は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを受信部８０２に送信する。

（受信部８０２の処理の説明）
図４５は、図４０の受信部８０２の再生処理を説明するフローチャートである。この再生処理は、例えば、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータが送信部８０１から伝送されてきたとき、開始される。

ステップＳ２３１において、受け取り部８４１は、テクスチャストリーム、デプスストリーム、形状ストリーム、および、伝送視点メタデータを受け取る。具体的には、受け取り部８４１は、送信部８０１から伝送されてきた各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを受け取る。受け取り部８４１は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータをストレージ８４２に供給する。ストレージ８４２は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータを記憶する。

ステップＳ２３２において、復号部８５１は、テクスチャストリーム、デプスストリーム、および、形状ストリームを復号する。具体的には、復号部８５１は、各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、形状ストリーム、および、伝送視点メタデータをストレージ８４２から読み出す。復号部８５１は、各伝送視点のテクスチャストリームの復号を行い、各伝送視点のテクスチャ画像を生成する。また、復号部８５１は、各伝送視点のデプスストリームの復号を行い、各伝送視点のデプス画像を生成する。さらに、復号部８５１は、形状ストリームの復号を行い、低解像度形状データを生成する。復号部８５１は、伝送視点メタデータを優先度設定部９５１に供給する。また、復号部８５１は、各伝送視点のテクスチャ画像、各伝送視点のデプス画像、低解像度形状データ、および、伝送視点メタデータを画像選択部９５２に供給する。

ステップＳ２３３において、受信部８０２は、仮想視点情報を取得する。具体的には、視線検出部８４７は、表示部８４５から姿勢情報を取得し、その姿勢情報に基づいて、ワールド座標系における視聴者の視線方向を検出する。また、視線検出部８４７は、カメラ８４６から撮影画像を取得し、その撮影画像に基づいて、ワールド座標系における視聴者の視聴位置を検出する。そして、視線検出部８４７は、視聴者の視聴位置と視線方向に基づいて、ワールド座標系における仮想視点を設定する。仮想視点は、ワールド座標系における視聴者の視点とほぼ一致する。また、視線検出部８４７は、視聴者の視聴位置と視線方向に基づいて視聴者の視野範囲を設定する。視線検出部８４７は、仮想視点および視野範囲を含む仮想視点情報を生成し、優先度設定部９５１および描画部８４４に供給する。

ステップＳ２３４において、優先度設定部９５１は、優先度を設定する。具体的には、優先度設定部９５１は、伝送視点メタデータおよび仮想視点情報に基づいて、テクスチャストリーム（テクスチャ画像）間、および、デプスストリーム（デプス画像）間の優先度を設定する。例えば、優先度設定部９５１は、伝送視点が仮想視点に近い順にテクスチャストリーム（テクスチャ画像）の優先度を設定する。同様に、優先度設定部９５１は、伝送視点が仮想視点に近い順にデプスストリーム（デプス画像）の優先度を設定する。

なお、伝送視点と仮想視点との間の近さを測る基準には、例えば、２つの視点間のユークリッド距離、２つの視点間の視線方向の角度、または、それらの２つの基準を複合した基準等が用いられる。

優先度設定部９５１は、設定した優先度を示す優先度情報を画像選択部９５２に供給する。

ステップＳ２３５において、画像選択部９５２は、表示画像の生成に用いる画像を選択する。具体的には、画像選択部９５２は、外部から供給されるリソース情報を取得する。画像選択部９５２は、リソース情報に示される再生リソースに基づいて、表示画像の生成に用いるテクスチャ画像（テクスチャストリーム）の数（以下、使用画像数と称する）、および、表示画像の生成に用いるデプス画像（デプスストリーム）の数（使用画像数）を設定する。

なお、再生リソースが大きいほど使用画像数は多くなり、再生リソースが小さいほど使用画像数は少なくなる。また、再生リソースが十分に大きい場合、例えば、テクスチャ画像およびデプス画像の使用画像数を、各画像の総数と同じ値に設定し、全ての伝送視点のテクスチャ画像およびデプス画像を表示画像に用いるようにしてもよい。

そして、画像選択部９５２は、各伝送視点のテクスチャ画像の中から、優先度が高い方から順に使用画像数のテクスチャ画像を選択する。同様に、画像選択部９５２は、各伝送視点のデプス画像の中から、優先度が高い方から順に使用画像数のデプス画像を選択する。

ここで、図４６を参照して、画像の選択方法の具体例について説明する。

図４６の伝送視点１００１－１乃至伝送視点１００１－ｎは、表示対象となるオブジェクト１００３のデプス画像の生成に用いられた伝送視点を示している。

例えば、優先度設定部９５１は、対応する伝送視点１００１－１乃至伝送視点１００１－ｎが仮想視点１００２から近い順に、各デプスストリーム（デプス画像）間の優先度を設定する。そして、例えば、使用画像数が４に設定されている場合、画像選択部９５２は、優先度が１番から４番までのデプスストリームから生成されたデプス画像を選択する。例えば、図４６の右側の図に示されるように、伝送視点１００１－４、伝送視点１００１－５、伝送視点１００１－６、および、伝送視点１００１－７の４視点に対応するデプス画像が選択される。

画像選択部９５２は、選択したテクスチャ画像、および、伝送視点メタデータを描画部８４４に供給する。また、画像選択部９５２は、選択したデプス画像、低解像度形状データ、および、伝送視点メタデータを形状復元部９５３に供給する。

なお、テクスチャ画像の使用画像数とデプス画像の使用画像数は、必ずしも同じでなくてもよい。例えば、一般的に人は形状に対する識別力より色に対する識別力の方が高いため、テクスチャ画像の使用画像数がデプス画像の使用画像数より多く設定される。

ステップＳ２３６において、形状復元部９５３は、形状データの復元を行う。具体的には、形状復元部９５３は、低解像度形状データと画像選択部９５２により選択されたデプス画像とを、伝送視点メタデータを用いて統合することにより、高解像度形状データを復元する。

ここで、図４７乃至図５１を参照して、低解像度形状データとデプス画像の統合方法の例について説明する。例えば、図４７の伝送視点１００１からオブジェクト１０２１を見た場合のデプス画像を用いて、仮想視点１００２から見た形状データを復元する場合を例に挙げて説明する。

まず、図４８を参照して第１の統合方法について説明する。

図４８のデプス画像１０３１は、図４７の伝送視点１００１からオブジェクト１０２１を見た場合のデプス画像である。

そして、デプス画像１０３１に対する視点を伝送視点１００１から仮想視点１００２に変換することにより、仮想視点１００２からオブジェクト１０２１を見た場合の仮想視点デプス画像１０３２が生成される。仮想視点デプス画像１０３２では、例えば、伝送視点１００１から死角となり見えない左側の三日月形の領域（以下、死角領域と称する）の画素値が０に設定される。

一方、仮想視点１００２から見た低解像度形状データ１０３３に基づいて、仮想視点１００２からオブジェクト１０２１を見た場合の仮想視点デプス画像１０３４が生成される。なお、仮想視点デプス画像１０３４は、デプス画像１０３１および仮想視点デプス画像１０３２より解像度が低い。

なお、以下、解像度の差を明確にするために、デプス画像１０３１および仮想視点デプス画像１０３２を、それぞれ高解像度デプス画像１０３１および高解像度仮想視点デプス画像１０３２と称し、仮想視点デプス画像１０３４を低解像度仮想視点デプス画像１０３４と称する。

次に、低解像度仮想視点デプス画像１０３４に、高解像度仮想視点デプス画像１０３２の死角領域以外の部分が重畳されることにより、高解像度仮想視点デプス画像１０３５が生成される。高解像度仮想視点デプス画像１０３５では、高解像度仮想視点デプス画像１０３２の死角領域に対応する領域が低解像度になり、それ以外の領域が高解像度になる。また、高解像度仮想視点デプス画像１０３５の高解像度領域と低解像度領域の繋ぎ目は、例えば、高解像度仮想視点デプス画像１０３２と低解像度仮想視点デプス画像１０３４とを合成したものとなる。

そして、画像選択部９５２により選択された他のデプス画像も低解像度仮想視点デプス画像１０３４に重畳され、得られた高解像度仮想視点デプス画像に基づいて、３次元のポリゴンメッシュからなる高解像度形状データが生成される。

次に、図４９乃至図５１を参照して第２の統合方法について説明する。

まず、図４９に示されるように、高解像度デプス画像１０３１に基づいて、仮想視点１００２からオブジェクト１０２１を見た場合の高解像度ポリゴンメッシュ１０４１が生成される。

一方、低解像度ポリゴンメッシュ１０４２は、仮想視点１００２からオブジェクト１０２１を見た場合の低解像度形状データである。そして、低解像度ポリゴンメッシュ１０４２に高解像度ポリゴンメッシュ１０４１を合成することにより、高解像度ポリゴンメッシュ１０４３が生成される。従って、高解像度ポリゴンメッシュ１０４３では、高解像度ポリゴンメッシュ１０４１に対応する領域が高解像度になり、それ以外の領域が低解像度になる。

ここで、図５０および図５１を参照して、低解像度ポリゴンメッシュ１０４２と高解像度ポリゴンメッシュ１０４１の合成方法の例について説明する。

図５０の例では、低解像度ポリゴンメッシュ１０４２の高解像度ポリゴンメッシュ１０４１と重なる領域が、高解像度ポリゴンメッシュ１０４１に挿げ替えられる。このとき、高解像度ポリゴンメッシュ１０４１と低解像度ポリゴンメッシュ１０４２の境界付近の切れ目が、ポリゴンのエッジを用いて接続される。

図５１の例では、低解像度ポリゴンメッシュ１０４２に高解像度ポリゴンメッシュ１０４１が重畳される。このとき、低解像度ポリゴンメッシュ１０４２の高解像度ポリゴンメッシュ１０４１と重なる領域が、高解像度ポリゴンメッシュ１０４１の裏側に押し込まれる。

そして、画像選択部９５２により選択された他のデプス画像に基づいて生成された高解像度ポリゴンメッシュも低解像度ポリゴンメッシュ１０４２に合成されることにより、３次元のポリゴンメッシュからなる高解像度形状データが生成される。

以上のようにして、画像選択部９５２により選択されたデプス画像と低解像度形状データとが統合されることにより、高解像度形状データが生成される。

このとき、再生リソースが大きく、使用するデプス画像が多くなるほど、高解像度形状データにおける高解像度領域が広くなる。一方、再生リソースが小さく、使用するデプス画像が少なくなるほど、高解像度形状データにおける高解像度領域が狭くなる。

例えば、図５２は、再生リソースが大きく、低解像度形状データ１０６１と、全ての伝送視点のデプス画像１０６２－１乃至デプス画像１０６２－４とを用いて、高解像度形状データ１０６３ａが生成される場合を示している。この場合、高解像度形状データ１０６３ａのほぼ全周が高解像度となり、受信部８０２の解像度変換部９０３で解像度を下げる前の高解像度形状データとほぼ同様の形状データが復元される。

一方、図５３は、再生リソースが小さく、低解像度形状データ１０６１と、仮想視点に近い伝送視点に対応するデプス画像１０６２－１およびデプス画像１０６２－４のみを用いて、高解像度形状データ１０６３ｂが生成される場合を示している。この場合、高解像度形状データ１０６３ｂは、仮想視点から見える領域付近が高解像度になり、他の領域は低解像度になる。

そして、形状復元部９５３は、生成した高解像度形状データを描画部８４４に供給する。

ステップＳ２３７において、描画部８４４は、描画処理を行う。例えば、描画部８４４は、高解像度形状データおよび伝送視点メタデータに基づいて、テクスチャ画像を用いて、高解像度形状データに色情報を付与する。そして、描画部８４４は、色情報を付与した高解像度形状データを、仮想視点から視野範囲に透視投影することにより、表示画像を生成する。描画部８４４は、表示画像を表示部８４５に供給する。

ステップＳ２３８において、表示部８４５は、表示画像に基づく画像を表示する。

以上のようにして、表示対象オブジェクトの周囲を取り囲むように配置された撮像カメラにより撮影された撮影画像に基づいて、任意の仮想視点からの表示画像を生成し、表示させることができる。

また、仮想視点および再生リソースに基づいて、表示画像の生成に用いられるテクスチャ画像およびデプス画像が適宜間引かれるため、再生処理の負荷が軽減される。これにより、再生リソースが少なくても、表示画像がスムーズに表示されるようになる。また、仮想視点から見える領域のテクスチャ画像およびデプス画像が優先して残されるため、視聴者の視野範囲の画像の画質の低下を抑制される。

さらに、デプス画像は、３次元の高解像度形状データと比較してデータ量が少ない。従って、高解像度の形状ストリームの代わりに、各伝送視点のデプスストリームおよび低解像度の形状ストリームを伝送することにより、送信部８０１と受信部８０２の間のデータの伝送量を削減することができる。

なお、以上の例では、表示対象オブジェクトが１つの場合の例について説明したが、表示対象オブジェクトが複数の場合にも同様の処理が行われる。表示対象オブジェクトが複数の場合、例えば、送信部８０１において、表示対象オブジェクト毎に各伝送視点のテクスチャストリーム、各伝送視点のデプスストリーム、および、低解像度の形状ストリームが生成され、受信部８０２に送信される。

なお、現実のオブジェクト間の位置関係等により、１つの表示対象オブジェクトが、複数の現実のオブジェクトを含む場合がある。例えば、人が椅子に座っている場合、１つの表示対象オブジェクトに人と椅子が含まれる。

＜変形例＞
以下、上述した本開示の実施の形態の変形例について説明する。

図５４は、第１レイヤのテクスチャ画像の他の例を示す図である。

上述した説明では、第１レイヤの各面のテクスチャ画像は、１つの視点Ｏのテクスチャ画像であったが、視点Ｏに対応する左目用の視点と右目用の視点のテクスチャ画像が合成されたものであってもよい。

具体的には、図５４のＡに示すように、第１レイヤの各面のテクスチャ画像は、例えば、視点Ｏに対応する左目用の視点の第１レイヤの各面のテクスチャ画像１１０１と、右目用の視点の第１レイヤの各面のテクスチャ画像１１０２が、横方向（水平方向）にパッキングされたパッキング画像１１００であってもよい。

また、図５４のＢに示すように、第１レイヤの各面のテクスチャ画像は、例えば、テクスチャ画像１１０１とテクスチャ画像１１０２が、縦方向（垂直方向）にパッキングされたパッキング画像１１１０であってもよい。

同様に、第２レイヤの各面のテクスチャ画像は、その面の１つの第２レイヤの視点に対応する左目用の視点の第２レイヤのテクスチャ画像と、右目用の視点の第２レイヤのテクスチャ画像が横方向または縦方向にパッキングされたパッキン画像であってもよい。

以上のように、第１レイヤおよび第２レイヤの各面のテクスチャ画像が左目用の視点と右目用の視点の画像をパッキングしたテクスチャ画像である場合、復号の結果得られるテクスチャ画像が、左目用の視点のテクスチャ画像と右目用の視点のテクスチャ画像に分離される。そして、第１レイヤおよび第２レイヤについて、左目用の３次元データと右目用の３次元データが生成される。

そして、視聴者の視聴方向および視聴位置に対応する左目の視聴方向および視聴位置基づいて、左目用の３次元データから左目用の表示画像が生成される。また、視聴者の視聴方向および視聴位置に対応する右目の視聴方向および視聴位置に基づいて、右目用の３次元データから右目用の表示画像が生成される。そして、ヘッドマウントディスプレイ１５が３Ｄ表示可能である場合、ヘッドマウントディスプレイ１５は、左目用の表示画像を左目用の画像として表示し、右目用の表示画像を右目用の画像として表示することにより、表示画像を３Ｄ表示する。

なお、第１乃至第４実施の形態では、撮影画像が正八面体にマッピングされることにより全天球画像が生成されたが、撮影画像がマッピングされる３Ｄモデルは、正八面体のほか、球や立方体などにすることができる。撮影画像が球にマッピングされる場合、全天球画像は、例えば、撮影画像がマッピングされた球の正距円筒図法による画像である。

また、第１乃至第４実施の形態では、立方体を構成する６つの面に全天球画像を透視投影することによりテクスチャ画像およびデプス画像が生成されたが、立方体以外の異なる形の面に透視投影することにより、テクスチャ画像およびデプス画像が生成されてもよい。

さらに、低解像度テクスチャストリームと低解像度デプスストリームは生成されなくてもよい。第１レイヤおよび第２レイヤのデプス画像は生成されなくてもよい。また、第２レイヤのテクスチャ画像とデプス画像は、重要な被写体の撮影画像がマッピングされる一部の面に対してのみ生成されるようにしてもよい。

また、低解像度テクスチャ画像および低解像度デプス画像も、高解像度のテクスチャ画像およびデプス画像と同様に、階層化して生成されてもよい。

さらに、テクスチャ画像とデプス画像のレイヤ数が３以上であってもよい。例えば、第１レイヤおよび第２レイヤと異なる視点から全天球画像を透視投影することにより、第３レイヤ以降のレイヤのテクスチャ画像とデプス画像が生成されてもよい。

また、レイヤ間の依存関係がないように各レイヤの画像が生成されてもよい。例えば、全天球画像における視点を中心とした立方体を構成する６つの面に対応する画像が、それぞれ視点からの複数の距離毎に階層化して生成されてもよい。例えば、全天球画像を所定の面にマッピングする場合に、視点からの全ての被写体をマッピングした画像、視点からの距離が第１の距離以上の被写体のみをマッピングした画像、視点からの距離が第２の距離（＞第１の距離）以上の被写体のみをマッピングした画像・・・により、当該面に対応する複数のレイヤの画像が生成されてもよい。

また、以上の説明では、表示画像等の２次元の画像の生成に透視投影を用いる例を示したが、透視投影以外の投影方法を用いるようにしてもよい。例えば、図５５および図５６に示されるtan軸投影を用いることが可能である。

この例では、３Ｄモデルの３次元のxyz座標系において、ｚが-1.0である投影面１１２１が設定されている。この場合、投影面１１２１の中心Ｏ´を原点とし、投影面１１２１の水平方向をｓ方向とし、垂直方向をｔ方向とする２次元のst座標系が、投影面１１２１の座標系となる。

なお、以下では、xyz座標系の原点Ｏからst座標系の座標(s,t)に向かうベクトル１１２２を、座標(s,t)と、原点Ｏから投影面１１２１までの距離である-1.0とを用いて、ベクトル(s,t,-1.0)という。

図５６は、tan軸投影（正接軸投影）を説明する図である。

図５６は、投影面１１２１をｚの負方向に見た図である。図５６の例では、st座標系において、投影面１１２１のｓ値およびｔ値の最小値は-1.0であり、最大値は1.0である。

この場合、透視投影では、原点Ｏから投影面１１２１上の投影点に向かう投影ベクトルがベクトル（s´,t´-1.0）となるように、投影面１１２１上に投影点が設定される。なお、ｓ´は、-1.0から1.0までのｓ値の範囲に設けられた所定の間隔ごとの値であり、ｔ´は-1.0から1.0までのｔ値の範囲に設けられた所定の間隔ごとの値である。従って、透視投影における投影点は、投影面１１２１上で均一である。

これに対して、投影面１１２１の画角をθｗ（図５６の例ではπ／２）とすると、tan軸投影では、投影ベクトルがベクトル(tan(s´*θｗ/2), tan(t´*θｗ/2), -1.0)となるように、投影面１１２１上に投影点が設定される。

具体的には、ベクトル(tan(s´*θｗ/2), tan(t´*θｗ/2), -1.0)は、s´*θｗ/2をθとし、t´*θｗ/2をφとすると、ベクトル(tanθ，tanφ，-1.0)になる。このとき、画角θｗがπに近付くと、tanθやtanφは無限大に発散する。従って、tanθやtanφが無限大に発散しないように、ベクトル(tanθ，tanφ，-1.0)が、ベクトル(sinθ*cosφ, cosθ*sinφ, -cosθ*cosφ)に補正され、投影ベクトルがベクトル(sinθ*cosφ, cosθ*sinφ, -cosθ*cosφ)となるように、投影面１１２１上に投影点が設定される。従って、tan軸投影では、隣り合う投影点に対応する投影ベクトルどうしがなす角が同一になる。

なお、対数軸（ログスケール）と同様に、tan(s´*θｗ/2), tan(t´*θｗ/2)は、tan軸のs´,t´であると捉えられる。従って、本明細書では、投影ベクトルがベクトル(tan(s´*θｗ/2), tan(t´*θｗ/2), -1.0)となる投影を、tan軸投影と称している。

さらに、例えば、第２および第３の実施の形態において、各符号化ストリームに割り当てる優先度Ａ乃至Ｄの比率が可変であってもよい。例えば、ホームサーバ１３ｂまたは１３ｃの優先度設定部５１１は、ホームサーバ１３ｂ若しくは１３ｃの処理能力や負荷、または各符号化ストリームの復号処理の進捗状況等に応じて、優先度の比率を可変にしてもよい。例えば、優先度設定部５１１は、ホームサーバ１３ｂまたは１３ｃの負荷が低い場合には、優先度Ａに設定する符号化ストリームの割合を増やし、ホームサーバ１３ｂまたは１３ｃの負荷が高い場合には、優先度Ｄに設定する符号化ストリームの割合を増やしてもよい。

また、図３５の優先度の分類方法は、その一例であり、任意に変更することが可能である。例えば、優先度が２種類、３種類、または５種類以上に分類されてもよい。

さらに、例えば、第２および第３の実施の形態は、全天球画像以外の２以上の異なる方向の画像に対応する複数の符号化ストリームの復号およびレンダリングを、符号化ストリーム間で優先度をつけて行う場合にも適用することができる。また、例えば、第２および第３の実施の形態は、同じ方向の異なるレイヤの画像に対応する複数の符号化ストリームの復号およびレンダリングを、レイヤ間で優先度をつけて行う場合にも適用することができる。

また、図３７のスコア算出テーブルは、任意に変更することが可能である。例えば、加算要因の種類を増減したり、基準値や重み係数を変更したりすることが可能である。

さらに、各優先度におけるピクチャの間引き方法は、任意に変更することが可能である。また、低解像度符号化ストリームにおいて、ピクチャの間引きが行われてもよい。

また、上述した第５実施の形態では、画像選択部９５２において、テクスチャ画像およびデプス画像を間引く例を説明したが、復号部８５１において間引き処理を行ってもよい。例えば、復号部８５１が、優先度に従って、復号するテクスチャストリームおよびデプスストリームを選択し、選択したテクスチャストリームおよびデプスストリームのみを復号するようにしてもよい。

また、例えば、受信部８０２側でなく、送信部８０１側で間引き処理を行ってもよい。

この場合、例えば、仮想視点情報または優先度情報のうち少なくとも１つとリソース情報とが、受信部８０２から送信部８０１に送信される。そして、例えば、送信部８０１の視点設定部９０１が、仮想視点または優先度と再生リソースとに基づいて、テクスチャ画像およびデプス画像を生成する伝送視点を選択する。例えば、視点設定部９０１は、再生リソースに基づいて使用する伝送視点の数を設定するともに、受信した優先度に基づいて、或いは、仮想視点に基づいて設定される優先度に基づいて、複数の伝送視点の中から、設定した数の伝送視点を選択する。

そして、例えば、選択された伝送視点のテクスチャ画像およびデプス画像のみが生成されることにより、テクスチャ画像およびデプス画像の間引きが行われる。また、送信部８０１から受信部８０２に伝送されるテクスチャストリームおよびデプスストリームの数が削減され、送信部８０１と受信部８０２の間のデータの伝送量が削減される。

或いは、例えば、全ての伝送視点のテクスチャ画像およびデプス画像を生成するようにして、符号化部８２３が、仮想視点または優先度と再生リソースとに基づいて伝送視点を選択し、選択した伝送視点に対応するテクスチャ画像およびデプス画像のみを圧縮符号化し、テクスチャストリームおよびデプスストリームを生成するようにしてもよい。

或いは、例えば、全ての伝送視点のテクスチャストリームおよびデプスストリームを生成するようにして、伝送部８１４が、仮想視点または優先度と再生リソースとに基づいて伝送視点を選択し、選択した伝送視点に対応するテクスチャストリームおよびデプスストリームのみを受信部８０２に送信するようにしてもよい。

なお、送信部８０１側で間引き処理を行う場合、再生リソースに加えて、或いは、再生リソースの代わりに、送信部８０１と受信部８０２の間の伝送路の状況に基づいて、間引き処理を行うようにしてもよい。例えば、送信部８０１は、上述した間引き処理を行うことにより、使用可能な伝送路の容量が大きくなるほど、伝送する符号化ストリームの数を増やし、使用可能な伝送路の容量が小さくなるほど、伝送する符号化ストリームの数を減らすようにしてもよい。

また、送信側の間引き処理は、例えば、上述した第２実施の形態又は第３実施の形態にも適用することができる。例えば、第２実施の形態又は第３実施の形態では、優先度をつけて各符号化ストリームの復号およびレンダリングを行うことにより、復号またはレンダリングするピクチャを間引く例を示したが、例えば、コンテンツサーバ１２において、生成又は伝送する符号化ストリームを間引くようにしてもよい。例えば、コンテンツサーバ１２が、優先度Ｄの符号化ストリームの生成または伝送を停止したり、優先度Ｂまたは優先度Ｃの符号化ストリームに含めるピクチャを間引くようにしてもよい。

なお、送信側（例えば、送信部８０１）で設定した優先度、又は、画像若しくは符号化ストリームの選択結果を再生側（例えば、受信部８０２）に送信し、再生側で、送信側から取得した情報に基づいて、間引き処理を行うようにしてもよい。

さらに、例えば、第５実施の形態において、送信部８０１のストリーム生成部８１２が、仮想視点に対応する表示画像を生成し、表示画像を圧縮符号化した表示画像ストリームを生成し、受信部８０２に送信するようにしてもよい。

また、第５実施の形態では、必ずしも表示対象オブジェクトの全周を囲む３次元の形状データを生成する必要はない。例えば、仮想視点が設定される範囲が限定されている場合、３次元の形状データは、少なくともその範囲内の視点から見える領域を含んでいればよい。

さらに、以上の説明では、第５実施の形態において、高解像度形状データからデプス画像を生成する例を示したが、例えば、ＴｏＦカメラ等のデプスの検出が可能なカメラを用いて、デプス画像を取得するようにしてもよい。

また、第５実施の形態において、例えば、視聴者の視線や視聴位置に基づかずに、仮想視点を設定するようにしてもよい。例えば、予め設定された位置に仮想視点を設定するようにしてもよい。

＜応用例＞
（本開示を適用したコンピュータの説明）
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図５７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータ１２００において、CPU（Central Processing Unit）１２０１，ROM（Read Only Memory）１２０２，RAM（Random Access Memory）１２０３は、バス１２０４により相互に接続されている。

バス１２０４には、さらに、入出力インタフェース１２０５が接続されている。入出力インタフェース１２０５には、入力部１２０６、出力部１２０７、記憶部１２０８、通信部１２０９、及びドライブ１２１０が接続されている。

入力部１２０６は、キーボード、マウス、マイクロフォンなどよりなる。出力部１２０７は、ディスプレイ、スピーカなどよりなる。記憶部１２０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部１２０９は、ネットワークインタフェースなどよりなる。ドライブ１２１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア１２１１を駆動する。

以上のように構成されるコンピュータ１２００では、CPU１２０１が、例えば、記憶部１２０８に記憶されているプログラムを、入出力インタフェース１２０５及びバス１２０４を介して、RAM１２０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ１２００（CPU１２０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１２１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータ１２００では、プログラムは、リムーバブルメディア１２１１をドライブ１２１０に装着することにより、入出力インタフェース１２０５を介して、記憶部１２０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１２０９で受信し、記憶部１２０８にインストールすることができる。その他、プログラムは、ROM１２０２や記憶部１２０８に、あらかじめインストールしておくことができる。

なお、コンピュータ１２００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

（移動体制御システムへの適用例）
また、本開示に係る技術は、様々な製品へ応用することができる。例えば、本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット、建設機械、農業機械（トラクター）などのいずれかの種類の移動体に搭載される装置として実現されてもよい。

図５８は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システム７０００の概略的な構成例を示すブロック図である。車両制御システム７０００は、通信ネットワーク７０１０を介して接続された複数の電子制御ユニットを備える。図５８に示した例では、車両制御システム７０００は、駆動系制御ユニット７１００、ボディ系制御ユニット７２００、バッテリ制御ユニット７３００、車外情報検出ユニット７４００、車内情報検出ユニット７５００、及び統合制御ユニット７６００を備える。これらの複数の制御ユニットを接続する通信ネットワーク７０１０は、例えば、ＣＡＮ（Controller Area Network）、ＬＩＮ（Local Interconnect Network）、ＬＡＮ（Local Area Network）又はＦｌｅｘＲａｙ（登録商標）等の任意の規格に準拠した車載通信ネットワークであってよい。

各制御ユニットは、各種プログラムにしたがって演算処理を行うマイクロコンピュータと、マイクロコンピュータにより実行されるプログラム又は各種演算に用いられるパラメータ等を記憶する記憶部と、各種制御対象の装置を駆動する駆動回路とを備える。各制御ユニットは、通信ネットワーク７０１０を介して他の制御ユニットとの間で通信を行うためのネットワークＩ／Ｆを備えるとともに、車内外の装置又はセンサ等との間で、有線通信又は無線通信により通信を行うための通信Ｉ／Ｆを備える。図５８では、統合制御ユニット７６００の機能構成として、マイクロコンピュータ７６１０、汎用通信Ｉ／Ｆ７６２０、専用通信Ｉ／Ｆ７６３０、測位部７６４０、ビーコン受信部７６５０、車内機器Ｉ／Ｆ７６６０、音声画像出力部７６７０、車載ネットワークＩ／Ｆ７６８０及び記憶部７６９０が図示されている。他の制御ユニットも同様に、マイクロコンピュータ、通信Ｉ／Ｆ及び記憶部等を備える。

駆動系制御ユニット７１００は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット７１００は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。駆動系制御ユニット７１００は、ＡＢＳ（Antilock Brake System）又はＥＳＣ（Electronic Stability Control）等の制御装置としての機能を有してもよい。

駆動系制御ユニット７１００には、車両状態検出部７１１０が接続される。車両状態検出部７１１０には、例えば、車体の軸回転運動の角速度を検出するジャイロセンサ、車両の加速度を検出する加速度センサ、あるいは、アクセルペダルの操作量、ブレーキペダルの操作量、ステアリングホイールの操舵角、エンジン回転数又は車輪の回転速度等を検出するためのセンサのうちの少なくとも一つが含まれる。駆動系制御ユニット７１００は、車両状態検出部７１１０から入力される信号を用いて演算処理を行い、内燃機関、駆動用モータ、電動パワーステアリング装置又はブレーキ装置等を制御する。

ボディ系制御ユニット７２００は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット７２００は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット７２００には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット７２００は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。

バッテリ制御ユニット７３００は、各種プログラムにしたがって駆動用モータの電力供給源である二次電池７３１０を制御する。例えば、バッテリ制御ユニット７３００には、二次電池７３１０を備えたバッテリ装置から、バッテリ温度、バッテリ出力電圧又はバッテリの残存容量等の情報が入力される。バッテリ制御ユニット７３００は、これらの信号を用いて演算処理を行い、二次電池７３１０の温度調節制御又はバッテリ装置に備えられた冷却装置等の制御を行う。

車外情報検出ユニット７４００は、車両制御システム７０００を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット７４００には、撮像部７４１０及び車外情報検出部７４２０のうちの少なくとも一方が接続される。撮像部７４１０には、ＴｏＦ（Time Of Flight）カメラ、ステレオカメラ、単眼カメラ、赤外線カメラ及びその他のカメラのうちの少なくとも一つが含まれる。車外情報検出部７４２０には、例えば、現在の天候又は気象を検出するための環境センサ、あるいは、車両制御システム７０００を搭載した車両の周囲の他の車両、障害物又は歩行者等を検出するための周囲情報検出センサのうちの少なくとも一つが含まれる。

環境センサは、例えば、雨天を検出する雨滴センサ、霧を検出する霧センサ、日照度合いを検出する日照センサ、及び降雪を検出する雪センサのうちの少なくとも一つであってよい。周囲情報検出センサは、超音波センサ、レーダ装置及びＬＩＤＡＲ（Light Detection and Ranging、Laser Imaging Detection and Ranging）装置のうちの少なくとも一つであってよい。これらの撮像部７４１０及び車外情報検出部７４２０は、それぞれ独立したセンサないし装置として備えられてもよいし、複数のセンサないし装置が統合された装置として備えられてもよい。

ここで、図５９は、撮像部７４１０及び車外情報検出部７４２０の設置位置の例を示す。撮像部７９１０，７９１２，７９１４，７９１６，７９１８は、例えば、車両７９００のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部のうちの少なくとも一つの位置に設けられる。フロントノーズに備えられる撮像部７９１０及び車室内のフロントガラスの上部に備えられる撮像部７９１８は、主として車両７９００の前方の画像を取得する。サイドミラーに備えられる撮像部７９１２，７９１４は、主として車両７９００の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部７９１６は、主として車両７９００の後方の画像を取得する。車室内のフロントガラスの上部に備えられる撮像部７９１８は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。

なお、図５９には、それぞれの撮像部７９１０，７９１２，７９１４，７９１６の撮影範囲の一例が示されている。撮像範囲ａは、フロントノーズに設けられた撮像部７９１０の撮像範囲を示し、撮像範囲ｂ，ｃは、それぞれサイドミラーに設けられた撮像部７９１２，７９１４の撮像範囲を示し、撮像範囲ｄは、リアバンパ又はバックドアに設けられた撮像部７９１６の撮像範囲を示す。例えば、撮像部７９１０，７９１２，７９１４，７９１６で撮像された画像データが重ね合わせられることにより、車両７９００を上方から見た俯瞰画像が得られる。

車両７９００のフロント、リア、サイド、コーナ及び車室内のフロントガラスの上部に設けられる車外情報検出部７９２０，７９２２，７９２４，７９２６，７９２８，７９３０は、例えば超音波センサ又はレーダ装置であってよい。車両７９００のフロントノーズ、リアバンパ、バックドア及び車室内のフロントガラスの上部に設けられる車外情報検出部７９２０，７９２６，７９３０は、例えばＬＩＤＡＲ装置であってよい。これらの車外情報検出部７９２０～７９３０は、主として先行車両、歩行者又は障害物等の検出に用いられる。

図５８に戻って説明を続ける。車外情報検出ユニット７４００は、撮像部７４１０に車外の画像を撮像させるとともに、撮像された画像データを受信する。また、車外情報検出ユニット７４００は、接続されている車外情報検出部７４２０から検出情報を受信する。車外情報検出部７４２０が超音波センサ、レーダ装置又はＬＩＤＡＲ装置である場合には、車外情報検出ユニット７４００は、超音波又は電磁波等を発信させるとともに、受信された反射波の情報を受信する。車外情報検出ユニット７４００は、受信した情報に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。車外情報検出ユニット７４００は、受信した情報に基づいて、降雨、霧又は路面状況等を認識する環境認識処理を行ってもよい。車外情報検出ユニット７４００は、受信した情報に基づいて、車外の物体までの距離を算出してもよい。

また、車外情報検出ユニット７４００は、受信した画像データに基づいて、人、車、障害物、標識又は路面上の文字等を認識する画像認識処理又は距離検出処理を行ってもよい。車外情報検出ユニット７４００は、受信した画像データに対して歪補正又は位置合わせ等の処理を行うとともに、異なる撮像部７４１０により撮像された画像データを合成して、俯瞰画像又はパノラマ画像を生成してもよい。車外情報検出ユニット７４００は、異なる撮像部７４１０により撮像された画像データを用いて、視点変換処理を行ってもよい。

車内情報検出ユニット７５００は、車内の情報を検出する。車内情報検出ユニット７５００には、例えば、運転者の状態を検出する運転者状態検出部７５１０が接続される。運転者状態検出部７５１０は、運転者を撮像するカメラ、運転者の生体情報を検出する生体センサ又は車室内の音声を集音するマイク等を含んでもよい。生体センサは、例えば、座面又はステアリングホイール等に設けられ、座席に座った搭乗者又はステアリングホイールを握る運転者の生体情報を検出する。車内情報検出ユニット７５００は、運転者状態検出部７５１０から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。車内情報検出ユニット７５００は、集音された音声信号に対してノイズキャンセリング処理等の処理を行ってもよい。

統合制御ユニット７６００は、各種プログラムにしたがって車両制御システム７０００内の動作全般を制御する。統合制御ユニット７６００には、入力部７８００が接続されている。入力部７８００は、例えば、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等、搭乗者によって入力操作され得る装置によって実現される。統合制御ユニット７６００には、マイクロフォンにより入力される音声を音声認識することにより得たデータが入力されてもよい。入力部７８００は、例えば、赤外線又はその他の電波を利用したリモートコントロール装置であってもよいし、車両制御システム７０００の操作に対応した携帯電話又はＰＤＡ（Personal Digital Assistant）等の外部接続機器であってもよい。入力部７８００は、例えばカメラであってもよく、その場合搭乗者はジェスチャにより情報を入力することができる。あるいは、搭乗者が装着したウェアラブル装置の動きを検出することで得られたデータが入力されてもよい。さらに、入力部７８００は、例えば、上記の入力部７８００を用いて搭乗者等により入力された情報に基づいて入力信号を生成し、統合制御ユニット７６００に出力する入力制御回路などを含んでもよい。搭乗者等は、この入力部７８００を操作することにより、車両制御システム７０００に対して各種のデータを入力したり処理動作を指示したりする。

記憶部７６９０は、マイクロコンピュータにより実行される各種プログラムを記憶するＲＯＭ（Read Only Memory）、及び各種パラメータ、演算結果又はセンサ値等を記憶するＲＡＭ（Random Access Memory）を含んでいてもよい。また、記憶部７６９０は、ＨＤＤ（Hard Disc Drive）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等によって実現してもよい。

汎用通信Ｉ／Ｆ７６２０は、外部環境７７５０に存在する様々な機器との間の通信を仲介する汎用的な通信Ｉ／Ｆである。汎用通信Ｉ／Ｆ７６２０は、ＧＳＭ（Global System of Mobile communications）、ＷｉＭＡＸ、ＬＴＥ（Long Term Evolution）若しくはＬＴＥ－Ａ（LTE－Advanced）などのセルラー通信プロトコル、又は無線ＬＡＮ（Ｗｉ－Ｆｉ（登録商標）ともいう）、Ｂｌｕｅｔｏｏｔｈ（登録商標）などのその他の無線通信プロトコルを実装してよい。汎用通信Ｉ／Ｆ７６２０は、例えば、基地局又はアクセスポイントを介して、外部ネットワーク（例えば、インターネット、クラウドネットワーク又は事業者固有のネットワーク）上に存在する機器（例えば、アプリケーションサーバ又は制御サーバ）へ接続してもよい。また、汎用通信Ｉ／Ｆ７６２０は、例えばＰ２Ｐ（Peer To Peer）技術を用いて、車両の近傍に存在する端末（例えば、運転者、歩行者若しくは店舗の端末、又はＭＴＣ（Machine Type Communication）端末）と接続してもよい。

専用通信Ｉ／Ｆ７６３０は、車両における使用を目的として策定された通信プロトコルをサポートする通信Ｉ／Ｆである。専用通信Ｉ／Ｆ７６３０は、例えば、下位レイヤのＩＥＥＥ８０２．１１ｐと上位レイヤのＩＥＥＥ１６０９との組合せであるＷＡＶＥ（Wireless Access in Vehicle Environment）、ＤＳＲＣ（Dedicated Short Range Communications）、又はセルラー通信プロトコルといった標準プロトコルを実装してよい。専用通信Ｉ／Ｆ７６３０は、典型的には、車車間（Vehicle to Vehicle）通信、路車間（Vehicle to Infrastructure）通信、車両と家との間（Vehicle to Home）の通信及び歩車間（Vehicle to Pedestrian）通信のうちの１つ以上を含む概念であるＶ２Ｘ通信を遂行する。

測位部７６４０は、例えば、ＧＮＳＳ（Global Navigation Satellite System）衛星からのＧＮＳＳ信号（例えば、ＧＰＳ（Global Positioning System）衛星からのＧＰＳ信号）を受信して測位を実行し、車両の緯度、経度及び高度を含む位置情報を生成する。なお、測位部７６４０は、無線アクセスポイントとの信号の交換により現在位置を特定してもよく、又は測位機能を有する携帯電話、ＰＨＳ若しくはスマートフォンといった端末から位置情報を取得してもよい。

ビーコン受信部７６５０は、例えば、道路上に設置された無線局等から発信される電波あるいは電磁波を受信し、現在位置、渋滞、通行止め又は所要時間等の情報を取得する。なお、ビーコン受信部７６５０の機能は、上述した専用通信Ｉ／Ｆ７６３０に含まれてもよい。

車内機器Ｉ／Ｆ７６６０は、マイクロコンピュータ７６１０と車内に存在する様々な車内機器７７６０との間の接続を仲介する通信インタフェースである。車内機器Ｉ／Ｆ７６６０は、無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＮＦＣ（Near Field Communication）又はＷＵＳＢ（Wireless USB）といった無線通信プロトコルを用いて無線接続を確立してもよい。また、車内機器Ｉ／Ｆ７６６０は、図示しない接続端子（及び、必要であればケーブル）を介して、ＵＳＢ（Universal Serial Bus）、ＨＤＭＩ（High-Definition Multimedia Interface）、又はＭＨＬ（Mobile High-definition Link）等の有線接続を確立してもよい。車内機器７７６０は、例えば、搭乗者が有するモバイル機器若しくはウェアラブル機器、又は車両に搬入され若しくは取り付けられる情報機器のうちの少なくとも１つを含んでいてもよい。また、車内機器７７６０は、任意の目的地までの経路探索を行うナビゲーション装置を含んでいてもよい。車内機器Ｉ／Ｆ７６６０は、これらの車内機器７７６０との間で、制御信号又はデータ信号を交換する。

車載ネットワークＩ／Ｆ７６８０は、マイクロコンピュータ７６１０と通信ネットワーク７０１０との間の通信を仲介するインタフェースである。車載ネットワークＩ／Ｆ７６８０は、通信ネットワーク７０１０によりサポートされる所定のプロトコルに則して、信号等を送受信する。

統合制御ユニット７６００のマイクロコンピュータ７６１０は、汎用通信Ｉ／Ｆ７６２０、専用通信Ｉ／Ｆ７６３０、測位部７６４０、ビーコン受信部７６５０、車内機器Ｉ／Ｆ７６６０及び車載ネットワークＩ／Ｆ７６８０のうちの少なくとも一つを介して取得される情報に基づき、各種プログラムにしたがって、車両制御システム７０００を制御する。例えば、マイクロコンピュータ７６１０は、取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット７１００に対して制御指令を出力してもよい。例えば、マイクロコンピュータ７６１０は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むＡＤＡＳ（Advanced Driver Assistance System）の機能実現を目的とした協調制御を行ってもよい。また、マイクロコンピュータ７６１０は、取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行ってもよい。

マイクロコンピュータ７６１０は、汎用通信Ｉ／Ｆ７６２０、専用通信Ｉ／Ｆ７６３０、測位部７６４０、ビーコン受信部７６５０、車内機器Ｉ／Ｆ７６６０及び車載ネットワークＩ／Ｆ７６８０のうちの少なくとも一つを介して取得される情報に基づき、車両と周辺の構造物や人物等の物体との間の３次元距離情報を生成し、車両の現在位置の周辺情報を含むローカル地図情報を作成してもよい。また、マイクロコンピュータ７６１０は、取得される情報に基づき、車両の衝突、歩行者等の近接又は通行止めの道路への進入等の危険を予測し、警告用信号を生成してもよい。警告用信号は、例えば、警告音を発生させたり、警告ランプを点灯させたりするための信号であってよい。

音声画像出力部７６７０は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図５８の例では、出力装置として、オーディオスピーカ７７１０、表示部７７２０及びインストルメントパネル７７３０が例示されている。表示部７７２０は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。表示部７７２０は、ＡＲ（Augmented Reality）表示機能を有していてもよい。出力装置は、これらの装置以外の、ヘッドホン、搭乗者が装着する眼鏡型ディスプレイ等のウェアラブルデバイス、プロジェクタ又はランプ等の他の装置であってもよい。出力装置が表示装置の場合、表示装置は、マイクロコンピュータ７６１０が行った各種処理により得られた結果又は他の制御ユニットから受信された情報を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。また、出力装置が音声出力装置の場合、音声出力装置は、再生された音声データ又は音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。

なお、図５８に示した例において、通信ネットワーク７０１０を介して接続された少なくとも二つの制御ユニットが一つの制御ユニットとして一体化されてもよい。あるいは、個々の制御ユニットが、複数の制御ユニットにより構成されてもよい。さらに、車両制御システム７０００が、図示されていない別の制御ユニットを備えてもよい。また、上記の説明において、いずれかの制御ユニットが担う機能の一部又は全部を、他の制御ユニットに持たせてもよい。つまり、通信ネットワーク７０１０を介して情報の送受信がされるようになっていれば、所定の演算処理が、いずれかの制御ユニットで行われるようになってもよい。同様に、いずれかの制御ユニットに接続されているセンサ又は装置が、他の制御ユニットに接続されるとともに、複数の制御ユニットが、通信ネットワーク７０１０を介して相互に検出情報を送受信してもよい。

なお、図１乃至図５４を用いて説明した本実施形態に係る画像表示システム１０、７００、または、８００の各機能を実現するためのコンピュータプログラムを、いずれかの制御ユニット等に実装することができる。また、このようなコンピュータプログラムが格納された、コンピュータで読み取り可能な記録媒体を提供することもできる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリ等である。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信されてもよい。

以上説明した車両制御システム７０００において、画像表示システム１０、７００、または、８００は、図５８に示した応用例の車両制御システム７０００に適用することができる。例えば、画像表示システム１０若しくは７００のマルチカメラ１１、または、画像表示システム８００の撮影部８１１は、撮像部７４１０の少なくとも一部に相当する。また、コンテンツサーバ１２、ホームサーバ１３（ホームサーバ１３ａ乃至１３ｃのいずれか）、および変換装置１４の全部若しくは一部、配信サーバ７０１、ネットワーク７０２、再生装置７０３、および変換装置１４の全部若しくは一部、または、送信部８０１（撮影部８１１を除く）および受信部８０２（表示部８４５を除く）の全部若しくは一部は一体化され、統合制御ユニット７６００のマイクロコンピュータ７６１０と記憶部７６９０に相当する。ヘッドマウントディスプレイ１５または表示部８４５は、表示部７７２０に相当する。

なお、画像表示システム１０または７００を車両制御システム７０００に適用する場合、カメラ１３Ａ、マーカ１５Ａ、およびジャイロセンサ１５Ｂは設けられず、視聴者である搭乗者の入力部７８００の操作により視聴者の視線方向および視聴位置が入力される。また、画像表示システム８００を車両制御システム７０００に適用する場合、カメラ８４６は設けられず、視聴者である搭乗者の入力部７８００の操作により視聴者の視線方向および視聴位置が入力される。

以上のようにして、画像表示システム１０、７００、または、８００を、図５８に示した応用例の車両制御システム７０００に適用することにより、全天球画像またはオブジェクトの周囲を囲む複数の視点からの画像を用いて高画質の表示画像を生成することができる。

また、画像表示システム１０、７００、または、８００の少なくとも一部の構成要素は、図５８に示した統合制御ユニット７６００のためのモジュール（例えば、一つのダイで構成される集積回路モジュール）において実現されてもよい。あるいは、画像表示システム１０、７００、または、８００が、図５８に示した車両制御システム７０００の複数の制御ユニットによって実現されてもよい。

本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

また、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本開示は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

なお、本開示は、以下のような構成もとることができる。

（１）
全天球画像を複数の面に投影することにより得られる複数の投影画像、または、異なる視点からの複数の視点画像を符号化した複数の符号化ストリーム間の優先度に基づいて、前記符号化ストリームの復号、並びに、表示画像の生成に用いる画像の生成または選択を行う画像処理部と、
前記生成または選択された画像に基づいて、前記表示画像を生成する描画部と
を備える画像処理装置。
（２）
前記画像処理部は、前記優先度に基づいて、各前記符号化ストリームの復号およびレンダリングを行い、
前記描画部は、各前記符号化ストリームの復号およびレンダリングを行うことにより生成される複数の生成画像に基づいて、表示画像を生成する
前記（１）に記載の画像処理装置。
（３）
前記複数の投影画像は、複数のレイヤの画像を含み、
前記画像処理部は、さらに前記レイヤ間の優先度に基づいて、各前記符号化ストリームの復号及びレンダリングを行う
前記（２）に記載の画像処理装置。
（４）
前記複数のレイヤの画像は、前記全天球画像を異なる視点から投影することにより得られる
前記（３）に記載の画像処理装置。
（５）
前記画像処理部は、優先度が低い前記符号化ストリームほど、復号するピクチャを間引く量またはレンダリングするピクチャを間引く量を大きくする
前記（２）または（４）に記載の画像処理装置。
（６）
前記画像処理部は、優先度が下がるにつれて、フレーム間予測を用いて復号されるピクチャであって他のピクチャから参照されない第１のピクチャ、フレーム間予測を用いて復号されるピクチャであって他のピクチャから参照される第２のピクチャ、単独で復号される第３のピクチャの順に間引くピクチャを追加する
前記（５）に記載の画像処理装置。
（７）
前記画像処理部は、いずれかの前記符号化ストリームのレンダリングの遅延の発生が予測される場合に、前記優先度に基づいて、各前記符号化ストリームの復号およびレンダリングを行う
前記（２）乃至（６）のいずれかに記載の画像処理装置。
（８）
前記画像処理部は、前記全天球画像を前記投影画像より低解像度にした低解像度画像を符号化したサブ符号化ストリームの復号およびレンダリングをさらに行い、
前記描画部は、前記サブ符号化ストリームの復号およびレンダリングを行うことにより生成される低解像度生成画像に基づいて、前記表示画像を生成する
前記（２）乃至（７）のいずれかに記載の画像処理装置。
（９）
前記サブ符号化ストリームの優先度が前記符号化ストリームの優先度より高い
前記（８）に記載の画像処理装置。
（１０）
各前記符号化ストリームのレンダリングの遅延の発生が予測されない場合、前記画像処理部は、前記サブ符号化ストリームの復号およびレンダリングを行わず、前記描画部は、複数の前記生成画像に基づいて、前記表示画像を生成し、
いずれかの前記符号化ストリームのレンダリングの遅延の発生が予測される場合、前記画像処理部は、前記サブ符号化ストリームの復号およびレンダリングを行うとともに、前記優先度に基づいて、各前記符号化ストリームの復号およびレンダリングを行い、前記描画部は、複数の前記生成画像、および前記低解像度生成画像に基づいて、前記表示画像を生成する
前記（８）または（９）に記載の画像処理装置。
（１１）
前記画像処理部は、前記優先度に基づいて、復号する前記符号化ストリームの選択、および、前記符号化ストリームの復号により得られた前記視点画像の選択のうち少なくとも１つを行う
前記（１）に記載の画像処理装置。
（１２）
前記複数の視点画像は、異なる視点からオブジェクトを見た複数のテクスチャ画像、および、異なる視点から前記オブジェクトを見た複数のデプス画像を含み、
前記画像処理部は、前記オブジェクトの３次元の形状を表し、前記デプス画像より解像度が低い第１の形状データを符号化した符号化形状ストリームの復号を行い、選択された前記デプス画像、および、前記第１の形状データに基づいて、前記第１の形状データより解像度が高い第２の形状データを生成し、
前記描画部は、選択された前記テクスチャ画像および前記第２の形状データに基づいて、前記表示画像を生成する
前記（１１）に記載の画像処理装置。
（１３）
画像処理装置が、
全天球画像を複数の面に投影することにより得られる複数の投影画像、または、異なる視点からの複数の視点画像を符号化した複数の符号化ストリーム間の優先度に基づいて、前記符号化ストリームの復号、並びに、表示画像の生成に用いる画像の生成または選択を行う画像処理ステップと、
前記生成または選択された画像に基づいて、前記表示画像を生成する描画ステップと
を含む画像処理方法。
（１４）
全天球画像を複数の面に投影することにより得られる複数の投影画像、または、異なる視点からの複数の視点画像を取得する画像取得部と、
前記複数の投影画像間または前記複数の視点画像間の優先度に基づいて、前記複数の投影画像または前記複数の視点画像の一部又は全部を伝送する伝送部と
を備える画像処理装置。
（１５）
前記複数の投影画像または前記複数の視点画像の符号化を行い、複数の符号化ストリームを生成する符号化部を
さらに備え、
前記符号化部が符号化する前記投影画像または前記視点画像を前記優先度に基づいて選択する処理、および、前記伝送部が伝送する前記符号化ストリームを前記優先度に基づいて選択する処理のうち少なくとも１つの処理を行う
前記（１４）に記載の画像処理装置。
（１６）
前記符号化部は、さらに前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、符号化する前記投影画像または前記視点画像を選択し、
前記伝送部は、さらに前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、伝送する前記符号化ストリームを選択する
前記（１５）に記載の画像処理装置。
（１７）
前記符号化部は、さらに前記全天球画像を前記投影画像より低解像度にした低解像度画像の符号化を行い、サブ符号化ストリームを生成し、
前記伝送部は、さらに前記サブ符号化ストリームの伝送を行う
前記（１４）乃至（１６）のいずれかに記載の画像処理装置。
（１８）
前記サブ符号化ストリームの優先度が前記符号化ストリームの優先度より高い
前記（１７）に記載の画像処理装置。
（１９）
前記複数の投影画像は、前記全天球画像のテクスチャ画像とデプス画像を前記複数の面に投影することにより得られる複数のテクスチャ画像と複数のデプス画像を含む
前記（１４）乃至（１６）のいずれかに記載の画像処理装置。
（２０）
画像処理装置が、
全天球画像を複数の面に投影することにより得られる複数の投影画像、または、異なる視点からの複数の視点画像を取得する画像取得ステップと、
前記複数の投影画像間または前記複数の視点画像間の優先度に基づいて、前記複数の投影画像または前記複数の視点画像の一部又は全部を伝送する伝送ステップと
を含む画像処理方法。

１０画像表示システム，１２コンテンツサーバ, １３，１３ａ乃至１３ｃホームサーバ, ２３６描画部, ２６４,２６８,３２４レンダリング部，５０２３Ｄモデル生成部，５１１優先度設定部, ５１２－１乃至５１２－６ＭＬ３Ｄモデル生成部，５１３低解像度３Ｄモデル生成部，５３１,５３２,５７１復号部, ６０１３Ｄモデル生成部, ７００画像表示システム, ７０１配信サーバ, ７０３再生装置，８００画像表示システム，８０１送信部，８０２受信部，８１２ストリーム生成部，８２１形状データ生成部，８２２変換部，８２３符号化部，８４３画像処理部，８４４描画部，８５１復号部，８５２再構成部

Claims

全天球画像を複数の面に投影することにより得られる複数の投影画像を符号化した複数の符号化ストリーム間の優先度に基づいて、復号するピクチャを間引く量またはレンダリングするピクチャを間引く量を前記優先度が低い前記符号化ストリームほど大きくするようにして、前記符号化ストリームの復号およびレンダリングを行い、表示画像の生成に用いる画像である生成画像を生成する画像処理部と、
前記生成画像に基づいて、前記表示画像を生成する描画部と
を備える画像処理装置。
前記描画部は、各前記符号化ストリームの復号およびレンダリングを行うことにより生成される複数の前記生成画像に基づいて、前記表示画像を生成する
請求項１に記載の画像処理装置。
複数の前記投影画像は、複数のレイヤの画像を含み、
前記画像処理部は、さらに前記レイヤ間の優先度に基づいて、各前記符号化ストリームの復号及びレンダリングを行う
請求項２に記載の画像処理装置。
前記複数のレイヤの画像は、前記全天球画像を異なる視点から投影することにより得られる
請求項３に記載の画像処理装置。
前記画像処理部は、前記優先度が下がるにつれて、フレーム間予測を用いて復号されるピクチャであって他のピクチャから参照されない第１のピクチャ、フレーム間予測を用いて復号されるピクチャであって他のピクチャから参照される第２のピクチャ、単独で復号される第３のピクチャの順に間引くピクチャを追加する
請求項１に記載の画像処理装置。
前記画像処理部は、いずれかの前記符号化ストリームのレンダリングの遅延の発生が予測される場合に、前記優先度に基づいて、各前記符号化ストリームの復号およびレンダリングを行う
請求項１に記載の画像処理装置。
前記画像処理部は、前記全天球画像を前記投影画像より低解像度にした低解像度画像を符号化したサブ符号化ストリームの復号およびレンダリングをさらに行い、
前記描画部は、前記サブ符号化ストリームの復号およびレンダリングを行うことにより生成される低解像度生成画像に基づいて、前記表示画像を生成する
請求項１に記載の画像処理装置。
前記サブ符号化ストリームの優先度が前記符号化ストリームの優先度より高い
請求項７に記載の画像処理装置。
各前記符号化ストリームのレンダリングの遅延の発生が予測されない場合、前記画像処理部は、前記サブ符号化ストリームの復号およびレンダリングを行わず、前記描画部は、複数の前記生成画像に基づいて、前記表示画像を生成し、
いずれかの前記符号化ストリームのレンダリングの遅延の発生が予測される場合、前記画像処理部は、前記サブ符号化ストリームの復号およびレンダリングを行うとともに、前記優先度に基づいて、各前記符号化ストリームの復号およびレンダリングを行い、前記描画部は、複数の前記生成画像、および前記低解像度生成画像に基づいて、前記表示画像を生成する
請求項７に記載の画像処理装置。
前記画像処理部は、前記優先度に基づいて、復号する前記符号化ストリームの選択を行う
請求項１に記載の画像処理装置。
画像処理装置が、
全天球画像を複数の面に投影することにより得られる複数の投影画像を符号化した複数の符号化ストリーム間の優先度に基づいて、復号するピクチャを間引く量またはレンダリングするピクチャを間引く量を前記優先度が低い前記符号化ストリームほど大きくするようにして、前記符号化ストリームの復号およびレンダリングを行い、表示画像の生成に用いる画像である生成画像を生成し、
前記生成画像に基づいて、前記表示画像を生成する
画像処理方法。
全天球画像を複数の面に投影することにより得られる複数の投影画像の符号化を行い、複数の符号化ストリームを生成する符号化部と、
複数の前記投影画像間の優先度に基づいて、複数の前記投影画像を符号化して生成された前記符号化ストリームの一部を伝送する伝送部と
を備え、
前記符号化部は、前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、符号化する前記投影画像を選択し、
前記伝送部は、さらに、前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、伝送する前記符号化ストリームを選択する
画像処理装置。
前記符号化部は、さらに前記全天球画像を前記投影画像より低解像度にした低解像度画像の符号化を行い、サブ符号化ストリームを生成し、
前記伝送部は、さらに前記サブ符号化ストリームの伝送を行う
請求項１２に記載の画像処理装置。
前記サブ符号化ストリームの優先度が前記符号化ストリームの優先度より高い
請求項１３に記載の画像処理装置。
複数の前記投影画像は、前記全天球画像のテクスチャ画像とデプス画像を前記複数の面に投影することにより得られる複数のテクスチャ画像と複数のデプス画像を含む
請求項１２に記載の画像処理装置。
画像処理装置が、
符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、符号化する投影画像を選択し、
全天球画像を複数の面に投影することにより得られる複数の前記投影画像の符号化を行うことによって複数の前記符号化ストリームを生成し、
複数の前記投影画像間の優先度に基づいて、複数の前記投影画像を符号化して生成された前記符号化ストリームの一部を伝送し、
前記符号化ストリームを伝送する伝送路の状況、および、前記符号化ストリームの再生を行う装置のリソースのうち少なくとも１つに基づいて、伝送する前記符号化ストリームを選択する
画像処理方法。