WO2020184174A1

WO2020184174A1 - 画像処理装置および画像処理方法

Info

Publication number: WO2020184174A1
Application number: PCT/JP2020/007592
Authority: WO
Inventors: 伸明泉
Original assignee: ソニー株式会社
Priority date: 2019-03-11
Filing date: 2020-02-26
Publication date: 2020-09-17
Also published as: US20220084300A1; CN113544746A; JPWO2020184174A1

Abstract

本技術は、描画処理の処理負荷を低減できるようにする画像処理装置および画像処理方法に関する。画像処理装置は、複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定する判定部と、判定部の判定結果を、被写体の３Dモデルの3D形状データに付加して出力する出力部とを備える。本技術は、例えば、オブジェクトの３Dモデルのデータを生成する画像処理装置等に適用できる。

Description

画像処理装置および画像処理方法

　本技術は、画像処理装置および画像処理方法に関し、特に、描画処理の処理負荷を低減できるようにした画像処理装置および画像処理方法に関する。

　3Dモデルの生成や伝送について、各種の技術が提案されている。例えば、被写体の３Dモデルの３次元データを、複数の視点から撮影した複数のテクスチャ画像およびデプス画像に変換して再生装置に伝送し、再生側で表示する方法が提案されている（例えば、特許文献１参照）。

国際公開第２０１７／０８２０７６号

　再生装置では、複数の視点に対応する複数のテクスチャ画像のうち、どのテクスチャ画像が描画対象のオブジェクトの色の貼り付けに使用できるかどうかを判定する必要があり、この判定のための処理負荷が大きかった。

　本技術は、このような状況に鑑みてなされたものであり、再生側の描画処理の処理負荷を低減できるようにするものである。

　本技術の第１の側面の画像処理装置は、複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定する判定部と、前記判定部の判定結果を、前記被写体の３Dモデルの3D形状データに付加して出力する出力部とを備える。

　本技術の第１の側面の画像処理方法は、画像処理装置が、複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定し、その判定結果を、前記被写体の３Dモデルの3D形状データに付加して出力する。

　本技術の第１の側面においては、複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かが判定され、その判定結果が、前記被写体の３Dモデルの3D形状データに付加して出力される。

　本技術の第２の側面の画像処理装置は、テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、前記３Dモデルの画像を生成する描画処理部を備える。

　本技術の第２の側面の画像処理方法は、画像処理装置が、テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、３Dモデルの画像を生成する。

　本技術の第２の側面においては、テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、３Dモデルの画像が生成される。

　なお、本技術の第１および第２の側面の画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

　画像処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

本技術を適用した画像処理システムの概要について説明する図である。本技術を適用した画像処理システムの構成例を示すブロック図である。複数の撮像装置の配置例を説明する図である。３Dモデルデータの例を説明する図である。オブジェクトの３D形状に色情報を貼り付けるテクスチャ画像の選択を説明する図である。オクルージョンがある場合のテクスチャ画像の貼り付けを説明する図である。ビジビリティフラグの例を説明する図である。生成装置の詳細な構成例を示すブロック図である。ビジビリティ判定部の処理を説明する図である。ビジビリティ判定部の処理を説明する図である。メッシュデータとビジビリティ情報のパッキング処理の一例を説明する図である。再生装置の詳細な構成例を示すブロック図である。生成装置による３Dモデルデータ生成処理を説明するフローチャートである。図１３のステップＳ７のビジビリティ判定処理の詳細を説明するフローチャートである。再生装置によるカメラ選択処理を説明するフローチャートである。描画処理部による描画処理を説明するフローチャートである。生成装置の変形例を示すブロック図である。三角形パッチの再分割処理を説明する図である。三角形パッチの再分割処理を説明する図である。三角形パッチの再分割処理を説明する図である。本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

　以下、本技術を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．画像処理システムの概要
２．画像処理システムの構成例
３．画像処理システムの特徴
４．生成装置２２の構成例
５．再生装置２５の構成例
６．３Dモデルデータ生成処理
７．ビジビリティ判定処理
８．カメラ選択処理
９．描画処理
１０．変形例
１１．コンピュータ構成例

＜１．画像処理システムの概要＞
　初めに、図１を参照して、本技術を適用した画像処理システムの概要について説明する。

　本技術を適用した画像処理システムは、複数の撮像装置で撮像して得られた撮像画像からオブジェクトの3Dモデルを生成して配信する配信側と、配信側から伝送されてくる3Dモデルを受け取り、再生表示する再生側とからなる。

　配信側においては、所定の撮影空間を、その外周から複数の撮像装置で撮像を行うことにより複数の撮像画像が得られる。撮像画像は、例えば、動画像で構成される。そして、異なる方向の複数の撮像装置から得られた撮像画像を用いて、撮影空間において表示対象となる複数のオブジェクトの3Dモデルが生成される。オブジェクトの3Dモデルの生成は、3Dモデルの再構成とも呼ばれる。

　図１の例では、撮影空間がサッカースタジアムのフィールドに設定された例が示されており、フィールドの外周であるスタンド側に配置された複数の撮像装置によって、フィールド上のプレイヤ等が撮影されている。3Dモデルの再構成により、例えば、フィールド上のプレイヤ、審判、サッカーボール、サッカーゴール、などがオブジェクトとして抽出され、各オブジェクトについて3Dモデルが生成（再構成）される。生成された多数のオブジェクトの3Dモデルのデータ（以下、3Dモデルデータとも称する。）は所定の記憶装置に格納される。

　そして、所定の記憶装置に格納された撮影空間に存在する多数のオブジェクトのうち、所定のオブジェクトの3Dモデルが、再生側の要求に応じて伝送され、再生側で、再生および表示される。

　再生側は、撮影空間に存在する多数のオブジェクトのうち、視聴対象のオブジェクトだけを要求して、表示装置に表示させることができる。例えば、再生側は、視聴者の視聴範囲が撮影範囲となるような仮想カメラを想定し、撮影空間に存在する多数のオブジェクトのうち、仮想カメラで捉えられるオブジェクトのみを要求して、表示装置に表示させる。実世界において視聴者が任意の視点からフィールドを見ることができるように、仮想カメラの視点は任意の位置に設定することができる。

　図１の例では、生成されたオブジェクトとしての多数のプレーヤのうち、四角で囲んだ３人のプレーヤのみが、表示装置で表示される。

＜２．画像処理システムの構成例＞
　図２は、図１で説明した画像処理を実現する画像処理システムの構成例を示すブロック図である。

　画像処理システム１は、複数の撮像装置２１から得られた複数の撮像画像から3Dモデルのデータを生成して配信する配信側と、配信側から伝送されてくる3Dモデルのデータを受け取り、再生表示する再生側とからなる。

　撮像装置２１－１乃至２１－N（N＞１）は、例えば、図３に示されるように、被写体の外周の異なる位置に配置されて被写体を撮像し、その結果得られる動画像の画像データを生成装置２２に供給する。図３は、８台の撮像装置２１－１乃至２１－８を配置した例である。撮像装置２１－１乃至２１－８それぞれは、他の撮像装置２１と異なる方向から被写体を撮像する。各撮像装置２１のワールド座標系上の位置は既知とする。

　本実施の形態では、各撮像装置２１が生成する動画像は、RGBの波長を含む撮像画像（RGB画像）で構成される。各撮像装置２１は、被写体を撮像した動画像（RGB画像）の画像データと、カメラパラメータを、生成装置２２に供給する。カメラパラメータには、外部パラメータおよび内部パラメータが少なくとも含まれる。

　生成装置２２は、撮像装置２１－１乃至２１－Nそれぞれから供給される複数の撮像画像から、被写体のテクスチャ画像の画像データと、被写体の3D形状を表した3D形状データを生成し、複数の撮像装置２１のカメラパラメータとともに、配信サーバ２３に供給する。以下では、各オブジェクトの画像データおよび3D形状データを、まとめて3Dモデルデータとも称する。

　なお、生成装置２２は、撮像装置２１－１乃至２１－Nから撮像画像を直接取得する代わりに、データサーバなど所定の記憶部に一旦記憶された撮像画像を取得して、3Dモデルデータを生成することもできる。

　配信サーバ２３は、生成装置２２から供給される3Dモデルデータを記憶したり、再生装置２５からの要求に応じて、3Dモデルデータを、ネットワーク２４を介して再生装置２５に送信する。

　配信サーバ２３は、送受信部３１と、ストレージ３２とを有する。

　送受信部３１は、生成装置２２から供給される3Dモデルデータとカメラパラメータを取得し、ストレージ３２に記憶する。また、送受信部３１は、再生装置２５からの要求に応じて、3Dモデルデータとカメラパラメータを、ネットワーク２４を介して再生装置２５に送信する。

　なお、送受信部３１は、ストレージ３２から3Dモデルデータとカメラパラメータを取得して、再生装置２５に送信することもできるし、生成装置２２から供給された3Dモデルデータとカメラパラメータをストレージ３２に記憶することなく、直接、再生装置２５に送信（リアルタイム配信）することもできる。

　ネットワーク２４は、例えば、インターネット、電話回線網、衛星通信網、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷIDｅＡｒｅａＮｅｔｗｏｒｋ）、ＩＰ－ＶＰＮ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ－ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）などの専用回線網などで構成される。

　再生装置２５は、ネットワーク２４を介して配信サーバ２３から送信されてくる3Dモデルデータとカメラパラメータを用いて、視聴位置検出装置２７から供給される視聴者の視聴位置から見たオブジェクトの画像（オブジェクト画像）を生成（再生）し、表示装置２６に供給する。より具体的には、再生装置２５は、視聴者の視聴範囲が撮影範囲となるような仮想カメラを想定し、仮想カメラで捉えられるオブジェクトの画像を生成し、表示装置２６に表示させる。仮想カメラの視点（仮想視点）は、視聴位置検出装置２７から供給される仮想視点情報によって特定される。仮想視点情報は、例えば、仮想カメラのカメラパラメータ（外部パラメータおよび内部パラメータ）で構成される。

　表示装置２６は、再生装置２５から供給されるオブジェクト画像を表示する。視聴者は、表示装置２６に表示されたオブジェクト画像を視聴する。視聴位置検出装置２７は、視聴者の視聴位置を検出し、その視聴位置を示す仮想視点情報を再生装置２５に供給する。

　表示装置２６と視聴位置検出装置２７は、一体の装置で構成されてもよい。例えば、表示装置２６と視聴位置検出装置２７は、ヘッドマウントディスプレイで構成され、視聴者が移動した位置、頭部の動き等を検出し、視聴者の視聴位置を検出する。視聴位置には、再生装置２５が生成するオブジェクトに対する視聴者の視線方向も含む。

　表示装置２６と視聴位置検出装置２７が別々の装置で構成される例としては、例えば、視聴位置検出装置２７が、例えば、視聴位置を操作するコントローラ等で構成される。この場合、視聴者によるコントローラの操作に応じた視聴位置が、視聴位置検出装置２７から再生装置２５に供給される。再生装置２５は、指定された視聴位置に対応するオブジェクト画像を表示装置２６に表示させる。

　表示装置２６または視聴位置検出装置２７は、表示装置２６が表示する画像の画像サイズや画角など、表示装置２６の表示機能に関する情報を、必要に応じて再生装置２５に供給することもできる。

　以上のように構成される画像処理システム１では、撮影空間に存在する多数のオブジェクトのうち、視聴者の視点（仮想視点）に応じたオブジェクトの３Dモデルデータが、生成装置２２で生成され、配信サーバ２３を介して再生装置２５に伝送される。そして、再生装置２５では、３Dモデルデータに基づくオブジェクト画像が再生され、表示装置２６に表示される。生成装置２２は、視聴者の視点（仮想視点）に応じたオブジェクトの３Dモデルデータを生成する画像処理装置であり、再生装置２５は、生成装置２２で生成された３Dモデルデータに基づくオブジェクト画像を再生させ、表示装置２６に表示させる画像処理装置である。

＜３．画像処理システムの特徴＞
　次に、図４乃至図７を参照して、画像処理システム１の特徴について説明する。

　図４は、配信サーバ２３から再生装置２５に伝送される３Dモデルデータの例を示している。

　再生装置２５には、3Dモデルデータとして、オブジェクト（被写体）のテクスチャ画像の画像データと、オブジェクトの3D形状を表した3D形状データとが伝送される。

　伝送されるオブジェクトのテクスチャ画像は、例えば、図４に示されるような、撮像装置２１－１乃至２１－８それぞれが被写体を撮像した撮像画像P１乃至P8である。

　オブジェクトの3D形状データとは、例えば、図４に示されるような、被写体の3D形状を、三角形（三角形パッチ）の頂点間のつながりで表したポリゴンメッシュで表現したメッシュデータである。

　再生装置２５は、視聴者の視点（仮想視点）に応じて表示装置２６に表示させるオブジェクト画像を生成する際、ポリゴンメッシュで表現されたオブジェクトの３D形状に、複数の撮像装置２１で撮像された複数のテクスチャ画像に基づく色情報（RBG値）を貼り付けることで、オブジェクト画像を生成する。

　ここで、再生装置２５は、配信サーバ２３から供給されてくるN台の撮像装置２１で撮像されたN枚のテクスチャ画像のうち、仮想視点に近い複数の撮像装置２１のテクスチャ画像を選択して、オブジェクトの３D形状に色情報を貼り付ける。

　例えば、再生装置２５は、図５に示されるように、オブジェクトObjを仮想カメラVCAMの視点（仮想視点）から見たオブジェクト画像を生成する場合、仮想カメラVCAMに近い位置の撮像装置２１－３乃至２１－５の３台のテクスチャ画像を用いて色情報を貼り付ける。このように、仮想カメラVCAMの位置に近い複数の撮像装置２１で得られたテクスチャ画像を用いてテクスチャマッピングを行う方式を、ビューデペンデントレンダリング（View Dependentレンダリング）という。なお、描画画素の色情報は、３枚のテクスチャ画像の色情報を所定の方式でブレンドして求められる。

　オブジェクトの3D形状データの値は、誤差や精度不足で必ずしも正確ではないことがある。オブジェクトの３次元形状が正確でない場合、視聴位置に近い撮像装置２１からの光線情報を利用する方が誤差が少なく、高画質化できるメリットがある。また、ビューデペンデントレンダリングでは、光の反射のように、見る方向で変化する色情報も再現可能である。

　ところで、オブジェクトが撮像装置２１の画角内に入っていても、他のオブジェクトと重なっている場合がある。

　例えば、図６に示されるように、仮想カメラVCAMの位置に近い撮像装置２１として、２台の撮像装置２１－Aおよび２１－Bが選択され、オブジェクトObj1の点Pの色情報を貼り付ける場合を考える。

　オブジェクトObj1の近くにはオブジェクトObj2が存在している。撮像装置２１－Bのテクスチャ画像は、オブジェクトObj2によってオブジェクトObj1の点Pが写っていない。したがって、仮想カメラVCAMの位置に近い２つの撮像装置２１－Aおよび２１－Bのうち、撮像装置２１－Aのテクスチャ画像（色情報）は使うことができるが、撮像装置２１－Bのテクスチャ画像（色情報）は使うことができない。

　このように、オブジェクトに重なり（オクルージョン）がある場合には、仮想カメラVCAMの位置に近い撮像装置２１であっても、そのテクスチャ画像（色情報）を使えない場合がある。

　このため、通常は、再生表示画像を生成する再生装置２５が、撮像装置２１からのオブジェクトまでの距離情報（奥行き情報）を算出したデプスマップを生成し、撮像装置２１のテクスチャ画像に描画点Pが写っているか否かを判定する必要があったが、この処理が重いという問題があった。

　そこで、画像処理システム１では、生成装置２２が、オブジェクトの描画面を構成する各点Pに対して、伝送する撮像装置２１のテクスチャ画像に、その点Pが写っているか否かを予め判定し、その判定結果を、フラグとして再生装置２５に伝送するように構成されている。このフラグは、撮像装置２１のテクスチャ画像に写っているかどうかの情報を表すフラグであり、ビジビリティフラグ(visibility flag)と称する。

　図７は、オブジェクトObjを撮像した２台の撮像装置２１－Aおよび２１－Bのビジビリティフラグの例を示している。

　オブジェクトObj表面の点Pが定まると、ビジビリティフラグも定まる。オブジェクトObj表面の各点Pに対して、撮像装置２１ごとに写る／写らないが決定する。

　図７の例では、オブジェクトObj表面の点P1は、撮像装置２１－Aおよび２１－Bの両方に写っているので、ビジビリティフラグ_P1（A，B）＝（１，１）となる。オブジェクトObj表面の点P2は、撮像装置２１－Aには写っていないが、撮像装置２１－Bには写っているので、ビジビリティフラグ_P2（A，B）＝（０，１）となる。

　オブジェクトObj表面の点P3は、撮像装置２１－Aおよび２１－Bの両方に写っていないので、ビジビリティフラグ_P3（A，B）＝（０，０）となる。オブジェクトObj表面の点P4は、撮像装置２１－Aには写っているが、撮像装置２１－Bには写っていないので、ビジビリティフラグ_P2（A，B）＝（１，０）となる。

　このように、オブジェクトObj表面の各点に対して撮像装置２１毎に、ビジビリティフラグが決まるので、N台の撮像装置２１のビジビリティ情報は、トータルNビットの情報となる。

　画像処理システム１では、生成装置２２が、ビジビリティフラグを生成し、３Dモデルデータやカメラパラメータとともに再生装置２５に供給することで、再生装置２５で、撮像装置２１のテクスチャ画像に、描画点Pが写っているか否かを判定する必要がない。これにより、再生装置２５の描画負荷を軽減することができる。

　生成装置２２は、オブジェクトの3D形状を表した3D形状データとして、ポリゴンメッシュで表現されたデータを生成して提供するので、生成装置２２は、ポリゴンメッシュの三角形パッチ単位でビジビリティフラグを生成して付加する。

　以下、生成装置２２と再生装置２５の詳細な構成について説明する。

＜４．生成装置２２の構成例＞
　図８は、生成装置２２の詳細な構成例を示すブロック図である。

　生成装置２２は、歪・色補正部４１、シルエット抽出部４２、ボクセル処理部４３、メッシュ処理部４４、デプスマップ生成部４５、ビジビリティ判定部４６、パッキング部４７、および、画像送信部４８を含んで構成される。

　生成装置２２には、N台の撮像装置２１それぞれで撮像された動画像の画像データが供給される。動画像は、時系列に得られたRGBの複数枚のテクスチャ画像で構成される。また、生成装置２２には、N台の撮像装置２１それぞれのカメラパラメータも供給される。なお、カメラパラメータは、撮像装置２１から供給されずに、ユーザの操作に基づいて、生成装置２２の設定部で設定（入力）されてもよい。

　各撮像装置２１からの動画像の画像データは、歪・色補正部４１に供給され、カメラパラメータは、ボクセル処理部４３、デプスマップ生成部４５、および、画像送信部４８に供給される。

　歪・色補正部４１は、N台の撮像装置２１から供給される、N枚のテクスチャ画像に対して、各撮像装置２１のレンズ歪と色の補正を行う。これにより、N枚のテクスチャ画像どうしの歪みや色のばらつきが補正されるため、描画時に複数枚のテクスチャ画像の色をブレンドした際の違和感を抑制することができる。補正後のN枚のテクスチャ画像の画像データは、シルエット抽出部４２と画像送信部４８に供給される。

　シルエット抽出部４２は、歪・色補正部４１から供給される補正後のN枚のテクスチャ画像それぞれに対して、描画対象のオブジェクトである被写体の領域をシルエットで表したシルエット画像を生成する。

　シルエット画像は、例えば、各画素の画素値が「０」または「１」に２値化された２値化画像であり、被写体の領域が「１」の画素値に設定され、白色で表現される。被写体以外の領域は、「０」の画素値に設定され、黒色で表現される。

　なお、テクスチャ画像内の被写体のシルエットを検出する検出方法は、特に限定されず、任意の手法を採用してよい。例えば、隣り合う２台の撮像装置２１をステレオカメラと捉え、２枚のテクスチャ画像から視差を算出することで被写体までの距離を算出し、前景と背景を分離することでシルエットを検出する方法を採用することができる。また、被写体を含まない背景のみが撮像された背景画像を予め撮像して保持しておき、テクスチャ画像と背景画像との差分をとる背景差分法を用いることにより、シルエットを検出する方法を採用してもよい。または、Graph Cutとステレオビジョンを用いる方法（"Bi-Layer segmentation of binocular stereo video" V.Kolmogorov， A.Blake et al. Microsoft Research Ltd., Cambridge, UK）を用れば、より精度良く撮像画像内の人物のシルエットを検出することができる。N枚のテクスチャ画像から生成された、N枚のシルエット画像のデータは、ボクセル処理部４３に供給される。

　ボクセル処理部４３は、シルエット抽出部４２から供給されるN枚のシルエット画像を、カメラパラメータに従って投影し、３次元形状の削り出しを行うVisual Hullの手法を用いて、オブジェクトの３次元形状を生成（復元）する。オブジェクトの３次元形状は、例えば、３次元上の格子（voxel）単位で、オブジェクトに属するかまたは属さないかを表したボクセルデータで表される。オブジェクトの３次元形状を表すボクセルデータは、メッシュ処理部４４に供給される。

　メッシュ処理部４４は、ボクセル処理部４３から供給されるオブジェクトの３次元形状を表すボクセルデータを、表示デバイスでレンダリング処理がしやすいポリゴンメッシュのデータ形式に変換する。データ形式の変換には、例えばマーチングキューブ法などのアルゴリズムを用いることができる。メッシュ処理部４４は、三角形パッチで表現された形式変換後のメッシュデータを、デプスマップ生成部４５、ビジビリティ判定部４６、および、パッキング部４７に供給する。

　デプスマップ生成部４５は、N台の撮像装置２１のカメラパラメータと、オブジェクトの３次元形状を表すメッシュデータとを用いて、N枚のテクスチャ画像に対応するN枚のデプス画像（デプスマップ）を生成する。

　ある撮像装置２１が撮像した画像上の２次元座標（u,v）と、その画像に映るオブジェクトのワールド座標系上の３次元座標（X,Y,Z）は、カメラの内部パラメータAと外部パラメータR|tを用いて、以下の式（１）により表現される。

　式（１）において、m’は、画像の２次元位置に対応する行列であり、Mは、ワールド座標系の３次元座標に対応する行列である。式（１）は、より詳細には式（２）で表現される。

　式（２）において、（u,v）は画像上の２次元座標であり、f_x, f_yは、焦点距離である。また、C_x, C_yは、主点であり、r_１１乃至r_１３,r_２１乃至r_２３,r_３１乃至r_３３、およびｔ_１乃至ｔ_３は、パラメータであり、（X,Y,Z）は、ワールド座標系の３次元座標である。

　従って、式（１）や（２）により、カメラパラメータを用いて、テクスチャ画像の各画素の２次元座標に対応する３次元座標を求めることができるので、テクスチャ画像に対応するデプス画像を生成することができる。生成されたN枚のデプス画像は、ビジビリティ判定部４６に供給される。

　ビジビリティ判定部４６は、N枚のデプス画像を用いて、オブジェクト上の各点が、撮像装置２１が撮像したテクスチャ画像に写っているか否かを、N枚のテクスチャ画像それぞれについて判定する。

　図９および図１０を参照して、ビジビリティ判定部４６の処理について説明する。

　例えば、図９に示されるオブジェクトObj1の点Pが、撮像装置２１－Aおよび２１－Bのそれぞれのテクスチャ画像に写っているかどうかをビジビリティ判定部４６が判定する場合について説明する。ここで、オブジェクトObj1の点Pの座標は、メッシュ処理部４４から供給されるオブジェクトの３次元形状を表すメッシュデータにより既知である。

　ビジビリティ判定部４６は、オブジェクトObj1の点Pの位置を、撮像装置２１－Aの撮像範囲に投影した投影画面上の座標（ｉ_A，ｊ_A）を計算し、座標（ｉ_A，ｊ_A）のデプス値ｄ_Aを、デプスマップ生成部４５から供給された撮像装置２１－Aのデプス画像から取得する。デプスマップ生成部４５から供給された撮像装置２１－Aのデプス画像の座標（ｉ_A，ｊ_A）に格納されたデプス値が、デプス値ｄ_Aとなる。

　次に、ビジビリティ判定部４６は、座標（ｉ_A，ｊ_A）およびデプス値ｄ_Aと、撮像装置２１－Aのカメラパラメータから、撮像装置２１－Aの投影画面上の座標（ｉ_A，ｊ_A）のワールド座標系上の３次元座標（ｘ_A，ｙ_A，ｚ_A）を算出する。

　撮像装置２１－Bについても同様に、撮像装置２１－Bの投影画面上の座標（ｉ_B，ｊ_B）およびデプス値ｄ_Bと、撮像装置２１－Bのカメラパラメータから、撮像装置２１－Bの投影画面上の座標（ｉ_B，ｊ_B）のワールド座標系上の３次元座標（ｘ_B，ｙ_B，ｚ_B）が算出される。

　次に、ビジビリティ判定部４６は、算出した３次元座標（ｘ，ｙ，ｚ）が、オブジェクトObj1の点Pの既知の座標と一致するか否かを判定することで、点Pが撮像装置２１のテクスチャ画像に写っているかどうかを判定する。

　図９に示される例では、撮像装置２１－Aについて算出した３次元座標（ｘ_A，ｙ_A，ｚ_A）は、点P_Aに対応し、点P＝点P_Aとなるので、オブジェクトObj1の点Pは撮像装置２１－Aのテクスチャ画像に写っていると判定される。

　これに対して、撮像装置２１－Bについて算出された３次元座標（ｘ_B，ｙ_B，ｚ_B）は、点P_Aではなく、オブジェクトObj2の点P_Bの座標となる。したがって、点P≠点P_Bとなるので、オブジェクトObj1の点Pは撮像装置２１－Bのテクスチャ画像に写っていないと判定される。

　ビジビリティ判定部４６は、図１０に示されるように、オブジェクトの３次元形状であるメッシュデータの三角形パッチ単位で、各撮像装置２１のテクスチャ画像に写っているかどうかの判定結果を示すビジビリティフラグを生成する。

　三角形パッチの全ての領域が、撮像装置２１のテクスチャ画像に写っている場合には、「１」のビジビリティフラグが設定され、三角形パッチの一部の領域でも撮像装置２１のテクスチャ画像に写っていない場合には、「０」のビジビリティフラグが設定される。

　１つの三角形パッチに対して、N台の撮像装置２１それぞれのビジビリティフラグが生成されるので、ビジビリティフラグは、１つの三角形パッチに対してNビットの情報となる。

　図８に戻り、ビジビリティ判定部４６は、メッシュデータの三角形パッチ単位にNビットの情報で表されるビジビリティ情報を生成し、パッキング部４７に供給する。

　パッキング部４７は、メッシュ処理部４４から供給されるポリゴンメッシュのメッシュデータと、ビジビリティ判定部４６から供給されるビジビリティ情報とをパッキング（結合）し、ビジビリティ情報付きのメッシュデータを生成する。

　図１１は、メッシュデータとビジビリティ情報のパッキング処理の一例を説明する図である。

　ビジビリティフラグは、上述したように、１つの三角形パッチに対してNビットの情報となる。

　ポリゴンメッシュのメッシュデータのデータ形式には、三角形の３つの頂点の座標情報と、三角形の法線ベクトルの情報（法線ベクトル情報）をもつ形式が多い。本実施の形態では、法線ベクトル情報は使用しないため、法線ベクトル情報のデータ格納場所に、Nビットのビジビリティ情報を格納することができる。法線ベクトル情報は、少なくともNビット分のデータを格納するのに十分な領域であるとする。

　あるいはまた、例えば、法線ベクトル(VNx,VNy,VNz)のVNx,VNy,VNzそれぞれが、３２ビットのデータ領域を有する場合、２２ビットを法線ベクトルに用いて、１０ビットをビジビリティ情報に用いるようにしてもよい。

　なお、法線ベクトル情報のデータ格納場所にビジビリティ情報を格納することができない場合には、ビジビリティ情報専用の格納場所を追加してもよい。

　以上のようにして、パッキング部４７は、ポリゴンメッシュのメッシュデータに、ビジビリティ情報を付加し、ビジビリティ情報付きのメッシュデータを生成する。

　図８に戻り、パッキング部４７は、生成したビジビリティ情報付きのメッシュデータを、配信サーバ２３の送受信部３１に出力する。尚、パッキング部４７は、生成したビジビリティ情報付きのメッシュデータを、他の装置に出力する出力部でもある。

　画像送信部４８は、N台の撮像装置２１それぞれで撮像された撮像画像（テクスチャ画像）を歪・色補正部４１で補正した後の、N枚のテクスチャ画像の画像データと、N台の撮像装置２１それぞれのカメラパラメータを、配信サーバ２３に出力する。

　具体的には、画像送信部４８は、歪・色補正部４１で補正された動画像を撮像装置２１単位でストリームとしたN本のビデオストリームを、配信サーバ２３に出力する。画像送信部４８は、所定の圧縮符号化方式で圧縮した符号化ストリームを、配信サーバ２３に出力してもよい。カメラパラメータは、ビデオストリームとは別に伝送される。

＜５．再生装置２５の構成例＞
　図１２は、再生装置２５の詳細な構成例を示すブロック図である。

　再生装置２５は、アンパッキング部６１、カメラ選択部６２、および、描画処理部６３を有する。

　アンパッキング部６１は、再生装置２５のパッキング部４７の逆の処理を行う。すなわち、アンパッキング部６１は、配信サーバ２３からオブジェクトの3D形状データとして送信されてくる、ビジビリティ情報付きのメッシュデータを、ビジビリティ情報と、ポリゴンメッシュのメッシュデータとに分離し、描画処理部６３に供給する。アンパッキング部６１は、ビジビリティ情報付きのメッシュデータを、ビジビリティ情報と、ポリゴンメッシュのメッシュデータとに分離する分離部でもある。

　カメラ選択部６２には、N台の撮像装置２１それぞれのカメラパラメータが供給される。

　カメラ選択部６２は、視聴位置検出装置２７（図２）から供給される、視聴者の視聴位置を示す仮想視点情報に基づいて、N台の撮像装置２１のなかから、視聴者の視聴位置に近いM台の撮像装置２１を選択する。仮想視点情報は、仮想カメラのカメラパラメータで構成されるので、N台の撮像装置２１それぞれのカメラパラメータと比較することにより、M台を選択することができる。選択される台数である値Mは、撮像装置２１の台数であるNよりも小さい場合（M＜N）に処理負荷を軽減することができるが、再生装置２５の処理能力によっては、M＝N、即ち撮像装置２１の全台数を選択してもよい。

　カメラ選択部６２は、選択したM台の撮像装置２１に対応するテクスチャ画像の画像データを、配信サーバ２３に要求して、取得する。テクスチャ画像の画像データは、例えば、撮像装置２１単位のビデオストリームとされる。このテクスチャ画像の画像データは、生成装置２２でテクスチャ画像間の歪みや色が補正されたデータである。

　カメラ選択部６２は、選択したM台の撮像装置２１に対応するカメラパラメータとテクスチャ画像の画像データを、描画処理部６３に供給する。

　描画処理部６３は、視聴者の視聴位置に基づき、オブジェクトの画像を描画するレンダリング処理を行う。すなわち、描画処理部６３は、視聴位置検出装置２７から供給される仮想視点情報に基づいて、視聴者の視聴位置から見たオブジェクトの画像（オブジェクト画像）を生成し、表示装置２６に供給して表示させる。

　描画処理部６３は、アンパッキング部６１から供給されるビジビリティ情報を参照し、M枚のテクスチャ画像のなかから、描画点が写っているK枚（K≦M）のテクスチャ画像を選択する。さらに、描画処理部６３は、選択したK枚のテクスチャ画像のなかから、優先して使用するL枚（L≦K）のテクスチャ画像を決定する。L枚のテクスチャ画像としては、K枚のテクスチャ画像を撮像した撮像装置２１の３次元位置（撮影位置）を参照して、視聴位置と撮像装置２１との角度が小さいテクスチャ画像が採用される。

　描画処理部６３は、決定したL枚のテクスチャ画像の色情報（RGB値）をブレンディングし、オブジェクトの描画点Pの色情報を決定する。例えば、L枚のうちのｉ枚目のテクスチャ画像のブレンド率Blend(i)は、以下の式（３）および式（４）で計算することができる。

　式（３）のangBlend(i)は、正規化前のｉ枚目のテクスチャ画像のブレンド率を表し、angDiff(i)は、ｉ枚目のテクスチャ画像を撮像した撮像装置２１と視聴位置との角度を表し、angMAXは、L枚のテクスチャ画像のangDiff(i)の最大値を表す。式（４）のΣangBlend(j)は、Ｌ枚のテクスチャ画像のangBlend(j)の総和（j＝1乃至L）を表す。

　描画処理部６３は、L枚（ｉ＝1乃至L）のテクスチャ画像の色情報をブレンド率Blend(i)でブレンディングし、オブジェクトの描画点Pの色情報を決定する。

　なお、L枚のテクスチャ画像のブレンド処理は、上述した処理に限定されず、その他の手法を用いてもよい。ブレンディング計算式は、例えば、視聴位置が撮像装置２１と同じ位置にきた場合は、その撮像装置２１で得られたテクスチャ画像の色情報に近いこと、撮像装置２１間を視聴位置が変化した場合には、時間的にも空間的にもなめらかにブレンド率Blend(i)が変化すること、使用するテクスチャ数Lが可変であること、などの条件を満たしていればよい。

＜６．３Dモデルデータ生成処理＞
　次に、図１３のフローチャートを参照して、生成装置２２による３Dモデルデータ生成処理を説明する。この処理は、例えば、N台の撮像装置２１から、被写体を撮像した撮像画像またはカメラパラメータが供給されたとき、開始される。

　初めに、ステップＳ１において、生成装置２２は、N台の撮像装置２１それぞれから供給されるカメラパラメータと撮像画像を取得する。撮像画像の画像データは、歪・色補正部４１に供給され、カメラパラメータは、ボクセル処理部４３、デプスマップ生成部４５、および、画像送信部４８に供給される。撮像画像は、順次供給される動画像の一部であり、被写体のテクスチャを規定するテクスチャ画像である。

　ステップＳ２において、歪・色補正部４１は、N枚のテクスチャ画像に対して、各撮像装置２１のレンズ歪と色の補正を行う。補正後のN枚のテクスチャ画像は、シルエット抽出部４２と画像送信部４８に供給される。

　ステップＳ３において、シルエット抽出部４２は、歪・色補正部４１から供給された補正後のN枚のテクスチャ画像それぞれに対して、オブジェクトとしての被写体の領域をシルエットで表したシルエット画像を生成し、ボクセル処理部４３に供給する。

　ステップＳ４において、ボクセル処理部４３は、シルエット抽出部４２から供給されたN枚のシルエット画像を、カメラパラメータに従って投影し、３次元形状の削り出しを行うVisual Hullの手法を用いて、オブジェクトの３次元形状を生成（復元）する。オブジェクトの３次元形状を表すボクセルデータは、メッシュ処理部４４に供給される。

　ステップＳ５において、メッシュ処理部４４は、ボクセル処理部４３から供給されたオブジェクトの３次元形状を表すボクセルデータを、ポリゴンメッシュのデータ形式に変換する。形式変換後のメッシュデータは、デプスマップ生成部４５、ビジビリティ判定部４６、および、パッキング部４７に供給される。

　ステップＳ６において、デプスマップ生成部４５は、N台の撮像装置２１のカメラパラメータと、オブジェクトの３次元形状を表すメッシュデータとを用いて、N枚のテクスチャ画像（色・歪み補正後）に対応するN枚のデプス画像を生成する。生成されたN枚のデプス画像は、ビジビリティ判定部４６に供給される。

　ステップＳ７において、ビジビリティ判定部４６は、オブジェクト上の各点が、撮像装置２１が撮像したテクスチャ画像に写っているか否かを、N枚のテクスチャ画像それぞれについて判定するビジビリティ判定処理を行う。ビジビリティ判定部４６は、ビジビリティ判定処理の結果である、メッシュデータの三角形パッチ単位のビジビリティ情報を、パッキング部４７に供給する。

　ステップＳ８において、パッキング部４７は、メッシュ処理部４４から供給されたポリゴンメッシュのメッシュデータと、ビジビリティ判定部４６から供給されたビジビリティ情報とをパッキングし、ビジビリティ情報付きのメッシュデータを生成する。そして、パッキング部４７は、生成したビジビリティ情報付きのメッシュデータを、配信サーバ２３に出力する。

　ステップＳ９において、画像送信部４８は、歪・色補正部４１で補正後の、N枚のテクスチャ画像の画像データと、N台の撮像装置２１それぞれのカメラパラメータを、配信サーバ２３に出力する。

　ステップＳ８とステップＳ９の処理は順不同である。すなわち、ステップＳ９の処理を、ステップＳ８の処理より先に実行してもよいし、ステップＳ８とステップＳ９の処理を同時に行ってもよい。

　上述したステップＳ１乃至Ｓ９の処理は、N台の撮像装置２１から撮像画像が供給される間、繰り返し実行される。

＜７．ビジビリティ判定処理＞
　次に、図１４のフローチャートを参照して、図１３のステップＳ７のビジビリティ判定処理の詳細について説明する。

　初めに、ステップＳ２１において、ビジビリティ判定部４６は、再生側で描画対象となるオブジェクト上の所定の点Pを、撮像装置２１に投影した投影画面上の座標（ｉ，ｊ）を計算する。点Pの座標は、メッシュ処理部４４から供給されたオブジェクトの３次元形状を表すメッシュデータにより既知である。

　ステップＳ２２において、ビジビリティ判定部４６は、座標（ｉ，ｊ）のデプス値ｄを、デプスマップ生成部４５から供給された撮像装置２１のデプス画像から取得する。デプスマップ生成部４５から供給された撮像装置２１のデプス画像の座標（ｉ，ｊ）に格納されたデプス値が、デプス値ｄとなる。

　ステップＳ２３において、ビジビリティ判定部４６は、座標（ｉ，ｊ）およびデプス値ｄと、撮像装置２１のカメラパラメータから、撮像装置２１の投影画面上の座標（ｉ，ｊ）のワールド座標系上の３次元座標（ｘ，ｙ，ｚ）を算出する。

　ステップＳ２４において、ビジビリティ判定部４６は、算出したワールド座標系上の３次元座標（ｘ，ｙ，ｚ）が、点Pの座標と同一であるかを判定する。例えば、算出したワールド座標系上の３次元座標（ｘ，ｙ，ｚ）が、既知の点Pの座標に対して所定の誤差範囲内である場合には、点Pの座標と同一であると判定される。

　ステップＳ２４で、撮像装置２１へ投影した投影画面から算出した３次元座標（ｘ，ｙ，ｚ）が点Pと同一であると判定された場合、処理はステップＳ２５に進み、ビジビリティ判定部４６は、点Pが撮像装置２１のテクスチャ画像に写っていると判定して、処理を終了する。

　一方、ステップＳ２４で、撮像装置２１へ投影した投影画面から算出した３次元座標（ｘ，ｙ，ｚ）が点Pと同一ではないと判定された場合、処理はステップＳ２６に進み、ビジビリティ判定部４６は、点Pが撮像装置２１のテクスチャ画像には写っていないと判定して、処理を終了する。

　以上の処理が、オブジェクト上の全ての点Pおよび全ての撮像装置２１について実行される。

＜８．カメラ選択処理＞
　図１５は、再生装置２５のカメラ選択部６２によるカメラ選択処理のフローチャートである。

　初めに、ステップＳ４１において、カメラ選択部６２は、N台の撮像装置２１のカメラパラメータと、視聴者の視聴位置を示す仮想視点情報を取得する。N台の撮像装置２１それぞれのカメラパラメータは配信サーバ２３から供給され、仮想視点情報は視聴位置検出装置２７から供給される。

　ステップＳ４２において、カメラ選択部６２は、仮想視点情報に基づいて、N台の撮像装置２１のなかから、視聴者の視聴位置に近いM台の撮像装置２１を選択する。

　ステップＳ４３において、カメラ選択部６２は、選択したM台の撮像装置２１のテクスチャ画像の画像データを配信サーバ２３に要求して、取得する。M台の撮像装置２１のテクスチャ画像の画像データは、M本のビデオストリームとして配信サーバ２３から伝送されてくる。

　ステップＳ４４において、カメラ選択部６２は、選択したM台の撮像装置２１に対応するカメラパラメータとテクスチャ画像の画像データを、描画処理部６３に供給して、処理を終了する。

＜９．描画処理＞
　図１６は、描画処理部６３による描画処理のフローチャートである。

　初めに、ステップＳ６１において、描画処理部６３は、M台の撮像装置２１に対応するカメラパラメータとテクスチャ画像の画像データ、および、オブジェクトのメッシュデータとビジビリティ情報を取得する。また、描画処理部６３は、視聴位置検出装置２７から供給される、視聴者の視聴位置を示す仮想視点情報も取得する。

　ステップＳ６２において、描画処理部６３は、視聴者の視線方向を表すベクトルと、メッシュデータの各三角形パッチ面との交差判定を行うことにより、描画画素の３次元空間上の座標（ｘ，ｙ，ｚ）を算出する。以下、簡単のため、描画画素の３次元空間上の座標（ｘ，ｙ，ｚ）を、描画点と称する。

　ステップＳ６３において、描画処理部６３は、M台の撮像装置２１それぞれについて、描画点が撮像装置２１のテクスチャ画像に写っているかどうかを、ビジビリティ情報を参照して判定する。ここで判定された描画点が写っているテクスチャ画像の枚数が、K枚（K≦M）であるとする。

　ステップＳ６４において、描画処理部６３は、描画点が写っているK枚のテクスチャ画像のなかから、優先して使用するL枚（L≦K）のテクスチャ画像を決定する。L枚のテクスチャ画像は、視聴位置に対して角度が小さい撮像装置２１のテクスチャ画像が採用される。

　ステップＳ６５において、描画処理部６３は、決定したL枚のテクスチャ画像の色情報（RGB値）をブレンディングし、オブジェクトの描画点Pの色情報を決定する。

　ステップＳ６６において、描画処理部６３は、オブジェクトの描画点Pの色情報を描画バッファに書き込む。

　視聴者の視聴範囲の全ての点について、ステップＳ６２乃至Ｓ６６の処理が実行されることにより、視聴位置に対応するオブジェクト画像が、描画処理部６３の描画バッファに生成され、表示装置２６に表示される。

＜１０．変形例＞
　図１７は、生成装置２２の変形例を示すブロック図である。

　図１７の変形例に係る生成装置２２は、図８に示した生成装置２２の構成と比較すると、メッシュ処理部４４とパッキング部４７との間に、メッシュ再分割部８１が新たに追加されている点が異なる。

　メッシュ再分割部８１には、メッシュ処理部４４から、オブジェクトの３次元形状を表すメッシュデータが供給されるとともに、デプスマップ生成部４５から、N枚のデプス画像（デプスマップ）が供給される。

　メッシュ再分割部８１は、メッシュ処理部４４から供給されるメッシュデータを基に、ビジビリティフラグの「０」と「１」の境界が三角形パッチの境界となるように、三角形パッチを再分割する。メッシュ再分割部８１は、再分割処理後のメッシュデータをパッキング部４７に供給する。

　メッシュ再分割部８１は、三角形パッチの再分割処理において、ビジビリティ判定部４６との間で、ビジビリティ情報と再分割処理後のメッシュデータを必要に応じて受け渡しする。

　メッシュ再分割部８１が三角形パッチの再分割処理を行う点を除いて、図１７の生成装置２２のその他の構成は、図８に示した生成装置２２の構成と同様である。

　図１８乃至図２０を参照して、三角形パッチの再分割処理について説明する。

　例えば、図１８に示されるように、所定の撮像装置２１に、オブジェクトObj11とオブジェクトObj12が写っており、オブジェクトObj11の一部が、オブジェクトObj12によって隠れている状況であるとする。

　撮像装置２１に写るオブジェクトObj11を再分割する前のメッシュデータ、換言すれば、メッシュ処理部４４からメッシュ再分割部８１に供給されるメッシュデータは、図１８の右上に示されるように、２つの三角形パッチTR1およびTR2で構成されている。

　２つの三角形パッチTR1およびTR2の２本の破線で示される内側の領域に、オブジェクトObj12が存在する。三角形パッチ内の一部でも隠れているとビジビリティフラグは「０」となるので、２つの三角形パッチTR1およびTR2のビジビリティフラグは、いずれも「０」となる。三角形パッチTR1およびTR2内の「０」は、ビジビリティフラグを表す。

　一方、２つの三角形パッチTR1およびTR2に対して、メッシュ再分割部８１が三角形パッチの再分割処理を行った後の状態が、図１８の右下に示されている。

　三角形パッチの再分割処理後では、三角形パッチTR1が、三角形パッチTR1a乃至TR1eに分割され、三角形パッチTR2が、三角形パッチTR2a乃至TR2eに分割されている。三角形パッチTR1a,TR1b、および、TR1eのビジビリティフラグは「１」であり、三角形パッチTR1cおよびTR1dのビジビリティフラグは「０」である。三角形パッチTR2a,TR2d、および、TR2eのビジビリティフラグは「１」であり、三角形パッチTR2bおよびTR2cのビジビリティフラグは「０」である。三角形パッチTR1a乃至TR1eおよび三角形パッチTR2a乃至TR2e内の「１」または「０」は、ビジビリティフラグを表す。再分割処理により、オクルージョンの境界が、ビジビリティフラグ「１」と「０」との境界にもなっている。

　図１９は、三角形パッチの再分割処理の手順を説明する図である。

　図１９のAは、再分割処理前の状態を示している。

　メッシュ再分割部８１は、図１９のBに示されるように、ビジビリティ判定部４６で実行されたビジビリティ判定処理の結果に基づいて、メッシュ処理部４４から供給された三角形パッチを、ビジビリティフラグの境界で分割する。

　次に、メッシュ再分割部８１は、図１９のCに示されるように、メッシュ処理部４４から供給された三角形パッチを分割した結果、三角形以外の多角形が含まれているかどうかを判定する。三角形以外の多角形が含まれている場合、メッシュ再分割部８１は、多角形の頂点どうしを結んで、多角形が三角形となるように多角形をさらに分割する。

　多角形を分割すると、図１９のDに示されるように、全てが三角形パッチとなり、三角形パッチの境界が、ビジビリティフラグ「１」と「０」との境界にもなる。

　図２０は、三角形パッチの再分割処理のフローチャートである。

　初めに、ステップＳ８１において、メッシュ再分割部８１は、ビジビリティ判定部４６で実行されたビジビリティ判定処理の結果に基づいて、メッシュ処理部４４から供給された三角形パッチを、ビジビリティフラグの境界で分割する。

　ステップＳ８２において、メッシュ再分割部８１は、ビジビリティフラグの境界で三角形パッチを分割した後の状態に、三角形以外の多角形が含まれているかどうかを判定する。

　ステップＳ８２で、三角形以外の多角形が含まれていると判定された場合、処理はステップＳ８３に進み、メッシュ再分割部８１は、三角形以外の多角形の頂点どうしを結んで、三角形以外の多角形が三角形となるように多角形をさらに分割する。

　一方、ステップＳ８２で、三角形以外の多角形が含まれていないと判定された場合、ステップＳ８３の処理がスキップされる。

　ビジビリティフラグの境界で分割後、三角形以外の多角形が含まれていなかった場合（ステップＳ８２でＮＯの判定の場合）、または、ステップＳ８３の処理後、再分割後のメッシュデータが、ビジビリティ判定部４６およびパッキング部４７に供給され、再分割処理が終了する。ビジビリティ判定部４６は、再分割後のメッシュデータに対して、ビジビリティ情報を生成する。ビジビリティ判定部４６とメッシュ再分割部８１は、１つのブロックで構成してもよい。

　生成装置２２の変形例によれば、ビジビリティフラグ「１」と「０」との境界を、三角形パッチの境界と一致させることで、撮像装置２１のテクスチャ画像に写っているかどうかをより正確に反映することができるので、再生側で生成するオブジェクト画像の画質を向上させることができる。

　以上、画像処理システム１では、生成装置２２が、オブジェクトの３次元形状であるメッシュデータの三角形パッチ単位でビジビリティフラグを生成し、ビジビリティ情報付きのメッシュデータを再生装置２５に供給するようにした。これにより、再生装置２５において、配信側から伝送されてくる各撮像装置２１のテクスチャ画像（正確には補正後のテクスチャ画像）を、表示オブジェクトの色情報（RGB値）の貼り付けに利用できるか否かを判定する必要がなくなる。再生側でビジビリティの判定処理を行う場合には、デプス画像を生成し、デプス情報から撮像装置２１の撮影範囲に写っているか否かを判定する必要があり、計算量が多く、重い処理となっていた。ビジビリティ情報付きのメッシュデータを再生装置２５に供給することで、再生側では、デプス画像の生成およびビジビリティの判定を行う必要がないので、処理負荷を大幅に低減することができる。

　また、再生側でビジビリティの判定を行う場合には、全てのオブジェクトの３Dデータがそろっている必要があるので、撮影時のオブジェクトを増減することはできない。本処理では、ビジビリティ情報が既知であるので、オブジェクトの増減が可能である。例えば、オブジェクトを減らして、必要なオブジェクトのみを選択して描画したり、撮影時には存在していないオブジェクトを追加して描画することなども可能である。従来、撮影時と異なるオブジェクト構成で描画する際には、描画バッファに何度も書き込みする必要があったが、本処理では、中間描画バッファの書き込みが不要である。

　なお、上述した例では、各撮像装置２１のテクスチャ画像（補正後のテクスチャ画像）を圧縮符号化せずに再生側に伝送する構成としたが、動画コーデックで圧縮して伝送してもよい。

　また、上述した例では、被写体の３Dモデルの3D形状データを、ポリゴンメッシュで表現したメッシュデータで伝送する例について説明したが、3D形状データのデータ形式は、その他のデータ形式でもよい。例えば、3D形状データのデータ形式をポイントクラウドやデプスマップとして、その3D形状データにビジビリティ情報を付加して伝送してもよい。この場合、ポイント単位または画素単位でビジビリティ情報を付加することができる。

　また、上述した例では、ビジビリティ情報を、三角形パッチ全部に写っているか否かの２値（「０」または「１」）で表したが、３値以上で表現してもよい。例えば、三角形パッチの３点の頂点が写っている場合を「３」、２点の頂点が写っている場合を「２」、１点の頂点が写っている場合を「１」、全部隠れている場合を「０」、のように、２ビット（４値）で表現してもよい。

＜１１．コンピュータ構成例＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図２１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）３０１，ROM（Read Only Memory）３０２，RAM（Random Access Memory）３０３は、バス３０４により相互に接続されている。

　バス３０４には、さらに、入出力インタフェース３０５が接続されている。入出力インタフェース３０５には、入力部３０６、出力部３０７、記憶部３０８、通信部３０９、及びドライブ３１０が接続されている。

　入力部３０６は、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部３０７は、ディスプレイ、スピーカ、出力端子などよりなる。記憶部３０８は、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部３０９は、ネットワークインタフェースなどよりなる。ドライブ３１０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体３１１を駆動する。

　以上のように構成されるコンピュータでは、CPU３０１が、例えば、記憶部３０８に記憶されているプログラムを、入出力インタフェース３０５及びバス３０４を介して、RAM３０３にロードして実行することにより、上述した一連の処理が行われる。RAM３０３にはまた、CPU３０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータ（CPU３０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体３１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体３１１をドライブ３１０に装着することにより、入出力インタフェース３０５を介して、記憶部３０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部３０９で受信し、記憶部３０８にインストールすることができる。その他、プログラムは、ROM３０２や記憶部３０８に、あらかじめインストールしておくことができる。

　なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。

　本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、上述した複数の実施の形態の全てまたは一部を組み合わせた形態を採用することができる。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。

　なお、本技術は、以下の構成を取ることができる。
（１）
　複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定する判定部と、
　前記判定部の判定結果を、前記被写体の３Dモデルの3D形状データに付加して出力する出力部と
　を備える画像処理装置。
（２）
　前記被写体の３Dモデルの3D形状データは、前記被写体の3D形状をポリゴンメッシュで表現したメッシュデータである
　前記（１）に記載の画像処理装置。
（３）
　前記判定部は、前記判定結果として、前記被写体が写っているか否かを、前記ポリゴンメッシュの三角形パッチ単位で判定する
　前記（２）に記載の画像処理装置。
（４）
　前記出力部は、前記ポリゴンメッシュの法線ベクトル情報に前記判定結果を格納することで、前記判定結果を前記3D形状データに付加する
　前記（２）または（３）に記載の画像処理装置。
（５）
　前記テクスチャ画像は、前記撮像装置が撮像した撮像画像のレンズ歪と色を補正した画像である
　前記（１）乃至（４）のいずれかに記載の画像処理装置。
（６）
　前記複数の撮像装置に対応する複数の前記テクスチャ画像とカメラパラメータとを用いて、デプスマップを生成するデプスマップ生成部をさらに備え、
　前記判定部は、前記デプスマップのデプス値を用いて、前記判定結果を生成する
　前記（１）乃至（５）のいずれかに記載の画像処理装置。
（７）
　前記被写体が写っているか否かを表す判定結果の境界を、前記被写体の３Dモデルの三角形パッチの境界と一致させるように、三角形パッチを分割する再分割部をさらに備える
　前記（１）乃至（６）のいずれかに記載の画像処理装置。
（８）
　前記撮像装置の前記撮像画像に対応する前記テクスチャ画像とカメラパラメータを送信する画像送信部をさらに備える
　前記（１）乃至（７）のいずれかに記載の画像処理装置。
（９）
　画像処理装置が、
　複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定し、その判定結果を、前記被写体の３Dモデルの3D形状データに付加して出力する
　画像処理方法。
（１０）
　テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、前記３Dモデルの画像を生成する描画処理部
　を備える画像処理装置。
（１１）
　N台の撮像装置のなかから、M台（M≦N）の撮像装置を選択し、前記M台の撮像装置に対応するM枚のテクスチャ画像を取得するカメラ選択部をさらに備え、
　前記描画処理部は、前記M枚のテクスチャ画像のなかから、前記判定結果を参照し、前記被写体が写っているK枚（K≦M）のテクスチャ画像を選択する
　前記（１０）に記載の画像処理装置。
（１２）
　前記描画処理部は、前記K枚のテクスチャ画像のなかのL枚（L≦K）のテクスチャ画像の色情報をブレンディングし、前記３Dモデルの画像を生成する
　前記（１１）に記載の画像処理装置。
（１３）
　前記判定結果付き３D形状データを、前記判定結果と前記3D形状データとに分離する分離部をさらに備える
　前記（１０）乃至（１２）のいずれかに記載の画像処理装置。
（１４）
　画像処理装置が、
　テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、３Dモデルの画像を生成する
　画像処理方法。

　１　画像処理システム，　２１　撮像装置，　２２　生成装置，　２３　配信サーバ，　２５　再生装置，　２６　表示装置，　２７　視聴位置検出装置，　４１　歪・色補正部，　４４　メッシュ処理部，　４５　デプスマップ生成部，　４６　ビジビリティ判定部，　４７　パッキング部，　４８　画像送信部，　６１　アンパッキング部，　６２　カメラ選択部，　６３　描画処理部，　８１　メッシュ再分割部，　３０１　CPU，　３０２　ROM，　３０３　RAM，　３０６　入力部，　３０７　出力部，　３０８　記憶部，　３０９　通信部，　３１０　ドライブ

Claims

　複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定する判定部と、
　前記判定部の判定結果を、前記被写体の３Dモデルの3D形状データに付加して出力する出力部と
　を備える画像処理装置。
　前記被写体の３Dモデルの3D形状データは、前記被写体の3D形状をポリゴンメッシュで表現したメッシュデータである
　請求項１に記載の画像処理装置。
　前記判定部は、前記判定結果として、前記被写体が写っているか否かを、前記ポリゴンメッシュの三角形パッチ単位で判定する
　請求項２に記載の画像処理装置。
　前記出力部は、前記ポリゴンメッシュの法線ベクトル情報に前記判定結果を格納することで、前記判定結果を前記3D形状データに付加する
　請求項２に記載の画像処理装置。
　前記テクスチャ画像は、前記撮像装置が撮像した撮像画像のレンズ歪と色を補正した画像である
　請求項１に記載の画像処理装置。
　前記複数の撮像装置に対応する複数の前記テクスチャ画像とカメラパラメータとを用いて、デプスマップを生成するデプスマップ生成部をさらに備え、
　前記判定部は、前記デプスマップのデプス値を用いて、前記判定結果を生成する
　請求項１に記載の画像処理装置。
　前記被写体が写っているか否かを表す判定結果の境界を、前記被写体の３Dモデルの三角形パッチの境界と一致させるように、三角形パッチを分割する再分割部をさらに備える
　請求項１に記載の画像処理装置。
　前記撮像装置の前記撮像画像に対応する前記テクスチャ画像とカメラパラメータを送信する画像送信部をさらに備える
　請求項１に記載の画像処理装置。
　画像処理装置が、
　複数の撮像装置それぞれが撮像した撮像画像に対応するテクスチャ画像に被写体が写っているか否かを判定し、その判定結果を、前記被写体の３Dモデルの3D形状データに付加して出力する
　画像処理方法。
　テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、前記３Dモデルの画像を生成する描画処理部
　を備える画像処理装置。
　N台の撮像装置のなかから、M台（M≦N）の撮像装置を選択し、前記M台の撮像装置に対応するM枚のテクスチャ画像を取得するカメラ選択部をさらに備え、
　前記描画処理部は、前記M枚のテクスチャ画像のなかから、前記判定結果を参照し、前記被写体が写っているK枚（K≦M）のテクスチャ画像を選択する
　請求項１０に記載の画像処理装置。
　前記描画処理部は、前記K枚のテクスチャ画像のなかのL枚（L≦K）のテクスチャ画像の色情報をブレンディングし、前記３Dモデルの画像を生成する
　請求項１１に記載の画像処理装置。
　前記判定結果付き３D形状データを、前記判定結果と前記3D形状データとに分離する分離部をさらに備える
　請求項１０に記載の画像処理装置。
　画像処理装置が、
　テクスチャ画像に被写体が写っているかを表す判定結果が付加された、前記被写体の３Dモデルの3D形状データである判定結果付き３D形状データに基づいて、３Dモデルの画像を生成する
　画像処理方法。