WO2020209108A1

WO2020209108A1 - 画像処理装置、３ｄモデル生成方法、およびプログラム

Info

Publication number: WO2020209108A1
Application number: PCT/JP2020/014171
Authority: WO
Inventors: 高橋　宏彰; 徹也福安
Original assignee: ソニー株式会社
Priority date: 2019-04-12
Filing date: 2020-03-27
Publication date: 2020-10-15
Also published as: CN113647093A; US20220172474A1; JPWO2020209108A1

Abstract

本技術は、３Dモデル生成のための多視点撮影において、撮影の失敗を減らすことができるようにする画像処理装置、３Dモデル生成方法、およびプログラムに関する。画像処理装置は、複数の多視点画像から生成された撮像範囲の３D領域を生成する３D領域計算部と、３D領域を特定視点に投影した領域画像と、特定視点に対応する撮像装置からの被写体画像とに基づいて、撮像装置の被写体の撮影状況を判定する判定部とを備える。本技術は、例えば、３Dモデル生成のための画像処理装置等に適用できる。

Description

画像処理装置、３Ｄモデル生成方法、およびプログラム

　本技術は、画像処理装置、３Dモデル生成方法、およびプログラムに関し、特に、３Dモデル生成のための多視点撮影において、撮影の失敗を減らすことができるようにした画像処理装置、３Dモデル生成方法、およびプログラムに関する。

　多視点で撮影された動画像から被写体の３Dモデルを生成し、任意の視聴位置に応じた３Dモデルの仮想視点画像を生成することで自由な視点の画像を提供する技術がある。この技術は、ボリューメトリックキャプチャ技術などとも呼ばれている。

　３Dモデルの生成には、異なる方向からの複数の撮像画像を用いて被写体の３次元形状の削り出しを行うVisual Hull等の手法が用いられる（例えば、特許文献１参照）。カメラの台数を増やすことで、３Dモデルの精度が向上するため、異なる方向から多数のカメラで被写体を撮影することが好ましい。

国際公開第２０１８／１５０９３３号

　しかしながら、カメラの台数が多いと、被写体が動いた場合に、あるカメラの撮像範囲から外れてしまうことがあり、撮影のやり直しが必要になる場合があった。

　本技術は、このような状況に鑑みてなされたものであり、３Dモデル生成のための多視点撮影において、撮影の失敗を減らすことができるようにするものである。

　本技術の一側面の画像処理装置は、複数の多視点画像から生成された撮像範囲の３D領域を生成する生成部と、前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する判定部とを備える。

　本技術の一側面の３Dモデル生成方法は、被写体の３Dモデルを生成する３Dモデル生成方法であって、複数の多視点画像から生成された撮像範囲の３D領域を生成するステップと、前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定するステップと、前記複数の多視点画像に基づいて被写体の３Dモデルを生成するステップとを有する。

　本技術の一側面のプログラムは、コンピュータを、複数の多視点画像から生成された撮像範囲の３D領域を生成する生成部と、前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する判定部として機能させるためのものである。

　本技術の一側面においては、数の多視点画像から生成された撮像範囲の３D領域が生成され、前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況が判定される。

　なお、本技術の一側面の画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。コンピュータに実行させるプログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。

　画像処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

本技術を適用した画像処理システムの構成例を示す図である。画像処理システムの通知例を説明する図である。画像処理装置の第１実施の形態の構成例を示すブロック図である。３D領域を計算する処理例を示す図である。有効領域マスク画像の処理例を示す図である。視認カメラ情報の例を示す図である。シルエット抽出部の処理例を示す図である。判定部のカメラ判定処理を説明する図である。第１の撮像範囲判定処理を説明するフローチャートである。画像処理装置の第２実施の形態の構成例を示すブロック図である。第２の撮像範囲判定処理を説明するフローチャートである。画像処理装置の第３実施の形態の構成例を示すブロック図である。第３実施の形態の３D領域計算部の処理を説明する図である。第３実施の形態の投影部の処理を説明する図である。カメラ配置のその他の例を示す図である。本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

　以下、本技術を実施するための形態（以下、実施の形態という）について説明する。なお、説明は以下の順序で行う。
１．画像処理システムの構成例
２．画像処理装置の第１実施の形態
３．第１の撮像範囲判定処理
４．画像処理装置の第２実施の形態
５．第２の撮像範囲判定処理
６．画像処理装置の第３実施の形態
７．第３の撮像範囲判定処理
８．カメラ配置のその他の例
９．コンピュータ構成例

＜１．画像処理システムの構成例＞
　図１は、本技術を適用した画像処理システムの構成例を示している。

　図１の画像処理システムは、例えば、N台の撮像装置CAM-1乃至CAM-N、画像処理装置１１、および、表示装置１２により構成される。

　撮像装置CAM-1乃至CAM-N（N＞１）は、図１に示されるように、被写体である人物を囲むように配置されて被写体を撮影し、その結果得られる撮像画像を画像処理装置１１に供給する。撮像画像は、動画像または連番静止画像として各撮像装置CAMから画像処理装置１１へ順次供給される。撮像装置CAM-1乃至CAM-Nから供給される複数の撮像画像は、被写体を撮影する視点が異なる複数の多視点画像である。図１の例では、N=8とされ、８台の撮像装置CAM-1乃至CAM-8が被写体を取り囲むように配置された例が示されている。

　画像処理装置１１は、撮像装置CAM-1乃至CAM-Nそれぞれから供給される複数の撮像画像から、被写体をオブジェクトとしたオブジェクトの３Dモデルを生成する。生成されたオブジェクトの３Dモデルのデータは、例えば、各撮像装置CAMにより得られた被写体の撮像画像の画像データと、被写体の3D形状を表した3D形状データとで構成される。3D形状データは、例えば、複数の撮像装置CAMで撮影された撮像画像に対応するデプス画像でもよいし、オブジェクトの３次元位置を点の集合で表したポイントクラウドや、頂点（Vertex）と頂点間のつながりで表したポリゴンメッシュなどで表される。

　表示装置１２は、画像処理装置１１から供給される所定の画像を表示する。

　なお、画像処理装置１１は、撮像装置CAM-1乃至CAM-Nから撮像画像を直接取得する代わりに、データサーバなど所定の記憶部に一旦記憶された撮像画像を取得して、オブジェクトの３Dモデルを生成することもできる。また、撮像装置CAM-1乃至CAM-Nから取得した撮像画像と、記憶部に記憶された撮像画像の組み合わせにより、オブジェクトの３Dモデルを生成することもできる。

　本実施の形態では、各撮像装置CAMが生成する動画像は、RGBの波長を含む撮像画像（RGB画像）で構成されるものとするが、IR（赤外線）画像を含むマルチスペクトル画像であってもよい。

　また、各撮像装置CAMは、露光条件、光源位置、または、光源色などの撮像条件を変えて複数回撮影を行い、その結果得られる撮像画像を画像処理装置１１に供給してもよい。

　さらに、各撮像装置CAMは、測距センサを備え、被写体までの距離も測定し、被写体のテクスチャ情報であるRGBの撮像画像に加えて、被写体までの距離をデプス値として撮像画像の各画素に対応させて格納したデプス画像も生成し、画像処理装置１１に供給してもよい。また、測距センサは各撮像装置CAMとは独立に配置してもよい。この場合、撮像装置CAMと測距センサ（測距装置）の個数は異なってもよい。

　画像処理装置１１は、クラウド上のサーバ装置であってもよく、表示装置１２は、スマートフォン（携帯端末）などのディスプレイを備える装置でもよい。複数の撮像装置CAMと画像処理装置１１との間、および、画像処理装置１１と表示装置１２との間は、直接接続されることで通信を行ってもよいし、LAN（Local Area Network）、インターネット等の所定のネットワークを介して接続されて通信を行ってもよい。

　オブジェクトの３Dモデルの生成では、撮像装置CAMの台数を増やすことで、３Dモデルの精度が向上するため、異なる方向から多数の撮像装置CAMで被写体を撮影することが好ましい。しかしながら、撮像装置CAMの台数が多いと、被写体が動いた場合に、１以上の撮像装置CAMの撮像範囲から外れてしまうことがあり、撮影のやり直しが必要になる場合がある。

　画像処理装置１１は、撮影中に、N台の撮像装置CAMそれぞれから送信されてくる撮像画像からサムネイル画像を生成し、表示装置１２に表示させることができる。なお、表示装置１２に表示させるサムネイル画像は、N台の撮像装置CAMそれぞれの撮像画像に対応する全てのサムネイル画像でもよいし、代表する１台の撮像装置CAMによる撮像画像に対応する１枚のサムネイル画像（代表サムネイル画像）でもよい。また、所定の複数台の撮像装置CAMに対応する複数枚のサムネイル画像でもよい。サムネイル画像とは、撮像装置CAMで得られた撮像画像に対して、解像度やフレームレートを落とした画像である。

　また、画像処理装置１１は、撮影中に被写体が動いたことにより、被写体が所定の撮像装置CAMの撮像範囲から外れたか否かを判定し、撮像範囲から外れたことをユーザに通知することができる。ここでのユーザは、撮影者や被写体となっている人物である。

　図２は、画像処理装置１１が、被写体が所定の撮像装置CAMの撮像範囲から外れたか否かを判定して、撮像範囲から外れたことをユーザに通知する場合の通知例を示している。

　図２のAは、表示装置１２に、「WARNING：CAM05」のメッセージ（文字）をダイアログで表示することにより、被写体が撮像装置CAM-5の撮像範囲から外れたことをユーザに通知する例を示している。

　図２のBは、表示装置１２に表示された代表サムネイル画像に「WARNING：CAM05」のメッセージを重畳することにより、被写体が撮像装置CAM-5の撮像範囲から外れたことをユーザに通知する例を示している。

　なお、N台の撮像装置CAMに対応する全てのサムネイル画像を表示する場合には、被写体が撮像範囲から外れた撮像装置CAMのサムネイル画像に「WARNING」のメッセージを重畳してユーザに通知すればよい。

　図２のCは、所定の撮像装置CAMで得られた撮像画像から生成した被写体のシルエット画像に、撮像範囲から外れた被写体の領域を色付けすることにより、被写体の色付けされた領域が撮像範囲から外れたことをユーザに通知する例を示している。

　シルエット画像とは、描画対象のオブジェクトである被写体の領域（被写体領域）をシルエットで表した画像であり、例えば、各画素の画素値が「０」または「１」に２値化された２値画像である。シルエット画像は、例えば、被写体の領域が「１」の画素値に設定され、白色で表現され、被写体以外の領域が「０」の画素値に設定され、黒色で表現される。

　図２のCの例では、シルエット画像の白色で表された被写体領域のうち、足の領域が赤色で着色されて、撮像範囲から外れたことをユーザに通知している。なお、図２では、図面の制約上、赤色の領域がハッチングで示されている。

　以上のように、画像処理装置１１は、被写体をオブジェクトとして、オブジェクトの３Dモデルを生成するオブジェクト生成機能に加え、被写体と撮像範囲との位置関係を判定して、被写体が撮像範囲外となるときにユーザに通知（警告）する撮像範囲判定機能を備える。

　なお、被写体が撮像範囲外となるときにユーザに通知する場合に、１台の撮像装置CAMで撮像範囲から外れた場合に、ユーザに通知してもよいし、多数の撮像装置CAMで構成される場合には、予め設定した所定の台数以上の撮像装置CAMで撮像範囲から外れた場合に、ユーザに通知するようにしてもよい。この場合、後述する判定部３６において何台以上で通知するかを設定（指定）することができる。

　また、図２の例は、表示装置１２に文字または画像を表示することで、被写体が所定の撮像範囲から外れたことを通知する例を説明したが、その他の方法で通知してもよい。例えば、ビープ音を出力して通知したり、「５番のカメラが外れました」や、「足がはみ出ています」などの音声を出力して通知してもよい。ビープ音や音声による音で通知する場合、スピーカを追加で設けてもよいし、表示装置１２のスピーカを用いてもよい。また、表示装置１２の画面表示と、音による出力の両方を行ってもよい。また、即時的な通知に代えて通知情報を撮像画像とともに記憶部に記憶し、事後的に通知できるようにしてもよい。例えば、撮像画像または3D形状データにタグ情報として通知情報を埋め込んだり、撮像画像および3D形状データとは別に、通知情報を格納したファイルを生成し、記憶させることができる。ユーザが撮像画像や３Ｄモデルを見たときに、タグ情報またはファイルに含まれる通知情報に基づく、文字、画像、または、音などにより、通知を行うことができる。

　以下では、画像処理装置１１による撮像範囲判定機能について詳しく説明する。なお、画像処理装置１１によるオブジェクト生成機能については、一般的な手法を用いて実現することとして、簡単な説明とする。

＜２．画像処理装置の第１実施の形態＞
　図３は、画像処理装置１１の第１実施の形態の構成例を示すブロック図である。

　画像処理装置１１は、画像入力部３１、キャリブレーション処理部３２、有効領域算出部３３、シルエット抽出部３４、セマンティック処理部３５、判定部３６、通知部３７、３Dモデル計算部３８、および、記憶部３９により構成される。有効領域算出部３３は、３D領域計算部４１と投影部４２で構成される。なお、セマンティック処理部３５は、オプションとして設ける構成であり、省略することができる。

　画像入力部３１は、N台の撮像装置CAMそれぞれから送信されてくる撮像画像を取得する。撮像画像は、動画像として順次入力される。N台の撮像装置CAMそれぞれからのN枚の撮像画像は、キャリブレーション処理部３２、シルエット抽出部３４、セマンティック処理部３５、通知部３７、および、３Dモデル計算部３８に供給される。

　キャリブレーション処理部３２は、N台の撮像装置CAMで撮影されたN枚の撮像画像に基づいて、各撮像装置CAMのカメラパラメータを算出するキャリブレーション処理を行う。キャリブレーション処理部３２は、例えば、白と黒の格子状のチェスパターンが付されたチェスボードをN台の撮像装置CAMで撮影したN枚の撮像画像を用いて、キャリブレーション処理を行う。キャリブレーション処理により、N台の撮像装置CAMそれぞれの単体での撮像装置CAMの特性を表す特性パラメータと、他の撮像装置CAMとの関係を表す外部パラメータとが決定される。単体での撮像装置CAMの特性を表す特性パラメータには、例えば、撮像装置CAMの焦点距離、主点、画角などの内部パラメータと、歪み（収差）などの光学特性パラメータとが含まれる。外部パラメータは、他の撮像装置CAMに対する自分の撮像装置CAMの相対座標値（相対位置）を含む。

　なお、N台の撮像装置CAMの位置が固定されている場合には、３Dモデル生成のための撮影前に、１度、チェスボードを撮影し、キャリブレーション処理を実行すればよい。撮像装置CAMの位置が移動したり、ズーム（画角）などが変更される場合には、撮影開始前のキャリブレーション処理に加えて、被写体の特徴点検出などに基づくリアルタイムのキャリブレーション処理も行う必要がある。

　なお、キャリブレーション処理は、上述したチェスボードを用いた方法に限定されず、所要のパラメータを決定できる手法であれば、その他の方法でももちろんよい。キャリブレーション処理により決定された各種のパラメータは、カメラパラメータとして、有効領域算出部３３（の３D領域計算部４１および投影部４２）に供給される。

　有効領域算出部３３の３D領域計算部４１は、キャリブレーション処理部３２から供給されるカメラパラメータに基づいて、N台全ての撮像装置CAMの撮像範囲に含まれる３D領域を計算する。

　図４は、N=6として、６台の撮像装置CAM-1乃至CAM-6それぞれの撮像範囲に含まれる領域である３D領域５１を３D領域計算部４１が計算する処理例を示している。

　N台全ての撮像装置CAMの撮像範囲に含まれる３D領域を計算する手法としては、例えば、カメラパラメータに従って各撮像装置CAMの撮像範囲を投影し、３次元形状の削り出しを行うVisual Hullの手法などを用いることができる。その他、３次元幾何などを用いて、３D領域を計算してもよい。算出した３D領域を表すデータは、オブジェクトの３次元位置を点の集合で表したポイントクラウドや、直方体格子の集合で表したボクセルデータ、頂点（Vertex）と頂点間のつながりで表したポリゴンメッシュなど、所定の３Dデータ形式で、投影部４２に供給される。

　投影部４２には、３D領域計算部４１から、N台全ての撮像装置CAMの撮像範囲に含まれる３D領域が供給されるとともに、キャリブレーション処理部３２から、カメラパラメータが供給される。

　投影部４２は、３D領域計算部４１からの３D領域を、ターゲットカメラとなる所定の撮像装置CAMの視点に投影し、３D領域に相当する領域を白色（画素値「１」）、３D領域以外の領域を黒色（画素値「０」）に設定した２値画像で表した有効領域マスク画像（領域画像）を生成する。有効領域マスク画像は、N台の撮像装置CAMそれぞれをターゲットカメラとして、全ての撮像装置CAMについて生成されるので、撮像装置CAMの台数Nと同じ枚数（即ちN枚）、生成される。以下、有効領域マスク画像において白色で表される領域を、投影３D領域と称する。

　図５は、図４に示した６台の撮像装置CAM-1乃至CAM-6に対応する３D領域５１を、撮像装置CAM-1をターゲットカメラとして、ターゲットカメラの視点に投影した有効領域マスク画像５２の例を示している。

　有効領域マスク画像５２は、３D領域５１を撮像装置CAM-1の視点に投影した投影面（撮像範囲）のうち、３D領域５１に相当する投影３D領域５３を白色（画素値「１」）、投影３D領域５３以外の領域を黒色（画素値「０」）に設定した２値画像で表される。

　さらに、投影部４２は、被写体の表面を何台の撮像装置CAMが見ることができるかを示した台数情報と、どの撮像装置CAMが被写体の表面を見ることができるかを示すカメラ情報とを含む視認カメラ情報を生成することができる。

　図６は、５台の撮像装置CAM-1乃至CAM-5で撮像したときの視認カメラ情報の例を示している。

　図６に示されるように、有効領域マスク画像５２の投影３D領域５３の内部が、被写体の表面を見ることができる撮像装置CAMの台数で区分されている。この台数が、被写体を直接視認できる撮像装置CAMの台数を示す台数情報を表す。３D領域５１の表面上の各点を各撮像装置CAMに投影することによりターゲットの撮像装置CAMから直接視認できるかを判定することができる。どの撮像装置CAMが被写体（３D領域５１）の表面を見ることができるかがわかれば、合計で何台の撮像装置CAMから被写体（３D領域５１）の表面が見えているかも集計することができる。

　図３に戻り、投影部４２は、生成したN枚の有効領域マスク画像と、視認カメラ情報を、判定部３６に供給する。

　シルエット抽出部３４は、画像入力部３１から供給されるN枚の撮像画像それぞれに対して、描画対象のオブジェクトである被写体の領域をシルエットとして抽出したシルエット画像を生成する。生成されたシルエット画像は、判定部３６に供給される。

　テクスチャ画像内の被写体のシルエットを検出する検出方法は、特に限定されず、任意の手法を採用することができる。例えば、図７に示されるように、被写体を含まない背景のみが撮像された背景画像６２を予め撮像して保持しておき、撮像画像６１と背景画像６２との差分をとる背景差分法を用いることにより、シルエット画像６３を生成することができる。

　また、被写体までの距離がデプス値として格納されたデプス画像も取得されている場合には、デプス画像の距離情報から被写体領域である前景領域と背景領域とを分離することで、シルエット画像を生成することができる。

　あるいはまた、Graph Cut、クロマキーなどのイメージマッティング技術を用いて、１枚の撮像画像のみから被写体領域を抽出し、シルエット画像を生成してもよい。

　セマンティック処理部３５は、撮像画像に被写体として写る物体のセマンティック情報を識別して、所定の領域ごとに付加するセマンティックセグメンテーション処理を行う。例えば、被写体が人物である場合には、セマンティック処理部３５は、セマンティックセグメンテーション処理により、人物全体の被写体領域を、頭、手（右手、左手）、腕（右腕、左腕）、足（右足、左足）、胴体、などのように部分ごとに識別し、分類することができる。被写体が人物ではない場合には、セマンティック処理部３５は、ボール、ラケット、車など、物体の種類を識別して付加することができる。セマンティック処理部３５は、被写体を識別して所定の領域ごとに付加したセマンティック情報を、判定部３６に供給する。このセマンティック情報は、個体情報を含むインスタンスセマンティックセグメンテーションであってもよい。個体情報を活用することによって、例えば、一人、二人など被写体数や特定の被写体に着目した処理が可能となる。

　判定部３６は、投影部４２からのN台の撮像装置CAMに対応するN枚の有効領域マスク画像と、判定部３６から供給されるN枚のシルエット画像とに基づいて、各撮像装置CAMの被写体の撮影状況を判定する。

　具体的には、判定部３６は、N台の撮像装置CAMそれぞれをターゲットカメラとして、次の他カメラ判定処理と自カメラ判定処理とを行う。判定部３６は、ターゲットカメラの撮像装置CAMに対応する有効領域マスク画像とシルエット画像とのペアを用いて、被写体がターゲットカメラ以外の撮像装置CAMの撮像範囲から外れたか否かを判定する他カメラ判定処理を行う。また、判定部３６は、ターゲットカメラの撮像装置CAMに対応するシルエット画像を用いて、被写体がターゲットカメラの撮像装置CAMの撮像範囲から外れたか否かを判定する自カメラ判定処理を行う。

　他カメラ判定処理では、判定部３６は、図８のAに示されるように、シルエット画像において白色で表された被写体領域７１が、有効領域マスク画像５２において白色で表された投影３D領域５３からはみ出たか否かを、被写体領域７１の画素ごとに比較する。

　自カメラ判定処理では、判定部３６は、図８のBに示されるように、シルエット画像において白色で表された被写体領域７１が、シルエット画像６３の外周の４辺と接しているか否かを、被写体領域７１の画素ごとに比較する。

　なお、上述したように、セマンティック処理部３５をオプションとして設けることができるが、セマンティック処理部３５を設けた場合、判定部３６は、セマンティック処理部３５からのセマンティック情報を用いて、投影３D領域５３からはみ出た被写体の部位（例えば、右足や左手など）や物体（ボール）などを特定することができる。

　判定部３６は、判定結果を示す判定情報として、ターゲットカメラである各撮像装置CAMの撮像範囲から外れたか否かの結果と、撮像範囲から外れた場合に、どの撮像装置CAMで外れたかを示す装置特定情報とを通知部３７に供給する。なお、判定情報は、常時、通知部３７に供給してもよいし、撮像範囲から外れた場合のみ、通知部３７に供給するようにしてもよい。

　また、セマンティック処理部３５が設けられている場合には、判定部３６は、撮像範囲から外れた場合に、撮像範囲から外れた被写体の物体や部位などのセマンティック特定情報も、判定情報の一部として、通知部３７に供給することができる。

　さらに、図２のBおよびCのように、通知部３７が撮像画像やシルエット画像とともに撮像範囲から外れたことをユーザに通知する場合には、撮像範囲から外れたターゲットカメラのシルエット画像や撮像画像も、判定部３６から通知部３７に供給される。

　通知部３７は、判定部３６からの判定情報に基づいて、特定の撮像装置CAMにおいて撮像範囲から外れたことをユーザに通知する通知情報を生成し、表示装置１２に出力する。

　通知情報は、図２のAに示したダイアログ表示の場合は、撮像範囲から外れた撮像装置CAMの情報を含むメッセージのダイアログを表示させる表示制御情報である。また、図２のBまたはCの例では、通知情報は、撮像範囲から外れた撮像装置CAMの情報と、シルエット画像または撮像画像を表示させる表示制御情報となる。シルエット画像や撮像画像は、必要に応じて縮小処理などを施し、サムネイル画像として表示装置１２に出力することができる。

　また、ビープ音や「５番のカメラが外れました」などの音を出力してユーザに通知する場合には、通知情報は、音響信号を含む音声制御情報となる。通知情報は、画面の表示と音声の両方でもよいし、いずれか一方でもよい。セマンティック処理部３５が設けられている場合には、「足が撮像範囲からはみ出ました」、「ボールが撮像範囲外です」などのような通知が可能である。表示装置１２は、通知部３７からの通知情報に基づいて、特定の撮像装置CAMにおいて撮像範囲から外れたことをユーザへ通知する。

　３Dモデル計算部３８は、N台の撮像装置CAMそれぞれから供給される被写体の撮像画像を用いて、被写体をオブジェクトとしたオブジェクトの３Dモデルを生成し、生成したオブジェクトの３Dモデルのデータ（3Dモデルデータ）を記憶部３９に供給する。

　例えば、３Dモデル計算部３８は、撮像装置CAMから供給される被写体を含む撮像画像と背景画像との差分を抽出することにより、被写体領域を抽出したシルエット画像を生成する。そして、３Dモデル計算部３８は、N台の撮像装置CAMそれぞれの異なる方向の複数枚のシルエット画像とカメラパラメータを用いて、Visual Hull等の手法により、オブジェクトの3Dモデルを生成する。シルエット画像とカメラパラメータは、キャリブレーション処理部３２とシルエット抽出部３４から取得してもよいし、別途算出してもよい。オブジェクトの３Dモデルの生成についての詳細は本明細書では省略する。

　記憶部３９は、３Dモデル計算部３８で生成された３Dモデルデータを記憶する。記憶された３Dモデルデータは、オブジェクトの３Dモデルを再生する再生装置などに必要に応じて提供され、再生装置で再生（復元）される。

　画像処理装置１１は、以上のように構成される。

　なお、画像処理装置１１が実行可能な撮像範囲判定機能とオブジェクト生成機能は、同一の装置ではなく、別々の装置で実現してもよい。その場合、撮像範囲判定機能を実行する画像処理装置１１は、例えば、画像入力部３１、キャリブレーション処理部３２、有効領域算出部３３、シルエット抽出部３４、セマンティック処理部３５、判定部３６、および、通知部３７により構成される。オブジェクト生成機能を実行する画像処理装置１１は、例えば、画像入力部３１、３Dモデル計算部３８、および、記憶部３９により構成される。

＜３．第１の撮像範囲判定処理＞
　次に、図９のフローチャートを参照して、画像処理装置１１の第１実施の形態による第１の撮像範囲判定処理について説明する。この処理は、例えば、N台の撮像装置CAMで撮影が開始されると同時に開始される。

　初めに、ステップＳ１において、画像入力部３１は、N台の撮像装置CAMそれぞれから送信されてくる撮像画像を取得する。取得したN枚の撮像画像は、キャリブレーション処理部３２、シルエット抽出部３４、セマンティック処理部３５、通知部３７、および、３Dモデル計算部３８に供給される。

　ステップＳ２において、キャリブレーション処理部３２は、N台の撮像装置CAMで撮影されたN枚の撮像画像に基づいて、各撮像装置CAMのカメラパラメータを算出するキャリブレーション処理を行う。この処理により、各撮像装置CAMの特性を表す特性パラメータ（内部パラメータと光学特性パラメータ）と、撮像装置CAM間の相対位置関係を表す外部パラメータとが得られる。

　ステップＳ３において、３D領域計算部４１は、キャリブレーション処理部３２から供給されたカメラパラメータに基づいて、N台全ての撮像装置CAMの撮像範囲に含まれる３D領域を計算する。

　ステップＳ４において、投影部４２は、３D領域計算部４１で計算された３D領域を、各撮像装置CAMの視点に投影した有効領域マスク画像を生成する。有効領域マスク画像は、撮像装置CAMの台数と同じN枚生成される。また、投影部４２は、撮像装置CAMの撮像範囲が直接見えている撮像装置CAMの台数を示した台数情報や、どの撮像装置CAMから見えているかを示すカメラ情報を表した視認カメラ情報も生成することができる。生成されたN枚の有効領域マスク画像と、N枚の視認カメラ情報は、判定部３６に供給される。

　ステップＳ５において、シルエット抽出部３４は、画像入力部３１から供給されたN枚の撮像画像から、N枚のシルエット画像を生成する。生成されたN枚のシルエット画像は、判定部３６に供給される。

　ステップＳ６において、セマンティック処理部３５は、画像入力部３１から供給されたN枚の撮像画像に対してセマンティックセグメンテーション処理を実行することによりセマンティック情報を生成して、判定部３６に供給する。この処理は、撮像装置CAMの撮像範囲から外れた物体や人物の部位を特定する必要がない場合には、省略することができる。

　ステップＳ７において、判定部３６は、投影部４２からのN枚の有効領域マスク画像と、判定部３６からのN枚のシルエット画像とに基づいて、被写体が撮像装置CAMの撮像範囲から外れたか否かを判定するカメラ判定処理を行う。より具体的には、判定部３６は、被写体がターゲットカメラ以外の撮像装置CAMの撮像範囲から外れたか否かを判定する他カメラ判定処理と、ターゲットカメラの撮像装置CAMの撮像範囲から外れたか否かを判定する自カメラ判定処理を行う。各撮像装置CAMをターゲットカメラとして実行される他カメラ判定処理と自カメラ判定処理の判定結果を示す判定情報が、判定部３６から通知部３７に供給される。

　ステップＳ８において、通知部３７は、判定部３６からの判定情報に基づいて、特定の撮像装置CAMにおいて撮像範囲から外れたことをユーザに通知する通知情報を生成し、表示装置１２に出力する。どの撮像装置CAMの撮像範囲からも外れていない場合には、特に通知情報は不要である。

　ステップＳ９において、表示装置１２は、通知部３７からの通知情報に基づいて、特定の撮像装置CAMにおいて撮像範囲から外れたことをユーザへ通知する。

　以上で、第１の撮像範囲判定処理が終了する。第１の撮像範囲判定処理によれば、被写体を撮影している複数の撮像装置CAMにおいて撮像範囲から外れた場合に、ユーザに通知することができるので、３Dモデル生成のための多視点撮影において、撮影の失敗を減らすことができる。

　上述した第１の撮像範囲判定処理において、判定部３６は、被写体が撮像装置CAMの撮像範囲から外れたか否かを判定するようにしたが、完全に撮像範囲から外れたか否かに加えて、被写体がもう少し移動した場合に撮像範囲から外れそうな状態であるか否かについても判定し、ユーザに通知してもよい。この場合、３D領域計算部４１が計算した３D領域５１をターゲットカメラの視点に投影した投影３D領域５３より所定の割合（例えば、１０％）だけ狭い範囲を被写体領域が外れた場合に、被写体が撮像範囲から外れそうな状態であるとして、通知することができる。あるいは、被写体の動きベクトルを検出して、所定時間後に予測される被写体の位置が、投影３D領域５３の外側となる場合に、被写体が撮像範囲から外れそうな状態であるとして、通知することができる。また、投影３D領域５３から特定量はみ出した場合に、通知するようにしてもよいし、セマンティック処理部３５で求めたセマンティック情報に基づき、特定の部位がはみ出したことを検出した場合に、通知するようにしてもよい。

　図９で説明した第１の撮像範囲判定処理は、N台の撮像装置CAMで撮影された新たな撮像画像が入力される度に繰り返し実行されるが、撮像画像の更新で変更がない処理は適宜省略することができる。例えば、ステップＳ２のキャリブレーション処理、ステップＳ３およびＳ４の有効領域マスク画像を生成する処理は、N台の撮像装置CAMの位置や画角が同じ場合には、最初の１度だけ実行すればよい。あるいはまた、３Dモデルを生成する撮影を行う前に実行してもよい。

　N台の撮像装置CAMそれぞれで撮影された撮像画像が、順次、画像処理装置１１に入力されると、上述した撮像範囲判定処理と並行して、３Dモデル計算部３８による３Dモデル生成処理も実行される。撮像範囲判定処理と３Dモデル生成処理とは、独立して実行してもよいし、連携して実行することも可能である。例えば、撮像範囲判定処理において、被写体が撮像装置CAMの撮像範囲から外れたことを示す判定情報を、判定部３６から３Dモデル計算部３８にも供給するようにして、被写体が撮像装置CAMの撮像範囲から外れた場合に、３Dモデルの生成を中止または中断してもよい。

＜４．画像処理装置の第２実施の形態＞
　図１０は、画像処理装置１１の第２実施の形態の構成例を示すブロック図である。

　図１０において、図３に示した第１実施の形態と対応する部分については同一の符号を付してあり、その部分の説明は適宜省略する。

　上述した第１実施の形態にかかる画像処理装置１１は、被写体が撮像装置CAMの撮像範囲から外れるか否かの判定の正確性を重視した構成であるのに対して、第２実施の形態にかかる画像処理装置１１は、リアルタイム性を重視した場合の構成である。

　第２実施の形態では、画像処理装置１１は、N台の撮像装置CAMのなかから選択されたM台（N＞M）の撮像装置CAMの撮像画像のみを用いて、被写体が撮像装置CAMの撮像範囲から外れたか否かを判定するカメラ判定処理を行う。

　図１０の第２実施の形態にかかる画像処理装置１１は、カメラ選択部８１と縮小処理部８２が新たに設けられている点で、第１実施の形態と相違する。

　カメラ選択部８１には、キャリブレーション処理部３２から、各撮像装置CAMのカメラパラメータが供給される。

　カメラ選択部８１は、N台の撮像装置CAMのなかから、M台（N＞M）の撮像装置CAMを選択する。カメラ選択部８１は、ユーザの指定により手動で選択することもできるし、ユーザが指定せずに自動で選択することもできる。

　カメラ選択部８１は、手動で選択する場合、各撮像装置CAMのカメラパラメータに基づいて、各撮像装置CAMの配置や画角情報を表示装置１２に表示させ、使用するM台の撮像装置CAMをユーザに指定させる。

　一方、自動で選択する場合、カメラ選択部８１は、各撮像装置CAMのカメラパラメータに基づいて、配置が近い複数台の撮像装置CAMを１つのグループにまとめ、N台の撮像装置CAMをM個のグループに分類する。そして、カメラ選択部８１は、グループごとに１台の撮像装置CAMを選択することで、使用するM台の撮像装置CAMを選択する。あるいは、カメラ選択部８１は、被写体が人物である場合、人物の顔が写っている撮像装置CAMを基準の撮像装置CAMとし、基準の撮像装置CAMに対して、位置が離れた撮像装置CAMや、選択した撮像装置CAMと対称な位置となる撮像装置CAMを、M個となるまで順番に選択してもよい。

　カメラ選択部８１は、選択したM個の撮像装置CAMを特定するカメラ選択情報を、有効領域算出部３３の３D領域計算部４１と、縮小処理部８２に供給する。

　有効領域算出部３３の３D領域計算部４１は、カメラ選択部８１で選択されたM個の撮像装置CAMのカメラパラメータを用いて、M台の撮像装置CAMの撮像範囲に含まれる３D領域を計算する。第２実施の形態では、第１実施の形態のN台のカメラパラメータを使った３D領域計算処理から、M台のカメラパラメータを使った３D領域計算処理に変更されるので、処理負荷が軽減される。また、３D領域を計算する際のオブジェクトの３次元形状を表すポイントまたは頂点の解像度や、ボクセルサイズなどを、第１実施の形態よりも粗い設定値とすることで、処理負荷をさらに軽減してもよい。

　投影部４２は、３D領域計算部４１で計算された３D領域を、M台の撮像装置CAMそれぞれの視点に投影したM枚の有効領域マスク画像を生成する。また、投影部４２は、生成したM枚の有効領域マスク画像を、縮小処理部８２が実行する縮小処理の縮小率に応じて、縮小する。

　縮小処理部８２は、画像入力部３１から供給されるN台の撮像装置CAMで撮影されたN枚の撮像画像のなかから、カメラ選択部８１で選択されたM個の撮像装置CAMに対応するM枚の撮像画像を選択する。そして、縮小処理部８２は、選択したM枚の撮像画像を、予め決定された所定の縮小率で縮小させた低解像度の撮像画像（以下、低解像度画像と称する。）を生成する。例えば、画像入力部３１から供給される撮像画像が、HD（High Definition）と呼ばれる、１９２０ｘ１０８０の解像度や、HDの４倍の解像度を有する４K解像度である場合、縮小処理部８２は、その撮像画像を、VGAと呼ばれる、６４０ｘ４８０の低解像度画像に縮小する。縮小処理の手法は特に限定されず、任意の手法を選択することができる。例えば、最近傍法、線形補間、バイキュービック法、面積平均法などを採用することができる。また、単純に、水平方向および垂直方向それぞれの画素数を、１／２や１／４など所定の比率で間引く方法でもよい。

　縮小処理部８２の縮小率と、投影部４２が有効領域マスク画像を縮小する際の縮小率は、予め同じに設定される。

　シルエット抽出部３４、セマンティック処理部３５、および判定部３６は、N枚から選択されたM枚の画像で処理を行う点、解像度が低解像度の画像とされている点を除いて、第１実施の形態と同様である。

　第２実施の形態のその他の点は、上述した第１実施の形態と同様である。

＜５．第２の撮像範囲判定処理＞
　次に、図１１のフローチャートを参照して、画像処理装置１１の第２実施の形態による第２の撮像範囲判定処理について説明する。この処理は、例えば、N台の撮像装置CAMで撮影が開始されると同時に開始される。

　ステップＳ２１およびＳ２２の処理は、図９の第１の撮像範囲判定処理のステップＳ１およびＳ２と同様であるので、説明は省略する。

　ステップＳ２３において、カメラ選択部８１は、N台の撮像装置CAMのなかから、M台（N＞M）の撮像装置CAMを選択する。カメラ選択部８１は、選択したM個の撮像装置CAMを特定するカメラ選択情報を、有効領域算出部３３の３D領域計算部４１と、縮小処理部８２に供給する。

　ステップＳ２４において、カメラ選択部８１で選択されたM個の撮像装置CAMのカメラパラメータを用いて、M台の撮像装置CAMの撮像範囲に含まれる３D領域を計算する。

　ステップＳ２５において、投影部４２は、３D領域計算部４１で計算された３D領域を、M台の撮像装置CAMそれぞれの視点に投影したM枚の有効領域マスク画像を生成し、所定の縮小率で縮小する。縮小処理後のM枚の有効領域マスク画像は、判定部３６に供給される。なお、投影部４２は、第１の実施の形態と同様に、視認カメラ情報を生成してもよい。

　ステップＳ２６において、縮小処理部８２は、画像入力部３１から供給されたN枚の撮像画像のなかから、カメラ選択部８１で選択されたM個の撮像装置CAMに対応するM枚の撮像画像を選択し、所定の縮小率で縮小する。縮小後のM枚の低解像度画像は、シルエット抽出部３４とセマンティック処理部３５に供給される。

　ステップＳ２７において、シルエット抽出部３４は、縮小処理部８２から供給されたM枚の低解像度画像から、M枚のシルエット画像を生成する。生成されたM枚のシルエット画像は、判定部３６に供給される。

　ステップＳ２８において、セマンティック処理部３５は、縮小処理部８２から供給されたM枚の低解像度画像に対してセマンティックセグメンテーション処理を実行することによりセマンティック情報を生成して、判定部３６に供給する。なお、この処理は、リアルタイム性を特に優先する場合、省略してよい。

　ステップＳ２９において、判定部３６は、投影部４２からのM枚の有効領域マスク画像と、判定部３６からのM枚のシルエット画像とに基づいて、被写体が撮像装置CAMの撮像範囲から外れたか否かを判定するカメラ判定処理を行う。この処理は、N枚ではなく、M枚の有効領域マスク画像とシルエット画像を用いる点以外は、第１の撮像範囲判定処理と同様である。

　ステップＳ３０およびＳ３１は、図９の第１の撮像範囲判定処理のステップＳ８およびＳ９と同様であるので、説明は省略する。

　以上で、第２の撮像範囲判定処理が終了する。第２の撮像範囲判定処理においても、被写体を撮影している複数の撮像装置CAMにおいて撮像範囲から外れた場合に、ユーザに通知することができるので、３Dモデル生成のための多視点撮影において、撮影の失敗を減らすことができる。

　第２の撮像範囲判定処理によれば、M台の撮像装置CAMのなかのN台の撮像装置CAMの撮像画像のみを用いて、被写体が撮像装置CAMの撮像範囲から外れたか否かを判定するカメラ判定処理を行うので、処理負荷を軽減し、リアルタイム性を向上させることができる。

　なお、第２の実施の形態では、画像処理装置１１内に、撮像画像の解像度を低解像度に変更する処理部を設けたが、撮像装置CAMの解像度設定を変更することで、撮像装置CAMから供給される撮像画像が低解像度となるようにしてもよい。この場合、第２の撮像範囲判定処理と並行して実行される３Dモデル生成処理に使用される撮像画像も低解像度となる。３Dモデル生成処理に使用される撮像画像を高解像度の画像としたい場合には、第２の撮像範囲判定処理で撮像範囲を確認した後、撮像装置CAMの解像度設定を高解像度に変更して３Dモデル生成処理を実行するように、時分割で実行すればよい。

＜６．画像処理装置の第３実施の形態＞
　図１２は、画像処理装置１１の第３実施の形態の構成例を示すブロック図である。

　図１２において、図３に示した第１実施の形態と対応する部分については同一の符号を付してあり、その部分の説明は適宜省略する。

　第３実施の形態にかかる画像処理装置１１は、演算処理を軽減し、処理負荷を少なくした構成である点で第２実施の形態と共通する。一方、第２実施の形態では、有効領域算出部３３が有効領域マスク画像を生成する処理自体は変更せず、撮像画像の枚数や解像度を変更したのに対し、第３実施の形態は、有効領域算出部３３が有効領域マスク画像を生成する処理を変更する点で、第２実施の形態と相違する。

　図１２の第３実施の形態の構成例を、図３に示した第１実施の形態の構成例と比較すると、図３の有効領域算出部３３の３D領域計算部４１および投影部４２が、図１２では３D領域計算部９１および投影部９２に置き換えられており、その他の構成は同一である。

　３D領域計算部９１は、図１３に示されるように、キャリブレーション処理部３２から供給されるカメラパラメータに基づいて、N台の撮像装置CAMそれぞれの撮像範囲を、四角錐台の形状で近似して計算する。図１３における奥行き方向の範囲（Zmax、Zmin）は、パラメータとして設定（入力）される。

　３D領域計算部９１は、撮像装置CAMの撮像範囲としての四角錐台の８頂点の座標を撮像装置CAMごとに計算し、投影部９２に供給する。

　投影部９２は、有効領域マスク画像を生成するN個の撮像装置CAMそれぞれをターゲットカメラとして、次の処理を行う。

　投影部９２は、３D領域計算部９１から供給される、N個の撮像装置CAMの四角錐台の８頂点の座標をターゲットカメラの視点に投影することで、N個の四角錐台の簡易３D領域をターゲットカメラの投影面に投影したN個の四角錐台投影領域を生成する。

　図１４を参照して、投影部９２の処理を説明する。図１４では、図をわかりやすくするため、ターゲットカメラが撮像装置CAM-3であるとして、２台の撮像装置CAM-1およびCAM-2の撮像範囲を、撮像装置CAM-3の視点に投影する例を説明する。

　図１４のAは、ターゲットカメラである撮像装置CAM-3の視点から、撮像装置CAM-1の撮像範囲を見た状態を示している。この状態は、撮像装置CAM-1の撮像範囲をターゲットカメラである撮像装置CAM-3の視点に投影することで生成することができる。

　図１４のBは、ターゲットカメラである撮像装置CAM-3の視点から、撮像装置CAM-2の撮像範囲を見た状態を示している。この状態は、撮像装置CAM-2の撮像範囲をターゲットカメラである撮像装置CAM-3の視点に投影することで生成することができる。

　次に、投影部９２は、N個の四角錐台投影領域が全て重なる領域を、ターゲットカメラの投影３D領域とする有効領域マスク画像を生成する。

　図１４のCは、撮像装置CAM-1の撮像範囲と、撮像装置CAM-2の撮像範囲とを重ねることで生成した有効領域マスク画像の概念図を示している。

　図１４のCの有効領域マスク画像は、第１実施の形態では図５に示した有効領域マスク画像５２に対応し、実際には、図５の有効領域マスク画像５２と同様に２値画像となる。図１４のCにおいて、ハッチングで示された領域が、撮像装置CAM-1の撮像範囲と、撮像装置CAM-2の撮像範囲とが重なる領域であり、ターゲットカメラの投影３D領域５３に相当する。

　第３実施の形態においても、投影部９２は、視認カメラ情報を生成することができる。第３実施の形態における視認カメラ情報は、ターゲットカメラの投影面（撮像範囲）が何台の撮像装置CAMから見えているかを示した台数情報と、ターゲットカメラの投影面（撮像範囲）がどの撮像装置CAMから見えているかを示すカメラ情報とで構成される。

　図１４のDは、ターゲットカメラの撮像範囲が何台の撮像装置CAMから見えているかを示した台数情報の例を示している。

　図１４のDでは、ターゲットカメラの撮像範囲が、領域１０１乃至１０４の４つに区分され、図１４のA乃至Cの投影状態に応じた台数情報が、領域１０１乃至１０４の領域ごとに格納されている。

　領域１０１は、ターゲットカメラである撮像装置CAM-3のみが見えている領域となるので、台数情報は「１」となっている。領域１０２は、撮像装置CAM-3と撮像装置CAM-2の２台が見えている領域となるので、台数情報は「２」となっている。領域１０３は、撮像装置CAM-1乃至CAM-3が見えている領域となるので、台数情報は「３」となっている。領域１０４は、撮像装置CAM-1と撮像装置CAM-3の２台が見えている領域となるので、台数情報は「２」となっている。

　図１４のEは、ターゲットカメラの撮像範囲がどの撮像装置CAMから見えているかを示すカメラ情報の例を示している。

　図１４のEでは、ターゲットカメラである撮像装置CAM-3の撮像範囲が、領域１０１乃至１０４の４つに区分され、図１４のA乃至Cの投影状態に応じたカメラ情報が、領域１０１乃至１０４の領域ごとに格納されている。

　なお、カメラ情報は、自分の撮像装置CAMから見えていることは当然であるので、他の撮像装置CAMから見えているかを示す情報のみが記録される。

　領域１０１は、撮像装置CAM-3のみが見えている領域となるので、カメラ情報はない。領域１０２は、自分以外に撮像装置CAM-2から見えていることを示すカメラ情報が記録される。領域１０３は、自分以外に撮像装置CAM-1とCAM-2から見えていることを示すカメラ情報が記録される。領域１０４は、自分以外に撮像装置CAM-1から見えていることを示すカメラ情報が記録される。

　第３実施の形態のその他の点は、上述した第１実施の形態と同様である。

＜７．第３の撮像範囲判定処理＞
　画像処理装置１１の第３実施の形態による第３の撮像範囲判定処理は、図９を参照して説明した第１の撮像範囲判定処理のステップＳ３およびＳ４が、次のステップＳ３’およびＳ４’に置き換えられる。

　ステップＳ３’において、３D領域計算部９１は、キャリブレーション処理部３２から供給されたカメラパラメータに基づいて、N台の撮像装置CAMそれぞれの撮像範囲を、四角錐台で近似して計算する。

　ステップＳ４’において、投影部９２は、有効領域マスク画像を生成するN個の撮像装置CAMそれぞれをターゲットカメラとして、次の処理を行う。投影部９２は、３D領域計算部９１から供給される、N個の撮像装置CAMの四角錐台の８頂点の座標をターゲットカメラの視点に投影することで、N個の四角錐台の簡易３D領域をターゲットカメラの投影面に投影したN個の四角錐台投影領域を生成する。次に、投影部９２は、N個の四角錐台投影領域が全て重なる領域を、ターゲットカメラの投影３D領域とする有効領域マスク画像を生成する。

　したがって、第１の撮像範囲判定処理では、有効領域算出部３３は、N台の撮像装置CAMそれぞれの四角錐形状の撮像範囲を計算し、N台全ての撮像範囲を統合して３D領域を計算してから、統合した３D領域を、各撮像装置CAMの視点に投影することで、ターゲットカメラの有効領域マスク画像を生成した。すなわち、第１実施の形態の有効領域算出部３３は、N個の撮像範囲の計算、統合、投影の順番で処理を行う。

　これに対して、第３の撮像範囲判定処理では、有効領域算出部３３は、N台の撮像装置CAMそれぞれの四角錐台の撮像範囲を計算し、各撮像装置CAMの視点に投影してのN個の四角錐台投影領域を生成し、投影後のN個の四角錐台投影領域を統合し、ターゲットカメラの投影３D領域とする有効領域マスク画像を生成する。すなわち、第３実施の形態の有効領域算出部３３は、N個の撮像範囲の計算、投影、統合の順番で処理を行う。

　第１実施の形態の３D領域計算部４１は、N台の撮像装置CAMそれぞれのN枚の撮像画像（複数の多視点画像）から、N台の撮像装置CAMの撮像範囲を統合した１つの３D領域を生成する生成部であると言える。

　第３実施の形態の３D領域計算部９１は、N台の撮像装置CAMそれぞれのN枚の撮像画像（複数の多視点画像）から、N台の撮像装置CAMそれぞれのN個の３D領域を生成する生成部であると言える。

　第３の撮像範囲判定処理においても、被写体を撮影している複数の撮像装置CAMで撮像範囲から外れた場合に、ユーザに通知することができるので、３Dモデル生成のための多視点撮影において、撮影の失敗を減らすことができる。

＜８．カメラ配置のその他の例＞
　上述した各実施の形態では、図１に示したように、N個の撮像装置CAMが、被写体を囲むように、被写体の外周に配置されることとして説明したが、撮像装置CAMの配置は、これに限られない。

　例えば、図１５のAに示されるように、複数の撮像装置CAMが外側を向くように配置したり、図１５のBに示されるように、コンサートホールのステージのように、複数の撮像装置CAMが特定方向を集中的に向くようにした配置でもよい。

＜９．コンピュータ構成例＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図１６は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）３０１，ROM（Read Only Memory）３０２，RAM（Random Access Memory）３０３は、バス３０４により相互に接続されている。

　バス３０４には、さらに、入出力インタフェース３０５が接続されている。入出力インタフェース３０５には、入力部３０６、出力部３０７、記憶部３０８、通信部３０９、及びドライブ３１０が接続されている。

　入力部３０６は、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部３０７は、ディスプレイ、スピーカ、出力端子などよりなる。記憶部３０８は、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部３０９は、ネットワークインタフェースなどよりなる。ドライブ３１０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体３１１を駆動する。

　以上のように構成されるコンピュータでは、CPU３０１が、例えば、記憶部３０８に記憶されているプログラムを、入出力インタフェース３０５及びバス３０４を介して、RAM３０３にロードして実行することにより、上述した一連の処理が行われる。RAM３０３にはまた、CPU３０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータ（CPU３０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体３１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体３１１をドライブ３１０に装着することにより、入出力インタフェース３０５を介して、記憶部３０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部３０９で受信し、記憶部３０８にインストールすることができる。その他、プログラムは、ROM３０２や記憶部３０８に、あらかじめインストールしておくことができる。

　なお、本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。

　本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、上述した複数の実施の形態の全てまたは一部を組み合わせた形態を採用することができる。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。

　なお、本技術は、以下の構成を取ることができる。
（１）
　複数の多視点画像から生成された撮像範囲の３D領域を生成する生成部と、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する判定部と
　を備える画像処理装置。
（２）
　前記判定部は、前記領域画像と前記被写体画像とのペアを用いて、前記被写体が前記複数の多視点画像を撮影した複数の前記撮像装置の撮像範囲から外れたか否かを判定する
　前記（１）に記載の画像処理装置。
（３）
　前記判定部は、前記領域画像と前記被写体画像とのペアを用いて、前記被写体が前記複数の多視点画像を撮影した複数の前記撮像装置の撮像範囲から外れそうな状態であるかを判定する
　前記（１）または（２）に記載の画像処理装置。
（４）
　前記判定部は、前記被写体が複数の前記撮像装置の撮像範囲から外れた場合に、どの撮像装置の撮像範囲から外れたかも判定する
　前記（２）または（３）に記載の画像処理装置。
（５）
　前記判定部は、前記被写体画像を用いて、前記被写体が前記特定視点に対応する撮像装置の撮像範囲から外れたか否かを判定する
　前記（１）乃至（４）のいずれかに記載の画像処理装置。
（６）
　前記被写体のセマンティック情報を識別するセマンティック処理部をさらに備え、
　前記判定部は、前記被写体のセマンティック情報を判定に用いる
　前記（１）乃至（５）のいずれかに記載の画像処理装置。
（７）
　前記複数の多視点画像に基づいて、前記複数の多視点画像を撮影した複数の前記撮像装置のカメラパラメータを算出する算出部をさらに備え、
　前記生成部は、算出された複数の前記撮像装置のカメラパラメータに基づいて、前記撮像範囲の３D領域を生成する
　前記（１）乃至（６）のいずれかに記載の画像処理装置。
（８）
　前記生成部は、前記複数の多視点画像を撮影した全ての前記撮像装置の前記撮像範囲に含まれる１つの前記３D領域を生成する
　前記（７）に記載の画像処理装置。
（９）
　前記３D領域を前記特定視点に投影した前記領域画像を生成する投影部をさらに備える
　前記（１）乃至（８）のいずれかに記載の画像処理装置。
（１０）
　前記領域画像は、２値画像である
　前記（１）乃至（９）のいずれかに記載の画像処理装置。
（１１）
　前記複数の多視点画像それぞれから、前記被写体の領域をシルエットとして抽出したシルエット画像を生成するシルエット抽出部をさらに備え、
　前記判定部は、前記領域画像と、前記被写体画像としての前記シルエット画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　前記（１）乃至（１０）のいずれかに記載の画像処理装置。
（１２）
　前記複数の多視点画像に対応する複数の撮像装置のなかから、一部の撮像装置を選択する選択部をさらに備え、
　前記生成部は、選択された前記一部の撮像装置に対応する多視点画像から生成された前記撮像範囲の３D領域を生成し、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する前記撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　前記（１）乃至（１１）のいずれかに記載の画像処理装置。
（１３）
　前記複数の多視点画像を所定の縮小率で縮小させる縮小処理部をさらに備え、
　前記判定部は、縮小後の前記領域画像と前記被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　前記（１）乃至（１２）のいずれかに記載の画像処理装置。
（１４）
　前記生成部は、前記複数の多視点画像に対応する複数の撮像装置それぞれの撮像範囲を近似した複数の前記３D領域を生成し、
　前記判定部は、複数の前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　前記（１）乃至（１３）のいずれかに記載の画像処理装置。
（１５）
　前記３D領域は、四角錐台の形状である
　前記（１４）に記載の画像処理装置。
（１６）
　前記判定部の判定結果をユーザに通知する通知部をさらに備える
　前記（１）乃至（１５）のいずれかに記載の画像処理装置。
（１７）
　前記通知部は、所定の記憶部に記憶された前記判定結果を参照し、前記ユーザに通知する
　前記（１６）に記載の画像処理装置。
（１８）
　被写体の３Dモデルを生成する３Dモデル生成方法であって、
　複数の多視点画像から生成された撮像範囲の３D領域を生成するステップと、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定するステップと、
　前記複数の多視点画像に基づいて被写体の３Dモデルを生成するステップと
　を有する３Dモデル生成方法。
（１９）
　コンピュータを、
　複数の多視点画像から生成された撮像範囲の３D領域を生成する生成部と、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する判定部
　として機能させるためのプログラム。

　CAM-１乃至CAM-8　撮像装置，　１１　画像処理装置，　１２　表示装置，　３１　画像入力部，　３２　キャリブレーション処理部，　３３　有効領域算出部，　３４　シルエット抽出部，　３５　セマンティック処理部，　３６　判定部，　３７　通知部，　３８　３Dモデル計算部，　４１　３D領域計算部，　４２　投影部，　８１　カメラ選択部，　８２　縮小処理部，　９１　３D領域計算部，　９２　投影部，　３０１　CPU，　３０２　ROM，　３０３　RAM，　３０６　入力部，　３０７　出力部，　３０８　記憶部，　３０９　通信部，　３１０　ドライブ

Claims

　複数の多視点画像から生成された撮像範囲の３D領域を生成する生成部と、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する判定部と
　を備える画像処理装置。
　前記判定部は、前記領域画像と前記被写体画像とのペアを用いて、前記被写体が前記複数の多視点画像を撮影した複数の前記撮像装置の撮像範囲から外れたか否かを判定する
　請求項１に記載の画像処理装置。
　前記判定部は、前記領域画像と前記被写体画像とのペアを用いて、前記被写体が前記複数の多視点画像を撮影した複数の前記撮像装置の撮像範囲から外れそうな状態であるかを判定する
　請求項１に記載の画像処理装置。
　前記判定部は、前記被写体が複数の前記撮像装置の撮像範囲から外れた場合に、どの撮像装置の撮像範囲から外れたかも判定する
　請求項２に記載の画像処理装置。
　前記判定部は、前記被写体画像を用いて、前記被写体が前記特定視点に対応する撮像装置の撮像範囲から外れたか否かを判定する
　請求項１に記載の画像処理装置。
　前記被写体のセマンティック情報を識別するセマンティック処理部をさらに備え、
　前記判定部は、前記被写体のセマンティック情報を判定に用いる
　請求項１に記載の画像処理装置。
　前記複数の多視点画像に基づいて、前記複数の多視点画像を撮影した複数の前記撮像装置のカメラパラメータを算出する算出部をさらに備え、
　前記生成部は、算出された複数の前記撮像装置のカメラパラメータに基づいて、前記撮像範囲の３D領域を生成する
　請求項１に記載の画像処理装置。
　前記生成部は、前記複数の多視点画像を撮影した全ての前記撮像装置の前記撮像範囲に含まれる１つの前記３D領域を生成する
　請求項７に記載の画像処理装置。
　前記３D領域を前記特定視点に投影した前記領域画像を生成する投影部をさらに備える
　請求項１に記載の画像処理装置。
　前記領域画像は、２値画像である
　請求項１に記載の画像処理装置。
　前記複数の多視点画像それぞれから、前記被写体の領域をシルエットとして抽出したシルエット画像を生成するシルエット抽出部をさらに備え、
　前記判定部は、前記領域画像と、前記被写体画像としての前記シルエット画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　請求項１に記載の画像処理装置。
　前記複数の多視点画像に対応する複数の撮像装置のなかから、一部の撮像装置を選択する選択部をさらに備え、
　前記生成部は、選択された前記一部の撮像装置に対応する多視点画像から生成された前記撮像範囲の３D領域を生成し、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する前記撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　請求項１に記載の画像処理装置。
　前記複数の多視点画像を所定の縮小率で縮小させる縮小処理部をさらに備え、
　前記判定部は、縮小後の前記領域画像と前記被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　請求項１に記載の画像処理装置。
　前記生成部は、前記複数の多視点画像に対応する複数の撮像装置それぞれの撮像範囲を近似した複数の前記３D領域を生成し、
　前記判定部は、複数の前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する
　請求項１に記載の画像処理装置。
　前記３D領域は、四角錐台の形状である
　請求項１４に記載の画像処理装置。
　前記判定部の判定結果をユーザに通知する通知部をさらに備える
　請求項１に記載の画像処理装置。
　前記通知部は、所定の記憶部に記憶された前記判定結果を参照し、前記ユーザに通知する
　請求項１６に記載の画像処理装置。
　被写体の３Dモデルを生成する３Dモデル生成方法であって、
　複数の多視点画像から生成された撮像範囲の３D領域を生成するステップと、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定するステップと、
　前記複数の多視点画像に基づいて被写体の３Dモデルを生成するステップと
　を有する３Dモデル生成方法。
　コンピュータを、
　複数の多視点画像から生成された撮像範囲の３D領域を生成する生成部と、
　前記３D領域を特定視点に投影した領域画像と、前記特定視点に対応する撮像装置からの被写体画像とに基づいて、前記撮像装置の被写体の撮影状況を判定する判定部
　として機能させるためのプログラム。