WO2022075073A1

WO2022075073A1 - 撮影デバイス、サーバ装置、および、３ｄデータ生成方法

Info

Publication number: WO2022075073A1
Application number: PCT/JP2021/034938
Authority: WO
Inventors: 真人島川
Original assignee: ソニーグループ株式会社
Priority date: 2020-10-07
Filing date: 2021-09-24
Publication date: 2022-04-14
Also published as: JPWO2022075073A1; CN116250242A

Abstract

本技術は、簡易な撮影デバイスを用いてボリューメトリック撮影を行うことができるようにする撮影デバイス、サーバ装置、および、３Ｄデータ生成方法に関する。サーバ装置は、複数の撮影デバイスから撮影に関する情報を受信し、受信した情報に基づいて、複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定する制御部を備える。撮影デバイスは、撮影に関する自身の情報をサーバ装置に送信し、ボリューメトリック撮影が可能か否かの判定結果に基づいてサーバ装置から送信されてくる、ボリューメトリック撮影に関する設定値の候補を取得する制御部を備える。本開示は、例えば、スマートフォン等の撮影デバイスによるボリューメトリック撮影と再生を提供する画像処理システム等に適用できる。

Description

撮影デバイス、サーバ装置、および、３Ｄデータ生成方法

　本技術は、撮影デバイス、サーバ装置、および、３Ｄデータ生成方法に関し、特に簡易な撮影デバイスを用いてボリューメトリック撮影を行うことができるようにした撮影デバイス、サーバ装置、および、３Ｄデータ生成方法に関する。

　多視点で撮影された動画像から被写体の3Dモデルを生成し、任意の視聴位置に応じた3Dモデルの仮想視点画像を生成することで自由な視点の画像を提供する技術がある。この技術は、ボリューメトリックキャプチャなどとも呼ばれている。

　3Dモデルを生成するための動画像を撮影する場合には、異なる方向（視点）から被写体を撮影するため、被写体を撮影する複数の撮影装置を異なる場所に配置し、撮影装置間の位置関係を求め、複数の撮影装置それぞれで同期を取って撮影を行う必要がある（例えば、特許文献１参照）。この3Dモデル生成用の撮影を、以下では、ボリューメトリック撮影とも称する。

　ボリューメトリック撮影は、現時点では、専用のスタジオ等で専用の機材を使って行うことが一般的である。

特開２０１９－８７７９１号公報

　しかしながら、例えば、スマートフォンやタブレットなどの、ユーザが一般的に所有している撮影機能を備えた電子機器を用いて、簡単にボリューメトリック撮影を行えることが望まれる。

　本技術は、このような状況に鑑みてなされたものであり、簡易な撮影デバイスを用いてボリューメトリック撮影を行うことができるようにするものである。

　本技術の第１の側面の撮影デバイスは、撮影に関する自身の情報をサーバ装置に送信し、ボリューメトリック撮影が可能か否かの判定結果に基づいて前記サーバ装置から送信されてくる、ボリューメトリック撮影に関する設定値の候補を取得する制御部を備える。

　本技術の第１の側面においては、撮影に関する自身の情報がサーバ装置に送信され、ボリューメトリック撮影が可能か否かの判定結果に基づいて前記サーバ装置から送信されてくる、ボリューメトリック撮影に関する設定値の候補が取得される。

　本技術の第２の側面のサーバ装置は、複数の撮影デバイスから撮影に関する情報を受信し、受信した前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定する制御部を備える。

　本技術の第２の側面においては、複数の撮影デバイスから撮影に関する情報が受信され、受信された前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかが判定される。

　本技術の第３の側面の３Dデータ生成方法は、複数の撮影デバイスから撮影に関する情報を受信し、受信した前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定し、ボリューメトリック撮影が可能であると判定された前記複数の撮影デバイスによって撮影された撮影画像から、被写体の３Dモデルのデータを生成する。

　本技術の第３の側面においては、複数の撮影デバイスから撮影に関する情報が受信され、受信された前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかが判定され、ボリューメトリック撮影が可能であると判定された前記複数の撮影デバイスによって撮影された撮影画像から、被写体の３Dモデルのデータが生成される。

　撮影デバイスおよびサーバ装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

本開示を適用した画像処理システムの構成例を示すブロック図である。ボリューメトリック撮影と再生を説明する図である。 3Dモデルデータのデータフォーマットの例を説明する図である。画像処理システムの各装置の詳細構成例を示すブロック図である。画像処理システムによるボリューメトリック撮影再生処理を説明するフローチャートである。図５のステップＳ１における撮影デバイスのグルーピング処理の詳細を説明するフローチャートである。２次元コードの画面例を示す図である。カメラキャリブレーション処理の例を示す図である。図５のステップＳ３における撮影デバイスのカメラキャリブレーション処理の詳細を説明するフローチャートである。カメラキャリブレーション処理の例を示す図である。カメラキャリブレーション処理の例を示す図である。図５のステップＳ４におけるボリューメトリック撮影用撮影設定処理の詳細を説明するフローチャートである。能力情報の例を示す図である。図５のステップＳ５における撮影デバイスの同期撮影処理の詳細を説明するフローチャートである。図５のステップＳ５における他の撮影デバイスの同期撮影処理の詳細を説明するフローチャートである。図５のステップＳ７におけるオフラインモデリング処理の詳細を説明するフローチャートである。オブジェクトの3Dモデルデータの例を示す図である。図５のステップＳ８におけるコンテンツ再生処理の詳細を説明するフローチャートである。図５のステップＳ９におけるリアルタイムモデリング再生処理の詳細を説明するフローチャートである。オートキャリブレーション処理を説明するフローチャートである。カメラキャリブレーション処理の他の例を示す図である。コントロールデバイスが行うカメラキャリブレーション処理を説明するフローチャートである。フィードバック画面の例を示す図である。クラウドサーバが行うカメラキャリブレーション処理を説明するフローチャートである。図２４のステップＳ２２４のカメラパラメータ算出処理の詳細を説明するフローチャートである。本開示を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

　以下、添付図面を参照しながら、本技術を実施するための形態（以下、実施の形態という）について説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。説明は以下の順序で行う。
１．画像処理システムの構成例
２．ボリューメトリック撮影と再生の概要
３．画像処理システムの各装置の詳細構成例
４．ボリューメトリック撮影再生処理のフローチャート
５．撮影デバイスのグルーピング処理のフローチャート
６．撮影デバイスのカメラキャリブレーション処理のフローチャート
７．ボリューメトリック撮影用撮影設定処理のフローチャート
８．撮影デバイスの同期撮影処理のフローチャート
９．オフラインモデリング処理のフローチャート
１０．コンテンツ再生処理のフローチャート
１１．リアルタイムモデリング再生処理のフローチャート
１２．オートキャリブレーション処理のフローチャート
１３．キャリブレーションボード画像を用いないカメラキャリブレーション処理
１４．コンピュータ構成例

＜１．画像処理システムの構成例＞
　図１は、本開示の画像処理システムであって、スマートフォン等の撮影デバイスによるボリューメトリック撮影と再生を提供する画像処理システムの構成例を示している。

　画像処理システム１は、N台（N＞１）の撮影デバイス１１と、クラウドサーバ（サーバ装置）１２と、再生デバイス１３とを備える。

　N台の撮影デバイス１１それぞれは、所定の被写体をオブジェクトOBJとしてボリューメトリック撮影を行い、その結果得られる画像データをクラウドサーバ１２に送信する。撮影デバイス１１は、例えば、スマートフォン、タブレット、デジタルカメラ、ゲーム端末等、撮像機能を備える電子機器で構成される。図１の例では、N＝５、即ち５台の撮影デバイス１１－１ないし１１－５でオブジェクトOBJを撮影する例が示されているが、撮像デバイス１１の台数は任意である。

　クラウドサーバ１２は、ボリューメトリック撮影により得られた画像データに基づいて、オブジェクトOBJの3Dモデルのデータ（3Dモデルデータ）MOを生成する。また、クラウドサーバ１２は、再生デバイス１３からの要求に応じて、蓄積されている所定のオブジェクトOBJの3DモデルデータMOを、再生デバイス１３へ送信する。

　再生デバイス１３は、クラウドサーバ１２から、所定のオブジェクトOBJの3DモデルデータMOを取得して再生することにより、オブジェクトOBJの3Dモデルを任意の視聴位置から見た自由視点画像を生成し、所定のディスプレイに表示する。再生デバイス１３は、例えば、スマートフォンまたはタブレット１３A、パーソナルコンピュータ１３B、ヘッドマウントディスプレイ（HMD）１３Cなど、ディスプレイを備える電子機器で構成される。

　N台の撮影デバイス１１とクラウドサーバ１２は、所定のネットワークを介して接続される。また、クラウドサーバ１２と再生デバイス１３も、所定のネットワークを介して接続される。これらを接続するネットワークは、任意の通信網であり、有線通信の通信網であってもよいし、無線通信の通信網であってもよいし、それらの両方により構成されるようにしてもよい。また、ネットワークが、１の通信網により構成されるようにしてもよいし、複数の通信網により構成されるようにしてもよい。例えば、インターネット、公衆電話回線網、所謂4G回線や５G回線等の無線移動体用の広域通信網、WAN（WIDe Area Network）、LAN（Local Area Network）、Bluetooth（登録商標）規格に準拠した通信を行う無線通信網、NFC（Near Field Communication）等の近距離無線通信の通信路、赤外線通信の通信路、HDMI（登録商標）（High-Definition Multimedia Interface）やUSB（Universal Serial Bus）等の規格に準拠した有線通信の通信網等、任意の通信規格の通信網や通信路がネットワークに含まれるようにしてもよい。

＜２．ボリューメトリック撮影と再生の概要＞
　図２および図３を参照して、ボリューメトリック撮影と再生について簡単に説明する。

　例えば、図２に示されるように、人物等の被写体を配置した所定の撮影空間を、その外周から複数の撮影装置で撮像を行うことにより複数の撮影画像が得られる。撮影画像は、例えば、動画像で構成される。図２の例では、被写体＃Ob1を取り囲むように３台の撮影装置CAM１乃至CAM３が配置されているが、撮影装置CAMの台数は３台に限らず、任意である。撮影時の撮影装置CAMの台数は、自由視点画像を生成する際の既知の視点数となるため、多ければ多いほど、自由視点画像を高精度に表現することができる。被写体＃Ob1は、所定の動作をとっている人物とされている。

　異なる方向の複数の撮影装置CAMから得られた撮影画像を用いて、撮影空間において表示対象となる被写体＃Ob1の3Dモデルである3DオブジェクトMO1が生成される（3Dモデリング）。例えば、異なる方向の撮影画像を用いて被写体の３次元形状の削り出しを行うVisual Hull等の手法を用いて、3DオブジェクトMO1が生成される。

　そして、撮影空間に存在する１以上の3Dオブジェクトのうち、１以上の3Dオブジェクトのデータ（3Dモデルデータ）が、再生側の装置に伝送され、再生される。すなわち、再生側の装置において、取得した3Dオブジェクトのデータに基づいて、3Dオブジェクトのレンダリングを行うことにより、視聴者の視聴デバイスに3D形状画像が表示される。図２においては、視聴デバイスが、ディスプレイD1や、ヘッドマウントディスプレイ（HMD）D2である例を示している。

　再生側は、撮影空間に存在する１以上の3Dオブジェクトのうち、視聴対象の3Dオブジェクトだけを要求して、視聴デバイスに表示させることが可能である。例えば、再生側は、視聴者の視聴範囲が撮影範囲となるような仮想カメラを想定し、撮影空間に存在する多数の3Dオブジェクトのうち、仮想カメラで捉えられる3Dオブジェクトのみを要求して、視聴デバイスに表示させる。実世界において視聴者が任意の視点から被写体を見ることができるように、仮想カメラの視点（仮想視点）は任意の位置に設定することができる。3Dオブジェクトには、適宜、所定の空間を表す背景の画像を合成することができる。

　図３は、一般的な3Dモデルデータのデータフォーマットの例を示している。

　3Dモデルデータは、一般的には、被写体の3D形状（ジオメトリ情報）を表した3D形状データと、被写体の色情報を表したテクスチャデータとで表現される。

　3D形状データは、例えば、被写体の３次元位置を点の集合で表したポイントクラウド形式、ポリゴンメッシュと呼ばれる頂点（Vertex）と頂点間のつながりで表した3Dメッシュ形式、ボクセル（voxel）と呼ばれる立方体の集合で表したボクセル形式などで表現される。

　テクスチャデータは、例えば、各撮影装置CAMが撮影した撮影画像（２次元テクスチャ画像）で保有するマルチテクスチャ形式や、3D形状データである各ポイントまたは各ポリゴンメッシュに貼り付けられる２次元テクスチャ画像を、UV座標系で表現して保有するUVマッピング形式などがある。

　図３の上段のように、3D形状データと、各撮影装置CAMが撮影した複数の撮影画像P1乃至P8で保有するマルチテクスチャ形式とで、3Dモデルデータを記述する形式は、仮想視点（仮想カメラの位置）によって、色情報が変化し得るViewDependentな形式である。

　これに対して、図３の下段のように、3D形状データと、被写体のテクスチャ情報をUV座標系にマッピングしたUVマッピング形式とで、3Dモデルデータを記述する形式は、仮想視点（仮想カメラの位置）によって、色情報が同一となるViewIndependentな形式である。

　3Dモデルデータの生成のための撮影であるボリューメトリック撮影は、従来、専用のスタジオ等で専用の機材等を使って行うことが一般的であった。

　しかしながら、図１の画像処理システム１は、ユーザが一般的に所有している、スマートフォンやタブレット等の電子機器を用いてボリューメトリック撮影を行うことができるようにしたシステムである。

＜３．画像処理システムの各装置の詳細構成例＞
　図４は、撮影デバイス１１、クラウドサーバ１２、および、再生デバイス１３の詳細構成例を示すブロック図である。

（撮像デバイス１１）
　撮影デバイス１１は、通信部３１、メッセージ送受信部３２、制御部３３、音声出力部３４、スピーカ３５、画像出力部３６、ディスプレイ３７、フラッシュ出力部３８、および、フラッシュ３９を備える。

　撮影デバイス１１は、また、タッチセンサ４０、ジャイロセンサ４１、加速度センサ４２、GPSセンサ４３、センサ入力部４４、および、同期信号生成部４５を備える。

　撮影デバイス１１は、さらに、１以上のカメラ５１（５１Aないし５１C）、マイクロホン５２、カメラ入出力部５３、画像処理部５４、画像圧縮部５５、音声入力部５６、音声処理部５７、音声圧縮部５８、および、ストリーム送信部５９を備える。

　通信部３１は、所謂4G回線や５G回線等の無線移動体用のキャリア通信、Wi-Fi（登録商標）等の無線通信、1000BASE-T等の有線通信などの各種の通信モジュールで構成され、クラウドサーバ１２との間で、メッセージやデータの通信を行う。

　メッセージ送受信部３２は、通信部３１を介して、クラウドサーバ１２との間でメッセージ通信を行う。メッセージ送受信部３２は、通信部３１の通信の種類に関わらず、クラウドサーバ１２側とメッセージ通信が可能なインスタントメッセージングシステムに対応する。このようなインスタントメッセージングシステムとしては、例えば、JabberやXMPP、SIP（Session Initiation Protocol）などがある。

　制御部３３は、メッセージ送受信部３２により受信されたメッセージや、不図示の操作部において検出されたユーザの操作に基づいて、撮影デバイス１１の動作全体を制御する。例えば、制御部３３は、メッセージ送受信部３２を介してクラウドサーバ１２とメッセージ通信を行い、ユーザの操作内容を通知したり、クラウドサーバ１２からの要求に合わせて、ボリューメトリック撮影（被写体の撮影）を開始させ、撮影により得られた画像データをクラウドサーバ１へ送信させる。また、制御部３３は、撮影デバイス１１が備える能力情報をクラウドサーバ１２へ送信したり、撮像デバイス１１が備える各種のセンサの検出結果であるセンサ情報をストリーム送信部５９に供給する。制御部３３は、クラウドサーバ１２から供給される、撮影機能の設定値情報を、カメラ入出力部５３、画像処理部５４、および画像圧縮部５５に供給し、所定の設定を行う。撮影機能の設定値情報には、例えば、露光時間、解像度、圧縮方式、ビットレートなどについての設定値が含まれる。

　撮影デバイス１１には、ボリューメトリック撮影を実行するためのアプリケーションプログラム（以下、ボリューメトリック撮影アプリと称する。）がインストールされており、ボリューメトリック撮影アプリを起動実行することにより、制御部３３が撮影デバイス１１の動作全体を制御する処理を行う。

　音声出力部３４は、制御部３３の制御に従い、音声信号をスピーカ３５に出力する。スピーカ３５は、音声出力部３４から供給される音声信号に基づいて音を出力する。画像出力部３６は、制御部３３の制御に従い、画像信号をディスペンサ３７に出力する。ディスプレイ３７は、画像出力部３６から供給される画像信号に基づく画像を表示する。フラッシュ出力部３８は、制御部３３からの制御に従い、発光制御信号をフラッシュ３９に出力する。フラッシュ３９は、フラッシュ出力部３８からの発光制御信号に基づき発光する。

　タッチセンサ４０は、ユーザがディスプレイ３７に対してタッチしたときのタッチ位置を検出し、センサ情報としてセンサ入力部４４に供給する。ジャイロセンサ４１は、角速度を検出し、センサ情報としてセンサ入力部４４に供給する。加速度センサ４２は、加速度を検出し、センサ情報としてセンサ入力部４４に供給する。GPSセンサ４３は、GNSS（Global Navigation Satellite System / 全球測位衛星システム）の１つであるGPSの信号を受信する。GPSセンサ４３は、受信したGPS信号に基づいて撮影デバイス１１の現在位置を検出し、センサ情報としてセンサ入力部４４に供給する。センサ入力部４４は、タッチセンサ４０、ジャイロセンサ４１、加速度センサ４２、および、GPSセンサ４３の各センサから供給されるセンサ情報を取得して、制御部３３へ供給する。

　同期信号生成部４５は、制御部３３からの指示に基づき、同期信号を生成し、１以上のカメラ５１に供給する。同期信号生成部４５が同期信号を生成する手段としては、N台の撮影デバイス１１とクラウドサーバ１２とを接続するネットワークの種類に応じて、次の手法を取り得る。

　第１の同期手法は、５G回線等のキャリア通信の時計情報を用いて同期を取る方法である。キャリア通信では、通信のために高精度な時計を持っているため、この時計情報を用いて時刻を合わせ、同期をとることができる。

　第２の同期手法は、GPS信号に含まれる時刻情報を用いて同期を取る方法である。GPS信号は、PTP (Precision Time Protocol)のグランドマスタクロックとして利用されるほど高精度な時刻情報を有しているため、この時計情報を用いて時刻を合わせ、同期をとることができる。

　第３の同期手法は、Wi-Fi無線通信のマルチキャスト通信を用いて時刻同期を行う方法である。同一のアクセスポイント下に接続している場合には、マルチキャストパケットを送信してタイミングを検出し、同期をとることができる。802.11AC、WiFi Time Syncを用いてもよい。

　第４の同期手法は、キャリア通信のマルチキャスト通信を用いて時刻同期を行う方法である。５G回線のキャリア通信では、通信が１msecまで低遅延化されるため、キャリア通信でマルチキャストパケットを送信してタイミングを検出し、同期をとることができる。

　カメラ５１Aないし５１Cは、カメラタイプ（種類）が異なるカメラであり、例えば、カメラ５１Aは、可視光（RGB）を受光した受光結果に基づいてRGB画像を生成するRGBカメラであり、カメラ５１Bは、RGB画像とともに、被写体までの距離情報としてのデプス値を各画素の画素値として格納したデプス画像も生成するRGB-Dカメラであり、カメラ５１Cは、赤外光（IR）を受光した受光結果に基づいてIR画像を生成するIRカメラである。RGB画像、デプス画像、およびIR画像を特に区別しない場合、カメラ画像と称する。

　カメラ５１Aないし５１Cは、カメラ入出力部５３を介して制御部３３から供給される設定値情報に基づいて、露光時間、ゲイン、解像度等について所定の設定を行う。また、カメラ５１Aないし５１Cは、撮影の結果得られるカメラ画像を、カメラ入出力部５３に出力する。

　マイクロホン５２は、周囲の音を収集し、音声入力部５６に出力する。

　カメラ入出力部５３は、制御部３３から供給される設定値情報を、カメラ５１Aないし５１Cのそれぞれに供給する。また、カメラ入出力部５３は、カメラ５１Aないし５１Cから供給されるカメラ画像を画像処理部５４に供給する。

　画像処理部５４は、カメラ入出力部５３から供給されるカメラ画像（のRAWデータ）に対して、デモザイク処理、色補正処理、歪補正処理、色空間変換処理などの所定の画像信号処理を実行する。

　画像圧縮部５５は、制御部３３から指定される設定値に基づいて、画像処理部５４からの画像信号に対して所定の圧縮符号化処理を実行し、圧縮符号化後の画像ストリームをストリーム送信部５９に供給する。制御部３３から指定される設定値としては、例えば、圧縮方式、ビットレート等のパラメータなどがある。

　ストリーム送信部５９は、画像圧縮部５５からの画像ストリーム、音声圧縮部５８からの音声ストリーム、および、制御部３３からのセンサ情報を、通信部３１を介してクラウドサーバ１２に送信する。制御部３３からのセンサ情報は、例えば、フレーム毎にカメラ画像の画像ストリーム内に格納されて、送信される。

　音声入力部５６は、マイクロホン５２から入力される音声を取得して、音声処理部５７に供給する。音声処理部５７は、音声入力部５６からの音声信号に対して、ノイズ除去処理等の所定の音声信号処理を実行する。音声圧縮部５８は、制御部３３から指定された設定値に基づいて、音声処理部５７からの音声信号に対して、所定の圧縮符号化処理を実行し、圧縮符号化後の音声ストリームをストリーム送信部５９に供給する。制御部３３から指定された設定値としては、例えば、圧縮方式、ビットレート等のパラメータなどがある。

（クラウドサーバ１２）
　クラウドサーバ１２は、コントローラ１０１、メッセージ送受信部１０２、通信部１０３、ストリーム受信部１０４、キャリブレーション部１０５、モデリングタスク生成部１０６、および、タスク記憶部１０７を備える。

　また、クラウドサーバ１２は、オフラインモデリング部１０８、コンテンツ管理部１０９、コンテンツ記憶部１１０、リアルタイムモデリング部１１１、ストリーム送信部１１２、および、オートキャリブレーション部１１３を備える。

　コントローラ１０１は、クラウドサーバ１２の全体の動作を制御する。例えば、コントローラ１０１は、メッセージ送受信部１０２を介して、各撮影デバイス１１または再生デバイス１３へ所定のメッセージを送信することにより、撮影動作や再生動作等の所定の動作を行わせる。また、コントローラ１０１は、オフラインモデリング部１０８等を制御して、オフラインモデリングを実行させたり、リアルタイムモデリング部１１１等を制御して、リアルタイムモデリングを実行させる。オフラインモデリングでは、ボリューメトリック撮影による3Dモデルの生成と、生成された3Dモデルデータに基づく3Dモデルの再生（自由視点画像の表示）とが、別々のタイミングで実行される。一方、リアルタイムモデリングでは、3Dモデルの生成と、生成された3Dモデルデータに基づく3Dモデルの再生が一連の処理として実行される。3Dモデルを生成する際のモデリングパラメータであるボクセルサイズとバウンディングボックスサイズは、各撮影デバイス１１の撮影対象領域や、ユーザの設定に応じて、コントローラ１０１によって決定される。ボクセルサイズは、ボクセルの大きさを表し、バウンディングボックスサイズは、３Dオブジェクトのボクセルがあるかどうかを探索する処理範囲を表す。

　メッセージ送受信部１０２は、撮影デバイス１１または再生デバイス１３と、通信部１０３を介してメッセージ通信を行う。メッセージ送受信部１０２は、例えば、撮影デバイス１１のメッセージ送受信部３２と対応する。

　通信部１０３は、キャリア通信、Wi-Fi（登録商標）等の無線通信、1000BASE-T等の有線通信などの各種の通信モジュールで構成され、撮影デバイス１１または再生デバイス１３とメッセージやデータの通信を行う。

　ストリーム受信部１０４は、各撮影デバイス１１から送信されてくる画像ストリームおよび音声ストリームを、通信部１０３を介して受信し、撮影デバイス１１で実行された所定の圧縮符号化方式に対応する復号処理を実行する。ストリーム受信部１０４は、復号処理後のカメラ画像または音声信号を、キャリブレーション部１０５、モデリングタスク生成部１０６、または、リアルタイムモデリング部１１１の少なくとも１つに供給する。また、ストリーム受信部１０４は、例えば、画像ストリーム内に格納されて送信されてきたセンサ情報を、キャリブレーション部１０５に供給する。

　キャリブレーション部１０５は、コントローラ１０１からの指示にしたがい、各撮影デバイス１１のカメラ画像およびセンサ情報に基づいてキャリブレーションを実行し、各カメラ５１のカメラパラメータを算出する。カメラパラメータには、外部パラメータと内部パラメータが含まれるが、内部パラメータが固定値として設定されている場合には、外部パラメータのみが算出される。算出されたカメラパラメータは、モデリングタスク生成部１０６、オフラインモデリング部１０８、リアルタイムモデリング部１１１、および、オートキャリブレーション部１１３に供給される。

　モデリングタスク生成部１０６は、コントローラ１０１からの指示により、ストリーム受信部１０４からの画像ストリームと、キャリブレーション部１０５からのカメラパラメータとに基づいて、３Dモデルを生成するタスクであるモデリングタスクを生成し、タスク記憶部１０７に記憶させる。タスク記憶部１０７には、モデリングタスク生成部１０６から順次供給されたモデリングタスクが、タスクキューとして記憶される。

　オフラインモデリング部１０８は、タスク記憶部１０７にタスクキューとして記憶されている１以上のモデリングタスクを順次取り出し、オフラインによる3Dモデリング処理を実行する。3Dモデリング処理により、オブジェクトの3Dモデルのデータ（3Dモデルデータ）が生成され、コンテンツ管理部１０９に供給される。オフラインモデリング部１０８は、3Dモデリング処理において、所定の撮影デバイス１１の各フレームの画像データに関連付けられたセンサ情報に基づいて、その時点でのキャリブレーション処理を、オートキャリブレーション部１１３に必要に応じて依頼し、キャリブレーション情報を更新してもよい。

　コンテンツ管理部１０９は、オフラインモデリング部１０８により生成されたオブジェクトの3Dモデルデータをコンテンツとしてコンテンツ記憶部１１０に記憶し、管理する。コンテンツ管理部１０９は、コントローラ１０１により指定されたコンテンツである、所定のオブジェクトの3Dモデルデータを、コンテンツ記憶部１１０から取得し、ストリーム送信部１１２を介して、再生デバイス１３へ送信する。コンテンツ記憶部１１０は、コンテンツであるオブジェクトの3Dモデルデータを記憶する。

　リアルタイムモデリング部１１１は、ストリーム受信部１０４から供給されるカメラ画像を取得し、3Dモデリング処理をリアルタイムに実行する。3Dモデリング処理により、オブジェクトの3Dモデルのデータ（3Dモデルデータ）がフレーム単位で生成され、ストリーム送信部１１２に順次供給される。リアルタイムモデリング部１１１は、3Dモデリング処理において、所定の撮影デバイス１１の各フレームの画像データに関連付けられたセンサ情報に基づいて、その時点でのキャリブレーション処理を、オートキャリブレーション部１１３に必要に応じて依頼し、キャリブレーション情報を更新してもよい。

　ストリーム送信部１１２は、コンテンツ管理部１０９またはリアルタイムモデリング部１１１から供給される、オブジェクトの3Dモデルデータを、再生デバイス１３へ送信する。

　オートキャリブレーション部１１３は、オフラインモデリング部１０８またはリアルタイムモデリング部１１１からの、各フレームの画像データに関連付けられたセンサ情報に基づいて、キャリブレーション部１０５で算出されたカメラパラメータの更新が必要であると判定された場合、キャリブレーション処理を実行し、カメラパラメータを更新する。

（再生デバイス１３）
　再生デバイス１３は、通信部１５１、メッセージ送受信部１５２、制御部１５３、センサ１５４、センサ入力部１５５、ストリーム受信部１５６、再生部１５７、画像出力部１５８、ディスプレイ１５９、音声出力部１６０、および、スピーカ１６１を備える。

　通信部１５１は、キャリア通信、Wi-Fi（登録商標）等の無線通信、1000BASE-T等の有線通信などの各種の通信モジュールで構成され、クラウドサーバ１２とメッセージやデータの通信を行う。

　メッセージ送受信部１５２は、クラウドサーバ１２と通信部１０３を介してメッセージ通信を行う。メッセージ送受信部１５２は、クラウドサーバ１２のメッセージ送受信部１０２と対応する。

　制御部１５３は、メッセージ送受信部１５２により受信されたメッセージや、不図示の操作部において検出された視聴者の操作に基づいて、再生デバイス１３の動作全体を制御する。例えば、制御部１５３は、視聴者の操作に基づいて、所定のコンテンツを要求するメッセージを、メッセージ送受信部１５２に送信させる。また、制御部１５３は、コンテンツの要求に応じてクラウドサーバ１２から送信されてくる、オブジェクトの3Dモデルデータを、再生部１５７に再生させる。オブジェクトの3Dモデルデータを再生部１５７に再生させる際、制御部１５３は、センサ入力部１５５から供給されるセンサ情報に基づく仮想視点となるように制御する。

　センサ１５４は、ジャイロセンサや加速度センサで構成され、視聴者の視聴位置を検出し、センサ情報としてセンサ入力部１５５に供給する。センサ入力部１５５は、センサ１５４から供給されるセンサ情報を制御部１５３に供給する。

　ストリーム受信部１５６は、クラウドサーバ１２のストリーム送信部１１２に対応する受信部であり、クラウドサーバ１２から送信されてくる、オブジェクトの3Dモデルデータを受信し、再生部１５７に供給する。

　再生部１５７は、オブジェクトの3Dモデルデータから、制御部１５３から供給される視聴位置に基づく視聴範囲となるようにオブジェクトの3Dモデルを再生する。再生の結果得られる3Dモデルの自由視点画像は、画像出力部１５８に供給され、音声は、音声出力部１６０に供給される。

　画像出力部１５８は、再生部１５７からの自由視点画像をディスプレイ１５９に供給し、表示させる。ディスプレイ１５９は、画像出力部１５８から供給される自由視点画像を表示する。

　音声出力部１６０は、再生部１５７からの音声信号をスピーカ１６１から出力させる。スピーカ１６１は、音声出力部１６０からの音声信号に基づく音を出力する。

　画像処理システム１の撮影デバイス１１、クラウドサーバ１２、および、再生デバイス１３のそれぞれは、以上のような構成を有している。

　以下、画像処理システム１が行う処理の詳細について説明する。

＜４．ボリューメトリック撮影再生処理のフローチャート＞
　図５は、画像処理システム１によるボリューメトリック撮影再生処理のフローチャートである。

　初めに、ステップＳ１において、画像処理システム１は、ボリューメトリック撮影に参加する複数（N台）の撮影デバイス１１を１つのグループとしてグルーピングする撮影デバイス１１のグルーピング処理を実行する。この処理の詳細は、図６および図７を参照して後述する。

　ステップＳ２において、画像処理システム１は、カメラキャリブレーション処理を行うための撮影デバイス１１の設定を行うキャリブレーション用撮影設定処理を実行する。各撮影デバイス１１は、例えば、自身が備える撮影の機能や設定可能範囲に従って、露光時間、解像度等を所定の値に設定する。このカメラキャリブレーション処理用の設定値は、予め決定しておいてもよいし、後述するステップＳ４のボリューメトリック撮影用撮影設定処理のように、自身の能力情報に基づいてユーザに設定（選択）させてもよい。

　ステップＳ３において、画像処理システム１は、複数の撮影デバイス１１それぞれのカメラパラメータを算出する撮像デバイス１１のカメラキャリブレーション処理を実行する。この処理の詳細は、図８ないし図１１を参照して後述する。

　ステップＳ４において、画像処理システム１は、ボリューメトリック撮影用の撮影デバイス１１の設定を行うボリューメトリック撮影用撮影設定処理を実行する。この処理の詳細は、図１２および図１３を参照して後述する。

　ステップＳ５において、画像処理システム１は、複数の撮影デバイス１１それぞれが撮影タイミングを同期させて撮影を行う、撮影デバイス１１の同期撮影処理を実行する。この処理の詳細は、図１４および図１５を参照して後述する。

　ステップＳ６において、画像処理システム１は、オフラインモデリングを行うか、または、リアルタイムモデリングを行うかを判定する。オフラインモデリングは、ボリューメトリック撮影とは別のタイミングで3Dモデルの生成を行う3Dモデリング処理であり、リアルタイムモデリングは、ボリューメトリック撮影に同期して3Dモデルの生成を行う3Dモデリング処理である。オフラインモデリングとするか、または、リアルタイムモデリングとするかは、例えば、撮影デバイス１１のグルーピングを行う際に、所定の１台の撮影デバイス１１においてユーザが指定することによって決定される。

　ステップＳ６で、オフラインモデリングを行うと判定された場合、以下のステップＳ７およびＳ８の処理が実行される。

　ステップＳ７において、画像処理システム１は、複数の撮影デバイス１１によって撮影された被写体の画像ストリームに基づいて、3Dモデルデータを生成するオフラインモデリング処理を実行する。この処理の詳細は、図１６および図１７を参照して後述する。

　ステップＳ８において、画像処理システム１は、オフラインモデリング処理で生成された3Dモデルデータをコンテンツとして、3Dモデルの自由視点画像を再生デバイス１３に表示させるコンテンツ再生処理を実行する。この処理の詳細は、図１８を参照して後述する。

　一方、ステップＳ６で、リアルタイムモデリングを行うと判定された場合、以下のステップＳ９の処理が実行される。

　ステップＳ９において、画像処理システム１は、複数の撮影デバイス１１によって撮影された被写体の画像ストリームに基づいて3Dモデルデータを生成し、生成した3Dモデルデータを再生デバイス１３に送信して、3Dモデルの自由視点画像を表示させるリアルタイムモデリング再生処理を実行する。この処理の詳細は、図１９を参照して後述する。

　以上で、画像処理システム１によるボリューメトリック撮影再生処理が終了する。

　なお、図５の各ステップの処理は、連続して実行されてもよいし、各ステップが別々のタイミングで所定の時間を空けて実行されてもよい。

＜５．撮影デバイスのグルーピング処理のフローチャート＞
　次に、図６のフローチャートを参照して、図５のステップＳ１として実行される、撮影デバイス１１のグルーピング処理の詳細について説明する。

　ボリューメトリック撮影に参加する複数の撮影デバイス１１のうち、所定の１台の撮影デバイス１１をマスタデバイスと称し、他の撮影デバイス１１を参加デバイスと称する。

　初めに、ステップＳ２１において、マスタデバイスである撮影デバイス１１が、ボリューメトリック撮影アプリを起動して、ユーザID、パスワード、および、グループ名を入力し、グループ登録依頼をクラウドサーバ１２に送信する。ユーザIDは、ユーザが入力してもよいし、撮影デバイス１１の端末名やMACアドレス等を用いて自動で（ユーザの入力なしに）入力してもよい。グループ登録依頼がクラウドサーバ１２に送信される際には、マスタデバイスの位置情報も合わせてクラウドサーバ１２に送信される。位置情報は、後述するステップＳ２４において、グループを構成する複数の撮影デバイス１１がボリューメトリック撮影可能であるかどうかの判断が可能な情報であればよい。位置情報には、例えば、GPSセンサ４３により検出される移動経度情報、キャリア通信の基地局の電界強度を用いた三角測量で求めた緯度経度情報、Wi-Fi無線通信のアクセスポイント情報（例えばSSIDやMACアドレス情報）をWi-Fi位置情報サービスに送信して取得した緯度経度情報などを用いることができる。

　ステップＳ２２において、マスタデバイスは、グループ登録依頼に対応してクラウドサーバ１２から返信されてくる２次元コードを取得して、ディスプレイ３７に表示する。

　図７は、ステップＳ２２においてマスタデバイスのディスプレイ３７に表示される２次元コードの画面例を示している。

　図７の画面では、クラウドサーバ１２が提供するサービスの名前である「Volumetricモデリングサービス」の文字とともに、ステップＳ２１でユーザが入力したユーザID(USERID)、パスワード（PASSWD）、グループ名（GroupName）が表示されている。また、「カメラで以下の２次元コードを撮影して下さい」の文字とともに、２次元コードが表示されている。

　ステップＳ２３において、マスタデバイス以外の撮影デバイス１１である各参加デバイスは、ボリューメトリック撮影アプリを起動して、マスタデバイスのディスプレイ３７に表示された２次元コードを撮影する。２次元コードを撮影した参加デバイスは、登録グループを識別するグループ識別情報と、自身の位置情報を、クラウドサーバ１２に送信する。あるいはまた、参加デバイスが２次元コードを撮影すると、ボリューメトリック撮影アプリが自動起動されて、グループ識別情報と参加デバイスの位置情報が、クラウドサーバ１２に送信されるようにしてもよい。グループ識別情報は、例えば、ユーザIDまたはグループ名とすることができる。

　ステップＳ２４において、クラウドサーバ１２は、参加デバイスから送信されてくるグループ識別情報と位置情報とを用いて、同一グループのマスタデバイスと参加デバイスがボリューメトリック撮影が可能であるかを判定する。クラウドサーバ１２のコントローラ１０１は、例えば、参加デバイスの位置が、マスタデバイスの位置から一定範囲内の近傍位置にあるか否かにより、参加デバイスがボリューメトリック撮影が可能であるかを判定する。参加デバイスが、マスタデバイスの位置から一定範囲内の近傍位置に存在する場合、クラウドサーバ１２は、リューメトリック撮影が可能であると判定する。

　ステップＳ２４で、参加デバイスがボリューメトリック撮影が可能であると判定された場合、クラウドサーバ１２は、参加デバイスを、グループ識別情報が示すグループ、すなわちマスタデバイスのグループに登録し、登録完了メッセージを参加デバイスに送信する。

　一方、ステップＳ２４で、参加デバイスがボリューメトリック撮影が可能ではないと判定された場合、クラウドサーバ１２は、参加デバイスにグループ登録エラーを送信する。

　ステップＳ２７において、画像処理システム１は、グループ登録が完了したか否かを判定し、グループ登録がまだ完了していないと判定された場合、上述したステップＳ２３ないしＳ２７の処理が繰り返される。例えば、マスタデバイスにおいて、図７の２次元コードの画面の表示を終了し、登録作業を終了する操作が行われた場合、グループ登録が完了したと判定される。

　ステップＳ２７で、グループ登録が完了したと判定された場合、図６の撮影デバイス１１のグルーピング処理が終了する。

　上述したグルーピング処理においては、２次元バーコードを認識することによりグループ識別情報を取得して、クラウドサーバ１２に送信するようにしたが、ユーザがグループ識別情報を入力して、クラウドサーバ１２に送信するようにしてもよい。

　また、Wi-Fi（登録商標）のWPSボタンのような操作で、参加デバイスのグループ登録が行えるようにしてもよい。具体的な処理としては、例えば、マスタデバイスが、画面上のグループ登録ボタンを押下すると、グループ登録受付状態となった旨と位置情報がクラウドサーバ１２に送信される。参加デバイスのユーザが、画面上のグループ登録ボタンを押下すると、グループ登録ボタン押下の旨と位置情報が、参加デバイスからクラウドサーバ１２に送信される。クラウドサーバ１２は、マスタデバイスのグループ登録ボタン押下から一定時間以内に、グループ登録ボタンが押下された参加デバイスの位置情報を確認し、マスタデバイスのグループに登録可能かを判定し、登録完了メッセージまたはグループ登録エラーを参加デバイスに送信する。

　また、上述したグルーピング処理においては、マスタデバイスと参加デバイスの位置情報のみに基づいて参加デバイスがボリューメトリック撮影が可能であるかを判定したが、その他の内容で判定してもよい。

　例えば、マスタデバイスと参加デバイスが、同一のアクセスポイントに接続しているか否かにより判定してもよい。また例えば、マスタデバイスと参加デバイスのそれぞれが、同一の被写体を撮影し、撮影された画像に同一の被写体が写っていることをもって、ボリューメトリック撮影が可能であると判定してもよい。また例えば、マスタデバイスで参加デバイスを撮影し、撮影された画像に参加デバイスの所定の部分（例えば、ディスプレイの表示画像）が写っていることをもって、ボリューメトリック撮影が可能であると判定してもよい。反対に、参加デバイスでマスタデバイスを撮影してもよい。さらに、上述した判定内容を複数組み合わせて判定してもよい。

　上述したグルーピング処理により、ユーザが普段使用している一般的な電子機器、例えば、スマートフォンやタブレットなどを、ボリューメトリック撮影を行う撮影デバイス１１として簡単に登録することができ、グループ登録した他の撮影デバイス１１と連携させた動作が可能となる。

＜６．撮影デバイスのカメラキャリブレーション処理のフローチャート＞
　次に、図５のステップＳ３として実行される、撮影デバイス１１のカメラキャリブレーション処理の詳細について説明する。

　ボリューメトリック撮影の専用のスタジオなどでは、カメラのキャリブレーション用に、キャリブレーションボードなどが予め用意されているが、そのような特別に用意されたボード等がなくてもキャリブレーションを実行できる必要がある。

　そこで、画像処理システム１では、図８に示されるように、１つの撮影デバイス１１にキャリブレーションボード画像を表示させ、他の全ての撮影デバイス１１が、表示されたキャリブレーションボード画像を撮影して特徴点を検出する処理を、グルーピングされた全ての撮影デバイス１１で順次行うことにより、撮影デバイス１１のカメラパラメータを算出するカメラキャリブレーション処理が実行される。撮影デバイス１１のカメラ５１としては、ディスプレイ３７と同じ面のカメラ５１が用いられる。

　図８の例では、５台の撮影デバイス１１のうち、撮影デバイス１１―５にキャリブレーションボード画像が表示されており、他の撮影デバイス１１－１ないし１１－４が、撮影デバイス１１―５のキャリブレーションボード画像を撮影して特徴点を検出する。撮影デバイス１１－１ないし１１－４も、順番に、キャリブレーションボード画像を表示し、他の撮影デバイス１１が、表示されたキャリブレーションボード画像を撮影して特徴点を検出する。

　図９のフローチャートを参照して、図５のステップＳ３として実行される、撮影デバイス１１のカメラキャリブレーション処理の詳細について説明する。

　初めに、ステップＳ４１において、クラウドサーバ１２は、キャリブレーションボード画像を表示する撮影デバイス１１を１つ選択する。クラウドサーバ１２は、選択した撮影デバイス１１（以下、選択撮影デバイス１１とも称する。）に対して、キャリブレーションボード画像を表示させる命令（メッセージ）を送信する。

　ステップＳ４２において、選択撮影デバイス１１は、クラウドサーバ１２から、キャリブレーションボード画像を表示させる命令を受信し、キャリブレーションボード画像をディスプレイ３７に表示する。

　ステップＳ４３において、選択撮影デバイス１１以外の他の撮影デバイス１１それぞれは、選択撮影デバイス１１のディスプレイ３７に表示されたキャリブレーションボード画像を同期して撮影する。

　ステップＳ４４において、選択撮影デバイス１１以外の他の撮影デバイス１１それぞれは、撮影して得られたキャリブレーションボード画像の特徴点を検出し、検出した各特徴点の情報である特徴点情報を、クラウドサーバ１２に送信する。

　ステップＳ４５において、クラウドサーバ１２のキャリブレーション部１０５は、各撮影デバイス１１から送信されてきた、キャリブレーションボード画像の特徴点情報を、通信部１０３等を介して取得し、記憶する。

　ステップＳ４６で、クラウドサーバ１２は、グルーピングされた全ての撮影デバイス１１でキャリブレーションボード画像を表示したかを判定する。

　ステップＳ４６で、全ての撮影デバイス１１でキャリブレーションボード画像を表示していないと判定された場合、処理はステップＳ４１へ戻り、上述したステップＳ４１ないしＳ４６の処理が再度実行される。すなわち、キャリブレーションボード画像をまだ表示していない撮影デバイス１１の１つが選択され、他の撮影デバイス１１それぞれが、表示されたキャリブレーションボード画像を撮像して特徴点を検出し、特徴点情報をクラウドサーバ１２に送信する処理が実行される。

　一方、ステップＳ４６で、全ての撮影デバイス１１でキャリブレーションボード画像を表示したと判定された場合、処理はステップＳ４７に進み、クラウドサーバ１２のキャリブレーション部１０５は、記憶した特徴点情報を用いて、特徴点の３次元位置と、撮影デバイス１１の内部パラメータおよび外部パラメータとを、撮影デバイス１１ごとに推定する。

　複数の撮影装置で撮影した画像から、撮影装置のカメラパラメータを算出する方法としては、例えば、バンドル調整と非線形最適化問題を解くアルゴリズムなどがあり、例えば、「岩元祐輝, 菅谷保之, 金谷健一. “3 次元復元のためのバンドル調整の実装と評価.” コンピュータビジョンとイメージメディア (CVIM) 2011.19 (2011): 1-8.」などに開示されている。

　ステップＳ４８において、クラウドサーバ１２のキャリブレーション部１０５は、推定した各撮影デバイス１１の内部パラメータおよび外部パラメータを、オフラインモデリング部１０８およびリアルタイムモデリング部１１１に供給して、カメラキャリブレーション処理を終了する。

　上述したカメラキャリブレーション処理により、特別に用意されたキャリブレーションボードなどが存在しない場合であっても、グルーピングされた各撮像デバイス１１のカメラパラメータを算出することができる。

　なお、上述したカメラキャリブレーション処理では、グルーピングされた複数の撮影デバイス１１で、同一のキャリブレーションボード画像を表示させることを前提として、複数の撮影デバイス１１が、順番にキャリブレーションボード画像を表示させるようにした。

　しかしながら、グルーピングされた複数の撮影デバイス１１に表示させるキャリブレーションボード画像が、図１０に示されるように異なる場合には、複数の撮影デバイス１１が同時にキャリブレーションボード画像を表示させ、各撮影デバイス１１は、他の撮影デバイス１１に表示されたキャリブレーションボード画像の特徴点を一度に検出することができる。キャリブレーションボード画像は、パターン形状が異なる画像であってもよいし、色が異なる画像でもよい。図１０に示されるキャリブレーションボード画像は、チェスパターンのボード画像、ドットパターンのボード画像の例であり、格子の数（MxN,KxL）やドットの大きさや密度が異なる画像である。

　あるいはまた、図１１の撮影デバイス１１―６のように、グルーピングされた複数の撮影デバイス１１のうちの１つを、キャリブレーションボード画像の表示用として、ユーザが、キャリブレーションボード画像が表示された撮影デバイス１１―６を、キャリブレーションボードのように動かしながら、各撮影デバイス１１で撮影して、キャリブレーションボード画像の特徴点を検出してもよい。

＜７．ボリューメトリック撮影用撮影設定処理のフローチャート＞
　次に、図１２のフローチャートを参照して、図５のステップＳ４として実行される、ボリューメトリック撮影用撮影設定処理の詳細について説明する。

　初めに、ステップＳ６１において、グルーピングされた複数の撮影デバイス１１それぞれは、自身の能力情報をクラウドサーバ１２に送信する。

　能力情報は、撮影デバイス１１が備える撮影の機能や設定可能範囲に関する情報であり、例えば、以下の項目についての情報が含まれ得る。
１．カメラタイプ（RGB,RGB-D,IR）
２．カメラ設定１（露光時間、ゲイン、ズーム）
３．カメラ設定２（撮影解像度、ROI、フレームレート）
４．画像エンコード設定（出力解像度、圧縮符号化方式、ビットレート）
５．カメラ同期方式（Type1、Type2、Type3）
６．カメラキャリブレーション方式（Type1、Type2、Type3）

　カメラ設定２のROIは、撮影解像度が示す撮影範囲のうち、注目領域として設定可能な範囲を表す。

　図１３は、ある撮影デバイス１１が有する能力情報の例を示している。

　図１３の能力情報によれば、この撮影デバイス１１は、機器識別名が“カメラ１”であり、カメラタイプが “RGB”であり、露光時間としては“500”, “1000”, “10000”のいずれかを設定可能であり、フレームレートとしては“30”, “60”, “120”のいずれかを設定可能であり、撮影解像度としては“3840x2160”, “1920x1080”, “640x480”のいずれかを設定可能である。

　また、撮影デバイス１１は、画像エンコード設定に関し、圧縮符号化方式として“H.264”, “H.265”のいずれかを設定可能であり、出力解像度として“3840x2160”, “1920x1080”, “640x480”のいずれかを設定可能であり、ビットレートとして“１M”, “3M”, “5M”, “10M”, “20M”, “50M”のいずれかを設定可能である。

　さらに、撮像デバイス１１は、カメラ同期方式として“タイプ１”、“タイプ２”、“タイプ３”のいずれかを設定可能であり、キャリブレーション方式として“タイプ１”、“タイプ２”、“タイプ３”のいずれかを設定可能である。

　ステップＳ６２において、クラウドサーバ１２は、１つのグループに設定された全ての撮影デバイス１１の能力情報を基に、ボリューメトリック撮影に適した各撮影デバイス１１の設定値の候補を生成する。各撮影デバイス１１の設定値は、１つのグループに設定された全ての撮影デバイス１１に共通な設定値もあるし、異なる設定値もある。例えば、カメラ同期方式などは全ての撮影デバイス１１で共通に設定されるが、カメラタイプは、複数の撮影デバイス１１がRGBで、残りの撮影デバイス１１がIRなど、のように別々に設定することができる。

　ステップＳ６３において、クラウドサーバ１２は、ボリューメトリック撮影、すなわち、3Dモデル生成用の撮影が可能であるかを判定する。ボリューメトリック撮影が可能か否かは、詳細は後述するが、例えば、１つのグループに設定された全ての撮影デバイス１１の撮影対象領域を重畳して、一定台数以上の撮影デバイス１１に共通する領域が存在するか等により判定することができる。

　ステップＳ６３で、ボリューメトリック撮影が可能であると判定された場合、処理はステップＳ６４に進み、クラウドサーバ１２は、各撮影デバイス１１に設定値の候補を送信し、各撮影デバイス１１が、設定値の候補を受信してユーザに提示する。

　ユーザは、表示された設定値の候補を参照し、所望の設定値の候補を選択する。すると、ステップＳ６５において、各撮影デバイス１１は、ユーザが指定した設定値の候補をクラウドサーバ１２に送信する。

　ステップＳ６６において、クラウドサーバ１２は、各撮影デバイス１１から送信されてきた、ユーザ指定の設定値の候補を取得し、ユーザが指定した設定値をセットする設定信号を、各撮影デバイス１１に送信して、ボリューメトリック撮影用撮影設定処理を終了する。

　一方、ステップＳ６３で、ボリューメトリック撮影が不可能であると判定された場合、処理はステップＳ６７に進み、クラウドサーバ１２は、ボリューメトリック撮影ができないことを各撮影デバイス１１に送信し、ユーザに提示する。これにより、ボリューメトリック撮影用撮影設定処理が終了する。

　以上のように、ボリューメトリック撮影用撮影設定処理では、各撮影デバイス１１の能力情報に基づいて、ボリューメトリック撮影が可能かどうかが判定され、ボリューメトリック撮影が可能となる設定値のなかから、所定の設定値が選択される。

　以下、各撮影デバイス１１の能力情報に基づく、各撮影デバイス１１の設定値候補の決定例と、ボリューメトリック撮影が可能かどうかの判定例について説明する。各撮影デバイス１１の能力情報は、取得済みであるとする。また、3Dモデルデータの生成におけるフレームレートの希望値や、何分のコンテンツを何分で処理したいか、という処理時間に対する希望値がユーザの要求値として設定されているものとする。

　[STEP1]
　クラウドサーバ１２のコントローラ１０１は、まず、各撮影デバイス１１の能力情報に基づいて、カメラ同期方式を決定する。例えば、撮影デバイス１１－１ないし１１－Ｎのカメラ同期方式が、以下の条件であるとき、コントローラ１０１は、全ての撮影デバイス１１がサポートしているカメラ同期方式のうち、より優先度の高いものを選択する。優先度が、type1 > type2> ... > type Kである場合、Type2が選択される。
　撮影デバイス１１－１:  Type1, Type2, ... TypeK
　撮影デバイス１１－２:         Type2, ... TypeK
　・・・
　撮影デバイス１１－Ｎ:  Type1, Type2, ... TypeK

　[STEP2]
　次に、コントローラ１０１は、各撮影デバイス１１との間で通信帯域の測定を行い、最大ビットレート[Mbps]を決定する。撮影デバイス１１－１ないし１１－Ｎのそれぞれで決定された最大ビットレートが以下であるとする。
　撮影デバイス１１－１:  X₀ [Mbps]
　撮影デバイス１１－２:  X₁ [Mbps]
　・・・
　撮影デバイス１１－Ｎ:  X_n [Mbps]

　[STEP3]
　次に、コントローラ１０１は、各撮影デバイス１１の最大ビットレートの範囲内で、カメラタイプ、解像度や、フレームレート、圧縮符号化方式等の可能な組み合わせを計算し、撮影デバイス１１毎に設定値の候補を決定する。
　撮影デバイス１１－１:
    候補1 (RGB, 3840x2160, 30, H.265, 40M)
    候補2 (RGB, 3840x2160, 60, H.265, 50M)
    候補3 (RGB, 1920x1080, 30, H.265, 20M)
    候補4 (RGB-D, 1920x1080, 30, H.265, 40M)
　撮影デバイス１１－２:
    候補1 (RGB, 3840x2160, 30, H.265, 40M)
    候補2 (RGB, 3840x2160, 60, H.265, 50M)
    候補3 (RGB, 1920x1080, 120, H.265, 20M)
    候補4 (RGB-D、1920x1080, 30, H.265, 40M)
　・・・

　[STEP4]
　コントローラ１０１は、決定された各設定値の候補を用いて、ボリューメトリック撮影が可能であるかを判定する。コントローラ１０１は、以下のような方法により、ボリューメトリック撮影が可能であるかを判定することができる。

　例えば、コントローラ１０１は、各撮影デバイス１１のキャリブレーション結果に基づいて、各撮影デバイス１１の撮影対象領域を算出し、各撮影デバイス１１の撮影対象領域を重畳したときに、共通撮影領域が存在するか否かにより、ボリューメトリック撮影が可能であるかを判定する。共通撮影領域は、全ての撮影デバイス１１の撮影対象領域に共通する領域としてもよいし、一定台数以上の撮影デバイス１１の撮影対象領域に共通する領域としてもよい。

　また例えば、コントローラ１０１は、各撮影デバイス１１の解像度と撮影対象領域とから、３Dモデルのモデリングパラメータを算出し、算出したモデリングパラメータが所定の範囲内であるか否かにより、ボリューメトリック撮影が可能であるかを判定する。モデリングパラメータは、ボクセルサイズとバウンディングボックスサイズで構成される。より具体的には、コントローラ１０１は、各撮影デバイス１１の解像度と撮影対象領域とから、３Dモデルを生成する際のボクセルサイズがいくつになるか（何mm角）を決定する。そして、コントローラ１０１は、算出されたボクセルサイズが、ボクセルサイズの下限値Voxel_Lと上限値Voxel_Uの間に入っているか否かにより（Voxel_L＜＝ボクセルサイズ＜＝Voxel_U）、ボリューメトリック撮影が可能であるかを判定する。コントローラ１０１は、ボクセルサイズの下限値Voxel_Lと上限値Voxel_Uの間のなかから、複数のボクセルサイズとバウンディングボックスサイズを設定値の候補として加えてもよい。

　また例えば、コントローラ１０１は、各撮影デバイス１１の各設定値の候補から、3Dモデリングにかかる処理時間を推定し、推定した3Dモデリング処理時間が所定の時間以内であるか否かにより、ボリューメトリック撮影が可能であるかを判定する。より具体的には、コントローラ１０１は、各撮影デバイス１１の解像度、フレームレート、圧縮符号化方式、ビットレートなどから、3Dモデルデータの復号処理時間を推定し、ボクセルサイズとバウンディングボックスサイズとから計算される処理対象ボクセル数に基づいて、自由視点画像の描画処理時間を推定する。コントローラ１０１は、オフラインモデリングの場合は、推定した3Dモデリング処理時間がユーザが要求する処理時間以内であるかを判定し、リアルタイムモデリングの場合は、推定した3Dモデリング処理時間がリアルタイム処理可能な所定値以下であるかを判定する。

　[STEP5]
　コントローラ１０１は、ボリューメトリック撮影が可能であると判定された場合に、[STEP3]で決定された設定値の候補を所定の優先度順で並べてユーザに提示する。

　例えば、画質を優先する場合には、(1)ボクセルサイズが小さくなる設定値、(2)解像度が高くなる設定値、(3)フレームレートが高くなる設定値、の順に、設定値の候補が提示される。

　また例えば、フレームレートを優先する場合、(1) フレームレートが高くなる設定値、(2) ボクセルサイズが小さくなる設定値、(3) 解像度が高くなる設定値、の順に、設定値の候補が提示される。

　以上のように、クラウドサーバ１２は、各撮影デバイス１１の能力情報に基づいて、各撮影デバイス１１の設定値候補を決定し、ボリューメトリック撮影が可能かどうかを自動で判定する。

　ユーザが普段使用しているスマートフォンやタブレットなどを、ボリューメトリック撮影を行う撮影デバイス１１として使用する場合、ユーザが持っている電子機器の性能は多種多様となる。上述したボリューメトリック撮影用撮影設定処理により、ボリューメトリック撮影に参加した撮像デバイス１１の性能に応じて、撮影機能に関する設定値を最適に決定することができる。

＜８．撮影デバイスの同期撮影処理のフローチャート＞
　次に、図５のステップＳ５において実行される、撮影デバイス１１の同期撮影処理の詳細について説明する。

　撮影デバイス１１の同期撮影処理には、図１４を参照して説明する処理と、図１５を参照して説明する処理の少なくとも２種類がある。図１４の同期撮影処理は、撮影デバイス１１内の時計情報を用いて同期して撮影する処理であり、図１５の同期撮影処理は、撮影デバイス１１内の時計情報を用いることができない場合の処理である。撮影デバイス１１内の時計情報を用いることができない場合の同期撮影処理は、撮影した画像データを事後的に同期させることができるようにするための撮影処理となる。

　初めに、図１４のフローチャートを参照して、撮影デバイス１１内の時計情報を用いて同期して撮影する場合の同期撮影処理について説明する。図１４の処理実行開始時には、撮影デバイス１１内の時計情報は、上述した第１の同期手法ないし第４の同期手法により、高精度に同期されている。

　ステップＳ８１において、クラウドサーバ１２は、グルーピングされた複数の撮影デバイス１１それぞれから現在の時刻を取得する。

　ステップＳ８２において、クラウドサーバ１２は、取得した各撮影デバイス１１の時刻のうち、最も進んだ時刻に一定時間を加えた時刻を、キャプチャ開始時刻に決定する。

　ステップＳ８３において、クラウドサーバ１２は、各撮影デバイス１１へネットワークを介して所定の命令を送信することにより、各撮影デバイス１１のカメラ５１をスタンバイ状態に制御する。スタンバイ状態とは、同期信号が入力されると、同期信号に応じて撮影を行うことができる状態である。

　ステップＳ８４において、クラウドサーバ１２は、ステップＳ８２で決定したキャプチャ開始時刻を、各撮影デバイス１１に送信する。

　ステップＳ８５において、各撮影デバイス１１は、クラウドサーバ１２から送信されてきたキャプチャ開始時刻を取得し、同期信号生成部４５に設定する。同期信号生成部４５は、キャプチャ開始時刻が到来すると、同期信号の生成および出力を開始する。同期信号は、図８の撮影設定処理で設定されたフレームレートで出力され、カメラ５１に供給される。

　ステップＳ８６において、各撮影デバイス１１のカメラ５１は、入力された同期信号に基づいて、3Dモデルとなる被写体を撮影する。撮影により得られた被写体の画像データ（画像ストリーム）は、撮像デバイス１１内に一時的に保持されるか、リアルタイムでクラウドサーバ１２へ送信される。

　ステップＳ８７において、各撮影デバイス１１は、撮影の終了が指示されたかを判定する。撮影の終了は、マスタデバイス等の所定の撮影デバイス１１をユーザが操作することにより決定され、その撮影デバイス１１から、他の撮影デバイス１１へ終了が指示されてもよいし、クラウドサーバ１２を介して終了が指示されてもよい。

　ステップＳ８７で、撮影の終了が指示されていないと判定された場合、上述したステップＳ８６およびＳ８７が繰り返される。すなわち、同期信号に基づく撮影が継続される。

　一方、ステップＳ８７で、撮影の終了が指示されたと判定された場合、処理はステップＳ８８に進み、各撮影デバイス１１は、被写体の撮影を停止して、同期撮影処理を終了する。同期信号生成部４５の同期信号の生成も停止する。

　次に、図１５のフローチャートを参照して、撮影デバイス１１内の時計情報を用いることができない場合の同期撮影処理について説明する。

　初めに、ステップＳ１０１において、クラウドサーバ１２は、各撮影デバイス１１へネットワークを介して所定の命令を送信することにより、各撮影デバイス１１に撮影を開始させる。

　ステップＳ１０２において、各撮影デバイス１１は、内部クロックに基づいて同期信号生成部４５が生成した同期信号に基づいて、3Dモデルとなる被写体を撮影する。撮影により得られた被写体の画像データ（画像ストリーム）は、撮像デバイス１１内に一時的に保持されるか、リアルタイムでクラウドサーバ１２へ送信される。

　ステップＳ１０３において、クラウドサーバ１２は、撮影開始から一定時間経過後の所定の時刻となったかを判定する。

　ステップＳ１０３で、撮影開始から一定時間経過後の所定の時刻となったと判定された場合、ステップＳ１０４において、クラウドサーバ１２は、フラッシュ３９の発光指令を、所定の撮影デバイス１１、例えば、マスタデバイスに送信する。

　ステップＳ１０５において、フラッシュの発光指令が送信されてきた所定の撮影デバイス１１は、発光指令に基づいて、フラッシュ３９を発光する。

　一方、ステップＳ１０３で、撮影開始から一定時間経過後の所定の時刻ではないと判定された場合、ステップＳ１０４およびＳ１０５がスキップされる。したがって、撮影開始から一定時間経過後の所定の時刻においてのみ、ステップＳ１０４およびＳ１０５の処理が実行される。

　ステップＳ１０６において、各撮影デバイス１１は、撮影の終了が指示されたかを判定する。ステップＳ１０６で、撮影の終了が指示されていないと判定された場合、上述したステップＳ１０２ないしＳ１０６が繰り返される。すなわち、同期信号に基づく撮影が継続される。

　一方、ステップＳ１０６で、撮影の終了が指示されたと判定された場合、処理はステップＳ１０７に進み、各撮影デバイス１１は、被写体の撮影を停止して、同期撮影処理を終了する。同期信号生成部４５の同期信号の生成も停止する。

　図１５の同期撮影処理によれば、グルーピングされた複数の撮影デバイス１１で撮影された画像ストリームには、フラッシュが発光した画像が含まれる。3Dモデリング処理を行う際、フラッシュが発光したフレームが同一のタイムスタンプとなるように、複数の撮影デバイス１１それぞれで撮影された画像ストリームの時刻情報を揃えることで、複数の撮影デバイス１１それぞれで撮影された撮影画像の同期を取ることができる。

　なお、タイムスタンプを揃えるために撮影中にフラッシュ３９を発光させる手段の他、スピーカ３５から音を出力し、音が記録されたフレームが同一のタイムスタンプとなるように画像ストリームの時刻情報を揃えることにより、撮影画像の同期を取ってもよい。

＜９．オフラインモデリング処理のフローチャート＞
　次に、図１６のフローチャートを参照して、図５のステップＳ７として実行される、オフラインモデリング処理の詳細について説明する。

　初めに、ステップＳ１２１において、複数の撮影デバイス１１それぞれは、撮影が終了したか否かを判定し、撮影が終了したと判定されるまで待機する。

　そして、ステップＳ１２１で、撮影が終了したと判定された場合、処理はステップＳ１２２に進み、各撮影デバイス１１は、被写体を撮影した撮影画像の画像ストリームを、所定のネットワークを介して、クラウドサーバ１２に送信する。被写体を撮影した撮影画像は、画像処理部５４においてデモザイク処理等の所定の画像信号処理が実行され、画像圧縮部５５において所定の圧縮符号化処理が実行された後、ストリーム送信部５９から画像ストリームとして送信される。

　ステップＳ１２３において、クラウドサーバ１２のストリーム受信部１０４は、通信部１０３を介して、各撮影デバイス１１から送信されてきた画像ストリームを受信し、モデリングタスク生成部１０６に供給する。

　ステップＳ１２４において、クラウドサーバ１２のモデリングタスク生成部１０６は、キャリブレーション部１０５から各撮影デバイス１１のカメラパラメータを取得し、ストリーム受信部１０４からの画像ストリームとともに、モデリングタスクを生成し、タスク記憶部１０７に記憶させる。タスク記憶部１０７には、モデリングタスク生成部１０６から順次供給されたモデリングタスクが、タスクキューとして記憶される。

　ステップＳ１２５において、オフラインモデリング部１０８は、タスク記憶部１０７に記憶されたモデリングタスクの１つを取得する。

　ステップＳ１２６において、オフラインモデリング部１０８は、取得したモデリングタスクの各撮影デバイス１１の画像ストリームのうち、第ｉフレームの撮影画像を取得する。ここで、画像ストリームのフレーム番号の変数ｉの初期値には「１」が設定されている。

　ステップＳ１２７において、オフラインモデリング部１０８は、取得した各撮影デバイス１１の第ｉフレームの撮影画像と、予め設定された背景画像とから、シルエット画像を生成する。シルエット画像は、被写体領域をシルエットで表した画像であり、例えば、撮影画像と背景画像との差分をとる背景差分法を用いることにより生成することができる。

　ステップＳ１２８において、オフラインモデリング部１０８は、各撮影デバイス１１に対応するN枚のシルエット画像から、例えばVisual Hullにより、オブジェクトの3D形状を表す形状データを生成する。Visual Hullは、N枚のシルエット画像を、カメラパラメータに従って投影し、３次元形状の削り出しを行う手法である。オブジェクトの3D形状を表す形状データは、例えば、３次元上の格子（voxel）単位で、オブジェクトに属するかまたは属さないかを表したボクセルデータで表される。

　ステップＳ１２９において、オフラインモデリング部１０８は、オブジェクトの3D形状を表す形状データを、ボクセルデータから、ポリゴンメッシュと呼ばれるメッシュ形式のデータに変換する。表示デバイスでレンダリング処理がしやすいポリゴンメッシュのデータ形式の変換には、例えばマーチングキューブ法などのアルゴリズムを用いることができる。

　ステップＳ１３０において、オフラインモデリング部１０８は、オブジェクトの形状データに対応するテクスチャ画像を生成する。テクスチャ画像は、図３を参照して説明したマルチテクスチャ形式が採用される場合には、各撮影デバイス１１で撮影された撮影画像が、そのままテクスチャ画像とされる。一方、図３を参照して説明したUVマッピング形式が採用される場合には、オブジェクトの形状データに対応するUVマッピング画像が、テクスチャ画像として生成される。

　ステップＳ１３１において、オフラインモデリング部１０８は、現在のフレームが、取得したモデリングタスクの各撮影デバイス１１の画像ストリームの最終フレームであるかを判定する。

　ステップＳ１３１で、現在のフレームが、取得したモデリングタスクの各撮影デバイス１１の画像ストリームの最終フレームではないと判定された場合、処理はステップＳ１３２へ進む。そして、ステップＳ１３２において、変数ｉが１だけインクリメントされた後、上述したステップＳ１２６ないしＳ１３１が繰り返される。すなわち、取得したモデリングタスクの各撮影デバイス１１の画像ストリームのなかの次のフレームの撮影画像について、オブジェクトの形状データとテクスチャ画像が生成される。

　一方、ステップＳ１３１で、現在のフレームが、取得したモデリングタスクの各撮影デバイス１１の画像ストリームの最終フレームであると判定された場合、処理はステップＳ１３３へ進み、オフラインモデリング部１０８は、オブジェクトの3Dモデルデータを、コンテンツ管理部１０９に供給する。コンテンツ管理部１０９は、オフラインモデリング部１０８から供給されたオブジェクトの3Dモデルデータを、コンテンツとしてコンテンツ記憶部１１０に記憶させて管理する。

　図１７は、コンテンツ記憶部１１０に記憶されるオブジェクトの3Dモデルデータの例を示している。オブジェクトの3Dモデルデータは、オブジェクトの形状データとテクスチャ画像をフレーム単位に有している。

　以上により、オフラインモデリング処理が終了する。

＜１０．コンテンツ再生処理のフローチャート＞
　次に、図１８のフローチャートを参照して、図５のステップＳ８として実行される、コンテンツ再生処理の詳細について説明する。

　再生デバイス１３のユーザである視聴者は、再生するコンテンツを指定する操作を行う。ステップＳ１４１において、再生デバイス１３のメッセージ送受信部１５２は、ユーザによって再生が指定されたコンテンツの3Dモデルデータを、クラウドサーバ１２へ要求する。

　ステップＳ１４２において、クラウドサーバ１２は、指定されたコンテンツの3Dモデルデータを再生デバイス１３に送信する。より具体的には、クラウドサーバ１２のコントローラ１０１は、メッセージ送受信部１０２を介して、所定のコンテンツの3Dモデルデータを要求するメッセージを受信する。コントローラ１０１は、要求されたコンテンツの再生デバイス１３への送信を、コンテンツ管理部１０９に指示する。コンテンツ管理部１０９は、指定されたコンテンツの3Dモデルデータを、コンテンツ記憶部１１０から取得し、ストリーム送信部１１２を介して再生デバイス１３に送信する。

　ステップＳ１４３において、再生デバイス１３は、クラウドサーバ１２から送信されてきたコンテンツとしての第ｋフレームの形状データとテクスチャ画像を取得する。ここで、送信されてくるコンテンツの3Dモデルデータのフレーム番号の変数ｋの初期値には「１」が設定されている。

　ステップＳ１４４において、再生デバイス１３の制御部１５３は、センサ１５４で検出されたセンサ情報に基づいて、オブジェクトに対する視聴者の視聴位置である仮想視点位置を決定する。決定された仮想視点位置の情報は、再生部１５７に供給される。

　ステップＳ１４５において、再生デバイス１３の再生部１５７は、決定された仮想視点位置に基づき、3Dモデルのオブジェクトの画像を描画するレンダリング処理を行う。すなわち、再生部１５７は、3Dモデルのオブジェクトを仮想視点位置から見たオブジェクト画像を生成して、画像出力部１５８を介してディスプレイ１５９に出力する。

　ステップＳ１４６において、再生部１５７は、現在のフレームが、取得したコンテンツの最終フレームであるかを判定する。

　ステップＳ１４６で、現在のフレームが、取得したコンテンツの最終フレームではないと判定された場合、処理はステップＳ１４７へ進む。そして、ステップＳ１４７において、変数ｋが１だけインクリメントされた後、上述したステップＳ１４３ないしＳ１４６が繰り返される。すなわち、取得したコンテンツの次のフレームのオブジェクトの形状データとテクスチャ画像に基づいて、仮想視点位置から見たオブジェクト画像が生成および表示される。

　一方、ステップＳ１４６で、現在のフレームが、取得したコンテンツの最終フレームであると判定された場合、コンテンツ再生処理は終了する。

＜１１．リアルタイムモデリング再生処理のフローチャート＞
　次に、図１９のフローチャートを参照して、図５のステップＳ９として実行される、リアルタイムモデリング再生処理の詳細について説明する。

　リアルタイムモデリング再生処理が実行される状態は、図５のステップＳ６において、リアルタイムモデリングを行うと判定された場合であるので、複数の撮影デバイス１１それぞれから、ボリューメトリック撮影による画像ストリームの撮影画像が、順次、クラウドサーバ１２へ送信されてくる。

　ステップＳ１６１において、クラウドサーバ１２のストリーム受信部１０４は、各撮影デバイス１１から順次送信されてきた画像ストリームの撮影画像を、通信部１０３を介して受信し、リアルタイムモデリング部１１１に供給する。

　ステップＳ１６２において、リアルタイムモデリング部１１１は、ストリーム受信部１０４から供給されて蓄積された各撮影デバイス１１の撮影画像を１フレームずつ取得する。より具体的には、リアルタイムモデリング部１１１は、蓄積された各撮影デバイス１１の撮影画像のうち、時刻情報の最も古い１フレームを複数の撮影デバイス１１それぞれについて取得する。

　ステップＳ１６３において、リアルタイムモデリング部１１１は、取得した各撮影デバイス１１の撮影画像と、予め設定された背景画像とから、シルエット画像を生成する。

　ステップＳ１６４において、リアルタイムモデリング部１１１は、各撮影デバイス１１に対応するN枚のシルエット画像から、例えばVisual Hullにより、オブジェクトの3D形状を表す形状データを生成する。オブジェクトの3D形状を表す形状データは、例えば、ボクセルデータで表される。

　ステップＳ１６５において、リアルタイムモデリング部１１１は、オブジェクトの3D形状を表す形状データを、ボクセルデータから、ポリゴンメッシュと呼ばれるメッシュ形式のデータに変換する。

　ステップＳ１６６において、リアルタイムモデリング部１１１は、オブジェクトの形状データに対応するテクスチャ画像を生成する。

　ステップＳ１６７において、リアルタイムモデリング部１１１は、ストリーム送信部１１２を介して、オブジェクトの形状データとテクスチャ画像を再生デバイス１３に送信する。

　ステップＳ１６８において、再生デバイス１３の再生部１５７は、ストリーム受信部１５６を介して、クラウドサーバ１２から送信されてきた、オブジェクトの形状データとテクスチャ画像を取得する。

　ステップＳ１６９において、再生デバイス１３の制御部１５３は、センサ１５４で検出されたセンサ情報に基づいて、オブジェクトに対する視聴者の視聴位置である仮想視点位置を決定する。決定された仮想視点位置の情報は、再生部１５７に供給される。

　ステップＳ１７０において、再生デバイス１３の再生部１５７は、決定された仮想視点位置に基づき、3Dモデルのオブジェクトの画像を描画するレンダリング処理を行う。すなわち、再生部１５７は、3Dモデルのオブジェクトを仮想視点位置から見たオブジェクト画像を生成して、画像出力部１５８を介してディスプレイ１５９に出力する。

　ステップＳ１７１において、再生デバイス１３の制御部１５３は、3Dモデルのオブジェクトの形状データとテクスチャ画像の受信が終了したかを判定する。

　ステップＳ１７１で、3Dモデルのオブジェクトの形状データとテクスチャ画像の受信がまだ終了していないと判定された場合、処理はステップＳ１６２に進み、上述したステップＳ１６２ないしＳ１７１の処理が繰り返される。

　一方、ステップＳ１７１で、3Dモデルのオブジェクトの形状データとテクスチャ画像の受信が終了したと判定された場合、リアルタイムモデリング再生処理が終了する。

　なお、上述したリアルタイムモデリング再生処理は、クラウドサーバ１２と再生デバイス１３の処理を連続して実行されることとして説明したが、実際には、クラウドサーバ１２と再生デバイス１３の各々で処理が独立に実行されることは言うまでもない。リアルタイムモデリング再生処理は、クラウドサーバ１２が、図１７に示した形状データとテクスチャ画像とからなるフレーム単位の3Dモデルデータを順次生成して送信し、再生デバイス１３が、フレーム単位の3Dモデルデータを順次受信して、再生（描画）、表示する処理となる。

＜１２．オートキャリブレーション処理のフローチャート＞
　再生デバイス１３としてスマートフォンやタブレットを用いる撮影では、従来の専用スタジオで行うように、カメラを強固に固定することを前提とはできず、手振れ等の振動で位置がずれることも想定される。

　そこで、クラウドサーバ１２は、上述したリアルタイムモデリング再生処理中に、撮影デバイス１１のジャイロセンサ４１や加速度センサ４２等のセンサ情報を取得して撮影デバイス１１の位置ずれを判定し、カメラパラメータを更新するオートキャリブレーション処理を実行することができる。

　図２０のフローチャートを参照して、オートキャリブレーション処理について説明する。この処理は、例えば、図１９のリアルタイムモデリング再生処理と同時に実行される。

　初めに、ステップＳ１８１において、撮影デバイス１１は、ジャイロセンサ４１、加速度センサ４２、GPSセンサ４３等の各種のセンサのセンサ情報を取得し、撮影画像とともにフレームデータとしてクラウドサーバ１２に送信する。センサ情報は、例えば、各フレームのヘッダ情報等に格納され、フレーム単位で送信される。

　ステップＳ１８２において、クラウドサーバ１２のストリーム受信部１０４は、各撮影デバイス１１から順次送信されてきた画像ストリームの撮影画像を、通信部１０３を介して受信し、リアルタイムモデリング部１１１に供給する。リアルタイムモデリング部１１１は、撮影画像のフレームデータに格納されているセンサ情報をオートキャリブレーション部１１３へ供給する。

　ステップＳ１８３において、オートキャリブレーション部１１３は、リアルタイムモデリング部１１１からのセンサ情報に基づいて、ボリューメトリック撮影を行っている撮影デバイス１１のなかで、所定値以上動いた撮影デバイス１１があるかを判定する。

　ステップＳ１８３で、所定値以上動いた撮影デバイス１１があると判定された場合、以下のステップＳ１８４ないしＳ１８６の処理が実行され、所定値以上動いた撮影デバイス１１がないと判定された場合、ステップＳ１８４ないしＳ１８６の処理はスキップされる。

　ステップＳ１８４において、オートキャリブレーション部１１３は、各撮影デバイス１１の撮影画像から特徴点を抽出する。

　ステップＳ１８５において、オートキャリブレーション部１１３は、各撮影デバイス１１の撮影画像から抽出された特徴点を用いて、更新対象の撮影デバイス１１のカメラパラメータを算出する。更新対象の撮影デバイス１１は、ステップＳ１８３で所定値以上動いたと判定された撮影デバイス１１である。また、ここで算出されるカメラパラメータは、内部パラメータと外部パラメータのうちの、外部パラメータであり、内部パラメータは変更なしとする。

　ステップＳ１８６において、オートキャリブレーション部１１３は、算出した更新対象の撮影デバイス１１のカメラパラメータを、リアルタイムモデリング部１１１に供給する。リアルタイムモデリング部１１１は、更新された撮影デバイス１１のカメラパラメータを用いて、3Dモデルデータを生成する。

　ステップＳ１８７において、クラウドサーバ１２は、撮影が終了したかを判定する。例えば、クラウドサーバ１２は、各撮影デバイス１１から撮影画像が送信されてきている場合、まだ撮影が終了していないと判定し、各撮影デバイス１１から撮影画像が送信されて来なくなった場合、撮影が終了したと判定する。

　ステップＳ１８７で、撮影がまだ終了していないと判定された場合、処理はステップＳ１８１に戻り、上述したステップＳ１８１ないしＳ１８７の処理が繰り返される。

　一方、ステップＳ１８７で、撮影が終了したと判定された場合、オートキャリブレーション処理が終了する。

　上述したオートキャリブレーション処理では、所定値以上動いたと判定された撮影デバイス１１のみについてカメラパラメータを算出して更新するようにしたが、カメラパラメータを更新する際には、全ての撮影デバイス１１のカメラパラメータを算出するようにしてもよい。また、外部パラメータのみでなく、内部パラメータについても算出してもよい。

　また、更新対象の撮影デバイス１１のカメラパラメータを算出する際、センサ情報から計算したずれ量に基づいて、外部パラメータの取り得る範囲を限定し、外部パラメータを算出するようにしてもよい。外部パラメータの計算は、特徴点の３次元位置と、撮影デバイス１１の内部パラメータおよび外部パラメータとについての非線形最適化計算となるので、外部パラメータの取り得る範囲を限定したり、内部パラメータを固定したりすることにより、計算量を削減し、処理を高速化することができる。

＜１３．キャリブレーションボード画像を用いないカメラキャリブレーション処理＞
　図８乃至図１１を参照して説明したカメラキャリブレーション処理では、キャリブレーションボードを用いる代わりに、キャリブレーションボード画像を撮影デバイス１１に表示して特徴点を抽出することで、カメラパラメータが算出された。

　しかしながら、スマートフォンやタブレットのディスプレイサイズ等を考慮すると、特徴点を十分に検出できない場合も考えられる。

　そこで、キャリブレーションボード画像を撮影デバイス１１に表示する方法以外のカメラキャリブレーション処理（以下、第２のカメラキャリブレーション処理と称する。）について説明する。

　以下で説明する第２のカメラキャリブレーション処理では、画像処理システム１は、任意の被写体を撮影し、その特徴点を抽出することで、カメラパラメータを算出する。例えば、図２１に示されるように、１人の人物とテーブルを被写体として撮影した結果に基づいて、カメラパラメータが算出される。

　また、第２のカメラキャリブレーション処理では、被写体を撮影する複数（５台）の撮影デバイス１１－１ないし１１－５とは別に、カメラキャリブレーション処理全体を制御するコントロールデバイス１５が用意される。コントロールデバイス１５は、再生デバイス１３と同等の構成を有するデバイスであればよく、再生デバイス１３を用いてもよい。

　図２２ないし図２５を参照して、第２のカメラキャリブレーション処理について説明する。図２２は、第２のカメラキャリブレーション処理のうち、コントロールデバイス１５が行うカメラキャリブレーション処理のフローチャートであり、図２４および図２５は、クラウドサーバ１２が行うカメラキャリブレーション処理のフローチャートである。

　初めに、図２２のフローチャートを参照して、コントロールデバイス１５が行うカメラキャリブレーション処理について説明する。

　ステップＳ２０１において、コントロールデバイス１５は、キャリブレーション撮影を開始するためのキャリブレーション撮影開始メッセージをクラウドサーバ１２に送信する。

　コントロールデバイス１５は、キャリブレーション撮影開始メッセージを送信後、クラウドサーバ１２から所定のメッセージが送信されてくるまで待機する。各撮影デバイス１１のカメラパラメータが計算されている間は、クラウドサーバ１２からコントロールデバイス１５へ、カメラパラメータ計算のためのフィードバック情報が送信されてくる。そして、各撮影デバイス１１のカメラパラメータの計算が終了すると、キャリブレーション完了のメッセージが、クラウドサーバ１２からコントロールデバイス１５へ送信されてくる。

　ステップＳ２０２において、コントロールデバイス１５は、クラウドサーバ１２から送信されてきたメッセージを受信する。

　ステップＳ２０３において、コントロールデバイス１５は、キャリブレーションが完了したかを判定する。コントロールデバイス１５は、受信したメッセージがキャリブレーション完了のメッセージである場合には、キャリブレーションが完了したと判定し、受信したメッセージがフィードバック情報である場合には、キャリブレーションがまだ完了していないと判定する。

　ステップＳ２０３で、キャリブレーションがまだ完了していないと判定された場合、処理はステップＳ２０４に進み、コントロールデバイス１５は、フィードバック情報に基づいて、フィードバック画面をディスプレイに表示する。

　クラウドサーバ１２のキャリブレーション部１０５は、各撮影デバイス１１で撮影された撮影画像それぞれについて特徴点を抽出し、抽出された特徴点を、各撮影デバイス１１に対応する複数の撮影画像どうしで対応付ける。すなわち、キャリブレーション部１０５は、抽出された特徴点の各々について、撮影デバイス１１間の対応をとる。そして、キャリブレーション部１０５は、撮影デバイス１１間の対応がとられた複数の特徴点を用いて、各特徴点の３次元位置、内部パラメータ、および、外部パラメータを対象として、誤差を最小とする非線形最適化問題を解くことで、カメラパラメータを算出する。クラウドサーバ１２は、撮影画像から抽出された特徴点が少ない場合や、撮影デバイス１１間の対応付けがされた特徴点が少ない場合に、撮影デバイス１１による撮影をやり直すために、フィードバック情報をコントロールデバイス１５に送信し、ユーザにフィードバックを行う。

　図２３は、クラウドサーバ１２からのフィードバック情報に基づいてコントロールデバイス１５に表示されたフィードバック画面の例を示している。

　図２３のフィードバック画面は、撮影デバイス１１－２と１１－４との間で対応付けられた特徴点の数が少ない場合の例を示している。

　図２３のフィードバック画面には、撮影デバイス１１－２で撮影された撮影画像２０１と、撮影デバイス１１－４で撮影された撮影画像２０２が表示されている。撮影画像２０１および撮影画像２０２のそれぞれには、対応付けがされた特徴点には丸（〇）が重畳表示され、対応付けができなかった特徴点にはバツ（×）が重畳表示されている。

　また、フィードバック画面には、撮影をやり直す際に、キャリブレーションの精度を向上させるためのフィードバックメッセージ２０３が表示されている。図２３の例では、「カメラ２とカメラ４の両方に共通した部分が写るように被写体を調整してください」のフィードバックメッセージ２０３が表示されている。

　さらに、フィードバック画面には、現時点のキャリブレーション結果で被写体の3Dモデルを生成した場合のオブジェクト画像２０４が表示されている。オブジェクト画像２０４は、画面上をスワイプ操作することで、仮想視点位置を変更することができる。

　図２２に戻り、ステップＳ２０３で、キャリブレーションが完了したと判定された場合、処理はステップＳ２０５に進み、コントロールデバイス１５は、キャリブレーション撮影を終了するためのキャリブレーション撮影終了メッセージをクラウドサーバ１２に送信して、カメラキャリブレーション処理を終了する。

　次に、図２４のフローチャートを参照して、クラウドサーバ１２が行うカメラキャリブレーション処理について説明する。

　初めに、ステップＳ２２１において、クラウドサーバ１２は、コントロールデバイス１５から送信されてきたキャリブレーション撮影開始メッセージを受信する。

　ステップＳ２２２において、クラウドサーバ１２は、各撮影デバイス１１に対して、同期撮影を開始させる。各撮影デバイス１１の同期撮影処理は、図１４と同様に行うことができる。

　ステップＳ２２３において、クラウドサーバ１２は、各撮影デバイス１１から送信されてきた撮影画像を取得する。

　ステップＳ２２４において、クラウドサーバ１２は、各撮影デバイス１１から送信されてきた撮影画像を用いてカメラパラメータを算出するカメラパラメータ算出処理を実行する。

　図２５は、ステップＳ２２４のカメラパラメータ算出処理の詳細を示すフローチャートである。

　この処理では、初めに、ステップＳ２４１において、クラウドサーバ１２のキャリブレーション部１０５が、各撮影デバイス１１で撮影された撮影画像それぞれについて特徴点を抽出する。

　次にステップＳ２４２において、キャリブレーション部１０５は、抽出された特徴点が十分であるかを判定する。例えば、１枚の撮影画像において抽出された特徴点の個数が所定値以上である場合に、抽出された特徴点が十分であると判定され、所定値より少ない場合に、抽出された特徴点が十分ではないと判定される。

　ステップＳ２４２で、抽出された特徴点が十分ではないと判定された場合、処理は後述するステップＳ２４７に進む。

　一方、ステップＳ２４２で、抽出された特徴点が十分であると判定された場合、処理はステップＳ２４３に進み、キャリブレーション部１０５は、撮影デバイス１１間で特徴点の対応付けを行い、撮影デバイス１１間で対応する特徴点を検出する。

　次にステップＳ２４４において、キャリブレーション部１０５は、対応する特徴点が十分であるかを判定する。例えば、１枚の撮影画像において対応する特徴点の個数が所定値以上である場合に、対応する特徴点が十分であると判定され、所定値より少ない場合に、対応する特徴点が十分ではないと判定される。

　ステップＳ２４４で、対応する特徴点が十分ではないと判定された場合、処理は後述するステップＳ２４７に進む。

　一方、ステップＳ２４４で、対応する特徴点が十分であると判定された場合、処理はステップＳ２４５に進み、キャリブレーション部１０５は、対応する特徴点の３次元位置を算出するとともに、各撮影デバイス１１のカメラパラメータ、即ち、内部パラメータおよび外部パラメータを算出する。各特徴点の３次元位置と、各撮影デバイス１１のカメラパラメータは、誤差を最小とする非線形最適化問題を解くことで算出される。

　ステップＳ２４６において、キャリブレーション部１０５は、カメラパラメータを算出した際の非線形最適化演算の誤差が所定値以下で十分に小さいかを判定する。

　ステップＳ２４６で、非線形最適化演算の誤差が所定値以下ではないと判定された場合、処理は後述するステップＳ２４７に進む。

　ステップＳ２４７において、キャリブレーション部１０５は、特徴点付きの撮影画像とフィードバックメッセージを含むフィードバック情報を生成する。

　上述したステップＳ２４２で、抽出された特徴点が十分ではないとされた場合、ステップＳ２４７の処理で生成されるフィードバック情報としての図２３のフィードバック画面の撮影画像２０１や２０２には、検出された特徴点が丸（〇）で重畳表示される。一方、上述したステップＳ２４４で、対応する特徴点が十分ではないとされた場合、ステップＳ２４７の処理で生成されるフィードバック情報としての図２３のフィードバック画面の撮影画像２０１や２０２には、対応付けがされた特徴点が丸（〇）で重畳表示され、対応付けができなかった特徴点がバツ（×）で重畳表示される。一方、上述したステップＳ２４６で、誤差が大きいと判定された場合、ステップＳ２４７の処理で生成されるフィードバック情報としての図２３のフィードバック画面には、誤差の大きい撮像デバイス１１の撮影画像が表示される。

　一方、ステップＳ２４６で、非線形最適化演算の誤差が所定値以下で十分に小さいと判定された場合、処理はステップＳ２４８に進み、キャリブレーション部１０５は、キャリブレーション完了のメッセージを生成する。

　ステップＳ２４７またはＳ２４８の処理により、カメラパラメータ算出処理は終了して、処理は、図２４に戻り、ステップＳ２２５に進む。

　図２４のステップＳ２２５において、キャリブレーション部１０５は、キャリブレーションが完了したか、すなわち、キャリブレーション完了のメッセージを生成したかを判定する。

　ステップＳ２２５で、キャリブレーションが完了していない、すなわち、フィードバック情報を生成したと判定された場合、処理はステップＳ２２６に進み、キャリブレーション部１０５は、生成したフィードバック情報を、メッセージとして送信する。ステップＳ２２６の後、処理は、ステップＳ２２４に戻され、ステップＳ２２４以降の処理が繰り返される。

　一方、ステップＳ２２５で、キャリブレーションが完了した、すなわち、キャリブレーション完了のメッセージを生成したと判定された場合、処理はステップＳ２２７に進み、クラウドサーバ１２は、撮影終了のメッセージを各撮影デバイス１１に送信する。各撮影デバイス１１は、撮影終了のメッセージを受信して、同期撮影を終了する。

　ステップＳ２２８において、クラウドサーバ１２は、生成したキャリブレーション完了のメッセージをコントロールデバイス１５に送信して、カメラキャリブレーション処理を終了する。

　以上説明した第２のカメラキャリブレーション処理によれば、キャリブレーションボードや、キャリブレーションボード画像がない場合であっても、カメラのキャリブレーションを行うことができる。

＜１４．コンピュータ構成例＞
　上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているマイクロコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図２６は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）３０１，ROM（Read Only Memory）３０２，RAM（Random Access Memory）３０３は、バス３０４により相互に接続されている。

　バス３０４には、さらに、入出力インタフェース３０５が接続されている。入出力インタフェース３０５には、入力部３０６、出力部３０７、記憶部３０８、通信部３０９、及びドライブ３１０が接続されている。

　入力部３０６は、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部３０７は、ディスプレイ、スピーカ、出力端子などよりなる。記憶部３０８は、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部３０９は、ネットワークインタフェースなどよりなる。ドライブ３１０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体３１１を駆動する。

　以上のように構成されるコンピュータでは、CPU３０１が、例えば、記憶部３０８に記憶されているプログラムを、入出力インタフェース３０５及びバス３０４を介して、RAM３０３にロードして実行することにより、上述した一連の処理が行われる。RAM３０３にはまた、CPU３０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータ（CPU３０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体３１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　本明細書において、フローチャートに記述されたステップは、記載された順序に沿って時系列的に行われる場合はもちろん、必ずしも時系列的に処理されなくとも、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで実行されてもよい。

　本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　また、例えば、本開示の複数の技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、本明細書に記載されたもの以外の効果があってもよい。

　なお、本技術は、以下の構成を取ることができる。
（１）
　撮影に関する自身の情報をサーバ装置に送信し、ボリューメトリック撮影が可能か否かの判定結果に基づいて前記サーバ装置から送信されてくる、ボリューメトリック撮影に関する設定値の候補を取得する制御部を備える
　撮影デバイス。
（２）
　前記制御部は、前記サーバ装置から取得した前記設定値の候補をユーザに提示し、選択させる
　前記（１）に記載の撮影デバイス。
（３）
　前記制御部は、さらに、ボリューメトリック撮影を行う複数の撮影装置で構成されるグループの識別情報と、自身の位置情報を送信し、前記グループへの登録の可否を受信するように制御する
　前記（１）または（２）に記載の撮影デバイス。
（４）
　前記制御部は、前記設定値の候補として、ボリューメトリック撮影を行う全ての撮影装置がサポートするカメラ同期方式を取得する
　前記（１）乃至（３）のいずれかに記載の撮影デバイス。
（５）
　前記カメラ同期方式は、キャリア通信の時刻情報、GPS信号の時刻情報、または、無線通信もしくはキャリア通信のマルチキャスト通信におるタイミング検出、のいずれかに基づく同期信号を生成する方式である
　前記（４）に記載の撮影デバイス。
（６）
　前記制御部は、ボリューメトリック撮影の撮影開始後、所定の時刻にフラッシュまたは音を出力させて、前記フラッシュまたは音を含む画像を生成するように制御し、前記フラッシュまたは音を含む画像を検出することにより各撮影装置で撮影された撮影画像を同期させる
　前記（１）乃至（５）のいずれかに記載の撮影デバイス。
（７）
　前記制御部は、カメラキャリブレーション処理において、他の撮影装置が表示した所定の画像を撮影し、前記所定の画像の特徴点を検出して、前記サーバ装置に送信するように制御する
　前記（１）乃至（６）のいずれかに記載の撮影デバイス。
（８）
　前記制御部は、ボリューメトリック撮影を行う複数の撮影装置が順番に表示した前記所定の画像を撮影するように制御する
　前記（７）に記載の撮影デバイス。
（９）
　前記制御部は、ボリューメトリック撮影を行う複数の撮影装置が同時に表示した前記所定の画像を撮影するように制御する
　前記（７）に記載の撮影デバイス。
（１０）
　同時に表示される前記所定の画像は、前記複数の撮影装置で異なる画像である
　前記（９）に記載の撮影デバイス。
（１１）
　前記制御部は、所定の被写体を撮影した撮影画像とともにセンサ情報をフレーム単位で送信し、
　前記センサ情報は、カメラパラメータを更新するか否かの判定に用いられる
　前記（１）乃至（１０）のいずれかに記載の撮影デバイス。
（１２）
　複数の撮影デバイスから撮影に関する情報を受信し、受信した前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定する制御部を備える
　サーバ装置。
（１３）
　前記制御部は、受信した前記情報に基づいて、前記撮影デバイスのボリューメトリック撮影に関する設定値の候補を生成し、生成した前記設定値の候補に基づいて、ボリューメトリック撮影が可能であるかを判定する
　前記（１２）に記載のサーバ装置。
（１４）
　前記制御部は、各撮影デバイスの撮影対象領域を算出し、前記各撮影デバイスの撮影対象領域を重畳したときに、所定数以上の撮影デバイスに共通する領域が存在するか否かにより、ボリューメトリック撮影が可能であるかを判定する
　前記（１２）乃至（１３）のいずれかに記載のサーバ装置。
（１５）
　前記制御部は、各撮影デバイスの解像度と撮影対象領域とから、３Dモデルのモデリングパラメータを算出し、算出した前記モデリングパラメータが所定の範囲内であるか否かにより、ボリューメトリック撮影が可能であるかを判定する
　前記（１２）乃至（１４）のいずれかに記載のサーバ装置。
（１６）
　前記制御部は、各撮影デバイスの前記情報から、3Dモデリングにかかる処理時間を推定し、推定した3Dモデリング処理時間が所定の時間以内であるか否かにより、ボリューメトリック撮影が可能であるかを判定する
　前記（１２）乃至（１５）のいずれかに記載のサーバ装置。
（１７）
　前記複数の撮影デバイスが撮影した所定の画像を取得して、カメラパラメータを算出するキャリブレーション部をさらに備える
　前記（１２）乃至（１６）のいずれかに記載のサーバ装置。
（１８）
　前記複数の撮影デバイスで撮影された撮影画像から、被写体の３Dモデルのデータを生成し、生成した前記３Dモデルのデータを再生デバイスに送信するモデリング部をさらに備える
　前記（１２）乃至（１７）のいずれかに記載のサーバ装置。
（１９）
　前記被写体を撮影した撮影画像とともにフレーム単位で受信したセンサ情報に基づいて前記撮影デバイスが動いたと判定された場合に、カメラパラメータを更新するキャリブレーション部をさらに備える
　前記（１８）に記載のサーバ装置。
（２０）
　複数の撮影デバイスから撮影に関する情報を受信し、受信した前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定し、
　ボリューメトリック撮影が可能であると判定された前記複数の撮影デバイスによって撮影された撮影画像から、被写体の３Dモデルのデータを生成する
　３Dデータ生成方法。

　１　画像処理システム，　１１　撮影デバイス，　１２　クラウドサーバ，　１３A　スマートフォンまたはタブレット，　１３B　パーソナルコンピュータ，　１３　再生デバイス，　１３C　ヘッドマウントディスプレイ（HMD），　１５　コントロールデバイス，　３３　制御部，　４５　同期信号生成部，　５１　カメラ，　１０１　コントローラ，　１０５　キャリブレーション部，　１０６　モデリングタスク生成部，　１０８　オフラインモデリング部，　１０９　コンテンツ管理部，　１１１　リアルタイムモデリング部，　１１３　オートキャリブレーション部，　１５３　制御部，　１５７　再生部，　３０１　CPU，　３０２　ROM，　３０３　RAM，　３０６　入力部，　３０７　出力部，　３０８　記憶部，　３０９　通信部，　３１０　ドライブ

Claims

　撮影に関する自身の情報をサーバ装置に送信し、ボリューメトリック撮影が可能か否かの判定結果に基づいて前記サーバ装置から送信されてくる、ボリューメトリック撮影に関する設定値の候補を取得する制御部を備える
　撮影デバイス。
　前記制御部は、前記サーバ装置から取得した前記設定値の候補をユーザに提示し、選択させる
　請求項１に記載の撮影デバイス。
　前記制御部は、さらに、ボリューメトリック撮影を行う複数の撮影装置で構成されるグループの識別情報と、自身の位置情報を送信し、前記グループへの登録の可否を受信するように制御する
　請求項１に記載の撮影デバイス。
　前記制御部は、前記設定値の候補として、ボリューメトリック撮影を行う全ての撮影装置がサポートするカメラ同期方式を取得する
　請求項１に記載の撮影デバイス。
　前記カメラ同期方式は、キャリア通信の時刻情報、GPS信号の時刻情報、または、無線通信もしくはキャリア通信のマルチキャスト通信におるタイミング検出、のいずれかに基づく同期信号を生成する方式である
　請求項４に記載の撮影デバイス。
　前記制御部は、ボリューメトリック撮影の撮影開始後、所定の時刻にフラッシュまたは音を出力させて、前記フラッシュまたは音を含む画像を生成するように制御し、前記フラッシュまたは音を含む画像を検出することにより各撮影装置で撮影された撮影画像を同期させる
　請求項１に記載の撮影デバイス。
　前記制御部は、カメラキャリブレーション処理において、他の撮影装置が表示した所定の画像を撮影し、前記所定の画像の特徴点を検出して、前記サーバ装置に送信するように制御する
　請求項１に記載の撮影デバイス。
　前記制御部は、ボリューメトリック撮影を行う複数の撮影装置が順番に表示した前記所定の画像を撮影するように制御する
　請求項７に記載の撮影デバイス。
　前記制御部は、ボリューメトリック撮影を行う複数の撮影装置が同時に表示した前記所定の画像を撮影するように制御する
　請求項７に記載の撮影デバイス。
　同時に表示される前記所定の画像は、前記複数の撮影装置で異なる画像である
　請求項９に記載の撮影デバイス。
　前記制御部は、所定の被写体を撮影した撮影画像とともにセンサ情報をフレーム単位で送信し、
　前記センサ情報は、カメラパラメータを更新するか否かの判定に用いられる
　請求項１に記載の撮影デバイス。
　複数の撮影デバイスから撮影に関する情報を受信し、受信した前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定する制御部を備える
　サーバ装置。
　前記制御部は、受信した前記情報に基づいて、前記撮影デバイスのボリューメトリック撮影に関する設定値の候補を生成し、生成した前記設定値の候補に基づいて、ボリューメトリック撮影が可能であるかを判定する
　請求項１２に記載のサーバ装置。
　前記制御部は、各撮影デバイスの撮影対象領域を算出し、前記各撮影デバイスの撮影対象領域を重畳したときに、所定数以上の撮影デバイスに共通する領域が存在するか否かにより、ボリューメトリック撮影が可能であるかを判定する
　請求項１２に記載のサーバ装置。
　前記制御部は、各撮影デバイスの解像度と撮影対象領域とから、３Dモデルのモデリングパラメータを算出し、算出した前記モデリングパラメータが所定の範囲内であるか否かにより、ボリューメトリック撮影が可能であるかを判定する
　請求項１２に記載のサーバ装置。
　前記制御部は、各撮影デバイスの前記情報から、3Dモデリングにかかる処理時間を推定し、推定した3Dモデリング処理時間が所定の時間以内であるか否かにより、ボリューメトリック撮影が可能であるかを判定する
　請求項１２に記載のサーバ装置。
　前記複数の撮影デバイスが撮影した所定の画像を取得して、カメラパラメータを算出するキャリブレーション部をさらに備える
　請求項１２に記載のサーバ装置。
　前記複数の撮影デバイスで撮影された撮影画像から、被写体の３Dモデルのデータを生成し、生成した前記３Dモデルのデータを再生デバイスに送信するモデリング部をさらに備える
　請求項１２に記載のサーバ装置。
　前記被写体を撮影した撮影画像とともにフレーム単位で受信したセンサ情報に基づいて前記撮影デバイスが動いたと判定された場合に、カメラパラメータを更新するキャリブレーション部をさらに備える
　請求項１８に記載のサーバ装置。
　複数の撮影デバイスから撮影に関する情報を受信し、受信した前記情報に基づいて、前記複数の撮影デバイスが、ボリューメトリック撮影が可能であるかを判定し、
　ボリューメトリック撮影が可能であると判定された前記複数の撮影デバイスによって撮影された撮影画像から、被写体の３Dモデルのデータを生成する
　３Dデータ生成方法。