以下、本発明の実施形態について、図面を参照しながら説明する。なお、以下の実施形態に記載される構成要素は、本発明の実施の形態の一例を示すものであり、本発明をそれらのみに限定するものではない。
本実施形態においては、仮想視点画像を生成するための素材データを含む素材データファイルを生成するファイル生成装置と、素材データファイルに基づいて仮想視点画像を生成する画像生成装置について説明する。仮想視点画像とは、複数の撮像装置による撮像に基づく複数の画像と、指定された任意の視点(仮想視点)とに基づいて、指定された仮想視点からの見えを表す画像である。複数の撮像装置は、例えば図1に示す撮像装置1のように、撮像領域を囲むように配置されうるが、配置及び台数はこの例に限定されない。本実施形態における仮想視点画像は、自由視点画像とも呼ばれるものであるが、ユーザが自由に(任意に)指定した視点に対応する画像に限定されず、例えば複数の候補からユーザが選択した視点に対応する画像なども仮想視点画像に含まれる。また、本実施形態における仮想視点画像は静止画であるが、複数の仮想視点画像を組み合わせることにより、動画を生成することが可能である。例えば、60fps(frame per second)の動画は、1秒間に60枚の仮想視点画像フレームを含む動画である。以下の説明においては、複数の仮想視点画像を組み合わせて生成された動画を構成する仮想視点画像フレームを、単にフレームと呼ぶ。
また、本実施形態においては、仮想視点画像を生成するためのデータを、素材データと呼ぶ。素材データは、複数の撮像装置が撮像領域を撮像することにより得られる複数の撮像画像、及び、複数の撮像画像に基づいて生成されるデータを含む。複数の撮像画像に基づいて生成されるデータは、例えば、シルエット画像、3次元モデルデータ、及び、テクスチャデータ等である。ここで、シルエット画像が、撮像画像における被写体に対応する領域を表す画像である。また、3次元モデルデータは、3次元空間における被写体の3次元形状を表すデータである。また、テクスチャデータは、3次元モデルデータに色付けをするためのデータである。
また、素材データは、仮想視点画像を生成するためのデータとして、撮像パラメータを含む。撮像パラメータは、撮像装置の設置位置、撮像方向(姿勢)及び画角を示すパラメータを含む。なお、撮像パラメータは、少なくとも撮像装置の設置位置及び撮像方向を示すパラメータが含まれていればよく、上記以外のパラメータがさらに含まれていてもよい。
なお、素材データは仮想視点画像を生成するためのデータであれば、含むデータの種類は限定されない。例えば、上記以外のデータを含んでいてもよいし、上記のうち必要な任意の種類のデータのみを含んでいてもよい。また、上記では3次元モデルデータを生成することにより仮想視点画像を生成する手法を用いる場合の素材データの例について記載した。しかしながら、3次元モデルデータを用いないイメージベースドレンダリングの手法を用いて仮想視点画像を生成する場合、仮想視点画像の生成に必要なデータは上記の素材データの例と異なる場合がある。このように、仮想視点画像の生成手法に応じて素材データが異なっていてもよい。素材データの生成方法の詳細については後述する。
本実施形態におけるファイル生成装置は、画像生成装置において所定の基準以上の品質を有する仮想視点画像が生成されるようにするための情報を含む素材データファイルを生成し、画像生成装置に出力する。なお、本実施形態における仮想視点画像の品質は、後述する画像処理システムにおいて定義づけられる品質であり、素材データの精度に依存する指標であるものとする。また、素材データの精度は、複数の撮像装置の設置位置及び撮像方向等の条件によって異なる場合がある。したがって、本実施形態におけるファイル生成装置は、複数の撮像装置の設置位置及び撮像方向に基づいて、所定の基準以上の品質を有する仮想視点画像が生成されるようにするための情報を決定する。
図2は、本実施形態における画像処理システムが有するファイル生成装置および画像生成装置のハードウェア構成を説明するための図である。図2における画像処理システム100は、ファイル生成装置110と画像生成装置120とを有する。ファイル生成装置110は、CPU(中央演算装置)111、ROM(リードオンリーメモリ)112、RAM(ランダムアクセスメモリ)113、補助記憶装置114、表示部115、操作部116、通信I/F117、およびバス118を有する。
CPU111は、ROM112やRAM113に格納されているコンピュータプログラムおよびデータを用いて、ファイル生成装置110の全体を制御する。なお、ファイル生成装置110がCPU111とは異なる一または複数の専用のハードウェアを有し、CPU111による処理の少なくとも一部を専用のハードウェアが実行してもよい。専用のハードウェアの例としては、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートウェイ)、およびDSP(デジタルシグナルプロセッサ)等がある。ROM112は、変更を必要としないプログラム等を格納する。RAM113は、補助記憶装置114から供給されるプログラムおよびデータ、および通信I/F117を介して外部から供給されるデータ等を一時記憶する。補助記憶装置114は、例えばHard Disk Drive(HDD)やSolid State Drive(SSD)、フラッシュメモリなどで構成され、画像データおよび音声データ等の様々なデータを記憶する。なお、補助記憶装置114は、単一のデバイスでなくてもよく、例えば、複数個又は複数種類の物理デバイスにより構成されていてもよい。
表示部115は、例えば液晶ディスプレイ、あるいはLED等で構成され、ユーザがファイル生成装置110を操作するためのGUI(グラフィカルユーザインターフェース)等を表示する。操作部116は、例えばキーボード、マウス、ジョイスティック、およびタッチパネル等で構成され、ユーザによる操作を受けて各種の指示をCPU111に入力する。CPU111は、表示部115を制御する表示制御部、および操作部116を制御する操作制御部として動作する。通信I/F117は、撮像システム101や画像生成装置等の、ファイル生成装置110の外部の装置との通信に用いられる。例えば、ファイル生成装置110が外部の装置と有線で接続される場合には、通信用のケーブルが通信I/F117に接続される。ファイル生成装置110が外部の装置と無線通信する機能を有する場合には、通信I/F117はアンテナを備える。バス118は、ファイル生成装置110の各部をつないで情報を伝達する。
本実施形態では、表示部115と操作部116がファイル生成装置110の内部に存在するものとするが、表示部115と操作部116との少なくとも一方がファイル生成装置110の外部に別の装置として存在していてもよい。
以上が、ファイル生成装置110のハードウェア構成についての説明である。画像生成装置120におけるCPU121、ROM122、RAM123、補助記憶装置124、表示部125、操作部126、通信I/F127およびバス128についても、それぞれファイル生成装置110のCPU111〜バス118と同様の機能を有する。
図3は、本実施形態におけるファイル生成装置の機能構成を説明するための図である。図3におけるファイル生成装置110は、素材データ取得部102、領域特定部103、ファイル生成部104、及び、保存部105を有する。以下、各処理部について説明する。
素材データ取得部102は、撮像システム101から素材データを取得する。ここで、撮像システム101は、図1に示すような複数の撮像装置を有するシステムである。本実施形態における素材データ取得部102は、素材データとして、複数の撮像画像、及び、撮像パラメータを取得する。取得された素材データは、保存部105に保存される。保存部105は、図2における補助記憶装置114に対応する処理部である。なお、保存部105は、例えば、ネットワーク上に仮想化されたクラウド上のデバイスであってもよい。
領域特定部103は、素材データ取得部102が取得した撮像パラメータに基づいて、所定の基準以上の品質を有する仮想視点画像が生成される領域(以下、品質領域という)を特定する。以下、領域特定部103が品質領域を特定する方法の一例について説明する。領域特定部103は、撮像領域における3次元空間に対し、互いに直交するX軸、Y軸、Z軸の3軸を世界座標軸として定義する。なお、このときの原点は撮像領域における任意の位置に指定することが可能である。領域特定部103は、上記の世界座標軸によって定義された世界座標の全座標について、撮像パラメータを用いて射影変換を行い、撮像座標を算出する。撮像座標は、撮像装置から取得される撮像画像上における2次元座標である。撮像座標は、撮像座標を構成する画素に対応する。本実施形態における撮像座標は、撮像画像を構成する画素のうち撮像画像の頂点に対応する4つの画素のいずれかを原点とし、互いに直交するX軸及びY軸の2軸で表される座標系における座標である。このとき、X軸及びY軸は、それぞれ原点から撮像画像の幅方向及び高さ方向に沿って定義される。撮像座標は、複数の撮像装置それぞれの撮像パラメータを用いて、撮像装置ごとに算出される。なお、射影変換に使用される撮像パラメータは、定義された世界座標軸に合わせてあらかじめ公知のキャリブレーション手法等により算出されているものとする。
ここで、世界座標を射影変換することにより算出された撮像座標のうち少なくともいずれかの座標値が負の値又は撮像解像度に基づく撮像座標の値の範囲を超えた値である場合、変換前の世界座標に対応する位置は、撮像装置の画角外であると判定される。撮像解像度とは、撮像装置が撮像を行う際の解像度であり、例えば、FHD(Full High Definition)の場合における1920×1080の値である。このとき、世界座標を射影変換して得られる撮像座標の値を(Xc、Yc)であるとすると、撮像装置の画角に含まれる世界座標を射影変換して算出される撮像座標がとりうる座標値は(Xc、Yc)=(0,0)〜(1919,1079)となる。算出された撮像座標(Xc、Yc)のうち、例えばXcの値がXc=2035であった場合、座標値が撮像解像度に基づく撮像座標の値の範囲を超えているため、変換前の世界座標に対応する位置は撮像装置の画角外であると判定される。
領域特定部103は、複数の撮像装置それぞれの撮像パラメータを使用し、世界座標に対応する位置が各撮像装置の画角に含まれるか否かを判定する。また、領域特定部103は、所定の数以上の撮像装置の画角に含まれる位置に対応する世界座標の集合を、品質領域として特定する。
品質領域と仮想視点画像の品質との関係について説明する。例えば、素材データの一つである3次元モデルデータは、複数の撮像画像に基づいて公知技術である視体積交差法(shape−from−silhouette法)を用いて生成される。視体積交差法を用いた3次元モデルデータの生成においては、アルゴリズムの関係上、被写体をより多くの方向から撮像することにより得られた撮像画像に基づいて3次元モデルデータを生成することで、生成される3次元モデルデータの精度が高くなる。ここで、本実施形態における複数の撮像装置は、図1に示すようにそれぞれ異なる方向から撮像領域を撮像する構成となっている。したがって、より多くの撮像装置から撮像される領域における被写体は、より多くの方向から撮像されていることになる。したがって、より多くの撮像装置により撮像された領域ほど、その領域に含まれる被写体の3次元モデルデータの精度がより高くなる。
また、例えば、素材データの一つであるテクスチャデータは、撮像画像に含まれる被写体の色情報(撮像画像の画素値)に基づいて生成される。このとき、被写体がより多くの方向から撮像されることにより、より多くの色情報が取得されるため、仮想視点から見たときの色を精度良く再現することが可能になる。また、被写体がより多くの方向から撮像されることにより、被写体に対して仮想視点の視点位置がいずれの位置に指定されても、仮想視点の視点位置から被写体を見たときの色が精度良く再現される。したがって、3次元モデルデータと同様に、より多くの撮像装置により撮像された領域ほど、その領域に含まれる被写体の色を表すテクスチャデータの精度がより高くなる。
このように、より多くの撮像装置により被写体が撮像されるほど、精度の高い素材データが生成される。また、素材データの精度が高いほど、素材データに基づいて生成される仮想視点画像の品質は高くなる。したがって、所定の基準以上の精度の素材データが生成されるために必要な台数の撮像装置により撮像される領域を品質領域として特定することにより、品質領域を視野に含む仮想視点に対応する仮想視点画像は一定以上の品質を有することが期待できる。本実施形態においては、仮想視点から見たときの範囲を表す指標として、仮想視点の視野という表現を用いる。仮想視点の視野は、撮像装置の画角と同様の指標であるものとする。
品質領域を特定するための所定の数は、所定の基準以上の精度の素材データが生成されるために必要な撮像装置の数であるとする。また、品質領域の外の領域については、品質領域内と比較して相対的に仮想視点画像の品質が低いことが想定される。このように、品質領域は、仮想視点画像の品質に係る情報であって、撮像領域において品質の高い仮想視点画像が生成される領域を示す。
品質領域を特定する際に使用される所定の数は、例えば、撮像システム101の規模に応じて異なる数が設定されてもよい。例えば、撮像システム101が有する撮像装置が100台である場合、所定の数として、撮像装置全体の台数の8割である80が設定される。また例えば、撮像システム101が有する撮像装置が10台である場合、所定の数として、撮像装置全体の台数である10が設定される。なお、上記の所定の数は一例であり、上記以外の値が設定されてもよい。また、第1の所定の数として80が設定され、第2の所定の数として60が設定されるというように、複数の所定の数が設定されてもよい。これにより、領域特定部103は、異なる品質の仮想視点画像が生成される領域を、より細かい品質の段階ごとに特定することが可能になる。また、本実施形態における領域特定部103は、所定の数以上の撮像装置により撮像される領域を特定するが、これに限定されない。領域特定部103は、所定の数未満の撮像装置により撮像される領域を特定してもよい。これにより、品質の低い仮想視点画像が生成される領域が特定されるため、品質の高い仮想視点画像が生成される領域も識別可能になる。
また、本実施形態においては、所定の基準以上の品質を有する仮想視点画像が生成される領域として、所定の数以上の撮像装置により撮像される撮像領域を特定する構成について説明したが、これに限定されない。例えば、領域が撮像される方向に基づいて、所定の基準以上の品質を有する仮想視点画像が生成される領域が特定される構成であってもよい。例えば、所定の数以上の撮像装置により撮像される領域であっても、その領域を撮像する撮像装置の撮像方向に偏りがある場合、その領域における被写体が特定の方向から撮像されない状況が起こりうる。これにより、視体積交差法によって生成される3次元モデルデータの形状の精度が低下したり、特定の方向に対応する被写体の色を精度よく再現できない場合がある。したがって、領域特定部103は、所定の数以上の撮像装置により撮像され、且つ各撮像装置の撮像方向が所定の条件を満たすような領域を品質領域として特定する。所定の条件としては、例えば、隣り合う撮像装置のそれぞれの撮像方向どうしがなす角が所定の閾値未満であること等が設定される。この条件が、隣り合う撮像装置のすべての組み合わせについて満たされる場合、領域が撮像される方向に偏りがないことを示す。上記の構成によれば、より精度の高い素材データが生成される領域を特定することが可能となる。なお、領域特定部103は、領域を撮像する撮像装置の台数によらずに、領域を撮像する各撮像装置の撮像方向が所定の条件を満たすか否かに基づいて、品質領域を特定する構成であってもよい。
上述したように、領域特定部103は、複数の撮像装置の設置位置及び撮像方向を示す撮像パラメータに基づいて、品質領域を特定する。ファイル生成部104は、保存部105に保存された素材データと、領域特定部103において特定された品質領域を示す情報とを含む素材データファイルを生成する。以下、図4を用いて素材データファイルの構成の例について説明する。
図4(a)は、素材データ201にメタデータ202が付与された素材データファイルの構成の一例である。メタデータ202には、品質領域を示す品質情報203が含まれる。品質情報203はN個の座標データから構成され、各座標データは世界座標のX,Y,Zの座標値を持つ。品質情報203に含まれる座標データは、上述した品質領域を表す世界座標である。例えば、数値Nが8の場合、8個の世界座標のそれぞれを頂点とする六面体により、品質領域が表現される。図4(b)は、素材データに付与されるメタデータの構成の別の例である。メタデータ302に含まれる品質情報303は、世界座標上における特定の座標と、X軸、Y軸、Z軸のそれぞれに平行な3つの線分の長さa、b、cが含まれる。品質情報303は、所定の立体図形に近似された品質領域を示す。
所定の立体図形の例を図5に示す。図5(a)、(b)及び(c)は、それぞれ直方体、円柱及び半球に近似された品質領域402、502及び602を示す。それぞれの品質領域は、特定の座標401、501及び601において直交する3つの線分により表される。各線分はそれぞれX軸、Y軸、Z軸と平行であり、線分の長さはそれぞれa、b、cである。なお、円柱及び半球の底面は楕円となる場合もある。品質領域を所定の立体図形に近似する方法の一例を説明する。領域特定部103は、例えば、品質領域に含まれる複数の座標について、X及びYの値を最小二乗法を用いて形状の底面の形状に近似することにより、X軸長a及びY軸長bを算出する。また、領域特定部103は、品質領域に含まれる複数の座標のうち最大のZの値に基づいてZ軸長cを算出する。なお、ここでは最小二乗法としたが、近似計算の手法については限定しない。また、図4(b)の例においては、品質領域を近似する立体図形としてあらかじめいずれかの図形が定まっている場合について説明したが、例えば図4に示す図形のうち任意の図形に近似させることが可能な構成であってもよい。この場合、品質情報303には、所定の立体図形を指定するための図形情報がさらに含まれる。図形情報としては、例えば直方体の場合は「0」、円柱の場合は「1」、半球の場合は「2」というようにあらかじめ割り振られた符号が用いられてもよい。図形情報は上記に限定されず、立体図形の種類を特定可能な情報であればよい。また、所定の立体図形についても図4に示す図形以外の形状が用いられてもよい。
図4(c)は、素材データに付与されるメタデータの構成の別の例である。図4(c)におけるメタデータ402は、品質情報701として、保存部105又は外部に接続された記憶装置等において品質領域を示す情報が格納されている場所を示すポインタ情報を含む。品質領域を示す情報は品質領域テーブル702として保存部104に格納される。品質領域テーブル702には1つ以上の品質領域を示す情報が格納される。品質領域テーブル702に含まれる情報は、それぞれ、異なる撮像システムによって特定された品質領域、又は、撮像システムは同様の構成であるが品質領域の特定時に使用された所定の数が異なる品質領域である。また、品質領域テーブル702に格納される情報は、例えば品質情報203又は品質情報303のフォーマットと同様である。品質情報701には、素材データ401に対応する品質領域に関する情報が格納されている場所を示すポインタ情報が含まれる。図4に示す例においては、素材データ401に対応する品質領域は領域Cであるため、品質情報701には領域Cを示すポインタ情報が含まれる。
以上、素材データファイルの構成の一例として、素材データに品質情報をメタデータとして付与する構成について説明した。なお、素材データファイルは、メタデータとして、品質情報以外の情報をさらに含んでいてもよい。例えば、撮像されたイベントに関する情報として、イベントの種類(例えばスポーツやコンサート等)、イベントの名称(例えば大会名等)、及びイベントの詳細(例えば開催日、出場チーム名及びアーティスト名等)等の情報がメタデータとして付与されてもよい。また、素材データを生成する際に行われた処理の内容を示す情報、処理中に発生したエラー等を示す情報、素材データそのものの品質を示す情報等がメタデータとして付与されてもよい。また、仮想視点画像に付加する情報として、仮想的な広告を表す画像データ、選手のプロフィール等の情報、又はそれらの情報が記憶された場所を示すアドレス情報等がメタデータとして付与されてもよい。このように、素材データファイルには種々の情報が含まれ得る。素材データファイルに含まれる情報は一例であり、上記以外の情報が含まれていてもよいし、上記のうち任意の情報のみが含まれていてもよい。
次に、素材データファイルのメタデータに品質情報を付与する方法の例について説明する。後述する画像生成装置において複数の仮想視点画像を組み合わせた動画が生成される場合は、動画を構成する各フレームを生成するための素材データについて、所定の素材データのまとまりごとに品質情報が関連付けられる。このような構成とすることにより、動画を生成する際の素材データの扱いが容易になる効果がある。詳細については、図面を参照しながら説明する。
図6は、所定の素材データのまとまりとして、フレームを生成するための素材データのまとまりごとにメタデータが付与された素材データファイルの一例を示す図である。素材データ802は、特定の時刻Tに行われた撮像により得られた複数の撮像画像に基づく素材データである。特定の時刻Tは、例えば撮像が60fpsで行われる場合、撮像タイミング803に示す時刻T=0、T=1、T=2、T=3...のような1/60秒間隔の時刻となる。すなわち、素材データ802に基づいて、特定の時刻Tに対応するフレームが生成される。メタデータ801には、特定の時刻Tを示す時刻情報804及び品質情報805が含まれる。品質情報805は、図4における品質情報203、303又は701と同様の構成であるとする。時刻情報804のフォーマットとしては、例えばSMPTE(Society of Motion Picture and Television Engineers)等が使用される。ただし時刻情報804のフォーマットはこれに限定されず、MPTE以外のフォーマットが使用されてもよい。図6のようにフレームごとにまとめられた素材データに品質情報を付与することで、任意のフレームのみ、又は任意のフレームから始まる連続したフレームを用いて動画を生成する際に、フレーム単位で品質を把握することが容易になる。
図7は、所定の素材データのまとまりとして、複数のフレームのまとまりごとにメタデータが付与された素材データファイルの例を示す図である。図7の例では、撮像システム101が撮像を行う時間範囲において、各撮像装置の設置位置及び撮像方向が変化しない時間範囲に行われた撮像により得られた複数の撮像画像に基づく素材データのまとまりごとにメタデータが付与される。なお、本実施形態においては設置位置及び撮像方向の少なくともいずれかが変化する場合について説明するが、撮像装置の画角など、上記以外の条件が変更された場合についても同様に適用可能である。
図7の例では、時刻T=N及びT=Mにおいて撮像装置の設置位置及び撮像方向の少なくともいずれかが変化している。このとき、ファイル生成部104は、複数の撮像装置の設置位置及び撮像方向が変化しない時間範囲であるT=0〜N−1に行われた撮像により得られた複数の撮像画像に基づく素材データのまとまり901に対して、メタデータを付与する。なお、T=N〜M−1及びT=M以降の時刻に対応する素材データについても、同様にメタデータが付与される。なお、N及びMはそれぞれ3以上の整数であり、M>(N+2)であるものとする。すなわち、複数の撮像装置の設置位置及び撮像方向が変化しない時間範囲において二以上の撮像が行われるものとする。まとまり901に含まれる複数の素材データ900及びメタデータ902は、T=0〜N−1における各時刻に行われた撮像により得られた撮像画像に基づく素材データ及び素材データに付与されたメタデータである。素材データ900及びメタデータ902の構成は、それぞれ図6に示す素材データ802及びメタデータ801と同様である。
また、まとまり901に付与されるメタデータ903は、品質情報904を含む。品質情報904は、図4における品質情報203、303又は701と同様の構成であるとする。本実施形態においては、撮像装置の設置位置及び撮像方向が変化しない場合、品質領域も変化しない。したがって、まとまり901に対して一つの品質情報を付与されることにより、同一の品質領域ごとに素材データを扱うことが容易になる。また、これにより、まとまり901に含まれる素材データ900に付与されたメタデータ902に含まれる品質情報については、省略することが可能になる。品質情報が省略されることにより、素材データファイルのデータ量が削減される等の効果が得られる。ただし、メタデータ902に含まれる品質情報は必ずしも省略されなくてもよい。
図8は、所定の素材データのまとまりとして、複数のフレームのまとまりごとにメタデータが付与された素材データファイルの別の例を示す図である。図8の例では、撮像システム101が撮像を行う時間範囲において、所定の長さの時間範囲に行われた撮像により得られた複数の撮像画像に基づく素材データのまとまりごとにメタデータが付与される。ファイル生成部104は、所定の長さNの時間範囲であるT=0〜N−1に行われた撮像により得られた複数の撮像画像に基づく素材データのまとまり1001に対してメタデータを付与する。なお、T=N〜2N−1及びT=2N以降の時刻に対応する素材データについても、同様にメタデータが付与される。なお、Nは3以上の整数であるものとする。すなわち、所定の長さの時間範囲において二以上の撮像が行われるものとする。まとまり1001に含まれる複数の素材データ1000及びメタデータ1002は、T=0〜N−1における各時刻に行われた撮像により得られた撮像画像に基づく素材データ及び素材データに付与されたメタデータである。素材データ1000及びメタデータ1002の構成は、それぞれ図6に示す素材データ802及びメタデータ801と同様である。
メタデータ1003は、時刻情報及び品質情報を含む。なお、図8の例は、所定の長さNの時間範囲T=0〜N−1において、途中で撮像装置の設置位置及び撮像方向の少なくともいずれかが変化した場合を示している。このとき、撮像装置の設置位置及び撮像方向の少なくともいずれかが変化した時刻において、品質領域も変化する。したがって、時刻情報及び品質情報は、品質領域が変化しない時間範囲ごとに付与される。例えば、T=Mにおいて品質領域が変化した場合、時刻情報1005はT=0〜M−1を示す情報であり、品質情報1006は、T=0〜M−1における品質領域を示す。また、時刻情報1007はT=M〜N−1を示す情報であり、品質情報1006は、T=M〜N−1における品質領域を示す。
図8のような構成とすることにより、後述する画像生成装置において、所定の長さごとに動画を生成したり素材データを扱う際の処理が容易になる効果がある。なお、所定の長さの時間範囲ではなく、所定のシーンごと(例えば、サッカーにおけるゴールシーン等)にまとめられた素材データに対しメタデータが付与される構成であってもよい。
次に、素材データファイルのファイルフォーマットの一例について説明する。なお本実施形態においては、素材データファイルのファイルフォーマットとして、ISO/IEC 14496−12(MPEG−4 Part12) ISO base media file format(以下、ISO BMFFという)規格に基づいた例について説明する。また、以下では、素材データファイルに基づいて生成される仮想視点画像を動画として再生するためのデータを、メディアデータと呼ぶ。
図9は、本実施形態におけるISO BMFFの構成の一例を説明するための図である。図9(a)に示すISO BMFFファイル1200は、ftyp(File Type Compatibility Box)1201、moov(Movie Box)1202、meta(metadata)1203、mdat(Media Data Box)1204のボックスから構成される。ボックスftyp1201には、ファイルフォーマットの情報、ボックスのバージョン、および、映像ファイルを作成したメーカの名称等が記載される。ボックスmoov1202には、メディアデータを管理するために必要な情報である、動画の再生時間、データサイズ、およびアドレス等が含まれる。ボックスmeta1203には、品質領域を示す情報(品質情報)が含まれる。ボックスmdat1204には、実際に動画として再生されるメディアデータが含まれる。
図10(a)は、ボックスmeta1203の構成の一例を示す図である。FreeViewPointImage_generate_area_infoは、品質領域に関する情報(品質情報)が格納されるボックスである。
FreeViewPointImage_generate_area_infoボックスに関する情報は、以下のとおりである。
Box Type:‘fvga‘
Container:Meta box(‘meta‘)
Mandatory:No
Quantity:Zero or one
また、FreeViewPointImage_generate_area_infoボックスのシンタックスの例を図10(b)及び(c)に示す。offset_size、length_size、base_offset_size、index_size、及び、reservedはISO BMFFの規格書に記載される、ボックスの大きさ等に関係する符号である。
図10(b)におけるmax_num_coordinate_minus1は品質領域を表す座標の数を示す符号であり、図4(a)における品質情報203の数値Nに相当する。coordinate_x、coordinate_y、及びcoordinate_zはそれぞれX座標の値、Y座標の値、及びZ座標の値を示した符号であり、図4(a)における品質情報203の各座標値に対応する。
また、図10(c)におけるarea_shape_codeは映像生成領域の形状を表す符号である。例えば、その値が0の場合は直方体、1の場合は円柱、及び2の場合は半球を表すというように、図形に対して所定の符号が割り当てられる。なお、割り当てられる符号及び表現される図形の種類は上記に限定されない。original_coordinate_x、original_coordinate_y、及び、original_coordinate_zはarea_shape_codeで規定された立体図形を表すための特定の座標の値である。この座標値は、図5における座標401、501、及び601の座標値に対応する。x_axis_direction_length、y_axis_direction_length、及び、z_axis_direction_lengthは、特定の座標において直交する3つの線分のそれぞれの長さを表す。この値は、図5におけるa,b及びcの値に対応する。
なお、図9(a)に示すISO BMFFファイル1200においては、品質情報をmeta1203に格納したが、この例に限らない。例えば、仮想視点画像に係る情報を格納するための新たなボックスが設けられてもよい。図9(b)に示すように、ISO BMFFファイル1200に、例えば仮想視点画像に係る情報を格納する専用のボックスとして、fvvi(Free viewpoint Video Info)1205が新たに設けられてもよい。fvvi1205には、品質情報の他、仮想視点画像に係る種々の情報を格納することが可能である。また、meta1203およびfvvi205は、動画(シーケンス)全体、動画に含まれる複数フレームから構成される映像クリップごと、および、フレームごとに設けることができる。例えば、図9(c)に示すように、ボックスmoov1202の中にボックスmeta1206が設けられてもよい。また例えば、ボックスmoov1202の中にある不図示のボックスmoof(Movie Fragment Box)の中に、ボックスmeta1206が設けられてもよい。あるいは、図9(d)に示すように、ボックスfvvi1205が複数のボックスfvvi807に分かれて設けられてもよい。
ファイル生成部104は、上述したような構成の素材データファイルを生成することにより、ユーザが素材データファイルを利用して仮想視点画像を生成したり、素材データを保管して管理したりする際の利便性が向上する。すなわち、品質情報が素材データと適切に紐づけられているため、品質情報を参照して仮想視点画像の生成を行うことが容易になる。また、素材データと品質情報とが同一のファイルに格納されているため、ユーザによる素材データの管理が容易になる。さらに、所定のファイルフォーマットに従い素材データファイルを生成することにより、後述する画像生成装置120においても共通のファイルフォーマットに従って仮想視点画像を生成することができるようになる。すなわち、共通のファイルフォーマットに準拠する他の装置にも素材データが適用可能になるという効果がある。また、素材データの一部を扱う、あるいはまとめて扱う等の場合に、扱いが容易になるという効果がある。なお、本実施形態においては、ISO BMFF規格に基づいた例について説明したが、フォーマットはこれに限定されない。ファイルフォーマットは、他の標準規格でもよいし、独自のフォーマットでもよい。
ファイル生成部104は、生成した素材データファイルを保存部105に保存する。保存された素材データファイルは、後述する画像生成装置120が仮想視点画像を生成する際に使用される。なお、ファイル生成部104から直接画像生成装置120に素材データファイルが送信される構成であってもよい。
図11は、ファイル生成装置110が行う処理を説明するためのフローチャートである。CPU111がROM112または補助記憶装置114に記憶されたプログラムを読み出して実行することにより、以下の処理が行われる。以降の説明においては、処理ステップを単にSと表記する。撮像システム101から送信された素材データを取得すると、処理が開始される。
S1101において、素材データ取得部102は、素材データとして、複数の撮像画像、及び、撮像パラメータを取得する。S1102において、領域特定部103は、素材データ取得部102が取得した撮像パラメータに基づいて、品質領域を特定する。領域特定部103は、撮像領域における世界座標を、複数の撮像装置それぞれの撮像パラメータを用いて射影変換を行うことにより、各撮像装置に対応する撮像座標を算出する。また、領域特定部103は、算出された撮像座標に基づき、変換前の世界座標が撮像装置の画角に含まれるか否かを判定する。上記の処理を行うことにより、領域特定部103は、所定の数以上の撮像装置の画角に含まれる世界座標の集合を、品質領域として特定する。
S1103において、ファイル生成部104は、保存部105に保存された素材データと、領域特定部103において特定された品質領域を示す情報とを含む素材データファイルを生成する。ファイル生成部104は、例えば、素材データに対し、品質領域を示す品質情報をメタデータとして付与する。付与される品質情報は、例えば、図4(a)に示すような、3次元座標により表される領域、及び図(b)に示すような、撮像領域における特定の座標及びその座標において互いに直交する3つの線分のそれぞれの長さを示す情報により表される領域等である。また、図4(c)に示すように、品質領域を示す情報が格納された場所を示すポインタ情報が付与されてもよい。また、ファイル生成部104は、素材データの所定のまとまりごとに品質情報を付与した素材データファイルを生成する。所定のまとまりは、例えば、特定の時刻、複数の撮像装置の設置位置及び撮像方向が変化しない時間範囲、又は、所定の長さの時間範囲のいずれかに行われた撮像により得られた撮像画像に基づく素材データのまとまりである。また、ファイル生成部104は、例えばISO BMFF規格に基づく素材データファイルを生成する。S1104において、ファイル生成部104は、生成した素材データファイルを保存部105に保存する。以上で処理が終了する。
以上説明したファイル生成装置110は、素材データと、仮想視点画像の品質に関する情報とを関連付けて出力する。これにより、生成される仮想視点画像の品質を容易に参照することができるようになる。
次に、素材データに基づいて仮想視点画像を生成する画像生成装置120について説明する。画像生成装置130のハードウェア構成は、図2に示すように、ファイル生成装置110と同様の構成である。図12は、画像生成装置120の機能構成を説明するための図である。画像生成装置120は、ファイル取得部1301、領域抽出部1302、素材データ抽出部1303、制御部1304、表示部1305、画像生成部1306、及び、入力部1307を有する。以下、各処理部について説明する。
ファイル取得部1301は、ファイル生成装置110に保存されている素材データファイルを取得する。領域抽出部1302は、ファイル取得部1301が取得した素材データファイルに含まれる品質領域を示す情報(品質情報)を抽出する。素材データ抽出部1303は、ファイル取得部1301が取得した素材データファイルに含まれる素材データを抽出する。なお、本実施形態においては、素材データファイルに含まれる素材データは、ファイル生成装置110において素材データ取得部102が取得した複数の撮像画像及び撮像パラメータであるものとして説明を行う。制御部1304は、領域抽出部1302が抽出した品質情報に基づいて、生成される仮想視点画像の品質をユーザに識別可能にさせる制御を行う。制御内容の詳細については後述する。画像生成部1306は、素材データ抽出部1306が抽出した素材データに基づいて仮想視点画像を生成する。
画像生成部1306の詳細について、図13を用いて説明する。画像生成部1306は、仮想視点画像の生成処理の各工程に対応する分離部1311、シルエット生成部1312、テクスチャ生成部1313、3次元モデル生成部1314、及び、画像生成処理部1315を有する。分離部1311は、素材データ抽出部1303において抽出された素材データに含まれる複数の撮像画像における被写体の領域(以下、被写体領域という)を抽出する。本実施形態においては、撮像領域において動きのあるオブジェクト(例えば、選手やボールなど)を被写体という。
分離部1311は、複数の撮像装置により連続する時間において撮像された複数の撮像画像同士を比較することにより、画素値に変化のない領域を検出する。分離部1311は、検出した領域を背景領域であると判定し、背景領域に基づいて背景画像を生成する。また、分離部1311は、生成した背景画像と撮像画像とを比較し、画像値の差が所定の閾値以上である領域を被写体領域であると判定し、被写体領域を抽出する。なお、被写体領域を抽出する方法は上記に限定されない。分離部1311は、例えば、連続する時間において撮像された複数の撮像画像同士を比較し、画素値の変化量が所定の閾値以上である領域を被写体領域として抽出してもよい。
シルエット生成部1312は、分離部1311が抽出した被写体領域に基づいて、撮像画像における被写体の領域を示すシルエット画像を生成する。シルエット生成部1312は、撮像画像において被写体領域に対応する画素の値を「1」、及び被写体領域以外の領域に対応する画素の値を「0」とすることにより、シルエット画像を生成する。なお、画素値は一例であり、他の値が使用されてもよい。テクスチャ生成部1313は、分離部1311が抽出した被写体領域に基づいて、被写体の形状を表す3次元モデルデータに色付けをするためのテクスチャデータを生成する。テクスチャデータは、撮像画像における被写体領域に対応する画素の値に基づいて生成される。
3次元モデル生成部1314は、シルエット生成部1312において生成されたシルエット画像に基づいて、被写体の形状を表す3次元モデルデータを生成する。本実施形態における3次元モデルデータは、視体積交差法を用いて生成されるものとする。画像生成処理部1315は、3次元モデル生成部1314において生成された3次元モデルデータに対し、テクスチャ生成部1313において生成されたテクスチャデータを用いて色付けを行う。また、画像生成処理部1315は、色付けされた3次元モデルデータを用いて仮想視点画像を生成する。このとき、後述する入力部1307に対して行われたユーザ操作に基づいて指定される仮想視点に応じた仮想視点画像が生成される。例えば、指定された仮想視点の視点位置及び仮想視点からの視線方向を考慮し、テクスチャデータに含まれる画素値をブレンドすることにより得られる色を用いて、3次元モデルデータの色付けがされる。
以上、画像生成部1306が有する各処理部について説明した。画像生成部1306において生成されるシルエット画像、テクスチャ画像、及び3次元モデルデータも、仮想視点画像を生成するためのデータであるので、素材データに含まれる。なお、分離部1311、シルエット生成部1312、テクスチャ生成部1313及び3次元モデル生成部1314は、それぞれが画像生成装置120とは異なる装置に含まれていてもよい。例えば、撮像システム101が有する複数の撮像装置のそれぞれに分離部1311及びシルエット生成部1312が含まれていてもよい。この場合、ファイル生成装置110は、素材データとして複数の撮像画像、シルエット画像及び撮像パラメータを取得する。また、ファイル生成装置110における素材データ取得部103が上記のうち任意の処理部と同等の処理行う構成であってもよい。例えば、素材データ取得部102がシルエット画像、テクスチャデータ及び3次元モデルデータの少なくともいずれかを生成する構成であってもよい。ファイル生成装置110は、取得あるいは生成した素材データを用いて素材データファイルを生成する。以上説明したように、分離部1311、シルエット生成部1312、テクスチャ生成部1313及び3次元モデル生成部1314は、処理順に対応してそれぞれ撮像システム101、ファイル生成装置110及び画像生成装置120のいずれかに含まれていればよい。また、それぞれが独立した処理装置として外部に接続される構成であってもよい。
図12に戻り、入力部1307は、図2における操作部126に対応し、仮想視点画像に係る仮想視点を指定するためのユーザ操作を受け付ける。ユーザは、例えばジョイスティックやタッチパネルを用いて仮想視点の視点位置及び仮想視点からの視線方向を指定するための操作を行う。入力部1307が受け付けたユーザ操作に基づいて、画像生成部1306において仮想視点が指定されることにより、指定された仮想視点からの見えを表す仮想視点画像が生成される。生成された仮想視点画像は表示部1305に表示される。ユーザは表示部1305に表示される仮想視点画像を見ながら、仮想視点を指定するための操作を行うことができる。
なお、本実施形態における表示部1305及び入力部1307は画像生成装置120の内部に含まれる構成としたが、これに限定されない。例えば、表示部1305及び入力部1307の少なくともいずれかが、独立した装置として画像生成装置120の外部に接続される構成であってもよい。
ここで、制御部1304が行う表示部1305の表示制御について説明する。図14は、制御部1304が行う表示制御の一例を説明するための図である。制御部1304は、品質情報が示す品質領域を識別可能な表示を表示部1305に表示させる。図14(a)及び(b)は、表示部1305に表示される画面表示の一例であり、撮像領域を上から見た図を表している。図14(a)において、斜線で表される領域1401は品質領域を示している。また、アイコン1402及びアイコン1403は各被写体の位置を示すアイコンである。図14(a)では、人型のアイコンにより被写体が模式的に表されているが、アイコンの種類はこれに限定されない。例えば、撮像領域における被写体の位置に矢印や丸などの記号を表示することにより、被写体の位置が示されてもよい。また、各被写体を識別可能にするための被写体情報が表示されてもよい。例えば、被写体がスポーツ選手である場合、被写体情報として、氏名、背番号、ポジションの名称、あるいはチーム名等の情報が表示されてもよい。また、被写体の位置を示すアイコンと共に被写体情報が表示されてもよいし、どちらか一方が表示されてもよい。
ここで、領域1401は、一定の品質を有する仮想視点画像が生成され得る所定の数以上の撮像装置により撮像された領域である。したがって、領域1401に含まれるアイコン1402は、領域1401の外に位置するアイコン1403よりも精度が高いことが期待される。ユーザは、図14(a)に示す画面表示を見ることにより、仮想視点の視点位置及び仮想視点からの視線方向に応じて異なる品質の仮想視点画像が生成されることを識別することが可能になる。すなわち、ユーザは領域1401を視野に含むような仮想視点の視点位置及び仮想視点からの視線方向が指定されるようにユーザ操作を行うことにより、品質の高い仮想視点画像が得られることがわかる。
図14(b)は、表示部1305に表示される画面表示の別の例を示す図である。領域1501は品質領域を示し、モデル1502及びモデル1503は、それぞれ被写体の3次元モデルデータを示す。図14(b)の例においては、領域1501に含まれる3次元モデルデータが太線により強調表示されている。したがって、モデル1502はモデル1503よりも太い線により表されている。これにより、ユーザは精度よく生成された3次元モデルデータを容易に識別することができる。すなわち、ユーザは、強調表示された3次元モデルデータを視野に含むような仮想視点を指定するようにユーザ操作を行うことにより、品質の高い仮想視点画像が得られることがわかる。制御部1304が行う強調表示は図14(b)の例に限定されない。例えば、赤色などの所定の色を3次元モデルデータに重畳させたり、3次元モデルデータを点滅表示したりする等、種々の方法が使用されてもよい。また、制御部1304は、領域1501の外に位置する3次元モデルデータの色の透明度を上げることにより薄く表示されるようにしてもよい。
図15は、品質情報が示す品質領域が複数ある場合に制御部1304が行う表示制御の一例を説明するための図である。図15(a)は、素材データファイルの構成を示す図であり、品質情報1601には複数の品質領域を示す情報が含まれている。例えば、品質領域Aは、80台以上の撮像装置から撮像される領域を示すものとする。また、品質領域Bは、60台以上80台未満の撮像装置から撮像される領域を示すものとする。また、品質領域Cは、40台以上60台未満の撮像装置から撮像される領域を示すものとする。図15(b)は、各品質領域を識別可能にする画面表示の一例であり、領域1701、領域1702及び領域1703は、それぞれ品質領域A、品質領域B及び品質領域Cを示す。これにより、ユーザは、指定される仮想視点によって生成される仮想視点画像の品質が段階的に異なることを認識することができる。
また、図15に示すように、品質領域A、品質領域B及び品質領域Cのそれぞれに「品質 高」「品質 中」「品質 低」という品質ランク情報が紐づけられていてもよい。また上記の品質ランク情報は、素材データファイルにあらかじめ含まれていてもよい。また、図15(b)に示すように、品質ランク情報が表示部1305に表示されてもよい。これにより、ユーザは直感的に仮想視点画像の品質を認識することが可能になる。
図16は、制御部1304が行う表示制御の別の例を説明するための図である。例えば、ユーザは図14に示すような品質領域を識別可能な表示画面を見ながら、仮想視点を指定するための操作を行う。これにより、仮想視点1800の視点位置及び仮想視点からの視線方向1802が指定され、図16(a)のような画面表示がされる。図16(a)において、仮想視点画像が生成される範囲1803は、仮想視点1800の視点位置及び仮想視点1800からの視線方向1802により決定される。図16(a)においては、範囲1803は品質領域である領域1801に含まれるため、品質の高い仮想視点画像が生成される。
しかしながら、図16(b)における仮想視点1900について、仮想視点画像が生成される範囲1903は、品質領域である領域1901の範囲外に位置する。このため、仮想視点1900に対応する仮想視点画像は仮想視点1800に対応する仮想視点画像よりも品質が低いことが想定される。このような場合に、制御部1304は、品質領域の外を視野に含む仮想視点が指定されたことを示す警告表示1904を表示部1305に表示させる。これにより、ユーザは品質の低い仮想視点画像が生成されることを回避することが可能になる。警告表示1904を表示させる方法の一例について述べる。例えば、制御部1304は、ユーザ操作に基づいて指定される仮想視点に対応する仮想視点画像が順次表示部1305に表示される場合に、品質領域の外を視野に含む仮想視点が指定されると、表示された仮想視点画像に重畳して警告表示1904を表示させる。また、例えば、制御部1304は、品質領域の外を視野に含む仮想視点が指定されると、仮想視点画像を表示せずに、又は図16(b)に示すような俯瞰図と警告表示1304とをともに表示させる。あるいは、制御部1304は、仮想視点画像を表示せずに、警告表示1304のみを表示させる構成であってもよい。品質領域の外を視野に含む仮想視点に対応する仮想視点画像を表示しないことにより、品質の低い仮想視点画像がユーザに提供されないようにすることができる。
なお、制御部1304は、仮想視点画像が生成される範囲のうち所定の割合以上が品質領域外に含まれる場合に警告表示を行う構成としてもよい。また、警告表示の方法は上記に限定されず、画面表示を点滅させたり、色合いを変化させたりする等、種々の方法が用いられてもよい。また、画像生成装置120の外部にスピーカー等を接続し、警告音を出力することによりユーザに通知する方法が用いられてもよい。
制御部1304は、図14、図15及び図16に示すような画面表示を表示部1305に表示させることにより、ユーザ操作に基づいて指定される仮想視点に対応する仮想視点画像の品質をユーザに識別可能にさせることができる。これにより、意図せず品質の低い仮想視点画像が生成される可能性を抑制することができる。なお、図14、図15及び図16では撮像領域を上から見た2次元の図が表示される例について説明したが、これに限定されない。品質情報が示す品質領域は3次元空間を表す領域であるため、表示部1306に表示される画面表示においても3次元で品質領域が表現されてもよい。
次に、制御部1304が行う入力部1307の入力制御について説明する。図17は、制御部1304が行う入力制御の一例を説明するための図である。図17において実線で示される範囲2103は、品質領域2101に含まれる位置を視野に含むための、仮想視点2100からの視線方向2102が指定可能な範囲を示す。範囲2103は、例えば、視線方向2102が品質領域2101を通るように設定され得る。本実施形態における品質領域は、図5に示すように3次元空間における3次元座標により表される領域であるため、範囲2103についても3次元空間上に設定される。
また、例えば、範囲2103は品質領域2101が仮想視点2100に対応する仮想視点画像のうち所定の割合を占めるように決定され得る。図17の例では、仮想視点2100の視点位置が指定されると、仮想視点2100の視点位置及び視野2105の少なくともいずれかに基づき、範囲2103が特定される。仮想視点2100の視点位置が品質領域2101に近づくほど、範囲2103は大きくなり、視点位置が品質領域2101から離れるほど、範囲2103は小さくなる。また、仮想視点2100の視野2105が大きいほど、仮想視点2100に対応する仮想視点画像を占める品質領域2101の割合は小さくなる。したがって、範囲2103を設定する際に使用される所定の割合が仮想視点2100の視野2105の大きさに応じて動的に変化するような構成であってもよい。なお、範囲2103の特定方法はこれらに限定されない。
視線方向2102が範囲2103に含まれる場合、また、破線で示される範囲2104は、品質領域2101の外の位置を視野に含む視線方向2102の範囲を示す。制御部1304は、入力部1307に対する入力を取得する。このとき、仮想視点2100に関する視線方向2102が範囲2104に指定された場合、入力部1307に対し視線方向2102を補正させる制御を行う。具体的には、視線方向2102が範囲2103に含まれるように、ユーザ操作に基づいて指定された視線方向2102を補正する。例えば、制御部1304は、仮想視点2100の視点位置を基準として、指定された視線方向2102を回転させるように制御する。なお、補正方法はこれに限定されず、例えば品質領域2101に含まれる位置が視野に含まれるように、仮想視点2100の視点位置を補正させてもよい。このように、制御部1304は、仮想視点の視点位置及び仮想視点からの視線方向の少なくともいずれかを変更することにより、品質の低い仮想視点画像が生成されることを抑制する。
なお、制御部1304は、あらかじめ範囲2103の間でしか視線方向2102を指定することができないように入力部1307に制限させてもよい。また、制御部1304は、例えば品質領域内にしか仮想視点2100の視点位置を指定することができないように入力部1307に制限させてもよい。また、品質領域内に仮想視点2100が指定された場合に、品質領域内から品質領域の外を見るような仮想視点が指定されないように、仮想視点2100からの視線方向に制限が設けられてもよい。
制御部1304が仮想視点の指定を制限する方法の例について述べる。例えば、ユーザがジョイスティックを用いて仮想視点を指定するための操作を行う場合、制御部1304は、仮想視点を指定可能な範囲と指定できない範囲との境界において、ジョイスティックを操作しても仮想視点を変更できないようにする。あるいは、制御部1304は、ユーザが仮想視点を指定できない範囲を選択した場合に、指定可能な範囲に自動で仮想視点を変更する。また、例えば、ユーザがタッチパネルに対してタッチやスワイプ等の操作を行う場合、制御部1304は、仮想視点を指定できない範囲においては仮想視点の視点位置を指定できないようにする。また、例えばユーザがスワイプ操作で仮想視点からの視線方向を変更する場合に、仮想視点を指定可能な範囲と指定できない範囲との境界において、スワイプしても表示画面を動かすことができないようにする。
このように、制御部1304は、仮想視点の視点位置を指定可能な範囲及び前記仮想視点からの視線方向を指定可能な範囲の少なくともいずれかを制限する。これにより、制御部1304は、所定の基準以上の品質を有する仮想視点画像が画像生成部1306において生成されるように制御する。なお、制御部1304は、仮想視点画像が生成される範囲のうち所定の割合以上が品質領域外に含まれる場合に上記の入力制御を行う構成であってもよい。
図18は、画像生成装置120が行う処理を説明するためのフローチャートである。CPU121がROM122または補助記憶装置124に記憶されたプログラムを読み出して実行することにより、以下の処理が行われる。画像生成装置120がファイル生成装置110から素材データファイルを取得すると、処理が開始される。
S2201において、ファイル取得部1301は、ファイル生成装置110に保存されている素材データファイルを取得する。S2202において、領域抽出部1302は、ファイル取得部1301が取得した素材データファイルに含まれる品質情報を抽出する。また、素材データ抽出部1303は、ファイル取得部1301が取得した素材データファイルに含まれる素材データを抽出する。
S2203において、制御部1304は、領域抽出部1302が抽出した品質情報に基づいて、品質領域を識別可能にする表示を表示部1305に表示させる制御を行う。具体的には、制御部1304は、品質情報に含まれる品質領域を示す座標等の情報に基づいて、品質領域を特定し、図14及び15に示すような表示画面を表示部1305に表示させる。
S2204において、入力部1307は、仮想視点を指定するためのユーザ操作の受付をする。S2205において、制御部1304は、入力部1307が受け付けたユーザ操作による入力を取得し、ユーザ操作に基づいて指定される仮想視点の視野に品質領域の外が含まれるか否かを判定する。より具体的には、制御部1304は、ユーザ操作に基づいて指定される仮想視点に対応する仮想視点画像のうち、品質領域の外の領域が所定の割合以上含まれるか否かを判定する。含まれると判定された場合、S2206へ処理が進む。
S2206において、制御部1304は、ユーザ操作に基づいて指定される仮想視点が、品質領域の外を視野に含むことをユーザに通知する。具体的には、制御部1304は、図16(b)に示すような警告表示1904を表示部1305に表示させる、又は画像生成装置120の外部に接続されるスピーカー等に警告音を出力させる等の制御を行う。
また、制御部1304は、ユーザ操作に基づいて指定される仮想視点に対応する仮想視点画像が生成されないように入力部1307を制御する。例えば、制御部1304は、品質情報に基づいて、仮想視点の視点位置を指定可能な範囲、及び、仮想視点からの視線方向を指定可能な範囲を決定する。制御部1304は、ユーザ操作に基づいて指定された仮想視点の視点位置及び視線方向が、それぞれ視点位置を指定可能な範囲及び視線方向を指定可能な範囲に含まれるように、仮想視点の視点位置及び視線方向の少なくともいずれかを補正する。あるいは、制御部1304は、視点位置を指定可能な範囲及び視線方向を指定可能な範囲においてのみ仮想視点が指定されるように、ユーザ操作を制限する。以上の入力制御を行うことにより、制御部1304は、所定の基準以上の品質を有する仮想視点画像が生成されるように制御する。
S2207において、画像生成部1306は、素材データと、指定された仮想視点とに基づいて、仮想視点画像を生成する。生成された仮想視点画像は、表示部1305に表示される。なお、S2203及びS2206の処理は、少なくともいずれかが実行される構成でもよい。また、S2206における通知および入力制御についても、少なくとも一方が実行される構成でもよい。
以上説明した画像生成装置120によれば、素材データファイルに含まれる品質情報に基づいて、生成される仮想視点画像の品質を識別可能にする情報をユーザに提供することができる。また、画像処理装置120は、ユーザ操作に基づいて指定された仮想視点を変更する、又は仮想視点を指定可能な範囲を制限することにより、所定の基準以上の品質を有する仮想視点画像を生成する。これにより、ユーザは、仮想視点画像の品質を容易に参照し、所望の品質の仮想視点画像を取得することができる。
なお、上記においては制御部1304が表示制御及び入力制御を行う構成について説明したが、他の処理部が表示制御及び入力制御を行う構成であってもよい。例えば、表示部1305が品質情報を取得し、品質情報に基づいて図14、15及び16に示すような画面表示を行う構成であってもよい。また、画像生成部1306が、入力部1307に対する入力を取得し、入力に基づいて指定された仮想視点を変更する、又は仮想視点を指定するためのユーザ操作を制限する構成であってもよい。
以上、仮想視点画像に係る品質を示す品質情報を含む素材データファイルを生成するファイル生成装置110、及び、素材データファイルを使用して仮想視点画像を生成する画像生成装置120について説明した。本実施形態において説明した素材データファイルが生成されることにより、複数の撮像装置の設置位置及び撮像方向の影響を考慮した仮想視点画像の品質を容易に参照できるようになる。また、この素材データファイルを使用して仮想視点画像を生成することで、所定の基準以上の品質を有する仮想視点画像を容易に生成することができるようになる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。