WO2023145571A1

WO2023145571A1 - 情報処理装置、情報処理方法、データ構造及びプログラム

Info

Publication number: WO2023145571A1
Application number: PCT/JP2023/001334
Authority: WO
Inventors: 裕尚伊藤
Original assignee: キヤノン株式会社
Priority date: 2022-01-31
Filing date: 2023-01-18
Publication date: 2023-08-03
Also published as: JP2023111640A

Abstract

所望の仮想視点映像を生成することを容易にする。　仮想視点映像のフレームにおける仮想視点を指定するための情報と、複数の被写体のうち仮想視点映像のフレームに表示する被写体を指定するための情報を取得する。仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、仮想視点映像のフレームにおいて表示される被写体を特定するための設定情報と、を含む制御情報を出力する。

Description

情報処理装置、情報処理方法、データ構造及びプログラム

　本開示は情報処理装置、情報処理方法、データ構造及びプログラムに関し、特に仮想視点映像の生成技術に関する。

　複数の撮像装置を異なる位置に設置し、同期撮像を行い、この撮像により得られた複数の画像を用いて仮想視点映像を生成する技術が注目されている。このように複数の視点からの画像を用いて仮想視点映像を生成する技術によれば、例えば、サッカー又はバスケットボールの試合を撮像した映像を用いて、任意の視点からの迫力あるコンテンツを映像制作者が制作できる。この場合、映像制作者は、試合のシーン、例えば選手又はボールの動きなどに応じて、迫力ある映像を生成するために最適な仮想視点の位置及び姿勢（仮想カメラパス）を指定する。特許文献１は、デバイス又はＵＩ画面を操作して仮想カメラパスを設定する技術を開示している。

特開２０１７－２１２５９２号公報

　特許文献１に記載の技術によれば、仮想カメラパスとしては、仮想視点の位置、姿勢、及び画角の推移が指定される。しかしながら、迫力ある仮想視点映像を作成するためには、単にこれらのパラメータに従う仮想視点からの仮想視点映像を生成するだけではなく、より細かく映像生成を制御することが求められる。

　本開示は、所望の仮想視点映像を生成することを容易にすることを目的とする。

　本開示の一実施形態に係る情報処理装置は、
　仮想視点映像のフレームにおける仮想視点を指定する情報を取得する視点取得手段と、
　複数の被写体のうち前記仮想視点映像の前記フレームに表示する被写体を指定する情報を取得する設定取得手段と、
　前記仮想視点映像の前記フレームについて前記仮想視点を特定するための仮想視点情報と、当該フレームにおいて表示される前記被写体を特定するための設定情報と、を含む制御情報を出力する出力手段と、
　を有する。

　本開示によれば、所望の仮想視点映像を生成することを容易にすることができる。

　本開示のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。

　添付図面は明細書に含まれ、その一部を構成し、本開示の実施の形態を示し、その記述と共に本開示の原理を説明するために用いられる。
一実施形態に係る仮想視点画像生成システムの構成例を示す図。仮想カメラパスデータを含むシーケンスデータの書式の一例を示す図。仮想カメラパスデータを含むシーケンスデータの書式の一例を示す図。仮想カメラパスデータの書式の一例を示す図。仮想カメラパスデータの書式の一例を示す図（図３Ａの続き）。仮想カメラパスデータの書式の一例を示す図。仮想カメラパスデータの書式の一例を示す図。表示被写体設定情報に従う映像生成方法を説明する図。表示被写体設定情報に従う映像生成方法を説明する図。表示被写体設定情報に従う映像生成方法を説明する図。色付けカメラ設定情報に従う映像生成方法を説明する図。色付けカメラ設定情報に従う映像生成方法を説明する図。色付けカメラ設定情報に従う映像生成方法を説明する図。レンダリング領域設定情報に従う映像生成方法を説明する図。レンダリング領域設定情報に従う映像生成方法を説明する図。レンダリング領域設定情報に従う映像生成方法を説明する図。レンダリング領域設定情報に従う映像生成方法を説明する図。一実施形態に従う情報処理方法のフローチャート。一実施形態に係る情報処理装置の構成例を示す図。一実施形態に従う情報処理方法のフローチャート。一実施形態で用いられるコンピュータのハードウェア構成例を示す図。

　以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

　本開示の一実施形態は、仮想視点からの被写体を含む仮想視点映像を生成するために用いる制御情報を生成する技術、及びこのような制御情報に従って仮想視点からの被写体を含む仮想視点映像を生成する技術に関する。一実施形態によれば、このような制御情報には、映像生成に関する設定情報が含まれ、この設定情報には、複数の被写体のうち仮想視点映像の各フレームに表示する被写体を指定する情報が含まれる。このような設定情報は、特定の被写体の表示又は非表示に関する設定のために用いることができる。このような構成によれば、例えば、複数の被写体のうちの１つを非表示にして、その後ろの被写体が見えるように制御することができる。とりわけ、複数の撮像装置によって得られた撮像画像に基づいて仮想視点映像を生成する場合、ＣＧによる映像制作を行う場合とは異なって映像製作者が各被写体の位置関係を制御することは容易ではない。このため、所望の仮想視点からの仮想視点映像において、所望の被写体が他の被写体に隠れてしまうことがある。一方で、このような設定情報を用いて他の被写体を非表示にすることにより、所望の被写体の任意の視点からの映像を生成することが容易になり、したがって迫力ある仮想視点映像の生成が容易となる。

　また、一実施形態によれば、設定情報には、複数の位置からの撮像画像のうち、各フレームにおいて被写体をレンダリングするために用いる撮像画像を指定する情報が含まれる。このような設定情報は、被写体への色付けにおいて用いる撮像装置に関する設定のために用いることができる。このような構成によれば、例えば、特定の撮像装置から見える被写体の色に従って、仮想視点映像における被写体の色を決定することができる。とりわけ、複数の撮像装置によって得られた撮像画像に基づいて仮想視点映像を生成する場合、ある撮像装置から見た場合に所望の被写体が他の被写体に隠れてしまうことがある。このような撮像装置による撮像画像を用いて仮想視点映像における被写体の色を決定すると、被写体の色の再現性が低下する可能性がある。一方で、このような設定情報を用いて被写体に色を付けるために用いる撮像装置を適切に選択することにより、被写体をより正確に再現することが容易になり、したがって迫力ある仮想視点映像の生成が容易となる。

　まず、本開示の一実施形態に係る、仮想視点からの被写体を含む仮想視点映像を生成するために用いる制御情報を生成する情報処理装置について説明する。以下の例において、仮想視点映像は、被写体を複数の位置から撮像することによって得られた撮像画像に基づいて生成される。また、以下ではこの制御情報のことを仮想カメラパスデータと呼ぶ。仮想カメラパスデータは、各フレームにおける仮想視点を指定する情報、すなわち時系列の情報を含むことができる。この制御情報は、例えば仮想視点の位置及び仮想視点からの視線方向などの外部パラメータを含むことができ、さらに仮想視点からの視野に相当する画角などの内部パラメータを含んでいてもよい。

　本実施形態で用いられる撮像画像は、複数の撮像装置が互いに異なる方向から被写体が存在する撮像領域を撮像することにより得ることができる。撮像領域は、例えば、ラグビー又はサッカーなどのスポーツが行われる競技場の、平面及び高さで規定される領域である。複数の撮像装置は、このような撮像領域を取り囲むように、それぞれ異なる位置に、それぞれ異なる方向を向くように設置することができ、それぞれの撮像装置は同期して撮像を行う。なお、撮像装置は、撮像領域の全周にわたって設置されなくてもよく、例えば設置場所の制限に応じて撮像領域の一部の近傍にのみ設置されていてもよい。撮像装置の数は限定されない。例えば、撮像領域がラグビーの競技場である場合、競技場の周囲には数十～数百台程度の撮像装置が設置されてもよい。

　また、望遠カメラ及び広角カメラなどのように、画角が異なる複数の撮像装置が設置されていてもよい。例えば、望遠カメラを用いることにより、高解像度で被写体を撮像できるので、生成される仮想視点映像の解像度が向上する。また、広角カメラを用いることにより、一台のカメラによる撮像範囲が広くなるため、設置するカメラ台数を減らすことができる。撮像装置は、現実世界の一つの時刻情報を用いて同期され、それぞれの撮像装置が撮像した映像の各フレームには撮像時刻情報が付与される。

　なお、１台の撮像装置は、１台のカメラで構成されていてもよいし、複数台のカメラで構成されていてもよい。さらに、撮像装置は、カメラ以外の装置を含んでいてもよい。例えば、撮像装置がレーザ光等による測距装置などを含んでいてもよい。

　仮想視点映像を生成する際には、それぞれの撮像装置の状態が参照される。撮像装置の状態は、撮像装置の位置、姿勢（向き及び撮像方向）、焦点距離、光学中心、及び得られる画像の歪みなどを含むことができる。撮像装置の位置及び姿勢（向き及び撮像方向）は、撮像装置自身によって制御されてもよいし、撮像装置の位置及び姿勢を制御する雲台によって制御されてもよい。以下では、撮像装置の状態を示すデータのことを撮像装置のカメラパラメータと呼ぶが、このカメラパラメータには、雲台等の別の装置により制御される状態を示すデータが含まれていてもよい。撮像装置の位置及び姿勢（向き及び撮像方向）に関するカメラパラメータは、いわゆる外部パラメータである。また、撮像装置の焦点距離、画像中心、及び画像の歪みに関するパラメータは、いわゆる内部パラメータである。撮像装置の位置及び姿勢は、例えば、一つの原点と直交する３軸を持つ座標系（以下、世界座標系という）で表現することができる。

　仮想視点映像は、自由視点画像とも呼ばれる。もっとも、仮想視点映像は、ユーザが自由に（任意に）指定した視点からの映像には限定されず、例えば、複数の候補となる視点からユーザが選択した視点からの映像も、仮想視点映像に含まれる。また、仮想視点の指定は、ユーザ操作により行われてもよいし、画像解析の結果等に基づいて自動で行われてもよい。また、本明細書では、仮想視点映像が動画である場合を中心に説明するが、仮想視点映像は静止画であってもよい。

　本実施形態における仮想視点情報は、仮想視点の位置及び向きを示す情報である。具体的には、仮想視点情報は、仮想視点の三次元位置を表すパラメータと、パン、チルト、及びロール方向における仮想視点の視線方向の向きを表すパラメータとを含む。もっとも、仮想視点情報は、仮想視点の視野の大きさ（画角）を表すパラメータを含んでいてもよい。

　また、仮想視点情報は、複数のフレームのそれぞれについての仮想視点を指定する仮想カメラパスデータであってもよい。つまり、仮想視点情報が、仮想視点映像の動画を構成する複数のフレームのそれぞれに対応するパラメータを有していてもよい。このような仮想視点情報は、連続する複数の時点のそれぞれにおける仮想視点の位置及び向きを示すことができる。

　仮想視点映像は、例えば、以下のような方法で生成される。まず、撮像装置が互いに異なる方向からそれぞれの撮像領域を撮像することで、複数の撮像画像が得られる。次に、複数の撮像画像のそれぞれから、人物又はボールなどの被写体に対応する前景領域から抽出された前景画像と、前景領域以外の背景領域から抽出された背景画像とが得られる。前景画像及び背景画像は、テクスチャ情報（色情報など）を有している。そして、被写体の三次元形状を表す前景モデルと、前景モデルに色付けするためのテクスチャデータとが、前景画像に基づいて生成される。前景モデルは、例えば視体積交差法（ｓｈａｐｅ－ｆｒｏｍ－ｓｉｌｈｏｕｅｔｔｅ法）などの形状推定方法により得ることができる。競技場などの背景の三次元形状を表す背景モデルは、例えばスタジアム又は会場などを事前に三次元測定しておくことで生成することができる。また、背景モデルに色づけするために用いられるテクスチャデータは、背景画像に基づいて生成することができる。そして、前景モデルと背景モデルとに対してテクスチャデータをマッピングし、仮想視点情報が示す仮想視点からの画像をレンダリングすることにより、仮想視点映像が生成される。なお、仮想視点映像の生成方法はこのような方法に限定されない。例えば、前景モデル及び背景モデルを用いずに、撮像画像の射影変換により仮想視点映像を生成する方法など、種々の方法を用いることができる。

　なお、仮想視点映像の１フレームのフレーム画像は、同じ時刻に同期して撮像された複数の撮像画像を用いて生成することができる。そして、各フレームについてのフレーム画像を、各フレームに対応する時刻の撮像画像を用いて生成することにより、複数フレームによって構成される仮想視点映像を生成することができる。

　なお、前景画像とは、撮像装置による撮像により得られた撮像画像のうち、被写体の領域（前景領域）から抽出された画像である。前景領域として抽出される被写体は、例えば、時系列で同じ方向から撮像を行った場合において動きのある（位置又は形が変化し得る）動的オブジェクト（動体）である。競技の場合、被写体は、例えば、競技が行われるフィールド内にいる選手又は審判などの人物を含み、球技であれば人物に加えてボールを含んでいてもよい。コンサート又はエンタテイメントなどにおいては、歌手、演奏者、パフォーマー、又は司会者が、被写体の一例である。なお、背景画像を指定するなどの方法により事前に背景を登録している場合、背景に存在していない静止した被写体も前景領域として抽出される。

　背景画像とは、前景となる被写体とは異なる領域（背景領域）から抽出された画像である。例えば、背景画像は、撮像画像から前景となる被写体を取り除くことで得られる画像であってもよい。背景とは、時系列で同じ方向から撮像を行った場合において静止している、又は静止に近い状態が継続している撮像対象物である。このような撮像対象物は、例えば、コンサート等のステージ、競技などのイベントを行うスタジアム、球技で使用するゴールなどの構造物、又はフィールドなどである。もっとも、背景は被写体とは異なる領域である一方で、撮像対象物として被写体及び背景とは異なる物体が存在していてもよい。

　図１は、本開示の一実施形態に係る仮想視点画像生成システムの構成例を示す図である。このシステムは、本開示の一実施形態に係る情報処理装置であるデータ処理装置１と、撮像装置２と、形状推定装置３と、記憶装置４と、映像生成装置５と、仮想カメラ操作装置６と、データ出力装置７と、を有する。なお、図１には１台の撮像装置２が示されている一方で、他の撮像装置は省略されている。また、これらの装置のうちの２以上が１つの装置に統合されていてもよい。例えば、データ処理装置１が、以下に説明する映像生成装置５と仮想カメラ操作装置６との少なくとも一方の機能を有していてもよい。

　データ処理装置１は、仮想視点からの被写体を含む仮想視点映像を生成するために用いる制御情報を生成する。図１において、データ処理装置１は、仮想カメラ操作装置６と、記憶装置４と、データ出力装置７とに接続されている。また、データ処理装置１は、仮想カメラ操作装置６から仮想視点情報を取得し、映像生成装置５から映像生成に関する設定情報を取得する。そして、データ処理装置１は、取得した仮想視点情報と映像生成に関する設定情報とに基づいて、仮想視点映像を生成するために用いる制御情報を生成及び出力する。本実施形態における制御情報は、各フレームにおける仮想視点情報と、各フレームにおける映像生成方法を示す設定情報とを含む、仮想カメラパスデータである。そして、データ処理装置１が出力した仮想カメラパスデータは、記憶装置４及びデータ出力装置７へ出力される。

　仮想カメラ操作装置６は、仮想視点映像を生成するために、仮想視点を指定する仮想視点情報を生成する。仮想視点は、例えば、ジョイスティック、ジョグダイヤル、タッチパネル、キーボード、及びマウスなどの入力装置を用いて、ユーザ（操作者）によって指定される。仮想視点情報は、仮想視点の位置、姿勢、及び画角などの情報、及びその他の情報を含むことができる。

　ここで、ユーザは、入力した仮想視点情報に従って生成された仮想視点映像又はフレーム画像を見ながら、仮想視点を指定することができる。このために仮想カメラ操作装置６は、映像生成装置５に仮想視点情報を送信する。また、仮想カメラ操作装置６は、送信した仮想視点情報に基づく仮想視点映像を映像生成装置５から受けとり、この仮想視点映像を表示することができる。ユーザは、こうして表示される仮想視点映像を参照しながら、仮想視点の位置等を検討することができる。なお、仮想視点の指定方法は上記の方法には限定されない。例えば、仮想カメラ操作装置６は、あらかじめ作成された仮想カメラパスファイルを読み込んで、この仮想カメラパスファイルに従って順次仮想視点を指定することも可能である。また、仮想カメラ操作装置６は、仮想視点の動きを指定するユーザ入力を受け取り、指定された動きに従って各フレームにおける仮想視点の位置を決定してもよい。一方で、仮想視点の動きを示す情報を仮想視点情報として用いてもよい。また、仮想カメラ操作装置６は、被写体を認識し、認識された被写体の位置等に基づいて仮想視点を自動的に指定してもよい。

　また、仮想カメラ操作装置６は、仮想視点情報に加えて、仮想視点映像を生成するために用いる、映像生成に関する設定情報を生成することができる。このような設定情報も、ユーザが入力装置を用いて指定することができる。例えば、仮想カメラ操作装置６は、映像生成装置５が生成した仮想視点映像を含み、ユーザによる仮想視点情報及び設定情報の少なくとも一方の指定を受け付けるユーザインタフェースを、例えばディスプレイを介して提示することができる。ユーザは、入力した仮想視点情報又は設定情報に従って生成された仮想視点映像又はフレーム画像を見ながら、仮想視点情報又は設定情報を指定することもできる。このために仮想カメラ操作装置６は、映像生成装置５に設定情報を送信することができる。また、仮想カメラ操作装置６は、送信した設定情報に基づく仮想視点映像を映像生成装置５から受けとり、この仮想視点映像を表示することができる。ユーザは、こうして表示される仮想視点映像を参照しながら、設定情報を検討することができる。なお、仮想カメラ操作装置６は設定情報を自動的に指定してもよい。例えば、仮想カメラ操作装置６は、注目被写体が他の被写体によって隠れないように、他の被写体を表示するか否かを決定することができる。

　映像生成装置５は、上記のように、仮想視点情報に従って仮想視点映像を生成することができる。また、映像生成装置５は、さらに設定情報に従って仮想視点映像を生成してもよい。この際に、映像生成装置５は、仮想視点映像を生成する際に用いる被写体データを、記憶装置４から取得する。この被写体データは、例えば、撮像装置２によって得られた撮像画像、撮像装置２のカメラキャリブレーション情報、点群モデルデータ、ビルボードモデルデータ、又はメッシュモデルデータなどでありうる。後述するように仮想カメラ操作装置６によって指定される被写体は、記憶装置４から取得される被写体データに対応していてもよい。また、映像生成装置５は、仮想カメラ操作装置６から取得した設定情報をデータ処理装置１へと送信することができる。例えば、映像生成装置５は、仮想視点映像を表示のために仮想カメラ操作装置６に送信するとともに、仮想カメラ操作装置６に表示される仮想視点映像を生成するために用いた設定情報をデータ処理装置１に送信することができる。

　記憶装置４は、形状推定装置３によって取得された、形状推定装置３によって生成された被写体データを格納する。記憶装置４は、例えば、半導体メモリ又は磁気記録装置などで構成されていてもよい。なお、記憶装置４に格納される被写体データはそれぞれ、被写体の撮像時刻情報と関連付けられている。被写体データに対する撮像時刻情報の関連付けは、例えば、被写体データのメタデータに撮像時刻情報を付与することによって行うことができる。このような撮像時刻情報を付与する装置は特に限定されず、例えば、撮像装置２又は記憶装置４が撮像時刻情報を付与することができる。また、記憶装置４は、リクエストに応じて被写体データを出力する。

　形状推定装置３は、撮像装置２から撮像画像又は前景画像を取得し、これらの画像に基づいて被写体の三次元形状を推定し、被写体の三次元形状を示す三次元モデルのデータを出力する。三次元モデルは、前述のような、点群モデルデータ、ビルボードモデルデータ、又はメッシュモデルデータなどにより表される。また、三次元モデルは、形状の情報だけでなく、被写体の色の情報を有していてもよい。なお、映像生成装置５が、仮想視点映像を前景モデル及び背景モデルを用いずに生成する場合、仮想視点画像生成システムは形状推定装置３を有していなくてもよい。

　撮像装置２は、他の撮像装置２から識別するための固有の識別番号を持っている。撮像装置２は、撮像により得た撮像画像から前景画像を抽出する機能などの他の機能を有していてもよく、このような機能を実現するためのハードウェア（回路又は装置など）も含んでいてもよい。

　データ出力装置７は、データ処理装置１から仮想カメラパスデータを、記憶装置４から仮想カメラパスデータに対応する被写体データを受け取り、入力された被写体データを保存又は出力する。保存又は出力される際のデータの書式については後述する。なお、データ出力装置７が被写体データを出力又は保存する必要はなく、データ出力装置７は仮想カメラパスデータのみをシーケンスデータとして保存又は出力してもよい。また、データ出力装置７は、１つのパターンの仮想カメラパスデータを保存又は出力するだけでなく、複数のパターンの仮想カメラパスデータを保存又は出力してもよい。

　次に、データ処理装置１の構成について説明する。データ処理装置１は、視点情報取得部１０１、設定情報取得部１０２、カメラパス生成部１０３、及びカメラパス出力部１０４を有する。

　視点情報取得部１０１は、仮想視点映像のフレームにおける仮想視点を指定するための情報を取得する視点取得動作を行う。視点情報取得部１０１は、各フレームにおける仮想視点を指定する情報を取得することができる。本実施形態において視点情報取得部１０１は、仮想カメラ操作装置６によって指定された仮想視点情報を取得する。なお、視点情報取得部１０１は、全フレームについての仮想視点情報を仮想カメラ操作装置６からまとめて取得してもよいし、仮想カメラ操作装置６に対するリアルタイムの操作により順次指定されている各フレームについての仮想視点情報を取得し続けてもよい。

　設定情報取得部１０２は、仮想視点からの被写体を含む仮想視点映像を生成するために用いる設定情報を取得する設定取得動作を行う。本実施形態において、設定情報取得部１０２は、複数の被写体のうち仮想視点映像の各フレームに表示する被写体を指定する情報を取得することができる。また、設定情報取得部１０２は、被写体を複数の位置から撮像することによって得られる複数の撮像画像のうち、仮想視点映像のフレームにおいて被写体の色を決定するために用いる撮像画像を指定するための情報を取得してもよい。上述のように、設定情報取得部１０２は、映像生成装置５が用いている映像生成に関する設定情報を、映像生成装置５から取得することができる。なお、視点情報取得部１０１と同様に、設定情報取得部１０２は、仮想カメラ操作装置６が出力した全フレームについての設定情報をまとめて取得することができる。また、設定情報取得部１０２は、仮想カメラ操作装置６に対するリアルタイムの操作により順次指定されている各フレームについての仮想視点情報を取得し続けてもよい。

　カメラパス生成部１０３は、仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、フレームにおいて表示される被写体を特定するための設定情報と、を含む制御情報を出力する。カメラパス生成部１０３は、各フレームについて仮想視点を示す仮想視点情報と、各フレームについての映像生成に関する設定情報（例えば表示する被写体を示す情報又はレンダリングするために用いる撮像画像を示す情報）と、を含む制御情報を生成できる。本実施形態においてカメラパス生成部１０３は、この制御情報を仮想カメラパスデータとして出力する。仮想カメラパスデータは、各フレームについて指定された仮想視点を示す情報と設定情報との関連付けを示すことができる。例えば、カメラパス生成部１０３は、視点情報取得部１０１が取得した仮想視点情報に対して、設定情報取得部１０２が取得した制御情報を付与することにより、仮想カメラパスデータを生成することができる。カメラパス生成部１０３は、生成した制御情報をカメラパス出力部１０４に出力できる。

　カメラパス出力部１０４は、カメラパス生成部１０３が生成した、仮想視点情報と設定情報とを含む制御情報を出力する。上記のとおり、カメラパス出力部１０４は、仮想カメラパスデータとして制御情報を出力することができる。カメラパス出力部１０４は、仮想カメラパスデータに対して、ヘッダ情報などを付与してから出力してもよい。なお、カメラパス出力部１０４は、仮想カメラパスデータをデータファイルとして出力してもよい。一方で、カメラパス出力部１０４は、仮想カメラパスデータを示す複数のパケットデータを順次出力してもよい。さらに、仮想カメラパスデータは、フレーム単位で出力されてもよいし、仮想カメラパス単位又は一定数のフレーム群単位で出力されてもよい。

　図２Ａは、カメラパス出力部１０４が出力する仮想カメラパスデータを含む、データ出力装置７が出力するシーケンスデータの書式の一例を示す。図２Ａにおいて、仮想カメラパスデータは、１つの仮想視点映像における仮想カメラパスを示すシーケンスデータを構成している。１つのシーケンスデータは、ビデオクリップごと、又は撮像カットごとに生成されてもよい。各シーケンスデータにはシーケンスヘッダが含まれており、シーケンスヘッダには、対応する被写体データのシーケンスデータを特定する被写体シーケンスデータ情報が保存される。この情報は、例えば、被写体データを一意に特定可能なシーケンスヘッダスタートコード、被写体の撮像場所及び撮像日時に関する情報、又は被写体データの所在を表すパス情報等であってもよいが、これらには限定されない。また、シーケンスヘッダは、シーケンスデータが仮想カメラパスデータを含むことを示す情報を含んでいてもよい。この情報は、例えば、シーケンスヘッダに含まれるデータセットを示す情報、又は仮想カメラパスデータの存在の有無を表す情報であってもよい。

　シーケンスヘッダには、続けてシーケンスデータ全体に関する情報が保存される。例えば、仮想カメラパスシーケンスの名称、仮想カメラパスの作成者の情報、権利者情報、被写体を撮像したイベント名や、撮像時のカメラフレームレート、及び仮想カメラパスにおいて基準となっている時刻情報を保存することができる。また、仮想視点映像のレンダリング時に想定される仮想視点映像サイズ及び背景データ情報を保存することができる。もっとも、シーケンスヘッダに保存される情報はこれらに限定されない。

　シーケンスデータには、それぞれの仮想カメラパスデータがデータセットと呼ばれる単位で保存される。シーケンスヘッダには、このデータセット数Ｎが保存される。本実施形態では、シーケンスデータには仮想カメラパスデータと被写体データの２種類のデータセットが含まれている。シーケンスヘッダの以降の部分には、データセットごとの情報が保存される。

　シーケンスヘッダにおける１つのデータセットについての情報として、最初にデータセットの識別ＩＤが保存される。識別ＩＤとしては、全データセットの中にユニークなＩＤが付与される。続いて、データセットの種別コードが保存される。本実施形態では、データセットが仮想カメラパスデータを表すのか被写体データを表すのかが、この種別コードにより示される。データセットの種別コードとしては、図２Ｂに示す２バイトのコードを用いることができる。ただし、データセットの種別及びコードはこれらに限定されない。例えば、シーケンスデータには、仮想視点映像生成する際に用いる他の種別のデータが含まれていてもよい。続いて、このデータセットへのポインタが保存される。もっとも、ポインタの代わりに、データセット本体へのアクセスのための他の情報が保存されてもよい。例えば、記憶装置４に構築されているファイルシステムにおけるファイル名を保存してもよい。

　図３Ａ及び図３Ｂは、仮想カメラパスデータのデータセットの構成の一例を示す。図３Ａ及び図３Ｂは、それぞれ仮想カメラパスデータの一部を示し、図３Ｂは図３Ａの続きである。上述のとおり、本実施形態における制御情報は、各フレームについての映像生成に関する設定情報を含むことができる。また、設定情報は、複数の被写体のうち仮想視点映像の各フレームに表示される被写体を示す情報を含むことができる。ここで、表示される被写体の特定方法は特に限定されない。例えば、設定情報は、複数の被写体のそれぞれについて表示するか否かを示す情報である表示被写体設定情報を含んでいてもよい。また、設定情報は、レンダリング対象となる三次元空間中の領域を示すレンダリング領域設定情報を含んでいてもよく、この場合この領域内に位置する被写体がフレーム画像に表示される。一方で、設定情報は、複数の位置からの撮像画像のうち、各フレームにおいて被写体をレンダリングするために用いる撮像画像を指定する色付けカメラ設定情報を含んでいてもよい。また、設定情報は、仮想視点映像を生成する際に用いる他の種別のデータを含んでいてもよい。例えば、設定情報は、表示被写体設定情報、色付けカメラ設定情報、及びレンダリング領域設定情報以外の付加情報を含んでいてもよい。ここで、付加情報としては、例えば被写体に影を付けるか否かを指定する情報、影の濃さの度合いを示す情報、仮想広告の表示に関する設定情報、又はエフェクト情報などが挙げられる。設定情報は、これらのうちの任意の種類の情報を含むことができる。

　図３Ａ及び図３Ｂに示す仮想カメラパスデータは、設定情報として、表示被写体設定情報、色付けカメラ設定情報、及びレンダリング領域設定情報を含んでいる。また、図３Ａ及び図３Ｂに示す仮想カメラパスデータは、仮想視点情報を含んでいる。

　データセットの先頭には、仮想カメラパスデータヘッダが保存される。このヘッダの先頭には、データセットが仮想カメラパスデータのデータセットであることを示す情報、及びデータセットのデータサイズが保存される。続いて、格納されている仮想カメラパスデータのフレーム数Ｍが記述される。そして、仮想カメラパスデータのフォーマット情報が記述される。このフォーマット情報は、格納されている仮想カメラパスデータの書式を表す情報であり、例えば、仮想カメラパスに関する様々なデータが種別ごとに格納されているか、フレームごとに格納されているか、を示すことができる。図３Ａ及び図３Ｂの例においては、各データは種別単位で格納されている。すなわち、仮想カメラパスデータは複数のデータブロックを含み、１つのデータブロックには各フレームについての仮想視点情報が含まれ、他の１つのデータブロックには各フレームについての設定情報が含まれている。続いて、仮想カメラパスデータヘッダには、データの数Ｌが記述される。以降の仮想カメラパスデータヘッダには、仮想カメラパスデータに含まれるデータごとの情報が保存される。

　仮想カメラパスデータヘッダ内のデータごとの情報には、最初にデータの種別コードが保存される。本実施形態では、データの種別は仮想カメラパスデータ種別コードによって表される。仮想カメラパスデータ種別コードとしては、例えば図３Ｃに示す２バイトのコードを用いることができる。ただし、データの種別及びコードはこれらに限定されない。例えば、コードは、記載する情報に応じて、例えば２バイトより長いコードであってもよいし、２バイトより短いコードであってもよい。続いて、ポインタなどの、データ本体へアクセスするための情報が保存される。そして、データに対応するフォーマット情報が記載される。例えば、仮想視点情報についてのフォーマット情報としては、仮想カメラの位置及び姿勢などを表すカメラ外部パラメータをクォータニオンで表記することを示す情報などが挙げられる。

　仮想カメラパスデータヘッダの後には、仮想カメラパスデータとして、仮想カメラパスに関する各データの実データ（データ本体）が、仮想カメラパスデータヘッダに記載されているフォーマットに従って、記載される。なお、各データの先頭には、そのデータの開始を表すスタートコードが記載される。図３Ａ及び図３Ｂの例では、データ本体として、仮想視点情報、表示被写体設定情報、色付けカメラ設定情報、及びレンダリング領域設定情報が順に記載されている。また、それぞれのデータには、１番目～Ｍ番目のフレームのそれぞれについての情報が含まれている。仮想視点情報としては、各フレームにおける仮想視点を指定する情報を記載することができ、例えば内部パラメータ及び／又は外部パラメータを記載することができる。一実施形態において、仮想視点情報は、仮想視点の位置及び仮想視点からの視線方向を示す外部パラメータを含んでいる。また、一実施形態において、仮想視点情報は、仮想視点の画角又は焦点距離を示す内部パラメータを含んでいる。

　表示被写体設定情報は、複数の被写体のそれぞれについて表示するか否かを示す情報である。ここでは、表示する被写体又は表示しない被写体を、対象とする被写体のモデルの識別子を用いて指定することができる。図３Ａ及び図３Ｂの例においては、表示する被写体を指定する方法を採用し、表示する被写体のモデル識別子００１及び００３を指定する例と、表示しない被写体を指定する方法を採用し、表示しない被写体のモデル識別子００２を指定する例が記載されている。どちらの例においても、モデル識別子００２によって特定される被写体は仮想視点映像において表示されない。被写体の指定には、１つのフレームにおいて三次元モデルを一意に特定可能なユニークな識別子を用いることができる。このような識別子は、フレームごとに規定されてもよいし、コンテンツデータ群において同じ被写体に対して同じ識別子が用いられてもよい。

　色付けカメラ設定情報は、仮想視点画像のフレームにおいて被写体の色を決定するために用いる撮像画像を特定するための情報である。この情報は、仮想視点映像の各フレームにおいて被写体をレンダリングするために用いる撮像画像を示すことができ、より具体的には、各フレームのフレーム画像における被写体の色を決定するために参照される撮像画像を示すことができる。このような情報により、被写体又はその三次元モデルに色を付与するために用いる撮像装置の選択を制御することができる。図３Ａ及び図３Ｂの例においては、色付けに使用する又は使用しない撮像装置が指定されている。指定の対象とする撮像装置は、撮像装置を一意に特定可能なユニークな識別子を用いて指定することができる。このような撮像装置の識別子は、画像生成システムを構築する際に決めることができ、この場合コンテンツデータ群において同じ撮像装置には同じ識別子が用いられる。もっとも、フレームごとに撮像装置に対する識別子が規定されてもよい。仮想視点映像を生成する際には例えば数十台～百台超の多数の撮像装置が用いられるため、色付けに使用しない撮像装置を指定する方法を用いることでユーザに対する負担が軽減できる可能性かがある。

　レンダリング領域設定情報は、仮想視点映像の生成対象である（あるいはレンダリング対象となる）三次元空間中の領域を示す情報である。各フレームにおいては、ここで設定された領域内に位置する被写体を表示することができる。例えば、座標範囲を指定することができ、この場合、指定された座標範囲に含まれない三次元モデルはレンダリングされず、つまり仮想視点映像に表示されない。範囲指定は、例えば、三次元モデルを規定する座標系、例えば世界座標に従うｘ、ｙ、ｚ座標を用いて行うことができる。もっとも、領域の設定方法は特に限定されず、例えば、ｘ座標及びｚ座標が所定の範囲内にある全ての被写体をレンダリングするように設定を行ってもよい。

　これらの設定情報はフレームごとに記述されてもよい。すなわち、一実施形態において、仮想カメラパスデータには、フレームごとに、仮想視点情報と、設定情報と、が記録されている。一方で、シーケンスデータによって表現されるコンテンツ全体に対して（例えば全てのフレームに対して）、又はコンテンツの一部に対して（例えば複数のフレームに対して）、共通の設定情報が用いられてもよい。すなわち、仮想カメラパスデータには、複数のフレームに共通して適用される設定情報が記録されていてもよい。フレームごとに異なる設定情報を記述するか、全てのフレームに対して共通の設定情報を記述するかは、データの種別ごとに決定することができる。例えば、図３Ａ及び図３Ｂの例では、表示被写体設定情報及び色付けカメラ設定情報はフレームごとに指定されており、レンダリング領域設定情報はコンテンツ全体で共通に用いられる。一方で、コンテンツ全体に共通の表示被写体設定情報又は色付けカメラ設定情報を指定してもよい。

　図４は、仮想カメラパスに関する様々なデータをフレームごとに格納する場合の、仮想カメラパスデータの例を示す。このように、仮想カメラパスデータが複数のデータブロックを含み、１つのデータブロックには１つのフレームについての仮想視点情報と設定情報とが含まれていてもよい。フレーム単位でデータを格納する場合、各フレームデータの先頭にはフレームデータヘッダが付加される。このフレームデータヘッダには、フレームデータが始まることを表すコード、及びフレームデータとして格納されるデータの種別及びその順序を示す情報を記述することができる。

　以下に、表示被写体設定情報、色付けカメラ設定情報、及びレンダリング領域設定情報を用いた仮想視点映像の制御について具体的に説明する。

　図５Ａ～５Ｃは、表示被写体設定情報を用いた制御例を示す。図５Ａには、被写体が存在する空間を撮像することで得られた被写体５０１，５０２，５０３の三次元モデルと、仮想視点映像を生成するために指定した仮想視点５００が示されている。ここで、被写体５０１～５０３の三次元モデルに従って仮想視点映像を生成すると、仮想視点映像には図５Ｂのように被写体５０１～５０３が表示される。ここで、非表示被写体として被写体５０１の三次元モデルを指定して仮想視点映像を生成すると、仮想視点映像には図５Ｃのように被写体５０１が表示されないため、被写体５０２が見えるようになる。

　図６Ａ～６Ｃは、色付けカメラ設定情報を用いた制御例を示す。図６Ａは被写体が存在する空間を示しており、撮像装置５１０，５１１と障害物５２０とが示されている。これらの撮像装置及びその他の撮像装置（不図示）により得られた撮像画像を用いて、被写体５０１～５０３の三次元モデルを生成し、仮想視点５００からの仮想視点映像を生成すると、図６Ｂに示す仮想視点映像が得られることが想定される。図６Ｂにおいて、被写体５０３には、被写体５０３に近い撮像装置５１１による撮像画像に基づくテクスチャが付与されているが、予期せぬ障害物５２０のために、被写体５０３の色は本来の被写体とは異なっている。ここで、色付けカメラ制御により、撮像装置５１１を色付けに用いる撮像装置から除外すると、図６Ｃに示す仮想視点映像が得られる。図６Ｃでは、被写体５０２には撮像装置５１０による撮像画像に基づくテクスチャが付与されており、被写体５０２は正しい色で表示されている。

　なお、被写体に色付けするために用いる撮像装置を選択するための様々なアルゴリズムが存在し、例えば仮想視点の位置に近い撮像装置、仮想視点と視線方向が近い撮像装置、被写体に近い撮像装置、などを選択することが考えられる。このような色付けカメラ設定情報を用いることにより、被写体をレンダリングする際に選択可能なカメラを限定することができる。このような手法によれば、図６Ａに示すような障害物、とりわけ三次元モデル化が行われない位置に存在する障害物への対策を行うことができる。また、仮想視点を同じ時刻の被写体の周りで回転させながら被写体を見る仮想視点映像を生成するに、このような手法を用いることにより、被写体をレンダリングために用いるカメラが切り替わることによる違和感を緩和することができる。

　図７Ａ～７Ｄは、レンダリング領域設定情報による制御例を示す。図７Ａは、被写体が存在する空間を撮像することで得られた被写体５０１，５０２，５０３の三次元モデルと、仮想視点映像を生成するために指定したレンダリング領域５３０と示す。図７Ａに示されるレンダリング領域５３０は、システムで指定可能な全空間である。この場合、図７Ｂに示されるように、生成される仮想視点映像には全ての三次元モデルが表示される。一方で、図７Ｃはレンダリング領域５３０の半分程度の大きさのレンダリング領域５４０が指定された場合の例を示す。この場合、被写体５０３の三次元モデルはレンダリング領域の外にあるために、図７Ｄのように仮想視点映像には被写体５０３が表示されない。このようなレンダリング領域の制御によれば、上述の被写体表示制御と同様の効果が得られる。一方で、このような構成によれば、三次元モデルの一部だけが領域内にある場合に、その一部が表示される。

　このように、仮想カメラパスデータのような一実施形態に係るデータ構造は、仮想視点情報のような、仮想視点映像のフレームについて仮想視点を特定するための第１のデータを含んでいる。また、一実施形態に係るデータ構造は、表示被写体設定情報又はレンダリング領域設定情報のような、仮想視点映像のフレームについて複数の被写体のうちの表示される被写体を特定するための第２のデータを含んでいる。そして、このようなデータ構造は、仮想視点映像を生成する情報処理装置が、複数の被写体から第２のデータにより被写体を特定する処理において用いられる。また、このようなデータ構造は、特定された被写体を含む、第１のデータにより特定された仮想視点に対応するフレーム画像を生成する処理において用いられる。一方で、一実施形態に係るデータ構造は、複数の位置から撮像することによって得られる複数の撮像画像のうち、仮想視点映像のフレームにおいて被写体の色を決定するために用いる撮像画像を特定するための第２のデータを含んでいる。第２のデータの例は、上述した色付けカメラ設定情報である。そして、このようなデータ構造は、仮想視点映像を生成する情報処理装置が、複数の撮像画像から第２のデータにより撮像画像を特定する処理において用いられる。また、このようなデータ構造は、特定された撮像画像に基づいて、第１のデータにより特定された仮想視点に対応するフレーム画像を生成する処理において用いられる。

　なお、図２Ａに示すシーケンスデータには、仮想カメラパスデータと被写体データとの２つのデータセットが含まれていた。しかしながら、仮想カメラパスデータ及び被写体データの保存方法は、このような方法には限られない。例えば、シーケンスデータには仮想カメラパスデータのみが含まれていてもよい。この場合、被写体データは、仮想カメラパスデータ（又はシーケンスデータ）とは別に記憶装置４に格納されていてもよい。

　上記のようなデータ処理装置１が行う情報処理方法の一例について、図８のフローチャートを参照して説明する。Ｓ８０１～Ｓ８０４の処理は、仮想カメラパスの開始から、仮想カメラパス又はフレーム単位での入力が終了するまで、フレーム単位で繰り返される。例えば、ユーザが仮想カメラパスの設定を開始するフレームから終了するフレームまで、以下の処理を繰り返すことができる。

　Ｓ８０２において視点情報取得部１０１は、仮想カメラ操作装置６から処理対象のフレームについての仮想視点を示す仮想視点情報を取得する。Ｓ８０３において設定情報取得部１０２は、映像生成装置５から、処理対象のフレームについての映像生成に関する上記の設定情報を取得する。

　Ｓ８０５において、カメラパス生成部１０３は、視点情報取得部１０１が取得した各フレームについての仮想視点情報と、設定情報取得部１０２が取得した各フレームについての設定情報と、を含む制御情報を生成する。例えば、カメラパス生成部１０３は、仮想視点情報に設定情報を付与することで仮想カメラパスデータを生成することができる。

　Ｓ８０６において、カメラパス出力部１０４は、カメラパス生成部１０３が生成した制御情報を出力する。例えば、カメラパス出力部１０４は、仮想カメラパスデータに対してヘッダ情報などを付与した後で、仮想カメラパスデータを出力することができる。

　本実施形態によれば、以上のように、各フレームについて仮想視点を示す仮想視点情報と、各フレームについての映像生成に関する設定情報と、を含む制御情報を生成することができる。とりわけ、本実施形態における仮想カメラパスデータには、仮想視点情報のみならず、上記の設定情報が付与されているため、既に説明したように、仮想視点映像の生成における制御の自由度が高まり、所望の仮想視点映像を生成することが容易になる。

　このような、データ処理装置１が生成した制御情報に従って仮想視点映像を生成する方法について次に説明する。図９は、本開示の一実施形態に係る情報処理装置である映像生成装置を含むシステムの構成例を示す。映像生成装置９００は、仮想視点からの被写体を含む仮想視点映像を生成する。この映像生成装置９００は、被写体を複数の位置から撮像することによって得られた撮像画像に基づいて仮想視点映像を生成することができる。なお、データ処理装置１及び記憶装置４の構成は、既に説明したとおりである。

　映像生成装置９００は、カメラパス取得部９０１、映像設定部９０２、データ管理部９０３、映像生成部９０４、及び映像出力部９０５を有する。

　カメラパス取得部９０１は、仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、各フレームについての映像生成に関する設定情報と、を含む制御情報を取得する。カメラパス取得部９０１は、上述のデータ処理装置１で出力された、このような制御情報を含む仮想カメラパスデータを取得することができる。なお、上述のように、設定情報は、仮想視点映像のフレームにおいて表示される被写体を特定するための情報であってもよい。また、設定情報は、被写体を複数の位置から撮像することによって得られる複数の撮像画像のうち、仮想視点映像のフレームにおいて被写体の色を決定するために用いる撮像画像を特定するため情報であってもよい。

　図９において映像生成装置９００はデータ処理装置１に接続されているが、映像生成装置９００は記憶媒体を介して仮想カメラパスデータを取得してもよい。例えば、データ処理装置１からの仮想カメラパスデータは、カメラパス取得部９０１にデータファイルとして入力されてもよいし、パケットデータとして入力されてもよい。なお、カメラパス取得部９０１は、仮想カメラパスデータを、フレームごとに取得してもよいし、一定数のフレーム群ごとに取得してもよいし、仮想カメラパスデータの１つ又は複数のデータセットごとに取得してもよい。仮想カメラパスデータの複数のデータセットを取得した場合、映像出力部９０５は、それぞれの仮想カメラパスデータセットに対応する仮想視点映像を別々に出力することができる。なお、それぞれの仮想カメラパスのデータセットは、各仮想カメラパスデータセットヘッダに記載された識別ＩＤによって区別できる。

　映像設定部９０２は、カメラパス取得部９０１が取得した仮想カメラパスデータから、仮想視点映像を生成するために用いる上記の設定情報を取得する。そして、映像設定部９０２は、取得した設定情報に基づいて、映像生成部９０４による映像生成方法を設定する。

　データ管理部９０３は、映像生成部９０４の要求に基づいて、仮想カメラパスに対応する被写体データを取得する。図９において映像生成装置９００は記憶装置４に接続されており、データ管理部９０３は被写体データを記憶装置４から取得することができる。また、映像生成装置９００は記憶媒体を介して被写体データを取得してもよい。例えば、データ管理部９０３は、データ出力装置７が出力したシーケンスデータに含まれる被写体データを取得することができる。さらに、映像生成装置９００は、記憶装置４に格納されている被写体データと同じデータを格納していてもよい。

　なお、データ管理部９０３が取得する被写体データは、映像生成部９０４が仮想視点映像を生成する方法に基づいて選択される。例えば、前景モデル又は背景モデルに基づく映像生成方法を用いる場合、データ管理部９０３は、前景又は背景の点群モデルデータ又はメッシュモデルデータを取得することができる。また、データ管理部９０３は、これらのモデルに対応するテクスチャ画像又はテクスチャを生成するための撮像画像、及びカメラキャリブレーションデータなどを取得することができる。一方で、前景モデル又は背景モデルを用いない映像生成方法を用いる場合、データ管理部９０３は撮像画像及びカメラキャリブレーションデータなどを取得することができる。

　映像生成部９０４は、設定情報に基づいて、仮想視点情報が示す仮想視点からのフレーム画像を仮想視点映像の各フレームについて生成することにより、仮想視点映像を生成する。本実施形態において映像生成部９０４は、カメラパス取得部９０１が取得した仮想視点情報と、データ管理部９０３が取得した被写体データとを用いて、仮想視点映像を生成する。ここで、映像生成部９０４は、映像設定部９０２によって設定された映像生成方法に従って仮想視点映像を生成する。上述のように、映像生成部９０４は、フレームにおいて表示される被写体を特定するための設定情報に従って、設定情報により特定される被写体を含み、仮想視点情報により特定される仮想視点に対応するフレーム画像を生成することができる。また、映像生成部９０４は、仮想視点映像のフレームについて、仮想視点情報により特定される仮想視点に対応して、被写体を含むフレーム画像を、設定情報により特定される撮像画像に基づいて生成することができる。設定情報に基づく映像生成方法は、図５Ａ～図７Ｄを参照して説明したとおりである。

　映像出力部９０５は、映像生成部９０４から仮想視点映像を取得し、ディスプレイ等の表示デバイスに仮想視点映像を出力する。なお、映像出力部９０５は、映像生成部９０４から取得した仮想視点映像を、データファイル又はパケットデータとして出力してもよい。

　本実施形態に係る情報処理装置が行う情報処理方法について、図１０のフローチャートを参照して説明する。Ｓ１００１～Ｓ１００８の処理は、仮想カメラパスの開始から終了まで、フレーム単位で繰り返される。

　Ｓ１００２において、カメラパス取得部９０１は、処理対象のフレームについての、仮想視点を示す仮想視点情報と、映像生成に関する上記の設定情報と、を含む制御情報を取得する。例えば、カメラパス取得部９０１は、データ処理装置１から取得した仮想カメラパスデータに含まれる、処理対象のフレームについての情報を取得することができる。設定情報については既に説明したとおりである。

　Ｓ１００３において、映像設定部９０２は、カメラパス取得部９０１から設定情報を取得し、設定情報に従う動作を行うように映像生成部９０４を設定する。Ｓ１００４において、映像生成部９０４は、カメラパス取得部９０１から仮想視点情報を取得する。Ｓ１００５において、データ管理部９０３は、映像生成部９０４の要求に従って被写体データを記憶装置４から取得する。

　Ｓ１００６において、映像生成部９０４は、処理対象のフレームについて、設定情報に従って、仮想視点情報が示す仮想視点からのフレーム画像を生成する。映像生成部９０４は、Ｓ１００３で指定された設定に従って、Ｓ１００５で取得した被写体データ及びＳ１００４で取得した仮想視点情報に基づいて仮想視点映像を生成することができる。設定情報に従う画像の生成方法については、既に説明したとおりである。Ｓ１００７において、映像出力部９０５は、Ｓ１００６で生成された仮想視点映像のフレーム画像を、ディスプレイ等の表示デバイスを介して出力する。映像出力部９０５は、仮想視点映像のフレーム画像をデータファイル又はパケットデータとして出力してもよい。

　以上の実施形態によれば、各フレームについて仮想視点を示す仮想視点情報と、各フレームについての映像生成に関する設定情報と、を含む制御情報に基づいて、仮想視点映像を生成することができる。このような設定情報を用いることにより、仮想視点映像の生成における制御の自由度が高まり、迫力のある仮想視点映像を出力することが容易になる。

　また、上記の仮想カメラパスデータのような制御情報には設定情報を記録することができるため、ユーザが制御情報を作成し、この制御情報に従う仮想視点映像を視聴した後で、仮想視点情報又は設定情報を修正することが容易になる。さらには、映像製作者が作成したこのような制御情報を被写体データとともに視聴者に送信することにより、視聴者は、制御情報に従う、映像製作者が推奨する仮想視点映像を見ることができる。一方で、視聴者は、制御情報に従う仮想視点映像を見るか、制御情報を用いずに所望の視点からの仮想視点映像を見るか、を選択することもできる。

　上記のデータ処理装置１及び映像生成装置９００等の各情報処理装置は、プロセッサとメモリとを備えるコンピュータにより実現することができる。もっとも、各情報処理装置が有する一部又は全部の機能が専用のハードウェアによって実現されてもよい。また、本開示の一実施形態に係る画像処理装置は、例えばネットワークを介して接続された複数の情報処理装置によって構成されていてもよい。

　図１１は、このようなコンピュータのハードウェアの構成例を示すブロック図である。ＣＰＵ１１０１は、ＲＡＭ１１０２又はＲＯＭ１１０３に格納されているコンピュータプログラム又はデータを用いてコンピュータ全体の制御を行うと共に、上記の実施形態に係る情報処理装置が行うものとして上述された各処理を実行する。すなわち、ＣＰＵ１１０１は、図１及び図９に示される各処理部として機能することができる。

　ＲＡＭ１１０２は、外部記憶装置１１０６からロードされたコンピュータプログラム又はデータ、及びＩ／Ｆ（インターフェース）１１０７を介して外部から取得したデータなどを一時的に記憶するためのエリアを有するメモリである。さらに、ＲＡＭ１１０２は、ＣＰＵ１１０１が各種の処理を実行する際に用いるワークエリアを有する。すなわち、ＲＡＭ１１０２は、例えば、フレームメモリその他の各種のエリアを提供することができる。

　ＲＯＭ１１０３は、コンピュータの設定データ又はブートプログラムなどが格納されているメモリである。操作部１１０４は、キーボード又はマウスなどの入力デバイスであり、コンピュータのユーザが操作することで、各種の指示をＣＰＵ１１０１に入力することができる。出力部１１０５は、ＣＰＵ１１０１による処理結果を出力する出力デバイスであり、例えば液晶ディスプレイなどの表示装置である。

　外部記憶装置１１０６は、ハードディスクドライブ装置のような大容量情報記憶装置である。外部記憶装置１１０６には、ＯＳ（オペレーティングシステム）、及び図１に示した各部の機能をＣＰＵ１１０１に実現させるためのコンピュータプログラムを保存することができる。また、外部記憶装置１１０６には、撮像装置２による撮像画像データ又は映像生成装置５が生成した仮想視点映像データなどが保存されていてもよい。

　外部記憶装置１１０６に保存されているコンピュータプログラム又はデータは、ＣＰＵ１１０１による制御に従って適宜ＲＡＭ１１０２にロードされ、ＣＰＵ１１０１による処理対象となる。Ｉ／Ｆ１１０７には、ＬＡＮ若しくはインターネット等のネットワーク、投影装置、又は表示装置などの他の機器を接続することができ、コンピュータはこのＩ／Ｆ１１０７を介して様々な情報を取得し及び送出することができる。１１０８は上述の各部を繋ぐバスである。

（その他の実施例）
　本開示の技術は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

　本開示は上記実施形態に制限されるものではなく、本開示の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本開示の範囲を公にするために請求項を添付する。

　本願は、２０２２年１月３１日提出の日本国特許出願特願２０２２－０１３５８２を基礎として優先権を主張するものであり、その記載内容の全てを、ここに援用する。

１０１：視点情報取得部、１０２：設定情報取得部、１０３：カメラパス生成部、１０４：カメラパス出力部、９０１：カメラパス取得部、９０２：映像設定部、９０３：データ管理部、９０４：映像生成部、９０５：映像出力部

Claims

　仮想視点映像のフレームにおける仮想視点を指定する情報を取得する視点取得手段と、
　複数の被写体のうち前記仮想視点映像の前記フレームに表示する被写体を指定する情報を取得する設定取得手段と、
　前記仮想視点映像の前記フレームについて前記仮想視点を特定するための仮想視点情報と、当該フレームにおいて表示される前記被写体を特定するための設定情報と、を含む制御情報を出力する出力手段と、
　を有することを特徴とする情報処理装置。
　前記設定情報は、複数の被写体のそれぞれについて表示するか否かを示す情報であることを特徴とする、請求項１に記載の情報処理装置。
　前記設定情報は、仮想視点映像の生成対象である三次元空間中の領域を示す情報であり、前記領域内に位置する被写体が表示されることを特徴とする、請求項１に記載の情報処理装置。
　仮想視点映像のフレームにおける仮想視点を指定するための情報を取得する視点取得手段と、
　被写体を複数の位置から撮像することによって得られる複数の撮像画像のうち、前記仮想視点映像の前記フレームにおいて前記被写体の色を決定するために用いる撮像画像を指定するための情報を取得する設定取得手段と、
　前記仮想視点映像の前記フレームについて前記仮想視点を特定するための仮想視点情報と、当該フレームにおいて前記被写体の色を決定するために用いる前記撮像画像を特定するための設定情報と、を含む制御情報を出力する出力手段と、
　を有することを特徴とする情報処理装置。
　前記仮想視点情報は、前記仮想視点の位置及び前記仮想視点からの視線方向を示す外部パラメータを含むことを特徴とする、請求項１から４のいずれか１項に記載の情報処理装置。
　前記仮想視点情報は、前記仮想視点の画角又は焦点距離を示す内部パラメータを含むことを特徴とする、請求項１から５のいずれか１項に記載の情報処理装置。
　前記出力手段は前記制御情報を仮想カメラパスデータとして出力し、前記仮想カメラパスデータには、フレームごとに、前記仮想視点情報と、前記設定情報と、が記録されていることを特徴とする、請求項１から６のいずれか１項に記載の情報処理装置。
　　前記出力手段は前記制御情報を仮想カメラパスデータとして出力し、前記仮想カメラパスデータには、複数のフレームに共通して適用される前記設定情報が記録されていることを特徴とする、請求項１から６のいずれか１項に記載の情報処理装置。
　前記仮想カメラパスデータは複数のデータブロックを含み、１つのデータブロックには１つのフレームについての前記仮想視点情報と前記設定情報とが含まれることを特徴とする、請求項７に記載の情報処理装置。
　前記仮想カメラパスデータは複数のデータブロックを含み、１つのデータブロックには各フレームについての前記仮想視点情報が含まれ、他の１つのデータブロックには各フレームについての前記設定情報が含まれることを特徴とする、請求項７又は８に記載の情報処理装置。
　前記出力手段は、前記仮想カメラパスデータをデータファイルとして出力し、又は前記仮想カメラパスデータを示す複数のパケットデータを順次出力することを特徴とする、請求項７から１０のいずれか１項に記載の情報処理装置。
　前記仮想視点情報及び前記設定情報に基づいて前記仮想視点映像を生成する生成手段と、
　生成された前記仮想視点映像を含み、ユーザによる前記仮想視点情報及び前記設定情報の少なくとも一方の指定を受け付けるユーザインタフェースを提示する提示手段と、
　をさらに有することを特徴とする請求項１から１１のいずれか１項に記載の情報処理装置。
　仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、当該フレームにおいて表示される被写体を特定するための設定情報と、を含む制御情報を取得する取得手段と、
　前記設定情報により特定される前記被写体を含み、前記仮想視点情報により特定される前記仮想視点に対応するフレーム画像を生成する生成手段と、
　を有することを特徴とする情報処理装置。
　仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、被写体を複数の位置から撮像することによって得られる複数の撮像画像のうち、当該フレームにおいて被写体の色を決定するために用いる撮像画像を特定するための設定情報と、を含む制御情報を取得する取得手段と、
　前記仮想視点映像の前記フレームについて、前記仮想視点情報により特定される前記仮想視点に対応して、前記被写体を含むフレーム画像を、前記設定情報により特定される撮像画像に基づいて生成する生成手段と、
　を有することを特徴とする情報処理装置。
　前記取得手段は、前記制御情報を示す仮想カメラパスデータを取得し、
　前記生成手段は、前記仮想カメラパスデータとは別に記憶装置に格納された前記被写体を表す被写体データを用いて前記仮想視点映像を生成することを特徴とする、請求項１３又は１４に記載の情報処理装置。
　情報処理装置が行う情報処理方法であって、
　仮想視点映像のフレームにおける仮想視点を指定する情報を取得する工程と、
　複数の被写体のうち前記仮想視点映像の前記フレームに表示する被写体を指定する情報を取得する工程と、
　前記仮想視点映像の前記フレームについて前記仮想視点を特定するための仮想視点情報と、当該フレームにおいて表示される前記被写体を特定するための設定情報と、を含む制御情報を出力する工程と、
　を有することを特徴とする情報処理方法。
　情報処理装置が行う情報処理方法であって、
　仮想視点映像のフレームにおける仮想視点を指定するための情報を取得する工程と、
　被写体を複数の位置から撮像することによって得られる複数の撮像画像のうち、前記仮想視点映像の前記フレームにおいて前記被写体の色を決定するために用いる撮像画像を指定するための情報を取得する工程と、
　前記仮想視点映像の前記フレームについて前記仮想視点を特定するための仮想視点情報と、当該フレームにおいて前記被写体の色を決定するために用いる前記撮像画像を特定するための設定情報と、を含む制御情報を出力する工程と、
　を有することを特徴とする情報処理方法。
　情報処理装置が行う情報処理方法であって、
　仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、当該フレームにおいて表示される被写体を特定するための設定情報と、を含む制御情報を取得する工程と、
　前記設定情報により特定される前記被写体を含み、前記仮想視点情報により特定される前記仮想視点に対応するフレーム画像を生成する工程と、
　を有することを特徴とする情報処理方法。
　情報処理装置が行う情報処理方法であって、
　仮想視点映像のフレームについて仮想視点を特定するための仮想視点情報と、被写体を複数の位置から撮像することによって得られる複数の撮像画像のうち、当該フレームにおいて被写体の色を決定するために用いる撮像画像を特定するための設定情報と、を含む制御情報を取得する工程と、
　前記仮想視点映像の前記フレームについて、前記仮想視点情報により特定される前記仮想視点に対応して、前記被写体を含むフレーム画像を、前記設定情報により特定される撮像画像に基づいて生成する工程と、
　を有することを特徴とする情報処理方法。
　仮想視点映像のフレームについて仮想視点を特定するための第１のデータと、
　前記仮想視点映像の前記フレームについて複数の被写体のうちの表示される被写体を特定するための第２のデータと、
　を含むデータ構造であって、
　仮想視点映像を生成する情報処理装置が、複数の被写体のうち前記第２のデータにより被写体を特定し、特定された被写体を含む、前記第１のデータにより特定された前記仮想視点に対応するフレーム画像を生成する処理において用いられる、データ構造。
　仮想視点映像のフレームについて仮想視点を特定するための第１のデータと、
　複数の位置から撮像することによって得られる複数の撮像画像のうち、前記仮想視点映像の前記フレームにおいて被写体の色を決定するために用いる撮像画像を特定するための第２のデータと、
　を含むデータ構造であって、
　仮想視点映像を生成する情報処理装置が、複数の撮像画像のうち、前記第２のデータにより撮像画像を特定し、特定された前記撮像画像に基づいて、前記第１のデータにより特定された前記仮想視点に対応するフレーム画像を生成する処理において用いられる、データ構造。
　コンピュータを、請求項１から１５のいずれか１項に記載の情報処理装置として機能させるためのプログラム。