JP2021026435A - 仮想視点映像を生成する装置、システム、方法、及びプログラム - Google Patents

仮想視点映像を生成する装置、システム、方法、及びプログラム Download PDF

Info

Publication number
JP2021026435A
JP2021026435A JP2019142915A JP2019142915A JP2021026435A JP 2021026435 A JP2021026435 A JP 2021026435A JP 2019142915 A JP2019142915 A JP 2019142915A JP 2019142915 A JP2019142915 A JP 2019142915A JP 2021026435 A JP2021026435 A JP 2021026435A
Authority
JP
Japan
Prior art keywords
image
movement path
gaze
virtual viewpoint
gaze region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019142915A
Other languages
English (en)
Inventor
町井 律雄
Ritsuo Machii
律雄 町井
嵯峨 吉博
Yoshihiro Saga
吉博 嵯峨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019142915A priority Critical patent/JP2021026435A/ja
Publication of JP2021026435A publication Critical patent/JP2021026435A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】複数の注視領域を設定する場合に、仮想視点映像の生成時間の増加を抑えること。【解決手段】本発明の一実施形態では、少数の撮像画像の撮像画像を用いて簡易3次元モデルを生成し、該簡易3次元モデルに基づいて、ユーザは仮想カメラパスを決定する。そして、注視領域における仮想カメラパスの開始時刻と終了時刻とに従い、多数の撮像装置の撮像画像を用いて、これら時刻間の高精度3次元モデルを、注視領域毎に生成する。そして、この高精度3次元モデルに基づいて、仮想視点画像を生成する。【選択図】図4

Description

本発明は、被写体を複数の方向から撮影した画像と仮想視点情報とに基づいて、仮想視点映像を生成する技術に関する。
昨今、複数の撮像装置を異なる位置に設置して多視点から被写体を撮像し、当該撮像により得られた複数視点画像を用いて仮想視点画像や3次元モデルを生成する技術が注目されている。このような複数視点画像に基づいて仮想視点画像を生成する技術によれば、例えば、サッカーやバスケットボールのハイライトシーンを様々な角度から視聴することが出来るため、通常の画像と比較してユーザに高臨場感を与えることが出来る。
仮想視点画像を生成する方法として、特許文献1は、簡易3次元モデルを使って仮想視点の移動経路を決定し、高精度な3次元モデルを使って、決定した仮想視点の移動経路に対応させて仮想視点映像を生成する方法を開示している。
特開2018−073105号公報
しかしながら、特許文献1では、複数の撮像装置の一部が所定の注視領域を撮像し、複数の撮像装置の他の一部が、別の注視領域を撮像するような構成については考慮されていない。複数(n(2以上の整数)とする)の注視領域を設定する場合、撮像装置の台数がn倍に増大し、画像処理に必要な時間も増大してしまう。
そこで本開示は、上記の課題に鑑みて、複数の注視領域を設定する場合に、仮想視点映像の生成時間の増加を抑えることを目的とする。
本発明の一実施形態は、第1の注視領域を撮像する複数の撮像装置のうち、第1の数の撮像装置の撮像画像に基づき、該第1の注視領域における3次元形状データを生成し、第2の注視領域を撮像する複数の撮像装置のうち、第2の数の撮像装置の撮像画像に基づき、該第2の注視領域における3次元形状データを生成する第1の生成手段と、前記第1の生成手段により生成された3次元形状データに基づいて指定された仮想視点の移動経路に関する情報を取得する取得手段と、前記取得手段により取得された移動経路に、前記第1の注視領域に対応する第1の移動経路と、前記第2の注視領域に対応する第2の移動経路が含まれる場合、前記第1の移動経路に応じて、前記第1の注視領域を撮像する前記複数の撮像装置のうち、前記第1の数より大きい数の撮像装置の撮像画像に基づき、該第1の注視領域における3次元形状データを生成し、前記第2の移動経路に応じて、前記第2の注視領域を撮像する前記複数の撮像装置のうち、前記第2の数より大きい数の撮像装置の撮像画像に基づき、該第2の注視領域における3次元形状データを生成する第2の生成手段と、前記第2の生成手段により生成される3次元形状データに基づき、仮想視点映像を生成する第3の生成手段と、を有することを特徴とする装置である。
本開示によれば、複数の注視領域を設定する場合に、仮想視点映像の生成時間の増加を抑えることができる。
第1の実施形態における多視点画像生成システムの概略図。 第1の実施形態における仮想視点映像の生成システムの機能構成を示すブロック図。 第1の実施形態における画像処理装置のハードウェア構成を示すブロック図。 第1の実施形態における仮想視点映像を生成する処理のフローチャート。 第1の実施形態の適用例を説明するための図。
以下、添付図面を参照し、本開示の好適な実施形態について説明する。尚、以下に説明する実施形態は、本開示を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施形態の一つである。
尚、本開示における仮想視点画像は、仮想的な視点から被写体を撮影した場合に得られる画像である。言い換えると、仮想視点画像は、指定された仮想的な視点における見えを表す画像である。仮想的な視点(所謂、仮想視点) は、ユーザにより指定されても良いし、画像解析の結果等に基づいて自動的に設定されても良い。すなわち仮想視点画像には、ユーザが任意に指定した視点に対応する任意視点画像(所謂、自由視点画像)が含まれる。また、複数の候補からユーザが指定した視点に対応する画像や、装置が自動で設定した視点に対応する画像も、仮想視点画像に含まれる。仮想視点映像は、複数の仮想視点画像から成る。
[第1の実施形態]
本実施形態では、最小限の撮像装置(以降カメラとする)で簡易3次元モデル(3次元形状データ)を生成し、該生成した3次元モデルを用いて仮想カメラパスを決定する。仮想カメラパスとは、仮想視点の位置、注視点、および画角を時間軸に沿って設定した仮想視点の経路である。仮想カメラパスを決定した後、仮想カメラパスを用いて映像生成に必要となるカメラグループを時間毎に判定し、カメラグループ毎の開始時間と終了時間とを求める。そして、開始時間と終了時間とに従って、映像データの読み出し、現像、高精度3次元モデル生成、及び仮想視点映像のレンダリングを行う。
<多視点画像生成システムの構成>
以下、本実施形態における多視点画像生成システムの構成について、このシステムをサッカースタジアムに適用した例を挙げて、図1を用いて説明する。
図1において、符号A1〜A60、符号B1〜B60はそれぞれカメラを示す。また、符号A1Ca〜A60Ca、符号B1Ca〜B60Caはそれぞれ、カメラに接続されたカメラアダプタを示す。カメラアダプタA1CaはカメラA1に対応し、他のカメラアダプタも同様にカメラに対応付けられている。
カメラA1〜A15(図示せず)、カメラA16〜A30(図示せず)、カメラA31〜A45(図示せず)、カメラA46〜A60は、注視点Aを中心とする撮影対象領域(注視領域RAとする)を撮影するためのカメラである。これらのカメラは形状推定に主に用いる標準カメラであり、これらのカメラから成るグループを、カメラグループGAと呼ぶ。カメラグループGAに属する60台のカメラそれぞれに対し、注視点Aを中心とする撮影対象領域を撮影できるように、撮影点、撮影方向、画角が設定されている。
カメラB1〜B15(図示せず)、カメラB16〜B30(図示せず)、カメラB31〜B45(図示せず)、カメラB46〜B60は、注視点Bを中心とする撮影対象領域(注視領域RBとする)を撮影するためのカメラである。これらのカメラは形状推定に主に用いる標準カメラであり、これらのカメラから成るグループを、カメラグループGBと呼ぶ。カメラグループGBに属する60台のカメラそれぞれに対し、注視点Bを中心とする撮影対象領域を撮影できるように、撮影点、撮影方向、画角が設定されている。
図1に示すように、カメラを接続するデイジーチェーン5は1系統に接続されていて、カメラグループGAおよびカメラグループGBはそれぞれ、サッカーコート半分をカバーするように設置される。具体的には、カメラグループGAに属するカメラが注視点Aを中心とする撮影対象領域(注視領域RA)を撮影するように設置され、カメラグループGBに属するカメラが注視点Bを中心とする撮影対象領域(注視領域RB)を撮影するように設置される。
尚、図1に示す形態はあくまでも一例であり、本実施形態はこれに限定されない。例えば、形状推定に主に用いるカメラグループに属するカメラと、このカメラグループとは異なる形状推定に主に用いるカメラグループに属するカメラとの間に、レンダリングに主に用いる望遠カメラを配置してもよい。図1のケースで説明すると、カメラA1とカメラB1との間に、レンダリングに主に用いる望遠カメラが配置され、以降のカメラ間においても同様に、望遠カメラが配置される。この60台の望遠カメラのそれぞれに対して、注視点Aを中心とする撮影対象領域(注視領域RA)、及び、注視点Bを中心とする撮影対象領域(注視領域RB)を撮影できるように、撮影点、撮影方向、画角が設定されている。
<仮想視点映像を生成するシステムの構成>
以下、図1に示すシステムで生成した多視点画像を用いて、仮想視点映像を生成するシステムの構成について、図2を用いて説明する。図2は、本実施形態における仮想視点映像の生成システム1(以下、単純にシステム1と記載する)の機能構成を示すブロック図である。
図2に示すように、システム1は、画像処理装置100と、カメラ群2と、表示装置3と、入力装置4とを有する。画像処理装置100は具体的には、サーバーやホストPC、タブレットPCなどの情報処理装置である。カメラ群2は、本例では、図1に示すカメラA1〜A60、及び、カメラB1〜B60である。表示装置3には、生成された仮想視点画像、仮想視点映像などが表示され、一般的に液晶ディスプレイが用いられる。尚、図2は、画像処理装置100と表示装置3と入力装置4とが個別に設けられたケースを示すが、これらが一体的に設けられていてもよい。
本実施形態の画像処理装置100は、次の処理を実行する。画像処理装置100は、カメラ台数を限定して第1の3次元モデルを生成し、この3次元モデルを用いて仮想カメラパスを決定する。その後、画像処理装置100は、決定した仮想カメラパスを用いて映像生成に必要となるカメラグループを時間毎に判定し、カメラグループ毎の開始時間と終了時間とを求める。そして、画像処理装置100は、求めた開始時間と終了時間とに従って、映像データの読み出し、現像、高精度3次元モデル生成、及び仮想視点映像レンダリングを行う。
画像処理装置100は、カメラ群2で撮影した画像と、カメラ群2の各カメラのパラメータとを取得し、該取得した画像とパラメータとに基づき、仮想視点画像を生成する。そして、画像処理装置100は、生成した仮想視点画像を表示装置3に出力する。表示装置3は、例えば液晶ディスプレイやLED等で構成され、画像処理装置100が出力した仮想視点画像を表示したり、ユーザが指示を入力するためのGUI(Graphical User Interface)を表示したりする。入力装置4は、仮想視点映像または仮想視点画像の生成、表示の指示を、ユーザが入力するためのユーザインターフェースであり、マウス、ジョイスティック等を含む。また、ユーザは、入力装置4を用いて、仮想視点情報を入力できる。
画像処理装置100は、カメラ情報取得部160と、仮想視点情報取得部110と、3次元モデル生成部120と、レンダリング処理部170と、出力部130と、カメラ選定部140と、記憶部150とを有する。カメラ情報取得部160は、カメラ群2の各カメラで撮影された画像、並びに、カメラ群2の各カメラの外部パラメータ及び内部パラメータを取得し、記憶部150に送信する。記憶部150において、カメラ情報取得部160により送信された、カメラ群2の各カメラで撮影された画像、並びに、カメラ群2の各カメラの外部パラメータ及び内部パラメータが記憶される。
仮想視点情報取得部110は、ユーザが表示装置3上に表示されるGUIを介し入力装置4を用いて入力した仮想視点情報を取得し、該取得した仮想視点情報を記憶部150に送信する。記憶部150において、仮想視点情報取得部110により送信された仮想視点情報が記憶される。
3次元モデル生成部120は、カメラ選定部140によって出力された情報に基づいて、簡易な3次元モデルなどの3次元モデルを生成する。レンダリング処理部170は、3次元モデル生成部120により生成された簡易な3次元モデルと、仮想視点情報とに基づいて、仮想視点からの前景の見えを表す簡易な前景画像を生成し、出力部130に送信する。以下、レンダリング処理部170によって生成される、仮想視点からの前景の見えを表す簡易な前景画像を「第1の前景画像」と呼ぶ。
出力部130は、仮想視点画像である第1の前景画像を表示装置3に出力する。ユーザは表示装置3に表示された第1の前景画像を見ながら入力装置4を操作することで、仮想カメラパスを決定する。
仮想カメラパスが決定された場合、仮想視点情報取得部110は、該決定された仮想カメラパスに対応するタイムコードを記憶部150に送信する。タイムコードとは、映像や音声の再生時など同期が必要な場面で用いられ、映像データ1フレームごとに与えられ、映像データ上に記録される時間情報である。記憶部150において、仮想視点情報取得部110により送信されたタイムコードが記憶される。
3次元モデル生成部120は、ユーザにより決定され、記憶部150から読み取った仮想カメラパスに対応するタイムコードに基づいて、カメラグループ毎に高精度3次元モデルを生成する。尚、ここで言う「決定された仮想カメラパス」とは、注視点(注視領域)ごとの、仮想視点の始点位置と終点位置との間の経路を示すカメラパスである。
レンダリング処理部170は、3次元モデル生成部120によって生成された高精度3次元モデルと仮想カメラパスとに基づいて、仮想視点からの前景の見えを表す高品質な前景画像を生成し、出力部130に送信する。以下、レンダリング処理部170によって生成される、仮想視点からの前景の見えを表す高品質な前景画像を「第2の前景画像」と呼ぶ。仮想視点画像である第2の前景画像は、カメラグループの全カメラの撮影データを使用して生成しているために、高品質な画像である。
<画像処理装置の構成>
以下、図2に示す画像処理装置100のハードウェア構成について、図3を用いて説明する。図3に示すように、画像処理装置100は、CPU311、ROM312、RAM313、補助記憶装置314、通信I/F315、及びバス316を有する。
CPU311は、ROM312やRAM313に格納されているコンピュータプログラムやデータを用いて画像処理装置100全体を制御することで、図2に示す画像処理装置100の各機能を実現する。尚、画像処理装置100がCPU311とは異なる1又は複数の専用のハードウェアを有し、CPU311による処理の少なくとも一部をその専用のハードウェアが実行してもよい。専用のハードウェアの例としては、ASIC(特定用途向け集積回路)、フィールドプログラマブルゲートアレイ、およびDSP(デジタルシグナルプロセッサ)等がある。ROM312には、変更を必要としないプログラムなどが格納される。RAM313には、補助記憶装置314から供給されるプログラムやデータ、及び通信I/F315を介して外部から供給されるデータなどが一時的に記憶される。補助記憶装置314は、例えばハードディスクドライブ等であり、画像データや音声データなどの種々のデータが記憶される。ROM312、RAM313、及び補助記憶装置314は、図2の記憶部150に相当する。
通信I/F315は、画像処理装置100と、画像処理装置100の外部装置との間の通信に用いられる。例えば、画像処理装置100が外部装置と有線で接続される場合には、通信用のケーブルが通信I/F315に接続される。または、画像処理装置100が外部装置と無線通信する機能を有する場合には、通信I/F315はアンテナを備える。バス316は、画像処理装置100の構成要素を接続し、構成要素間の情報伝達を可能とする。
尚、前述したように、図2に示した表示装置3と入力装置4とのうち少なくとも一方が画像処理装置100内部に表示部または操作部として存在していてもよい。いずれにせよ、CPU311が、表示部または表示装置を制御する表示制御部として機能し、操作部または入力装置を制御する操作(入力)制御部として機能する。
<仮想視点映像を生成する処理>
以下、本実施形態における仮想視点映像の生成処理について、図4を用いて説明する。図4に示す一連の処理のうち、ステップS4010とステップS4020とは、簡易3次元モデルを生成するために必要なカメラを選定する処理である。ステップS4030〜ステップS4050は、簡易3次元モデルを生成する処理である。ステップS4060とステップS4070とは、簡易な3次元モデルに基づいて生成された第1の仮想視点画像である簡易な前景画像を用いて、仮想カメラパスを決定する処理である。ステップS4080〜ステップS4120は、第2の仮想視点画像である非ライブ用の(高品質な)画像を生成する処理である。以下、各ステップについて詳しく説明する。尚、以下では「ステップS〜」を「S〜」と単純に記載する。
尚、図4に示す一連の処理が開始する前提として、カメラ情報取得部160は、カメラ情報として、各カメラの画像、外部パラメータ、及び内部パラメータを取得し、該取得した情報が記憶部150に記憶されているものとする。外部パラメータは、カメラの位置、姿勢などを示す情報であり、内部パラメータは、カメラの焦点距離、画像中心などを示す情報である。
S4010では、カメラ選定部140は、簡易3次元モデルを生成するために必要な最小限のカメラを、第1のカメラグループに属するカメラの中から選定する。本ステップは、後段のS4060〜S4070で仮想カメラパスを決定するために行う前段処理である。本例では、注視点Aを中心に円周状に配置され、主に形状推定に用いられるカメラから成るカメラグループGAに属するカメラの中から4台のカメラを選定する。
簡易3次元モデルを生成するために必要な最小限のカメラの選定方法として、注視点を基準として90°ごとに1台のカメラを選定する方法を採用することができる。図1の例を用いて具体的に説明すると、注視点Aを中心として円周状に配置されるカメラグループGAのカメラのうち、90°ずれた位置に配されたカメラA1、A16、A31、A46を選定する。
S4020は、S4010と同様の処理である。S4020では、カメラ選定部140は、簡易3次元モデルを生成するために必要な最小限のカメラを、第2のカメラグループに属するカメラの中から選定する。本ステップもS4010と同様、後段のS4060〜S4070で仮想カメラパスを決定するために行う前段処理である。本例では、注視点Bを中心に円周状に配置され、主に形状推定に用いられるカメラから成るカメラグループGBに属するカメラの中から4台のカメラを選定する。図1の例を用いて具体的に説明すると、注視点Bを中心として円周状に配置されるカメラグループGBのカメラのうち、90°ずれた位置に配されたカメラB1、B16、B31、B46を選定する。
S4030では、CPU311は、S4010、S4020で選定されたカメラの視点から撮影された画像に基づいて生成され、記憶部150に記憶されている前景画像のデータを、記憶部150から読み取る。尚、本ステップで取得する前景画像のデータは、RAW画像データである。
S4040では、CPU311は、S4030で取得したRAW画像データをビットマップ画像に変換する現像処理を行なう。
S4050では、3次元モデル生成部120は、S4010、S4020で選定されたカメラの視点から撮影された前景画像に基づき、例えばステレオカメラの原理を用いて、注視点Aと注視点Bとのそれぞれに対応する簡易3次元モデルを生成する。
S4060では、CPU311は、ユーザによる仮想カメラパスの指定指示、即ち、S4050で生成された簡易3次元モデルに基づき生成された複数の仮想視点候補の中から、仮想カメラパスを最終的に決定するために必要な仮想視点を指定する指示を受け付ける。具体的には、ユーザは、ジョイスティック等の入力装置4を操作することで、試合中のあるシーンにおいて、S4050で生成された3次元モデルに基づく複数の仮想視点候補の中から希望の仮想視点を選択する。
ここで、仮想視点の指定について、図5を用いて説明する。図5は、サッカースタジアムで開催されたサッカーの試合について、ユーザが選択したシーン例を示す。図5において、右向きの矢印は、時間軸であり、図中の左から右に向けて時間が進行する。また、a:b:cと、d:e:fと、g:h:iとは、時間情報としてのタイムコード(具体的には、時:分:秒)であり、それぞれ特定の時刻を示す。さらに、図5中の時間軸の下に、時間帯によって変わる、仮想視点が存在する領域を示している。
本例における仮想カメラパスを決定するシーンは、図5に示すように、Aチームの攻撃から、Bチームの選手がボールを奪取して一気にカウンターを行ない、Bチームの別の選手がシュートするところまでのシーンである。このシーンに対して仮想視点が注視する領域について見ると、時間の経過とともに、注視領域RAから注視領域RBに切り替わっていくことが分かる。従って、本例ではまず、ユーザは、Aチームの攻撃の特定の1シーン(具体的には、タイムコードa:b:cのシーン)において、複数の仮想視点候補の中から、希望の仮想視点を選択することとなる。
ユーザによるAチームの攻撃シーン1フレームにおける仮想視点の選択が終わった場合、仮想視点情報取得部110は、該ユーザにより入力された仮想視点情報を、記憶部150に出力する。仮想視点情報とは、仮想視点の外部パラメータと内部パラメータである。前述のカメラ情報と同様、外部パラメータは、仮想視点の位置の情報、仮想視点の姿勢の情報(具体的には、回転行列)などを含み、内部パラメータは、焦点距離の情報、画像中心の情報などを含む。仮想視点画像、即ち仮想視点映像の1フレームを生成するために、仮想視点情報が1つ定義される。各仮想カメラパスに対応するシーンのスクリプトや試合の経過時間、シーンの前後指定時間、及びプレーヤ情報等のメタ情報も仮想視点情報と合わせて、画像処理装置100に入力し、記憶部150にて記憶することができる。
次に、仮想視点情報取得部110は、S4060で指定された仮想視点に対応する時間情報としてのタイムコードを、記憶部150に記憶する。
尚、ここでは、入力装置4を介して、仮想視点に関する情報を入力する形態を示したが、仮想視点に関する情報が、画像処理装置100の外部装置(例えばPC等)から送信される形態であってもよい。
S4070では、3次元モデル生成部120は、仮想カメラパスが決定されたか、言い換えると、仮想カメラパスの決定に必要な仮想視点の指定が完了したか判定する。本ステップの判定結果が真の場合、S4080に進む。一方、本ステップの判定結果が偽の場合、S4060に戻って、S4050で生成された簡易3次元モデルに基づく簡易前景画像がレンダリングされる。ユーザは、この簡易前景画像を用いて、後続の仮想視点を選択的に指定する。
図5の例の場合、Bチームの選手がシュートしたところまでのシーンにおける仮想視点の指定が完了するまで、S4070でNOと判定されS4060に戻り、ユーザによる仮想視点の指定が行われる。仮想視点の指定が行われている間は、前述したように、仮想視点情報取得部110は、指定された仮想視点に対応する仮想視点情報、タイムコードを取得し、これらの情報を記憶部150に記憶する。Bチームの選手がシュートしたところまでのシーンにおける仮想視点の指定が完了した場合、S4080に進むことになる。
S4080では、3次元モデル生成部120は、時間情報として、注視領域RAを担当するカメラグループAに対する仮想カメラパスの開始時刻を示すタイムコードと終了時刻を示すタイムコードとを、記憶部150から読み取る。
S4090では、3次元モデル生成部120は、時間情報として、注視領域RBを担当するカメラグループBに対する仮想カメラパスの開始時刻を示すタイムコードと終了時刻を示すタイムコードとを、記憶部150から読み取る。尚、ここでは時間情報としてタイムコードを利用する形態を示しているが、利用可能な時間情報はこれに限られず、任意の時間情報を利用してよい。
S4100では、3次元モデル生成部120は、S4080で読み取った注視領域RAにおける仮想カメラパスの開始時刻を示すタイムコードと終了時刻を示すタイムコードとに基づき、カメラグループGAのカメラによるこれらの時刻間の撮影画像を取得する。そして、3次元モデル生成部120は、取得した撮影画像に基づいて、高精度3次元モデルを生成する。このように、注視領域RAにおける仮想カメラパスの開始時刻と終了時刻との間の期間について、カメラグループGAのカメラのみを用いて3次元モデルを生成している。つまり、注視領域RAにおける仮想カメラパスの開始時刻と終了時刻との間の期間について、カメラグループGBのカメラの撮影画像を用いた注視領域RBにおける高精度3次元モデルの生成を行わない。従って、注視点が1つから2つに増えたような場合であっても、この期間における注視領域RBにおける高精度3次元モデルを生成する処理を行わない分、処理時間を短縮できる。
S4100では、カメラ選定部140は、注視領域RAにおける高精度3次元モデルを生成するために必要なカメラとして、カメラグループGAに属する全部(本例では60台)のカメラを選定する。
S4100では、3次元モデル生成部120は、注視領域RAにおける仮想カメラパスの開始時刻に対応した、第1のカメラグループの全カメラ(本例では、カメラグループGAに属する60台のカメラ)による前景画像を記憶部150から読み取る。そして、3次元モデル生成部120は、読み取った前景画像に基づき、例えばステレオカメラの原理を用いることで、第1のカメラグループの全カメラによる高精度3次元モデルを生成する。このような処理が、注視領域RAにおける仮想カメラパスの終了時刻に対応した高精度3次元モデルを生成するまで繰り返し行われる。
尚、ここでは、第1のカメラグループの全カメラの撮像画像に基づいて高精度3次元モデルを生成する形態を示したが、必ずしも第1のカメラグループの全てのカメラを用いる必要はない。S4100で用いるカメラの台数が、S4010で用いるカメラの台数より多ければ、簡易3次元モデルよりも高精度な3次元モデルを生成できるため、そのような形態に対しても本実施形態を適用可能である。
また、S4100で注視領域RAにおける高精度3次元モデルを生成しなくても良い場合がある。詳しく説明すると、カメラグループAに対する仮想カメラパスの開始時刻と終了時刻とが設定されていないような場合、換言すると、注視領域RAに仮想カメラパスが含まれない場合は、S4100の処理を実行せずにすむ。
S4110では、3次元モデル生成部120は、S4090で読み取った注視領域RBにおける仮想カメラパスの開始時刻を示すタイムコードと終了時刻を示すタイムコードとに基づき、カメラグループGBのカメラによるこれらの時刻間の撮影画像を取得する。そして、3次元モデル生成部120は、取得した撮影画像に基づいて、高精度3次元モデルを生成する。このように、注視領域RBにおける仮想カメラパスの開始時刻と終了時刻との間の期間について、カメラグループGBのカメラのみを用いて3次元モデルを生成している。つまり、注視領域RBにおける仮想カメラパスの開始時刻と終了時刻との間の期間について、カメラグループGAのカメラの撮影画像を用いた注視領域RAにおける高精度3次元モデルの生成を行わない。従って、注視点が1つから2つに増えたような場合であっても、この期間における注視領域RAにおける高精度3次元モデルを生成する処理を行わない分、処理時間を短縮できる。
S4110では、カメラ選定部140は、注視領域RBにおける高精度3次元モデルを生成するために必要なカメラとして、カメラグループGBに属する全部(本例では60台)のカメラを選定する。尚、S4110の以降の処理は、S4100と同様なので説明を省略する。
尚、ここでは、第2のカメラグループの全カメラの撮像画像に基づいて高精度3次元モデルを生成する形態を示したが、必ずしも第2のカメラグループの全てのカメラを用いる必要はない。S4110で用いるカメラの台数が、S4020で用いるカメラの台数より多ければ、簡易3次元モデルよりも高精度な3次元モデルを生成できるため、そのような形態に対しても本実施形態を適用可能である。
また、S4110で注視領域RBにおける高精度3次元モデルを生成しなくても良い場合がある。詳しく説明すると、カメラグループBに対する仮想カメラパスの開始時刻と終了時刻とが設定されていないような場合、換言すると、注視領域RBに仮想カメラパスが含まれない場合は、S4110の処理を実行せずにすむ。
S4120では、レンダリング処理部170は、生成したテクスチャ付き背景メッシュモデルを仮想視点から見た視野にトリミングし、そこにS4100またはS4200で生成した高精度3次元モデルに基づく前景画像を合成する。これにより、仮想視点の全景画像が生成される。最終的には、レンダリング処理部170は、レンダリングされた仮想視点の全景画像を統合し、仮想視点映像を生成する。
<本実施形態の効果など>
本実施形態では、少数のカメラの撮影画像を用いて簡易3次元モデルを生成し、該簡易3次元モデルに基づいて、第1の仮想視点画像である簡易な前景画像を生成する。この簡易な前景画像を利用して、ユーザは仮想カメラパスを決定する。そして、注視領域における仮想カメラパスの開始時刻と終了時刻に従い、多数のカメラの撮影画像を用いて、これら時刻間の高精度3次元モデルを、注視領域(注視点)毎に生成する。そして、この高精度3次元モデルに基づいて、第2の仮想視点画像である高品質な前景画像を生成する。最終的には、この高品質な前景画像を用いて仮想視点映像を生成する。このように、本実施形態では、注視領域毎に必要な期間だけ高精度3次元モデルを生成している。
従って、本実施形態によれば、注視領域が増加するような場合であっても、不必要な高精度3次元モデルを生成する処理を行わない分、仮想視点映像の品質低下を防ぎつつ、処理時間の増加を抑制できる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 画像処理装置
110 仮想視点情報取得部
120 3次元モデル生成部
170 レンダリング処理部
2 カメラ群

Claims (11)

  1. 第1の注視領域を撮像する複数の撮像装置のうち、第1の数の撮像装置の撮像画像に基づき、該第1の注視領域における3次元形状データを生成し、第2の注視領域を撮像する複数の撮像装置のうち、第2の数の撮像装置の撮像画像に基づき、該第2の注視領域における3次元形状データを生成する第1の生成手段と、
    前記第1の生成手段により生成された3次元形状データに基づいて指定された仮想視点の移動経路に関する情報を取得する取得手段と、
    前記取得手段により取得された移動経路に、前記第1の注視領域に対応する第1の移動経路と、前記第2の注視領域に対応する第2の移動経路が含まれる場合、前記第1の移動経路に応じて、前記第1の注視領域を撮像する前記複数の撮像装置のうち、前記第1の数より大きい数の撮像装置の撮像画像に基づき、該第1の注視領域における3次元形状データを生成し、前記第2の移動経路に応じて、前記第2の注視領域を撮像する前記複数の撮像装置のうち、前記第2の数より大きい数の撮像装置の撮像画像に基づき、該第2の注視領域における3次元形状データを生成する第2の生成手段と、
    前記第2の生成手段により生成される3次元形状データに基づき、仮想視点映像を生成する第3の生成手段と、
    を有することを特徴とする装置。
  2. 前記仮想視点の移動経路をユーザに指定させるためのユーザインターフェースを更に有することを特徴とする請求項1に記載の装置。
  3. 前記情報は、前記装置の外部から送られることを特徴とする請求項1または2に記載の装置。
  4. 前記取得手段は、
    前記第1の移動経路における始点と終点それぞれに対応する時刻を含む第1の情報と、
    前記第2の移動経路における始点と終点それぞれに対応する時刻を含む第2の情報と、
    を取得することを特徴とする請求項1乃至3の何れか1項に記載の装置。
  5. 前記第2の生成手段は、
    前記第1の注視領域を撮像する前記複数の撮像装置のうち、前記第1の数より大きい数の撮像装置の撮像画像であって、前記第1の情報で示される前記第1の移動経路における始点と終点それぞれに対応する時刻の間の撮影画像に基づき、該第1の注視領域における3次元形状データを生成し、
    前記第2の注視領域を撮像する前記複数の撮像装置のうち、前記第2の数より大きい数の撮像装置の撮影画像であって、前記第2の情報で示される前記第2の移動経路における始点と終点それぞれに対応する時刻の間の撮影画像に基づき、該第2の注視領域における3次元形状データを生成する
    ことを特徴とする請求項4に記載の装置。
  6. 前記第1の注視領域を撮像する前記複数の撮像装置の中から、前記第1の数の撮像装置を選定する選定手段と、
    前記第2の注視領域を撮像する前記複数の撮像装置の中から、前記第2の数の撮像装置を選定する選定手段と、
    を更に有することを特徴とする請求項1乃至5の何れか1項に記載の装置。
  7. 前記第2の生成手段は、前記取得手段により取得された移動経路に前記第2の移動経路が含まれない場合、前記第2の注視領域を撮像する前記複数の撮像装置のうち、前記第2の数より大きい数の撮像装置の撮像画像に基づく該第2の注視領域における3次元形状データを生成しない
    ことを特徴とする請求項1乃至6の何れか1項に記載の装置。
  8. 請求項1乃至7の何れか1項に記載の装置と、
    前記第1の注視領域を撮像する前記複数の撮像装置と、
    前記第2の注視領域を撮像する前記複数の撮像装置と、
    を有することを特徴とするシステム。
  9. 前記第1の注視領域を撮像する前記複数の撮像装置と、前記第2の注視領域を撮像する前記複数の撮像装置とはそれぞれ、互いに異なる注視点に対応することを特徴とする請求項8に記載のシステム。
  10. 第1の注視領域を撮像する複数の撮像装置のうち、第1の数の撮像装置の撮像画像に基づき、該第1の注視領域における3次元形状データを生成し、第2の注視領域を撮像する複数の撮像装置のうち、第2の数の撮像装置の撮像画像に基づき、該第2の注視領域における3次元形状データを生成する第1の生成ステップと、
    前記第1の生成ステップにより生成された3次元形状データに基づいて指定された仮想視点の移動経路に関する情報を取得する取得ステップと、
    前記取得ステップにより取得された移動経路に、前記第1の注視領域に対応する第1の移動経路と、前記第2の注視領域に対応する第2の移動経路が含まれる場合、前記第1の移動経路に応じて、前記第1の注視領域を撮像する前記複数の撮像装置のうち、前記第1の数より大きい数の撮像装置の撮像画像に基づき、該第1の注視領域における3次元形状データを生成し、前記第2の移動経路に応じて、前記第2の注視領域を撮像する前記複数の撮像装置のうち、前記第2の数より大きい数の撮像装置の撮像画像に基づき、該第2の注視領域における3次元形状データを生成する第2の生成ステップと、
    前記第2の生成ステップにより生成される3次元形状データに基づき、仮想視点映像を生成する第3の生成ステップと、
    を有することを特徴とする方法。
  11. コンピュータに請求項10に記載の方法を実行させるためのプログラム。
JP2019142915A 2019-08-02 2019-08-02 仮想視点映像を生成する装置、システム、方法、及びプログラム Pending JP2021026435A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019142915A JP2021026435A (ja) 2019-08-02 2019-08-02 仮想視点映像を生成する装置、システム、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019142915A JP2021026435A (ja) 2019-08-02 2019-08-02 仮想視点映像を生成する装置、システム、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2021026435A true JP2021026435A (ja) 2021-02-22

Family

ID=74663886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019142915A Pending JP2021026435A (ja) 2019-08-02 2019-08-02 仮想視点映像を生成する装置、システム、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2021026435A (ja)

Similar Documents

Publication Publication Date Title
US11445167B2 (en) Display control apparatus, display control method, and storage medium
JP7301507B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN112311965B (zh) 虚拟拍摄方法、装置、系统及存储介质
CN109691084A (zh) 信息处理装置和方法以及程序
JP2019125929A (ja) 画像処理装置、画像処理方法、及びプログラム
KR101997991B1 (ko) 시점 변환을 이용하는 영상 결합 방법 및 시스템
KR20190027323A (ko) 정보 처리장치, 정보 처리방법, 및 프로그램
JP2020086983A (ja) 画像処理装置、画像処理方法、及びプログラム
JP7027049B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP7446754B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6812181B2 (ja) 画像処理装置、画像処理方法、及び、プログラム
WO2016015544A1 (zh) 运动物体的轨迹的拍摄方法及装置
JP2015026880A (ja) 撮像装置
JP2011035638A (ja) 仮想現実空間映像制作システム
JP7423251B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2021026435A (ja) 仮想視点映像を生成する装置、システム、方法、及びプログラム
JP2020135290A (ja) 画像生成装置、画像生成方法、画像生成システム、及びプログラム
CN115686295A (zh) 图像处理设备、图像处理方法和存储介质
JP2015198340A (ja) 画像処理装置およびその制御方法、並びにプログラム
EP2940989A1 (en) Method and apparatus for generating composite image in electronic device
WO2018235762A1 (ja) 表示制御装置、表示制御方法、およびプログラム
JP2021029035A (ja) システム、制御装置、撮影装置、それらの動作方法およびプログラム
JP2019047502A (ja) 情報処理装置、情報処理方法、及びプログラム
WO2022230718A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2019118042A (ja) 画像処理装置、画像処理方法及びプログラム