JP2022039374A - 画像処理装置、画像処理システム、画像処理方法、およびプログラム - Google Patents
画像処理装置、画像処理システム、画像処理方法、およびプログラム Download PDFInfo
- Publication number
- JP2022039374A JP2022039374A JP2020144364A JP2020144364A JP2022039374A JP 2022039374 A JP2022039374 A JP 2022039374A JP 2020144364 A JP2020144364 A JP 2020144364A JP 2020144364 A JP2020144364 A JP 2020144364A JP 2022039374 A JP2022039374 A JP 2022039374A
- Authority
- JP
- Japan
- Prior art keywords
- image
- generation
- generation target
- data
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Generation (AREA)
Abstract
【課題】三次元形状データに係る処理負荷を抑制する。【解決手段】三次元モデル生成装置200は、複数の撮像装置によって複数の異なる方向から撮像することに基づくオブジェクトを表すオブジェクト画像を取得し、前記オブジェクトに関連する所定のデータ量に基づき、三次元形状データが生成される対象とする生成対象空間を決定し、決定された生成対象空間に含まれるオブジェクトの三次元形状データを、オブジェクト画像に基づいて生成する。【選択図】図3
Description
本開示は、撮像画像に基づくデータの生成に関する。
撮像空間の周囲に配置された複数の撮像装置が撮像することによって得られた複数の撮像画像に基づいて、撮像画像に含まれるオブジェクトの三次元形状データを生成する方法がある。三次元形状データでは、ボクセルと呼ばれる直方体によってオブジェクトの三次元形状が表される。
特許文献1には、撮像画像を用いた処理の演算量を抑制する方法として、特定オブジェクト以外のオブジェクトに対する画像処理を行う場合、特定のオブジェクトに対して画像処理を行う場合よりも、少ない撮像画像を用いて処理する方法が記載されている。
三次元形状データのボクセル数が増加すると、レンダリング処理等の三次元形状データに係る処理負荷が増加することがある。
本開示の技術は、三次元形状データに係る処理負荷を抑制することを目的とする。
本開示の技術に係る画像処理装置は、複数の撮像装置によってオブジェクトを複数の異なる方向から撮像することに基づく前記オブジェクトを表すオブジェクト画像を取得する取得手段と、前記オブジェクトに関連する所定のデータ量に基づき、三次元形状データが生成される対象とする生成対象空間を決定する決定手段と、前記決定手段により決定された前記生成対象空間に含まれるオブジェクトの三次元形状データを、前記取得手段により取得された前記オブジェクト画像に基づいて生成する生成手段と、を有することを特徴とする。
本開示の技術によれば、三次元形状データに係る処理負荷を抑制することができる。
以下、添付の図面を参照して、実施形態に基づいて本開示の技術の詳細を説明する。なお、以下の実施形態で示す構成は一例に過ぎず、本開示の技術は図示された構成に限定されるものではない。
また、以下の実施形態では、参照符号において番号の後ろに付与したアルファベットのみが異なる用語については、同一機能を持つ装置の別インスタンスを示すものとする。
<実施形態1>
仮想視点画像を生成する処理では、所定の三次元空間内のオブジェクトの三次元モデルが生成される。本実施形態では、この三次元モデルを生成するための三次元空間のサイズを小さく設定することで、三次元形状データに係る処理負荷を抑制する方法を説明する。
仮想視点画像を生成する処理では、所定の三次元空間内のオブジェクトの三次元モデルが生成される。本実施形態では、この三次元モデルを生成するための三次元空間のサイズを小さく設定することで、三次元形状データに係る処理負荷を抑制する方法を説明する。
[システム構成]
図1は、仮想視点画像を生成する画像処理システム100の一例を示す図である。複数の撮像装置を異なる位置に設置することにより複数の視点で同期して撮像し、その撮像により得られた複数の画像を用いて、実際の撮像装置からの視点によらない仮想視点から見た画像を生成する方法がある。当該方法によって生成された、仮想視点から見た画像を仮想視点画像とよぶ。仮想視点画像によれば、ユーザは、サッカー等の競技のハイライトシーンを様々な角度から視聴閲覧することができるため、通常の撮像画像と比較してユーザに高臨場感を与えることができる。なお、仮想視点画像は、動画であっても、静止画であってもよい。以下の実施形態では、仮想視点画像は動画であるものとして説明を行う。
図1は、仮想視点画像を生成する画像処理システム100の一例を示す図である。複数の撮像装置を異なる位置に設置することにより複数の視点で同期して撮像し、その撮像により得られた複数の画像を用いて、実際の撮像装置からの視点によらない仮想視点から見た画像を生成する方法がある。当該方法によって生成された、仮想視点から見た画像を仮想視点画像とよぶ。仮想視点画像によれば、ユーザは、サッカー等の競技のハイライトシーンを様々な角度から視聴閲覧することができるため、通常の撮像画像と比較してユーザに高臨場感を与えることができる。なお、仮想視点画像は、動画であっても、静止画であってもよい。以下の実施形態では、仮想視点画像は動画であるものとして説明を行う。
画像処理システム100は、撮像装置101a~d、それぞれの撮像装置101a~dに接続された前景抽出装置102a~d、三次元モデル生成装置200、ストレージ装置300、レンダリング装置400、および仮想視点パス生成装置500を有する。
撮像装置101a~dは、画像(動画)を撮像するデジタルビデオカメラなどの装置である。撮像装置101a~dは、複数方向から撮像環境内に存在するオブジェクトを様々な角度で撮像して、前景抽出装置102a~dへ撮像画像の画像データを出力する。図1では、撮像装置101a~dが4台配置されている例を示しているが、画像処理システム100における撮像装置の台数は4台に限定されない。配置される撮像装置の数は何台でもよい。また、撮像装置101a~dは画像だけではなく音声その他のセンサ情報をキャプチャリングする装置でもよい。また、特に断りがない限り撮像装置101a~dのことを総じて撮像装置101と記載する。
前景抽出装置102a~dは、夫々の撮像装置101a~dに対応する画像処理装置である。前景抽出装置102a~dには撮像装置101が撮像した結果得られた撮像画像が入力され、前景抽出装置102a~dは入力された撮像画像に対して画像処理を行う。前景抽出装置102a~dが行う画像処理は、入力された画像から撮像画像に含まれるオブジェクトのシルエットを示す前景領域を抽出する処理が含まれる。そして撮像画像に含まれる前景領域と非前景領域とを二値で示したシルエット画像を生成する。また、前景のテクスチャ画像を生成する。前景のシルエット画像とテクスチャ画像とをオブジェクト画像または前景データと呼ぶ。
撮像画像に前景として表されるオブジェクトは、仮想視点の任意の角度から見ることを可能とする被写体であり、例えば、競技場のフィールド上に存在する人物のことを指す。または、オブジェクトは、ボール、またはゴール等、画像パターンが予め定められている物体であってもよい。また、オブジェクトは動体であってもよいし、静止体であってもよい。どのようなオブジェクトを前景として抽出すべきかについては、ユーザ等が予め指定することができる。
撮像画像から前景を抽出する方法としては、背景差分情報を用いる方法がある。この方法は、例えば、オブジェクトが存在しない撮像環境の状態を、背景画像として予め撮像して保持しておく。そして、撮像画像と背景画像との画素値の差分値が閾値より大きい領域を前景と判定する方法である。なお、前景を抽出する方法は背景差分情報を用いる方法に限られない。他にも、前景を抽出する方法として、視差を用いる方法、特徴量を用いる方法、または機械学習を用いる方法などが用いられてもよい。生成された前景データは三次元モデル生成装置200へ出力される。
なお、図1では4台の前景抽出装置102a~dを配置している例を示しているが、前景抽出装置の台数は4台に限定されない。配置される前景抽出装置の台数は何台でもよい。また、特に断りがない限り前景抽出装置102a~dのことを総じて前景抽出装置102と記載する。また本実施形態では、前景抽出装置102と撮像装置101は異なる装置であるが、一体型の装置でもよいし、機能ごとに異なる装置によって実現されてもよい。
三次元モデル生成装置200は、PCやワークステーション、サーバなどのコンピュータなどで実現される画像処理装置である。三次元モデル生成装置200は、それぞれ異なる視野範囲を撮像した結果得られた撮像画像から生成された前景データを、前景抽出装置102a~dから取得する。そして前景データに基づきオブジェクトの三次元形状データを生成する。三次元形状データにおいてボクセルで表されるオブジェクトの三次元形状を、オブジェクト(前景)の三次元モデルとも呼ぶ。生成された三次元モデルは三次元空間上のボクセルの集合である点群フォーマットとして出力される。
ストレージ装置300は、PCやワークステーション、サーバなどのコンピュータによって実現される装置である。ストレージ装置300は、三次元モデル生成装置200が生成する点群フォーマットデータおよび前景抽出装置102が生成する前景データを記憶する装置である。ストレージ装置300におけるデータを記憶するための記憶部は揮発性メモリ、不揮発性メモリ、ハードディスク、またはSSDのいずれで実現されてもよい。なお、本実施形態では、ストレージ装置300の記憶部で三次元モデル生成装置200から出力されるデータを記憶するものとして説明する。他にも、三次元モデル生成装置200はレンダリング装置400にデータを直接出力してもよい。この場合、画像処理システム100は、ストレージ装置300を有しない構成でもよい。
レンダリング装置400は、PCやワークステーション、サーバなどのコンピュータなによって実現される画像処理装置である。ストレージ装置300に記憶されている点群フォーマットデータ、前景データ、および後述する仮想視点パス生成装置500が生成する仮想視点パスに基づき仮想視点画像を生成する。
仮想視点パス生成装置500は、PCやワークステーション、サーバなどのコンピュータなどによって実現される装置である。仮想視点パス生成装置500は、仮想視点画像を生成するための仮想的なカメラからの視点である仮想視点の情報(仮想視点パス情報)を作成する装置であり、生成した仮想視点の情報をレンダリング装置400に出力する。
三次元モデル生成装置200、前景抽出装置102、ストレージ装置300、レンダリング装置400、仮想視点パス生成装置500はLANネットワークを介して接続されている。本実施形態のネットワークトポロジはデイジーチェーン接続であるものとして説明するが、ネットワークトポロジはデイジーチェーン接続に限定されるものではない。Hubなどの中継装置を介したスター、バス、メッシュ型接続でもよい。また装置間の接続はLANネットワークだけではなく、他の有線接続や、無線LAN、公衆無線、インターネットを介してもよい。また、画像伝送用のインターフェースであるSDI(Serial Digital Interface)やDVI(Digital Visual Interface)等でもよい。
[ハードウエア構成]
図2は三次元モデル生成装置200のハードウエア構成を示す図である。なお、前景抽出装置102、レンダリング装置400、仮想視点パス生成装置500のハードウエア構成も、以下で説明する三次元モデル生成装置200の構成と同様である。
図2は三次元モデル生成装置200のハードウエア構成を示す図である。なお、前景抽出装置102、レンダリング装置400、仮想視点パス生成装置500のハードウエア構成も、以下で説明する三次元モデル生成装置200の構成と同様である。
三次元モデル生成装置200は、CPU211、ROM212、RAM213、補助記憶装置214、表示部215、操作部216、通信I/F217、及びバス218を有する。
CPU211は、ROM212やRAM213に格納されているコンピュータプログラムやデータを用いて三次元モデル生成装置200の全体を制御することで、図3に示すそれぞれの装置の各機能を実現する。なお、三次元モデル生成装置200はCPU211とは異なる1又は複数の専用のハードウエアを有し、CPU211による処理の少なくとも一部を専用のハードウエアが実行してもよい。専用のハードウエアの例としては、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、およびDSP(デジタルシグナルプロセッサ)などがある。
ROM212は、変更を必要としないプログラムなどを格納する。RAM213は、補助記憶装置214から供給されるプログラムやデータ、及び通信I/F217を介して外部から供給されるデータなどを一時記憶する。補助記憶装置214は、例えばハードディスクドライブ等で構成され、画像データや音声データなどの種々のデータを記憶する。
表示部215は、例えば液晶ディスプレイやLED等で構成され、ユーザが三次元モデル生成装置200を操作するためのGUI(Graphical User Interface)などを表示する。操作部216は、例えばキーボードやマウス、ジョイスティック、タッチパネル等で構成され、ユーザによる操作を受けて各種の指示をCPU211に入力する。CPU211は、表示部215を制御する表示制御部、及び操作部216を制御する操作制御部として動作する。本実施形態では表示部215と操作部216とは三次元モデル生成装置200の内部に存在するものとして説明するが、表示部215と操作部216との少なくとも一方が三次元モデル生成装置200の外部の別の装置として存在していてもよい。
通信I/F217は、三次元モデル生成装置200の外部の装置との通信に用いられる。例えば、三次元モデル生成装置200が外部の装置と有線で接続される場合には、通信用のケーブルが通信I/F217に接続される。三次元モデル生成装置200が外部の装置と無線通信する機能を有する場合には、通信I/F217はアンテナを備える。バス218は、三次元モデル生成装置200の各部をつないで情報を伝達する。
[機能構成]
図3は、三次元モデル生成装置200、ストレージ装置300、レンダリング装置400の機能構成を示すブロック図である。図3を用いて画像処理システム100を構成する各装置の機能について説明する。
図3は、三次元モデル生成装置200、ストレージ装置300、レンダリング装置400の機能構成を示すブロック図である。図3を用いて画像処理システム100を構成する各装置の機能について説明する。
三次元モデル生成装置200は、前景データ取得部201、読出し部202、生成対象空間決定部203、三次元モデル生成部204、およびカメラパラメータ設定部205を有する。
前景データ取得部201は、複数の前景抽出装置102から撮像装置の前景データを夫々取得する。なお、本実施形態では1台の三次元モデル生成装置200で複数の前景抽出装置102からの前景データを取得するものとして説明するが、前景データを取得する装置は1台に限られない。複数の三次元モデル生成装置200がネットワーク上に配置されている場合は、複数の三次元モデル生成装置200で前景データを取得してもよい。
読出し部202は、後述する生成対象空間決定部203から指示された前景データを前景データ取得部201から読み出して、後述する三次元モデル生成部204に提供する。なお、複数の三次元モデル生成装置200で前景データを取得する場合、読出し部202は、複数の前景データ取得部201から前景データの取得を行う。なお、三次元モデルの生成には全ての前景抽出装置102の前景データを使用することも考えられるが、本実施形態では、三次元モデルの生成のために使用される前景データが三次元モデル生成部204によって選択される。
生成対象空間決定部203は、三次元モデル生成部204にて三次元モデルを生成する対象の三次元空間である生成対象空間を決定する。生成対象空間を決定する方法については後述する。
三次元モデル生成部204は、カメラパラメータ設定部205から出力されたカメラパラメータと、読出し部202から出力された前景データとを用いてオブジェクトの三次元モデルを生成する。本実施形態では三次元モデルの生成方法としてVisualHullを用いるものとして説明する。VisualHullの説明は後述する。
三次元モデル生成部204は、生成した三次元モデルの情報を、点群フォーマットでストレージ装置300に記憶する。また、読出し部202から出力された前景データのうち、作成された三次元モデルから仮想視点画像を生成するために使用する前景データをストレージ装置300に記憶する。複数の三次元モデル生成部204を有する形態においては、それぞれの三次元モデル生成部204は、三次元モデル生成部204毎の異なるストレージ装置にデータを記憶する。
カメラパラメータ設定部205は、複数の撮像装置101の情報をカメラパラメータとして設定し、三次元モデル生成部204に出力する。カメラパラメータには、各々の撮像装置101の世界座標上の三次元位置、姿勢(撮像装置の向き)、焦点距離、主点(撮像画像上の中心)が含まれる。なお、カメラパラメータは、例えば、撮像装置の位置を校正するための校正パターンを予め撮像し、校正パターンを基準として定義される三次元座標と二次元の撮像部座標との座標変換を行うことにより測定および算出される。
レンダリング装置400は、レンダリング部401、出力部402、および仮想視点パス取得部403を有する。
仮想視点パス取得部403は、仮想視点パス生成装置500から出力された仮想視点パス情報を取得し、その結果をレンダリング部401に通知する。仮想視点パス情報には、ユーザが望む仮想のカメラからの視点(仮想視点)の位置、画角、移動スピードなどのデータが含まれる。仮想視点パス情報はカメラパラメータと同様の形式で生成される。
レンダリング部401は、ストレージ装置300に記憶された点群フォーマットおよび前景データと、仮想視点パス取得部403から出力された仮想視点パス情報とを取得する。そして点群フォーマットおよび前景データと、仮想視点パス情報とに従い、仮想視点画像をレンダリングする処理を行う。具体的には、取得した点群フォーマットが示す三次元モデルに対して着色し、仮想視点パス情報に基づく仮想視点からの2次元座標に射影した状態をレンダリング結果として出力する。
出力部402は、レンダリング部401によって生成されたレンダリング結果を画像形式に変換して出力する。出力する画像形式はDVIとするが、画像形式は問わない。DVIの他に、SDIや動画ファイルをネットワーク上にストリーミング出力してもよい。
上述した各機能部は、夫々の装置のCPUが所定のプログラムを実行することにより実現されるが、これに限られるものではない。他にも例えば、演算を高速化するためのGPU(Graphics Processing Unit)、または、FPGA(Field Programmable Gate Array)などのハードウエアが利用されてもよい。各機能部は、ソフトウエアと専用ICなどのハードウエアとの協働で実現されてもよいし、一部またはすべての機能がハードウエアのみで実現されてもよい。
ストレージ装置300は、記憶部301を有する。記憶部301は、三次元モデル生成部204が生成した点群フォーマットと前景データ取得部201が取得した前景データとを関連付けて記憶する機能を有する。
なお、図3の各部の機能は、上記で説明した各装置において実現されるものとして説明するが、各部の機能が実現される装置は限定されない。例えば、三次元モデル生成装置200が、上記に示した機能の全てを有している形態でもよい。または、三次元モデル生成装置200またはレンダリング装置400が記憶部301を有していてもよく、その場合、ストレージ装置300を介さないで、三次元モデル生成装置200とレンダリング装置400とが接続されていてもよい。
[三次元形状データの生成方法について]
図4は、VisualHullの基本原理を示す図である。図4を用いて三次元モデル生成に用いられるVisualHullの概要を説明する。図4(a)は、あるオブジェクトである対象物体Cを撮像装置により撮像したときの図である。前述したように、対象物体Cを撮像して得られる撮像画像と背景画像との色または輝度の差分に基づき二値化することで対象物体Cの二次元シルエット(前景領域)が含まれるシルエット画像が得られる。
図4は、VisualHullの基本原理を示す図である。図4を用いて三次元モデル生成に用いられるVisualHullの概要を説明する。図4(a)は、あるオブジェクトである対象物体Cを撮像装置により撮像したときの図である。前述したように、対象物体Cを撮像して得られる撮像画像と背景画像との色または輝度の差分に基づき二値化することで対象物体Cの二次元シルエット(前景領域)が含まれるシルエット画像が得られる。
図4(b)は、撮像装置の投影中心(Pa)から二次元シルエットDaの輪郭上の各点を通すように、三次元空間中に広がる錐体を示す図である。この錐体のことを当該撮像装置による視体積Vaと呼ぶ。図4(c)は複数の視体積によりオブジェクトの三次元モデルが求まる様子を示す図である。図4(c)のように、位置が異なる複数の異なる撮像装置によって同期して撮像された画像に基づく二次元シルエットDaから撮像装置ごとの複数の視体積を求める。VisualHullによる三次元モデルの生成では、複数の撮像装置の視体積の交差(共通領域)を求めることによって、対象物体の三次元モデルが生成される。生成される三次元モデルはボクセルの集合で表される。
VisualHullによる演算アルゴリズムとして、例えば、VIM(Volume intersection method)、およびSCM(Space carving method)がある。本実施形態では三次元モデル生成部204はSCMを使用するものとして説明する。
図5は、三次元モデル生成部204による三次元モデルの生成の概要を説明するための図である。図5(a)は、ボクセルを示す図であり、図に示すようにボクセルは微小な立方体のことである。図5(b)に示すように、三次元モデルを生成するための生成対象空間をボクセルで敷き詰める。SCMでは、生成対象空間の個々のボクセルを各々の撮像装置101の平面に逆投影した時、全ての撮像装置101の前景領域の内部に逆投影されるボクセルは前景として残し、それ以外は削除するシルエット内外判定処理が行われる。
より具体的には、シルエット内外判定処理では、三次元空間に敷き詰められたボクセルのうち、処理対象のボクセルの位置を示す世界座標を撮像装置101a~dのそれぞれの撮像部座標に射影変換する。撮像部座標とは、撮像装置101から撮像した画像上の座標を指す。世界座標を撮像部座標に変換するための射影変換の行列値はカメラパラメータから決定される。
次に、射影変換によって求められた撮像部座標が、シルエット画像の前景領域内の座標か否かを判定する。射影変換によって求められた撮像部座標が前景領域内の座標である場合、その撮像装置のシルエット内フラグが「1」と設定される。他方、射影変換によって求められた撮像部座標がシルエット画像の前景領域の外の座標である場合、その撮像装置のシルエット内フラグは「0」と設定される。
処理対象のボクセルに対して、使用すべき全ての前景についてシルエット内外判定処理を終えると、撮像装置101の台数分のシルエット内フラグを総合的に判断して、処理対象のボクセルを「残す」か、または「削る」か、を決定する。
本実施形態では、撮像装置101の台数分の全てのシルエット内フラグが「1」と設定された処理対象のボクセルは「残す」と決定される。つまり、いずれかの撮像装置のシルエット内フラグが「0」と設定されている処理対象のボクセルは「削る」と決定される。なお、この判定のアルゴリズムはあくまで一例であり、種々のアルゴリズムを採用できる。例えば、「残す」か「削る」判断するためのアルゴリズムは、シルエット内フラグの決め方において撮像部座標外の射影結果をどう扱うかとも関連する。また、処理対象の前景について得られたシルエット内フラグのうち、「1」であるシルエット内フラグの数がある閾値以上であった場合に「残す」と決定されるようにしてもよい。
このように、シルエット画像の前景領域に収まらなかったボクセルを削ることで、図5(c)に示す四角錐の対象物体の三次元モデルが、図5(d)に示すようにボクセルによって生成される。生成された三次元モデルを構成する各ボクセルの位置に対応したテクスチャ画像の画素値をボクセルに付与することで三次元空間上に色の付いたオブジェクトの三次元形状を構成することができる。
[最大三次元空間について]
図6は、三次元モデル生成装置200の三次元モデル生成部204が三次元モデルを生成する対象とする三次元空間について説明するための図である。スタジアム600は撮像装置101が設置される撮像環境である。スタジアム600は撮像環境の一例であり、撮像環境はイベント会場やスタジオなどでもよい。三次元モデル生成部204は、生成対象空間である三次元空間に含まれるオブジェクトの三次元モデルを生成する。つまり、三次元モデル生成部204が三次元モデルを生成する対象となるオブジェクトは、生成対象空間に含まれるオブジェクトである。
図6は、三次元モデル生成装置200の三次元モデル生成部204が三次元モデルを生成する対象とする三次元空間について説明するための図である。スタジアム600は撮像装置101が設置される撮像環境である。スタジアム600は撮像環境の一例であり、撮像環境はイベント会場やスタジオなどでもよい。三次元モデル生成部204は、生成対象空間である三次元空間に含まれるオブジェクトの三次元モデルを生成する。つまり、三次元モデル生成部204が三次元モデルを生成する対象となるオブジェクトは、生成対象空間に含まれるオブジェクトである。
最大三次元空間601は、三次元モデル生成装置200が前景データに基づき三次元モデルを生成することが可能な最大の生成対象空間である。最大三次元空間601は、三次元モデルの生成の対象となる人物やボール等のオブジェクトが入りうるスタジアム内の空間として定義している。この空間を世界座標として、縦、横、高さの3つの配列(縦,横,高さ)で表現する。
世界座標とは、ある三次元空間において基準となる原点を定め、それぞれの三次元空間上での位置をその原点からの座標で表すための共通の座標である。本実施形態ではあらかじめ処理対象となる三次元空間上の座標は世界座標に変換してあるものとする。図6(a)では世界座標601aが原点(0,0,0)として定められている。
図6では、最大三次元空間601の大きさは、世界座標601a~hで示すように、横が100、縦が50、高さが10である。図6では最大三次元空間601は直方体であるが、直方体に限定するわけではなく、最大三次元空間601の形状は任意の形状でよい。また、本実施形態では三次元空間のサイズを整数で表示しているが、整数に限定するわけではなく、小数点を含んだ値でもよいし、負の値で表現してもよい。
三次元モデルを生成するための生成対象空間が大きいと、生成対象空間に含まれるオブジェクトの数も多くなることがある。このため生成される三次元モデルの数が多くなるため、三次元モデルを構成するボクセル数も多くなる。ボクセル数が多くなるとレンダリング処理等の三次元形状データに係る処理負荷が増加することがある。さらに三次元モデルを構成するボクセル数が多くなるとデータサイズが大きくなる。例えば、動画の仮想視点画像を生成する場合、三次元モデル生成部204は、撮像装置101が生成する時間的に連続する一連のフレームに対応する三次元モデルが生成される。このため、三次元モデルのデータである点群フォーマットが周期的に記憶部301へ書き込まれることになる。点群フォーマットのデータサイズが大きくなると、記憶部301の書込み性能を超えるデータが生成されることがあり、その場合に書込み処理が遅延し、書き込みが正常にできない虞がある。
また、三次元形状データを生成するための演算量は、概ね生成対象空間に敷き詰められた総ボクセル数に比例する。生成対象空間が大きいと、生成対象空間に敷き詰められるボクセル数が多くなるため三次元形状データを生成する負荷が増す虞がある。このため、三次元空間に敷き詰めるボクセルのサイズを大きくすることでボクセル数を少なくすることが考えられるが、ボクセルサイズが大きくなると三次元モデルの精細度が低下してしまう。
[生成対象空間決定部によって決定される生成対象空間について]
そこで、本実施形態では、三次元モデルの生成対象空間を、最大三次元空間より小さい空間になるように決定する。このため、三次元形状データに係る演算量を抑制することができる。
そこで、本実施形態では、三次元モデルの生成対象空間を、最大三次元空間より小さい空間になるように決定する。このため、三次元形状データに係る演算量を抑制することができる。
生成対象空間決定部203は、例えば、オブジェクトに関連する所定のデータ量が、設定されている値を超えた場合、生成対象空間を最大三次元空間よりも小さい空間になるように決定する。本実施形態では、生成対象空間決定部203は、前景抽出装置102から出力された前景データに係るデータ量を算出し、データ量が所定の値を超えた場合、生成対象空間を最大三次元空間よりも小さい空間になるように決定するものとして説明する。算出される前景データに係るデータ量は、シルエット画像に含まれる前景領域内のピクセル数(画素数)の総和でもよいし、前景領域を内包する矩形のサイズの総和でもよい。
所定のデータ量が設定された値を超えた場合、例えば、最大三次元空間のサイズを示す縦、横、高さの何れか1個以上の成分の長さが10%だけ短い長さの空間となるように生成対象空間を決定する。最大三次元空間が図6の最大三次元空間601である場合、横の長さは100であり、最大三次元空間の横の長さを表す世界座標の横成分の値は0から100である。最大三次元空間601から横の長さを10%だけ短い長さの空間となるように生成対象空間を決定する場合、(100-0)×0.1=10より、横の長さは10だけ短くする必要がある。このため、生成対象空間の横の長さを表す世界座標の横成分の値は、例えば、5から95となるように、生成対象空間を決定する。
生成対象空間のサイズを決定する方法は、縦、横、高かさのサイズを一律に短くする方法の他、所定のデータ量に応じたサイズに生成対象空間になるようにしてもよい。例えば、所定のデータ量が大きくなるほど、生成対象空間のサイズが小さくなるように、生成対象空間が決定されてもよい。
生成対象空間のサイズを決定する方法は、他にも、最大三次元空間に含まれる重要性の低いような空間を削除することにより生成対象空間の位置とサイズを決定してもよい。
図7は、生成対象空間決定部203によって、決定された生成対象空間を示す図である。図7は、生成される仮想視点画像がサッカーのPKシーンの画像である場合に、生成対象空間決定部203が決定した生成対象空間701の例を示す図である。PKシーンでは、ゴール前の以外の空間は視聴者の注目度が低いため、ゴール前の以外の空間に含まれるオブジェクトの重要性は低い。このため、図7の生成対象空間701は、ゴール前の空間に含まれるオブジェクトの三次元モデルが生成されるように決定されている。このように、生成される仮想視点画像に応じて三次元モデルの生成対象空間を適切な空間に決定することで、仮想視点画像の品質の低下を抑制しつつ、三次元モデルに関わる処理負荷を抑制することができる。
図7では、生成対象空間決定部203が決定した生成対象空間701の位置は、世界座標に基づく座標として表現されており、生成対象空間701の原点を示す世界座標701aは(60,10,0)である。生成対象空間701の大きさは、世界座標701a~hで示す通り、横が100-60=40、縦が40-10=30、高さが10-0=10である。なお、生成対象空間701の原点は最大三次元空間601の世界座標ではなく、原点を(0,0,0)として表してもよい。
次に、生成対象空間のサイズおよび位置を決定する方法の例について、説明する。
(仮想視点パス情報に基づく生成対象空間)
生成対象空間決定部203にて生成された仮想視点パス情報に基づき、仮想視点画像を生成するために必要な撮像空間及び周辺エリアを生成対象空間として決定してもよい。
生成対象空間決定部203にて生成された仮想視点パス情報に基づき、仮想視点画像を生成するために必要な撮像空間及び周辺エリアを生成対象空間として決定してもよい。
例えば、仮想視点パス情報に基づき導出された仮想視点画像の中心を含む空間を生成対象空間と決定する。仮想視点画像の中心を世界座標で表すと(20,20,0)である場合、生成対象空間の横の長さを表す世界座標の横成分は10から30、生成対象空間の縦の長さを表す世界座標の横成分は10から30とする。そして、生成対象空間の高さを表す世界座標の横成分は0から30とする空間を生成対象空間と決定してもよい。または、仮想視点の中心から一律空間を広げるのではなく、仮想視点の進行方向に応じて中心から広げる空間を変更してもよい。
複数の仮想視点に係る仮想視点パス情報を取得した場合は、複数の仮想視点のそれぞれの中心を包含する空間を生成対象空間としてもよい。または、それぞれの仮想視点の中心を包含する複数の空間を生成対象空間としてもよい。また、生成対象空間の最大体積または決定される生成対象空間の最大数を設定しておき、複数の仮想視点パス情報を取得した場合、仮想視点パス情報に設定された優先度に基づき、生成対象空間を決定してもよい。
(特定のオブジェクトに基づく生成対象空間)
生成対象空間決定部203は、球技におけるボール、特定人物などの特定のオブジェクトをトラッキングして、特定のオブジェクトを含む周辺の空間を生成対象空間として決定してもよい。例えば、仮想視点パス情報から生成対象空間を決定する場合と同様に、特定のオブジェクトを中心とした空間を生成対象空間として決定する。複数のオブジェクトが特定のオブジェクトとして設定された場合は、複数の特定のオブジェクトを包含する空間を生成対象空間としてもよい。または、それぞれの特定のオブジェクトを包含する複数の空間を生成対象空間としてもよい。
生成対象空間決定部203は、球技におけるボール、特定人物などの特定のオブジェクトをトラッキングして、特定のオブジェクトを含む周辺の空間を生成対象空間として決定してもよい。例えば、仮想視点パス情報から生成対象空間を決定する場合と同様に、特定のオブジェクトを中心とした空間を生成対象空間として決定する。複数のオブジェクトが特定のオブジェクトとして設定された場合は、複数の特定のオブジェクトを包含する空間を生成対象空間としてもよい。または、それぞれの特定のオブジェクトを包含する複数の空間を生成対象空間としてもよい。
(注目エリアに基づく生成対象空間)
生成対象空間決定部203は、視聴者の注目度の高い注目エリアが含まれる空間を生成対象空間として決定してもよい。例えば、生成対象空間決定部203は、撮像対象がサッカー等のスポーツ競技である場合、プレーエリアを取得し、プレーエリアが含まれる空間を生成対象空間として決定する。生成対象空間決定部203は、撮像画像からフィールドに引かれたラインなどの情報に基づきプレーエリアを特定する機能を有していてもよい。例えば、撮像対象がサッカーの試合の場合、仮想視点画像の生成対象シーンが、キックオフや、ペナルティーキックなどのシーンであるかを特定する。プレーエリアが推定できるシーンの場合は、そのプレーエリアを中心とする空間を生成対象空間として決定してもよい。チームスポーツの場合、特定のチームが攻め込むエリアを生成対象空間としてもよい。
生成対象空間決定部203は、視聴者の注目度の高い注目エリアが含まれる空間を生成対象空間として決定してもよい。例えば、生成対象空間決定部203は、撮像対象がサッカー等のスポーツ競技である場合、プレーエリアを取得し、プレーエリアが含まれる空間を生成対象空間として決定する。生成対象空間決定部203は、撮像画像からフィールドに引かれたラインなどの情報に基づきプレーエリアを特定する機能を有していてもよい。例えば、撮像対象がサッカーの試合の場合、仮想視点画像の生成対象シーンが、キックオフや、ペナルティーキックなどのシーンであるかを特定する。プレーエリアが推定できるシーンの場合は、そのプレーエリアを中心とする空間を生成対象空間として決定してもよい。チームスポーツの場合、特定のチームが攻め込むエリアを生成対象空間としてもよい。
上記のいずれかの方法で生成対象空間を決定した結果、複数の生成対象空間が決定された場合、複数の生成対象空間のうち、位置が近いまたは空間が重なる2つ以上の生成対象空間については、生成対象空間を結合して新たな生成対象空間として決定してもよい。この場合、物理的に遠い生成対象空間が他の生成対象空間と異なる生成対象空間となる。また、複数の生成対象空間が決定された場合、三次元モデル生成部204は、複数の生成対象空間ごとに三次元モデルの生成を行い、生成された三次元モデルの情報を複数のストレージ装置300の記憶部301に記憶してもよい。
なお、上記の方法は、所定のデータ量が設定された値を超えていない場合であっても、生成対象空間を決定するための方法として用いられてもよい。
また、決定された複数の生成対象空間にはそれぞれ優先度を付与してもよい。三次元モデルのデータ量の上限値を設定してもよい。その場合、設定された優先度の順番で生成対象空間を選択してオブジェクトの三次元モデルを生成し、生成された順に三次元モデルをストレージ装置300に記憶することで、三次元モデルのデータ量の上限を超えないようにしてもよい。生成対象空間の優先度は、例えば、複数の仮想視点パス情報を受け取った場合、仮想視点パス情報ごとに設定された優先度に基づき、優先度を設定してもよい。
生成対象空間を最大三次元空間より小さい空間とするか判定するための情報は前景データに係るデータ量に限られない。最大三次元空間を生成対象空間とした場合に生成される三次元モデルのデータ量を推定し、推定される三次元モデルのデータ量が所定のデータ量を超える場合、三次元モデルの生成対象空間を最大三次元空間より小さい空間に決定してもよい。
また、複数の三次元モデル生成部204を有する形態である場合、生成対象空間決定部203は、複数の三次元モデル生成部204毎の生成対象空間を決定してもよい。
[三次元モデルの生成処理フロー]
図8は、生成対象空間内のオブジェクトの三次元モデルを生成する本実施形態の処理の一例を説明するためのフローチャートである。図8のフローチャートで示される一連の処理は、三次元モデル生成装置200のCPUがROMに記憶されているプログラムコードをRAMに展開し実行することにより行われる。また、図8におけるステップの一部または全部の機能をASICや電子回路等のハードウエアで実現してもよい。なお、各処理の説明における記号「S」は、当該フローチャートにおけるステップであることを意味する。
図8は、生成対象空間内のオブジェクトの三次元モデルを生成する本実施形態の処理の一例を説明するためのフローチャートである。図8のフローチャートで示される一連の処理は、三次元モデル生成装置200のCPUがROMに記憶されているプログラムコードをRAMに展開し実行することにより行われる。また、図8におけるステップの一部または全部の機能をASICや電子回路等のハードウエアで実現してもよい。なお、各処理の説明における記号「S」は、当該フローチャートにおけるステップであることを意味する。
S801において生成対象空間決定部203は、前景データを解析し、前景データに係るデータ量が所定の値を超えているか判定する。前景データに係るデータ量が所定の値を超えていない場合(S801がNO)、S802において生成対象空間決定部203は、最大三次元空間を、三次元モデルを生成する生成対象空間として決定する。
前景データに係るデータ量が所定の値を超えている場合(S801がYES)、S803において生成対象空間決定部203は、最大三次元空間より小さい空間を、三次元モデルを生成する生成対象空間として決定する。
S804において三次元モデル生成部204は、生成対象空間決定部203から取得した生成対象空間の情報に基づき、生成対象空間以外の三次元空間にボクセルが敷き詰められないようにする。例えば、最大三次元空間より小さい空間を生成対象空間として決定された場合、三次元モデル生成部204は、生成対象空間以外の三次元空間のボクセルを削除して、最大三次元空間における生成対象空間以外の空間にボクセルが敷き詰められないようにする。
S805において三次元モデル生成部204は、生成対象空間の全座標に対応するボクセルに対してシルエット内外判定処理が完了しているか否かを判定する。
生成対象空間内の全ボクセルに対してシルエット内外判定処理が完了していない場合(S805がNO)、S806において三次元モデル生成部204は、シルエット内外判定処理が未処理であるボクセルを処理対象ボクセルとして選択する。そして、読出し部202から、生成対象空間を含む前景データを取得する。S807において三次元モデル生成部204は、処理対象のボクセルに対してシルエット内外判定処理を実施し、処理対象のボクセルを、残すか削るかを決定する。
生成対象空間内の全ボクセルに対してシルエット内外判定が完了した場合(S805がYES)、生成対象空間内のオブジェクトの三次元モデルが生成されたことになる。この場合、生成された三次元モデルは三次元空間上のボクセルの集合である点群フォーマットとして出力され、S808に進む。
S808において三次元モデル生成部204は、生成した三次元モデルを構成するボクセル数の総和を算出する。三次元モデルを構成するボクセルとは、シルエット内外判定の結果、「残す」と決定されたボクセルをいう。
S809において三次元モデル生成部204は、算出したボクセルの総和が予め設定された閾値を超えたか否かを判定する。算出されたボクセル数が閾値を超えている場合(S809がYES)、S810において三次元モデル生成部204は、ボクセルの総和が閾値の範囲内になるように生成した何れかのオブジェクトの三次元モデルを削除する。この閾値は記憶部301またはレンダリング部401による処理性能の上限を超えないデータ量に基づく値である。生成対象空間決定部203が複数の生成対象空間に優先度を設定している場合、優先度の低い生成対象空間内に含まれるオブジェクトから削除する。
閾値を超えていない場合(S809がNO)、または、S810の処理が完了した場合、生成された三次元モデルの点群フォーマットと三次元モデルのシルエット内外判定で使用した前景データとが記憶部301に記憶される。レンダリング装置は、ストレージ装置300に記憶されている点群フォーマットデータに基づき仮想視点画像を生成する。
以上説明したように本実施形態では、生成対象空間決定部203で決定した生成対象空間に基づき三次元モデルを生成する。このため、記憶される点群フォーマットおよび前景データのデータ量を削減することができ、記憶部301またはレンダリング部401が処理可能なデータ量になるようにデータ量を抑制することができる。また、生成対象空間に敷き詰められるボクセルの総数も減らすことができるため、三次元モデル生成時の処理負荷も抑制することができる。よって、本実施形態によれば、記憶部301およびレンダリング部401によって、例えば、撮像装置による撮像から仮想視点画像の生成までの時間を短くすることでリアルタイムで仮想視点画像を表示するようなリアルタイム処理を行うことができる。また、リアルタイム処理においてフレーム飛びなどの仮想視点画像の品質劣化を抑制することができる。
<その他の実施形態>
本開示は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本開示は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
200 三次元モデル生成装置
201 前景データ取得部
203 生成対象空間決定部
204 三次元モデル生成部
201 前景データ取得部
203 生成対象空間決定部
204 三次元モデル生成部
Claims (13)
- 複数の撮像装置によってオブジェクトを複数の異なる方向から撮像することに基づく前記オブジェクトを表すオブジェクト画像を取得する取得手段と、
前記オブジェクトに関連する所定のデータ量に基づき、三次元形状データが生成される対象とする生成対象空間を決定する決定手段と、
前記決定手段により決定された前記生成対象空間に含まれるオブジェクトの三次元形状データを、前記取得手段により取得された前記オブジェクト画像に基づいて生成する生成手段と、
を有することを特徴とする画像処理装置。 - 前記決定手段は、前記所定のデータ量が所定の値を超える場合、前記オブジェクト画像に基づいて三次元形状データを生成することが可能な最大の三次元空間より小さい空間を、前記生成対象空間として決定する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記決定手段は、前記所定のデータ量が大きいほど、前記生成対象空間のサイズが小さくなるように、前記生成対象空間を決定する
ことを特徴とする請求項1または2に記載の画像処理装置。 - 前記三次元形状データに基づいて生成される仮想視点画像の仮想視点を示すパラメータを取得する第2の取得手段をさらに有し、
前記決定手段は、前記所定のデータ量が前記所定の値を超える場合、前記仮想視点画像の中心が含まれる空間を前記生成対象空間として決定する
ことを特徴とする請求項2または3に記載の画像処理装置。 - 前記決定手段は、前記所定のデータ量が前記所定の値を超える場合、特定のオブジェクトが含まれる空間を生成対象空間として決定する
ことを特徴とする請求項2または3に記載の画像処理装置。 - 前記撮像装置による撮像対象に含まれる注目エリアを取得する第2の取得手段をさらに有し、
前記決定手段は、前記所定のデータ量が前記所定の値を超える場合、前記注目エリアが含まれる空間を前記生成対象空間として決定する
ことを特徴とする請求項2または3に記載の画像処理装置。 - 前記所定のデータ量は、前記オブジェクト画像に係るデータ量である
ことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。 - 前記所定のデータ量は、前記オブジェクト画像におけるオブジェクトの形状に係る領域の画素数である
ことを特徴とする請求項7に記載の画像処理装置。 - 前記決定手段は、複数の前記生成対象空間を決定した場合、前記決定された複数の生成対象空間のうちの2つ以上の生成対象空間を1つの生成対象空間にする処理を行う
ことを特徴とする請求項1から8のいずれか1項に記載の画像処理装置。 - 前記生成手段によって生成されたオブジェクトの三次元形状データのボクセル数を算出する算出手段と、
前記算出されたボクセル数の総和が閾値を超える場合、前記生成された三次元形状データのうち、いずれかのオブジェクトの三次元形状データを削除する削除手段と、をさらに有する
ことを特徴とする請求項1から9のいずれか1項に記載の画像処理装置。 - 請求項1から10のいずれか1項に記載の画像処理装置と、
前記画像処理装置によって生成された三次元形状データに基づき仮想視点画像を生成する装置と、
を有することを特徴とする画像処理システム。 - 複数の撮像装置によってオブジェクトを複数の異なる方向から撮像することに基づく前記オブジェクトを表すオブジェクト画像を取得する取得ステップと、
前記オブジェクトに関連する所定のデータ量に基づき、三次元形状データが生成される対象とする生成対象空間を決定する決定ステップと、
前記決定ステップで決定された前記生成対象空間に含まれるオブジェクトの三次元形状データを、前記取得ステップで取得された前記オブジェクト画像に基づいて生成する生成ステップと、
を含むことを特徴とする画像処理方法。 - コンピュータを、請求項1から10のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020144364A JP2022039374A (ja) | 2020-08-28 | 2020-08-28 | 画像処理装置、画像処理システム、画像処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020144364A JP2022039374A (ja) | 2020-08-28 | 2020-08-28 | 画像処理装置、画像処理システム、画像処理方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022039374A true JP2022039374A (ja) | 2022-03-10 |
Family
ID=80498459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020144364A Pending JP2022039374A (ja) | 2020-08-28 | 2020-08-28 | 画像処理装置、画像処理システム、画像処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022039374A (ja) |
-
2020
- 2020-08-28 JP JP2020144364A patent/JP2022039374A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6425780B1 (ja) | 画像処理システム、画像処理装置、画像処理方法及びプログラム | |
JP6948175B2 (ja) | 画像処理装置およびその制御方法 | |
CN106548516B (zh) | 三维漫游方法和装置 | |
US20200068188A1 (en) | Generating apparatus, generating method, and storage medium | |
US11200690B2 (en) | Image processing apparatus, three-dimensional shape data generation method, and non-transitory computer readable storage medium | |
US11900529B2 (en) | Image processing apparatus and method for generation of a three-dimensional model used for generating a virtual viewpoint image | |
JP7023696B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11195322B2 (en) | Image processing apparatus, system that generates virtual viewpoint video image, control method of image processing apparatus and storage medium | |
US11574432B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US20230394701A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2022039374A (ja) | 画像処理装置、画像処理システム、画像処理方法、およびプログラム | |
JP2020046960A (ja) | 画像処理装置、画像処理装置の制御方法、およびプログラム | |
JP2022029239A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP7271115B2 (ja) | 画像処理装置、背景画像の生成方法およびプログラム | |
JP2018063635A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP6759300B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021072604A (ja) | 生成装置、生成方法、及び、プログラム | |
JP2023018253A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US20240169552A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US11928831B2 (en) | Information processing apparatus, shape data generation method, and storage medium | |
JP6759375B2 (ja) | 仮想視点画像を生成するシステム、方法及びプログラム | |
WO2023058545A1 (ja) | 情報処理装置および方法、プログラム | |
JP2022096217A (ja) | 画像処理装置、画像処理システム、画像処理方法、およびプログラム | |
JP2023080290A (ja) | 情報処理装置、情報処理装置の制御方法およびプログラム | |
JP2024073835A (ja) | 画像処理システム、画像処理方法、及びプログラム |